1) Chinese corpuses system
语料检索
1.
To solve the problem,this paper makes following contributions: 1) Propose words of batch disposal of Chinese corpuses system based on Rough Set;2) Propose the retrieval algorithm of Ambiguous Multi-retrieval in Text Base on Rou.
传统的语料检索的不足主要为:(1)无法模糊匹配检索;(2)存在跨行词问题,无法保证查全率;(3)难以对检索结果缩检和扩检。
2) concordance
[英][kən'kɔ:dəns] [美][kən'kɔrdṇs]
语料库检索
1.
Concordance of Pride and Prejudice;
《傲慢与偏见》的语料库检索分析
3) tagged corpus retrieval
标注语料库检索
5) speech retrieval
语音检索
1.
Novel mixing speech retrieval algorithm;
一种新颖的混合语音检索算法
2.
Research on Chinese Speech Retrieval Technology Based on Word Fragment and Lattice;
基于词片和Lattice的汉语语音检索技术研究
3.
Speech indexing is a key speech retrieval task.
语音索引是语音检索任务的关键问题之一。
6) Semantic Search
语义检索
1.
Ontology-based semantic search over relational databases.;
基于本体的关系数据库语义检索
2.
Proceeding from the definition of semantic search, this paper discusses the basic principles of how to endow information input, information organization and searching result with semantic meaning.
本文从一种新的检索方式——语义检索的定义出发,讨论了对检索入口、信息组织和结果输出赋予语义的基本原理。
3.
On the platform of Jena,semantic search and rule reasoning based on ontology are used to create the auto components purchase order.
使用Protégé作为知识建模工具开发汽车制造领域本体,以Jena为开发平台运用基于本体的语义检索技术和规则推理实现订单的自动生成,开发了一套基于本体的汽车零部件采购订单自动生成系统。
补充资料:"戴罗格"联机情报检索系统
世界上最大的联机情报检索系统, 简称DIALOG系统。1970 年由美国洛克希德导弹和空间公司的子公司建立。该系统的特点是用户利用终端与计算机以文字对话形式检索计算机数据库中的情报。使用时用户通过终端设备的键盘将指令和主题词输入机器。机器将处理的结果作为检索提问的答案显示在终端设备的屏幕上。如果对答案不满意,可随时修改检索策略,往返对话,直至满意为止。
在硬件方面,采用双机工作方式。一台为IBM3033型电子计算机,与TYMNET公用数据网连接;另一台为 NAS9098型电子计算机,与TELENET公用数据网连接。外部设备有150台 IBM3330Ⅰ型磁盘机,总容量达70000兆字节;14台 IBM2321型磁卡机,总容量达5600兆字节。3台XEROX9600/9700快速输出打印机。以上是1980年初的配置情况。硬件配置将随数据库容量增加和检索服务的扩大而不断更新换代。
DIALOG检索软件具有检索文献题录、文摘和联机对话检索的功能。检索时可以利用主题词、作者名、期刊名或自然语言词汇作为检索标识、以单词或几个词组配方式进行检索。检索指令有30余条。基本指令包括选库指令、选词指令、组配指令、打印指令和关机指令 5条。每检索一个课题约需10~15分钟。1984年底改用了新的检索软件,称为DIALOGⅡ。
至1990年5月数据库已发展达到380多个,拥有文献记录2亿篇,其中包括50多种语言6万种期刊。数据库的专业内容有综合性学科、自然科学、应用科学和社会科学(如商业、经济和法律)等等。文献类型有图书、报纸、期刊、学位论文、会议录、研究报告、政府文件、专利、标准、年鉴、市场商情和厂商名录等等。
该系统的总部设有用户服务部,负责用户培训、收集用户意见和答复用户咨询。至1988年底,DIALOG系统用户终端遍布80多个国家,9万多台。这些用户多为图书馆、专业学会、产业部门、大专院校以及情报人员。今后着重发展个人用户。
在硬件方面,采用双机工作方式。一台为IBM3033型电子计算机,与TYMNET公用数据网连接;另一台为 NAS9098型电子计算机,与TELENET公用数据网连接。外部设备有150台 IBM3330Ⅰ型磁盘机,总容量达70000兆字节;14台 IBM2321型磁卡机,总容量达5600兆字节。3台XEROX9600/9700快速输出打印机。以上是1980年初的配置情况。硬件配置将随数据库容量增加和检索服务的扩大而不断更新换代。
DIALOG检索软件具有检索文献题录、文摘和联机对话检索的功能。检索时可以利用主题词、作者名、期刊名或自然语言词汇作为检索标识、以单词或几个词组配方式进行检索。检索指令有30余条。基本指令包括选库指令、选词指令、组配指令、打印指令和关机指令 5条。每检索一个课题约需10~15分钟。1984年底改用了新的检索软件,称为DIALOGⅡ。
至1990年5月数据库已发展达到380多个,拥有文献记录2亿篇,其中包括50多种语言6万种期刊。数据库的专业内容有综合性学科、自然科学、应用科学和社会科学(如商业、经济和法律)等等。文献类型有图书、报纸、期刊、学位论文、会议录、研究报告、政府文件、专利、标准、年鉴、市场商情和厂商名录等等。
该系统的总部设有用户服务部,负责用户培训、收集用户意见和答复用户咨询。至1988年底,DIALOG系统用户终端遍布80多个国家,9万多台。这些用户多为图书馆、专业学会、产业部门、大专院校以及情报人员。今后着重发展个人用户。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条