1) incremental inverted index
增量倒排索引
2) inverted index
倒排索引
1.
Research on Inverted Index Algorithm of Search Engine;
搜索引擎建立倒排索引的算法研究
2.
Improvement of Inverted Index in Search Engine System;
搜索引擎倒排索引技术的改进
3.
An approach for compression-based inverted index in full-text database;
一种基于压缩的全文本数据库倒排索引方法
3) inverted file index
倒排索引表
1.
For a web search engine, both the efficient access to the inverted file indexes and the high-efficiency retrieval operation play crucial roles in achieving high retrieval performance.
对于提高网络搜索引擎系统的性能而言,有效的存取倒排索引表和快速的响应搜索操作起着关键的作用,故提出了一种能够有效提高索引压缩率的文档重排算法——S tar-Scan算法。
4) invert indexed
倒排序索引
5) Indexing Structure based on Inverted List
倒排表索引
6) synthetically inversed index
综合倒排索引
1.
Furthermore, an algorithm based on synthetically inversed index was presented.
本文分析了国内外个性化信息服务研究现状,提出了基于综合倒排索引的搜索算法,从关键词、主题词和评语三个角度出发建立综合倒排索引进行全文搜索。
2.
The paper brings up an architecture of synthetically inversed index,which is based on drawbacks of traditional search engine systems.
针对传统搜索引擎的不足,论述了个性化综合倒排索引的基本思想,结合词频渠道奖励算法、遗忘算法和文档关注度算法来动态获取用户兴趣变化,从而满足个性化搜索的需求。
补充资料:倒排档
计算机中存储的辅关键词索引。所谓辅关键词是指能在多个情报中同时出现的关键词,诸如情报中的主题词、作者、分类号等,它们与情报没有一一对应关系;而与情报有一一对应关系的关键词则称之为主关键词,如文献情报中的文献号、存储地址等。
倒排档记录一般总是由辅关键词及其所属情报主关键词的集合所组成,常见的组织方式有多表方式、倒排表方式和位图方式,其逻辑结构可图示如下:其中,假设字母表示辅关键词;数字表示情报的编号。也就是说,假定情报1包含辅关键词A;情报2包含辅关键词B;情报3包含辅关键词A;情报4包含辅关键词C。
位图方式为定长记录,处理简单,但存储空间浪费较多;倒排表采用变长记录,节省存储,但处理比较复杂;而多表方式使用半固定长记录,处理比倒排表简单,但比位图方式复杂,存储量比倒排表大,但比位图方式小。
正如索引能加快手工查找速度一样,在计算机建立倒排档往往也能加快情报的检索速度。联机情报检索要求实时响应,故大多数联机检索系统都使用倒排档进行检索或辅助检索。不过,建立倒排档需要时间与空间,维护也比较困难,因而一次性的定题情报检索(SDI) 系统往往都不使用倒排档;为了尽可能的减少不必要的存储,在联机情报检索中往往不对所有的辅关键词建立倒排档,而只是对常用的辅关键词:主题词、作者等建立倒排档,因此,在对倒排档检索以后,往往还要补充对原文档进行二次检索。前者人们又常称之为集合检索,后者则称之为顺序检索。
倒排档记录一般总是由辅关键词及其所属情报主关键词的集合所组成,常见的组织方式有多表方式、倒排表方式和位图方式,其逻辑结构可图示如下:其中,假设字母表示辅关键词;数字表示情报的编号。也就是说,假定情报1包含辅关键词A;情报2包含辅关键词B;情报3包含辅关键词A;情报4包含辅关键词C。
位图方式为定长记录,处理简单,但存储空间浪费较多;倒排表采用变长记录,节省存储,但处理比较复杂;而多表方式使用半固定长记录,处理比倒排表简单,但比位图方式复杂,存储量比倒排表大,但比位图方式小。
正如索引能加快手工查找速度一样,在计算机建立倒排档往往也能加快情报的检索速度。联机情报检索要求实时响应,故大多数联机检索系统都使用倒排档进行检索或辅助检索。不过,建立倒排档需要时间与空间,维护也比较困难,因而一次性的定题情报检索(SDI) 系统往往都不使用倒排档;为了尽可能的减少不必要的存储,在联机情报检索中往往不对所有的辅关键词建立倒排档,而只是对常用的辅关键词:主题词、作者等建立倒排档,因此,在对倒排档检索以后,往往还要补充对原文档进行二次检索。前者人们又常称之为集合检索,后者则称之为顺序检索。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条