2) subject extraction
主题抽取
1.
Novel chinese text subject extraction method based on word clustering;
一种基于词聚类的中文文本主题抽取方法
2.
Word segmentation or word extraction is always the first step of subject extraction.
主题抽取是文本自动处理的基础工作之一 ,而主题的抽取一直以分词或者抽词作为第 1步 由于汉语词间缺少明显的间隔 ,因此分词和抽词的效果往往不够理想 ,从而在一定程度上影响了主题抽取的质量 提出以字为处理单位 ,基于字同现频率的汉语文本主题自动抽取的新方法 该方法速度快 ,适应多种文体类型 ,并完全避开了分词和抽词过程 ,可以广泛应用在主题句、主题段落等主题抽取的多个层面 ,而且同样适用于其他语言的文本主题抽取 主题句自动抽取实验表明 ,该方法抽取新闻文本主题句的正确率达到 77 19% 汉语文本的主题抽取比较实验还表明 ,省略分词步骤并没有降低抽取算法的正确
3.
The paper aimed at the requirement of the automatic extraction of subject from the emergency plans,took up with the measures of lexical semantic relatedness,and has constructed a subject extraction model based on the lexical chain algorithm which accords with human s subjective feeling.
本文针对应急预案自动主题抽取的需求,采用词汇语义相关度计算的方法,构建了一个基于词汇链算法且符合人的主观感受的主题抽取模型。
3) topic distillation
主题提取
1.
Research on Topic Distillation Algorithm for Search Engine System;
搜索引擎的主题提取算法研究
2.
New cut-plane based algorithm for topic distillation;
基于切平面的主题提取算法
3.
Improved web linkages topic distillation algorithm;
改进的Web链接主题提取算法
4) subject extraction
主题提取
1.
Chinese text subject extraction is helpful for user to condense vast amounts of information.
中文文本主题提取有助于用户对海量信息进行浓缩和提炼。
5) Topic Extraction
主题提取
1.
An Topic Extraction Approach of Text Clusters Based on Chinese Conceptual Clustering;
一种基于概念聚类的中文文本类簇主题提取方法
6) focused crawling
主题爬取
1.
A Shark-Search algorithm is one of the classical algorithms for focused crawling.
Shark-Search算法是一个经典的主题爬取算法。
2.
Finally,a new focused crawling algorithm is presented.
在此基础上,提出基于上述方法的主题爬取算法。
补充资料:《标准文献主题词表》
《标准文献主题词表》
ROOT Thesaurus
B旧ozhun勺Venxian ZhUtieibico《标准文献主题词表》(Ro口T刀晚sa~)标准化领域中使用的规范化的标准文献检索辞典。又称叙词表。随着计算机在标准情报工作中的应用,标准文献主题标引的工具—主题词表的编制就提上了日程。l叨6年,国际标准化组织(】50)编写了《150主题词表》(了义)介曰~)。在此基础上,1981年法国和英国各自编制了一部多语种主题词表。法国标准化协会(月刊OR)编制的词表名为《国际技术主题词表》,由字顺表、范畴表、主题词轮排索引等部分组成;英国标准学会(璐】)编制的词表名为《根主题词表》,中文版译名为《标准文献主题词表》。它是一部主题分类合一的词表。其主表是一部按层累制分类原则和概念种属词族原则编制的分类表,全部主题词都排人体系分类表并配有惟一等级制词号,附表为字顺表。国际标准化组织(】50)分别将《国际技术主题词表》和《根主题词表》确定为150工作词表,用于国际标准信息的交流。有若干国家分别采用了两个词表。由于《根主题词表》选词立类新颖,较适于手工标引,因此中国选择了《根主题词表》作为中国标准化系统的标引词表,并编译出版了中文版,分为分类表、字顺表、英汉对照表三卷出版,现已在全国标准情报系统推广使用。为了解决两部标准主题词表不统一的问题,目前150拟议编制一部统一的150主题词表。(周洁)
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条