说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 文档自动分类
1)  Automatic Document Categorization
文档自动分类
2)  automatic web page categorization
Web文档自动分类
3)  categorization text
分类文档
4)  document classification
文档分类
1.
Parallel KNN algorithm for WEB document classification;
用于WEB文档分类的并行KNN算法
2.
LDE and simplified SVM method for document classification
面向文档分类的LDE和简化SVM方法研究
3.
A rough set based corner classification neural network, the Rough-CC4, is presented to solve document classification problems such as document representation of different document sizes,document feature selection and document feature encoding.
针对文档分类过程中不同大小文档表示、文档特征选择和文档特征编码问题,提出了一种基于粗糙集的角分类神经网络Rough-CC4。
5)  text classification
文档分类
1.
Research on Text Classification with Bayesian Model and Relational Technologies;
基于贝叶斯模型的文档分类及相关技术研究
2.
Feature selection is frequently used as a preprocessing step to text classification,which is effective in reducing dimensionality and increasing classification accuracy.
特征选择是文档分类中常见的预处理工作,通过对文档特征空间降维,可以提高文档的分类性能。
6)  text categorization
文档分类
1.
In this paper,through analysing the construction of some classic weighting functions,we will propose a term weighting modification approach based on text information space so that efficiency of text categorization and filtering is higher.
在web文档信息检索中,文档分类、文档过滤的质量一直是影响用户查询结果的关键。
2.
Existing multi-label text categorization approaches usually require using a large amount of documents with correct class labels to achieve good performance.
真实世界的文档往往同时属于多个类别,因此,利用多标记学习技术进行文档分类是一个重要的研究方向。
补充资料:自动分类
      用计算机系统代替人工对文献等对象进行分类。一般包含自动聚类与自动归类。
  
  自动聚类由计算机系统按照被考察对象的内部或外部特征,根据一定的要求(如类别的数量限制,同类对象的亲近程度等等),将相近、相似或相同特征的对象聚合在一起的过程。目前常用的自动聚类方法有:关联词法、文献--文献相似矩阵法、聚丛法和因子分析法等。自动归类是指计算机系统按照一定的分类标准或分类参考,将被考察对象划归到不同类目的过程。目前常用的自动归类方法有语义分析法、语法分析法和统计法等。
  
  在文献的手工分类过程中,人们往往根据文献的主题内容,以公认的科学分类体系(如《杜威十进分类法》、《国际十进分类法》、《中国图书资料分类法》等),来决定每篇文献的分类号。可以说,文献的分类过程,就是人们根据一定的分类标准给文献以分类号的过程。文献分类的目的是为了便于人们按文献的内在特征,即所属类别进行查找。自动分类与手工分类相比,其类目体系的决定更科学、更灵活,文献的定类更整齐划一。同时,由于劳力的限制,人工分类往往不细、不全(大多一篇文献划归一类),而自动分类则可克服这些缺点,并有很大的潜力。特别是自动聚类与自动分类的结合,将使自动分类体系具有新陈代谢的生命特征,并将为高效的聚类检索奠定基础。
  
  文献的自动分类研究始于20世纪60年代初,最早是由R.M.尼达姆等人进行的。从马罗的第一个自动分类模型发展至今,无论在理论研究上还是实际运用上均取得相当的进展。由于种种原因,特别是中文计算机处理能力的限制,在中国关于自动分类的研究还刚刚开始不久。
  
  由于计算机自动分析主题等研究还没有取得实质性的进展,所以,现在自动分类大部分都建立在题中或文摘中关键词的基础上,它的缺点是不能准确地按文献主题分类。但据有关资料表明,专家的偏爱也常使其分类的质量与普通标引员的分类质量相差无几,而自动分类现有的水平与之也差不多,然而其速度与规定性则是手工分类无法比拟的。因此,它正在受到人们越来越大的重视,成为情报检索中一个重要的研究与发展方向。特别是它与聚类检索的结合,将使其有更强的生命力。
  

说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条