说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 文本倾向性分类
1)  text tendency classification
文本倾向性分类
1.
Text classification technology and text tendency classification technology are firstly introduced in this paper.
介绍了文本分类技术和文本倾向性分类技术,并基于文本倾向性分类技术分析了图书评论中的信息,研究如何将机器学习方法应用在图书评论的倾向性分类中,提出了一种图书评价模型构建的解决方法。
2)  Tendency Text Analysis
倾向性文本分析
3)  Text sentiment orientation classification
文本情感倾向分类
4)  Text Orientation
文本倾向性
1.
The Research of Chinese Web Text Orientation Classification;
中文WEB文本倾向性分类研究
2.
In order to extract the useful information from the rich information, the analysis of the text orientation is born.
本文的主要工作概括如下:(1)分析研究了传统的文本倾向性分析方法,并指出了其中的不足。
5)  text opinion analysis
文本观点倾向性分析
1.
Identification of subjective sentences is the foundation of text opinion analysis.
主观性句子的判别是文本观点倾向性分析的基础。
6)  Polarity Text Filtering
倾向性文本过滤
补充资料:印刷文本版面分析


印刷文本版面分析
printed page analysis

y inshua wenben banm一an fenxi印刷文本版面分析(printed page analysis)对印刷文本版面的排版格式进行自动分析、切分和标识的过程。实际的印刷文本可分为若干不同属性的文本块,例如标题、作者、正文、图象、图形、表格、公式、注释、页码等,正文块可由单栏、双栏、三栏等编排而成。文本块之间用空白条、直线、装饰线、花边等隔开。对于较复杂版面,要在版面理解的基础上才能正确分析和切分。版面分析和理解的任务是利用文本块本身的信息和它们编排成版面的规则等先验知识对印刷文本的文本块进行切分并对其属性和各文本块之间的连接等逻辑关系进行分析和判定,确定是否同一篇文章的文本块和它们之间的连接顺序关系。例如,通过版面分析,按标题、作者、摘要、正文(可能由不同栏目的正文块连接而成,其中包括表格)等顺序,剔除图象、图形、花边等不能识别的文本块,连接成一个完整的文字文本块的图象文件送到识别预处理(参见汉字识别前处理)环节,才能进行识别。 版面分析的基本方法是利用文本图象的水平、垂直投影确定出各文本块的边界进行切分。有自底向上和自顶向下两种分析方法。版面理解是根据各文本块内图象投影值的特征和该块在版面中的位置特点来进行的。例如,正文的某一方向投影有周期性空白行的特征,而插图的投影则无此种周期性;图象块的黑象素比图形一般要多;标题的空白间隔比正文行间隔要大,且位置一般在正文之前(横排版)等等。对各文本块的属性作出判别后,剔除图象、图形等不能识别的文本块,找出该版面中的各标题,按标题从左到右,从上到下顺序联接各文本块,就完成了该版面的分析和理解。由于实际文本版面多样、复杂,所以,在一个实用识别系统中,版面分析和理解常做成交互形式,必要时可辅以人工修改。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条