说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 正文抽取
1)  content extraction
正文抽取
1.
This paper concerns content extraction from news web pages based on decisions of two layers.
首先根据实际应用的需要给出了新闻网页正文的严格界定,然后分析了新闻网页及其正文的特性,提出了基于双层决策的正文抽取策略,基于特征向量提取和决策树学习算法对上述双层决策进行了建模,并在国内10个主要新闻网站的1687个新闻页面上开展了模型训练和测试实验。
2.
Pervasive information service based on web needs higher requirements for content extraction.
基于互联网数据挖掘的正文抽取技术是提供普适的信息服务的基础,利用该技术分析巨大的网络信息源获得服务内容,同时从中提取出供咨询、参考和决策等用途的信息——情境信息,为普适服务中的Web高级应用奠定良好的基础。
3.
This paper presents a new method for content extraction from Web pages based on statistic and content-features.
该文提出了一种基于统计与正文特征的网页正文抽取方法。
2)  Web Page Content Extraction
网页正文内容抽取
3)  cross extract
正交抽取
4)  Text extraction
文本抽取
1.
A Text Extraction Method for Image with Complex Background Based on Conditional Random Field
一种基于条件随机场的复杂背景图像文本抽取方法
2.
Fast Web automatic text extraction algorithm based on template
该算法先对网页噪声进行预处理,将其DOM树结构进行标签hash映射,通过自动训练的阈值快速判定网页的主要部分,根据数据块中的嵌套结构获取网页文本抽取模板。
5)  Sentence Extracting
文摘句抽取
6)  Extractive Summarization
抽取型文摘
补充资料:关正文

关正文

北京人。1982年毕业于北京师范大学中文系。历任北京师范学院中文系教师,作家出版社编辑,中外文化出版公司编辑、国际合作部主任,《小说选刊》杂志编辑、事业部主任,副编审。1998年加入中国作家协会。

说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条