1) regular text page
正文页
2) Web content
网页正文
1.
Web content extraction method based on logic lines and maximum admitting distances
基于逻辑行和最大接纳距离的网页正文抽取
3) Preliminaries
[英][pri'liminəri] [美][prɪ'lɪmə,nɛrɪ]
正文前书页
4) web page text extraction
网页正文提取
1.
In order to improve the performance of Lucene system in searching Chinese web pages,the technique of web page text extraction based on statistics,Chinese word segmentation module and documents for indexing pretreatment module are added into the system by analyzing the structure of Lucene.
通过分析Lucene的系统结构,系统采用了基于统计的网页正文提取技术,并且加入了中文分词模块和索引文档预处理模块来提高检索系统的效率和精度。
6) blind page
正文前空白页
补充资料:正文
1.著作的本文,区别于"序言"﹑"注解"﹑"附录"等。 2.本字。 3.指合乎正常写法的文章。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条