1) Layout Identification and Analysis
版面结构定位与分析
2) layout analysis
版面结构分析
1.
In this paper,a method of layout analysis under the instruction of syntactic analysis and the system built on it are presented.
因此,本文提出了一个在语法结构分析指导下的版面结构分析方法,给出了其系统架构,对系统中用到的版面结构分析方法进行了优化,并给出了最终实验结果。
3) layout structure analysis
版面结构分析
1.
Based on massive practice, this paper has carried on the beneficial exploration to the table layout structure analysis and the table logical structure analysis.
本文在大量实践工作的基础上,对表格图像的版面结构分析及逻辑结构分析进行了有益的探索。
4) table layout analysis
表格版面结构分析
1.
This paper proposed a novel table layout analysis model based on simple region and frame line.
表格版面结构分析与判别是文档图像处理领域的研究热点。
5) Document layout
版面分析与理解
补充资料:印刷文本版面分析
印刷文本版面分析
printed page analysis
y inshua wenben banm一an fenxi印刷文本版面分析(printed page analysis)对印刷文本版面的排版格式进行自动分析、切分和标识的过程。实际的印刷文本可分为若干不同属性的文本块,例如标题、作者、正文、图象、图形、表格、公式、注释、页码等,正文块可由单栏、双栏、三栏等编排而成。文本块之间用空白条、直线、装饰线、花边等隔开。对于较复杂版面,要在版面理解的基础上才能正确分析和切分。版面分析和理解的任务是利用文本块本身的信息和它们编排成版面的规则等先验知识对印刷文本的文本块进行切分并对其属性和各文本块之间的连接等逻辑关系进行分析和判定,确定是否同一篇文章的文本块和它们之间的连接顺序关系。例如,通过版面分析,按标题、作者、摘要、正文(可能由不同栏目的正文块连接而成,其中包括表格)等顺序,剔除图象、图形、花边等不能识别的文本块,连接成一个完整的文字文本块的图象文件送到识别预处理(参见汉字识别前处理)环节,才能进行识别。 版面分析的基本方法是利用文本图象的水平、垂直投影确定出各文本块的边界进行切分。有自底向上和自顶向下两种分析方法。版面理解是根据各文本块内图象投影值的特征和该块在版面中的位置特点来进行的。例如,正文的某一方向投影有周期性空白行的特征,而插图的投影则无此种周期性;图象块的黑象素比图形一般要多;标题的空白间隔比正文行间隔要大,且位置一般在正文之前(横排版)等等。对各文本块的属性作出判别后,剔除图象、图形等不能识别的文本块,找出该版面中的各标题,按标题从左到右,从上到下顺序联接各文本块,就完成了该版面的分析和理解。由于实际文本版面多样、复杂,所以,在一个实用识别系统中,版面分析和理解常做成交互形式,必要时可辅以人工修改。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条