1) layout analysis
版面分析
1.
A Morphology Based Adaptive Text Layout Analysis Algorithm;
基于数学形态学的自适应文字版面分析方法
2.
The Study on Obtaining Chain Code and Document Layout Analysis;
链编码的获取和文档图像的版面分析
3.
A Bottom-Up Layout Analysis Algorithm Based on Multi-Level Confidence;
基于多层次可信度指导下的自底向上版面分析
2) document analysis
版面分析
1.
Document analysis and understanding is to research into theories and technologies during the whole procedure converting paper documents into electronic formats.
版面分析与理解技术主要研究如何将纸质文档转化为电子表示,并进一步理解为计算机可处理的符号表示的整个过程。
2.
It is focus on document image incline rectify, document analysis and document recognition.
本文在收集和分析大量近年来国内外文档图像处理方面的研究报告、学术论文的基础上,对文档图像版面理解所涉及的若干问题进行了深入探讨;着重对文档图像的倾斜校正、版面分析和版面识别进行了研究,并且完成了原型系统的实现,经测试,可以满足要求。
3) layout analysis
版面结构分析
1.
In this paper,a method of layout analysis under the instruction of syntactic analysis and the system built on it are presented.
因此,本文提出了一个在语法结构分析指导下的版面结构分析方法,给出了其系统架构,对系统中用到的版面结构分析方法进行了优化,并给出了最终实验结果。
4) Document layout
版面分析与理解
5) layout analysis and understanding
版面分析和理解
6) Layout analysis of table
表格版面分析
补充资料:印刷文本版面分析
印刷文本版面分析
printed page analysis
y inshua wenben banm一an fenxi印刷文本版面分析(printed page analysis)对印刷文本版面的排版格式进行自动分析、切分和标识的过程。实际的印刷文本可分为若干不同属性的文本块,例如标题、作者、正文、图象、图形、表格、公式、注释、页码等,正文块可由单栏、双栏、三栏等编排而成。文本块之间用空白条、直线、装饰线、花边等隔开。对于较复杂版面,要在版面理解的基础上才能正确分析和切分。版面分析和理解的任务是利用文本块本身的信息和它们编排成版面的规则等先验知识对印刷文本的文本块进行切分并对其属性和各文本块之间的连接等逻辑关系进行分析和判定,确定是否同一篇文章的文本块和它们之间的连接顺序关系。例如,通过版面分析,按标题、作者、摘要、正文(可能由不同栏目的正文块连接而成,其中包括表格)等顺序,剔除图象、图形、花边等不能识别的文本块,连接成一个完整的文字文本块的图象文件送到识别预处理(参见汉字识别前处理)环节,才能进行识别。 版面分析的基本方法是利用文本图象的水平、垂直投影确定出各文本块的边界进行切分。有自底向上和自顶向下两种分析方法。版面理解是根据各文本块内图象投影值的特征和该块在版面中的位置特点来进行的。例如,正文的某一方向投影有周期性空白行的特征,而插图的投影则无此种周期性;图象块的黑象素比图形一般要多;标题的空白间隔比正文行间隔要大,且位置一般在正文之前(横排版)等等。对各文本块的属性作出判别后,剔除图象、图形等不能识别的文本块,找出该版面中的各标题,按标题从左到右,从上到下顺序联接各文本块,就完成了该版面的分析和理解。由于实际文本版面多样、复杂,所以,在一个实用识别系统中,版面分析和理解常做成交互形式,必要时可辅以人工修改。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条