1) text identifier
文字识别符
2) Tibetan character recognition
藏文字符识别
1.
A comprehensive algorithm for multi-font printed Tibetan character recognition is proposed in this paper.
提出了一种完整的多字体印刷藏文字符识别方法:先提取输入字符的方向线素特征组成特征向量,然后采用两级分类策略判定字符类别。
2.
Tibetan character recognition is a significant module of Chinese multi language information processing system,however hardly any research work has been undertaken yet.
藏文字符识别系统是中文多文种信息处理系统的重要组成部分 ,但至今国内外的研究基本处于空白。
3) Hangul character recognition
朝鲜文字符识别
4) English character recognition
英文字符识别
1.
It has been decided by experiment that through feature and gridding feature are chosen as the classification features of the English character recognition,and feature fusion are implemented by getting a set of coefficients added to the feature vector from the experiment.
英文字符识别率依然有待提高,它是进一步改善英文文档识别性能的重要内容。
5) character recognition
字符识别
1.
Study of print character recognition based on wavelet moment;
基于小波矩的印刷体英文字符识别研究
2.
Fast character recognition algorithm based on wavelet transform;
基于小波变换的字符识别快速算法
3.
Research on handwritten character recognition;
手写字符识别方法的研究
6) character identification
字符识别
1.
Second generation identification card's character identification using profile detection
基于轮廓检测的第二代身份证字符识别
2.
Character identification is an issue that computer pattern recognition often meets.
字符识别是计算机模式识别中较为常见的问题。
3.
There is more research on the location and character identification of the license plate in the recognition techology.
根据我国车牌的基本特征,本文对车牌识别技术中的车牌定位和车牌字符识别这两个环节进行了深入的研究。
补充资料:文字识别
利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本。为了减轻人们的劳动,提高处理效率,50年代开始探讨一般文字识别方法,并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。60年代后期,出现了多种字体和手写体文字识别机,其识别精度和机器性能都基本上能满足要求。如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究。
文字识别一般包括文字信息的采集、信息的分析与处理、信息的分类判别等几个部分。
信息采集 将纸面上的文字灰度变换成电信号,输入到计算机中去。信息采集由文字识别机中的送纸机构和光电变换装置来实现,有飞点扫描、摄像机、光敏元件和激光扫描等光电变换装置。
信息分析和处理 对变换后的电信号消除各种由于印刷质量、纸质(均匀性、污点等)或书写工具等因素所造成的噪音和干扰,进行大小、偏转、浓淡、粗细等各种正规化处理。
信息的分类判别 对去掉噪声并正规化后的文字信息进行分类判别,以输出识别结果。
文字识别方法 文字识别方法基本上分为统计、逻辑判断和句法三大类。常用的方法有模板匹配法和几何特征抽取法。
① 模板匹配法 将输入的文字与给定的各类别标准文字(模板)进行相关匹配,计算输入文字与各模板之间的相似性程度,取相似度最大的类别作为识别结果。这种方法的缺点是当被识别类别数增加时,标准文字模板的数量也随之增加。这一方面会增加机器的存储容量,另一方面也会降低识别的正确率,所以这种方式适用于识别固定字型的印刷体文字。这种方法的优点是用整个文字进行相似度计算,所以对文字的缺损、边缘噪声等具有较强的适应能力。
② 几何特征抽取法 抽取文字的一些几何特征,如文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜等各方向的线段、闭合环路等,根据这些特征的位置和相互关系进行逻辑组合判断,获得识别结果。这种识别方式由于利用结构信息,也适用于手写体文字那样变型较大的文字。
应用 文字识别可应用于许多领域,如阅读、翻译、文献资料的检索、信件和包裹的分拣、稿件的编辑和校对、大量统计报表和卡片的汇总与分析、银行支票的处理、商品发票的统计汇总、商品编码的识别、商品仓库的管理,以及水、电、煤气、房租、人身保险等费用的征收业务中的大量信用卡片的自动处理和办公室打字员工作的局部自动化等。现代使用中的一些系统虽然比人读得快,但仍不能象人那样正确地读出各种多样的字符,与人的识别能力相比还有很大差别,远不能满足上述各个方面对文字识别应用所提出的要求,还有待于进一步研究。
文字识别一般包括文字信息的采集、信息的分析与处理、信息的分类判别等几个部分。
信息采集 将纸面上的文字灰度变换成电信号,输入到计算机中去。信息采集由文字识别机中的送纸机构和光电变换装置来实现,有飞点扫描、摄像机、光敏元件和激光扫描等光电变换装置。
信息分析和处理 对变换后的电信号消除各种由于印刷质量、纸质(均匀性、污点等)或书写工具等因素所造成的噪音和干扰,进行大小、偏转、浓淡、粗细等各种正规化处理。
信息的分类判别 对去掉噪声并正规化后的文字信息进行分类判别,以输出识别结果。
文字识别方法 文字识别方法基本上分为统计、逻辑判断和句法三大类。常用的方法有模板匹配法和几何特征抽取法。
① 模板匹配法 将输入的文字与给定的各类别标准文字(模板)进行相关匹配,计算输入文字与各模板之间的相似性程度,取相似度最大的类别作为识别结果。这种方法的缺点是当被识别类别数增加时,标准文字模板的数量也随之增加。这一方面会增加机器的存储容量,另一方面也会降低识别的正确率,所以这种方式适用于识别固定字型的印刷体文字。这种方法的优点是用整个文字进行相似度计算,所以对文字的缺损、边缘噪声等具有较强的适应能力。
② 几何特征抽取法 抽取文字的一些几何特征,如文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜等各方向的线段、闭合环路等,根据这些特征的位置和相互关系进行逻辑组合判断,获得识别结果。这种识别方式由于利用结构信息,也适用于手写体文字那样变型较大的文字。
应用 文字识别可应用于许多领域,如阅读、翻译、文献资料的检索、信件和包裹的分拣、稿件的编辑和校对、大量统计报表和卡片的汇总与分析、银行支票的处理、商品发票的统计汇总、商品编码的识别、商品仓库的管理,以及水、电、煤气、房租、人身保险等费用的征收业务中的大量信用卡片的自动处理和办公室打字员工作的局部自动化等。现代使用中的一些系统虽然比人读得快,但仍不能象人那样正确地读出各种多样的字符,与人的识别能力相比还有很大差别,远不能满足上述各个方面对文字识别应用所提出的要求,还有待于进一步研究。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条