1) configuration characteristic algorithm
字符结构特征法
2) character feature
字符特征
1.
Technique of randomized question reading CAPTCHA based on character feature;
基于字符特征的随机问题阅读式验证码技术
2.
A method to normalize character feature based Zernike moment;
基于Zernike矩的字符特征归一化方法
3.
Based on analyzing the relationship between license plate background and character color,presents an effective license plate location algorithm which uses color saturation and vehicle character feature.
在分析汽车牌照底色与字符颜色关系的基础上提出了一种利用色彩饱和度信息和牌照字符特征的汽车牌照定位分割方法。
3) character-word
特征字符
1.
It finds the character-word in the pattern string before matching, and then compares the character-word and the last word of the pattern string with the text.
该算法进行匹配前先找到模式串中的特征字符(出现概率最小的字符),进行特征字符与尾字符双重匹配,失败则移动尽可能远的距离。
5) Feature of Chinese characters structure
汉字结构特征
6) structure of character
字符结构
1.
This thesis analyzes the theory of image processing and feature extraction, character feature is investigated in this thesis, including width, intersection, chain-code, the way of structure of character is used, a hand-written character recognition and entry system is developed.
在分析图象处理及其特征提取理论的基础上,研究了字符的笔划特点, 探讨了手写字符的宽度、交叉点、链码等特征,用提取字符结构特征的方法,设计并实现了一种手写字符识别系统。
补充资料:汉字编码字符集标准体系结构
汉字编码字符集标准体系结构
the standard architecture for coded Ideographic character sets
·284·汉第二字节黔,or一一一--一一一一一一一,┌─┐│ │└─┘7F组中的00平面l!叹19咭协)-- IL第一字节(1箕KSC 5601韩国汉字集GB2312一中国汉字集 TCA一CNS 11643一台清地区汉字集几Sx 0208一日本汉字集 图3汉字在13D/IEC2022代码空间的位里可以放在以七位为基础扩充的空间。但实际上,目前各国家和地区的汉字编码字符集都是以七位代码为基础的。 汉字和相关的非汉字文字、符号,由两维坐标所定义,其中每个坐标的取值都是从人艾H的33(!)到126(一),对应的十六进制是21到7E。 中国、日本、韩国三国的各汉字编码字符集,除了I劝/IEC 10646的本地标准之外,都完全遵守上述的格局。只术过它们的字汇、字级、字序各不相同。 上述I岌〕/IEC2022的体系结构具有如下的特点: (1)代码空间狭小,凡是印,Cl控制字符相关的空间都回避不用;汉字编码没有利用80(十六进制)以上的空间。 (2)按国家或地区分别编码。 (3)需要一整套复杂的指明和调用的控制功能来区分代码空间中的字汇。 150/IEC 10646和Unioxle定义的体系结构国际标准通用多八位编码字符集(UCS)和Un ieede2.0是完全兼容的两个标准。其体系结构是基于所谓“多八位”。而“八位”,实际上就是8一bit的字节。UCS用四个“八位”来表征组、面、行、位的四维空间。整个空间包含128组,其中每组有256个平面,每个平面由256行、每行由256个字位构成。 以下用四个图来描述U〔万的体系结构。 图4 UCS的总体代码空间图; 图5 UCS的00组; 图6U(污的基本多文种平面(B酬[P); 图7 UCS的基本多文种平面的拼音文字区┌────┐│每个平面││256X256 ││个码位 │└────┘图4 UCS的总体代码空间图细部。 UCS的编码表现形式有以下两种。 (1)肆八位属于正则形式,记作UCS一4。比如,汉字“一”的正则形式为0000 4E000 (2)双八位也称为BM[P形式,记作UCS一2。这种形式仅适用于基本多文种平面。如,“一”的双八位形式为4助0;控制字符E岌二为00lB。 此外还有两种变形显现形式。 (1)L」TF-8制定它的目的是为了与原8一bit系统向下兼容。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条