1) Study of Chinese character glyph
汉字字形理论
2) the theory of Chinese characters formation
汉字构形学理论
3) Chinese character theory
汉字理论
5) Chinese font
汉字字形
1.
Generating new Chinese font with B-spline wavelet transform;
用B-样条小波变换生成新的汉字字形
2.
The Chinese characters thus generated can meet the three necessary requirements for combining Chinese fonts based on Fourier descriptor.
对基于 Fourier描述器的汉字字形生成及合成算法进行了改进 。
6) Chinese character glyph
汉字字形
1.
The main problem existing in current Chinese character glyph discriptions is the lack of a formal description for Chinese character glyphs which is computable and can cover all possible Chinese characters at the same time.
目前汉字字形描述方法存在的主要问题是缺少能涵盖一切可能汉字的可计算的字形形式化描述体系,从而造成汉字处理应用中的一系列障碍。
2.
This paper analyzes the main problems existing in the Chinese character information processing applications, and concludes that the core of the problems is due to the lack of a formal description method of Chinese character glyphs which is computable and can cover all Chinese characters at the same time, resulting in a series of obstacles in the appli- cations.
发现了现有字形描述方法共同存在的特征选取缺陷,最后给出了一种可行的汉字网格字形描述方法,该方法不仅能表示一切可能的汉字字形(包括错字),而且为字形特征异同的自动计算奠定了可靠的基础。
3.
The similarity calculation of Chinese character glyph is important in automatic recognizing,computer aided proofreading,and teaching of Chinese characters.
汉语是一种开放大字符集语言,汉字字形相似度计算是汉语信息处理的一项基础研究,对于汉字识别、计算机辅助的汉语文章校对和汉字教学都有重要作用。
补充资料:汉字字形属性
汉字字形属性
Ideographic glyph attribute
hQnzi zixing Shuxing汉字字形属性《M,旷叩hicgl”hat幼bute】 汉字字形的特征和派生的有关特性。从传统角度看,汉字字形由笔画、偏旁部首和单字三级构成,从计算机处理汉字的角度看,汉字字形结构层次可分为位点、笔段、笔面、部件、单字五级。由位点组成笔段、笔画,由几十种笔画组成部件,由几百种部件组成几万个汉字。 (l)位点汉字字形数字化后的一个二进制位数。有笔画的部分,位点为黑象素,其值为“1”,称为,’l”位点,否则为“0’,位点。若干“1”位点的连接可表示黑象素的方向和形状,从而表示各种笔画。(2)笔段、笔画用笔按一定走向连续写成的每一笔叫笔画。笔画共约有38种,其中横、竖、撤、捺、点5种(也有人把点归人捺,而成4种)称为基本笔画,它们和用各种折(曲)、钩组成的复合笔画约33种。笔画除了以上的形体属性外,还有笔画数目、笔画比例、笔画顺序、笔画关系等属性。例如:汉字笔画从1画一36画,平均每字n画一12画。汉字笔画中“横”占28%,“竖”占18%,“撇”占巧%,“点、捺”占13%,“折”占7%,其它占19%。笔段是在同一方向上的“1”位点的组合。基本笔画可看成笔段,复合笔画根据折点可分解为笔段。 (3)部件是由笔画构成,用以组成汉字字形的独立构件。它在构字时反复出现,并能从字形中分割出来。部件是汉字结构的基础,是汉字的基本单位。成千上万的汉字是由几百个部件组合起来的,“此木为柴山山出,因火成烟夕夕多”这副对联就是形象的说明。 部件按形体关系可分为单部件(日、月、火)和复部件(受、足);按音义关系可分为成字部件(水、火)和不成字部件(了、丁);按使用频度可分为高频部件(口、木)和低频部件(黑、鼠)。部件间有位置和连接两种关系。位置关系有上下(思、杏)、左右(泪、林)、内外(历、冈、国)关系。连接关系有相离(湘、盟)、相接(允、王)、相交(串、末)关系。还有独体部件(大、十)。部件在方块汉字中占有不同的比例,如“乡”占整字宽度的比例为39 .58%。部件在多少汉字中出现称部件组字频度,例如在(新华字典)8 500个汉字范围中组字300次以上的有6个部件—宁、‘、口、木、乎、了。部件在某一汉字集合中(如词典)出现的次数是部件的出现频度,例如在《现代汉语词典)中11000个汉字有部件800多个,其中“口”出现次数为2犯2次,频度为6.730%,是最高的。部件构成单字时结构位置出现的次数是结构频度。例如在l000()个汉字中,左右型部件结构占60%一63%,上下型部件结构占19%一22%,内外型部件结构为13%,独体字占2%一8%。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条