1) Scientific Grouping Method
分类识字
1.
The Scientific Grouping Method(SGM) and Its Application in Teaching Foreigners the Chinese Characters
分类识字法及其在对外汉语教学中的应用
2) Chinese characters classification recognition
汉字分类识别
3) dispersive character learning
分散识字
5) classify and identification
分类标识
补充资料:汉字分类识别
汉字分类识别
Chinese character recognition by classification
hQnzi fsnlei ShibiG汉字分类识别(Chi~ch~ter八叉邺,itionby cl别洛ifiCation】根据某种判别准则,用统计或结构的方法,把汉字模式多维特征向量(参见汉宇识别鑫本方法)构成的特征空间划分为若干子空间的过程。 由于汉字数量巨大,汉字模式样本甚多,为提高识别速度,汉字识别通常采用两到三级分类识别方案。其中最后一级分类(通过该分类就识别出汉字)称为细分类,前面若干级分类都称为粗分类。 汉字识别分类方法的选择原则是:①分类特性好。即类内各样本距离小,类间距离大,各类重叠样本少。②分类稳定性好,抗干扰能力强。③粗分类的正确分类率和稳定性应比细分类高。④每类汉字的相关性要小,分类速度快。⑤分类特征易提取,简单,维数低。⑥粗分类要和细分类相协调。以上要求很难同时满足,分类(特别是粗分类)的稳定性和正确分类率是首先需要考虑的。 分类方法有重叠区分类、中心提取分类、判定树分类、引导树分类等。 在汉字分类时,用某种类似度(或距离)准则,把未知文字特征和字典中标准文字特征逐一比较,按相似性从大到小排序,取i位以前(包括第i位)的所有文字为一类,所得到的正确分类的文字占全部需要识别文字的百分比,称为累计分类率。第i位的累计分类率就是从第1位到第i位所得正确分类字数占全部需要识别文字的百分比。第1位的累计分类率就是识别率,第。位(n为全部需要识别文字数)累计分类率总是100%。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条