1) Chinese character expanded code
汉字扩充码
2) expanded code of Chinese character
汉字扩展码
4) code extension character
代码扩充符;代码扩充字符
5) CJK Unified Ideographs Extension B
CJK统一汉字扩充B
1.
The aim of this subject is to implement an IME of Chinese character which are in CJK Unified Ideographs Extension B.
汉字输入法研究是自然语言处理的一个重要课题,自GB18030-2005颁布以来,许多研究人员一直在研究支持该超大字符集的输入法,而本课题的主要研究目的是实现处于CJK统一汉字扩充B区汉字的输入与显示。
6) Chinese Internal Code Specification
汉字内码扩展规范
补充资料:汉字国标码
汉字国标码
national standard code for Chinese character information inter-change
!lonz{guo匕一ooma汉字国标码(national standard eode forChinese eharaeter information interehange)中国国家标准GB1988《信息交换用汉字编码字符集》所描述的编码。它共有六个汉字编码字符集标准,分别命名为基本集、第一辅助集、第二辅助集、第三辅助集、第四辅助集和第五辅助集。 这六个集均采用双七位编码方式,每张代码表分为94个区和94个位,其中前15个区作为拼音文字及符号区或保留未用,16区至94区为汉字区。 基本集GB2312一80《信息交换用汉字编码字符集·基本集》规定了汉字信息交换用的基本图形字符及其二进制编码表示,该集适用于一般汉字处理、汉字通信等系统之间的信息交换。 基本集共收汉字6763个,分为两级。它将使用频度高的常用字作为第一级汉字,共计3755个,按汉语拼音字母顺序排列;将次常用字作为第二级汉字,共计3 008个,按部首排列。除汉字外,该标准还收集了一般符号202个(包括间隔符、标点符号、运算符号、单位符号和制表符号等),序号60个,数字22个,拉丁字母52个,日文假名169个,希腊字母48个,俄文字母66个,汉字拼音符号26个,汉字注音字母37个,连同汉字一共7445个图形字符。 第二、四辅助集GB7589一87《信息交换用汉字编码字符集·第二辅助集》和GB759o一87《信息交换用汉字编码字符集·第四辅助集》所收集的都是简化汉字,作为基本集的补充,供用字量大的用户使用。其中第二辅助集收汉字7237个,第四辅助集收汉字7039个。两个集中的汉字均按部首排列,从代码表的第16区开始存放,前15区保留未用。这两个集中大约有4200多个汉字是经类推简化而得到的,极少使用。 第一、三、五辅助集为了使简化字和繁体字之间便于进行代码转换,繁体字的编码采用了与简化字一一对应的映射方式。 第一辅助集共收集图形字符7581个,其中前15区是拼音文字及符号区,计有717个字符,除收集了基本集符号区中的682个字符外,还增加了35个竖排标点符号及汉语拼音符号。从第16区开始是汉字区,共收6864个繁体汉字,其中一级汉字3755个,二级汉字3008个,增补汉字101个。 第三、五辅助集分别收入了与第二、四辅助集对应的繁体汉字集。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条