1) Owing to the code handling
基于操作的编码
3) encoding operation
编码操作
4) Code-based software
基于编码的软件
5) content-based coding
基于内容的编码
6) node-based encoding
基于节点的编码
补充资料:基于ISO/IEC10646和Unicode的汉字编码字符集
基于ISO/IEC10646和Unicode的汉字编码字符集
coded Ideographic character sets based on ISO/IEC 10646/Unicode
]lyu 150/IEC 10646/Un一eo由de hanzlb ianma zifuji基于150/IEC 10646和Uulcode的汉字编码字符集((闭曰Id仪心raphicch~ter setsb别哭对on 150/IEC 10646/Unicode)在I田/IEC10646一1定义的体系结构内,遵守中、日、韩汉字认同甄别规则而统一编码的汉字(参见汉字编码字符集标准体系结构)。 中日韩统一汉宇指I劝/IEC 10646中基本多文种平面的I区里的20902个汉字。其编码从4E00始,至gF八j终。这20 902个汉字是源自中国及其台湾地区、日本、韩国的13个字符集的60000多个汉字经过认同与甄别,合并为28000字中最有用的子集。 它涵盖了GB 2312之全部,GB 8565之全部,(现代汉语通用字表》之全部,Bigs之全部,台湾地区新、旧电报码之全部,日本的JIS汉字之全部,韩国K岌二汉字之全部。 这些汉字的字序,是按照汉字在中、日、韩四大字典的页码、字位综合排列的(参见汉字字序)。 中日韩统一汉字的字表格式为“四点式”(显印4种汉字字型)。 Row/Cell C JK Ueede GHallzi一T Kanji Hanja 078/000一一一一统一编码~4E000一523BI一44210一306C0一6C69一交换码(十六进制)0一50271一36()10一16760一7673~区位码 个个个个(源字集) 源字集编号源字集编号 G源字集是 G 0 GB 2312一1980 GI GB12345一199()及58个香港用字、92个“吏读” G 3 GB 7589一1987非简化形式 GS(泪7590一1987非简化形式 G7现代汉语通用字表 GS GB8665一1989邮电通信子集 T源字集是 T 1 TCAesCNS 11643第一字面及附加字符 TZ TG冬CNSll643第二字面 T E TCA,CNS n643第十四字面及附加字符 J源字集是 J 0 JIS烈)208一1990 J 1 JISXDZ12一199() K源字集是 K OK义!56()1一1987 K 1 KSC 5657一1991 中、日、韩汉宇认同规则在制定中、日、韩统一汉字时,当时的中、日、韩联合研究组(CJK-JRG)共同确定的认同与甄别原则的主要之点是: (1)接受用于汉字认同的XYZ模型(参见汉字的XYZ模型),认同在Y轴进行一对汉字字形的认同,而不是字义、字音的认同,也不是具体造型的认 同。 (2)不作“垂直认同”。即在同一集属下(如同在G下,或同在T下),即使两个汉字的字形非常相近也不认同。如“丢,“丢”,“户”“户”,“吕”“吕”不认同。这也称作“源字集分离”造成的分别编码, 可视为认同规则的特例。 (3)非同源字不认同。即在文字的演变过程中互不相干的字不认同。比如,日文略字“壳”(卖)与 贝壳的“壳”就不认同;朝文吏读字“木”与“木”也不 能认同。中、日、韩各国与150门EC 10646等效的版本中国:GB13000.1一1995日本:JIS 0221一1995韩国:KSC50(j0一1995(张轴材)
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条