说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 字符集·基本集
1)  Collection of Chinese characters· Basic Collection
字符集·基本集
2)  basic character set
基本字符集
3)  Tibetan base character set
藏文基本字符集
4)  native character set
本原字符集
5)  native character set
本机字符集
6)  Alphabetic Character Set
字符字符集
补充资料:字符集


字符集
character set

zifu』i字符集(character set)按某种约定而设定的一组表示数据的符号。数据可以是数、英文字母、汉字、符号、命令、图形、图象、声音等。 在字符集内,每个字拼都有确定的二进制编码,并能被计算机辨识。 在编码字符集中的字符代码必须具有:①唯一性,即字符与二进制代码之间为一一对应关系。不存在1个字符有1种以上的代码,或1种代码表示1种以上的字符。②规范性,各种编码字符集都有相当大的适用范围,在此范围内的计算机用户必须严格遵守其规定。只有这样,才能保证信息的交换和相互利用。③兼容性,当一个计算机系统中采用1种以上的字符集时,应考虑不同字符集中字符代码的兼容性。即一方面,要使各种字符共容于一个系统中,能够相互区分而不会混淆,另一方面,也要考虑不同字符集之间具有某种共性和继承性而不会相互冲突。 计算机中应用最广的编码字符集为美国制订的A瑛{11。它采用7位二进制位进行编码。字符集中包含32个控制字符和%个图形字符,图形字符有数字、英文大小写字母和多种符号。与A岌二11完全兼容的字符集有国际标准化组织制订的I犯646及我国制订的GB1988。国外比较流行的另一种字符集为EB(工)IC。这是一种以8位二进制位编码的字符集,主要应用于美国IBM公司的大中型计算机系统中。为了适应汉字信息处理的需要,我国于1980年制订了“信息交换用汉字编码字符集·基本集”,其标准号为〔沼2312一80,简称国标码。它是我国应用最广的汉字编码字符集。GB2312包含汉字6763个(分布在16一87区),非汉字图形字符682个(分布在1一9区)。每个字符以两个字节来编码。当在计算机中同时处理汉字及A以二11字符集的字符时,为了满足兼容性的要求,将(犯2312的代码作某种变化,即把字节的最高位置为1,以便同最高位为O的ASCll码相区分。 除了GB2312外,我国台湾地区还采用“通用汉字标准交换码(即CNS 11643)”、Bl一G5码及TCA码等。随着汉字在国际交流中的重要性日益提高,在国际标准化组织以及中、日、韩三国专家和政府的努力下,制定了包含中、日、韩3国所使用的汉字的编码字符集“统一的中日韩汉字辞汇与字序”,简称“CJK’,大字符集。集中包含汉字20 902个。该字符集己成为“国际标准通用多八位编码字符集(I岌)10646)”的重要组成部分。(何厚存)
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条