1) source character set
来源字符集
2) source alphabet
信源字母集,信源符号集
3) Alphabetic Character Set
字符字符集
4) character set
字符集
1.
Setting environment variable to update Oracle client s character set;
设置环境变量修改Oracle客户端字符集
2.
Analysis of Oracle Database Character Set Problems;
Oracle数据库字符集问题解析
3.
Some proposes on modification of Tibetan encoded character set-basic set;
藏文字符集基本集的修订方案
5) charset
字符集
1.
Study and implementation of JAVA charset codec;
Java字符集编/解码器的研究与实现
2.
A Method to Convert ORACLE Database Objects and Information Between Different Charsets;
不同字符集的ORACLE数据库对象和信息转换方法
3.
A Simple Way to Convert MYSQL Database Charset From GBK to UTF-8;
以MYSQL数据库为例,介绍了一种简便的字符集的转换方法,将MYSQL的GBK数据库转换成UTF-8的数据库,在实验的基础上提出并实现了大数据量数据库字符集转换的方案。
补充资料:字符集
字符集
character set
zifu』i字符集(character set)按某种约定而设定的一组表示数据的符号。数据可以是数、英文字母、汉字、符号、命令、图形、图象、声音等。 在字符集内,每个字拼都有确定的二进制编码,并能被计算机辨识。 在编码字符集中的字符代码必须具有:①唯一性,即字符与二进制代码之间为一一对应关系。不存在1个字符有1种以上的代码,或1种代码表示1种以上的字符。②规范性,各种编码字符集都有相当大的适用范围,在此范围内的计算机用户必须严格遵守其规定。只有这样,才能保证信息的交换和相互利用。③兼容性,当一个计算机系统中采用1种以上的字符集时,应考虑不同字符集中字符代码的兼容性。即一方面,要使各种字符共容于一个系统中,能够相互区分而不会混淆,另一方面,也要考虑不同字符集之间具有某种共性和继承性而不会相互冲突。 计算机中应用最广的编码字符集为美国制订的A瑛{11。它采用7位二进制位进行编码。字符集中包含32个控制字符和%个图形字符,图形字符有数字、英文大小写字母和多种符号。与A岌二11完全兼容的字符集有国际标准化组织制订的I犯646及我国制订的GB1988。国外比较流行的另一种字符集为EB(工)IC。这是一种以8位二进制位编码的字符集,主要应用于美国IBM公司的大中型计算机系统中。为了适应汉字信息处理的需要,我国于1980年制订了“信息交换用汉字编码字符集·基本集”,其标准号为〔沼2312一80,简称国标码。它是我国应用最广的汉字编码字符集。GB2312包含汉字6763个(分布在16一87区),非汉字图形字符682个(分布在1一9区)。每个字符以两个字节来编码。当在计算机中同时处理汉字及A以二11字符集的字符时,为了满足兼容性的要求,将(犯2312的代码作某种变化,即把字节的最高位置为1,以便同最高位为O的ASCll码相区分。 除了GB2312外,我国台湾地区还采用“通用汉字标准交换码(即CNS 11643)”、Bl一G5码及TCA码等。随着汉字在国际交流中的重要性日益提高,在国际标准化组织以及中、日、韩三国专家和政府的努力下,制定了包含中、日、韩3国所使用的汉字的编码字符集“统一的中日韩汉字辞汇与字序”,简称“CJK’,大字符集。集中包含汉字20 902个。该字符集己成为“国际标准通用多八位编码字符集(I岌)10646)”的重要组成部分。(何厚存)
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条