汉字国家标准的编码原则是
汉字国家标准的编码原则是汉字用两个字节表示,每个字节用一个七位码表示(高位为0)。
汉字国家标准码,创建于1980,颁布汉字编码国家标准是为了使每个汉字都有一个全国统一的代码。每个汉字都有一个二进制码,称为汉字国标码。在汉字编码标准GB2312-80中,有6763个常用汉字采用二进制编码。
GB2312-80?GB2312将码表分为94个区域,对应第一个字节;每个区域有94位,对应第二个字节。这两个字节的值分别是区号值和位数值加32(20H)。01-09为符号和数字区,16-87为汉字区,10-15和88-94为待进一步规范的空白区。
GB2312将采集的汉字分为两个层次:第一层次是常用汉字3755个,按汉语拼音字母/笔画形状顺序排列在16-55的区域内;二级汉字是3008个常用汉字,放在56-87个区域,按偏旁/笔画顺序排列。因此,GB2312最多可以表示6763个汉字。
国家代码不等于区号,而是通过对区号稍加转换得到的。转换方法如下:首先将十进制区号和位码转换成十六进制区号和位码;这样就得到一个与国标代码有相对位置差的代码,然后将这个代码的第一个字节和第二个字节分别加上20H,就得到国标代码。比如“宝”的国标代号是3123H,通过以下变换得到:1703d->;1103h->;+20H-& gt;3123H .