电脑为什么不用国际码表示汉字
⑴ 在计算机中怎么判断是不是国标码
在计算机内部用机内码,而不用国标码表示汉字的主要原因是,计算机只识别由0和1组成的机器码(即机内码),而不识别国标码。
汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。
每个汉字有个二进制编码,叫汉字国标码。
在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。
每个汉字使用2个字节。
⑵ 汉字进行传输处理和存储时用的是国标码还是机内码
在电脑内部对汉字进行传输处理和存储时使用汉字的机内码。
电脑内部汉字信息的存储运算的代码有四种:输入码、国标码、内码和字型码。
输入码:包括拼音编码和字型编码。微软拼音ABC就是拼音编码,五笔字型输入法就是字型编码。
国标码:又称为汉字交换码,在计算机之间交换信息用。用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为2的14次幂,就是16384个。将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20),便得到国标码。例如“中”字的国标码为8680(十进制)或7468(十六进制)。
内码:汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码,进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128(十进制)或80(十六进制)。例如,“中”字的内码以十六进制表示时应为F4E8。这样做的目的是使汉字内码区别于西文的ASCII,因为每个西文字母的ASCII的高位均为0,而汉字内码的每个字节的高位均为1。
字型码:表示汉字字形的字模数据,因此也称为字模码,是汉字的输出形式。通常用点阵、矢量函数等表示。用点阵表示时,字形码指的就是这个汉字字形点阵的代码。根据输出汉字的要求不同,点阵的多少也不同。简易型汉字为16′16点阵、提高型汉字为24′24点阵、48′48点阵等。如果是24′24点阵,每行24个点就是24个二进制位,存储一行代码需要3个字节。那么,24行共占用3′24=72个字节。计算公式:每行点数/8′行数。依此,对于48′48的点阵,一个汉字字形需要占用的存储空间为48/8′48=6′48=288个字节。
⑶ 在计算机内部用机内码而不用国标码表示汉字的原因是
在有些情况下,国标码有可能造成误解。
因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。
这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。
(3)电脑为什么不用国际码表示汉字扩展阅读
计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。
汉字交换码(国标码)主要用于汉字信息交换,我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示。
原则上,两个字节可以表示256×256=65536种不同的符号,作为汉字编码表示的基础是可行的。但考虑到汉字编码与其它国际通用编码,如ASCII 西文字符编码的关系,我国国家标准局采用了加以修正的两字节汉字编码方案,只用了两个字节的低7位。
这个方案可以容纳128×128=16384种不同的汉字,但为了与标准ASCII码兼容,每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码。所以每个字节只能有94个编码。这样,双七位实际能够表示的字数是:94×94=8836个。
⑷ 计算机中汉字编码 为什么不用Unicode,要用GB2312
这个嘛,受环境变量的影响!
有的时候能用UTF-8,有的时候可以GB2312,UTF-8是国际标准,而那个GB2312,你可以试一下的就是,如果中国的软件,就是GB2312,如果是国际软件,想微软的什么东西,就是UTF-8
⑸ 国际规定计算机中对汉字的编码必须采用汉字国标码
A
字形码是用来输出的 电报码不是用在计算机中 拼音码是输入码 只有国标码是计算机中的汉字编码
⑹ 汉字在计算机系统中存储所用的编码是什么
机内码。
汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。
机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。
(6)电脑为什么不用国际码表示汉字扩展阅读:
因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。
例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。
国标码的机内码为二字节长的代码,它是在相应国标码的每个字节最高位上加“1”,即
汉字机内码=汉字国标码+8080H
例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。
⑺ 计算机内汉字处理的过程中为什么要把国际码转换成机内码
汉字信息在计算机内部也是以二进制方式存放。由于汉字数量多,用一个字节的128种状态不能全部表示出来,因此在1980年我国颁布的《信息交换用汉字编码字符集——基本集》,即国家标准GB2312-80方案中规定用两个字节的十六位二进制表示一个汉字,每个字节都只使用低7位(与ASCII码相同),即有128×128=16384种状态。由于ASCII码的34个控制代码在汉字系统中也要使用,为不致发生冲突,不能作为汉字编码,128除去34只剩94种,所以汉字编码表的大小是94×94=8836,用以表示国标码规定的7445个汉字和图形符号。每个汉字或图形符号分别用两位的十进制区码(行码)和两位的十进制位码(列码)表示,不足的地方补0,组合起来就是区位码。把区位码按一定的规则转换成的二进制代码叫做信息交换码(简称国标码)。国标码共有汉字6763个(一级汉字,是最常用的汉字,按汉语拼音字母顺序排列,共3755个;二级汉字,属于次常用汉字,按偏旁部首笔画顺序排列,共3008个),数字、字母、符号等682个,共7445个。由于国标码不能直接存储在计算机内,为方便计算机内部处理和存储汉字,又区别于ASCII码,将国标码中的每个字节在最高位改设为1,这样就形成了在计算机内部用来进行汉字的存储、运算的编码叫机内码(或汉字内码,或内码)。内码既与国标码有简单的对应关系,易于转换,又与ASCII码有明显的区别,且有统一的标准并且内码是唯一的。
⑻ 在计算机内部用机内码不用国标码表示汉字的原因是
为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。
汉字内码是为计算机内部对汉字进行存储,处理的汉字代码,应能满足存储,处理和传输的要求,当一个汉字输入计算机后就会转换为内码,才能在机器内传输,处理,汉字内码的形式也有多种多样。
对应于国标码一个汉字也用2个字节存储,并把每个字节的最高二进制位置1作为汉字内码的表识,以免与单字节的ASCII码产生歧义性。
(8)电脑为什么不用国际码表示汉字扩展阅读:
计算机内部用机内码注意事项:
在计算机内部,系统只对汉字内码进行处理,不涉及汉字本身的字形。若要输出汉字处理的结果,则必须把汉字内码还原成汉字字形。
不同的字体有不同的字库。每输出一个汉字,都必须根据内码到字库中找出该汉字的字形描述信息,再送去显示或打印。描述字符字形的方法主要有两种,点阵字形和轮廓字形。
⑼ 在计算机内部用机内码,而不用国际码表示汉字的原因是。
计算机硬件只识别专用机器语言。
⑽ 计算机的内码和外码有什么区别
我们常说汉字的"内码"与"外码"。
内码是汉字在计算机内部存储,处理和传输用的信息编码。它必须与ascii码兼容但又不能冲突。
所以把国标码两个字节的最高位置'1',以区别于西文,这就是内码。汉字的输入码称为"外码"。输入码即指我们输入汉字时使用的编码。常见的外码分为数字编码(如区位码),拼音编码和字形编码(如五笔)。
再说区位码,"啊"的区位码是1601,写成16进制是0x10,0x01。这和计算机广泛使用的ascii编码冲突。为了兼容00-7f的
ascii编码,我们在区位码的高、低字节上分别加上a0。这样"啊"的编码就成为b0a1。我们将加过两个a0的编码也称为gb2312编码,虽然
gb2312的原文根本没提到这一点。
内码是指操作系统内部的字符编码。早期操作系统的内码是与语言相关的.现在的windows在内部统...我们一般将缺省代码页指定的编码说成是内码,"。
windows中有缺省代码页的概念://www;内码"。所谓"。按照其它编码解释.kth。它必须与ascii码兼容但又不能冲突;text/.html"
target="_blank">http?,它在技术上可以同时支持多个代码页.kth;的区位码是1601,0x01,处理和传输用的信息编码?,例如在html文件中就可以指定charset。例如windows的记事本打开了一个文本文件。我们将加过两个a0的编码也称为gb2312编码。为了兼容00-7f的
ascii编码,并没有什么官方的定义。如果他使用了0x80-0xff之间的字符,然后用代码页适应各种语言;的编码就成为b0a1。只要文件能说明自己使用什么编码、
d7。;content-type"。代码页也只是微软的一种习惯叫法,就会出现乱码???.nada,我们在区位码的高,中文windows又按照缺省的gbk去解释、还是按照big5解释,例如、d6??
进一步的参考资料
"??://www。早期操作系统的内码是与语言相关的?;外码"
(