電腦為什麼不用國際碼表示漢字
⑴ 在計算機中怎麼判斷是不是國標碼
在計算機內部用機內碼,而不用國標碼表示漢字的主要原因是,計算機只識別由0和1組成的機器碼(即機內碼),而不識別國標碼。
漢字機內碼,又稱「漢字ASCII碼」,簡稱「內碼」,指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。
每個漢字有個二進制編碼,叫漢字國標碼。
在我國漢字代碼標准GB2312-80中有6763個常用漢字規定了二進制編碼。
每個漢字使用2個位元組。
⑵ 漢字進行傳輸處理和存儲時用的是國標碼還是機內碼
在電腦內部對漢字進行傳輸處理和存儲時使用漢字的機內碼。
電腦內部漢字信息的存儲運算的代碼有四種:輸入碼、國標碼、內碼和字型碼。
輸入碼:包括拼音編碼和字型編碼。微軟拼音ABC就是拼音編碼,五筆字型輸入法就是字型編碼。
國標碼:又稱為漢字交換碼,在計算機之間交換信息用。用兩個位元組來表示,每個位元組的最高位均為0,因此可以表示的漢字數為2的14次冪,就是16384個。將漢字區位碼的高位位元組、低位位元組各加十進制數32(即十六進制數的20),便得到國標碼。例如「中」字的國標碼為8680(十進制)或7468(十六進制)。
內碼:漢字內碼是在設備和信息處理系統內部存儲、處理、傳輸漢字用的代碼。無論使用何種輸入碼,進入計算機後就立即被轉換為機內碼。規則是將國標碼的高位位元組、低位位元組各自加上128(十進制)或80(十六進制)。例如,「中」字的內碼以十六進製表示時應為F4E8。這樣做的目的是使漢字內碼區別於西文的ASCII,因為每個西文字母的ASCII的高位均為0,而漢字內碼的每個位元組的高位均為1。
字型碼:表示漢字字形的字模數據,因此也稱為字模碼,是漢字的輸出形式。通常用點陣、矢量函數等表示。用點陣表示時,字形碼指的就是這個漢字字形點陣的代碼。根據輸出漢字的要求不同,點陣的多少也不同。簡易型漢字為16′16點陣、提高型漢字為24′24點陣、48′48點陣等。如果是24′24點陣,每行24個點就是24個二進制位,存儲一行代碼需要3個位元組。那麼,24行共佔用3′24=72個位元組。計算公式:每行點數/8′行數。依此,對於48′48的點陣,一個漢字字形需要佔用的存儲空間為48/8′48=6′48=288個位元組。
⑶ 在計算機內部用機內碼而不用國標碼表示漢字的原因是
在有些情況下,國標碼有可能造成誤解。
因為漢字處理系統要保證中西文的兼容,當系統中同時存在ASCII碼和漢字國標碼時,將會產生二義性。為了避免ASCII碼和國標碼同時使用時產生二義性問題,大部分漢字系統都採用將國標碼每個位元組高位置1作為漢字機內碼。
這樣既解決了漢字機內碼與西文機內碼之間的二義性,又使漢字機內碼與國標碼具有極簡單的對應關系。
(3)電腦為什麼不用國際碼表示漢字擴展閱讀
計算機只識別由0、1組成的代碼,ASCII碼是英文信息處理的標准編碼,漢字信息處理也必須有一個統一的標准編碼。
漢字交換碼(國標碼)主要用於漢字信息交換,我國國家標准局於1981年5月頒布了《信息交換用漢字編碼字元集——基本集》,代號為GB2312-80,共對6763個漢字和682個圖形字元進行了編碼,其編碼原則為:漢字用兩個位元組表示。
原則上,兩個位元組可以表示256×256=65536種不同的符號,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII 西文字元編碼的關系,我國國家標准局採用了加以修正的兩位元組漢字編碼方案,只用了兩個位元組的低7位。
這個方案可以容納128×128=16384種不同的漢字,但為了與標准ASCII碼兼容,每個位元組中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個位元組只能有94個編碼。這樣,雙七位實際能夠表示的字數是:94×94=8836個。
⑷ 計算機中漢字編碼 為什麼不用Unicode,要用GB2312
這個嘛,受環境變數的影響!
有的時候能用UTF-8,有的時候可以GB2312,UTF-8是國際標准,而那個GB2312,你可以試一下的就是,如果中國的軟體,就是GB2312,如果是國際軟體,想微軟的什麼東西,就是UTF-8
⑸ 國際規定計算機中對漢字的編碼必須採用漢字國標碼
A
字形碼是用來輸出的 電報碼不是用在計算機中 拼音碼是輸入碼 只有國標碼是計算機中的漢字編碼
⑹ 漢字在計算機系統中存儲所用的編碼是什麼
機內碼。
漢字機內碼,又稱「漢字ASCII碼」,簡稱「內碼」,指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受後就由漢字操作系統的「輸入碼轉換模塊」轉換為機內碼,與所採用的鍵盤輸入法無關。
機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。
(6)電腦為什麼不用國際碼表示漢字擴展閱讀:
因為漢字處理系統要保證中西文的兼容,當系統中同時存在ASCII碼和漢字國標碼時,將會產生二義性。
例如:有兩個位元組的內容為30H和21H,它既可表示漢字「啊」的國標碼,又可表示西文「0」和「!」的ASCII碼。為此,漢字機內碼應對國標碼加以適當處理和變換。
國標碼的機內碼為二位元組長的代碼,它是在相應國標碼的每個位元組最高位上加「1」,即
漢字機內碼=漢字國標碼+8080H
例如,上述「啊」字的國標碼是3021H,其漢字機內碼則是B0A1H。
⑺ 計算機內漢字處理的過程中為什麼要把國際碼轉換成機內碼
漢字信息在計算機內部也是以二進制方式存放。由於漢字數量多,用一個位元組的128種狀態不能全部表示出來,因此在1980年我國頒布的《信息交換用漢字編碼字元集——基本集》,即國家標准GB2312-80方案中規定用兩個位元組的十六位二進製表示一個漢字,每個位元組都只使用低7位(與ASCII碼相同),即有128×128=16384種狀態。由於ASCII碼的34個控制代碼在漢字系統中也要使用,為不致發生沖突,不能作為漢字編碼,128除去34隻剩94種,所以漢字編碼表的大小是94×94=8836,用以表示國標碼規定的7445個漢字和圖形符號。每個漢字或圖形符號分別用兩位的十進制區碼(行碼)和兩位的十進制位碼(列碼)表示,不足的地方補0,組合起來就是區位碼。把區位碼按一定的規則轉換成的二進制代碼叫做信息交換碼(簡稱國標碼)。國標碼共有漢字6763個(一級漢字,是最常用的漢字,按漢語拼音字母順序排列,共3755個;二級漢字,屬於次常用漢字,按偏旁部首筆畫順序排列,共3008個),數字、字母、符號等682個,共7445個。由於國標碼不能直接存儲在計算機內,為方便計算機內部處理和存儲漢字,又區別於ASCII碼,將國標碼中的每個位元組在最高位改設為1,這樣就形成了在計算機內部用來進行漢字的存儲、運算的編碼叫機內碼(或漢字內碼,或內碼)。內碼既與國標碼有簡單的對應關系,易於轉換,又與ASCII碼有明顯的區別,且有統一的標准並且內碼是唯一的。
⑻ 在計算機內部用機內碼不用國標碼表示漢字的原因是
為了避免ASCII碼和國標碼同時使用時產生二義性問題,大部分漢字系統都採用將國標碼每個位元組高位置1作為漢字機內碼。這樣既解決了漢字機內碼與西文機內碼之間的二義性,又使漢字機內碼與國標碼具有極簡單的對應關系。
漢字內碼是為計算機內部對漢字進行存儲,處理的漢字代碼,應能滿足存儲,處理和傳輸的要求,當一個漢字輸入計算機後就會轉換為內碼,才能在機器內傳輸,處理,漢字內碼的形式也有多種多樣。
對應於國標碼一個漢字也用2個位元組存儲,並把每個位元組的最高二進制位置1作為漢字內碼的表識,以免與單位元組的ASCII碼產生歧義性。
(8)電腦為什麼不用國際碼表示漢字擴展閱讀:
計算機內部用機內碼注意事項:
在計算機內部,系統只對漢字內碼進行處理,不涉及漢字本身的字形。若要輸出漢字處理的結果,則必須把漢字內碼還原成漢字字形。
不同的字體有不同的字型檔。每輸出一個漢字,都必須根據內碼到字型檔中找出該漢字的字形描述信息,再送去顯示或列印。描述字元字形的方法主要有兩種,點陣字形和輪廓字形。
⑼ 在計算機內部用機內碼,而不用國際碼表示漢字的原因是。
計算機硬體只識別專用機器語言。
⑽ 計算機的內碼和外碼有什麼區別
我們常說漢字的"內碼"與"外碼"。
內碼是漢字在計算機內部存儲,處理和傳輸用的信息編碼。它必須與ascii碼兼容但又不能沖突。
所以把國標碼兩個位元組的最高位置'1',以區別於西文,這就是內碼。漢字的輸入碼稱為"外碼"。輸入碼即指我們輸入漢字時使用的編碼。常見的外碼分為數字編碼(如區位碼),拼音編碼和字形編碼(如五筆)。
再說區位碼,"啊"的區位碼是1601,寫成16進制是0x10,0x01。這和計算機廣泛使用的ascii編碼沖突。為了兼容00-7f的
ascii編碼,我們在區位碼的高、低位元組上分別加上a0。這樣"啊"的編碼就成為b0a1。我們將加過兩個a0的編碼也稱為gb2312編碼,雖然
gb2312的原文根本沒提到這一點。
內碼是指操作系統內部的字元編碼。早期操作系統的內碼是與語言相關的.現在的windows在內部統...我們一般將預設代碼頁指定的編碼說成是內碼,"。
windows中有預設代碼頁的概念://www;內碼"。所謂"。按照其它編碼解釋.kth。它必須與ascii碼兼容但又不能沖突;text/.html"
target="_blank">http?,它在技術上可以同時支持多個代碼頁.kth;的區位碼是1601,0x01,處理和傳輸用的信息編碼?,例如在html文件中就可以指定charset。例如windows的記事本打開了一個文本文件。我們將加過兩個a0的編碼也稱為gb2312編碼。為了兼容00-7f的
ascii編碼,並沒有什麼官方的定義。如果他使用了0x80-0xff之間的字元,然後用代碼頁適應各種語言;的編碼就成為b0a1。只要文件能說明自己使用什麼編碼、
d7。;content-type"。代碼頁也只是微軟的一種習慣叫法,就會出現亂碼???.nada,我們在區位碼的高,中文windows又按照預設的gbk去解釋、還是按照big5解釋,例如、d6??
進一步的參考資料
"??://www。早期操作系統的內碼是與語言相關的?;外碼"
(