資源簡介 (共16張PPT)第3課 字符編碼對于英文字母、數字和其他非數值數據,目前常用的編碼規則是ASCII碼(美國信息交換標準碼)標準的ASCII碼用一個字節中的7位來表示,可以表示27=128種編碼。(一個字母、數字、半角符號等占1個字節)字符編碼字符或控制符 ASCII 相當的十進制數A 1000001 65B 1000010 66a 1100001 970 0110000 481 0110001 49空格 0100000 32回車 0001101 13換行符 0001100 102漢字在計算機內部也是以二進制代碼的形式表示,我國采用的國標碼:GB2312-80為6763個常用的漢字規定了二進制代碼。最近新標準有GB1300(含65536個符號)和GB18030編碼(一個漢字、全角符號等占2個字節,每個字節含8位二進制代碼)計算機中漢字的表示也是用二進制編碼,同樣是人為編碼的。根據應用目的的不同,漢字編碼分為外碼、交換碼、機內碼和字形碼。外碼也叫輸入碼,是用來將漢字輸入到計算機中的一組鍵盤符號。交換碼(國標碼)機內碼,根據國標碼的規定,每一個漢字都有了確定的二進制代碼,在微機內部漢字代碼都用機內碼,在磁盤上記錄漢字代碼也使用機內碼。字形碼是漢字的輸出碼,輸出漢字時都采用圖形方式3字符編碼字符編碼的原因主要源于計算機底層硬件的特性和處理能力的限制。具體來說,計算機最初被設計用來解決數字計算問題,其底層硬件實現依賴于電路的斷開和閉合兩種狀態,這兩種狀態分別用0和1兩個數字表示。因此,計算機只能直接存儲和處理二進制數字。然而,隨著計算機技術的發展,人們發現計算機除了數字計算外,還可以進行文本處理等更多工作。為了在計算機上表示、存儲和處理像文字、符號等非數字信息,就需要將這些字符轉換成計算機能夠理解的二進制數字。但是,這種轉換不能隨意進行,否則可能會造成同一段二進制數字在不同計算機上顯示出的字符不一致的情況。因此,需要制定一個統一的、標準的轉換規則,即字符編碼標準。為什么要字符編碼漢字編碼問題1:怎樣將漢字輸入到計算機?1、自動識別方式:漢字字形的自動識別、漢字語音的自動識別2、將漢字編碼輸入輸入碼音碼——拼音輸入法形碼——五筆輸入法音形碼——未來碼輸入法形音碼——兩筆輸入法(使用什么輸入法?)漢字編碼問題2:各種計算機系統之間是怎樣交換漢字信息?交換碼(GB2312-80標準《信息交換用漢字編碼》) ——區位碼(94個區、每個區包含94個位,存儲容量:94×94個單元)區碼在前,位碼在后漢字編碼一個漢字占2B一個字符占1B每個漢字的區碼和位碼在計算機內部分別用一個字節來表示。漢字編碼問題3:在計算機內部怎么處理漢字?處理碼是計算機內部用于信息處理的漢字代碼,也稱漢字機內碼。一般情況內碼和機內碼是一樣的。如何區分漢字編碼還是ASCII碼 ASCII碼:最高位為“0”,值小于128機內碼:最高位為“1”,值大于128漢字編碼問題4:計算機怎么實現漢字的輸出?漢字編碼漢字編碼:點陣方式:點陣漢字所占存儲空間 = 點陣數(小方格)/ 8 B漢字編碼:漢字點陣碼是一種用黑白兩色點陣來表示漢字字形的編碼。一個16×16點陣字模的存儲容量為( )A.1字節 B.16字節C.32字節 D.64字節輸入 存儲 輸出識別漢字編碼輸入碼拼音字形字庫交換碼編碼處理處理碼轉換點陣字形碼(內碼)國標碼機內碼輸入漢字字形碼輸出漢字輸入碼拼音編碼字形編碼點陣字形矢量字形漢字編碼的過程牛刀小試1、小明用UltraEdit軟件觀察“G20,2016,中國”這幾個字,顯示的十六進制內碼如圖所示。則“2017”這幾個字對應的內碼用十六進制表示是( )A.32 30 31 37 B.2C 32 30 32 C.32 30 31 36 D.2C 32 30 332、用UltraEdit軟件觀察字符內碼,結果如圖所示。由圖可知,“2018,高考加油!”所占字節數及“高”的內碼分別是( )A.14,B8DF B.15,ACB8 C.16,B8DF D.16,ACB8A一個漢字占兩個字節,一個英文字符或數字占一個字符,全角狀態下標點符號占兩個字符。C牛 刀 小 試3、某字庫采用點陣方式描述漢字字形,點陣規模為16×16,每個點用1個二進制位表示,“0”表示白點,“1”表示黑點,逐行編碼。漢字“和”的字形如圖所示,下列描述正確的是( )A.該漢字字形編碼需要16×16個字節B.該漢字字形第一行編碼需要2個字節C.該漢字字形編碼的第一個字節內容是OFHD.該漢字字形編碼最后一個字節內容是FFH4、字符“A”比“a”的ASCII碼值小32(十進制),已知字符“H”的二進制為0100 1000,則字符“h”的二進制ASCII碼值為( )A.0110 1000 B.0111 1000 C.0010 1000 D.0011 1000B一個漢字占兩個字節,一個英文字符或數字占一個字符,全角狀態下標點符號占兩個字符。A先將“H”轉換為十進制,再得出“h”的十進制數,然后再轉換成二進制16 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫