《項目三漢字編碼》PPT課件.ppt_第1頁
《項目三漢字編碼》PPT課件.ppt_第2頁
《項目三漢字編碼》PPT課件.ppt_第3頁
《項目三漢字編碼》PPT課件.ppt_第4頁
《項目三漢字編碼》PPT課件.ppt_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、漢字編碼,第一章 項目三,2,重點:漢字編碼類型及編碼方式 難點:ASCII碼,1.2.5 字符的編碼,3,1.2.5 字符的編碼,字母、數(shù)字、各種符號,4,1.2.5 字符的編碼,1.西文字符的編碼,計算機中的數(shù)據(jù)都是用二進制編碼表示的,用以表示字符的二進制編碼稱為字符編碼。 而,計算機最常用的就是ASCII。 美國信息交換標準碼ASCII,7位碼(128個字符) 擴展碼ASCII,8位碼(256個字符),7位國際通用,5,1.2.5 字符的編碼,1.西文字符的編碼,ASCII碼對128個字符進行了編碼,這其中包括大小寫英文字母、阿拉伯數(shù)字、標點符號以及控制字符等特殊字符。 ASCII碼中共

2、有34個非圖形字符(控制字符),94個可打印字符(圖形字符)。 讀表1-6可知,每個符號的ASCII編碼為:高3位+低4位。,6,1.2.5 字符的編碼,1.西文字符的編碼,“a”字符編碼為1100001(97),bcde依次增加 “A”字符編碼為1000001(65),BCDE依次增加 “0”數(shù)字字符編碼為0110000(48),1234依次增加 計算機內(nèi)部用一個字節(jié)(8個二進制位)存放一個7位ASCII碼,最高位置為0。,重點掌握字符的推算!,7,1.2.5 字符的編碼,ASCII碼中存在以下兩個規(guī)律: (1)大小寫英文字母和阿拉伯數(shù)字都是按其固有順序排列在表中的。 (2)在表中,阿拉伯數(shù)

3、字排在大寫英文字母前,而大寫英文字母排在小寫英文字母前。,1.西文字符的編碼,8,1.2.5 字符的編碼,1.西文字符的編碼(非圖形字符/控制字符),SP(空格)的編碼是 CR(回車)的編碼是 DEL(刪除)的編碼是 BS(退格)的編碼是,0100000,0001101,1111111,0001000,9,1.2.5 字符的編碼,漢字分成兩級: 一級漢字3755個,按漢語拼音字母的次序排列; 二級漢字3008個,按偏旁部首排列。 由于一個字節(jié)不足以表示6763個漢字,所以一個國標碼用兩個字節(jié)來表示一個漢字,每個字節(jié)最高位為0。,2.漢字的編碼國標碼,10,1.2.5 字符的編碼,GB2312-

4、80將漢字分為94行、94列,代碼表分為94個區(qū)(行)、94個位(列)。 區(qū)位碼是一個4位十進制數(shù) 國標碼是一個4位十六進制數(shù)。,2.漢字的編碼區(qū)位碼,11,1.2.5 字符的編碼,2.漢字的編碼區(qū)位碼、國標碼轉(zhuǎn)換,漢字國標碼=區(qū)位碼+(2020)H,區(qū)號和位號: 轉(zhuǎn)換為16進制數(shù),分別加上(20)H,12,1.2.5 字符的編碼,3.漢字的處理過程,由于漢字的特殊性(象形文字),漢字的處理過程必須同時需要多種編碼才能完成。,13,1.2.5 字符的編碼,3.漢字的處理過程,漢字輸入碼(外碼):為將漢字輸入計算機而編制的代碼。 一個好的輸入編碼: 編碼短,重碼少,好學好記,14,1.2.5 字

5、符的編碼,3.漢字的處理過程,漢字內(nèi)碼:是為在計算機內(nèi)部對漢字進行存儲、處理的漢字編碼。 不同漢字系統(tǒng)使用的機內(nèi)碼可能不同。漢字內(nèi)碼的形式有多種。 對應國標碼,一個漢字的內(nèi)碼用2個字節(jié)存儲,每個漢字的最高位置“1”作為漢字內(nèi)碼的標識。,15,1.2.5 字符的編碼,3.漢字的處理過程,國標碼,漢字內(nèi)碼,漢字內(nèi)碼=漢字國標碼+(8080)H,16,1.2.5 字符的編碼,3.漢字的處理過程,西文字符 7位ASCII 碼,區(qū)位碼分別加20H,國標碼,最高位由0變1,即加8080H,漢字內(nèi)碼,17,1.2.5 字符的編碼,4.漢字字形碼,又稱漢字字模,用于漢字在顯示屏或打印機輸出。 兩種表示方式:點

6、陣和矢量。 點陣規(guī)模越大,字形越清晰美觀,所占存儲空間也愈大。 矢量表示方式存儲的是描述漢字字形的輪廓特征。,18,1.2.5 字符的編碼,4.漢字字形碼,點陣:有點的用“1”表示,沒點的用“0”表示。一位(1 bit)可以存儲一個點的信息。 顯示一個漢字需要多少個點,就需要有多少位(bit)的存儲空間來存儲它。 例:存儲一個1616點陣的漢字字形碼,需要的存儲空間為:1616 bit=256 bit,即2568=32B(字節(jié)),19,1.2.5 字符的編碼,4.漢字字形碼,漢字的點陣字形編碼,僅用于構(gòu)造漢字的字庫 字模點陣只能用來構(gòu)成“字庫”,而不能用于機內(nèi)存儲。 輸出漢字時,先根據(jù)漢字內(nèi)碼從字庫中提取漢字的字形數(shù)據(jù),然后很據(jù)字形數(shù)據(jù)顯示和打印出漢字。,20,1.2.5 字符的編碼,4.漢字字形碼,點陣式:,21,1.2.5 字符的編碼,4.漢字字形碼,矢量式:,22,1.2.5 字符的編碼,5.漢字地址碼,是指漢字庫中存儲漢字字形信息的邏輯地址碼。需要向輸出設備輸出漢字時,必須通過地址碼對漢字庫進行訪問。,23,1.2.5 字符的編碼,6.其他漢字內(nèi)碼,1)GBK碼(擴充漢字內(nèi)碼規(guī)范):多達2萬多簡、繁漢字。 2)UCS碼

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論