組成原理課件23非數(shù)值數(shù)據(jù)的表示_第1頁
組成原理課件23非數(shù)值數(shù)據(jù)的表示_第2頁
組成原理課件23非數(shù)值數(shù)據(jù)的表示_第3頁
組成原理課件23非數(shù)值數(shù)據(jù)的表示_第4頁
組成原理課件23非數(shù)值數(shù)據(jù)的表示_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

北京理工大學計算機學院第2章2.1數(shù)值數(shù)據(jù)的表示2.2機器數(shù)的定點表示與浮點表示2.3非數(shù)值數(shù)據(jù)的表示2.4十進制數(shù)和數(shù)串的表示2.5不同類型的數(shù)據(jù)表示舉例2.6數(shù)據(jù)校驗碼北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示2.3.1字符和字符串的表示方法1.ASCII字符編碼常見的ASCII碼用七位二進制表示一個字符,它包括10個十進制數(shù)字(0~9)、52個英文大寫和小寫字母(A~Z,a~z)、34個專用符號和32個控制符號,共計128個字符。在ASCII碼表中,數(shù)字和英文字母都是按順序排列的,只要知道其中一個的二進制代碼,不要查表就可以推導(dǎo)出其他數(shù)字或字母的二進制代碼。北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示2.字符串的存放字符串是指一串連續(xù)的字符。例如,字符串IFX>0THENREAD(C)。

(1)向量法在存儲器中占用一片連續(xù)的空間,每個字節(jié)存放一個字符代碼,字符串的所有元素(字符)在物理上是鄰接的。在字長為32位的存儲器,每一個主存單元可存放4個字符,整個字符串需5個主存單元。在每個字節(jié)中實際存放的是相應(yīng)字符的ASCII碼。北京理工大學計算機學院IFX>0THENREA(C)D2.3非數(shù)值數(shù)據(jù)的表示5449462020202030454541444852433E2928584E北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示(2)串表法一個存儲單元有32位,僅存放一個字符代碼。字符串的每個字符代碼后有一個鏈接字,用以指出下一個字符的存儲單元地址。串表法不要求串中的各個字符在物理上相鄰,在對字符串進行刪除和插入操作時,只需修改相應(yīng)字符代碼后面的鏈接字即可。由于鏈接字占據(jù)了存儲單元的大部分空間,使得主存的有效利用率下降(只有原來的25%)。上例中整個字符串需19個主存單元。北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示2.3.2漢字的表示1.漢字國標碼

GB2312-80,簡稱國標碼。該標準共收集常用漢字6763個,其中一級漢字3755個,按拼音排序;二級漢字3008個,按部首排序;另外還有各種圖形符號682個,共計7445個。每個漢字、圖形符號都用兩個字節(jié)表示,每個字節(jié)只使用低七位編碼。北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示2.漢字區(qū)位碼

區(qū)位碼將漢字編碼GB2312-80中的6763個漢字分為94個區(qū),每個區(qū)中包含94個漢字(位),區(qū)和位組成一個二維數(shù)組,每個漢字在數(shù)組中對應(yīng)一個唯一的區(qū)位碼。漢字的區(qū)位碼定長4位,前2位表示區(qū)號,后2位表示位號,區(qū)號和位號用十進制數(shù)表示,區(qū)號從01到94,位號也從01到94。例如,“中”字在54區(qū)的48位上,其區(qū)位碼為“54-48”,“國”字在25區(qū)的90位上,其區(qū)位碼為“25-90”。北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示

漢字區(qū)位碼并不等于漢字國標碼,它們兩者之間的關(guān)系可用以下公式表示:

國標碼=區(qū)位碼(十六進制)+2020H

例如:已知漢字“春”的區(qū)位碼為“20-26”,計算它的國標碼。區(qū)位碼:

2026十進制

14H1AH十六進制

+20H+20H

國標碼:

34H3AH北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示3.漢字機內(nèi)碼

漢字可以通過不同的輸入碼輸入,但在計算機內(nèi)部其內(nèi)碼是唯一的。

因為漢字處理系統(tǒng)要保證中西文的兼容,當系統(tǒng)中同時存在ASCII碼和漢字國標碼時,將會產(chǎn)生二義性。北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示

例如:從主存中讀出兩個字節(jié)的內(nèi)容,它們分別為30H和21H,這時既可能是表示漢字“啊”的國標碼,又可能是表示西文“0”和“!”的ASCII碼。啊30210!北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示

常用的漢字機內(nèi)碼為兩字節(jié)長的代碼,它是在相應(yīng)漢字國標碼的每個字節(jié)最高位上加“1”。即:

漢字機內(nèi)碼=漢字國標碼+8080H

例如,上述“啊”字的國標碼是3021H,其漢字機內(nèi)碼則是B0A1H。3021+8080B0A1北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示4.漢字字形碼

漢字字形碼是指確定一個漢字字形點陣的代碼,又叫漢字字模碼或漢字輸出碼。在一個漢字點陣中,凡筆畫所到之處,記為“1”,否則記為“0”。根據(jù)對漢字質(zhì)量的不同要求,可有16×16、24×24、32×32或48×48的點陣結(jié)構(gòu)。顯然點陣越大,輸出漢字的質(zhì)量越高,每個漢字所占用的字節(jié)數(shù)也越多。北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示5.漢字編碼的發(fā)展

1990年頒布了繁體字的編碼標準GB12345-90,目的在于規(guī)范必須使用繁體字的各種場合,該標準共收錄6866個漢字(比GB2312多103個字),純繁體的字大概有2200余個。

1995年底推出的GBK編碼是中文編碼擴展國家標準,該編碼標準兼容GB2312,共收錄漢字21003個、符號883個,并提供1894個造字碼位,簡、繁體字融于一庫。

2000年底又頒布了GB18030大字符集標準,這個標準可以涵蓋27484個漢字,繁、簡字均處于同一平臺。北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示2.3.3

統(tǒng)一代碼(Unicode)隨著國際間的交流與合作的擴大,信息處理應(yīng)用對字符集提出了多文種、大字量、多用途的要求,解決問題的最佳方案是設(shè)計一種全新的編碼方法,這種方法必須有足夠的能力來表示任意一種語言里使用的所有符號,這就是統(tǒng)一代碼(Unicode)。北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示1.編碼方式

Unicode的基本方法是用一個16位的數(shù)來表示每個符號,這種符號集可表示65536個不同的字符或符號。被稱為基本多語言平面(BMP)。這個空間已經(jīng)非常大了,但設(shè)計者考慮到將來某一天它可能也會不夠用,所以采用了一種可使這種表示法使用得更遠的方法。北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示

當只用2字節(jié)數(shù)來表示Unicode字符時,使用的是UCS-2編碼,但盡管如此,也允許在UCS-2文本中插入一些UCS-4字符。為此,在BMP中,保留了兩個有1024個大小的塊,這兩個塊中任何位置都不能用來表示任何符號。UCS-4的兩個16位字每個表示一個數(shù),這個數(shù)是UCS-2BMP中1024個數(shù)值中的一個。這兩個數(shù)的組合可以表示多達1百萬多個自定義的UCS-4字符。

UCS-2:65536-2×1024

UCS-4:210×210=220北京理工大學計算機學院2.3非數(shù)值數(shù)據(jù)的表示

2.實現(xiàn)方式

Unicode的實現(xiàn)方式不同于編碼方式。一個字符的Unicode編碼是確

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論