![計(jì)算機(jī)數(shù)據(jù)與編碼_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/25/ff4bc79a-fcd1-41da-83fd-36e1279b58ba/ff4bc79a-fcd1-41da-83fd-36e1279b58ba1.gif)
![計(jì)算機(jī)數(shù)據(jù)與編碼_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/25/ff4bc79a-fcd1-41da-83fd-36e1279b58ba/ff4bc79a-fcd1-41da-83fd-36e1279b58ba2.gif)
![計(jì)算機(jī)數(shù)據(jù)與編碼_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/25/ff4bc79a-fcd1-41da-83fd-36e1279b58ba/ff4bc79a-fcd1-41da-83fd-36e1279b58ba3.gif)
![計(jì)算機(jī)數(shù)據(jù)與編碼_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/25/ff4bc79a-fcd1-41da-83fd-36e1279b58ba/ff4bc79a-fcd1-41da-83fd-36e1279b58ba4.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、計(jì)算機(jī)數(shù)據(jù)與編碼1.6.1 信息和數(shù)據(jù)信息是人們對(duì)客觀世界的認(rèn)識(shí),即對(duì)客觀世界的一種反映。數(shù)據(jù)是表達(dá)現(xiàn)實(shí)世界中各種信息的一組可以記錄、可以識(shí)別的記號(hào)或符號(hào)。它是信息的載體,是信息的具體表現(xiàn)形式。數(shù)據(jù)形式可以是字符、符號(hào)、表格、聲音、圖像等。數(shù)據(jù)可以在物理介質(zhì)上記錄或傳輸,并通過輸入設(shè)備傳送給計(jì)算機(jī)處理加工。數(shù)據(jù)的單位分為以下幾種:1) 位(bit)計(jì)算機(jī)中最小的數(shù)據(jù)單位 二進(jìn)制的一個(gè)數(shù)位,稱為比特位,簡(jiǎn)稱位。1位二進(jìn)制只能表示兩種狀態(tài),即0或1。n位二進(jìn)制能表示2n種狀態(tài)2) 字節(jié)(Byte)相鄰8個(gè)比特位組成一個(gè)字節(jié),用B表示。字節(jié)是計(jì)算機(jī)中用來表示存儲(chǔ)容量大小的基本單位。1B = 8bit
2、s1KB = 210B = 1024B1MB = 220B = 1024KB1GB = 230B = 1024MB1TB = 240B = 1024GB3) 字(Word)在計(jì)算機(jī)中作為一個(gè)整體被存取、傳送、處理的二進(jìn)制數(shù)位叫做一個(gè)字,每個(gè)字中二進(jìn)制位數(shù)的長(zhǎng)度,稱為字長(zhǎng)。用8位字長(zhǎng)表示一個(gè)整數(shù)與用16位字長(zhǎng)表示一個(gè)整數(shù),其所表示的數(shù)的上限和下限是不一樣的。字長(zhǎng)所占位數(shù) 其所表示的數(shù)的范圍8 -128 127 即:-27 (27 - 1)16 -32768 32767 即:-215 (215 - 1)32 -2147483648 2147483647 即:-231 (231 - 1)1.6.2
3、數(shù)字化信息編碼在計(jì)算機(jī)內(nèi)部,可用物理器件的高低電平代表二進(jìn)制的“0”和“1”,另外,脈沖的正負(fù)極性,晶體管的導(dǎo)通和截止都可以用來表示二進(jìn)制的“0”和“1”。由于二進(jìn)制只有兩個(gè)狀態(tài),數(shù)據(jù)的傳輸和處理不容易出錯(cuò),另外二進(jìn)制數(shù)的記數(shù)、加減法運(yùn)算規(guī)則較為簡(jiǎn)單,可用開關(guān)電路實(shí)現(xiàn),且二進(jìn)制的“0”和“1”正好與邏輯命題的兩個(gè)值“真”和“假”相對(duì)應(yīng),為計(jì)算機(jī)種中實(shí)現(xiàn)邏輯運(yùn)算和邏輯判斷提供了便利的條件。所以,在計(jì)算機(jī)中,廣泛采用的是只有“0”和“1”兩個(gè)基本符號(hào)組成的基二碼,或稱為二進(jìn)制碼。計(jì)算機(jī)最重要的功能是處理信息,這些信息包括數(shù)值、文字、圖形、符號(hào)、圖象、聲音等,所有這些信息都必須經(jīng)過編碼,轉(zhuǎn)換成計(jì)算機(jī)
4、能夠識(shí)別和處理的二進(jìn)制碼的形式才能夠被存儲(chǔ)、傳送和加工。BCD碼是二進(jìn)制編碼的十進(jìn)制數(shù)(Binary Coded Decimal)的簡(jiǎn)寫。有四位 BCD碼、六位BCD碼和擴(kuò)展的BCD碼三種。(1)非數(shù)值數(shù)據(jù)的表示1) 字符數(shù)據(jù)的表示ASCII碼(America Standard Code for Information Interchage)是美國(guó)標(biāo)準(zhǔn)信息交換碼,被國(guó)際化組織指定為國(guó)際標(biāo)準(zhǔn),分為7位和8位兩種版本。國(guó)際通用的是7位ASCII碼,它已對(duì)大、小寫英文字母、阿拉伯?dāng)?shù)字、標(biāo)點(diǎn)符號(hào)及控制符等特殊符號(hào)編碼,共128個(gè)字符。表中特殊符號(hào)的意義如下:NUL 空白SOH 標(biāo)題開始STX 正文開始
5、EXT 正文結(jié)束EOT 傳輸結(jié)束ENQ 詢問ACK 承認(rèn)BEL 告警BS 退格HT 橫向列表LF 換行VT 垂直列表FF 換頁CR 回車SO 移位輸出SI 移位輸入SP 空格DLE 轉(zhuǎn)義DC1 設(shè)備控制1DC2 設(shè)備控制2DC3 設(shè)備控制3DC4 設(shè)備控制4NAK 否認(rèn)SYN 空轉(zhuǎn)同步ETB 信息組傳送結(jié)束CAN 作廢EM 紙盡SUB 取代ESC 擴(kuò)展FS 文字分隔符GS 組分隔符RS 記錄分隔符US 單元分隔符DEL 刪除(2) 漢字的表示漢字與英文的主要區(qū)別: 1) 英文是拼音文字,漢字是表意文字。英文字母只有26個(gè),漢字多達(dá)5萬個(gè)以上,常用漢字也有6000多個(gè)。 2) 漢字的同音字很多,
6、一個(gè)音往往會(huì)有幾個(gè)甚至幾十個(gè)字。3) 英文排序簡(jiǎn)單,漢字排序非常復(fù)雜,而且與文字本身沒有本質(zhì)聯(lián)系。開發(fā)一個(gè)完善的中文信息處理系統(tǒng)必須解決以下三個(gè)主要問題: (1) 漢字輸入 (2) 漢字輸出 (3) 漢字與西文的兼容性漢字的編碼和表示 1)漢字交換碼(國(guó)標(biāo)碼) 漢字交換碼(國(guó)標(biāo)碼)主要用于漢字信息交換。國(guó)標(biāo)碼:以國(guó)家標(biāo)準(zhǔn)局1980年頒布的信息交換用漢字編碼字符集"基本集(代號(hào)為GB2312 80)規(guī)定的漢字交換碼作為國(guó)家標(biāo)準(zhǔn)漢字編碼。 GB2312 80中共有7445個(gè)字符符號(hào): 漢字符號(hào)6763個(gè) 一級(jí)漢字3755個(gè)(按漢語拼音字母順序排列) 二級(jí)漢字3008個(gè)(按部首筆劃順序排列
7、) 非漢字符號(hào)682個(gè) GB2312 80規(guī)定,所有的國(guó)標(biāo)碼漢字及符號(hào)組成一個(gè)94 94的方陣。在此方陣中,每一行稱為一個(gè)"區(qū)",每一列稱為一個(gè)"位"。這個(gè)方陣實(shí)際上組成一個(gè)有94個(gè)區(qū)(編號(hào)由01到94),每個(gè)區(qū)有94個(gè)位(編號(hào)由01到94)的漢字字符集。 一個(gè)漢字所在的區(qū)號(hào)和位號(hào)的組合就構(gòu)成了該漢字的"區(qū)位碼"。其中,高兩位為區(qū)號(hào),低兩位為位號(hào)。這樣區(qū)位碼可以唯一地確定某一漢字或字符;反之,任何一個(gè)漢字或符號(hào)都對(duì)應(yīng)一個(gè)唯一的區(qū)位碼,沒有重碼。 區(qū)位碼分布情況如下:區(qū) 號(hào) 內(nèi) 容 1區(qū) 鍵盤上沒有的各種符號(hào) 2區(qū) 各種序號(hào) 3區(qū) 鍵盤
8、上的各種符號(hào)(按中文方式給出) 4 -5區(qū) 日文字母 6區(qū) 希臘字母 7區(qū) 俄文字母 8區(qū) 標(biāo)識(shí)拼音聲調(diào)的母音及拼音字母名稱 9區(qū) 制表符號(hào) 10- 15區(qū) 未用 16-55區(qū) 一級(jí)漢字(按拼音字母順序排列) 56- 87區(qū) 二級(jí)漢字(按部首筆劃順序排列) 88- 94區(qū) 自定義漢字 由上可以看出,所有漢字與符號(hào)的94個(gè)區(qū),可以分為四個(gè)組:1 -15區(qū):為圖形符號(hào)區(qū)。其中1 9區(qū)為標(biāo)準(zhǔn)符號(hào)區(qū);10 15區(qū)為自定義符號(hào)區(qū)。16 -55區(qū):為一級(jí)漢字區(qū),包含3755個(gè)漢字。這些區(qū)中的漢字按漢語拼音順序排序,同音字按筆畫順序列出。56 -87區(qū):為二級(jí)漢字區(qū),包含3008個(gè)漢字。這些區(qū)中的漢字是按部
9、首筆劃順序排序的。88 -94區(qū):為自定義漢字區(qū)。國(guó)標(biāo)碼規(guī)定,每個(gè)漢字(包括非漢字的一些符號(hào))由2字節(jié)代碼表示。每個(gè)字節(jié)的最高位為0,只使用低7位,而低7位的編碼中又有34個(gè)適用于控制用的,這樣每個(gè)字節(jié)只有27 - 34 = 94個(gè)編碼用于漢字。2個(gè)字節(jié)就有94 94=8836個(gè)漢字編碼。在表示一個(gè)漢字的2個(gè)字節(jié)中,高字節(jié)對(duì)應(yīng)編碼表中的行號(hào),稱為區(qū)號(hào);低字節(jié)對(duì)應(yīng)編碼表中的列號(hào),稱為位號(hào)。漢字國(guó)標(biāo)碼的范圍用二進(jìn)制表示是: 00100001 00100001 01111110 01111110 (1+32)10 (1+32)10 (94+32)10 (94+32)10 7位ASCII碼是128個(gè)字
10、符組成的字符集。其中編碼值0 31(00000000 00011111)不對(duì)應(yīng)任何印刷字符,通常稱為控制符,用于計(jì)算機(jī)通信中的通信控制或?qū)τ?jì)算機(jī)設(shè)備的功能控制。編碼值32(00100000)是空格字符SP。編碼值127(1111111)是刪除字符DEL。漢字國(guó)標(biāo)碼的起始二進(jìn)制位置選擇00100001即(33)10是為了跳過ASCII碼的32個(gè)控制字符和空格字符。所以,漢字國(guó)標(biāo)碼的高位和低位分別比對(duì)應(yīng)的區(qū)位碼大(32)10或(00100000)2或(20)H,即: 國(guó)標(biāo)碼高位 = 區(qū)碼 + 20H (H表示十六進(jìn)制) 國(guó)標(biāo)碼低位 = 位碼 + 20H2) 漢字機(jī)內(nèi)碼(內(nèi)碼)(漢字存儲(chǔ)碼) 漢字機(jī)
11、內(nèi)碼(內(nèi)碼)(漢字存儲(chǔ)碼)的作用是統(tǒng)一了各種不同的漢字輸入碼在計(jì)算機(jī)內(nèi)部的表示。 為了將漢字的各種輸入碼在計(jì)算機(jī)內(nèi)部統(tǒng)一起來,就有了專用于計(jì)算機(jī)內(nèi)部存儲(chǔ)漢字使用的漢字機(jī)內(nèi)碼,用以將輸入時(shí)使用的多種漢字輸入碼統(tǒng)一轉(zhuǎn)換成漢字機(jī)內(nèi)碼進(jìn)行存儲(chǔ),以方便機(jī)內(nèi)的漢字處理 漢字機(jī)內(nèi)碼是在計(jì)算機(jī)內(nèi)部存儲(chǔ)、處理的代碼。計(jì)算機(jī)既要處理漢字,又要處理英文。因此計(jì)算機(jī)必須能區(qū)別漢字字符和英文字符。英文字符的的機(jī)內(nèi)碼是最高為為0的8位ASCII碼。為了不與7位ASCII碼發(fā)生沖突,把國(guó)標(biāo)碼每個(gè)字節(jié)的最高位由0改為1,其余位不變的編碼作為漢字字符的機(jī)內(nèi)碼。漢字機(jī)內(nèi)碼的范圍用二進(jìn)制表示是: 10100001 10100001
12、 11111110 11111110 機(jī)內(nèi)碼的高位和低位比對(duì)應(yīng)的國(guó)標(biāo)碼的高位和低位大(128)10或(10000000)2或(80)H 即: 機(jī)內(nèi)碼高位 = 國(guó)標(biāo)碼高位 + 80H 機(jī)內(nèi)碼低位 = 國(guó)標(biāo)碼低位 + 80H 又因?yàn)椋?國(guó)標(biāo)碼高位 = 區(qū)碼 + 20H 國(guó)標(biāo)碼低位 = 位碼 + 20H 所以: 機(jī)內(nèi)碼高位 = 區(qū)碼 + A0H 機(jī)內(nèi)碼低位 = 位碼 + A0H 也就是說,機(jī)內(nèi)碼高位和機(jī)內(nèi)碼低位分別比對(duì)應(yīng)的區(qū)碼和位碼大(160)10或(10100000)2或(A0)H 例如:漢字"啊"的區(qū)位碼為"1601",其中區(qū)碼為(16)10或(10)H,
13、位碼為(01)10或(01)H。 則: 機(jī)內(nèi)碼高位 = 10H + A0H = B0H 機(jī)內(nèi)碼低位 = 01H + A0H = A1H 所以: 機(jī)內(nèi)碼= B0A1H 3) 漢字輸入碼(外碼)漢字輸入碼(外碼)是為了通過鍵盤字符把漢字輸入計(jì)算機(jī)而設(shè)計(jì)的一種編碼。 英文輸入時(shí),相輸入什么字符便按什么鍵,輸入碼和機(jī)內(nèi)碼一致。漢字輸入時(shí),可能要按幾個(gè)鍵才能輸入一個(gè)漢字。 漢字輸入方案有成百上千個(gè),但是這千差萬別的外碼輸入進(jìn)計(jì)算機(jī)后都會(huì)轉(zhuǎn)換成統(tǒng)一的內(nèi)碼。 漢字輸入方案大致可分為以下4種類型:(1) 音碼:如全拼、雙拼、微軟拼音等 (2) 形碼:如五筆字型、鄭碼、表形碼等 (3) 音形碼:如智能ABC、自然碼等(4) 數(shù)字碼:如區(qū)位碼、電報(bào)碼等4) 漢字字形碼(輸出碼)漢字字形碼(輸出碼)用于漢字的顯示和打印,是漢字字形的數(shù)字化信息。 漢字的內(nèi)碼是用數(shù)字代碼來表示漢字,但是為了在輸出時(shí)讓人們看到漢字,就必須輸出漢字的字形。在漢字系統(tǒng)中,一般采用點(diǎn)陣來表示字形。 16 *16漢字點(diǎn)陣示意 16 * 16點(diǎn)陣字形的字要使用32個(gè)字節(jié)(16 * 16/8=32)存儲(chǔ),24 * 24點(diǎn)陣字形的字要使用72個(gè)字節(jié)(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度辦事處知識(shí)產(chǎn)權(quán)專利實(shí)施許可與授權(quán)合同
- 家裝項(xiàng)目監(jiān)管合同
- 二零二五年度辦公室清潔與員工健康關(guān)懷合同
- 農(nóng)產(chǎn)品銷售居間合同委托書
- 有保證人借款合同
- 全新借錢的合同
- 制造業(yè)自動(dòng)化技術(shù)指南
- 醫(yī)院技術(shù)合作協(xié)議
- 工程建設(shè)項(xiàng)目招標(biāo)代理協(xié)議書
- 商標(biāo)權(quán)轉(zhuǎn)讓合同
- 必修3《政治與法治》 選擇題專練50題 含解析-備戰(zhàn)2025年高考政治考試易錯(cuò)題(新高考專用)
- 二零二五版電商企業(yè)兼職財(cái)務(wù)顧問雇用協(xié)議3篇
- 課題申報(bào)參考:流視角下社區(qū)生活圈的適老化評(píng)價(jià)與空間優(yōu)化研究-以沈陽市為例
- 深圳2024-2025學(xué)年度四年級(jí)第一學(xué)期期末數(shù)學(xué)試題
- 《openEuler操作系統(tǒng)》考試復(fù)習(xí)題庫(kù)(含答案)
- 2024-2025學(xué)年成都市高新區(qū)七年級(jí)上英語期末考試題(含答案)
- 17J008擋土墻(重力式、衡重式、懸臂式)圖示圖集
- 《中南大學(xué)模板》課件
- 廣東省深圳市南山區(qū)2024-2025學(xué)年第一學(xué)期期末考試九年級(jí)英語試卷(含答案)
- T-CISA 402-2024 涂鍍產(chǎn)品 切口腐蝕試驗(yàn)方法
- 后勤安全生產(chǎn)
評(píng)論
0/150
提交評(píng)論