成品庫(kù)編碼知識(shí)2011年版_第1頁(yè)
成品庫(kù)編碼知識(shí)2011年版_第2頁(yè)
成品庫(kù)編碼知識(shí)2011年版_第3頁(yè)
成品庫(kù)編碼知識(shí)2011年版_第4頁(yè)
成品庫(kù)編碼知識(shí)2011年版_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

編碼知識(shí)(2011年版)什么是編碼?以固定的順序排列字符,并以此做為記錄、存貯、傳遞、交換的統(tǒng)一內(nèi)部特征,這個(gè)字符排列順序被稱為“編碼”。字庫(kù)的編碼是字庫(kù)組織的依據(jù),也是文字處理的基礎(chǔ)。不同國(guó)家和地區(qū)有不同的編碼標(biāo)準(zhǔn)。和中文字庫(kù)有關(guān)的常見(jiàn)編碼有:?jiǎn)巫止?jié)編碼、GB2312-80、GB12345-90、GBK、Unicode編碼、ISO10646/Unicode字符集、GB18030-2000、BIG5編碼、方正748編碼工作中應(yīng)用頻率最高的編碼?GB2312-80編碼;(大陸簡(jiǎn)體)GB12345-90編碼;(大陸繁體)GBK編碼;Big5編碼;(港澳臺(tái)繁體)GB2312-80編碼?全稱是《信息交換用漢字編碼字符集基本集》,1980年發(fā)布,是中文信息處理的國(guó)家標(biāo)準(zhǔn),在大陸及海外使用簡(jiǎn)體中文的地區(qū)(如新加坡等)是強(qiáng)制使用的唯一中文編碼。GB2312-80標(biāo)準(zhǔn)每個(gè)字體含字符7539個(gè),詳細(xì)內(nèi)容如下:

7539=94(單字節(jié)ASCII字符)

+6763(雙字節(jié)漢字)+682(雙字節(jié)符號(hào))可以簡(jiǎn)單的理解為:在大陸應(yīng)用的最基本的簡(jiǎn)體編碼標(biāo)準(zhǔn);GB12345-90編碼?全稱是《信息交換用漢字編碼字符集輔助集》,是一個(gè)關(guān)于繁體漢字的編碼標(biāo)準(zhǔn)。所謂“輔助集”是與“基本集”(GB2312-80)相對(duì)應(yīng)而言的。原則上是將GB2312中的簡(jiǎn)化字用相應(yīng)的繁體字替換而成。GB12345標(biāo)準(zhǔn)每個(gè)字體含字符7642個(gè),詳細(xì)內(nèi)容如下:

7642=94(單字節(jié)ASCII字符)

+6866(雙字節(jié)漢字)+682(雙字節(jié)符號(hào))可以簡(jiǎn)單的理解為:在大陸應(yīng)用的繁體編碼標(biāo)準(zhǔn);GBK編碼?全稱是《漢字內(nèi)碼擴(kuò)展規(guī)范》,1995年發(fā)布,該編碼標(biāo)準(zhǔn)兼容GB2312,簡(jiǎn)、繁體字融于一庫(kù)。GBK標(biāo)準(zhǔn)每個(gè)字體含字符21980個(gè),詳細(xì)內(nèi)容如下:

21980=94(單字節(jié)ASCII字符)

+21003(雙字節(jié)漢字)+883(雙字節(jié)符號(hào))

可以簡(jiǎn)單的理解為:在大陸應(yīng)用的字?jǐn)?shù)較多的編碼標(biāo)準(zhǔn);GB2312編碼屬于GBK編碼的子集;Big5編碼?是目前臺(tái)灣、香港地區(qū)普遍使用的一種繁體漢字的編碼標(biāo)準(zhǔn),俗稱“大五碼”。BIG5標(biāo)準(zhǔn)每個(gè)字體含字符13554,詳細(xì)內(nèi)容如下:

13554=94(單字節(jié)ASCII字符)+407(標(biāo)準(zhǔn)符號(hào)區(qū)<A140-A3E1,含歐元>)

+5401(常用字區(qū)<A440-C67E>)

+7652(次常用字區(qū)<C940-F9D5>)可以簡(jiǎn)單的理解為:在港澳臺(tái)地區(qū)應(yīng)用的最基本的繁體編碼標(biāo)準(zhǔn);四個(gè)編碼體系的關(guān)系1、若在大陸地區(qū)應(yīng)用,主要應(yīng)用到GB2312-80編碼、GB12345-90編碼、GBK編碼;若在港澳臺(tái)地區(qū)應(yīng)用,主要應(yīng)用Big5編碼;2、GBK編碼可簡(jiǎn)單理解為大字符集,包括GB2312-80編碼、GB12345-90編碼中的所有字符,并有所增加;兩種繁體字型比較GB12345-90編碼的繁體與Big5編碼的繁體字型不同,不可混用。同一個(gè)編碼體系,不同字體時(shí)寫(xiě)法也不同;GBK編碼有漢字21003個(gè),而GB2312編碼只有漢字6763個(gè)。

一些生僻字都包含進(jìn)了GBK編碼,比如:?jiǎn)撮F犇堃瞭暸旻皕彧屾玕珺愔赟篯玨玨珮等;通常戶籍管理、辭書(shū)出版、古籍整理、地理信息系統(tǒng)中涉及的文字較多,建議使用

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論