字符編碼(略看)_第1頁
字符編碼(略看)_第2頁
字符編碼(略看)_第3頁
字符編碼(略看)_第4頁
字符編碼(略看)_第5頁
已閱讀5頁,還剩47頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1(52)3.5 文字的表示及處理文字的表示及處理2(52)1. ASCII1. ASCII碼碼 ASCIIASCII碼,即美國標(biāo)準(zhǔn)信息交換碼碼,即美國標(biāo)準(zhǔn)信息交換碼(American Standard Code for Information Interchange)(American Standard Code for Information Interchange),使用使用 個(gè)二進(jìn)位對(duì)字符進(jìn)行編碼。個(gè)二進(jìn)位對(duì)字符進(jìn)行編碼。一、西文字符編碼一、西文字符編碼3(52)v 基本的基本的ASCIIASCII字符集共有字符集共有個(gè)字符個(gè)字符 9595個(gè)可打印字符(常用字母、數(shù)字、標(biāo)點(diǎn)符號(hào))個(gè)可打

2、印字符(常用字母、數(shù)字、標(biāo)點(diǎn)符號(hào)) 3333個(gè)控制字符(不可直接顯示或打?。﹤€(gè)控制字符(不可直接顯示或打?。﹙ 特殊字符的特殊字符的ASCIIASCII碼碼4(52)標(biāo)準(zhǔn)標(biāo)準(zhǔn)ASCII字符集及其碼表字符集及其碼表 b6 b5 b4 b3 b2 b1 b0 012345670 1 2 3 4 5 6 7 8 9 A B C D E Fb6b5b4b3b2b1b00 1 1 01 0 01 1 0 1 0 1 15(52)0123456789ABCDEF0123456789ABCDEF6(52) 每個(gè)字符用標(biāo)準(zhǔn)規(guī)定的每個(gè)字符用標(biāo)準(zhǔn)規(guī)定的7 7位二進(jìn)制數(shù)表示,位二進(jìn)制數(shù)表示,在機(jī)內(nèi)占一個(gè)字節(jié)(最高位

3、為在機(jī)內(nèi)占一個(gè)字節(jié)(最高位為0 0)。)。 如:如: 字符字符“A”A”的的ASCIIASCII碼為:碼為: 字符字符“0”0”的的ASCIIASCII碼為:碼為: 0 02 2 或或(48)(48)1010、(60)(60)8 8、(30)(30)16162 2 或或(65)(65)1010、(101)(101)8 8、(41)(41)16167(52)要求:要求: 1.1.會(huì)比較會(huì)比較ASCIIASCII字符的大小字符的大?。ò雌洌ò雌銩SCIIASCII碼值)碼值) 空格空格0 09 9A A Z Z a az z 2. 2.會(huì)推算同組字符會(huì)推算同組字符ASCIIASCII碼值碼值 如如

4、A A的的ASCIIASCII值(十進(jìn)制)為值(十進(jìn)制)為6565,則,則B B、C C 的的ASCIIASCII值分別為值分別為6666、67678(52)定義方式定義方式: : 用用8 8位二進(jìn)制數(shù)位表示一個(gè)字符的擴(kuò)位二進(jìn)制數(shù)位表示一個(gè)字符的擴(kuò)充充 二二- -十進(jìn)制十進(jìn)制 交換碼交換碼. .特點(diǎn)特點(diǎn): : 每個(gè)字符對(duì)應(yīng)一個(gè)字節(jié),共每個(gè)字符對(duì)應(yīng)一個(gè)字節(jié),共256256種種說明說明: : 有很多編碼沒有使用有很多編碼沒有使用, ,保留做為擴(kuò)充保留做為擴(kuò)充910(52)(2 2)第二部分:一級(jí)常用漢字,共)第二部分:一級(jí)常用漢字,共37553755個(gè),個(gè), 按漢語拼音排列按漢語拼音排列(3 3)

5、第三部分:二級(jí)常用漢字,共)第三部分:二級(jí)常用漢字,共30083008個(gè),個(gè), 按偏旁部首排列按偏旁部首排列 漢字共漢字共67636763個(gè)個(gè) 字符共字符共74457445個(gè)個(gè)11(52)一級(jí)漢字一級(jí)漢字(3755個(gè))個(gè))二級(jí)漢字二級(jí)漢字(3008個(gè))個(gè))(擴(kuò)充使用)(擴(kuò)充使用)字母、數(shù)字和各種符號(hào)字母、數(shù)字和各種符號(hào) 19423位號(hào)位號(hào) 191655568794區(qū)區(qū) 號(hào)號(hào)(按漢語拼音排列按漢語拼音排列)(按偏旁部首排列按偏旁部首排列)拉丁字母、俄文、拉丁字母、俄文、日文平假名與片日文平假名與片假名、希臘字母、假名、希臘字母、漢語拼音等共漢語拼音等共682個(gè)個(gè)共共6763個(gè)漢字和個(gè)漢字和682

6、個(gè)符號(hào),個(gè)符號(hào),每個(gè)每個(gè)漢字或符號(hào)都有一漢字或符號(hào)都有一個(gè)確定位置,該位個(gè)確定位置,該位置的區(qū)號(hào)和位號(hào)就置的區(qū)號(hào)和位號(hào)就是這個(gè)漢字的是這個(gè)漢字的“區(qū)區(qū)位碼位碼”GB2312-80字符集字符集12(52)n 區(qū)位碼區(qū)位碼: GB2312-80GB2312-80是一個(gè)二維代碼是一個(gè)二維代碼表,有表,有9494行、行、9494列列, , 漢字在代碼表中的漢字在代碼表中的位置用它所處的行號(hào)、列號(hào)表示。位置用它所處的行號(hào)、列號(hào)表示。行號(hào)行號(hào) 區(qū)號(hào)區(qū)號(hào)列號(hào)列號(hào) 位號(hào)位號(hào)13(52)例如:例如: “ “大大”字的區(qū)號(hào)字的區(qū)號(hào)2020,位號(hào),位號(hào)8383, 區(qū)位碼是區(qū)位碼是20 8320 83 用用2 2個(gè)字

7、節(jié)表示為:個(gè)字節(jié)表示為: 00010100 0101001100010100 0101001183列20行大14(52)國標(biāo)交換碼國標(biāo)交換碼 ( (國標(biāo)碼國標(biāo)碼):):信息通信中,漢字的區(qū)位碼與通信信息通信中,漢字的區(qū)位碼與通信使用的控制碼(使用的控制碼(00H00H1FH1FH)發(fā)生沖突。)發(fā)生沖突。為了避免漢字區(qū)位碼與通信控為了避免漢字區(qū)位碼與通信控制碼的沖突,每個(gè)漢字的區(qū)號(hào)和位號(hào)必須制碼的沖突,每個(gè)漢字的區(qū)號(hào)和位號(hào)必須分別加上分別加上3232。得到的代碼稱為漢字的。得到的代碼稱為漢字的“國國標(biāo)交換碼標(biāo)交換碼”15(52)16(52)n機(jī)內(nèi)碼:機(jī)內(nèi)碼:n問題問題:n解決方法解決方法:17(

8、52)例如:例如:“大大”字字 區(qū)位碼區(qū)位碼:20 83 20 83 二進(jìn)制表示為:二進(jìn)制表示為:00000 010100 0110100 010 01001110011 國標(biāo)交換碼國標(biāo)交換碼:52 115 52 115 (+32+32) 二進(jìn)制表示為:二進(jìn)制表示為:00001 110100 0110100 011 11001110011 :180 243180 243(+128+128) 二進(jìn)制表示為:二進(jìn)制表示為: 0 01 110100 10100 1 11 11001110011(B4F3B4F3)18(52)19(52)nGBKGBK編碼區(qū)分三個(gè)部分編碼區(qū)分三個(gè)部分: :漢字區(qū)漢字區(qū)

9、(2100321003個(gè)漢字)、個(gè)漢字)、圖形符號(hào)區(qū)、用戶自定義圖形符號(hào)區(qū)、用戶自定義區(qū)區(qū) GBKGBK每一個(gè)字符都采用每一個(gè)字符都采用雙字節(jié)雙字節(jié)表示表示總體編碼范圍為:總體編碼范圍為:81814040H HH H,共,共2394023940個(gè)碼位;個(gè)碼位; 首字節(jié)范圍:首字節(jié)范圍:8181H HH H(二進(jìn)制最高位為(二進(jìn)制最高位為1 1);); 尾字節(jié)范圍:尾字節(jié)范圍:4040H HH H(二進(jìn)制最高位可以為(二進(jìn)制最高位可以為0 0或或1 1););GBKGBK漢字內(nèi)碼擴(kuò)充規(guī)范漢字內(nèi)碼擴(kuò)充規(guī)范20(52)n目的目的:統(tǒng)一的多文本處理環(huán)境:統(tǒng)一的多文本處理環(huán)境, ,實(shí)現(xiàn)所有字符實(shí)現(xiàn)所有字

10、符在同一字符集中統(tǒng)一編碼在同一字符集中統(tǒng)一編碼n途徑途徑:UCS:UCS:ISO/IEC 10646 (ISO/IEC 10646 (通用多通用多8 8位編碼位編碼字符集字符集) )UnicodeUnicode:統(tǒng)一碼或聯(lián)合碼,與:統(tǒng)一碼或聯(lián)合碼,與UCSUCS完全等完全等同的工業(yè)標(biāo)準(zhǔn)同的工業(yè)標(biāo)準(zhǔn) n優(yōu)點(diǎn)優(yōu)點(diǎn):編碼空間極大(:編碼空間極大(4 4個(gè)字節(jié)),能容納足個(gè)字節(jié)),能容納足夠多的各種字符集(夠多的各種字符集(1313億字符)億字符)21(52)22(52) GB18030-2000 GB18030-2000編碼標(biāo)準(zhǔn)在編碼標(biāo)準(zhǔn)在GB2312GB2312和和GBKGBK編碼標(biāo)準(zhǔn)的基礎(chǔ)上進(jìn)行

11、了擴(kuò)充,采用編碼標(biāo)準(zhǔn)的基礎(chǔ)上進(jìn)行了擴(kuò)充,采用單字節(jié)、雙字節(jié)和四字節(jié)三種方式對(duì)字單字節(jié)、雙字節(jié)和四字節(jié)三種方式對(duì)字符編碼,因此該標(biāo)準(zhǔn)的漢字有符編碼,因此該標(biāo)準(zhǔn)的漢字有2700027000多個(gè)。多個(gè)。包括全部中、日、韓統(tǒng)一字符集和包括全部中、日、韓統(tǒng)一字符集和CJKCJK漢漢字?jǐn)U充的所有字符。字?jǐn)U充的所有字符。23(52) BIG5 BIG5碼是臺(tái)灣、香港等地使用的漢字碼是臺(tái)灣、香港等地使用的漢字繁體的編碼標(biāo)準(zhǔn),它用雙字節(jié)進(jìn)行編碼。繁體的編碼標(biāo)準(zhǔn),它用雙字節(jié)進(jìn)行編碼。BIG5BIG5收錄了收錄了1346113461個(gè)漢字和符號(hào)。個(gè)漢字和符號(hào)。24(52)幾種漢字編碼的對(duì)比幾種漢字編碼的對(duì)比GBK0

12、0 FF00FF20902漢字00 FF00FF6763漢字GB231200 FF00FF27484漢字GB18030GB2312GBKGB18030UCS-2(Unicode)6763個(gè)個(gè)漢字漢字(簡(jiǎn)體簡(jiǎn)體字字)21003個(gè)個(gè)漢字(包括漢字(包括GB2312漢漢字在內(nèi))字在內(nèi))27 000多漢多漢字字(包括包括GBK漢字和漢字和CJK及其擴(kuò)充中及其擴(kuò)充中的漢字的漢字)2萬多漢字萬多漢字雙字節(jié)存雙字節(jié)存儲(chǔ)和表示,儲(chǔ)和表示,每個(gè)字節(jié)每個(gè)字節(jié)的最高位的最高位均為均為“1” 雙字節(jié)存儲(chǔ)雙字節(jié)存儲(chǔ)和表示,第和表示,第1個(gè)字節(jié)的個(gè)字節(jié)的最高位必為最高位必為“1”部分雙字節(jié)、部分雙字節(jié)、部分部分4字節(jié)字節(jié)

13、表示表示(UTF-8編編碼碼) 1字節(jié)、字節(jié)、2字節(jié)、字節(jié)、3字節(jié)等不等字節(jié)等不等長(zhǎng)編碼長(zhǎng)編碼編碼不編碼不兼容!兼容!保持向下兼容保持向下兼容25(52):通過鍵盤、手寫筆或語音通過鍵盤、手寫筆或語音輸入方式輸入字符輸入方式輸入字符:將紙介質(zhì)上的文本通過識(shí)將紙介質(zhì)上的文本通過識(shí)別技術(shù)自動(dòng)轉(zhuǎn)換為文字的編碼別技術(shù)自動(dòng)轉(zhuǎn)換為文字的編碼26(52)27(52)n 鍵盤輸入編碼鍵盤輸入編碼 : : 漢字字?jǐn)?shù)很多,無法與鍵盤上的鍵漢字字?jǐn)?shù)很多,無法與鍵盤上的鍵一一對(duì)應(yīng),因此必須使用一個(gè)或幾個(gè)鍵來一一對(duì)應(yīng),因此必須使用一個(gè)或幾個(gè)鍵來表示漢字,這就需要對(duì)漢字進(jìn)行編碼。表示漢字,這就需要對(duì)漢字進(jìn)行編碼。(1 1

14、)鍵盤輸入)鍵盤輸入28(52)n漢字輸入編碼的分類漢字輸入編碼的分類:如:智能如:智能ABC, ABC, 紫光拼音紫光拼音 缺點(diǎn):同音字引起的重碼多,需增加選缺點(diǎn):同音字引起的重碼多,需增加選擇操作擇操作:將漢字的字形分解歸類而給出的將漢字的字形分解歸類而給出的編碼方法,重碼少、輸入速度較快,編碼方法,重碼少、輸入速度較快, 如:五筆字形法和表形碼等如:五筆字形法和表形碼等 缺點(diǎn):缺點(diǎn): 編碼規(guī)則不易掌握編碼規(guī)則不易掌握29(52)n聯(lián)機(jī)手寫漢字識(shí)別系統(tǒng)構(gòu)成聯(lián)機(jī)手寫漢字識(shí)別系統(tǒng)構(gòu)成 n 輸入輸入 、預(yù)處理、特征提取、分類、后、預(yù)處理、特征提取、分類、后處理、輸出處理、輸出n需求的配件需求的配

15、件: : 專用的書寫板和筆專用的書寫板和筆(2)聯(lián)機(jī)手寫漢字識(shí)別)聯(lián)機(jī)手寫漢字識(shí)別(筆輸入)(筆輸入)30(52)n工作過程工作過程: : n例如例如: : 漢王筆漢王筆 正識(shí)率正識(shí)率 9595 9090,速度速度 1212字字/ /秒秒31(52)n 目的目的: :使計(jì)算機(jī)具有人的聽覺使計(jì)算機(jī)具有人的聽覺, ,是模式識(shí)別的是模式識(shí)別的分支分支n 語音識(shí)別的分類語音識(shí)別的分類(按照不同的應(yīng)用及要求):(按照不同的應(yīng)用及要求):n孤立詞孤立詞/ /連接詞連接詞/ /連續(xù)語音識(shí)別連續(xù)語音識(shí)別n小詞匯量小詞匯量/ /中詞匯中詞匯/ /大詞匯量語音識(shí)別大詞匯量語音識(shí)別n特定人特定人/ /限定人限定人/

16、 /非特定人語音識(shí)別非特定人語音識(shí)別n 最高目標(biāo):非特定人大詞匯量的連續(xù)語音識(shí)最高目標(biāo):非特定人大詞匯量的連續(xù)語音識(shí)別技術(shù)別技術(shù)(3 3)漢字語音識(shí)別)漢字語音識(shí)別32(52)n 脫機(jī)文字識(shí)別:對(duì)已經(jīng)印刷或?qū)懲甑奈淖置摍C(jī)文字識(shí)別:對(duì)已經(jīng)印刷或?qū)懲甑奈淖诌M(jìn)行識(shí)別進(jìn)行識(shí)別, , 自動(dòng)輸入計(jì)算機(jī)并轉(zhuǎn)換為數(shù)字文本自動(dòng)輸入計(jì)算機(jī)并轉(zhuǎn)換為數(shù)字文本形式的一種技術(shù),也叫做漢字形式的一種技術(shù),也叫做漢字OCROCR(Optical Optical Character RecognitionCharacter Recognition)。)。n 分類分類: : 印刷體印刷體OCR OCR 和手寫體和手寫體OCROC

17、R(4 4)脫機(jī)文字識(shí)別)脫機(jī)文字識(shí)別33(52)漢字鍵盤輸入方法的比較漢字鍵盤輸入方法的比較類型類型原理原理舉例舉例優(yōu)點(diǎn)優(yōu)點(diǎn)缺點(diǎn)缺點(diǎn)數(shù)字?jǐn)?shù)字編碼編碼使用一串?dāng)?shù)字來表示使用一串?dāng)?shù)字來表示漢字漢字電報(bào)碼電報(bào)碼區(qū)位碼區(qū)位碼僅使用僅使用10個(gè)數(shù)個(gè)數(shù)字鍵字鍵難記憶難記憶字音字音編碼編碼把漢語的拼音作為漢把漢語的拼音作為漢字的輸入編碼字的輸入編碼智能智能ABC紫光紫光微軟拼音輸入微軟拼音輸入簡(jiǎn)單易學(xué),適簡(jiǎn)單易學(xué),適合于非專業(yè)人合于非專業(yè)人員員重碼多,需增加選擇重碼多,需增加選擇操作,不會(huì)漢語拼音操作,不會(huì)漢語拼音或不知道讀音時(shí)無法或不知道讀音時(shí)無法使用使用字形字形編碼編碼把漢字的部件或筆畫把漢字的部件或

18、筆畫作為碼元,按照漢字作為碼元,按照漢字結(jié)構(gòu)及其切分規(guī)則作結(jié)構(gòu)及其切分規(guī)則作為編碼依據(jù),確定每為編碼依據(jù),確定每個(gè)漢字的輸入代碼個(gè)漢字的輸入代碼五筆字形五筆字形表形碼表形碼鄭碼鄭碼重碼少、輸入重碼少、輸入速度較快,適速度較快,適合于專業(yè)錄入合于專業(yè)錄入員、打字員使員、打字員使用用缺乏統(tǒng)一的規(guī)范,編缺乏統(tǒng)一的規(guī)范,編碼規(guī)則不易掌握碼規(guī)則不易掌握音形音形編碼編碼(或形音或形音編碼編碼)采用字音及字形兩種采用字音及字形兩種屬性作為碼元的漢字屬性作為碼元的漢字編碼輸入方法編碼輸入方法粵音輸入法粵音輸入法同上同上同時(shí)要掌握音、形兩同時(shí)要掌握音、形兩種取碼方法或規(guī)則,種取碼方法或規(guī)則,對(duì)普通用戶比較困難對(duì)

19、普通用戶比較困難34(52):輸出機(jī)器內(nèi)部的漢字編:輸出機(jī)器內(nèi)部的漢字編碼碼, ,需要根據(jù)漢字編碼對(duì)應(yīng)的漢字字型碼進(jìn)行解需要根據(jù)漢字編碼對(duì)應(yīng)的漢字字型碼進(jìn)行解釋,生成映像,最后再傳送到顯示器或打印機(jī)釋,生成映像,最后再傳送到顯示器或打印機(jī)輸出。輸出。 機(jī)內(nèi)機(jī)內(nèi)漢字編碼漢字編碼字型碼字型碼打印輸出打印輸出( (顯示器顯示器/ /打印機(jī)打印機(jī)) )35(52)n 漢字字型碼漢字字型碼: :用于漢字在顯示器或者用于漢字在顯示器或者打印機(jī)上輸出打印機(jī)上輸出. .n 漢字字型碼表示形式分類漢字字型碼表示形式分類:n點(diǎn)陣表示形式點(diǎn)陣表示形式n矢量表示形式矢量表示形式36(52) 輪廓描述輪廓描述輪廓點(diǎn)輪廓

20、點(diǎn)直線直線二次曲線二次曲線點(diǎn)陣描述點(diǎn)陣描述37(52)n 字型庫字型庫:簡(jiǎn)稱字庫,同一種字體的所有簡(jiǎn)稱字庫,同一種字體的所有字符字符( (例如例如GB2312GB2312中的中的70007000多字符多字符) )的形狀描的形狀描述信息的集合。不同的字體述信息的集合。不同的字體( (如宋體、仿宋、如宋體、仿宋、楷體、黑體等楷體、黑體等) )對(duì)應(yīng)不同的字庫。對(duì)應(yīng)不同的字庫。 38(52)n 文本編輯的主要功能(了解)文本編輯的主要功能(了解)n對(duì)字、詞、句、段落進(jìn)行添加、刪除、修改對(duì)字、詞、句、段落進(jìn)行添加、刪除、修改等操作等操作n字的處理:設(shè)置字體、字號(hào)、字的排列方向、字的處理:設(shè)置字體、字號(hào)、

21、字的排列方向、間距、顏色、效果等間距、顏色、效果等39(52)n段落的處理:設(shè)置行距、段間距、段縮進(jìn)、段落的處理:設(shè)置行距、段間距、段縮進(jìn)、對(duì)稱方式等對(duì)稱方式等n頁面布局的處理:設(shè)置頁邊距、每頁行列數(shù)、頁面布局的處理:設(shè)置頁邊距、每頁行列數(shù)、分欄、頁眉、頁腳等分欄、頁眉、頁腳等n “ “所見即所得所見即所得”(What You See Is What You What You See Is What You Get, Get, 簡(jiǎn)稱簡(jiǎn)稱WYSIWYGWYSIWYG)40(52)n文本處理內(nèi)容:文本處理內(nèi)容:n字?jǐn)?shù)統(tǒng)計(jì),字頻統(tǒng)計(jì),簡(jiǎn)字?jǐn)?shù)統(tǒng)計(jì),字頻統(tǒng)計(jì),簡(jiǎn)/ /繁體相互轉(zhuǎn)換,繁體相互轉(zhuǎn)換,漢字漢字

22、/ /拼音相互轉(zhuǎn)換拼音相互轉(zhuǎn)換n詞語排序,詞語錯(cuò)誤檢測(cè),文句語法檢查詞語排序,詞語錯(cuò)誤檢測(cè),文句語法檢查n自動(dòng)分詞,詞頻統(tǒng)計(jì),詞性標(biāo)注,詞義辨自動(dòng)分詞,詞頻統(tǒng)計(jì),詞性標(biāo)注,詞義辨識(shí),大陸識(shí),大陸/ /臺(tái)灣術(shù)語轉(zhuǎn)換臺(tái)灣術(shù)語轉(zhuǎn)換41(52)n文本壓縮,文本加密,文本著作權(quán)保護(hù)文本壓縮,文本加密,文本著作權(quán)保護(hù)n關(guān)鍵詞提取,文摘自動(dòng)生成,文本分類關(guān)鍵詞提取,文摘自動(dòng)生成,文本分類n文本檢索(關(guān)鍵詞檢索、全文檢索),文本過文本檢索(關(guān)鍵詞檢索、全文檢索),文本過濾濾n文語轉(zhuǎn)換(語音合成),文種轉(zhuǎn)換(機(jī)器翻譯)文語轉(zhuǎn)換(語音合成),文種轉(zhuǎn)換(機(jī)器翻譯)n篇章理解,自動(dòng)問答,自動(dòng)寫作等篇章理解,自動(dòng)問答,

23、自動(dòng)寫作等42(52)(1 1)面向通信的文本處理軟件面向通信的文本處理軟件 計(jì)算機(jī)網(wǎng)絡(luò)上最普及的應(yīng)用是用電子郵件進(jìn)行通計(jì)算機(jī)網(wǎng)絡(luò)上最普及的應(yīng)用是用電子郵件進(jìn)行通信。信。n典型軟件典型軟件:n 微軟公司的微軟公司的Outlook ExpressOutlook Express,具有文字的增、,具有文字的增、刪、改以及字體、字號(hào)的設(shè)置功能,也可以設(shè)定一刪、改以及字體、字號(hào)的設(shè)置功能,也可以設(shè)定一些簡(jiǎn)單的格式和插入一些圖片。些簡(jiǎn)單的格式和插入一些圖片。43(52)(2 2)面向辦公的文本處理軟件面向辦公的文本處理軟件n功能要求功能要求: 文本制作的高效率、高質(zhì)量;軟件面向文本制作的高效率、高質(zhì)量;軟

24、件面向非專業(yè)用戶,易學(xué)好用;文本處理能力,既非專業(yè)用戶,易學(xué)好用;文本處理能力,既功能豐富,又操作簡(jiǎn)單;排版功能。功能豐富,又操作簡(jiǎn)單;排版功能。n典型軟件典型軟件: MS-Office MS-Office、WPS2000WPS200044(52)(3 3)面向出版的文本處理軟件面向出版的文本處理軟件n排版軟件的排版軟件的主要功能主要功能: 將文字、圖形和圖像等合理地安排在頁將文字、圖形和圖像等合理地安排在頁面內(nèi)面內(nèi), ,使版面符合專業(yè)排版要求。使版面符合專業(yè)排版要求。n典型排版軟件典型排版軟件:n方正集團(tuán)公司的方正集團(tuán)公司的“飛騰飛騰”排版軟件排版軟件n美國美國AdobeAdobe公司的公司

25、的PageMakerPageMaker和和PDF WriterPDF Writer45(52)(4 4)面向網(wǎng)絡(luò)信息發(fā)布和電子出版的文本處理面向網(wǎng)絡(luò)信息發(fā)布和電子出版的文本處理軟件軟件 將文本制作成網(wǎng)頁發(fā)布到將文本制作成網(wǎng)頁發(fā)布到internetinternet或作為或作為電子圖書進(jìn)行出版電子圖書進(jìn)行出版n 典型處理軟件典型處理軟件n面向網(wǎng)絡(luò)信息發(fā)布的軟件面向網(wǎng)絡(luò)信息發(fā)布的軟件 MS FontpageMS Fontpage、Word Word n面向電子出版的軟件面向電子出版的軟件 AdobeAdobe公司的公司的Acrobat PDFAcrobat PDF格式文件格式文件46(52)n 根據(jù)

26、根據(jù)制作文本的用途制作文本的用途分為分為n 純文本純文本 TXTTXTn 豐富格式文本豐富格式文本 RTFRTFn 根據(jù)根據(jù)軟件的使用軟件的使用不同不同 DOC DOC、PDFPDF、WPS WPS 等等47(52)n 純文本純文本:是由一連串的字符組成的,幾乎不包含任:是由一連串的字符組成的,幾乎不包含任何其他格式信息和結(jié)構(gòu)信息。何其他格式信息和結(jié)構(gòu)信息。n 特性特性:呈現(xiàn)為一種線性結(jié)構(gòu),文件體積小,閱讀不:呈現(xiàn)為一種線性結(jié)構(gòu),文件體積小,閱讀不受限制,幾乎所有的文字處理軟件都能識(shí)別和處理受限制,幾乎所有的文字處理軟件都能識(shí)別和處理, ,沒沒有字體、字號(hào)的變化,不能插入圖片、表格等,不能有字

27、體、字號(hào)的變化,不能插入圖片、表格等,不能建立超鏈接。建立超鏈接。u由一串用于表達(dá)正文內(nèi)容的字符編碼所組成,幾乎不由一串用于表達(dá)正文內(nèi)容的字符編碼所組成,幾乎不包含任何其他的格式信息和結(jié)構(gòu)信息包含任何其他的格式信息和結(jié)構(gòu)信息(1 1)純文本)純文本.txt.txt48(52) 本本 書書 由由 南南 京京 大大 學(xué)學(xué) 出出 B1 BE CA E9 D3 C9 C4 CF BE A9 B4 F3 D1 A7 B3 F6 版版 社社 ( P u b l i s h i n g B0 E6 C9 E7 28 50 75 62 6C 69 73 68 69 6E 67 H o u s e o f N

28、a n j i n 20 48 6F 75 73 65 20 6F 66 20 4E 61 6E 6A 69 6E g U n i v e r s i t y ) 出出 版版 67 20 55 6E 69 76 65 72 73 69 74 79 29 B3 F6 B0 E6 文文本本的的內(nèi)內(nèi)容容文文本本在在計(jì)計(jì)算算機(jī)機(jī)中中的的表表示示49(52)n 文本的格式化文本的格式化( (字型字型 字號(hào)字號(hào) 顏色顏色 ) )n 豐富格式文本豐富格式文本(rich textrich text、fancy textfancy text、formatted textformatted text)n RTFR

29、TF格式格式 ( (不同軟件系統(tǒng)相互交互中間格式不同軟件系統(tǒng)相互交互中間格式) )n 多媒體文檔多媒體文檔(Multimedia DocumentMultimedia Document)n插入圖插入圖 表表 公式公式 聲音聲音 視頻視頻 . . (2)豐富格式文本)豐富格式文本50(52) 使用使用HTML語言描述為:語言描述為: 本書由南京大學(xué)出版社本書由南京大學(xué)出版社(Publishing House of Nanjing University)出版出版用一對(duì)用一對(duì)指出的是標(biāo)記,如指出的是標(biāo)記,如 和和 等,用于說明排版的格式和文字等,用于說明排版的格式和文字屬性,它們不屬于正文內(nèi)容屬性,它們不屬于正文內(nèi)容正文內(nèi)容正文內(nèi)容51(52)(3) 超文本超文本n若干文本或文本中的各個(gè)部分可按照其內(nèi)容的關(guān)若干文本或文本中的各個(gè)部分可按照其內(nèi)容的關(guān)系互相鏈接起來,從而形成系互相鏈接起來,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論