版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
計算機應(yīng)用基礎(chǔ)(理論篇)第5章數(shù)字媒體及應(yīng)用本章學(xué)習(xí)目標(biāo)與要求掌握西文與漢字的編碼、了解數(shù)字文本的制作與編輯及常用軟件。熟悉數(shù)字圖像的獲取方法和設(shè)備及常用圖像文件格式,了解數(shù)字圖像的編輯、處理和應(yīng)用以及計算機圖形的概念和應(yīng)用。熟悉數(shù)字聲音獲取方法和設(shè)備,掌握數(shù)字聲音壓縮編碼。熟悉數(shù)字視頻獲取方法和設(shè)備,掌握數(shù)字視頻壓縮編碼。5.1文本與文本處理文字與文本文字:一種書面語言,由一系列稱為“字符”(character)的書寫符號構(gòu)成文本(text):文字信息在計算機中的表示形式是基于特定字符集的、具有上下文相關(guān)性的一個(二進(jìn)制編碼)字符流是計算機中最常用的一種數(shù)字媒體組成文本的基本元素是字符,字符在計算機中采用二進(jìn)制編碼表示。文本處理過程文本在計算機中的處理過程:文本的準(zhǔn)備(例如漢字的輸入),文本編輯,文本處理,文本存儲與傳輸、文本展現(xiàn)等,根據(jù)應(yīng)用的不同,各個處理環(huán)節(jié)的內(nèi)容和要求可能有很大的差別。文本存儲與傳輸(閱讀器)文本處理(文本處理軟件)文本生成其他媒體電子文本文本編輯(編輯器)格式化的電子文本文本展現(xiàn)5.1.1字符編碼西文字符的編碼字符集:常用字符的集合。西文字符集:由拉丁字母、數(shù)字、標(biāo)點符號及一些特殊符號組成。字符的編碼:字符集中每一個字符各有一個代碼,即字符的二進(jìn)制表示,稱為該字符的編碼。字符代碼表:字符集中不同字符的編碼互相區(qū)別,構(gòu)成該字符集的代碼表。美國標(biāo)準(zhǔn)信息交換碼(AmericanStandardCodeforInformationInterchange):使用7個二進(jìn)位對字符進(jìn)行編碼(叫做標(biāo)準(zhǔn)ASCII碼),稱為ISO-646標(biāo)準(zhǔn)?;镜腁SCII字符集共有128個字符96個可打印字符(常用字母、數(shù)字、標(biāo)點符號等)32個控制字符特殊字符的ASCII碼空格(32)A(65)a(97)0(48)ASCII字符集和ASCII碼0123456789ABCDEF控制字符01234567b3b2b1b0b6b5b4標(biāo)準(zhǔn)ASCII碼是七位的編碼,但字節(jié)是計算機中最基本的處理單位,故以一個字節(jié)來存放一個ASCII字符。每個字節(jié)中多出來的一位一般保持為“0”,在數(shù)據(jù)傳輸時可用作奇偶校驗位。擴充ASCII字符集:標(biāo)準(zhǔn)ASCII字符集只有128個不同的字符,在很多應(yīng)用中無法滿足要求。按照ISO2022標(biāo)準(zhǔn)(《七位字符集的代碼擴充技術(shù)》)的規(guī)定,ISO陸續(xù)制定了一批適用于不同地區(qū)的擴充ASCII字符集,每個擴充ASCII字符集分別可以擴充128個字符,這些擴充字符的編碼均是高位為1的8位代碼(十進(jìn)制數(shù)128~255),稱為擴展ASCII碼。擴充ASCII字符集(1)GB2312-80漢字編碼《信息交換用漢字編碼字符集·基本集》(GB2312-80)組成:第一部分:字母、數(shù)字和各種符號,包括拉丁字母、俄文、日文平假名與片假名、希臘字母、漢語拼音等共682個(統(tǒng)稱為GB2312圖形符號)第二部分:一級常用漢字,共3755個, 按漢語拼音排列第三部分:二級常用字,共3008個, 按偏旁部首排列漢字的編碼(一)漢字6763所有字符7445(1)GB2312-80漢字編碼區(qū)位碼:GB2312國標(biāo)字符集構(gòu)成一個二維平面,它分成94行、94列,行號稱為區(qū)號,列號稱為位號。每一個漢字或符號在碼表中都有各自的位置,字符的位置用它所在的區(qū)號(行號)及位號(列號)來表示。每個漢字的區(qū)號和位號分別用1個字節(jié)來表示, 如:“大”字的區(qū)號20,位號83,區(qū)位碼是2083
用2個字節(jié)表示為:0001010001010011漢字的編碼(二)(1)GB2312-80漢字編碼漢字的編碼(三)一級漢字(3755個)二級漢字(3008個)(擴充使用)位號:
………………19423字母、數(shù)字和各種符號…………區(qū)號:191655568794GB2312-80字符集(1)GB2312-80漢字編碼國標(biāo)交換碼:問題:信息通信中,漢字的區(qū)位碼與通信使用的控制碼(00H~1FH)發(fā)生沖突。解決方案:為了避免漢字區(qū)位碼與通信控制碼的沖突,ISO2022規(guī)定,每個漢字的區(qū)號和位號必須分別加上32(即二進(jìn)制00100000)。經(jīng)過這樣處理得到的代碼稱為漢字的“國標(biāo)交換碼”(簡稱交換碼)。因此,“大”字的交換碼是:0011010001110011。漢字的編碼(四)(1)GB2312-80漢字編碼機內(nèi)碼:問題:文本中的漢字與西文字符經(jīng)常是混合在一起使用的,漢字信息如不予以特別的標(biāo)識,它與單字節(jié)的標(biāo)準(zhǔn)ASCII碼就會混淆不清。解決方法:把一個漢字看作兩個擴展ASCII碼,使表示GB2312漢字的兩個字節(jié)的最高位(b7)都等于“1”。這種高位為l的雙字節(jié)(16位)漢字編碼就稱為GB2312漢字的“機內(nèi)碼”,又稱內(nèi)碼。如:“大”字的內(nèi)碼是:1011010011110011(B4F3)漢字的編碼(五)高位字節(jié)(7位):qqqqqqq=>0qqqqqqq(區(qū)號)低位字節(jié)(7位):wwwwwww=>0wwwwwww(位號)例如:“啊”區(qū)位碼:1601=>1001H0001000000000001國標(biāo)碼:3021H<=1001H
+2020H0011000000100001機內(nèi)碼:B0A1H<=3021H
+8080H1011000010100001漢字編碼例(1)GB2312-80漢字編碼 GB2312漢字內(nèi) 碼在雙字節(jié)代 碼空間中,其 碼位分布于右 下角的1/4象限
漢字的編碼(六)首字節(jié)尾字節(jié)00 7EA1 FE0081A1FEGB2312圖形符號GB2312漢字代碼空間(6763個漢字)GB2312-80漢字內(nèi)碼的碼位分布B0F7(2)GBK漢字內(nèi)碼擴充規(guī)范問題:GB2312-80只有6763個漢字,使用時功能不夠。解決方法:1995年發(fā)布GBK,全稱為《漢字內(nèi)碼擴展規(guī)范》GBK字符集中一共有21003個漢字和883個圖形符號,它與GB2312國標(biāo)漢字字符集及其內(nèi)碼保持兼容。GBK/1:GB2312中的符號;
GBK/2:GB2312中的全部漢字;
GBK/4和GBK/3:包括繁體字在內(nèi)的大量漢字;
GBK/5:符號。例如計算機係等繁體漢字和冃冄円冇鎔等生僻的漢字。
漢字的編碼(七)(2)GBK漢字內(nèi)碼擴充規(guī)范組成:21003個漢字,883個圖形符號GBK字符集中的每個字符都采用雙字節(jié)表示,總的編碼范圍為8140-FEFE,首字節(jié)在81-FE之間,尾字節(jié)在40-FE之間(剔除xx7F一條線不安排字符), 總計23940個碼位, 共收入21886個漢字 和圖形符號,未使 用的區(qū)域作為用戶 自定義區(qū)。漢字的編碼(八)首字節(jié)尾字節(jié)00407EA1 FE0081FEGBK/3GBK/4GBK/2GBK/5GBK/1GB2312圖形符號GB2312漢字代碼空間(6763個漢字)A0AAGBK/1B0F7GBK代碼控件和碼位分布(2)GBK漢字內(nèi)碼擴充規(guī)范應(yīng)用:操作系統(tǒng)——Windows95以上簡體中文版,采用GBK代碼,并提供了多種輸入法和字體應(yīng)用軟件——Office95以上簡體中文版本提供GBK碼的檢索和排序互聯(lián)網(wǎng)應(yīng)用——許多網(wǎng)站的網(wǎng)頁使用GBK代碼,但目前還不是所有搜索引擎都支持GBK漢字文本的搜索漢字的編碼(九)(3)UCS/Unicode與GB18030漢字編碼標(biāo)準(zhǔn)(a)通用編碼字符集UCS/Unicode約有6800種語言和文字在使用,需要建立一個多文種(Multilingual)處理環(huán)境在ISO2022基礎(chǔ)上,使用代碼頁號切換不同字符集的方法過于繁瑣,且與其他系統(tǒng)不兼容目標(biāo)與途徑:實現(xiàn)所有字符在同一字符集中統(tǒng)一編碼漢字的編碼(十)(3)UCS/Unicode與GB18030漢字編碼標(biāo)準(zhǔn)(a)通用編碼字符集UCS/UnicodeUCS:ISO/IEC10646
UniversalMultiple-OctetCodedCharacterSet,通用多8位編碼字符集Unicode:統(tǒng)一碼或聯(lián)合碼,微軟、IBM等聯(lián)合制定、與UCS完全等同的工業(yè)標(biāo)準(zhǔn)UCS/Unicode用4個字節(jié)對全世界現(xiàn)代書面文字所使用的所有字符、符號進(jìn)行編碼(記作
UCS-4)漢字的編碼(十一)(3)UCS/Unicode與GB18030漢字編碼標(biāo)準(zhǔn)(a)通用編碼字符集UCS/Unicode優(yōu)點:編碼空間極大,能容納足夠多的各種字符集(13億字符)缺點:4字節(jié)的字符編碼使存儲空間浪費嚴(yán)重克服:在UCS/Unicode編碼空間中,把第1和第2字節(jié)均為“0”的一個子空間(稱為基本多文種平面BMP),作為UCS/Unicode的子集來使用,記作UCS-2。UCS-2是雙字節(jié)編碼,共有字符49194個,其中包括:歐洲及中東地區(qū)使用的拉丁字母、音節(jié)文字各種標(biāo)點符號、數(shù)學(xué)符號、技術(shù)符號、幾何形狀、箭頭及其他符號中、日、韓(CJK)統(tǒng)一編碼的漢字漢字的編碼(十二)(3)UCS/Unicode與GB18030漢字編碼標(biāo)準(zhǔn)(a)通用編碼字符集UCS/UnicodeCJK統(tǒng)一編碼漢字:指中、日、韓、新、馬及我國臺灣、香港、澳門地區(qū)使用的漢字,不論其字義和讀音有無區(qū)別,只要字形相同,該漢字就只有一個代碼。CJK漢字集以現(xiàn)有各國和地區(qū)的標(biāo)準(zhǔn)字符集(中國大陸的GB國標(biāo)字符集,中國臺灣的CNS11643標(biāo)準(zhǔn),日本的JIS標(biāo)準(zhǔn)及韓國的KS標(biāo)準(zhǔn))作為源字符集,將其中的漢字按統(tǒng)一的認(rèn)同規(guī)則進(jìn)行認(rèn)同/甄別后,構(gòu)成UCS/Unicode中的共27484個字符的漢字部分。漢字的編碼(十三)(3)UCS/Unicode與GB18030漢字編碼標(biāo)準(zhǔn)(a)通用編碼字符集UCS/Unicode為了與目前大量使用的8-bit系統(tǒng)兼容,且避免與數(shù)據(jù)通信中使用的控制碼沖突,UCS/Unicode在實現(xiàn)時可將雙字節(jié)變換為可變長代碼。UCS-2編碼到UTF-8編碼的部分轉(zhuǎn)換規(guī)則漢字的編碼(十四)UCS/Unicode編碼UTF-8編碼范圍轉(zhuǎn)換前的代碼轉(zhuǎn)換后的代碼0000~007Fhex000000000xxxxxxx0xxxxxxx0080~07FFhex00000xxxxxyyyyyy110xxxxx10yyyyyy0800~FFFFhexxxxxyyyyyyzzzzzz1110xxxx10yyyyyy10zzzzzz(3)UCS/Unicode與GB18030漢字編碼標(biāo)準(zhǔn)(b)GB18030-2000編碼GB18030-2000碼位范圍的分配漢字的編碼(十五)字節(jié)數(shù)碼位空間碼位數(shù)單字節(jié)0x00~0x80129雙字節(jié)第1字節(jié)第2字節(jié)239400x81-0xFE0x40-0x7E,0x80-0xFE四字節(jié)第1字節(jié)第2字節(jié)第3字節(jié)第4字節(jié)15876000x81-0xFE0x30-0x390x81-0xFE0x30-0x393種漢字編碼的關(guān)系GBK-95GB2312-80GB12345-90GB18030-200000FF00FF00FF00FF00FF00FF27484漢字20902漢字6763漢字2個擴充的漢字字符集GB2312GBK-95GB18030-2000虛線外的漢字,4字節(jié)表示5.1.2文本的類型文本是計算機表示文字及符號信息的最常用也是最基本的一種數(shù)字媒體。由于文字和符號采用了二進(jìn)制編碼表示,因而可以方便地進(jìn)行編輯、排版和各種分析處理(如統(tǒng)計、排序、分類、索引、檢索等)。使用計算機制作的數(shù)字文本,根據(jù)用途分為:簡單文本、豐富格式文本和超文本三類。
簡單文本(plaintext):是由一連串的字符組成的,除了用于表達(dá)正文內(nèi)容的字符(包括漢字)及“回車”、“換行”、“制表”等有限的幾個打印(顯示)控制字符之外,幾乎不包含任何其他格式信息和結(jié)構(gòu)信息。這種文本通常稱為純文本或ASCII文本,在PC機中的文件后綴名是.txt特性:呈現(xiàn)為一種線性結(jié)構(gòu),以行、字為單位,順序?qū)懽髋c閱讀是最通用的文本文件格式,文件體積小,閱讀不受限制,幾乎所有的文字處理軟件都能識別和處理不能插入圖片、表格等,不能建立超鏈接簡單文本(純文本)文本的格式化豐富格式文本(richtext、fancytext、formattedtext)RTF格式多媒體文檔(MultimediaDocument)
豐富格式文本線性文本超文本(hypertext)的閱讀方式傳統(tǒng)的順序式閱讀通過鏈接、跳轉(zhuǎn)、導(dǎo)航、回溯等操作實現(xiàn)跳躍式閱讀超文本的結(jié)構(gòu)節(jié)點(node)節(jié)點包含的內(nèi)容超鏈(hyperlink)鏈源鏈宿超文本超文本ABCDEFGH超文本結(jié)構(gòu)超媒體(Hypermedia):超文本中的節(jié)點不單是文本節(jié)點,還包含圖形、圖像、聲音或動畫節(jié)點,這種基于多媒體信息結(jié)點的超文本,有時也稱為“超媒體”
超文本的應(yīng)用Windows等一些軟件中的“幫助”文件使用瀏覽器從Web服務(wù)器上下載的網(wǎng)頁(html或htm文件)超文本5.1.3文本的準(zhǔn)備人工輸入:通過鍵盤、手寫筆或語音輸入方式輸入字符特點:速度慢、成本高,不適合需處理大批量文字的應(yīng)用自動輸入:將紙介質(zhì)上的文本通過識別技術(shù)自動轉(zhuǎn)換為文字的編碼特點:速度快,效率高文字的自動識別分為:印刷體識別和手寫體識別文本信息的輸入方法文本信息的輸入人工輸入自動識別輸入鍵盤輸入聯(lián)機手寫輸入語音輸入印刷體識別手寫體識別文本信息的輸入方法文本信息的輸入人工輸入自動識別輸入鍵盤輸入聯(lián)機手寫輸入語音輸入印刷體識別手寫體識別
由于漢字字?jǐn)?shù)很多,無法使每個漢字與西文鍵盤上的鍵一一對應(yīng),因此必須使用一個或幾個鍵來表示漢字,這就稱為漢字的“鍵盤輸入編碼”好的漢字鍵盤輸入編碼方案的特點:易學(xué)習(xí)、易記憶、效率高(平均擊鍵次數(shù)較少)、重碼少、容量大(可輸入的漢字字?jǐn)?shù)多)等漢字的輸入編碼與漢字的內(nèi)碼是不同范疇的概念。使用不同的輸入編碼方法向計算機輸入的同一個漢字,它們的內(nèi)碼是相同的漢字鍵盤輸入(一)漢字輸入編碼方法的分類數(shù)字編碼:使用一串?dāng)?shù)字來表示漢字的編碼方法,例如電報碼、區(qū)位碼等缺點:難以記憶,不易推廣字音編碼:一種基于漢語拼音的編碼方法,簡單易學(xué),適合于非專業(yè)人員缺點:同音字引起的重碼多,需增加選擇操作字形編碼:將漢字的字形分解歸類而給出的編碼方法,重碼少、輸入速度較快,如五筆字形法和表形碼等缺點:編碼規(guī)則不易掌握形音編碼:吸取了字音編碼和字形編碼的優(yōu)點,使編碼規(guī)則適當(dāng)簡化、重碼減少缺點:不易掌握漢字鍵盤輸入(二)以平常書寫的習(xí)慣,把要輸入的漢字寫在一塊叫書寫板的設(shè)備上,書寫板將筆尖的運動(包括抬筆、落筆、筆段軌跡以及各筆段之間的時間關(guān)系等)按時間采樣后發(fā)送到計算機中,由計算機軟件自動進(jìn)行識別,然后用該漢字(或符號)對應(yīng)的代碼進(jìn)行保存。漢王筆正識率95℅~90℅,速度12字/秒中科院自動化所,華旗資訊科技發(fā)展有限公司(愛國者)聯(lián)機手寫漢字識別(筆輸入)使用語音輸入文本的系統(tǒng)也叫做“聽寫機”或“語音打字機”按照不同的應(yīng)用及要求,語音識別的功能區(qū)別:孤立語音/連續(xù)語音識別小詞匯量/大詞匯量語音識別特定人/非特定人語音識別最高目標(biāo):非特定人大詞匯量的連續(xù)語音識別技術(shù)漢語語音識別印刷體漢字識別:將傳統(tǒng)紙介質(zhì)上的文字信息自動輸入計算機并轉(zhuǎn)換為數(shù)字文本形式的一種技術(shù),也叫做漢字OCR(OpticalCharacterRecognition)。印刷體文字識別的過程印刷體漢字識別(漢字OCR)掃描后的圖像文本預(yù)處理版面分析文字切分特征提取字符識別后處理識別后的編碼文本手寫漢字識別聯(lián)機與脫機(手寫漢字識別)的比較脫機手寫漢字識別5.1.4文本編輯與排版文本編輯的主要功能對字、詞、句、段落進(jìn)行添加、刪除、修改等操作字的處理:設(shè)置字體、字號、字的排列方向、間距、顏色、效果等段落的處理:設(shè)置行距、段間距、段縮進(jìn)、對稱方式等頁面布局的處理:設(shè)置頁邊距、每頁行列數(shù)、分欄、頁眉、頁腳等“所見即所得”(WhatYouSeeIsWhatYouGet,簡稱WYSIWYG):一方面所有的編輯操作效果立即可以在屏幕上看到,另一方面在屏幕上看到的效果與打印機的輸出結(jié)果相同。文本編輯與文本處理(一)文本處理內(nèi)容:字?jǐn)?shù)統(tǒng)計,字頻統(tǒng)計,簡/繁體相互轉(zhuǎn)換,漢字/拼音相互轉(zhuǎn)換詞語排序,詞語錯誤檢測,文句語法檢查自動分詞,詞頻統(tǒng)計,詞性標(biāo)注,詞義辨識,大陸/臺灣術(shù)語轉(zhuǎn)換文本壓縮,文本加密,文本著作權(quán)保護(hù)關(guān)鍵詞提取,文摘自動生成,文本分類文本檢索(關(guān)鍵詞檢索、全文檢索),文本過濾文語轉(zhuǎn)換(語音合成),文種轉(zhuǎn)換(機器翻譯)篇章理解,自動問答,自動寫作等文本編輯與文本處理(二)(1)面向通信的文本處理軟件 計算機網(wǎng)絡(luò)上最普及的應(yīng)用是用電子郵件進(jìn)行通信。大多數(shù)情況下電子郵件正文的內(nèi)容一般都是簡單文本,因此電子郵件內(nèi)嵌的文本編輯器功能比較簡單,操作使用方便。典型軟件:微軟公司的OutlookExpress,具有文字的增、刪、改以及字體、字號的設(shè)置功能,也可以設(shè)定一些簡單的格式和插入一些圖片。當(dāng)然郵件所帶的附件并不受此限制。在互聯(lián)網(wǎng)上進(jìn)行聊天所使用的文本處理軟件更加簡單。常用文本處理軟件(一)(2)面向辦公的文本處理軟件功能要求:文本制作的高效率、高質(zhì)量軟件面向非專業(yè)用戶,易學(xué)好用文本處理能力,既功能豐富,又操作簡單排版功能典型軟件:MS-OfficeWPS2000永中Office中的文本處理軟件常用文本處理軟件(二)(3)面向出版的文本處理軟件排版軟件的主要功能:將文字、圖形和圖像等合理地安排在頁面內(nèi).ps文件:排版軟件的輸出的一種使用頁面描述語言(例如PostScript)描述的文件,該文件記錄了每一個頁面的排版結(jié)果,它被送到裝有柵格圖像處理器(RIP)的激光照排機去,經(jīng)過RIP的解釋,產(chǎn)生頁面的圖像,然后驅(qū)動激光束對感光材料進(jìn)行掃描曝光,以得到用于制版的膠片典型排版軟件:方正集團(tuán)公司的“飛騰”排版軟件美國Adobe公司的PageMaker和PDFWriter常用文本處理軟件(三)(4)面向網(wǎng)絡(luò)信息發(fā)布和電子出版的文本處理軟件制作HTML文件的軟件:微軟的FrontPage,使用Word也可以產(chǎn)生HTML文件輸出。
HTML文件:一種使用HTML語言(超文本標(biāo)記語言)進(jìn)行描述的文本文件。使用形如<xxx>和</xxx>的一對“括號”作為標(biāo)記,指出文本中的標(biāo)題、文本的分段及格式,描述文本中的表格類型、文本的分區(qū)、背景顏色、文字的顏色、字體和大小,設(shè)定文本頁面的邊距、文本中插圖的位置、大小及圖片名稱等,最重要的是它能描述超鏈。超鏈的鏈宿有兩種:書簽,指的是文本內(nèi)部標(biāo)記有書簽的某個地方互聯(lián)網(wǎng)上的某個信息資源(文件),它用統(tǒng)一資源定位器(URL)指定常用文本處理軟件(四)(4)面向網(wǎng)絡(luò)信息發(fā)布和電子出版的文本處理軟件面向電子出版的軟件PDF格式文件常用文本處理軟件(五)5.1.6文本展現(xiàn)文本輸出:在屏幕上顯示文本,用打印機打印文本等操作。文本輸出過程:首先要對文本的格式描述進(jìn)行解釋,然后生成文字和圖表的映像(bitmap),最后再傳送到顯示器或打印機輸出。文本閱讀器:承擔(dān)上述文本輸出任務(wù)的軟件,也稱為瀏覽器。它們可以是嵌入在文本處理軟件中的一個模塊,如微軟的Word,也可以是獨立的軟件,如Adobe公司的AcrobatReader,微軟公司的IE等。文本的輸出(一)文字(漢字)字形的生成過程:先根據(jù)字符的字體確定相應(yīng)的字型庫(font),再按照該字符的代碼從字型庫中取出該字符的形狀描述信息,然后按形狀描述信息生成字形,并按照字號大小及有關(guān)屬性(粗體、斜體、下橫線)將字形作必要的變換,最后將變換得到的字形放置在頁面的指定位置處。字型庫:簡稱字庫,同一種字體的所有字符(例如GB2312中的7000多字符)的形狀描述信息的集合。不同的字體(如宋體、仿宋、楷體、黑體等)對應(yīng)不同的字庫。
文本的輸出(二)字符形狀的描述方法:點陣描述輪廓描述文本的輸出(三)
字符的點陣描述字符的輪廓描述5.2圖形與圖像處理5.2.1基礎(chǔ)知識從現(xiàn)實世界中通過數(shù)字化設(shè)備獲取的圖像,稱為:取樣圖像(sampledimage)、點陣圖像(dotmatriximage)、位圖圖像(bitmapimage)——簡稱圖像(image)計算機合成的圖像(syntheticimage),稱為:矢量圖形(vectorgraphics),簡稱圖形(graphics)圖像按生成方法分類5.2.2圖像的獲取途徑與圖像數(shù)字化圖像的獲取(capturing):從現(xiàn)實世界中獲得數(shù)字圖像的過程圖像獲取的過程實質(zhì)上是模擬信號的數(shù)字化過程,它的處理步驟:取樣分色量化圖像的數(shù)字化(一)圖像的數(shù)字化過程圖像的數(shù)字化(二)模擬圖像取樣分色量化量化量化數(shù)字圖像RGB設(shè)備:從現(xiàn)實世界獲得數(shù)字圖像過程中所使用的設(shè)備通稱為數(shù)字圖像獲取設(shè)備設(shè)備的功能:將現(xiàn)實的景物輸入到計算機內(nèi)并以取樣圖像的形式表示2D圖像獲取設(shè)備(如掃描儀、數(shù)碼相機等)只能對圖片或景物的2D投影進(jìn)行數(shù)字化3D掃描儀能獲取包括深度信息在內(nèi)的3D景物的信息數(shù)字圖像獲取設(shè)備5.2.3圖像的表示與壓縮從取樣圖像的獲取過程可以知道,一幅取樣圖像由M(行)*N(列)個取樣點組成,每個取樣點是組成取樣圖像的基本單位,稱為像素(pictureelement,簡寫為pel)。彩色圖像的像素是矢量,它由多個彩色分量組成,黑白圖像的像素只有1個亮度值圖像的表示方法與主要參數(shù)彩色圖像的表示圖像的表示方法與主要參數(shù)155156159170150151175176150154159166156158177178147153158162156168180188168175175174177182187183225225219217216218223227225224221220214215222225240233226223219220224229233231229226220220227230178176176176176205216226179178175180177200223231174175178184181189217224208203208196193197216225212210215202192196207218211212212210198194207210224227224214197196213220228231233220202197210217180177187190190220225231182184179188192217239233182185190191194207229235219215218198198205220237211214218202192195212234217214213210194192214238222225226214197200216230228230230225200206212220紅色分量綠色分量藍(lán)色分量取樣圖像在計算機中的表示方法:單色圖像用一個矩陣來表示彩色圖像用一組(一般是3個)矩陣來表示,矩陣的行數(shù)稱為圖像的垂直分辨率,列數(shù)稱為圖像的水平分辨率,矩陣中的元素是像素顏色分量的亮度值,使用整數(shù)表示,一般是8位至12位圖像的表示方法與主要參數(shù)圖像的屬性信息圖像大小,也稱圖像分辨率(包括垂直分辨率和水平分辨率)位平面的數(shù)目,即矩陣的數(shù)目,也就是彩色分量的數(shù)目顏色空間的類型,指彩色圖像所使用的顏色描述方法,也叫顏色模型。常用顏色模型:RGB(紅、綠、藍(lán))、CMYK(青、品紅、黃、黑)、HSV(色彩、飽和度、亮度)、YUV(亮度、色度)等像素深度,即像素的所有顏色分量的位數(shù)之和,它決定了不同顏色(亮度)的最大數(shù)目圖像的表示方法與主要參數(shù)圖象文件的大小圖象文件名圖象大小、深度、類型白色小車點陣圖示行駛中的白色小車一幅圖像的數(shù)據(jù)量可按下面的公式進(jìn)行計算(以字節(jié)為單位):圖像數(shù)據(jù)量=圖像水平分辨率×圖像垂直分辨率×像素深度/8幾種常用圖像的數(shù)據(jù)量圖像的壓縮編碼圖像大小8位(256色)16位(65536色)24位(真彩色)640×480300KB600KB900KB1024×768768KB1.5MB2.25MB1280×10241.25MB2.5MB5.75MB圖像數(shù)據(jù)壓縮的可能性:由于數(shù)字圖像中的數(shù)據(jù)相關(guān)性很強,數(shù)據(jù)的冗余度很大,因此對數(shù)字圖像進(jìn)行大幅度的數(shù)據(jù)壓縮是完全可能的。而且,人眼的視覺有一定的局限性,即使壓縮前后的圖像有一定失真,只要限制在人眼允許的誤差范圍之內(nèi),也是允許的。圖像的壓縮編碼數(shù)據(jù)壓縮類型無損壓縮:壓縮以后的數(shù)據(jù)進(jìn)行圖像還原(也稱為解壓縮)時,重建的圖像與原始圖像完全相同 例如:行程長度編碼(runlengthcoding,RLC):111110005555333302222222513045431072
哈夫曼(Huffman)編碼:對出現(xiàn)概率高(低)的編短(長)碼,是變長碼有損壓縮:使用壓縮后的數(shù)據(jù)進(jìn)行圖像重建時,重建后的圖像與原始圖像雖有一定的誤差,但不影響人們對圖像含義的正確理解。如變換編碼、矢量編碼等圖像的壓縮編碼圖像壓縮方法很多,不同方法適用于不同的應(yīng)用,在計算機中常常是多種壓縮方法的綜合使用。為得到較高的數(shù)據(jù)壓縮比,一般都采用有損壓縮。壓縮編碼方法優(yōu)劣的評價壓縮倍數(shù)的大小重建圖像的質(zhì)量(有損壓縮時)壓縮算法的復(fù)雜程度圖像的壓縮編碼圖像壓縮編碼方法的國際標(biāo)準(zhǔn)和工業(yè)標(biāo)準(zhǔn):ISO和IEC兩個國際機構(gòu)聯(lián)合組成了一個專家組
(JointPhotographicExpertsGroup,JPEG),制定了一個靜止圖像數(shù)據(jù)壓縮編碼的國際標(biāo)準(zhǔn),稱為JPEG標(biāo)準(zhǔn)JPEG標(biāo)準(zhǔn)的特點:適用范圍廣;能處理各種連續(xù)色調(diào)的彩色或灰度圖像;算法復(fù)雜度適中;既可用硬件實現(xiàn),也可用軟件實現(xiàn);圖像的壓縮比可控制(壓縮比越低,圖像質(zhì)量越好;壓縮比越高,圖像質(zhì)量越差)JPEG2000:適用于各種不同類型(黑白、灰度、彩色等)和不同特性(自然、醫(yī)學(xué)、遙感、合成)的圖像,可用于不同的應(yīng)用模式(實時傳輸、檢索、存檔等)。采用了小波分析等先進(jìn)算法,提供了更好的圖像質(zhì)量,更低的碼率,更適合在WWW網(wǎng)上傳輸?shù)?,它兼容JPEG圖像的壓縮編碼JPEG圖像壓縮比例
圖像的壓縮編碼中等壓縮后的圖像高倍壓縮后的圖像5.2.4常用圖像文件格式常用圖像文件格式名稱壓縮編碼方法性質(zhì)典型應(yīng)用開發(fā)組織/公司BMPRLC無損Windows應(yīng)用程序MicrosoftTIFRLC,LZW無損DesktoppublishingAldus,MicrosoftGIFLZW無損InternetCompuServeJPEGDCT,Huffman無損/有損Internet,數(shù)碼相機等ISO/IECJP2小波變換,算術(shù)編碼無損/有損Internet,數(shù)碼相機等ISO/IEC用畫圖軟件可以產(chǎn)生的圖形類型用photoshop可以產(chǎn)生的圖形類型BMP(BitMaP-file)圖像:微軟公司在Windows操作系統(tǒng)下使用的一種標(biāo)準(zhǔn)圖像文件格式,一個文件存放一幅圖像,可以使用行程長度編碼(RLC)進(jìn)行無損壓縮,也可不壓縮。不壓縮的BMP文件是一種通用的圖像文件格式,幾乎所有Windows應(yīng)用軟件都能支持。TIFF(TaggedImageFileFormat)圖像文件格式:用于掃描儀和桌面出版,能支持多種壓縮方法和多種不同類型的圖像,有許多圖像圖形應(yīng)用軟件支持這種文件格式。由文件頭、文件目錄、目錄條目三個部分組成。常用圖像文件格式GIF(GraphicsInterchangeFormat):互聯(lián)網(wǎng)上廣泛使用的一種圖像文件格式,它的顏色數(shù)目較少(不超過256色),文件特別小,適合網(wǎng)絡(luò)傳輸。由于顏色數(shù)目有限,GIF適用于插圖、剪貼畫等色彩數(shù)目不多的應(yīng)用場合。GIF格式能夠支持透明背景,具有在屏幕上漸進(jìn)顯示的功能。尤為突出的是,它可以將許多張圖像保存在同一個文件中,顯示時按預(yù)先規(guī)定的時間間隔逐一進(jìn)行顯示,從而形成動畫的效果,因而在網(wǎng)頁制作中大量使用。由CompuServe公司1987年開發(fā),基于Lempel-ZivWalch(LZW)壓縮算法、使用特殊碼、可變長度。
常用圖像文件格式5.2.5數(shù)字圖像處理與應(yīng)用數(shù)字圖像處理:使用計算機對來自照相機、攝像機、傳真機、掃描儀、醫(yī)用CT機、X光機等的圖像,進(jìn)行去噪、增強、復(fù)原、分割、提取特征、壓縮、存儲、檢索等操作處理對圖像進(jìn)行處理的主要目的提高圖像的視感質(zhì)量圖像復(fù)原與重建圖像分析圖像的存儲、管理、檢索,以及圖像內(nèi)容與知識產(chǎn)權(quán)的保護(hù)等數(shù)字圖像處理
與應(yīng)用領(lǐng)域密切相關(guān),通常具有很強的專業(yè)性,如遙感圖像處理軟件、醫(yī)學(xué)圖像處理軟件等。 使用較多的是面向辦公、出版與信息發(fā)布的圖像處理軟件,也稱為圖像修飾(imageretouching)或圖像編輯軟件,支持多種不同的圖像文件格式,提供多種圖像編輯處理功能,可制作出生動形象的圖像。如美國Adobe公司的PhotoShop,集圖像掃描、圖像編輯、繪圖、圖像合成及圖像輸出等多種功能于一體,是一個流行的圖像處理工具。圖像處理軟件圖像的顯示控制圖像區(qū)域的選擇圖像的編輯操作圖像的濾鏡操作繪圖功能文字編輯功能圖層操作PhotoShop的主要功能包括圖像處理軟件處理前圖片上有劃痕處理后劃痕被清除圖像的濾鏡操作背景圖前景圖復(fù)合后的圖像圖層操作圖像通信遙感醫(yī)療診斷工業(yè)生產(chǎn)中的應(yīng)用機器人視覺軍事、公安、檔案管理數(shù)字圖像的應(yīng)用5.2.6計算機圖形學(xué)與圖形處理技術(shù)景物的模型(model):景物在計算機內(nèi)的描述景物的建模(modeling):人們進(jìn)行景物描述的過程繪制(rendering):也稱圖像合成(imagesynthesis),根據(jù)景物的模型生成圖像的過程,所產(chǎn)生的數(shù)字圖像稱為計算機合成圖像計算機圖形學(xué)(ComputerGraphics):研究如何使用計算機描述景物并生成其圖像的原理、方法與技術(shù)景物形狀的計算機表示計算機合成圖像的過程:景物形狀的計算機表示建模/造型(Modeling)景物形狀的模型(model)建模/造型(Modeling)景物形狀的視圖幾何模型:景物建模方法與景物類型有關(guān)。普通工業(yè)產(chǎn)品(如電視機、電話機、汽車、飛機等),使用基本的幾何元素(如點、線、面、體等)及表面材料的性質(zhì)等進(jìn)行描述所建立的模型幾何模型分類(按照所使用的幾何元素類型)線框模型曲面模型實體模型幾何模型應(yīng)用:工業(yè)產(chǎn)品的計算機輔助設(shè)計/制造過程模型/算法模型:根據(jù)景物的生成規(guī)律,并使用相應(yīng)的算法來描述其規(guī)律所建立的模型景物形狀的計算機表示剪貼畫剪貼畫的分解剪貼畫的構(gòu)造與效果改變幾何點景物形狀的計算機表示使用幾何模型描述的機械零件使用分形模型描述的圖案形體與景物的建模方法線框模型實體模型表面模型幾何造型技術(shù)過程模型技術(shù)分形幾何形狀語法微粒系統(tǒng)基于物理的建模圖像繪制/圖像合成:在計算機內(nèi)建立了景物的模型之后,從景物的模型生成用戶可見的具有高度真實感的該景物的圖像的過程。從景物模型繪制景物圖像的處理步驟計算機合成圖像的繪制景物的模型取景變換視域裁減三角化光柵化隱藏面消除明暗處理陰影生成紋理映射景物的圖像使用計算機合成圖像的主要優(yōu)點:能生成實際存在的具體景物的圖像,還能生成假想或抽象景物的圖像能生成靜止圖像,還能生成各種運動、變化的動態(tài)圖像計算機合成圖像的應(yīng)用:計算機輔助設(shè)計和輔助制造(CAD/CAM)利用計算機生成各種地形圖、交通圖、天氣圖、海洋圖、石油開采圖等作戰(zhàn)指揮和軍事訓(xùn)練計算機動畫和計算機藝術(shù)其他:電子出版、數(shù)據(jù)處理、工業(yè)監(jiān)控、輔助教學(xué)(CAI)、軟件工程等計算機合成圖像的繪制矢量圖形:計算機合成圖像矢量繪圖軟件:制作矢量圖形的軟件 如:AutoCAD、MAPInfo、ARCInfo等2D的矢量繪圖軟件:Corel公司的CorelDrawAdobe公司的IllustratorMacromedia公司的FreeHand微軟公司的MicrosoftVisio微軟公司Office辦公套件中的Word和PowerPoint矢量繪圖軟件國際標(biāo)準(zhǔn)的繪圖語言(編程語言)二維圖形的國際標(biāo)準(zhǔn)是GKS三維圖形的國際標(biāo)準(zhǔn)是GKS-3D、PHIGS工業(yè)標(biāo)準(zhǔn)OpenGL公司標(biāo)準(zhǔn)如微軟公司的Direct-3D圖形元文件標(biāo)準(zhǔn)(數(shù)據(jù)形式)國際標(biāo)準(zhǔn)CGM和STEPAutodesk公司的DXFMicrosoft公司的WMF矢量繪圖軟件5.3數(shù)字聲音及應(yīng)用5.3.1聲音信號基本概念聲音:由振動而產(chǎn)生,通過空氣進(jìn)行傳播。它由許多不同頻率的諧波所組成,諧波的頻率范圍稱為聲音的帶寬(bandwidth),帶寬是聲音的一項重要參數(shù)。多媒體技術(shù)處理的聲音信號主要是人耳可聽到的20~20kHz的音頻信號(audio)言語(speech)/語音:人說話的聲音,其頻率范圍約為300~3400Hz全頻帶聲音:音樂聲、風(fēng)雨聲、汽車聲等其他聲音,其帶寬可達(dá)到20~20kHz聲音信號的數(shù)字化5.3.2
聲音的獲取1.獲取聲音素材
需要的聲音可能是音樂,也可能是解說等,一般的普通音樂素材可直接到網(wǎng)上下載,如/teach/shucaiku/。
2.聲音素材的錄制
在Windows操作系統(tǒng)中有一個專門用于錄制聲音的工具錄音機,利用它可以錄制、混合、播放和編輯聲音,也可以將聲音鏈接或插入另一個文檔中。
Windows操作系統(tǒng)中的“錄音機”可通過依次選擇“開始”→“所有程序”→“附件”→“娛樂”→“錄音機”命令來啟動。
3.聲音片段的截取
若聲音文件中有不需要的部分,則可以將其刪除。在Windows操作系統(tǒng)中,其操作方法是將需要修改的聲音文件利用錄音機打開,再將滑塊移到文件中要剪切的位置,然后執(zhí)行“編輯”菜單中的“刪除當(dāng)前位置以前的內(nèi)容(或刪除當(dāng)前位置以后的內(nèi)容)”命令。聲音的獲取5.3.3
數(shù)字聲音的獲取與播放聲音信號的數(shù)字化:將模擬聲音信號轉(zhuǎn)換成數(shù)字編碼形式以便于計算機進(jìn)行處理的過程聲音信號數(shù)字化的過程:取樣量化編碼聲音信號的數(shù)字化模擬聲音信號取樣量化編碼數(shù)字聲音011010011101……A/D轉(zhuǎn)換(模擬信號->數(shù)字編碼)電壓值時間間隔A/D轉(zhuǎn)換(模擬信號->數(shù)字編碼)電壓值時間間隔模擬聲音信號取樣量化編碼數(shù)字聲音011010011101……模擬的聲音信號轉(zhuǎn)變成數(shù)字形式進(jìn)行處理的優(yōu)點:以數(shù)字形式存儲的聲音重放性能好,復(fù)制時沒有失真數(shù)字聲音的可編輯性強,易于進(jìn)行效果處理數(shù)字聲音能進(jìn)行數(shù)據(jù)壓縮,傳輸時抗干擾能力強數(shù)字聲音容易與其他媒體相互結(jié)合(集成)數(shù)字聲音為自動提取“元數(shù)據(jù)”和實現(xiàn)基于內(nèi)容的檢索創(chuàng)造了條件聲音信號的數(shù)字化麥克風(fēng):將聲波轉(zhuǎn)換為電信號聲卡(soundcard):進(jìn)行數(shù)字化波形聲音的獲?。喊涯M的聲音信號轉(zhuǎn)換為數(shù)字形式。(話筒或線路輸入、單雙道)波形聲音的重建與播放MIDI(MusicalInstrumentDigitalInterface)聲音的輸入MIDI聲音的合成與播放波形聲音的獲取設(shè)備聲卡的工作原理波形聲音的獲取設(shè)備取樣、量化DSPMIDI合成器重建、濾波D/A聲音輸入數(shù)字聲音輸出聲音輸出DMA接口PCI總線MIDI接口聲卡以數(shù)字信號處理器(DSP)為核心,DSP在完成數(shù)字聲音的編碼、解碼及聲音編輯操作中起著重要的作用。它利用PCI總線與主機進(jìn)行數(shù)據(jù)交換,混音器(mixer)的將不同的聲音信號進(jìn)行混音,并提供音量控制功能。PC機的聲卡較多的已經(jīng)與主板集成在一起,不再做成獨立的插卡。利用聲卡可在線(on-line)獲取聲音;使用數(shù)碼錄音 筆可離線(off-line)獲取聲音,然后再通過USB接 口直接將已經(jīng)數(shù)字化的聲音數(shù)據(jù)送入計算機中。數(shù) 碼錄音筆的原理與上述過程基本相同,不過由于帶 寬的原因,它一般適合于錄制語音。
聲卡的組成與工作原理聲音的播放數(shù)字聲音解碼數(shù)模轉(zhuǎn)換插值重建的模擬聲音信號011010011101……聲音播放:計算機輸出聲音的過程聲音重建步驟:聲音重建(reconstruction):把聲音從數(shù)字形式轉(zhuǎn)換成模擬信號形式解碼數(shù)模轉(zhuǎn)換插值處理將模擬聲音信號經(jīng)過處理和放大送到揚聲器發(fā)出聲音聲音重建
聲音的重建也是由聲卡完成的。聲卡輸出的聲音需送到音箱去發(fā)音。音箱分類普通音箱:接收的是重建的模擬聲音信號數(shù)字音箱:可直接接收聲卡輸出的數(shù)字聲音信號,避免信號在傳輸中發(fā)生畸變和受到干擾,其音響效果更加突出聲音重建5.3.4
數(shù)字語音的壓縮方法取樣頻率量化位數(shù)聲道數(shù)目使用的壓縮編碼方法數(shù)碼率(bitrate):指的是每秒鐘的數(shù)據(jù)量,也稱比特率、碼率數(shù)字聲音未壓縮前,其計算公式為:波形聲音的碼率
=
取樣頻率
×
量化位數(shù)
×
聲道數(shù)壓縮編碼以后的碼率=壓縮前的碼率/壓縮倍數(shù)波形聲音的主要參數(shù)幾種常見數(shù)字聲音的主要參數(shù)
波形聲音的主要參數(shù)聲音類型帶寬(Hz)取樣頻率(kHz)量化位數(shù)(bits)聲道數(shù)未壓縮時的碼率壓縮后的碼率數(shù)字語音300~340088164kb/s2~64kb/sCD唱片20~2000044.1162176.4kB/s176.4kB/sMP3音樂20~2000044.1162176.4kB/s128~112kb/s問題:數(shù)據(jù)量很大。如CD盤片上所存儲的立體聲高保真的全頻帶數(shù)字音樂,1小時的數(shù)據(jù)量大約是635MB目的與辦法:降低存儲成本和傳輸通信帶寬,對數(shù)字波形聲音進(jìn)行數(shù)據(jù)壓縮波形聲音數(shù)據(jù)壓縮的可能性:聲音信號中包含有大量的冗余信息,再加上還可以利用人的聽覺感知特性,因此,產(chǎn)生了許多壓縮算法聲音數(shù)據(jù)壓縮算法的評價:壓縮倍數(shù)高,聲音失真小,算法簡單,編碼器/解碼器的成本低全頻帶聲音的壓縮編碼第1代編碼技術(shù)——PCM(脈沖編碼調(diào)制)編碼:依據(jù)聲音波形本身的信息相關(guān)性進(jìn)行數(shù)據(jù)壓縮,代表性的應(yīng)用是CD唱片第2代壓縮編碼——感知聲音編碼(perceptualaudiocoding)
:不但充分利用聲音信息本身的相關(guān)性,而且還充分利用人耳的聽覺特性,即使用“心理聲學(xué)模型”來達(dá)到大幅度壓縮數(shù)據(jù)的目的全頻帶聲音的壓縮編碼第2代壓縮編碼——感知聲音編碼的編碼過程:第1階段:通過時間/頻率變換和心理聲學(xué)分析,揭示原始聲音中與人耳感知無關(guān)的信息第2階段:通過量化和編碼予以抑制第3階段:使用熵編碼消除聲音信息中的統(tǒng)計冗余全頻帶聲音的壓縮編碼第2代全頻帶聲音壓縮編碼標(biāo)準(zhǔn)全頻帶聲音的壓縮編碼名稱壓縮后的碼率(每個聲道)聲道數(shù)目主要應(yīng)用MPEG-1層1384kbps(壓縮4倍)2數(shù)字盒式錄音帶MPEG-1層2256~192kbps(壓縮6~8倍)2DAB,VCD,DVDMPEG-1層3128~112kbps(壓縮10~12倍)2Internet,MP3音樂MPEG-2層audio與MPEG-1層1,層2,層3相同5.1,7.0同MPEG-1DolbyAC-364kbps5.1,7.1DVD,DTV,家庭影院MPEG-1聲音壓縮編碼是國際上第一個高保真聲音數(shù)據(jù)壓縮的國際標(biāo)準(zhǔn),它分為三個層次:層1(Layer1):編碼簡單,用于數(shù)字盒式錄音磁帶層2(Layer2):算法復(fù)雜度中等,用于數(shù)字音頻廣播(DAB)和VCD等層3(Layer3):編碼復(fù)雜,用于互聯(lián)網(wǎng)上的高質(zhì)量聲音的傳輸,如MP3音樂壓縮10倍MPEG-2的聲音壓縮編碼采用與MPEG-1聲音相同的編譯碼器,層1,層2和層3的結(jié)構(gòu)也相同,但它能支持5.1聲道和7.1聲道的環(huán)繞立體聲全頻帶聲音的壓縮編碼全頻帶聲音的壓縮編碼全頻帶聲音的壓縮編碼杜比數(shù)字AC-3(DolbyDigitalAC-3):美國杜比公司開發(fā)的多聲道全頻帶聲音編碼系統(tǒng),它提供的環(huán)繞立體聲系統(tǒng)由5個全頻帶聲道加一個超低音聲道組成,6個聲道的信息在制作和還原過程中全部數(shù)字化,信息損失很少,細(xì)節(jié)豐富,具有真正的立體聲效果,在數(shù)字電視、DVD和家庭影院中廣泛使用。全頻帶聲音的壓縮編碼音(視)頻媒體的傳輸要求高帶寬連續(xù)實時傳輸平穩(wěn)傳輸,克服突發(fā)問題傳輸音(視)頻媒體的方式先下載,后播放(下載方式,需要等待很長時間,有很大的存儲需求)邊下載,邊播放(流式傳輸方式,不需要下載完整個文件,只需經(jīng)過幾秒或十?dāng)?shù)秒的啟動延時即可進(jìn)行播放)全頻帶聲音的壓縮編碼流媒體技術(shù):允許在窄帶網(wǎng)上讓用戶一邊下載一邊收看(聽)音視頻連續(xù)媒體的技術(shù)流媒體:使用流式傳輸技術(shù)的音/視頻媒體優(yōu)點:等待時間大大縮短減少了對緩沖容量的需求降低了對網(wǎng)絡(luò)帶寬的要求全頻帶聲音的壓縮編碼聲音流媒體產(chǎn)品RealNetworks公司的RA(RealAudio)數(shù)字音頻微軟公司的WMA(WindowsMediaAudio)數(shù)字音頻蘋果公司的QuickTime全頻帶聲音的壓縮編碼設(shè)定28Kbips網(wǎng)速播放設(shè)定300Kbips網(wǎng)速播放語音:空氣通過聲道引起聲門振動產(chǎn)生語音 帶寬只有300~3400Hz壓縮方法波形編碼(基于感覺模型的壓縮方法)特點:碼率較高(64kb/s、32kb/s)、語音質(zhì)量高、 算法簡單、易實現(xiàn)應(yīng)用:固定電話通信系統(tǒng)、多媒體文檔參數(shù)編碼或模型編碼特點:碼率很低、聲音質(zhì)量較差應(yīng)用:保密通信混合編碼特點:中度碼率(4.8-16kb/s)、壓縮比較高、 語音質(zhì)量較好應(yīng)用:移動通信、IP電話數(shù)字語音的壓縮編碼數(shù)字語音壓縮編碼方法的比較數(shù)字語音的壓縮編碼語音質(zhì)量優(yōu)良中差壞1248163264混合編碼波形編碼模型編碼碼率(kb/s)極低低中5.3.5
聲音文件格式.wav(waveform):用于PC.PCM:使用PCM編碼的聲音文件,.VOC:聲霸卡使用的音頻文件格式.Mp2:MPEGLayerI,II.Mp3:MPEGLayerIII,.rm,ra(RealAudio):RealNetworks的流式聲音文件.wma:微軟公司的流式聲音文件.aif(AudioInterchangeableFileFormat):蘋果機波形聲音的文件格式5.3.6聲音文件的編輯基本編輯操作聲音的剪輯(刪除、移動或復(fù)制一段聲音,插入空白等)聲音音量調(diào)節(jié)(提高或降低音量,淡入、淡出處理等)聲音的反轉(zhuǎn)持續(xù)時間的壓縮/拉伸消除噪音聲音的頻譜分析聲音的效果處理包括混響、回聲、延遲、頻率均衡、和聲效果、動態(tài)效果、升降調(diào)、顫音等格式轉(zhuǎn)換功能其他功能如分軌錄音,配音,刻錄CD唱片等聲音編輯軟件的功能
聲音編輯軟件的界面時間刻度左聲道信號波形淡入淡出播放標(biāo)尺右聲道信號波形數(shù)字聲音的參數(shù)5.3.7計算機合成聲音語音合成(Speechsynthesis):根據(jù)語言學(xué)和自然語言理解的知識,使計算機模仿人的發(fā)聲,自動生成語音的過程。目前主要是按照文本(書面語言)進(jìn)行語音合成,這個過程稱為文語轉(zhuǎn)換(Text-To-Speech,簡稱TTS)。文語轉(zhuǎn)換過程文本分析韻律分析語音生成語音合成文語轉(zhuǎn)換過程語音合成文本文本分析韻律處理語音合成合成語音詞典,發(fā)音規(guī)則韻律規(guī)則庫語音庫語音庫:語音庫中存儲了大量預(yù)先錄制的語音基元(單音、詞組、短語或句子)的波形,合成時讀取語音基元的波形,將這些波形進(jìn)行拼接和韻律修飾,然后輸出連續(xù)語音流。對計算機合成的語音希望能達(dá)到的要求:發(fā)音清晰可懂語氣語調(diào)自然說話人可選擇語速可變化等語音合成計算機合成語音的應(yīng)用:股票交易、航班動態(tài)查詢、電話報稅等業(yè)務(wù)有聲E-mail服務(wù)CAI課件或游戲解說詞的自動配音文稿校對、語言學(xué)習(xí)、語音秘書、自動報警、殘疾人服務(wù)等語音合成音樂是使用樂器演奏而成的音樂的基本單元是一些音符音符的屬性:音調(diào):聲波的基頻音色:由聲音的頻譜決定,不同樂器有不同的音色音強:聲音的強度旋律:樂曲中音符持續(xù)時間的變化音源:也稱為音樂合成器(musicsynthesizer),它能模仿許多樂器生成各種不同音色的音符。PC機的聲卡一般都帶有音源音樂合成聲卡上的音源調(diào)頻合成器:一種受控的電子振蕩器(波形發(fā)生器),能模擬生成許多樂器演奏的音符 特點:音色單調(diào),效果較差波表合成器:預(yù)先將每種樂器演奏的各個音符的波形數(shù)字化,把它們組織成一張表(稱為波表),存放在ROM中,播放時根據(jù)樂器類型、音符等參數(shù)訪問ROM,取出相應(yīng)的波形數(shù)據(jù),將其修飾成所要求的音強和時長,然后播放出來特點:音色優(yōu)美,效果好MIDI(MusicalInstrumentDigitalInterface):計算機中描述樂譜的一種標(biāo)準(zhǔn)描述語言,規(guī)定了樂譜的數(shù)字表示方法(包括音符、定時、樂器等)和演奏控制器、音源、計算機等相互連接時的通信規(guī)程。音樂合成MIDI規(guī)定:樂譜中的音符及其定時、速度、音色(樂器)等采用MIDI消息(MIDImessage)進(jìn)行描述每個MIDI消息描述一個音樂事件(如開始演奏某個音符、結(jié)束演奏某個音符、選擇音符的音色、改變演奏速度等)一首樂曲所對應(yīng)的全部MIDI消息組成一個MIDI文件MIDI文件在計算機中的文件擴展名為
.MID,它是計算機合成音樂的交換標(biāo)準(zhǔn),也是商業(yè)音樂作品發(fā)行的標(biāo)準(zhǔn)音樂合成MIDI音樂的制作與播放:音樂合成實時演奏MIDI鍵盤MIDI消息樂譜輸入音序器軟件MIDI文件媒體播放器MIDI合成器MIDI消息MIDI音樂音序器的軟件:音序器(sequencer)MIDI演奏器(如MIDI鍵盤)音樂合成音序器軟件的其他功能:對MIDI文件進(jìn)行修改和編輯,生成并打印樂譜,管理與檢索MIDI文件,播放MIDI樂曲等典型的音序器軟件:Cakewalk,Encore音樂合成MIDI文件在Windows系統(tǒng)中可以使用媒體播放器進(jìn)行播放。播放MIDI音樂的過程:媒體播放器軟件從磁盤上讀入MID文件把其中的一個個MIDI消息發(fā)送給聲卡上的音樂合成器由音樂合成器解釋并執(zhí)行MIDI消息所規(guī)定的操作合成出各種音色的音符,通過揚聲器播放出樂曲來音樂合成由PC計算機、聲卡、MIDI演奏器和音序器軟件等構(gòu)成的個人電腦音樂系統(tǒng),徹底改變了傳統(tǒng)的音樂制作方式和概念。原來需要由多人才能完成的工作現(xiàn)在只需一個人即可記錄音樂的方式也由原來的樂譜變成了MIDI文件音樂作品由修改困難變?yōu)榭扇我饩庉嬓薷膹姶蟮碾娔X編輯功能不僅提高了音樂表現(xiàn)的精確性,同時也降低了制作者對演奏技術(shù)的依賴性,使本屬于專業(yè)音樂工作者的音樂制作變成了一種大眾化的、個人的音樂行為和活動音樂合成轉(zhuǎn)換MIDI音樂與高保真的波形聲音相比:缺點:音質(zhì)方面較差無法合成出所有各種不同的聲音(例如語音)優(yōu)點:數(shù)據(jù)量很少(比CD-DA少3個數(shù)量級,比MP3少2個數(shù)量級)易于編輯修改可以與波形聲音同時播放音樂合成5.4數(shù)字視頻及應(yīng)用5.4.1基本知識視頻(video):指的是內(nèi)容隨時間變化的一個圖像序列,也稱為活動圖像(motionpicture)。常見的視頻有電視和計算機動畫。電視:能傳輸和再現(xiàn)真實世界的圖像與聲音,是當(dāng)代最有影響力的信息傳播工具。數(shù)字視頻:數(shù)字化的電視信號稱為數(shù)字視頻。計算機動畫:是計算機制作的圖像序列,是一種計算機合成的視頻?;靖拍铍娨暜嬅妫阂环N光柵掃描圖像,一般采用隔行掃描方式,即圖像由奇數(shù)場和偶數(shù)場兩部分組成,合起來組成一幀圖像PAL制式(中國采用)幀頻25幀/s,場頻50場/s,圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專業(yè)人才2024年薪金聘用協(xié)議書版
- 二零二五版冷鏈物流車輛貨物運輸安全協(xié)議2篇
- 二零二五年藝術(shù)品搬運運輸服務(wù)合同3篇
- 二零二五版數(shù)字經(jīng)濟產(chǎn)業(yè)發(fā)展合同范本2篇
- 2024施工合同匯集
- 二零二五年度鋼板租賃與節(jié)能減排服務(wù)協(xié)議3篇
- 個性化旅游顧問服務(wù)協(xié)議2024版版A版
- 2024版產(chǎn)品銷售協(xié)議6篇
- 二零二五年度高科技產(chǎn)業(yè)合伙人分家協(xié)議書3篇
- 二零二五年度智能工廠安全生產(chǎn)服務(wù)外包合同2篇
- 2024年山東省高考政治試卷真題(含答案逐題解析)
- 《用銳角三角函數(shù)解決問題(3)》參考課件
- 房地產(chǎn)營銷策劃 -佛山龍灣壹號學(xué)區(qū)房項目推廣策略提案方案
- 產(chǎn)品共同研發(fā)合作協(xié)議范本5篇
- 風(fēng)水學(xué)的基礎(chǔ)知識培訓(xùn)
- 吸入療法在呼吸康復(fù)應(yīng)用中的中國專家共識2022版
- 1-35kV電纜技術(shù)參數(shù)表
- 信息科技課程標(biāo)準(zhǔn)測(2022版)考試題庫及答案
- 施工組織設(shè)計方案針對性、完整性
- 2002版干部履歷表(貴州省)
評論
0/150
提交評論