版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
蘇州大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院第7章多媒體及應(yīng)用
目錄(1)*多媒體技術(shù)概述文本與文本處理圖像與圖形數(shù)字化音頻及應(yīng)用數(shù)字化視頻及應(yīng)用12345目錄(2)*多媒體制作開發(fā)工具簡介65*7.1多媒體技術(shù)概述1.媒體
媒體在計算機(jī)領(lǐng)域中主要有兩種含義:一是指用以存儲信息的實(shí)體,如磁帶、磁盤、光盤等;二是指用以承載信息的載體,如數(shù)字、文字、聲音、圖形、圖像、視頻等。2.多媒體和多媒體技術(shù)多媒體(Multimedia)是數(shù)字、文字、聲音、圖形、圖像、動畫和視頻等多種媒體信息的集合。
多媒體技術(shù)是指以數(shù)字化技術(shù)為基礎(chǔ),利用計算機(jī)綜合處理多媒體信息,使多種媒體信息之間建立邏輯關(guān)系,并連同多媒體設(shè)備一起集成為一個具有交互性能的應(yīng)用系統(tǒng)的技術(shù)。7.1.1多媒體概念7.1.2多媒體技術(shù)的特點(diǎn)1.集成性集成性是指將多種媒體信息有機(jī)地組織在一起,共同表達(dá)一個完整的多媒體信息,使這些媒體成為密切聯(lián)系的一體化系統(tǒng)。
2.交互性用戶可以通過鍵盤、鼠標(biāo)、觸摸屏等輸入設(shè)備來控制媒體的播放,實(shí)現(xiàn)了從“你播放我接收”的單向傳輸?shù)健拔尹c(diǎn)播你播放”的交互方式的改變。
3.實(shí)時性實(shí)時性是指多媒體系統(tǒng)中多種媒體間無論在時間上還是空間上都存在密切的關(guān)系,是具有同步性和協(xié)調(diào)性的群體。7.1.3多媒體系統(tǒng)的組成多媒體系統(tǒng)是指能夠提供交互式處理文本、聲音、圖像、視頻等多種媒體信息的計算機(jī)系統(tǒng),主要由四個部分組成。1.多媒體硬件系統(tǒng)2.多媒體操作系統(tǒng)3.媒體系統(tǒng)處理工具4.用戶應(yīng)用軟件返回目錄7.2文本與文本處理7.2.1西文字符的編碼1.標(biāo)準(zhǔn)ASCII編碼全稱為“AmericanStandardCodeforInformationInterchange(美國信息交換標(biāo)準(zhǔn)代碼)”。標(biāo)準(zhǔn)ASCII碼采用一個字節(jié)表示一個字符,但只使用其中的低7位,共表示128個字符,每個字節(jié)的最高位在計算機(jī)內(nèi)部通常保持為“0”。已被國際標(biāo)準(zhǔn)化組織(ISO)批準(zhǔn)為國際標(biāo)準(zhǔn),稱為ISO-646標(biāo)準(zhǔn)。7.2.1西文字符的編碼1.標(biāo)準(zhǔn)ASCII編碼【例7-1】下列特殊字符的編碼,其相互關(guān)系一般需要記住。字符’A’的編碼為1000001,對應(yīng)的十六進(jìn)制編碼為41H,對應(yīng)的十進(jìn)制編碼為65。字符’a’的編碼為1100001,對應(yīng)的十六進(jìn)制編碼為61H,對應(yīng)的十進(jìn)制碼為97。*2.?dāng)U充ASCII編碼使用8位二進(jìn)制數(shù)來表示字符的擴(kuò)充字符集??梢允褂?56種數(shù)字代碼表示更多的字符。在這些字符集中,從0~127的代碼與ASCII保持兼容,從128~255用于其它的字符和符號。擴(kuò)充出來的128個編碼稱為擴(kuò)展ASCII編碼,對應(yīng)的字符稱為擴(kuò)展ASCII字符。國際標(biāo)準(zhǔn)化組織的ISO8859標(biāo)準(zhǔn)得到了廣泛的使用。7.2.2漢字的編碼1.GB2312漢字編碼1980年發(fā)布的國家標(biāo)準(zhǔn),共收錄了6763個漢字和682個圖形符號,總計7445個字符。GB2312規(guī)定“對任意一個圖形字符都采用兩個字節(jié)表示,每個字節(jié)均采用七位編碼表示。”GB2312將編碼表分為94個區(qū),對應(yīng)第一字節(jié),每個區(qū)94個位,對應(yīng)第二字節(jié)。由區(qū)號和位號共同構(gòu)成區(qū)位碼。為了避免信息通訊中漢字區(qū)位碼與通訊控制碼的沖突,每個漢字的區(qū)號和位號必須分別加上32(即二進(jìn)制的00100000,十六進(jìn)制的20H),經(jīng)過這樣處理的代碼稱為漢字的國標(biāo)交換碼(簡稱國標(biāo)碼)。
為了區(qū)分漢字編碼和ASCII碼,將國標(biāo)碼的每個字節(jié)的最高位由0變?yōu)?,變換后的國標(biāo)碼稱為漢字機(jī)內(nèi)碼(簡稱機(jī)內(nèi)碼)。
漢字機(jī)內(nèi)碼、國標(biāo)碼、區(qū)位碼之間的關(guān)系為:國標(biāo)碼=區(qū)位碼+2020H機(jī)內(nèi)碼=國標(biāo)碼+8080H=區(qū)位碼+A0A0H
例如:“新”的區(qū)號為48,位號為34,其區(qū)位碼為4834,其二進(jìn)制表示為0011000000100010,其十六進(jìn)制為3022H?!靶隆钡膰鴺?biāo)碼為8066(5042H)?!靶隆钡臋C(jī)內(nèi)碼為D0C2H。7.2.2漢字的編碼2.GBK漢字編碼1995年發(fā)布了另一個漢字編碼標(biāo)準(zhǔn),其全稱為《漢字內(nèi)碼擴(kuò)展規(guī)范》,簡稱GBK。GBK也采用雙字節(jié)表示,GBK向下與GB2312完全兼容,向上支持ISO10646國際標(biāo)準(zhǔn)。在GBK中共收錄了21003個漢字和883個圖形符號,除了GB2312的全部漢字和符號外,還收錄了繁體字和生僻字。微軟公司的Windows簡體中文版操作系統(tǒng)XP就支持GBK編碼方案。
3.UCS/Unicode與GB18030漢字編碼國際標(biāo)準(zhǔn)化組織制定了一個能夠覆蓋幾乎任何語言的編碼表,稱為UCS(對應(yīng)的工業(yè)標(biāo)準(zhǔn)為Unicode),它的具體實(shí)現(xiàn)(如UTF-8和UTF-16)已在Windows、Unix、Linux操作系統(tǒng)中及許多Internet應(yīng)用中廣泛使用。
GB18030是我國政府于2000年發(fā)布了新的漢字編碼國家標(biāo)準(zhǔn)該標(biāo)準(zhǔn)收錄了27484個漢字,同時還收錄了藏文、蒙文、維吾爾文等少數(shù)名族文字,它向下兼容GB2312和GBK,并擴(kuò)充了UCS/Unicode中的字符,目前已在許多計算機(jī)系統(tǒng)和軟件中使用。4.BIG5漢字編碼GB2312、GBK和GB18030標(biāo)準(zhǔn)主要在我國大陸使用,中國臺灣、香港等地區(qū)還在使用繁體中文,他們制定了一套表示繁體中文的字符編碼,稱為“BIG5漢字編碼標(biāo)準(zhǔn)”(簡稱“大五碼”),采用雙字節(jié),但不兼容GB2312和GBK。7.2.3文本信息的輸入與輸出1.文本信息的輸入(1)人工輸入人工輸入又分為鍵盤輸入、手寫筆和語音輸入。人工鍵盤輸入是指用手工擊鍵方式按照一定的規(guī)律把漢字輸入到計算機(jī)。漢字輸入碼就是利用鍵盤輸入漢字時所用的編碼。目前常用的漢字輸入碼主要分為以下兩類。①音碼類②形碼類7.2.3文本信息的輸入與輸出1.文本信息的輸入(2)自動識別輸入文字的自動識別分為印刷體識別和手寫體識別兩大類:①印刷體識別利用光電掃描儀將印刷體的文本掃描成圖像,再通過專用的光學(xué)字符識別(OpticalCharacterRecognition,簡稱OCR)系統(tǒng)進(jìn)行文字識別,將漢字的圖像轉(zhuǎn)換成文本的形式,最后用“文件發(fā)送”或“導(dǎo)出”功能輸出到其他文檔編輯軟件中。這種輸入方法只能用于印刷體文字的輸入。受識別系統(tǒng)能力的限制,后期要做一些編輯修改工作。OCR軟件種類很多,常用的有清華紫光OCR、漢王OCR、蒙恬OCR等。②手寫體識別脫機(jī)手寫體漢字的識別難度很大,目前還不能達(dá)到實(shí)用階段。7.2.3文本信息的輸入與輸出*2.文本信息的輸出文本的輸出主要是顯示和打印可以把字符的形狀看成是一種圖形。漢字有很多字體,如宋體、楷體、黑體、隸書等,同一個漢字的字體不同,字的形狀也不同,為了輸出這些不同的漢字,以及同一個漢字的不同字體,要求把每一個漢字字形碼(又稱漢字字模)信息預(yù)先存放在計算機(jī)中。這些一定數(shù)量的字符形狀描述信息的集合稱為字形信息庫,簡稱字庫。要顯示或打印某個字符時,計算機(jī)根據(jù)該字符的機(jī)內(nèi)碼找到其在字庫中的位置,再取出其字形碼(字模)信息作為字形在屏幕上顯示或在打印機(jī)上輸出。漢字字形碼通常有兩種表示方式:點(diǎn)陣和矢量表示方式。7.2.4文本的常見格式1.簡單文本(純文本)簡單文本幾乎不包含任何格式信息和結(jié)構(gòu)信息。這種文本通常稱為純文本或ASCII文本,文件后綴名是TXT。2.豐富格式文本豐富文本格式文件也稱富文本格式(RichTextFormat,簡稱RTF)是由微軟公司開發(fā)的跨平臺文檔格式,以純文本描述內(nèi)容,能夠保存各種格式信息。
3.超文本超文本也稱為非線性文本,文本的組織結(jié)構(gòu)是網(wǎng)狀結(jié)構(gòu),即包含鏈接信息的豐富格式文本。
4.超媒體超媒體=超文本+多媒體。
7.2.5文本編輯、排版與處理1.文本編輯與排版文本編輯與排版功能,一般包括:(1)對字、詞、句、段落進(jìn)行添加、刪除、修改等操作;(2)文字的格式處理:設(shè)置字體、字號、字的排列方向、間距、顏色、效果等;(3)段落的格式處理:設(shè)置行距、段間距、段縮進(jìn)、對齊方式等;(4)表格制作和繪圖;(5)定義超鏈。(6)頁面布局。7.2.5文本編輯、排版與處理2.文本處理常用文本處理的有關(guān)內(nèi)容:(1)字?jǐn)?shù)統(tǒng)計,字頻統(tǒng)計、簡/繁體相互轉(zhuǎn)換、漢字/拼音相互轉(zhuǎn)換;(2)詞語排序,詞語錯誤檢測、文句語法檢查;(3)自動分詞,詞頻統(tǒng)計、詞性標(biāo)注、詞義辨識、大陸/臺灣術(shù)語轉(zhuǎn)換;(4)文本壓縮,文本加密、文本著作權(quán)保護(hù);(5)關(guān)鍵詞提取,文摘自動生成、文本分類;(6)文本檢索(關(guān)鍵詞檢索、全文檢索)、文本過濾;(7)文語轉(zhuǎn)換(語音合成)、文種轉(zhuǎn)換(機(jī)器翻譯);(8)篇章理解,自動問答、自動寫作等。7.2.5文本編輯、排版與處理3.常用文本處理軟件(1)面向通信的文本處理軟件
如微軟公司的OutlookExpress(2)面向辦公的文本處理軟件
微軟公司Office套件中的Word和我國自行開發(fā)的WPS(3)面向出版的文本處理軟件(4)面向網(wǎng)絡(luò)信息發(fā)布和電子出版的文本處理軟件
7.3圖像與圖形7.3圖像與圖形能夠被計算機(jī)處理的圖像為數(shù)字圖像。數(shù)字圖像按生成方式大致分為兩類:位圖圖像和矢量圖形。位圖圖像是指由掃描儀和數(shù)碼相機(jī)等輸入設(shè)備捕捉實(shí)際的畫面產(chǎn)生的數(shù)字圖像。也稱為取樣圖像或點(diǎn)陣圖像,常簡稱為圖像。矢量圖形又稱為矢量圖像,常稱為圖形,一般是指通過計算機(jī)繪圖軟件生成的矢量圖形。矢量圖形文件存儲的是描述生成圖形的指令,因此不必對圖形中每一點(diǎn)進(jìn)行數(shù)字化處理。7.3.1圖像的獲取與數(shù)字化1.?dāng)?shù)字圖像獲取設(shè)備數(shù)字圖像獲取設(shè)備的功能是將現(xiàn)實(shí)的景物輸入到計算機(jī)內(nèi)并以取樣圖像的形式表示。2D圖像獲取設(shè)備(如掃描儀、數(shù)碼相機(jī)等)只能對圖片或景物的2D投影進(jìn)行數(shù)字化,3D掃描儀則能獲取包括深度信息在內(nèi)的3D景物的信息。7.3.1圖像的獲取與數(shù)字化2.圖像的數(shù)字化圖像獲取的過程實(shí)質(zhì)上是模擬信號的數(shù)字化過程,具體的處理步驟大致分為以下四步:7.3.1圖像的獲取與數(shù)字化2.圖像的數(shù)字化(1)掃描將畫面劃分成M×N個網(wǎng)格,每個網(wǎng)格即一個取樣點(diǎn),又稱像素。這樣,一幅模擬圖像就轉(zhuǎn)換為M×N個取樣點(diǎn)組成的矩陣。(2)分色將彩色圖像取樣點(diǎn)的顏色通過一種特殊的棱鏡分解成三個基色,如紅,綠,藍(lán)三種顏色。如果不是彩色圖像,則不必進(jìn)行分色。(3)取樣通過圖像傳感元件將每個取樣點(diǎn)(像素)的每個分量(基色)的亮度值轉(zhuǎn)換成與其成比例的電壓值(灰度值)。(4)量化將取樣得到的每個分量的電壓值進(jìn)行模數(shù)轉(zhuǎn)換,即把模擬量的電壓值使用數(shù)字量(一般為8~12位正整數(shù))來表示。
7.3.2圖像的基本參數(shù)1.顏色模型在對圖像進(jìn)行數(shù)字化時,首先將圖像離散成若干行和若干列的像素點(diǎn),然后將每個點(diǎn)用二進(jìn)制的顏色編碼表示。圖像中的顏色編碼可以使用不同的顏色模型,顏色模型又稱為顏色空間,是指彩色圖像所使用的顏色描述方法。常用的顏色模型有:RGB(紅、綠、藍(lán))、CMYK(青藍(lán)、洋紅、黃、黑)、YUV(亮度、色度)等。從理論上講這些顏色模型都可以互相轉(zhuǎn)換。
7.3.2圖像的基本參數(shù)2.圖像分辨率一個圖像取樣后得到的像素數(shù)目稱為圖像分辨率,是用于表示圖像大小的一個參數(shù),一般表示為“水平分辨率×垂直分辨率”的形式,其中水平分辨率表示圖像在水平方向的像素數(shù),垂直分辨率表示圖像在垂直方向的像素數(shù),如800×600,1024×768等。對于一個相同尺寸的圖像,組成該圖的像素數(shù)量越多,說明圖像的分辨率越高,看起來就越逼真,相應(yīng)地,圖像文件占用的存儲空間也越大;相反,像素數(shù)量越少,圖像文件占用的存儲空間少了,但圖像顯得越粗糙。7.3.2圖像的基本參數(shù)3.位平面數(shù)目即矩陣的數(shù)目,也就是彩色分量的數(shù)目,如RGB的位平面數(shù)是3,而CMYK的位平面數(shù)是4。4.像素深度即像素的所有顏色分量的二進(jìn)制位數(shù)之和,它決定了不同顏色或亮度的最大數(shù)目。例如24位真彩色,每種顏色分別用8位二進(jìn)制數(shù)表示,其像素深度是8+8+8=24,它可以表示224,即16777216(約1600萬)種不同的顏色。7.3.3圖像的壓縮一幅圖像的數(shù)據(jù)量的計算公式是:圖像數(shù)據(jù)量=水平分辨率×垂直分辨率×像素深度/8(單位為字節(jié))以表7-2中1024×768的圖像為例,未經(jīng)壓縮的24位(真彩色)圖像的數(shù)據(jù)量計算方法如下:圖像數(shù)據(jù)量=1024×768×24/8B=2.25MB7.3.3圖像的壓縮如果對圖像進(jìn)行壓縮,則一幅圖像的數(shù)據(jù)量為:圖像數(shù)據(jù)量=未壓縮前的圖像數(shù)據(jù)量/圖像壓縮的倍數(shù)【例7-2】一架數(shù)碼相機(jī),其Flash存儲器容量為20MB,它一次可以連續(xù)拍攝像素深度16位(65536色)的1024×1024的彩色相片40張,計算其圖像數(shù)據(jù)的壓縮倍數(shù)。(1024×1024×16×40)/(20×1024×1024×8)=4圖像壓縮分為兩種類型,一種是無損壓縮,另一種是有損壓縮。7.3.4常用圖像格式1.BMP格式BMP(Bitmap,位圖)是微軟公司在Windows環(huán)境下的一種標(biāo)準(zhǔn)圖像文件格式,是一種通用的圖像格式,文件的擴(kuò)展名為“.bmp”。BMP可以有多種彩色模式,如4位、16位、24位真彩色,最新版本的BMP格式允許32位真彩色。由于BMP文件占用存儲空間較大,所以一般在單機(jī)上比較流行,而在Internet上使用得較少。2.GIF格式GIF格式的特點(diǎn)是壓縮比高,磁盤空間占用較少,但不能存儲超過256色的圖像,是Internet上常用的文件格式之一。由于GIF圖像文件短小、下載速度快、可用許多具有同樣大小的圖像文件組成動畫。
7.3.4常用圖像格式3.JPEG格式JPEG是JointPhotographicExpertsGroup(聯(lián)合圖像專家組)的縮寫,文件后輟名為.jpg或.jpeg,是最常用的圖像文件格式。目前各類瀏覽器均支持JPEG這種圖像格式,因?yàn)镴PEG格式的文件尺寸較小,下載速度快,是網(wǎng)絡(luò)上最受歡迎的圖像格式之一。4.TIFFTIFF(TagImageFileFormat)是Mac中廣泛使用的圖像格式,它由Aldus和微軟聯(lián)合開發(fā),文件的擴(kuò)展名為“.tif”。它的特點(diǎn)是圖像格式復(fù)雜、存貯信息多。非常有利于原稿的復(fù)制。5.PNG格式PNG(Portable
NetworfGraphics)的原名為“可移植性網(wǎng)絡(luò)圖像”,是網(wǎng)上接受的最新圖像文件格式。7.3.5圖像處理與應(yīng)用1.?dāng)?shù)字圖像處理數(shù)字圖像處理是指利用計算機(jī)技術(shù)對圖像進(jìn)行降噪、增強(qiáng)、復(fù)原、分割、提取特征、壓縮、存儲、管理、檢索等操作。2.圖像處理軟件Windows操作系統(tǒng)附件中的畫圖軟件(paint)和映像軟件(Imageforwindows)Office中的MicrosoftPhotoEditor和PictureManager軟件還有Adobe公司的Photoshop、IllustratorUlead公司的Paintshop、PhotoImpactAcdSystem公司的ACDSee軟件
7.3.5圖像處理與應(yīng)用3.?dāng)?shù)字圖像的應(yīng)用數(shù)字圖像處理在通信、遙感、電視、出版、廣告、工業(yè)生產(chǎn)、醫(yī)療診斷、電子商務(wù)等領(lǐng)域得到了廣泛的應(yīng)用,例如:(1)圖像通信,包括傳真、電視電話、電視會議等。(2)遙感。對航空遙感或衛(wèi)星遙感圖像進(jìn)行處理加工,用于礦藏勘探、地理資源調(diào)查、自然災(zāi)害預(yù)測,環(huán)境污染檢測,氣象預(yù)報等。(3)醫(yī)療診斷。例如,利用X射線、超聲、計算機(jī)斷層掃描(CT)、核磁共振等技術(shù)形成成圖像,進(jìn)行病理分析和疾病診斷。(4)工業(yè)生產(chǎn)應(yīng)用。如產(chǎn)品質(zhì)量檢測,生產(chǎn)過程自動控制等。(5)機(jī)器人視覺。(6)軍事、公安、檔案管理等方面的應(yīng)用。7.3.6計算機(jī)圖形與應(yīng)用1.計算機(jī)圖形矢量圖形又稱為矢量圖像,常稱為圖形,一般是指通過計算機(jī)繪圖軟件生成的矢量圖形。圖形通常是由計算機(jī)模擬產(chǎn)生的,可以是各種具體實(shí)在的物體,如家俱,房屋,機(jī)械零件等,也可以是假想的事物,如天氣形勢,人口分布,經(jīng)濟(jì)增長趨勢等。計算機(jī)圖形學(xué)研究的是用計算機(jī)模型來生成真實(shí)或想象中物體的圖像。在計算機(jī)中為物體建模的方法很多,它與物體的類型有密切關(guān)系。7.3.6計算機(jī)圖形與應(yīng)用1.計算機(jī)圖形以普通工業(yè)產(chǎn)品為例,它們可使用基本的幾何元素(如點(diǎn)、線、面、體等)及表面材料的性質(zhì)等進(jìn)行描述,所建立的模型稱為幾何模型,這在工業(yè)品的計算機(jī)輔助設(shè)計/制造(CAD/CAM)中有著重要的應(yīng)用。在現(xiàn)實(shí)世界中,有許多景物是很難使用幾何模型來描述的,例如山脈、云彩、海浪、煙火、樹木等。對于這些景物,需要找出它們的生成規(guī)律,使用相應(yīng)的算法來描述其規(guī)律,這種模型稱為過程模型或景物模型。7.3.6計算機(jī)圖形與應(yīng)用2.計算機(jī)圖形學(xué)的應(yīng)用計算機(jī)圖形的主要應(yīng)用領(lǐng)域有:(1)圖形用戶界面(2)計算機(jī)輔助設(shè)計與制造(CAD/CAM)(3)事務(wù)和商務(wù)數(shù)據(jù)的圖形展示(4)地形地貌和自然資源的圖形顯示(5)過程控制及系統(tǒng)環(huán)境模擬(6)電子出版及辦公室自動化7.3.6計算機(jī)圖形與應(yīng)用3.常用計算機(jī)繪圖軟件AutoCAD、MAPInfo、ARCInfo等專用領(lǐng)域的繪圖軟件通用的辦公事務(wù)處理、平面設(shè)計、桌面出版所涉及的二維繪圖軟件,如Corel公司的CorelDraw,Adobe公司的Illustrator,Macromedia公司的FreeHand,微軟公司的MicrosoftViso等。7.4數(shù)字化音頻及應(yīng)用7.4.1聲音的數(shù)字化1.基本概念聲音是一種波,它由許多不同頻率的諧波組成。按頻率可分為次聲(頻率低于20Hz)、超聲(頻率高于20kHz)和可聽聲(頻率在20Hz~20kHz),次聲和超聲是人耳無法聽到的。多媒體技術(shù)處理的聲音主要是人耳可聽到的20Hz~20kHz的音頻信號,稱為全頻帶聲音。人說話的聲音的頻率大致在300Hz~3000Hz之間,稱為語音;其他聲音,如音樂,即各種樂器產(chǎn)生的聲音;大自然物理現(xiàn)象產(chǎn)生的聲音,如刮風(fēng)、下雨、打雷等;還有人工產(chǎn)生的爆破聲以及機(jī)器運(yùn)轉(zhuǎn)發(fā)出的聲音、各種動物的叫聲等等。7.4.1聲音的數(shù)字化2.聲音信號的數(shù)字化聲音是模擬信號,為了使用計算機(jī)進(jìn)行處理,必須將它轉(zhuǎn)換為二進(jìn)制數(shù)字編碼的形式,這個過程稱為聲音信號的數(shù)字化。波形編碼是最常用的一種聲音信號數(shù)字化的處理方式,它直接對音頻信號的時域或頻域進(jìn)行取樣量化編碼,處理過程如圖7-9所示。7.4.1聲音的數(shù)字化(1)取樣所謂取樣就是每隔一定時間間隔在聲音波形上取一個幅度值,把時間上連續(xù)的信號變?yōu)闀r間上離散的信號。該時間間隔稱為取樣周期。取樣周期的倒數(shù)稱取樣頻率,即每秒鐘的取樣次數(shù)。如44.1khz表示將1秒鐘的聲音用44100個取樣點(diǎn)數(shù)據(jù)表示,取樣頻率越高,數(shù)字化音頻的質(zhì)量越高,但數(shù)據(jù)量也越大。(2)量化量化是將每個取樣點(diǎn)的幅度值以數(shù)字存儲。聲音信號的量化位數(shù)一般取8位,12位或16位,量化位數(shù)越高,聲音的保真度越好。量化位數(shù)是另一個影響聲音質(zhì)量的重要指標(biāo),它決定了表示聲音振幅的精度。(3)編碼編碼是將取樣和量化后的數(shù)字?jǐn)?shù)據(jù)以一定的格式記錄下來。編碼的方式很多,常用的編碼方式是脈沖編碼調(diào)制(PulseCodeModulation,簡稱PCM),其主要優(yōu)點(diǎn)是抗干擾能力強(qiáng),失真小、傳輸特性穩(wěn)定,但編碼的數(shù)據(jù)量比較大。7.4.2聲音的獲取設(shè)備與播放1.聲音的獲取設(shè)備聲音的獲取設(shè)備包括話筒(麥克風(fēng))和聲卡。話筒的作用是將聲波信號轉(zhuǎn)換為電信號,然后由聲卡進(jìn)行數(shù)字化。聲卡是多媒體技術(shù)中最基本的組成部分,是實(shí)現(xiàn)聲波/數(shù)字信號相互轉(zhuǎn)換的硬件。聲卡既參與聲音的獲取,也負(fù)責(zé)聲音的重建,它控制并完成聲音的輸入與輸出。2.聲音的播放計算機(jī)輸出聲音的過程稱為聲音的播放,一般分為兩步:先把聲音從數(shù)字信號形式轉(zhuǎn)換為模擬信號形式,這個過程稱為聲音的重建;然后再將模擬信號經(jīng)過處理和放大后送到揚(yáng)聲器發(fā)出聲音。聲音的重建也由聲卡完成。7.4.3聲音的技術(shù)指標(biāo)和壓縮標(biāo)準(zhǔn)1.聲音的技術(shù)指標(biāo)數(shù)字化的波形聲音的質(zhì)量技術(shù)指標(biāo)有:取樣頻率、量化位數(shù)、聲道數(shù)、使用的壓縮編碼方法以及比特率。聲道數(shù)指聲音通道的個數(shù)。單聲道只記錄和產(chǎn)生一個波形;雙聲道產(chǎn)生兩個波形,也即立體聲,存儲空間是單聲道的兩倍。比特率也稱為碼率,它指的是每秒鐘的數(shù)據(jù)量。7.4.3聲音的技術(shù)指標(biāo)和壓縮標(biāo)準(zhǔn)1.聲音的技術(shù)指標(biāo)波形聲音未壓縮前,波形聲音的碼率計算公式為:波形聲音的碼率=取樣頻率(Hz)×量化位數(shù)(bit)×聲道數(shù)壓縮編碼后的碼率則為壓縮前的碼率除以壓縮倍數(shù)?!纠?-3】用44.1kHz的取樣頻率,量化位數(shù)為16,錄制1秒鐘的立體聲(雙聲道)節(jié)目,其聲音文件的數(shù)據(jù)量為:44.1×1000×16×2b/s=1411200b/s=1411.2kb/s=1411.2/8kB/s=176.4kB/s7.4.3聲音的技術(shù)指標(biāo)和壓縮標(biāo)準(zhǔn)2.聲音的壓縮標(biāo)準(zhǔn)波形聲音經(jīng)過數(shù)字化之后數(shù)據(jù)量很大,以CD盤片上所存儲的立體聲高保真的全頻帶數(shù)字音樂為例,1小時的數(shù)據(jù)量大約是635MB。為了降低存儲成本和提高通信效率(降低傳輸帶寬),對數(shù)字波形聲音進(jìn)行數(shù)據(jù)壓縮是十分必要的。波形聲音的數(shù)據(jù)壓縮也是完全可能的。其依據(jù)是聲音信號中包含大量的冗余信息,再加上人具有聽覺感知特性,因此,產(chǎn)生了許多壓縮算法。7.4.4聲音文件的常見格式1.WAV(.wav)文件WAV是微軟公司開發(fā)的一種聲音文件存儲格式,是PC機(jī)上最為流行的聲音文件格式。2.MPEG(.mp1/.mp2/.mp3)文件采用MPEG-1
Audio
Layer
3標(biāo)準(zhǔn)壓縮的聲音文件稱為mp3格式文件
mp3文件具有尺寸小,音質(zhì)相對較好,制作簡單、便于交換等優(yōu)點(diǎn),非常適合在網(wǎng)上傳播,是目前使用最多的音頻格式文件。3.WMA(.wma)文件WMA的全稱是WindowsMediaAudio,是微軟力推的一種音頻格式。4.RealAudio文件(.ra、.rm、ram)5.MIDI(.mid)文件7.4.5計算機(jī)合成聲音1.計算機(jī)合成音樂計算機(jī)合成音樂是指計算機(jī)自動演奏樂曲。計算機(jī)的聲卡一般都帶有音源,音源也稱為“音樂合成器”,相當(dāng)于樂器,可以模仿幾十種樂器的聲音。樂譜在計算機(jī)中既不用簡譜也不用五線譜表示,而是用一種叫MIDI的音樂描述語言來表示。計算機(jī)中支持MIDI音樂播放的軟件就相當(dāng)于演奏人員,例如WindowsMediaPlayer、RealPlayer等。7.4.5計算機(jī)合成聲音2.計算機(jī)合成語音計算機(jī)合成語音就是利用計算機(jī)模仿人把一段文字朗讀出來,這個過程稱為文語轉(zhuǎn)換(TTS)。計算機(jī)合成語音有很多方面的應(yīng)用。例如,股票交易、航班動態(tài)查詢、電話報稅等;又如有聲E-mail服務(wù);CAI課件或游戲解說詞的自動配音;文稿校對、語言學(xué)習(xí)、語音秘書、自動報警、殘疾人服務(wù)等。7.5數(shù)字化視頻及應(yīng)用7.5.1視頻基礎(chǔ)1.基本概念視頻分為數(shù)字視頻和模擬視頻。數(shù)字視頻簡稱DV(Digitalvideo),是指以數(shù)字化方式表示連續(xù)變化的圖像信息。現(xiàn)在出現(xiàn)的VCD、DVD和數(shù)字便攜攝像機(jī)都是數(shù)字視頻。模擬視頻是指信號在時間和幅度上連續(xù)的信號,早期的電視、錄像機(jī)、攝像機(jī)中采用的就是模擬視頻。模擬電視制式是國際上通用的電視顯示標(biāo)準(zhǔn),世界上主要使用的電視廣播制式有PAL、NTSC和SECAM三種。7.5.1視頻基礎(chǔ)2.?dāng)?shù)字視頻計算機(jī)處理的對象是數(shù)字視頻。數(shù)字視頻與模擬視頻相比有很多優(yōu)點(diǎn)。例如,復(fù)制和傳輸時不會造成質(zhì)量下降、容易編輯修改、有利于傳輸、可節(jié)省頻率資源等。視頻信號的數(shù)字化過程比聲音要復(fù)雜。PC機(jī)中用于視頻信號數(shù)字化的插卡是視頻采集卡,簡稱視頻卡。它能將模擬視頻信號及其伴音信號進(jìn)行數(shù)字化然后存儲在硬盤中。在數(shù)字化的同時,視頻圖像經(jīng)過彩色空間轉(zhuǎn)換(由YUV轉(zhuǎn)換為RGB)與計算機(jī)圖形顯示卡產(chǎn)生的圖像疊加,用戶就可以在顯示器上觀看到視頻內(nèi)容。7.5.1視頻基礎(chǔ)2.?dāng)?shù)字視頻數(shù)字?jǐn)z像頭是一種在線獲取數(shù)字視頻的設(shè)備。數(shù)字?jǐn)z像頭通過光學(xué)鏡頭和CCD器件采集圖像,然后直接將圖像轉(zhuǎn)換成數(shù)字信號并輸入到計算機(jī),不再需要使用專門的視頻采集卡。數(shù)字?jǐn)z像頭有分辨率、鏡頭視角、幀率等主要技術(shù)參數(shù)。大多數(shù)數(shù)字?jǐn)z像頭采用CCD傳感器,有些產(chǎn)品采用CMOS類型的光傳感器,雖然分辨率不高,但功耗低、速度快。數(shù)字?jǐn)z像頭的接口大多采用USB接口,有些采用高速的IEEE1394接口。7.5.1視頻基礎(chǔ)2.?dāng)?shù)字視頻數(shù)字?jǐn)z像機(jī)是一種離線的數(shù)字視頻獲取設(shè)備。它通過將CCD轉(zhuǎn)換光信號得到的視頻信號進(jìn)行A/D轉(zhuǎn)換,得到數(shù)字視頻信號,然后經(jīng)過數(shù)字信號處理、數(shù)據(jù)壓縮,最終可輸出壓縮的數(shù)字視頻信號。數(shù)字?jǐn)z像機(jī)輸出的圖像質(zhì)量較好,高清晰度的數(shù)字?jǐn)z像機(jī)可達(dá)720線,是高清晰度數(shù)字電視(HDTV)標(biāo)準(zhǔn)中最高級的一種。7.5.2視頻壓縮編碼1.MPEG-1MPEG-1主要適用于VCD、數(shù)碼相機(jī)和數(shù)字?jǐn)z像機(jī)等,也可用于數(shù)字電話網(wǎng)絡(luò)上的視頻傳輸,如視頻點(diǎn)播(VOD)等。2.MPEG-2MPEG-2主要針對數(shù)字電視(DTV)的應(yīng)用要求,碼率為1.5Mb/s~60Mb/s甚至更高。MPEG-2最顯著的特點(diǎn)是通用性,它保持了與MPEG-1向下兼容。7.5.2視頻壓縮編碼3.MPEG-4與MPEG-1和MPEG-2相比,MPEG-4的特點(diǎn)是更注重多媒體系統(tǒng)的交互性和靈活性。
MPEG-4主要應(yīng)用于可視電話、可視電子郵件以及遠(yuǎn)程監(jiān)視和控制等。4.MPEG-7和MPEG-21MPEG-7并不是一種壓縮編碼方法,而是一種多媒體內(nèi)容描述接口,它不針對某個具體的應(yīng)用。MPEG-7可應(yīng)用于數(shù)字圖書館、多媒體查詢服務(wù)、廣播媒體選擇和多媒體編輯等。MPEG-21的正式名稱是“多媒體框架”或“數(shù)字視聽框架”,其目的是為所有使用多媒體信息的用戶提供透明而有效的電子交易和使用環(huán)境,使用戶能以各種方式使用分布在全球不同設(shè)備上的各種各樣的多媒體信息。7.5.3數(shù)字視頻的常見格式1.AVI格式Windows視頻標(biāo)準(zhǔn)格式文件。AVI兼容性好、使用方便、圖像質(zhì)量好,但文件體積太大。
2.MOV格式MOV文件是美國Apple公司開發(fā)的一種視頻格式。其最大的特點(diǎn)是跨平臺性,即不僅支持Mac操作系統(tǒng),同樣也能支持Windows操作系統(tǒng)。一般認(rèn)為MOV格式文件的圖像質(zhì)量好于AVI格式。3.MPEG格式MPEG文件是按照MPEG標(biāo)準(zhǔn)壓縮的全屏視頻的標(biāo)準(zhǔn)文件。目前很多視頻處理軟件都支持這種格式的文件。7.5.2視頻壓縮編碼4.DAT格式DAT文件是一種為VCD及卡拉OKCD專用的視頻文件格式,采用MPEG壓縮、解壓縮。計算機(jī)配備視頻卡或安裝解壓縮程序就可以進(jìn)行播放。5.RM格式RM(Rea
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 重點(diǎn)中學(xué)德育工作計劃
- 2025年下學(xué)期小學(xué)一年級班主任工作計劃
- 體育鍛煉小計劃
- 采購人員年終總結(jié)及計劃范文
- 2025初二工作計劃范文
- 英語六級復(fù)習(xí)計劃不求高分只求通過
- 《歌唱基本常識》課件
- 《電工電子技術(shù)基礎(chǔ)》課件-第1章
- 《大眾汽車社會責(zé)任》課件
- 通道門安全協(xié)議書范本
- 裝修逾期索賠合同范例
- 【MOOC】全新版大學(xué)進(jìn)階英語綜合教程II-內(nèi)蒙古大學(xué) 中國大學(xué)慕課MOOC答案
- 印刷保密協(xié)議
- 輔導(dǎo)員年終匯報
- 中國當(dāng)代文學(xué)專題-003-國開機(jī)考復(fù)習(xí)資料
- 【MOOC】綜合英語-中南大學(xué) 中國大學(xué)慕課MOOC答案
- 2025年1月“八省聯(lián)考”考前猜想卷歷史試題02 含解析
- 人教版2025九年級道德與法治中考備考復(fù)習(xí)計劃
- 農(nóng)村集體經(jīng)濟(jì)組織內(nèi)部控制制度
- 淮陰工學(xué)院《供應(yīng)鏈管理3》2022-2023學(xué)年第一學(xué)期期末試卷
- 預(yù)防校園欺凌主題班會課件(共36張課件)
評論
0/150
提交評論