




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第4章多媒體技術(shù)基礎(chǔ)主要內(nèi)容:§4.1多媒體的概念§4.2光盤(pán)存儲(chǔ)系統(tǒng)§4.3多媒體音頻信號(hào)處理§4.4多媒體圖像信息處理§4.5計(jì)算機(jī)圖形處理技術(shù)簡(jiǎn)介§4.6多媒體視頻信息處理本章小結(jié)思考與練習(xí)§4.1多媒體的概念4.1.1媒體的分類(lèi)在計(jì)算機(jī)領(lǐng)域中媒體有兩種含義:一種是指用以存儲(chǔ)信息的實(shí)體(媒質(zhì));另一種是指信息的載體。多媒體計(jì)算機(jī)技術(shù)中的媒體是指后者。媒體可分為以下五種,如圖4-1所示。(1)感覺(jué)媒體(perception)(2)表示媒體(presentation)(3)顯示媒體(display)(4)存儲(chǔ)媒體(storage)(5)傳輸媒體(transmission)§4.1多媒體的概念§4.1多媒體的概念圖4-1國(guó)際標(biāo)準(zhǔn)將媒體分為
五種類(lèi)型各種媒體之間的關(guān)系如圖4-2所示?!?.1多媒體的概念圖4-2各種媒體之間的關(guān)系4.1.2多媒體與多媒體技術(shù)1.多媒體的定義通常所指的多媒體就是各種感覺(jué)媒體的組合,也就是聲音、圖像、圖形、動(dòng)畫(huà)、文字、數(shù)據(jù)、文件等各種媒體的組合。定義1:所謂多媒體技術(shù)就是計(jì)算機(jī)交互式綜合處理多種媒體信息——文本、圖形、圖像和聲音,使多種信息建立邏輯連接,集成為一個(gè)系統(tǒng)并具有交互性。定義2:所謂多媒體就是在數(shù)值、文字、圖形等由計(jì)算機(jī)處理的信息中,使靜止圖像、語(yǔ)音、影像等時(shí)間序列信息相互關(guān)聯(lián),同步處理的技術(shù)?!?.1多媒體的概念2.多媒體技術(shù)多媒體技術(shù)是指利用計(jì)算機(jī)綜合處理多種媒體信息的技術(shù)。3.多媒體技術(shù)的主要特性信息媒體的多樣性、多種技術(shù)的集成性和處理過(guò)程的交互性。4.多媒體的關(guān)鍵技術(shù)大容量數(shù)據(jù)存儲(chǔ)技術(shù)、多媒體數(shù)據(jù)壓縮編碼與解碼技術(shù)、虛擬現(xiàn)實(shí)技術(shù)、多媒體數(shù)據(jù)庫(kù)技術(shù)、智能多媒體技術(shù)、多媒體信息檢索?!?.1多媒體的概念4.1.3多媒體計(jì)算機(jī)系統(tǒng)1.多媒體計(jì)算機(jī)系統(tǒng)的層次結(jié)構(gòu)§4.1多媒體的概念圖4-3多媒體計(jì)算機(jī)
系統(tǒng)的組成2.多媒體計(jì)算機(jī)的硬件系統(tǒng)多媒體計(jì)算機(jī)硬件系統(tǒng)由多媒體計(jì)算機(jī)主機(jī)、多媒體接口卡、多媒體外部設(shè)備、光盤(pán)存儲(chǔ)器、網(wǎng)絡(luò)接口卡等組成。一個(gè)常見(jiàn)的多媒體硬件系統(tǒng)如圖4-4所示。§4.1多媒體的概念圖4-4多媒體
計(jì)算機(jī)硬件系統(tǒng)§4.2光盤(pán)存儲(chǔ)系統(tǒng)4.2.1光盤(pán)及其特點(diǎn)光盤(pán)存儲(chǔ)系統(tǒng)由光盤(pán)和光盤(pán)驅(qū)動(dòng)器組成。光盤(pán)存儲(chǔ)系統(tǒng)具有一切存儲(chǔ)介質(zhì)的優(yōu)點(diǎn),如大容量、耐用、易保存、標(biāo)準(zhǔn)化等。CD意為高密盤(pán),稱(chēng)之為光盤(pán),因?yàn)樗峭ㄟ^(guò)光學(xué)方式來(lái)記錄和讀取二進(jìn)制信息的?!?.2光盤(pán)存儲(chǔ)系統(tǒng)4.2.2光盤(pán)的標(biāo)準(zhǔn)與類(lèi)型由于光盤(pán)能存儲(chǔ)不同類(lèi)型的數(shù)據(jù),包括音頻和視頻數(shù)據(jù)、計(jì)算機(jī)程序等,而這些數(shù)據(jù)的組織方式各有不同,由此制定了一些國(guó)際標(biāo)準(zhǔn),以適應(yīng)多媒體的各種應(yīng)用?!?.2光盤(pán)存儲(chǔ)系統(tǒng)按光盤(pán)的讀寫(xiě)性能來(lái)講,可分為三種類(lèi)型:1.只讀型光盤(pán)存儲(chǔ)器只讀光盤(pán)中的數(shù)據(jù)是用壓模或化學(xué)刻寫(xiě)方法制成的,用戶只能讀取上面的數(shù)據(jù),而不能寫(xiě)入或修改光盤(pán)中的數(shù)據(jù)。2.一次可寫(xiě)光盤(pán)存儲(chǔ)器一次性可寫(xiě)光盤(pán)的每一個(gè)記憶單元只可以寫(xiě)入一次,不可抹去。3.多次可擦寫(xiě)光盤(pán)存儲(chǔ)器多次可擦寫(xiě)光盤(pán)具有磁盤(pán)一樣的可擦寫(xiě)性,允許用戶存儲(chǔ)、移動(dòng)、修改光盤(pán)上的數(shù)據(jù),適合作為計(jì)算機(jī)的新型標(biāo)準(zhǔn)外存設(shè)備。§4.2光盤(pán)存儲(chǔ)系統(tǒng)4.2.3光盤(pán)系統(tǒng)記錄與讀取信息的原理光盤(pán)系統(tǒng)是由光盤(pán)驅(qū)動(dòng)器和光盤(pán)盤(pán)片組成。光盤(pán)的讀取信息的過(guò)程是基于物理學(xué)的“光反射”原理,以圖4-5所示的CD-ROM光盤(pán)讀取過(guò)程為例。光盤(pán)是一種多層材料組成的圓盤(pán)結(jié)構(gòu)。以CD-ROM為例,其物理結(jié)構(gòu)如圖4-6所示?!?.2光盤(pán)存儲(chǔ)系統(tǒng)§4.2光盤(pán)存儲(chǔ)系統(tǒng)圖4-5光盤(pán)數(shù)據(jù)讀取原理圖4-6CD-ROM的剖面結(jié)構(gòu)CD-ROM只讀光盤(pán)是利用在盤(pán)上壓制凹坑的機(jī)械辦法,利用凹坑(Pit)和平面(Land)部分來(lái)記錄“0”和“1”。CD-R光盤(pán)增加了一層有機(jī)染料作為記錄層。CD-RW記錄原理為在光盤(pán)的記錄層鍍上一層結(jié)晶層,這個(gè)結(jié)晶層的特色是能呈現(xiàn)出結(jié)晶與非結(jié)晶的狀態(tài),借助于激光的照射,可在這兩種狀態(tài)之間互換,而這兩種狀態(tài)也對(duì)光的反射不同,產(chǎn)生的0與1的信號(hào),經(jīng)過(guò)解碼器分析后,獲得所需的數(shù)據(jù)?!?.2光盤(pán)存儲(chǔ)系統(tǒng)§4.3多媒體音頻信號(hào)處理4.3.1音頻信號(hào)的形式音頻(Audio)信號(hào)可分為兩類(lèi):語(yǔ)音信號(hào)和非語(yǔ)音信號(hào)。根據(jù)物理學(xué)原理,聲音是一種在時(shí)間和幅度上都是連續(xù)的波形,是一種模擬信號(hào)。模擬音頻信號(hào)有兩個(gè)重要參數(shù):頻率和幅度。人們?cè)谌粘Uf(shuō)話時(shí)的語(yǔ)音信號(hào)頻率范圍在300Hz~3000Hz之間。頻率范圍為20Hz~20kHz的信號(hào)稱(chēng)為音頻(audio)。信號(hào)的幅度是從信號(hào)的基線到當(dāng)前波峰的距離。周期是指信號(hào)在兩個(gè)峰點(diǎn)或谷底之間的相對(duì)時(shí)間。周期和頻率之間的關(guān)系是互為倒數(shù)。(如圖4-7所示)§4.3多媒體音頻信號(hào)處理§4.3多媒體音頻信號(hào)處理圖4-7聲音的幅度和周期4.3.2音頻的數(shù)字化過(guò)程模擬音頻信號(hào)的數(shù)字化過(guò)程需要三個(gè)步驟:采樣、量化和編碼。1.聲音的采樣聲音的采樣就是按一定的時(shí)間間隔將聲音波形在時(shí)間軸(即橫軸)上進(jìn)行分割,把時(shí)間和幅度上都是連續(xù)的模擬信號(hào)轉(zhuǎn)化成時(shí)間上離散、幅度連續(xù)的信號(hào)(圖4-9a)。采樣頻率越高,即采樣的間隔時(shí)間越短,則在單位時(shí)間內(nèi)計(jì)算機(jī)得到的聲音樣本數(shù)據(jù)就越多,對(duì)聲音波形的表示越精確,聲音的保真度也越好,但所要求的存儲(chǔ)空間也越大。§4.3多媒體音頻信號(hào)處理2.量化我們把對(duì)聲波波形幅度的數(shù)字化表示稱(chēng)之為“量化”,如圖4-9b所示。量化把采樣后在幅度軸上連續(xù)取值(模擬量)的每一個(gè)樣本轉(zhuǎn)換為離散值表示?!?.3多媒體音頻信號(hào)處理圖4-9聲音的采樣和量化示意圖3.編碼編碼就是按照一定的格式把經(jīng)過(guò)采樣和量化后得到的離散數(shù)據(jù)記錄下來(lái),并在有用的數(shù)據(jù)中加入一些用于糾錯(cuò)、同步和控制的數(shù)據(jù)。4.數(shù)字化音頻文件的存儲(chǔ)容量計(jì)算采樣頻率、量化位數(shù)、聲道數(shù)的值越大,形成的數(shù)字音頻文件也就越大。數(shù)字音頻文件的存儲(chǔ)量以字節(jié)為單位,模擬波形聲音被數(shù)字化后音頻文件的存儲(chǔ)量為:存儲(chǔ)量(字節(jié))=采樣頻率(Hz)×量化位數(shù)/8×聲道數(shù)×?xí)r間(秒)§4.3多媒體音頻信號(hào)處理4.3.3數(shù)字音頻的文件格式所謂格式,可以理解為數(shù)碼信息的組織方式。一段模擬音頻經(jīng)過(guò)數(shù)字化處理后,所產(chǎn)生的數(shù)碼信息可以用各種編碼格式編排,而形成一個(gè)個(gè)音頻格式文件。1.WAV格式2.CD-DA格式3.MPEG音頻文件——MP3MPEG音頻文件的壓縮是一種有損壓縮,根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度的不同可分為三層,分別對(duì)應(yīng)MP1、MP2和MP3這三種聲音文件?!?.3多媒體音頻信號(hào)處理4.VOC文件5.其他格式除了上面介紹之外,還有WMA(WindowsMediaAudio)格式(*.wma);為解決網(wǎng)絡(luò)傳輸帶寬資源而設(shè)計(jì)的,被認(rèn)為是網(wǎng)絡(luò)靈魂的文件格式Realaudio(*.RA/*.RM)和蘋(píng)果公司開(kāi)發(fā)的,被Macintosh平臺(tái)和應(yīng)用程序所支持的文件格式AIFF(*.AIF/*.AIFF)等。以上介紹的都是數(shù)字音頻格式,很多人熟悉的MIDI格式并不在其中。4.3.4語(yǔ)音信號(hào)處理技術(shù)語(yǔ)音信號(hào)處理的應(yīng)用極為廣泛,其中的主要技術(shù)包括語(yǔ)音編碼、語(yǔ)音合成、語(yǔ)音識(shí)別和語(yǔ)音增強(qiáng)等?!?.3多媒體音頻信號(hào)處理語(yǔ)音識(shí)別技術(shù)(AutomaticSpeechRecognition)是指將人說(shuō)話的語(yǔ)音信號(hào)轉(zhuǎn)換為可被計(jì)算機(jī)識(shí)別的文字信息,從而識(shí)別說(shuō)話人的語(yǔ)音指令以及文字內(nèi)容的技術(shù)。語(yǔ)音識(shí)別系統(tǒng)的模型通常由聲學(xué)模型和語(yǔ)言模型兩部分組成,分別對(duì)應(yīng)于語(yǔ)音到音節(jié)概率的計(jì)算和音節(jié)到字概率的計(jì)算,語(yǔ)言模型主要采用概率統(tǒng)計(jì)的方法來(lái)揭示語(yǔ)言單位內(nèi)在的統(tǒng)計(jì)規(guī)律。語(yǔ)音合成技術(shù)(TexttoSpeech)是指將文字信息轉(zhuǎn)變?yōu)檎Z(yǔ)音數(shù)據(jù),以語(yǔ)音的方式播放出來(lái)的技術(shù)?!?.3多媒體音頻信號(hào)處理§4.4多媒體圖像信息處理4.4.1計(jì)算機(jī)圖像處理的概念現(xiàn)代圖像既包括可見(jiàn)圖像(VisibleIimage,可見(jiàn)光范圍的圖像),也包括不可見(jiàn)光范圍內(nèi)借助于適當(dāng)轉(zhuǎn)換裝置轉(zhuǎn)換成人眼可見(jiàn)的圖像(如紅外成像技術(shù)),還包括視覺(jué)無(wú)法觀察的其他物理圖像和空間物體圖像,以及由數(shù)學(xué)函數(shù)和離散數(shù)據(jù)所描述的連續(xù)或離散圖像。計(jì)算機(jī)圖像處理研究的主要內(nèi)容是如何對(duì)一幅連續(xù)圖像取樣、量化以產(chǎn)生數(shù)字圖像,如何對(duì)數(shù)字圖像做各種變換以方便處理,如何濾去圖像中的無(wú)用噪聲,如何壓縮圖像數(shù)據(jù)以便存儲(chǔ)和傳輸、圖像邊緣提取、特征增強(qiáng)和提取、計(jì)算機(jī)視覺(jué)和模式識(shí)別等?!?.4多媒體圖像信息處理§4.4多媒體圖像信息處理4.4.2顏色模型1.RGB模型基色是指互為獨(dú)立的單色,任一基色都不能由其他兩種基色混合產(chǎn)生。自然界常見(jiàn)的各種顏色,都可以由紅(Red)、綠(Gre-
en)、藍(lán)(Blue)三種顏色光按不同比例相配而成。2.CMYK顏色模型CMY模型(Cyan、Magenta、Yellow)是采用青、粉紅、黃色三種基本顏色按一定比例合成顏色的方法。雖然理論上利用CMY三原色混合可以制作出所需要的各種色彩,但實(shí)際上同量的CMY混合后并不能產(chǎn)生完善的黑色或灰色?!?.4多媒體圖像信息處理4.4.3圖像的數(shù)字化過(guò)程1.圖像的采樣數(shù)字化圖像的形成是計(jì)算機(jī)使用相應(yīng)的軟硬件技術(shù)把許多像素點(diǎn)的特征數(shù)據(jù)組織成行列,整齊地排列在一個(gè)矩形區(qū)域內(nèi),形成計(jì)算機(jī)可以識(shí)別的圖像。圖像采樣就是將二維空間上連續(xù)的圖像用許多等距的水平線與豎直線分割成網(wǎng)狀的過(guò)程(如圖4-12所示)。被分割的圖像若水平方向有M個(gè)間隔,垂直方向上有N個(gè)間隔,則一幅圖像畫(huà)面就被表示成M×N個(gè)離散像素點(diǎn)構(gòu)成的集合,M×N表示圖像的分辨率??梢詫⑦B續(xù)變化的二維圖像用f(x,y)函數(shù)離散值的形式表示出來(lái)?!?.4多媒體圖像信息處理在進(jìn)行采樣時(shí),采樣點(diǎn)的間隔的選取是一個(gè)重要的問(wèn)題。它決定了采樣后的圖像是否能真實(shí)地反映原圖像的程度。圖4-13給出在不同采樣頻率下獲得不同的圖像效果。圖4-12采樣是對(duì)圖像在水平方向和垂直方向上分割成網(wǎng)狀結(jié)構(gòu)§4.4多媒體圖像信息處理圖4-13不同采樣頻率獲得不同的圖像效果2.圖像的量化圖像量化實(shí)際就是將圖像采樣后的樣本值的范圍分為有限多個(gè)段,把落入某段中的所有樣本值用同一值表示,是用有限的離散數(shù)值量來(lái)代替無(wú)限的連續(xù)模擬量的一種映射操作。圖像可表示的量化級(jí)數(shù)(顏色數(shù)或灰度值)就為2的冪次方,即28、216位、224
種顏色。量化字長(zhǎng)越大,所得到的量化級(jí)數(shù)也就越多,則越能真實(shí)地反映原有圖像的顏色。圖像文件的大小與圖像的分辨率和圖像顏色深度有關(guān)。一幅未經(jīng)壓縮的圖像文件的存儲(chǔ)容量可以按照下面的公式進(jìn)行估算:圖像存儲(chǔ)容量(字節(jié))=分辨率×顏色深度/8§4.4多媒體圖像信息處理§4.4多媒體圖像信息處理4.4.4圖像的壓縮與編碼1.圖像信息為什么能壓縮從信息論的角度來(lái)看,壓縮就是去掉信息中的冗余,即保留不確定的信息,去除確定的信息(可推知的),也就是用一種更接近信息本質(zhì)的描述來(lái)代替原有冗余的描述。連續(xù)多幀畫(huà)面在很大程度上是相似的,而這些相似的信息(或稱(chēng)作冗余信息)為數(shù)據(jù)的壓縮提供了基礎(chǔ)。人的視覺(jué)和聽(tīng)覺(jué)對(duì)某些信號(hào)(如顏色,聲音)不那么敏感的生理特性,至使信息被壓縮之后還不知不覺(jué),也不至對(duì)壓縮后的信息產(chǎn)生誤解。2.數(shù)據(jù)壓縮與編碼分類(lèi)(1)數(shù)據(jù)壓縮:分為有損壓縮和無(wú)損壓縮兩類(lèi)無(wú)損壓縮算法是為保留原始多媒體對(duì)象而設(shè)計(jì)的。有損壓縮會(huì)造成一些信息的損失,關(guān)鍵問(wèn)題是看這種損失對(duì)圖像質(zhì)量帶來(lái)的影響。(2)經(jīng)典壓縮編碼:通常有預(yù)測(cè)編碼、變換編碼和統(tǒng)計(jì)編碼三種類(lèi)型預(yù)測(cè)編碼根據(jù)離散信號(hào)之間存在著一定的相關(guān)性,利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一信號(hào)進(jìn)行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)值的差進(jìn)行編碼。變換編碼的基本方法是將數(shù)字圖像分成一定大小的子圖像塊,用某種變換對(duì)子像塊進(jìn)行變換,得到變換域中的系數(shù)矩陣,然后選用其中的主要系數(shù)進(jìn)行量化和編碼。統(tǒng)計(jì)編碼就是根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼?!?.4多媒體圖像信息處理3.行程編碼行程長(zhǎng)度編碼,用RLE(RunLengthEncoding)表示,具有相同顏色并且是連續(xù)的像素?cái)?shù)目稱(chēng)為行程長(zhǎng)度。RLE所能獲得的壓縮比有多大,主要取決于圖像本身的特點(diǎn)。RLE編碼方法特別適用于由計(jì)算機(jī)生成的圖像,對(duì)于減少圖像文件的存儲(chǔ)空間非常有效?!?.4多媒體圖像信息處理§4.4多媒體圖像信息處理4.4.5圖像文件格式1.BMPBMP文件是一種與設(shè)備無(wú)關(guān)的圖像文件,它是Windows軟件推薦使用的一種格式。2.JPEGJPEG是按圖像專(zhuān)家聯(lián)合組制訂的壓縮標(biāo)準(zhǔn),JPEG使用一種有損壓縮算法,無(wú)損壓縮算法能在解壓后準(zhǔn)確再現(xiàn)壓縮前的圖像,而有損壓縮則犧牲了一部分的圖像數(shù)據(jù)來(lái)達(dá)到較高的壓縮率。3.GIFGIF是由CompuServe公司為了制定彩色圖像傳輸協(xié)議而開(kāi)發(fā)的圖像格式文件。4.PSD格式PSD是著名的Adobe公司的圖像處理軟件Photoshop的專(zhuān)用格式。5.TIFF格式TIFF稱(chēng)為標(biāo)記圖像文件格式。它是Alaus和Microsoft公司為掃描儀和桌面出版系統(tǒng)研制開(kāi)發(fā)的較為通用的圖像文件格式。6.PNG格式PNG是一種新興的網(wǎng)絡(luò)圖像格式。7.其他格式§4.4多媒體圖像信息處理§4.5計(jì)算機(jī)圖形處理技術(shù)簡(jiǎn)介4.5.1計(jì)算機(jī)圖形處理的概述計(jì)算機(jī)圖形處理是指利用由概念或數(shù)學(xué)描述所表示物體的幾何數(shù)據(jù)或幾何模型,用計(jì)算機(jī)進(jìn)行顯示并存儲(chǔ),并可以進(jìn)行修改、完善以及有關(guān)操作的過(guò)程。圖形主要分為兩類(lèi)。一是基于線條信息表示的;二是反映物體表面屬性或材質(zhì)的灰度顏色等非幾何要素。圖形處理技術(shù)的主要應(yīng)用領(lǐng)域是計(jì)算機(jī)輔助設(shè)計(jì)和制造、計(jì)算機(jī)教育、計(jì)算機(jī)藝術(shù)、計(jì)算機(jī)模擬、計(jì)算機(jī)可視化、計(jì)算機(jī)動(dòng)畫(huà)和虛擬現(xiàn)實(shí)?!?.5計(jì)算機(jī)圖形處理技術(shù)簡(jiǎn)介4.5.2計(jì)算機(jī)圖形處理包括的內(nèi)容如何在計(jì)算機(jī)中表示圖形、以及利用計(jì)算機(jī)進(jìn)行圖形的建模、計(jì)算、處理和顯示的相關(guān)原理與算法,構(gòu)成了計(jì)算機(jī)圖形學(xué)的主要研究?jī)?nèi)容。主要有:幾何變換,如平移、旋轉(zhuǎn)、縮放、透視和投影等;曲線和曲面擬合;建模或造型;隱藏線隱藏面消除;陰暗處理;紋理產(chǎn)生;渲染?!?.5計(jì)算機(jī)圖形處理技術(shù)簡(jiǎn)介§4.5計(jì)算機(jī)圖形處理技術(shù)簡(jiǎn)介(a)由Matlab軟件生成的三維曲面(b)3DMAX動(dòng)畫(huà)軟件中生成的三維模型圖4-18三維圖形模型示例4.5.3圖形與圖像處理技術(shù)的區(qū)別與聯(lián)系計(jì)算機(jī)圖形學(xué)是指將點(diǎn)、線、面、曲面等實(shí)體生成物體的模型,然后模型存放在計(jì)算機(jī)里,并可修改、合并、改變模型和選擇視點(diǎn)來(lái)顯示模型的一門(mén)學(xué)科。計(jì)算機(jī)圖形技術(shù)主要應(yīng)用于CAD、物理實(shí)體建模、可視化、虛擬現(xiàn)實(shí),以及計(jì)算機(jī)動(dòng)畫(huà)、游戲等領(lǐng)域。圖形學(xué)的逆過(guò)程是分析和識(shí)別輸入的圖像并從中提取二維或三維的數(shù)據(jù)模型(特征)。圖像處理技術(shù)是采用計(jì)算機(jī)外部輔助設(shè)備(如掃描儀、視頻采集裝置等)輸入的圖像像素?cái)?shù)據(jù)進(jìn)行處理、壓縮、傳輸?shù)囊婚T(mén)計(jì)算機(jī)技術(shù)?!?.5計(jì)算機(jī)圖形處理技術(shù)簡(jiǎn)介在實(shí)際應(yīng)用中,圖形圖像技術(shù)是相互關(guān)聯(lián)的。把圖形處理技術(shù)和圖像處理技術(shù)相結(jié)合可以使視覺(jué)效果和質(zhì)量更加完善,更加精美。4.5.4矢量圖和位圖的比較客觀世界中,圖可分為兩類(lèi)。一類(lèi)是可見(jiàn)的圖像。另一類(lèi)是可用數(shù)學(xué)公式或模型描述的圖形。由此對(duì)應(yīng)的圖文件有兩種,一種是存儲(chǔ)圖形信息的矢量圖(VectorGraphics)文件,另一種是存儲(chǔ)圖像信息的位圖(BitGraphics)文件?!?.5計(jì)算機(jī)圖形處理技術(shù)簡(jiǎn)介矢量圖主要是把圖形元素當(dāng)作矢量來(lái)處理。矢量圖形的特點(diǎn)是精度高、靈活性大,并且用它們?cè)O(shè)計(jì)出來(lái)的作品可以任意放大、縮小而不變形失真。靜態(tài)圖像亦稱(chēng)為位圖,它指的是由掃描儀、數(shù)碼相機(jī)等圖像采集設(shè)備捕捉實(shí)際的畫(huà)面產(chǎn)生的數(shù)字圖像,是由像素點(diǎn)陣構(gòu)成的點(diǎn)陣圖。§4.5計(jì)算機(jī)圖形處理技術(shù)簡(jiǎn)介§4.6多媒體視頻信息處理§4.6多媒體視頻信息處理4.6.1視頻的定義視頻(video)就其本質(zhì)而言,實(shí)際上就是其內(nèi)容隨時(shí)間變化的一組動(dòng)態(tài)圖像(25或30幀/秒),所以視頻又叫做運(yùn)動(dòng)圖像或活動(dòng)圖像。由圖4-19可見(jiàn),視頻由一幅幅連續(xù)的圖像幀序列構(gòu)成,沿時(shí)間軸若一幀圖像保持一個(gè)時(shí)間段Δt,利用人眼的視覺(jué)暫留作用,可形成連續(xù)運(yùn)動(dòng)圖像(即視頻)的感覺(jué)。圖像與視頻是兩個(gè)既有聯(lián)系又有區(qū)別的概念:靜止的圖片稱(chēng)為圖像(Image),運(yùn)動(dòng)的圖像稱(chēng)為視頻(Video)?!?.6多媒體視頻信息處理視頻與動(dòng)畫(huà)都是動(dòng)態(tài)的圖像,其主要區(qū)別在于幀圖像畫(huà)面的產(chǎn)生方式的不同。圖4-19視頻由連續(xù)的圖像幀序列構(gòu)成§4.6多媒體視頻信息處理4.6.2視頻的分類(lèi)按照處理方式的不同,視頻分為:1.模擬視頻(AnalogVideo)模擬視頻是一種用于傳輸圖像和聲音的并且隨時(shí)間連續(xù)變化的電信號(hào)。2.數(shù)字視頻(DigitalVideo-DV)要使計(jì)算機(jī)能夠?qū)σ曨l進(jìn)行處理,必須把視頻源轉(zhuǎn)換成計(jì)算機(jī)要求的數(shù)字視頻形式并存放在磁盤(pán)上。4.6.3電視信號(hào)制式1.NTSC制NTSC是美國(guó)國(guó)家電視系統(tǒng)委員會(huì)在1953年制定的一種兼容的彩色電視制式,是目前常用的視頻標(biāo)準(zhǔn),在美國(guó)、日本和其他國(guó)家廣為使用。2.PAL制PAL是聯(lián)邦德國(guó)1962年制定的一種兼容電視制式。3.SECAMSECAM稱(chēng)為順序傳送彩色與存儲(chǔ),是用于法國(guó)、俄羅斯及幾個(gè)東歐國(guó)家的彩色電視制式。§4.6多媒體視頻信息處理4.6.4YUV彩色模型在PAL彩色電視制式中采用YUV模型來(lái)表示彩色圖像。其中Y表示亮度,U,V用來(lái)表示色差,是構(gòu)成彩色的兩個(gè)分量(如圖4-20所示)?!?.6多媒體視頻信息處理圖4-20PAL彩色電視制式中采用YUV模型來(lái)表示彩色圖像4.6.5視頻的數(shù)字化過(guò)程視頻數(shù)字化是將模擬視頻信號(hào)經(jīng)模數(shù)轉(zhuǎn)換和彩色空間變換轉(zhuǎn)為計(jì)算機(jī)可處理的數(shù)字信號(hào)。在電腦上通過(guò)視頻采集卡可以接收來(lái)自視頻輸入端的模擬視頻信號(hào),對(duì)該信號(hào)進(jìn)行采集、量化成數(shù)字信號(hào),然后壓縮編碼成數(shù)字視頻(圖4-21)。視頻數(shù)字化操作更多的是對(duì)視頻進(jìn)行各種數(shù)字化的錄制、編輯、處理、格式轉(zhuǎn)換的過(guò)程?!?.6多媒體視頻信息處理§4.6多媒體視頻信息處理圖4-21視頻采集卡的作用4.6.6數(shù)字電視系統(tǒng)數(shù)字電視(DigitalTelevision)系統(tǒng)包括前端系統(tǒng)、傳輸網(wǎng)絡(luò)和接收終端,是一個(gè)從節(jié)目采集、節(jié)目制作、節(jié)目傳輸直到用戶端都以數(shù)字方式處理信號(hào)的端到端的系統(tǒng)。根據(jù)信號(hào)的空間傳播方式,數(shù)字電視主要包括四種形式:數(shù)字電視地面?zhèn)鬏斚到y(tǒng)、數(shù)字有線電視系統(tǒng)、數(shù)字衛(wèi)星電視系統(tǒng)、IP數(shù)字電視系統(tǒng)。國(guó)際電聯(lián)(ITU-T)給出的定義是:“高清晰度電視應(yīng)是一個(gè)透明系統(tǒng),一個(gè)正常視力的觀眾在距該系統(tǒng)顯示屏高度的三倍距離上所看到的圖像質(zhì)量應(yīng)具有觀看原始景物或表演時(shí)所得到的印象?!薄?.6多媒體視頻信息處理HDTV采用了全數(shù)字信號(hào)傳輸?!?.6多媒體視頻信息處理圖4-22不同制式的縱橫比屏幕效果比較(電影《指環(huán)王3》截圖)(a)NTSC或PAL制式的縱橫比為4∶3(b)HDTV標(biāo)準(zhǔn)規(guī)定的縱橫比為16∶94.6.7H.264視頻編解碼標(biāo)準(zhǔn)H.264標(biāo)準(zhǔn)的主要目標(biāo)是:與其他現(xiàn)有的視頻編碼標(biāo)準(zhǔn)相比,在相同的帶寬下提供更加優(yōu)秀的圖像質(zhì)量。H.264標(biāo)準(zhǔn)的主要特點(diǎn)如下:(1)更高的編碼效率,同其他視頻編碼效率相比,能夠平均節(jié)省大于50%的碼率。(2)高質(zhì)量的視頻畫(huà)面,H.264能夠在低碼率情況下提供高質(zhì)量的視頻圖像。(3)提高網(wǎng)絡(luò)適應(yīng)能力,H.264可以工作在實(shí)時(shí)通信應(yīng)用(如視頻會(huì)議)低延時(shí)模式下,也可以工作在沒(méi)有延時(shí)的視頻存儲(chǔ)或視頻流服務(wù)器中。§4.6多媒體視頻信息處理H.264最大的優(yōu)勢(shì)是具有很高的數(shù)據(jù)壓縮比率,在同等圖像質(zhì)量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。§4.6多媒體視頻信息處理4.6.8常見(jiàn)的視頻文件格式1.本地影像視頻(1)AVI格式AVI即音頻視頻交錯(cuò)格式。AVI格式允許視頻和音頻交錯(cuò)在一起同步播放,其優(yōu)點(diǎn)是圖像質(zhì)量好,可以跨多個(gè)平臺(tái)使用,缺點(diǎn)是壓縮標(biāo)準(zhǔn)不統(tǒng)一,不具有兼容性。(2)MOV格式默認(rèn)的播放器是Apple公司的QuickTimePlayer。它具有較高的壓縮比率和較完美的視頻清晰度等特點(diǎn),但是其最大的特點(diǎn)還是跨平臺(tái)性?!?.6多媒體視頻信息處理(3)MPEG/MPG/DAT格式MPEG即動(dòng)態(tài)圖像專(zhuān)家組格式,是運(yùn)動(dòng)圖像壓縮算法的國(guó)際標(biāo)準(zhǔn),現(xiàn)已被幾乎所有的計(jì)算機(jī)平臺(tái)共同支持。MPEG采用有損壓縮方法減少運(yùn)動(dòng)圖像中的冗余信息,從而達(dá)到高壓縮比(最高可達(dá)200∶1)的目的,同時(shí)圖像和音響的質(zhì)量也非常好,兼容性相當(dāng)好。2.網(wǎng)絡(luò)影像視頻(1)FLVFLV是FLASHVIDEO的簡(jiǎn)稱(chēng),F(xiàn)LV流媒體格式是隨著FlashMX的推出發(fā)展而來(lái)的視頻格式?!?.6多媒體視頻信息處理由于它形成的文件極小、加載速度極快,使得網(wǎng)絡(luò)觀看視頻文件成為可能,它的出現(xiàn)有效地解決了視頻文件導(dǎo)入Flash后,使導(dǎo)出的SWF文件體積龐大,不能在網(wǎng)絡(luò)上很好的使用等缺點(diǎn)。(2)WMV格式WMV也是微軟推出的一種采用獨(dú)立編碼方式并且可以直接在網(wǎng)上實(shí)時(shí)觀看視頻節(jié)目的文件壓縮格式。(3)RM格式對(duì)符合RealMedia規(guī)范的網(wǎng)絡(luò)音頻/視頻資源進(jìn)行實(shí)況轉(zhuǎn)播,并且RealMedia可以根據(jù)不同的網(wǎng)絡(luò)傳輸速率制定出不同的壓縮比率,從而實(shí)現(xiàn)在低速率的網(wǎng)絡(luò)上進(jìn)行影像數(shù)據(jù)實(shí)時(shí)傳送和播放?!?.6多媒體視頻信息處理(4)3GP3GP是一種3G流媒體的視頻編碼格式,主要是為了配合3G網(wǎng)絡(luò)的高傳輸速度而開(kāi)發(fā)的?!?.6多媒體視頻信息處理目前,具有多媒體功能的計(jì)算機(jī)越來(lái)越普及,其中最廣泛、最基本的是多媒體個(gè)人計(jì)算機(jī)(MPC)。多媒體計(jì)算機(jī)使得計(jì)算機(jī)的外部設(shè)備日益豐富。通過(guò)多媒體計(jì)算機(jī),人們可以處理聲音、視頻圖像(靜態(tài)、動(dòng)態(tài))等各種媒體信息。我們現(xiàn)在所說(shuō)的“多媒體”,常常不是指多種媒體本身,而主要是指處理和應(yīng)用它的一整套技術(shù)。通常多媒體技術(shù)是指把文字、音頻、視頻、圖形、圖像、動(dòng)畫(huà)等多媒體信息通過(guò)計(jì)算機(jī)進(jìn)行數(shù)字化采集、獲取、壓縮/解壓縮、編輯、存儲(chǔ)等加工處理,再以單獨(dú)或合成形式表現(xiàn)出來(lái)的一體化技術(shù)。本章小結(jié)本章介紹了多媒體技術(shù)的基本概念和主要媒體在計(jì)算機(jī)中的信息表示方式與數(shù)字化過(guò)程。內(nèi)容涉及光盤(pán)存儲(chǔ)技術(shù)、音頻數(shù)字化過(guò)程及處理、圖像數(shù)字化過(guò)程及處理、對(duì)視頻信息獲取與處理的基本原理。無(wú)論何種媒體形式,其數(shù)字化過(guò)程都是一致的,即包括采樣、量化和編碼三個(gè)步驟。模擬量是連續(xù)量,而數(shù)字量是離散量,因此采樣是將在時(shí)間上連續(xù)的模擬量離散化。量化操作實(shí)質(zhì)上是用有限的離散量在取值空間上取代無(wú)限的連續(xù)模擬量的映射操作。為減少數(shù)字化后的存儲(chǔ)容量,一般對(duì)多媒體數(shù)據(jù)都要進(jìn)行壓縮和編碼。本章小結(jié)一、思考與練習(xí)1.什么是媒體?媒體是如何分類(lèi)的?2.什么是多媒體?多媒體技術(shù)有哪些關(guān)鍵特性?3.一個(gè)完整的多媒體計(jì)算機(jī)系統(tǒng)包括哪幾個(gè)層次的結(jié)構(gòu)?4.相對(duì)于其他存儲(chǔ)介質(zhì)而言,光盤(pán)存儲(chǔ)具有哪些特點(diǎn)?5.常見(jiàn)的光盤(pán)標(biāo)準(zhǔn)是如何劃分的?可分為哪些類(lèi)型?6.DVD與藍(lán)光DVD能夠?qū)崿F(xiàn)大容量存儲(chǔ)的原因是什么?7.簡(jiǎn)述光盤(pán)系統(tǒng)記錄與讀取信息的原理。8.可刻錄光盤(pán)(CD
R)是如何寫(xiě)入與存儲(chǔ)信息的?9.什么是音頻信號(hào)?決定音頻信號(hào)波形的參數(shù)有哪些?10.常見(jiàn)的數(shù)字音頻文件有哪些?11.計(jì)算機(jī)語(yǔ)音信號(hào)處理技術(shù)已經(jīng)介入到日常生活中,請(qǐng)列舉幾例應(yīng)用說(shuō)明它的用途。12.什么是計(jì)算機(jī)圖像處理?13.圖像的數(shù)字化過(guò)程的基本步驟是什么?思考與練習(xí)14.圖像的采樣與分辨率的關(guān)系是什么?15.什么圖像量化?量化級(jí)數(shù)與量化字長(zhǎng)有什么關(guān)系?16.常見(jiàn)的數(shù)字圖像文件有哪些?17.什么是RGB彩色模型?它與CMYK
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度全面薪酬激勵(lì)辦公室職員勞動(dòng)合同
- 2025年中國(guó)燃油切斷閥市場(chǎng)調(diào)查研究報(bào)告
- 2025年中國(guó)滅苗型空氣凈化柜市場(chǎng)調(diào)查研究報(bào)告
- 2025年中國(guó)水槽實(shí)驗(yàn)臺(tái)市場(chǎng)調(diào)查研究報(bào)告
- 二零二五年度物業(yè)管理員勞動(dòng)合同違約責(zé)任解析
- 2025年中國(guó)汽車(chē)裝具膠粘劑市場(chǎng)調(diào)查研究報(bào)告
- 紙箱進(jìn)貨合同范本
- 采購(gòu)合同與招標(biāo)合同范本
- 2025年中國(guó)房間置物架組合市場(chǎng)調(diào)查研究報(bào)告
- 2025年中國(guó)平房雙扇門(mén)市場(chǎng)調(diào)查研究報(bào)告
- 合規(guī)管理體系實(shí)務(wù)培訓(xùn)測(cè)試題附有答案
- 常見(jiàn)癥狀-黃疸課件
- 節(jié)后復(fù)工安全培訓(xùn)的事故案例分析與教訓(xùn)
- 五子棋基礎(chǔ)入門(mén)課件
- 課程思政融入專(zhuān)業(yè)課程的
- 涉密人員專(zhuān)題培訓(xùn)課件
- 浙江游戲產(chǎn)業(yè)園可行性方案
- 提升辦公室工作效能的經(jīng)驗(yàn)交流發(fā)言模板
- 胃癌影像診斷課件
- 建筑工程勞務(wù)作業(yè)服務(wù)方案
- 教育興則國(guó)家興教育強(qiáng)則國(guó)家強(qiáng)心得
評(píng)論
0/150
提交評(píng)論