多媒體技術(shù)復(fù)習(xí)_第1頁
多媒體技術(shù)復(fù)習(xí)_第2頁
多媒體技術(shù)復(fù)習(xí)_第3頁
多媒體技術(shù)復(fù)習(xí)_第4頁
多媒體技術(shù)復(fù)習(xí)_第5頁
已閱讀5頁,還剩99頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章多媒體基礎(chǔ)1、媒體聲音媒體圖像媒體2、數(shù)據(jù)壓縮理論數(shù)據(jù)冗余數(shù)據(jù)壓縮分類第一頁,共104頁。第一頁,共104頁。1.1媒體媒體是信息表示和傳輸?shù)妮d體,是一個(gè)重要的概念。多媒體(multimedia)是融合兩種以上媒體的人機(jī)交互式信息交流和傳播媒體。ITU-TI.374建議將媒體劃分為感覺媒體、表示媒體、顯示媒體、存儲(chǔ)媒體和傳輸媒體5類。通常認(rèn)為多媒體中的連續(xù)媒體(聲音和電視圖像)是人與機(jī)器交互的最自然的媒體。多媒體技術(shù)是將計(jì)算機(jī)技術(shù)、通信技術(shù)和電視技術(shù)三種技術(shù)融合在一起的新技術(shù),俗稱“3C合一”。第二頁,共104頁。第二頁,共104頁。聲音信號(hào)的頻率

1)小于20Hz的信號(hào)稱為亞音信號(hào)或次音信號(hào)2)20Hz~20kHz的信號(hào)稱為音頻信號(hào)3)高于20kHz的信號(hào)稱為超音頻信號(hào)或稱超聲波信號(hào)4)300~3400Hz稱為話音信號(hào)

人的聽覺器官能感知的聲音頻率大約在20~20000Hz之間。在這種頻率范圍里感知的聲音幅度大約在0~120dB之間聲音媒體第三頁,共104頁。第三頁,共104頁。聲音的質(zhì)量主要體現(xiàn)在音調(diào)與聲音的頻率有關(guān)音強(qiáng)與波形震動(dòng)的幅度(聲波壓力)有關(guān)音色與基音和諧音的組合有關(guān)第四頁,共104頁。第四頁,共104頁。等響曲線人類的聽覺特性曲線,是反映人們對(duì)聲音振幅范圍心理因素的曲線,每條曲線上對(duì)應(yīng)于不同頻率的聲壓級(jí)是不相同的,但人耳感覺到的響應(yīng)卻是一樣,因此稱為等響曲線,每條曲線上注有一個(gè)數(shù)字,為響度單位。又稱為Fletcher-Munson(弗萊徹—芒森曲線)曲線。第五頁,共104頁。第五頁,共104頁。等響曲線第六頁,共104頁。第六頁,共104頁。掩蔽效應(yīng)一種頻率的聲音阻礙聽覺系統(tǒng)感受另一種頻率的聲音的現(xiàn)象稱為掩蔽效應(yīng)。掩蔽可分成:時(shí)域掩蔽頻域掩蔽第七頁,共104頁。第七頁,共104頁。圖像的顏色模型常見模型:

RGB彩色模型CMY彩色模型YUV彩色模型YIQ彩色模型HSI彩色模型第八頁,共104頁。第八頁,共104頁。RGB彩色空間顏色=R(紅色百分比)+G(綠色百分比)+B(藍(lán)色百分比)第九頁,共104頁。第九頁,共104頁。一幅彩色圖像可以看成是由許多點(diǎn)組成的圖像中的每個(gè)點(diǎn)稱為像素點(diǎn)(pixel)每個(gè)像素點(diǎn)都有一個(gè)像素值,表示特定的顏色強(qiáng)度像素值往往用R、G、B三個(gè)分量表示第十頁,共104頁。第十頁,共104頁。CMY彩色空間Cyan(青色),Magenta(品紅),Yellow(黃)-CMY任何一種顏色都可以用三種基本顏料按一定的比例混合得到。用這種方法產(chǎn)生的顏色稱為相減色CMY主要用于印刷和打印系統(tǒng)圖1-2第十一頁,共104頁。第十一頁,共104頁。YUV彩色空間由廣播電視需求的推動(dòng)而開發(fā)的彩色空間,主要目的是為了壓縮色度信息以便有效的播送彩色電視圖像。Y為亮度信號(hào),U、V是色差信號(hào)(B-Y,R-Y)

U和V構(gòu)成彩色的兩個(gè)分量。PAL模擬彩色電視采用的彩色空間。優(yōu)點(diǎn)是亮度和色差信號(hào)分離,容易使彩色電視系統(tǒng)與黑白電視信號(hào)兼容。第十二頁,共104頁。第十二頁,共104頁。YIQ彩色空間NTSC制式的模擬彩色電視采用的彩色空間Y是亮度,I和Q是兩個(gè)彩色分量,共同描述圖象的色調(diào)和飽和度。亮度與色差分離,可以更有效的壓縮圖像的數(shù)據(jù)量第十三頁,共104頁。第十三頁,共104頁。HSI彩色空間用H(Hue,色調(diào))、S(Saturation,飽和度)、I(Intensity,光強(qiáng)度)表示一種顏色一種直觀的顏色模型,更適合人的視覺特性。HSL(Hue,Saturation,Lightness)HSI(HSL)RGB第十四頁,共104頁。第十四頁,共104頁。1.2數(shù)據(jù)壓縮理論數(shù)據(jù)能夠進(jìn)行壓縮的兩個(gè)原因:

1)數(shù)據(jù)中存在大量的冗余(相關(guān)性),如空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余及紋理統(tǒng)計(jì)冗余。

2)對(duì)于圖像、音頻和視頻等,人的感知可容忍某些細(xì)節(jié)信息的丟失(失真)。(感知冗余)第十五頁,共104頁。第十五頁,共104頁。1)空間冗余這是圖像數(shù)據(jù)中經(jīng)常存在的一種冗余。在同一幅圖像中,規(guī)則物體和規(guī)則背景的表面物理特性具有相關(guān)性,這些相關(guān)性的光成像結(jié)構(gòu)在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。第十六頁,共104頁。第十六頁,共104頁。2)結(jié)構(gòu)冗余在有些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式。我們稱此為結(jié)構(gòu)冗余;已知分布模式,可以通過某一過程生成圖像;例如布紋圖像和草席圖像;第十七頁,共104頁。第十七頁,共104頁。3)時(shí)間冗余這是序列圖像和語音數(shù)據(jù)中所經(jīng)常包含的冗余;圖像序列中的兩幅相鄰的圖像之間有較大的相關(guān)性,這反映為時(shí)間冗余;在語言中,由于人在說話時(shí)發(fā)音的音頻是一連續(xù)的漸變過程,而不是一個(gè)完全時(shí)間上獨(dú)立的過程,因而存在時(shí)間冗余。第十八頁,共104頁。第十八頁,共104頁。4)視覺冗余人類視覺系統(tǒng)并不是對(duì)任何圖像的變化都很敏感,人眼對(duì)于圖像的注意是非均勻的;事實(shí)上人類視覺系統(tǒng)一般分辨能力約為26灰度等級(jí),而一般圖像量化采用28灰度等級(jí),這類冗余我們稱為視覺冗余;例如,人的視覺對(duì)于邊緣的急劇變化不敏感,且人眼對(duì)圖像的亮度信息敏感,對(duì)顏色的分辨率弱等。第十九頁,共104頁。第十九頁,共104頁。5)知識(shí)冗余有許多圖像的理解與某些基礎(chǔ)知識(shí)有相當(dāng)大的相關(guān)性。例如,人臉的圖像有固定的結(jié)構(gòu)。比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正臉圖像的中線上等等。這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,我們稱此類冗余為知識(shí)冗余。第二十頁,共104頁。第二十頁,共104頁。除了以上冗余外,還有一些其他方面的冗余。空間冗余和時(shí)間冗余反應(yīng)了信號(hào)的統(tǒng)計(jì)特性,有時(shí)把這兩種冗余稱為統(tǒng)計(jì)冗余。它們也是多媒體數(shù)據(jù)處理中兩種最主要的數(shù)據(jù)冗余。第二十一頁,共104頁。第二十一頁,共104頁。數(shù)據(jù)壓縮分類

按照其作用域在空間域或頻率域上分為空間方法、變換方法和混合方法;根據(jù)是否自適應(yīng)分為自適應(yīng)性編碼和非自適應(yīng)性編碼。根據(jù)質(zhì)量有無損失可分為有損失編碼和無損失編碼,如圖1-3第二十二頁,共104頁。第二十二頁,共104頁。圖1-3第二十三頁,共104頁。第二十三頁,共104頁。常用編碼子帶編碼,首先將語音信號(hào)劃分為多個(gè)頻帶,然后對(duì)每個(gè)頻帶的參數(shù)進(jìn)行編碼。變換編碼,不是直接對(duì)空域圖像信號(hào)進(jìn)行編碼,而是首先將空域圖像信號(hào)映射變換到另一個(gè)正交矢量空間(變換域或頻域),產(chǎn)生一批變換系數(shù),然后對(duì)這些變換系數(shù)進(jìn)行編碼處理。預(yù)測(cè)編碼,是根據(jù)離散信號(hào)之間存在著一定關(guān)聯(lián)性的特點(diǎn),利用前面一個(gè)或多個(gè)信號(hào)預(yù)測(cè)下一個(gè)信號(hào)進(jìn)行,然后對(duì)實(shí)際值和預(yù)測(cè)值的差(預(yù)測(cè)誤差)進(jìn)行編碼。如果預(yù)測(cè)比較準(zhǔn)確,誤差就會(huì)很小。在同等精度要求的條件下,就可以用比較少的比特進(jìn)行編碼,達(dá)到壓縮數(shù)據(jù)的目的。第二十四頁,共104頁。第二十四頁,共104頁。靜態(tài)圖像編碼標(biāo)準(zhǔn)JPEG(JointPhotographicExpertsGroup)運(yùn)動(dòng)圖像編碼標(biāo)準(zhǔn) H.261,H.263 MPEG1,MPEG2,MPEG4第二十五頁,共104頁。第二十五頁,共104頁。第二章多媒體數(shù)字編碼技術(shù)2.1采樣和量化2.2無損編碼2.3有損編碼第二十六頁,共104頁。第二十六頁,共104頁。2.1采樣和量化數(shù)字化的好處A)數(shù)字化后處理更方便B)易于存儲(chǔ)和遠(yuǎn)距離傳輸C)沒有累積失真模擬世界數(shù)字世界模擬世界A/DD/A第二十七頁,共104頁。第二十七頁,共104頁。數(shù)字化過程包括三步驟采樣量化編碼第二十八頁,共104頁。第二十八頁,共104頁。采樣采樣(sampling)通過某種頻率的采樣脈沖將模擬信息的值取出,變連續(xù)的模擬信號(hào)為離散信號(hào)。采樣定理:采樣頻率≥原始信號(hào)頻率的2倍時(shí),采樣信號(hào)才可以保真地恢復(fù)為原始信號(hào)。第二十九頁,共104頁。第二十九頁,共104頁。量化將采樣樣本的幅度按照量化級(jí)別決定其取值的過程,如圖2-1所示。目的是將采樣樣本的幅度值離散化。量化之前需要規(guī)定量化級(jí),比如8級(jí),16級(jí)等。量化處理是一個(gè)多對(duì)一的處理過程,不可逆。量化處理中有信息丟失,或者說,會(huì)引起量化誤差(量化噪聲)。第三十頁,共104頁。第三十頁,共104頁。圖2-1第三十一頁,共104頁。第三十一頁,共104頁。量化的分類量化標(biāo)量量化矢量量化均勻量化非均勻量化第三十二頁,共104頁。第三十二頁,共104頁。均勻量化圖2-2第三十三頁,共104頁。第三十三頁,共104頁。非均勻量化

圖2-3非線性量化的原理圖概率密度大的區(qū)域細(xì)量化,概率密度小的區(qū)域粗量化

第三十四頁,共104頁。第三十四頁,共104頁。向量量化原理如下:

1)比特流被劃分為向量

2)各向量可參考碼本選擇最佳匹配模式

3)一旦找到最佳匹配模式就將碼本中的對(duì)應(yīng)條目進(jìn)行傳送

4)在接收端,根據(jù)傳送的索引在接收端碼本查出對(duì)應(yīng)的向量。

圖2-4是向量量化的原理圖

第三十五頁,共104頁。第三十五頁,共104頁。圖2-4第三十六頁,共104頁。第三十六頁,共104頁。圖2-5向量量化的編碼解碼框圖第三十七頁,共104頁。第三十七頁,共104頁。如果出現(xiàn)實(shí)際值與模式根本不匹配,那在接收端就會(huì)出現(xiàn)失真。為了對(duì)此進(jìn)行補(bǔ)救,該技術(shù)要計(jì)算一下實(shí)際值和模式的差分。然后將該差分與模式的參數(shù)一起傳送。參數(shù)編碼可用自身進(jìn)行量化。因此,根據(jù)傳送是否有差分以及差分大小,向量量化可能是無損的或是有損的壓縮模式。

第三十八頁,共104頁。第三十八頁,共104頁。2.2無損編碼

根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致,數(shù)據(jù)壓縮方法劃分為兩類:無損編碼(無失真編碼,無損壓縮)又稱冗余壓縮法或熵編碼。

如:Huffman編碼、算術(shù)編碼、行程長度編碼等;有損編碼(有失真編碼,有損壓縮)

如:變換編碼和預(yù)測(cè)編碼;無損失壓縮主要用于文本和數(shù)據(jù)壓縮。第三十九頁,共104頁。第三十九頁,共104頁??晌ㄒ蛔g碼性

具有可唯一譯碼性的編碼方法產(chǎn)生的編碼,在解碼的時(shí)候,只會(huì)產(chǎn)生唯一的譯碼結(jié)果。譯碼出來的結(jié)果與編碼是一一對(duì)應(yīng)的關(guān)系。第四十頁,共104頁。第四十頁,共104頁。哈夫曼編碼哈夫曼(Huffman)編碼的理論基礎(chǔ)是哈夫曼定理;哈夫曼定理(1952年Huffman提出的)

在變長編碼中,對(duì)出現(xiàn)概率大的信源符號(hào)賦于短碼字,而對(duì)于出現(xiàn)概率小的信源符號(hào)賦于長碼字。如果碼字長度嚴(yán)格按照所對(duì)應(yīng)符號(hào)出現(xiàn)概率大小逆序排列,則編碼結(jié)果平均碼字長度一定小于任何其它排列方式。也稱為最佳編碼,平均碼長最短。第四十一頁,共104頁。第四十一頁,共104頁。哈夫曼編碼示例

圖2-6

EFGDCAB第四十二頁,共104頁。第四十二頁,共104頁。已知A~G的霍夫曼編碼如上圖所示,求:(1)字符串ADBFEGEFCE的編碼;(2)計(jì)算平均碼長;(3)對(duì)1010011進(jìn)行解碼。第四十三頁,共104頁。第四十三頁,共104頁。算術(shù)編碼算術(shù)編碼是一種無損數(shù)據(jù)壓縮方法,也是一種熵編碼的方法。和其它熵編碼方法不同的地方在于,其他的熵編碼方法通常是把輸入的消息分割為符號(hào),然后對(duì)每個(gè)符號(hào)進(jìn)行編碼,而算術(shù)編碼是直接把整個(gè)輸入的消息編碼為一個(gè)數(shù),一個(gè)滿足(0.0≤n<1.0)的小數(shù)n。第四十四頁,共104頁。第四十四頁,共104頁。算術(shù)編碼示例假設(shè)信源符號(hào)為{00,01,10,11},符號(hào)概率分別為{0.1,0.4,0.2,0.3},根據(jù)這些概率可把間隔[0,1]分成4個(gè)子間隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),其中[x,y)表示半開放間隔,即包含x不包含y。上面的信息可綜合在下表中。如果二進(jìn)制消息序列的輸入為:0001111010符號(hào)00011011概率0.40.20.30.1初始編碼間隔[0,0.4)[0.4,0.6)[0.6,0.9)[0.9,1)第四十五頁,共104頁。第四十五頁,共104頁。輸入0001111010得到區(qū)間[0.23824,0.23896);讓我們?cè)谶@個(gè)區(qū)間內(nèi)隨便選擇一個(gè)容易變成二進(jìn)制的數(shù),例如0.23828125,將它變成二進(jìn)制0.00111101,去掉前面沒有太多意義的0和小數(shù)點(diǎn),我們可以輸出00111101,這就是信息被壓縮后的結(jié)果,我們完成了一次最簡單的算術(shù)壓縮過程。0.40.60.900.40.160.240.36100.240.160.1920.2080.2320.240.2320.23520.23680.23920.23680.23920.237760.238240.238960.238240.238960.2385280.2386720.238888第四十六頁,共104頁。第四十六頁,共104頁。算術(shù)編碼的特點(diǎn)1)不必預(yù)先定義概率模型,自適應(yīng)模式具有獨(dú)特的優(yōu)點(diǎn);2)信源符號(hào)概率接近時(shí),此時(shí)算術(shù)編碼效率高于其他編碼方法。3)算術(shù)編碼繞過了用一個(gè)特定的代碼替代一個(gè)輸入符號(hào)的想法,用一個(gè)浮點(diǎn)輸出數(shù)值代替一個(gè)符號(hào)流的輸入。第四十七頁,共104頁。第四十七頁,共104頁。注意下面幾個(gè)問題1)由于實(shí)際的計(jì)算機(jī)的精度不可能無限長,運(yùn)算中出現(xiàn)溢出是一個(gè)明顯的問題,但多數(shù)機(jī)器都有16位、32位或者64位的精度,因此這個(gè)問題可使用比例縮放方法解決。2)算術(shù)編碼器對(duì)整個(gè)消息只產(chǎn)生一個(gè)碼字,這個(gè)碼字是在間隔[0,1)中的一個(gè)實(shí)數(shù),因此譯碼器在接受到表示這個(gè)實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。3)算術(shù)編碼也是一種對(duì)錯(cuò)誤很敏感的編碼方法,如果有一位發(fā)生錯(cuò)誤就會(huì)導(dǎo)致整個(gè)消息譯錯(cuò)。第四十八頁,共104頁。第四十八頁,共104頁。LZW壓縮算法LZW壓縮算法是一種無損壓縮方法,由Lemple-Ziv-Welch三人共同創(chuàng)造,用他們的名字命名。它將每個(gè)第一次出現(xiàn)的串放在一個(gè)串表中,用一個(gè)數(shù)字來表示串,壓縮文件只存貯數(shù)字,則不存貯串,從而使圖象文件的壓縮效率得到較大的提高。奇妙的是,不管是在壓縮還是在解壓縮的過程中都能正確的建立這個(gè)串表,壓縮或解壓縮完成后,這個(gè)串表又被丟棄。第四十九頁,共104頁。第四十九頁,共104頁。1.基本原理首先建立一個(gè)字符串表,把每一個(gè)第一次出現(xiàn)的字符串放入串表中,并用一個(gè)數(shù)字來表示,這個(gè)數(shù)字與此字符串在串表中的位置有關(guān),并將這個(gè)數(shù)字存入壓縮文件中,如果這個(gè)字符串再次出現(xiàn)時(shí),即可用表示它的數(shù)字來代替,并將這個(gè)數(shù)字存入文件中。壓縮完成后將串表丟棄。如"print"字符串,如果在壓縮時(shí)用266表示,只要再次出現(xiàn),均用266表示,并將"print"字符串存入串表中,在圖象解碼時(shí)遇到數(shù)字266,即可從串表中查出266所代表的字符串"print",在解壓縮時(shí),串表可以根據(jù)壓縮數(shù)據(jù)重新生成。第五十頁,共104頁。第五十頁,共104頁。2.實(shí)現(xiàn)方法A.初始化串表在壓縮圖象信息時(shí),首先要建立一個(gè)字符串表,用以記錄每個(gè)第一次出現(xiàn)的字符串。一個(gè)字符串表最少由兩個(gè)字符數(shù)組構(gòu)成,一個(gè)稱為當(dāng)前數(shù)組,一個(gè)稱為前綴數(shù)組,一個(gè)基本字符串由當(dāng)前字符和它前面的字符(也稱前綴)構(gòu)成。前綴數(shù)組中存入字符串中的首字符,當(dāng)前數(shù)組存放字符串中的尾字符,其存入位置相同,因此只要確定一個(gè)下標(biāo),就可確定它所存貯的基本字符串,所以在數(shù)據(jù)壓縮時(shí),用下標(biāo)代替基本字符串。第五十一頁,共104頁。第五十一頁,共104頁。一般串表大小為4096個(gè)字節(jié)(即212),這意味著一個(gè)串表中最多能存貯4096個(gè)基本字符串,在初始化時(shí)根據(jù)圖象中色彩數(shù)目多少,將串表中起始位置的字節(jié)均賦以數(shù)字,通常當(dāng)前數(shù)組中的內(nèi)容為該元素的序號(hào)(即下標(biāo)),如第一個(gè)元素為0,第二個(gè)元素為1,第15個(gè)元素為14,直到下標(biāo)為色彩數(shù)目加2的元素為止。如果色彩數(shù)為256,則要初始化到第258個(gè)字節(jié),該字節(jié)中的數(shù)值為257。其中數(shù)字256表示清除碼,數(shù)字257為圖象結(jié)束碼。后面的字節(jié)存放文件中每一個(gè)第一次出現(xiàn)的串。同樣也要音樂會(huì)前綴數(shù)組初始化,其中各元素的值為任意數(shù),但一般均將其各位置1,即將開始位置的各元素初始化為0XFF,初始化的元素?cái)?shù)目與當(dāng)前數(shù)組相同,其后的元素則要存入每一個(gè)第一次出現(xiàn)的字符串了。如果加大串表的長度可進(jìn)一步提高壓縮效率,但會(huì)降低解碼速度。第五十二頁,共104頁。第五十二頁,共104頁。用lzw算法壓縮原始數(shù)據(jù)的示例分析輸入流,也就是原始的數(shù)據(jù)為:255,24,54,255,24,255,255,24,5,123,45,255,24,5,24,54第五十三頁,共104頁。第五十三頁,共104頁。第幾步前綴后綴·Entry認(rèn)識(shí)(Y/N)輸出標(biāo)號(hào)1255(,255)225524(255,24)

N25525832454(24,54)

N24259454255(54,255)

N54260525524(255,24)

Y6258255(258,255)

N2582617255255(255,255)

N255第五十四頁,共104頁。第五十四頁,共104頁。另一個(gè)例子原輸入數(shù)據(jù)為:ABABABABBBABABAACDACDADCABAAABAB注意原數(shù)據(jù)中只包含4個(gè)character,A,B,C,D

用2bit即可表述,根據(jù)lzw算法,首先擴(kuò)展一位變?yōu)?bit,Clear=2的2次方+1=4;End=4+1=5;

初始標(biāo)號(hào)集應(yīng)該為:012345ABCDClearEnd第五十五頁,共104頁。第五十五頁,共104頁。而壓縮過程為:第幾步前綴后綴Entry認(rèn)識(shí)(Y/N)輸出標(biāo)號(hào)1A(,A)2AB(A,B)

NA63BA(B,A)

NB74AB(A,B)

Y56A(6,A)

N686AB(A,B)

Y76A(6,A)

Y88B(8,B)

N899BB(B,B)

NB1010BB(B,B)

Y1110A(10,A)

N101112AB(A,B)

Y第五十六頁,共104頁。第五十六頁,共104頁。當(dāng)進(jìn)行到第12步的時(shí)候,標(biāo)號(hào)集應(yīng)該為01234567891011ABCDClearEndABBA6A8BBB10A第五十七頁,共104頁。第五十七頁,共104頁。行程長度編碼(RLE)具有相同顏色,并且是連續(xù)的像素?cái)?shù)目稱為行程長度,簡稱長度。行程編碼的基本原理是建筑在圖像的統(tǒng)計(jì)特性基礎(chǔ)之上的,彩色值與其行程長度組合一起作為編碼輸入的碼元進(jìn)行編碼,如下圖所示。適用于在同一行或相鄰行的像素之間具有強(qiáng)相關(guān)性的圖像。第五十八頁,共104頁。第五十八頁,共104頁。2.3有損編碼

壓縮過程中減少了數(shù)據(jù)中包含的數(shù)據(jù)量

解壓縮后恢復(fù)的數(shù)據(jù)與原先的不完全一致

能獲得較高的壓縮比

又稱熵壓縮法

前綴編碼第五十九頁,共104頁。第五十九頁,共104頁。預(yù)測(cè)編碼

編碼和傳輸?shù)牟⒉皇窍笏夭蓸又当旧?,而是這個(gè)采樣值的預(yù)測(cè)值與其實(shí)際值之間的差值相鄰樣本之間存在較強(qiáng)的相關(guān)性差值具有更小的動(dòng)態(tài)范圍第六十頁,共104頁。第六十頁,共104頁。根據(jù)編碼器的實(shí)現(xiàn)機(jī)理,語音編碼方法可以分成三大類,分別是波形編碼、變換編碼和混合編碼。第六十一頁,共104頁。第六十一頁,共104頁。第三章視頻3.1JPEG3.2MPEG視頻第六十二頁,共104頁。第六十二頁,共104頁。3.1JPEGJPEG(JointPhotographicExpertsGroup)

一個(gè)適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn),既可用于灰度圖像又可用于彩色圖像。JPEG算法與彩色空間無關(guān),處理的彩色圖像是單獨(dú)的彩色分量圖像?;陔x散余弦變換(DCT)的編碼方法。DCT變換:將信號(hào)從一種表達(dá)形式(空間域,即圖像的像素值)變成另一種等同的表達(dá)形式(頻率域,即頻率系數(shù)),并且這種變換過程是不可逆的。DCT變換的作用是使空間域的能量重新分布,降低圖像的相關(guān)性。DCT變換主要用來減少空間冗余。第六十三頁,共104頁。第六十三頁,共104頁。JPEG編碼框圖第六十四頁,共104頁。第六十四頁,共104頁。JPEG20002001年頒布,是JPEG的改進(jìn)版原理:JPEG2000與傳統(tǒng)JPEG最大的不同,在于它放棄了JPEG所采用的以離散余弦轉(zhuǎn)換(DCT,DiscreteCosineTransform)為主的區(qū)塊編碼方式,而改采以小波轉(zhuǎn)換(Wavelettransform)為主的多解析編碼方式。小波轉(zhuǎn)換的主要目的是要將圖像的頻率成分抽取出來。第六十五頁,共104頁。第六十五頁,共104頁。JPEG2000編解碼器原理框圖第六十六頁,共104頁。第六十六頁,共104頁。3.2MPEG視頻

MPEG是在1988年由國際標(biāo)準(zhǔn)化組織(InternationalOrganizationforStandardization,ISO)和國際電工委員會(huì)(InternationalElectrotechnicalCommission,IEC)聯(lián)合成立的專家組。開發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標(biāo)準(zhǔn)。他們開發(fā)的標(biāo)準(zhǔn)稱為MPEG標(biāo)準(zhǔn)。第六十七頁,共104頁。第六十七頁,共104頁。MPEG-1和MPEG-2典型的編碼參數(shù)第六十八頁,共104頁。第六十八頁,共104頁。減少時(shí)間冗余度1.MPEG

1視頻算法為了追求更高的壓縮效率,注重去除圖像序列的時(shí)間冗余度,同時(shí)滿足多媒體等應(yīng)用所必須的隨機(jī)存取要求。為此,MPEG1標(biāo)準(zhǔn)將視頻圖像序列劃分為:幀內(nèi)圖(I幀)預(yù)測(cè)圖(P幀)雙向圖(B幀)直流分量圖(D圖)再根據(jù)不同的圖像類型而區(qū)別對(duì)待。

第六十九頁,共104頁。第六十九頁,共104頁。1幀內(nèi)圖(I幀)可由它來構(gòu)造出其它的幀但不能由其它幀構(gòu)造的幀對(duì)于幀內(nèi)圖只使用類似于JPEG標(biāo)準(zhǔn)的幀內(nèi)編碼第七十頁,共104頁。第七十頁,共104頁。2預(yù)測(cè)圖(P幀)僅由前趨幀構(gòu)造所得,如下圖8所示

第七十一頁,共104頁。第七十一頁,共104頁。3雙向圖(B幀)由前趨和后繼幀差值所得,第七十二頁,共104頁。第七十二頁,共104頁。4直流分量圖是變換系數(shù)的直流分量(DC系數(shù)),代表能量分布的圖。僅使用其自身的信息第七十三頁,共104頁。第七十三頁,共104頁。第七十四頁,共104頁。第七十四頁,共104頁。運(yùn)動(dòng)補(bǔ)償主要用于消除P圖象和B圖象在時(shí)間上的冗余性提高壓縮效率。運(yùn)動(dòng)補(bǔ)償是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法之一。包括運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償插值兩部分。運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)是指視頻的相鄰幀間的運(yùn)動(dòng)部分具有連續(xù)性,即當(dāng)前畫面上的圖像可以看成是前畫某時(shí)刻畫面上圖像的位移,位移的幅度值和方向在畫面各處可以不同。利用運(yùn)動(dòng)位移信息與前面某時(shí)刻的圖像對(duì)當(dāng)前畫面圖像進(jìn)行預(yù)測(cè)的方法,稱為前向預(yù)測(cè)。反之,根據(jù)某時(shí)刻的圖與位移信息預(yù)測(cè)該時(shí)刻之前的圖像,稱為后向預(yù)測(cè)。運(yùn)動(dòng)補(bǔ)償插值是指以插補(bǔ)方法補(bǔ)償運(yùn)動(dòng)信息,是提高視頻壓縮比的最有效措施之一。在時(shí)域中插補(bǔ)運(yùn)動(dòng)補(bǔ)償是一種多分辨率壓縮技術(shù)。例如1/15秒或1/10秒時(shí)間隔選取參考子圖,對(duì)時(shí)域較低分辨率子圖進(jìn)行編碼,通過低分辨子圖反映運(yùn)動(dòng)趨勢(shì)的附加校正信息(運(yùn)動(dòng)夭量)進(jìn)行插值,可得到滿分辨率(幀率1/30秒)的視頻信號(hào)。插值運(yùn)動(dòng)補(bǔ)償也稱為雙向預(yù)測(cè),因?yàn)樗壤昧饲懊鎺男畔⒂掷昧撕竺鎺男畔?。第七十五頁,?04頁。第七十五頁,共104頁。在MPEG方案中,運(yùn)動(dòng)補(bǔ)償技術(shù)工作在宏塊一級(jí)。宏塊分類如下:B圖象宏塊有4種類型幀內(nèi)宏塊,簡稱I塊;前向預(yù)測(cè)宏塊,簡稱F塊;后向預(yù)測(cè)宏塊,簡稱B塊;平均宏塊,簡稱A塊。對(duì)于P圖象,其宏塊只有I塊和F塊兩種第七十六頁,共104頁。第七十六頁,共104頁。運(yùn)動(dòng)估計(jì)就是運(yùn)動(dòng)向量的求取過程。運(yùn)動(dòng)向量的選擇范圍是基于幀間圖像的時(shí)間分辯率和塊內(nèi)圖像的時(shí)間分辯率,以及幀序列圖像的性質(zhì)而選定。第七十七頁,共104頁。第七十七頁,共104頁。MPEG

1數(shù)據(jù)流結(jié)構(gòu)第七十八頁,共104頁。第七十八頁,共104頁。GSM編譯碼器簡介

1988年頒布GSM標(biāo)準(zhǔn),也稱泛歐數(shù)字蜂窩通信標(biāo)準(zhǔn)

GSM壓縮后的數(shù)據(jù)率為:13.2kb/sGSM的壓縮比:128∶13.2=9.7,近似于10∶1第七十九頁,共104頁。第七十九頁,共104頁。第五章多媒體網(wǎng)絡(luò)通信5.1基本術(shù)語與概念5.2局域網(wǎng)(LAN)技術(shù)第八十頁,共104頁。第八十頁,共104頁。5.1基本術(shù)語與概念基本概念1.TCP/IPTCP/IP是英文TrasmissionControlProtocol/InternetProtocol的縮寫,也稱為傳輸控制協(xié)議/國際互連協(xié)議。其目的是將各種異構(gòu)計(jì)算機(jī)網(wǎng)絡(luò)或主機(jī)通過TCP/IP實(shí)現(xiàn)互連互通。第八十一頁,共104頁。第八十一頁,共104頁。網(wǎng)絡(luò)地址

MAC地址: MAC地址由數(shù)據(jù)鏈路層地址子集組成。對(duì)于某個(gè)局域網(wǎng)接口來說,MAC地址是唯一的。其地址長度為48位。網(wǎng)絡(luò)層地址 IP地址:IP地址是網(wǎng)上主機(jī)地址的數(shù)字形式,與主機(jī)的域名一一對(duì)應(yīng)。IPv4地址是一個(gè)32位的二進(jìn)制數(shù)。常用的IP地址有以下幾種:A類地址空間:1.0.0.0~126.255.255.255;B類地址空間:128.0.0.0~191.255.255.255;C類地址空間:192.0.0.0~223.255.255.255。第八十二頁,共104頁。第八十二頁,共104頁。IPv6地址類型::/128:1/128 回環(huán)地址2001::/16

全球可聚合地址2002::/16 6to4自動(dòng)構(gòu)造隧道地址3ffe::/16

早期IPv6試驗(yàn)網(wǎng)地址fe80::/10

本地鏈路地址ff00::/8

組播地址::A.B.C.D 兼容IPv4的IPv6地址::FFFF:A.B.C.D IPv4映射的IPv6地址第八十三頁,共104頁。第八十三頁,共104頁。5.2局域網(wǎng)(LAN)技術(shù)IEEE802標(biāo)準(zhǔn)1.局域網(wǎng)分類(1)以太網(wǎng)(Ethernet) 帶有檢測(cè)沖突的載波偵聽多路存?。–SMA/CD)(2)令牌網(wǎng)(RingToken)(3)光纖分布式數(shù)據(jù)接口(FDDI)第八十四頁,共104頁。第八十四頁,共104頁。100Base-T快速以太網(wǎng) 網(wǎng)絡(luò)最大直徑為205m; 傳輸介質(zhì)采用5類UTP或光纜。100Base-T: 100Base-TX 100Base-FX 100Base-T4千兆位快速以太網(wǎng): 1000Base-SX 1000Base-LX 1000Base-CX 1000Base-T第八十五頁,共104頁。第八十五頁,共104頁。FDMA是把分配給無線蜂窩電話通訊的頻段分為若干個(gè)信道,每一個(gè)信道都能夠傳輸語音通話、數(shù)字服務(wù)和數(shù)字?jǐn)?shù)據(jù)。CDMA指通信中的一種多路復(fù)用技術(shù),在CDMA方式中,用戶共享時(shí)間和頻率分配并由唯一指配碼指配。在接收端通過使用只接收來自所需電路信號(hào)能量的相關(guān)器把信號(hào)分開。不需要的信號(hào)被做為噪音忽略掉。

TDMA如果物理信道所能達(dá)到的傳輸率超過傳單一信源要求的數(shù)據(jù)傳輸率,則可將物理信道按時(shí)間分成時(shí)間片,輪流地分配給每個(gè)用戶,每個(gè)時(shí)間片由復(fù)用的一個(gè)用戶占用。

多路復(fù)用技術(shù)是把多個(gè)低信道組合成一個(gè)高速信道的技術(shù),它可以有效的提高數(shù)據(jù)鏈路的利用率,從而使得一條高速的主干鏈路同時(shí)為多條低速的接入鏈路提供服務(wù),也就是使得網(wǎng)絡(luò)干線可以同時(shí)運(yùn)載大量的語音和數(shù)據(jù)傳輸。

第八十六頁,共104頁。第八十六頁,共104頁。ATM技術(shù)1.ATM的產(chǎn)生隨著多媒體技術(shù)的出現(xiàn),人們對(duì)對(duì)帶寬的需求也越來越高。針對(duì)這種情況,CCITT研究制定了B-ISDN(寬帶綜合業(yè)務(wù)數(shù)字網(wǎng))標(biāo)準(zhǔn)。ATM就是支持B-ISDN服務(wù)的一種交換技術(shù)。2.ATM信元結(jié)構(gòu)ATM信息傳輸采用固定長格式,一律為53字節(jié),稱為ATM數(shù)據(jù)信元。其中包括48個(gè)字節(jié)的數(shù)據(jù)和5個(gè)字節(jié)的信元頭。ATM信元結(jié)構(gòu)如圖5-21所示。第八十七頁,共104頁。第八十七頁,共104頁。ATM信元結(jié)構(gòu)如圖5-21所示。圖5-21信元結(jié)構(gòu)3.ATM的傳輸模式ATM采用面向連接的傳輸方式,將數(shù)據(jù)分割成固定長度的信元,通過虛連接進(jìn)行交換。一個(gè)ATM的傳輸過程可以包括三個(gè)階段:連接建立、數(shù)據(jù)傳輸和連接終止第八十八頁,共104頁。第八十八頁,共104頁。ATM與IP的比較:1、ATM是面向連接的,但I(xiàn)P是無連接的。當(dāng)在一個(gè)面向連接的ATM網(wǎng)絡(luò)上傳送無連接的IP分組時(shí),還可以有兩種選擇。第一種方法是每傳送一個(gè)分組就根據(jù)需要建立一條ATM連接,而第二種方法是在事先配置好的連接上傳送。2、ATM的一個(gè)突出優(yōu)點(diǎn)就是有服務(wù)質(zhì)量QoS的保證。但I(xiàn)P(目前是IPv4)則沒有服務(wù)質(zhì)量的概念,每一個(gè)分組按照“盡最大努力”的原則由路由器轉(zhuǎn)發(fā)。第八十九頁,共104頁。第八十九頁,共104頁。接入網(wǎng)基礎(chǔ)1、概念接入網(wǎng)AN(AccessNetwork),也稱為用戶接入網(wǎng),是由業(yè)務(wù)節(jié)點(diǎn)接口(SNI)和相關(guān)用戶網(wǎng)絡(luò)接口(UNI)之間的一系列傳送實(shí)體(例如線路設(shè)施和傳輸設(shè)備)組成的。2、接入網(wǎng)的功能結(jié)構(gòu)它位于交換局端和用戶終端之間,可以支持各種交換型和非交換型業(yè)務(wù),并將這些業(yè)務(wù)流組合后沿著公共的傳輸通道送往業(yè)務(wù)節(jié)點(diǎn)。3、分類 接入網(wǎng)可以分為有線接入網(wǎng)和無線接入網(wǎng):有線接入網(wǎng)包括銅線接入網(wǎng)、光纖接入網(wǎng)和混合光纖/同軸電纜接入網(wǎng);無線接入網(wǎng)包括固定無線接入網(wǎng)和移動(dòng)接入網(wǎng)第九十頁,共104頁。第九十頁,共104頁。目前3G存在四種標(biāo)準(zhǔn)CDMA2000WCDMATD-SCDMAWiMAX第九十一頁,共104頁。第九十一頁,共104頁。LTELTE(LongTermEvolution,長期演進(jìn))項(xiàng)目是3G的演進(jìn),LTE并非人們普遍誤解的4G技術(shù),而是3G與4G技術(shù)之間的一個(gè)過渡,是3.9G的全球標(biāo)準(zhǔn)。第九十二頁,共104頁。第九十二頁,共104頁。HSPA 高速分組接入技術(shù)HSPA(HighSpeedPacketAccess)分為HSDPA和HSUPA。 HSDPA(高速下行分組接入)在下行鏈路上能夠?qū)崿F(xiàn)高

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論