多媒體技術(shù)復(fù)習(xí)

上傳人：m*** IP屬地：浙江上傳時(shí)間：2023-04-16 格式：PPTX 頁數(shù)：104 大小：3.32MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩99頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章多媒體基礎(chǔ)1、媒體聲音媒體圖像媒體2、數(shù)據(jù)壓縮理論數(shù)據(jù)冗余數(shù)據(jù)壓縮分類第一頁，共104頁。第一頁，共104頁。1.1媒體媒體是信息表示和傳輸?shù)妮d體，是一個(gè)重要的概念。多媒體(multimedia)是融合兩種以上媒體的人機(jī)交互式信息交流和傳播媒體。ITU-TI.374建議將媒體劃分為感覺媒體、表示媒體、顯示媒體、存儲(chǔ)媒體和傳輸媒體5類。通常認(rèn)為多媒體中的連續(xù)媒體(聲音和電視圖像)是人與機(jī)器交互的最自然的媒體。多媒體技術(shù)是將計(jì)算機(jī)技術(shù)、通信技術(shù)和電視技術(shù)三種技術(shù)融合在一起的新技術(shù)，俗稱“3C合一”。第二頁，共104頁。第二頁，共104頁。聲音信號(hào)的頻率

1）小于20Hz的信號(hào)稱為亞音信號(hào)或次音信號(hào)2）20Hz～20kHz的信號(hào)稱為音頻信號(hào)3）高于20kHz的信號(hào)稱為超音頻信號(hào)或稱超聲波信號(hào)4）300～3400Hz稱為話音信號(hào)

人的聽覺器官能感知的聲音頻率大約在20～20000Hz之間。在這種頻率范圍里感知的聲音幅度大約在0～120dB之間聲音媒體第三頁，共104頁。第三頁，共104頁。聲音的質(zhì)量主要體現(xiàn)在音調(diào)與聲音的頻率有關(guān)音強(qiáng)與波形震動(dòng)的幅度（聲波壓力）有關(guān)音色與基音和諧音的組合有關(guān)第四頁，共104頁。第四頁，共104頁。等響曲線人類的聽覺特性曲線，是反映人們對(duì)聲音振幅范圍心理因素的曲線，每條曲線上對(duì)應(yīng)于不同頻率的聲壓級(jí)是不相同的，但人耳感覺到的響應(yīng)卻是一樣，因此稱為等響曲線，每條曲線上注有一個(gè)數(shù)字，為響度單位。又稱為Fletcher-Munson(弗萊徹—芒森曲線)曲線。第五頁，共104頁。第五頁，共104頁。等響曲線第六頁，共104頁。第六頁，共104頁。掩蔽效應(yīng)一種頻率的聲音阻礙聽覺系統(tǒng)感受另一種頻率的聲音的現(xiàn)象稱為掩蔽效應(yīng)。掩蔽可分成：時(shí)域掩蔽頻域掩蔽第七頁，共104頁。第七頁，共104頁。圖像的顏色模型常見模型：

RGB彩色模型CMY彩色模型YUV彩色模型YIQ彩色模型HSI彩色模型第八頁，共104頁。第八頁，共104頁。RGB彩色空間顏色＝R(紅色百分比)＋G(綠色百分比)＋B(藍(lán)色百分比)第九頁，共104頁。第九頁，共104頁。一幅彩色圖像可以看成是由許多點(diǎn)組成的圖像中的每個(gè)點(diǎn)稱為像素點(diǎn)（pixel）每個(gè)像素點(diǎn)都有一個(gè)像素值，表示特定的顏色強(qiáng)度像素值往往用R、G、B三個(gè)分量表示第十頁，共104頁。第十頁，共104頁。CMY彩色空間Cyan(青色),Magenta(品紅),Yellow(黃)-CMY任何一種顏色都可以用三種基本顏料按一定的比例混合得到。用這種方法產(chǎn)生的顏色稱為相減色CMY主要用于印刷和打印系統(tǒng)圖1-2第十一頁，共104頁。第十一頁，共104頁。YUV彩色空間由廣播電視需求的推動(dòng)而開發(fā)的彩色空間，主要目的是為了壓縮色度信息以便有效的播送彩色電視圖像。Y為亮度信號(hào)，U、V是色差信號(hào)（B-Y,R-Y）

U和V構(gòu)成彩色的兩個(gè)分量。PAL模擬彩色電視采用的彩色空間。優(yōu)點(diǎn)是亮度和色差信號(hào)分離，容易使彩色電視系統(tǒng)與黑白電視信號(hào)兼容。第十二頁，共104頁。第十二頁，共104頁。YIQ彩色空間NTSC制式的模擬彩色電視采用的彩色空間Y是亮度，I和Q是兩個(gè)彩色分量，共同描述圖象的色調(diào)和飽和度。亮度與色差分離，可以更有效的壓縮圖像的數(shù)據(jù)量第十三頁，共104頁。第十三頁，共104頁。HSI彩色空間用H(Hue,色調(diào))、S(Saturation,飽和度)、I(Intensity,光強(qiáng)度)表示一種顏色一種直觀的顏色模型，更適合人的視覺特性。HSL(Hue,Saturation,Lightness)HSI(HSL)RGB第十四頁，共104頁。第十四頁，共104頁。1.2數(shù)據(jù)壓縮理論數(shù)據(jù)能夠進(jìn)行壓縮的兩個(gè)原因：

1）數(shù)據(jù)中存在大量的冗余（相關(guān)性），如空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余及紋理統(tǒng)計(jì)冗余。

2）對(duì)于圖像、音頻和視頻等，人的感知可容忍某些細(xì)節(jié)信息的丟失（失真）。（感知冗余）第十五頁，共104頁。第十五頁，共104頁。1)空間冗余這是圖像數(shù)據(jù)中經(jīng)常存在的一種冗余。在同一幅圖像中,規(guī)則物體和規(guī)則背景的表面物理特性具有相關(guān)性,這些相關(guān)性的光成像結(jié)構(gòu)在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。第十六頁，共104頁。第十六頁，共104頁。2)結(jié)構(gòu)冗余在有些圖像的紋理區(qū)，圖像的像素值存在著明顯的分布模式。我們稱此為結(jié)構(gòu)冗余；已知分布模式，可以通過某一過程生成圖像；例如布紋圖像和草席圖像；第十七頁，共104頁。第十七頁，共104頁。3)時(shí)間冗余這是序列圖像和語音數(shù)據(jù)中所經(jīng)常包含的冗余；圖像序列中的兩幅相鄰的圖像之間有較大的相關(guān)性,這反映為時(shí)間冗余；在語言中,由于人在說話時(shí)發(fā)音的音頻是一連續(xù)的漸變過程,而不是一個(gè)完全時(shí)間上獨(dú)立的過程,因而存在時(shí)間冗余。第十八頁，共104頁。第十八頁，共104頁。4)視覺冗余人類視覺系統(tǒng)并不是對(duì)任何圖像的變化都很敏感，人眼對(duì)于圖像的注意是非均勻的；事實(shí)上人類視覺系統(tǒng)一般分辨能力約為26灰度等級(jí)，而一般圖像量化采用28灰度等級(jí)，這類冗余我們稱為視覺冗余；例如，人的視覺對(duì)于邊緣的急劇變化不敏感，且人眼對(duì)圖像的亮度信息敏感，對(duì)顏色的分辨率弱等。第十九頁，共104頁。第十九頁，共104頁。5)知識(shí)冗余有許多圖像的理解與某些基礎(chǔ)知識(shí)有相當(dāng)大的相關(guān)性。例如，人臉的圖像有固定的結(jié)構(gòu)。比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正臉圖像的中線上等等。這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到，我們稱此類冗余為知識(shí)冗余。第二十頁，共104頁。第二十頁，共104頁。除了以上冗余外，還有一些其他方面的冗余。空間冗余和時(shí)間冗余反應(yīng)了信號(hào)的統(tǒng)計(jì)特性，有時(shí)把這兩種冗余稱為統(tǒng)計(jì)冗余。它們也是多媒體數(shù)據(jù)處理中兩種最主要的數(shù)據(jù)冗余。第二十一頁，共104頁。第二十一頁，共104頁。數(shù)據(jù)壓縮分類

按照其作用域在空間域或頻率域上分為空間方法、變換方法和混合方法；根據(jù)是否自適應(yīng)分為自適應(yīng)性編碼和非自適應(yīng)性編碼。根據(jù)質(zhì)量有無損失可分為有損失編碼和無損失編碼，如圖1-3第二十二頁，共104頁。第二十二頁，共104頁。圖1-3第二十三頁，共104頁。第二十三頁，共104頁。常用編碼子帶編碼，首先將語音信號(hào)劃分為多個(gè)頻帶，然后對(duì)每個(gè)頻帶的參數(shù)進(jìn)行編碼。變換編碼，不是直接對(duì)空域圖像信號(hào)進(jìn)行編碼，而是首先將空域圖像信號(hào)映射變換到另一個(gè)正交矢量空間（變換域或頻域），產(chǎn)生一批變換系數(shù)，然后對(duì)這些變換系數(shù)進(jìn)行編碼處理。預(yù)測(cè)編碼，是根據(jù)離散信號(hào)之間存在著一定關(guān)聯(lián)性的特點(diǎn)，利用前面一個(gè)或多個(gè)信號(hào)預(yù)測(cè)下一個(gè)信號(hào)進(jìn)行，然后對(duì)實(shí)際值和預(yù)測(cè)值的差（預(yù)測(cè)誤差）進(jìn)行編碼。如果預(yù)測(cè)比較準(zhǔn)確，誤差就會(huì)很小。在同等精度要求的條件下，就可以用比較少的比特進(jìn)行編碼，達(dá)到壓縮數(shù)據(jù)的目的。第二十四頁，共104頁。第二十四頁，共104頁。靜態(tài)圖像編碼標(biāo)準(zhǔn)JPEG（JointPhotographicExpertsGroup）運(yùn)動(dòng)圖像編碼標(biāo)準(zhǔn) H.261,H.263 MPEG1,MPEG2,MPEG4第二十五頁，共104頁。第二十五頁，共104頁。第二章多媒體數(shù)字編碼技術(shù)2.1采樣和量化2.2無損編碼2.3有損編碼第二十六頁，共104頁。第二十六頁，共104頁。2.1采樣和量化數(shù)字化的好處A）數(shù)字化后處理更方便B）易于存儲(chǔ)和遠(yuǎn)距離傳輸C）沒有累積失真模擬世界數(shù)字世界模擬世界A/DD/A第二十七頁，共104頁。第二十七頁，共104頁。數(shù)字化過程包括三步驟采樣量化編碼第二十八頁，共104頁。第二十八頁，共104頁。采樣采樣（sampling）通過某種頻率的采樣脈沖將模擬信息的值取出，變連續(xù)的模擬信號(hào)為離散信號(hào)。采樣定理：采樣頻率≥原始信號(hào)頻率的2倍時(shí)，采樣信號(hào)才可以保真地恢復(fù)為原始信號(hào)。第二十九頁，共104頁。第二十九頁，共104頁。量化將采樣樣本的幅度按照量化級(jí)別決定其取值的過程，如圖2-1所示。目的是將采樣樣本的幅度值離散化。量化之前需要規(guī)定量化級(jí)，比如8級(jí)，16級(jí)等。量化處理是一個(gè)多對(duì)一的處理過程，不可逆。量化處理中有信息丟失，或者說，會(huì)引起量化誤差（量化噪聲）。第三十頁，共104頁。第三十頁，共104頁。圖2-1第三十一頁，共104頁。第三十一頁，共104頁。量化的分類量化標(biāo)量量化矢量量化均勻量化非均勻量化第三十二頁，共104頁。第三十二頁，共104頁。均勻量化圖2-2第三十三頁，共104頁。第三十三頁，共104頁。非均勻量化

圖2-3非線性量化的原理圖概率密度大的區(qū)域細(xì)量化，概率密度小的區(qū)域粗量化

第三十四頁，共104頁。第三十四頁，共104頁。向量量化原理如下：

1）比特流被劃分為向量

2）各向量可參考碼本選擇最佳匹配模式

3）一旦找到最佳匹配模式就將碼本中的對(duì)應(yīng)條目進(jìn)行傳送

4）在接收端，根據(jù)傳送的索引在接收端碼本查出對(duì)應(yīng)的向量。

圖2-4是向量量化的原理圖

第三十五頁，共104頁。第三十五頁，共104頁。圖2-4第三十六頁，共104頁。第三十六頁，共104頁。圖2-5向量量化的編碼解碼框圖第三十七頁，共104頁。第三十七頁，共104頁。如果出現(xiàn)實(shí)際值與模式根本不匹配，那在接收端就會(huì)出現(xiàn)失真。為了對(duì)此進(jìn)行補(bǔ)救，該技術(shù)要計(jì)算一下實(shí)際值和模式的差分。然后將該差分與模式的參數(shù)一起傳送。參數(shù)編碼可用自身進(jìn)行量化。因此，根據(jù)傳送是否有差分以及差分大小，向量量化可能是無損的或是有損的壓縮模式。

第三十八頁，共104頁。第三十八頁，共104頁。2.2無損編碼

根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致，數(shù)據(jù)壓縮方法劃分為兩類：無損編碼（無失真編碼，無損壓縮）又稱冗余壓縮法或熵編碼。

如：Huffman編碼、算術(shù)編碼、行程長度編碼等；有損編碼(有失真編碼，有損壓縮)

如：變換編碼和預(yù)測(cè)編碼；無損失壓縮主要用于文本和數(shù)據(jù)壓縮。第三十九頁，共104頁。第三十九頁，共104頁?？晌ㄒ蛔g碼性

具有可唯一譯碼性的編碼方法產(chǎn)生的編碼，在解碼的時(shí)候，只會(huì)產(chǎn)生唯一的譯碼結(jié)果。譯碼出來的結(jié)果與編碼是一一對(duì)應(yīng)的關(guān)系。第四十頁，共104頁。第四十頁，共104頁。哈夫曼編碼哈夫曼（Huffman）編碼的理論基礎(chǔ)是哈夫曼定理；哈夫曼定理（1952年Huffman提出的）

在變長編碼中,對(duì)出現(xiàn)概率大的信源符號(hào)賦于短碼字,而對(duì)于出現(xiàn)概率小的信源符號(hào)賦于長碼字。如果碼字長度嚴(yán)格按照所對(duì)應(yīng)符號(hào)出現(xiàn)概率大小逆序排列,則編碼結(jié)果平均碼字長度一定小于任何其它排列方式。也稱為最佳編碼，平均碼長最短。第四十一頁，共104頁。第四十一頁，共104頁。哈夫曼編碼示例

圖2-6

EFGDCAB第四十二頁，共104頁。第四十二頁，共104頁。已知A~G的霍夫曼編碼如上圖所示，求：（1）字符串ADBFEGEFCE的編碼；（2）計(jì)算平均碼長；（3）對(duì)1010011進(jìn)行解碼。第四十三頁，共104頁。第四十三頁，共104頁。算術(shù)編碼算術(shù)編碼是一種無損數(shù)據(jù)壓縮方法，也是一種熵編碼的方法。和其它熵編碼方法不同的地方在于，其他的熵編碼方法通常是把輸入的消息分割為符號(hào)，然后對(duì)每個(gè)符號(hào)進(jìn)行編碼，而算術(shù)編碼是直接把整個(gè)輸入的消息編碼為一個(gè)數(shù)，一個(gè)滿足(0.0≤n<1.0)的小數(shù)n。第四十四頁，共104頁。第四十四頁，共104頁。算術(shù)編碼示例假設(shè)信源符號(hào)為{00,01,10,11}，符號(hào)概率分別為{0.1,0.4,0.2,0.3}，根據(jù)這些概率可把間隔[0,1]分成4個(gè)子間隔：[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1)，其中[x,y)表示半開放間隔，即包含x不包含y。上面的信息可綜合在下表中。如果二進(jìn)制消息序列的輸入為：0001111010符號(hào)00011011概率0.40.20.30.1初始編碼間隔[0，0.4)[0.4,0.6)[0.6,0.9)[0.9,1)第四十五頁，共104頁。第四十五頁，共104頁。輸入0001111010得到區(qū)間[0.23824,0.23896)；讓我們?cè)谶@個(gè)區(qū)間內(nèi)隨便選擇一個(gè)容易變成二進(jìn)制的數(shù)，例如0.23828125，將它變成二進(jìn)制0.00111101，去掉前面沒有太多意義的0和小數(shù)點(diǎn)，我們可以輸出00111101，這就是信息被壓縮后的結(jié)果，我們完成了一次最簡單的算術(shù)壓縮過程。0.40.60.900.40.160.240.36100.240.160.1920.2080.2320.240.2320.23520.23680.23920.23680.23920.237760.238240.238960.238240.238960.2385280.2386720.238888第四十六頁，共104頁。第四十六頁，共104頁。算術(shù)編碼的特點(diǎn)1）不必預(yù)先定義概率模型，自適應(yīng)模式具有獨(dú)特的優(yōu)點(diǎn)；2）信源符號(hào)概率接近時(shí)，此時(shí)算術(shù)編碼效率高于其他編碼方法。3）算術(shù)編碼繞過了用一個(gè)特定的代碼替代一個(gè)輸入符號(hào)的想法，用一個(gè)浮點(diǎn)輸出數(shù)值代替一個(gè)符號(hào)流的輸入。第四十七頁，共104頁。第四十七頁，共104頁。注意下面幾個(gè)問題1）由于實(shí)際的計(jì)算機(jī)的精度不可能無限長，運(yùn)算中出現(xiàn)溢出是一個(gè)明顯的問題，但多數(shù)機(jī)器都有16位、32位或者64位的精度，因此這個(gè)問題可使用比例縮放方法解決。2）算術(shù)編碼器對(duì)整個(gè)消息只產(chǎn)生一個(gè)碼字，這個(gè)碼字是在間隔[0,1)中的一個(gè)實(shí)數(shù)，因此譯碼器在接受到表示這個(gè)實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。3）算術(shù)編碼也是一種對(duì)錯(cuò)誤很敏感的編碼方法，如果有一位發(fā)生錯(cuò)誤就會(huì)導(dǎo)致整個(gè)消息譯錯(cuò)。第四十八頁，共104頁。第四十八頁，共104頁。LZW壓縮算法LZW壓縮算法是一種無損壓縮方法，由Lemple-Ziv-Welch三人共同創(chuàng)造，用他們的名字命名。它將每個(gè)第一次出現(xiàn)的串放在一個(gè)串表中，用一個(gè)數(shù)字來表示串，壓縮文件只存貯數(shù)字，則不存貯串，從而使圖象文件的壓縮效率得到較大的提高。奇妙的是，不管是在壓縮還是在解壓縮的過程中都能正確的建立這個(gè)串表，壓縮或解壓縮完成后，這個(gè)串表又被丟棄。第四十九頁，共104頁。第四十九頁，共104頁。1.基本原理首先建立一個(gè)字符串表，把每一個(gè)第一次出現(xiàn)的字符串放入串表中，并用一個(gè)數(shù)字來表示，這個(gè)數(shù)字與此字符串在串表中的位置有關(guān)，并將這個(gè)數(shù)字存入壓縮文件中，如果這個(gè)字符串再次出現(xiàn)時(shí)，即可用表示它的數(shù)字來代替，并將這個(gè)數(shù)字存入文件中。壓縮完成后將串表丟棄。如"print"字符串，如果在壓縮時(shí)用266表示，只要再次出現(xiàn)，均用266表示，并將"print"字符串存入串表中，在圖象解碼時(shí)遇到數(shù)字266，即可從串表中查出266所代表的字符串"print"，在解壓縮時(shí)，串表可以根據(jù)壓縮數(shù)據(jù)重新生成。第五十頁，共104頁。第五十頁，共104頁。2.實(shí)現(xiàn)方法A.初始化串表在壓縮圖象信息時(shí)，首先要建立一個(gè)字符串表，用以記錄每個(gè)第一次出現(xiàn)的字符串。一個(gè)字符串表最少由兩個(gè)字符數(shù)組構(gòu)成，一個(gè)稱為當(dāng)前數(shù)組，一個(gè)稱為前綴數(shù)組，一個(gè)基本字符串由當(dāng)前字符和它前面的字符（也稱前綴）構(gòu)成。前綴數(shù)組中存入字符串中的首字符，當(dāng)前數(shù)組存放字符串中的尾字符，其存入位置相同，因此只要確定一個(gè)下標(biāo)，就可確定它所存貯的基本字符串，所以在數(shù)據(jù)壓縮時(shí)，用下標(biāo)代替基本字符串。第五十一頁，共104頁。第五十一頁，共104頁。一般串表大小為4096個(gè)字節(jié)（即212），這意味著一個(gè)串表中最多能存貯4096個(gè)基本字符串，在初始化時(shí)根據(jù)圖象中色彩數(shù)目多少，將串表中起始位置的字節(jié)均賦以數(shù)字，通常當(dāng)前數(shù)組中的內(nèi)容為該元素的序號(hào)（即下標(biāo)），如第一個(gè)元素為0，第二個(gè)元素為1，第15個(gè)元素為14，直到下標(biāo)為色彩數(shù)目加2的元素為止。如果色彩數(shù)為256，則要初始化到第258個(gè)字節(jié)，該字節(jié)中的數(shù)值為257。其中數(shù)字256表示清除碼，數(shù)字257為圖象結(jié)束碼。后面的字節(jié)存放文件中每一個(gè)第一次出現(xiàn)的串。同樣也要音樂會(huì)前綴數(shù)組初始化，其中各元素的值為任意數(shù)，但一般均將其各位置1，即將開始位置的各元素初始化為0XFF，初始化的元素?cái)?shù)目與當(dāng)前數(shù)組相同，其后的元素則要存入每一個(gè)第一次出現(xiàn)的字符串了。如果加大串表的長度可進(jìn)一步提高壓縮效率，但會(huì)降低解碼速度。第五十二頁，共104頁。第五十二頁，共104頁。用lzw算法壓縮原始數(shù)據(jù)的示例分析輸入流，也就是原始的數(shù)據(jù)為:255,24,54,255,24,255,255,24,5,123,45,255,24,5,24,54第五十三頁，共104頁。第五十三頁，共104頁。第幾步前綴后綴·Entry認(rèn)識(shí)(Y/N)輸出標(biāo)號(hào)1255(，255)225524(255,24)

N25525832454(24,54)

N24259454255(54,255)

N54260525524(255,24)

Y6258255(258,255)

N2582617255255(255,255)

N255第五十四頁，共104頁。第五十四頁，共104頁。另一個(gè)例子原輸入數(shù)據(jù)為:ABABABABBBABABAACDACDADCABAAABAB注意原數(shù)據(jù)中只包含4個(gè)character,A,B,C,D

用2bit即可表述，根據(jù)lzw算法，首先擴(kuò)展一位變?yōu)?bit,Clear=2的2次方+1=4;End=4+1=5;

初始標(biāo)號(hào)集應(yīng)該為：012345ABCDClearEnd第五十五頁，共104頁。第五十五頁，共104頁。而壓縮過程為:第幾步前綴后綴Entry認(rèn)識(shí)(Y/N)輸出標(biāo)號(hào)1A(，A)2AB(A,B)

NA63BA(B,A)

NB74AB(A,B)

Y56A(6,A)

N686AB(A,B)

Y76A(6,A)

Y88B(8,B)

N899BB(B,B)

NB1010BB(B,B)

Y1110A(10,A)

N101112AB(A,B)

Y第五十六頁，共104頁。第五十六頁，共104頁。當(dāng)進(jìn)行到第12步的時(shí)候，標(biāo)號(hào)集應(yīng)該為01234567891011ABCDClearEndABBA6A8BBB10A第五十七頁，共104頁。第五十七頁，共104頁。行程長度編碼（RLE）具有相同顏色，并且是連續(xù)的像素?cái)?shù)目稱為行程長度，簡稱長度。行程編碼的基本原理是建筑在圖像的統(tǒng)計(jì)特性基礎(chǔ)之上的，彩色值與其行程長度組合一起作為編碼輸入的碼元進(jìn)行編碼，如下圖所示。適用于在同一行或相鄰行的像素之間具有強(qiáng)相關(guān)性的圖像。第五十八頁，共104頁。第五十八頁，共104頁。2.3有損編碼

壓縮過程中減少了數(shù)據(jù)中包含的數(shù)據(jù)量

解壓縮后恢復(fù)的數(shù)據(jù)與原先的不完全一致

能獲得較高的壓縮比

又稱熵壓縮法

前綴編碼第五十九頁，共104頁。第五十九頁，共104頁。預(yù)測(cè)編碼

編碼和傳輸?shù)牟⒉皇窍笏夭蓸又当旧?，而是這個(gè)采樣值的預(yù)測(cè)值與其實(shí)際值之間的差值相鄰樣本之間存在較強(qiáng)的相關(guān)性差值具有更小的動(dòng)態(tài)范圍第六十頁，共104頁。第六十頁，共104頁。根據(jù)編碼器的實(shí)現(xiàn)機(jī)理，語音編碼方法可以分成三大類，分別是波形編碼、變換編碼和混合編碼。第六十一頁，共104頁。第六十一頁，共104頁。第三章視頻3.1JPEG3.2MPEG視頻第六十二頁，共104頁。第六十二頁，共104頁。3.1JPEGJPEG(JointPhotographicExpertsGroup)

一個(gè)適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)，既可用于灰度圖像又可用于彩色圖像。JPEG算法與彩色空間無關(guān)，處理的彩色圖像是單獨(dú)的彩色分量圖像?；陔x散余弦變換（DCT）的編碼方法。DCT變換：將信號(hào)從一種表達(dá)形式（空間域，即圖像的像素值）變成另一種等同的表達(dá)形式（頻率域，即頻率系數(shù)），并且這種變換過程是不可逆的。DCT變換的作用是使空間域的能量重新分布，降低圖像的相關(guān)性。DCT變換主要用來減少空間冗余。第六十三頁，共104頁。第六十三頁，共104頁。JPEG編碼框圖第六十四頁，共104頁。第六十四頁，共104頁。JPEG20002001年頒布，是JPEG的改進(jìn)版原理：JPEG2000與傳統(tǒng)JPEG最大的不同，在于它放棄了JPEG所采用的以離散余弦轉(zhuǎn)換(DCT，DiscreteCosineTransform)為主的區(qū)塊編碼方式，而改采以小波轉(zhuǎn)換(Wavelettransform)為主的多解析編碼方式。小波轉(zhuǎn)換的主要目的是要將圖像的頻率成分抽取出來。第六十五頁，共104頁。第六十五頁，共104頁。JPEG2000編解碼器原理框圖第六十六頁，共104頁。第六十六頁，共104頁。3.2MPEG視頻

MPEG是在1988年由國際標(biāo)準(zhǔn)化組織(InternationalOrganizationforStandardization，ISO)和國際電工委員會(huì)(InternationalElectrotechnicalCommission，IEC)聯(lián)合成立的專家組。開發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標(biāo)準(zhǔn)。他們開發(fā)的標(biāo)準(zhǔn)稱為MPEG標(biāo)準(zhǔn)。第六十七頁，共104頁。第六十七頁，共104頁。MPEG-1和MPEG-2典型的編碼參數(shù)第六十八頁，共104頁。第六十八頁，共104頁。減少時(shí)間冗余度1.MPEG

1視頻算法為了追求更高的壓縮效率，注重去除圖像序列的時(shí)間冗余度，同時(shí)滿足多媒體等應(yīng)用所必須的隨機(jī)存取要求。為此，MPEG1標(biāo)準(zhǔn)將視頻圖像序列劃分為：幀內(nèi)圖（I幀）預(yù)測(cè)圖（P幀）雙向圖（B幀）直流分量圖（D圖）再根據(jù)不同的圖像類型而區(qū)別對(duì)待。

第六十九頁，共104頁。第六十九頁，共104頁。1幀內(nèi)圖（I幀）可由它來構(gòu)造出其它的幀但不能由其它幀構(gòu)造的幀對(duì)于幀內(nèi)圖只使用類似于JPEG標(biāo)準(zhǔn)的幀內(nèi)編碼第七十頁，共104頁。第七十頁，共104頁。2預(yù)測(cè)圖（P幀）僅由前趨幀構(gòu)造所得，如下圖8所示

第七十一頁，共104頁。第七十一頁，共104頁。3雙向圖（B幀）由前趨和后繼幀差值所得，第七十二頁，共104頁。第七十二頁，共104頁。4直流分量圖是變換系數(shù)的直流分量（DC系數(shù)），代表能量分布的圖。僅使用其自身的信息第七十三頁，共104頁。第七十三頁，共104頁。第七十四頁，共104頁。第七十四頁，共104頁。運(yùn)動(dòng)補(bǔ)償主要用于消除P圖象和B圖象在時(shí)間上的冗余性提高壓縮效率。運(yùn)動(dòng)補(bǔ)償是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法之一。包括運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償插值兩部分。運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)是指視頻的相鄰幀間的運(yùn)動(dòng)部分具有連續(xù)性，即當(dāng)前畫面上的圖像可以看成是前畫某時(shí)刻畫面上圖像的位移，位移的幅度值和方向在畫面各處可以不同。利用運(yùn)動(dòng)位移信息與前面某時(shí)刻的圖像對(duì)當(dāng)前畫面圖像進(jìn)行預(yù)測(cè)的方法，稱為前向預(yù)測(cè)。反之，根據(jù)某時(shí)刻的圖與位移信息預(yù)測(cè)該時(shí)刻之前的圖像，稱為后向預(yù)測(cè)。運(yùn)動(dòng)補(bǔ)償插值是指以插補(bǔ)方法補(bǔ)償運(yùn)動(dòng)信息，是提高視頻壓縮比的最有效措施之一。在時(shí)域中插補(bǔ)運(yùn)動(dòng)補(bǔ)償是一種多分辨率壓縮技術(shù)。例如1/15秒或1/10秒時(shí)間隔選取參考子圖，對(duì)時(shí)域較低分辨率子圖進(jìn)行編碼，通過低分辨子圖反映運(yùn)動(dòng)趨勢(shì)的附加校正信息（運(yùn)動(dòng)夭量）進(jìn)行插值，可得到滿分辨率（幀率1/30秒）的視頻信號(hào)。插值運(yùn)動(dòng)補(bǔ)償也稱為雙向預(yù)測(cè)，因?yàn)樗壤昧饲懊鎺男畔⒂掷昧撕竺鎺男畔?。第七十五頁，?04頁。第七十五頁，共104頁。在MPEG方案中，運(yùn)動(dòng)補(bǔ)償技術(shù)工作在宏塊一級(jí)。宏塊分類如下：B圖象宏塊有4種類型幀內(nèi)宏塊，簡稱I塊；前向預(yù)測(cè)宏塊，簡稱F塊；后向預(yù)測(cè)宏塊，簡稱B塊；平均宏塊，簡稱A塊。對(duì)于P圖象，其宏塊只有I塊和F塊兩種第七十六頁，共104頁。第七十六頁，共104頁。運(yùn)動(dòng)估計(jì)就是運(yùn)動(dòng)向量的求取過程。運(yùn)動(dòng)向量的選擇范圍是基于幀間圖像的時(shí)間分辯率和塊內(nèi)圖像的時(shí)間分辯率，以及幀序列圖像的性質(zhì)而選定。第七十七頁，共104頁。第七十七頁，共104頁。MPEG

1數(shù)據(jù)流結(jié)構(gòu)第七十八頁，共104頁。第七十八頁，共104頁。GSM編譯碼器簡介

1988年頒布GSM標(biāo)準(zhǔn)，也稱泛歐數(shù)字蜂窩通信標(biāo)準(zhǔn)

GSM壓縮后的數(shù)據(jù)率為：13.2kb/sGSM的壓縮比：128∶13.2=9.7，近似于10∶1第七十九頁，共104頁。第七十九頁，共104頁。第五章多媒體網(wǎng)絡(luò)通信5.1基本術(shù)語與概念5.2局域網(wǎng)（LAN）技術(shù)第八十頁，共104頁。第八十頁，共104頁。5.1基本術(shù)語與概念基本概念1.TCP/IPTCP/IP是英文TrasmissionControlProtocol/InternetProtocol的縮寫，也稱為傳輸控制協(xié)議/國際互連協(xié)議。其目的是將各種異構(gòu)計(jì)算機(jī)網(wǎng)絡(luò)或主機(jī)通過TCP/IP實(shí)現(xiàn)互連互通。第八十一頁，共104頁。第八十一頁，共104頁。網(wǎng)絡(luò)地址

MAC地址: MAC地址由數(shù)據(jù)鏈路層地址子集組成。對(duì)于某個(gè)局域網(wǎng)接口來說，MAC地址是唯一的。其地址長度為48位。網(wǎng)絡(luò)層地址 IP地址:IP地址是網(wǎng)上主機(jī)地址的數(shù)字形式，與主機(jī)的域名一一對(duì)應(yīng)。IPv4地址是一個(gè)32位的二進(jìn)制數(shù)。常用的IP地址有以下幾種：A類地址空間：1.0.0.0～126.255.255.255;B類地址空間：128.0.0.0～191.255.255.255;C類地址空間：192.0.0.0～223.255.255.255。第八十二頁，共104頁。第八十二頁，共104頁。IPv6地址類型::/128:1/128 回環(huán)地址2001::/16

全球可聚合地址2002::/16 6to4自動(dòng)構(gòu)造隧道地址3ffe::/16

早期IPv6試驗(yàn)網(wǎng)地址fe80::/10

本地鏈路地址ff00::/8

組播地址::A.B.C.D 兼容IPv4的IPv6地址::FFFF:A.B.C.D IPv4映射的IPv6地址第八十三頁，共104頁。第八十三頁，共104頁。5.2局域網(wǎng)（LAN）技術(shù)IEEE802標(biāo)準(zhǔn)1.局域網(wǎng)分類（1）以太網(wǎng)（Ethernet）帶有檢測(cè)沖突的載波偵聽多路存?。–SMA/CD）（2）令牌網(wǎng)（RingToken）（3）光纖分布式數(shù)據(jù)接口（FDDI）第八十四頁，共104頁。第八十四頁，共104頁。100Base-T快速以太網(wǎng) 網(wǎng)絡(luò)最大直徑為205m；傳輸介質(zhì)采用5類UTP或光纜。100Base-T： 100Base-TX 100Base-FX 100Base-T4千兆位快速以太網(wǎng)： 1000Base-SX 1000Base-LX 1000Base-CX 1000Base-T第八十五頁，共104頁。第八十五頁，共104頁。FDMA是把分配給無線蜂窩電話通訊的頻段分為若干個(gè)信道，每一個(gè)信道都能夠傳輸語音通話、數(shù)字服務(wù)和數(shù)字?jǐn)?shù)據(jù)。CDMA指通信中的一種多路復(fù)用技術(shù)，在CDMA方式中，用戶共享時(shí)間和頻率分配并由唯一指配碼指配。在接收端通過使用只接收來自所需電路信號(hào)能量的相關(guān)器把信號(hào)分開。不需要的信號(hào)被做為噪音忽略掉。

TDMA如果物理信道所能達(dá)到的傳輸率超過傳單一信源要求的數(shù)據(jù)傳輸率，則可將物理信道按時(shí)間分成時(shí)間片，輪流地分配給每個(gè)用戶，每個(gè)時(shí)間片由復(fù)用的一個(gè)用戶占用。

多路復(fù)用技術(shù)是把多個(gè)低信道組合成一個(gè)高速信道的技術(shù),它可以有效的提高數(shù)據(jù)鏈路的利用率,從而使得一條高速的主干鏈路同時(shí)為多條低速的接入鏈路提供服務(wù),也就是使得網(wǎng)絡(luò)干線可以同時(shí)運(yùn)載大量的語音和數(shù)據(jù)傳輸。

第八十六頁，共104頁。第八十六頁，共104頁。ATM技術(shù)1.ATM的產(chǎn)生隨著多媒體技術(shù)的出現(xiàn)，人們對(duì)對(duì)帶寬的需求也越來越高。針對(duì)這種情況，CCITT研究制定了B-ISDN（寬帶綜合業(yè)務(wù)數(shù)字網(wǎng)）標(biāo)準(zhǔn)。ATM就是支持B-ISDN服務(wù)的一種交換技術(shù)。2.ATM信元結(jié)構(gòu)ATM信息傳輸采用固定長格式，一律為53字節(jié)，稱為ATM數(shù)據(jù)信元。其中包括48個(gè)字節(jié)的數(shù)據(jù)和5個(gè)字節(jié)的信元頭。ATM信元結(jié)構(gòu)如圖5-21所示。第八十七頁，共104頁。第八十七頁，共104頁。ATM信元結(jié)構(gòu)如圖5-21所示。圖5-21信元結(jié)構(gòu)3.ATM的傳輸模式ATM采用面向連接的傳輸方式，將數(shù)據(jù)分割成固定長度的信元，通過虛連接進(jìn)行交換。一個(gè)ATM的傳輸過程可以包括三個(gè)階段：連接建立、數(shù)據(jù)傳輸和連接終止第八十八頁，共104頁。第八十八頁，共104頁。ATM與IP的比較：1、ATM是面向連接的，但I(xiàn)P是無連接的。當(dāng)在一個(gè)面向連接的ATM網(wǎng)絡(luò)上傳送無連接的IP分組時(shí)，還可以有兩種選擇。第一種方法是每傳送一個(gè)分組就根據(jù)需要建立一條ATM連接，而第二種方法是在事先配置好的連接上傳送。2、ATM的一個(gè)突出優(yōu)點(diǎn)就是有服務(wù)質(zhì)量QoS的保證。但I(xiàn)P（目前是IPv4）則沒有服務(wù)質(zhì)量的概念，每一個(gè)分組按照“盡最大努力”的原則由路由器轉(zhuǎn)發(fā)。第八十九頁，共104頁。第八十九頁，共104頁。接入網(wǎng)基礎(chǔ)1、概念接入網(wǎng)AN（AccessNetwork），也稱為用戶接入網(wǎng)，是由業(yè)務(wù)節(jié)點(diǎn)接口（SNI）和相關(guān)用戶網(wǎng)絡(luò)接口（UNI）之間的一系列傳送實(shí)體（例如線路設(shè)施和傳輸設(shè)備）組成的。2、接入網(wǎng)的功能結(jié)構(gòu)它位于交換局端和用戶終端之間，可以支持各種交換型和非交換型業(yè)務(wù)，并將這些業(yè)務(wù)流組合后沿著公共的傳輸通道送往業(yè)務(wù)節(jié)點(diǎn)。3、分類接入網(wǎng)可以分為有線接入網(wǎng)和無線接入網(wǎng)：有線接入網(wǎng)包括銅線接入網(wǎng)、光纖接入網(wǎng)和混合光纖/同軸電纜接入網(wǎng)；無線接入網(wǎng)包括固定無線接入網(wǎng)和移動(dòng)接入網(wǎng)第九十頁，共104頁。第九十頁，共104頁。目前3G存在四種標(biāo)準(zhǔn)CDMA2000WCDMATD-SCDMAWiMAX第九十一頁，共104頁。第九十一頁，共104頁。LTELTE(LongTermEvolution,長期演進(jìn))項(xiàng)目是3G的演進(jìn)，LTE并非人們普遍誤解的4G技術(shù)，而是3G與4G技術(shù)之間的一個(gè)過渡，是3.9G的全球標(biāo)準(zhǔn)。第九十二頁，共104頁。第九十二頁，共104頁。HSPA 高速分組接入技術(shù)HSPA（HighSpeedPacketAccess）分為HSDPA和HSUPA。 HSDPA（高速下行分組接入）在下行鏈路上能夠?qū)崿F(xiàn)高

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

多媒體技術(shù)復(fù)習(xí)

文檔簡介

溫馨提示

最新文檔

評(píng)論

多媒體技術(shù)復(fù)習(xí)

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔