多媒體計(jì)算機(jī)技術(shù)-電子教案-第5章-多媒體數(shù)據(jù)壓縮編碼技術(shù)課件_第1頁(yè)
多媒體計(jì)算機(jī)技術(shù)-電子教案-第5章-多媒體數(shù)據(jù)壓縮編碼技術(shù)課件_第2頁(yè)
多媒體計(jì)算機(jī)技術(shù)-電子教案-第5章-多媒體數(shù)據(jù)壓縮編碼技術(shù)課件_第3頁(yè)
多媒體計(jì)算機(jī)技術(shù)-電子教案-第5章-多媒體數(shù)據(jù)壓縮編碼技術(shù)課件_第4頁(yè)
多媒體計(jì)算機(jī)技術(shù)-電子教案-第5章-多媒體數(shù)據(jù)壓縮編碼技術(shù)課件_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第5章多媒體數(shù)據(jù)壓縮編碼技術(shù)

多媒體數(shù)據(jù)壓縮編碼的重要性隨著計(jì)算機(jī)技術(shù)的高度發(fā)展以及通信、計(jì)算機(jī)和大眾傳媒三大技術(shù)的相互融合,計(jì)算機(jī)已經(jīng)不再局限于數(shù)值計(jì)算、文字處理的范疇,而成為處理圖形、圖像、視頻、音頻等多種信息的工具。但數(shù)字化后的聲音、圖像、視頻和音頻等多媒體數(shù)據(jù)是非常龐大的。例如:一頁(yè)在A4(216mm×300mm)紙上的照片,以300dpi(12像素/mm)采樣,每個(gè)像素用24位真彩色信號(hào)表示,其數(shù)據(jù)量約為25MB/頁(yè),650MB的CD-ROM只可放14頁(yè);雙聲道立體聲光盤,采樣率是44.1kHz,采樣精度16位,一秒鐘數(shù)據(jù)量是44.1×16×2/8=176KB/s,一張CD只能存放約1小時(shí)的聲音。

多媒體數(shù)據(jù)壓縮編碼的重要性對(duì)于如此巨大的多媒體數(shù)據(jù),如果不經(jīng)過(guò)壓縮,不僅超出了計(jì)算機(jī)的存儲(chǔ)和處理能力,而且在現(xiàn)在的通信信道的傳輸速率下,是無(wú)法完成大量多媒體信息的傳輸?shù)?,多媒體數(shù)據(jù)的高速傳輸和儲(chǔ)藏所需要的巨大容量已經(jīng)成為多媒體數(shù)據(jù)通信技術(shù)的最大障礙。因此,為了存儲(chǔ)、處理和傳輸這些數(shù)據(jù),必須進(jìn)行壓縮。多媒體數(shù)據(jù)壓縮編碼的重要性多媒體數(shù)據(jù)之所以能夠進(jìn)行壓縮是因?yàn)樵紨?shù)據(jù)是高度相關(guān)的,存在很大的數(shù)據(jù)冗余。多媒體數(shù)據(jù)所包含的冗余信息一般有以下幾種:(1)統(tǒng)計(jì)冗余。(2)信息熵冗余。(3)結(jié)構(gòu)冗余。

(4)知識(shí)冗余。

(5)視覺(jué)冗余。

統(tǒng)計(jì)冗余圖像數(shù)據(jù)存在大量的統(tǒng)計(jì)特征的重復(fù),這種重復(fù)包括靜態(tài)單幀圖像數(shù)據(jù)在空間上的冗余和音頻、視頻數(shù)據(jù)在時(shí)間上的冗余。

在動(dòng)態(tài)圖像序列中,前后兩幀圖像之間具有較大的相關(guān)性,表現(xiàn)出幀與幀之間的重復(fù),因而存在時(shí)間冗余。

信息熵冗余

信息熵定義為一組數(shù)據(jù)所表示的信息量,即

式中,E為信息熵,N為數(shù)據(jù)的種類(或稱碼元)個(gè)數(shù),為第i個(gè)碼元出現(xiàn)的概率。一組數(shù)據(jù)的數(shù)據(jù)量顯然等于各記錄碼元的二進(jìn)制位數(shù)(即編碼長(zhǎng)度)與該碼元出現(xiàn)的概率乘積之和,即

式中,D為數(shù)據(jù)量,為第i個(gè)碼元的二進(jìn)制位數(shù)。一般取(如ASCII編碼把所有碼元都編碼為7比特),這樣得到的D必然大于E。這種因碼元編碼長(zhǎng)度的不經(jīng)濟(jì)帶來(lái)的冗余稱為信息熵冗余或編碼冗余。

信息熵冗余圖26個(gè)英文字母相對(duì)頻率結(jié)構(gòu)冗余

有些圖像從大面積上或整體上看存在著重復(fù)出現(xiàn)的相同或詳盡的紋理結(jié)構(gòu),例如布紋圖像和草席圖像,被稱為結(jié)構(gòu)冗余。

知識(shí)冗余許多圖像的理解與圖像所表現(xiàn)內(nèi)容的基礎(chǔ)知識(shí)(鮮艷或背景知識(shí))有相當(dāng)大的相關(guān)性,從這種知識(shí)出發(fā)可以歸納出圖像的某種規(guī)律性變化,這類冗余稱為知識(shí)冗余。知識(shí)冗余的一個(gè)典型例子是對(duì)人像的理解,如鼻子上方有眼睛、鼻子又在嘴的上方等。視覺(jué)冗余人類的視覺(jué)系統(tǒng)實(shí)際上只在一定程度上對(duì)圖像的變化產(chǎn)生敏感,即圖像數(shù)據(jù)中存在著大量人類視覺(jué)覺(jué)察不到的細(xì)節(jié)。事實(shí)上,人類視覺(jué)系統(tǒng)的一般分辨率為64灰度級(jí),而一般圖像量化采用的是256灰度級(jí),這類冗余稱為視覺(jué)冗余。多媒體數(shù)據(jù)壓縮方法的分類多媒體數(shù)據(jù)壓縮方法有許多種,從不同的角度出發(fā)有不同的分類方法。1.從信息論角度出發(fā)可分為兩大類

(1)冗余度壓縮方法。也稱無(wú)損壓縮、信息保持編碼或熵編碼。(2)信息量壓縮方法。也稱有損壓縮、失真度編碼或熵壓縮編碼。

2.按壓縮算法分類現(xiàn)有多媒體數(shù)據(jù)的壓縮編碼方案可分為統(tǒng)計(jì)編碼、預(yù)測(cè)編碼、脈沖編碼調(diào)制、變換編碼、子帶編碼、分形編碼和小波編碼等。評(píng)價(jià)多媒體數(shù)據(jù)壓縮方法的指標(biāo)評(píng)價(jià)多媒體數(shù)據(jù)壓縮方法有3個(gè)主要指標(biāo):1.壓縮比2.壓縮質(zhì)量(失真度)3.壓縮與解壓的速度

壓縮比并不是一個(gè)絕對(duì)的指標(biāo)將16M色的真彩圖像(圖A)轉(zhuǎn)變?yōu)?56色(圖B),數(shù)據(jù)量減少了約3倍,壓縮比為1:3.當(dāng)然這時(shí)產(chǎn)生了色彩失真,但如果選擇原圖的色彩范圍定義調(diào)色板,色彩失真較小,人眼一般都還能接受.如果把圖像深度從8位再壓縮到4位,即從256色再壓到16色(圖C),雖然數(shù)據(jù)量只減少了2倍,壓縮比為1:2,但這時(shí)的人眼所看到的色彩失真比第一次大得多,效果很差圖像效果

圖像類型圖A真彩色圖像圖B256色圖像圖C16色圖像壓縮比8/24=1/34/24=1/6常用的編碼方法根據(jù)壓縮算法的原理,可以將壓縮算法分為如下幾類:信息熵編碼(主要有行程長(zhǎng)度編碼、哈夫曼編碼和算術(shù)編碼)、通用編碼、預(yù)測(cè)編碼、模型法編碼、矢量量化編碼、子帶編碼和混合編碼等。信息熵編碼1.行程長(zhǎng)度編碼行程長(zhǎng)度編碼(Run-LengthEncoding,RLE)又叫游程編碼,是壓縮文件最簡(jiǎn)單的方法之一。把一系列的重復(fù)值(例如圖像象素的灰度值)用一個(gè)單獨(dú)的值再加上一個(gè)計(jì)數(shù)值來(lái)取代。

比如有這樣一個(gè)字母序列aabbbccccccccdddddd它的行程長(zhǎng)度編碼就是2a3b8c6d。

很多位圖文件格式都用行程長(zhǎng)度編碼,例如TIFF,PCX、GEM等。行程長(zhǎng)度編碼例有一線狀圖像,其灰度隨長(zhǎng)度坐標(biāo)的關(guān)系如圖3.1所示。描述這個(gè)一維圖像可以用順序的七個(gè)3bit的二進(jìn)制數(shù)表示:011,011,011,011,101,101,101,共21比特。

如果用行程編碼方法對(duì)其編碼,其編碼就變成了100,011;011,101,共用了12比特,比前一種編碼節(jié)約了9個(gè)比特。

哈夫曼編碼編碼步驟如下:統(tǒng)計(jì)信源符號(hào)出現(xiàn)的概率;將信源符號(hào)按概率遞減順序排列;

把兩個(gè)最小的概率值加起來(lái),作為一個(gè)新組合符號(hào)的概率;重復(fù)步驟(2)、(3),直到概率和達(dá)到1為止;在每次合并信源時(shí),將合并的信源分別標(biāo)記“1”和“0”(例如,概率小的標(biāo)記為“1”,概率大的標(biāo)記為“0”);尋找從每一信源符號(hào)到概率為1的路徑,記錄下路徑上的“1”和“0”;對(duì)每一符號(hào)寫出“1”和“0”序列;

哈夫曼編碼的例子考慮信源進(jìn)行哈夫曼編碼的過(guò)程如下:

信源符號(hào)X1X2X3X4X5X6

概率0.250.250.200.150.10.05哈夫曼編碼的不足

它必須精確地統(tǒng)計(jì)出原始文件中每個(gè)值的出現(xiàn)頻率,如果沒(méi)有這個(gè)精確統(tǒng)計(jì),壓縮的效果就會(huì)大打折扣,甚至根本達(dá)不到壓縮的效果。因此哈夫曼編碼通常要經(jīng)過(guò)兩遍操作,第一遍進(jìn)行統(tǒng)計(jì),第二遍產(chǎn)生編碼,所以編碼的過(guò)程是比較慢的。另外由于各種長(zhǎng)度的編碼的譯碼過(guò)程也比較復(fù)雜,因此解壓縮的過(guò)程也比較慢。它對(duì)于位的增刪比較敏感。

算術(shù)編碼算術(shù)編碼在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG,JBIG)中扮演了重要的角色。在算術(shù)編碼中,消息用0到1之間的實(shí)數(shù)進(jìn)行編碼,算術(shù)編碼用到兩個(gè)基本的參數(shù):符號(hào)的概率和它的編碼間隔。信源符號(hào)的概率決定壓縮編碼的效率,也決定編碼過(guò)程中信源符號(hào)的間隔,而這些間隔包含在0到1之間。編碼過(guò)程中的間隔決定了符號(hào)壓縮后的輸出。算法舉例假設(shè)信源符號(hào)為{00,01,10,11},這些符號(hào)的概率分別為{0.1,0.4,0.2,0.3},根據(jù)這些概率可把間隔[0,1)分成4個(gè)子間隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),二進(jìn)制消息序列的輸入為:10001100101101算術(shù)編碼算術(shù)編碼的主要特點(diǎn)(1)信源符號(hào)的出現(xiàn)概率比較接近時(shí),算術(shù)編碼的效率比哈夫曼編碼高。(2)算術(shù)編碼的實(shí)現(xiàn)比哈夫曼編碼復(fù)雜。算術(shù)編碼是一種相對(duì)比較新的編碼,它在許多方面比哈夫曼編碼優(yōu)越;算術(shù)編碼是按照分?jǐn)?shù)比特逼近熵,而哈夫曼編碼是按照整數(shù)比特逼近熵;算術(shù)編碼可以有效地從模型中分離出來(lái),而哈夫曼編碼是與統(tǒng)計(jì)模型強(qiáng)相關(guān)的。算術(shù)編碼需要注意的幾個(gè)問(wèn)題1.由于實(shí)際計(jì)算機(jī)精度不可能無(wú)限長(zhǎng),運(yùn)算中溢出是明顯的問(wèn)題,但多數(shù)機(jī)器都有16位、32位或者64位的精度,因此可使用比例縮放法解決。2.算術(shù)編碼器對(duì)消息只產(chǎn)生一個(gè)碼字,這個(gè)碼字是在[0,1)中的一個(gè)實(shí)數(shù),因此譯碼器在接受到表示這個(gè)實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。3.算術(shù)編碼也是一種對(duì)錯(cuò)誤很敏感的編碼方法,如果有一位發(fā)生錯(cuò)誤就會(huì)導(dǎo)致整個(gè)消息譯錯(cuò)。算術(shù)編碼可以是靜態(tài)的或者自適應(yīng)的。在靜態(tài)算術(shù)編碼中,信源符號(hào)的概率是固定的。在自適應(yīng)算術(shù)編碼中,信源符號(hào)的概率根據(jù)編碼時(shí)符號(hào)出現(xiàn)的頻繁程度動(dòng)態(tài)地進(jìn)行修改,在編碼期間估算信源符號(hào)概率的過(guò)程叫做建模。需要開(kāi)發(fā)動(dòng)態(tài)算術(shù)編碼的原因是因?yàn)槭孪戎谰_的信源概率是很難的,而且是不切實(shí)際的。當(dāng)壓縮消息時(shí),我們不能期待一個(gè)算術(shù)編碼器獲得最大的效率,所能做的最有效方法是在編碼過(guò)程中估算概率。因此動(dòng)態(tài)建模成為確定編碼器壓縮效率的關(guān)鍵。詞典編碼詞典編碼的思想第一類詞典法的想法是企圖查找正在壓縮的字符序列是否在以前輸入的數(shù)據(jù)中出現(xiàn)過(guò),然后用已經(jīng)出現(xiàn)過(guò)的字符串替代重復(fù)的部分,它的輸出僅僅是指向早期出現(xiàn)過(guò)的字符串的“指針”。第二類詞典編碼第二類算法的想法是企圖從輸入的數(shù)據(jù)中創(chuàng)建一個(gè)“短語(yǔ)詞典(dictionaryofthephrases)”,這種短語(yǔ)可以是任意字符的組合。編碼數(shù)據(jù)過(guò)程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的“短語(yǔ)”時(shí),編碼器就輸出這個(gè)詞典中的短語(yǔ)的“索引號(hào)”,而不是短語(yǔ)本身。LZW算法的壓縮過(guò)程

LZW算法在壓縮過(guò)程中主要處理3種數(shù)據(jù):輸入流、輸出流和一張字符串表。輸入流就是原始的字符流(對(duì)圖像處理而言就是圖像數(shù)據(jù)),輸出流則是壓縮生成的代碼流。LZW壓縮程序的任務(wù)就是把輸入的原始數(shù)據(jù)轉(zhuǎn)換成比原來(lái)短的代碼串。字符串表是整個(gè)算法的核心。LZW算法和其他一些壓縮技術(shù)的不同之處在于它是動(dòng)態(tài)地標(biāo)記數(shù)據(jù)流中出現(xiàn)的重復(fù)串。它把壓縮過(guò)程中遇到的字符串記錄在這張龐大的表中,在下一次又碰到這一字符串的時(shí)候,就用一個(gè)代碼來(lái)表示它,通過(guò)用短代碼來(lái)表示相對(duì)較長(zhǎng)的字符串來(lái)壓縮數(shù)據(jù)量。其具體壓縮流程如右圖所示。LZW算法的解壓縮過(guò)程

解開(kāi)一個(gè)GIF圖像實(shí)際上剛好是壓縮的一個(gè)逆過(guò)程。字符流變成了輸出流,而代碼流變成了輸入流。同樣,解壓縮程序也要生成并維護(hù)與壓縮時(shí)所用的一模一樣的串表。解壓縮程序從串表中查到輸入代碼對(duì)應(yīng)的字符串,再將此字符串輸出。右圖給出了解壓縮過(guò)程的流程。預(yù)測(cè)編碼通常,圖像中局部區(qū)域的像素是高度相關(guān)的,因此可以用先前像素的有關(guān)灰度知識(shí)來(lái)對(duì)當(dāng)前像素的灰度進(jìn)行估計(jì),這就是預(yù)測(cè)。如果預(yù)測(cè)是正確的,則不必對(duì)每一個(gè)像素的灰度都進(jìn)行壓縮,而是把預(yù)測(cè)值與實(shí)際像素值之間的差值經(jīng)過(guò)熵編碼后發(fā)送到接收端,接收端通過(guò)預(yù)測(cè)值+差值信號(hào)來(lái)重建原像素。預(yù)測(cè)編碼可分為線性預(yù)測(cè)編碼和非線性預(yù)測(cè)編碼。前者常被稱為差分脈沖編碼調(diào)制,即DPCM(DifferentialPulseCodeModulation)。DPCM的原理框圖(a)DPCM編碼框圖(b)DPCM譯碼框圖DPCM編碼示例DPCM系統(tǒng)如圖所示,預(yù)測(cè)器的預(yù)測(cè)值為前一個(gè)樣值(圖中D表示單位延遲)。假設(shè)輸入信號(hào)已經(jīng)量化,差值不再進(jìn)行量化。若DPCM系統(tǒng)的輸入為{0,1,2,1,1,2,3,3,4,4,…},則編碼過(guò)程如下:變換編碼變換編碼是進(jìn)行一種可逆的函數(shù)變換(例如離散傅里葉變換),映射變換從一個(gè)信號(hào)域變換到另一個(gè)信號(hào)域。在變換到另一個(gè)信號(hào)域的過(guò)程中,只要適當(dāng)處理,就可以大大減少需要編碼的信息,從而達(dá)到減化編碼過(guò)程,實(shí)現(xiàn)數(shù)據(jù)壓縮的目的,通常壓縮效果很好。變換編碼原理圖模型編碼模型編碼將圖像信號(hào)看成三維世界中的目標(biāo)和景物投影到二維平面的產(chǎn)物,而對(duì)這一產(chǎn)物的評(píng)價(jià)是由人類視覺(jué)系統(tǒng)的特性決定的。模型編碼的關(guān)鍵是對(duì)特定的圖像建立模型,并根據(jù)這個(gè)模型確定圖像中景物的特征參數(shù),如運(yùn)動(dòng)參數(shù)、形狀參數(shù)等。解碼時(shí)根據(jù)參數(shù)和已知模型用圖像合成技術(shù)重建圖像。由于編碼的對(duì)象是特征參數(shù),而不是原始圖原像,因此有可能實(shí)現(xiàn)比較大的壓縮比。模型編碼引入的誤差主要是人眼視覺(jué)不太敏感的幾何失真,因此重建圖像非常自然和逼真。1988年召開(kāi)的首屆“64kb/s活動(dòng)圖像編碼工作會(huì)議”確定了模型編碼為新一代的編碼方法?;旌暇幋a

以兩種或兩種以上的方法對(duì)圖像進(jìn)行編碼稱為混合編碼,本章后面介紹的JPEG和MPEG都屬于混合編碼。多媒體數(shù)據(jù)壓縮的國(guó)際標(biāo)準(zhǔn)音頻壓縮標(biāo)準(zhǔn)音頻信號(hào)是多媒體信息的重要組成部分。目前,業(yè)界公認(rèn)的聲音質(zhì)量標(biāo)準(zhǔn)分為4級(jí),即數(shù)字激光唱盤CD-DA質(zhì)量,其信號(hào)帶寬為10Hz~20kHz;調(diào)頻廣播FM質(zhì)量,其信號(hào)帶寬為20Hz~l5kHz;調(diào)幅廣播AM質(zhì)量,其信號(hào)帶寬為50Hz~7kHz;電話的話音質(zhì)量,其信號(hào)帶寬為200Hz~3.4kHz??梢?jiàn),數(shù)字激光唱盤的聲音質(zhì)量最高,電話的話音質(zhì)量最低。數(shù)字音頻壓縮技術(shù)標(biāo)準(zhǔn)分為電話語(yǔ)音壓縮、調(diào)幅廣播語(yǔ)音壓縮、高保真立體聲音頻壓縮三種。ITU-T的G系列聲音壓縮標(biāo)準(zhǔn)ITU-T是國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門,它研究和制定除無(wú)線電以外的所有電信領(lǐng)域標(biāo)準(zhǔn)。對(duì)于不同的音頻信號(hào),ITU-T制定了不同的音頻標(biāo)準(zhǔn)。(1)用于電話質(zhì)量的語(yǔ)音壓縮標(biāo)準(zhǔn)。(2)用于調(diào)幅廣播質(zhì)量的音頻壓縮標(biāo)準(zhǔn)。G.7xx標(biāo)準(zhǔn)

G.7xx是一組ITU-T標(biāo)準(zhǔn),用于音頻壓縮和解壓縮,主要用于電話方面。在電話技術(shù)中,有兩個(gè)主要的算法標(biāo)準(zhǔn),分別定義在mu-law算法(美國(guó)使用)和a-law算法(歐洲及世界其他國(guó)家使用)中。兩者都是基于對(duì)數(shù)關(guān)系的,但對(duì)于計(jì)算機(jī)的處理來(lái)說(shuō),后者更為簡(jiǎn)單。G.7xx協(xié)議組的組成G.711:64kb/s信道上的語(yǔ)音頻率脈沖編碼調(diào)制(PCM)。量化位數(shù)為8bit,采樣頻率為8kHz。G.721:32kb/s自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)。量化位數(shù)為4bit,采樣頻率為8kHz。G.722:64kb/s下的7kHz音頻編碼,采樣頻率為16kHz。采用子帶編碼,即將16kHz的頻帶分為兩個(gè)子帶,通過(guò)ADPCM分別進(jìn)行編碼。G.722.1:帶有低幀損耗的具有免提操作的系統(tǒng)在24kb/s和32kb/s上的編碼。G.722.2:利用自適應(yīng)多頻率寬帶(AMR-WB)以16kb/s多頻率語(yǔ)音編碼。G.7xx協(xié)議組的組成G.723:24kb/s自適應(yīng)差分脈沖編碼調(diào)制。采樣頻率為8kHz。G.726:40、32、24、16kb/s自適應(yīng)差分脈沖編碼調(diào)制。采樣頻率為8kHz。G.727:采用嵌入式自適應(yīng)差分脈沖編碼調(diào)制。G.728:利用短時(shí)延碼本激勵(lì)線性預(yù)測(cè)(LD-CELP)算法,比特率為16kb/s,采樣頻率為8kHz。G.729:利用共軛結(jié)構(gòu)—代數(shù)激勵(lì)編碼線性預(yù)測(cè)(CS-ACELP),比特率為8kb/s。高保真立體聲音頻壓縮標(biāo)準(zhǔn)高保真立體聲音頻信號(hào)的頻率范圍為50Hz~20kHz,在44.1kHz采樣頻率下用16bit量化,信號(hào)速率為每聲道705kb/s。目前國(guó)際上比較成熟的高保真立體聲音頻壓縮標(biāo)準(zhǔn)為MPEG音頻。MPEG是由音頻和視頻兩部分組成的,可以分別進(jìn)行壓縮。MPEG

MPEG音頻根據(jù)不同的算法分為三個(gè)層次。Layer1與Layer2具有大致相同的算法。輸入音頻信號(hào)的采樣頻率為48kHz、44.1kHz或32kHz,經(jīng)過(guò)濾波器組分成32個(gè)子帶。同時(shí)編碼器利用人耳的掩蔽效應(yīng),根據(jù)音頻信號(hào)的性質(zhì)計(jì)算各個(gè)頻率分量的掩蔽門限,以控制每一個(gè)子帶的量化參數(shù),達(dá)到數(shù)據(jù)壓縮的目的。MPEG音頻的Layer3進(jìn)一步引入了輔助子帶、非均勻量化和熵編碼等技術(shù),可以進(jìn)一步壓縮碼率,目前在因特網(wǎng)CD光盤中廣泛使用的MP3音樂(lè)就屬于這一層次。立體聲信號(hào)的編碼也可以在MPEG音頻中作為附加功能實(shí)現(xiàn)。MPEG音頻壓縮技術(shù)的傳輸速率為每聲道32~448kb/s。MPEG音頻編碼器和解碼器的原理框圖

MPEG音頻編碼器原理框圖

MPEG音頻解碼器原理框圖

靜止圖像的壓縮標(biāo)準(zhǔn)對(duì)于靜止圖像來(lái)說(shuō),目前有很多壓縮標(biāo)準(zhǔn),如ISO制定的JPEG標(biāo)準(zhǔn)、JBIG標(biāo)準(zhǔn)、ITU-T制訂的G3和G4標(biāo)準(zhǔn)等。JPEG標(biāo)準(zhǔn)適用于黑白及彩色照片、彩色傳真和印刷圖片,可以支持很高的圖像分辨率和量化精度。JPEG聯(lián)合圖像專家組(JointPhotographicCodingExpertsGroup,JPEG)是由國(guó)際標(biāo)準(zhǔn)化組織ISO和國(guó)際電報(bào)電話咨詢委員會(huì)CCITT組織于1986年底成立的,負(fù)責(zé)制定一種用于連續(xù)色調(diào)的(黑白的或真彩色的)靜止圖像壓縮編碼的通用算法的國(guó)際標(biāo)準(zhǔn)。該組織于1991年3月公布了他們提出的壓縮標(biāo)準(zhǔn)的草案,1992年JPEG成為ISO國(guó)際標(biāo)準(zhǔn)。JPEGJPEG專家組開(kāi)發(fā)了兩種基本的壓縮算法:一種是以空間線性預(yù)測(cè)技術(shù)(DPCM)為基礎(chǔ)的無(wú)損壓縮算法,不會(huì)產(chǎn)生失真,但壓縮比很?。涣硪环N是采用以離散余弦變換(DiscreteCosineTransform,DCT)為基礎(chǔ)的有損壓縮算法,它利用了人們視覺(jué)系統(tǒng)的特性,去掉視覺(jué)冗余信息和數(shù)據(jù)本身的冗余信息,包含基本系統(tǒng)(必須保證的功能)和擴(kuò)展系統(tǒng)(擴(kuò)充功能),這種算法進(jìn)行圖像壓縮時(shí)信息雖有損失,但壓縮比可以很大,例如當(dāng)壓縮比達(dá)到25:1左右時(shí),人眼基本上無(wú)法察覺(jué)失真。現(xiàn)在應(yīng)用較多的是有損壓縮算法。JPEGJPEG定義了3種編碼系統(tǒng)。無(wú)損預(yù)測(cè)編碼系統(tǒng):用于無(wú)失真的應(yīng)用場(chǎng)合。基于DCT的有損編碼基本系統(tǒng):可用于絕大多數(shù)壓縮應(yīng)用場(chǎng)合基于DCT的有損編碼增強(qiáng)系統(tǒng):用于高壓縮比、高精確度或漸進(jìn)重建應(yīng)用等場(chǎng)合。JPEGJPEG規(guī)定了4種運(yùn)行模式,以滿足不同需要。無(wú)損預(yù)測(cè)編碼模式:壓縮比可以達(dá)到2:1?;贒CT的有損順序編碼模式:壓縮比可以達(dá)到10:1以上。基于DCT的漸進(jìn)編碼模式?;贒CT的分層編碼模式。JPEG的無(wú)損預(yù)測(cè)編碼PEG采用了基于預(yù)測(cè)編碼的壓縮算法,其框圖如下圖所示。該算法采用一個(gè)簡(jiǎn)單的預(yù)測(cè)器,其工作原理是從X中減去預(yù)測(cè)值,得到差值,然后不進(jìn)行量化,直接進(jìn)行無(wú)失真的熵編碼(哈夫曼編碼或算術(shù)編碼),從而滿足無(wú)失真壓縮圖像數(shù)據(jù)的要求。

JPEG的無(wú)損預(yù)測(cè)編碼框圖JPEG的無(wú)損預(yù)測(cè)編碼的優(yōu)點(diǎn)是硬件易實(shí)現(xiàn),重建圖像質(zhì)量好。缺點(diǎn)是壓縮比太低,大約為2:1。基于OCT的有損壓縮編碼基于OCT的壓縮編碼算法包括兩種不同層次的系統(tǒng),即基本系統(tǒng)和增強(qiáng)系統(tǒng)。增強(qiáng)系統(tǒng)是基本系統(tǒng)的擴(kuò)充。JPEG還定義了兩種工作方式,即順序方式和漸進(jìn)方式。基本系統(tǒng)只能采用順序工作方式,熵編碼只能采用哈夫曼編碼,而且只能存儲(chǔ)兩套碼表?;贠CT的有損順序編碼框圖及解碼框圖

基于DCT的有損順序編碼框圖

基于DCT的有損順序編碼的解碼框圖

JPEG算法的不同壓縮比及其壓縮效果實(shí)例JPEG2000放棄了JPEG所采用的以離散余弦變換算法(DCT)為主的區(qū)塊編碼方式,而改用以離散小波變換算法(DWT)為主的多解析編碼方式。

JPEG2000還將彩色靜態(tài)畫面采用的JPEG編碼方式、2值圖像采用的JBIG(JointBinaryImageGroup)編碼方式及低壓縮率采用JPEGLS統(tǒng)一起來(lái),成為對(duì)應(yīng)各種圖像的通用編碼方式。DCT和DWT變換圖

(a)采用DCT變換得到的圖像圖

(b)采用DWT變換得到的圖像JPEG2000的優(yōu)勢(shì)高壓縮率無(wú)損壓縮漸進(jìn)傳輸感興趣區(qū)域壓縮JPEG2000的應(yīng)用目前,支持JPEG2000的軟件已經(jīng)出現(xiàn),如LuraWaveSmartCompressFreewareforWindows為ACDSee3.0提供JPEG2000LWF格式的外掛插件,這樣只要安置了這個(gè)插件就可以觀看和制作采用JPEG2000編碼的LWF格式文件。在不久的將來(lái),JPEG2000無(wú)論是在傳統(tǒng)的JPEG市場(chǎng)(如數(shù)碼相機(jī)、掃描儀等)還是在新興應(yīng)用領(lǐng)域(如網(wǎng)路傳輸、無(wú)線通訊、醫(yī)療影像等)都將大有用武之地。

MPEG壓縮標(biāo)準(zhǔn)MPEG標(biāo)準(zhǔn)是面向運(yùn)動(dòng)圖像壓縮的一個(gè)系列標(biāo)準(zhǔn)。ISO和CCITT于1988年成立運(yùn)動(dòng)圖像專家組(MovingPictureExpertsGroup,MPEG),研究制定了用于數(shù)字存儲(chǔ)媒介中活動(dòng)圖像及其伴音的編碼的國(guó)際標(biāo)準(zhǔn)。最初MPEG專家組的工作項(xiàng)目是三個(gè),即分別1.5Mb/s、10Mb/s、40Mb/s傳輸速率下對(duì)圖像編碼,分別命名為MPEG-1、MPEG-2、MPEG-3,MPEG-3于1992年被合并到高清晰度電視(HDTV)工作組。為了滿足不同應(yīng)用的要求,MPEG又陸續(xù)增加了其他一些標(biāo)準(zhǔn)MPEG-4、MPEG-7、MPEG-21。MPEG-l壓縮標(biāo)準(zhǔn)為VCD所采納,MPEG-2壓縮標(biāo)準(zhǔn)為DVD采納,MPEG-4是為交互式多媒體通信制定的壓縮標(biāo)準(zhǔn),MPEG-7是為因特網(wǎng)視頻檢索制定的壓縮標(biāo)準(zhǔn)。MPEG標(biāo)準(zhǔn)MPEG標(biāo)準(zhǔn)一般包括4個(gè)部分:MPEG視頻(ISO/IECl1172-2)。MPEG音頻(ISO/IECl1172-3)。MPEG系統(tǒng)(ISO/IECl1172-1)。MPEG測(cè)試與驗(yàn)證(ISO/IEC11172-4)。

已經(jīng)開(kāi)發(fā)的MPEG標(biāo)準(zhǔn)有:MPEG-1:1992年正式發(fā)布的數(shù)字電視標(biāo)準(zhǔn)。MPEG-2:數(shù)字電視標(biāo)準(zhǔn)。MPEG-4:1999年發(fā)布的多媒體應(yīng)用標(biāo)準(zhǔn)。MPEG-7:多媒體內(nèi)容描述接口標(biāo)準(zhǔn)。MPEG-21:有關(guān)多媒體框架的協(xié)議標(biāo)準(zhǔn)。MPEG-1壓縮標(biāo)準(zhǔn)用于數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音速率為1.5Mb/s的壓縮編碼簡(jiǎn)稱MPEG-1,于1992年正式發(fā)布,標(biāo)準(zhǔn)的編號(hào)為ISO/IEC1172。它針對(duì)標(biāo)準(zhǔn)分辨率(NTSC制為352×240,PAL制為352×288)的圖像進(jìn)行壓縮,每秒30幀畫面,具備CD音質(zhì)。它還用于數(shù)字電話網(wǎng)絡(luò)上的視頻傳輸,如視頻點(diǎn)播、教育網(wǎng)絡(luò)等。使用MPEG-1的壓縮算法,可將一部120min長(zhǎng)的電影壓縮到1.2GB左右。因此,它被廣泛地應(yīng)用于VCD制作。MPEG-1壓縮標(biāo)準(zhǔn)MPEG-1分為5個(gè)部分:MPEG系統(tǒng)(11172-1):定義音頻、視頻及有關(guān)數(shù)據(jù)的同步。MPEG視頻(11172-2):定義視頻數(shù)據(jù)的編碼和重建圖像所需的解碼過(guò)程。MPEG音頻(11172-3):定義音頻數(shù)據(jù)的編碼和解碼。一致性測(cè)試(11172-4)。軟件模擬(11172-5)。MPEG-1壓縮標(biāo)準(zhǔn)

MPEG-1的主要任務(wù)是將視頻信號(hào)及其伴音以可接收和重建質(zhì)量壓縮到1.5Mb/s的碼率,并復(fù)合成一個(gè)單一的MPEG位流,同時(shí)保證視頻和音頻的同步。MPEG-l編碼解碼器框圖

MPEG-2壓縮標(biāo)準(zhǔn)

MPEG-2標(biāo)準(zhǔn)于1994年公布,包括編號(hào)為13818-1的系統(tǒng)部分、編號(hào)為13818-2的視頻部分、編號(hào)為13818-3的音頻部分及編號(hào)為13818-4的符合性測(cè)試部分。它能適用于更廣的領(lǐng)域,主要包括數(shù)字存儲(chǔ)媒體、廣播電視和通信。MPEG-2適合高于2Mb/s的視頻壓縮。MPEG-2壓縮標(biāo)準(zhǔn)MPEG-2利用網(wǎng)絡(luò)提供的3~100Mb/s的數(shù)據(jù)傳輸率支持具有更高分辨率圖像的壓縮和更高的圖像質(zhì)量。可支持交疊圖像序列、可調(diào)節(jié)性編碼,多種運(yùn)動(dòng)估計(jì)方式,提供一個(gè)較廣的范圍改變壓縮比,以適應(yīng)不同畫面質(zhì)量、存儲(chǔ)容量和帶寬的要求。它在與MPEG-1兼容的基礎(chǔ)上實(shí)現(xiàn)了低碼率和多聲道擴(kuò)展:MPEG-2可以將一部120min長(zhǎng)的電影壓縮到4~8GB(DVD質(zhì)量),其音頻編碼可提供左、右、中及兩個(gè)環(huán)繞聲道、一個(gè)加重低音聲道和多達(dá)7個(gè)伴音聲道。MPEG-2分為系統(tǒng)、視頻、音頻、一致性測(cè)試、軟件模擬、數(shù)字存儲(chǔ)媒體命令和控制擴(kuò)展協(xié)議、先進(jìn)聲音編碼、系統(tǒng)解碼器和實(shí)時(shí)接口擴(kuò)展標(biāo)準(zhǔn)10個(gè)部分。MPEG-2系統(tǒng)MPEG-2系統(tǒng)規(guī)定電視圖像數(shù)據(jù)、音頻數(shù)據(jù)和其他相關(guān)數(shù)據(jù)的同步性。MPEG-2標(biāo)準(zhǔn)的壓縮編碼系統(tǒng)是將視頻和音頻編碼算法結(jié)合起來(lái)開(kāi)發(fā)的。系統(tǒng)編碼可有兩種方法,其編碼輸出包括傳送流和程序流兩種定義流。傳送流和協(xié)議ISO/IECl1172-1系統(tǒng)定義的流相似;程序流是一種用來(lái)傳送和保存一道程序的數(shù)據(jù)或其數(shù)據(jù)的數(shù)據(jù)流。MPEG-2視頻MPEG-2視頻規(guī)定視頻數(shù)據(jù)的編碼和解碼。MPEG-2按壓縮比大小的不同分成5個(gè)檔次(Profile),每一個(gè)檔次又按圖像清晰度的不同分成四種圖像格式,或稱為級(jí)別(Level)。5個(gè)檔次4種級(jí)別共有20種組合,但實(shí)際應(yīng)用中有些組合不太可能出現(xiàn),較常用的是11種組合。MPEG-2視頻MPEG-2的5個(gè)檔次按功能增強(qiáng)逐次為:簡(jiǎn)單型(Simple)?;拘停∕ain)。信噪比可調(diào)型(SNRScalable)??臻g可調(diào)型(SpatialScalable)。增強(qiáng)型(High)。MPEG-2的4個(gè)等級(jí)為:低級(jí)(Low):352×288×30,面向VCR并與MPEG-1兼容?;炯?jí)(Main):70×460×30或720×576×25,面向視頻廣播信號(hào)。高1440級(jí)(High-1440):440×1080×30或1440×l152×25,面向HDTV。高級(jí)(High):1930×1080×30或1920×l152×25,面向HDTV。MPEG-2視頻較常用的是11種組合:高級(jí)的基本型,MP@HL。高級(jí)的增強(qiáng)型,HP@HL。高-1440級(jí)的基本型,MP@H1440。高-1440級(jí)的空間可調(diào)型,SSP@H1440。高-1440級(jí)的增強(qiáng)型,HP@H1440?;炯?jí)的簡(jiǎn)單型,SP@ML?;炯?jí)的基本型,MP@ML?;炯?jí)的信噪比可調(diào)型,SNP@ML。基本級(jí)的增強(qiáng)型,HP@ML。低級(jí)的基本型,MP@LL。低級(jí)的信噪比可調(diào)型,SNP@LL。MPEG-2音頻MPEG-2音頻的基本特性之一是與MPEG-l音頻兼容,并且支持5.1或7.1通道的環(huán)繞立體聲。5.1通道采用左、右聲道,中置和后面兩個(gè)環(huán)繞聲通道,總共5個(gè)通道?!?”是指LFE(LowFrequencyEffect),是低頻音效的加強(qiáng)通道,也就是通常所說(shuō)的“低音炮”。7.1通道環(huán)繞立體聲比5.1還多中左、中右兩個(gè)喇叭通道。MPEG-2技術(shù)就是實(shí)現(xiàn)DVD的標(biāo)準(zhǔn)技術(shù),現(xiàn)在DVD播放器在家庭中已經(jīng)普及了。除了作為DVD的指定標(biāo)準(zhǔn)外,MPEG-2還可用于為廣播、有線電視網(wǎng)、電纜網(wǎng)絡(luò)以及衛(wèi)星直播提供廣播級(jí)的數(shù)字視頻。MPEG-4MPEG-4于1988年11月公布。它是為視聽(tīng)數(shù)據(jù)的編碼和交互播放而開(kāi)發(fā)的算法。其目標(biāo)是極低碼率的音頻/視頻壓縮編碼。它所涉及的應(yīng)用范疇包括有線、無(wú)線、移動(dòng)通信和Internet等領(lǐng)域。MPEG-4可使用戶實(shí)現(xiàn)音頻、視頻內(nèi)容交互性的多種形式,以及以一種整體的方式將人工和自然的音頻和視頻信息融合在一起。MPEG-4具有高速壓縮,基于內(nèi)容交互和內(nèi)容分級(jí)擴(kuò)展等特點(diǎn),并且具有基于內(nèi)容方式表示的視頻數(shù)據(jù)。MPEG-4在信息描述中引入了對(duì)象(Object)的概念,用來(lái)表達(dá)視頻對(duì)象(VideoObject,VO)和音頻對(duì)象(AudioObject,AO)。MPEG-4對(duì)AV對(duì)象的操作MPEG-4對(duì)AV對(duì)象的操作主要有:采用AV對(duì)象來(lái)表示聽(tīng)覺(jué)、視覺(jué)或者視聽(tīng)組合內(nèi)容。組合己有AV對(duì)象來(lái)生成復(fù)合的AV對(duì)象,并生成AV場(chǎng)景。對(duì)AV對(duì)象的數(shù)據(jù)靈活地多路合成與同步,以選擇合適的網(wǎng)絡(luò)來(lái)傳輸AV對(duì)象數(shù)據(jù)。允許接收端用戶在AV場(chǎng)景中對(duì)AV對(duì)象進(jìn)行交互操作等?;趦?nèi)容的視頻編碼過(guò)程基于內(nèi)容的視頻編碼過(guò)程可由三步完成:1)VO的形成:先從原始視頻流中分割出VO。2)編碼:對(duì)各VO分別獨(dú)立編碼,即對(duì)不同VO和運(yùn)動(dòng)信息、形狀信息和紋理信息分別編碼,分配不同的碼字。3)復(fù)合:將各個(gè)VO的碼流復(fù)合成一個(gè)符合MPEG-4標(biāo)準(zhǔn)的位流。MPEG-7壓縮標(biāo)準(zhǔn)MPEG-7標(biāo)準(zhǔn)于2001年11月正式推出。MPEG-7的正式名稱為多媒體內(nèi)容描述接口(MultimediaContentDescriptionInterface),它為各種類型的多媒體信息規(guī)定一種標(biāo)準(zhǔn)化的描述。這種描述以提取待描述對(duì)象的各種特征為基礎(chǔ),便于人們對(duì)多媒體信息進(jìn)行快速有效的檢索。這種描述與多媒體信息的內(nèi)容一起,支持對(duì)用戶感興趣的圖形、圖像、3D模型、視頻、音頻等信息以及它們的組合的快速有效的查詢,滿足實(shí)時(shí)、非實(shí)時(shí)以及推—拉應(yīng)用的要求。MPEG-7可應(yīng)用于數(shù)字圖書館、各種多媒體目錄服務(wù)、廣播媒體的選擇以及多媒體編輯等領(lǐng)域。MPEG-7MPEG-7的研究重點(diǎn)是多媒體對(duì)象的特征提取、數(shù)據(jù)庫(kù)類層次劃分、不同數(shù)據(jù)類型的有機(jī)聯(lián)系等。MPEG-7采取的描述方案和方法與被描述內(nèi)容是否編碼或如何存儲(chǔ)無(wú)關(guān),例如視覺(jué)信號(hào)仍可以用已有的各種編碼方案(如JPEG、MPEG-l、MPEG-2、MPEG-4等)進(jìn)行編碼。MPEG-7將擴(kuò)展現(xiàn)有標(biāo)識(shí)內(nèi)容的專用方案及有限的能力,包含更多的多媒體數(shù)據(jù)類型。MPEG-7的功能與其他MPEG標(biāo)準(zhǔn)互為補(bǔ)充。MPEG-l、MPEG-2和MPEG-4是內(nèi)容本身的表示,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論