第6章 多媒體數(shù)據(jù)壓縮(改)_第1頁
第6章 多媒體數(shù)據(jù)壓縮(改)_第2頁
第6章 多媒體數(shù)據(jù)壓縮(改)_第3頁
第6章 多媒體數(shù)據(jù)壓縮(改)_第4頁
第6章 多媒體數(shù)據(jù)壓縮(改)_第5頁
已閱讀5頁,還剩86頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第6章多媒體數(shù)據(jù)壓縮2本章主要內(nèi)容6.1數(shù)據(jù)壓縮技術(shù)概述6.2數(shù)據(jù)壓縮技術(shù)原理6.3JPEG靜止圖像壓縮標(biāo)準(zhǔn)6.4運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)MPEG36.1數(shù)據(jù)壓縮技術(shù)概述6.1.1數(shù)據(jù)壓縮的概念

采樣數(shù)據(jù)不僅僅是所代表的原始信息本身,還包含著其它一些沒必要保留的(確定的、可推知的)信息,即存在著數(shù)據(jù)冗余。

M=D-?d

其中M表示實(shí)際媒體信息,D表示數(shù)字化后的采樣數(shù)據(jù),?d表示數(shù)據(jù)冗余量。

數(shù)據(jù)壓縮就是從采樣數(shù)據(jù)中去除冗余,即保留原始信息中變化的、特征性信息,去除重復(fù)的、確定的或可推知的信息,在實(shí)現(xiàn)更接近實(shí)際媒體信息描述的前提下,盡可能的減少描述用的信息量。

46.1.2多媒體數(shù)據(jù)的冗余隨著計(jì)算機(jī)技術(shù)的高度發(fā)展以及通信、計(jì)算機(jī)和大眾傳媒三大技術(shù)的相互融合,計(jì)算機(jī)已經(jīng)不再局限于數(shù)值計(jì)算、文字處理的范疇,而成為處理圖形、圖像、視頻、音頻等多種信息的工具。但數(shù)字化后的聲音、圖像、視頻和音頻等多媒體數(shù)據(jù)是非常龐大的。

例如:一頁在A4(216mm×300mm)紙上的照片,以300dpi(12像素/mm)采樣,每個(gè)像素用24位真彩色信號表示,其數(shù)據(jù)量約為27MB/頁,650MB的CD-ROM只可放24頁;雙聲道立體聲光盤,采樣率是44.1kHz,采樣精度16位,一秒鐘數(shù)據(jù)量是44.1×16×2/8=172KB/s,一張CD只能存放約1小時(shí)的聲音。56.1.2多媒體數(shù)據(jù)的冗余對于如此巨大的多媒體數(shù)據(jù),如果不經(jīng)過壓縮,不僅超出了計(jì)算機(jī)的存儲和處理能力,而且在現(xiàn)在的通信信道的傳輸速率下,是無法完成大量多媒體信息的傳輸?shù)模嗝襟w數(shù)據(jù)的高速傳輸和儲藏所需要的巨大容量已經(jīng)成為多媒體數(shù)據(jù)通信技術(shù)的最大障礙。因此,為了存儲、處理和傳輸這些數(shù)據(jù),必須進(jìn)行壓縮。66.1.2多媒體數(shù)據(jù)的冗余

一般而言,多媒體數(shù)據(jù)中存在的數(shù)據(jù)冗余情況主要有以下幾種(P107):信息熵冗余空間冗余時(shí)間冗余結(jié)構(gòu)冗余知識冗余視覺冗余聽覺冗余紋理的統(tǒng)計(jì)冗余信息熵冗余

信息熵定義為一組數(shù)據(jù)所表示的信息量,即

式中,E為信息熵,N為數(shù)據(jù)的種類(或稱碼元)個(gè)數(shù),Pi為第i個(gè)碼元出現(xiàn)的概率。一組數(shù)據(jù)的數(shù)據(jù)量顯然等于各記錄碼元的二進(jìn)制位數(shù)(即編碼長度)與該碼元出現(xiàn)的概率乘積之和,即

式中,D為數(shù)據(jù)量,為第i個(gè)碼元的二進(jìn)制位數(shù)。一般取(如ASCII編碼把所有碼元都編碼為7比特),這樣得到的D必然大于E。這種因碼元編碼長度的不經(jīng)濟(jì)帶來的冗余稱為信息熵冗余或編碼冗余。

信息熵冗余圖26個(gè)英文字母相對頻率空間冗余

--同一景物表面上各采樣點(diǎn)的顏色之間往往存在著空間連貫性,但是基于離散像素采樣來表示物體顏色的方式通常沒有利用景物表面顏色的這種空間連貫性,從而產(chǎn)生了空間冗余。 --可以通過改變物體表面顏色的像素存儲方式來利用空間連貫性,達(dá)到減少數(shù)據(jù)量的目的。時(shí)間冗余

--這是序列圖像(電視圖像、運(yùn)動(dòng)圖像)表示中經(jīng)常包含的冗余。 --序列圖像一般為位于一時(shí)間軸區(qū)間內(nèi)的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動(dòng)物體,只不過移動(dòng)物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時(shí)刻的同一場景畫面,所以稱為時(shí)間冗余。結(jié)構(gòu)冗余

--在有些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式,例如,方格狀的地板圖案等。我們稱此為結(jié)構(gòu)冗余。 --已知分布模式,可以通過某一過程生成圖像。知識冗余

--有些圖像的理解與某些知識有相當(dāng)大的相關(guān)性。例如,人臉的圖像有固定的結(jié)構(gòu)。這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識和背景知識得到,我們稱此類冗余為知識冗余。 --根據(jù)已有的知識,對某些圖像中所包含的物體,我們可以構(gòu)造其基本模型,并創(chuàng)建對應(yīng)各種特征的圖像庫,進(jìn)而圖像的存儲只需要保存一些特征參數(shù),從而可以大大減少數(shù)據(jù)量。知識冗余是模型編碼主要利用的特性。視覺冗余

--事實(shí)表明,人類的視覺系統(tǒng)對圖像場的敏感性是非均勻和非線性的。然而,在記錄原始的圖像數(shù)據(jù)時(shí),通常假定視覺系統(tǒng)是線性和均勻的,對視覺敏感和不敏感的部分同等對待,從而產(chǎn)生了比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來編碼)更多的數(shù)據(jù),這就是視覺冗余。--通過大量實(shí)驗(yàn),發(fā)現(xiàn)以下視覺的非均勻特征。視覺系統(tǒng)對圖像的亮度和色彩度的敏感性相差很大;隨著亮度的增加,視覺系統(tǒng)對量化誤差的敏感度降低;人眼的視覺系統(tǒng)在圖像的邊緣和非邊緣區(qū)域分開來處理;人類的視覺系統(tǒng)總是把視網(wǎng)膜上的圖像分解成若干個(gè)空間有向的頻率通道后再進(jìn)一步處理。圖像區(qū)域的相同性冗余

--它是指在圖像中的兩個(gè)或多個(gè)區(qū)域所對應(yīng)的所有像素值相同或相近,從而產(chǎn)生的數(shù)據(jù)重復(fù)性存儲,這就是圖像區(qū)域的相似性冗余。

--在以上的情況下,記錄了一個(gè)區(qū)域中各像素的顏色值,則與其相同或相近的其他區(qū)域就不在記錄其中各像素的值。--向量量化方法就是針對這種冗余性的圖像壓縮編碼方法。紋理的統(tǒng)計(jì)冗余

--有些圖像紋理盡管不嚴(yán)格服從某一分布規(guī)律,但是它在統(tǒng)計(jì)的意義上服從該規(guī)律。利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量,所以我們稱之為紋理的統(tǒng)計(jì)冗余。

思考:圖像序列中的兩幅相鄰圖像,后一幅圖像與前一幅圖像之間有較大的相關(guān),這是()。

(A)空間冗余(B)時(shí)間冗余(C)信息熵冗余(D)視覺冗余16下列哪一種說法是正確的:信息量等于數(shù)據(jù)量與冗余量之和信息量等于信息熵與數(shù)據(jù)量之差信息量等于數(shù)據(jù)量與冗余量之差信息量等于信息熵與冗余量之和17186.1.3數(shù)據(jù)壓縮技術(shù)的發(fā)展過程

20世紀(jì)40年代,人們開始系統(tǒng)地研究數(shù)據(jù)壓縮技術(shù);主要表現(xiàn)在數(shù)據(jù)壓縮算法方面:首先是ClaudeShannon與R.M.Fano的Shannon-Fano編碼方法;

1952年,D.A.Huffman提出了Huffman編碼方法;

1968年,P.Elias發(fā)展了Shannon-Fano編碼,構(gòu)造出更為完美的Shannon-Fano-Elias編碼。

1976年,J.Rissanen提出了一種可以成功地逼近信息熵極限的編碼方法——算術(shù)編碼。

1982年,Rissanen和G.G.Langdon一起改進(jìn)了算術(shù)編碼。

1977年,JacobZiv和AbrahamLempel提出了LZ77編碼算法,78年又作了改進(jìn),被稱為LZ78編碼算法。

1984年,TerryWelch提出了LZ78算法的變種算法——LZW。

LZ77、LZ78、LZW三種壓縮技術(shù)就是目前無損壓縮領(lǐng)域中最為流行的、被稱為“字典式編碼”的壓縮技術(shù)。

196.1.3數(shù)據(jù)壓縮技術(shù)的發(fā)展過程(續(xù))

數(shù)據(jù)壓縮標(biāo)準(zhǔn)逐漸形成,有損壓縮算法快速出現(xiàn)。

1986年開始制定靜態(tài)圖像壓縮標(biāo)準(zhǔn),1994年后成為國際標(biāo)準(zhǔn),稱為JPEG標(biāo)準(zhǔn)。

ITU制定的電視會(huì)議系列標(biāo)準(zhǔn)(H.261、H.262、H.263、H.264等)以及由ISO制定的視頻系列標(biāo)準(zhǔn)(MPEG-1、MPEG-2、MPEG-4)中,均采用了有損壓縮原理作為其核心壓縮算法。其中的MPEG-4標(biāo)準(zhǔn)(相當(dāng)于ITU的H.263和H.263+標(biāo)準(zhǔn))是為了適應(yīng)網(wǎng)絡(luò)視頻的需求特點(diǎn)而制定的,具有更高的壓縮比、支持并發(fā)數(shù)據(jù)流編碼、基于內(nèi)容的交互操作、增強(qiáng)的時(shí)間域隨機(jī)存取、容錯(cuò)、基于內(nèi)容的尺度可變性等新特性。206.1.4數(shù)據(jù)壓縮的分類1、按照壓縮內(nèi)容

分為音頻數(shù)據(jù)壓縮、靜態(tài)圖像數(shù)據(jù)壓縮、視頻數(shù)據(jù)壓縮和其他數(shù)據(jù)文件壓縮等四種類型。2、按照壓縮方式分為對稱壓縮和非對稱壓縮兩種類型。

3、按照壓縮效果

分為有損壓縮與無損壓縮兩種類型。普通數(shù)據(jù)文件,一般采用無損壓縮,對于冗余度較小的圖像,需要采用有損壓縮。214、按照算法思想

分為信息熵編碼、預(yù)測編碼、變換編碼、混合編碼以及其他編碼等五種,每種類型包含了一些具體算法,如下圖。226.1.5數(shù)據(jù)壓縮的主要指標(biāo)

衡量不同壓縮方法優(yōu)劣的技術(shù)指標(biāo)是相同的,主要包括以下幾個(gè)方面。

1)壓縮比:指壓縮前后的數(shù)據(jù)量之比,它反映了施加某壓縮算法之后,數(shù)據(jù)量減少的比例;

2)恢復(fù)效果:指經(jīng)解壓縮算法對壓縮數(shù)據(jù)進(jìn)行處理后所得到的數(shù)據(jù)與其表示的原信息的相似程度;

3)算法簡單、速度快:主要指實(shí)現(xiàn)算法的復(fù)雜度。236.2數(shù)據(jù)壓縮技術(shù)原理6.2.1信息熵與編碼1、信息熵的概念信息論中,編碼數(shù)據(jù)量與所表示的信息量以及冗余信息之間的關(guān)系為:數(shù)據(jù)量=信息量+冗余量信息是對所表現(xiàn)的事件中不確定性的描述,信息量多少與不確定性的程度有關(guān)。通常,可以用概率來描述不確定性的大小。某信息描述的事件狀態(tài)的出現(xiàn)概率越小,其不確定性越大,其表達(dá)的信息量就越多,冗余量就越少。

信息熵信息熵用來度量信息量的大小。對于單個(gè)事件(如字符)來說,其信息熵定義為:

H(i)=-log2(Pi)(bit)(1)公式(1)表示發(fā)生概率為Pi的事件i所具有的信息熵為H(i),單位為bit(比特)。2425對于一個(gè)消息隊(duì)列(如字符串)的信息熵定義為:

H(X)=-∑Pi×log2(Pi)=∑Pi×H(i)(2)其中,Pi表示某一事件i發(fā)生的概率。例如:有一字符串“babbdcaacb”包含a、b、c、d四種字符,其長度為10,字符a、b、c、d分別出現(xiàn)了3、4、2、1次,則a、b、c、d在信息中出現(xiàn)的概率分別為0.3、0.4、0.2、0.1,它們的熵分別為:

H(a)=-log2(0.3)≈1.737(bit)

H(b)=-log2(0.4)≈1.322(bit)

H(c)=-log2(0.2)≈2.322(bit)

H(d)=-log2(0.1)≈3.322(bit)26

每種字符的信息熵就是該字符編碼所用的理想位數(shù)(二進(jìn)制)。整條信息的熵就是表達(dá)整個(gè)字符串需要的位數(shù)(這里用字符出現(xiàn)的次數(shù)代替概率):H(X)=-∑Pi×log2(Pi)=H(a)×3+H(b)×4+H(c)×2+H(d)×1=18.465(bit)若用ASCII編碼,需要多少bit?272、編碼

編碼實(shí)質(zhì)上是對要處理的源數(shù)據(jù)或源文件按一定的規(guī)則進(jìn)行變換(映射),力圖用盡可能少的符號代碼來表示較多、較長的源符號信息。編碼方法中的碼字(代碼)有固定長度和可變長度兩種。3、壓縮模型

模型是規(guī)則和數(shù)據(jù)的集合,即:壓縮算法=模型+編碼

284、壓縮、還原

壓縮是指設(shè)法去掉部分或全部冗余,從而減少文件或數(shù)據(jù)所占的存儲空間;還原(解壓縮)則是指利用相反的算法使文件或數(shù)據(jù)恢復(fù)原狀。29306.2.2無損壓縮編碼1、Shannon-Fano編碼簡稱為S-F編碼,是一種變長編碼,其基本思想是按信源符號出現(xiàn)的概率大小進(jìn)行排序,出現(xiàn)概率大的分配短碼,反之則分配長碼。具體編碼過程如下:

(1)信源符號按概率遞減順序排列。(2)把符號序列分成上下兩部分,使上下兩部分的概率和相等或接近相等。(3)對上部分子序列編碼為“0”,相當(dāng)于左子樹,對下部分子序列編碼為“1”,相當(dāng)于右子樹。(4)重復(fù)上述步驟,直到每個(gè)子序列只包含一個(gè)符號為止。

31舉例:有信源字符序列S為:aaabbceeehddabafffbdddgghhabccedabdgghha

其長度為40個(gè)字符,由a、b、c、d、e、f、g、h共8種字符構(gòu)成。假設(shè)在編碼之前,每種字符出現(xiàn)的概率已由某種模型統(tǒng)計(jì)出來,用<字符>-<出現(xiàn)次數(shù)>來表示,具體值分別為:

a-8,b-6,c-3,d-7,e-4,f-3,g-4,h-532a-8d-7b-6h-5e-4g-4c-3f-3a-8d-7b-6———h-5e-4g-4c-3f-3(a)第一步(b)第二步解:首先將信源符號按概率遞減順序排列,形成圖(a)所示結(jié)果,然后,再把符號序列分成上下兩部分,使上下兩部分的概率和相等或接近相等,形成圖(b)所示結(jié)果。其中上部分符號序列概率和為21,編碼為0;下部分為19,編碼為1。33

最后再重復(fù)第二步,不斷對子符號序列進(jìn)行劃分,最后得到一棵二叉樹,如圖(c)所示。34最終得到的符號編碼分別為:

a-00,b-011,c-1110,d-010,

e-101,f-1111,g-110,h-100。

信源字符序列S的編碼總位數(shù)L等于每種字符編碼位數(shù)與字符出現(xiàn)次數(shù)乘積的和,即:

L=2×8+3×6+4×3+3×7+3×4+4×3+3×4+3×5

=118(位)如果直接用ASCII碼,則要用40×8=320位。因此,S-F編碼實(shí)現(xiàn)了數(shù)據(jù)壓縮。

352、Huffman編碼

其編碼思想與Shannon-Fano編碼方法基本一致,但構(gòu)造二叉樹的方法則相反,不是自上而下,而是自下而上、從樹葉到樹根生成二叉樹。具體編碼過程如下:(l)將信源符號按概率遞減順序排列;(2)把兩個(gè)最小的概率加起來,作為新符號的概率;(3)重復(fù)步驟(1)和(2),直到概率達(dá)到“1”為止;(4)在每次合并消息時(shí),將被合并的消息賦于“1”和“0”或“0”和“l(fā)”;(5)尋找從每一信源符號到概率為“1”處的路徑,記錄下路徑上的“l(fā)”和“0”;(6)對每一符號寫出從碼樹的根到終結(jié)點(diǎn)的“l(fā)”、“0”序列。36例如,對于信源其編碼過程如下:

x1x2x3x4x5x6X=

0.250.250.200.150.100.05最后得到的編碼為:x1–01,x2–10,x3-11,x4–000,x5-0010,x6-0011。其中x1、x2、x3的碼長為2,x4的碼長為3,x5、x6的碼長為4,平均碼長為2.45。0.050.150.450.55信源符號及其概率如下:求其Huffman編碼,信息熵及平均碼長。aa1a2a3a4a5P(a)0.50.250.1250.06250.062537Huffman編碼體現(xiàn)了統(tǒng)計(jì)編碼的思想。Huffman編碼的基本原理是按信源符號出現(xiàn)的概率大小進(jìn)行排序,出現(xiàn)概率大的分配短碼,出現(xiàn)概率小的則分配長碼。38393、算術(shù)編碼

算術(shù)編碼也是一種信息熵編碼方法,它用0到1之間的一個(gè)實(shí)數(shù)對輸入的信息進(jìn)行編碼。用到兩個(gè)基本的參數(shù),一是信源符號的概率,二是信源符號對應(yīng)的編碼區(qū)間。一般的信源符號集x可表示為:

對于一個(gè)給定的信源符號輸入序列S=x1x2x3……xm,其中xi屬于信源符號集X中的任意符號,可按以下過程進(jìn)行編碼:401)定義初始區(qū)間[0,1),表示一個(gè)0到1之間的半開區(qū)間,并規(guī)定初始概率p0=0;2)根據(jù)信源中各符號的概率值,把[0,1)區(qū)間劃分成N個(gè)子區(qū)間Q1,Q2,……,Qn,其中:Qi=[Li,Ri),Li=,Ri=Li+Pi

,i=1,2,……,N(3)3)設(shè)置輸入序號i的初值,i=1表示開始輸入第一個(gè)信源符號。414)當(dāng)輸入符號為xi(xi

對應(yīng)信源符號集X中的第k個(gè)符號),可按以下公式定義新的子區(qū)間Ii,并計(jì)算區(qū)間長度di。

Ii=[li,ri)(4)

li=li-1+di-1×(5)

ri=li-1+di-1×(6)

di=ri-li

(7)5)i=i+1,如果還有信源符號未輸入完畢,則轉(zhuǎn)第4)步繼續(xù)輸入下一個(gè)信源符號。如果全部輸入完畢,則當(dāng)前區(qū)間Ii=[li,ri)中的任意數(shù)就是所需的編碼。42例:有四個(gè)符號a1、a2、a3、a4的信源,其對應(yīng)概率分別為0.5、0.25、0.125、0.125。如果輸入序列為S=a2a1a3a2a4……。根據(jù)以上編碼過程,得如下結(jié)果:43從以上的編碼過程可以看出以下幾個(gè)問題:

1)算術(shù)編碼器對整個(gè)消息只產(chǎn)生一個(gè)碼字,這個(gè)碼字是在間隔[0,1)中的一個(gè)實(shí)數(shù),因此譯碼器在接受到表示這個(gè)實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。2)運(yùn)算中出現(xiàn)溢出是一個(gè)明顯的問題,但多數(shù)機(jī)器都有16位、32位或者64位的精度,因此該問題可使用比例縮放方法解決。

3)算術(shù)編碼也是一種對錯(cuò)誤很敏感的編碼方法,如果有一位發(fā)生錯(cuò)誤就會(huì)導(dǎo)致整個(gè)消息譯錯(cuò)。444、行程編碼

行程編碼(RLE)通過統(tǒng)計(jì)信源符號中的重復(fù)個(gè)數(shù),并以<重復(fù)個(gè)數(shù)><重復(fù)符號>格式來編碼。適用于壓縮包含大量重復(fù)信息的信源。其基本思想是:按行存儲一個(gè)顏色值和相同色值的像素個(gè)數(shù)。如下圖。(a)圖像示例(16×8像素)00000000000000000011111111111000001000000000000000100000000000000010000000000000001111111111100000000000000000000000000000000000(b)示例圖像的像素值(16×8像素)連續(xù)相同色塊圖像與像素值示例16020111302011130201113020111302011130160160(c)RLE編碼45說明:

RLE壓縮編碼尤其適用于計(jì)算機(jī)生成的圖像,對減少圖像文件的存儲空間非常有效。然而,RLE對顏色豐富的自然圖像就顯得力不從心,如果使用RLE編碼方法,不僅不能壓縮圖像數(shù)據(jù),反而可能使原來的圖像數(shù)據(jù)變得更大。465、詞典編碼

詞典編碼主要是利用編碼數(shù)據(jù)本身存在字符串重復(fù)特性來實(shí)現(xiàn)數(shù)據(jù)壓縮的。算法的核心就是如何動(dòng)態(tài)地形成詞典,以及如何選擇輸出格式以減小冗余。詞典編碼又可分為兩類:第一類詞典編碼的思想是:查找正在壓縮的字符序列是否在以前輸入的數(shù)據(jù)中出現(xiàn)過,然后用已經(jīng)出現(xiàn)過的字符串替代重復(fù)的部分,并將指向重復(fù)字符串的指針作為輸出編碼。指針P指向了重復(fù)字符串“abc”,所以,當(dāng)再次出現(xiàn)相同字符串時(shí),則輸出指針P。47

第二類詞典編碼的思想是:從輸入的數(shù)據(jù)中創(chuàng)建一個(gè)由短語組成的“編碼詞典”,編碼數(shù)據(jù)過程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的“短語”時(shí),編碼器就輸出這個(gè)詞典中短語的“索引號”,而不是短語本身,如下圖。486.2.3有損壓縮編碼介紹

有損數(shù)據(jù)壓縮編碼方法通常用于對靜態(tài)圖像、音頻以及視頻等多媒體信息的編碼壓縮,這些多媒體信息大多數(shù)是通過對模擬信息的數(shù)字化(采樣與量化)而得到的。1、預(yù)測編碼

1)預(yù)測編碼的基本概念

預(yù)測編碼是數(shù)據(jù)壓縮的重要技術(shù)原理之一,它是根據(jù)離散信號之間的空間或時(shí)間相關(guān)性,利用前面的一個(gè)或多個(gè)信號對下一信號進(jìn)行預(yù)測,然后對實(shí)際值和預(yù)測值的差進(jìn)行編碼。常用的預(yù)測編碼方法有DPCM(差分脈沖編碼調(diào)制)和ADPCM(自適應(yīng)差分脈沖編碼調(diào)制)等。492)DPCM——差分脈沖編碼DPCM

:DifferentialPulseCodeModulation,差分脈沖編碼調(diào)制,用采樣量化后的樣本值與預(yù)測值之間的差值來編碼。原理如下圖所示。

s(k)是PCM樣本值,se(k-1)是s(k)的預(yù)測值,d(k)是差分信號,即d(k)=s(k)-se(k-1)。I(k)是差分信號d(k)的量化值,st(k)是重構(gòu)信號,是由逆量化器產(chǎn)生的量化差分信號與對過去樣本信號的估算值se(k-1)求和得到,以作為預(yù)測器確定下一個(gè)信號估算值的輸入信號。原理P205503)ADPCM——自適應(yīng)差分脈沖編碼

ADPCM是自適應(yīng)量化和自適應(yīng)預(yù)測方法的總稱,是對DPCM方法的進(jìn)一步改進(jìn),通過調(diào)整量化步長,對不同頻段設(shè)置不同的量化字長,使數(shù)據(jù)得到進(jìn)一步的壓縮。

自適應(yīng)量化就是使量化間隔大小的變化自動(dòng)地去適應(yīng)輸入信號大小的變化。根據(jù)信號分布不均勻的特點(diǎn),使系統(tǒng)具有隨輸入信號的變化而改變量化區(qū)間的大小,以保持輸入量化器的信號基本均勻的能力。51下圖給出了反饋?zhàn)赃m應(yīng)的基本原理。522、變換編碼

先對信號進(jìn)行域變換,以尋求更大的信號獨(dú)立性,減少相關(guān)性。然后再對變換后的信號進(jìn)行采樣和量化編碼。數(shù)據(jù)編碼過程分為三步,即變換、變換域采樣和量化編碼。如下圖所示。

常用的變換有KLT、DCT、WHT以及WLT。531)KLT

KLT(Karhunen-LoeveTransform)通常稱為K-L變換,亦稱主要成分變換,是一個(gè)離散變換。用一組不相關(guān)的系數(shù)來表示連續(xù)信號,實(shí)現(xiàn)正交變換。是失真最小的一種變換,故稱作最佳變換。2)DCT

DCT(DiscreteCosineTransform)是離散余弦變換的簡稱。對于圖像編碼來說,DCT先將整體圖像分成若干個(gè)NxN的像素塊,然后每個(gè)NxN像素塊逐一進(jìn)行DCT變換。

54DCT變換公式如下:其中:

N為所劃分圖像方陣的行列數(shù),一般N=8;

x、y:原圖像方陣內(nèi)某個(gè)數(shù)據(jù)的坐標(biāo)位置,取值為0~N-1;

f(x,y)代表原圖像數(shù)據(jù)方陣內(nèi)的某個(gè)數(shù)值;

u、v:DCT后矩陣內(nèi)某個(gè)數(shù)值的坐標(biāo)位置,取值為0~N-1;

C(u,v)代表DCT變換后矩陣內(nèi)的某個(gè)數(shù)值;當(dāng)u=0且v=0時(shí),E(u)=E(v)=1/1.414;當(dāng)u>0或V>0時(shí),E(u)=E(v)=l。DCT逆變換公式:553)WHTWHT(Walsh-HadamardTransform)又稱哈達(dá)瑪特變換,這是一種有效地去除噪波的方法。基本思想為:對于圖像壓縮,首先將輸入值按4x2分成小塊,分別進(jìn)行實(shí)時(shí)快速哈達(dá)瑪特變換。圖像經(jīng)變換后,轉(zhuǎn)換成相應(yīng)成分的系數(shù),這些系數(shù)分別代表直流分量、水平方向細(xì)節(jié)和色度分量、垂直方向細(xì)節(jié)、斜方向細(xì)節(jié)及色度分量等,而噪波變換后均勻散在各系數(shù)中。這樣就能更有效地區(qū)分出信號和噪波,從而達(dá)到更有效地進(jìn)行自適應(yīng)降噪的目的。

564)WLT

WLT(WaveLetTransform)又稱小波變換,是近年來新興的一種變換方法,解決了較好地解決突變信號與非平穩(wěn)信號的問題。是空間(時(shí)間)和頻率的局部變換。小波變換的基本思想是將信號展開成一族基函數(shù)的加權(quán)和,即用一族函數(shù)來表示或逼近信號(或函數(shù)),這一族函數(shù)是通過基本函數(shù)的平移和伸縮構(gòu)成的。573、混合編碼

混合編碼不是一類原理性編碼方案,是兩種或兩種以上相關(guān)編碼方法優(yōu)點(diǎn)與特長的混合應(yīng)用。比如在MPEG和JPEG標(biāo)準(zhǔn)中,都混合應(yīng)用了不同的編碼方法,從而實(shí)現(xiàn)較為理想的編碼壓縮效果。584、其它編碼主要包括分形編碼、矢量量化編碼、子帶編碼等獨(dú)具特色編碼方法。1)分形編碼

分形的概念:分形指某種形狀(或結(jié)構(gòu))的一個(gè)局部或片斷,它可以有許多種大小、尺寸的相似形。分形編碼是一種以分形幾何學(xué)為理論基礎(chǔ)的編碼方法,它利用分形幾何中自相似的原理來實(shí)現(xiàn)數(shù)據(jù)壓縮的。首先對把一幅數(shù)字圖像,通過一些圖像處理技術(shù),然后在分形集中尋找各子圖像之間的相似性,其壓縮比超出經(jīng)典編碼方法近3個(gè)數(shù)量級。592)矢量量化編碼矢量量化編碼利用相鄰圖像數(shù)據(jù)間的高度相關(guān)性,將輸入圖像數(shù)據(jù)序列分組,每一組由n個(gè)數(shù)據(jù)構(gòu)成一個(gè)N維矢量,一起進(jìn)行編碼,即一次量化多個(gè)點(diǎn)。

3)子帶編碼

子帶編碼技術(shù)是一種高質(zhì)量、高壓縮比的圖像編碼方法。其基本思想是,依據(jù)語音和圖像信號可以劃分為不同的頻域段,而人眼對不同頻域段的敏感程度不同的特性,將要壓縮的信息分離成高低不同的兩個(gè)頻帶(子帶),再根據(jù)頻帶的特性分別進(jìn)行量化和編碼,完成對信息的編碼壓縮。練習(xí)

數(shù)據(jù)壓縮可分為兩種類型:一種叫做(),另一種叫做()。6061在數(shù)據(jù)壓縮方法中,有損壓縮具有()的特點(diǎn):A.壓縮比大,不可逆B.壓縮比小,不可逆C.壓縮比大,可逆D.壓縮比小,可逆衡量數(shù)據(jù)壓縮技術(shù)性能好壞的重要指標(biāo)是()。(1)壓縮比(2)標(biāo)準(zhǔn)化(3)恢復(fù)效果(4)算法復(fù)雜度

A.(1)(3)B.(1)(2)(3)C.(1)(3)(4)D.全部62636.3JPEG靜止圖像壓縮標(biāo)準(zhǔn)6.3.1JPEG概述

JPEG是一個(gè)適用于彩色和單色、多級灰度、連續(xù)色調(diào)的靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn),它定義了兩種基本的壓縮算法:一種是基于DPCM(差分脈沖編碼調(diào)制)及Huffman編碼(或算術(shù)編碼)的無失真壓縮算法。壓縮此較??;另一種是基于DCT(離散余弦變換)的有失真壓縮算法,壓縮比可以很大,這種壓縮算法又可分為基本和增強(qiáng)兩種系統(tǒng)。646.3.2無失真壓縮為了實(shí)現(xiàn)無失真壓縮,JPEG選擇了一個(gè)簡單的空間線性預(yù)測算法——DPCM,具體編碼處理過程如圖7-16所示。656.3.3有失真壓

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論