離散余弦變換(DCT)及其應用_第1頁
離散余弦變換(DCT)及其應用_第2頁
離散余弦變換(DCT)及其應用_第3頁
離散余弦變換(DCT)及其應用_第4頁
離散余弦變換(DCT)及其應用_第5頁
已閱讀5頁,還剩84頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 離 散 余 弦 變 換 (離 散 余 弦 變 換 ( D i s c re t e C o s i n e Transform, DCT)的變換核為余弦函數(shù)。)的變換核為余弦函數(shù)。DCT除了具有一般的正交變換性質(zhì)外,除了具有一般的正交變換性質(zhì)外, 它的它的變換陣的基向量能很好地描述人類語音信號變換陣的基向量能很好地描述人類語音信號和圖像信號的相關特征。因此,在對語音信和圖像信號的相關特征。因此,在對語音信號、圖像信號的變換中,號、圖像信號的變換中,DCT變換被認為是變換被認為是一種準最佳變換。近年頒布的一系列視頻壓一種準最佳變換。近年頒布的一系列視頻壓縮編碼的國際標準建議中,都把縮編碼的國際

2、標準建議中,都把DCT作為其作為其中的一個基本處理模塊。除此之外,中的一個基本處理模塊。除此之外, DCT還還是一種可分離的變換。是一種可分離的變換。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用離散余弦變換(離散余弦變換(DCT)及其應用)及其應用 1.1一維離散余弦變換一維離散余弦變換一維一維CT的變換核定義為的變換核定義為 :NuxNuCuxg2) 12(cos2)(),(1-1) 式中,x, u=0, 1, 2, , N1; 其他1021)(uuC(1-2) 一維DCT定義如下: 設f(x)|x=0, 1, , N-1為離散的信號列。 離散余弦變換(離散余弦變換(DCT)及其應

3、用)及其應用102) 12(cos)(2)()(NxNuxxfNuCuF(1-3) 式中,u, x=0, 1, 2, , N1。將變換式展開整理后, 可以寫成矩陣的形式, 即 F=Gf (1-4) 其中 )2/) 12)(1cos()2/3)(1cos()2/) 1cos(/2)2/) 12cos()2/6cos()2/cos(/2)2/) 12cos()2/3cos()2/cos(/2111/1NNNNNNNNNNNNNNNNNNNG(1-5) 離散余弦變換(離散余弦變換(DCT)及其應用)及其應用 一維DCT的逆變換IDCT定義為 102) 12(cos)()(2)(NuNuxuFuCNx

4、f 式中, x, u=0, 1, 2, , N1。可見一維DCT的逆變換核與正變換核是相同的。 (1-6) 1.2 二維離散余弦變換二維離散余弦變換 考慮到兩個變量,很容易將一維DCT的定義推廣到二維DCT。其正變換核為離散余弦變換(離散余弦變換(DCT)及其應用)及其應用NvyMuxvCuCMNvuyxg2) 12(cos2) 12(cos)()(2),(1-7) 式中,C(u)和C(v)的定義同式(7-48);x, u=0, 1, 2, , M1; y, v=0, 1, 2, , N1。 二維DCT定義如下:設f(x, y)為MN的數(shù)字圖像矩陣,則 NvyMuxvCuCyxfMNvuFMx

5、Ny2) 12(cos2) 12(cos)()(),(2),(1010(1-8) 離散余弦變換(離散余弦變換(DCT)及其應用)及其應用式中: x, u=0, 1, 2, , M1; y, v=0, 1, 2, , N1。 二維DCT逆變換定義如下: NvyMuxvuFvCuCMNyxfMuNv2) 12(cos2) 12(cos),()()(2),(1010(1-9) 式中:x, u=0, 1, 2, , M1; y, v=0, 1, 2, , N1。 類似一維矩陣形式的DCT,可以寫出二維DCT的矩陣形式如下: F=GfGT (1-10)離散余弦變換(離散余弦變換(DCT)及其應用)及其應

6、用 同時,由式(1-8)和式(1-9)可知二維DCT的逆變換核與正變換核相同,且是可分離的,即 NvyvCNMuxuCMvyguxgvuyxg2) 12(cos)(22) 12(cos)(2),(),(),(21(1-11) 式中:C(u)和C(v)的定義同式(1-2); x, u=0, 1, 2, , M1; y, v=0, 1, 2, , N1。 離散余弦變換(離散余弦變換(DCT)及其應用)及其應用 通常根據(jù)可分離性, 二維DCT可用兩次一維DCT來完成, 其算法流程與DFT類似, 即 ),(),(),(),(),(),(),(vuFvuFvxFFvxFvxFyxfFyxfTTT轉(zhuǎn)置列轉(zhuǎn)

7、置行(1-12) 1.3 快速離散余弦變換快速離散余弦變換離散余弦變換(離散余弦變換(DCT)及其應用)及其應用 離散余弦變換的計算量相當大, 在實用中非常不方便, 也需要研究相應的快速算法。目前已有多種快速DCT(FCT), 在此介紹一種由FFT的思路發(fā)展起來的FCT。 首先,將f(x)延拓為 0)()(xfxfex=0, 1, 2, , N-1x=N, N+1, , 2N-1 (1-13) 離散余弦變換(離散余弦變換(DCT)及其應用)及其應用按照一維DCT的定義,fe(x)的DCT為 10)(1)0(NxexfNF(1-14) NxujNxeNujNuxjNxeNxeNNxeNxeNNx

8、NxNxexfeNexfNNuxxfNNuxxfNNuxxfNNuxNNuxxfNNuxxfNuF2212022)12(1201201210121010)(Re2)(Re22)12(cos)(22)12(cos)(22)12(cos)(22)12(cos022)12(cos)(22)12(cos)(2)(式中,Re表示取復數(shù)的實部。 離散余弦變換(離散余弦變換(DCT)及其應用)及其應用 由于 為fe(x)的2N點DFT。因此,在作DCT時,可把長度為N的f(x)的長度延拓為2N點的序列fe(x),然后對fe(x)作DFT,最后取DFT的實部便可得到DCT的結果。 同理對于離散余弦逆變換IDC

9、T,可首先將F(u)延拓為12022)(NxNxujeexf0)()(uFuFeu=0, 1, 2, , N-1u=N, N+1, , 2N-1 (1-15) 離散余弦變換(離散余弦變換(DCT)及其應用)及其應用由式(1-9)可得,DCT的IDCT為 1202)12(21212)12(121)(Re2)0(21)(Re2)0(12) 12(cos)(2)0(1)(NuNuxjNujeeNuNuxjeeNueeeeuFNFNNeuFNFNNuxuFNFNxf(1-16) 由式(7-63)可見,IDCT可由 的2N點的IDFT來實現(xiàn)。 NujeeuF2)(離散余弦變換(離散余弦變換(DCT)及其

10、應用)及其應用 最后要注意的是二維DCT的頻譜分布, 其譜域分布與DFT相差一倍,如圖1-1所示。 從圖中可以看出,對于DCT而言,(0, 0)點對應于頻譜的低頻成分,(N-1, N-1)點對應于高頻成分,而同階的DFT中, (N2, N2)點對應于高頻成分(注: 此頻譜圖中未作頻譜中心平移)。 由于DFT和IDFT已有快速算法FFT和IFFT,因此可用它們實現(xiàn)快速DCT和IDCT算法FCT及IFCT。不過,由于FFT及IFFT中要涉及到復數(shù)運算, 因此這種FCT及IFCT算法并不是最佳的。 離散余弦變換(離散余弦變換(DCT)及其應用)及其應用圖1-1 DFT和DCT的頻譜分布(a)DFT頻

11、譜分布; (b) DCT頻譜分布 1.4 離散余弦變換在圖像壓縮中的應用離散余弦變換在圖像壓縮中的應用1.4.1圖像壓縮概述圖像壓縮概述 多媒體數(shù)據(jù)的顯著特點:數(shù)據(jù)量非常大。例如,多媒體數(shù)據(jù)的顯著特點:數(shù)據(jù)量非常大。例如,一張彩色相片的數(shù)據(jù)量可達一張彩色相片的數(shù)據(jù)量可達10MB10MB;視頻影像和聲音由;視頻影像和聲音由于連續(xù)播放,數(shù)據(jù)量更加龐大。這對計算機的存儲以于連續(xù)播放,數(shù)據(jù)量更加龐大。這對計算機的存儲以及網(wǎng)絡傳輸都造成了極大的負擔。解決辦法之一就是及網(wǎng)絡傳輸都造成了極大的負擔。解決辦法之一就是進行數(shù)據(jù)壓縮,壓縮后再進行存儲和傳輸,到需要時進行數(shù)據(jù)壓縮,壓縮后再進行存儲和傳輸,到需要時再

12、解壓、還原。再解壓、還原。 在位圖格式的圖像存儲方式中,像素與像素之在位圖格式的圖像存儲方式中,像素與像素之間在行方向和列方向都具有很大的相關性,我們說整間在行方向和列方向都具有很大的相關性,我們說整體數(shù)據(jù)的體數(shù)據(jù)的冗余度很大冗余度很大,需要對圖像數(shù)據(jù)進行很大程度,需要對圖像數(shù)據(jù)進行很大程度的壓縮的壓縮離散余弦變換(離散余弦變換(DCT)及其應用)及其應用離散余弦變換(離散余弦變換(DCT)及其應用)及其應用多媒體數(shù)據(jù)的冗余類型多媒體數(shù)據(jù)的冗余類型多媒體數(shù)據(jù)表示中存在著大量的冗余,數(shù)據(jù)壓縮技術就是利用多媒體數(shù)據(jù)的冗余性來減少數(shù)據(jù)量的方法。常見圖像、視頻、音頻數(shù)據(jù)中存在的冗余類型如下:1. 空間

13、冗余2. 時間冗余3. 視覺冗余離散余弦變換(離散余弦變換(DCT)及其應用)及其應用1. 空間冗余 一幅圖像表面上各采樣點的顏色之間往往存在著一幅圖像表面上各采樣點的顏色之間往往存在著空空間連貫性間連貫性,基于離散像素采樣來表示物體表面顏色的像,基于離散像素采樣來表示物體表面顏色的像素存儲方式可利用空間連貫性,達到減少數(shù)據(jù)量的目的。素存儲方式可利用空間連貫性,達到減少數(shù)據(jù)量的目的。例如,在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,例如,在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,在此區(qū)域中所有點的光強和色彩以及飽和度都是相同的,在此區(qū)域中所有點的光強和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余。

14、因此數(shù)據(jù)有很大的空間冗余。幀內(nèi)壓縮幀內(nèi)壓縮圖圖BitmapBitmap顏色相同的塊顏色相同的塊幀內(nèi)壓縮幀內(nèi)壓縮離散余弦變換(離散余弦變換(DCT)及其應用)及其應用2. 時間冗余 運動圖像一般為位于一時間軸區(qū)間的一組連續(xù)畫面,運動圖像一般為位于一時間軸區(qū)間的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動物體,只不過其中的相鄰幀往往包含相同的背景和移動物體,只不過移動物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)移動物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時刻的同一場景畫面,所以

15、稱為相鄰幀記錄了相鄰時刻的同一場景畫面,所以稱為時間時間冗余冗余。 同理,語音數(shù)據(jù)中也存在著時間冗余。同理,語音數(shù)據(jù)中也存在著時間冗余。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用3. 視覺冗余 人類的視覺系統(tǒng)由于受生理特性的限制,對于圖像人類的視覺系統(tǒng)由于受生理特性的限制,對于圖像場的注意是非均勻的,人對細微的顏色差異感覺不明顯。場的注意是非均勻的,人對細微的顏色差異感覺不明顯。 例如,人類視覺的一般分辨能力為例如,人類視覺的一般分辨能力為2 26 6灰度等級,而灰度等級,而一般的圖像的量化采用的是一般的圖像的量化采用的是2 28 8灰度等級,即存在視覺冗灰度等級,即存在視覺冗余。

16、余。 人類的聽覺對某些信號反映不太敏感,使得壓縮后人類的聽覺對某些信號反映不太敏感,使得壓縮后再還原有允許范圍的變化,人也感覺不出來。再還原有允許范圍的變化,人也感覺不出來。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用數(shù)據(jù)壓縮方法的分類數(shù)據(jù)壓縮方法的分類按照壓縮方法是否產(chǎn)生失真分類(1)無失真壓縮無失真壓縮 無失真壓縮要求解壓以后的數(shù)據(jù)和原始無失真壓縮要求解壓以后的數(shù)據(jù)和原始數(shù)據(jù)完全一致。解壓后得到的數(shù)據(jù)是原數(shù)據(jù)的復制,數(shù)據(jù)完全一致。解壓后得到的數(shù)據(jù)是原數(shù)據(jù)的復制,是一種可逆壓縮。是一種可逆壓縮。無失真壓縮法去掉或減少數(shù)據(jù)中的冗余,恢復時再無失真壓縮法去掉或減少數(shù)據(jù)中的冗余,恢復時再

17、重新插到數(shù)據(jù)中,因此是可逆過程重新插到數(shù)據(jù)中,因此是可逆過程根據(jù)目前的技術水平,無損壓縮算法一般可以把普根據(jù)目前的技術水平,無損壓縮算法一般可以把普通文件的數(shù)據(jù)壓縮到原來的通文件的數(shù)據(jù)壓縮到原來的1/21/21/41/4。一些常用的。一些常用的無損壓縮算法有赫夫曼無損壓縮算法有赫夫曼(Huffman)(Huffman)算法和算法和LZW(Lenpel-Ziv & Welch)LZW(Lenpel-Ziv & Welch)壓縮算法壓縮算法(2)有失真壓縮有失真壓縮 解壓以后的數(shù)據(jù)和原始數(shù)據(jù)不完全一致,解壓以后的數(shù)據(jù)和原始數(shù)據(jù)不完全一致,是不可逆壓縮方式。有失真壓縮還原后,不影響信

18、息是不可逆壓縮方式。有失真壓縮還原后,不影響信息的表達的表達例如,圖像、視頻、音頻數(shù)據(jù)的壓縮就可以采用例如,圖像、視頻、音頻數(shù)據(jù)的壓縮就可以采用有損壓縮方法,因為其中包含的數(shù)據(jù)往往多于我有損壓縮方法,因為其中包含的數(shù)據(jù)往往多于我們的視覺系統(tǒng)和聽覺系統(tǒng)所能接收的信息,丟掉們的視覺系統(tǒng)和聽覺系統(tǒng)所能接收的信息,丟掉一些數(shù)據(jù)而不至于對聲音或者圖像所表達的意思一些數(shù)據(jù)而不至于對聲音或者圖像所表達的意思產(chǎn)生誤解,但可大大提高壓縮比。圖像、視頻、產(chǎn)生誤解,但可大大提高壓縮比。圖像、視頻、音頻數(shù)據(jù)的壓縮比可高達音頻數(shù)據(jù)的壓縮比可高達100:1100:1,但人的主觀,但人的主觀感受仍不會對原始信息產(chǎn)生誤解。感

19、受仍不會對原始信息產(chǎn)生誤解。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用數(shù)據(jù)壓縮方法的分類數(shù)據(jù)壓縮方法的分類按照壓縮方法的原理分類按照壓縮方法的原理分類預測編碼:預測編碼:基本思想是利用已被編碼的點的數(shù)據(jù)值,基本思想是利用已被編碼的點的數(shù)據(jù)值,預測鄰近的一個像素點的數(shù)據(jù)值預測鄰近的一個像素點的數(shù)據(jù)值變換編碼:基本思想是將圖像的光強矩陣變換到系數(shù)空間上,然后對系數(shù)進行編碼壓縮統(tǒng)計編碼:根據(jù)信息出現(xiàn)概率的分布特性而進行的壓縮編碼 *無失真編碼*分析合成編碼:基元和特征參數(shù)混合編碼:混合壓縮是利用了各種單一壓縮的長處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷離散余弦變換(離散余弦變換

20、(DCT)及其應用)及其應用數(shù)據(jù)壓縮方法的分類數(shù)據(jù)壓縮方法的分類離散余弦變換(離散余弦變換(DCT)及其應用)及其應用影響數(shù)據(jù)壓縮的要素影響數(shù)據(jù)壓縮的要素 壓縮比壓縮前后文件大小之比,越高越好,但受速度、消耗資源等的影響 圖像質(zhì)量還原后與原圖像相比,評估的方法有客觀評估和主觀評估 壓縮與解壓縮速度與壓縮方法和壓縮編碼的算法有關,一般壓縮比解壓縮計算量大,因而壓縮比解壓縮慢離散余弦變換(離散余弦變換(DCT)及其應用)及其應用圖像壓縮編碼舉例圖像壓縮編碼舉例(1)(1)、行程編碼(、行程編碼(RLERLE) 現(xiàn)實中有許多這樣的圖像,在一幅圖像中具有許多現(xiàn)實中有許多這樣的圖像,在一幅圖像中具有許多

21、顏色相同的圖塊。在這些圖塊中,許多行上都具有相同顏色相同的圖塊。在這些圖塊中,許多行上都具有相同的顏色,或者在一行上有許多連續(xù)的像素都具有相同的的顏色,或者在一行上有許多連續(xù)的像素都具有相同的顏色值。在這種情況下就不需要存儲每一個像素的顏色顏色值。在這種情況下就不需要存儲每一個像素的顏色值,而僅僅存儲一個像素的顏色值,以及具有相同顏色值,而僅僅存儲一個像素的顏色值,以及具有相同顏色的的像素數(shù)目像素數(shù)目就可以,或者存儲像素的顏色值,以及具有就可以,或者存儲像素的顏色值,以及具有相同顏色值的行數(shù)。相同顏色值的行數(shù)。 這種壓縮編碼稱為這種壓縮編碼稱為行程編碼行程編碼(run length encod

22、ing(run length encoding,RLE)RLE),具有相同顏色并且是連續(xù)的像素數(shù)目稱為行程長,具有相同顏色并且是連續(xù)的像素數(shù)目稱為行程長度。度。例如例如, ,字符串字符串AAABCDDDDDDDDBBBBBAAABCDDDDDDDDBBBBB利用利用RLERLE原理可以壓縮為原理可以壓縮為3ABC8D5B3ABC8D5BRLERLE編碼簡單直觀,編碼編碼簡單直觀,編碼/ /解碼速度快,解碼速度快,因此許多圖形和視頻文件,如因此許多圖形和視頻文件,如.BMP.BMP.TIFF.TIFF及及AVIAVI等格式文件的壓縮均采用此方法等格式文件的壓縮均采用此方法. . 由于一幅圖像中有

23、許多顏色相同的圖塊,用一整數(shù)對由于一幅圖像中有許多顏色相同的圖塊,用一整數(shù)對存儲一個像素的顏色值及相同顏色像素的數(shù)目(長存儲一個像素的顏色值及相同顏色像素的數(shù)目(長度)。例如:度)。例如: (G G ,L L)離散余弦變換(離散余弦變換(DCT)及其應用)及其應用圖像壓縮編碼舉例圖像壓縮編碼舉例長度長度顏色值顏色值編碼時采用從左到右,從上到下的排列,編碼時采用從左到右,從上到下的排列,每當遇到一串相同數(shù)據(jù)時就用該數(shù)據(jù)及每當遇到一串相同數(shù)據(jù)時就用該數(shù)據(jù)及重復次數(shù)代替原來的數(shù)據(jù)串。重復次數(shù)代替原來的數(shù)據(jù)串。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用圖像壓縮編碼舉例圖像壓縮編碼舉例000

24、000003333333333222222222226666666111111111111111111111111555555555555888888888888888888555555555555553333222222222222222222(0,8) (3,10) (2,11) (6,7)(1,18) (1,6) (5,12) (8,18)(5,14) (3,4) (2,18)18*7的像素顏色僅用的像素顏色僅用11對數(shù)據(jù)對數(shù)據(jù)離散余弦變換(離散余弦變換(DCT)及其應用)及其應用圖像壓縮編碼舉例圖像壓縮編碼舉例游程長度編碼特點:游程長度編碼特點: 直觀,經(jīng)濟;直觀,經(jīng)濟; 是一種無損壓

25、縮;是一種無損壓縮; 壓縮比取決于圖像本身特點,相同顏色圖像塊越壓縮比取決于圖像本身特點,相同顏色圖像塊越大,圖像塊數(shù)目越少,壓縮比越高。大,圖像塊數(shù)目越少,壓縮比越高。 適用于計算機生成的圖像,例如。適用于計算機生成的圖像,例如。BMPBMP、TIFTIF等,等,不適于顏色豐富的自然圖像。不適于顏色豐富的自然圖像。 這并不是說這并不是說RLERLE編碼方法不適用于自然圖像的壓縮,編碼方法不適用于自然圖像的壓縮,相反,在自然圖像的壓縮中少不了相反,在自然圖像的壓縮中少不了RLERLE,只不過是,只不過是不能單純使用不能單純使用RLERLE一種編碼方法,需要和其他的壓一種編碼方法,需要和其他的壓

26、縮編碼技術聯(lián)合應用。縮編碼技術聯(lián)合應用。 離散余弦變換(離散余弦變換(DCT)及其應用)及其應用圖像壓縮編碼舉例圖像壓縮編碼舉例(2)、哈夫曼編碼(Huffman): 由于圖像中表示顏色的數(shù)據(jù)出現(xiàn)的概率不同,對于出現(xiàn)頻率高的賦(編)予較短字長的碼,對出現(xiàn)頻率小的編于較長字長的碼,從而減少總的代碼量,但不減少總的信息量。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用(1)(1)初始化,根據(jù)符號概率的大小按由大到小順序?qū)Ψ跏蓟?,根?jù)符號概率的大小按由大到小順序?qū)Ψ栠M行排序號進行排序 (2)(2)把概率最小的兩個符號組成一個節(jié)點,如圖把概率最小的兩個符號組成一個節(jié)點,如圖4-024-02

27、中中的的D D和和E E組成節(jié)點組成節(jié)點P P1 1。(3)(3)重復步驟重復步驟2 2,得到節(jié)點,得到節(jié)點P P2 2、P P3 3和和P P4 4,形成一棵,形成一棵“樹樹”,其中的其中的P P4 4稱為根節(jié)點。稱為根節(jié)點。(4)(4)從根節(jié)點從根節(jié)點P P4 4開始到相應于每個符號的開始到相應于每個符號的“樹葉樹葉”,從,從上到下標上上到下標上“0”(0”(上枝上枝) )或者或者“1”(1”(下枝下枝) ),至于哪個,至于哪個為為“1”1”哪個為哪個為“0”0”則無關緊要,最后的結果僅僅是則無關緊要,最后的結果僅僅是分配的代碼不同,而代碼的平均長度是相同的。分配的代碼不同,而代碼的平均長

28、度是相同的。(5)(5)從根節(jié)點從根節(jié)點P P4 4開始順著樹枝到每個葉子分別寫出每個開始順著樹枝到每個葉子分別寫出每個符號的代碼。符號的代碼。圖像壓縮編碼舉例圖像壓縮編碼舉例離散余弦變換(離散余弦變換(DCT)及其應用)及其應用圖像壓縮編碼舉例圖像壓縮編碼舉例赫夫曼編碼舉例赫夫曼編碼舉例符號符號出現(xiàn)的次數(shù)出現(xiàn)的次數(shù)loglog2 2(1/p(1/pi i) )分配的代碼分配的代碼需要的位數(shù)需要的位數(shù)A A15(0.3846)15(0.3846)1.381.380 01515B B7(0.1795)7(0.1795)2.482.481001002121C C6(0.1538)6(0.1538)

29、2.702.701011011818D D6(0.1538)6(0.1538)2.702.701101101818E E5(0.1282)5(0.1282)2.962.961111111515離散余弦變換(離散余弦變換(DCT)及其應用)及其應用圖像壓縮編碼舉例圖像壓縮編碼舉例赫夫曼編碼舉例赫夫曼編碼舉例離散余弦變換(離散余弦變換(DCT)及其應用)及其應用1.4 1.4 基于基于DCTDCT圖像壓縮圖像壓縮 1)基本概念)基本概念 將在空域上描述的圖象,經(jīng)過某種變換(通常采用,將在空域上描述的圖象,經(jīng)過某種變換(通常采用,余弦變換、傅立葉變換、沃爾什變換等),在某種余弦變換、傅立葉變換、沃爾

30、什變換等),在某種變換域里進行描述。變換域里進行描述。 在變換域里,首先降低了圖象的相關性;其次通過在變換域里,首先降低了圖象的相關性;其次通過某種圖象處理(如頻域的二維濾波)以及熵編碼,某種圖象處理(如頻域的二維濾波)以及熵編碼,則可進一步壓縮圖象的編碼比特率。則可進一步壓縮圖象的編碼比特率。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用基于基于DCTDCT圖像壓縮圖像壓縮 2)變換壓縮原理框圖變換壓縮原理框圖變換量化編碼器解碼器逆變換信道輸入輸出GAAUUG:GGUUAA輸入數(shù)字圖象逆變換后的復原圖象二維正交變換二維正交逆變換變換域中的變換系數(shù)量化后的變換系數(shù)離散余弦變換(離散余弦

31、變換(DCT)及其應用)及其應用基于基于DCTDCT圖像壓縮圖像壓縮 3)常用圖象變換技術討論)常用圖象變換技術討論 傅立葉變換和余弦變換傅立葉變換和余弦變換 傅立葉變換及頻譜移中后,其能量集中在中心附傅立葉變換及頻譜移中后,其能量集中在中心附近。中心數(shù)據(jù)又稱為直流分量,代表全圖數(shù)值的近。中心數(shù)據(jù)又稱為直流分量,代表全圖數(shù)值的算術平均值。算術平均值。 其編碼誤差來源有:變換系數(shù)經(jīng)過量化器而引起其編碼誤差來源有:變換系數(shù)經(jīng)過量化器而引起的量化誤差。常使高頻分量為的量化誤差。常使高頻分量為0,導致圖象模糊。,導致圖象模糊。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜

32、止圖像編碼國際標準JPEGJPEG 1)JPEG基本系統(tǒng)基本系統(tǒng) 2)FDCT和和IDCT 3)量化與反量化)量化與反量化 4)對量化系數(shù)的處理和組織)對量化系數(shù)的處理和組織 5)熵編碼)熵編碼 6)應用舉例)應用舉例離散余弦變換(離散余弦變換(DCT)及其應用)及其應用 1)JPEG基本系統(tǒng)基本系統(tǒng) 以以8*8的圖象塊為基本單位進行編碼;的圖象塊為基本單位進行編碼; 將將RGB轉(zhuǎn)換為亮度轉(zhuǎn)換為亮度-色調(diào)色調(diào)-飽和度系統(tǒng),并重新采樣;飽和度系統(tǒng),并重新采樣;圖象分割FDCT量化系數(shù)編碼量化表碼表圖象拼接IDCT反量化系數(shù)解碼量化表碼表色彩轉(zhuǎn)換和重采樣靜止圖像編碼國際標準靜止圖像編碼國際標準JP

33、EGJPEG離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG YIQ(NTSC制)與制)與YUV(PAL制)制) Y:指顏色的明視度、亮度、灰度值;:指顏色的明視度、亮度、灰度值;I或或U:指色:指色調(diào);調(diào);Q或或V:指飽和度。:指飽和度。 Y=0.299R+0.587G+0.114B I=0.596R-0.247G-0.322B Q=0.211R-0.523G+0.312B U=0.148R-0.289G+0.473B V=0.615R-0.515G-0.1B離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標

34、準靜止圖像編碼國際標準JPEGJPEG 思想:人對亮度比對色彩敏感,在光線不足的情況下,思想:人對亮度比對色彩敏感,在光線不足的情況下,所觀察物體都是黑白的。因此可以對色調(diào)和飽和度做所觀察物體都是黑白的。因此可以對色調(diào)和飽和度做粗略處理。粗略處理。 方法:對方法:對8*8圖象塊矩陣,圖象塊矩陣,Y成分數(shù)據(jù)不變,成分數(shù)據(jù)不變,U每每2*2個個數(shù)據(jù)求平均,數(shù)據(jù)求平均,V每每2*1個數(shù)據(jù)求平均。稱為個數(shù)據(jù)求平均。稱為YUV421系系統(tǒng)。統(tǒng)。 除此除此,還有還有YUV422, 411, 420等系統(tǒng)等系統(tǒng).離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準J

35、PEGJPEG 2)FDCT與與IDCT 思想:人眼對低頻數(shù)據(jù)比對高頻數(shù)據(jù)敏感。思想:人眼對低頻數(shù)據(jù)比對高頻數(shù)據(jù)敏感。 根據(jù)根據(jù)8*8的二維的二維DCT定義定義 7700770021211,coscos4161621211,coscos416161021xyuvxuyvF u vC u C vf x yuxvyf x yF u v C u C vwC w其中當其他離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG 稱稱F(0,0)為直流系數(shù),其他為交流系數(shù)。)為直流系數(shù),其他為交流系數(shù)。 JPEG標準不規(guī)定標準不規(guī)定FDCT和和IDC

36、T的算法。的算法。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG 3)量化與反量化)量化與反量化 思想:將每個思想:將每個DCT系數(shù)除以各自量化步長并四舍五入系數(shù)除以各自量化步長并四舍五入后取整,得到量化系數(shù)。后取整,得到量化系數(shù)。 JPEG系統(tǒng)分別規(guī)定了亮度分量和色度分量的量化表,系統(tǒng)分別規(guī)定了亮度分量和色度分量的量化表,顯然色度分量相應的量化步長比亮度分量大。顯然色度分量相應的量化步長比亮度分量大。 ,0.5,F u vF u vINTS u vF u vF u v S u v離散余弦變換(離散余弦變換(DCT)及其應用)及其

37、應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG 4)對量化系數(shù)的處理和組織)對量化系數(shù)的處理和組織 思想:思想:JPEG采用定長和變長相結合的編碼方法。采用定長和變長相結合的編碼方法。 直流系數(shù):通常相鄰直流系數(shù):通常相鄰8*8圖象塊的圖象塊的DC分量很接近,因分量很接近,因此此JPEG對量化后的直流分量采用無失真對量化后的直流分量采用無失真DPCM編碼。編碼。通常通常JPEG要保存所需比特數(shù)和實際差值。要保存所需比特數(shù)和實際差值。 交流系數(shù):經(jīng)過量化后,交流系數(shù):經(jīng)過量化后,AC分量出現(xiàn)較多的分量出現(xiàn)較多的0。JPEG采用對采用對0系數(shù)的行程長度編碼。而對非系數(shù)的行程長度編碼。

38、而對非0值,則值,則要保存所需數(shù)和實際值。要保存所需數(shù)和實際值。10,00,00,0iiFFF離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG ZIG-ZAG排序:為使連續(xù)的排序:為使連續(xù)的0個數(shù)增多,采用個數(shù)增多,采用Z形編形編碼。碼。063離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG 5)熵編碼)熵編碼 對于直流系數(shù)的差值,采用對于直流系數(shù)的差值,采用Huffman編碼。編碼。JPEG標準標準為亮度和色度分量分別擬定了為亮度和色度分量分別擬定了Huffman碼表。

39、碼表。 對于交流對于交流0系數(shù)的行長,采用系數(shù)的行長,采用Huffamn編碼。同樣編碼。同樣JPEG標準為亮度和色度分量分別擬定了標準為亮度和色度分量分別擬定了Huffman碼表。碼表。 計算每象素的平均比特稱為碼率。計算每象素的平均比特稱為碼率。 0.250.50 圖象質(zhì)量中等,滿足某些應用圖象質(zhì)量中等,滿足某些應用 0.500.75 質(zhì)量好,滿足多數(shù)應用質(zhì)量好,滿足多數(shù)應用 0.751.50 極好,滿足大多數(shù)應用極好,滿足大多數(shù)應用 1.502.0與原始圖象質(zhì)量一樣與原始圖象質(zhì)量一樣離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPE

40、G 6)應用舉例)應用舉例 Lenna圖象的一個圖象的一個8*8方塊方塊139144149153155155155155144151153156159156156156150155160163158156156156159161 162160160159159159,159160161 162162155155155161161161161 160157157157162162161163162157157157162162161161163158158158f x y離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG 經(jīng)過經(jīng)過FDC

41、T后的變換系數(shù)矩陣后的變換系數(shù)矩陣126011252231231763300111922011072011000,11120111202011111001021132422110F u v離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG 根據(jù)亮度量化表量化后得到的量化系數(shù)矩陣根據(jù)亮度量化表量化后得到的量化系數(shù)矩陣790100000210000001100000000000000,00000000000000000000000000000000F u v離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像

42、編碼國際標準JPEGJPEG 假設上一編碼塊的直流量化系數(shù)為假設上一編碼塊的直流量化系數(shù)為77,則直流差值,則直流差值為為2。 則該圖象塊編碼為則該圖象塊編碼為790211100 102,21/2, 20/1, 10/1, 10/1, 12/1, 1011,1011011,0100,000,000,011100,01010EOB離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG 反量化反量化1264010000002412000000141300000000000000,00000000000000000000000000000000

43、F u v離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG 反變換反變換144146149152154156156156148150152154156156156156155156157158158157156155160161161 162161 159157155,163163164163162160158156163163164164162160158157160161 162162162161159158158159161161 162161159158f x y離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像

44、編碼國際標準靜止圖像編碼國際標準JPEGJPEG 編碼比特率與質(zhì)量因子編碼比特率與質(zhì)量因子 通常在圖象傳輸時要求固定比特率,通常在圖象傳輸時要求固定比特率,JPEG通過設通過設定一個質(zhì)量控制因子定一個質(zhì)量控制因子Q,在量化時用該因子與量,在量化時用該因子與量化表中的量化步長相乘作為實際的量化步長。化表中的量化步長相乘作為實際的量化步長。 則要求較高比特率時,則要求較高比特率時,Q取較小值如取較小值如0.1;否則??;否則取大值。大值。Q與比特流一起傳送給解碼端。與比特流一起傳送給解碼端。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG

45、壓縮率壓縮率9.2離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG壓縮率壓縮率18.4離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEG壓縮率壓縮率51.6離散余弦變換(離散余弦變換(DCT)及其應用)及其應用靜止圖像編碼國際標準靜止圖像編碼國際標準JPEGJPEGH.261:用于電視電話和電視會議;碼率:用于電視電話和電視會議;碼率128kbps384kbps;MPEG1:用于數(shù)字存儲媒體(如用于數(shù)字存儲媒體(如VCD),碼率為),碼率為11.5Mbps,適合通訊網(wǎng)絡;適

46、合通訊網(wǎng)絡;MPEG2:用于數(shù)字電視和高清晰度電視(如:用于數(shù)字電視和高清晰度電視(如CCTV Ch 5),碼率為),碼率為1.530Mbps;MPEG4:用于:用于64Kbps以下帶寬的音視編碼,實現(xiàn)基于內(nèi)容的編碼;以下帶寬的音視編碼,實現(xiàn)基于內(nèi)容的編碼;其他編碼方法:子帶編碼、小波編碼其他編碼方法:子帶編碼、小波編碼JPEG2000、分形編碼和基于模、分形編碼和基于模型的編碼等。型的編碼等。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用1.4 離散余弦變換在數(shù)字水印中的應用離散余弦變換在數(shù)字水印中的應用 近幾年來,數(shù)字作品盜版現(xiàn)象日益嚴重,有關數(shù)字作品的版權保護問題已經(jīng)引起了各方面

47、的關注; 數(shù)字水印技術作為新型的版權保護技術,已經(jīng)得到廣泛的認可,有越來越多的技術人員投入到這方面的研究中,并取得了很好的成績。數(shù)字水印技術離散余弦變換(離散余弦變換(DCT)及其應用)及其應用數(shù)字水印分類數(shù)字水印有多種分類方法 按照可視性:可見水印和隱形水印; 按照魯棒性:脆弱性水印和健壯性水?。?按照嵌入方法:空間域和變換域水??; 按照檢測與提取方法分類:私有水印、 半公開水印和公開水??;離散余弦變換(離散余弦變換(DCT)及其應用)及其應用數(shù)字水印原理用戶密鑰無水印的輸入圖像數(shù)字水印數(shù)字水印插入算法有水印的輸出圖像數(shù)字水印插入過程用戶密鑰有水印的輸入圖像數(shù)字水印(特定的ID數(shù)字水印檢測算

48、法判決結果(有水印存在?數(shù)字水印檢測過程離散余弦變換(離散余弦變換(DCT)及其應用)及其應用數(shù)字水印分存 數(shù)字水印分存主要是將秘密共享的思想引入到數(shù)字水印中; 借助秘密共享的算法中國剩余定理,利用(k,n)方案實現(xiàn)水印分存; 水印分存可以實現(xiàn)基于部分內(nèi)容的水印提取,對內(nèi)容侵權有比較好的鑒定能力,可以有效的保護數(shù)字作品的版權。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用數(shù)字水印分存原理 可以將任何水印文件(如數(shù)字序列、文本、圖標等)都看作二進制流文件; 水印分存步驟:(1)對水印圖像進行置亂;(2)按8比特切割,轉(zhuǎn)化為十進制數(shù)據(jù);(3)對切割后的水印數(shù)據(jù)進行分存;注:分存后的水印數(shù)據(jù)

49、需要用9比特表示。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用空間域水印嵌入算法嵌入算法與LSB算法類似,將水印信息 嵌入到圖像像素的最低兩比特。 嵌入算法:(1)將原始圖像進行分塊,分為n塊;(2)將水印信息按塊轉(zhuǎn)化為二進制比特流,分別嵌入到各塊圖像像素的最低兩比特中;注:要保管好m,與塊相一一對應。離散余弦變換(離散余弦變換(DCT)及其應用)及其應用空域水印實例:圖象的位平面表示87654321離散余弦變換(離散余弦變換(DCT)及其應用)及其應用LSB隱藏原理圖解Lena原圖:8-bit灰度BMP圖象離散余弦變換(離散余弦變換(DCT)及其應用)及其應用Lena位平面與能量分布第一個位平面與去掉第1個位平面的Lena:離散余弦變換(離散余弦變換(DCT)及其應用)及其應用Lena位平面與能量分布第二個位平面與去掉第1-2個位平面的Lena:離散余弦變換(離散余弦變換(DCT)及其應用)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論