圖像有損壓縮課件_第1頁
圖像有損壓縮課件_第2頁
圖像有損壓縮課件_第3頁
圖像有損壓縮課件_第4頁
圖像有損壓縮課件_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、圖像有損壓縮1目錄引言1圖像壓縮基本知識介紹2圖像有損壓縮技術(shù)32引言 圖像壓縮的必要性 圖像數(shù)據(jù)的特點(diǎn)之一是數(shù)據(jù)量龐大。給存儲和傳輸帶來 許多困難 一幅低分辨率彩色圖像640 480,24bit/pixel, 該圖像數(shù)據(jù)量:640 480 3=921,600Byte=0.92MB HDTV系統(tǒng)中,每個畫面720 1280點(diǎn),24bit真彩色,60幀/s,具有6倍于傳統(tǒng)電視系統(tǒng)的空間分辨率和 畫面動感。每秒數(shù)據(jù)量: 720 1280 3 60=166MB=1.33Gb 目前數(shù)字傳輸能力,6MHz帶寬,只有20Mb/s的傳輸速率,需要壓縮比: 1330/20=66.43圖像壓縮的可能性從信息論的

2、觀點(diǎn)看,描述信源的數(shù)據(jù)由有用數(shù)據(jù)和冗余數(shù)據(jù)組成。例:“你的妻子,Helen,將于明天晚上6點(diǎn)零5分在波士頓的Logan機(jī)場接你”“你的妻子將于明晚6點(diǎn)零5分在Logan機(jī)場接你”“Helen將于明晚6點(diǎn)在Logan接你”數(shù)量可觀的冗余信息及不相關(guān)信息,為數(shù)據(jù)壓縮技術(shù)提供可能。如果能夠消除一種或多種冗余,就可取得數(shù)據(jù)壓縮效果。圖像壓縮的可能性圖像中存在很大的冗余度。用戶通常允許圖像失真。4例1靜止圖像信息的冗余(相鄰像素間的空間冗余)5例2活動圖像信息的冗余(相鄰幀間的時間冗余)圖像序列中不同幀之間存在相關(guān)性引起的時間冗余6圖像壓縮的主要應(yīng)用很多領(lǐng)域,都會遇到對大量圖像數(shù)據(jù)進(jìn)行傳輸和存儲的問題,

3、沒有圖像壓縮技術(shù)的發(fā)展,大容量圖像數(shù)據(jù)的存儲與傳輸難以實(shí)現(xiàn)。多媒體電視會議、數(shù)字電視,可視電話遙感圖像醫(yī)學(xué)圖像教育商業(yè)管理等圖文資料存儲:在存儲時壓縮原始數(shù)據(jù),而在使用時再解壓縮,這樣能夠大大增加存儲介質(zhì)的存儲量。傳輸:在發(fā)送端壓縮原始數(shù)據(jù),在接收端將壓縮數(shù)據(jù)解碼,減少傳輸時間在現(xiàn)代通信中,圖像傳輸已成為重要內(nèi)容之一。采用編碼壓縮技術(shù),減少傳輸數(shù)據(jù)量,是提高通信速度的重要手段。72.圖像壓縮基本知識介紹2.1圖像壓縮概念及其原理2.2圖像壓縮分類82.1圖像壓縮概念數(shù)據(jù)壓縮:數(shù)據(jù)壓縮是信息論的一個重要研究內(nèi)容,稱信源編碼。以盡可能少的數(shù)據(jù)表示信源所發(fā)出的信號,減少數(shù)據(jù)所占用的存儲空間。圖像壓縮

4、:數(shù)據(jù)壓縮技術(shù)在圖像中的應(yīng)用。在滿足一定圖像質(zhì)量條件下,用盡可能少的比特數(shù)來表示原始圖像,以提高圖像傳輸?shù)男屎蜏p少圖像存儲的容量。信源編碼可分為兩大類,無失真編碼有失真編碼(或稱限失真編碼)92.2圖像壓縮分類根據(jù)解壓重建后的圖像和原始圖像之間是否具有誤差,圖像編碼壓縮分為無損壓縮;(亦稱無誤差編碼;無失真、無損、信息保持編碼)有損壓縮;(亦稱有誤差編碼;有失真或有損編碼)無損壓縮(Lossless compression):原始數(shù)據(jù)可完全從壓縮數(shù)據(jù)中恢復(fù)出來,即在壓縮和解壓縮過程中沒有信息損失。壓縮比2:1左右有損壓縮(Lossy compression) :原始數(shù)據(jù)不能完全從壓縮數(shù)據(jù)中恢

5、復(fù)出來,即恢復(fù)數(shù)據(jù)只是在某種失真度下的近似。 壓縮比1000:1; 103.圖像有損壓縮技術(shù)3.1 圖像有損壓縮介紹3.2 常見有損壓縮技術(shù)113.1有損壓縮介紹雖然人們總是期望無損壓縮,但冗余度很少的信息對象用無損壓縮技術(shù)并不能得到可接受的結(jié)果。當(dāng)使用的壓縮方法會造成一些信息損失時,關(guān)鍵的問題是看這種損失的影響。有損壓縮經(jīng)常用于壓縮音頻、灰度或彩色圖像和視頻對象等,因?yàn)樗鼈儾⒉灰缶_的數(shù)據(jù)。在由音頻、彩色圖像、視頻以及其他專門數(shù)據(jù)組成的多媒體對象中,可以單獨(dú)使用有損壓縮技術(shù),也可與無損壓縮技術(shù)共同使用。 有損壓縮編碼不具有可恢復(fù)性和可逆性,該編碼在壓縮時舍棄冗余的數(shù)據(jù)。例如人眼較難分辨的顏

6、色或人耳難以分辨的方向源信號,實(shí)際取決于初始信號的類型、信號的相關(guān)性以及語義等內(nèi)容。這些被舍去的信息值是無法再找回的,所以還原后的數(shù)據(jù)與原始數(shù)據(jù)存在差異。123.2常用的有損壓縮技術(shù)預(yù)測編碼 變換編碼 基于模型編碼 分形編碼 其他編碼 133.2.1預(yù)測編碼預(yù)測編碼是根據(jù)離散信號之間存在著一定關(guān)聯(lián)性的特點(diǎn),利用前面一個或多個信號預(yù)測下一個信號進(jìn)行,然后對實(shí)際值和預(yù)測值的差(預(yù)測誤差)進(jìn)行編碼。如果預(yù)測比較準(zhǔn)確,誤差就會很小。在同等精度要求的條件下,就可以用比較少的比特進(jìn)行編碼,達(dá)到壓縮數(shù)據(jù)的目的。 預(yù)測編碼中典型的壓縮方法有脈沖編碼調(diào)制(PCM Pulse Code Modulation)、差

7、分脈沖編碼調(diào)制(DPCM,Differential Pulse Code Modulation)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM,Adaptive Differential Pulse Code Modulation)等,它們較適合于聲音、圖像數(shù)據(jù)的壓縮,因?yàn)檫@些數(shù)據(jù)由采樣得到,相鄰樣值之間的差相差不會很大,可以用較少位來表示。 143.2.2變換編碼預(yù)測編碼的壓縮能力是有限的。以DPCM為例,一般只能壓縮到每樣值24比特。20世紀(jì)70年代后,科學(xué)家們開始探索比預(yù)測編碼效率更高的編碼方法。人們首先討論了KL變換(Karhunen-Loeve Transform)、傅立葉變換等正交變換,得到

8、了比預(yù)測編碼效率高得多的結(jié)果,但苦于算法的計(jì)算復(fù)雜性太高,進(jìn)行科學(xué)研究可以,實(shí)際使用起來很困難。直到20世紀(jì)70年代后期,研究者發(fā)現(xiàn)離散余弦變換DCT與KL變換在某一特定相關(guān)函數(shù)條件下具有相似的基向量,而用DCT的變換矩陣來做正交變換就可以節(jié)省大量的求解特征向量的計(jì)算,因而大大簡化了算法的計(jì)算復(fù)雜性。DCT的使用使變換編碼壓縮進(jìn)入了實(shí)用階段。小波變換是繼DCT之后科學(xué)家們找到的又一個可以實(shí)用的正交變換,它與DCT各有千秋,因而分別被不同的研究群體所推崇。 15變換編碼的原理變換編碼是指先對信號進(jìn)行某種函數(shù)變換,從一種信號(空間)變換到另一種(空間),然后再對信號進(jìn)行編碼。如將時域信號變換到頻域

9、,因?yàn)槁曇?、圖像大部分信號都是低頻信號,在頻域中信號的能量較集中,再進(jìn)行采樣、編碼,那么可以肯定能夠壓縮數(shù)據(jù)。 變換編碼系統(tǒng)中壓縮數(shù)據(jù)有變換、變換域采樣和量化三個步驟。變換本身并不進(jìn)行數(shù)據(jù)壓縮,它只把信號映射到另一個域,使信號在變換域里容易進(jìn)行壓縮,變換后的樣值更獨(dú)立和有序。這樣,量化操作通過比特分配可以有效地壓縮數(shù)據(jù)。 在變換編碼系統(tǒng)中,用于量化一組變換樣值的比特總數(shù)是固定的,它總是小于對所有變換樣值用固定長度均勻量化進(jìn)行編碼所需的總數(shù),所以量化使數(shù)據(jù)得到壓縮,是變換編碼中不可缺少的一步。在對量化后的變換樣值進(jìn)行比特分配時,要考慮使整個量化失真最小。 16變換編碼是一種間接編碼方法。它是將原

10、始信號經(jīng)過數(shù)學(xué)上的正交變換后,得到一系列的變換系數(shù),再對這些系數(shù)進(jìn)行量化、編碼、傳輸。圖3是變換編碼系統(tǒng)方框圖。17圖中接收端輸出信號與輸入信號的誤差是因?yàn)檩斎攵瞬捎昧炕鞯牧炕`差所致。當(dāng)經(jīng)過正交變換后的協(xié)方差矩陣為一對角矩陣,且具有最小均方誤差時,該變換稱為最佳變換,也稱Karhunen-Loeve變換(K-L變換)。如果變換后的協(xié)方差矩陣接近對角矩陣,該類變換稱為準(zhǔn)最佳變換,典型的有DCT(離散余弦變換)、DFT(離散傅立葉變換)、WHT等。 18離散余弦變換(DCT)離散余弦變換(Discrete Cosine Tranform,簡稱DCT)是一種與傅立葉變換緊密相關(guān)的數(shù)學(xué)運(yùn)算。在傅立

11、葉級數(shù)展開式中,如果被展開的函數(shù)式是偶函數(shù),那么其傅立葉級數(shù)中只包含余弦項(xiàng),再將其離散化可導(dǎo)出余弦變換,因此稱之為離散余弦變換。時間域中信號需要許多數(shù)據(jù)點(diǎn)表示;在x軸表示時間,在y軸表示幅度。信號一旦用傅立葉變換轉(zhuǎn)換到頻率域,就只需要幾點(diǎn)就可以表示這個相同的信號。如我們已經(jīng)看到的那樣,原因就是信號只含有少量的頻率成分。這允許在頻率域中只用幾個數(shù)據(jù)點(diǎn)就可以表示信號,而在時間域中表示則需要大量數(shù)據(jù)點(diǎn)這一技術(shù)可以應(yīng)用到彩色圖像上。彩色圖像有像素組成,這些像素具有RGB彩色值。每個像素都帶有x,y坐標(biāo),對每種原色使用8x8或者16x16矩陣。在灰度圖像中像素具有灰度值,它的x,y坐標(biāo)由灰色的幅度組成。

12、為了在JPEG中壓縮灰度圖像,每個像素被翻譯為亮度或灰度值。19為了壓縮RGB彩色圖像,這項(xiàng)工作必須進(jìn)行三遍,因?yàn)镴PEG分別得處理每個顏色成分,R成分第一個被壓縮,然后是G成分,最后是B成分。而一個8x8矩陣的64個值,每個值都帶有各自的x,y坐標(biāo),這樣我們就有了一個像素的三維表示法,稱作控件表達(dá)式或空間域。通過DCT變換,空間表達(dá)式就轉(zhuǎn)化為頻譜表達(dá)式或頻率域。從而達(dá)到了數(shù)據(jù)壓縮的目的。DCT式目前最佳的圖像變換,它有很多優(yōu)點(diǎn)。DCT是正交變換,它可以將8x8圖像空間表達(dá)式轉(zhuǎn)換為頻率域,只需要用少量的數(shù)據(jù)點(diǎn)表示圖像;DCT產(chǎn)生的系數(shù)很容易被量化,因此能獲得好的塊壓縮;DCT算法的性能很好,它

13、有快速算法,如采用快速傅立葉變換可以進(jìn)行高效的運(yùn)算,因此它在硬件和軟件中都容易實(shí)現(xiàn);而且DCT算法是對稱的,所以利用逆DCT算法可以用來解壓縮圖像。20為什么采用8x8的圖像塊,其原因是由于計(jì)算量和像素之間關(guān)系的數(shù)量,許多研究表明,在15或20個像素之后,像素間的相關(guān)性開始下降。就是說,一列相似的像素通常會持續(xù)15到20個像素那么長,在此之后,像素就會改變幅度水平(或反向)。模擬圖像經(jīng)采樣后成為離散化的亮度值然后分成一個個宏塊,而一個宏塊有分成8x8大小的塊,可以用一個矩陣來表示這個塊。21在這里,N=8,矩陣中元素f(i,j)表示塊中第i行、第j列像素的亮度值。把該矩陣看作一個空間域,顯然,

14、塊中這些亮度值的大小有一定的隨機(jī)性,無序性,或者說亮度值的分布沒有什么特征;DCT變換就是來解決這個問題的,把這些隨機(jī)的數(shù)據(jù)變的有序,便于對數(shù)據(jù)進(jìn)行編碼壓縮。一維DCT變換的公式為:22結(jié)論DCT的信息壓縮能力比DFT和WHT的能力要強(qiáng)。DCT在信息壓縮能力和計(jì)算復(fù)雜性之間提供了很好的平衡,因此,許多變換編碼系統(tǒng)都是以DCT變換為基礎(chǔ)的。對比其它方法,DCT變換具有使用單一的集成電路就可以實(shí)現(xiàn),可以將最多的信息包裝在最少的系數(shù)之中??墒埂胺謮K噪聲”的塊效應(yīng)最小,這些分塊噪聲是由子圖像之間的可見邊界造成的。23小波變換傳統(tǒng)的基于DCT 變換的圖像壓縮雖然在較高碼率下能夠提供較好的圖像質(zhì)量, 但在

15、碼率低于0.25 bpp時,重構(gòu)圖像存在嚴(yán)重的方塊效應(yīng);同時,許多情況下希望在單一碼流中實(shí)現(xiàn)圖像的有損和無損壓縮,從而實(shí)現(xiàn)從有損到無損的累進(jìn)式傳輸,而基于DCT 的壓縮算法難以實(shí)現(xiàn)這一要求。針對以上問題,近年發(fā)展的離散小波變換(DWT)方法,越來越成為圖像壓縮領(lǐng)域的研究熱點(diǎn)。所謂小波(wavelet),就是存在于一個較小區(qū)域的波。一個小波母函數(shù)經(jīng)過伸縮和平移得到小波基函數(shù)。將伸縮因子和平移因子經(jīng)過采樣并離散化得到離散化的小波函數(shù)。所謂小波變換或小波分解,實(shí)際上就是尋求空間L2(R)上的標(biāo)準(zhǔn)正交小波基,將信號在這組小波基上分解,以便進(jìn)行分析和處理,并且還可以通過這些分解系數(shù)重建原來的信號。24

16、二維圖像信號的小波變換,可以按照下圖分別在水平和垂直方向進(jìn)行濾波的方法實(shí)現(xiàn)二維小波多分辨率分解。原始信號f(x, y)進(jìn)行一級小波分解被分成4個子帶,其中LL子帶對應(yīng)圖像的低頻成分;LH 子帶對應(yīng)水平低通-垂直高通成分,反映了圖像在垂直方向的高頻細(xì)節(jié);HL子帶對應(yīng)水平高通-垂直低通成分,反映了圖像在水平方向的高頻細(xì)節(jié);HH子帶對應(yīng)水平和垂直兩個方向的高通成分反映了圖像在對角線方向的高頻細(xì)節(jié)。為了獲得圖像的多分辨率分解,低頻子帶LL可以繼續(xù)一分為四,每經(jīng)過一級分解,當(dāng)前子帶LLn-1被分成LLn,HLn,LHn和HHn 4 個子帶。對于D 級分解,一幅圖像共產(chǎn)生3D+1 個子帶。2526經(jīng)過小波

17、多分辨率分解后,得到的低頻子帶圖像依然保持原始圖像的概貌,而各高頻子帶各自包含了原圖像在水平、垂直和對角線方向的高頻分量,因而大部分區(qū)域變化幅度不大、能量低;而幅度變化大、能量高的區(qū)域集中在圖像內(nèi)物體的邊緣和細(xì)節(jié)部分,它保持著物體的結(jié)構(gòu)特征。小波分解在不同分辨率下各子帶中系數(shù)的父子關(guān)系可以表示成樹結(jié)構(gòu),粗尺度上的小波系數(shù)稱為父系數(shù),為樹根,在較細(xì)尺度上相應(yīng)空間位置上的小波系數(shù)稱為子孫系數(shù)。小波分解后,子圖按重要性從低到高排序?yàn)椋篖Ln,HLn,LHn,HHn,HLn1,LHn1,HHn1,HH1。在對小波系數(shù)編碼時,應(yīng)按照子圖重要性順序掃描,這樣的掃描順序與圖像信號的能量分布主要集中在低頻,而

18、高頻較少,且人的視覺對低頻比高頻更敏感,對水平和垂直方向的邊緣比對斜向邊緣更敏感的特點(diǎn)一致。27二維圖像信號用二維小波分析進(jìn)行壓縮可以按照如下3 個步驟來進(jìn)行:運(yùn)用小波分析對二維信號進(jìn)行分解。選擇一個小波和小波分解的層次n, 然后計(jì)算信號f 到第n 層的分解。(2)對高頻系數(shù)進(jìn)行閾值量化。對于從1 到n 的每一層, 選擇一個閾值, 并對這一層的高頻系數(shù)進(jìn)行軟閾值量化處理。(3)對二維小波進(jìn)行重構(gòu)。根據(jù)小波分解的第n 層的低頻系數(shù)和經(jīng)過修改的從第1 層到第n 層的各層高頻系數(shù)計(jì)算二維信號的小波重構(gòu)。在以上三個步驟中, 通過小波變換將信號分成高頻和低頻部分。低頻部分是信號的近似子帶, 集中了信號的

19、主要能量; 高頻部分集中了信號的大部分細(xì)節(jié)??梢詫Φ皖l部分進(jìn)行多級的分解, 分出更低頻率的低頻部分和高頻部分, 從而實(shí)現(xiàn)信號的多分辨率分析。小波變換不僅能夠很好的進(jìn)行空間到頻率的定位, 還具有頻率域能量緊縮特性和空間域能量緊縮特性; 表現(xiàn)為大部分的圖像能量總是集中在最低頻率的子圖像, 從低頻到高頻呈遞減分布趨勢。小波變換的這些特性, 構(gòu)成了利用小波對圖像內(nèi)容進(jìn)行分析的重要基礎(chǔ)。283.2.3基于模型編碼從80年代中后期開始,科學(xué)家們開始探討基于模型的編碼,并在包括人臉圖像的編碼等應(yīng)用中使用。如果把以預(yù)測編碼和變換編碼為核心的基于波形的編碼作為第一代編碼技術(shù),則基于模型的編碼就是第二代編碼技術(shù)。

20、 N. Jayant指出,壓縮編碼的極限結(jié)果原則上可通過那些能夠反映信號產(chǎn)生過程最早階段的模型而得到。這就是基于模型編碼的思想。一個例子是人類發(fā)音的“清晰聲帶-聲道模型”(The Articulatory Vocal Cord-Vocal Tract Model),它把注意焦點(diǎn)從線性預(yù)測編碼(LPC,Linear Predictive Coding)分析擴(kuò)展到聲道區(qū)分析,原則上為很低碼率矢量量化提供了強(qiáng)得多的定義域,并允許更好地處理聲帶-聲道的相互作用。另一個例子是人臉的線框(wire-frame)模型,它為壓縮可視電話這類以人臉為主要景物的序列圖像提供了一個強(qiáng)有力的手段。 29基于模型圖像編

21、碼首先由瑞典Forchheimer 等人于1983年提出?;谀P头椒ǖ幕舅枷胧牵涸诎l(fā)送端,利用圖像分析模塊對輸入圖像提取緊湊和必要的描述信息,得到一些數(shù)據(jù)量不大的模型參數(shù);在接收端,利用圖像綜合模塊重建原圖像,是對圖像信息的合成過程?;驹砣鐖D5所示。 30與經(jīng)典方法中的預(yù)測編碼方法類似,基于模型編碼在發(fā)送端既有分析用的編碼器,同時又有綜合用的解碼器。只有這樣,在發(fā)送端才能獲得與接收端相同的綜合后的重建圖像,并將后者與原始圖像進(jìn)行“比較”,以確定圖像失真是否低于“某種閾值”,以便修正模型參數(shù)。 同經(jīng)典方法比較,基于模型編碼還有兩點(diǎn)顯著不同: 一是編碼失真。基于模型編碼所引起的失真已從傳統(tǒng)

22、方法的量化誤差轉(zhuǎn)化為幾何失真,并可能進(jìn)一步轉(zhuǎn)化為物理失真或行為失真。 二是如何評價重建圖像質(zhì)量。傳統(tǒng)的以像素為單位計(jì)算原始圖像與重建圖像之間“逼真度”(如均方誤差、信噪比)不能測量幾何失真和物理失真等,從原理上講根本不適用于基于模型編碼。 313.2.4分型編碼分形編碼的思路 1988年1月,美國Georgia理工學(xué)院的M. F. Barnsley在BYTE發(fā)表了分形壓縮方法。分形編碼法(Fractal Coding )的目的是發(fā)掘自然物體(比如天空、云霧、森林等)在結(jié)構(gòu)上的自相似形,這種自相似形是圖像整體與局部相關(guān)性的表現(xiàn)。分形壓縮正是利用了分形幾何中的自相似的原理來實(shí)現(xiàn)的。首先對圖像進(jìn)行分塊,然后再去尋找各塊之間的相似形,這里相似形的描述主要是依靠仿射變換確定的。一旦找到了每塊的仿射變換,就保存下這個仿射變換的系數(shù),由于每塊的數(shù)據(jù)量遠(yuǎn)大于仿

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論