圖像有損壓縮課件_第1頁
圖像有損壓縮課件_第2頁
圖像有損壓縮課件_第3頁
圖像有損壓縮課件_第4頁
圖像有損壓縮課件_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

圖像有損壓縮

目錄引言1圖像壓縮基本知識介紹2圖像有損壓縮技術(shù)3引言

圖像壓縮的必要性

圖像數(shù)據(jù)的特點之一是數(shù)據(jù)量龐大。給存儲和傳輸帶來許多困難

一幅低分辨率彩色圖像640×480,24bit/pixel,該圖像數(shù)據(jù)量:640×480×3=921,600Byte=0.92MB

HDTV系統(tǒng)中,每個畫面720×1280點,24bit真彩色,60幀/s,具有6倍于傳統(tǒng)電視系統(tǒng)的空間分辨率和

畫面動感。每秒數(shù)據(jù)量:

720×1280×3×60=166MB=1.33Gb

目前數(shù)字傳輸能力,6MHz帶寬,只有20Mb/s的傳輸速率,需要壓縮比:

1330/20=66.4圖像壓縮的可能性從信息論的觀點看,描述信源的數(shù)據(jù)由有用數(shù)據(jù)和冗余數(shù)據(jù)組成。例:“你的妻子,Helen,將于明天晚上6點零5分在波士頓的Logan機場接你”“你的妻子將于明晚6點零5分在Logan機場接你”“Helen將于明晚6點在Logan接你”數(shù)量可觀的冗余信息及不相關(guān)信息,為數(shù)據(jù)壓縮技術(shù)提供可能。如果能夠消除一種或多種冗余,就可取得數(shù)據(jù)壓縮效果。圖像壓縮的可能性圖像中存在很大的冗余度。用戶通常允許圖像失真。例1靜止圖像信息的冗余

(相鄰像素間的空間冗余)例2活動圖像信息的冗余

(相鄰幀間的時間冗余)圖像序列中不同幀之間存在相關(guān)性引起的時間冗余圖像壓縮的主要應(yīng)用很多領(lǐng)域,都會遇到對大量圖像數(shù)據(jù)進行傳輸和存儲的問題,沒有圖像壓縮技術(shù)的發(fā)展,大容量圖像數(shù)據(jù)的存儲與傳輸難以實現(xiàn)。多媒體電視會議、數(shù)字電視,可視電話遙感圖像醫(yī)學(xué)圖像教育商業(yè)管理等圖文資料……存儲:在存儲時壓縮原始數(shù)據(jù),而在使用時再解壓縮,這樣能夠大大增加存儲介質(zhì)的存儲量。傳輸:在發(fā)送端壓縮原始數(shù)據(jù),在接收端將壓縮數(shù)據(jù)解碼,減少傳輸時間在現(xiàn)代通信中,圖像傳輸已成為重要內(nèi)容之一。采用編碼壓縮技術(shù),減少傳輸數(shù)據(jù)量,是提高通信速度的重要手段。2.圖像壓縮基本知識介紹2.1圖像壓縮概念及其原理2.2圖像壓縮分類2.1圖像壓縮概念

數(shù)據(jù)壓縮:數(shù)據(jù)壓縮是信息論的一個重要研究內(nèi)容,稱信源編碼。以盡可能少的數(shù)據(jù)表示信源所發(fā)出的信號,減少數(shù)據(jù)所占用的存儲空間。圖像壓縮:數(shù)據(jù)壓縮技術(shù)在圖像中的應(yīng)用。在滿足一定圖像質(zhì)量條件下,用盡可能少的比特數(shù)來表示原始圖像,以提高圖像傳輸?shù)男屎蜏p少圖像存儲的容量。信源編碼可分為兩大類,無失真編碼有失真編碼(或稱限失真編碼)2.2圖像壓縮分類

根據(jù)解壓重建后的圖像和原始圖像之間是否具有誤差,圖像編碼壓縮分為無損壓縮;(亦稱無誤差編碼;無失真、無損、信息保持編碼)有損壓縮;(亦稱有誤差編碼;有失真或有損編碼)無損壓縮(Losslesscompression):原始數(shù)據(jù)可完全從壓縮數(shù)據(jù)中恢復(fù)出來,即在壓縮和解壓縮過程中沒有信息損失。壓縮比2:1左右有損壓縮(Lossycompression):原始數(shù)據(jù)不能完全從壓縮數(shù)據(jù)中恢復(fù)出來,即恢復(fù)數(shù)據(jù)只是在某種失真度下的近似。

壓縮比1000:1;

3.圖像有損壓縮技術(shù)3.1圖像有損壓縮介紹3.2常見有損壓縮技術(shù)3.1有損壓縮介紹雖然人們總是期望無損壓縮,但冗余度很少的信息對象用無損壓縮技術(shù)并不能得到可接受的結(jié)果。當(dāng)使用的壓縮方法會造成一些信息損失時,關(guān)鍵的問題是看這種損失的影響。有損壓縮經(jīng)常用于壓縮音頻、灰度或彩色圖像和視頻對象等,因為它們并不要求精確的數(shù)據(jù)。在由音頻、彩色圖像、視頻以及其他專門數(shù)據(jù)組成的多媒體對象中,可以單獨使用有損壓縮技術(shù),也可與無損壓縮技術(shù)共同使用。有損壓縮編碼不具有可恢復(fù)性和可逆性,該編碼在壓縮時舍棄冗余的數(shù)據(jù)。例如人眼較難分辨的顏色或人耳難以分辨的方向源信號,實際取決于初始信號的類型、信號的相關(guān)性以及語義等內(nèi)容。這些被舍去的信息值是無法再找回的,所以還原后的數(shù)據(jù)與原始數(shù)據(jù)存在差異。3.2常用的有損壓縮技術(shù) 預(yù)測編碼 變換編碼 基于模型編碼 分形編碼 其他編碼

3.2.1預(yù)測編碼預(yù)測編碼是根據(jù)離散信號之間存在著一定關(guān)聯(lián)性的特點,利用前面一個或多個信號預(yù)測下一個信號進行,然后對實際值和預(yù)測值的差(預(yù)測誤差)進行編碼。如果預(yù)測比較準(zhǔn)確,誤差就會很小。在同等精度要求的條件下,就可以用比較少的比特進行編碼,達到壓縮數(shù)據(jù)的目的。預(yù)測編碼中典型的壓縮方法有脈沖編碼調(diào)制(PCM

PulseCodeModulation)、差分脈沖編碼調(diào)制(DPCM,DifferentialPulseCodeModulation)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM,AdaptiveDifferentialPulseCodeModulation)等,它們較適合于聲音、圖像數(shù)據(jù)的壓縮,因為這些數(shù)據(jù)由采樣得到,相鄰樣值之間的差相差不會很大,可以用較少位來表示。3.2.2變換編碼預(yù)測編碼的壓縮能力是有限的。以DPCM為例,一般只能壓縮到每樣值2~4比特。20世紀(jì)70年代后,科學(xué)家們開始探索比預(yù)測編碼效率更高的編碼方法。人們首先討論了KL變換(Karhunen-LoeveTransform)、傅立葉變換等正交變換,得到了比預(yù)測編碼效率高得多的結(jié)果,但苦于算法的計算復(fù)雜性太高,進行科學(xué)研究可以,實際使用起來很困難。直到20世紀(jì)70年代后期,研究者發(fā)現(xiàn)離散余弦變換DCT與KL變換在某一特定相關(guān)函數(shù)條件下具有相似的基向量,而用DCT的變換矩陣來做正交變換就可以節(jié)省大量的求解特征向量的計算,因而大大簡化了算法的計算復(fù)雜性。DCT的使用使變換編碼壓縮進入了實用階段。小波變換是繼DCT之后科學(xué)家們找到的又一個可以實用的正交變換,它與DCT各有千秋,因而分別被不同的研究群體所推崇。變換編碼的原理 變換編碼是指先對信號進行某種函數(shù)變換,從一種信號(空間)變換到另一種(空間),然后再對信號進行編碼。如將時域信號變換到頻域,因為聲音、圖像大部分信號都是低頻信號,在頻域中信號的能量較集中,再進行采樣、編碼,那么可以肯定能夠壓縮數(shù)據(jù)。 變換編碼系統(tǒng)中壓縮數(shù)據(jù)有變換、變換域采樣和量化三個步驟。變換本身并不進行數(shù)據(jù)壓縮,它只把信號映射到另一個域,使信號在變換域里容易進行壓縮,變換后的樣值更獨立和有序。這樣,量化操作通過比特分配可以有效地壓縮數(shù)據(jù)。 在變換編碼系統(tǒng)中,用于量化一組變換樣值的比特總數(shù)是固定的,它總是小于對所有變換樣值用固定長度均勻量化進行編碼所需的總數(shù),所以量化使數(shù)據(jù)得到壓縮,是變換編碼中不可缺少的一步。在對量化后的變換樣值進行比特分配時,要考慮使整個量化失真最小。變換編碼是一種間接編碼方法。它是將原始信號經(jīng)過數(shù)學(xué)上的正交變換后,得到一系列的變換系數(shù),再對這些系數(shù)進行量化、編碼、傳輸。圖3是變換編碼系統(tǒng)方框圖。圖中接收端輸出信號與輸入信號的誤差是因為輸入端采用量化器的量化誤差所致。當(dāng)經(jīng)過正交變換后的協(xié)方差矩陣為一對角矩陣,且具有最小均方誤差時,該變換稱為最佳變換,也稱Karhunen-Loeve變換(K-L變換)。如果變換后的協(xié)方差矩陣接近對角矩陣,該類變換稱為準(zhǔn)最佳變換,典型的有DCT(離散余弦變換)、DFT(離散傅立葉變換)、WHT等。離散余弦變換(DCT)

離散余弦變換(DiscreteCosineTranform,簡稱DCT)是一種與傅立葉變換緊密相關(guān)的數(shù)學(xué)運算。在傅立葉級數(shù)展開式中,如果被展開的函數(shù)式是偶函數(shù),那么其傅立葉級數(shù)中只包含余弦項,再將其離散化可導(dǎo)出余弦變換,因此稱之為離散余弦變換。時間域中信號需要許多數(shù)據(jù)點表示;在x軸表示時間,在y軸表示幅度。信號一旦用傅立葉變換轉(zhuǎn)換到頻率域,就只需要幾點就可以表示這個相同的信號。如我們已經(jīng)看到的那樣,原因就是信號只含有少量的頻率成分。這允許在頻率域中只用幾個數(shù)據(jù)點就可以表示信號,而在時間域中表示則需要大量數(shù)據(jù)點這一技術(shù)可以應(yīng)用到彩色圖像上。彩色圖像有像素組成,這些像素具有RGB彩色值。每個像素都帶有x,y坐標(biāo),對每種原色使用8x8或者16x16矩陣。在灰度圖像中像素具有灰度值,它的x,y坐標(biāo)由灰色的幅度組成。為了在JPEG中壓縮灰度圖像,每個像素被翻譯為亮度或灰度值。 為了壓縮RGB彩色圖像,這項工作必須進行三遍,因為JPEG分別得處理每個顏色成分,R成分第一個被壓縮,然后是G成分,最后是B成分。而一個8x8矩陣的64個值,每個值都帶有各自的x,y坐標(biāo),這樣我們就有了一個像素的三維表示法,稱作控件表達式或空間域。通過DCT變換,空間表達式就轉(zhuǎn)化為頻譜表達式或頻率域。從而達到了數(shù)據(jù)壓縮的目的。 DCT式目前最佳的圖像變換,它有很多優(yōu)點。DCT是正交變換,它可以將8x8圖像空間表達式轉(zhuǎn)換為頻率域,只需要用少量的數(shù)據(jù)點表示圖像;DCT產(chǎn)生的系數(shù)很容易被量化,因此能獲得好的塊壓縮;DCT算法的性能很好,它有快速算法,如采用快速傅立葉變換可以進行高效的運算,因此它在硬件和軟件中都容易實現(xiàn);而且DCT算法是對稱的,所以利用逆DCT算法可以用來解壓縮圖像。

為什么采用8x8的圖像塊,其原因是由于計算量和像素之間關(guān)系的數(shù)量,許多研究表明,在15或20個像素之后,像素間的相關(guān)性開始下降。就是說,一列相似的像素通常會持續(xù)15到20個像素那么長,在此之后,像素就會改變幅度水平(或反向)。 模擬圖像經(jīng)采樣后成為離散化的亮度值然后分成一個個宏塊,而一個宏塊有分成8x8大小的塊,可以用一個矩陣來表示這個塊。

在這里,N=8,矩陣中元素f(i,j)表示塊中第i行、第j列像素的亮度值。把該矩陣看作一個空間域,顯然,塊中這些亮度值的大小有一定的隨機性,無序性,或者說亮度值的分布沒有什么特征;DCT變換就是來解決這個問題的,把這些隨機的數(shù)據(jù)變的有序,便于對數(shù)據(jù)進行編碼壓縮。 一維DCT變換的公式為:結(jié)論DCT的信息壓縮能力比DFT和WHT的能力要強。DCT在信息壓縮能力和計算復(fù)雜性之間提供了很好的平衡,因此,許多變換編碼系統(tǒng)都是以DCT變換為基礎(chǔ)的。對比其它方法,DCT變換具有使用單一的集成電路就可以實現(xiàn),可以將最多的信息包裝在最少的系數(shù)之中。可使“分塊噪聲”的塊效應(yīng)最小,這些分塊噪聲是由子圖像之間的可見邊界造成的。小波變換傳統(tǒng)的基于DCT變換的圖像壓縮雖然在較高碼率下能夠提供較好的圖像質(zhì)量,但在碼率低于0.25bpp時,重構(gòu)圖像存在嚴(yán)重的方塊效應(yīng);同時,許多情況下希望在單一碼流中實現(xiàn)圖像的有損和無損壓縮,從而實現(xiàn)從有損到無損的累進式傳輸,而基于DCT的壓縮算法難以實現(xiàn)這一要求。針對以上問題,近年發(fā)展的離散小波變換(DWT)方法,越來越成為圖像壓縮領(lǐng)域的研究熱點。所謂小波(wavelet),就是存在于一個較小區(qū)域的波。一個小波母函數(shù)經(jīng)過伸縮和平移得到小波基函數(shù)。將伸縮因子和平移因子經(jīng)過采樣并離散化得到離散化的小波函數(shù)。所謂小波變換或小波分解,實際上就是尋求空間L2(R)上的標(biāo)準(zhǔn)正交小波基,將信號在這組小波基上分解,以便進行分析和處理,并且還可以通過這些分解系數(shù)重建原來的信號。

二維圖像信號的小波變換,可以按照下圖分別在水平和垂直方向進行濾波的方法實現(xiàn)二維小波多分辨率分解。原始信號f(x,y)進行一級小波分解被分成4個子帶,其中LL子帶對應(yīng)圖像的低頻成分;LH子帶對應(yīng)水平低通-垂直高通成分,反映了圖像在垂直方向的高頻細節(jié);HL子帶對應(yīng)水平高通-垂直低通成分,反映了圖像在水平方向的高頻細節(jié);HH子帶對應(yīng)水平和垂直兩個方向的高通成分反映了圖像在對角線方向的高頻細節(jié)。為了獲得圖像的多分辨率分解,低頻子帶LL可以繼續(xù)一分為四,每經(jīng)過一級分解,當(dāng)前子帶LLn-1被分成LLn,HLn,LHn和HHn4個子帶。對于D級分解,一幅圖像共產(chǎn)生3D+1個子帶。經(jīng)過小波多分辨率分解后,得到的低頻子帶圖像依然保持原始圖像的概貌,而各高頻子帶各自包含了原圖像在水平、垂直和對角線方向的高頻分量,因而大部分區(qū)域變化幅度不大、能量低;而幅度變化大、能量高的區(qū)域集中在圖像內(nèi)物體的邊緣和細節(jié)部分,它保持著物體的結(jié)構(gòu)特征。小波分解在不同分辨率下各子帶中系數(shù)的父子關(guān)系可以表示成樹結(jié)構(gòu),粗尺度上的小波系數(shù)稱為父系數(shù),為樹根,在較細尺度上相應(yīng)空間位置上的小波系數(shù)稱為子孫系數(shù)。小波分解后,子圖按重要性從低到高排序為:LLn,HLn,LHn,HHn,HLn-1,LHn-1,HHn-1,…,HH1。在對小波系數(shù)編碼時,應(yīng)按照子圖重要性順序掃描,這樣的掃描順序與圖像信號的能量分布主要集中在低頻,而高頻較少,且人的視覺對低頻比高頻更敏感,對水平和垂直方向的邊緣比對斜向邊緣更敏感的特點一致。二維圖像信號用二維小波分析進行壓縮可以按照如下3個步驟來進行:⑴運用小波分析對二維信號進行分解。選擇一個小波和小波分解的層次n,然后計算信號f到第n層的分解。(2)對高頻系數(shù)進行閾值量化。對于從1到n的每一層,選擇一個閾值,并對這一層的高頻系數(shù)進行軟閾值量化處理。(3)對二維小波進行重構(gòu)。根據(jù)小波分解的第n層的低頻系數(shù)和經(jīng)過修改的從第1層到第n層的各層高頻系數(shù)計算二維信號的小波重構(gòu)。在以上三個步驟中,通過小波變換將信號分成高頻和低頻部分。低頻部分是信號的近似子帶,集中了信號的主要能量;高頻部分集中了信號的大部分細節(jié)。可以對低頻部分進行多級的分解,分出更低頻率的低頻部分和高頻部分,從而實現(xiàn)信號的多分辨率分析。小波變換不僅能夠很好的進行空間到頻率的定位,還具有頻率域能量緊縮特性和空間域能量緊縮特性;表現(xiàn)為大部分的圖像能量總是集中在最低頻率的子圖像,從低頻到高頻呈遞減分布趨勢。小波變換的這些特性,構(gòu)成了利用小波對圖像內(nèi)容進行分析的重要基礎(chǔ)。3.2.3基于模型編碼 從80年代中后期開始,科學(xué)家們開始探討基于模型的編碼,并在包括人臉圖像的編碼等應(yīng)用中使用。如果把以預(yù)測編碼和變換編碼為核心的基于波形的編碼作為第一代編碼技術(shù),則基于模型的編碼就是第二代編碼技術(shù)。 N.Jayant指出,壓縮編碼的極限結(jié)果原則上可通過那些能夠反映信號產(chǎn)生過程最早階段的模型而得到。這就是基于模型編碼的思想。一個例子是人類發(fā)音的“清晰聲帶-聲道模型”(TheArticulatoryVocalCord-VocalTractModel),它把注意焦點從線性預(yù)測編碼(LPC,LinearPredictiveCoding)分析擴展到聲道區(qū)分析,原則上為很低碼率矢量量化提供了強得多的定義域,并允許更好地處理聲帶-聲道的相互作用。另一個例子是人臉的線框(wire-frame)模型,它為壓縮可視電話這類以人臉為主要景物的序列圖像提供了一個強有力的手段。基于模型圖像編碼首先由瑞典Forchheimer等人于1983年提出?;谀P头椒ǖ幕舅枷胧牵涸诎l(fā)送端,利用圖像分析模塊對輸入圖像提取緊湊和必要的描述信息,得到一些數(shù)據(jù)量不大的模型參數(shù);在接收端,利用圖像綜合模塊重建原圖像,是對圖像信息的合成過程?;驹砣鐖D5所示。

與經(jīng)典方法中的預(yù)測編碼方法類似,基于模型編碼在發(fā)送端既有分析用的編碼器,同時又有綜合用的解碼器。只有這樣,在發(fā)送端才能獲得與接收端相同的綜合后的重建圖像,并將后者與原始圖像進行“比較”,以確定圖像失真是否低于“某種閾值”,以便修正模型參數(shù)。 同經(jīng)典方法比較,基于模型編碼還有兩點顯著不同: 一是編碼失真。基于模型編碼所引起的失真已從傳統(tǒng)方法的量化誤差轉(zhuǎn)化為幾何失真,并可能進一步轉(zhuǎn)化為物理失真或行為失真。 二是如何評價重建圖像質(zhì)量。傳統(tǒng)的以像素為單位計算原始圖像與重建圖像之間“逼真度”(如均方誤差、信噪比)不能測量幾何失真和物理失真等,從原理上講根本不適用于基于模型編碼。3.2.4分型編碼分形編碼的思路 1988年1月,美國Georgia理工學(xué)院的M.F.Barnsley在BYTE發(fā)表了分形壓縮方法。分形編碼法(FractalCoding)的目的是發(fā)掘自然物體(比如天空、云霧、森林等)在結(jié)構(gòu)上的自相似形,這種自相似形是圖像整體與局部相關(guān)性的表現(xiàn)。分形壓縮正是利用了分形幾何中的自相似的原理來實現(xiàn)的。首先對圖像進行分塊,然后再去尋找各塊之間的相似形,這里相似形的描述主要是依靠仿射變換確定的。一旦找到了每塊的仿射變換,就保存

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論