![圖像數(shù)據(jù)壓縮技術(shù)的分析研究_第1頁](http://file4.renrendoc.com/view/59fc1842815ef82ef42d4ff0ea23740e/59fc1842815ef82ef42d4ff0ea23740e1.gif)
![圖像數(shù)據(jù)壓縮技術(shù)的分析研究_第2頁](http://file4.renrendoc.com/view/59fc1842815ef82ef42d4ff0ea23740e/59fc1842815ef82ef42d4ff0ea23740e2.gif)
![圖像數(shù)據(jù)壓縮技術(shù)的分析研究_第3頁](http://file4.renrendoc.com/view/59fc1842815ef82ef42d4ff0ea23740e/59fc1842815ef82ef42d4ff0ea23740e3.gif)
![圖像數(shù)據(jù)壓縮技術(shù)的分析研究_第4頁](http://file4.renrendoc.com/view/59fc1842815ef82ef42d4ff0ea23740e/59fc1842815ef82ef42d4ff0ea23740e4.gif)
![圖像數(shù)據(jù)壓縮技術(shù)的分析研究_第5頁](http://file4.renrendoc.com/view/59fc1842815ef82ef42d4ff0ea23740e/59fc1842815ef82ef42d4ff0ea23740e5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
圖像數(shù)據(jù)壓縮技術(shù)的分析研究學(xué)院,000000摘要:信息化是當(dāng)今社會發(fā)展的總體趨勢,它成為推動社會經(jīng)濟發(fā)展的具有舉足輕重的力量。各種先進的數(shù)字技術(shù)使得數(shù)字化程度越來越高,對于電子與信息工程、通信、計算機、等領(lǐng)域有著深遠(yuǎn)的影響。隨著這些領(lǐng)域的應(yīng)用與發(fā)展,各式各樣的數(shù)據(jù)量變得越來越龐大,給這些數(shù)據(jù)的存儲、傳輸及高效、迅速地獲取信息帶來了嚴(yán)重的阻礙。毋庸置疑,數(shù)據(jù)壓縮技術(shù)成為了解決這一問題的關(guān)鍵技術(shù)。圖像是人類最熟悉、最直觀、最容易接受的信息載體,能夠展示出直觀、形象、逼真、立體的場景。統(tǒng)計結(jié)果表明,人類感覺器官接受的信息中,由視覺得到的占絕大多數(shù)。圖像壓縮方法從原理上看在視頻壓縮領(lǐng)域也是適用的,因而圖像數(shù)據(jù)壓縮的重要地位不言而喻。本文主要分析了圖像數(shù)據(jù)壓縮技術(shù)的原理,以及一些主要的壓縮編碼方式,著重分析了DCT和小波變換在圖像壓縮領(lǐng)域的應(yīng)用,它們具有著非常明顯的優(yōu)勢,備受圖像壓縮領(lǐng)域的專家學(xué)者關(guān)注。關(guān)鍵詞:圖像壓縮霍夫曼編碼DCT小波變換
TheApplicativeResearchonDataCompressionAbstract:Informationisthegeneraltrendofsocialdevelopment,itpromotessocialandeconomicdevelopmentandhasbecomeapivotalforce.Avarietyofadvanceddigitaltechnologiesmakeincreasinglyhighdegreeofdigitization,forelectronicandinformationengineering,communications,computers,andotherfieldshaveaprofoundimpact.Withtheapplicationanddevelopmentoftheseareas,avarietyofdatabecomesincreasinglylarge,makingstorage,transmissionofdataandefficiently,quicklyaccesstoinformationposesaseriousobstacle.Thedatacompressiontechnology,withoutdoubt,hasbecomeakeytechnologytosolvethisproblem.
Imageismankind'smostfamiliar,intuitiveandeasiestacceptedinformationcarrier,whichdemonstratesvisualimage,realistic,three-dimensionalscenes.Statisticalresultsshowthathumansensoryorgansreceivethemajorityofinformationbythevisual.Imagecompressionmethod,inprinciple,alsoappliestothefieldofvideocompression,thustheimportanceoftheimagedatacompressionisevident.Thispaperanalyzestheprincipleofimagedatacompressiontechnology,aswellassomemajorcompressionencodingmethods.ItanalyzestheDCTandwavelettransforminthefieldofimagecompressionapplications,whichownaverydistinctadvantageinimagecompressionandhaveawiderangeofapplications,drawingtheattentionsofexpertsandscholarsinthefieldofimagecompression.Keywords:Imagecompression,HuffmanCoding,DCT,WaveletTranslation
目錄18059第一章數(shù)據(jù)壓縮導(dǎo)論 5TOC\o"1-3"\h\u227971.1圖像數(shù)據(jù)壓縮概述 517151.2圖像的分類 5183021.3圖像數(shù)據(jù)壓縮的主要性能指標(biāo) 518840第二章圖像數(shù)據(jù)壓縮的理論基礎(chǔ) 6206832.1信息論基礎(chǔ) 6168612.1.1信息量、熵和編碼 733532.1.2信道、信道容量和信道編碼 7309102.2圖像壓縮編碼方法 811252.2.1霍夫曼編碼 9135752.2.2行程編碼 923702第三章DCT編碼 958143.1離散余弦變換DCT 9323453.2基于DCT的圖像壓縮編碼步驟 10194843.2.1顏色空間的轉(zhuǎn)換和采樣 10165793.2.2二維離散余弦變換 11177053.2.3DCT系數(shù)的量化 12236353.2.4量化系數(shù)的編排 1319083.2.5DC系數(shù)的編碼 14233373.2.6AC系數(shù)的編碼 14134043.3基于DCT的圖像壓縮MATLAB編程 15203553.3.1程序流程圖 15129873.3.2不同圖像的DCT變換壓縮對比 15136283.3.3對圖像做不同的采樣格式進行DCT變換壓縮對比 1727333.3.4不同的亮度量化矩陣的倍乘的DCT變換壓縮對比 19246013.4小結(jié) 2219268第四章小波變換編碼 22175234.1小波變換的基本原理 22275234.2小波變換編碼 23139324.3小波變換對圖像數(shù)據(jù)壓縮的MATLAB仿真實現(xiàn) 25280554.3.1小波變換圖像壓縮的MATLAB實現(xiàn) 25142884.3.2小波變換進行多層圖像壓縮的對比 27295854.3.3不同小波基進行圖像壓縮的對比 29124654.3.4基于DCT和小波的圖像壓縮對比 30320344.4小結(jié) 307397參考文獻 317397致謝 32
第一章數(shù)據(jù)壓縮導(dǎo)論1.1圖像數(shù)據(jù)壓縮概述數(shù)字化的多媒體信息數(shù)據(jù)量[1]龐大,一幅圖像占用很大的本地內(nèi)存,在對其進行傳輸?shù)倪^程中,假如不對它進行壓縮,耗費巨大,也很難得到實際應(yīng)用。壓縮技術(shù)因而成為了現(xiàn)如今的數(shù)字通信、廣播、多媒體等領(lǐng)域中的一項至關(guān)重要的先進技術(shù)。壓縮并不晦澀難懂,在人們生活的方方面面都有它的應(yīng)用。打包行李、整理書桌,這些都是通俗的例子。數(shù)據(jù)壓縮利用有限的時間空間存儲盡量多的信息。比如說人們經(jīng)常的簡稱,國際電信聯(lián)盟縮寫為ITU,上海簡稱“滬”,南京信息工程大學(xué)簡稱為“南信大”。通信中較早的數(shù)據(jù)壓縮技術(shù)是莫斯電報,其將英文中出現(xiàn)頻率最大的字母e用“.”來代替。人類接受的信息超過80%部分是視覺接收到的,圖像相比于文字更形象、豐富,相比于視頻,它不需要借助于多媒體播放器,即不局限于電子工具,因而圖像在傳輸、通信方面擁有著與生俱來的優(yōu)勢。數(shù)字圖像的數(shù)據(jù)量是很龐大的,在確保一定的圖像質(zhì)量等條件下,利用壓縮技術(shù)以減少圖像的數(shù)據(jù)量叫做圖像壓縮。1.2圖像的分類圖像[2]是一種直觀、容易接受的信息載體。我們?nèi)粘I钪?,往往使用大量的圖像來描述某些場景或事物。交通指揮信號、產(chǎn)品使用說明、各種標(biāo)志信息、使用操作圖,等都是以圖像形式存在。圖像的格式眾多,其中最常使用到的在公共領(lǐng)域中包括GIF圖像格式、BMP圖像格式和JPEG(JPG)圖像格式。按照不同的標(biāo)準(zhǔn),我們可以把圖像可以分成很多的種類[3],如下表1-1。表1-1圖像的分類圖像的分類標(biāo)準(zhǔn)按照圖像的灰度分類按照彩色級分類按照運動情況分類按照圖像的產(chǎn)生情況分類按照圖像的對象分類圖像的類型二值圖像灰度圖像連續(xù)色調(diào)圖像離散色調(diào)圖像黑白圖像多色圖像彩色圖像靜止圖像準(zhǔn)靜止圖像運動圖像自然圖像人造圖像廣播電視、可視電話圖像HDTV圖像人像醫(yī)學(xué)圖像其他圖像1.3圖像數(shù)據(jù)壓縮的主要性能指標(biāo)(1)壓縮比壓縮比R,是衡量壓縮系統(tǒng)性能優(yōu)劣的指標(biāo)中極為重要的指標(biāo),它的定義為式(1.1)。(1.1)物理含義表示,壓縮后的數(shù)據(jù)流長度占原始輸入數(shù)據(jù)流長度的百分比(通常R<1)。(2)壓縮因子壓縮比R的倒數(shù)稱為壓縮因子,用K表示,定義見式(1.2)。(1.2)一般情況下K>1,K越大,就表示壓縮系統(tǒng)顯示的壓縮能力越強。(3)壓縮時間我們將壓縮時間其定義為編碼時的時延,它同樣是衡量壓縮性能的一個非常重要的指標(biāo)。假如一個數(shù)據(jù)壓縮系統(tǒng)的編碼方法體系設(shè)計得好,這個系統(tǒng)在編譯時的時延必然也會很小,這樣會有比較顯著地提高系統(tǒng)的性能;相反,則可能降低系統(tǒng)的壓縮性能。(4)信噪比(SNR)SNR是用來測量兩個圖像之間的差異。信噪比(SNR)的計算是為了定量評價的壓縮圖像的質(zhì)量。信噪比提供一種在信號的失真量的測定,利用較高的數(shù)值表示較少的失真。MSE指均方誤差,對于一個每幀n比特的圖像,SNR被定義為式(1.3)。(1.3)(5)峰值信噪比(PSNR)更多情況下,我們會采用峰值信噪比(PSNR)評判重建圖像質(zhì)量,它也是常用的客觀評價指標(biāo)。定義如式(1.4)。(1.4)該式子中,L表示的是圖像灰度值的量化級數(shù),比如是8比特量化,那么L=255。第二章圖像數(shù)據(jù)壓縮的理論基礎(chǔ)2.1信息論基礎(chǔ)信息論[4]是圖像數(shù)據(jù)壓縮編碼的重要基礎(chǔ),信息論由其開山鼻祖香農(nóng)C.E.Shannon在美國著名的貝爾實驗室創(chuàng)立,最早始于香農(nóng)在1948年發(fā)表的《通信的數(shù)學(xué)理論》,這本書也被譽為信息論的開山之作,香農(nóng)之于信息論相當(dāng)于牛頓之于力學(xué)。書中采用了專業(yè)術(shù)語“熵”,“熵”原先被用于熱力學(xué)中,是表示物理系統(tǒng)中的無序程度。這篇論文的偉大之處在于提出了信息熵,同時也奠定了所有的數(shù)據(jù)壓縮算法,以及本文重點研究的圖像壓縮的理論基礎(chǔ)。2.1.1信息量、熵和編碼數(shù)據(jù)是信息的載體,用來記錄、傳送信息。數(shù)據(jù)本身并沒有實質(zhì)的作用,相反數(shù)據(jù)所攜帶的信息才是有用的。數(shù)據(jù)壓縮的理論基礎(chǔ)是著名的香農(nóng)信息論。信息熵有兩個基本的理論概念,即信息、信息量。首先,信息是用不確定量度來定義的,即用一系列的隨機變量表示信息,即通常會用隨機符號來表示它們。這些符號的源被稱為“信源”,它們是進行詳細(xì)研究和壓縮的對象。信息量是指從N個相等的可能事件中,選擇一個事件所需要的信息度量和含量。給定事件X=xi例如,則其信息量I(x)被定義為:(單位:bit)。式中對數(shù)所用的“底”可以取不同的值,對應(yīng)的單位也會有所不同。對于某個信源,它是由n個隨機事件構(gòu)成,就用熵來表示這n個隨機事件的平均信息量。n個隨機事件的自信息的求數(shù)學(xué)期為H(X)是指信源X發(fā)出的一個隨機變量的平均信息量,也就是在信息論中所指的信源X的“熵”(Entropy)。由于信息或多或少地存在著自然冗余。而編碼就會很好的解決這一資源浪費的問題。2.1.2信道、信道容量和信道編碼信道的數(shù)學(xué)模型如圖2.1所示。編碼信道編碼信道調(diào)制信道圖2.1信道的數(shù)學(xué)模型信道的模型如圖2.2所示。x1x2x3yx1x2x3yiy2y1接收端發(fā)送端xn。。。。。。。。
。ynm圖2.2信道模型P(xi)P(y1/x1)P(ym/x1)P(ym/xn)P(yj)平均信息量/符號=容量C的定義:每個符號能夠傳輸?shù)钠骄畔⒘孔畲笾怠? (比特/符號)為了達到最大的信道速率的目的,這就需要需要高效的編碼方式,這就指著名的信道編碼定理,由于是香農(nóng)最先研究這一問題,又稱為香農(nóng)第二定理。2.2圖像壓縮編碼方法數(shù)字圖像的壓縮編碼是指在一定的質(zhì)量條件下,用盡量少的比特數(shù)來表示或者傳輸圖像的過程。通過原始圖像與重構(gòu)圖像的對比,大致可以將圖像壓縮方法分成兩類。第一類為可逆的圖像壓縮編碼的過程,圖像信息沒有絲毫丟失,根據(jù)壓縮后的信息可以完整地恢復(fù)原始圖像,這種壓縮方式建立在信息熵原理基礎(chǔ)上,也成做無損壓縮編碼、熵編碼等,它也是統(tǒng)計意義基礎(chǔ)上的壓縮編碼。其框圖如圖2.3。熵編碼器量化器映射變換原始圖像 碼流熵編碼器量化器映射變換原始圖像信道信道原始圖像恢復(fù)圖像原始圖像原始圖像恢復(fù)圖像原始圖像原始圖像原始圖像碼流2.3無損壓縮過程框圖另一類是指不可逆的圖像壓縮編碼過程,由于圖像信息有一定的損失,根據(jù)解壓后的圖像信息無法完整地恢復(fù)原圖,這種方法通常也被稱作有損壓縮編碼、失真壓縮編碼等。圖2.4給出的是圖像的壓縮編碼方法的一般分類。霍夫曼編碼霍夫曼編碼無損壓縮游程編碼算數(shù)編碼預(yù)測編碼有損編碼變換編碼其他編碼圖像壓縮編碼方法圖2.4是圖像壓縮編碼方法分類2.2.1霍夫曼編碼霍夫曼編碼(Huffmancoding)是無損壓縮的編碼方法中一種有效的編碼方法,它是由霍夫曼博士在于1952年根據(jù)可變長最佳編碼定理提出來的。其的具體步驟如下所示:對于信源符號,按照概率大小降序排列;將概率最小的兩個信源符號通過組合的方式做改變,接著再把組合后的概率之和作為一個新的符號概率,重新按照步驟一排序。重復(fù)以上步驟,始終將概率大的分支放在上層,概率小的分支放在下層,直到總概率為1;將每對組合中的上層分支指定為0,下層分支指定為1;將上述構(gòu)造結(jié)果從上到下構(gòu)造成一個編碼樹,數(shù)的結(jié)構(gòu)決定每個字符的碼字,由此得到整段符號的編碼表。源數(shù)據(jù)里面哪個符號的概率越高,那么我們就得知這個符號對應(yīng)碼字自然就會越短;反之,概率越小的符號,它的碼長會越長,所以可用盡可能少的碼去表示源數(shù)據(jù),壓縮效果顯著。2.2.2行程編碼行程編碼(RunLengthCoding)主要是來檢測信源中出現(xiàn)的重復(fù)符號序列,用符號出現(xiàn)的次數(shù)進行編碼。它又被學(xué)者們叫做游程編碼。我們可以通過計算信源符號出現(xiàn)的行程長度,將行程長度換成剪短的代碼。比如二值符號序列0000000000000001111111000000000可以利用行程編碼改編成1507190,表示15個0,7個1,9個0。符號0、1交錯排列,因而不需要指明具體是哪個符號的行程長度。行程編碼屬于無損壓縮。其壓縮效果在很大程度上是取決于需要壓縮數(shù)據(jù)的內(nèi)容。例如黑白二值圖像(傳真)里面含有大量重復(fù)的像素,這樣在采用行程編碼之后就能更加有效地經(jīng)行數(shù)據(jù)壓縮。但是對于一些特殊的圖像,他們的各種像素分布均勻,假如采用行程編碼反而會使數(shù)據(jù)量增加,出現(xiàn)負(fù)壓縮現(xiàn)象。這種現(xiàn)象就是行程編碼存在的局限。第三章DCT編碼3.1離散余弦變換DCT我們知道,在圖像變換[5]的編碼過程之中,KLT變換是應(yīng)用比較廣泛的正交變換方式,用它來進行圖像壓縮效果明顯。但是,離散余弦變換DCT的算法更加簡單,最為突出的是它實現(xiàn)起來成本非常低廉,所以,DCT慢慢取代了KLT。利用DCT對圖像進行壓縮,其過程見圖3.1。壓縮后的圖像將原圖像數(shù)據(jù)分成8*8的小塊量化器DCT變換熵編碼器壓縮后的圖像將原圖像數(shù)據(jù)分成8*8的小塊量化器DCT變換熵編碼器碼表量化表碼表量化表圖3.1DCT圖像壓縮過程圖解壓縮與壓縮的過程恰好是相反的相互對應(yīng)的兩個具體的過程,見圖3.2。被壓縮圖像DCT逆變換8*8小塊合并,重構(gòu)出圖像反量化熵解碼器被壓縮圖像DCT逆變換8*8小塊合并,重構(gòu)出圖像反量化熵解碼器碼表量化表碼表量化表圖3.2DCT圖像壓縮過程圖在編碼過程中,首先將輸入圖像顏色空間轉(zhuǎn)換后分解為8×8個塊,接著用系統(tǒng)又用2D-DCT將它們分別換為DCT的系數(shù)值,共有64個系數(shù)值。在這些系數(shù)值中第一個是直流(DC)系數(shù),剩下的63個表示的是交流(AC)系數(shù)。當(dāng)然了,DC同樣代表了8×8空域圖像子塊的平均值,再利用量化后的DCT系數(shù)來編碼,最后經(jīng)過系統(tǒng)傳送。與以上過程相反,解碼時,第一步是解出量化后的DCT系數(shù)碼,第二步利用IDCT把它們換成8×8樣本像塊,最后的步驟很簡單,把解好的塊組合,變成單一的圖像,以便重構(gòu)處需要壓縮的圖像。這些就是編解碼的過程,分解開來比較便于理解。3.2基于DCT的圖像壓縮編碼步驟3.2.1顏色空間的轉(zhuǎn)換和采樣電視圖像的數(shù)字化標(biāo)準(zhǔn)已經(jīng)執(zhí)行了多年,具有一定的權(quán)威。這個標(biāo)準(zhǔn)是CCIR601,后來又變成了一個叫做ITU-RBT.601的標(biāo)準(zhǔn),JPEG文件也規(guī)定了應(yīng)當(dāng)使用該標(biāo)準(zhǔn)的顏色空間。JPEG不支持YUV,一直用的是YCbCr的顏色的模式,Y代表著亮度,而色度是由CbCr這組符號來表示的。全彩色在圖像RGB模式下,可以利用公式(3.1)轉(zhuǎn)換成為JPEG標(biāo)準(zhǔn)規(guī)定使用的YCbCr模式。 (3.1)其逆變換如公式(3.2)。 (3.2)JPEG是以8×8塊為一個單位來統(tǒng)一處理,YUV444是最全面的也是最占內(nèi)存的采樣方式。一般情況下,會采用縮減采樣的方式,如YUV422采樣,見圖3.2。圖3.2YUV422取樣示意圖對于YUV422,它表示對矩陣進行2:1的水平采樣,同時也按同樣的比例進行對垂直采樣。YUV411方式采樣更加粗糙??s減采樣的方法如圖3.3所示。aabcde……b'd'圖3.3壓縮取樣示意圖3.2.2二維離散余弦變換傅里葉級數(shù)的展開式里面,如果被展開的函數(shù)只是實偶函數(shù),則其傅式級數(shù)只含有余弦項,在把它離散化,根據(jù)這個理論可以推導(dǎo)出余弦變換,又被稱作離散余弦變換[6]DCT(DiscreteCosineTransform)。2D-DCT正變換公式如式(3.3)。(3.3)其中,。2D-DCT的逆變換公式式(3.4)。(3.4)其中,。在JPEG標(biāo)準(zhǔn)中,通常是將原始圖像分成8×8的子塊,為了得到64個變換系數(shù),利用DCT變換來實現(xiàn)。變換公式是式(3.5)。(3.5)式中,。3.2.3DCT系數(shù)的量化經(jīng)過以上步驟后對其頻率量化,在這里,量化不但為了減小非“0”系數(shù)的幅度,同時也增加“0”值系數(shù)數(shù)量,量化必然會提高效率,相應(yīng)地節(jié)省帶寬資源,當(dāng)然這也將會導(dǎo)致圖像質(zhì)量有一定程度的下降。一般我們會采用如圖3.4所示的均勻量化器,通常人眼對于亮度信號的敏感度會比對色差信號強一些,所以一般采用表3.1中的量化表。表3.1左上角設(shè)定的量化步距是小于右下角的設(shè)定的量化步距的,這樣設(shè)定的原因是因為人眼對低頻分量的圖像比對高頻分量的圖像更敏感。DCT系數(shù)輸入DCT系數(shù)輸入量化系數(shù)輸出圖3.4均勻量化器亮度和色度表示不同的圖像信息,圖像的低頻分量由亮度表示,高頻分量由色度表示,需要根據(jù)不同的量化表分別對亮度和色度進行量化。下面,給出JPEG壓縮色度量化表,以及亮度量化表,如表3.1所示。表3.1JPEG壓縮色度和亮度量化表亮度量化表色度量化表161110162440516117182447999999991212141926586055182126669999999914131624405769562426569999999999141722295187806247669999999999991822375668109103779999999999999999243555648110411392999999999999999949647887103121120101999999999999999979929598112100103999999999999999999量化會必然帶來誤差,不過表3.1綜合了大量圖像測試得到的實驗結(jié)果,會給大部分圖像帶來一個相對較好量化效果。3.2.4量化系數(shù)的編排經(jīng)過量化后,我們需要對系數(shù)進一步做一次重新的編排,這樣做是為了增加對有益于系統(tǒng)進行編碼的連續(xù)的“0”系數(shù)的個數(shù),即“0”的游程長度,在這里我們采用zig-zag編排。DCT變換后其系數(shù)可以看成按有規(guī)律的Z字形狀的衰減。因此,量化系數(shù)按Z字形掃描來讀數(shù)。經(jīng)過量化后的DCT系數(shù)的編排方式可以很清晰明了地從如圖3.5看出。圖3.5量化DCT系數(shù)的編排經(jīng)過量化后的得到了DCT系數(shù)的序號,這些序號見表3.2所示。表3.2量化DCT系數(shù)的序號01561415272824713162629423812172530414391118243140445310192332394552542022333846515560213437475056596135364849575862633.2.5DC系數(shù)的編碼8×8子塊的64個變換系數(shù)經(jīng)量化之后,再按直流系數(shù)DC和交流系數(shù)AC分成兩類來分別處理。經(jīng)過DCT之后,DC系數(shù)的數(shù)值在一般情況下都會有些偏大,相反地,在相鄰8×8圖像塊的DC系數(shù)值變化偏小。所以,JPEG算法充分聯(lián)合了DC系數(shù)的這些獨特之處以及差分脈沖調(diào)制編碼DPCM在這些特點上的優(yōu)勢,從而降低了編碼的比特率,提高了編碼的效率。3.2.6AC系數(shù)的編碼量化AC系數(shù)的特點是1×64矢量中包含有許多“0”,而且這些“0”是連續(xù)的,因此可以采用簡而和直觀的游程編碼(RLE)。AC系數(shù)采用游程編碼的方式可以很清晰地從如圖3.6了解到其原理及過程。77654321076543210第一字節(jié)第二字節(jié)兩個非零值之間的連續(xù)零的個數(shù)下一個非零值所占的比特數(shù)下一個非零系數(shù)的實際值圖3.6AC編碼格式3.2.7Huffman(霍夫曼)編碼對通過以上步驟,DC系數(shù)利用DPCM進行了,而DC直流系數(shù)借助于RLE游程編碼得到了編碼,接著使用Huffman編碼對AC、DC再進行一次統(tǒng)一編排。JPEG編碼的最后是把編碼后的圖像數(shù)據(jù)封裝成幀,為傳輸、存儲以及譯碼的工作提供便利,這個步驟形成JPEG的位數(shù)據(jù)流。3.3基于DCT的圖像壓縮MATLAB編程3.3.1程序流程圖基于DCT的圖像壓縮編碼的MATLAB實現(xiàn)的流程圖如圖3.7所示:
分成8*8像素塊,DCT變換分成8*8像素塊,DCT變換輸入量化表,對變換系數(shù)量化對量化系數(shù)進行掃描選擇不同圖像分別對其進行DCT變換編碼反量化反DCT變換顯示壓縮后圖像的碼率、壓縮比、峰值信噪比PSNR輸入圖片開始結(jié)束圖3.7程序流程圖3.3.2不同圖像的DCT變換壓縮對比實驗用MATLAB編寫程序來進行實驗對比,主要看DCT變換對于不同圖像的壓縮效果。本次試驗的硬件環(huán)境為CPU中央處理器采用Inteli3,CPU主頻2.40GHz,內(nèi)存370M。軟件環(huán)境為windows7操作系統(tǒng),MATLAB的版本為R2010b。利用MATLAB,對我自己拍攝并處理的四幅的不同的圖像進行基于DCT變換來進行圖像壓縮。四組實驗結(jié)果圖如下圖3.8、3.9、3.10、3.11所示。(a)nuist1原始圖像(b)nuist1還原圖像圖3.8nuist1壓縮前后圖像對比(a)nuis2原始圖像(b)nuist2還原圖像圖3.9nuist2壓縮前后圖像對比(a)nuist3原始圖像(b)nuist3還原圖像圖3.10nuist3壓縮前后圖像對比(a)nuist4原始圖像(b)nuist4還原圖像圖3.11nuist4壓縮前后圖像對比從視覺主觀評價來看,這四幅圖絲毫看不出圖像質(zhì)量變壞的痕跡。這也驗證了離散余弦變換(DCT)是圖像處理領(lǐng)域的一種高效方法。表3.3是處理的四幅實驗圖像經(jīng)過DCT壓縮編碼重構(gòu)圖像后各指標(biāo)的具體數(shù)值。表3.3實驗結(jié)果表圖像名稱Nuist1Nuist2Nuist3Nuist4圖像大小512*512512*512512*512512*512碼率bpp(b/s)0.54660.45850.85171.4930壓縮比43.905352.343328.179816.0746峰值信噪比PSNR(dB)37.497337.670133.970328.4736通過表3.3中的詳細(xì)數(shù)據(jù),可以看出,對于不同的圖像,由于其亮度、色度等系數(shù)的分布情況不盡相同,他們的各指標(biāo),如碼率、壓縮比、峰值信噪比也不相同。這里我們采用的圖像大小都為512*512,以方便對比數(shù)據(jù)。從主要的指標(biāo)壓縮比對比來看,基于DCT的圖像壓縮的壓縮比還是比較可觀的,一般都能達到十幾到幾十,而防止信噪比的數(shù)值也比較高,基本都是三十多。由實驗數(shù)據(jù)可以看得出DCT應(yīng)用于圖像壓縮的顯著優(yōu)勢。實際上,DCT憑借其“信息壓縮能力與運算速度之間的最佳平衡”表現(xiàn)出它的應(yīng)用的優(yōu)越性。3.3.3對圖像做不同的采樣格式進行DCT變換壓縮對比對同一幅圖像進行不同的采樣格式Y(jié)UV444,YUV422,YUV411三種采樣格式進行DCT壓縮處理,必然會得到不同的得到的實驗數(shù)據(jù)。下面是對圖3.11fanzhongyan1.jpg圖像采用不同的YUV方式得到的實驗數(shù)據(jù)。由于經(jīng)過DCT壓縮之后,還原恢復(fù)出來的的圖像與原圖上在肉眼分辨率的基礎(chǔ)上幾乎沒有區(qū)別,所以只給出了采用YUV444方法還原出來的圖像,如圖3.12。表3.4是由MATLAB編程運行得到的具體數(shù)據(jù)。圖3.11fanzhongyan1.jpg圖3.12采用YUV444壓縮恢復(fù)后的圖像表3.4對fanzhongyan1.jpg采用不同YUV方式得出的結(jié)果表YUV方式Y(jié)UV444YUV422YUV411碼率bpp1.03740.95260.8971壓縮比23.134725.194926.5143峰值信噪比PSNR35.101834.723934.1745對另一幅圖片leaf.jpg采用不同的YUV方式進行MATLAB編碼,是得到實驗數(shù)據(jù)如表3.5所示,經(jīng)過DCT編解碼恢復(fù)出來的圖像基本相似,限于人眼的分辨率,幾乎看不出圖像差異,論文篇幅的限制下就沒有給出所有的圖像。表3.5對leaf.jpg采用不同YUV方式得出的結(jié)果表YUV方式Y(jié)UV444YUV422YUV411碼率bpp0.89850.788690.7231壓縮比26.708330.429933.1347峰值信噪比PSNR31.185330.764129.9809從表3.4和表3.5可以看出YUV444,YUV422,YUV411三種圖像采樣方式的差異,顯然,YUV444的碼率最高,相應(yīng)地壓縮比也最低,當(dāng)然得到的峰值信噪比也就越高,還原出來的圖像也就越逼真。YUV411采樣方式在三種YUV采樣方式中的碼率是最小的,其壓縮比最大,而峰值信噪比最小。從橫向角度看,YUV444,YUV422,YUV411三種方式的碼率呈現(xiàn)單調(diào)遞減趨勢,壓縮比呈單調(diào)遞增趨勢,而相應(yīng)地,峰值信噪比呈現(xiàn)出單調(diào)遞減的趨勢。在MATLAB編解碼的過程中,YUV444方式耗費的時間最長,YUV422方式次之,YUV411方式耗費的時間最短??梢愿鶕?jù)實際需要相應(yīng)地選擇不同的YUV方式,如果圖像質(zhì)量的要求比較高,即對對峰值信噪比的要求比較高,相應(yīng)地會付出多一些的代價,則可以選用YUV444方式,如果對成本有限制,圖像質(zhì)量要求可以相對降低一些,則可以采用YUV411采樣方式。當(dāng)然,也可以選擇折中一些的YUV422方式。從宏觀角度來看,YUV444,YUV422,YUV411這三種方式都能得到較高的壓縮比,以及比較好的峰值信噪比,所以無論采用哪種方式都能到較好的壓縮效果,這也就充分體現(xiàn)了基于DCT的圖像壓縮技術(shù)的優(yōu)越性。3.3.4不同的亮度量化矩陣的倍乘的DCT變換壓縮對比亮度量化矩陣的倍數(shù)的差異對于圖像壓縮的必然有不一樣的壓縮效果,下面我采用對圖像fanzhongyan1.jpg進行DCT壓縮的試驗方法,使用MATLAB編程完成實驗,并對比試驗結(jié)果。在編程設(shè)計中,默認(rèn)采用YUV422采樣,色度量化矩陣倍數(shù)為一,那么對于同一幅圖像乘以不同的亮度量化矩陣倍數(shù),得到的實驗對比圖如圖3.13。(a)倍數(shù)為9的恢復(fù)圖像(b)倍數(shù)為4的恢復(fù)圖像(c)倍數(shù)為2的恢復(fù)圖像(b)倍數(shù)為1的恢復(fù)圖像(e)倍數(shù)為0.5的恢復(fù)圖像(f)倍數(shù)為0.2的恢復(fù)圖像圖3.13不同量化矩陣倍數(shù)恢復(fù)圖像對比從圖像質(zhì)量可以看出,亮度量化矩陣的倍數(shù)越小,經(jīng)過DCT壓縮變換后的圖像與原圖像越接近。不過,從整體上看來,亮度量化系數(shù)對于圖像經(jīng)過DCT壓縮變換后的圖像質(zhì)量不是很大,恢復(fù)出來的圖像都是比較接近原始圖像的。表3.6給出了不同量化亮度量化矩陣倍數(shù)經(jīng)過MATLAB編碼得到的具體實驗數(shù)據(jù)。表3.6不同亮度量化矩陣倍數(shù)得到的壓縮數(shù)據(jù)亮度量化矩陣的倍數(shù)碼率bpp壓縮比峰值信噪比PSNR90.291882.257425.326940.447353.658529.080020.657036.529432.083210.952625.194934.72390.51.324518.120336.76420.22.185910.979738.8870由表3.6可以非常清晰地得到結(jié)論,DCT壓縮編碼的亮度量化矩陣乘以的倍數(shù)越小,編碼的碼率就會越高,也就是編碼復(fù)雜度逐漸遞增,相應(yīng)地,壓縮比就會減小,這就是編碼要求高導(dǎo)致壓縮比降低的直接結(jié)果,同時,毋庸置疑,碼率高了,峰值信噪比也就提高了,從表格中也可以清晰地看到峰值信噪比也隨著亮度量化倍數(shù)的減小而增大。在MATLAB程序運行過程中,亮度量化矩陣相乘的倍數(shù)越小,碼率越高,所以經(jīng)過DCT變換壓縮和解壓,恢復(fù)出來圖像所耗費的時間也就越長,這符合實驗原理。從表3.6中,我們還可以得到總體的結(jié)論,基于DCT的圖像壓縮方法效率較高,亮度量化矩陣的倍數(shù)大小,除了對壓縮比、編解碼時間的影響比較大以外,對峰值信噪比的影響不是特別重要,峰值信噪比的值都能保持在30左右,即還原出來的圖像與原始圖像還是比較逼近的,這也證實了基于DCT的圖像壓縮編碼的良好效果,所以DCT在圖像壓縮領(lǐng)域有著極為廣泛的應(yīng)用。3.3.5不同的亮度量化矩陣的倍乘的DCT變換壓縮對比根據(jù)主觀推測,由于亮度量化矩陣的倍數(shù)的差異對圖像壓縮壓縮效果存在很大區(qū)別,那么,毫無疑問,色度量化矩陣的倍數(shù)的差異對圖像壓縮壓縮效果也會有一定的影響。下面我采用對一幅圖像cup.bmp進行DCT壓縮的試驗方法,使用MATLAB編程完成實驗,并對比試驗結(jié)果。在編程設(shè)計中,默認(rèn)采用YUV422采樣,亮度量化矩陣倍數(shù)為一,那么對于同一幅圖像乘以不同的色度量化矩陣倍數(shù),用MATLAB編程進行實驗。我采用色度量化矩陣分別乘以9、4、2.5、2、1、0.5、0.3、0.2這8個倍數(shù),分別得到8幅經(jīng)過DCT變換壓縮重構(gòu)后的圖像,由于DCT的優(yōu)越性,恢復(fù)出來的圖像從肉眼上看不出太大差異,和原始進行圖像對比也比較接近,限于篇幅,壓縮后的圖像沒有給出,表3.7給出了不同色度量化矩陣倍數(shù)得到的壓縮數(shù)據(jù),數(shù)據(jù)非常具體。表3.7不同色度量化矩陣倍數(shù)得到的壓縮數(shù)據(jù)色度量化矩陣的倍數(shù)碼率bpp壓縮比峰值信噪比PSNR90.506547.3927.6140.522645.9232.942.50.543844.1434.6720.558942.9535.2410.631937.9836.650.50.763731.4337.540.30.908026.4337.940.21.05522.7538.17從表3.7中的具體數(shù)據(jù)中,我們可以得到非常詳細(xì)的信息,根據(jù)這些詳細(xì)的信息可以歸納出一系列的結(jié)論。可以看出DCT壓縮編碼的色度量化矩陣乘以的倍數(shù)越小,其編碼的碼率也就會越高,那么毫無疑問編碼復(fù)雜度逐漸遞增,相應(yīng)地,壓縮比呈現(xiàn)遞減趨勢,這就是編碼要求高導(dǎo)致壓縮比降低的直接結(jié)果,同時,毋庸置疑,單位編碼位數(shù)高了就代表碼率高了,峰值信噪比也就提高了,從表格中也可以清晰地看到峰值信噪比也隨著色度量化倍數(shù)的減小而增大。在MATLAB程序運行過程中,亮度量化矩陣相乘的倍數(shù)越小,碼率越高,所以經(jīng)過DCT變換壓縮和解壓,恢復(fù)出來圖像會耗費的更多時間。從表3.7中,我們還可以得到總體的結(jié)論,基于DCT的圖像壓縮方法效率較高,色度量化矩陣的倍數(shù)大小,除了對壓縮比、編解碼時間的影響比較大以外,對峰值信噪比的影響不是特別重要,峰值信噪比的值都能保持在30左右,即還原出來的圖像與原始圖像還是比較逼近的。當(dāng)然了,如果對圖像質(zhì)量的要求比較嚴(yán)格,即要求峰值信噪比很高,則可以攢則小的色度量化倍數(shù),如果信道資源有限,傳輸帶寬不能夠占用太大,則可以相對選擇高一些的色度量化倍數(shù),這些完全取決于系統(tǒng)的需要。本實驗得到了基于DCT的圖像壓縮編碼的良好效果,驗證出DCT在圖像壓縮領(lǐng)域性能優(yōu)越。3.4小結(jié)本章節(jié)主要介紹了DCT的基本原理,基于DCT進行圖像壓縮的基本步驟,再通過MATLAB工具編程實現(xiàn)DCT壓縮圖像,分別從四個角度進行實驗對比,首先是對不同圖像進行壓縮對比,接著從不同的采樣方式來進行對比,再然后對亮度矩陣進行不同的倍乘,最后,又從對色度矩陣進行不同倍乘的角度進行分析,整個實驗過程中,都能體現(xiàn)經(jīng)過DCT變換后進行圖像壓縮的優(yōu)越性能。第四章小波變換編碼一種新型的數(shù)據(jù)壓縮技術(shù)正在廣泛地被應(yīng)用于圖像壓縮,這種方法就是現(xiàn)在流行的、應(yīng)用也非常廣泛的小波變換[8]編碼。小波變換有著良好的時域局部特性(即空域局部特性),而且是多分辨率的,所以,很顯然,小波會迎合人眼視覺系統(tǒng),從而會得到一個進行圖像壓縮的良好效果。對某個信號采用時頻分析時,時域分析通過把一維時間信號轉(zhuǎn)換成二維,涵蓋了時間和頻率的二維。傅立葉變換已經(jīng)在頻譜分析領(lǐng)域有著無可取代的地位,同時也應(yīng)用在各種濾波方法中,成為了近代數(shù)學(xué)界以及其相關(guān)領(lǐng)域的最基本工具之一。美中不足的是傅立葉變換(傅氏變換)只能表征信號或者函數(shù)它們的整體的特征,而局部特征不能通過它很好地表現(xiàn)出來。小波變換可變的時間,以及它良好的頻率分辨率,在經(jīng)過巨大的工作量研究之后,順利地幫助學(xué)者解決了這一技術(shù)難題。4.1小波變換的基本原理設(shè),表示這個函數(shù)的傅里葉變換,即傅氏變換,在符合設(shè)定的基本要求條件下:,那么將叫做原型小波,又或者是母小波函數(shù)。將母函數(shù)經(jīng)平移和伸縮得小波函數(shù)族為,在該式子里面,a稱作伸縮因子,而b稱作平移因子,且a≠0;則代表平方可積的、而且是可測量的的一維函數(shù)的矢量空間。對連續(xù)小波變換可以通過式(4.1)來實現(xiàn)。(4.1)這個公式的其重構(gòu)公式,也就是逆變換同樣可以實現(xiàn),其實現(xiàn)公式為式(4.2)。(4.2)其中:(4.3)從上面的幾個式子中可以看出,小波函數(shù)的線性組合具有強大的數(shù)學(xué)應(yīng)用,它可以表示出任何一個平方可積函數(shù)。如果設(shè)則,對定義其離散小波變換為:,(4.4)具有一定衰減性質(zhì)的光滑函數(shù)的二進制伸縮與平移系為:,(4.5)構(gòu)成的規(guī)范正交基。如果小波子空間M=apan{}j,k∈Z是由一組規(guī)范正交基,如上述的Meyer基所張成的,則對于,其重建展開式為:(4.6)小波變換可以看成兩個函數(shù)的乘積,這個乘積由我們設(shè)計的系統(tǒng)的輸入函數(shù)同一個小波基函數(shù)相內(nèi)積之值,則是投影系數(shù),表示了函數(shù)在這個小波子空間M上的投影,所以,它便反映出輸入函數(shù)與小波基函數(shù)的相似程度。借助于系數(shù)的嚴(yán)格分析可以達到分析特性的重要目的。往往就是要分析和處理的信號或圖像。類似地,對于重建(即小波逆變換),可認(rèn)為是以系數(shù)為權(quán)的小波基函數(shù)的累加。4.2小波變換編碼小波變換的特點很多,具有多分辨率分析能力、方向選擇能力等,這些特性符合人眼睛的視覺特性,已經(jīng)被人們廣泛地應(yīng)用在圖像他所編碼過程中,良好的效果得到高度的重視,開創(chuàng)了新的技術(shù)領(lǐng)域,并持續(xù)地蓬勃發(fā)展。對于圖像壓縮,采用小波變換編碼這種方式效率高,其原理框圖如圖4.1所示。原圖像小波變換量化熵編碼輸出比特流壓縮圖像小波逆變換反量化反熵編碼輸入比特流圖4.1小波變換編碼壓縮圖小波變換的編碼部分包括小波變換、量化、熵編碼。相反,解碼部分包括反熵編碼、反量化以及小波逆變換,下面簡要介紹編碼部分各模塊的原理及其作用。小波變換小波變換起基礎(chǔ)性的作用,它把原始輸入圖像設(shè)置為系統(tǒng)的初始數(shù)據(jù),并多次把上一級圖像按照同樣的方式去劃分,在每次分割都同樣地分為四個子帶,當(dāng)然,分解后的子帶圖像代表不同區(qū)域,包含了不同的頻率。在多分辨率分析過程中,每次只對上一級子帶圖像分解。小波變換的分解圖如圖4.2所示。其中,低頻子帶用LL表示,高頻子帶用HH、HL、LH來統(tǒng)一表示。LLLHHLHH(a)原始圖像模式(b)第一級小波分解L2L2L2H2H2L2H2H2(c)第二級小波分解(d)第三極小波分解圖4.2小波變換原始圖像分解示意圖經(jīng)過小波變換之后,原始圖像發(fā)生了變化,整幅圖像在這個變換后,能量經(jīng)過算法程序得到了重新分配,使得很寬范圍內(nèi)的大數(shù)據(jù)當(dāng)中,集中在了較小區(qū)域之中,但是,很大的區(qū)域中數(shù)據(jù)的動態(tài)范圍仍然是非常之小的,顯而易見,這樣的方式就為圖像壓縮創(chuàng)造了良好的條件,不過,小波變換本身沒有實現(xiàn)圖像的壓縮,它只是做了關(guān)鍵性的變換工作,這至關(guān)重要的一步為下面奠定了良好的基礎(chǔ),剩余工作是由之后的量化和編碼過程來實現(xiàn)的。這個特征與變換編碼的原理相似。量化根據(jù)原理,小波變換后的圖像可以用標(biāo)量量化,也可以用矢量量化。如果采用標(biāo)量量化,Lloyd-Max算法是很好的選擇,它可以設(shè)計出小波圖像對應(yīng)的各個高頻子帶在均方誤差下的最佳量化器,也可以根據(jù)人眼的視覺特性與小波圖像吻合的方向選擇性,以及多分辨率的分析能力。對于不同的方向,為了實現(xiàn)理想的壓縮同時,又能夠保證良好的圖像重建質(zhì)量,所以,在不同分辨率的頻帶上可以采用不同的量化級。小波圖像具有多分辨率特性,它的系數(shù)的空間分布特性同樣也有這種特性,所以它很適合采用矢量量化技術(shù),這也就能夠在圖像編碼中顯示出很大的優(yōu)越性。編碼小波變換一般都會采用霍夫曼編碼或者行程編碼等等其它熵編碼,這些編碼方式在本論文的第二章都有介紹,在這里不再贅述。4.3小波變換對圖像數(shù)據(jù)壓縮的MATLAB仿真實現(xiàn)4.3.1小波變換圖像壓縮的MATLAB實現(xiàn)利用MATLAB這一工具對名一幅為nuist34bw.jpg的圖像進行壓縮。本機CPU處理器采用Inteli3,CPU主頻2.40GHz,內(nèi)存370M。軟件環(huán)境為windows7操作系統(tǒng),MATLAB的版本為R2010b。采用baar小波函數(shù),對圖像進行變換、壓縮,最后恢復(fù)出原始圖像,圖4.3一層小小波分解過程圖,這幅圖像清晰地展示了一層小波分解的詳細(xì)過程,我們知道,大多數(shù)情況下圖像的低頻部分集中了很多的該圖像的主要的信息,而高頻部分不是很重要,當(dāng)中大部分點的數(shù)值都是與0非常之逼近,也就可以看做是0了,同時結(jié)論還表明頻率越高,這些店的數(shù)值就更加會與0接近。所以,小波變換低頻的細(xì)節(jié)被保留,一層分解中垂直、水平、以及對角上面的細(xì)節(jié)表示高頻信息,相應(yīng)地它們被忽略。圖4.3一層小小波分解過程圖圖4.4兩層小小波分解過程圖(a)一層重構(gòu)圖像(b)二層重構(gòu)圖像圖4.5一層和兩層壓縮重構(gòu)后的圖像圖4.4展示了nuist34bw.jpg圖像的二層小波分解,程序同樣是采用用小波haar,圖4.5是該圖像經(jīng)過一層重構(gòu)和兩層重構(gòu)后還原出來的圖像,可以看到,經(jīng)過兩次的壓縮,壓縮后的圖像與原圖像幾乎沒有差別,人眼幾乎看不出變迷糊的痕跡,這就是小波變換體現(xiàn)出來的良好特性,它去掉了圖像的高頻系數(shù),H1、D1、V1、H2、V2、D2它們的細(xì)節(jié)部分,只保留了圖像的低頻系數(shù)(近似值部分)。從一層重構(gòu)和兩層重構(gòu)后還原出來的圖像看來,人的眼睛對圖像灰度存在一定的局限,所以雖然經(jīng)過兩次基于小波變換的圖像壓縮,恢復(fù)后的圖像看起來總體上還是比較清晰的。4.3.2小波變換進行多層圖像壓縮的對比對圖像進行小波變換壓縮的效果由很多因素來決定,其中小波分解的層數(shù)多少對重構(gòu)圖像也有著非常重要的影響,下面的實驗,我利用MATLAB編程實現(xiàn)對一幅數(shù)字圖像領(lǐng)域經(jīng)典的圖像512*512的lena進行多層小波分解重構(gòu)的對比,其字節(jié)數(shù)為262144,得出壓縮比、峰值信噪比等實驗數(shù)據(jù)見表4.1。表4.1多層壓縮詳細(xì)數(shù)據(jù)表分解層數(shù)壓縮后字節(jié)數(shù)(bit)壓縮比壓縮誤差峰值信噪比PSNR(dB)運算時間(s)一層1140262.2990.357159.56807223.141962兩層1004922.60860.1001621.01611416.290723三層825183.17680.2494112.95254718.521494四層562304.6620.409338.3289663.299083五層635664.1240.727095.0884443.736587從表4.1中可以看出,將圖像進行幾層分解絕對是有講究的,并不是分解層數(shù)越多越好,也不是分解層數(shù)越少越好,而是要增和考慮。就lena圖像來說分解為四層時壓縮比最大,同時運算時間最短,但是壓縮誤差大,峰值信噪比偏高,重構(gòu)后恢復(fù)出來的圖像失真度過大,這就不算是合適的壓縮方式,一般情況下,進行圖像數(shù)據(jù)壓縮時,首先應(yīng)當(dāng)保證的還是圖像質(zhì)量,其次才是時間、占用內(nèi)存等等壓縮代價和成本,相比之下,兩層分解壓縮并解壓重構(gòu)后的圖像峰值信噪比比較高,雖然耗費了一定的時間,同時,壓縮比也不是很理想,但就圖像質(zhì)量而言,進行兩層小波分解的壓縮重構(gòu)還是比較理想的。為了充分比較小波分解的層數(shù)對于對重構(gòu)圖像質(zhì)量的影響,下面有利用MATLAB編程做了另一組實驗,對經(jīng)典圖像262144個字節(jié)的barbara.png進行不同層數(shù)的分解,接著再對其進行重構(gòu),重構(gòu)后的各項參數(shù),壓縮比、PSNR、運算時間等見表4.2。表4.2多層壓縮詳細(xì)數(shù)據(jù)表2分解層數(shù)壓縮后字節(jié)數(shù)(bit)壓縮比壓縮誤差峰值信噪比PSNR(dB)運算時間(s)一層1172262.23620.359969.32597627.434819兩層1055722.48310.2825410.86952818.313104三層848683.08880.2494118.5713839.994697四層825663.1750.506767.7240479.541222五層532564.92230.74995.4279562.637696根據(jù)表4.2得知,五層壓縮的壓縮比是最高的,但是它的峰值信噪比也最高,壓縮誤差偏大,圖像的質(zhì)量無法保證,而這幅圖片進行三層壓縮時的峰值信噪比最高,其恢復(fù)出來的具有相對較好的質(zhì)量。就運算時間而言,壓縮的層數(shù)越低,則其運算時間越長。所以,綜合考慮各種因素,不同的系統(tǒng)根據(jù)自身需求設(shè)計成不同的壓縮層數(shù)。當(dāng)然對于效率高,但峰值信噪比比較低的壓縮層數(shù),應(yīng)當(dāng)避免,因為其恢復(fù)圖像存在著非常嚴(yán)重的方塊效應(yīng),圖像質(zhì)量嚴(yán)重受損。圖4.8是進行二層和五層壓縮后的圖像,相對比,五層壓縮后的圖像損傷太過嚴(yán)重。從總體角度來說,小波變換后的圖像壓縮相對具有良好的效果。(a)barbara兩層壓縮重構(gòu)圖(b)barbara五層壓縮重構(gòu)圖圖4.8barbara重構(gòu)圖像對比4.3.3不同小波基進行圖像壓縮的對比不同的小波基對于圖像壓縮必然有不同的效果,下面利用MATLAB編程來實現(xiàn)不同小波基的不同壓縮效果的對比,本次試驗?zāi)J(rèn)采用3層小波壓縮,實驗圖片為512*512的lena圖,262144個字節(jié)數(shù),由于恢復(fù)圖像與原圖差別很小,所以直接給出了實驗得出的詳細(xì)數(shù)據(jù)見表4.3。表4.3使用不同的小波函數(shù)的壓縮詳細(xì)數(shù)據(jù)表小波函數(shù)壓縮后字節(jié)數(shù)(bit)壓縮比壓縮誤差峰值信噪比PSNR(dB)運算時間(s)db2744643.52040.2831611.7739695.287058db3713663.67320.229613.73714018.313104db4717743.65240.2241613.9573775.618785db52620810.00240.02084733.1684591.067667db6690803.79480.250119.0726544.751565Sym4857123.05840.233913.55100710.003328Sym5816423.21090.104420.6759048.712723Sym61810214.48150.250292.1112640.924182從表4.3可以看出,Sym5小波、db5小波具有相對較高的峰值信噪比,而且運算時間比較短,在集中小波基中,它們的壓縮比也是最高的,所以就lena圖像來說,Sym5小波、db5小波是比較理想的小波,具有很好的壓縮效果。當(dāng)然,由于不同圖像頻率分配不一樣,不同小波對其的壓縮效果也不盡相同,所以針對不同的圖像應(yīng)當(dāng)向應(yīng)選擇不同的小波。下面又采取了一組小波,同樣對lena進行實驗,這里也省略恢復(fù)圖像,表4.4給出了MATLAB運算出來的具體數(shù)據(jù)。表4.4使用不同的小波函數(shù)的壓縮詳細(xì)數(shù)據(jù)表2小波函數(shù)壓縮后字節(jié)數(shù)(bit)壓縮比壓縮誤差峰值信噪比PSNR(dB)運算時間(s)coif1714603.66840.704355.2201565.838242coif2687883.81090.250462.1122585.310724spline0.2970382.70150.255135.64954814.296418spline1.0448505.84490.03213627.6741251.856009spline1.5839083.12420.1999714.9580139.321767Spline2.01008022.60060.474612.44188215.066393Spline3.0740463.540317.6151026.148522v9/3860863.04510.380368.97814310.158495s+p(4,4)805543.25430.374749.1176268.036391這組小波的對于lena圖像的壓縮性能可以從表4.4對比出來,很顯然spline1.0小波的峰值信噪比最高,整體來說,這組小波的壓縮比偏低,但是運算時間短,效率比較高,spline1.0,spline1.5對圖像的恢復(fù)效果比較好,壓縮比也比較高,壓縮誤差小,比較適合做這幅圖像壓縮的小波基。綜上,不同的小波性能差別各異,應(yīng)根據(jù)系統(tǒng)的具體體統(tǒng),選擇適合的小波基函數(shù)。4.3.4基于DCT和小波的圖像壓縮對比為了對比經(jīng)過DCT變換和經(jīng)過小波變換的圖像壓縮性能,下面在JPEG編譯器中做MATLAB編程對比試驗,實驗環(huán)境CPU處理器采用Inteli3,CPU主頻2.40GHz,內(nèi)存370M。軟件環(huán)境為windows7操作系統(tǒng),MATLAB的版本為R2010b。對lena和barbaba圖進行三層分解,以峰值信噪比為參數(shù),得到的實驗結(jié)果見表4.5。表4.5DCT和DCT的性能對比表碼率bppPSNR(dB)lenabarbabaDCTDWTDCTDWT0.2531.6032.0725.2026.620.5034.9035.8328.3030.680.7536.6037.9431.0033.501.0037.9039.3133.1036.06對比表4.5中的數(shù)據(jù),DCT的峰值信噪比略低于DWT,說明在重構(gòu)的圖像質(zhì)量上面DWT比DCT略勝一籌,每組對比值都高出了超過1dB。從圖4.9中的lena圖像的DCT和DWT對比柱形圖,以及圖4.10中的barbaba圖像的DCT和DWT對比的柱形圖,清晰地看出DCT和小波變換的圖像壓縮的峰值信噪比都比較高,是理想的壓縮方式,小波變換比DCT的壓縮效果略好一些。圖4.9lena圖像的DCT和DWT對比圖4.10barbaba圖像的DCT和DWT對比4.4小結(jié)本章節(jié)主要介紹了小波變換,小波變換應(yīng)用于圖像壓縮的實現(xiàn)。利用MATLAB編程實現(xiàn)了對圖像并進行不同小波層數(shù),以及使用不同小波函數(shù)的進行圖像壓縮的實驗對比。另外,利用MATLAB編程對比DCT和DWT的性能,得出DWT在JPEG編譯器中比DCT的性能略好。本章節(jié)從各個方面分析了基于小波變換的圖像壓縮,小波變換的優(yōu)越性能在圖像壓縮的中充分體現(xiàn)出來。
參考文獻:[1]吳家安.數(shù)據(jù)壓縮技術(shù)及應(yīng)用[M].北京:科學(xué)出版社,2009.[2](美)DavidSalomon著;吳樂南等譯.數(shù)據(jù)壓縮原理與應(yīng)用[M].北京:電子工業(yè)出版社.2003.[3]閆陽,張正炳.淺談數(shù)據(jù)壓縮技術(shù)[J].長江大學(xué)學(xué)報.2004,1(4):120-122.[3]李伶俐.基于DCT和小波變換的圖像編碼的研究.廣州:廣東工業(yè)大學(xué),2008.[4]吳樂南.數(shù)據(jù)壓縮[M].北京:電子工業(yè)出版社.2005.[5]黃賢武,王加俊,李家華.?dāng)?shù)字圖像處理與壓縮編碼技術(shù)[M].西安:西安電子科技大學(xué)出版社.2000.[6]張春田,蘇育挺.數(shù)字圖像壓縮編碼/信號與信息處理叢書[M].清華大學(xué)出版社有限公司,2006.[7]張俊蘭,周鋒.數(shù)據(jù)壓縮的發(fā)展歷程[J].延安大學(xué)學(xué)報(自然科學(xué)版).2008,27(3):24-27.[8]劉觀海.小波變換技術(shù)及其在圖像壓縮中的應(yīng)用分析[J].電腦知識與技術(shù).2009,(21)[9]王向陽,楊紅穎.基于小波變換的有損圖像壓縮算法研究[J].計算機工程與應(yīng)用,2001,37(15
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 湘教版數(shù)學(xué)七年級上冊3.3《一元一次方程模型的應(yīng)用》聽評課記錄3
- 小學(xué)二年級口算題之一
- 五年級口算競賽題
- 店鋪出租合同范本
- 小區(qū)弱電合同范本
- 2025年度車位物業(yè)管理與社區(qū)老年活動中心服務(wù)合同
- 2025年度智能小區(qū)物業(yè)與業(yè)主服務(wù)合同模板范文
- 二零二五年度離婚后子女撫養(yǎng)費及教育支持協(xié)議
- 國際科技合作項目專題合作協(xié)議書范本
- 2025年度電影音樂創(chuàng)作與制作聘用合同
- 二年級看圖寫話看圖寫話素材
- 政務(wù)服務(wù)一網(wǎng)通辦平臺解決方案
- 2022年垃圾焚燒發(fā)電項目可行性研究報告
- 無菌技術(shù)操作-PPT課件
- JTT888-2020公共汽車類型劃分及等級評定_(高清-最新)
- 某天然氣公司場站設(shè)備管理制度
- T_CHES 22-2018 渡槽安全評價導(dǎo)則
- 汶川地震災(zāi)后恢復(fù)重建生產(chǎn)力布局和產(chǎn)業(yè)調(diào)整專項規(guī)劃
- 教師專業(yè)發(fā)展與職業(yè)生涯規(guī)劃優(yōu)秀課件
- 深化內(nèi)部改革轉(zhuǎn)換經(jīng)營機制強推內(nèi)部市場機制管理
- 稅務(wù)師事務(wù)所收費標(biāo)準(zhǔn)
評論
0/150
提交評論