




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、景象匹配與目標(biāo)識別大作業(yè)選題: 圖像壓縮淺析圖像壓縮淺析背景介紹圖像壓縮相關(guān)基礎(chǔ)知識基于DCT變換的JPEG圖像壓縮算法DCT算法的Matlab仿真實現(xiàn)2021-10-20選題背景選題背景:隨著信息技術(shù)的發(fā)展,圖像信息被廣泛應(yīng)用于多媒體通信和計算機系統(tǒng)中,但是圖像數(shù)據(jù)的一個顯著特點就是信息量大。具有龐大的數(shù)據(jù)量,如果不經(jīng)過壓縮,不僅超出了計算機的存儲和處理能力,而且在現(xiàn)有的通信信道的傳輸速率下,是無法完成大量多媒體信息實時傳輸?shù)?因此,為了更有效的存儲、處理和傳輸這些圖像數(shù)據(jù),必須對其進行壓縮,因此有必要對圖像壓縮編碼進行研究。內(nèi)容簡介:內(nèi)容簡介:首先在第二部分中簡單介紹了一些與圖像編碼有關(guān)的
2、基礎(chǔ)知識;在第三部分中對基于DCT變換的JPEG圖像壓縮算法進行了詳細(xì)的分析,重點介紹了JPEG壓縮編碼的具體過程和方法 ,詳細(xì)介紹了編碼中DCT變換、量化、熵編碼和霍夫曼編碼等模塊的原理和數(shù)學(xué)推導(dǎo)以及各模塊的功能分析。最后應(yīng)用MATLAB進行了實驗仿真并分析結(jié)果得出結(jié)論。1、背景介紹2021-10-202、基礎(chǔ)知識 1.圖像壓縮的概念 減少表示數(shù)字圖像時需要的數(shù)據(jù)量 2.圖像壓縮的基本原理 去除多余數(shù)據(jù),以數(shù)學(xué)的觀點來看,這一過程實際上就 是將二維像素陣列變換為一個在統(tǒng)計上無關(guān)聯(lián)的數(shù)據(jù)集合。 圖像壓縮是指以較少的比特有損或無損地表示原來的像 素矩陣的技術(shù),也稱圖像編碼。 圖像數(shù)據(jù)之所以能被壓
3、縮,就是因為數(shù)據(jù)中存在著冗余。2021-10-20 3.圖像數(shù)據(jù)的冗余主要表現(xiàn)為: (1)圖像中相鄰像素間的相關(guān)性引起的空間冗余; (2)圖像序列中不同幀之間存在相關(guān)性引起的時間冗余; (3)不同彩色平面或頻譜帶的相關(guān)性引起的頻譜冗余。 4.數(shù)據(jù)壓縮的目的 就是通過去除這些數(shù)據(jù)冗余來減少表示數(shù)據(jù)所需的比特數(shù)。 由于圖像數(shù)據(jù)量的龐大,在存儲、傳輸、處理時非常困難,因 此圖像數(shù)據(jù)的壓縮就顯得非常重要。 2021-10-20 5.圖像壓縮基本方法 從壓縮編碼算法原理上可以分為以下3類: (1)無損壓縮編碼種類 霍夫曼(Huffman)編碼,算術(shù)編碼,行程(RLE)編碼,Lempel zev編碼。 (
4、2)有損壓縮編碼種類 預(yù)測編碼,DPCM,運動補償; 頻率域方法:正交變換編碼(如DCT),子帶編碼;2021-10-20 空間域方法:統(tǒng)計分塊編碼; 模型方法:分形編碼,模型基編碼; 基于重要性:濾波,子采樣,比特分配,向量量化;(3)混合編碼 有JBIG,JPEG,H261,MPEG等技術(shù)標(biāo)準(zhǔn)。6.圖像壓縮效果的評估 壓縮方法的質(zhì)量經(jīng)常使用峰值信噪比來衡量,峰值信噪比用來表示圖像有損壓縮帶來的噪聲。但是,觀察者的主觀判斷也認(rèn)為是一個重要的、或許是最重要的衡量標(biāo)準(zhǔn)。2021-10-207、幾種常見的連續(xù)色調(diào)靜止圖像壓縮標(biāo)準(zhǔn)2021-10-203、基于DCT變換的JPEG圖像壓縮算法1、簡化算
5、法流程圖原始圖像數(shù)據(jù)分成8*8的小塊DCT變換量化器熵編碼器壓縮數(shù)據(jù)量化表碼表基于DCT編碼的JPEG壓縮過程簡化圖2021-10-20 在編碼過程中,首先將輸入圖像顏色空間轉(zhuǎn)換后分解為88大小的數(shù)據(jù)塊,然后用正向二維DCT把每個塊轉(zhuǎn)變成64個DCT系數(shù)值,其中1個數(shù)值是直流(DC)系數(shù),即88空域圖像子塊的平均值,其余的63個是交流(AC)系數(shù),接下來對DCT系數(shù)進行量化,最后將變換得到的量化的DCT系數(shù)進行編碼和傳送,這樣就完成了圖像的壓縮過程。 在解碼過程中,形成壓縮后的圖像格式,先對已編碼的量子化的DCT系數(shù)進行解碼,然后求逆量化并把DCT系數(shù)轉(zhuǎn)化為88樣本像塊(使用二維DCT反變換)
6、,最后將操作完成后的塊組合成一個單一的圖像。這樣就完成了圖像的解壓過程。2021-10-20 2、顏色空間的轉(zhuǎn)換和采樣 JPEG文件使用的顏色空間為1982年推薦的電視圖像數(shù)字化 標(biāo)準(zhǔn)CCIR 601(現(xiàn)為ITU-RB T.601)。在這個色彩空間中,每 個分量、每個像素的電平規(guī)定為255級,用8位代碼表示。 JPEG只支持YCbCr顏色模式。其中Y代表亮度,CbCr代表色 度。全彩色圖像RGB模式轉(zhuǎn)換到Y(jié)CbCr模式,用下組公式:0.2990.5870.114()/1.402()/1.772YRGBCrRYCbBY2021-10-20 3、DCT變換 在傅里葉級數(shù)展開式中,如果被展開的函數(shù)是
7、實偶函數(shù),那么,其傅里葉級數(shù)中只包含余弦項,在將其離散化由此可導(dǎo)出余弦變換,或稱之為離散余弦變換(DCT,Discrete Cosine Transform)7。二維離散余弦正向變換公式為式中: vNyuNxyxfNvcucvuFNyNx212cos212cos,2,10101, 1 , 0,Nvuyx其它10, 021)()(vuvcuc2021-10-20 離散余弦變換(DCT)從本質(zhì)上是一種變換分析方法,要在變換時最大的去除分析信號的相關(guān)性提取其特征,就必須適當(dāng)?shù)臉?gòu)造一組基函數(shù),這組基函數(shù)以某種形式類似于我們所要表示的數(shù)據(jù),甚至具有與數(shù)據(jù)相同的相關(guān)結(jié)構(gòu)。在我們?nèi)粘I钪谐S龅降男盘栐诳臻g
8、域和頻域都具有相關(guān)性。在空間上相隔較近的樣值間的相關(guān)性比相隔較遠(yuǎn)的大的多,而在頻域上通常呈帶狀。為了分析和表示這樣的信號,我們需要基函數(shù)在空間域和頻域是局域性的。由于離散余弦函數(shù)的頻域分辨率與時域分辨率成反比,剛好與實際信號長時低頻、短時高頻的特性相吻合。既能精確定位信號的突發(fā)跳變,又能把握信號的整體變化率。由此可見,離散余弦變換是一種比較理想的進行信號處理的數(shù)學(xué)工具。2021-10-20在MATLAB的圖像處理工具箱中,可以直接調(diào)用dct2和idct2來實現(xiàn)二維離散 余弦變換及其反變換。 (1) dct2dct2函數(shù)實現(xiàn)圖像的二維離散余弦變換,其語法為: F=dct2(f)運行下列程序: f
9、=imread(cameraman.tif); f=im2double(f); F=dct2(f); subplot(121),imshow(f, ); subplot(122),imshow(log(1+20*abs(F), );2021-10-20 運行結(jié)果如圖所示 由運行結(jié)果可知,DCT變換具有能量集中的性質(zhì),數(shù)據(jù)集中在左上角。因此進行圖像壓縮時離散余弦變換矩陣可以舍棄右下角的高頻數(shù)據(jù)。2021-10-20 88的圖像經(jīng)過DCT變換后,其低頻分量都集中在左上角,高頻分量分布在右下角(DCT變換實際上是空間域的低通濾波器)。由于該低頻分量包含了圖像的主要信息(如亮度),而高頻與之相比,就不
10、那么重要了,所以我們可以忽略高頻分量,從而達(dá)到壓縮的目的。 將高頻分量去掉,這就要用到量化,它是產(chǎn)生信息損失的根源。這里的量化操作,就是將某一個值除以量化表中對應(yīng)的值。由于量化表左上角的值較小,右下角的值較大,這樣就起到了保持低頻分量,抑制高頻分量的目的。JPEG使用的顏色是YUV格式。我們提到過,Y分量代表了亮度信息,UV分量代表了色差信息。相比而言,Y分量更重要一些。我們可以對Y采用細(xì)量化,對UV采用粗量化,可進一步提高壓縮比。所以上面所說的量化表通常有兩張,一張是針對Y的,一張是針對UV的。2021-10-20 JPEG壓縮色度和亮度量化表2021-10-20量化之后的效果圖量化之后的效
11、果圖2021-10-20 注注: 由于人眼對低頻分量的圖像比對高頻分量的圖像更敏感,因此表中的左上角的量化步距要比右下角的量化步距小。 量化會產(chǎn)生誤差,上圖是綜合大量的圖像測試的實驗結(jié)果,對于大部分圖像都有很好的結(jié)果。表中可以看出,高頻部分對應(yīng)的量化值大,目的就是將高頻部分編程接近于0,以便以后處理。JPEG可以在壓縮比和圖像質(zhì)量間作取舍。方法就是改變量化值。如果量化值放大一倍,則有更多的系數(shù)量化為0,提高了壓縮比。2021-10-204、量化系數(shù)的編排 經(jīng)過DCT變換和量化之后,低頻分量集中在左上角,其中F(0,0)(即第一行第一列元素)代表了直流(DC)系數(shù),即88子塊的平均值,要對它單獨
12、編碼。由于兩個相鄰的88子塊的DC系數(shù)相差很小,所以對它們采用差分編碼DPCM,可以提高壓縮比,也就是說對相鄰的子塊DC系數(shù)的差值進行編碼。 88的其它63個元素是交流(AC)系數(shù),DCT變換后低頻分量多呈圓形輻射狀向高頻率衰減,因此可以看成按Z字形衰減。所以量化后的系數(shù)要重新編排,目的是為了增加連續(xù)的“0”系數(shù)的個數(shù),就是“0”的游程長度,因此,量化系數(shù)按Z字形掃描讀數(shù),采用行程編碼。2021-10-20亮度量化后的系數(shù)注注:可見量化后只有左上角的幾個點(低頻分量)不為零,這樣采用行程編碼就會很有效。2021-10-20量化后的DCT系數(shù)的編排如圖所示2021-10-205、系數(shù)編碼DC系數(shù)
13、的編碼圖像塊經(jīng)過DCT變換之后得到的DC直流系數(shù)有兩個特點,一是系數(shù)的數(shù)值比較大,二是相鄰88圖像塊的DC系數(shù)值變化不大。根據(jù)這個特點,JPEG算法使用了差分脈沖調(diào)制編碼技術(shù)。連續(xù)色調(diào)的圖像中,其差值多半比原值小,對差值進行編碼所需的位數(shù),會比對原值進行編碼所需的位數(shù)少許多。在差值前端另外加入一些差值的霍夫曼碼值,例如亮度差值為5(101)的位數(shù)為3,則霍夫曼碼值應(yīng)該是100,兩者連接在一起即為100101。這種霍夫曼碼值+幅值的表示方法簡稱SS/VV編碼。2021-10-20AC系數(shù)的編碼量化AC系數(shù)的特點是164矢量中包含有許多“0”系數(shù),并且許多“0”是連續(xù)的,因此使用非常簡單和直觀的游
14、程長度編碼(RLE)對它們進行編碼。所謂行程編碼(Run-Length Encoding)就是指僅存儲一個像素值以及具有相同顏色的像素數(shù)目的圖像數(shù)據(jù)編碼方式,或稱游程編碼。63個AC系數(shù)采用行程編碼的方式進行編碼的格式如下頁示意圖所示。也即在AC01到AC63中,找出每一個非零的AC值,將其表示成(NN/SS)VV的形式,其中:NN表示該AC值前的0的個數(shù);而SS、VV與DC的定義一樣,其中SS表示該非零值占的位數(shù),VV表示其幅值。如果連續(xù)的非0超過15個時,增加一個擴展字節(jié):(15/0)表示連續(xù)16個0。另外若有一串0延伸到AC63,一律用(0/0)表示結(jié)束。2021-10-20 對于AC系
15、數(shù),有兩個符號。符號1為行程和尺寸,即上面的(RunLength,Size)。符號2為幅度值。(0,0)和(15,0)是兩個比較特殊的情況。(0,0)表示塊結(jié)束標(biāo)志(EOB), (15,0)表示ZRL,當(dāng)行程長度超過15時,用增加ZRL的個數(shù)來解決。 對于DC系數(shù),也有兩個符號。符號1為尺寸(Size);符號2為幅度值(Amplitude)。(NN/SS)VV(NN/SS)VV示意圖示意圖2021-10-20 第一步,熵編碼的中間格式表示。 JPEG中為了更進一步節(jié)約空間,并不直接保存數(shù)據(jù)的具體數(shù)值,而是將數(shù)據(jù)按照位數(shù)分為16組,保存在表里面。這也就是所謂的變長整數(shù)編碼變長整數(shù)編碼VLIVLI
16、。即,第0組中保存的編碼位數(shù)為0,其編碼所代表的數(shù)字為0;第1組中保存的編碼位數(shù)為1,編碼所代表的數(shù)字為-1或者1.舉例來說:Size=6時,Amplitude的范圍是-63-32,以及3263。對絕對值相同,符號相反的碼字之間為反碼關(guān)系。所以AC系數(shù)為32的碼字為100000,33的碼字為100001,-32的碼字為011111,-33的碼字為011110。符號2的碼字緊接于符號1的碼字之后。 對于DC系數(shù),Y和UV的Huffman碼表也不同。6、熵編碼2021-10-20詳解:先看DC系數(shù)。假設(shè)前一個88子塊DC系數(shù)的量化值為12,則本塊DC系數(shù)與它的差為3,查表得Size=2,Ampli
17、tude=3,所以DC中間格式為(2)(3)。下面對AC系數(shù)編碼。經(jīng)過Zig-Zag掃描后,遇到的第一個非零系數(shù)為-2,其中遇到零的個數(shù)為1(即RunLength)查表得Size=2。所以RunLength=1,Size=2,Amplitude=-2,所以AC中間格式為(1,2)(-2)。其余的點類似,可以求得這個88子塊熵編碼的中間格式為 (DC)(2)(3),(1,2)(-2),(0,1)(-1),(0,1)(-1),(0,1)(-1),(2,1)(- 1), (EOB)(0,0)2021-10-20VLI:DC系數(shù)表2021-10-20VLI:AC系數(shù)表2021-10-20第二步,熵編碼
18、。對符號1進行Huffman編碼(亮度,色差的Huffman碼表不同)。對符號2進行變長整數(shù)VLI編碼。對于(2)(3):2查DC亮度Huffman表得到11,3經(jīng)過VLI編碼為011;對于(1,2)(-2):(1,2)查AC亮度Huffman表得到11011,-2是2的反碼,為01;對于(0,1)(-1):(0,1)查AC亮度Huffman表得到00,-1是1的反碼,為0;.最后,這一88子塊亮度信息壓縮后的數(shù)據(jù)流為11011,1101101,000, 000, 000,111000,1010。總共31比特,其壓縮比是648/31=16.5,大約每個象素用半個比特(原先需要8個比特)。以上是
19、圖像壓縮編碼的整個過程。2021-10-20 從上面的例子可以看出,壓縮比和圖像質(zhì)量是呈反比的,以下是壓縮效率與圖像質(zhì)量之間的大致關(guān)系,可以根據(jù)需要,選擇合適的壓縮比。壓縮比和圖像質(zhì)量的關(guān)系如表所示 圖:壓縮效率與圖像質(zhì)量的關(guān)系2021-10-20 綜述:JPEG格式是目前網(wǎng)絡(luò)上最流行的圖像格式,是可以把文件壓縮到最小的格式,在 Photoshop軟件中以JPEG格式儲存時,提供11級壓縮級別,以010級表示。其中0級壓縮比最高,圖像品質(zhì)最差。即使采用細(xì)節(jié)幾乎無損的10 級質(zhì)量保存時,壓縮比也可達(dá) 5:1(1.6 bits/pixel)。以BMP格式保存時得到的4.28MB圖像文件,在采用JP
20、G格式保存時,其文件僅為178KB,壓縮比達(dá)到24:1。一般情況下,采用第8級壓縮為存儲空間與圖像質(zhì)量兼得的最佳比例。JPEG格式的應(yīng)用非常廣泛,特別是在網(wǎng)絡(luò)和光盤讀物上,都能找到它的身影。目前各類瀏覽器均支持JPEG這種圖像格式,因為JPEG格式的文件尺寸較小,下載速度快。2021-10-204、Matlab的仿真實現(xiàn) MATLAB為用戶提供了專門的函數(shù)來從圖像格式的文件中讀寫圖像數(shù)據(jù)。這種方法不像其他編程語言,需要編寫復(fù)雜的代碼,只需要簡單地調(diào)用MATLAB提供的函數(shù)即可。4.1 圖像的讀寫(1) 圖像文件的讀取。 MATLAB中利用函數(shù)imread來實現(xiàn)圖像文件的讀取操作。其語法格式為:
21、A=imread(filename,fmt)X,map=imread(filename,fmt)=imread(filename)Filename:圖像文件名;fmt:圖像文件格式。2021-10-20(2) 圖像文件的輸出。 MATLAB中利用函數(shù)imwrite來實現(xiàn)圖像文件的輸出和保存操作。其語法格式為:Imwrite(A,filename,fmt)Imwrite(X,map,filename,fmt)Imwrite(,filename)Imwrite(A,filename,fmt)把圖像 A 寫入圖像文件 filename。Imwrite(X,map,filename,fmt)把 X和它
22、的相關(guān)色彩信息map寫入filename。2021-10-20(3) 圖像文件的顯示。 在MATLAB中,可以調(diào)用image函數(shù)來顯示圖像,其語法格式為:Image(C)Image(C) 把矩陣 C 轉(zhuǎn)成一圖像。C 可以是一MN 或 MN3維的矩陣,且可以是包含 double, uint8,或 uint16 數(shù)據(jù)。image是用來顯示附標(biāo)圖像,即顯示的圖像上有x、y坐標(biāo)軸的顯示,可以看到圖像的像素大小。但可以加上axis off命令即可把坐標(biāo)去掉。在MATLAB的圖像處理工具箱中,還提供了一個應(yīng)用很廣泛的圖像顯示函數(shù),即imshow函數(shù),其調(diào)用格式為:Imshow(I,n)顯示一幅n個灰度級的
23、圖像I。2021-10-20Imshow(I,low high)一定灰度范圍內(nèi)顯示灰度圖像,low和high參數(shù)分別為數(shù)據(jù)數(shù)組的最小值和最大值。Imshow(BW)顯示二進制圖像。Imshow(X,map)顯示索引圖像,其中X代表索引圖像的數(shù)據(jù)矩陣,map為顏色映射表。imshow filename 顯示一幅在當(dāng)前目錄下的合法文件。imshow(RGB)顯示RGB圖像。RGB是一個mn3的數(shù)組。對于RGB中的每個像素(r,c),imshow顯示數(shù)值(r,c,1:3)所描述的顏色。2021-10-20 4.2 程序流程圖開始輸入圖片分成8*8像素塊,DCT變換輸入量化表,對變換系數(shù)量化對量化系數(shù)進行掃描熵編碼反量化反DCT變換顯示所選圖像的信噪比結(jié)束2021-10-20 4.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞務(wù)派遺合同范本
- 養(yǎng)殖社購銷合同范本
- 借條正規(guī)合同范本
- 公司網(wǎng)絡(luò)線路維修合同范本
- 加工蔬菜采購合同范本
- 利益聯(lián)結(jié)機制合同范本
- 出租專用桌子合同范本
- 與社區(qū)合作社簽訂合同范例
- 二手房按揭買賣合同范本
- 公司許可經(jīng)營合同范本
- 如果國寶會說話中國歷史文物介紹
- 智慧農(nóng)業(yè)的智能農(nóng)機與裝備
- 2 祖父的園子(生字)-部編版五年級下冊語文課件
- 并聯(lián)有源電力濾波器工程應(yīng)用關(guān)鍵技術(shù)的研究的開題報告
- 復(fù)用醫(yī)療器械的規(guī)范化處理流程之清洗課件
- ★滬教牛津版英語四年級上冊練習(xí)冊4a
- 跨文化語境下的國家形象塑造與傳播以中國《國家形象》宣傳片為例
- 2024年北京電子科技職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試題庫含答案解析
- 生產(chǎn)車間環(huán)境改善方案
- 第1課 古代亞非(課件)
- 2024年高考物理真題分類匯編(全一本附答案)
評論
0/150
提交評論