數(shù)字圖像處理:基于DCT的圖像壓縮(共8頁(yè))_第1頁(yè)
數(shù)字圖像處理:基于DCT的圖像壓縮(共8頁(yè))_第2頁(yè)
數(shù)字圖像處理:基于DCT的圖像壓縮(共8頁(yè))_第3頁(yè)
數(shù)字圖像處理:基于DCT的圖像壓縮(共8頁(yè))_第4頁(yè)
數(shù)字圖像處理:基于DCT的圖像壓縮(共8頁(yè))_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上數(shù)字圖像處理基于DCT的圖像壓縮姓名:張凱學(xué)號(hào):0專(zhuān)業(yè):空間技術(shù)處理及應(yīng)用技術(shù)基于DCT的圖像壓縮算法介紹DCT變換的全稱(chēng)是離散余弦變換(Discrete Cosine Transform),離散余弦變換相當(dāng)于一個(gè)長(zhǎng)度大概是它兩倍的離散傅里葉變換,這個(gè)離散傅里葉變換是對(duì)一個(gè)實(shí)偶函數(shù)進(jìn)行的。通過(guò)數(shù)字信號(hào)處理的學(xué)習(xí)我們知道實(shí)函數(shù)的傅立葉變換獲得的頻譜大多是復(fù)數(shù),而偶函數(shù)的傅立葉變換結(jié)果是實(shí)函數(shù)。以此為基礎(chǔ),使信號(hào)函數(shù)成為偶函數(shù),去掉頻譜函數(shù)的虛部,是余弦變換的特點(diǎn)之一。它可以將將一組光強(qiáng)數(shù)據(jù)轉(zhuǎn)換成頻率數(shù)據(jù),以便得知強(qiáng)度變化的情形。若對(duì)高頻的數(shù)據(jù)做些修飾

2、,再轉(zhuǎn)回原來(lái)形式的數(shù)據(jù)時(shí),顯然與原始數(shù)據(jù)有些差異,但是人類(lèi)的眼睛卻是不容易辨認(rèn)出來(lái)。壓縮時(shí),將原始圖像數(shù)據(jù)分成8*8數(shù)據(jù)單元矩陣,例如亮度值在第一個(gè)矩陣內(nèi)。理論背景視頻信號(hào)的頻譜線(xiàn)在0-6MHz范圍內(nèi),而且1幅視頻圖像內(nèi)包含的大多數(shù)為低頻頻譜線(xiàn),只在占圖像區(qū)域比例很低的圖像邊緣的視頻信號(hào)中才含有高頻的譜線(xiàn)。因此,在視頻信號(hào)數(shù)字處理時(shí),可根據(jù)頻譜因素分配比特?cái)?shù):對(duì)包含信息量大的低頻譜區(qū)域分配較多的比特?cái)?shù),對(duì)包含信息量低的高頻 譜區(qū)域分配較少的比特?cái)?shù),而圖像質(zhì)量并沒(méi)有可察覺(jué)的損傷,達(dá)到碼率壓縮的目的。然而,這一切要在低熵(Entropy)值的情況下,才能達(dá)到有效的編碼。能否對(duì)一串?dāng)?shù)據(jù)進(jìn)行

3、有效的編碼,取決于每個(gè)數(shù)據(jù)出現(xiàn)的概率。每個(gè)數(shù)據(jù)出現(xiàn)的概率差別大,就表明熵值低, 可以對(duì)該串?dāng)?shù)據(jù)進(jìn)行高效編碼。反之,出現(xiàn)的概率差別小,熵值高,則不能進(jìn)行高效編碼。視頻信號(hào)的數(shù)字化是在規(guī)定的取樣頻率下由A/D轉(zhuǎn)換器對(duì)視頻電平轉(zhuǎn)換而來(lái)的,每個(gè)像素的視頻信號(hào)幅度隨著每層的時(shí)間而周期性地變化。每個(gè)像素的平均信息量的總和為總平均信息量,即熵值。由于每個(gè)視頻電平發(fā)生幾乎具有相等的概率,所以視頻信號(hào)的熵值很高。 熵值是一個(gè)定義碼率壓縮率的參數(shù),視頻圖像的壓縮率依賴(lài)于視頻信號(hào)的熵值,在多數(shù)情況下視頻信號(hào)為高熵值,要進(jìn)行高效編碼,就要將高熵值變?yōu)榈挽刂?。怎樣變成低熵值呢?這就需要分析視頻頻譜的

4、特點(diǎn)。大多數(shù)情況下,視頻頻譜的幅度隨著頻率的升高而降低。其中 低頻頻譜在幾乎相等的概率下獲得0到最高的電平。與此相對(duì)照,高頻頻譜通常得到的是低電平及稀少的高電平。顯然,低頻頻譜具有較高的熵值,高頻頻譜具有較低的熵值。據(jù)此,可對(duì)視頻的低頻分量和高頻分量分別處理,獲得高頻的壓縮值。 應(yīng)用自從Ahmed和Rao于1974年給出了離散余弦變換(DCT)的定義以來(lái),離散余弦變換(DCT)與改進(jìn)型離散余弦變換(MDCT)就成為廣泛應(yīng)用于信號(hào)處理和圖像處理特別是用于圖像壓縮和語(yǔ)音壓縮編解碼的重要工具和技術(shù),一直是國(guó)際學(xué)術(shù)界和高科技產(chǎn)業(yè)界的研究熱點(diǎn)?,F(xiàn)在的很多圖像和視頻編碼標(biāo)準(zhǔn)(如MPEG

5、-1 , MEPG-2 ,MEPG-4中的第二部分)都要求實(shí)現(xiàn)整數(shù)的8×8 的DCT和IDCT,而MDCT 和IMDCT 則主要被應(yīng)用于音頻信號(hào)的編解碼中(如MPEG-1 ,MEPG-2 和AC-等標(biāo)準(zhǔn)的音頻編碼部分)。正是由于這類(lèi)變換被廣泛采用,對(duì)于這類(lèi)變換的快速算法的研究才顯得尤為重要。特別是針對(duì)特定的應(yīng)用條件下的快速算法的研究對(duì)于提高整個(gè)系統(tǒng)的性能表現(xiàn)有很大幫助。 功能由上面的引用可見(jiàn),碼率壓縮基于變換編碼和熵值編碼兩種算法。前者用于降低熵值,后者將數(shù)據(jù)變?yōu)榭山档捅忍財(cái)?shù)的有效編碼方式。在M

6、PEG標(biāo)準(zhǔn)中,變換編碼采用的是DCT,變換過(guò)程本身雖然并不產(chǎn)生碼率壓縮作用,但是變換后的頻率系數(shù)卻非常有利于碼率壓縮。 實(shí)際上壓縮數(shù)字視頻信號(hào)的整個(gè)過(guò)程分為塊取樣、DCT、量化、編碼4個(gè)主要過(guò)程進(jìn)行-首先在時(shí)間域?qū)⒃紙D像分成N(水平)×N(垂直)取樣塊,根據(jù)需要可選擇4×4、4×8、8×8、8×16、16×16等塊,這些取樣的像素塊代表了原圖像幀各像素的灰度值,其范圍在139-163之間,并依序送入DCT編碼器,以便將取樣塊由時(shí)間域轉(zhuǎn)換為頻率域的DCT系數(shù)塊。DCT系統(tǒng)的轉(zhuǎn)換分別在每個(gè)取樣塊中進(jìn)行,這些塊中每個(gè)取樣是數(shù)字化

7、后的值,表示一場(chǎng)中對(duì)應(yīng)像素的視頻信號(hào)幅度值MatLab源代碼RGB=imread('C:UserszhangkaiDesktop1.jpg'); %讀取圖像到RGBRGB=imresize(RGB,168,224); %改變圖像大小imwrite(RGB,'C:UserszhangkaiDesktopstart.jpg'); %將改變后的圖像存入start.jpg R=RGB(:,:,1);G=RGB(:,:,2);B=RGB(:,:,3);figure,imshow(RGB),title('原來(lái)的RGB圖像'); %RGB->YUV Y=

8、0.299*double(R)+0.587*double(G)+0.114*double(B); U=-0.169*double(R)-0.3316*double(G)+0.5*double(B); V=0.5*double(R)-0.4186*double(G)-0.0813*double(B); YUV=cat(3,Y,U,V);%YUV圖像 figure,imshow(uint8(YUV),title('通過(guò)計(jì)算得到的YUV圖像') T=dctmtx(8);%產(chǎn)生一個(gè)8×8的DCI變換矩陣 %進(jìn)行DCT變換 BY BU BV 是double類(lèi)型 BY=blkpr

9、oc(Y,8 8,'P1*x*P2',T,T'); BU=blkproc(U,8 8,'P1*x*P2',T,T'); BV=blkproc(V,8 8,'P1*x*P2',T,T'); a=16 11 10 16 24 40 51 61; 12 12 14 19 26 58 60 55; 14 13 16 24 40 57 69 55; 14 17 22 29 51 87 80 62; 18 22 37 56 68 109 103 77; 24 35 55 64 81 104 113 92; 49 64 78 87 10

10、3 121 120 101; 72 92 95 98 112 100 103 99; %量化值 b=17 18 24 47 99 99 99 99; 18 21 26 66 99 99 99 99; 24 26 56 99 99 99 99 99; 47 66 99 99 99 99 99 99; 99 99 99 99 99 99 99 99; 99 99 99 99 99 99 99 99; 99 99 99 99 99 99 99 99; 99 99 99 99 99 99 99 99; %BY2 BU2 BV2是double類(lèi)型BY2=blkproc(BY,8 8,'x./P1

11、',a); BU2=blkproc(BU,8 8,'x./P1',b); BV2=blkproc(BV,8 8,'x./P1',b); %這里進(jìn)行取整量化,BY3 BU3 BV3是uint8類(lèi)型 BY3=int8(BY2); BU3=int8(BU2); BV3=int8(BV2); %BY4 BU4 BV4是double類(lèi)型 BY4=blkproc(double(BY3),8 8,'x.*P1',a); BU4=blkproc(double(BU3),8 8,'x.*P1',b); BV4=blkproc(double(

12、BV3),8 8,'x.*P1',b); mask= 1 1 1 1 1 1 1 1; 1 1 1 1 1 1 1 1; 1 1 1 1 1 1 1 1; 1 1 1 1 1 1 1 1; 1 1 1 1 1 1 1 1; 1 1 1 1 1 1 1 1; 1 1 1 1 1 1 1 1; 1 1 1 1 1 1 1 1; %BY5 BU5 BV5是double類(lèi)型 BY5=blkproc(BY4,8 8,'P1.*x',mask); BU5=blkproc(BU4,8 8,'P1.*x',mask); BV5=blkproc(BV4,8 8,&

13、#39;P1.*x',mask); %YI UI VI是double類(lèi)型YI=blkproc(double(BY5),8 8,'P1*x*P2',T',T); UI=blkproc(double(BU5),8 8,'P1*x*P2',T',T); VI=blkproc(double(BV5),8 8,'P1*x*P2',T',T); %YUVI是double類(lèi)型YUVI=cat(3,uint8(YI),uint8(UI),uint8(VI);%經(jīng)過(guò)DCT變換和量化后的YUV圖像figure,imshow(YUVI),title('經(jīng)過(guò)DCT變換和量化后的YUV圖像'); RI=YI-0.001*UI+1.402*VI; GI=YI-0.344*UI-0.714*VI; BI=YI+1.772*UI+0.001*VI; RGBI=cat(3,RI,GI,BI);%經(jīng)過(guò)DCT變換和量化后的RGB圖像RGBI=uint8(RGBI); figure,imshow(RGBI),title('經(jīng)過(guò)DCT變換和量化后的RGB圖像'); imwrite(RGBI,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論