基于MATLAB的JPEG基本系統(tǒng)編碼_第1頁
基于MATLAB的JPEG基本系統(tǒng)編碼_第2頁
基于MATLAB的JPEG基本系統(tǒng)編碼_第3頁
基于MATLAB的JPEG基本系統(tǒng)編碼_第4頁
基于MATLAB的JPEG基本系統(tǒng)編碼_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、摘摘 要要本文介紹了基于 MATLAB 的 JPEG 基本系統(tǒng)編碼。在圖像傳送過程中,經(jīng)常采用 JPEG格式對靜止圖像進(jìn)行壓縮編碼。JPEG 基本系統(tǒng)編碼首先把灰度圖像分成 88 的像素塊,然后對各個像素塊進(jìn)行離散余弦變換得到變換系數(shù)后再進(jìn)行量化。其次,對量化后的變換系數(shù)采用 Z 形掃描,得到直流系數(shù)和交流系數(shù)。接著,對直流系數(shù)采用預(yù)測編碼,對交流系數(shù)采用可變長編碼。最后,根據(jù)標(biāo)準(zhǔn)的 Huffman 編碼進(jìn)行熵編碼,輸出壓縮圖像的比特序列,從而實現(xiàn)圖像壓縮。在接收端,經(jīng)過 Huffman 解碼、直流系數(shù)和交流系數(shù)可變長解碼以與反量化后,再進(jìn)行離散余弦逆變換后得到重建圖像。MATLAB 仿真結(jié)果

2、表明:重建圖像與原始圖像幾乎沒有任何差異,能夠滿足人們的視覺需求。另外,數(shù)據(jù)壓縮比在 10 倍左右且峰值信噪比均在 30dB 以上。因此,采用MATLAB 實現(xiàn) JPEG 基本系統(tǒng)編碼具有方法簡單、速度快、誤差小等優(yōu)點,能夠大大提高圖像壓縮的效率和精度。關(guān)鍵詞:關(guān)鍵詞:JPEG;離散余弦變換; MATLAB;圖形用戶界面A ABSTRACTBSTRACTThe JPEG basic system coding based on MATLAB is introduced in this paper. The JPEG format is usually used to compress stat

3、ic image during the process of image transmission.The JPEG basic system coding divides the gray image into several sub-images of size 88 firstly. Discrete cosine transform is used to get the transform coefficient of sub-image and then the transform coefficient is quantized. Secondly, Z type scan is

4、adopted to get direct current (DC) coefficient and alternate current (AC) coefficient of the quantized transform coefficient. Thirdly, predictive coding and variable-length coding is used for DC and AC coefficient respectively. Finally, bit sequences of the compressed image are outputted by using en

5、tropy coding according to standard Huffman coding. Then image compression is realized. The user gets the reconstructed image by Huffman decoding, variable-length decoding of DC and AC coefficient, dequantization and reverse discrete cosine transform sequentially.MATLAB results of simulation demonstr

6、ate that there is no difference between reconstructed image and original image and reconstructed image can satisfy human visual requirements. Additionally, compression ratio is about 10 and peak signal-to-noise ratio is all over than 30dB. Therefore, the realization of JPEG basic system coding using

7、 MATLAB is of such advantages as simple method, fast speed, small error and it can enhance the efficiency and accuracy of image compression greatly. KeyKey words:words: JPEG; discrete cosine transform; MATLAB; graphical user interfaceIII / 49i / 49目目 錄錄第 1 章 緒 論 11.1 圖像變換編碼概述與目前狀況 11.2 論文結(jié)構(gòu) 2第 2 章 M

8、ATLAB 簡介 32.1 MATLAB 的發(fā)展簡史 32.2 MATLAB 的特點 32.2.1 MATLAB 的功能 32.2.2 MATLAB 的技術(shù)特點 42.3 MATLAB 圖像類型 52.4 GUI5第 3 章 變換編碼 73.1 變換編碼的一般形式與意義 73.2 基本原理 73.2.1 正交變換的去相關(guān)性 83.2.2 變換編碼性能判斷 93.2.3 變換編碼的特點 113.3 最佳正交變換K-L 變換 11第 4 章 JPEG 圖像壓縮 134.1 JPEG 概述 134.2 JPEG 圖像編碼算法的實現(xiàn) 144.2.1 離散余弦編碼 144.2.2 量化 154.2.3

9、編碼 164.2.4 JPEG 圖像數(shù)據(jù)壓縮發(fā)展 19第 5 章 MATLAB 仿真 215.1 系統(tǒng)模塊圖 215.2 JPEG 壓縮編碼的設(shè)計流程 215.2.1 掃描順序變換 225.2.2 量化部分程序流程圖 225.2.3 霍夫曼編碼部分程序流程圖 225.3 圖形用戶界面設(shè)計 25第 6 章 結(jié)論與展望 296.1 結(jié)論 296.2 不足之處與未來展望 29參考文獻(xiàn) 31致 32附 錄 331 / 49第第1 1章章 緒緒 論論1.11.1 圖像變換編碼概述與目前狀況圖像變換編碼概述與目前狀況現(xiàn)實世界中的圖像多為模擬圖像,但是計算機只能處理數(shù)字信息,因此,必須將其數(shù)字化,轉(zhuǎn)換成適合

10、計算機存儲和表示的形式,才能由計算機進(jìn)行處理。為了便于信息交換和方便使用,數(shù)字圖像必須以一定的格式存儲,如常用的 BMP、JPEG、GIF 等圖像文件格式。從顏色來看,數(shù)字圖像又有線畫稿、灰度圖像、彩色圖像、真彩色圖像等種類。隨著信息技術(shù)的發(fā)展,對靜止圖像和視頻序列圖像的壓縮編碼技術(shù)的應(yīng)用越來越廣泛,從家庭娛樂到專業(yè)的通信設(shè)備、從廉價的消費電子產(chǎn)品到昂貴的專業(yè)級專用設(shè)備,應(yīng)用的例子舉不勝舉,如 VCD、DVD、可視、視頻會議、IP 上的視頻服務(wù)、數(shù)字圖書館、數(shù)字電視、高清晰電視、數(shù)碼照相機、數(shù)字圖像監(jiān)控等因此工業(yè)界對圖像壓縮專業(yè)人員的需求在不斷地增長。長期以來,人們在自然界感受到的最主要的信息

11、是視覺信息,但與此不同,在早期計算機和通信領(lǐng)域,能夠處理和傳輸?shù)闹饕俏淖趾吐曇?。因此,早期的計算機和通信設(shè)備的處理能力跟人類的需求有相當(dāng)大的差距。隨著通信信道與計算機容量和速度的提高,圖像信息已經(jīng)成為通信和計算機系統(tǒng)的一種重要的處理對象。與文字信息不同,圖像信息需要大的存儲容量和寬的傳輸信道,尤其是在需要實現(xiàn)大規(guī)模圖像數(shù)據(jù)庫或傳輸高分辨率實時圖像序列的場合,即使以現(xiàn)在的技術(shù),仍然難以滿足原始數(shù)字圖像存儲和傳輸?shù)男枰?表 1.1 是幾種常見視頻圖像源未經(jīng)壓縮的原始數(shù)據(jù)率)。正由于這種需求,使得圖像壓縮(編碼)算法和技術(shù)成為近 30 年來非?;钴S的一個研究領(lǐng)域。圖像壓縮的基本理論起源于 20 世

12、紀(jì) 40 年代末香農(nóng)(Shannon)的信息理論。香農(nóng)的編碼定理告訴我們,在不產(chǎn)生任何失真的前提下,通過合理的編碼,對每一個信源符合分配不等長的碼字,平均碼長可以任意接近于信源的熵。在這個理論框架下,出現(xiàn)了幾種不同的無失真信源編碼方法,如 Huffman 編碼、算術(shù)編碼、字典編碼等,這些方法可以應(yīng)用于一幅數(shù)字圖像,能獲得一定的碼率壓縮。但無失真編碼的壓縮率是很有限的,對較復(fù)雜的自然圖像,壓縮率一般不超過 2。由于無失真信源編碼壓縮率的限制,使其難以滿足大多數(shù)圖像存儲和傳輸?shù)男枰?。根?jù)應(yīng)用的需求,人們對有失真壓縮進(jìn)行了廣泛的研究。有失真壓縮的目的是去除圖像數(shù)據(jù)中的冗余信息和對視覺不重要的細(xì)節(jié)分量

13、,以盡可能少的碼字來表示所處理的圖像。給定一幅數(shù)字圖像,它的原始表示一般是空間像素陣列,這是它的空間域表示。在空間域表示中,相鄰的像素之間存在很強的相關(guān)性,冗余信息分布在較大圍的空間像素集中,直接處理比較困難。最常用的處理方法是通過一種變換,將圖像從空間域映射到變換域中,在變換域可以進(jìn)行簡捷和有效的處理。對于變換的第一種要:將強相關(guān)的空間像素陣映射成完全不相關(guān)的、能量分布緊湊的變換系數(shù)陣,占少數(shù)的大的變換系數(shù)代表了圖像中最主要的能量成分,占多數(shù)的小的變換系數(shù)表示了一些不重要的細(xì)節(jié)分量,通過量化去除小系數(shù)所代表的細(xì)節(jié)分量,用很少的碼字來描述大系數(shù)所代表的主要能量成分,從而達(dá)到高的壓縮比。這是用變

14、換技術(shù)進(jìn)行有失真編碼能夠達(dá)到高壓縮比的主要原因。對于變換的第二種要:變換系數(shù)陣的物理含義要明確,使其容易與人們關(guān)于 HVS(人類視覺系統(tǒng))的知識相結(jié)合,以便有效地去除視覺冗余,盡可能地保留重要的視覺信息。具備最理想的去相關(guān)和最強的能量緊致特性的變換是 KL(Karhunen Loeve)變換,KL變換使得變換系數(shù)之間是統(tǒng)計不相關(guān)的。但 KL 變換的基是不固定的,由像素的相關(guān)系數(shù)矩陣的特征向量構(gòu)成,特征分析的復(fù)雜性和需要額外存儲變換基,使得 KL 變換的應(yīng)用不現(xiàn)實。幸運的是,人們找到了 KL 變換的一個很好的逼近。對于強相關(guān)空間像素陣,人們發(fā)現(xiàn) DCT(discrete cosine trans

15、form,離散余弦變換)是 KL 變換的很好的逼近。DCT 有固定的基和明確的物理含義,使得 DCT 廣泛應(yīng)用于圖像壓縮,成了變換編碼的主要工具。20 世紀(jì) 80 年代中期開始制定的靜止圖像壓縮編碼的國際標(biāo)準(zhǔn) JPEG 采用了 DCT 變換編碼為其核心算法,并被廣泛地接受和應(yīng)用。但是 DCT 變換編碼也有難以克服的缺點。在實際應(yīng)用中,為了便于實現(xiàn)和后處理,圖像被劃分成 88 或 1616 的小塊,對每一個塊進(jìn)行單獨的變換和后處理。這種塊之間的單獨處理帶來了壓縮效率上的限制和塊效應(yīng)問題,尤其是當(dāng)壓縮倍數(shù)較高時,塊效應(yīng)成為限制 DCT 變換編碼質(zhì)量的主要因素。20 世紀(jì) 80 年代后期,小波變換的

16、發(fā)展提供了一種新的有效的多分辨信號處理工具,也為各種可分級圖像編碼算法的實現(xiàn)奠定了基礎(chǔ)。小波變換應(yīng)用在很多領(lǐng)域,最成功的應(yīng)用領(lǐng)域之一就是圖像壓縮。小波變換的理論和算法明確地提出了一些有啟發(fā)意義的思想,一個關(guān)鍵的思想是多分辨率分解,這個思想很好地利用在小波圖像編碼的研究中。小波圖像壓縮的研究表明,現(xiàn)代應(yīng)用所需求的許多特征如多分辨、多層質(zhì)量控制、嵌入式碼流等與小波圖像編碼結(jié)構(gòu)非常自然地融合在一起,在較大壓縮比下,小波圖像壓縮的重構(gòu)質(zhì)量也明顯好于 DCT 變換方法1。1.21.2 論文結(jié)構(gòu)論文結(jié)構(gòu)第1章主要介紹了圖像變換編碼與其目前狀況;第2章簡單闡述了MATLAB的相關(guān)容,其中包括它的發(fā)展史、特點

17、、功能、圖像類型、圖像用戶界面等方面;第3章則討論了靜止圖像的變換編碼,這是傳統(tǒng)變換方法的主要容,也是構(gòu)成目前多數(shù)圖像編碼標(biāo)準(zhǔn)的基礎(chǔ)算法;第4章主要給出了一些JPEG圖像壓縮的標(biāo)準(zhǔn),以與具體的JPEG圖像編碼算法的實現(xiàn)過程;第5章則用MATLAB對圖像編碼進(jìn)行仿真,并用圖形用戶界面的形式呈現(xiàn)處理結(jié)果;第6章對基于MATLAB的JPEG基本系統(tǒng)編碼進(jìn)行總結(jié),并對其應(yīng)用進(jìn)行展望。實驗仿真結(jié)果表明,用MATLAB 來實現(xiàn)離散余弦變換的圖像壓縮,具有方法簡單、速度快、誤差小的優(yōu)3 / 49點,免去了大量矩陣計算,大大提高了圖像壓縮的效率和精度。第第2 2章章 MATLABMATLAB簡介簡介 MATL

18、AB 語言是由美國 Math Works 公司推出的計算機軟件,經(jīng)過多年的逐步發(fā)展與不斷完善,現(xiàn)已成為國際公認(rèn)的最優(yōu)秀的科學(xué)計算與數(shù)學(xué)應(yīng)用軟件之一。其容涉與矩陣代數(shù)、微積分、應(yīng)用數(shù)學(xué)、有限元法、科學(xué)技術(shù)、信號與系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、小波分析與其應(yīng)用、數(shù)字圖像處理、計算機圖形學(xué)、電子線路、電機學(xué)、自動控制與通信技術(shù)、物理、力學(xué)和機械振動等方面。MATLAB 的特點是語法結(jié)構(gòu)簡單,數(shù)值計算高效,圖形功能完備,特別受以完成數(shù)據(jù)處理與圖像生成為目的的科研人員的青睞。在高等院校,MATLAB 已經(jīng)成為學(xué)生必須掌握的基本技能。在設(shè)計研究單位和工業(yè)部門,MATLAB 已經(jīng)走出實驗室,并被廣泛應(yīng)用于研究和解決各種具

19、體的工程問題2。2.12.1 MATLABMATLAB的發(fā)展簡史的發(fā)展簡史 MATLAB 是 Matrix Laboratory(矩陣實驗室的縮寫),最初由美國 Cleve Moler 博士在 70 年代末講授矩陣?yán)碚摵蛿?shù)據(jù)分析等課程時編寫的軟件包 Linpack 與 Eispack 組成,旨在使應(yīng)用人員免去大量經(jīng)常重復(fù)的矩陣運算和基本數(shù)學(xué)運算等繁瑣的編程工作。1984年成立的 Math Works 公司正式把 MATLAB 推向市場,并從事 MATLAB 的研究和開發(fā)。1990年,該公司推出了以框圖為基礎(chǔ)的控制系統(tǒng)仿真工具 Simulink,它方便了系統(tǒng)的研究與開發(fā),使控制工程師可以直接構(gòu)造

20、系統(tǒng)框圖進(jìn)行仿真,并提供了控制系統(tǒng)中常用的各種環(huán)節(jié)的模塊庫。1993 年,Math Works 公司推出的 MATLAB4.0 版在原來的基礎(chǔ)上又作了較大改進(jìn),并推出了 Windows 版,使命令執(zhí)行和圖形繪制可以在不同窗口進(jìn)行。1994 年推出了 MATLAB4.2 版本,并得到廣泛的重視和應(yīng)用。1999 年,推出了 MATLAB5.3 版本,真正實現(xiàn)了 32 位運算,其速度更快、功能更完善、界面更友好,并提供了 Internet 搜索引擎,可以協(xié)助用戶尋求在線幫助。版本 6.0、6.1 又作了更精細(xì)的改進(jìn),增加了許多新的功能。版本 7.0、7.1 包括擁有數(shù)百個部函數(shù)的主包和三十幾種工具包

21、。工具包又可以分為功能性工具包和學(xué)科工具包。功能工具包用來擴充 MATLAB 的符號計算,可視化建模仿真,文字處理與實時控制等功能。學(xué)科工具包是專業(yè)性比較強的工具包,控制工具包,信號處理工具包,通信工具包等都屬于此類。2.22.2 MATLABMATLAB的特點的特點2.2.12.2.1 MATLABMATLAB 的功能的功能 MATLAB 之所以成為世界流行的科學(xué)計算與數(shù)學(xué)應(yīng)用軟件,是因為它有著強大的功能。(1) 高質(zhì)量、強大的數(shù)值計算功能。為滿足復(fù)雜科學(xué)計算任務(wù)的需要,MATLAB 匯集了大量常用的科學(xué)和工程計算算法,如矩陣求逆、矩陣特征值以與快速傅立葉變換等。5 / 49(2) 數(shù)據(jù)分析

22、和科學(xué)計算可視化功能。MATLAB 不但科學(xué)計算功能強大,而且在數(shù)值計算結(jié)果的分析和數(shù)據(jù)可視化方面也遠(yuǎn)遠(yuǎn)優(yōu)于其他同類軟件。在科學(xué)計算和工程應(yīng)用中,經(jīng)常需要分析大量的原始數(shù)據(jù)和數(shù)值計算結(jié)果,MATLAB 能將這些數(shù)據(jù)以圖形的方式顯示出來,使數(shù)據(jù)間的關(guān)系清晰明了。(3) 強大的符號計算功能。在 MATLAB 的發(fā)展過程中,Math Works 公司以 Maple 的核心部分作為其符號計算功能的引擎,依靠 Maple 已有的庫函數(shù),實現(xiàn)了 MATLAB 環(huán)境下符號的計算功能。(4) 強大的非線性動態(tài)系統(tǒng)建模和仿真功能。MATLAB 提供了一個模擬動態(tài)系統(tǒng)的交互式程序 Simulink,允許用戶通過繪

23、制框圖來模擬一個系統(tǒng),并動態(tài)地控制該系統(tǒng)。(5) 靈活的程序接口功能。應(yīng)用程序接口(API)是一個允許用戶編寫的與 MATLAB 互相配合的 C.或 Fortran 程序的文件庫。用戶可以在 MATLAB 環(huán)境下直接調(diào)用已經(jīng)編譯過的C 和 Fortran 子程序,同樣,在 C 和 Fortran 程序中也可以調(diào)用 MATLAB 的函數(shù)或命令,使得這些語言可以充分利用 MATLAB 的矩陣運算功能和方便的繪圖功能。(6) 文字處理功能。MATLAB 記事本成功地將 MATLAB 與文字處理系統(tǒng) Microsoft Word 集成為一個整體,為用戶進(jìn)行文字處理、科學(xué)計算、工程設(shè)計創(chuàng)造了一個統(tǒng)一的工

24、作環(huán)境。2.2.22.2.2 MATLABMATLAB 的技術(shù)特點的技術(shù)特點 MATLAB 還具有支持科學(xué)計算標(biāo)準(zhǔn)的開放式可擴充結(jié)構(gòu)和跨平臺兼容的特點,能夠很好地解決科學(xué)和工程領(lǐng)域的復(fù)雜問題。(1) 界面友好,編程效率高。MATLAB 不僅免去了大量的經(jīng)常重復(fù)的基本數(shù)學(xué)運算,而且其編譯和執(zhí)行速度都遠(yuǎn)遠(yuǎn)超過了采用 C 和 Fortran 語言設(shè)計的程序。(2) 功能強大,可擴展性強。MATLAB 語言不但提供了科學(xué)計算、數(shù)據(jù)分析與可視化、系統(tǒng)仿真等強大的功能,而且還具有可擴展性特征。MATLAB 支持用戶對其函數(shù)進(jìn)行二次開發(fā),用戶的應(yīng)用程序可以作為新的函數(shù)添加到相應(yīng)的工具箱中。(3) 圖形功能靈

25、活方便。MATLAB 具有靈活的二維與三維繪圖功能,在程序的運行過程中,可方便迅速地用圖形、圖像、聲音、動畫等多媒體技術(shù)直接表述數(shù)值計算結(jié)果,可以選擇不同的坐標(biāo)系,可以設(shè)置顏色、線型等,還可以將圖形嵌入到用戶的 Word 文件中。 (4) 在線幫助,有利于自學(xué)。用戶可借助 MATLAB 環(huán)境下的“在線幫助”學(xué)習(xí)各種函數(shù)的用法。 總之,MATLAB 語言已經(jīng)成為科學(xué)計算、系統(tǒng)仿真、信號與圖像處理的主流軟件。2.32.3 MATLABMATLAB圖像類型圖像類型圖像類型是指數(shù)組數(shù)值與像素顏色之間定義的關(guān)系。MATLAB 圖像處理工具箱支持五種類型的圖像:(1) 二進(jìn)制圖像。在一幅二進(jìn)制圖像中,每一

26、個像素將取兩個離散數(shù)值(0 或 1)中的一個,從本質(zhì)上說,這兩個數(shù)值分別代表狀態(tài)“開”(on)或“關(guān)”(off)。(2) 索引圖像。索引圖像是一種把像素值直接作為 RGB 調(diào)色板下標(biāo)的圖像。(3) 灰度圖像。灰度圖像是包含灰度級(亮度)的圖像。在 MATLAB 中,灰度圖像由一個 uint8、uint16 或一個雙精度類型的數(shù)組來描述。(4) 多幀圖像。多幀圖像也稱為多頁圖像,是一種包含多幅圖像或幀的圖像文件。在 MATLAB 存中,多幀圖像是一個四維數(shù)組,第四維用來指定幀的序號。多幀圖像主要用于需要對時間或場景上相關(guān)圖像集合進(jìn)行操作的場合,例如,磁諧振圖像切片或電影幀等。(5) RGB 圖像

27、。RGB 圖像也稱為真彩圖像,其每一個像素由三個數(shù)值來指定紅、綠和藍(lán)色分量。2.42.4 GUIGUI 傳統(tǒng)的用戶界面是指用戶與計算機之間進(jìn)行交互通信聯(lián)系的平臺。但在近幾年,這種概念發(fā)生了巨大的變化,出現(xiàn)了多種形式的人機交互方式,從命令的交互方式轉(zhuǎn)變到以圖形界面為主的交互形式?,F(xiàn)在,圖形界面已在人機交互方式中占主導(dǎo)地位。圖形用戶界面(GUI)是包含圖形對象(如窗口、圖標(biāo)、菜單和文本)的用戶界面。以某種方式選擇或激活這些對象,通常會引起動作或發(fā)生變化,最常見的激活方法是用鼠標(biāo)或其他動作。MATLAB 也提供了在 MATLAB 應(yīng)用程序中加入 GUI 的功能。GUI 的目前現(xiàn)狀為:(1) 就用戶界

28、面的具體形式而言,過去經(jīng)歷了批處理、聯(lián)機終端(命令接口)、(文本)菜單等多通道多媒體用戶界面和虛擬現(xiàn)實系統(tǒng)。(2) 就用戶界面息載體類型而言,經(jīng)歷了以文本為主的字符用戶界面(GUI)、以二維圖形為主的用戶界面(GUI)和多媒體用戶界面,計算機與用戶之間的通信帶寬不斷提高。(3) 就計算機輸出信息的形式而言,經(jīng)歷了以符號為主的字符命令語言、以視覺感知為主的圖形用戶界面、兼顧聽覺感知的多媒體用戶界面和綜合運用多種感觀(包括觸覺等)的虛擬現(xiàn)實系統(tǒng)。(4) 就人機界面中的信息維度而言,經(jīng)歷了一維信息(主要指文本流,如早期電傳式終端)、二維信息(主要是二維圖形技術(shù),利用了色彩、形狀、紋理等維度信息)、三

29、維信息(主要是三維圖形技術(shù),但顯示技術(shù)仍利用二維平面為主)和多維信息(多通道的多維信息)空間。7 / 49不論從何種角度看,人機交互發(fā)展的趨勢體現(xiàn)了對人的因素的不斷重現(xiàn),使人機交互更接近于大自然的形式,使用戶能利用日常的自然技能,不需經(jīng)過特別的努力和學(xué)習(xí),認(rèn)知負(fù)荷降低,工作效率提高。MATLAB 的用戶,在指令窗中打開圖形界面后,只要用鼠標(biāo)進(jìn)行選擇和點擊,就可瀏覽那豐富多彩的容。由此可見, 使用 GUI 給大家?guī)砹嗽S多方便。第第3 3章章 變換編碼變換編碼變換編碼是目前應(yīng)用最廣泛的圖像壓縮編碼方法,幾乎所有的圖像(除 2 值圖像外)和視頻壓縮標(biāo)準(zhǔn)均以變換編碼為工具。近年所發(fā)展的一些技術(shù),如區(qū)

30、域或物體編碼方法也以變換編碼為基礎(chǔ)。變換編碼在壓縮比、重構(gòu)圖像質(zhì)量、適應(yīng)圍和算法復(fù)雜性等方面能獲得好的折衷,在實際中得到了廣泛應(yīng)用3。3.13.1 變換編碼的一般形式與意義變換編碼的一般形式與意義信源編碼實質(zhì)是一種變換,變換就是將像素信息重組為更緊湊的形式,并產(chǎn)生一系列表示像素值的數(shù)字信號,并能在信道中更有效地傳送。在變換編碼中,用一組代表空間頻率分布的變換系數(shù)表示一組空間幾何位置像素值,通過這種映射能夠巧妙地解除或減弱圖像信號的相關(guān)性(原始圖像的幀與幀、場與場、行與行之間存在很強的相關(guān)性)。顯然,如果變換系數(shù)選擇得恰當(dāng),所得變換系數(shù)之間的相關(guān)性要明顯小于原始像素之間的相關(guān)性,從而達(dá)到降低冗余

31、度的目的。再根據(jù)人眼對圖像高頻成分不如對低頻成分敏感的特點,對各個變換系數(shù)進(jìn)行符合主觀視覺特性的加權(quán)處理,而后量化,就可以獲得大幅度的數(shù)據(jù)壓縮。事實上變換編碼都能實現(xiàn)信源編碼的解相關(guān)性即壓縮,換言之,變換并非一定要正交變換。正交變換在硬件技術(shù)中較為容易實現(xiàn),這是由(矩陣)電路對稱性決定的。變換編碼不是直接對空間圖像信號編碼,而是首先將空間域圖像信號映射變換到另一個正交矢量空間即變換域,將圖像像素轉(zhuǎn)變成一組非相關(guān)系數(shù),然后對這些系數(shù)進(jìn)行量化和編碼??梢宰C明,基于塊的變換編碼對靜止圖像和視頻幀是一種非常有效的壓縮編碼方法。為了充分利用像素之間的空間相關(guān)性,理想的變換塊尺寸應(yīng)該是整幅圖像或視頻幀大小

32、,但其計算量卻是十分驚人的。為減少計算復(fù)雜度,在實際應(yīng)用上一般都采用基于一定尺寸塊的變換編碼,即把整幅圖像分成許多不重疊的塊,對每個塊進(jìn)行變換編碼。在靜止圖像和視頻編碼的許多國際標(biāo)準(zhǔn)采樣基于 1616、88、44 的 DCT 變換編碼方法。變換編碼技術(shù)上比較成熟,理論也比較完整,廣泛應(yīng)用到各種靜止圖像數(shù)據(jù)壓縮,以與運動圖像的幀壓縮,幀間預(yù)測誤差信號的壓縮編碼。正交變換的種類很多,如傅里葉變換(Fourier Transform)、離散余弦變換(DCT)、沃爾什變換(Walsh Transform)、哈爾變換(Haar Transform)、斜變換(Slant Transform)、離散正弦變換

33、(DST)、K-L 變換(Karhunen Transform)、小波變換(Wavelet Transform)等。3.23.2 基本原理基本原理變換編碼的通用模型如圖 3.1 所示。其中映射變換是把原始信號中的各個樣值從一9 / 49個域變換到另一個域,然后針對變換后的數(shù)據(jù)再進(jìn)行量化(二次量化)與編碼操作。接收端首先對接收到的進(jìn)行解碼和反量化(Dequantization),然后再進(jìn)行反變換以恢復(fù)原來信號(在一定的保真度下)。映射變換的關(guān)鍵在于能產(chǎn)生一系列更有效的系數(shù),對這些系數(shù)進(jìn)行編碼所需的總比特數(shù),要比對原始數(shù)據(jù)進(jìn)行編碼所需的總比特數(shù)少得多,使數(shù)據(jù)率得以降低。映射變換量化編碼反量化反映射

34、變換解碼信道原始數(shù)據(jù)恢復(fù)數(shù)據(jù)圖 3.1 變換編碼的通用模型3.2.13.2.1 正交變換的去相關(guān)性正交變換的去相關(guān)性映射變換的方法很多,一般是指函數(shù)變換法,而常用的又是正交變換法。比如,我們所熟知的傅里葉變換就是利用復(fù)數(shù)域正交變換,將一個函數(shù)從時域描寫變?yōu)轭l域的頻譜展開。這樣有可能使函數(shù)的某些特性變得明顯,使問題的處理得到簡化?,F(xiàn)在用最簡單的連續(xù)信號為例來說明圖像經(jīng)過正交變換如何能夠去)2sin()(ftAty除空間相關(guān)性達(dá)到壓縮圖像數(shù)據(jù)量。當(dāng)變量 t 從-到變換是,f(t)的取值有無窮多個,即使按照奈奎斯特采樣定理進(jìn)行采樣,要描述該信號也需要限制采樣間距保證有足夠的采樣點。如果將其變換到頻域

35、表示,只需要用一個幅值參數(shù) A 和一個頻率參數(shù) f 值就能完全描述信號了,可見在時域上采樣值之間存在非常強的相關(guān)性,數(shù)據(jù)冗余度大。而變換域上的兩個參數(shù),相互獨立,沒有相關(guān)性,描述信號的數(shù)據(jù)量大大減少。對于圖像信號也是如此,圖像信號轉(zhuǎn)換到變換域后,其相關(guān)性下降,數(shù)據(jù)冗余度減小,壓縮數(shù)據(jù)有顯著效果。從一個簡單的圖像實例來說明正交變換的去相關(guān)性。假設(shè)把一個 nn 像素的圖像子塊看成為維坐標(biāo)空間上的一個坐標(biāo)點,也就是說,在這個坐標(biāo)空間上的不同坐標(biāo)點對2n應(yīng)于不同灰度分布的維圖像子塊(不同圖像子塊其區(qū)別在于不同的灰度分布,一樣之處2n是其尺寸都是 nn)。而這個坐標(biāo)空間的每一個坐標(biāo)軸上坐標(biāo)值對應(yīng)的是圖像

36、子塊像素所有可能的灰度級。以 12 像素構(gòu)成的子圖像(即相鄰兩個像素組成的子圖像)為例,設(shè)每個像素取 8 個灰度級(3bit 量化)。則圖 3.2(a)中二維坐標(biāo)的軸表示第一個像素可能取1x的 8 個灰度級,軸表示第二個像素可能取的 8 個灰度級。由、組成的二維坐標(biāo)空2x1x2x間中不同坐標(biāo)點對應(yīng)于不同的 12 子圖像,該點數(shù)值由兩個像素的灰度所組成。所有兩個像素點(,)圖像子塊的灰度分布為,共1x2x)77()71 () 11 ()01 ()70() 10()00(,有 64 種不同灰度分布的圖像子塊,用圖 3.2(a)中的 64 個坐標(biāo)點表示。對于一般圖像而言,因相鄰像素之間存在很強的相關(guān)

37、性,絕大多數(shù)的子圖像中相鄰兩像素其灰度級相等或很接近,也就是說在直線=附近出現(xiàn)的概率大。或者說,絕大1x2x多數(shù)圖像子塊落在圖 3.2(a)中的弧度?,F(xiàn)在將坐標(biāo)系逆時針轉(zhuǎn),如圖 3.2(b)所示。在新的坐標(biāo)系、中,即絕大多451y2y數(shù)圖像子塊落在軸附近,在這些區(qū)域上的圖像子塊,其與相差較大。由此表明變1y1y2y量、之間的聯(lián)系比變量、之間的聯(lián)系,在統(tǒng)計上更加獨立,而且方差也重新分1y2y1x2x布。在原來坐標(biāo)系中,圖像子塊的兩個像素具有較大的相關(guān)性,能量的分布比較分散,兩者具有大致一樣的方差;而在變換后的坐標(biāo)系中,圖像子塊的兩個像素之間2221xx的相關(guān)性大大減弱,能量的分布向軸集中,其的方

38、差也遠(yuǎn)大于,即。從1y1y2y2221xx這個簡單的例子可以看出,這種變換后坐標(biāo)軸上方差不均勻分布正是正交變換編碼能夠?qū)崿F(xiàn)圖像數(shù)據(jù)壓縮的理論根據(jù)。若按照人的視覺特性,只保留方差較大的那些變換系數(shù)分量,就可以獲得更大的數(shù)據(jù)壓縮比,這就是所謂視覺心理編碼的方法之一。將上述簡單的實例推廣到一般的維圖像的變換,圖像在維變換域中,相關(guān)性nn2n大大下降。因此用變換后的系數(shù)進(jìn)行編碼,將比直接使用原圖像數(shù)據(jù)編碼獲得更大的數(shù)據(jù)壓縮4。0 1 23 4 5 6 72134567(a) 變換前1x2x0 1 23 4 5 6 72134567(b) 變換后1x2x1y2y圖 3.2 正交變換的物理概念綜上所述,圖

39、像正交變換實現(xiàn)數(shù)據(jù)壓縮的物理本質(zhì)在于:把在原來坐標(biāo)軸上彼此密切相關(guān)的像素所構(gòu)成的矩陣經(jīng)過多維坐標(biāo)軸適當(dāng)?shù)淖鴺?biāo)軸旋轉(zhuǎn)和變換,變成統(tǒng)計上彼此較為相互獨立、甚至達(dá)到完全獨立的變換系數(shù)所構(gòu)成的矩陣。或者說把接近均勻散布在各個坐標(biāo)軸上的原始圖像數(shù)據(jù),變換在新的坐標(biāo)系中,圖像數(shù)據(jù)只集中在少數(shù)坐標(biāo)上,實現(xiàn)高效率的壓縮編碼。3.2.23.2.2 變換編碼性能判斷變換編碼性能判斷從上面的例子看成,圖像正交變換可以看成是選用新坐標(biāo)系的過程。如將新坐標(biāo)系用一組基矢量或變換基函數(shù)來表示,那么正交變換過程便可描述為圖像如何用一組所選定的基矢量進(jìn)行線性組合的過程。每個基矢量對圖像的貢獻(xiàn)就是相應(yīng)基矢量的變換系數(shù)。求出圖像塊

40、在給定一組基矢量的變換系數(shù)的過程稱為正變換,從變換系數(shù)恢復(fù)重建圖像塊的過程稱為反變換。設(shè)一維離散信號有 N 個采樣點組成,在變換前用矢量來表示,TNxxxX)(21,11 / 49其變換后的系數(shù)采用矢量來表示,用表示正交變換核矩陣,由變TNyyyY)(21,V換基矢量構(gòu)成,即,則離散信號的正交變換式可以寫成Nvvv,21)(21NvvvV, (3.1)VXY 當(dāng)圖像變換核矩陣是酉矩陣,或者說上式的正交變換基矢量滿足正交歸一化時,變換核矩陣存在逆矩陣,而且,是變換核矩陣的轉(zhuǎn)置矩陣,此時根據(jù)變換1VTVV1TV后系數(shù)利用反變換重建原來圖像: (3.2)YVYVXT1變換核矩陣滿足: (3.3)IV

41、VVVTT表示 NN 的單位矩陣。I對于變換編碼,除了對輸入信號如何變換以與如何從變換系數(shù)反變換恢復(fù)圖像之外,我們還關(guān)心變換前原始信號和變換后系數(shù)的統(tǒng)計特性,以便進(jìn)一步明確變換編碼性能。變換編碼的性能依賴于所選定的基矢量,采用不同的就矢量,變換編碼的去相關(guān)性能、計算復(fù)雜度、變換系數(shù)值以與變換系數(shù)分布也不一樣。因此,一個正交變換應(yīng)該關(guān)心以下幾個主要容:(1) 去相關(guān)性。去相關(guān)性越強,變換之后的系數(shù)越獨立,冗余數(shù)據(jù)越少。(2) 變換后數(shù)據(jù)的分布性。一個好的變換編碼應(yīng)該使圖像能量盡可能地集中在少數(shù)幾個位置上,也就是用幅值較大的很少幾個系數(shù)便可以描述原來圖像塊。(3) 計算復(fù)雜度。所選用的基矢量簡單,

42、能夠很方便地求出變換后系數(shù),同時也能很容易、無失真地從變換系數(shù)反變換得到原來圖像值。信息論的研究表明,圖像正交變換不改變信源的熵值,變換前后圖像的信息量并無損失,完全可以通過反變換得到原來的圖像值。但是在實際上,不是直接對變換的系數(shù)進(jìn)行發(fā)送,而是對變換系數(shù)進(jìn)行標(biāo)量量化,對量化后的數(shù)據(jù)進(jìn)行熵編碼,生成二進(jìn)制碼流發(fā)送。接收端對二進(jìn)制碼流解碼后進(jìn)行反量化,然后再進(jìn)行反變換來恢復(fù)圖像,因此,實際應(yīng)用的變換編碼因為量化/反量化過程引入的變換系數(shù)前后不一致而存在變換圖像編碼失真。為了進(jìn)一步描述正交變換編碼的性能,用均方差 MSE 來描述正交變換編碼器的失真,討論變換前原始數(shù)據(jù)和變換后系數(shù)的一些統(tǒng)計特性和相

43、互關(guān)系。(1)均值矢量和協(xié)方差矩陣設(shè)變換前平均值向量為,協(xié)方差矩陣為,變換后系數(shù)的平均值向量為,協(xié)方xxCy差矩陣為,則有:yC 或者 (3.4)yTTTxVYEVYVEXExyVVCVVYVVYVEXXECyTTyTTyTTTxxx)()(或者 (3.5)TxyVVCC (2)總方差和總能量設(shè)變換前任一樣值的方差,變換后系數(shù)的方差為ix)(22iixixxEiy,于是總方差和總能量存在關(guān)系式:)(22iiyiyyE (3.6)NiyNixii1212 (3.7)NiiNiiyx1212 (3)均方誤差如果只采用變換系數(shù)的前面 m 個值來恢復(fù)原來圖像,其重建值為,mTmmYVX則重建圖像與原來

44、圖像近似誤差為,其均方誤差為mkXXe (3.8)NmiyNmixiiXXE12122由于變換前后總能量保持不變,按照能量從大到小選擇較大的 m 個系數(shù)重建時,其重建圖像接近原來圖像?;蛘哒f,通過選擇 m 個具有較大方差的系數(shù)重建圖像使得近似誤差最小。3.2.33.2.3 變換編碼的特點變換編碼的特點在視頻壓縮中,最常用的變換方法是 DCT,DCT 被認(rèn)為是性能接近 K-L 變換的準(zhǔn)最佳變換,變換編碼的主要特點有:(1) 在變換域里視頻圖像要比空間域里簡單。(2) 視頻圖像的相關(guān)性明顯下降,信號的能量主要集中在少數(shù)幾個變換系數(shù)上,采用量化和熵編碼可有效地壓縮其數(shù)據(jù)。(3) 具有較強的抗干擾能力

45、,傳輸過程中的誤碼對圖像質(zhì)量的影響遠(yuǎn)小于預(yù)測編碼5。3.33.3 最佳正交變換最佳正交變換K-LK-L變換變換 K-L 變換是遙感圖像增強和信息提取中用得最多的線性變換,是對原波段圖像進(jìn)行波譜信息的線性投影變換,在盡可能不減少信息量的前提下,將原圖像的高維多光譜空間的像素亮度投影到新的低維空間,減少特征空間維數(shù),達(dá)到數(shù)據(jù)壓縮、提高信噪比、提取相關(guān)信息、降維處理和提取原圖像特征信息的目的,并能有效地提取影像信息。它可以使原來多波段圖像經(jīng)變換后提供出一組不相關(guān)的圖像變量,最前面的主分量具有較大的方差,包含了原始影像的主要信息,所以要集中表達(dá)信息,突出圖像的某些細(xì)部特征,可采用主分量變換來完成。離散

46、 K-L 變換是以圖像的統(tǒng)計特征為基礎(chǔ)的一種正交變換,也稱為特征向量變換。由于其變換基矢量或者說變換矩陣是根據(jù)輸入圖像的統(tǒng)計性質(zhì)得出的,也就是說其變換13 / 49矩陣是針對輸入圖像“量身定做”的,因此具有最佳的去相關(guān)性。K-L 變換的基本原理如下所述:任意時刻一個 NN 抽樣圖像,可用維矢量來表示),(yxfi2NiXNixxxxXTiNijiii, 2 , 1,221式中為第 次實現(xiàn)的矢量的第個分量。鑒于圖像信號是隨機變量,度量隨機變量之ijxiiXj間的相關(guān)程度可用協(xié)方差(任意兩個時刻上獲得的隨機變量的統(tǒng)計相關(guān)特性)矩陣表示,協(xié)方差矩陣是圖像統(tǒng)計特性的重要反映。矢量 X 的協(xié)方差矩陣為:

47、xC (3.9)(TxxxMXMXEC式中,代表數(shù)學(xué)期望,此時根據(jù)的特征值所求的特征所求的特征矢量構(gòu))(XEMxExC成的矩陣,用對實施以下變換,由矩陣?yán)碚撝?,上式變換的結(jié)果是典AAxCTxYAACC型的對角矩陣,對角矩陣的非零數(shù)可以按遞減大小排列,顯然是正交矩陣,有,ATAA1因此實施下列變換必是正交矩陣,即,滿足此條件的變換即為 K-L 變換。)(xMXAY容易從 K-L 變換的過程和結(jié)果得到 KL 變換具有以下性質(zhì):(1) KL 變換使矢量信號的各個分量互不相關(guān),即變換域信號的協(xié)方差矩陣為對角線型。(2) 在所有正交變換中,KL 變換能力最集中于部分變換系數(shù)中。(3) 對于所有正交變換,

48、在同樣失真條件下,KL 變換達(dá)到最小的碼率。(4) KL 變換是在均方誤差準(zhǔn)則下,失真最小的一種變換,故又稱最佳變換6。15 / 49第第4 4章章 JPEGJPEG圖像壓縮圖像壓縮4.14.1 JPEGJPEG概述概述 JPEG 是聯(lián)合圖像專家小組的英文縮寫。是一個由 ISO 和 IEC 兩個組織機構(gòu)聯(lián)合組成的一個專家組,該專家小組多年來一直致力于標(biāo)準(zhǔn)化工作。他們開發(fā)研制出連續(xù)色調(diào)、多級灰度以與負(fù)責(zé)制定靜態(tài)的數(shù)字圖像數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn),這個專家組開發(fā)的算法稱為JPEG 算法,并且成為,因此又稱為 JPEG 標(biāo)準(zhǔn)。JPEG 是一個適用圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn),既可用于灰度圖像又可用于彩色圖像

49、。圖像壓縮的目的在于以較少的數(shù)據(jù)來表示圖像以節(jié)約存儲費用,或者傳輸時間和費用。JPEG 壓縮算法可以用失真的壓縮方式來處理圖像,但失真的程度卻是肉眼所無法辨認(rèn)的。這也就是為什么 JPEG 會有如此滿意的壓縮比例的原因。它不僅適用于靜態(tài)圖像的壓縮;電視圖像序列的幀圖像的壓縮編碼,也常采用 JPEG 壓縮標(biāo)準(zhǔn)7。JPEG 標(biāo)準(zhǔn)委員會完成了詳盡的技術(shù)評估、測試、選擇、有效化和文檔編制工作,形成了完整的國際標(biāo)準(zhǔn)。這個國際標(biāo)準(zhǔn)經(jīng)的起質(zhì)量和時間的檢驗。隨著各種各樣的圖像應(yīng)用在開放網(wǎng)絡(luò)化計算機系統(tǒng)中,JPEG 數(shù)字圖像壓縮文件,作為一種數(shù)據(jù)類型,如同文本和圖形文件一樣地存儲和傳輸。JPEG 的目的是為了給出

50、一個適用于連續(xù)色調(diào)圖像的壓縮方法,使之滿足如下要求:(1) 達(dá)到或接近當(dāng)前壓縮比與圖像保真度的技術(shù)水平,能覆蓋一個較寬的圖像質(zhì)量等級圍,能達(dá)到“很好”或“極好”的評估,與原始圖像相比,人的視覺難以辨別。(2) 能適用于任何連續(xù)色調(diào)的圖像,長寬比不受限制,同時也不受限于景物容、圖像的復(fù)雜程度和統(tǒng)計特性等。(3)計算的復(fù)雜性是可控的,其軟件可在各種 CPU 上完成,算法也可用硬件實現(xiàn)。(4)JPEG 算法具有四種工作模式: 順序編碼:每圖像分量按從左到右,從上到下掃描,一次掃描完成編碼。 累進(jìn)編碼:圖像編碼在多次掃描中完成。 無失真編碼:該方法保證解碼后完全精確地恢復(fù)采用值。 分層編碼:圖像在多個

51、空間分辨率進(jìn)行編碼。當(dāng)信道傳輸速率慢時,接收端顯示器分辨率也不高的情況下,只需做低分辨率圖像解碼,不必進(jìn)行高分辨率解碼。4.24.2 JPEGJPEG圖像圖像編碼算法的實現(xiàn)編碼算法的實現(xiàn)JPEG 壓縮編碼算法的主要計算步驟如下:圖像顏色模式轉(zhuǎn)換,分塊采樣,離散余弦變換(DCT),量化(quantization),Z 字形編碼(zigzag scan),使用差分脈沖編碼調(diào)制(differential pulse code modulation,DPCM)對直流系數(shù)(DC)進(jìn)行編碼,使用行程長度編碼(run-length encoding,RLE)對交流系數(shù)(AC)進(jìn)行編碼,熵編碼(entropy

52、 coding)。4.2.14.2.1 離散余弦編碼離散余弦編碼DCT 變換的全稱是離散余弦變換,是指將一組光強數(shù)據(jù)轉(zhuǎn)換成頻率數(shù)據(jù),以便得知強度變化的情形。若對高頻的數(shù)據(jù)做些修飾,再轉(zhuǎn)回原來形式的數(shù)據(jù)時,顯然與原始數(shù)據(jù)有些差異,但是人類的眼睛卻是不容易辨認(rèn)出來。當(dāng)圖像數(shù)據(jù)分成一個 88 矩陣后,還必須將每個數(shù)值減去 128,然后一一代入 DCT變換公式中,即可達(dá)到 DCT 變換的目的。圖像數(shù)據(jù)值必須減去 128,是因為 DCT 轉(zhuǎn)換公式所接受的數(shù)字圍是在-128 到+127 之間。DCT 變換編碼其變換前后的信號熵和能量不變,在時域(或空域)中的 n 維信號 x 其變換核可分離的正、逆 DCT

53、 變換分別定義如下 (4.1)1102) 12(cos)()(2)(10NkNknnxkCNkXNn, (4.2)1-N102) 12(cos)()(2)(10,nNknkXkCNnxNn其中121102/1)(NkkkC,DCT 的各行(列)基矢量均是歸一正交的(為了保證變換前后熵和數(shù)相等)。由于圖像信號的統(tǒng)計特性接近一階馬氏鏈,因此 DCT 基矢量與之非常匹配,且不僅 DCT 基矢量的設(shè)計在多數(shù)情況下符合 HVS 特性,而且編碼電路簡單。綜合 DCT 編碼特性與相關(guān)性等方面因素,它僅次于理想的 K-L 變換,所以 DCT 在眾多變換(DCT、斜變換、Haar 變換、KLT和沃爾什變換等)中

54、脫穎而出。經(jīng)過 DCT 變換后的系數(shù)主要值集中在左上角低頻區(qū)域,其中直流值最大。由于變換后系數(shù)矩陣右下角大多數(shù)高頻系數(shù)趨向于零,這樣就為結(jié)合 HVS特性,采用(有死區(qū))量化、Zigzag 掃描、截斷 DCT 變字長壓縮編碼創(chuàng)造了條件,更重要的是為數(shù)字圖像/視音頻信號的壓縮找到了切實可行的方法。盡管帶限的頻率域模型存在頻譜的截斷誤差,但由于其求解精度和抗噪聲能力較好,該方法同樣有助于問題更加準(zhǔn)確地描述和求解,這也正是頻率方法研究的意義所在8。數(shù)字圖像可以看成是一個 MN 的矩陣,借助于二維 DCT,可以將圖像從空間),(nmx17 / 49域(即平面)變換到 DCT 域(即平面)。以求和形式定義

55、的二維 DCT 為mnkl (4.3)10102) 12(cos2) 12(cos),()()(2),(MmNnNlnMkmnmXlCkCMNlkX其中 k=0,1,M-1;l=0,1,N-1.4.2.24.2.2 量化量化88 圖像子塊通過 DCT 變換后,其低頻分量主要集中在左上角,高頻分量分布在右下角。由于人眼對高頻分量遠(yuǎn)沒有低頻分量敏感,大量的圖像信息(如亮度)主要包含在低頻中,所以編碼時,可以忽略圖像的高頻分量,從而在視覺損失很小的情況下達(dá)到壓縮的目的。要將高頻分量去掉,就要用到量化,它是產(chǎn)生信息損失的根源。量化過程就是每個 DCT 系數(shù)除以各自的量化步長并取整,得到量化系數(shù): (4

56、.4)5 . 0)()()(vuSvuFINTvuF,這里的取整采用四舍五入的方式。反量化則是在解碼器中由量化系數(shù)恢復(fù) DCT 系數(shù)的過程: (4.5)()()(vuSvuFvuF,對于 DCT 變換后的 64 個系數(shù),利用量化表中相對應(yīng)的 64 個數(shù)值(量化步長)進(jìn)行均勻量化(線性量化),實現(xiàn)圖像數(shù)據(jù)的實際壓縮。應(yīng)用程序可以根據(jù)圖像的性質(zhì)、顯示設(shè)備和觀察條件等因素設(shè)定量化表的值。JPEG 標(biāo)準(zhǔn)沒有規(guī)定缺省的量化表,但它給出了一些指導(dǎo)性的量化表。如圖 4.1、圖 4.2 所示,分別用于對亮度和色差信號。之所以用兩量化表,是因為亮度分量比色差分量更重要,因而對亮度采用細(xì)量化,對色差采用粗量化。量

57、化表左上角的值較小,右下角的值較大,這樣就達(dá)到了保持低頻分量、抑制高頻分量的目的。這兩個量化表均基于兩個因素:一是人的視覺心理閾值;二是對于大量圖像的觀測,適應(yīng)于 8bit 精度、水平方向進(jìn)行 2:1 抽樣的圖像。目前在許多一般應(yīng)用的 JPEG 基本系統(tǒng)中均使用這兩個量化表,并且取得了良好的效果。9910310011298959272101120121103877864499211310481645535247710310968563722186280875129221714566957402416131455605826191412126151402416101116圖 4.1 亮度信號的量

58、化表99999999999999999999999999999999999999999999999999999999999999999999999999996647999999999956262499999999662621189999999947241817圖 4.2 色差信號的量化表4.2.34.2.3 編碼編碼Huffman 編碼無專利權(quán)問題,成為 JPEG 最常用的編碼方式,Huffman 編碼通常是以完整的 MCU 來進(jìn)行的。編碼時,每個矩陣數(shù)據(jù)的 DC 值與 63 個 AC 值,將分別使用不同的Huffman 編碼表,而亮度與色度也需要不同的 Huffman 編碼表,所以一共需要

59、4 個編碼表,才能順利地完成 JPEG 編碼工作。DC 編碼是采用差值脈沖編碼調(diào)制的差值編碼法,也就是在同一個圖像分量中取得每個 DC 值與前一個 DC 值的差值來編碼,同時,由于其后的附加位用以唯一的規(guī)定該類中一個具體的差值幅度。亮度分量和灰度分量的統(tǒng)計特性不同,其碼字結(jié)構(gòu)為:C=(SSSS,附加位),其中 4bits 二進(jìn)制碼“SSSS”用來將 DC 差值的幅度圍分為 255。DC 采用差值脈沖編碼的主要原因是由于在連續(xù)色調(diào)的圖像中,其差值多半比原值小,對差值進(jìn)行編碼所需的位數(shù),會比對原值進(jìn)行編碼所需的位數(shù)少許多,具體可看表 4.1差值 Bits數(shù)與差值容對照表。表 4.1 差值 Bits

60、 數(shù)與差值容對照表差值 BitsDC 差值容001-1,12-3,-2,2,33-7,-4,4,74-15,-8,8,155-31,-16,16,316-61,-32,32,637-127,-64,64,1278-255,-128,128,25518-511,-256,256,51110-1023,-512,512, ,102319 / 4911-2047,-1024,1024,2047在差值前端另外加入一些差值的 Huffman 碼值,例如亮度差值為 5(101)的位數(shù)為3,在 Huffman 碼值應(yīng)該是 100,兩者連接在一起即為 100101。表 4.2 和表 4.3 分別是亮度和色度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論