畢業(yè)設(shè)計(jì)(論文)-JPEG2000感興趣區(qū)域算法的研究.doc_第1頁
畢業(yè)設(shè)計(jì)(論文)-JPEG2000感興趣區(qū)域算法的研究.doc_第2頁
畢業(yè)設(shè)計(jì)(論文)-JPEG2000感興趣區(qū)域算法的研究.doc_第3頁
畢業(yè)設(shè)計(jì)(論文)-JPEG2000感興趣區(qū)域算法的研究.doc_第4頁
畢業(yè)設(shè)計(jì)(論文)-JPEG2000感興趣區(qū)域算法的研究.doc_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

摘 要JPEG2000是聯(lián)合圖像專家組于2000年底制定的新一代靜態(tài)圖像壓縮編碼標(biāo)準(zhǔn)。傳統(tǒng)的JPE6標(biāo)準(zhǔn)相比,JPEGZ000標(biāo)準(zhǔn)采用了離散小波變換、內(nèi)嵌編碼等技術(shù),從而具有了漸進(jìn)傳輸、感興趣區(qū)域壓縮、抗誤碼等新特性。論文介紹了JPEGZ000標(biāo)準(zhǔn)。給出了JPEG2000標(biāo)準(zhǔn)的理論基礎(chǔ),按功能模塊分析了其編碼解碼系統(tǒng),并進(jìn)行了仿真實(shí)驗(yàn),與JPEG標(biāo)準(zhǔn)的壓縮性能進(jìn)行了比較。重點(diǎn)研究了JPEGZ000標(biāo)準(zhǔn)的感興趣區(qū)域特性,該編碼處理方法可以將用戶感興趣的圖像區(qū)域7與背景區(qū)域區(qū)別開來,并實(shí)現(xiàn)對(duì)前者優(yōu)先、優(yōu)質(zhì)的編碼操作。詳細(xì)討論了標(biāo)準(zhǔn)第一部分采納的最大平移法的編碼原理,進(jìn)行了仿真實(shí)驗(yàn),對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了比較和分析。針對(duì)最大平移法不能控制感興趣區(qū)域和背景區(qū)域重建圖像相對(duì)質(zhì)量的不足,又進(jìn)一步設(shè)計(jì)并實(shí)現(xiàn)了兩種改進(jìn)算法:最重要平移法和逐個(gè)平移法。實(shí)驗(yàn)結(jié)果證明,這兩種改進(jìn)算法具有最大平移法的優(yōu)點(diǎn),即不需要對(duì)感興趣區(qū)域的形狀信息進(jìn)行編碼和傳輸,同時(shí)又克服了最大平移法的缺點(diǎn),實(shí)現(xiàn)了對(duì)感興趣區(qū)域和背景區(qū)域壓縮質(zhì)量的靈活調(diào)整。關(guān)鍵詞:圖像壓縮;JPEG2000;感興趣區(qū)域;小波變換IThe Format Criterion of Masters Degree Paper of DUTAbstractJPEG2000,the new ISO/ITU.T standard for still image encoding, had been finished at the end for 2000.Compared with the JPEG standard adopts some different compress technique, such as Discrete Wavelet Transform, Embedded Coding and so on. So it has better compress performances, including progressive Display, Region of interest (ROI) encoding.Firstly, JPEG2000 standard is introduced, including the basic theory and every module in its encoding/decoding system. The programming results are analyzed and compared with those of the JPEG standard. Then, the research of ROI is mainly involved, which allows the ROI to be coded with better quality than the background of an image. The MAXShift method in adopted in JPEG200 part I. For MAXShift method does not have the flexibility to select a scaling value to define the relative importance of the RIO and the background wavelet coefficients, two new methods are realized; Most Significant Bit place shift method and Bitplane.by.Bitplane shift method. The programming results prove that the two improved methods support both arbitrary ROI shape and arbitrary scaling without shape encoding.Key Words:Image Compression;JPEG2000;ROI;Wavelet TransformationXXVII 分校學(xué)位論文(設(shè)計(jì))目 錄摘 要IAbstractII1 緒論I1.1 研究的背景11.2 研究的目的和意義11.2.1 研究的目的11.2.2 研究的意義31.3 國內(nèi)外研究現(xiàn)狀31.3.1國內(nèi)研究現(xiàn)狀31.3.2 國外研究現(xiàn)狀42 用JPEG開發(fā)的優(yōu)點(diǎn)和存在的問題62.1 JPEG2000的優(yōu)點(diǎn)62.3 JPEG的主要特點(diǎn)72.4 JPEG的發(fā)展83 JPEG2000核心部分技術(shù)的研究103.1 預(yù)處理103.1.1 圖像片103.1.2 DC移位103.2 圖象壓縮的性能評(píng)價(jià)113.2.1 圖象壓縮的基本概念113.2.2 圖象壓縮的類型123.3 圖象質(zhì)量的判斷標(biāo)準(zhǔn)143.3.1 壓縮比153.3.2 解碼圖象質(zhì)量153.4 核心處理183.4.1 小波變換183.4.2 量化183.4.3 熵編碼194 JPEG2000感興趣的區(qū)域經(jīng)典算法及改進(jìn)214.1 JPEG感興趣區(qū)域算法存在的問題214.2 一般位移法和量化位移法234.2.1 一般移位法234.2.2 最大移位法234.3 結(jié)果仿真及分析25結(jié) 論29參 考 文 獻(xiàn)30附錄A 相關(guān)程序32III分校學(xué)位論文(設(shè)計(jì))1 緒論1.1 研究的背景JPEG是20世紀(jì)80年代末由ISO/IEC制定的靜止圖像壓縮標(biāo)準(zhǔn),現(xiàn)在隨著多媒體和網(wǎng)絡(luò)的發(fā)展,圖像壓縮技術(shù)的應(yīng)用范圍越來越廣,人們對(duì)圖像質(zhì)量和圖像功能的要求越來越高,這些變化要求壓縮編碼算法具有高效率性、靈活性和互換性。圖像壓縮可分為有損壓縮和無損壓縮,它是實(shí)現(xiàn)圖像數(shù)據(jù)傳輸和存儲(chǔ)的核心技術(shù)。目前在圖像壓縮這一領(lǐng)域中的研究一直是以滿足容量更小,傳輸速度更快,圖像質(zhì)量更高為目的的。但是由于壓縮比和重建圖像質(zhì)量的相互制約,想要一幅圖像同時(shí)在這兩方面都獲得最佳效果是無法實(shí)現(xiàn)的,在圖像的實(shí)際應(yīng)用上,人們往往只對(duì)一幅圖像中的某一特殊的部分感興趣。在許多數(shù)字圖像應(yīng)用的領(lǐng)域中,需要的并不是整個(gè)清晰的圖像,而只是需要圖像中某一(或某幾個(gè))特定位置處于無損壓縮的狀態(tài)。例如,在圖像通信中,通信雙方對(duì)人物頭區(qū)域感興趣;對(duì)拍攝的軍事偵察圖像,指揮官只對(duì)其上的打擊目標(biāo)感興趣,而對(duì)大地背景信息并不感興趣,大地背景信息屬于背景區(qū)域,是可以對(duì)其進(jìn)行有損壓縮的;對(duì)于醫(yī)學(xué)圖像,醫(yī)生只對(duì)病變部位區(qū)域感興趣;而一個(gè)網(wǎng)上購物者則僅僅只對(duì)網(wǎng)頁中商品物有興趣,等等這些都是感興趣區(qū)域編碼應(yīng)用的范圍。如果能在整幅圖片中指定一塊感興趣區(qū)域,然后在壓縮時(shí),對(duì)該區(qū)域采用低壓縮比的壓縮,甚至是無損壓縮以獲取較好的圖像壓縮效果,而其他區(qū)域采用高壓縮比的有損壓縮,這樣既能滿足人們對(duì)圖像的要求,又能降低傳輸時(shí)間,節(jié)省存儲(chǔ)空間。也就是說,在一幅圖像內(nèi)實(shí)現(xiàn)多種質(zhì)量的壓縮。這就是我們所說的感興趣區(qū)域(Region of InterestROI)編碼技術(shù)。1.2 研究的目的和意義1.2.1 研究的目的JPEG2000是新一代的靜止圖像標(biāo)準(zhǔn),和JPEG相兼容,但不是用來代替它。JPEG2000與JPEG最大的不同就是,放棄了JPEG所采用的以離散余弦變換DCT(Discrete Cosine Transform)為主的區(qū)塊編碼方式,而改用以離散小波變換DWT(Discrete Wavelet Transform)算法為主的多解析編碼方式,采用當(dāng)前最新的嵌入式編碼技術(shù),在獲得優(yōu)于目前JPEG標(biāo)準(zhǔn)壓縮效果的同時(shí)生成的碼流具有較強(qiáng)的可截?cái)喙δ?,以期望在至?0年的時(shí)間內(nèi)占據(jù)標(biāo)準(zhǔn)壓縮領(lǐng)域的領(lǐng)先地位。以其在高端應(yīng)用和成像設(shè)備上表現(xiàn)出的優(yōu)異性能,開拓圖像壓縮尚未涉足的市場。其主要優(yōu)勢有以下幾個(gè)方面:1 低碼率下的高壓縮性能傳統(tǒng)的JPEG標(biāo)準(zhǔn)在中、高比特率下提供了比較好的率失真(Rate.Distortion)性能,但是在低碼率條件下(比如對(duì)于細(xì)節(jié)豐富的灰度圖像使用低于0.25bit/s的碼率),它提供的主觀圖像質(zhì)量往往令人無法接受,存在顯著的方塊效應(yīng)。JPEG2000將提供低碼率下的超級(jí)性能,并且在碼率下降的同時(shí)率失真性能仍能保持最優(yōu),這對(duì)于有限的帶寬資源來說是很有現(xiàn)實(shí)的應(yīng)用價(jià)值。同時(shí)支持有損壓縮和無損壓縮JPEG2000在圖像壓縮時(shí),使用LeGall(5,3)小波濾波器和Daubechies(9,7)小波濾波器。LeGall(5,3)小波濾波器為從整數(shù)到整數(shù)的變換實(shí)現(xiàn)無損壓縮,這對(duì)于那些需要精確保存原始圖像的細(xì)節(jié)信息的圖像(例如醫(yī)療圖像和建筑圖像)是比不可少的;另外JPEG2000也支持使用Daubechies(9,7)小波濾波器,為實(shí)數(shù)到實(shí)數(shù)的變換,實(shí)現(xiàn)有損壓縮,適合于那些不需要高精度的保存原始圖像細(xì)節(jié)信息的圖像(例如印刷、掃描等的圖像)。而且,在一個(gè)JPEG2000碼流中,可以同時(shí)存在有損壓縮和高性能的無損壓縮數(shù)據(jù),并且對(duì)圖像的無損恢復(fù)可以利用層進(jìn)式解碼自然得到。2 漸進(jìn)傳輸傳統(tǒng)的圖像在網(wǎng)絡(luò)中傳輸顯示時(shí)是逐行顯示,而JPEG2000壓縮的圖像文件在網(wǎng)絡(luò)中傳輸時(shí),是首先傳輸圖像的輪廓,然后逐步顯示圖像的細(xì)節(jié)信息,即圖像的顯示是一個(gè)有不清楚到清楚,逐漸清晰的過程。這對(duì)于客戶在瀏覽互聯(lián)網(wǎng)上的圖像時(shí),帶來很大的便利,但從圖像的輪廓發(fā)現(xiàn)不感興趣時(shí),客戶就可以終止圖像的傳輸,從而節(jié)約帶寬,節(jié)省等待時(shí)間。感興趣區(qū)域ROI(Region Of Interest)的支持JPEG2000容許用戶在瀏覽圖像時(shí),定義自己感興趣的區(qū)域,對(duì)該區(qū)域進(jìn)行優(yōu)先傳輸和高精度顯示。用戶不僅可以使用比圖像其它部分小的多的失真對(duì)該區(qū)域進(jìn)行壓縮,而且可以在壓縮情況下對(duì)該區(qū)域進(jìn)行翻轉(zhuǎn)、縮放等幾何操作,提供圖像內(nèi)容的描述JPEG2000在對(duì)圖像的碼流傳輸時(shí),提供格外的關(guān)于圖像內(nèi)容的描述信息,通過這個(gè)特性,就可以方便地建立關(guān)于圖像的內(nèi)容的數(shù)據(jù)庫檢索,從而使得圖像檢索在互聯(lián)網(wǎng)搜索中成為可能。另一方面,這一特性對(duì)于一個(gè)很大容量的圖像數(shù)據(jù)庫的維護(hù)和檢索來說,也是必不可少的。圖像安全保護(hù)JPEG2000容許通過水印、標(biāo)簽、沖壓、指紋、加密和干擾等方式對(duì)數(shù)字圖像進(jìn)行保護(hù)。水印和指紋都是在圖像內(nèi)部設(shè)置的不可見標(biāo)記,這對(duì)于現(xiàn)在互聯(lián)網(wǎng)中普遍存在的盜版現(xiàn)象具有顯示的應(yīng)用價(jià)值;標(biāo)簽已經(jīng)在SPIFF中實(shí)現(xiàn),但必須易于和JPEG2000的圖像文件一起傳輸;沖壓時(shí)顯示在圖像上的標(biāo)記,只能通過特殊方式清除;加密和干擾可以對(duì)全部圖像文件或者其中一部分進(jìn)行,以避免對(duì)圖像的未授權(quán)。1.2.2 研究的意義本文把JPEG2000標(biāo)準(zhǔn)的關(guān)鍵技術(shù)之一ROI區(qū)域處理作為研究課題,研究了大多數(shù)JPEG2000分析資料中很少提及的ROI功能。同時(shí)研究了多區(qū)域多質(zhì)量的圖像壓縮算法,期望通過研究與實(shí)現(xiàn),來跟蹤當(dāng)代先進(jìn)的圖像壓縮編碼技術(shù),為今后的圖像壓縮技術(shù)的進(jìn)一步研究做準(zhǔn)備。圖像編碼的一系列國際建議的提出標(biāo)志著圖像編碼技術(shù)已經(jīng)成熟,開始由大學(xué)的實(shí)驗(yàn)室走向產(chǎn)業(yè)化,其中包含著巨大的商業(yè)利益。圖像編碼技術(shù)的突破對(duì)IT技術(shù)的各個(gè)方面有巨大的影響,可以促使現(xiàn)有信息產(chǎn)業(yè)的結(jié)構(gòu)發(fā)生巨變。由于圖像編碼體系應(yīng)用在于IT技術(shù)的各個(gè)方面,具有很大的經(jīng)濟(jì)價(jià)值,成為各方面爭奪的焦點(diǎn),誰掌握了它就擁有了具大的利益。可以想象到掌握核心的知識(shí)產(chǎn)權(quán)帶來多大的收益,目前我們應(yīng)該多開發(fā)此類的核心技術(shù),才能在將來的科技、經(jīng)濟(jì)競賽處于有利位置.感興趣區(qū)域編碼技術(shù)作為JPEG2000的核心技術(shù)之一可以解決圖像交互處理、遠(yuǎn)程醫(yī)療、遠(yuǎn)程教育、遠(yuǎn)程測量,空間探索中出現(xiàn)的許多與圖像處理有關(guān)的問題,這種技術(shù)可以推廣應(yīng)用到很多場合,從Internet應(yīng)用到軍事目標(biāo)偵察;可以將感興趣區(qū)域與加密技術(shù)結(jié)合,限制圖像某些區(qū)域的可見性;可以與版權(quán)信息結(jié)合,利用感興趣區(qū)域在多次壓縮傳輸中信息不會(huì)損失,從而對(duì)版權(quán)加以保護(hù)。在車牌識(shí)別系統(tǒng)中,由于現(xiàn)有的車牌識(shí)別率不是很高,因此一般要結(jié)合整個(gè)汽車的圖像來進(jìn)行識(shí)別,而整個(gè)汽車圖像的數(shù)據(jù)量非常大,必須壓縮存儲(chǔ)和傳輸。如果采用ROI編碼,對(duì)車牌號(hào)進(jìn)行高精度的編碼,而對(duì)整個(gè)汽車的圖像進(jìn)行高壓縮率低精度的編碼,則可以實(shí)現(xiàn)在較小數(shù)據(jù)量情況下實(shí)現(xiàn)高精度的車牌識(shí)別。在視頻會(huì)議系統(tǒng)中,一般感興趣的只是參與開會(huì)的人的圖像,而對(duì)其背景部分并不是很感興趣,因此我們就可以把參加會(huì)議的人的圖像設(shè)為是感興趣區(qū)域,其余為背景,采用感興趣區(qū)域圖像編碼技術(shù)對(duì)其進(jìn)行相應(yīng)處理。該方法可以大大降低帶寬的需求,推動(dòng)視頻會(huì)議的發(fā)展。這將是我們今后隨著研究的進(jìn)一步深入而逐步應(yīng)用到具體實(shí)踐中的,在互聯(lián)網(wǎng)迅速發(fā)展的今天,有著實(shí)際的研究意義和價(jià)值。也就是說,感興趣區(qū)域編碼有著非常廣闊的應(yīng)用空間和發(fā)展前景。1.3 國內(nèi)外研究現(xiàn)狀1.3.1國內(nèi)研究現(xiàn)狀目前,對(duì)JPEG2000壓縮算法的并行算法研究,國內(nèi)外從軟件方面考慮主要集中以下幾個(gè)方面:在針對(duì)如何在一個(gè)單時(shí)鐘周期內(nèi)實(shí)現(xiàn)兩個(gè)位編碼的EBCOT(Embedded Block Coding With Optimized Truncation)體系的并行化研究,其研究的重點(diǎn)主要集中在JPEG2000中最復(fù)雜的部分EBCOT的Tier.1編碼,因?yàn)門ier.1編碼包含了大量的計(jì)算負(fù)載,所以針對(duì)EBCOT國內(nèi)外提出了許多種體系結(jié)構(gòu),并且大部分也已經(jīng)在實(shí)際的應(yīng)用中被采用,所有的這些方法采用的是JPEG2000的缺省模式,或者稱之為串行模式與并行模式的并存模式,除此之外,還有基于圖像壓縮過程中如何提高內(nèi)存利用率的并行,這主要是通過使用RESTART、RESET和CAUSAL三個(gè)模式選擇,從而得到減少JPEG2000編碼器的內(nèi)存利用,特別是減少子帶數(shù)據(jù)占用的內(nèi)存。另外還有基于如何把位平面和雙通過程并行化BPDP(Bit.plane and Pass Dual Parallel)的系數(shù)位模式(Coefficient Bit Modeling)并行,這主要是利用并行的思想通過在一次掃描之內(nèi)完成小數(shù)位平面FBP(Fractional Bit.plane)編碼而實(shí)現(xiàn)。此外在硬件方面,國內(nèi)外還有利用并行的思想,使用超大規(guī)模集成電路(Very Large Scale Integration)實(shí)現(xiàn)EBCOT編碼器。一種新的VLSI體系采用一種叫做動(dòng)態(tài)內(nèi)存控制(Dynamic Memory Control)策略來加速編碼過程。針對(duì)位平面編碼器提出了一種管道VLSI體系,在每一個(gè)通道(Pass)過程中同時(shí)處理一列。然而,單純地從圖像壓縮的時(shí)間長短的角度考慮,以圖像壓縮時(shí)間最少進(jìn)行并行化的文章卻比較少,本文正是基于這個(gè)角度出發(fā),通過分析JPEG2000圖像壓縮算法的串行代碼實(shí)現(xiàn),從中要找出JPEG2000圖像壓縮技術(shù)中各個(gè)階段中運(yùn)算費(fèi)時(shí)最長、計(jì)算量最大的部分來并行化,從而得到節(jié)約計(jì)算時(shí)間,滿足圖像壓縮應(yīng)用中實(shí)時(shí)性的要求。據(jù)悉,清華大學(xué)微電子研究所正在與美國WIS技術(shù)公司合作開發(fā)在FPGA中使用的運(yùn)算器,該運(yùn)算器將用于JPEG2000設(shè)備核心的畫質(zhì)無損/有損過濾器。國內(nèi)的一些相機(jī)制造商也在積極開發(fā)JPEG2000數(shù)碼相機(jī)。上海海鷗相機(jī)公司現(xiàn)在已經(jīng)達(dá)到年產(chǎn)60萬部普通百萬像素解像JPEG標(biāo)準(zhǔn)數(shù)碼相機(jī)的能力,該公司正在和一些世界頂級(jí)的JPEG2000技術(shù)芯片供應(yīng)商爭取合作關(guān)系。鳳凰光學(xué)儀器公司與北京大學(xué)遙感所合作,建立了一個(gè)數(shù)碼相機(jī)壓縮控制芯片及CMOS成像器的開發(fā)項(xiàng)目。圍繞這個(gè)課題內(nèi)容,本文作者在畢業(yè)論文階段主要作了以下工作: 對(duì)JPEG2000標(biāo)準(zhǔn)的串行算法進(jìn)行討論和分析; 設(shè)計(jì)實(shí)現(xiàn)基于小波變換系數(shù)塊的并行算法; 對(duì)實(shí)現(xiàn)其它并行算法的實(shí)現(xiàn)進(jìn)行討論和分析。1.3.2 國外研究現(xiàn)狀JPEG20000是靜態(tài)圖像壓縮的最新國際標(biāo)準(zhǔn)。JPEG全名為Joint Photographic Experts Group,它是一個(gè)在國際標(biāo)準(zhǔn)組織(ISO)下從事靜態(tài)圖像壓縮標(biāo)準(zhǔn)制定的委員會(huì)即聯(lián)合圖片專家組。它制定出了第一套國標(biāo)靜態(tài)圖像壓縮標(biāo)準(zhǔn):即JPEG。由于JPEG優(yōu)良的品質(zhì),使得它在短短的幾年內(nèi)就獲得極大的成功,目前在因特網(wǎng)上有百分之七十多的圖像都是采用JPEG的壓縮標(biāo)準(zhǔn)。然而,隨著多媒體應(yīng)用領(lǐng)域的不斷發(fā)展,傳統(tǒng)的JPEG壓縮技術(shù)已無法滿足人們的需求。因此,新一代靜態(tài)圖像壓縮技術(shù)JPEG2000就誕生了,它擁有更高壓縮率以及更多的新功能。JPEG2000的制定始于1997年3月,直到2000年3月,規(guī)定基本編碼系統(tǒng)的最終協(xié)議草案才出臺(tái)?!案邏嚎s、低比特速率”是JPEG2000的目標(biāo)。在壓縮率相同的情況下,JPEG2000的信噪比將比JPEG提高30%左右。JPEG2000擁有5種層次的編碼形式:彩色靜態(tài)畫面采用的JPEG編碼、2值圖像采用的JBIG、低壓縮率圖像采用JPEGLS等,成為應(yīng)對(duì)各種圖像的通用編碼方式。在編碼算法上,JPEG2000采用離散小波變換(DWT)和比特平面算術(shù)編碼(MQ coder)。此外,JPEG2000碼流還支持空間隨機(jī)訪問。隨著JPEG2000標(biāo)準(zhǔn)的出臺(tái),參與開發(fā)的企業(yè)除了軟件供應(yīng)商越來越多以外,還有很多制造圖像設(shè)備的硬件供應(yīng)商,以及整個(gè)IT業(yè)界都看好JPEG2000。2 用JPEG開發(fā)的優(yōu)點(diǎn)和存在的問題2.1 JPEG2000的優(yōu)點(diǎn)1992年聯(lián)合圖像專家組(JPEG,Joint Photographic Expert Group)推出了基于離散余弦變換(DCT)的JPEG靜態(tài)圖像壓縮標(biāo)準(zhǔn)(ISO 10928)。該壓縮標(biāo)準(zhǔn)一經(jīng)推出就因?yàn)槠鋬?yōu)越的壓縮性能而得到了各方面的認(rèn)可,成為迄今為止應(yīng)用最為廣泛的圖像標(biāo)準(zhǔn)之一。但隨著多媒體技術(shù)和網(wǎng)絡(luò)通訊技術(shù)的迅猛發(fā)展,人們對(duì)圖像的壓縮性能、處理靈活性、功能性等各方面也有了進(jìn)一步要求。現(xiàn)有的JPEG圖像壓縮標(biāo)準(zhǔn)己經(jīng)不能完全滿足用戶的需求。人們迫切需要一種壓縮效果更加優(yōu)越,支持更多圖像格式,并能夠提俱更多新特性的靜止圖像壓縮格式。于是聯(lián)合圖像專家組于ZOQ。年12月推出了JPEG2000靜態(tài)圖像壓縮標(biāo)準(zhǔn)。JPEGZ000與之前的JPEG相比具有以下優(yōu)點(diǎn):(1)更高的壓縮比;(2)同時(shí)支持有損和無損壓縮;(3)支持多分辨率表示;(4)嵌入式碼流(逐漸顯示解碼和SNR可分級(jí));(5)疊置(TiLing);(6)感興趣區(qū)域編碼(RQI,Rerest);(7)抗誤碼;(8)碼流的隨機(jī)存取和處理;(9)對(duì)多重壓縮、解壓縮循環(huán)的性能改造;(10)更靈活的文件格式。為了達(dá)到以上性能,JPEG2000標(biāo)準(zhǔn)采用了許多新的壓縮編碼技術(shù).首先,不同于JEPG標(biāo)準(zhǔn)中基于子塊的離散余弦變換(DCT),JPEG2000標(biāo)準(zhǔn)采用了基于離散二維小波變換(DWT).由于DWT自身具有多分辨率圖像表示性能、而且可以在大范圍內(nèi)去除圖像的相關(guān)性將圖像能童分布更好地集中,一因此壓縮效率得到了提高;其次,由于使用整數(shù)DWT濾波器,在單一碼流中可以同時(shí)實(shí)現(xiàn)有損和無損壓縮;第三,通過使用均勻量化器實(shí)現(xiàn)嵌入式編碼。對(duì)于量化系數(shù)各比特面進(jìn)行基于上下文的自適應(yīng)算術(shù)編碼,這些由比特面提供的嵌入式碼流同時(shí)又提供了5NR的可分級(jí)性。進(jìn)一步,每個(gè)子帶的比特面被限制在獨(dú)立的矩形塊中,通過三次掃描完成編碼,由此得到最佳的嵌入式碼流、改進(jìn)的抗誤碼能力和部分空間隨機(jī)存取能力。JPEG2000和JPEG相比優(yōu)勢明顯且向下兼容,可廣泛應(yīng)用于網(wǎng)絡(luò)通訊、無線通訊、醫(yī)療成像、遙感、打印、掃描、傳真、數(shù)碼相機(jī)等領(lǐng)域,取代傳統(tǒng)的JPEG己經(jīng)是指日可待。JPEG2000是一個(gè)基于小波變換的編碼系統(tǒng),它主要采用嵌入式方塊編碼方式。JPEG2000的一大特色就是支持對(duì)感興趣區(qū)域的編碼,感興趣區(qū)域可以獲得比背景圖像高得多的圖像壓縮質(zhì)量。在JPEG2000的第一部分文獻(xiàn)里,定義了JPEG2000感興趣區(qū)域方法。它采用了一種叫做最大上移(MAXSHIFT)的算法。利用該算法,可以對(duì)任意形狀的感興趣區(qū)域進(jìn)行編碼,而不必保存感興趣區(qū)域的形狀信息,在解碼時(shí),也不必對(duì)感興趣區(qū)域的形狀解碼。JPEG2000支持的感興趣區(qū)域編碼算法是基于對(duì)小波系數(shù)的放大(scale)。該算法的原則就是按比例增大(scale up)或上移(shift up)與感興趣區(qū)域有關(guān)的小波系數(shù)5,使它們能夠位于較高的比特平面上。在接下來進(jìn)行的嵌入式編碼的編碼比特流里,這些被上移的系數(shù)被放在非感興趣區(qū)域的小波變換系數(shù)前面。這樣,感興趣區(qū)域就會(huì)先于非感興趣區(qū)域進(jìn)行編碼和細(xì)化。即使編碼比特流被截?cái)嗔?,或者在?duì)整幅圖像完全編碼之前終止了編碼過程,感興趣區(qū)域也會(huì)擁有比圖像的其它區(qū)域高的逼真度。在JPEG2000中,基于小波系數(shù)的按比例放大的方法主要有以下執(zhí)行步驟5.6:(1)計(jì)算小波變換;(2)若已經(jīng)選定了感興趣區(qū)域,則產(chǎn)生感興趣區(qū)域掩模,來指明需要進(jìn)行無損感興趣區(qū)域重建的系數(shù)集合;(3)量化小波系數(shù);(4)按一定比例縮小感興趣區(qū)域掩模以外的小波系數(shù)值;(5)漸進(jìn)熵編碼,最重要的比特平面優(yōu)先編碼。2.2 JPEG的主要特點(diǎn) 2.2.1 JPEG的主要特點(diǎn)(1)壓縮比高,壓縮的質(zhì)量比較好,圖像主觀質(zhì)量損傷難以察覺;(2)有多個(gè)參數(shù),用戶能得到所需要的壓縮比和圖像質(zhì)量;(3)無論連續(xù)色調(diào)圖像的維數(shù)、彩色空間、像素寬高比或其他特性如何,都能得到良好的壓縮效果。(4)處理的速度快,且有成熟的價(jià)格低廉的硬件電路的支持。2.3 JPEG的發(fā)展前面章節(jié)所介紹的JPEG2000的標(biāo)準(zhǔn)只適用與靜止的圖像,隨著JPEG標(biāo)準(zhǔn)的發(fā)展,制定出了許多的適應(yīng)于不同動(dòng)態(tài)圖像的標(biāo)準(zhǔn)。例如:MPEG.1、MPEG.2、MPEG.4。MJPEG 是指 Motion JPEG,即動(dòng)態(tài)JPEG,按照25幀/秒速度使用JPEG 算法壓縮視頻信號(hào),完成動(dòng)態(tài)視頻的壓縮。是由JPEG專家組制訂的,其圖像格式是對(duì)每一幀進(jìn)行壓縮,通??蛇_(dá)到6:1的壓縮率,但這個(gè)比率相對(duì)來說仍然不足。就像每一幀都是獨(dú)立的圖像一樣。MJPEG圖像流的單元就是一幀一幀的JPEG畫片。因?yàn)槊繋伎扇我獯嫒?,所以MJPEG常被用于視頻編輯系統(tǒng)。動(dòng)態(tài)JPEG能產(chǎn)生高質(zhì)量、全屏、全運(yùn)動(dòng)的視頻,但是,它需要依賴附加的硬件。而且,由于MJPEG不是一個(gè)標(biāo)準(zhǔn)化的格式,各廠家都有自己版本的MJPEG,雙方的文件無法互相識(shí)別。 MJPEG的優(yōu)點(diǎn)是畫質(zhì)還比較清晰,缺點(diǎn)是壓縮率低,占用帶寬很大。一般單路占用帶寬2M左右。2.3.2 JPEG的標(biāo)準(zhǔn) (1)MPEG.1標(biāo)準(zhǔn) MPEG.1是 ISO 開發(fā)的第一個(gè)視頻壓縮算法??梢蕴峁┳罡哌_(dá)1.5Mbps的數(shù)字視頻,只支持逐行掃描。主要應(yīng)用是數(shù)字媒體上動(dòng)態(tài)圖像與音頻的存儲(chǔ)與檢索,如速率為 1.15Mbps、采用 SIF 分辨率(352(240 . 29.97fps 或者 352(288 . 25 fps)的VCD。 (2)MPEG.2 標(biāo)準(zhǔn)MPEG.2專門針對(duì)數(shù)字電視而開發(fā),很快成為了迄今最成功的視頻壓縮標(biāo)準(zhǔn)。MPEG.2 既能夠滿足標(biāo)準(zhǔn)逐行視頻的需求(其中視頻序列由一系列按一定時(shí)間間隔采集的幀構(gòu)成),又能夠滿足電視領(lǐng)域常用的隔行視頻的需求。隔行視頻交替采集及顯示圖像中兩組交替的像素(每組稱為一個(gè)場)。這種方式尤其適合電視顯示器的物理特性。MPEG2 支持標(biāo)準(zhǔn)的電視分辨率,其中包括:針對(duì)美國和日本采用的 NTSC 制式隔行 720(480 分辨率,每秒 60 場,以及歐洲和其他國家采用的PAL 制式的 720(576 分辨率,每秒 50 場。 MPEG.2 建立在 MPEG.1 基礎(chǔ)之上,并具備擴(kuò)展功能,能支持隔行視頻及更寬的運(yùn)動(dòng)補(bǔ)償范圍。由于高分辨率視頻是非常重要的應(yīng)用,因此 MPEG.2 支持的搜索范圍遠(yuǎn)遠(yuǎn)大于 MPEG.1。與之前的標(biāo)準(zhǔn)相比,它顯著提高了運(yùn)動(dòng)估計(jì)的性能要求,并充分利用更寬搜索范圍與更高分辨率優(yōu)勢的編碼器需要比 H.261 和 MPEG.1 高得多的處理能力。MPEG2 中的隔行編碼工具包含優(yōu)化運(yùn)動(dòng)補(bǔ)償?shù)哪芰?,同時(shí)支持基于場和基于幀的預(yù)測,而且同時(shí)支持基于場和基于幀的 DCT/IDCT。MPEG.2 在 30:1 左右的壓縮比時(shí)運(yùn)行良好。MPEG.2 在 4.8Mbps 時(shí)達(dá)到的質(zhì)量適合消費(fèi)類視頻應(yīng)用,因此它很快在許多應(yīng)用中得到普及,如:數(shù)字衛(wèi)星電視、數(shù)字有線電視、DVD 以及后來的高清電視等。(4)MPEG.4支持逐行掃描和隔行掃描,是基于視頻對(duì)象的編碼標(biāo)準(zhǔn),通過對(duì)象識(shí)別提供了空間的可伸縮性;MPEG.4由ISO提出,以延續(xù) MPEG.2 的成功。一些早期的目標(biāo)包括:提高容錯(cuò)能力以支持無線網(wǎng)、對(duì)低比特率應(yīng)用進(jìn)行更好的支持、實(shí)現(xiàn)各種新工具以支持圖形對(duì)象及視頻之間的融合。大部分圖形功能并未在產(chǎn)品中受到重視,相關(guān)實(shí)施主要集中在改善低比特率壓縮及提高容錯(cuò)性上3 JPEG2000核心部分技術(shù)的研究3.1 預(yù)處理3.1.1 圖像片在編碼前,首先對(duì)源圖像進(jìn)行分割,分割成大小相等、相互不重疊的矩形塊tile(位于圖像邊緣的tile大小可以不同),這種分割有兩種作用:(1)以tile為基本單位獨(dú)立編碼,可以處理較大的圖像,且可節(jié)省存儲(chǔ)空間。(2)可在圖像特定位置截取出具有特定寬高比的重構(gòu)子圖。接下來,將每個(gè)tile看成是小的源圖像,分別進(jìn)行圖3.2所示的單獨(dú)編碼。碼率控制 熵編碼預(yù)處理分層組織嵌入式碼塊位流嵌入式碼塊編碼量化前向小波變換前向分量變換前向DC電平位移 圖3.1 JPEG 2000解碼器反向DC電平位移反向分量變換反向小波變換反向量化熵解碼 圖3.2 JPEG 2000解碼器3.1.2 DC移位在對(duì)每一圖像片進(jìn)行正向離散小波變換之前,都要進(jìn)行直流電平位移。目的是在解碼時(shí),能夠從有符號(hào)的數(shù)值中正確恢復(fù)重構(gòu)的無符號(hào)樣本值。直流電平位移是對(duì)僅有無符號(hào)數(shù)組成的圖像片的像素進(jìn)行的。如果無符號(hào)圖像用P位二進(jìn)制數(shù)表示,則對(duì)這些無符號(hào)分量樣本值減去Z的P.2次方,電平位移并不影響圖像的質(zhì)量。在解碼端,在離散小波反變換之后,對(duì)重構(gòu)的圖像進(jìn)行反向直流電平位移。3.2 圖象壓縮的性能評(píng)價(jià)3.2.1 圖象壓縮的基本概念在多媒體信息系統(tǒng)中,為了達(dá)到令人滿意的圖像、視頻畫面質(zhì)量和聽覺效果,必須解決視頻、圖像和音頻信號(hào)數(shù)據(jù)的大容量存儲(chǔ)和實(shí)時(shí)傳輸?shù)膯栴}。數(shù)字化的視頻、音頻信號(hào)的數(shù)據(jù)量是很大的,如果不進(jìn)行處理,計(jì)算機(jī)幾乎無法對(duì)它進(jìn)行存取和交換。而,另一方面,視頻、圖像和聲音這些媒體確實(shí)具有很大的壓縮潛力,數(shù)據(jù)的冗余很大。因此,在允許一定的失真的前提下,能夠?qū)D像進(jìn)行很大程度的壓縮。圖像壓縮編碼的目的是以盡量少的比特?cái)?shù)表征圖像,同時(shí)保持復(fù)原圖像的質(zhì)量,使它符合預(yù)定應(yīng)用場合的要求。通常把圖像壓縮的過程叫做編碼,圖像恢復(fù)的過程叫做解碼。圖像可以進(jìn)行壓縮主要是因?yàn)閳D像數(shù)據(jù)往往存在各種數(shù)據(jù)冗余。數(shù)據(jù)冗余是指圖像信息本身所固有的冗余。它不是一個(gè)抽象的概念,而是一個(gè)在數(shù)學(xué)上可以進(jìn)行量化的實(shí)體。信息論的鼻祖C.E.shannon早在1948年創(chuàng)立信息論的奠基性論文“通信的數(shù)學(xué)原理”中就提出了可以把數(shù)據(jù)看作是信息量和冗余度的組合這個(gè)基本原理。用I表示信息量,D表示數(shù)據(jù)量,Rd表示冗余量,則它們的關(guān)系可山下式給出:I=D.Rd,冗余的消除或減少是數(shù)據(jù)壓縮的一個(gè)基本依據(jù)和理論基礎(chǔ)。具體說來,圖像信息本身存在以下一些冗余(1)空間冗余這是靜態(tài)圖像中存在的一種最主要的數(shù)據(jù)冗余。一幅圖像記錄了畫面上可見景物的灰度值,而同一景物表面上各采樣點(diǎn)的灰度值之間往往存在著空間連貫性,即相鄰象素間的關(guān)聯(lián)會(huì)產(chǎn)生空間冗余。(2)時(shí)間冗余這是序列圖像中經(jīng)常包含的數(shù)據(jù)冗余。對(duì)于視頻圖像來說,相鄰幀之間的時(shí)間間隔很小。在1/25秒或1/30秒的幀間間隔內(nèi),運(yùn)動(dòng)部分的景物在畫面上的位移量很小或當(dāng)場景交替時(shí)整幅景物切換的概率極小。大多數(shù)象素點(diǎn)的亮度及色度信號(hào)幀間變化很小或基本上不變。圖像序列中前后兩幀圖像之間的時(shí)間相關(guān)性很大,這就產(chǎn)生了大量的數(shù)據(jù)冗余,稱為時(shí)間冗余。(3)視覺冗余人類視覺系統(tǒng)(Human Vision system,HVS)是由人眼和大腦皮層的一部分組成的。它實(shí)際上是一個(gè)高度復(fù)雜的圖像處理系統(tǒng)。由于人眼是圖像信息的最終接收者,因此進(jìn)行圖像壓縮時(shí)我們應(yīng)該而且必須考慮人眼的特性。通常人們總是假定視覺系統(tǒng)是線性的和均勻的,對(duì)于人眼視覺敏感和不敏感部分都同等對(duì)待,這必然會(huì)有許多冗余信息。事實(shí)上人類視覺的一般分辨能力為26灰度等級(jí),而一般圖像的量化采用的是28灰度等級(jí),即存在視覺冗余。有效利用HVS特性可以得到很高的圖像壓縮比和較好的圖像質(zhì)量。W.E.Glenn經(jīng)過分析認(rèn)為充分利用HVS特性能夠得到40.100倍靜止圖像壓縮比,對(duì)運(yùn)動(dòng)圖像則會(huì)更高,這是一個(gè)非常誘人的目標(biāo)。(4)信息熵冗余信息熵是信源的平均信息量。當(dāng)信源以等概率分布時(shí),熵取最大值。熵最大值與非等概率分布時(shí)熵值之間的差值就是信源含有的冗余度,我們稱之為信息熵冗余。這種冗余度寓于信源符號(hào)的非等概率分布之中的特性是數(shù)據(jù)壓縮的基本途徑和重要方法之一。設(shè)法改變信源的概率分布使其盡可能的不均勻以達(dá)到數(shù)據(jù)壓縮之目的,這是統(tǒng)計(jì)壓縮編碼的理論基礎(chǔ)。(5)結(jié)構(gòu)冗余有些圖像在較大的區(qū)域存在很強(qiáng)的紋理結(jié)構(gòu),如草席、紡織物的圖案等。如果已知這些紋理的分布模式,就可以通過某一過程生成圖像。(6)知識(shí)冗余對(duì)許多圖像的理解、分析、綜合與一些基礎(chǔ)知識(shí)相關(guān)。對(duì)于某些圖像內(nèi)容確定的特定場合,可由先驗(yàn)知識(shí)、背景知識(shí)一類規(guī)律化的結(jié)構(gòu),建立圖像景物模型。這類冗余稱為知識(shí)冗余。例如模型基編碼(Model.based decoding)用計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)的知識(shí),按照可視電話中圖像和景物的先驗(yàn)知識(shí),建立一定的模型,用圖像分析的方法,提取景物的參數(shù),通過圖像綜合。將參數(shù)和模型結(jié)合,獲得重建圖像。3.2.2 圖象壓縮的類型對(duì)圖像信息中不同冗余的利用,產(chǎn)生了不同的圖像壓縮方法。根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致進(jìn)行分類,圖像壓縮編碼方法大體上可分為兩類:無失真壓縮編碼和有失真壓縮編碼。無失真壓縮編碼無失真壓縮編碼又叫熵編碼。是指使用壓縮后的數(shù)據(jù)進(jìn)行解碼,解碼后的數(shù)據(jù)與原來的數(shù)據(jù)完全相同,無失真壓縮編碼算法刪除的僅僅是冗余信息,它用于重構(gòu)信號(hào)與原始信號(hào)完全一致的場合。例如為了傳送文本,在傳送之前采用Winzip等軟件進(jìn)行壓縮,這就是無損壓縮編碼。它將輸入圖像中表達(dá)象素點(diǎn)灰階的值的每個(gè)符號(hào),用規(guī)定的碼字符號(hào)按一定的方式編排而成。由于規(guī)定的碼字符比原圖像的符號(hào)短,從而可以用較少的比特?cái)?shù)表達(dá)原圖像的符號(hào),達(dá)到圖像壓縮的目的。在恢復(fù)圖像時(shí),只要把碼字符與象素點(diǎn)的灰階符號(hào)對(duì)應(yīng)起來,就可無失真地恢復(fù)圖像。例如一個(gè)靜態(tài)圖像A,由512x5I2 個(gè)象素組成,象素上的灰階用8比特字符表示,即有256 種可能的符號(hào)。如果我們分析每個(gè)符號(hào)出現(xiàn)的概率,把概率出現(xiàn)大的符號(hào)用比8比特短的碼字符表示(如2比特)。而概率出現(xiàn)少的符號(hào)用較長的碼字符表示(如10比特),這樣,平均每個(gè)碼字符長度(比特?cái)?shù))就比8比特小。但由于無失真壓縮技術(shù)在原理上大多采用概率統(tǒng)計(jì)編碼。因而一般對(duì)在內(nèi)容上重復(fù)較多的數(shù)據(jù)壓縮倍數(shù)較大,而對(duì)沒有重復(fù)或重復(fù)較小的數(shù)據(jù),壓縮倍數(shù)就較低。由于受到信源本身熵的限制(編碼輸出碼字的平均碼長,只能大于等于信源熵),無失真壓縮編碼不可能取得高的壓縮比,一般平均壓縮比在2:1一5:1之間。常見的無失真編碼方法有:行程編碼、哈夫曼編碼、算術(shù)編碼等。其中行程編碼技術(shù)相當(dāng)?shù)闹庇^和經(jīng)濟(jì),運(yùn)算也相當(dāng)簡單。它的基本的原理是:用一個(gè)符號(hào)值或串長代替具有相同值的連續(xù)符號(hào),使符號(hào)的長度少于原始數(shù)據(jù)的長度。它經(jīng)常用于二值圖像,可以得到良好的壓縮比。有失真壓縮編碼為了進(jìn)一步提高圖像編碼的壓縮比,通常采用有失真編碼方法。有失真編碼方法是指使用壓縮后的數(shù)據(jù)進(jìn)行解碼,解碼后的數(shù)據(jù)與原始數(shù)據(jù)有所不同,把不相干的信息也刪除了,但不影響人對(duì)原始資料表達(dá)信息的理解。因?yàn)槿祟愐曈X系統(tǒng)的特殊性,它接受信息的能力是有限的,對(duì)圖像中存在的許多“錯(cuò)誤”并不敏感。例如人眼不能分辨太高的灰度級(jí)和空間分辨率,對(duì)圖像中的某些信息損失并不能覺察。即使是記錄或顯示設(shè)備,也往往受本身特性限制,只能接受某種程度的信息量,而并不能全部接受,如電腦監(jiān)示器的灰度特性、空間分辨率都是有限的。此外,數(shù)字圖像是二維亮度函數(shù)通過采樣和量化而得到的,因此,準(zhǔn)確重構(gòu)是不必要的。下面簡單介紹一下預(yù)測編碼、變換編碼和量化編碼等方法。預(yù)測編碼預(yù)測編碼是根據(jù)圖像在幀內(nèi)和幀間的相關(guān)性以及人眼的視覺特性,利用前面一個(gè)或多個(gè)象素值來預(yù)測當(dāng)前值,然后對(duì)當(dāng)前值與預(yù)測值之差進(jìn)行編碼。預(yù)測編碼分為無失真預(yù)測編碼和有失真預(yù)測編碼。前者是指不對(duì)預(yù)測誤差進(jìn)行量化,不丟失任何有效信息;而后者則需對(duì)預(yù)測誤差進(jìn)行量化處理。差分脈沖編碼調(diào)制法(DPCM)是有失真預(yù)測編碼的典型代表。預(yù)測編碼的算法簡單,容易用硬件實(shí)現(xiàn),但是它對(duì)誤碼敏感,會(huì)產(chǎn)生誤碼擴(kuò)散,降低圖像質(zhì)量。變換編碼變換編碼是有失真編碼的一種重要的編碼類型。在變換編碼中,原始數(shù)據(jù)在初始空間域或時(shí)間域中進(jìn)行數(shù)學(xué)變換.使得信號(hào)中最重要的部分(例如包含大量能量的最重要的系數(shù))在變換域中易于識(shí)別,并且集中出現(xiàn),可以重點(diǎn)處理:相反使能量較小的部分較分散,可以進(jìn)行粗處理。數(shù)學(xué)家們己經(jīng)構(gòu)造了多種數(shù)學(xué)變換。例如離散傅里葉變換(DFT)、離散余弦變換(DCT),walsh.Hadamard變換、Karllunen一Loeev、變換(K.L變換)和小波變換(DWT)等。其中較為常用的是DCT變換和小波變換。在所有的正交變換中,K.L變換是最小均方誤差意義下的最佳變換,但由于K.L變換的基函數(shù)是與信源本身相關(guān)的,因此對(duì)每幅不同圖像都需要重新計(jì)算其基函數(shù),因而其空間和時(shí)間開銷很大,復(fù)雜度也最高。由子K一L變換的壓縮率比較高,誤差小,它通常作為各種變換編碼壓縮效果的比較標(biāo)準(zhǔn)。DCT是逼近于K.L變換的次最優(yōu)變換,由于它具有快速算法,因而得以廣泛的應(yīng)用。目前國際上己經(jīng)制定了基于DCT的靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG和運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)MPEG等。采用基于DCT方法的壓縮算法由于DCT本身的限制使得圖像的壓縮率有所限制,且沒有很好地利用人眼的視覺特性來對(duì)圖像進(jìn)行壓縮,因而在圖像壓縮方法上不是最優(yōu)的?;谛〔ㄗ儞Q的壓縮方法本質(zhì)上使用多尺度或多分辨率方法對(duì)圖像進(jìn)行分解。分解后圖像被分成了低頻分量、水平分量、垂直方向以及對(duì)角方向的高頻分量,然后利用人眼對(duì)對(duì)角方向的高頻分量、水平和垂直方向的高頻分量、低頻分量的靈敏度的依次增加來對(duì)圖像進(jìn)行壓縮。進(jìn)行多級(jí)分辨率分解后,數(shù)據(jù)量的取舍可以逐漸增大,因此獲得的壓縮比也會(huì)相應(yīng)的增大。由于小波變換本身的特性及其所具有的與人眼的視覺特性相結(jié)合的性質(zhì),使得小波變換在很多方面超過了離散余弦變換。目前正在推廣的JPEG2000和MPEG一4就將小波變換作為其內(nèi)核技術(shù)之一。量化編碼量化法是一種基于語義的編碼方法,是一種很有前景的方法。其基本思想是采用非線性量化器,即對(duì)空間頻率及能量分布較大的系數(shù)分配較多比特?cái)?shù),也就是采用較小的量化步長:反之則分配較少的比特?cái)?shù),即采用較大的量化步長從而達(dá)到壓縮的目的。量化包括標(biāo)量量化和矢量量化。Shannon率失真理論指出,即使對(duì)無記憶信源,矢量量化編碼總優(yōu)于標(biāo)量量化編碼。但矢量量化編碼的計(jì)算量較大,且設(shè)計(jì)起來也較標(biāo)量量化編碼復(fù)雜。3.3 圖象質(zhì)量的判斷標(biāo)準(zhǔn)正確評(píng)價(jià)一種圖像壓縮方法,對(duì)衡量該方法的優(yōu)劣來講是至關(guān)重要的。它有三個(gè)關(guān)鍵指標(biāo):壓縮比、解碼圖像質(zhì)量、壓縮和解壓的速度,除此之外還可以考慮壓縮算法所需要的軟件和硬件開銷。3.3.1 壓縮比壓縮性能常用壓縮比來定義,也就是壓縮過程中輸入數(shù)據(jù)和輸出數(shù)據(jù)量之比。值得注意的是,這種度量方法必須指明輸出的顯示形式,否則就將是不可靠的。一種衡量壓縮比的更科學(xué)的方法是確定壓縮前后每個(gè)象素所需的位。3.3.2 解碼圖象質(zhì)量圖像質(zhì)量可分為圖像逼真度和圖像可理解度。前者表示復(fù)原圖像、被處理或被評(píng)價(jià)圖像相對(duì)于原始圖像的偏離程度。是指二者之間的精細(xì)差別。后者表示人或機(jī)器從圖像中提取相關(guān)信息的能力,一般指處理圖像與原始圖像的大體差別。對(duì)無損壓縮不必?fù)?dān)心圖像的質(zhì)量。對(duì)有損壓縮得到的解碼圖像質(zhì)量評(píng)價(jià)可分為客觀評(píng)價(jià)(Objective Assessment)和主觀評(píng)價(jià)(subjective,Assessment)。由于至今對(duì)人類視覺系統(tǒng)的理解和認(rèn)識(shí)仍十分有限,因而一些客觀評(píng)價(jià)標(biāo)準(zhǔn)雖經(jīng)常使用,但最具權(quán)威性的還是主觀評(píng)價(jià)方法。(1) 圖像質(zhì)量的客觀評(píng)價(jià)目前常用的有以下幾個(gè)指標(biāo): 均方誤差(Mean square error,MSN): (2.1) 信噪比: (2.2) 峰值信噪比: (2.3)其中,為原始圖像信息序列,為重建圖像信號(hào),為的 (2.4) (2.5)(2) 圖像質(zhì)量的主觀評(píng)價(jià)圖像質(zhì)量的主觀評(píng)價(jià)是以人作為圖像的觀察者,對(duì)圖像質(zhì)量優(yōu)劣做出主觀評(píng)定。這是目前普遍采用的方法。主觀評(píng)價(jià)所得到的圖像質(zhì)量與觀察者的特性、經(jīng)驗(yàn)、愛好有關(guān),也與被評(píng)價(jià)的圖像內(nèi)容及觀察環(huán)境、條件有關(guān)。測試和觀察條件應(yīng)盡可能與使用條件相匹配。為保證主觀評(píng)價(jià)在統(tǒng)計(jì)上的意義,參與評(píng)分的觀察者不得少于20 名。這些觀察者分為兩類:一類是末經(jīng)訓(xùn)練的“外行”觀察者,一類是訓(xùn)練有素的“內(nèi)行”。“內(nèi)行”是指對(duì)圖像技術(shù)有一定經(jīng)驗(yàn)的人,能對(duì)圖像質(zhì)量提出嚴(yán)格甚至苛刻的判斷,對(duì)一般人易于忽視的某些細(xì)小的變化,他們卻易發(fā)現(xiàn)。主觀評(píng)價(jià)分為絕對(duì)評(píng)價(jià)和相對(duì)評(píng)價(jià)二種。評(píng)價(jià)常用的尺度稱為“全優(yōu)度尺度,對(duì)一般人而言,多用質(zhì)量尺度,對(duì)圖像的優(yōu)劣分等級(jí)以數(shù)字評(píng)分。全優(yōu)度尺度對(duì)專業(yè)人員以采用損傷尺度為宜,如下表3.1表3.1 圖像質(zhì)量的絕對(duì)評(píng)價(jià)相對(duì)評(píng)價(jià)相對(duì)評(píng)價(jià)是出現(xiàn)觀察者將一批圖像有好至壞進(jìn)行分類,對(duì)圖像進(jìn)行相互比較,得出好壞,進(jìn)行評(píng)分。在圖像處理中,往往用于多種處理方法的比較。如表3.2所示表3.2 圖像質(zhì)量的相對(duì)評(píng)價(jià)主觀評(píng)價(jià)結(jié)果可表示為平均意見的分?jǐn)?shù),它有下列式表示:,其中Ck為圖像屬于k類的分?jǐn)?shù),nk為判定該圖像屬于k類的人數(shù),分子為圖像所得總分,分母為觀察者總數(shù)。(3) 壓縮和解壓縮的速度人們總希望壓縮解壓縮速度越快越好。在許多應(yīng)用中,壓縮和解壓縮將在不同的時(shí)間、不同的地點(diǎn)、不同的系統(tǒng)中進(jìn)行,因而必須分別評(píng)價(jià)壓縮和解壓縮速度。在靜態(tài)圖像中,壓縮速度沒有解壓速度要求嚴(yán)格。處理速度只需比用戶能夠忍受的等待時(shí)倒快一些即可。但對(duì)于動(dòng)態(tài)視頻的壓縮與解壓縮,速度問題是重要的。動(dòng)態(tài)視頻為保證動(dòng)作變化的連貫要求,必須有較高的幀率。對(duì)于大多數(shù)情況來說至少要15幀/秒,而全動(dòng)態(tài)視頻則要求有25幀/秒或30幀/秒。在電話線上傳送視頻,因?yàn)槭艿骄€路傳輸速率的限制,幀率沒有這么高,但也要達(dá)到5幀/秒,否則動(dòng)態(tài)圖像就會(huì)產(chǎn)生跳動(dòng)感,使人難以接受。(4) 軟件和硬件的開銷有些數(shù)據(jù)的壓縮和解壓縮可以在標(biāo)準(zhǔn)的PC硬件上用軟件實(shí)現(xiàn),有些則因?yàn)樗惴ㄌ珡?fù)雜或者質(zhì)量要求太高而必須采用專門的硬件。這就需要在占用PC上的計(jì)算機(jī)資源或者另外使用專門硬件的問題上做出選擇。從上面的分析研究中,我們可以理解了圖像壓縮的基本的概念,分析了圖像本身和人類視覺系統(tǒng)所產(chǎn)生的視覺冗余,從而說明圖像壓縮的可能性。下面我們對(duì)傳統(tǒng)的JPEG壓縮過程進(jìn)行分析和研究。3.4 核心處理3.4.1 小波變換小波變換具有對(duì)信號(hào)進(jìn)行多分辨率分析和反映信號(hào)局部特征的特點(diǎn)。通過對(duì)圖像片進(jìn)行離散小波變換,得到小波系數(shù)圖像,小波系數(shù)圖像由幾種子帶系數(shù)圖像組成,不同子帶的小波系數(shù)反映圖像片不同空間分辨率的特性。通過多級(jí)小波分解,小波系數(shù)既能表示圖像片中局部區(qū)域的高頻信息(如圖像邊緣),也能表示圖像片中的低頻信息(如圖像背景)。因此通過對(duì)系數(shù)圖像的不同級(jí)數(shù)進(jìn)行解碼,就可以得到具有不同空間分辨率的圖像。在編碼系統(tǒng)中,對(duì)每個(gè)圖像片進(jìn)行M山at塔式小波分解。JPEG2000編碼系統(tǒng)選擇兩種小波濾波器:Daubeehiesg/7或整數(shù)Daubeehioss/3。9/7濾波器(浮點(diǎn)數(shù))主要用于高質(zhì)量壓縮,短整數(shù)5/3濾波器通過整數(shù)算法和可逆DWT實(shí)現(xiàn)無損壓縮。3.4.2 量化量化的關(guān)鍵是根據(jù)變換后圖像的特征、重構(gòu)圖像質(zhì)量要求等因素設(shè)計(jì)合理的量化步長。量化操作是有損的,會(huì)產(chǎn)生量化誤差。不過一種情況除外,那就是量化步長是1,并且小波系數(shù)都是整數(shù),利用可恢復(fù)整數(shù)5/3拍小波濾波器進(jìn)行小波變換得到的結(jié)果就符合這種情況JPEG2000核心系統(tǒng)采用恒域標(biāo)量量化,恒域?qū)挾仁瞧渌麉^(qū)間的兩倍,為的是獲得最理想的嵌人結(jié)構(gòu)使SNR飛可伸縮。在JPEG2000標(biāo)準(zhǔn)中,對(duì)每一個(gè)子帶可以有不同的量化步長。但是在一個(gè)子帶中只有一個(gè)量化步長。量化以后,每一個(gè)小波系數(shù)有兩部分來表示:符號(hào)和幅值。一次子帶分解可生成低通和高通兩個(gè)子帶,形成編碼對(duì)象的變換系數(shù)。由于在一次子帶分解后被抽取成1/2,所以,變換系數(shù)的總和與原來采樣數(shù)目相同。但信息內(nèi)容卻集中在對(duì)應(yīng)于低頻子帶的系數(shù),減少該子帶系數(shù)精度的處理就是量化。在對(duì)圖像進(jìn)行壓縮編碼時(shí),通過量化處理可以進(jìn)一步提高圖像壓縮效率。當(dāng)然,這部分壓縮效率的提高是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論