




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
多媒體圖像壓縮技術(shù)摘要:多媒體數(shù)據(jù)壓縮技術(shù)是現(xiàn)代網(wǎng)絡(luò)發(fā)展的關(guān)鍵性技術(shù)之一。由于圖像和聲音信號中存在各種各樣的冗余,為數(shù)據(jù)壓縮提供了可能。數(shù)據(jù)壓縮技術(shù)有無損壓和有損壓縮兩大類,這些壓縮技術(shù)又各有不同的標準。一、多媒體數(shù)據(jù)壓縮技術(shù)仙農(nóng)(C.E.Shannon)在創(chuàng)立信息論時,提出把數(shù)據(jù)看作是信息和冗余度的組合。早期的數(shù)據(jù)壓縮之所以成為信息論的一部分是因為它涉及冗余度問題。而數(shù)據(jù)之所以能夠被壓縮是因為其中存在各種各樣的冗余;其中有時間冗余性、空間冗余性、信息熵冗余、先驗知識冗余、其它冗余等。時間冗余是語音和序列圖像中常見的冗余,運動圖像中前后兩幀間就存在很強的相關(guān)性,利用幀間運動補興就可以將圖像數(shù)據(jù)的速率大大壓縮。語音也是這樣。尤其是濁音段,在相當長的時間內(nèi)(幾到幾十毫秒)語音信號都表現(xiàn)出很強的周期性,可以利用線性預(yù)測的方法得到較高的壓縮比??臻g冗余是用來表示圖像數(shù)據(jù)中存在的某種空間上的規(guī)則性,如大面積的均勻背景中就有很大的空間冗余性。信息熵冗余是指在信源的符號表示過程中由于未遵循信息論意義下最優(yōu)編碼而造成的冗余性,這種冗余性可以通過熵編碼來進行壓縮,經(jīng)常使用的如Huff-man編碼。先驗知識冗余是指數(shù)據(jù)的理解與先驗知識有相當大的關(guān)系,如當收信方知道一個單詞的前幾個字母為administrato時,立刻就可以猜到最后一個字母為r,那么在這種情況下,最后一個字母就不帶任何信息量了,這就是一種先驗知識冗余。其它冗余是指那些主觀無法感受到的信息等帶來的冗余。通常數(shù)據(jù)壓縮技術(shù)可分為無損壓縮(又叫冗余壓縮)和有損壓縮(又叫熵壓縮)兩大類。無損壓縮就是把數(shù)據(jù)中的冗余去掉或減少,但這些冗余量是可以重新插入到數(shù)據(jù)中的,因而不會產(chǎn)生失真。該方法一般用于文本數(shù)據(jù)的壓縮,它可以保證完全地恢復(fù)原始數(shù)據(jù);其缺點是壓縮比小(其壓縮比一般為2:1至5:1)。有損壓縮是對熵進行壓縮,因而存在一定程度的失真;它主要用于對聲音、圖像、動態(tài)視頻等數(shù)據(jù)進行壓縮,壓縮比較高(其壓縮比一般高達20:1以上。最新被稱為“E—igen—ID”的壓縮技術(shù)可將基因數(shù)據(jù)壓縮1.5億倍)。對于多媒體圖像采用的有損壓縮的標準有靜態(tài)圖像壓縮標準(JPEG標準,即‘JointPhotographicExpertGroup’標準)和動態(tài)圖像壓縮標準(MPEG標準,即‘MovingPictureExpertGroup’標準)。PEG利用了人眼的心理和生理特征及其局限性來對彩色的、單色的和多灰度連續(xù)色調(diào)的、靜態(tài)圖像的、數(shù)字圖像的壓縮,因此它非常適合不太復(fù)雜的以及一般來源于真實景物的圖像。它定義了兩種基本的壓縮算法:一種是基于有失真的壓縮算法,另一種是基于空間線性預(yù)測技術(shù)(DPCM)無失真的壓縮算法。為了滿足各種需要,它制定了四種工作模式:無失真壓縮、基于DCT的順序工作方式、累進工作方式和分層工作方式。MPEG用于活動影像的壓縮。MPEG標準具體包三部分內(nèi)容:(1)MPEG視頻、(2)MPEG音頻、(3)MP系統(tǒng)(視頻和音頻的同步)。MPEG視頻是標準的核心分,它采用了幀內(nèi)和幀間相結(jié)合的壓縮方法,以離散余變換(DCT)和運動補償兩項技術(shù)為基礎(chǔ),在圖像質(zhì)量基不變的情況下,MPEG可把圖像壓縮至1/100或更MPEG音頻壓縮算法則是根據(jù)人耳屏蔽濾波功能。利用音響心理學(xué)的基本原理,即“某些頻率的音響在重放其頻率的音頻時聽不到”這樣一個特性,將那些人耳完全不到或基本上聽到的多余音頻信號壓縮掉,最后使音頻號的壓縮比達到8:1或更高,音質(zhì)逼真,與CD唱片可媲美。按照MPEG標準,MPEG數(shù)據(jù)流包含系統(tǒng)層和壓層數(shù)據(jù)。系統(tǒng)層含有定時信號,圖像和聲音的同步、多分配等信息。壓縮層包含經(jīng)壓縮后的實際的圖像和聲數(shù)據(jù),該數(shù)據(jù)流將視頻、音頻信號復(fù)合及同步后,其數(shù)據(jù)輸率為1.5MB/s。其中壓縮圖像數(shù)據(jù)傳輸率為1.2M壓縮聲音傳輸率為0.2MB/s。MPEG標準的發(fā)展經(jīng)歷了MPEG—I,MPEG一2、MPEG一4、MPEG-7、MPEG一21等不同層次。在MPEG的不同標準中,每—個標準都是建立在前面的標準之上的,并與前面的標準向后的兼容。目前在圖像壓縮中,應(yīng)用得較多的是MPEG一4標準,MPEG-是在MPEG-2基礎(chǔ)上作了很大的擴充,主要目標是多媒體應(yīng)用。在MPEG一2標準中,我們的觀念是單幅圖像,而且包含了一幅圖像的全部元素。在MPEG一4標準下,我們的觀念變?yōu)槎鄨D像元素,其中的每—個多圖像元素都是獨立編碼處理的。該標準包含了為接收器所用的指令,告訴接收器如何構(gòu)成最終的圖像。每個解碼緩沖器只接收屬于它自己的靈敏據(jù)流,并轉(zhuǎn)送給解碼器。復(fù)合存儲器完成圖像元素的存儲,并將它們送到顯示器的恰當位置。音頻的情況也是這樣,但顯然不同點是要求同時提供所有的元素。數(shù)據(jù)上的時間標記保證這些元素在時間上能正確同步。MPEG一4標準對自然元素(實物圖像)和合成元素進行區(qū)分和規(guī)定,計算機生成的動畫是合成元素的一個例子。比如,一幅完整的圖像可以包含一幅實際的背景圖,并在前面有一幅動畫或者有另外一幅自然圖像。這樣的每一幅圖像都可以作最佳壓縮,并互相獨立地傳送到接收器,接收器知道如何把這些元素組合在一起。在MPEG一2標準中,圖像被看作一個整體來壓縮;而在MPEG一4標準下,對圖像中的每一個元素進行優(yōu)化壓縮。靜止的背景不必壓縮到以后的I幀之中去,否則會使帶寬的使用變得很緊張。而如果這個背景圖像靜止10秒鐘,就只要傳送一次(假設(shè)我們不必擔心有人在該時間內(nèi)切人此頻道),需要不斷傳送的僅是前臺的比較小的圖像元素。對有些節(jié)目類型,這樣做會節(jié)省大量的帶寬。MPEG一4標準對音頻的處理也是相同的。例如,有一位獨唱演員,伴隨有電子合成器,在MPEG一2標準下,我們必須先把獨唱和合成器作混合,然后再對合成的音頻信號進行壓縮與傳送。在MPEG一4標準下,我們可以對獨唱作單獨壓縮,然后再傳送樂器數(shù)字接口的聲軌信號,就可以使接收器重建伴音。當然,接收器必須能支持MIDI放音。與傳送合成的信號相比,分別傳送獨唱信號和MIDI數(shù)據(jù)要節(jié)省大量的帶寬。其它的節(jié)目類型同樣可以作類似的規(guī)定。MPEG一7標準又叫多媒體內(nèi)容描述接口標準。圖像可以用色彩、紋理、形狀、運動等參數(shù)來描述,MPEG一7標準是依靠眾多的參數(shù)對圖像與聲音實現(xiàn)分類,并對它們的數(shù)據(jù)庫實現(xiàn)查詢。二、多媒體數(shù)據(jù)壓縮技術(shù)的實現(xiàn)方法目前多媒體壓縮技術(shù)的實現(xiàn)方法已有近百種,其中基于信源理論編碼的壓縮方法、離散余弦變換(DCT)和小波分解技術(shù)壓縮算法的研究更具有代表性。小波技術(shù)突破了傳統(tǒng)壓縮方法的局限性,引入了局部和全局相關(guān)去冗余的新思想,具有較大的潛力,因此近幾年來吸引了眾多的研究者。在小波壓縮技術(shù)中,一幅圖像可以被分解為若干個叫做“小片”的區(qū)域;在每個小片中,圖像經(jīng)濾波后被分解成若干個低頻與高頻分量。低頻分量可以用不同的分辨率進行量化,即圖像的低頻部分需要許多的二進制位,以改善圖像重構(gòu)時的信噪比。低頻元素采用精細量化,高頻分量可以量化得比較粗糙,因為你不太容易看到變化區(qū)域的噪聲與誤差。此外,碎片技術(shù)已經(jīng)作為一種壓縮方法被提出,這種技術(shù)依靠實際圖形的重復(fù)特性。用碎片技術(shù)壓縮圖像時需要占用大量的計算機資源,但可以獲得很好的結(jié)果。借助于從DNA序列研究中發(fā)展出來的模式識別技術(shù),能減少通過WAN鏈路的流量,最多時的壓縮比率能達到90%,從而為網(wǎng)絡(luò)傳送圖像和聲音提供更大的壓縮比,減輕風絡(luò)負荷,更好地實現(xiàn)網(wǎng)絡(luò)信息傳播。三、壓縮原理由于圖像數(shù)據(jù)之間存在著一定的冗余,所以使得數(shù)據(jù)的壓縮成為可能。信息論的創(chuàng)始人Shannon提出把數(shù)據(jù)看作是信息和冗余度(redundancy)的組合。所謂冗余度,是由于一副圖像的各像素之間存在著很大的相關(guān)性,可利用一些編碼的方法刪去它們,從而達到減少冗余壓縮數(shù)據(jù)的目的。為了去掉數(shù)據(jù)中的冗余,常常要考慮信號源的統(tǒng)計特性,或建立信號源的統(tǒng)計模型。圖像的冗余包括以下幾種:(1)空間冗余:像素點之間的相關(guān)性。(2)時間冗余:活動圖像的兩個連續(xù)幀之間的冗余。(3)信息熵冗余:單位信息量大于其熵。(4)結(jié)構(gòu)冗余:圖像的區(qū)域上存在非常強的紋理結(jié)構(gòu)。(5)知識冗余:有固定的結(jié)構(gòu),如人的頭像。(6)視覺冗余:某些圖像的失真是人眼不易覺察的。對數(shù)字圖像進行壓縮通常利用兩個基本原理(1)數(shù)字圖像的相關(guān)性。在圖像的同一行相鄰像素之間、活動圖像的相鄰幀的對應(yīng)像素之間往往存在很強的相關(guān)性,去除或減少這些相關(guān)性,也就去除或減少圖像信息中的冗余度,即實現(xiàn)了對數(shù)字圖像的壓縮。(2)人的視覺心理特征。人的視覺對于邊緣急劇變化不敏感(視覺掩蓋效應(yīng)),對顏色分辨力弱,利用這些特征可以在相應(yīng)部分適當降低編碼精度,而使人從視覺上并不感覺到圖像質(zhì)量的下降,從而達到對數(shù)字圖像壓縮的目的。編碼壓縮方法有許多種,從不同的角度出發(fā)有不同的分類方法,比如從信息論角度出發(fā)可分為兩大類:(1)冗余度壓縮方法,也稱無損壓縮,信息保持編碼或熵編碼。具體講就是解碼圖像和壓縮編碼前的圖像嚴格相同,沒有失真,從數(shù)學(xué)上講是一種可逆運算。(2)信息量壓縮方法,也稱有損壓縮,失真度編碼或熵壓縮編碼。也就是講解碼圖像和原始圖像是有差別的,允許有一定的失真。應(yīng)用在多媒體中的圖像壓縮編碼方法,從壓縮編碼算法原理上可以分類為:(1)無損壓縮編碼種類?哈夫曼編碼?算術(shù)編碼?行程編碼?Lempelzev編碼(2)有損壓縮編碼種類?預(yù)測編碼:DPCM,運動補償?頻率域方法:正文變換編碼(如DCT),子帶編碼?空間域方法:統(tǒng)計分塊編碼?模型方法:分形編碼,模型基編碼?基于重要性:濾波,子采樣,比特分配,矢量量化(3)混合編碼?JBIG,H261,JPEG,MPEG等技術(shù)標準衡量一個壓縮編碼方法優(yōu)劣的重要指標(1)壓縮比要高,有幾倍、幾十倍,也有幾百乃至幾千倍;(2)壓縮與解壓縮要快,算法要簡單,硬件實現(xiàn)容易;(3)解壓縮的圖像質(zhì)量要好。四、JPEG圖像壓縮算法1..JPEG壓縮過程JPEG壓縮分四個步驟實現(xiàn):1.顏色模式轉(zhuǎn)換及采樣;2.DCT變換;3.量化;4.編碼。2.1.顏色模式轉(zhuǎn)換及采樣RGB色彩系統(tǒng)是我們最常用的表示顏色的方式。JPEG采用的是YCbCr色彩系統(tǒng)。想要用JPEG基本壓縮法處理全彩色圖像,得先把RGB顏色模式圖像數(shù)據(jù),轉(zhuǎn)換為YCbCr顏色模式的數(shù)據(jù)。Y代表亮度,Cb和Cr則代表色度、飽和度。通過下列計算公式可完成數(shù)據(jù)轉(zhuǎn)換。Y=0.2990R+0.5870G+0.1140BCb=-0.1687R-0.3313G+0.5000B+128Cr=0.5000R-0.4187G-0.0813B+128人類的眼晴對低頻的數(shù)據(jù)比對高頻的數(shù)據(jù)具有更高的敏感度,事實上,人類的眼睛對亮度的改變也比對色彩的改變要敏感得多,也就是說Y成份的數(shù)據(jù)是比較重要的。既然Cb成份和Cr成份的數(shù)據(jù)比較相對不重要,就可以只取部分數(shù)據(jù)來處理。以增加壓縮的比例。JPEG通常有兩種采樣方式:YUV411和YUV422,它們所代表的意義是Y、Cb和Cr三個成份的資料取樣比例。2.2.DCT變換DCT變換的全稱是離散余弦變換(DiscreteCosineTransform),是指將一組光強數(shù)據(jù)轉(zhuǎn)換成頻率數(shù)據(jù),以便得知強度變化的情形。若對高頻的數(shù)據(jù)做些修飾,再轉(zhuǎn)回原來形式的數(shù)據(jù)時,顯然與原始數(shù)據(jù)有些差異,但是人類的眼睛卻是不容易辨認出來。壓縮時,將原始圖像數(shù)據(jù)分成8*8數(shù)據(jù)單元矩陣,例如亮度值的第一個矩陣內(nèi)容如下:JPEG將整個亮度矩陣與色度Cb矩陣,飽和度Cr矩陣,視為一個基本單元稱作MCU。每個MCU所包含的矩陣數(shù)量不得超過10個。例如,行和列采樣的比例皆為4:2:2,則每個MCU將包含四個亮度矩陣,一個色度矩陣及一個飽和度矩陣。當圖像數(shù)據(jù)分成一個8*8矩陣后,還必須將每個數(shù)值減去128,然后一一代入DCT變換公式中,即可達到DCT變換的目的。圖像數(shù)據(jù)值必須減去128,是因為DCT轉(zhuǎn)換公式所接受的數(shù)字范圍是在-128到+127之間。
DCT變換公式:x,y代表圖像數(shù)據(jù)矩陣內(nèi)某個數(shù)值的坐標位置f(x,y)代表圖像數(shù)據(jù)矩陣內(nèi)的數(shù)個數(shù)值u,v代表DCT變換后矩陣內(nèi)某個數(shù)值的坐標位置F(u,v)代表DCT變換后矩陣內(nèi)的某個數(shù)值u=0且v=0c(u)c(v)=1/1.414u>0或v>0c(u)c(v)=1
經(jīng)過DCT變換后的矩陣數(shù)據(jù)自然數(shù)為頻率系數(shù),這些系數(shù)以F(0,0)的值最大,稱為DC,其余的63個頻率系數(shù)則多半是一些接近于0的正負浮點數(shù),一概稱之為AC。
3.3、量化圖像數(shù)據(jù)轉(zhuǎn)換為頻率系數(shù)后,還得接受一項量化程序,才能進入編碼階段。量化階段需要兩個8*8矩陣數(shù)據(jù),一個是專門處理亮度的頻率系數(shù),另一個則是針對色度的頻率系數(shù),將頻率系數(shù)除以量化矩陣的值,取得與商數(shù)最近的整數(shù),即完成量化。當頻率系數(shù)經(jīng)過量化后,將頻率系數(shù)由浮點數(shù)轉(zhuǎn)變?yōu)檎麛?shù),這才便于執(zhí)行最后的編碼。不過,經(jīng)過量化階段后,所有數(shù)據(jù)只保留整數(shù)近似值,也就再度損失了一些數(shù)據(jù)內(nèi)容,JPEG提供的量化表如下:2.4、編碼Huffman編碼無專利權(quán)問題,成為JPEG最常用的編碼方式,Huffman編碼通常是以完整的MCU來進行的。編碼時,每個矩陣數(shù)據(jù)的DC值與63個AC值,將分別使用不同的Huffman編碼表,而亮度與色度也需要不同的Huffman編碼表,所以一共需要四個編碼表,才能順利地完成JPEG編碼工作。DC編碼DC是彩采用差值脈沖編碼調(diào)制的差值編碼法,也就是在同一個圖像分量中取得每個DC值與前一個DC值的差值來編碼。DC采用差值脈沖編碼的主要原因是由于在連續(xù)色調(diào)的圖像中,其差值多半比原值小,對差值進行編碼所需的位數(shù),會比對原值進行編碼所需的位數(shù)少許多。例如差值為5,它的二進制表示值為101,如果差值為-5,則先改為正整數(shù)5,再將其二進制轉(zhuǎn)換成1的補碼即可。所謂1的補碼,就是將每個Bit若值為0,便改成1;Bit為1,則變成0。差值5應(yīng)保留的位數(shù)為3,下表即列出差值所應(yīng)保留的Bit數(shù)與差值內(nèi)容的對照。在差值前端另外加入一些差值的霍夫曼碼值,例如亮度差值為5(101)的位數(shù)為3,則霍夫曼碼值應(yīng)該是100,兩者連接在一起即為100101。下列兩份表格
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商務(wù)公寓改造合同
- 2025年鎮(zhèn)流器塑料外殼行業(yè)深度研究分析報告
- 八年級物理蘇科版下冊《8.1力彈力》教學(xué)設(shè)計教案
- 2025年度林業(yè)苗木種植賠償協(xié)議
- 2025年紙品項目可行性研究報告
- 社區(qū)商業(yè)活動組織與執(zhí)行策略
- 2025年度金融風險管理師聘用合同
- 2025年度城鄉(xiāng)居民先診療后付費醫(yī)療保障協(xié)議
- 科技企業(yè)的知識產(chǎn)權(quán)管理與競爭策略
- 2025年度酒店式公寓租賃合同租金調(diào)整及家具配置補充協(xié)議
- 天然氣脫硫完整版本
- 2025年中國電子煙行業(yè)發(fā)展前景與投資戰(zhàn)略規(guī)劃分析報告
- 貨物學(xué)基礎(chǔ) 課件 項目一 任務(wù)一 貨物的基本概念
- 無人機法律法規(guī)與安全飛行 第2版空域管理
- 我的小學(xué)生活
- 團會:紀念一二九運動
- 《商務(wù)溝通-策略、方法與案例》課件 第三章 書面溝通
- 2024具身大模型關(guān)鍵技術(shù)與應(yīng)用報告-哈爾濱工業(yè)大學(xué)
- 提高瓦屋面太陽能板安裝一次驗收合格率
- 2024上海市房屋租賃合同范本下載
- 安徽省六安市裕安區(qū)六安市獨山中學(xué)2024-2025學(xué)年高一上學(xué)期11月期中生物試題(含答案)
評論
0/150
提交評論