第8章-數(shù)字圖像壓縮編碼_第1頁
第8章-數(shù)字圖像壓縮編碼_第2頁
第8章-數(shù)字圖像壓縮編碼_第3頁
第8章-數(shù)字圖像壓縮編碼_第4頁
第8章-數(shù)字圖像壓縮編碼_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

多媒體通信北京科技大學楊揚第8章圖像壓縮編碼圖像數(shù)據(jù)壓縮基礎(chǔ)圖像壓縮編碼算法靜態(tài)圖像壓縮標準動態(tài)圖像壓縮標準H.26X標準1、圖像數(shù)據(jù)壓縮基礎(chǔ)色彩的基本概念彩色空間及其變換圖像數(shù)據(jù)壓縮的可能性1.1色彩的基本概念從人的視覺系統(tǒng)看,色彩可用色調(diào)、飽和度和亮度來描述。人眼看到的任一彩色光都是這三個特性的綜合效果,這三個特性可以說是色彩的三要素。其中:色調(diào)與光波的波長有直接關(guān)系;亮度和飽和度與光波的幅度有關(guān)。1.1色彩的基本概念—色調(diào)繪畫中要求有固定的色彩感覺,有統(tǒng)一的色調(diào),否則難以表現(xiàn)畫面的情調(diào)和主題。例如我們說一幅畫具紅色調(diào),是指它在色彩上總體偏紅。計算機在圖像處理上采用數(shù)字化,可以非常精確地表現(xiàn)色彩的變化,色調(diào)是相對連續(xù)變化的。用一個圓環(huán)來表現(xiàn)色譜的變化,就構(gòu)成了一個色彩連續(xù)變化的色環(huán)。1.1色彩的基本概念—亮度亮度可以說是指各種純正的色彩相互比較所產(chǎn)生的明暗差別。在純正光譜中,黃色的明度最高,顯得最亮;其次是橙、綠;再其次是紅、藍;紫色明度最低,顯得最暗。1.1色彩的基本概念—飽和度飽和度是指顏色色調(diào)的表現(xiàn)程度。飽和度越高,色彩越艷麗、越鮮明突出,越能發(fā)揮其色彩的固有特性。但飽和度高的色彩容易讓人感到單調(diào)刺眼。飽和度低,色感比較柔和協(xié)調(diào),可混色太雜則容易讓人感覺渾濁,色調(diào)顯得灰暗。對于同一色調(diào)的彩色光,飽和度越深,顏色越鮮明或說越純,相反則越淡。1.1色彩的基本概念視覺系統(tǒng)對顏色和亮度的響應(yīng)特性1.1色彩的基本概念—圖像深度與色彩類型圖像深度是指位圖中記錄每個像素點所占的位數(shù),它決定了彩色圖像中可出現(xiàn)的最多顏色數(shù),或者灰度圖像中的最大灰度等級數(shù)。

每個像素點的圖像深度的分配還與圖像所用的色彩空間有關(guān)。以最常用的RGB色彩空間為例,圖像深度與色彩的映射關(guān)系主要有真彩色、偽彩色和調(diào)配色。1.1色彩的基本概念—圖像深度與色彩類型真彩色(true-color)是指圖像中的每個像素值都分成R、G、B三個基色分量,每個基色分量直接決定其基色的強度,這樣產(chǎn)生的色彩稱為真彩色。例如圖像深度為24,用R:G:B=8:8:8來表示色彩,則R、G、B各占用8位來表示各自基色分量的強度,每個基色分量的強度等級為28=256種。圖像可容納224=16M種色彩。這樣得到的色彩可以反映原圖的真實色彩,故稱真彩色。1.1色彩的基本概念—圖像深度與色彩類型偽彩色(pseudo-color)圖像的每個像素值實際上是一個索引值或代碼,該代碼值作為色彩查找表CLUT(ColorLook-UpTable)中某一項的入口地址,根據(jù)該地址可查找出包含實際R、G、B的強度值。用這種方式產(chǎn)生的色彩本身是真的,不過它不一定反映原圖的色彩。在VGA顯示系統(tǒng)中,調(diào)色板就相當于色彩查找表。從16色標準VGA調(diào)色板的定義可以看出這種偽彩色的工作方式。1.1色彩的基本概念—圖像深度與色彩類型調(diào)配色(direct-color)的獲取是通過每個像素點的R、G、B分量分別作為單獨的索引值進行變換,經(jīng)相應(yīng)的色彩變換表找出各自的基色強度,用變換后的R、G、B強度值產(chǎn)生的色彩。1.2圖像編碼概述能夠?qū)Χ嗝襟w數(shù)據(jù)進行壓縮編碼的前提是因為數(shù)據(jù)存在大量的冗余,尤其是聲音和圖像。數(shù)據(jù)壓縮的目的就是盡可能消除這些冗余。冗余一般分以下幾類:統(tǒng)計冗余(空間冗余和時間冗余)信息熵冗余結(jié)構(gòu)冗余知識冗余視覺冗余1.2圖像編碼概述—統(tǒng)計冗余圖像數(shù)據(jù)存在大量的統(tǒng)計特征的重復,這種重復包括靜態(tài)單幀圖像數(shù)據(jù)在空間上的冗余和音頻、視頻數(shù)據(jù)在時間上的冗余。

在動態(tài)圖像序列中,前后兩幀圖像之間具有較大的相關(guān)性,表現(xiàn)出幀與幀之間的重復,因而存在時間冗余。1.2圖像編碼概述—信息熵冗余信息熵定義為一組數(shù)據(jù)所表示的信息量,即

式中,E為信息熵,N為數(shù)據(jù)的種類(或稱碼元)個數(shù),pi為第i個碼元出現(xiàn)的概率。一組數(shù)據(jù)的數(shù)據(jù)量顯然等于各記錄碼元的二進制位數(shù)(即編碼長度)與該碼元出現(xiàn)的概率乘積之和,即

式中,D為數(shù)據(jù)量,為第i個碼元的二進制位數(shù)。一般取b0=b1=…bN-1(如ASCII編碼把所有碼元都編碼為7比特),這樣得到的D必然大于E。這種因碼元編碼長度的不經(jīng)濟帶來的冗余稱為信息熵冗余或編碼冗余。1.2圖像編碼概述—結(jié)構(gòu)冗余有些圖像從大面積上或整體上看存在著重復出現(xiàn)的相同或相近的紋理結(jié)構(gòu),例如布紋圖像和草席圖像,被稱為結(jié)構(gòu)冗余。1.2圖像編碼概述—知識冗余有許多圖像的理解與圖像所表現(xiàn)內(nèi)容的基礎(chǔ)知識(先驗或背景知識)有相當大的相關(guān)性,從這種知識出發(fā)可以歸納出圖像的某種規(guī)律性變化,這類冗余稱為知識冗余。知識冗余的一個典型例子是對人像的理解,比如,鼻子上方有眼睛,鼻子又在嘴的上方等。1.2圖像編碼概述—視覺冗余人類的視覺系統(tǒng)實際上只在一定程度上對圖像的變化產(chǎn)生敏感,即圖像數(shù)據(jù)中存在著大量人類視覺覺察不到的細節(jié)。事實上,人類視覺系統(tǒng)的一般分辨力為64灰度級,而一般圖像量化采用的是256灰度級,這類冗余稱為視覺冗余。1.2圖像編碼概述—幾種常見應(yīng)用的碼率1.3圖像編碼的方法根據(jù)編碼過程中是否存在信息損耗可將圖像編碼分為有損壓縮和無損壓縮。無損壓縮無信息損失,解壓縮時能夠從壓縮數(shù)據(jù)精確地恢復原始圖像;有損壓縮不能精確重建原始圖像,存在一定程度的失真。根據(jù)編碼原理可以將圖像編碼分為熵編碼、預測編碼、變換編碼和混合編碼等。1.3圖像編碼的方法(1)熵編碼。熵編碼是純粹基于信號統(tǒng)計特性的編碼技術(shù),是一種無損編碼。熵編碼的基本原理是給出現(xiàn)概率較大的符號賦予一個短碼字,而給出現(xiàn)概率較小的符號賦予一個長碼字,從而使得最終的平均碼長很小。常見的熵編碼方法有行程編碼(RunLengthEncoding)、哈夫曼編碼和算術(shù)編碼。1.3圖像編碼的方法(2)預測編碼。預測編碼是基于圖像數(shù)據(jù)的空間或時間冗余特性,用相鄰的已知像素(或像素塊)來預測當前像素(或像素塊)的取值,然后再對預測誤差進行量化和編碼。預測編碼可分為幀內(nèi)預測和幀間預測,常用的預測編碼有差分脈碼調(diào)制(DifferentialPulseCodeModulation,DPCM)和運動補償法。1.3圖像編碼的方法(3)變換編碼。變換編碼通常是將空間域上的圖像經(jīng)過正交變換映射到另一變換域上,使變換后的系數(shù)之間的相關(guān)性降低。圖像變換本身并不能壓縮數(shù)據(jù),但變換后圖像的大部分能量只集中到少數(shù)幾個變換系數(shù)上,采用適當?shù)牧炕挽鼐幋a就可以有效地壓縮圖像。(4)混合編碼?;旌暇幋a是指綜合了熵編碼、變換編碼或預測編碼的編碼方法,如JPEG標準和MPEG標準。1.3圖像編碼的方法根據(jù)對壓縮編碼后的圖像進行重建的準確程度,可將常用的圖像編碼方法分為三類:(1)信息保持編碼:也稱無失真編碼,它要求在編解碼過程中保證圖像信息不丟失,從而可以完整地重建圖像。信息保持編碼的壓縮比較低,一般不超過3:1,主要應(yīng)用在圖像的數(shù)字存儲方面,常用于醫(yī)學圖像編碼中。1.3圖像編碼的方法(2)保真度編碼:主要利用人眼的視覺特性,在允許的失真(Lossy)條件下或一定的保真度準則下,最大限度地壓縮圖像。保真度編碼可以實現(xiàn)較大的壓縮比,主要用于數(shù)字電視技術(shù)、靜止圖像通信、娛樂等方面。對于這些圖像,過高的空間分辨率和過多的灰度層次,不僅增加了數(shù)據(jù)量,而且人眼也接收不到。因此在編碼過程中,可以丟掉一些人眼不敏感的信息,在保證一定的視覺效果條件下提高壓縮比。

1.3圖像編碼的方法(3)特征提?。涸趫D像識別、分析和分類等技術(shù)中,往往并不需要全部圖像信息,而只要對感興趣的部分特征信息進行編碼即可壓縮數(shù)據(jù)。例如,對遙感圖像進行農(nóng)作物分類時,就只需對用于區(qū)別農(nóng)作物與非農(nóng)作物,以及農(nóng)作物類別之間的特征進行編碼,而可以忽略道路、河流、建筑物等其他背景信息。1.4圖像編碼的新技術(shù)圖像編碼已經(jīng)發(fā)展了幾十年,人們不斷提出新的壓縮方法。如,利用人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)的壓縮編碼、分形編碼(FractalCoding)、小波編碼(WaveletCoding)、基于對象的壓縮編碼(ObjectBasedCoding)和基于模型的壓縮編碼(ModelBasedCoding)等等1.4圖像編碼的新技術(shù)1)分形編碼分形編碼是在波蘭美籍數(shù)學家B.B.Mandelbrot建立的分形幾何理論的基礎(chǔ)上發(fā)展起來的一種編碼方法。分形編碼最大限度地利用了圖像在空間域上的自相似性(即局部與整體之間存在某種相似性),通過消除圖像的幾何冗余來壓縮數(shù)據(jù)。M.Barnsley將迭代函數(shù)系統(tǒng)(IterateFunctionSystem,IFS)用于描述圖像的自相似性,并將其用于圖像編碼,對某些特定圖像獲得了10000:1的壓縮比。分形編碼過程十分復雜,而解碼過程卻很簡單,故通常用于對圖像編碼一次,而需譯碼多次的信息傳播應(yīng)用中。1.4圖像編碼的新技術(shù)

2)小波編碼1989年,S.G.Mallat首次將小波變換用于圖像編碼。經(jīng)過小波變換后的圖像,具有良好的空間方向選擇性,而且是多分辨率的,能夠保持原圖像在各種分辨率下的精細結(jié)構(gòu),與人的視覺特性十分吻合。1.4圖像編碼的新技術(shù)3)模型編碼模型編碼是近幾年發(fā)展起來的一種很有前途的低比特率編碼方法,其基本出發(fā)點是在編、解碼兩端分別建立起相同的模型,編碼時利用先驗模型抽取圖像中的主要信息并用模型參數(shù)的形式表示,解碼時則利用所接收的模型參數(shù)重建圖像。1.4圖像編碼評價隨著眾多圖像壓縮算法的出現(xiàn),如何評價圖像壓縮算法就成為重要的課題。一般說來,評價圖像壓縮算法的優(yōu)劣主要有以下4個參數(shù)。

1)算法的編碼效率算法的編碼效率通常有幾種表現(xiàn)形式:平均碼字長度(R),圖像的壓縮比(rate,r),每秒鐘所需的傳輸比特數(shù)(bitspersecond,bps),圖像熵與平均碼長之比(η),這些表現(xiàn)形式很容易相互轉(zhuǎn)換。下面給出與圖像編碼效率有關(guān)的幾個定義。1.4圖像編碼評價

設(shè)一幅灰度級為N的圖像,圖像中第k級灰度出現(xiàn)的概率為Pk,圖像大小為Nx×Ny,每個像素用d比特表示,每兩幀圖像間隔Δt,則按信息論中信息熵的定義,數(shù)字圖像的熵H由下式定義:

由此可見,圖像熵H表示各灰度級比特數(shù)的統(tǒng)計平均值。1.4圖像編碼評價對于一種圖像編碼方法,設(shè)第k級灰度的碼字長度為Bk,則該圖像的平均碼字長度R為

1.4圖像編碼評價于是,可定義編碼效率η為每秒鐘所需的傳輸比特數(shù)bps為1.4圖像編碼評價

壓縮比r為

由于同一壓縮算法對不同圖像的編碼效率會有所不同,因此常需定義一些“標準圖像”,如國際上流行的三幅圖像Lena、Barbara和Mandrill。一般通過測量不同壓縮算法對同一組“標準圖像”的編碼性能來評價各圖像壓縮算法的編碼效率。1.4圖像編碼評價

2)編碼圖像的質(zhì)量圖像質(zhì)量評價可分為客觀質(zhì)量評價和主觀質(zhì)量評價。最常用的客觀質(zhì)量評價指標是均方誤差(MSE)和峰值信噪比(PSNR),其定義如下:

1.4圖像編碼評價

主觀質(zhì)量評價是指由一批觀察者對編碼圖像進行觀察并打分,然后綜合所有人的評判結(jié)果,給出圖像的質(zhì)量評價??陀^質(zhì)量評價能夠快速有效地評價編碼圖像的質(zhì)量,但符合客觀質(zhì)量評價指標的圖像不一定具有較好的主觀質(zhì)量。主觀質(zhì)量評價能夠與人的視覺效果相匹配,但其評判過程緩慢費時。1.4圖像編碼評價

3)算法的適用范圍特定的圖像編碼算法具有其相應(yīng)的適用范圍,并不對所有圖像都有效。一般說來,大多數(shù)基于圖像信息統(tǒng)計特性的壓縮算法具有較廣的適用范圍,而一些特定的編碼算法的適用范圍較窄,如分形編碼主要用于自相似性高的圖像。1.4圖像編碼評價

4)算法的復雜度算法的復雜度即指完成圖像壓縮和解壓縮所需的運算量和硬件實現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡單,易于硬件實現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時一定要考慮圖像信源本身的統(tǒng)計特性、多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應(yīng)能力、應(yīng)用環(huán)境以及技術(shù)標準。2.1圖像壓縮編碼算法—行程長度編碼把一系列的重復值(例如圖像象素的灰度值)用一個單獨的值再加上一個計數(shù)值來取代。

比如有這樣一個字母序列aabbbccccccccdddddd它的行程長度編碼就是2a3b8c6d。

很多位圖文件格式都用行程長度編碼,例如TIFF,PCX。2.1圖像壓縮編碼算法—行程長度編碼例如:有一線狀圖像,其灰度隨長度坐標的關(guān)系如下圖所示。描述這個一維圖像可以用順序的七個3bit的二進制數(shù)表示:011,011,011,011,101,101,101,共21比特。

如果用行程編碼方法對其編碼,其編碼就變成了100,011;011,101,共用了12比特,比前一種編碼節(jié)約了9個比特。2.2圖像壓縮編碼算法—哈夫曼編碼

基本思路:出現(xiàn)頻率越高的符號,對應(yīng)的編碼長度越短編碼步驟如下:統(tǒng)計信源符號出現(xiàn)的概率;將信源符號按概率遞減順序排列;

把兩個最小的概率值加起來,作為一個新組合符號的概率;重復步驟(2)、(3),直到概率和達到1為止;在每次合并信源時,將合并的信源分別標記“1”和“0”(例如,概率小的標記為“1”,概率大的標記為“0”);尋找從每一信源符號到概率為1的路徑,記錄下路徑上的“1”和“0”;對每一符號寫出“1”和“0”序列;2.2圖像壓縮編碼算法—哈夫曼編碼考慮信源:進行哈夫曼編碼的過程如下:編碼前:平均碼長為3編碼后:平均碼長為2.45壓縮比:2.45/32.2圖像壓縮編碼算法—哈夫曼編碼哈夫曼編碼的不足:它必須精確地統(tǒng)計出原始文件中每個值的出現(xiàn)頻率,如果沒有這個精確統(tǒng)計,壓縮的效果就會大打折扣,甚至根本達不到壓縮的效果。因此哈夫曼編碼通常要經(jīng)過兩遍操作,第一遍進行統(tǒng)計,第二遍產(chǎn)生編碼,所以編碼的過程是比較慢的。另外由于各種長度的編碼的譯碼過程也比較復雜,因此解壓縮的過程也比較慢。它對于位的增刪比較敏感。

2.2圖像壓縮編碼算法—辭典編碼辭典編碼是一種通用編碼技術(shù),屬于無損壓縮技術(shù)?!o典編碼的思想辭典編碼的根據(jù)是數(shù)據(jù)本身包含的重復代碼,如文本文件和光柵圖像就具有這種特性。辭典編碼歸納起來有兩類。第一類辭典編碼的想法是:查找壓縮的字符序列是否在以前輸入的數(shù)據(jù)中出現(xiàn)過,然后用已經(jīng)出現(xiàn)過的字符串代替重復的部分,它的輸出僅僅是指向早期出現(xiàn)過的字符串的“指針”。2.2圖像壓縮編碼算法—辭典編碼第二類算法的思想是,從輸入的數(shù)據(jù)中創(chuàng)建一個“短語辭典”,編碼數(shù)據(jù)過程中,遇到已經(jīng)在辭典中出現(xiàn)的“短語”時,編碼器就輸出這個詞典中該短語的“索引號”,而不是短語本身。J.Ziv和A.Lempel在1978年首次發(fā)表了介紹這種編碼的文章,在他們研究的基礎(chǔ)上,TerryA.Weltch在1984年發(fā)表了改進這種編碼算法的文章,因此這種編碼方法稱為LZW壓縮編碼。2.3圖像壓縮編碼算法—LZW編碼LZW(Lempel-Ziv&Welch)編碼又稱字串表編碼,屬于一種無損編碼,是Welch將Lempel和Ziv所提出的無損壓縮技術(shù)改進后的壓縮方法。LZW編碼的基本思想是:在編碼過程中,將所遇到的字符串建立一個字符串表,表中的每個字符串都對應(yīng)一個索引,編碼時用該字符串在字串表中的索引來代替原始的數(shù)據(jù)串。2.3圖像壓縮編碼算法—LZW編碼例如,一幅8位的灰度圖像,我們可以采用12位來表示每個字符串的索引,前256個索引用于對應(yīng)可能出現(xiàn)的256種灰度,由此可建立一個初始的字符串表,而剩余的3840個索引就可分配給在壓縮過程中出現(xiàn)的新字符串,這樣就生成了一個完整的字符串表,壓縮數(shù)據(jù)就可以只保存它在字符串表中的索引,從而達到壓縮數(shù)據(jù)的目的。字符串表是在壓縮過程中動態(tài)生成的,不必將它保存在壓縮文件里,因為解壓縮時字符串表可以由壓縮文件中的信息重新生成。2.4圖像壓縮編碼算法—算術(shù)編碼算術(shù)編碼在圖像數(shù)據(jù)壓縮標準(如JPEG,JBIG)中扮演了重要的角色。在算術(shù)編碼中,消息用0到1之間的實數(shù)進行編碼,算術(shù)編碼用到兩個基本的參數(shù):符號的概率和它的編碼間隔。信源符號的概率決定壓縮編碼的效率,也決定編碼過程中信源符號的間隔,而這些間隔包含在0到1之間。編碼過程中的間隔決定了符號壓縮后的輸出。2.4圖像壓縮編碼算法—算術(shù)編碼算法舉例假設(shè)信源符號為{00,01,10,11},這些符號的概率分別為{0.1,0.4,0.2,0.3},根據(jù)這些概率可把間隔[0,1)分成4個子間隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),二進制消息序列的輸入為:10001100101101算術(shù)編碼過程如下頁圖所示:2.4圖像壓縮編碼算法—算術(shù)編碼3、靜態(tài)圖像壓縮標準JPEGJPEG20003、靜態(tài)圖像壓縮標準JPEG是國際標準化組織(ISO)和國際電報電話咨詢委員會(CCITT)關(guān)于靜止圖像編碼的聯(lián)合專家組(JointPhotographicExpertsGroup)名稱的縮寫。該標準可用于自然景象或任何連續(xù)色調(diào)圖像的數(shù)字數(shù)據(jù)的壓縮編碼和解碼。對于數(shù)字化精度為每種彩色分量每個樣點4至16比特的數(shù)字圖像有良好的壓縮效果,但不適用于二值圖像。3、靜態(tài)圖像壓縮標準JPEG標準綜合了多年來圖像壓縮編碼的研究成果,是一種集大成的算法。該標準規(guī)定了兩種工作方式,即順序方式和漸進方式;還規(guī)定了三種級別的編碼算法,即基本系統(tǒng)(Baselinesystem)、擴展系統(tǒng)(Extendedsystem)和無失真系統(tǒng)(Losslesscoding)。3.1JPEGJPEG是面向靜態(tài)圖像編碼的國際標準。在相同圖像質(zhì)量條件下,JPEG文件擁有比其他圖像文件格式更高的壓縮比。JPEG目前被廣泛應(yīng)用于多媒體和網(wǎng)絡(luò)程序中,是現(xiàn)今萬維網(wǎng)中使用最廣泛的兩種圖像文件格式之一。JPEG是一種有損壓縮,即在壓縮過程中會丟失數(shù)據(jù),每次編輯JPEG圖像后,圖像就會被重復壓縮一次,損失就會有所增加。3.1JPEG順序(Sequential)方式:從左到右、從上到下對圖像順序進行基于離散余弦變換(DCT)的編碼。DCT理論上是可逆的,但在計算時存在誤差,因而基于DCT的編碼模式是一種有損編碼。3.1JPEG漸進方式(Progressivemode):整個圖像首先以一種低于最終質(zhì)量要求的質(zhì)量標準(如分辨率或數(shù)據(jù)精度)進行編碼,完成后再以較上次高一級的質(zhì)量要求再進行一次編碼,但僅傳送為改善質(zhì)量所需增加的那部分信息。這種過程可以重復若干次直至達到所需的最終質(zhì)量要求。每個子過程中的編碼則還是順序方式的。3.1JPEG---基本系統(tǒng)以離散余弦變換為核心,采用順序工作方式,適用于一般精度(每種分量每個樣點8比特)的圖像,有良好的壓縮效果,壓縮比可調(diào)。標準規(guī)定,每個JPEG靜止圖像壓縮編解碼器都必須具有實現(xiàn)基本系統(tǒng)的功能。3.1JPEG---基本系統(tǒng)流程基本系統(tǒng)3.1JPEG---基本系統(tǒng)流程通過離散余弦變換減少圖像數(shù)據(jù)的相關(guān)性;利用人眼視覺特性對系數(shù)進行自適應(yīng)量化;對每個子塊量化后的系數(shù)矩陣進行Z形掃描,將系數(shù)矩陣變換成符號序列;用哈夫曼變長碼對符號進行熵編碼。3.1JPEG---基本系統(tǒng)流程Z形掃描3.1JPEG---漸近方式漸進方式的基本實現(xiàn)有三種方式(1)頻譜選擇法,即按Z形掃描的序號將DCT量化序數(shù)分成幾個頻段,每個頻段對應(yīng)一次掃描,每塊均先傳送低頻掃描數(shù)據(jù),得到原圖概貌,再依次傳送高頻掃描數(shù)據(jù),使圖像逐漸清晰;(2)逐次逼近法,即每次掃描全部DCT量化序數(shù),但每次的表示精度逐漸提高。(3)階梯方式,圖像以數(shù)種分辨率來壓縮,其目的是為了讓具有高分辨率的圖像也可以在較低分辨率的設(shè)備上顯示。3.1JPEG---壓縮效果采用JPEG算法所能達到的壓縮效果,與被壓縮圖像的特性有關(guān)。對于在開發(fā)和測試本算法標準時所用的那些內(nèi)容是彩色自然景物和人像的測試圖片,壓縮到0.15比特/像素時,圖像可識別;0.25比特/像素時,解碼后的圖像可評價為“有用(usefulimage)”;約0.75比特/像素時,被認為是“極佳(verygood)”;大約1.5比特/像素時基本上與原圖像無法區(qū)別。用無失真算法對這些測試圖片進行壓縮編碼,大致可以得到2:1的壓縮比。3.2JPEG2000JPEG2000的核心JPEG2000的優(yōu)勢JPEG2000的應(yīng)用3.2JPEG2000---核心放棄了JPEG所采用的以離散余弦變換算法為主的區(qū)塊編碼方式,而改用以離散小波變換算法為主的多解析編碼方式。JPEG2000還將彩色靜態(tài)畫面采用的JPEG編碼方式、2值圖像采用的JBIG(JointBinaryImageGroup)編碼方式及低壓縮率采用JPEGLS統(tǒng)一起來,成為對應(yīng)各種圖像的通用編碼方式。3.2JPEG2000---優(yōu)勢高壓縮率無損壓縮漸進傳輸感興趣區(qū)域壓縮3.2JPEG2000---應(yīng)用目前,支持JPEG2000的軟件已經(jīng)出現(xiàn),如LuraWaveSmartCompressFreewareforWindows為ACDSee3.0提供JPEG2000LWF格式的外掛插件,這樣只要安置了這個插件就可以觀看和制作采用JPEG2000編碼的LWF格式文件。在不久的將來,JPEG2000無論是在傳統(tǒng)的JPEG市場(如數(shù)碼相機、掃描儀等)還是在新興應(yīng)用領(lǐng)域(如網(wǎng)路傳輸、無線通訊、醫(yī)療影像等)都將大有用武之地。4、動態(tài)圖像壓縮標準MPEG是運動圖像專家組(MotionPictureExpertsGroup)的縮寫,是國際標準化組織中IEC/JTC1/SC2/WG11的一個小組。MPEG下分三個小組:視頻組(MPEG-Video)的任務(wù)是研究壓縮傳輸速度上限為1.5Mbps的視頻信號;音頻組(MPEG-Audio)的任務(wù)是研究壓縮每信道64、128和192Kbps的數(shù)字音頻信號;系統(tǒng)組(MPEG-System)則解決多道壓縮視頻、音頻位流的同步及合成問題。

MPEG委員會的工作始于1988年,1990年制訂出標準草案。兩年中MPEG工作參加單位由15家發(fā)展到150家。MPEG工作一開始就兼顧JPEG標準,CCITT的H.261標準,支持這兩個標準的優(yōu)秀成果。4、動態(tài)圖像壓縮標準MPEG標準主要有以下五個,MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。MPEG標準的視頻壓縮編碼技術(shù)主要利用了具有運動補償?shù)膸g壓縮編碼技術(shù)以減小時間冗余度,利用DCT技術(shù)以減小圖象的空間冗余度,利用熵編碼則在信息表示方面減小了統(tǒng)計冗余度。這幾種技術(shù)的綜合運用,大大增強了壓縮性能。4、動態(tài)圖像壓縮標準MPEG-1標準于1992年正式出版,標準的編號為ISO/IEC11172,其標題為“碼率約為1.5Mb/s用于數(shù)字存貯媒體活動圖象及其伴音的編碼”。MPEG-2標準于1994年公布,包括編號為13818-1系統(tǒng)部分、編號為13818-2的視頻部分、編號為13818-3的音頻部分及編號為13818-4的符合性測試部分。該標準希望囊括數(shù)字電視、圖象通信各領(lǐng)域的編碼標準。MPEG-4是基于內(nèi)容的壓縮編碼標準。MPEG-7是“多媒體內(nèi)容描述接口標準”。MPEG-21是有關(guān)多媒體框架的協(xié)議。4.1MPEG-1標準MPEG-1標準叫作“運動圖像和伴隨聲音的編碼—用于速率約在1.5Mb/s以下的數(shù)字存儲媒體”,主要用于多媒體存儲與再現(xiàn),如VCD等。

MPEG-1采用CIF視頻格式(分辨率為352×288),幀速率為25幀/秒或30幀/秒,碼率為1.5Mb/s(其中視頻約1.2Mb/s,音頻約0.3Mb/s)。

MPEG-1將視頻圖像序列劃分為I幀、P幀和B幀

標準草案于1991年11月完成,1992年11月正式通過。4.1MPEG-1標準MPEG-1由五個部分組成:MPEG-1Systems,規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其它相關(guān)數(shù)據(jù)的同步MPEG-1Video,規(guī)定視頻數(shù)據(jù)的編碼和解碼,MPEG-1Audio,規(guī)定音頻數(shù)據(jù)的編碼和解碼MPEG-1Conformancetesting,詳細說明如何測試比特數(shù)據(jù)流(bitstreams)和解碼器是否滿足MPEG-1前3個部分(Part1,2和3)中所規(guī)定的要求MPEG-1Softwaresimulation4.2MPEG-2標準MPEG-2標準的基本算法也是運動補償?shù)念A測和帶有DCT的幀間內(nèi)變長編碼與MPEG-1的主要區(qū)別在于:

能夠有效地支持電視的隔行掃描格式

支持可分級的可調(diào)視頻編碼,這適用于需要同時提供多種質(zhì)量的視頻業(yè)務(wù)的情況

根據(jù)MPEG-2的標準CCIR601格式(702×576×25幀)的信號可壓縮到4Mb/s~6Mb/s,而HDTV格式(1280×720×60幀)的信號可壓縮到20Mb/s左右。4.2MPEG-2標準---組成(1)MPEG-2Systems,規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其它相關(guān)數(shù)據(jù)的同步(2)MPEG-2Video,規(guī)定視頻數(shù)據(jù)的編碼和解碼

(3)MPEG-2Audio,規(guī)定聲音數(shù)據(jù)的編碼和解碼,是MPEG-1Audio的擴充,支持多個聲道

(4)MPEG-2Conformancetesting4.2MPEG-2標準---組成(5)MPEG-2Softwaresimulation(6)MPEG-2數(shù)字存儲媒體命令和控制擴展協(xié)議

(7)MPEG-2先進聲音編碼(MPEG-2AAC),是多聲道聲音編碼算法標準

(8)MPEG-2系統(tǒng)解碼器實時接口擴展標準

(9)MPEG-2DSM-CC一致性擴展測試

4.3MPEG-4標準MPEG-4于1998年10月定案,在1999年1月成為一個國際性標準,隨后為擴展用途又進行了第二版的開發(fā),于1999年底結(jié)束,其正式名稱為ISO14496-2,是為了滿足交互式多媒體應(yīng)用而制定的新一代國際標準,具有更高的靈活性和可擴展性。MPEG-4主要應(yīng)用于可視電話、視頻郵件和電子新聞等,對傳輸速率要求較低,在4800bps~64000bps之間。4.3MPEG-4標準利用很窄的帶寬,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求以最小的數(shù)據(jù)獲得最佳的圖像質(zhì)量?;趦?nèi)容的壓縮、更高的壓縮比和時空可伸縮性,是MPEG-4最重要的三個技術(shù)特征。

MPEG-4標準同以前標準的最顯著的差別在于它是采用基于對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯(lián)系的視頻音頻對象,分別編碼后,再經(jīng)過復用傳輸?shù)浇邮斩?,然后再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。4.4MPEG-7標準國際標準化組織(ISO)在制定MPEG-1、MPEG-2及MPEG-4的標準基礎(chǔ)上,推出了新的標準MPEG-7,該標準的正式名稱為“多媒體內(nèi)容描述接口”(MultimediaContentDescriptionInterface),其目標是產(chǎn)生一種描述多媒體內(nèi)容數(shù)據(jù)的標準,滿足實時、非實時以及推-拉應(yīng)用的需求。它既不同于基于波形和基于壓縮的表示方式如MPEG-1和MPEG-2,又不同于基于對象的表示方式如MPEG-4,而是將對各種不同類型的多媒體信息進行標準化描述,并將該描述與所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論