四章多媒體數據壓縮編碼技術_第1頁
四章多媒體數據壓縮編碼技術_第2頁
四章多媒體數據壓縮編碼技術_第3頁
四章多媒體數據壓縮編碼技術_第4頁
四章多媒體數據壓縮編碼技術_第5頁
已閱讀5頁,還剩87頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四章多媒體數據壓縮編碼技術學習目的:通過本章的學習,使學生掌握多媒體數據壓縮編碼的基本原理和算法、數據壓縮編碼的分類和方法。了解多媒體數據壓縮編碼的國際標準。學習的知識點:多媒體數據壓縮、信息能被壓縮原因、、多媒體數據壓縮編碼的國際標準JPEG、MPEG-1等內容。學習要求:掌握:數據冗余的概念和冗余的種類、霍夫曼(Huffman)編碼的原理和方法、JPEG數據壓縮的原理和實現技術。理解:量化的原理和量化器的設計、MPEG-1的原理和實現技術。了解:多媒體數據壓縮的必要性和可能性、多媒體數據壓縮的內涵、常用的壓縮編碼和算法(統計編碼、預測編碼、變換編碼)、多媒體數據壓縮編碼的國際標準。學習重難點:重點:

·信息熵的概念

·統計編碼、變換編碼、預測編碼的原理

·JPEG編碼實現方法

·哈夫曼算法難點:

·信息熵的概念

·哈夫曼算法目錄:4.1多媒體數據壓縮的必要性、可能性和分類4.2量化4.3統計編碼4.4預測編碼4.5變換編碼4.6多媒體數據壓縮編碼的國際標準4.1多媒體數據壓縮的重要性和分類

1.多媒體數據壓縮編碼的重要性多媒體信息包括文本、數據、聲音、動畫、圖像、圖形以及視頻等多種媒體信息。雖然經過數字化處理后其數據量是非常大的,如果不進行數據壓縮處理,計算機系統就無法對它進行存儲和交換。另一個原因是圖像、音頻和視頻這些媒體具有很大的壓縮潛力。因為在多媒體數據中,存在著空間冗余、時間冗余、結構冗余、知識冗余、視覺冗余、圖像區(qū)域的相同性冗余、紋理的統計冗余等。它們?yōu)閿祿嚎s技術的應用提供了可能的條件。因此在多媒體系統中必須采用數據壓縮技術,這是多媒體技術中一項十分關鍵的技術。未經過壓縮的信息數據的示例未經壓縮的數據情況數據大?。s)一張CD-ROM可存(約)一幅1024×768、24位真彩圖像2.26MB287張監(jiān)測衛(wèi)星采用四波段,按每天30幅的頻率傳輸2340×3240真彩圖像2.5GB0.25天一分鐘的立體聲CD-A激光唱盤,采樣頻率44.1kHz,量化位1610.09MB64分鐘一分鐘24位真彩、320×240、25幀/秒的PAL電視信號329.6MB2分鐘數據量巨大帶來的問題:1、要求提高存儲器的容量2、增加通信干線的信道傳輸率3、提高計算機的速度。形成一種瓶頸。單純靠擴大存儲器的容量、增加通信干線的傳輸率的辦法是不現實的。數據壓縮是以一定的質量損失為前提的,按照某種方法從給定的信源中推出已簡化的數據表述。這里所說的質量損失一般都是在人眼允許的誤差范圍之內,壓縮前后的圖像如果不做非常細致的對比是很難覺察出兩者的差別。處理一般是由兩個過程組成:一是編碼過程,即將原始數據經過編碼進行壓縮,以便存儲與傳輸;二是解碼過程,此過程對編碼數據進行解碼,還原為可以使用的數據。2.多媒體數據壓縮編碼的可能性音頻與視頻數據表示中存在大量的冗余,數據壓縮技術就是研究如何利用數據的冗余性來減少數據量的方法。(1)空間(空域)冗余(2)時間(時域)冗余(3)結構冗余(4)知識冗余(5)視覺冗余(6)聽覺冗余(7)信息熵冗余(編碼冗余)(1)空間(空域)冗余靜態(tài)圖像存在的一種主要數據冗余。同一景物表面上各采樣點的顏色之間往往存在著空間連貫性,但是基于離散像素采樣來表示物體顏色的方式通常沒有利用景物表面顏色的這種連貫性,從而產生冗余。(2)時間(時域)冗余序列圖像(電視畫面、運動圖像)表示中經常包含的冗余。序列圖像一般為位于一時間軸區(qū)間內的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動物體,只不過移動的物體所在的空間位置略有變化,所以前后相鄰的幀的數據有許多共同的地方。這種共同性是由于相鄰幀記錄相鄰時刻的同一場景畫面引起的,所以稱為時間冗余。同理,在言語中,由于人在說話時發(fā)音的音頻是一連續(xù)的漸變過程,而不是一個完全在時間上獨立的過程,因而也存在時間冗余。(3)結構冗余有一些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式。例如方格狀的地板圖案等。通過分布模型,可生成圖像。(4)知識冗余有些圖像的理解與某些知識有相當大的相關性。如:人臉的圖像有固定的結構,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正面圖像的中線上等等。這類規(guī)律性的結構可由先驗知識和背景知識得到。這就是知識冗余。根據已有的知識,對某些圖像中所包含的物體,構造出描述模型,并創(chuàng)建對應的各種特征的圖像庫,進行圖像的存儲只需要保存一些特征參數,從而可大大減少數據量。知識冗余是模型編碼的主要利用的特征。(5)視覺冗余人類的視覺系統對圖像場的敏感性是非均勻的和非線性的。然而,在記錄原始圖像數據時,通常假設視覺系統是線性和均勻的,對視覺敏感和不敏感的部分同等對待,從而產生了冗余的數據。人類的視覺冗余:①視覺系統對圖像的亮度和色彩度的敏感性差異很大。對亮度的敏感性遠遠高于色彩度。②隨著亮度的增加,視覺系統對量化誤差的敏感度降低。即人眼的辨別能力與物體周圍的背景亮度成反比。這樣,對于高亮度區(qū)域,灰度值的量化可以粗糙些。③人眼的視覺系統是把圖像的邊緣和非邊緣區(qū)域分開來處理的。據此圖像可以分成非邊緣區(qū)域和邊緣區(qū)域分別進行編碼。邊緣區(qū)域是指灰度值發(fā)生劇烈變化的地方,非邊緣區(qū)域是指邊緣之外的圖像其他任何部分。④人類的視覺系統總是把視網膜上的圖像分解成若干空間有向的頻率通道后再行處理。小波編碼就利用了這個特性。⑤人類視覺系統一般的分辨力估計是26灰度級,而一般圖像的量化采用28灰度級。(6)聽覺冗余①人的聽覺具有掩蔽效應。這是強弱不同的聲音同時存在或在不同時間先后發(fā)生時出現的現象。②人耳對不同頻段的聲音的敏感程度不同,并不能察覺所有頻率的變化,對某些頻率變化不特別關注,通常對低頻端較之對高頻端更敏感。③人耳對語音信號的相位變化不敏感。(7)信息熵冗余(編碼冗余)信息熵是指一組數據所攜帶的平均信息量。由信息理論的有關原理可知,表示圖像信息數據的一個像素,只要按其信息熵的大小分配相應的比特數即可。然而對于實際圖像數據的每個像素,很難得到它的信息熵,在數字化一幅圖像時,對每個像素是用相同的符號,這樣必然存在冗余。比如,使用相同碼長表示不同出現概率的符號,則會造成比特數的浪費。如果采用可變長編碼技術,對出現概率大的符號用短碼字表示,對出現概率小的符號用長碼字表示,則可去除符號冗余,從而節(jié)約碼字。

種類內容目前用的主要方法統計特性空間冗余像素間的相關性變換編碼,預測編碼時間冗余時間方向上的相關性幀間預測,移動補償結構冗余圖像本身的構造輪廓編碼,區(qū)域分割知識冗余收發(fā)兩端對人物的共有認識基于知識的編碼視覺冗余人的視覺特性非線性量化、位分配其他不確定性因素電視圖像壓縮利用的各種冗余信息數據壓縮就是去掉信號數據的冗余性。數據壓縮常常又稱為數據信源編碼,或簡稱為數據編碼。與此對應,數據壓縮的逆過程稱為數據解壓縮,也稱為數據信源解碼,或簡稱為數據解碼。3.多媒體數據壓縮編碼的分類多媒體數據壓縮的方法根據不同的依據可產生不同的分類。第一種,常用的壓縮編碼方法可根據質量是否有損失可以分為兩大類,一類是無損壓縮法(冗余壓縮法)、一類是有損壓縮法(熵壓縮法)、有失真壓縮法。無損壓縮法(Losslesscompressioncoding)和有損壓縮法(Losscompressioncoding)第二種,按照其作用域在空間域或頻率域上分為:空間方法、變換方法和混合方法。第三種,根據是否自適應分為自適應性編碼和非自適應性編碼。第四種,根據編碼后產生的碼詞長度是否相等,數據編碼又可分為定長碼和變長碼兩類。多媒體數據編碼算法(1)脈沖編碼調制PCM(2)預測編碼(3)變換編碼(4)統計編碼(5)混合編碼(1)脈沖編碼調制PCM數據編碼方式之一。主要過程是將話音、圖像等模擬信號每隔一定時間進行取樣,使其離散化,同時將抽樣值按分層單位四舍五人取整量化,同時將抽樣值按一組二進制碼來表示抽樣脈沖的幅值。(2)預測編碼編碼器記錄的不是樣本的真實值,而是它對預測值的差。這種編碼方式稱為差值脈沖編碼調制(DPCM)。預測值由欲編碼圖像信號的過去信息決定。通常采用線性預測。由于空間相關性,真實值與預測值的差值的變化范圍遠遠小于真實值的變化范圍,因而可以彩較少的位數來表示。另外,若利用人的視覺特性對差值進行非均勻量化,則會獲得更高的壓縮比。(3)變換編碼其主要思想是利用圖像塊內像素值之間的相關性,把圖像變換到一組新的基上,使得能量集中在少數變換系數上,通過存儲這些系數從而達到壓縮圖像的目的。在變換編碼中,由于對整幅圖進行變換的計算量太大,所以一般把原始圖像分成許多個矩形區(qū)域子圖像獨立進行變換。如DCT變換。(4)統計編碼最常用的統計編碼是Huffman編碼。其基本原理是根據信源的頻率進行編碼。對于出現頻率大的符號用較少的位數來表示,而對于出現頻率小的符號用較多位數來表示。這種方法的壓縮率取決符號的分布頻率,分布越集中壓縮效果越好。還有一種算術編碼方法,也是統計編碼。算術編碼適合于信源符號概率比較接近的情況。在JPEG的擴展系統中,用算術編碼代替Huffman編碼。(5)混合編碼一般是將預測編碼和變換編碼合并使用。比如在一個方向上進行變換,在另一個方向上用DPCM對變換系數進行預測編碼。或是對動態(tài)圖像二維變換加上時間方向上的DPCM預測。數據壓縮技術的重要指標衡量一種數據壓縮技術的好壞有3個重要指標。一是,壓縮比要大,即壓縮前后所需要的信息存儲量之比要大;二是,實現壓縮的算法要簡單,壓縮、解壓速度要快,盡可能地做到實時壓縮解壓;三是,恢復效果要好,要盡可能地恢復原始數據。4.2多媒體數據的量化

1.量化(Quantization)概念與原理量化的作用是在圖像質量或聲音質量達到一定保真度的前提下,舍棄那些對視覺或聽覺影響不大的信息。量化的過程是模擬信號到數字信號的映射。模擬量是連續(xù)量,而數字量是離散量,因此量化操作實際上是用有限的離散量代替無限的連續(xù)模擬量的多對一的映射操作。量化概念主要來自于從模擬量到數字量的轉換,即A/D轉換,也就是通過采樣把連續(xù)的模擬量離散化。量化過程預先設置一組判決電平和一組重建電平,各個判決電平覆蓋一定的區(qū)間,所有判決電平將覆蓋整個有效取值區(qū)間。量化時將模擬量的取樣值同這些電平比較,若采樣值幅度落在覆蓋區(qū)間之上,則取這個量化級的代表值,稱為碼字。一個量化器只能取有限多個量化級,因此量化過程不可避免地存在量化誤差。量化方法分為標量量化和矢量量化。2.標量量化標量量化是一維量化,它使用一個量化器進行量化,每個采樣的量化都和其他采樣無關。A/D轉換器中所使用的PC編碼器是最典型的例子。標量量化的輸入-輸出特性采用階梯形函數的形式。標量量化又可分為均勻量化、非均勻量化和自適應量化。均勻量化、非均勻量化和自適應量化均勻量化是將量化輸入值的振幅進行等值均分,優(yōu)點是計算處理簡單,缺點是量化誤差大。非均勻量化就是將輸入數據的振幅,按照其變化曲線的曲率大小進行不等值劃分,優(yōu)點是量化誤差小,缺點是計算處理復雜,需要較多的比特數。自適應量化是按照輸入數據的變化曲率的局部區(qū)域的特點,自適應地修改和調整量化器的箱寬,優(yōu)點是量化誤差小,缺點是算法設計復雜、硬件實現難度大、成本高。均勻量化、非均勻量化和自適應量化3.矢量量化(VectorQuantization)量化時一次量化多個點,即將輸入數據幾個一組地分成許多組,成組的量化編碼,這種方法就是矢量量化。矢量量化又稱為多維量化,是從稱為碼本的碼字集合中選出最緊密適配于輸入序列的一個碼字來近似一個采樣序列,這種方法以輸入序列與選出的碼字之間失真最小為依據。矢量量化與標量量化相比有更大的數據壓縮能力。矢量量化經常與其他的編碼方法一同構成混合方法使用。一般是與變換編碼相結合使用,對信源進行變換后,形成多維向量組,然后到碼本中尋找最佳碼字。矢量量化是一種有失真的編碼過程。矢量量化編碼原理框圖圖中輸入矢量X是一個待編碼的k維矢量,該矢量原則上既可以是原始圖像,也可以是圖像的預測誤差或變換矩陣分塊(或稱分組)。碼本C是一個具有N個k維矢量的集合,即C={Yi},i=1,2,...,N,它實際上是一個長度為N的表,這個表的每個分量是一個k維矢量Yi,稱為碼字。矢量編碼的過程就是在碼本C中搜索一個與輸入矢量最接近的碼字Yi。傳輸時,并不傳送碼字Yi本身,而只需傳送碼字Yi的下標i。在接收端解碼器中,有一個與發(fā)送端面相同的碼本C,根據下標i可簡單地用查表法找到Yi作為對應X的近似。4.量化器對模擬量進行數字化時,要經歷一個量化過程,這需要使用量化器。如果要量化的數據在其動態(tài)范圍內的概率密度服從均勻分布,則量化級別可以等間隔地分配。量化器的設計方法有兩種:第1種是當量化器的量化電平數K已給定時,根據量化誤差的均勻值取最小值的原則來設計;第2種是給出固定的量化噪聲或失真要求,以量化電平總數K盡量小為原則來設計。如何降低量化器誤差是量化需要考慮的主要問題,另一個就是盡量少的比特數輸出。顯然這是一對矛盾,不能同時滿足,只能根據不同的需要,設計不同的量化器,并求得上述問題的折中處理。4.3統計編碼

1.統計編碼原理──信息量和信息熵

根據香農信息論的原理,最佳的數據壓縮方法的理論極限是信息熵。如果要求在編碼過程中不丟失信息量,即要求保存信息熵,這種信息保持的編碼又叫熵保存編碼,或叫熵編碼。熵編碼是無失真壓縮。當然在考慮人眼失真不易察覺的生理特性時,有些圖像編碼不嚴格要求熵保存,信息允許通過部分損失來換取高的數據壓縮比。這種編碼屬于有失真數據壓縮。信息是用不確定性的量度定義的,也就是說信息被假設為由一系列的隨機變量所代表,它們往往用隨機出現的符號來表示。我們稱輸出這些符號的源為“信源”。也就是要進行研究與壓縮的對象。信息量信息熵定長碼與變長碼信息量信息量指從N個相等可能事件中選出一個事件所需要的信息度量或含量,也可以說是辨別N個事件中特定事件過程中所需提問“是”或“否”的最小次數。例如:從64個數(1~64的整數)中選定某一個數(采用折半查找算法),提問:“是否大于32?”,則不論回答是與否,都消去半數的可能事件,如此下去,只要問6次這類問題,就可以從64個數中選定一個數,則所需的信息量是=6(bit)。我們現在可以換一種方式定義信息量,也就是信息論中信息量的定義。設從N中選定任一個數X的概率為P(x),假定任選一個數的概率都相等,即P(x)=1/N,則信息量I(x)可定義為:上式可隨對數所用“底”的不同而取不同的值,因而其單位也就不同。設底取大于1的整數α,考慮一般物理器件的二態(tài)性,通常α取2,相應的信息量單位為比特(bit);當α=e,相應的信息量單位為奈特(Nat);當α=10,相應的信息量單位為哈特(Hart)。顯然,當隨機事件x發(fā)生的先驗概率P(x)大時,算出的I(x)小,那么這個事件發(fā)生的可能性大,不確定性小,事件一旦發(fā)生后提供的信息量也少。必然事件的P(x)等于1,I(x)等于0,所以必然事件的消息報導,不含任何信息量;但是一件人們都沒有估計到的事件(P(x)極小),一旦發(fā)生后,I(x)大,包含的信息量很大。所以隨機事件的先驗概率,與事件發(fā)生后所產生的信息量,有密切關系。I(x)稱x發(fā)生后的自信息量,它也是一個隨機變量。P(x)大時,算出的I(x)小必然事件的P(x)等于1,I(x)等于0。P(x)小時,算出的I(x)大必然事件的P(x)等于0,I(x)等于1。I(x)稱x發(fā)生后的自信息量,它也是一個隨機變量。信息熵現在可以給“熵”下個定義了。信息量計算的是一個信源的某一個事件(X)的自信息量,而一個信源若由n個隨機事件組成,n個隨機事件的平均信息量就定義為熵(Entropy)。熵的準確定義是:信源X發(fā)出的xj(j=1,2,……n),共n個隨機事件的自信息統計平均(求數學期望),即H(X)在信息論中稱為信源X的“熵(Entropy)”,它的含義是信源X發(fā)出任意一個隨機變量的平均信息量。更詳細的說,一般在解釋和理解信息熵有4種樣式(1)當處于事件發(fā)生之前,H(X)是不確定性的度量;(2)當處于事件發(fā)生之時,是一種驚奇性的度量;(3)當處于事件發(fā)生之后,是獲得信息的度量;(4)還可以理解為是事件隨機性的度量.下面為了掌握信息熵的概念,我們來做一道計算題。例如:以信源X中有8個隨機事件,即n=8。每一個隨機事件的概率都相等,即P(x1)=P(x2)=P(x3)……P(x8)=1/8,計算信源X的熵。應用“熵”的定義可得其平均信息量為3比特再例:信源X中有17個隨機事件,即n=17。每一個隨機事件的概率分別為:計算信源X的熵。信息熵的計算公式:信源X的熵:定長碼與變長碼定長碼(fixed-lengthcode)即采用相同的位數(bit)對數據進行編碼。大多數存儲數字信息的編碼系統都采用定長碼。如我們常用的ASCII碼就是定長碼,其碼長為1字節(jié)(Byte)。漢字國標碼也是定長碼,其碼長為2字節(jié)(Byte)。變長碼(variable-lengthcode)即采用不相同的位數(bit)對數據進行編碼,以節(jié)省存儲空間。例如,不同的字符或漢字出現的概率是不同的,有的字符出現的概率非常高,有的則非常低。根據統計,英文字母中“E”的使用概率約為13%,而字母“Z”的使用概率則為0.08%。又如大多數圖像常含有單色的大面積圖塊,而且某些顏色比其他顏色出現更頻繁。為了節(jié)省空間,在對數據進行編碼時,就有可能對那些經常出現的數據指定較少的位數表示,而那些不常出現的數據指定較多的位數表示。這樣從總的效果看還是節(jié)省了存儲空間。用這種方法得到的代碼,其碼的位數,也即碼長就是不固定的,故稱為變長碼。香農-范諾編碼,以及霍夫曼編碼,都是變長碼。2.赫夫曼(Huffman)編碼基本原理:按信源符號出現的概率大小進行排序,出現概率大的分配短碼,出現概率小的則分配長碼。(定長碼采用相同的碼長對數據進行編碼,如ASCII碼是定長碼,其碼長為1字節(jié)。)定理:在變長碼中,對于出現概率在的信息符號編以短字長的碼,對于出現概率小的信息符號以長字長的碼,如果碼字長度嚴格按照符號概率的大小的相反順序排列,則平均碼字長度一定小于按任何其他符號順序排列方式得到的碼字長度。2.赫夫曼(Huffman)編碼定理證明Huffman編碼的編碼步驟利用Huffman編碼方式對信源進行編碼Huffman編碼的特點定理證明設最佳排列方式的碼字平均長度為,則有:

式中為信源符號出現的概率,是符號的編碼長度。規(guī)定,。如果將的碼字與的碼字互換,其余碼字不變,經過這樣的互換以后,平均碼字長度變成,即因為,所以,也就是說最短。證畢。Huffman編碼的編碼步驟①概率統計(如對一幅圖像,或m幅同種類型圖像作灰度信號統計),得到n個不同概率的信息符號。②將n個信源信息符號的n個概率,按概率大小排序。③將n個概率中,最后兩個小概率相加,這時概率個數減為n-1個。④將n-1個概率,按大小重新排序。⑤重復③,將新排序后的最后兩個小概率再相加,相加和與其余概率再排序。⑥如此反復重復n-2次,得到只剩兩個概率序列。⑦以二進制碼元(0.1)賦值,構成霍夫曼碼字。編碼結束。利用Huffman編碼方式對信源進行編碼已知信源:編碼結果:平均碼長:=(0.35+0.20)×2+(0.15+0.10+0.10)×3+(0.06+0.04)×4=2.55(bit)(對于等長碼則需要3比特)。X1X2X3X4X5X6X7001001001111011101111利用Huffman編碼方式對信源進行編碼Huffman編碼的特點(1)平均碼長(熵);(2)平均碼長bits(等長碼需要的比特數);(3)保證解碼的唯一性,短碼字不構成長碼字的前綴;(4)在接收端需保存一個與發(fā)送端相同的赫夫曼碼表。Huffman不足方面:(1)構造出的碼不唯一,其原因是:一是在給兩個分支賦值時,可以是左支(或上支)為0,也可以是右支(或下支)為0,造成編碼的不唯一;二是當兩個消息的概率相等時,誰前誰后也是隨機的,構造出來的碼字也不唯一。(2)編碼碼字字長參差不齊,因此硬件實現起來不大方便。(3)編碼對不同信編碼效率是不同的。在概率頒很不均勻時,Huffman編碼才會有顯著的效果,在信源頒均勻的情況下,一般不使用Huffman編碼。3.算術編碼(ArithmeticCoding)算術編碼方法也是利用信源概率分布特性、能夠趨近熵極限的編碼的方法。算術編碼不按符號編碼,即不是用一個特定的碼字與輸入符號之間建立一一對應的關系,而是從整個符號序列出發(fā),采用遞推形式進行連續(xù)編碼,用一個單獨的浮點數來表示一串輸入符號。算術編碼是將被編碼的信息表示成實數0和1之間的一個間隔。信息越長編碼表示它的間隙就越小,表示這一間隙所須二進位就越多,大概率符號出現的概率越大對應于區(qū)間愈寬,可用長度較短的碼字表示;小概率符號出現概率越小層間愈窄,需要較長碼字表示。它的編碼方法比Huffman編碼方式要復雜,但它不需要傳送像Huffman編碼中的Huffman碼表,同時算術編碼還有自適應的優(yōu)點,所以算術編碼是實現高效壓縮數據中很有前途的編碼方法。特點:方法比較復雜,具有自適應能力(隨著編碼符號流中01出現的概率的變化將自適應的改變)。在信源符號概率接近時,算術編碼比Huffman編碼效率要高。算術編碼與解碼舉例假設信源符號為{00,01,10,11},這些符號的概率分別為{0.1,0.4,0.2,0.3},根據這些概率可把間隔[0,1)分成4個子間隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),其中[x,y)表示半開放間隔,即包含x不包含y。上面的信息可綜合在下表中。表信源符號,概率和初始編碼間隔符號00011011概率0.10.40.20.3初始編碼間隔[0,0.1)[0.1,0.5)[0.5,0.7)[0.7,1)如果二進制消息序列的輸入為:10001100101101。編碼時首先輸入的符號是10,找到它的編碼范圍是[0.5,0.7)。由于消息中第二個符號00的編碼范圍是[0,0.1),因此它的間隔就取[0.5,0.7)的第一個十分之一作為新間隔[0.5,0.52)。依此類推,編碼第3個符號11時取新間隔為[0.514,0.52),編碼第4個符號00時,取新間隔為[0.514,0.5146),…。消息的編碼輸出可以是最后一個間隔中的任意數。整個編碼過程如下圖示:表:編碼過程步驟輸入符號編碼間隔編碼判決110[0.5,0.7)符號的間隔范圍[0.5,0.7)200[0.5,0.52)[0.5,0.7)間隔的第一個1/10311[0.514,0.52)[0.5,0.52)間隔的最后三個1/10400[0.514,0.5146)[0.514,0.52)間隔的第一個1/10510[0.5143,0.51442)[0.514,0.5146)間隔的第六個1/10開始的兩個1/10611[0.514384,0.51442)[0.5143,0.51442)間隔的最后三個1/10701[0.5143836,0.514402)[0.514384,0.51442)間隔的從第二個1/10開始的四個1/108從[0.5143876,0.514402中選擇一個數作為輸出:0.51439表:譯碼過程步驟間隔譯碼符號譯碼判決1[0.5,0.7)100.51439在間隔[0,1)第六個1/102[0.5,0.52)000.51439在間隔[0.5,0.7)的第一個1/103[0.514,0.52)110.51439在間隔[0.5,0.52)的第八個1/104[0.514,0.5146)000.51439在間隔[0.514,0.52)的第一個1/105[0.5143,0.51442)100.51439在間隔[0.514,0.5146)的第七個1/106[0.514384,0.51442)110.51439在間隔[0.5143,0.51442)的第八個1/107[0.5143876,0.514402)010.51439在間隔[0.5143876,0.514402)的第二個1/108譯碼的消息:10001100101101譯碼器的譯碼過程應無限制地運行下去。在譯碼器中需要添加一個專門的終止符,當譯碼器看到終止符時就停止譯碼。在算術編碼中需要注意的幾個問題:①由于實際的計算機的精度不可能無限長,運算中出現溢出是一個明顯的問題,但多數機器都有16位、32位或者64位的精度,因此這個問題可使用比例縮放方法解決。②算術編碼器對整個消息只產生一個碼字,這個碼字是在間隔[0,1)中的一個實數,因此譯碼器在接受到表示這個實數的所有位之前不能進行譯碼。③算術編碼也是一種對錯誤很敏感的編碼方法,如果有一位發(fā)生錯誤就會導致整個消息譯錯。算術編碼可以是靜態(tài)的或者自適應的。在靜態(tài)算術編碼中,信源符號的概率是固定的。在自適應算術編碼中,信源符號的概率根據編碼時符號出現的頻繁程度動態(tài)地進行修改,在編碼期間估算信源符號概率的過程叫做建模。需要開發(fā)自適應算術編碼的原因是因為事先知道精確的信源概率是很難的,而且是不切實際的。當壓縮消息時,不能期待一個算術編碼器獲得最大的效率,所能做的最有效的方法是在編碼過程中估算概率。因此動態(tài)建模就成為確定編碼器壓縮效率的關鍵。算術編碼的實現相應地比Huffman編碼復雜,但當與信號源符號的出現概率接近時,算術編碼的效率高于Huffman編碼。在圖像測試中表明,算術編碼效率比Huffman效率高5%左右。4.4預測編碼

1.預測編碼的基本原理預測編碼(PredictionCoding)是根據某一種模型,利用以前的(已收到)一個或幾個樣值,對當前的(正在接收的)樣本值進行預測,將樣本實際值和預測值之差進行編碼。如果模型足夠好,圖像樣本時間上相關性很強,一定可以獲得較高的壓縮比。具體來說,從相鄰像素之間有很強的相關性特點考慮,比如當前像素的灰度或顏色信號,數值上與其相鄰像素總是比較接近,除非處于邊界狀態(tài)。那么,當前像素的灰度或顏色信號的數值,可用前面已出現的像素的值,進行預測(估計),得到一個預測值(估計值),將實際值與預測值求差,對這個差值信號進行編碼、傳送,這種編碼方法稱為預測編碼方法。預測編碼的基本思想建立一個數學模型利用以往的樣本數據對新樣本值進行預測將預測值與實際值相減對其差值進行編碼,這時差值很少,可以減少編碼碼位。2.預測編碼的分類最佳預測編碼:在均方誤差最小的準則下,使其誤差最小的方法。線性預測:利用線性方程計算預測值的編碼方法。非線性預測:利用非線性方程計算預測值的編碼方法。線性預測編碼方法,也稱差值脈沖編碼調制法(DifferentionPulseCodeModulation,DPCM)。如果根據同一幀樣本進行預測的編碼方法叫幀內預測編碼。根據不同幀樣本進行預測的編碼方法叫幀間預測編碼。如果預測器和量化器參數按圖像局部特性進行調整,稱為自適應預測編碼(ADPCM)在幀間預測編碼中,若幀間對應像素樣本值超過某一閾值就保留,否則不傳或不存,恢復時就用上一幀對應像素樣本值來代替,稱為條件補充幀間預測編碼。在活動圖像預測編碼中,根據畫面運動情況,對圖像加以補償再進行幀間預測的方法稱為運動補償預測編碼方法。3.DPCM編碼算法一幅二維靜止圖像,設空間坐標(i,j)像素點的實際樣本為f(i,j),是預測器根據傳輸的相鄰的樣本值對該點估算得到的預測(估計)值。編碼時不是對每個樣本值進行量化,而是預測下一個樣本值后,量化實際值與預測值之間的差。計算預測值的參考像素,可以是同一行掃描行的前幾個像素,這種預測叫一維預測;也可以是本行、前一行或者前幾行的像素,這種預測叫二維預測;除此之外,甚至還可以是前幾幀圖像的像素,這種預測就是三維預測。一維預測和二維預測屬于幀內預測,三維預測則屬于幀間預測。實際值和預測值之間的差值,以下式表示:e(i,j)=f(i,j)-將差值e(i,j)定義為預測誤差,由于圖像像素之間有極強的相關性,所以這個預測誤差是很小的。編碼時,不是對像素點的實際灰度f(i,j)進行編碼,而是對預測誤差信號進行量化、編碼、發(fā)送,由此而得名為差值脈沖編碼調制法,簡寫DPCM。DPCM預測編、解碼的原理圖如下。DPCM系統包括發(fā)送端、接收端和信道傳輸3個部分。發(fā)送端由編碼器、量化器、預測器和加減法器組成;接收端包括解碼器和預測器等。DPCM系統的結構簡單,容易用硬件實現。預測編碼的步驟:①f(i,j)與發(fā)送端預測器產生的預測值相減得到預測誤差e(i,j)。②e(i,j)經量化器量化后變?yōu)閑'(i,j),同時引起量化誤差。③e'(i,j)再經過編碼器編成碼字發(fā)送,同時又將e'(i,j)加上恢復輸入信號f'(i,j)。因存在量化誤差,所以f(i,j)≠f'(i,j),但相當接近。發(fā)送端的預測器及其環(huán)路作為發(fā)送端本地解碼器。④發(fā)送端預測器帶有存儲器,它把f'(i,j)存儲起來以供對后面的像素進行預測。⑤繼續(xù)輸入下一像素,重復上述過程。4.預測編碼方法的特點①算法簡單、速度快、易于硬件實現。②編碼壓縮比不太高,DPCM一般壓縮到2~4bit/s。③誤碼易于擴散,抗干擾能力差。4.預測編碼方法的特點①算法簡單、速度快、易于硬件實現。②編碼壓縮比不太高,DPCM一般壓縮到2~4bit/s。③誤碼易于擴散,抗干擾能力差。變換編碼系統中壓縮數據分為三步,即變換、變換域采樣和量化。變換本身并不進行壓縮,只是把數據映射到另一個域,使信號在變換域里容易進行壓縮,變換后的樣值更獨立和有序。這樣,量化操作通過比特分配可以有效地壓縮數據。正交變換的幾何意義現在舉一個例子,設有兩個相鄰的數據樣本x1與x2,每樣本采用3bit編碼,因此各有23=8個幅度等級。而兩個樣本的聯合事件,共有8×8=64種可能性,可用二維平面坐標表示。其中x1軸與x2軸分別表示相鄰兩樣本可能的幅度等級。對于慢變信號,相鄰兩樣本x1與x2同時出現相近幅度等級的可能性較大。因此,如圖陰影區(qū)內45°斜線附近的聯合事件,其出現概率也就較大,不妨將此陰影區(qū)之邊界稱為相關圈。信源的相關性愈強,則相關圈愈加扁長?;蛘咝蜗蟮卣f,x1與x2呈現“水漲船高”的緊密關聯特性。為了要對圈內各點的位置進行編碼,就要對兩個差不多大的坐標值分別進行編碼。當相關性愈弱時,此相關圈就愈顯方圓形狀,說明x1處于某一幅度等級時,x2可能出現在不相同的任意幅度等級上?,F在若對該數據對進行正交變換,從幾何上相當于坐標系旋轉45°,變成y1,y2坐標系。那么此時該相關圈正好處在y1坐標軸上下,且該圈愈扁長,其在y1上的投影就愈大,而在y2上的投影就愈小。因而從y1,y2坐標來看,任憑y1在較大范圍內變化,而y2卻巍然“不動”或只有“微動”。這就意味著變量y1和y2之間在統計更加相互獨立。因此,通過這種坐標系旋轉變換,就能得到一組去掉大部分甚至全部統計相關性的另一種輸出樣本。正交變換的幾何意義變換編碼技術上比較成熟,廣泛應用于各種圖像數據壓縮,如單傅立葉(Fouries)變換、沃爾什(Walsh)變換、哈爾(Haar)變換、斜(slant)變換、余弦變換、正弦變換、K-L(Karhunen-Loeve)變換等。離散Karhunen-Loeve(K-L)變換是以圖像的統計特性為基礎的一種正交變換,也稱為特征向量變換或主分量變換。2.離散余弦變換(DCT)變換編碼的理論基礎是“聯合信息熵必不大于各分量信息熵之和。”也就是說,對于聯合信源(x,y),其冗余度也隱含在信源間的相關性之中,通常不易直接對各分量進行編碼;應盡量去除各分量間的相關性。余弦變換是傅里葉變換的一種特殊情況。在傅里葉級數展開式中,如果被展開的函數是實偶函數,那么,其傅里葉級數中只包含余弦項,再將其離散化由此可導出余弦變換,或稱之為離散余弦變換(DiscreteCosineTranstorm,DCT)。離散余弦變換,在數字圖像數據壓縮編碼技術中,可與最佳變換K-L變換媲美,因為DCT與K-L變換壓縮性能和誤差很接近,而DCT計算復雜度適中,又具有可分離特性,還有快速算法等特點,所以近年來在圖像數據壓縮中,采用離散余弦變換編碼的方案很多,特別是90年代迅速崛起的計算機多媒體技術中,JPEG、MPEG、H.261等壓縮標準,都用到離散余弦變換編碼進行數據壓縮。4.6多媒體數據壓縮編碼的國際標準由于多媒體技術迅速發(fā)展,用戶如何選擇產品,用戶能自由地,組合、裝配來自不同廠家的產品部件,構成自己滿意的系統?!這就提出了一個不同廠家產品的兼容性問題,因此需要一個,全球性的統一的國際技術標準。國際標準化協會(InternationalStandardizationOrganizationISO),國際電子學委員會(InternationalElectronicsCommitteeIEC),國際電信協會(InternationalmunicationUnionITU)等國際組織,于90年代領導制定了三個重要的多媒體國際標準,①JPEG標準,②H.261標準;③MPEG標準。一.靜態(tài)圖像壓縮編碼的國際標準(JPEG)1986年CCITT和ISO兩個國際標準化組織聯合成立一個聯合圖像專家組JPEG(JointPhotograohicExoertsGroup),該小組開發(fā)研制出連續(xù)色調、多級灰度、靜止圖像的數字圖像壓縮編碼方法,這個壓縮編碼方法就是JPEG算法,于1991年成為正式的國際標準。該標準不僅適用于靜態(tài)圖像的壓縮,對于電視圖像序列中的幀內圖像的壓縮編碼也常用JPEG壓縮標準?;陔x散余弦變換(DCT)的編碼方法是JPEG算法的核心內容。JPEG只有幀內壓縮,每幀可隨機存取。JPEG壓縮方法滿足以下要求:(1)達到或接近當前壓縮比與圖像保真度的技術水平,用戶可選擇期望的壓縮/質量比。(2)能適用于任何連續(xù)色調數字圖像,且長寬比都不受限制,同時也不受限于景物內容、圖像的復雜程序和統計特性等。(3)計算機的復雜性是可控制的,其軟件可在各種CPU上完成,算法也可用硬件實現。(4)為了適應不同的應用需求,JPEG標準提供了4種不同的工作模式,用戶可以根據自身需要進行選擇。JPEG標準提供了4種不同的工作模式①順序編碼模式。每個圖像分量從左到右、從上到下掃描,一次掃描完成編碼。②累進編碼模式(遞增編碼模式)。圖形編碼在多次掃描中完成。累進編碼傳輸時間長,接收端收到的圖像是多次掃描由粗糙到清晰的累進過程。③無失真編碼模式。保證解碼后,完全精確地恢復源圖像采樣值,其壓縮比低于有失真的編碼方法。④分層編碼模式。圖像在多個空間分辨率進行解碼。當信道傳送速率慢、接收端顯示器分辨率也不同的情況下,只需要做低分辨率圖像解碼,不必進行高分辨率解碼?;陔x散余弦變換(DCT)的有失真JPEG編碼示例基于離散余弦變換(DCT)的有失真JPEG編碼算法包括基本系統和增強系統兩種不同層次的系統,并定義了兩種工作方式:順序方式和累進方式?;鞠到y采用順序方式,編碼過程中只采用霍夫曼編碼,且只能存儲兩套碼表。增加系統是基本系統的擴充,可采用累進工作方式、分層工作方式等,熵編碼時可選用霍夫曼碼或算術編碼?;贒CT編碼的過程為先進行正變換,再對DCT系數進行量化,并對量化后的直流系數和交流系數分別進行差分編碼或行程編碼,最后再進行熵編碼。(1)離散余弦變換(DCT)首先把一幅圖像(單色圖像的灰度值或彩色圖像的亮度分量或色度分量信號)分成8×8的塊進行離散余弦正變換(FDTC)或離散余弦逆變換(IDCT)。在編碼器的輸入端,原始圖像被分成一系列8×8的塊,作為離散余弦正變換(FDTC)的輸入。在解碼器的輸出端,離散余弦逆變換(IDCT)輸出許多8×8的數據塊,用以重構圖像。8×8FDCT正變換和8×8IDCT逆變換的數學定義表達式如下:IDCT:FDCT:其中:(2)量化為了達到壓縮數據的目的,對DCT系數F(u,v)需作量化處理。如果沒有量化過程,經過離散余弦逆變換(IDCT)原始圖像就能精確恢復。量化的作用是在一定的主觀保真度圖像質量的前提下,丟掉那些對視覺效果影響不大的信息。量化處理是一個多到一的映射,它是造成DCT編解碼信息損失的根源。在JPEG標準中采用線性均勻量化器。量化定義為對64個DCT變換系數F(u,v)除以量化步長Q(u,v)后四舍五入取整。

(3)DC系數編碼和AC系數的行程編碼經過離散余弦變換后得到的64個變換系數經量化后,坐標0,0的系數是直流分量DC,其它的為交流分量AC。轉換后DC系數采用DPCM編碼或差分編碼,AC系數采沿對角線方向,以“Z”字形方式進行行程掃描,進行行程編碼。(4)熵編碼為進一步達到壓縮數據的目的,需要對量化后的DC系數和行程編碼后的AC系數進行基于統計特性的熵編碼。63個AC系數行程編碼的碼字,可用兩個字節(jié)表示。JPEG建議使用兩種熵編碼方法:Huffman編碼和自適應二進制算術編碼。熵編碼可分成兩步進行,首先把DC和AC系數轉換成一個中間格式的符號序列;第二步是給這些符號賦以變長碼字。二.MPEG-1標準MPEG是運動圖像的數字圖像壓縮編碼方法,是英文MovingPictureExpertsGroup(即運動圖像專家小組)的縮寫。MPEG-1標準(ISO/IEC11172-II)是針對全活動視頻的壓縮標準,該標準包括MPEG視頻、MPEG音頻和MPEG系統三大部分。MPEG視頻是面向位速率約1.5Mbit/s全屏幕運動圖像的數據壓縮,MPEG音頻是面向每通道數率為64,128,192kbit/s的數字音頻信號的壓縮。MPEG輸入圖像亮度信號的分辨率為360×240,色度信號的分辨率為180×120,每幀29.97幀,采用雙向運動補償。MPEG把輸入的視頻信號分成組,用三種圖像格式標出:幀內圖像、預測圖像和差補圖像。每組中的第一幀用幀內圖像格式編碼,第1M、2M、3M幀(M一般選為3)用預測圖像格式編碼,其它各幀使用差補圖像格式編碼。差補圖像不僅利用過去的幀內圖像或預測圖像,也利用未來的幀內圖像或預測圖像進行運動補償,因此可以達到更高的圖像壓縮率。1.MPEG-1視頻(1)MPEG-1壓縮特點:①隨機存?。阂竽茉诒粔嚎s的視頻比特流中間進行存取,并且能在限定的時間內對視頻的任一幀進行解碼。②快速正向/逆向搜索:可對壓縮數據流進行掃描,利用合適的存取點來顯示所選擇的圖像。③逆向重播:交互式應用有時需要視頻信號能夠逆向重播。④視聽同步:提供機制使視頻音頻能持久地同步。⑤容錯性:要能在有誤差的情況下,也能避免編碼失敗。⑥編解碼延遲:傳輸質量與延遲是一對矛盾,延遲時間被看作為一個閾值參數設定。(2)MPEG-1視頻壓縮策略:為了提高壓縮比,MPEG-1同時使用了幀內圖像數據壓縮和幀間圖像數據壓縮技術。幀內壓縮算法與JPEG壓縮算法大致相同,采用基于DCT的變換編碼技術,以減少空域冗余信息。幀間壓縮算法采用預測和插補法,預測法有單純性預測(因果預測)和非因果預測(插補)。預測誤差可再通過DCT變換編碼處理,進一步壓縮,幀間編碼技術可減少時間軸方向的冗余信息。①減少時間冗余度②減少空間冗余度①減少時間冗余度MPEG通過幀運動補償有效地壓縮了數據的比特數。MPEG采用了3種類型的圖像:幀內圖(IntrapicturesI)、預測圖(PredictedPicturesP)和雙向預測圖(BidrectionalPredictionB插補圖)。這樣做的原因有兩個:一是考慮隨機訪問視頻存儲的重要性,二上運動補償可顯著降低位速率。幀內圖是獨立編碼的圖像,是不能由其他幀構造的,必須存儲或傳輸,可提供隨機存取的存取位置,但壓縮比不大;幀間插補可減少時域的冗余信息。幀間預測編碼時,要用到先前的圖(幀內圖或預測圖),當前的預測圖通常又作為后面預測圖的參考值;雙向預測圖的數據壓縮效果最顯著,但是它在預測時需要先前和后續(xù)的信息。另外,雙向預測圖不能作為其他圖的預測參考圖。幀內圖(I)和預測圖(P)及雙向預測圖(B)沿時間軸上的順序排列,如下圖:運動補償是應用得最廣泛的降低時間冗余度的方法,是許多視頻壓縮算法的基礎。運動補償有兩種算法分別是:運動補償預測法和運動補償插補法。②減少空間冗余度MPEG用于減少空間冗余度的方法與JPEG類似,混合使用變換編碼、基于視覺加權的標量量化和行程編碼等技術。整個過程分為三個階段,第一階段為基于DCT的正交變換,計算變換系數;第二階段對變換系數進行量化,把數據按Z字形掃描順序重新組合;最后對變換系數行程編碼進行熵編碼,以達到進一步壓縮數據的目的。在JPEG壓縮算法中,針對靜止圖像,對DCT系數采用等寬量化。在MPEG中的視頻信號包含靜止畫面(幀內圖)和運動信息(幀間預測圖)等不同的內容,故量化器的設計需做特殊考慮。一方面量化器結合行程編碼能使大部分數據得以壓縮;另一方面要求通過量化器,編碼器使之輸出一個與信道傳輸速率匹配的比特流。(3)MPEG-1視頻的分層結構MPEG-1視頻圖像數據流是一個分層結構,目的是把比特流中邏輯上獨立的實體分開,防止語意模糊,并減輕譯碼過程的負擔。對分層的要求是支持通用性、靈活性和有效性。MPEG標準的通用性可以用MPEG比特流來更好地說明。通用性的含義是使MPEG標準的語法規(guī)定可滿足不同的應用要求。如下表所示的MPEG視頻比特流分層結構。共包括六層,每一層支持一個確定的函數,或者是一個信號處理函數(DCT,運動補償),或者是一個邏輯函數(同步,隨機存取點)等。層次名稱功能圖像序列層隨機存取單元:上下文圖像組層隨機存取單元:視頻編碼圖像層基本編碼單元宏塊片層重同步單元宏塊層運動補償單元塊層DCT單元表:MPEG視頻比特流語法的六個層次2.MPEG-1音頻MPEG-1音頻編碼過程如下:輸入的音頻抽樣被讀入編碼器;映射器建立經濾波的輸入音頻數據流的子帶抽樣表示,如在層1或層2是子帶抽樣,在層3則是經過變換的子帶抽樣;心理聲學模型建立一組控制量化的數據;各子帶系數經過量化和編碼,再加上其他一些附加信息;最后形成已編碼的數據流。壓縮后的比特流可以按以單聲道模式、雙-單聲道模式(dual-monophonicmode)、立體聲模式和聯合立體聲模式4種模式之一支持單聲道或雙聲道。MPEG-1音頻標準提供3個獨立的壓縮層次:第一層(Layer1)、第二層(Layer2)和第三層(Layer3),用戶對層次的選擇可在編碼方案的復雜性和壓縮質量之間進行權衡。第一層的編碼器最為簡單,應用于數字小型盒式磁帶(DigitalCompactCasstte,DCC)記錄系統。第二層的編碼器的復雜程序屬中等,應用于數字音頻廣播(DAB)、CD-ROM、CD-I和VCD等。第三層的編碼器最為復雜,應用于綜合業(yè)務數字網(ISDN)上的音頻傳輸、Internet上的廣播、MP3光盤存儲等。MPEG-1標準是VCD工業(yè)標準的核心。MPEG-1音頻第3層的MP3是廣受歡迎的音樂格式。三.MPEG-2標準

MPEG-2是MPEG-1的擴充,豐富和完善。MPEG-2標準包括MPEG系統、MPEG視頻、MPEG音頻和MPEG一致性4部分內容,是運動圖象及其伴音的通用編碼國際標準。MPEG-2標準克服并解決了MPEG-1標準不能滿足的日益增長的多媒體技術、數字電視技術、多媒體分辨率和輿率等方面技術要求的缺陷。1.MPEG-2系統MPEG-2標準的系統功能是將一個或多個音頻、視頻或其他的基本數據流合成單個或多個數據流,以適應存儲和傳送。符合MPEG-2標準的編碼數據流,可以在一個很寬的恢復和接收條件下進行同步解碼。MPEG-2系統支持的5項基本功能分別是:解碼時多壓縮流的同步、將多個壓縮流交織成單個的數據流、解碼時緩沖器初始化、緩沖區(qū)管理和時間識別。MPEG-2標準的壓縮編碼系統是將視頻和音頻編碼算法結合起來開發(fā)的。系統編碼有兩種方法,其編碼輸出包括傳送流(TransportStream,TS)和程序流(ProgramStream,PS)兩種定義流。傳送流和協議ISO/IEC11172-1系統定義的流相似:程序流是一種用來傳送和保存的編碼數據或其數據的數據流。2.MPEG-2視頻MPEG-2視頻體系的視頻分量的數據速率范圍大約為2Mbit/s~15Mbit/s。MPEG-2視頻體系要求保證與MPEG-1視頻體系向下兼容,并且同時應滿足數據在存儲媒體、可視電話、數字電視、高清晰電視(HDTV)、通信網絡等領域的應用。分辨率有低(352×288)、中(720×480)、次高(1440×1080)、高(1920×1080)等不同檔次,壓縮編碼方法也從簡單至復雜有不同等級。MPEG-2標準詳細地敘述了數字存儲媒體和數字視頻通信中的圖像信息的編碼描述和解碼過程。它支持固定比特率傳送、可變比特率傳送、隨機訪問、信道跨越、分級解碼、比特流編輯以及一些特殊功能。MPEG-2視頻編碼的關鍵技術與MPEG-1基本一致,其與MPEG-1的區(qū)別主要是隔行掃描制式下,DCT到底是在場內進行不是在幀內進行由用戶自行選擇,亦可自適應選擇。一般情況下,對細節(jié)多、運動部分少的圖像在幀內進行DCT,而細節(jié)少、運動部分多的圖像在場內進行DTC。MPEG-2采用了分層的編碼體系,提供了較好的可擴充性及互操作能力。MPEG-2整個視頻比特流由逐級嵌入的若干層組成,這樣不同復雜度的解碼器可根據自身的能力從同一比特流中抽出不同層解碼,得到不同質量、不同時間/空間分辨率的視頻信號。分層編碼使同一比特流能適應不同特性的解碼器,極大地提高了系統的靈活性、有效性。為了實現分層編碼,MPEG-2提供了4種工具:空間可擴展性、時間可擴充性、信噪比可擴充性及數據分塊。MPEG-2還提供了框架及等級的概念,給出了豐富的編碼、靈活的操作模式,以適應不同場合的需要。3.MPEG-2音頻

MPEG-2標準委員會定義了兩個音頻壓縮編碼算法,一種是MPEG-2Audio或MPEG-2多通道聲音,其與MPEG-1Audio是兼容的,稱為MPEG-2BC(B

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論