數(shù)字電視視音頻信號壓縮編碼技術(shù)_第1頁
數(shù)字電視視音頻信號壓縮編碼技術(shù)_第2頁
數(shù)字電視視音頻信號壓縮編碼技術(shù)_第3頁
數(shù)字電視視音頻信號壓縮編碼技術(shù)_第4頁
數(shù)字電視視音頻信號壓縮編碼技術(shù)_第5頁
已閱讀5頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第三章 數(shù)字電視視音頻信號壓 縮編碼技術(shù)3.1視頻信號緊縮的必要性和可行性一、緊縮的必要性 1、電視信號數(shù)字化后的數(shù)據(jù)量過大,使普通的存儲器難以接受。 一盤12cm直徑的VCD光盤,可播放74分鐘的活動圖像及相當(dāng)于CD數(shù)字激光唱片音質(zhì)的聲音。存儲容量為650MB=6508=5200Mbit。 4:2:2規(guī)范:R=720576258+2360576258=165.9Mb/s 一張12cm直徑的VCD光盤可存儲的時間 5200/165.931秒2、數(shù)碼率太高使數(shù)字電視信號頻帶過寬,頻道利用率太低,甚至無法包容。分量編碼:4:2:2規(guī)范:R=165.9Mb/s 頻帶寬度B83MHz 4:4:4規(guī)范:

2、R=278.7Mb/s B140MHz 4次群的R為.264Mb/s,可傳話路1920路 。1920路傳不了一套4:2:2的數(shù)字電視節(jié)目;用11套模擬電視節(jié)目換一套數(shù)字電視節(jié)目。 信號頻帶太寬,頻帶利用率低,頻率資源嚴(yán)重浪費。同時對電路要求高,設(shè)計復(fù)雜,維修困難,設(shè)備造價高。 二、緊縮的可行性來自: 圖像本身存在大量的冗余: 空間相關(guān)冗余 時間相關(guān)冗余 符號相關(guān)冗余 構(gòu)造相關(guān)冗余 知識相關(guān)冗余人眼的視覺冗余1、圖像本身存在大量的冗余度 空間相關(guān)冗余 時間相關(guān)冗余 符號相關(guān)冗余 構(gòu)造相關(guān)冗余 知識相關(guān)冗余2、人眼的視覺冗余 人眼對事物細節(jié)的分辨力是有限制的; 對顏色畫面的分辨力低于對黑白畫面的分

3、辨力; 對高頻信號變化的分辨率低于低頻信號的分辨率; 對屏幕中心區(qū)失真的敏感度要高于屏幕周圍的失真。 三、緊縮的途徑及方法 1、行、場逆程不傳送,在接納端重新構(gòu)成。 2、亞奈奎斯特取樣 fs2fm。使混疊分量與亮度譜線交錯。 3、采用高效編碼信源編碼。去除電視信號中的冗余。3.3 常用的數(shù)字電視視頻緊縮編碼技術(shù)一、 預(yù)測編碼1、預(yù)測編碼的根本原理 利用某種數(shù)學(xué)方式對以前知的相關(guān)數(shù)據(jù)進行運算,得出一個與當(dāng)前傳送樣值相接近的預(yù)測值,進而把當(dāng)前要傳送的值減去預(yù)測值,得到一個誤差值預(yù)測誤差,將這個誤差值編碼后傳送出去。 當(dāng)前樣值預(yù)測值預(yù)測誤差第一個樣值:16016;第二個樣值:16160;第三個樣值:

4、第3第20第360樣值:第360第3590第361樣值:第361第360 23516219第362樣值:第362第3610第720樣值:第720第7190第二行第1第一行第10;第二行第361第一行第3610當(dāng)前編碼樣值預(yù)測值前一個樣值=預(yù)測誤差2、預(yù)測編碼的意義 去除了電視信號中空間、時間上的冗余。 給出了良好的概率分布,為后面的緊縮編碼發(fā)明了條件。3、DPCM差值預(yù)測編碼的實現(xiàn) 原理方框圖式中 為前值序列, 稱為預(yù)測系數(shù)也叫相關(guān)系數(shù),且滿足: 預(yù)測項與預(yù)測系數(shù)的選擇 ?。篴1=1/2、a2=1/4、a3=1/8、a4=1/8、a5=0、a6=0 一維、二維和三維預(yù)測一維預(yù)測: 參考樣值僅與

5、xN當(dāng)前樣值處于同一掃描行內(nèi)的預(yù)測編碼;二維預(yù)測: 參考樣值除了本行之外還和前一行或前幾行的樣值有關(guān); 三維預(yù)測: 參考樣值除了本幀之外還和前一幀或前幾幀圖像的樣值有關(guān)。 由于一、二維預(yù)測都是在同一幀內(nèi)進展預(yù)測,所以也稱為幀內(nèi)預(yù)測編碼;三維預(yù)測與前面的幀有關(guān),所以也稱為幀間預(yù)測編碼。 二、 變換編碼變換編碼也有變換、量化、編碼三大過程:1、離散余弦變換DCT的根本思想 DCT變換是把空間域上的信號變換到頻率域上,使能量在空間域上分散分布的原信號變換后能量在頻率域上相對集中到某些少數(shù)區(qū)域內(nèi),即將空間域上的信號樣值變換成頻率域上的系數(shù),經(jīng)變換后的系數(shù)按頻率由低到高分布。2、處置步驟: 將一幅圖像分

6、成假設(shè)干像塊,每個像塊的大小為88個像素。 對每一塊像塊進展DCT變換。 此式闡明這是一個二維的變換關(guān)系式,即在一個平面上進展變換。 結(jié)論: 像塊樣值數(shù)據(jù)f(x,y)為88的矩陣,經(jīng)DCT后的頻域系數(shù)F(u,v)也為88的矩陣。此矩陣的左上角系數(shù)F00相當(dāng)于像塊中64個樣值的平均直流成分,其他的63個F(u,v)均表示64個樣值中所含交流成分的系數(shù) 。 經(jīng)過變換后,較大的系數(shù)集中在直流分量及附近的低頻區(qū)域,即信號能量主要集中在直流及低頻區(qū)域的少數(shù)變換系數(shù)上,高頻區(qū)域的系數(shù)多為0或很小。如:變換系數(shù): 圖像樣值:88DCT基圖像 對變換后的系數(shù)進展量化。 進展之字形掃描讀出和零游程編碼。2、處置

7、步驟:將一幅圖象分成假設(shè)干像塊,每個像塊的大小為88個像素。 對每一塊像塊進展DCT變換。對變換后的系數(shù)進展量化。進展之字形掃描讀出和零游程編碼。3、DCT緊縮編碼的過程為:三、統(tǒng)計編碼熵編碼統(tǒng)計編碼是基于信號統(tǒng)計特性的編碼技術(shù)。根本原理: 按信源符號出現(xiàn)概率的不同分配以不同長度的碼字bit數(shù),概率大的分配以短的碼字,概率小的分配以長的碼字。這樣使最終的平均碼長很小,總的數(shù)碼率大大降低。 1、信息熵的概念 香農(nóng)的信息論以為,信源中所含有的平均信息量熵就是進展無失真緊縮編碼的實際極限。緊縮編碼只需不低于此極限,那就總能找到某種編碼方法去恣意的逼近熵。平均信息量: 假設(shè)是非等概情況,設(shè)離散信源是一

8、個由n個符號組成的符號集,其中符號 出現(xiàn)的概率為 ,且有 ,那么x1,x2,x3xn所包含的信息量分別為 。于是,每個符號所含信息量的統(tǒng)計平均值,即平均信息量為:即信息源X的熵定義為:單位為bit/符號。平均碼字長度 設(shè)Ni為數(shù)字信號第i個碼字的編碼長度即二進制代碼的位數(shù),其相應(yīng)出現(xiàn)的概率為Pi,那么該數(shù)字信號所賦予的碼字的平均長度為:編碼效率比特碼字將每個符號按其概率由大到小順序陳列起來。將最小的兩個概率相加,并對其中較大的概率用“1表示,較小的概率用“0表示。反之也可,但賦值方式應(yīng)堅持一致。把求出的和值作為一個新的概率值再按重新陳列。按照這樣的步驟反復(fù)進展,直到概率加到1。分配碼字。由概率

9、為1處開場沿各點參與運算的分支線從后向前從右向左逐一寫出“0、“1的代號從高位到低位寫直到各符號為止。得到的代碼就是各信源符號的碼字。反之也可,從符號到集合點p1從左到右,但代碼的寫出是從低位到高位。2、霍夫曼編碼 霍夫曼編碼的詳細步驟: xi: x1 x2 x3 x4 x5 x6 x7 x8 pi:0.20 0.19 0.10 0.15 0.005 0.17 0.18 0.005 再舉例: 符號A、B、C、D、E、F、G、H概率 0.10、0.18、0.40、0.05、0.06、0.10、0.07、0.04單義可譯性 :例如:接納到下面例子中的一串?dāng)?shù)據(jù)序列110010110111011110

10、1,那么它只能獨一地分為下述碼字:110,0,1011,0,11101,11101,110B,0A,1011G,0A,11101D,11101D。 二、霍夫曼編碼的平均碼長和編碼效率:以上一例結(jié)果為例:平均碼長: 信息熵 :那么編碼效率為: 3.4 其他視頻緊縮編碼技術(shù)引見一、具有運動補償?shù)膸g編碼技術(shù) 1、幀間預(yù)測編碼的概念 據(jù)統(tǒng)計,對普通的彩色電視廣播節(jié)目,在相鄰幀之間亮度信號平均只需7.5的像素有變化,而色度信號平均只需6.5的像素有變化。 電視圖像的幀差信號具有更強的相關(guān)性??梢?,圖像的時間冗余度是相當(dāng)大的。 幀間預(yù)測編碼取不同幀場的像素作為預(yù)測像素,求其差值,再對差值進展編碼。 幀間

11、預(yù)測編碼的目的正是在于消除這些時間冗余。 2、運動處置運動估計和運動補償 運動處置原理 通常,電視節(jié)目中只需畫面鏡頭不切換,前后幀圖像的內(nèi)容是差別不大的,許多情況下僅僅很少一部分在運動,因此,只需知道畫面中哪部分在運動,其運動方向和位移量怎樣樣,把就可以從前一幀圖像中預(yù)測出當(dāng)前幀圖像。又由于運動預(yù)測會有誤差,需求對幀間預(yù)測誤差信號進展編碼和傳送,因此我們只需求傳送運動矢量和幀間預(yù)測差值,從而可以大幅度緊縮碼率。 2、運動處置運動估計和運動補償 k-1幀, x1y1 k幀,挪動到x1+x,y1+y 位移矢量D(x,y) 把k幀x1+x,y1+y移到 k-1幀x1,y1 點,再與k-1 幀求差值

12、估計算出運動物體的位移量,這就是運動估值 借助運動估值得到的物體幀間位移矢量進展運動補償后,再做幀間預(yù)測可以使預(yù)測誤差明顯下降。運動處置的兩個過程: 運動估計:在幀間預(yù)測之前,對運動物體從上一幀到當(dāng)前幀位移的方向和像素數(shù)做出估計,即求出運動矢量。 運動補償:按照運動矢量,找到上一幀中相應(yīng)的塊,求得對當(dāng)前幀的估計預(yù)測值這個過程稱為運動補償。 運動處置的全過程如前面運動著的球 然后用這個運動矢量將K-1幀過去幀位移。 將K-1幀(5,4)球的數(shù)據(jù)位移D(10,6)的位置, 移到(15,10)的位置,做K幀的預(yù)測估計值-運動補償。 K幀為當(dāng)前幀,把K幀的球的數(shù)據(jù)拿到K-1幀中比較,直到找到K-1幀中

13、球的位置,記下K幀挪動了多少,計算出運動矢量D(10,6)運動矢量; 塊匹配法 對當(dāng)前幀中的每一個宏塊MB,在前一幀中以與其對應(yīng)的位置m,n為中心,上下左右四個方向搜索找與其最正確匹配的宏塊MB,宏塊MB和MB在程度和垂直方向上的間隔即是求得的位移矢量。 二、具有運動補償?shù)膸g內(nèi)插編碼技術(shù) 在某些場所,為降低碼率發(fā)送端會每隔一段時間丟棄一幀或幾幀圖像,而在接納端再利用圖像的幀間相關(guān)性將丟棄的幀恢復(fù)出來,以防止幀率下降引起閃爍和動作的不延續(xù),這種技術(shù)稱為幀間內(nèi)插編碼技術(shù)。最簡單的幀間內(nèi)插編碼是線性內(nèi)插法。 假設(shè)在二個知數(shù)據(jù)中的變化為線性關(guān)系,因此可由知二點的座標(biāo)(A, B)去計算經(jīng)過這二點的斜線

14、。 (y-y1)/(x-x1)y2-y1)/(x2-x1)=直線斜率, yy1(y2-y1)(x-x1)/(x2-x1) 另外,在幀間內(nèi)插中的位移估值普通要對運動區(qū)的每一個像素進展,而不是對一個子塊。 3.5 數(shù)字電視聲音緊縮編碼技術(shù)一、 聲音信號緊縮編碼的必要性常用的聲音信號有:窄帶語音3003400Hz,fs=8KHz寬帶語音視頻會議507000Hz,fs=16KHz數(shù)字音頻廣播信號2015KHz,fs=32KHz高保真立體聲2020KHz,fs=44.1KHz或fs=48KHz3.5 數(shù)字電視聲音緊縮編碼技術(shù)例如:激光唱盤CD:fs=44.1KHz,n=16bit,共兩個聲道:其R44.

15、1162=1.411Mb/s;設(shè)信道編碼率R=1/2,那么實踐上傳送的數(shù)據(jù)率為21.411Mb/s;假設(shè)頻帶利用率按(2b/s)/Hz計,那么傳送一套這樣的立體聲節(jié)目所需射頻帶寬為:B21.411Mb/s/(2b/s)/Hz1.411MHz 假設(shè)5.1聲道: fs=48KHz,n=18bit,6個聲道,R=481865.184Mb/s。 而高明晰度電視圖像信號緊縮后的碼率大約為30Mb/s左右。二、聲音緊縮編碼的能夠性 聲音信號客觀統(tǒng)計規(guī)律 人耳聽覺的生理、心思學(xué)要素 根據(jù)聲學(xué)實際,人耳存在著一個聽覺的閾值,當(dāng)某個頻率的聲音的強度聲強小于某個特定的數(shù)值之后,人耳就聽不見了,即當(dāng)聲音弱到人的耳朵

16、剛剛可以聽見時,我們稱此時的聲音強度為“聽閾。 掩蔽效應(yīng) 指一個聲音的聽覺感受遭到另一個聲音的影響的景象。其中前者稱為被掩蔽音,后者稱為掩蔽音。絕對聽閾:被掩蔽音單獨存在的聽閾分貝值。掩蔽聽閾同聽閾:在掩蔽情況下的聽閾。 1、頻率掩蔽效應(yīng): 一個頻率的聲音掩蓋另一個頻率的聲音,這就是頻率掩蔽效應(yīng)。2、時域掩蔽效應(yīng):a.預(yù)掩蔽前掩蔽: 在時域中,在聽到強信號之前的短暫時間內(nèi),原已存在的弱音可以被掩蔽而聽不到,這種景象稱為預(yù)掩蔽。2、時域掩蔽效應(yīng):b.同時掩蔽同期掩蔽: 強音與弱音同時存在時,弱音被強音掩蔽稱為同期掩蔽。c.后掩蔽: 當(dāng)強音消逝后,經(jīng)過較長的持續(xù)時間,才干重新聽到弱音信號恢復(fù)到以前

17、的聽力,這種景象稱為后掩蔽。 在編碼時 可將時間上彼此相繼的取樣值歸并成塊; 由掩蔽效應(yīng),人耳聽不到的不傳; 對于人耳不能分辨方向的頻率接近的高頻音,不用再分聲道,將多聲道的高頻音耦合到一個公共通道; 采用子頻帶編碼,由每個子頻帶中的最小同聽閾來確定各子頻帶取樣值的必要的量化。 3.6 兩種主要聲音緊縮編碼的方法簡介一、MUSICAM編碼 MUSICAM-掩蔽型自順應(yīng)通用子頻帶集成編碼與復(fù)用。1、MUSICAM的技術(shù)特征 這種編碼的方法屬于子頻帶編碼,它是用濾波器組將寬頻帶的聲音信號的頻譜分割為寬度均為750Hz的32個子頻帶。每個子帶的量化和比特分配是利用人耳聽覺的心思聲學(xué)模型和音頻信號統(tǒng)計

18、特性的內(nèi)在聯(lián)絡(luò)確定,并去除音頻信號中的冗余和不相關(guān)部分,來實現(xiàn)有效的數(shù)據(jù)緊縮。2、MUSICAM的三個層次 Layer1簡單版本。在CD質(zhì)量下,比特率為384Kb/s,緊縮比為1:4。主要用于數(shù)字盒式錄音磁帶、VCD。Layer2規(guī)范版本,編碼器的復(fù)雜度屬中等。CD質(zhì)量下,比特率為192Kb/s左右,緊縮比為1:8。在數(shù)字演播室、DAB、DVB、電纜和衛(wèi)星廣播ADR、計算機多媒體等數(shù)字節(jié)目的制造、交換、存儲、傳送中得到廣泛運用。Layer3復(fù)雜版本。它是MUSICAM和ASPEC自順應(yīng)聲頻頻譜感知熵編碼的混合編碼。聲音質(zhì)量最正確。在CD質(zhì)量下,運用的比特率為128Kb/s,緊縮比為1:12。主要用于通訊、尤其適用于ISDN綜合業(yè)務(wù)數(shù)據(jù)網(wǎng)上傳送廣播節(jié)目、運用于Internet網(wǎng)的聲音點播、MP3光盤存儲等。二、杜比AC-3編碼 AC-3是杜比實驗室開發(fā)的數(shù)字音頻編碼技術(shù),它提供5.1環(huán)繞立體聲。由于AC-3系統(tǒng)編碼靈敏,在消費電子領(lǐng)域,目前大多數(shù)的電影制造都運用了該技術(shù),美國等國家的數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論