數(shù)字電視原理筆記_第1頁
數(shù)字電視原理筆記_第2頁
數(shù)字電視原理筆記_第3頁
數(shù)字電視原理筆記_第4頁
數(shù)字電視原理筆記_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)字電視原理筆記第一章 彩色電視基礎(chǔ)知識(shí)1.1 光的特性與光源 光的特性光電磁波 波粒二象性 標(biāo)準(zhǔn)白光源與色溫l 白光l 色溫表征各種光源的具體光色l 絕對(duì)黑體吸收所有光l 絕對(duì)黑體所輻射的光譜成分只與溫度有關(guān)l 絕對(duì)黑體在某一溫度下所輻射的光譜成分與某光源所輻射的一致,該溫度定義為該光源的色溫 白熾燈 絕對(duì)黑體l 溫度 2800K 2854K 色溫l 相關(guān)色溫,光譜最接近但永不相等l 5種白光標(biāo)準(zhǔn) A光源 2854K B光源 4800K(相關(guān)) C光源 6770K(相關(guān))D65光源 6500K(相關(guān))E光源 等能白光(假想)1.2 光的度量 光通量與發(fā)光強(qiáng)度 輻射功率相同,波長(zhǎng)不同,兩度感光

2、不同 光通量能被人眼視覺所感受到的那部分輻射功率大小的度量 光通量的單位是“流明” 發(fā)光強(qiáng)度在某指定方向上發(fā)出光通量的能力 單位為:坎 德拉 照度和亮度 照度照明程度 單位:勒 克斯 亮度單位面積上的發(fā)光強(qiáng)度1.3 色度學(xué)概要 光的顏色和彩色三要素 光的分類 彩色光宇非彩色光 單色光與復(fù)合光 普色光與非普色光 直射光 反射光 透射光(折射光) 衍射光 光的顏色取決于主觀和客觀兩方面:主觀視覺;客觀功率波譜分析 任何一個(gè)彩色光可由亮度、色調(diào)、飽和度確定,稱為彩色三要素 亮度:明亮程度 色調(diào):顏色類別 飽和度:深淺程度 三基色原理及應(yīng)用方法 自然界當(dāng)中大部分顏色可由三種相互獨(dú)立的基色 混色不同顏色

3、混合在一起可以產(chǎn)生新的顏色(1)相加混色光源混合(電視)(2)相減混色顏料混合(印染) 相加混色的方法:時(shí)間混色法;空間混色法(顯示器、夜光屏);生理混色法 配色方程與亮度公式 1.配色實(shí)驗(yàn) 2.配色方程與亮度公式 F=RR+GG+BB RGB基本單位;RGB色系數(shù) 亮度公式: Y = 0.30R + 0.59G + 0.11B1.4 人眼的視覺特性 視覺光譜光視效率曲線 如果光的輻射功率相同而波長(zhǎng)不同,則引起的視覺效果也不同。隨著波長(zhǎng)的改變,不僅顏色感覺不同,而且亮度感覺也不同。 人眼色亮度感覺特性 1.明暗視覺 2.亮度感覺 (1)在觀察景物時(shí)所得到的亮度感覺卻并不直接由勁舞的亮度所決定,

4、還與周圍環(huán)境的背景亮度有關(guān) (2)人眼感覺亮度變化的能力是有限的 (3)亮度感覺是相對(duì)的,相同的輻射,亮度感覺不一定相同 3.視覺范圍及明暗感覺的相對(duì)性 (1)視覺范圍是指人眼所感覺到的亮度的范圍 (2)在不同的亮度環(huán)境下,人眼對(duì)于同一實(shí)際亮度所產(chǎn)生的相對(duì)亮度感覺是不相同的 人眼的分辨能力與視覺特性 人眼察覺亮度最小變化的能力是有限的1.人煙的分辨力 (1)圖像的清晰度是指人眼對(duì)圖像細(xì)節(jié)是否清晰的主觀感覺 (2)人眼對(duì)被觀察物體上剛能分辨的最緊鄰兩黑點(diǎn)或兩白點(diǎn)的視角的倒數(shù)稱為人眼的分辨力和視覺銳度 (3)人眼對(duì)彩色細(xì)節(jié)的分辨力要低于對(duì)黑白細(xì)節(jié)的分辨力,對(duì)不同彩色的細(xì)節(jié)分辨力也不一樣2.視覺惰性

5、與臨界閃爍頻率 (1)視覺惰性描述主觀亮度與光作用時(shí)間的關(guān)系 (2)人眼亮度感覺變化滯后于實(shí)際亮度變化的特性,以及視覺暫留特性,統(tǒng)稱視覺惰性 (3)當(dāng)人眼受到周期性的光脈沖照射時(shí),如果將光脈沖頻率提高到某一定值上,由于視覺惰性,眼睛便感覺不到閃爍,感到的是一種均勻的、連續(xù)的光刺激,剛好不引起閃爍感覺的最低頻率,稱為臨界閃爍頻率,主要與脈沖亮度有關(guān) (4)人眼的高亮度下對(duì)閃爍的敏感程度高于在的亮度下的情況1.5 電視圖像的傳送及基本參量 圖像分解與順序傳送 傳送一幅圖像,將整個(gè)畫面分解成許多小的單元,這些組成圖像的基本單元成為像素 電視掃描方式 1.隔行掃描 隔行掃描是將一幀電視圖像分成兩場(chǎng)進(jìn)行

6、交錯(cuò)掃描 2.逐行掃描TH=THt+THr fH=1/TH Tv=Tvt+Tvn fv=1/Tv 水平H行 垂直V場(chǎng)(幀) 逐行電視信號(hào)的傳輸帶寬太寬 隔行電視信號(hào)的傳輸帶寬比逐行少一半 隔行掃描方式 先掃 1 3 5 奇數(shù)行 奇數(shù)場(chǎng) 后掃 2 4 6 偶數(shù)行 偶數(shù)場(chǎng) 一幅圖像(1幀圖像)由奇、偶兩場(chǎng)組成逐行 TF=TV=ZTH(TF:幀周期 TV:場(chǎng)周期 Z:掃描行數(shù)/幀 ZTH:行周期)隔行掃描 fF=(1/2)fv (TF=2TV) (Z一般為奇數(shù))隔行掃描優(yōu)點(diǎn)傳輸寬帶下降一半 缺點(diǎn)(1)行間閃爍;(2)并行現(xiàn)象;(3)鋸齒化現(xiàn)象3.掃描同步 收發(fā) 在電視系統(tǒng)中為掃描同步,在信號(hào)中假如同

7、步場(chǎng)同步信號(hào)與圖像一起稱為度數(shù)信號(hào)。 電視圖像的基本參量 1.幅型比(寬高比) 人眼清晰范圍: 水平20° 垂直15° 幅型比 4:3 數(shù)字電視16:9 2.屏幕尺寸:對(duì)角線長(zhǎng)度 3.亮度、對(duì)比度、灰度 亮度平均背景亮度 對(duì)比度最高亮度/最低亮度 灰度亮度層次 4.圖像清晰度與電視分辨力 一般人眼視像最小為1.5 約600線 Z=15°/ 1 1.5 2Z 900 600 450 最低 M=(1-)Z 最差 M=0 垂直分辨力 M=Ke(1-)Z Ke=0.76 Z=625 =8% M=440線 水平分辨力 N=KM (K:幅型比) 水平與垂直分辨力相當(dāng)5.圖像信

8、號(hào)的最高頻率 掃描一個(gè)像素 fd=THt/N=(1-)/NfFZ fmax=1/2fd逐行 fF = fv fmax=(1/2)KKe(1-)/(1-)fvZ2隔行 fF = (1/2)fv fmax=(1/4)KKe(1-)/(1-)fvZ2 6.場(chǎng)頻的確定 fV大于臨界間隔頻率48Hz fV與電網(wǎng)頻率相同=50Hz(我國(guó)) 7.掃描行頻確定 M取600 Z=800左右 兼顧帶寬與清晰度 Z取525行和625行(我國(guó)采用625)1.6 兼容制模擬電視制式 1.NTSC制 美國(guó) 1953 2.PIR制 德國(guó) 1967 3.SECOM制 法國(guó) 1967 傳輸電視基本信號(hào) Y=0.30R+0.58

9、G+0.11B R-Y=0.70R-0.59G-0.11BB-Y=-0.299R-0.587G+0.886B第二章 數(shù)字電視的基本概念2.1 數(shù)字電視和高清晰度電視l 數(shù)字電視是指一個(gè)從節(jié)目設(shè)置、制作、編輯、存儲(chǔ)、發(fā)射、傳輸?shù)降男盘?hào)接收處理、顯示等全過程完全數(shù)字化的系統(tǒng)。數(shù)字化電視不是數(shù)字電視。l 數(shù)字電視真正意義是數(shù)字電視成為一個(gè)數(shù)字信號(hào)傳輸平臺(tái)l 高清晰度電視:一個(gè)視力正常的觀眾,在觀看距離為顯示屏高為3倍處所顯示的圖像清晰度與觀看原景物感覺相同 HDTV 高清 35mml 數(shù)字電視 SDTV 標(biāo)清 DVD LDTV 低清 VCD2.2 數(shù)字電視的有點(diǎn)2.3 數(shù)字電視系統(tǒng)的關(guān)鍵技術(shù) 壓縮編

10、碼和解碼 視頻 國(guó)際采用 MPEG-2 音頻 日、歐 MPEG-2 ; 美 杜比 AC-3 數(shù)據(jù)加擾和解擾 加密和解密 大屏幕顯示 中間件將應(yīng)用軟件與底層操作系統(tǒng)和硬件隔離 條件接收只允許合法用戶收看 數(shù)據(jù)分組(打包) MPEG 信道編碼和解碼2.4 國(guó)外數(shù)字電視及其標(biāo)準(zhǔn)化狀況歐洲 DVB(我國(guó)采用)美國(guó) ATSC 三大制式共存日本 ISDB2.5我國(guó)數(shù)字電視及其標(biāo)準(zhǔn)化狀況DVB第三章 數(shù)字電視信號(hào)的產(chǎn)生3.1 信號(hào)的數(shù)字化采樣 量化 編碼 每隔一定時(shí)間(或空間)間隔抽取信號(hào)的一個(gè)瞬時(shí)幅度值(樣本值),即將一連續(xù)的時(shí)間函數(shù)(空間函數(shù))變?yōu)殡x散的時(shí)間函數(shù)(空間函數(shù))。 空間采樣垂直方向 ; 時(shí)間

11、采樣各幀之間采樣定理采樣頻率大于等于信號(hào)最高頻率2倍時(shí),得到采樣信號(hào)離散信號(hào)完全可以得到原連續(xù)信號(hào) 將采樣的得到的模擬量進(jìn)行離散化的處理量化 處理量化A/D 模擬信號(hào):縱軸取值連續(xù) 數(shù)字信號(hào):縱軸取值離散 采樣值 四舍五入 量化值 采樣值與量化值之差量化誤差(量化失真、量化噪聲) 量化間隔一致均勻量化 最大量化誤差=1/2的量化階距 (量化階距:量化值最小差) 均勻量化的缺點(diǎn) 小信號(hào)時(shí),量化信噪比低 S/N (1/2) S小 S/N小 因材多采用非均勻量化即小信號(hào)時(shí)量化階距小,大信號(hào)時(shí)量化階距大 數(shù)字電視采用非均勻量化 用n比特二進(jìn)制碼表示量化值3.2 音頻信號(hào)的數(shù)字化(P40)聲音 20Hz

12、20KHz 聲波發(fā)聲 80Hz3400Hz語音 300Hz3000Hz 人耳能感知微小的失真和極大的動(dòng)態(tài)范圍,對(duì)音頻信號(hào)的數(shù)字化量化彼特?cái)?shù)比視頻要多 聲音采樣頻率:11.025Hz 22.05Hz 44.1KHz 48KHz 量化比特?cái)?shù):8bit 12bit 16bit聲道數(shù):?jiǎn)温暤?,雙聲道(立體聲),5.1聲道(環(huán)繞立體聲) 存儲(chǔ)量=(采樣頻率×比特?cái)?shù)×聲道數(shù))/8 字節(jié)聲音質(zhì)量分5個(gè)等級(jí):1.電話;2,條幅廣播AM;3.調(diào)頻廣播FM;4.CD;5.數(shù)字錄音帶3.3 視頻信號(hào)的數(shù)字化 對(duì)彩色電視信號(hào)的數(shù)字化有兩種編碼方式,即復(fù)合編碼和分量編碼 復(fù)合編碼將彩色全電視信號(hào)直接

13、PCM 分來編碼將亮度及兩個(gè)色差信號(hào)(或三基色信號(hào))分別PCM PCM 脈沖編碼調(diào)制復(fù)合編碼優(yōu)點(diǎn):一般編碼率較低;設(shè)備簡(jiǎn)單 缺點(diǎn):采樣頻率必須與彩色幅載波頻率保持一定關(guān)系分量編碼優(yōu)點(diǎn):所有環(huán)節(jié)都是數(shù)字編碼,避免了復(fù)合編碼時(shí)因反復(fù)解碼所引起的問題,編碼與電視制式無關(guān),在節(jié)目制作中簡(jiǎn)單;不會(huì)產(chǎn)生串色;亮度和色度帶寬不同;分類編碼作為電視視頻幅空編碼的國(guó)際標(biāo)準(zhǔn)1. 分量編碼采樣頻率的確定(1) 亮度信號(hào)的采樣頻率要考慮的因素:亮色信號(hào)的帶寬可以不同 亮度信號(hào)的帶寬應(yīng)為5.8MHz采樣頻率至少應(yīng)等于12.7613.2MHzfs=mfH 采用同一采樣頻率使625行/50場(chǎng)及525行/60場(chǎng)這兩種掃描制式

14、實(shí)現(xiàn)兼容 亮度信號(hào)頻率:13.5MHz(2)色差信號(hào)的采樣頻率 要考慮的因素:帶寬 色度信號(hào)的帶寬為2.8MHz降低混疊噪聲mfH用同一采樣頻率使625行/50場(chǎng)與525行/60場(chǎng)掃描制式兼容 色度信號(hào)的采樣頻率為6.75是亮度信號(hào)采樣頻率的1/2 Y:B-Y:R-Y=13.5MHz:6.7MHz:6.75MHz=4:2:2 采樣格式 色差信號(hào)均為 3.375MHz 為4:1:1格式 13.5MHz 為4:4:4格式2.量化比特?cái)?shù)的確定和量化級(jí)的分配 (1)量化比特?cái)?shù) 未經(jīng)校正的信號(hào)進(jìn)行量化采用10bit (2)亮度信號(hào)的量化級(jí)分配 在對(duì)亮度信號(hào)進(jìn)行8bit均勻量化時(shí),共分為256個(gè)等間隔的量

15、化級(jí) 量化級(jí)16對(duì)應(yīng)消隱電平,量化級(jí)235對(duì)應(yīng)峰值白電平(3)色差信號(hào)的量化級(jí)分配 8bit256級(jí) 以分量數(shù)字編碼4:2:2標(biāo)準(zhǔn)作為演播室彩色電視信號(hào)數(shù)字編碼的國(guó)際標(biāo)準(zhǔn) GY/T155-2000:方形像素通用格式 掃描制式 1125/6V/2:1 1250/5V/2:1 傳統(tǒng)隔行掃描 HDTV 視頻格式 像素4:3 方形像素通用HDTV視頻格式 像素?cái)?shù)紙幣與幅型比相同3.5 數(shù)字電視掃描制式表示方法i表示隔行掃描p表示逐行掃描國(guó)際上沒有統(tǒng)一的表示方法 1080/60i 一幀掃描行數(shù)1080 一秒鐘60行 隔行掃描 1080/50i 我國(guó)HDTV 1080/50p 3.6 電影/電視格式轉(zhuǎn)換1

16、080/50i 1080/60i24p電影格式電視 :25 30電影 :24把膠片相接的電影轉(zhuǎn)換成電視信號(hào)時(shí),需要進(jìn)行幀頻轉(zhuǎn)換 24轉(zhuǎn)60 進(jìn)行 3-2 下拉變換 24轉(zhuǎn)50 以25格/秒 接收 時(shí)間縮短4%1234 3-2下拉 電影 1112233344電視 非線性編輯所用素材的長(zhǎng)短和前后順序可以不按制作的長(zhǎng)短和先后順序進(jìn)行任意編排和剪輯第4章 視頻壓縮編碼的基本原理和方法4.1視頻壓縮的必要性和可能性分辨率720×576 8bit量化 則碼率165.9mb/s25 4:2:2數(shù)字化的視頻數(shù)據(jù)量十分巨大,不便于存儲(chǔ)和傳播,而解決的辦法是數(shù)據(jù)壓縮。數(shù)字壓縮的可能性:在視頻數(shù)據(jù)中存在著

17、極強(qiáng)的相關(guān)性即有很大的冗余,清除這樣的冗余即可達(dá)到壓縮數(shù)據(jù)的目的。(1) 空間冗余(2) 時(shí)間冗余(3) 符號(hào)冗余 用相同碼長(zhǎng)來表示不同碼長(zhǎng)的符號(hào)。(4) 結(jié)構(gòu)冗余 圖像中某些部分有相同的紋理與機(jī)構(gòu)。(5) 知識(shí)冗余 常識(shí)(6) 視覺冗余4.2視頻壓縮編碼的發(fā)展理論基礎(chǔ)信息論(香農(nóng))壓縮是去掉數(shù)據(jù)中的冗余,即保留不確定的信息,去除確定的信息。壓縮:考慮主觀特性 結(jié)合事件本身的具體含義,重要程度和引起的后果。數(shù)據(jù)壓縮的圖像組織MPEG(活動(dòng)圖像專家組)MPEG-1 1.5Mb/s VCD CD-ROMMPEG-2 DVB HDTV DVDMPEG-4 多媒體H261,H263 會(huì)議電視/電視電話

18、發(fā)展原理:第一代(基于數(shù)據(jù)統(tǒng)計(jì),沒有考慮接受者的主觀特性和具體特征)MPEG-1 MPEG-2 H261 H262第二代(考慮主觀因素和事件具體特征)MPEG-4 基于內(nèi)容的4.3視頻壓縮編碼方法和分類1.按解碼重建圖像和原始圖像是否相同分類。無失真編碼 又稱信息保持 重建圖像與原圖像一致 編碼熵編碼(變碼長(zhǎng)編碼)限失真編碼:也稱非信息保持編碼 熵壓縮編碼重建圖像與原圖像不同,有一定失真和信息有關(guān),但失真控制再一定范圍內(nèi)2.按壓縮編碼算法的原理分類基于圖像統(tǒng)計(jì)特性基于人眼視覺特性基于內(nèi)容基于模型3.按繪編圖像的不同屬性分類4.4視頻壓縮編碼方法熵編碼熵編碼是建立在隨即過程的統(tǒng)計(jì)特性基礎(chǔ)上的圖像

19、灰度或彩色信號(hào)值統(tǒng)計(jì)意義上的分布。圖像信源熵表示無失真編碼所需的比特率的下限。熵編碼輸出碼字的平均碼長(zhǎng)只能大于等于信源熵,否則將要丟失信息信源的冗余來自信源本身的相關(guān)性和信源概率分布的不均勻性。常用的熵編碼有:基于圖像概率分布特性:霍夫曼編碼 算術(shù)編碼基于圖像相關(guān)性:游程編碼1. 霍夫曼編碼霍夫曼編碼是可變長(zhǎng)度(VLC)的一種,各符號(hào)與碼字一一對(duì)應(yīng),是一種分組碼。在變字長(zhǎng)編碼中,對(duì)于出現(xiàn)概率大的符號(hào),編以短字長(zhǎng)的碼,對(duì)于出現(xiàn)概率小的符號(hào)編以長(zhǎng)字長(zhǎng)的碼。2. 算術(shù)編碼霍夫曼編碼每個(gè)符號(hào)至少需要1bit為信源中的某個(gè)符號(hào)出現(xiàn)的概率很大,其包含的信息是很小,遠(yuǎn)小于1bit,霍夫曼編碼就帶來了浪費(fèi),此

20、時(shí)可采用算術(shù)編碼。算術(shù)編碼與霍夫曼編碼的最大區(qū)別在于算術(shù)編碼不是使用整數(shù)碼,再編碼時(shí)不是按符號(hào)編碼,而是按符號(hào)序列的發(fā)展,對(duì)序列進(jìn)行編碼,并把序列編碼化為一種逆歸運(yùn)算。將被編碼的每一個(gè)信源符號(hào)按其出現(xiàn)概率大小表示成實(shí)數(shù)軸01之間的一個(gè)子區(qū)間,概率大占區(qū)間大,表示這一子區(qū)間所需二進(jìn)制小數(shù)的位數(shù)就越小。3. 游程編碼如對(duì)于二維圖像,每一行總有若干段連續(xù)的黑像素和連續(xù)的白像素,黑(白)像素點(diǎn)連續(xù)出現(xiàn)的像素點(diǎn)數(shù)稱為游程長(zhǎng)度,把黑和黑的長(zhǎng)度組合構(gòu)成編碼單元,并按其出現(xiàn)的概率分布配以不同的碼長(zhǎng) 游程編碼不局限于二維圖像。預(yù)測(cè)編碼預(yù)測(cè)編碼是利用圖像數(shù)據(jù)的相關(guān)性,用已傳輸?shù)南袼刂祵?duì)當(dāng)前像素值進(jìn)行預(yù)測(cè),然后對(duì)當(dāng)

21、前像素的實(shí)際值與預(yù)測(cè)值的差值(預(yù)測(cè)誤差)進(jìn)行編碼傳輸,而不是對(duì)當(dāng)前 像素值本身進(jìn)行編碼傳輸。當(dāng)預(yù)測(cè)比較準(zhǔn)確時(shí),預(yù)測(cè)誤差很小。因此,對(duì)預(yù)測(cè)誤差進(jìn)行編碼所需的行數(shù)要比對(duì)原始圖像本身進(jìn)行編碼傳輸要少,從而達(dá)到數(shù)據(jù)壓縮的目的。計(jì)算預(yù)測(cè)值的參考像素可以是同一行前幾個(gè)像素(一維預(yù)測(cè))也可以是本行前一行或前幾行的像素(二維預(yù)測(cè)),也可以是前幾幀圖像的像素(三維預(yù)測(cè))。一維預(yù)測(cè)和二維預(yù)測(cè)為幀內(nèi)預(yù)測(cè),三維預(yù)測(cè)為幀間預(yù)測(cè)。幀內(nèi)預(yù)測(cè) 場(chǎng)內(nèi)預(yù)測(cè) 幀內(nèi)預(yù)測(cè) 靜止圖像幀內(nèi)預(yù)測(cè)有利活動(dòng)圖像幀內(nèi)預(yù)測(cè)有利 對(duì)編行掃描進(jìn)行場(chǎng)內(nèi)預(yù)測(cè)。幀間預(yù)測(cè)由前一幀圖像推測(cè)當(dāng)前幀圖像時(shí),預(yù)測(cè)誤差進(jìn)行編碼,預(yù)測(cè)編碼如果經(jīng)量化則為有幀壓縮,如果不經(jīng)過

22、量化則為無幀壓縮。采用非均勻量化預(yù)測(cè)誤差分布于0值附近,絕對(duì)值小的部分出現(xiàn)概率大非均勻量化可得到較小的量化誤差預(yù)測(cè)誤差較小的部分分布于圖像變化較緩區(qū)域,人眼對(duì)高度變化平緩的噪音比較敏感。預(yù)測(cè)誤差較大的部分分布于圖像邊緣 或細(xì)節(jié)較多區(qū)域,人眼對(duì)圖像邊界或細(xì)節(jié)區(qū)域的噪聲敏感度較低。因此非均勻量化有利于提高圖像質(zhì)量。提高圖像質(zhì)量預(yù)測(cè)編碼在提高編碼效率的同時(shí)降低了可靠性,其像素的轉(zhuǎn)移誤碼會(huì)影響后續(xù)圖像的重組,產(chǎn)生了誤碼的擴(kuò)散 運(yùn)動(dòng)估值和運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼將前一幀作為當(dāng)前的預(yù)測(cè)值,對(duì)圖像中靜止背景部分是有效的,但對(duì)于運(yùn)動(dòng)部分并不理想,如果對(duì)當(dāng)前幀某像素(像素塊),進(jìn)行預(yù)測(cè)時(shí)知道是從前一幀哪個(gè)位置移動(dòng)過來的

23、,則預(yù)測(cè)的準(zhǔn)確值將提高運(yùn)動(dòng)估值。運(yùn)動(dòng)估值是對(duì)物體的位移做出估計(jì),即對(duì)運(yùn)動(dòng)物體前一幀到當(dāng)前幀位移的方向和像素?cái)?shù)做出估計(jì),也就是求出運(yùn)動(dòng)矢量。運(yùn)動(dòng)補(bǔ)償是根據(jù)求出的運(yùn)動(dòng)矢量找到當(dāng)前幀的像素(像素塊)是從前一幀的哪個(gè)位置移動(dòng)過來的,從而得到當(dāng)前幀像素(像素塊)的預(yù)測(cè)值。運(yùn)動(dòng)估計(jì) 遞歸法:求每個(gè)像素的運(yùn)動(dòng)矢量,但不傳遞,再接受端再求運(yùn)動(dòng)矢量 接收端比較復(fù)制。 塊匹配法:將當(dāng)前幀分割成子塊,對(duì)子塊最優(yōu)匹配,計(jì)算運(yùn)動(dòng)矢量 一般送16×16為一個(gè)子塊。運(yùn)動(dòng)矢量估值的而應(yīng)用1.運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼利用視頻序列中相鄰幀之間的時(shí)間關(guān)聯(lián)適用于所有幀間編碼2.運(yùn)動(dòng)自適應(yīng) 幀內(nèi)插通過降低發(fā)送端傳送的幀頻來降低轉(zhuǎn)

24、換頻率,未傳輸?shù)膱D像幀在接收端,由已傳送的位于該幀前和該幀后的兩個(gè)圖像幀的內(nèi)插恢復(fù)。變換編碼l 變換編碼:不直接對(duì)空間域圖像數(shù)據(jù)進(jìn)行編碼,而是前先將空間域圖像數(shù)據(jù)映射變換到另一個(gè)正交向量空間得到一組變換系數(shù),然后對(duì)這些變換數(shù)據(jù)進(jìn)行編碼傳輸。為保證平穩(wěn)性和相關(guān)性,減少運(yùn)算量,在變換編碼中,先將一幀圖像劃分成MXN的子塊,然后對(duì)每一個(gè)子塊還一變換編碼。l 變換本身不能對(duì)數(shù)據(jù)進(jìn)行壓縮,但變換后變換系數(shù)使統(tǒng)計(jì)“獨(dú)立”的相關(guān)性下降,圖像大部分能量集中在少數(shù)幾個(gè)變換系數(shù)上,這樣得到一對(duì)重建圖像。圖像重要的系數(shù)進(jìn)行量化編碼后存放壓縮數(shù)據(jù)量。信號(hào)的主要能量集中再低頻部分。人眼對(duì)低頻部分比較敏感,在頻域編碼時(shí),

25、低頻分量用較多的比特進(jìn)行細(xì)量化,高頻分量用較少的比特進(jìn)行粗量化。實(shí)際中常采用離散余弦變換(DTC)子塊 16×16或8×8像素塊第5章 音頻壓縮編碼原理及標(biāo)準(zhǔn)5.1音頻壓縮編碼的基本原理音頻壓縮編碼的必要性和可能性必要性:音頻信號(hào)數(shù)字化數(shù)據(jù)量很大,儲(chǔ)存,傳輸費(fèi)用很大可能性:音頻信號(hào)本身存在著很大的冗余。音頻信號(hào)中存在的冗余1. 時(shí)間冗余:(1) 幅度分布的非均勻性小幅度樣值比大幅度樣值出現(xiàn)頻率大(2) 相值間的相關(guān)性 相鄰相值間存在很強(qiáng)相關(guān)性 (3) 信號(hào)周期之間的相關(guān)性 短時(shí)2ms在周期與周期間存在相關(guān)性(3) 長(zhǎng)時(shí)自關(guān)性較長(zhǎng)時(shí)間間隔也存在相關(guān)性 (幾十秒)(4) 靜音

26、靜音 冗余2.頻域冗余(1) 長(zhǎng)時(shí)功率譜密度的非均勻性長(zhǎng)時(shí)功率譜密度函數(shù)呈現(xiàn)明顯的非平坦性(2) 短時(shí)功率譜密度的非均勻性短時(shí)功率譜在某些頻率上出現(xiàn)峰值,而在另一些頻率上出現(xiàn)谷值。3.聽覺冗余人耳聽不到或感知不靈敏的信號(hào)都可稱為冗余。音頻壓縮編碼方法的分類及典型代表音頻壓縮編碼可分為波形編碼、參數(shù)編碼和混合編碼。1. 波形編碼波形編碼是指直接對(duì)音頻信號(hào)時(shí)域或頻域采樣值進(jìn)行編碼,目標(biāo)是力圖使重建后的音頻信號(hào)的波形與原音頻信號(hào)波形保持一致。重建聲音質(zhì)量較高,但壓縮比不高。(1) 自適應(yīng)量化編碼自適應(yīng)分組分配按系數(shù)的不同變換DCT劃分子帶的好處:減少子帶內(nèi)信號(hào)能量分布不均勻性(或減少動(dòng)態(tài)范圍)降低各

27、子帶采樣頻率(成倍下降)2.參數(shù)編碼參數(shù)編碼是對(duì)音頻信號(hào)特征參數(shù)進(jìn)行編碼,目標(biāo)是使重建后的音頻信號(hào)與原音頻信號(hào)特性保持一致。3.混合編碼 混合編碼是波形編碼和參數(shù)編碼的結(jié)合。人耳聽覺感知特性1.對(duì)響度的感知聲音的響度就是聲音的強(qiáng)弱當(dāng)聲音弱到人的耳朵剛剛可以聽到時(shí),稱此時(shí)的聲音強(qiáng)度為聽覺閾值聽閾聽閾隨頻率變化而不同,通過實(shí)驗(yàn)可以測(cè)得聽閾頻率曲線當(dāng)聲音強(qiáng)到使人耳感覺疼痛的時(shí)候,稱為痛閾。 痛閾隨頻率變化而不同。通過實(shí)驗(yàn)可以測(cè)得痛閾頻率曲線。聽見范圍:聽閾和痛閾之間的區(qū)域人耳對(duì)不同頻率的聲音的敏感程度不同,其中對(duì)24Hz范圍的聲音最敏感,而低、高頻區(qū)不敏感,對(duì)音頻數(shù)據(jù)進(jìn)行壓縮時(shí),可以將聽閾以下的電平

28、去掉。2.對(duì)音高的感知人耳能感知的聲音頻率范圍是20Hz20000Hz人耳對(duì)音高的感知與頻率不是線性關(guān)系3.掩蔽效應(yīng)人在聽一個(gè)較強(qiáng)聲音時(shí)會(huì)掩蔽另一較弱聲音掩蔽效應(yīng)。強(qiáng)音稱為掩蔽音,弱音稱為被掩蔽音。被掩蔽音單獨(dú)存在時(shí)的聽閾稱為絕對(duì)聽閾,再掩蔽情況下必須加大被掩蔽音的強(qiáng)度才能被人耳再聽到,此時(shí)的聽閾稱為掩蔽聽閾。(1) 頻率掩蔽一個(gè)強(qiáng)純音令掩蔽頻率接近弱純音,稱為頻率掩蔽。一般情況,弱純音的頻率與強(qiáng)純音的頻率越近則弱純音就越容易被掩蔽(2) 時(shí)域掩蔽再一個(gè)強(qiáng)音信號(hào)之前或之后的弱音信號(hào)也會(huì)被掩蔽掉,稱為時(shí)域掩蔽。時(shí)域掩蔽分為超前掩蔽和滯后掩蔽,超前掩蔽520ms 滯后掩蔽50200ms心理聲學(xué)模型

29、再音頻編碼中的應(yīng)用聽覺系統(tǒng)中存在一個(gè)聽覺閾值電平低于這個(gè)電平的音頻信號(hào)聽不到,把這部分信號(hào)忽略掉不影響聽覺效果。5.2 MPEG-1音頻壓縮碼標(biāo)準(zhǔn) MPEG-1音頻壓縮算法的特點(diǎn)MPEG-1音頻壓縮算法是世界上第一個(gè)高保真音頻數(shù)據(jù)壓縮標(biāo)準(zhǔn)MPEG-1音頻壓縮算法的特點(diǎn)(1)編碼器輸入信號(hào)為線性Xcm信號(hào),采樣率32KHz 441KHz 或48KHz輸入碼率 32384Kbit/s(2)壓縮后的比特流可以支持單聲道或雙聲道(3)MPEG-1音頻壓縮標(biāo)準(zhǔn)提供了三個(gè)獨(dú)立的壓縮層次,用戶對(duì)層次的選擇存在編碼方案的復(fù)雜性和壓縮質(zhì)量之間進(jìn)行權(quán)衡。(4)可預(yù)先定義壓縮后的碼率(5)編碼后的數(shù)據(jù)流支持CRC(

30、檢錯(cuò))(6)MPEG-1音頻壓縮標(biāo)準(zhǔn)還支持再數(shù)據(jù)流中載帶附加信息。 MPEG-1音頻壓縮編碼的基本原理MPEG-1使用子帶編碼來達(dá)到既壓縮音頻數(shù)據(jù)又盡可能保證音頻音質(zhì)的目的。子帶編碼的理論依據(jù)是聽覺系統(tǒng)的掩蔽效應(yīng),主要利用頻域掩蔽效應(yīng)。MPEG-1音頻編碼標(biāo)準(zhǔn)提供了3個(gè)獨(dú)層5.3杜比AC-3 音頻壓縮算法MPEG-1音頻壓縮算法是針對(duì)最多兩聲道的音頻開發(fā)的人們對(duì)聲音有了更高的要求,即環(huán)繞3D立體聲,為此杜比公司開發(fā)了AC-3壓縮標(biāo)準(zhǔn)。5.1聲道:即原左右聲道增加中置聲道后左右聲道 0.1(1.5120Hz) 聲道杜比AC-3可以把這個(gè)獨(dú)立的全頻帶和一個(gè)超低音聲道的信號(hào)實(shí)行統(tǒng)一編碼稱為單一的復(fù)合

31、數(shù)據(jù)流。1.分析濾波器組l 分析濾波器組把時(shí)域內(nèi)的PCM樣本數(shù)據(jù)變換到頻域,在變換之前要先將音頻的樣本數(shù)據(jù)分成許多組,靠窗函數(shù),實(shí)現(xiàn)窗函數(shù)的形狀決定了濾波器組中各濾波器的形狀。l 在進(jìn)行變換編碼時(shí),時(shí)間分辨率和頻率分辨率之間是矛盾的,不能兼顧,對(duì)于穩(wěn)態(tài)信號(hào),頻率隨時(shí)間變化緩慢,要求濾波器組有好的頻率分辨率,即要求一個(gè)長(zhǎng)的窗函數(shù)對(duì)于快速變化的信號(hào)要求有好的時(shí)間分辨率,即要求一個(gè)短的窗函數(shù)。AC-3采用基于改進(jìn)離散余弦變換(MDCT)的自適應(yīng)變換編碼(ATC)算法2.譜包絡(luò)編碼從變換得到的頻率變換系數(shù)被轉(zhuǎn)換成浮點(diǎn)數(shù),所有變換系數(shù)的值都定標(biāo)為小于1.0,分析濾波器輸出的是指數(shù)和波量化的尾數(shù),兩者被編

32、碼后都進(jìn)入碼流。對(duì)指數(shù)編碼的結(jié)果是根據(jù)頻率分辨率的需要選擇一種頻譜包絡(luò)。3.比特分配按譜包絡(luò)編碼輸出的信息確定尾數(shù)編碼所需要的比特?cái)?shù),將可分配的比特?cái)?shù)按最佳的方式分配給多個(gè)尾數(shù)。4.尾數(shù)量化按比特?cái)?shù)分配程序確定的比特?cái)?shù)對(duì)尾數(shù)進(jìn)行量化5.聲道的組合將組合聲道中的幾個(gè)聲道的變換多數(shù)加以平均,各個(gè)被組合的聲道有一個(gè)特有的組合坐標(biāo)集合可用來保溫原始聲道的高頻包絡(luò)。組合對(duì)高頻包絡(luò)聲音進(jìn)行定位6.重組矩陣對(duì)高度相關(guān)的聲道的和與差進(jìn)行編碼。7.動(dòng)態(tài)范圍控制在廣播前先將音頻節(jié)目動(dòng)態(tài)范圍進(jìn)行壓縮AC-3允許每個(gè)音頻塊傳送一個(gè),動(dòng)態(tài)控制字,以使解碼器還原動(dòng)態(tài)范圍8.AC-3的幀格式形成AC-3內(nèi)一個(gè)同步幀的序列組

33、成每個(gè)塊包含6個(gè)編碼的音頻塊5.4 MPEG-2音頻壓縮編碼標(biāo)準(zhǔn) MPEG-2BC MPEG-2 AAC主要使用聽覺系統(tǒng)的掩蔽特性來壓縮聲音的數(shù)據(jù)量并通過把量化噪聲分散到各個(gè)子帶中用全局信號(hào)把噪聲掩蔽5.5 MPEG-4音頻壓縮編碼標(biāo)準(zhǔn)MPEG-4提供交互式多媒體應(yīng)用為了實(shí)現(xiàn)基于內(nèi)容的編碼引入了音頻對(duì)象的概念自然音頻編碼MPEG-4采用分組編碼的方法提供了3類編碼工具1.參數(shù)編碼器使用參數(shù)編碼技術(shù)提供兩種編碼工具HVXC 諧波矢量激勵(lì)編碼HTLV 諧波和特征線加噪聲編碼2.CECP編碼器采用碼激勵(lì)線性預(yù)測(cè)編碼技術(shù)3.時(shí)/頻編碼器采用時(shí)時(shí)/頻(T/F)編碼技術(shù)合成音頻編碼MPEG-4提供了有關(guān)合

34、成,音視頻場(chǎng)景,合成與自然內(nèi)容的同步和時(shí)空聯(lián)合等方向的描述。結(jié)構(gòu)化音頻標(biāo)準(zhǔn)提供了關(guān)于合成音樂,聲音效果,交換式多媒體場(chǎng)景下合成聲音與自然聲音的同步等方面的有效的靈活的描述。1.結(jié)構(gòu)化音頻交響樂語言SAOL任何目前已知的聲音合成方法都可以用SAOL來描述2.結(jié)構(gòu)化音頻樂譜語言(SAOL)一種樂譜和控制語言3.結(jié)構(gòu)化音頻樣本分組格式允許傳移再波表合成中使用的分組的音頻樣本數(shù)據(jù),并描述它們使用的簡(jiǎn)單處理算法4.規(guī)范化程度表描述結(jié)構(gòu)化音頻編碼過程的運(yùn)行流程5.規(guī)范化參考用于MIDI標(biāo)準(zhǔn)合成/自然音頻混合編碼聯(lián)合了自然和合成音頻編碼工具,再特定和聲音質(zhì)量上獲得滿音效果第6章 圖像/視頻壓縮編碼標(biāo)準(zhǔn)國(guó)際上

35、推出了一系列相應(yīng)的數(shù)字視/音頻壓縮編碼標(biāo)準(zhǔn)用于電視會(huì)議及可視電話系統(tǒng)的H.261 H.263 用于靜止圖像壓縮的JPEG,JPEG2000用于VCD的MPEG-1 用于數(shù)字電視、DVD、HDTV的MPEG-2以及用于多媒體通信的MPEG-4等6.1 JPEG和JPEG2000標(biāo)準(zhǔn)JPEG標(biāo)準(zhǔn)簡(jiǎn)介JPEG負(fù)責(zé)制訂連續(xù)色調(diào)靜止圖像的數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn)電視圖像的幀內(nèi)編碼也常采用JPEG。 JPEG有兩種基本的壓縮算法,一種是采用以離散余弦變換(DCT)為基理的有失真壓縮算法;另一種是采用以預(yù)測(cè)編碼技術(shù)為基礎(chǔ)的無失真壓縮算法。JPEG2000標(biāo)準(zhǔn)采用小波變換算法JPEG支持兩種圖像建立模式:順序性一次完

36、成對(duì)圖像的編碼和轉(zhuǎn)移漸近性分幾次完成對(duì)圖像的編碼和轉(zhuǎn)移JPEG4種編碼工作模式:基于DCT的順序型編碼模式基于DCT的漸近型編碼模式無失真編碼模式多分辨率編碼模式JPEG系統(tǒng)分為基本系統(tǒng)和擴(kuò)充系統(tǒng),基本系統(tǒng)采用基于DCT的順序型編碼和霍夫曼編碼。擴(kuò)充系統(tǒng)有漸近型編碼,算術(shù)編碼,無失真編碼,分層編碼基本編碼系統(tǒng)1.直流分量的編碼8×8圖像子塊經(jīng)DCT得到DC系統(tǒng),有兩個(gè)特點(diǎn):分組值較大相鄰子塊系數(shù)變化不大,因此,JPEG采用DPCM進(jìn)行霍夫曼編碼2.交流分量的編碼再對(duì)AC系數(shù)進(jìn)行編碼之前,首先將63個(gè)AC系數(shù)按ZigZag掃描方式排序成一組數(shù)組并轉(zhuǎn)換成“0”游長(zhǎng),非“0”值事件進(jìn)行霍夫

37、曼編碼。 JPEG2000標(biāo)準(zhǔn)簡(jiǎn)介JPEG2000在一個(gè)統(tǒng)一的集成系統(tǒng)中可以使用不同的成像模型,對(duì)不同類型不同性質(zhì)的靜止圖像進(jìn)行壓縮。JPEG2000的關(guān)鍵技術(shù)JPEG2000以離散小數(shù)變換算為主,可多分辨率編碼。JPEG2000將圖像變換為一系列小波系統(tǒng),這些系數(shù)可被高效壓縮和存儲(chǔ)小波的粗略邊緣清除了DCT方塊效應(yīng),對(duì)圖像高頻成分采用由粗到細(xì)的漸進(jìn)采相間隔,從而可放大注意細(xì)節(jié)。JPEG2000的特點(diǎn)高壓縮比連續(xù)色調(diào)圖像壓縮和二值圖像壓縮無失真壓縮和有失真壓縮漸近傳輸圖像比特率,圖像尺寸 有限的工作存儲(chǔ)器對(duì)碼流的隨即訪問和隨機(jī)處理誤碼魯棒性開放的體系結(jié)構(gòu)6.1.6 運(yùn)動(dòng)JPEG2000運(yùn)動(dòng)JP

38、EG200(MJP2)在一個(gè)單獨(dú)編碼器中同時(shí)支持無失真和有失真壓縮6.2 MPEG-1和MPEG-2標(biāo)準(zhǔn)l MPEG負(fù)責(zé)制定適用于數(shù)字存儲(chǔ)媒介電視廣播和通信等應(yīng)用場(chǎng)合的視頻和音頻壓縮。l MPEG-1針對(duì)1.5Mbit/s以下數(shù)據(jù)率的數(shù)字存儲(chǔ)媒介應(yīng)用的運(yùn)動(dòng)圖像及其音頻編碼標(biāo)準(zhǔn)。l 根據(jù)傳輸率1.416Mbit/s,其中1.1Mbit/s用于視頻,128Kbit/s用于音頻,其余為系統(tǒng)。 l MPEG-2不是MPEG-1的簡(jiǎn)單升級(jí) 應(yīng)用于DVD BTV HDTV VOD MVODl MPEG-1是MPEG-2的一個(gè)子集MPEG-1/-2 標(biāo)準(zhǔn)中的三種編碼類型圖像MPEG標(biāo)準(zhǔn)再實(shí)現(xiàn)高壓縮比例同時(shí)又

39、能獲得較高的重建圖像質(zhì)量,并且還要滿足能夠隨機(jī)存儲(chǔ)的要求。MPEG標(biāo)準(zhǔn)將編碼圖像分為三種類型 分別為I幀、P幀和B幀I幀圖像(基礎(chǔ)幀)只利用了單幀圖像內(nèi)的空間相關(guān)性,而沒有利用時(shí)間相關(guān)性。I幀圖像提供了隨機(jī)存取的插入點(diǎn),可作為B幀和P幀圖像的預(yù)測(cè)參考幀。P幀圖像根據(jù)前面靠近的I幀圖像或P幀圖像,進(jìn)行前向預(yù)測(cè),采用帶運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)編碼方式。B幀圖像是雙向預(yù)測(cè)“內(nèi)插幀”,它既用已轉(zhuǎn)移的再視頻序列中處于該幀前的過去幀(I或P)作預(yù)測(cè)參考幀進(jìn)行前向運(yùn)動(dòng)補(bǔ)償預(yù)測(cè),又用后面的未來幀(I或P)作為預(yù)測(cè)參考幀進(jìn)行后向預(yù)測(cè)補(bǔ)償預(yù)測(cè)。B幀不能用來作為對(duì)其它幀進(jìn)行預(yù)測(cè)補(bǔ)償預(yù)測(cè)的參考幀。 視頻碼流的分層結(jié)構(gòu)視頻數(shù)

40、據(jù)經(jīng)過壓縮編碼后形成視頻基本碼流(ES)MPEG用句法規(guī)定了一個(gè)分層結(jié)構(gòu)共分6層,從高到低依次為:視頻序列層,圖像組(GOP)層,圖像層,密塊條層,密塊層,像塊層除了密塊層和像塊層之外其它4層的數(shù)據(jù)都以起始碼開頭,一旦發(fā)生收發(fā)失步,可利用起始碼作為同步碼重新建立同步。1.視頻序列層一個(gè)宏塊包括亮度分量和空間位置上相對(duì)應(yīng)的色度分量MEPG-2定義了 3種宏塊結(jié)構(gòu):4:2:0 4:2:2 4:4:4MPEG-1定義了4:2:0宏塊結(jié)構(gòu)三種宏塊結(jié)構(gòu)分別對(duì)應(yīng)與三種高度和色度的采樣格式視頻序列頭中包含視頻序列參數(shù)(尺寸、寬度比,幀頻,數(shù)碼率,緩沖壓大?。?圖像組層 GOP是由一個(gè)視頻序列中連續(xù)的若干幀圖

41、像組成每個(gè)GOP由一個(gè)I幀和一些P幀 B幀組成GOP的第一幀一定為I幀防止由于幀間預(yù)測(cè)可能引起的傳輸誤碼的長(zhǎng)時(shí)間擴(kuò)散I幀出現(xiàn)的頻率及I、B、P幀之間如何組合,MPEG未作具體規(guī)定。B幀圖像采用未來幀做預(yù)測(cè)參考幀,傳輸幀不按顯示幀順序進(jìn)行,再傳輸B幀前先傳它的參考幀。3圖像層圖像層包括了同編碼類型的圖像有I、P、B幀圖像再圖像層頭中包含了圖像編碼的類型和時(shí)間參考信息圖像是一個(gè)獨(dú)立的顯示單元,可作為一個(gè)整體被顯示一個(gè)圖像包括亮度分量和色度分量4.宏塊條層每個(gè)宏塊條包括若干連續(xù)宏塊,其順序和掃描順序一致。宏塊條是比特流重新同步的基本單元?jiǎng)澐殖珊陦K條的主要目的在于防止誤碼擴(kuò)散。5.宏塊層宏塊是運(yùn)動(dòng)補(bǔ)償

42、預(yù)測(cè)的基本單元,為提高編碼性能,MPEG算法除了再I幀中全部宏塊都采用幀內(nèi)編碼模式之外,再P幀和B幀中以宏塊為單位自適應(yīng)地選擇合適的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)模式。6.像塊層像塊層是MPEG算法中最小的編碼單元,它包括8×8像素像塊是DCT的基本單元,像塊層的數(shù)據(jù)包含8×8個(gè)像素的樣值經(jīng)DCT變換后所生成的DCT系數(shù)的編碼碼字。MPEG1. 離散余弦變換(DCT)再M(fèi)PEG中DCT以8×8的像塊為單位進(jìn)行,生成的是8×8的DCT變換系數(shù)數(shù)據(jù)塊,DCT變換最大特點(diǎn)是對(duì)大部分圖像,能將像塊的能量集中再少數(shù)低頻DCT變換系數(shù)上。2. 量化器DCT并不能壓縮數(shù)據(jù),64個(gè)樣值經(jīng)

43、DCT變換后仍是64個(gè)變換系數(shù),只有通過DCT變換系數(shù)進(jìn)行量化處理后再結(jié)合游程編碼和熵編碼才能達(dá)到數(shù)據(jù)壓縮的目的。以某個(gè)量化編碼去除DCT變換系數(shù)既用降低DCT變換系數(shù)精度的方法,忽略掉不必要的DCT變換系數(shù)降低碼率。3.“之”字掃描與游程編碼DCT變換產(chǎn)生的二維數(shù)組,經(jīng)之字型掃描轉(zhuǎn)換為一組數(shù)字,DCT變換后的系數(shù)集中于二維矩陣左上角經(jīng)之字型掃描非零系數(shù)集中于一維數(shù)組前部,后面為長(zhǎng)串量化為零的DCT系數(shù)為游程編碼創(chuàng)造了條件4.熵編碼DCT后經(jīng)量化的系數(shù)在進(jìn)行熵編碼產(chǎn)生用于傳輸傳輸?shù)臄?shù)字比特流采用霍夫曼編碼5運(yùn)動(dòng)估計(jì)幀間編碼要進(jìn)行運(yùn)動(dòng)估計(jì),以宏塊為單位計(jì)算被壓縮當(dāng)前幀圖像與參考幀圖像對(duì)應(yīng)位置上宏

44、塊間的位置偏移,以運(yùn)動(dòng)矢量描述6.運(yùn)動(dòng)補(bǔ)償利用運(yùn)動(dòng)矢量將參考圖像中的宏塊移至水平和垂直方向上的相對(duì)應(yīng)位置,生成被壓縮圖像的預(yù)測(cè)。MPEG-2與MPEG-1的區(qū)別:1.MPEG-2定義了類與級(jí)的概念規(guī)定了6個(gè)語法子集,即類簡(jiǎn)單類、主類、4:2:2類,信噪比可分級(jí)類,空間可分級(jí)類和高級(jí)類在同一語法子集中(類)又推出了級(jí)的概念按分辨率為4級(jí) 高級(jí) 1440高級(jí) 主級(jí) 低級(jí)2.MPEG-2有按幀編碼和按場(chǎng)編碼兩種模式在MPEG-1中,沒有電視幀的概念只支持逐行掃描,不支持隔行掃描;在MPEG-2中允許隔行掃描和逐行掃描,針對(duì)隔行掃描設(shè)置了按幀編碼和按場(chǎng)編碼兩種模式。3.MPEG-2增加了可分級(jí)層MPE

45、G-2采納了多級(jí)編碼條件,將圖像的編碼碼流分為基本層和一個(gè)或多個(gè)增強(qiáng)層允許解碼器對(duì)編碼比特流的部分或全部碼流進(jìn)行編碼,得到不同時(shí)間/空間分辨率/和不同質(zhì)量等級(jí)的視頻信號(hào)6.2.6 MPEG-2的系統(tǒng)傳送層視頻和音頻經(jīng)編碼后生成各自的基本碼流ES ,在電視節(jié)目傳播和交換時(shí)將多路節(jié)目復(fù)用在一起傳輸,根據(jù)節(jié)目?jī)?nèi)容動(dòng)態(tài)分配帶寬MPEG-2系統(tǒng)復(fù)用/解復(fù)用可分兩個(gè)層次,節(jié)目級(jí)復(fù)用/解復(fù)用和系統(tǒng)級(jí)復(fù)用/解復(fù)用節(jié)目級(jí)復(fù)用/解復(fù)用指從多ES流到單路節(jié)目傳送流(TS)的復(fù)用/解復(fù)用系統(tǒng)級(jí)復(fù)用/解復(fù)用指多路節(jié)目TS間的復(fù)用/分離1.數(shù)字復(fù)用/解復(fù)用打包:以包為基礎(chǔ)對(duì)信號(hào)進(jìn)行復(fù)用/解復(fù)用2.節(jié)目流和傳送流MPEG-

46、2定義了兩種復(fù)用信息流,節(jié)目流(PS)和傳送流(TS)將ES打包成PES將PES及輔助數(shù)據(jù)再打包進(jìn)行復(fù)用生成TS或PSPS是為相對(duì)無誤碼環(huán)境設(shè)計(jì)的,為本地設(shè)計(jì)。PS包結(jié)構(gòu)是可變長(zhǎng)度的 ,TS是為易發(fā)生誤碼的轉(zhuǎn)移信道環(huán)境和有損存儲(chǔ)媒質(zhì)設(shè)計(jì)的。TS為廣播應(yīng)用的設(shè)計(jì),TS的包結(jié)構(gòu)是固定長(zhǎng)度的,當(dāng)傳輸誤碼破壞了某一TS包的圖像信息時(shí),接收機(jī)可在固定位置推測(cè)共后續(xù)包中的同步信息從而恢復(fù)同步。由于PS包長(zhǎng)度可變,一旦某一PS包同步信息丟失,接收機(jī)無法確定下一個(gè)同步位置會(huì)造成失真。3.PES包的組成的功能: PES包中包含了數(shù)碼率,定時(shí)及數(shù)據(jù)描述等信號(hào)和數(shù)據(jù)4.TS包(1)鏈接頭:包同步,包標(biāo)識(shí),加擾控制,

47、誤碼控制(2)適配域:1)視頻、音頻編碼器的同步 2)壓縮碼流隨機(jī)進(jìn)入機(jī)制 3)本地節(jié)目插入機(jī)制(3)凈荷:1)視頻、音頻 PES包以及輔助數(shù)據(jù) 2)描述單路節(jié)目復(fù)用信息的節(jié)目映射表 3)描述多路節(jié)目復(fù)用的節(jié)目關(guān)聯(lián)表5.單路節(jié)目 TS流復(fù)用的一般流程首先,在PID=0的TS包中PAT表中找出攜帶PMT表的碼流的PID值,然后根據(jù)PID值到處描述所需節(jié)目結(jié)構(gòu)的PMT碼流,從此PMT中找出組成該節(jié)目的多ES流的PID,根據(jù)這些PID值就可以從TS包中將多ES流的數(shù)據(jù)復(fù)用出來,并重新組成各ES流送給相應(yīng)的解碼器進(jìn)行解碼 查表法 6.3 MPEG-4視頻編碼標(biāo)準(zhǔn)6.3.1 MPEG-4視頻編碼功能與特

48、點(diǎn)l MPEG-4標(biāo)準(zhǔn)以音/視頻對(duì)象的形式對(duì)AV場(chǎng)景進(jìn)行描述,提供了一種嶄新的交互方式基于內(nèi)容的交互l MPEG-4提出了基于內(nèi)容的存取概念,能對(duì)任意形狀的視頻對(duì)象進(jìn)行有效表示,使用戶可與場(chǎng)景進(jìn)行交互 特點(diǎn):基于內(nèi)容的交互;高壓縮率;靈活多樣的存取6.3.2 MPEG-4視頻編碼工具箱l MPEG-4視頻組通過激活由接收機(jī)下載軟件解碼工具的機(jī)制,使MPEG-4標(biāo)準(zhǔn)具有開放、靈活、可擴(kuò)展的特點(diǎn).l MPEG-4通過MSDL可以選擇若干工具靈活的組合成一個(gè)算法,也可以集成若干個(gè)工具貨算法構(gòu)成類,以適用于某些特定的應(yīng)用6.3.3 MPEG-4視頻編碼技術(shù) MPEG-4采用驗(yàn)證模型法1 視頻驗(yàn)證模型的

49、一般結(jié)構(gòu) MPEG-4視頻驗(yàn)證模型引入了視頻對(duì)象平面的概念,視頻驗(yàn)證模型所編碼的視頻輸入將不再只是矩形壓縮,可以是任意形狀的,視頻對(duì)象平面圖像區(qū)域,且該區(qū)域的形狀和位置可隨幀變化2 視頻驗(yàn)證模型的數(shù)據(jù)結(jié)構(gòu)視頻驗(yàn)證模型在其語法中使用了4個(gè)層次的數(shù)據(jù)結(jié)構(gòu):視頻會(huì)晤;視頻對(duì)象;視頻對(duì)象層;視頻對(duì)象平面3 基于VOP的編碼編碼主要針對(duì)某一時(shí)刻VO的形狀,運(yùn)動(dòng)紋理這類信息進(jìn)行,驗(yàn)證模型中的主要編碼工具,就是對(duì)這3類信息進(jìn)行編碼工具,紋理編碼,運(yùn)動(dòng)估計(jì)及補(bǔ)償類似于MPEG-1/-2真正新增的部分是形狀編碼6.3.4 MPEG-4在數(shù)字電視領(lǐng)域的應(yīng)用1.虛擬演播室(1)虛擬出席;(2)虛擬重效;(3)虛擬跟

50、蹤;(4)虛擬廣告2.交互電視利用MPEG-4的交互性和支持多個(gè)并發(fā)數(shù)據(jù)流編碼的特點(diǎn),可實(shí)現(xiàn)交互電視使用3.視頻編輯MPEG-4定義的簡(jiǎn)單演播室類能夠成為視頻編輯提供高質(zhì)量的信號(hào),核心演播室類在簡(jiǎn)單演播室類的基礎(chǔ)上增加了p幀,這兩個(gè)新擴(kuò)展的類,使MPEG-4用于高質(zhì)量的視頻編碼稱為可能6.4 MPEG-7標(biāo)準(zhǔn)簡(jiǎn)介 MPEG-7多媒體內(nèi)容描述接口 它不是信息壓縮編碼標(biāo)準(zhǔn),而是一種多媒體內(nèi)容描述標(biāo)準(zhǔn)MPEG-7的目標(biāo) MPEG-7可獨(dú)立于MPEG的其他標(biāo)準(zhǔn)使用,MPEG-7的描述將與所描述內(nèi)容的壓縮編碼或存儲(chǔ)方式無關(guān),任何經(jīng)壓縮或未經(jīng)壓縮的多媒體信息都可用MPEG-7標(biāo)準(zhǔn)來描述MPEG-7的應(yīng)用 1.視頻數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論