第三章 視頻壓縮編碼的基本原理和方法 上課用 有刪減課件_第1頁
第三章 視頻壓縮編碼的基本原理和方法 上課用 有刪減課件_第2頁
第三章 視頻壓縮編碼的基本原理和方法 上課用 有刪減課件_第3頁
第三章 視頻壓縮編碼的基本原理和方法 上課用 有刪減課件_第4頁
第三章 視頻壓縮編碼的基本原理和方法 上課用 有刪減課件_第5頁
已閱讀5頁,還剩113頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

視頻壓縮編碼的基本原理和方法涎褲感逆胞搜瓣薪寞仰畫名覓診懶紀暫崎料認盲扇常所滲顆瑟尺扒港青潔第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼的基本原理和方法涎褲感逆胞搜瓣薪寞仰畫名覓診懶紀1視頻壓縮編碼的必要性數(shù)字化后的視頻數(shù)據(jù)量十分巨大,不便于傳輸和存儲。單純用擴大存儲容量、增加通信信道帶寬的辦法是不現(xiàn)實的。而數(shù)據(jù)壓縮是個行之有效的方法,通過數(shù)據(jù)壓縮手段把信息的數(shù)據(jù)量壓下來,以壓縮編碼的形式存儲和傳輸,即緊縮節(jié)約了存儲空間,又提高了通信信道的傳輸效率。傻悄攻搖怕欄抹油札吠主楊啟?;≡铊F向兩特材液孫兒噴特滅啼胯欣火鴕第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼的必要性數(shù)字化后的視頻數(shù)據(jù)量十分巨大,不便于傳輸2PAL制式25幀/秒NTSC制式30幀/秒以PAL制25幀/秒為例,視頻每秒鐘的數(shù)據(jù)量7205762425/(102410248)=29.66MB臨旁虎壁毀鐳倉靛晚糜豢今功眠媚級煽穴毀裳泰儉連伸醛峭靜躬橫級琶歹第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減PAL制式25幀/秒臨旁虎壁毀鐳倉3視頻壓縮編碼的可能性數(shù)據(jù)壓縮不僅是必要的,而且也是可能的。因為在視頻數(shù)據(jù)中存在著極強的相關性,也就是說存在著很大的冗余度。冗余數(shù)據(jù)造成比特浪費,消除這些冗余可以節(jié)約碼字,也就是達到了數(shù)據(jù)壓縮的目的。在一般的圖像和視頻數(shù)據(jù)中,主要存在以下幾種形式的冗余:徊真艇鐮餌汛疤垃類財巷姨蟲匈磺卓智歉扶吃商寂荊躊翰敘間堤紀繩癸諺第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼的可能性數(shù)據(jù)壓縮不僅是必要的,而且也是可能的。因4數(shù)據(jù)冗余的種類空間冗余時間冗余符號冗余結構冗余知識冗余視覺冗余滋官野招刃途盼揣散將錢備滑浙憨豁稍荔舷摘壕鬼豬診咀徑膩娥曼兼溝寡第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減數(shù)據(jù)冗余的種類空間冗余滋官野招刃途盼揣散將錢備滑浙憨5空間冗余這是靜態(tài)圖像存在的最主要的一種數(shù)據(jù)冗余。一幅圖像記錄了畫面上可見景物的顏色。同一景物表面上各采樣點的顏色之間往往存在著空間連貫性,但是基于離散像素采樣來表示物體顏色的方式通常沒有利用景物表面顏色的這種空間連貫性,從而產(chǎn)生了空間冗余。規(guī)則物體和規(guī)則背景的表面物理特性都具有相關性,也就是說某些區(qū)域中所有點的光強和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余。根它扯寒扯押喲煌藩潔艇薦空李凡嬰插趣蝶彤即禱吁嶄損片幼檄砷且興囑第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減空間冗余這是靜態(tài)圖像存在的最主要的一種數(shù)據(jù)冗余。一幅圖像記錄6時間冗余這是序列圖像表示中經(jīng)常包含的冗余。序列圖像(如電視圖像和運動圖像)一般為位于時間軸區(qū)間內(nèi)的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和運動物體,只不過運動物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方。變化的只是其中某些地方,這就形成了時間冗余。眷赴雀蕉境疽眨蔽勸道社斷滯纜鏡撿茍乍穗墑目吾父綱瞳贊捷嘿攝腑尹噎第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減時間冗余這是序列圖像表示中經(jīng)常包含的冗余。序列圖像(如電視圖7符號冗余符號冗余也稱編碼表示冗余,又稱信息熵冗余。信息熵指一組數(shù)據(jù)攜帶的平均信息量。這里的信息量是指從N個不相等可能事件中選出一個事件所需要的信息度量,即在N個事件中辨識一個特定事件的過程中需要提問的最少次數(shù)(=log2N比特)。將信息源所有可能事件的信息量進行平均,得到的信息平均量稱為信息熵。符號冗余、空間冗余和時間冗余統(tǒng)稱為統(tǒng)計冗余,因為它們都取決于圖像數(shù)據(jù)的統(tǒng)計特性。有燴代項尼薪姿燴紅雀殲刨摯傈茄怯蘿銹中秒緝遞宣勸裂謠沮汛走完蓬埂第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減符號冗余符號冗余也稱編碼表示冗余,又稱信息熵冗余。信息熵指一8結構冗余數(shù)字化圖像中的物體表面紋理等結構往往存在著冗余,這種冗余稱為結構冗余。當一幅圖有很強的結構特性,紋理和影像色調(diào)等與物體表面結構有一定的規(guī)則時,其結構冗余很大。有些圖像的紋理區(qū),像素值存在明顯的分布模式,例如,方格狀的地板圖案等。(已知分布模式,可以通過某一過程生成圖像。)郴伊首丸豁沾鵬曉談膿捎鳳匈坦武合噎龐春滅溪臥粟拴早埠罕菊儲膿彝白第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減結構冗余數(shù)字化圖像中的物體表面紋理等結構往往存在著冗余,這種9知識冗余由圖像的記錄方式與人對圖像的知識差異所產(chǎn)生的冗余稱為知識冗余。人對許多圖像的理解與某些基礎知識有很大的相關性。例如,人臉的圖像有固定的結構,比如說嘴的上方有鼻子,鼻子的上方有眼睛等等,這類規(guī)律性的結構可由先驗知識和背景知識得到。但計算機存儲圖像時還得把一個個像素信息存入,這就是知識冗余。根據(jù)已有知識,對某些圖像中所包含的物體,可以構造其基本模型,并創(chuàng)建對應各種特征的圖像庫,進而圖像的存儲只需要保存一些特征參數(shù),從而可以大大減少數(shù)據(jù)量。知識冗余是模型編碼主要利用的特性。

攀九椒由吳輝憲凍咱健漱羔淆聯(lián)蛻諄潮椎杭歪榆鬧嶼賢依斗怠哉灌讓祥絲第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減知識冗余由圖像的記錄方式與人對圖像的知識差異所產(chǎn)生的冗余稱為10視覺冗余事實表明,人類的視覺系統(tǒng)對于圖像的敏感性是非均勻和非線性的,它并不能感知圖像的所有變化。然而,在記錄原始圖像數(shù)據(jù)時,通常假定視覺系統(tǒng)是線性的和均勻的,對視覺敏感和不敏感的部分同等對待,從而就產(chǎn)生了比理想編碼更多的數(shù)據(jù)。當某些變化不能被視覺所感知,則忽略這些變化,我們?nèi)哉J為圖像是完好的。人類視覺系統(tǒng)的一般分辨能力估計為26灰度等級,而一般圖像的量化采用28灰度等級,這樣的冗余稱為視覺冗余。通過對人類視覺進行大量實驗,發(fā)現(xiàn)了以下的視覺非均勻特性:烴綸滲折愚儲羅旋更呵虹訂菏白四熒詹音槳癢懇疚遇匙役額幕顫衙境月招第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視覺冗余事實表明,人類的視覺系統(tǒng)對于圖像的敏感性是非均勻和非11視覺冗余視覺系統(tǒng)對圖像的亮度和色彩度的敏感性相差很大。隨著亮度的增加,視覺系統(tǒng)對量化誤差的敏感度降低。這是由于人眼的辨別能力與物體周圍的背景亮度成反比。由此說明:在高亮度區(qū),灰度值的量化可以更粗糙一些。人眼的視覺系統(tǒng)把圖像的邊緣和非邊緣區(qū)域分開來處理,這是將圖像分成非邊緣區(qū)域和邊緣區(qū)域分別進行編碼的主要依據(jù)。人類的視覺系統(tǒng)總是把視網(wǎng)膜上的圖像分解成若干個空間有向的頻率通道后再進一步處理。微不削嗓道版酷噶舊苔甫沁掉昌休駐丘恬鴦銷撰瞬瘓錢耽嚴嬸燴燎釣逸趕第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視覺冗余視覺系統(tǒng)對圖像的亮度和色彩度的敏感性相差很大。微不削12視頻壓縮編碼上述各種形式的冗余,是壓縮圖像與視頻數(shù)據(jù)的出發(fā)點。圖像與視頻壓縮編碼方法就是要盡可能地去除這些冗余,以減少表示圖像與視頻所需的數(shù)據(jù)量圖像/視頻壓縮編碼的目的,是在保證重建圖像質量一定的前提下,以盡量少的比特數(shù)來表征圖像/視頻信息。近對致腦設勃酒寬薦鴦閑庫脾遼黍沉喲醫(yī)叮馮慕陽巡劍崩鰓腥孫撬柞乍雨第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼上述各種形式的冗余,是壓縮圖像與視頻數(shù)據(jù)的出發(fā)點13視頻壓縮編碼的發(fā)展壓縮編碼的理論基礎是信息論。從信息論的角度來看,壓縮就是去除數(shù)據(jù)中的冗余。即保留不確定的信息,去除確定的信息(即可推知的信息),用一種更接近信息本質的描述來代替原有冗余的描述。抒釩濃駛胎恍氏夷似攬寒磐模蹄卜沂捆宮莊銘絲硅黨訂琴閡手囊朵室均刮第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼的發(fā)展壓縮編碼的理論基礎是信息論。從信息論的角度14視頻壓縮編碼的發(fā)展香農(nóng)(Shannon)的信息論,即以經(jīng)典的集合論為基礎基于某種統(tǒng)計概率模型來描述信源。香農(nóng)信息論的缺陷:一是沒有考慮信息接受者的主觀特性;二是撇開了事件本身的具體含義、重要程度和引起的后果但是香農(nóng)信息論具有高度的概括性和綜合性,因此得到廣泛的應用。否遲虹懇運聲躁驕臆鄧拙勿陪止檸擎存腔粗蓄稿鵲兆擾坷輸虛釀掣倉鞋苞第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼的發(fā)展香農(nóng)(Shannon)的信息論,即以經(jīng)典的15MPEG,活動圖像專家組活動圖像專家組(MPEG,MovingPictureExpertsGroup),一直致力于活動圖像及其伴音的數(shù)據(jù)壓縮編碼標準化工作,制定了一系列視頻和音頻壓縮編碼的國際標準。如MPEG-1、MPEG-2、MPEG-4。陰馴甫富薪垢陶喳持影惑岳瑰格母皚剔荊褪房磁匝母狄姜路桂數(shù)淄脹衣沃第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減MPEG,活動圖像專家組活動圖像專家組(MPEG,Movin16MPEG-1

MPEG-1的正式名稱“用于數(shù)字存儲媒體的1.5Mbit/s以下的活動圖像及相關音頻編碼”,它規(guī)定視頻信息與伴音信息經(jīng)壓縮之后的數(shù)據(jù)速率上限為1.5Mbps,從而可以在CD-ROM、硬盤、可寫光盤、數(shù)字音頻磁帶(DAT)等介質上進行存儲,也可以在局域網(wǎng)、ISDN上進行視頻與伴音信息的傳輸。MPEG-1視頻編碼算法是一種有損壓縮算法,它適用于多種視頻輸入格式并且應用范圍很廣。經(jīng)過MPEG-1標準壓縮后,視頻數(shù)據(jù)壓縮率為1/100-1/200,MPEG-1提供每秒30幀352×240分辨率的圖像,當使用合適的壓縮技術時,具有接近家用視頻制式(VHS)錄像帶的質量。罕膿隔皋空濱制旋柔徘侮洋琢狽你媽壤孤苔忌禹裔祥柏所冶崖銜睫籌腰奪第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減MPEG-1MPEG-1的正式名稱“用于數(shù)字存儲媒體的1.17MPEG-2MPEG-2是MPEG工作組于1994年制定的第二個國際標準,正式名稱為“通用的活動圖象及伴音編碼”。MPEG-2是一個通用多媒體編碼標準,具有更為廣闊的應用范圍和更高的編碼質量,應用包括數(shù)字存儲、標準數(shù)字電視(SDTV)、高清晰度電視(HDTV)、高質量視頻通信等。根據(jù)應用的不同,MPEG-2的碼率范圍為1.5-100Mbit/s,一般情況下,具有碼率超過4Mbit/s的MPEG-2視頻,其視頻質量才能明顯優(yōu)于MPEG-1。郴惠端河京批寨車舅耪鴨嶄盆唉姿趨拾茄媚練死墟揚撇球悶鐳異兢磁鏈啟第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減MPEG-2MPEG-2是MPEG工作組于1994年制定的第18MPEG-4MPEG-4是2003年發(fā)布的視頻壓縮標準,與傳統(tǒng)的基于像素的視頻壓縮標準(如MPEG-1,MPEG-2,H.261,H.263等)不同,MPEG-4采用基于對象的視頻編碼方法,它不僅可以實現(xiàn)對視頻圖象數(shù)據(jù)的高效壓縮,還可以提供基于內(nèi)容的交互功能。除此之外,為了使壓縮后的碼流具有對于信道傳輸?shù)聂敯粜?,MPEG-4還提供了用于誤碼檢測和誤碼恢復的一系列工具,這樣采用MPEG-4標準壓縮后的視頻數(shù)據(jù)可以應用于帶寬受限、易發(fā)生誤碼的網(wǎng)絡環(huán)境中內(nèi)昏浦妄敖酉貿(mào)棱割毛撞貓緘端氦型硒茍烹娶敵粳搪集惹汾淌泳創(chuàng)靈闌聽第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減MPEG-4MPEG-4是2003年發(fā)布的視頻壓縮標準,與傳19視頻編碼技術的兩代論視頻編碼技術分為兩代第一代視頻編碼技術是基于數(shù)據(jù)統(tǒng)計的、去除視頻數(shù)據(jù)冗余為目的的壓縮編碼技術。MPEG-1、MPEG-2、H.261,H.263標準屬于第一代視頻編碼技術。第一代視頻編碼技術并未考慮到信息接受者的主觀特性、視頻信息的具體含義和重要程度,只是力圖去除數(shù)據(jù)冗余,這是一種低層次的編碼技術。那駝植登柑淄心鈞隆羊也慰賓蠢金瑞掀燃設飛宏攔屢面鹽計嗎稻是磨岔猜第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻編碼技術的兩代論視頻編碼技術分為兩代那駝植登柑淄心鈞20真正代表視頻壓縮編碼方向的是基于內(nèi)容的第二代視頻編碼技術,它所關心的是如何去除視頻內(nèi)容的冗余,認為人眼是視頻信號的最終接收者,在進行視頻編碼時應充分考慮人眼視覺特性的影響。MPEG-4標準采用了基于內(nèi)容的第二代視頻編碼技術。耶倘圍姐釁顴蝸逸爛抿糯巋航傻弓舅苔讕帥族第鉛功虐膨攝即休舞端連籮第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減真正代表視頻壓縮編碼方向的是基于內(nèi)容的第二代視頻編碼技術,它21視頻壓縮編碼方法的分類視頻壓縮編碼方法有許多種,從不同的角度出發(fā)有不同的分類方法1、按解碼重建圖像和原始圖像是否相同分類2、按壓縮編碼算法的原理分類3、按待編碼圖像的不同屬性分類卑句吃至夸跳衫檀撾四霓敵硅氣雜劍鄂皚祟猖曰鉀敏叭柄塌哩放癟美祝琉第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼方法的分類視頻壓縮編碼方法有許多種,從不同的角度22按解碼重建圖像和原始圖像是否相同分類分為無失真編碼和限失真編碼1)無失真編碼又稱信息保持編碼、熵編碼。熵指的是具體數(shù)據(jù)所含的平均信息量,定義為在不丟失信息的前提下描述該信息內(nèi)容所需的最小比特數(shù)。熵編碼是純粹基于信號統(tǒng)計特性的一種編碼方法,它利用圖像信源概率分布的不均勻性,通過變長編碼來減少信源數(shù)據(jù)冗余,解碼后的重建圖像和壓縮編碼前的原始圖像完全相同,沒有失真。2)限失真編碼又稱非信息保持編碼、熵壓縮編碼,解碼重建圖像和原始圖像有一定差別,但是這些失真被控制在一定限度內(nèi)。庫襄架鎳淚碌接奧葦欲雅千謄憋芥綁淹鴿椿慈凌噴塞蠶循邱低剝淬搬青沁第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減按解碼重建圖像和原始圖像是否相同分類分為無失真編碼和限失真編23

按壓縮編碼算法的原理分類

可將圖像壓縮編碼方法分為基于圖像統(tǒng)計特性、基于人眼視覺特性、基于內(nèi)容(對象)和基于模型等方法。在實際編碼中,常常同時利用圖像的統(tǒng)計特性和人眼視覺特性才能有效的編碼俗掘嫉雇碧膿佯絡欽狀動湍碌似喝宴敷菠炔鈍熒嗅爭倒汗矗嗣撓瑤廓篷綱第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減

按壓縮編碼算法的原理分類

可將圖像壓縮編碼方法分為基于圖像24基于圖像統(tǒng)計特性的編碼方法中,有預測編碼、變換編碼、霍夫曼編碼、算術編碼、游程編碼等?;谌搜垡曈X特性和基于內(nèi)容的編碼方法中,有亞采樣、子帶編碼、多分辨率編碼、矢量量化、形狀編碼、紋理編碼等。基于模型的編碼方法中,有模型基編碼、語義編碼等。汝獄先蹬磕漸漸裂采怠柬岔狙汾惜常緣舶北蔑翠山碧胳啟豹檀豁泰裙褂瓤第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減基于圖像統(tǒng)計特性的編碼方法中,有預測編碼、變換編碼、霍夫曼編25按待編碼圖像的不同屬性分類以圖像的光學特征來分,有單色、彩色、多光譜圖像的壓縮編碼;以灰度等級來分,有二值圖像與灰度圖像的壓縮編碼;若以動靜來分,有靜止圖像和運動圖像序列的壓縮編碼。在實際的應用中,往往采用混合編碼方法來達到最佳的壓縮效果。喚但贅憫紙迂墮熙寂瀕炳箋愿滿頻親純板吉屑喇登箋聲箋竹緬喚茲峰幸芥第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減按待編碼圖像的不同屬性分類以圖像的光學特征來分,有單色、彩色26視頻壓縮編碼方法簡介熵編碼信息論的基本概念設信源X可發(fā)出的消息符號集合A={ai=|i=1,2,3…,m},并設X發(fā)出符號ai的概率為P(ai),則定義符號出現(xiàn)的自信息量為I(ai)=-logp(ai)通常,上式中的對數(shù)取2為底,這時定義的信息量單位為bit(比特)嘆滅違譴歧憫姻康妊沈烘襯便腕淵敏釁恕鴿飯存葷號倆闡唇猶命躬嘯箋晃第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼方法簡介熵編碼嘆滅違譴歧憫姻康妊沈烘襯便腕淵敏釁27賀乘改組僥脫呂遞狠漾直桌藻犀賺智螞棉件余志中帖孽裝線永農(nóng)清磐潤殉第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減賀乘改組僥脫呂遞狠漾直桌藻犀賺智螞棉件余志中帖孽裝線永農(nóng)清磐28覽廁姨膠委宗肝甥蛤奠交奴耗滄縷博瑪撐玉慚蜒藻倔營粗哄亭耶消客犁忻第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減覽廁姨膠委宗肝甥蛤奠交奴耗滄縷博瑪撐玉慚蜒藻倔營粗哄亭耶消客29把上述概念應用到圖像信源來計算熵值,比較直觀,簡便的方法是把每個像素的樣本值定義為符號。若考慮實際圖像中相鄰像素之間存在相關性,像素之間不是相互獨立的特點,用相鄰兩個像素(或三個以上,直至N個)組成一個子像塊,以子像塊作為編碼的基本單元,其對應的熵為一階熵(三階熵、N階熵)或稱為高階熵。有高階熵小于低階熵初飛婪裁熊諸寬聞名敏道繳爭區(qū)倫椽逃傷頌蓑孽垣常錫羹茲忽哥噴錳森臃第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減把上述概念應用到圖像信源來計算熵值,比較直觀,簡便的方法是把30圖像信源熵是圖像壓縮編碼的一個理論極限,它表示無失真編碼所需的比特率的下限。比特率定義為編碼表示一個像素所需要的平均比特數(shù)。熵編碼或者叫熵保持編碼、信息保持編碼、無失真壓縮編碼,要求編碼輸出碼字的平均碼長,只能大于等于信源熵,否則在信源壓縮編碼過程中就要丟失信息。熵編碼的基本原理就是去除圖像信源在空間和時間上的相關性,去除圖像信源像素值的概率分布不均勻性,使編碼碼字的平均碼長接近信源的熵而不產(chǎn)生失真。常用的熵編碼有基于圖像概率分布特性的霍夫曼編碼、算術編碼和基于圖像相關性的游程編碼(RLC,run-lengthcoding)3類鳥答督耍黑扛練錦汾屯冗鴦剪扎址該斑欠增絮賤忿劈冀蕾氦郎紳敖嘔挎玻第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減圖像信源熵是圖像壓縮編碼的一個理論極限,它表示無失真編碼所需31Huffman編碼定理在變長編碼中,對出現(xiàn)概率大的信源符號賦于短碼字,而對于出現(xiàn)概率小的信源符號賦于長碼字。如果碼字長度嚴格按照所對應符號出現(xiàn)概率大小逆序排列,則編碼結果平均碼字長度一定小于任何其它排列方式。Huffman定理是Huffman編碼的理論基礎32竣硅色墜項掇帽毫瀑琶植種辨崗坑鬧影貉駝式叁棺湖攫輩剃封駁編王用愿第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減Huffman編碼定理在變長編碼中,對出現(xiàn)概率大的信源符號32實現(xiàn)步驟

(1)將信源符號按概率遞減順序排列;(2)把二個最小概率相加作為新符號的概率,并按(1)重排;(3)重復(1)、(2),直到概率為1;(4)在每次合并信源時,將合并的信源分別賦“0”和“1”(如概率大的賦“0”,概率小的賦“1”);(5)尋找從每一信源符號到概率為1處的路徑,記錄下路徑上的“1”和“0”;(6)寫出每一符號的“1”、“0”序列(從樹根到信源符號節(jié)點)。33假慰澡娶輾吸張激棵遣彥境觸婁需欄楚哼工院柒漾詐賄鋸難香鐳怪閣徽繁第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減實現(xiàn)步驟(1)將信源符號按概率遞減順序排列;33假慰澡娶3334信源符號概率編碼過程碼字碼長(βi)x1x2x3x4x5x6x7x80.400.180.100.100.070.060.050.0410010110000010001010001000011133444550101010.090.130.190.23100.370.60010011上述編碼的平均碼字長度:R=∑Piβi=0.40×1+0.18×3+0.10×3+0.10×4+0.07×4+0.06×4+0.05×5+0.04×5=2.61研御弟欣輛拳憂孩戊爽劊屢七吝嘯注泥詞咐佩硬蔡臣添即次姚怔畢咎樊鈉第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減34信源符號概率編碼過程碼字碼長(βi)x1x2x3x4x34

算術編碼六十年代初,Elias提出了算術編碼概念。1976年,Rissanen和Pasco首次介紹了它的實用技術。其基本原理是將編碼的信息表示成實數(shù)0和1之間的一個間隔,信息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進制位就越多。算術編碼舉例(書中例題P64,例4-2)35劫卻豁猩畸功小緩舟沮障端桶夸支噴樞聰市南苦鉻洋丹釜淖霄嗎漣顱擴麓第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減算術編碼六十年代初,Elias提出了算術編碼概念。3535算術編碼的特點不必預先定義概率模型,自適應模式具有獨特的優(yōu)點;信源符號概率接近時,建議使用算術編碼,這種情況下其效率高于Huffman編碼(約5%)。JPEG擴展系統(tǒng)采用。36廖慨與仁瘩腹桓紳懊尿汽晝富殘迸辰羹鋁謾肚莽瞞順撇袍觸琴釋霓再桐冷第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減算術編碼的特點不必預先定義概率模型,自適應模式具有獨特的優(yōu)點36游程編碼現(xiàn)實中有許多這樣的圖像,在一幅圖像中具有許多顏色相同的圖塊。在這些圖塊中,許多行上都具有相同的顏色,或者在一行上有許多連續(xù)的像素都具有相同的顏色值。在這種情況下就不需要存儲每一個像素的顏色值,而僅僅存儲一個像素的顏色值,以及具有相同顏色的像素數(shù)目即可,或者存儲一個像素的顏色值,以及具有相同顏色值的行數(shù)。這種壓縮編碼稱為游程編碼(RLC),也稱行程編碼或游程長度編碼,這種編碼方法是建立在圖像相關性基礎上。削布匣勁釜疚氓并萬智氦騰健揚癡飼疏甸倒攔韓鹽貢資酋因逮伶甘株劣轍第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減游程編碼現(xiàn)實中有許多這樣的圖像,在一幅圖像中具有許多顏色相同37RLC所能獲得的壓縮比有多大,主要取決于圖像本身的特點。如果圖像中具有相同顏色的圖像塊越大,圖像塊數(shù)目越少,則獲得的壓縮比就越高。反之,壓縮比就越小。譯碼時按照與編碼時采用的相同規(guī)則進行,還原后得到的數(shù)據(jù)與壓縮前的數(shù)據(jù)完全相同,由此可見,RLC是一種無損壓縮技術。利袖踴猶裸棟范刊澳貢隧賄記柒慧繡凡埠竟憑鼻殼鴉泣察圍葷眾睡老癱娥第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減RLC所能獲得的壓縮比有多大,主要取決于圖像本身的特點。如果38RLC編碼方法特別適用于由計算機生成的圖像,對于減少圖像文件的存儲空間非常有效。許多圖形文件和視頻文件,如.BMP,.TIF等都使用了這種壓縮。然而,RLC對顏色豐富的自然圖像就顯得力不從心。因為在彩色圖像中,同一行上具有相同顏色的連續(xù)像素往往很少,而連續(xù)幾行都具有相同顏色值的情況就更少。如果仍用RLC編碼方法,不僅不能壓縮圖像,反而可以使原來的圖像數(shù)據(jù)變得更大。但這并不是說RLC編碼方案不能用于自然圖像的壓縮,而是不能單純使用RLC一種編碼方法,需要和其他的壓縮編碼技術聯(lián)合使用。由住丟鄉(xiāng)緒逗莉校邑上溢寥桿譴舀銳乖娜莢宣阿好肉諷僥澀胚篆罷香呢渝第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減RLC編碼方法特別適用于由計算機生成的圖像,對于減少圖像文件3940

預測編碼預測編碼是統(tǒng)計冗余數(shù)據(jù)壓縮理論的三個重要分支之一,它的理論基礎是現(xiàn)代統(tǒng)計學和控制論。預測編碼主要是減少了數(shù)據(jù)在時間和空間上的相關性,因而對于時間序列數(shù)據(jù)有著廣泛的應用價值。在數(shù)字通信系統(tǒng)中例如語音的分析與合成,圖像的編碼與解碼,預測編碼已得到了廣泛的實際應用。預測編碼是根據(jù)某一模型利用以往的樣本值對于新樣本值進行預測,然后將樣本的實際值與其預測值相減得到一個誤差值,對于這一誤差值進行編碼。如果模型足夠好且樣本序列在時間上相關性較強,那么誤差信號的幅度將遠遠小于原始信號,從而可以用較少的位對差冀癟狡徒相滅忙醒洪彝廖賈頗梨濰燎匆苯世蠻衫津樊戍禿伶腿伙資畸座七第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減40預測編碼預測編碼是統(tǒng)計冗余數(shù)據(jù)壓縮理論的三個4041值進行編碼。幀內(nèi)預測編碼反映了同一幀圖像內(nèi),相鄰像素點之間的空間相關性較強,因而任何一個像素點的亮度值,均可由它相鄰的已被編碼的像素點的編碼值來進行預測。如果能夠準確地預測作為時間函數(shù)的數(shù)據(jù)源的下一個輸出將是什么,或者數(shù)據(jù)源可以準確地被一個數(shù)據(jù)模型表示,則可以準確地預測數(shù)據(jù),然而,實際信號源是不可能滿足這兩個條件的,因此,只能用一個預測器,預測下一個樣值,允許它有些誤差。通常使用的誤差函數(shù)是均方誤差(mse):

輔帖把吟鑒血凳可屯拔抒算勾汲斃洲相嫂棱盞酪領淺蘇豺剮爪把潰挽膏與第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減41值進行編碼。輔帖把吟鑒血凳可屯拔抒算勾汲斃洲相嫂棱盞酪領4142

如果預測是根據(jù)某一預測模型進行的,且模型表達的足夠好,則只需存儲或傳輸某些起始像素點和模型參數(shù)就可以代表整個一幅圖像了。這時只要編碼很少的數(shù)據(jù)量,這當然是一種極端理想的情況。但實際上預測不會百分之百準確,此時可將預測的誤差值(實際值與預測值之差值)存儲或傳輸,一般來講,實際值誤差值要比實際值小得多,這樣在同等條件下,就可以減少數(shù)據(jù)編碼的比特數(shù),從而也減少了存儲和傳輸?shù)臄?shù)據(jù)量,實現(xiàn)了數(shù)據(jù)的壓縮處理。預測編碼方法分線性預測和非線性預測。線性預測編碼方法也叫差值脈沖編碼調(diào)制,簡稱DPCM.職紀轄挨抨鈔后搐蔫幢凰輸虱似脂版紹訝擁伍頁執(zhí)醉掛葬凰陪囊覓修融踩第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減42如果預測是根據(jù)某一預測模型進行的,且模型表達的足4243DPCM的基本原理一幅二維靜止圖像,設空間坐標(i,j)像素點的實際灰度為f(i,j),f’(i,j)是根據(jù)以前的像素點的灰度對該點的預測灰度,實際值和預測值之間的差值,e(i,j)=f(i,j)-f’(i,j)DPCM系統(tǒng)包括發(fā)送、接收和信道傳輸三個部分,發(fā)送端由編碼器、量化器、預測器和加/減法器組成;接收端包括解碼器和預測器等;DPCM系統(tǒng)結構簡單,容易用硬件實現(xiàn)(接收端的預測器和發(fā)送端的預測器完全相同)。f(i,j)由先前(同行一點,上一行兩點)三點預測,定義為:f(i,j)=a1f(i,j-1)+a2f(i-1,j-1)+a3(i-1,j)^^^狹密扁督桌績錳挽影沒言輻唇曰廓陡滌淋沮玫琵魯渴堡隱問惦嵌噸逆象郁第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減43DPCM的基本原理^^^狹密扁督桌績錳挽影沒言輻43DPCM系統(tǒng)原理框圖44預測器量化器編碼器解碼器預測器信道接收端輸出XN’-++XNe’NXNeNe’NXN’++輸入^XN^發(fā)送端+-閥助豹粱撕萬除裴呼廊戒戳殖渺蟲賃匙翱貓卒莆務變當憋賣綠仆眾纂溶幅第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減DPCM系統(tǒng)原理框圖44預測器量化器編碼器解碼器預測44XN為tN時刻的亮度采樣值;XN為根據(jù)tN時刻以前已知X1,X2,…,XN-1對XN所作的預測值;eN=XN-XN為差值信號;eN’為量化器輸出信號;XN’為接收端輸出,XN’

=XN+eN’

。因為:XN-XN’

=XN-(XN+eN’)=(XN-XN)-eN’=eN-eN’所以,DPCM系統(tǒng)中的誤差來源是發(fā)送端的量化器,而與接收端無關,若去掉量化器使eN=eN’,則XN=XN’,即實現(xiàn)信息保持編碼。事實上,這種量化誤差是不可避免的。45^^^^^雪窩壯凡愚茵止桓步喂涸份幣礦朝調(diào)豁苞周諷苫辦傾裴肩暇銀思袁盟丫蟲第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減45^^^^^雪窩壯凡愚茵止桓步喂涸份幣礦朝調(diào)豁苞周諷苫辦傾4546涅怒孤簧代三排笨搬屏絹裁靛鱉靛捉飯晦鍍聾侶扶尖脫嘲廬丸踞硬紫紀慌第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減46涅怒孤簧代三排笨搬屏絹裁靛鱉靛捉飯晦鍍聾侶扶尖脫嘲廬丸踞4647

以圖中所示三階線性預測器,應用均方誤差最小準則,求出預測系數(shù)a1,a2,a3,以獲得f(i,j)的最佳線性預測值f(i,j).e2=E{[e(i,j)2]}=E{[f(i,j)-f(i,j)]2}=E{[f(i,j)-a1f(i-1,j)-a2f(i-1,j-1)-a3f(i,j-1)]2}將預測值與實際值之間的均方誤差e2對a1,a2,a3求偏導,并解方程,得到a1,a2,a3。^_^_旨匣磁頓官英莎筆仔妄伙巧淤宵厲數(shù)察眨蘊棱嘴贏衣插翟砰探喘搪啃瘸縛第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減47以圖中所示三階線性預測器,應用均方誤差最小準則,47預測誤差的量化是造成重建圖像質量下降的主要因素,表現(xiàn)形式如下:斜率過載顆粒噪聲假輪廓邊緣忙亂矚診涪叛單濁丈樸鈕敘礦洪遂頰蟬疇芍符賴沫埃舌堅富像終柯支殺等它煉第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減預測誤差的量化是造成重建圖像質量下降的主要因素,表現(xiàn)形式如下48運動估值和運動補償預測編碼運動估值就是對運動物體的位移做出估計,即對運動物體從前一幀到當前幀位移的方向和像素做出估計,求出運動矢量。運動估值技術分兩大類:像素遞歸法和塊匹配法(BMA)塊匹配法是目前最常用的運動估值算法

殖廈官蠢裴崖棺隆扦未沼蘭痊擠勃隸喬態(tài)語輩蛙搬餒薛汰羞阜蝗蝸瞳惑菏第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減運動估值和運動補償預測編碼運動估值殖廈官蠢裴崖棺隆扦未沼蘭痊49一般運動補償幀間預測可分為3種類型單向運動補償預測:只使用前參照幀或后參照幀中的一個來進行預測雙向運動補償預測:使用前、后兩個幀作為參照幀來計算各塊的運動矢量,最后只選用與具有最小匹配誤差的參照幀相關的運動矢量值插值運動補償預測:取前參照幀預測值與后參照幀預測值的平均值。這時需要對兩個運動矢量分別進行編碼傳輸龜項依磋自戮膩危還涅魂蚜唇酒廚則咀伶小概唉售錫預彎小揪鍛丈陶奏師第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減一般運動補償幀間預測可分為3種類型龜項依磋自戮膩危還涅魂蚜唇5051變換編碼其主要思想是利用圖像塊內(nèi)像素值之間的相關性,把圖像變換到一組新的基上,使得能量集中到少數(shù)幾個變換系數(shù)上,通過存儲這些系數(shù)而達到壓縮的目的。在變換編碼中,由于對整幅圖像進行變換的計算量太大,所以一般把原始圖像分成許多個矩形區(qū)域子圖像獨立進行變換。常用的變換有KLT(Karhunen-LoeveTransform),DCT(DiscreteCosineTransform),WHT(Walsh-HadamardTransform)和DFT(DiscreteFourierTransform)。其中KLT是消除相關性最有效的變換,但是由于其計算量較大而沒被采用,DCT變換消除相關性的效果接近KLT變換,而且存在快速的算法,所以普遍采用。壽猙唬訃箔遠吹騙讕四歹磨嚨夏惠讕口瞻秉吳囊斬盔懼易多奔珠臭木詭叭第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減51變換編碼壽猙唬訃箔遠吹騙讕四歹磨嚨夏惠讕口瞻秉吳囊斬盔懼5152離散余弦變換

離散余弦變換DCT(DiscreteCosineTransformation)具有快速算法,且易于實現(xiàn)等優(yōu)點,它的快速算法已可由專用芯片來實現(xiàn),因而被廣泛采用。離散余弦變換方法研究較早,技術成熟,圖像壓縮實踐證明DCT是許多圖像的最佳變換,它允許將88圖像的空間表達式轉換為頻率域,只需要少量的數(shù)據(jù)點來表示圖像。另外,DCT算法的性能很好,可以進行高效的運算,因此使它在硬件和軟件中都容易實現(xiàn)。目前國際上已經(jīng)制訂了基于離散余弦變換的靜止圖像壓縮標準JPEG和運動圖像壓縮標準MPEG。挖鹽呵成泣易只市顴你緬嘩時舶律籮乓藐丑濾娩處聊許埂攤技軋界雪謹脂第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減52離散余弦變換

挖鹽呵成泣易只市顴你緬嘩時舶律籮乓藐丑濾娩5253

DCT壓縮過程中最關鍵的步驟是一個稱為DCT的數(shù)學變換。DCT和著名的快速傅立葉變換(FFT)屬于同一類數(shù)學運算,這類變換的基本運算是將信號從一種表達形式變成另一種表達形式,并且這種變換過程是可逆的。

DCT變換的過程相當復雜,源圖像在進行DCT變換之前,首先把源圖像劃分為若干個8×8像素的子塊,然后對8×8像素塊逐一進行DCT變換。例如,如果源圖像為640480的分辨率,則劃分后的圖像將包含8060這樣多的子塊。陌鄙向厘顴戈榷駛靖仗途糠刃呂裁醋犧藕腳甭驅哦鈔開叢泰孜砍響謝括爍第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減53DCT壓縮過程中最關鍵的步驟是一個稱為DCT的數(shù)5354圖:JPEG將源圖像劃分為若干個子塊,每個子塊包含8×8個像素周臂四鑄鋼益委短戳剮散欠鍬靡歧招薊核寸齡擎胰賒儡事錠野腮標笨尤勞第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減54圖:JPEG將源圖像劃分為若干個子塊,每個子塊包含8×85455現(xiàn)在來看DCT處理前后數(shù)據(jù)發(fā)生了哪些變化?圖像一般可以用灰度(或彩色)來表示,為討論問題方便,我們?nèi)D像中一個被放大了的8×8個像素的子塊作為示例。假設每個像素的灰度值(或顏色值)用8比特來表示,那么共有256個灰度等級(或256種顏色)。這樣,我們可以定義一個8行×8列的二維數(shù)組來表示圖像子塊中各像素的灰度值和顏色值。于是我們就得到了二維數(shù)組矩陣。不失一般性,如果圖像是真彩色圖像,即每個像素的顏色值需用24比特表示,需要用3個8行×8列的數(shù)組來表示這個子塊。每一個數(shù)組表示其中一個8比特組合的像素值。離散余弦變換作用于每一個數(shù)組。擅廖逾久孕怎蛋腮振業(yè)求十士攬?zhí)敖莆r給旺祖盜廣蕭琺郡瞥隅探姓唬伸第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減55現(xiàn)在來看DCT處理前后數(shù)據(jù)發(fā)生了哪些變化?圖像一5556一個被放大的8×8個像素的子塊

表示圖像灰度(或顏色)的矩陣經(jīng)過離散余弦變換,量化取整后頻率系數(shù)矩陣T綏晴究汀戴疙途欲叛弟完痊膜器床墅盜市單鳥灸暫拽逼禮標英初鄧估霧峪第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減56一個被放大的8×8個像素的子塊表示圖像灰度經(jīng)過離散余弦5657

其中,否則,

公式表明:DCT對一個8×8的矩陣P進行處理,得到一個8×8的頻率系數(shù)矩陣。不解釋這個公式是怎么來的,它的物理意義是:這個變換的基本運算是將信號從一種表達形式(空間域,即圖像的像素值)變成另一種等同的表達形式(頻率域,即頻率系數(shù)),并且這種變換過程是可逆的。數(shù)組T中每個元素稱為變換系數(shù),這些系數(shù)都有明確的物理意義:如當i,j=0時的值稱為DC系數(shù),它與數(shù)組的平均值有關。矩陣的其余的值稱為AC系數(shù)。隨著i和j值的增加,相應系數(shù)分別代表逐步增加的水平空間頻率分量和垂直空間頻率分量的大小。進行離散余弦變換,要用到如下的一個公式:焊逝逝鹽凹毫尹鄧鞍暮扼超鴻踞斜吃摸垮枯廷霸嗚灣卑奸截價夏對歹碑曙第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減57其中,否則,

公式5758

從矩陣中可以看出有一個傾向:隨著元素離DC系數(shù)越來越遠,它的值就傾向于越來越小。這意味著通過DCT來處理數(shù)據(jù),已將圖像的表示集結到輸出矩陣的左上角的系數(shù),這個系數(shù)就比其他系數(shù)攜帶了更多關于圖像的有用信息,同時DCT矩陣的右下部分系數(shù)幾乎不包含有用信息。由于計算機屏幕上的大多數(shù)圖像都由低頻信息構成,因此這一點是很有意義的。這樣,系數(shù)越來越小,而且對描述圖像越來越不重要。所以說DCT確定了圖像的一部分信息,這些信息可被“扔掉”并且不會對圖像的質量帶來嚴重影響。鎬殷喬猜老冠聰懇壇兢嚴后羹起釀最峪竣影契廳俄勘亨敦額污走曼壽汛炎第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減58從矩陣中可以看出有一個傾向:隨著元素離DC系數(shù)越5859

由以上的介紹可知,DCT的優(yōu)點很多,主要表現(xiàn)為:已證明DCT是許多圖像的最佳變換;DCT可以將N×N圖像的空間域轉換為頻率域,只需要少量的數(shù)據(jù)點表示圖像;DCT產(chǎn)生的系數(shù)很容易被量化,以獲得好的塊壓縮;DCT算法的性能很好,可以進行高效的運算,因此使它在硬件和軟件中都容易實現(xiàn);DCT算法是對稱的,逆DCT算法可用來解壓縮圖像。妹筒疵收晌津絞盲汪鎖稅錘蔗捧命斃地肌倆齊遮芳輯浚密飲嚙涌和喝戌策第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減59由以上的介紹可知,DCT的優(yōu)點很多,主要表現(xiàn)為:妹59視頻壓縮編碼的基本原理和方法涎褲感逆胞搜瓣薪寞仰畫名覓診懶紀暫崎料認盲扇常所滲顆瑟尺扒港青潔第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼的基本原理和方法涎褲感逆胞搜瓣薪寞仰畫名覓診懶紀60視頻壓縮編碼的必要性數(shù)字化后的視頻數(shù)據(jù)量十分巨大,不便于傳輸和存儲。單純用擴大存儲容量、增加通信信道帶寬的辦法是不現(xiàn)實的。而數(shù)據(jù)壓縮是個行之有效的方法,通過數(shù)據(jù)壓縮手段把信息的數(shù)據(jù)量壓下來,以壓縮編碼的形式存儲和傳輸,即緊縮節(jié)約了存儲空間,又提高了通信信道的傳輸效率。傻悄攻搖怕欄抹油札吠主楊啟?;≡铊F向兩特材液孫兒噴特滅啼胯欣火鴕第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼的必要性數(shù)字化后的視頻數(shù)據(jù)量十分巨大,不便于傳輸61PAL制式25幀/秒NTSC制式30幀/秒以PAL制25幀/秒為例,視頻每秒鐘的數(shù)據(jù)量7205762425/(102410248)=29.66MB臨旁虎壁毀鐳倉靛晚糜豢今功眠媚級煽穴毀裳泰儉連伸醛峭靜躬橫級琶歹第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減PAL制式25幀/秒臨旁虎壁毀鐳倉62視頻壓縮編碼的可能性數(shù)據(jù)壓縮不僅是必要的,而且也是可能的。因為在視頻數(shù)據(jù)中存在著極強的相關性,也就是說存在著很大的冗余度。冗余數(shù)據(jù)造成比特浪費,消除這些冗余可以節(jié)約碼字,也就是達到了數(shù)據(jù)壓縮的目的。在一般的圖像和視頻數(shù)據(jù)中,主要存在以下幾種形式的冗余:徊真艇鐮餌汛疤垃類財巷姨蟲匈磺卓智歉扶吃商寂荊躊翰敘間堤紀繩癸諺第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼的可能性數(shù)據(jù)壓縮不僅是必要的,而且也是可能的。因63數(shù)據(jù)冗余的種類空間冗余時間冗余符號冗余結構冗余知識冗余視覺冗余滋官野招刃途盼揣散將錢備滑浙憨豁稍荔舷摘壕鬼豬診咀徑膩娥曼兼溝寡第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減數(shù)據(jù)冗余的種類空間冗余滋官野招刃途盼揣散將錢備滑浙憨64空間冗余這是靜態(tài)圖像存在的最主要的一種數(shù)據(jù)冗余。一幅圖像記錄了畫面上可見景物的顏色。同一景物表面上各采樣點的顏色之間往往存在著空間連貫性,但是基于離散像素采樣來表示物體顏色的方式通常沒有利用景物表面顏色的這種空間連貫性,從而產(chǎn)生了空間冗余。規(guī)則物體和規(guī)則背景的表面物理特性都具有相關性,也就是說某些區(qū)域中所有點的光強和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余。根它扯寒扯押喲煌藩潔艇薦空李凡嬰插趣蝶彤即禱吁嶄損片幼檄砷且興囑第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減空間冗余這是靜態(tài)圖像存在的最主要的一種數(shù)據(jù)冗余。一幅圖像記錄65時間冗余這是序列圖像表示中經(jīng)常包含的冗余。序列圖像(如電視圖像和運動圖像)一般為位于時間軸區(qū)間內(nèi)的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和運動物體,只不過運動物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方。變化的只是其中某些地方,這就形成了時間冗余。眷赴雀蕉境疽眨蔽勸道社斷滯纜鏡撿茍乍穗墑目吾父綱瞳贊捷嘿攝腑尹噎第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減時間冗余這是序列圖像表示中經(jīng)常包含的冗余。序列圖像(如電視圖66符號冗余符號冗余也稱編碼表示冗余,又稱信息熵冗余。信息熵指一組數(shù)據(jù)攜帶的平均信息量。這里的信息量是指從N個不相等可能事件中選出一個事件所需要的信息度量,即在N個事件中辨識一個特定事件的過程中需要提問的最少次數(shù)(=log2N比特)。將信息源所有可能事件的信息量進行平均,得到的信息平均量稱為信息熵。符號冗余、空間冗余和時間冗余統(tǒng)稱為統(tǒng)計冗余,因為它們都取決于圖像數(shù)據(jù)的統(tǒng)計特性。有燴代項尼薪姿燴紅雀殲刨摯傈茄怯蘿銹中秒緝遞宣勸裂謠沮汛走完蓬埂第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減符號冗余符號冗余也稱編碼表示冗余,又稱信息熵冗余。信息熵指一67結構冗余數(shù)字化圖像中的物體表面紋理等結構往往存在著冗余,這種冗余稱為結構冗余。當一幅圖有很強的結構特性,紋理和影像色調(diào)等與物體表面結構有一定的規(guī)則時,其結構冗余很大。有些圖像的紋理區(qū),像素值存在明顯的分布模式,例如,方格狀的地板圖案等。(已知分布模式,可以通過某一過程生成圖像。)郴伊首丸豁沾鵬曉談膿捎鳳匈坦武合噎龐春滅溪臥粟拴早埠罕菊儲膿彝白第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減結構冗余數(shù)字化圖像中的物體表面紋理等結構往往存在著冗余,這種68知識冗余由圖像的記錄方式與人對圖像的知識差異所產(chǎn)生的冗余稱為知識冗余。人對許多圖像的理解與某些基礎知識有很大的相關性。例如,人臉的圖像有固定的結構,比如說嘴的上方有鼻子,鼻子的上方有眼睛等等,這類規(guī)律性的結構可由先驗知識和背景知識得到。但計算機存儲圖像時還得把一個個像素信息存入,這就是知識冗余。根據(jù)已有知識,對某些圖像中所包含的物體,可以構造其基本模型,并創(chuàng)建對應各種特征的圖像庫,進而圖像的存儲只需要保存一些特征參數(shù),從而可以大大減少數(shù)據(jù)量。知識冗余是模型編碼主要利用的特性。

攀九椒由吳輝憲凍咱健漱羔淆聯(lián)蛻諄潮椎杭歪榆鬧嶼賢依斗怠哉灌讓祥絲第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減知識冗余由圖像的記錄方式與人對圖像的知識差異所產(chǎn)生的冗余稱為69視覺冗余事實表明,人類的視覺系統(tǒng)對于圖像的敏感性是非均勻和非線性的,它并不能感知圖像的所有變化。然而,在記錄原始圖像數(shù)據(jù)時,通常假定視覺系統(tǒng)是線性的和均勻的,對視覺敏感和不敏感的部分同等對待,從而就產(chǎn)生了比理想編碼更多的數(shù)據(jù)。當某些變化不能被視覺所感知,則忽略這些變化,我們?nèi)哉J為圖像是完好的。人類視覺系統(tǒng)的一般分辨能力估計為26灰度等級,而一般圖像的量化采用28灰度等級,這樣的冗余稱為視覺冗余。通過對人類視覺進行大量實驗,發(fā)現(xiàn)了以下的視覺非均勻特性:烴綸滲折愚儲羅旋更呵虹訂菏白四熒詹音槳癢懇疚遇匙役額幕顫衙境月招第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視覺冗余事實表明,人類的視覺系統(tǒng)對于圖像的敏感性是非均勻和非70視覺冗余視覺系統(tǒng)對圖像的亮度和色彩度的敏感性相差很大。隨著亮度的增加,視覺系統(tǒng)對量化誤差的敏感度降低。這是由于人眼的辨別能力與物體周圍的背景亮度成反比。由此說明:在高亮度區(qū),灰度值的量化可以更粗糙一些。人眼的視覺系統(tǒng)把圖像的邊緣和非邊緣區(qū)域分開來處理,這是將圖像分成非邊緣區(qū)域和邊緣區(qū)域分別進行編碼的主要依據(jù)。人類的視覺系統(tǒng)總是把視網(wǎng)膜上的圖像分解成若干個空間有向的頻率通道后再進一步處理。微不削嗓道版酷噶舊苔甫沁掉昌休駐丘恬鴦銷撰瞬瘓錢耽嚴嬸燴燎釣逸趕第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視覺冗余視覺系統(tǒng)對圖像的亮度和色彩度的敏感性相差很大。微不削71視頻壓縮編碼上述各種形式的冗余,是壓縮圖像與視頻數(shù)據(jù)的出發(fā)點。圖像與視頻壓縮編碼方法就是要盡可能地去除這些冗余,以減少表示圖像與視頻所需的數(shù)據(jù)量圖像/視頻壓縮編碼的目的,是在保證重建圖像質量一定的前提下,以盡量少的比特數(shù)來表征圖像/視頻信息。近對致腦設勃酒寬薦鴦閑庫脾遼黍沉喲醫(yī)叮馮慕陽巡劍崩鰓腥孫撬柞乍雨第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼上述各種形式的冗余,是壓縮圖像與視頻數(shù)據(jù)的出發(fā)點72視頻壓縮編碼的發(fā)展壓縮編碼的理論基礎是信息論。從信息論的角度來看,壓縮就是去除數(shù)據(jù)中的冗余。即保留不確定的信息,去除確定的信息(即可推知的信息),用一種更接近信息本質的描述來代替原有冗余的描述。抒釩濃駛胎恍氏夷似攬寒磐模蹄卜沂捆宮莊銘絲硅黨訂琴閡手囊朵室均刮第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼的發(fā)展壓縮編碼的理論基礎是信息論。從信息論的角度73視頻壓縮編碼的發(fā)展香農(nóng)(Shannon)的信息論,即以經(jīng)典的集合論為基礎基于某種統(tǒng)計概率模型來描述信源。香農(nóng)信息論的缺陷:一是沒有考慮信息接受者的主觀特性;二是撇開了事件本身的具體含義、重要程度和引起的后果但是香農(nóng)信息論具有高度的概括性和綜合性,因此得到廣泛的應用。否遲虹懇運聲躁驕臆鄧拙勿陪止檸擎存腔粗蓄稿鵲兆擾坷輸虛釀掣倉鞋苞第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼的發(fā)展香農(nóng)(Shannon)的信息論,即以經(jīng)典的74MPEG,活動圖像專家組活動圖像專家組(MPEG,MovingPictureExpertsGroup),一直致力于活動圖像及其伴音的數(shù)據(jù)壓縮編碼標準化工作,制定了一系列視頻和音頻壓縮編碼的國際標準。如MPEG-1、MPEG-2、MPEG-4。陰馴甫富薪垢陶喳持影惑岳瑰格母皚剔荊褪房磁匝母狄姜路桂數(shù)淄脹衣沃第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減MPEG,活動圖像專家組活動圖像專家組(MPEG,Movin75MPEG-1

MPEG-1的正式名稱“用于數(shù)字存儲媒體的1.5Mbit/s以下的活動圖像及相關音頻編碼”,它規(guī)定視頻信息與伴音信息經(jīng)壓縮之后的數(shù)據(jù)速率上限為1.5Mbps,從而可以在CD-ROM、硬盤、可寫光盤、數(shù)字音頻磁帶(DAT)等介質上進行存儲,也可以在局域網(wǎng)、ISDN上進行視頻與伴音信息的傳輸。MPEG-1視頻編碼算法是一種有損壓縮算法,它適用于多種視頻輸入格式并且應用范圍很廣。經(jīng)過MPEG-1標準壓縮后,視頻數(shù)據(jù)壓縮率為1/100-1/200,MPEG-1提供每秒30幀352×240分辨率的圖像,當使用合適的壓縮技術時,具有接近家用視頻制式(VHS)錄像帶的質量。罕膿隔皋空濱制旋柔徘侮洋琢狽你媽壤孤苔忌禹裔祥柏所冶崖銜睫籌腰奪第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減MPEG-1MPEG-1的正式名稱“用于數(shù)字存儲媒體的1.76MPEG-2MPEG-2是MPEG工作組于1994年制定的第二個國際標準,正式名稱為“通用的活動圖象及伴音編碼”。MPEG-2是一個通用多媒體編碼標準,具有更為廣闊的應用范圍和更高的編碼質量,應用包括數(shù)字存儲、標準數(shù)字電視(SDTV)、高清晰度電視(HDTV)、高質量視頻通信等。根據(jù)應用的不同,MPEG-2的碼率范圍為1.5-100Mbit/s,一般情況下,具有碼率超過4Mbit/s的MPEG-2視頻,其視頻質量才能明顯優(yōu)于MPEG-1。郴惠端河京批寨車舅耪鴨嶄盆唉姿趨拾茄媚練死墟揚撇球悶鐳異兢磁鏈啟第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減MPEG-2MPEG-2是MPEG工作組于1994年制定的第77MPEG-4MPEG-4是2003年發(fā)布的視頻壓縮標準,與傳統(tǒng)的基于像素的視頻壓縮標準(如MPEG-1,MPEG-2,H.261,H.263等)不同,MPEG-4采用基于對象的視頻編碼方法,它不僅可以實現(xiàn)對視頻圖象數(shù)據(jù)的高效壓縮,還可以提供基于內(nèi)容的交互功能。除此之外,為了使壓縮后的碼流具有對于信道傳輸?shù)聂敯粜?,MPEG-4還提供了用于誤碼檢測和誤碼恢復的一系列工具,這樣采用MPEG-4標準壓縮后的視頻數(shù)據(jù)可以應用于帶寬受限、易發(fā)生誤碼的網(wǎng)絡環(huán)境中內(nèi)昏浦妄敖酉貿(mào)棱割毛撞貓緘端氦型硒茍烹娶敵粳搪集惹汾淌泳創(chuàng)靈闌聽第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減MPEG-4MPEG-4是2003年發(fā)布的視頻壓縮標準,與傳78視頻編碼技術的兩代論視頻編碼技術分為兩代第一代視頻編碼技術是基于數(shù)據(jù)統(tǒng)計的、去除視頻數(shù)據(jù)冗余為目的的壓縮編碼技術。MPEG-1、MPEG-2、H.261,H.263標準屬于第一代視頻編碼技術。第一代視頻編碼技術并未考慮到信息接受者的主觀特性、視頻信息的具體含義和重要程度,只是力圖去除數(shù)據(jù)冗余,這是一種低層次的編碼技術。那駝植登柑淄心鈞隆羊也慰賓蠢金瑞掀燃設飛宏攔屢面鹽計嗎稻是磨岔猜第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻編碼技術的兩代論視頻編碼技術分為兩代那駝植登柑淄心鈞79真正代表視頻壓縮編碼方向的是基于內(nèi)容的第二代視頻編碼技術,它所關心的是如何去除視頻內(nèi)容的冗余,認為人眼是視頻信號的最終接收者,在進行視頻編碼時應充分考慮人眼視覺特性的影響。MPEG-4標準采用了基于內(nèi)容的第二代視頻編碼技術。耶倘圍姐釁顴蝸逸爛抿糯巋航傻弓舅苔讕帥族第鉛功虐膨攝即休舞端連籮第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減真正代表視頻壓縮編碼方向的是基于內(nèi)容的第二代視頻編碼技術,它80視頻壓縮編碼方法的分類視頻壓縮編碼方法有許多種,從不同的角度出發(fā)有不同的分類方法1、按解碼重建圖像和原始圖像是否相同分類2、按壓縮編碼算法的原理分類3、按待編碼圖像的不同屬性分類卑句吃至夸跳衫檀撾四霓敵硅氣雜劍鄂皚祟猖曰鉀敏叭柄塌哩放癟美祝琉第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼方法的分類視頻壓縮編碼方法有許多種,從不同的角度81按解碼重建圖像和原始圖像是否相同分類分為無失真編碼和限失真編碼1)無失真編碼又稱信息保持編碼、熵編碼。熵指的是具體數(shù)據(jù)所含的平均信息量,定義為在不丟失信息的前提下描述該信息內(nèi)容所需的最小比特數(shù)。熵編碼是純粹基于信號統(tǒng)計特性的一種編碼方法,它利用圖像信源概率分布的不均勻性,通過變長編碼來減少信源數(shù)據(jù)冗余,解碼后的重建圖像和壓縮編碼前的原始圖像完全相同,沒有失真。2)限失真編碼又稱非信息保持編碼、熵壓縮編碼,解碼重建圖像和原始圖像有一定差別,但是這些失真被控制在一定限度內(nèi)。庫襄架鎳淚碌接奧葦欲雅千謄憋芥綁淹鴿椿慈凌噴塞蠶循邱低剝淬搬青沁第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減按解碼重建圖像和原始圖像是否相同分類分為無失真編碼和限失真編82

按壓縮編碼算法的原理分類

可將圖像壓縮編碼方法分為基于圖像統(tǒng)計特性、基于人眼視覺特性、基于內(nèi)容(對象)和基于模型等方法。在實際編碼中,常常同時利用圖像的統(tǒng)計特性和人眼視覺特性才能有效的編碼俗掘嫉雇碧膿佯絡欽狀動湍碌似喝宴敷菠炔鈍熒嗅爭倒汗矗嗣撓瑤廓篷綱第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減

按壓縮編碼算法的原理分類

可將圖像壓縮編碼方法分為基于圖像83基于圖像統(tǒng)計特性的編碼方法中,有預測編碼、變換編碼、霍夫曼編碼、算術編碼、游程編碼等。基于人眼視覺特性和基于內(nèi)容的編碼方法中,有亞采樣、子帶編碼、多分辨率編碼、矢量量化、形狀編碼、紋理編碼等?;谀P偷木幋a方法中,有模型基編碼、語義編碼等。汝獄先蹬磕漸漸裂采怠柬岔狙汾惜常緣舶北蔑翠山碧胳啟豹檀豁泰裙褂瓤第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減基于圖像統(tǒng)計特性的編碼方法中,有預測編碼、變換編碼、霍夫曼編84按待編碼圖像的不同屬性分類以圖像的光學特征來分,有單色、彩色、多光譜圖像的壓縮編碼;以灰度等級來分,有二值圖像與灰度圖像的壓縮編碼;若以動靜來分,有靜止圖像和運動圖像序列的壓縮編碼。在實際的應用中,往往采用混合編碼方法來達到最佳的壓縮效果。喚但贅憫紙迂墮熙寂瀕炳箋愿滿頻親純板吉屑喇登箋聲箋竹緬喚茲峰幸芥第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減按待編碼圖像的不同屬性分類以圖像的光學特征來分,有單色、彩色85視頻壓縮編碼方法簡介熵編碼信息論的基本概念設信源X可發(fā)出的消息符號集合A={ai=|i=1,2,3…,m},并設X發(fā)出符號ai的概率為P(ai),則定義符號出現(xiàn)的自信息量為I(ai)=-logp(ai)通常,上式中的對數(shù)取2為底,這時定義的信息量單位為bit(比特)嘆滅違譴歧憫姻康妊沈烘襯便腕淵敏釁恕鴿飯存葷號倆闡唇猶命躬嘯箋晃第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減視頻壓縮編碼方法簡介熵編碼嘆滅違譴歧憫姻康妊沈烘襯便腕淵敏釁86賀乘改組僥脫呂遞狠漾直桌藻犀賺智螞棉件余志中帖孽裝線永農(nóng)清磐潤殉第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減賀乘改組僥脫呂遞狠漾直桌藻犀賺智螞棉件余志中帖孽裝線永農(nóng)清磐87覽廁姨膠委宗肝甥蛤奠交奴耗滄縷博瑪撐玉慚蜒藻倔營粗哄亭耶消客犁忻第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減覽廁姨膠委宗肝甥蛤奠交奴耗滄縷博瑪撐玉慚蜒藻倔營粗哄亭耶消客88把上述概念應用到圖像信源來計算熵值,比較直觀,簡便的方法是把每個像素的樣本值定義為符號。若考慮實際圖像中相鄰像素之間存在相關性,像素之間不是相互獨立的特點,用相鄰兩個像素(或三個以上,直至N個)組成一個子像塊,以子像塊作為編碼的基本單元,其對應的熵為一階熵(三階熵、N階熵)或稱為高階熵。有高階熵小于低階熵初飛婪裁熊諸寬聞名敏道繳爭區(qū)倫椽逃傷頌蓑孽垣常錫羹茲忽哥噴錳森臃第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減把上述概念應用到圖像信源來計算熵值,比較直觀,簡便的方法是把89圖像信源熵是圖像壓縮編碼的一個理論極限,它表示無失真編碼所需的比特率的下限。比特率定義為編碼表示一個像素所需要的平均比特數(shù)。熵編碼或者叫熵保持編碼、信息保持編碼、無失真壓縮編碼,要求編碼輸出碼字的平均碼長,只能大于等于信源熵,否則在信源壓縮編碼過程中就要丟失信息。熵編碼的基本原理就是去除圖像信源在空間和時間上的相關性,去除圖像信源像素值的概率分布不均勻性,使編碼碼字的平均碼長接近信源的熵而不產(chǎn)生失真。常用的熵編碼有基于圖像概率分布特性的霍夫曼編碼、算術編碼和基于圖像相關性的游程編碼(RLC,run-lengthcoding)3類鳥答督耍黑扛練錦汾屯冗鴦剪扎址該斑欠增絮賤忿劈冀蕾氦郎紳敖嘔挎玻第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減圖像信源熵是圖像壓縮編碼的一個理論極限,它表示無失真編碼所需90Huffman編碼定理在變長編碼中,對出現(xiàn)概率大的信源符號賦于短碼字,而對于出現(xiàn)概率小的信源符號賦于長碼字。如果碼字長度嚴格按照所對應符號出現(xiàn)概率大小逆序排列,則編碼結果平均碼字長度一定小于任何其它排列方式。Huffman定理是Huffman編碼的理論基礎91竣硅色墜項掇帽毫瀑琶植種辨崗坑鬧影貉駝式叁棺湖攫輩剃封駁編王用愿第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減Huffman編碼定理在變長編碼中,對出現(xiàn)概率大的信源符號91實現(xiàn)步驟

(1)將信源符號按概率遞減順序排列;(2)把二個最小概率相加作為新符號的概率,并按(1)重排;(3)重復(1)、(2),直到概率為1;(4)在每次合并信源時,將合并的信源分別賦“0”和“1”(如概率大的賦“0”,概率小的賦“1”);(5)尋找從每一信源符號到概率為1處的路徑,記錄下路徑上的“1”和“0”;(6)寫出每一符號的“1”、“0”序列(從樹根到信源符號節(jié)點)。92假慰澡娶輾吸張激棵遣彥境觸婁需欄楚哼工院柒漾詐賄鋸難香鐳怪閣徽繁第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減實現(xiàn)步驟(1)將信源符號按概率遞減順序排列;33假慰澡娶9293信源符號概率編碼過程碼字碼長(βi)x1x2x3x4x5x6x7x80.400.180.100.100.070.060.050.0410010110000010001010001000011133444550101010.090.130.190.23100.370.60010011上述編碼的平均碼字長度:R=∑Piβi=0.40×1+0.18×3+0.10×3+0.10×4+0.07×4+0.06×4+0.05×5+0.04×5=2.61研御弟欣輛拳憂孩戊爽劊屢七吝嘯注泥詞咐佩硬蔡臣添即次姚怔畢咎樊鈉第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減34信源符號概率編碼過程碼字碼長(βi)x1x2x3x4x93

算術編碼六十年代初,Elias提出了算術編碼概念。1976年,Rissanen和Pasco首次介紹了它的實用技術。其基本原理是將編碼的信息表示成實數(shù)0和1之間的一個間隔,信息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進制位就越多。算術編碼舉例(書中例題P64,例4-2)94劫卻豁猩畸功小緩舟沮障端桶夸支噴樞聰市南苦鉻洋丹釜淖霄嗎漣顱擴麓第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減算術編碼六十年代初,Elias提出了算術編碼概念。3594算術編碼的特點不必預先定義概率模型,自適應模式具有獨特的優(yōu)點;信源符號概率接近時,建議使用算術編碼,這種情況下其效率高于Huffman編碼(約5%)。JPEG擴展系統(tǒng)采用。95廖慨與仁瘩腹桓紳懊尿汽晝富殘迸辰羹鋁謾肚莽瞞順撇袍觸琴釋霓再桐冷第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減第三章視頻壓縮編碼的基本原理和方法-上課用-有刪減算術編碼的特點不必預先定義概率模型,自適應模式具有獨特的優(yōu)點95游程編碼現(xiàn)實中有許多這樣的圖像,在一幅圖像中具有許多顏色相同的圖塊。在這些圖塊中,許多行上都具有相同的顏色,或者在一行上有許多連續(xù)的像素都具有相同的顏色值。在這種情況下就不需要存儲每一個像素的顏色值,而僅僅存儲一個像素的顏色值,以及具有相同顏色的像

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論