多媒體技術(shù)-視頻壓縮

上傳人：a*** IP屬地：湖北上傳時(shí)間：2023-02-05 格式：PPT 頁(yè)數(shù)：145 大小：3.95MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩140頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

多媒體計(jì)算機(jī)技術(shù)魯宏偉luhw@第三章數(shù)字圖像處理技術(shù)信號(hào)處理的基本術(shù)語(yǔ)圖像數(shù)據(jù)壓縮基礎(chǔ)

圖像數(shù)據(jù)壓縮算法

常用圖形、圖像文件的格式靜態(tài)圖像壓縮標(biāo)準(zhǔn)動(dòng)態(tài)圖像壓縮標(biāo)準(zhǔn)H.261和H.263標(biāo)準(zhǔn)思考題信號(hào)處理的基本術(shù)語(yǔ)采樣與量化DFT和IDFT小波變換采樣和量化

信號(hào)的數(shù)字化處理包括兩個(gè)步驟，一個(gè)是信號(hào)在時(shí)間上的離散化，即采樣；另一個(gè)是幅度上的離散化，即量化。采樣也稱(chēng)抽樣，是信號(hào)在時(shí)間上的離散化，即按照一定時(shí)間間隔△t在模擬信號(hào)x(t)上逐點(diǎn)采取其瞬時(shí)值。它是通過(guò)采樣脈沖和模擬信號(hào)相乘來(lái)實(shí)現(xiàn)的t=采樣點(diǎn)之間的距離采樣和量化量化是對(duì)幅值進(jìn)行離散化，即將振動(dòng)幅值用二進(jìn)制量化電平來(lái)表示。量化電平按級(jí)數(shù)變化，實(shí)際的幅度值是連續(xù)的物理量。具體幅度值用舍入法歸到靠近的量化電平上。

對(duì)模擬信號(hào)采樣首先要確定采樣間隔。如何合理選擇△t涉及到許多需要考慮的技術(shù)因素。

過(guò)采樣信號(hào)低采樣產(chǎn)生的偏差信號(hào)DFT和IDFT傅立葉分析是將原始信號(hào)分解成不同頻率成分的正弦波，將時(shí)域信號(hào)轉(zhuǎn)變?yōu)轭l域信號(hào)的一種數(shù)學(xué)方法，在信號(hào)的分析和處理中有著十分重要的作用對(duì)數(shù)字信號(hào)，需要采用相關(guān)的離散化方法，這就是由傅立葉分析得到的離散傅立葉變換DFT，其逆變換表示為IDFT。

DFT和IDFT設(shè)是連續(xù)函數(shù)h(t)的N個(gè)采樣值，則這N個(gè)點(diǎn)的寬度為N的DFT定義為IDFT定義為稱(chēng)為N點(diǎn)DFT的變換核函數(shù)稱(chēng)為N點(diǎn)IDFT的變換核函數(shù)小波變換

一個(gè)小波是一個(gè)在有限周期內(nèi)的波形，它的平均值為零。比較正弦波形和小波，正弦信號(hào)正是Fourier分析的基礎(chǔ)，它沒(méi)有限定的周期，它可以從負(fù)無(wú)窮擴(kuò)展到正無(wú)窮，正弦信號(hào)是平滑并且是可預(yù)知的，小波信號(hào)是不規(guī)則的并且不對(duì)稱(chēng)。

圖3.3正弦信號(hào)和小波信號(hào)正弦波小波小波變換傅立葉分析是將信號(hào)分解為各種頻率的正弦信號(hào)，類(lèi)似地，小波分析是將信號(hào)分解為滑動(dòng)的、與母系小波成比例的各種子波。

信號(hào)傅立葉變換不同頻率的連續(xù)正弦子波信號(hào)小波變換不同尺度與位置的連續(xù)小波小波變換小波變換可以使得信號(hào)的低頻長(zhǎng)時(shí)特性和高頻短時(shí)特性同時(shí)得到處理，具有良好的局部化性質(zhì)，能有效地克服傅氏變換在處理非平穩(wěn)復(fù)雜信號(hào)時(shí)存在的局限性，具有極強(qiáng)的自適應(yīng)性。由于小波變換能夠有效地解決方塊效應(yīng)和基本上解決蚊式噪聲，所以小波變換已經(jīng)成為當(dāng)今圖像壓縮編碼的主要研究方向。

圖像數(shù)據(jù)壓縮基礎(chǔ)色彩的基本概念視覺(jué)系統(tǒng)對(duì)顏色的感知彩色空間及其變換RGB顏色模式

Lab顏色模式

HSB顏色模式CMYK顏色模式顏色模型的色域彩色空間的線性變換標(biāo)準(zhǔn)圖像的種類(lèi)圖像數(shù)據(jù)壓縮的可能性統(tǒng)計(jì)冗余信息熵冗余結(jié)構(gòu)冗余知識(shí)冗余視覺(jué)冗余

色彩的基本概念

從人的視覺(jué)系統(tǒng)看，色彩可用色調(diào)、飽和度和亮度來(lái)描述。人眼看到的任一彩色光都是這三個(gè)特性的綜合效果，這三個(gè)特性可以說(shuō)是色彩的三要素，其中色調(diào)與光波的波長(zhǎng)有直接關(guān)系，亮度和飽和度與光波的幅度有關(guān)。圖像深度與色彩類(lèi)型

圖像深度與顯示深度圖像深度與色彩類(lèi)型圖像深度是指位圖中記錄每個(gè)像素點(diǎn)所占的位數(shù)，它決定了彩色圖像中可出現(xiàn)的最多顏色數(shù)，或者灰度圖像中的最大灰度等級(jí)數(shù)。

每個(gè)像素點(diǎn)的圖像深度的分配還與圖像所用的色彩空間有關(guān)。以最常用的RGB色彩空間為例，圖像深度與色彩的映射關(guān)系主要有真彩色、偽彩色和調(diào)配色。真彩色真彩色（true-color）是指圖像中的每個(gè)像素值都分成R、G、B三個(gè)基色分量，每個(gè)基色分量直接決定其基色的強(qiáng)度，這樣產(chǎn)生的色彩稱(chēng)為真彩色。例如圖像深度為24，用R：G：B＝8：8：8來(lái)表示色彩，則R、G、B各占用8位來(lái)表示各自基色分量的強(qiáng)度，每個(gè)基色分量的強(qiáng)度等級(jí)為28＝256種。圖像可容納224＝16M種色彩。這樣得到的色彩可以反映原圖的真實(shí)色彩，故稱(chēng)真彩色偽彩色偽彩色（pseudo-color）圖像的每個(gè)像素值實(shí)際上是一個(gè)索引值或代碼，該代碼值作為色彩查找表CLUT（ColorLook-UpTable）中某一項(xiàng)的入口地址，根據(jù)該地址可查找出包含實(shí)際R、G、B的強(qiáng)度值。用這種方式產(chǎn)生的色彩本身是真的，不過(guò)它不一定反映原圖的色彩。在VGA顯示系統(tǒng)中，調(diào)色板就相當(dāng)于色彩查找表。從16色標(biāo)準(zhǔn)VGA調(diào)色板的定義可以看出這種偽彩色的工作方式偽彩色一般用于65K色以下的顯示方式中。標(biāo)準(zhǔn)的調(diào)色板是在256K色譜中按色調(diào)均勻地選取16種或256種色彩。一般應(yīng)用中，有的圖像往往偏向于某一種或幾種色調(diào)，此時(shí)如果采用標(biāo)準(zhǔn)調(diào)色板，則色彩失真較多。因此，同一幅圖像，采用不同的調(diào)色板顯示可能會(huì)出現(xiàn)不同的色彩效果。16色標(biāo)準(zhǔn)VGA調(diào)色板采用不同的調(diào)色板顯示同一幅圖像的效果實(shí)例調(diào)配色調(diào)配色（direct-color）的獲取是通過(guò)每個(gè)像素點(diǎn)的R、G、B分量分別作為單獨(dú)的索引值進(jìn)行變換，經(jīng)相應(yīng)的色彩變換表找出各自的基色強(qiáng)度，用變換后的R、G、B強(qiáng)度值產(chǎn)生的色彩。調(diào)配色與偽彩色相比，相同之處是都采用查找表，不同之處是前者對(duì)R、G、B分量分別進(jìn)行查找變換，后者是把整個(gè)像素當(dāng)作查找的索引進(jìn)行查找變換。因此，調(diào)配色的效果一般比偽彩色好。調(diào)配色與真彩色比，相同之處是都采用R、G、B分量來(lái)決定基色強(qiáng)度，不同之處是前者的基色強(qiáng)度是由R、G、B經(jīng)變換后得到的，而后者是直接用R、G、B決定。在VGA顯示系統(tǒng)中，用調(diào)配色可以得到相當(dāng)逼真的彩色圖像，雖然其色彩數(shù)受調(diào)色板的限制而只有256色圖像深度與顯示深度顯示深度表示顯示緩存中記錄屏幕上一個(gè)點(diǎn)的位數(shù)（bit），也即顯示器可以顯示的色彩數(shù)。因此，顯示一幅圖像時(shí)，屏幕上呈現(xiàn)的色彩效果與圖像文件所提供的色彩信息有關(guān)，也即與圖像深度有關(guān)；同時(shí)也與顯示器當(dāng)前可容納的色彩容量有關(guān)，也即與顯示深度有關(guān)。顯示深度大于圖像深度顯示深度等于圖像深度顯示深度小于圖像深度顯示深度大于圖像深度在這種情況下屏幕上的色彩能較真實(shí)地反映圖像文件的色彩效果。如當(dāng)顯示深度為24位，圖像深度為8位時(shí)，屏幕上可以顯示按該圖像的調(diào)色板選取的256種顏色；圖像深度為4位時(shí)可顯示16色。這種情況下，顯示的色彩完全取決于圖像的色彩定義顯示深度等于圖像深度在這種情況下，如果用真彩色顯示模式來(lái)顯示真彩色圖像，或者顯示調(diào)色板與圖像調(diào)色板一致時(shí)，屏幕上的色彩能較真實(shí)地反映圖像文件的色彩效果。反之，如果顯示調(diào)色板與圖像調(diào)色板不一致，則顯示色彩會(huì)出現(xiàn)失真

顯示深度小于圖像深度此時(shí)顯示的色彩會(huì)出現(xiàn)失真。例如，若顯示深度為8位，需要顯示一幅真彩色的圖像時(shí)顯然達(dá)不到應(yīng)有的色彩效果。在這種情況下不同的圖像軟件有不同的處理方法

色調(diào)與色相繪畫(huà)中要求有固定的色彩感覺(jué)，有統(tǒng)一的色調(diào)，否則難以表現(xiàn)畫(huà)面的情調(diào)和主題。例如我們說(shuō)一幅畫(huà)具紅色調(diào)，是指它在色彩上總體偏紅。計(jì)算機(jī)在圖像處理上采用數(shù)字化，可以非常精確地表現(xiàn)色彩的變化，色調(diào)是相對(duì)連續(xù)變化的。用一個(gè)園環(huán)來(lái)表現(xiàn)色譜的變化，就構(gòu)成了一個(gè)色彩連續(xù)變化的色環(huán)。

色彩連續(xù)變化的色環(huán)太陽(yáng)光帶中的六標(biāo)準(zhǔn)色與六個(gè)中間色，即紅橙，黃橙，黃綠，藍(lán)綠（青），藍(lán)紫，紅紫（品紅），合稱(chēng)十二色相或色調(diào)。把不同的色調(diào)按紅橙黃綠藍(lán)紫的順序銜接起來(lái)，就形成了一個(gè)色調(diào)連續(xù)變化過(guò)渡的圓環(huán)，稱(chēng)作為色環(huán)。亮度與明度同一物體因受光不同會(huì)產(chǎn)生明度上的變化不同顏色的光，強(qiáng)度相同時(shí)照射同一物體也會(huì)產(chǎn)生不同的亮度感覺(jué)。

明度也可以說(shuō)是指各種純正的色彩相互比較所產(chǎn)生的明暗差別。在純正光譜中，黃色的明度最高，顯得最亮；其次是橙、綠；再其次是紅、藍(lán)；紫色明度最低，顯得最暗。同一物體因受光不同會(huì)產(chǎn)生明度上的變化照射的光越強(qiáng)，反射光也越強(qiáng)，看起來(lái)越亮。顯然，如果彩色光的強(qiáng)度降到使人看不到了，在亮度標(biāo)尺上它應(yīng)與黑色對(duì)應(yīng)。同樣，如果其強(qiáng)度變得很大，那么亮度等級(jí)應(yīng)與白色對(duì)應(yīng)。亮度是非彩色屬性，彩色圖像中的亮度對(duì)應(yīng)于黑白圖像中的灰度飽和度與純度淡色的飽和度比濃色要低一些。飽和度還和亮度有關(guān)，同一色調(diào)越亮或越暗越不純。飽和度越高，色彩越艷麗、越鮮明突出，越能發(fā)揮其色彩的固有特性。但飽和度高的色彩容易讓人感到單調(diào)刺眼。飽和度低，色感比較柔和協(xié)調(diào)，可混色太雜則容易讓人感覺(jué)渾濁，色調(diào)顯得灰暗。

飽和度與純度對(duì)于同一色調(diào)的彩色光，飽和度越深，顏色越鮮明或說(shuō)越純，相反則越淡飽和度和亮度在飽和的彩色光中增加白光的成分，相當(dāng)于增加了光能，因而變得更亮了，但是它的飽和度卻降低了。若增加黑色光的成分，相當(dāng)于降低了光能，因而變得更暗，其飽和度也降低了視覺(jué)系統(tǒng)對(duì)顏色的感知視覺(jué)系統(tǒng)對(duì)顏色和亮度的響應(yīng)特性視覺(jué)系統(tǒng)對(duì)顏色的感知產(chǎn)生波長(zhǎng)不同的光所需要的三基色值人眼對(duì)圖像的亮度信息敏感、對(duì)顏色分辨率弱由于人眼對(duì)色彩細(xì)節(jié)的分辨能力遠(yuǎn)比對(duì)亮度細(xì)節(jié)的分辨能力低，若把人眼剛能分辨的黑白相間的條紋換成不同顏色的彩色條紋，那么眼睛就不再能分辨出條紋來(lái)。如圖所示，等寬的藍(lán)紅相間的彩條，藍(lán)綠相間的彩條和黑白相間的條紋比較。使眼睛逐漸遠(yuǎn)離屏幕，當(dāng)你分辨不出彩條時(shí)，黑白條還能分辨出來(lái)RGB顏色模式

自然界中所有的顏色都可以用紅、綠、藍(lán)(RGB)這三種波長(zhǎng)顏色的不同的強(qiáng)度組合而得，這就是人們常說(shuō)的三基色原理。因?yàn)镽GB顏色合成產(chǎn)生白色，它們也叫作加色把三種基色交互重疊，就產(chǎn)生了次混合色：青(cyan)、洋紅(magenta)、黃(yellow)在數(shù)字視頻中，對(duì)RGB三基色各進(jìn)行8位編碼就構(gòu)成了大約16.7萬(wàn)種顏色，這就是我們常說(shuō)的真彩色。

電視機(jī)和計(jì)算機(jī)的監(jiān)視器都是基于RGB顏色模式來(lái)創(chuàng)建其顏色的。

RGB色彩空間RGB相加混色模型RGB相加色示例RGB強(qiáng)度顏色色彩效果000

黑（Black）001

藍(lán)（Blue）010

綠（Green）011

青（Cyan）100

紅（Red）101

品紅（Magenta）110

黃（Yellow）111

白（White）Lab顏色模式該顏色模式由一個(gè)發(fā)光率(luminance)和兩個(gè)顏色(a,b)軸組成。它由顏色軸所構(gòu)成的平面上的環(huán)形線來(lái)表示顏色的變化，其中徑向表示色飽和度的變化，自?xún)?nèi)向外，飽和度逐漸增高；圓周方向表示色調(diào)的變化，每個(gè)圓周形成—個(gè)色環(huán)；而不同的發(fā)光率表示不同的亮度并對(duì)應(yīng)不同環(huán)形顏色變化線。A.光度=100（白）B.綠到紅分量C.藍(lán)到黃分量D.光度=0（黑）到紅分量Lab顏色模式

Lab顏色是由RGB三基色轉(zhuǎn)換而來(lái)的

它是一種具有“獨(dú)立于設(shè)備”的顏色模式，既不論使用任何一種監(jiān)視器或者打印機(jī)，Lab的顏色不變。

HSB顏色模式

從心理學(xué)的角度來(lái)看，顏色有三個(gè)要素：色相、飽和度和亮度。HSB顏色模式便是基于人對(duì)顏色的心里感受的顏色模式。

HSB色彩空間可以用一個(gè)圓錐空間模型來(lái)描述。圓錐空間模型（A）HSI圓錐空間模型（B）線條示意圖：圓錐上亮度、色度和飽和度的關(guān)系。（C）縱軸表示亮度（D）圓錐縱切面：描述了同一色調(diào)的不同亮度和飽和度關(guān)系。（E）圓錐橫切面：色調(diào)H為繞著圓錐截面度量的色環(huán)，圓周上的顏色為完全飽和的純色，色飽和度為穿過(guò)中心的半徑橫軸。彩色空間的線性變換標(biāo)準(zhǔn)

為了使用人的視角特性以降低數(shù)據(jù)量，通常把RGB空間表示的彩色圖像變換到其他彩色空間。彩色空間變換有三種：YIQ,YUV和YCrCbYIQ適用于NTSC彩色電視制式Y(jié)UV適用于PAL和SECAM彩色電視制式而YCrCb適用于計(jì)算機(jī)用的顯示器彩色空間的線性變換標(biāo)準(zhǔn)YUV與YIQ模型

在彩色電視制式中，使用YUV和YIQ模型來(lái)表示彩色圖像。在PAL彩色電視制式中使用YUV模型，Y表示亮度，UV用來(lái)表示色差，U、V是構(gòu)成彩色的兩個(gè)分量；在NTSC彩色電視制式中使用YIQ模型，其中的Y表示亮度，I、Q是兩個(gè)彩色分量。YUV/YIQ特點(diǎn)

亮度信號(hào)(Y)和色度信號(hào)(U、V)是相互獨(dú)立的可以利用人眼的特性來(lái)降低數(shù)字彩色圖像所需要的存儲(chǔ)容量。人眼對(duì)彩色細(xì)節(jié)的分辨能力遠(yuǎn)比對(duì)亮度細(xì)節(jié)的分辨能力低。例如，要存儲(chǔ)RGB8:8:8的彩色圖像，即R、G和B分量都用8位二進(jìn)制數(shù)表示，圖像的大小為640×480像素，那末所需要的存儲(chǔ)容量為921600字節(jié)。如果用YUV來(lái)表示同一幅彩色圖像，Y分量仍然為640×480，并且Y分量仍然用8位表示，而對(duì)每四個(gè)相鄰像素(2×2)的U、V值分別用相同的一個(gè)值表示，那末存儲(chǔ)同樣的一幅圖像所需的存儲(chǔ)空間就減少到460800字節(jié)。這實(shí)際上也是圖像壓縮技術(shù)的一種方法。與YUV顏色模式類(lèi)似的一種稱(chēng)為YCrCb模式，主要適用于計(jì)算機(jī)用的顯示器。彩色空間的線性變換標(biāo)準(zhǔn)YUV與RGB彩色空間變換Y=0.299R+0.587G+0.114BU=-0.147R-0.289G+0.436BV=0.615R-0.515G-0.100B寫(xiě)成矩陣的形式：彩色空間RGB-YUVYIQ與RGB彩色空間變換Y=0.299R+0.587G+0.114BI=0.596R-0.275G-0.321BQ=0.212R-0.523G+0.311B寫(xiě)成矩陣的形式：彩色空間RGB-YIQ彩色空間RGB-YCrCbYCrCb與RGB彩色空間變換

數(shù)字域中的彩色空間變換與模擬域的彩色空間變換不同。它們的分量使用Y、Cr和Cb來(lái)表示，與RGB空間的轉(zhuǎn)換關(guān)系如下：Y＝0.299R＋0.578G＋0.114BCr＝(0.500R－0.4187G－0.0813B)＋128Cb=(-0.1687R－0.3313G＋0.500B)＋128寫(xiě)成矩陣的形式：CMYK顏色模式

這是彩色印刷使用的—種顏色模式。它由青(cyan)、洋紅(magenta)、黃(yellow)和黑(black)四種顏色組成。

這種模式的創(chuàng)建基礎(chǔ)和RGB不同，它不是靠增加光線，而是靠減去光線。這是因?yàn)榕c監(jiān)視器或者電視機(jī)不同，打印紙不能創(chuàng)建光源，即它不會(huì)發(fā)射光線，而只能吸收和反射光線，即它只能夠吸收特定波長(zhǎng)而反射其它波長(zhǎng)。

通過(guò)對(duì)上述四種顏色的組合，可以產(chǎn)生可見(jiàn)光譜中的絕大部分顏色。

CMYK顏色模式CMYK相減混色模型

CMYK模型以打印在紙張上油墨的光線吸收特性為基礎(chǔ)，白光照射到半透明油墨上時(shí)，部分光譜被吸收，部分被反射回眼睛。理論上，青色(C)、洋紅(M)和黃色(Y)色素能合成吸收所有顏色并產(chǎn)生黑色。由于這個(gè)原因，這些顏色叫作減色。

因?yàn)樗写蛴∮湍紩?huì)包含一些雜質(zhì)，這三種油墨實(shí)際上產(chǎn)生一種土灰色，必須與黑色(K)油墨混合才能產(chǎn)生真正的黑色。將這些油墨混合產(chǎn)生顏色叫作四色印刷。顏色模型的色域

色域是一個(gè)色系能夠顯示或打印的顏色范圍。人眼看到的色譜比任何顏色模型中的色域都寬。在顏色模型中，Lab具有最寬的色域，它包括RGB和CMYK色域中的所有顏色。通常RGB色域包含能在計(jì)算機(jī)顯示器或電視屏幕（發(fā)出紅、綠和藍(lán)光）上所有能顯示的顏色。因而一些諸如純青或純黃等顏色不能在顯示器上精確顯示。

CMYK色域較窄，僅包含使用印刷色油墨能夠打印的顏色。當(dāng)不能被打印的顏色在屏幕上顯示時(shí)，它們稱(chēng)為溢色──即超出CMYK色域之外。圖像的種類(lèi)標(biāo)準(zhǔn)單色圖標(biāo)準(zhǔn)灰度圖圖像的種類(lèi)256色標(biāo)準(zhǔn)圖像24位標(biāo)準(zhǔn)圖像圖像的種類(lèi)256色標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖24位標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖統(tǒng)計(jì)冗余圖像數(shù)據(jù)存在大量的統(tǒng)計(jì)特征的重復(fù)，這種重復(fù)包括靜態(tài)單幀圖像數(shù)據(jù)在空間上的冗余和音頻、視頻數(shù)據(jù)在時(shí)間上的冗余。

在動(dòng)態(tài)圖像序列中，前后兩幀圖像之間具有較大的相關(guān)性，表現(xiàn)出幀與幀之間的重復(fù)，因而存在時(shí)間冗余。

信息熵冗余

信息熵定義為一組數(shù)據(jù)所表示的信息量，即

式中，E為信息熵，N為數(shù)據(jù)的種類(lèi)(或稱(chēng)碼元)個(gè)數(shù)，為第i個(gè)碼元出現(xiàn)的概率。一組數(shù)據(jù)的數(shù)據(jù)量顯然等于各記錄碼元的二進(jìn)制位數(shù)(即編碼長(zhǎng)度)與該碼元出現(xiàn)的概率乘積之和，即

式中，D為數(shù)據(jù)量，為第i個(gè)碼元的二進(jìn)制位數(shù)。一般取(如ASCII編碼把所有碼元都編碼為7比特)，這樣得到的D必然大于E。這種因碼元編碼長(zhǎng)度的不經(jīng)濟(jì)帶來(lái)的冗余稱(chēng)為信息熵冗余或編碼冗余。

信息熵冗余圖26個(gè)英文字母相對(duì)頻率結(jié)構(gòu)冗余

有些圖像從大面積上或整體上看存在著重復(fù)出現(xiàn)的相同或詳盡的紋理結(jié)構(gòu)，例如布紋圖像和草席圖像，被稱(chēng)為結(jié)構(gòu)冗余。

知識(shí)冗余

有許多圖像的理解與圖像所表現(xiàn)內(nèi)容的基礎(chǔ)知識(shí)(鮮艷或背景知識(shí))有相當(dāng)大的相關(guān)性，從這種知識(shí)出發(fā)可以歸納出圖像的某種規(guī)律性變化，這類(lèi)冗余稱(chēng)為知識(shí)冗余。知識(shí)冗余的一個(gè)典型例子是對(duì)人像的理解，比如，鼻子上方有眼睛，鼻子又在嘴的上方等。

視覺(jué)冗余

人類(lèi)的視覺(jué)系統(tǒng)實(shí)際上只在一定程度上對(duì)圖像的變化產(chǎn)生敏感，即圖像數(shù)據(jù)中存在著大量人類(lèi)視覺(jué)覺(jué)察不到的細(xì)節(jié)。事實(shí)上，人類(lèi)視覺(jué)系統(tǒng)的一般分辨力為64灰度級(jí)，而一般圖像量化采用的是256灰度級(jí)，這類(lèi)冗余稱(chēng)為視覺(jué)冗余。

圖像數(shù)據(jù)壓縮算法評(píng)價(jià)壓縮算法的指標(biāo)

壓縮算法分類(lèi)行程長(zhǎng)度編碼

哈夫曼編碼算術(shù)編碼

詞典編碼預(yù)測(cè)編碼

變換編碼

模型法編碼

混合編碼

評(píng)價(jià)壓縮算法的指標(biāo)

壓縮比指壓縮編碼后的數(shù)據(jù)量與原始數(shù)據(jù)大小的比值；

算法的復(fù)雜性和運(yùn)算速度；

失真度。

壓縮比并不是一個(gè)絕對(duì)的指標(biāo)將16M色的真彩圖像(圖A)轉(zhuǎn)變?yōu)?56色(圖B),數(shù)據(jù)量減少了約3倍,壓縮比為1:3.當(dāng)然這時(shí)產(chǎn)生了色彩失真,但如果選擇原圖的色彩范圍定義調(diào)色板,色彩失真較小,人眼一般都還能接受.如果把圖像深度從8位再壓縮到4位,即從256色再壓到16色(圖C),雖然數(shù)據(jù)量只減少了2倍,壓縮比為1:2,但這時(shí)的人眼所看到的色彩失真比第一次大得多，效果很差圖像效果

圖像類(lèi)型圖A真彩色圖像圖B256色圖像圖C16色圖像壓縮比8/24=1/34/24=1/6壓縮算法分類(lèi)根據(jù)對(duì)編碼數(shù)據(jù)進(jìn)行解碼后與編碼前的數(shù)據(jù)是否一致可以把數(shù)據(jù)編碼方法分為兩類(lèi)：

無(wú)損編碼。解碼后的數(shù)據(jù)與編碼前的數(shù)據(jù)完全一致，沒(méi)有任何失真。

有損編碼。解碼后的數(shù)據(jù)與原始數(shù)據(jù)有一定程度的偏差或失真，但一般不影響聽(tīng)覺(jué)或視覺(jué)效果。

行程長(zhǎng)度編碼

把一系列的重復(fù)值（例如圖像象素的灰度值）用一個(gè)單獨(dú)的值再加上一個(gè)計(jì)數(shù)值來(lái)取代。

比如有這樣一個(gè)字母序列aabbbccccccccdddddd它的行程長(zhǎng)度編碼就是2a3b8c6d。

很多位圖文件格式都用行程長(zhǎng)度編碼，例如TIFF，PCX。行程長(zhǎng)度編碼例有一線狀圖像，其灰度隨長(zhǎng)度坐標(biāo)的關(guān)系如圖3.1所示。描述這個(gè)一維圖像可以用順序的七個(gè)3bit的二進(jìn)制數(shù)表示：011，011，011，011，101，101，101，共21比特。

如果用行程編碼方法對(duì)其編碼，其編碼就變成了100，011；011，101，共用了12比特，比前一種編碼節(jié)約了9個(gè)比特。

香農(nóng)-范諾算法編碼器信源（消息集）編碼輸出集X={x1,…,xn}Z={z1,…,zn}符號(hào)集Am={a1,…,am}熵(Entropy)的概念熵是信息量的度量方法，它表示某一事件出現(xiàn)的消息越多，事件發(fā)生的可能性就越小，數(shù)學(xué)上就是概率越小。某個(gè)事件的信息量用表示，其中Pi為第i個(gè)事件的概率，0<Pi1。哈夫曼編碼編碼步驟如下：統(tǒng)計(jì)信源符號(hào)出現(xiàn)的概率；將信源符號(hào)按概率遞減順序排列；

把兩個(gè)最小的概率值加起來(lái)，作為一個(gè)新組合符號(hào)的概率；重復(fù)步驟(2)、(3)，直到概率和達(dá)到1為止；在每次合并信源時(shí)，將合并的信源分別標(biāo)記“1”和“0”（例如，概率小的標(biāo)記為“1”，概率大的標(biāo)記為“0”）；尋找從每一信源符號(hào)到概率為1的路徑，記錄下路徑上的“1”和“0”；對(duì)每一符號(hào)寫(xiě)出“1”和“0”序列；

哈夫曼編碼的例子考慮信源進(jìn)行哈夫曼編碼的過(guò)程如下：

哈夫曼編碼的不足

它必須精確地統(tǒng)計(jì)出原始文件中每個(gè)值的出現(xiàn)頻率，如果沒(méi)有這個(gè)精確統(tǒng)計(jì)，壓縮的效果就會(huì)大打折扣，甚至根本達(dá)不到壓縮的效果。因此哈夫曼編碼通常要經(jīng)過(guò)兩遍操作，第一遍進(jìn)行統(tǒng)計(jì)，第二遍產(chǎn)生編碼，所以編碼的過(guò)程是比較慢的。另外由于各種長(zhǎng)度的編碼的譯碼過(guò)程也比較復(fù)雜，因此解壓縮的過(guò)程也比較慢。它對(duì)于位的增刪比較敏感。

算術(shù)編碼算術(shù)編碼在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG，JBIG)中扮演了重要的角色。在算術(shù)編碼中，消息用0到1之間的實(shí)數(shù)進(jìn)行編碼，算術(shù)編碼用到兩個(gè)基本的參數(shù)：符號(hào)的概率和它的編碼間隔。信源符號(hào)的概率決定壓縮編碼的效率，也決定編碼過(guò)程中信源符號(hào)的間隔，而這些間隔包含在0到1之間。編碼過(guò)程中的間隔決定了符號(hào)壓縮后的輸出。算法舉例假設(shè)信源符號(hào)為{00,01,10,11}，這些符號(hào)的概率分別為{0.1,0.4,0.2,0.3}，根據(jù)這些概率可把間隔[0,1)分成4個(gè)子間隔：[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1)，二進(jìn)制消息序列的輸入為：10001100101101算術(shù)編碼算術(shù)編碼需要注意的幾個(gè)問(wèn)題1.由于實(shí)際計(jì)算機(jī)精度不可能無(wú)限長(zhǎng)，運(yùn)算中溢出是明顯的問(wèn)題，但多數(shù)機(jī)器都有16位、32位或者64位的精度，因此可使用比例縮放法解決。2.算術(shù)編碼器對(duì)消息只產(chǎn)生一個(gè)碼字，這個(gè)碼字是在[0,1)中的一個(gè)實(shí)數(shù)，因此譯碼器在接受到表示這個(gè)實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。3.算術(shù)編碼也是一種對(duì)錯(cuò)誤很敏感的編碼方法，如果有一位發(fā)生錯(cuò)誤就會(huì)導(dǎo)致整個(gè)消息譯錯(cuò)。算術(shù)編碼可以是靜態(tài)的或者自適應(yīng)的。在靜態(tài)算術(shù)編碼中，信源符號(hào)的概率是固定的。在自適應(yīng)算術(shù)編碼中,信源符號(hào)的概率根據(jù)編碼時(shí)符號(hào)出現(xiàn)的頻繁程度動(dòng)態(tài)地進(jìn)行修改,在編碼期間估算信源符號(hào)概率的過(guò)程叫做建模。需要開(kāi)發(fā)動(dòng)態(tài)算術(shù)編碼的原因是因?yàn)槭孪戎谰_的信源概率是很難的,而且是不切實(shí)際的。當(dāng)壓縮消息時(shí),我們不能期待一個(gè)算術(shù)編碼器獲得最大的效率,所能做的最有效方法是在編碼過(guò)程中估算概率。因此動(dòng)態(tài)建模成為確定編碼器壓縮效率的關(guān)鍵。詞典編碼詞典編碼的思想第一類(lèi)詞典法的想法是企圖查找正在壓縮的字符序列是否在以前輸入的數(shù)據(jù)中出現(xiàn)過(guò)，然后用已經(jīng)出現(xiàn)過(guò)的字符串替代重復(fù)的部分，它的輸出僅僅是指向早期出現(xiàn)過(guò)的字符串的“指針”。詞典編碼LZ77算法算法中用到的幾個(gè)術(shù)語(yǔ)：1.輸入數(shù)據(jù)流(inputstream)：要被壓縮的字符序列。2.字符(character)：輸入數(shù)據(jù)流中的基本單元。3.編碼位置(codingposition)：輸入數(shù)據(jù)流中當(dāng)前要編碼的字符位置，指前向緩沖存儲(chǔ)器中的開(kāi)始字符。4.前向緩沖存儲(chǔ)器(Lookaheadbuffer)：存放從編碼位置到輸入數(shù)據(jù)流結(jié)束的字符序列的存儲(chǔ)器。5.窗口(window)：指包含W個(gè)字符的窗口，字符是從編碼位置開(kāi)始向后數(shù)也就是最后處理的字符數(shù)。6.指針(pointer)：指向窗口中的匹配串且含長(zhǎng)度的指針。詞典編碼LZ77編碼算法的核心是查找從前向緩沖存儲(chǔ)器開(kāi)始的最長(zhǎng)的匹配串。編碼算法的具體執(zhí)行步驟如下：1.把編碼位置設(shè)置到輸入數(shù)據(jù)流的開(kāi)始位置。2.查找窗口中最長(zhǎng)的匹配串。3.以“(Pointer,Length)Characters”的格式輸出，其中Pointer是指向窗口中匹配串的指針，Length表示匹配字符的長(zhǎng)度，Characters是前向緩沖存儲(chǔ)器中的不匹配的第1個(gè)字符。4.如果前向緩沖存儲(chǔ)器不是空的，則把編碼位置和窗口向前移(Length+1)個(gè)字符，然后返回到步驟2。詞典編碼-LZ77算法詞典編碼-LZSS算法LZ77通過(guò)輸出真實(shí)字符解決了在窗口中出現(xiàn)沒(méi)有匹配串的問(wèn)題，但這個(gè)解決方案包含有冗余信息。冗余信息表現(xiàn)在兩個(gè)方面，一是空指針，二是編碼器可能輸出額外的字符，這種字符是指可能包含在下一個(gè)匹配串中的字符。

LZSS算法以比較有效的方法解決這個(gè)問(wèn)題，它的思想是如果匹配串的長(zhǎng)度比指針本身的長(zhǎng)度長(zhǎng)就輸出指針，否則就輸出真實(shí)字符。詞典編碼-LZSS算法編碼算法的具體執(zhí)行步驟如下：1.把編碼位置置于輸入數(shù)據(jù)流的開(kāi)始位置。2.在前向緩沖存儲(chǔ)器中查找與窗口中最長(zhǎng)的匹配串①Pointer：=匹配串指針。②Length：=匹配串長(zhǎng)度。3.判斷匹配串長(zhǎng)度是否大于等于最小匹配串長(zhǎng)度(LengthMIN_LENGTH)，

如果“是”：輸出指針，然后把編碼位置向前移動(dòng)Length個(gè)字符。如果“否”：輸出前向緩沖存儲(chǔ)器中的第1個(gè)字符，然后把編碼位置向前移動(dòng)一個(gè)字符。4.如果前向緩沖存儲(chǔ)器不是空的，就返回到步驟2。詞典編碼-LZSS算法詞典編碼-LZSS算法在相同的計(jì)算機(jī)環(huán)境下，LZSS算法比LZ77可獲得比較高的壓縮比，而譯碼同樣簡(jiǎn)單。這也就是為什么這種算法成為開(kāi)發(fā)新算法的基礎(chǔ)，許多后來(lái)開(kāi)發(fā)的文檔壓縮程序都使用了LZSS的思想。例如，PKZip,ARJ,LHArc和ZOO等等，其差別僅僅是指針的長(zhǎng)短和窗口的大小等有所不同。LZSS同樣可以和熵編碼聯(lián)合使用，例如ARJ就與霍夫曼編碼聯(lián)用，而PKZip則與Shannon-Fano聯(lián)用，它的后續(xù)版本也采用霍夫曼編碼。第二類(lèi)詞典編碼第二類(lèi)算法的想法是企圖從輸入的數(shù)據(jù)中創(chuàng)建一個(gè)“短語(yǔ)詞典(dictionaryofthephrases)”，這種短語(yǔ)可以是任意字符的組合。編碼數(shù)據(jù)過(guò)程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的“短語(yǔ)”時(shí)，編碼器就輸出這個(gè)詞典中的短語(yǔ)的“索引號(hào)”，而不是短語(yǔ)本身。LZ78算法LZ78的編碼思想是不斷地從字符流中提取新的綴-符串(String)，通俗地理解為新“詞條”，然后用“代號(hào)”也就是碼字(Codeword)表示這個(gè)“詞條”。這樣一來(lái)，對(duì)字符流的編碼就變成了用碼字(Codeword)去替換字符流(Charstream)，生成碼字流(Codestream)，從而達(dá)到壓縮數(shù)據(jù)的目的。LZ78編碼器的輸出是碼字-字符(W,C)對(duì)，每次輸出一對(duì)到碼字流中，與碼字W相對(duì)應(yīng)的綴-符串(String)用字符C進(jìn)行擴(kuò)展生成新的綴-符串(String)，然后添加到詞典中。LZ78算法與LZ77相比，LZ78的最大優(yōu)點(diǎn)是在每個(gè)編碼步驟中減少了綴-符串(String)比較的數(shù)目，而壓縮率與LZ77類(lèi)似。預(yù)測(cè)編碼一般在圖像中局部區(qū)域的象素是高度相關(guān)的，因此可以用先前象素的有關(guān)灰度知識(shí)來(lái)對(duì)當(dāng)前象素的灰度進(jìn)行預(yù)計(jì)，這就是預(yù)測(cè)。預(yù)測(cè)編碼可分為線性預(yù)測(cè)編碼和非線性預(yù)測(cè)編碼。前者常被稱(chēng)為差分脈沖編碼調(diào)制，即DPCM(DifferentialPulseCodeModulation)。DPCM的原理框圖

DPCM編碼示例DPCM系統(tǒng)如圖所示，預(yù)測(cè)器的預(yù)測(cè)值為前一個(gè)樣值(圖中D表示單位延遲)。假設(shè)輸入信號(hào)已經(jīng)量化，差值不再進(jìn)行量化。若DPCM系統(tǒng)的輸入為{0,1,2,1,1,2,3,3,4,4,…},則編碼過(guò)程如下：變換編碼

變換編碼就是將時(shí)域信號(hào)(如圖像光強(qiáng)矩陣)變換到頻域信號(hào)(系數(shù)空間)上進(jìn)行處理的方法。在空間上具有強(qiáng)相關(guān)的信號(hào)，反映在頻域上是某些特定的區(qū)域內(nèi)能量常常被集中在一起，或者是系數(shù)矩陣的分布具有某些規(guī)律。我們可以利用這些規(guī)律在頻域上減少量化比特?cái)?shù)，達(dá)到壓縮的目的。典型的變換編碼和解碼過(guò)程

圖中的變換一般采用正交變換，這是由于正交變換的變換矩陣是可逆的且逆矩陣與轉(zhuǎn)置矩陣相等，這就使解碼運(yùn)算是有解的且運(yùn)算方便，因此運(yùn)算矩陣總是選用正交變換來(lái)做。模型法編碼

模型編碼則是利用計(jì)算機(jī)視覺(jué)和計(jì)算機(jī)圖形學(xué)的知識(shí)對(duì)圖像信號(hào)的分析與合成。模型編碼的關(guān)鍵是對(duì)特定的圖像建立模型，并根據(jù)這個(gè)模型確定圖像中景物的特征參數(shù)，如運(yùn)動(dòng)參數(shù)、形狀參數(shù)等。解碼時(shí)則根據(jù)參數(shù)和已知模型用圖像合成技術(shù)重建圖像。模型編碼引入的誤差主要是人眼視覺(jué)不太敏感的幾何失真，因此重建圖像非常自然和逼真?；旌暇幋a

以?xún)煞N或兩種以上的方法對(duì)圖像進(jìn)行編碼稱(chēng)為混合編碼，本章后面介紹的JPEG和MPEG都屬于混合編碼。常用圖形、圖像文件的格式矢量圖和位映像圖圖像文件的一般結(jié)構(gòu)BMP文件格式GIF文件格式TIF文件格式PNG文件格式

圖像文件的一般結(jié)構(gòu)矢量圖和位映像圖矢量圖是用數(shù)學(xué)方法描述的一系列點(diǎn)、線、弧和其它幾何形狀，因此存放這種圖使用的格式稱(chēng)為矢量圖格式，存儲(chǔ)的數(shù)據(jù)主要是繪制圖形的數(shù)學(xué)描述；

位映像圖(bitmappedgraphics)也稱(chēng)光柵圖(rastergraphics)，這種圖就像電視圖像一樣，由像點(diǎn)組成的，因此存放這種圖使用的格式稱(chēng)為位映像圖格式，經(jīng)常簡(jiǎn)稱(chēng)為位圖格式，存儲(chǔ)的數(shù)據(jù)是描述像素的數(shù)值。

矢量圖矢量圖是用一系列計(jì)算機(jī)指令來(lái)表示一幅圖，如畫(huà)點(diǎn)、畫(huà)線、畫(huà)曲線、畫(huà)圓、畫(huà)矩形等。這種方法實(shí)際上是數(shù)學(xué)方法來(lái)描述一幅圖，然后變成許多的數(shù)學(xué)表達(dá)式，再編程，用計(jì)算機(jī)語(yǔ)言來(lái)表達(dá)。在計(jì)算顯示圖時(shí)，也往往能看到畫(huà)圖的過(guò)程。繪制和顯示這種圖的軟件通常稱(chēng)為繪圖程序(drawprograms)。

位圖位圖法與矢量圖法很不相同。它是把一幅彩色圖分成許多的像素，每個(gè)像素用若干個(gè)二進(jìn)制位來(lái)指定該像素的顏色、亮度和屬性。因此一幅圖由許多描述每個(gè)像素的數(shù)據(jù)組成，這些數(shù)據(jù)通常稱(chēng)為圖像數(shù)據(jù)，而這些數(shù)據(jù)作為一個(gè)文件來(lái)存儲(chǔ)，這種文件又稱(chēng)為圖像文件。如要畫(huà)點(diǎn)位圖，或者編輯點(diǎn)位圖，則用類(lèi)似于繪制矢量圖的軟件工具，這種軟件稱(chēng)為畫(huà)圖程序(paintprograms)。

位圖和矢量圖的區(qū)別

BMP文件格式

圖文件(Bitmap-File，BMP)格式是Windows采用的圖像文件存儲(chǔ)格式，在Windows環(huán)境下運(yùn)行的所有圖像處理軟件都支持這種格式。

BMP圖像文件由以下三部分組成：位圖文件頭(BITMAPHEADER)數(shù)據(jù)結(jié)構(gòu)、位圖信息(BITMAPINFO)數(shù)據(jù)結(jié)構(gòu)和位圖陣列。位圖文件頭

位圖文件頭數(shù)據(jù)結(jié)構(gòu)包含BMP圖像文件的類(lèi)型、顯示內(nèi)容等信息。它的數(shù)據(jù)結(jié)構(gòu)如下：typedefstruct{intbfType;/*always"BM"*/longbfSize；/*filesize*/intbfReserved1；intbfReserved2；longbfOffBits;/*imagedataoffset*/}BITMAPFILEHEADER;典型的BMP圖像文件

在Windows環(huán)境中，它的名字是SEAWATER.BMP。GIF文件格式GIF(GraphicsInterchangeFormat)是CompuServe公司開(kāi)發(fā)的圖像文件存儲(chǔ)格式，稱(chēng)為圖形交換格式。

1987年開(kāi)發(fā)的GIF文件格式版本號(hào)是GIF87a，1989年進(jìn)行了擴(kuò)充，擴(kuò)充后的版本號(hào)定義為GIF89a。

一個(gè)GIF文件由表示圖形/圖像的數(shù)據(jù)塊、數(shù)據(jù)子塊以及顯示圖形/圖像的控制信息塊組成。GIF文件格式采用了LZW(Lempel-ZivWalch)壓縮算法來(lái)存儲(chǔ)圖像數(shù)據(jù)。GIF文件格式可在一個(gè)文件中存放多幅彩色圖形/圖像。

GIF文件的典型結(jié)構(gòu)

TIF文件格式TIF是TIFF(TaggedImageFormatFile)文件的擴(kuò)展名，該格式由美國(guó)AldusDeveloper’sDesk和MicrosoftWindowsMarketingGroup制訂。TIFF支持任意大小的圖像，從單色的二值圖像到24位的真彩色圖像；支持灰度圖像，也支持EGA/VGA上最常見(jiàn)的調(diào)色板式圖像。TIF格式的優(yōu)點(diǎn)主要是適合于廣泛的應(yīng)用程序，它與計(jì)算機(jī)體系結(jié)構(gòu)、操作系統(tǒng)和圖形處理的硬件無(wú)關(guān)。TIFF文件組成文件頭(8字節(jié))參數(shù)指針表參數(shù)數(shù)據(jù)表PNG文件格式

PNG是20世紀(jì)90年代中期開(kāi)始開(kāi)發(fā)的圖像文件存儲(chǔ)格式，其目的是企圖替代GIF和TIFF文件格式，同時(shí)增加一些GIF文件格式所不具備的特性。PNG使用從LZ77派生的無(wú)損數(shù)據(jù)壓縮算法。PNG的優(yōu)點(diǎn)

兼有GIF和JPEG的色彩模式PNG能把圖像文件壓縮到極限以利于網(wǎng)絡(luò)傳輸，但又能保留所有與圖像品質(zhì)有關(guān)的信息的解決方案更優(yōu)化的傳輸顯示透明圖像在制作網(wǎng)頁(yè)圖像的時(shí)候很有用PNG可以讓你在Macintosh上制作的圖像與在Windows上所顯示的圖像完全相同PNG圖像的缺點(diǎn)

PNG不支持動(dòng)畫(huà)的應(yīng)用因?yàn)镻NG采用的是無(wú)損壓縮方式，盡管相同圖像質(zhì)量的PNG圖像文件比JPEG圖像文件小，但是JPEG可以適當(dāng)?shù)貭奚?huà)面品質(zhì)而取得比PNG更小的文件尺寸PNG不支持CMYK的模式靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG

JPEG2000

JPEGJPEG是國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)電話咨詢(xún)委員會(huì)(CCITT)關(guān)于靜止圖像編碼的聯(lián)合專(zhuān)家組(JointPhotographicExpertsGroup)名稱(chēng)的縮寫(xiě)。該標(biāo)準(zhǔn)可用于自然景象或任何連續(xù)色調(diào)圖像的數(shù)字?jǐn)?shù)據(jù)的壓縮編碼和解碼。對(duì)于數(shù)字化精度為每種彩色分量每個(gè)樣點(diǎn)4至16比特的數(shù)字圖像有良好的壓縮效果，但不適用于二值圖像。JPEG標(biāo)準(zhǔn)綜合了多年來(lái)圖像壓縮編碼的研究成果，是一種集大成的算法。該標(biāo)準(zhǔn)規(guī)定了兩種工作方式，即順序方式和漸進(jìn)方式；還規(guī)定了三種級(jí)別的編碼算法，即基本系統(tǒng)(Baselinesystem)、擴(kuò)展系統(tǒng)(Extendedsystem)和無(wú)失真系統(tǒng)(Losslesscoding)。JPEG能達(dá)到的壓縮效果

采用JPEG算法所能達(dá)到的壓縮效果，與被壓縮圖像的特性有關(guān)。對(duì)于在開(kāi)發(fā)和測(cè)試本算法標(biāo)準(zhǔn)時(shí)所用的那些內(nèi)容是彩色自然景物和人像的測(cè)試圖片，壓縮到0.15比特/像素時(shí)，圖像可識(shí)別；0.25比特/像素時(shí)，解碼后的圖像可評(píng)價(jià)為“有用(usefulimage)”；約0.75比特/像素時(shí)，被認(rèn)為是“極佳(verygood)”；大約1.5比特/像素時(shí)基本上與原圖像無(wú)法區(qū)別。用無(wú)失真算法對(duì)這些測(cè)試圖片進(jìn)行壓縮編碼，大致可以得到2:1的壓縮比。JPEG算法的不同壓縮比及其壓縮效果實(shí)例順序方式圖像被分割為成行成列的四方小塊，編碼時(shí)由左而右，由上而下地逐行逐列對(duì)每個(gè)小塊進(jìn)行運(yùn)算，直到所有小塊都被編碼為止。每個(gè)小塊的編碼都是一次完成。解碼時(shí)按編碼順序逐塊解碼，也是一次完成。漸進(jìn)方式整個(gè)圖像首先以一種低于最終質(zhì)量要求的質(zhì)量標(biāo)準(zhǔn)(如分辨率或數(shù)據(jù)精度)進(jìn)行編碼，完成后再以較上次高一級(jí)的質(zhì)量要求再進(jìn)行一次編碼，但僅傳送為改善質(zhì)量所需增加的那部分信息。這種過(guò)程可以重復(fù)若干次直至達(dá)到所需的最終質(zhì)量要求。每個(gè)子過(guò)程中的編碼則還是順序方式的。實(shí)現(xiàn)方式

譜選擇法逐次逼近階梯方式基本系統(tǒng)以離散余弦變換為核心，采用順序工作方式，適用于一般精度(每種分量每個(gè)樣點(diǎn)8比特)的圖像，有良好的壓縮效果，壓縮比可調(diào)。標(biāo)準(zhǔn)規(guī)定，每個(gè)JPEG靜止圖像壓縮編解碼器都必須具有實(shí)現(xiàn)基本系統(tǒng)的功能?；鞠到y(tǒng)算法

通過(guò)離散余弦變換減少圖像數(shù)據(jù)的相關(guān)性；利用人眼視覺(jué)特性對(duì)系數(shù)進(jìn)行自適應(yīng)量化；對(duì)每個(gè)子塊量化后的系數(shù)矩陣進(jìn)行Z形掃描，將系數(shù)矩陣變換成符號(hào)序列；用哈夫曼變長(zhǎng)碼對(duì)符號(hào)進(jìn)行熵編碼。基本系統(tǒng)流程

Z形掃描擴(kuò)展系統(tǒng)將基本系統(tǒng)在若干方面增強(qiáng)并減少一些限制條件后就稱(chēng)為擴(kuò)展系統(tǒng)。擴(kuò)展系統(tǒng)可對(duì)精度范圍4～12bit的圖像進(jìn)行處理，可采用漸進(jìn)方式，可選用哈夫曼碼或算術(shù)碼對(duì)離散余弦變換產(chǎn)生的統(tǒng)計(jì)事件進(jìn)行壓縮編碼。無(wú)失真系統(tǒng)無(wú)失真系統(tǒng)采用二維DPCM技術(shù)，實(shí)現(xiàn)無(wú)失真壓縮，當(dāng)然壓縮比不可能很高。無(wú)失真編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)預(yù)測(cè)器熵編碼器表說(shuō)明DPCM預(yù)測(cè)編碼框圖JPEG2000JPEG2000的核心JPEG2000的優(yōu)勢(shì)JPEG2000的應(yīng)用

JPEG2000的核心放棄了JPEG所采用的以離散余弦變換算法(DCT)為主的區(qū)塊編碼方式，而改用以離散小波變換算法(DWT)為主的多解析編碼方式。JPEG2000還將彩色靜態(tài)畫(huà)面采用的JPEG編碼方式、2值圖像采用的JBIG(JointBinaryImageGroup)編碼方式及低壓縮率采用JPEGLS統(tǒng)一起來(lái)，成為對(duì)應(yīng)各種圖像的通用編碼方式。DCT和DWT變換圖(a)采用DCT變換得到的圖像圖(b)采用DWT變換得到的圖像JPEG2000的優(yōu)勢(shì)高壓縮率無(wú)損壓縮漸進(jìn)傳輸感興趣區(qū)域壓縮JPEG2000的應(yīng)用目前，支持JPEG2000的軟件已經(jīng)出現(xiàn)，如LuraWaveSmartCompressFreewareforWindows為ACDSee3.0提供JPEG2000LWF格式的外掛插件，這樣只要安置了這個(gè)插件就可以觀看和制作采用JPEG2000編碼的LWF格式文件。在不久的將來(lái)，JPEG2000無(wú)論是在傳統(tǒng)的JPEG市場(chǎng)（如數(shù)碼相機(jī)、掃描儀等）還是在新興應(yīng)用領(lǐng)域（如網(wǎng)路傳輸、無(wú)線通訊、醫(yī)療影像等）都將大有用武之地。動(dòng)態(tài)圖像壓縮標(biāo)準(zhǔn)動(dòng)態(tài)圖像的分類(lèi)動(dòng)態(tài)圖像的特點(diǎn)運(yùn)動(dòng)圖象壓縮技術(shù)的發(fā)展MPEG標(biāo)準(zhǔn)概述MPEG-1標(biāo)準(zhǔn)MPEG-2標(biāo)準(zhǔn)動(dòng)態(tài)圖像的分類(lèi)動(dòng)態(tài)圖像一般可分為：視頻和動(dòng)畫(huà)。視頻：每一幀圖像是實(shí)時(shí)獲取的自然景物的真實(shí)圖像。和音頻一樣，在多媒體計(jì)算機(jī)中使用的是數(shù)字視頻。數(shù)字視頻的應(yīng)用于VCD/DVD、數(shù)字電視、遠(yuǎn)程教學(xué)及視頻會(huì)議等。動(dòng)畫(huà)：每一幀圖像是由計(jì)算機(jī)或人工制作的具有真實(shí)感的圖像。若畫(huà)面僅為二維透視效果時(shí)，則為二維動(dòng)畫(huà)；若畫(huà)面具有空間效果時(shí)，則為三維動(dòng)畫(huà)；若加上真實(shí)的光照效果和質(zhì)感，則為三維真實(shí)感動(dòng)畫(huà)。動(dòng)態(tài)圖像的特點(diǎn)連續(xù)性在時(shí)間軸上以幀為運(yùn)動(dòng)單位，屬于離散型媒體類(lèi)。動(dòng)態(tài)圖像比靜態(tài)圖像表示的范圍廣、表現(xiàn)力強(qiáng)。時(shí)延性動(dòng)態(tài)圖像數(shù)據(jù)量大，必須被壓縮后才能在計(jì)算機(jī)中應(yīng)用。計(jì)算機(jī)的容量和速度直接影響圖像質(zhì)量。相關(guān)性幀之間的關(guān)聯(lián)是動(dòng)態(tài)圖像連續(xù)動(dòng)作形成的基礎(chǔ)，也是進(jìn)行壓縮和其他處理的條件。但對(duì)錯(cuò)誤的敏感性較低。

運(yùn)動(dòng)圖象壓縮技術(shù)的發(fā)展第一代：被稱(chēng)為“運(yùn)動(dòng)JPEG技術(shù)”。它是利用連續(xù)保存獨(dú)立的JPEG圖象來(lái)實(shí)現(xiàn)的運(yùn)動(dòng)圖象技術(shù)，JPEG的壓縮率為2.5位/像素到0.6位/像素之間。目前大量應(yīng)用于廣播級(jí)的攝像機(jī)中。第二代：MPEG技術(shù)。有MPEG-1、MPEG-2和新的MPEG-4及MPEG-7等。壓縮率為0.8位/像素到0.4位/像素之間,典型的VCD應(yīng)用是0.6位/像素,所以其位率為:0.6位/像素*(352*240像素)*30幀/s=1520640位/s=1.5Mb/s。第三代：目前國(guó)內(nèi)有人開(kāi)發(fā)出了新的圖像壓縮技術(shù)，其壓縮率為0.15位/像素到0.01位/像素之間，已經(jīng)突破MPEG的極限。MPEG標(biāo)準(zhǔn)概述MPEG是運(yùn)動(dòng)圖像專(zhuān)家組(MotionPictureExpertsGroup)的縮寫(xiě)，是國(guó)際標(biāo)準(zhǔn)化組織中IEC/JTC1/SC2/WG11的一個(gè)小組。MPEG下分三個(gè)小組：視頻組(MPEG-Video)的任務(wù)是研究壓縮傳輸速度上限為1.5Mbps的視頻信號(hào)；音頻組(MPEG-Audio)的任務(wù)是研究壓縮每信道64、128和192Kbps的數(shù)字音頻信號(hào)；系統(tǒng)組(MPEG-System)則解決多道壓縮視頻、音頻位流的同步及合成問(wèn)題。

MPEG委員會(huì)的工作始于1988年，1990年制訂出標(biāo)準(zhǔn)草案。兩年中MPEG工作參加單位由15家發(fā)展到150家。MPEG工作一開(kāi)始就兼顧JPEG標(biāo)準(zhǔn)，CCITT的H.261標(biāo)準(zhǔn)，支持這兩個(gè)標(biāo)準(zhǔn)的優(yōu)秀成果。

MPEG-1標(biāo)準(zhǔn)

MPEG-1標(biāo)準(zhǔn)叫作“運(yùn)動(dòng)圖像和伴隨聲音的編碼—用于速率約在1.5Mb/s以下的數(shù)字存儲(chǔ)媒體”，主要用于多媒體存儲(chǔ)與再現(xiàn)，如VCD等。

MPEG-1采用CIF視頻格式(分辨率為352×288)，幀速率為25幀/秒或30幀/秒，碼率為1.5Mb/s(其中視頻約1.2Mb/s，音頻約0.3Mb/s)。

MPEG-1將視頻圖像序列劃分為I幀、P幀和B幀

標(biāo)準(zhǔn)草案于1991年11月完成，1992年11月正式通過(guò)。

MPEG-1由五個(gè)部分組成：MPEG-1Systems，規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其它相關(guān)數(shù)據(jù)的同步

MPEG-1Video,規(guī)定視頻數(shù)據(jù)的編碼和解碼，

MPEG-1Audio,規(guī)定音頻數(shù)據(jù)的編碼和解碼

MPEG-1Conformancetesting，詳細(xì)說(shuō)明如何測(cè)試比特?cái)?shù)據(jù)流(bitstreams)和解碼器是否滿(mǎn)足MPEG-1前3個(gè)部分(Part1，2和3)中所規(guī)定的要求

MPEG-1Softwaresimulation

MPEG視頻壓縮算法

MPEG數(shù)據(jù)流采用分層結(jié)構(gòu)(如下圖所示)

圖MPEG數(shù)據(jù)流的分層結(jié)構(gòu)為滿(mǎn)足高壓縮比和隨機(jī)訪問(wèn)兩方面要求，MPEG采取了預(yù)測(cè)和插值兩種幀間編碼技術(shù)。

MPEG視頻壓縮算法的兩個(gè)基礎(chǔ)是：

基于16×16塊的運(yùn)動(dòng)補(bǔ)償?shù)目s減時(shí)間冗余

基于變換域(DCT)的縮減空間冗余技術(shù)

縮減時(shí)間冗余度

MPEG考慮了三種畫(huà)面：內(nèi)幀(I)、預(yù)測(cè)幀(P)和內(nèi)插幀(B)。這樣做的原因一是考慮隨機(jī)訪問(wèn)視頻存儲(chǔ)的重要性，二是運(yùn)動(dòng)補(bǔ)償插值可顯著降低位速率。MPEG視頻幀編碼及關(guān)系運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)是應(yīng)用最廣泛的降低時(shí)間冗余度的方

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

多媒體技術(shù)-視頻壓縮

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

多媒體技術(shù)-視頻壓縮

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔