數(shù)據(jù)預(yù)測(cè)編碼3

上傳人：所*** IP屬地：浙江上傳時(shí)間：2024-10-19 格式：PPT 頁(yè)數(shù)：42 大?。?25KB 積分：6 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩37頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章預(yù)測(cè)編碼5.4

靜止圖像的預(yù)測(cè)編碼經(jīng)過(guò)統(tǒng)計(jì)，認(rèn)為人們獲取的信息的70％來(lái)自視覺(jué)系統(tǒng)。分類(lèi)從表面形態(tài)上看：靜止圖像活動(dòng)圖像(運(yùn)動(dòng)圖像,序列圖像)按描述方法的不同：矢量圖像(圖形,graphics)點(diǎn)陣圖像(位圖圖像,圖像,image)圖像數(shù)字化之后的數(shù)據(jù)量非常大，傳輸時(shí)很費(fèi)時(shí)間，存儲(chǔ)時(shí)很占空間，故必須對(duì)圖像數(shù)據(jù)進(jìn)行壓縮。幀內(nèi)預(yù)測(cè)器的設(shè)計(jì)預(yù)測(cè)編碼時(shí):利用多個(gè)像素進(jìn)行預(yù)測(cè)①一維預(yù)測(cè):利用處于同一行的因果樣值來(lái)預(yù)測(cè);②二維預(yù)測(cè):不但利用同一掃描行的幾個(gè)因果樣值,

還利用以前幾行的取樣值;③三維預(yù)測(cè):不但利用本行的因果樣值前幾行的相

鄰取樣值，還要利用相鄰幾幀(或不

同波段)上的取樣值。圖像信號(hào):垂直方向相關(guān)水平方向相關(guān)實(shí)用中：預(yù)測(cè)器階數(shù)不宜過(guò)高及盡量減少乘法運(yùn)

算，可采用4個(gè)最鄰近像素進(jìn)行預(yù)測(cè)：圖像中當(dāng)前像素S0和鄰近像素S1,

S2,…,的關(guān)系:S6S0S1S5S3S2S4S7前一行當(dāng)前行圖5.7像素S0的鄰近像素(5.4-1)幀內(nèi)預(yù)測(cè)器的設(shè)計(jì)1個(gè)取樣的延遲S11行的延遲S21行加1個(gè)的延遲S31行減1個(gè)的延遲S4

加法器

圖5.8

4階幀內(nèi)預(yù)測(cè)器的實(shí)現(xiàn)結(jié)構(gòu)因此，此4像素(4階)預(yù)測(cè)器結(jié)構(gòu)如圖5.8所示:幀內(nèi)預(yù)測(cè)器的設(shè)計(jì)理論上,不同的圖像其特點(diǎn)和相關(guān)系數(shù)不同,從而對(duì)應(yīng)于不同的最佳預(yù)測(cè)系數(shù)。實(shí)用中,不便對(duì)不同圖像逐一計(jì)算最佳系數(shù)，而是取它們的某種均值，并將恢復(fù)圖像的實(shí)際效果(有損壓縮)或誤差信號(hào)的熵值(無(wú)損壓縮熵)作為重要依據(jù)。幀內(nèi)預(yù)測(cè)器的設(shè)計(jì)誤差熵最小意義下的預(yù)測(cè)器最佳設(shè)計(jì)預(yù)測(cè)誤差信號(hào)e的概率分布曲線可用拉普拉斯(Laplace)分布來(lái)近似,即式中σe為差值信號(hào)的e的均方根值，而預(yù)測(cè)越準(zhǔn)，σe也越低,σe越小曲線越尖銳，表明e的分布在零附近，所需編碼長(zhǎng)度也越短，編碼率也可以越低。幀內(nèi)預(yù)測(cè)器的設(shè)計(jì)(5.4-2)

JPEG的無(wú)損壓縮模式發(fā)展:1986年底,ISO和前CCITT成立“聯(lián)合圖片專(zhuān)家組”(JPEG:JointPhotographicExpertGroup),研究靜止圖像壓縮算法的標(biāo)準(zhǔn)化;1992年,正式完成了用于各種分辨率和格式的連續(xù)色調(diào)圖像的ISO/IEC10918標(biāo)準(zhǔn)(ITU-TT.81建議),簡(jiǎn)稱JPEG標(biāo)準(zhǔn)。JPEG標(biāo)準(zhǔn)有損壓縮系統(tǒng)(采用變換編碼)；無(wú)損壓縮系統(tǒng)(采用空間域的無(wú)量化DPCM、對(duì)預(yù)測(cè)誤差進(jìn)行Huffman編碼或算術(shù)編碼)。JPEG是一個(gè)適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)，既可用于灰度圖像又可用于彩色圖像。

JPEG的無(wú)損壓縮模式JPEG有損壓縮系統(tǒng)：在壓縮比為25:1的情況下，壓縮后還原得到的圖像與原始圖像相比較，非圖像專(zhuān)家難于找出它們之間的區(qū)別，因此得到了廣泛的應(yīng)用。為了在保證圖像質(zhì)量的前提下進(jìn)一步提高壓縮比，2000年JPEG專(zhuān)家組制定了JPEG2000(簡(jiǎn)稱JP2000)標(biāo)準(zhǔn)，以作為JPGE的后繼者。

JPEG的無(wú)損壓縮模式選擇值a1

a2a3a4預(yù)測(cè)值說(shuō)明0非預(yù)測(cè)僅用于分層模型的差分編碼11000S1前值預(yù)測(cè)，用于第1行20100S2前行預(yù)測(cè),用于第1列(除了第1行)30010S3一維預(yù)測(cè)411-10S1+S2-S3二維預(yù)測(cè)511/2-1/20S1+((S2-S3)/2)二維預(yù)測(cè)61/21-1/20S2+((S1-S3)/2)二維預(yù)測(cè)71/21/200(S1+S2)/2二維預(yù)測(cè)表5.2JPEG無(wú)失真編碼所用的預(yù)測(cè)器JPEG無(wú)損壓縮系統(tǒng)：預(yù)測(cè)器只考慮圖5.7中S1、S2、

S3三個(gè)鄰域像素，預(yù)測(cè)方程如式(5.4-1),預(yù)測(cè)系數(shù)則可從表5.2中的8種簡(jiǎn)單線性組合方案中選擇。

JPEG的無(wú)損壓縮模式JPEG-LS壓縮標(biāo)準(zhǔn)JPEG無(wú)損壓縮模式：簡(jiǎn)單快速，但壓縮比難以滿足使用要求；只有所有都嘗試一遍，才能從8種壓縮模式中選出

合適的模式，對(duì)大尺寸的圖像難以實(shí)時(shí)壓縮；無(wú)失真的要求使得可供選擇的壓縮方法和技術(shù)受

到極大的限制。JPEG組織從1994年開(kāi)始征集新的無(wú)損/近無(wú)損壓縮(簡(jiǎn)稱JPEG-LS標(biāo)準(zhǔn))算法提案,并于1998年2月作為ITU-T建議T.87(草案)|國(guó)際標(biāo)準(zhǔn)ISO/IEC14495-1正式公布與JPEG無(wú)損壓縮的不同:JPEG-LS編碼系統(tǒng)如圖5.9所示:圖5.9JPEG-LS編碼器簡(jiǎn)化框圖基于上下文的建模；游程編碼；誤差可以控制的近似無(wú)損壓縮。JPEG-LS壓縮標(biāo)準(zhǔn)實(shí)現(xiàn)步驟：①基于上下文的建模②預(yù)測(cè)③常規(guī)模式的誤差編碼④游程編碼模式JPEG-LS壓縮標(biāo)準(zhǔn)5.5活動(dòng)圖像的預(yù)測(cè)編碼電視畫(huà)面(包括廣播電視、會(huì)議電視、可視電話、

電視監(jiān)控)和各種動(dòng)態(tài)醫(yī)學(xué)影像等。視頻編碼：對(duì)活動(dòng)圖像的數(shù)據(jù)壓縮。常見(jiàn)的活動(dòng)圖像(序列圖像):我國(guó)的彩色電視制式采用PAL-D(PhaseAlternationLine,逐行倒相),為了能與黑白電視兼容,把R、G、B信號(hào)變成Y(亮度)、U、V信號(hào)(U、V為色差信號(hào),即指基色信號(hào)中的R、G、B與亮度信號(hào)之差)；1982年2月，CCIR(InternationalRadioConsultativeCommittee,現(xiàn)為ITU-R)的601建議(“演播室數(shù)字電視的編碼參數(shù)”),將R、G、B信號(hào)變成Y(亮度)、CB、CR信號(hào)(CB、CR為色差信號(hào))。

電視圖像的數(shù)字化格式(5.5-1b)(5.5-1a)R、G、B信號(hào)變成Y、CB、CR信號(hào)的變換規(guī)則:Y、CB、CR

信號(hào)變成R、G、B信號(hào)的變換規(guī)則:

電視圖像的數(shù)字化格式彩色電視信號(hào)的數(shù)字化格式CCIR601規(guī)定對(duì)彩色電視信號(hào)的亮度和色差分別進(jìn)行編碼,稱為分量編碼或分離編碼(圖5.10)。圖5.10分量編碼原理框圖

電視圖像的數(shù)字化格式

電視圖像信號(hào)的冗余度空間相關(guān)性(幀內(nèi)相關(guān)性):

幀內(nèi)編碼—利用圖像幀內(nèi)相關(guān)性進(jìn)行壓縮編碼;時(shí)間相關(guān)性(幀間相關(guān)性):

幀間編碼—利用序列圖像在時(shí)間方向的相關(guān)性

而進(jìn)行的壓縮編碼；色度空間表示上的相關(guān)性電視信號(hào)的冗余度：幀間編碼的基本依據(jù)：著重利用的是電視圖像信號(hào)中典型景物(Scene)的時(shí)間冗余度，最特殊的例子是電視中演講人片段的幀間差值(FD:Framedifference)統(tǒng)計(jì)特性,根據(jù)統(tǒng)計(jì),幀間差值一般不大:對(duì)于變化緩慢的圖像序列（256級(jí)灰度圖像序列）: 幀間差值超過(guò)3的像素?cái)?shù)不超過(guò)4%;對(duì)于變化較為劇烈的圖像序列（彩色電視圖像序列）: 對(duì)于亮度信號(hào),幀間差值超過(guò)6的像素?cái)?shù)平均

只有7.5%;而對(duì)于色度信號(hào)平均只有7.5‰。

電視圖像信號(hào)的冗余度

人的視覺(jué)感知特性彩色電視信號(hào)數(shù)碼率寫(xiě)為電視幀頻fZ與每幀的總像素?cái)?shù)P的乘積)：r=Ｐ(Y)

R+Ｐ(Cr)

R+Ｐ(Cb)

R=[Ｐ(Y)+Ｐ(Cr)+Ｐ(Cb)]

R(5.5-4)

):可理解為圖像的細(xì)節(jié)或空間(Spatial)分辨率;

R:可以理解為圖像的灰度(Gray-level)或色彩層次分辨率;

fZ:可理解為圖像的運(yùn)動(dòng)或時(shí)間(Temporal)分辨率。研究表明:細(xì)節(jié)、運(yùn)動(dòng)及灰度等三個(gè)分辨參數(shù)實(shí)質(zhì)上是互相依賴的。亮度掩蔽特性

在背景較亮或較暗時(shí),人眼對(duì)亮度不敏感的特性;空間掩蔽特性

指隨著空間變化頻率的提高,人眼對(duì)細(xì)節(jié)分辨能力下降的特性;時(shí)間掩蔽特性

指隨著時(shí)間變化頻率的提高,人眼對(duì)細(xì)節(jié)分辨能力

的下降的特性。人的視覺(jué)系統(tǒng)(HVS:HumanVisualSystem)特性:

人的視覺(jué)感知特性利用HVS的生理特性，適當(dāng)降低對(duì)某些參數(shù)的分辨要求，可望進(jìn)一步降低數(shù)碼率。利用HVS特性進(jìn)行數(shù)據(jù)壓縮，并未涉及到信號(hào)內(nèi)在的相關(guān)性，稱為非相關(guān)壓縮或視覺(jué)生理-心理壓縮。

人的視覺(jué)感知特性非相關(guān)壓縮的幾個(gè)措施：①P~R轉(zhuǎn)換(空間-灰度分辨率轉(zhuǎn)換):②P~fZ

轉(zhuǎn)換(空間-時(shí)間分辨率轉(zhuǎn)換):③R~fZ

轉(zhuǎn)換(灰度-時(shí)間分辨率轉(zhuǎn)換):④利用視覺(jué)特性降低對(duì)色信號(hào)的帶寬及取樣率:一個(gè)優(yōu)秀的電視圖像編碼器,應(yīng)能夠充分利用上述主觀視覺(jué)約束,自適應(yīng)地按圖像的局部特性最佳地調(diào)整這3個(gè)分辨參數(shù)到“夠用，但不浪費(fèi)”的程度。

人的視覺(jué)感知特性實(shí)現(xiàn)過(guò)程舉例：運(yùn)動(dòng)檢測(cè)運(yùn)動(dòng)時(shí)幀頻增加靜止時(shí)重發(fā)前一幀邊緣檢測(cè)輪廓部分增加采樣率，降低量化位數(shù)平坦部分降低采樣率，增加量化位數(shù)

人的視覺(jué)感知特性幀間預(yù)測(cè)編碼幀間預(yù)測(cè)編碼技術(shù)的發(fā)展過(guò)程DPCM算法簡(jiǎn)單，易于硬件實(shí)現(xiàn)，因而在圖像特別是電視信號(hào)的壓縮編碼過(guò)程中得到較多的應(yīng)用。1958年,Graham用計(jì)算機(jī)模擬了圖像的DPCM編碼方法；1966年,J.B.O’Neal對(duì)電視圖像的預(yù)測(cè)編碼進(jìn)行了分析和模擬;1969年,Mounts等人首先提出在電視圖像編碼中采用幀間預(yù)測(cè)的條件幀修補(bǔ)法(CFR);1970年代初,Haskell重點(diǎn)考慮了采用CFR法的幀內(nèi)/幀間復(fù)合預(yù)測(cè)模式;1980年代初,開(kāi)始對(duì)運(yùn)動(dòng)補(bǔ)償(MC)預(yù)測(cè)所用的運(yùn)動(dòng)估值技術(shù)進(jìn)行研究;1988年形成草案,1990年通過(guò)的ITU-TH.261建議,標(biāo)志著“簡(jiǎn)單幀間預(yù)測(cè)+MC(或有條件地切換為幀內(nèi)編碼)+DCT”的幀間編碼主體技術(shù)框架迅速走向?qū)嵱?1990年代初相繼提出的MPEG-1、MPEG-2和H.263等視頻標(biāo)準(zhǔn),都是在H.261的幀間編碼主體技術(shù)框架的基礎(chǔ)上發(fā)展和改進(jìn)的。幀間預(yù)測(cè)編碼電視圖像的典型景物特點(diǎn)運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)建立在對(duì)電視圖像運(yùn)動(dòng)景物分析的基礎(chǔ)上。可視電話圖像序列：①背景區(qū)②運(yùn)動(dòng)物體區(qū)③暴露區(qū)第τ

幀第τ-1幀背景區(qū)暴露區(qū)運(yùn)動(dòng)物體位移

dx圖5.12可視電話的典型景物示意這3類(lèi)區(qū)域都存在幀間相關(guān)性，都可以作為壓縮編碼的依據(jù)。幀間預(yù)測(cè)編碼會(huì)議電視圖像序列可類(lèi)比可視電話的3類(lèi)區(qū)域劃分；廣播電視圖像則靈活多變，可以看成上述幾類(lèi)各有特點(diǎn)的序列圖像的復(fù)雜組合，總有一定程度的幀間相關(guān)性可利用。幀間預(yù)測(cè)編碼運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼是目前廣為應(yīng)用的H.261、H.263和MPEG-1、MPEG-2等視頻壓縮國(guó)際標(biāo)準(zhǔn)的主體框架，是當(dāng)前最實(shí)用的高效混合編碼方法，編碼器框圖如圖5.13所是示。幀間預(yù)測(cè)編碼圖5.13運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼器框圖幀間預(yù)測(cè)編碼運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)的技術(shù)組成主要有:①圖像分割:

把圖像劃分為靜止和運(yùn)動(dòng)的兩個(gè)部分;②運(yùn)動(dòng)估值:

估計(jì)物體的位移值,得到運(yùn)動(dòng)矢量;運(yùn)動(dòng)補(bǔ)償:

用運(yùn)動(dòng)矢量補(bǔ)償(或抵消)物體的運(yùn)動(dòng)效果,

再進(jìn)行預(yù)測(cè);④預(yù)測(cè)信息編碼:

包括幀間預(yù)測(cè)誤差和運(yùn)動(dòng)矢量。幀間預(yù)測(cè)編碼把圖像分為矩形子圖像或子塊,適當(dāng)選擇塊的

大小,把子塊分為動(dòng)和不動(dòng)兩種,估計(jì)出運(yùn)動(dòng)子

塊的位移,進(jìn)行預(yù)測(cè)傳輸;對(duì)每個(gè)像素的位移都進(jìn)行遞歸估計(jì)。圖像分割是運(yùn)動(dòng)補(bǔ)償?shù)幕A(chǔ),通常采用兩種較簡(jiǎn)單的方法:對(duì)運(yùn)動(dòng)子塊的估計(jì)或者說(shuō)運(yùn)動(dòng)估值的問(wèn)題，成為必須解決的關(guān)鍵技術(shù)。當(dāng)對(duì)圖像的分割作了必要的簡(jiǎn)化后幀間預(yù)測(cè)編碼活動(dòng)圖像的運(yùn)動(dòng)估值活動(dòng)圖像編碼所關(guān)心的：被攝物體與攝象機(jī)之間相對(duì)運(yùn)動(dòng)所造成的物體的像的二維運(yùn)動(dòng)，和估計(jì)該二維運(yùn)動(dòng)的有效方法。本書(shū)只介紹空間域進(jìn)行的運(yùn)動(dòng)估值。兩種常用方法：像素遞歸法塊匹配法像素遞歸法PRA(PixelRecursiveAlgorithm)基本思想:對(duì)當(dāng)前幀運(yùn)動(dòng)區(qū)域中某一像素Sτ(x,y),在前一幀某一位移處找到一個(gè)同灰度值的像素Sτ-1(x-dx,y-dy),位移d=(dx,dy)T代表Sτ(x,y)真實(shí)的運(yùn)動(dòng)矢量。傳輸時(shí)，讓接收端在與發(fā)送端同樣的條件下，用與發(fā)送端相同的方法進(jìn)行運(yùn)動(dòng)估值。代價(jià)是接收端較復(fù)雜，不利于一發(fā)多收(SDTV/HDTV、VCD/DVD等)的應(yīng)用，但這種方法估計(jì)精度高，能滿足運(yùn)動(dòng)補(bǔ)償幀內(nèi)插的要求?；顒?dòng)圖像的運(yùn)動(dòng)估值改進(jìn)方法:1979年，Netravali和Robbins提出的遞歸估計(jì)方法以改進(jìn)d的估計(jì)值d的估計(jì)精度和擴(kuò)大搜索范圍，像素遞歸法：只是孤立地考察單個(gè)像素，故抗干擾能力差，為從根本上提高估值精度和可靠性，在估計(jì)某像素的運(yùn)動(dòng)矢量時(shí)可考慮其鄰域點(diǎn)，則性能可得到顯著改善?；顒?dòng)圖像的運(yùn)動(dòng)估值塊匹配法BMA(BlockMatchingAlgorithm)目前最常用的一類(lèi)運(yùn)動(dòng)估值方法，有關(guān)活動(dòng)圖像的國(guó)際標(biāo)準(zhǔn)H.261/H.263和MPEG-1/2等都采用了該方法。τ幀N

M像素塊NMdxmaxdymax

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

數(shù)據(jù)預(yù)測(cè)編碼3

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

數(shù)據(jù)預(yù)測(cè)編碼3

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔