運(yùn)動圖像的編碼一

上傳人：姚*** IP屬地：廣東上傳時(shí)間：2023-06-14 格式：PPT 頁數(shù)：32 大?。?.67MB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩27頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

運(yùn)動圖像的編碼一第一頁，共三十二頁，編輯于2023年，星期三運(yùn)動圖像的特點(diǎn)運(yùn)動圖像本質(zhì)上是連續(xù)的時(shí)間內(nèi)連續(xù)的場景變化，我們眼睛看到的實(shí)際事物就滿足這個(gè)要求。由于人眼的視覺特點(diǎn)，我們可以利用離散的時(shí)間點(diǎn)上一幅幅圖像來表示，而讓人產(chǎn)生同樣的視覺效果。這一幅幅圖像就是幀，就是時(shí)間離散化的結(jié)果。在一幀圖像中，我們可以從空間上分割為一個(gè)個(gè)像素，用單個(gè)像素來替代原來的若干模擬點(diǎn)，這就是空間離散化的結(jié)果。我們對于運(yùn)動圖像，就利用時(shí)間離散化和空間離散化產(chǎn)生的相關(guān)性，來進(jìn)行壓縮編碼第二頁，共三十二頁，編輯于2023年，星期三運(yùn)動圖像的冗余空間冗余：和靜止圖像的冗余情況一致時(shí)間冗余：人眼的視覺特點(diǎn)，25fps就可以認(rèn)為連續(xù)。幀間預(yù)測：利用相鄰幀的時(shí)間相關(guān)性運(yùn)動估值：對運(yùn)動的物體，幀間的相關(guān)性降低，利用運(yùn)動估值，可以減小預(yù)測的殘差。第三頁，共三十二頁，編輯于2023年，星期三運(yùn)動圖像編碼技術(shù)我們已經(jīng)講過了靜止圖像編碼，運(yùn)動圖像既然是一幅幅靜止圖像在時(shí)間上的先后排列，因此可以簡單的將每一幅靜止圖像編碼組合起來，就形成了一個(gè)運(yùn)動圖像的編碼。這樣的碼流還是很大，舉例來說，一幅300*200的圖像，用JPEG壓縮后要20KBytes。如果是30幀/秒的視頻，則會產(chǎn)生600KB/s=4.8Mb/s的碼流。這在網(wǎng)絡(luò)傳輸中還是無法接收的帶寬要求。為此，我們必須利用運(yùn)動圖像在時(shí)間軸上的相關(guān)性，利用預(yù)測編碼的方法，而只傳輸余量信號，就可以減小信號的動態(tài)范圍，降低碼率。進(jìn)行準(zhǔn)確預(yù)測的基礎(chǔ)就是運(yùn)動矢量估計(jì)，具體的編碼方法就是幀間預(yù)測編碼第四頁，共三十二頁，編輯于2023年，星期三運(yùn)動矢量估計(jì)第五頁，共三十二頁，編輯于2023年，星期三塊匹配方法(1)按一般想法，應(yīng)將運(yùn)動物體和靜止背景分離，然后再對運(yùn)動物理進(jìn)行運(yùn)動估計(jì)。如何分離？實(shí)際上，將圖像分塊，并認(rèn)為每塊內(nèi)像素具有同樣的運(yùn)動矢量。在k幀中的一個(gè)塊，在k-1幀中尋找最相似的子塊，稱為匹配塊，進(jìn)而得到運(yùn)動矢量D當(dāng)前幀中的子塊前一幀中的最佳匹配子塊前一幀中的搜索區(qū)域位移矢量第六頁，共三十二頁，編輯于2023年，星期三塊匹配方法(2)搜索范圍是有限的，設(shè)兩幀間隔時(shí)間內(nèi)，最大的水平和垂直位移是，則搜索范圍SR為如何判斷兩個(gè)子塊是否匹配？如何搜索計(jì)算量最小？子塊相似程度—?dú)w一化的二維互相關(guān)函數(shù)，越大越相似。第七頁，共三十二頁，編輯于2023年，星期三塊匹配方法(3)NCCF計(jì)算復(fù)雜，常用下面兩個(gè)計(jì)算簡單的值。幀間子塊亮度的均方差值MSE幀間子塊亮度的絕對值的均值MAD匹配準(zhǔn)則的不同，對匹配精度影響不大，故常用沒有乘除法的MAD作為實(shí)用的匹配準(zhǔn)則。第八頁，共三十二頁，編輯于2023年，星期三匹配塊的搜索全搜索：在整個(gè)搜索區(qū)域逐個(gè)像素移動，每次都要計(jì)算MAD?？偟囊苿哟螖?shù)：快速搜索算法二維對數(shù)法三步法共軛方向法正交搜索法基于同一假設(shè)：當(dāng)偏離最小誤差方向時(shí)，判決函數(shù)單調(diào)上升。即不存在局部最小值。第九頁，共三十二頁，編輯于2023年，星期三三步法每步對中心和8個(gè)臨域點(diǎn)計(jì)算，而且臨域點(diǎn)和中心點(diǎn)的距離，隨著搜索步驟的增加而減小。右圖搜索3步，最終的匹配點(diǎn)是(i+2,j+6)2221121222211111133333333第十頁，共三十二頁，編輯于2023年，星期三共軛方向法首先延水平方向搜索，計(jì)算中心點(diǎn)與左右兩點(diǎn)的判決值，找到最小點(diǎn)，并移動，直到中心點(diǎn)就是最小點(diǎn)。再延垂直方向進(jìn)行搜索，直至找到最佳匹配點(diǎn)。91123445678第十一頁，共三十二頁，編輯于2023年，星期三快速搜索算法比較搜索方法所需搜索點(diǎn)數(shù)所需搜索步驟圖例最壞情況圖例最壞情況二維對數(shù)法182157三步法252533共軛方向法1215912正交搜索法131366對全搜索，若，需要搜索點(diǎn)數(shù)Q=169，而快速算法的搜索點(diǎn)數(shù)見下表。由于很多DSP能并行運(yùn)算，因此減小搜索步驟比減小搜索點(diǎn)數(shù)更重要，同一步的不同點(diǎn)的判決函數(shù)值可以并行計(jì)算。

第十二頁，共三十二頁，編輯于2023年，星期三像素遞歸法(1)先將圖像中的運(yùn)動部分與靜止部分分開，然后在運(yùn)動區(qū)域內(nèi)每個(gè)像素上以迭代的方式計(jì)算位移量經(jīng)位移后，相鄰兩幀圖像差值DFD(DisplacedFrameDifference)的平方通過迭代，得到最優(yōu)的Di，使得DFD最小。一般迭代方向沿著負(fù)梯度方向。第十三頁，共三十二頁，編輯于2023年，星期三像素遞歸法(2)迭代法示意圖DFD按什么范圍計(jì)算？一個(gè)像素還是整個(gè)運(yùn)動區(qū)域？按像素計(jì)算的DFD函數(shù)圖，可能的問題按運(yùn)動區(qū)域計(jì)算的函數(shù)圖與可能的問題第十四頁，共三十二頁，編輯于2023年，星期三兩種方法的比較塊匹配法不需要分離運(yùn)動與靜止區(qū)域一個(gè)塊有一個(gè)運(yùn)動矢量像素遞歸法需要分離運(yùn)動與靜止區(qū)域逐個(gè)像素，或者逐個(gè)獨(dú)立運(yùn)動的模塊進(jìn)行遞歸運(yùn)動矢量估計(jì)更準(zhǔn)確對于一般的運(yùn)動圖像，由于運(yùn)動物體無規(guī)律，采用塊匹配法更合適；而對于那種大面積背景不變，而只是單個(gè)或個(gè)別物體運(yùn)動的運(yùn)動圖像，則更適合用像素遞歸法。第十五頁，共三十二頁，編輯于2023年，星期三半像素搜索為了提高運(yùn)動矢量的精度，引入半像素搜索。在原先搜索到最小MAD的位置(i,j)上，再通過線形內(nèi)插得到周圍8個(gè)半像素點(diǎn)。再在這9個(gè)點(diǎn)中尋找最終的匹配點(diǎn)。(i,j)第十六頁，共三十二頁，編輯于2023年，星期三具有運(yùn)動補(bǔ)償?shù)膸g預(yù)測第十七頁，共三十二頁，編輯于2023年，星期三前向預(yù)測(1)前向預(yù)測：用k-1幀來預(yù)測k幀。不直接傳送當(dāng)前幀像素，而是傳送同一位置的當(dāng)前幀像素與前一幀像素的差值。對運(yùn)動物體，這個(gè)差值很大，預(yù)測沒有起作用。如果已知運(yùn)動物體的方向和速度，可從k-1幀的位置推出k幀中運(yùn)動物體的位置，而背景而以k-1幀的背景代替。這種方法稱為具有運(yùn)動補(bǔ)償?shù)膸g預(yù)測。k-1幀k幀k-1幀k幀X’X第十八頁，共三十二頁，編輯于2023年，星期三前向預(yù)測(2)基本步驟將圖像分割為運(yùn)動物理和靜止背景，估計(jì)各運(yùn)動物體的運(yùn)動矢量。計(jì)算運(yùn)動補(bǔ)償后的預(yù)測值傳送預(yù)測誤差，運(yùn)動矢量以及對運(yùn)動物體和靜止背景的分割的信息。事實(shí)上，將圖像分割為靜止區(qū)和不同的運(yùn)動區(qū)域，是很困難的。一般來說，將圖像分塊，每塊都作為一個(gè)物體估算運(yùn)動矢量，接收端按上面的方法可以恢復(fù)該塊數(shù)據(jù)。第十九頁，共三十二頁，編輯于2023年，星期三前向預(yù)測(3)問題：若同一塊中有兩個(gè)不同的運(yùn)動物體，則運(yùn)動矢量必然不準(zhǔn)確，導(dǎo)致預(yù)測誤差增大。k-1與k幀中各子塊的相互關(guān)系1234567891011121312734561389101112K-1幀K幀也可以使用像素遞歸法得到每個(gè)像素的位移矢量。但是運(yùn)算復(fù)雜，而且對于大面積的運(yùn)動物體，像素遞歸法反而會由于噪聲的存在，導(dǎo)致同一物體的運(yùn)動矢量不一致。因此實(shí)用中，常選用塊匹配算法。第二十頁，共三十二頁，編輯于2023年，星期三后向預(yù)測與雙向預(yù)測如果用k幀預(yù)測k-1幀的圖像，稱為后向預(yù)測為提高壓縮比，往往需要用前后兩幀來預(yù)測中間幀，稱為雙向預(yù)測。利用兩個(gè)運(yùn)動矢量和預(yù)測值，進(jìn)一步降低預(yù)測誤差。問題：會引入延時(shí)。K-1幀K幀K+1幀第二十一頁，共三十二頁，編輯于2023年，星期三具有運(yùn)動補(bǔ)償?shù)膸g內(nèi)插第二十二頁，共三十二頁，編輯于2023年，星期三幀間內(nèi)插(1)在發(fā)送端每隔一段時(shí)間，丟掉一幀或幾幀圖像，在收端利用幀間相關(guān)性將丟掉的幀恢復(fù)，適用于低比特率傳輸，如可視電話。簡單的接收幀重復(fù)顯示。這樣動作會不連續(xù)。線形內(nèi)插恢復(fù)丟失幀。ABC傳送幀丟棄幀傳送幀第二十三頁，共三十二頁，編輯于2023年，星期三幀間內(nèi)插(2)ABk-幀i幀k幀當(dāng)存在運(yùn)動物體時(shí)，簡單內(nèi)插會引起圖像模糊，必須加入運(yùn)動補(bǔ)償。相鄰兩幀比較，分為不變區(qū)域，變化區(qū)域變換區(qū)域又分為運(yùn)動物體，由于運(yùn)動而覆蓋的背景以及新暴露的背景。這4塊區(qū)域需要不同的處理方法。幀間內(nèi)插要求運(yùn)動矢量估計(jì)更準(zhǔn)確，一般采用像素遞歸法。第二十四頁，共三十二頁，編輯于2023年，星期三運(yùn)動圖像編碼系統(tǒng)

典型的編碼器框圖

速率控制的反饋

編碼速率的范圍

第二十五頁，共三十二頁，編輯于2023年，星期三典型的編碼器框圖DCT緩存熵編碼QDQIDCT運(yùn)動估值參考幀存儲運(yùn)動補(bǔ)償預(yù)測預(yù)處理++圖像復(fù)雜度分析速率控制視頻信號入運(yùn)動矢量壓縮碼流編碼器-第二十六頁，共三十二頁，編輯于2023年，星期三典型的解碼器框圖熵解碼DQIDCT幀存儲運(yùn)動補(bǔ)償+運(yùn)動矢量視頻信號壓縮碼流解碼器第二十七頁，共三十二頁，編輯于2023年，星期三速度控制策略編碼器產(chǎn)生的碼流速率是變化的，為了適應(yīng)恒定速率信道的要求，需要在編碼器和信道之間設(shè)置一個(gè)緩存器。緩存器的充滿程度與碼流速率和信道速率的差值有關(guān)。為了防止緩存器的溢出或清空，需要利用反饋機(jī)制去控制量化器的量化間隔來穩(wěn)定碼流。一般來說，運(yùn)動較大時(shí)，預(yù)測后余量信號動態(tài)范圍較大，產(chǎn)生較多的碼流，通過反饋，使得量化間隔變大，碼率下降，但是圖像質(zhì)量也相應(yīng)的下降。因此我們看到同樣的情況下，運(yùn)動劇烈的視頻質(zhì)量，往往不如運(yùn)動比較平穩(wěn)的視頻。第二十八頁，共三十二頁，編輯于2023年，星期三速度控制的反饋模型基本思想是：根據(jù)信道速率，為每幀圖像規(guī)定好編碼的比特?cái)?shù)，稱為目標(biāo)比特分配；然后在編碼中，通過調(diào)整量化間隔，使編碼的實(shí)際比特?cái)?shù)，接近其預(yù)分配值。目標(biāo)比特分配：設(shè)Ti,Tp,Tb為三種幀的目標(biāo)比特?cái)?shù)，應(yīng)和信道速率Rc匹配。若實(shí)際幀的編碼比特為Si,Sp,Sb，實(shí)際數(shù)據(jù)速率為Rc’。則將目標(biāo)比特?cái)?shù)更新為Tx=Sx*Rc/Rc’。碼率調(diào)整：量化間隔Q=Qmin+Buf/N，其中Qmin為量化間隔的下限，N為系數(shù)，Buf為緩沖器中數(shù)據(jù)量。Buf由下式更新：Buf+=SB-NB。其中SB為實(shí)際的編碼比特?cái)?shù)，NB為目標(biāo)比特?cái)?shù)。第二十九頁，共三十二頁，編輯于2023年，星期三編碼器碼流的速度范圍盡管從一段時(shí)間平均的來看，編碼器通過速率控制使其輸出碼流的速率保持恒定，但是對每一幀圖像而言，編碼后的數(shù)據(jù)量并不相同。對于恒定速率信道而言，每個(gè)已編碼幀的數(shù)據(jù)量的變動不應(yīng)超過一定的范圍。我們利用VBV(VideoBufferVerifier)模型來進(jìn)行描述第三十頁，共三十二頁，編輯于2023年，星期三VBV模型（1）VBV是一個(gè)假想的解碼器，在解碼器前有個(gè)容量為B的緩存器。右圖表示隨著時(shí)間的推移，緩存器中數(shù)據(jù)量的變化。其中tn表示幀的采樣時(shí)刻，dn表示一幀圖像的數(shù)據(jù)，Bn表示緩存器中的剩余數(shù)據(jù)。0Bttn+1tnt1d1Bn+1BnB1dndn+1BFVBV-delay解碼器B第三十一頁，共三十二頁，編輯于2023年，星期三VBV模型（2）若tn時(shí)刻剩余量為Bn，為了保證有足夠數(shù)據(jù)提供給tn+1時(shí)刻作解碼，要求Bn+Rc/fr>=dn+1，其中fr為幀

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

運(yùn)動圖像的編碼一

文檔簡介

溫馨提示

最新文檔

評論

運(yùn)動圖像的編碼一

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔