多媒體信息處理_第1頁
多媒體信息處理_第2頁
多媒體信息處理_第3頁
多媒體信息處理_第4頁
多媒體信息處理_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、通信工程應(yīng)用技術(shù)綜合訓(xùn)練與實習(xí)課程設(shè)計課程設(shè)計任務(wù)書學(xué)生姓名: 專業(yè)班級:指導(dǎo)教師:學(xué)院:信息學(xué)院題 目: 多媒體信息處理初始條件:MATLAB軟件平臺要求完成的主要任務(wù):設(shè)計任務(wù)設(shè)計視頻壓縮系統(tǒng)中的運動估計算法:全搜索法(FS: Full Search)和三步法(TSS: Three Step Search),比較二種方法的搜索點和每幀的峰值信噪比(PSNR: peak signal to noise ratio)設(shè)計要求編制出有全搜索法和三步搜索法分別實現(xiàn)的算法代碼對給定的視頻中的兩幅相鄰圖像進(jìn)行運動塊估計算法,對視頻進(jìn)行運動估計,并根據(jù)估計結(jié)果與原來的第二幅圖進(jìn)行比較,計算PSNR,分析

2、全搜索法和三步搜索法的優(yōu)劣。時間安排:2013年12月15日-12月25日:研究原理,進(jìn)行理論學(xué)習(xí) 2013年12月26日-12月31日:編寫程序源代碼 2014年1月1日-1月5日 :調(diào)試程序 2014年1月6日-1月10日 :撰寫報告答辯時間2014年1月12日。指導(dǎo)教師簽名: 年 月 日系主任簽名: 年 月 日 PAGE 40TOC o 1-3 h u HYPERLINK l _Toc11857 摘要 PAGEREF _Toc11857 2 HYPERLINK l _Toc30624 Abstract PAGEREF _Toc30624 3 HYPERLINK l _Toc16717 1

3、 運動估計算法概念 PAGEREF _Toc16717 4 HYPERLINK l _Toc6696 1.1 運動估計算法基本思想 PAGEREF _Toc6696 4 HYPERLINK l _Toc14817 1.2 運動估計算法實驗原理 PAGEREF _Toc14817 4 HYPERLINK l _Toc14345 2 實驗原理和方法 PAGEREF _Toc14345 5 HYPERLINK l _Toc20743 2.1 塊匹配運動估計中的準(zhǔn)則函數(shù) PAGEREF _Toc20743 5 HYPERLINK l _Toc2401 2.1.1 SSE(和方差) PAGEREF _T

4、oc2401 5 HYPERLINK l _Toc23877 2.1.2 MSE(均方差) PAGEREF _Toc23877 5 HYPERLINK l _Toc5621 2.1.3 RMSE(均方根) PAGEREF _Toc5621 6 HYPERLINK l _Toc3391 2.1.4 比較結(jié)果 PAGEREF _Toc3391 6 HYPERLINK l _Toc18436 2.2 全搜索法(FS) PAGEREF _Toc18436 6 HYPERLINK l _Toc26552 2.3 三步法(TSS) PAGEREF _Toc26552 7 HYPERLINK l _Toc1

5、7087 2.4 峰值信噪比 PAGEREF _Toc17087 8 HYPERLINK l _Toc17589 3運動估計算法的MATLAB編程 PAGEREF _Toc17589 8 HYPERLINK l _Toc354 3.1 MATLAB介紹 PAGEREF _Toc354 8 HYPERLINK l _Toc20640 3.2 全搜索法 PAGEREF _Toc20640 9 HYPERLINK l _Toc11334 3.2.1 算法的描述 PAGEREF _Toc11334 9 HYPERLINK l _Toc29086 3.2.2 算法的流程圖 PAGEREF _Toc290

6、86 9 HYPERLINK l _Toc15212 3.3 三步法 PAGEREF _Toc15212 10 HYPERLINK l _Toc26737 3.3.1 算法的描述 PAGEREF _Toc26737 10 HYPERLINK l _Toc31297 3.3.2 算法的流程圖 PAGEREF _Toc31297 11 HYPERLINK l _Toc4516 3.4 主要的函數(shù)說明 PAGEREF _Toc4516 11 HYPERLINK l _Toc24243 4 仿真結(jié)果及分析 PAGEREF _Toc24243 12 HYPERLINK l _Toc4303 4.1 全搜

7、索法結(jié)果 PAGEREF _Toc4303 12 HYPERLINK l _Toc30163 4.2 三步法結(jié)果 PAGEREF _Toc30163 15 HYPERLINK l _Toc16175 4.3分析與比較 PAGEREF _Toc16175 18 HYPERLINK l _Toc31379 4.4 實驗中出現(xiàn)的問題 PAGEREF _Toc31379 18 HYPERLINK l _Toc16371 5 小結(jié)與體會 PAGEREF _Toc16371 19 HYPERLINK l _Toc3936 參考文件 PAGEREF _Toc3936 20 HYPERLINK l _Toc2

8、8643 附錄 PAGEREF _Toc28643 21摘要近幾十年來,我們正在經(jīng)歷著一場數(shù)字革命,數(shù)字?jǐn)?shù)據(jù)和數(shù)字通訊異常普遍?,F(xiàn)在,在臺式機(jī)上的多媒體信息處理技術(shù)已經(jīng)日趨成熟。 數(shù)字信號不僅更加健壯,而且數(shù)字表示和數(shù)字傳輸最主要的好處是它們使得在同樣的網(wǎng)絡(luò)上提供不同范圍的服務(wù)變得更加簡單。基于計算機(jī)的多媒體信息處理技術(shù)中的視頻處理技術(shù)使計算機(jī)和通訊以一種全新的方式結(jié)合在一起。運動估計是多媒體視頻信息處理中一個很基本的、也很重要的問題。運動估計,通常是指二維的平面圖像運動估計或者是三維的實體運動的估計。 事實上,它一直是人們研究很多的主題。塊運動估計和塊運動補(bǔ)償是最常用的方法。塊運動估計和補(bǔ)償

9、已經(jīng)被使用在如 H.261,MPEG1-2 等國際數(shù)字視頻壓縮標(biāo)準(zhǔn)中1。塊運動估計同樣也被廣泛地使用在很多其它的數(shù)字視頻應(yīng)用中,比如標(biāo)準(zhǔn)壓縮中的運動補(bǔ)償濾波。當(dāng)前的塊運動估計算法包括:全搜索法;三步法;共軛方向搜索法;兩維對數(shù)下降法;交叉搜索法;動態(tài)窗口搜索法;兩步搜索法等。它們在計算速度和計算精度上各有特點。其中全搜索方法的精度一般是最高的,但是由于是逐點搜索,所以在速度上是最慢的;而三步快速搜索僅在事先確定的侯選的運動矢量的范圍內(nèi)計算準(zhǔn)則函數(shù)的值,因此精度比較低,但是由于處理的點較少,它的處理速度很快。運動估計與超分辨率等技術(shù)相結(jié)合,將可以很大程度地提高圖像的質(zhì)量,運用到視頻恢復(fù)等技術(shù)中,

10、因而運動估計的研究會有較大的應(yīng)用前景。關(guān)鍵詞:多媒體信息處理 運動估計 全搜索法 三步法AbstractIn recent decades, we are experiencing a digital revolution . digital data and digital communications are abnormaly common. Now, on the desktop, multimedia information processing technology has matured . Not only digital signal is more robust , but

11、 also the main benefit of digital representation and digital transmission is that they make it easier to provide a diverse range of services on the same network . Computer-based multimedia information processing technology in the video processing technology enables computers and communications toget

12、her in a new way .Motion estimation is a very basic and very important issue in multimedia video information processing . Motion estimation usually refers to the estimated two-dimensional planar image motion estimation or three-dimensional movement of the entity . In fact, it has been the study subj

13、ect of a lot of people . Block motion estimation and motion compensation block are the most commonly used methods. Block motion estimation and compensation have been used in such as H.261, MPEG1-2 digital video compression and other international standards 1 . Block motion estimation is widely used

14、also in many other digital video applications , such as the standard compression motion compensation filtering.The current block motion estimation algorithms include full search method ,three-step method , conjugate direction search method , two-dimensional logarithmic descent , cross- search method

15、 , dynamic window search method , two-step search method. They have their own characteristics in calculation speed and accuracy . The accuracy of the full search method is generally the highes.But because it is the search -by-point , it is the speed of the slowest .And three-step quick search calcul

16、ated only criterion function value in the range of pre-determined candidate motion vectors ,therefore it has relatively low accuracy and fewer point processing . Its processing speed is very fast. Motion estimation combining super-resolution technology will be able to greatly increase the quality of

17、 the image, using the video restoration technology , and thus the motion estimation studies have greater prospects.Keywordsmultimediuminformation processing motion estimation Full search Method of three-step method1 運動估計算法概念視頻原始圖像中存在著大量的信息冗余,如時間冗余、空間冗余、信息熵冗余、譜間冗余、幾何結(jié)構(gòu)冗余、視覺冗余和知識冗余等等。運動估計是視頻壓縮編碼中的核心技術(shù)

18、之一,采用運動估計和運動補(bǔ)償技術(shù)可以消除視頻信號的時間冗余以提高編碼效率。如何提高運動估計的效率,使運動估計算法的搜索過程更健壯、更快速、更高效成為目前研究的熱點。運動估計的基本思想是盡可能準(zhǔn)確地獲得序列圖像幀間的運動位移,即運動矢量。因為運動估計越準(zhǔn)確,預(yù)測補(bǔ)償?shù)膱D像質(zhì)量越高,補(bǔ)償?shù)臍埐罹驮叫?,補(bǔ)償編碼所需位數(shù)越少,需要傳輸?shù)谋忍芈示驮叫 @玫玫降倪\動矢量在幀間進(jìn)行運動補(bǔ)償。補(bǔ)償殘差經(jīng)過變換、量化、編碼后與運動矢量一起經(jīng)過熵編碼,然后以比特流形式發(fā)送出去。運動估計算法多種多樣,大體上可以把它們分成四類:塊匹配法、遞歸估計法、貝葉斯估計法和光流法。其中塊匹配運動估計算法因其具有算法簡單、便于

19、VLSI實現(xiàn)等優(yōu)點得到廣泛應(yīng)用。所以本文將重點介紹塊匹配運動估計算法。1.1 運動估計算法基本思想運動估計的基本思想是盡可能準(zhǔn)確地獲得序列圖像幀間的運動位移,即運動矢量。運動估計算法的目標(biāo)是效率和準(zhǔn)確性。由于在成象的場景中一般有多個物體作不同的運動,如果直接按照不同類型的運動將圖像分割成復(fù)雜的區(qū)域是比較困難的。最直接和不受約束的方法是在每個像素都指定運動矢量,這就是所謂基于像素表示法。這種表示法是對任何類型圖像都是適用的,但是它需要估計大量的未知量,并且它的解時常在物理上是不正確,除非在估計過程中施加適當(dāng)?shù)奈锢砑s束。這在具體實現(xiàn)時是不可能的,通常采用基于塊的物體運動表示法。因為運動估計越準(zhǔn)確,

20、預(yù)測補(bǔ)償?shù)膱D像質(zhì)量越高,補(bǔ)償?shù)臍埐罹驮叫。a(bǔ)償編碼所需位數(shù)越少,需要傳輸?shù)谋忍芈示驮叫 ?.2 運動估計算法實驗原理在幀間預(yù)測編碼中,由于活動圖像鄰近幀中的景物存在著一定的相關(guān)性。因此,可將活動圖像分成若干塊或宏塊,并設(shè)法搜索出每個塊或宏塊在鄰近幀圖像中的位置,并得出兩者之間的空間位置的相對偏移量,得到的相對偏移量就是通常所指的運動矢量,得到運動矢量的過程被稱為運動估計。運動矢量和經(jīng)過運動匹配后得到的預(yù)測誤差共同發(fā)送到解碼端,在解碼端按照運動矢量指明的位置,從已經(jīng)解碼的鄰近參考幀圖像中找到相應(yīng)的塊或宏塊,和預(yù)測誤差相加后就得到了塊或宏塊在當(dāng)前幀中的位置。運動估計的準(zhǔn)確程度往往用補(bǔ)償圖像與原圖像

21、比較的PSNR來衡量表示。2 實驗原理和方法2.1 塊匹配運動估計中的準(zhǔn)則函數(shù)塊之間是否匹配是通過各種不同的準(zhǔn)則函數(shù)來判斷。常用的塊匹配準(zhǔn)則函數(shù)包括均方誤差函數(shù)(MSE),最小絕對差誤差函數(shù)(MAD),最大匹配像素個數(shù)函數(shù)(MPC),絕對平均誤差函數(shù)(MAE),互相關(guān)函數(shù)(CCF),最大誤差最小函數(shù)(MME)。還有一些比較新的準(zhǔn)則函數(shù),比如,塊特征匹配函數(shù)(BFM)等等。下面介紹其中幾種。2.1.1 SSE(和方差)該統(tǒng)計參數(shù)計算的是擬合數(shù)據(jù)和原始數(shù)據(jù)對應(yīng)點的誤差的平方和,計算公式如下SSE越接近于0,說明模型選擇和擬合更好,數(shù)據(jù)預(yù)測也越成功。接下來的MSE和RMSE因為和SSE是同出一宗,所

22、以效果一樣。2.1.2 MSE(均方差)該統(tǒng)計參數(shù)是預(yù)測數(shù)據(jù)和原始數(shù)據(jù)對應(yīng)點誤差的平方和的均值,也就是SSE/n,和SSE沒有太大的區(qū)別,計算公式如下2.1.3 RMSE(均方根)該統(tǒng)計參數(shù),也叫回歸系統(tǒng)的擬合標(biāo)準(zhǔn)差,是MSE的平方根,就算公式如下 (2-1)在這之前,我們所有的誤差參數(shù)都是基于預(yù)測值和原始值之間的誤差。從下面開始是所有的誤差都是相對原始數(shù)據(jù)平均值而展開的。2.1.4 比較結(jié)果根據(jù)塊匹配的特性和實現(xiàn)的方便性,我們選擇MSE(均方差)算法。即 (2-2)2.2 全搜索法(FS)所有的運動估計算法中FS是性能最好的,因為它是對整個搜索窗口的每一個點進(jìn)行塊匹配計算,根據(jù)均方差(比如M

23、SE準(zhǔn)則函數(shù))或絕對差(比如MAD準(zhǔn)則函數(shù))最小的原則最后得出最佳匹配點。由于FS逐點搜索,其計算量也是最大的,如果系統(tǒng)處理速度不夠,那么用這種方法是很難實現(xiàn)多媒體系統(tǒng)的實時化的。其它任何一種算法的性能都不如FS,但是其它的算法都是通過減少在搜索窗中搜索的點數(shù),以減少計算量,其性能必然都有所下降,是以犧牲性能來換取處理速度的提高。X下圖為FS的搜索過程,黑色箭頭矢量表示了搜索點的順序,直到搜索完整個窗口的點2。圖2-3 全搜索法2.3 三步法(TSS) 三步法是運動估計的一種很好的算法,快速而且高效,它基本上保持了FS的性能,但其計算量只有FS的10%左右。TSS在會議電視和可視電話中是應(yīng)用最

24、多的,它是通過三步搜索,逐步減小搜索步長。每次搜索都是以上一步的搜索結(jié)果為中心,進(jìn)行周圍一定步長的3*3像素的搜索,搜索精度為1個像素。如圖,顯示TSS的全過程:第一步,以窗口中心為中心,步長為4,進(jìn)行周圍8個點搜索,根據(jù)最小絕對差原則得到一個最佳匹配點,共搜索了9個點;第二步,以上步最佳匹配點為中心,步長為2,繼續(xù)搜索周圍8個點得到匹配點,共搜索了8個點;第三步,同上一步,只是步長為1,最后得到的最佳匹配點就是要得到的運動估計的點,從而得到運動矢量進(jìn)行圖像的預(yù)測。TSS共搜索了25個點,而FS要進(jìn)行15*15=225點搜索,運算時間明顯減少,性能稍有下降。因此,它是一種很好的運動估計算法。圖

25、2-4 三步搜索法2.4 峰值信噪比峰值信噪比(經(jīng)??s寫為PSNR)是一個表示信號最大可能功率和影響它的表示精度的破壞性噪聲功率的比值的工程術(shù)語。由于許多信號都有非常寬的動態(tài)范圍,峰值信噪比常用對數(shù)分貝單位來表示。PSNR是“Peak Signal to Noise Ratio”的縮寫。peak的中文意思是頂點。而ratio的意思是比率或比列的。整個意思就是到達(dá)噪音比率的頂點信號,psnr是一般是用于最大值信號和背景噪音之間的一個工程項目。通常在經(jīng)過影像壓縮之后,輸出的影像通常都會有某種程度與原始影像不一樣。為了衡量經(jīng)過處理后的影像品質(zhì),我們通常會參考PSNR 值來認(rèn)定某個處理程序夠不夠令人滿

26、意。Peak 就是指8 bits 表示法的最大值255。MSE 指 Mean Square Error(均方誤差,各值相差的n次方和的平均值的n次平方根(這幾個字應(yīng)該沒有)),I(角標(biāo)n)指原始影像第n個pixel 值,P(角標(biāo)n)指經(jīng)處理后的影像第n個pixel 值。PSNR 的單位為dB。所以PSNR值越大,就代表失真越少。PSNR 是最普遍,最廣泛使用的評鑒畫質(zhì)的客觀量測法,不過許多實驗結(jié)果都顯示,PSNR 的分?jǐn)?shù)無法和人眼看到的視覺品質(zhì)完全一致,有可能 PSNR 較高者看起來反而比 PSNR 較低者差。這是因為人眼的視覺對于誤差的敏感度并不是絕對的,其感知結(jié)果會受到許多因素的影響而產(chǎn)生

27、變化(例如:人眼對空間頻率較低的對比差異敏感度較高,人眼對亮度對比差異的敏感度較色度高,人眼對一個區(qū)域的感知結(jié)果會受到其周圍鄰近區(qū)域的影響)。計算公式如下所示: (2-3)3運動估計算法的MATLAB編程3.1 MATLAB介紹MATLAB是一個高級的矩陣/陣列語言,它包含控制語句、函數(shù)、數(shù)據(jù)結(jié)構(gòu)、輸入和輸出和面向?qū)ο缶幊烫攸c。用戶可以在命令窗口中將輸入語句與執(zhí)行命令同步,也可以先編寫好一個較大的復(fù)雜的應(yīng)用程序(M文件)后再一起運行,可移植性好、可拓展性極強(qiáng)。MATLAB是一個包含大量計算算法的集合。其擁有600多個工程中要用到的數(shù)學(xué)運算函數(shù),可以方便的實現(xiàn)用戶所需的各種計算功能。MATLAB

28、的這些函數(shù)所能解決的問題大致包括矩陣運算和線性方程組的求解、微分方程及偏微分方程的組的求解、符號運算、傅立葉變換和數(shù)據(jù)的統(tǒng)計分析、工程中的優(yōu)化問題、稀疏矩陣運算、復(fù)數(shù)的各種運算、三角函數(shù)和其他初等數(shù)學(xué)運算、多維數(shù)組操作以及建模動態(tài)仿真等。MATLAB有兩種工作方式:一種是交互式的命令行工作方式;另一種是M文件的程序工作方式。在前一種工作方式下,MATLAB被當(dāng)做一種高級數(shù)學(xué)演算紙和圖形表現(xiàn)器來使用,MATLAB提供了一套完整的而易于使用的編程語言,為用戶提供了二次開發(fā)的工具,下面主要介紹MATLAB控制語句和程序設(shè)計的基本方法。用MATLAB語言編寫的程序,稱為M文件。M文件有兩類:命令文件和

29、函數(shù)文件。兩者區(qū)別在于:命令文件沒有輸入?yún)?shù),也不返回輸出參數(shù);而函數(shù)文件可以輸入?yún)?shù),也可以返回輸出參數(shù)。命令文件對MATLAB工作空間的變量進(jìn)行操作,而且函數(shù)文件中定義的變量為局部變量,當(dāng)函數(shù)文件執(zhí)行完畢時,這些變量被清除。M文件可以使用任何編輯程序建立和編輯,而一般常用的是使用MATLAB提供的M文件窗口。本次課程設(shè)計中我全部采用M文件,把每個需要自己編程實現(xiàn)的模塊都分別放在一個人函數(shù)文件中最后建立一個命令文件中放主干程序并在其中調(diào)用之前寫好的函數(shù)實現(xiàn)整個過程。3.2 全搜索法3.2.1 算法的描述 全搜索算法是先將視頻流中的第 K+1 幀劃分為許多個不重疊的,相互緊靠著的 N*N 大小

30、的塊。然后依次對每一塊進(jìn)行處理。在處理某一塊時,以該塊的中心點為中心點,在第 K 幀中的窗口內(nèi)的每個點都進(jìn)行一次匹配的運算。從中選擇準(zhǔn)則函數(shù)值最理想的那個點,就是與之相匹配的點。3.2.2 算法的流程圖 塊運動估計算法的核心是準(zhǔn)則函數(shù)的選擇。其總體思想是首先將圖像劃分成若干個塊,對每一個塊進(jìn)行估計。也即計算出窗口中的像素點的個數(shù)后,再選擇合適的準(zhǔn)則函數(shù)進(jìn)行計算,求出其最小值。該算法的流程圖3如圖圖3-1 全搜索法流程3.3 三步法3.3.1 算法的描述 三步法是運動估計的一種很好的算法,快速而且高效。它是通過三步搜索,逐漸減小搜索步長。每次搜索都是以上一步的搜索結(jié)果為中心,進(jìn)行周圍一定步長的

31、3*3 像素的搜索,搜索精度為 1 個像素。3.3.2 算法的流程圖圖3-2 三步搜索法流程3.4 主要的函數(shù)說明1 A=imread(filename)讀取一個名為filename的灰度或者真彩圖像到A中如果文件包含一個灰度圖像,A為一個二維數(shù)組;如果文件包含一個真彩色(RGB)圖像,則A是一個三維數(shù)組。2 A=rgb2gray(B)將真彩色圖像B轉(zhuǎn)換成灰度圖像格式A3imshow(A,)用處理圖形圖的格式將圖形顯示出來。表示將A中的最高值顯示為黑,最低值顯示為白。4 quiver(x,y,u,v)在點(x,y)處顯示對應(yīng)于分量(u,v)的速度向量。5 tic;toc用于計算程序所花的時間4

32、 仿真結(jié)果及分析4.1 全搜索法結(jié)果圖4-1 第一幅圖圖4-2 第一幅圖像圖4-3 幀間差值圖4-4 利用全搜索法匹配后的幀間差圖4-5 利用全搜索法恢復(fù)的圖像圖4-6 全搜索法得出的位移矢量圖Elapsed time is 9.579308 seconds.PSNR =37.63024.2 三步法結(jié)果圖4-7 第一幅圖圖4-8 第二幅圖圖4-9 幀間差值圖4-10 三步搜索法匹配后的幀間差值圖4-11 用三步法恢復(fù)后的第二幀圖像圖4-12 三步搜索法的位移矢量圖Elapsed time is 7.989397 seconds.PSNR =336.94604.3分析與比較全搜索法中的PSNR

33、=37.6302time=9.579308 seconds三步搜索法中的PSNR =36.9460time=7.989397 seconds也就是說兩種搜索法的性能相近,全搜索法更精確一些。但是全搜索法所用的時間稍長些。4.4 實驗中出現(xiàn)的問題1當(dāng)使用其他自己截取的較大視頻圖片進(jìn)行試驗時,會出現(xiàn)如下警告:Warning: Image is too big to fit on screen; displaying at 67% 通過查詢網(wǎng)上的幫助發(fā)現(xiàn)了問題的原因:480P的視頻要顯示的像素太多,但figure顯示圖片位置的大小是固定的,這兩者發(fā)生了沖突。于是我在暴風(fēng)視頻中選擇240P的視頻截圖進(jìn)

34、行的實驗,順利得出結(jié)果。2 每次試驗顯示的所需時間略有不同通過查閱網(wǎng)上的資料發(fā)現(xiàn)是因為系統(tǒng)在運行程序時還運行了其他的應(yīng)用程序,所以每次試驗得出的時間都略有不同。5 小結(jié)與體會通過本次對多媒體信息處理課程設(shè)計,讓我更深刻的理解了多媒體信息的獲取、搜索和保存的基本方法?;趬K的運動估計,是先將視頻圖像分成一個個規(guī)則的圖像塊,然后對每個圖像塊估計運動矢量?;趬K的運動估計和運動補(bǔ)償已經(jīng)廣泛應(yīng)用于各種視頻壓縮編碼標(biāo)準(zhǔn)。因此,本次課程設(shè)計是非常有作用的,它讓我了解了多媒體處理的基本原理。課程設(shè)計中會遇到很多的困難,但在自己思考下最終解決了問題。所以,本次課程設(shè)計我個人的收獲很大,但是讓我知道自己還在圖像

35、編程方面有很多欠缺的地方。不僅對均方誤差(MSE)、絕對值誤差(MAD)更深的理解,并且采用全搜索塊匹配方法得到所有宏塊的運動矢量,把MATLAB語言的知識又重新的過了一遍。參考文件1 戴 酉, 李小紅, 錢源誠.MPEG 運動估計的改進(jìn).淮南工業(yè)學(xué)院學(xué)報,2001 年,第 21 卷第 2 期,3033.2 唐澤鵬,秦雷,朱昌秀.運動估計算法分析.南京郵電學(xué)院,2001年,第12期,1013.3 趙美枝.運動估計算法的實現(xiàn)、分析與改進(jìn),2006年附錄1 全搜索法%?給圖像擴(kuò)邊,每個邊都擴(kuò)大dm大小%I1=double(I1);I2=double(I2);rownum colnum = size

36、(I1);II=zeros(rownum+2*dm,colnum+2*dm);II(dm+1:dm+rownum,dm+1:dm+colnum)=I1;%errorfor i=1:dm II(i,dm+1:dm+colnum)=II(dm+1,dm+1:dm+colnum);%left II(rownum+dm+i,dm+1:dm+colnum)=II(dm+rownum,dm+1:dm+colnum);%downendfor j=1:dm II(1:rownum+2*dm,j)=II(1:rownum+2*dm,dm+1);%up II(1:rownum+2*dm,colnum+dm+j)=

37、II(1:rownum+2*dm,dm+colnum);%rightend tic;%下面進(jìn)行全搜索算法 blocksize=16; rowblocks =rownum/blocksize; colblocks =colnum/blocksize; A=99999999999999999999; %為了找到最小的均方誤差,A用于設(shè)定一個很大的初值 Eij=0; xrecord=ones(16,16); %xrecord,yrecord用于存放匹配塊的塊號,即運動矢量 yrecord=ones(16,16); diff=zeros(rownum,colnum); %這幅圖的大小為rownum*c

38、olnumfor x=0:(rowblocks-1) %x表示行中第幾個子塊 row=x*blocksize;for y=0:(colblocks-1) %y表示列中第幾個子塊 col=y*blocksize;% tempx=x*blocksize+1:(x+1)*blocksize;% tempy=y*blocksize+1:(y+1)*blocksize;for p=-dm:dmfor q=-dm:dm %(p,q)表示x,y對應(yīng)子塊在前一幀所的搜索位置% Eij=0; Eij=sum(sum(I2(row+1:row+blocksize,col+1:col+blocksize)-. II

39、(row+dm+p+1:row+dm+p+blocksize,col+dm+q+1:col+dm+q+blocksize).2)/(blocksize2); %后一張圖片與前一張圖片對應(yīng)位置的值作比較,得mseif Eij0)&(col+dm+q1+10)&(row+dm+p1+blocksizerownum+dm)&(col+dm+q1+blocksizecolnum+dm) Eij=0; Eij=sum(sum(I2(row+1:row+blocksize,col+1:col+blocksize)-II(row+dm+p1+1:row+dm+p1+blocksize,col+dm+q1+1

40、:col+dm+q1+blocksize).2)/(blocksize2); if Eij0)&(col+dm+q2+10)&(row+dm+p2+blocksizerownum+dm)&(col+dm+q2+blocksizecolnum+dm) Eij=0; Eij=sum(sum(I2(row+1:row+blocksize,col+1:col+blocksize)-II(row+dm+p2+1:row+dm+p2+blocksize,col+dm+q2+1:col+dm+q2+blocksize).2)/(blocksize2);if Eij0)&(col+dm+q3+10)&(row+dm

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論