鏡頭邊緣檢測_第1頁
鏡頭邊緣檢測_第2頁
鏡頭邊緣檢測_第3頁
鏡頭邊緣檢測_第4頁
鏡頭邊緣檢測_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、鏡頭邊緣檢測1簡介如何才能在眾多的視頻信息中用最短時間找到自己所需要的內(nèi)容,已經(jīng)成了一個亟待解決的事情。鏡頭邊界檢測是視頻檢索的關(guān)鍵性技術(shù)之一。當(dāng)鏡頭發(fā)生轉(zhuǎn)換時,會造成一些明顯的變化。例如鏡頭連續(xù)幀之間相應(yīng)位置像素點差值的變大、顏色分布發(fā)生明顯改變或者物體邊緣的突然出現(xiàn)與消失。鏡頭邊界檢測從本質(zhì)上講就是檢測這些明顯特征的變化。由于鏡頭中的內(nèi)容有多種描述方法,所以相應(yīng)的也有多種鏡頭邊界檢測方法。2基本概念視頻:視頻一般是由許多個場景拼接而成的,它在時間、空間和圖像結(jié)構(gòu)上都具有一定地連續(xù)性。從根本上講,它是一組動態(tài)的圖像序列,所描述的是一個完整的故事。場景:包含一個或多個鏡頭,并且這些鏡頭內(nèi)容相近

2、,只是從不同的角度對同一個事件進行描述。一般敘述的是一個階段性的故事。鏡頭:鏡頭是視頻數(shù)據(jù)結(jié)構(gòu)中的基本單位,它由若干幀時間上連續(xù)的圖像組成。在內(nèi)容上具有很大的相似性。幀:幀作為視頻數(shù)據(jù)結(jié)構(gòu)中的最小單元,從本質(zhì)上來講是一幅靜態(tài)的的圖像。連續(xù)幀之間會發(fā)生變化。3鏡頭邊界:兩個鏡頭發(fā)生轉(zhuǎn)換的時候,會出現(xiàn)一些明顯的變化。例如鏡頭連續(xù)幀之間相應(yīng)位置像素點差值的變大、顏色分布發(fā)生明顯的改變或者物體邊緣的突然出現(xiàn)與消失。鏡頭邊界是視頻鏡頭相鄰幀的內(nèi)容出現(xiàn)了某種意義上的變化,即鏡頭邊界反映的是視頻內(nèi)容的不連續(xù)性。鏡頭邊界檢測從本質(zhì)上講就是檢測這些明顯特征的變化。4視頻鏡頭邊界分類視頻鏡頭邊界主要有兩種,分別為

3、突變鏡頭邊界與漸變鏡頭邊界。其中突變鏡頭邊界是一個鏡頭直接轉(zhuǎn)換到另一個鏡頭,兩個鏡頭之間沒有使用任何攝影編輯效果。它的特點是鏡頭的變換發(fā)生在兩幀圖像之間,這兩幀圖像分屬不同的鏡頭,兩幀圖像的最基本特征已發(fā)生改變。漸變鏡頭邊界是指一個鏡頭漸漸過渡到另一個鏡頭,鏡頭之間會有一些空間或時間上的編輯效果,包括淡入淡出,溶解等。它的主要特點是漸變過程中相鄰兩幀圖像變化相對較小,所以漸變過程通常為幾幀到十幾幀。5性能標準通常,在視頻鏡頭邊界檢測中,要用查全率和準確率兩個概念還衡量檢測算法的檢測精度,這兩個概念定義如下:另外,在鏡頭邊界檢測中還有兩個參數(shù)經(jīng)常被用到,即漏檢率和誤檢率:(1)漏檢率=1-查全率

4、(2)誤檢率=1-查準率6連續(xù)幀相減原理由于人眼是以像素為單位來辨別圖象的相似度或者差異度的,兩幀圖像在同一位置上相同像素點的個數(shù)越多,這兩幀圖像就越相似。由此,提出基于連續(xù)幀相減的像素差法。該方法主要原理就是判斷相鄰圖像幀中發(fā)生變化的像素點的多少。首先統(tǒng)計兩幅圖像對應(yīng)像素點變化率超過閾值F1的像素點個數(shù)。然后,將變化的像素點個數(shù)與第二個預(yù)定的閾值F2比較,如果超過范圍,則認為這兩幀之間發(fā)生較大變化,判斷其為鏡頭邊界。 7連續(xù)幀相減MATLAB實現(xiàn)讀取視頻序列,獲取幀高h,幀寬w,總幀數(shù)framesi=2提取幀x(i)與x(i-1),并灰度轉(zhuǎn)換iframeskwj=1輸出幀號mw*h*7%j=

5、j+1i=i+1jh計算像素點變化率ek=1存入數(shù)組me25%8程序代碼:info=aviinfo(E:Hepburn.avi);%錄入AVI視頻的相關(guān)信息mov=aviread(E:Hepburn.avi);%讀入視頻frames=size(mov,2);%獲取視頻中的幀總數(shù)w=info.Width;%幀寬h=info.Height;%幀高 m=zeros(frames,1);for i=2:frames x=mov(i-1).cdata(:,:,:); y=mov(i).cdata(:,:,:); a=rgb2gray(x); b=rgb2gray(y); %c=im2double(a);

6、 %d=im2double(b); e=abs(a-b)./(a+b); for j=1:h for k=1:w if e(j,k)0.25 %對于突變檢測,像素點變化率閾值可選范圍較大 m(i)=m(i)+1; end end end if m(i)h*w*0.07%閾值設(shè)為總像素點數(shù)的7% disp(i-1); end endn=1:frames;plot(n,m);xlabel(幀數(shù),FontWeight,bold);ylabel(像素點變化數(shù),FontWeight,bold);title(連續(xù)幀相減,FontSize,12,FontWeight,bold,FontName,隸書)910

7、程序運行結(jié)果:程序輸出結(jié)果為37,110。即第37幀和110幀為鏡頭突變邊界。并且由圖3.3可以看出37與38幀與110與111幀像素差遠遠超出其它相鄰幀像素差。將視頻打成幀圖像,查看第37幀與110幀。程序運行結(jié)果正確,第37幀與110幀確實為鏡頭突變邊界。程序運行結(jié)果:程序輸出結(jié)果為37,110。即第37幀和110幀為鏡頭突變邊界。并且由圖3.3可以看出37與38幀與110與111幀像素差遠遠超出其它相鄰幀像素差。將視頻打成幀圖像,查看第37幀與110幀。程序運行結(jié)果正確,第37幀與110幀確實為鏡頭突變邊界。程序運行結(jié)果:程序輸出結(jié)果為37,110。即第37幀和110幀為鏡頭突變邊界。并

8、且由圖3.3可以看出37與38幀與110與111幀像素差遠遠超出其它相鄰幀像素差。將視頻打成幀圖像,查看第37幀與110幀。程序運行結(jié)果正確,第37幀與110幀確實為鏡頭突變邊界。程序運行結(jié)果:程序輸出結(jié)果為37,110。即第37幀和110幀為鏡頭突變邊界。并且由圖3.3可以看出37與38幀與110與111幀像素差遠遠超出其它相鄰幀像素差。將視頻打成幀圖像,查看第37幀與110幀。程序運行結(jié)果正確,第37幀與110幀確實為鏡頭突變邊界。11連續(xù)幀相減優(yōu)點與缺點優(yōu)點: 在計算兩視頻幀圖像的幀間差時考慮到了像素的位置關(guān)系,因此計算的圖像幀間差較為精確。缺點:對攝像機運動敏感,如放縮、平移。對視頻序

9、列內(nèi)物體的運動同樣敏感。解決辦法:通過濾波器的使用來降低攝像機及目標運動的干擾,提高算法對于攝像機及目標運動的容忍度。在比較一幀的每個像素前,用它的鄰近區(qū)域的平均值來代替,這也過濾了輸入圖像的一些噪聲。12直方圖相減原理基于直方圖的方法也是利用視頻圖像幀間差進行鏡頭邊界檢測的方法。它的原理也很簡單,具體操作過程如下:首先計算連續(xù)兩幀圖像的直方圖,然后統(tǒng)計相鄰兩幀中所有像素在不同灰度上的分布差異,即直方圖相減。當(dāng)差異的累加值超過閾值T時,即檢測到鏡頭邊界。13程序代碼:info=aviinfo(E:Hepburn.avi);%錄入AVI視頻的相關(guān)信息mov=aviread(E:Hepburn.a

10、vi);%讀入視頻frames=size(mov,2);%獲取視頻中的幀總數(shù)w=info.Width;%幀寬h=info.Height;%幀高% for x=1:frames% mov=aviread(E:Hepburn.avi,x);% I=mov.cdata;% J=rgb2gray(I);%轉(zhuǎn)成灰度圖% imwrite(J,strcat(int2str(m),.,bmp);%將視頻打成幀圖像% end14for i=2:frames x=mov(i-1).cdata(:,:,:);%讀取視頻幀 y=mov(i).cdata(:,:,:); a=rgb2gray(x);%轉(zhuǎn)成灰度圖 b=rgb2gray(y); e=imhist(a); f=imhist(b); g(i)=sum(abs(e-f);%直方圖幀差 k=sum(g); th=k*0.11;%閾值設(shè)定為差異累加值的11% if g(i)th disp(i-1);%輸出幀號 endendh=1:frames;plot(h,g);%直方圖幀差圖xlabel(幀數(shù),FontWeight,bold);ylabel(直方圖幀差,FontWeight,bold);title(直方圖相減,FontSize,12,FontWeight,bold,FontNa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論