場景文本提取方法的應(yīng)用_第1頁
場景文本提取方法的應(yīng)用_第2頁
場景文本提取方法的應(yīng)用_第3頁
場景文本提取方法的應(yīng)用_第4頁
場景文本提取方法的應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、場景文本提取方法的應(yīng)用摘要場景圖像中的文本提供了重要的語義信息,它是圖像內(nèi)容的重要來源。針對當(dāng)前的求解算法普遍存在提取文本準(zhǔn)確度不高等缺點(diǎn),本文提出了一種有效的文本提取方法。首先對原始圖片進(jìn)展模糊化處理,然后進(jìn)展Laplaian邊緣提取和二值化,再形態(tài)學(xué)變化,最后進(jìn)展連通域分析,實(shí)現(xiàn)了場景文本的提齲關(guān)鍵詞文本提??;邊緣檢測;二值化;連通域分析隨著計算機(jī)、多媒體以及通訊技術(shù)的飛速開展,相當(dāng)數(shù)量的文字信息正越來越多地以圖像形式出現(xiàn)1。圖像中的文字是圖像內(nèi)容的一個重要來源,假如這些文字能自動地被檢測、分割、識別出來,那么對圖像語義的自動理解、索引和檢索是非常有價值的4。圖像文本可以分為人工文本和場景

2、文本。人工文本是指人工加在圖像上的文本,場景文本是圖像上本身存在的文本,如廣告牌或運(yùn)發(fā)動球衣上的號碼等。由于場景文本圖像具有較為復(fù)雜的背景,同時受光線和文本的字體、顏色、位置等因素影響較大,往往很難被檢測、提取和識別,因此自動從場景中提取文本是一項極具挑戰(zhàn)性的工作。目前已有的文本區(qū)域提取方法大致可以分為三類:基于連通域的方法,基于紋理的方法和基于邊緣的方法2。基于連通域的方法速度快,但是當(dāng)背景復(fù)雜或文本與背景顏色相近時分割困難,而基于紋理的方法非常費(fèi)時而且處理復(fù)雜背景時誤報比擬多。本文根據(jù)場景中的文本區(qū)域與背景比照度強(qiáng),存在豐富的邊緣信息,因此選擇基于邊緣檢測的文本提取方法對場景文本的提取進(jìn)展

3、研究。首先對原始圖像進(jìn)展模糊化處理,然后用Laplaian邊緣提取降噪,再進(jìn)展形態(tài)學(xué)變化,最后連通域分析,從而實(shí)現(xiàn)場景文本的提齲實(shí)驗說明,本文的文本提取方法具有較高的正確率,邊界定位較準(zhǔn)確。1.1圖像預(yù)處理由于光照等環(huán)境因素的影響在圖像上會產(chǎn)生許多噪聲,又考慮到Laplaian算子去噪才能較差,因此本文在預(yù)處理時先對原始圖像進(jìn)展模糊化,濾除圖像中的局部噪點(diǎn)。本文用的是3*3的卷積來進(jìn)展連續(xù)模糊。1.2邊緣檢測與二值化邊緣檢測是所有基于邊界分割方法的第一步。兩個具有不同灰度值的相鄰區(qū)域之間總存在著邊緣。由于場景中文本和背景視覺反差較大,且文本區(qū)域具有相當(dāng)大的一個寬度,與此同時場景文本筆畫邊緣明顯

4、,所以利用邊緣檢測方法可以較好地提取出場景中的文本邊緣。本文采用的是基于二階微分算子的Laplaian邊緣檢測算子。該方法對圖像中的階躍型邊緣點(diǎn)定位準(zhǔn)確且具有旋轉(zhuǎn)不變性的特點(diǎn),即各向同性的性質(zhì)。而場景文本正好具有階躍型邊緣的特性,所以說Laplaian算子較合適場景文本的提齲其表達(dá)式為:1-1使用的Laplaian算子模板如下圖:圖1拉普拉斯算子從邊緣檢測結(jié)果來看,在引入經(jīng)過模糊處理后的Laplaian算子可以在不影響文本邊緣提取的前提下能獲得很好的去噪效果。缺點(diǎn)是對光線影響較強(qiáng)和質(zhì)量較差的圖片處理過程中損失較大。邊緣圖像的二值化是很重要的問題,假如閾值過大可能會漏掉一些文字邊緣,而閾值過小那

5、么可能會使較多的非文字邊緣被當(dāng)作文字邊緣處理,導(dǎo)致誤檢較多。本文針對不同圖像采用整體閾值二值化,用最小誤差方法求分割閾值。這主要是由于整體閾值算法簡單,時間開銷小,選擇適宜的閾值可以獲得較好的效果。而且用最小誤差方法求整體閾值的算法可以較好地別離背景和文字。1.3形態(tài)學(xué)運(yùn)算形態(tài)學(xué)將圖像信號與幾何形狀聯(lián)絡(luò)起來,利用構(gòu)造元素的探針?biāo)鸭瘓D像的信息。形態(tài)學(xué)運(yùn)算可以對圖像上的物體做形狀等方面的限制,常用于目的檢測等。本文用形態(tài)學(xué)中的開閉運(yùn)算和腐蝕膨脹的方法來檢測二值邊緣密度圖像上的文本矩形區(qū)域。形態(tài)學(xué)運(yùn)算包括以下兩步:(1)對二值化的邊緣密度圖像做7個象素寬度的程度閉運(yùn)算,連接字符筆畫形成矩形區(qū)域;再做

6、15個象素寬度的程度開運(yùn)算,去除孤立的背景;(2)形態(tài)學(xué)后處理(即在連通域分析后進(jìn)展的二次形態(tài)學(xué)運(yùn)算):對每個連通域做度的膨脹運(yùn)算和度的腐蝕運(yùn)算。其定義如下:in(,/8)1-2/41-3其中,分別對應(yīng)連通域的高度和寬度。通過第一步形態(tài)學(xué)運(yùn)算去除局部背景區(qū)域,將相連的背景和文本分開;第二步形態(tài)學(xué)運(yùn)算后圖像上只剩下局部規(guī)那么的矩形區(qū)域。實(shí)驗說明,通過以上兩步形態(tài)學(xué)運(yùn)算能比擬準(zhǔn)確的得到文本矩形區(qū)域。1.4連通域分析雖然以上方法可刪除大量的非文本區(qū)域,但結(jié)果中可能還存在不包含文本的矩形區(qū)域。因此有必要對二值圖像做連通域分析。連通域算法是指從二值圖像中標(biāo)記出所有像素連通的區(qū)域。本文的連通域分析指的是8

7、連通。該方法步驟如下:(1)將原始圖像變換為行連通單元圖像,如圖2(b)所示,此時不考慮不同行之間的連通,同一行中的不同連通域賦予不同的標(biāo)號,背景置零。(2)考慮不同行之間的連通情況,從上到下掃描圖2(b)中結(jié)果,引入記錄數(shù)組D,該數(shù)組用來記錄連通的情況,約束是:數(shù)組下標(biāo)和數(shù)組存儲的內(nèi)容表示兩個連通域單元連通,應(yīng)該合并為一個連通域,如D(5)=3,那么表示5和3本質(zhì)上是一個連通域。如今使用數(shù)組D記錄連通的情況,假如下一行某個行連通單元和本行中不止一個連通單元連通,那么記錄本行中標(biāo)號最小的單元與下一行此單元連通。按照D的記錄修改圖2(b),得到圖2()中的結(jié)果。(3)進(jìn)一步考慮不同行之間的連通情

8、況,修正圖2()中結(jié)果。對圖2()從下到上掃描,假如連通情況與D的記錄不符就修改D。此時按照D的記錄修改圖2()就可以得到最終結(jié)果。見圖2(d),可以看出一樣的連通域已經(jīng)有了一樣的標(biāo)號。圖2連通域分析過程對于各個標(biāo)記的連通分量,文本區(qū)域的橫寬比、密度、寬度、高度等均有一定的限制。在本文中取如下參數(shù):in(/,/)0.25(1-4)0.2A/()1(1-5)in,3(1-6)其中A表示連通分量的面積,表示寬度,表示高度。本文的實(shí)驗數(shù)據(jù)由150幅標(biāo)志牌,海報,廣告標(biāo)語,新聞圖片,球衣照片等組成。采用計算正確率,錯誤率和遺漏率的方法來評價實(shí)驗結(jié)果。正確率正確提取的文本區(qū)域個數(shù)/實(shí)際文本區(qū)域個數(shù);錯誤

9、率錯誤提取的文本區(qū)域個數(shù)/實(shí)際文本區(qū)域個數(shù);遺漏率未被檢測到文本區(qū)域個數(shù)/實(shí)際文本區(qū)域個數(shù)。本文選擇了較復(fù)雜的150幅圖片作為測試數(shù)據(jù),盡可能的包含了文本提取過程中可能出現(xiàn)的情況。實(shí)驗結(jié)果為:正確率80.31,錯誤率11.23,遺漏率10.57。出現(xiàn)錯誤和遺漏情況的原因是圖像的分辨率太低或背景與文本區(qū)域比照度太校局部實(shí)驗結(jié)果如圖3所示:圖3局部實(shí)驗結(jié)果本文介紹了一個從場景圖像中提取文本有效的方法。先通過模糊化處理進(jìn)展除噪,并對傳統(tǒng)的Laplaian邊緣檢測方法加以改良和二值化處理。通過對邊緣圖像的形態(tài)學(xué)運(yùn)算,去除了非文本區(qū)域。最后進(jìn)展連通域的分析,使得文本提取有較高的正確率。該方法較anny算子處理的結(jié)果具有非文本連通區(qū)域少、定位準(zhǔn)確等特點(diǎn)。但該方法在處理有光照等復(fù)雜背景的圖像時效果不理想,閾值的依賴性較強(qiáng),因此在設(shè)計算子和選取有效的閾值方法上需要進(jìn)一步研究。1章毓晉.圖象處理和分析根底.高等教育出版社.20012崔瑩瑩,楊杰,梁棟.基于邊緣的標(biāo)志牌文本提取方法.影像技術(shù).20223王鄭耀.數(shù)字圖像的邊緣檢測.西安交通大學(xué)出版社.20024張引.復(fù)雜背景下文本提取方法研究與應(yīng)用.浙江大學(xué)博士學(xué)位論文.19995何斌,馬天予,王運(yùn)堅等.Visual+數(shù)字圖像處理.人民郵電出版社.20016

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論