版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、基于單義域鄰接圖的工程圖紙掃描圖象的字符提取 摘要 工程圖紙掃描圖象的圖文分割是一個重要問題。本文在構(gòu)建單義域鄰接圖基礎(chǔ)上來提取字符及其特征。圖文分離先從單義域中篩選字符筆劃域,進行初步分離。然后,以字符筆劃域為起點,遍歷鄰接圖來搜索鄰接字符筆劃域,提取字符域,分析特性作進一步篩選。以字符域鄰近與共線為判據(jù)來組合字符串域,字符域鄰近是用其外接膨脹矩形相交來判定。利用共串字符域外接矩形中心及所附圖形對字符域進行定向。對非水平字符域旋轉(zhuǎn)至水平,并構(gòu)建其單義域鄰接圖,以表達幾何與拓撲特征,為后續(xù)識別作準備。實例表明,本算法可以較好地處理字符與圖形的粘連問題,提取效果很好,且能夠描述字符整體特征。1
2、引言工程圖紙掃描圖象的識別與理解是目前學術(shù)界和工程界研究的熱點,在機械、電子、建筑及地理信息系統(tǒng)等應(yīng)用領(lǐng)域中具有重要的實際意義。圖樣中有兩部分信息,一是圖形,由幾何圖素組成,用來表達產(chǎn)品形體;二是文字,用來定義產(chǎn)品尺寸及描述其它信息,有的附于圖形,如尺寸數(shù)字等,也有獨立存在的,如技術(shù)要求等。文字是圖樣中非常重要的信息。因此,工程圖紙掃描圖象的字符提取與識別是一個重要問題,對進一步的尺寸理解、圖像理解等高層次理解都有較大作用。工程圖樣中的文字包括多種字符,如漢字、數(shù)字、字母及符號等。字符情況較為復(fù)雜,有自己的一些特點:字符多為手寫,具有一定的隨意性,不同于印刷體;具有多種方向,不僅有水平書寫,而
3、且有的垂直放置,還有其它各種角度的斜向;有直體與斜體;有時字符與字符及圖形粘連,增加了圖文分割及字符提取的難度;位置分散,大小不一。上述情況在字符的分割及識別時都必須考慮。所以,工程圖樣字符提取及識別是一個十分困難的問題。鑒于工程圖樣字符的特點,其處理方法與光柵文檔具有很大差別,一般的處理過程是:先標識連通體,從中選出字符域,再根據(jù)字符域鄰近和共線來生成字符串域,并判斷方向,然后分割字符域,最后進行字符識別及校正。經(jīng)過多年研究,工程圖樣字符的分割及識別算法已有多種:一是基于連通體1;二是基于輪廓跟蹤2,利用同步邊緣特性檢測進行輪廓跟蹤,分離字符輪廓,采用鄰域搜索來生成字符串,最后通過分類樹進行
4、字符識別,并根據(jù)專業(yè)知識作校正;三是行程編碼匹配法3,采用圖分割集方法來分割與字符及圖形粘連的字符。本文提出一種基于單義域鄰接圖的圖文分割方法,在二值圖象水平黑游程編碼基礎(chǔ)上,以相關(guān)游程線寬和拓撲的一致為約束生成條形域,對其中多義域作分裂獲得單義域:線段域和圓弧域,并建立其鄰接圖。字符筆劃可以表示為一個或多個單義域。字符筆劃的長度較小,線寬一致。根據(jù)這些特點,從單義域中篩選字符筆劃域,進行初步圖文分離。字符筆劃多是鄰接的,以字符筆劃域為起點,通過遍歷鄰接圖搜索鄰接的字符筆劃域,來提取字符域。字符結(jié)構(gòu)與圖元差別較大,根據(jù)字符域特性實現(xiàn)字符進一步篩選。采用字符域外接矩形來標識字符的大小和位置。根據(jù)
5、字符域外接矩形相交來判定字符鄰近,再加上字符共線為判據(jù)來生成字符串域。圖樣中字符串多是附于圖形的,單義域可以很容易獲取方向,即可得圖形方向。利用共串字符外接矩形中心及所附圖形對字符進行定向。然后將非水平字符域旋轉(zhuǎn)至水平,并重新進行水平黑游程編碼,以單義域鄰接圖來表達字符的結(jié)構(gòu)特征,為后續(xù)識別作準備。下面進行詳細介紹。2 圖象的單義域鄰接圖描述在工程圖形中,既有圖元又有字符。圖元有多種,如線段、圓弧、圓、箭頭等,而且圖元多為相交。不同圖元需要用一種結(jié)構(gòu)來統(tǒng)一描述,然后通過分析其幾何與拓撲特征確定類型來進行矢量化。交點信息對提取同一圖元及不同圖元之間拓撲關(guān)系具有重要指導(dǎo)意義。字符是由筆劃組成的,在
6、提取筆劃的基礎(chǔ)上進行識別是一種很好的方法。但筆劃的提取難度較大?,F(xiàn)有對圖樣字符的識別多是處理數(shù)字和字母,較少涉及漢字,而我國圖紙均有大量漢字信息,還有數(shù)字及字母等。因此,需要建立一種模型,既能表達幾何數(shù)據(jù),還可以描述拓撲關(guān)系,便于各種特征提取?,F(xiàn)有圖文分離算法多是以象素為單元,進行連通體生成。而連通體對后續(xù)識別貢獻較小,尤其是對圖元的識別。這就要求采用一種模型能夠統(tǒng)一描述圖形和文字的幾何與拓撲信息。基于單義域鄰接圖的描述模型,可以統(tǒng)一描述圖元和文字,不但能提取圖元,還為字符識別的筆劃特征提取提供啟發(fā)。下面給出單義域鄰接圖的建立方法。對圖象作水平黑游程編碼,這時對圖象的分析單元由象素變?yōu)橛纬?,?/p>
7、程連通性反映了圖形拓撲關(guān)系。如圖1.b所示。通過分析游程的拓撲關(guān)系,可以獲取具有轉(zhuǎn)折意義的游程4。這些關(guān)鍵游程為圖元分割提供線索。相關(guān)游程基于寬度和拓撲一致性可以聚合為一個集合,來表達某一幾何與拓撲意義,稱之為條形域。條形域具有較強的整體性和宏觀性5。但是,有的條形域具有多義性,即由線段域和圓弧域組成,對多義域需作分裂得單義域。這時,圖象的表達單元變?yōu)閱瘟x域,如圖1.c所示。而單義域首末游程的拓撲則表達了單義域的拓撲關(guān)系。單義域鄰接圖可以完整地表達圖象中圖元與字符的幾何與拓撲信息。如圖2所示。3 字符提取圖文分離算法已有多種,主要是基于連通域。多數(shù)字符是一個連通域,數(shù)字、字母及漢字多是連通的,
8、或是由幾個連通域構(gòu)成的,而且字符域具有許多與幾何圖元域不同的特征。在實際中多以象素八鄰域來進行字符提取,且輔以多種字符屬性判斷,確認是字符域而不是圖形域,并生成其最小外接矩形,用以標識字符域的大小與位置。上述算法主要是分析連通域的特征來確定字符,在生成連通體時,對于圖文粘連情況,勢必形成一體,需要后續(xù)分割或造成圖文誤分。這主要是因為在形成連通體時只是基于象素。如果能夠在確定筆劃域的基礎(chǔ)上進行圖文分割及字符提取,則毫無疑問會提高分割及提取效果。根據(jù)制圖規(guī)則,圖樣中的漢字、數(shù)字、字母的字體均有規(guī)定,在一定掃描率下,可以確定字符的范圍閾值,從而確定字符筆劃的長度,而字符筆劃線寬又是基本一致的,根據(jù)這
9、兩個條件從單義域中選取字符筆劃域。鄰接的字符筆劃域為一個字符,或是一個字符的部分筆劃。字符提取是以字符筆劃域為基礎(chǔ)的,遍歷鄰接圖搜索鄰接的字符筆劃域來完成。下面給出具體算法:(1)取出未訪問字符筆劃域,設(shè)為當前域,新建字符域及其外接矩形,將當前域插入字符域。(2)如果當前域無鄰接的可訪問域,則轉(zhuǎn)到(4),否則,取當前域鄰接的未訪問字符筆劃域,設(shè)為當前域,插入字符域,字符域外接矩形生長。(3)返回(2)。(4)得一字符。字符結(jié)構(gòu)與圖元差別較大,根據(jù)字符域特性1實現(xiàn)字符進一步篩選。圖3.a給出圖1.a的字符提取結(jié)果,采用外接矩形標識。 4 字符串生成工程圖紙中字符多以串的形式存在,組成字符串來表達
10、語義。分析字符的字符串歸屬能夠為字符識別提供方向及上下文等信息。由于圖樣字符的多向性,字符的方向確定也需從字符串中獲取。對于小象素群究竟是小數(shù)點還是噪聲,只有置身于字符串的上下文中才能作出正確判斷。因此,字符串的組合是繼字符提取之后的必然要求。字符串成組通常采用的方法有兩種,一種是利用Hough變換進行共線檢測6;另一種是相鄰檢測,即字符串的生成就是將鄰近字符組合在一起。第二種方法有多種作法:一種是以字符外接矩形的中心距為判據(jù)的,與某一閾值作比較,若小于閾值則將其歸為同一字符串。一般先進行水平、垂直兩個方向字符串搜索,再進行斜方向,以字符外接矩形的中心距為判定值,對不同方向采用不同閾值2。另一
11、種是以字符外接矩形的角點距為判據(jù)的,與某一閾值作比較,若小于閾值則將其歸為同一字符串7。閾值與方向的關(guān)系較大,有時需要同時處理多種情況。上述方法即使對同一字體由于方向不同(水平、垂直、斜向)需采取不同閾值,對方向較為敏感。本文采用一種矩形求交方法來進行字符鄰近判斷,可以較好地解決字符鄰近判斷問題,無需預(yù)先設(shè)定方向。4.1字符組合在圖樣中,不同大小文字之間的行列間距是不同的,文字列間距與其大小具有一定對應(yīng)關(guān)系。本文根據(jù)字符域外接矩形自適應(yīng)求得字間距,通過膨脹字符外接矩形,即字符外接矩形按字列間距擴大生成膨脹矩形,對膨脹矩形進行求交運算來判定兩個字符是否鄰近。同一字符串的字符不但是鄰近的,而且還應(yīng)
12、共線(第三個字符起)。下面給出字符組合步驟:(1)取出未訪問字符域i, 設(shè)為當前域,新建字符串域,將當前域插入字符串域。(2)如果當前域無鄰近且共線的可訪問域,則轉(zhuǎn)到(4),否則,取當前域鄰近且共線的未訪問字符域,設(shè)為當前域,并插入字符串域。(3)返回(2)。(4)得一字符串。圖3.b可以看出,矩形求交方法可以較好解決字符組合問題,在字符串的生長中無需預(yù)設(shè)方向。4.2字符串定向及旋轉(zhuǎn)工程圖樣中字符是多向的,其定向問題直接影響識別精度。字符串的方向為其書寫的基線方向。多數(shù)方法以字符中心連線來確定方向,但,如果字符較少,則誤差較大。在工程圖紙中,多數(shù)字符串附于圖形,尤其是線段,而其基線方向與其所附
13、線段的方向一致,如機械圖樣中的尺寸數(shù)字。由于采用單義域鄰接圖來描述圖象中圖形和文字,從單義域中可以很容易獲得圖形的方向信息。對于附于圖形的字符串定向,可以采用比較字符串中心線與所附線段來確定字符串的基線方向。如果字符串鄰近的某一單義域(線段域)的方向與字符串中字符域中心連線方向一致,則采用線段域方向作為字符串方向。而獨立字符串的定向問題可采用文獻1方法。對于水平字符串,可以直接取出每個字符進行識別。而對其它方向的字符串,需先對每個字符根據(jù)其方向旋轉(zhuǎn)至水平然后進行識別。圖3.b給出字符串標識。圖3.c給出旋轉(zhuǎn)后結(jié)果。5 字符單義域表示我國圖紙多是中西文混合,字符識別的特征提取必須考慮漢字特點,筆
14、劃特征明顯。字符識別的特征提取方法很多,如果能夠提取筆劃,則必定會大大提高識別效果8。采用單義域鄰接圖可以較好地提取、表達字符的幾何與拓撲信息。圖4給出字符單義域表示實例。6 結(jié)束語本文采用單義域鄰接圖來表達圖象信息,在確定筆劃域的基礎(chǔ)上進行圖文分割及字符提取,整體性很強。本研究算法已被應(yīng)用于我們開發(fā)的工程圖紙掃描圖象識別與理解系統(tǒng)之中,字符提取效果較好。但仍需進一步完善,研究各種復(fù)雜情況,以提高字符及其筆劃特征提取精度,尤其是研究各種結(jié)構(gòu)漢字,進行以筆劃為基礎(chǔ)的中西文識別。參考文獻1 鄒榮金,蔡士杰,張福炎等. 字符粘連及字線相交的分割與識別方法. 軟件學報,1999,10(3):241-2
15、472 胡友蘭,黃樹槐,常明. 工程圖中字符分離和標注字符串生成技術(shù). 華中理工大學學報,1997,25(3):30-333 陳勇,朱林,常明. 工程圖中粘連字符的提取與分割. 華中理工大學學報,1996,24(4):23-264 S. Di Zenzo, L. Cinque, and S. Levialdi. Run-Based Algorithms for Binary Image Analysis and Processing. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1996,18(1):83-89
16、5 王金鶴. 基于條形域結(jié)構(gòu)的掃描圖樣識別理論與方法研究(博士學位論文). 大連,大連理工大學,1999.66 江早,劉積仁,劉晉軍. 工程圖紙圖象圖文自動分割工具SegChar. 軟件學報,1999,10(6):589-5947 李偉青,彭群生. 一種新的字符提取和組合算法. 工程圖學學報,1997,No.2-3:38-458 L. Y. Tseng and C. T. Chuang. An efficient Knowledge-Based Stroke Extraction Method for Multi-Font Chinese Characters. Pattern Recogni
17、tion, 1992, 25(12): 1445-1458An Algorithm of Extracting Characters from Scanned Image of Engineering Drawings Using Primitive Region Adjacency Graph Abstract It is a important issue how to separate text from scanned image of engineering drawings. The paper presents an algorithm to extract characters
18、 and their features from images using Primitive Region Adjacency Graph. We can easily get character stroke regions from primitive regions. At start of a character stroke region, a character region grows by traversing the graph for adjacent character stroke regions. After analyzing features of character regions, we can get real character regions. A string can be got through combining those near and collinear character regions. If rectangles inflated of two character regions are intersected, they are near. The direction of a str
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度環(huán)保監(jiān)測軟件個人開發(fā)服務(wù)合同范本4篇
- 二零二四年度中小企業(yè)擔保合同3篇
- 2025年大數(shù)據(jù)平臺建設(shè)入股分紅合同3篇
- 2025年度高速公路大理石隔音屏障施工合同3篇
- 2025年度汽車租賃行業(yè)數(shù)據(jù)分析與應(yīng)用合同4篇
- 2025年度商業(yè)綜合體戶外攤位租賃及商業(yè)推廣合同4篇
- 二零二五年度電梯安裝工程安全防護與應(yīng)急救援合同4篇
- 2025年度個人股權(quán)贈與合同范本(詳細條款)3篇
- 2025年個人長途客運合同規(guī)范文本4篇
- 2025年度個人住房抵押貸款合同規(guī)范2篇
- 定額〔2025〕1號文-關(guān)于發(fā)布2018版電力建設(shè)工程概預(yù)算定額2024年度價格水平調(diào)整的通知
- 2024年城市軌道交通設(shè)備維保及安全檢查合同3篇
- 【教案】+同一直線上二力的合成(教學設(shè)計)(人教版2024)八年級物理下冊
- 湖北省武漢市青山區(qū)2023-2024學年七年級上學期期末質(zhì)量檢測數(shù)學試卷(含解析)
- 單位往個人轉(zhuǎn)賬的合同(2篇)
- 電梯操作證及電梯維修人員資格(特種作業(yè))考試題及答案
- 科研倫理審查與違規(guī)處理考核試卷
- GB/T 44101-2024中國式摔跤課程學生運動能力測評規(guī)范
- 鍋爐本體安裝單位工程驗收表格
- 高危妊娠的評估和護理
- 2024年山東鐵投集團招聘筆試參考題庫含答案解析
評論
0/150
提交評論