工程圖紙矢量化發(fā)展現(xiàn)狀報告_第1頁
工程圖紙矢量化發(fā)展現(xiàn)狀報告_第2頁
工程圖紙矢量化發(fā)展現(xiàn)狀報告_第3頁
工程圖紙矢量化發(fā)展現(xiàn)狀報告_第4頁
工程圖紙矢量化發(fā)展現(xiàn)狀報告_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

工程圖紙識別技術(shù)研討

開展情況匯報

1報告內(nèi)容研討意義開展現(xiàn)狀根本技術(shù)問題現(xiàn)有技術(shù)手段未來能夠的著力點2研討意義工程圖是工程技術(shù)人員描畫設(shè)計的對象、表達設(shè)計思想的主要工具。現(xiàn)有的工程圖紙是長期以來人類智慧和勞動成果的結(jié)晶,據(jù)國際數(shù)據(jù)與文檔管理雜志估計,在全世界現(xiàn)有的80億張工程圖紙中,超越85%以上是人工繪制的。但是,如今工程圖紙繪制的技術(shù)主要是運用計算機來進展繪制,運用CAD技術(shù)。3在大多數(shù)領(lǐng)域,勝利運用過的工程圖紙就是一種珍貴的技術(shù)貯藏資源,除了運用于當時工程的指點,也是以后對產(chǎn)品進展再設(shè)計、維護,以及對于提高產(chǎn)品設(shè)計質(zhì)量、降低設(shè)計本錢及縮短產(chǎn)品設(shè)計周期具有不可估量的作用。CAD技術(shù)可以極大地提高圖紙的消費和運用效率,當我們想像運用CAD技術(shù)那樣來高效地利用以前的手繪圖紙時,這中間需求一個轉(zhuǎn)化技術(shù),以及一些更加智能的協(xié)助[1]。4開展現(xiàn)狀從80年代中期起,很多工業(yè)興隆國家就開場著手圖紙輸入這一任務(wù)。起初方法是運用某種CAD系統(tǒng)經(jīng)過人機交互重畫一遍一切的藍圖,這樣可以使得圖面美觀一致,尺寸比例準確。但是這種方法效率很低,繪制價錢昂貴,任務(wù)既繁瑣又枯燥無味,呵斥人力物力資源的浪費。5近假設(shè)干年來,CAD技術(shù)在工程設(shè)計領(lǐng)域得到普及性運用,從而使工程圖紙矢量化技術(shù)的研討進入高潮。目前國外己經(jīng)出現(xiàn)了一些商品化的矢量化軟件,比較著名的有德國Softelec公司的VPStudio/VPRasterPro,Able公司的R2V,挪威Rasterex公司的RxAutolmagePro2000,,華中科技大學的EDIS軟件、清華大學的ANNO等。這些軟件在一定程度上可以進展圖紙的矢量化,但是它們通常都是針對某種專業(yè)圖紙,如機械圖紙、電子圖紙或地圖等,而且矢量化的準確率也不是很高,例如對于交叉點多而復雜的圖紙,軟件自動跟蹤時能夠會出現(xiàn)錯誤走向。6根本問題圖像獲取與處置圖紙圖像的矢量化根本圖元和文字符號的識別工程圖形的2D了解面向工程圖形的二維重建7工程圖紙識別的根本過程預處理矢量化圖文分離圖形識別圖形重建8圖像的獲取與預處置由于工程圖紙普通較大,所以大多數(shù)情況下運用掃描儀掃描工程圖紙,最后將位圖格式的文件保管到計算機中。圖像預處置的質(zhì)量直接影響到后續(xù)任務(wù),但在這個領(lǐng)域,技術(shù)相對成熟,根據(jù)工程圖紙的特性主要用到的圖像處置技術(shù)是消藍處置〔濾色〕、圖像去噪,邊緣提取。9由于工程圖紙在存放的過程中容易產(chǎn)生褶皺等損壞,圖紙上難免會出現(xiàn)一些非繪制的圖像元素,運用高斯濾波,中值濾波,以及數(shù)學形狀學的方法都可以在一定程度上消除噪聲,改善圖像質(zhì)量。由于工程圖紙的特性,在矢量化之前,經(jīng)過邊緣提取處置的圖像最接近于矢量圖,也最容易進展矢量化處置。這里適用的方法主要有Canny、Sobel、數(shù)學形狀學、頻域變換〔傅里葉、小波等〕等方法進展處置[2]。10圖紙圖像的矢量化[3]基于細化的矢量化方法基于輪廓匹配的矢量化方法基于鄰接圖的矢量化方法正交方向搜索法11智能算法在控制工程領(lǐng)域中有比較勝利的運用如模糊控制、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)等,表現(xiàn)出非常好的魯棒性、自順應性以及靈敏的可擴展性。在矢量化的過程中可以處置較復雜的情況。模擬人工讀圖的的方式來進展矢量化的過程可以使機器具備一些“常識〞,先從整體上把握圖紙的宏觀特征然后由粗到細由拓撲構(gòu)造到詳細線型準確有效地把握圖紙中各類線型之間的相互關(guān)系直接從圖像中提取出各類圖元[4]。12圖文分別技術(shù)圖形雖然是工程圖紙中最為重要的信息,但是假設(shè)短少了一些必要的文字描畫,工程圖也將變成不可了解的圖像,也無法用于工程指點。這其中主要有圖源,圖紙類型標注,作者,尺寸標注,資料標注等。這些文字描畫,對于快速運用工程圖紙進展消費、修正、產(chǎn)品維護、查詢等起著至關(guān)重要的作用。工程圖紙自動化識別中有必要運用OCT技術(shù)將工程圖標的信息提取出來[5]。13工程圖形2D重建圖形經(jīng)矢量化處置后,圖素的尺寸和圖素間的拓撲關(guān)系都會產(chǎn)生一定誤差,為了使識別結(jié)果與各種CAD軟件繪制圖形的效果相近,提出對矢量圖實施“二維重構(gòu)〞。包括兩部分[6]:

圖形結(jié)構(gòu)拓撲校正圖形輪廓的精確尺寸校正14工程圖紙二維重建的前提是根本圖形元素的識別,根本可以分為兩大類[7][8][9][10]:基于統(tǒng)計的方法和基于知識表示的方法。大多數(shù)基于統(tǒng)計的識別方法,圖形對象的特性是被事先定義的,然后設(shè)計一個運用邊境斷定的分類器來進展空間特性的決策。最典型的是模版匹配方法。基于知識的識別方法,是將圖形對象表示為一些知識,比如規(guī)那么或語法,依此來對圖形對象識別。對具代表性的是知識構(gòu)造表示與推理和知識語法的方法。15圖素的拓撲類型直線圖素與其他類型的拓撲關(guān)系圓弧圖素與其他類型的拓撲關(guān)系 根據(jù)現(xiàn)有的兩大類識別方法,以及工程圖紙本身拓撲關(guān)系約束的特點。統(tǒng)計類識別方法較適宜用于數(shù)目多,構(gòu)造簡單的工程圖識別。知識表示方法,由于知識推理方便,易于表達拓撲約束關(guān)系,在圖形對象多而復雜的情況下較適宜。16 圖形拓撲關(guān)系表示的中不乏有各種新意的表示方法,但是運用最多也是最有效的表示方式就是運用圖。 工程圖紙本身就是一張圖,而且圖紙當中很多的圖形基元或整體相對于根本圖元〔直線、圓弧、圓、工程標注符號〕就類似于一張有著很強拓撲關(guān)系的圖。所以用圖來表示工程圖紙中的根本圖元是目前最流行的表示方法。而且在CAD繪圖中,根本的繪制操作〔除了圖元的修正〕都非常類似于對圖這種數(shù)據(jù)構(gòu)造的操作。17將工程圖中的每個圖素作為“圖〞的頂點,兩個頂點之間的關(guān)系可用弧來表示,屠蘇見的拓撲關(guān)系用權(quán)值來表示,將其數(shù)值化。根據(jù)事先定義的圖素間關(guān)系來選擇有向圖或無向圖。圖的儲存普通運用鄰接表[6]。

18圖素的拓撲關(guān)系表示模型是一種動態(tài)表示模型,普通對該模型進展如下操作[6]:添加結(jié)點:圖素添加,添加結(jié)點,并添加該節(jié)點所對應的關(guān)系。刪除結(jié)點:圖素被刪除,減少結(jié)點,并在與其有拓撲關(guān)系的表中刪除該結(jié)點。查詢:在帶權(quán)圖的中找到該圖素對應的結(jié)點,并提取該節(jié)點對應的鄰接表。結(jié)點拓撲關(guān)系修正:當拓撲關(guān)系變動時,對圖素結(jié)點的鄰接表重寫,及向與改圖素有拓撲關(guān)系的其他圖素的鄰接表中添加該圖素結(jié)點。19拓撲校正處置有了前面拓撲關(guān)系的正確表示,根據(jù)識別結(jié)果,對圖形對象進展矯正[6]。主要方法有:

剪切和延伸平移和擴展歸并20尺寸校正處置[6] 這一階段的前提也是正確識別尺寸標注線。在工程圖紙中的尺寸有各種類型,如程度尺寸,斜向尺寸,直徑尺寸,角度尺寸。尺寸標注的構(gòu)造相對簡單,都是矢量箭頭和表示尺寸的字符組成,同時很多情況下,尺寸標注,尤其是長度的表示,有很強的層次關(guān)系。所以可以采用樹類數(shù)據(jù)構(gòu)造來保管。每個方向的尺寸可以構(gòu)成一顆樹,一切方向的樹可以構(gòu)成森林。從而處理不同視圖間尺寸表達一致的的問題21樹的根節(jié)點為與根節(jié)點相連的葉子節(jié)點的尺寸基準,樹的每個節(jié)點都以他的父節(jié)點的一個尺寸界限作為它的基準。校正時,都是以基準所在的一段為固定端,而一零一段為活動端,堅持固定端不動,校正活動端到相應的位置。其中主要過程有生成尺寸樹,確定約束域,定義約束屬關(guān)系,圖形元素及尺寸標注的準確位置校正。22相關(guān)任務(wù)1[11]來自印度的學者SekharMandal采用了比較系統(tǒng)的圖像處置方法來進展工程圖紙的重建,詳細流程如下:1.運用OCR類軟件將圖中一切字符探測出,進展圖文分別任務(wù)。2.運用Canny邊緣提取算法,將光柵圖中一切的輪廓表示出來,二值化處置之后就將整幅圖的骨架細化出來。233.采用數(shù)學形狀學中的開啟運算來提取特定方向的的圖形元素;采用1×4的構(gòu)造元素來提取程度線段,4×1的構(gòu)造元素來提取垂直線段用原圖將提取出來的兩幅圖減掉,就可以得到其他恣意方向上的線段和弧線。4.采用鏈式碼〔行程編碼〕的方式將圖中的一切點陣圖表示出來,運用和弦特性將圖中一切的直線判別出而且一切的弧線被當成是多個小線段組成,記錄線段的拐點。提取后的程度線段提取后的垂直線段245.利用鏈式碼信息來構(gòu)建矢量格式圖。然后,根據(jù)兩線段之間相間間隔的關(guān)系來判別兩條直線能否屬于原來同不斷線的兩條邊緣,設(shè)定閾值進展判別

假設(shè)兩條直線滿足閾值限定,就將兩條線段間的部分進展填充,從而進展矢量圖的重建。重構(gòu)圖形的閾值化斷定過程以及重構(gòu)線寬信息25相關(guān)任務(wù)2.1[7][8][9]識別領(lǐng)域比較有代表性的任務(wù)就是香港城市大學——劉文印運用基于知識表示的識別方法。首先,在預處置階段,運用開源軟件Res2Vec進展矢量化,然后運用閾值去噪的方法去除被判別為噪聲的小短線。其次,定義了四種拓撲關(guān)系,分別為直線的相交、平行、垂直〔不相交〕以及弧線與直線;分別都有準確量化了的參數(shù)來表示。26再次,提出了一種屬性樹的知識表示方法;同時,提出了KAA(KnowledgeAcquisitionAlgorithm)——用于知識提取與表示和KGRA(KnowledgeGraphRecognitionAlgorithm)用于知識推理與識別。KAA的根本流程如下:27KAA算法描畫:輸入:組成圖形對象的向量集(用戶提供的例如)。輸出:圖形化知識〔一顆儲存著每兩個結(jié)點間的幾何約束關(guān)系和訪問順序的樹〕流程:1.提取一切的相交幾何約束關(guān)系同時構(gòu)造屬性樹G(V,E);2.假設(shè)G是連通的,轉(zhuǎn)到第6步;3.將G分割成G1,G2,G3……Gn顆連通的子樹;4.搜索節(jié)點間可以將字數(shù)銜接起來的平行和垂直關(guān)系;5.假設(shè)上述關(guān)系找到了就將它們參與G,同時轉(zhuǎn)到第2步,否那么停頓〔F〕。6.參與弧線和圓的拓撲關(guān)系到圖中;7.在G的根底上構(gòu)造生成樹ST,用廣度優(yōu)先的原那么遍歷ST,獲取約束順序K(c1,c2……cn);8.停頓(S),同時將G和K作為這種對象的知識儲存到知識庫中。28由于在識別過程中不能夠?qū)⑾蛄亢鸵延械闹R表示100%的匹配,所以定義了關(guān)于直線和直線,弧線和弧線以及由直線構(gòu)成的類弧線之間的類似因子的定義。KGRA算法描畫如下:輸入:SV:向量集〔構(gòu)成待識別對象的向量集〕KD:知識庫TL:閾值集,其中包含了長度和數(shù)量的容忍范圍變量:CT:識別過程中暫時構(gòu)造的的樹SM:標識集〔用來標識識別過程中被運用過的向量〕輸出:RR:識別結(jié)果——用SV來表示的圖形對象的類型。29算法過程:1.從KD當中選擇知識樹K,假設(shè)一切的知識都曾經(jīng)實驗過就停頓〔F〕2.清空CT,初始化SM3.從SV中選擇下一個向量V,要求這個V真實沒有在SM中被標注的。參與V到CT中作為根;同時,將V在SM中標注,表示V曾經(jīng)在識別過程中運用過了。4.從遍歷順序K中選擇下一條邊E。假設(shè)一切的邊曾經(jīng)被訪問過了,而且冗余向量的個數(shù)沒有超越容忍限制,就停頓〔S〕,同時將RR標示為由當前K來指示的對象類型5.否那么,將V標志為以E為邊的父節(jié)點,運用V和E來計算V’6.搜索V〞,在空間上沿著兩個方向搜索,運用TL中的容忍限制來檢測在SV中與V’類似的向量。7.假設(shè)V〞找到了,就將它設(shè)為CT中V的子節(jié)點,在SM中將V〞標志為已運用過,同時轉(zhuǎn)到第4步8.假設(shè)沒有找到V〞,而且向量的缺損數(shù)量超越了容忍的范圍,就轉(zhuǎn)到第1步,否那么轉(zhuǎn)到第4步30由于目前完全由計算機進展識別還不能到達較高的精度和理想的了解結(jié)果,往往在經(jīng)過一些幾何變換〔尺寸、方向、圖層交疊等〕之后,就不能得出很好地識別結(jié)果。這時需求用戶交互的來審查正確、錯誤、脫漏這樣的識別結(jié)果。給出新的指點來引導知識庫的更新;知識庫的更新,最直接的表達就是對其中閾值庫〔或容忍庫〕中關(guān)于長度、角度、向量個數(shù)的閾值范圍進展動態(tài)的調(diào)整。在用戶給與反響之后系統(tǒng)將根據(jù),正確識別堅持原有閾值,脫漏識別更新閾值,錯誤識別被忽略掉的原那么進展閾值調(diào)整。這樣就是整個系統(tǒng)構(gòu)成一個閉環(huán)反響來提高系統(tǒng)性能。31相關(guān)任務(wù)2.2[10]清華大學的——郭田田,在劉文印任務(wù)的根底上進展了進一步的開展[16]。主要創(chuàng)新點如下:1.把注釋作為一種新的根本圖素,由此主要圖素分為三大類:直線、弧線和文本;并且由此定義了五種拓撲關(guān)系:直線相交、直線平行、直線與圓弧、直線與文本、圓弧與文本。2.在知識提取和識別的階段都設(shè)置了優(yōu)先級,優(yōu)先級概念的引入提高了知識提取和識別的效率。在知識提取階段,按照統(tǒng)計數(shù)據(jù)顯示,按照直線相交-直線平行-直線與圓弧-直線與文本-圓弧與文本這樣由高到低的優(yōu)先級來提取拓撲關(guān)系,這樣可以節(jié)約大量的計算時間。知識提取過程與劉文印類似。32識別的過程中,根本思緒和劉文印非常類似,但是運用了優(yōu)先級的概念,可以提高識別效率。作者以為,一個圖形對象假設(shè)特征越明顯,由于其差別大,所以在統(tǒng)計上的特性就是分布的比較少,所以在識別階段,搜索根本圖素的優(yōu)先級就由統(tǒng)計分布特性少到多,優(yōu)先級由高到低。這樣,首先開場搜索特征明顯的部分,假設(shè)在沒有用到優(yōu)先級最低的一級就可以將目的識別出來,就可以節(jié)省大量的計算時間,同時也在一定程度上降低了搜索目的時的復雜度。在本文中識別過程的優(yōu)先級正好和知識提取階段相反:文本與圓弧-文本與直線-弧線與直線-直線平行-直線相交的順序又高到低進展探測。333.反復方式的預處置在工程師繪圖的過程中,在規(guī)范允許的范圍內(nèi),不用的繪圖工程師能夠會有不同的繪制風格,一樣的事物在人看來被歸為一類,而對于對一切認知事物都準確表示的機器來說就被歸到不同的分類,例如:以上兩幅圖都代表樓梯,但是由于在樓梯的表示中平行的線條樹木不一樣,在機器看來就是分為兩類,由此我們可以想到,反復方式的表示雖然符合規(guī)范,但是會導致大量識別結(jié)果的冗余分類。所以作者將反復方式處置為實踐關(guān)系塊:在實踐關(guān)系塊的處置中,只保管第一個和最后一個圖素的拓撲關(guān)系,來代表所包含的塊中的表現(xiàn)方式。從而使識別過程具有一定的智能性。34相關(guān)任務(wù)3[12][13]南京大學——路通,運用約束網(wǎng)絡(luò)來進展識別。其主要特征有:1.運用了更加準確地特征表示方法,初步的有定義了CGF(CommonGraphicsFeature),其中有根本圖素、屬性、關(guān)系、優(yōu)先級、閾值范圍這5個屬性來描畫一個圖形對象。為了提高識別效果和表達出大類與小類的層次關(guān)系,在CGF的根底之上定義了定義了靜態(tài)特性,其中包括:積極特性、消極特性、輔助特性和關(guān)系。前三個特性都是CGF集,關(guān)系描畫的就是這三個集中兩兩之間的關(guān)系。作者同樣采用了優(yōu)先級戰(zhàn)略來對識別匹配過程中的候選特性進展排序,表示為文本-圓-弧-直線這樣由高到低的優(yōu)先級。2.用戶初始化系統(tǒng)階段對將要識別的工程圖設(shè)定領(lǐng)域知識背景。在作者看來,由于規(guī)范不同沒有一種規(guī)那么是一切工程圖紙之間共有的,所以指定領(lǐng)域知識可以將識別率提高。353.表述拓撲關(guān)系時,作者運用字符號表示,其間可以運用+、!、>、&、|、〔等計算機運算符號進展銜接,這樣,規(guī)那么都是以字符串的型式表現(xiàn)的。到了識別的時候,就會轉(zhuǎn)化稱約束網(wǎng)絡(luò),進展逐漸的測試

約束網(wǎng)絡(luò)中每個節(jié)點都是根據(jù)約束條件建立的測試函數(shù),每個節(jié)點得到的測試結(jié)果是一個布爾值。4.建立一個指明領(lǐng)域的規(guī)那么庫,規(guī)那么庫在識別的過程中動態(tài)的調(diào)整規(guī)那么構(gòu)成、規(guī)那么候選排序、自動閾值調(diào)理;而且,將人機互動的調(diào)整,和機器自動識別結(jié)果的調(diào)整分別對待。5.將文字的語義了解結(jié)果和圖形對象的識別過程交融起來,使之成為同時進展的互動指點過程,而不是簡單地進展圖文分別和圖形識別這樣順序且分別的過程。36現(xiàn)存問題[3][4]缺乏對工程圖建立完好意義的信息表示方法,表達才干不是足夠的強。工程圖進展了解的針對性強的領(lǐng)域知識還不能給予準確地表示。對工程圖進展了解的實施表達方法才干還不是非常強。缺乏對工程圖進展深層次了解的有效的實現(xiàn)方法。只能處置單張圖紙內(nèi)容。37未來展望提高圖像預處置質(zhì)量,采用更加有效的去噪、重建和圖像分割算法;從而提高矢量化的結(jié)果,減少重建時的難度。運用一種評價機制,減少誤校正發(fā)生。提高知識表示才干,開展公用性更強的圖形了解知識系統(tǒng)。加強專業(yè)領(lǐng)域知識指點知識表示和推理,提高機器學習才干和圖形對象的識別才干。圖像重建時,可以將同一系列不同張圖紙之間建立聯(lián)絡(luò),從而進展成套產(chǎn)品重建。38參考文獻1.工程圖紙矢量化的研討與實現(xiàn)〔上海海運學院碩士論文〕,2004。2.數(shù)字圖像的邊緣檢測,陳啟祥,2006。3.工程圖紙矢量化方法研討,丁偉東,2006。4.工程圖紙識別與了解的研討現(xiàn)狀分析,董玉德,2006。5.AStudyonInformationExtractionMethodofEngineeringDrawingTables,RizaSulaiman(Malaysia),20216.基于質(zhì)量評價的矢量化工程圖后處置技術(shù)研討〔西北工業(yè)大學博士學位論文〕,2004。7.EngineeringDrawingsRecognitionUsingaCase-basedApproach,WenyinLiu,2003。8.InteractiveRecognitionofGraphicObjectsi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論