印刷體漢字識別及其MATLAB實現(xiàn)_第1頁
印刷體漢字識別及其MATLAB實現(xiàn)_第2頁
印刷體漢字識別及其MATLAB實現(xiàn)_第3頁
印刷體漢字識別及其MATLAB實現(xiàn)_第4頁
印刷體漢字識別及其MATLAB實現(xiàn)_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、印刷體漢字的識別及其MATLA實現(xiàn)0. 漢字識別研究的意義漢字已有數(shù)千年的歷史, 是中華民族文化的重要結晶, 閃爍著中國人民智慧 的光芒。 同時也是世界上使用人數(shù)最多和數(shù)量最多的文字之一?,F(xiàn)如今, 漢字印 刷材料的數(shù)量大大增加, 一些專業(yè)單位所接觸的印刷材料更是浩如煙海, 信息量 均是爆炸性增長。然而,漢字是非字母化、非拼音化的文字,因此,如何將漢字 快速高效地輸入計算機, 是信息處理的一個關鍵問題, 也是關系到計算機技術能 否在我國真正普及的關鍵問題, 更是傳播與弘揚中華民族悠久歷史文化的關鍵問 題。而且隨著勞動力價格的升高, 利用人工方法進行漢字輸入也將面臨經(jīng)濟效益 的挑戰(zhàn)。 因此,對于大

2、量已有的文檔資料, 漢字自動識別輸入就成為了最佳的選 擇。因此,漢字識別技術也越來越受到人們的重視。 漢字識別是一門多學科綜合 的研究課題,它不僅與人工智能的研究有關,而且與數(shù)字信號處理、圖像處理、 信息論、計算機科學、幾何學、統(tǒng)計學、語言學、生物學、模糊數(shù)學、決策論等 都有著千絲萬縷的聯(lián)系。 一方面各學科的發(fā)展給它的研究提供了工具; 另一方面, 它的研究與發(fā)展也必將促進各學科的發(fā)展。因而有著重要的實用價值和理論意 義。1. 印刷體漢字識別的研究印刷體漢字識別技術的發(fā)展歷程 計算機技術的快速發(fā)展和普及,為文字識別技術應運而生提供了必備條件。 加上人們對信息社會發(fā)展的要求越來越高,文字識別技術的

3、快速發(fā)展可想而知。 印刷體文字的識別可以說很早就成為人們的夢想。 印刷體漢字的識別最早可以追 溯到 60 年代,但都是西方國家進行的研究。我國對印刷體漢字識別的研究始于 70 年代末 80 年代初。 同國外相比, 我國的印刷體漢字識別研究起步較晚。 從 80 年代開始,漢字 ORC 的研究開發(fā)一直受到國家重視,經(jīng)過科研人員十多年的辛 勤努力,印刷體漢字識別技術的發(fā)展和應用,有了長足進步。印刷體漢字識別的原理分析及算法研究漢字識別實質是解決文字的分類問題 ,一般通過特征辨別及特征匹配的方法 來實現(xiàn)。目前漢字識別技術按照識別的漢字不同可以分為印刷體漢字識別和手寫 體漢字識別。印刷體漢字識別從識別字

4、體上可分為單體印刷體漢字識別與多體印 刷體漢字識別。印刷體漢字識別的流程如圖 1-1 所示:圖 1-1 漢字識別流程框圖印刷在紙張上的漢字 ,通過用掃描儀掃描或者數(shù)碼相機拍攝等光學方式輸入后得到灰度圖像(GraySCaIe image或者二值圖像(Binary image),然后利用各種 模式識別算法對漢字圖像進行分析 ,提取漢字的特征,與標準漢字進行匹配判別 , 從而達到識別漢字的目的。印刷體漢字識別技術主要包括預處理、特征提取、 匹 配識別和后處理等步驟。1.2.1 預處理在對原始圖像進行識別處理之前, 盡可能將干擾因素影響降低, 是非常有必 要的,也就是要先對原始采樣信號進行預處理。 預

5、處理通常包括去除噪聲、 版面 分析、二值化、傾斜校正、行列切分、平滑、歸一化、細化等。( 1 )版面分析它是指對印刷體文檔圖像進行分析,提取出文本、圖像圖形、表格等區(qū)域, 并確定其邏輯關系,并將相應的文本塊連接在一起。(2)二值化 將一幅具有多種灰度值的圖像變成白黑分布的二值圖像的工作稱為二值化 處理,二值化的主要目的是將漢字從圖像中分離出來。 通常的方法為先確定像素 的閾值,比較像素值和閾值的大小,從而確定為 1 或 0,這個二值化閾值的選取 較為關鍵。(3)傾斜校正 通過輸入設備獲得的圖像不可避免地會發(fā)生傾斜,這會給后面的行字分割、 文字識別等圖像處理與分析帶來困難,因此, 在漢字識別系統(tǒng)

6、中, 傾斜校正是圖 像預處理的重要部分。傾斜校正的核心在于如何檢測出圖像的傾斜角。(4)漢字切分 漢字切分的目的是利用字與字之間、 行與行之間的空隙, 將單個漢字從整個 圖像中分離出來。漢字的切分分為行切分和字切分 9 。(5)歸一化 歸一化也稱規(guī)格化, 它是把文字尺寸變換成統(tǒng)一大小, 糾正文字位置(平移), 文字筆畫粗細變換等文字圖像的規(guī)格化處理,并只對文字圖像進行投影。(6)平滑對數(shù)字圖像進行平滑, 目的是去處孤立的噪聲干擾,以平滑筆畫邊緣。平滑 在圖像處理中實質是一幅文字圖像通過一個低通濾波器, 去除高頻分量, 保留低 頻分量。(7)細化 細化處理是將二值化文字點陣逐層剝去輪廓邊緣上的點

7、, 變成筆畫寬度只有 一個比特的文字骨架圖形。 細化處理的目的是搜索圖像的骨架, 去除圖像上多余 的像素,從而在不改變圖像主要特征的前提下,減少圖像的信息量。1.2.2 漢字特征提取 預處理的最終目的是為了更加方便、準確地進行漢字的特征提取,從而提高 漢字識別率。對于漢字,其特征大致分為兩類,包括結構特征和統(tǒng)計特征,至今總數(shù)已經(jīng)不下百種。要做到有的放矢, 就需要研究已有的獲得良好效果的各種漢字特征, 分析它 們的優(yōu)點、 缺點和適用環(huán)境。 如下列出常用的一些的漢字結構特征和漢字統(tǒng)計特 征。1.結構特征(1)抽取筆畫法 抽取筆畫法是利用漢字由筆畫所構成的特點進行識別, 它利用漢字的結構信 息來進行

8、漢字的聯(lián)機識別,在印刷體和脫機手寫識別中,由于筆畫提取的困難, 結果不是很理想。(2)松弛匹配法松弛匹配法是一種基于全局特征的匹配方法, 它對輸入漢字作多邊近似, 抽 取邊界線段,將這些邊界線段組成臨近線段表, 然后用松弛匹配操作, 完成邊與 邊的匹配。這種方法利用彈性吸收漢字的變形,一個字只用一個樣本。(3) 非線性匹配法非線性匹配法是由TSUkUmO等提出的,用以解決字形的位移、筆畫的變形等 現(xiàn)象。此方法試圖克服從圖形中正確抽取筆畫的困難,以提高正確判別的能力。 2.統(tǒng)計特征(1) 筆畫復雜性( COmplexity Index) 筆畫復雜性指數(shù)是指文字筆畫的線段密度,其定義如下:Cx L

9、y / x(1-1)Cy Lx / y(1-2)式( 1-1)和( 1-2)中Cx、 Cy 一橫向和縱向的筆畫復雜性指數(shù);Lx 、 Ly 一橫向和縱向的文字線段總長度;x、 y 一橫向和縱向質心二次矩的平方根;C、Cy分別反應了橫向和縱向的筆畫復雜性,橫多的 CX大,豎多的Cy大。 筆畫復雜性指數(shù)與漢字的位移無關, 受字體和字號的影響較小, 但易受筆畫斷裂 和粘連的影響,且其分類能力較差,常與另一種粗分類方法“四邊碼”連用。(2) 四邊碼( Four-side Code)四邊碼是在漢字點陣圖的四周各取一條帶, 計算其中的文字圖像素點數(shù), 并 將它分成四級,構成一個四元組。 由于漢字邊框不但含有

10、豐富的結構信息, 而且 邊框部分筆畫一般較少,不易粘連, 抗干擾能力強, 但對漢字的位移和旋轉比較 敏感,與筆畫復雜性指數(shù)正好形成互補。(3)特征點 特征點提取算法的主要思想是利用字符點陣中一些有代表性的黑點 (筆畫)、 白點(背景)作為特征來區(qū)分不同的字符。 特征點包括筆畫骨架線的端點、 折點、 歧點和交點, 漢字的背景也含有一定的區(qū)別于其它漢字的信息, 選擇若干背景點 作為特征點, 有利于提高系統(tǒng)的抗干擾能力。 其特點是能夠大大壓縮特征庫的容 量,對于內部筆畫粘連字符,其識別的適應性較強、直觀性好,但不易表示為矢 量形式,匹配難度大,不適合作為粗分類的特征。(4)筆段特征 漢字是由筆畫組成

11、的, 而筆畫又由筆段組成,筆段可近似為一定方向、長度 和寬度的矩形段。 利用筆段與筆段之間的關系組成特征對漢字進行識別, 受字體 和字號的影響小, 對于多體漢字的識別獲得了良好效果。 其缺點是筆段的提取會 較為困難,匹配的難度大,抗內部筆畫斷裂或者粘連能力差。1.2.3 漢字識別分類1.相關匹配這是一種統(tǒng)計識別方法, 它通過在特征空間中計算輸入特征向量與各模板向 量之間的距離進行分類判決。(2)文法分析文法分析的基本思想是將輸入的漢字看作是一個語句或符號串, 將識別問題 轉化為判斷輸入的語句是否屬于某種語言, 即句子是否符合某種語言的語法約束 條件。3)松弛匹配無論是相關匹配還是文法分析, 都

12、要求輸入特征向量和模板特征向量的各分 量之間具有確切的對應關系, 然而在結構分析中, 往往事先難以確定兩者各分量 間的對應關系,此時可以采用松弛匹配法。松(4)人工神經(jīng)網(wǎng)絡漢字識別是一個非常活躍的分支, 不斷有新的方法涌現(xiàn)出來, 為漢字識別的 研究注入新的活力,其中基于人工神經(jīng)網(wǎng)絡的識別方法是非常引人注目的方向。 目前神經(jīng)網(wǎng)絡理論的應用己經(jīng)滲透到各個領域,并在模式識別、智能控制、 計算 機視覺、自適應濾波和信號處理、非線性優(yōu)化、自動目標識別,連續(xù)語音識別、 聲納信號的處理、知識處理、傳感技術與機器人、生物等領域都有廣泛地應用。 1.2.4 后處理后處理就是利用相關算法對識別后的漢字文本或者初級

13、識別結果做進一步 的處理,糾正誤識的漢字,給出拒識的漢字,確定模棱兩可的漢字。漢字識別的 后處理方法 12, 13從用戶的參與程度來說,可分為三類:手工處理,交互式處理 和計算機自動處理。以下對各種常用的后處理方法做簡單的介紹。 (1)簡單的詞匹配簡單的詞匹配就是利用文本中字的上下文匹配關系和詞的使用頻度, 給識別 后文本中的拒識字提供一個“最佳”的候選字,其關鍵是建立漢語詞條數(shù)據(jù)庫。 (2)綜合詞匹配綜合詞匹配方法, 就是綜合利用初級識別結果和字的上下文關系及詞的使用 頻度,來決定最后的識別結果。 這種方法實際上己把識別過程和后處理過程融為 一體了。(3)詞法分析 語言是語音和意義的結合體。

14、語素是最小的語言單位。無論是詞還是短語, 都有其構成規(guī)則,利用這些規(guī)則,將它們分類。另外,不同的應用背景,也有不 同的分類結果。4)句法、語義分析語句無論是從結構上, 還是從意思上都有一種人類共同理解、 共同接受和共 同遵守的語言組合法則。所以利用語義句法的方法,在初級識別結果的基礎上, 在利用詞法分析進行匹配之后或匹配的同時, 再進行句法分析和語義分析, 從而 確定要識別的漢字。(5)人工神經(jīng)元網(wǎng)絡 利用人工神經(jīng)元網(wǎng)絡的漢字識別后處理可以采取兩種方式。 一種是把識別過 程和后處理過程分開, 網(wǎng)絡的輸入是初級識別結果的短語或者句子, 其中包含不 確定的漢字(或拒識的漢字) ,通過網(wǎng)絡的運行,最

15、終確定這些字。另一種方法 是把識別過程和后處理過程綜合在一起, 初級識別給出的結果是每一個待識漢字 的前幾個候選字和每一候選字與待識字之間的相似度。 然后,把這些候選字以及 與之相連的相似度輸入網(wǎng)絡, 通過網(wǎng)絡的并行作用, 找到最符合漢語語法和語義 組合關系的詞或句子,從而確定出要識別的漢字。印刷體漢字識別技術分析1.3.1 結構模式識別方法漢字的數(shù)量巨大, 結構復雜,但其特殊的組成結構中蘊藏著相當嚴的規(guī)律 14。 從筆畫上講,漢字有包括橫、豎、撇、捺、點、折、勾等七種基本筆畫,還有提 挑、撇點、橫捺等七種變形筆畫。從部件上講,部件是有特殊的筆畫組合而成, 故部件也是一定的。換而言之, 漢字圖

16、形具有豐富的有規(guī)律可循的結構信息, 可 以設法提取含有這些信息的結構特征和組字規(guī)律,將它們作為漢字識別的依據(jù)。 這就是結構模式識別。結構模式識別理論在 20 世紀 70 年代初形成 ,是早期漢字識別研究的主要方 法。其思想是直接從字符的輪廓或骨架上提取的字符像素分布特征, 如筆畫、圈、 端點、節(jié)點、弧、突起、凹陷等多個基元組合,再用結構方法描述基元組合所代 表的結構和關系。通常抽取筆段或基本筆畫作為基元 ,由這些基元組合及其相互 關系完全可以精確地對漢字加以描述 ,最后利用形式語言及自動機理論進行文法推斷,即識別。結構模式識別方法的主要優(yōu)點在于對字體變化的適應性強,區(qū)分相似字能力強;缺點是抗干

17、擾能力差,從漢字圖像中精確的抽取基元、輪廓、特征 點比較困難,匹配過程復雜。因此,有人采用漢字輪廓結構信息作為特征,但這一方 案需要進行松弛迭代匹配,耗時太長,而且對于筆畫較模糊的漢字圖像,抽取輪廓 會遇到極大困難。也有些學者采用抽取漢字圖像中關鍵特征點來描述漢字,但是特征點的抽取易受噪聲點、筆畫的粘連與斷裂等影響??傊畣渭儾捎媒Y構模式識 別方法的脫機手寫漢字識別系統(tǒng),識別率較低。1.3.2統(tǒng)計模式識別方法統(tǒng)計模式識別方法是用概率統(tǒng)計模型提取待識別漢字的特征向量,然后根據(jù)決策函數(shù)進行分類,識別就是判別待識漢字的特征向量屬于哪一類。常用的判別 準則是距離準則和類似度準則,典型的統(tǒng)計模式識別方法有

18、最小距離分類、最鄰 近分類等。1.最小距離分類最小距離分類器(Minimum - DiStance CIaSSifie)是以漢字與特征空間模型點 之間的距離作為分類準則,它有著圖 3-2所描述的結構。其中,X是輸入特征向 量,他將被分配到C個類別中的某一個類 k ( k 1,2, IC),這些類有各自的典型模式mk表示。ml圖1-2最小距離分類器系統(tǒng)圖2.最鄰近分類最鄰近法的思想是對于C個類別i (i 1,2, ,C),每類有標明類別的樣本Ni個(i 1,2, ,C )。規(guī)定i的判別函數(shù)如式(1-1)所示。其中Xik的角 標i表示i類,k表示i類Ni個樣本中的第k個。gi (x) min X

19、Xik , k 1,2, , nj(1-3)gj(x) mingi(i), i 1,2, ,C ,(1-4)若式(1-2)成立,則決策X j。即對未知樣本X,比較X與N個已知類 別的樣本之間的歐式距離并決策 X與離它最近的樣本同類。常用的漢字統(tǒng)計模式識別方法包括:(1)模板匹配(2)利用變換特征的方法(3)筆畫方向特征(4)外圍特征(5)特征點特征隨著漢字識別技術的發(fā)展,已經(jīng)有越來越多的統(tǒng)計特征出現(xiàn)。但幾乎每種特 征都不是完美的,都要在特殊條件下施加一些特殊的處理。2系統(tǒng)的實現(xiàn)與仿真系統(tǒng)的實現(xiàn)印刷品上的漢字輸入,經(jīng)過預處理后,對照標準漢字修補缺損部分,用修補 后的漢字進行學習,形成初始的特征庫

20、后再進行大量樣本的學習,建立實用的特征庫。系統(tǒng)在識別過程中可進行自學習。取標準漢字,對每一個漢字計算面積。 所有按面積由小到大排列,建立每一漢字與其國標碼的指針。對神經(jīng)網(wǎng)絡設置其初始權值,選取大量標準漢字訓練網(wǎng)絡,反復修改權值,直至與面積序號對應的輸出為有效,并建立每一輸出與面積特征庫之間的連接關系。以后隨著學習過程的進行,將建立動態(tài)調整面積特征庫及其與神經(jīng)網(wǎng)絡之間的對應關系。系統(tǒng)共包括5個子功能模塊(見圖2-1)。圖2-1系統(tǒng)模塊圖預漢字說別加S特庫特征提取特征匹配圖2-2 系統(tǒng)流程框圖系統(tǒng)的工作流程如圖2-2所示,文件首先由文件管理器加載。送人圖像處理 模塊,經(jīng)二值化轉灰度,均值濾波,二值

21、化,行字切分等圖像預處理操作后。得 到待識文字的點陣,漢字識別模塊從點陣中提取識別特征,通過十三點特征提取, 精確匹配得出識別結果。系統(tǒng)的仿真此次采用MATLAB進行系統(tǒng)仿真(MatIab仿真程序見附錄1),其中學習功 能使用Sim函數(shù)實現(xiàn),特征提取用十三點特征提取法。y = Sim( net, P_test) ; %用訓練出來的神經(jīng)網(wǎng)絡計算數(shù)據(jù)的第 P_test行; 其中net是SlMULlNK的模型名(神經(jīng)網(wǎng)絡的對象見附錄 2); P_test是外部輸入 向量。十三點特征提取法:首先把字符平均分成8份,統(tǒng)計每一份內黑色像素點的個數(shù)作為 8個特征,然后統(tǒng)計水平方向中間兩列和豎直方向中間兩列的

22、黑色像素點的個數(shù)作為4個特征,最后統(tǒng)計所有黑色像素點的個數(shù)作為第 13個特征。也就是說,畫4道線, 統(tǒng)計穿過的黑色像素的數(shù)目??梢缘玫?個特征。最后,將字符圖像的全部黑色 像素的數(shù)目的總和作為一個特征。 十三點特征提取法有著極好的適應性,但是由于特征點的數(shù)目太少所以在樣本訓練的時候比較難收斂。系統(tǒng)首先對標準圖像(見圖2-3)進行識別,識別過程中轉灰度(見圖2-4), 均值濾(見圖2-5),二值化(見圖2-6),波識別結果見圖(2-7)。匣圉圖國盅匡盞HlJn盈団盔因圖2-3標準圖像匣園圖國盅匡盞固監(jiān)盂盒團盈団盔因圖2-6 標準圖像二值化圖像irm1.jpgIm2.jpgir5 JPB n4 j

23、pg IrrtEIPqIn* jP9im7 jpg <rtl.jH匣圉圖國盅匡盞固im9 jpq監(jiān)盂盒團盈団盔因rr1 jpg im11 j>g ilTJpg *TlIajPg im14.jpg jm1 石,jp* imlG.jpg圖2-7 標準圖像識別結果通過對標準圖像識別學習訓練,然后對輸入亂序圖像(見圖2-8)進行識別, 過程中轉灰度(見圖2-9),均值濾波(見圖2-10),二值化(見圖2-11),識別結果(見 圖 2-12)??鴪F盞圖盒國匣因匡固.盈盂監(jiān)団I圖2-8亂序圖像盔團盞圖盒國匣因匡固盅盈盂監(jiān)圖2-9 亂序圖像轉灰度圖像盒國匣jr 1? r圖2-10亂序圖像均值濾波

24、圖像盔團盞圖盒國匣因匡周盅盈盂監(jiān)冋圉圖2-11亂序圖像二值化圖像Irrtl jpg i>*2.jfjy ItT jpg i"皿-jP3 Iin5 jpa rJPy irri7.jpg lllll0JP9盔團盞圖盒國匣因IrmSJPfl IOJPg im11.jp9 im12JpQ im13Jpg im14Jp IrTlI6JPS im16JP9匡固盅盈盂監(jiān)団圉圖 2-12 亂序圖像識別結果由以上實驗結果可以看出,當輸入標準圖像,經(jīng)過轉灰度,均值濾波,二值化,識別輸 出。然后,輸入亂序圖像在經(jīng)過轉灰度,均值濾波,二值化,特征提取,匹配識別后,系統(tǒng) 能夠將亂序圖像中的圖像識別輸出。

25、 說明系統(tǒng)基本實現(xiàn)預先設想的功能, 能夠在學習標準圖 像識別后建立標準庫, 并根據(jù)標準字庫與以后輸入的圖像進行匹配識別輸出。 但由于系統(tǒng)比 較簡單,實現(xiàn)的功能也比較單一,要想實現(xiàn)較完備功能還需進一步完善。%亂序圖像識別:load bp;G=imread(”); 讀取I=rgb2gray(G);%轉灰度圖象B1=filter2(fspecial('average',3),I)/ 255;%以3,3為模板均值濾波%均值濾波d=im2bw(B1,;%二值k1=1;k2=1;s=sum(d');j=2;a=1;c=1m, n=size(d');while s(j)=mj

26、=j+1;3.附錄附錄 1k1=j;while s(j)=m && j<=n-1j=j+1;endk2=j-1;d=d(k1:k2),:);%行分割m,n=size(d);k1=1;k2=1;s=sum(d);j=2;a=1;c=1for a=1:16while s(j)=mj=j+1;endk1=j;while s(j)=m && j<=n-1endj=j+1;endy = sim(net,P_test');word=jieguoxianshi(y)end%第 3 個字符if c=4 b4=d(:,(k1:k2); imwrite(b4,&

27、#39;'); t4=tezhengtiqu(b4);P_test = t4;y = sim(net,P_test'); word=jieguoxianshi(y) end%第 4 個字符if c=5 b5=d(:,(k1:k2); imwrite(b5,''); t5=tezhengtiqu(b5);P_test = t5;y = sim(net,P_test'); word=jieguoxianshi(y) end%第 5 個字符if c=6 b6=d(:,(k1:k2); imwrite(b6,''); t6=tezhengtiqu

28、(b6);P_test = t6;y = sim(net,P_test'); word=jieguoxianshi(y) end%第 6 個字符if c=7k2=j-1;%列分割if c=1b1=d(:,(k1:k2); imwrite(b1,'');t1=tezhengtiqu(b1);P_test = t1'y = sim(net,P_test);%用 訓練出 來的 神經(jīng)網(wǎng) 絡計算 數(shù)據(jù) 的第 P_test 行word=jieguoxianshi(y)end%第 1 個字符if c=2b2=d(:,(k1:k2);imwrite(b2,'')

29、;t2=tezhengtiqu(b2); %用十三點特征提取法提取特征P_test = t2;y = sim(net,P_test'); %用訓練出來的神經(jīng)網(wǎng)絡計算數(shù)據(jù)的%第 P_test 行word=jieguoxianshi(y)end%第 2 個字符if c=3b3=d(:,(k1:k2);imwrite(b3,'');t3=tezhengtiqu(b3);P_test = t3;b7=d(:,(k1:k2);word=jieguoxianshi(y)imwrite(b7,'');endt7=tezhengtiqu(b7);%第 10 個字符P_t

30、est = t7;if c=11y = sim(net,P_test');b11=d(:,(k1:k2);word=jieguoxianshi(y)imwrite(b11,'');endt11=tezhengtiqu(b11);%第 7 個字符P_test = t11;if c=8y = sim(net,P_test');b8=d(:,(k1:k2);word=jieguoxianshi(y)imwrite(b8,'');endt8=tezhengtiqu(b8);%第 11 個字符P_test = t8;if c=12y = sim(net,P

31、_test');b12=d(:,(k1:k2);word=jieguoxianshi(y)imwrite(b12,'');endt12=tezhengtiqu(b12);%第 8 個字符P_test = t12;if c=9y = sim(net,P_test');b9=d(:,(k1:k2);word=jieguoxianshi(y)imwrite(b9,'');endt9=tezhengtiqu(b9);%第 12 個字符P_test = t9;if c=13y = sim(net,P_test');b13=d(:,(k1:k2);w

32、ord=jieguoxianshi(y)imwrite(b13,'');endt13=tezhengtiqu(b13);%第 9 個字符P_test = t13;if c=10y = sim(net,P_test');b10=d(:,(k1:k2);word=jieguoxianshi(y)imwrite(b10,'');endt10=tezhengtiqu(b10);%第 13 個字符P_test = t10;if c=14y = sim(net,P_test');b14=d(:,(k1:k2);imwrite(b14,'');

33、 t14=tezhengtiqu(b14); P_test = t14;y = sim(net,P_test'); word=jieguoxianshi(y) end%第 14 個字符if c=15 b15=d(:,(k1:k2); imwrite(b15,'');t15=tezhengtiqu(b15);P_test = t15;y = sim(net,P_test');word=jieguoxianshi(y) end%第 15 個字符if c=16 b16=d(:,(k1:k2); imwrite(b16,'');t16=tezhengti

34、qu(b16);P_test = t16;y = sim(net,P_test');word=jieguoxianshi(y) end%第 16 個字符c=c+1;endsubplot(2,8,1),imshow ( ''); subplot ( 2,8,2),imshow(''); subplot(2,8,3),imshow(''); subplot(2,8,4),imshow(''); subplot(2,8,5),imshow('');subplot(2,8,6),imshow('')

35、;subplot(2,8,7),imshow('');subplot(2,8,8),imshow('');subplot(2,8,9),imshow('');subplot(2,8,10),imshow('');subplot(2,8,11),imshow('');subplot(2,8,12),imshow('');subplot(2,8,13),imshow('');subplot(2,8,14),imshow('');subplot(2,8,15),imshow

36、('');subplot(2,8,16),imshow('');%標準圖像識別:load fbp;G=imread(”); 讀取I=rgb2gray(G);%轉灰度圖象B1=filter2(fspecial('average',3),I)/ 255;%均值濾波d=im2bw(B1,;%二值imshow(d);k1=1;k2=1;s=sum(d');j=2;a=1;c=1m,n=size(d');while s(j)=mj=j+1;endk1=j;while s(j)=m && j<=n-1j=j+1;endk

37、2=j-1;if c=3d=d(k1:k2),:);%行分割m,n=size(d); k1=1;k2=1;s=sum(d);j=2;a=1;c=1for a=1:16while s(j)=mj=j+1;endk1=j;while s(j)=m && j<=n-1j=j+1;endk2=j-1;%列分割if c=1 b1=d(:,(k1:k2); imwrite(b1,''); t1=tezhengtiqu(b1);P_test = t1'y = sim(net,P_test); word=fbmjieguoxianshi(y) end%第 1 個字

38、符if c=2b2=d(:,(k1:k2);imwrite(b2,''); t2=tezhengtiqu(b2);P_test = t2;y = sim(net,P_test');word=fbmjieguoxianshi(y)end%第 2 個字符 b3=d(:,(k1:k2); imwrite(b3,''); t3=tezhengtiqu(b3);P_test = t3;y = sim(net,P_test');word=fbmjieguoxianshi(y) end%第 3 個字符if c=4b4=d(:,(k1:k2); imwrite(

39、b4,''); t4=tezhengtiqu(b4);P_test = t4;y = sim(net,P_test');word=fbmjieguoxianshi(y) end%第 4 個字符if c=5b5=d(:,(k1:k2); imwrite(b5,''); t5=tezhengtiqu(b5);P_test = t5;y = sim(net,P_test');word=fbmjieguoxianshi(y) end%第 5 個字符if c=6b6=d(:,(k1:k2); imwrite(b6,''); t6=tezhe

40、ngtiqu(b6);P_test = t6;y = sim(net,P_test');word=fbmjieguoxianshi(y) end%第 6 個字符if c=7b7=d(:,(k1:k2); imwrite(b7,''); t7=tezhengtiqu(b7);P_test = t7;y = sim(net,P_test');word=fbmjieguoxianshi(y) end%第 7 個字符if c=8b8=d(:,(k1:k2); imwrite(b8,''); t8=tezhengtiqu(b8);P_test = t8;y

41、 = sim(net,P_test');word=fbmjieguoxianshi(y) end%第 8 個字符if c=9b9=d(:,(k1:k2); imwrite(b9,''); t9=tezhengtiqu(b9);P_test = t9;y = sim ( net,P_test'); word=fbmjieguoxianshi(y) end%第 9 個字符if c=10b10=d(:,(k1:k2); imwrite(b10,''); t10=tezhengtiqu(b10);P_test = t10; y = sim(net,P_t

42、est'); word=fbmjieguoxianshi(y) end%第 10 個字符if c=11b11=d(:,(k1:k2); imwrite(b11,''); t11=tezhengtiqu(b11);P_test = t11; y = sim(net,P_test'); word=fbmjieguoxianshi(y) end%第 11 個字符if c=12b12=d(:,(k1:k2); imwrite(b12,''); t12=tezhengtiqu(b12);P_test = t12; y = sim(net,P_test

43、9;); word=fbmjieguoxianshi(y) end%第 12 個字符if c=13b13=d(:,(k1:k2); imwrite(b13,''); t13=tezhengtiqu(b13);P_test = t13;y = sim(net,P_test');word=fbmjieguoxianshi(y)end%第 13 個字符if c=14b14=d(:,(k1:k2); imwrite(b14,'');t14=tezhengtiqu(b14);P_test = t14;y = sim(net,P_test');word=fb

44、mjieguoxianshi(y)end%第 14 個字符if c=15b15=d(:,(k1:k2); imwrite(b15,'');t15=tezhengtiqu(b15);P_test = t15;y = sim(net,P_test');word=fbmjieguoxianshi(y)end%第 15 個字符if c=16b16=d(:,(k1:k2); imwrite(b16,''); t16=tezhengtiqu(b16);P_test = t16;y = sim(net,P_test');word=fbmjieguoxiansh

45、i(y)end%第 16 個字符c=c+1;endsubplot(2,8,1),imshow('');subplot(2,8,2),imshow('');subplot(2,8,3),imshow('');subplot(2,8,4),imshow('');subplot(2,8,5),imshow('');subplot(2,8,6),imshow('');subplot(2,8,7),imshow('');subplot(2,8,8),imshow('');sub

46、plot(2,8,9),imshow('');subplot(2,8,10),imshow('');subplot(2,8,11),imshow('');subplot(2,8,12),imshow('');subplot(2,8,13),imshow('');subplot(2,8,14),imshow('');subplot(2,8,15),imshow('');subplot(2,8,16),imshow('');%標準圖像識別結果顯示:function wor

47、d=jieguoxianshi(y)%顯示結果的函數(shù) y=round(y(1),round(y(2),round(y(3), round(y(4),round(y(5),round(y(6), round(y(7),round(y(8),round(y(9), round(y(10),round(y(11),round(y(12), round(y(13),round(y(14),round(y(15), round(y(16);C,I=max(y);if I=16word=' 匣 'elseif I=15word=' 囡 'elseif I=14 word=&

48、#39; 圖 'elseif I=13 word=' 國 'elseif I=12 word=' 盅 'elseif I=11 word=' 匡 'elseif I=10word=' 盞 'elseif I=9 word=' 固 'elseif I=8 word=' 監(jiān) 'elseif I=7 word=' 盂 'elseif I=6 word=' 盒 'elseif I=5 word=' 團 'elseif I=4 word=' 盈

49、'elseif I=3 word=' 団 'elseif I=2 word=' 盔 'elseif I=1 word=' 因 'end%亂序圖像識別結果顯示function word=jieguoxianshi(y)%顯示結果的函數(shù) y=round(y(1),round(y(2),round(y(3), round(y(4);if y=0,0,0,0word=' 匣 'elseif y=0,0,0,1,word=' 囡 'elseif y=0,0,1,0word=' 圖 'elseif y=

50、0,0,1,1word=' 國 'elseif y=0,1,0,0word=' 盅'elseif y=0,1,0,1word=' 匡 'elseif y=0,1,1,0word=' 盞 'elseif y=0,1,1,1word=' 固 'elseif y=1,0,0,0word=' 監(jiān) 'elseif y=1,0,0,1word=' 盂 'elseif y=1,0,1,0word=' 盒 'elseif y=1,0,1,1word=' 團 'else

51、if y=1,1,0,0word=' 盈 'elseif y=1,1,0,1word=' 団 'elseif y=1,1,1,0word=' 盔 'elseif y=1,1,1,1word=' 因 'end%特征提取 :function PN=moshishibie(d) %特征提取函數(shù)%通過 13 點特征提取法提取特征 %d 為已處理圖象 m,n=size(d);k1=1;for i=1:m/ 4for j=1:n/ 2if d(i,j)=1k1=k1+1;endendendk2=1;for i=1:round(m/ 4)for j=round(n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論