模式識別及其在數(shù)字圖像處理中的應(yīng)用_第1頁
模式識別及其在數(shù)字圖像處理中的應(yīng)用_第2頁
模式識別及其在數(shù)字圖像處理中的應(yīng)用_第3頁
模式識別及其在數(shù)字圖像處理中的應(yīng)用_第4頁
模式識別及其在數(shù)字圖像處理中的應(yīng)用_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、模式識別及其在數(shù)字圖像處理 中的應(yīng)用作者:日期:模式識別及其在數(shù)字圖像處理中的應(yīng)用摘要:模式識別是人工智能領(lǐng)域的基礎(chǔ),隨著計算機和人工智能技術(shù)的發(fā)展,模 式識別在圖像處理中的應(yīng)用日益廣泛。近年來,模式識別也去的了很多讓人矚目 的成就,有很多不可忽視的進展。數(shù)字圖像處理乂稱為計算機圖像處理,它是指 將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進行處理的過程。圖像是人類獲取 和交換信息的主要來源,圖像處理的應(yīng)用領(lǐng)域必然涉及到人類生活和工作的方方 面面。隨著人類活動范圍的不斷擴大,圖像處理的應(yīng)用領(lǐng)域也將隨之不斷擴大。 基于模式識別的圖像處理隨著當今計算機和人工智能技術(shù)的發(fā)展,已經(jīng)成為了圖 像識別領(lǐng)域的蹤

2、影研究方向。本文首先介紹了圖像模式識別的基本理論和基本方 法,然后闡述了模式識別在圖像處理中應(yīng)用理論,最后舉例說明了模式識別在圖 像處理中的具體應(yīng)用。關(guān)鍵字:模式識別:人工智能;圖像處理;特征提??;識別方法1模式識別技術(shù)的基本理論1.1模式識別的基本框架模式識別是通過計算機對信息進行處理、判別的一種分類過程,是信號處理 與人工智能的一個重要分支。人工智能是專門研究用機器人模仿人的動作、感覺 和思維過程與規(guī)律的一門學科,而模式識別就是通過計算機用數(shù)學技術(shù)方法來研 究模式的自動處理和判讀。我們把環(huán)境與客體統(tǒng)稱為“模式”。隨著計算機技術(shù) 和人工智能的發(fā)展,人類有可能研究復雜的信息處理過程。信息處理過

3、程的一個 重要形式是生命體對環(huán)境及客體的識別。對人類來說,特別重要的是對光學信息 (通過視覺器官來獲得)和聲學信息(通過聽覺器官來獲得)的識別。這是模式 識別的兩個重要方面。在圖像處理中,識別場景中的對象或區(qū)域是一個重要課題。圖像模式識別的 任務(wù)是從策略對象集的場景中識別對象。每個對象都是一種模式,并且策略值是 模式的特征,同特征的相似對象集屬于具體的模式類,測量特征的技術(shù)稱為特征 提取。模式識別的基本框架如圖1所示:圖1模式識別的基本框架1. 2.1決策理論法在模式識別中,已經(jīng)使用了一些模式分類技術(shù)。這些技術(shù)中的一些技術(shù)被稱 為決策理論技術(shù),在這種技術(shù)中,未知的模式分類是由一些確定的、統(tǒng)計的

4、或者 模糊理論的基本原理進行決策。決策理論的模塊圖如圖2所示:測試模式樣本模式分類輸出圖2決策理論模式分類器模塊圖決策理論模式識別技術(shù)主要分為基于有監(jiān)督學習的分類方法和使用無監(jiān)督 技術(shù)的分類方法。有監(jiān)督的分類方法乂可分為有參數(shù)分類器和非參數(shù)分類器。在有參數(shù)監(jiān)督的 分類中,用大量標注訓練樣本模式集訓練分類器,并估計每類模式的統(tǒng)計參數(shù)。 其中,最小距離分類器和最大似然分類器是頻繁使用的有監(jiān)督算法。無監(jiān)督分類技術(shù)不考慮參數(shù),常使用一些非參數(shù)的技術(shù),例如K近鄰技術(shù)、 Parzen窗技術(shù)等。在無監(jiān)督的情況下,根據(jù)一些相似標準機器分割整個數(shù)據(jù)集, 結(jié)構(gòu)產(chǎn)生了聚類集,模式中的每個聚類集都屬于具體類。1. 2

5、. 2句法方法在句法模式識別中,關(guān)鍵問題是使用屬于不同模式類的樣本集推斷適當?shù)奈?法。文法推斷問題是一個首要問題。這種方法是基于基本假設(shè),每個模式至少存 在一個文法描述。每個模式類文法描述的識別和提取形成了設(shè)計綜合模式分類器 的核心問題。文法推斷問題包括使用在研究中的樣本模式集獲得文法的算法開 發(fā)。因此這可以視為使用有限的并且增長的訓練模式集進行學習的方法。在文法 模式分類中,屬于特殊模式類的字符串可以作為形成屬于語言的句子,這些句子 對應(yīng)于模式類。如果每個字符串都屬于該模式類,機器就可以識別這個模式類, 對于不在該模式類中的任何字符串,機器決策它是否是語言的成員,要么拒絕, 要么永久接受。對

6、于自動機的自動化造句而言,接受字符串屬于特殊模式類,已 經(jīng)有了一些成熟的技術(shù)。1.2.3人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)已經(jīng)廣泛使用于圖像分割和對象分類問題。這些網(wǎng)絡(luò)本質(zhì)上是 學習網(wǎng)絡(luò),用于場景中像素或?qū)ο蟮姆诸?。它們是大量互?lián)的神經(jīng)元集,并行地 執(zhí)行學習任務(wù)。神經(jīng)元由生物神經(jīng)元建模,因此它們被命名為神經(jīng)網(wǎng)絡(luò)。根據(jù)學 習過程的類型,這些網(wǎng)絡(luò)可以分為有監(jiān)督或無監(jiān)督網(wǎng)絡(luò)。1.2.4小結(jié)在低級II算機視覺和圖像處理中,圖像模式識別和分類是重要任務(wù)。圖像模 式識別的關(guān)鍵是對圖像的分類和解譯。在圖像分析的不同領(lǐng)域已經(jīng)發(fā)現(xiàn)了這些技 術(shù)的廣泛應(yīng)用,即分割,像素分類和圖像的解譯。2基于模式識別技術(shù)的圖像處理2.1 基

7、于模式識別技術(shù)的圖像分割把圖像按相關(guān)度劃分成各具特色的區(qū)域并提取出所需目標的技術(shù)和過程稱為 圖像分割。分割的關(guān)鍵在于分割依據(jù)的確定。從模式識別技術(shù)理論上考慮圖像分 割問題,分割是針對圖像所需分割的對象,根據(jù)圖像的結(jié)構(gòu)特性將圖像的所有組 成部分分成“分割”類和“非分割類”兩類。對于任何一個事物都有與其他事物 相互區(qū)別的一些本質(zhì)特征,必然可以提取出本質(zhì)特征能夠與分割背景圖像相區(qū)別 并作為識別事物的依據(jù),即為分割依據(jù)。在分割圖像定位對象時,可以選擇由特征 組成的特征空間進行定位識別。因此,將分割對象視為模式識別的對象,圖像分割 的過程是為在模式識別中尋找特定模式類,并按照該模式類的特征,結(jié)合與其對

8、應(yīng)的分割技術(shù)進行分割。2.2 基于模式識別技術(shù)的圖像特征提取由于圖像的隨機性和數(shù)據(jù)量大,增加了在圖像中選取有效的圖像特征的難度, 并直接影響到圖像識別系統(tǒng)的性能。所以完成圖像識別的首要任務(wù)為提取有效的 圖像特征。然而在很多實際問題中不易找到所需的特征,或由于條件限制不能對 它們進行測試,于是把特征選擇和提取任務(wù)復雜化,成為構(gòu)建模式識別系統(tǒng)困難 的任務(wù)之一。圖像的原始特性或?qū)傩员环Q為圖像特征。其中有些是自然特征,有 些是人為特征。特征提取是提取特征,經(jīng)篩選或變換直到得出有效特征的全過程。 其根本任務(wù)是選擇有效的特征,并運用相應(yīng)的技術(shù)進行特征提取。基于模式識別 技術(shù)的圖像特征提取工作的結(jié)果是給出了

9、某一具體圖像與其它圖像相區(qū)別的特 征。2.3 基于模式識別技術(shù)的圖像識別圖像識別是圖像處理的高級階段,其研究的是通過儀器對周圍物體的視覺圖 像進行分析和識別,從而可得到有效的結(jié)論性判斷。但是,為了使計算機系統(tǒng)也能 認識人類視覺系統(tǒng)認識的圖像,人們必須研究出計算方法,分析圖像特征,因而將 模式識別技術(shù)應(yīng)用到圖像識別中,進而將圖像特征能用數(shù)學方法表示出來并教會 計算機也能認識、識別這些特征。3基于模式識別技術(shù)的生物醫(yī)學圖像處理3.1 概述生物統(tǒng)計的識別系統(tǒng)在一些應(yīng)用中非常有用,例如商務(wù)和執(zhí)法應(yīng)用,特別是 在犯罪識別、安全系統(tǒng)、可視電話、信用卡驗證以及用于識別個人身份的證件照 片驗證等方面。人臉的識

10、別、指紋、簽名和許多其他生物統(tǒng)計圖像在計算機視覺領(lǐng)域中構(gòu)成了重要的研究領(lǐng)域?;谀J阶R別的自動人臉識別已經(jīng)有了很多實現(xiàn)方案。人臉識別中主要的策 略要么是基于特征的,要么是基于人臉空間的,例如特征臉或Fisher臉。大多 數(shù)特征提取的方法都是從人臉的正視圖中提取特征,有時也從側(cè)面人臉輪廓中提 取特征。自動人臉識別系統(tǒng)既使用正面也使用側(cè)面,所有更加準確,因為它利用 了子人臉的兩個視圖中固有可利用的明確信息。下面介紹用于人臉識別的特征提 取和匹配技術(shù)。3. 2特征選擇首先從人臉的正視圖和側(cè)視圖中辨識標志點集合,然后使用它們之間的基于 區(qū)域、角度和距離的特征向量。側(cè)面輪廓特征提供了人臉額外的結(jié)構(gòu)輪廓信

11、息, 這些信息從正視圖中是看不到的,所以從兩個視圖中提取特征集通常能夠有效地 應(yīng)用于人臉識別,并且與只使用一個視圖的特征的系統(tǒng)相比,可靠性更高。3. 3正面面部特征提取提取一些正面面部分量,例如眼睛、眉毛等,開始時選擇眼睛模板集,面部 圖像f(i,j)以適當選擇的模板集T(m,n)進行卷積運算,由以下濾波器操作表示:F(Lj)= 22 T(m, n) * f(i + m,j + n)這個卷積過程在濾波器的輸出產(chǎn)生了能力測試集。從卷積濾波器的輸出確定 眼睛的位置,使用平移、尺度和選擇不變仿射變換,我們可以從卷積濾波器檢測 出眼睛。一旦檢測出兩只眼睛,眼眉位置可能位于眼睛中心的小搜索區(qū)域之內(nèi)。 隨

12、后,沿虹膜列可以川一半的眼眉模板窗口與眼眉模板集合匹配來檢測上述左右 眼睛之上的眉眼。一些正面面部特征具有不變特征,它不隨面部表示而改變,而 其他的是變化的特征。圖3給出了正面面部點。在正面面部特征提取中,眼睛是 重要的角色。(a)(b)正面臉的一些 基準特征點(c)(d)側(cè)面外形掄廓具 有標記的基準點側(cè)視圖二進制側(cè)視圖圖3正面面部點3.4側(cè)面面部特征提取人臉的側(cè)視圖選擇的標志點是:鼻子點、頜下點、前額點、鼻梁點、眉間點 和嘴角點。將側(cè)面臉的數(shù)字圖像變化為側(cè)面外形輪廓,然后提取標志點。側(cè)面面 孔圖像是一幅二進制圖像,從每個側(cè)面輪廓獲得的標志點提取7個距離測量和一 個區(qū)域測量。3.4.2距離和區(qū)

13、域測量計算距離測量的提取標志點如圖4所示,正視圖和側(cè)視圖的特征集合形成組 合特征向量,這些特征向量陣列表示面部圖片,所以我們希望對于不同的臉部, 這些向量陣列是不同的。我們將這些特征陣列存儲在文件中,并且具有主索引號。 為了消除尺度作用,將鼻子點和鼻梁點間的距離,側(cè)視圖的距離測量和面積測量 值,兩眼間的距離和正面臉的測量值進行歸一化處理。圖4側(cè)面面部點3.5人臉識別從人臉的正視圖和側(cè)視圖提取最佳特征集,并且將這些特征值存儲在獨立的 文件中,主要臉數(shù)據(jù)文件中的向量稱為M向量,對于未知的樣本,測試數(shù)據(jù)文件 包含15維特征向量。為了減少匹配特征向量值計算的復雜性,將這些特征向量 與它們的主索引一起升

14、序存儲。將測試特征值插到每個特征向量(列)的排序特 征列表的適當位置。測試樣本模式的兩個最近鄰居在每列中進行識別,并且評估 它們的相似性。下面就K-近鄰算法給出人臉識別的步驟:步驟1在每一列,將特征值與它們的主索引一起升序排列。步驟2在每列的適當位置插入測試樣本的每個特征向量。步驟3在每列中去掉兩個最近鄰居,并對兩個最近的鄰居計算測試模式的 相似性,每個都有主索引。步驟4對所有主索引計算測試模式的所有相似性。步驟5給測試人臉分配具有最大相似性值的主索引。如果在測試文件中的人臉不屬于任何存儲在主要數(shù)據(jù)文件的人臉,對于這個測試臉,將給出.與其最相似的分類索引。4結(jié)語隨著計算機和人工智能技術(shù)的發(fā)展,

15、人們對模式識別技術(shù)在圖像處理中的應(yīng) 用越來越重視。同時,模式識別涉及并利用到數(shù)學、計算機科學等多學科的理論 知識,而將這些學科的新技術(shù)和成就綜合運用到模式識別中,提出更符合需求的 模式識別技術(shù)是今后值得研究的重要課題。5參考文獻1邊肇祺,張學工,等.模式識別(第二版)M.北京:清華大學出版社2000-01.2沈清,湯森.模式識別導論M.長沙:國防科技大學出版社,1991.3 Karayiannis N B, Pai P I. A fuzzy vector quantization algorithms and their application in image compression J.IEEE Transaction on Image Processing, 1995,4(9):1 193-1 201.4 Chen Li, Yap Kim-Hui. A fuzzy K-n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論