模式識別-第一章概論_第1頁
模式識別-第一章概論_第2頁
模式識別-第一章概論_第3頁
模式識別-第一章概論_第4頁
模式識別-第一章概論_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

王改華TelEmail:80103185@湖北工業(yè)大學(xué)電氣學(xué)院具有某些屬性的實體的集合蘋果水果具體形式:實體抽象形式:概念1.模式和模式識別最簡單的例子:對蘋果和桔子的識別特征:顏色、形狀顏色特征:RGB形狀:測量圖像頂部到最寬處的距離模式識別(PatternRecognition):確定一個樣本的類別屬性(模式類)的過程,即把某一樣本歸屬于多個類型中的某個類型。樣本(Sample):一個具體的研究(客觀)對象。如患者,某人寫的一個漢字,一幅圖片等。模式(Pattern):對客體(研究對象)特征的描述(定量的或結(jié)構(gòu)的描述),是取自客觀世界的某一樣本的測量值的集合(或綜合)。

模式和模式識別特征(Features):能描述模式特性的量(測量值)。在統(tǒng)計模式識別方法中,通常用一個矢量表示,稱之為特征矢量,記為模式類(Class):具有某些共同特性的模式的集合。模式識別是模擬人的某些功能模擬人的視覺:計算機+光學(xué)系統(tǒng)模擬人的聽覺:計算機+聲音傳感器模擬人的嗅覺和觸覺:計算機+傳感器訓(xùn)練集:是一個已知樣本集,在監(jiān)督學(xué)習(xí)方法中,用它來開發(fā)出模式分類器。測試集:在設(shè)計識別和分類系統(tǒng)時沒有用過的獨立樣本集。系統(tǒng)評價原則:為了更好地對模式識別系統(tǒng)性能進行評價,必須使用一組獨立于訓(xùn)練集的測試集對系統(tǒng)進行測試。人類具有很強的模式識別能力,時刻在完成某種模式識別的任務(wù)。模式識別是一門理論與應(yīng)用并重的技術(shù)科學(xué),有廣泛的需求。模式識別是從樣本到類別的映射。模式識別是從樣本到類別的映射。2.人的模式識別能力人的視覺識別能力圖像信息80%看書、看報、寫字看電影、看風(fēng)景…光學(xué)信息可見光圖像、紅外圖像X射線圖像、γ射線圖像靜態(tài)圖像、動態(tài)圖像2.人的模式識別能力人的聽覺識別能力一聽就知道是…為什么研究它?3、計算機模式識別問題生產(chǎn)實踐的需要:需要智能機器人,另外人的工資高,而計算機的價格越來便宜。信息爆炸現(xiàn)象:用人來不及處理信息。如:衛(wèi)星遙感,超級市場,郵政,銀行,指紋庫。危險地帶:油漆、放射、高溫、核電站。提高工效:自動化帶來的好處已經(jīng)顯而易見。衛(wèi)星地圖符號化地圖的分割方法圖5.2“地圖3”分割結(jié)果:(a)原始圖像(b)分割的“路面”信息(c)分割的“湖泊”信息(d)分割的“植被”信息圖5.3“地圖6”分割結(jié)果:(a)原始圖像(b)分割的“路面”信息(c)分割的“湖泊”信息(d)分割的“植被”信息圖5.6分割后處理的結(jié)果圖:(a1)分割得到的“路面”信息(a2)后處理之后的“路面”信息(b1)分割得到的“湖泊”信息(b2)后處理之后的“湖泊”信息(c1)分割得到的“植被”信息(c2)后處理之后的“植被”信息彩色地圖后處理方法圖5.7分割后處理的結(jié)果圖:(a1)分割得到的“路面”信息(a2)后處理之后的“路面”信息(b1)分割得到的“湖泊”信息(b2)后處理之后的“湖泊”信息(c1)分割得到的“植被”信息(c2)后處理之后的“植被”信息彩色地圖后處理方法美軍排爆機器人執(zhí)行任務(wù)智能娛樂機器人-童童騎自行車的機器人-村田頑童航天機器人對象空間模式空間特征空間類型空間各類空間(Space)的概念模式采集:從客觀世界(對象空間)到模式空間的過程稱為模式采集。特征提取和特征選擇:由模式空間到特征空間的變換和選擇。類型判別:特征空間到類型空間所作的操作。模式識別三大任務(wù)信息的獲?。菏峭ㄟ^傳感器,將光或聲音等信息轉(zhuǎn)化為電信息。信息可以是二維的圖象如文字,圖象等;可以是一維的波形如聲波,心電圖,腦電圖;也可以是物理量與邏輯值。預(yù)處理:包括A\D,二值化,圖象的平滑,變換,增強,恢復(fù),濾波等。1.2模式識別系統(tǒng)特征抽取和選擇:在模式識別中,需要進行特征的抽取和選擇,例如,一幅64x64的圖象可以得到4096個數(shù)據(jù),這種在測量空間的原始數(shù)據(jù)通過變換獲得在特征空間最能反映分類本質(zhì)的特征,就是特征提取和選擇的過程。分類器設(shè)計:分類器設(shè)計的主要功能是通過訓(xùn)練確定判決規(guī)則,使按此類判決規(guī)則分類時,錯誤率最低。把這些判決規(guī)則建成標準庫。分類決策:在特征空間中對被識別對象進行分類。

1.數(shù)據(jù)獲取為了使計算機能夠?qū)腕w進行分類識別,必須將客體用計算機所能接受的形式表示,通常從客體獲得的信息有下列三種類型①二維圖像,如文字、指紋、照片等;②一維波形,如語音、機械振動波、心電團等;③物理參量或邏輯值,如體溫、各種實驗數(shù)據(jù)等。通過測量、采樣和量化,可以用矩陣或向量表示二維圖象或一維波形,這就是信息獲取過程。2.預(yù)處理預(yù)處理的目的是去除噪聲,加強有用的信息,并對種種因素造成的退化現(xiàn)象進行復(fù)原。某人聲音有雜音模糊圖像清晰圖像清晰聲音圖像預(yù)處理語音信號預(yù)處理3.特征抽取

由信息獲取部分獲得的原始數(shù)據(jù)量一般是相當(dāng)大的。為了有效地實現(xiàn)分類識別,要對原始數(shù)據(jù)進行選擇或變換,得到最能反應(yīng)分類本質(zhì)的待征,構(gòu)成特征向量。這就是特征抽取的過程。人臉幾何特征人臉部件規(guī)一化的點間距離和比率特征點如眼角、嘴角、鼻尖等人臉的顏色特征

黃皮膚、黑眼睛統(tǒng)計特征臉形模板和圖象灰度的自相關(guān)性

4.分類器設(shè)計為了把待識模式分配到各自的模式類中去,必須設(shè)計出分類判別規(guī)則?;咀鞣ㄊ牵河靡欢〝?shù)量的樣本(稱為訓(xùn)練樣本集)確定出一套分類判別規(guī)則,使得按這套分類判別規(guī)則對待識模式進行分類所造成的錯誤識別率最小或引起約損失最小。分類器按已確定的分類判別規(guī)則對待識模式進行分類判別,輸出分類結(jié)果?!?-4模式識別的基本問題一、模式(樣本)表示方法向量表示:假設(shè)一個樣本有n個變量(特征)

x=(x1,x2,…,xn)T2.矩陣表示:N個樣本,n個變量(特征)3.幾何表示

一維表示

X1=1.5,X2=3

二維表示X1=(x1,x2)T=(1,2)T

X2=(x1,x2)T=(2,1)T

三維表示X1=(x1,x2,x3)T=(1,1,0)T

X2=(x1,x2,x3)T=(1,0,1)Tx1x2x3x1x24.基元(鏈碼)表示:在右側(cè)的圖中八個基元分別表示:0,1,2,3,4,5,6,7,八個方向和基元線段長度。則右側(cè)樣本可以表示為X1=006666這種方法將在句法模式識別中用到。5一些基本問題模式類的緊致性:集合中任意兩個內(nèi)點可以用光滑線連接,在該連線上的點也屬于這個集合。每個內(nèi)點都有一個足夠大的鄰域,在該鄰域中只包含同一集合中的點。緊致集要求臨界點要比較少假若每個模式類都滿足緊致性假設(shè),則解決模式識別間題就不會碰到什么原則上的困難。但對于很多實際問題這個假設(shè)是不成立的。只要各個模式類是可分的,總存在這樣一個空間,使變換到這個空間中的集合滿足緊致性要求。5一些基本問題相似與分類:相似與分類問題遠不像集合表達那樣簡單明了。集合的概念可用來表現(xiàn)已經(jīng)分好的類,但對于怎樣分類和歸類則缺乏指導(dǎo)意義。

用各種距離表示相似性:已知兩個樣本

xi=(xi1,xi2,xi3,…,xin)Txj=(xj1,xj2,xj3,…,xjn)T

5一些基本問題5一些基本問題②歐幾里德距離①絕對值距離③明考夫斯基距離其中當(dāng)q=1時為絕對值距離,當(dāng)q=2時為歐氏距離5一些基本問題④切比雪夫距離⑤夾角余弦x4x5x1x2x3因為x1,x2的夾角小,所以x1,x2最相似。其中Xi,Xj為特征向量,為協(xié)方差矩陣。使用于N個樣本的集合中兩個樣本之間求M氏距離:⑤馬哈拉諾比斯(Mahalanobis)距離N——樣本個數(shù)例:馬哈拉諾比斯(Mahalanobis)距離:設(shè)X1=(0,0)T,X2=(0,1)T,X3=(1,0)T,X4=(1,1)T.則N=4,兩點之間的馬氏距離X1X2X3X4兩點之間的歐氏距離都具對稱性。但數(shù)值不同。歐氏距離的計算步驟:1.求樣本均值;2.求協(xié)方差矩陣;3.求協(xié)方差矩陣的逆矩陣;4。按公式求兩點間馬氏距離。如:1,3,5,7,9與2,4,6,8,10的相關(guān)系數(shù)為1;1,3,5,7,9與10,8,6,4,2的相關(guān)系數(shù)為-1;注意:在求相關(guān)系數(shù)之前,要將數(shù)標準化*相關(guān)系數(shù)分別的均值:其中,Xi=(xi1,xi2,…,xin),Xj=(xj1,xj2,…,xjn).分類的主觀性和客觀性①分類帶有主觀性:目的不同,分類不同。例如:鯨魚,牛,馬從生物學(xué)的角度來講都屬于哺乳類,但是從產(chǎn)業(yè)角度來講鯨魚屬于水產(chǎn)業(yè),牛和馬屬于畜牧業(yè)。②分類的客觀性:科學(xué)性

判斷分類必須有客觀標準,因此分類是追求客觀性的,但主觀性也很難避免,這就是分類的復(fù)雜性??磕男┨卣鳑Q定相似并進行分類,取決于行為的目的和方法。5一些基本問題范例木板圖象512×512d=3長度紋理亮度

c=2松木\樺木維數(shù)無限有限/很大R有限d不大c模式識別過程d<<R<無限模式采集模式空間特征提取/選擇類型空間分類特征空間客觀世界待識別對象識別過程錯誤概率檢測制定分類的判決規(guī)則特征提取/選擇方法校正學(xué)習(xí)過程采集方法校正已知對象預(yù)處理應(yīng)用領(lǐng)域1.4模式識別的應(yīng)用應(yīng)用領(lǐng)域生物醫(yī)學(xué):血細胞計數(shù),染色體分類,心電腦電圖1.4模式識別的應(yīng)用應(yīng)用領(lǐng)域文字處理:文字識別(印刷體,手寫體漢字識別);辦公自動化(機器翻譯);銀行(支票識別);郵局(郵政信函的自動分揀)。遙感:資源普查(對地形地貌的分析,森林資源、海洋資源的普查,湖水面積的計算),地圖識別……1.4模式識別的應(yīng)用紙幣識別器對紙幣按面額進行分類

面額

系統(tǒng)實例5元10元20元50元100元 長度(mm)寬度(mm) 5元 136 63 10元 141 70 20元 146 70 50元 151 70 100元 156 77 磁性 金屬條位置(大約) 5元 有 54/82 10元 有 54/87 20元 有 57/89 50元 有 60/91 100元 有 63/935元10元20元50元100元12345678反射光波形數(shù)據(jù)采集、特征提?。?/p>

長度、寬度、磁性、磁性的位置,光反射亮度、光透射亮度等等

特征選擇:

長度、磁性及位置、反射亮度分類識別:

確定紙幣的面額及真?zhèn)螐臄z像頭獲取包含車牌的彩色圖象車牌定位和獲取字符分割和識別輸入圖象特征提取粗略

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論