




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
復習要點緒論舉出日常生活或技術(shù)、學術(shù)領(lǐng)域中應(yīng)用模式識別理論解決問題的實例。答:我的本科畢設(shè)內(nèi)容和以后的研究方向為重癥監(jiān)護病人的狀態(tài)監(jiān)測與預(yù)診斷,其中的第一步就是進行ICU病人的死亡率預(yù)測,與模式識別理論密切相關(guān)。主要的任務(wù)是分析數(shù)據(jù)庫的8000名ICU病人,統(tǒng)計分析死亡與非死亡的生理特征,用于分析預(yù)測新進ICU病人的病情狀態(tài)。按照模式識別的方法步驟,首先從數(shù)據(jù)庫中采集數(shù)據(jù),包括病人的固有信息,生理信息,事件信息等并分為死亡組和非死亡組,然后分別進行數(shù)據(jù)的預(yù)處理,剔除不正常數(shù)據(jù),對數(shù)據(jù)進行插值并取中值進行第一次特征提取,然后利用非監(jiān)督學習的方法即聚類分析進行第二次特征提取,得到訓練樣本集和測試樣本集。分別利用判別分析,人工神經(jīng)網(wǎng)絡(luò),支持向量機的方法進行訓練,測試,得到分類器,實驗效果比傳統(tǒng)ICU中采用的評價預(yù)測系統(tǒng)好一些。由于兩組數(shù)據(jù)具有較大重疊,特征提取,即提取模式特征就變得尤為重要。語音識別,圖像識別,車牌識別,文字識別,人臉識別,通信中的信號識別;①文字識別漢字已有數(shù)千年的歷史,也是世界上使用人數(shù)最多的文字,對于中華民族燦爛文化的形成和開展有著不可磨滅的功勛。所以在信息技術(shù)及計算機技術(shù)日益普及的今天,如何將文字方便、快速地輸入到計算機中已成為影響人機接口效率的一個重要瓶頸,也關(guān)系到計算機能否真正在我過得到普及的應(yīng)用。目前,漢字輸入主要分為人工鍵盤輸入和機器自動識別輸入兩種。其中人工鍵入速度慢而且勞動強度大;自動輸入又分為漢字識別輸入及語音識別輸入。從識別技術(shù)的難度來說,手寫體識別的難度高于印刷體識別,而在手寫體識別中,脫機手寫體的難度又遠遠超過了聯(lián)機手寫體識別。到目前為止,除了脫機手寫體數(shù)字的識別已有實際應(yīng)用外,漢字等文字的脫機手寫體識別還處在實驗室階段。②語音識別語音識別技術(shù)技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。近年來,在生物識別技術(shù)領(lǐng)域中,聲紋識別技術(shù)以其獨特的方便性、經(jīng)濟性和準確性等優(yōu)勢受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌豺炞C方式。而且利用基因算法訓練連續(xù)隱馬爾柯夫模型的語音識別方法現(xiàn)已成為語音識別的主流技術(shù),該方法在語音識別時識別速度較快,也有較高的識別率。③指紋識別我們手掌及其手指、腳、腳趾內(nèi)側(cè)外表的皮膚凹凸不平產(chǎn)生的紋路會形成各種各樣的圖案。而這些皮膚的紋路在圖案、斷點和交叉點上各不相同,是唯一的。依靠這種唯一性,就可以將一個人同他的指紋對應(yīng)起來,通過比擬他的指紋和預(yù)先保存的指紋進行比擬,便可以驗證他的真實身份。一般的指紋分成有以下幾個大的類別:環(huán)型(loop),螺旋型(whorl),弓型(arch),這樣就可以將每個人的指紋分別歸類,進行檢索。指紋識別根本上可分成:預(yù)處理、特征選擇和模式分類幾個大的步驟。③遙感遙感圖像識別已廣泛用于農(nóng)作物估產(chǎn)、資源勘察、氣象預(yù)報和軍事偵察等。④醫(yī)學診斷在癌細胞檢測、X射線照片分析、血液化驗、染色體分析、心電圖診斷和腦電圖診斷等方面,模式識別已取得了成效。假設(shè)要實現(xiàn)汽車車牌自動識別,你認為應(yīng)該有哪些處理步驟?分別需要哪些模式識別方法?試用流程圖予以說明。答:汽車車牌自動識別需要有以下三大步驟:(1)獲取包含車牌的彩色圖像〔2〕實現(xiàn)車牌定位和獲取〔3〕進行字符分割和識別,詳細操作如流程圖所示。第一步需要建立字符庫,即根據(jù)字符的二值圖像進行處理生成特征字符庫;第二步通過攝像頭獲取包含車牌的彩色圖像,輸入圖像;第三步利用主成分分析法、K-L變換,MDS和KPCA等方法對車牌進行特征識別;第四步對車牌進行粗略定位和精細定位,如VMLA定位,基于邊緣檢測的方法,基于水平灰度變化特征的方法,基于車牌顏色特征的方法等。第五步利用分類器確定車牌類型之后對字符進行分割,對圖像進行預(yù)處理,去除鉚釘,谷值分析,模板匹配,二值化投影法等第六步分割成得單個字符進行模式識別,得到每個字符,然后組合輸出結(jié)果,具體的方法為統(tǒng)計學習或人工神經(jīng)網(wǎng)絡(luò)等。輸入圖像輸入圖像特征提取粗略定位精細定位確定類型分割字符識別,輸出統(tǒng)計決策3、最小錯誤率貝葉斯決策方法與最小風險貝葉斯決策方法4、正態(tài)分布下最小錯誤率決策與Neyman-Pearson決策方法〔1〕假設(shè)在某個地區(qū)的細胞識別中正常和異常兩類的先驗概率分別為正常狀態(tài):異常狀態(tài):現(xiàn)有一待識的細胞,其觀測值為,從類條件概率密度分布曲線上查得并且損失系數(shù)為11=0,12=1,21=6,22=0。試對該細胞以以下兩種方法進行分類:①基于最小錯誤概率準那么的貝葉斯判決;②基于最小風險的貝葉斯判決。解:①基于最小錯誤概率準那么的貝葉斯判決②基于最小風險的貝葉斯判決〔2〕兩個一維模式類別的類概率密度函數(shù)為先驗概率P(1)=P(2),損失函數(shù),11=22=0,12=0.6,21=0.4?!?〕求最小平均損失Bayes判決函數(shù);〔2〕求總的誤判概率P(e);解:先求先驗概率:、求條件風險:期望風險要求最小,當時滿足要求,即〔3〕對于這個兩類一維問題,假設(shè)這兩類的類概率密度分別服從正態(tài)分布N(0,2)和N(1,2),證明使平均決策風險最小的決策閾值為這里,假設(shè)風險函數(shù)11=22=0。一維正態(tài)分布:解:先求先驗概率:、求條件風險:期望風險要求最小,當時滿足要求,即概率密度函數(shù)估計最大似然估計方法與貝葉斯估計方法答:最大似然估計是把待估的參數(shù)看作固定的未知量,而貝葉斯估計那么是把待估的參數(shù)作為具有某種先驗分布的隨機變量,通過對第i類學習樣本Xi的觀察,使概率密度分布P(Xi/θ)轉(zhuǎn)化為后驗概率P(θ/Xi),再求貝葉斯估計。設(shè)以下兩類模式均為正態(tài)分布
1:{(0,0)T,(2,0)T,(2,2)T,(0,2)T}
2:{(4,4)T,(6,4)T,(6,6)T,(4,6)T}
設(shè)P(