模式識(shí)別精彩試題及總結(jié)材料_第1頁
模式識(shí)別精彩試題及總結(jié)材料_第2頁
模式識(shí)別精彩試題及總結(jié)材料_第3頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、一、填空與選擇填空(本題答案寫在此試卷上,30分)1、 模式識(shí)別系統(tǒng)的基本構(gòu)成單元包括:模式采集 、特征提取與選擇和 模式分類。2、 統(tǒng)計(jì)模式識(shí)別中描述模式的方法一般使用特真矢量 ;句法模式識(shí)別中模式描述方法一般有串樹、網(wǎng)。3、聚類分析算法屬于(1);判別域代數(shù)界面方程法屬于(3)。(1)無監(jiān)督分類 (2)有監(jiān)督分類(3)統(tǒng)計(jì)模式識(shí)別方法(4)句法模式識(shí)別方法4、若描述模式的特征量為0-1二值特征量,則一般采用(4)進(jìn)行相似性度量。(1)距離測度(2)模糊測度(3)相似測度(4)匹配測度5、下列函數(shù)可以作為聚類分析中的準(zhǔn)則函數(shù)的有(1)( 3)( 4)(1)八恥態(tài)(2)隔矇j-i 1-13 =

2、 2 (函-兩(函-m) 二6、 Fisher線性判別函數(shù)的求解過程是將N維特征矢量投影在(2) 中進(jìn)行。(1) 二維空間(2) 維空間(3) N-1維空間7、 下列判別域界面方程法中只適用于線性可分情況的算法有(1);線性可分、不可分都適用的有(3)(1)感知器算法(2) H-K算法(3)積累位勢函數(shù)法8、下列四元組中滿足文法定義的有(1)( 2)( 4)(1)( A,B,0, 1,A 01, A0 A1 ,A-. 1 A0 , B-.BA , B )0, A)(2)( A, 0, 1, A 0, A; 0 A,A)(3)( S, a,b, S 00 S, S11 S, S-00,S 11,

3、S)(4)(A, 0, 1, A 01, A 0A1, A 1 A0,A)9、 影響層次聚類算法結(jié)果的主要因素有(計(jì)算模式距離的測度、(聚類準(zhǔn)則、類間距離門限、預(yù)定的類別數(shù)目)。10、歐式距離具有(1、2);馬式距離具有(1、2、3、4)。(1)平移不變性(2)旋轉(zhuǎn)不變性(3)尺度縮放不變性(4)不受量綱影響的特性11、線性判別函數(shù)的正負(fù)和數(shù)值大小的幾何意義是( 正(負(fù))表示樣本點(diǎn)位于判別界面法向量指向的正(負(fù))半空間中;絕對(duì)值正比于樣本點(diǎn)到判別界面的距離。)。12、感知器算法 丄。(1)只適用于線性可分的情況;(2 )線性可分、不可分都適用。13、 積累勢函數(shù)法較之于 H-K算法的優(yōu)點(diǎn)是(該

4、方法可用于非線性可分情況(也可用于線性可分情況);K (x= H kK(x,Xk )位勢函數(shù)K(x,x k)與積累位勢函數(shù) K(x)的關(guān)系為(Xk.x)。14、 在統(tǒng)計(jì)模式分類問題中,聶曼 -皮爾遜判決準(zhǔn)則主要用于(某一種判決錯(cuò)誤較另一種判決錯(cuò)誤更為重要)情況;最小最大判決準(zhǔn)則主要用于(先驗(yàn)概率未知的)情況。15、 “特征個(gè)數(shù)越多越有利于分類”這種說法正確嗎?(錯(cuò)誤)。特征選擇的主要目的是(從n個(gè)特征中選出最有利于分類的的m個(gè)特征(mn )的條件下,可以使用分支定界法以減少計(jì)算量。16、散度Jij越大,說明國i類模式與 類模式的分布(差別越大);當(dāng)oi類模式與 類模式的分 布相同時(shí),Jij=

5、( 0 )。17、 已知有限狀態(tài)自動(dòng)機(jī) Af=,Q,、,qO, F), =0,1 ; Q=qO, q1 ;,:、(qO , 0)= q1,(q0,1)= q1,(q1 ,0)=q0,、(q1,1)=q0 ; q0=q0; F=q0。現(xiàn)有輸入字符串:(a) 00011101011, (b) 1100110011 ,,試問,用 Af對(duì)上述字符串進(jìn)行分類的結(jié)果為(3 1:a,d;32:b,c)。18、 影響聚類算法結(jié)果的主要因素有(_)。已知類別的樣本質(zhì)量;分類準(zhǔn)則;特征選?。荒J较嗨菩詼y度。19、 模式識(shí)別中,馬式距離較之于歐式距離的優(yōu)點(diǎn)是(_)。平移不變性;旋轉(zhuǎn)不變性;尺度不變性;考慮了模式的分

6、布。20、 基于二次準(zhǔn)則函數(shù)的 H-K算法較之于感知器算法的優(yōu)點(diǎn)是(_)??梢耘袆e問題是否線性可分;其解完全適用于非線性可分的情況;其解的適應(yīng)性更好;計(jì)算量小。21、 影響基本C均值算法的主要因素有( )。樣本輸入順序;模式相似性測度;聚類準(zhǔn)則;初始類心的選取。22、 位勢函數(shù)法的積累勢函數(shù)K(x)的作用相當(dāng)于Bayes判決中的(_)。先驗(yàn)概率;后驗(yàn)概率;類概率密度;類概率密度與先驗(yàn)概率的乘積。23、在統(tǒng)計(jì)模式分類問題中,當(dāng)先驗(yàn)概率未知時(shí),可以使用(_)。最小損失準(zhǔn)則;最小最大損失準(zhǔn)則;最小誤判概率準(zhǔn)則;N-P判決。24、在()情況下,用分支定界法做特征選擇計(jì)算量相對(duì)較少。Gdn, (n為原特

7、征個(gè)數(shù),d為要選出的特征個(gè)數(shù));樣本較多;選用的可分性判據(jù) J對(duì)特征 數(shù)目單調(diào)不減;選用的可分性判據(jù)J具有可加性。25、散度Jd是根據(jù)(_)構(gòu)造的可分性判據(jù)。先驗(yàn)概率;后驗(yàn)概率;類概率密度;信息熵;幾何距離。26、 似然函數(shù)的概型已知且為單峰,則可用(_)估計(jì)該似然函數(shù)。矩估計(jì);最大似然估計(jì); Bayes估計(jì);Bayes學(xué)習(xí);Parzen窗法。27、Kn近鄰元法較之Parzen窗法的優(yōu)點(diǎn)是(一_)。所需樣本數(shù)較少;穩(wěn)定性較好;分辨率較高;連續(xù)性較好。28、從分類的角度講,用 DKLT做特征提取主要利用了 DKLT的性質(zhì):(_)。使變換后的矢)。變換產(chǎn)生的新分量正交或不相關(guān);以部分新的分量表示原

8、矢量均方誤差最??;量能量更趨集中;29、一般,剪輯k-NN最近鄰方法在(_)的情況下效果較好。樣本數(shù)較大;樣本數(shù)較?。粯颖境蕡F(tuán)狀分布;樣本呈鏈狀分布。30、 如果以特征向量的相關(guān)系數(shù)作為模式相似性測度,則影響聚類算法結(jié)果的主要因素有已知類別樣本質(zhì)量;分類準(zhǔn)則;特征選??;量綱。二、(15分)簡答及證明題(1)影響聚類結(jié)果的主要因素有那些?(2)證明馬氏距離是平移不變的、非奇異線性變換不變的。答:(1 )分類準(zhǔn)則,模式相似性測度,特征量的選擇,量綱。(2)證明:(2分)(2分)(1分)(1分)護(hù)爲(wèi)即=(% 一禺j廠1國一引1池卩二一憑_歛驚_対設(shè),有非奇異線性變換:1 m勺二砂g-丙-莎 m=R苕

9、(町展)隔-広)1 用1 m=七吉區(qū)-交)厲- 5)W=沁冷厲莎戶仇-丹y羅說-號(hào))二隅-闿席-呵二化引加7%區(qū)-引=區(qū)_虧)蟲3忌4尸衛(wèi)& 一右)=(呂_f 乂“右I/(鬲-鬲)=(石-刃yk (爲(wèi)一刃)-;(:)(4 分)三、(8分)說明線性判別函數(shù)的正負(fù)和數(shù)值大小在分類中的意義并證明之。答:(1)( 4分)必初的絕對(duì)值0任丿正比于亍到超平面d(初=0的距離山平面ji的方程可以寫成式中1-1 -:1是平面71的單位法矢量,上式可寫成設(shè)是平面H中的任一點(diǎn),二是特征空間 r 中任一點(diǎn),點(diǎn)二到平面一的距離為差矢量 (花肉 在上的投影的絕對(duì)值,即梯二碼二必二龍-動(dòng)1二獻(xiàn)-莎囪岡廣(1-1)F;亍+

10、我| nr上式中利用了 /在平面|中,故滿足方程式(1-1)的分子為判別函數(shù)絕對(duì)值,上式表明,的值正比于】到超平面 d(初二 0 的距離-,一個(gè)特征矢量代入判別函數(shù)后所得值的絕對(duì)值越大表明該特征點(diǎn)距判別界面越遠(yuǎn)。(2)(4分)的正(負(fù))反映:在超平面 d(AO 的正(負(fù))側(cè)兩矢量:;和 (右肉 的數(shù)積為0;反之,當(dāng).廣” 一”“心一,(2 分)顯然,當(dāng);和夾角小于.一時(shí),即.在.指向的那個(gè)半空間中,和代一勿夾角大于90”時(shí),即亍在分背向的那個(gè)半空間中,岡狀.P)丿0。由于%,故ng和宀卞叩同號(hào)。所以,當(dāng)】在指向的半空間中時(shí),】一ri;當(dāng)】在:背向的半 空間中,汕:口點(diǎn)。判別函數(shù)值的正負(fù)表示出特

11、征點(diǎn)位于哪個(gè)半空間中,或者換句話說,表示特 征點(diǎn)位于界面的哪一側(cè)。五、(12分,每問4分)在目標(biāo)識(shí)別中,假定有農(nóng)田和裝甲車兩種類型,類型.1和類型.2分別代表農(nóng)田和裝甲車,它們的先驗(yàn)概率分別為0.8和0.2,損失函數(shù)如表1所示?,F(xiàn)在做了三次試驗(yàn),獲得三個(gè)樣本的類概率密度如下:J: 0.3,0.1,0.6p(x/叭):0.7 , 0.8 , 0.3(1)試用貝葉斯最小誤判概率準(zhǔn)則判決三個(gè)樣本各屬于哪一個(gè)類型;(2)假定只考慮前兩種判決,試用貝葉斯最小風(fēng)險(xiǎn)準(zhǔn)則判決三個(gè)樣本各屬于哪一類;(3)把拒絕判決考慮在內(nèi),重新考核三次試驗(yàn)的結(jié)果。表1判決損失類型X叫1145111P) - 3 刊如離)_ 3解

12、:由題可知,險(xiǎn)丨如_ P(西丨_| ;_ 1 一 , _| :. -1;(1) ( 4分)根據(jù)貝葉斯最小誤判概率準(zhǔn)則知:戶(罰|昭)P(Qj戶區(qū)|遇)*(購)P(再|(zhì)硝)*(曲)-1 . -匕,則可以任判;_ 1 一人,則判為_:1 ,則判為I】;鞏碼)(血-卷)_0死-1)_4W H 二(2)(4分)由題可知: 尸)(血血)0-7(4-1)7P(可)J則,判為匚;戶(巧1碼)吒4,判為1 ;尺也1碼)/_,判為;(3)(4分)對(duì)于兩類問題,對(duì)于樣本:,假設(shè)亠已知,有R(対I x)=久(礙I遢)F(碼I x) +2(勺|嶼)H嶼I x)=_ q(礙|碼)zy |碼)刊碼)+昭烏)戸(兀|碼)卩

13、(叫)%)則對(duì)于第一個(gè)樣本,2x0.21dw一荻0214E21尺(鯊丨力一,氏(鯊閃一用|x)二;廠,則拒判;“1.03 “. 0.59 $ , , 0.247?釦力=,(21 兀)=1 = 7T- - f-.,則拒判;a , ,078 “,2.19 少,0.51R(釦 x) = -7R(a21 忑)=(備 |忑)二亍1,拒判。1. 監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí)的區(qū)別:監(jiān)督學(xué)習(xí)方法用來對(duì)數(shù)據(jù)實(shí)現(xiàn)分類,分類規(guī)則通過訓(xùn)練獲得。該訓(xùn)練集由帶分類號(hào)的數(shù)據(jù)集組成,因此監(jiān)督學(xué) 習(xí)方法的訓(xùn)練過程是離線的。非監(jiān)督學(xué)習(xí)方法不需要單獨(dú)的離線訓(xùn)練過程,也沒有帶分類號(hào)(標(biāo)號(hào))的訓(xùn)練數(shù)據(jù)集,一般用來對(duì)數(shù)據(jù)集進(jìn)行 分析,如聚類,

14、確定其分布的主分量等。(實(shí)例:道路圖)就道路圖像的分割而言,監(jiān)督學(xué)習(xí)方法則先在訓(xùn)練用圖像中獲取道路象素與非道路象素集,進(jìn)行分類器設(shè)計(jì),然后用所設(shè)計(jì)的分類器對(duì)道路圖像進(jìn)行分割。使用非監(jiān)督學(xué)習(xí)方法,則依據(jù)道路路面象素與非道路象素之間的聚類分析進(jìn)行聚類運(yùn)算,以實(shí)現(xiàn)道路圖像的分割。2. 動(dòng)態(tài)聚類是指對(duì)當(dāng)前聚類通過迭代運(yùn)算改善聚類;分級(jí)聚類則是將樣本個(gè)體,按相似度標(biāo)準(zhǔn)合并,隨著相似度要求的降低實(shí)現(xiàn)合并。3. 線性分類器三種最優(yōu)準(zhǔn)則:Fisher準(zhǔn)則:根據(jù)兩類樣本一般類內(nèi)密集,類間分離的特點(diǎn),尋找線性分類器最佳的法線向量方向,使兩類樣 本在該方向上的投影滿足類內(nèi)盡可能密集,類間盡可能分開。該種度量通過類內(nèi)

15、離散矩陣 Sw和類間離散矩陣Sb實(shí)現(xiàn)。感知準(zhǔn)則函數(shù):準(zhǔn)則函數(shù)以使錯(cuò)分類樣本到分界面距離之和最小為原則。其優(yōu)點(diǎn)是通過錯(cuò)分類樣本提供的信息對(duì)分類器函數(shù)進(jìn)行修正,這種準(zhǔn)則是人工神經(jīng)元網(wǎng)絡(luò)多層感知器的基礎(chǔ)。支持向量機(jī):基本思想是在兩類線性可分條件下,所設(shè)計(jì)的分類器界面使兩類之間的間隔為最大,它的基本岀發(fā)點(diǎn)是使期望泛化風(fēng)險(xiǎn)盡可能小。一、試問模式”與模式類”的含義。如果一位姓王的先生是位老年人,試問王先生”和老頭”誰是模式,誰是模式類?答:在模式識(shí)別學(xué)科中,就模式”與模式類”而言,模式類是一類事物的代表,概念或典型,而模式”則是某一事物的具體體現(xiàn),如老頭”是模式類,而王先生則是 模式”是老頭”的具體化。二

16、、試說明Mahalanobis距離平方的定義,到某點(diǎn)的 Mahalanobis距離平方為常數(shù)的軌跡的幾何意義,它與歐氏距 離的區(qū)別與聯(lián)系。答:Mahalanobis距離的平方定義為:rJ(xlu) = (x-u)r21(x-u)其中x,u為兩個(gè)數(shù)據(jù), 是一個(gè)正定對(duì)稱矩陣(一般為協(xié)方差矩陣)。根據(jù)定義,距某一點(diǎn)的Mahalanobis 距離相等點(diǎn)的軌跡是超橢球,如果是單位矩陣厶貝U Mahalanobis距離就是通常的歐氏距離。三、試說明用監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí)兩種方法對(duì)道路圖像中道路區(qū)域的劃分的基本做法,以說明這兩種學(xué)習(xí)方法 的定義與它們間的區(qū)別。答:監(jiān)督學(xué)習(xí)方法用來對(duì)數(shù)據(jù)實(shí)現(xiàn)分類,分類規(guī)則通過

17、訓(xùn)練獲得。該訓(xùn)練集由帶分類號(hào)的數(shù)據(jù)集組成, 因此監(jiān)督學(xué)習(xí)方法的訓(xùn)練過程是離線的。非監(jiān)督學(xué)習(xí)方法不需要單獨(dú)的離線訓(xùn)練過程,也沒有帶分類號(hào)(標(biāo)號(hào))的訓(xùn)練數(shù)據(jù)集,一般用來對(duì)數(shù)據(jù) 集進(jìn)行分析,如聚類,確定其分布的主分量等。就道路圖像的分割而言,監(jiān)督學(xué)習(xí)方法則先在訓(xùn)練用圖像中獲取道路象素與非道路象素集,進(jìn)行分類器 設(shè)計(jì),然后用所設(shè)計(jì)的分類器對(duì)道路圖像進(jìn)行分割。使用非監(jiān)督學(xué)習(xí)方法,則依據(jù)道路路面象素與非道路象素之間的聚類分析進(jìn)行聚類運(yùn)算,以實(shí)現(xiàn)道路圖 像的分割。四、試述動(dòng)態(tài)聚類與分級(jí)聚類這兩種方法的原理與不同。答:動(dòng)態(tài)聚類是指對(duì)當(dāng)前聚類通過迭代運(yùn)算改善聚類;分級(jí)聚類則是將樣本個(gè)體,按相似度標(biāo)準(zhǔn)合并,隨著相

18、似度要求的降低實(shí)現(xiàn)合并五、如果觀察一個(gè)時(shí)序信號(hào)時(shí)在離散時(shí)刻序列得到的觀察量序列表示為-,而該時(shí)序信號(hào)的內(nèi)在狀態(tài)序列表示成一. o如果計(jì)算在給定 0條件下岀現(xiàn)S的概率,試問此概率是何種概率。如果從觀察序列來估計(jì)狀態(tài)序列的最大似然估計(jì),這與Bayes決策中基于最小錯(cuò)誤率的決策有什么關(guān)系。答:在給定觀察序列-條件下分析它由某個(gè)狀態(tài)序列S產(chǎn)生的概率似后驗(yàn)概率,寫成P(S|O),而通過0求對(duì)狀態(tài)序列的最大似然估計(jì),與貝葉斯決策的最小錯(cuò)誤率決策相當(dāng)r 1 1/211/2 1六、已知一組數(shù)據(jù)的協(xié)方差矩陣為I丿,試問1. 協(xié)方差矩陣中各元素的含義。2. 求該數(shù)組的兩個(gè)主分量。3. 主分量分析或稱K-L變換,它

19、的最佳準(zhǔn)則是什么?4. 為什么說經(jīng)主分量分析后,消除了各分量之間的相關(guān)性。r 1答:協(xié)方差矩陣為口煌1丿,則2)主分量,通過求協(xié)方差矩陣的特征值,用相應(yīng)的特征向量為:二,對(duì)應(yīng)特征向量為5=1,對(duì)應(yīng)1)對(duì)角元素是各分量的方差,非對(duì)角元素是各分量之間的協(xié)方差。這兩個(gè)特征向量即為主分量。3) K-L變換的最佳準(zhǔn)則為:對(duì)一組數(shù)據(jù)進(jìn)行按一組正交基分解,在只取相同數(shù)量分量的條件下, 以均方誤差計(jì)算截尾誤差最小。4) 在經(jīng)主分量分解后,協(xié)方差矩陣成為對(duì)角矩陣,因而各主分量間相關(guān)消除。七、試說明以下問題求解是基于監(jiān)督學(xué)習(xí)或是非監(jiān)督學(xué)習(xí):1. 求數(shù)據(jù)集的主分量2. 漢字識(shí)別3. 自組織特征映射4. CT圖像的分

20、割答:1、求數(shù)據(jù)集的主分量是非監(jiān)督學(xué)習(xí)方法;2、 漢字識(shí)別對(duì)待識(shí)別字符加上相應(yīng)類別號(hào)一一有監(jiān)督學(xué)習(xí)方法;3、 自組織特征映射 一一將高維數(shù)組按保留近似度向低維映射 一一非監(jiān)督學(xué)習(xí);4、CT圖像分割一一按數(shù)據(jù)自然分布聚類 一一非監(jiān)督學(xué)習(xí)方法;八、試列舉線性分類器中最著名的三種最佳準(zhǔn)則以及它們各自的原理。答:線性分類器三種最優(yōu)準(zhǔn)則:Fisher準(zhǔn)則:根據(jù)兩類樣本一般類內(nèi)密集,類間分離的特點(diǎn),尋找線性分類器最佳的法線向量方向,使兩類樣本在該方向上的投影滿足類內(nèi)盡可能密集,類間盡可能分開。該種度量通過類內(nèi)離散矩陣 Sw和類間離散矩陣Sb實(shí)現(xiàn)。感知準(zhǔn)則函數(shù):準(zhǔn)則函數(shù)以使錯(cuò)分類樣本到分界面距離之和最小為原

21、則。其優(yōu)點(diǎn)是通過錯(cuò)分類樣本提供的信息對(duì)分類器函數(shù)進(jìn)行修正,這種準(zhǔn)則是人工神經(jīng)元網(wǎng)絡(luò)多層感知器的 基礎(chǔ)。支持向量機(jī):基本思想是在兩類線性可分條件下,所設(shè)計(jì)的分類器界面使兩類之間的間隔為最大,它的基本出發(fā)點(diǎn)是使期望泛化風(fēng)險(xiǎn)盡可能小。九、在一兩維特征空間,兩類決策域由兩條直線H1和H2分界,其中匚: 二1 : II而包含H1與H2的銳角部分為第一類,其余為第二類。 試求:1 .用一雙層感知器構(gòu)造該分類器2用凹函數(shù)的并構(gòu)造該分類器1) H1與H2將空間劃分成四個(gè)部分,按使H1與H2大于零與小于零表示成四個(gè)區(qū)域,而第一類屬于(-TJ -Y -+? = 0丄 1+ )區(qū)域,為方便起見,令.-則第一類在(+

22、 + )區(qū)域。用雙層感知器,神經(jīng)元用一域值,則在第一類樣本輸入時(shí),兩隱層結(jié)點(diǎn)的輸出均為+1,其余則分別為(H ), ( ), ( + ),故可按圖設(shè)置域值。-0.5X1X2十、2)用凹函數(shù)的并表示:廠或表示成J,如一,則,設(shè)有兩類正態(tài)分布的樣本基于最小錯(cuò)誤率的貝葉斯決策分界面,分別為X2=0,以及Xi=3,其中兩類的協(xié)方差矩陣先驗(yàn)概率相等,并且有5答:設(shè)待求如=,待求由于 .1-, 先驗(yàn)概率相等。Ml =則基于最小錯(cuò)誤率的 Bayes決策規(guī)則,在兩類決策面分界面上的樣本. _ . . . (1)X應(yīng)滿足-1其中按題意(注:為方便起見,在下面計(jì)算中先去掉系數(shù)4/3 )。按題意分界面由x仁3及x2

23、=0兩條直線構(gòu)成,則分界面方程為二,Y Al :-二(2)對(duì)(1)式進(jìn)行分解有XT石収2詡琴X匡二XZ吹-2“茫摳+必石尢XT %)X - 2虻礦-必君)X +得! .j - .(3)由(3)式第一項(xiàng)得=XiQ- a) + 2 址聲,1/2 -b)+Xj(l - c)將(4)式與(2)式對(duì)比可知a=1,c=1又由c=1 與-, 得b2=1/4 , b有兩種可能,即 b=1/2或b=-1/2,如果b=1/2,則表明,此時(shí)分界面方程應(yīng)為線性,與題意不符,只有b=-1/2則(4)式為:2X1x2( 5)將相應(yīng)結(jié)果帶入(3)式第二項(xiàng)有=2=2=2(-12)r 1 1/21T1/2 172“ 3、r11

24、.()-如口21十#2(:)(6)則結(jié)合(5)( 2)應(yīng)有,則-( 7)如1*+和解得財(cái)=7陶2,F 1-1/21sa =得r 11/21-1/211/21九、證明在工正定或半正定時(shí),Mahalanobis距離r符合距離定義的三個(gè)條件,即(1) r(a,b)=r(b,a)(2) 當(dāng)且僅當(dāng)a=b時(shí),有r(a,b)=0(3) r(a,c) P() = 0182所以合理的決聶是把耳歸類于正常狀態(tài)2.尸伽=0” 1 p(x |馬)=0 4 人 ij G兀=0P(ws|jt)=0r 162牌:已知條件為|w1) = 0-氛A| j C*(31= 11根攜1紂訃篁結(jié)果可知后臉概率為叫|=仏再計(jì)算出無件風(fēng)險(xiǎn)

25、t-iRS: x = 1 尸(個(gè)1 |工)=) 81R由于RUix)RU-x)即決策為砂的條種鳳險(xiǎn)小于抉策為卿的條件鳳險(xiǎn),因此我們釆取決策行動(dòng)歟,即判斷待識(shí) 別的細(xì)胞工為氣類一異常細(xì)胞,將1與2柑對(duì)比,其分類給果IE好相反,這是因?yàn)檫@里影響決策結(jié)果的因索又多了一孑- 即-損失舄而且繭類錯(cuò)像決策所造成的損失相差很懸殊因此“損失就起了主導(dǎo)作用.十五、既然有線性判別函數(shù),為什么還要引進(jìn)非線性判別函數(shù)?試分析由“線性判別函數(shù)”向“非線性判別函數(shù)”推廣的思想和方法。答:實(shí)際中有很多模式識(shí)別問題并不是線性可分的,這時(shí)就需要采用非線性分類器,比如 當(dāng)兩類樣本分不具有多峰性質(zhì)并互相交錯(cuò)時(shí),簡單的線性判別函數(shù)往

26、往會(huì)帶來較大的分類 錯(cuò)誤。這時(shí),樹分類器作為一種分段線性分類器,常常能有效地應(yīng)用于這種情況。十六、1.什么是特征選擇?2.什么是Fisher線性判別?答:1.特征選擇就是從一組特征中挑選出一些最有效的特征以達(dá)到降低特征空間維數(shù)的目 的。2. Fisher線性判別:可以考慮把d維空間的樣本投影到一條直線上,形成一維空間,即把維數(shù)壓縮到一維,這在數(shù)學(xué)上容易辦到,然而,即使樣本在d維空間里形成若干緊湊的互相分得開的集群,如果把它們投影到一條任意的直線上,也可能使得幾類樣本混在一 起而變得無法識(shí)別。但是在一般情況下,總可以找到某個(gè)方向,使得在這個(gè)方向的直線上, 樣本的投影能分開得最好。問題是如何根據(jù)實(shí)

27、際情況找到這條最好的、最易于分類的投影 線,這就是Fisher算法所要解決的基本問題。十七、寫出兩類和多類情況下最小風(fēng)險(xiǎn)貝葉斯決策判別函數(shù)和決策面方程。兩類別問題:判別函數(shù)gi(x) = A11p(o1|x) + A12p(a)2|x) gzfe)=入十 心P(3x) 決策面方程:gl(x) = g2(x)匸類別問題;判別函數(shù)CgjW =工 Ajip(3j|M i = lr-.c 決策面方程:gi(x) = gj(x), i j i = j c j = L*-,c特征空間十八、請(qǐng)論述模式識(shí)別系統(tǒng)的主要組成部分及其設(shè)計(jì)流程,并簡述各組成部分中 常用方法的主要思想。信號(hào)空間信息獲?。和ㄟ^測量、采樣

28、和量化,可以用矩陣或向量表示二維圖像或以為波形。預(yù)處理:去除噪聲,加強(qiáng)有用的信息,并對(duì)輸入測量儀器或其他因素造成的退化現(xiàn)象進(jìn)行復(fù)原。特征選擇和提?。簽榱擞行У貙?shí)現(xiàn)分類識(shí)別,就要對(duì)原始數(shù)據(jù)進(jìn)行變換,得到最能反映 分類本質(zhì)的特征。分類決策:在特征空間中用統(tǒng)計(jì)方法把識(shí)別對(duì)象歸為某一類。十九、有兩類樣本集1T2T3T4TX1 =0,0,0, Xi =1,0,0, Xi =1,0,1,Xi =1,1,0x2 0,0,1T,X; =0,1,0T,X;=0,1,1T,X;=1,1,1T1. 用K-L變換求其二維特征空間,并求出其特征空間的坐標(biāo)軸;2. 使用Fisher線性判別方法給出這兩類樣本的分類面。/l

29、1-41-21-41-41-41-2-2_V61_V6J_V61_V31_V3_1V3對(duì)應(yīng)的坐標(biāo)丄IV3I-2_W2-V31 _V6(2)nh3-rl-i44134* m2 =413*4-4-6 1t所以判別函數(shù)為:g(x) =二十、定性說明基于參數(shù)方法和非參數(shù)方法的概率密度估計(jì)有什么區(qū)別?答:基于參數(shù)方法:是由已知類別的樣本集對(duì)總體分布的某些參數(shù)進(jìn)行統(tǒng)計(jì)推斷非參數(shù)方法:已知樣本所屬類別,但未知總體概率密度函數(shù)形式假設(shè)二類模式服從如下的正態(tài)分布:請(qǐng)分別求出便憶(;去)和tr(SJ ( =幾+ %)域大化的一維特征空間的變換一、矢量口答:2Sb =空(山_對(duì)1Sl = 512Lo5wLo(出_刃=# (山一出)(心出)T三:J1sw = -(1 + S3)=52-i=l因?yàn)樨档闹葹樨八灾挥幸粋€(gè)非零本征值昭是DX1矩陣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論