




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第四章 判別分析4.1 簡(jiǎn)述歐幾里得距離與馬氏距離的區(qū)別和聯(lián)系。答: 設(shè)p維歐幾里得空間中的兩點(diǎn)X=和Y=。那么歐幾里得距離為。歐幾里得距離的局限有在多元數(shù)據(jù)分析中,其度量不合理。會(huì)受到實(shí)際問(wèn)題中量綱的影響。設(shè)X,Y是來(lái)自均值向量為,協(xié)方差為的總體G中的p維樣本。那么馬氏距離為D(X,Y)=。當(dāng)即單位陣時(shí),D(X,Y)=即歐幾里得距離。因此,在一定程度上,歐幾里得距離是馬氏距離的特殊情況,馬氏距離是歐幾里得距離的推廣。4.2 試述判別分析的實(shí)質(zhì)。答:判別分析就是希望利用已經(jīng)測(cè)得的變量數(shù)據(jù),找出一種判別函數(shù),使得這一函數(shù)具有某種最優(yōu)性質(zhì),能把屬于不同類別的樣本點(diǎn)盡可能地區(qū)別開(kāi)來(lái)。設(shè)R1,R2,R
2、k是p維空間R p的k個(gè)子集,如果它們互不相交,且它們的和集為,那么稱為的一個(gè)劃分。判別分析問(wèn)題實(shí)質(zhì)上就是在某種意義上,以最優(yōu)的性質(zhì)對(duì)p維空間構(gòu)造一個(gè)“劃分,這個(gè)“劃分就構(gòu)成了一個(gè)判別規(guī)那么。4.3 簡(jiǎn)述距離判別法的根本思想和方法。答:距離判別問(wèn)題分為兩個(gè)總體的距離判別問(wèn)題和多個(gè)總體的判別問(wèn)題。其根本思想都是分別計(jì)算樣本與各個(gè)總體的距離馬氏距離,將距離近的判別為一類。兩個(gè)總體的距離判別問(wèn)題設(shè)有協(xié)方差矩陣相等的兩個(gè)總體G1和G2,其均值分別是m1和m 2,對(duì)于一個(gè)新的樣品X,要判斷它來(lái)自哪個(gè)總體。計(jì)算新樣品X到兩個(gè)總體的馬氏距離D2X,G1和D2X,G2,那么 X ,D2X,G1D2X,G2X
3、,D2X,G1> D2X,G2,具體分析, 記 那么判別規(guī)那么為 X ,W(X)X ,W(X)<0多個(gè)總體的判別問(wèn)題。設(shè)有個(gè)總體,其均值和協(xié)方差矩陣分別是和,且。計(jì)算樣本到每個(gè)總體的馬氏距離,到哪個(gè)總體的距離最小就屬于哪個(gè)總體。具體分析, 取,??梢匀【€性判別函數(shù)為, 相應(yīng)的判別規(guī)那么為 假設(shè) 4.4 簡(jiǎn)述貝葉斯判別法的基本思想和方法。根本思想:設(shè)k個(gè)總體,其各自的分布密度函數(shù),假設(shè)k個(gè)總體各自出現(xiàn)的概率分別為,。設(shè)將本來(lái)屬于總體的樣品錯(cuò)判到總體時(shí)造成的損失為,。設(shè)個(gè)總體相應(yīng)的維樣本空間為 。在規(guī)那么下,將屬于的樣品錯(cuò)判為的概率為 那么這種判別規(guī)那么下樣品錯(cuò)判后所造成的平均損失為
4、那么用規(guī)那么來(lái)進(jìn)行判別所造成的總平均損失為 貝葉斯判別法那么,就是要選擇一種劃分,使總平均損失到達(dá)極小。根本方法:令,那么 假設(shè)有另一劃分,那么在兩種劃分下的總平均損失之差為 因?yàn)樵谏蠈?duì)一切成立,故上式小于或等于零,是貝葉斯判別的解。從而得到的劃分為 4.5 簡(jiǎn)述費(fèi)希爾判別法的基本思想和方法。答:根本思想:從個(gè)總體中抽取具有個(gè)指標(biāo)的樣品觀測(cè)數(shù)據(jù),借助方差分析的思想構(gòu)造一個(gè)線性判別函數(shù) 系數(shù)可使得總體之間區(qū)別最大,而使每個(gè)總體內(nèi)部的離差最小。將新樣品的個(gè)指標(biāo)值代入線性判別函數(shù)式中求出值,然后根據(jù)判別一定的規(guī)那么,就可以判別新的樣品屬于哪個(gè)總體。4.6 試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的
5、異同。答: 費(fèi)希爾判別與距離判別對(duì)判別變量的分布類型無(wú)要求。二者只是要求有各類母體的兩階矩存在。而貝葉斯判別必須知道判別變量的分布類型。因此前兩者相對(duì)來(lái)說(shuō)較為簡(jiǎn)單。 當(dāng)k=2時(shí),假設(shè)那么費(fèi)希爾判別與距離判別等價(jià)。當(dāng)判別變量服從正態(tài)分布時(shí),二者與貝葉斯判別也等價(jià)。 當(dāng)時(shí),費(fèi)希爾判別用作為共同協(xié)差陣,實(shí)際看成等協(xié)差陣,此與距離判別、貝葉斯判別不同。 距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)那么是 X ,W(X)X ,W(X)<lnd距離判別的判別規(guī)那么是 X ,W(X)X ,W(X)<0二者的區(qū)別在于閾值點(diǎn)。當(dāng),時(shí),。二者完全相同。4.7 設(shè)有兩個(gè)二元總體和 ,從中分別
6、抽取樣本計(jì)算得到 , 假設(shè),試用距離判別法建立判別函數(shù)和判別規(guī)那么。 樣品X=6,0應(yīng)屬于哪個(gè)總體?解:= ,= , =即樣品X屬于總體4.8 某超市經(jīng)銷十種品牌的飲料,其中有四種暢銷,三種滯銷,三種平銷。下表是這十種品牌飲料的銷售價(jià)格元和顧客對(duì)各種飲料的口味評(píng)分、信任度評(píng)分的平均數(shù)。銷售情況產(chǎn)品序號(hào)銷售價(jià)格口味評(píng)分信任度評(píng)分暢銷158267339486平銷576687798滯銷8349421043 根據(jù)數(shù)據(jù)建立貝葉斯判別函數(shù),并根據(jù)此判別函數(shù)對(duì)原樣本進(jìn)行回判。 現(xiàn)有一新品牌的飲料在該超市試銷,其銷售價(jià)格為,顧客對(duì)其口味的評(píng)分平均為8,信任評(píng)分平均為5,試預(yù)測(cè)該飲料的銷售情況。解:增加grou
7、p變量,令暢銷、平銷、滯銷分別為group1、2、3;銷售價(jià)格為X1,口味評(píng)分為X2,信任度評(píng)分為X3,用spss 解題的步驟如下:1. 在SPSS窗口中選擇AnalyzeClassifyDiscriminate,調(diào)出判別分析主界面,將左邊的變量列表中的“group變量選入分組變量中,將X1、X2、X3變量選入自變量中,并選擇Enter independents together單項(xiàng)選擇按鈕,即使用所有自變量進(jìn)行判別分析。2. 點(diǎn)擊Define Range按鈕,定義分組變量的取值范圍。本例中分類變量的范圍為1到3,所以在最小值和最大值中分別輸入1和3。單擊Continue按鈕,返回主界面。如圖
8、 圖4.1 判別分析主界面3. 單擊Statistics按鈕,指定輸出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)。選中Function Coefficients欄中的Fishers:給出Bayes判別函數(shù)的系數(shù)。注意:這個(gè)選項(xiàng)不是要給出Fisher判別函數(shù)的系數(shù)。這個(gè)復(fù)選框的名字之所以為Fishers,是因?yàn)榘磁袆e函數(shù)值最大的一組進(jìn)行歸類這種思想是由Fisher提出來(lái)的。這里極易混淆,請(qǐng)讀者注意區(qū)分。如圖。單擊Continue按鈕,返回主界面。 圖4.2 statistics子對(duì)話框4. 單擊Classify按鈕,彈出classification子對(duì)話框,選中Display選項(xiàng)欄中的Summary table
9、復(fù)選框,即要求輸出錯(cuò)判矩陣,以便實(shí)現(xiàn)題中對(duì)原樣本進(jìn)行回判的要求。如圖。 圖4.3 classification對(duì)話框5. 返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過(guò)程。1) 根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù):Bayes判別函數(shù)的系數(shù)見(jiàn)表4.1。表中每一列表示樣本判入相應(yīng)類的Bayes判別函數(shù)系數(shù)。由此可建立判別函數(shù)如下:Group1: Group2: Group3: 將各樣品的自變量值代入上述三個(gè)Bayes判別函數(shù),得到三個(gè)函數(shù)值。比擬這三個(gè)函數(shù)值,哪個(gè)函數(shù)值比擬大就可以判斷該樣品判入哪一類。 Classification Function Coefficientsgroup12
10、3x1x2x3(Constant)Fisher's linear discriminant functions 表4.1 Bayes判別函數(shù)系數(shù)根據(jù)此判別函數(shù)對(duì)樣本進(jìn)行回判,結(jié)果如表4.2。從中可以看出在4種暢銷飲料中,有3種被正確地判定,有1種被錯(cuò)誤地判定為平銷飲料,正確率為75%。在3種平銷飲料中,有2種被正確判定,有1種被錯(cuò)誤地判定為暢銷飲料,正確率為66.7%。3種滯銷飲料均正確判定。整體的正確率為80.0%。Classification ResultsagroupPredicted Group MembershipTotal123OriginalCount1310421203
11、30033%1.02.03.0.0a. 80.0% of original grouped cases correctly classified. 表4.2 錯(cuò)判矩陣2) 該新飲料的,將這3個(gè)自變量代入上一小題得到的Bayes判別函數(shù),的值最大,該飲料預(yù)計(jì)平銷。也可通過(guò)在原樣本中增加這一新樣本,重復(fù)上述的判別過(guò)程,并在classification子對(duì)話框中同時(shí)要求輸出casewise results,運(yùn)行判別過(guò)程,得到相同的結(jié)果。4.9 銀行的貸款部門需要判別每個(gè)客戶的信用好壞是否未履行還貸責(zé)任,以決定是否給予貸款??梢愿鶕?jù)貸款申請(qǐng)人的年齡、受教育程度、現(xiàn)在所從事工作的年數(shù)、未變更住址的年數(shù)、
12、收入、負(fù)債收入比例、信用卡債務(wù)、其它債務(wù)等來(lái)判斷其信用情況。下表是從某銀行的客戶資料中抽取的局部數(shù)據(jù),根據(jù)樣本資料分別用距離判別法、Bayes判別法和Fisher判別法建立判別函數(shù)和判別規(guī)那么。某客戶的如上情況資料為53,1,9,18,50,對(duì)其進(jìn)行信用好壞的判別。目前信用好壞客戶序號(hào)已履行還貸責(zé)任12317231234117359342272341.9443911954853519134未履行還貸責(zé)任6371132472911314283221167592822323102614327.36解:令已履行還貸責(zé)任為group0,未履行還貸責(zé)任為group1。令53,1,9,18,50,客戶序號(hào)
13、為11,group未知。用spss解題步驟如下:1. 在SPSS窗口中選擇AnalyzeClassifyDiscriminate,調(diào)出判別分析主界面,將左邊的變量列表中的“group變量選入分組變量中,將變量選入自變量中,并選擇Enter independents together單項(xiàng)選擇按鈕,即使用所有自變量進(jìn)行判別分析。2. 點(diǎn)擊Define Range按鈕,定義分組變量的取值范圍。本例中分類變量的范圍為0到1,所以在最小值和最大值中分別輸入0和1。單擊Continue按鈕,返回主界面。3. 單擊Statistics按鈕,指定輸出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)。選中Function Coeff
14、icients欄中的Fishers和Unstandardized。單擊Continue按鈕,返回主界面。4. 單擊Classify按鈕,定義判別分組參數(shù)和選擇輸出結(jié)果。選擇Display欄中的Casewise results,以輸出一個(gè)判別結(jié)果表。其余的均保留系統(tǒng)默認(rèn)選項(xiàng)。單擊Continue按鈕。5. 返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過(guò)程。1) 用費(fèi)希爾判別法建立判別函數(shù)和判別規(guī)那么:未標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)由于可以將實(shí)測(cè)的樣品觀測(cè)值直接代入求出判別得分,所以該系數(shù)使用起來(lái)比標(biāo)準(zhǔn)化的系數(shù)要方便一些。具體見(jiàn)表4.3 。 表4.3 未標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)由此表可知, Fish
15、er判別函數(shù)為:用計(jì)算出各觀測(cè)值的具體坐標(biāo)位置后,再比擬它們與各類重心的距離,就可以得知分類,如假設(shè)與group0的重心距離較近那么屬于group0,反之亦然。各類重心在空間中的坐標(biāo)位置如表所示。 表4.4 各類重心處的費(fèi)希爾判別函數(shù)值 用bayes判別法建立判別函數(shù)與判別規(guī)那么,由于此題中假設(shè)各類出現(xiàn)的先驗(yàn)概率相等且誤判造成的損失也相等,所以距離判別法與bayes判別完全一致。如表4.5所示,group欄中的每一列表示樣品判入相應(yīng)列的Bayes判別函數(shù)系數(shù)。由此可得,各類的Bayes判別函數(shù)如下: 表4.5 Bayes判別函數(shù)系數(shù)將各樣品的自變量值代入上述兩個(gè)Bayes判別函數(shù),得到兩個(gè)函數(shù)
16、值。比擬這兩個(gè)函數(shù)值,哪個(gè)函數(shù)值比擬大就可以判斷該樣品該判入哪一類。2) 在判別結(jié)果的Casewise Stastics表中容易查到該客戶屬于group0,信用好。4.10 從胃癌患者、萎縮性胃炎患者和非胃炎患者中分別抽取五個(gè)病人進(jìn)行四項(xiàng)生化指標(biāo)的化驗(yàn):血清銅蛋白、藍(lán)色反響、尿吲哚乙酸和中性硫化物,數(shù)據(jù)見(jiàn)下表。試用距離判別法建立判別函數(shù),并根據(jù)此判別函數(shù)對(duì)原樣本進(jìn)行回判。類別病人序號(hào)胃癌患者12281342011224513410403200167122741701507851001672014胃炎患者萎縮性6225125714713010061281501177691201331026101
17、60100510非胃炎患者1118511551912170125641316514253141351082121510011772解:令胃癌患者、萎縮性胃炎患者和非胃炎患者分別為group1、group2、group3,由于此題中假設(shè)各類出現(xiàn)的先驗(yàn)概率相等且誤判造成的損失也相等,所以距離判別法與bayes判別完全一致。用spss的解題步驟如下:1.在SPSS窗口中選擇AnalyzeClassifyDiscriminate,調(diào)出判別分析主界面,將左邊的變量列表中的“group變量選入分組變量中,將X1、X2、X3、X4變量選入自變量中,并選擇Enter independents together
18、單項(xiàng)選擇按鈕,即使用所有自變量進(jìn)行判別分析。2.點(diǎn)擊Define Range按鈕,定義分組變量的取值范圍。本例中分類變量的范圍為1到3,所以在最小值和最大值中分別輸入1和3。單擊Continue按鈕,返回主界面。3.單擊Statistics按鈕,指定輸出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)。選中Function Coefficients欄中的Fishers:給出Bayes判別函數(shù)的系數(shù)。4.單擊Classify按鈕,彈出classification子對(duì)話框,選中Display選項(xiàng)欄中的Summary table復(fù)選框,即要求輸出錯(cuò)判矩陣,以便實(shí)現(xiàn)題中對(duì)原樣本進(jìn)行回判的要求。5.返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過(guò)程。根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù):Bayes判別函數(shù)的系數(shù)見(jiàn)表4.6。表中每一列表示樣本判入相應(yīng)類的Bayes判別函數(shù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高端汽車維修中心場(chǎng)地租賃及維修技術(shù)引進(jìn)合同
- 不動(dòng)產(chǎn)抵押擔(dān)保房地產(chǎn)開(kāi)發(fā)合同
- 餐飲店面租賃及品牌升級(jí)改造合同
- 車輛安全責(zé)任事故調(diào)查與處理協(xié)議
- 產(chǎn)業(yè)園區(qū)廠房物業(yè)安全防范與應(yīng)急處理合同
- 餐飲品牌區(qū)域代理權(quán)授權(quán)合同范本
- 生態(tài)旅游度假區(qū)租賃承租合同
- 城市綜合體餐飲業(yè)態(tài)承包協(xié)議書模板
- 餐飲店店長(zhǎng)職位競(jìng)聘與職業(yè)規(guī)劃合同
- 體育健身園區(qū)場(chǎng)地合作開(kāi)發(fā)與經(jīng)營(yíng)協(xié)議書
- 汽車保險(xiǎn)與理賠課件 8.2汽車水災(zāi)事故的預(yù)防與施救
- 采購(gòu)磁鐵物料合同模板
- 2024年重新寫撫養(yǎng)協(xié)議書模板
- 專題6.6射影定理專項(xiàng)提升訓(xùn)練(重難點(diǎn)培優(yōu))-2022-2023學(xué)年九年級(jí)數(shù)學(xué)下冊(cè)尖子生培優(yōu)題典(原卷版)
- 中華詩(shī)詞之美學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 蚊蠅蟲鼠害防治管理制度
- DL∕T 1811-2018 電力變壓器用天然酯絕緣油選用導(dǎo)則
- 水泵檢修工(高級(jí))技能鑒定考試題庫(kù)(含答案)
- AQ/T 9009-2015 生產(chǎn)安全事故應(yīng)急演練評(píng)估規(guī)范(正式版)
- 瀘州老窖“濃香文釀杯”企業(yè)文化知識(shí)競(jìng)賽考試題庫(kù)大全-下(多選、填空題)
- 酒店運(yùn)營(yíng)管理 智慧樹知到期末考試答案章節(jié)答案2024年山東青年政治學(xué)院
評(píng)論
0/150
提交評(píng)論