多元第四章答案

上傳人：翰*** IP屬地：廣西上傳時間：2023-12-07 格式：DOC 頁數(shù)：6 大小：567.50KB 積分：12 舉報 版權(quán)申訴

已閱讀5頁，還剩1頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

4.1簡述歐幾里得距離與馬氏距離的區(qū)別和聯(lián)系。答：設(shè)p維歐幾里得空間中的兩點X=和Y=。那么歐幾里得距離為。歐幾里得距離的局限有=1\*GB3①在多元數(shù)據(jù)分析中，其度量不合理。=2\*GB3②會受到實際問題中量綱的影響。設(shè)X,Y是來自均值向量為，協(xié)方差為的總體G中的p維樣本。那么馬氏距離為D(X,Y)=。當(dāng)即單位陣時，D(X,Y)==即歐幾里得距離。因此，在一定程度上，歐幾里得距離是馬氏距離的特殊情況，馬氏距離是歐幾里得距離的推廣。4.2試述判別分析的實質(zhì)。答：判別分析就是希望利用已經(jīng)測得的變量數(shù)據(jù)，找出一種判別函數(shù)，使得這一函數(shù)具有某種最優(yōu)性質(zhì)，能把屬于不同類別的樣本點盡可能地區(qū)別開來。設(shè)R1，R2，…，Rk是p維空間Rp的k個子集，如果它們互不相交，且它們的和集為，那么稱為的一個劃分。判別分析問題實質(zhì)上就是在某種意義上，以最優(yōu)的性質(zhì)對p維空間構(gòu)造一個“劃分〞，這個“劃分〞就構(gòu)成了一個判別規(guī)那么。4.3簡述距離判別法的根本思想和方法。答：距離判別問題分為=1\*GB3①兩個總體的距離判別問題和=2\*GB3②多個總體的判別問題。其根本思想都是分別計算樣本與各個總體的距離〔馬氏距離〕，將距離近的判別為一類。=1\*GB3①兩個總體的距離判別問題設(shè)有協(xié)方差矩陣∑相等的兩個總體G1和G2，其均值分別是1和2，對于一個新的樣品X，要判斷它來自哪個總體。計算新樣品X到兩個總體的馬氏距離D2〔X，G1〕和D2〔X，G2〕，那么X，D2〔X，G1〕D2〔X，G2〕X，D2〔X，G1〕>D2〔X，G2，具體分析，記那么判別規(guī)那么為X，W(X)X，W(X)<0=2\*GB3②多個總體的判別問題。設(shè)有個總體，其均值和協(xié)方差矩陣分別是和，且。計算樣本到每個總體的馬氏距離，到哪個總體的距離最小就屬于哪個總體。具體分析，取，，?？梢匀【€性判別函數(shù)為，相應(yīng)的判別規(guī)那么為假設(shè)4.4簡述貝葉斯判別法的根本思想和方法。根本思想：設(shè)k個總體，其各自的分布密度函數(shù)，假設(shè)k個總體各自出現(xiàn)的概率分別為，，。設(shè)將本來屬于總體的樣品錯判到總體時造成的損失為，。設(shè)個總體相應(yīng)的維樣本空間為。在規(guī)那么下，將屬于的樣品錯判為的概率為那么這種判別規(guī)那么下樣品錯判后所造成的平均損失為那么用規(guī)那么來進行判別所造成的總平均損失為貝葉斯判別法那么，就是要選擇一種劃分，使總平均損失到達極小。根本方法：令，那么假設(shè)有另一劃分，那么在兩種劃分下的總平均損失之差為因為在上對一切成立，故上式小于或等于零，是貝葉斯判別的解。從而得到的劃分為4.5簡述費希爾判別法的根本思想和方法。答：根本思想：從個總體中抽取具有個指標(biāo)的樣品觀測數(shù)據(jù)，借助方差分析的思想構(gòu)造一個線性判別函數(shù)系數(shù)可使得總體之間區(qū)別最大，而使每個總體內(nèi)部的離差最小。將新樣品的個指標(biāo)值代入線性判別函數(shù)式中求出值，然后根據(jù)判別一定的規(guī)那么，就可以判別新的樣品屬于哪個總體。4.6試析距離判別法、貝葉斯判別法和費希爾判別法的異同。答：=1\*GB3①費希爾判別與距離判別對判別變量的分布類型無要求。二者只是要求有各類母體的兩階矩存在。而貝葉斯判別必須知道判別變量的分布類型。因此前兩者相對來說較為簡單。=2\*GB3②當(dāng)k=2時，假設(shè)那么費希爾判別與距離判別等價。當(dāng)判別變量服從正態(tài)分布時，二者與貝葉斯判別也等價。=3\*GB3③當(dāng)時，費希爾判別用作為共同協(xié)差陣，實際看成等協(xié)差陣，此與距離判別、貝葉斯判別不同。=4\*GB3④距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)那么是X，W(X)X，W(X)<lnd距離判別的判別規(guī)那么是X，W(X)X，W(X)<0二者的區(qū)別在于閾值點。當(dāng)，時，，。二者完全相同。4.7設(shè)有兩個二元總體和，從中分別抽取樣本計算得到,,假設(shè)，試用距離判別法建立判別函數(shù)和判別規(guī)那么。樣品X=〔6，0〕’應(yīng)屬于哪個總體？解：=，=，==即樣品X屬于總體4.8某超市經(jīng)銷十種品牌的飲料，其中有四種暢銷，三種滯銷，三種平銷。下表是這十種品牌飲料的銷售價格〔元〕和顧客對各種飲料的口味評分、信任度評分的平均數(shù)。銷售情況產(chǎn)品序號銷售價格口味評分信任度評分暢銷158267339486平銷576687798滯銷8349421043=1\*GB2⑴根據(jù)數(shù)據(jù)建立貝葉斯判別函數(shù)，并根據(jù)此判別函數(shù)對原樣本進行回判。=2\*GB2⑵現(xiàn)有一新品牌的飲料在該超市試銷，其銷售價格為3.0，顧客對其口味的評分平均為8，信任評分平均為5，試預(yù)測該飲料的銷售情況。解：增加group變量，令暢銷、平銷、滯銷分別為group1、2、3；銷售價格為X1，口味評分為X2，信任度評分為X3，用spss解題的步驟如下：在SPSS窗口中選擇Analyze→Classify→Discriminate，調(diào)出判別分析主界面，將左邊的變量列表中的“group〞變量選入分組變量中，將X1、X2、X3變量選入自變量中，并選擇Enterindependentstogether單項選擇按鈕，即使用所有自變量進行判別分析。點擊DefineRange按鈕，定義分組變量的取值范圍。本例中分類變量的范圍為1到3，所以在最小值和最大值中分別輸入1和3。單擊Continue圖4.1判別分析主界面單擊Statistics…按鈕，指定輸出的描述統(tǒng)計量和判別函數(shù)系數(shù)。選中FunctionCoefficients欄中的Fisher’s：給出Bayes判別函數(shù)的系數(shù)?！沧⒁猓哼@個選項不是要給出Fisher判別函數(shù)的系數(shù)。這個復(fù)選框的名字之所以為Fisher’s，是因為按判別函數(shù)值最大的一組進行歸類這種思想是由Fisher提出來的。這里極易混淆，請讀者注意區(qū)分?！橙鐖D4.2。單擊Continue按鈕，返回主界面。圖4.2statistics子對話框單擊Classify…按鈕，彈出classification子對話框，選中Display選項欄中的Summarytable復(fù)選框，即要求輸出錯判矩陣，以便實現(xiàn)題中對原樣本進行回判的要求。如圖4.3。圖4.3classification對話框返回判別分析主界面，單擊OK按鈕，運行判別分析過程。根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù)：Bayes判別函數(shù)的系數(shù)見表4.1。表中每一列表示樣本判入相應(yīng)類的Bayes判別函數(shù)系數(shù)。由此可建立判別函數(shù)如下：Group1：Group2：Group3：將各樣品的自變量值代入上述三個Bayes判別函數(shù)，得到三個函數(shù)值。比擬這三個函數(shù)值，哪個函數(shù)值比擬大就可以判斷該樣品判入哪一類。ClassificationFunctionCoefficientsgroup123x1x2x3(Constant)Fisher'slineardiscriminantfunctions表4.1Bayes判別函數(shù)系數(shù)根據(jù)此判別函數(shù)對樣本進行回判，結(jié)果如表4.2。從中可以看出在4種暢銷飲料中，有3種被正確地判定，有1種被錯誤地判定為平銷飲料，正確率為75%。在3種平銷飲料中，有2種被正確判定，有1種被錯誤地判定為暢銷飲料，正確率為66.7%。3種滯銷飲料均正確判定。整體的正確率為80.0%。ClassificationResultsagroupPredictedGroupMembershipTotal123OriginalCount131042120330033%1.02.03.0.0a.80.0%oforiginalgroupedcasescorrectlyclassified.表4.2錯判矩陣該新飲料的，，，將這3個自變量代入上一小題得到的Bayes判別函數(shù)，的值最大，該飲料預(yù)計平銷。也可通過在原樣本中增加這一新樣本，重復(fù)上述的判別過程，并在classification子對話框中同時要求輸出casewiseresults，運行判別過程，得到相同的結(jié)果。4.9銀行的貸款部門需要判別每個客戶的信用好壞〔是否未履行還貸責(zé)任〕，以決定是否給予貸款。可以根據(jù)貸款申請人的年齡〔〕、受教育程度〔〕、現(xiàn)在所從事工作的年數(shù)〔〕、未變更住址的年數(shù)〔〕、收入〔〕、負債收入比例〔〕、信用卡債務(wù)〔〕、其它債務(wù)〔〕等來判斷其信用情況。下表是從某銀行的客戶資料中抽取的局部數(shù)據(jù)，=1\*GB2⑴根據(jù)樣本資料分別用距離判別法、Bayes判別法和Fisher判別法建立判別函數(shù)和判別規(guī)那么。=2\*GB2⑵某客戶的如上情況資料為〔53，1，9，18，50，11.20，2.02，3.58〕，對其進行信用好壞的判別。目前信用好壞客戶序號已履行還貸責(zé)任123172310.342341173593422723410.94.94439119548535191340.40未履行還貸責(zé)任63711324729113142832211675928223230.19102614327.36解：令已履行還貸責(zé)任為group0，未履行還貸責(zé)任為group1。令〔53，1，9，18，50，11.20，2.02，3.58〕客戶序號為11，group未知。用spss解題步驟如下：在SPSS窗口中選擇Analyze→Classify→Discriminate，調(diào)出判別分析主界面，將左邊的變量列表中的“group〞變量選入分組變量中，將變量選入自變量中，并選擇Enterindependentstogether單項選擇按鈕，即使用所有自變量進行判別分析。點擊DefineRange按鈕，定義分組變量的取值范圍。本例中分類變量的范圍為0到1，所以在最小值和最大值中分別輸入0和1。單擊Continue按鈕，返回主界面。單擊Statistics…按鈕，指定輸出的描述統(tǒng)計量和判別函數(shù)系數(shù)。選中FunctionCoefficients欄中的Fisher’s和Unstandardized。單擊Continue按鈕，返回主界面。單擊Classify…按鈕，定義判別分組參數(shù)和選擇輸出結(jié)果。選擇Display欄中的Casewiseresults，以輸出一個判別結(jié)果表。其余的均保存系統(tǒng)默認選項。單擊Continue按鈕。返回判別分析主界面，單擊OK按鈕，運行判別分析過程。用費希爾判別法建立判別函數(shù)和判別規(guī)那么：未標(biāo)準化的典型判別函數(shù)系數(shù)由于可以將實測的樣品觀測值直接代入求出判別得分，所以該系數(shù)使用起來比標(biāo)準化的系數(shù)要方便一些。具體見表4.3。表4.3未標(biāo)準化的典型判別函數(shù)系數(shù)由此表可知，F(xiàn)isher判別函數(shù)為：用計算出各觀測值的具體坐標(biāo)位置后，再比擬它們與各類重心的距離，就可以得知分類，如假設(shè)與group0的重心距離較近那么屬于group0，反之亦然。各類重心在空間中的坐標(biāo)位置如表4.4所示。表4.4各類重心處的費希爾判別函數(shù)值用bayes判別法建立判別函數(shù)與判別規(guī)那么，由于此題中假設(shè)各類出現(xiàn)的先驗概率相等且誤判造成的損失也相等，所以距離判別法與bayes判別完全一致。如表4.5所示，group欄中的每一列表示樣品判入相應(yīng)列的Bayes判別函數(shù)系數(shù)。由此可得，各類的Bayes判別函數(shù)如下：表4.5Bayes判別函數(shù)系數(shù)將各樣品的自變量值代入上述兩個Bayes判別函數(shù)，得到兩個函數(shù)值。比擬這兩個函數(shù)值，哪個函數(shù)值比擬大就可以判斷該樣品該判入哪一類。在判別結(jié)果的CasewiseStastics表中容易查到該客戶屬于group0，信用好。4.10從胃癌患者、萎縮性胃炎患者和非胃炎患者中分別抽取五個病人進行四項生化指標(biāo)的化驗：血清銅蛋白、藍色反響、尿吲哚乙酸和中性硫化物，數(shù)據(jù)見下表。試用距離判別法建立判別函數(shù)，并根據(jù)此判別函數(shù)對原樣本進行回判。類別病人序號胃癌患者12281342011224513410403200167122741701507851001672014胃炎患者萎縮性622512571471301006128150117769120133102610160100510非胃炎患者1118511551912170125641316514253141351082121510011772解：令胃癌患者、萎縮性胃炎患者和非胃炎患者分別為group1、group2、group3，由于此題中假設(shè)各類出現(xiàn)的先驗概率相等且誤判造成的損失也相等，所以距離判別法與bayes判別完全一致。用spss的解題步驟如下：1.在SPSS窗口中選擇Analyze→Classify→Discriminate，調(diào)出判別分析主界面，將左邊的變量列表中的“group〞變量選入分組變量中，將X1、X2、X3、X4變量選入自變量中，并選擇Enterindependentstogether單項選擇按鈕，即使用所有自變量進行判別分析。2.點擊DefineRange按鈕，定義分組變量的取值范圍。本例中分類變量的范圍為1到3，所以在最

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多元第四章答案

文檔簡介

溫馨提示

最新文檔

評論

多元第四章答案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔