




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上多元統(tǒng)計(jì)分析實(shí)驗(yàn)報(bào)告學(xué)院名稱 理學(xué)院 專業(yè)班級(jí) 應(yīng)用統(tǒng)計(jì)學(xué)14-2 學(xué)生姓名 張艷雪 學(xué) 號(hào) 1 第一章 多元正態(tài)分布1.1 從某企業(yè)全部職工中隨機(jī)抽取一容量為6的樣本,該樣本中個(gè)職工的目前工資、受教育年限、初始工資和工作經(jīng)驗(yàn)資料如下表所示:職工編號(hào)目前工資(美元)受教育年限(年)初始工資(美元)工作經(jīng)驗(yàn)(月)12345657000420021450219004500028350151612815827000187501200021000120001443638119013826設(shè)職工總體的以上變量服從多元正態(tài)分布,根據(jù)樣本資料利用SPSS軟件求出均值向量和協(xié)方差矩陣
2、的最大似然估計(jì)。注1:最大似然估計(jì)公式為: ,;一SPSS操作步驟:第一步:利用spss建立數(shù)據(jù)集第二步:分析-描述統(tǒng)計(jì)-描述 計(jì)算樣本均值向量第三步:分析-相關(guān)-雙變量 計(jì)算樣本協(xié)方差陣與樣本相關(guān)系數(shù)二輸出結(jié)果:描述性統(tǒng)計(jì)量均值標(biāo)準(zhǔn)差N目前工資29650.0018763.4756受教育年限12.333.6156初始工資37125.0046827.2766工作經(jīng)驗(yàn)152.50129.2106相關(guān)性目前工資受教育年限初始工資工作經(jīng)驗(yàn)?zāi)壳肮べYPearson 相關(guān)性1.184-.126.042顯著性(雙側(cè)).727.812.937平方與叉積的和.00062500.000-.000.000協(xié)方差.00
3、012500.000-.000.000N6666受教育年限Pearson 相關(guān)性.1841-.510-.077顯著性(雙側(cè)).727.302.885平方與叉積的和62500.00065.333-.000-179.000協(xié)方差12500.00013.067-86250.000-35.800N6666初始工資Pearson 相關(guān)性-.126-.5101.114顯著性(雙側(cè)).812.302.829平方與叉積的和-.000-.000.000.000協(xié)方差-.000-86250.000.000.000N6666工作經(jīng)驗(yàn)Pearson 相關(guān)性.042-.077.1141顯著性(雙側(cè)).937.885.8
4、29平方與叉積的和.000-179.000.00083475.500協(xié)方差.000-35.800.00016695.100N6666三實(shí)驗(yàn)結(jié)果分析:樣本均值為 樣本的協(xié)方差 如此就可以按照極大似然估計(jì)方程: ,得出均值向量與協(xié)方差向量的最大似然估計(jì)結(jié)果。第三章 聚類分析3.1 下表是15個(gè)上市公司2001年的一些主要財(cái)務(wù)指標(biāo),使用系統(tǒng)聚類法和K均值法利用SPSS軟件分別對(duì)這些公司進(jìn)行聚類,并對(duì)結(jié)果進(jìn)行比較分析。公司編號(hào)凈資產(chǎn)收益率每股凈利潤(rùn)總資產(chǎn)周轉(zhuǎn)率資產(chǎn)負(fù)債率流動(dòng)負(fù)債比率每股凈資產(chǎn)凈利潤(rùn)增長(zhǎng)率總資產(chǎn)增長(zhǎng)率111.090.210.0596.9870.531.86-44.0481.99211.9
5、60.590.7451.7890.734.957.0216.11300.030.03181.99100-2.98103.3321.18411.580.130.1746.0792.181.146.55-56.325-6.19-0.090.0343.382.241.52-1713.5-3.366100.470.4868.4864.7-11.560.85710.490.110.3582.9899.871.02100.2330.32811.12-1.690.12132.14100-0.66-4454.39-62.7593.410.040.267.8698.511.25-11.25-11.43101.1
6、60.010.5443.71001.03-87.18-7.411130.220.160.487.3694.880.53729.41-9.97128.190.220.3830.311002.73-12.31-2.771395.79-5.20.5252.3499.34-5.42-9816.52-46.821416.550.350.9372.3184.052.14115.95123.4115-24.18-1.160.7956.2697.84.81-533.89-27.74一、實(shí)驗(yàn)原理:1.系統(tǒng)聚類的基本思想是:首先,每個(gè)樣品(或變量)先聚成一類,然后,選擇距離公式計(jì)算類與類之間的距離,把距離相近的樣
7、品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類,該過(guò)程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中,最后,所有的樣品(或變量)聚成一類。打開SPSS軟件,在數(shù)據(jù)窗口依次定義變量,并輸入以上數(shù)據(jù)。2.K-均值聚類法:K-均值法和系統(tǒng)聚類法一樣,都是以距離的遠(yuǎn)近親疏為標(biāo)準(zhǔn)進(jìn)行聚類的,但是兩者的不同之處也是明顯的:系統(tǒng)聚類對(duì)不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,離不開實(shí)踐經(jīng)驗(yàn)的積累;有時(shí)也可以借助系統(tǒng)聚類法以一部分樣品為對(duì)象進(jìn)行聚類,其結(jié)果作為K均值法確定類數(shù)的參考。二SPSS操作步驟:(一)系統(tǒng)聚類基本操作步驟如下:1.點(diǎn)擊分析分類系統(tǒng)聚類,進(jìn)入系統(tǒng)
8、聚類對(duì)話框。2.將凈資產(chǎn)收益率、每股凈利潤(rùn)、總資產(chǎn)周轉(zhuǎn)率、資產(chǎn)負(fù)債率、流動(dòng)負(fù)債比率、每股凈資產(chǎn)、凈利潤(rùn)增長(zhǎng)率、總資產(chǎn)增長(zhǎng)率8個(gè)變量選入變量框中,將公司編號(hào)選入標(biāo)注個(gè)案框中。輸出框中保持默認(rèn)選項(xiàng),選中統(tǒng)計(jì)量和圖。3.統(tǒng)計(jì)量部分保持默認(rèn)選項(xiàng),點(diǎn)擊繼續(xù)按鈕;點(diǎn)擊繪制按鈕,進(jìn)入系統(tǒng)聚類-繪制對(duì)話框,選中樹狀圖,其他部分保持默認(rèn),點(diǎn)擊繼續(xù)按鈕;點(diǎn)擊方法按鈕,進(jìn)入聚類分析-方法對(duì)話框,轉(zhuǎn)換值框中標(biāo)準(zhǔn)化選擇Z得分,其他部分保持默認(rèn)選項(xiàng),點(diǎn)擊繼續(xù)按鈕;保存部分保持默認(rèn)選項(xiàng),點(diǎn)擊繼續(xù)按鈕。4.最后點(diǎn)擊確定按鈕,得系統(tǒng)聚類結(jié)果。(二)K-均值法基本操作步驟如下:1. 點(diǎn)擊分析分類K-均值聚類,進(jìn)入K-均值聚類對(duì)話
9、框。2.將凈資產(chǎn)收益率、每股凈利潤(rùn)、總資產(chǎn)周轉(zhuǎn)率、資產(chǎn)負(fù)債率、流動(dòng)負(fù)債比率、每股凈資產(chǎn)、凈利潤(rùn)增長(zhǎng)率、總資產(chǎn)增長(zhǎng)率8個(gè)變量選入變量框中,將公司編號(hào)選入標(biāo)注個(gè)案框中。根據(jù)系統(tǒng)聚類的結(jié)果,聚類數(shù)改為3,其他部分保持默認(rèn)選項(xiàng)。3.迭代部分保持默認(rèn)選項(xiàng),點(diǎn)擊繼續(xù)按鈕;點(diǎn)擊保存按鈕,選中聚類成員、與聚類中心的距離,點(diǎn)擊繼續(xù)按鈕;選項(xiàng)部分中保持默認(rèn)選項(xiàng),點(diǎn)擊繼續(xù)。 4.最后點(diǎn)擊確定按鈕,得K-均值聚類結(jié)果。三輸出結(jié)果:系統(tǒng)聚類法:表1 案例處理匯總a,b案例有效缺失總計(jì)N百分比N百分比N百分比12100.00.012100.0a. 平方 Euclidean 距離 已使用b. 平均聯(lián)結(jié)(組之間)表2 聚類表
10、階群集組合系數(shù)首次出現(xiàn)階群集下一階群集 1群集 2群集 1群集 2169363.2800022261189.69701332121492.5322044243976.32830552107995.87440767149315.36000871213588.43405881728034.8797699111.98980101018.326901111113.8611000K均值法:表3 初始聚類中心聚類123凈資產(chǎn)收益率95.7911.1230.22每股凈利潤(rùn)-5.20-1.69.16總資產(chǎn)周轉(zhuǎn)率.50.12.40資產(chǎn)負(fù)債率252.34132.1487.36流動(dòng)負(fù)債率99.34100.0094.
11、88每股凈資產(chǎn)-5.42-.66.53凈利潤(rùn)增長(zhǎng)率-9816.52-4454.39729.41總資產(chǎn)增長(zhǎng)率-46.82-62.75-9.97表4 迭代歷史記錄a迭代聚類中心內(nèi)的更改1231.000.000834.1342.000.000.000a. 由于聚類中心內(nèi)沒(méi)有改動(dòng)或改動(dòng)較小而達(dá)到收斂。任何中心的最大絕對(duì)坐標(biāo)更改為 .000。當(dāng)前迭代為 2。初始中心間的最小距離為 5184.300。表5最終聚類中心聚類123凈資產(chǎn)收益率95.7911.126.48每股凈利潤(rùn)-5.20-1.69.08總資產(chǎn)周轉(zhuǎn)率.50.12.39資產(chǎn)負(fù)債率252.34132.1471.48流動(dòng)負(fù)債率99.34100.00
12、92.06每股凈資產(chǎn)-5.42-.661.90凈利潤(rùn)增長(zhǎng)率-9816.52-4454.39-103.94總資產(chǎn)增長(zhǎng)率-46.82-62.7511.91表6 每個(gè)聚類中的案例數(shù)聚類11.00021.000313.000有效15.000缺失.000四,實(shí)驗(yàn)結(jié)果分析:(一)系統(tǒng)聚類法:表2聚類表是對(duì)每一階段聚類結(jié)果的反應(yīng)。圖1冰狀圖,圖2樹狀圖,是反應(yīng)樣品聚類情況的圖,從圖中可以由分類個(gè)數(shù)得到分類情況。如果選擇分為2類,分類結(jié)果為:13號(hào)公司單獨(dú)一類,1-12號(hào)公司為一類;如果選擇分為3類,分類結(jié)果為:13、1、14、2、3、4、5、6、7、8、9、10、11、12、15。由表中數(shù)據(jù)可以發(fā)現(xiàn),13號(hào)
13、公司資產(chǎn)負(fù)債率最高,凈利潤(rùn)增長(zhǎng)率最低,1號(hào)和14號(hào)公司的主要財(cái)務(wù)指標(biāo)都比較好,可以認(rèn)為系統(tǒng)聚類根據(jù)經(jīng)營(yíng)情況對(duì)公司進(jìn)行分類的。(二)K均值法:表3出始聚類中心,表示最初種類的重心,也就是種子點(diǎn)。表5最終聚類中心,表示K-均值聚類之后各類的重心,可以看到,1類資產(chǎn)負(fù)債率高,凈利潤(rùn)增長(zhǎng)率低,3類各項(xiàng)指標(biāo)值都比較好。由數(shù)據(jù)集輸出結(jié)果知分類結(jié)果為:1類13、2類8、3類1、2、3、4、5、6、7、9、10、11、12、14、15。與系統(tǒng)聚類的結(jié)果不完全相同,K-均值聚類將8號(hào)公司單獨(dú)作為一類。由數(shù)據(jù)表可以發(fā)現(xiàn)8號(hào)公司資產(chǎn)負(fù)債率較高,凈利潤(rùn)增長(zhǎng)率較低,與其他公司之間有較大差別,單獨(dú)分為一類也比較符合實(shí)際。
14、3.2 下表是2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo):人均GDP(元)、人均工業(yè)產(chǎn)值(元)、客運(yùn)總量(萬(wàn)人)、貨運(yùn)總量(萬(wàn)噸)、地方財(cái)政預(yù)算內(nèi)收入(億元)、固定資產(chǎn)投資總額(億元)、在崗職工占總?cè)丝诘谋壤ǎ⒃趰徛毠と司べY額(元)、城鄉(xiāng)居民年底儲(chǔ)蓄余額(億元)。試?yán)肧PSS軟件進(jìn)行系統(tǒng)聚類分析,并比較何種方法與人們觀察到的實(shí)際情況較接近。城市北京31886331683052030671593200037.8253126441天津264334373235073467920593418.8186481825石家莊15134131591184310008494169.51230610
15、44太原15752158312975152483319722.812679660呼和浩特1899111257350841552118213.514116255沈陽(yáng)23268154466612146368155714.8149611423大連2914527615110012108111140714.7175601310長(zhǎng)春18630210456999108924629412.513870831哈爾濱148257561645895187642317.7124511154上海4658677083721263861899227421.0273056055南京2754743853167901480513
16、679415.4221901134杭州3266749823213491681515071711.8246671466寧波3254347904249381379713955510.9236911060合肥106211171460344641362458.313901359福州2228121310968082506737611.815053876廈門5359093126444130557023838.619024397南昌142219205572844543121011.013913483濟(jì)南23437226345810143547642913.516027758青島247053550614666
17、3055312054814.515335908鄭州16674140231070978476637312.7135381048武漢212781708311882166108062317.4137301286長(zhǎng)沙15446887310609106316043410.016987705廣州48220554042975128859275108925.1288053727深圳10989679329187569.6310532199南寧8176339070165893361708.313171451???644214553132843304129916.514819284重慶719050765829032
18、45016211876.5124401897成都17914928972793287989078811.9152741494貴陽(yáng)11046103501851153184023115.812181345昆明16215116015126123386034214.614255709西安1314089131141393926544615.9135051211蘭州1445917136220955812120318.013489468西寧706656052788203787610.114629175銀川1178711013214621271213421.913497193烏魯木齊22508171372188
19、127544118026.116509420南寧31886331683052030671593200037.8253126441???64334373235073467920593418.8186481825資料來(lái)源:中國(guó)統(tǒng)計(jì)年鑒2004一、實(shí)驗(yàn)原理:系統(tǒng)聚類的基本思想:首先,每個(gè)樣品(或變量)先聚成一類,然后,選擇距離公式計(jì)算類與類之間的距離,把距離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類,該過(guò)程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中,最后,所有的樣品(或變量)聚成一類。打開SPSS軟件,在數(shù)據(jù)窗口依次定義變量,并輸入以上數(shù)據(jù)二SPSS操作步驟:1.點(diǎn)擊分析分類系統(tǒng)聚類,
20、進(jìn)入系統(tǒng)聚類對(duì)話框。2.將x1、x2、x3、x4、x5、x6、x7、x8、x9,9個(gè)變量選入變量框中,將城市選入標(biāo)注個(gè)案框中。輸出框中保持默認(rèn)選項(xiàng),選中統(tǒng)計(jì)量和圖。3.統(tǒng)計(jì)量部分保持默認(rèn)選項(xiàng),點(diǎn)擊繼續(xù)按鈕;點(diǎn)擊繪制按鈕,進(jìn)入系統(tǒng)聚類-繪制對(duì)話框,選中樹狀圖,其他部分保持默認(rèn),點(diǎn)擊繼續(xù)按鈕;點(diǎn)擊方法按鈕,進(jìn)入聚類分析-方法對(duì)話框,轉(zhuǎn)換值框中標(biāo)準(zhǔn)化選擇Z得分,聚類方法中有7種方法可供選擇,分別進(jìn)行選擇,其他部分保持默認(rèn)選項(xiàng),點(diǎn)擊繼續(xù)按鈕;保存部分保持默認(rèn)選項(xiàng),點(diǎn)擊繼續(xù)按鈕。4.最后點(diǎn)擊確定按鈕,得系統(tǒng)聚類結(jié)果。經(jīng)過(guò)比較得類平均法的組間聯(lián)接法的結(jié)果與人們觀察到的實(shí)際情況較接近,輸出結(jié)果見(jiàn)表1、表2,
21、圖1、圖2。三輸出結(jié)果:表1 案例處理摘要a案例有效缺失合計(jì)N百分比N百分比N百分比37100.0%00.0%37100.0%a. 平方 Euclidean 距離 已使用表2 聚類表階群集組合系數(shù)首次出現(xiàn)階群集下一階群集 1群集 2群集 1群集 21237.00000282136.000003231417.08100441425.11830115830.11900862031.1420097532.23400158815.26950139920.270061410621.2800021111433.3064022121213.311001913818.33980161439.409091815
22、534.440702216822.49613018172629.53000241838.610141621191112.6570122920435.73900262136.76218102522514.79215112423719.9460028245261.06322172525351.41921242626341.9582520302727282.425003428272.59412329292114.48628193030236.284292631312169.911300343212310.71920333311019.305320353422720.888312735351242.4
23、7833343636124100.4223500圖1 冰狀圖圖2 樹狀圖四實(shí)驗(yàn)結(jié)果分析:表2聚類表是對(duì)每一階段聚類結(jié)果的反應(yīng)。如第一行表示,第一階段時(shí)第二個(gè)樣品(天津)與第37個(gè)樣品(??冢┚蹫橐活?,其他以此類推。圖1冰狀圖,圖2樹狀圖,是反應(yīng)樣品聚類情況的圖,從圖中可以由分類個(gè)數(shù)得到分類情況。如果選擇分為2類,分類結(jié)果為:深圳單獨(dú)一類,其他城市為一類;如果選擇分為3類,分類結(jié)果為:1類深圳、2類北京、南寧、廣州、上海、3類其他城市為一類。由表中數(shù)據(jù)可以發(fā)現(xiàn),深圳各項(xiàng)經(jīng)濟(jì)指標(biāo)都比較好,且人均GDP遠(yuǎn)高于其他各城市,所以單獨(dú)聚為一類,北京、南寧、廣州、上海各項(xiàng)經(jīng)濟(jì)指標(biāo)在全國(guó)各省份地區(qū)的平均水平之
24、上,故聚為一類。可以從經(jīng)濟(jì)發(fā)展水平來(lái)理解所做的分類,1類是經(jīng)濟(jì)最發(fā)達(dá)的地區(qū),2類是經(jīng)濟(jì)比較發(fā)達(dá)的地區(qū),3類是經(jīng)濟(jì)發(fā)展水平一般的地區(qū)。第四章 判別分析4.1 銀行的貸款部門需要判別每個(gè)客戶的信用好壞(是否未履行還貸責(zé)任),以決定是否給予貸款??梢愿鶕?jù)貸款申請(qǐng)人的年齡(X1)、受教育程度(X2)、現(xiàn)在所從事工作的年數(shù)(X3)、未變更住址的年數(shù)(X4)、收入(X5)、負(fù)債收入比例(X6)、信用卡債務(wù)(X7)、其它債務(wù)(X8)等來(lái)判斷其信用情況。下表是從某銀行的客戶資料中抽取的部分?jǐn)?shù)據(jù)。 根據(jù)樣本資料分別用距離判別法、Bayes判別法和Fisher判別法建立判別函數(shù)和判別規(guī)則; 某客戶的如上情況資料為
25、(53,1,9,18,50,11.20,2.02,3.58),對(duì)其進(jìn)行信用好壞的判別。目前信用好壞客戶序號(hào)已履行還貸責(zé)任123172316.600.341.712341173598.001.812.913422723414.600.94.9443911954813.101.934.36535191345.000.401.30未履行還貸責(zé)任6371132415.101.801.827291131427.401.461.6583221167523.307.769.72928223236.400.191.2910261432710.502.47.36一、實(shí)驗(yàn)原理:1.費(fèi)希爾判別與距離判別對(duì)判別變量的
26、分布類型無(wú)要求。二者只是要求有各類母體的兩階矩存在。而貝葉斯判別必須知道判別變量的分布類型。因此前兩者相對(duì)來(lái)說(shuō)較為簡(jiǎn)單。 2.當(dāng)k=2時(shí),若,則費(fèi)希爾判別與距離判別等價(jià)。當(dāng)判別變量服從正態(tài)分布時(shí),二者與貝葉斯判別也等價(jià)。3.當(dāng),時(shí),費(fèi)希爾判別用作為共同協(xié)差陣,實(shí)際看成等協(xié)差陣,此與距離判別、貝葉斯判別不同。 4.距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)則是。貝葉斯判別的判別規(guī)則是。二者的區(qū)別在于閾值點(diǎn)。當(dāng)時(shí),。二者完全相同。二SPSS操作步驟:判別分析的基本操作步驟如下:1.點(diǎn)擊分析分類判別,進(jìn)入判別分析對(duì)話框。2.類別y選入分組變量框中,定義范圍,最小值為
27、1,最大值為2,將x1、x2、x3、x4、x5、x6、x7、x8,8個(gè)變量選入自變量框中,其它選項(xiàng)保保持默認(rèn)。3.點(diǎn)擊統(tǒng)計(jì)量按鈕,進(jìn)入判別分析-統(tǒng)計(jì)量對(duì)話框,選中均值、組內(nèi)相關(guān)、函數(shù)系數(shù)部分選中Fisher、為標(biāo)準(zhǔn)化,點(diǎn)擊繼續(xù)按鈕;點(diǎn)擊分類按鈕,進(jìn)入判別分析-分類對(duì)話框,選中摘要表、合并組,其他部分保持默認(rèn),點(diǎn)擊繼續(xù)按鈕;點(diǎn)擊保存按鈕,進(jìn)入判別分析-保存對(duì)話框,選中預(yù)測(cè)組成員,點(diǎn)擊繼續(xù)按鈕。4.最后點(diǎn)擊確定按鈕,得判別分析結(jié)果。(1)建立判別函數(shù)。打開SPSS軟件,在數(shù)據(jù)窗口依次定義變量,并輸入以上數(shù)據(jù),用1代表已履行還貸責(zé)任,用2代表未履行還貸責(zé)任,定義新的變量y類別。三輸出結(jié)果及結(jié)果分析:
28、表1 特征值函數(shù)特征值方差的 %累積 %正則相關(guān)性17.422a100.0100.0.939a. 分析中使用了前 1 個(gè)典型判別式函數(shù)。表2 Wilks 的 Lambda函數(shù)檢驗(yàn)Wilks 的 Lambda卡方dfSig.1.1198.5238.384表3 標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù)函數(shù)1x1-.190x23.344x3.968x4-2.358x5.418x63.869x71.694x8-6.847表4 典型判別式函數(shù)系數(shù)函數(shù)1x1-.032x26.687x3.173x4-.357x5.024x6.710x7.792x8-2.383(常量)-10.794非標(biāo)準(zhǔn)化系數(shù)結(jié)果分析表1特征值表,反應(yīng)判
29、別函數(shù)的特征根、解釋方差的比例和典型相關(guān)系數(shù)。 表2 Wilks 的 Lambda表,是對(duì)兩個(gè)判別函數(shù)的顯著性檢驗(yàn)。認(rèn)為第一個(gè)判別函數(shù)在0.05的顯著性水平上沒(méi)有通過(guò)顯著性檢驗(yàn)。表3標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù), 表4典型判別式函數(shù)系數(shù),分類統(tǒng)計(jì)量輸出結(jié)果:表5 分類處理摘要已處理的10已排除的缺失或越界組代碼0至少一個(gè)缺失判別變量0用于輸出中10表6 組的先驗(yàn)概率目前信用好壞先驗(yàn)用于分析的案例未加權(quán)的已加權(quán)的1.50055.0002.50055.000合計(jì)1.0001010.000表7 分類函數(shù)系數(shù)目前信用好壞12x1.340.184x294.070126.660x31.0331.874x4-
30、4.943-6.681x52.9693.086x613.72317.182x7-10.994-7.133x8-37.504-49.116(常量)-118.693-171.296Fisher 的線性判別式函數(shù)表8 分類結(jié)果a目前信用好壞預(yù)測(cè)組成員合計(jì)12初始計(jì)數(shù)15052055%1100.0.0100.02.0100.0100.0a. 已對(duì)初始分組案例中的 100.0% 個(gè)進(jìn)行了正確分類。結(jié)果分析表5分類處理摘要表,概括了分類過(guò)程,說(shuō)明10個(gè)觀測(cè)值都參與分類。表6組的先驗(yàn)概率表,說(shuō)明各組的先驗(yàn)概率,此處在分類選項(xiàng)中選擇所有組的先驗(yàn)概率相等。表7分類函數(shù)系數(shù),是每組的分類函數(shù),也稱費(fèi)歇爾線性判別函
31、數(shù)。表8分類結(jié)果表,可以發(fā)現(xiàn),沒(méi)有發(fā)生誤判,判別準(zhǔn)確率很高。 某客戶的如上情況資料為(53,1,9,18,50,11.20,2.02,3.58),對(duì)其進(jìn)行信用好壞的判別。將該客戶作為11號(hào),將該客戶的資料輸入數(shù)據(jù)集數(shù)據(jù)視圖窗口,重復(fù)以上操作,進(jìn)行判別分析,輸出結(jié)果見(jiàn)表9。表9 判別結(jié)果客戶序號(hào)所屬類別判別類別1112113114115116227228229221022111由表9得,11號(hào)客戶的被判別為1類。4.2 從胃癌患者、萎縮性胃炎患者和非胃炎患者中分別抽取五個(gè)病人進(jìn)行四項(xiàng)生化指標(biāo)的化驗(yàn):血清銅蛋白(X1)、藍(lán)色反應(yīng)()、尿吲哚乙酸和中性硫化物,數(shù)據(jù)見(jiàn)下表。試用距離判別法建立判別函數(shù),
32、并根據(jù)此判別函數(shù)對(duì)原樣本進(jìn)行回判。類別病人序號(hào) 胃癌患者12281342011224513410403200167122741701507851001672014 萎縮性胃炎患者622512571471301006128150117769120133102610160100510 非胃炎患者1118511551912170125641316514253141351082121510011772一實(shí)驗(yàn)原理:按照一定的判別準(zhǔn)則,建立一個(gè)或多個(gè)判別函數(shù),用研究對(duì)象的大量資料確定判別函數(shù)中的待定系數(shù),并計(jì)算判別指標(biāo)。據(jù)此即可確定某一樣本屬于何類。二SPSS操作步驟:打開SPSS軟件,在數(shù)據(jù)窗口依次定義
33、變量,并輸入以上數(shù)據(jù),用1代表胃癌患者,用2代表萎縮性胃炎患者,用3代表非胃炎患者,定義新的變量y類別。判別分析的基本操作步驟如下:1.點(diǎn)擊分析分類判別,進(jìn)入判別分析對(duì)話框。2.類別y選入分組變量框中,定義范圍,最小值為1,最大值為3,將x1、x2、x3、x4,4個(gè)變量選入自變量框中,其它選項(xiàng)保保持默認(rèn)。3.點(diǎn)擊統(tǒng)計(jì)量按鈕,進(jìn)入判別分析-統(tǒng)計(jì)量對(duì)話框,選中均值、組內(nèi)相關(guān)、函數(shù)系數(shù)部分選中Fisher、為標(biāo)準(zhǔn)化,點(diǎn)擊繼續(xù)按鈕;點(diǎn)擊分類按鈕,進(jìn)入判別分析-分類對(duì)話框,選中摘要表、合并組,其他部分保持默認(rèn),點(diǎn)擊繼續(xù)按鈕;點(diǎn)擊保存按鈕,進(jìn)入判別分析-保存對(duì)話框,選中預(yù)測(cè)組成員,點(diǎn)擊繼續(xù)按鈕。4.最后點(diǎn)
34、擊確定按鈕,得判別分析結(jié)果。三輸出結(jié)果及結(jié)果分析:表1 特征值函數(shù)特征值方差的 %累積 %正則相關(guān)性13.044a93.693.6.8682.207a6.4100.0.414a. 分析中使用了前 2 個(gè)典型判別式函數(shù)。表2 Wilks 的 Lambda函數(shù)檢驗(yàn)Wilks 的 Lambda卡方dfSig.1 到 2.20516.6498.0342.8281.9783.577表3 標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù)函數(shù)12x1.453-.175x2.596-.811x3.662.600x4.299.608表4 典型判別式函數(shù)系數(shù)函數(shù)12x1.010-.004x2.040-.055x3.176.160x4.
35、031.062(常量)-8.7845.448非標(biāo)準(zhǔn)化系數(shù)結(jié)果分析表1特征值表,反應(yīng)判別函數(shù)的特征根、解釋方差的比例和典型相關(guān)系數(shù)。 表2 Wilks 的 Lambda表,是對(duì)兩個(gè)判別函數(shù)的顯著性檢驗(yàn)。認(rèn)為第一個(gè)判別函數(shù)在0.05的顯著性水平上是顯著的,第二個(gè)判別函數(shù)則沒(méi)有通過(guò)顯著性檢驗(yàn)。表3標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù),表4典型判別式函數(shù)系數(shù),分類統(tǒng)計(jì)量輸出結(jié)果:表5 分類處理摘要已處理的15已排除的缺失或越界組代碼0至少一個(gè)缺失判別變量0用于輸出中15表6 組的先驗(yàn)概率y類別先驗(yàn)用于分析的案例未加權(quán)的已加權(quán)的1.33355.0002.33355.0003.33355.000合計(jì)1.000151
36、5.000表7 分類函數(shù)系數(shù)y類別123x1.164.130.130x2.753.595.637x3.778.317.100x4.073.012-.059(常量)-79.212-46.721-49.598Fisher 的線性判別式函數(shù)結(jié)果分析表5分類處理摘要表,概括了分類過(guò)程,說(shuō)明15個(gè)觀測(cè)值都參與分類。表6組的先驗(yàn)概率表,說(shuō)明各組的先驗(yàn)概率,此處在分類選項(xiàng)中選擇所有組的先驗(yàn)概率相等。表7分類函數(shù)系數(shù),是每組的分類函數(shù),也稱費(fèi)歇爾線性判別函數(shù)。圖1 合并組圖表8 分類結(jié)果ay類別預(yù)測(cè)組成員合計(jì)123初始計(jì)數(shù)140152041530145%180.0.020.0100.02.080.020.01
37、00.03.020.080.0100.0a. 已對(duì)初始分組案例中的 80.0% 個(gè)進(jìn)行了正確分類。結(jié)果分析圖1合并組圖,是分類結(jié)果圖。從圖中可以看到,1類胃癌患者與2類萎縮性胃炎患者和3類非胃炎患者可以很清晰的區(qū)分開,2類萎縮性胃炎患者與3類非胃炎患者兩者之間存在重合區(qū)域,即存在誤判。表8分類結(jié)果表,可以發(fā)現(xiàn),1類中有1個(gè)誤判到3類中,2類中有1個(gè)誤判到3類中,3類中有1個(gè)誤判到2類中,誤判率為20%。表根據(jù)此判別函數(shù)對(duì)原樣本進(jìn)行回判,有數(shù)據(jù)集數(shù)據(jù)視圖輸出界面得回判結(jié)果見(jiàn)表9。表9 回判結(jié)果病人序號(hào)實(shí)際組別判別組別1112113114135116227228239221022113212331
38、33314331533由表9得,出現(xiàn)誤判的病人是4號(hào)、8號(hào)、11號(hào),分別誤判到了3號(hào)、3號(hào)、2號(hào)。第五章 主成分分析5.1 利用主成分分析法,綜合評(píng)價(jià)六個(gè)工業(yè)行業(yè)的經(jīng)濟(jì)效益指標(biāo)。單位:(億元)行業(yè)名稱資產(chǎn)總計(jì)固定資產(chǎn)凈值平均余額產(chǎn)品銷售收入利潤(rùn)總額煤炭開采和選業(yè)6917.23032.7683.361.6石油和天然氣開采業(yè)5675.93926.2717.533877黑色金屬礦采選業(yè)768.1221.296.513.8有色金屬礦采選業(yè)622.4248116.421.6非金屬礦采選業(yè)699.9291.584.96.2其它采礦業(yè)1.60.50.30一實(shí)驗(yàn)原理:主成分分析的基本思想: 我們處理
39、的問(wèn)題多是多指標(biāo)變量問(wèn)題,由于多個(gè)變量之間往往存在著一定程度的相關(guān)性,人們希望能通過(guò)線性組合的方式從這些指標(biāo)中盡可能快的提取信息。當(dāng)?shù)谝粋€(gè)組合不能提取止。這就是主成分分析的基本思想。 打開SPSS軟件,在數(shù)據(jù)窗口依次定義變量,并輸入以上數(shù)據(jù)。二SPSS操作步驟:1.點(diǎn)擊分析降維因子分析,進(jìn)入因子分析對(duì)話框。2.將資產(chǎn)總計(jì)、固定資產(chǎn)凈值平均余額、產(chǎn)品銷售收入、利潤(rùn)總額4個(gè)變量選入變量框中。3.得分部分選中顯示因子得分系數(shù)矩陣,點(diǎn)擊繼續(xù)按鈕,描述、抽取、旋轉(zhuǎn)、選型部分都保持默認(rèn)選項(xiàng)。4.點(diǎn)擊確定按鈕,得主成分分析結(jié)果三輸出結(jié)果及結(jié)果分析:表1 公因子方差初始提取資產(chǎn)總計(jì)1.000.898
40、固定資產(chǎn)凈值平均余額1.000.999產(chǎn)品銷售收入1.000.972利潤(rùn)總額1.000.592提取方法:主成份分析。表2 解釋的總方差成份初始特征值提取平方和載入合計(jì)方差的 %累積 %合計(jì)方差的 %累積 %13.46086.49986.4993.46086.49986.4992.53713.43499.9333.002.06099.9934.000.007100.000提取方法:主成份分析。表3 成份矩陣a成份1資產(chǎn)總計(jì).947固定資產(chǎn)凈值平均余額.999產(chǎn)品銷售收入.986利潤(rùn)總額.769提取方法 :主成份。a. 已提取了 1 個(gè)成份。表4 成份得分系數(shù)矩陣成份1資產(chǎn)總計(jì).274固定資產(chǎn)凈值
41、平均余額.289產(chǎn)品銷售收入.285利潤(rùn)總額.222提取方法 :主成份。表5 成份得分協(xié)方差矩陣成份111.000提取方法 :主成份。結(jié)果分析表1公因子方差表,給出了該次分析中每個(gè)原始變量中提取的信息,可以看到除利潤(rùn)總額損失較大外,主成分幾乎包含了各個(gè)原始變量至少90%的信息。表2解釋的總方差,顯示了各主成分解釋原始變量總方差的情況,SPSS默認(rèn)保留特征根大于1的主成分,本題中可以看到保留一個(gè)主成分為宜,這1個(gè)主成分集中了4個(gè)原始變量信息的86.499%,可見(jiàn)效果比較好。表3成分矩陣,給出了標(biāo)準(zhǔn)化原始變量用求得的主成分線性表示的近似表達(dá)式,用y1表示主成分,則有標(biāo)準(zhǔn)化的資產(chǎn)總計(jì)=0.947y1
42、,其他可以此類推。表4成分得分系數(shù)矩陣,可以寫出主成分用標(biāo)準(zhǔn)化后的原始變量表示的表達(dá)式。用x1、x2、x3、x4分別表示資產(chǎn)總計(jì)、固定資產(chǎn)凈值平均余額、產(chǎn)品銷售收入、利潤(rùn)總額,則表達(dá)式為:由數(shù)據(jù)集數(shù)據(jù)視圖結(jié)果得,各行業(yè)的得分如表6所示。表6 主成分得分行業(yè)名稱得分名次煤炭開采和選業(yè)0.957526石油和天然氣開采業(yè)1.568491黑色金屬礦采選業(yè)-0.584833有色金屬礦采選業(yè)-0.576032非金屬礦采選業(yè)-0.589514其它采礦業(yè)-0.775655由表6得,各行業(yè)的排名為:石油和天然氣開采業(yè)、有色金屬礦采選業(yè)、黑色金屬礦采選業(yè)、非金屬礦采選業(yè)、其它采礦業(yè)、煤炭開采和選業(yè)。經(jīng)濟(jì)效益指標(biāo)最
43、好的行業(yè)是石油和天然氣開采業(yè),我國(guó)是人口大國(guó),工業(yè)和日常經(jīng)濟(jì)發(fā)展都需要大量的石油和天然氣,煤炭雖然也是重要的能源,但早期的需求量比較大,近幾年逐漸被石油和天然氣取代,結(jié)果比較符合實(shí)際。5.2 下表是我國(guó)2003年各地區(qū)農(nóng)村居民家庭平均每人主要食品消費(fèi)量,試用主成分方法對(duì)各主要食品和地區(qū)進(jìn)行分類。地區(qū)糧食蔬菜食油豬牛羊肉家禽蛋類及其制品水產(chǎn)品食糠酒北京134.0592.789.1514.62.1710.134.252.9214.42天津150.269.991011.070.8410.88.350.7210.14河北216.7255.976.597.10.546.362.250.657.29山西218.9180.875.725.360.246.150.471.152.59內(nèi)蒙207.370.772.7921.181.413.821.451.3410.77遼寧194.39178.595.916.452.519.594.490.7310.8吉林255.99115.26.2711.423.238.643.60.7513.64黑龍江195.08111.77.627.852.616.263.350.915.09上海189.4476.68.5916.377.47.5116.112.1216.7
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度電子商務(wù)企業(yè)監(jiān)事長(zhǎng)聘用合同范本
- 二零二五年度旅行社與旅行社簽訂的二零二五年度旅游人才輸送合作合同
- 2025年度高速公路巡檢駕駛員安全責(zé)任協(xié)議書模板
- 二零二五年度土地儲(chǔ)備中心拆遷安置協(xié)議
- 2025遼寧能源控股集團(tuán)所屬撫礦集團(tuán)招聘90人筆試參考題庫(kù)附帶答案詳解
- 空分知識(shí)培訓(xùn)課件
- 常見(jiàn)急救知識(shí)培訓(xùn)課件
- 江南音樂(lè)文化之美知到智慧樹章節(jié)測(cè)試課后答案2024年秋蘇州大學(xué)
- 2025年國(guó)網(wǎng)新疆電力有限公司招聘1300人(第一批)筆試參考題庫(kù)附帶答案詳解
- 2025四川科瑞軟件有限責(zé)任公司北京分公司招聘銷售代表1人筆試參考題庫(kù)附帶答案詳解
- 2023年全國(guó)高中化學(xué)競(jìng)賽預(yù)賽試題(山東省)
- 11-化學(xué)動(dòng)力學(xué)基礎(chǔ)-2-考研試題資料系列
- 《簡(jiǎn)愛(ài)》課本劇劇本
- 社區(qū)獲得性肺炎臨床路徑
- 產(chǎn)品品質(zhì)檢驗(yàn)流程標(biāo)準(zhǔn)規(guī)范模板()
- DB12-595-2015醫(yī)院安全防范系統(tǒng)技術(shù)規(guī)范
- GB∕T 7260.40-2020 不間斷電源系統(tǒng) UPS 第4部分:環(huán)境 要求及報(bào)告
- 高邊坡施工危險(xiǎn)源辨識(shí)及分析
- 安全文明施工管理(EHS)方案(24頁(yè))
- 水廠項(xiàng)目基于BIM技術(shù)全生命周期解決方案-城市智慧水務(wù)講座課件
- 幼兒園繪本:《閃閃的紅星》 紅色故事
評(píng)論
0/150
提交評(píng)論