版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、多元統(tǒng)計(jì)分析案例具體操作多元回歸分析高磷鋼的效率(Y)與高磷鋼的出鋼量(X1)及高 磷鋼中的FeO含量(X2)有關(guān),所測(cè)數(shù)據(jù)如下表,請(qǐng) 用線性回歸模型擬合上述數(shù)據(jù)。試驗(yàn)序號(hào)出鋼量X1FeO含 量 X2效率Y187.913.2822101.413廠843109.82080493.014.288.6588.016.481.56115.314.283.5756.914.9738103.41388910114.991.41080.312.9811196.514.67812110.615.386.513102.918.283.4利用SPS統(tǒng)計(jì)軟件,其解答過程如下:擬建立回歸方程:Y=bO+b1*X1+b
2、2*X2步驟如 下:(1)操作過程在數(shù)據(jù)輸入之后,依次單擊“分析”一一“回 歸”一一“線性”,在彈出的“線性回歸”對(duì)話框 中,將出鋼量X1和FeO含量X2設(shè)為自變量,效率設(shè)為 因變量,回歸方法設(shè)為“進(jìn)入”。如下圖:7畝世聞燈圖1.1輸出結(jié)果如下:輸入/移去的變量模型輸入的變量移去的變量方法1FeO含量 X2,出鋼量X1輸入模型匯總模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差Durbin-Watson1.689 a.475.3693.846481.858a.預(yù)測(cè)變量:(常量),FeO含量X2,出鋼量XI。b.因變量:效率YAnovab模型平方和df均方FSig.1回歸133.598266.7994.515.
3、040 a殘差147.9541014.795總計(jì)281.55212a.預(yù)測(cè)變量:(常量),FeO含量X2,出鋼量XI。b.因變量:效率Y系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)B標(biāo)準(zhǔn)誤差試用版tSig.1(常量)75.1449.4887.920.000出鋼量X1.215.075.6852.889.016FeO含 量 X2-.843.548-.365-1.538.155模型輸入的變量移去的變量方法1FeO含量 X2,出鋼量X1輸入模型匯總模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差Durbin-Watson1.689 a.475.3693.846481.858a.預(yù)測(cè)變量:(常量),FeO含量X2,出鋼量XI。a.因
4、變量:效率Y系數(shù)模型相關(guān)性零階偏部分1FeO含 量 X2-.189-.437-.352出鋼量X1.592.675.662a.因變量:效率Y殘差統(tǒng)計(jì)量極小值極大值均值標(biāo)準(zhǔn)偏差N預(yù)測(cè)值74.841188.015683.14623.3366413殘差-5.627217.05607.000003.5113413標(biāo)準(zhǔn)預(yù)測(cè)值-2.4891.459.0001.00013標(biāo)準(zhǔn)殘差-1.4631.834.000.91313a.因變量:效率Y(3)結(jié)果分析回歸方程的回歸系數(shù):b0=75.144,b1=0.215, b2=-0.843擬合回歸方程:Y=0.215*X1-0.843*X2+75.1441)回歸方程的顯
5、著性檢驗(yàn)(F檢驗(yàn)):檢驗(yàn)假設(shè):H。:十十十0,比:各(j=1,2,m)不全為0,、-0.05SS、=SS+SS戔,其中 FF(m, n-m-1)SS回 /mMS回F 二SS戔/(nmT) MS殘根據(jù)方差分析表(An ova), MS回 =66.799 , MS 殘=14.759 ,從而 F=4.515 , FF0.5 (2,10)(Sigt 0.05/2( 10),拒絕原假設(shè),說明在 給定的顯著水平a = 0.05下,X1對(duì)丫有顯著的影響; 對(duì)于 b2, t2=-1.538 ,t 0.05/2說明在給定的顯著水平a = 0.05下,接受原假設(shè),X2 對(duì)丫沒有顯著的影響。而在給定的顯著水平a =
6、 0.1下,拒絕原假設(shè),X2對(duì)丫有顯著的影響。說明X1對(duì)方程的貢獻(xiàn)顯著,X2的貢獻(xiàn)不顯著。B、偏回歸平方和檢驗(yàn)回歸方程中某一自變量X的偏回歸平方和表示 模型中含有其他m-1個(gè)自變量的條件下自變量對(duì)丫的 回歸貢獻(xiàn),相當(dāng)于從回歸方程中提出X后所引起的回 歸平方和的減少量,或在m-1個(gè)自變量的基礎(chǔ)上新增 加X引起的回歸平方和的增加量。匚SS回(Xj)/1F jSS殘/(n- m-1)SS回(Xj)表示偏回歸平方和,其值愈大說明相應(yīng)的自 變量愈重要。一般情況下,ml個(gè)自變量對(duì)丫的回歸 平方和由重新建立的新方程得到,而不是簡(jiǎn)單地把 ax從有n個(gè)自變量的方程中剔出后算得。Anovab模型平方和df均方FS
7、ig.1回歸98.622198.6225.930a.033殘差182.9301116.630總計(jì)281.55212a. 預(yù)測(cè)變量:(常量),出鋼量XI。b. 因變量:效率YAnovab模型平方和df均方FSig.1回歸10.078110.078.408.536 a殘差271.4741124.679總計(jì)281.55212a. 預(yù)測(cè)變量:(常量),FeO含量X2。b. 因變量:效率YAnovab模型平方和df均方FSig.1回歸98.622198.6225.930.033 a殘差182.9301116.630總計(jì)281.55212a.預(yù)測(cè)變量:(常量),出鋼量XI。SS (X1) =SS (X1,
8、X2) -SS回(X2)=133.598-10.078=123.52SS (X2) =SS( (X1,X2) -SS回(X1)=133.598-98.622=34.976Fi = 123.52/ (147.954/10 )=8.3485 , F2=34.976/ (147.954/10 )=2.335F1F2,同樣說明X1對(duì)方程的貢獻(xiàn)大于X24) 標(biāo)準(zhǔn)化回歸系數(shù)變量標(biāo)準(zhǔn)化是將原始數(shù)據(jù)減去相應(yīng)變量的均 數(shù),然后再除以該變量的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)化回歸系數(shù) 無(wú)單位,用來比較各自變量對(duì)應(yīng)變量的影響大小, |Bi|越大,Xi對(duì)丫的影響越大。此處,標(biāo)準(zhǔn)回歸系數(shù)B1 = 0.685,B2 = -0.365,|B1
9、|B2|,說明X1對(duì)丫的影響要比X2對(duì)Y的影響顯 著。5) 偏相關(guān)系數(shù)偏相關(guān)系數(shù)是在排除了其他變量的影響下計(jì) 算變量間的相關(guān)系數(shù)。假設(shè)我們需要計(jì)算X和 丫之間 的相關(guān)性,Z代表其他所有的變量,X和 丫的偏相關(guān) 系數(shù)可以認(rèn)為是X和Z線性回歸得到的殘差 Rx與 丫和Z線性回歸得到的殘差 Ry之間的簡(jiǎn)單相關(guān)系數(shù),即 pears on相關(guān)系數(shù)。P 1,2 = 0.675P 2,1 = -0.437(4)預(yù)測(cè)值試驗(yàn)序號(hào)觀測(cè)值預(yù)測(cè)值預(yù)測(cè)值-觀測(cè) 值(預(yù)測(cè)值-觀測(cè)值)/觀測(cè)值*100%18282.91490.91491.11573170728485.56451.56451.862538081.8911.89
10、12.36375488.683.1684-5.4316-6.130474041581.580.2388-1.2612-1.547484663683.587.96294.46295.34479041977374.81681.81682.488767123888 :86.416-1.584-1.8991.484.2983-7.1017-7.7699124731081 :81.53380.53380.659012346117883.58375.58377.1585897441286.5:86.0251-0.4749-0.5490173411383.481.9249-1.4751-1.76870503
11、6二、 聚類分析下表是2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主 要經(jīng)濟(jì)指標(biāo):人均GDPX1元)、人均工業(yè)產(chǎn)值X2(元)、 客運(yùn)總量X3(萬(wàn)人)、貨運(yùn)總量X4 (萬(wàn)噸)、地方財(cái) 政預(yù)算內(nèi)收入X5 (億元)、固定資產(chǎn)投資總額X6 (億 元)、在崗職工占總?cè)丝诒壤齒7 (%、在崗職工人 均工資額X8(元)、城鄉(xiāng)居民年底儲(chǔ)蓄余額X9(億元)。 試通過統(tǒng)計(jì)分析軟件進(jìn)行系統(tǒng)聚類分析,并比較何 種方法與人們觀察到的實(shí)際情況較接近。城市X1X2X3X4X5X6X7X8X9北京31886331683052030671593200037.8253126441天津264334373235073467920593418
12、.8186481825石家莊15134131591184310008494169.5123061044太原15752158312975152483319722.812679660呼和浩特1899111257350841552118213.514116255沈陽(yáng)23268154466612146368155714.8149611423大連2914527615110012108111140714.7175601310長(zhǎng)春18630210456999108924629412.513870831哈爾濱148257561645895187642317.7124511154上海46586770837212
13、63861899227421.0273056055南京2754743853167901480513679415.4221901134杭州3266749823213491681515071711.8246671466寧波3254347904249381379713955510.9236911060合肥106211171460344641362458.313901359福州2228121310968082506737611.815053876廈門5359093126444130557023838.619024397南昌142219205572844543121011.013913483濟(jì)南2343
14、7226345810143547642913.516027758青島2470535506146663055312054814.515335908鄭州16674140231070978476637312.7135381048武漢212781708311882166108062317.4137301286長(zhǎng)沙15446887310609106316043410.016987705廣州48220554042975128859275108925.1288053727深圳19183834751910989679329187569.6310532199南寧8176339070165893361708.31
15、3171451???644214553132843304129916.514819284重慶71905076582903245016211876.5124401897成都17914928972793287989078811.9152741494貴陽(yáng)11046103501851153184023115.812181345昆明16215116015126123386034214.614255709西安1314089131141393926544615.9135051211蘭州1445917136220955812120318.013489468西寧706656052788203787610.114
16、629175銀川1178711013214621271213421.913497193烏魯木齊22508171372188127544118026.116509420利用spss統(tǒng)計(jì)軟件,其解答過程如下:根據(jù)統(tǒng)計(jì)所得數(shù)據(jù),此處聚類為Q型聚類,即對(duì)樣本進(jìn)行聚類分析,聚類方法選擇系統(tǒng)聚類法,其 基本思想是距離相近的樣品(或變量)先聚成類, 距離相遠(yuǎn)的后聚成類,過程一直進(jìn)行下去,每個(gè)樣 品(或變量)總能聚到合適的類中。在進(jìn)行系統(tǒng)聚 類之前,首先要定義類與類之間的距離,由類間距 離定義的不同產(chǎn)生不同的聚類方法:最短距離法、最長(zhǎng)距離法、中間距離法、重心法等。此處,主要 運(yùn)用最短距離法、重心法和最長(zhǎng)距離法
17、對(duì)樣本進(jìn)行 聚類。以下用dj表示樣品Xd和X(j)之間的距離,當(dāng)樣 品間的親疏關(guān)系米用相似系數(shù)C時(shí),令d2 = 1 _ C 2 ijij以下用Dp,q)表示類G和G之間的距離。(一) 利用Matlab做系統(tǒng)聚類分析,主要運(yùn)行步驟:將統(tǒng)計(jì)數(shù)據(jù)表格導(dǎo)入到Matlab中,若數(shù)據(jù)集命 名為data,則進(jìn)行如下運(yùn)算:X=ZSCORE(data) %標(biāo)準(zhǔn)化數(shù)據(jù)矩陣Y=pdist (X, metric ) %計(jì)算數(shù)據(jù)集X中兩 兩元素的距離,metric表示使用特定的方法,有歐 式距離euclid 、馬氏距離mahal、明可夫斯 基距離 Minkowski 等。D=squareform(Y) % 將距離的輸出
18、向量形式定 格為矩陣形式Z=linkage(Y, method ) %創(chuàng)建逐級(jí)聚類樹, method表示用何種方法,默認(rèn)值是歐式距離, 有complete 最長(zhǎng)距離法; average 類平均距離;cen troid重心法等。H,T=dendrogram (Z) %畫聚類樹形圖(二) 不同聚類方法結(jié)果分析(1) 最短距離法聚類分析類與類間距離定義:DS (p,q) =mindjk|j G,k G,等于G和G中最為鄰近的兩個(gè)樣品之間的距離。 利用最短距離法所得的Matlab聚類樹形圖如下圖所 示:從聚類樹形圖可直觀的看出,當(dāng)將35個(gè)樣品分 為兩類時(shí),深圳(24)單獨(dú)作為第2類,其他城市屬 于第1
19、類;當(dāng)將35個(gè)樣品分為三類時(shí),深圳(24)單 獨(dú)為第3類,上海(10)單獨(dú)為第2類,其他城市為 第1類。2)重心法聚類分析若樣品間采用歐式距離,設(shè)某步將G和G并為G, 它們各有np、nq和nr樣品,其重心用p、q和r表示, 顯然r=1/nrnp p+nq q,某類G的重心為k,它與新 類G的距離為=紀(jì)(3+尹舲QS)從聚類樹形圖可直觀的看出,當(dāng)將35個(gè)樣品分 為兩類時(shí),深圳(24)單獨(dú)作為第2類,其他城市屬 于第1類;當(dāng)將35個(gè)樣品分為三類時(shí),深圳(24)單 獨(dú)為第3類,北京(1)、上海(10)和廣州(23) 單獨(dú)為第2類,其他城市為第1類。結(jié)果同重心聚類 法相似,這種聚類與人們實(shí)際觀察到的情
20、況相接近。(3)最遠(yuǎn)距離聚類法類與類間距離定義:DS (p, q) =max|j G,k G,等于G和G中最遠(yuǎn)的兩個(gè)樣品之間的距離。從聚類樹形圖可直觀的看出,當(dāng)將35個(gè)樣品分 為兩類時(shí),深圳(24)單獨(dú)作為第2類,其他城市屬 于第1類;當(dāng)將35個(gè)樣品分為三類時(shí),深圳(24)單 獨(dú)為第3類,北京(1)、上海(10)和廣州(23) 單獨(dú)為第2類,其他城市為第1類;當(dāng)將35個(gè)樣品分 為四類時(shí),深圳(24)單獨(dú)為第4類,北京(1)、 上海(10)和廣州(23)單獨(dú)為第3類,重慶(27) 和成都(28)為第2類,其他城市為第1類;這種聚 類與人們實(shí)際觀察到的情況相接近。三、 判別分析銀行的貸款部門需要判
21、別每個(gè)客戶的信用好 壞(是否履行還貸責(zé)任),以決定是否給予貸款。 可以根據(jù)貸款申請(qǐng)人的年齡(X1)、受教育程度(X2)、現(xiàn)在所從事工作的年數(shù)(X3)、未變更住 址的年數(shù)(X4)、收入(X5)、負(fù)債收入比例(X6)、 信用卡債務(wù)(X7)、其他債務(wù)(X8)等來判別其信 用情況,下表是從某銀行的客戶資料中抽取的部 分?jǐn)?shù)據(jù),(1)根據(jù)樣本資料分別用距離判別法、 貝葉斯判別法和費(fèi)希爾判別法建立判別函數(shù)和判 別規(guī)則。(2)某客戶的如上情況資料為(53,1,9,18,50,11.20,2.02,3.58 ),對(duì)其進(jìn)行信用好壞的判別。目前信 用好壞客戶序 列號(hào)X1X2X3X4X5X6X7X8已履行 還貸任 務(wù)
22、123172316.600.341.712341仃3598.001.812.913422723414.600.940.9443911954813.101.934.36535191345.000.401.30未履行 還貸任 務(wù)6371132415.101.801.827291131427.401.461.6583221167523.307.769.72928223236.400.191.2910261432710.502.470.361、Fisher和Bayes方法在SPS中的應(yīng)用判別分析是先根據(jù)已知類別的事物的性質(zhì)(自 變量),建立函數(shù)式(自變量的線性組合,及判別 函數(shù)),然后對(duì)未知類別的新鮮
23、事物進(jìn)行判斷以將 之歸入已知類別。主要的判別方法有:距離判別, Fisher判別,貝葉斯判別等。在SPS系統(tǒng)中,在判別分析使用時(shí)應(yīng)注意以下 幾條:1、首先要對(duì)原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)檢驗(yàn):在進(jìn)行判別分析前,應(yīng)首先檢驗(yàn)各類的均值是 不是有差異(因?yàn)榕袆e分析要求給定的樣本數(shù)據(jù)必 須是差異明顯的),如果檢驗(yàn)后某兩個(gè)總體的差異 不顯著應(yīng)將兩個(gè)總體合并為一個(gè)總體,再由剩下的 互不相同的總體重新建立判別函數(shù)。2、兩種判別方法對(duì)總體的數(shù)據(jù)的分布要求不同:一般來說,F(xiàn)isher判別對(duì)數(shù)據(jù)分布沒有特殊的 要求,Bayes判別要求數(shù)據(jù)分布是多元正態(tài)分布,但 在實(shí)際操作過程中,要求并不嚴(yán)格。3、SPS中的Fisher判別函
24、數(shù)實(shí)為Bayes判別函 數(shù):在SPS中,選中判別分析下的“統(tǒng)計(jì)量”中的“函數(shù)系數(shù)”中的Fisher項(xiàng),在輸出結(jié)果的末尾, 給出的分類函數(shù)系數(shù)表下注明的Fisher的線性判 別式函數(shù)。但是,經(jīng)驗(yàn)證實(shí)為一般教課書中的Bayes線性判別函數(shù)。命名出現(xiàn)不一致的原因是,按判別 函數(shù)值最大的一組進(jìn)行歸類這種思想是 Fisher提出 來的,因此SPS用Fisher對(duì)Bayes方法進(jìn)行了命名。 并且因?yàn)锽ayes判別函數(shù)只有在各個(gè)總體的樣本的 協(xié)方差陣相同時(shí)才是線性的,因此在得到該判別函 數(shù)的系數(shù)時(shí),對(duì)樣本的協(xié)方差的估計(jì)必須是在總體 協(xié)方差相等情況下的估計(jì)。此處,將已履行還貸責(zé)任的一類的信用級(jí)別設(shè) 為1,未履
25、行還貸責(zé)任的信用級(jí)別設(shè)為2,然后判斷 待判客戶的信用級(jí)別。2、Fisher判別法費(fèi)希爾判別(或稱典型判別;x, y的基本y思想是投影 (或降維):用p維向量x= (x1,x2,xp)的少數(shù)幾個(gè)線性組合(稱為判別式或典型變量)來代替原始的P個(gè)變量。(一)主要運(yùn)行步驟(1)在SPSS窗口中選擇分析一一分類一一判 別,在調(diào)出的判別分析對(duì)話框中,將左邊的變量列 表中的“目前信用好壞(1,2 ) ”選入分組變量中, 將X1-X8變量選入自變量中,并選擇“一起輸入自變 量”單選按鈕,及使用所有自變量進(jìn)行判別分析。(2)點(diǎn)擊定義范圍按鈕,定義分組變量的取值 范圍,此處分組變量范圍為1到2,所以在最小值和 最
26、大值中分別輸入1和2。(3)單擊統(tǒng)計(jì)量按鈕,指定輸出的描述統(tǒng)計(jì)量 和判別函數(shù)系數(shù)。在函數(shù)系數(shù)欄中選擇 Fisher判別 函數(shù)和非標(biāo)準(zhǔn)化,在描述性欄中選擇均值(對(duì)各組 的各變量作均數(shù)與標(biāo)準(zhǔn)差的描述),選中矩陣欄中 所有的項(xiàng)。(4)單擊分類按鈕,定義判別分組參數(shù)和選擇 輸出結(jié)果。在先驗(yàn)概率欄中選擇所有組別的事前概 率值均假定相等,在輸出框中選擇個(gè)案結(jié)果(給出 每個(gè)觀察值的分類結(jié)果),在使用協(xié)方差矩陣欄中 選擇在組內(nèi)(使用組內(nèi)離差矩陣將觀察值分類)。(5)單擊保存按鈕,指定在數(shù)據(jù)文件中生成代 表判別分組結(jié)果和判別得分的新變量,生成新變量 的含義為,預(yù)測(cè)組成員:存放判別樣品所屬組別的值,保存在變量di
27、s_1中;判別得分:存放Fisher判 別得分的值,有幾個(gè)典型判別函數(shù)就有幾個(gè)判別得 分;組成員概率:存放樣品屬于各組的貝葉斯后驗(yàn)概率值。(二)輸出結(jié)果分析(1)組統(tǒng)計(jì)量信用等級(jí)有效的N (列表狀態(tài))均值標(biāo)準(zhǔn)差未加權(quán)的已加權(quán)的1X1X2X3X4X5X6X7X834.60001.200011.80006.800042.60007.46001.08402.24407.23187.447215.761949.1760611.282733.43045.755801.39622555555555.0005.0005.0005.0005.0005.0005.0005.0002X1X2X3X4X5X6X7X
28、830.40001.40006.20003.200038.200012.54002.73602.96804.27785.547725.449771.7888521.947676.903122.928213.81647555555555.0005.0005.0005.0005.0005.0005.0005.000合計(jì)X1X2X3X4X5X6X7X832.50001.30009.00005.000040.400010.00001.91002.60606.02310.483056.055306.5149416.614595.794632.196092.73598101010101010101010.
29、00010.00010.00010.00010.00010.00010.00010.000上表為組別統(tǒng)計(jì)信息,顯示共有2個(gè)組,其中第一組 5例,第二組5例,分組給出各組中變量的平均數(shù)與 標(biāo)準(zhǔn)差。表中各類的均值存在明顯的差異。(2) 匯聚的組內(nèi)矩陣X1X2X3X4X5X6X7X8協(xié)方差X135.30.8253.921.922.359.6682.6883.206X20.8250.25-0.5252.352.50.220.2920.471X33.9-0.52531.45-8.872.0512.7285.9549.046X421.92.35-8.843.713.80.3032.3190.433X522
30、.352.572.0513.8304.566.4133.27844.154X69.6680.2212.7280.30366.4129.71110.28713.864X72.6880.2925.9542.31933.27810.2874.5735.644X83.2060.4719.0460.43344.15413.8645.6448.257相關(guān)性X110.2780.1170.5580.2160.2990.2120.188X20.2781-0.1870.7110.2870.0810.2730.328X30.117-0.1871-0.2370.7360.4160.4960.561X40.5580.7
31、11-0.23710.120.0080.1640.023X50.2160.2870.7360.1210.6980.8920.881X60.2990.0810.4160.0080.69810.8830.885X70.2120.2730.4960.1640.8920.88310.918X80.1880.3280.5610.0230.8810.8850.9181上表為組內(nèi)8個(gè)變量的相關(guān)性和協(xié)方差(3) 協(xié)方差矩陣信用等級(jí)X1X2X3X4X5X6X7X81X152.31.8511.941.933.33.082.6451.269X21.850.2-1.24.05-0.4-0.715-0.036-0.32
32、6X311.9-1.233.2-17.852.917.044.0117.541X441.94.05-17.884.21.9-10.040.231-4.857X533.3-0.452.91.9127.318.7557.8059.687X63.08-0.71517.04-10.03518.75511.7681.9744.701X72.645-0.0364.0110.2317.8051.9740.5710.876X81.269-0.3267.541-4.8579.6874.7010.8761.9492X118.3-0.2-4.11.911.416.2552.7325.144X2-0.20.30.15
33、0.655.41.1550.621.269X3-4.10.1529.70.291.28.4157.89610.551X41.90.650.23.225.710.644.4065.723X511.45.491.225.7481.7114.0758.75178.62X616.2551.1558.41510.64114.06547.65318.59923.028X72.7320.627.8964.40658.75118.5998.57410.411X85.1441.26910.5515.72378.6223.02810.41114.565合計(jì)X136.2780.51023.667252.6670.4
34、622.006X20.50.233-0.7781.8891.9780.4780.3510.459X310-0.77836.667-2.22270.8893.4112.7226.914X423.6671.889-2.22242.44416.667-4.8110.409-0.339X5251.97870.88916.667276.04452.82227.56138.363X62.6670.4783.411-4.81152.82233.57811.47513.346X70.4620.3512.7220.40927.56111.4754.8235.349X82.0060.4596.914-0.3393
35、8.36313.3465.3497.486上表輸出的是組間的協(xié)方差矩陣(4) 特征值和 Wilks的LambdaFisher的基本思想是投影,投影的重要性是和 特征值的貢獻(xiàn)率有關(guān),特征值表說明得到的唯一的 一個(gè)Fisher判別函數(shù)的貢獻(xiàn)率為100%此外,在計(jì) 算中需要看關(guān)于個(gè)各類的有關(guān)變量的均值是否顯著 不同的檢驗(yàn)結(jié)果,Wilks Lambda統(tǒng)計(jì)量檢驗(yàn)的零假 設(shè)是各組變量均值相等,LambdO近0表示組均值不 同,接近1表示組均值沒有不同。特征值函數(shù)特征值方差的%累積%正則相關(guān)性17.422 a100.0100.0.939a.分析中使用了前1個(gè)典型判別式函數(shù)。Wilks 的 Lambda函數(shù)
36、檢驗(yàn)Wilks 的 Lambda卡方dfSig.1.1198.5238.384(5) 標(biāo)準(zhǔn)化判別系數(shù)和非標(biāo)準(zhǔn)化判別系數(shù) 標(biāo)準(zhǔn)化的典型判別函數(shù)是由標(biāo)準(zhǔn)化的自變量通 過Fisher判別法得到的,所以要得到標(biāo)準(zhǔn)化的典型 判別得分,代入該函數(shù)的自變量必須是經(jīng)過標(biāo)準(zhǔn)化 的;未標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)由于可以將實(shí)測(cè) 的樣品觀測(cè)值直接代入求出判別得分,所以該系數(shù) 使用起來比標(biāo)準(zhǔn)化的系數(shù)要方便些。非標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)函數(shù)1X1-.032X26.687X3.173X4-.357X5.024X6.710X7.792X8-2.383(常量)-10.794由上表可知,得到的一個(gè)費(fèi)希爾判別函數(shù)為Y=-10.794
37、-0.32X1+6.687X2+0.173X3-0.357X4+0.024X5+0.710X6+0.792X7-2.383X8結(jié)構(gòu)矩陣函數(shù)1X3-.205X6.191X7.159X1-.145X4-.112X2.082X5-.052X8.052上表給出了按大小次序排列的各個(gè)變量與典型 判斷函數(shù)之間的相關(guān)性。由表可見, X3對(duì)典型判斷 函數(shù)影響最大,而X8對(duì)典型判斷函數(shù)的影響最小。(6)在組均值處評(píng)估的非標(biāo)準(zhǔn)化典型判別式函數(shù): 各類別重心在空間中的坐標(biāo)位置,這樣,只要在前 面計(jì)算出各觀測(cè)值的具體坐標(biāo)位置后,再計(jì)算它們 分別離各重心的距離就可以得知它們的分類了。組重心處的函數(shù)信用等級(jí)函數(shù)11-2.
38、43722.437(7) 個(gè)案觀察結(jié)果在按照案例順序的統(tǒng)計(jì)量表中,針對(duì)每個(gè)樣品 給出了大部分的判別結(jié)果,其中包括:實(shí)際組、預(yù) 測(cè)組、貝葉斯判別法的后驗(yàn)概率(P(G=g I D=d)、到質(zhì)心 的平方的馬氏距離及Fisher判別法的典型判別函數(shù) 的判別得分。從表中可以看出待判樣品被判別為第 幾級(jí)。案例 數(shù)目實(shí)際 組最咼組第二最咼組P(Dd | G=g)預(yù)測(cè)組PdfP(G=g | D=d)至U質(zhì)心的平方Mahalanobis 距離組P(G=g |D=d)至U質(zhì)心的平方Mahalanobis 距離1110.773110.0832026.6452110.485110.4882017.4313110.57110.3222029.6054110.867110.0282022.1515110.9931102023.846220.81110.0581021.4627220.03610.8384.4110.1627.6918220.841110.041025.7499220.487110.4831031.00710220.149112.0871039.91911未分 組的101136.15420118.509將待判樣本的各自變量值輸入到判別函數(shù):Y=-10.794-0.32X1+6.687X2+0.173X3-0.357X4+0.024X5+0.71可得到待判樣本到
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建師范大學(xué)《中學(xué)語(yǔ)文基礎(chǔ)名篇選講》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年二級(jí)建造師實(shí)務(wù)集訓(xùn)模擬題二
- 福建師范大學(xué)《數(shù)字電路與系統(tǒng)設(shè)計(jì)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《環(huán)境工程實(shí)驗(yàn)》2022-2023學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《大眾文化傳播》2023-2024學(xué)年第一學(xué)期期末試卷
- 橙藍(lán)幾何體扁平漸變簡(jiǎn)約風(fēng)電商直播行業(yè)發(fā)展分析報(bào)告
- 規(guī)范學(xué)習(xí)考試題目 管道考試
- 特色班線描畫學(xué)期教學(xué)計(jì)劃
- 小班幼兒作品分析
- 2024年銀川客運(yùn)上崗證考什么內(nèi)容
- 駕駛員技能比武方案
- 赫茲伯格雙因素理論(正式版)課件
- 合同的權(quán)益和權(quán)力轉(zhuǎn)移
- 神經(jīng)外科手術(shù)治療頸椎病的研究現(xiàn)狀
- 2023水利系統(tǒng)職稱考試題庫(kù)及答案
- 中藥調(diào)劑員知識(shí)競(jìng)賽考試題庫(kù)(附答案)
- LY/T 3354-2023土地退化類型與分級(jí)規(guī)范
- 北京市商業(yè)地產(chǎn)市場(chǎng)細(xì)分研究
- 新媒體視覺設(shè)計(jì)之新媒體視覺設(shè)計(jì)基本要素
- 《大衛(wèi)科波菲爾(節(jié)選)》《老人與?!仿?lián)讀課件17張高中語(yǔ)文選擇性必修上冊(cè)
- HSK五級(jí)必過考前輔導(dǎo)課件
評(píng)論
0/150
提交評(píng)論