




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、判別分析判別判別 有一些昆蟲的性別很難看出,只有通過解剖才能夠判別;但是雄性和雌性昆蟲在若干體表度量上有些綜合的差異。于是統(tǒng)計(jì)學(xué)家就根據(jù)已知雌雄的昆蟲體表度量(這些用作度量的變量亦稱為預(yù)測(cè)變量)得到一個(gè)標(biāo)準(zhǔn),并且利用這個(gè)標(biāo)準(zhǔn)來判別其他未知性別的昆蟲。這樣的判別雖然不能保證百分之百準(zhǔn)確,但至少大部分判別都是對(duì)的,而且用不著殺死昆蟲來進(jìn)行判別了。 判別分析判別分析(discriminant analysis)這就是本章要講的是判別分析。判別分析和前面的聚類分析有什么不同呢?主要不同點(diǎn)就是,在聚類分析中一般人們事先并不知道或一定要明確應(yīng)該分成幾類,完全根據(jù)數(shù)據(jù)來確定。而在判別分析中,至少有一個(gè)已經(jīng)明
2、確知道類別的“訓(xùn)練樣本”,利用這個(gè)數(shù)據(jù),就可以建立判別準(zhǔn)則,并通過預(yù)測(cè)變量來為未知類別的觀測(cè)值進(jìn)行判別了。判別分析例子判別分析例子數(shù)據(jù)disc.sav:企圖用一套打分體系來描繪企業(yè)的狀況。該體系對(duì)每個(gè)企業(yè)的一些指標(biāo)(變量)進(jìn)行評(píng)分。這些指標(biāo)包括:企業(yè)規(guī)模(is)、服務(wù)(se)、雇員工資比例(sa)、利潤(rùn)增長(zhǎng)(prr)、市場(chǎng)份額(ms)、市場(chǎng)份額增長(zhǎng)(msr)、流動(dòng)資金比例(cp)、資金周轉(zhuǎn)速度(cs)等等。另外,有一些企業(yè)已經(jīng)被某雜志劃分為上升企業(yè)、穩(wěn)定企業(yè)和下降企業(yè)。我們希望根據(jù)這些企業(yè)的上述變量的打分和它們已知的類別(三個(gè)類別之一:group-1代表上升,group-2代表穩(wěn)定,group
3、-3代表下降)找出一個(gè)分類標(biāo)準(zhǔn),以對(duì)沒有被該刊物分類的企業(yè)進(jìn)行分類。該數(shù)據(jù)有90個(gè)企業(yè)(90個(gè)觀測(cè)值),其中30個(gè)屬于上升型,30個(gè)屬于穩(wěn)定型,30個(gè)屬于下降型。這個(gè)數(shù)據(jù)就是一個(gè)“訓(xùn)練樣本”。disc.savdisc.sav數(shù)據(jù)數(shù)據(jù) 根據(jù)距離的判別(不用投影)根據(jù)距離的判別(不用投影) disc.sav數(shù)據(jù)有8個(gè)用來建立判別標(biāo)準(zhǔn)(或判別函數(shù))的(預(yù)測(cè))變量,另一個(gè)(group)是類別。因此每一個(gè)企業(yè)的打分在這8個(gè)變量所構(gòu)成的8維空間中是一個(gè)點(diǎn)。這個(gè)數(shù)據(jù)有90個(gè)點(diǎn),由于已經(jīng)知道所有點(diǎn)的類別了,所以可以求得每個(gè)類型的中心。這樣只要定義了如何計(jì)算距離,就可以得到任何給定的點(diǎn)(企業(yè))到這三個(gè)中心的三個(gè)
4、距離。顯然,最簡(jiǎn)單的辦法就是離哪個(gè)中心距離最近,就 屬 于 哪 一 類 。 通 常 使 用 的 距 離 是 所 謂 的mahalanobis距離。用來比較到各個(gè)中心距離的數(shù)學(xué)函數(shù)稱為判別函數(shù)(discriminant function).這種根據(jù)遠(yuǎn)近判別的方法,原理簡(jiǎn)單,直觀易懂。fisherfisher判別法判別法(先進(jìn)行投影先進(jìn)行投影)所謂所謂fisher判別法,就是一種先投影的方法。判別法,就是一種先投影的方法。考慮只有兩個(gè)(預(yù)測(cè))變量的判別分析問題??紤]只有兩個(gè)(預(yù)測(cè))變量的判別分析問題。假定這里只有兩類。數(shù)據(jù)中的每個(gè)觀測(cè)值是二維空間假定這里只有兩類。數(shù)據(jù)中的每個(gè)觀測(cè)值是二維空間的一個(gè)
5、點(diǎn)。見圖(下一張幻燈片)。的一個(gè)點(diǎn)。見圖(下一張幻燈片)。這里只有兩種已知類型的訓(xùn)練樣本。其中一類有這里只有兩種已知類型的訓(xùn)練樣本。其中一類有38個(gè)個(gè)點(diǎn)(用點(diǎn)(用“o”表示),另一類有表示),另一類有44個(gè)點(diǎn)(用個(gè)點(diǎn)(用“*”表示)。表示)。按照原來的變量(橫坐標(biāo)和縱坐標(biāo)),很難將這兩種按照原來的變量(橫坐標(biāo)和縱坐標(biāo)),很難將這兩種點(diǎn)分開。點(diǎn)分開。于是就尋找一個(gè)方向,也就是圖上的虛線方向,沿著于是就尋找一個(gè)方向,也就是圖上的虛線方向,沿著這個(gè)方向朝和這個(gè)虛線垂直的一條直線進(jìn)行投影會(huì)使這個(gè)方向朝和這個(gè)虛線垂直的一條直線進(jìn)行投影會(huì)使得這兩類分得最清楚??梢钥闯觯绻蚱渌较蛲兜眠@兩類分得最清楚。
6、可以看出,如果向其他方向投影,判別效果不會(huì)比這個(gè)好。影,判別效果不會(huì)比這個(gè)好。有了投影之后,再用前面講到的距離遠(yuǎn)近的方法來得有了投影之后,再用前面講到的距離遠(yuǎn)近的方法來得到判別準(zhǔn)則。這種首先進(jìn)行投影的判別方法就是到判別準(zhǔn)則。這種首先進(jìn)行投影的判別方法就是fisher判別法。判別法。 -4-20246-4-3-2-10123逐步判別法逐步判別法(僅僅是在前面的方僅僅是在前面的方法中加入變量選擇的功能法中加入變量選擇的功能)有時(shí),一些變量對(duì)于判別并沒有什么作用,為了得到對(duì)判別最合適的變量,可以使用逐步判別。也就是,一邊判別,一邊引進(jìn)判別能力最強(qiáng)的變量,這個(gè)過程可以有進(jìn)有出。一個(gè)變量的判別能力的判斷
7、方法有很多種,主要利用各種檢驗(yàn),例如wilks lambda、raos v、the squared mahalanobis distance、smallest f ratio或the sum of unexplained variations等檢驗(yàn)。其細(xì)節(jié)這里就不贅述了;這些不同方法可由統(tǒng)計(jì)軟件的各種選項(xiàng)來實(shí)現(xiàn)。逐步判別的其他方面和前面的無異。disc.sav例子例子利用spss軟件的逐步判別法淘汰了不顯著的流動(dòng)資金比例(cp),還剩下七個(gè)變量is,se,sa,prr,m s , m s r , c s , 得 到 兩 個(gè) 典 則 判 別 函 數(shù)(canonical discriminant
8、function coefficients):n0.0350.035is+3.283se+0.037sa-0.007prr+0.068ms-0.023msr-0.385cs-3.166is+3.283se+0.037sa-0.007prr+0.068ms-0.023msr-0.385cs-3.166n0.005is+0.567se+0.041sa+0.012prr+0.048ms+0.044msr-0.159cs-4.3840.005is+0.567se+0.041sa+0.012prr+0.048ms+0.044msr-0.159cs-4.384 這兩個(gè)函數(shù)實(shí)際上是由這兩個(gè)函數(shù)實(shí)際上是由fi
9、sher判別法得到的向判別法得到的向兩個(gè)方向的投影。這兩個(gè)典則判別函數(shù)的系數(shù)兩個(gè)方向的投影。這兩個(gè)典則判別函數(shù)的系數(shù)是下面的是下面的spss輸出得到的:輸出得到的: disc.sav例子例子根據(jù)這兩個(gè)函數(shù),從任何一個(gè)觀測(cè)值(每個(gè)觀測(cè)值都有7個(gè)變量值)都可以算出兩個(gè)數(shù)。把這兩個(gè)數(shù)目當(dāng)成該觀測(cè)值的坐標(biāo),這樣數(shù)據(jù)中的150個(gè)觀測(cè)值就是二維平面上的150個(gè)點(diǎn)。它們的點(diǎn)圖在下面圖中。 canonical discriminant function coefficients.035.0053.283.567.037.041-.007.012.068.048-.023.044-.385-.159-3.166
10、-4.384is 企業(yè)規(guī)模se 服務(wù)sa 雇員工資比例prr 利潤(rùn)增長(zhǎng)ms 市場(chǎng)份額msr 市場(chǎng)份額增長(zhǎng)cs 資金周轉(zhuǎn)速度(constant)12functionunstandardized coefficientscanonical discriminant functionsfunction 1100-10function 243210-1-2-3groupgroup centroids321321disc.sav例子例子從上圖可以看出,第一個(gè)投影(相應(yīng)于來自于第一個(gè)典則判別函數(shù)橫坐標(biāo)值)已經(jīng)能夠很好地分辨出三個(gè)企業(yè)類型了。這兩個(gè)典則判別函數(shù)并不是平等的。其實(shí)一個(gè)函數(shù)就已經(jīng)能夠把這三類分清
11、楚了。spss的一個(gè)輸出就給出了這些判別函數(shù)(投影)的重要程度:eigenvalueseigenvalues26.673a99.099.0.982.262a1.0100.0.456function12eigenvalue% of variance cumulative %canonicalcorrelationfirst 2 canonical discriminant functions were used in theanalysis.a. 前面說過,投影的重要性是和特征值的貢獻(xiàn)率有關(guān)。該表前面說過,投影的重要性是和特征值的貢獻(xiàn)率有關(guān)。該表說明第一個(gè)函數(shù)的貢獻(xiàn)率已經(jīng)是說明第一個(gè)函數(shù)的貢獻(xiàn)率
12、已經(jīng)是99%了,而第二個(gè)只有了,而第二個(gè)只有1%。當(dāng)然,二維圖要容易看一些。投影之后,再根據(jù)各。當(dāng)然,二維圖要容易看一些。投影之后,再根據(jù)各點(diǎn)的位置遠(yuǎn)近算出具體的判別公式(點(diǎn)的位置遠(yuǎn)近算出具體的判別公式(spss輸出):輸出):disc.sav例子例子具體的判別公式(spss輸出),由一張分類函數(shù)表給出: c cl la as ss si if fi ic ca at ti io on n f fu un nc ct ti io on n c co oe ef ff fi ic ci ie en nt ts s.118.338.554.77021.32941.616.345.542.811.0
13、86.029-.001.355.7431.203.368.173.0817.5315.2202.742-57.521-53.704-96.084issesaprrmsmsrcs(constant)1.002.003.00groupfishers linear discriminant functions該表給出了三個(gè)線性分類函數(shù)的系數(shù)。把每個(gè)觀測(cè)點(diǎn)帶入三個(gè)函數(shù),該表給出了三個(gè)線性分類函數(shù)的系數(shù)。把每個(gè)觀測(cè)點(diǎn)帶入三個(gè)函數(shù),就可以得到分別代表三類的三個(gè)值,就可以得到分別代表三類的三個(gè)值,哪個(gè)值最大,該點(diǎn)就屬于相應(yīng)哪個(gè)值最大,該點(diǎn)就屬于相應(yīng)的那一類。的那一類。當(dāng)然,用不著自己去算,計(jì)算機(jī)軟件的選項(xiàng)可
14、以把這些當(dāng)然,用不著自己去算,計(jì)算機(jī)軟件的選項(xiàng)可以把這些訓(xùn)練數(shù)據(jù)的每一個(gè)點(diǎn)按照這里的分類法分到某一類。當(dāng)然,我們一訓(xùn)練數(shù)據(jù)的每一個(gè)點(diǎn)按照這里的分類法分到某一類。當(dāng)然,我們一開始就知道這些訓(xùn)練數(shù)據(jù)的各個(gè)觀測(cè)值的歸屬,但即使是這些訓(xùn)練開始就知道這些訓(xùn)練數(shù)據(jù)的各個(gè)觀測(cè)值的歸屬,但即使是這些訓(xùn)練樣本的觀測(cè)值(企業(yè))按照這里推導(dǎo)出的分類函數(shù)來分類,也不一樣本的觀測(cè)值(企業(yè))按照這里推導(dǎo)出的分類函數(shù)來分類,也不一定全都能夠正確劃分。定全都能夠正確劃分。 disc.sav例子例子下面就是對(duì)我們的訓(xùn)練樣本的分類結(jié)果(spss):classification resultsclassification resu
15、ltsb,cb,c300030030030003030100.0.0.0100.0.0100.0.0100.0.0.0100.0100.0300030030030003030100.0.0.0100.0.0100.0.0100.0.0.0100.0100.0group1.002.003.001.002.003.001.002.003.001.002.003.00count%count%originalcross-validateda1.002.003.00predicted group membershiptotalcross validation is done only for those
16、 cases in the analysis. in crossvalidation, each case is classified by the functions derived from allcases other than that case.a. 100.0% of original grouped cases correctly classified.b. 100.0% of cross-validated grouped cases correctly classified.c. 誤判和正確判別率誤判和正確判別率從這個(gè)表來看,我們的分類能夠從這個(gè)表來看,我們的分類能夠100%
17、地把訓(xùn)地把訓(xùn)練數(shù)據(jù)的每一個(gè)觀測(cè)值分到其本來的類。練數(shù)據(jù)的每一個(gè)觀測(cè)值分到其本來的類。該表分成兩部分;上面一半(該表分成兩部分;上面一半(original)是用)是用從全部數(shù)據(jù)得到的判別函數(shù)來判斷每一個(gè)點(diǎn)的從全部數(shù)據(jù)得到的判別函數(shù)來判斷每一個(gè)點(diǎn)的結(jié)果(前面三行為判斷結(jié)果的數(shù)目,而后三行結(jié)果(前面三行為判斷結(jié)果的數(shù)目,而后三行為相應(yīng)的百分比)。為相應(yīng)的百分比)。下面一半(下面一半(cross validated)是對(duì)每一個(gè)觀)是對(duì)每一個(gè)觀測(cè)值,都用缺少該觀測(cè)的全部數(shù)據(jù)得到的判別測(cè)值,都用缺少該觀測(cè)的全部數(shù)據(jù)得到的判別函數(shù)來判斷的結(jié)果。函數(shù)來判斷的結(jié)果。這里的判別結(jié)果是這里的判別結(jié)果是100%判別正
18、確,但一般并判別正確,但一般并不一定。不一定。 disc.sav例子例子如果就用這個(gè)數(shù)據(jù),但不用所有的變量,而只用4個(gè)變量進(jìn)行判別:企業(yè)規(guī)模(is)、服務(wù)(se)、雇員工資比例(sa)、資金周轉(zhuǎn)速度(cs)。結(jié)果的圖形和判別的正確與否就不一樣了。下圖為兩個(gè)典則判別函數(shù)導(dǎo)出的150個(gè)企業(yè)的二維點(diǎn)圖。它不如前面的圖那么容易分清楚了 canonical discriminant functionsfunction 186420-2-4-6-8function 23210-1-2-3-4groupgroup centroids321321canonical discriminant functions
19、function 1100-10function 243210-1-2-3groupgroup centroids321321原先的圖原先的圖disc.sav例子例子下面是基于4個(gè)變量時(shí)分類結(jié)果表: 這個(gè)表的結(jié)果是有這個(gè)表的結(jié)果是有87個(gè)點(diǎn)(個(gè)點(diǎn)(96.7%)得到正確劃分,有)得到正確劃分,有3個(gè)點(diǎn)被錯(cuò)誤判別;其中第二類有兩個(gè)被誤判為第一類,個(gè)點(diǎn)被錯(cuò)誤判別;其中第二類有兩個(gè)被誤判為第一類,有一個(gè)被誤判為第三類。有一個(gè)被誤判為第三類。classification resultsclassification resultsb,cb,c300030227130003030100.0.0.0100.0
20、6.790.03.3100.0.0.0100.0100.0300030227130003030100.0.0.0100.06.790.03.3100.0.0.0100.0100.0group1.002.003.001.002.003.001.002.003.001.002.003.00count%count%originalcross-validateda1.002.003.00predicted group membershiptotalcross validation is done only for those cases in the analysis. in crossvalidat
21、ion, each case is classified by the functions derived from allcases other than that case.a. 96.7% of original grouped cases correctly classified.b. 96.7% of cross-validated grouped cases correctly classified.c. 判別分析要注意什么判別分析要注意什么?訓(xùn)練樣本中必須有所有要判別的類型,分類必須訓(xùn)練樣本中必須有所有要判別的類型,分類必須清楚,不能有混雜。清楚,不能有混雜。 要選擇好可能由于判
22、別的預(yù)測(cè)變量。這是最重要要選擇好可能由于判別的預(yù)測(cè)變量。這是最重要的一步。當(dāng)然,在應(yīng)用中,選擇的余地不見得有的一步。當(dāng)然,在應(yīng)用中,選擇的余地不見得有多大。多大。 要注意數(shù)據(jù)是否有不尋常的點(diǎn)或者模式存在。還要注意數(shù)據(jù)是否有不尋常的點(diǎn)或者模式存在。還要看預(yù)測(cè)變量中是否有些不適宜的;這可以用單要看預(yù)測(cè)變量中是否有些不適宜的;這可以用單變量方差分析(變量方差分析(anova)和相關(guān)分析來驗(yàn)證。)和相關(guān)分析來驗(yàn)證。判別分析是為了正確地分類,但同時(shí)也要注意使判別分析是為了正確地分類,但同時(shí)也要注意使用盡可能少的預(yù)測(cè)變量來達(dá)到這個(gè)目的。使用較用盡可能少的預(yù)測(cè)變量來達(dá)到這個(gè)目的。使用較少的變量意味著節(jié)省資源
23、和易于對(duì)結(jié)果進(jìn)行解釋。少的變量意味著節(jié)省資源和易于對(duì)結(jié)果進(jìn)行解釋。 判別分析要注意什么?判別分析要注意什么?在計(jì)算中需要看關(guān)于各個(gè)類的有關(guān)變量的均值是否顯著在計(jì)算中需要看關(guān)于各個(gè)類的有關(guān)變量的均值是否顯著不同的檢驗(yàn)結(jié)果(在不同的檢驗(yàn)結(jié)果(在spss選項(xiàng)中選擇選項(xiàng)中選擇wilks lambda、raos v、the squared mahalanobis distance或或the sum of unexplained variations等檢驗(yàn)的計(jì)算等檢驗(yàn)的計(jì)算機(jī)輸出),以確定是否分類結(jié)果是僅僅由于隨機(jī)因素。機(jī)輸出),以確定是否分類結(jié)果是僅僅由于隨機(jī)因素。此外成員的權(quán)數(shù)(此外成員的權(quán)數(shù)(sps
24、s用用prior probability,即,即“先先驗(yàn)概率驗(yàn)概率”,和貝葉斯統(tǒng)計(jì)的先驗(yàn)概率有區(qū)別)需要考慮;,和貝葉斯統(tǒng)計(jì)的先驗(yàn)概率有區(qū)別)需要考慮;一般來說,加權(quán)要按照各類觀測(cè)值的多少,觀測(cè)值少的一般來說,加權(quán)要按照各類觀測(cè)值的多少,觀測(cè)值少的就要按照比例多加權(quán)。就要按照比例多加權(quán)。對(duì)于多個(gè)判別函數(shù),要弄清各自的重要性。對(duì)于多個(gè)判別函數(shù),要弄清各自的重要性。注意訓(xùn)練樣本的正確和錯(cuò)誤分類率。研究被誤分類的觀注意訓(xùn)練樣本的正確和錯(cuò)誤分類率。研究被誤分類的觀測(cè)值,看是否可以找出原因。測(cè)值,看是否可以找出原因。 spss選項(xiàng)選項(xiàng)打開打開disc.sav數(shù)據(jù)。然后點(diǎn)擊數(shù)據(jù)。然后點(diǎn)擊analyzecl
25、assifydiscriminant,把把group放入放入grouping variable,再定義范圍,即在,再定義范圍,即在define range輸入輸入13的范圍。然后在的范圍。然后在independents輸入所有想用輸入所有想用的變量;但如果要用逐步判別,則不選的變量;但如果要用逐步判別,則不選enter independents together,而選擇,而選擇use stepwise method,在方法(在方法(method)中選挑選變量的準(zhǔn)則(檢驗(yàn)方法;默認(rèn)值為)中選挑選變量的準(zhǔn)則(檢驗(yàn)方法;默認(rèn)值為wilks lambda)。)。為了輸出為了輸出fisher分類函數(shù)的結(jié)
26、果可以在分類函數(shù)的結(jié)果可以在statistics中的中的function coefficient選選 fisher和和unstandardized(點(diǎn)則判別函數(shù)系(點(diǎn)則判別函數(shù)系數(shù))數(shù)) ,在,在matrices中選擇輸出所需要的相關(guān)陣;中選擇輸出所需要的相關(guān)陣;還可以在還可以在classify中的中的display選選summary table, leave-one-out classification;注意在;注意在classify選項(xiàng)中默認(rèn)的選項(xiàng)中默認(rèn)的prior probability為為all groups equal表示所有的類都平等對(duì)待,而表示所有的類都平等對(duì)待,而另一個(gè)選項(xiàng)為另
27、一個(gè)選項(xiàng)為compute from group sizes,即按照類的大小,即按照類的大小加權(quán)。加權(quán)。在在plots可選可選 combined-groups, territorial map等。等。 14.4.3 判別分析實(shí)例p379鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(花瓣花瓣,花萼的長(zhǎng)寬花萼的長(zhǎng)寬) 5個(gè)變量個(gè)變量:花瓣長(zhǎng)花瓣長(zhǎng)(slen),花瓣寬花瓣寬(swid), 花萼長(zhǎng)花萼長(zhǎng)(plen), 花萼寬花萼寬(pwid), 分類號(hào)分類號(hào)(1:setosa, 2:versicolor, 3:virginica)(data14-04)statisticsclassify discriminant:variab
28、les: independent (slen,swid,plen,pwid) grouping(spno) define range(min-1,max-3) classify: prior probability(all group equal) use covariance matrix (within-groups) plots (combined-groups, separate-groups, territorial map) display (summary table)statistics: descriptive (means) function coefficients (f
29、ishers, unstandardized) matrix (within-groups correlation, within-groups covariance, separate-groups covariance, total covariance) save: (predicted group membership, discriminant scores, probability of group membership)鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(數(shù)據(jù)分析過程簡(jiǎn)明表數(shù)據(jù)分析過程簡(jiǎn)明表)a an na al ly ys si is s c ca as se e p pr ro oc ce
30、 es ss si in ng g s su um mm ma ar ry y150100.00.00.00.00.0150100.0unweighted casesvalidmissing or out-of-rangegroup codesat least one missingdiscriminating variableboth missing orout-of-range groupcodes and at least onemissing discriminatingvariabletotalexcludedtotalnpercentgroup statisticsgroup st
31、atistics50.063.5255050.00034.283.7915050.00014.621.7375050.0002.461.0545050.00059.365.1625050.00027.663.1475050.00042.604.6995050.00013.261.9785050.00066.387.1285050.00029.823.2185050.00055.605.5405050.00020.262.7475050.00058.608.633150150.00030.594.363150150.00037.6117.682150150.00011.997.622150150
32、.000花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬分類剛毛鳶尾花變色鳶尾花佛吉尼亞鳶尾花totalmeanstd.deviationunweightedweightedvalid n (listwise)鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(原始數(shù)據(jù)的描述原始數(shù)據(jù)的描述)鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(合并類內(nèi)相關(guān)陣和協(xié)方差陣合并類內(nèi)相關(guān)陣和協(xié)方差陣)pooled within-groups matricespooled within-groups matricesa a29.9608.76716.1294.3408.76711.5425.0333.14516.12
33、95.03318.5974.2874.3403.1454.2874.1881.000.471.683.387.4711.000.344.452.683.3441.000.486.387.452.4861.000花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬covariancecorrelation花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬the covariance matrix has 147 degrees of freedom.a. 鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(總協(xié)方差陣總協(xié)方差陣)covariance matricescovariance matricesa a12.4259.9221.6361.0339.
34、92214.3691.170.9301.6361.1703.016.6071.033.930.6071.11126.6438.28818.2905.5788.2889.9028.1274.04918.2908.12722.0827.3105.5784.0497.3103.91150.8128.09028.4616.4098.09010.3555.8044.45628.4615.80430.6944.9436.4094.4564.9437.54374.537-4.683130.03653.507-4.68319.036-33.056-12.083130.036-33.056312.670129.
35、80353.507-12.083129.80358.101花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬分類剛毛鳶尾花變色鳶尾花佛吉尼亞鳶尾花total花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬the total covariance matrix has 149 degrees of freedom.a. 鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(特征值表特征值表)eigenvalue:用于分析的前兩個(gè)典則判別函數(shù)的特用于分析的前兩個(gè)典則判別函數(shù)的特征值征值, 是組間平方和與組內(nèi)平方和之比值是組間平方和與組內(nèi)平方和之比值. 最大特最大特征值與組均值最大的向量對(duì)應(yīng)征值與組均值最大的
36、向量對(duì)應(yīng), 第二大特征值對(duì)應(yīng)第二大特征值對(duì)應(yīng)著次大的組均值向量著次大的組均值向量典則相關(guān)系數(shù)典則相關(guān)系數(shù)(canonical correlation):是組間平是組間平方和與總平方和之比的平方根方和與總平方和之比的平方根.被平方的是由組間被平方的是由組間差異解釋的變異總和的比差異解釋的變異總和的比.eigenvalueseigenvalues30.419a99.099.0.984.293a1.0100.0.476function12eigenvalue% of variance cumulative %canonicalcorrelationfirst 2 canonical discrimi
37、nant functions were used in theanalysis.a. 鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(wilks lambda統(tǒng)計(jì)量統(tǒng)計(jì)量)檢驗(yàn)的零假設(shè)是各組變量均值相等檢驗(yàn)的零假設(shè)是各組變量均值相等. lambda接近接近0表示組均值不同表示組均值不同,接近接近1表示組均值沒有不同表示組均值沒有不同. chi-square是是lambda的卡方轉(zhuǎn)換的卡方轉(zhuǎn)換, 用于確定其顯用于確定其顯著性著性. wilks lambdawilks lambda.025538.9508.000.77437.3513.000test of function(s)1 through 22wilks lamb
38、dachi-squaredfsig.鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(有關(guān)判別函數(shù)的輸出有關(guān)判別函數(shù)的輸出)standardized canonical discriminantstandardized canonical discriminantfunction coefficientsfunction coefficients-.346.039-.525.742.846-.386.613.555花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬12function標(biāo)準(zhǔn)化的典則判別標(biāo)準(zhǔn)化的典則判別函數(shù)系數(shù)函數(shù)系數(shù)(使用時(shí)使用時(shí)必須用標(biāo)準(zhǔn)化的自必須用標(biāo)準(zhǔn)化的自變量變量)11234212340.3460.5250.8460.6130
39、.0390.7420.3860.555yxxxxyxxxx 鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(有關(guān)判別函數(shù)的輸出有關(guān)判別函數(shù)的輸出)canonical discriminant function coefficientscanonical discriminant function coefficients-.063.007-.155.218.196-.089.299.271-2.526-6.987花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬(constant)12functionunstandardized coefficients典則判別函數(shù)系數(shù)典則判別函數(shù)系數(shù)11234212340.0630.1550.1960.299
40、2.5260.0070.2180.0890.2716.948yxxxxyxxxx鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(有關(guān)判別函數(shù)的輸出有關(guān)判別函數(shù)的輸出)這是類均值這是類均值(重心重心)處的典則判別函數(shù)值處的典則判別函數(shù)值functions at group centroidsfunctions at group centroids-7.392.2191.763-.7375.629.518分類剛毛鳶尾花變色鳶尾花佛吉尼亞鳶尾花12functionunstandardized canonical discriminantfunctions evaluated at group means這是典則判別函數(shù)這是典
41、則判別函數(shù)(前面兩個(gè)函數(shù)前面兩個(gè)函數(shù))在類在類均值均值(重心重心)處的值處的值鳶尾花數(shù)據(jù)鳶尾花數(shù)據(jù)(用判別函數(shù)對(duì)觀測(cè)量分類結(jié)果用判別函數(shù)對(duì)觀測(cè)量分類結(jié)果)classification processing summaryclassification processing summary15000150processedmissing or out-of-rangegroup codesat least one missingdiscriminating variableexcludedused in outputprior probabilities for groupsprior proba
42、bilities for groups.3335050.000.3335050.000.3335050.0001.000150150.000分類剛毛鳶尾花變色鳶尾花佛吉尼亞鳶尾花totalpriorunweightedweightedcases used in analysisclassification function coefficientsclassification function coefficients1.6871.101.8652.6951.070.747-.8801.0011.647-2.284.1971.695-80.268-71.196-103.890花萼長(zhǎng)花萼寬花瓣長(zhǎng)花瓣寬(constant)剛毛鳶尾花變色鳶尾花佛吉尼亞鳶尾花分類fishers linear discriminant functions先驗(yàn)概率先驗(yàn)概率(沒有給沒有給)費(fèi)歇判別函數(shù)系數(shù)費(fèi)歇判別函數(shù)系數(shù)把自變量代入三個(gè)把自變量代入三個(gè)式子式子,哪個(gè)大歸誰哪個(gè)大歸誰. territorial mapcanonical discriminantfunction 2 -12.0 -8.0 -4.0 .0 4.0 8.0 12.0 趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 分紅股合作合同范本
- 公司建材購銷合同范本
- 車輛運(yùn)輸肉類合同范本
- 供貨合同范本范文
- 養(yǎng)殖股東協(xié)議合同范本
- 華為購車合同范本
- 區(qū)代理商合同范本
- 儲(chǔ)料倉合同范本
- 制作標(biāo)識(shí)標(biāo)牌合同范本
- 合理借款合同范例
- 動(dòng)畫劇本創(chuàng)作課件
- 40篇英語短文搞定高考3500個(gè)單詞
- 【企業(yè)會(huì)計(jì)信息化存在的問題及解決對(duì)策開題報(bào)告】
- 痘痘肌膚的各種類型
- (完整版)設(shè)計(jì)管理
- 中國嚴(yán)重膿毒癥膿毒性休克治療指南2023年
- 材料性能學(xué)(第2版)付華課件0-緒論-材料性能學(xué)
- GB/T 3403.2-2013塑料粉狀脲-甲醛和脲/三聚氰胺-甲醛模塑料(UF-和UF/MF-PMCs)第2部分:試樣制備和性能測(cè)定
- GB/T 21835-2008焊接鋼管尺寸及單位長(zhǎng)度重量
- 2023年湖南省普通高中學(xué)業(yè)水平考試數(shù)學(xué)版含答案
- 積極情緒的力量
評(píng)論
0/150
提交評(píng)論