應(yīng)用多元統(tǒng)計(jì)分析課后答案-朱建平版_第1頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析課后答案-朱建平版_第2頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析課后答案-朱建平版_第3頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析課后答案-朱建平版_第4頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析課后答案-朱建平版_第5頁(yè)
已閱讀5頁(yè),還剩85頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

.........學(xué)習(xí)參考.第二章2.1.試敘述多元聯(lián)合分布和邊際分布之間的關(guān)系。解:多元聯(lián)合分布討論多個(gè)隨機(jī)變量聯(lián)合到一起的概率分布狀況,的聯(lián)合分布密度函數(shù)是一個(gè)p維的函數(shù),而邊際分布討論是的子向量的概率分布,其概率密度函數(shù)的維數(shù)小于p。2.2設(shè)二維隨機(jī)向量服從二元正態(tài)分布,寫(xiě)出其聯(lián)合分布。解:設(shè)的均值向量為,協(xié)方差矩陣為,則其聯(lián)合分布密度函數(shù)為。2.3已知隨機(jī)向量的聯(lián)合密度函數(shù)為其中,。求(1)隨機(jī)變量和的邊緣密度函數(shù)、均值和方差;(2)隨機(jī)變量和的協(xié)方差和相關(guān)系數(shù);(3)判斷和是否相互獨(dú)立。(1)解:隨機(jī)變量和的邊緣密度函數(shù)、均值和方差;所以由于服從均勻分布,則均值為,方差為。同理,由于服從均勻分布,則均值為,方差為。(2)解:隨機(jī)變量和的協(xié)方差和相關(guān)系數(shù);(3)解:判斷和是否相互獨(dú)立。和由于,所以不獨(dú)立。2.4設(shè)服從正態(tài)分布,已知其協(xié)方差矩陣為對(duì)角陣,證明其分量是相互獨(dú)立的隨機(jī)變量。解:因?yàn)榈拿芏群瘮?shù)為又由于則則其分量是相互獨(dú)立。2.5由于多元正態(tài)分布的數(shù)學(xué)期望向量和均方差矩陣的極大似然分別為注:利用,S其中在SPSS中求樣本均值向量的操作步驟如下:選擇菜單項(xiàng)Analyze→DescriptiveStatistics→Descriptives,打開(kāi)Descriptives對(duì)話(huà)框。將待估計(jì)的四個(gè)變量移入右邊的Variables列表框中,如圖2.1。圖2.1Descriptives對(duì)話(huà)框單擊Options按鈕,打開(kāi)Options子對(duì)話(huà)框。在對(duì)話(huà)框中選擇Mean復(fù)選框,即計(jì)算樣本均值向量,如圖2.2所示。單擊Continue按鈕返回主對(duì)話(huà)框。圖2.2Options子對(duì)話(huà)框單擊OK按鈕,執(zhí)行操作。則在結(jié)果輸出窗口中給出樣本均值向量,如表2.1,即樣本均值向量為(35.3333,12.3333,17.1667,1.5250E2)。表2.1樣本均值向量在SPSS中計(jì)算樣本協(xié)差陣的步驟如下:選擇菜單項(xiàng)Analyze→Correlate→Bivariate,打開(kāi)BivariateCorrelations對(duì)話(huà)框。將三個(gè)變量移入右邊的Variables列表框中,如圖2.3。 圖2.3BivariateCorrelations對(duì)話(huà)框單擊Options按鈕,打開(kāi)Options子對(duì)話(huà)框。選擇Cross-productdeviationsandcovariances復(fù)選框,即計(jì)算樣本離差陣和樣本協(xié)差陣,如圖2.4。單擊Continue按鈕,返回主對(duì)話(huà)框。 圖2.4Options子對(duì)話(huà)框單擊OK按鈕,執(zhí)行操作。則在結(jié)果輸出窗口中給出相關(guān)分析表,見(jiàn)表2.2。表中Covariance給出樣本協(xié)差陣。(另外,PearsonCorrelation為皮爾遜相關(guān)系數(shù)矩陣,SumofSquaresandCross-products為樣本離差陣。)2.6漸近無(wú)偏性、有效性和一致性;2.7設(shè)總體服從正態(tài)分布,,有樣本。由于是相互獨(dú)立的正態(tài)分布隨機(jī)向量之和,所以也服從正態(tài)分布。又所以。2.8方法1:。方法2:。故為的無(wú)偏估計(jì)。2.9.設(shè)是從多元正態(tài)分布抽出的一個(gè)簡(jiǎn)單隨機(jī)樣本,試求的分布。證明:設(shè)為一正交矩陣,即。令,所以。且有,,。所以獨(dú)立同分布。又因?yàn)橐驗(yàn)橛忠驗(yàn)樗栽焦?,由于?dú)立同正態(tài)分布,所以2.10.設(shè)是來(lái)自的簡(jiǎn)單隨機(jī)樣本,,(1)已知且,求和的估計(jì)。(2)已知求和的估計(jì)。解:(1),(2)解之,得,第三章3.1試述多元統(tǒng)計(jì)分析中的各種均值向量和協(xié)差陣檢驗(yàn)的基本思想和步驟。其基本思想和步驟均可歸納為:答:第一,提出待檢驗(yàn)的假設(shè)H0和H1 第二,給出檢驗(yàn)的統(tǒng)計(jì)量及其服從的分布; 第三,給定檢驗(yàn)水平,查統(tǒng)計(jì)量的分布表,確定相應(yīng)的臨值,從而得到否定域; 第四,根據(jù)樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量的值,看是否落入否定域中,以便對(duì)待判假設(shè)做出決策(拒絕或接受)。均值向量的檢驗(yàn):統(tǒng)計(jì)量拒絕域在單一變量中當(dāng)已知當(dāng)未知(作為的估計(jì)量)一個(gè)正態(tài)總體協(xié)差陣已知協(xié)差陣未知()兩個(gè)正態(tài)總體有共同已知協(xié)差陣有共同未知協(xié)差陣(其中)協(xié)差陣不等協(xié)差陣不等多個(gè)正態(tài)總體單因素方差多因素方差協(xié)差陣的檢驗(yàn)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量3.2試述多元統(tǒng)計(jì)中霍特林T2分布和威爾克斯?答:(1)霍特林T2而若設(shè),且與相互獨(dú)立,,則稱(chēng)統(tǒng)計(jì)量T2=nX-μ'S-1(X-μ)的分布為非中心霍特林T2若,且與相互獨(dú)立,令,則。(2)威爾克斯?分布在實(shí)際應(yīng)用中經(jīng)常把?統(tǒng)計(jì)量化為統(tǒng)計(jì)量進(jìn)而化為統(tǒng)計(jì)量,利用統(tǒng)計(jì)量來(lái)解決多元統(tǒng)計(jì)分析中有關(guān)檢驗(yàn)問(wèn)題。與統(tǒng)計(jì)量的關(guān)系統(tǒng)計(jì)量及分別任意任意1任意任意21任意任意2任意任意3.3試述威爾克斯統(tǒng)計(jì)量在多元方差分析中的重要意義。答:威爾克斯統(tǒng)計(jì)量在多元方差分析中是用于檢驗(yàn)均值的統(tǒng)計(jì)量。用似然比原則構(gòu)成的檢驗(yàn)統(tǒng)計(jì)量為給定檢驗(yàn)水平,查Wilks分布表,確定臨界值,然后作出統(tǒng)計(jì)判斷。

第四章4.1簡(jiǎn)述歐幾里得距離與馬氏距離的區(qū)別和聯(lián)系。答:設(shè)p維歐幾里得空間Rp中的兩點(diǎn)X=(X1,X2?XP)'和Y=Y1,Y2設(shè)X,Y是來(lái)自均值向量為μ,協(xié)方差為的總體G中的p維樣本。則馬氏距離為D(X,Y)=X-Y'-1X-Y因此,在一定程度上,歐幾里得距離是馬氏距離的特殊情況,馬氏距離是歐幾里得距離的推廣。4.2試述判別分析的實(shí)質(zhì)。答:判別分析就是希望利用已經(jīng)測(cè)得的變量數(shù)據(jù),找出一種判別函數(shù),使得這一函數(shù)具有某種最優(yōu)性質(zhì),能把屬于不同類(lèi)別的樣本點(diǎn)盡可能地區(qū)別開(kāi)來(lái)。設(shè)R1,R2,…,Rk是p維空間Rp的k個(gè)子集,如果它們互不相交,且它們的和集為Rp,則稱(chēng)R1,R2?Rp為Rp的一個(gè)劃分。判別分析問(wèn)題實(shí)質(zhì)上就是在某種意義上,以最優(yōu)的性質(zhì)對(duì)p維空間R4.3簡(jiǎn)述距離判別法的基本思想和方法。答:距離判別問(wèn)題分為=1\*GB3①兩個(gè)總體的距離判別問(wèn)題和=2\*GB3②多個(gè)總體的判別問(wèn)題。其基本思想都是分別計(jì)算樣本與各個(gè)總體的距離(馬氏距離),將距離近的判別為一類(lèi)。=1\*GB3①兩個(gè)總體的距離判別問(wèn)題設(shè)有協(xié)方差矩陣∑相等的兩個(gè)總體G1和G2,其均值分別是1和2,對(duì)于一個(gè)新的樣品X,要判斷它來(lái)自哪個(gè)總體。計(jì)算新樣品X到兩個(gè)總體的馬氏距離D2(X,G1)和D2(X,G2),則X∈G1,D2(X,G1)≤D2(X,GX∈G2,D2(X,G1)>D2(X,G具體分析,記則判別規(guī)則為X∈G1,W(X)X∈G2=2\*GB3②多個(gè)總體的判別問(wèn)題。設(shè)有個(gè)總體,其均值和協(xié)方差矩陣分別是和,且。計(jì)算樣本到每個(gè)總體的馬氏距離,到哪個(gè)總體的距離最小就屬于哪個(gè)總體。具體分析,取,,??梢匀【€(xiàn)性判別函數(shù)為,相應(yīng)的判別規(guī)則為若4.4簡(jiǎn)述貝葉斯判別法的基本思想和方法。基本思想:設(shè)k個(gè)總體,其各自的分布密度函數(shù),假設(shè)k個(gè)總體各自出現(xiàn)的概率分別為,,。設(shè)將本來(lái)屬于總體的樣品錯(cuò)判到總體時(shí)造成的損失為,。設(shè)個(gè)總體相應(yīng)的維樣本空間為。在規(guī)則下,將屬于的樣品錯(cuò)判為的概率為則這種判別規(guī)則下樣品錯(cuò)判后所造成的平均損失為則用規(guī)則來(lái)進(jìn)行判別所造成的總平均損失為貝葉斯判別法則,就是要選擇一種劃分,使總平均損失達(dá)到極小。基本方法:令,則若有另一劃分,則在兩種劃分下的總平均損失之差為因?yàn)樵谏蠈?duì)一切成立,故上式小于或等于零,是貝葉斯判別的解。從而得到的劃分為4.5簡(jiǎn)述費(fèi)希爾判別法的基本思想和方法。答:基本思想:從個(gè)總體中抽取具有個(gè)指標(biāo)的樣品觀測(cè)數(shù)據(jù),借助方差分析的思想構(gòu)造一個(gè)線(xiàn)性判別函數(shù)系數(shù)可使得總體之間區(qū)別最大,而使每個(gè)總體內(nèi)部的離差最小。將新樣品的個(gè)指標(biāo)值代入線(xiàn)性判別函數(shù)式中求出值,然后根據(jù)判別一定的規(guī)則,就可以判別新的樣品屬于哪個(gè)總體。4.6試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的異同。答:=1\*GB3①費(fèi)希爾判別與距離判別對(duì)判別變量的分布類(lèi)型無(wú)要求。二者只是要求有各類(lèi)母體的兩階矩存在。而貝葉斯判別必須知道判別變量的分布類(lèi)型。因此前兩者相對(duì)來(lái)說(shuō)較為簡(jiǎn)單。=2\*GB3②當(dāng)k=2時(shí),若Σ1=Σ2=3\*GB3③當(dāng)Σ1≠Σ2時(shí),費(fèi)希爾判別用Σ=4\*GB3④距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)則是X∈G1,W(X)≥lndX∈G2距離判別的判別規(guī)則是X∈G1,X∈G2二者的區(qū)別在于閾值點(diǎn)。當(dāng),時(shí),,。二者完全相同。4.7設(shè)有兩個(gè)二元總體G1和G2,從中分別抽取樣本計(jì)算得到X(1)=51,X(2)=解:μ1=X(1)=51,μ2=XWx-μW∴X∈4.8某超市經(jīng)銷(xiāo)十種品牌的飲料,其中有四種暢銷(xiāo),三種滯銷(xiāo),三種平銷(xiāo)。下表是這十種品牌飲料的銷(xiāo)售價(jià)格(元)和顧客對(duì)各種飲料的口味評(píng)分、信任度評(píng)分的平均數(shù)。銷(xiāo)售情況產(chǎn)品序號(hào)銷(xiāo)售價(jià)格口味評(píng)分信任度評(píng)分暢銷(xiāo)12.25822.56733.03943.286平銷(xiāo)52.87663.58774.898滯銷(xiāo)81.73492.242102.743=1\*GB2⑴根據(jù)數(shù)據(jù)建立貝葉斯判別函數(shù),并根據(jù)此判別函數(shù)對(duì)原樣本進(jìn)行回判。=2\*GB2⑵現(xiàn)有一新品牌的飲料在該超市試銷(xiāo),其銷(xiāo)售價(jià)格為3.0,顧客對(duì)其口味的評(píng)分平均為8,信任評(píng)分平均為5,試預(yù)測(cè)該飲料的銷(xiāo)售情況。解:增加group變量,令暢銷(xiāo)、平銷(xiāo)、滯銷(xiāo)分別為group1、2、3;銷(xiāo)售價(jià)格為X1,口味評(píng)分為X2,信任度評(píng)分為X3,用spss解題的步驟如下:在SPSS窗口中選擇Analyze→Classify→Discriminate,調(diào)出判別分析主界面,將左邊的變量列表中的“group”變量選入分組變量中,將X1、X2、X3變量選入自變量中,并選擇Enterindependentstogether單選按鈕,即使用所有自變量進(jìn)行判別分析。點(diǎn)擊DefineRange按鈕,定義分組變量的取值范圍。本例中分類(lèi)變量的范圍為1到3,所以在最小值和最大值中分別輸入1和3。單擊Continue按鈕,返回主界面。如圖4.1圖4.1判別分析主界面單擊Statistics…按鈕,指定輸出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)。選中FunctionCoefficients欄中的Fisher’s:給出Bayes判別函數(shù)的系數(shù)。(注意:這個(gè)選項(xiàng)不是要給出Fisher判別函數(shù)的系數(shù)。這個(gè)復(fù)選框的名字之所以為Fisher’s,是因?yàn)榘磁袆e函數(shù)值最大的一組進(jìn)行歸類(lèi)這種思想是由Fisher提出來(lái)的。這里極易混淆,請(qǐng)讀者注意辨別。)如圖4.2。單擊Continue按鈕,返回主界面。圖4.2statistics子對(duì)話(huà)框單擊Classify…按鈕,彈出classification子對(duì)話(huà)框,選中Display選項(xiàng)欄中的Summarytable復(fù)選框,即要求輸出錯(cuò)判矩陣,以便實(shí)現(xiàn)題中對(duì)原樣本進(jìn)行回判的要求。如圖4.3。圖4.3classification對(duì)話(huà)框返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過(guò)程。根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù):Bayes判別函數(shù)的系數(shù)見(jiàn)表4.1。表中每一列表示樣本判入相應(yīng)類(lèi)的Bayes判別函數(shù)系數(shù)。由此可建立判別函數(shù)如下:Group1:Group2:Group3:將各樣品的自變量值代入上述三個(gè)Bayes判別函數(shù),得到三個(gè)函數(shù)值。比較這三個(gè)函數(shù)值,哪個(gè)函數(shù)值比較大就可以判斷該樣品判入哪一類(lèi)。ClassificationFunctionCoefficientsgroup123x1-11.689-10.707-2.194x212.29713.3614.960x316.76117.0866.447(Constant)-81.843-94.536-17.449Fisher'slineardiscriminantfunctions表4.1Bayes判別函數(shù)系數(shù)根據(jù)此判別函數(shù)對(duì)樣本進(jìn)行回判,結(jié)果如表4.2。從中可以看出在4種暢銷(xiāo)飲料中,有3種被正確地判定,有1種被錯(cuò)誤地判定為平銷(xiāo)飲料,正確率為75%。在3種平銷(xiāo)飲料中,有2種被正確判定,有1種被錯(cuò)誤地判定為暢銷(xiāo)飲料,正確率為66.7%。3種滯銷(xiāo)飲料均正確判定。整體的正確率為80.0%。ClassificationResultsagroupPredictedGroupMembershipTotal123OriginalCount131042120330033%175.025.0.0100.0233.366.7.0100.03.0.0100.0100.0a.80.0%oforiginalgroupedcasescorrectlyclassified.表4.2錯(cuò)判矩陣該新飲料的,,,將這3個(gè)自變量代入上一小題得到的Bayes判別函數(shù),的值最大,該飲料預(yù)計(jì)平銷(xiāo)。也可通過(guò)在原樣本中增加這一新樣本,重復(fù)上述的判別過(guò)程,并在classification子對(duì)話(huà)框中同時(shí)要求輸出casewiseresults,運(yùn)行判別過(guò)程,得到相同的結(jié)果。4.9銀行的貸款部門(mén)需要判別每個(gè)客戶(hù)的信用好壞(是否未履行還貸責(zé)任),以決定是否給予貸款??梢愿鶕?jù)貸款申請(qǐng)人的年齡()、受教育程度()、現(xiàn)在所從事工作的年數(shù)()、未變更住址的年數(shù)()、收入()、負(fù)債收入比例()、信用卡債務(wù)()、其它債務(wù)()等來(lái)判斷其信用情況。下表是從某銀行的客戶(hù)資料中抽取的部分?jǐn)?shù)據(jù),=1\*GB2⑴根據(jù)樣本資料分別用距離判別法、Bayes判別法和Fisher判別法建立判別函數(shù)和判別規(guī)則。=2\*GB2⑵某客戶(hù)的如上情況資料為(53,1,9,18,50,11.20,2.02,3.58),對(duì)其進(jìn)行信用好壞的判別。目前信用好壞客戶(hù)序號(hào)已履行還貸責(zé)任123172316.600.341.712341173598.001.812.913422723414.600.94.9443911954813.101.934.36535191345.000.401.30未履行還貸責(zé)任6371132415.101.801.827291131427.401.461.6583221167523.307.769.72928223236.400.191.2910261432710.502.47.36解:令已履行還貸責(zé)任為group0,未履行還貸責(zé)任為group1。令(53,1,9,18,50,11.20,2.02,3.58)客戶(hù)序號(hào)為11,group未知。用spss解題步驟如下:在SPSS窗口中選擇Analyze→Classify→Discriminate,調(diào)出判別分析主界面,將左邊的變量列表中的“group”變量選入分組變量中,將變量選入自變量中,并選擇Enterindependentstogether單選按鈕,即使用所有自變量進(jìn)行判別分析。點(diǎn)擊DefineRange按鈕,定義分組變量的取值范圍。本例中分類(lèi)變量的范圍為0到1,所以在最小值和最大值中分別輸入0和1。單擊Continue按鈕,返回主界面。單擊Statistics…按鈕,指定輸出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)。選中FunctionCoefficients欄中的Fisher’s和Unstandardized。單擊Continue按鈕,返回主界面。單擊Classify…按鈕,定義判別分組參數(shù)和選擇輸出結(jié)果。選擇Display欄中的Casewiseresults,以輸出一個(gè)判別結(jié)果表。其余的均保留系統(tǒng)默認(rèn)選項(xiàng)。單擊Continue按鈕。返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過(guò)程。用費(fèi)希爾判別法建立判別函數(shù)和判別規(guī)則:未標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)由于可以將實(shí)測(cè)的樣品觀測(cè)值直接代入求出判別得分,所以該系數(shù)使用起來(lái)比標(biāo)準(zhǔn)化的系數(shù)要方便一些。具體見(jiàn)表4.3。表4.3未標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)由此表可知,F(xiàn)isher判別函數(shù)為:用計(jì)算出各觀測(cè)值的具體坐標(biāo)位置后,再比較它們與各類(lèi)重心的距離,就可以得知分類(lèi),如若與group0的重心距離較近則屬于group0,反之亦然。各類(lèi)重心在空間中的坐標(biāo)位置如表4.4所示。表4.4各類(lèi)重心處的費(fèi)希爾判別函數(shù)值用bayes判別法建立判別函數(shù)與判別規(guī)則,由于此題中假設(shè)各類(lèi)出現(xiàn)的先驗(yàn)概率相等且誤判造成的損失也相等,所以距離判別法與bayes判別完全一致。如表4.5所示,group欄中的每一列表示樣品判入相應(yīng)列的Bayes判別函數(shù)系數(shù)。由此可得,各類(lèi)的Bayes判別函數(shù)如下:表4.5Bayes判別函數(shù)系數(shù)將各樣品的自變量值代入上述兩個(gè)Bayes判別函數(shù),得到兩個(gè)函數(shù)值。比較這兩個(gè)函數(shù)值,哪個(gè)函數(shù)值比較大就可以判斷該樣品該判入哪一類(lèi)。在判別結(jié)果的CasewiseStastics表中容易查到該客戶(hù)屬于group0,信用好。4.10從胃癌患者、萎縮性胃炎患者和非胃炎患者中分別抽取五個(gè)病人進(jìn)行四項(xiàng)生化指標(biāo)的化驗(yàn):血清銅蛋白、藍(lán)色反應(yīng)、尿吲哚乙酸和中性硫化物,數(shù)據(jù)見(jiàn)下表。試用距離判別法建立判別函數(shù),并根據(jù)此判別函數(shù)對(duì)原樣本進(jìn)行回判。類(lèi)別病人序號(hào)胃癌患者12281342011224513410403200167122741701507851001672014胃炎患者萎縮性622512571471301006128150117769120133102610160100510非胃炎患者1118511551912170125641316514253141351082121510011772解:令胃癌患者、萎縮性胃炎患者和非胃炎患者分別為group1、group2、group3,由于此題中假設(shè)各類(lèi)出現(xiàn)的先驗(yàn)概率相等且誤判造成的損失也相等,所以距離判別法與bayes判別完全一致。用spss的解題步驟如下:1.在SPSS窗口中選擇Analyze→Classify→Discriminate,調(diào)出判別分析主界面,將左邊的變量列表中的“group”變量選入分組變量中,將X1、X2、X3、X4變量選入自變量中,并選擇Enterindependentstogether單選按鈕,即使用所有自變量進(jìn)行判別分析。2.點(diǎn)擊DefineRange按鈕,定義分組變量的取值范圍。本例中分類(lèi)變量的范圍為1到3,所以在最小值和最大值中分別輸入1和3。單擊Continue按鈕,返回主界面。3.單擊Statistics…按鈕,指定輸出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)。選中FunctionCoefficients欄中的Fisher’s:給出Bayes判別函數(shù)的系數(shù)。4.單擊Classify…按鈕,彈出classification子對(duì)話(huà)框,選中Display選項(xiàng)欄中的Summarytable復(fù)選框,即要求輸出錯(cuò)判矩陣,以便實(shí)現(xiàn)題中對(duì)原樣本進(jìn)行回判的要求。5.返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過(guò)程。根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù):Bayes判別函數(shù)的系數(shù)見(jiàn)表4.6。表中每一列表示樣本判入相應(yīng)類(lèi)的Bayes判別函數(shù)系數(shù)。由此可建立判別函數(shù)如下:Group1:Group2:Group3:將各樣品的自變量值代入上述三個(gè)Bayes判別函數(shù),得到三個(gè)函數(shù)值。比較這三個(gè)函數(shù)值,哪個(gè)函數(shù)值比較大就可以判斷該樣品判入哪一類(lèi)。 表4.6Bayes判別函數(shù)系數(shù)根據(jù)此判別函數(shù)對(duì)樣本進(jìn)行回判,結(jié)果如表4.7。從中可以看出在5個(gè)胃癌患者中,有4個(gè)被正確地判定,有1個(gè)被錯(cuò)誤地判定為非胃炎患者,正確率為80%。在5個(gè)萎縮性胃炎患者中,有4個(gè)被正確判定,有1個(gè)被錯(cuò)誤地判定為非胃炎患者,正確率為80%。在5個(gè)非胃炎患者中,有4個(gè)被正確判定,有1個(gè)被錯(cuò)誤地判為萎縮性胃炎患者。整體的正確率為80.0%。表4.7錯(cuò)判矩陣第五章5.1判別分析和聚類(lèi)分析有何區(qū)別?答:即根據(jù)一定的判別準(zhǔn)則,判定一個(gè)樣本歸屬于哪一類(lèi)。具體而言,設(shè)有n個(gè)樣本,對(duì)每個(gè)樣本測(cè)得p項(xiàng)指標(biāo)(變量)的數(shù)據(jù),已知每個(gè)樣本屬于k個(gè)類(lèi)別(或總體)中的某一類(lèi),通過(guò)找出一個(gè)最優(yōu)的劃分,使得不同類(lèi)別的樣本盡可能地區(qū)別開(kāi),并判別該樣本屬于哪個(gè)總體。聚類(lèi)分析是分析如何對(duì)樣品(或變量)進(jìn)行量化分類(lèi)的問(wèn)題。在聚類(lèi)之前,我們并不知道總體,而是通過(guò)一次次的聚類(lèi),使相近的樣品(或變量)聚合形成總體。通俗來(lái)講,判別分析是在已知有多少類(lèi)及是什么類(lèi)的情況下進(jìn)行分類(lèi),而聚類(lèi)分析是在不知道類(lèi)的情況下進(jìn)行分類(lèi)。5.2試述系統(tǒng)聚類(lèi)的基本思想。答:系統(tǒng)聚類(lèi)的基本思想是:距離相近的樣品(或變量)先聚成類(lèi),距離相遠(yuǎn)的后聚成類(lèi),過(guò)程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類(lèi)中。5.3對(duì)樣品和變量進(jìn)行聚類(lèi)分析時(shí),所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡(jiǎn)要說(shuō)明為什么這樣構(gòu)造?答:對(duì)樣品進(jìn)行聚類(lèi)分析時(shí),用距離來(lái)測(cè)定樣品之間的相似程度。因?yàn)槲覀儼裯個(gè)樣本看作p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為(一)閔可夫斯基距離:q取不同值,分為(1)絕對(duì)距離()(2)歐氏距離()(3)切比雪夫距離()(二)馬氏距離 (三)蘭氏距離對(duì)變量的相似性,我們更多地要了解變量的變化趨勢(shì)或變化方向,因此用相關(guān)性進(jìn)行衡量。將變量看作p維空間的向量,一般用(一)夾角余弦(二)相關(guān)系數(shù)5.4在進(jìn)行系統(tǒng)聚類(lèi)時(shí),不同類(lèi)間距離計(jì)算方法有何區(qū)別?選擇距離公式應(yīng)遵循哪些原則?答:設(shè)dij表示樣品Xi與Xj之間距離,用Dij表示類(lèi)Gi與Gj之間的距離。(1).最短距離法(2)最長(zhǎng)距離法(3)中間距離法 其中-1/4≤β≤0(4)重心法(5)類(lèi)平均法(6)可變類(lèi)平均法其中是可變的且<1(7)可變法其中是可變的且<1(8)離差平方和法D通常選擇距離公式應(yīng)注意遵循以下的基本原則:(1)要考慮所選擇的距離公式在實(shí)際應(yīng)用中有明確的意義。如歐氏距離就有非常明確的空間距離概念。馬氏距離有消除量綱影響的作用。(2)要綜合考慮對(duì)樣本觀測(cè)數(shù)據(jù)的預(yù)處理和將要采用的聚類(lèi)分析方法。如在進(jìn)行聚類(lèi)分析之前已經(jīng)對(duì)變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。(3)要考慮研究對(duì)象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)比較復(fù)雜且?guī)в幸欢ㄖ饔^性的問(wèn)題,我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)不同做出具體分折。實(shí)際中,聚類(lèi)分析前不妨試探性地多選擇幾個(gè)距離公式分別進(jìn)行聚類(lèi),然后對(duì)聚類(lèi)分析的結(jié)果進(jìn)行對(duì)比分析,以確定最合適的距離測(cè)度方法。5.5試述K均值法與系統(tǒng)聚類(lèi)法的異同。答:相同:K—均值法和系統(tǒng)聚類(lèi)法一樣,都是以距離的遠(yuǎn)近親疏為標(biāo)準(zhǔn)進(jìn)行聚類(lèi)的。不同:系統(tǒng)聚類(lèi)對(duì)不同的類(lèi)數(shù)產(chǎn)生一系列的聚類(lèi)結(jié)果,而K—均值法只能產(chǎn)生指定類(lèi)數(shù)的聚類(lèi)結(jié)果。具體類(lèi)數(shù)的確定,離不開(kāi)實(shí)踐經(jīng)驗(yàn)的積累;有時(shí)也可以借助系統(tǒng)聚類(lèi)法以一部分樣品為對(duì)象進(jìn)行聚類(lèi),其結(jié)果作為K—均值法確定類(lèi)數(shù)的參考。5.6試述K均值法與系統(tǒng)聚類(lèi)有何區(qū)別?試述有序聚類(lèi)法的基本思想。答:K均值法的基本思想是將每一個(gè)樣品分配給最近中心(均值)的類(lèi)中。系統(tǒng)聚類(lèi)對(duì)不同的類(lèi)數(shù)產(chǎn)生一系列的聚類(lèi)結(jié)果,而K—均值法只能產(chǎn)生指定類(lèi)數(shù)的聚類(lèi)結(jié)果。具體類(lèi)數(shù)的確定,有時(shí)也可以借助系統(tǒng)聚類(lèi)法以一部分樣品為對(duì)象進(jìn)行聚類(lèi),其結(jié)果作為K均值法確定類(lèi)數(shù)的參考。有序聚類(lèi)就是解決樣品的次序不能變動(dòng)時(shí)的聚類(lèi)分析問(wèn)題。如果用表示個(gè)有序的樣品,則每一類(lèi)必須是這樣的形式,即,其中且,簡(jiǎn)記為。在同一類(lèi)中的樣品是次序相鄰的。一般的步驟是(1)計(jì)算直徑{D(i,j)}。(2)計(jì)算最小分類(lèi)損失函數(shù){L[p(l,k)]}。(3)確定分類(lèi)個(gè)數(shù)k。(4)最優(yōu)分類(lèi)。5.7檢測(cè)某類(lèi)產(chǎn)品的重量,抽了六個(gè)樣品,每個(gè)樣品只測(cè)了一個(gè)指標(biāo),分別為1,2,3,6,9,11.試用最短距離法,重心法進(jìn)行聚類(lèi)分析。(1)用最短距離法進(jìn)行聚類(lèi)分析。采用絕對(duì)值距離,計(jì)算樣品間距離陣DG1G2G3G4G10G2G3G4G5G6由上表易知D(0)中最小元素是D12=D23=1于是將計(jì)算距離陣DG7G4GG70G4G5G6D(1)中最小元素是D56=2于是將G5計(jì)算樣本距離陣D(G7G4G70G4G8D(2)中最小元素是D47=D48因此,(2)用重心法進(jìn)行聚類(lèi)分析計(jì)算樣品間平方距離陣D2G1G2G3G4G10G2G3G4G5G6易知D2(0)中最小元素是D212=D2計(jì)算距離陣DG7G4GG70G4G5G6注:計(jì)算方法D247D2(1)中最小元素是D256計(jì)算樣本距離陣DG7G4G70G4G8D2(2)中最小元素是D247=因此,5.8下表是15個(gè)上市公司2001年的一些主要財(cái)務(wù)指標(biāo),使用系統(tǒng)聚類(lèi)法和K-均值法分別對(duì)這些公司進(jìn)行聚類(lèi),并對(duì)結(jié)果進(jìn)行比較分析。公司編號(hào)凈資產(chǎn)收益率每股凈利潤(rùn)總資產(chǎn)周轉(zhuǎn)率資產(chǎn)負(fù)債率流動(dòng)負(fù)債比率每股凈資產(chǎn)凈利潤(rùn)增長(zhǎng)率總資產(chǎn)增長(zhǎng)率111.090.210.0596.9870.531.86-44.0481.99211.960.590.7451.7890.734.957.0216.11300.030.03181.99100-2.98103.3321.18411.580.130.1746.0792.181.146.55-56.325-6.19-0.090.0343.382.241.52-1713.5-3.366100.470.4868.4864.7-11.560.85710.490.110.3582.9899.871.02100.2330.32811.12-1.690.12132.14100-0.66-4454.39-62.7593.410.040.267.8698.511.25-11.25-11.43101.160.010.5443.71001.03-87.18-7.411130.220.160.487.3694.880.53729.41-9.97128.190.220.3830.311002.73-12.31-2.771395.79-5.20.5252.3499.34-5.42-9816.52-46.821416.550.350.9372.3184.052.14115.95123.4115-24.18-1.160.7956.2697.84.81-533.89-27.74解:令凈資產(chǎn)收益率為X1,每股凈利潤(rùn)X2,總資產(chǎn)周轉(zhuǎn)率為X3,資產(chǎn)負(fù)債率為X4,流動(dòng)負(fù)債比率為X5,每股凈資產(chǎn)為X6,凈利潤(rùn)增長(zhǎng)率為X7,總資產(chǎn)增長(zhǎng)率為X8,用spss對(duì)公司聚類(lèi)分析的步驟如下:系統(tǒng)聚類(lèi)法:在SPSS窗口中選擇Analyze→Classify→HierachicalCluster,調(diào)出系統(tǒng)聚類(lèi)分析主界面,并將變量移入Variables框中。在Cluster欄中選擇Cases單選按鈕,即對(duì)樣品進(jìn)行聚類(lèi)(若選擇Variables,則對(duì)變量進(jìn)行聚類(lèi))。在Display欄中選擇Statistics和Plots復(fù)選框,這樣在結(jié)果輸出窗口中可以同時(shí)得到聚類(lèi)結(jié)果統(tǒng)計(jì)量和統(tǒng)計(jì)圖。圖5.1系統(tǒng)分析法主界面點(diǎn)擊Statistics按鈕,設(shè)置在結(jié)果輸出窗口中給出的聚類(lèi)分析統(tǒng)計(jì)量。我們選擇Agglomerationschedule與ClusterMembership中的Rangeofsolution2-4,如圖5.2所示,點(diǎn)擊Continue按鈕,返回主界面。(其中,Agglomerationschedule表示在結(jié)果中給出聚類(lèi)過(guò)程表,顯示系統(tǒng)聚類(lèi)的詳細(xì)步驟;Proximitymatrix表示輸出各個(gè)體之間的距離矩陣;ClusterMembership表示在結(jié)果中輸出一個(gè)表,表中顯示每個(gè)個(gè)體被分配到的類(lèi)別,Rangeofsolution2-4即將所有個(gè)體分為2至4類(lèi)。)點(diǎn)擊Plots按鈕,設(shè)置結(jié)果輸出窗口中給出的聚類(lèi)分析統(tǒng)計(jì)圖。選中Dendrogram復(fù)選框和Icicle欄中的None單選按鈕,如圖5.3,即只給出聚類(lèi)樹(shù)形圖,而不給出冰柱圖。單擊Continue按鈕,返回主界面。圖5.2Statistics子對(duì)話(huà)框圖5.3Plots子對(duì)話(huà)框點(diǎn)擊Method按鈕,設(shè)置系統(tǒng)聚類(lèi)的方法選項(xiàng)。ClusterMethod下拉列表用于指定聚類(lèi)的方法,這里選擇Between-groupinkage(組間平均數(shù)連接距離);Measure欄用于選擇對(duì)距離和相似性的測(cè)度方法,選擇SquaredEuclideandistance(歐氏距離);單擊Continue按鈕,返回主界面。圖5.4Method子對(duì)話(huà)框圖5.5Save子對(duì)話(huà)框點(diǎn)擊Save按鈕,指定保存在數(shù)據(jù)文件中的用于表明聚類(lèi)結(jié)果的新變量。None表示不保存任何新變量;Singlesolution表示生成一個(gè)分類(lèi)變量,在其后的矩形框中輸入要分成的類(lèi)數(shù);Rangeofsolutions表示生成多個(gè)分類(lèi)變量。這里我們選擇Rangeofsolutions,并在后面的兩個(gè)矩形框中分別輸入2和4,即生成三個(gè)新的分類(lèi)變量,分別表明將樣品分為2類(lèi)、3類(lèi)和4類(lèi)時(shí)的聚類(lèi)結(jié)果,如圖5.5。點(diǎn)擊Continue,返回主界面。點(diǎn)擊OK按鈕,運(yùn)行系統(tǒng)聚類(lèi)過(guò)程。聚類(lèi)結(jié)果分析:下面的群集成員表給出了把公司分為2類(lèi),3類(lèi),4類(lèi)時(shí)各個(gè)樣本所屬類(lèi)別的情況,另外,從右邊的樹(shù)形圖也可以直觀地看到,若將15個(gè)公司分為2類(lèi),則13獨(dú)自為一類(lèi),其余的為一類(lèi);若分為3類(lèi),則公司8分離出來(lái),自成一類(lèi)。以此類(lèi)推。表5.1各樣品所屬類(lèi)別表圖5.6聚類(lèi)樹(shù)形圖K均值法的步驟如下:在SPSS窗口中選擇Analyze→Classify→K-MeansCluster,調(diào)出K均值聚類(lèi)分析主界面,并將變量X1-X8移入Variables框中。在Method框中選擇Iterateclassify,即使用K-means算法不斷計(jì)算新的類(lèi)中心,并替換舊的類(lèi)中心(若選擇Classifyonly,則根據(jù)初始類(lèi)中心進(jìn)行聚類(lèi),在聚類(lèi)過(guò)程中不改變類(lèi)中心)。在NumberofCluster后面的矩形框中輸入想要把樣品聚成的類(lèi)數(shù),這里我們輸入3,即將15個(gè)公司分為3類(lèi)。(Centers按鈕,則用于設(shè)置迭代的初始類(lèi)中心。如果不手工設(shè)置,則系統(tǒng)會(huì)自動(dòng)設(shè)置初始類(lèi)中心,這里我們不作設(shè)置。)圖5.7K均值聚類(lèi)分析主界面點(diǎn)擊Iterate按鈕,對(duì)迭代參數(shù)進(jìn)行設(shè)置。MaximumIterations參數(shù)框用于設(shè)定K-means算法迭代的最大次數(shù),輸入10,ConvergenceCriterion參數(shù)框用于設(shè)定算法的收斂判據(jù),輸入0,只要在迭代的過(guò)程中先滿(mǎn)足了其中的參數(shù),則迭代過(guò)程就停止。單擊Continue,返回主界面。圖5.8Iterate子對(duì)話(huà)框點(diǎn)擊Save按鈕,設(shè)置保存在數(shù)據(jù)文件中的表明聚類(lèi)結(jié)果的新變量。我們將兩個(gè)復(fù)選框都選中,其中Clustermembership選項(xiàng)用于建立一個(gè)代表聚類(lèi)結(jié)果的變量,默認(rèn)變量名為qcl_1;Distancefromclustercenter選項(xiàng)建立一個(gè)新變量,代表各觀測(cè)量與其所屬類(lèi)中心的歐氏距離。單擊Continue按鈕返回。圖5.9Save子對(duì)話(huà)框點(diǎn)擊Options按鈕,指定要計(jì)算的統(tǒng)計(jì)量。選中Initialclustercenters和Clusterinformationforeachcase復(fù)選框。這樣,在輸出窗口中將給出聚類(lèi)的初始類(lèi)中心和每個(gè)公司的分類(lèi)信息,包括分配到哪一類(lèi)和該公司距所屬類(lèi)中心的距離。單擊Continue返回。圖5.10Options子對(duì)話(huà)框點(diǎn)擊OK按鈕,運(yùn)行K均值聚類(lèi)分析程序。聚類(lèi)結(jié)果分析:以下三表給出了各公司所屬的類(lèi)及其與所屬類(lèi)中心的距離,聚類(lèi)形成的類(lèi)的中心的各變量值以及各類(lèi)的公司數(shù)。由以上表格可得公司13與公司8各自成一類(lèi),其余的公司為一類(lèi)。通過(guò)比較可知,兩種聚類(lèi)方法得到的聚類(lèi)結(jié)果完全一致。5.9下表是某年我國(guó)16個(gè)地區(qū)農(nóng)民支出情況的抽樣調(diào)查數(shù)據(jù),每個(gè)地區(qū)調(diào)查了反映每人平均生活消費(fèi)支出情況的六個(gè)經(jīng)濟(jì)指標(biāo)。試通過(guò)統(tǒng)計(jì)分析軟件用不同的方法進(jìn)行系統(tǒng)聚類(lèi)分析,并比較何種方法與人們觀察到的實(shí)際情況較接近。地區(qū)食品衣著燃料住房交通和通訊娛樂(lè)教育文化北京190.3343.779.7360.5449.019.04天津135.236.410.4744.1636.493.94河北95.2122.839.322.4422.812.8山西104.7825.116.49.8918.173.25內(nèi)蒙128.4127.638.9412.5823.992.27遼寧145.6832.8317.7927.2939.093.47吉林159.3733.3818.3711.8125.295.22黑龍江116.2229.5713.2413.7621.756.04上海221.1138.6412.53115.6550.825.89江蘇144.9829.1211.6742.627.35.74浙江169.9232.7512.7247.1234.355安徽135.1123.0915.6223.5418.186.39福建144.9221.2616.9619.5221.756.73江西140.5421.517.6419.1915.974.94山東115.8430.2612.233.633.773.85河南101.1823.268.4620.220.54.3解:令食品支出為X1,衣著支出為X2,燃料支出為X3,住房支出為X4,交通和通訊支出為X5,娛樂(lè)教育文化支出為X6,用spss對(duì)16各地區(qū)聚類(lèi)分析的步驟如5.8題,不同的方法在第4個(gè)步驟的Method子對(duì)話(huà)框中選擇不同的Clustermethod。Between-groupinkage(組間平均數(shù)連接距離)上表給出了把全國(guó)16個(gè)地區(qū)分為2類(lèi)、3類(lèi)和4類(lèi)時(shí),各地區(qū)所屬的類(lèi)別,另外從右邊的樹(shù)形圖也可以直觀地觀察到,若用組間平均數(shù)連接距離將這些地區(qū)分為3類(lèi),則9(上海)獨(dú)自為一類(lèi),1(北京)和11(浙江)為一類(lèi),剩余地區(qū)為一類(lèi)。Within-grouplinkage(組內(nèi)平均連接距離)若用組內(nèi)平均數(shù)連接距離將這些地區(qū)分為3類(lèi),則9(上海)獨(dú)自為一類(lèi),1(北京)獨(dú)自為一類(lèi),剩余地區(qū)為一類(lèi)。Nearestneighbor(最短距離法)若用最短距離法將這些地區(qū)分為3類(lèi),則9(上海)獨(dú)自為一類(lèi),1(北京)獨(dú)自為一類(lèi),剩余地區(qū)為一類(lèi)。Furthestneighbor(最遠(yuǎn)距離法)若用最遠(yuǎn)距離法將這些地區(qū)分為3類(lèi),則9(上海)獨(dú)自為一類(lèi),1(北京)和11(浙江)為一類(lèi),剩余地區(qū)為一類(lèi)。Centroidcluster(重心法)若用重心法將這些地區(qū)分為3類(lèi),則9(上海)獨(dú)自為一類(lèi),1(北京)和11(浙江)為一類(lèi),剩余地區(qū)為一類(lèi)。Mediancluster(中位數(shù)距離)若用中位數(shù)距離法將這些地區(qū)分為3類(lèi),則9(上海)獨(dú)自為一類(lèi),1(北京)和11(浙江)為一類(lèi),剩余地區(qū)為一類(lèi)。Wardmethod(離差平方和)若用離差平方和法將這些地區(qū)分為3類(lèi),則9(上海),1(北京)和11(浙江)為一類(lèi),2(天津)、6(遼寧)、7(吉林)、10(江蘇)、12(安徽)、13(福建)和14(江西)為一類(lèi),剩余地區(qū)為一類(lèi)。5.10根據(jù)上題數(shù)據(jù)通過(guò)SPSS統(tǒng)計(jì)分析軟件進(jìn)行快速聚類(lèi)運(yùn)算,并與系統(tǒng)聚類(lèi)分析結(jié)果進(jìn)行比較。解:快速聚類(lèi)運(yùn)算即K均值法聚類(lèi),具體步驟同5.8,聚類(lèi)結(jié)果如下:聚類(lèi)的結(jié)果為9(上海)獨(dú)自為一類(lèi),1(北京)、2(天津)、6(遼寧)、7(吉林)、10(江蘇)、11(浙江)、13(福建)和14(江西)為一類(lèi),剩余地區(qū)為一類(lèi)。5.11下表是2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo):人均GDP(元)、人均工業(yè)產(chǎn)值(元)、客運(yùn)總量(萬(wàn)人)、貨運(yùn)總量(萬(wàn)噸)、地方財(cái)政預(yù)算內(nèi)收入(億元)、固定資產(chǎn)投資總額(億元)、在崗職工占總?cè)丝诘谋壤ǎィ⒃趰徛毠と司べY額(元)、城鄉(xiāng)居民年底儲(chǔ)蓄余額(億元)。試通過(guò)統(tǒng)計(jì)分析軟件進(jìn)行系統(tǒng)聚類(lèi)分析,并比較何種方法與人們觀察到的實(shí)際情況較接近。城市北京31886331683052030671593200037.8253126441天津264334373235073467920593418.8186481825石家莊15134131591184310008494169.5123061044太原15752158312975152483319722.812679660呼和浩特1899111257350841552118213.514116255沈陽(yáng)23268154466612146368155714.8149611423大連2914527615110012108111140714.7175601310長(zhǎng)春18630210456999108924629412.513870831哈爾濱148257561645895187642317.7124511154上海4658677083721263861899227421.0273056055南京2754743853167901480513679415.4221901134杭州3266749823213491681515071711.8246671466寧波3254347904249381379713955510.9236911060合肥106211171460344641362458.313901359福州2228121310968082506737611.815053876廈門(mén)5359093126444130557023838.619024397南昌142219205572844543121011.013913483濟(jì)南23437226345810143547642913.516027758青島2470535506146663055312054814.515335908鄭州16674140231070978476637312.7135381048武漢212781708311882166108062317.4137301286長(zhǎng)沙15446887310609106316043410.016987705廣州48220554042975128859275108925.1288053727深圳19183834751910989679329187569.6310532199南寧8176339070165893361708.313171451???644214553132843304129916.514819284重慶71905076582903245016211876.5124401897成都17914928972793287989078811.9152741494貴陽(yáng)11046103501851153184023115.812181345昆明16215116015126123386034214.614255709西安1314089131141393926544615.9135051211蘭州1445917136220955812120318.013489468西寧706656052788203787610.114629175銀川1178711013214621271213421.913497193烏魯木齊22508171372188127544118026.116509420南寧31886331683052030671593200037.8253126441海口264334373235073467920593418.8186481825資料來(lái)源:《中國(guó)統(tǒng)計(jì)年鑒2004》解:用spss對(duì)37個(gè)地區(qū)聚類(lèi)分析的步驟如5.8題,不同的方法在第4個(gè)步驟的Method子對(duì)話(huà)框中選擇不同的Clustermethod。1.Between-groupinkage(組間平均數(shù)連接距離)從上面的樹(shù)形圖可以直觀地觀察到,若用組間平均數(shù)連接距離將這些地區(qū)分為3類(lèi),則24(深圳)獨(dú)自為一類(lèi),10(上海)和16(廈門(mén))為一類(lèi),剩余地區(qū)為一類(lèi)。2.Within-grouplinkage(組內(nèi)平均連接距離)若用組內(nèi)平均數(shù)連接距離將這些地區(qū)分為3類(lèi),則24(上海)獨(dú)自為一類(lèi),27(重慶)和28(成都)為一類(lèi),剩余地區(qū)為一類(lèi)。3.Nearestneighbor(最短距離法)若用最短距離法將這些地區(qū)分為2類(lèi),則24(深圳)獨(dú)自為一類(lèi),剩余地區(qū)為一類(lèi)。4.Furthestneighbor(最遠(yuǎn)距離法)若用最遠(yuǎn)距離法將這些地區(qū)分為3類(lèi),則24(深圳)獨(dú)自為一類(lèi),1(北京)、2(天津)、7(大連)、10(上海)、11(南京)、12(杭州)、13(寧波)、16(廈門(mén))、19(青島)、23(廣州)、36(海寧)和37(??冢橐活?lèi),剩余地區(qū)為一類(lèi)。5.Centroidcluster(重心法)若用重心法將這些地區(qū)分為3類(lèi),則24(深圳)獨(dú)自為一類(lèi),10(上海)和16(廈門(mén))為一類(lèi),剩余地區(qū)為一類(lèi)。6.Mediancluster(中位數(shù)距離)若用中位數(shù)距離法將這些地區(qū)分為3類(lèi),則24(深圳)獨(dú)自為一類(lèi),1(北京)、2(天津)、7(大連)、10(上海)、11(南京)、12(杭州)、13(寧波)、16(廈門(mén))、19(青島)、23(廣州)、36(海寧)和37(??冢橐活?lèi),剩余地區(qū)為一類(lèi)。7.Wardmethod(離差平方和)若用離差平方和法將這些地區(qū)分為3類(lèi),則24(深圳)獨(dú)自為一類(lèi),1(北京)、2(天津)、7(大連)、10(上海)、11(南京)、12(杭州)、13(寧波)、16(廈門(mén))、19(青島)、23(廣州)、36(海寧)和37(??冢橐活?lèi),剩余地區(qū)為一類(lèi)。經(jīng)過(guò)比較,各種方法得到的結(jié)果又相似點(diǎn)也有不同點(diǎn)。筆者認(rèn)為,其中最遠(yuǎn)距離法、中位數(shù)距離、離差平方和這三種方法所得到的結(jié)果與現(xiàn)實(shí)生活中人們的感覺(jué)比較相近。5.12下表是我國(guó)1991-2003年的固定資產(chǎn)投資價(jià)格指數(shù),試對(duì)這段時(shí)期進(jìn)行分段,并據(jù)此對(duì)我國(guó)固定資產(chǎn)投資的價(jià)格變化情況進(jìn)行分析。年份1991199219931994199519961997指數(shù)109.5115.3126.6110.4105.9104.0101.7年份199819992000200120022003指數(shù)99.899.6101.1100.4100.2100.2第六章6.1試述主成分分析的基本思想。答:我們處理的問(wèn)題多是多指標(biāo)變量問(wèn)題,由于多個(gè)變量之間往往存在著一定程度的相關(guān)性,人們希望能通過(guò)線(xiàn)性組合的方式從這些指標(biāo)中盡可能快的提取信息。當(dāng)?shù)谝粋€(gè)組合不能提取更多信息時(shí),再考慮第二個(gè)線(xiàn)性組合。繼續(xù)這個(gè)過(guò)程,直到提取的信息與原指標(biāo)差不多時(shí)為止。這就是主成分分析的基本思想。6.2主成分分析的作用體現(xiàn)在何處?答:一般說(shuō)來(lái),在主成分分析適用的場(chǎng)合,用較少的主成分就可以得到較多的信息量。以各個(gè)主成分為分量,就得到一個(gè)更低維的隨機(jī)向量;主成分分析的作用就是在降低數(shù)據(jù)“維數(shù)”的同時(shí)又保留了原數(shù)據(jù)的大部分信息。6.3簡(jiǎn)述主成分分析中累積貢獻(xiàn)率的具體含義。答:主成分分析把個(gè)原始變量的總方差分解成了個(gè)相互獨(dú)立的變量的方差之和。主成分分析的目的是減少變量的個(gè)數(shù),所以一般不會(huì)使用所有個(gè)主成分的,忽略一些帶有較小方差的主成分將不會(huì)給總方差帶來(lái)太大的影響。這里我們稱(chēng)為第個(gè)主成分的貢獻(xiàn)率。第一主成分的貢獻(xiàn)率最大,這表明綜合原始變量的能力最強(qiáng),而的綜合能力依次遞減。若只取個(gè)主成分,則稱(chēng)為主成分的累計(jì)貢獻(xiàn)率,累計(jì)貢獻(xiàn)率表明綜合的能力。通常取,使得累計(jì)貢獻(xiàn)率達(dá)到一個(gè)較高的百分?jǐn)?shù)(如85%以上)。6.4在主成分分析中“原變量方差之和等于新的變量的方差之和”是否正確?說(shuō)明理由。答:這個(gè)說(shuō)法是正確的。i=1∴即原變量方差之和等于新的變量的方差之和6.5試述根據(jù)協(xié)差陣進(jìn)行主成分分析和根據(jù)相關(guān)陣進(jìn)行主成分分析的區(qū)別。答:從相關(guān)陣求得的主成分與協(xié)差陣求得的主成分一般情況是不相同的。從協(xié)方差矩陣Σ出發(fā)的,其結(jié)果受變量單位的影響。主成分傾向于多歸納方差大的變量的信息,對(duì)于方差小的變量就可能體現(xiàn)得不夠,也存在“大數(shù)吃小數(shù)”的問(wèn)題。實(shí)際表明,這種差異有時(shí)很大。我們認(rèn)為,如果各指標(biāo)之間的數(shù)量級(jí)相差懸殊,特別是各指標(biāo)有不同的物理量綱的話(huà),較為合理的做法是使用R代替∑。對(duì)于研究經(jīng)濟(jì)問(wèn)題所涉及的變量單位大都不統(tǒng)一,采用R代替∑后,可以看作是用標(biāo)準(zhǔn)化的數(shù)據(jù)做分析,這樣使得主成分有現(xiàn)實(shí)經(jīng)濟(jì)意義,不僅便于剖析實(shí)際問(wèn)題,又可以避免突出數(shù)值大的變量。6.6已知X=(X1,X2,X3)解:Σ-λE=計(jì)算得-64∴∴D當(dāng)λ1=12時(shí),∴同理,計(jì)算得

λ2λ3易知α1單位化向量得,TT2=α∴Y1綜上所述,第一主成分為Y1=第二主成分為Y2=-1第三主成分為Y3=-6.7設(shè)X=(X1,?,Xp)Σ=σ證明:λ1=σ證明:Σ-λE=(p-1)=(p-1)∵0<ρ<1,λ1=[λ1∴λ當(dāng)λ1Σ-λ1?α1T1所以,Y6.8利用主成分分析法,綜合評(píng)價(jià)六個(gè)工業(yè)行業(yè)的經(jīng)濟(jì)效益指標(biāo)。單位:(億元)行業(yè)名稱(chēng)資產(chǎn)總計(jì)固定資產(chǎn)凈值平均余額產(chǎn)品銷(xiāo)售收入利潤(rùn)總額煤炭開(kāi)采和選業(yè)6917.23032.7683.361.6石油和天然氣開(kāi)采業(yè)5675.93926.2717.533877黑色金屬礦采選業(yè)768.1221.296.513.8有色金屬礦采選業(yè)622.4248116.421.6非金屬礦采選業(yè)699.9291.584.96.2其它采礦業(yè)1.60.50.30解:令資產(chǎn)總計(jì)為X1,固定資產(chǎn)凈值平均余額為X2,產(chǎn)品銷(xiāo)售收入為X3,利潤(rùn)總額為X4,用SPSS對(duì)這六個(gè)行業(yè)進(jìn)行主成分分析的方法如下:在SPSS窗口中選擇Analyze→DataReduction→Factor菜單項(xiàng),調(diào)出因子分析主界面,并將變量移入Variables框中,其他均保持系統(tǒng)默認(rèn)選項(xiàng),單擊OK按鈕,執(zhí)行因子分析過(guò)程(關(guān)于因子分子在SPSS中實(shí)現(xiàn)的詳細(xì)過(guò)程,參見(jiàn)7.7)。得到如表6.1所示的特征根和方差貢獻(xiàn)率表和表6.2所示的因子載荷陣。第一個(gè)因子就可以解釋86.5%表6.1特征根和方差貢獻(xiàn)率表表6.2因子載荷陣將表6.2中因子載荷陣中的數(shù)據(jù)輸入SPSS數(shù)據(jù)編輯窗口,命名為a1。點(diǎn)擊菜單項(xiàng)中的Transform→Compute,調(diào)出Computevariable對(duì)話(huà)框,在對(duì)話(huà)框中輸入等式:z1=a1/SQRT(3.46),計(jì)算第一個(gè)特征向量。點(diǎn)擊OK按鈕,即可在數(shù)據(jù)編輯窗口中得到以z1為變量名的第一特征向量。表6.3特征向量矩陣z1x10.509x20.537x30.530x40.413根據(jù)表6.3得主成分的表達(dá)式:再次使用Compute命令,調(diào)出Computevariable對(duì)話(huà)框,在對(duì)話(huà)框中輸入等式:根據(jù)六個(gè)工業(yè)行業(yè)計(jì)算所的y1的大小可得石油和天然氣開(kāi)采業(yè)的經(jīng)濟(jì)效益最好,煤炭開(kāi)采和選業(yè)其次,接著依次是黑色金屬、非金屬、有色金屬和其他采礦業(yè)。6.9下表是我國(guó)2003年各地區(qū)農(nóng)村居民家庭平均每人主要食品消費(fèi)量,試用主成分方法對(duì)各主要食品和地區(qū)進(jìn)行分類(lèi)。地區(qū)糧食蔬菜食油豬牛羊肉家禽蛋類(lèi)及其制品水產(chǎn)品食糠酒北京134.0592.789.1514.62.1710.134.252.9214.42天津150.269.991011.070.8410.88.350.7210.14河北216.7255.976.597.10.546.362.250.657.29山西218.9180.875.725.360.246.150.471.152.59內(nèi)蒙207.370.772.7921.181.413.821.451.3410.77遼寧194.39178.595.916.452.519.594.490.7310.8吉林255.99115.26.2711.423.238.643.60.7513.64黑龍江195.08111.77.627.852.616.263.350.915.09上海189.4476.68.5916.377.47.5116.112.1216.77江蘇251.98109.128.2712.054.56.729.091.38.82浙江208.4683.915.8116.426.035.3314.642.1324.15安徽228.3580.976.879.074.275.045.431.4210.61福建198.2799.925.1916.515.143.5513.32.3516.84江西264.8144.228.7713.243.313.55.191.137.31山東229.06118.196.968.092.711.614.01110.81河南236.97100.114.226.481.238.011.351.134.23湖南227.39159.769.419.862.743.868.10.927.29湖北247.21149.448.3517.513.893.286.891.134.02廣東233.75130.226.7322.2710.42.8313.32.163.33廣西205.65108.944.9214.447.331.123.571.186.14海南236.3186.615.715.49.771.3114.751.243.88解:令糧食為X1,蔬菜為x2,食油為x3,豬牛羊肉為x4,家禽為x5,蛋類(lèi)及其制品為x6,水產(chǎn)品為x7,食糠為x8,酒為x9,用SPSS進(jìn)行主成分分析的具體方法參見(jiàn)6.8,分析結(jié)果如下:表6.4特征根和方差貢獻(xiàn)率表表6.5因子載荷陣表6.6特征向量矩陣z1z2z3x10.001169-0.55035-0.00518x20.054359-0.320140.616746x30.0052610.1852390.697829x40.455914-0.075840.167341x50.509689-0.14229-0.05521x6-0.329080.4080630.269126x70.5009210.1187950.112136x80.3881120.332893-0.13025x90.1408660.4933-0.01984根據(jù)表6.6得主成分的表達(dá)式:分別計(jì)算出以上三項(xiàng)后,利用公式得到綜合得分并排序如下表:地區(qū)y1y2y3y北京14.92-90.4267.81-10.16天津11.80-93.4854.76-15.31上海24.39-115.4657.85-16.51福建24.55-129.9368.56-19.17浙江25.14-126.0059.51-19.43遼寧19.55-154.56118.72-19.47黑龍江13.27-131.9076.07-23.38湖南23.53-169.91108.84-24.97廣東29.80-167.0688.93-25.29廣西19.18-144.8972.06-25.99內(nèi)蒙15.93-130.4748.84-27.33海南24.93-154.5760.04-29.19山東11.81-152.6481.06-30.09湖北21.71-179.61100.93-30.74安徽14.06-143.1256.46-30.92江蘇18.07-164.9376.08-32.51河北7.10-129.8340.94-32.73山西6.20-141.4455.18-34.15吉林14.54-166.9078.26-34.32江西18.74-185.6297.04-34.94河南8.32-156.3666.62-35.93最后的分類(lèi)可以根據(jù)最終得分Y的值來(lái)劃分,由于沒(méi)有給出具體的分類(lèi)標(biāo)準(zhǔn),具體分類(lèi)結(jié)果根據(jù)各人的主觀意愿可以有多種答案。6.10根據(jù)習(xí)題5.10中2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),利用主成分分析法對(duì)這些地區(qū)進(jìn)行分類(lèi)。解:用SPSS進(jìn)行主成分分析的具體方法參見(jiàn)6.8,分析結(jié)果如下:表6.7特征根和方差貢獻(xiàn)率表表6.8因子載荷陣表6.6特征向量矩陣z1z2x10.290.47x20.280.48x30.14-0.29x40.31-0.37x50.40-0.20x60.40-0.27x70.310.39x80.390.12x90.39-0.24根據(jù)表6.6得主成分的表達(dá)式:分別計(jì)算出以上三項(xiàng)后,利用公式得到綜合得分并排序如下表:地區(qū)y1y2y深圳170038.89254204.05197055.90上海70185.8834213.0258638.59廈門(mén)50894.5369593.9356897.04廣州55849.2132174.5848249.65杭州42167.7129244.9838019.51寧波40552.8528367.3436641.30北京45747.3811555.7334771.86南寧45747.3811555.7334771.86天津39597.9021080.5233653.82海口39597.9021080.5233653.82南京36680.7525804.6533189.52青島35237.2714552.4628597.44大連31830.5617629.5327272.03濟(jì)南25149.7316499.3922372.97福州22734.1616326.9720677.45烏魯木齊22284.5415284.6820037.59沈陽(yáng)23184.9912310.2219694.19武漢23909.279770.5619370.75長(zhǎng)春21524.9514179.2119166.96成都33808.79-17638.7317294.14太原19445.429809.9916352.45鄭州18561.819822.9015756.62蘭州16568.9713769.8015670.44???7666.7011325.7715631.26昆明18494.348579.7215311.75呼和浩特16128.6013359.1015239.59長(zhǎng)沙18845.236252.5414802.98石家莊18229.337399.6214752.99西安16764.154871.9712946.76南昌14598.409288.2012893.83哈爾濱15782.076297.2012737.43合肥14319.858659.4112502.85銀川12865.9710960.0812254.18貴陽(yáng)15339.904138.4811744.24重慶27859.53-22407.6611723.76西寧10450.626144.519068.36南寧11526.862677.298686.15最后的分類(lèi)可以根據(jù)最終得分Y的值來(lái)劃分,由于沒(méi)有給出具體的分類(lèi)標(biāo)準(zhǔn),具體分類(lèi)結(jié)果根據(jù)各人的主觀意愿可以有多種答案。第七章7.1試述因子分析與主成分分析的聯(lián)系與區(qū)別。答:因子分析與主成分分析的聯(lián)系是:=1\*GB3①兩種分析方法都是一種降維、簡(jiǎn)化數(shù)據(jù)的技術(shù)。=2\*GB3②兩種分析的求解過(guò)程是類(lèi)似的,都是從一個(gè)協(xié)方差陣出發(fā),利用特征值、特征向量求解。因子分析可以說(shuō)是主成分分析的姐妹篇,將主成分分析向前推進(jìn)一步便導(dǎo)致因子分析。因子分析也可以說(shuō)成是主成分分析的逆問(wèn)題。如果說(shuō)主成分分析是將原指標(biāo)綜合、歸納,那么因子分析可以說(shuō)是將原指標(biāo)給予分解、演繹。因子分析與主成分分析的主要區(qū)別是:主成分分析本質(zhì)上是一種線(xiàn)性變換,將原始坐標(biāo)變換到變異程度大的方向上為止,突出數(shù)據(jù)變異的方向,歸納重要信息。而因子分析是從顯在變量去提煉潛在因子的過(guò)程。此外,主成分分析不需要構(gòu)造分析模型而因子分析要構(gòu)造因子模型。7.2因子分析主要可應(yīng)用于哪些方面?答:因子分析是一種通過(guò)顯在變量測(cè)評(píng)潛在變量,通過(guò)具體指標(biāo)測(cè)評(píng)抽象因子的統(tǒng)計(jì)分析方法。目前因子分析在心理學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科中都有重要的應(yīng)用。具體來(lái)說(shuō),=1\*GB3①因子分析可以用于分類(lèi)。如用考試分?jǐn)?shù)將學(xué)生的學(xué)習(xí)狀況予以分類(lèi);用空氣中各種成分的比例對(duì)空氣的優(yōu)劣予以分類(lèi)等等=2\*GB3②因子分析可以用于探索潛在因素。即是探索未能觀察的或不能觀測(cè)的的潛在因素是什么,起的作用如何等。對(duì)我們進(jìn)一步研究與探討指示方向。在社會(huì)調(diào)查分析中十分常用。=3\*GB3③因子分析的另一個(gè)作用是用于時(shí)空分解。如研究幾個(gè)不同地點(diǎn)的不同日期的氣象狀況,就用因子分析將時(shí)間因素引起的變化和空間因素引起的變化分離開(kāi)來(lái)從而判斷各自的影響和變化規(guī)律。7.3簡(jiǎn)述因子模型X=AY+答:對(duì)于因子模型因子載荷陣為與的協(xié)方差為:==若對(duì)作標(biāo)準(zhǔn)化處理,rXi,Fj=,因此一方面表示對(duì)的依賴(lài)程度;另一方面也反映了變量對(duì)公共因子的相對(duì)重要性。變量共同度說(shuō)明變量的方差由兩部分組成:第一部分為共同度,它描述了全部公共因子對(duì)變量的總方差所作的貢獻(xiàn),反映了公共因子對(duì)變量的影響程度。第二部分為特殊因子對(duì)變量的方差的貢獻(xiàn),通常稱(chēng)為個(gè)性方差。而公共因子對(duì)的貢獻(xiàn)表示同一公共因子對(duì)各變量所提供的方差貢獻(xiàn)之總和,它是衡量每一個(gè)公共因子相對(duì)重要性的一個(gè)尺度。7.4在進(jìn)行因子分析時(shí),為什么要進(jìn)行因子旋轉(zhuǎn)?最大方差因子旋轉(zhuǎn)的基本思路是什么?答:因子分析的目標(biāo)之一就是要對(duì)所提取的抽象因子的實(shí)際含義進(jìn)行合理解釋。但有時(shí)直接根據(jù)特征根、特征向量求得的因子載荷陣難以看出公共因子的含義。這種因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很難對(duì)因子的實(shí)際背景進(jìn)行合理的解釋。這時(shí)需要通過(guò)因子旋轉(zhuǎn)的方法,使每個(gè)變量?jī)H在一個(gè)公共因子上有較大的載荷,而在其余的公共因子上的載荷比較小。最大方差旋轉(zhuǎn)法是一種正交旋轉(zhuǎn)的方法,其基本思路為:=1\*GB3①A→A*→其中令的第列元素平方的相對(duì)方差可定義為=2\*GB3②最大方差旋轉(zhuǎn)法就是選擇正交矩陣,使得矩陣所有m個(gè)列元素平方的相對(duì)方差之和達(dá)到最大。7.5試分析因子分析模型與線(xiàn)性回歸模型的區(qū)別與聯(lián)系。答:因子分析模型是一種通過(guò)顯在變量測(cè)評(píng)潛在變量,通過(guò)具體指標(biāo)測(cè)評(píng)抽象因子的統(tǒng)計(jì)分析方法的模型。而線(xiàn)性回歸模型回歸分析的目的是設(shè)法找出變量間的依存(數(shù)量)關(guān)系,用函數(shù)關(guān)系式表達(dá)出來(lái)。因子分析模型中每一個(gè)變量都可以表示成公共因子的線(xiàn)性函數(shù)與特殊因子之和。即,()該模型可用矩陣表示為:而回歸分析模型中多元線(xiàn)性回歸方程模型為:y1=b0+b1x1+b因子模型滿(mǎn)足:(1);(2),即公共因子與特殊因子是不相關(guān)的;(3),即各個(gè)公共因子不相關(guān)且方差為1;(4),即各個(gè)特殊因子不相關(guān),方差不要求相等。而回歸分析模型滿(mǎn)足(1)正態(tài)性:隨機(jī)誤差(即殘差)e服從均值為0,方差為2的正態(tài)分布;(2)等方差:對(duì)于所有的自變量x,殘差e的條件方差為2,且為常數(shù);(3)獨(dú)立性:在給定自變量x的條件下,殘差e的條件期望值為0(本假設(shè)又稱(chēng)零均值假設(shè));(4)無(wú)自相關(guān)性:各隨機(jī)誤差項(xiàng)e互不相關(guān)。兩種模型的聯(lián)系在于都是線(xiàn)性的。因子分析的過(guò)程就是一種線(xiàn)性變換。7.6設(shè)某客觀現(xiàn)象可用X=(X1,X2,X3)’來(lái)描述,在因子分析時(shí),從約相關(guān)陣出發(fā)計(jì)算出特征值為λ1=1.754(1)計(jì)算因子載荷矩陣A,并建立因子模型。(2)計(jì)算共同度hi(3)計(jì)算第一公因子對(duì)X的“貢獻(xiàn)”。解:(1)根據(jù)題意,A=t=0.7070∴建立因子模型為X1X2X3(2)hh2h3(3)因?yàn)槭菑募s相關(guān)陣計(jì)算的特征值,所以公共因子對(duì)X的“貢獻(xiàn)”為g17.7利用因子分析方法分析下列30個(gè)學(xué)生成績(jī)的因子構(gòu)成,并分析各個(gè)學(xué)生較適合學(xué)文科還是理科。序號(hào)數(shù)學(xué)物理化學(xué)語(yǔ)文歷史英語(yǔ)16561728481792777776647055367634965675748069757474635747080848174678847562716476671675265578777157728671983100794167501086949751635511748088647366126784535866561381626956665214716494526152157896818089761669566775948017779080686660188467756070631962678371857720746575729073219174976271662272877279837623827083687785246370609185822574799559745926666177627364279082984771602877908568737629918284546260307884100516060解:令數(shù)學(xué)成績(jī)?yōu)閄1,物理為X2,化學(xué)為X3,語(yǔ)文為X4,歷史為X5,英語(yǔ)為X1,用spss分析學(xué)生成績(jī)的因子構(gòu)成的步驟如下:1.在SPSS窗口中選擇Analyze→DataReduction→Factor,調(diào)出因子分析主界面,并將六個(gè)變量移入Variables框中。圖7.1因子分析主界面2.點(diǎn)擊Descriptives按鈕,展開(kāi)相應(yīng)對(duì)話(huà)框,見(jiàn)圖7.2。選擇Initialsolution復(fù)選項(xiàng)。這個(gè)選項(xiàng)給出各因子的特征值、各因子特征值占總方差的百分比以及累計(jì)百分比。單擊Continue按鈕,返回主界面。圖7.2Descriptives子對(duì)話(huà)框3.點(diǎn)擊Extraction按鈕,設(shè)置因子提取的選項(xiàng),見(jiàn)圖7.3。在Method下拉列表中選擇因子提取的方法,SPSS提供了七種提取方法可供選擇,一般選擇默認(rèn)選項(xiàng),即“主成分法”。在Analyze欄中指定用于提取因子的分析矩陣,分別為相關(guān)矩陣和協(xié)方差矩陣。在Display欄中指定與因子提取有關(guān)的輸出項(xiàng),如未旋轉(zhuǎn)的因子載荷陣和因子的碎石圖。在Extract欄中指定因子提取的數(shù)目,有兩種設(shè)置方法:一種是在Eigenvaluesover后的框中設(shè)置提取的因子對(duì)應(yīng)的特征值的范圍,系統(tǒng)默認(rèn)值為1,即要求提取那些特征值大于1的因子;第二種設(shè)置方法是直接在Numberoffactors后的矩形框中輸入要求提取的公因子的數(shù)目。這里我

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論