應(yīng)用多元統(tǒng)計(jì)分析課后答案_第1頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析課后答案_第2頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析課后答案_第3頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、應(yīng)用多元統(tǒng)計(jì)分析課后答案第五章聚類(lèi)分析5.1判別分析和聚類(lèi)分析有何區(qū)別?答:即根據(jù)一定的判別準(zhǔn)則,判定一個(gè)樣本歸屬于哪一類(lèi)。具體而言,設(shè)有n個(gè)樣本,對(duì)每個(gè)樣本測(cè)得p項(xiàng)指標(biāo)(變量)的數(shù)據(jù),已知每個(gè)樣本屬于k個(gè)類(lèi)別(或總體)中的某一類(lèi),通過(guò)找出一個(gè)最優(yōu)的劃分,使得不同類(lèi)別的樣本盡可能地區(qū)別開(kāi),并判別該樣本屬于哪個(gè)總體。聚類(lèi)分析是分析如何對(duì)樣品(或變量)進(jìn)行量化分類(lèi)的問(wèn)題。在聚類(lèi)之前,我們并不知 道總體,而是通過(guò)一次次的聚類(lèi),使相近的樣品(或變量)聚合形成總體。通俗來(lái)講,判別 分析是在已知有多少類(lèi)及是什么類(lèi)的情況下進(jìn)行分類(lèi),而聚類(lèi)分析是在不知道類(lèi)的情況下進(jìn)行分類(lèi)。5.2試述系統(tǒng)聚類(lèi)的基本思想。答:系

2、統(tǒng)聚類(lèi)的基本思想是:距離相近的樣品(或變量)先聚成類(lèi),距離相遠(yuǎn)的后聚成類(lèi), 過(guò)程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類(lèi)中。5.3對(duì)樣品和變量進(jìn)行聚類(lèi)分析時(shí),所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡(jiǎn)要說(shuō)明為什么這樣構(gòu)造?答:對(duì)樣品進(jìn)行聚類(lèi)分析時(shí),用距離來(lái)測(cè)定樣品之間的相似程度。因?yàn)槲覀儼裯個(gè)樣本看作p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為prq(一)閔可夫斯基距離:dj(q) ( Z Xjk| 廠k 1q取不同值,分為(1)絕對(duì)距離(q 1)pdj(1)Xik Xjkk 1(2)歐氏距離(q 2)Xjk1/2pdj (2)( X,k 1(3)切比雪夫距離(q )dj )m

3、a)p Xik Xjk(二)馬氏距離dj(L)1 p XikX jkp k 1 XikX jk(三)蘭氏距離2 1dij (M ) (Xi Xj) E (Xi Xj)對(duì)變量的相似性,我們更多地要了解變量的變化趨勢(shì)或變化方向,因此用相關(guān)性進(jìn)行衡量。將變量看作p維空間的向量,一般用(一)夾角余弦COS ijpXikXjkk 1ppX;)(Xj:)1(二)相關(guān)系數(shù)rij(Xik Xi)(Xjk Xj)k 1(Xikp 2 2Xi) (Xjk Xj)k 15.4在進(jìn)行系統(tǒng)聚類(lèi)時(shí),不同類(lèi)間距離計(jì)算方法有何區(qū)別?選擇距離公式應(yīng)遵循哪些原 則?答:設(shè)dj表示樣品Xi與Xj之間距離,用Dj表示類(lèi)G與Gj之間的

4、距離。(1).最短距離法DjXimXjGjdjDkrXi min Gdij min Dkp,Dkqmax diiXi Gp,Xj Gq J(2)最長(zhǎng)距離法DpqDkr X max G dij maxDkp,DkqXi Gk,Xj Gr(3)中間距離法2DkrjDkp2D pq1*1 國(guó) u其中(4)重心法DPq(XpXq)(XpXq)- 1 - -Xr (n pXp nqXq) nrDkr21D2kqnrnpnqp-nrDpq(5)類(lèi)平均法2Dpqdij(6)n pHq XiGpXjGjdipnm Xi Gk XjGr可變類(lèi)平均法DPr(1)垮 Dinq2-Dkq) nr2Dpq其中是可變的且

5、<1(7)可變法DkrDppDjq)其中是可變的且<1(8)離差平方和法St(Xitt 1Xt)(Xit Xt)D2nknpd2nknqd2 nk d2DkrDkpDkqDpqnrnknrrvn氐通常選擇距離公式應(yīng)注意遵循以下的基本原則:(1)要考慮所選擇的距離公式在實(shí)際應(yīng)用中有明確的意義。如歐氏距離就有非常明確的空 間距離概念。馬氏距離有消除量綱影響的作用。(2 )要綜合考慮對(duì)樣本觀測(cè)數(shù)據(jù)的預(yù)處理和將要采用的聚類(lèi)分析方法。如在進(jìn)行聚類(lèi)分析 之前已經(jīng)對(duì)變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。(3)要考慮研究對(duì)象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)比較復(fù)雜且?guī)в幸欢ㄖ?/p>

6、觀性的問(wèn)題, 我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)不同做出具體分折。實(shí)際中,聚類(lèi)分析前不妨試探性地多選擇幾個(gè)距離公式分別進(jìn)行聚類(lèi),然后對(duì)聚類(lèi)分析的結(jié)果進(jìn)行對(duì)比分析, 以 確定最合適的距離測(cè)度方法。5.5試述K均值法與系統(tǒng)聚類(lèi)法的異同。答:相同:K均值法和系統(tǒng)聚類(lèi)法一樣,都是以距離的遠(yuǎn)近親疏為標(biāo)準(zhǔn)進(jìn)行聚類(lèi)的。不同:系統(tǒng)聚類(lèi)對(duì)不同的類(lèi)數(shù)產(chǎn)生一系列的聚類(lèi)結(jié)果,而K 均值法只能產(chǎn)生指定類(lèi)數(shù)的聚類(lèi)結(jié)果。具體類(lèi)數(shù)的確定,離不開(kāi)實(shí)踐經(jīng)驗(yàn)的積累; 有時(shí)也可以借助系統(tǒng)聚類(lèi)法以一部分樣品為 對(duì)象進(jìn)行聚類(lèi),其結(jié)果作為K均值法確定類(lèi)數(shù)的參考。5.6試述K均值法與系統(tǒng)聚類(lèi)有何區(qū)別?試述有序聚類(lèi)法的基本思想。系統(tǒng)聚類(lèi)對(duì)不同 具體類(lèi)數(shù)

7、的確 K均值法確定答:K均值法的基本思想是將每一個(gè)樣品分配給最近中心(均值)的類(lèi)中。的類(lèi)數(shù)產(chǎn)生一系列的聚類(lèi)結(jié)果,而K均值法只能產(chǎn)生指定類(lèi)數(shù)的聚類(lèi)結(jié)果。X ,X(2) , X(n)表示定,有時(shí)也可以借助系統(tǒng)聚類(lèi)法以一部分樣品為對(duì)象進(jìn)行聚類(lèi),其結(jié)果作為 類(lèi)數(shù)的參考。有序聚類(lèi)就是解決樣品的次序不能變動(dòng)時(shí)的聚類(lèi)分析問(wèn)題。如果用n個(gè)有序的樣品,則每一類(lèi)必須是這樣的形式,即X(i),X(i 1), ,X(j),其中1 i n,且j n,簡(jiǎn)記為|Gi i,i 1, , j。在同一類(lèi)中的樣品是次序相鄰的。一般的步驟是(1)計(jì)算直徑D (i,j) 。(2)計(jì)算最小分類(lèi)損失函數(shù)Lp(l,k)。(3)確定分類(lèi)個(gè)數(shù)

8、ko(4)最優(yōu) 分類(lèi)。5.7檢測(cè)某類(lèi)產(chǎn)品的重量,抽了六個(gè)樣品,每個(gè)樣品只測(cè)了一個(gè)指標(biāo),分別為 1 , 2, 3,6, 9, 11 試用最短距離法,重心法進(jìn)行聚類(lèi)分析。(1 )用最短距離法進(jìn)行聚類(lèi)分析。采用絕對(duì)值距離,計(jì)算樣品間距離陣L . $ E 爲(wèi) qG占Q卜0'10-210-5430":87630"-1098520G7 G4od30630g68520-1-1中最小元素是朗=2于是將丄,聚為一類(lèi),記為由上表易知-h. I中最小元素是計(jì)算距離陣''y.y于是將九,丄,"聚為一類(lèi),記為計(jì)算樣本距離陣g4gb030630中最小元素是于是將

9、9;1-,聚為一類(lèi),記為 +因此,(2 )用重心法進(jìn)行聚類(lèi)分析計(jì)算樣品間平方距離陣Y.Y0"1 1 04102516906449369010081642540易知中最小元素是于是將羽,刃聚為一類(lèi),記為3!計(jì)算距離陣注:計(jì)算方法,其他以此類(lèi)推。丫中最小元素是Sffl=4于是將曙,詞聚為一類(lèi),記為3計(jì)算樣本距離陣''G4.64160'U中最小元素是于是將®,聚為一類(lèi),記為冬因此,5.8下表是15個(gè)上市公司2001年的一些主要財(cái)務(wù)指標(biāo),使用系統(tǒng)聚類(lèi)法和K 均值法分別對(duì)這些公司進(jìn)行聚類(lèi),并對(duì)結(jié)果進(jìn)行比較分析。公司凈資產(chǎn)每股凈總資產(chǎn)資產(chǎn)負(fù)流動(dòng)負(fù)每股凈凈利潤(rùn)總資

10、產(chǎn)編號(hào)收益率利潤(rùn)周轉(zhuǎn)率債率債比率資產(chǎn)增長(zhǎng)率增長(zhǎng)率111.090.210.0596.9870.531.86-44.0481.99211.960.590.7451.7890.734.957.0216.11300.030.03181.99100-2.98103.3321.18411.580.130.1746.0792.181.146.55-56.325-6.19-0.090.0343.382.241.52-1713.5-3.366100.470.4868.4864.7-11.560.85710.490.110.3582.9899.871.02100.2330.32811.12-1.690.12132

11、.14100-0.66-4454.39-62.7593.410.040.267.8698.511.25-11.25-11.43101.160.010.5443.71001.03-87.18-7.411130.220.160.487.3694.880.53729.41-9.97128.190.220.3830.311002.73-12.31-2.771395.79-5.20.5252.3499.34-5.42-9816.52-46.821416.550.350.9372.3184.052.14115.95123.4115-24.18-1.160.7956.2697.84.81-533.89-27

12、.74解:令凈資產(chǎn)收益率為 X1,每股凈利潤(rùn)X2,總資產(chǎn)周轉(zhuǎn)率為 X3,資產(chǎn)負(fù)債率為X4,流動(dòng)負(fù) 債比率為X5,每股凈資產(chǎn)為X6,凈利潤(rùn)增長(zhǎng)率為 X7,總資產(chǎn)增長(zhǎng)率為 X8,用spss對(duì)公司 聚類(lèi)分析的步驟如下:a)系統(tǒng)聚類(lèi)法:1. 在 SPSS窗 口 中選擇 AnalyzbClassify Hierachical Cluster 調(diào)出系統(tǒng)聚類(lèi)分析主界面,并將變量|X1 -X81移入Variables框中。在Cluster欄中選擇Cases單選按鈕,即對(duì)樣品進(jìn)行聚類(lèi)(若選擇Variables則對(duì)變量進(jìn)行聚類(lèi)) 在Display欄中選擇Statistics和Plots復(fù)選框,這樣在結(jié)果輸出窗口中

13、可 以同時(shí)得到聚類(lèi)結(jié)果統(tǒng)計(jì)量和統(tǒng)計(jì)圖圖5.1系統(tǒng)分析法主界面2. 點(diǎn)擊Statistics按鈕,設(shè)置在結(jié)果輸出窗口中給出的聚類(lèi)分析統(tǒng)計(jì)量。我 們選擇 Agglomeration schedul與 Cluster Membership中的 Range of solution 2-4,如圖5.2所示,點(diǎn)擊Continue按鈕,返回主界面。(其中,Agglomeration schedul表示在結(jié)果中給出聚類(lèi)過(guò)程表,顯示系 統(tǒng)聚類(lèi)的詳細(xì)步驟;Proximity matrix表示輸出各個(gè)體之間的距離矩陣; Cluster Membership表示在結(jié)果中輸出一個(gè)表,表中顯示每個(gè)個(gè)體被分配 到的類(lèi)別,R

14、ange of solution 2-4即將所有個(gè)體分為2至4類(lèi)。)3. 點(diǎn)擊Plots按鈕,設(shè)置結(jié)果輸出窗口中給出的聚類(lèi)分析統(tǒng)計(jì)圖。選中Dendrogram復(fù)選框和Icicle欄中的None單選按鈕,如圖5.3,即只給出 聚類(lèi)樹(shù)形圖,而不給出冰柱圖。單擊Co ntinue按鈕,返回主界面。圖5.2Statistics子對(duì)話(huà)框p QenrinFWiyC華曲®r«f * M MT沖dhmUkxnCoffr&ie'ZartriHfct*圖5.3 Plots子對(duì)話(huà)框4. 點(diǎn)擊Method按鈕,設(shè)置系統(tǒng)聚類(lèi)的方法選項(xiàng)。Cluster Method下拉列表用于指定聚類(lèi)

15、的方法,這里選擇 Between-groupinkage (組間平均數(shù)連接 距離);Measure欄用于選擇對(duì)距離和相似性的測(cè)度方法,選擇SquaredContinue按鈕,返回主界面Euclidean dista nc(歐氏距離);單擊圖5.4Method子對(duì)話(huà)框團(tuán) Hir-ardilcal Cluslsr Analy&ifj Sj. IflHHrOustar MstiibarsliiF*1O呵&Vrdst» ut eriMuiiHr 01 t urtwi:憶島n護(hù) 口十直O(jiān)iLflicm*MmrnLm imrer o1 Dieters: 戈M&irnju

16、miTfiFr 口ir elmslers- 斗Cchtinub I CancBtI 佰心圖5.5 Save子對(duì)話(huà)框5. 點(diǎn)擊Save按鈕,指定保存在數(shù)據(jù)文件中的用于表明聚類(lèi)結(jié)果的新變量。None表示不保存任何新變量;Sin gle solution表示生成一個(gè)分類(lèi)變量,在 其后的矩形框中輸入要分成的類(lèi)數(shù);Range of solutio ns表示生成多個(gè)分類(lèi) 變量。這里我們選擇Range of solution§并在后面的兩個(gè)矩形框中分別輸 入2和4,即生成三個(gè)新的分類(lèi)變量,分別表明將樣品分為 2類(lèi)、3類(lèi)和4類(lèi)時(shí)的聚類(lèi)結(jié)果,如圖5.5。點(diǎn)擊Continue,返回主界面6. 點(diǎn)擊0K按

17、鈕,運(yùn)行系統(tǒng)聚類(lèi)過(guò)程聚類(lèi)結(jié)果分析:下面的群集成員表給出了把公司分為2類(lèi),3類(lèi),4類(lèi)時(shí)各個(gè)樣本所屬類(lèi)別的情況,另外,從右邊的樹(shù)形圖也可以直觀地看到,若將15個(gè)公司分為2類(lèi),則13獨(dú)自為一類(lèi),其余的為一類(lèi);若分為3類(lèi),則公司8分離出來(lái),自成一類(lèi)。以此類(lèi)推。»|3KS111112i113I11411151111T11J111D3J1g11110f11liil1112111134321411115111表5.1各樣品所屬類(lèi)別表Sistazice:Coc±iioe Si B E 05101520£5圖5.6聚類(lèi)樹(shù)形圖b) K均值法的步驟如下:1. 在 SPSS窗口 中選擇

18、AnalyzeClassify K-Means Cluster,調(diào)出 K 均值聚 類(lèi)分析主界面,并將變量 X1-X8移入Variables框中。在Method框中選 擇Iterate classify即使用K-means算法不斷計(jì)算新的類(lèi)中心,并替換舊 的類(lèi)中心(若選擇Classifyonly,則根據(jù)初始類(lèi)中心進(jìn)行聚類(lèi),在聚類(lèi)過(guò) 程中不改變類(lèi)中心)。在 Number of Cluster后面的矩形框中輸入想要把 樣品聚成的類(lèi)數(shù),這里我們輸入 3,即將15個(gè)公司分為3類(lèi)。(Ce nters按鈕,貝U用于設(shè)置迭代的初始類(lèi)中心。如果不手工設(shè)置,則系 統(tǒng)會(huì)自動(dòng)設(shè)置初始類(lèi)中心,這里我們不作設(shè)置。)1二口

19、 flllvIW圖5.7 K均值聚類(lèi)分析主界面I2. 點(diǎn)擊Iterate按鈕,對(duì)迭代參數(shù)進(jìn)行設(shè)置。Maximum Iterations參數(shù)框用于框用于設(shè)定算法的收斂判據(jù),輸入0,只要在迭代的過(guò)程中先滿(mǎn)足了其中的參數(shù),則迭代過(guò)程就停止。單擊Continue,返回主界面。設(shè)定K-means算法迭代的最大次數(shù),輸入 10, Convergenee Criterion參數(shù)CT <-M&ans cluster Anal/sie IterateM&xhuum Heiations:i gyise running meensContinueCancelHslp圖5.8 Iterate子對(duì)

20、話(huà)框3. 點(diǎn)擊Save按鈕,設(shè)置保存在數(shù)據(jù)文件中的表明聚類(lèi)結(jié)果的新變量。我們 將兩個(gè)復(fù)選框都選中,其中Cluster membership選項(xiàng)用于建立一個(gè)代表聚 類(lèi)結(jié)果的變量,默認(rèn)變量名為 qcl_1; Distanee from cluster center選項(xiàng)建 立一個(gè)新變量,代表各觀測(cè)量與其所屬類(lèi)中心的歐氏距離。單擊Continue按鈕返回K-Meanw flusten Save Nev; Var.0 Quster memberwhipl巫 Distance from cluster centerCortinue I CancelHelp圖5.9 Save子對(duì)話(huà)框4. 點(diǎn)擊Options

21、按鈕,指定要計(jì)算的統(tǒng)計(jì)量。選中 Initial cluster centers和Cluster in formation for each cas復(fù)選框。這樣,在輸出窗口中將給出聚類(lèi)的初始類(lèi)中心和每個(gè)公司的分類(lèi)信息,包括分配到哪一類(lèi)和該公司距所屬類(lèi)中心的距離。單擊 Continue返回圖5.10 Options子對(duì)話(huà)框5. 點(diǎn)擊OK按鈕,運(yùn)行K均值聚類(lèi)分析程序。聚類(lèi)結(jié)果分析:1398.15323112.95933235.34643132.42653160S.9586393.39973205.511g1J0C9395.9231)336.967113B 34.13412?101.32131.000

22、14324630215433.1 T8銀類(lèi)應(yīng)員以下三表給出了各公司所屬的類(lèi)及其與所屬類(lèi)中心的距 離,聚類(lèi)形成的類(lèi)的中心的各變量值以及各類(lèi)的公司數(shù)。由以上表格可得公司 13與公司8各自成一類(lèi),其余的公司 為一類(lèi)。通過(guò)比較可知,兩種聚類(lèi)方法得到的聚類(lèi)結(jié)果完全一致。每個(gè)聚類(lèi)中的案洌埶果類(lèi)11.00021.000313.000有效15.00000012y1957911126.49X2-5.201.69.03X3.50.12.鶉X425234132.1471.4&99 34100.0092 08x5-542.麵1 90X7-901G.52-4454 39-103.94x&-4BB252

23、7511.915.9下表是某年我國(guó)16個(gè)地區(qū)農(nóng)民支出情況的抽樣調(diào)查數(shù)據(jù),每個(gè)地區(qū)調(diào)查了反映每人平均生活消費(fèi)支出情況的六個(gè)經(jīng)濟(jì)指標(biāo)。試通過(guò)統(tǒng)計(jì)分析軟件用不同的方法進(jìn)行系統(tǒng)聚類(lèi)分析, 并比較何種方法與人們觀察到的實(shí)際情況較接近。地區(qū)食品衣著燃料住房交通和 通訊娛樂(lè)教 育文化北京190.3343.779.7360.5449.019.04天津135.236.410.4744.1636.493.94河北95.2122.839.322.4422.812.8山西104.7825.116.49.8918.173.25內(nèi)蒙128.4127.638.9412.5823.992.27遼寧145.6832.8317.

24、7927.2939.093.47吉林159.3733.3818.3711.8125.295.22黑龍江116.2229.5713.2413.7621.756.04上海221.1138.6412.53115.6550.825.89江蘇144.9829.1211.6742.627.35.74浙江169.9232.7512.7247.1234.355安徽135.1123.0915.6223.5418.186.39福建144.9221.2616.9619.5221.756.73江西140.5421.517.6419.1915.974.94山東115.8430.2612.233.633.773.85河南

25、101.1823.268.4620.220.54.3解:令食品支出為X1,衣著支出為X2,燃料支出為X3,住房支出為X4,交通和通訊支出為 X5,娛樂(lè)教育文化支出為 X6,用spss對(duì)16各地區(qū)聚類(lèi)分析的步驟如 5.8題,不同的方法在 第4個(gè)步驟的Method子對(duì)話(huà)框中選擇不同的 Cluster method。1. Betwee n-group in kag(組間平均數(shù)連接距離)甑彌員上表給出了把全國(guó)16個(gè)地區(qū)分為2類(lèi)、3類(lèi)和4類(lèi)時(shí),各地區(qū)所屬的類(lèi)別,另外從右邊的 樹(shù)形圖也可以直觀地觀察到,若用組間平均數(shù)連接距離將這些地區(qū)分為3類(lèi),則9 (上海)獨(dú)自為一類(lèi),1 (北京)和11 (浙江)為一類(lèi),

26、剩余地區(qū)為一類(lèi)。2. Withi n-group lin kage (組內(nèi)平均連接距離)2或3耗英1122219214321呂J21J31F?21冃321g432if?2i1122111Ji113221U2X1321lii*Jr3類(lèi),則9 (上海)獨(dú)自為一類(lèi),1 (北京)獨(dú)自若用組內(nèi)平均數(shù)連接距離將這些地區(qū)分為 為一類(lèi),剩余地區(qū)為一類(lèi)。3. Nearest n eighbor( 最短距離法)4 t=fS=11112!*1322142152X1221721182219332TO21111I211222113221U212比1221若用最短距離法將這些地區(qū)分為 剩余地區(qū)為一類(lèi)。3類(lèi),則9 (上海)

27、獨(dú)自為一類(lèi),1 (北京)獨(dú)自為一類(lèi),4. Furthest neighbor (最遠(yuǎn)距離法)5153類(lèi),則9 (上海)獨(dú)自為一類(lèi),1 (北京)和11 (浙江)為一類(lèi),剩余地區(qū)為一類(lèi)。5. Cen troid cluster (重心法)&竹篥3KS?CSE111Z卞213321+3215空21$22177213221g41210>211111112721-331142212211611CASED510IS20Lsbc 1 Nuiri +1二三*若用重心法將這些地區(qū)分為3類(lèi),則9 (上海)獨(dú)自為一類(lèi),1 (北京)和11 (浙江)為一類(lèi),剩余地區(qū)為一類(lèi)6. Media n cluste

28、r (中位數(shù)距離)為一類(lèi),剩余地區(qū)為一類(lèi)。7. Ward method (離差平方和)111122223332A5325352GZJ272229332a411102221111112?7213i221427j1532IB-2CASE05153D-+li -+若用離差平方和法將這些地區(qū)分為3類(lèi),貝U 9 (上海),1 (北京)和11 (浙江)為一類(lèi),2(天津)、6 (遼寧)、7 (吉林)、10 (江蘇)、12 (安徽)、13 (福建)和14 (江西)為一類(lèi), 剩余地區(qū)為一類(lèi)。5.10根據(jù)上題數(shù)據(jù)通過(guò) SPSS統(tǒng)計(jì)分析軟件進(jìn)行快速聚類(lèi)運(yùn)算,并與系統(tǒng)聚類(lèi)分析結(jié)果進(jìn)行 比較。解:快速聚類(lèi)運(yùn)算即 K均值

29、法聚類(lèi),具體步驟同5.8,聚類(lèi)結(jié)果如下:陽(yáng)畜11407512122Q203322.4804316.S645313.8806115.2557126 265837.513g2.00010114 59811117.93612319.50113125.91214325.20015319.2011b310.483聚塑威員327913.36 戲15 33 33221.1130.6412.531156550. a 21171625州J 1.-10r9 JO?1 89毎個(gè)凱冀審IB紳駅耒奏 17.00021 £003專(zhuān)熬16000ife失CiOD聚類(lèi)的結(jié)果為9 (上海)獨(dú)自為一類(lèi),1 (北京)、2

30、(天津)、6 (遼寧)、7 (吉林)、10 (江 蘇)、11 (浙江)、13 (福建)和14 (江西)為一類(lèi),剩余地區(qū)為一類(lèi)。5.11下表是2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo):人均GDPx (元)、人均工業(yè)產(chǎn)值x2 (元)、客運(yùn)總量x3 (萬(wàn)人)、貨運(yùn)總量X4 (萬(wàn)噸)、地方財(cái)政預(yù)算內(nèi)收入 x5 (億元)、固定資產(chǎn)投資總額 x6 (億元)、在崗職工占總?cè)丝诘谋壤齲7 (%)、在崗職工人均工資額x8 (元)、城鄉(xiāng)居民年底儲(chǔ)蓄余額 x9 (億元)。試通過(guò)統(tǒng)計(jì)分析軟件進(jìn)行系統(tǒng)聚類(lèi)析,并比較何種方法與人們觀察到的實(shí)際情況較接近。城市X1X2XXX5X6XXX9北京318863316830

31、52030671593200037.8253126441天津264334373235073467920593418.8186481825石家莊15134131591184310008494169.5123061044太原15752158312975152483319722.812679660呼和浩特1899111257350841552118213.514116255沈陽(yáng)23268154466612146368155714.8149611423大連2914527615110012108111140714.7175601310長(zhǎng)春18630210456999108924629412.513870

32、831哈爾濱148257561645895187642317.7124511154上海4658677083721263861899227421.0273056055南京2754743853167901480513679415.4221901134杭州3266749823213491681515071711.8246671466寧波3254347904249381379713955510.9236911060合肥106211171460344641362458.313901359福州2228121310968082506737611.815053876廈門(mén)5359093126444130557023838.619024397南昌142219205572844543121011.013913483濟(jì)南23437226345810143547642913.516027758青島2470535506146663055312054814.515335908鄭州16674140231070978476637312.7135381048武漢212781708311882166108062317.4137301286長(zhǎng)沙15446887310609106316043410.016987705廣州48220554042975128859275108925.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論