主成分分析與聚類分析和判別分析_第1頁
主成分分析與聚類分析和判別分析_第2頁
主成分分析與聚類分析和判別分析_第3頁
主成分分析與聚類分析和判別分析_第4頁
主成分分析與聚類分析和判別分析_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、實(shí)驗(yàn)三主成分分析、聚類分析和判別分析學(xué)院:地理科學(xué)學(xué)院專業(yè):自然地理學(xué)姓名:郭國(guó)洋實(shí)驗(yàn)內(nèi)容(1)中國(guó)31個(gè)省份、直轄市、自治區(qū)(不包括港澳臺(tái))經(jīng)濟(jì)狀況的7項(xiàng)指標(biāo)。(2)用主成分分析剖析出影響中國(guó)大陸經(jīng)濟(jì)狀況的主要指標(biāo),并對(duì)中國(guó)大陸的經(jīng)濟(jì)綜 合實(shí)力進(jìn)行排序。(3)用主成分剖析出的指標(biāo),用聚類分析對(duì)中國(guó)大陸的經(jīng)濟(jì)狀況進(jìn)行評(píng)價(jià),并對(duì)每類 的經(jīng)濟(jì)綜合狀況進(jìn)行評(píng)價(jià)。(4)結(jié)合本題,談?wù)劸垲惙治龊椭鞒煞址治鰞煞N方法如何結(jié)合使用來分析問題。實(shí)驗(yàn)?zāi)康?1)鞏固主成分和聚類分析的基本原理和方法步驟以及在實(shí)際分析中的意義。(2)用SPS歌件完成地理的主成分分析和聚類分析。第一部分主成分分析1實(shí)驗(yàn)數(shù)據(jù)查閱2012年

2、中國(guó)統(tǒng)計(jì)年鑒,數(shù)據(jù)表示2011年的指標(biāo)。得到中國(guó) 31個(gè)省份、直轄市、自治區(qū)(不含港澳臺(tái))的7項(xiàng)經(jīng)濟(jì)統(tǒng)計(jì)指標(biāo)數(shù)據(jù), 包括:總?cè)丝?10人4人,城鎮(zhèn)人口比例/%, 第一產(chǎn)業(yè)總產(chǎn)值/10人8元,工業(yè)生產(chǎn)總值/10人8元,公共財(cái)政預(yù)算收入/10人8元,城鄉(xiāng)居民儲(chǔ) 蓄余額/10人8元,城鎮(zhèn)單位就業(yè)人員工資總額 /10人8元。樣本容量:31 ,變量:7,如圖1。ra I FW T) .ww IftMi ET-Oj 岬丫瑋凹L-期0圖翦晅生迎U J.峭WB麻恒Lt it里!產(chǎn)1。十j噌.蚪n ice JE_梟葉氐組城孑1.3牛營(yíng),片fll= 土!LL ;eW;L學(xué)UBE工黑電1元1h京gcgoa139 Z

3、TO3MSTMd?3CM2B1*12& 137W5W9fle2COZ天親囿EEi啊moM - H44TC-。代目136123 orrw1W1!TON二二7240 51 DO45 0000皿5 nDO1117TOMftD1737 771T24 33W013?S SfilBDAUj3通加郵49MX3l641 420UIM41M5&4SXK)lifts白綣力5內(nèi)i也MSI TIM*喻g7 例 OWC倍溥第g蠅法遼7(5硒褥ms宜& T 35BO7吉*2749410053 40001277 44iXi4917 954DB50 W5835 JI5*3R國(guó)芷江3634 OJOO56.50001701 51

4、XS6O215(町WT551佟轉(zhuǎn)SCOg_t.3桶緊R各劌血師耕甘髓ita(fc45M3優(yōu) 522id由制股MTW FS般?aoBB制修曾111*工Mn#哂0914W nw的皎植MW 1404A心吉*6迪比1附i15 JiOO7D6J1出541雙n3720 m3se 1歐112 3400拒M DMtD1501 512270 2配箋uu事U貼*刪出皿!1 *J1 CMMil HbuD13*3J12ibhSXJ1iJSi15ill5C WM篝打黑5112 6酬221川野*0l*5TO常雨0璇用股構(gòu)和8149 32WE 7S1叼427E2TW17唱-r5TS7 5KJDOgt oa2509 3CO&

5、653HQ4DD15agi11?91 WMO2OS3 97290 M二 w2實(shí)驗(yàn)步驟及分析(1)點(diǎn)擊“分析”一“降維”一“因子分析”,將上述的7個(gè)指標(biāo)選擇為變量。SPSS中的“主成分分析”嵌入到“因子分析”中,因此在操作的過程中我們要先進(jìn)行因子分析。如2。圖2選擇因子分析變量(2)依次點(diǎn)擊“因子分析”框中的“描述”、“抽取”、“旋轉(zhuǎn)”、“得分”、“選項(xiàng)”,勾選相應(yīng)的選項(xiàng),如圖3、4、5、6、7所示圖3抽取圖4旋轉(zhuǎn)十L K開產(chǎn):虧波所計(jì)-統(tǒng)計(jì)量1門單否量描述囹6M原始日析鉆果Q)-相螭11案散(9匚逆觸國(guó))且箸性水平但) 口再生出)行列式直)口反聽ft -d Kf .l J U 叫即時(shí)遮四出.3

6、總因子分析;因子得分卜屋猿喜歷至基nil Im maiiiBmi (wiiiii:i !(一方法回歸遲) Bartlett(B) Anderson-RubinfA)顯示因子得分系數(shù)矩陣。)J圖4描述統(tǒng)計(jì)圖5因子得分圖6選項(xiàng)圖7旋轉(zhuǎn)(3)點(diǎn)擊“確定”,得到相應(yīng)的結(jié)果并分析。KMOfU Bartlett 的哪賺取樣足夠度的Kals er-Meyer-Olkin度量量7B7Bwrtl明的球形度檢臉近似卡方321 ,995df21Sig.,000圖8 KMO和Bartlett檢驗(yàn)分析:圖8中,在進(jìn)行因子分析之前,需要檢驗(yàn)變量之間是否具備進(jìn)行分析的條件。由圖中可知KMO直為0.7870.5 ,說明數(shù)據(jù)變

7、量之間具有結(jié)構(gòu)效度,Sig0.05 ,說明可以進(jìn)行因子分析。公因子方差初始提取總?cè)丝?。人4人1.000一 969城鎮(zhèn)人口比重)男-1,000.898第一產(chǎn)業(yè)總產(chǎn)使J1 0吃元1.000.023工業(yè)生產(chǎn)總值門口陰元1.00D.935公共財(cái)政預(yù)算收入元1 000.952城鄉(xiāng)居民年底儲(chǔ)番余額 1口幾口元1.000.556城植單位就業(yè)人員工費(fèi)總 甑門口空元1.000.925提取方法=主成份分析工圖9公因子方差分析:圖9是指全部公共因子對(duì)于變量的總方差做所的貢獻(xiàn),說明了全部公共因子反映出的原變量的信息的百分比。例如:“總?cè)丝凇钡墓餐仁?0.969 ,即提取的公因子對(duì)原變量的方差作出了96.9%的貢獻(xiàn)

8、。圖9中我們知道提取公因子之后各個(gè)變量的數(shù)值都比較大,說明在變量空間轉(zhuǎn)化為因子空間是,保存了比較多的信息,因此,因子分析的效果是顯著的。麟聯(lián)的總方將成份叨始將征值提取平方和我工在轉(zhuǎn)平方和領(lǐng)入合計(jì)方差的馳祟怛%的上走的國(guó)瑞根先合M方桂的男14.95970,3307D,33670,33570.B3C3.40549.7B64978。21.59E22,93193,6671.59S2283133.3673.07243JB2916573.2173.10096,7884,1321.83198,6405041,68499,232E133Q,725.J1G,2761 D0.000提取方法:主成份分新“圖10解釋

9、的總方差分析:圖10中可以看到各個(gè)特征值的貢獻(xiàn)率以及累積貢獻(xiàn)率??梢姡诒敬卧囼?yàn)中,前兩個(gè)因子的累積貢獻(xiàn)率已達(dá)到93.667%。圖11碎石圖分析:圖11橫坐標(biāo)為因子數(shù),縱坐標(biāo)為特征值,從圖中可以看出前面兩個(gè)因子的特征值比較大,都大于1,從第三個(gè)因子以后,折線平緩,因此,本次實(shí)驗(yàn)選擇前面2個(gè)因子。的分期酎1成份12-Zn/10iA,esc域鎮(zhèn)人口七空自418r851第一晅717工業(yè)生廣總值,日元555= 150仁具盤數(shù)預(yù)皙理2.I0岬元滕,203博寺蒲昨衣小琴余部 t。吒元969,125幡鎮(zhèn)單位就業(yè)人員工資總 西門匕TE.G053拍灌灰方丈主就伯”鼻巳程中了,個(gè)威伯立成仍,2人.96BJSD城崔

10、人口出市自-.251g14,B61-janeatL總值1爐0元川5,52 a心共財(cái)改便苴舊人10穌工53D.019城鄉(xiāng):5工年息保蓄氽額 ,1獷沅.64373G城找判工就業(yè)人員工賃總XVI陣,156.t - /陽向跑畔繇需2,標(biāo)狗噴正交旋端港, a皮名學(xué)工娃代肩枝ii*圖12因子載荷矩陣分析:圖13旋轉(zhuǎn)成分矩陣在圖12中我們發(fā)現(xiàn)工業(yè)生產(chǎn)總值、公共財(cái)政預(yù)算收入、 城鄉(xiāng)居民年底儲(chǔ)蓄余額、 城鎮(zhèn)單位就業(yè)人員工資總額在第 2個(gè)主因子的載荷值都比較低,不能對(duì)因子作出很好的解釋。本實(shí)驗(yàn)有必要對(duì)因子載荷矩陣實(shí)施旋轉(zhuǎn),得到圖13的結(jié)果。用具有 Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法旋轉(zhuǎn)之后我們發(fā)現(xiàn)第一因子主要由“總?cè)?/p>

11、口、第一產(chǎn)業(yè)總產(chǎn)值、工業(yè)生產(chǎn)總值”決定,第二因子主要由“城鎮(zhèn)人口比重、 公共財(cái)政預(yù)算收入、 儲(chǔ)蓄余額、工資總額”決定。咸的1211 .000.0002“口1 000堤:取月法.主派附* 部遇T懸盤里瞿于標(biāo) 他|隰但行*圖14成份得分協(xié)方差矩陣分析:圖14的結(jié)果告訴我們兩個(gè)因子之間是不相關(guān)的。成份得分柒數(shù)矩陣成份12總?cè)丝?門口氣人,334-J19城覆人口比重,%,.頌,455第一產(chǎn)業(yè)總門直n甲日元,373-.204工業(yè)生產(chǎn)總值匚K元,207.057公共財(cái)政強(qiáng)直收入1 05元,033.249城多居民年底儲(chǔ)蓄余款1 口也元0Q51E9城通單位就業(yè)人員工資總W1獷沅-.002.277提取方法:主咸份

12、*提轉(zhuǎn)法,具有Kai也r標(biāo)隹化的正變旋轉(zhuǎn)法, 構(gòu)成潺分*圖15成份得分系數(shù)矩陣分析:圖15給出了因子得分系數(shù)矩陣,將公共因子表示成原始變量的線性組合,將公因子對(duì)變量做線性回歸,得到系數(shù)的最小二乘估計(jì)就是所謂的因子得分系數(shù)。人口五人|戒慎.匚立第一L業(yè)總工亡工上生*史值億元也攵即敵巴M 土,姬中噂昆用底收元位元拿毒仁元工更總相憶元FACl-iFAC2.1- 2QM60B86X)00136 2700XMB790O3006 19T26 13700S099GE2&)1 46112? 422301355 000060 5000150 7W541D 皿 00H55 11123 077001 儂 W5W-1

13、 516BS1則孫72O.51W畤W0Q*5由11770. JWQ17J7.771 陰 241MW1J75 J51W1 165K-W51S3593QODOjg 6a 口。M1 42005ffi9 96001213.431W55 46QD015gB 后5644-4032 3-D63122 W.71QO56 62001306 30007*01613.56.675423 0601122 04520 46850-oew&o43&3.00DQ64D6D01Q15 570 口1D606 540 02943.1515365 65SD02242 73500D75B76M帕一的1M53 1001277 -MOO

14、4WN5OO850. IO535 3150口6605413-33B34.00W56 5000imi 5DdO5602. ?BQOW?.56St47 4CSD014135 9BiBD-19/60-.17149234 r 冊(cè) 0060 3000MO20民59M329 831 F26S 455003TJ5 i22O01358762SM00用器.A0MM 90003004 noo229ML 例 OO514A.M幽 1“QUJW3 2SfiOO1 4B8 皖1 305 汨颯.WKWMPG1M3WW14M3.QM31W.W2547D 25Q01Hg Lwras13s22859,0000M M0&2016

15、31007IM2OO0Oi 13 5ama 5720015*0 1382047180-M5503720 0000M歸g181? MOO7S75 MOO1WI.i1906B&1900227D 260M-1MD3潮51必的436$45TOQO1W1 0700Mil WOOIMS 437123 SWXIMO 5W部iizwa9037 OOW5OB5W即32破不箝53455 中?173 273003日? 11042湖耳9鯉000040 5700博可2椒*139贈(zèng)3式用144B 427002775 27W1 76741wo57S7 50MS1 的0 46S36 040015MM11M1 S73M2063

16、 92290曲66.M27S圖16因子得分分析:根據(jù)估計(jì)出來的得分系數(shù),可以計(jì)算因子得分,由于在圖 6的“因子得分”中勾選了“保存為變量”,在SPS徽據(jù)視圖中出現(xiàn)的fac1_、fac_2就是變量的因子得分,如圖16。旋轉(zhuǎn)空間中的成分圖優(yōu)輔人口比不 O城第甲把就業(yè)人員_L資總戰(zhàn)億元O 口&共制政限弊也人億虎 O理蘇居民年隹?jī)?chǔ)蓄金款億元工業(yè)生產(chǎn)君值已元O總(口萬人O 第一聲巾:.由產(chǎn)有開r-1.0-0 50.00 51.0成分1圖17因子載荷圖分析:圖17說明了我們提取了兩個(gè)公因子,所以輸出的是二位平面圖, 我們可以看到旋轉(zhuǎn)后 在主因子為坐標(biāo)軸的二維平面上原變量的位置。(3)計(jì)算主成分綜合得分Z1

17、、Z2 (總得分)和數(shù)學(xué)表達(dá)式:點(diǎn)擊“轉(zhuǎn)換”一“計(jì)算變量”,輸入目標(biāo)變量Y=0.70643*FAC1 1+0.22545*FAC2 1D j06招峰此 1_1 +0_22M5*FAC2_1“點(diǎn)口”0*4人J /觸K口比 產(chǎn)笠一廣立窗區(qū)/公共內(nèi)源臚白3 /好蕾民軍盛,“加枕地位就此人/ REGR $.Z REGR factor w Z RFijR iartor x/ REGR factor .+1一二,二11.1主都卡COFiiSB*H-L CCF算押當(dāng)肺白養(yǎng)時(shí)同H朗迅箕圖18計(jì)算變量wj f=_i此家原品二更西Ji1K2HX)川型唧Q海就IWELWM國(guó)啕/歸1.1113 3 *-5000159

18、 rai14 1361Z3OTW13情圜-15T6101制腳2W73C0,17TOW017W17171 XK0O1575 180ne70114200眄蚓01213 榔涮愷呻整M0TO儂財(cái)?-130aso13S5 3XH7121 00013T用S6FMZ箝通用112 01520-.350500195優(yōu)覺iSO2M31522短詼圜.07567ME201377 442(14固1,段加血1035 11540EWJGBK-.4B115-33301-MOO171100麗網(wǎng)Q啊耨1415&80-.1刖-1714,-1SMU由廁理5晤3IMM2W-1.35m2痢-44too22210 SMU初相物片JMU蛆的

19、2B4Kid颯1 Wlxm1513 函0闞英掰021出冊(cè)2WK)2M0aMKI,朝 K.35J2513522156mo2015 31007WCCOO1悶轉(zhuǎn)33 5?恬的T加R4T1K-,“酷21IWO%巧寓。1知51蹣出順22用闔/嗝,-nmo1391 而刈頻1053 437123 5993WB0潮露:om-5TMJ.15級(jí)期3晚0曾犯MOD形第2TIT3J7W/通71ZiTW335157痔新.?和0碇硼1721 用課婚蝗砸ms蜜圜i?mi即1110版修91111葡心蟠如Mae辦.圖19因子總得分分析:該圖的列 Z1、Z2代表主成分變量,由此可以相關(guān)的線性組合方程組。(4)對(duì)31個(gè)觀察量的綜合

20、得分進(jìn)行排序點(diǎn)擊“數(shù)據(jù)”一“排序個(gè)案”,選擇丫作為變量,選擇“降序”,點(diǎn)擊確定。如圖20所示。衷件El觸1榭DM府IB值分小電IM;N) 3通1= o?lIWillflO *flll_卜中石國(guó)然s呼1霖吃 J 1:二: 3-J.電裁節(jié)SAOHM.A.A二 Lz t-尸1R總L值呼 帆衛(wèi)生生廣言值IM 4其r財(cái)電裳收上 5tuMrr題,噂手三主背系 ?Mifioe 正工牙?iGMHW3:廠訴1回M鼬翼5wxg90QQ5yI4 笈40405056H KI*山茶903TIMKI國(guó)的口171 B50D21Zr5W0O3*559322173 273co3B56149TO3江蘇TBMBOKi61 wno0

21、64 TITO22ZeO$1DD5Mffi9M7113 MJW13神途m72to000地的gTS7BONOfSM E1370 3 配 3t*w a0831K3SEOXI1411 QfM)24 3000MM eB&56 034001I17S 加 misH S45TOOQ13al DTDDMiiaa 呼IC534J7123 5CS M1C64涮卻ti B174J&MC卻wg122I9M54CT垃肉1K0 IS91050齡演制普!0IT藻MOM耨觸g 5W0刖1離Q。W7 555ir1堿mw1ry川t圖20綜合得分排序4部分小結(jié)在以上的操作過程中我們提取了兩個(gè)公因子(主成分),發(fā)現(xiàn)兩個(gè)主成分可以保存

22、有原變量的93.188%的信息,因此我們認(rèn)為主成分的提取是有效?!翱?cè)丝凇⒌谝划a(chǎn)業(yè)總產(chǎn)值、工業(yè)生產(chǎn)總值”可以由第一主成分代替,“城鎮(zhèn)人口比重、公共財(cái)政預(yù)算收入、儲(chǔ)蓄余額、工資總額”可以由第二主成分代替。 在對(duì)因子載荷矩陣進(jìn)行旋轉(zhuǎn)之后,我們發(fā)現(xiàn)可以就不難建立因子模型,在得到因子得分后, 就可以得到以兩個(gè)組成分為變量的因子總得分,達(dá)到實(shí)驗(yàn)的要求和目的。本次實(shí)驗(yàn)是有效的。第二部分聚類分析1實(shí)驗(yàn)原理聚類分析,亦稱群分析或點(diǎn)群分析, 它是研究多要素事物分類問題的數(shù)量方法。 其基本 原理是,根據(jù)樣本自身的屬性, 用數(shù)學(xué)方法按照某種相似性或差異性指標(biāo), 定量地確定樣本 之間的親疏關(guān)系,并按這種親疏關(guān)系程度對(duì)樣本進(jìn)行聚類。最近鄰元素:也是最近距離法。定義類與類之間的距離為兩類中最近的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論