主成分分析課件_第1頁(yè)
主成分分析課件_第2頁(yè)
主成分分析課件_第3頁(yè)
主成分分析課件_第4頁(yè)
主成分分析課件_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

主成分分析

主成分分析1§11.1什么是主成分分析及其基本思想問題的提出:

在對(duì)某一事物進(jìn)行實(shí)證分析研究中,為了更全面準(zhǔn)確反映出事物的特征及其發(fā)展規(guī)律,往往考慮與其有關(guān)系的多個(gè)指標(biāo),因此會(huì)產(chǎn)生的問題:(1)為避免漏掉重要信息而考慮盡量多的指標(biāo)(2)隨著考慮指標(biāo)的增多增加了問題的復(fù)雜性,并且多指標(biāo)之間不可避免會(huì)造成信息的大量重疊(相關(guān)性),這種重疊有時(shí)甚至?xí)谏w事物的真正特征與內(nèi)在規(guī)律。

目的:§11.1什么是主成分分析及其基本思想問題的提出:2§11.1什么是主成分分析及其基本思想

主成分分析(PrincipalComponentAnalysis,PCA)也稱為主分量分析,是一種數(shù)據(jù)降維技術(shù),主成分分析正是研究如何將多個(gè)具有較強(qiáng)相關(guān)性指標(biāo)化為少數(shù)幾個(gè)綜合指標(biāo)來(lái)解釋原來(lái)變量絕大多數(shù)信息的一種多元統(tǒng)計(jì)方法。把轉(zhuǎn)化生成的綜合指標(biāo)稱之為主成分。

§11.1什么是主成分分析及其基本思想3§11.1什么是主成分分析及其基本思想

例1:某廠商要做一件上衣,需要測(cè)量很多尺寸,如身長(zhǎng),體重,袖長(zhǎng),胸圍,腰圍,肩寬,肩厚等十幾項(xiàng)指標(biāo)

將多種指標(biāo)綜合成幾個(gè)少數(shù)的綜合指標(biāo),作為分類的型號(hào),可綜合成3項(xiàng)指標(biāo):一項(xiàng)反映長(zhǎng)度的指標(biāo),一項(xiàng)反映胖瘦的指標(biāo),一項(xiàng)反映特體的指標(biāo)?!?1.1什么是主成分分析及其基本思想4例2:醫(yī)學(xué)研究中常常需要對(duì)患者的健康狀況等進(jìn)行評(píng)價(jià),而這類評(píng)價(jià)要求內(nèi)容全面,多個(gè)測(cè)量指標(biāo),最后產(chǎn)出綜合評(píng)價(jià)結(jié)果。將多個(gè)指標(biāo)進(jìn)行綜合總會(huì)面臨以下問題:1.各指標(biāo)量綱不同,不能直接相加;2.各指標(biāo)間存在相關(guān),直接相加產(chǎn)生信息重疊;3.相加時(shí)需要考慮各指標(biāo)的權(quán)重。

主成分分析ppt課件5主成分分析的基本思想:

設(shè)法將用原來(lái)眾多具有一定相關(guān)性的指標(biāo)(比如p個(gè))重新組合成一組新的相互無(wú)關(guān)的綜合指標(biāo)來(lái)代替原來(lái)指標(biāo),同時(shí)根據(jù)實(shí)際需要,從中取幾個(gè)較少的綜合指標(biāo)(主成分)盡可能多地反映原來(lái)指標(biāo)的信息。§11.1什么是主成分分析及其基本思想§11.1什么是主成分分析及其基本思想6注:

通常數(shù)學(xué)上的處理:新的綜合指標(biāo)是原來(lái)p個(gè)指標(biāo)的線性組合。指標(biāo)“信息量”的表達(dá)用方差來(lái)表示,方差越大,表示該指標(biāo)包含的信息越多。因此,在所有的線性組合中選取方差最大的F1作為第一主成分,將方差次大的F2作為第二主成分,且要求Cov(F1,)=0,保證F1中的信息不出現(xiàn)在F2中,以此類推,構(gòu)造第三、第四,…第p主成分。

§11.1什么是主成分分析及其基本思想§11.1什么是主成分分析及其基本思想7§11.1什么是主成分分析及其基本思想實(shí)際工作中,挑選前幾個(gè)最大的主成分代替原來(lái)的指標(biāo)信息,雖然會(huì)損失一部分信息,但是由于我們抓住了主要矛盾,在實(shí)際問題的研究中得益比損失大,這種既減少了變量的數(shù)目又抓住了主要矛盾的做法有利于問題的分析和處理?!?1.1什么是主成分分析及其基本思想8原始指標(biāo)的線性組合綜合指標(biāo)間不相關(guān),且方差遞減第一主成分,第二主成分,…第p主成分選取前幾個(gè)最大的主成分代替原來(lái)指標(biāo)的信息盡可能多地找出相關(guān)指標(biāo)作為原始指標(biāo)主成分分析流程圖:原始指標(biāo)的線性組合綜合指標(biāo)間不相關(guān),且方差遞減第一主成分,第9§11.2主成分分析數(shù)學(xué)模型及幾何解釋§11.2主成分分析數(shù)學(xué)模型及幾何解釋10上述方程組要求:§11.2主成分分析數(shù)學(xué)模型及幾何解釋上述方程組要求:§11.2主成分分析數(shù)學(xué)模型及幾何解釋11§11.2主成分分析數(shù)學(xué)模型及幾何解釋用數(shù)學(xué)語(yǔ)言描述就是要求:§11.2主成分分析數(shù)學(xué)模型及幾何解釋用數(shù)學(xué)語(yǔ)言描述就是12§11.2主成分分析數(shù)學(xué)模型及幾何解釋注:(1)數(shù)學(xué)模型中用線性組合基于兩種原因:數(shù)學(xué)上容易處理和在實(shí)踐中效果好。(2)每次主成分的選取使Var(Fi)最大,如果不加限制就可使Var(Fi)趨于無(wú)窮大,就沒有意義了,常用的限制要求就是:§11.2主成分分析數(shù)學(xué)模型及幾何解釋注:13?????????????????????????????????????主成分分析的幾何解釋平移、旋轉(zhuǎn)坐標(biāo)軸??????????????????????????????14

如果我們將xl

軸和x2軸先平移,再同時(shí)按逆時(shí)針方向旋轉(zhuǎn)角度,得到新坐標(biāo)軸Fl和F2。Fl和F2是兩個(gè)新變量。如果我們將xl軸和x2軸先平移,再同時(shí)按15

根據(jù)旋轉(zhuǎn)變換的公式:根據(jù)旋轉(zhuǎn)變換的公式:16

旋轉(zhuǎn)變換的目的是為了使得n個(gè)樣品點(diǎn)在Fl軸方向上的離散程度最大,即Fl的方差最大。變量Fl代表了原始數(shù)據(jù)的絕大部分信息,在研究某問題時(shí),即使不考慮變量F2也無(wú)損大局。經(jīng)過上述旋轉(zhuǎn)變換原始數(shù)據(jù)的大部分信息集中到Fl軸上,對(duì)數(shù)據(jù)中包含的信息起到了濃縮作用。旋轉(zhuǎn)變換的目的是為了使得n個(gè)樣品點(diǎn)17§11.3總體主成分的推導(dǎo)及性質(zhì)(1)主成分的推導(dǎo):求主成分就是尋找X的線性函數(shù)使相應(yīng)的方差盡可能地大,即使§11.3總體主成分的推導(dǎo)及性質(zhì)(1)主成分的推導(dǎo):18§11.3總體主成分的推導(dǎo)及性質(zhì)§11.3總體主成分的推導(dǎo)及性質(zhì)19§11.3總體主成分的推導(dǎo)及性質(zhì)§11.3總體主成分的推導(dǎo)及性質(zhì)20§11.3總體主成分的推導(dǎo)及性質(zhì)§11.3總體主成分的推導(dǎo)及性質(zhì)21§11.3總體主成分的推導(dǎo)及性質(zhì)上述推導(dǎo)表明:

X1,X2,…Xp的主成分就是以Σ的特征向量為系數(shù)的線性組合,它們互不相關(guān),其方差為Σ的特征根。主成分的名詞是按照特征根取值大小的順序排列的。在解決實(shí)際問題時(shí),一般不是取p個(gè)主成分,而是根據(jù)累計(jì)貢獻(xiàn)率的大小取前K個(gè)?!?1.3總體主成分的推導(dǎo)及性質(zhì)上述推導(dǎo)表明:22§11.3總體主成分的推導(dǎo)及性質(zhì)定義:稱第一主成分的貢獻(xiàn)率為,由于,所以,

因此,第一主成分的貢獻(xiàn)率及時(shí)第一主成分方差在全部方差中的比值,這個(gè)比值越大,表明第一主成分綜合X1,X2,…,Xp信息的能力越強(qiáng)?!?1.3總體主成分的推導(dǎo)及性質(zhì)定義:23§11.3總體主成分的推導(dǎo)及性質(zhì)

前K個(gè)主成分的貢獻(xiàn)率(累計(jì)貢獻(xiàn)率)定義為:

如果前k個(gè)主成分的貢獻(xiàn)率達(dá)到85%,表明取前k個(gè)主成分基本包含了全部測(cè)量指標(biāo)所具有的信息,這樣既減少了變量的個(gè)數(shù)又便于對(duì)實(shí)際問題的分析和研究?!?1.3總體主成分的推導(dǎo)及性質(zhì)前K個(gè)主24§11.3總體主成分的推導(dǎo)及性質(zhì)(2)主成分性質(zhì)性質(zhì)1性質(zhì)2§11.3總體主成分的推導(dǎo)及性質(zhì)(2)主成分性質(zhì)25§11.3總體主成分的推導(dǎo)及性質(zhì)性質(zhì)3F1…FK…FPX1ρ(F1,X1)…ρ(FK,X1)…ρ(FP,X1)X2ρ(F1,X2)…ρ(FK,X2)…ρ(FP,X2)………………Xpρ(F1,XP)…ρ(FK,XP)…ρ(FP,XP)§11.3總體主成分的推導(dǎo)及性質(zhì)性質(zhì)3F1…FK…FPX26§11.3總體主成分的推導(dǎo)及性質(zhì)性質(zhì)4§11.3總體主成分的推導(dǎo)及性質(zhì)性質(zhì)427§11.3總體主成分的推導(dǎo)及性質(zhì)性質(zhì)5

此性質(zhì)說明:上表中Fk對(duì)應(yīng)的每一列關(guān)于各變量相關(guān)系數(shù)的加權(quán)平方和為λk即Var(Fk)?!?1.3總體主成分的推導(dǎo)及性質(zhì)性質(zhì)528§11.3總體主成分的推導(dǎo)及性質(zhì)§11.3總體主成分的推導(dǎo)及性質(zhì)29§11.4有關(guān)問題的討論(一)從協(xié)差陣出發(fā)還是從相關(guān)陣出發(fā)求主成分

從協(xié)差陣出發(fā)——求原始數(shù)據(jù)的協(xié)差陣的特征值特征向量的過程。

從相關(guān)陣出發(fā)——求原始數(shù)據(jù)的相關(guān)陣(標(biāo)準(zhǔn)化數(shù)據(jù)的協(xié)差陣)的特征值特征向量的過程。

從協(xié)差陣出發(fā)和從相關(guān)陣出發(fā)所求得的主成分一般來(lái)說是有差別的,而且這種差別有時(shí)候還很大?!?1.4有關(guān)問題的討論(一)從協(xié)差陣出發(fā)還是從相關(guān)陣出30§11.4有關(guān)問題的討論

對(duì)于度量單位不同的指標(biāo)或是取值范圍彼此差異非常大的指標(biāo),一般不直接由其協(xié)差陣出發(fā)而應(yīng)該考慮將數(shù)據(jù)標(biāo)準(zhǔn)化。

原始數(shù)據(jù)標(biāo)準(zhǔn)化處理后傾向于各個(gè)指標(biāo)的作用在主成分的構(gòu)成中相等。數(shù)據(jù)標(biāo)準(zhǔn)化的過程實(shí)際上就是抹殺原始變量離散程度差異的過程,標(biāo)準(zhǔn)化后各變量方差相等均等于1,而實(shí)際上方差也是對(duì)數(shù)據(jù)信息的重要概括形式,即對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化后抹殺了一部分重要信息,因此才使得標(biāo)準(zhǔn)化后各變量在對(duì)主成分構(gòu)成中的作用趨于相等。

§11.4有關(guān)問題的討論對(duì)于度量單位不同的31§11.4有關(guān)問題的討論

因此從相關(guān)陣出發(fā)求主成分有其不足之處,實(shí)際問題中不可盲目將數(shù)據(jù)標(biāo)準(zhǔn)化處理,可分別從協(xié)差陣和相關(guān)陣出發(fā)進(jìn)行求解并研究其結(jié)果的差別,看是否有顯著差異并分析產(chǎn)生差異的原因,以確定用哪種結(jié)果更為可信?!?1.4有關(guān)問題的討論32§11.4有關(guān)問題的討論(二)主成分分析不要求數(shù)據(jù)來(lái)自正態(tài)總體

與很多多元統(tǒng)計(jì)分析方法不同,主成分分析不要求數(shù)據(jù)來(lái)自于正態(tài)總體,主成分分析實(shí)際上就是對(duì)矩陣結(jié)構(gòu)的分析,主要用到矩陣運(yùn)算及矩陣對(duì)角化技術(shù)。§11.4有關(guān)問題的討論33§11.4有關(guān)問題的討論(三)主成分分析與重疊信息

主成分分析適用于變量之間存在較強(qiáng)相關(guān)性的數(shù)據(jù),如果原始數(shù)據(jù)相關(guān)性較弱,運(yùn)用主成分分析后不能起到很好的降維作用,即所得的各個(gè)主成分濃縮原始變量信息的能力差別不大。一般當(dāng)原始數(shù)據(jù)大部分變量的相關(guān)系數(shù)都小于0.3時(shí),運(yùn)用主成分分析不會(huì)取得很好的效果。

§11.4有關(guān)問題的討論(三)主成分分析與重疊信息34§11.4有關(guān)問題的討論

主成分分析對(duì)重疊信息的剔除是無(wú)能為力的。在實(shí)際選取初始變量進(jìn)入分析時(shí),對(duì)原始變量存在多重共線性的問題,應(yīng)用主成分分析方法時(shí)要慎重。要考慮選取的初始變量是否合適,如果出于避免漏掉某些信息而特意選取了過多存在重疊信息的變量時(shí),就要注意應(yīng)用主成分分析得到的結(jié)果。

如果所得樣本協(xié)差陣的最小特征值接近于0,就意味著原始變量之間存在著多重共線性,即原始變量存在著不可忽視的重疊信息?!?1.4有關(guān)問題的討論主成分分析對(duì)重疊35§11.5由樣本數(shù)據(jù)求主成分例1.測(cè)得10名幼兒的身高,體重如下表,求主成分。對(duì)象號(hào)x1體重(kg)x2身高(cm)116.3108213.088318.3111415.095511.988614.495713.594812.188913.3931013.595均數(shù)14.1395.5標(biāo)準(zhǔn)差1.9658477.989577§11.5由樣本數(shù)據(jù)求主成分例1.測(cè)得10名幼兒的身高361.求相關(guān)系數(shù)矩陣Rr11=r22=1,r12=r21=0.95472.求R的特征根,解方程:即(1-λ)*(1-λ)-0.9547*0.9547=0得兩個(gè)根1.9547和0.0453,記為:λ1=1.9547,λ2=0.04531.求相關(guān)系數(shù)矩陣R2.求R的特征根,解方程:即(1-λ)*373.求特征向量Liλ1=1.9547所對(duì)應(yīng)的特征向量用下式解:l11+0.9547l12=1.9547l110.9547l11+l12=1.9547l12l112+l122=1得l11=0.7071,l12=0.7071,第一主成分為:C1=0.7071X1+0.7071X2同樣的方法,用λ2=0.0453可計(jì)算出第二主成分,此處略。3.求特征向量Li38§11.5由樣本數(shù)據(jù)求主成分

設(shè)樣本觀測(cè)矩陣為Xn*p,樣本主成分計(jì)算步驟:1.將原始數(shù)據(jù)標(biāo)準(zhǔn)化(可選)2.求原始數(shù)據(jù)的協(xié)差陣Σ或相關(guān)陣R3.求Σ(或R)的特征根和特征向量4寫出主成分

§11.5由樣本數(shù)據(jù)求主成分39§11.5由樣本數(shù)據(jù)求主成分練習(xí):§11.5由樣本數(shù)據(jù)求主成分練習(xí):4041特征值標(biāo)準(zhǔn)正交特征向量是否有接近0的情況是其他處理否主成分對(duì)主成分進(jìn)行分析深入分析選擇初始變量度量或取值范圍相同?是否(否)對(duì)比分析相關(guān)陣分析協(xié)方差陣主成分分析的邏輯框圖見圖5-3:41特征值標(biāo)準(zhǔn)正交特征向量是否有接近0的情況是其他處理否主成41【例5.2】數(shù)據(jù)集Employeedata為Midwestern銀行在1969-1971年之間雇員情況的數(shù)據(jù),共包括474條觀測(cè)及如下10個(gè)變量:Id(觀測(cè)號(hào))、Gender(性別)、Bdate(出生日期)、Educ(受教育程度(年數(shù)))、Jobcat(工作種類)、Salary(目前年薪)、Salbegin(開始受聘時(shí)的年薪)、Jobtime(受雇時(shí)間(月))、Prevexp(受雇以前的工作時(shí)間(月))、Minority(是否少數(shù)民族)。下面我們用主成分分析方法處理該數(shù)據(jù),以期用少數(shù)變量來(lái)描述該地區(qū)居民的雇傭情況。2023/8/9中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心42

目錄上頁(yè)下頁(yè)返回結(jié)束

§11.6主成分分析的上機(jī)實(shí)現(xiàn)SPSS軟件FACTOR模塊提供了主成分分析的功能。下面先以SPSS軟件包自帶的數(shù)據(jù)Employeedata.sav為例介紹主成分分析的上機(jī)實(shí)現(xiàn)方法,在SPSS軟件的安裝目錄下可以找到該數(shù)據(jù)集;然后,我們舉一個(gè)實(shí)際的例子介紹主成分分析的具體應(yīng)用。2023/8/9【例5.2】數(shù)據(jù)集Employeedata為Midwes42§11.6主成分分析的上機(jī)實(shí)現(xiàn)

進(jìn)入SPSS軟件,打開數(shù)據(jù)集Employeedata.sav。依次點(diǎn)選Analyze→DataReduction→Factor….進(jìn)入FactorAnalysis(因子分析)對(duì)話框。(在SPSS軟件中,主成分分析與因子分析均在FactorAnalysis模塊中完成。此時(shí),數(shù)據(jù)集Employeedata.sav中的變量名均已顯示在左邊的窗口中,依次選中變量educ、salary、salbegin、jobtime、prevexp并點(diǎn)向右的箭頭按鈕,這五個(gè)變量便進(jìn)入variables窗口(此時(shí)若選中variables窗口中的變量,則窗口左側(cè)的箭頭按鈕即轉(zhuǎn)向左側(cè),點(diǎn)此按鈕即可剔除所選中變量)。點(diǎn)擊右側(cè)的OK按鈕,即可得到如下輸出結(jié)果5-1?!?1.6主成分分析的上機(jī)實(shí)現(xiàn)進(jìn)入SPSS軟件,打開43§11.6主成分分析的上機(jī)實(shí)現(xiàn)輸出結(jié)果11-1(1)Communalities給出了該次分析從每個(gè)原始變量中提取的信息,表格下面的注示表明,該次分析是用Factoranalysis模塊默認(rèn)的信息提取方法即主成分分析完成的??梢钥吹匠芙逃潭刃畔p失較大外,主成分幾乎包含了各個(gè)原始變量至少90%的信息?!?1.6主成分分析的上機(jī)實(shí)現(xiàn)輸出結(jié)果11-1(1)Com44輸出結(jié)果11-1(2)TotalVarianceExplained表則顯示了各主成分解釋原始變量總方差的情況,SPSS默認(rèn)保留特征根大于1的主成分,在本例中看到當(dāng)保留3個(gè)主成分為宜,這3個(gè)主成分集中了原始5個(gè)變量信息的90.66%,可見效果是比較好的。輸出結(jié)果11-1(2)TotalVarianceExpl45輸出結(jié)果11-1(3)輸出結(jié)果11-1(3)46SPSS默認(rèn)是從相關(guān)陣出發(fā)求解主成分,且默認(rèn)保留特征根大于1的主成分,實(shí)際上,對(duì)主成分的個(gè)數(shù)我們可以自己確定SPSS默認(rèn)是從相關(guān)陣出發(fā)求解主成分,且默認(rèn)保留特征根大于147

【例11.2】在企業(yè)經(jīng)濟(jì)效益的評(píng)價(jià)中,設(shè)計(jì)的指標(biāo)往往很多。為了簡(jiǎn)化系統(tǒng)結(jié)構(gòu),抓住經(jīng)濟(jì)效益評(píng)價(jià)中的主要問題,我們可由原始數(shù)據(jù)矩陣出發(fā)求主成分。在對(duì)我國(guó)部分省、市、自治區(qū)獨(dú)立核算的工業(yè)企業(yè)的經(jīng)濟(jì)效益評(píng)價(jià)中,涉及到9項(xiàng)指標(biāo),原始數(shù)據(jù)見表11-7,即樣品數(shù)n=28,變量數(shù)p=9。【例11.2】48

100固定資產(chǎn)原值實(shí)現(xiàn)值(%)100元固定資產(chǎn)原值實(shí)現(xiàn)利稅(%)100元資金實(shí)現(xiàn)利稅(%)100元工業(yè)總產(chǎn)值實(shí)現(xiàn)利稅(%)100元銷售收入實(shí)現(xiàn)利稅(%)每噸標(biāo)準(zhǔn)煤實(shí)現(xiàn)工業(yè)產(chǎn)值(元)每千瓦時(shí)電力實(shí)現(xiàn)工業(yè)產(chǎn)值(元)全員勞動(dòng)生產(chǎn)率(元/人.年)100元流動(dòng)資金實(shí)現(xiàn)產(chǎn)值(元)北京(1)119.2930.9829.9225.9715.4821783.4121006296.7天津(2)143.9831.5930.2121.9412.2928524.2920254363.1河北(3)94.817.217.9518.149.3711672.0312607322.2山西(4)65.811.0811.0612.1516.848.821.6510166284.7內(nèi)蒙(5)54.799.249.5416.866.278941.87564225.4遼寧(6)94.5121.1222.8322.3511.2814162.3613.386311.7吉林(7)80.4913.3613.7616.67.1413062.079400274.1黑龍江(8)75.8615.8216.6720.8610.3712672.269830267上海(9)187.7945.939.7724.4415.0943464.1131246418.6江蘇(10)205.9627.6522.5813.427.8132024.6923377407.2浙江(11)207.4633.0625.7815.949.2838114.1922054385.5安徽(12)110.7820.720.1218.696.614682.2312578341.1福建(13)122.7622.5219.9318.348.3522002.6312164301.2表11-7100固定資產(chǎn)原值實(shí)現(xiàn)值(%)100元固定資產(chǎn)原值實(shí)現(xiàn)利稅(%)100元資金實(shí)現(xiàn)利稅(%)100元工業(yè)總產(chǎn)值實(shí)現(xiàn)利稅(%)100元銷售收入實(shí)現(xiàn)利稅(%)每噸標(biāo)準(zhǔn)煤實(shí)現(xiàn)工業(yè)產(chǎn)值(元)每千瓦時(shí)電力實(shí)現(xiàn)工業(yè)產(chǎn)值(元)全員勞動(dòng)生產(chǎn)率(元/人.年)100元流動(dòng)資金實(shí)現(xiàn)產(chǎn)值(元)北京(1)119.2930.9829.9225.9715.4821783.4121006296.7天津(2)143.9831.5930.2121.9412.2928524.2920254363.1河北(3)94.817.217.9518.149.3711672.0312607322.2山西(4)65.811.0811.0612.1516.848.821.6510166284.7內(nèi)蒙(5)54.799.249.5416.866.278941.87564225.4遼寧(6)94.5121.1222.8322.3511.2814162.3613.386311.7吉林(7)80.4913.3613.7616.67.1413062.079400274.1黑龍江(8)75.8615.8216.6720.8610.3712672.269830267上海(9)187.7945.939.7724.4415.0943464.1131246418.6江蘇(10)205.9627.6522.5813.427.8132024.6923377407.2浙江(11)207.4633.0625.7815.949.2838114.1922054385.5安徽(12)110.7820.720.1218.696.614682.2312578341.1福建(13)122.7622.5219.9318.348.3522002.6312164301.2100固定資產(chǎn)49

江西(14)94.9414.714.1815.496.6916692.2410463274.4山東(15)117.5821.9320.8918.659.118202.817829331.1河南(16)85.9817.317.1820.127.6713061.8911247276.5湖北(17)103.9619.518.4818.779.1618292.7515745308.9湖南(18)104.0321.4721.2820.638.7212721.9813161309廣東(19)136.4423.6420.8317.337.8529593.7116259334廣西(20)100.7222.0420.921.889.6717322.1312441296.4四川(21)84.7314.3514.1716.937.9613102.3411703242.5貴州(22)59.0514.4814.3524.538.0910681.329710206.7云南(23)73.7221.9122.729.729.3814471.9412517295.8陜西(24)78.0213.1312.5716.839.1917312.0811369220.3甘肅(25)59.6214.0716.2423.5911.349261.1313084246.8青海(26)51.668.328.2616.117.0510551.319246176.49寧夏(27)52.958.258.8215.576.588341.1210406245.4新疆(28)60.2911.2613.1418.688.3910412.910983266續(xù)表5-7江西(14)950

0.4235231.3384051.5902821.6875562.2396340.4819710.9547461.2603710.0488050.9951991.4096491.6314530.6672281.0658731.1887581.8553941.1338441.200166-0.14352-0.271-0.10906-0.29487-0.00854-0.57821-0.45763-0.152790.49097-0.81499-0.98577-1.08721-1.811432.740046-1.79273-0.84655-0.56349-0.15927-1.06992-1.20067-1.303-0.61894-1.14919-0.86449-0.69303-1.00129-1.18752-0.150240.1868270.5837370.7710330.694243-0.3171-0.11989-2.27170.308902-0.47486-0.71949-0.7039-0.68477-0.82907-0.43245-0.4167-0.69238-0.34307-0.58206-0.43218-0.290780.393790.359408-0.47334-0.22224-0.62003-0.466192.0095833.0809562.9886561.3001862.0961332.7554331.6711712.9832842.1625242.4302940.9494850.548246-1.48989-0.582541.5557832.264781.6592991.9648512.4650251.5813351.002539-0.85187-0.041662.1944081.7530481.43671.5885780.2264810.1377740.199007-0.15562-1.02776-0.26257-0.25294-0.157670.8186910.5038680.3503370.172033-0.24423-0.383850.5050410.156444-0.227320.126834-0.14028-0.56298-0.64428-0.9658-0.99465-0.05179-0.24271-0.51352-0.337870.3839290.2814290.308322-0.16574-0.107890.1065570.3304330.725830.645294表5-8首先標(biāo)準(zhǔn)化原始數(shù)據(jù),標(biāo)準(zhǔn)化后的數(shù)據(jù)見表5-8。0.4235251§5.7主成分分析的上機(jī)實(shí)現(xiàn)

-0.34774-0.25932-0.218380.206435-0.63406-0.43245-0.60092-0.38161-0.301460.068569-0.00238-0.03382-0.13536-0.085810.1159940.279260.375190.2603510.070190.2277050.3636890.335558-0.24771-0.4681-0.50881-0.059580.2620850.8206170.4811450.299804-0.49995-0.567831.3009631.2617850.4616730.695579-0.006450.2942770.3097410.6520370.1018430.014276-0.35529-0.180720.043603-0.37669-0.60386-0.6457-0.60122-0.52735-0.42825-0.14036-0.30489-0.89101-0.97128-0.58868-0.620141.322972-0.47952-0.68202-1.18429-0.64022-1.51177-0.631610.2790930.5652822.636993-0.00486-0.28459-0.54975-0.167930.033199-0.53205-0.74635-0.87284-0.62654-0.074770.013227-0.40646-0.36109-1.27595-0.95809-0.63656-0.351821.084980.71632-0.83093-1.37875-0.07253-0.81645-1.14239-1.30812-1.48472-0.80883-0.86219-0.69566-1.19453-0.71829-2.03561-1.11252-1.3163-1.40522-0.94555-1.03512-0.92741-1.38899-0.52311-0.84073-0.94257-0.96475-0.79192-0.15815-0.36913-0.710340.432779-0.42603-0.48353續(xù)表5-8§5.7主成分分析的上機(jī)實(shí)現(xiàn)52

將表5-8數(shù)據(jù)導(dǎo)入spss軟件,依次點(diǎn)選Analyze-DataReduction-Factor進(jìn)入FactorAnalysis對(duì)話框。(在spss中,主成分分析與因子分析均在FactorAnalysis模塊中完成。)如圖5-4所示:將表5-8數(shù)據(jù)導(dǎo)入spss軟件,依次53§5.7主成分分析的上機(jī)實(shí)現(xiàn)

此時(shí),數(shù)據(jù)集5-5.sav中的變量名均顯示在對(duì)話框左邊的窗口中,選擇變量x1,x2,x3,x4,x5,x6,x7,x8,x9進(jìn)入variables窗口中,操作如圖5-5所示:圖5-5§5.7主成分分析的上機(jī)實(shí)現(xiàn)此時(shí),54

圖5-5點(diǎn)擊descriptives按鈕,在彈出的對(duì)話框中,在correlationmatrix中選擇coefficients。回到原對(duì)話框點(diǎn)擊右側(cè)的Ok,即可得到輸出結(jié)果5-4和輸出結(jié)果5-5。圖5-5點(diǎn)擊descriptives55

輸出結(jié)果5-4輸出結(jié)果5-456

輸出結(jié)果5-5由輸出結(jié)果5-4看到,前面2個(gè)主成分、的方差和占全部方差的比例為84.7%。我們就選取為第一主成分,為第二主成分,且這兩個(gè)主成分之方差和占全部方差的84.7%,即基本上保留了原來(lái)指標(biāo)的信息,這樣由原來(lái)的9個(gè)指標(biāo)轉(zhuǎn)化為2個(gè)新指標(biāo),起到了降維的作用。輸出結(jié)果5-5由輸出結(jié)果5-4看到,57

SPSS軟件得到因子載荷矩陣如下圖:SPSS軟件得到因子載荷矩陣如下圖:58

對(duì)SPSS的因子分析模塊運(yùn)行結(jié)果輸出的ComponentMatrix的第列的每個(gè)元素分別除以第個(gè)特征根的平方根就得到主成分分析的第個(gè)主成分的系數(shù)。結(jié)果如下表:對(duì)SPSS的因子分析模塊運(yùn)行結(jié)果輸出的Compo59

主成分1主成分2x10.3755586-0.25951x20.39339580.134374x30.37525560.265294x40.09353430.711329x50.1745590.491327x60.3721494-0.16496x70.3616165-0.2254x80.3513161-0.05236x90.3625942-0.12675主成分1主成分2x10.3755586-0.25951x260

(11.13)

其中,表示對(duì)原始變量標(biāo)準(zhǔn)化后的變量。由上表得到前2個(gè)主成分,,的線性組合為:由上表得到前2個(gè)主成分,,的線性組合為:其中,表示對(duì)原始變量標(biāo)準(zhǔn)化后的變量。由上表得到前2個(gè)主成分,,的線性組合為:

(11.13)其中,61

對(duì)所選主成分作經(jīng)濟(jì)解釋。主成分分析的關(guān)鍵在于能否給主成分賦予新的意義,給出合理的解釋,這個(gè)解釋應(yīng)根據(jù)主成分的計(jì)算結(jié)果結(jié)合定性分析來(lái)進(jìn)行。主成分是原來(lái)變量的線性組合,在這個(gè)線性組合中,各變量的系數(shù)有大有小,有正有負(fù),有的大小相當(dāng),因而不能簡(jiǎn)單地認(rèn)為這個(gè)主成分是某個(gè)原變量的屬性的作用。線性組合中個(gè)變量的系數(shù)的絕對(duì)值大者表明該主成分主要綜合了絕對(duì)值大的變量,有幾個(gè)變量系數(shù)大小相當(dāng)時(shí),應(yīng)認(rèn)為這一主成分是這幾個(gè)變量的總和,這幾個(gè)變量綜合在一起應(yīng)賦予怎樣的經(jīng)濟(jì)意義,要結(jié)合經(jīng)濟(jì)專業(yè)知識(shí),給出恰如其分的解釋,才能達(dá)到深刻分析經(jīng)濟(jì)成因的目的。對(duì)所選主成分作經(jīng)濟(jì)解釋。主成分分析62

我們所取的例子中有9個(gè)指標(biāo)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論