SPSS軟件進行主成分分析的應(yīng)用總結(jié)歸納例子_第1頁
SPSS軟件進行主成分分析的應(yīng)用總結(jié)歸納例子_第2頁
SPSS軟件進行主成分分析的應(yīng)用總結(jié)歸納例子_第3頁
SPSS軟件進行主成分分析的應(yīng)用總結(jié)歸納例子_第4頁
SPSS軟件進行主成分分析的應(yīng)用總結(jié)歸納例子_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、精心整理SPSS軟件進行主成分分析的應(yīng)用例子2002年16家上市公司4項指標(biāo)的數(shù)據(jù)5見表2,定量綜合贏利能力分析如下:表2 2002年16家上市公司4項指標(biāo)的數(shù)據(jù)公司銷售凈利率(X1)資產(chǎn)凈利率(X)凈資產(chǎn)收益率(X銷售毛利率(X”歌華有線43.317.398.7354.89五糧液?17.1112.1317.2944.25用友軟件21.116.037.0089.37太太藥業(yè)29.558.6210.1373浙江陽光11.008.4111.8325.22煙臺萬華17.6313.8615.4136.44方正科技2.734.2217.169.96紅河光明29.115.446.0956.26貴州茅臺20

2、.299.4812.9782.23中鐵二局3.994.649.3513.04紅星發(fā)展22.6511.1314.350.51伊利股份4.437.3014.3629.04青島海爾5.408.9012.5365.5湖北宜化7.062.795.2419.79雅戈爾?19.8210.5318.5542.04福建南紙7.262.996.9922.721.主成分分析的做法第一,將 EXCEL中的原始數(shù)據(jù)導(dǎo)入到SPSSa件中;注意:導(dǎo)入Spss的數(shù)據(jù)不能出現(xiàn)空缺的現(xiàn)象,如出現(xiàn)可用 0補齊。第二,對四個指標(biāo)百標(biāo)準(zhǔn)化處理;11 “分析” | “描述統(tǒng)計” | “描述”。21彈出“描述統(tǒng)計”對話框,首先將準(zhǔn)備標(biāo)準(zhǔn)化

3、的變量移入變量組中,此時,最重 要的一步就是勾選“將標(biāo)準(zhǔn)化得分另存為變量”,最后點擊確定?!?】返回SPSS的“數(shù)據(jù)視圖”,此時就可以看到新增了標(biāo)準(zhǔn)化后數(shù)據(jù)的字段。所做工作:a.原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理數(shù)據(jù)標(biāo)準(zhǔn)化主要功能就是消除變量間的量綱關(guān)系,從而使數(shù)據(jù)具有可比性,可以舉個簡單的例子,一個百分制的變 量與一個5分值的變量在一起怎么比較?只有通過數(shù)據(jù)標(biāo)準(zhǔn)化,都把它們標(biāo)準(zhǔn)到同一個標(biāo)準(zhǔn)時才具有可比性,一般標(biāo)準(zhǔn) 化采用的是Z標(biāo)準(zhǔn)化,即均值為 0,方差為1,當(dāng)然也有其他標(biāo)準(zhǔn)化,比如 0-1標(biāo)準(zhǔn)化等等,可根據(jù)自己的研究目的進 行選擇,這里介紹怎么進行數(shù)據(jù)的Z標(biāo)準(zhǔn)化。所的結(jié)論:標(biāo)準(zhǔn)化后的所有指標(biāo)數(shù)據(jù)。注意:S

4、PSS在調(diào)用Factor Analyze 過程進行分析時,SPSS會自動對原始數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,所以在得到計算結(jié)果后的變量都是指經(jīng)過標(biāo)準(zhǔn)化處理后的變量,但SPSS并不直接給出標(biāo)準(zhǔn)化后的數(shù)據(jù),如需要得到標(biāo)準(zhǔn)化數(shù)據(jù),則需調(diào)用Descriptives 過程進行計算。第三,并把標(biāo)準(zhǔn)化后的數(shù)據(jù)保存在數(shù)據(jù)編輯窗口中然后利用SPSS的factor過程對數(shù)據(jù)進行因子分析(指標(biāo)之間的相關(guān)性判定略)。表;11 “分析” | “降維” | “因子分析”選項卡,將要進行分析的變量選入“變量”列21設(shè)置“描述”,勾選“原始分析結(jié)果”和“KMOtf Bartlett 球形度檢驗”復(fù)選框;31設(shè)置“抽取”,勾選“碎石圖”

5、復(fù)選框;41設(shè)置“旋轉(zhuǎn)”,勾選“最大方差法”復(fù)選框;【5】設(shè)置“得分”,勾選“保存為變量”和“因子得分系數(shù)”復(fù)選框;61查看分析結(jié)果。所做工作:a.查看KMOF口 Bartlett 的檢驗KMO直接近1.KMO值越接近于1,意味著變量間的相關(guān)性越強,原有變量越適合作因子分析;Bartlett球度度中驗的Sig值越小于顯著水平 0.05 ,越說明變量之間存在相關(guān)關(guān)系。所的結(jié)論:符合因子分析的條件,可以進行因子分析,并進一步完成主成分分析。注意:1.KM0 (Kaiser-Meyer-Olkin)KM%計量是取值在 0和1之間。當(dāng)所有變量間的簡單相關(guān)系數(shù)平方和遠遠大于偏相關(guān)系數(shù)平方和時,KMO直接

6、近1.KMO值越接近于1,意味著變量間的相關(guān)性越強,原有變量越適合作因子分析;當(dāng)所有變量間的簡單相關(guān)系數(shù)平方和接 近0時,KMO直接近0.KMO值越接近于0,意味著變量間的相關(guān)性越弱,原有變量越不適合作因子分析。Kaiser給出了常用的kmo度量標(biāo)準(zhǔn):0.9以上表示非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合; 0.5以下表示極不適合。2.Bartlett球度檢驗:巴特利特球度檢驗的統(tǒng)計量是根據(jù)相關(guān)系數(shù)矩陣的行列式得到的,如果該值較大,且其對應(yīng)的相伴概率值小于用戶 心中的顯著性水平,那么應(yīng)該拒絕零假設(shè),認(rèn)為相關(guān)系數(shù)矩陣不可能是單位陣,即原始變量之間存在相關(guān)性,適合于做 主成份分

7、析;相反,如果該統(tǒng)計量比較小,且其相對應(yīng)的相伴概率大于顯著性水平,則不能拒絕零假設(shè),認(rèn)為相關(guān)系數(shù) 矩陣可能是單位陣,不宜于做因子分析。Bartlett球度檢驗的原假設(shè)為相關(guān)系數(shù)矩陣為單位矩陣,Sig值為0.001小于顯著水平0.05 ,因此拒絕原假設(shè),說明變量之間存在相關(guān)關(guān)系,適合做因子分析。所做工作:b.全部解釋方差或者解釋的總方差(Total Variance Explained)初始特征根(Initial Eigenvalues )大于1 ,并且累計百分比達到80%85%Z上。查看相關(guān)系數(shù)矩陣的特征木K及方差貢獻率見表3,由于前2個主成分貢獻率85%結(jié)合表4中變量不出現(xiàn)丟失,所以提取的主

8、成分個數(shù) m=2 所的結(jié)論:初始特征根:入1=1.897 入2=1.550主成分貢獻率:C=0.47429 r 2=0.38740注意:主成分的數(shù)目可以根據(jù)相關(guān)系數(shù)矩陣的特征根來判定,如前所說,相關(guān)系數(shù)矩陣的特征根剛好等于主成分的方差,而方差是變量數(shù)據(jù)蘊涵信息的重要判據(jù)之一。根據(jù)人值決定主成分?jǐn)?shù)目的準(zhǔn)則有三:1 .只取人1的特征根對應(yīng)的主成分從Total Variance Explained表中可見,第一、第二和第三個主成分對應(yīng)的人值都大于1,這意味著這三個主成分得分的方差都大于1。本例正是根據(jù)這條準(zhǔn)則提取主成分的。2 .累計百分比達到 80%85%Z上的人值對應(yīng)的主成分在Total Vari

9、ance Explained 表可以看出,前三個主成分對應(yīng)的人值累計百分比達到89.584%,這暗示只要選取三2019年一9月精心整理個主成分,信息量就夠了。3 .根據(jù)特征根變化的突變點決定主成分的數(shù)量從特征根分布的折線圖(Scree Plot )上可以看到,第 4個人值是一個明顯的折點,這暗示選取的主成分?jǐn)?shù)目應(yīng)有 p<4。那么,究竟是3個還是4個呢?根據(jù)前面兩條準(zhǔn)則,選3個大致合適(但小有問題)。第四,計算特征向量矩陣(主成分表達式的系數(shù))【1】將初始因子載荷矩陣中的兩列數(shù)據(jù)輸入(可用復(fù)制粘貼的方法)到數(shù)據(jù)編輯窗口(為變 量 VI、V2);Fi=Vi/SQR(入 1)【2然后利用“轉(zhuǎn)換

10、” | “計算變量”,打開“計算變量”對話框,在“目標(biāo)變量”文本框 中輸入“Fi”,然后在數(shù)字表達式中輸入“ M/SQR(入1)” 注:入1=1.897,即可得到特征向量Fi;【3然后利用“轉(zhuǎn)換” | “計算變量”,打開“計算變量”對話框,在“目標(biāo)變量”文本框 中輸入“F2”,然后在數(shù)字表達式中輸入“ V2/SQR(入2)” 注:入1=1.550,即可得到特征向量F2;【4】最后得到特征向量矩陣(主成分表達式的系數(shù))。所做工作:a.成分矩陣或者初始因子載荷矩陣( Component Matrix )初始因子載荷矩陣見上圖,通過初始因子載荷矩陣還不能得出主成分的表達式,還需要把初始因子載荷矩陣中

11、的每 列的系數(shù)(主成分的載荷)除以其相應(yīng)主成分的特征根的平方根后才能得到主成分系數(shù)向量(主成分的得出系數(shù)); 所的結(jié)論:1 .用于計算主成分表達式系數(shù)的初始因子載荷矩陣中每個指標(biāo)的載荷。2 .計算后,得到的主成分表達式的系數(shù)矩陣。 注意:1 .主成分表達式的系數(shù)提取出來的全部主成分可以基本反映全部指標(biāo)的信息,但這些新變量(主成分)的表達卻不能從輸出窗口中直接得到 ,即:主成分中每個指標(biāo)所對應(yīng)的系數(shù)不是初始因子載荷矩陣中的對應(yīng)指標(biāo)的載荷,因為“Component Matrix ”是指初始因子載荷矩陣,每一個載荷量表示主成分與對應(yīng)變量的相關(guān)系數(shù)。2 .主成分表達式系數(shù)的計算方法初始因子載荷矩陣或主

12、成分載荷矩陣(Component Matrix)中的數(shù)據(jù)除以主成分相對應(yīng)的特征根(或特征值)開平方根便得到兩個主成分中每個指標(biāo)所對應(yīng)的系數(shù)。F1=V1/SQR(人 1)3 .主成分的指標(biāo)劃分與命名初始因子載荷矩陣或主成分載荷矩陣(Component Matrix)中每列表示相應(yīng)主成分與對應(yīng)變量的相關(guān)系數(shù),每個主成分所反映的原始指標(biāo)各有不同,為進一步明確每個主成分側(cè)重反應(yīng)的具體原始指標(biāo),需要對原始指標(biāo)在每個主成分上的 載荷進行比較,其中載荷越大,其對應(yīng)的主成分反映該原始指標(biāo)的信息量越大,反之亦然;如果某一原始指標(biāo)在幾個主 成分的載荷絕對值不相上下,歸類比較含混,導(dǎo)致主成分的原始指標(biāo)劃分不清。說明

13、有必要作進一步的因子分析。從Component Matrix即主成分載荷表中可以看出,哪一原始指標(biāo)在哪一主成分上載荷絕對值較大,亦即與該主成分I第五,計算主成分得分矩陣(主成分得分)11將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù) 相乘,然后就可以得出主成分函數(shù)的表達式;Z1= F11*zX1+ F12*zX2+ F13*zX3+ F14*zX4乙=F21*zX1+ F22*zX2+ F23*zX3+ F24*zX4?(其中,zXi 為標(biāo)準(zhǔn)化后的數(shù)據(jù))【2然后利用“轉(zhuǎn)換” | “計算變量”,打開“計算變量”對話框,在“目標(biāo)變量”文本框 中輸入“ Z1”,然后在數(shù)字表達式中輸入“0.531* Z (銷售凈利

14、率)+0.594*Z (資產(chǎn)凈利2019年一9月精心整理率)+0.261*Z (凈資產(chǎn)收益率)+0.546*Z (銷售毛利率)”注:Fi=0.531,0.594,0.261,0.546,即可得到特征向量 Z;【3同理注:F2=-0.412 , 0.404 , 0.720 , -0.383 ,可得到特征向量 乙;【4】求出16家上市公司的主成分值。所做工作:a.對原始數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù); 所的結(jié)論:1.用于計算主成分表達式系數(shù)的初始因子載荷矩陣中每個指標(biāo)的載荷。 注意:1.特征向量矩陣載荷的用運Zl= F 11*ZXl+ F 12*ZX2+ F 13*ZX3+ Fi4*zX4Z2=

15、 F2i*zXi+ F22*zX2+ F 23*zX3+ F?4*zX4?(其中,zXi 為標(biāo)準(zhǔn)化后的數(shù)據(jù))第六,最后利用主成分函數(shù)、綜合主成分公式:【1】將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,然后就可以得出主成分表達式;Z=ri*Zi+r2*Z2【2然后利用“轉(zhuǎn)換” | “計算變量”,打開“計算變量”對話框,在“目標(biāo)變量”文本框 中輸入“Z”,然后在數(shù)字表達式中輸入“ ri*Zi+2*Z2” 注:r 1=0.47429,2=0.3874,即可得到綜 合主成分;【3】綜合主成分(贏利能力)值。 所做工作:a.對原始數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù); 所的結(jié)論:1.用于計算主成分表達式系數(shù)的初始因子載荷矩陣中每個指標(biāo)的載荷。 注意:1.綜合主成分得分的計算方法Z=ri*Zi+r2*Z2 (Z:綜合主成分得分;ri:主成分貢獻率;Z:主成分i得分)表5.主成分、綜合主成分(贏利能力)值公司Z1Z2Z煙臺萬華1.211.461.14五糧液1.161.461.12雅戈爾1.031

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論