SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第1頁
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第2頁
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第3頁
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第4頁
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

SPSS軟件進(jìn)行主成分分

析的應(yīng)用例子集團(tuán)標(biāo)準(zhǔn)化小組:[VVOPPT-JOPP28-JPPTL98-LOPPNN]SPSS軟件進(jìn)行主成分分析的應(yīng)用例子2002年16家上市公司4項(xiàng)指標(biāo)的數(shù)據(jù)[5]見表2,定量綜合贏利能力分析如下表22002年16家上市公司4項(xiàng)指標(biāo)的數(shù)據(jù)公司銷售凈利率(X)資產(chǎn)凈利率(X)凈資產(chǎn)收益率(X)銷售毛利率(X)歌華有線143.3127.3938.73454.89五糧液?17.1112.1317.2944.25用友軟件21.116.037.0089.37太太藥業(yè)29.558.6210.1373浙江陽光11.008.4111.8325.22煙臺(tái)萬華17.6313.8615.4136.44方正科技2.734.2217.169.96紅河光明29.115.446.0956.26貴州茅臺(tái)20.299.4812.9782.23中鐵二局3.994.649.3513.04紅星發(fā)展22.6511.1314.350.51伊利股份4.437.3014.3629.04青島海爾5.408.9012.5365.5湖北宜化7.062.795.2419.79雅戈?duì)枺?9.8210.5318.5542.04福建南紙7.262.996.9922.721.主成分分析的做法第一,將EXCEL中的原始數(shù)據(jù)導(dǎo)入到SPSS軟件中;注意:導(dǎo)入Spss的數(shù)據(jù)不能出現(xiàn)空缺的現(xiàn)象,如出現(xiàn)可用0補(bǔ)齊。第二,對四個(gè)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理;【1】“分析”|“描述統(tǒng)計(jì)”|“描述”?!?】彈出“描述統(tǒng)計(jì)”對話框,首先將準(zhǔn)備標(biāo)準(zhǔn)化的變量移入變量組中,此時(shí),最重要的一步就是勾選“將標(biāo)準(zhǔn)化得分另存為變量”,最后點(diǎn)擊確定。【3】返回SPSS的“數(shù)據(jù)視圖”,此時(shí)就可以看到新增了標(biāo)準(zhǔn)化后數(shù)據(jù)的字段。所做工作:a.原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理數(shù)據(jù)標(biāo)準(zhǔn)化主要功能就是消除變量間的量綱關(guān)系,從而使數(shù)據(jù)具有可比性,可以舉個(gè)簡單的例子,一個(gè)百分制的變量與一個(gè)5分值的變量在一起怎么比較?只有通過數(shù)據(jù)標(biāo)準(zhǔn)化,都把它們標(biāo)準(zhǔn)到同一個(gè)標(biāo)準(zhǔn)時(shí)才具有可比性,一般標(biāo)準(zhǔn)化采用的是Z標(biāo)準(zhǔn)化,即均值為0,方差為1,當(dāng)然也有其他標(biāo)準(zhǔn)化,比如0--1標(biāo)準(zhǔn)化等等,可根據(jù)自己的研究目的進(jìn)行選擇,這里介紹怎么進(jìn)行數(shù)據(jù)的Z標(biāo)準(zhǔn)化。所的結(jié)論:標(biāo)準(zhǔn)化后的所有指標(biāo)數(shù)據(jù)。注意:SPSS在調(diào)用FactorAnalyze過程進(jìn)行分析時(shí),SPSS會(huì)自動(dòng)對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理所以在得到計(jì)算結(jié)果后的變量都是指經(jīng)過標(biāo)準(zhǔn)化處理后的變量但SPSS并不直接給出標(biāo)準(zhǔn)化后的數(shù)據(jù),如需要得到標(biāo)準(zhǔn)化數(shù)據(jù),則需調(diào)用Descriptives過程進(jìn)行計(jì)算。第三,并把標(biāo)準(zhǔn)化后的數(shù)據(jù)保存在數(shù)據(jù)編輯窗口中然后利用SPSS的factor過程對數(shù)據(jù)進(jìn)行因子分析(指標(biāo)之間的相關(guān)性判定略)?!?】“分析”|“降維”|“因子分析”選項(xiàng)卡,將要進(jìn)行分析的變量選入“變量”列表;【2】設(shè)置“描述”,勾選“原始分析結(jié)果”和“KMO與Bartlett球形度檢驗(yàn)”復(fù)選框;【3】設(shè)置“抽取”,勾選“碎石圖”復(fù)選框;【4】設(shè)置“旋轉(zhuǎn)”,勾選“最大方差法”復(fù)選框;【5】設(shè)置“得分”,勾選“保存為變量”和“因子得分系數(shù)”復(fù)選框;【6】查看分析結(jié)果。所做工作:查看KMO和Bartlett的檢驗(yàn)KMO值接近1.KMO值越接近于1,意味著變量間的相關(guān)性越強(qiáng),原有變量越適合作因子分析;Bartiett球度度檢驗(yàn)的Sig值越小于顯著水平0.05,越說明變量之間存在相關(guān)關(guān)系。所的結(jié)論:符合因子分析的條件,可以進(jìn)行因子分析,并進(jìn)一步完成主成分分析。注意:KMO(Kaiser-Meyer-Olkin)KMO統(tǒng)計(jì)量是取值在0和1之間。當(dāng)所有變量間的簡單相關(guān)系數(shù)平方和遠(yuǎn)遠(yuǎn)大于偏相關(guān)系數(shù)平方和時(shí),KMO值接近KMO值越接近于1,意味著變量間的相關(guān)性越強(qiáng),原有變量越適合作因子分析;當(dāng)所有變量間的簡單相關(guān)系數(shù)平方和接近0時(shí),KMO值接近0.KMO值越接近于0,意味著變量間的相關(guān)性越弱,原有變量越不適合作因子分析。Kaiser給出了常用的kmo度量標(biāo)準(zhǔn):0.9以上表示非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合;0.5以下表示極不適合。Bartiett球度檢驗(yàn):巴特利特球度檢驗(yàn)的統(tǒng)計(jì)量是根據(jù)相關(guān)系數(shù)矩陣的行列式得到的,如果該值較大,且其對應(yīng)的相伴概率值小于用戶心中的顯著性水平,那么應(yīng)該拒絕零假設(shè),認(rèn)為相關(guān)系數(shù)矩陣不可能是單位陣,即原始變量之間存在相關(guān)性,適合于做主成份分析;相反,如果該統(tǒng)計(jì)量比較小,且其相對應(yīng)的相伴概率大于顯著性水平,則不能拒絕零假設(shè),認(rèn)為相關(guān)系數(shù)矩陣可能是單位陣,不宜于做因子分析。Bartiett球度檢驗(yàn)的原假設(shè)為相關(guān)系數(shù)矩陣為單位矩陣,Sig值為0.001小于顯著水平0.05,因此拒絕原假設(shè),說明變量之間存在相關(guān)關(guān)系,適合做因子分析。所做工作:全部解釋方差或者解釋的總方差(TotaiVarianceExplained)初始特征根(InitiaiEigenvalues)大于1,并且累計(jì)百分比達(dá)到80%~85%以上。查看相關(guān)系數(shù)矩陣的特征根及方差貢獻(xiàn)率見表3,由于前2個(gè)主成分貢獻(xiàn)率285%、結(jié)合表4中變量不出現(xiàn)丟失,所以提取的主成分個(gè)數(shù)m=2。所的結(jié)論:初始特征根:入=1.897入=1.55012主成分貢獻(xiàn)率:r=0.47429r=0.3874012注意:主成分的數(shù)目可以根據(jù)相關(guān)系數(shù)矩陣的特征根來判定,如前所說,相關(guān)系數(shù)矩陣的特征根剛好等于主成分的方差,而方差是變量數(shù)據(jù)蘊(yùn)涵信息的重要判據(jù)之一。根據(jù)入值決定主成分?jǐn)?shù)目的準(zhǔn)則有三:只取入>1的特征根對應(yīng)的主成分從TotalVarianceExplained表中可見,第一、第二和第三個(gè)主成分對應(yīng)的入值都大于1,這意味著這三個(gè)主成分得分的方差都大于1。本例正是根據(jù)這條準(zhǔn)則提取主成分的。累計(jì)百分比達(dá)到80%~85%以上的入值對應(yīng)的主成分在TotaiVarianceExplained表可以看出,前三個(gè)主成分對應(yīng)的入值累計(jì)百分比達(dá)到89.584%,這暗示只要選取三個(gè)主成分,信息量就夠了。根據(jù)特征根變化的突變點(diǎn)決定主成分的數(shù)量從特征根分布的折線圖(ScreePiot)上可以看到,第4個(gè)入值是一個(gè)明顯的折點(diǎn),這暗示選取的主成分?jǐn)?shù)目應(yīng)有pW4。那么,究竟是3個(gè)還是4個(gè)呢?根據(jù)前面兩條準(zhǔn)則,選3個(gè)大致合適(但小有問題)。第四,計(jì)算特征向量矩陣(主成分表達(dá)式的系數(shù))【1】將初始因子載荷矩陣中的兩列數(shù)據(jù)輸入(可用復(fù)制粘貼的方法)到數(shù)據(jù)編輯窗口(為變量V1、V2);F=V/SQR(入)—1 11【2】然后利用“轉(zhuǎn)換”|“計(jì)算變量”,打開“計(jì)算變量”對話框,在“目標(biāo)變量”文本框中輸入“F”,然后在數(shù)字表達(dá)式中輸入“V/SQR(入)”[注:入=1.897],即可得到特征向量F;【3】1然后利用“轉(zhuǎn)換”|“計(jì)算變量”,1打開“1計(jì)算變量”1對話框,在“目標(biāo)變量”文本框1中輸入“F”,然后在數(shù)字表達(dá)式中輸入“V/SQR(入)”[注:入=1.550],即可得到特征向量F;22212【4】最后得到特征向量矩陣(主成分表達(dá)式的系數(shù))。所做工作:a.成分矩陣或者初始因子載荷矩陣(ComponentMatrix)初始因子載荷矩陣見上圖,通過初始因子載荷矩陣還不能得出主成分的表達(dá)式,還需要把初始因子載荷矩陣中的每列的系數(shù)(主成分的載荷)除以其相應(yīng)主成分的特征根的平方根后才能得到主成分系數(shù)向量(主成分的得出系數(shù));所的結(jié)論:1?用于計(jì)算主成分表達(dá)式系數(shù)的初始因子載荷矩陣中每個(gè)指標(biāo)的載荷。2?計(jì)算后,得到的主成分表達(dá)式的系數(shù)矩陣。注意:主成分表達(dá)式的系數(shù)提取出來的全部主成分可以基本反映全部指標(biāo)的信息但這些新變量(主成分)的表達(dá)卻不能從輸出窗口中直接得到即:主成分中每個(gè)指標(biāo)所對應(yīng)的系數(shù)不是初始因子載荷矩陣中的對應(yīng)指標(biāo)的載荷,因?yàn)?ComponentMatrix”是指初始因子載荷矩陣,每一個(gè)載荷量表示主成分與對應(yīng)變量的相關(guān)系數(shù)。主成分表達(dá)式系數(shù)的計(jì)算方法初始因子載荷矩陣或主成分載荷矩陣(ComponentMatrix)中的數(shù)據(jù)除以主成分相對應(yīng)的特征根(或特征值)開平方根便得到兩個(gè)主成分中每個(gè)指標(biāo)所對應(yīng)的系數(shù)。F=V/SQR(入)111主成分的指標(biāo)劃分與命名初始因子載荷矩陣或主成分載荷矩陣(ComponentMatrix)中每列表示相應(yīng)主成分與對應(yīng)變量的相關(guān)系數(shù),每個(gè)主成分所反映的原始指標(biāo)各有不同,為進(jìn)一步明確每個(gè)主成分側(cè)重反應(yīng)的具體原始指標(biāo),需要對原始指標(biāo)在每個(gè)主成分上的載荷進(jìn)行比較,其中載荷越大,其對應(yīng)的主成分反映該原始指標(biāo)的信息量越大,反之亦然;如果某一原始指標(biāo)在幾個(gè)主成分的載荷絕對值不相上下,歸類比較含混,導(dǎo)致主成分的原始指標(biāo)劃分不清。說明有必要作進(jìn)一步的因子分析。從ComponentMatrix即主成分載荷表中可以看出,哪一原始指標(biāo)在哪一主成分上載荷絕對值較大,亦即與該主成分的相關(guān)系數(shù)較高【注:相關(guān)分為正負(fù)相關(guān)】。―第五,計(jì)算主成分得分矩陣(主成分得分)【1】將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,然后就可以得出主成分函數(shù)的表達(dá)式;Z=F*zX+F*zX+F*zX+F*zX11 1 12 2 13 3 14 4Z=F*zX+F*zX+F*zX+F*zX??(其中,zX為標(biāo)準(zhǔn)化后的數(shù)據(jù))21 1 22 2 23 3 24 4 i 【2】然后利用“轉(zhuǎn)換”|“計(jì)算變量”,打開“計(jì)算變量”對話框,在“目標(biāo)變量”文本框中輸入“Z",然后在數(shù)字表達(dá)式中輸入“0.531*Z(銷售凈利率)+0.594*Z(資產(chǎn)凈利率)+0.261*Z(凈資產(chǎn)收益率)+0.546*Z(銷售毛利率)”[注:F=0.531,0.594,0.261,0.546],即可得到特征向量Z1; 1【3】同理[注:F=-0.412,0.404,0.720,-0.383],可得到特征向量Z;22【4】求出16家上市公司的主成分值。所做工作:a.對原始數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù);所的結(jié)論:1?用于計(jì)算主成分表達(dá)式系數(shù)的初始因子載荷矩陣中每個(gè)指標(biāo)的載荷。注意:1.特征向量矩陣載荷的用運(yùn)Z=F*zX+F*zX+F*zX+F*zX1 11 1 12 2 13 3 14 4Z=F*zX+F*zX+F*zX+F*zX??(其中,zX為標(biāo)準(zhǔn)化后的數(shù)據(jù))第六,最1后利用2主成分2函數(shù)、綜合主成分公式:【1】將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,然后就可以得出主成分表達(dá)式;Z=r*Z+r*Z 1 1 2 2 【2】然后利用“轉(zhuǎn)換”|“計(jì)算變量”,打開“計(jì)算變量”對話框,在“目標(biāo)變量”文本框中輸入“Z”,然后在數(shù)字表達(dá)式中輸入“r*Z+r*Z”[注:r=0.47429,r=0.3874],即可得到112212綜合主成分;【3】綜合主成分(贏利能力)值。所做工作:a.對原始數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù);所的結(jié)論:1/r/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論