第13成分和因子分析_第1頁
第13成分和因子分析_第2頁
第13成分和因子分析_第3頁
第13成分和因子分析_第4頁
第13成分和因子分析_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第十三章 主成分分析和因子分析1在建立多元回歸模型時,為了更準(zhǔn)確地反映事物的特征,人們經(jīng)常會在模型中包含較多相關(guān)解釋變量,這不僅使得問題分析變得復(fù)雜,而且變量之間可能存在多重共線性,使得數(shù)據(jù)提供的信息發(fā)生重疊,甚至?xí)⑹挛锏恼嬲卣鳌榱私鉀Q這些問題,需要采用降維的思想,將所有指標(biāo)的信息通過少數(shù)幾個指標(biāo)來反映,在低維空間將信息分解為互不相關(guān)的部分以獲得更有意義的解釋。本章介紹的主成分分析和因子分析可用于解決這類問題。主成分分析(principal

components

analysis,簡稱PCA)是由霍特林(Hotelling)于1933年首先提出的。它通過投影的方法,實現(xiàn)數(shù)據(jù)的降維,在損失較少數(shù)據(jù)信息的基礎(chǔ)上把多個指標(biāo)轉(zhuǎn)化為幾個有代表意義的綜合指標(biāo)。213.1

主成分分析13.1.1

主成分分析的基本思想3假如對某一問題的研究涉及p

個指標(biāo),記為X1,X2,…,

Xp,由這p

個隨機變量構(gòu)成的隨機向量為X=(X1,X2,…,Xp)¢,設(shè)X

的均值向量為m,協(xié)方差矩陣為S。設(shè)Y=(Y1,Y2

,…,Yp)¢為對X

進行線性變換得到的合成隨機向量,即(13.1.1)(13.1.2)

pp

pXY

=

Y2

Y1

aaa

2

p

X

2

a1

p

X

1

a11

a12a

21

a

22

p

p1

a

p

2Y

=

AX設(shè)ai=(ai1,

ai2

,

…,

aip)¢,(

i

=

1

,2

,,

p

),

A=(a1

,

a2

,…,ap)¢,則有且4i=1

,

2

,,

pi,

j

=1

,

2

,,

p(13.1.3)var(Yi

)

=

αi

Σαicov(Yi

,Yj

)

=

αi¢Σα

j由式(13.1.1)和式(13.1.2)可以看出,可以對原始變量進行任意的線性變換,不同線性變換得到的合成變量Y的統(tǒng)計特征顯然是不一樣的。每個Yi

應(yīng)盡可能多地反映p個原始變量的信息,通常用方差來度量“信息”,Yi

的方差越大表示它所包含的信息越多。由式(13.1.3)可以看出將系數(shù)向量ai擴大任意倍數(shù)會使Yi

的方差無限增大,為了消除這種不確定性,增加約束條件:ai

ai

=

1為了有效地反映原始變量的信息,Y的不同分量包含的信息不應(yīng)重疊。綜上所述,式(13.1.1)的線性變換需要滿足下面的約束:5(2)

Y1在滿足約束(1)

即的情況下,方差最大;Y2是在滿

足約束(1),且與Y1不相關(guān)的條件下,其方差達到最大;……;Yp是在滿足約束(1),且與Y1,Y2,…,Y

p-1不相關(guān)的條件下,在各種線性組合中方差達到最大者。滿足上述約束得到的合成變量Y1,Y2,…,Yp分別稱為原始變量的第一主成分、第二主成分、…、第p

主成分,而且各

成分方差在總方差中占的比重依次遞減。在實際研究工作中,僅挑選前幾個方差較大的主成分,以達到簡化系統(tǒng)結(jié)構(gòu)的目

的。i1

i

2

ip(1)

ai

ai

=

1,即

a

2

+

a

2

+

+

a

2

=

1

,i

=1,

2,

…,

p。13.1.2

總體主成分求解及其性質(zhì)613.1.1節(jié)中提到主成分分析的基本思想是考慮合成變量的方差大小及其對原始變量波動(方差)的貢獻大小,而對于原始隨機變量X1,X2,…,Xp,其協(xié)方差矩陣或相關(guān)矩陣正是對各變量離散程度和相關(guān)程度的度量。在實際求解主成分時,一般從原始變量的協(xié)方差矩陣或相關(guān)矩陣的結(jié)構(gòu)分析出發(fā)。7求

X

的線性函數(shù)

使其方差即達到最大,且Xp)¢的協(xié)方差矩陣。設(shè)l1

≥l2

≥…≥lp

≥0

為S

的特征值,e1

,e2

,…,ep為S

矩陣各特征值對應(yīng)的標(biāo)準(zhǔn)正交特征向量,則對于任意的ei

和ej,有(13.1.4)且(13.1.5)11Y

=

a

X1.從協(xié)方差矩陣出發(fā)求解主成分設(shè)a1是任意p·1向量,求解主成份就是在約束條件ai

ai

下=,1var(Y1

)=a1達Σa到1

最大,a

a

,=其1中S

是隨機變量向量X

=(X1,X2,…,i

ii

j1,

i

=

j=

0,

i

?

je¢epΣ

=

li

ei

ei¢

,i=1pei

ei¢=

Ii=1因此8(13.1.6)當(dāng)a1

=e1

時有(13.1.7)p

pa1¢Σa1

=

a1¢(li

ei

ei¢)a1

l1a1¢(ei

ei¢)a1

=

l1a1¢Ia1

=

l1i=1

i=1e1

Σe1

=

e1l1e1

=

l1e1e1

=

l1此時var(Y1

)=a1

Σa1并且達到最大值為l1。同理有var(ei

X

)=lii

?

j

=

1,

2,,

p(13.1.8)cov(ei

X

,

e

j

X

)

=

ei

Σe

j

=

lj

ei

e

j

=

0,由上述推導(dǎo)得9(13.1.9)可見Y1,Y2,…,Yp

即為原始變量的p

個主成份。因此,主成分的求解轉(zhuǎn)變?yōu)榍骕1,X2,…,Xp

協(xié)方差矩陣S

的特征值和特征向量的問題。Y1

=

e1

X

,Y2

=

e2

X

,,Yp

=

e

p

X2.主成份的性質(zhì)性質(zhì)1

Y的協(xié)方差矩陣為對角陣L,即10(13.1.10)即p

l

0

0

l1

var(Y

)

=

Λ

=

性質(zhì)2

設(shè)S=(sij)p×p是隨機變量向量

X

的協(xié)方差矩陣,可得p

pvar(Xi

)

=

var(Yi

)i=1

i=1pp=

lii=1s

iii=1由此可見,主成分分析是把p

個隨機變量的總方差分解為

p

個不相關(guān)隨機變量的方差之和l1

+l2

+…+lP,則總方差中屬于第i個主成分(被第i個主成分所解釋)的比例為(13.1.12)稱為前m個主成分的累積貢獻度,衡量了前m個主成份對原始變量的解釋程度。lil1

+

l2

+

lp稱為第i

個主成分的貢獻度。定義p11mm

p

(13.1.13)lj

lij

=1

i=1性質(zhì)3

記第k個主成分

Yk

與原始變量

Xi

的相關(guān)系數(shù)為r(Yk,Xi),稱為因子載荷,或者因子負(fù)荷量,則有ii12iikcov(Yk

,

Xi

)i

,

k

=1,

2

,,

p(13.1.14)eki==r(Yk

,

Xi

)

=slkvar(Yk

)

var(Xi

)

l

slk

eki3.從相關(guān)矩陣出發(fā)求解主成分在實際應(yīng)用時,為了消除原始變量量綱的影響,通常將數(shù)據(jù)標(biāo)準(zhǔn)化??紤]下面的標(biāo)準(zhǔn)化變化,令(13.1.15)ii13iii,

i

=1,

2,,

pZ

=sX

-

m其中mi,sii

分別表示隨機變量Xi

的期望與方差,則E(Zi

)

=

0, var(Zi

)

=

1(13.1.17)由相關(guān)矩陣求得的主成分仍然滿足性質(zhì)1~3。性質(zhì)3可以進一步表示為:原始變量的相關(guān)矩陣就是原始變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣,因此,由相關(guān)矩陣求主成分的過程與由協(xié)方差矩陣求主成分的過程是一致的。如果仍然采用(λi,ei)表示相關(guān)矩陣R對應(yīng)的特征值和標(biāo)準(zhǔn)正交特征向量,根據(jù)式(13.1.9)有:Y

=

e¢Z

=

e¢(V

1

/

2)-1

(

X

-

μ)i

i

ii

=

1

,

2

,,

pr(Yk

,

Zi

)

=

eki14lk

,

i

,

k

=

1,

2,,

p(13.1.18)13.1.3

樣本的主成分151.樣本統(tǒng)計量在實際工作中,我們通常無法獲得總體的協(xié)方差矩陣S和相關(guān)矩陣R。因此,需要采用樣本數(shù)據(jù)來估計。設(shè)從均值向量為m,協(xié)方差矩陣為S

的p維總體中得到的n個樣本,且樣本數(shù)據(jù)矩陣為(13.1.19)xnp

x

x2

p

21x1p

x11

x12x22

xn1

xn21

2

nx

=

(

x

,

x

,

,

x

)¢=則樣本協(xié)方差矩陣為:(13.1.20)其中:(13.1.21)樣本相關(guān)矩陣為:(13.1.22)nkij p·

p=

(s

)n

-11

kk

=1(

x

-

x

)(x

-

x

)¢S

=jkjijnsxi

=k

=1

kik

=1(xki

-

xi

)(x

-

xn

-1n=

1

1nx i

=

1,

2

,,

px

=

(x1

,

x2

,

xp

)¢ij

pR?

=

(r

)

,ii

jj16ijs

ssijr

=樣本協(xié)方差矩陣S是總體協(xié)方差矩陣S

的無偏估計量,樣本相關(guān)矩陣R?

是總體相關(guān)矩陣R

的估計量。(13.1.23)17而且(13.1.24)(13.1.25)2.樣本主成份及其性質(zhì)由于采用相關(guān)矩陣和協(xié)方差矩陣求解主成分的過程基本一致,因此本節(jié)僅介紹基于樣本相關(guān)矩陣求解主成分的過程。設(shè)樣本相關(guān)矩陣

R?

的特征值為l?

,

l?

,,l?

,且1

2

pl?

?

l?

?

?

l?

?

01

2

p與特征值相對應(yīng)的標(biāo)準(zhǔn)正交特征向量為e?1

,e?2

,,e?p

,根據(jù)式(13.1.17)第i

個樣本主成分可表示為:yi

=

e?i

x

=

e?i1

x1

+

e?i

2

x2

+

+

e?ip

x

pi

=

1

,2

,,

pcov(

yi

,yk

)

=

0i,

i

=

1

,

2

,,

p,

i

?

k,

i,

k

=

1

,

2

,,

pvar(yi

)

=

l?且由式(13.1.16)和性質(zhì)2可得(13.1.26)計貢獻度為另外(13.1.27)p

p

i

iii=1

i=1?l

=

p

=

sk

siil?r(

yk

,

xi

)

=

e?kip

,前m個樣本主成份的累18i則第i個樣本主成分的貢獻度為l?mii

=1l?

/

p3.主成份個數(shù)的確定主成分分析的目的之一是減少變量的個數(shù),但是對于應(yīng)保留多少個主成分沒有確切的回答。通常需要綜合考慮樣本總方差的量、特征值的相對大小以及各成分對現(xiàn)實的闡述。一般所取m

使得累積貢獻率達到85%以上為宜。19按照從大到小的順序進行排列,碎石圖是特征值與相應(yīng)序號i為了確定主成分的合適個數(shù),選擇碎石圖斜率變化較大的拐彎點,通常在此序號之后的特征值取值比較小,則此序號作為主成分的個數(shù)。例如,圖13.1所示的碎石圖在i=2處拐彎,則m選擇2。第三個經(jīng)驗的判斷方法是只保留那些方差大于1的主成分。i另一個比較常用的可視的方法是碎石圖,首先將特征值l?ii的(i,l?)圖形,其中橫軸表示序號,縱軸表示特征值l?

。例13.1

宏觀經(jīng)濟景氣波動的主成分分析本例從一批對景氣變動敏感,有代表的指標(biāo)中篩選出5個反應(yīng)宏觀經(jīng)濟波動的一致指標(biāo)組:工業(yè)增加值增速(iva)、工業(yè)行業(yè)產(chǎn)品銷售收入增速(sr)、固定資產(chǎn)投資增速(if)、發(fā)電量增速(elec)和貨幣供應(yīng)量M1增速(m1),樣本區(qū)間從1998年1月~2006年12月,為了消除季節(jié)性因素和不規(guī)則因素,采用X-12方法進行季節(jié)調(diào)整。常用的方法是美國商務(wù)部采用的計算合成指數(shù)CI的方法。特別的,本例利用主成分分析降維的思想,提取主成分(PCA),并與合成指數(shù)CI的結(jié)果進行比較。2013.3.1

EViews軟件中主成分分析的計算21本節(jié)以例13.1的數(shù)據(jù)為例,介紹EViews軟件中主成分分析的實現(xiàn)過程。首先將所涉及的變量建成一個組(g1),選擇組菜單的View/Principal

Components...,出現(xiàn)如圖13.6所示的窗口。在窗口中有兩個切換鈕:第一個鈕標(biāo)著

Components,第二個鈕標(biāo)著Calculation,控制著組中各序列離差矩陣的計算和估計。默認(rèn)的,EViews完成主成分分析使用普通的(Pearson)相關(guān)矩陣,也可以在這個菜單下重新設(shè)定主成分的計算。1.Components選擇紐Components按鈕用于設(shè)定顯示主成分和保存方差的特征值和特征向量。在Display對話框中可以以表的形式顯示特征值和特征向量,或者按照特征值的大小以線性圖的形式顯示,或者是載荷、得分的散點圖,或者兩個都顯示(biplot)。選擇不同的顯示方式,對話框中其余的內(nèi)容也會發(fā)生相應(yīng)的改變。22圖13.6

主成分估計對話框(1)2324表頭描述了觀測值的樣本區(qū)間、計算離差矩陣的方法以及保留成分的個數(shù)(在這個例子中顯示了所有的5個主成分)。表的第一部分概括了特征值(Value)、相應(yīng)特征值與后一項的差(Difference)、對總方差的累積解釋比例(CumulativeProportion)等等。由于上述結(jié)果的計算采用相關(guān)矩陣,所以5個特征值之和等于5。第一個成分占總方差的72.94%,第二個成分占總方差的19.22%。前兩個成分占總方差的92.16%。表的第二部分描述了線性組合的系數(shù),第一個主成分(標(biāo)為“PC1”)大約等于所有5個一致指標(biāo)的線性組合,它可以解釋為一般的經(jīng)濟景氣指數(shù)。輸出的第三部分表示計算的相關(guān)矩陣。25第1主成分第2主成分第3主成分第4主成分第5主成分特征向量固定資產(chǎn)投資增速(if)0.449-0.3670.6960.2000.374工業(yè)增加值增速(iva)0.510-0.153-0.0780.312-0.783貨幣供應(yīng)量增速(m1r)0.2040.9130.2850.2080.009產(chǎn)品銷售收入增速(sr)0.4900.023-0.6540.2930.496發(fā)電量增速(elec)0.5080.088-0.020-0.857-0.026特征值3.6030.9880.2700.0870.051貢獻率0.7210.1970.0540.0180.01累積貢獻率0.7210.9180.9720.9901.00026表13.1

一致指標(biāo)組的主成分分析結(jié)果由表13.1可以看出,第1主成分的貢獻率為72.1%,已能較好地反映5個一致指標(biāo)的總體變動情況,而且根據(jù)它們的特征值可以發(fā)現(xiàn)第2個特征值開始明顯變小(小于1),碎石圖出現(xiàn)明顯的拐彎,同時為了討論方便,僅選擇m=1,提取第一個主成分反映經(jīng)濟變動。表13.1中已經(jīng)給出對應(yīng)的特征向量,根據(jù)式(13.1.23)可以得到對應(yīng)的主成分序列。27如果在主對話框的Display部分選擇Eigenvaluesplots,則顯示按順序排列的特征值的線性圖(碎石圖)。在對話框的下面將發(fā)生改變,可以選擇顯示特征值(碎石圖)、特征值的差、方差累積貢獻率其中之一,或是全部。如圖13.7所示可以選擇任意的復(fù)選框。默認(rèn)的EViews僅顯示特征值排序的碎石圖。圖13.7

主成分估計對話框(2)282930圖13.8

主成分估計對話框(3)變量載荷圖(Variableloadingsplot)給出對應(yīng)主成分的變量載荷系數(shù),從圖中可以看出如何根據(jù)原始變量合成新的主成分;成分得分圖(Component

scoresplot)顯示對應(yīng)于樣本區(qū)間內(nèi)的觀測值成分的得分值;

biplot

(Biplots

(scores

&

loadings))則表示在一個圖中同時顯示載荷系數(shù)和得分值。3132圖13.10計算得分序列的設(shè)置對話框2.

Calculation選擇鈕在Type下拉菜單中選擇使用相關(guān)(Correlation)還是協(xié)方差(Covariance)矩陣。在Method下拉菜單中選擇計算方法:Ordinary,Ordinary

(uncentered),Spearman

rank-order

or

Kendall’s

tau-a,or

Kendall’s

tau-b。在該對話框中,還可以設(shè)定計算使用的觀測值樣本。33圖13.9

保存得分序列的對話框3.保存得分序列如果想保存主成分得分序列,直接從組(Group)菜單中選擇Proc/Make

Principal

Components...,則出現(xiàn)圖

13.9所示的對話框。34第一個選項是Scaling,用于選擇得分序列和載荷計算的權(quán)重。有4個選項:Normalize

loadings,Normalize

scores,Symmetric

weights和User

loading

weight,默認(rèn)的Normalizeloadings,表示標(biāo)準(zhǔn)化載荷,使得所有觀測值得分對特征值

有標(biāo)準(zhǔn)的比例;選擇Normalizescores,所有變量標(biāo)準(zhǔn)化為1;選擇Symmetric

weights,將會有對稱的權(quán)重;選擇Userloading

weight,可以用戶自己定義權(quán)重。然后需要輸入得分序列的名稱,在例13.1中,我們輸入第一主成分的名字“PAC1”,用于保存第一個主成分。也可以根據(jù)需要保存對應(yīng)得分的載荷、特征值和特征向量。35圖13.2中的實線給出了由主成分分析的第一主成分表示的一致景氣指數(shù)(PCA),虛線給出的是由國際上常用的美國商務(wù)部計算合成指數(shù)的方法給出的一致合成指數(shù)(CI),可以發(fā)現(xiàn)二者的變化趨勢和轉(zhuǎn)折點幾乎完全相同,只是波動的幅度略有差異。進一步表明:PCA指數(shù)不僅能夠反映景氣波動的變化趨勢和峰谷的轉(zhuǎn)折點,而且還能反映波動的幅度。圖13.2

第一主成分(PCA,左坐標(biāo)),一致合成指數(shù)(CI,右坐標(biāo))13.2

因子分析36因子分析(factoranalysis,簡稱FA)是主成分分析的推廣,相對于主成分分析,因子分析更側(cè)重于解釋被觀測變量之間的相關(guān)關(guān)系或協(xié)方差之間的結(jié)構(gòu)。因子分析的思想源于1904年查爾斯·斯皮爾曼(CharlesSpearman)對學(xué)生考試成績的研究。研究多指標(biāo)問題時常常會發(fā)現(xiàn),這些指標(biāo)相關(guān)性形成的背景原因是各種各樣的,其中共同的原因稱為公共因子;每一個變量也含有其特定的原因,成為特定(特殊)因子。因子分析的實質(zhì)就是用幾個潛在的但不能觀察的互不相關(guān)的隨機變量去描述許多變量之間的相關(guān)關(guān)系(或者協(xié)方差關(guān)系),這些隨機變量被稱為因子。為了使得這些因子能很好的替代原始數(shù)據(jù),需要對這些因子給出合理的解釋。同時為了使用這些因子,還需要對提取結(jié)果進行評價。因此,可以簡單將因子分析的目標(biāo)概括為以下幾方面:首先考慮是否存在較少的不相關(guān)的隨機變量可用于描述原始變量之間的關(guān)系;如果存在公共因子,那么究竟應(yīng)該選擇幾個;對提取的公共因子的含義進行解釋;評價每一個原始變量與公共因子之間的關(guān)系;可以將這些公共因子用于其他的統(tǒng)計分析。本節(jié)將從這幾個角度給出詳細(xì)的介紹。需要注意的是因子分析從一系列高度相關(guān)的原始變量矩陣X=(X1,X2

,…,Xp)¢中提取少數(shù)幾個不相關(guān)的因子,所以如果原始變量之間不相關(guān)則沒有必要進行因子分析。在實際研究和應(yīng)用中,為了消除觀察值之間由于量綱的差異而造成的影響,需要將觀測值按照式(13.1.15)進行標(biāo)準(zhǔn)化處理。本節(jié)的討論都是基于標(biāo)準(zhǔn)化后的序列,為了方便,把標(biāo)準(zhǔn)化后的隨機變量矩陣仍記為Z=(Z1,Z

2,…,Zp)¢。3713.2.1

基本的因子分析模型38假如對某一問題的研究涉及p個指標(biāo),且這p個指標(biāo)之間存在較強的相關(guān)性,則基本的因子模型可以表示為(13.2.1)Z

p

=

l

p1

F1

+

l

p

2

F2

++

l

pm

Fm

+

ep稱式(13.2.1)中F1,

F2,

…,

Fm為公共因子,e1,

e2,…,

ep

表示特殊因子,其中包含了隨機誤差,

ei

只與第

i個變量

Zi

有關(guān),

lij

稱為第

i個變量

Zi

在第

j個因子

Fj

上的載荷(因子載荷),由其構(gòu)成的矩陣

L

稱為因子載荷矩陣。Z1

=

l11

F1

+

l12

F2

++

l1m

Fm

+

e1Z

2

=

l21

F1

+

l22

F2

++

l2m

Fm

+

e2

式(13.2.1)進一步可以表示為下面的矩陣形式39(13.2.2)其中,F(xiàn)

=(F1,F2

,…,Fm)¢;e=(e1,e2

,…,ep)¢。注意式(13.2.1)中的F1,F2

,…,Fm

是不可觀測的隨機變量,因此,必須對隨機變量F和e做一些假定,使得模型具有特定的且能驗證的協(xié)方差結(jié)構(gòu)。Z

=

LF

+

ε假設(shè)40(13.2.3)(13.2.4)且F

與e獨立,即(13.2.5)滿足式(13.2.3)~式(13.2.5)假定的模型(13.2.1)(或(13.2.2))稱為正交因子模型。cov(F

,

F

)

=

E(FF

)

=

IE(F

)

=

0,p

y

0y

1

0

0

y

2

00cov(ε,

ε)

=

E(εε¢)

=

Ψ

=

0E(ε)

=

0,cov(ε,

F

)

=

E(εF

)

=

013.2.2

正交因子模型的性質(zhì)411.正交因子模型的協(xié)方差結(jié)構(gòu)假定隨機變量Z的協(xié)方差矩陣為Σ,則有Σ

=

cov(Z

,

Z

)

=

E(ZZ

)

=

E[(LF

+

ε)(LF

+

ε)

]=

E[(LF

+

ε)((LF

)¢+

ε¢)]

=

E[(LF

(LF

)¢+

ε(LF

)¢+

LFε¢+

εε¢)]=

LE(FF

¢)L¢+

E(εF

¢)L¢+

LE(Fε¢)

+

E(εε¢)=

LL¢+Ψ(13.2.6)cov(Z

,

F

)

=

E(ZF

)

=

E[(LF

+

ε)F

]

=

LE(FF

)

+

E(εF

)

=

L(13.2.7)2.因子載荷lij

的意義42由式(13.2.7)可得(13.2.8)mmj

=1由于假定Zi

和Fj都是方差為1的隨機變量,因此lij即為變量Zi

與因子Fj

的相關(guān)系數(shù)。=

cov(lij

Fj

,

Fj

)

+cov(ei

,

Fj

)

=

lijcov(Zi

,

Fj

)

=

cov(lij

Fj

+

ei

,

Fj

)j

=13.共同度與公因子的方差貢獻由式(13.2.6)可得43令則有(13.2.9)其中hi2

反映了公共因子對Zi

方差的貢獻,稱為共性方差,或者變量共同度。yi

稱為特殊方差,或者剩余方差。iimvar(Z

)

=

l

2

+

l

2i

i1

i

2++

l

2

+y2mij

il

=

h2j

=1l

2

+

l

2

++

l

2

=i1

i

2

imvar(Z

)

=

h2

+y

=1i

i

i式(13.2.9)表明,hi2接近1時,yi接近0,說明Zi

包含的幾乎全部信息都可以被公因子解釋;當(dāng)hi2

接近0時,表明公共因子對的影響不大,主要由特殊因子描述。因此,

hi2

也反映了變量Zi

對公共因子的依賴程度。與此類似,矩陣L

的第j列元素反映了第j個因子Fj

對所有變量Z的影響,記為44(13.2.10)=pjli=1稱為公共因子Fj

對原始變量向量Z

的方差貢獻,是衡量公共因子相對重要性的一個尺度,其值越大反映Fj

對原始變量向量Z

的方差貢獻也越大。2ijg

213.2.3

因子載荷的估計方法45因子分析的首要步驟是先確定因子載荷,或估計得到因子載荷矩陣L,注意在式(13.2.1)和式(13.2.2)中的

F1,F2,…,Fm是不可觀測的隨機變量,因此因子載荷矩陣

L的估計方法都比較復(fù)雜,常用的方法有極大似然法、主成分法、迭代主成分方法、最小二乘法、a

因子提取法等。1.極大似然法如果假設(shè)公共因子F

和特殊因子ε

服從正態(tài)分布,即

F~

Nm(0,I),e~

Np(0,Y

),X1,X2,…,Xp

的均值為m

=(m1,m2,…,mp),則觀測值X1,X2,…,Xp

為來自正態(tài)總體Np(m,S)的樣本,可以采用極大似然法估計因子載荷矩陣和特殊方差,似然函數(shù)是m

和S

的函數(shù)L(m

,S

)。46,因此似然函數(shù)可以更清楚地表示(13.2.11)由于

Σ

=

LL

+Ψ為L(m

,L,Y

),記(m

,L,Y

)的估計量為(μ?

,L?

,Ψ?

),則有L(

μ?

,

L?,Ψ?

)

=

max

L(

μ

,

L,Ψ

)2.主成分方法用主成分法確定因子載荷,就是對隨機變量進行主成分分析,把前面幾個主成分作為原始公共因子。其具體過程如下,設(shè)有p

個變量Z=(Z1,Z2

,…,Zp)¢,可以求得從大到小排序的p個主成分Y1,Y2,…,Yp,根據(jù)13.1節(jié)的內(nèi)容可知,原始變量與主成分之間存在如下的關(guān)系:47

ppppZY

=

Y2

Y1

aaa

2

p

Z

2

(13.2.13)a1

p

Z1

a11

a12a

21

a

22

p1

a

p

2由于A=(a1,a,…,ap)¢=(e1,e2,…,ep)¢為正交矩陣,則有48(13.2.14)(13.2.15)式(13.2.15)與式(13.2.1)的形式一致,Yi表示主成分,因此相互獨立。Z

=

AYZ

p

Z=

a

Y

+

a

Y

+

+

a

Y

+

e=

a1

pY1

+

a

2

pY2

+

+

ampYm

+

ep2

2

12

1

22

2

m2

m如果在式(13.2.13)中僅取前m個主成分,把其余的p-m個主成分用特殊因子ei

代替,則式(13.2.13)可以表示為

Z1

=

a11Y1

+

a

21Y2

+

+

am1Ym

+

e1為了使Yi

符合式(13.2.3)假設(shè)的公共因子,需要將主成分Yi

的方差轉(zhuǎn)變?yōu)?。由13.1節(jié)的介紹可知,主成分方差為特征根li,只需要將Yi

除以標(biāo)準(zhǔn)差(13.2.16)(13.2.17)式(13.2.15)已與式(13.2.1)不僅在形式上一致,而且完全符合式(13.2.3)~式(13.2.5)的假設(shè)。由此就得到因子載荷矩陣和一組初始公共因子。il即可,令Fi

=

Yi

/

li,

lij49li

a

ji=Z

p

Z=

l

F

+

l

F

+

+

l

F

+

e=

l

p1

F1

+

l

p

2

F2

+

+

l

pm

Fm

+

ep21

1

22

2

2m

m

2

2則式(13.2.15)轉(zhuǎn)變?yōu)椋?/p>

Z1

=

l11

F1

+

l12

F2

+

+

l1m

Fm

+

e1503.迭代主成分方法(Iterated

Principal

Factors)迭代主成分方法也叫主因子法,或主軸因子方法,是對主成分法的一種修正。首先對原始變量進行標(biāo)準(zhǔn)化處理,其相關(guān)矩陣與協(xié)方差矩陣一致,使其因子模型滿足式(13.2.1),根據(jù)式(13.2.6)有(13.2.18)令(13.2.19)(13.2.20)Σ

=

R

=

LL

+ΨR*

=

R

=

LL12121*2p2

p1

p2

p1

p

rh*2

r

h*2r

h

2

r

r

rR?

*

=

R?

*

=

稱R*為調(diào)整相關(guān)矩陣,或約相關(guān)矩陣。不妨設(shè)特殊因子ei

的方差的初始估計為yi*,則有hi*2

=1-yi*

,且相應(yīng)的樣本相關(guān)矩陣為R?

,則對應(yīng)的約相關(guān)矩陣為設(shè)*

*1

2

m個特征值依次為l

≥l

≥…≥l

*

≥0,相應(yīng)*

*

*的正交單位特征向量為e1

,

e2

,…,

em

,則對應(yīng)的因子載荷矩陣L

的解為(13.2.21)根據(jù)式(13.2.21)和式(13.2.18),可以進一步得到特殊因子方差的最終估計量為,

(13.2.22)如果希望得到擬合程度更好的解,則可以采用迭代的方法,即利用式(13.2.22)得到的特殊因子方差估計量帶入式(13.2.20)重復(fù)上述步驟,直到所求解比較穩(wěn)定為止。*的前m?R*

*51*

*?1

1

2

2

m

mL

=

(

l

e

)l

e

,

l*

e*

,,m

ijiilj

=122?=

1

-?=

1

-

hy?i

=

1

,

2

,,

p下面介紹幾種求特殊因子方差和公共因子方差初始估計的幾種常用方法:(1)復(fù)合相關(guān)系數(shù)(squared

multiple

correlations,簡稱SMC)方法ii它表示Xi

與其他p-1

個解釋變量之間的復(fù)相關(guān)系數(shù)。(2)最大相關(guān)系數(shù)方法(max

absolute

correlation)最大相關(guān)系數(shù)方法是用第i

個變量Xi

與其他變量相關(guān)系ij,其中

r

表示第i個變量Xi

與第j

個變量Xj

的相關(guān)系數(shù)。i*

ii=1/r

,其中rSMC是比較常用的一種方法,令y是R?

-1

的第i個對角元素,此時公共因子方差的估計值為i

ih?2=

1

-y

*

=

1

-1/

r

iii52數(shù)絕對值的最大值來估計,即令h=

max

i?

j

rij?2對角線比例方法(fraction

of

diagonals)該方法使用相關(guān)矩陣(或協(xié)方差矩陣)對角線元素的固定比例a。特殊的可以取a

=1,此時結(jié)果等同于主成分求解得到的結(jié)果。分塊的協(xié)方差矩陣估計方法(partitionedcovariance,簡稱PACE)由于第3種方法PACE的估計量是非迭代的,因此,比較適合為迭代估計方法提供初值。53i*,則y

=0,此時得到的也是(5)特殊的直接取一個主成分解。*2=1ihL?13.2.4

因子數(shù)目的確定方法及檢驗上述求解過程中重要的是如何確定公因子數(shù)目m,這是因子分析中最重要的一步。本小節(jié)將列出其中幾種常用的方法1.因子數(shù)目的確定方法(1)

最小特征值(Kaiser-Guttman

Minimum

Eigenvalue)Kaiser-Guttman規(guī)則也叫做“特征值大于1”方法,是最常用的一種方法。只需要計算離差矩陣(相關(guān)矩陣、協(xié)方

差矩陣)的特征值,特征值超過平均值的個數(shù)作為因子個數(shù)。特別地,對于相關(guān)矩陣,特征值的均值為1,所以通常取特

征值大于1的數(shù)作為公因子數(shù)。54總方差比例(Fraction

of

Total

Variance)選擇公因子個數(shù)m使得前m個特征值的和超過公因子總方差的某一門限值。這種方法多用于主成分分析方法,比較典型的是這些成分構(gòu)成總方差的95%(Jackson,

1993)。MAP方法(Minimum

Average

Partial)Velicer

(1976)

提出的最小平均偏相關(guān)(簡稱MAP)方法原理是:給定m個成分(m=0,1,…,p-1),計算偏相關(guān)系數(shù)平方的平均值,應(yīng)保留因子的個數(shù)是使得平均值最小化的個數(shù)55分割線段(Broken

Stick)分割線段模型的基本原理是:首先,計算離差矩陣中第j個最大特征值對方差的貢獻度,然后計算從分割線段分布得到的相應(yīng)的期望值。當(dāng)前者超過后者時,所對應(yīng)的j即為應(yīng)該保留的因子個數(shù)(Jackson,1993)。平行分析(Parallel

Analysis)平行分析模擬使用的數(shù)據(jù)與原始數(shù)據(jù)有著相同方差和

觀測值個數(shù),是由隨機生成器生成的獨立隨機變量數(shù)據(jù)集。計算模擬數(shù)據(jù)的Pearson協(xié)方差和相關(guān)矩陣及其特征值。只要原始數(shù)據(jù)的特征值超過模擬數(shù)據(jù)的對應(yīng)值,相應(yīng)的個數(shù)

將作為保留因子數(shù)562.公共因子個數(shù)的大樣本檢驗57采用極大似然估計模型時,假設(shè)公共因子和特殊因子均服從正態(tài)分布,而正態(tài)分布的假定,可以幫助我們構(gòu)造模型充分性的檢驗。設(shè)提取m個公共因子的模型成立,則檢驗m個公共因子的充分性等價于檢驗(13.2.27)對應(yīng)的備擇假設(shè)H1

為Σ

是任意其他的正定矩陣。H

0

:

Σ

=

LL

+Ψ(13.2.28)的極大似然估計量。式(13.2.28)的統(tǒng)計量服從c2分布。特別的,Bartlett在1954年證明了-2lnL抽樣分布的c

2近似可以用多重因子(n-1-(2p+4m+5)/6)代替式(13.2.28)中的n。58

S

n

在原假設(shè)成立的條件下可以構(gòu)造下面的似然比統(tǒng)計量

Σ?

-

2

ln

L

=

n

ln

其中

Sn

表示協(xié)方差矩陣的極大似然估計;Σ?

=

L?L?

+Ψ?

,其中

L?

Ψ?

分別表示

L

y

的極大似然估計量,而Σ?

=L?L?

+Ψ?

是Σ

=

LL

+Ψ利用Bartlett修正,只要n和n-p大,若(13.2.29)則在顯著性水平a

下拒絕原假設(shè)H0,認(rèn)為m個因子是不充分的。式(13.2.29)表示的c2統(tǒng)計量也稱為Bartlettc2統(tǒng)計量。由于式(13.2.29)中的自由度必須大于0,進一步化簡可以得到(13.2.30)在選擇m

時,必須根據(jù)上述方法進行判斷模型的充分性。n

(n

-1

-

(2

p

+

4m

+

5)

/

6)

ln>

c

2

((

p

-

m)2

-

p

-

m)

/

2S

L?L?¢+Ψ?

m

<

1

(2

p

+1

-

8

p

+1)259例13.2

紐約股票交易所股票收益率的因子分析(1)曾有學(xué)者研究了紐約票股交易所的5只股票(阿萊德化學(xué)(allied)、杜邦(dupont)、聯(lián)合碳化物(union)、埃克森(exxon)和德士古(texaco))從1975年1月到1976年12月期間周回報率之間的關(guān)系(數(shù)據(jù)見本章附錄)。周回報率定義為(本周五收盤價-上周五收盤價)/上周五收盤價,如有拆股或支付股息時進行相應(yīng)調(diào)整。連續(xù)100周的觀測值表現(xiàn)出獨立同分布,但是各股之間的回報率受總體經(jīng)濟狀況的影響,也存在相關(guān)關(guān)系。表13.2給出各指標(biāo)的相關(guān)矩陣。60表13.2

各指標(biāo)的相關(guān)矩陣61allieddupontunionexxontexacoallied1.000.580.510.390.46dupont0.581.000.600.390.32union0.510.601.000.440.43exxon0.390.390.441.000.52texaco0.460.320.430.521.00從表13.2可以看出各股收益率之間存在一定的相關(guān)性,本例采用因子分析計算其因子載荷矩陣、公共方差、剩余

方差以及相應(yīng)的貢獻度。13.3.2

因子分析的實現(xiàn)EViews中因子分析的實現(xiàn)是通過因子對象完成

的。從工作文件的窗口選擇Object/NewObject,選

中Factor;或者選中相應(yīng)的序列,單擊右鍵,選擇

Open/as

Factor...;或者打開一個已經(jīng)存在的組對象,選擇Proc/MakeFactor...;或者在命令窗口輸入關(guān)鍵詞factor,都會彈出圖13.12所示的因子分析設(shè)定對話框。從圖中可以看出,因子設(shè)定對話框也包含兩個切換鈕:Data和Estimation。62圖13.1263因子設(shè)定對話框1.Estimation

選擇鈕Estimation標(biāo)簽用于控制主要的估計設(shè)置(圖13.11),其中主要包括估計方法、因子個數(shù)設(shè)定、初始貢獻率以及其他屬性4個方面的設(shè)置。(1)

估計方法(Method)在Method的下拉菜單中,EViews提供了多種估計方法:極大似然估計法、廣義最小二乘法、不加權(quán)最小二乘法、主成分分析法、迭代主成分分析法以及非迭代的分區(qū)協(xié)方差估計方法(PACE)。選擇不同的方法,在右邊的屬性部分將會顯示不同的設(shè)置。64因子數(shù)(Number

of

factors)EViews提供了很多的方法選擇因子數(shù),各種方法的簡要概括可參考13.2.4節(jié)的介紹。默認(rèn)的,EViews使用Velicer的

minimum

average

partial(MAP)方法。實證模擬結(jié)果表明:

MAP和平行分析方法比起其他常用的方法來更精確??梢愿鶕?jù)需要選擇不同的方法,但是頁面也會發(fā)生相應(yīng)的改變。公共方差的初值(Initial

Communalities)大部分估計方法都需要公共方差的原始估計。例如,對主成分估計方法,初始的公共方差是構(gòu)建估計的基礎(chǔ)。在

EViews中可以從Initialcommunalities的下拉菜單中選擇不同的方法。65(4)

估計選項(Opition)估計屬性主要包括對迭代控制、scaling、隨機數(shù)生成器以及Heywood情況的選擇和設(shè)置。選中Scaleestimates

to

matchobservedvariances復(fù)選框,可控制剩余方差和公共方差之和等于離差矩陣的對角元素。在迭代主因子估計的過程中,可能會遇到被估計公因子方差暗含至少一個剩余方差小于等于0,這種情況就是通常所說的Heywood情況。當(dāng)EViews在計算中遇到Heywood情況時,有幾種方法是可選擇的。默認(rèn)的,EViews將停止迭代,并給出最后的估計(Stop

and

report

final),同時指出結(jié)果可能是不適合的;或者EViews報告前一次的迭代結(jié)果(Stop

and

report

last);或者結(jié)果為0,繼續(xù)(Set

to

zero,continue);或者忽略負(fù)的方差,繼續(xù)(Ignore

andcontinue)。662.Data

選擇鈕點擊Data按鈕,出現(xiàn)圖13.13所示的窗口,該窗口分為兩部分——協(xié)方差設(shè)置和協(xié)方差屬性。圖13.13因子分析的數(shù)據(jù)設(shè)定對話框67類型(Type)協(xié)方差設(shè)置的第一項是Type下拉菜單,主要用于確定因子分析是基于協(xié)方差矩陣還是相關(guān)矩陣,或者采用用戶已經(jīng)根據(jù)相關(guān)測量方法定義的矩陣(User-matrix)方法(Method)可以用Method下拉菜單設(shè)定計算相關(guān)矩陣(或協(xié)方差矩陣)的方法:普通Pearson協(xié)方差、非中心協(xié)方差、斯皮爾曼秩協(xié)方差(Spearman

rank-order

covariances)和Kendall’s

tau(肯德爾)相關(guān)測量。68變量(Variables)在該框中應(yīng)列出用于因子分析的序列名稱,或包含這些序列的組名。樣本(Sample)該項主要用于設(shè)定用于分析的觀測值的樣本,同時表明是否希望樣本是均衡的。默認(rèn)的,如果遇到缺失數(shù)據(jù),EViews將刪除相關(guān)變量中的缺失數(shù)據(jù)。69偏相關(guān)或偏協(xié)方差(Partialing)偏相關(guān)和偏協(xié)方差可用于一對變量的分析,只需在相應(yīng)的編輯框中列出變量名稱。偏協(xié)方差或偏相關(guān)的分析不支持因子得分的計算,在這種選擇下要計算因子得分,同樣也需要使用用戶設(shè)定矩陣估計模型。權(quán)重(Weighting)當(dāng)選擇使用加權(quán)方法時,將會提示需要輸入權(quán)重序列的名稱。有5種不同的權(quán)重選擇:頻率、方差、標(biāo)準(zhǔn)偏差、比例方差和比例標(biāo)準(zhǔn)偏差。自由度修正可以選擇使用極大似然估計量或者自由度修正規(guī)則計算協(xié)方差。默認(rèn)的,EViews計算(沒有自由度修正的)ML估計的協(xié)方差。70(8)用戶設(shè)定矩陣如果在Type下拉菜單中選擇User-matrix,對話框?qū)l(fā)生改變。依次輸入矩陣名稱,這個矩陣應(yīng)該是方陣,并且是對稱的,但是對稱不是必須的;然后輸入一個標(biāo)量表示觀測值的數(shù),或者一個矩陣,它包含表示觀測值數(shù)目的一對數(shù);最后,列名(C)主要是為結(jié)果提供標(biāo)簽,如果不填寫此項,變量將以

“V1”,“V2”…的形式顯示,不需要為所有的列提供名字,默認(rèn)地名字將按照提供的順序被替代。7172下面給出例13.2采用主成分方法求解m=2時的結(jié)果,因子個數(shù)設(shè)置為2,其他選項都采用默認(rèn)設(shè)置,其結(jié)果如下:公共方差=1-0.50=0.50。其它相對應(yīng)的公共方差和剩余方差以此類推。從表13.3中可以發(fā)現(xiàn)所有股票都高度依賴于F

1,且載荷都差不多相等,可稱之為市場因子,代表總的經(jīng)濟條件。而在因子F

2上,化學(xué)類股票在此因子上均有負(fù)載荷,石油類股票在此因子上有正的載荷,表明因子F2

將不同行業(yè)股票加以區(qū)分,稱為行業(yè)因子。?2=

0.702

+

(-0.09)2h21

1

1?=

1

-

h=0.50

,剩余方差y?73同時比較極大似然估計和主成分估計的結(jié)果可以發(fā)現(xiàn):同樣在因子

F1上有大的正的載荷,稱為市場因子;而因子F2的結(jié)果與主成分分析載荷的符號正好相反,同樣也是區(qū)分了行業(yè),因此也稱為行業(yè)因子。我們需要進一步通過因子旋轉(zhuǎn)才能發(fā)現(xiàn)有用的因子模式。例13.3

影響我國物價波動多因素的因子分析(1)

隨著我國市場化程度的深化以及經(jīng)濟全球化進程的加快,我國物價的波動不僅反映了國內(nèi)市場中總供給和總需求的矛盾,而且受國際經(jīng)濟的影響,尤其是國際市場價格的影響也越來越大。受國內(nèi)經(jīng)濟波動、居民收入及財富變化、生產(chǎn)成本價格上漲、國際石油、糧食等原材料價格的影響使得我國物價的波動變得極其復(fù)雜。由于物價的波動不是取決于某一種因素,或某幾個指標(biāo),而是受多方面因素的影響,此時簡單的多元回歸分析已經(jīng)無法滿足分析的需要。本例選擇15個經(jīng)濟變量,采用因子分析方法分析各因素對物價波動的影響,樣本區(qū)間為2000年1季度~2008年3季度。采用主成分方法(PrincipalFactors)求解,按照特征根大于1的準(zhǔn)則,選取因子數(shù)目m=4,求解結(jié)果如表13.5。指標(biāo)名稱F1載荷li1F2載荷li2F3載荷li3F4載荷li4剩余方差CPI居民消費價格指數(shù)(CPI)0.84-0.150.39-0.150.09成本因素原材料、燃料、動力購進價格指數(shù)0.79-0.54-0.17-0.140.03工業(yè)品出廠價格指數(shù)0.82-0.51-0.08-0.140.04農(nóng)副產(chǎn)品類購進價格指數(shù)0.76-0.21-0.21-0.010.34商品房銷售價格指數(shù)0.910.12-0.06-0.180.11工業(yè)企業(yè)成本費用利潤率0.870.24-0.180.060.16需求因素全部從業(yè)人員人均報酬增速0.270.370.77-0.130.19城鎮(zhèn)家庭人均可支配收入增速0.610.410.59-0.050.11貨幣因素外匯儲備同比增速0.480.58-0.46-0.230.17貨幣乘數(shù)0.440.44-0.560.310.20M2增速0.220.76-0.19-0.190.30GDP增長率0.830.300.000.400.06國際因素G7工業(yè)品出廠價格指數(shù)0.67-0.560.19-0.130.19G7支出法GDP同比增速0.19-0.50-0.180.620.31股價指數(shù)上證收盤綜合指數(shù)同比增速0.250.200.400.790.12特征值6.352.862.091.58貢獻率(%)42.3319.0813.9210.56累計貢獻率(%)42.3361.4175.3385.89表13.5

影響物價波動多因素的因子分析結(jié)果從表13.5中可以看出:4個公因子對原始變量方差的累計貢獻率為85.89%,可見通過因子分析實現(xiàn)了將15維數(shù)據(jù)變量降至4維的目的。采用表13.5的信息還可以得到各變量對應(yīng)的公共方差和剩余方差,如對于第一個變量,=1-0.91

=0.09。其它變量相對應(yīng)的公共方差和剩余方差以此類推。同時,通過表13.5各公因子的載荷可以看出:代表成本因素的各上游價格指數(shù)在公因子F1上有較高的載荷,可稱為成本因子;而代表居民需求增長的兩個收入變量在公因子F3上有較高的載荷,可稱為需求因子;而表示貨幣因素的3個變量在公因子F2上有較高的載荷,可稱為貨幣因子;而代表財富變化的股票指數(shù)在公因子F4上有較高的載荷,稱為財富因子。但還有一些變量的載荷并不是很明確,我們可以通過因子旋轉(zhuǎn)得到實際意義更加明確的因子模式。?21=

0.842

+

(-0.15)2

+

0.392

+

(-0.15)2

=

0.91h21

1?=

1

-

hy?13.2.5

因子旋轉(zhuǎn)因子分析的目的不僅是求出公共因子,更重要的是知道每個公共因子的實際意義,以便對所研究的問題作出進一步的分析。公共因子是否容易解釋,很大程度上取決于因子載荷矩陣L

的元素結(jié)構(gòu)。假設(shè)因子載荷矩陣L

是基于相關(guān)矩陣得到的,則其所有元素均在-1

到1

之間,如果

L

的所有元素都接近0

或±1,公共因子的含義就容易解釋了,否則公因子含義將含糊不清。77設(shè)L是通過某種方法估計得到的因子載荷矩陣,令78且

(13.2.31)(13.2.32)式(13.2.31)和式(13.2.32)表明因子載荷矩陣是不唯一的,對一任意正交陣T,也是一個因子載荷矩陣。因此,實際中求得一個載荷矩陣之后,可通過右乘正交陣T,使更具有實際意義,這種變換載荷矩陣的方法稱為因子軸旋轉(zhuǎn)。因子的旋轉(zhuǎn)方法有正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)。正交旋轉(zhuǎn)與斜交旋轉(zhuǎn)區(qū)別就在于:正交旋轉(zhuǎn)得到的新公共因子仍然是相互獨立的,但斜交旋轉(zhuǎn)則放寬了這一限制。L*

=

LT

TT

=

=

LL

=

LTT

L

+Ψ正交矩陣T的不同選取法構(gòu)成了正交旋轉(zhuǎn)的各種不同方法,如最大方差旋轉(zhuǎn)法(Varimax)、全體旋轉(zhuǎn)(變量和因子同時旋轉(zhuǎn),Equamax)、四分旋轉(zhuǎn)(Quartimax)等。最常采用的是最大方差旋轉(zhuǎn)法,其旋轉(zhuǎn)目的是使得因子載荷矩陣的元素取值盡可能地向兩極分化,部分元素取盡可能大的值,部分元素盡量接近零值。本節(jié)主要介紹最大方差旋轉(zhuǎn)法,其基本思想如下:7980先考慮兩個因子(m=2)的平面正交旋轉(zhuǎn),設(shè)因子載荷矩陣為(13.2.33)取正交矩陣為其中f

表示坐標(biāo)平面上因子軸旋轉(zhuǎn)的角度,則(13.2.34)p1

p

2

l

ll22

l11

l12

L

=

l21

cosj-

sinj

cosjT

=

sinj

12111211p1

p

2

p

2p1p

2p1*

l

*l

l

*

l

*l11 12

=

cosj

+

l

sinj

-

l

sinj

+

l

cosj

-

l

sinj

+

l

cosj

l

cosj

+

l

sinjL*

=

LT

=

當(dāng)公共因子個數(shù)大于2時,可以逐次對每兩個進行上述的旋轉(zhuǎn),如果存在m個公共因子,則需要進行次變換,這樣就完成一輪旋轉(zhuǎn)。如果旋轉(zhuǎn)完畢,并不能認(rèn)為已經(jīng)達到預(yù)期的效果,可以在第一輪所得結(jié)果基礎(chǔ)上繼續(xù)上述旋轉(zhuǎn)過程,可得第二輪旋轉(zhuǎn)結(jié)果。每一次旋轉(zhuǎn)以后,所得載荷矩陣各列平方的相對方差之和總會比上一次有所增加,而另一方面由于載荷矩陣每一個元素的絕對值均不大于1,因此,其方差最終一定會收斂于某一個極限。實際中,通常經(jīng)過若干次旋轉(zhuǎn)以后,如果總方差改變不大,則可以停止旋轉(zhuǎn)。8113.3.3

因子旋轉(zhuǎn)的操作為了使得因子具有實際的意義,可以對初始回歸的結(jié)果進行因子旋轉(zhuǎn)。在EViews中簡單地點擊因子對象工具條中的Rotate按鈕,或者選擇Proc/Rotate...,都可以調(diào)用

FactorRotation對話框,如圖13.14。圖13.14

因子旋轉(zhuǎn)設(shè)定對話框82Type和Method下拉菜單可用于設(shè)定基本的選轉(zhuǎn)類型和方法,其中的一些方法,可能需要輸入一些參數(shù)值。默認(rèn)

的,在旋轉(zhuǎn)前,EViews不列出載荷權(quán)重。為了標(biāo)準(zhǔn)化數(shù)據(jù),可以點擊Row

weight下拉菜單選擇Kaiser或者Cureton-Mulaik。另外,如果沒有旋轉(zhuǎn)載荷,EViews自動使用單位矩陣作為旋轉(zhuǎn)迭代的初值。也可以在Startingvalues下拉菜單中選擇合適的方式,如Random或User-specified。如果已經(jīng)完成一次旋轉(zhuǎn),也可以使用已經(jīng)存在的結(jié)果作為下一次旋轉(zhuǎn)的初值。設(shè)置完畢單擊OK即可。EViews的估計結(jié)果將列出旋轉(zhuǎn)的載荷、因子相關(guān)關(guān)系、因子旋轉(zhuǎn)矩陣、旋轉(zhuǎn)后的載荷矩

陣和旋轉(zhuǎn)目標(biāo)函數(shù)值。EViews會把結(jié)果保存在因子對象中,從因子對象中選擇View/RotationResults,可以隨時查看旋轉(zhuǎn)結(jié)果的輸出表。83例13.4

紐約股票交易所股票收益率的因子分析(2)從因子旋轉(zhuǎn)后結(jié)果可以84看出石油股票(德士古和??松┰谝蜃覨¢1有較高的載荷,而化學(xué)股票(阿萊德化學(xué)、杜邦、聯(lián)合碳化物)在因子F¢2有較高的載荷。進一步表明正交化的因子旋轉(zhuǎn)將行業(yè)區(qū)分開,因子F¢1

代表引起石油股票波動的獨特的經(jīng)濟力量,因子F¢2

代表引起化學(xué)股票波動的獨特的經(jīng)濟力量。在例13.3中表示一般市場因子的F1被破壞了。例13.5

影響我國物價波動多因素的因子分析(2)本例對例13.3的結(jié)果采用方差最大化的正交旋轉(zhuǎn)方法進行因子旋轉(zhuǎn),希望得到更好的結(jié)果,本例進行了兩次旋轉(zhuǎn)以后,總方差變化不大,結(jié)束旋轉(zhuǎn)。旋轉(zhuǎn)后的公共因子Fi如表13.7所示。lij記為

~(i=1,2,…,4),相應(yīng)的載荷記為

~,其結(jié)果指標(biāo)名稱F1載荷li1F2載荷li2F3載荷li3F4載荷li4CPI居民消費價格指數(shù)(CPI)0.770.080.540.12成本因素原材料、燃料、動力購進價格指數(shù)0.970.10-0.100.01工業(yè)品出廠價格指數(shù)0.970.0080.000.04農(nóng)副產(chǎn)品類購進價格指數(shù)0.730.33-0.030.13商品房銷售價格指數(shù)0.690.550.320.03工業(yè)企業(yè)成本費用利潤率0.540.670.210.24需求因素全部從業(yè)人員人均報酬增速-0.01-0.040.900.09城鎮(zhèn)家庭人均可支配收入增速0.230.250.860.22貨幣因素外匯儲備同比增速0.110.880.08-0.18貨幣乘數(shù)0.060.81-0.200.30M2增速-0.230.730.29-0.16GDP增長率0.410.590.290.58國際因素

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論