多元統(tǒng)計(jì)分析第六章 因子分析_第1頁(yè)
多元統(tǒng)計(jì)分析第六章 因子分析_第2頁(yè)
多元統(tǒng)計(jì)分析第六章 因子分析_第3頁(yè)
多元統(tǒng)計(jì)分析第六章 因子分析_第4頁(yè)
多元統(tǒng)計(jì)分析第六章 因子分析_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第6章 因子分析6.1 因子分析數(shù)學(xué)模型因子分析是很有用的統(tǒng)計(jì)分析工具,因子分析的實(shí)質(zhì)就是找出少量不可觀測(cè)的隨機(jī)變量,用它們表示眾多的可觀測(cè)隨機(jī)變量。以下例子能說(shuō)明因子分析的意義。例6.1對(duì)一個(gè)班的學(xué)生,進(jìn)行五門課程(力學(xué)、物理、代數(shù)、分析、統(tǒng)計(jì))考試,其中力學(xué)和物理閉卷考試,代數(shù)、分析、統(tǒng)計(jì)開卷。這5門功課的成績(jī)是可觀測(cè)的隨機(jī)向量。每個(gè)學(xué)生的成績(jī)可以看成5維隨機(jī)向量的一個(gè)觀測(cè),見表6-1。表 6-1 五門課程考試成績(jī)經(jīng)過(guò)一定計(jì)算(因子分析)后發(fā)現(xiàn)存在不可觀測(cè)的隨機(jī)變量:f1、f2,它們和x1,.x5間有關(guān)系 x1=62.409+8.64570f1+8.1220f2+v1x2=72.523+7

2、.64838f1+5.0269f2+v2x3=72.909+6.13358f1-0.1559f2+v3 (6.1) x4=72.364+5.62258f1-1.8264f2+v4x5=67.750+9.91469f1-10.6377f2+v5其中f1、f2是不可觀測(cè)的隨機(jī)變量。我們認(rèn)為它們分別表示學(xué)生的學(xué)習(xí)能力和適應(yīng)開閉卷能力,所以可分別稱為學(xué)習(xí)因子和適應(yīng)開閉卷因子。(6.1)揭示了這兩個(gè)因子如何影響5門功課的成績(jī),也揭示5門課成績(jī)的實(shí)質(zhì):每門課的成績(jī)由學(xué)習(xí)因子和適應(yīng)開閉卷因子的線性組合,加上常數(shù),再加上隨機(jī)變量而得。這是是很有意義的。象例6.1那樣,找出少量不可觀測(cè)因子(例如f1、f2),并

3、給出它們影響可觀測(cè)隨機(jī)變量(例如x1,.x5)方式的統(tǒng)計(jì)分析,就是因子分析。因子分析與主成分分析不同:主成分分析是尋求若干個(gè)可觀測(cè)隨機(jī)變量的少量線性組合,說(shuō)明其含義;因子分析主要的目的是找出不一定可觀測(cè)的潛在變量作為公共因子,并解釋公共因子的意義,及如何用不可觀測(cè)隨機(jī)變量,計(jì)算可觀測(cè)隨機(jī)變量。因子分析方法在心理學(xué),經(jīng)濟(jì),醫(yī)學(xué),生物學(xué),教育學(xué)等方面有重要用途。例如為了測(cè)驗(yàn)應(yīng)聘者的素質(zhì),出40道題,讓應(yīng)聘者回答,每道題有一得分, 40題得分被認(rèn)為可以觀測(cè)的隨機(jī)變量。我們希望找出有限個(gè)不可觀測(cè)的潛在變量來(lái)解釋這40個(gè)隨機(jī)變量,這些不可觀測(cè)的潛在變量不一定能表示為原來(lái)隨機(jī)變量的線性組合,但卻是有實(shí)際意

4、義的,例如交際能力,應(yīng)變能力,語(yǔ)言能力、推理能力、藝術(shù)修養(yǎng)、歷史知識(shí)和生活常識(shí)等。又如分析生物生長(zhǎng)狀況時(shí),從生物的實(shí)測(cè)指標(biāo)(長(zhǎng)、寬和體重等)可以分析出生長(zhǎng)因子和控制因子,找出它們?cè)诓煌瑫r(shí)刻的作用。有關(guān)因子分析細(xì)節(jié)可參看方開泰(1989)、Richard(2003)和Gorsuch(1983)。因子分析模型包括正交和斜交因子模型,本書只介紹正交因子分析模型,表述如下:定義6.1 設(shè)X為p維可觀測(cè)隨機(jī)向量,其均值向量為,協(xié)差陣為var(X)=,若X能表為X=+f+u (6.2)其中是pk待定常數(shù)陣,f是k維隨機(jī)變量(通常k小于p),u是p維隨機(jī)向量,且 E(f)=0,var(f)=I22E(u)=

5、0,var(u)=diag(,.) (6.3) 1pcov(f,u)=0則滿足條件(6.3)的(6.2)式稱為X有k個(gè)因子的因子分析模型。f稱為公共因子,u稱為特殊因子,叫做因子負(fù)荷矩陣,其元素ij稱為第i個(gè)變量在第j個(gè)因子上的負(fù)荷。例6.1中X=(X1,X2,X3,X4,X5)',=(62.409,72.523,72.909,72.364,67.750)',f=(f1,f2)',u=(v1,v2,v3,v4,v5)',8.645707.64838=6.133585.622589.914695.0269-0.1559 -1.8264-10.6377k8.1220

6、由(6.2)式可見,因子負(fù)荷矩陣特別重要:第i個(gè)變量的值Xi由fjij再加上常數(shù)項(xiàng)i和特殊j=1因子ui而成。ij的大小反映第j個(gè)因子對(duì)第i個(gè)變量的影響。令kh2i=j=1ij, 2則它反映了所有公共因子對(duì)X第i個(gè)變量的影響大小。2定義6.2 hi稱為共同度(communality)或共性方差(commonvariance)。例6.1中共性方差是h1=8.64570h2=7.64838h3=6.13358h4=5.62258h5=9.914692222222222+8.12205.026922222(-0.1559)(-1.8264) (-10.6377)v1,.v5表示這門課程成績(jī)的分散性(

7、它由測(cè)試題目的區(qū)分度決定)和測(cè)量誤差,因子分析中不討論它們。因子分析的重點(diǎn)在尋求因子負(fù)荷陣和解釋公共因子,一般不對(duì)特殊因子研究。通常,因子分析的計(jì) 3算由X的協(xié)方差陣11=p1. pp1p的分解而完成: 由(6.2)和(6.3)可見var(X)='+= (6.4)由已知解(6.4),可得和。其實(shí)只要解得即可,因?yàn)閷?duì)角線上元素kii=j=12ij+i=hi+i i=1,p 222于是由可得。但是,(6.4)的解是否存在?如果無(wú)解,能否作因子分析?當(dāng)k=p時(shí),取=1/2,=0就是(6.4)的解,因而(6.4)總有解。然而k=p不符合因子分析的目的:用少量不可觀測(cè)的隨機(jī)變量表示維數(shù)很高的隨機(jī)

8、向量 。不幸的是,當(dāng)k<p時(shí),(6.4)不一定有解,這從下面例6.2可見。例6.2 設(shè)3維隨機(jī)向量的協(xié)方差陣1=.9.7.91.4.7.4 1且只取一個(gè)公共因子,即k=1,則由'+=非對(duì)角線元素的相等,可得3等式1121=0.9,1131=0.7,2131=0.4。由后2式得21=0.411/0.7,代入1121=0.9,可得11=1.575。從而122<0這與(6.3)矛盾。好在實(shí)際問(wèn)題中,只能得到樣本協(xié)差陣和樣本相關(guān)陣,總體協(xié)差陣或總體相關(guān)陣用它們估計(jì)。而樣本協(xié)差陣和樣本相關(guān)陣的分量是隨機(jī)變量,一般與總體協(xié)差陣或總體相關(guān)陣不等,從而(6.4)近似成立即可,關(guān)于這一問(wèn)題的

9、討論見本章例6.4。另一方面值得注意的是,若(6.4)有解,則因子負(fù)荷陣不是唯一的:若已解出公共因子負(fù)荷陣,使得X=+f+u f,因子pk設(shè)是任一k階正交陣,則(6.4)也可寫為X=+()(f)+u (6.5)4 T若將作為因子負(fù)荷陣,f作為公共因子,(6.5)也是X有k個(gè)因子的因子分析模型。例如,對(duì)于例6.1,做/4旋轉(zhuǎn),取0.7071=-0.70710.70710.7071T則可得另一因子分析模型x1=62.409+0.7071(8.64570-8.1220)f1+0.7071(8.64570+8.1220)f2+v1x2=72.523+0.7071(7.64838-5.0269)f1+0

10、.7071(7.64838+5.0269)f2+v2x3=72.909+0.7071(6.13358+0.1559)f1+0.7071(6.13358-0.1559)f2+v3x4=72.364+0.7071(5.62258+1.8264)f1+0.7071(5.62258-1.8264)f2+v4x5=67.750+0.7071(9.91469+10.6377)f1+0.7071(9.91469-10.6377)f2+v5要強(qiáng)調(diào)指出的是:因子負(fù)荷陣的不唯一性,使我們對(duì)f有更多的選擇余地,反而是有利的:當(dāng)用某種方法找出的f沒有明確的意義時(shí),我們可以選擇,使f的意義變得更明確。這稱為因子旋轉(zhuǎn),將

11、在6.3節(jié)細(xì)述。T6.2 因子分析模型參數(shù)的估計(jì)由于(6.4)不一定有精確解,通常采用近似解法。常用的有主成分法、極大似然法、主因子法和迭代主因子法,以下分別敘述其原理。為了減少可觀測(cè)變量的單位,對(duì)因子分析的影響,人們常常把隨22機(jī)變量標(biāo)準(zhǔn)化后再做因子分析,這時(shí)(6.4)中的化為相關(guān)陣,從而i=1-hi。和主成分分析情況一樣,同樣的數(shù)據(jù),用協(xié)方差陣和用相關(guān)陣做因子分析,得到的結(jié)果不一樣。實(shí)際問(wèn)題中,總是得到隨機(jī)向量的n個(gè)觀測(cè)值X子分析模型變?yōu)閄(i)(i),當(dāng)可觀測(cè)變量有n次觀測(cè)X(1),.X(n)時(shí),因=+f,u(i)(i)+u(i)i=1,.n其中f(i)是公共因子和特殊因子的樣品。-可用

12、樣本均值X=用樣本方差陣1n-1(X1n-X(i)估計(jì),(6.2)化為X-X=f+u,因而總設(shè)X是零均值化的;(i)-(i)-X)(X-X)'或樣本相關(guān)陣估計(jì),再由主成分法、極大似然法、主因子法、迭代主因子法等方法估計(jì)因子負(fù)荷陣。(1)主成分法的原理是:設(shè)X*是X的標(biāo)準(zhǔn)化,設(shè)Corr(X)=的特征值和相應(yīng)單位特征向量分別是1,2,.p;a1,a2,.apX的全部主成分是y1=a1'X*,y2=a2'X*,yp=ap'X*;設(shè)主成分分析認(rèn)定只需選取k個(gè)主成分。因?yàn)镋(yi)=0,Var(yi)=i,fi=yi/i的方差是1,想到取公共因子為fi=yi/i,i=1,

13、k; 令A(yù)=a1,.apy1a1'Y=.=.X*=A'X* (6.6)ypap'因?yàn)锳的列向量是單位向量,彼此正交,A是正交陣;所以X*=AY,將A剖分,A=A1,A2,其中A1=a1,.ak,則由(6.5)得 yk+1y1X*=AY=A1.+ak+1,.ap.=A1diag1,.kypykyk+1f1f1=B1.+ak+1,.ap.=B1.+ufkfkyppyk+1f1.+ak+1,.ap.ypfk于是可取=B1=A1diag1,2,.k為因子負(fù)荷陣,f1,.fk為公共因子,u=殊因子。容易證明,這時(shí)有X=f+u,滿足E(f)=0,var(f)=I,E(u)=0,co

14、v(f,u)=0yjaj為特j=k+1雖不完全滿足(6.4),但u的方差不大,也可近似認(rèn)為(6.4)成立。例6.3 對(duì)例5.4北京冬季氣溫的數(shù)據(jù)作因子分析。解 容易求出相關(guān)陣前兩個(gè)特征值是1.50776062,0.84615115;特征向量是 0.638791 0.573479 0.512901 -.107283, -.593736 0.797476 ;第一、二主成分分別是 prin1=0.638791Dec*+0.573479 Jan*+0.512901 Feb*,prin2=-0.107283 Dec*-0.593736 Jan*+0.797476 Feb*,其中Dec*、Jan*、Feb

15、*是12月、1月、2月月平均氣溫的標(biāo)準(zhǔn)化。當(dāng)取兩個(gè)公共因子時(shí),第一、二個(gè)公共因子就是f1=(0.638791Dec*+0.573479 Jan*+0.512901 Feb*)/f2=(-0.107283 Dec*-0.593736 Jan*+0.797476 Feb*)/0.84615115因子負(fù)荷陣就是0.638791 -.107283 = 0.573479 *.50776062, -.593736 0.797476 0.512901* 0.846151150.78438 -0.09869=0.70418 -0.546160.62980 0.73357 主成分法的優(yōu)點(diǎn)是:計(jì)算簡(jiǎn)單,只要計(jì)算特

16、征值特征向量即可得到因子負(fù)荷陣B1。公共因子,是可觀測(cè)隨機(jī)變量的線性組合,其含義容易由主成分f1,.fk是X前k個(gè)主成分標(biāo)準(zhǔn)化(除以i)分析看出(上例中f1是冬季總溫度偏高程度,f2是12月1月溫度距平與2月溫度距平反差)。k可適當(dāng)選取,使共性方差較大。缺點(diǎn)是u的協(xié)方差陣不是對(duì)角陣,由于ppVar(u) =Var(yjaj)=j=k+1jajaj'。j=k+1因而-'對(duì)角線外元素絕對(duì)值可能較大。在調(diào)用SAS的FACTOR過(guò)程做因子分析時(shí),為使 SAS執(zhí)行主成分法,應(yīng)當(dāng)在PROC FACTOR語(yǔ)句中,采用METHODp選項(xiàng)。(2)極大似然法的原理是:當(dāng)公共因子和特殊因子的聯(lián)合分布

17、服從正態(tài)分布時(shí)。似然函數(shù)(略去常數(shù)后)可化為 L(,)=|-n/2exp-12ntr-1j=1(xj-x)(xj-x)'+n(x-)'-1(x-) (6.7)從而的極大似然估計(jì)是x,選擇和,在約束條件='+下,使(6.7)極大,可得和的極大似然估計(jì);為了克服因子負(fù)荷陣的不確定性,可加上約束條件:'-1是對(duì)角陣。在調(diào)用SAS的FACTOR過(guò)程做因子分析時(shí),在PROC FACTOR語(yǔ)句中,采用選項(xiàng)METHODML就能指示SAS執(zhí)行極大似然法。使用極大似然法時(shí)必須是正定陣,協(xié)差陣行列式不能是0。(3)主因子法的原理是:因?yàn)?='是非負(fù)定陣,設(shè)秩為k,故存在正交

18、陣,使'(-)=diag(1,.k,0,0,.0)=且12.k>0,令1為前k列所成矩陣,1=diag(1,.k) 則有-='=111'=(111/2)(11)' (6.8)1/2因此,當(dāng)找到一個(gè)的合適估計(jì)時(shí),就能用-的前k個(gè)標(biāo)準(zhǔn)正交化的特征向量為列向量,從而構(gòu)成1;令1/21/21/2是-的前k個(gè)特征值算術(shù)平方根所成的對(duì)角陣,則-(11)(11)'。1/2從而11即是的一個(gè)估計(jì)。在調(diào)用SAS的FACTOR過(guò)程做因子分析時(shí),為使SAS執(zhí)行主因子分1析,應(yīng)當(dāng)在PROC FACTOR語(yǔ)句中,采用METHODp選項(xiàng),并增加PRIORS語(yǔ)句,且相應(yīng)變量值不

19、等于1。(4)迭代主因子法的原理是:選取適當(dāng)初值1,再令i=1;(i)1,.(i)k是-i前k個(gè)特征值,i是-i的前k個(gè)標(biāo)準(zhǔn)化特征向量所成矩陣(i)1/2i=idiag(1,.k(i)1/2) i+1=diag(-ii') ,i=i+1。轉(zhuǎn)從1出發(fā)用至 反復(fù)迭代直至穩(wěn)定,可得,的估計(jì)值。在調(diào)用SAS的FACTOR過(guò)程做因子分析時(shí),在PROC FACTOR語(yǔ)句中,用METHOD=PRlNIT選項(xiàng)指示SAS執(zhí)行迭代主因子法,這時(shí)SAS會(huì)自動(dòng)選取適當(dāng)初值1,并進(jìn)行迭代。用上述方法之一估計(jì)出參數(shù)后,還必須對(duì)得到的公共因子進(jìn)行解釋,對(duì)每個(gè)公共因子要給出一個(gè)名稱,說(shuō)明其作用。上述計(jì)算十分復(fù)雜,一般

20、用專用軟件完成。要用SAS 軟件對(duì)資料進(jìn)行因子分析,可調(diào)用SAS 軟件的FACTOR過(guò)程,即因子分析過(guò)程。FACTOR過(guò)程可以完成以上所述各種類型的公共因子分析,和各種旋轉(zhuǎn)。FACTOR過(guò)程的處理的數(shù)據(jù)集可以是原始數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)的相關(guān)陣或協(xié)差陣。FACTOR過(guò)程主要包含兩個(gè)語(yǔ)句:PROC FACTOR語(yǔ)句和VAR語(yǔ)句,當(dāng)使用主因子法時(shí),還要配上PRIORS語(yǔ)句。(1)PROC FACTOR語(yǔ)句。其一般形式是:PROC FACTOR 選項(xiàng)項(xiàng)1,選項(xiàng)2,; PROC FACTOR語(yǔ)句后的選項(xiàng)可以是DATA用以指定被分析的數(shù)據(jù)集,若缺省,則分析最新建立的SAS數(shù)據(jù)集;也可以是OUT用以建立輸出數(shù)據(jù)集

21、,把有關(guān)結(jié)果存入其中;也可以是method用以規(guī)定提取因子的方法;還可以是rotate用以給出旋轉(zhuǎn)方法,n=規(guī)定提取公共因子的個(gè)數(shù),當(dāng)使用選項(xiàng)COV時(shí),SAS用協(xié)差陣計(jì)算因子負(fù)荷陣,否則用相關(guān)陣計(jì)算因子負(fù)荷陣。(2)VAR語(yǔ)句。一般形式是:VAR變量1,變量2;用以規(guī)定要分析的變量。(3)PRIORS語(yǔ)句。一般形式是PRIORS 數(shù)值1 數(shù)值2;在調(diào)用SAS的FACTOR過(guò)程做因子分析時(shí),若采用主因子法,要用PRIORS語(yǔ)句,且相應(yīng)變量值等于的合適估計(jì)。例6.4 對(duì)6.1用主成分法作因子分析。 令x1-x5分別表示力學(xué)、物理、代數(shù)、分析、統(tǒng)計(jì)的成績(jī)。采用SAS程序:data grade;/*建

22、立數(shù)據(jù)集grade*/input No x1-x5;/*建立變量No x1,x2,x3,x4,x5*/cards;/*以下是數(shù)據(jù)體*/1 92 97 82 82 962 78 93 95 85 963 90 88 86 81 964 70 87 78 85 8342 63 63 64 66 5243 56 78 64 61 4944 61 67 68 56 55 ;proc factor data=grade method=p n=2;/*采用主成分法,用相關(guān)陣計(jì)算,選取兩個(gè)公共因子*/ var x1-x5;/*可觀測(cè)因子是x1、x2、x3、x4、x5*/run;執(zhí)行上述程序后輸出許多信息,主

23、要信息是相關(guān)陣特征值表(表頭為, Eigenvalues of theCorrelation Matrix: Total = 5 Average = 1)、因子負(fù)荷陣(表頭為Factor Pattern)和另兩個(gè)小表(表頭分別為Variance Explained by Each Factor和 Final Communality Estimates: Total =3.684019)Eigenvalues of the Correlation Matrix: Total = 5 Average = 11 2 3 4 5 Eigenvalue 2.6120 1.0721 0.5694 0.43

24、59 0.3106 Difference 1.5399 0.5026 0.1335 0.1253Proportion 0.5224 0.2144 0.1139 0.0872 0.0621 Cumulative 0.5224 0.7368 0.8507 0.9379 1.00002 factors will be retained by the NFACTOR criterion.以上給出相關(guān)陣的特征值。Factor PatternFACTOR1 FACTOR2X1 0.62491 0.58706X2 0.67015 0.44046X3 0.84837 -0.02156X4 0.80568 -0

25、.26171X5 0.63520 -0.68152以上給出因子負(fù)荷陣, Factor1、Factor2等下面的數(shù)即是可觀測(cè)變量在第一、第二等等公共因子上的負(fù)荷,所以因子負(fù)荷陣就是0.624910.67015=0.848370.805680.635200.587060.44046-0.02156。 -0.26171-0.68152若x1*,.x5*是x1,.x5標(biāo)準(zhǔn)化而得。所估計(jì)x1*,.x5*的因子分析模型就是x1*=0.62491f1+0.58706f2+u1x2*=0.67105f1+0.44046f2+u2x3*=0.84837f1-0.02156f2+u3 (6.9)x4*=0.805

26、68f1-0.26171f2+u4x5*=0.63520f1-0.68152f2+u5由于x1*,.x5*在第一個(gè)公共因子上的負(fù)荷基本相等,第一個(gè)公共因子表示學(xué)生的學(xué)習(xí)能力,稱為學(xué)習(xí)能力因子。由于x1*,x2*在第二個(gè)公共因子上的負(fù)荷是正的,x3*,x4*,.x5*在第二個(gè)公共因子上的負(fù)荷是負(fù)的,第二個(gè)公共因子表示閉卷對(duì)考試成績(jī)的影響,第二個(gè)公共因子可稱為開卷影響成績(jī)因子,第二個(gè)公共因子值越大閉卷成績(jī)?cè)讲睢ariance explained by each factorFACTOR1 FACTOR22.611953 1.072066上表說(shuō)明兩個(gè)公共因子解釋的方差分別是 2.6119530和1

27、.0720658。(全部方差是相關(guān)陣對(duì)角線上元素之和5)Final Communality Estimates: Total = 3.684019X1 X2 X3 X4 X50.735157 0.643113 0.720190 0.717618 0.867940上表給出各個(gè)可觀測(cè)變量的共性方差。由此容易算出,i等于0.26484287,0.35688694,0.27980969,0.28238173,0.13205997。因?yàn)檫@5門課成績(jī)的樣本均值分別是62.4090909、72.5227273、72.9090909、72.3636364、67.7500000;樣本方差是 191.410148

28、0、130.2552854、52.2706131、48.7019027、243.6337209。將 x1*=(x1-62.40909090)/.410148x2*=(x2-72.5227273)/.25528542x3*=(x3-72.9090909)/52.2706131x4*=(x4-72.3636364)/48.7019027x5*=(x5-67.75)/243.6337209代入(6.9)x1,.x5的因子分析模型就是x1=62.409+8.64570f1+8.1220f2+v1x2=72.523+7.64838f1+5.0269f2+v2x3=72.909+6.13358f1-0.1

29、559f2+v3 x4=72.364+5.62258f1-1.8264f2+v4x5=67.750+9.91469f1-10.6377f2+v5參數(shù)估計(jì)的不同方法(例如主成分法與最大似然法)對(duì)參數(shù)估計(jì)是有影響的,請(qǐng)看下例。例6.5 對(duì)5個(gè)公司Allied Chemical(阿萊德化學(xué)) 、du Pont(杜邦) 、Union Carbide(聯(lián)合碳化物)、 Exxon(??松exaco(德士古)股票100周的回報(bào)率(如表6-2)做因子分析。表6-2 5個(gè)公司100周股票的回報(bào)率試對(duì)股票回報(bào)率用主成分法、極大似然法主因子法和迭代主因子法分別做因子分析, 取2個(gè)公共因子。以變量AllChem

30、i 、duPont 、UnionCar、 Exxon、Texaco表示這5個(gè)公司的回報(bào)率,先建立主成分法的SAS程序data stock;input AllChemi duPont UnionCar Exxon Texaco; cards;0.000000 0.000000 0.000000 0.039473 -0.000000 0.027027 -0.044855 -0.003030 -0.014466 0.043478 0.122807 0.060773 0.088146 0.086238 0.078124 .0.045454 0.046375 0.074561 0.014563 0.01

31、8779 0.050167 0.036380 0.004082 -0.011961 0.009216 0.019108 -0.033303 0.008362 0.033898 0.004566 ;proc factor data=stock method=p n=2 ;/*采用主成分法,用相關(guān)陣計(jì)算,選取兩個(gè)公共因子*/var AllChemi duPont UnionCar Exxon Texaco; /*可觀測(cè)因子是AllChemi 、duPont 、UnionCar、 Exxon、Texaco */run;執(zhí)行后得到的主要結(jié)果是Factor PatternFACTOR1 FACTOR2A

32、LLCHEMI 0.78344 -0.21665DUPONT 0.77251 -0.45794UNIONCAR 0.79432 -0.23439EXXON 0.71268 0.47248TEXACO 0.71209 0.52373可見因子負(fù)荷陣是0.783440.772510.794320.712680.71209-0.21665 -0.45794 -0.23439 0.47248 0.52373Variance explained by each factorFACTOR1 FACTOR22.856487 0.809118上表是每個(gè)因子負(fù)荷的平方和,反映因子的重要性:平方和越大,該因子越重要

33、。本例中2.8564869>0.8091185,因子1比因子2重要。Final Communality Estimates: Total = 3.665605ALLCHEMI DUPONT UNIONCAR EXXON TEXACO0.660709 0.806483 0.685885 0.731155 0.781374上表是共性方差。從因子負(fù)荷陣可見:可觀測(cè)因子在第一公共因子上的負(fù)荷都是相差不多的正數(shù),可見第一公共因子表示一般經(jīng)濟(jì)條件,可稱為市場(chǎng)因子;前三個(gè)公司是化學(xué)加工公司,它們的股票回報(bào)率在第二個(gè)公共因子上的負(fù)荷都是負(fù)的,后兩個(gè)公司是石油公司,它們的股票回報(bào)率在第二個(gè)公共因子上的負(fù)荷

34、都是正的,可見第二個(gè)公共因子反映產(chǎn)業(yè)的不同,可稱為產(chǎn)業(yè)因子。 由于數(shù)據(jù)集stock已建立,可直接調(diào)用。采用極大似然法的程序是proc factor data=stock method=ml n=2; /*采用極大似然法,對(duì)數(shù)據(jù)集stock用相關(guān)陣計(jì)算因子分析,選取兩個(gè)公共因子*/var AllChemi duPont UnionCar Exxon Texaco; /*可觀測(cè)因子是AllChemi 、duPont 、UnionCar、 Exxon、Texaco */run;主要輸出的表Factor PatternFACTOR1 FACTOR2ALLCHEMI 0.68323 -0.19151DU

35、PONT 0.69240 -0.51867UNIONCAR 0.68027 -0.25058EXXON 0.62085 0.07033TEXACO 0.79388 0.43971可見極大似然法所得因子負(fù)荷陣是0.683230.692400.680270.620850.79388-0.19151 -0.51867 -0.25058 0.07033 0.43971Variance explained by each factorFACTOR1 FACTOR2Weighted 8.026412 2.379734Unweighted 2.424712 0.566772上表第3列是每個(gè)因子負(fù)荷的平方和,

36、反映因子的重要性:平方和越大,該因子越重要。本例中2.42471244 >0.56677229,因子1比因子2重要。Final Communality Estimates and Variable WeightsTotal Communality: Weighted = 10.406145 Unweighted = 2.991485ALLCHEMI DUPONT UNIONCAR EXXON TEXACO Communality 0.503484 0.748441 0.525560 0.390406 0.823593 Weight 2.014042 3.975230 2.107740 1

37、.640434 5.668700上表第2列是共性方差。 兩個(gè)公共因子的含義和主成分法一樣。 采用主因子法(初始特殊因子的方差是0.3,0.2,0.3,0.3,0.2)的程序是proc factor data=stock method=p n=2; /*采用主因子法,對(duì)數(shù)據(jù)集stock用相關(guān)陣計(jì)算因子分析,選取兩個(gè)公共因子*/var AllChemi duPont UnionCar Exxon Texaco; /*可觀測(cè)因子是AllChemi 、duPont 、UnionCar、 Exxon、Texaco */priors 0.3 0.2 0.3 0.3 0.2;/*規(guī)定特殊因子的方差為0.3

38、0.2 0.3 0.3 0.2*/ run;執(zhí)行后所得主要輸出有Factor PatternFACTOR1 FACTOR2ALLCHEMI 0.68468 -0.07101DUPONT 0.64931 -0.10567UNIONCAR 0.69450 -0.06773EXXON 0.62329 0.15067TEXACO 0.59798 0.11765可見主因子法所得因子負(fù)荷陣是0.684680.649310.694500.623290.59798-0.07101 -0.10567 -0.06773 0.15067 0.11765 Variance explained by each fact

39、orFACTOR1 FACTOR22.118782 0.057339上表第是每個(gè)因子負(fù)荷的平方和,反映因子的重要性:平方和越大,該因子越重要。本例中2.1187820 >0.0.0573392,因子1比因子2重要。Final Communality Estimates: Total = 2.176121ALLCHEMI DUPONT UNIONCAR EXXON TEXACO0.473823 0.432771 0.486911 0.411192 0.371424上表是共性方差。 采用迭代主因子法的程序是proc factor data=stock method=prinit n=2; /

40、*采用迭代主因子法,對(duì)數(shù)據(jù)集stock用相關(guān)陣計(jì)算因子分析,選取兩個(gè)公共因子*/var AllChemi duPont UnionCar Exxon Texaco; /*可觀測(cè)因子是AllChemi 、duPont 、UnionCar、 Exxon、Texaco */run;執(zhí)行后所得主要輸出有Factor PatternFACTOR1 FACTOR2ALLCHEMI 0.69710 -0.07560DUPONT 0.77286 -0.42899UNIONCAR 0.71576 -0.11929EXXON 0.61011 0.19072TEXACO 0.69767 0.50637可見迭代主因子

41、法所得因子負(fù)荷陣是0.697100.772860.715760.610110.69767-0.07560 -0.42899 -0.11929 0.19072 0.50637Variance explained by each factorFACTOR1 FACTOR22.454553 0.496758上表最后一行是每個(gè)因子負(fù)荷的平方和,反映因子的重要性:平方和越大,該因子越重要。本例中2.1187820 >0.0.0573392,因子1比因子2重要。Final Communality Estimates: Total = 2.951310ALLCHEMI DUPONT UNIONCAR

42、EXXON TEXACO0.491662 0.781354 0.526545 0.408606 0.743143上表是共性方差。如何比較不同估計(jì)方法的效果?一般說(shuō)來(lái),我們可以用共性方差的大小和方程(6.4)滿足的程度來(lái)估價(jià)其效果。共性方差越大,特殊因子的方差越小,效果越好;(6.4)滿足的程度越高,即R-'-分量絕對(duì)值越小,效果越好。四種方法共性方差列表如下可見主成分法共性方差大。另一方面,由于樣本相關(guān)陣是1.000000.57692R=0.508660.386720.462180.576921.000000.598380.389520.321950.508660.598381.000

43、000.436100.425630.386720.389520.436101.000000.523530.462180.321950.42563 0.523531.00000對(duì)于主成分法0.0000-0.127R-'-=-0.164-0.0690.017-.01270.0000-0.1220.0550.012-0.164-0.1220.0000-0.019-0.017-0.0690.055-0.0190.0000-0.2320.0170.012-0.017 -0.2320.0000對(duì)于極大似然法0.00000.004R-'-=-0.004-0.0230.0040.0040.00

44、00-0.003-0.0040.000-0.004-0.0030.00000.031-0.0040.004-0.0040.0000.031-0.004 0.0000-0.000-0.0000.0000-0.023對(duì)于主因子法0.00000000.1248468R-'-=0.0283402-0.0293350.0611094 0.1248468 0.0283402 -0.029335 0.0611094 0.0000000 0.1402772 0.0007329 -0.053892 0.1402772 0.0000000 0.01343 0.0183013 0.0007329 0.013

45、43 0.0000000 0.1330887 -0.053892 0.0183013 0.1330887 0.00000000.0057276 0.0006854 -0.024169 0.0141158 0.0000000 -0.005976 -0.000193 -0.000024-0.005976 0.0000000 0.0221587 -0.013329 -0.000193 0.0221587 0.0000000 0.0012997-0.000024 -0.013329 0.0012997 0.000000對(duì)于迭代主因子法 0.00000000.0057276R-'-=0.0006

46、854-0.0241690.0141158可見,對(duì)于例6.4,極大似然法的擬合效果較好。但是極大似然法和迭代主因子法所得共性方差較小,從而特殊因子方差較大。迭代主因子法比主因子法效果好。估計(jì)因子負(fù)荷陣還有其他方法,諸如 因子分析,在調(diào)用SAS的FACTOR過(guò)程時(shí),由METHOD=A指示SAS執(zhí)行;HARRIS分量分析,在調(diào)用SAS的FACTOR過(guò)程時(shí),由METHODH指示SAS執(zhí)行,此法要求樣本相關(guān)陣非奇異;映像分量分析 ,在調(diào)用SAS的FACTOR過(guò)程時(shí),由METHOD=i指示SAS執(zhí)行;不加權(quán)的最小二乘因子分析,由METHOD=V指示SAS執(zhí)行。通常所得的觀測(cè)值都被簡(jiǎn)化為樣本協(xié)差陣或樣本相

47、關(guān)陣,這時(shí)可以把樣本協(xié)差陣或樣本相關(guān)陣直接輸入,從而計(jì)算因子負(fù)荷陣。例6.6 為了弄清員工的病情,對(duì)某學(xué)校員工進(jìn)行調(diào)查,得到16種病的樣本相關(guān)陣,其中x1:高血壓;x2:臨界高血壓;x3:慢性肝?。粁4:有肝炎病史;x5:頸胸腰椎?。粁6:肺結(jié)核??;x7:有肺結(jié)核病史;x8:胃及12指腸潰瘍;x9:有大手術(shù)史;x10:精神?。粁11:腫瘤??;x12:糖料??;x13:心電圖異常;x14:眼底網(wǎng)動(dòng)脈硬化;x15:血脂高;x16:先天性或風(fēng)濕性心臟病。表6-3 16種病的樣本相關(guān)陣解 用變量x1-x6表示16種疾病的病人數(shù),采用SAS程序 data helth(type=corr); _type_=

48、'corr'input _name_ $ x1-x16; cards;x1 1 .5204 .1478 -.0357 .3094 .2063 .3708 .2911 .3095 -.3548 .5248 -.1525 .6728 .7608 .5548 -.4007 x2 . 1 .3509 .3354 .7538 .7772 .7043 .5258 .3111 -.2179 .7216 .3531 .7929 .8024 .8244 -.1530 x3 . . 1 .7849 .7585 .0625 .6089 .8043 .6419 .4515 .3698 .7975 .5

49、031 .5113 .5830 -.1520 x4 . . . 1 .8154 .3894 .7371 .8824 .7889 .3850 .0511 .6985 .4461 .3714 .5096 .0855 x5 . . . . 1 .6911 .9410 .9408 .5915 .2720 .5933 .6676 .7410 .7428 .8964 -.0047 x6 . . . . . 1 .7495 .5254 .1614 -.0551 .4861 .1990 .5403 .5255 .7017 .1614 x7 . . . . . . 1 .8891 .5068 .3663 .54

50、40 .6209 .6456 .7856 .9220 .0123 x8 . . . . . . . 1 .6575 .3443 .4524 .6074 .6972 .6189 .7845 -.0218 x9 . . . . . . . . 1 .0388 -.0798 .3684 .4434 .4831 .3560 -.1334 x10 . . . . . . . . . 1 .0425 .6213 -.3272 .0897 .2353 .0304 x11 . . . . . . . . . . 1 .2275 .6448 .7000 .8044 -.1647 x12 . . . . . .

51、. . . . . 1 .2466 .3951 .5297 -.0013 x13 . . . . . . . . . . . . 1 .6855 .7317 -.2479 x14 . . . . . . . . . . . . . 1 .9053 -.2827 x15 . . . . . . . . . . . . . . 1 -.0745 x16 . . . . . . . . . . . . . . . 1 ;proc factor data=helth method=p n=4 ; var x1-x16;run;得到的主要輸出是Factor PatternFACTOR1 FACTOR2

52、FACTOR3 FACTOR4X1 0.48467 -0.68282 -0.38453 -0.06038X2 0.80453 -0.43608 0.17225 0.06529X3 0.74531 0.45805 -0.31980 -0.15802X4 0.73304 0.57630 -0.11543 0.32384X5 0.97732 0.13498 0.10259 0.08012X6 0.65530 -0.24839 0.55737 0.27754X7 0.94244 0.10092 0.19327 0.01622X8 0.90852 0.26794 -0.05251 0.11829X9 0

53、.59683 0.27559 -0.53867 0.44684X10 0.21558 0.72815 0.16366 -0.55071X11 0.65551 -0.45267 0.24445 -0.43027X12 0.62976 0.59238 0.04675 -0.25876X13 0.80018 -0.40612 -0.16834 0.18805X14 0.85655 -0.31599 -0.10783 -0.18553X15 0.94330 -0.16516 0.18887 -0.17474X16 -0.12761 0.28301 0.65625 0.43476上表是因子負(fù)荷陣。x1-

54、x16在第1公共因子上的負(fù)荷中,除x10,x16外,比較一致,而x10,x16數(shù)值很小,x10和x16反映的是先天性疾病,所以第一公共因子反映人的體質(zhì)。x1-x16在第2公共因子上的負(fù)荷中x1,x2,x11,x13是負(fù)的且絕對(duì)值偏大,它們反映心血管??;x3,x4,x10, x12偏大,它們反映內(nèi)臟器官病癥,所以第二公共因子反映這心血管病和內(nèi)臟特征。其余兩個(gè)公共因子含義不明確。6.3 因子旋轉(zhuǎn)有時(shí)由主成分法、極大似然法等方法得到公共因子f,但f難以和實(shí)際問(wèn)題相對(duì)應(yīng),這時(shí)需要通過(guò)某個(gè)正交陣作公共因子旋轉(zhuǎn),使f和有鮮明的實(shí)際意義。另一方面,主成分法、極大似然法等方法估計(jì)參數(shù)帶有隨意性,通過(guò)旋轉(zhuǎn)公共因子,可以減少隨意性。所以作公共因子旋轉(zhuǎn)是有必要的。因子旋轉(zhuǎn),就是找尋正交陣,使新的因子負(fù)荷陣*=更有實(shí)際意義的計(jì)算。由(6.5)可見, 對(duì)于使用因子旋轉(zhuǎn),新舊因子負(fù)荷陣,共性方差不變、特殊因子的方差不變。有許多優(yōu)化準(zhǔn)則,用于選擇正交陣,從而形成不同的旋轉(zhuǎn)方法。常用的因子旋轉(zhuǎn)方法是最大方差旋轉(zhuǎn)法(varimax),即使因子旋轉(zhuǎn)后,因子的貢獻(xiàn)盡可能分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論