第8章 因子分析課件_第1頁
第8章 因子分析課件_第2頁
第8章 因子分析課件_第3頁
第8章 因子分析課件_第4頁
第8章 因子分析課件_第5頁
已閱讀5頁,還剩107頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第八章因子分析FactorAnalysis第8章因子分析§8.1引言1、什么是因子分析?

因子分析是主成分分析的推廣,也是利用降維的思想,由研究原始變量相關(guān)矩陣或協(xié)方差矩陣的內(nèi)部依賴關(guān)系出發(fā),把一些具有錯綜復雜關(guān)系的多個變量歸結(jié)為少數(shù)幾個綜合因子,以再現(xiàn)原始變量與因子之間的相關(guān)關(guān)系的一種多元統(tǒng)計分析方法。2、因子分析的基本思想:

把每個研究變量分解為幾個影響因素變量,將每個原始變量分解成兩部分因素,一部分是由所有變量共同具有的少數(shù)幾個公共因子組成的,另一部分是每個變量獨自具有的因素,即特殊因子.第8章因子分析3、因子分析的目的:因子分析的目的之一,簡化變量維數(shù),即要使因素結(jié)構(gòu)簡單化,希望以最少的共同因素(公共因子),能對總變異量作最大的解釋,因而抽取得因子愈少愈好,但抽取因子的累積解釋的變異量愈大愈好.在因子分析的公共因子抽取中,應最先抽取特征值最大的公共因子,其次是次大者,最后抽取公共因子的特征值最小,通常會接近0.第8章因子分析★實例1

在企業(yè)形象或品牌形象的研究中,消費者可以通過一個有24個指標構(gòu)成的評價體系,評價百貨商場的24個方面的優(yōu)劣.&但消費者主要關(guān)心的是三個方面,即商店的環(huán)境、商店的服務和商品的價格.因子分析方法可以通過24個變量,找出反映商店環(huán)境、商店服務水平和商品價格的三個潛在的因子,對商店進行綜合評價.而這三個公共因子可以表示為:&稱是不可觀測的潛在因子,稱為公共因子.24個變量共享這三個因子,但是每個變量又有自己的個性,不被包含的部分,稱為特殊因子.這就是個因子分析模型.(i=1,2,…,24)第8章因子分析

實例2

調(diào)查青年對婚姻家庭的態(tài)度,抽取n個青年回答了p=50個問題的答卷,這些問題課歸納為如下幾個方面:對相貌的重視、對孩子的觀點、對老人的態(tài)度等等,這也是一個因子分析的模型,每一個方面就是一個因子.第8章因子分析

實例3

考察人體的五項生理指標:收縮壓(X1)、舒張壓(X2)、心跳間隔(X3)、呼吸間隔(X4)和舌下溫度(X5).從生理學知識可知,這五項指標是受植物神經(jīng)支配的,植物神經(jīng)又分為交感神經(jīng)和副交感神經(jīng),因此這五項指標至少受到兩個公共因子的影響,也可用因子分析的模型去處理它.第8章因子分析

因子分析的主要應用有兩方面:一是尋求基本結(jié)構(gòu),簡化觀測系統(tǒng),將具有錯綜復雜的對象(變量或樣品)綜合為少數(shù)幾個因子(不可觀測的隨機變量),以再現(xiàn)因子與原始變量之間的內(nèi)在聯(lián)系;二是用于分類,對p個變量或n個樣品進行分類.因子分析R型因子分析Q型因子分析研究變量(指標)之間的相關(guān)關(guān)系,通過對變量的相關(guān)陣或協(xié)方差陣內(nèi)部結(jié)構(gòu)的研究,找出控制所有變量的幾個公共因子(或稱主因子、潛因子),用以對變量或樣品進行分類.研究樣品之間的相關(guān)關(guān)系,通過對樣品的相似矩陣內(nèi)部結(jié)構(gòu)的研究找出控制所有樣品的幾個主要因素(或稱主因子).第8章因子分析4、主成分分析分析與因子分析的聯(lián)系和差異:

聯(lián)系:(1)因子分析是主成分分析的推廣,是主成分分析的逆問題.(2)二者都是以“降維”為目的,都是從協(xié)方差矩陣或相關(guān)系數(shù)矩陣出發(fā).

區(qū)別:(1)主成分分析模型是原始變量的線性組合,是將原始變量加以綜合、歸納,僅僅是變量變換;而因子分析是將原始變量加以分解,描述原始變量協(xié)方差矩陣結(jié)構(gòu)的模型;只有當提取的公因子個數(shù)等于原始變量個數(shù)時,因子分析才對應變量變換.(2)主成分分析,中每個主成分對應的系數(shù)是唯一確定的;因子分析中每個因子的相應系數(shù)即因子載荷不是唯一的.(3)因子分析中因子載荷的不唯一性有利于對公因子進行有效解釋;而主成分分析對提取的主成分的解釋能力有限.

第8章因子分析§8.2因子模型一、正交因子模型設是可觀測是隨機向量,E(X)=

,D(X)=

,且設(m<p)是不可觀測的隨機向量,E(F)=0,D(F)=Im(即F的各分量方差為1,且互不相關(guān)).又設與F互不相關(guān),且defD(對角矩陣)第8章因子分析假定隨機向量X滿足以下的模型:(8.2.1)則稱模型(8.2.1)為正交因子模型.第8章因子分析(8.2.2)模型(8.2.1)用矩陣表示為

其中,F1,…,Fm稱為X的公共因子;,

1,…,

p稱為X的特殊因子;公共因子F1,…,Fm

一般對X的每一個分量Xi都有作用,而

i只對Xi起作用,而且各特殊因子之間以及特殊因子與所有公共因子之間都是互不相關(guān)的.

模型中的矩陣A=(aij)p×m是待估的參數(shù)矩陣,稱為因子載荷矩陣,aij(i=1,…,p;j=1,…,m)稱為第i個變量在第j個因子上的載荷(簡稱為因子載荷).第8章因子分析(1)(2)三個關(guān)鍵的假設:即互不相關(guān),方差為1.,即特殊因子同公共因子相互獨立即不相關(guān);第8章因子分析(3)即特殊因子互不相關(guān),方差不一定相等,。滿足以上條件的,稱為正交因子模型.defD如果(2)不成立,即各公共因子之間不獨立,則因子分析模型為斜交因子模型.

在主成分分析中,回歸模型(7.2.2)中的殘差通常是彼此相關(guān)的.在因子分析中,特殊因子起著殘差的作用,但被定義為彼此不相關(guān)且與公共因子也不相關(guān);而且每個公共因子假定至少對兩個變量有貢獻,否則它將是一個特殊因子.第8章因子分析

在正交因子模型中,假定公共因子彼此不相關(guān)且具有單位方差,即D(F)=Im.由可知,正交因子模型意味著第j個變量和第k個變量的協(xié)方差

jk由下式給出(8.2.3)第8章因子分析

如果原始變量已被標準化,在(8.2.3)式中將用相關(guān)陣代替協(xié)方差陣.在此意義上,公共因子解釋了觀測變量間的相關(guān)性.用正交因子模型預測的相關(guān)與實際的相關(guān)之間的差異就是剩余相關(guān).評估正交因子模型擬合優(yōu)度的好方法就是考察剩余相關(guān)的大小.第8章因子分析

因子分析的目的首先是由樣本協(xié)方差陣估計

,然后由分解式(8.2.3)求得A和D,也就是從可以預測的變量給出的樣本資料中,求出載荷矩陣A,然后預測公共因子F1,…,Fm.又因(8.2.4)其中A為p×m矩陣.可見A中元素aij刻畫變量Xi與Fj之間的相關(guān)性,稱為Xi在Fj上的因子載荷.第8章因子分析(8.2.3)(8.2.4)上述兩個關(guān)系式稱為正交因子模型的協(xié)方差結(jié)構(gòu).第8章因子分析公因子F1公因子F2共同度hi特殊因子δix1=代數(shù)10.8960.3410.9190.081x2=代數(shù)20.8020.4960.8890.111x3=幾何0.5160.8550.9970.003x4=三角0.8410.4440.9040.096x5=解析幾何0.8330.4340.8820.118方差貢獻(特征值)3.1131.4794.9590.409方差貢獻率(變異量)62.26%29.58%91.85%因子分析案例F1

體現(xiàn)邏輯思維和運算能力,F2

體現(xiàn)空間思維和推理能力第8章因子分析二、正交因子模型中各個量的統(tǒng)計意義1.因子載荷的統(tǒng)計意義因子負荷量(或稱因子載荷)

是指因子結(jié)構(gòu)中原始變量與因子分析時抽取出的公共因子的相關(guān)程度.由因子模型(8.2.1)及(8.2.4)可知,Xi與Fj的協(xié)方差第8章因子分析如果Xi是標準化變量(即E(Xi)=0,Var(Xi)=1),即Xi為則第8章因子分析

在各公共因子不相關(guān)的前提下,(載荷矩陣中第i行,第j列的元素)是隨機變量Xi與公共因子Fj的相關(guān)系數(shù),統(tǒng)計術(shù)語叫做“權(quán)重”,它表示Xi依賴Fj的分量(比重).

由于歷史的原因,在心理學中將模型(8.2.1)中的系數(shù)叫做“載荷”,即第i個變量在第j個因子上的載荷(或負荷),反映了第i個原始變量在第j個公共因子上的相對重要性.因此絕對值越大,則公共因子Fj與原始變量Xi的關(guān)系越強.第8章因子分析2.變量共同度的統(tǒng)計意義

共同度又稱共性方差或公因子方差(community或commonvariance)就是變量與每個公共因子之負荷量的平方總和(一行中所有因素負荷量的平方和).變量的共同度是因子載荷矩陣A的各行的元素的平方和hi2.記為

從共同性的大小可以判斷這個原始實測變量與公共因子之間的關(guān)系程度.

如因子分析案例中:共同度h12=(0.896)2+(0.341)2=0.919第8章因子分析為了給出hi2的統(tǒng)計意義,下面來計算Xi的方差:左式表明Xi的方差由兩部分組成,第一部分hi2是全部公共因子對變量Xi的總方差所作出的貢獻,稱為公因子方差;第二部分

i2是由特定因子

i產(chǎn)生的方差,它僅與變量Xi有關(guān),也稱為剩余方差.第8章因子分析

所有的公共因子和特殊因子對變量Xi的貢獻為1,即hi2+

i2=1.hi2反映了全部公共因子對變量Xi的影響,是全部公共因子對變量方差所做出的貢獻,或者說Xi對公共因子的共同依賴程度,稱為公共因子對變量Xi的方差貢獻.

hi2接近于1,表明該變量的原始信息幾乎都被選取的公共因子說明了.hi2反映了變量Xi對公因子F依賴的程度,故也稱公因子方差hi2為變量Xi的共同度.

特殊因子的方差

i2(剩余方差),反映了原始變量方差中無法被公共因子描述的比例,即各變量的特殊因素影響的大小,就是1減掉該變量共同度的值.如因子分析案例中:

i2=1-0.919=0.081第8章因子分析3.公共因子Fj的方差貢獻的統(tǒng)計意義

在因子載荷矩陣A中,求A的各列的平方和,記為qj2,即qj2的統(tǒng)計意義與Xi的共同度hi2恰好相反,qj2表示第j個公共因子Fj對X的所有分量X1,…,Xp的總影響,稱為第j個公因子Fj對X的貢獻,它是衡量第j個公共因子相對重要性的指標.方差貢獻qj2即每個變量與某一共同因素之因素負荷量的平方總和(因子載荷矩陣中某一公共因子列所有因子負荷量的平方和),又稱為特征值.如因子分析案例中:F1的方差貢獻為

=(0.896)2+(0.802)2+(0.516)2+(0.841)2+(0.833)2=3.113第8章因子分析

qj2愈大,表明Fj對X的貢獻愈大,該因子的重要程度越高.如果我們把載荷矩陣A的各列平方和都計算,使相應的貢獻有順序:q12≥…≥qm2,我們就能夠以此為依據(jù),找出最有影響的公共因子.要解決此問題,關(guān)鍵是求載荷矩陣A的估計.方差貢獻率指公共因子對實測變量的貢獻,又稱變異量.

方差貢獻率=方差貢獻qj2/實測變量數(shù)p,是衡量公共因子相對重要性的指標.qj2越大,表明公共因子Fj對X的貢獻越大,該因子的重要程度越高.

如因子分析案例中:F1的貢獻率為3.113/5=62.26%第8章因子分析※【注】關(guān)于因子模型有下列兩點需要指出(書P298):(1)模型不受量綱的影響.(2)因子載荷矩陣A不是唯一的.第8章因子分析例8.2.1

已知的協(xié)方差陣

為試求滿足(8.2.3)式的因子載荷矩陣A和特殊因子協(xié)方差陣D,并計算X1的共同度.第8章因子分析解:容易驗證第8章因子分析因而因子載荷矩陣A和特殊因子協(xié)方差陣D

分別為即X的協(xié)方差陣

具有m=2的正交因子模型結(jié)構(gòu),且X1的共同度為第一個特殊因子

1的方差

12=2,X1的方差可分解為即方差=共同度+特殊方差對Xi(i=2,3,4)也有類似地分解.第8章因子分析§8.3參數(shù)估計方法

已知p個相關(guān)變量的n次觀測值(i=1,2,…,n).因子分析的目的是用少數(shù)幾個公共因子(設為m個)來描述p個相關(guān)變量間的協(xié)方差結(jié)構(gòu):其中A=(aij)為p×m的因子載荷矩陣;D=diag(

12,…,

p2)為p階對角矩陣.也就是估計公共因子的個數(shù)m、因子載荷矩陣A及特殊因子方差

i2(i=1,…,p),使得滿足第8章因子分析

由p個相關(guān)變量的觀測數(shù)據(jù)計算樣本協(xié)方差陣S,作為協(xié)方差陣的估計.為了建立公因子模型,首先要估計因子載荷aij和特殊因子方差

i2.常用的參數(shù)估計方法有一下幾種:主成分法,主因子解和極大似然法.第8章因子分析一、主成分法(基于主成分模型的主成分分析法Principalcomponents)

設樣本協(xié)方差陣S的特征值為

1≥

2≥…≥

p≥0,相應單位正交特征向量為l1,l2,…,lp,則S有譜分解式:第8章因子分析當最后p-m

個特征值較小時,S可近似地分解為(8.3.1)第8章因子分析其中def(8.3.2)(8.3.2)式給出的A和D就是因子模型的一個解.載荷矩陣A中第j列(即第j個公共因子Fj在X上的載荷)和X的第j個主成分的系數(shù)相差一個倍數(shù)故(8.3.2)式給出的這個解常稱為因子模型的主成分解.第8章因子分析

公因子個數(shù)m的確定方法一般有兩種,一是根據(jù)實際問題的意義或?qū)I(yè)理論知識來確定;二是用確定主成分個數(shù)的原則,選m為滿足:的最小整數(shù)(比如取P0≥0.70且P0<1).

當相關(guān)變量所取單位不同時,我們常常先對變量標準化.標準化變量的樣本協(xié)方差陣就是原始變量的樣本相關(guān)陣R,再用R代替S,與上類似,即可的主成分.第8章因子分析

例:

假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型.第8章因子分析(1)求解特征根(2)求解單位特征向量:(3)因子載荷矩陣:第8章因子分析(4)因子分析模型:

可取前兩個因子F1和F2為公共因子,第一公因子F1物價就業(yè)因子,對X的貢獻為1.55.第二公因子F2為投資因子,對X的貢獻為0.85.共同度分別為0.987,0.706,0.706。第8章因子分析此方法是從R出發(fā),是對主成分方法的一種修正.假定我們首先對變量進行標準化變換,則

R=AA’+DR*=AA’=R-D稱R*為約相關(guān)矩陣,R*對角線上的元素是,而不是1.二、主因子解(基于因子分析模型的主軸因子法Principalaxisfactoring)這里第8章因子分析直接求R*的前p個特征根和對應的單位正交特征向量,得如下的矩陣:第8章因子分析當特殊因子的方差已知:第8章因子分析方差矩陣未知,估計的方法有如下幾種:

1)取,在這個情況下主因子解與主成分解等價;

2)取,為Xi與其他所有的原始變量Xj的復相關(guān)系數(shù)的平方,即Xi對其余的p-1個Xj的回歸方程的判定系數(shù),這是因為Xi

與公共因子的關(guān)系是通過其余的p-1個Xj

的線性組合聯(lián)系起來的;

3)取,這意味著取Xi與其余的Xj的簡單相關(guān)系數(shù)的絕對值最大者;

4)取,其中要求該值為正數(shù)。

5)取,其中是的對角元素。第8章因子分析

例:假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主因子分析法求因子分析模型.假定用代替初始的。。第8章因子分析(1)求解特征根:(2)對應的非0特征向量:(3)因子載荷矩陣表:第8章因子分析(4)因子分析模型:(5)新的共同度:第8章因子分析三、主成分估計法的具體步驟設樣本數(shù)據(jù)陣為第8章因子分析應用主成分估計法求因子模型的具體步驟如下:def其中其中第8章因子分析(2)

求R的特征值和標準化特征向量.記

1≥

2≥…≥

p≥0為R的特征值,其相應的單位正交特征向量為l1,l2,…,lp.(3)

求因子模型的因子載荷矩陣A:①

確定公共因子的個數(shù)m.比如取m滿足(

1+

2+…+

m)/p≥0.80(或0.70或0.90)的最小正整數(shù);②

令則A=(a1,…,am)為因子載荷矩陣.(4)

求特殊因子方差Xi的共同度hi2為(5)

對m個公共因子(或稱潛因子,主因子)作解釋.(1)

由樣本數(shù)據(jù)陣X計算樣本均值、樣本離差陣及樣本相關(guān)陣.第8章因子分析因子旋轉(zhuǎn):為什么要旋轉(zhuǎn)因子?

建立了因子分析數(shù)學目的不僅僅要找出公共因子以及對變量進行分組,更重要的要知道每個公共因子的意義,以便進行進一步的分析,如果每個公共因子的含義不清,則不便于進行實際背景的解釋。由于因子載荷陣是不惟一的,所以應該對因子載荷陣進行旋轉(zhuǎn)。目的是使每個變量在盡可能少的因子上有比較高的載荷,讓某個變量在某個因子上的載荷趨于1,而在其他因子上的載荷趨于0,即:使載荷矩陣每列或行的元素平方值向0和1兩極分化。第8章因子分析奧運會十項全能運動項目得分數(shù)據(jù)的因子分析

百米跑成績跳遠成績鉛球成績跳高成績

400米跑成績百米跨欄鐵餅成績撐桿跳遠成績標槍成績

1500米跑成績

第8章因子分析第8章因子分析因

陣因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運動因子。其他的3個因子不太容易解釋。似乎是跑和投擲的能力對比,似乎是長跑耐力和短跑速度的對比。于是考慮旋轉(zhuǎn)因子,得下表第8章因子分析旋轉(zhuǎn)變幻后因子載荷矩陣第8章因子分析

通過旋轉(zhuǎn),因子有了較為明確的含義。百米跑,跳遠和400米跑,需要爆發(fā)力的項目在有較大的載荷,可以稱為短跑速度因子;鉛球,鐵餅和標槍在上有較大的載荷,可以稱為爆發(fā)性臂力因子;百米跨欄,撐桿跳遠,跳遠和跳高在上有較大的載荷,爆發(fā)腿力因子;長跑耐力因子。第8章因子分析

旋轉(zhuǎn)的方法有:(1)正交旋轉(zhuǎn);(2)斜交旋轉(zhuǎn)(1)正交旋轉(zhuǎn)由初始載荷矩陣A左乘一正交矩陣得到;目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠離0;只是在旋轉(zhuǎn)后的新的公因子仍保持獨立性。主要有以下方法:varimax:方差最大旋轉(zhuǎn)。簡化對因子的解釋quartmax:四次最大正交旋轉(zhuǎn)。簡化對變量的解釋equamax:等量正交旋轉(zhuǎn)第8章因子分析A、方差最大法

方差最大法從簡化因子載荷矩陣的每一列出發(fā),使和每個因子有關(guān)的載荷的平方的方差最大。當只有少數(shù)幾個變量在某個因子上有較高的載荷時,對因子的解釋最簡單。方差最大的直觀意義是希望通過因子旋轉(zhuǎn)后,使每個因子上的載荷盡量拉開距離,一部分的載荷趨于

1,另一部分趨于0。第8章因子分析B、四次方最大旋轉(zhuǎn)

四次方最大旋轉(zhuǎn)是從簡化載荷矩陣的行出發(fā),通過旋轉(zhuǎn)初始因子,使每個變量只在一個因子上有較高的載荷,而在其它的因子上盡可能低的載荷。如果每個變量只在一個因子上有非零的載荷,這時的因子解釋是最簡單的。四次方最大法通過使因子載荷矩陣中每一行的因子載荷平方的方差達到最大。C、等量最大法

等量最大法把四次方最大法和方差最大法結(jié)合起來求行和列因子載荷平方的方差的加權(quán)平均最大。第8章因子分析(2)斜交旋轉(zhuǎn)

目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠離0;只是在旋轉(zhuǎn)時,放棄了因子之間彼此獨立的限制,旋轉(zhuǎn)后的新公因子更容易解釋。主要有以下的方法:directoblimin:直接斜交旋轉(zhuǎn)。允許因子之間具有相關(guān)性;promax:斜交旋轉(zhuǎn)方法。允許因子之間具有相關(guān)性;第8章因子分析因子得分因子得分的概念

前面我們主要解決了用公共因子的線性組合來表示一組觀測變量的有關(guān)問題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來做回歸分析,對樣本進行分類或評價,這就需要我們對公共因子進行測度,即給出公共因子的值。所謂的因子得分,就是要求把公共因子表示成變量的線性組合,或反過來對每一個樣品計算公共因子的估計值.第8章因子分析例:人均要素變量因子分析。對我國32個省市自治區(qū)的要素狀況作因子分析。指標體系中有如下指標:X1

:人口(萬人)X2

:面積(萬平方公里)X3

:GDP(億元)X4

:人均水資源(立方米/人)X5:人均生物量(噸/人)X6:萬人擁有的大學生數(shù)(人)X7:萬人擁有科學家、工程師數(shù)(人)

RotatedFactorPattern(旋轉(zhuǎn)后的因子結(jié)構(gòu))FACTOR1FACTOR2FACTOR3

X1

-0.21522-0.273970.89092

X20.63973-0.28739-0.28755

X3

-0.157910.063340.94855

X40.95898-0.01501-0.07556

X50.97224-0.06778-0.17535

X6

-0.114160.98328-0.08300X7

-0.110410.97851-0.07246第8章因子分析

X1=-0.21522F1-0.27397F2+0.89092F3

X2=0.63973F1-0.28739F2-0.28755F3

X3=-0.15791F1+0.06334F2+0.94855F3

X4=0.95898F1-0.01501F2-0.07556F3

X5=0.97224F1-0.06778F2-0.17535F3

X6=-0.11416F1+0.98328F2-0.08300F3

X7=-0.11041F1+0.97851F2-0.07246F3第8章因子分析

高載荷指標

因子命名

因子1X2:面積(萬平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子

因子2X6:萬人擁有的大學生數(shù)(人)X7:萬人擁有的科學家、工程師數(shù)(人)

人力資源因子

因子3

X1:人口(萬人)X3:GDP(億元)經(jīng)濟發(fā)展總量因子

第8章因子分析StandardizedScoringCoefficients(標準化得分系數(shù))

FACTOR1

FACTOR2

FACTOR3

X1

0.05764

-0.06098

0.50391

X2

0.22724

-0.09901

-0.07713

X3

0.14635

0.12957

0.59715

X4

0.47920

0.11228

0.17062

X5

0.45583

0.07419

0.10129

X6

0.05416

0.48629

0.04099

X7

0.05790

0.48562

0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7第8章因子分析

前三個因子得分地區(qū)

FACTOR1FACTOR2FACTOR3北京?-0.081694.23473-0.37983天津-0.474221.31789-0.87891河北-0.22192-0.358020.86263山西-0.48214-0.32643-0.54219內(nèi)蒙0.54446-0.66668-0.92621遼寧-0.205110.463770.34087吉林-0.214990.10608-0.57431黑龍江

0.10839-0.11717-0.02219上海-0.200692.38962-0.04259第8章因子分析因子分析的數(shù)學模型為:原變量被表示為公共因子的線性組合,當載荷矩陣旋轉(zhuǎn)之后,公共因子可以做出解釋,通常的情況下,我們還想反過來把公共因子表示為原變量的線性組合。因子得分函數(shù):第8章因子分析可見,要求得每個因子的得分,必須求得分函數(shù)的系數(shù),而由于p>m,所以不能得到精確的得分,只能通過估計。因子得分的計算方法:(1)運用回歸分析思想求解(2)Bartlett法(即:加權(quán)最小二乘法)第8章因子分析(1)運用回歸分析思想求解第8章因子分析則,我們有如下的方程組:第8章因子分析(j=1,2,…,m)第8章因子分析注:共需要解m次才能解出所有的得分函數(shù)的系數(shù).第8章因子分析(2)Bartlett法(即:加權(quán)最小二乘法)把一個個體的p個變量的取值X*當作因變量,把求因子解中得到的A作為自變量數(shù)據(jù)陣,對于這個個體在公因子上的取值f,當作未知參數(shù),而特殊因子的取值看作誤差e,于是得到如下的線性回歸模型:X*=Af+e,則稱未知參數(shù)f為取值為X*的因子得分。

最小二乘法第8章因子分析案例分析:國民生活質(zhì)量的因素分析

國家發(fā)展的最終目標,是為了全面提高全體國民的生活質(zhì)量,滿足廣大國民日益增長的物質(zhì)和文化的合理需求。在可持續(xù)發(fā)展消費的統(tǒng)一理念下,增加社會財富,創(chuàng)造更多的物質(zhì)文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進化的基礎上,維系人類與自然的平衡,達到完整的代際公平和區(qū)際公平(即時間過程的最大合理性與空間分布的最大合理化)。從1990年開始,聯(lián)合國開發(fā)計劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標對于國民生活質(zhì)量進行測度。人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標組合,即人的健康狀況(使用出生時的人均預期壽命表達)、人的智力程度(使用組合的教育成就表達)、人的福利水平(使用人均國民收入或人均GDP表達),并且特別強調(diào)三類指標組合的整體表達內(nèi)涵,去衡量一個國家或地區(qū)的社會發(fā)展總體狀況以及國民生活質(zhì)量的總水平。第8章因子分析在這個指標體系中有如下的指標:X1——預期壽命X2——成人識字率X3——綜合入學率X4——人均GDP(美元)X5——預期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù)第8章因子分析旋轉(zhuǎn)后的因子結(jié)構(gòu)

RotatedFactorPatternFACTOR1FACTOR2FACTOR3

X10.381290.417650.81714

X20.121660.848280.45981

X30.648030.618220.22398

X4

0.904100.205310.34100

X50.388540.432950.80848

X60.282070.853250.43289

X7

0.900910.206120.35052

FACTOR1為經(jīng)濟發(fā)展因子

FACTOR2為教育成就因子

FACTOR3為健康水平因子第8章因子分析StandardizedScoringCoefficients(標準化得分系數(shù))FACTOR1FACTOR2FACTOR3X1-0.18875-0.343970.85077X2-0.241090.60335-0.10234X30.354620.50232-0.59895X40.53990-0.17336-0.10355X5-0.17918-0.316040.81490X6-0.092300.62258-0.24876第8章因子分析

生育率的影響因素分析

生育率受社會、經(jīng)濟、文化、計劃生育政策等很多因素影響,但這些因素對生育率的影響并不是完全獨立的,而是交織在一起,如果直接用選定的變量對生育率進行多元回歸分析,最終結(jié)果往往只能保留兩三個變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對生育率進行分析。選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國民收入。下表是1990年中國30個省、自治區(qū)、直轄市的數(shù)據(jù)。第8章因子分析第8章因子分析特征根與各因子的貢獻Eigenvalue特征值DifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201

1.0000第8章因子分析沒有旋轉(zhuǎn)的因子結(jié)構(gòu)

Factor1Factor2X1-0.760620.55316X20.56898-0.76662X30.891840.25374X40.870660.34618X50.890760.36962第8章因子分析各旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.93006369Factor1可解釋方差Factor2可解釋方差2.99754292.1642615第8章因子分析

在這個例子中我們得到了兩個因子,第一個因子是社會經(jīng)濟發(fā)展水平因子,第二個是計劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進行其他的統(tǒng)計分析。

Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728

Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu)標準化得分函數(shù)第8章因子分析因子分析的SPSS上機操作過程(1)選擇分析變量

——選SPSS[Analyze]菜單中的(DataReduction)→(Factor),出現(xiàn)【FactorAnalysis】對話框;——在【FactorAnalysis】對話框中左邊的原始變量中,選擇將進行因子分析的變量選入(Variables)欄。第8章因子分析第8章因子分析(2)設置描述性統(tǒng)計量——在【FactorAnalysis】框中選【Descriptives】按鈕,出現(xiàn)【Descriptives】對話框;——選擇Initialsolution(未轉(zhuǎn)軸的統(tǒng)計量)選項——選擇KMO選項——點擊(Contiue)按鈕確定。提供描述性統(tǒng)計量和與相關(guān)矩陣有關(guān)的統(tǒng)計量第8章因子分析顯示各觀測變量的均值和標準差顯示公因子方差、特征值、各因子解釋的方差比例和累計比例觀測變量的相關(guān)系數(shù)矩陣每個相關(guān)系數(shù)的顯著水平相關(guān)系數(shù)矩陣的行列式相關(guān)系數(shù)矩陣的逆矩陣由因子模型估計出的相關(guān)系數(shù)及殘差反應象相關(guān)系數(shù)KMO測度和巴特利特球體檢驗第8章因子分析(3)設置對因子的抽取選項

——在【FactorAnalysis】框中點擊【Extraction】按鈕,出現(xiàn)【FactorAnalysis:Extraction】對話框;——在Method欄中選擇(Principalcomponents)選項;——在Analyze欄中選擇Correlationmatrix選項;——在Display欄中選擇Unrotatedfactorsolution選項;——在Extract欄中選擇Eigenvaluesover并填上1;——點擊(Contiue)按鈕確定,回到【FactorAnalysis】對話框中。第8章因子分析提供和因子提取有關(guān)的選項第8章因子分析選擇提取因子的方法決定提取因子的個數(shù)直接指定提取的因子的個數(shù)指定與初始有關(guān)的輸出項顯示未經(jīng)旋轉(zhuǎn)的因子解顯示碎石圖指定因子分析收斂的最大迭代次數(shù).系統(tǒng)默認值是25.第8章因子分析其中選擇的方法,從上到下依次是:主成分分析普通最小二乘法廣義最小二乘法最大似然法主軸因子法-主因子解法

因子提取法映象分析法第8章因子分析(4)設置因子轉(zhuǎn)軸——

在【FactorAnalysis】對話框中,點擊【Rotation】按鈕,出現(xiàn)【FactorAnalysis:Rotation】(因子分析:旋轉(zhuǎn))對話框。

——

在Method欄中選擇Varimax(最大變異法)

——

在Display欄中選擇Rotatedsolution(轉(zhuǎn)軸后的解)

——

點擊(Contiue)按鈕確定,回到【FactorAnalysis】對話框中。

提供和因子旋轉(zhuǎn)有關(guān)的選項第8章因子分析選擇因子旋轉(zhuǎn)的方法不進行旋轉(zhuǎn)方差最大法斜交旋轉(zhuǎn)法四次方最大法等量最大法指定輸出項顯示旋轉(zhuǎn)后的因子解顯示因子負載圖指定旋轉(zhuǎn)收斂的最大迭代次數(shù).系統(tǒng)默認值為25.第8章因子分析(5)設置因素分數(shù)——

在【FactorAnalysis】對話框中,點擊【Scores】按鈕,出現(xiàn)【FactorAnalysis:Scores】(因素分析:分數(shù))對話框.

——

一般取默認值.

——

點擊(Contiue)按鈕確定,回到【FactorAnalysis】對話框.提供和因子值有關(guān)的選項第8章因子分析指定計算因子值的方法回歸法加權(quán)最小二乘法安德森-魯賓法將因子值作為新變量保存在數(shù)據(jù)文件中顯示因子值系數(shù)矩陣第8章因子分析(6)設置因子分析的選項——在【FactorAnalysis】對話框中,單擊【Options】按鈕,出現(xiàn)【FactorAnalysis:Options】(因素分析:選項)對話框。——在MissingValues

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論