《多元統(tǒng)計(jì)分析》課件因子分析_第1頁(yè)
《多元統(tǒng)計(jì)分析》課件因子分析_第2頁(yè)
《多元統(tǒng)計(jì)分析》課件因子分析_第3頁(yè)
《多元統(tǒng)計(jì)分析》課件因子分析_第4頁(yè)
《多元統(tǒng)計(jì)分析》課件因子分析_第5頁(yè)
已閱讀5頁(yè),還剩153頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

因子分析1因子分析1

§1引言因子分析(factoranalysis)是一種數(shù)據(jù)簡(jiǎn)化的技術(shù)。它通過(guò)研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測(cè)數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)假想變量來(lái)表示其基本的數(shù)據(jù)結(jié)構(gòu)。這幾個(gè)假想變量能夠反映原來(lái)眾多變量的主要信息。原始的變量是可觀測(cè)的顯在變量,而假想變量是不可觀測(cè)的潛在變量,稱為因子。例如,在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過(guò)一個(gè)有24個(gè)指標(biāo)構(gòu)成的評(píng)價(jià)體系,評(píng)價(jià)百貨商場(chǎng)的24個(gè)方面的優(yōu)劣。2§1引言2但消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過(guò)24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在的因子,對(duì)商店進(jìn)行綜合評(píng)價(jià)。而這三個(gè)公共因子可以表示為:

稱是不可觀測(cè)的潛在因子。24個(gè)變量共享這三個(gè)因子,但是每個(gè)變量又有自己的個(gè)性,不被包含的部分,稱為特殊因子。3但消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的注:

因子分析與回歸分析不同,因子分析中的因子是一個(gè)比較抽象的概念,而回歸因子有非常明確的實(shí)際意義;

主成分分析分析與因子分析也有不同,主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型。主成分分析:原始變量的線性組合表示新的綜合變量,即主成分;因子分析:潛在的假想變量和隨機(jī)影響變量的線性組合表示原始變量。4注:4§2因子分析模型

一、數(shù)學(xué)模型設(shè)個(gè)變量,如果表示為5§2因子分析模型一、數(shù)學(xué)模型設(shè)稱為公共因子,是不可觀測(cè)的變量,他們的系數(shù)稱為因子載荷。是特殊因子,是不能被前m個(gè)公共因子包含的部分。并且滿足:即不相關(guān);即互不相關(guān),方差為1。6稱為公共因子,是不可觀測(cè)的變量,他們即互不相關(guān),方差不一定相等,。7即互不相關(guān),方差不一定相等,。7用矩陣的表達(dá)方式8用矩陣的表達(dá)方式8二、因子分析模型的性質(zhì)1、原始變量X的協(xié)方差矩陣的分解D的主對(duì)角線上的元素值越小,則公共因子共享的成分越多。9二、因子分析模型的性質(zhì)1、原始變量X的協(xié)方差矩陣的分解2、模型不受計(jì)量單位的影響將原始變量X做變換X*=CX,這里C=diag(c1,c2,…,cn),ci>0。102、模型不受計(jì)量單位的影響將原始變量X11113、因子載荷不是惟一的設(shè)T為一個(gè)p×p的正交矩陣,令A(yù)*=AT,F(xiàn)*=T’F,則模型可以表示為且滿足條件因子模型的條件123、因子載荷不是惟一的設(shè)T為一個(gè)三、因子載荷矩陣中的幾個(gè)統(tǒng)計(jì)特征1、因子載荷aij的統(tǒng)計(jì)意義因子載荷是第i個(gè)變量與第j個(gè)公共因子的相關(guān)系數(shù)

模型為

在上式的左右兩邊乘以

,再求數(shù)學(xué)期望

根據(jù)公共因子的模型性質(zhì),有(載荷矩陣中第i行,第j列的元素)反映了第i個(gè)變量與第j個(gè)公共因子的相關(guān)重要性。絕對(duì)值越大,相關(guān)的密切程度越高。13三、因子載荷矩陣中的幾個(gè)統(tǒng)計(jì)特征1、因子載荷aij的2、變量共同度的統(tǒng)計(jì)意義定義:變量的共同度是因子載荷矩陣的第i行的元素的平方和。記為統(tǒng)計(jì)意義:兩邊求方差

所有的公共因子和特殊因子對(duì)變量的貢獻(xiàn)為1。如果非??拷?,非常小,則因子分析的效果好,從原變量空間到公共因子空間的轉(zhuǎn)化性質(zhì)好。142、變量共同度的統(tǒng)計(jì)意義定義:變量的共同度是3、公共因子方差貢獻(xiàn)的統(tǒng)計(jì)意義因子載荷矩陣中各列元素的平方和稱為某一公共因子對(duì)諸變量所提供的方差貢獻(xiàn)和。衡量的相對(duì)重要性。153、公共因子方差貢獻(xiàn)的統(tǒng)計(jì)意義因子載荷矩陣中各列元§3因子載荷矩陣的估計(jì)方法設(shè)隨機(jī)向量的均值為,協(xié)方差為,為的特征根,為對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量,則主成分分析法16§3因子載荷矩陣的估計(jì)方法設(shè)隨機(jī)向量上式給出的表達(dá)式是精確的,然而,它實(shí)際上是毫無(wú)價(jià)值的,因?yàn)槲覀兊哪康氖菍で笥蒙贁?shù)幾個(gè)公共因子解釋,故略去后面的p-m項(xiàng)的貢獻(xiàn),有17上式給出的表達(dá)式是精確的,然而,它實(shí)際上是毫

上式有一個(gè)假定,模型中的特殊因子是不重要的,因而從的分解中忽略了特殊因子的方差。18上式有一個(gè)假定,模型中的特殊因子例假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型。19例假定某地固定資產(chǎn)投資率,通貨膨

特征根為:20特征根為:20可取前兩個(gè)因子F1和F2為公共因子,第一公因子F1物價(jià)就業(yè)因子,對(duì)X的貢獻(xiàn)為1.55。第一公因子F2為投資因子,對(duì)X的貢獻(xiàn)為0.85。共同度分別為1,0.706,0.706。21可取前兩個(gè)因子F1和F2為公共因子,第一

§4因子旋轉(zhuǎn)(正交變換)建立了因子分析數(shù)學(xué)目的不僅僅要找出公共因子以及對(duì)變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析,如果每個(gè)公共因子的含義不清,則不便于進(jìn)行實(shí)際背景的解釋。由于因子載荷陣是不惟一的,所以應(yīng)該對(duì)因子載荷陣進(jìn)行旋轉(zhuǎn)。目的是使因子載荷陣的結(jié)構(gòu)簡(jiǎn)化,使載荷矩陣每列或行的元素平方值向0和1兩極分化。有三種主要的正交旋轉(zhuǎn)法。四次方最大法、方差最大法和等量最大法。22§4因子旋轉(zhuǎn)(正交變換)建立了因子分析數(shù)學(xué)百米跑成績(jī)跳遠(yuǎn)成績(jī)鉛球成績(jī)跳高成績(jī)

400米跑成績(jī)百米跨欄鐵餅成績(jī)撐桿跳遠(yuǎn)成績(jī)標(biāo)槍成績(jī)

1500米跑成績(jī)

奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目得分?jǐn)?shù)據(jù)的因子分析

23百米跑成績(jī)奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目232424因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運(yùn)動(dòng)因子。其他的3個(gè)因子不太容易解釋。似乎是跑和投擲的能力對(duì)比,似乎是長(zhǎng)跑耐力和短跑速度的對(duì)比。于是考慮旋轉(zhuǎn)因子,得下表

25因子載荷矩陣可以看出,除第一因子在所有的變量在公共因2626通過(guò)旋轉(zhuǎn),因子有了較為明確的含義。百米跑,400米跑,需要爆發(fā)力的項(xiàng)目在有較大的載荷,可以稱為短跑速度因子;鉛球,鐵餅和標(biāo)槍在上有較大的載荷,可以稱為爆發(fā)性臂力因子;百米跨欄,撐桿跳遠(yuǎn),跳遠(yuǎn)和為跳高在上有較大的載荷,爆發(fā)腿力因子;長(zhǎng)跑耐力因子。27通過(guò)旋轉(zhuǎn),因子有了較為明確的含義。百米跑變換后因子的共同度設(shè)正交矩陣,做正交變換變換后因子的共同度沒(méi)有發(fā)生變化!(二)旋轉(zhuǎn)方法28變換后因子的共同度設(shè)正交矩陣,做正交變換變換后因子的共同度變換后因子貢獻(xiàn)設(shè)正交矩陣,做正交變換變換后因子的貢獻(xiàn)發(fā)生了變化!29變換后因子貢獻(xiàn)設(shè)正交矩陣,做正交變換變換后因子的貢獻(xiàn)發(fā)生了1、方差最大法

方差最大法從簡(jiǎn)化因子載荷矩陣的每一列出發(fā),使和每個(gè)因子有關(guān)的載荷的平方的方差最大。當(dāng)只有少數(shù)幾個(gè)變量在某個(gè)因子上又較高的載荷時(shí),對(duì)因子的解釋最簡(jiǎn)單。方差最大的直觀意義是希望通過(guò)因子旋轉(zhuǎn)后,使每個(gè)因子上的載荷盡量拉開距離,一部分的載荷趨于1,另一部分趨于0。301、方差最大法3031313232

§5因子得分

(一)因子得分的概念

前面我們主要解決了用公共因子的線性組合來(lái)表示一組觀測(cè)變量的有關(guān)問(wèn)題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來(lái)做回歸分析,對(duì)樣本進(jìn)行分類或評(píng)價(jià),這就需要我們對(duì)公共因子進(jìn)行測(cè)度,即給出公共因子的值。33§5因子得分(一)因子得分的概念前面我們?nèi)司刈兞恳蜃臃治?。?duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況作因子分析。指標(biāo)體系中有如下指標(biāo):X1:人口(萬(wàn)人)X2:面積(萬(wàn)平方公里)X3:GDP(億元)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)X6:萬(wàn)人擁有的大學(xué)生數(shù)(人)X7:萬(wàn)人擁有科學(xué)家、工程師數(shù)(人)RotatedFactorPatternFACTOR1FACTOR2FACTOR3X1-0.21522-0.273970.89092X20.63973-0.28739-0.28755X3-0.157910.063340.94855X40.95898-0.01501-0.07556X50.97224-0.06778-0.17535X6-0.114160.98328-0.08300X7-0.110410.97851-0.0724634人均要素變量因子分析。對(duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況

高載荷指標(biāo)

因子命名

因子1X2;面積(萬(wàn)平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子

因子2X6:萬(wàn)人擁有的大學(xué)生數(shù)(人)X7:萬(wàn)人擁有的科學(xué)家、工程師數(shù)(人)

人力資源因子

因子3

X1;人口(萬(wàn)人)X3:GDP(億元)經(jīng)濟(jì)發(fā)展總量因子

X1=-0.21522F1-0.27397F2+0.89092F3X2=0.63973F1-0.28739F2-0.28755F3X3=-0.15791F1+0.06334F2+0.94855F3X4=0.95898F1-0.01501F2-0.07556F3X5=0.97224F1-0.06778F2-0.17535F3X6=-0.11416F1+0.98328F2-0.08300F3X7=-0.11041F1+0.97851F2-0.07246F335

X2;面積(萬(wàn)平方公里)自然資源因子

X6:萬(wàn)人擁有StandardizedScoringCoefficients

FACTOR1

FACTOR2

FACTOR3X10.05764

-0.06098

0.50391X20.22724

-0.09901

-0.07713X30.14635

0.12957

0.59715X40.47920

0.11228

0.17062X50.45583

0.07419

0.10129X60.05416

0.48629

0.04099X70.05790

0.48562

0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X736StandardizedScoringCoefficiREGIONFACTOR1FACTOR2FACTOR3beijing?-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259前三個(gè)因子得分37REGIONFACTOR1FACTOR2FACTOR3be因子分析的數(shù)學(xué)模型為:

原變量被表示為公共因子的線性組合,當(dāng)載荷矩陣旋轉(zhuǎn)之后,公共因子可以做出解釋,通常的情況下,我們還想反過(guò)來(lái)把公共因子表示為原變量的線性組合。因子得分函數(shù):可見(jiàn),要求得每個(gè)因子的得分,必須求得分函數(shù)的系數(shù),而由于p>m,所以不能得到精確的得分,只能通過(guò)估計(jì)。38因子分析的數(shù)學(xué)模型為:原變量被表示為公共回歸方法

1)思想39回歸方法1)思想39則,我們有如下的方程組:40則,我們有如下的方程組:40j=1,2,…,m41j=1,2,…,m41

注:共需要解m次才能解出所有的得分函數(shù)的系數(shù)。42注:共需要解m次才能解42國(guó)民生活質(zhì)量的因素分析

國(guó)家發(fā)展的最終目標(biāo),是為了全面提高全體國(guó)民的生活質(zhì)量,滿足廣大國(guó)民日益增長(zhǎng)的物質(zhì)和文化的合理需求。在可持續(xù)發(fā)展消費(fèi)的統(tǒng)一理念下,增加社會(huì)財(cái)富,創(chuàng)自更多的物質(zhì)文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進(jìn)化的基礎(chǔ)上,維系人類與自然的平衡,達(dá)到完整的代際公平和區(qū)際公平(即時(shí)間過(guò)程的最大合理性與空間分布的最大合理化)。從1990年開始,聯(lián)合國(guó)開發(fā)計(jì)劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標(biāo)對(duì)于國(guó)民生活質(zhì)量進(jìn)行測(cè)度。人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標(biāo)組合,即人的健康狀況(使用出生時(shí)的人均預(yù)期壽命表達(dá))、人的智力程度(使用組合的教育成就表達(dá))、人的福利水平(使用人均國(guó)民收入或人均GDP表達(dá)),并且特別強(qiáng)調(diào)三類指標(biāo)組合的整體表達(dá)內(nèi)涵,去衡量一個(gè)國(guó)家或地區(qū)的社會(huì)發(fā)展總體狀況以及國(guó)民生活質(zhì)量的總水平。43國(guó)民生活質(zhì)量的因素分析43在這個(gè)指標(biāo)體系中有如下的指標(biāo):X1——預(yù)期壽命X2——成人識(shí)字率X3——綜合入學(xué)率X4——人均GDP(美圓)X5——預(yù)期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù)44在這個(gè)指標(biāo)體系中有如下的指標(biāo):44旋轉(zhuǎn)后的因子結(jié)構(gòu)RotatedFactorPatternFACTOR1FACTOR2FACTOR3X10.381290.417650.81714X20.121660.848280.45981X30.648030.618220.22398X40.904100.205310.34100X50.388540.432950.80848X60.282070.853250.43289X70.900910.206120.35052

FACTOR1為經(jīng)濟(jì)發(fā)展因子

FACTOR2為教育成就因子FACTOR3為健康水平因子45旋轉(zhuǎn)被每個(gè)因子解釋的方差和共同度VarianceexplainedbyeachfactorFACTOR1FACTOR2FACTOR32.4397002.2763172.009490FinalCommunalityEstimates:Total=6.725507X1X2X3X4X50.9875300.9457960.8523060.9758300.992050

X6X70.9949950.976999

46

生育率的影響因素分析生育率受社會(huì)、經(jīng)濟(jì)、文化、計(jì)劃生育政策等很多因素影響,但這些因素對(duì)生育率的影響并不是完全獨(dú)立的,而是交織在一起,如果直接用選定的變量對(duì)生育率進(jìn)行多元回歸分析,最終結(jié)果往往只能保留兩三個(gè)變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對(duì)生育率進(jìn)行分析。選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國(guó)民收入。下表是1990年中國(guó)30個(gè)省、自治區(qū)、直轄市的數(shù)據(jù)。47生育率的影響因素分析生育率受社會(huì)、經(jīng)濟(jì)、文化4848EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201

1.0000特征根與各因子的貢獻(xiàn)49EigenvalueDifferenceProportion

Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962沒(méi)有旋轉(zhuǎn)的因子結(jié)構(gòu)50

Factor1Factor2x1-0.760620.553Factor1可解釋方差Factor2可解釋方差2.99754292.1642615各旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.9300636951Factor1可解釋方差Factor2可解釋方差2.9975

在這個(gè)例子中我們得到了兩個(gè)因子,第一個(gè)因子是社會(huì)經(jīng)濟(jì)發(fā)展水平因子,第二個(gè)是計(jì)劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進(jìn)行其他的統(tǒng)計(jì)分析。

Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728

Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu)標(biāo)準(zhǔn)化得分函數(shù)52

§6因子分析的步驟、展望和建議

計(jì)算所選原始變量的相關(guān)系數(shù)矩陣

相關(guān)系數(shù)矩陣描述了原始變量之間的相關(guān)關(guān)系。可以幫助判斷原始變量之間是否存在相關(guān)關(guān)系,這對(duì)因子分析是非常重要的,因?yàn)槿绻x變量之間無(wú)關(guān)系,做因子分析是不恰當(dāng)?shù)?。并且相關(guān)系數(shù)矩陣是估計(jì)因子結(jié)構(gòu)的基礎(chǔ)。選擇分析的變量用定性分析和定量分析的方法選擇變量,因子分析的前提條件是觀測(cè)變量間有較強(qiáng)的相關(guān)性,因?yàn)槿绻兞恐g無(wú)相關(guān)性或相關(guān)性較小的話,他們不會(huì)有共享因子,所以原始變量間應(yīng)該有較強(qiáng)的相關(guān)性。一、因子分析通常包括以下五個(gè)步驟53§6因子分析的步驟、展望和建議

選擇分析提取公共因子

這一步要確定因子求解的方法和因子的個(gè)數(shù)。需要根據(jù)研究者的設(shè)計(jì)方案或有關(guān)的經(jīng)驗(yàn)或知識(shí)事先確定。因子個(gè)數(shù)的確定可以根據(jù)因子方差的大小。只取方差大于1(或特征值大于1)的那些因子,因?yàn)榉讲钚∮?的因子其貢獻(xiàn)可能很小;按照因子的累計(jì)方差貢獻(xiàn)率來(lái)確定,一般認(rèn)為要達(dá)到60%才能符合要求;

因子旋轉(zhuǎn)

通過(guò)坐標(biāo)變換使每個(gè)原始變量在盡可能少的因子之間有密切的關(guān)系,這樣因子解的實(shí)際意義更容易解釋,并為每個(gè)潛在因子賦予有實(shí)際意義的名字。

54提取公共因子54

計(jì)算因子得分求出各樣本的因子得分,有了因子得分值,則可以在許多分析中使用這些因子,例如以因子的得分做聚類分析的變量,做回歸分析中的回歸因子。

55計(jì)算因子得分55因子分析是十分主觀的,在許多出版的資料中,因子分析模型都用少數(shù)可闡述因子提供了合理解釋。實(shí)際上,絕大多數(shù)因子分析并沒(méi)有產(chǎn)生如此明確的結(jié)果。不幸的是,評(píng)價(jià)因子分析質(zhì)量的法則尚未很好量化,質(zhì)量問(wèn)題只好依賴一個(gè)“哇!”準(zhǔn)則

如果在仔細(xì)檢查因子分析的時(shí)候,研究人員能夠喊出“哇,我明白這些因子”的時(shí)候,就可看著是成功運(yùn)用了因子分析方法。56因子分析是十分主觀的,在許多出版的資料中,因子分析和主成分分析的一些注意事項(xiàng)

可以看出,因子分析和主成分分析都依賴于原始變量,也只能反映原始變量的信息。所以原始變量的選擇很重要。另外,如果原始變量都本質(zhì)上獨(dú)立,那么降維就可能失敗,這是因?yàn)楹茈y把很多獨(dú)立變量用少數(shù)綜合的變量概括。數(shù)據(jù)越相關(guān),降維效果就越好。在得到分析的結(jié)果時(shí),并不一定會(huì)都得到如我們例子那樣清楚的結(jié)果。這與問(wèn)題的性質(zhì),選取的原始變量以及數(shù)據(jù)的質(zhì)量等都有關(guān)系在用因子得分進(jìn)行排序時(shí)要特別小心,特別是對(duì)于敏感問(wèn)題。由于原始變量不同,因子的選取不同,排序可以很不一樣。57因子分析和主成分分析的一些注意事項(xiàng)

可以看出,因子分析和主SPSS實(shí)現(xiàn)(因子分析與主成分分析)拿student.sav為例,選Analyze-DataReduction-Factor進(jìn)入主對(duì)話框;把math、phys、chem、literat、history、english選入Variables,然后點(diǎn)擊Extraction,在Method選擇一個(gè)方法(如果是主成分分析,則選PrincipalComponents),下面的選項(xiàng)可以隨意,比如要畫碎石圖就選Screeplot,另外在Extract選項(xiàng)可以按照特征值的大小選主成分(或因子),也可以選定因子的數(shù)目;之后回到主對(duì)話框(用Continue)。然后點(diǎn)擊Rotation,再在該對(duì)話框中的Method選擇一個(gè)旋轉(zhuǎn)方法(如果是主成分分析就選None),在Display選Rotatedsolution(以輸出和旋轉(zhuǎn)有關(guān)的結(jié)果)和Loadingplot(以輸出載荷圖);之后回到主對(duì)話框(用Continue)。如果要計(jì)算因子得分就要點(diǎn)擊Scores,再選擇Saveasvariables(因子得分就會(huì)作為變量存在數(shù)據(jù)中的附加列上)和計(jì)算因子得分的方法(比如Regression);之后回到主對(duì)話框(用Continue)。這時(shí)點(diǎn)OK即可。58SPSS實(shí)現(xiàn)(因子分析與主成分分析)拿student.sav主成分分析:洛衫磯對(duì)12個(gè)人口調(diào)查區(qū)的數(shù)據(jù)編號(hào)

總?cè)丝?/p>

總雇員數(shù)

中等校

專業(yè)服務(wù)

中等房?jī)r(jià)

平均校齡

項(xiàng)目數(shù)1 5700 12.8 2500 270 250002 1000 10.9 600 10 100003 3400 8.8 1000 10 90004 3800 13.6 1700 140 250005 4000 12.8 1600 140 250006 8200 8.3 2600 60 120007 1200 11.4 400 10 160008 9100 11.5 3300 60 140009 9900 12.5 3400 180 1800010 9600 13.7 3600 390 2500011 9600 9.6 3300 80 1200012 9400 11.4 4000 100 1300059主成分分析:洛衫磯對(duì)12個(gè)人口調(diào)查區(qū)的數(shù)據(jù)編號(hào)總?cè)颂卣髦?、累積貢獻(xiàn)率60特征值、累積貢獻(xiàn)率60特征值圖61特征值圖61二主成分因子負(fù)荷圖62二主成分因子負(fù)荷圖62主成分的因子負(fù)荷(每列平方和為相應(yīng)特征值,而每列除以相應(yīng)特征值的平方根為相應(yīng)的特征向量)這是主成分與各個(gè)變量的相關(guān)系數(shù)有的書把它當(dāng)成特征向量了SPSS沒(méi)有給出特征向量63主成分的因子負(fù)荷(每列平方和為相應(yīng)特征值,而每列除以相應(yīng)特銷售人員數(shù)據(jù)(50個(gè)觀測(cè)值)銷售增長(zhǎng)銷售利潤(rùn)新客戶銷售額創(chuàng)造力機(jī)械推理抽象推理數(shù)學(xué)推理93.00 96.00 97.80 9.00 12.00 9.00 20.0088.80 91.80 96.80 7.00 10.00 10.00 15.0095.00 100.30 99.00 8.00 12.00 9.00 26.00101.30 103.80 106.80 13.00 14.00 12.00 29.00102.00 107.80 103.00 10.00 15.00 12.00 32.0095.80 97.50 99.30 10.00 14.00 11.00 21.0095.50 99.50 99.00 9.00 12.00 9.00 25.00110.80 122.00 115.30 18.00 20.00 15.00 51.00102.80 108.30 103.80 10.00 17.00 13.00 31.00106.80 120.50 102.00 14.00 18.00 11.00 39.00103.30 109.80 104.00 12.00 17.00 12.00 32.0099.50 111.80 100.30 10.00 18.00 8.00 31.00103.50 112.50 107.00 16.00 17.00 11.00 34.0099.50 105.50 102.30 8.00 10.00 11.00 34.0064銷售人員數(shù)據(jù)(50個(gè)觀測(cè)值)銷售增長(zhǎng)銷售利潤(rùn)新客戶銷售額特征值、累積貢獻(xiàn)率65特征值、累積貢獻(xiàn)率65特征值圖66特征值圖66二主成分因子負(fù)荷圖67二主成分因子負(fù)荷圖67主成分的因子負(fù)荷(每列平方和為相應(yīng)特征值,而每列除以相應(yīng)特征值的平方根為相應(yīng)的特征向量)這是主成分與各個(gè)變量的相關(guān)系數(shù)有書把它當(dāng)成特征向量了SPSS沒(méi)有給出特征向量68主成分的因子負(fù)荷(每列平方和為相應(yīng)特征值,而每列除以相應(yīng)特因子分析:洛衫磯對(duì)12個(gè)人口調(diào)查區(qū)的數(shù)據(jù)編號(hào)

總?cè)丝?/p>

總雇員數(shù)

中等校

專業(yè)服務(wù)

中等房?jī)r(jià)

平均校齡

項(xiàng)目數(shù)1 5700 12.8 2500 270 250002 1000 10.9 600 10 100003 3400 8.8 1000 10 90004 3800 13.6 1700 140 250005 4000 12.8 1600 140 250006 8200 8.3 2600 60 120007 1200 11.4 400 10 160008 9100 11.5 3300 60 140009 9900 12.5 3400 180 1800010 9600 13.7 3600 390 2500011 9600 9.6 3300 80 1200012 9400 11.4 4000 100 1300069因子分析:洛衫磯對(duì)12個(gè)人口調(diào)查區(qū)的數(shù)據(jù)編號(hào)總?cè)丝赟tatistics→DataReduction→Factor:Variables:pop,school,employ,service,houseDescriptive:Statistics(UnivariateDescriptives,Initialsolution),CorrelationMatrix(Coefficients,Significancelevels)Extraction:Method(Principalcomponent),Analyze(Correlationmatrix),Extract(Number=2factors)Display(Unrotatedfactorsolution,Screeplot),MaximumIterationsfor(25)Rotation:

Method(Varmax),Display(Rotatedsolusion,Loadingplot),MaximumIterationsfor(25)Score:Saveasvariables,Method(Regression),DisplayfactorscorecoefficientmatrixOptions:MissingValue(ExcludecasesListwise),Coefficientdisplayformat(Sortedbysize)70Statistics→DataReduction→Fac71717272共同度Sjaij73共同度Sjaij737474旋轉(zhuǎn)前的因子載荷正交變換陣75旋轉(zhuǎn)前的因子載荷正交變換陣75旋轉(zhuǎn)后的因子載荷第一主因子對(duì)中等房?jī)r(jià),中等校平均校齡,專業(yè)服務(wù)項(xiàng)目有絕對(duì)值較大的載荷(代表一般社會(huì)福利-福利條件因子);而第二主因子對(duì)總?cè)丝诤涂偣蛦T數(shù)有較大的載荷(代表人口-人口因子).76旋轉(zhuǎn)后的因子載荷第一主因子對(duì)中等房?jī)r(jià),中等校平均校齡,專業(yè)服旋轉(zhuǎn)后的因子載荷圖77旋轉(zhuǎn)后的77因子得分的計(jì)算基礎(chǔ)(F=bX)中的b。把n個(gè)觀測(cè)值代入得到FACT_1和FACT_2存入數(shù)據(jù)對(duì)每個(gè)觀測(cè)值有兩個(gè)因子得分(一點(diǎn))Fj=bj1X1+…+bj5X5,

j=1,278因子得分的計(jì)算基礎(chǔ)(F=bX)中的b。把n個(gè)觀測(cè)值代入得到F因子得分之間不相關(guān)79因子得分之間不相關(guān)79因子分析80因子分析1

§1引言因子分析(factoranalysis)是一種數(shù)據(jù)簡(jiǎn)化的技術(shù)。它通過(guò)研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測(cè)數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)假想變量來(lái)表示其基本的數(shù)據(jù)結(jié)構(gòu)。這幾個(gè)假想變量能夠反映原來(lái)眾多變量的主要信息。原始的變量是可觀測(cè)的顯在變量,而假想變量是不可觀測(cè)的潛在變量,稱為因子。例如,在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過(guò)一個(gè)有24個(gè)指標(biāo)構(gòu)成的評(píng)價(jià)體系,評(píng)價(jià)百貨商場(chǎng)的24個(gè)方面的優(yōu)劣。81§1引言2但消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過(guò)24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在的因子,對(duì)商店進(jìn)行綜合評(píng)價(jià)。而這三個(gè)公共因子可以表示為:

稱是不可觀測(cè)的潛在因子。24個(gè)變量共享這三個(gè)因子,但是每個(gè)變量又有自己的個(gè)性,不被包含的部分,稱為特殊因子。82但消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的注:

因子分析與回歸分析不同,因子分析中的因子是一個(gè)比較抽象的概念,而回歸因子有非常明確的實(shí)際意義;

主成分分析分析與因子分析也有不同,主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型。主成分分析:原始變量的線性組合表示新的綜合變量,即主成分;因子分析:潛在的假想變量和隨機(jī)影響變量的線性組合表示原始變量。83注:4§2因子分析模型

一、數(shù)學(xué)模型設(shè)個(gè)變量,如果表示為84§2因子分析模型一、數(shù)學(xué)模型設(shè)稱為公共因子,是不可觀測(cè)的變量,他們的系數(shù)稱為因子載荷。是特殊因子,是不能被前m個(gè)公共因子包含的部分。并且滿足:即不相關(guān);即互不相關(guān),方差為1。85稱為公共因子,是不可觀測(cè)的變量,他們即互不相關(guān),方差不一定相等,。86即互不相關(guān),方差不一定相等,。7用矩陣的表達(dá)方式87用矩陣的表達(dá)方式8二、因子分析模型的性質(zhì)1、原始變量X的協(xié)方差矩陣的分解D的主對(duì)角線上的元素值越小,則公共因子共享的成分越多。88二、因子分析模型的性質(zhì)1、原始變量X的協(xié)方差矩陣的分解2、模型不受計(jì)量單位的影響將原始變量X做變換X*=CX,這里C=diag(c1,c2,…,cn),ci>0。892、模型不受計(jì)量單位的影響將原始變量X90113、因子載荷不是惟一的設(shè)T為一個(gè)p×p的正交矩陣,令A(yù)*=AT,F(xiàn)*=T’F,則模型可以表示為且滿足條件因子模型的條件913、因子載荷不是惟一的設(shè)T為一個(gè)三、因子載荷矩陣中的幾個(gè)統(tǒng)計(jì)特征1、因子載荷aij的統(tǒng)計(jì)意義因子載荷是第i個(gè)變量與第j個(gè)公共因子的相關(guān)系數(shù)

模型為

在上式的左右兩邊乘以

,再求數(shù)學(xué)期望

根據(jù)公共因子的模型性質(zhì),有(載荷矩陣中第i行,第j列的元素)反映了第i個(gè)變量與第j個(gè)公共因子的相關(guān)重要性。絕對(duì)值越大,相關(guān)的密切程度越高。92三、因子載荷矩陣中的幾個(gè)統(tǒng)計(jì)特征1、因子載荷aij的2、變量共同度的統(tǒng)計(jì)意義定義:變量的共同度是因子載荷矩陣的第i行的元素的平方和。記為統(tǒng)計(jì)意義:兩邊求方差

所有的公共因子和特殊因子對(duì)變量的貢獻(xiàn)為1。如果非??拷?,非常小,則因子分析的效果好,從原變量空間到公共因子空間的轉(zhuǎn)化性質(zhì)好。932、變量共同度的統(tǒng)計(jì)意義定義:變量的共同度是3、公共因子方差貢獻(xiàn)的統(tǒng)計(jì)意義因子載荷矩陣中各列元素的平方和稱為某一公共因子對(duì)諸變量所提供的方差貢獻(xiàn)和。衡量的相對(duì)重要性。943、公共因子方差貢獻(xiàn)的統(tǒng)計(jì)意義因子載荷矩陣中各列元§3因子載荷矩陣的估計(jì)方法設(shè)隨機(jī)向量的均值為,協(xié)方差為,為的特征根,為對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量,則主成分分析法95§3因子載荷矩陣的估計(jì)方法設(shè)隨機(jī)向量上式給出的表達(dá)式是精確的,然而,它實(shí)際上是毫無(wú)價(jià)值的,因?yàn)槲覀兊哪康氖菍で笥蒙贁?shù)幾個(gè)公共因子解釋,故略去后面的p-m項(xiàng)的貢獻(xiàn),有96上式給出的表達(dá)式是精確的,然而,它實(shí)際上是毫

上式有一個(gè)假定,模型中的特殊因子是不重要的,因而從的分解中忽略了特殊因子的方差。97上式有一個(gè)假定,模型中的特殊因子例假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型。98例假定某地固定資產(chǎn)投資率,通貨膨

特征根為:99特征根為:20可取前兩個(gè)因子F1和F2為公共因子,第一公因子F1物價(jià)就業(yè)因子,對(duì)X的貢獻(xiàn)為1.55。第一公因子F2為投資因子,對(duì)X的貢獻(xiàn)為0.85。共同度分別為1,0.706,0.706。100可取前兩個(gè)因子F1和F2為公共因子,第一

§4因子旋轉(zhuǎn)(正交變換)建立了因子分析數(shù)學(xué)目的不僅僅要找出公共因子以及對(duì)變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析,如果每個(gè)公共因子的含義不清,則不便于進(jìn)行實(shí)際背景的解釋。由于因子載荷陣是不惟一的,所以應(yīng)該對(duì)因子載荷陣進(jìn)行旋轉(zhuǎn)。目的是使因子載荷陣的結(jié)構(gòu)簡(jiǎn)化,使載荷矩陣每列或行的元素平方值向0和1兩極分化。有三種主要的正交旋轉(zhuǎn)法。四次方最大法、方差最大法和等量最大法。101§4因子旋轉(zhuǎn)(正交變換)建立了因子分析數(shù)學(xué)百米跑成績(jī)跳遠(yuǎn)成績(jī)鉛球成績(jī)跳高成績(jī)

400米跑成績(jī)百米跨欄鐵餅成績(jī)撐桿跳遠(yuǎn)成績(jī)標(biāo)槍成績(jī)

1500米跑成績(jī)

奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目得分?jǐn)?shù)據(jù)的因子分析

102百米跑成績(jī)奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目2310324因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運(yùn)動(dòng)因子。其他的3個(gè)因子不太容易解釋。似乎是跑和投擲的能力對(duì)比,似乎是長(zhǎng)跑耐力和短跑速度的對(duì)比。于是考慮旋轉(zhuǎn)因子,得下表

104因子載荷矩陣可以看出,除第一因子在所有的變量在公共因10526通過(guò)旋轉(zhuǎn),因子有了較為明確的含義。百米跑,400米跑,需要爆發(fā)力的項(xiàng)目在有較大的載荷,可以稱為短跑速度因子;鉛球,鐵餅和標(biāo)槍在上有較大的載荷,可以稱為爆發(fā)性臂力因子;百米跨欄,撐桿跳遠(yuǎn),跳遠(yuǎn)和為跳高在上有較大的載荷,爆發(fā)腿力因子;長(zhǎng)跑耐力因子。106通過(guò)旋轉(zhuǎn),因子有了較為明確的含義。百米跑變換后因子的共同度設(shè)正交矩陣,做正交變換變換后因子的共同度沒(méi)有發(fā)生變化?。ǘ┬D(zhuǎn)方法107變換后因子的共同度設(shè)正交矩陣,做正交變換變換后因子的共同度變換后因子貢獻(xiàn)設(shè)正交矩陣,做正交變換變換后因子的貢獻(xiàn)發(fā)生了變化!108變換后因子貢獻(xiàn)設(shè)正交矩陣,做正交變換變換后因子的貢獻(xiàn)發(fā)生了1、方差最大法

方差最大法從簡(jiǎn)化因子載荷矩陣的每一列出發(fā),使和每個(gè)因子有關(guān)的載荷的平方的方差最大。當(dāng)只有少數(shù)幾個(gè)變量在某個(gè)因子上又較高的載荷時(shí),對(duì)因子的解釋最簡(jiǎn)單。方差最大的直觀意義是希望通過(guò)因子旋轉(zhuǎn)后,使每個(gè)因子上的載荷盡量拉開距離,一部分的載荷趨于1,另一部分趨于0。1091、方差最大法301103111132

§5因子得分

(一)因子得分的概念

前面我們主要解決了用公共因子的線性組合來(lái)表示一組觀測(cè)變量的有關(guān)問(wèn)題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來(lái)做回歸分析,對(duì)樣本進(jìn)行分類或評(píng)價(jià),這就需要我們對(duì)公共因子進(jìn)行測(cè)度,即給出公共因子的值。112§5因子得分(一)因子得分的概念前面我們?nèi)司刈兞恳蜃臃治觥?duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況作因子分析。指標(biāo)體系中有如下指標(biāo):X1:人口(萬(wàn)人)X2:面積(萬(wàn)平方公里)X3:GDP(億元)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)X6:萬(wàn)人擁有的大學(xué)生數(shù)(人)X7:萬(wàn)人擁有科學(xué)家、工程師數(shù)(人)RotatedFactorPatternFACTOR1FACTOR2FACTOR3X1-0.21522-0.273970.89092X20.63973-0.28739-0.28755X3-0.157910.063340.94855X40.95898-0.01501-0.07556X50.97224-0.06778-0.17535X6-0.114160.98328-0.08300X7-0.110410.97851-0.07246113人均要素變量因子分析。對(duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況

高載荷指標(biāo)

因子命名

因子1X2;面積(萬(wàn)平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子

因子2X6:萬(wàn)人擁有的大學(xué)生數(shù)(人)X7:萬(wàn)人擁有的科學(xué)家、工程師數(shù)(人)

人力資源因子

因子3

X1;人口(萬(wàn)人)X3:GDP(億元)經(jīng)濟(jì)發(fā)展總量因子

X1=-0.21522F1-0.27397F2+0.89092F3X2=0.63973F1-0.28739F2-0.28755F3X3=-0.15791F1+0.06334F2+0.94855F3X4=0.95898F1-0.01501F2-0.07556F3X5=0.97224F1-0.06778F2-0.17535F3X6=-0.11416F1+0.98328F2-0.08300F3X7=-0.11041F1+0.97851F2-0.07246F3114

X2;面積(萬(wàn)平方公里)自然資源因子

X6:萬(wàn)人擁有StandardizedScoringCoefficients

FACTOR1

FACTOR2

FACTOR3X10.05764

-0.06098

0.50391X20.22724

-0.09901

-0.07713X30.14635

0.12957

0.59715X40.47920

0.11228

0.17062X50.45583

0.07419

0.10129X60.05416

0.48629

0.04099X70.05790

0.48562

0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7115StandardizedScoringCoefficiREGIONFACTOR1FACTOR2FACTOR3beijing?-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259前三個(gè)因子得分116REGIONFACTOR1FACTOR2FACTOR3be因子分析的數(shù)學(xué)模型為:

原變量被表示為公共因子的線性組合,當(dāng)載荷矩陣旋轉(zhuǎn)之后,公共因子可以做出解釋,通常的情況下,我們還想反過(guò)來(lái)把公共因子表示為原變量的線性組合。因子得分函數(shù):可見(jiàn),要求得每個(gè)因子的得分,必須求得分函數(shù)的系數(shù),而由于p>m,所以不能得到精確的得分,只能通過(guò)估計(jì)。117因子分析的數(shù)學(xué)模型為:原變量被表示為公共回歸方法

1)思想118回歸方法1)思想39則,我們有如下的方程組:119則,我們有如下的方程組:40j=1,2,…,m120j=1,2,…,m41

注:共需要解m次才能解出所有的得分函數(shù)的系數(shù)。121注:共需要解m次才能解42國(guó)民生活質(zhì)量的因素分析

國(guó)家發(fā)展的最終目標(biāo),是為了全面提高全體國(guó)民的生活質(zhì)量,滿足廣大國(guó)民日益增長(zhǎng)的物質(zhì)和文化的合理需求。在可持續(xù)發(fā)展消費(fèi)的統(tǒng)一理念下,增加社會(huì)財(cái)富,創(chuàng)自更多的物質(zhì)文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進(jìn)化的基礎(chǔ)上,維系人類與自然的平衡,達(dá)到完整的代際公平和區(qū)際公平(即時(shí)間過(guò)程的最大合理性與空間分布的最大合理化)。從1990年開始,聯(lián)合國(guó)開發(fā)計(jì)劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標(biāo)對(duì)于國(guó)民生活質(zhì)量進(jìn)行測(cè)度。人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標(biāo)組合,即人的健康狀況(使用出生時(shí)的人均預(yù)期壽命表達(dá))、人的智力程度(使用組合的教育成就表達(dá))、人的福利水平(使用人均國(guó)民收入或人均GDP表達(dá)),并且特別強(qiáng)調(diào)三類指標(biāo)組合的整體表達(dá)內(nèi)涵,去衡量一個(gè)國(guó)家或地區(qū)的社會(huì)發(fā)展總體狀況以及國(guó)民生活質(zhì)量的總水平。122國(guó)民生活質(zhì)量的因素分析43在這個(gè)指標(biāo)體系中有如下的指標(biāo):X1——預(yù)期壽命X2——成人識(shí)字率X3——綜合入學(xué)率X4——人均GDP(美圓)X5——預(yù)期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù)123在這個(gè)指標(biāo)體系中有如下的指標(biāo):44旋轉(zhuǎn)后的因子結(jié)構(gòu)RotatedFactorPatternFACTOR1FACTOR2FACTOR3X10.381290.417650.81714X20.121660.848280.45981X30.648030.618220.22398X40.904100.205310.34100X50.388540.432950.80848X60.282070.853250.43289X70.900910.206120.35052

FACTOR1為經(jīng)濟(jì)發(fā)展因子

FACTOR2為教育成就因子FACTOR3為健康水平因子124旋轉(zhuǎn)被每個(gè)因子解釋的方差和共同度VarianceexplainedbyeachfactorFACTOR1FACTOR2FACTOR32.4397002.2763172.009490FinalCommunalityEstimates:Total=6.725507X1X2X3X4X50.9875300.9457960.8523060.9758300.992050

X6X70.9949950.976999

125

生育率的影響因素分析生育率受社會(huì)、經(jīng)濟(jì)、文化、計(jì)劃生育政策等很多因素影響,但這些因素對(duì)生育率的影響并不是完全獨(dú)立的,而是交織在一起,如果直接用選定的變量對(duì)生育率進(jìn)行多元回歸分析,最終結(jié)果往往只能保留兩三個(gè)變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對(duì)生育率進(jìn)行分析。選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國(guó)民收入。下表是1990年中國(guó)30個(gè)省、自治區(qū)、直轄市的數(shù)據(jù)。126生育率的影響因素分析生育率受社會(huì)、經(jīng)濟(jì)、文化12748EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201

1.0000特征根與各因子的貢獻(xiàn)128EigenvalueDifferenceProportion

Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962沒(méi)有旋轉(zhuǎn)的因子結(jié)構(gòu)129

Factor1Factor2x1-0.760620.553Factor1可解釋方差Factor2可解釋方差2.99754292.1642615各旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.93006369130Factor1可解釋方差Factor2可解釋方差2.9975

在這個(gè)例子中我們得到了兩個(gè)因子,第一個(gè)因子是社會(huì)經(jīng)濟(jì)發(fā)展水平因子,第二個(gè)是計(jì)劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進(jìn)行其他的統(tǒng)計(jì)分析。

Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728

Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu)標(biāo)準(zhǔn)化得分函數(shù)131

§6因子分析的步驟、展望和建議

計(jì)算所選原始變量的相關(guān)系數(shù)矩陣

相關(guān)系數(shù)矩陣描述了原始變量之間的相關(guān)關(guān)系??梢詭椭袛嘣甲兞恐g是否存在相關(guān)關(guān)系,這對(duì)因子分析是非常重要的,因?yàn)槿绻x變量之間無(wú)關(guān)系,做因子分析是不恰當(dāng)?shù)?。并且相關(guān)系數(shù)矩陣是估計(jì)因子結(jié)構(gòu)的基礎(chǔ)。選擇分析的變量用定性分析和定量分析的方法選擇變量,因子分析的前提條件是觀測(cè)變量間有較強(qiáng)的相關(guān)性,因?yàn)槿绻兞恐g無(wú)相關(guān)性或相關(guān)性較小的話,他們不會(huì)有共享因子,所以原始變量間應(yīng)該有較強(qiáng)的相關(guān)性。一、因子分析通常包括以下五個(gè)步驟132§6因子分析的步驟、展望和建議

選擇分析提取公共因子

這一步要確定因子求解的方法和因子的個(gè)數(shù)。需要根據(jù)研究者的設(shè)計(jì)方案或有關(guān)的經(jīng)驗(yàn)或知識(shí)事先確定。因子個(gè)數(shù)的確定可以根據(jù)因子方差的大小。只取方差大于1(或特征值大于1)的那些因子,因?yàn)榉讲钚∮?的因子其貢獻(xiàn)可能很?。话凑找蜃拥睦塾?jì)方差貢獻(xiàn)率來(lái)確定,一般認(rèn)為要達(dá)到60%才能符合要求;

因子旋轉(zhuǎn)

通過(guò)坐標(biāo)變換使每個(gè)原始變量在盡可能少的因子之間有密切的關(guān)系,這樣因子解的實(shí)際意義更容易解釋,并為每個(gè)潛在因子賦予有實(shí)際意義的名字。

133提取公共因子54

計(jì)算因子得分求出各樣本的因子得分,有了因子得分值,則可以在許多分析中使用這些因子,例如以因子的得分做聚類分析的變量,做回歸分析中的回歸因子。

134計(jì)算因子得分55因子分析是十分主觀的,在許多出版的資料中,因子分析模型都用少數(shù)可闡述因子提供了合理解釋。實(shí)際上,絕大多數(shù)因子分析并沒(méi)有產(chǎn)生如此明確的結(jié)果。不幸的是,評(píng)價(jià)因子分析質(zhì)量的法則尚未很好量化,質(zhì)量問(wèn)題只好依賴一個(gè)“哇!”準(zhǔn)則

如果在仔細(xì)檢查因子分析的時(shí)候,研究人員能夠喊出“哇,我明白這些因子”的時(shí)候,就可看著是成功運(yùn)用了因子分析方法。135因子分析是十分主觀的,在許多出版的資料中,因子分析和主成分分析的一些注意事項(xiàng)

可以看出,因子分析和主成分分析都依賴于原始變量,也只能反映原始變量的信息。所以原始變量的選擇很重要。另外,如果原始變量都本質(zhì)上獨(dú)立,那么降維就可能失敗,這是因?yàn)楹茈y把很多獨(dú)立變量用少數(shù)綜合的變量概括。數(shù)據(jù)越相關(guān),降維效果就越好。在得到分析的結(jié)果時(shí),并不一定會(huì)都得到如我們例子那樣清楚的結(jié)果。這與問(wèn)題的性質(zhì),選取的原始變量以及數(shù)據(jù)的質(zhì)量等都有關(guān)系在用因子得分進(jìn)行排序時(shí)要特別小心,特別是對(duì)于敏感問(wèn)題。由于原始變量不同,因子的選取不同,排序可以很不一樣。136因子分析和主成分分析的一些注意事項(xiàng)

可以看出,因子分析和主SPSS實(shí)現(xiàn)(因子分析與主成分分析)拿student.sav為例,選Analyze-DataReduction-Factor進(jìn)入主對(duì)話框;把math、phys、chem、literat、history、english選入Variables,然后點(diǎn)擊Extraction,在Method選擇一個(gè)方法(如果是主成分分析,則選PrincipalComponents),下面的選項(xiàng)可以隨意,比如要畫碎石圖就選Screeplot,另外在Extract選項(xiàng)可以按照特征值的大小選主成分(或因子),也可以選定因子的數(shù)目;之后回到主對(duì)話框(用Continue)。然后點(diǎn)擊Rotation,再在該對(duì)話框中的Method選擇一個(gè)旋轉(zhuǎn)方法(如果是主成分分析就選None),在Display選Rotatedsolution(以輸出和旋轉(zhuǎn)有關(guān)的結(jié)果)和Loadingplot(以輸出載荷圖);之后回到主對(duì)話框(用Continue)。如果要計(jì)算因子得分就要點(diǎn)擊Scores,再選擇Saveasvariables(因子得分就會(huì)作為變量存在數(shù)據(jù)中的附加列上)和計(jì)算因子得分的方法(比如Regression);之后回到主對(duì)話框(用Continue)。這時(shí)點(diǎn)OK即可。137SPSS實(shí)現(xiàn)(因子分析與主成分分析)拿student.sav主成分分析:洛衫磯對(duì)12個(gè)人口調(diào)查區(qū)的數(shù)據(jù)編號(hào)

總?cè)丝?/p>

總雇員數(shù)

中等校

專業(yè)服務(wù)

中等房?jī)r(jià)

平均校齡

項(xiàng)目數(shù)1 5700 12.8 2500 270 250002 1000 10.9 600 10 100003 3400 8.8 1000 10 90004 3800 13.6 1700 140 250005 4000 12.8 1600 140 250006 8200 8.3 2600 60 120007 1200 11.4 400 10 160008 9100 11.5 3300 60 140009 9900 12

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論