版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
因子分析Saturday,December17,20221
§1引言因子分析(factoranalysis)是一種數(shù)據(jù)簡化的技術(shù)。它通過研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)假想變量來表示其基本的數(shù)據(jù)結(jié)構(gòu)。這幾個(gè)假想變量能夠反映原來眾多變量的主要信息。原始的變量是可觀測的顯在變量,而假想變量是不可觀測的潛在變量,稱為因子。2例如,在企業(yè)形象的研究中,消費(fèi)者可以通過一個(gè)包含24個(gè)指標(biāo)的指標(biāo)體系評價(jià)百貨商店的優(yōu)劣。但消費(fèi)者主要關(guān)心的是三個(gè)方面:商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在的因子,對商店進(jìn)行綜合評價(jià)。而這三個(gè)公共因子可以表示為:稱是不可觀測的潛在因子。24個(gè)變量共享這三個(gè)因子,但是每個(gè)變量又有自己的個(gè)性,不被包含的部分,稱為特殊因子。3因子分析的特點(diǎn)因子個(gè)數(shù)遠(yuǎn)遠(yuǎn)小于原有變量的個(gè)數(shù)。因子能夠反映原有變量的絕大部分信息。因子之間的線性關(guān)系不顯著。因子具有命名解釋性。5注意:
主成分分析分析與因子分析也有不同,主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型。主成分分析:原始變量的線性組合表示新的綜合變量,即主成分。因子分析:潛在的假想變量和隨機(jī)影響變量的線性組合表示原始變量。6§2因子分析模型
一、數(shù)學(xué)模型設(shè)表示個(gè)變量,如果表示為7稱為公共因子,是不可觀測的變量,它們的系數(shù)稱為因子載荷。是特殊因子,是不能被前m個(gè)公共因子包含的部分。并且滿足:不相關(guān);即互不相關(guān),方差為1。8二、因子載荷矩陣中的幾個(gè)統(tǒng)計(jì)特征1.因子載荷aij的統(tǒng)計(jì)意義因子載荷是第i個(gè)變量與第j個(gè)公共因子的相關(guān)系數(shù)。
反映了第i個(gè)變量與第j個(gè)公共因子的相關(guān)性以及第i個(gè)原有變量在第j個(gè)公共因子上的相對重要性。10
反映了全部公共因子對變量Xi的影響,是全部公共因子對變量方差所做出的貢獻(xiàn),或者說Xi對公共因子的共同依賴程度,稱為公共因子對變量Xi的方差貢獻(xiàn)。接近于1,表明該變量的原始信息幾乎都被選取的公共因子說明了。特殊因子的方差,反映了原有變量方差中無法被公共因子描述的比例。12§3因子載荷矩陣的估計(jì)方法Principalcomponents:主成分法Unweightedleastsquare:不加權(quán)最小平方法Generalizedleastsquares:廣義最小平方法Maximumlikelihood:最大似然法Principalaxisfactoring:主因子法Alphafactoring:α因子提取法Imagefactoring:映象因子提取法14
§4因子旋轉(zhuǎn)(正交變換)進(jìn)行因子分析的數(shù)學(xué)目的不僅僅要找出公共因子以及對變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析,如果每個(gè)公共因子的含義不清,則不便于進(jìn)行實(shí)際的解釋。因子旋轉(zhuǎn)的目的是使因子載荷陣的結(jié)構(gòu)簡化,使各個(gè)因子的載荷值盡可能地向0和1兩個(gè)極值轉(zhuǎn)化。(一)為什么要進(jìn)行因子旋轉(zhuǎn)15因子旋轉(zhuǎn)的方法1.varimax:方差最大旋轉(zhuǎn)法。簡化對因子的解釋。2.directoblimin:直接斜交旋轉(zhuǎn)法。允許因子之間具有相關(guān)性。3.quartmax:四次方最大正交旋轉(zhuǎn)法。簡化對變量的解釋。4.equamax:平均正交旋轉(zhuǎn)法。5.promax:斜交旋轉(zhuǎn)法。16
百米跑成績跳遠(yuǎn)成績鉛球成績跳高成績400米跑成績百米跨欄鐵餅成績撐桿跳遠(yuǎn)成績標(biāo)槍成績1500米跑成績奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目得分?jǐn)?shù)據(jù)的因子分析
17相關(guān)系數(shù)矩陣18
旋轉(zhuǎn)后的因子載荷矩陣20通過旋轉(zhuǎn),因子有了較為明確的含義。百米跑,跳遠(yuǎn)和400米跑,需要爆發(fā)力的項(xiàng)目在上有較大的載荷,可以稱為短跑速度因子;鉛球,鐵餅和標(biāo)槍在上有較大的載荷,可以稱為爆發(fā)性臂力因子;百米跨欄,撐桿跳遠(yuǎn),跳遠(yuǎn)和為跳高在上有較大的載荷,爆發(fā)腿力因子;長跑耐力因子。21因子分析的數(shù)學(xué)模型為:
原變量被表示為公共因子的線性組合,當(dāng)載荷矩陣旋轉(zhuǎn)之后,公共因子可以做出解釋,通常的情況下,我們還想反過來把公共因子表示為原變量的線性組合。因子得分函數(shù):可見,要求得每個(gè)因子的得分,必須求得分函數(shù)的系數(shù),而由于p>m,所以不能得到精確的得分,只能進(jìn)行估計(jì)。23估計(jì)因子得分的方法Regression:回歸法Bartlette:巴特萊特因子得分法Anderson-Rubin:安德森—魯賓因子得分法24
高載荷指標(biāo)
因子命名
因子1X2;面積(萬平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子
因子2X6:萬人擁有的大學(xué)生數(shù)(人)X7:萬人擁有的科學(xué)家、工程師數(shù)(人)
人力資源因子
因子3
X1;人口(萬人)X3:GDP(億元)經(jīng)濟(jì)發(fā)展總量因子
X1=-0.21522F1-0.27397F2+0.89092F3X2=0.63973F1-0.28739F2-0.28755F3X3=-0.15791F1+0.06334F2+0.94855F3X4=0.95898F1-0.01501F2-0.07556F3X5=0.97224F1-0.06778F2-0.17535F3X6=-0.11416F1+0.98328F2-0.08300F3X7=-0.11041F1+0.97851F2-0.07246F326
StandardizedScoringCoefficients
FACTOR1
FACTOR2
FACTOR3
X1
0.05764
-0.06098
0.50391X20.22724
-0.09901
-0.07713X30.14635
0.12957
0.59715X40.47920
0.11228
0.17062X50.45583
0.07419
0.10129X60.05416
0.48629
0.04099X70.05790
0.48562
0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X727REGIONFACTOR1FACTOR2FACTOR3beijing-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259前三個(gè)因子得分2830EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201
1.0000特征根與各因子的貢獻(xiàn)31
Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962沒有旋轉(zhuǎn)的因子結(jié)構(gòu)32Factor1可解釋方差Factor2可解釋方差2.99754292.1642615各變量旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.9300636933
在這個(gè)例子中我們得到了兩個(gè)因子,第一個(gè)因子是社會(huì)經(jīng)濟(jì)發(fā)展水平因子,第二個(gè)是計(jì)劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進(jìn)行其他的統(tǒng)計(jì)分析。
Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728
Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu)標(biāo)準(zhǔn)化得分函數(shù)34§6因子分析的步驟1.選擇分析的變量
用定性分析和定量分析的方法選擇變量,因子分析的前提條件是觀測變量間有較強(qiáng)的相關(guān)性。如果變量之間無相關(guān)性或相關(guān)性較小的話,它們不會(huì)有公共因子。35因子分析的前提條件計(jì)算相關(guān)系數(shù)矩陣計(jì)算反映象相關(guān)矩陣(Anti-imagecorrelationmatrix)巴特利特球度檢驗(yàn)(Bartletttestofsphericity)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)36反映象相關(guān)矩陣
(Anti-imagecorrelationmatrix)觀察反映象相關(guān)矩陣,如果反映象相關(guān)矩陣中除主對角元素外,其他大多數(shù)元素的絕對值均較小,對角線上元素的值較接近1,則說明這些變量的相關(guān)性較強(qiáng),適合進(jìn)行因子分析。37巴特利特球度檢驗(yàn)
(Bartletttestofsphericity)H0:相關(guān)系數(shù)矩陣是一個(gè)單位陣如果統(tǒng)計(jì)量值比較大,且其相對應(yīng)的概率值小于用戶指定的顯著性水平,拒絕原假設(shè),認(rèn)為適合作因子分析。反之,接受原假設(shè),不適合作因子分析。38KMO(Kaiser-Meyer-Olkin)檢驗(yàn)Kaiser給出了常用的KMO度量標(biāo)準(zhǔn):0.9以上表示非常適合;0.8~0.9表示適合;0.7~0.8表示一般;0.6~0.7表示不太適合;0.5以下表示極不適合。392.將原始變量數(shù)據(jù)標(biāo)準(zhǔn)化3.求解標(biāo)準(zhǔn)化變量的相關(guān)系數(shù)矩陣4.求解相關(guān)系數(shù)矩陣R的特征根、特征向量和貢獻(xiàn)率405.提取公共因子這一步要確定因子求解的方法和因子的個(gè)數(shù)。需要根據(jù)研究者的設(shè)計(jì)方案或有關(guān)的經(jīng)驗(yàn)或知識事先確定。因子個(gè)數(shù)的確定可以根據(jù)因子方差的大小。只取方差大于1(或特征值大于1)的那些因子,因?yàn)榉讲钚∮?的因子其貢獻(xiàn)可能很??;按照因子方差貢獻(xiàn)率大于80%的原則。416.因子旋轉(zhuǎn)
通過坐標(biāo)變換使每個(gè)原始變量在盡可能少的因子之間有密切的關(guān)系,這樣因子解的實(shí)際意義更容易解釋,并為每個(gè)潛在因子賦予有實(shí)際意義的名字。427.計(jì)算因子得分
有了因子得分值,則可以在許多分析中使用這些因子,例如進(jìn)行多指標(biāo)綜合評價(jià)、以因子的得分做聚類分析的變量、做回歸分析中的回歸因子。437.多指標(biāo)綜合評價(jià)
44
因子分析具有一定程度的主觀性,在許多出版的資料中,因子分析模型都用少數(shù)因子提供了合理解釋。實(shí)際上,絕大多數(shù)因子分析并沒有產(chǎn)生如此明確的結(jié)果。不幸的是,評價(jià)因子分析質(zhì)量的法則尚未很好量化,質(zhì)量問題只好依賴一個(gè)“哇!”準(zhǔn)則
如果在仔細(xì)檢查因子分析的時(shí)候,研究人員能夠喊出“哇,我明白這些因子”的時(shí)候,就可認(rèn)為成功運(yùn)用了因子分析方法。45例子:上市公司財(cái)務(wù)分析2003年滬、深兩市48家上市公司的13個(gè)財(cái)務(wù)指標(biāo)數(shù)據(jù)。數(shù)據(jù)文件為:上市公司財(cái)務(wù)數(shù)據(jù)因子分析.sav4647Determinant:相關(guān)系數(shù)矩陣的行列式Inverse:相關(guān)系數(shù)矩陣矩陣的逆矩陣Reproduced:再生相關(guān)陣Anti-image:反映像相關(guān)矩陣48Unrotatedfactorsolutions:輸出旋轉(zhuǎn)前的因子方差貢獻(xiàn)表和旋轉(zhuǎn)前的因子載荷陣。Screeplot:碎
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024戶外廣告牌制作安裝合同
- 2024年合作投資協(xié)議書模板
- 2024苗木購銷合同范本簡單版
- 2024股東合作經(jīng)營合同協(xié)議書
- 城市街道廣告位租賃合同
- 插畫約稿合同樣本
- 二房東租房合同租房合同協(xié)議范本
- 2024股份制工程合作協(xié)議書
- 貨物運(yùn)輸合同簽訂技巧
- 4.1 夯實(shí)法治基礎(chǔ)(導(dǎo)學(xué)案) 2024-2025學(xué)年統(tǒng)編版道德與法治九年級上冊
- (培訓(xùn)體系)2020年普通話測試培訓(xùn)材料
- 3-4單元測試-2024-2025學(xué)年統(tǒng)編版語文六年級上冊
- 北師版數(shù)學(xué)八年級上冊 5.8三元一次方程組課件
- 2024混合動(dòng)力汽車賽道專題報(bào)告-2024-10-市場解讀
- DB34T 4338-2022 行政規(guī)范性文件合法性審核規(guī)范
- 企業(yè)單位消防安全規(guī)范化管理指導(dǎo)手冊
- 廢舊物資回收投標(biāo)方案(技術(shù)方案)
- 宣傳視頻拍攝服務(wù)投標(biāo)方案(技術(shù)方案)
- 森林防火課件下載
- 3《歡歡喜喜慶國慶》(教學(xué)設(shè)計(jì))2024-2025學(xué)年統(tǒng)編版道德與法治二年級上冊
- 2024糧改飼工作總結(jié)五篇
評論
0/150
提交評論