版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第13章因子分析因子分析始于1904年Chars Spearman對學(xué)生成績的分析,在經(jīng)濟領(lǐng)域有著極 為廣泛的用途。在多個變量的變化過程中,除了一些特定因素之外,還受到一些共 同因素的影響。因此,每個變量可以拆分成兩部分,一是共同因素,二是特殊因 素。這些共同因素稱為公因子,特殊因素稱為特殊因子。因子分析即是提出多個變 量的公共影響因子的一種多元統(tǒng)計方法,它是主成分分析的推廣。因子分析主要解決兩類問題:一是尋求基本結(jié)構(gòu),簡化觀察系統(tǒng)。給定一組變 量或觀察數(shù)據(jù),是否存在一個子集,特別是一個加權(quán)子集,來解釋整個問題,即將 為數(shù)眾多的變量減少為兒個新的因子,以再現(xiàn)它們之間的內(nèi)在聯(lián)系。二是用于分 類,
2、將變量或樣本進行分類,根據(jù)因子得分值,在因子軸所構(gòu)成的空間中進行分類 處理。P個變量X的因子模型表達式為:X=fA +ef稱為公因子,八稱為因子載荷。X的相關(guān)系數(shù)矩陣分解為:為二AA+W對于未旋轉(zhuǎn)的因子,e = l。W稱為特殊度,即每個變量中不屬于共性的部分。因子估計Stata可以通過變量進行因子分析,也可以通過矩陣進行。命令為factor或 factormato webuse bg2,clear describefactor bg2costl-bg2cost6factor bg2costl-bg2cost6, factors(2)pf主因獷方法,用復(fù)相關(guān)系數(shù)的平方作為因f載荷的估計量(默認(rèn)選
3、項)factor bg2costl-bg2cost6, factors (2) pcfpcf主成分因子,假定共同度二1factor bg2costl-bg2cost6, factors (2) ipfipf迭代主因子,重復(fù)估計共同度factor bg2costl-bg2cost6, factors(2) ml*ml極大似然Wf,假定變量(至少3個)服從多元正態(tài)分布,對偏相關(guān)矩陣的行列式進行最優(yōu)化求 解,等價于Ra。的典型因子方法預(yù)測Stata可以通過predict預(yù)測變量得分、擬合值和殘差等。webuse bg2,clearfactor bg2costl-bg2cost6predict fl
4、f2factor 1 faoto 工 2 犬 I 了得分predict stdp residuals *預(yù)測標(biāo)準(zhǔn)差和殘差EstatEatat給出了兒個非常有用的工具,包括KMO、SMC等指標(biāo)。webuse bg2,clearfactor bg2costl-bg2cost6estat antiestat kmoestat residualsestat smcestat summarize因子旋轉(zhuǎn)與作圖因子分析的旋轉(zhuǎn)方法以及碎石圖、得分圖、因子載荷圖與主成分分析的方法相 同,請參見”主成分分析”一章。webuse bg2,clearfactor bg2costl-bg2cost6screeplot
5、/ 碎石圖*/scoreplot/得分圖/loadingplot /因 戈荷圖*/rotate /旋轉(zhuǎn)/例:利用2009年的數(shù)據(jù)對中國社會發(fā)展?fàn)顩r進行綜合考察,原始數(shù)據(jù)如下 表:省份人均GDP(元)新增固定 資產(chǎn)(億 元)城鎮(zhèn)居民 人均年可 支配收入 (元)農(nóng)村居民家庭人均純收入(元)高等學(xué)校 數(shù)(所)衛(wèi)生機構(gòu)數(shù)(個)areaX1x2x3x4x5x6北京63029856497天津55473552784河北2323910515632山西20398699431內(nèi)蒙古32214397162遼寧3125910414627吉林23514559659黑龍江21727787928上海73124662822江
6、蘇3962214613357浙江422149815290安徽144851047837福建30123814478江東3308312514973河南1959364149411683湖北1986011810305湖南1752111514455廣東3758912515819廣西1496614196810427海川153789020738貴州8824903455848云南125871551599249西藏1386161326陜肅121103910534青海1738991582寧/p>
7、新19893376739程序. clear*定義變量的標(biāo)簽labelvararea 省份labelvar人均GDPlabelvar新增固定資產(chǎn)(億元)labelvar城鎮(zhèn)居民人均年可支配收入(兀)labelvar農(nóng)村居民家庭人均純收入(元) labelvar高等學(xué)校數(shù)(所)”labelvar少衛(wèi)生機構(gòu)數(shù)(個“describefactor xl-x6screeplot/*碎石圖(特征值等于1處的水平線標(biāo)示保留主成分的分界點)*/檢驗estat kmo /*KM0檢驗.越高越好*二/estat smc /*SMC檢驗,值越高越好*/rotate /* 旋轉(zhuǎn) */loadingplot , ylin
8、e(O) xline(O)/* 載荷圖 */*預(yù)測predict score fit residual q /*預(yù)測變量得分、擬合值和殘差以及殘差的平方和*/ predict fl f2 label var fl收入因子label var f2 ”投資、社會因子”list area fl f2summarize fl f2correlate fl f2scoreplot, xtitle (h 收入因 f n) ytitle (n投資、社會因子”)LR test: independent vs saturated : chi2(15) = Probchi2 =Factor loadings (p
9、attern matrix) and unique variancesVariableFactorlFactor2 Factor3Uniquenessxl_s1x2_s1x3_s1x4_s1x5_s 11x6 s 11從上面的分析可以看出,只有兩個成分大于1大于的特征值,同時兩個成分 解釋了全部六個變量組合的方差還多。不重要的第2到6個主成分在隨后的分析中 可以放心地省略去。運行factor命令后,我們可以接著運行screeplot命令畫出碎石圖。碎石圖 中特征值等于1處的水平線標(biāo)示了保留主成分的常用分界點,同時再次強調(diào)了本例 中的成分3到成分6并不重要。碎石圖檢驗的方法還是跟上一章的主成分分
10、析一樣,山于我們都是選用實際的數(shù)據(jù) 來進行分析,所以在一般情況下,檢驗都是通得過的,可以忽略,覺得有需要的再 進行檢驗。旋轉(zhuǎn)會進一步簡化因子結(jié)構(gòu)。在提取因子之后,鍵入rotate命令進行旋轉(zhuǎn)。 TOC o 1-5 h z Factor analysis/correlationNumber of obs=31Method : principal factorsRetained factors=3Rotation : orthogonal varimax (Kaiser off)Number of params =15Proportion CumulativeFactorVariance Diff
11、erenceFactorlFactor2Factor3LR test: independent vs saturated : chi2(15) = Probchi2 =Rotated factor loadings (pattern matrix) and unique variancesVariable Factorl Factor2 Factor3 Uniquenessxl x2Factor rotation matrixFactorl Factor2 Factor3FactorlFactor2Factor3結(jié)合實際情況,我們通過上面的分析整理出前兩個主因子的正交因子表。表:正交因子表因子
12、指曠FactorFactor12x2x3x4x5x6根據(jù)上表將六個指標(biāo)按高載荷分成兩類,并結(jié)合專業(yè)知識對各因子命名,如 下表:表:高載荷分類高載荷指標(biāo)因子命名1人均GDP城鎮(zhèn)居民人均年可支配收入農(nóng)村居民 家庭人均純收入收入因子2高等學(xué)校數(shù)衛(wèi)生機構(gòu)數(shù)新增固定資 產(chǎn)投資、社會因子接著進行一個后續(xù)因子分析的制圖命令loadingplote有助于將其可視化。從 圖中我們就可以直觀的看出在主因子1中xl、x3、x4明顯取得較大值,而對于主因 子2則是x2、x5、x6取得較大的值。載荷圖Factor loadingsCDI.5Factor 1Rotation: orthogonal varimax Met
13、hod: principal factors因子分是通過將每個變量標(biāo)準(zhǔn)化為平均數(shù)等于0和方差等于1,然后以因子分 系數(shù)進行加權(quán)合計為每個因子構(gòu)成的線性組合?;谧罱?rotate 或 factor 結(jié)果, predict會自動進行這些計算。通過命令predict fl f2,我們得到了各個觀察變量 的主因子1、主因子2的得分悄況。 list area fl f2+areafl+f2 I11.2.3.45.北京 天津 河北 11西 1內(nèi)蒙古11111 059728211&78.9.10.遼寧 吉林 黑龍江 上海 江蘇058915411 051870517713872111.浙江12.1安徽 5
14、026091|13.fni建 537655414.1江西 2167013 |15.1山東1河南117.1湖北.7986803 |18.1湖南.8609527 |19.1廣東 612531220.1廣西111 -21.1海南122.1重慶123.1四川 9108785|24.1貴州1 558010225云南129.1青海1寧夏1_ 11西30.26藏1127.陜西 191327531.1七斤據(jù)128tr肅1-summarize fl f2VariableObsMean Std DevMinMaxfl31 988557f231 9461783在這些因子分之間是存在著相關(guān),
15、在默認(rèn)選項中, promax 旋轉(zhuǎn)允許因子分之 間存在相關(guān)。通過運行命令correlate fl f2可得。從運行出來的結(jié)果看到,兩個因 子分相關(guān)關(guān)系是很小的。 correlate fl f2(obs=31)fl f2flf2另一個后因子分析制圖命令,scoreplot可繪出這些觀測案例的因子分的散點 圖。在本例的得分圖中,我們可以看到,上海、北京、浙江、天津這些城市的主因 子1的得分相對于其他城市高,因為主因子1是收入因子,這些城市的收入在全國 是排在前列的。而我們可以看到北京、上海的在主因子2 (即投資、社會因子)的得 分是較低,這是因為這兩個城市的經(jīng)濟總量相對較小。在江蘇、山東、廣東這些
16、經(jīng) 濟總量名列前茅的省份,它們的主因子2的得分也是相應(yīng)位于其他城市前面。得分圖Score variables (factor)江蘇山東廣東-1收殳因子Rotation: orthog onal van max Method: principal factors練習(xí):將上一章的主成分分析的例子的數(shù)據(jù)進行因子分析。省份areaGDP(億元)X1居民消費水平(元)x2固定資產(chǎn) 投資(億 元)x3職工平均工資(元)x4貨物周轉(zhuǎn)址(億噸公里)x5居民消 費價格 指數(shù)(上年100)x6商品零 售價格 指數(shù)(上年 100)x7工業(yè)總產(chǎn)值(億元)x8北京203165632810413天津110004174812503河北65702475623031山西61872582810024內(nèi)蒙古810826114遼寧96252772924769吉林759123186黑龍江83107039365623046上海273135656525121江蘇110133166767799浙江1389393233414610510832安徽637767472636311162福建103612570215213江西575321
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年幼兒課程教案6篇
- 智能科創(chuàng)課程設(shè)計
- 2025年度股權(quán)代持及收益權(quán)分配合同(個人股權(quán)投資與代持)20篇
- 2025年度住宅小區(qū)智能安防系統(tǒng)合同11294篇
- 2025年新能源汽車充電樁停車場地合作租賃合同3篇
- 網(wǎng)紅木質(zhì)拓展課程設(shè)計
- 2025年草花種植基地水資源使用權(quán)合同3篇
- 2024食品行業(yè)市場競爭分析合同
- 電纜掛牌施工方案
- 2024食品行業(yè)線上線下整合營銷代理協(xié)議3篇
- 2025年度私立學(xué)校教師聘用合同(初中部專業(yè)學(xué)科)3篇
- DB32T 4880-2024民用建筑碳排放計算標(biāo)準(zhǔn)
- 銀行2025年紀(jì)檢工作計劃
- 注射泵管理規(guī)范及工作原理
- 國潮風(fēng)中國風(fēng)2025蛇年大吉蛇年模板
- 故障診斷技術(shù)的國內(nèi)外發(fā)展現(xiàn)狀
- 農(nóng)機維修市場前景分析
- 匯款賬戶變更協(xié)議
- 蝦皮shopee新手賣家考試題庫及答案
- 四川省宜賓市2023-2024學(xué)年八年級上學(xué)期期末義務(wù)教育階段教學(xué)質(zhì)量監(jiān)測英語試題
- 價值醫(yī)療的概念 實踐及其實現(xiàn)路徑
評論
0/150
提交評論