因子分析使用幫助PPT課件.ppt_第1頁
因子分析使用幫助PPT課件.ppt_第2頁
因子分析使用幫助PPT課件.ppt_第3頁
因子分析使用幫助PPT課件.ppt_第4頁
因子分析使用幫助PPT課件.ppt_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三講因子分析 FactorAnalysis 目錄 1引言 2因子分析模型 3因子載荷矩陣的估計方法 4因子旋轉(zhuǎn) 正交變換 5因子得分 6因子分析的SPSS操作 因子分析 factoranalysis 是一種數(shù)據(jù)簡化的技術(shù) 它通過研究眾多變量之間的內(nèi)部依賴關(guān)系 探求觀測數(shù)據(jù)中的基本結(jié)構(gòu) 并用少數(shù)幾個假想變量來表示其基本的數(shù)據(jù)結(jié)構(gòu) 這幾個假想變量能夠反映原來眾多變量的主要信息 原始的變量是可觀測的顯變量 ObservedVariable 而假想變量是不可觀測的潛變量 LatentVariable 稱為因子 例如 在企業(yè)形象或品牌形象的研究中 消費者可以通過一個有24個指標(biāo)構(gòu)成的評價體系 評價百貨商場的24個方面的優(yōu)劣 1引言 但消費者主要關(guān)心的是三個方面 即商店的環(huán)境 商店的服務(wù)和商品的價格 因子分析方法可以通過24個變量 找出反映商店環(huán)境 商店服務(wù)水平和商品價格的三個潛在的因子 對商店進(jìn)行綜合評價 而這三個公共因子可以表示為 稱是不可觀測的潛在因子 24個變量共享這三個因子 但是每個變量又有自己的個性 即不被包含的部分 稱為特殊因子 注 因子分析與回歸分析不同 因子分析中的因子是一個比較抽象的概念 而回歸因子有非常明確的實際意義 主成分分析分析與因子分析也有不同 主成分分析僅僅是變量變換 而因子分析需要構(gòu)造因子模型 主成分分析 原始變量的線性組合表示新的綜合變量 即主成分 因子分析 潛在的假想變量和隨機(jī)影響變量的線性組合表示原始變量 2因子分析模型 一 數(shù)學(xué)模型 設(shè)個變量 如果表示為 稱為公共因子 是不可觀測的變量 他們的系數(shù)稱為因子載荷 是特殊因子 是不能被前m個公共因子包含的部分 并且滿足 不相關(guān) 即互不相關(guān) 且各自的方差為1 即各之間互不相關(guān) 且各自的方差不一定相等 用矩陣的表達(dá)方式 二 因子分析模型的性質(zhì) 1 原始變量X的協(xié)方差矩陣的分解 D的主對角線上的元素值越小 則公共因子共享的成分越多 2 因子載荷不是惟一的 設(shè)T為一個p p的正交矩陣 令A(yù) AT F T F 則模型可以表示為 且滿足條件因子模型的條件 三 因子載荷矩陣中的幾個統(tǒng)計特征 1 因子載荷aij的統(tǒng)計意義 因子載荷是第i個標(biāo)準(zhǔn)化變量與第j個公共因子的相關(guān)系數(shù) 模型為 在上式的左右兩邊乘以 再求數(shù)學(xué)期望 根據(jù)公共因子的模型性質(zhì) 有 載荷矩陣中第i行 第j列的元素 反映了第i個變量與第j個公共因子的相關(guān)重要性 絕對值越大 相關(guān)的密切程度越高 注意標(biāo)準(zhǔn)化變量的方差為1 2 變量共同度的統(tǒng)計意義 定義 變量的共同度是因子載荷矩陣的第i行的元素的平方和 記為 統(tǒng)計意義 兩邊求方差 所有的公共因子和特殊因子對變量的貢獻(xiàn)為1 如果非??拷? 非常小 則因子分析的效果好 從原變量空間到公共因子空間的轉(zhuǎn)化性質(zhì)好 注意為標(biāo)準(zhǔn)化變量 3 公共因子方差貢獻(xiàn)的統(tǒng)計意義 因子載荷矩陣中各列元素的平方和稱為第j個公共因子對X的所有分量的方差貢獻(xiàn)和 它衡量了第j個公共因子在全體公共因子中的相對重要性 3因子載荷矩陣的估計方法 設(shè)隨機(jī)向量的均值為 協(xié)方差為 為 的特征根 為對應(yīng)的標(biāo)準(zhǔn)化特征向量 則 一 主成分分析法 上式給出的 表達(dá)式是精確的 然而 它實際上是毫無價值的 因為我們的目的是尋求用少數(shù)幾個公共因子解釋 故略去后面的p m項的貢獻(xiàn) 有 二 主因子法 主因子方法是對主成分方法的修正 假定我們首先對變量進(jìn)行標(biāo)準(zhǔn)化變換 設(shè)R AA DR AA R D稱R 為約相關(guān)矩陣 R 對角線上的元素是 而不是1 直接求R 的前p個特征根和對應(yīng)的正交特征向量 得如下的矩陣 當(dāng)特殊因子的方差不大且已知的 問題非常好解決 在實際的應(yīng)用中 特殊因子方差矩陣一般都是未知的 可以通過一組樣本來估計 估計的方法有如下幾種 首先 求的初始估計值 構(gòu)造出 1 取 在這個情況下主因子解與主成分解等價 2 取 為xi與其他所有的原始變量xj的復(fù)相關(guān)系數(shù)的平方 即xi對其余的p 1個xj的回歸方程的判定系數(shù) 這是因為xi與公共因子的關(guān)系是通過其余的p 1個xj的線性組合聯(lián)系起來的 3 取 這意味著取xi與其余的xj的簡單相關(guān)系數(shù)的絕對值最大者 4 取 其中要求該值為正數(shù) 5 取 其中是的對角元素 例假定某地固定資產(chǎn)投資率 通貨膨脹率 失業(yè)率 相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型 特征根為 可取前兩個因子F1和F2為公共因子 第一公因子F1物價就業(yè)因子 對X的貢獻(xiàn)為1 55 第二公因子F2為投資因子 對X的貢獻(xiàn)為0 85 共同度分別為1 0 706 0 706 4因子旋轉(zhuǎn) 正交變換 建立了因子分析數(shù)學(xué)目的不僅僅要找出公共因子以及對變量進(jìn)行分組 更重要的要知道每個公共因子的意義 以便進(jìn)行進(jìn)一步的分析 如果每個公共因子的含義不清 則不便于進(jìn)行實際背景的解釋 由于因子載荷陣是不惟一的 所以應(yīng)該對因子載荷陣進(jìn)行旋轉(zhuǎn) 目的是使因子載荷陣的結(jié)構(gòu)簡化 使載荷矩陣每列或行的元素平方值向0和1兩極分化 有三種主要的正交旋轉(zhuǎn)法 四次方最大法 方差最大法和等量最大法 一 為什么要旋轉(zhuǎn)因子 百米跑成績跳遠(yuǎn)成績鉛球成績跳高成績400米跑成績百米跨欄鐵餅成績撐桿跳遠(yuǎn)成績標(biāo)槍成績1500米跑成績 奧運會十項全能運動項目得分?jǐn)?shù)據(jù)的因子分析 因子載荷矩陣可以看出 除第一因子在所有的變量在公共因子上有較大的正載荷 可以稱為一般運動因子 其他的3個因子不太容易解釋 似乎是跑和投擲的能力對比 似乎是長跑耐力和短跑速度的對比 于是考慮旋轉(zhuǎn)因子 得下表 通過旋轉(zhuǎn) 因子有了較為明確的含義 百米跑 跳遠(yuǎn)和400米跑 需要爆發(fā)力的項目在有較大的載荷 可以稱為短跑速度因子 鉛球 鐵餅和標(biāo)槍在上有較大的載荷 可以稱為爆發(fā)性臂力因子 百米跨欄 撐桿跳遠(yuǎn) 跳遠(yuǎn)和為跳高在上有較大的載荷 爆發(fā)腿力因子 長跑耐力因子 方差最大法方差最大法從簡化因子載荷矩陣的每一列出發(fā) 使和每個因子有關(guān)的載荷的平方的方差最大 當(dāng)只有少數(shù)幾個變量在某個因子上又較高的載荷時 對因子的解釋最簡單 方差最大的直觀意義是希望通過因子旋轉(zhuǎn)后 使每個因子上的載荷盡量拉開距離 一部分的載荷趨于 1 另一部分趨于0 二 旋轉(zhuǎn)方法 變換后因子的共同度 設(shè) 正交矩陣 做正交變換 變換后因子的共同度沒有發(fā)生變化 三 旋轉(zhuǎn)結(jié)果 變換后因子貢獻(xiàn) 設(shè) 正交矩陣 做正交變換 變換后因子的貢獻(xiàn)發(fā)生了變化 5因子得分 一 因子得分的概念 前面我們主要解決了用公共因子的線性組合來表示一組觀測變量的有關(guān)問題 如果我們要使用這些因子做其他的研究 比如把得到的因子作為自變量來做回歸分析 對模型進(jìn)行診斷 進(jìn)一步分析原始數(shù)據(jù) 如對樣本進(jìn)行分類或評價 這就需要我們對公共因子進(jìn)行測度 即給出公共因子的值 例1人均要素變量因子分析 對我國32個省市自治區(qū)的要素狀況作因子分析 指標(biāo)體系中有如下指標(biāo) X1 人口 萬人 X2 面積 萬平方公里 X3 GDP 億元 X4 人均水資源 立方米 人 X5 人均生物量 噸 人 X6 萬人擁有的大學(xué)生數(shù) 人 X7 萬人擁有科學(xué)家 工程師數(shù) 人 RotatedFactorPatternFACTOR1FACTOR2FACTOR3X1 0 21522 0 273970 89092X20 63973 0 28739 0 28755X3 0 157910 063340 94855X40 95898 0 01501 0 07556X50 97224 0 06778 0 17535X6 0 114160 98328 0 08300X7 0 110410 97851 0 07246 2020 2 4 41 X1 0 21522F1 0 27397F2 0 89092F3X2 0 63973F1 0 28739F2 0 28755F3X3 0 15791F1 0 06334F2 0 94855F3X4 0 95898F1 0 01501F2 0 07556F3X5 0 97224F1 0 06778F2 0 17535F3X6 0 11416F1 0 98328F2 0 08300F3X7 0 11041F1 0 97851F2 0 07246F3 StandardizedScoringCoefficientsFACTOR1FACTOR2FACTOR3X10 05764 0 060980 50391X20 22724 0 09901 0 07713X30 146350 129570 59715X40 479200 112280 17062X50 455830 074190 10129X60 054160 486290 04099X70 057900 485620 04822 F1 0 05764X1 0 22724X2 0 14635X3 0 47920X4 0 45583X5 0 05416X6 0 05790X7F2 0 06098X1 0 09901X2 0 12957X3 0 11228X4 0 07419X5 0 48629X6 0 48562X7F3 0 50391X1 0 07713X2 0 59715X3 0 17062X4 0 10129X5 0 04099X6 0 04822X7 前三個因子得分 例2國民生活質(zhì)量的因素分析國家發(fā)展的最終目標(biāo) 是為了全面提高全體國民的生活質(zhì)量 滿足廣大國民日益增長的物質(zhì)和文化的合理需求 在可持續(xù)發(fā)展消費的統(tǒng)一理念下 增加社會財富 創(chuàng)自更多的物質(zhì)文明和精神文明 保持人類的健康延續(xù)和生生不息 在人類與自然協(xié)同進(jìn)化的基礎(chǔ)上 維系人類與自然的平衡 達(dá)到完整的代際公平和區(qū)際公平 即時間過程的最大合理性與空間分布的最大合理化 從1990年開始 聯(lián)合國開發(fā)計劃署 UYNP 首次采用 人文發(fā)展系數(shù) 指標(biāo)對于國民生活質(zhì)量進(jìn)行測度 人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標(biāo)組合 即人的健康狀況 使用出生時的人均預(yù)期壽命表達(dá) 人的智力程度 使用組合的教育成就表達(dá) 人的福利水平 使用人均國民收入或人均GDP表達(dá) 并且特別強(qiáng)調(diào)三類指標(biāo)組合的整體表達(dá)內(nèi)涵 去衡量一個國家或地區(qū)的社會發(fā)展總體狀況以及國民生活質(zhì)量的總水平 在這個指標(biāo)體系中有如下的指標(biāo) X1 預(yù)期壽命X2 成人識字率X3 綜合入學(xué)率X4 人均GDP 美圓 X5 預(yù)期壽命指數(shù)X6 教育成就指數(shù)X7 人均GDP指數(shù) 旋轉(zhuǎn)后的因子結(jié)構(gòu)RotatedFactorPatternFACTOR1FACTOR2FACTOR3X10 381290 417650 81714X20 121660 848280 45981X30 648030 618220 22398X40 904100 205310 34100X50 388540 432950 80848X60 282070 853250 43289X70 900910 206120 35052FACTOR1為經(jīng)濟(jì)發(fā)展因子FACTOR2為教育成就因子FACTOR3為健康水平因子 被每個因子解釋的方差和共同度VarianceexplainedbyeachfactorFACTOR1FACTOR2FACTOR32 4397002 2763172 009490FinalCommunalityEstimates Total 6 725507X1X2X3X4X50 9875300 9457960 8523060 9758300 992050X6X70 9949950 976999 StandardizedScoringCoefficients標(biāo)準(zhǔn)化得分系數(shù)FACTOR1FACTOR2FACTOR3X1 0 18875 0 343970 85077X2 0 241090 60335 0 10234X30 354620 50232 0 59895X40 53990 0 17336 0 10355X5 0 17918 0 316040 81490X6 0 092300 62258 0 24876 例3生育率的影響因素分析 生育率受社會 經(jīng)濟(jì) 文化 計劃生育政策等很多因素影響 但這些因素對生育率的影響并不是完全獨立的 而是交織在一起 如果直接用選定的變量對生育率進(jìn)行多元回歸分析 最終結(jié)果往往只能保留兩三個變量 其他變量的信息就損失了 因此 考慮用因子分析的方法 找出變量間的數(shù)據(jù)結(jié)構(gòu) 在信息損失最少的情況下用新生成的因子對生育率進(jìn)行分析 選擇的變量有 多子率 綜合節(jié)育率 初中以上文化程度比例 城鎮(zhèn)人口比例 人均國民收入 下表是1990年中國30個省 自治區(qū) 直轄市的數(shù)據(jù) 特征根與各因子的貢獻(xiàn) 沒有旋轉(zhuǎn)的因子結(jié)構(gòu) 在這個例子中我們得到了兩個因子 第一個因子是社會經(jīng)濟(jì)發(fā)展水平因子 第二個是計劃生育因子 有了因子得分值后 則可以利用因子得分為變量 進(jìn)行其他的統(tǒng)計分析 方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu) 標(biāo)準(zhǔn)化得分函數(shù) 6因子分析的SPSS操作 原始數(shù)據(jù) 20口鹽泉的化學(xué)成分 建立Excel數(shù)據(jù)表文件 數(shù)據(jù)存放在Sheet1 打開SPSS16 0 在SPSS開始向?qū)Т翱?選定 CreatenewqueryusingDatabaseWizard 點擊 OK 按鈕 進(jìn)入 DatabaseWizard 向?qū)Т翱?在 DatabaseWizard 向?qū)Т翱?選定 ExcelFiles 點擊 Next 按鈕 在 ODBCDriverLogin 向?qū)Т翱?使用 Browse 按鈕 搜索選定Excel數(shù)據(jù)源文件 點擊 Open 按鈕 點擊 OK 按鈕 在 DatabaseWizard 向?qū)Т翱?在其左邊的窗口中選定Excel數(shù)據(jù)表 本例為Sheet1 點擊位于中間的 箭頭 按鈕 將該數(shù)據(jù)表 本例為Sheet1 移入到右邊的空白窗口之中 點擊 Next 按鈕 第二次點擊 Next 按鈕 第三次點擊 Next 按鈕 在 DatabaseWizard 向?qū)Т翱?使用 Browse 按鈕指定文件夾 命名SPSS數(shù)據(jù)轉(zhuǎn)換文件 spq 建議采用與Excel數(shù)據(jù)文件相同的名稱 點擊 Save 按鈕 點擊 Next 按鈕 點擊 Finish 按鈕 自動回到SPSS16 0視窗 顯示為未命名的SPSS數(shù)據(jù)集編輯窗口 在SPSS數(shù)據(jù)集編輯窗口的底部 點擊 VariableView 定義各變量的數(shù)據(jù)類型 寬度 小數(shù)位數(shù)等 在SPSS數(shù)據(jù)集編輯窗口的底部 點擊 DataView 顯示出最終的數(shù)據(jù)集 利用該數(shù)據(jù)集 在SPSS主菜單 選定 Analyze DataReduction Factor 點擊 得到因子分析引導(dǎo)窗口 FactorAnalysis 在因子分析引導(dǎo)窗口 FactorAnalysis 將待分析的原始變量用箭頭輸入到右邊的 Variables 窗口 在因子分析引導(dǎo)窗口 FactorAnalysis 點擊 Descriptives 按鈕 進(jìn)入 Descriptives 對話框 從中選取需要的統(tǒng)計量 選完后點擊 Continue 在因子分析引導(dǎo)窗口 FactorA

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論