數(shù)學模型講座因子分析_第1頁
數(shù)學模型講座因子分析_第2頁
數(shù)學模型講座因子分析_第3頁
數(shù)學模型講座因子分析_第4頁
數(shù)學模型講座因子分析_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)學模型講座因子分析第1頁,課件共29頁,創(chuàng)作于2023年2月因子分析是主成分分析的推廣和發(fā)展,它也是多元統(tǒng)計中處理降維的一種方法。因子分析是研究相關(guān)陣或協(xié)差陣的內(nèi)部依賴關(guān)系,將多個變量綜合為少數(shù)幾個因子,再現(xiàn)原始變量與因子之間的關(guān)系。形成和發(fā)展:1904年CharlesSpearman的論文

《對智力測驗得分進行的統(tǒng)計分析》

早期主要用于心理學和教育學方面的問題目前:經(jīng)濟學、社會學、考古學、生物學、醫(yī)學及體育科學第2頁,課件共29頁,創(chuàng)作于2023年2月實例1(1)為了解學生的學習能力,觀測了n個學生p個科目的成績,用X1,

X2,…,Xp表示科目(例如代數(shù)、幾何、語文、英語,……)可以認為各科目有兩部分組成:其中F是對所有的Xi都起作用的公共因子,它表示智能高低的因子;系數(shù)ai稱為因子載荷,表示第i各科目在智能高低上的體現(xiàn);εi是科目變量特有的特殊因子,描述原始變量.這就是一個最簡單的因子模型;(2).推廣到m個因子,如數(shù)學因子、記憶因子、計算因子等,分別記為F1,F2,……,Fm。

這就是一個因子分析模型.第3頁,課件共29頁,創(chuàng)作于2023年2月實例2

調(diào)查青年對婚姻家庭的態(tài)度,抽取n個青年回答了50個問題的答卷,這些問題可歸納為如下的幾個方面:如對相貌的重視,對孩子的觀點、對老人的態(tài)度等實例3考察人體的五項生理指標:收縮壓、舒張壓、心跳間隔、呼吸間隔和舍下溫度。從生理學知識,這五項指標是受植物神經(jīng)支配的,植物神經(jīng)又分為交感神經(jīng)和副交感神經(jīng),因此這五項指標也可以用因子分析模型去處理

第4頁,課件共29頁,創(chuàng)作于2023年2月因子分析的主要應用

(1).尋求基本結(jié)構(gòu),簡化觀測系統(tǒng),將具有錯綜復雜關(guān)系的對象(變量或樣本)綜合為少數(shù)幾個因子(不可觀測的隨機變量),以再現(xiàn)因子與原始變量之間的內(nèi)在聯(lián)系

(2).用于分類,對變量或樣本進行分類.

R型和Q型因子分析(1).R型從變量的相關(guān)陣出發(fā),找出控制所有變量的幾個公共因子,用以對變量或樣本進行分類。(2).Q型從樣本的相相似據(jù)陣出發(fā),找出控制所有樣本的幾個主要因素。第5頁,課件共29頁,創(chuàng)作于2023年2月因子分析與主成分分析的區(qū)別

(1).主成分分析不能作為一個模型,只是變量變換,而因子分析需要構(gòu)造模型

(2).主成分的個數(shù)和變量的個數(shù)相同,它是將一組具有相關(guān)的關(guān)系的變量變換為一組互不相關(guān)的變量,而因子分析是要用盡可能少的的公因子,以便構(gòu)造一個簡單的因子模型

(3).

主成分表示為原始變量的線性組合,而因子分析是將原始變量表示為公因子和特殊因子的線性組合。第6頁,課件共29頁,創(chuàng)作于2023年2月R型因子分析的數(shù)學模型用矩陣表示因子分析的數(shù)學模型第7頁,課件共29頁,創(chuàng)作于2023年2月簡記為且滿足第8頁,課件共29頁,創(chuàng)作于2023年2月為任一個m階的正交陣,上式仍滿足約束條件因子分析每個相應的系數(shù)不是唯一的,即因子載荷陣不是唯一的通過模型以F代替X,由于m<p,或m<n,從而達到簡化變量維數(shù)目的因子分析的目的第9頁,課件共29頁,創(chuàng)作于2023年2月正交因子模型中各統(tǒng)計量的意義因子載荷的統(tǒng)計意義第i個變量與第j個公共因子的相關(guān)系數(shù)。用統(tǒng)計學術(shù)語叫權(quán)重,表示Xi依賴Fj的分量第10頁,課件共29頁,創(chuàng)作于2023年2月因子載荷據(jù)陣A中各行元素的平方和記為稱為變量Xi的共同度公共因子方差剩余方差變量共同度的統(tǒng)計意義第11頁,課件共29頁,創(chuàng)作于2023年2月因子載荷據(jù)陣A中各列元素的平方和記為表示第j個因子對所有分量的總影響,稱為第j個因子對X的貢獻,它是衡量第j個因子相對重要性的指標公共因子Fj方差的統(tǒng)計意義第12頁,課件共29頁,創(chuàng)作于2023年2月因子載荷陣的估計方法主成分法主因子法極大似然法設(shè)樣本的協(xié)差陣的特征值和特征向量分別為:則協(xié)差陣可分解為第13頁,課件共29頁,創(chuàng)作于2023年2月其中分量A和D就是因子模型的一個解,A中的第j列和X中的第j個主成分的系數(shù)相差一個倍數(shù)。故此解常稱為因子模型的主成分解。當最后p-m個特征值較小時,協(xié)差陣可以近似的分解為第14頁,課件共29頁,創(chuàng)作于2023年2月公因子個數(shù)的確定方法1)根據(jù)實際問題的意義或?qū)I(yè)理論知識2)用確定主成分個數(shù)的原則第15頁,課件共29頁,創(chuàng)作于2023年2月因子旋轉(zhuǎn)用一個正交陣右乘A,使旋轉(zhuǎn)后的因子載荷陣結(jié)構(gòu)簡化,即使得每個變量僅在一個公共因子上有較大的載荷,而在其余的因子上載荷比較小。方差最大的正交旋轉(zhuǎn)使得旋轉(zhuǎn)后的所得到的因子載荷陣的總方差達到最大值.第16頁,課件共29頁,創(chuàng)作于2023年2月因子得分Thomson回歸法第17頁,課件共29頁,創(chuàng)作于2023年2月因子分析的步驟計算所選原始變量的相關(guān)系數(shù)矩陣相關(guān)系數(shù)矩陣描述了原始變量之間的相關(guān)關(guān)系。可以幫助判斷原始變量之間是否存在相關(guān)關(guān)系,這對因子分析是非常重要的,因為如果所選變量之間無關(guān)系,做因子分析是不恰當?shù)?。并且相關(guān)系數(shù)矩陣是估計因子結(jié)構(gòu)的基礎(chǔ)。選擇分析的變量用定性分析和定量分析的方法選擇變量,因子分析的前提條件是觀測變量間有較強的相關(guān)性,因為如果變量之間無相關(guān)性或相關(guān)性較小的話,他們不會有共享因子,所以原始變量間應該有較強的相關(guān)性。第18頁,課件共29頁,創(chuàng)作于2023年2月提取公共因子這一步要確定因子求解的方法和因子的個數(shù)。需要根據(jù)研究者的設(shè)計方案或有關(guān)的經(jīng)驗或知識事先確定。因子個數(shù)的確定可以根據(jù)因子方差的大小。只取方差大于1(或特征值大于1)的那些因子,因為方差小于1的因子其貢獻可能很??;按照因子的累計方差貢獻率來確定,一般認為要達到60%才能符合要求;

因子旋轉(zhuǎn)通過坐標變換使每個原始變量在盡可能少的因子之間有密切的關(guān)系,這樣因子解的實際意義更容易解釋,并為每個潛在因子賦予有實際意義的名字。

第19頁,課件共29頁,創(chuàng)作于2023年2月

計算因子得分求出各樣本的因子得分,有了因子得分值,則可以在許多分析中使用這些因子,例如以因子的得分做聚類分析的變量,做回歸分析中的回歸因子。

第20頁,課件共29頁,創(chuàng)作于2023年2月因子分析計算步驟與實例分析對我國30個省市自治區(qū)的農(nóng)業(yè)生產(chǎn)情況作因子分析。從農(nóng)業(yè)生產(chǎn)條件和生產(chǎn)結(jié)果及效益出發(fā),選取六項指標分別為:X1—鄉(xiāng)村勞動力人口(萬人)、X2—人均經(jīng)營耕地面積(畝)、X3—戶均生產(chǎn)性固定資產(chǎn)原值(元)、X4—家庭基本純收入(元)、X5—人均農(nóng)業(yè)總產(chǎn)值(千元/人)、X6—增加值占總產(chǎn)值比重(%),原始資料數(shù)據(jù)如下頁表:第21頁,課件共29頁,創(chuàng)作于2023年2月序號地區(qū)X1X2X3X4X5X61北京66.90.932972.413290.732.52549.72天津80.21.644803.542871.621.77449.63河北1621.82.034803.542871.810.8004544山西635.42.762257.661499.140.55556.25內(nèi)蒙古514.110.175834.941550.150.905166.46遼寧605.12.963108.862059.351.475253.17吉林534.24.734767.511940.461.115463.18黑龍江494.88.245573.022075.421.628357.89上海661.021660.034571.813.044835.610江蘇1530.21.262826.862868.331.192150.611浙江1123.10.945494.233289.070.856563.312安徽1953.61.443573.621508.240.575659.213福建775.80.822410.052295.191.149662.814江西1103.21.32310.981804.930.664959.915山東2475.11.443109.111989.530.88095516河南2815.81.53782.261508.360.582358.517湖北1296.51.62291.61754.130.879962.818湖南2089.31.422348.721719.180.58764.719廣東1439.80.883249.612928.241.09659.720廣西1579.91.433090.171590.90.569464.521海南165.91.354454.771575.490.353565.222四川3903.71.082870.451340.610.444364.123貴州1376.61.182282.271206.250.289265.424云南1642.22.424025.061096.730.345664.225西藏88.62.5111559.831257.710.434970.426陜西1046.12.62228.551091.960.438359.727甘肅6725.862879.361037.120.488357.228青海137.12.626725.111133.060.409670.329寧夏139.14.015607.971346.890.497362.530新疆288.53.967438.131161.711.493957.8第22頁,課件共29頁,創(chuàng)作于2023年2月因子分析計算步驟與實例分析第一步將原始數(shù)據(jù)標準化第二步建立指標間的相關(guān)系數(shù)陣R:第23頁,課件共29頁,創(chuàng)作于2023年2月因子分析計算步驟與實例分析第三步求R的特征值和特征向量。序號特征值貢獻率累積貢獻率(%)12.776546.275646.275621.740929.016075.291730.711611.861287.152940.43347.224894.377850.23693.948498.326360.10041.6736100第24頁,課件共29頁,創(chuàng)作于2023年2月因子分析計算步驟與實例分析由于前三個特征值累積貢獻率已達87.15%,所以取前三個特征值所對應的特征向量如下:u1u2u30.1460-0.6242-0.18540.16310.52700.75470.24210.52720.5369-0.54630.01530.2325-0.54550.2317-0.04220.54530.02250.2276第25頁,課件共29頁,創(chuàng)作于2023年2月因子分析計算步驟與實例分析第四步列出因子載荷矩陣表。因子指標a1a2a3X10.2433-0.8236-0.15640.7621X20.27180.69540.63660.9629X30.40350.69570.45290.8520X4-0.91030.02020.19610.8675X5-0.90890.3057-0.03560.9210X60.90860.02960.1920.8634第26頁,課件共29頁,創(chuàng)作于2023年2月因子分析計算步驟與實例分析第五步對因子載荷陣實行方差最大正交旋轉(zhuǎn),旋轉(zhuǎn)后的矩陣如下:

由上表可見,每個因子只對應少數(shù)幾個指標的因子載荷較大,因此可根據(jù)上表對指標進行分類。因子

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論