因素分析方法_第1頁
因素分析方法_第2頁
因素分析方法_第3頁
因素分析方法_第4頁
因素分析方法_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于因素分析方法第1頁,課件共20頁,創(chuàng)作于2023年2月因素分析——FactorAnalysis系統(tǒng)分析與決策的四個(gè)進(jìn)程:對(duì)系統(tǒng)進(jìn)行描述性分析解析性分析預(yù)測(cè)性研究系統(tǒng)決策 因素分析法屬于描述性分析,它能保證在數(shù)據(jù)信息損失最小的前提下,從大規(guī)模的原始數(shù)據(jù)群中,迅速將重要的信息提取出來,將高維的數(shù)據(jù)進(jìn)行降維處理,迅速的揭示出系統(tǒng)中的因子結(jié)構(gòu),使人們對(duì)系統(tǒng)達(dá)到盡可能充分的認(rèn)識(shí),提高決策者的洞察力和分析效率。又稱作因子分析。第2頁,課件共20頁,創(chuàng)作于2023年2月因子分析 因子分析是通過變量或樣本的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的研究,找出能控制所有變量的少數(shù)幾個(gè)隨機(jī)變量去描述多個(gè)變量之間的相關(guān)關(guān)系。即將觀察變量分類,將相關(guān)性較高的、聯(lián)系較密切的、包含重復(fù)信息較多的變量分在同一類中,使不同類的變量之間的相關(guān)性較低,每類變量代表了一個(gè)本質(zhì)因子或基本結(jié)構(gòu)。因子分析就是尋找系統(tǒng)中這種不可觀測(cè)的因子或結(jié)構(gòu)的方法。第3頁,課件共20頁,創(chuàng)作于2023年2月因子分析 在許多實(shí)際問題中,涉及的變量眾多,各變量間還存在錯(cuò)綜復(fù)雜的相關(guān)關(guān)系,這時(shí)最好能從中提取少數(shù)綜合變量,這些綜合變量彼此不相關(guān),是不可測(cè)的潛在因素,但對(duì)觀測(cè)變量的變化起支配作用,且包含原變量提供的大部分信息。因子分析就是為解決這一問題提供的統(tǒng)計(jì)分析方法。 例如:P159東西部地區(qū)各主成份的提取第4頁,課件共20頁,創(chuàng)作于2023年2月因子分析的目的和任務(wù)目的:

尋求變量的基本結(jié)構(gòu)、簡(jiǎn)化觀測(cè)系統(tǒng),即減少變量維數(shù)。用一個(gè)變量子集來解釋整個(gè)問題。主要目的是研究一種假設(shè)的結(jié)構(gòu),用m(m<p)個(gè)假設(shè)的公共因子來解釋和說明p個(gè)變量之間的相互依賴結(jié)構(gòu)及其復(fù)雜關(guān)系。任務(wù):

尋找共性因素,且能解釋各主因子的意義第5頁,課件共20頁,創(chuàng)作于2023年2月主成份分析主成分分析只是一種中間手段,其背景是研究中經(jīng)常會(huì)遇到多指標(biāo)的問題,這些指標(biāo)間往往存在一定的相關(guān),直接納入分析不僅復(fù)雜,變量間難以取舍,而且可能因多元共線性而無法得出正確結(jié)論。主成分分析的目的就是通過線性變換,將原來的多個(gè)指標(biāo)組合成相互獨(dú)立的少數(shù)幾個(gè)能充分反映總體信息的指標(biāo),便于進(jìn)一步分析。第6頁,課件共20頁,創(chuàng)作于2023年2月模型形式1.1公共因子與特殊因子 從總體中提取的綜合變量:F1,F2,…,Fm(m<p)稱為(總體的)公共因子。一般來說,公共因子不可能包含總體的所有信息,每個(gè)變量Xi除了可以由公共因子解釋的那部分外,總還有一些公共因子解釋不了的部分,稱這部分為變量Xi的特殊因子,記為:i。 故因子模型描述為:變量Xi的信息=公共因子可以表達(dá)部分公共因子不可表達(dá)部分 目前,公共因子可以表達(dá)的部分由公共因子的線性組合表示。即上面的因子模型可以寫成以下的形式:第7頁,課件共20頁,創(chuàng)作于2023年2月1.2正交因子模型 其中m<p,F(xiàn)1,F2,…,Fm稱為所有變量的公共因子;i稱為變量Xi的特殊因子。模型假設(shè):公共因子是互相不相關(guān)的。特殊因子和公共因子不相關(guān)。

第8頁,課件共20頁,創(chuàng)作于2023年2月1.3因子載荷矩陣1.矩陣A稱為因子載荷矩陣(componentmatrix)系數(shù)aij稱為變量Xi在因子Fj上的載荷(loading)。即變量Xi在公共因子Fj上的載荷aij就是Xi與Fj的相關(guān)系數(shù)。反映公共因子對(duì)觀察變量的影響程度。因子載荷越高,表明該因子包含原有指標(biāo)的信息量越多。2.載荷矩陣的估計(jì):主成分法。

主成分法是估計(jì)載荷矩陣的一種方法,由于其估計(jì)結(jié)果和變量的主成分僅相差一個(gè)常數(shù)倍,因此就冠以主成分法的名稱。學(xué)習(xí)的時(shí)候,不要和主成分分析混為一談。主成分法是SPSS系統(tǒng)默認(rèn)的方法,在一般情況下,這是比較好的方法。以數(shù)據(jù)“應(yīng)征人員”為例,按特征值大于1提取公共因子。在用不同方法獲得因子載荷時(shí),公共因子對(duì)總體方差的貢獻(xiàn)率以主成分法為最高:第9頁,課件共20頁,創(chuàng)作于2023年2月第二節(jié)變量的共同度與因子的方差貢獻(xiàn)率2.1變量的共同度定義載荷矩陣A的第i行元素的平方和:稱為變量Xi的共同度(communality)。共同度表示公共因子在多大的程度上解釋變量Xi。2.2公共因子的方差貢獻(xiàn)率定義載荷矩陣A第j列的平方和:稱為因子Fj對(duì)總體的貢獻(xiàn)(initialeigenvalues)。第10頁,課件共20頁,創(chuàng)作于2023年2月共性方差:

也稱方差貢獻(xiàn)率,是用某個(gè)公共因子占總方差的百分比來說明共性因素的對(duì)觀測(cè)變量總體的作用大小。公共因子個(gè)數(shù)的選擇應(yīng)考慮:因子所能解釋的方差比率或貢獻(xiàn)率;與利用有關(guān)專業(yè)知識(shí)所得結(jié)果的合理一致性通過這幾種途徑和手段對(duì)研究結(jié)果給予合理解釋的可能性和可靠性。 一般,所選公共因子的個(gè)數(shù)應(yīng)保證使其方差累計(jì)貢獻(xiàn)率大于85%,且主成份個(gè)數(shù)與變量個(gè)數(shù)的比值越小越好。第11頁,課件共20頁,創(chuàng)作于2023年2月第三節(jié)方差最大正交旋轉(zhuǎn)3.1因子旋轉(zhuǎn)的意義1.正交因子模型只是一個(gè)數(shù)學(xué)模型,所得的因子在專業(yè)上不一定能反映問題的實(shí)質(zhì),或者說:因子作為一個(gè)綜合變量,其專業(yè)意義在許多情況下不容易解釋。因子旋轉(zhuǎn)就是針對(duì)這一問題,提出的一種改進(jìn)的方法。2.因子旋轉(zhuǎn)的依據(jù):因子模型的不唯一性。

正是由于因子模型的不唯一性,如果模型不適合專業(yè)解釋,那么作一個(gè)正交變換T(即因子旋轉(zhuǎn)),在新模型中再去尋找因子的專業(yè)解釋。經(jīng)轉(zhuǎn)換后的公共因子具有最大的載荷離散總平方和D。由此確定的因子載荷矩陣B,對(duì)每個(gè)公共因子來說,載荷最為分散,因此比較容易對(duì)因子的專業(yè)意義作出解釋。第12頁,課件共20頁,創(chuàng)作于2023年2月第四節(jié)因子得分4.1因子得分函數(shù) 因子模型將總體中的原有變量分解為公共因子與特殊因子的線性組合: 按照這個(gè)思路,也可以把每個(gè)公共因子表示成原變量的線性組合: 稱這個(gè)線性表達(dá)式為因子得分函數(shù)。用它可以計(jì)算出每個(gè)觀察值在各公共因子上的取值,從而在一定程度上解決了公共因子不可觀察的問題。獲得因子得分函數(shù)的關(guān)鍵問題是怎樣估計(jì)參數(shù)bj1,bj2,…,bjp。第13頁,課件共20頁,創(chuàng)作于2023年2月*4.2因子得分的估計(jì)(Thompson方法) 根據(jù)回歸分析中最小二乘法,應(yīng)有: 但是,是不可觀察的。因此上述公式尚不能給出因子得分函數(shù)的系數(shù)估計(jì)。在總體變量標(biāo)準(zhǔn)化的條件下,根據(jù)正交因子模型的假設(shè)是總體與因子的樣本相關(guān)系數(shù),所以可以用因子載荷矩陣A的第j列代替。第14頁,課件共20頁,創(chuàng)作于2023年2月第五節(jié)KMO檢驗(yàn)與Bartlett球形檢驗(yàn)5.1因子分析對(duì)樣本的要求 和任何統(tǒng)計(jì)分析問題一樣,因子分析也要求樣本具有一定的容量。這從兩個(gè)方面來說:從變量個(gè)數(shù)p考量,則樣本容量n應(yīng)有n5p;即使這樣,樣本容量也不能太少,一般應(yīng)在100以上。以上要求在實(shí)際問題中往往都達(dá)不到。這時(shí)可以適當(dāng)放寬要求,結(jié)合檢驗(yàn)來判斷結(jié)果的可靠性。第15頁,課件共20頁,創(chuàng)作于2023年2月5.2因子分析可行性與效果檢驗(yàn)1.Bartlett球形檢驗(yàn)檢驗(yàn)各變量是否獨(dú)立,通過相關(guān)陣是否單位陣來判斷。只有在原假設(shè):各變量相互獨(dú)立被拒絕,因子分析才能進(jìn)行。2.KMO檢驗(yàn)檢查各變量間的偏相關(guān)性,用來判斷因子分析效果:0≤KMO≤1。通常使用的標(biāo)準(zhǔn)是:當(dāng)KMO0.7,因子分析效果較好,越大越好 當(dāng)KMO<0.5,此時(shí)不適合用因子分析法。第16頁,課件共20頁,創(chuàng)作于2023年2月5.3關(guān)于因子的解釋 因子分析得到的公共因子應(yīng)該可以解釋,即有實(shí)際意義。否則,就應(yīng)該重新設(shè)計(jì)原始變量集合。第17頁,課件共20頁,創(chuàng)作于2023年2月第六節(jié)實(shí)例——東西部經(jīng)濟(jì)發(fā)展因子分析準(zhǔn)備數(shù)據(jù)選擇因素定性分析收集數(shù)據(jù)

工業(yè)農(nóng)業(yè)GDP投資自然資源……定義變量

注意因素不等于變量,變量必為等間隔測(cè)度或比率的數(shù)值型,用于計(jì)算彼此間的相關(guān)系數(shù)。數(shù)據(jù)要求

注意變量的標(biāo)準(zhǔn)化、歸一化、無量綱化處理,總量與相對(duì)量問題等。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論