因子分析(課堂PPT)_第1頁
因子分析(課堂PPT)_第2頁
因子分析(課堂PPT)_第3頁
因子分析(課堂PPT)_第4頁
因子分析(課堂PPT)_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第十章第十章SPSS 因子分析因子分析2本章內(nèi)容10.1 因子分析概述因子分析概述10.2 因子分析的基本內(nèi)容因子分析的基本內(nèi)容10.3 因子分析的基本操作及案例因子分析的基本操作及案例310.1 因子分析概述10.1.1因子分析的意義因子分析的意義 在實(shí)際問題的分析過程中,人們往往希望盡可能多的在實(shí)際問題的分析過程中,人們往往希望盡可能多的搜集關(guān)于分析對象的數(shù)據(jù)信息,進(jìn)而能夠比較全面的、完搜集關(guān)于分析對象的數(shù)據(jù)信息,進(jìn)而能夠比較全面的、完整的把握和認(rèn)識它。于是,對研究對象的描述就會有很多整的把握和認(rèn)識它。于是,對研究對象的描述就會有很多指標(biāo)。但是效果如何呢?如果搜集的變量過多,雖然能夠指標(biāo)。

2、但是效果如何呢?如果搜集的變量過多,雖然能夠比較全面精確的描述事物,但在實(shí)際建模時這些變量會給比較全面精確的描述事物,但在實(shí)際建模時這些變量會給統(tǒng)計分析帶來計算量大和信息重疊的問題。而消減變量個統(tǒng)計分析帶來計算量大和信息重疊的問題。而消減變量個數(shù)必然會導(dǎo)致信息丟失和信息不完整等問題的產(chǎn)生。數(shù)必然會導(dǎo)致信息丟失和信息不完整等問題的產(chǎn)生。 因子分析是解決上述問題的一種非常有效的方法。它因子分析是解決上述問題的一種非常有效的方法。它以最少的信息丟失,將原始眾多變量綜合成較少的幾個綜以最少的信息丟失,將原始眾多變量綜合成較少的幾個綜合指標(biāo)(因子),能夠起到有效降維的目的。合指標(biāo)(因子),能夠起到有效降

3、維的目的。4因子分析的特點(diǎn)因子分析的特點(diǎn)1、因子個數(shù)遠(yuǎn)遠(yuǎn)少于原有變量的個數(shù);、因子個數(shù)遠(yuǎn)遠(yuǎn)少于原有變量的個數(shù);2、因子能夠反應(yīng)原有變量的絕大部分信息;、因子能夠反應(yīng)原有變量的絕大部分信息;3、因子之間不存在線性關(guān)系;、因子之間不存在線性關(guān)系;4、因子具有命名解釋性。、因子具有命名解釋性。510.1.2因子分析的數(shù)學(xué)模型和相關(guān)概念因子分析的數(shù)學(xué)模型和相關(guān)概念數(shù)學(xué)模型數(shù)學(xué)模型 假設(shè)原有變量有假設(shè)原有變量有p個,分別用個,分別用 表表示,且每個變量的均值是示,且每個變量的均值是0,標(biāo)準(zhǔn)差是,標(biāo)準(zhǔn)差是1,現(xiàn)將每個原,現(xiàn)將每個原有變量用有變量用k(kp)個因子)個因子 的線性組的線性組合來表示,即:合來

4、表示,即:123.pxxxx、 、 、111 112211221 1222221 122.kkkkppppkkpxa fa fa fxa fafafxafafafXAF用矩陣表示為12.kfff、 、6 在這個數(shù)學(xué)模型中,在這個數(shù)學(xué)模型中,F(xiàn)稱為公共因子,因?yàn)樗霈F(xiàn)在每個稱為公共因子,因?yàn)樗霈F(xiàn)在每個變量的線性表達(dá)式中,簡稱因子。因子可理解為高維空間中變量的線性表達(dá)式中,簡稱因子。因子可理解為高維空間中互相垂直的互相垂直的k個坐標(biāo)軸;個坐標(biāo)軸;A稱為因子載荷矩陣,稱為因子載荷矩陣, 稱為因子載稱為因子載荷,是第荷,是第i個原始變量在第個原始變量在第j個因子上的負(fù)荷;個因子上的負(fù)荷; 稱為特殊因

5、子稱為特殊因子,表示原始變量不能被因子解釋的部分。其均值為,表示原始變量不能被因子解釋的部分。其均值為0,相當(dāng)于,相當(dāng)于多元線性回歸模型中的殘差。多元線性回歸模型中的殘差。因子分析的幾個相關(guān)概念因子分析的幾個相關(guān)概念1、因子載荷、因子載荷 在因子不相關(guān)的前提下,因子載荷是第在因子不相關(guān)的前提下,因子載荷是第i個變量與第個變量與第j個個因子的相關(guān)系數(shù)。因子載荷越大說明因子與變量的相關(guān)性越因子的相關(guān)系數(shù)。因子載荷越大說明因子與變量的相關(guān)性越強(qiáng),所以因子載荷說明了因子對變量的重要作用和程度。強(qiáng),所以因子載荷說明了因子對變量的重要作用和程度。 ija7 2、變量共同度、變量共同度 變量共同度也稱為公共

6、方差。第變量共同度也稱為公共方差。第i個變量的共同度定義個變量的共同度定義為因子載荷矩陣中第為因子載荷矩陣中第i行元素的平方和,即:行元素的平方和,即: 3、因子的方差貢獻(xiàn)、因子的方差貢獻(xiàn) 因子方差貢獻(xiàn)是因子載荷矩陣中第因子方差貢獻(xiàn)是因子載荷矩陣中第j列元素的平方和,列元素的平方和,反映了第反映了第j個因子對原有變量總方差的解釋能力。該數(shù)值越個因子對原有變量總方差的解釋能力。該數(shù)值越高,說明相應(yīng)因子的重要性越高。高,說明相應(yīng)因子的重要性越高。221pjijiSa221kiijjha810.2 因子分析的基本內(nèi)容10.2.1因子分析的基本步驟因子分析的基本步驟 1、因子分析的前提條件;、因子分析

7、的前提條件; 因子分析的前提條件是原始變量之間應(yīng)存在較因子分析的前提條件是原始變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。強(qiáng)的相關(guān)關(guān)系。 2、因子提??;、因子提??; 3、使因子更具有命名可解釋性;、使因子更具有命名可解釋性; 4、計算各樣本的因子得分。、計算各樣本的因子得分。910.2.2因子分析的前提條件因子分析的前提條件 1、計算相關(guān)系數(shù)并進(jìn)行統(tǒng)計檢驗(yàn)、計算相關(guān)系數(shù)并進(jìn)行統(tǒng)計檢驗(yàn) 如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)小于如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)小于0.3,那么,那么這些變量不適合進(jìn)行因子分析。這些變量不適合進(jìn)行因子分析。 2、計算反映象相關(guān)矩陣、計算反映象相關(guān)矩陣222ijijiijijijij

8、ijijrMSArprp其中 為第i個變量與第j個變量的簡單相關(guān)系數(shù);為第i個變量與第j個變量在控制了剩余變量下的偏相關(guān)系數(shù)。10 3、Bartletts球度檢驗(yàn)球度檢驗(yàn) 以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn),假設(shè)相關(guān)系數(shù)以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn),假設(shè)相關(guān)系數(shù)為單位矩陣,如果該檢驗(yàn)對應(yīng)的為單位矩陣,如果該檢驗(yàn)對應(yīng)的P值小于給定的顯著性水平值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為原有變量適合進(jìn)行因子分析。,則應(yīng)拒絕原假設(shè),認(rèn)為原有變量適合進(jìn)行因子分析。 4、KMO檢驗(yàn)檢驗(yàn) 該統(tǒng)計量取值在該統(tǒng)計量取值在0-1之間,越接近于之間,越接近于1說明變量間的相說明變量間的相關(guān)性越強(qiáng),原有變量適合

9、做因子分析。關(guān)性越強(qiáng),原有變量適合做因子分析。0.9以上表示非常合以上表示非常合適;適;0.8-0.9表示合適;表示合適;0.7-0.8表示一般;表示一般;0.6-0.7表表示尚可;示尚可;0.5-0.6表示不太合適;表示不太合適;0.5以下表示極不合適。以下表示極不合適。222ijijiijijijijijijrMSArprp其中 為第i個變量與第j個變量的簡單相關(guān)系數(shù);為第i個變量與第j個變量在控制了剩余變量下的偏相關(guān)系數(shù)。1110.2.3因子提取和因子載荷矩陣的求解因子提取和因子載荷矩陣的求解 因子載荷矩陣的求解一般采用主成分法。主成份分析因子載荷矩陣的求解一般采用主成分法。主成份分析法

10、通過坐標(biāo)變換的手段,將原有的法通過坐標(biāo)變換的手段,將原有的p個變量標(biāo)準(zhǔn)化后進(jìn)行線個變量標(biāo)準(zhǔn)化后進(jìn)行線性組合,轉(zhuǎn)換成另一組不相關(guān)的變量性組合,轉(zhuǎn)換成另一組不相關(guān)的變量y,即:,即:111 11221221 1222211 12222212.1(1 2 .pppppppppiiipyu xu xu xyu xu xuxyu xuxu xuuuip其中、 )12式中的系數(shù)按以下原則進(jìn)行求解:式中的系數(shù)按以下原則進(jìn)行求解:(1)(2) 根據(jù)以上原則確定的變量依次為原始變量的第根據(jù)以上原則確定的變量依次為原始變量的第1、第、第2第第p個主成分。其中第一個主成分在總方差中所占比例個主成分。其中第一個主成分

11、在總方差中所占比例最大,其余主成分在總方差中所占比例依次遞減,即主成分最大,其余主成分在總方差中所占比例依次遞減,即主成分綜合原始變量的能力依次減弱。在主成份的實(shí)際應(yīng)用中,一綜合原始變量的能力依次減弱。在主成份的實(shí)際應(yīng)用中,一般只選取前面幾個主成分即可,這樣既減少了變量的數(shù)目,般只選取前面幾個主成分即可,這樣既減少了變量的數(shù)目,又能夠用較少的主成分反映原始變量的絕大部分信息。又能夠用較少的主成分反映原始變量的絕大部分信息。ijyy與 相互獨(dú)立(ij,i,j=1、2、3、.、p)121121ppyyyyyyy是所有線性組合中方差最大的;是與 不相關(guān)的一切線性組合中方差最大的;是與 、 、.、都不

12、相關(guān)的一切線性組合中方差最大的。13 可見,主成分分析關(guān)鍵的步驟是如何求出上述方程可見,主成分分析關(guān)鍵的步驟是如何求出上述方程中的系數(shù)。通過方程的推導(dǎo)可以發(fā)現(xiàn),每個方程中的系中的系數(shù)。通過方程的推導(dǎo)可以發(fā)現(xiàn),每個方程中的系數(shù)向量是原始變量相關(guān)系數(shù)矩陣的特征值對應(yīng)的特征向數(shù)向量是原始變量相關(guān)系數(shù)矩陣的特征值對應(yīng)的特征向量。具體求解步驟如下:量。具體求解步驟如下:(1)將原有變量進(jìn)行標(biāo)準(zhǔn)化處理;)將原有變量進(jìn)行標(biāo)準(zhǔn)化處理;(2)計算變量的相關(guān)系數(shù)矩陣;)計算變量的相關(guān)系數(shù)矩陣;(3)求相關(guān)系數(shù)矩陣的的特征根)求相關(guān)系數(shù)矩陣的的特征根 及對應(yīng)的特及對應(yīng)的特征向量征向量 12.p12.puuu、 、1

13、4 因子分析利用主成分分析得到的因子分析利用主成分分析得到的p個特征根和對應(yīng)的個特征根和對應(yīng)的特征向量,在此基礎(chǔ)上計算因子載荷矩陣:特征向量,在此基礎(chǔ)上計算因子載荷矩陣: 由于因子分析的目的是減少變量個數(shù),因此在計算由于因子分析的目的是減少變量個數(shù),因此在計算因子載荷矩陣時,一般不選取所有特征值,而只選取前因子載荷矩陣時,一般不選取所有特征值,而只選取前k個特征值和特征向量,得到下面包含個特征值和特征向量,得到下面包含k個因子的因子載荷個因子的因子載荷矩陣:矩陣: 15因子個數(shù)的確定方法:因子個數(shù)的確定方法:(1)根據(jù)特征根確定因子數(shù):一般選取大于)根據(jù)特征根確定因子數(shù):一般選取大于1的的特征

14、根,還可規(guī)定特征根數(shù)與特征根值的碎石特征根,還可規(guī)定特征根數(shù)與特征根值的碎石圖并通過觀察碎石圖確定因子數(shù);圖并通過觀察碎石圖確定因子數(shù);(2)根據(jù)因子的累計方差貢獻(xiàn)率確定因子數(shù):)根據(jù)因子的累計方差貢獻(xiàn)率確定因子數(shù):通常選取累計方差貢獻(xiàn)率大于通常選取累計方差貢獻(xiàn)率大于85%的特征根的特征根個數(shù)為因子個數(shù)。個數(shù)為因子個數(shù)。1617例:例: 成績數(shù)據(jù)(成績數(shù)據(jù)(student.sav)100個學(xué)生的數(shù)學(xué)、物理、化學(xué)、語文、歷史、個學(xué)生的數(shù)學(xué)、物理、化學(xué)、語文、歷史、英語的成績?nèi)缦卤恚ú糠郑S⒄Z的成績?nèi)缦卤恚ú糠郑?18從本例可能提出的問題從本例可能提出的問題能不能把這個數(shù)據(jù)的能不能把這個數(shù)據(jù)的

15、6個變量用一兩個綜合變量來表示呢?個變量用一兩個綜合變量來表示呢?這一兩個綜合變量包含有多少原來的信息呢?這一兩個綜合變量包含有多少原來的信息呢?能不能利用找到的綜合變量來對學(xué)生排序呢?這一類數(shù)據(jù)能不能利用找到的綜合變量來對學(xué)生排序呢?這一類數(shù)據(jù)所涉及的問題可以推廣到對企業(yè),對學(xué)校進(jìn)行分析、排序所涉及的問題可以推廣到對企業(yè),對學(xué)校進(jìn)行分析、排序、判別和分類等問題。、判別和分類等問題。19例中的的數(shù)據(jù)點(diǎn)是六維的;也就是說,每個觀測值是例中的的數(shù)據(jù)點(diǎn)是六維的;也就是說,每個觀測值是6維空間中的一個點(diǎn)。我們希望把維空間中的一個點(diǎn)。我們希望把6維空間用低維空間表維空間用低維空間表示。示。先假定只有二維

16、,即只有兩個變量,它們由橫坐標(biāo)和先假定只有二維,即只有兩個變量,它們由橫坐標(biāo)和縱坐標(biāo)所代表;因此每個觀測值都有相應(yīng)于這兩個坐縱坐標(biāo)所代表;因此每個觀測值都有相應(yīng)于這兩個坐標(biāo)軸的兩個坐標(biāo)值;如果這些數(shù)據(jù)形成一個橢圓形狀標(biāo)軸的兩個坐標(biāo)值;如果這些數(shù)據(jù)形成一個橢圓形狀的點(diǎn)陣,那么這個橢圓有一個長軸和一個短軸。在短的點(diǎn)陣,那么這個橢圓有一個長軸和一個短軸。在短軸方向上,數(shù)據(jù)變化很少;在極端的情況,短軸如果軸方向上,數(shù)據(jù)變化很少;在極端的情況,短軸如果退化成一點(diǎn),那只有在長軸的方向才能夠解釋這些點(diǎn)退化成一點(diǎn),那只有在長軸的方向才能夠解釋這些點(diǎn)的變化了;這樣,由二維到一維的降維就自然完成了的變化了;這樣,

17、由二維到一維的降維就自然完成了。20當(dāng)坐標(biāo)軸和橢圓的長短軸平行,那么代表長軸的變量就當(dāng)坐標(biāo)軸和橢圓的長短軸平行,那么代表長軸的變量就描述了數(shù)據(jù)的主要變化,而代表短軸的變量就描述了數(shù)描述了數(shù)據(jù)的主要變化,而代表短軸的變量就描述了數(shù)據(jù)的次要變化。據(jù)的次要變化。但是,坐標(biāo)軸通常并不和橢圓的長短軸平行。因此,需但是,坐標(biāo)軸通常并不和橢圓的長短軸平行。因此,需要尋找橢圓的長短軸,并進(jìn)行變換,使得新變量和橢圓要尋找橢圓的長短軸,并進(jìn)行變換,使得新變量和橢圓的長短軸平行。的長短軸平行。如果長軸變量代表了數(shù)據(jù)包含的大部分信息,就用該變?nèi)绻L軸變量代表了數(shù)據(jù)包含的大部分信息,就用該變量代替原先的兩個變量(舍去次

18、要的一維),降維就完量代替原先的兩個變量(舍去次要的一維),降維就完成了。成了。橢圓(球)的長短軸相差得越大,降維也越有效果。橢圓(球)的長短軸相差得越大,降維也越有效果。21-4-2024-4-202422對于多維變量的情況和二維類似,也有高維的橢對于多維變量的情況和二維類似,也有高維的橢球,只不過無法直觀地看見罷了。球,只不過無法直觀地看見罷了。首先把高維橢球的主軸找出來,再用代表大多數(shù)首先把高維橢球的主軸找出來,再用代表大多數(shù)數(shù)據(jù)信息的最長的幾個軸作為新變量;這樣,主數(shù)據(jù)信息的最長的幾個軸作為新變量;這樣,主成分分析就基本完成了。成分分析就基本完成了。注意,和二維情況類似,高維橢球的主軸

19、也是互注意,和二維情況類似,高維橢球的主軸也是互相垂直的。這些互相正交的新變量是原先變量的相垂直的。這些互相正交的新變量是原先變量的線性組合,即主成分線性組合,即主成分(principal component)。正如二維橢圓有兩個主軸,三維橢球有三個主軸正如二維橢圓有兩個主軸,三維橢球有三個主軸一樣,有幾個變量,就有幾個主成分。一樣,有幾個變量,就有幾個主成分。 23原則上如果有原則上如果有n個變量,則最多可以提取出個變量,則最多可以提取出n個主個主成分,但如果將它們?nèi)刻崛〕鰜砭褪チ嗽摲椒ǔ煞?,但如果將它們?nèi)刻崛〕鰜砭褪チ嗽摲椒ê喕瘮?shù)據(jù)的實(shí)際意義。多數(shù)情況下提取出前簡化數(shù)據(jù)的實(shí)際意義。

20、多數(shù)情況下提取出前 23個主成分已包含了個主成分已包含了85%以上的信息,其他的可以以上的信息,其他的可以忽略不計。忽略不計。提取出的主成分能包含主要信息即可,不一定非要提取出的主成分能包含主要信息即可,不一定非要有準(zhǔn)確的實(shí)際含義。有準(zhǔn)確的實(shí)際含義。249.2.4因子的命名因子的命名 觀察因子載荷矩陣,如果因子載荷的絕對值在第觀察因子載荷矩陣,如果因子載荷的絕對值在第j列的列的多個行上都有較大的取值,則表明因子多個行上都有較大的取值,則表明因子fj能夠同時解釋許多能夠同時解釋許多變量的信息,且對每個變量只能揭示較少部分信息,但不變量的信息,且對每個變量只能揭示較少部分信息,但不能代表任何一個原

21、有變量。這種情況下,因子能代表任何一個原有變量。這種情況下,因子fj的含義是模的含義是模糊不清的,為解決這個問題,可通過因子旋轉(zhuǎn)的方式是一糊不清的,為解決這個問題,可通過因子旋轉(zhuǎn)的方式是一個變量值在盡可能少的因子上有比較高的載荷。因子旋轉(zhuǎn)個變量值在盡可能少的因子上有比較高的載荷。因子旋轉(zhuǎn)一般采用正交旋轉(zhuǎn)使新生成的變量仍可保持不相關(guān),正交一般采用正交旋轉(zhuǎn)使新生成的變量仍可保持不相關(guān),正交旋轉(zhuǎn)一般采用方差最大法(旋轉(zhuǎn)一般采用方差最大法(varimax)。然后再根據(jù)各因)。然后再根據(jù)各因子對各原始變量的解釋程度進(jìn)行命名。子對各原始變量的解釋程度進(jìn)行命名。259.2.5 計算因子得分計算因子得分在因子

22、分析實(shí)際應(yīng)用中,當(dāng)因子確定以后,便可計算各因子在因子分析實(shí)際應(yīng)用中,當(dāng)因子確定以后,便可計算各因子在每個樣本上的具體數(shù)值,這些數(shù)值稱為因子得分,形成在每個樣本上的具體數(shù)值,這些數(shù)值稱為因子得分,形成的變量稱為因子變量。計算因子得分的途徑是用原有變量的變量稱為因子變量。計算因子得分的途徑是用原有變量描述因子,第描述因子,第j個因子在第個因子在第i個樣本上的值可表示為:個樣本上的值可表示為: 估計因子得分系數(shù)的方法有很多,通常采用最小二乘估計因子得分系數(shù)的方法有很多,通常采用最小二乘意義下的回歸法進(jìn)行估計。意義下的回歸法進(jìn)行估計。jj11j22jppfw xw x.w x=1 2 .jk(、 、

23、)269.3 因子分析的基本操作1、選擇菜單、選擇菜單AnalyzeData ReductionFactor,出現(xiàn),出現(xiàn)主窗口:主窗口:272、把參與因子分析的變量選到、把參與因子分析的變量選到Variables框中。框中。3、選擇參與因子分析的樣本。把作為條件變量的變量指定到、選擇參與因子分析的樣本。把作為條件變量的變量指定到Selection Variable框中并單擊框中并單擊Value按鈕輸入變量值按鈕輸入變量值,只有滿足條件的樣本數(shù)據(jù)才參與因子分析。,只有滿足條件的樣本數(shù)據(jù)才參與因子分析。4、在主窗口中單擊、在主窗口中單擊Descriptives按鈕指定輸出結(jié)果。按鈕指定輸出結(jié)果。S

24、tatistics框中指定輸出哪些基本統(tǒng)計量,其中框中指定輸出哪些基本統(tǒng)計量,其中Univariate descriptives表示輸出各個變量的基本描述表示輸出各個變量的基本描述統(tǒng)計量;統(tǒng)計量;Initial solution表示輸出因子分析的初始解。表示輸出因子分析的初始解。Correlation Matrix框中指定考察因子分析條件的方法及框中指定考察因子分析條件的方法及輸出結(jié)果,其中輸出結(jié)果,其中Coefficients表示輸出相關(guān)系數(shù)矩陣;表示輸出相關(guān)系數(shù)矩陣;Significance levels表示輸出相關(guān)系數(shù)檢驗(yàn)的概率表示輸出相關(guān)系數(shù)檢驗(yàn)的概率p值;值;Determinant表

25、示輸出變量相關(guān)系數(shù)矩陣的行列式值;表示輸出變量相關(guān)系數(shù)矩陣的行列式值;Inverse表示輸出相關(guān)系數(shù)矩陣的逆矩陣;表示輸出相關(guān)系數(shù)矩陣的逆矩陣;Anti-image表示輸出反映象相關(guān)矩陣;表示輸出反映象相關(guān)矩陣;KMO and Bartletts test of sphericity表示進(jìn)行巴特利特球度檢驗(yàn)和表示進(jìn)行巴特利特球度檢驗(yàn)和KMO檢驗(yàn)。檢驗(yàn)。28295、在主窗口中單擊、在主窗口中單擊Extraction按鈕指定提取因子的方法。按鈕指定提取因子的方法。在在Method框中提供了多種提取因子的方法,其中框中提供了多種提取因子的方法,其中Principal components是主成分分析

26、法,是是主成分分析法,是SPSS默認(rèn)默認(rèn)的方法;在的方法;在Analyze框中指定提取因子的依據(jù),其中框中指定提取因子的依據(jù),其中Correlation matrix為相關(guān)系數(shù)矩陣,當(dāng)原有變量存在為相關(guān)系數(shù)矩陣,當(dāng)原有變量存在數(shù)量級的差異時,通常選擇該選項(xiàng);數(shù)量級的差異時,通常選擇該選項(xiàng);Covariance matrix為協(xié)方差陣。在為協(xié)方差陣。在Extract框中選擇如何確定因子數(shù)框中選擇如何確定因子數(shù)目:在目:在Eigenvaluse over后輸入一個特征根值(默認(rèn)值后輸入一個特征根值(默認(rèn)值為為1),),SPSS將提取大于該值的特征根;也可在將提取大于該值的特征根;也可在Number

27、 of factors框后輸入提取因子的個數(shù)。在框后輸入提取因子的個數(shù)。在Display框中選框中選擇輸出哪些與因子提取有關(guān)的信息,其中擇輸出哪些與因子提取有關(guān)的信息,其中Unrotated factor solution表示輸出未旋轉(zhuǎn)的因子載荷矩陣;表示輸出未旋轉(zhuǎn)的因子載荷矩陣;Scree plot表示輸出因子的碎石圖。表示輸出因子的碎石圖。30316、在主窗口中單擊、在主窗口中單擊Rotation按鈕選擇因子旋轉(zhuǎn)方法。在按鈕選擇因子旋轉(zhuǎn)方法。在Method框中選擇因子旋轉(zhuǎn)方法,其中框中選擇因子旋轉(zhuǎn)方法,其中None表示不旋轉(zhuǎn)(表示不旋轉(zhuǎn)(默認(rèn)選項(xiàng));默認(rèn)選項(xiàng));Varimax為方差最大法;

28、為方差最大法;Quartimax為四為四次方最大法;次方最大法;Equamax為等量最大法;其他為斜交旋轉(zhuǎn)法為等量最大法;其他為斜交旋轉(zhuǎn)法。在。在Display框指定輸出與因子旋轉(zhuǎn)相關(guān)的信息,其中框指定輸出與因子旋轉(zhuǎn)相關(guān)的信息,其中Rotated Solution表示輸出旋轉(zhuǎn)后的因子載荷矩陣表示輸出旋轉(zhuǎn)后的因子載荷矩陣B;Loading plots表示輸出旋轉(zhuǎn)后的因子載荷散點(diǎn)圖。表示輸出旋轉(zhuǎn)后的因子載荷散點(diǎn)圖。327、在主窗口中單擊、在主窗口中單擊Scores按鈕選擇計算因子得分的方法。按鈕選擇計算因子得分的方法。選中選中Save as variables項(xiàng)表示將因子得分保存到項(xiàng)表示將因子得分

29、保存到SPSS變量中,生成幾個因子便產(chǎn)生幾個變量中,生成幾個因子便產(chǎn)生幾個SPSS變量。變量名的形變量。變量名的形式為式為FACn_m,其中,其中n為因子編號,以數(shù)字序號的形式表為因子編號,以數(shù)字序號的形式表示;示;m表示是第幾次分析的結(jié)果。選中表示是第幾次分析的結(jié)果。選中Display factor score coefficient matrix項(xiàng)表示輸出因子得分函數(shù)中項(xiàng)表示輸出因子得分函數(shù)中的各因子得分系數(shù)。在的各因子得分系數(shù)。在Method框中指定計算因子得分的方框中指定計算因子得分的方法,其中法,其中Regression為回歸法。為回歸法。338、在主窗口中單擊、在主窗口中單擊Opt

30、ions按鈕指定缺失值的處理方法和因按鈕指定缺失值的處理方法和因子載荷矩陣的輸出方法。在子載荷矩陣的輸出方法。在Missing Values框中指定如框中指定如何處理缺失值。在何處理缺失值。在Coefficient Display Format框中指框中指定因子載荷矩陣的輸出方式,其中定因子載荷矩陣的輸出方式,其中Sorted by size表示以表示以第一因子得分的降序輸出因子載荷矩陣;在第一因子得分的降序輸出因子載荷矩陣;在Suppress absolute values less than框后輸入一數(shù)值,表示輸出框后輸入一數(shù)值,表示輸出大于該值的因子載荷。大于該值的因子載荷。349.4

31、因子分析的應(yīng)用舉例 為研究全國各地區(qū)年人均收入的差異性和相似性,收為研究全國各地區(qū)年人均收入的差異性和相似性,收集到集到19971997年全國年全國3131個省市自治區(qū)各類經(jīng)濟(jì)單位包括國有經(jīng)個省市自治區(qū)各類經(jīng)濟(jì)單位包括國有經(jīng)濟(jì)單位、集體經(jīng)濟(jì)單位、聯(lián)營經(jīng)濟(jì)單位、股份制經(jīng)濟(jì)單位濟(jì)單位、集體經(jīng)濟(jì)單位、聯(lián)營經(jīng)濟(jì)單位、股份制經(jīng)濟(jì)單位、外商投資經(jīng)濟(jì)單位、港澳臺經(jīng)濟(jì)單位和其他經(jīng)濟(jì)單位的、外商投資經(jīng)濟(jì)單位、港澳臺經(jīng)濟(jì)單位和其他經(jīng)濟(jì)單位的年人均收入數(shù)據(jù)。由于涉及的變量較多,直接進(jìn)行地區(qū)間年人均收入數(shù)據(jù)。由于涉及的變量較多,直接進(jìn)行地區(qū)間的比較分析較為繁瑣,因此首先考慮采用因子分析方法減的比較分析較為繁瑣,因此首先考慮采用因子分析方法減少變量個數(shù),之后再進(jìn)行比較和綜合評價。少變量個數(shù),之后再進(jìn)行比較和綜合評價。359.4.1 考察原有變量是否適合進(jìn)行因子分析考察原有變量是否適合進(jìn)行因子分析 這里借助變量的相關(guān)系數(shù)矩陣、巴特利特球度檢驗(yàn)和這里借助變量的相關(guān)系數(shù)矩陣、巴特利特球度檢驗(yàn)和KMO檢驗(yàn)方法進(jìn)行分析。檢驗(yàn)方法進(jìn)行分析。 同時,由于數(shù)據(jù)中存在缺失值,采用均值替代法處理缺同時,由于數(shù)據(jù)中存在缺失值,采用均值替代法處理缺失值。失值。9.4.2 提取因子提取因子 首先進(jìn)行嘗試性分析,根據(jù)原有變量的相關(guān)系數(shù)矩陣,首先進(jìn)行嘗試性分析,根據(jù)原

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論