第14章 因子分析1統(tǒng)計(jì)學(xué)原理課件_第1頁
第14章 因子分析1統(tǒng)計(jì)學(xué)原理課件_第2頁
第14章 因子分析1統(tǒng)計(jì)學(xué)原理課件_第3頁
第14章 因子分析1統(tǒng)計(jì)學(xué)原理課件_第4頁
第14章 因子分析1統(tǒng)計(jì)學(xué)原理課件_第5頁
已閱讀5頁,還剩95頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第14章

因子分析第14章因子分析1統(tǒng)計(jì)學(xué)原理因子分析1因子分析的概念2數(shù)學(xué)模型及統(tǒng)計(jì)意義3因子載荷陣的估計(jì)方法4因子得分5因子旋轉(zhuǎn)*6計(jì)算步驟及實(shí)例第14章因子分析1統(tǒng)計(jì)學(xué)原理因子分析的概念因子分析的概念起源于KarlPearson和CharlesSpearmen等人關(guān)于智力測驗(yàn)的統(tǒng)計(jì)分析。1904年CharlesSpearman發(fā)表了一篇著名論文《對(duì)智力測驗(yàn)得分進(jìn)行統(tǒng)計(jì)分析》被視為因子分析的起點(diǎn)。因子分析最早用來研究心理學(xué)和教育方面的問題,但因子分析由于計(jì)算量大,在缺少計(jì)算機(jī)條件下其應(yīng)用受到了很大限制。隨著計(jì)算機(jī)的大量使用,使得因子分析的計(jì)算問題得到了解決大大促進(jìn)了該方法的發(fā)展。因子分析方法應(yīng)用范圍十分廣泛,在經(jīng)濟(jì)管理科學(xué)、社會(huì)科學(xué)、生物學(xué)、醫(yī)學(xué)、地質(zhì)科學(xué)、考古學(xué)、教育學(xué)乃至體育科學(xué)等取得了顯著成就。第14章因子分析1統(tǒng)計(jì)學(xué)原理1引言

因子分析是主成分分析的推廣和發(fā)展,它是將具有錯(cuò)綜復(fù)雜關(guān)系的變量(或樣品)綜合為數(shù)量較少的幾個(gè)因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系,同時(shí)根據(jù)不同因子還可以對(duì)變量進(jìn)行分類,它也是屬于多元分析中處理降維的一種統(tǒng)計(jì)方法。第14章因子分析1統(tǒng)計(jì)學(xué)原理1引言因子分析(factoranalysis)是一種數(shù)據(jù)簡化的技術(shù)。它通過研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)假想變量來表示其基本的數(shù)據(jù)結(jié)構(gòu)。這幾個(gè)假想變量能夠反映原來眾多變量的主要信息。原始的變量是可觀測的顯在變量,而假想變量是不可觀測的潛在變量,稱為因子。第14章因子分析1統(tǒng)計(jì)學(xué)原理

問題一:某公司對(duì)100名招聘人員的知識(shí)和能力進(jìn)行測試,出了50道題的試卷,其內(nèi)容包括的面較廣,但總的來講可歸納為六個(gè)方面:語言表達(dá)能力、邏輯思維能力、判斷事物的敏捷和果斷程度、思想修養(yǎng)、興趣愛好、生活常識(shí)等,我們將每一個(gè)方面稱為因子.100人測試的分?jǐn)?shù)可以用上述六個(gè)因子表示成線性函數(shù):稱為公共因子稱為特殊因子稱為因子載荷第14章因子分析1統(tǒng)計(jì)學(xué)原理問題二:在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過一個(gè)有24個(gè)指標(biāo)構(gòu)成的評(píng)價(jià)體系,評(píng)價(jià)百貨商場的24個(gè)方面的優(yōu)劣。消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在的因子,對(duì)商店進(jìn)行綜合評(píng)價(jià)。而這三個(gè)公共因子可以表示為:第14章因子分析1統(tǒng)計(jì)學(xué)原理問題三,服裝剪裁問題

對(duì)于裁縫來說,服裝裁剪需要根據(jù)許多指標(biāo)來進(jìn)行決定,雖然有許多指標(biāo)如領(lǐng)長、袖長、等一些列指標(biāo),但最后關(guān)鍵指標(biāo)是衣服的長度和衣服的寬度兩個(gè)核心指標(biāo)或者因子。其他指標(biāo)都是相關(guān)指標(biāo)。第14章因子分析1統(tǒng)計(jì)學(xué)原理

因子分析的基本思想是通過變量的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的研究,找出能控制所有變量的少數(shù)幾個(gè)隨機(jī)變量去描述多個(gè)變量之間的相關(guān)關(guān)系,但在這里,這少數(shù)幾個(gè)隨機(jī)變量是不可觀測的,通常稱為因子。然后根據(jù)相關(guān)性的大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,但不同組的變量相關(guān)性較低.第14章因子分析1統(tǒng)計(jì)學(xué)原理注:

因子分析與回歸分析不同,因子分析中的因子是一個(gè)比較抽象的概念,而回歸因子有非常明確的實(shí)際意義;

主成分分析分析與因子分析也有不同,主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型。主成分分析:原始變量的線性組合表示新的綜合變量,即主成分;因子分析:潛在的假想變量和隨機(jī)影響變量的線性組合表示原始變量。第14章因子分析1統(tǒng)計(jì)學(xué)原理2數(shù)學(xué)模型及統(tǒng)計(jì)意義1)因子分析模型(正交因子模型)(1)R型因子分析模型(變量因子模型)用矩陣表示:第14章因子分析1統(tǒng)計(jì)學(xué)原理簡記為且滿足:第14章因子分析1統(tǒng)計(jì)學(xué)原理

其中X是可實(shí)測的p個(gè)指標(biāo)所構(gòu)成p維隨機(jī)向量,F(xiàn)是不可觀測的向量,F(xiàn)稱為X的公共因子或潛因子;aij稱為因子載荷是第i個(gè)變量在第j個(gè)公共因子上的負(fù)荷,如果把變量Xi看成m維因子空間中的一個(gè)向量,則表示Xi在坐標(biāo)軸Fj上的投影,矩陣A稱為因子載荷矩陣;ε稱為X的特殊因子,通常理論上要求的協(xié)方差陣是對(duì)角陣,其中包括了隨機(jī)誤差.由上述模型滿足的條件可知:是不相關(guān)的.第14章因子分析1統(tǒng)計(jì)學(xué)原理此時(shí)X1,X2,…,Xn表示n個(gè)樣品.(2)Q型因子分析模型(樣品因子模型)

因子分析的目的就是通過模型

代替X,由于

,從而達(dá)到簡化變量維數(shù)的愿望。第14章因子分析1統(tǒng)計(jì)學(xué)原理2)因子載荷和變量共同度及其統(tǒng)計(jì)意義(1)因子載荷的統(tǒng)計(jì)意義于是:已知模型:兩端后乘Fj得:第14章因子分析1統(tǒng)計(jì)學(xué)原理所以上式可寫成:由于在標(biāo)準(zhǔn)化下有:因此因子載荷

aij的統(tǒng)計(jì)意義:第i個(gè)變量與第j個(gè)公共因子的相關(guān)系數(shù),即表示Xi依賴Fj的份量(比重).第14章因子分析1統(tǒng)計(jì)學(xué)原理(2)變量共同度的統(tǒng)計(jì)意義所謂變量Xi的共同度定義為因子載荷陣A中第i行元素的平方和,即第14章因子分析1統(tǒng)計(jì)學(xué)原理共同度hi2:它刻劃全部公共因子對(duì)變量Xi的總方差所作的貢獻(xiàn),越接近1,說明由原始變量空間轉(zhuǎn)為因子空間轉(zhuǎn)化的性質(zhì)越好,保留原來信息量多;其值越小,說明公共因子對(duì)Xi影響很小,主要由特殊因子來描述,因此是Xi方差的重要組成部分。所以σi2:是特定變量所產(chǎn)生的方差,稱為特殊因子方差,僅與變量Xi本身的變化有關(guān),它是使Xi的方差為1的補(bǔ)充值。第14章因子分析1統(tǒng)計(jì)學(xué)原理3)公共因子Fj的方差貢獻(xiàn)的統(tǒng)計(jì)意義將因子載荷矩陣中各列元素的平方和記為稱qj為公共因子Fj對(duì)變量組X的貢獻(xiàn),即Sj表示同一公共因子Fj對(duì)諸變量所提供的方差貢獻(xiàn)之總和,它是衡量公共因子相對(duì)重要性指標(biāo)。第14章因子分析1統(tǒng)計(jì)學(xué)原理3因子載荷陣的估計(jì)方法

設(shè)隨機(jī)向量X的協(xié)差陣為Σ,λi為的特征根,ei為對(duì)應(yīng)的標(biāo)準(zhǔn)正交化特征向量(只要特征根不等,對(duì)應(yīng)的單位特征向量一定是正交的),則根據(jù)線性代數(shù)知識(shí)可分解為

1)忽略特殊因子第14章因子分析1統(tǒng)計(jì)學(xué)原理

上邊給出的Σ表達(dá)式是精確的,但實(shí)際應(yīng)用時(shí)總是希望公共因子個(gè)數(shù)小于變量的個(gè)數(shù)即m<p,當(dāng)最后p-m個(gè)特征根較小時(shí),通常是略去最后p-m項(xiàng)對(duì)Σ的貢獻(xiàn),于是得到上式是假定了因子模型中的特殊因子是不重要的,因而從的分解中忽略掉特殊因子的方差.第14章因子分析1統(tǒng)計(jì)學(xué)原理2)考慮特殊因子當(dāng)Σ未知,可用樣本協(xié)差陣S去代替,要經(jīng)過標(biāo)準(zhǔn)化處理,則S與相關(guān)陣R相同,仍然可作上面類似的表示。一般設(shè)

為樣本相關(guān)陣R的特征根,相應(yīng)的標(biāo)準(zhǔn)正交化特征向量為

,設(shè)m<p,則因子載荷陣的估計(jì)

即第14章因子分析1統(tǒng)計(jì)學(xué)原理4因子得分因子分析的數(shù)學(xué)模型是將變量(或樣品)表示為公共因子的線性組合:往往需要反過來將公共因子表示為變量(或樣品)的線性組合,即稱上式為因子得分的函數(shù)。用它來計(jì)算每個(gè)樣品的公共因子得分。第14章因子分析1統(tǒng)計(jì)學(xué)原理由于因子得分函數(shù)中方程的個(gè)數(shù)m小于變量的個(gè)數(shù)p,因此不能精確計(jì)算出因子得分,只能對(duì)因子得分進(jìn)行估計(jì)。這里用回歸法進(jìn)行估計(jì)。Thomson假設(shè)公共因子可以對(duì)p個(gè)變量作回歸,F(xiàn)j(j=1,…,m)對(duì)變量X1,…,Xp的回歸方程為由于假設(shè)變量及公共因子都已經(jīng)標(biāo)準(zhǔn)化了,所以第14章因子分析1統(tǒng)計(jì)學(xué)原理由因子載荷的意義知:即第14章因子分析1統(tǒng)計(jì)學(xué)原理其中因此記則第14章因子分析1統(tǒng)計(jì)學(xué)原理于是其中這就是估計(jì)因子得分的計(jì)算公式。第14章因子分析1統(tǒng)計(jì)學(xué)原理建立了因子分析模型的目的不僅僅要找出公共因子以及對(duì)變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析,如果每個(gè)公共因子的含義不清,則不便于進(jìn)行實(shí)際背景的解釋.由于因子載荷陣是不惟一的,所以應(yīng)該對(duì)因子載荷陣進(jìn)行旋轉(zhuǎn)。目的是使因子載荷陣的結(jié)構(gòu)簡化,使載荷矩陣每列或行的元素平方值向0和1兩極分化。有三種主要的正交旋轉(zhuǎn)法。四次方最大法、方差最大法和等量最大法。5因子旋轉(zhuǎn)第14章因子分析1統(tǒng)計(jì)學(xué)原理第14章因子分析1統(tǒng)計(jì)學(xué)原理5因子旋轉(zhuǎn)原因子模型令新因子模型變成因子載荷陣不是唯一的。證明如下設(shè)C為一個(gè)p×p的正交矩陣仍滿足正是由于因子載荷陣不是唯一的,可尋找合適的正交矩陣,使得因子載荷陣具有特殊的結(jié)構(gòu)。第14章因子分析1統(tǒng)計(jì)學(xué)原理因子載荷旋轉(zhuǎn):用一個(gè)正交陣右乘A,使旋轉(zhuǎn)后的因子載荷陣結(jié)構(gòu)簡化,便于對(duì)公共因子進(jìn)行解釋。有三種主要的正交旋轉(zhuǎn)法:四次方最大法、方差最大法和等量最大法。本節(jié)只介紹常用的方差最大正交旋轉(zhuǎn)法。對(duì)A按行計(jì)算共同度5因子旋轉(zhuǎn)首先考慮m=2的情形。設(shè)因子載荷陣第14章因子分析1統(tǒng)計(jì)學(xué)原理然后對(duì)規(guī)格化后的矩陣,為書寫方便仍記為A,施行方差最大正交旋轉(zhuǎn)。設(shè)正交陣記第14章因子分析1統(tǒng)計(jì)學(xué)原理這樣做的目的是使因子載荷陣A的結(jié)構(gòu)簡化,為此,正交旋轉(zhuǎn)的角度φ必須滿足:旋轉(zhuǎn)后所得到因子載荷陣的總方差V達(dá)到最大值,即達(dá)到最大值。根據(jù)求極值原理,先求V對(duì)φ的導(dǎo)數(shù)令第14章因子分析1統(tǒng)計(jì)學(xué)原理經(jīng)過計(jì)算,其旋轉(zhuǎn)角度φ可按下面公式求得:記則第14章因子分析1統(tǒng)計(jì)學(xué)原理根據(jù)tg(4φ)的分式的分子和分母取值的正負(fù)號(hào)來確定角φ

的取值范圍如下表:分子取值符號(hào)分母取值符號(hào)取值范圍取值范圍++0~π/20~π/8+-π/2

~ππ/8

~π/4--

-π~-π/2-π/4~π/8-+-π/2

~0-π/8

~0第14章因子分析1統(tǒng)計(jì)學(xué)原理如果公共因子有m個(gè),則需逐次對(duì)每兩個(gè)公共因子進(jìn)行上述旋轉(zhuǎn),必須滿足使旋轉(zhuǎn)后所得到的因子載荷陣的總方差達(dá)到最大值,即使達(dá)到最大。其中Tkj為如下的正交陣:第14章因子分析1統(tǒng)計(jì)學(xué)原理A經(jīng)過Tkj旋轉(zhuǎn)(變換)后,矩陣

B=ATkj

,其元素為第14章因子分析1統(tǒng)計(jì)學(xué)原理其中旋轉(zhuǎn)角度φ仍按下面公式求得m個(gè)因子,每次取兩個(gè)全部配對(duì)進(jìn)行旋轉(zhuǎn),共需旋轉(zhuǎn)Cm2次,算做一個(gè)循環(huán)完畢,如果循環(huán)完畢得出的因子載荷陣還沒有達(dá)到目的,則可以繼續(xù)進(jìn)行第二輪次配對(duì)旋轉(zhuǎn),具體地說如果第一輪旋轉(zhuǎn)完畢的因子載荷陣記為B(1)從B(1)算出V(1)

。第14章因子分析1統(tǒng)計(jì)學(xué)原理從B(1)出發(fā)進(jìn)行第二輪旋轉(zhuǎn)循環(huán),旋轉(zhuǎn)完畢得B(2)如此不斷重復(fù)旋轉(zhuǎn)循環(huán)可得V值的一個(gè)非降序列:從B(2)算出V(2)

。因?yàn)橐蜃虞d荷的絕對(duì)值不大于1,故這個(gè)序列是有上界的,于是有極限記為,即為V的最大值。因此只要循環(huán)次數(shù)k充分大,就有第14章因子分析1統(tǒng)計(jì)學(xué)原理δ為所要求的精度。在實(shí)際應(yīng)用中,經(jīng)過若干次旋轉(zhuǎn)之后,若相對(duì)方差改變不大,則停止旋轉(zhuǎn),最后得即為旋轉(zhuǎn)后的因子載荷矩陣。第14章因子分析1統(tǒng)計(jì)學(xué)原理6計(jì)算步驟及實(shí)例

計(jì)算步驟設(shè)原始數(shù)據(jù)資料如下表:

變量樣品X1X2

…Xp

1x11

x12

…x1p

2x21

x22

…x2p

……………

nxn1

xn2…xnp第14章因子分析1統(tǒng)計(jì)學(xué)原理第一步將原始數(shù)據(jù)標(biāo)準(zhǔn)化,為書寫方便仍記為xij。第二步建立變量的相關(guān)系數(shù)陣若作Q型因子分析,則建立樣品的相似系數(shù)陣Q=(Qij)n×n。其中其中第14章因子分析1統(tǒng)計(jì)學(xué)原理第三步求R的特征根及相應(yīng)的單位特征向量,分別記為和,記根據(jù)累計(jì)貢獻(xiàn)率的要求比如,取前m個(gè)特征根及相應(yīng)的特征向量寫出因子載荷陣:第14章因子分析1統(tǒng)計(jì)學(xué)原理第四步對(duì)A進(jìn)行方差最大正交旋轉(zhuǎn)。第五步計(jì)算因子得分。第14章因子分析1統(tǒng)計(jì)學(xué)原理例題對(duì)全國30個(gè)省市自治區(qū)的經(jīng)濟(jì)發(fā)展八項(xiàng)指標(biāo)作因子分析。第二步建立指標(biāo)間的相關(guān)系數(shù)陣R。首先對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化,以消除量綱的影響;X1X2X3X4X5X6X7X8X11.0000.2670.9510.1910.617-0.274-0.2640.874X20.2671.0000.4260.718-0.151-0.234-0.5930.363X30.9510.4261.0000.4000.431-0.282-0.3590.792X40.1910.7180.4001.000-0.356-0.134-0.5390.104X50.617-0.1510.431-0.3561.000-0.2550.0220.659X6-0.274-0.234-0.282-0.134-0.2551.0000.760-0.126X7-0.264-0.593-0.359-0.5390.0220.7601.000-0.192X80.8740.3630.7920.1040.659-0.126-0.1921.000第14章因子分析1統(tǒng)計(jì)學(xué)原理第三步求R的特征值和特征向量。序號(hào)特征值方差貢獻(xiàn)率%累積貢獻(xiàn)率%13.75546.94346.94322.19527.44374.38631.21415.17889.56440.4035.03394.59650.2132.66097.25660.1391.73798.99376.594E-020.82499.81781.462E-020.183100.00第14章因子分析1統(tǒng)計(jì)學(xué)原理由于前三個(gè)特征值的累計(jì)貢獻(xiàn)率已達(dá)89.564%。所以取前三個(gè)特征值所對(duì)應(yīng)的特征向量如下:第一特征向量u1第二特征向量U2第三特征向量u30.4706410.1079950.192410.4567080.2565120.1098190.4247120.2875360.19241-0.319440.4009310.3975250.3127290.404310.245050.2508020.498801-0.247770.240481-0.488680.332179-0.262670.1673920.723351第14章因子分析1統(tǒng)計(jì)學(xué)原理第四步建立因子載荷陣。

因子指標(biāo)Component123X10.8850.3830.121X20.606-0.5990.270X30.9120.1600.212X40.466-0.7240.366X50.4860.739-0.273X6-0.5090.2480.797X7-0.6190.5940.438X80.8230.4260.212第14章因子分析1統(tǒng)計(jì)學(xué)原理第五步對(duì)因子載荷陣實(shí)行方差最大旋轉(zhuǎn),旋轉(zhuǎn)后的矩陣如下:正交因子表

因子指標(biāo)Component123X10.9550.125-0.132X20.2170.841-0.212X30.8170.352-0.138X45.102E-020.927-0.114X50.752-0.505-0.190X6-0.136-8.325E-030.968X7-0.102-0.4960.820X80.9440.111-1.465E-02第14章因子分析1統(tǒng)計(jì)學(xué)原理從上表可見,每個(gè)因子只有少數(shù)幾個(gè)指標(biāo)的因子載荷較大,因此可根據(jù)上表進(jìn)行分類,將8個(gè)指標(biāo)按高載荷分成三類,列于下表:高載荷指標(biāo)意義1X1:GDPX3:固定資產(chǎn)投資X8:工業(yè)總產(chǎn)值總量因子2X2:居民消費(fèi)水平X4:職工平均工資X5:貨物周轉(zhuǎn)量消費(fèi)因子3X6:居民消費(fèi)價(jià)格指數(shù)X7:商品零售價(jià)格指數(shù)價(jià)格因子第14章因子分析1統(tǒng)計(jì)學(xué)原理第一個(gè)因子在指標(biāo)X1、X2、Xδ有較大的載荷,這些是從GDP、固定資產(chǎn)投資、工業(yè)總產(chǎn)值三個(gè)方面反映經(jīng)濟(jì)發(fā)展?fàn)顩r的,因此命名為總量因子。第二個(gè)因子在指標(biāo)X2、X4、X5有較大的載荷,這些是從居民消費(fèi)水平,職工平均工資、貨物周轉(zhuǎn)量這三方面反映經(jīng)濟(jì)發(fā)展?fàn)顩r的,因此命名為消費(fèi)因子。第三個(gè)因子在指標(biāo)X6、X7有較大的載荷,因此命名為價(jià)格因子。第14章因子分析1統(tǒng)計(jì)學(xué)原理例2

利用1995年的數(shù)據(jù)對(duì)我國社會(huì)發(fā)展?fàn)顩r進(jìn)行綜合考察。原始數(shù)據(jù)如下:地區(qū)人均GDP(元)X1新增固定資產(chǎn)(億元)X2城鎮(zhèn)居民人均年可支配收入(元)X3農(nóng)村居民家庭人均純收入(元)X4高等學(xué)校數(shù)(所)X5衛(wèi)生機(jī)構(gòu)數(shù)(個(gè))X6北京1026530.8162353223654995天津816449.1349292406213182河北337677.76392116684710266山西281933.9733051206265922內(nèi)蒙301354.5128631208194915遼寧6103124.0237061756616719吉林370328.6531741609433891黑龍江442748.5133751766387637上海15204128.9371914245455288江蘇5785101.09463424566712039浙江614941.8862212966378721安徽252155.7437951302356593福建538618.3545062048304537江西237626.2833761537315423第14章因子分析1統(tǒng)計(jì)學(xué)原理山東4473102.54426417154810463河南247571.3632991231507661湖北334137.7540281511569744湖南270143.1046991425479137廣東638051.8274382699428848廣西277232.5247911446275571海南48205.354770151951653四川251680.97400211586418885貴州155322.0739311086223934云南249048.4840851010266395陜西234426.313309962466215甘肅192514.843152880174131青海29104.163319102971176寧夏26857.94338299871028新疆395326.6541631136213932資料來源:《中國統(tǒng)計(jì)年鑒》。第14章因子分析1統(tǒng)計(jì)學(xué)原理第一步將數(shù)據(jù)標(biāo)準(zhǔn)化。第二步建立指標(biāo)間相關(guān)系數(shù)陣R如下:X1X2X3X4X5X6X11.000.460.760.930.29-0.06X20.461.000.260.450.660.57X30.760.261.000.850.250.13X40.930.450.851.000.390.09X50.290.660.250.391.000.75X6-0.060.570.130.090.751.00第14章因子分析1統(tǒng)計(jì)學(xué)原理第三步求R的特征值和累計(jì)貢獻(xiàn)率。序號(hào)特征值方差貢獻(xiàn)率累計(jì)貢獻(xiàn)率13.32465055.4108355.410821.79067829.8446385.255530.4925838.2097293.465240.2639914.3998597.865050.884651.4744299.339560.0396330.66054100.0000第14章因子分析1統(tǒng)計(jì)學(xué)原理第四步建立因子載荷陣。由于前三個(gè)特征值的累計(jì)貢獻(xiàn)率已達(dá)93.46%,故取前三個(gè)特征值建立因子載荷陣如下:

因子指標(biāo)FactorFactorFactor12310.612657-0.1412170.28490420.2402910.315040.88871830.9204680.158874-0.0078940.9530770.336650.19031650.1894620.5025400.3070106-0.307760.9288650.252020第14章因子分析1統(tǒng)計(jì)學(xué)原理第五步將因子載荷陣實(shí)行方差最大正交旋轉(zhuǎn),得正交因子表如下:

因子指標(biāo)FactorFactorFactor123X10.953927-0.186840.188985X20.3396980.5660740.750912X30.9004500.108737-0.133105X40.9749140.1317730.54662X50.2597440.8848240.86750X6-0.246890.9620150.049149第14章因子分析1統(tǒng)計(jì)學(xué)原理第六步將六個(gè)指標(biāo)按高載荷分成三類,并結(jié)合專業(yè)知識(shí)對(duì)各因子給此命名如下高載荷指標(biāo)因子命名1人均GDP城鎮(zhèn)居民人均年可支配收入農(nóng)村居民家庭人均純收入收入因子2高等學(xué)校數(shù)衛(wèi)生機(jī)構(gòu)數(shù)社會(huì)因子3新增固定資產(chǎn)投資因子第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作

(一)操作步驟

1.在SPSS窗口中選擇Analyze→DataReduction→Factor,調(diào)出因子分析主界面圖(7.1),并將變量X1—X13移入Variables框中。圖7.1因子分析主界面第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作 2.點(diǎn)擊Descriptives按鈕,展開相應(yīng)對(duì)話框,見圖7.2。選擇Initialsolution復(fù)選項(xiàng)。這個(gè)選項(xiàng)給出各因子的特征值、各因子特征值占總方差的百分比以及累計(jì)百分比。單擊Continue按鈕,返回主界面。圖7.2Descriptives子對(duì)話框第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作 3.點(diǎn)擊Extraction按鈕,設(shè)置因子提取的選項(xiàng),見圖7.3。在Method下拉列表中選擇因子提取的方法,SPSS提供了七種提取方法可供選擇,一般選擇默認(rèn)選項(xiàng),即“主成分法”。在Analyze欄中指定用于提取因子的分析矩陣,分別為相關(guān)矩陣和協(xié)方差矩陣。在Display欄中指定與因子提取有關(guān)的輸出項(xiàng),如未旋轉(zhuǎn)的因子載荷陣和因子的碎石圖。在Extract欄中指定因子提取的數(shù)目,有兩種設(shè)置方法:一種是在Eigenvaluesover后的框中設(shè)置提取的因子對(duì)應(yīng)的特征值的范圍,系統(tǒng)默認(rèn)值為1,即要求提取那些特征值大于1的因子;第二種設(shè)置方法是直接在Numberoffactors后的矩形框中輸入要求提取的公因子的數(shù)目。這里我們均選擇系統(tǒng)默認(rèn)選項(xiàng),單擊Continue按鈕,返回主界面。第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作圖7.3Extraction子對(duì)話框第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作 4.點(diǎn)擊Rotation按鈕,設(shè)置因子旋轉(zhuǎn)的方法。這里選擇Varimax(方差最大旋轉(zhuǎn)),并選擇Display欄中的Rotatedsolution復(fù)選框,在輸出窗口中顯示旋轉(zhuǎn)后的因子載荷陣。單擊Continue按鈕,返回主界面。圖7.4Rotation子對(duì)話框第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作 5.點(diǎn)擊Scores按鈕,設(shè)置因子得分的選項(xiàng)。選中Saveasvariables復(fù)選框,將因子得分作為新變量保存在數(shù)據(jù)文件中。選中Displayfactorscorecoefficientmatrix復(fù)選框,這樣在結(jié)果輸出窗口中會(huì)給出因子得分系數(shù)矩陣。單擊Continue按鈕返回主界面。

6.單擊OK按鈕,運(yùn)行因子分析過程。圖7.5Scores子對(duì)話框第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作

(二)主要運(yùn)行結(jié)果解釋

1.Communalities(給出變量共同度)變量共同度反映每個(gè)變量對(duì)所提取的所有公共因子的依賴程度,此數(shù)值是因子載荷陣中每一行的因子載荷量的平方和,提取的因子個(gè)數(shù)不同,變量共同度也不同。

第14章因子分析1統(tǒng)計(jì)學(xué)原理2.TotalVarianceExplained

(給出各公因子方差貢獻(xiàn)表)InitialEigenvalues給出初始相關(guān)矩陣或協(xié)差陣矩陣的特征值,用于確定哪些因子應(yīng)該被提取,共有三項(xiàng):Total列為各因子對(duì)應(yīng)的特征值,本例中共有四個(gè)因子對(duì)應(yīng)的特征值大于1,因此應(yīng)提取相應(yīng)的四個(gè)公因子;%ofVariance列為各因子的方差貢獻(xiàn)率;Cumulative%列為各因子的累積方差貢獻(xiàn)率,由表7.1可以看出,前四個(gè)因子已經(jīng)可以解釋89.651%的方差。RotationSumsofSquaredLoadings給出提取出的公因子經(jīng)過旋轉(zhuǎn)后的方差貢獻(xiàn)情況。第14章因子分析1統(tǒng)計(jì)學(xué)原理表7.1特征根與方差貢獻(xiàn)率表

第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作

第14章因子分析1統(tǒng)計(jì)學(xué)原理表7.2旋轉(zhuǎn)前因子載荷陣第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作第14章因子分析1統(tǒng)計(jì)學(xué)原理表7.3旋轉(zhuǎn)后因子載荷陣

第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作注意:在因子表達(dá)式中的各變量為進(jìn)行標(biāo)準(zhǔn)化變換后的標(biāo)準(zhǔn)變量,均值為0,標(biāo)準(zhǔn)差為1。

第14章因子分析1統(tǒng)計(jì)學(xué)原理SPSS操作7.由于我們已經(jīng)在Scores子對(duì)話框中選擇了Saveasvariables復(fù)選框,因此,因子得分已經(jīng)作為新的變量保存在數(shù)據(jù)文件中,變量名分別為fac1_1、fac2_1、fac3_1和fac4_1。此后,我們還可以利用因子得分進(jìn)行其他的統(tǒng)計(jì)分析。第14章因子分析1統(tǒng)計(jì)學(xué)原理表7.4因子得分系數(shù)矩陣

第14章因子分析1統(tǒng)計(jì)學(xué)原理實(shí)例1上市公司財(cái)務(wù)狀況的因子分析

隨著我國股票市場的發(fā)展與不斷成熟,人們的投資越來越理性化,更加重視對(duì)上市公司財(cái)務(wù)狀況的考察,從而更需要準(zhǔn)確地了解上市公司的經(jīng)營業(yè)績狀況。而上市公司的經(jīng)營業(yè)績可以通過一系列的財(cái)務(wù)指標(biāo)來反映,但是這些財(cái)務(wù)指標(biāo)往往容易混淆投資者的視線。第14章因子分析1統(tǒng)計(jì)學(xué)原理傳統(tǒng)評(píng)價(jià)公司財(cái)務(wù)指標(biāo)方法的缺陷

無論是投資者、中介機(jī)構(gòu)還是上市公司自身,大都會(huì)習(xí)以為常地設(shè)計(jì)一套綜合指標(biāo)評(píng)價(jià)體系。其基本做法就是選取多項(xiàng)財(cái)務(wù)指標(biāo),并根據(jù)行業(yè)平均水準(zhǔn)對(duì)各個(gè)財(cái)務(wù)指標(biāo)打分,再給每個(gè)考核指標(biāo)設(shè)置一個(gè)權(quán)重,計(jì)算出綜合評(píng)分。而這種方法依賴于分析者的偏好和經(jīng)驗(yàn),指標(biāo)選取和權(quán)重設(shè)置帶有較強(qiáng)主觀性,且難以解決評(píng)價(jià)指標(biāo)之間存在的相關(guān)性問題。第14章因子分析1統(tǒng)計(jì)學(xué)原理因子分析法能解決

因子分析方法能較好地解決上述問題。它把眾多指標(biāo)綜合為少數(shù)幾個(gè)基本不相關(guān)的綜合因子,以實(shí)現(xiàn)“用變量子集來解釋整個(gè)問題”的目的。特別是在上市公司報(bào)表中,財(cái)務(wù)指標(biāo)名目繁多,并可以進(jìn)行大量的變換組合,這不但增加了問題分析的復(fù)雜性,而且由于每一指標(biāo)都在不同程度上反映了財(cái)務(wù)績效的某些信息,所以各個(gè)指標(biāo)之間往往存在一定的相關(guān)關(guān)系。因此,有必要設(shè)計(jì)若干綜合指標(biāo)來整合各方面的信息,同時(shí)這些綜合指標(biāo)之間并不相關(guān),反映的信息就不會(huì)重疊。因子分析較好地滿足了這些要求,比較便于研究復(fù)雜事物,它通過一種從大量數(shù)據(jù)和指標(biāo)當(dāng)中“去粗取精”、“由表及里”的方法,把多個(gè)變量轉(zhuǎn)化為少數(shù)幾個(gè)綜合的更具有解釋力的變量,通過對(duì)統(tǒng)計(jì)結(jié)果的深入分析,挖掘數(shù)據(jù)內(nèi)在的信息資源,更好地從整體上洞察研究對(duì)象的現(xiàn)狀和發(fā)展規(guī)律。同時(shí)這種方法比較客觀、準(zhǔn)確、可操作性強(qiáng),能處理大量復(fù)雜的數(shù)據(jù)信息,可較大限度地避免人為因素所產(chǎn)生的偏差。第14章因子分析1統(tǒng)計(jì)學(xué)原理

運(yùn)用因子分析方法,借助SPSS15.0軟件,選取40家上市公司的7項(xiàng)財(cái)務(wù)指標(biāo)進(jìn)行綜合評(píng)價(jià),客觀合理地反映上市公司的經(jīng)營績效,從而為投資者提供一定的投資決策依據(jù)。返回第14章因子分析1統(tǒng)計(jì)學(xué)原理數(shù)據(jù)介紹數(shù)據(jù)來源:公告期:2010年4月21日,報(bào)告期:2009年12月31日選取的指標(biāo):流動(dòng)比率、速動(dòng)比率、資產(chǎn)負(fù)債率、凈資產(chǎn)收益率、每股收益、主營收入增長率、凈利潤增長率。第14章因子分析1統(tǒng)計(jì)學(xué)原理部分?jǐn)?shù)據(jù)第14章因子分析1統(tǒng)計(jì)學(xué)原理相關(guān)系數(shù)矩陣

流動(dòng)比率速動(dòng)比率資產(chǎn)負(fù)債率每股收益凈利潤增長率凈資產(chǎn)收益率主營收入增長率Correlation流動(dòng)比率1.000.998-.709-.095-.103-.212-.081

速動(dòng)比率.9981.000-.701-.085-.097-.212-.081

資產(chǎn)負(fù)債率-.709-.7011.000.032.111-.001.234

每股收益-.095-.085.0321.000.085.572.111

凈利潤增長率-.103-.097.111.0851.000.099.451

凈資產(chǎn)收益率-.212-.212-.001.572.0991.000-.026

主營收入增長率-.081-.081.234.111.451-.0261.000Sig.(1-tailed)流動(dòng)比率

.000.000.280.264.094.309

速動(dòng)比率.000

.000.301.276.094.309

資產(chǎn)負(fù)債率.000.000

.423.248.498.073

每股收益.280.301.423

.302.000.248

凈利潤增長率.264.276.248.302

.271.002

凈資產(chǎn)收益率.094.094.498.000.271

.436

主營收入增長率.309.309.073.248.002.436

第14章因子分析1統(tǒng)計(jì)學(xué)原理KMO檢驗(yàn)和巴特利特球度檢驗(yàn)結(jié)果表

檢驗(yàn)結(jié)果表明可以做因子分析第14章因子分析1統(tǒng)計(jì)學(xué)原理總的方差解釋表

由于貢獻(xiàn)率反映了每個(gè)因子包含原始數(shù)據(jù)的信息量度,所以當(dāng)選擇前3個(gè)因子作為公因子時(shí),就包含了原始變量信息量的81%以上,滿足了因子分析“用變量子集來解釋整個(gè)問題”的要求。第14章因子分析1統(tǒng)計(jì)學(xué)原理碎石圖第14章因子分析1統(tǒng)計(jì)學(xué)原理建立因子載荷矩陣

因子載荷用于反映因子和各個(gè)變量間的密切程度。當(dāng)各公因子間完全不相關(guān)時(shí),因子負(fù)荷值就等于因子與變量的相關(guān)系數(shù)。它的絕對(duì)值越大,說明該因子對(duì)當(dāng)前變量的影響程度越大。下圖給出了旋轉(zhuǎn)后的因子載荷矩陣。第14章因子分析1統(tǒng)計(jì)學(xué)原理因子載荷矩陣

可以看出經(jīng)過旋轉(zhuǎn)后載荷系數(shù)已經(jīng)明顯地向兩極分化了。第一個(gè)公因子對(duì)流動(dòng)比率、速動(dòng)比率、資產(chǎn)負(fù)債率有較大的載荷系數(shù),主要涉及企業(yè)的償

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論