因子分析解析(同名318)課件_第1頁(yè)
因子分析解析(同名318)課件_第2頁(yè)
因子分析解析(同名318)課件_第3頁(yè)
因子分析解析(同名318)課件_第4頁(yè)
因子分析解析(同名318)課件_第5頁(yè)
已閱讀5頁(yè),還剩157頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

建模

因子分析(FactorAnalysis)建模重點(diǎn)什么是因子分析?理解因子分析的基本思想因子分析的數(shù)學(xué)模型以及模型中公共因子、因子載荷變量共同度的統(tǒng)計(jì)意義因子分析的基本步驟因子旋轉(zhuǎn)的意義重點(diǎn)什么是因子分析?引入研究事物時(shí)候,需要影響該對(duì)象的各種變量的大量數(shù)據(jù)。但是過(guò)多的變量會(huì)影響數(shù)據(jù)的采集和數(shù)據(jù)的分析。大多數(shù)情況下,多變量會(huì)出現(xiàn)相關(guān),利用傳統(tǒng)的多元回歸就出現(xiàn)了大問(wèn)題。如果刪減指標(biāo),有時(shí)會(huì)損失很多有用的信息。需要在減少指標(biāo)的同時(shí),盡量減少對(duì)于原指標(biāo)所包含信息的損失。由于各變量之間相關(guān),所以有可能用較少的綜合指標(biāo)分別綜合存在于各變量中的各類信息,從而達(dá)到降維的目的。引入研究事物時(shí)候,需要影響該對(duì)象的各種變量的大量數(shù)據(jù)。但是過(guò)降維思路:身高體重?cái)?shù)據(jù)

變量觀測(cè)量i身高h(yuǎn)體重w1h1w12h2w23h3w34h4w4………nhnwn主成分概念示意圖用p1一個(gè)指標(biāo)來(lái)代替原始變量h、w研究n個(gè)觀測(cè)對(duì)象的差異。p1、p2可以用原始變量h、w的線性組合來(lái)表示:降維思路:身高體重?cái)?shù)據(jù)變量身高h(yuǎn)體重w一、因子分析的基本理論1、什么是因子分析利用降維的思想,由研究原始變量相關(guān)矩陣或協(xié)方差矩陣的內(nèi)部依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的多個(gè)變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多元統(tǒng)計(jì)分析方法。2、歷史

由心理學(xué)家發(fā)展起來(lái)的,1904年,斯皮爾曼在美國(guó)心理學(xué)雜志上發(fā)表了第一篇有關(guān)因子分析的文章,來(lái)解釋人類的行為和能力。50年代后,在社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、醫(yī)學(xué)、地質(zhì)學(xué)、氣象學(xué)和市場(chǎng)營(yíng)銷學(xué)中得到了廣泛的應(yīng)用。一、因子分析的基本理論1、什么是因子分析3、應(yīng)用方面1、尋求基本結(jié)構(gòu)summarization2、數(shù)據(jù)簡(jiǎn)化datareduction3、應(yīng)用方面1、尋求基本結(jié)構(gòu)summarization應(yīng)用第一方面:尋求基本結(jié)構(gòu)多元統(tǒng)計(jì)中,多變量如果存在較強(qiáng)的相關(guān)性。意味著他們所反映的信息高度重合,通過(guò)因子分析可以找到較少的代表因子。例如,某快餐店為了了解市場(chǎng)競(jìng)爭(zhēng)力進(jìn)行消費(fèi)者調(diào)查,通過(guò)定性研究設(shè)計(jì)了30個(gè)調(diào)查項(xiàng)目,這30個(gè)項(xiàng)目可能反映了快餐的質(zhì)量、價(jià)格、就餐環(huán)境和服務(wù)四個(gè)基本方面。通過(guò)因子分析我們能找到反映這四個(gè)因子和30個(gè)觀測(cè)變量之間的關(guān)系。應(yīng)用第一方面:尋求基本結(jié)構(gòu)多元統(tǒng)計(jì)中,多變量如果存在較強(qiáng)的相應(yīng)用第二方面:數(shù)據(jù)簡(jiǎn)化數(shù)據(jù)簡(jiǎn)化通過(guò)因子分析把一組觀測(cè)變量化為較少的幾個(gè)因子后,利用這些因子代替原來(lái)的觀測(cè)變量進(jìn)行其他的統(tǒng)計(jì)分析,比如:回歸分析、路徑分析、判別分析和聚類分析,利用因子值還可以直接對(duì)樣本進(jìn)行分類和綜合評(píng)價(jià)。應(yīng)用第二方面:數(shù)據(jù)簡(jiǎn)化數(shù)據(jù)簡(jiǎn)化把每個(gè)研究變量分解為幾個(gè)影響因素變量,將每個(gè)原始變量分解成兩部分因素,一部分是由所有變量共同具有的少數(shù)幾個(gè)公共因子組成的,另一部分是每個(gè)變量獨(dú)自具有的因素,即特殊因子。因子分析的基本思想因子分析的基本思想因子分析原理因?yàn)槿魏我粋€(gè)變量都可以經(jīng)過(guò)標(biāo)準(zhǔn)化處理,并且經(jīng)過(guò)這樣的標(biāo)準(zhǔn)化轉(zhuǎn)化不改變變量間的相關(guān)系數(shù)。不失一般性,假設(shè)我們討論的都是標(biāo)準(zhǔn)化變量。因子分析模型和多元回歸模型類似每個(gè)觀測(cè)變量由一組因子的線性組合來(lái)表示。設(shè)有p個(gè)觀測(cè)變量都是0均值,單位方差的標(biāo)準(zhǔn)化變量。因子分析原理因?yàn)槿魏我粋€(gè)變量都可以經(jīng)過(guò)標(biāo)準(zhǔn)化處理,并且經(jīng)過(guò)這

4、因子分析模型

設(shè)個(gè)變量,如果表示為4、因子分析模型設(shè)(1)(2)

稱為公共因子,是不可觀測(cè)的變量,他們的系數(shù)稱為因子載荷。是特殊因子,是不能被前m個(gè)公共因子包含的部分。其中:不相關(guān);即互不相關(guān),方差為1。稱為公共因子,是不可觀測(cè)的變量,他們(3)即互不相關(guān),方差不一定相等,。滿足以上條件的,稱為正交因子模型.如果(2)不成立,即各公共因子之間不獨(dú)立,則因子分析模型為斜交因子模型.(3)即互不相關(guān),方差不一定相等,。5、因子分析的目的因子分析的目的之一,簡(jiǎn)化變量維數(shù)。即要使因素結(jié)構(gòu)簡(jiǎn)單化,希望以最少的共同因素(公共因子),能對(duì)總變異量作最大的解釋,因而抽取得因子愈少愈好,但抽取因子的累積解釋的變異量愈大愈好。在因子分析的公共因子抽取中,應(yīng)最先抽取特征值最大的公共因子,其次是次大者,最后抽取公共因子的特征值最小的,通常會(huì)接近0。5、因子分析的目的案例1:在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過(guò)一個(gè)有24個(gè)指標(biāo)構(gòu)成的評(píng)價(jià)體系,評(píng)價(jià)百貨商場(chǎng)的24個(gè)方面的優(yōu)劣。但消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過(guò)24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在的因子,對(duì)商店進(jìn)行綜合評(píng)價(jià)。而這三個(gè)公共因子可以表示為:是不可觀測(cè)的潛在因子,稱為公共因子。24個(gè)變量共享這三個(gè)因子.但是每個(gè)變量又有自己的個(gè)性,不被包含的部分,稱為特殊因子。案例1:在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過(guò)一個(gè)有2

公因子F1公因子F2共同度hi特殊因子δix1=代數(shù)10.8960.3410.9190.081x2=代數(shù)20.8020.4960.8890.111x3=幾何0.5160.8550.9970.003x4=三角0.8410.4440.9040.096x5=解析幾何0.8330.4340.8820.118特征值G3.1131.4794.9590.409方差貢獻(xiàn)率(變異量)62.26%29.58%91.85%因子分析案例2F1體現(xiàn)邏輯思維和運(yùn)算能力,F(xiàn)2體現(xiàn)空間思維和推理能力

公因子F1公因子共同度特殊因子x1=代數(shù)10.8960.3

公因子F1公因子F2x1=代數(shù)10.8960.341x2=代數(shù)20.8020.496x3=幾何0.5160.855x4=三角0.8410.444x5=解析幾何0.8330.434因子分析案例2該案例是對(duì)數(shù)學(xué)專業(yè)的五門專業(yè)課進(jìn)行相關(guān)性因子分析

公因子公因子x1=代數(shù)10.8960.341x2=代數(shù)206、因子分析模型中的幾個(gè)重要統(tǒng)計(jì)量的意義(1)因子負(fù)荷量(或稱因子載荷)----是指因子結(jié)構(gòu)中原始變量與因子分析時(shí)抽取出的公共因子的相關(guān)程度。6、因子分析模型中的幾個(gè)重要統(tǒng)計(jì)量的意義注意:在各公共因子不相關(guān)的前提下,(載荷矩陣中第i行,第j列的元素)是隨機(jī)變量xi*與公共因子Fj的相關(guān)系數(shù),表示xi*依賴于Fj的程度。反映了第i個(gè)原始變量在第j個(gè)公共因子上的相對(duì)重要性。因此絕對(duì)值越大,則公共因子Fj與原有變量xi的關(guān)系越強(qiáng)。注意:(2)共同度----又稱共性方差或公因子方差(community或commonvariance)就是觀測(cè)變量的方差中由公因子決定的比例。當(dāng)因子正交時(shí),等于每個(gè)公共因子之負(fù)荷量的平方總和(一行中所有因素負(fù)荷量的平方和)。變量的共同度是因子載荷矩陣的第i行的元素的平方和。記為

從共同性的大小可以判斷這個(gè)原始實(shí)測(cè)變量與公共因子間之關(guān)系程度。特殊因子方差(剩余方差)----各變量的特殊因素影響大小就是1減掉該變量共同度的值。(2)共同度----又稱共性方差或公因子方差(communi統(tǒng)計(jì)意義:兩邊求方差

所有的公共因子和特殊因子對(duì)變量的貢獻(xiàn)為1。hi2反映了全部公共因子對(duì)變量Xi*的影響,是全部公共因子對(duì)變量方差所做出的貢獻(xiàn),或者說(shuō)Xi*對(duì)公共因子的共同依賴程度,稱為公共因子對(duì)變量Xi*的方差貢獻(xiàn)。

hi2接近于1,表明該變量的原始信息幾乎都被選取的公共因子說(shuō)明了。特殊因子的方差,反映了原有變量方差中無(wú)法被公共因子描述的比例。統(tǒng)計(jì)意義:兩邊求方差所有的公共因子和特殊因子對(duì)變

公因子F1公因子F2共同度hi特殊因子δix1=代數(shù)10.8960.3410.9190.081x2=代數(shù)20.8020.4960.8890.111x3=幾何0.5160.8550.9970.003x4=三角0.8410.4440.9040.096x5=解析幾何0.8330.4340.8820.118因子分析案例2第一個(gè)觀測(cè)變量共同度h12=(0.896)平方+(0.341)平方=0.919同時(shí),它的剩余方差是:

公因子F1公因子共同度特殊因子x1=代數(shù)10.8960.3(3)特征值----是第j個(gè)公共因子Fj對(duì)于X*的每一分量Xi*所提供的方差的總和。又稱第j個(gè)公共因子的方差貢獻(xiàn)。即每個(gè)變量與某一共同因子之因子負(fù)荷量的平方總和(因子載荷矩陣中某一公共因子列所有因子負(fù)荷量的平方和)。

如因子分析案例中

F1的特征值

G=(0.896)平方+(0.802)平方+(0.516)平方+(0.841)平方+(0.833)平方=3.113表示了每個(gè)公因子對(duì)數(shù)據(jù)的屆時(shí)能力(3)特征值----是第j個(gè)公共因子Fj對(duì)于X*的每一分量X(4)方差貢獻(xiàn)率實(shí)際中更常用的指標(biāo)--指每個(gè)因子所解釋的方差占所有變量總方差的比例。即公共因子對(duì)實(shí)測(cè)變量的貢獻(xiàn),變量方差貢獻(xiàn)率=特征值G/p,是衡量公共因子相對(duì)重要性的指標(biāo),Gi越大,表明公共因子Fj對(duì)X*的貢獻(xiàn)越大,該因子的重要程度越高如因子分析案例中F1的貢獻(xiàn)率為3.113/5=62.26%(4)方差貢獻(xiàn)率如因子分析案例中F1的貢獻(xiàn)率為3.113/

7、主成分分析分析principalcomponents與因子分析的聯(lián)系和差異

聯(lián)系:(1)因子分析是主成分分析的推廣,是主成分分析的逆問(wèn)題。(2)二者都是以‘降維’為目的,都是從協(xié)方差矩陣或相關(guān)系數(shù)矩陣出發(fā)。

區(qū)別:(1)主成分分析模型是原始變量的線性組合,是將原始變量加以綜合、歸納,僅僅是變量變換;而因子分析是將原始變量加以分解,描述原始變量協(xié)方差矩陣結(jié)構(gòu)的模型;只有當(dāng)提取的公因子個(gè)數(shù)等于原始變量個(gè)數(shù)時(shí),因子分析才對(duì)應(yīng)變量變換。(2)主成分分析,中每個(gè)主成分對(duì)應(yīng)的系數(shù)是唯一確定的;因子分析中每個(gè)因子的相應(yīng)系數(shù)即因子載荷不是唯一的。(3)因子分析中因子載荷的不唯一性有利于對(duì)公共因子進(jìn)行有效解釋;而主成分分析對(duì)提取的主成分的解釋能力有限。目的不同!一個(gè)側(cè)重降維,一個(gè)側(cè)重解釋!

7、主成分分析分析principalcomponent二、因子分析的基本內(nèi)容1、因子分析的基本步驟(1)因子分析的前提條件鑒定考察原始變量之間是否存在較強(qiáng)的相關(guān)關(guān)系,是否適合進(jìn)行因子分析。因?yàn)椋阂蜃臃治龅闹饕蝿?wù)之一就是對(duì)原有變量中信息重疊的部分提取和綜合成因子,最終實(shí)現(xiàn)減少變量個(gè)數(shù)的目的。所以要求原有變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。否則,如果原有變量相互獨(dú)立,不存在信息重疊,也就無(wú)需進(jìn)行綜合和因子分析。(2)因子提取

研究如何在樣本數(shù)據(jù)的基礎(chǔ)上提取綜合因子。二、因子分析的基本內(nèi)容1、因子分析的基本步驟(3)因子旋轉(zhuǎn)

通過(guò)正交旋轉(zhuǎn)或斜交旋轉(zhuǎn)使提取出的因子具有可解釋性。(4)計(jì)算因子得分

通過(guò)各種方法求解各樣本在各因子上的得分,為進(jìn)一步分析奠定基礎(chǔ)。(3)因子旋轉(zhuǎn)2、因子分析前提條件——相關(guān)性分析分析方法主要有:(1)計(jì)算相關(guān)系數(shù)矩陣(correlationcoefficientsmatrix)

如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)值均小于0.3,即各變量間大多為弱相關(guān),原則上這些變量不適合進(jìn)行因子分析。(2)計(jì)算反映象相關(guān)矩陣(Anti-imagecorrelationmatrix)2、因子分析前提條件——相關(guān)性分析

反映象相關(guān)矩陣,如果其主對(duì)角線外的元素大多絕對(duì)值較小,對(duì)角線上的元素值較接近1,則說(shuō)明這些變量的相關(guān)性較強(qiáng),適合進(jìn)行因子分析。其中主對(duì)角線上的元素為某變量的MSA(MeasureofSampleAdequacy):

是變量和變量()間的簡(jiǎn)單相關(guān)系數(shù),是變量和變量()在控制了其他變量影響下的偏相關(guān)系數(shù),即凈相關(guān)系數(shù)。取值在0和1之間,越接近1,意味著變量與其他變量間的相關(guān)性越強(qiáng),越接近0則相關(guān)性越弱。反映象相關(guān)矩陣,如果其主對(duì)角線外的元素大多(3)巴特利特球度檢驗(yàn)(Bartletttestofsphericity)

該檢驗(yàn)以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn),其零假設(shè)H0是:相關(guān)系數(shù)矩陣為單位矩陣,即相關(guān)系數(shù)矩陣主對(duì)角元素均為1,非主對(duì)角元素均為0。(即原始變量之間無(wú)相關(guān)關(guān)系)。

依據(jù)相關(guān)系數(shù)矩陣的行列式計(jì)算可得其近似服從卡方分布。如果統(tǒng)計(jì)量卡方值較大且對(duì)應(yīng)的sig值小于給定的顯著性水平a時(shí),零假設(shè)不成立。即說(shuō)明相關(guān)系數(shù)矩陣不太可能是單位矩陣,變量之間存在相關(guān)關(guān)系,適合做因子分析。(3)巴特利特球度檢驗(yàn)(Bartletttestofs(4)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)

KMO檢驗(yàn)的統(tǒng)計(jì)量是用于比較變量間簡(jiǎn)單相關(guān)系數(shù)矩陣和偏相關(guān)系數(shù)的指標(biāo),數(shù)學(xué)定義為:

KMO與MSA區(qū)別是它將相關(guān)系數(shù)矩陣中的所有元素都加入到了平方和計(jì)算中。KMO值越接近1,意味著變量間的相關(guān)性越強(qiáng),原有變量適合做因子分析;越接近0,意味變量間的相關(guān)性越弱,越不適合作因子分析。Kaiser給出的KMO度量標(biāo)準(zhǔn):0.9以上非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合;0.5以下表示極不適合。(4)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)3、因子提取和因子載荷矩陣的求解因子載荷矩陣求解的方法:

(1)基于主成分模型的主成分分析法(2)基于因子分析模型的主軸因子法(3)極大似然法(4)最小二乘法(5)a因子提取法(6)映象分析法3、因子提取和因子載荷矩陣的求解(1)基于主成分模型的主成分分析法Principalcomponents

設(shè)隨機(jī)向量的均值為,協(xié)方差為,為的特征根,為對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量,則(1)基于主成分模型的主成分分析法Principalco上式給出的表達(dá)式是精確的,然而,它實(shí)際上是毫無(wú)價(jià)值的,因?yàn)槲覀兊哪康氖菍で笥蒙贁?shù)幾個(gè)公共因子解釋,故略去后面的p-m項(xiàng)的貢獻(xiàn),有:因子分析解析(同名318)課件上式有一個(gè)假定,模型中的特殊因子是不重要的,因而從的分解中忽略了特殊因子的方差。因子分析解析(同名318)課件

例:

假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型。例:假定某地固定資產(chǎn)投資率,通貨膨脹率,(1)求解特征根(2)求解特征向量:(3)因子載荷矩陣:(1)求解特征根(4)因子分析模型:

可取前兩個(gè)因子F1和F2為公共因子,第一公因子F1物價(jià)就業(yè)因子,對(duì)X的貢獻(xiàn)為1.55。第一公因子F2為投資因子,對(duì)X的貢獻(xiàn)為0.85。共同度分別為1,0.706,0.706。(4)因子分析模型:(2)基于因子分析模型的主軸因子法Principalaxisfactoring

是對(duì)主成分方法的修正,假定我們首先對(duì)變量進(jìn)行標(biāo)準(zhǔn)化變換。則

R=AA’+DR*=AA’=R-D稱R*為約相關(guān)矩陣,R*對(duì)角線上的元素是,而不是1。(2)基于因子分析模型的主軸因子法Principalaxi直接求R*的前p個(gè)特征根和對(duì)應(yīng)的正交特征向量。得如下的矩陣:因子分析解析(同名318)課件當(dāng)特殊因子的方差已知:當(dāng)特殊因子的方差已知:方差矩陣未知,估計(jì)的方法有如下幾種:

1)取,在這個(gè)情況下主因子解與主成分解等價(jià);2)取,為xi與其他所有的原始變量xj的復(fù)相關(guān)系數(shù)的平方,即xi對(duì)其余的p-1個(gè)xj的回歸方程的判定系數(shù),這是因?yàn)閤i

與公共因子的關(guān)系是通過(guò)其余的p-1個(gè)xj

的線性組合聯(lián)系起來(lái)的;

3)取,這意味著取xi與其余的xj的簡(jiǎn)單相關(guān)系數(shù)的絕對(duì)值最大者;方差矩陣未知,估計(jì)的方法有如下幾種:1)取

4)取,其中要求該值為正數(shù)。5)取,其中是的對(duì)角元素。

例:假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主軸因子分析法求因子分析模型。假定用代替初始的。。例:假定某地固定資產(chǎn)投資率,通貨膨脹率,(1)求解特征根:(2)對(duì)應(yīng)的非0特征向量:(3)因子載荷矩陣表:(1)求解特征根:(4)因子分析模型:(5)新的共同度:(4)因子分析模型:4、因子旋轉(zhuǎn)為什么要旋轉(zhuǎn)因子?建立了因子分析數(shù)學(xué)目的不僅僅要找出公共因子以及對(duì)變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析,如果每個(gè)公共因子的含義不清,則不便于進(jìn)行實(shí)際背景的解釋。由于因子載荷陣是不惟一的,所以應(yīng)該對(duì)因子載荷陣進(jìn)行旋轉(zhuǎn)。目的是使每個(gè)變量在盡可能少的因子上有比較高的載荷,讓某個(gè)變量在某個(gè)因子上的載荷趨于1,而在其他因子上的載荷趨于0。即:使載荷矩陣每列或行的元素平方值向0和1兩極分化。4、因子旋轉(zhuǎn)案例3:奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目得分?jǐn)?shù)據(jù)的因子分析

百米跑成績(jī)跳遠(yuǎn)成績(jī)鉛球成績(jī)跳高成績(jī)400米跑成績(jī)百米跨欄鐵餅成績(jī)撐桿跳遠(yuǎn)成績(jī)標(biāo)槍成績(jī)1500米跑成績(jī)案例3:奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目因子分析解析(同名318)課件因

陣因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運(yùn)動(dòng)因子。其他的3個(gè)因子不太容易解釋。似乎是跑和投擲的能力對(duì)比,似乎是長(zhǎng)跑耐力和短跑速度的對(duì)比。于是考慮旋轉(zhuǎn)因子,得下表因

陣旋轉(zhuǎn)變換后因子載荷矩陣旋轉(zhuǎn)變換后因子載荷矩陣通過(guò)旋轉(zhuǎn),因子有了較為明確的含義。百米跑,跳遠(yuǎn)和400米跑,需要爆發(fā)力的項(xiàng)目在有較大的載荷,可以稱為短跑速度因子;鉛球,鐵餅和標(biāo)槍在上有較大的載荷,可以稱為爆發(fā)性臂力因子;百米跨欄,撐桿跳遠(yuǎn),跳遠(yuǎn)和為跳高在上有較大的載荷,爆發(fā)腿力因子;長(zhǎng)跑耐力因子。通過(guò)旋轉(zhuǎn),因子有了較為明確的含義。百米跑,因子旋轉(zhuǎn)的方法有:(1)正交旋轉(zhuǎn);(2)斜交旋轉(zhuǎn)(1)正交旋轉(zhuǎn)

由初始載荷矩陣A左乘一正交矩陣得到;目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠(yuǎn)離0;只是在旋轉(zhuǎn)后的新的公因子仍保持獨(dú)立性。主要有以下方法:varimax:方差最大旋轉(zhuǎn)。簡(jiǎn)化對(duì)因子的解釋quartmax:四次最大正交旋轉(zhuǎn)。簡(jiǎn)化對(duì)變量的解釋equamax:等量正交旋轉(zhuǎn)因子旋轉(zhuǎn)的方法有:(1)正交旋轉(zhuǎn);(2)斜交旋轉(zhuǎn)A、方差最大法方差最大法從簡(jiǎn)化因子載荷矩陣的每一列出發(fā),使和每個(gè)因子有關(guān)的載荷的平方的方差最大。當(dāng)只有少數(shù)幾個(gè)變量在某個(gè)因子上有較高的載荷時(shí),對(duì)因子的解釋最簡(jiǎn)單。方差最大的直觀意義是希望通過(guò)因子旋轉(zhuǎn)后,使每個(gè)因子上的載荷盡量拉開(kāi)距離,一部分的載荷趨于1,另一部分趨于0。A、方差最大法方差最大法從簡(jiǎn)化因子載荷矩陣的每一B、四次方最大旋轉(zhuǎn)四次方最大旋轉(zhuǎn)是從簡(jiǎn)化載荷矩陣的行出發(fā),通過(guò)旋轉(zhuǎn)初始因子,使每個(gè)變量只在一個(gè)因子上有較高的載荷,而在其它的因子上盡可能低的載荷。如果每個(gè)變量只在一個(gè)因子上有非零的載荷,這時(shí)的因子解釋是最簡(jiǎn)單的。四次方最大法通過(guò)使因子載荷矩陣中每一行的因子載荷平方的方差達(dá)到最大。B、四次方最大旋轉(zhuǎn)四次方最大旋轉(zhuǎn)是從簡(jiǎn)化載荷矩陣C、等量最大法

等量最大法把四次方最大法和方差最大法結(jié)合起來(lái)求行和列因子載荷平方的方差的加權(quán)平均最大。C、等量最大法(2)斜交旋轉(zhuǎn)

目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠(yuǎn)離0;只是在旋轉(zhuǎn)時(shí),放棄了因子之間彼此獨(dú)立的限制,旋轉(zhuǎn)后的新公因子更容易解釋。主要有以下的方法:directoblimin:直接斜交旋轉(zhuǎn)。允許因子之間具有相關(guān)性;promax:斜交旋轉(zhuǎn)方法。允許因子之間具有相關(guān)性;(2)斜交旋轉(zhuǎn)5、因子得分因子得分的概念

前面我們主要解決了用公共因子的線性組合來(lái)表示一組觀測(cè)變量的有關(guān)問(wèn)題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來(lái)做回歸分析,對(duì)樣本進(jìn)行分類或評(píng)價(jià),這就需要我們對(duì)公共因子進(jìn)行測(cè)度,即給出公共因子的值。5、因子得分例:人均要素變量因子分析。對(duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況作因子分析。指標(biāo)體系中有如下指標(biāo):X1:人口(萬(wàn)人)X2:面積(萬(wàn)平方公里)X3:GDP(億元)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)X6:萬(wàn)人擁有的大學(xué)生數(shù)(人)X7:萬(wàn)人擁有科學(xué)家、工程師數(shù)(人)

RotatedFactorPatternFACTOR1FACTOR2FACTOR3X1-0.21522-0.273970.89092X20.63973-0.28739-0.28755X3-0.157910.063340.94855X40.95898-0.01501-0.07556X50.97224-0.06778-0.17535X6-0.114160.98328-0.08300X7-0.110410.97851-0.07246例:人均要素變量因子分析。對(duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況作對(duì)應(yīng)的因子分析模型X1=-0.21522F1-0.27397F2+0.89092F3X2=0.63973F1-0.28739F2-0.28755F3X3=-0.15791F1+0.06334F2+0.94855F3X4=0.95898F1-0.01501F2-0.07556F3X5=0.97224F1-0.06778F2-0.17535F3X6=-0.11416F1+0.98328F2-0.08300F3X7=-0.11041F1+0.97851F2-0.07246F3對(duì)應(yīng)的因子分析模型X1=-0.21522F1-0.27

高載荷指標(biāo)

因子命名

因子1X2;面積(萬(wàn)平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子

因子2X6:萬(wàn)人擁有的大學(xué)生數(shù)(人)X7:萬(wàn)人擁有的科學(xué)家、工程師數(shù)(人)

人力資源因子

因子3

X1;人口(萬(wàn)人)X3:GDP(億元)經(jīng)濟(jì)發(fā)展總量因子

X2;面積(萬(wàn)平方公里)自然資源因子

X6:萬(wàn)人擁有StandardizedScoringCoefficients

FACTOR1

FACTOR2

FACTOR3X10.05764

-0.06098

0.50391X20.22724

-0.09901

-0.07713X30.14635

0.12957

0.59715X40.47920

0.11228

0.17062X50.45583

0.07419

0.10129X60.05416

0.48629

0.04099X70.05790

0.48562

0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7StandardizedScoringCoefficie

前三個(gè)因子得分REGION

FACTOR1FACTOR2FACTOR3beijing?-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259前三個(gè)因子分析的數(shù)學(xué)模型為:原變量被表示為公共因子的線性組合,當(dāng)載荷矩陣旋轉(zhuǎn)之后,公共因子可以做出解釋,通常的情況下,我們還想反過(guò)來(lái)把公共因子表示為原變量的線性組合。因子得分函數(shù):因子分析的數(shù)學(xué)模型為:可見(jiàn),要求得每個(gè)因子的得分,必須求得分函數(shù)的系數(shù),而由于p>m,所以不能得到精確的得分,只能通過(guò)估計(jì)。因子得分的計(jì)算方法:(1)運(yùn)用回歸分析思想求解(2)Bartlett(3)Anderson-rubin可見(jiàn),要求得每個(gè)因子的得分,必須求得分函數(shù)的系數(shù),而由于p>(1)運(yùn)用回歸分析思想求解(1)運(yùn)用回歸分析思想求解則,我們有如下的方程組:則,我們有如下的方程組:j=1,2,…,mj=1,2,…,m

注:共需要解m次才能解出所有的得分函數(shù)的系數(shù)。注:共需要解m次才能解出所有的得分函數(shù)的系數(shù)(2)Bartlett法(即:加權(quán)最小二乘法)把一個(gè)個(gè)體的p個(gè)變量的取值X*當(dāng)作因變量,把求因子解中得到的A作為自變量數(shù)據(jù)陣,對(duì)于這個(gè)個(gè)體在公因子上的取值f,當(dāng)作未知參數(shù),而特殊因子的取值看作誤差e,于是得到如下的線性回歸模型:x*=Af+e,則稱未知參數(shù)f為取值為X*的因子得分。

最小二乘法(3)Anderson-rubin(略)(2)Bartlett法(即:加權(quán)最小二乘法)最小二乘法(案例分析:國(guó)民生活質(zhì)量的因素分析

國(guó)家發(fā)展的最終目標(biāo),是為了全面提高全體國(guó)民的生活質(zhì)量,滿足廣大國(guó)民日益增長(zhǎng)的物質(zhì)和文化的合理需求。在可持續(xù)發(fā)展消費(fèi)的統(tǒng)一理念下,增加社會(huì)財(cái)富,創(chuàng)造更多的物質(zhì)文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進(jìn)化的基礎(chǔ)上,維系人類與自然的平衡,達(dá)到完整的代際公平和區(qū)際公平(即時(shí)間過(guò)程的最大合理性與空間分布的最大合理化)。從1990年開(kāi)始,聯(lián)合國(guó)開(kāi)發(fā)計(jì)劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標(biāo)對(duì)于國(guó)民生活質(zhì)量進(jìn)行測(cè)度。人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標(biāo)組合,即人的健康狀況(使用出生時(shí)的人均預(yù)期壽命表達(dá))、人的智力程度(使用組合的教育成就表達(dá))、人的福利水平(使用人均國(guó)民收入或人均GDP表達(dá)),并且特別強(qiáng)調(diào)三類指標(biāo)組合的整體表達(dá)內(nèi)涵,去衡量一個(gè)國(guó)家或地區(qū)的社會(huì)發(fā)展總體狀況以及國(guó)民生活質(zhì)量的總水平。案例分析:國(guó)民生活質(zhì)量的因素分析在這個(gè)指標(biāo)體系中有如下的指標(biāo):X1——預(yù)期壽命X2——成人識(shí)字率X3——綜合入學(xué)率X4——人均GDP(美圓)X5——預(yù)期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù)在這個(gè)指標(biāo)體系中有如下的指標(biāo):

FACTOR1為經(jīng)濟(jì)發(fā)展因子

FACTOR2為教育成就因子

FACTOR3為健康水平因子RotatedFactorPatternFACTOR1FACTOR2FACTOR30.381290.417650.817140.121660.848280.459810.648030.618220.22398

0.904100.205310.341000.388540.432950.80848

0.282070.853250.43289

0.900910.206120.35052旋轉(zhuǎn)后的因子結(jié)構(gòu)X1——預(yù)期壽命X2——成人識(shí)字率X3——綜合入學(xué)率X4——人均GDP(美圓)X5——預(yù)期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù)RotatedFactorPattern被每個(gè)因子解釋的方差和共同度:

VarianceexplainedbyeachfactorFACTOR1FACTOR2FACTOR32.4397002.2763172.009490FinalCommunalityEstimates:Total=6.725507X1X2X3X4X50.9875300.9457960.8523060.9758300.992050X6X70.9949950.976999

被每個(gè)因子解釋的方差和共同度:StandardizedScoringCoefficients標(biāo)準(zhǔn)化得分系數(shù)

FACTOR1FACTOR2FACTOR3X1-0.18875-0.343970.85077X2-0.241090.60335-0.10234X30.354620.50232-0.59895X40.53990-0.17336-0.10355X5-0.17918-0.316040.81490X6-0.092300.62258-0.24876StandardizedScoringCoefficie案例4:生育率的影響因素分析

生育率受社會(huì)、經(jīng)濟(jì)、文化、計(jì)劃生育政策等很多因素影響,但這些因素對(duì)生育率的影響并不是完全獨(dú)立的,而是交織在一起,如果直接用選定的變量對(duì)生育率進(jìn)行多元回歸分析,最終結(jié)果往往只能保留兩三個(gè)變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對(duì)生育率進(jìn)行分析。選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國(guó)民收入。下表是1990年中國(guó)30個(gè)省、自治區(qū)、直轄市的數(shù)據(jù)。案例4:生育率的影響因素因子分析解析(同名318)課件EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201

1.0000特征根與各因子的貢獻(xiàn)EigenvalueDifferenceProportion沒(méi)有旋轉(zhuǎn)的因子結(jié)構(gòu)

Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962沒(méi)有旋轉(zhuǎn)的因子結(jié)構(gòu)

Factor1Factor2x1-0.7各旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.93006369Factor1可解釋方差Factor2可解釋方差2.99754292.1642615各旋轉(zhuǎn)后的共同度0.884540230.911439980.

在這個(gè)例子中我們得到了兩個(gè)因子,第一個(gè)因子是社會(huì)經(jīng)濟(jì)發(fā)展水平因子,第二個(gè)是計(jì)劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進(jìn)行其他的統(tǒng)計(jì)分析。

Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728

Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu)標(biāo)準(zhǔn)化得分函數(shù)在這個(gè)例子中我們得到了兩個(gè)因子,第一個(gè)因子是社會(huì)建模

因子分析(FactorAnalysis)建模重點(diǎn)什么是因子分析?理解因子分析的基本思想因子分析的數(shù)學(xué)模型以及模型中公共因子、因子載荷變量共同度的統(tǒng)計(jì)意義因子分析的基本步驟因子旋轉(zhuǎn)的意義重點(diǎn)什么是因子分析?引入研究事物時(shí)候,需要影響該對(duì)象的各種變量的大量數(shù)據(jù)。但是過(guò)多的變量會(huì)影響數(shù)據(jù)的采集和數(shù)據(jù)的分析。大多數(shù)情況下,多變量會(huì)出現(xiàn)相關(guān),利用傳統(tǒng)的多元回歸就出現(xiàn)了大問(wèn)題。如果刪減指標(biāo),有時(shí)會(huì)損失很多有用的信息。需要在減少指標(biāo)的同時(shí),盡量減少對(duì)于原指標(biāo)所包含信息的損失。由于各變量之間相關(guān),所以有可能用較少的綜合指標(biāo)分別綜合存在于各變量中的各類信息,從而達(dá)到降維的目的。引入研究事物時(shí)候,需要影響該對(duì)象的各種變量的大量數(shù)據(jù)。但是過(guò)降維思路:身高體重?cái)?shù)據(jù)

變量觀測(cè)量i身高h(yuǎn)體重w1h1w12h2w23h3w34h4w4………nhnwn主成分概念示意圖用p1一個(gè)指標(biāo)來(lái)代替原始變量h、w研究n個(gè)觀測(cè)對(duì)象的差異。p1、p2可以用原始變量h、w的線性組合來(lái)表示:降維思路:身高體重?cái)?shù)據(jù)變量身高h(yuǎn)體重w一、因子分析的基本理論1、什么是因子分析利用降維的思想,由研究原始變量相關(guān)矩陣或協(xié)方差矩陣的內(nèi)部依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的多個(gè)變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多元統(tǒng)計(jì)分析方法。2、歷史

由心理學(xué)家發(fā)展起來(lái)的,1904年,斯皮爾曼在美國(guó)心理學(xué)雜志上發(fā)表了第一篇有關(guān)因子分析的文章,來(lái)解釋人類的行為和能力。50年代后,在社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、醫(yī)學(xué)、地質(zhì)學(xué)、氣象學(xué)和市場(chǎng)營(yíng)銷學(xué)中得到了廣泛的應(yīng)用。一、因子分析的基本理論1、什么是因子分析3、應(yīng)用方面1、尋求基本結(jié)構(gòu)summarization2、數(shù)據(jù)簡(jiǎn)化datareduction3、應(yīng)用方面1、尋求基本結(jié)構(gòu)summarization應(yīng)用第一方面:尋求基本結(jié)構(gòu)多元統(tǒng)計(jì)中,多變量如果存在較強(qiáng)的相關(guān)性。意味著他們所反映的信息高度重合,通過(guò)因子分析可以找到較少的代表因子。例如,某快餐店為了了解市場(chǎng)競(jìng)爭(zhēng)力進(jìn)行消費(fèi)者調(diào)查,通過(guò)定性研究設(shè)計(jì)了30個(gè)調(diào)查項(xiàng)目,這30個(gè)項(xiàng)目可能反映了快餐的質(zhì)量、價(jià)格、就餐環(huán)境和服務(wù)四個(gè)基本方面。通過(guò)因子分析我們能找到反映這四個(gè)因子和30個(gè)觀測(cè)變量之間的關(guān)系。應(yīng)用第一方面:尋求基本結(jié)構(gòu)多元統(tǒng)計(jì)中,多變量如果存在較強(qiáng)的相應(yīng)用第二方面:數(shù)據(jù)簡(jiǎn)化數(shù)據(jù)簡(jiǎn)化通過(guò)因子分析把一組觀測(cè)變量化為較少的幾個(gè)因子后,利用這些因子代替原來(lái)的觀測(cè)變量進(jìn)行其他的統(tǒng)計(jì)分析,比如:回歸分析、路徑分析、判別分析和聚類分析,利用因子值還可以直接對(duì)樣本進(jìn)行分類和綜合評(píng)價(jià)。應(yīng)用第二方面:數(shù)據(jù)簡(jiǎn)化數(shù)據(jù)簡(jiǎn)化把每個(gè)研究變量分解為幾個(gè)影響因素變量,將每個(gè)原始變量分解成兩部分因素,一部分是由所有變量共同具有的少數(shù)幾個(gè)公共因子組成的,另一部分是每個(gè)變量獨(dú)自具有的因素,即特殊因子。因子分析的基本思想因子分析的基本思想因子分析原理因?yàn)槿魏我粋€(gè)變量都可以經(jīng)過(guò)標(biāo)準(zhǔn)化處理,并且經(jīng)過(guò)這樣的標(biāo)準(zhǔn)化轉(zhuǎn)化不改變變量間的相關(guān)系數(shù)。不失一般性,假設(shè)我們討論的都是標(biāo)準(zhǔn)化變量。因子分析模型和多元回歸模型類似每個(gè)觀測(cè)變量由一組因子的線性組合來(lái)表示。設(shè)有p個(gè)觀測(cè)變量都是0均值,單位方差的標(biāo)準(zhǔn)化變量。因子分析原理因?yàn)槿魏我粋€(gè)變量都可以經(jīng)過(guò)標(biāo)準(zhǔn)化處理,并且經(jīng)過(guò)這

4、因子分析模型

設(shè)個(gè)變量,如果表示為4、因子分析模型設(shè)(1)(2)

稱為公共因子,是不可觀測(cè)的變量,他們的系數(shù)稱為因子載荷。是特殊因子,是不能被前m個(gè)公共因子包含的部分。其中:不相關(guān);即互不相關(guān),方差為1。稱為公共因子,是不可觀測(cè)的變量,他們(3)即互不相關(guān),方差不一定相等,。滿足以上條件的,稱為正交因子模型.如果(2)不成立,即各公共因子之間不獨(dú)立,則因子分析模型為斜交因子模型.(3)即互不相關(guān),方差不一定相等,。5、因子分析的目的因子分析的目的之一,簡(jiǎn)化變量維數(shù)。即要使因素結(jié)構(gòu)簡(jiǎn)單化,希望以最少的共同因素(公共因子),能對(duì)總變異量作最大的解釋,因而抽取得因子愈少愈好,但抽取因子的累積解釋的變異量愈大愈好。在因子分析的公共因子抽取中,應(yīng)最先抽取特征值最大的公共因子,其次是次大者,最后抽取公共因子的特征值最小的,通常會(huì)接近0。5、因子分析的目的案例1:在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過(guò)一個(gè)有24個(gè)指標(biāo)構(gòu)成的評(píng)價(jià)體系,評(píng)價(jià)百貨商場(chǎng)的24個(gè)方面的優(yōu)劣。但消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過(guò)24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在的因子,對(duì)商店進(jìn)行綜合評(píng)價(jià)。而這三個(gè)公共因子可以表示為:是不可觀測(cè)的潛在因子,稱為公共因子。24個(gè)變量共享這三個(gè)因子.但是每個(gè)變量又有自己的個(gè)性,不被包含的部分,稱為特殊因子。案例1:在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過(guò)一個(gè)有2

公因子F1公因子F2共同度hi特殊因子δix1=代數(shù)10.8960.3410.9190.081x2=代數(shù)20.8020.4960.8890.111x3=幾何0.5160.8550.9970.003x4=三角0.8410.4440.9040.096x5=解析幾何0.8330.4340.8820.118特征值G3.1131.4794.9590.409方差貢獻(xiàn)率(變異量)62.26%29.58%91.85%因子分析案例2F1體現(xiàn)邏輯思維和運(yùn)算能力,F(xiàn)2體現(xiàn)空間思維和推理能力

公因子F1公因子共同度特殊因子x1=代數(shù)10.8960.3

公因子F1公因子F2x1=代數(shù)10.8960.341x2=代數(shù)20.8020.496x3=幾何0.5160.855x4=三角0.8410.444x5=解析幾何0.8330.434因子分析案例2該案例是對(duì)數(shù)學(xué)專業(yè)的五門專業(yè)課進(jìn)行相關(guān)性因子分析

公因子公因子x1=代數(shù)10.8960.341x2=代數(shù)206、因子分析模型中的幾個(gè)重要統(tǒng)計(jì)量的意義(1)因子負(fù)荷量(或稱因子載荷)----是指因子結(jié)構(gòu)中原始變量與因子分析時(shí)抽取出的公共因子的相關(guān)程度。6、因子分析模型中的幾個(gè)重要統(tǒng)計(jì)量的意義注意:在各公共因子不相關(guān)的前提下,(載荷矩陣中第i行,第j列的元素)是隨機(jī)變量xi*與公共因子Fj的相關(guān)系數(shù),表示xi*依賴于Fj的程度。反映了第i個(gè)原始變量在第j個(gè)公共因子上的相對(duì)重要性。因此絕對(duì)值越大,則公共因子Fj與原有變量xi的關(guān)系越強(qiáng)。注意:(2)共同度----又稱共性方差或公因子方差(community或commonvariance)就是觀測(cè)變量的方差中由公因子決定的比例。當(dāng)因子正交時(shí),等于每個(gè)公共因子之負(fù)荷量的平方總和(一行中所有因素負(fù)荷量的平方和)。變量的共同度是因子載荷矩陣的第i行的元素的平方和。記為

從共同性的大小可以判斷這個(gè)原始實(shí)測(cè)變量與公共因子間之關(guān)系程度。特殊因子方差(剩余方差)----各變量的特殊因素影響大小就是1減掉該變量共同度的值。(2)共同度----又稱共性方差或公因子方差(communi統(tǒng)計(jì)意義:兩邊求方差

所有的公共因子和特殊因子對(duì)變量的貢獻(xiàn)為1。hi2反映了全部公共因子對(duì)變量Xi*的影響,是全部公共因子對(duì)變量方差所做出的貢獻(xiàn),或者說(shuō)Xi*對(duì)公共因子的共同依賴程度,稱為公共因子對(duì)變量Xi*的方差貢獻(xiàn)。

hi2接近于1,表明該變量的原始信息幾乎都被選取的公共因子說(shuō)明了。特殊因子的方差,反映了原有變量方差中無(wú)法被公共因子描述的比例。統(tǒng)計(jì)意義:兩邊求方差所有的公共因子和特殊因子對(duì)變

公因子F1公因子F2共同度hi特殊因子δix1=代數(shù)10.8960.3410.9190.081x2=代數(shù)20.8020.4960.8890.111x3=幾何0.5160.8550.9970.003x4=三角0.8410.4440.9040.096x5=解析幾何0.8330.4340.8820.118因子分析案例2第一個(gè)觀測(cè)變量共同度h12=(0.896)平方+(0.341)平方=0.919同時(shí),它的剩余方差是:

公因子F1公因子共同度特殊因子x1=代數(shù)10.8960.3(3)特征值----是第j個(gè)公共因子Fj對(duì)于X*的每一分量Xi*所提供的方差的總和。又稱第j個(gè)公共因子的方差貢獻(xiàn)。即每個(gè)變量與某一共同因子之因子負(fù)荷量的平方總和(因子載荷矩陣中某一公共因子列所有因子負(fù)荷量的平方和)。

如因子分析案例中

F1的特征值

G=(0.896)平方+(0.802)平方+(0.516)平方+(0.841)平方+(0.833)平方=3.113表示了每個(gè)公因子對(duì)數(shù)據(jù)的屆時(shí)能力(3)特征值----是第j個(gè)公共因子Fj對(duì)于X*的每一分量X(4)方差貢獻(xiàn)率實(shí)際中更常用的指標(biāo)--指每個(gè)因子所解釋的方差占所有變量總方差的比例。即公共因子對(duì)實(shí)測(cè)變量的貢獻(xiàn),變量方差貢獻(xiàn)率=特征值G/p,是衡量公共因子相對(duì)重要性的指標(biāo),Gi越大,表明公共因子Fj對(duì)X*的貢獻(xiàn)越大,該因子的重要程度越高如因子分析案例中F1的貢獻(xiàn)率為3.113/5=62.26%(4)方差貢獻(xiàn)率如因子分析案例中F1的貢獻(xiàn)率為3.113/

7、主成分分析分析principalcomponents與因子分析的聯(lián)系和差異

聯(lián)系:(1)因子分析是主成分分析的推廣,是主成分分析的逆問(wèn)題。(2)二者都是以‘降維’為目的,都是從協(xié)方差矩陣或相關(guān)系數(shù)矩陣出發(fā)。

區(qū)別:(1)主成分分析模型是原始變量的線性組合,是將原始變量加以綜合、歸納,僅僅是變量變換;而因子分析是將原始變量加以分解,描述原始變量協(xié)方差矩陣結(jié)構(gòu)的模型;只有當(dāng)提取的公因子個(gè)數(shù)等于原始變量個(gè)數(shù)時(shí),因子分析才對(duì)應(yīng)變量變換。(2)主成分分析,中每個(gè)主成分對(duì)應(yīng)的系數(shù)是唯一確定的;因子分析中每個(gè)因子的相應(yīng)系數(shù)即因子載荷不是唯一的。(3)因子分析中因子載荷的不唯一性有利于對(duì)公共因子進(jìn)行有效解釋;而主成分分析對(duì)提取的主成分的解釋能力有限。目的不同!一個(gè)側(cè)重降維,一個(gè)側(cè)重解釋!

7、主成分分析分析principalcomponent二、因子分析的基本內(nèi)容1、因子分析的基本步驟(1)因子分析的前提條件鑒定考察原始變量之間是否存在較強(qiáng)的相關(guān)關(guān)系,是否適合進(jìn)行因子分析。因?yàn)椋阂蜃臃治龅闹饕蝿?wù)之一就是對(duì)原有變量中信息重疊的部分提取和綜合成因子,最終實(shí)現(xiàn)減少變量個(gè)數(shù)的目的。所以要求原有變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。否則,如果原有變量相互獨(dú)立,不存在信息重疊,也就無(wú)需進(jìn)行綜合和因子分析。(2)因子提取

研究如何在樣本數(shù)據(jù)的基礎(chǔ)上提取綜合因子。二、因子分析的基本內(nèi)容1、因子分析的基本步驟(3)因子旋轉(zhuǎn)

通過(guò)正交旋轉(zhuǎn)或斜交旋轉(zhuǎn)使提取出的因子具有可解釋性。(4)計(jì)算因子得分

通過(guò)各種方法求解各樣本在各因子上的得分,為進(jìn)一步分析奠定基礎(chǔ)。(3)因子旋轉(zhuǎn)2、因子分析前提條件——相關(guān)性分析分析方法主要有:(1)計(jì)算相關(guān)系數(shù)矩陣(correlationcoefficientsmatrix)

如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)值均小于0.3,即各變量間大多為弱相關(guān),原則上這些變量不適合進(jìn)行因子分析。(2)計(jì)算反映象相關(guān)矩陣(Anti-imagecorrelationmatrix)2、因子分析前提條件——相關(guān)性分析

反映象相關(guān)矩陣,如果其主對(duì)角線外的元素大多絕對(duì)值較小,對(duì)角線上的元素值較接近1,則說(shuō)明這些變量的相關(guān)性較強(qiáng),適合進(jìn)行因子分析。其中主對(duì)角線上的元素為某變量的MSA(MeasureofSampleAdequacy):

是變量和變量()間的簡(jiǎn)單相關(guān)系數(shù),是變量和變量()在控制了其他變量影響下的偏相關(guān)系數(shù),即凈相關(guān)系數(shù)。取值在0和1之間,越接近1,意味著變量與其他變量間的相關(guān)性越強(qiáng),越接近0則相關(guān)性越弱。反映象相關(guān)矩陣,如果其主對(duì)角線外的元素大多(3)巴特利特球度檢驗(yàn)(Bartletttestofsphericity)

該檢驗(yàn)以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn),其零假設(shè)H0是:相關(guān)系數(shù)矩陣為單位矩陣,即相關(guān)系數(shù)矩陣主對(duì)角元素均為1,非主對(duì)角元素均為0。(即原始變量之間無(wú)相關(guān)關(guān)系)。

依據(jù)相關(guān)系數(shù)矩陣的行列式計(jì)算可得其近似服從卡方分布。如果統(tǒng)計(jì)量卡方值較大且對(duì)應(yīng)的sig值小于給定的顯著性水平a時(shí),零假設(shè)不成立。即說(shuō)明相關(guān)系數(shù)矩陣不太可能是單位矩陣,變量之間存在相關(guān)關(guān)系,適合做因子分析。(3)巴特利特球度檢驗(yàn)(Bartletttestofs(4)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)

KMO檢驗(yàn)的統(tǒng)計(jì)量是用于比較變量間簡(jiǎn)單相關(guān)系數(shù)矩陣和偏相關(guān)系數(shù)的指標(biāo),數(shù)學(xué)定義為:

KMO與MSA區(qū)別是它將相關(guān)系數(shù)矩陣中的所有元素都加入到了平方和計(jì)算中。KMO值越接近1,意味著變量間的相關(guān)性越強(qiáng),原有變量適合做因子分析;越接近0,意味變量間的相關(guān)性越弱,越不適合作因子分析。Kaiser給出的KMO度量標(biāo)準(zhǔn):0.9以上非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合;0.5以下表示極不適合。(4)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)3、因子提取和因子載荷矩陣的求解因子載荷矩陣求解的方法:

(1)基于主成分模型的主成分分析法(2)基于因子分析模型的主軸因子法(3)極大似然法(4)最小二乘法(5)a因子提取法(6)映象分析法3、因子提取和因子載荷矩陣的求解(1)基于主成分模型的主成分分析法Principalcomponents

設(shè)隨機(jī)向量的均值為,協(xié)方差為,為的特征根,為對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量,則(1)基于主成分模型的主成分分析法Principalco上式給出的表達(dá)式是精確的,然而,它實(shí)際上是毫無(wú)價(jià)值的,因?yàn)槲覀兊哪康氖菍で笥蒙贁?shù)幾個(gè)公共因子解釋,故略去后面的p-m項(xiàng)的貢獻(xiàn),有:因子分析解析(同名318)課件上式有一個(gè)假定,模型中的特殊因子是不重要的,因而從的分解中忽略了特殊因子的方差。因子分析解析(同名318)課件

例:

假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型。例:假定某地固定資產(chǎn)投資率,通貨膨脹率,(1)求解特征根(2)求解特征向量:(3)因子載荷矩陣:(1)求解特征根(4)因子分析模型:

可取前兩個(gè)因子F1和F2為公共因子,第一公因子F1物價(jià)就業(yè)因子,對(duì)X的貢獻(xiàn)為1.55。第一公因子F2為投資因子,對(duì)X的貢獻(xiàn)為0.85。共同度分別為1,0.706,0.706。(4)因子分析模型:(2)基于因子分析模型的主軸因子法Principalaxisfactoring

是對(duì)主成分方法的修正,假定我們首先對(duì)變量進(jìn)行標(biāo)準(zhǔn)化變換。則

R=AA’+DR*=AA’=R-D稱R*為約相關(guān)矩陣,R*對(duì)角線上的元素是,而不是1。(2)基于因子分析模型的主軸因子法Principalaxi直接求R*的前p個(gè)特征根和對(duì)應(yīng)的正交特征向量。得如下的矩陣:因子分析解析(同名318)課件當(dāng)特殊因子的方差已知:當(dāng)特殊因子的方差已知:方差矩陣未知,估計(jì)的方法有如下幾種:

1)取,在這個(gè)情況下主因子解與主成分解等價(jià);2)取,為xi與其他所有的原始變量xj的復(fù)相關(guān)系數(shù)的平方,即xi對(duì)其余的p-1個(gè)xj的回歸方程的判定系數(shù),這是因?yàn)閤i

與公共因子的關(guān)系是通過(guò)其余的p-1個(gè)xj

的線性組合聯(lián)系起來(lái)的;

3)取,這意味著取xi與其余的xj的簡(jiǎn)單相關(guān)系數(shù)的絕對(duì)值最大者;方差矩陣未知,估計(jì)的方法有如下幾種:1)取

4)取,其中要求該值為正數(shù)。5)取,其中是的對(duì)角元素。

例:假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主軸因子分析法求因子分析模型。假定用代替初始的。。例:假定某地固定資產(chǎn)投資率,通貨膨脹率,(1)求解特征根:(2)對(duì)應(yīng)的非0特征向量:(3)因子載荷矩陣表:(1)求解特征根:(4)因子分析模型:(5)新的共同度:(4)因子分析模型:4、因子旋轉(zhuǎn)為什么要旋轉(zhuǎn)因子?建立了因子分析數(shù)學(xué)目的不僅僅要找出公共因子以及對(duì)變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析,如果每個(gè)公共因子的含義不清,則不便于進(jìn)行實(shí)際背景的解釋。由于因子載荷陣是不惟一的,所以應(yīng)該對(duì)因子載荷陣進(jìn)行旋轉(zhuǎn)。目的是使每個(gè)變量在盡可能少的因子上有比較高的載荷,讓某個(gè)變量在某個(gè)因子上的載荷趨于1,而在其他因子上的載荷趨于0。即:使載荷矩陣每列或行的元素平方值向0和1兩極分化。4、因子旋轉(zhuǎn)案例3:奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目得分?jǐn)?shù)據(jù)的因子分析

百米跑成績(jī)跳遠(yuǎn)成績(jī)鉛球成績(jī)跳高成績(jī)400米跑成績(jī)百米跨欄鐵餅成績(jī)撐桿跳遠(yuǎn)成績(jī)標(biāo)槍成績(jī)1500米跑成績(jī)案例3:奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目因子分析解析(同名318)課件因

陣因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運(yùn)動(dòng)因子。其他的3個(gè)因子不太容易解釋。似乎是跑和投擲的能力對(duì)比,似乎是長(zhǎng)跑耐力和短跑速度的對(duì)比。于是考慮旋轉(zhuǎn)因子,得下表因

陣旋轉(zhuǎn)變換后因子載荷矩陣旋轉(zhuǎn)變換后因子載荷矩陣通過(guò)旋轉(zhuǎn),因子有了較為明確的含義。百米跑,跳遠(yuǎn)和400米跑,需要爆發(fā)力的項(xiàng)目在有較大的載荷,可以稱為短跑速度因子;鉛球,鐵餅和標(biāo)槍在上有較大的載荷,可以稱為爆發(fā)性臂力因子;百米跨欄,撐桿跳遠(yuǎn),跳遠(yuǎn)和為跳高在上有較大的載荷,爆發(fā)腿力因子;長(zhǎng)跑耐力因子。通過(guò)旋轉(zhuǎn),因子有了較為明確的含義。百米跑,因子旋轉(zhuǎn)的方法有:(1)正交旋轉(zhuǎn);(2)斜交旋轉(zhuǎn)(1)正交旋轉(zhuǎn)

由初始載荷矩陣A左乘一正交矩陣得到;目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠(yuǎn)離0;只是在旋轉(zhuǎn)后的新的公因子仍保持獨(dú)立性。主要有以下方法:varimax:方差最大旋轉(zhuǎn)。簡(jiǎn)化對(duì)因子的解釋quartmax:四次最大正交旋轉(zhuǎn)。簡(jiǎn)化對(duì)變量的解釋equamax:等量正交旋轉(zhuǎn)因子旋轉(zhuǎn)的方法有:(1)正交旋轉(zhuǎn);(2)斜交旋轉(zhuǎn)A、方差最大法方差最大法從簡(jiǎn)化因子載荷矩陣的每一列出發(fā),使和每個(gè)因子有關(guān)的載荷的平方的方差最大。當(dāng)只有少數(shù)幾個(gè)變量在某個(gè)因子上有較高的載荷時(shí),對(duì)因子的解釋最簡(jiǎn)單。方差最大的直觀意義是希望通過(guò)因子旋轉(zhuǎn)后,使每個(gè)因子上的載荷盡量拉開(kāi)距離,一部分的載荷趨于1,另一部分趨于0。A、方差最大法方差最大法從簡(jiǎn)化因子載荷矩陣的每一B、四次方最大旋轉(zhuǎn)四次方最大旋轉(zhuǎn)是從簡(jiǎn)化載荷矩陣的行出發(fā),通過(guò)旋轉(zhuǎn)初始因子,使每個(gè)變量只在一個(gè)因子上有較高的載荷,而在其它的因子上盡可能低的載荷。如果每個(gè)變量只在一個(gè)因子上有非零的載荷,這時(shí)的因子解釋是最簡(jiǎn)單的。四次方最大法通過(guò)使因子載荷矩陣中每一行的因子載荷平方的方差達(dá)到最大。B、四次方最大旋轉(zhuǎn)四次方最大旋轉(zhuǎn)是從簡(jiǎn)化載荷矩陣C、等量最大法

等量最大法把四次方最大法和方差最大法結(jié)合起來(lái)求行和列因子載荷平方的方差的加權(quán)平均最大。C、等量最大法(2)斜交旋轉(zhuǎn)

目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠(yuǎn)離0;只是在旋轉(zhuǎn)時(shí),放棄了因子之間彼此獨(dú)立的限制,旋轉(zhuǎn)后的新公因子更容易解釋。主要有以下的方法:directoblimin:直接斜交旋轉(zhuǎn)。允許因子之間具有相關(guān)性;promax:斜交旋轉(zhuǎn)方法。允許因子之間具有相關(guān)性;(2)斜交旋轉(zhuǎn)5、因子得分因子得分的概念

前面我們主要解決了用公共因子的線性組合來(lái)表示一組觀測(cè)變量的有關(guān)問(wèn)題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來(lái)做回歸分析,對(duì)樣本進(jìn)行分類或評(píng)價(jià),這就需要我們對(duì)公共因子進(jìn)行測(cè)度,即給出公共因子的值。5、因子得分例:人均要素變量因子分析。對(duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況作因子分析。指標(biāo)體系中有如下指標(biāo):X1:人口(萬(wàn)人)X2:面積(萬(wàn)平方公里)X3:GDP(億元)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)X6:萬(wàn)人擁有的大學(xué)生數(shù)(人)X7:萬(wàn)人擁有科學(xué)家、工程師數(shù)(人)

RotatedFactorPatternFACTOR1FACTOR2FACTOR3X1-0.21522-0.273970.89092X20.63973-0.28739-0.28755X3-0.157910.063340.94855X40.95898-0.01501-0.07556X50.97224-0.06778-0.17535X6-0.114160.98328-0.08300X7-0.110410.97851-0.07246例:人均要素變量因子分析。對(duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況作對(duì)應(yīng)的因子分析模型X1=-0.21522F1-0.27397F2+0.89092F3X2=0.63973F1-0.28739F2-0.28755F3X3=-0.15791F1+0.06334F2+0.94855F3X4=0.95898F1-0.01501F2-0.07556F3X5=0.97224F1-0.06778F2-0.17535F3X6=-0.11416F1+0.98328F2-0.08300F3X7=-0.11041F1+0.97851F2-0.07246F3對(duì)應(yīng)的因子分析模型X1=-0.21522F1-0.27

高載荷指標(biāo)

因子命名

因子1X2;面積(萬(wàn)平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子

因子2X6:萬(wàn)人擁有的大學(xué)生數(shù)(人)X7:萬(wàn)人擁有的科學(xué)家、工程師數(shù)(人)

人力資源因子

因子3

X1;人口(萬(wàn)人)X3:GDP(億元)經(jīng)濟(jì)發(fā)展總量因子

X2;面積(萬(wàn)平方公里)自然資源因子

X6:萬(wàn)人擁有StandardizedScoringCoefficients

FACTOR1

FACTOR2

FACTOR3X10.05764

-0.06098

0.50391X20.22724

-0.09901

-0.07713X30.14635

0.12957

0.59715X40.47920

0.11228

0.17062X50.45583

0.07419

0.10129X60.05416

0.48629

0.04099X70.05790

0.48562

0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7StandardizedScoringCoefficie

前三個(gè)因子得分REGION

FACTOR1FACTOR2FACTOR3beijing?-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259前三個(gè)因子分析的數(shù)學(xué)模型為:原變量被表示為公共因子的線性

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論