因子分析解析(同名318)課件

上傳人：信*** IP屬地：貴州上傳時(shí)間：2022-12-23 格式：PPT 頁(yè)數(shù)：162 大?。?.12MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩157頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

建模

因子分析（FactorAnalysis）建模重點(diǎn)什么是因子分析？理解因子分析的基本思想因子分析的數(shù)學(xué)模型以及模型中公共因子、因子載荷變量共同度的統(tǒng)計(jì)意義因子分析的基本步驟因子旋轉(zhuǎn)的意義重點(diǎn)什么是因子分析？引入研究事物時(shí)候，需要影響該對(duì)象的各種變量的大量數(shù)據(jù)。但是過(guò)多的變量會(huì)影響數(shù)據(jù)的采集和數(shù)據(jù)的分析。大多數(shù)情況下，多變量會(huì)出現(xiàn)相關(guān)，利用傳統(tǒng)的多元回歸就出現(xiàn)了大問(wèn)題。如果刪減指標(biāo)，有時(shí)會(huì)損失很多有用的信息。需要在減少指標(biāo)的同時(shí)，盡量減少對(duì)于原指標(biāo)所包含信息的損失。由于各變量之間相關(guān)，所以有可能用較少的綜合指標(biāo)分別綜合存在于各變量中的各類信息，從而達(dá)到降維的目的。引入研究事物時(shí)候，需要影響該對(duì)象的各種變量的大量數(shù)據(jù)。但是過(guò)降維思路：身高體重?cái)?shù)據(jù)

變量觀測(cè)量i身高h(yuǎn)體重w1h1w12h2w23h3w34h4w4………nhnwn主成分概念示意圖用p1一個(gè)指標(biāo)來(lái)代替原始變量h、w研究n個(gè)觀測(cè)對(duì)象的差異。p1、p2可以用原始變量h、w的線性組合來(lái)表示：降維思路：身高體重?cái)?shù)據(jù)變量身高h(yuǎn)體重w一、因子分析的基本理論1、什么是因子分析利用降維的思想，由研究原始變量相關(guān)矩陣或協(xié)方差矩陣的內(nèi)部依賴關(guān)系出發(fā)，把一些具有錯(cuò)綜復(fù)雜關(guān)系的多個(gè)變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多元統(tǒng)計(jì)分析方法。2、歷史

由心理學(xué)家發(fā)展起來(lái)的，1904年，斯皮爾曼在美國(guó)心理學(xué)雜志上發(fā)表了第一篇有關(guān)因子分析的文章，來(lái)解釋人類的行為和能力。50年代后，在社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、醫(yī)學(xué)、地質(zhì)學(xué)、氣象學(xué)和市場(chǎng)營(yíng)銷學(xué)中得到了廣泛的應(yīng)用。一、因子分析的基本理論1、什么是因子分析3、應(yīng)用方面1、尋求基本結(jié)構(gòu)summarization2、數(shù)據(jù)簡(jiǎn)化datareduction3、應(yīng)用方面1、尋求基本結(jié)構(gòu)summarization應(yīng)用第一方面：尋求基本結(jié)構(gòu)多元統(tǒng)計(jì)中，多變量如果存在較強(qiáng)的相關(guān)性。意味著他們所反映的信息高度重合，通過(guò)因子分析可以找到較少的代表因子。例如，某快餐店為了了解市場(chǎng)競(jìng)爭(zhēng)力進(jìn)行消費(fèi)者調(diào)查，通過(guò)定性研究設(shè)計(jì)了30個(gè)調(diào)查項(xiàng)目，這30個(gè)項(xiàng)目可能反映了快餐的質(zhì)量、價(jià)格、就餐環(huán)境和服務(wù)四個(gè)基本方面。通過(guò)因子分析我們能找到反映這四個(gè)因子和30個(gè)觀測(cè)變量之間的關(guān)系。應(yīng)用第一方面：尋求基本結(jié)構(gòu)多元統(tǒng)計(jì)中，多變量如果存在較強(qiáng)的相應(yīng)用第二方面：數(shù)據(jù)簡(jiǎn)化數(shù)據(jù)簡(jiǎn)化通過(guò)因子分析把一組觀測(cè)變量化為較少的幾個(gè)因子后，利用這些因子代替原來(lái)的觀測(cè)變量進(jìn)行其他的統(tǒng)計(jì)分析，比如：回歸分析、路徑分析、判別分析和聚類分析，利用因子值還可以直接對(duì)樣本進(jìn)行分類和綜合評(píng)價(jià)。應(yīng)用第二方面：數(shù)據(jù)簡(jiǎn)化數(shù)據(jù)簡(jiǎn)化把每個(gè)研究變量分解為幾個(gè)影響因素變量，將每個(gè)原始變量分解成兩部分因素，一部分是由所有變量共同具有的少數(shù)幾個(gè)公共因子組成的，另一部分是每個(gè)變量獨(dú)自具有的因素，即特殊因子。因子分析的基本思想因子分析的基本思想因子分析原理因?yàn)槿魏我粋€(gè)變量都可以經(jīng)過(guò)標(biāo)準(zhǔn)化處理，并且經(jīng)過(guò)這樣的標(biāo)準(zhǔn)化轉(zhuǎn)化不改變變量間的相關(guān)系數(shù)。不失一般性，假設(shè)我們討論的都是標(biāo)準(zhǔn)化變量。因子分析模型和多元回歸模型類似每個(gè)觀測(cè)變量由一組因子的線性組合來(lái)表示。設(shè)有p個(gè)觀測(cè)變量都是0均值，單位方差的標(biāo)準(zhǔn)化變量。因子分析原理因?yàn)槿魏我粋€(gè)變量都可以經(jīng)過(guò)標(biāo)準(zhǔn)化處理，并且經(jīng)過(guò)這

4、因子分析模型

設(shè)個(gè)變量，如果表示為4、因子分析模型設(shè)（1）（2）

稱為公共因子，是不可觀測(cè)的變量，他們的系數(shù)稱為因子載荷。是特殊因子，是不能被前m個(gè)公共因子包含的部分。其中：不相關(guān)；即互不相關(guān)，方差為1。稱為公共因子，是不可觀測(cè)的變量，他們（3）即互不相關(guān)，方差不一定相等，。滿足以上條件的，稱為正交因子模型．如果（２）不成立，即各公共因子之間不獨(dú)立，則因子分析模型為斜交因子模型．（3）即互不相關(guān)，方差不一定相等，。5、因子分析的目的因子分析的目的之一，簡(jiǎn)化變量維數(shù)。即要使因素結(jié)構(gòu)簡(jiǎn)單化，希望以最少的共同因素（公共因子），能對(duì)總變異量作最大的解釋，因而抽取得因子愈少愈好，但抽取因子的累積解釋的變異量愈大愈好。在因子分析的公共因子抽取中，應(yīng)最先抽取特征值最大的公共因子，其次是次大者，最后抽取公共因子的特征值最小的，通常會(huì)接近0。5、因子分析的目的案例1：在企業(yè)形象或品牌形象的研究中，消費(fèi)者可以通過(guò)一個(gè)有24個(gè)指標(biāo)構(gòu)成的評(píng)價(jià)體系，評(píng)價(jià)百貨商場(chǎng)的24個(gè)方面的優(yōu)劣。但消費(fèi)者主要關(guān)心的是三個(gè)方面，即商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過(guò)24個(gè)變量，找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在的因子，對(duì)商店進(jìn)行綜合評(píng)價(jià)。而這三個(gè)公共因子可以表示為：是不可觀測(cè)的潛在因子,稱為公共因子。24個(gè)變量共享這三個(gè)因子.但是每個(gè)變量又有自己的個(gè)性，不被包含的部分，稱為特殊因子。案例1：在企業(yè)形象或品牌形象的研究中，消費(fèi)者可以通過(guò)一個(gè)有2

公因子F1公因子F2共同度hi特殊因子δix1=代數(shù)10.8960.3410.9190.081x2=代數(shù)20.8020.4960.8890.111x3=幾何0.5160.8550.9970.003x4=三角0.8410.4440.9040.096x5=解析幾何0.8330.4340.8820.118特征值G3.1131.4794.9590.409方差貢獻(xiàn)率（變異量）62.26%29.58%91.85%因子分析案例2F1體現(xiàn)邏輯思維和運(yùn)算能力，F(xiàn)2體現(xiàn)空間思維和推理能力

公因子F1公因子共同度特殊因子x1=代數(shù)10.8960.3

公因子F1公因子F2x1=代數(shù)10.8960.341x2=代數(shù)20.8020.496x3=幾何0.5160.855x4=三角0.8410.444x5=解析幾何0.8330.434因子分析案例2該案例是對(duì)數(shù)學(xué)專業(yè)的五門專業(yè)課進(jìn)行相關(guān)性因子分析

公因子公因子x1=代數(shù)10.8960.341x2=代數(shù)206、因子分析模型中的幾個(gè)重要統(tǒng)計(jì)量的意義（1）因子負(fù)荷量（或稱因子載荷）----是指因子結(jié)構(gòu)中原始變量與因子分析時(shí)抽取出的公共因子的相關(guān)程度。6、因子分析模型中的幾個(gè)重要統(tǒng)計(jì)量的意義注意：在各公共因子不相關(guān)的前提下，（載荷矩陣中第i行，第j列的元素）是隨機(jī)變量xi*與公共因子Fj的相關(guān)系數(shù)，表示xi*依賴于Fj的程度。反映了第i個(gè)原始變量在第j個(gè)公共因子上的相對(duì)重要性。因此絕對(duì)值越大，則公共因子Fj與原有變量xi的關(guān)系越強(qiáng)。注意：（2）共同度----又稱共性方差或公因子方差（community或commonvariance）就是觀測(cè)變量的方差中由公因子決定的比例。當(dāng)因子正交時(shí)，等于每個(gè)公共因子之負(fù)荷量的平方總和（一行中所有因素負(fù)荷量的平方和）。變量的共同度是因子載荷矩陣的第i行的元素的平方和。記為

從共同性的大小可以判斷這個(gè)原始實(shí)測(cè)變量與公共因子間之關(guān)系程度。特殊因子方差（剩余方差）----各變量的特殊因素影響大小就是1減掉該變量共同度的值。（2）共同度----又稱共性方差或公因子方差（communi統(tǒng)計(jì)意義：兩邊求方差

所有的公共因子和特殊因子對(duì)變量的貢獻(xiàn)為1。hi2反映了全部公共因子對(duì)變量Xi*的影響，是全部公共因子對(duì)變量方差所做出的貢獻(xiàn)，或者說(shuō)Xi*對(duì)公共因子的共同依賴程度，稱為公共因子對(duì)變量Xi*的方差貢獻(xiàn)。

hi2接近于1，表明該變量的原始信息幾乎都被選取的公共因子說(shuō)明了。特殊因子的方差，反映了原有變量方差中無(wú)法被公共因子描述的比例。統(tǒng)計(jì)意義：兩邊求方差所有的公共因子和特殊因子對(duì)變

公因子F1公因子F2共同度hi特殊因子δix1=代數(shù)10.8960.3410.9190.081x2=代數(shù)20.8020.4960.8890.111x3=幾何0.5160.8550.9970.003x4=三角0.8410.4440.9040.096x5=解析幾何0.8330.4340.8820.118因子分析案例2第一個(gè)觀測(cè)變量共同度h12=(0.896)平方+(0.341)平方=0.919同時(shí)，它的剩余方差是：

公因子F1公因子共同度特殊因子x1=代數(shù)10.8960.3（3）特征值----是第j個(gè)公共因子Fj對(duì)于X*的每一分量Xi*所提供的方差的總和。又稱第j個(gè)公共因子的方差貢獻(xiàn)。即每個(gè)變量與某一共同因子之因子負(fù)荷量的平方總和（因子載荷矩陣中某一公共因子列所有因子負(fù)荷量的平方和）。

如因子分析案例中

F1的特征值

G=（0.896）平方+（0.802）平方+（0.516）平方+（0.841）平方+（0.833）平方=3.113表示了每個(gè)公因子對(duì)數(shù)據(jù)的屆時(shí)能力（3）特征值----是第j個(gè)公共因子Fj對(duì)于X*的每一分量X（4）方差貢獻(xiàn)率實(shí)際中更常用的指標(biāo)--指每個(gè)因子所解釋的方差占所有變量總方差的比例。即公共因子對(duì)實(shí)測(cè)變量的貢獻(xiàn)，變量方差貢獻(xiàn)率=特征值G/p，是衡量公共因子相對(duì)重要性的指標(biāo)，Gi越大，表明公共因子Fj對(duì)X*的貢獻(xiàn)越大，該因子的重要程度越高如因子分析案例中F1的貢獻(xiàn)率為3.113/5=62.26%（4）方差貢獻(xiàn)率如因子分析案例中F1的貢獻(xiàn)率為3.113/

7、主成分分析分析principalcomponents與因子分析的聯(lián)系和差異

聯(lián)系：（1）因子分析是主成分分析的推廣，是主成分分析的逆問(wèn)題。（2）二者都是以‘降維’為目的，都是從協(xié)方差矩陣或相關(guān)系數(shù)矩陣出發(fā)。

區(qū)別：（1）主成分分析模型是原始變量的線性組合，是將原始變量加以綜合、歸納，僅僅是變量變換；而因子分析是將原始變量加以分解，描述原始變量協(xié)方差矩陣結(jié)構(gòu)的模型；只有當(dāng)提取的公因子個(gè)數(shù)等于原始變量個(gè)數(shù)時(shí)，因子分析才對(duì)應(yīng)變量變換。（2）主成分分析，中每個(gè)主成分對(duì)應(yīng)的系數(shù)是唯一確定的；因子分析中每個(gè)因子的相應(yīng)系數(shù)即因子載荷不是唯一的。（3）因子分析中因子載荷的不唯一性有利于對(duì)公共因子進(jìn)行有效解釋；而主成分分析對(duì)提取的主成分的解釋能力有限。目的不同！一個(gè)側(cè)重降維，一個(gè)側(cè)重解釋！

7、主成分分析分析principalcomponent二、因子分析的基本內(nèi)容1、因子分析的基本步驟（1）因子分析的前提條件鑒定考察原始變量之間是否存在較強(qiáng)的相關(guān)關(guān)系，是否適合進(jìn)行因子分析。因?yàn)椋阂蜃臃治龅闹饕蝿?wù)之一就是對(duì)原有變量中信息重疊的部分提取和綜合成因子，最終實(shí)現(xiàn)減少變量個(gè)數(shù)的目的。所以要求原有變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。否則，如果原有變量相互獨(dú)立，不存在信息重疊，也就無(wú)需進(jìn)行綜合和因子分析。（2）因子提取

研究如何在樣本數(shù)據(jù)的基礎(chǔ)上提取綜合因子。二、因子分析的基本內(nèi)容1、因子分析的基本步驟（3）因子旋轉(zhuǎn)

通過(guò)正交旋轉(zhuǎn)或斜交旋轉(zhuǎn)使提取出的因子具有可解釋性。（4）計(jì)算因子得分

通過(guò)各種方法求解各樣本在各因子上的得分，為進(jìn)一步分析奠定基礎(chǔ)。（3）因子旋轉(zhuǎn)2、因子分析前提條件——相關(guān)性分析分析方法主要有：（1）計(jì)算相關(guān)系數(shù)矩陣(correlationcoefficientsmatrix)

如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)值均小于0.3，即各變量間大多為弱相關(guān)，原則上這些變量不適合進(jìn)行因子分析。（2）計(jì)算反映象相關(guān)矩陣（Anti-imagecorrelationmatrix)2、因子分析前提條件——相關(guān)性分析

反映象相關(guān)矩陣，如果其主對(duì)角線外的元素大多絕對(duì)值較小，對(duì)角線上的元素值較接近1，則說(shuō)明這些變量的相關(guān)性較強(qiáng)，適合進(jìn)行因子分析。其中主對(duì)角線上的元素為某變量的MSA(MeasureofSampleAdequacy)：

是變量和變量（）間的簡(jiǎn)單相關(guān)系數(shù)，是變量和變量（）在控制了其他變量影響下的偏相關(guān)系數(shù)，即凈相關(guān)系數(shù)。取值在0和1之間，越接近1，意味著變量與其他變量間的相關(guān)性越強(qiáng)，越接近0則相關(guān)性越弱。反映象相關(guān)矩陣，如果其主對(duì)角線外的元素大多（3）巴特利特球度檢驗(yàn)（Bartletttestofsphericity)

該檢驗(yàn)以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn)，其零假設(shè)H0是：相關(guān)系數(shù)矩陣為單位矩陣，即相關(guān)系數(shù)矩陣主對(duì)角元素均為1，非主對(duì)角元素均為0。（即原始變量之間無(wú)相關(guān)關(guān)系）。

依據(jù)相關(guān)系數(shù)矩陣的行列式計(jì)算可得其近似服從卡方分布。如果統(tǒng)計(jì)量卡方值較大且對(duì)應(yīng)的sig值小于給定的顯著性水平a時(shí)，零假設(shè)不成立。即說(shuō)明相關(guān)系數(shù)矩陣不太可能是單位矩陣，變量之間存在相關(guān)關(guān)系，適合做因子分析。（3）巴特利特球度檢驗(yàn)（Bartletttestofs（4）KMO(Kaiser-Meyer-Olkin)檢驗(yàn)

KMO檢驗(yàn)的統(tǒng)計(jì)量是用于比較變量間簡(jiǎn)單相關(guān)系數(shù)矩陣和偏相關(guān)系數(shù)的指標(biāo)，數(shù)學(xué)定義為：

KMO與MSA區(qū)別是它將相關(guān)系數(shù)矩陣中的所有元素都加入到了平方和計(jì)算中。KMO值越接近1，意味著變量間的相關(guān)性越強(qiáng)，原有變量適合做因子分析；越接近0，意味變量間的相關(guān)性越弱，越不適合作因子分析。Kaiser給出的KMO度量標(biāo)準(zhǔn)：0.9以上非常適合；0.8表示適合；0.7表示一般；0.6表示不太適合；0.5以下表示極不適合。（4）KMO(Kaiser-Meyer-Olkin)檢驗(yàn)3、因子提取和因子載荷矩陣的求解因子載荷矩陣求解的方法：

（1）基于主成分模型的主成分分析法（2）基于因子分析模型的主軸因子法（3）極大似然法（4）最小二乘法（5）a因子提取法（6）映象分析法3、因子提取和因子載荷矩陣的求解（1）基于主成分模型的主成分分析法Principalcomponents

設(shè)隨機(jī)向量的均值為，協(xié)方差為,為的特征根，為對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量，則（1）基于主成分模型的主成分分析法Principalco上式給出的表達(dá)式是精確的，然而，它實(shí)際上是毫無(wú)價(jià)值的，因?yàn)槲覀兊哪康氖菍で笥蒙贁?shù)幾個(gè)公共因子解釋，故略去后面的p-m項(xiàng)的貢獻(xiàn)，有：因子分析解析(同名318)課件上式有一個(gè)假定，模型中的特殊因子是不重要的，因而從的分解中忽略了特殊因子的方差。因子分析解析(同名318)課件

例:

假定某地固定資產(chǎn)投資率，通貨膨脹率，失業(yè)率，相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型。例:假定某地固定資產(chǎn)投資率，通貨膨脹率，(1)求解特征根(2)求解特征向量：(3)因子載荷矩陣：(1)求解特征根(4)因子分析模型：

可取前兩個(gè)因子F1和F2為公共因子，第一公因子F1物價(jià)就業(yè)因子，對(duì)X的貢獻(xiàn)為1.55。第一公因子F2為投資因子，對(duì)X的貢獻(xiàn)為0.85。共同度分別為1，0.706，0.706。(4)因子分析模型：（2）基于因子分析模型的主軸因子法Principalaxisfactoring

是對(duì)主成分方法的修正，假定我們首先對(duì)變量進(jìn)行標(biāo)準(zhǔn)化變換。則

R=AA’+DR*=AA’=R-D稱R*為約相關(guān)矩陣，R*對(duì)角線上的元素是,而不是1。（2）基于因子分析模型的主軸因子法Principalaxi直接求R*的前p個(gè)特征根和對(duì)應(yīng)的正交特征向量。得如下的矩陣：因子分析解析(同名318)課件當(dāng)特殊因子的方差已知：當(dāng)特殊因子的方差已知：方差矩陣未知，估計(jì)的方法有如下幾種：

1）取，在這個(gè)情況下主因子解與主成分解等價(jià)；2）取，為xi與其他所有的原始變量xj的復(fù)相關(guān)系數(shù)的平方，即xi對(duì)其余的p-1個(gè)xj的回歸方程的判定系數(shù)，這是因?yàn)閤i

與公共因子的關(guān)系是通過(guò)其余的p-1個(gè)xj

的線性組合聯(lián)系起來(lái)的；

3）取，這意味著取xi與其余的xj的簡(jiǎn)單相關(guān)系數(shù)的絕對(duì)值最大者；方差矩陣未知，估計(jì)的方法有如下幾種：1）取

4）取，其中要求該值為正數(shù)。5）取，其中是的對(duì)角元素。

例：假定某地固定資產(chǎn)投資率，通貨膨脹率，失業(yè)率，相關(guān)系數(shù)矩陣為試用主軸因子分析法求因子分析模型。假定用代替初始的。。例：假定某地固定資產(chǎn)投資率，通貨膨脹率，（1）求解特征根：（2）對(duì)應(yīng)的非0特征向量：（3）因子載荷矩陣表：（1）求解特征根：（4）因子分析模型：（5）新的共同度：（4）因子分析模型：4、因子旋轉(zhuǎn)為什么要旋轉(zhuǎn)因子？建立了因子分析數(shù)學(xué)目的不僅僅要找出公共因子以及對(duì)變量進(jìn)行分組，更重要的要知道每個(gè)公共因子的意義，以便進(jìn)行進(jìn)一步的分析，如果每個(gè)公共因子的含義不清，則不便于進(jìn)行實(shí)際背景的解釋。由于因子載荷陣是不惟一的，所以應(yīng)該對(duì)因子載荷陣進(jìn)行旋轉(zhuǎn)。目的是使每個(gè)變量在盡可能少的因子上有比較高的載荷，讓某個(gè)變量在某個(gè)因子上的載荷趨于1，而在其他因子上的載荷趨于0。即：使載荷矩陣每列或行的元素平方值向0和1兩極分化。4、因子旋轉(zhuǎn)案例3：奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目得分?jǐn)?shù)據(jù)的因子分析

百米跑成績(jī)跳遠(yuǎn)成績(jī)鉛球成績(jī)跳高成績(jī)400米跑成績(jī)百米跨欄鐵餅成績(jī)撐桿跳遠(yuǎn)成績(jī)標(biāo)槍成績(jī)1500米跑成績(jī)案例3：奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目因子分析解析(同名318)課件因

子

載

荷

矩

陣因子載荷矩陣可以看出，除第一因子在所有的變量在公共因子上有較大的正載荷，可以稱為一般運(yùn)動(dòng)因子。其他的3個(gè)因子不太容易解釋。似乎是跑和投擲的能力對(duì)比，似乎是長(zhǎng)跑耐力和短跑速度的對(duì)比。于是考慮旋轉(zhuǎn)因子，得下表因

子

載

荷

矩

陣旋轉(zhuǎn)變換后因子載荷矩陣旋轉(zhuǎn)變換后因子載荷矩陣通過(guò)旋轉(zhuǎn)，因子有了較為明確的含義。百米跑，跳遠(yuǎn)和400米跑，需要爆發(fā)力的項(xiàng)目在有較大的載荷，可以稱為短跑速度因子；鉛球，鐵餅和標(biāo)槍在上有較大的載荷，可以稱為爆發(fā)性臂力因子；百米跨欄，撐桿跳遠(yuǎn)，跳遠(yuǎn)和為跳高在上有較大的載荷，爆發(fā)腿力因子；長(zhǎng)跑耐力因子。通過(guò)旋轉(zhuǎn)，因子有了較為明確的含義。百米跑，因子旋轉(zhuǎn)的方法有：（1）正交旋轉(zhuǎn)；（2）斜交旋轉(zhuǎn)（1）正交旋轉(zhuǎn)

由初始載荷矩陣A左乘一正交矩陣得到；目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠(yuǎn)離0；只是在旋轉(zhuǎn)后的新的公因子仍保持獨(dú)立性。主要有以下方法：varimax:方差最大旋轉(zhuǎn)。簡(jiǎn)化對(duì)因子的解釋quartmax:四次最大正交旋轉(zhuǎn)。簡(jiǎn)化對(duì)變量的解釋equamax:等量正交旋轉(zhuǎn)因子旋轉(zhuǎn)的方法有：（1）正交旋轉(zhuǎn)；（2）斜交旋轉(zhuǎn)A、方差最大法方差最大法從簡(jiǎn)化因子載荷矩陣的每一列出發(fā)，使和每個(gè)因子有關(guān)的載荷的平方的方差最大。當(dāng)只有少數(shù)幾個(gè)變量在某個(gè)因子上有較高的載荷時(shí)，對(duì)因子的解釋最簡(jiǎn)單。方差最大的直觀意義是希望通過(guò)因子旋轉(zhuǎn)后，使每個(gè)因子上的載荷盡量拉開(kāi)距離，一部分的載荷趨于1，另一部分趨于0。A、方差最大法方差最大法從簡(jiǎn)化因子載荷矩陣的每一B、四次方最大旋轉(zhuǎn)四次方最大旋轉(zhuǎn)是從簡(jiǎn)化載荷矩陣的行出發(fā)，通過(guò)旋轉(zhuǎn)初始因子，使每個(gè)變量只在一個(gè)因子上有較高的載荷，而在其它的因子上盡可能低的載荷。如果每個(gè)變量只在一個(gè)因子上有非零的載荷，這時(shí)的因子解釋是最簡(jiǎn)單的。四次方最大法通過(guò)使因子載荷矩陣中每一行的因子載荷平方的方差達(dá)到最大。B、四次方最大旋轉(zhuǎn)四次方最大旋轉(zhuǎn)是從簡(jiǎn)化載荷矩陣C、等量最大法

等量最大法把四次方最大法和方差最大法結(jié)合起來(lái)求行和列因子載荷平方的方差的加權(quán)平均最大。C、等量最大法（2）斜交旋轉(zhuǎn)

目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠(yuǎn)離0；只是在旋轉(zhuǎn)時(shí)，放棄了因子之間彼此獨(dú)立的限制，旋轉(zhuǎn)后的新公因子更容易解釋。主要有以下的方法：directoblimin:直接斜交旋轉(zhuǎn)。允許因子之間具有相關(guān)性；promax:斜交旋轉(zhuǎn)方法。允許因子之間具有相關(guān)性；（2）斜交旋轉(zhuǎn)5、因子得分因子得分的概念

前面我們主要解決了用公共因子的線性組合來(lái)表示一組觀測(cè)變量的有關(guān)問(wèn)題。如果我們要使用這些因子做其他的研究，比如把得到的因子作為自變量來(lái)做回歸分析，對(duì)樣本進(jìn)行分類或評(píng)價(jià)，這就需要我們對(duì)公共因子進(jìn)行測(cè)度，即給出公共因子的值。5、因子得分例：人均要素變量因子分析。對(duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況作因子分析。指標(biāo)體系中有如下指標(biāo)：X1：人口（萬(wàn)人）X2：面積（萬(wàn)平方公里）X3：GDP（億元）X4：人均水資源（立方米/人）X5：人均生物量（噸/人）X6：萬(wàn)人擁有的大學(xué)生數(shù)（人）X7：萬(wàn)人擁有科學(xué)家、工程師數(shù)（人）

RotatedFactorPatternFACTOR1FACTOR2FACTOR3X1-0.21522-0.273970.89092X20.63973-0.28739-0.28755X3-0.157910.063340.94855X40.95898-0.01501-0.07556X50.97224-0.06778-0.17535X6-0.114160.98328-0.08300X7-0.110410.97851-0.07246例：人均要素變量因子分析。對(duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況作對(duì)應(yīng)的因子分析模型X1=-0.21522F1-0.27397F2+0.89092F3X2=0.63973F1-0.28739F2-0.28755F3X3=-0.15791F1+0.06334F2+0.94855F3X4=0.95898F1-0.01501F2-0.07556F3X5=0.97224F1-0.06778F2-0.17535F3X6=-0.11416F1+0.98328F2-0.08300F3X7=-0.11041F1+0.97851F2-0.07246F3對(duì)應(yīng)的因子分析模型X1=-0.21522F1-0.27

高載荷指標(biāo)

因子命名

因子1X2；面積（萬(wàn)平方公里）X4:人均水資源（立方米/人）X5:人均生物量（噸/人）自然資源因子

因子2X6：萬(wàn)人擁有的大學(xué)生數(shù)（人）X7：萬(wàn)人擁有的科學(xué)家、工程師數(shù)（人）

人力資源因子

因子3

X1;人口（萬(wàn)人）X3:GDP(億元)經(jīng)濟(jì)發(fā)展總量因子

X2；面積（萬(wàn)平方公里）自然資源因子

X6：萬(wàn)人擁有StandardizedScoringCoefficients

FACTOR1

FACTOR2

FACTOR3X10.05764

-0.06098

0.50391X20.22724

-0.09901

-0.07713X30.14635

0.12957

0.59715X40.47920

0.11228

0.17062X50.45583

0.07419

0.10129X60.05416

0.48629

0.04099X70.05790

0.48562

0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7StandardizedScoringCoefficie

前三個(gè)因子得分REGION

FACTOR1FACTOR2FACTOR3beijing?-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259前三個(gè)因子分析的數(shù)學(xué)模型為：原變量被表示為公共因子的線性組合，當(dāng)載荷矩陣旋轉(zhuǎn)之后，公共因子可以做出解釋，通常的情況下，我們還想反過(guò)來(lái)把公共因子表示為原變量的線性組合。因子得分函數(shù)：因子分析的數(shù)學(xué)模型為：可見(jiàn)，要求得每個(gè)因子的得分，必須求得分函數(shù)的系數(shù)，而由于p>m，所以不能得到精確的得分，只能通過(guò)估計(jì)。因子得分的計(jì)算方法：（1）運(yùn)用回歸分析思想求解（2）Bartlett（3）Anderson-rubin可見(jiàn)，要求得每個(gè)因子的得分，必須求得分函數(shù)的系數(shù)，而由于p>（1）運(yùn)用回歸分析思想求解（1）運(yùn)用回歸分析思想求解則，我們有如下的方程組：則，我們有如下的方程組：j=1,2,…,mj=1,2,…,m

注：共需要解m次才能解出所有的得分函數(shù)的系數(shù)。注：共需要解m次才能解出所有的得分函數(shù)的系數(shù)（2）Bartlett法(即：加權(quán)最小二乘法）把一個(gè)個(gè)體的p個(gè)變量的取值X*當(dāng)作因變量，把求因子解中得到的A作為自變量數(shù)據(jù)陣，對(duì)于這個(gè)個(gè)體在公因子上的取值f，當(dāng)作未知參數(shù)，而特殊因子的取值看作誤差e，于是得到如下的線性回歸模型：x*=Af+e，則稱未知參數(shù)f為取值為X*的因子得分。

最小二乘法（3）Anderson-rubin（略）（2）Bartlett法(即：加權(quán)最小二乘法）最小二乘法（案例分析：國(guó)民生活質(zhì)量的因素分析

國(guó)家發(fā)展的最終目標(biāo)，是為了全面提高全體國(guó)民的生活質(zhì)量，滿足廣大國(guó)民日益增長(zhǎng)的物質(zhì)和文化的合理需求。在可持續(xù)發(fā)展消費(fèi)的統(tǒng)一理念下，增加社會(huì)財(cái)富，創(chuàng)造更多的物質(zhì)文明和精神文明，保持人類的健康延續(xù)和生生不息，在人類與自然協(xié)同進(jìn)化的基礎(chǔ)上，維系人類與自然的平衡，達(dá)到完整的代際公平和區(qū)際公平(即時(shí)間過(guò)程的最大合理性與空間分布的最大合理化)。從1990年開(kāi)始，聯(lián)合國(guó)開(kāi)發(fā)計(jì)劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標(biāo)對(duì)于國(guó)民生活質(zhì)量進(jìn)行測(cè)度。人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標(biāo)組合，即人的健康狀況(使用出生時(shí)的人均預(yù)期壽命表達(dá))、人的智力程度(使用組合的教育成就表達(dá))、人的福利水平(使用人均國(guó)民收入或人均GDP表達(dá))，并且特別強(qiáng)調(diào)三類指標(biāo)組合的整體表達(dá)內(nèi)涵，去衡量一個(gè)國(guó)家或地區(qū)的社會(huì)發(fā)展總體狀況以及國(guó)民生活質(zhì)量的總水平。案例分析：國(guó)民生活質(zhì)量的因素分析在這個(gè)指標(biāo)體系中有如下的指標(biāo)：X1——預(yù)期壽命X2——成人識(shí)字率X3——綜合入學(xué)率X4——人均GDP（美圓）X5——預(yù)期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù)在這個(gè)指標(biāo)體系中有如下的指標(biāo)：

FACTOR1為經(jīng)濟(jì)發(fā)展因子

FACTOR2為教育成就因子

FACTOR3為健康水平因子RotatedFactorPatternFACTOR1FACTOR2FACTOR30.381290.417650.817140.121660.848280.459810.648030.618220.22398

0.904100.205310.341000.388540.432950.80848

0.282070.853250.43289

0.900910.206120.35052旋轉(zhuǎn)后的因子結(jié)構(gòu)X1——預(yù)期壽命X2——成人識(shí)字率X3——綜合入學(xué)率X4——人均GDP（美圓）X5——預(yù)期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù)RotatedFactorPattern被每個(gè)因子解釋的方差和共同度：

VarianceexplainedbyeachfactorFACTOR1FACTOR2FACTOR32.4397002.2763172.009490FinalCommunalityEstimates:Total=6.725507X1X2X3X4X50.9875300.9457960.8523060.9758300.992050X6X70.9949950.976999

被每個(gè)因子解釋的方差和共同度：StandardizedScoringCoefficients標(biāo)準(zhǔn)化得分系數(shù)

FACTOR1FACTOR2FACTOR3X1-0.18875-0.343970.85077X2-0.241090.60335-0.10234X30.354620.50232-0.59895X40.53990-0.17336-0.10355X5-0.17918-0.316040.81490X6-0.092300.62258-0.24876StandardizedScoringCoefficie案例4：生育率的影響因素分析

生育率受社會(huì)、經(jīng)濟(jì)、文化、計(jì)劃生育政策等很多因素影響，但這些因素對(duì)生育率的影響并不是完全獨(dú)立的，而是交織在一起，如果直接用選定的變量對(duì)生育率進(jìn)行多元回歸分析，最終結(jié)果往往只能保留兩三個(gè)變量，其他變量的信息就損失了。因此，考慮用因子分析的方法，找出變量間的數(shù)據(jù)結(jié)構(gòu)，在信息損失最少的情況下用新生成的因子對(duì)生育率進(jìn)行分析。選擇的變量有：多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國(guó)民收入。下表是1990年中國(guó)30個(gè)省、自治區(qū)、直轄市的數(shù)據(jù)。案例4：生育率的影響因素因子分析解析(同名318)課件EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201

1.0000特征根與各因子的貢獻(xiàn)EigenvalueDifferenceProportion沒(méi)有旋轉(zhuǎn)的因子結(jié)構(gòu)

Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962沒(méi)有旋轉(zhuǎn)的因子結(jié)構(gòu)

Factor1Factor2x1-0.7各旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.93006369Factor1可解釋方差Factor2可解釋方差2.99754292.1642615各旋轉(zhuǎn)后的共同度0.884540230.911439980.

在這個(gè)例子中我們得到了兩個(gè)因子，第一個(gè)因子是社會(huì)經(jīng)濟(jì)發(fā)展水平因子，第二個(gè)是計(jì)劃生育因子。有了因子得分值后，則可以利用因子得分為變量，進(jìn)行其他的統(tǒng)計(jì)分析。

Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728

Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu)標(biāo)準(zhǔn)化得分函數(shù)在這個(gè)例子中我們得到了兩個(gè)因子，第一個(gè)因子是社會(huì)建模

4、因子分析模型

設(shè)個(gè)變量，如果表示為4、因子分析模型設(shè)（1）（2）

公因子F1公因子共同度特殊因子x1=代數(shù)10.8960.3

公因子F1公因子F2共同度hi特殊因子δix1=代數(shù)10.8960.3410.9190.081x2=代數(shù)20.8020.4960.8890.111x3=幾何0.5160.8550.9970.003x4=三角0.8410.4440.9040.096x5=解析幾何0.8330.4340.8820.118因子分析案例2第一個(gè)觀測(cè)變量共同度h12=(0.896)平方+(0.341)平方=0.919同時(shí)，它的剩余方差是：

如因子分析案例中

F1的特征值

7、主成分分析分析principalcomponents與因子分析的聯(lián)系和差異

研究如何在樣本數(shù)據(jù)的基礎(chǔ)上提取綜合因子。二、因子分析的基本內(nèi)容1、因子分析的基本步驟（3）因子旋轉(zhuǎn)

通過(guò)正交旋轉(zhuǎn)或斜交旋轉(zhuǎn)使提取出的因子具有可解釋性。（4）計(jì)算因子得分

KMO檢驗(yàn)的統(tǒng)計(jì)量是用于比較變量間簡(jiǎn)單相關(guān)系數(shù)矩陣和偏相關(guān)系數(shù)的指標(biāo)，數(shù)學(xué)定義為：

例:

是對(duì)主成分方法的修正，假定我們首先對(duì)變量進(jìn)行標(biāo)準(zhǔn)化變換。則

與公共因子的關(guān)系是通過(guò)其余的p-1個(gè)xj

的線性組合聯(lián)系起來(lái)的；

3）取，這意味著取xi與其余的xj的簡(jiǎn)單相關(guān)系數(shù)的絕對(duì)值最大者；方差矩陣未知，估計(jì)的方法有如下幾種：1）取

4）取，其中要求該值為正數(shù)。5）取，其中是的對(duì)角元素。

子

載

荷

矩

子

載

荷

矩

等量最大法把四次方最大法和方差最大法結(jié)合起來(lái)求行和列因子載荷平方的方差的加權(quán)平均最大。C、等量最大法（2）斜交旋轉(zhuǎn)

高載荷指標(biāo)

因子命名

因子1X2；面積（萬(wàn)平方公里）X4:人均水資源（立方米/人）X5:人均生物量（噸/人）自然資源因子

因子2X6：萬(wàn)人擁有的大學(xué)生數(shù)（人）X7：萬(wàn)人擁有的科學(xué)家、工程師數(shù)（人）

人力資源因子

因子3

X1;人口（萬(wàn)人）X3:GDP(億元)經(jīng)濟(jì)發(fā)展總量因子

X2；面積（萬(wàn)平方公里）自然資源因子

X6：萬(wàn)人擁有StandardizedScoringCoefficients

FACTOR1

FACTOR2

FACTOR3X10.05764

-0.06098

0.50391X20.22724

-0.09901

-0.07713X30.14635

0.12957

0.59715X40.47920

0.11228

0.17062X50.45583

0.07419

0.10129X60.05416

0.48629

0.04099X70.05790

0.48562

前三個(gè)因子得分REGION

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

因子分析解析(同名318)課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

因子分析解析(同名318)課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔