




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第一節(jié) 對(duì)應(yīng)分析方法及基本思想第二節(jié) 對(duì)應(yīng)分析方法的基本原理第三節(jié) 實(shí)例分析推薦閱讀第八章 對(duì)應(yīng)分析第一節(jié) 因子分析的概念 因子分析是主成分分析的推廣和發(fā)展,它是多元統(tǒng)計(jì)分析中降維的一種方法。因子分析是研究相關(guān)陣或協(xié)方差陣的內(nèi)部依賴關(guān)系,它將多個(gè)變量綜合為少數(shù)幾個(gè)因子,以再現(xiàn)原始變量與因子之間的相關(guān)關(guān)系,同時(shí)根據(jù)不同因子還可以對(duì)變量進(jìn)行分類。 因子分析概念起源于20世紀(jì)初Karl Pearson 和Charles Spearmen等學(xué)者為定義和測(cè)驗(yàn)智力所作的統(tǒng)計(jì)分析。目前因子分析在心理學(xué)、社會(huì)學(xué)、教育學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科都取得了成功的應(yīng)用。因子分析是通過研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測(cè)數(shù)據(jù)
2、中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)“抽象”的變量來表示其基本結(jié)構(gòu)。這幾個(gè)抽象的變量被稱為因子,它能反映原來眾多變量的主要信息。原始的變量是可觀測(cè)的顯在變量,而因子一般是不可觀測(cè)的潛在變量。例如,在商業(yè)企業(yè)的形象評(píng)價(jià)中,消費(fèi)者可以通過一系列指標(biāo)構(gòu)成一個(gè)評(píng)價(jià)指標(biāo)體系,評(píng)價(jià)百貨商場(chǎng)的各個(gè)方面的優(yōu)劣,但消費(fèi)者真正關(guān)系的只是商店的環(huán)境、商店的服務(wù)和商品的價(jià)格這3個(gè)方面。這3個(gè)方面除了價(jià)格外,商店的環(huán)境和商店的服務(wù)質(zhì)量都是客觀存在的、抽象的影響因素,都不便于直接測(cè)量,只能通過其它具體指標(biāo)進(jìn)行間接反映。因子分析就是一種通過顯在變量測(cè)評(píng)潛在變量,通過具體指標(biāo)進(jìn)行間接反映。 例如:某公司對(duì)100名招聘人員的知識(shí)和能力進(jìn)
3、行測(cè)評(píng),主要測(cè)評(píng)六個(gè)方面的內(nèi)容:語言表達(dá)能力、邏輯思維能力、判斷事物的敏捷和果斷程度、思想修養(yǎng)、興趣愛好、生活常識(shí)等,我們將每一個(gè)方面稱為因子,顯然這里所說的因子不同于回歸分析中的因素,因?yàn)榍罢呤潜容^抽象的一種概念,而后者有著極為明確的實(shí)際意義。假設(shè)100人測(cè)試得分xi可以用上述六個(gè)因子表示成線性函數(shù):再如,我們研究區(qū)域社會(huì)經(jīng)濟(jì)發(fā)展問題時(shí),描述社會(huì)和經(jīng)濟(jì)現(xiàn)象的指標(biāo)很多,過多的指標(biāo)容易導(dǎo)致分析過程復(fù)雜化。一個(gè)合適的做法就是從這些關(guān)系錯(cuò)綜復(fù)雜的社會(huì)經(jīng)濟(jì)指標(biāo)間提取少數(shù)幾個(gè)主要因子,每一個(gè)主要因子都能反映相互依賴的社會(huì)經(jīng)濟(jì)指標(biāo)間的共同作用,抓著這些主要因素就可以幫助我們對(duì)復(fù)雜的社會(huì)經(jīng)濟(jì)發(fā)展問題進(jìn)行深入
4、的分析、合理解釋和正確評(píng)價(jià)。因子分析的基本思想就是把每個(gè)研究變量分解為幾個(gè)影響因素變量,將每個(gè)原始變量分解成兩部分因素,一部分是由所有變量共同具有的少數(shù)幾個(gè)公共因子組成的,另一部分是每個(gè)變量獨(dú)自具有的因素,即特殊因子。因子分析即是通過變量的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的研究,找出能夠控制所有變量的少數(shù)幾個(gè)隨機(jī)變量去描述多個(gè)變量之間的相關(guān)關(guān)系,這里這少數(shù)幾個(gè)隨機(jī)變量是不可觀測(cè)的,通常稱為因子,然后根據(jù)相關(guān)性的大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,不同組的變量相關(guān)性較低。因子分析的研究內(nèi)容十分豐富,常用的因子分析類型是R型因子分析和Q型因子分析。R型因子分析是對(duì)變量作因子分析,Q型因子分析是對(duì)樣
5、品作因子分析。 第二節(jié) 因子分析的數(shù)學(xué)模型 1、正交因子模型1)R型因子分析模型R型因子分析中的公共因子是不可直接觀測(cè)但又客觀存在的共同影響因素,每一個(gè)變量都可以表示成公共因子的線性函數(shù)和特殊因子之和。即 其中 稱為公共因子,它們的系數(shù) 稱為因子載荷, 稱為特殊因子。 該模型用矩陣表示為 其中,A稱為因子載荷矩陣或因子負(fù)荷矩陣, 是第i個(gè)變量在第j個(gè)因子上的負(fù)荷。滿足下列條件: (1) (2) ,即公共因子F與特殊因子i是不相關(guān)的; (3) cov(F)=I, 即各個(gè)公共因子不相關(guān)且方差為1。 (4)即各個(gè)特殊因子不相關(guān),方差要求相等。 2)Q型因子分析模型類似地,Q型因子分析的數(shù)學(xué)模型可表示
6、為 Q型因子分析與R型因子分析模型的差異體現(xiàn)在 表示的是個(gè)樣品。無論Q型因子分析或R型因子分析,都用公共因子F代替X,一般要求 , ,因此,因子分析與主成分分析一樣,也是一種降低變量維數(shù)的一種統(tǒng)計(jì)方法。下面我們將看到,因子分析的求解過程與主成分分析類似,也是從協(xié)方差陣(或相似系數(shù)陣)出發(fā)的。雖然因子分析與主成分分析有許多相似之處,但這兩種模型又存在明顯的不同。主成分分析的數(shù)學(xué)模型實(shí)質(zhì)上是一種線性變換,將原來坐標(biāo)變換到變異程度大的方向上去,相當(dāng)于從空間上轉(zhuǎn)換觀看數(shù)據(jù)的角度,突出數(shù)據(jù)變異的方向,歸納重要的信息。在主成分分析中每個(gè)主成分相應(yīng)的系數(shù)aij是唯一確定的。而因子分析模型是描述原指標(biāo)協(xié)方差陣
7、結(jié)構(gòu)的一種模型,是從顯在變量去提煉潛在因子的過程,正因?yàn)橐蜃臃治鍪且粋€(gè)提煉潛在因子的過程,因此因子的個(gè)數(shù)m取多大是要通過一定的規(guī)則確定的,并且因子分析中因子載荷陣不是唯一確定的。一般來說,作為“自變量”的因子是不可觀測(cè)的。(1)變量X的協(xié)方差陣的分解式為:故 如果X為標(biāo)準(zhǔn)化隨機(jī)向量,則就是相關(guān)矩陣,即(2)因子載荷陣不是唯一的。這是因?yàn)閷?duì)于m階正交矩陣T,令則因子分析模型可以表示為由于 所以A*仍然滿足模型的條件。同樣也可以分解為因此,因子載荷矩陣A不是唯一的,在實(shí)際應(yīng)用中經(jīng)常會(huì)利用這一點(diǎn),通過因子的變換,使得新的因子有更好的實(shí)際意義。2、因子載荷陣的統(tǒng)計(jì)意義與性質(zhì) 為了便于對(duì)因子分析計(jì)算結(jié)果
8、進(jìn)行解釋,將因子分析模型中各個(gè)量的統(tǒng)計(jì)意義加以說明是十分必要的。假設(shè)模型中各個(gè)變量以及公共因子、特殊因子都已經(jīng)是標(biāo)準(zhǔn)化(均值為0,方差為1)的變量。 1)因子載荷aij的統(tǒng)計(jì)意義 已知模型我們可以得到變量Xi與公共因子Fj的協(xié)方差為 第i個(gè)變量Xi與第j個(gè)公共因子Fj的相關(guān)系數(shù)即可以表示為Xi依賴Fj的份量(比重)。由于變量Xi與公共因子Fj已作標(biāo)準(zhǔn)化處理,因此在各公共因子不相關(guān)的前提下,aij是Xi與Fj的相關(guān)系數(shù),一方面他表示Xi依賴于Fj的程度,絕對(duì)值越大,密切程度越高;另一方面也反映了第i個(gè)原有變量Xi在第j個(gè)公共因子Fj上的相對(duì)重要性。 2)變量共同度 及其統(tǒng)計(jì)意義因子載荷陣A中第
9、i行元素的平方和稱為Xi 的共同度。為了給出 的統(tǒng)計(jì)意義,下面計(jì)算Xi的方差 這說明變量Xi的方差由兩部分組成:第一部分為共同度hi2 ,它刻劃了全部公共因子對(duì)變量Xi的總方差所作的貢獻(xiàn),反映了公共因子對(duì)變量Xi的影響程度。第二部分為特殊因子i對(duì)變量Xi的方差所作的貢獻(xiàn)。由于Xi已作了標(biāo)準(zhǔn)化處理,因此有 hi2反映了全部公共因子對(duì)變量Xi的影響,是全部公共因子對(duì)變量方差所做出的貢獻(xiàn),或者說Xi對(duì)公共因子的共同依賴程度,稱為公共因子對(duì)變量Xi的方差貢獻(xiàn)。hi2接近于1,表明該變量Xi的原始信息幾乎都被選取的公共因子說明了。特殊因子i的方差,反映了原有變量方差中無法被公共因子描述的比例。顯然,若h
10、i2 大, 必小。而hi2 大,表明變量Xi對(duì)公共因子 的共同依賴程度就大。當(dāng)hi2=1時(shí),表明變量Xi完全能夠由公共因子的線性組合表示;當(dāng)hi20時(shí),表明公共因子對(duì)變量Xi的影響很小, Xi主要由特殊因子i來描述??梢奾i2反映了變量Xi對(duì)公共因子的共同依賴程度,故稱公共因子方差hi2為變量Xi的共同度。3、公共因子Fj的方差貢獻(xiàn)及其統(tǒng)計(jì)意義因子載荷陣中第 j列元素的平方和稱為公共因子Fj對(duì)X的貢獻(xiàn)。gj2表示第j個(gè)公共因子Fj對(duì)于X的每一分量Xi所提供的方差貢獻(xiàn)的總和。稱第j個(gè)公共因子的方差貢獻(xiàn)。它是衡量某一公共因子相對(duì)重要性的指標(biāo), gj2越大,表明公共因子Fj對(duì)X的貢獻(xiàn)越大,該因子的重
11、要程度越高,或者說對(duì)X的影響和作用越大,它是衡量每一個(gè)公共因子相對(duì)重要性的一個(gè)指標(biāo)。 我們有時(shí)也用方差貢獻(xiàn)率來衡量公共因子的相對(duì)重要性也是衡量公共因子相對(duì)重要性的另一指標(biāo)。 另外,任意兩個(gè)變量Xk與Xl的協(xié)方差等于因子載荷陣中第k行與第l列對(duì)應(yīng)元素乘積之和。例7.1某校對(duì)學(xué)生進(jìn)行了測(cè)量語言能力和數(shù)學(xué)能力的六項(xiàng)考試??荚嚦煽兌蓟癁闃?biāo)準(zhǔn)分。假定x1,x2,x3 是語言能力的三項(xiàng)不同考試的標(biāo)準(zhǔn)分, x4,x5,x6是數(shù)學(xué)能力的三項(xiàng)不同的標(biāo)準(zhǔn)分。通過部分學(xué)生這六項(xiàng)考試成績,得到相關(guān)系數(shù)矩陣: 依此得出因子載荷矩陣:試求其因子載荷矩陣和特殊因子的協(xié)方差陣,并計(jì)算各變量的共同度及公共因子的方差貢獻(xiàn)率。解:
12、 容易驗(yàn)證滿足 因此A,D分別是因子載荷矩陣和特殊因子協(xié)方差陣。還可求出各變量的共同度,各變量對(duì)應(yīng)的特殊因子方差,各公共因子方差貢獻(xiàn)率以及兩個(gè)公共因子的累計(jì)方差貢獻(xiàn)。變量ai1ai2共同度特殊因子方差X1X2X3X4X5X60.2720.4090.4770.9260.8480.8430.2930.4390.513-0.1790.0310.1720.160.360.490.890.720.740.840.640.510.110.280.26方差貢獻(xiàn)率45.9%10.1%56%44%累計(jì)方差貢獻(xiàn)率45.9%56%通過前面研究及上例可以得出因子變量具有如下的特點(diǎn):1、因子變量的數(shù)量遠(yuǎn)少于原有指標(biāo)變量
13、的數(shù)量。2、因子變量是對(duì)原始變量的重新組構(gòu),能夠反映原有眾多指標(biāo)的絕大部分信息。3、因子變量之間沒有線性相關(guān)關(guān)系,對(duì)因子變量的分析能夠?yàn)檠芯抗ぷ魈峁┹^大的便利。4、因子變量具有命名解釋性。已知p維隨機(jī)向量 的n次觀測(cè)值矩陣第三節(jié) 因子載荷矩陣的求解 因子分析的目的就是用少數(shù)幾個(gè)公共因子來描述這p個(gè)變量間的協(xié)方差結(jié)構(gòu):上式中 為因子載荷矩陣 為p階對(duì)角矩陣。 由p個(gè)變量的觀測(cè)矩陣計(jì)算樣本協(xié)方差陣S,把它作為協(xié)方差陣的估計(jì),因此要建立實(shí)際問題的因子分析的具體模型,關(guān)鍵是根據(jù)樣本數(shù)據(jù)估計(jì)載荷矩陣A和特殊因子的方差 。常用的估計(jì)方法有很多,這里主要介紹主成分法和主因子法。1、主成分分析法根據(jù)線性代數(shù)知
14、識(shí),可分解為:上式的分解式恰是公共因子個(gè)數(shù)與變量個(gè)數(shù)一樣多,且特殊因子的方差為0時(shí),因子模型中協(xié)方差陣的結(jié)構(gòu)。 因?yàn)檫@時(shí)因子模型為: ,其中 ,所以 ,即 。由分解式可以看出,因子載荷陣A的第j列元素為 ,也就是說除常數(shù) 外,第j列因子載荷恰是第j個(gè)主成分的系數(shù)Uj,因此稱為主成分法。上面給出的表達(dá)式是精確的,但實(shí)際應(yīng)用時(shí)總是希望公共因子的個(gè)數(shù)小于變量的個(gè)數(shù),即mp,當(dāng)最后p-m個(gè)特征值較小時(shí),通常是略去最后個(gè)公共因子對(duì)的貢獻(xiàn),于是得到即上式假定了因子模型中特殊因子是不重要的,因而從的分解中忽略掉特殊因子的方差。如果考慮了特殊因子以后,協(xié)方差陣為當(dāng)未知時(shí),可用樣本協(xié)方差陣S代替,注意這時(shí)要對(duì)數(shù)
15、據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,處理后的S與相關(guān)陣R相同,仍然作上面的表示。 具體計(jì)算時(shí),一般取前m個(gè)特征值所對(duì)應(yīng)的因子載荷矩陣A的前m個(gè)列向量組成的矩陣作為因子載荷矩陣。確定公共因子的個(gè)數(shù)有兩種方法:一是根據(jù)具體問題的專業(yè)理論來確定,二是利用主成分分析中選取主成分個(gè)數(shù)的方法。二、主因子法主因子法的基本思想是使用多元相關(guān)系數(shù)的平方作為對(duì)公因子方差的初始估計(jì)。初始估計(jì)公因子方差時(shí)多元相關(guān)系數(shù)的平方置于對(duì)角線上。這些因子載荷用于估計(jì)新公因子方差,替換對(duì)角線上前一次的公因子方差估計(jì)。這樣的迭代持續(xù)到本次到下一次迭代結(jié)果公因子方差的變化滿足提取因子的收斂條件(解穩(wěn)定)。主因子法是對(duì)主成分法的一種修正,我們假設(shè)原始變
16、量經(jīng)過數(shù)據(jù)標(biāo)準(zhǔn)化變換。如果隨機(jī)向量X滿足因子模型,則有其中R為X的相關(guān)陣,令稱R*為約相關(guān)陣。這時(shí)R*中的對(duì)角線元素是共同度hi2,而不是1,非對(duì)角線元素和R中的元素完全相同,并且R*也是一個(gè)非負(fù)定矩陣。設(shè) 是特殊因子方差 的一個(gè)初始估計(jì)值,則約相關(guān)陣可估計(jì)為:其中 , 是hi2的初始估計(jì)值。又設(shè) 的前m個(gè)特征值依次為相應(yīng)的單位正交特征向量為則A的主因子解為由此我們可以重新估計(jì)特殊方差, 的最終估計(jì)值為在實(shí)際應(yīng)用中,特殊因子的方差i2和共同度hi2是未知的,以上得到的解是近似解。為了得到擬合程度更好的解,則可以使用迭代的方法,即利用上式中的 再作為特殊因子方差的初始估計(jì)值,重復(fù)上述步驟,直至得
17、到穩(wěn)定解為止。 因?yàn)樘厥庖蜃臃讲?,故求特殊因子方差i2的初始估計(jì)等價(jià)于求共同度hi2的初始估計(jì)。下面介紹共同度hi2常用的初始估計(jì)的幾種方法:1) hi2取為第i個(gè)變量與其它p-1個(gè)變量的多重相關(guān)系數(shù)的平方;2) hi2取為第i個(gè)變量與其它p-1個(gè)變量的多重相關(guān)系數(shù)絕對(duì)值的最大值,即;3)取hi2 =1,它等價(jià)于主成分解。主因子法的求解步驟為:1)給出共同度hi2的初步估計(jì)值 ; 2)求出約化相關(guān)陣。計(jì)算 ,再計(jì)算出3) 求出約化相關(guān)陣 的特征根和特征向量,得主因子解為4)求出 的估計(jì),用估計(jì)值代替第2)中的 。直到 , 的估計(jì)達(dá)到穩(wěn)定為止。 1、因子旋轉(zhuǎn)的概念因子分析的目標(biāo)之一就是要對(duì)提取
18、的抽象的實(shí)際含義進(jìn)行合理的解釋,進(jìn)行這種解釋通常需要一定的專業(yè)知識(shí)和經(jīng)驗(yàn),要對(duì)每個(gè)公共因子給出具有實(shí)際意義的一種名稱,用它來反映這個(gè)公共因子對(duì)每個(gè)原始變量的重要性(在數(shù)量上表現(xiàn)為相應(yīng)的載荷大?。?。有時(shí)直接根據(jù)特征根、特征向量求解的因子載荷難以看出公共因子的含義。公共因子的解釋帶有一定的主觀性,我們常常通過旋轉(zhuǎn)公共因子的方法來減少這種主觀性。 第四節(jié) 因子旋轉(zhuǎn) 例如可能有些變量在多個(gè)公共因子上都有較大的載荷,有些公共因子對(duì)許多許多變量的載荷也不小,說明它對(duì)多個(gè)變量都有較明顯的影響作用。這種因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也難對(duì)因子的實(shí)際背景進(jìn)行合理的解釋。這就需要通過某種方法
19、是每個(gè)變量僅在一個(gè)公共因子上有較大的載荷,而在其余的公共因子上的載荷比較小,至多達(dá)到中等大小。這時(shí)對(duì)于公共因子而言(載荷矩陣的每一列),它在部分變量上載荷較大,而在其它變量上載荷較小,使同一列上的載荷盡可能地靠近1或0,兩極分離。這時(shí)就突出了每個(gè)公共因子和其它較大的那些變量的聯(lián)系,該公共因子的含義也就可以通過這些載荷較大的變量做出合理的解釋與說明,這樣也顯示出該公共因子的主要性質(zhì)。 因子旋轉(zhuǎn)的目的就是使每個(gè)變量在盡可能少的因子上有比較高的載荷,讓某個(gè)變量在某個(gè)因子上的載荷趨于1,而在其他因子上的載荷趨于0;要求每一列上的載荷大部分為很小的值,每一列中只有少量的最好只有一個(gè)較大的載荷值;每兩列中
20、大載荷與小載荷的排列模式應(yīng)該不同。因子旋轉(zhuǎn)的方法有正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)兩類,這里我們重點(diǎn)介紹正交旋轉(zhuǎn)。對(duì)公共因子作正交旋轉(zhuǎn)相當(dāng)于對(duì)載荷矩陣A作一正交變換,右乘正交矩陣T,使AT能有更鮮明的實(shí)際意義。旋轉(zhuǎn)后的公共因子向量為 ,它的各個(gè)分量也是互不相關(guān)的公共因子,它的幾何意義是在m維空間上原因子軸作一旋轉(zhuǎn)。正交矩陣的不同選取方法構(gòu)成了正交旋轉(zhuǎn)T的各種不同方法,在這些方法中使用最普遍的是最大方差旋轉(zhuǎn)法,下面我們就介紹這種方法。令 則 的第j列元素平方的相對(duì)方差可定義為以上用 除以hi是為了消除公共因子對(duì)個(gè)原始變量的方差貢獻(xiàn)不同的影響,選擇除數(shù)hi是由于正交旋轉(zhuǎn)不改變共性方差( ),取d2ij是為了消除
21、dij符號(hào)不同的影響。所謂最大方差旋轉(zhuǎn)法就是選擇正交矩陣T,使得矩陣 所有個(gè)列元素平方的相對(duì)方差之和達(dá)到最大。2、兩公共因子的方差最大正交旋轉(zhuǎn)當(dāng)時(shí) 可求得的各列元素平方的相對(duì)方差之和。 顯然是旋轉(zhuǎn)角度的函數(shù),求旋轉(zhuǎn)角度使得達(dá)到最大。由微積分中求極值的方法,將對(duì)求導(dǎo),并令其等于零,可以得到。令得其中 分子符號(hào)分母符號(hào)4 取值范圍取值范圍0/20/8/2 /8 /4- -/2-/4 -/8-/2 0-/8 0 根據(jù)公式的分子、分母的符號(hào)來確定角的取值范圍。當(dāng)時(shí),我們可以逐次對(duì)每兩個(gè)公共因子進(jìn)行上述旋轉(zhuǎn)。對(duì)公共因子和進(jìn)行旋轉(zhuǎn),就是對(duì)的第列和列進(jìn)行正交變換,使這兩列元素平方的相對(duì)方差之和達(dá)到最大,而其
22、余各列不變,其正交變換矩陣為:3、多因子的方差最大正交旋轉(zhuǎn)由于有個(gè)公共因子,每次取2個(gè)因子進(jìn)行旋轉(zhuǎn),全部配對(duì)旋轉(zhuǎn)需要進(jìn)行次,全部旋轉(zhuǎn)完畢算一次循環(huán),并記第一輪旋轉(zhuǎn)后的因子載荷矩陣記為A(1)。如果循環(huán)完畢得出的因子載荷陣還沒達(dá)到目的,則可以繼續(xù)進(jìn)行第二輪配對(duì)旋轉(zhuǎn),新的因子載荷矩陣記為A(2)。 ,如此不斷重復(fù)旋轉(zhuǎn)循可得一系列因子載荷矩陣。A(1) ,A(2), ,A(s) 。 記V(s)為A(s)各列元素平方的相對(duì)方差之和。則得到V值的一個(gè)升序列: V(1)V(2) V(3) V(s) 這是一個(gè)有界的單調(diào)數(shù)列,因此一定會(huì)收斂到某一個(gè)極限。實(shí)際應(yīng)用中,經(jīng)過若干次旋轉(zhuǎn)之后,若相對(duì)方差改變不大,則停
23、止旋轉(zhuǎn)。在因子分析中我們通過樣本矩陣估計(jì)出了公共因子個(gè)數(shù)m、因子載荷矩陣A及特殊方差矩陣D,并試圖對(duì)公共因子 進(jìn)行合理的解釋,即給出具有實(shí)際意義的名稱。但有時(shí)要求把公共因子表示成變量的線性組合。第五節(jié) 因子得分因子分析的數(shù)學(xué)模型是將變量表示為公共因子的線性組合: Xi=ai1F1+ai2F2+aimFm i=1,2,p 由于公共因子能反映原始變量的相關(guān)關(guān)系,用公共因子代表原始變量時(shí)有時(shí)更有利于描述研究對(duì)象的特征,因而往往需要反過來將公共因子表示為變量的線性組合:即Fi=i1X1+ i2X2+ ipXp i=1,2,m 上式稱為因子得分函數(shù),用它來計(jì)算每個(gè)樣本的公共因子得分。 由于因子得分函數(shù)中
24、方程的個(gè)數(shù)m小于變量的個(gè)數(shù)p,因此不能精確計(jì)算出因子得分,只能對(duì)因子得分進(jìn)行估計(jì)。 估計(jì)因子得分的方法很多,下面我們介紹因子得分的幾種常用的方法:最小加權(quán)二乘法(巴特萊特因子得分)、回歸法等。 1、最小加權(quán)二乘因子得分法 把一個(gè)個(gè)體的p個(gè)變量的取值X當(dāng)作因變量,把求因子解中得到的A作為自變量數(shù)據(jù)陣,對(duì)于這個(gè)個(gè)體在公因子上的取值 F,當(dāng)作未知參數(shù),而特殊因子的取值看作誤差,于是得到如下的線性回歸模型: X=AF+ ,則稱未知參數(shù)F為取值X的因子得分。若將F和不相關(guān)的假設(shè)加強(qiáng)為相互獨(dú)立,則在F值已知的條件下,可得因子得分 的條件數(shù)學(xué)期望 因此,從條件意義上來說,加權(quán)最小二乘的因子得分 是無偏的。二
25、、回歸法因子得分 在最小二乘法意義下對(duì)因子得分函數(shù)進(jìn)行估計(jì),記建立的公共因子F對(duì)變量X滿足的回歸方程為:即 下面我們來估計(jì)上式中的回歸系數(shù) 。 因?yàn)橐蜃拥梅諪j的值是待估的,我們僅知道利用樣本值可得因子載荷矩陣A=(aij) 。由因子載荷矩陣的意義知:寫成矩陣的形式為:因此B的最小二乘估計(jì)為:把B的最小二乘估計(jì)代入回歸方程式,得因子得分的估計(jì)為:這就是回歸法估計(jì)因子得分的計(jì)算公式。也稱為湯姆森因子得分。7.6 變量間的相關(guān)性檢驗(yàn)由前面的分析,我們知道進(jìn)行因子分析的前提就是要保證觀測(cè)變量之間具體相關(guān)性。如果相關(guān)系數(shù)矩陣中大部分相關(guān)系數(shù)都小于0.3且未通過統(tǒng)計(jì)檢驗(yàn),那么這些變量就不適合做因子分析。
26、也就是說如果相關(guān)性較低,則它們不可能共享公共因子,只有相關(guān)性較高時(shí),才適合作因子分析。常用的相關(guān)性檢驗(yàn)方法有: 反映象相關(guān)矩陣檢驗(yàn)(Anti-image correlation matrix)、巴特利特球度檢驗(yàn)(Bartlett test of sphericity)、 KMO(Kaiser-Meyer-Olkin)。1)巴特利特球度檢驗(yàn) 巴特利特球度檢驗(yàn)是通過對(duì)相關(guān)系數(shù)矩陣的檢驗(yàn)來判定是否適合作因子分析。檢驗(yàn)假設(shè)H0:相關(guān)系數(shù)矩陣是一個(gè)單位陣 檢驗(yàn)的統(tǒng)計(jì)量根據(jù)相關(guān)系數(shù)矩陣的行列式計(jì)算得到。如果該統(tǒng)計(jì)量值比較大,使得巴特利特統(tǒng)計(jì)值的顯著性概率小于等于 ,則拒絕H0 ,認(rèn)為相關(guān)系數(shù)矩陣不太可能是
27、單位陣,適合作因子分析;反之,接受原假設(shè)H0 ,可以認(rèn)為相關(guān)系數(shù)矩陣可能是單位陣,不適合作因子分析。 2) 反映象相關(guān)矩陣檢驗(yàn) 反映象相關(guān)陣:將偏相關(guān)系數(shù)矩陣的每個(gè)元素取相反數(shù)(即乘以-1 );由于偏相關(guān)系數(shù)是在控制了其他變量對(duì)兩變量影響的條件下,計(jì)算出來的凈相關(guān)系數(shù),如果變量之間確實(shí)存在較強(qiáng)的相互重疊傳遞影響,即如果變量中確實(shí)能夠提取出公共因子,那么控制了這些影響后的偏相關(guān)系數(shù)必然很小,因此,如果反映象相關(guān)矩陣中的有關(guān)元素的絕對(duì)值比較大,則說明這些變量可能不適合作因子分析。 3)KMO檢驗(yàn)KMO統(tǒng)計(jì)量是用于比較變量間簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的一個(gè)指標(biāo),計(jì)算公式如下: 式中:rij是變量和變量
28、之間的簡單相關(guān)系數(shù);pij是它們之間的偏相關(guān)系數(shù)。KMO統(tǒng)計(jì)量的取值在0和1之間,KMO越接近于1,則越適合作因子分析。當(dāng)所有變量間的簡單相關(guān)系數(shù)平方和遠(yuǎn)遠(yuǎn)大于偏相關(guān)系數(shù)平方和時(shí),KMO值接近1。KMO值越接近于1,意味著變量間的相關(guān)性越強(qiáng),原有變量越適合作因子分析;當(dāng)所有變量間的簡單相關(guān)系數(shù)平方和接近0時(shí),KMO值接近0。KMO值越接近于0,意味著變量間的相關(guān)性越弱,原有變量越不適合作因子分析。 Kaiser給出了常用的KMO度量標(biāo)準(zhǔn):0.9以上表示非常適合;0.80.9表示很適合;0.70. 8表示適合;0. 60. 7表示一般;0. 50. 6不太適合;0.5以下表示極不適合。 得因子分
29、析求解的基本步驟:1)進(jìn)行變量之間的相關(guān)性檢驗(yàn),確認(rèn)待分析的這些變量是否適合作因子分析。然后將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;2)建立變量的相關(guān)系數(shù)矩陣R=(rij) 若作Q型因子分析,則建立樣品的相似系數(shù)矩陣Q;3、求相關(guān)系數(shù)矩陣R的特征值及相應(yīng)的單位正交特征向量 。并根據(jù)累計(jì)貢獻(xiàn)率的要求,使累計(jì)貢獻(xiàn)率達(dá)到80%90以上,取前m個(gè)特征值及相應(yīng)的特征向量,寫出因子載荷矩陣。4、對(duì)A施行最大正交旋轉(zhuǎn),并對(duì)公共因子進(jìn)行解釋; 5、計(jì)算因子得分。77 實(shí)例分析實(shí)例7.1:我國31個(gè)?。ㄊ小^(qū))2008年經(jīng)濟(jì)發(fā)展基本情況的7項(xiàng)指標(biāo),X1:地區(qū)生產(chǎn)總值;X2:居民消費(fèi)水平; X3:固定資產(chǎn)投資; X4:職工平均
30、工資; X5:居民消費(fèi)價(jià)格指數(shù); X6:商品零售價(jià)格指數(shù); X7:工業(yè)總產(chǎn)值進(jìn)行因子分析。具體數(shù)據(jù)如表7.3所示。地 區(qū)X1(億元)X2(元)X3(億元)X4(元)X5X6X7(億元) 北 京9353.32203463814.756328105.1104.410413.09 天 津5050.40140003389.841748105.4105.112503.25 河 北13709.5065708866.624756106.2106.723030.73 山 西5733.3561873531.225828107.2107.210023.87 內(nèi)蒙古6091.1281085475.426114105
31、.7104.78740.18 遼 寧11023.49962510019.127729104.6105.324769.09 吉 林5284.6975915038.923486105.1106.28406.85 黑龍江7065.0070393656.023046105.6105.87624.54 上 海12188.85273434823.156565105.8105.325120.92 江 蘇25741.151101315300.631667105.4104.967798.68 浙 江18780.44138939323.034146105.0106.340832.10 安 徽7364.186377
32、6747.026363106.2106.311162.16 福 建9249725702104.6105.715212.81 江 西5500.2557534745.421000106.0106.18499.58 山 東25965.91957315435.926404105.3104.962958.53 河 南15012.46587710490.624816107.0107.526028.41 湖 北9230.6874065647.022739106.3106.313454.94 湖 南9200.0071455534.024870106.0105.611553.31 廣
33、東31084.401439010868.733110105.6106.065424.61 廣 西5955.6561033756.425660107.8107.66071.98 海 南1223.286550705.421864106.9106.71103.07 重 慶4122.5198353979.626985105.6105.05755.90 四 川10505.3060727127.825038105.1105.314761.86 貴 州2741.9044261864.524602107.6107.23111.13 云 南4741.3145533435.924030105.7106.15144
34、.58 西 藏342.193504309.947280105.7103.948.19 陜 西5465.7962904614.425942106.4106.97480.79 甘 肅2702.4048691712.824017108.2107.93667.52 青 海783.615830583.230983110.1110.61103.10 寧 夏889.207193828.930719108.5108.51366.46 新 疆3523.1655422260.024687108.1108.54276.05解:首先對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后計(jì)算相關(guān)系數(shù)矩陣,具體的相關(guān)系數(shù)矩陣計(jì)算如表7.4所示。表7.4 相關(guān)系數(shù)矩陣 地區(qū)生產(chǎn)總值居民消費(fèi)水平固定資產(chǎn)投資職工平均工資居民消費(fèi)價(jià)格指數(shù)商品零售價(jià)格指數(shù)工業(yè)總 產(chǎn)值地區(qū)生產(chǎn)總值10.41260.91120.1045-0.4539-0.33070.9758居民消費(fèi)水平0.412610.23300.7664-0.3974-0.38980.3986固定資產(chǎn)投資0.91120.233
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 各地專升本數(shù)學(xué)試卷
- 廣東高中新課標(biāo)數(shù)學(xué)試卷
- 甘肅六年級(jí)數(shù)學(xué)試卷
- 冮蘇省七下數(shù)學(xué)試卷
- 2025年04月佳木斯市湯原縣鄉(xiāng)鎮(zhèn)衛(wèi)生院公開招聘醫(yī)學(xué)畢業(yè)生1人筆試歷年專業(yè)考點(diǎn)(難、易錯(cuò)點(diǎn))附帶答案詳解
- 2025年浙江醫(yī)療衛(wèi)生招聘溫州醫(yī)科大學(xué)附屬第二醫(yī)院招聘心理測(cè)評(píng)室技師2人筆試歷年專業(yè)考點(diǎn)(難、易錯(cuò)點(diǎn))附帶答案詳解
- 2025至2030城市商業(yè)銀行行業(yè)發(fā)展趨勢(shì)分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- 四川甘孜州遴選公務(wù)員考試真題2024
- 光谷八下數(shù)學(xué)試卷
- 分享一次數(shù)學(xué)試卷
- 嚴(yán)格標(biāo)準(zhǔn)物質(zhì)管理制度
- 體育課期末課程總結(jié)匯報(bào)
- 論語十二章 導(dǎo)學(xué)案 統(tǒng)編版高中語文選擇性必修上冊(cè)
- 新生兒呼吸機(jī)相關(guān)性肺炎的防控
- 兒童籃球教學(xué)課件視頻
- 道路運(yùn)輸行業(yè)員工安全考試試卷及答案
- 注塑公司規(guī)章管理制度
- 應(yīng)急救援技術(shù)專業(yè)教學(xué)標(biāo)準(zhǔn)(中等職業(yè)教育)2025修訂
- 河南交通投資集團(tuán)有限公司招聘筆試真題2024
- 呼吸康復(fù)講課
- 互聯(lián)網(wǎng)女皇AI報(bào)告:人工智能趨勢(shì)報(bào)告(雙語翻譯版本)
評(píng)論
0/150
提交評(píng)論