主成份分析因子分析_第1頁
主成份分析因子分析_第2頁
主成份分析因子分析_第3頁
主成份分析因子分析_第4頁
主成份分析因子分析_第5頁
已閱讀5頁,還剩100頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

關(guān)于主成份分析因子分析zf第1頁,講稿共105頁,2023年5月2日,星期三zf2因子分析的重點(diǎn)1、什么是因子分析?2、理解因子分析的基本思想3、因子分析的數(shù)學(xué)模型以及模型中公共因子、因子載荷變量共同度的統(tǒng)計(jì)意義4、因子旋轉(zhuǎn)的意義5、結(jié)合SPSS軟件進(jìn)行案例分析第2頁,講稿共105頁,2023年5月2日,星期三zf36.1因子分析的基本理論1、什么是因子分析?

因子分析是主成分分析的推廣,也是利用降維的思想,由研究原始變量相關(guān)矩陣或協(xié)方差矩陣的內(nèi)部依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的多個(gè)變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多元統(tǒng)計(jì)分析方法。2、因子分析的基本思想:把每個(gè)研究變量分解為幾個(gè)影響因素變量,將每個(gè)原始變量分解成兩部分因素,一部分是由所有變量共同具有的少數(shù)幾個(gè)公共因子組成的,另一部分是每個(gè)變量獨(dú)自具有的因素,即特殊因子。第3頁,講稿共105頁,2023年5月2日,星期三zf43、因子分析的目的:因子分析的目的之一,簡化變量維數(shù)。即要使因素結(jié)構(gòu)簡單化,希望以最少的共同因素(公共因子),能對總變異量作最大的解釋,因而抽取得因子愈少愈好,但抽取因子的累積解釋的變異量愈大愈好。在因子分析的公共因子抽取中,應(yīng)最先抽取特征值最大的公共因子,其次是次大者,最后抽取公共因子的特征值最小通常會(huì)接近0。第4頁,講稿共105頁,2023年5月2日,星期三zf5例:在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過一個(gè)有24個(gè)指標(biāo)構(gòu)成的評價(jià)體系,評價(jià)百貨商場的24個(gè)方面的優(yōu)劣。但消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在的因子,對商店進(jìn)行綜合評價(jià)。而這三個(gè)公共因子可以表示為:稱是不可觀測的潛在因子,稱為公共因子。24個(gè)變量共享這三個(gè)因子,但是每個(gè)變量又有自己的個(gè)性,不被包含的部分,稱為特殊因子。第5頁,講稿共105頁,2023年5月2日,星期三zf64、主成分分析分析與因子分析的聯(lián)系和差異:

聯(lián)系:(1)因子分析是主成分分析的推廣,是主成分分析的逆問題。(2)二者都是以‘降維’為目的,都是從協(xié)方差矩陣或相關(guān)系數(shù)矩陣出發(fā)。

區(qū)別:(1)主成分分析模型是原始變量的線性組合,是將原始變量加以綜合、歸納,僅僅是變量變換;而因子分析是將原始變量加以分解,描述原始變量協(xié)方差矩陣結(jié)構(gòu)的模型;只有當(dāng)提取的公因子個(gè)數(shù)等于原始變量個(gè)數(shù)時(shí),因子分析才對應(yīng)變量變換。(2)主成分分析,中每個(gè)主成分對應(yīng)的系數(shù)是唯一確定的;因子分析中每個(gè)因子的相應(yīng)系數(shù)即因子載荷不是唯一的。(3)因子分析中因子載荷的不唯一性有利于對公因子進(jìn)行有效解釋;而主成分分析對提取的主成分的解釋能力有限。第6頁,講稿共105頁,2023年5月2日,星期三zf75、因子分析模型:

設(shè)個(gè)變量,如果表示為第7頁,講稿共105頁,2023年5月2日,星期三zf8(1)(2)

稱為公共因子,是不可觀測的變量,他們的系數(shù)稱為因子載荷。是特殊因子,是不能被前m個(gè)公共因子包含的部分。其中:相互獨(dú)立即不相關(guān);即互不相關(guān),方差為1。第8頁,講稿共105頁,2023年5月2日,星期三zf9(3)即互不相關(guān),方差不一定相等,。滿足以上條件的,稱為正交因子模型.如果(2)不成立,即各公共因子之間不獨(dú)立,則因子分析模型為斜交因子模型.第9頁,講稿共105頁,2023年5月2日,星期三zf10

公因子F1公因子F2共同度hi特殊因子δix1=代數(shù)10.8960.3410.9190.081x2=代數(shù)20.8020.4960.8890.111x3=幾何0.5160.8550.9970.003x4=三角0.8410.4440.9040.096x5=解析幾何0.8330.4340.8820.118特征值G3.1131.4794.9590.409方差貢獻(xiàn)率(變異量)62.26%29.58%91.85%因子分析案例F1體現(xiàn)邏輯思維和運(yùn)算能力,F(xiàn)2體現(xiàn)空間思維和推理能力第10頁,講稿共105頁,2023年5月2日,星期三zf116、因子分析模型中的幾個(gè)重要統(tǒng)計(jì)量的意義:(1)因子負(fù)荷量(或稱因子載荷)----是指因子結(jié)構(gòu)中原始變量與因子分析時(shí)抽取出的公共因子的相關(guān)程度。第11頁,講稿共105頁,2023年5月2日,星期三zf12在各公共因子不相關(guān)的前提下,(載荷矩陣中第i行,第j列的元素)是隨機(jī)變量xi*與公共因子Fj的相關(guān)系數(shù),表示xi*依賴于Fj的程度。反映了第i個(gè)原始變量在第j個(gè)公共因子上的相對重要性。因此絕對值越大,則公共因子Fj與原有變量xi的關(guān)系越強(qiáng)。第12頁,講稿共105頁,2023年5月2日,星期三zf13(2)共同度----又稱共性方差或公因子方差(community或commonvariance)就是變量與每個(gè)公共因子之負(fù)荷量的平方總和(一行中所有因素負(fù)荷量的平方和)。變量的共同度是因子載荷矩陣的第i行的元素的平方和。記為

從共同性的大小可以判斷這個(gè)原始實(shí)測變量與公共因子間之關(guān)系程度。如因子分析案例中共同度h12=(0.896)平方+(0.341)平方=0.919特殊因子方差(剩余方差)----各變量的特殊因素影響大小就是1減掉該變量共同度的值。如=1-0.919=0.081第13頁,講稿共105頁,2023年5月2日,星期三zf14統(tǒng)計(jì)意義:兩邊求方差

所有的公共因子和特殊因子對變量的貢獻(xiàn)為1。hi2反映了全部公共因子對變量Xi*的影響,是全部公共因子對變量方差所做出的貢獻(xiàn),或者說Xi*對公共因子的共同依賴程度,稱為公共因子對變量Xi*的方差貢獻(xiàn)。

Hi2接近于1,表明該變量的原始信息幾乎都被選取的公共因子說明了。特殊因子的方差,反映了原有變量方差中無法被公共因子描述的比例。第14頁,講稿共105頁,2023年5月2日,星期三zf15(3)特征值----是第j個(gè)公共因子Fj對于X*的每一分量Xi*所提供的方差的總和。又稱第j個(gè)公共因子的方差貢獻(xiàn)。即每個(gè)變量與某一共同因素之因素負(fù)荷量的平方總和(因子載荷矩陣中某一公共因子列所有因子負(fù)荷量的平方和)。如因子分析案例中F1的特征值G=(0.896)平方+(0.802)平方+(0.516)平方+(0.841)平方+(0.833)平方=3.113(4)方差貢獻(xiàn)率----指公共因子對實(shí)測變量的貢獻(xiàn),又稱變異量方差貢獻(xiàn)率=特征值G/實(shí)測變量數(shù)p,是衡量公共因子相對重要性的指標(biāo),Gi越大,表明公共因子Fj對X*的貢獻(xiàn)越大,該因子的重要程度越高如因子分析案例中F1的貢獻(xiàn)率為3.113/5=62.26%第15頁,講稿共105頁,2023年5月2日,星期三zf166.2因子的基本內(nèi)容1、因子分析的基本步驟:(1)因子分析的前提條件鑒定考察原始變量之間是否存在較強(qiáng)的相關(guān)關(guān)系,是否適合進(jìn)行因子分析。因?yàn)椋阂蜃臃治龅闹饕蝿?wù)之一就是對原有變量中信息重疊的部分提取和綜合成因子,最終實(shí)現(xiàn)減少變量個(gè)數(shù)的目的。所以要求原有變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。否則,如果原有變量相互獨(dú)立,不存在信息重疊,也就無需進(jìn)行綜合和因子分析。(2)因子提取

研究如何在樣本數(shù)據(jù)的基礎(chǔ)上提取綜合因子。第16頁,講稿共105頁,2023年5月2日,星期三zf17(3)因子旋轉(zhuǎn)

通過正交旋轉(zhuǎn)或斜交旋轉(zhuǎn)使提取出的因子具有可解釋性。(4)計(jì)算因子得分

通過各種方法求解各樣本在各因子上的得分,為進(jìn)一步分析奠定基礎(chǔ)。第17頁,講稿共105頁,2023年5月2日,星期三zf182、因子分析前提條件——相關(guān)性分析:分析方法主要有:(1)計(jì)算相關(guān)系數(shù)矩陣(correlationcoefficientsmatrix)如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)值均小于0.3,即各變量間大多為弱相關(guān),原則上這些變量不適合進(jìn)行因子分析。(2)計(jì)算反映象相關(guān)矩陣(Anti-imagecorrelationmatrix)第18頁,講稿共105頁,2023年5月2日,星期三zf19

反映象相關(guān)矩陣,如果其主對角線外的元素大多絕對值較小,對角線上的元素值較接近1,則說明這些變量的相關(guān)性較強(qiáng),適合進(jìn)行因子分析。其中主對角線上的元素為某變量的MSA(MeasureofSampleAdequacy):

是變量和變量()間的簡單相關(guān)系數(shù),是變量和變量()在控制了其他變量影響下的偏相關(guān)系數(shù),即凈相關(guān)系數(shù)。取值在0和1之間,越接近1,意味著變量與其他變量間的相關(guān)性越強(qiáng),越接近0則相關(guān)性越弱。第19頁,講稿共105頁,2023年5月2日,星期三zf20(3)巴特利特球度檢驗(yàn)(Bartletttestofsphericity)

該檢驗(yàn)以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn),其零假設(shè)H0是:相關(guān)系數(shù)矩陣為單位矩陣,即相關(guān)系數(shù)矩陣主對角元素均為1,非主對角元素均為0。(即原始變量之間無相關(guān)關(guān)系)。

依據(jù)相關(guān)系數(shù)矩陣的行列式計(jì)算可得其近似服從卡方分布。如果統(tǒng)計(jì)量卡方值較大且對應(yīng)的sig值小于給定的顯著性水平a時(shí),零假設(shè)不成立。即說明相關(guān)系數(shù)矩陣不太可能是單位矩陣,變量之間存在相關(guān)關(guān)系,適合做因子分析。第20頁,講稿共105頁,2023年5月2日,星期三zf21(4)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)

KMO檢驗(yàn)的統(tǒng)計(jì)量是用于比較變量間簡單相關(guān)系數(shù)矩陣和偏相關(guān)系數(shù)的指標(biāo),數(shù)學(xué)定義為:

KMO與MSA區(qū)別是它將相關(guān)系數(shù)矩陣中的所有元素都加入到了平方和計(jì)算中。KMO值越接近1,意味著變量間的相關(guān)性越強(qiáng),原有變量適合做因子分析;越接近0,意味變量間的相關(guān)性越弱,越不適合作因子分析。Kaiser給出的KMO度量標(biāo)準(zhǔn):0.9以上非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合;0.5以下表示極不適合。第21頁,講稿共105頁,2023年5月2日,星期三zf223、因子提取和因子載荷矩陣的求解:因子載荷矩陣求解的方法:

(1)基于主成分模型的主成分分析法(2)基于因子分析模型的主軸因子法(3)極大似然法(4)最小二乘法(5)a因子提取法(6)映象分析法第22頁,講稿共105頁,2023年5月2日,星期三zf23(1)基于主成分模型的主成分分析法Principalcomponents

設(shè)隨機(jī)向量的均值為,協(xié)方差為,為的特征根,為對應(yīng)的標(biāo)準(zhǔn)化特征向量,則第23頁,講稿共105頁,2023年5月2日,星期三zf24上式給出的表達(dá)式是精確的,然而,它實(shí)際上是毫無價(jià)值的,因?yàn)槲覀兊哪康氖菍で笥蒙贁?shù)幾個(gè)公共因子解釋,故略去后面的p-m項(xiàng)的貢獻(xiàn),有:第24頁,講稿共105頁,2023年5月2日,星期三zf25上式有一個(gè)假定,模型中的特殊因子是不重要的,因而從的分解中忽略了特殊因子的方差。第25頁,講稿共105頁,2023年5月2日,星期三zf26

例:

假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型。第26頁,講稿共105頁,2023年5月2日,星期三zf27(1)求解特征根(2)求解特征向量:(3)因子載荷矩陣:第27頁,講稿共105頁,2023年5月2日,星期三zf28(4)因子分析模型:

可取前兩個(gè)因子F1和F2為公共因子,第一公因子F1物價(jià)就業(yè)因子,對X的貢獻(xiàn)為1.55。第一公因子F2為投資因子,對X的貢獻(xiàn)為0.85。共同度分別為1,0.706,0.706。第28頁,講稿共105頁,2023年5月2日,星期三zf29(2)基于因子分析模型的主軸因子法Principalaxisfactoring

是對主成分方法的修正,假定我們首先對變量進(jìn)行標(biāo)準(zhǔn)化變換。則

R=AA’+DR*=AA’=R-D稱R*為約相關(guān)矩陣,R*對角線上的元素是,而不是1。第29頁,講稿共105頁,2023年5月2日,星期三zf30直接求R*的前p個(gè)特征根和對應(yīng)的正交特征向量。得如下的矩陣:第30頁,講稿共105頁,2023年5月2日,星期三zf31當(dāng)特殊因子的方差已知:第31頁,講稿共105頁,2023年5月2日,星期三zf32方差矩陣未知,估計(jì)的方法有如下幾種:

1)取,在這個(gè)情況下主因子解與主成分解等價(jià);2)取,為xi與其他所有的原始變量xj的復(fù)相關(guān)系數(shù)的平方,即xi對其余的p-1個(gè)xj的回歸方程的判定系數(shù),這是因?yàn)閤i

與公共因子的關(guān)系是通過其余的p-1個(gè)xj

的線性組合聯(lián)系起來的;

3)取,這意味著取xi與其余的xj的簡單相關(guān)系數(shù)的絕對值最大者;第32頁,講稿共105頁,2023年5月2日,星期三zf33

4)取,其中要求該值為正數(shù)。5)取,其中是的對角元素。第33頁,講稿共105頁,2023年5月2日,星期三zf34

例:假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主因子分析法求因子分析模型。假定用代替初始的。。第34頁,講稿共105頁,2023年5月2日,星期三zf35(1)求解特征根:(2)對應(yīng)的非0特征向量:(3)因子載荷矩陣表:第35頁,講稿共105頁,2023年5月2日,星期三zf36(4)因子分析模型:(5)新的共同度:第36頁,講稿共105頁,2023年5月2日,星期三zf374、因子旋轉(zhuǎn):為什么要旋轉(zhuǎn)因子?建立了因子分析數(shù)學(xué)目的不僅僅要找出公共因子以及對變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析,如果每個(gè)公共因子的含義不清,則不便于進(jìn)行實(shí)際背景的解釋。由于因子載荷陣是不惟一的,所以應(yīng)該對因子載荷陣進(jìn)行旋轉(zhuǎn)。目的是使每個(gè)變量在盡可能少的因子上有比較高的載荷,讓某個(gè)變量在某個(gè)因子上的載荷趨于1,而在其他因子上的載荷趨于0。即:使載荷矩陣每列或行的元素平方值向0和1兩極分化。第37頁,講稿共105頁,2023年5月2日,星期三zf38奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目得分?jǐn)?shù)據(jù)的因子分析

百米跑成績跳遠(yuǎn)成績鉛球成績跳高成績400米跑成績百米跨欄鐵餅成績撐桿跳遠(yuǎn)成績標(biāo)槍成績1500米跑成績第38頁,講稿共105頁,2023年5月2日,星期三zf39第39頁,講稿共105頁,2023年5月2日,星期三zf40因

因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運(yùn)動(dòng)因子。其他的3個(gè)因子不太容易解釋。似乎是跑和投擲的能力對比,似乎是長跑耐力和短跑速度的對比。于是考慮旋轉(zhuǎn)因子,得下表第40頁,講稿共105頁,2023年5月2日,星期三zf41旋轉(zhuǎn)變幻后因子載荷矩陣第41頁,講稿共105頁,2023年5月2日,星期三zf42通過旋轉(zhuǎn),因子有了較為明確的含義。百米跑,跳遠(yuǎn)和400米跑,需要爆發(fā)力的項(xiàng)目在有較大的載荷,可以稱為短跑速度因子;鉛球,鐵餅和標(biāo)槍在上有較大的載荷,可以稱為爆發(fā)性臂力因子;百米跨欄,撐桿跳遠(yuǎn),跳遠(yuǎn)和為跳高在上有較大的載荷,爆發(fā)腿力因子;長跑耐力因子。第42頁,講稿共105頁,2023年5月2日,星期三zf43旋轉(zhuǎn)的方法有:(1)正交旋轉(zhuǎn);(2)斜交旋轉(zhuǎn)(1)正交旋轉(zhuǎn)

由初始載荷矩陣A左乘一正交矩陣得到;目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠(yuǎn)離0;只是在旋轉(zhuǎn)后的新的公因子仍保持獨(dú)立性。主要有以下方法:varimax:方差最大旋轉(zhuǎn)。簡化對因子的解釋quartmax:四次最大正交旋轉(zhuǎn)。簡化對變量的解釋equamax:等量正交旋轉(zhuǎn)第43頁,講稿共105頁,2023年5月2日,星期三zf44A、方差最大法

方差最大法從簡化因子載荷矩陣的每一列出發(fā),使和每個(gè)因子有關(guān)的載荷的平方的方差最大。當(dāng)只有少數(shù)幾個(gè)變量在某個(gè)因子上有較高的載荷時(shí),對因子的解釋最簡單。方差最大的直觀意義是希望通過因子旋轉(zhuǎn)后,使每個(gè)因子上的載荷盡量拉開距離,一部分的載荷趨于1,另一部分趨于0。第44頁,講稿共105頁,2023年5月2日,星期三zf45B、四次方最大旋轉(zhuǎn)

四次方最大旋轉(zhuǎn)是從簡化載荷矩陣的行出發(fā),通過旋轉(zhuǎn)初始因子,使每個(gè)變量只在一個(gè)因子上有較高的載荷,而在其它的因子上盡可能低的載荷。如果每個(gè)變量只在一個(gè)因子上有非零的載荷,這時(shí)的因子解釋是最簡單的。四次方最大法通過使因子載荷矩陣中每一行的因子載荷平方的方差達(dá)到最大。第45頁,講稿共105頁,2023年5月2日,星期三zf46C、等量最大法

等量最大法把四次方最大法和方差最大法結(jié)合起來求行和列因子載荷平方的方差的加權(quán)平均最大。第46頁,講稿共105頁,2023年5月2日,星期三zf47(2)斜交旋轉(zhuǎn)

目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠(yuǎn)離0;只是在旋轉(zhuǎn)時(shí),放棄了因子之間彼此獨(dú)立的限制,旋轉(zhuǎn)后的新公因子更容易解釋。主要有以下的方法:directoblimin:直接斜交旋轉(zhuǎn)。允許因子之間具有相關(guān)性;promax:斜交旋轉(zhuǎn)方法。允許因子之間具有相關(guān)性;第47頁,講稿共105頁,2023年5月2日,星期三zf485、因子得分因子得分的概念

前面我們主要解決了用公共因子的線性組合來表示一組觀測變量的有關(guān)問題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來做回歸分析,對樣本進(jìn)行分類或評價(jià),這就需要我們對公共因子進(jìn)行測度,即給出公共因子的值。第48頁,講稿共105頁,2023年5月2日,星期三zf49例:人均要素變量因子分析。對我國32個(gè)省市自治區(qū)的要素狀況作因子分析。指標(biāo)體系中有如下指標(biāo):X1:人口(萬人)X2:面積(萬平方公里)X3:GDP(億元)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)X6:萬人擁有的大學(xué)生數(shù)(人)X7:萬人擁有科學(xué)家、工程師數(shù)(人)

RotatedFactorPatternFACTOR1FACTOR2FACTOR3X1-0.21522-0.273970.89092X20.63973-0.28739-0.28755X3-0.157910.063340.94855X40.95898-0.01501-0.07556X50.97224-0.06778-0.17535X6-0.114160.98328-0.08300X7-0.110410.97851-0.07246第49頁,講稿共105頁,2023年5月2日,星期三zf50X1=-0.21522F1-0.27397F2+0.89092F3X2=0.63973F1-0.28739F2-0.28755F3X3=-0.15791F1+0.06334F2+0.94855F3X4=0.95898F1-0.01501F2-0.07556F3X5=0.97224F1-0.06778F2-0.17535F3X6=-0.11416F1+0.98328F2-0.08300F3X7=-0.11041F1+0.97851F2-0.07246F3第50頁,講稿共105頁,2023年5月2日,星期三zf51

高載荷指標(biāo)

因子命名

因子1X2;面積(萬平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子

因子2X6:萬人擁有的大學(xué)生數(shù)(人)X7:萬人擁有的科學(xué)家、工程師數(shù)(人)

人力資源因子

因子3

X1;人口(萬人)X3:GDP(億元)經(jīng)濟(jì)發(fā)展總量因子

第51頁,講稿共105頁,2023年5月2日,星期三zf52StandardizedScoringCoefficients

FACTOR1

FACTOR2

FACTOR3X10.05764

-0.06098

0.50391X20.22724

-0.09901

-0.07713X30.14635

0.12957

0.59715X40.47920

0.11228

0.17062X50.45583

0.07419

0.10129X60.05416

0.48629

0.04099X70.05790

0.48562

0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7第52頁,講稿共105頁,2023年5月2日,星期三zf53

前三個(gè)因子得分REGION

FACTOR1FACTOR2FACTOR3beijing?-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259第53頁,講稿共105頁,2023年5月2日,星期三zf54因子分析的數(shù)學(xué)模型為:原變量被表示為公共因子的線性組合,當(dāng)載荷矩陣旋轉(zhuǎn)之后,公共因子可以做出解釋,通常的情況下,我們還想反過來把公共因子表示為原變量的線性組合。因子得分函數(shù):第54頁,講稿共105頁,2023年5月2日,星期三zf55可見,要求得每個(gè)因子的得分,必須求得分函數(shù)的系數(shù),而由于p>m,所以不能得到精確的得分,只能通過估計(jì)。因子得分的計(jì)算方法:(1)運(yùn)用回歸分析思想求解(2)Bartlett(3)Anderson-rubin第55頁,講稿共105頁,2023年5月2日,星期三zf56(1)運(yùn)用回歸分析思想求解第56頁,講稿共105頁,2023年5月2日,星期三zf57則,我們有如下的方程組:第57頁,講稿共105頁,2023年5月2日,星期三zf58j=1,2,…,m第58頁,講稿共105頁,2023年5月2日,星期三zf59

注:共需要解m次才能解出所有的得分函數(shù)的系數(shù)。第59頁,講稿共105頁,2023年5月2日,星期三zf60(2)Bartlett法(即:加權(quán)最小二乘法)把一個(gè)個(gè)體的p個(gè)變量的取值X*當(dāng)作因變量,把求因子解中得到的A作為自變量數(shù)據(jù)陣,對于這個(gè)個(gè)體在公因子上的取值f,當(dāng)作未知參數(shù),而特殊因子的取值看作誤差e,于是得到如下的線性回歸模型:x*=Af+e,則稱未知參數(shù)f為取值為X*的因子得分。

最小二乘法第60頁,講稿共105頁,2023年5月2日,星期三zf61(3)Anderson-rubin(略)第61頁,講稿共105頁,2023年5月2日,星期三zf62案例分析:國民生活質(zhì)量的因素分析

國家發(fā)展的最終目標(biāo),是為了全面提高全體國民的生活質(zhì)量,滿足廣大國民日益增長的物質(zhì)和文化的合理需求。在可持續(xù)發(fā)展消費(fèi)的統(tǒng)一理念下,增加社會(huì)財(cái)富,創(chuàng)造更多的物質(zhì)文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進(jìn)化的基礎(chǔ)上,維系人類與自然的平衡,達(dá)到完整的代際公平和區(qū)際公平(即時(shí)間過程的最大合理性與空間分布的最大合理化)。從1990年開始,聯(lián)合國開發(fā)計(jì)劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標(biāo)對于國民生活質(zhì)量進(jìn)行測度。人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標(biāo)組合,即人的健康狀況(使用出生時(shí)的人均預(yù)期壽命表達(dá))、人的智力程度(使用組合的教育成就表達(dá))、人的福利水平(使用人均國民收入或人均GDP表達(dá)),并且特別強(qiáng)調(diào)三類指標(biāo)組合的整體表達(dá)內(nèi)涵,去衡量一個(gè)國家或地區(qū)的社會(huì)發(fā)展總體狀況以及國民生活質(zhì)量的總水平。第62頁,講稿共105頁,2023年5月2日,星期三zf63在這個(gè)指標(biāo)體系中有如下的指標(biāo):X1——預(yù)期壽命X2——成人識字率X3——綜合入學(xué)率X4——人均GDP(美圓)X5——預(yù)期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù)第63頁,講稿共105頁,2023年5月2日,星期三zf64旋轉(zhuǎn)后的因子結(jié)構(gòu)

RotatedFactorPatternFACTOR1FACTOR2FACTOR3X10.381290.417650.81714X20.121660.848280.45981X30.648030.618220.22398X40.904100.205310.34100X50.388540.432950.80848X60.282070.853250.43289X70.900910.206120.35052

FACTOR1為經(jīng)濟(jì)發(fā)展因子

FACTOR2為教育成就因子

FACTOR3為健康水平因子第64頁,講稿共105頁,2023年5月2日,星期三zf65被每個(gè)因子解釋的方差和共同度:

VarianceexplainedbyeachfactorFACTOR1FACTOR2FACTOR32.4397002.2763172.009490FinalCommunalityEstimates:Total=6.725507X1X2X3X4X50.9875300.9457960.8523060.9758300.992050X6X70.9949950.976999

第65頁,講稿共105頁,2023年5月2日,星期三zf66StandardizedScoringCoefficients標(biāo)準(zhǔn)化得分系數(shù)

FACTOR1FACTOR2FACTOR3X1-0.18875-0.343970.85077X2-0.241090.60335-0.10234X30.354620.50232-0.59895X40.53990-0.17336-0.10355X5-0.17918-0.316040.81490X6-0.092300.62258-0.24876第66頁,講稿共105頁,2023年5月2日,星期三zf67

生育率的影響因素分析

生育率受社會(huì)、經(jīng)濟(jì)、文化、計(jì)劃生育政策等很多因素影響,但這些因素對生育率的影響并不是完全獨(dú)立的,而是交織在一起,如果直接用選定的變量對生育率進(jìn)行多元回歸分析,最終結(jié)果往往只能保留兩三個(gè)變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對生育率進(jìn)行分析。選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國民收入。下表是1990年中國30個(gè)省、自治區(qū)、直轄市的數(shù)據(jù)。第67頁,講稿共105頁,2023年5月2日,星期三zf68第68頁,講稿共105頁,2023年5月2日,星期三zf69特征根與各因子的貢獻(xiàn)EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201

1.0000第69頁,講稿共105頁,2023年5月2日,星期三zf70沒有旋轉(zhuǎn)的因子結(jié)構(gòu)

Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962第70頁,講稿共105頁,2023年5月2日,星期三zf71各旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.93006369Factor1可解釋方差Factor2可解釋方差2.99754292.1642615第71頁,講稿共105頁,2023年5月2日,星期三zf72

在這個(gè)例子中我們得到了兩個(gè)因子,第一個(gè)因子是社會(huì)經(jīng)濟(jì)發(fā)展水平因子,第二個(gè)是計(jì)劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進(jìn)行其他的統(tǒng)計(jì)分析。

Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728

Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu)標(biāo)準(zhǔn)化得分函數(shù)第72頁,講稿共105頁,2023年5月2日,星期三zf736.3因子分析的上機(jī)操作問題題項(xiàng)從未使用很少使用有時(shí)使用經(jīng)常使用總是使用12345A1電腦A2錄音磁帶A3錄像帶A4網(wǎng)上資料A5校園網(wǎng)或因特網(wǎng)A6電子郵件A7電子討論網(wǎng)A8CAI課件A9視頻會(huì)議A10視聽會(huì)議第73頁,講稿共105頁,2023年5月2日,星期三zf74題目編號A1A2A3A4A5A6A7A8A9A10011551111111022552221211034333431411044344442422054433441411064333342321074444332411081531111111094454442411105435543533115434442522125454443522133552221311145343332522154553332522164444351411175445554544185442341511195455553533205445552521第74頁,講稿共105頁,2023年5月2日,星期三zf75(01)建立數(shù)據(jù)文件第75頁,講稿共105頁,2023年5月2日,星期三zf76(02)選擇分析變量

——選SPSS[Analyze]菜單中的(DataReduction)→(Factor),出現(xiàn)【

FactorAnalysis】對話框;——在【

FactorAnalysis】對話框中左邊的原始變量中,選擇將進(jìn)行因子分析的變量選入(Variables)欄。第76頁,講稿共105頁,2023年5月2日,星期三zf77(03)設(shè)置描述性統(tǒng)計(jì)量——在【

FactorAnalysis】框中選【

Descriptives】按鈕,出現(xiàn)【Descriptives】對話框;——選擇Initialsolution(未轉(zhuǎn)軸的統(tǒng)計(jì)量)選項(xiàng)——選擇KMO選項(xiàng)——點(diǎn)擊(Contiue)按鈕確定。第77頁,講稿共105頁,2023年5月2日,星期三zf78第78頁,講稿共105頁,2023年5月2日,星期三zf79(04)設(shè)置對因子的抽取選項(xiàng)

——在【

FactorAnalysis】框中點(diǎn)擊【Extraction】按鈕,出現(xiàn)【FactorAnalysis:Extraction】對話框;——在Method欄中選擇(Principalcomponents)選項(xiàng);——在Analyze欄中選擇Correlationmatrix選項(xiàng);——在Display欄中選擇Unrotatedfactorsolution選項(xiàng);——在Extract欄中選擇Eigenvaluesover并填上1;——點(diǎn)擊(Contiue)按鈕確定,回到【

FactorAnalysis】對話框中。第79頁,講稿共105頁,2023年5月2日,星期三zf80第80頁,講稿共105頁,2023年5月2日,星期三zf81第81頁,講稿共105頁,2023年5月2日,星期三zf82(05)設(shè)置因子轉(zhuǎn)軸——在【

FactorAnalysis】對話框中,點(diǎn)擊【Rotation】按鈕,出現(xiàn)【

FactorAnalysis:Rotation】(因子分析:旋轉(zhuǎn))對話框?!贛ethod欄中選擇Varimax(最大變異法)——在Display欄中選擇Rotatedsolution(轉(zhuǎn)軸后的解)——點(diǎn)擊(Contiue)按鈕確定,回到【

FactorAnalysis】對話框中。第82頁,講稿共105頁,2023年5月2日,星期三zf83第83頁,講稿共105頁,2023年5月2日,星期三zf84(06)設(shè)置因素分?jǐn)?shù)——在【

FactorAnalysis】對話框中,點(diǎn)擊【Scores】按鈕,出現(xiàn)【

FactorAnalysis:Scores】(因素分析:分?jǐn)?shù))對話框。

——一般取默認(rèn)值?!c(diǎn)擊(Contiue)按鈕確定,回到【

FactorAnalysis】對話框。第84頁,講稿共105頁,2023年5月2日,星期三zf85第85頁,講稿共105頁,2023年5月2日,星期三zf86(07)設(shè)置因子分析的選項(xiàng)——在【

FactorAnalysis】對話框中,單擊【Options】按鈕,出現(xiàn)【

FactorAnalysis:Options】(因素分析:選項(xiàng))對話框?!贛issingValues欄中選擇Excludecaseslistwise(完全排除缺失值)——在CoefficientDisplayFormat(系數(shù)顯示格式)欄中選擇Sortedbysize(依據(jù)因素負(fù)荷量排序)項(xiàng);——在CoefficientDisplayFormat(系數(shù)顯示格式)勾選“Suppressabsolutevalueslessthan”,其后空格內(nèi)的數(shù)字不用修改,默認(rèn)為0.1。——如果研究者要呈現(xiàn)所有因素負(fù)荷量,就不用選取“Suppressabsolutevalueslessthan”選項(xiàng)。在例題中為了讓研究者明白此項(xiàng)的意義,才勾選了此項(xiàng),正式的研究中應(yīng)呈現(xiàn)題項(xiàng)完整的因素負(fù)荷量較為適宜?!獑螕簟癈ontinue”按鈕確定。第86頁,講稿共105頁,2023年5月2日,星期三zf87第87頁,講稿共105頁,2023年5月2日,星期三zf88第88頁,講稿共105頁,2023年5月2日,星期三zf89對SPSS因子分析結(jié)果的解釋取樣適當(dāng)性(KMO)檢驗(yàn)——KMO值越大,表示變量間的共同因素越多,越適合進(jìn)行因素分析,要求KMO>0.5——要求Barlett’s的卡方值達(dá)到顯著程度第89頁,講稿共105頁,2023年5月2日,星期三zf902.共同度檢查第90頁,講稿共105頁,2023年5月2日,星期三zf913.因子陡坡檢查,除去坡線平坦部分的因子圖中第三個(gè)因子以后較為平坦,故保留3個(gè)因子第91頁,講稿共105頁,2023年5月2日,星期三zf924.方差貢獻(xiàn)率檢驗(yàn)——取特征值大于1的因子,共有3個(gè),分別(6.358)(1.547)(1.032);——變異量分別為(63.58%)(15.467%)(10.32%)第92頁,講稿共105頁,2023年5月2日,星期三zf935.顯示未轉(zhuǎn)軸的因子矩陣第93頁,講稿共105頁,2023年5月2日,星期三zf946.分析轉(zhuǎn)軸后的因子矩陣----根據(jù)因子負(fù)荷量形成3個(gè)公共因子第94頁,講稿共105頁,2023年5月2日,星期三zf957.形成綜合分析結(jié)果題項(xiàng)貢獻(xiàn)率(解釋變異量)累積貢獻(xiàn)率(累積解釋變異量)Component(抽取的因子)因子1負(fù)荷量因子2負(fù)荷量因子3負(fù)荷量共同性A1電腦A8CAI課件A6電子郵件A5校園網(wǎng)或因特網(wǎng)A4網(wǎng)上資料43.885%43.885%0.9150.9120.8840.8240.7890.9280.9070.8670.9010.872A10視聽會(huì)議

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論