




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第十章主成分分析和因子分析主要內(nèi)容主要內(nèi)容10.1 主成分分析和因子分析簡(jiǎn)介主成分分析和因子分析簡(jiǎn)介10.2 主成分分析主成分分析10.3 因子分析因子分析10.1主成分分析和因子分析簡(jiǎn)介主成分分析和因子分析簡(jiǎn)介10.1.1 基本概念和主要用途基本概念和主要用途(1 1) 基本概念基本概念 主成分分析就是考慮各指標(biāo)之間的相互關(guān)系,利用降維的方法將多個(gè)指標(biāo)轉(zhuǎn)換為少數(shù)幾個(gè)互不相關(guān)的指標(biāo),從而使進(jìn)一步研究變得簡(jiǎn)單的一種統(tǒng)計(jì)方法。主成分分析是由Hotelling于1933年首先提出的,是利用“降維”的思想,在損失很少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo),稱為主成分。每個(gè)主成分均是原始變量的線性組合
2、,且各個(gè)主成分之間互不相關(guān),這就使得主成分比原始變量具有某些更優(yōu)越的性能。 因子分析是一種通過顯在變量測(cè)評(píng)潛在變量,通過具體指標(biāo)測(cè)評(píng)抽象因子的分析方法,最早是由心理學(xué)家Chales Spearman在1904年提出的,它的基本思想是將實(shí)測(cè)的多個(gè)指標(biāo),用少數(shù)幾個(gè)潛在指標(biāo)(因子)的線性組合表示。10.1主成分分析和因子分析簡(jiǎn)介主成分分析和因子分析簡(jiǎn)介(2 2)主要用途)主要用途解決共線性問題; 評(píng)估問卷的結(jié)構(gòu)效度;尋找變量之間的潛在結(jié)構(gòu); 內(nèi)在結(jié)構(gòu)證實(shí)。(3 3)常用術(shù)語)常用術(shù)語因子載荷變量共同度公共因子的方差貢獻(xiàn)10.1主成分分析和因子分析簡(jiǎn)介主成分分析和因子分析簡(jiǎn)介10.1.2主成分和公因子
3、數(shù)量的確定主成分和公因子數(shù)量的確定(1 1) 確定時(shí)遵循幾個(gè)原則確定時(shí)遵循幾個(gè)原則主成分的累積貢獻(xiàn)率:主成分的累積貢獻(xiàn)率:一般來說,提取主成分的累積貢獻(xiàn)率達(dá)到80%85%以上就比較滿意了,可以由此確定需要提取多少個(gè)主成分。 特征值:特征值:特征值在某種程度上可以看成表示主成分影響力度大小的指標(biāo),如果特征值小于1,說明該主成分的解釋力度還不如直接引入原變量的平均解釋力度大。因此一般可以用特征值大于1作為納入標(biāo)準(zhǔn)。 綜合判斷:綜合判斷:大量的實(shí)際情況表明,如果根據(jù)累積貢獻(xiàn)率來確定主成分?jǐn)?shù)往往較多,而用特征值來確定又往往較少,很多時(shí)候應(yīng)當(dāng)將兩者結(jié)合起來,以綜合確定合適的數(shù)量。10.1主成分分析和因子
4、分析簡(jiǎn)介主成分分析和因子分析簡(jiǎn)介10.1.3 兩者兩者的區(qū)別與聯(lián)系的區(qū)別與聯(lián)系(1)兩者都是在多個(gè)原始變量中通過它們之間的內(nèi)部相關(guān)性來獲得新的變量(主成分變量或因子變量),達(dá)到既能減少分析指標(biāo)個(gè)數(shù),又能概括原始指標(biāo)主要信息的目的。 (2)提取公因子主要有主成分分析法和公因子法,若采用主成分法,則主成分分析和因子分析基本等價(jià)。(3)因子分析提取的公因子比主成分分析提取的主成分更具有解釋性。 (4)兩者分析的實(shí)質(zhì)和重點(diǎn)不同。 (5)兩者的SPSS操作都是通過“分析降維因子分析”過程實(shí)現(xiàn)的,主成分分析不需要因子旋轉(zhuǎn),而因子分析需要經(jīng)過旋轉(zhuǎn)。主要內(nèi)容主要內(nèi)容10.1 主成分分析和因子分析簡(jiǎn)介主成分分析
5、和因子分析簡(jiǎn)介10.2 主成分分析主成分分析10.3 因子分析因子分析10.2 主成分分析主成分分析10.2.1 統(tǒng)計(jì)原理與分析步驟統(tǒng)計(jì)原理與分析步驟(1)(1)統(tǒng)計(jì)原理統(tǒng)計(jì)原理 10.2 主成分分析主成分分析(1)(1)統(tǒng)計(jì)原理統(tǒng)計(jì)原理 111 11221221 122221 122mmmmppppmmye xe xe xye xe xexye xexex10.2 主成分分析主成分分析10.2.1 統(tǒng)計(jì)原理與分析步驟統(tǒng)計(jì)原理與分析步驟(2 2)分析步驟)分析步驟 第1步 原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理。 第2步 計(jì)算相關(guān)系數(shù)矩陣。第3步 計(jì)算特征值及單位特征向量。第4步 計(jì)算主成分的方差貢獻(xiàn)率和累積方
6、差貢獻(xiàn)率。第5步 計(jì)算主成分。 10.2 主成分分析主成分分析10.2.2 SPSS實(shí)例分析實(shí)例分析【例10-1】 為了從總體上反映世界經(jīng)濟(jì)全球化的狀況,現(xiàn)選擇了具有代表性的16個(gè)國(guó)家的數(shù)據(jù),這些國(guó)家參與經(jīng)濟(jì)全球化的程度指標(biāo)值如下表所示。試分析一個(gè)國(guó)家參與經(jīng)濟(jì)全球化的程度主要受哪些因素的影響。編號(hào)國(guó)家x1x2x3x4x5x6x7x8x9x10 x11x12x13x14x151中國(guó)3.20554.528.530.8781.4090.89411.62.3050.5472.9324.8189.0032.73.9141.4722印度1.44931.10.2790.3390.2720.12.70.128
7、0.1930.8252.3185.1270.640.2183日本14.07952.30.65310.25411.7691.09701.9671.36.17814.74627.29730.957.73415.1254韓國(guó)1.318136.31.0111.60.421.8381.30.770.782.26723.3242.8759.112.1290.4525新加坡0.275739.53.57227.8410.88413.31428.60.6220.1431.885169.772 319.90754.2917.3280.7186美國(guó)29.64146.13.6826.42920.5634.8085.4
8、24.25329.94115.63810.78424.55513.624.49521.2747加拿大2.056101.50.8988.2762.3135.36910.52.4445.1453.85434.69167.04715.121.831.3628巴西2.43427.11.5842.3270.9622.9056.81.9532.30.8574.71610.1016.75.4981.1049墨西哥1.567151.41.6572.8370.7971.47110.90.670.2122.18618.48537.9864.54.8870.46810英國(guó)4.67118.40.49726.15112
9、.45622.13711.216.55219.6425.54228.43458.766.1278.96811.28911法國(guó)4.639120.61.849.2424.49210.8488.58.2825.8415.2128.4654.05229.256.4538.88912德國(guó)6.84132.92.2529.5586.6467.7472.28.5898.9718.84332.12163.1743651.51412.1813意大利3.792104.50.3218.1533.7241.0592.50.771.9134.03222.86943.9242717.7765.67814俄羅斯1.358.6
10、1.5331.4990.5520.4992.50.310.2980.9877.7712.5811.12.0010.46915澳大利亞1.30994.50.5025.7730.9411.98718.90.5271.3711.13115.74533.79513.224.1170.79710.2 主成分分析主成分分析第第1步步 分析:分析:從數(shù)據(jù)來看,一共有15個(gè)因素,但有些因素是存在相關(guān)性的,同時(shí)各因素對(duì)全球化影響的程度也是不一樣的,故可采用主成分分析。 第第2步步 數(shù)據(jù)組織:數(shù)據(jù)組織:按如教材所示的“指標(biāo)”一列定義變量,輸入數(shù)據(jù)并保存。第第3步步 主成分分析的設(shè)置:主成分分析的設(shè)置:按“分析降維
11、因子分析”順序打開“因子分析”對(duì)話框,將x1x15這15個(gè)變量移入“變量”對(duì)話框中,并按如下所示的圖形進(jìn)行設(shè)置。 10.2 主成分分析主成分分析10.2 主成分分析主成分分析 由于在SPSS中并沒有完整的主成分分析過程,其主成分分析過程是集成在“因子分析”過程中的,但并不完善。由于主成分的得分需要對(duì)因子得分情況進(jìn)行進(jìn)一步計(jì)算,故不需設(shè)置“得分”子對(duì)話框,即不需保存因子得分情況,即使保存了,因子得分也不是各主成分得分的結(jié)果。 對(duì)于提取因子的個(gè)數(shù)問題,一般遵循兩個(gè)標(biāo)準(zhǔn),其一是累計(jì)方差貢獻(xiàn)率在80%以上,其二是其特征值大于1。本例之所以設(shè)置為3,是因?yàn)橥ㄟ^預(yù)先分析,發(fā)現(xiàn)前3個(gè)主成分可以解釋總體信息的
12、86.7%。 10.2 主成分分析主成分分析第四步第四步 因子分析的結(jié)果:因子分析的結(jié)果:特征值和方差貢獻(xiàn)表成分初始特征值提取平方和載入合計(jì)方差的%累積%合計(jì)方差的%累積%16.04940.32540.3256.04940.32540.32525.81338.75579.0805.81338.75579.08031.1427.61686.6961.1427.61686.6964.8765.84292.5385.5993.99696.5346.3262.17498.7097.119.79699.5058.041.27299.7769.018.12199.89710.010.06399.96111
13、.004.02799.98812.001.00999.99713.000.00299.99914.000.001100.000154.080E-72.720E-6100.000提取方法:主成分分析。從表中可以看出前3個(gè)主成分已經(jīng)解釋了總方差的近86.7%,故可以選擇前3個(gè)主成分進(jìn)行分析。 10.2 主成分分析主成分分析第四步第四步 因子分析的結(jié)果:因子分析的結(jié)果:主成分的碎石圖 該圖從另一個(gè)側(cè)面說明了取前三個(gè)主成分為宜。10.2 主成分分析主成分分析第四步第四步 因子分析的結(jié)果:因子分析的結(jié)果:旋轉(zhuǎn)前的因子載荷矩陣 成分123x1.407.805.268x2.596-.727.209x3-.1
14、47.016.821x4.895-.333-.181x5.614.763.028x6.826-.124-.281x7.273-.627.184x8.636.703.041x9.619.703.008x10.552.766.196x11.654-.691.172x12.666-.685.166x13.863-.191-.297x14.728-.632.144x15.579.760.005提取方法 :主成分。a. 已提取了 3 個(gè)成分。教材中公式10.7中的 是標(biāo)準(zhǔn)化正交向量,并不是SPSS輸出“因子載荷矩陣”中的系數(shù)。而“因子載荷矩陣”中各分量的系數(shù)為單位特征向量乘以相應(yīng)的特征值的平方根的結(jié)果,
15、其公式為 。故需進(jìn)一步利用因子分析的結(jié)果進(jìn)行主成分分析。12(,)iiipieeee /ijijiea10.2 主成分分析主成分分析第五步第五步 利用因子分析的結(jié)果進(jìn)行主成分分析。利用因子分析的結(jié)果進(jìn)行主成分分析。10.2 主成分分析主成分分析第六步第六步 主要結(jié)果:主要結(jié)果:y綜編號(hào)國(guó)家y1y2y31中國(guó)-2.190.073.01-0.632印度-2.56-0.11-0.46-1.113日本0.451.85-0.270.884韓國(guó)-1.69-0.46-0.27-0.885新加坡5.28-6.261.19-0.206美國(guó)3.306.071.463.807加拿大-0.43-0.47-0.31-0
16、.388巴西-1.91-0.06-0.43-0.839墨西哥-1.68-0.680.03-0.9410英國(guó)4.460.98-1.752.0511法國(guó)0.870.46-0.520.4912德國(guó)1.401.34-0.261.0613意大利-0.610.10-0.54-0.2514俄羅斯-2.35-0.20-0.30-1.0515澳大利亞-1.36-0.92-0.30-0.9316新西蘭-0.99-1.73-0.28-1.09過綜合得分的高低可知各國(guó)參與國(guó)際化水平的高低,其中美國(guó)最高,印度最低。主要內(nèi)容主要內(nèi)容10.1 主成分分析和因子分析簡(jiǎn)介主成分分析和因子分析簡(jiǎn)介10.2 主成分分析主成分分析1
17、0.3 因子分析因子分析10.3 因子分析因子分析10.3.1 統(tǒng)計(jì)原理與分析步驟統(tǒng)計(jì)原理與分析步驟(1)統(tǒng)計(jì)原理)統(tǒng)計(jì)原理111 11221221 122221 122mmmmppppmmxa Fa Fa Fxa Fa FaFxa FaFaFXAFa其中x1,x2, ,xp為p個(gè)原有變量,是均值為零,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)化變量,F(xiàn)1,F(xiàn)2,F(xiàn)m為m個(gè)因子變量,m小于p,表示成矩陣形式為:10.3 因子分析因子分析10.3.1 統(tǒng)計(jì)原理與分析步驟統(tǒng)計(jì)原理與分析步驟(2)分析步驟)分析步驟第1步 將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化;第2步 確定待分析的原有若干變量是否適合于因子分析;第3步 構(gòu)造因子變量;第4步
18、利用旋轉(zhuǎn)使得因子變量更具有可解釋性;第5步 計(jì)算因子變量的得分。計(jì)算因子得分和模型為:11jjjppFXXj=1,2,m 10.3 因子分析因子分析10.3.2 SPSS實(shí)例分析實(shí)例分析【例10-2】 為了研究幾個(gè)省市的科技創(chuàng)新力問題,現(xiàn)取了2005年8個(gè)省市的15個(gè)科技指標(biāo)數(shù)據(jù),試分析一個(gè)省的科技創(chuàng)新能力主要受哪些潛在因素的影響?省市x1x2x3x4x5x6x7x8x9x10 x11x12x13x14x15北京 229 80.2648.524.49 3.55 5.55 10.23 44774.45 25.0224.1 779.24 226.01 34.42 3183.29 2.12天冿876
19、7.48 36.82 14.08 2.62 1.964.49 35451.77 33.59 21.38 410.34 73.15 25.06 495.78 1.82遼寧4465.69 35.948.342.32 1.562.4518974.2 11.295.57 263.35 22.32 15.21 204.98 1.78上海 104 74.06 35.98 17.84 4.78 2.284.851485.83 39.72 19.08 654.31 112.32 15.85 1303.322江蘇5060.79 34.076.82.13 1.473.17 24489.18 43.13 17.99
20、 206.6816.69.14134.89 1.41浙江5363.48 31.085.423.95 1.221.83 27435.38 7.947.63 257.65 22.665.8279.011.72山東3064.59 33.224.441.81 1.051.59 20022.57 9.175.69 117.739.768.41106.36 1.34廣東3569.64 37.275.813.66 1.092.18 24327.32 35.67 24.99 117.5120.45.08122.33 1.4710.3 因子分析因子分析第第1步步 分析:分析:如題所述,要分析一個(gè)省的科技創(chuàng)新能力
21、受哪些潛在因素的影響,可用因子分析法進(jìn)行分析。第第2步步 數(shù)據(jù)組織:數(shù)據(jù)組織:建立x1x15共15個(gè)數(shù)據(jù)變量和一個(gè)“省市”字符型變量,將北京、天津等8個(gè)省市作為個(gè)案數(shù)據(jù)輸入并保存。第第3步步 因子分析設(shè)置:因子分析設(shè)置:按“分析降維因子分析”打開“因子分析”對(duì)話框,將x1x15這15個(gè)變量移入“變量”對(duì)話框中,表示對(duì)這15個(gè)變量數(shù)據(jù)進(jìn)行因子分析。10.3 因子分析因子分析“得分”對(duì)話框的設(shè)置:?jiǎn)螕簟暗梅郑⊿)”按鈕,彈出此子對(duì)話框,選擇“保存為變量”,即將因子得分保存下來。第第4步主要結(jié)果及分析:步主要結(jié)果及分析:特征值與方差貢獻(xiàn)表可以看出前3個(gè)特征值大于1,同時(shí)這3個(gè)公共因子的方差貢獻(xiàn)率占了
22、93.924%,說明提取這3個(gè)公共因子可以解釋原變量的絕大部分信息。10.3 因子分析因子分析旋轉(zhuǎn)前的因子載荷矩陣 表的底部表明使用的是主成分分析法,3個(gè)主成分被抽取出來。成分123x1.973-.158.052x2.919.036-.090 x3.883-.161.334x4.985-.004-.022x5.482.497-.664x6.947-.242.131x7.972-.108.178x8.849.340-.301x9.300.834.386x10.611.637.399x11.955-.001-.211x12.992-.091-.001x13.876-.282.205x14.968-.156.032x15.859-.092-.385提取方法 :主成分。a. 已提取了3個(gè)成分。10.3 因子分析因子分析旋轉(zhuǎn)后的因子載荷矩陣 是按照前面設(shè)定的“方差極大法”對(duì)因子載荷矩陣旋轉(zhuǎn)的結(jié)果。在表10.10所示未經(jīng)旋轉(zhuǎn)的載荷矩陣中,因子變量在許多變量上均有較高的載荷,從旋轉(zhuǎn)后的因子載荷矩陣可以看出,因子1在1、3、4、6、7、12、13、14上有較大載荷 ,反映科技投入與產(chǎn)出情況,可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年大數(shù)據(jù)分析師考試試卷及答案
- 時(shí)光荏苒寫物:一臺(tái)老式收音機(jī)12篇
- 藥品管理法案例課件
- 在校學(xué)生實(shí)習(xí)期間工作表現(xiàn)證明(7篇)
- 醫(yī)療器械銷售行業(yè)從業(yè)證明(5篇)
- 2025年公共英語三級(jí)考試試卷:基礎(chǔ)詞匯與短語應(yīng)用試題
- 投資合作協(xié)議與股權(quán)激勵(lì)協(xié)議組合
- 分析某制造業(yè)公司的財(cái)務(wù)報(bào)表
- 2025年茶藝師中級(jí)茶葉銷售與市場(chǎng)推廣技能鑒定理論試卷
- 2025年電梯安裝改造維修作業(yè)特種操作證考試試卷(電梯安全操作標(biāo)準(zhǔn))深度解析
- 16J914-1 公用建筑衛(wèi)生間
- GB/T 17431.1-1998輕集料及其試驗(yàn)方法第一部分:輕集料
- 2023年德陽市旌陽區(qū)廣播電視臺(tái)(融媒體中心)招聘筆試題庫及答案解析
- 小學(xué)生職業(yè)生涯規(guī)劃啟蒙課件PPT
- 鉆井安全操作規(guī)范
- 焊接工藝評(píng)定氬弧焊
- 食用菌生產(chǎn)技術(shù) 大球蓋菇栽培技術(shù)課件
- 花城版小學(xué)二年級(jí)音樂(下)全冊(cè)教案
- 小班語言課《水果歌》PPT
- (外研社)新編進(jìn)出口英語函電答案-Unit-2-11-包含部分test-yourself
- JJF 1959-2021 通用角度尺校準(zhǔn)規(guī)范(高清最新版)
評(píng)論
0/150
提交評(píng)論