因子分析的應(yīng)用_第1頁
因子分析的應(yīng)用_第2頁
因子分析的應(yīng)用_第3頁
因子分析的應(yīng)用_第4頁
因子分析的應(yīng)用_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、因子分析的應(yīng)用摘要:隨著我國的經(jīng)濟的發(fā)展,人民的生活水平逐漸提高,從而家庭耐用品的擁有 量也有所提高。但各省市的擁有量也存在差異,為了準(zhǔn)確的把握各省市的情況及其差異, 本文采用多變量統(tǒng)計因子分析的方法對其進(jìn)行定量分析,對各省市的耐用品擁有量的情 況有個客觀的把握及反映各省市的經(jīng)濟發(fā)展情況。關(guān)鍵字:因子分析,經(jīng)濟發(fā)展?fàn)顩r;1因子分析的基本定義1.1因子分析的基本思想因子分析的基本思想是根據(jù)相關(guān)性大小把原始變量分組,使得同組內(nèi)的變量之間相 關(guān)性較高,而不同組的變量間的相關(guān)性則較低。每組變量代表一個基本結(jié)構(gòu),并用一個 不可觀測的綜合變量表示,這個基本結(jié)構(gòu)就稱為公共因子。對于所研究的某一具體問題, 原

2、始變量可以分解成兩部分之和的形式,一部分是少數(shù)幾個不可測的所謂公共因子的線 性函數(shù),另一部分是與公共因子無關(guān)的特殊因子。因子分析不見可以用來研究變量之間的相關(guān)關(guān)系,還可以用來研究樣品之間的相關(guān) 關(guān)系,通常將前者稱為R型因子分析,后者稱為Q型因子分析。1.2 一般因子分析模型設(shè)有n個樣品,每個樣品觀測p個指標(biāo),這p個指標(biāo)之間有較強大相關(guān)性。為了便 于研究,并消除由于觀測量綱的差異及級數(shù)不同所造成的影響,將樣本觀測數(shù)據(jù)進(jìn)行標(biāo) 準(zhǔn)化處理,使標(biāo)準(zhǔn)化后的變量均值為0方差為1為了方便把原始變量及標(biāo)準(zhǔn)化后的變 量向量均用X表示,用F,F(xiàn),.,F(xiàn)(mp)表示標(biāo)準(zhǔn)化的公共因子。如果:X=(X,X,F(xiàn))是可觀測隨

3、機向量,且均值向量E(X)=0,協(xié)方差矩陣1 2 ,0cov(X)二工,且協(xié)方差矩陣工 與相關(guān)陣R相等;F=(F,F,.,F)(mp)是不可觀測的變量,其均值向量E(F)=0,協(xié)方差矩陣 cov(F)=I,即向量 F的各分量是相互獨立的;(3) = ( ,1)與F相互獨立,且E( (3) = ( ,12p,對角方陣COV( COV( )=工a 2iiQ222Q 2pp即的各分量之間也是相互獨立的,則模型X1 = a F + a F + + a F + 11 112 21m m1X2 = a F + a F +. + a F + 21 122 22m m2Xp = a F + a F +. +

4、a F +lp1 1p 2 2pm m p稱為因子模型,其矩陣形式為:X二AF+其中F為公共因子,為特殊因子。a1ma2 ma .aa1ma2 m11 12a .aA= 2122a.a-a.a-p1p 2apm2因子分析的實例應(yīng)用2.1數(shù)據(jù)選用根據(jù)分析用意,為了更好的反映各省市的耐用品擁有量的情況,且根據(jù)當(dāng)今社會家 庭擁有耐用品的檔次的不同,可將耐用品分為低,中,高三檔,從而本文使用2009年 統(tǒng)計年鑒的數(shù)據(jù)。選取了具有代表的三類九個指標(biāo):():低檔消費耐用品:普通電話擁有量(部);(二):中檔消費耐用品:電冰箱擁有量(臺),彩色電視機擁有量(臺),空調(diào)器 擁有量(臺),移動電話擁有量(部);

5、(三):高檔奢侈消費耐用品:家用電腦擁有量(臺),家用汽車擁有量(輛),攝 像機擁有量(臺),照相機擁有量(臺);則各地區(qū)各種耐用品擁有量如下表1:表1各地區(qū)城鎮(zhèn)居民家庭平均每百戶耐用消費品擁有量地區(qū)家用汽 車彩色電視機家用電 腦攝像機照相機空調(diào)器普通電話移動電話電冰箱北京29.55137.6396.9621.9389.35162.68100.24212.67103.6天津11.86127.7579.5212.2958.66129.9282.62190.63107.57河北10.1311857.35.637.6984.5175.79164.4397.22山西10.03111.0349.473.

6、9527.1933.7885.24137.5286.97內(nèi)家古9.51110.3643.245.9534.8510.2365.18170.8594.7遼寧7.23121.7660.9712.9746.6829.7384.1169.2897.54吉林5.95120.5850.576.6629.656.2269.55193.8988. 72黑龍江3.23107.642.225.9422.187.9272.81157.6984.45上海14.04184.96123.2416.0291.3196.0498. 52223.05104.45江蘇11.92166.7575.727.4446.39163.81

7、10.46176.298. 27浙江23.72181.6384.539.2247.87180.0589.71191.5799.23安徽2.76140.0956.13.4528. 03110.3187.81158.1996.69福建9.57175.4589.158.6443.57175.3693.56216.68103.91江西4.31146.0554.914.2731.69101.9972.73175.1795.25山東16121.0570.879.8452.6795.0475.33189.74100.83河南5.03124.6251.75.5431.55112.8167.4167.8788.

8、 17湖北4.41130.4557.585.3833.71112.4772.4164.0198. 75湖南5.51124.3947.773.3324.19102.8174.05163.5793.22廣東23.31142.7791.5411.7858.29196.2192.83215.2895.54廣西10.68135.4671.855.5240.53106.3476.28204.1896.29海南10.72118.2249.734.9521.0866.5291.2716 8.876.6重慶4.9144.6162.037.3232.87151.1386180.5100.23四川6.83134.1

9、255.585.3930.9998. 3876.59177.5193.09貴州4.85122.0352.474.828. 7817.4971.38177.2794.42云南14.88122.3646.525.2437.221.560.55185.9982.91西藏13.28127.2335.16.2134.276.2278. 57152.4378.64陜西5.72125.4162.36.444.63100.5767.12193.7688.84甘肅2.53108.8538.242.7124.275.2860.82152.8785.11青海3.95104.7436.013.3125.111.288

10、2.71148.0291.07寧夏5.3104.2748. 473.2719.3910.4764.55175.4686.22新疆7.61104.6445.194.2826.2911.2282.8154.4789.752.2各省市耐用品情況分析2.2.1本文所采取的定量分析方法本文的研究主要采取因子分析方法。它是用較少個數(shù)的公共因子的線性函數(shù)和特定 因子之和來表達(dá)原有觀測的每個變量,從研究相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些具 有錯綜復(fù)雜的變量歸納為少數(shù)幾個綜合因子的一種多變量統(tǒng)計分析方法。當(dāng)這幾個公共 因子的累計方差和達(dá)到85%以上時,就說明這幾個公共因子反映了研究問題的大部分信 息,而又不相關(guān)

11、,信息不重疊。本文在使用spss18.0對數(shù)據(jù)標(biāo)準(zhǔn)化以后,采取主成分法提取公共因子,并采用方 差最大化正旋轉(zhuǎn)。2.2.2考察原有變量是否適合進(jìn)行因子分析由下圖表2上半部分可知矩陣中存在許多比較高的相關(guān)系數(shù),下半部分是相關(guān)性顯 著性檢驗相關(guān)P值,其中存在大量小于0.05的值,這些都說明原始變量之間存在著較強 的相關(guān)性,具有進(jìn)行因子分析的必要性。而由表3是KMO檢驗統(tǒng)計量與Bartlett球形檢驗結(jié)果,KMO統(tǒng)計量等于0.812, Bartlett球形檢驗的p值為0.000,這些也都說明本文的數(shù)據(jù)比較適合進(jìn)行因子分析。相關(guān)矩陣家用汽車彩色電視機用腦 家電攝像機照相機空調(diào)器普通電話移動電話電冰箱相關(guān)

12、家用汽車1.000.414.630.730.726.485.500.568.303彩色電視機.4141.000.786.457.579.829.632.636.580家用電腦.630.7861.000.796.885.846.654.839.734攝像機.730.457.7961.000.929.550.557.681.592照相機.726.579.885.9291.000.647.540.741.651空調(diào)器.485.829.846.550.6471.000.648.659.695普通電話.500.632.654.557.540.6481.000.325.458移動電話.568.636.83

13、9.681.741.659.3251.000.551電冰箱.303.580.734.592.651.695.458.5511.000Sig.(單 側(cè))家用汽車.010.000.000.000.003.002.000.049彩色電視機.010.000.005.000.000.000.000.000家用電腦.000.000.000.000.000.000.000.000攝像機.000.005.000.000.001.001.000.000照相機.000.000.000.000.000.001.000.000空調(diào)器.003.000.000.001.000.000.000.000普通電話.002.00

14、0.000.001.001.000.037.005移動電話.000.000.000.000.000.000.037.001電冰箱.049.000.000.000.000.000.005.001KMO和Bartlett的檢驗取樣足夠度的Kaiser-Meyer-Olkin度量。.812Bartlett的球形度 檢驗近似卡方281.440df36Sig.0002.2.3提取因子根據(jù)原有變量的相關(guān)系數(shù)距陣,采用主成分分析法,提取因子并指定提取3個因子。公因子方差初始提取家用汽車1.000.853彩色電視機1.000.841家用電腦1.000.957攝像機1.000.898照相機1.000.925空調(diào)

15、器1.000.880普通電話1.000.926移動電話1.000.828電冰箱1.000.735提取方法:主成份分析。由表4可看出所有變量的共同度幾乎所有的變量共同度都在80%甚至90%以上,只 有一個在70%以上,說明提取的因子已經(jīng)包含了原始變量的大部分信息,因子提取的效 果比較理想。2.2.4因子分析和因子解釋通過以上因子提取過程,選入3個公因子,其方差累計貢獻(xiàn)率達(dá)87.141%,即反應(yīng)原 有信息的87.141%見表5。且經(jīng)旋轉(zhuǎn)后分配到各因子的方差貢獻(xiàn)率是比較合適的。我們 將這3個因子作為評價全國31個?。ㄊ校灾螀^(qū))百戶擁有耐用品數(shù)分析的綜合變量。解釋的總方差成份初始特征值提取平方和載入

16、旋轉(zhuǎn)平方和載入合計方差的%累積%合計方差的%累積%合計方差的%累積%16.13468.15468.1546.13468.15468.1543.20035.55535.5552.99311.03879.191.99311.03879.1912.96032.89368.4483.7157.95087.141.7157.95087.1411.68218.69387.1414.5245.82192.9625.2442.71595.6776.1581.76097.4377.1371.52598.9628.067.74899.7109.026.290100.000提取方法:主成份分析。公因子和原有變量之間

17、的關(guān)聯(lián)程度是由因子載荷值表示的。因子載荷值越高,表明 該因子包含該指標(biāo)的信息越多。下表6表示初始因子載荷矩陣。成份矩陣a成份123家用電腦.973.048-.087照相機.910-.301-.077空調(diào)器.860.375.014攝像機.853-.412.003移動電話.818-.115-.382彩色電視機.798.448.059電冰箱.753.270-.309家用汽車.719-.506.282普通電話.708.216.614提取方法:主成份。a.已提取了 3個成份。由表6可知,9個變量在第一個因子的載荷值都很高。即說明他們與第一個因子的相 關(guān)程度高,而第二,三個因子與原有變量的相關(guān)性均很差,對

18、原有變量的解釋不顯著。 無法進(jìn)行因子解釋。于是采用方差最大法對因子載荷矩陣實施正交旋轉(zhuǎn),表7即經(jīng)旋轉(zhuǎn)9 次后的因子載荷矩陣。旋轉(zhuǎn)成份矩陣a成份123電冰箱.809.232.167空調(diào)器.745.240.518家用電腦.723.558.350彩色電視機.713.148.558移動電話.711.568-.021家用汽車.079.862.323攝像機.373.850.188照相機.510.793.191普通電話.225.315.881提取方法:主成份。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正父旋轉(zhuǎn) 法。a.旋轉(zhuǎn)在9次迭代后收斂。根據(jù)表7可以寫出因子分析模型:電冰箱擁有量=0.809F +0.232F +0

19、.167F TOC o 1-5 h z 123空調(diào)器彩擁有量=0.745F +0.240F +0.518F123家用電腦擁有量=0.723F +0.558F +0.350F123彩色電視機擁有量=0.713F +0.148F +0.558F123移動電話擁有量=0.711F +0.568F -0.021F123家用汽車擁有量=0.079F +0.862F +0.323F123攝像機擁有量=0.373F +0.850F +0.188F123照相機擁有量=0.510F +0.793F +0.191F123普通電話擁有量=0.225F +0.315F +0.881F123通過以上分析模型可知:電冰箱

20、,彩色電視機,空調(diào)器,移動電話在第一因子有較 高的載荷,第一因子主要解釋這幾個變量,可解釋為家庭中檔消費耐用品。而家用電腦, 家用汽車,攝像機,照相機在第二因子的載荷較高,第二因子主要解釋這些變量,可解 釋為家庭高檔消費耐用品。而第三個因子主要解釋變量普通電話,可解釋為家庭低檔消 費耐用品。2.2.5因子得分進(jìn)行因子分析之后,由回歸法計算因子得分,結(jié)果如表9,且從表8因子得分協(xié)方差 矩陣可以看出因子間已無相關(guān)關(guān)系,說明因子提取是成功的。表8成份得分協(xié)方差矩陣成份12311.000.000.0002.0001.000.0003.000.0001.000提取方法:主成份。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正父 旋轉(zhuǎn)法。構(gòu)成得分。表9成份得分系數(shù)矩陣成份123家用汽車-.389.500.165彩色電視機.254-.266.303家用電腦.198.051-.014攝像機-.106.411-.107照相機.017.321-.149空調(diào)器.262-.207.227普通電話-.311-.035.837移動電話.340.133-.427電冰箱.459-.169-.193提取方法:主成份。旋轉(zhuǎn)法:具有Kai

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論