應(yīng)用多元統(tǒng)計(jì)分析習(xí)題解答-主成分分析_第1頁
應(yīng)用多元統(tǒng)計(jì)分析習(xí)題解答-主成分分析_第2頁
應(yīng)用多元統(tǒng)計(jì)分析習(xí)題解答-主成分分析_第3頁
應(yīng)用多元統(tǒng)計(jì)分析習(xí)題解答-主成分分析_第4頁
應(yīng)用多元統(tǒng)計(jì)分析習(xí)題解答-主成分分析_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、主成分分析6.1試述主成分分析的基本思想。答:我們處理的問題多是多指標(biāo)變量問題,由于多個(gè)變量之間往往存在著一定程度的相關(guān)性,人們希望能通過線性組合的方式從這些指標(biāo)中盡可能快的提取信息。當(dāng)?shù)谝粋€(gè)組合不能提取止。這就是主成分分析的基本思想。6.2主成分分析的作用體現(xiàn)在何處?答:一般說來,在主成分分析適用的場(chǎng)合,用較少的主成分就可以得到較多的信息量。以各個(gè)主成分為分量,就得到一個(gè)更低維的隨機(jī)向量;主成分分析的作用就是在降低數(shù)據(jù)“維數(shù)”6.3簡(jiǎn)述主成分分析中累積貢獻(xiàn)率的具體含義。答:主成分分析把P個(gè)原始變量X,X,X的總方差tr(X)分解成了“個(gè)相互獨(dú)立的變量12pp個(gè)主成分的,忽略一些帶有較小方差的

2、主成分將不會(huì)給總方差帶來太大的影響。這里我們m(p)個(gè)主成分,貝y稱中,k為主成分Y1,Y”的累計(jì)貢獻(xiàn)率,累計(jì)貢獻(xiàn)率TOC o 1-5 h zk=1k=1表明Y,Y綜合X,X,X的能力。通常取m,使得累計(jì)貢獻(xiàn)率達(dá)到一個(gè)較高的百分1m12p數(shù)(如85%以上)。答:這個(gè)說法是正確的。即原變量方差之和等于新的變量的方差之和6.5試述根據(jù)協(xié)差陣進(jìn)行主成分分析和根據(jù)相關(guān)陣進(jìn)行主成分分析的區(qū)別。答:從相關(guān)陣求得的主成分與協(xié)差陣求得的主成分一般情況是不相同的。從協(xié)方差矩陣匚出發(fā)的,其結(jié)果受變量單位的影響。主成分傾向于多歸納方差大的變量的信息,對(duì)于方差小的變量就可能體現(xiàn)得不夠,也存在“大數(shù)吃小數(shù)”的問題。實(shí)際

3、表明,這種差異有時(shí)很大。我6.6已知X=()的協(xié)差陣為試進(jìn)行主成分分析。=0解:計(jì)算得證明:為最大特征根,其對(duì)應(yīng)的主成分為2苗自、/3I1253-17/V120-2苗-1100/63-5耳凋1013、(-2-34?U-V31.oo7同理,計(jì)算得D時(shí),易知相互正交單位化向量得,/綜上所述,第一主成分為第二主成分為第三主成分為6.7設(shè)X=()的協(xié)方差陣(p為,0p1證明:|X-AE|=叮c2-Apa2I!pc?2a2-A為最大特征根時(shí),單位:(億元)資產(chǎn)固定資產(chǎn)凈產(chǎn)品銷利潤(rùn)總計(jì)值平均余額售收入總額6917.23032.7683.361.6綜合評(píng)價(jià)六個(gè)工業(yè)行業(yè)的經(jīng)濟(jì)效益指標(biāo)。所以,6.8利用主成分分

4、析法,行業(yè)名稱煤炭開采和選業(yè)石油和天然氣開采業(yè)5675.93926.2717.533877黑色金屬礦采選業(yè)768.1221.296.513.8有色金屬礦采選業(yè)622.4248116.421.6非金屬礦采選業(yè)699.9291.584.96.2其它采礦業(yè)1.60.50.30解:令資產(chǎn)總計(jì)為X1,固定資產(chǎn)凈值平均余額為X2,產(chǎn)品銷售收入為X3,利潤(rùn)總額為X4,用SPSS對(duì)這六個(gè)行業(yè)進(jìn)行主成分分析的方法如下:1.在SPSS窗口中選擇AnalyzeDataReductionFactor菜單項(xiàng),調(diào)出因子分析主界面,并將變量X-X移入Variables框中,其他均保持系統(tǒng)默認(rèn)選項(xiàng),單擊0K按15鈕,執(zhí)行因子

5、分析過程(關(guān)于因子分子在SPSS中實(shí)現(xiàn)的詳細(xì)過程,參見7.7)。得到如表6.1所示的特征根和方差貢獻(xiàn)率表和表6.2所示的因子載荷陣。第一個(gè)因子就可以解釋86.5%表6.1特征根和方差貢獻(xiàn)率表解鄴昂忌點(diǎn)羞初抬特征値右差的累與臺(tái)計(jì)有差的生累頼13.40086.49986.4993.46086.49986.4992.53713.43499.9333.002.06099.9934.000.007100.000表6.2因子載荷陣2.將表6.2中因子載荷陣中的數(shù)據(jù)輸入SPSS數(shù)據(jù)編輯窗口,命名為al。點(diǎn)擊菜單項(xiàng)中的TransformCompute,調(diào)出Computevariable對(duì)話框,在對(duì)話框中輸入等

6、式:z1=a1/SQRT(3.46),計(jì)算第一個(gè)特征向量。點(diǎn)擊0K按鈕,即可在數(shù)據(jù)編輯窗口中得到以z1為變量名的第一特征向量。表6.3特征向量矩陣z1x10.509x20.537x30.530 x40.413根據(jù)表6.3得主成分的表達(dá)式:Y1,0.509X1+0.537X2+0.530X3+0.413X43.再次使用Compute命令,調(diào)出Computevariable對(duì)話框,在對(duì)話框中輸入等式:y1二0.509*x10.537*x20.53*x30.413*x4根據(jù)六個(gè)工業(yè)行業(yè)計(jì)算所的yl的大小可得石油和天然氣開采業(yè)的經(jīng)濟(jì)效益最好,煤炭開采和選業(yè)其次,接著依次是黑色金屬、非金屬、有色金屬和其

7、他采礦業(yè)。6.9下表是我國(guó)2003年各地區(qū)農(nóng)村居民家庭平均每人主要食品消費(fèi)量,試用主成分方法對(duì)各主要食品和地區(qū)進(jìn)行分類。地區(qū)糧食蔬菜食油豬牛羊肉家禽蛋類及其制品水產(chǎn)品食糠酒北京134.0592.789.1514.62.1710.134.252.9214.42天津150.269.991011.070.8410.88.350.7210.14河北216.7255.976.597.10.546.362.250.657.29山西218.9180.875.725.360.246.150.471.152.59內(nèi)蒙207.370.772.7921.181.413.821.451.3410.77遼寧194.39

8、178.595.916.452.519.594.490.7310.8吉林255.99115.26.2711.423.238.643.60.7513.64黑龍江195.08111.77.627.852.616.263.350.915.09上海189.4476.68.5916.377.47.5116.112.1216.77江蘇251.98109.128.2712.054.56.729.091.38.82浙江208.4683.915.8116.426.035.3314.642.1324.15安徽228.3580.976.879.074.275.045.431.4210.61福建198.2799.92

9、5.1916.515.143.5513.32.3516.84江西264.8144.228.7713.243.313.55.191.137.31山東229.06118.196.968.092.711.614.01110.81河南236.97100.114.226.481.238.011.351.134.23湖南227.39159.769.419.862.743.868.10.927.29湖北247.21149.448.3517.513.893.286.891.134.02廣東233.75130.226.7322.2710.42.8313.32.163.33廣西205.65108.944.9214

10、.447.331.123.571.186.14海南236.3186.615.715.49.771.3114.751.243.88解:令糧食為X1,蔬菜為x2,食油為x3,豬牛羊肉為x4,家禽為x5,蛋類及其制品為x6,水產(chǎn)品為x7,食糠為x8,酒為x9,用SPSS進(jìn)行主成分分析的具體方法參見6.8,分析結(jié)果如下:表6.4特征根和方差貢獻(xiàn)率表斛稈的嘉啟差成桔初始特征值臺(tái)計(jì)方差的累積倉計(jì)右差的累積12.9232.52132.5212.92732.52132.52123.23024.67157.1923.22034.67157.19231.34414.93672.1281.34414.93672.1

11、284.801S.90581.0335.6547.26388.2966.3964.39992.6941.3353.72796.42282.4729S.S949.1001.106100.000表6.5因子載荷陣阪曲拒陣H成借123X1.002-.820-.006x2.093-.477.715幻.009.276.809X4.780113.194x5.072-.212-.064x6-.563.60S.312叮.857177.130 x8.664.496-.151x9.241735-.023表6.6特征向量矩陣z1z2z3x10.001169-0.55035-0.00518x20.054359-0.3

12、20140.616746x30.0052610.1852390.697829x40.455914-0.075840.167341x50.509689-0.14229-0.05521x6-0.329080.4080630.269126x70.5009210.1187950.112136x80.3881120.332893-0.13025x90.1408660.4933-0.01984根據(jù)表6.6得主成分的表達(dá)式:Y1,0.001X10.054X20.005X30.456X40.51X50.329X60.501X70.388X80.141X92,0.55X10.32X20.185X30.076X4

13、0.142X50.408X60.119X70.333X80.493X93,0.005X10.617X20.698X30.167X40.055X50.269X60.112X70.130X80.02X9分別計(jì)算出以上三項(xiàng)后,利用公式Y(jié),f1Y1fY2fY3得到綜合得分并排序如卜表:地區(qū)y1y2y3y北京14.92-90.4267.81-10.16天津11.80-93.4854.76-15.31上海24.39-115.4657.85-16.51福建24.55-129.9368.56-19.17浙江25.14-126.0059.51-19.43遼寧19.55-154.56118.72-19.47黑龍江

14、13.27-131.9076.07-23.38湖南23.53-169.91108.84-24.97廣東29.80-167.0688.93-25.29廣西19.18-144.8972.06-25.99內(nèi)蒙15.93-130.4748.84-27.33海南24.93-154.5760.04-29.19山東11.81-152.6481.06-30.09湖北21.71-179.61100.93-30.74安徽14.06-143.1256.46-30.92江蘇18.07-164.9376.08-32.51河北7.10-129.8340.94-32.73山西6.20-141.4455.18-34.15吉林

15、14.54-166.9078.26-34.32江西18.74-185.6297.04-34.94河南8.32-156.3666.62-35.93最后的分類可以根據(jù)最終得分Y的值來劃分,由于沒有給出具體的分類標(biāo)準(zhǔn),具體分類結(jié)果根據(jù)各人的主觀意愿可以有多種答案。6.10根據(jù)習(xí)題5.10中2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),利用主成分分析法對(duì)這些地區(qū)進(jìn)行分類。解:用SPSS進(jìn)行主成分分析的具體方法參見6.8,分析結(jié)果如下:表6.7特征根和方差貢獻(xiàn)率表初始特征值舍計(jì)累與臺(tái)計(jì)肓差的15.05856.19956.1995.05850.19956.19922.39026.55182.750

16、2.39026.55162.7503.8149.04191.7904.3413.7S495.5755.2482.75990.3336.1001.10899.4417.027.30499.7448.020.31999.9649.003.036100.000表6.8因子載荷陣成苗12K1.655.732.629.736k3.315-.444.694-.571.908-.302k6.894-.419k7.687.607.883.180購.882-.370表6.6特征向量矩陣z1z2x10.290.47x20.280.48x30.14-0.29x40.31-0.37x50.40-0.20 x60.40-0.27x70.310.39x80.390.12x90.39-0.24青島35237.2714552.4628597.44大連31830.5617629.5327272.03濟(jì)南25149.7316499.3922372.97福州22734.1616326.9720677.45烏魯木齊22284.5415284.6820037.59沈陽23184.9912310.2219694.19武漢23909.279770.5619370.75長(zhǎng)春21524.9514179.211

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論