主成分與因子分析_第1頁
主成分與因子分析_第2頁
主成分與因子分析_第3頁
主成分與因子分析_第4頁
主成分與因子分析_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

主成份分析與因子分析轉(zhuǎn)載自網(wǎng)站/teachers/lidf/docs/statsoft/html/statsoft.html作者:北京大學(xué)概率統(tǒng)計(jì)系李東風(fēng)現(xiàn)實(shí)中的統(tǒng)計(jì)對(duì)象經(jīng)常用多個(gè)指標(biāo)來表示,比如人口普查,就可以有姓名、性別、出生年月日、籍貫、婚姻狀況、民族、政治面貌、地區(qū)等,企業(yè)調(diào)查,可以有凈資產(chǎn)、負(fù)債、盈利、職工人數(shù)、還貸情況等等。多個(gè)指標(biāo)(變量)可以分別進(jìn)行分析,但是,我們往往希望綜合使用這些指標(biāo),這時(shí),有主成份分析、因子分析等方法可以把數(shù)據(jù)的維數(shù)降低,同時(shí)又盡量不損失數(shù)據(jù)中的信息。I.主成份分析一、理論介紹主成份分析的目的是從原始的多個(gè)變量取若干線性組合,能盡可能多地保留原始變量中的信息。從原始變量到新變量是-個(gè)正交變換(坐標(biāo)變換).設(shè)有x=(趴…誑)'是一個(gè)維隨機(jī)變量,u=E(X)£=有二階矩,記,??紤]它的線性變換易見??冢ぃǘ?,與)=如果要用‘1盡可能多地保留原始的'的信息,經(jīng)典的辦法是使‘1的方差盡可能大,這需要對(duì)線性11[1]=1匕變換的系數(shù)加限制,一般要求它是單位向量,即。其它的各也希望盡可能多地保留的信息,但前面的已保留的信息就不再保留,即要求頃序)=0口二1,一一挪-1131/13=1,同時(shí)對(duì)也有的要求,在這樣的條件下使Var(Y;)y>2P>0最大。設(shè)協(xié)方差陣乙的特征值為,相應(yīng)的單位特征向量分別為(當(dāng)特征根有重根時(shí)單位特征向量不唯一)。這時(shí)&的第個(gè)主成分為—i=1?---Var(Y^)=^占=(%…aP),,且。記,,其中,為主成份主成份與原始變量為了減少變量的個(gè)數(shù),希望前幾個(gè)就可以代表八的大部分信息。定義為的主對(duì)角線元素。稱為因子負(fù)荷量(factorloading),可以證明則刀■為正交陣,=AX的相關(guān)系數(shù)的貢獻(xiàn)率,稱為主成份的累計(jì)貢獻(xiàn)率。一般取使得累計(jì)貢獻(xiàn)率達(dá)到70%—80%以上。累計(jì)貢獻(xiàn)率表示個(gè)主成份從中提取了多少信息,但沒有表達(dá)用它來恢復(fù)每一個(gè)能恢復(fù)多少,為此定義個(gè)主成份對(duì)原始變量m的貢獻(xiàn)率匕,匕為對(duì)的復(fù)相關(guān)系數(shù)平方,可以用公式計(jì)算(注Im,其中,為主成份主成份與原始變量為了減少變量的個(gè)數(shù),希望前幾個(gè)就可以代表八的大部分信息。定義為的主對(duì)角線元素。稱為因子負(fù)荷量(factorloading),可以證明則刀■為正交陣,=AX的相關(guān)系數(shù)的貢獻(xiàn)率,稱為主成份的累計(jì)貢獻(xiàn)率。一般取使得累計(jì)貢獻(xiàn)達(dá)用它來恢復(fù)每一個(gè)能恢復(fù)多少,為此定義個(gè)主成份對(duì)原始變量m的貢獻(xiàn)率匕,匕為對(duì)的復(fù)相關(guān)系數(shù)平方,可以用公式計(jì)算(注Im=pK=1…時(shí))。前個(gè)主成份在'的個(gè)線性組合中能對(duì)偵最好地線性逼近。在上面的主成份計(jì)算方法中,方差越大的變量越被優(yōu)先保留信息準(zhǔn)化,即令X-EX..實(shí)際中為了消除這種影響經(jīng)常把變量標(biāo)這時(shí)的協(xié)方差陣就是的相關(guān)陣氏。這時(shí),主成份的協(xié)方差陣是,其中為氏的特征根;的相關(guān)系數(shù)(因子負(fù)荷量)為心)二成&,其中主成份為R的對(duì)應(yīng)廠(就*)=&的單位特征向量;對(duì)于X的觀測(cè)樣本,設(shè)第t次觀測(cè)為,把數(shù)據(jù)寫成矩陣形式為由'得協(xié)方差陣£的估計(jì)的相關(guān)系數(shù)(因子負(fù)荷量)為心)二成&,其中主成份為R的對(duì)應(yīng)廠(就*)=&的單位特征向量;對(duì)于X的觀測(cè)樣本,設(shè)第t次觀測(cè)為,把數(shù)據(jù)寫成矩陣形式為由'得協(xié)方差陣£的估計(jì)£或丑可以得到主成份分解。計(jì)算特征值和單位特征向量,仍記為E和相關(guān)陣K的估計(jì)胃,從|里1?'-^2?■■■?p,用作為X的第i主成份,份得分矩陣為1=曲。可以把稱為第t個(gè)觀測(cè)的主成份得分。結(jié)果得到的主成而Y的前幾行作為維數(shù)壓縮后的數(shù)據(jù)。在SAS的PRINCOMP中計(jì)二、用PRINCOMP過程計(jì)算主成份分析SAS的PRINTCOMP過程有如下功能:完成主成份分析。主成份的個(gè)數(shù)可以由用戶自己確定,主成份的名字可以用戶自己規(guī)定,主成份得分是否標(biāo)準(zhǔn)化可自己規(guī)定。輸入數(shù)據(jù)集可以是原始數(shù)據(jù)集、相關(guān)陣、協(xié)方差陣或叉積陣。輸入為原始數(shù)據(jù)時(shí),用戶還可以規(guī)定從協(xié)方差陣出發(fā)還是從相關(guān)陣出發(fā)進(jìn)行分析。由協(xié)方差陣出發(fā)時(shí)方差大的變量在分析中起到更大的作用。計(jì)算結(jié)果有:簡(jiǎn)單統(tǒng)計(jì)量,相關(guān)陣或協(xié)方差陣,從大到小排序的特征值和相應(yīng)特征向量,每個(gè)主成份解釋的方差比例,累計(jì)比例等。可生成兩個(gè)輸出數(shù)據(jù)集:一個(gè)包含原始數(shù)據(jù)及主成份得分,另一個(gè)包含有關(guān)統(tǒng)計(jì)量,類型為TYPE=CORR或COV??山沂咀兞块g的共線關(guān)系。若某特征值特別接近0說明變量線性相關(guān),這時(shí)用這些變量作回歸自變量可能得到錯(cuò)誤的結(jié)果。PRINCOMP主要使用PROCPRINCOMP語句與VAR語句。PROCPRINCOMP語句用來規(guī)定輸入輸出和一些運(yùn)行選項(xiàng),包括:DATA=輸入數(shù)據(jù)集,可以是原始數(shù)據(jù)集,也可以是TYPE=CORR,COV的數(shù)據(jù)集OUT=輸出包含原始數(shù)據(jù)和主成份得分的數(shù)據(jù)集OUTSTAT二統(tǒng)計(jì)量輸出數(shù)據(jù)集COV要求從協(xié)方差陣出發(fā)計(jì)算主成份。缺省為從相關(guān)陣出發(fā)計(jì)算。N二要計(jì)算的主成份個(gè)數(shù)。缺省時(shí)全算。NOINT要求在模型中不使用截距項(xiàng)。這時(shí)統(tǒng)計(jì)量輸出數(shù)據(jù)集類型為TYPE=UCORR或UCOV。STD要求在OUT=的數(shù)據(jù)集中把主成份得分標(biāo)準(zhǔn)化為單位方差。不規(guī)定時(shí)方差為相應(yīng)特征值。用VAR語句指定原始變量。必須為數(shù)值型(區(qū)間變量)。三、應(yīng)用舉例例1.一月和七月平均氣溫的主成份分析在數(shù)據(jù)集TEMPERAT中存放有美國(guó)一些城市一月和七月的平均氣溫。我們希望對(duì)這兩個(gè)氣溫進(jìn)行主成分分析,希望用一個(gè)統(tǒng)一的溫度來作為總的可比的溫度,所以進(jìn)行主成份分析。程序如下:/^EXAMPLE1*/DATATEMPERAT;INPUTCITY$1-15JANUARYJULY;CARDS;MOBILE51.281.6PHOENIX51.291.2LITTLEROCK39.581.4SACRAMENTO45.175.2DENVER29.973.0HARTFORD24.872.7WILMINGTON32.075.8WASHINGTONDC35.678.7JACKSONVILLE54.681.0MIAMI67.282.3ATLANTA42.478.0BOISE29.074.5CHICAGO22.971.9PEORIA23.875.1INDIANAPOLIS27.975.0DESMOINES19.475.1WICHITA31.380.7LOUISVILLE33.376.9NEWORLEANS52.981.9PORTLAND,MAINE21.568.0BALTIMORE33.476.6

BOSTON29.273.3DETROIT25.573.3SAULTSTEMARIE14.263.8DULUTH8.565.6MINNEAPOLIS12.271.9JACKSON47.181.7KANSASCITY27.878.8STLOUIS31.378.6GREATFALLS20.569.3OMAHA22.677.2RENO31.969.3CONCORD20.669.7ATLANTICCITY32.775.1ALBUQUERQUE35.278.7ALBANY21.572.0BUFFALO23.770.1NEWYORK32.276.6CHARLOTTE42.178.5RALEIGH40.577.5BISMARCK8.270.8CINCINNATI31.175.6CLEVELAND26.971.4COLUMBUS28.473.6OKLAHOMACITY36.881.5PORTLAND,OREG38.167.1PHILADELPHIA32.376.8PITTSBURGH28.171.9PROVIDENCE28.472.1COLUMBIA45.481.2SIOUXFALLS14.273.3MEMPHIS40.579.6NASHVILLE38.379.6DALLAS44.884.8ELPASO43.682.3HOUSTON52.183.3SALTLAKECITY28.076.7BURLINGTON16.869.8NORFOLK40.578.3RICHMOND37.577.9SPOKANE25.469.7CHARLESTON,WV34.575.0MILWAUKEE19.469.9CHEYENNE26.669.1

PROCPRINCOMPCOVOUT=PRIN;VARJULYJANUARY;RUN;在INSIGHT在INSIGHT中打開WORK.PRIN,分別繪制JULY對(duì)JANUARY、PRIN2對(duì)PRIN1的散點(diǎn)圖(圖1)。從圖可以看出主成份為原始變量的一個(gè)正交旋轉(zhuǎn)。輸出如下:PrincipalComponentAnalysis62Observations2VariablesSimpleStatisticsJULYJANUARYMean75.9209677432.55483871StD4.8806119311.59197967CovarianceMatrixJULYJANUARYJULY23.820372843.4319461JANUARY43.4319461134.3739926TotalVariance=158.19436542EigenvaluesoftheCovarianceMatrixEigenvalueDifferenceProportionCumulativePRIN1149.396140.5970.944380PRIN1149.396140.5970.9443800.94438PRIN28.7990.0556201.00000EigenvectorsPRIN28.7990.0556201.00000PRIN1PRIN2JULY0.3268660.945071JANUARY0.945071-.326866輸出中,第一部分為簡(jiǎn)單統(tǒng)計(jì)量(均值和標(biāo)準(zhǔn)差),第二部分為協(xié)方差的特征值(注意我們?cè)谶^程中用了COV選項(xiàng),無此選項(xiàng)用相關(guān)陣),從這里可以看到貢獻(xiàn)率(Proportion)和累計(jì)貢獻(xiàn)率(Cumulative),第三部分為特征向量。按本結(jié)果的特征向量值及用COV選項(xiàng)規(guī)定使用協(xié)方差陣,我們可以知道兩個(gè)主成份如此計(jì)算:PRIN1=0.326866(JULY-75.92)+0.945071(JANUARY-32.55)PRIN2=0.945071(JULY-75.92)+(-0.326866)(JANUARY-32.55)如果沒有用COV選項(xiàng),原始變量還需要除以標(biāo)準(zhǔn)差。由系數(shù)可見,第一主成份是兩個(gè)月份的加權(quán)平均,代表了一個(gè)地方的氣溫水平,第二主成份系數(shù)一正一負(fù),反應(yīng)了冬季和夏季的氣溫差別。例2.美國(guó)各種類型犯罪的主成份分析在數(shù)據(jù)集CRIME中有美國(guó)各個(gè)州的各種類型犯罪的犯罪率數(shù)據(jù)。希望對(duì)這些犯罪率數(shù)據(jù)進(jìn)行主成份分析以概括犯罪情況。程序如下:/*EXAMPLE2*/DATACRIME;TITLE'各州每十萬人的犯罪率’;INPUTSTATE$1-15MURDERRAPEROBBERYASSAULTBURGLARYLARCENYAUTO;CARDS;ALABAMA14.225.296.8278.31135.51881.9280.7ALASKA10.851.696.8284.01331.73369.8753.3ARIZONA9.534.2138.2312.32346.14467.4439.5ARKANSAS8.827.683.2203.4972.61862.1183.4CALIFORNIA11.549.4287.0358.02139.43499.8663.5COLORADO6.342.0170.7292.91935.23903.2477.1CONNECTICUT4.216.8129.5131.81346.02620.7593.2DELAWARE6.024.9157.0194.21682.63678.4467.0FLORIDA10.239.6187.9449.11859.93840.5351.4GEORGIA11.731.1140.5256.51351.12170.2297.9HAWAII7.225.5128.064.11911.53920.4489.4

IDAHO5.519.439.6172.51050.82599.6237.6ILLINOIS9.921.8211.3209.01085.02828.5528.6INDIANA7.426.5123.2153.51086.22498.7377.4IOWA2.310.641.289.8812.52685.1219.9KANSAS6.622.0100.7180.51270.42739.3244.3KENTUCKY123.3872.21662.1245.4LOUISIANA15.530.9142.9335.51165.52469.9337.7MAINE2.413.538.7170.01253.12350.7246.9MARYLAND8.034.8292.1358.91400.03177.7428.5MASSACHUSETTS3.120.8169.1231.61532.22311.31140.MICHIGAN9.338.9261.9274.61522.73159.0545.5MINNESOTA2.719.585.985.81134.72559.3343.1MISSISSIPPI14.319.665.7189.1915.61239.9144.4MISSOURI9.628.3189.0233.51318.32424.2378.4MONTANA5.416.739.2156.8804.92773.2309.2NEBRASKA3.918.164.7112.7760.02316.1249.1NEVADA15.849.1323.1355.02453.14212.6559.2NEWHAMPSHIRE3.210.723.276.01041.72343.9293.4NEWJERSEY5.621.0180.4185.11435.82774.5511.5NEWMEXICO8.839.1109.6343.41418.73008.6259.5NEWYORK10.729.4472.6319.11728.02782.0745.8NORTHCAROLINA10.617.061.3318.31154.12037.8192.1NORTHDAKOTA0.99.013.343.8446.11843.0144.7OHIO7.827.3190.5181.11216.02696.8400.4OKLAHOMA8.629.273.8205.01288.22228.1326.8OREGON4.939.9124.1286.91636.43506.1388.9PENNSYLVANIA5.619.0130.3128.0877.51624.1333.2RHODEISLAND3.610.586.5201.01489.52844.1791.4SOUTHCAROLINA11.933.0105.9485.31613.62342.4245.1SOUTHDAKOTA2.013.517.9155.7570.51704.4147.5TENNESSEE10.129.7145.8203.91259.71776.5314.0TEXAS13.333.8152.4208.21603.12988.7397.6UTAH3.520.368.8147.31171.63004.6334.5VERMONT1.415.930.8101.21348.22201.0265.2VIRGINIA9.023.392.1165.7986.22521.2226.7WASHINGTON4.339.6106.2224.81605.63386.9360.3WESTVIRGINIA6.013.242.290.9597.41341.7163.3WISCONSIN2.812.952.263.7846.92614.2220.7WYOMING5.421.939.7173.9811.62772.2282.0;PROCPRINCOMP(OUT=CRIMCOMP;RUN;PROCSORT;

BYPRIN1;PROCPRINT;IDSTATE;VARPRIN1PRIN2MURDERRAPEROBBERYASSAULTBURGLARYLARCENYAUTO;TITLE2'各州按第一主成份作為總犯罪率排列’;PROCSORT;BYPRIN2;PROCPRINT;IDSTATE;VARPRIN1PRIN2MURDERRAPEROBBERYASSAULTBURGLARYLARCENYAUTO;TITLE2'各州按第二主成份作為金錢犯罪與暴力犯罪對(duì)比的排列’;PROCGPLOT;PLOTPRIN2*PRIN1二STATE;TITLE2,PLOTOFTHEFIRSTTWOPRINCIPALCOMPONENTS';PROCGPLOT;PLOTPRIN3*PRIN1=STATE;TITLE2,PLOTOFTHEFIRSTANDTHIRDPRINCIPALCOMPONENTS';RUN;輸入數(shù)據(jù)后,用PROCPRINCOMP對(duì)數(shù)據(jù)進(jìn)行主成份分析,結(jié)果先給出了各變量的簡(jiǎn)單統(tǒng)計(jì)量,變量的相關(guān)陣,其特征值和特征向量結(jié)果如下:EigenvaluesoftheCorrelationMatrixEigenvalueDifferenceProportionCumulativeEigenvalueDifferenceProportionPRIN10.587854.114962.876240.587851PRIN20.764811.238720.512910.176960PRIN30.868500.725820.409380.103688PRIN40.913700.316430.058460.045205PRIN50.950560.257970.035930.036853

PRIN60.982280.222040.097980.031720PRIN71.000000.12406.0.017722EigenvectorsPRIN7PRIN1PRIN2PRIN3PRIN4PRIN5PRIN6MURDER0.2675930.300279-.6291740.178245-.2321140.5381230.259117RAPE-.2964850.431759-.169435-.2441980.0622160.188471-.773271ROBBERY-.0039030.3968750.0422470.495861-.557989-.519977-.114385ASSAULT0.1917450.396652-.343528-.0695100.629804-.5066510.172363BURGLARY-.6481170.4401570.203341-.209895-.0575550.1010330.535987LARCENY0.6016900.3573600.402319-.539231-.2348900.0300990.039406AUTO0.2951770.5024210.5683840.4192380.369753-.0572980.147046第一主成份貢獻(xiàn)率只有59%,前兩個(gè)主成份累計(jì)貢獻(xiàn)率達(dá)到76%,可以用前兩個(gè)主成份。前三個(gè)主成份累計(jì)貢獻(xiàn)率已達(dá)到87%,所以前三個(gè)主成份可以表現(xiàn)犯罪率的大部分信息。第一主成份的計(jì)算系數(shù)都是正數(shù),所以它是一個(gè)州的犯罪率的一個(gè)加權(quán)平均,代表這個(gè)州的總的犯罪情況。第二主成份在入室盜竊(BURGLARY)、盜竊罪(LARCENY)、汽車犯罪(AUTO)上有較大的正系數(shù),在謀殺(MURDER)、強(qiáng)奸(RAPE)、攻擊(ASSAULT)上有較大的負(fù)系數(shù),所以代表了暴力犯罪與其它犯罪的一種對(duì)比。第三主成份為搶劫、汽車犯罪等與盜竊罪、入室盜竊、強(qiáng)奸的對(duì)比,其意義不易解釋。為了看出各州按第一主成份和第二主成份由低到高排列的情況,先用SORT過程排了序,然后用PRINT過程打印了結(jié)果(結(jié)果略)。在按第一主成份排序中,NorthDakota、SouthDakota、WestVirginia排列在前,說明其犯罪率最低,Nevada、California排列在后,說明其犯罪率最高。在按第二主成份排列的結(jié)果中,Mississippi排在最前,說明其暴力犯罪最高,Massachusetts最后,說明其暴力犯罪最低。后面用PLOT過程畫了主成分的散點(diǎn)圖。四、用SAS/INSIGHT進(jìn)行主成份分析在SAS/INSIGHT中可進(jìn)行主成份分析。例如,對(duì)于上面的WORK.CRIME數(shù)據(jù)集,在INSIGHT中打開它后,選“Analyze|Multivariate(Y's)”,彈出選擇變量的對(duì)話框,把各犯罪率變量都選為Y變量,然后按Output按鈕,選中主成份分析(PrincipalComponentAnalysis)復(fù)選框,OK后就得到了多變量分析結(jié)果(包括原始變量的簡(jiǎn)單統(tǒng)計(jì)量、相關(guān)陣)和主成份分析的結(jié)果(特征值、累計(jì)貢獻(xiàn)率、特征向量)。另外還畫了前兩個(gè)主成份的散點(diǎn)圖。II.因子分析一、理論簡(jiǎn)介主成份分析作'個(gè)原始變量的祖?zhèn)€線性組合,這些線性組合在原始變量的所有歡個(gè)線性組合中可以最好地預(yù)報(bào)原始變量。因子分析對(duì)主成份分析進(jìn)行了推廣,它用潛在的個(gè)“因子”來概括原始變量的信息,這些因子不一定是原始變量的線性組合。設(shè)X為1隨機(jī)向量,其均值為,協(xié)方差陣為,我們稱里有個(gè)因子的模型,pxk八pu:xlfu廣是未知常數(shù)陣,『和為隨機(jī)向量。稱為公共因子,叫做特殊因子,叫因子負(fù)荷矩陣。這個(gè)模型象是回歸分析模型,但是這里*是多元隨機(jī)變量而不是一個(gè)隨機(jī)變量的樣本,[也是隨機(jī)變量而不是一般的回歸系數(shù)。求因子分解要用到原始變量協(xié)方差陣E與「、特殊因子的協(xié)方差陣中的如下關(guān)系式:公因子模型分解是不唯一的,因?yàn)槿绻甘且粋€(gè)正交陣,則有x二“+(AT)(「T)+u這時(shí)]f是新的因子,at是新的因子負(fù)荷陣。我們可以利用這一特點(diǎn)對(duì)得到的因子模型進(jìn)行旋轉(zhuǎn)以產(chǎn)生容易解釋的因子。旋轉(zhuǎn)時(shí)一般試圖使因子載荷系數(shù)靠近正負(fù)1和0,這樣容易解釋因子的組成。二、FACTOR過程使用SAS/STAT的FACTOR過程可以進(jìn)行因子分析、分量分析和因子旋轉(zhuǎn)。對(duì)因子模型可以使用正交旋轉(zhuǎn)和斜交旋轉(zhuǎn),可以用回歸法計(jì)算得分系數(shù),同時(shí)把因子得分的估計(jì)存貯在輸出數(shù)據(jù)集中;用FACTOR過程計(jì)算的所有主要統(tǒng)計(jì)量也能存貯在輸出數(shù)據(jù)集中。FACTOR過程用法很簡(jiǎn)單,主要使用如下語句:PROCFACTORDATA=數(shù)據(jù)集選項(xiàng);VAR原始變量RUN;輸出結(jié)果包括特征值情況、因子載荷、公因子解釋比例,等等。為了計(jì)算因子得分,一般在PROCFACTOR語句中加一個(gè)SCORE選項(xiàng)和“OUTSTAT=輸出數(shù)據(jù)集”選項(xiàng),然后用如下的得分過程計(jì)算公因子得分:PROCSCOREDATA二原始數(shù)據(jù)集SCORE=FACTOR過程的輸出數(shù)據(jù)集OUT=得分輸出數(shù)據(jù)集;VAR用來計(jì)算得分的原始變量集合;RUN;三、例子數(shù)據(jù)集SOCECON為洛杉基12個(gè)地區(qū)統(tǒng)計(jì)的五個(gè)社會(huì)經(jīng)濟(jì)指標(biāo):人口總數(shù)(POP),教育程度(SCHOOL),就業(yè)數(shù)(EMPLOY),服務(wù)業(yè)人數(shù)(SERVICES),中等的房?jī)r(jià)(HOUSE)。用FACTOR過程可以進(jìn)行主成份分析。下例中的SIMPLE選項(xiàng)要求計(jì)算變量的簡(jiǎn)單統(tǒng)計(jì)量,CORR要求輸出相關(guān)陣。DATASOCECON;TITLE'五個(gè)經(jīng)濟(jì)指標(biāo)的分析’;INPUTPOPSCHOOLEMPLOYSERVICESHOUSE;CARDS;570012.8250027025000100010.9600101000034008.81000109000380013.6170014025000400012.816001402500082008.326006012000120011.44001016000910011.533006014000990012.5340018018000960013.736003902500096009.633008012000940011.4400010013000PROCFACTORDATA=SOCECONSIMPLECORR;TITLE2,主成份分析’;RUN;結(jié)果給出了五個(gè)變量的簡(jiǎn)單統(tǒng)計(jì)量,相關(guān)陣,和相關(guān)陣的特征值、累計(jì)貢獻(xiàn):

5Eigenvalue2.87331.79670.21480.09990.0153Difference1.07671.58180.11490.0847Proportion0.57470.35930.04300.02000.0031Cumulative0.57470.93400.97700.99691.00002factorswillberetainedbytheMINEIGENcriterion.前兩個(gè)主成份解釋了93.4%的方差,按照缺省的選擇因子個(gè)數(shù)的準(zhǔn)則MINEIGEN,取大于1的特征值,所以取兩個(gè)因子。因子模式陣(factorpattern,或稱因子載荷陣)為最重要的結(jié)果之一:FactorPatternFACTOR1FACTOR2POP0.580960.80642SCHOOL0.76704-0.54476EMPLOY0.672430.72605SERVICES0.93239-0.10431HOUSE0.79116-0.55818它們是用公因子預(yù)報(bào)原始變量的回歸系數(shù)。第一主成份(因子)在所有五個(gè)變量上都有正的載荷,可見這個(gè)因子反應(yīng)了城市規(guī)模的影響。第二主成份在人口、就業(yè)上有大的正載荷,在教育程度和住房?jī)r(jià)格上有大的負(fù)載荷,則第二個(gè)因子較大的城市人口多但是教育程度和住房?jī)r(jià)格低。結(jié)果還給出了公因子解釋能力的估計(jì):FinalCommunalityEstimates:Total=4.669974POPSCHOOLEMPLOYSERVICESHOUSE0.9878260.8851060.9793060.8802360.937500這里給出了公因子對(duì)每一個(gè)原始變量的解釋能力的量度,這是用原始變量對(duì)公因子的復(fù)相關(guān)系數(shù)平方(取0到1間值)來計(jì)算的。CommunalityEstimate是這些復(fù)相關(guān)系數(shù)平方的總和。因?yàn)槊恳粋€(gè)復(fù)相關(guān)系數(shù)平方都比較大,所以我們可以認(rèn)為兩個(gè)公因子可以很好地解釋原始變量中的信息。但是我們得到的因子解釋不夠清楚,于是考慮用其它的因子分析方法。

我們來進(jìn)行主因子分析。用FACTOR過程作主因子分析與作主成份分析的不同只是增加一個(gè)PRIORS=選項(xiàng),可以用PRIORS=SMC或者M(jìn)AX、ONE等。例如:PROCFACTORDATA=SOCECONpriors=smc;TITLE2,主因子分析’;RUN;主因子法計(jì)算簡(jiǎn)約了的相關(guān)陣的特征值(相當(dāng)于£一下的估計(jì)),所以其特征值可能為負(fù)值。選取因子個(gè)數(shù)的缺省準(zhǔn)則是PROPORTIONS,即累計(jì)特征值達(dá)到特征值總和的100%。這樣取了兩個(gè)因子。結(jié)果與主成份分析相似。為了得到好的因子解釋,我們?cè)谏厦娴腜ROCFACTOR語句中再加上一個(gè)ROTATE=PROMAX旋轉(zhuǎn)選項(xiàng),這樣將在得到主因子分析后先產(chǎn)生方差最大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論