




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、多元統(tǒng)計(jì)分析概述目錄一、引言3二、多元統(tǒng)計(jì)分析方法的研究對(duì)象和主要內(nèi)容31 .多元統(tǒng)計(jì)分析方法的研究對(duì)象32 .多元統(tǒng)計(jì)分析方法的主要內(nèi)容3三、各種多元統(tǒng)計(jì)分析方法31 .回歸分析32 .判別分析63 .聚類分析84 .主成分分析105 .因子分析106 .對(duì)應(yīng)分析方法117 .典型相關(guān)分析11四、多元統(tǒng)計(jì)分析方法的一般步驟12五、多元統(tǒng)計(jì)分析方法在各個(gè)自然領(lǐng)域中的應(yīng)用12六、總結(jié)1315參考文獻(xiàn)14謝辭一、引言統(tǒng)計(jì)分布是用來(lái)刻畫隨機(jī)變量特征及規(guī)律的重要手段,是進(jìn)行統(tǒng)計(jì)分布的基礎(chǔ)和提高。多元統(tǒng)計(jì)分析方法則是建立在多元統(tǒng)計(jì)分布基礎(chǔ)上的一類處理多元統(tǒng)計(jì)數(shù)據(jù)方法的總稱,是統(tǒng)計(jì)學(xué)中的具有豐富理論成果和
2、眾多應(yīng)用方法的重要分支。在本文中,我們將對(duì)多元統(tǒng)計(jì)分析方法做一個(gè)大體的描述,并通過(guò)一部分實(shí)例來(lái)進(jìn)一步了解多元統(tǒng)計(jì)分析方法的具體實(shí)現(xiàn)過(guò)程。二、多元統(tǒng)計(jì)分析方法的研究對(duì)象和主要內(nèi)容(一)多元統(tǒng)計(jì)分析方法的研究對(duì)象由于大量實(shí)際問(wèn)題都涉及到多個(gè)變量,這些變量又是隨機(jī)變量,所以要討論多個(gè)隨機(jī)變量的統(tǒng)計(jì)規(guī)律性。多元統(tǒng)計(jì)分析就是討論多個(gè)隨機(jī)變量理論和統(tǒng)計(jì)方法的總稱。其內(nèi)容包括一元統(tǒng)計(jì)學(xué)中某些方法的直接推廣,也包括多個(gè)隨即便量特有的一些問(wèn)題,多元統(tǒng)計(jì)分析是一類范圍很廣的理論和方法?,F(xiàn)實(shí)生活中,受多個(gè)隨機(jī)變量共同作用和影響的現(xiàn)象大量存在。統(tǒng)計(jì)分析中,有兩種方法可同時(shí)對(duì)多個(gè)隨機(jī)變量的觀測(cè)數(shù)據(jù)進(jìn)行有效的分析和研究。
3、一種方法是把多個(gè)隨機(jī)變量分開分析,一次處理一個(gè)隨機(jī)變量,分別進(jìn)行研究。但是,這樣處理忽略了變量之間可能存在的相關(guān)性,因此,一般丟失的信息太多,分析的結(jié)果不能客觀全面的反映整個(gè)問(wèn)題,而且往往也不容易取得好的研究結(jié)論。另一種方法是同時(shí)對(duì)多個(gè)隨機(jī)變量進(jìn)行研究分析,此即多元統(tǒng)計(jì)方法。通過(guò)對(duì)多個(gè)隨即使量觀測(cè)數(shù)據(jù)的分析,來(lái)研究隨機(jī)變量總的特征、規(guī)律以及隨機(jī)變量之間的相互關(guān)系。所以,多元統(tǒng)計(jì)分析是研究多個(gè)隨機(jī)變量之間相互依賴關(guān)系及內(nèi)在統(tǒng)計(jì)規(guī)律的一門統(tǒng)計(jì)學(xué)科。(二)多元統(tǒng)計(jì)分析方法的主要內(nèi)容近年來(lái),隨著統(tǒng)計(jì)理論研究的不斷深入,多元統(tǒng)計(jì)分析方法的內(nèi)容一直在豐富。其中,主要內(nèi)容包括多元正態(tài)總體參數(shù)估計(jì)、假設(shè)檢驗(yàn)和
4、常用的多元統(tǒng)計(jì)方法。多元正態(tài)總體參數(shù)估計(jì)、假設(shè)檢驗(yàn)是多元統(tǒng)計(jì)推斷的核心和基礎(chǔ),而常用的多元統(tǒng)計(jì)分析方法則是具體應(yīng)用。從形式上,常用多元統(tǒng)計(jì)分析方法可劃分為兩類:一類屬于單變量常用的統(tǒng)計(jì)方法在多元隨機(jī)變量情況下的推廣和應(yīng)用,如多元回歸分析,典型相關(guān)分析等;另一類是對(duì)多元變量本身進(jìn)行研究所形成的一些特殊方法。如主成分分析,因子分析,聚類分析,判別分析,對(duì)應(yīng)分析等。三、各種多元統(tǒng)計(jì)分析方法具體來(lái)說(shuō),常用的多元統(tǒng)計(jì)分析方法主要包括:多元回歸分析、聚類分析、判別分析、主成分分析、因子分析、對(duì)應(yīng)分析、典型相關(guān)分析等。下面我們對(duì)各種多元統(tǒng)計(jì)分析方法就行分別描述,(一)回歸分析回歸分析是最靈活最常用的統(tǒng)計(jì)分析
5、方法之一,它用于分析一個(gè)因變量與一個(gè)或多個(gè)自變量之間的關(guān)系。特別是用于:(1)定量的描述和解釋相互關(guān)系;(2)估測(cè)或預(yù)測(cè)因變量的值?;貧w分析方法是在眾多的相關(guān)變量中,根據(jù)實(shí)際問(wèn)題考察其中一個(gè)或多個(gè)變量與其余變量的依賴關(guān)系。如果只要考察一個(gè)變量與其余多個(gè)變量之間的相互依賴關(guān)系,我們稱為多元回歸問(wèn)題。若要同時(shí)考察多個(gè)因變量與多個(gè)自變量之間的相互依賴關(guān)系,我們稱為多因變量的多元回歸問(wèn)題。多元回歸分析是研究因變量Y與m個(gè)自變量為,x2,Xm的相關(guān)關(guān)系,而且總是假設(shè)因變量Y為隨機(jī)變量,而X1,X2,;Xm為一般變量。下面我們來(lái)看一下多元線性回歸模型的建立。假定因變量Y與Xi,X2,Xm線性相關(guān)。收集到的
6、n組數(shù)據(jù)(yt,Xti,Xt2,L,Xtm)(t=1,2,n)滿足以下回歸模型:yt01Xt1十E(t)0,Var(t)mXtmt(t1,2,L,n)2,Cov(j)0(ij)或t-N(0,2),相互獨(dú)立(t=1,2,Ln).C=M1X11KOXn1LX1mMXnm(1nMX),y1Vy2'Myn則所建回歸模型的矩陣形式為01Mm12MnYE(0n,D(2In,CNn(0,2In),并稱它們?yōu)榻?jīng)典多元回歸模型,其中Y是可觀測(cè)的隨機(jī)向量,是不可觀測(cè)的隨機(jī)向量,C是已知矩陣,,2是未知參數(shù),并設(shè)n>m,且rank(C)=m+1。在經(jīng)典回歸分析中,我們討論模型中參數(shù)(0,1,L,m)和
7、2的估計(jì)和檢驗(yàn)問(wèn)題。近代回歸分析中討論變量篩選、估計(jì)的改進(jìn),以及對(duì)模型中的一些假設(shè)進(jìn)行診斷等問(wèn)題。我國(guó)國(guó)內(nèi)生產(chǎn)總值與基本建設(shè)投資額的大小有密切關(guān)系,研究發(fā)現(xiàn)兩變量之間存在線性關(guān)系。根據(jù)甘肅省1990-2003年的國(guó)內(nèi)生產(chǎn)總值與基本建設(shè)投資額數(shù)據(jù),研究它們的數(shù)量規(guī)律性,探討甘肅省基本建設(shè)投資額與國(guó)內(nèi)生產(chǎn)總值的數(shù)量關(guān)系,原始數(shù)據(jù)見下表。年份GDP(億元)基本建設(shè)投資(億元)1990242.829.041991271.3933.961992317.7939.221993372.2442.891994451.6658.191995553.3562.621996714.18101.421997781.3
8、4121.741998869.75157.141999931.98187.492000983.36208.2820011072.51228.6320021161.43263.0620031304.6307.3利用excel進(jìn)行分析,具體輸出以下數(shù)據(jù),平方和自由度方差F檢驗(yàn)值回歸1553189.711553189.7殘差59475.667124956.3056313.3765001離差1612665.413復(fù)相關(guān)系數(shù)R=.981386594345333剩余標(biāo)準(zhǔn)差SY=70.4010340269248回歸方差與剩余方差之比F=313.376500123223各個(gè)自變量的t檢驗(yàn)值17.7024433
9、4t檢驗(yàn)的自由度N-P-1=12F檢驗(yàn)的自由度第一自由度=1,第二自由度=12各個(gè)自變量的偏回歸平方和1553189.7各個(gè)自變量的偏相關(guān)系數(shù)0.981386594由輸出結(jié)果,得以下結(jié)論:其中,負(fù)相關(guān)系數(shù)為R2回歸方程為y=232.70+3.68x1=0.9814,說(shuō)明回歸方程擬合優(yōu)度較高。而回歸系數(shù)的t=17.7024,查t分布表to.025(12)2.1788,小于t值,因此回歸系數(shù)顯著。查F分布表,F(xiàn)o.o5(1,12)4.75,由下表知,F(xiàn)=313.3765>4.75,因此回歸方程也顯著。平方和自由度方差F檢驗(yàn)值回歸1553189.711553189.7313.3765001殘差
10、59475.667124956.3056離差1612665.413(二)判別分析判別分析是多元統(tǒng)計(jì)分析中用于判別樣品所屬類型的一種統(tǒng)計(jì)分析方法,是一種在已知研究對(duì)象用某種方法已經(jīng)分成與若干類的情況下,確定新的樣品屬于哪一類的多元統(tǒng)計(jì)分析方法。判別方法處理問(wèn)題時(shí),通常通常要給出用來(lái)衡量新樣品與各已知組別的接近程度的指數(shù),即判別函數(shù),同時(shí)也指定一種判別準(zhǔn)則,借以判別新樣品的歸屬。所謂判別準(zhǔn)則是用于衡量新樣品與各已知組別接近程度的理論依據(jù)和方法準(zhǔn)則。常用的有,距離準(zhǔn)則、Fisher準(zhǔn)則、貝葉斯準(zhǔn)則等。距離判別的基本思想是:樣品和那個(gè)總體距離最近,就判斷它屬于哪個(gè)總體。距離判別也稱直觀判別。已知有兩個(gè)
11、類G和G2,比如G是設(shè)備A生產(chǎn)的產(chǎn)品,G2是設(shè)備B生產(chǎn)的同類產(chǎn)品。設(shè)備A的產(chǎn)品質(zhì)量高(如考察指標(biāo)為耐磨度X),其平均耐磨度=80,反映設(shè)備精度的方差12=0.25;設(shè)備B的產(chǎn)品質(zhì)量稍差,其平均耐磨度2=75,反映設(shè)備精度的方差;二4。今有一產(chǎn)品X。,測(cè)得耐磨度x0=78,試判斷該產(chǎn)品是哪一臺(tái)設(shè)備生產(chǎn)的?下面考慮一種相對(duì)于分散性的距離。記X0與G1或G2的相對(duì)平均距離為222(x)2d1(X0)或d2(x0),則有:d1(X0)=21d2(x1)2d2(X0)=22_2(78=2.25。4.00因?yàn)閐2(X0)=1.5<4=d1(%),按這種距離準(zhǔn)則應(yīng)判X0為設(shè)備B生產(chǎn)的般的,我們假設(shè)總體
12、G的分布為N(;),總體G2的分布為N(,;),則利用相對(duì)距離的定義,可以找出分界點(diǎn)和(不妨設(shè)<,1<2),(2)def21人(X)2(x)22122X1212此例中,=79,=81.6667。而按這種距離最近法則的判別法為:當(dāng)(x)2G1,工J21G當(dāng)(x)2G2,芻21(x(2)2(X2)(即2(x(2)2(一"-(即x2為了區(qū)分小麥品種的兩種不同的分奠類型,用X,x2,x3三個(gè)指標(biāo)求其判別函數(shù)。經(jīng)驗(yàn)樣品中,第一類取11(主莖型)個(gè)樣品,第二類(分奠型)取12個(gè)樣品,數(shù)據(jù)如下表所示Xix2x3判別歸類xx2x3判別歸類10.713.8012.00111.004.251
13、5.162弟20.783.8612.171弟21.003.4316.252一31.002.105.701二31.003.7011.402類40.701.705.901類41.003.8012.402(50.301.806.101(51.004.0013.602主60.603.4010.201分61.004.0012.802莖71.003.6010.201奠71.004.2013.402型80.503.5010.501型81.004.3014.002)90.505.0011.501)91.005.7015.802100.714.0011.251101.004.7020.402111.004.50
14、12.002111.004.6014.002121.004.5614.602-(1)xi0.70913.38739.7746一xi0.984.2714.4842由表計(jì)算得X(1)X=(-0.2742,-0.882,-4.7096)T,X=X(1)2二=(0.8462,3.8287,12.1293)0.56240.18210.835515.516032.3014Lxx=L(1)xx+L(2)xx=0.28210.835532.3014126.23740.00760.03520.01701.79780.0169S121Lx1210.01690.13810.00760.0352(X)(XX)TS1(
15、XX)2x10.846221=(0.4425,0.0486,0.0468)x23.82862x312.1295用(X)對(duì)經(jīng)驗(yàn)樣本的23個(gè)樣品進(jìn)行判別有如下結(jié)果:第一類的11個(gè)樣本中有10個(gè)判別為第一類,一個(gè)判別為第二類;第二類的12個(gè)樣品全部判別為第二類,符合率為22/23=96%。例如,第一類第一個(gè)樣品見=(0.71,3.80,12.00)T,則(X1)=0.6819>0,則X1G1(第一類)。又如,第一類的第11個(gè)樣品X1(?=(1.00,4.50,12.00)T,岡)=-0.3083<0,故X:1G2(第二類)。將(X)投入使用,可判別小麥品種的分奠類型,如測(cè)得某小麥品種Xi
16、1,x23.43,x316.25,則由(X)=-2.9128<0判別該品種為分奠型。(三)聚類分析聚類分析是將樣品或變量按照它們?cè)谛再|(zhì)上的親疏程度進(jìn)行分類的多元統(tǒng)計(jì)分析方法。聚類分析時(shí),用來(lái)描述樣品或變量的親疏程度通常有來(lái)兩個(gè)途徑,一是把每個(gè)樣品或變量看成是多維空間上的一個(gè)點(diǎn),在多維坐標(biāo)中,定一點(diǎn)與點(diǎn),類和類之間的距離,用點(diǎn)與點(diǎn)間距離來(lái)描述樣品或變量之間的親疏程度:另一個(gè)是計(jì)算樣品或變量的相似系數(shù),用相似系數(shù)來(lái)描述樣品或變量之間的親屬程度。聚類分析是實(shí)用多元統(tǒng)計(jì)分析的一個(gè)新的分支,聚類分析的功能是建立一種分類方法,他將一批樣品或變量,按照它們?cè)谛再|(zhì)上的親疏、相似程度進(jìn)行分類。聚類分析的內(nèi)
17、容十分豐富,按其聚類的方法可分為以下幾種:(1)系統(tǒng)聚類法:開始每個(gè)對(duì)象自成一類,然后每次將最相似的兩類合并,合并后重新計(jì)算新類與其他類的距離或相近性測(cè)度。這一過(guò)程可用一張譜系聚類圖描述。(2)調(diào)優(yōu)法(動(dòng)態(tài)聚類法):首先對(duì)n個(gè)對(duì)象初步分類,然后根據(jù)分類的損失函數(shù)盡可能小的原則對(duì)其進(jìn)行調(diào)整,直到分類合理為止。(3)最優(yōu)分割法(有序樣品聚類法):開始將所有樣品看做一類,然后根據(jù)某種最優(yōu)準(zhǔn)則將它們分割為二類、三類,一直分割到所需的K類為止。這種方法適用于有序樣品的分類問(wèn)題,也稱為有序樣品的聚類法。(4)模糊聚類法:利用模糊集理論來(lái)處理分類問(wèn)題,它對(duì)經(jīng)濟(jì)領(lǐng)域中具有模糊特征兩態(tài)數(shù)據(jù)或多態(tài)數(shù)據(jù)具有明顯的分
18、類效果。(5)圖論聚類法:利用圖論中最小支撐樹的理論來(lái)處理分類問(wèn)題,創(chuàng)造了獨(dú)具風(fēng)格的方法。(6)聚類預(yù)報(bào)法:利用聚類方法處理預(yù)報(bào)問(wèn)題,在多元統(tǒng)計(jì)分析中,可以用來(lái)做預(yù)報(bào)的方法很多,如回歸分析和判別分析。但對(duì)一些異常數(shù)據(jù),如氣象中的災(zāi)害性天氣的預(yù)報(bào),使用回歸分析或判別分析處理的效果都不好,而聚類預(yù)報(bào)彌補(bǔ)了這一不足,只是一個(gè)值得重視的方法。聚類分析根據(jù)對(duì)象的不同又分為R型和Q型兩大類,R型是對(duì)變量(指標(biāo))進(jìn)行分類,Q型是對(duì)樣品進(jìn)行分類。R型聚類分析的目的有以下幾方面:(1)可以了解變量間及變量組合間的親疏關(guān)系;(2)對(duì)變量進(jìn)行分類;(3)根據(jù)分類結(jié)果及它們之間的關(guān)系,在每一類中選擇有代表性的變量作為
19、重要變量,利用少數(shù)幾個(gè)重要變量進(jìn)一步作分析計(jì)算,如進(jìn)行回歸分析或Q型聚類分析等。Q型聚類分析的目的主要是對(duì)樣品進(jìn)行分類。分類的結(jié)果是直觀的,且比傳統(tǒng)的分類方法更細(xì)致、全面、合理。當(dāng)然使用不同的分類方法通常有不同的分類結(jié)果。對(duì)任何觀測(cè)數(shù)據(jù)都沒(méi)有唯一“正確”的分類方法。實(shí)際應(yīng)用中,常采用不同的分類方法,對(duì)數(shù)據(jù)進(jìn)行分析計(jì)算,一邊對(duì)分類提供具體意見,并由實(shí)際工作者決定所需要的分類數(shù)及分類情況。下面是聚類分析的一個(gè)簡(jiǎn)單例子。有五個(gè)樣品,每個(gè)只測(cè)量了一個(gè)指標(biāo),分別為1,2,6,8,11我們用最短距離法將它們分類。計(jì)算五個(gè)樣品兩兩間的距離,得初始類間的距離矩陣D(o),G1G2G10G210G354G476
20、G5109G3G4G5由D(0)知類間最小距離為1,于是將G和G2合并成G6,并計(jì)算G6和其他類之間的距離,的新的距離陣DG6G3G4G5G60G340G4620G59530(3)由D(1)知,類間最小距離為2,合并G3和G4為G7,計(jì)算G7與其他類間的距離得矩陣D,G6G1G50G640G7930G5由D(2)知,類間的最小距離為3,將G5和G7合并為G8,得新的距離矩陣D(3),(5)最后將G6和G8合并為G9,這時(shí)五個(gè)樣品聚為一類(四)主成分分析主成分分析是采取一種數(shù)學(xué)降維的方法,找出幾個(gè)綜合變量來(lái)代替原來(lái)眾多的變量,是這些綜合變量盡可能的代表原來(lái)變量的信息,而且彼此之間互不相關(guān)。這種把
21、多個(gè)變化量化為少數(shù)幾個(gè)互相無(wú)關(guān)的綜合變量的統(tǒng)計(jì)分析方法就叫做主成分分析或主分量分析。主成分分析所要做的就是設(shè)法將原來(lái)眾多具有一定相關(guān)性的變量,重新組合為一組新的相互無(wú)關(guān)的綜合變量來(lái)代替原來(lái)變量。通常,數(shù)學(xué)上的處理方法就是將原來(lái)的變量做線性組合,作為新的綜合變量,但是這種組合如果不加以限制,則可以有很多,應(yīng)該如何選擇呢?如果將選取的第一個(gè)線性組合即第一個(gè)綜合變量記為Fi,自然希望它盡可能多的反映原來(lái)變量信息,這里信息用方差來(lái)測(cè)量,即希望Var(FJ越大,表示F1包含信息越多。因此在所有線性組合中所選取的'應(yīng)該是方差最大的,故稱Fi為第一主成分。如果第一主成分不足以代表原來(lái)p個(gè)變量的信息,
22、再考慮選取F2即第二個(gè)線性組合,為了有效地反映原來(lái)信息,F(xiàn)i已有的信息就不需要再出現(xiàn)在F2中,用數(shù)學(xué)語(yǔ)言表達(dá)就是要求Cov(Fi,F2)=0,稱F2為第二主成分,以此類推可以構(gòu)造出第三、四第p個(gè)主成分。(五)因子分析因子分析是主成分分析的推廣和發(fā)展,它是由研究原始數(shù)據(jù)相關(guān)矩陣的內(nèi)部依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系多個(gè)變量(或樣品)綜合為少數(shù)幾個(gè)因子,并給出原始變量與綜合因子之間相關(guān)關(guān)系的一種多元統(tǒng)計(jì)分析方法。它也屬于多元分析中數(shù)據(jù)降維的一種統(tǒng)計(jì)方法。因子分析是通過(guò)變量(或樣品)的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的研究,找出存在于所有變量(或樣品)中具有共性的因素,并綜合為少數(shù)幾個(gè)新變量,把原始變量表示
23、成少數(shù)幾個(gè)綜合變量的線性組合,以再現(xiàn)原始變量與綜合變量之間的相關(guān)關(guān)系。其中,這里的少數(shù)幾個(gè)綜合變量一般是不可觀測(cè)指標(biāo),通常稱為公公因子。因子分析常用的兩種類型:一種是R型因子分析,即對(duì)變量進(jìn)行因子分析:另一種叫做Q型因子分析,即對(duì)樣品進(jìn)行的因子分析。(六)對(duì)應(yīng)分析方法對(duì)應(yīng)分析又稱為相應(yīng)分析,是一種目的在于揭示和樣品之間或者定性量資料中變量與其類別之間的相互關(guān)系的多元統(tǒng)計(jì)分析方法。對(duì)應(yīng)分析的關(guān)鍵是利用一種數(shù)據(jù)變換,使含有p個(gè)變量n個(gè)樣品的原始數(shù)據(jù)矩陣,變換成為一個(gè)過(guò)渡矩陣乙并通過(guò)矩陣Z將R型因子分析和Q型因子分析有機(jī)的結(jié)合起來(lái)。具體地說(shuō),首先給出進(jìn)行R型因子分析時(shí)變量點(diǎn)的協(xié)差陣A=ZZ和進(jìn)行Q型
24、因子分析時(shí)樣品點(diǎn)的協(xié)差陣B=ZZ,由于ZZ和ZZ有相同的非零特征根,記為i2Lm,0mmin(p,n)依據(jù)證明,如果A的特征根i對(duì)應(yīng)的特征向量為U,則B的特征根i對(duì)應(yīng)的特征向量就是ZUiVi,根據(jù)這個(gè)結(jié)論就可以很方便的借助R型因子分析而得到Q型因子分析的結(jié)果。因?yàn)榍蟪鯝的特征根和特征向量后很容易地寫出變量點(diǎn)協(xié)差陣對(duì)應(yīng)的因子載荷矩陣,記為F。則UiiiUi22LuimiF=U21,1fU222LU2m.iMMMUpi?1Up22LUpm'Fm這樣,利用關(guān)系式ZUi蛻也很容易地寫出樣品點(diǎn)協(xié)差陣B對(duì)應(yīng)的因子載荷陣,記為Go則viiiVi2、;2Lvim-'/iG=v2iiv22,2L
25、v2miMMMvniivn22Lvnm、:/m從結(jié)果的展示上,由于A和B具有相同的非零特征根,而這些特征根正是公共因子的方差,因此可以用相同的因子軸同時(shí)表示變量點(diǎn)和樣品點(diǎn),即把變量點(diǎn)和樣品點(diǎn)同時(shí)反映在具有相同坐標(biāo)軸的因子平面上,以便顯示出變量點(diǎn)和樣品點(diǎn)之間的相互關(guān)系,并且可以一并考慮進(jìn)行分類分析。(七)典型相關(guān)分析在經(jīng)濟(jì)問(wèn)題中,不僅經(jīng)常需要考察兩個(gè)變量之間的相關(guān)程度,而且還經(jīng)常需要考察多個(gè)變量與多個(gè)變量之間即兩組變量之間的相關(guān)系。典型相關(guān)分析就是研究?jī)山M變量之間相關(guān)程度的一種多元統(tǒng)計(jì)分析方法。典型相關(guān)分析是研究?jī)山M變量之間相關(guān)關(guān)系的一種統(tǒng)計(jì)分析方法。為了研究?jī)山M變量Xi,X2,LXp和YhML
26、Yq之間的相關(guān)關(guān)系,采用類似于主成分分析的方法,在兩組變量中,分別選取若干有代表性的變量組成有代表性的綜合指數(shù),通過(guò)研究這兩組變量之間的相關(guān)關(guān)系,來(lái)代替這兩組變量之間的相關(guān)關(guān)系,這些綜合指數(shù)稱為典型變量。止匕外,多元統(tǒng)計(jì)分析方法還有方差分析、偏最小二乘回歸分析、邏輯分析、聯(lián)合分析等,我們就不做一一介紹了。四、多元統(tǒng)計(jì)分析方法的一般步驟與一般統(tǒng)計(jì)分析方法一樣,多元統(tǒng)計(jì)分析方法也要經(jīng)過(guò)建立模型、進(jìn)行參數(shù)估計(jì)、假設(shè)檢驗(yàn)以及預(yù)測(cè)控制等步驟。以經(jīng)濟(jì)統(tǒng)計(jì)為例,具體步驟是:1、根據(jù)經(jīng)濟(jì)理論進(jìn)行定性分析,設(shè)計(jì)理論模型;2、對(duì)實(shí)際經(jīng)濟(jì)活動(dòng)的現(xiàn)象抽取樣本,并取得樣本統(tǒng)計(jì)資料;3、對(duì)描述樣本的指標(biāo)利用多元統(tǒng)計(jì)分析方
27、法進(jìn)行統(tǒng)計(jì)分析,選擇最佳的統(tǒng)計(jì)指標(biāo);4根據(jù)最佳指標(biāo)的樣本數(shù)據(jù),估計(jì)參數(shù),建立數(shù)量模型模型;五、多元統(tǒng)計(jì)分析方法在各個(gè)自然領(lǐng)域中的應(yīng)用多元統(tǒng)計(jì)分析是解決實(shí)際問(wèn)題的有效的數(shù)據(jù)處理方法,其應(yīng)用范圍非常廣泛。多元統(tǒng)計(jì)分析方法可以應(yīng)用于地質(zhì)科學(xué)、氣象科學(xué)、醫(yī)療衛(wèi)生、體育、語(yǔ)言學(xué)、考古學(xué)、教育學(xué)、心理學(xué)以及經(jīng)濟(jì)學(xué)、管理學(xué)等各個(gè)方面。下面我們以經(jīng)濟(jì)學(xué)和管理學(xué)為例,了解一下多元分析方法在其中的作用和應(yīng)用的場(chǎng)合與領(lǐng)域:1、簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)。對(duì)多個(gè)變量進(jìn)行降維處理,選擇數(shù)目較小的變量子集合。在商業(yè)經(jīng)濟(jì)中,為了能夠全面刻畫所研究對(duì)象的數(shù)量特征,往往要調(diào)查多方面的統(tǒng)計(jì)數(shù)據(jù)。數(shù)據(jù)維數(shù)越多,反映問(wèn)題越全面,但同時(shí)也給數(shù)據(jù)分析
28、帶來(lái)困難。這是句要用降維的方法將很復(fù)雜的數(shù)據(jù)綜合成商業(yè)指數(shù)形式,處理方法主要有主成分分析、因子分析和對(duì)應(yīng)分析等。2、對(duì)研究對(duì)象進(jìn)行分類與判別。比如根據(jù)各地區(qū)的經(jīng)濟(jì)發(fā)展水平、經(jīng)濟(jì)發(fā)展特征對(duì)我國(guó)各地區(qū)的經(jīng)濟(jì)發(fā)展類型進(jìn)行劃分,需要通過(guò)反映各地區(qū)經(jīng)濟(jì)情況的多項(xiàng)數(shù)據(jù)測(cè)算各地區(qū)經(jīng)濟(jì)發(fā)展的相似度,并以對(duì)各地經(jīng)濟(jì)類型此進(jìn)行劃分和歸類。用來(lái)處理這一問(wèn)題的多元統(tǒng)計(jì)方法主要是聚類分析、判別分析等。3、建立經(jīng)濟(jì)模型。經(jīng)濟(jì)模型一般是指把經(jīng)濟(jì)變量之間的依存關(guān)系通過(guò)通過(guò)數(shù)學(xué)表達(dá)形式加以模擬。例如根據(jù)我國(guó)幾十年來(lái)財(cái)政收入與國(guó)民收入、工農(nóng)業(yè)總值、人口、就業(yè)人口、固定投資等相關(guān)因素,利用回歸方法建立預(yù)測(cè)模型,對(duì)今后的財(cái)政收入進(jìn)行預(yù)測(cè)。4、研究經(jīng)濟(jì)現(xiàn)象之間的相互關(guān)系。當(dāng)我們研究?jī)山M變量之間的相關(guān)程度時(shí),只用簡(jiǎn)單直線相關(guān)系數(shù)是不夠的,在多元統(tǒng)計(jì)分析中,用典型相關(guān)分析可以處理兩組變量之間的相關(guān)程度的分析和測(cè)算。有一點(diǎn)需要特殊說(shuō)明,由于現(xiàn)實(shí)問(wèn)題的復(fù)雜性和每種多元分析方法特殊的應(yīng)用場(chǎng)合和自身的局限性,所以在處理問(wèn)題時(shí)有必要將各種多元分析
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 包裝回收合同范例
- 北京合伙合同范本培訓(xùn)
- 中介代辦合同范例
- 個(gè)人汽車置換合同范本
- 辦公住宿出租合同范本
- 出租鋪面合同范本
- 三方合伙范本合同范本
- 履約反擔(dān)保合同范本
- 單位職工租房合同范例
- 醫(yī)院編制合同范本
- 內(nèi)科學(xué)-高血壓病
- 單元知識(shí)結(jié)構(gòu)圖(排球)
- 卡通風(fēng)寒假生活PPT模板課件
- 教學(xué)課件:物流營(yíng)銷
- 小兒泄瀉(小兒腹瀉?。┰\療方案
- 種子內(nèi)部構(gòu)造圖片集
- 羊水栓塞的處理)
- 廣州預(yù)拌混凝土行業(yè)發(fā)展專項(xiàng)規(guī)劃
- 初中英語(yǔ)考試答題卡(可編輯WORD版)
- 【教案】 人民音樂(lè)家 教案高中人音版(2019)必修《音樂(lè)鑒賞》
- 風(fēng)光高壓變頻器用戶手冊(cè)最新2011-11-17
評(píng)論
0/150
提交評(píng)論