多元統(tǒng)計分析方法_第1頁
多元統(tǒng)計分析方法_第2頁
多元統(tǒng)計分析方法_第3頁
多元統(tǒng)計分析方法_第4頁
多元統(tǒng)計分析方法_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

多元統(tǒng)計分析概目 錄一、引言… 3二、多元統(tǒng)計分析方法的研究對象和主要容 3多元統(tǒng)計分析方法的研究對象… 3多元統(tǒng)計分析方法的主要容… 3三、各種多元統(tǒng)計分析方法 3回歸分析… 3判別分析 6聚類分析 8主成分分析 10因子分析 10對應(yīng)分析方法 11典型相關(guān)分析 11四、多元統(tǒng)計分析方法的一般步驟… 12五、多元統(tǒng)計分析方法在各個自然領(lǐng)域中的應(yīng)用… 12六、總結(jié)… 13參考文獻… 14辭… 15一、引言統(tǒng)計分布是用來刻畫隨機變量特征及規(guī)律多元統(tǒng)計分布計數(shù)據(jù)方法的總稱,是統(tǒng)計學(xué)中的具有豐富理論成果和眾多應(yīng)用方法的重要分例來進一步了解多元統(tǒng)計分析方法的具體實現(xiàn)過程。(一)多元統(tǒng)計分析方法的研究對象有的一些問題,多元統(tǒng)計分析是一類圍很廣的理論和方法。(二)多元統(tǒng)計分析方法的主要容元回歸分析,典型相關(guān)分析等;另一類是對多元變量本身進行研究所形成的一些特殊方法。如主成分分析,因子分析,聚類分析,判別分析,對應(yīng)分析等。三、各種多元統(tǒng)計分析方法具體來說,常用的多元統(tǒng)計分析方法主要包括:多元回歸分析、聚類分析、判別分析、主成分分析、因子分析、對應(yīng)分析、典型相關(guān)分析等。下面我們對各種多元統(tǒng)計分析方法就行分別描述,(一)回歸分析(1)定量的描述和解釋相互關(guān)系;(2)估測或預(yù)測因變量的值。相互依賴關(guān)系,我們稱為多因變量的多元回歸問題。Ymx,x··,x1 2 m

的相關(guān)關(guān)系,而Yx,x··,x1 2 m

為一般變量。下面我們來看一下多元線性回歸模型的建立。假定因變量Y與x,x··,x 線性相關(guān)。收集到的n組數(shù)據(jù)1 2 m(y,x,x,L,x

(t=1,2··n)滿足以下回歸模型:t t1 t2 tmyx···+x

(t1,2,L,n)t 0 1

mtm tE(t記

)0,Var(t

)2,Cov(,i

)0(ij)或t

~N(0,2),相互獨立(t=1,2,Ln).1 xK x 11 1mC=M O

M(1MX),1 xL x n1 nmY10y ,Y10yy

,2

1 2yMy

M Mm n則所建回歸模型的矩陣形式為YC,)E 0,D)( n (或

2I,) nYC,~N(0,2I),n nY機向量,C,2n>mrank(C)=m+1。(,L和2的估計和檢0 1 m進行診斷等問題。1990-2003見下表。年份GDP(億元)基本建設(shè)投資(億元)1990242.829.041991271.3933.961992317.7939.221993372.2442.891994451.6658.191995553.3562.621996714.18101.421997781.34121.741998869.75157.141999931.98187.492000983.36208.2820011072.51228.6320021161.43263.0620031304.6307.3利用excel進行分析,具體輸出以下數(shù)據(jù),平方和自由度方差F檢驗值回歸1553189.711553189.7殘差59475.667124956.3056313.3765001離差1612665.413復(fù)相關(guān)系數(shù) R=.5333剩余標(biāo)準差SY回歸方差與剩余方差之比F=313.3各個自變量的t檢驗值17.70244334t檢驗的自由度 N-P-1F檢驗的自由度第一自由度=1,第二自由度=12各個自變量的偏回歸平方和1553189.7各個自變量的偏相關(guān)系數(shù)0.981386594由輸出結(jié)果,得以下結(jié)論:回歸方程為 y=232.70+3.68x1其中,負相關(guān)系數(shù)為R2=0.9814,說明回歸方程擬合優(yōu)度較高。而回歸系數(shù)的t=17.7024,t分布表

0.025

2.1788tF分布表,F(xiàn)0.05

(1,12)4.75,由下表知,F(xiàn)=313.3765>4.75,因此回歸方程也顯著。平方和自由度方差F檢驗值回歸1553189.711553189.7殘差59475.667124956.3056313.3765001離差1612665.413(二)判別分析哪一類的多元統(tǒng)計分析方法。Fisher準則、貝葉斯準則等。距離判別的基本思想是:樣品和那個總體距離最近,就判斷它屬于哪個總體。距離判別也稱直觀判別。已知有兩個類G

和G,比如GA

是設(shè)備B生產(chǎn)的1 2 1 2A(如考察指標(biāo)為耐磨度(1)=8,反映設(shè)備精度的方差2=0.25B的產(chǎn)品質(zhì)量稍差,其平均耐磨度1

=75,反映設(shè)備精度的方差2=4X2 是哪一臺設(shè)備生產(chǎn)的?

x0

=78,試判斷該產(chǎn)品下面考慮一種相對于分散性的距離。記

G

的相對平均距離為0 1 20d2(x或d2(xd2(x(x0

(1)

(7880)2

=16,1 0 2 0

1 0 21

0.250d2(x)=(x0

(2))2(7875)2

=2.25。2 0 22

4.00因為d

(x)=1.5<4=d(x),按這種距離準則應(yīng)判X

為設(shè)備B生產(chǎn)的。2 0 1 0 0GN((1),2GN((2),2,1 1 2 2和(不妨設(shè)(2)(1)<, 1 2令(x(1))221

(x(2))222

x

(1)221

(2)112

ef,和

(1)222

(2)111

ef。此例中,=79,=81.6667。而按這種距離最近法則的判別法為: (x(1))2 (x(2))2判,當(dāng) (即x)1 2 2 1 2判XG,當(dāng)(x(1))2(x(2))2

或x) 2 1

(即x2 2xx

三個指標(biāo)求其判別函1 2 3ii主莖型)個樣品,第二類(分蘗型)12iix1x2x3判別歸類x1x2x3判別歸類10.713.8012.00111.004.2515.162第20.783.8612.171第21.003.4316.252一31.002.105.701二31.003.7011.402類40.701.705.901類41.003.8012.402(50.301.806.101(51.004.0013.602主60.603.4010.201分61.004.0012.802莖71.003.6010.201蘗71.004.2013.402型80.503.5010.501型81.004.3014.002)90.505.0011.501)91.005.7015.802100.714.0011.251101.004.7020.402111.004.5012.002111.004..6014.002121.004.5614.602x(1)0.70913.38739.7746x(2)0.984.2714.4842由表計算得XX(2)=(-0.2742,-0.882,-4.7096)T,X(1)X(2)X= =(0.8462,3.8287,12.1293)20.5624

0.8355L=L(1)xx xx

+L(2)xx

=0.2821 15.5160 32.3014,0.8355 32.3014 126.23741.7978 0.0169 0.0076S1210.0169 0.1381 0.0352,xx 0.0076 0.0352 0.01701(X) (X(1)X(2))TS1(XX)2x0.84622=21(0.4425,0.0486,0.0468)13.828622 x x12.12953用X2311個樣本中有10個判別為第一類一個判別為第二類第二類的12個樣品全部判別為第二類符合率為22/23=96%。例如,第一類第一個樣品 X(1)=(0.71,3.80,12.00)T,則1X(1))=0.6819>0,X(1)

(第一類。又如,第一類的第11個樣品1 1 1X(1)(1.00,4.50,12.00)TX(1)=-0.3083<0X(1)

(第二類。11 11 11 2將(X)投入使用,可判別小麥品種的分蘗類型,如測得某小麥品種x1,x1

3.43,x3

16.25,則由(X)=-2.9128<0判別該品種為分蘗型。(三)聚類分析聚類分析是將樣品或變量按照它們在性質(zhì)上的親疏程度進行分類的多元統(tǒng)計分析方法。聚類分析時,用來描述樣品或變量的親疏程度通常有來兩個途徑,聚類分析的容十分豐富,按其聚類的方法可分為以下幾種:系統(tǒng)聚類法:開始每個對象自成一類,然后每次將最相似的兩類合并,描述。調(diào)優(yōu)法(動態(tài)聚類法n函數(shù)盡可能小的原則對其進行調(diào)整,直到分類合理為止。最優(yōu)分割法(有序樣品聚類法K類為止。這種方法適用于有序樣品的分類問題,也稱為有序樣品的聚類法。糊特征兩態(tài)數(shù)據(jù)或多態(tài)數(shù)據(jù)具有明顯的分類效果。具風(fēng)格的方法。聚類預(yù)報法:利用聚類方法處理預(yù)報問題,在多元統(tǒng)計分析中,可以用補了這一不足,只是一個值得重視的方法。RQ型是對變量(指標(biāo)進行分類,Q型是對樣品進行分類。R型聚類分析的目的有以下幾方面:可以了解變量間及變量組合間的親疏關(guān)系;對變量進行分類;QQ型聚類分析的目的主要是對樣品進行分類。分類的結(jié)果是直觀的,且比傳下面是聚類分析的一個簡單例子。有五個樣品,每個只測量了一個指標(biāo),分別為1,2,6,8,11,我們用最短距離法將它們分類。計算五個樣品兩兩間的距離,得初始類間的距離矩陣D ,G1G1G2G3G4G5GGGGG123450105407620109530

知類間最小距離為1,于是將G和G

合并成G

,并計算G

和其他類(0) 1 2 6 6之間的距離,的新的距離陣DG6G6G3G4G5G60G340G4620G59530D(1)

2,合并G和G3

為G,計算G7

與其他類間的距離得矩陣D ,G6G6G7G5G60G740G5930D(2)

3G和G5 7

合并為G8

,(3)GG6G8G60G840最后將G和G合并為

,這時五個樣品聚為一類。6 8 9(四)主成分分析這種把多個變化量化為少數(shù)幾個互相無關(guān)的綜合變量的統(tǒng)計分析方法就叫做主成分分析或主分量分析。量記為F,自然希望它盡可能多的反映原來變量信息,這里信息用方差來測量,1即希望Var(FFF應(yīng)1 1 1Fp個變1FF已2 1FCov(FFF2 1 2 2為第二主成分,以此類推可以構(gòu)造出第三、四……第p個主成分。(五)因子分析(或樣品元分析中數(shù)據(jù)降維的一種統(tǒng)計方法。因子分析是通過變量(或樣品)的相關(guān)系數(shù)矩陣部結(jié)構(gòu)的研究,找出存在于所有變量(或樣品)中具有共性的因素,并綜合為少數(shù)幾個新變量,把原始變量表示成少數(shù)幾個綜合變量的線性組合,以再現(xiàn)原始變量與綜合變量之間的相關(guān)關(guān)系。其中,這里的少數(shù)幾個綜合變量一般是不可觀測指標(biāo),通常稱為公公因子。因子分析常用的兩種類型:一種是R型因子分析,即對變量進行因子分析:另一種叫做Q型因子分析,即對樣品進行的因子分析。(六)對應(yīng)分析方法對應(yīng)分析又稱為相應(yīng)分析,是一種目的在于揭示和樣品之間或者定性量資料中變量與其類別之間的相互關(guān)系的多元統(tǒng)計分析方法。p個變量nZZRQ型因子分析有機RA=Z和QB=ZZZ和ZZ有相同的非零特征根,記為1 2

Lm,

0mmin(p,n)A的特征根對應(yīng)的特征向量為Ui

,則B的特征根對應(yīng)的i特征向量就是ZUi

@V,根據(jù)這個結(jié)論就可以很方便的借助R型因子分析而得到iQ型因子分析的結(jié)果。因為求出A的特征根和特征向量后很容易地寫出變量點協(xié)差陣對應(yīng)的因子載荷矩陣,記為F。則1111111u u L u 11

12

1m F=u21

u L u22 2 2m1 1uup1

M M 2m2mp2 pmZUi陣,記為G。則

@V也很容易地寫出樣品點協(xié)差陣B對應(yīng)的因子載荷i1111111111

12

1m 21G=v21 vn1

L v2m2m1212mv L vn2 nmAB之間的相互關(guān)系,并且可以一并考慮進行分類分析。(七)典型相關(guān)分析在經(jīng)濟問題中,不僅經(jīng)常需要考察兩個變量之間的相關(guān)程度,而且還經(jīng)常需究兩組變量之間相關(guān)程度的一種多元統(tǒng)計分析方法。典型相關(guān)分析是研究兩組變量之間相關(guān)關(guān)系的一種統(tǒng)計分析方法。為了研究XX,LX和Y,Y,L

之間的相關(guān)關(guān)系,采用類似于主成分分析的方1 2 p 1 2 q合指數(shù)稱為典型變量。此外,多元統(tǒng)計分析方法還有方差分析、偏最小二乘回歸分析、邏輯分析、聯(lián)合分析等,我們就不做一一介紹了。四、多元統(tǒng)計分析方法的一般步驟估計、假設(shè)檢驗以及預(yù)測控制等步驟。以經(jīng)濟統(tǒng)計為例,具體步驟是:1、根據(jù)經(jīng)濟理論進行定性分析,設(shè)計理論模型;2、對實際經(jīng)濟活動的現(xiàn)象抽取樣本,并取得樣本統(tǒng)計資料;3指標(biāo);4根據(jù)最佳指標(biāo)的樣本數(shù)據(jù),估計參數(shù),建立數(shù)量模型模型;五、多元統(tǒng)計分析方法在各個自然領(lǐng)域中的應(yīng)用多元統(tǒng)計分析方法可以應(yīng)用于地質(zhì)科學(xué)、氣象科學(xué)、醫(yī)療衛(wèi)生、體育、語言學(xué)、考古學(xué)、教育學(xué)、心理學(xué)以及經(jīng)濟學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論