多元正態(tài)總體均值向量和協(xié)差陣的假設(shè)檢驗(yàn)._第1頁
多元正態(tài)總體均值向量和協(xié)差陣的假設(shè)檢驗(yàn)._第2頁
多元正態(tài)總體均值向量和協(xié)差陣的假設(shè)檢驗(yàn)._第3頁
多元正態(tài)總體均值向量和協(xié)差陣的假設(shè)檢驗(yàn)._第4頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三章多元正態(tài)總體均值向量和協(xié)差陣的假設(shè)檢驗(yàn)什么是假設(shè)檢驗(yàn)及基本思想、計算步驟,在初等數(shù)理統(tǒng)計中都已做過介紹。多元分析也涉及這方面內(nèi)容,在后面介紹的常用各種統(tǒng)計方法,有時要對總體的均值向量和協(xié)差陣做檢驗(yàn),比如,對兩個總體做判別分析時,事先就需要對兩個總體的均值向量做檢驗(yàn),看看是否在統(tǒng)計上有顯著差異,否則做判別分析就毫無意義。本章類似一元統(tǒng)計分析中的各種均值和方差的檢驗(yàn)相應(yīng)給出多元統(tǒng)計分析中的各種均值向量和協(xié)差陣的檢驗(yàn)。 不論做上述任何檢驗(yàn),其基本步驟均可歸納為四步:第一步, 提出待檢驗(yàn)的假設(shè)H 0 和 H 1 。第二步,給出檢驗(yàn)的統(tǒng)計量及它服從的分布。第三步,給定檢驗(yàn)水平a,查統(tǒng)計量的分布表,

2、確定臨界值 a ,從而得到否定域。第四步根據(jù)樣本觀測值計算出統(tǒng)計量的值,看是否落入否定域中,以便對待判假設(shè)檢驗(yàn)做出決策(拒絕或接受) 。由于各種檢驗(yàn)的計算步驟類似,關(guān)鍵在于對不同的檢驗(yàn)給出不同的統(tǒng)計量,而有關(guān)統(tǒng)計量的給出大多用似然比方法得到。本章只側(cè)重于解釋選取統(tǒng)計量的合理性,而不給出推導(dǎo)過程,最后給出幾個實(shí)例。同時為了說明統(tǒng)計量的分布,自然地給出分布的定義,它們分別是一元統(tǒng)計中 t 分布和 F 分布的推廣。HotellingT2 分布和Wilks§ 3.1均值向量的檢驗(yàn)為了對多元正態(tài)總體均值向量作檢驗(yàn),首先需要給出HotellingT 2 分布的定義。1HotellingT 2 分

3、布定義設(shè) X N p ( , ), S Wp (n,) 且 X 與 S 相互獨(dú)立, n p ,則稱統(tǒng)計量 T 2nX S 1 X 的分布為非中心HotellingT 2 分布,記為 T 2 T 2 ( p, n,) 。當(dāng)0 時,稱 T 2 服從(中心) HotellingT2分布,記為T2 (, ),由于這一統(tǒng)計量的分布首先由Harold Hotelling 提出來的,故稱為 HotellingT2分布,值p n得指出的是, 我國著名統(tǒng)計學(xué)家許寶 馬錄先生在1938 年用不同方法也導(dǎo)出T2 分布的密度函數(shù), 因表達(dá)式很復(fù)雜,故略去。在一元統(tǒng)計中,若 X1 , Xn 來自總體 N (,2 ) 的

4、樣本,則統(tǒng)計量:tn ( X) t (n 1) 分布?1n2?2其中1 i( X i X )n1顯然,t 2n( X) 2n( X) (?2) 1(X)?2與上邊給出的 T2 統(tǒng)計量形式類似,且 X2N 0,。n可見, T2 分布是一元統(tǒng)計中 t 分布的推廣?;拘再|(zhì):在一元統(tǒng)計中,若統(tǒng)計量t t( n 1) 分布,則 t 2 F (1, n 1) 分布,即把 t 分布的統(tǒng)計量轉(zhuǎn)化為F 統(tǒng)計量來處理,在多元統(tǒng)計分析中T2 統(tǒng)計量也具有類似的性質(zhì)。定理若 X N p ( 0, ), S Wp (n,) 且 X 與 S相互獨(dú)立,令 T2nX S 1 X ,則n p 12 F ( p, n p 1)

5、Tnp這個性質(zhì)在后面經(jīng)常用到。2 均值向量的檢驗(yàn)設(shè) p元正態(tài)總體N p (, ) , 從 總 體 中 抽 取 容 量 為 n的 樣 本X(1),X(2),1nn, X ( n) , XX (i ) , S( X ( i ) X )( X (i ) X ) 。n i1i 1(1)已知時均值向量的檢驗(yàn)H 0 :0 ( 0為已知向量 )H1 :0檢驗(yàn)統(tǒng)計量:T02n( X0 )1(X0) 2 ( p) (在 H 0 成立時)給出檢驗(yàn)水平a,查2 分布表使 P T02a a ,可確定出臨界值a ,再用樣本值計算出T02 ,若T02a ,則否定H 0,否則 H 0 相容。這里要對統(tǒng)計量的選取作兩點(diǎn)解釋,

6、一是說明它為什么取為這種形式。二是說明它為什么服從2 ( p) 分布。一元統(tǒng)計中,當(dāng)2 已知時,作均值檢驗(yàn)所取的統(tǒng)計量為:UX0 N (0,1)n顯然,U2 n( X0 ) 2n( X0 )(2)1( X0 )2與 上 邊給 出 的 檢 驗(yàn) 統(tǒng) 計 量 T02 形 式 相 同 。 另 外 根 據(jù)二 次 型 分 布 定 理 : 若 X N p ( 0, ) , 則X E1 X X 2 ( p) 。顯然, T 2n( X0)1 ( X0)n ( X0)1n ( X0)0Y1Y 。其中, Yn ( X0 ) N p (0,) ,因此, T02n( X0 )1 ( X0 ) 2 ( p) 。(2)未知

7、時均值向量的檢驗(yàn)H 0 :0H 1 :0檢驗(yàn)統(tǒng)計量:(n 1)p 1T 2 F ( p, np) (在 H 0 成立時)( n1) p其中 T2(n1)n ( X0)'S 1n ( X0 )給定檢驗(yàn)水平a,查 F 分布表,使 pnpT 2Faa ,可確定出臨界值Fa ,再用樣本值計算( n1) p出 T2,若npT 2Fa ,則否定 H 0 ,否則 H 0相容。(n1) p這里需要解釋的是,當(dāng) 未知時, 自然想到要用樣本協(xié)差陣n11S 去代替,因( n-1)S-1 是1 的無偏估計量,而樣本離差陣nS( X ( a)X )( X (a)X ) W p ( n1,)x 1n ( X0 )

8、 N p (0,)T 2(n 1) n( X0 ) S 1 n( X0 ) T 2 ( p,n p)再根據(jù) Hotelling T2 分布性質(zhì),所以(n 1)p 1T 2 F ( p, n p)(n1) p3 協(xié)差陣相等時,兩個正態(tài)總體均值向量的檢驗(yàn)設(shè)X (a )( X a1 , X a2 , , X ap ) N p ( 1 , )1, ,nY( a)(Ya1 , Ya 2 , ,Yap ) N p ( 2 , )1, , m且兩組樣本相互獨(dú)立,X1n1mY(i )。n iX (i ) ,Ym i 11(1)有共同已知協(xié)差陣時H 0 :12H1: 12檢驗(yàn)統(tǒng)計量:2n m,1_2(X Y)(

9、在 H0 成立時)T0n m ( X Y)( p)給出檢驗(yàn)水平a,查 x 2 ( p) 分布表使 P T 2aa ,可確定出臨界值a ,再用樣本值計算出T02 ,若 T 2a,則否定 H 0,否則 H0 相容。0在一元統(tǒng)計中作均值相等檢驗(yàn)所給出的統(tǒng)計量:UXY N (0,1)22nm顯然,U2( XY) 2nm( XY )222(nm)2nmnm ( XY),(2) 1(XY ) 2 (1)nm此式恰為上邊統(tǒng)計量當(dāng) p1時的情況,不難看出這里給出的檢驗(yàn)統(tǒng)計量是一元情況的推廣。( 2)有共同的未知協(xié)差陣0 時H0: 12H 1 :12檢驗(yàn)統(tǒng)計量:F(n m 2) p 1 T 2 F ( p,n

10、m p 1)( nm2) p(在 H0 成立時)其中:'T 2(n m 2)n m ( X Y) S 1n m ( X Y)nmnmSS1 S2n'X ) , X ( X 1, X 2 , , X p ) 'S1( X ( a)X )( X ( a )a 1m',Y )'S2(Y( a )Y)(Y( a ) Y) ,Y (Y1,Y 2,a 1給定檢驗(yàn)水平,查 F分布表使 P FFa,可確定出 Fa ,再用樣本值計算出F,若 FF ,則否定 H 0,否則 H 0 相容。當(dāng)兩個總體的協(xié)差陣未知時,自然想到用每個總體的樣本協(xié)差陣1S 和1去代替,而nS1 1m

11、 12nS1( X ( a )X)(X( )X ) Wp (n 1, )a 1mS2(Y( a)Y )(Y( )Y) Wp ( m 1, )a 1從而S S1S2 Wp (n m2, )所以(nm2)p1T2 F ( p, nmp1)( nm2)下述假設(shè)檢驗(yàn)統(tǒng)計量的選取和前邊統(tǒng)計量的選取思路是一樣的,以下只提出待檢驗(yàn)的假設(shè),然后給出統(tǒng)計量及其分布,為節(jié)省篇幅,不做重復(fù)的解釋。4 協(xié)差陣不等時,兩個正態(tài)總體均值向量的檢驗(yàn)設(shè)X (a )(X a1 , X a2 , , X ap ) N p ( 1 , 1 )1, ,nY( a)(Ya1 , Ya 2 , , Yap ) N p ( 2 , 2 )

12、1, , m且兩組樣本相互獨(dú)立,10,20H 0 :12H1: 12分兩種情況( 1) n = m令Z (i )X (i ) Y(i )i1,nZ1nnZ( i )XYi1nS(Z ( j )Z )(Z ( j ) Z) 'j1nX Y )( X ( j ) Y(i ) X Y) 'j 1( X ( j )Y( i )檢驗(yàn)統(tǒng)計量:F( np)n Z ' S 1 Z F ( p,np)(在 H 0 成立時)p(2) nm, 不妨假設(shè) nm令n1n1 mZ(i )X (i )mY(i )n m j 1 Y( j )m j 1 Y( j )i 1, , n1 nZ (i )X

13、 YZn i1nS( Z( i )Z)( Z (i )Z )i1n( Xn(Y1n)(i )X )Ym(i )n( j )i 1j 1( X (i )X )n1n(Y(i )n jY( j ) )m1檢驗(yàn)統(tǒng)計量:F( n p)n Z ' S 1 Z F ( p,n p)p5 多個正態(tài)總體均值向量的檢驗(yàn)(多元方差分析)多元方差分析是一元方差分析的推廣。為此先復(fù)習(xí)一下一元方差分析,之后為了對多個正態(tài)總體均值向量作檢驗(yàn),自然地先給出 Wilks 分布的定義。(1)復(fù)習(xí)一元方差分析(單因素方差分析)設(shè) k 個正態(tài)總體分別為N (H 0 :12k檢驗(yàn)統(tǒng)計量:FSSA k1 F ( kSSE nk

14、其中k1,2), ,N(k,2),從k個總體取i 個獨(dú)立樣本如下:nX 1(1) , X 2(1) , X n(11)X 1( k) , X 2(k ) , , X nk(k)H1:至少存在 ij 使 ij1,nk ) (在 H0 成立時)SSAni( X iX ) 2 組間平方和i1kniSSE(X j(i)X i) 2 組內(nèi)平方和i1j1kni( X (ji )X ) 2SST 總平方和i1j11niX (ji )X inij11kn i(i )XXn nnkn i 1 j 1j1給定檢驗(yàn)水平, 查 F 分布表使 p F Fa,可確定出臨界值F ,再用樣本值計算出F 值,若 FFa 則否定

15、 H 0,否則 H0 相容。( 2) Wilks 分布在一元統(tǒng)計中,方差是刻劃隨機(jī)變量分散程度的一個重要特征,而方差概念在多變量情況下變?yōu)閰f(xié)差陣。如何用一個數(shù)量指標(biāo)來反映協(xié)差陣所體現(xiàn)的分散程度呢?有的用行列式,有的用跡等方法,目前使用最多的是行列式。定義 1 若 X N p (,) ,則稱協(xié)差陣的行列式為 X 的廣義方差。稱1 S 為樣本廣義方差。其nn中 S( X (a)X )( X (a )X ) 。a 1定義 2 若 A1 W p ( n1 ,), n1p, A2 W p ( n2 , ),0 ,且 A1 和 A 2 相互獨(dú)立,則稱A1 A1A2為 Wilks統(tǒng)計量,的分布稱為 Wilk

16、s分布,簡記為( p,n1 , n2 ) ,其中 n1 , n2 為自由度。在實(shí)際應(yīng)用中,經(jīng)常把統(tǒng)計量化為 T2 統(tǒng)計量進(jìn)而化為 F 統(tǒng)計量,利用F 統(tǒng)計量來解決多元統(tǒng)計分析中有關(guān)檢驗(yàn)問題。當(dāng)n21時,用 n 代替 n1,可得到它們之間的關(guān)系式如下:( p, n,1)1np1 T 2 ( p, n)1n即T 2n 1( p,n,1)( p,n,1)由前邊定理知n p 1T 2 F ( p, n p 1)np所以np1 1( p, n,1) F( p,n p1)p( p, n,1)當(dāng) n2=2 時有如下關(guān)系:np 1( p, n,2) F (2 p,2(np)p( p, n,2)當(dāng) p=1 時有

17、:n11(1, n1 , n2 ) F (n2 , n1 )n2(1, n1 , n2 )當(dāng) p=2 時有:n1 12, n1, n21 F ( 2n2 ,2(n11)n22,n1 , n2以上幾個關(guān)系式說明對一些特殊的統(tǒng)計量可以化為F 統(tǒng)計量,而當(dāng) n22, p2 時,可用2 統(tǒng)計量或 F 統(tǒng)計量來近似表示,后面給出。(3)多個正態(tài)總體均值向量檢驗(yàn)(多元方差分析)設(shè) 有 k 個 p 元 正 態(tài) 總 體 N p (1, ), N p ( k , ) , 從 每 個 總 體 抽 取 獨(dú) 立 樣 品 個 數(shù) 分 別 為n1 , n2 , nk ,n1nkn ,每個樣品觀測p 個指標(biāo)得觀測數(shù)據(jù)如下:

18、X 11(1)X12(1)X 1(1p)X1(1)第一個總體:X 21(1)X 22(1)X 2(1p)X 2(1)(1)(1)(1)X n(1)X n1X n2X np111此處 X i(1)( X i(11) , X i(12) , X ip(1) ), i1, n1X 11(2)X 12(2)X 1(p2)X1(2)X 21(2)X 22(2)X 2( 2p)X2(2)第二個總體:X n(12)X n(22)X n( 2p)X (2)222n2此處 X i( 2)( X i(12) , X i(22) , , X 1(p2 ) ), i 1, ,n2X 11(k )X 12(k)X 1p

19、(k )X 1(k )X 21(k )X 22(k)X 2(kp)X 2(k )第 k 個總體:X n(1k )X n( 2k)X n(kp )X (k )kkknk此處 X i(k )( X i(1k ) , X i(2k ) , , X ip(k) ), i 1, , n k全部樣品的總均值向量:1kn aXX i(a) ( X 1 , X 2 , , X p )1 pn a 1i 1各總體樣品的均值向量:X(a )1n a( a)(a )( a)naX i(a)( X 1,X2 , X p ), a 1, , k1 pi 1此處( a )1naX ij(a )j 1, , pX jnai

20、 1類似一元方差分析辦法,將諸平方和變成了離差陣有:k( a)(a )AX )na ( XX) (X組間離差陣a1kna(a )( a)(a)(a )E)( X iX ) ( X iX組內(nèi)離差陣a1i 1kna( a)( a)T( X iX ) ( X iX )總離差陣a1i 1這里 T=A+E欲檢驗(yàn)假設(shè)H0: 12kH 1 : 至少存在 ij ,使 1j用似然比原則構(gòu)成的檢驗(yàn)統(tǒng)計量為:EEk ,k 1)T ( p, nA E給定檢驗(yàn)水平,查 Wilks 分布表,確定臨界值,然后作出統(tǒng)計判斷。當(dāng)手頭沒有Wilks 分布表時可用如下2 分布或 F 分布來近似。設(shè) ( p,n,m)令V(nm( p

21、m1) 2) ln11LR1L式中tL2pmtnm( pm1) 2p 2m 241 2Lp 2m25pm2則 V 近似服從2 ()4F ( pm,tL 2 ) ,這里不一定為整數(shù), 可用與它最近的整數(shù), 近似服從tL2pmR來作為 F 的自由度,且 min( p, m) 2 。§3.2協(xié)差陣的檢驗(yàn)1 一個正態(tài)總體協(xié)差陣檢驗(yàn)設(shè) X ( a ) ( X a 1, X a 2 , X ap ) (1, , n) 來自 p 元正態(tài)總體 N p (, ) 的樣本,未知,且(1) H 0 :I pH 1 :I p檢驗(yàn)統(tǒng)計量:nnpexp1trSe22S 2n其中nS( X (a)X )( X (

22、a )X )a1(2) H0:0I pH 1 :0I p因?yàn)? 0 ,所以存在 D( D 0)使 D0 DI p令 Y(a)DX (a )1, n則Y Np(D,DD)Np(*,*)( a )因此,檢驗(yàn)0 等價于檢驗(yàn)*I p檢驗(yàn)統(tǒng)計量nnpexp1*S*e 2trS2n2其中S*n(YY)(YY)( a)(a )a 1給定檢驗(yàn)水平,因?yàn)橹苯佑煞植加嬎闩R界值0 很困難,所以通常采用的近似分布。2在 H 0 成立時,一 2ln 極限分布是p( p 1)分布。因此當(dāng) np ,由樣本值計算出值,若 -2ln20 。2a2a即e 2 ,則拒絕 H 0,否則 H 0 相容。2 多個協(xié)差陣相等檢驗(yàn)設(shè) k 個

23、正態(tài)總體分別為N p (1 ,1 ), N p (k , k ),i0 且未知, i 1, k 。從 k 個總體分別取 ni個樣本X (ai)( X a(i1) , X ap(i) )i1, k;1, N p ( k ,k ),i 0 且未知, i 1, k 。從 k 個總體分別取 ni 個樣本X (ai)( X a(i1) , , X ap(i) )ki 1, , k; a 1, , n i ,nini 1H 0 :12kH1 :i不全相等k令 SSii 1n(i )(i)( i )(i )S( XX )(XX )i(a )( a)i1niX (i )1X (ai)ni i1檢驗(yàn)統(tǒng)計量:np

24、kninkpni22kn 2SiS 2nii 1i 12f在實(shí)際應(yīng)用中,將ni 改為 ni1, n改為n-k,得修正的統(tǒng)計量記為k ,則2ln k 近似分布(1 D) ,其中f1p( p 1)(k 1)22 p23 p1k11,至少有一對 nin j6( p 1)(k 1) i 1 ni1 n k,D(2 p 23 p 1)(k 1) ,n1 n 2nk6( p1)( n k)例 1人的出汗多少與人體內(nèi)鈉和鉀的含量有一定的關(guān)系。今測20 名健康成年女性的出汗多少( X 1 )、鈉的含量(X 2)和鉀的含量 ( X 3),其數(shù)據(jù)如下表。 試檢驗(yàn) H 0 :0 (4,50,10) , H 1 :0

25、 。序號X 1X 2X 313.748.59.325.765.18.033.847.210.943.253.212.053.155.59.764.636.17.972.424.814.087.233.17.696.747.48.5105.454.111.3113.936.912.7124.558.812.3133.527.89.8144.540.28.4151.513.510.1168.556.47.1174.571.68.2186.552.810.9194.144.111.2205.640.99.4經(jīng)計算X(4.64,45.4,9.965)X0 (0.64,4.6,0.035)55.7641

26、77.5932.374S177.593795.98107.1632.374107.1668.9255為了計算 ( X0) S 1(X0 )令Y S1(X0), 則SY( X0 ) ,于是得如下方程組,55.764y1177.59y 232.374y30.64177.59 y13795.98y 2107.16 y34.632.374y1 107.16y268.9255y3 0.035解得: y10.0151, y20.0015, y30.0020于是 (X0) S 1(X0) (X0 ) Y0.0151(0.64, 4.6,0.035)0.00150.0020=0.016494T 2n(n1)(

27、 X0) S 1(X0 )20190.0164946.26772F176.267721.87319查 F 表得 F3,17 (0.05)3.2, F3,17 (0.01) 5.18因此在 a = 0.05 或 0.01 時接受 H 0 假設(shè)。例 2 為了研究日、美兩國在華投資企業(yè)對中國經(jīng)營環(huán)境的評價是否存在差異,今從兩國在華投資企業(yè)中各抽出 10 家,讓其對中國的政治、經(jīng)濟(jì)、法律、文化等環(huán)境進(jìn)行打分,其結(jié)果如下表:序號政治環(huán)境經(jīng)濟(jì)環(huán)境法律環(huán)境文化環(huán)境16535256027550305536045356547540407057030305065541356576045306086540256096050307010555535751155554065125060457013454535751450505070155550307516604045601765554575185060358

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論