卡方分布及其它分布_第1頁
卡方分布及其它分布_第2頁
卡方分布及其它分布_第3頁
卡方分布及其它分布_第4頁
卡方分布及其它分布_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、卡方分布卡方分布的定義:若n個相互獨立的隨機變量己1,己2,,己n ,均服從標準正態(tài)分布(也稱獨立同分布于標準正態(tài)分布),則這 n個服從標準正態(tài)分布的隨機變量的平方和三己i A2構成一新的隨機變量,其分布規(guī)律稱為x 2(n)分布(chi-square distribution ),其中參數(shù) n 稱為自由度??ǚ椒植嫉男再|:(1)(可加性) 設Yi72ni,九,i =1,,k,且相互獨立,則這里 n = ni,,= i.(2) E(72/) = n + MVar(蜉,p =2n+4 九.證明 (1)根據(jù)定義易得。(2)設Y Z2,7,則依定義,Y可表示為其中 Xi N(0,1),i =1,,n1

2、, Xn N(JI,1),且相互獨立,于是因為代入(1),第一條結論可得證。直接計算可得于是代 入 (2) 便 證 明 了 第 二 條 結 論三、卡方分布的概率密度函數(shù):其中Dx為n維x空間內由不等式x12+xn2 y z所定的區(qū)域。即,Dz為n維x空間內以坐標原點為球心、JZ為半徑的球面所圍成的區(qū)域(邊界不在內)可以利用極坐標來計算這積分。令與這變換相應的函數(shù)行列式為:其中括號和9都表示4刀2的函數(shù)。因此。當 z0時,C是常數(shù)。為了定出C,在上述等式的兩端令 r-+巴得到從而, 在分母內的積分中令 1r2=N,即,用r=及N5作代換,那么,這個積分等2n-1 n_111.22因此,從而,當z

3、0時, 即,72的密度函數(shù)為稱這個密度函數(shù)所定的分布為自由度為n的72分布,記作/2。它的圖像如下:圖(一)72分布密度函數(shù)圖四、卡方分布的累積分布函數(shù)為Fk x =k 2,x 2 - k2其中丫(k,z)為不完全Gamm函數(shù)。其圖像如下:圖(二)?2分布的分布函數(shù)圖五、卡方分布的特征函數(shù)及其推導:特征函數(shù): 巾 ()=f(x)dx= dx六、論證過程中的心得體會:首先通過對卡方的研究和證明,提高了我們對數(shù)學的興趣。其次,通過這 次的推導和搜索資料進行分析,大大提高了我們的獨立思考的能力, 我們當中很 多同學之前都很害怕類似的證明題,這一次的合力解決難題使我們信心倍增。當然同時,這個合作鍛煉了

4、我們團隊合作的能力, 分工合作解決問題,有的人負 責收集資料,有點人負責推導公式,有的人負責輸入文章,整理公式,等等。這 讓大家明白了團結的力量。做出合理的時間安排,做任何事情,合理的時間安排非常重要,多元課程設計也是一樣,事先要做好一個規(guī)戈課程設計一共分5個板塊(定義,性質,特征函數(shù),密度函數(shù),分布函數(shù),心得體會)。你每 天 要做完哪幾個板塊事先要確定好,這樣做才會使自己游刃有余,保證在2周時間 內內完成論文,以避免由于時間上的不妥,以致于最后無法完成論文。另外,寫論文的過程中也使我們對論文的格式有了一個了解,更規(guī)范更具 體,為以后的學業(yè)報告做了一次很好的準備。論文屬于科學性的文章,它有嚴格

5、 的書寫格式規(guī)范,因此一篇好的論文一定 要有正確的格式,論文格式錯誤就不 能得到好成績,因此我們寫論文時要端正態(tài)度,注意書寫格式。多元課程的設計更加是豐富了我們的業(yè)余生活,讓大家聚在一起討論題目,其樂融融。這樣的課程設計也能使我們找到志同道合的朋友,發(fā)現(xiàn)生活中的點滴數(shù)學趣事,從實際出發(fā)思考題目,同時我們對計算機的知識也有了一定的加深,matlab的使用等等。t分布的有關知識t分布的概述及其歷史在概率論和統(tǒng)計學中,學生 t-分布(Students t-distribution )應用在當對呈正態(tài)分布的母群體的均值進行估計。它是對兩個樣本均值差異進行顯著性測試的學生t測定的基礎。t檢定改進了 (超

6、過120等)時,可以應用 此樣本很小的情況下得改用學生 此時可以用變異數(shù)分析代替學生Z檢定,不論樣本數(shù)量大或小皆可應用。在樣本數(shù)量大Z檢定,但 Z檢定用在小的樣本會產(chǎn)生很大的誤差,因 t檢定。在數(shù)據(jù)有三組以上時,因為誤差無法壓低, t檢定。當母群體的標準差是未知的但卻又需要估計時,我們可以運用學生t -分布。學生t-分布可簡稱為t分布。其推導由威廉戈塞于 1908之首先發(fā)表,當時他還在都柏林的健力士釀酒廠工作。因為不能以他本人的名義發(fā)表,所以論文使用了學生(Student )這一筆名。之后t檢驗以及相關理論經(jīng)由羅納德費雪的工作發(fā)揚光大,而正是他將此分布稱 為學生分布 由于在實際工作中, 往往b

7、是未知的,常用s作為b的估計值,為了與 u變換區(qū)別,稱為 t變換1 =X二,統(tǒng)計量t值的分布稱為t分布。Sxt分布的分布函數(shù)及證明用T (x; n)表示tn分布的分布函數(shù),則證明根據(jù)分布函數(shù)的定義有 當x .0時,上式為 TOC o 1-5 h z 0 22由于Jt(y;n)dy =1,故立即可得 A =1/2,為了計算 % 我們做變換t = y /(n+y )則1_3dy =(n +y2)2/(2ny) *dt =t 2 (1 -t) 2dt ,因此 一 _11 _11、故 T(x;n) =A A2 =- 2Ix2/(n.x2)(2,an)而當x W0時,我們有然后利用剛剛的討論可知綜上所述

8、便得我們所要的結論。t分布的密度函數(shù)及證明設,,z為相互獨立隨機變量,服從正態(tài) N (0,1), z服從自由度為 n的72 分布,則t= 7 jzn的密度函數(shù)為稱ft(x)是自由度為n的t一分布(或Student分布)的密度函數(shù),證:首先,易知與;zn相互獨立,事實上,故得證二與Jzn是相互獨立的.(其實,由商的密度函數(shù)為證明過程用到公式t分布的W特征函為:t分布有如下特征:1、t分布是對稱分布,且其均值為02. t分布是一簇曲線,其形態(tài)變化與n (確切地說與自由度v )大小有關。自由 度V越小,t分布曲線越低平;自由度v越大,t分布曲線越接近標準正態(tài)分布(U分布)曲線,如圖1。3、t分布是一

9、個分布族,對于不同的樣本容量都對應不同的分布,且其均值都為0。4、與標準正態(tài)分布相比,t分布的中心部分較低,2個尾部較高。5、變量t的取值范圍在 -七到之間圖1自由度為1、5、的t分布t分布有如下性質:2性質 1 令 g(x) =(1 +x-)n 初2 n2則 g (x) -1J(1 J,n 3)/2 .x n n TOC o 1-5 h z .22cg(x) =U(1 +、)8/2(1 +二一nx2)故g(x)=0 的 解 為n nn nx = Jn/(n+2),即分布密度在 x=Jn/(n+2)處有拐點。1 2 1_ x2性質 2 lim t(x;n) e 2 2-性質3設X tn ,若r

10、 n,則E(Xr)不存在。此點由微積分中判別積分收斂的法則很容易看出。若rn,且r為奇數(shù),由于函數(shù)xr(1+x2 / n)*2是x的奇函數(shù),因此,叫=0;若rn且r為偶數(shù),可以算得Nr = Nr=nr/21 *3*5(r -1)_特別(n -2)(n - 4) (n r)n6E(X) =0,Va(rX)=,n =3,4,r1 =0/2 =,n =5,6,n -2n -4性質4 tn分布由于只有n-1階矩存在,故沒有矩母函數(shù)存在。性質5如Xi和X2獨立同分布于?2n,則隨機變量Y = 3 底(X2 _X1)/JX1X2 tn。t分布的d分位數(shù)t分布的分位數(shù)記作t和)如圖所示,當Xt(n)時,PX

11、 -4,604,加儂 4 )=-2.776,卜儂 4i;=-2.132另外,當n 30時,在比較簡略的表中查不到t和)可用u3乍為t南的近似值.t分布的分位數(shù)t分布表n 0.250.20.150.10.050,0250.010,0050.00250.0010.000511.0001.3761.9633.0786.31412.70631.82163.657127.32318.31636.6220.8161.0611.3861.8862.9204.3036.9659.92514.08923.32631.59830.7650.9781.2501.6382.3533.1824.5415.8417.45

12、310.21312.92440.7410.9411.1901.5332.1322.7763.7474.6045.5987.1738.6150.7270.9201.1561.4762.0152.5713.3654.0324.7735.8936.86960.7180.9061.1341.4401.9432.4473.1433.7074.3175.2085.95970.7110.8961.1191.4151.8952.3652.9983.4994.0294.7855.40880.7060.8891.1081.3971.8602.3062.8963.3553.8334.5015.04190.7030.

13、8831.1001.3831.8332.2622.8213.2503.6904.2974.781100.700.8791.0931.3721.8122.2282.7643.1693.5814.1444.587110.6970.8761.0881.3631.7962.2012.7183.1063.4974.0254.437120.6950.8731.0831.3561.7822.1792.6813.0553.4283.9304.318130.6940.8701.0791.3501.7712.1602.6503.0123.3723.8524.221140.6920.8681.0761.3451.7

14、612.1452.6242.9773.3263.7874.14150.6910.8661.0741.3411.7532.1312.6022.9473.2863.7334.073160.6900.8651.0711.3371.7462.1202.5832.9213.2523.6864.015170.6890.8631.0691.3331.7402.1102.5672.8983.2223.6463.965180.6880.8621.0671.3301.7342.1012.5522.8783.1973.6103.922190.6880.8611.0661.3281.7292.0932.5392.86

15、13.1743.5793.883200.6870.8601.0641.3251.7252.0862.5282.8453.1533.5523.85210.6860.8591.0631.3231.7212.0802.5182.8313.1353.5273.819220.6860.8581.0611.3211.7172.0742.5082.8193.1193.5053.792230.6850.8581.0601.3191.7142.0692.5002.8073.1043.4853.767240.6850.8571.0591.3181.7112.0642.4922.7973.0913.4673.745

16、250.6840.8561.0581.3161.7082.0602.4852.7873.0783.4503.725260.6840.8561.0581.3151.7062.0562.4792.7793.0673.4353.707270.6840.8551.0571.3141.7032.0522.4732.7713.0573.4213.69280.6830.8551.0561.3131.7012.0482.4672.7633.0473.4083.674290.6830.8541.0551.3111.6992.0452.4622.7563.0383.3963.659300.6830.8541.05

17、51.3101.6972.0422.4572.7503.0303.3853.646400.6810.8511.0501.3031.6842.0212.4232.7042.9713.3073.551600.6790.8481.0451.2961.6712.0002.3902.6602.9153.2323.461200.6770.8451.0411.2891.6581.982.3582.6172.8603.1603.37300 .0.6740 8421 0361 2821 6451 962 3262 5762 8073 093.291廣義非中心t分布定義::鏟1 且 N =( 3,0,0)。(*)

18、 t =n2 X11(x(2)x(2)“Xi.。、設 X = I(2)ECn 由(N,In 由由,其中 X(2)X 1的分布稱為廣義非中心t分布,記為t Gtn32)或tGtn(6, f)。定理1:設t Gtn f),則t的密度是(*1)1 n 2(n二)2 (2n)1(n t2),(n 1)二 22 n一一f f (y -261y +6 )y dy , - t +=c ,1其中二1 二t、:/(n t2)2。證:設 x ECn 書(N,In* f)其中R =(6,0,0)且 h(,)是 Borel 函數(shù)使得 E(h(t) m利用 f f (Z x2 )dx1,dx11一 m(二)2-(2m)

19、一1:二-mJ0 y111 、f(y)dy = (n)2 F(-m) Ii( f -m) 對于22X2,,Xn小則我們有E(h(t)=(*2)V n)2L2 二 21:- n_2n 1_ 0 h(n 2 /r)f (Xi -、)gr drdx111(2n)n2,1二 h(t)f(tr/n“、)2 r2)rndrdtJ u因此,t的密度是1 n 2出 22 0 f(t2 n)r2nn2- (2 n)1-2t rn 2,32)rndr1令 y =(t2 +n)/n)2r,我們立得(*)。當6 =0時,(*1 )成為我們熟悉的密度to推論 1 :設 t Gtn(3, f),Eh(t) ,則(*3)

20、E(h(t)=In2 二 2o M (:):n f (:2)d:,1x其中(*4) M (P) = I h(n2 e + Pcos)/(Psin) sin6d6 o證:做變換x1 =6 + Pcosdr = Psin 9 ,則由(*2)結論得證。推論2:設Et-k1n2 ( (n -k)k!k2 kko.1r(-n)Cn2一 2(*6)2 n26 nE(t )=+1n2*n - 2 g2 n 26 nvar(t)=-+1n -2 cn j. TOC o 1-5 h z k 2 - 1- 12_n信(仁(n-1)/(仁n)g)、22由(*3), (*4)和22a,1Legendre 倍量公式 F

21、(2a) =i(a)(a+-),結論得證。二,2分布、定義如果隨機變量的密度函數(shù)為則稱隨機變量 服從第一自由度為 ,第二自由度為 的 分布,記為二、性質1、設隨機變量 與相互獨立,且,則隨機變量證明:因為隨機變量 與 分別 分布,所以其密度函數(shù)分別為一 ? 一由商的密度函數(shù)公式,故得所以,隨機變量。2、設隨機變量,則,D 解:一二一令,得同理可得,D 3、設隨機變量 ,則。證明:因為隨機變量,所以其密度函數(shù)為則的密度函數(shù)為所以,4、若隨機變量證明:因為隨機變量,所以其密度函數(shù)為-的密度函數(shù)為所以,、非中心分布,且與相互獨立,令,則稱服從自由度為 ,非中心參數(shù)為的非中心分布,記為隨機變量的密度函

22、數(shù)為證明:的聯(lián)合分布為作變換的聯(lián)合分布為的邊沿分布為將改為,即為所證。二次型的分布Wishart 分布設Xi, | | , Xn相互獨立同標準正態(tài)N(0,1)分布,令X = (xJH,Xn),則Y -XX- xi2 2(n)其密度函數(shù)為:n/2n/2exp 一2,y 0,2n/2 - I n12刀而在x/llXn相互獨立同正態(tài)N(0尸2)分布時,Yo272(n),其密度函數(shù)為:n n/2 1y、-y exp -2 , y 0,卜面將上述結果推廣至多元正態(tài)分布的情況。二.Wishart分布的定義假設Y()Y).,Y(m相互獨立, 其中:10 , Y =(YQY(2L.,Y(m)pMm , U =

23、YY= Y(aY(a),則稱隨機陣 U 服從自由度為m ,非中心參數(shù)為M =(u,uf ,u(m )p父m=E(Y)的非中心wishart分布,記為uWp(m,M卜特別地,當M =(0,0,.,0)時,則稱之為中心 wishart分布,記為:uWp(m,l),其概率密度為:1N P 1仃W 廠 exp np pn p jn _OE Yf W,三二22 二 n p-1 Z2ii.:-T . 210,其它其中W =(aj)pxp為對稱陣,是隨機矩陣U的觀測值矩陣。三.Wishart分布的特征函數(shù)定理:如果SWp(m,E),(工0已蘊含在W分布的定義中),則mQ(T )= Ip -2訂,其中T=(t

24、j 2Mp為實變元對稱陣。- m證明:因為S Wp(m,工),所以S可表示為f = Ya)Y),其中1YC,Yf,.,Y(m珈立同分布與Np(0,I),Z0o有隨機矩陣特征函數(shù)的定義可知Q (T 產(chǎn)ECTS),且T=T ,因此有: TOC o 1-5 h z mmmmtr (TS)=trTS =trST=tr 匕 Y卜=tr Y(aY(aT =tr 丫口才丫(“)= 丫慳斤丫陽 .、1 1- 11m m、iZYTYMm.丫也TmYTY m從而 Q(T)=Ee 皓 =口 E(e( T ) = LE(e J,其中 Y Np ( 0,E ),o(m由對角定理,對于對稱陣T及正定陣工。必存在奇異陣B使

25、得:BB = Ip,4 III 0a,做變換X = BY,一I,-1L(即工=(B ) B ,工=bb ), b tb =:.:0 ,為常數(shù))。n.證明:由亞亞(工),可知w=2 x8X。,其中x( )m,x()相互獨立,-1且 x(與Np(u(Ql:)0,F = 1,|,N,M =(uQ川,u(N ),N故 CWC = (CX(G)(CX ),而 CX(o) NP (Cu(QCZC),且 CX(|,CX(也相互獨立,則 CWCWm(n,CEC)。同理得:aWWp(n,aX) (a0 ,為常數(shù))?!瓣P于p階wishart分布密度函數(shù)有以下說明:(1)、W是p階對稱陣,(3)式是W的p(p+1)

26、/2個變量,(明1/|,*p,s22,lll產(chǎn)2P,川,8Pp )的密度函數(shù),而積分區(qū)域是使得 W0的這些變量 所構成的區(qū)域。(2)、為了使得p階wishart分布有密度函數(shù),除了 工0,為什么還要求n p?這是因為p階矩陣W以概率1為正定矩陣的充要條件是n p o證:由于W = XX,X是nxp階矩陣,所以np時,W=XX= xixi之 xix,所以欲證W以概率1為正定 i 1i 1矩陣的充要條件是n2 p ,僅需要證明在n = p時,p(WA0) = 1。在n = p時,由于W=XX ,所以W不是正定夕!陣a X =00令x =(%,111,不)=1,HI, p0顯然G = xj,i, j

27、 =1川,p:兇=0是p2維歐式空間中一個沒有內點的集合。由此可見,p(|x=0)=0。從而有p(w0)=1.故W以概率1為正定矩陣的充要條件是n之p得到證明。五.非中心 wishart分布的定義非中心wishart分布是非中心X2分布的推廣。若x1,川,xn相互獨立,nXiN(Ni ,1)i,= m n,則稱Y= x:服從非中心*分布,其自由度為n。它的分 i 1n布除了與n有關外,還與a=叫2有關,a稱為非中心參數(shù)。非中心2分布記i 1n為72(n,a)。顯然,在Xi N(R,。2)時, (xi/。)2服從非中心72(n,a)分布,其 i 4nn中,a = (xi/仃)2。這時 Y = x

28、i2 =仃2X(n, a)。 i 1i4下面將非中心2分布推廣到非中心 wishart分布。若xi,|l|,xn相互獨立,nxi Np(邑i,Z), 0,i = 1UI n,則稱 W= xix 服從非中心 wishart 分布,顯然 Wi 1n的分布與p,n和工有關。下面證明其分布與H =工2NH)工/2有關。i 1令 yi =1/2 (x 巴 卜 Np(0,Ip),i=1,|,n,則因為=工,/2乂 +B,i =1用,n,所以 TOC o 1-5 h z n- nnn-W= P;=工/2 yiy;+ y (電/2 )+ (工”)y; + H 廿, i 1_i 1i 1i 1其中:nz yiy

29、; Wp(n,Ip )i 1n yi(H2)NpMp(0,HIp)i衽nz (工,)y;Np*(0,IP H )i 1由此看來,W勺分布僅與p,n,工和H有關。三,Wishart分布設Xi,川,xn相互獨立同標準正態(tài)N(0,1)分布,令X = (Xi川,、),則nY =XX = xi2 2(n)i 4其密度函數(shù)為:2n/2: n2n/2yy exp 一2 ,y 0,C n/2 L n212刀而在Xi, ill, Xn相互獨立同正態(tài)N(0,。2)分布時,Yo272(n),其密度函數(shù)為:_n n/2 dy |二 y exp , y 0, 2 二卜面將上述結果推廣至多元正態(tài)分布的情況。四.Wisha

30、rt分布的定義假設YC,Yf ,Y(m而互獨立,m其中:I0 , Y =(YC)Y(2,Y(m)pxm , U =YY=Z Y(aY(a),則稱隨機陣 U 服 1從自由度為m ,非中心參數(shù)為M = (u,,u,u(m)p父m=E(Y )的非中心wishart分布,記為uWp(m,1; M卜特別地,當M =(0,0,.,0)時,則稱之為中心 wishart分布,記為:uWp(m,I),其概率密度為: TOC o 1-5 h z 1N _P _L_1 1口 W F exp .汽苗 l,W 0np p in. p i n a )l 2Jf W,三二22 二 n p -1 三 2| .::=0.21,

31、其它其中W=(aj 2Mp為對稱陣,是隨機矩陣U的觀測值矩陣。三.Wishart分布的特征函數(shù)定理:如果SWp(m,E),(工0已蘊含在W分布的定義中),則Q(T)=Ip-2打,其中T=(% )pMp為實變元對稱陣。一m證明:因為S Wp(m,工),所以S可表示為f = Y)Y),其中YC,YQ.,Y(m助立同分布與Np(0,I),I0o有隨機矩陣特征函數(shù)的定義可知久(T戶eHZtS),且T=T ,因此有:tr (TS)=trTS =trST=tryBYV)%:4= tr YYT =tr yRTyRLz yPJtyR)從而 s T :,EmiY種網(wǎng)e於m=口 e ) = ?1iY TYLE e

32、,其中 Y Np(0,E),由對角定理,對于對稱陣T及正定陣工,,必存在奇異陣B使得:Bi-B-Ip,1,(即工=(B )B,E=BB , BTB =a1III,做變換X = B/Y,III反之Y = BX , 則:11 JX Np 0,B 三(B )所以 X Np(0,I)o 記 X =(Xi,X2,III,Xp )22則有 Xi,IH,XpWN1(0,1),故有 XkXi,K=1,P.從而EiY TY el iX B TBX=E e一 i之 九X2=E e i-1-2=.1 - 2i , k = k=1Ip2認1一2而I p -2i九p_ 1_=BE B -2iBTBB|W -2iT B

33、=非-2iT =|IP 2iT 工因此有久(T )= 1P 2iT工二m反之,若是對稱陣S的特征函數(shù)Q(T )=|Ip-2iT1p2 ,則$陣舊,工)。四.Wishart分布的性質性質1:設總體X 為Np(u,工),則樣本離差陣S服從自由度為n-1的wishart分布,即:n-S Xi - X ! Xi -X:Wp n-1,i_證明:S = ;Xi X I. Xi -X= XHX,且 H = I -1II ,由 H2 = H 和nrk (H ) = n -1 ,由定理:X為N p (0,工)的n父p階數(shù)據(jù)陣,rk (A )= r , A為n父n對稱陣,且A2 = A ,則 XAXWP(r,工)

34、,則 XHX (n1,工)。性質2:(可加性)設WWP (niE )WZ 2WP(n ),且Wi,W2相互獨立,則Wj+WWp(n+n ,2 )。證:(用特征函數(shù))由WWPSi,工),W2WWPS2,工),可知其特征函數(shù)分別 為mim2邛i(T尸院-2氏口氣&(丁尸Ip -2團廣,又由WW相互獨立,可推之W, + W2 mj+mi的特征函數(shù)為 巴T )=Q(T )中2(T )=|p2iET 一丁,由定理 1之逆可知,W+W2Wp(n#n21)成立。性質3:設亞四(工),對任意mxp階常數(shù)矩陣C,有CWC Wm(n,CZC),特別的有,aWWp(n,a工)(a0 ,為常數(shù))。N.證明:S WWP

35、(n,Z),可知W= XX(8),其中Xf川|,X(N)相互獨立,=i且 X。Np(u付工戶0,”1,川,N,M =(u(|,u(N),N故 CWC =E (CXNCX),而CX(* Np(Cu(/CEC),且 cxC川,CX (N 也相互獨立,則 CWCWm(n,CIC )o同理得:aWWP(n,a1) (a0 ,為常數(shù))。“關于p階wishart分布密度函數(shù)有以下說明:(1)、W是p階對稱陣,(3)式是W的p(p+1)/2個變量,(明1,川明p,外“產(chǎn)2p,川產(chǎn)pp)的密度函數(shù),而積分區(qū)域是使得 W0的這些變量 所構成的區(qū)域。(2)、為了使得p階wishart分布有密度函數(shù),除了 工0,為

36、什么還要求n之p?這是因為p階矩陣W以概率1為正定矩陣的充要條件是n至p。證:由于W = XX, X是nMp階矩陣,所以n0) = 1。在n = p時,由于W=XX,所以W不是正定貨!陣a X =0。令 X =(XiJH,Xip),i =1,川,p。顯然 G = xj,i, j =1川,p:X =0是 p2 維歐式空間中一個沒有內點的集合。由此可見, p(|x=0)=0。從而有p(w0)=1.故W以概率1為正定矩陣的充要條件是n之p得到證明。五.非中心 wishart分布的定義非中心wishart分布是非中心”分布的推廣。若為川,4相互獨立,nxiN得,1)i,= HI n,則,稱Y= x;服

37、從非中心?2分布,其自由度為n。它的分 i 1n布除了與n有關外,還與a=干有關,a稱為非中心參數(shù)。非中心?2分布記 i 1n為爐(n,a)。顯然,在xi N(%。2)時,工(xi/。)2服從非中心72(n,a)分布,其 i 1nn中,a =S (xi /)2 o 這時 Y = x2 =。2/2(n, a)。 i =1i=1下面將非中心?2分布推廣到非中心 wishart分布。若、,川昌 相互獨立,nxi Np(iJ)J 0,i =111 n,則稱 W=Z xix服從非中心 wishart 分布,顯然 W i 1n的分布與p,n和工有關。下面證明其分布與H =工”/2以3)工/2有關。 i 1

38、令% =力/2(為一片卜Np(0,Ip),i=1JU,n,則因為=藥 W,i =1川,n,所以 TOC o 1-5 h z n- nnn-/2 | 一 J /2,./2 1/2W=z XiXi =x_ E YiYi +Z Yi)十 (工H +H 工一,i 1_i 4i 4i 4其中: n Z YiYi Wp(n,Ip )i 4 nZ Yi(NiE/2)NpMp(0,HIp)i 4 n工(工/29)YiNpMp(0,Ip H )4由此看來,W勺分布僅與p,n,工和H有關。Hotelling T2 分布回顧t分布的定義。假設變量X與Y相互獨立,X N(0,1),Y ?2(n),則X t =f= t

39、(n)(1),Y/n稱變量t服從自由度為n的t分布。顯然,若X N(0,1),Y ”(n),則t仍然服從 自由度為n的t分布。事實上,所謂的將t分布推廣到多元正態(tài)分布的場合并不是直接將t進行推廣,而是將t2進行推廣。t2服從F分布X2 t = nF (1,n)。Y下面將t2推廣到多元正態(tài)分布的場合。. Hotelling T2分布的定義定義:設*(0,1),隨機陣WWP(n,工)(工0,n AP),且X與W相互獨立,則稱統(tǒng)計量T2 = nX WX服從自由度為n的(中心)Hotelling T2分布,記為T2T2(P,n)0由于所以T2的分布與工無關。一般地,若XNP(N,工),則稱統(tǒng)計量T2

40、=nXW,X的分布為非中心Hotelling T2分布,記為T 2T 2(P, n, N )。.關于(中心)Hotelling T2分布的一些性質:性質1:設X,|,X(n)是總體Np(代工),工A0,n p的隨機樣本,則統(tǒng)計量T2 =n(n -1)(X _.)S(X -四)T2(p,n-1 .證明:因為XNP 匕11, p,則2口,L=3(nXSX)F(p,n_pQ),其中 S=nNN。 p n -1 p補充書本以外的一些性質如下: 由于X與W相互獨立,所以在X給定的條件下,W條件分布仍為WWp(n,I), 則丫 =工 的條件分布為72(n_p+l)。XW,X由于這個條件分布與給定的 X沒有

41、關系,所以Y與X相互獨立,并且Y的(無 條件)分布仍為2(n-p+1)。由于XNp(0,),根據(jù)多元正態(tài)分布的性質知,XX ?2(p)。因為所以有性質(1)(2)2(p)2(n - p 1)其中,分子與分母這兩個?2分布相互獨立 性質(1)說明XW/X服從Z(p/2, (n- p+ 1)/2分布,從而(1)式可知,Hotelling T2(P,n)分布可轉化為Z分布1 2 d -T2(P, n)=n2(p)p n - p 1%,).由(1),有 這說明Hotelling T2(P, n)分布可轉化為F分布。性質(2) F ( p, n - p 1)(4)n -p 1T2(P n)1IF pnp

42、 2(n -p 1)/(n -p 1)顯然,p=1時,(4)就化為(1)式由性質1導出性質2,把Hotelling T 2的分布轉化為F分布。性質(1)在把Hotelling T2的分布轉化為F分布的過程中起著關鍵作用,所以除了記住(4)式外,還有必要記住(2), (3)式。.關于非中心Hotelling T2分布的定義與性質嚴格 的說,在X與W相互獨立,XNp(0,E), WWp(n,E)時,T2 =nX W,X的分布是中心的Hotelling T2分布。如果XNp(0,工),則稱T2的 分布是非中心Hotelling T2分布。由于所以t2 =nX WX的分布與6 =工/*無關。而在6 =

43、0時,非中心Hotelling T2分布就是中心的Hotelling T2分布T2 T2( P,n卜與(2)式 (4)式相類似,有在X與W相互獨立,XNp(0,1),WWP(n,工)時, d 2XW-X = 一,2一(p,a), a=65=邛,(5)2(n - p 1)其中,分子與分母這兩個 爐分布相互獨立,分子的”(p,a)是自由度為p的非中 心爐分布,其非中心參數(shù)為a,由(5)式可以看出非中心T2 = nXW,X的分布除了與p有關外,還僅與a=$5=N,N有關。為此,人們將非中心Hotelling T2分布記為T2 T2 (P,n, a ),在a = 0時,T 2(P,n,0價布,就是中心

44、的Hotelling T2分 布。:2(p,a)2(n p 1)(6)非中心Hotelling T2分布與非中心Z分布 1 2T (P,n,a) n(3)非中心Hotelling T2分布與非中心F分布n-p 1_2dT (P,n,a)= np而章器JFgn-pFa)(5)式與(7)式的證明與(2)式與(4)式的證明類似下面討論如何導出非中心Hotelling T2分布的密度函數(shù)。由(7)式知,由非中心F分布的密度函數(shù)可以得到非中心 Hotelling T2分布的密度函數(shù)。同樣地,(6) 式說明由非中心Z分布的密度函數(shù)也可以得到非中心 Hotelling T2分布的密度函 數(shù)??紤]到非中心Z分

45、布的密度函數(shù)容易記住,由它得到非中心 Hotelling T2分 布的密度函數(shù)的計算過程比非中心 F分布的計算過程更為簡單,所以下面首先介 紹一下非中心Z分布的密度函數(shù),然后導出非中心Hotelling T2分布的密度函數(shù)。根據(jù)非中心”分布的密度函數(shù),引入服從泊松分布的變量中后,非中心X2分 布變量y可以理解成,在給定中后y的條件分布為中心72分布。因而由(6)式知,若令 z Z(p / 2,(n - p +1)/ 2,a),則在引入服從泊松分布P(a/ 2)的變量中后,變量z的 分布可以理解為,在給定 中后z的條件分布為中心的Z(p+2)/2,(n-p+1)/2) 分布,所以非中心Z(p/2

46、,(n-p+1)/2,a)分布的密度函數(shù)為從而根據(jù)(6)式,可由非中心Z(p/2,(n-p+1)/2,a)分布密度函數(shù)得到非中心T2(P,n,a汾布函數(shù)為(T2. ) _1 ; (a/2)k .:(n 2k 1)/2)(T2 / n)z(p 約2/P ;ank$ k! ,- (p 2k)/2)-(n -p 1)/2) (1 T2 / n)(n 2k 1)/2在(8)式中取a=0,即得到中心T2(P,n )分布函數(shù)為p(T2)=:(n 1)/2)(T2/n)zp/2-(p/2)- (n - p 1)/2) (1 T2/n)(n 1)/2此外,中心T2 (P,n )分布的密度函數(shù)也可以有中心 Z(

47、p/2,(n-p+1)/2)分布密度函數(shù)導出。知道中心Z(%P)分布的密度函數(shù)為 從而根據(jù)(3)式,就可以得到中心T2(P,n)分布函數(shù),即(9)式. 一元統(tǒng)計分布與多元統(tǒng)計分布的關系示意圖回歸方程的顯著性檢驗F 檢驗-、一元回歸方程的顯著性檢驗(F檢驗)當我們得到一個實際問題的經(jīng)驗回歸方程y =久+冏x ,還不能用它作分析和預測,因為y = P0+P1x是否真正描述了變量y與x之間的統(tǒng)計規(guī)律,還需 要運用統(tǒng)計方法對回歸方程進行檢驗。 在對回歸方程進行檢驗時,通常需要 進行正態(tài)性假設與N(0,。2),以下的內容若無特別聲明,都是在此正態(tài)性 假設下進行的。下面我們重點介紹 F檢驗法。(1)分解式

48、的引入F檢驗是根據(jù)平方和分解式,直接從回歸效果檢驗回歸方程的顯著性。 平 方分解式是 TOC o 1-5 h z nn_ n工(x -y)2 = (yi -y)2 + (y - yj2(1)i 1i 1i 1n_n_其中,. (yi - y)2稱為總平方和,簡記為SST或S總或Lyy。 (yi - y)2稱 i 1i T為回歸平方和,簡記為SSR或S回,反應了 x對y的線性影響,稱為回歸平n方或回歸貢獻。(y (yi yi)2稱為殘差平方和,簡記為SSE或鼠,其本質 i 1是估計誤差的平方和,這部分反應了這組實測值 y扣除了 x對y的線性影(2)響后剩下的變異。因而平方和分解式可以SST=SS

49、R SSE(2)分解式的證明下面對上述分解式給出證明 TOC o 1-5 h z n_下面只需證明 (yi - yi)(yi -1) = 0即可i 1又因為,nn其中 e=0 , Z 0(久 +1為)=01i 1nnn所以 Z (yi-y)2= (yi-y)2 + (yi - yi)2 分解式可證。i 1i 1i 1(3) F檢驗根據(jù)方差分析的原理,判斷回歸貢獻是否有意義可以用回歸方差分析進行 檢驗。SST中,能夠由自變量解釋的部分為 SSR,不能由自變量解釋的部分為 SSE。這樣,回歸平方和SSRffi大,回歸的效果越好。又總體變異的自由度為n-1, 自變量只有一個,所以回歸自由度為1,誤差

50、自由度為n-2,構造F統(tǒng)計量如下,(2)l SSR/1F 二SSE/(n -2)在正態(tài)假設下,當原假設H0:Pi=0成立時,F(xiàn)服從自由度為(1,n-2)的F分布 當F值大于臨界值FJIm2)時,拒絕H。,說明回歸方程顯著,x與y有顯著的線性關系。也可以根據(jù)P值做檢驗,具體檢驗過程可以放在方差分析表中進行, 如表1所小。表1 一元線性回歸方差分析表方差來源自由度平方和F值P值回歸PSSRSSR/1P(F F值)殘差n-2SSESSE/(n-2)總和n-1SST=P(F統(tǒng)計量的具體證明在多元線性回歸模型中給出。)多元回歸方程的顯著性檢驗(F檢驗)設隨機變量y與一般變量x1,x21|, xp的線性回

51、歸模型為y=P0+P1X1+|+PpXp + w其中,久,久川,Pp是p +1個未知參數(shù),P。稱為回歸常數(shù),月川I,耳稱為回歸系數(shù)。y稱為因變量,而,x2,川,xp是p個可以精確 ,、一一 、,、E(;) =0var(;)=;:- TOC o 1-5 h z 測量并可控制的一般變量,稱為自變量。君是隨機誤差,一般假定|()2稱E(y) = P0 + PiXi +山+PpXp為理論回歸方程。對一個實際問題,如果我們獲得n組觀測數(shù)據(jù)(xM,Xi2,|,Xip;yi)(i =1,2,|,n),則Vi =20 , iXii |l| , IpXip;iIHIIIHIIIIV Mm |H pXnp ;線性

52、回歸模型可表示為產(chǎn)二 ”lX21+川spf2寫成矩陣形式為y 二 X :;一% 一1 Xu HI Xip邛0 飛甘山y(tǒng)2i X2i III &p r &其中 y=(,x=,P=r,名=卜 f,*rfJn -J Xni HI %p -p -/_對多元線性回歸方程的顯著性檢驗就是要看自變量xi,x2,m,xp從整體上對隨機變量y是否有明顯的影響。為此提出原假設如果H。被接受,則表示隨機變量y與xi,x2,川,Xp之間的關系由線性回歸模型表示不合適。類似一元線性回歸檢驗,為了建立對H。進行檢驗的F統(tǒng)計量,仍然利用總離差平方和的分解式,即簡寫成 SST-SSR SSE此分解式的證明只需利用即殘差的平均

53、值為0,殘差對每個自變量的加權平均為 0。用矩陣表示為xe = 0 具體參照一元線性回歸的證明。若eN(0,仃2 1),則總離旁nSST = E (yi -y)2 =1 Y -iY 12 =| Y -Y |2 +| Y?-Yi |2 。若再有條件 Pi = 0 , i=i,2,lll,p滿足。則SSR, SSE獨立,它們與。2的商分別服從?2(p)和 lpF。從而 SriW)。證明:因為Z=H -H Y =(I H (XP + 8)=Xp X(XXfXXP +(I H K = (I H所以X,(I -H另=(X XX(XXX 3=0,而X第一列全是1,所以另一方面,容易看出因為=|y -Y?|

54、2 +y_Yi2 +2Y?&_2Yi 監(jiān)所以其余部分證明見Seber(1976)。附爐分布、F分布的定義定理2.4.4 (爐分布)n若n相互獨立的隨機變量 二|,二,均服從正態(tài)N(0,1),則?2=的密度函kT數(shù)為稱為自由度為n的N2密度函數(shù)。定理2.4.6 ( F分布)2設%,蜉為獨立的隨機變量,分別服從具有自由度m及n的?2分布。令之=球,n2n=-,貝fj 7的密度函數(shù)為 n稱f,(x)為自由度為m及n的F分布的密度函數(shù)。Wilks分布的定義及性質本文包括Wilks分布的定義、密度函數(shù)、分布函數(shù)的積分表達式和漸進展開 式、特征函數(shù)的積分形式以及相關性質及證明?;仡橣分布的定義,假設變量X

55、和Y相互獨立,則X X2(n),Y X2(m),則X/nY/m F(n,m),(1)稱變量F服從分子自由度為n,分母自由度為m的F分布,簡稱F服從自由度為n和m的F分布.顯然,若X 仃2 X2(n),Y 仃2 X2(m),則F仍服從分子自由度為n ,分母自由度為m的F分布.F分布和P分布可以互相轉化.令(2)則B P(n/2,m/2).事實上,所謂將F分布推廣到多元正態(tài)分布的場合并不是直接將他進行推廣,而是將P分布進行推廣.一、Wilks分布的定義:假設由與川2相互獨立,W Wp(n,Z),W2Wp(m,Z),其中 0,n 之 p .記W1Wi W2(3)稱A的分布為Wilks分布.顯然,0W

56、AM1.除了工 0 ,為什么還要求n之p ?這是為了使得A的分子和分母為正的概率都等于1.而m和p之間,可能m之p ,也可能m 0,級數(shù)-an nrn=0 n!絕對收斂,則X是唯一以為n(n =0,1,2,)階矩的變量.顯然,若變量X有界,則(6)式的級數(shù)必絕對收斂,故 X就被它的各階 矩唯一確定。已 知性質1中的Ap,n,m和B1B2Bp都是有 界的,即滿足:0 MAp,n,m M1QMB1B2Bp 時,可以由(WhW2)的聯(lián)合密度求得Ap,n,m的h階矩.而在m0,n 之p ,則 xix Wp(m,),i 1W A mP,n,m., . 1W + xixii 1(10)為簡化計算,不妨假設

57、Z=Ip.將分一下3個步驟計算Ap,n,m的矩:(1)令x =(xi,x2xn).首先由(W,X)的聯(lián)合密度求得(Ui,U2)的聯(lián)合密 度,其中,引入變量(Ui,U2)的原因就在于W Ui XXA =W+XX UiIp -U2U2(2)然后由(Ui,U2)的聯(lián)合密度,導出5的密度函數(shù).(3)最后由U2的密度函數(shù)計算A =| Ip -U2U2 |的h階矩.具體說明如下:(D (w,x)的聯(lián)合密度為W(nf )/2 exp _ltr(W) exp-tr(XX)2np/2- p(n/2)(2二嚴2,W 0(ii)(為了由(W,x)的聯(lián)合密度得到(Ui,U2)的聯(lián)合密度,關鍵在于計算變換(W,X )T

58、 (Ui,U2)的雅克比行列式.由于變換(Ui,U2)T (W,X )是 這個變換的雅克比行列式為這相當于引入中間變量(Ui,X),使得,mo mm/2一穴U2)/4X)=5=5線性變換的雅克比行列式i i i i ,所以由(W,x)的聯(lián)合密度得到(Ui,U2)的聯(lián)合密度為U1(n:;m _p)/2,1、exp_2tW) Ip -U2U (n3)/22(13)(n.m)p/2mp/22- p (n / 2) T,Ui 0(2)由(Ui,U2)的聯(lián)合密度知Ui與U2相互獨立.顯然,Ui =W+X X Wp(n+m, Ip), U1的密度函數(shù)為U1(n m_p)/21exp - 2tr (U1)2

59、(m n)p/2: p(n m)/2)(14)故U2的密度函數(shù)為p(n m)/2):p(n/2)二 mp/2Ip -U2U2(np -1)/2(15)三、Wilks分布的密度函數(shù)推導:由概率論的知識知:若(U)的聯(lián)合密度函數(shù)為 匕巴區(qū)心)則已設0)的密度函數(shù)為:f 1 (x)-72COf 1, 2(X1X,X2) |X2 dX2(16)特別的,當匕,3獨立時,有f 1 (x) = f C1X) f 2(X2) |X2 dX2(17)已知W的密度函數(shù)為:/2 |W |(n4)/2 exp-tr(W)/2J.= 1- (n/2) ,aw11、ke-()2(np)/2 二 p(p/41;(n -i

60、1)/2) k k! (n/2 k) 4(18)i 1根據(jù)公式(11) , (14), Ip -U2U2(3)由于A =E(A)h =i Ip -U2U2(17), (18)可以得到 Wilks的密度公式。,所以A的h階矩為- p(n m)/2):p(n/2)二 mp/2Ip -U2U2(n-pf/2dU】p(n m)/2): p(n 2h)/2)p(n/2)】p(n 2h m)/2) TOC o 1-5 h z pp二二(n m-i 1)/2)二二(n 2h-i 1)/2)(19)i 4i 4pPH 】(n -i 1)/2)】(n 2h m-i 1)/2)i 4i 4比較(9)式與(19)式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論