多維隨機變量及其分布_第1頁
多維隨機變量及其分布_第2頁
多維隨機變量及其分布_第3頁
多維隨機變量及其分布_第4頁
多維隨機變量及其分布_第5頁
已閱讀5頁,還剩26頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、第七章假設檢驗 7.1假設檢驗的基本思想與概念7.1.1假設檢驗問題例1某廠生產(chǎn)的合金強度服從正態(tài)分布N(r16),其中r的設霅值為不低于110(Pa)。為了保證質(zhì)量,該廠每天都要對生產(chǎn)情況做例行檢查,以判斷生產(chǎn) 是否正常進行,即該合金的平均強度不低于110。某天從生產(chǎn)中隨機抽取25塊合金,沒得強度值為 ,x25,其均值為X =108,問當日生產(chǎn)是否生產(chǎn)正常?分析:(1) 這不是一個參數(shù)估計問題。(2) 這是在給定總體與樣本下,要求對命題“合金平均強度不低于110”作出回答:“是”還是“否”?這類問題稱為統(tǒng)計假設問題,簡稱假設檢驗問題。(3) 命題:“合金平均強度不低于110”正確與否僅涉及參

2、數(shù) 二,因此該命題是否正確將涉及如下兩個參數(shù)集合:00 =二:二-110,-P :八:116命題成立對應于 “日乏o 0 ”,命題不成立則對應 “日乏G1 ”。在統(tǒng)計學中這兩個 非空參數(shù)集合都稱作 統(tǒng)計假設,簡稱假設。(4) 我們的任務是利用所給總體N (二16)和樣本均值x =108去判斷假設(命題)v - C.-? 0是否成立。這里的“判斷”在統(tǒng)計學中稱為檢驗或檢驗法則。檢驗結(jié)果有兩種:“假設不正確”一稱為拒絕該假設“假設正確” 一稱為接收該假設(5) 若假設可用一個參數(shù)的集合表示,該假設檢驗問題稱為參數(shù)假設檢驗問題,否則稱為非參數(shù)假設檢驗問題。上例中就是一個參數(shù)假設檢驗問題。7.1.2假

3、設檢驗的基本步驟一、建立假設原假設:被檢驗的假設H0。一般不應輕易加以否定的假設。備擇假設:當H0被拒絕時而接收的假設。二者多是成對出現(xiàn)。如例中建立:H0:=p : : -110 vsH1 : ) L-打=二:J : 110若簡寫為 H0: “二-110 vsH1 : 二門 () 0.05,由于g)是關(guān)4/ 5c _ 110于二的單調(diào)減函數(shù),只需要 g(110) - G() =0.05成立即可。由此可先4/5c _ 110確定標準正態(tài)分布的 0.05分位數(shù)u0 05 = -u0 95。它使得 =u0 05,從而c4/5的值為 c =110 0.8u0.05 = 110-0.8 1.645 =1

4、08.684所以,檢驗的拒絕域為W 叫乂 乞 108.684X _110若令u,則拒絕域有另一種表示,即4/5W =u 蘭U0.05 =u 蘭 一1.64$五、做出判斷在有明確的拒絕域后,根據(jù)樣本觀測值可以做出判斷:當X 108.684或ua1.645時,則拒絕H0,即接收H1 ;當 X 108.684或 u -1.645 時,則接收 H0 。在例1中,由于x =108 Ui/2時拒絕原假設,否則接收它。勢函數(shù)具體如下:J R,有ZIg (卩)=pu 35/2)= P_i(i_i2)6如/2)=1 ne。一:)/二 7_:./2),(、n(% -)/二一 Ui_:./2)例1要求一種元件使用壽

5、命不得低于1OOO小時,今從一批這種元件中隨機抽取25件,測得其壽命的平均值為95O小時,已知這種元件壽命服從標準差為(T=1OO小時的正態(tài)分布。試在顯著水平a= O.O5下確定這批元件是否合格?設總體均值為 W即需檢驗假設 Ho: 1OOO, Hi: p1OOO。解:首先假設為HO : &1OOO vs H1: f1OOO;因為(r=1OO已知,為單側(cè)檢驗問題,所以選用 U檢驗,Ho的拒絕域為u = % 一1000乞u-.cr / Jnn=25 , a= 0.05, X =950 ,計算知 一1000_ =_2.5 ::: uo 05 =645100/ J25故在a= 0.05下,拒絕Ho,

6、即認為這批元件不合格。二、二未知時的t檢驗將未知的匚換成其樣本標準差S,形成t檢驗,檢驗統(tǒng)計量為 在H0下,有tt(n -1)從而拒絕域為W 二t 一(n-1) 對于第二種和第三種情形拒絕域分別為W -rL.(n -1)W 二t _t2(n-1)例2用某儀器間接測量溫度,重復五次,測得結(jié)果為12501265124512601275設測量值X服從正態(tài)分布N(J;2),水平:=0.05。問是否有理由認為該儀器測 量值大于12770 (真實值)?解 首先假設為Ho: 乞J 0 vs Hr :丄-0因為方差匚2未知,用t檢驗法,這時拒絕域為x %W 忙 0 _t(n1)s/J n這里 n = 5 ,

7、ti-.(n-1) = to.95(4) = 2.1348 由樣本算得x = 1 2 5, 92 = 1 4 25代入可得 t J2591277 : _3.372 : 2.1348.i142.5V 5因此接受Ho即認為測量值不大于 1277。三、假設檢驗與置信區(qū)間的關(guān)系設x ,Xn是來自正態(tài)總體 N(4;2)的樣本,現(xiàn)討論在;未知的場合關(guān)于均值的檢驗問題。分三種情況:考慮雙側(cè)檢驗問題H0 :0 vs 比:0其水平為二的接收域為W =|X-% 蘭(s/Vn)t1/2( n-1)可以將之改寫為W 二X -(s . n)如:./2(n -1) % 乞 X (s n兒一從n -1)并且有P.0(W),

8、這里沒有限制,若讓 在R上取值,就可得到 J的1 - :置信區(qū)間:乞X_(s . n)t仁一./2(n-1)。反若有一個如上的1 -:置信區(qū) 間,也可獲得關(guān)于 H0 : - 0的水平為:-的顯著性檢驗。所以“正態(tài)均值 J 的1 _ :置信區(qū)間”與“關(guān)于 H0 :-0的雙側(cè)檢驗問題的水平為 :的檢驗” 是對應的。同樣,單側(cè)檢驗問題H0 :0 vs H1: - b0其水平為-的接收域為W 二x - 乞(s 、n)t;.(n -1) = % 一 x -(s . n)t-.(n -1)這就給出了參數(shù) ,的1 -:置信下限。反之亦然。722兩個正態(tài)總體均值差的檢驗設X1,Xm是來自正態(tài)總體 N(1,;1

9、 )的樣本,.yn是來自正態(tài)總體N(2,;2)的樣本,兩個樣本獨立,考慮如下三類檢驗問題H。: ; 70H0: . C0 ,vs2 2H1 :. V : 702 22 2H0:二=二0 , vsH 1 : ;-C0。由前可知,樣本方差此處通常假定均值 未知。采用的檢驗統(tǒng)計量均為2 =(n -1)s2/;/:,則對應三個檢驗問在二2=;:02時,22(n -1),于是若取顯著性水平為題的拒絕域依次為W 二 2 一12.-.(n-1)W = 2 空2(n-1)W= 2/2(n-1)或 2 一 二./2(n-1)例4某廠生產(chǎn)的銅絲,質(zhì)量一向比較穩(wěn)定,今從中隨機地抽出10根檢查其折 斷力,測得數(shù)據(jù)(單

10、位:千克)如下:575576570569582 577580571585設銅絲的折斷力服從正態(tài)分布N(J;2),檢驗水平為:-=0.05。試問:是否可以相信該廠的銅絲的折斷力的方差為64?2 2解 由題意知要檢驗假設 H0:二=64 , H1:二-64,因為未知,故檢驗 統(tǒng)計量在H0下2 二(n )S 2(n_1).2-0這里 n = 10, a =0.05,町刖2(n 1)=蹤975 (9) =19.02 及 2./2( n-1) = 0025(92.7由樣本算得 殳=5757,(n- 1)s210-.:(Xi -X)2 =260.1,i 4n為(Xi -X)2由此可算得 2 = V 2o嚴

11、 4.06,64因為2.70 4.06 19,02,根據(jù)2檢驗法應接受H。,即認為這批銅絲的折斷力的 方差為64。二、兩個正態(tài)總體方差比的F檢驗2設X- ,Xm是來自正態(tài)總體 N()1,;1 )的樣本,,.yn是來自正態(tài)總體H0:2:-12H1:22:-1二 2vs:-1:j 2H。2:G2匚2vsH12:二12池匚22N(2,6)的樣本,考慮如下三類檢驗問題此處J1和J2均為未知,由樣本 Xi,Xm和Y1,.yn計算的二12和二:的無偏估 計分別記為 和S:,兩個樣本獨立,則可建立如下的檢驗統(tǒng)計量2SxF -2Sy在H。為真時有FF(m -1, n -1),由此可得水平為:-的三種情況下的拒

12、絕域分別為W =F 一 F5 -1, n -1)W =F 乞 F:.(m -1, n -1)W = F 乞 F:.(m -1,n -1)或F - F -,(m -1,n -1)1 2 2例9某一橡膠配方中,原用氧化鋅5克,現(xiàn)減為1克。今分別對兩種配方作一批試驗,分別測得橡膠伸長率如下:氧化鋅 1 克565577580575556542560532470461氧化鋅 5 克540533525520545531541529534假設橡膠伸長率服從正態(tài)分布,問對這兩種配方對橡膠伸長率的總體方差有無 顯著差異?(用=0.1)解 根據(jù)題意需檢驗 H0 :時一 ;,比:時=這里m =10,n = 9,二=

13、0.1,從而可得F./2(m-1, n T) = F0.95 (9,8) =3.393.23F:./2(m -1 ,n -)= F0.05(9,8)=F0.95 (9,8)由樣本可算得s2 = 236.8, s: =63.862于是 F = S二 236 : 3.73.39Sy63.86故拒絕Ho,即認為兩總體方差有顯著性差異。 7.3其他分布參數(shù)的假設檢驗7.3.1指數(shù)分布參數(shù)的假設檢驗設x ,xn是來自指數(shù)分布 Exp(1/R的樣本,二是其均值,現(xiàn)考慮關(guān)于二的如下檢驗問題:H 0 : v : vs H1 : v 厲 拒絕域的自然形式是 W二X _c。為了尋找檢驗統(tǒng)計量, 我們考察參數(shù) 二的

14、充n分統(tǒng)計量X,在V - -0時,有nx - :XiGa(n,1/入),由伽瑪分布的性質(zhì)知2nX2(2n)因此可用作為檢驗統(tǒng)計量并利用2(2n)的分位數(shù)建立檢驗的拒絕域,對上述檢驗問題,拒絕域為W = 2 一 二(2n)關(guān)于二的另兩種檢驗問題的處理方法是類似的。對檢驗問題H 0 : v _ 比vsH10H 0 : v - %vs比:八入 拒絕域分別為W =2 乞 2(2n)W =2 乞;2(2n)或 2 一 12_./2(2n)例1設我們要檢驗某種元件的平均壽命不小于6000h,假定元件壽命為指數(shù)分布,現(xiàn)取5個元件投入試驗,觀測到如下5個失效時間(h)395119115726133這是一個假設

15、檢驗問題,檢驗的假設為H0 門-6000 vs H1: 6000經(jīng)計算X =4462.6,故檢驗統(tǒng)計量為210x10 4462.67.4377 比6000若取。=0.05 ,則查表知 益05(10) =3.94,由于/2 a 3 0.05(10)故接受原假設,可以認為平均壽命不低于6000h.7.3.2比例p的檢驗比例p可看作某事件發(fā)生的概率,即可看作二點分布b(1, p)中的參數(shù),作n次獨立試驗,以x記該事件發(fā)生的次數(shù),則 xb(n, p)??梢愿鶕?jù)x檢驗關(guān) 于p的一些假設。先考慮如下單邊假設檢驗問題H。: p 乞 P。vs Hi : p po直觀上看,一個顯然的檢驗方法是取如下的拒絕域W二

16、x _c,由于x只取整數(shù)值,故c可限制在非負整數(shù)中,然而,一般對給定的,不一定能正好取到一個c使nP(x C; Po)=亠 cnp0(1 - Po)n_L =j =c能恰好使得上式成立的 C值是罕見的。這個問題在離散總體下普遍存在,這時, 常見的方法是找一個 co,使得nn、cnp0(i-p)2 cnp0(i-po)n于是若取C二Co,這相當于把檢驗的顯著性水平提高了一些,由:-提高到nC:po(1 - po)n,若取C = q 1,此時相當于把顯著性水平由:降低到i壬n、cn po(i - Po)n_t,因為后者可保證上式左側(cè)不大于故取c二$ i可j =Co 1得水平為二的檢驗。對檢驗問題H

17、 o : p - Povs Hi : p :: Po處理方法是類似的,檢驗的拒絕域為W二X乞c , C為滿足C、Upo(i Po)ni 的最大正整數(shù)。對檢驗問題Ho : p = Povs Hi : p = Po檢驗的拒絕域W =x _G或x c2,其中c1為滿足Ci、cnpo(i Po)n: /2i =o的最大整數(shù),C2為滿足ni cnd(i -Po)n: /2的最小整數(shù)。例2某廠生產(chǎn)的產(chǎn)品優(yōu)質(zhì)品率一直保持在4o%,近期對該廠生產(chǎn)的該類產(chǎn)品抽檢2o件,其中優(yōu)質(zhì)品7件,在-o.o5下能否認為優(yōu)質(zhì)品率仍保持在4。解設p為優(yōu)質(zhì)品率,x為2o件產(chǎn)品中的優(yōu)質(zhì)品件數(shù),則xb(2o, p),待檢驗的假設為H

18、0 : p = 0.4 vs 出:p = 0.4拒絕域為 W =x g或x _ c2,下面求C|,c2由于 P(x 乞 3) = 0.016 ::: 0.025 ::: P(x 乞 4) = 0.051故取 c1 =3,又因為 P(x _ 11) = 0.0565 0.025 . P(x _ 12) = 0.021從而c2=12,拒絕域為 W =x _3或x _12。該拒絕域的實際顯著性水平不是0.05,而是0.016+0.02仁0.037,由于觀測值沒有落入拒絕域,故接受原假設。7.3.3大樣本檢驗思路如下:設x ,xn是來自某總體的樣本,又設該總體均值為二,方差為二的函數(shù),記二 2 (二)

19、。如對二點分布b(1門),其方差二(1-旳是均 值二的函數(shù),則對下列三種假設檢驗問題:H 0 : r :厲 vs H10H0 : v _ % vs H1: %H0: vs 出:八花在樣本容量n充分大時,利用中心極限定理,xNU,二2(二)/n),故在v -入時,可米用如下檢驗統(tǒng)計量.n(x - )N(0,1)近似地確定拒絕域,對應上述三類檢驗問題的拒絕域依次分別為W =u _W 二uW = U 占 5 屯/2例3某廠生產(chǎn)的產(chǎn)品不合格率10%,在一次例行檢查中,隨機抽取80件,發(fā)現(xiàn)有11件不合格品,在=0.05下能否認為不合格品率仍為10%。解 這是關(guān)于不合格品率 二的檢驗,假設為H0 :二-0

20、.1 vs H1-0.1由于樣本容量較大,因此可采用大樣本檢驗方法。由于-0 = 0.1,;2(二0) = 0.1 0.9 = 0.09,檢驗統(tǒng)計量為v80(1-0.1)u : 80=1.1180.09若取G =0.05 ,則U0.975 =1.96 ,故拒絕域為W=u 3 1.96。由于u =1.118成1.96,故不能拒絕原假設,可以認為不合格品率仍為10%。7.3.4檢驗的p值定義7.3.1在一個假設檢驗問題中,利用觀測值能夠做出拒絕原假設的最小顯著性水平稱為檢驗的p值給出檢驗的p值之后,則當: - p時,則在顯著性水平:-下拒絕H0 ;當: r+1)。這樣我們得到一個近似的水平為:-的

21、拒絕域:W 二 2 一(k -r -1)例2實驗中,每隔一定的時間觀察一次某種鈾所放射的到達計算器上的:粒子數(shù),共觀察 100次,的結(jié)果如下:i01234567891011色1215161726119921210其中n為觀察到i個:.粒子的次數(shù)。從理論上可知次數(shù)X應服從泊松(Poisson)i分布,即PX二i e,i =0,12,試問根據(jù)實驗的結(jié)果,X是否可認為服 i!iHo : PX 二i e常數(shù),0,i =0,1,2,i!從泊松(Poisson)分布? ( : =0.05)解:根據(jù)實驗結(jié)果構(gòu)造有限完備事件群:Ai=X = mi, i=1 , 2, - , 11,A12= X 12,由此 H

22、0可簡化為iH:P(Ai)二eji =0,1,2,11,i!11 iP(A12) =1e_,y i!因為H。和 H。中含有未知參數(shù), 的極大似然估計為? = X = 4.2然后再計算各事件得概率估計值:4 2 e211 A? =P(A)=PX =i=,i =0,1,2,,11, ?12 =1送 Pi .i!i_0結(jié)果見下表:A?n?ini - n?i(ni -n?i)2/n?A110.0151.5-1.80.415A250.0636.3-1.80.415A3160.13213.22.80.594A4170.18518.5-1.50.122A5260.19419.46.62.245A6110.1

23、6316.3-5.31.723A790.11411.4-2.40.505A890.0696.92.10.639A920.0363.6-0.50.0385A1010.0171.7-0.50.0385A1120.0070.7-0.50.0385A1210.0030.3-0.50.0385A1300.0020.2-0.50.0385E6.2815注意到有些n ?:5的組與相鄰組進行適當合并,使n ?-5。并組后r =8,且估計一個參數(shù),故2的自由度為8-1-1=6。因為 (r k 1)=忑05(6) =12.592 6.2815故接受Ho,即可以認為樣本來自泊松分布。7.4.2列聯(lián)表的獨立性檢驗列聯(lián)

24、表:將觀測數(shù)據(jù)按兩個或更多屬性(定性變量)分類時所列出的頻數(shù)表。一般地,若總體中的個體可按兩個屬性 A和B分類,A有r個類A - , Ar, B有c個類B!,Be,從總體中抽取大小為 n的樣本,設其中有nj個個體既屬 于A又屬于Bj,山稱為頻數(shù),將r e個山排列成為一個r行e列的二維列聯(lián) 表,簡稱r e表。r e列聯(lián)表AB1 -j-e和1nnn“ en1.91ini1nijn ieI-a11rn1njnren.和nnjnen若所考慮的屬性多于兩個,也可類似作出列聯(lián)表,稱為多維列聯(lián)表。列聯(lián)表分析的基本問題是:考察各屬性之間有無關(guān)聯(lián),即判別二屬性是否 獨立。在r e表中,若以pi, pj.和pij

25、分別表示總體中個體僅屬于A,僅屬于Bj和同時屬于 A和Bj的概率,則“ A、B兩屬性獨立”的假設可以表述為H 0 : Pj - pi p j,i - 1, r, j -1, ,e二維離散分布表AB1je行和1P11ap1 j-P1e*P1.iipi1aPij-Pie*Pi.1rPr1PrjPrePr .列和P1PjPe1這就變?yōu)樯弦徊糠种兄T Pj不完全已知時的分布擬合檢驗,這里諸 Pj共有 re個參數(shù),在原假設成立時,這re個參數(shù)Pj由r e個參數(shù)ppr , P1Pe re決定。在這后r - e個參數(shù)中存在兩個約束條件:、 p= 1 , p j = 1,所以,idi d此時pj實際上由r e-

26、2個獨立參數(shù)所確定。據(jù)此,檢驗統(tǒng)計量為g - npj )2n?j在原假設成立時上式近似服從自由度為 布。其中諸?j是在原假設成立下得到的?j = pi=(n ,/n)(nj /n)r c-( r c-2)= (r -1)(1)的 2 分Pj的最在似然估計。其表達式為對給定的顯著性水平:-(0 : : : 1),檢驗的拒絕域為2 2W=- (1)(1)1436名兒童,例3為研究兒童智力發(fā)展與營養(yǎng)的關(guān)系,某研究機構(gòu)調(diào)查了得到下表的數(shù)據(jù),試在顯著性水平0.05下判斷智力發(fā)展與營養(yǎng)有無關(guān)系。兒童智力與營養(yǎng)的調(diào)查數(shù)據(jù)智商合計 100營養(yǎng)良好3673422663291304營養(yǎng)不良56402016132合

27、計4233822863451436解用A表示營養(yǎng)狀況,它有兩個水平:A1表示營養(yǎng)良好,A2表示營養(yǎng)不良;B表示兒童智商,它有四個水平,B1,B2,B3, B4分別表示表中四種情況。沿用前面記號,首先建立假設H。:營養(yǎng)狀況與智商無關(guān)聯(lián),即A與B是獨立的。統(tǒng)計表示如下H。: Pj = Pi p j ,i = 1,2, j =1,2,3,4在原假設成立下,我們可以計算諸參數(shù)的最大似然估計值,P1 =1304/1436 =0.9081, ?2 =132/1436= 0.0919 =423/1436 =0.2946,?2 =382/1436 =0.266二 286/1436 = 0.1992,? 4 二

28、 345/1436 二 0.2403進而可給出諸npj = npi p。結(jié)果如下表諸n?j的計算結(jié)果 100營養(yǎng)良好384.1677346.8724259.7631313.35880.9081營養(yǎng)不良38.877935.103626.288131.71200.0919?j.0.29460.26600.19920.2403計算得到2 =19.2785此處(r -1)(c -1)=(2-1)(4-1)=3,?。?0.05,則盅.95 (3) = 7.81519.2785,故拒絕原假設。7.4.3正態(tài)性檢驗一、正態(tài)概率紙這是一種自然現(xiàn)象的坐標紙,其橫坐標是等間隔的,縱坐標是按標準正態(tài) 分布函數(shù)值給出的。進行正態(tài)性檢驗的方法:利用樣本數(shù)據(jù)在概率紙上描點,用目測方法看這 些點是否在一條直線附近,若是的話,可以認為該數(shù)據(jù)來自的總體為正態(tài)分布, 若明顯不在一條直線附近,則認為該數(shù)據(jù)來自非正態(tài)總體。例4隨機選取10個零件,測得其直徑與標準尺寸的偏差如下: (單位:絲)9.48.89.610.210.17.211.18.28.69.6在止態(tài)概率紙上作圖如卜:(1)首先將數(shù)據(jù)按從小到大的次序排列:x(1) - x(2)- x(n),具體為7.28.28.68.89.49.69.810.1 10.211.1對每一個i,計算修正頻率(i - 0.375)/(n - 0.25),i =1,2- ,n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論