概率論與數(shù)理統(tǒng)計(jì)第八章假設(shè)檢驗(yàn)_第1頁(yè)
概率論與數(shù)理統(tǒng)計(jì)第八章假設(shè)檢驗(yàn)_第2頁(yè)
概率論與數(shù)理統(tǒng)計(jì)第八章假設(shè)檢驗(yàn)_第3頁(yè)
概率論與數(shù)理統(tǒng)計(jì)第八章假設(shè)檢驗(yàn)_第4頁(yè)
概率論與數(shù)理統(tǒng)計(jì)第八章假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、.第八章 假設(shè)檢驗(yàn)第一節(jié) 概述統(tǒng)計(jì)推斷中的另一類重要問(wèn)題是假設(shè)檢驗(yàn)Hypothesis testing.當(dāng)總體的分布函數(shù)未知,或只知其形式而不知道它的參數(shù)的情況時(shí),我們常需要判斷總體是否具有我們所感興趣的某些特性.這樣,我們就提出某些關(guān)于總體分布或關(guān)于總體參數(shù)的假設(shè),然后根據(jù)樣本對(duì)所提出的假設(shè)作出判斷:是承受還是回絕.這就是本章所要討論的假設(shè)檢驗(yàn)問(wèn)題.我們先從下面的例子來(lái)說(shuō)明假設(shè)檢驗(yàn)的一般提法.例8.1 某工廠用包裝機(jī)包裝奶粉,額定標(biāo)準(zhǔn)為每袋凈重0.5kg.設(shè)包裝機(jī)稱得奶粉重量X服從正態(tài)分布N,2.根據(jù)長(zhǎng)期的經(jīng)歷知其標(biāo)準(zhǔn)差=0.015kg.為檢驗(yàn)?zāi)撑_(tái)包裝機(jī)的工作是否正常;隨機(jī)抽取包裝的奶粉9袋

2、,稱得凈重單位:kg為0.499 0.515 0.508 0.512 0.4980.515 0.516 0.513 0.524問(wèn)該包裝機(jī)的工作是否正常?由于長(zhǎng)期理論說(shuō)明標(biāo)準(zhǔn)差比較穩(wěn)定,于是我們假設(shè)XN,0.0152.假設(shè)奶粉重量X的均值等于0.5kg,我們說(shuō)包裝機(jī)的工作是正常的.于是提出假設(shè):H0:=0=0.5;H1:0=0.5.這樣的假設(shè)叫統(tǒng)計(jì)假設(shè).1.統(tǒng)計(jì)假設(shè)關(guān)于總體X的分布或隨機(jī)事件之概率的各種論斷叫統(tǒng)計(jì)假設(shè),簡(jiǎn)稱假設(shè),用“H表示,例如:1 對(duì)于檢驗(yàn)?zāi)硞€(gè)總體X的分布,可以提出假設(shè):H0:X服從正態(tài)分布,H1: X不服從正態(tài)分布.H0:X服從泊松分布,H1: X不服從泊松分布.2 對(duì)于總體

3、X的分布的參數(shù),假設(shè)檢驗(yàn)均值,可以提出假設(shè):H0:=0;H1:0.H0:0;H1:0.假設(shè)檢驗(yàn)標(biāo)準(zhǔn)差,可提出假設(shè):H0:=0;H1:0.H0:0;H1:0.這里0,0是數(shù),而=EX,2=DX是未知參數(shù).上面對(duì)于總體X的每個(gè)論斷,我們都提出了兩個(gè)互相對(duì)立的統(tǒng)計(jì)假設(shè):H0和H1,顯然,H0與H1只有一個(gè)成立,或H0真H1假,或H0假H1真,其中假設(shè)H0,稱為原假設(shè)Original hypothesis又叫零假設(shè)、根本假設(shè),而H1稱為H0的對(duì)立假設(shè)又叫備擇假設(shè).在處理實(shí)際問(wèn)題時(shí),通常把希望得到的陳述視為備擇假設(shè),而把這一陳述的否認(rèn)作為原假設(shè).例如在上例中,H0:=0=0.5為原假設(shè),它的對(duì)立假設(shè)是H

4、1:0=0.5.統(tǒng)計(jì)假設(shè)提出之后,我們關(guān)心的是它的真?zhèn)?所謂對(duì)假設(shè)H0的檢驗(yàn),就是根據(jù)來(lái)自總體的樣本,按照一定的規(guī)那么對(duì)H0作出判斷:是承受,還是回絕,這個(gè)用來(lái)對(duì)假設(shè)作出判斷的規(guī)那么叫做檢驗(yàn)準(zhǔn)那么,簡(jiǎn)稱檢驗(yàn),如何對(duì)統(tǒng)計(jì)假設(shè)進(jìn)展檢驗(yàn)?zāi)兀课覀兘Y(jié)合上例來(lái)說(shuō)明假設(shè)檢驗(yàn)的根本思想和做法.2.假設(shè)檢驗(yàn)的根本思想在例8.1中所提假設(shè)是H0:=0=0.5備擇假設(shè)H1:0.由于要檢驗(yàn)的假設(shè)涉及總體均值,故首先想到是否可借助樣本均值這一統(tǒng)計(jì)量來(lái)進(jìn)展判斷.從抽樣的結(jié)果來(lái)看,樣本均值=0.499+0.515+0.508+0.512+0.498+0.515+0.516+0.513+0.524=0.5110,與=0.5之

5、間有差異.對(duì)于與0之間的差異可以有兩種不同的解釋.1 統(tǒng)計(jì)假設(shè)H0是正確的,即=0=0.5,只是由于抽樣的隨機(jī)性造成了與0之間的差異;2 統(tǒng)計(jì)假設(shè)H0是不正確的,即0=0.5,由于系統(tǒng)誤差,也就是包裝機(jī)工作不正常,造成了與0之間的差異.對(duì)于這兩種解釋到底哪一種比較合理呢?為了答復(fù)這個(gè)問(wèn)題,我們適中選擇一個(gè)小正數(shù)=0.1,0.05等,叫做顯著性程度Level of significance.在假設(shè)H0成立的條件下,確定統(tǒng)計(jì)量 -0的臨界值,使得事件-0為小概率事件,即P-0=.8.1例如,取定顯著性程度=0.05.如今來(lái)確定臨界值0.05.因?yàn)閄N,2,當(dāng)H0:=0=0.5為真時(shí),有XN0,2,

6、于是,Z=N0,1,所以 PZz/2=.由8.1式,有=,因此0.05=z0.025×=1.96×0.015/3=0.0098.故有P-00.0098=0.05.因?yàn)?0.05很小,根據(jù)實(shí)際推斷原理,即“小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生的原理,我們認(rèn)為當(dāng)H0為真時(shí),事件-00.0098是小概率事件,實(shí)際上是不可能發(fā)生的.如今抽樣的結(jié)果是-0=0.5110-0.5=0.01100.0098.也就是說(shuō),小概率事件-00.0098居然在一次抽樣中發(fā)生了,這說(shuō)明抽樣得到的結(jié)果與假設(shè)H0不相符,因此不能不使人疑心假設(shè)H0的正確性,所以在顯著性程度=0.05下, 我們回絕H0,承

7、受H1,即認(rèn)為這一天包裝機(jī)的工作是不正常的.通過(guò)上例的分析,我們知道假設(shè)檢驗(yàn)的根本思想是小概率事件原理,檢驗(yàn)的根本步驟是:1 根據(jù)實(shí)際問(wèn)題的要求,提出原假設(shè)H0及備擇假設(shè)H1;2 選取適當(dāng)?shù)娘@著性程度通常=0.10,0.05等以及樣本容量n;3 構(gòu)造檢驗(yàn)用的統(tǒng)計(jì)量U,當(dāng)H0為真時(shí),U的分布要,找出臨界值使PU=.我們稱U所確定的區(qū)域?yàn)镠0的回絕域Rejection region,記作W;4 取樣,根據(jù)樣本觀察值,計(jì)算統(tǒng)計(jì)量U的觀察值U0;5 作出判斷,將U的觀察值U0與臨界值比較,假設(shè)U0落入回絕域W內(nèi),那么回絕H0承受H1;否那么就說(shuō)H0相容承受H0.3.兩類錯(cuò)誤由于我們是根據(jù)樣本作出承受H

8、0或回絕H0的決定,而樣本具有隨機(jī)性,因此在進(jìn)展判斷時(shí),我們可能會(huì)犯兩個(gè)方面的錯(cuò)誤:一類錯(cuò)誤是,當(dāng)H0為真時(shí),而樣本的觀察值U0落入回絕域W中,按給定的法那么,我們回絕了H0,這種錯(cuò)誤稱為第一類錯(cuò)誤.其發(fā)生的概率稱為犯第一類錯(cuò)誤的概率或稱棄真概率,通常記為,即P回絕H0H0為真=;另一種錯(cuò)誤是,當(dāng)H0不真時(shí),而樣本的觀察值落入回絕域W之外,按給定的檢驗(yàn)法那么,我們卻承受了H0.這種錯(cuò)誤稱為第二類錯(cuò)誤,其發(fā)生的概率稱為犯第二類錯(cuò)誤的概率或取偽概率,通常記為,即P承受H0H0不真=.顯然這里的就是檢驗(yàn)的顯著性程度.總體與樣本各種情況的搭配見(jiàn)表8-1.表8-1H0判斷結(jié)論犯錯(cuò)誤的概率真承受正確0回絕

9、犯第一類錯(cuò)誤假承受犯第二類錯(cuò)誤回絕正確0對(duì)給定的一對(duì)H0和H1,總可以找到許多回絕域W.當(dāng)然我們希望尋找這樣的回絕域W,使得犯兩類錯(cuò)誤的概率與都很小.但是在樣本容量n固定時(shí),要使與都很小是不可能的,一般情形下,減小犯其中一類錯(cuò)誤的概率,會(huì)增加犯另一類錯(cuò)誤的概率,它們之間的關(guān)系猶如區(qū)間估計(jì)問(wèn)題中置信程度與置信區(qū)間的長(zhǎng)度的關(guān)系那樣.通常的做法是控制犯第一類錯(cuò)誤的概率不超過(guò)某個(gè)事先指定的顯著性程度01,而使犯第二類錯(cuò)誤的概率也盡可能地小.詳細(xì)實(shí)行這個(gè)原那么會(huì)有許多困難,因此有時(shí)把這個(gè)原那么簡(jiǎn)化成只要求犯第一類錯(cuò)誤的概率等于,稱這類假設(shè)檢驗(yàn)問(wèn)題為顯著性檢驗(yàn)問(wèn)題,相應(yīng)的檢驗(yàn)為顯著性檢驗(yàn).在一般情況下,顯

10、著性檢驗(yàn)法那么是較容易找到的,我們將在以下各節(jié)中詳細(xì)討論.在實(shí)際問(wèn)題中,要確定一個(gè)檢驗(yàn)問(wèn)題的原假設(shè),一方面要根據(jù)問(wèn)題要求檢驗(yàn)的是什么,另一方面要使原假設(shè)盡量簡(jiǎn)單,這是因?yàn)樵谙旅鎸⒅v到的檢驗(yàn)法中,必需要理解某統(tǒng)計(jì)量在原假設(shè)成立時(shí)的準(zhǔn)確分布或漸近分布.下面各節(jié)中,我們先介紹正態(tài)總體下參數(shù)的幾種顯著性檢驗(yàn),再介紹總體分布函數(shù)的假設(shè)檢驗(yàn).第二節(jié) 單個(gè)正態(tài)總體的假設(shè)檢驗(yàn)1.單個(gè)正態(tài)總體數(shù)學(xué)期望的假設(shè)檢驗(yàn)1 2關(guān)于的假設(shè)檢驗(yàn)Z檢驗(yàn)法Z-test設(shè)總體XN,2,方差2,檢驗(yàn)假設(shè)H0:=0;H1:0 0為常數(shù)由N,N0,1,我們選取Z= 8.2作為此假設(shè)檢驗(yàn)的統(tǒng)計(jì)量,顯然當(dāng)假設(shè)H0為真即=0正確時(shí),ZN0,1

11、,所以對(duì)于給定的顯著性程度,可求z/2使PZz/2=,見(jiàn)圖8-1,即PZ-z/2+PZz/2=.從而有PZz/2=/2,PZz/2=1-/2.圖8-1利用概率1-/2,反查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表,得雙側(cè)分位點(diǎn)即臨界值z(mì)/2.另一方面,利用樣本觀察值x1,x2,xn計(jì)算統(tǒng)計(jì)量Z的觀察值z(mì)0=. 8.3假設(shè):az0z/2,那么在顯著性程度下,回絕原假設(shè)H0承受備擇假設(shè)H1,所以z0z/2便是H0的回絕域.b z0z/2,那么在顯著性程度下,承受原假設(shè)H0,認(rèn)為H0正確.這里我們是利用H0為真時(shí)服從N0,1分布的統(tǒng)計(jì)量Z來(lái)確定回絕域的,這種檢驗(yàn)法稱為Z檢驗(yàn)法或稱U檢驗(yàn)法.例8.1中所用的方法就是Z檢驗(yàn)法

12、.為了熟悉這類假設(shè)檢驗(yàn)的詳細(xì)作法,如今我們?cè)倥e一例.例8.2 根據(jù)長(zhǎng)期經(jīng)歷和資料的分析,某磚廠消費(fèi)的磚的“抗斷強(qiáng)度X服從正態(tài)分布,方差2=1.21.從該廠產(chǎn)品中隨機(jī)抽取6塊,測(cè)得抗斷強(qiáng)度如下單位:kg·cm-2:32.56 29.66 31.64 30.00 31.87 31.03檢驗(yàn)這批磚的平均抗斷強(qiáng)度為32.50kg·cm-2是否成立取=0.05,并假設(shè)磚的抗斷強(qiáng)度的方差不會(huì)有什么變化?解 提出假設(shè)H0:=0=32.50;H1:0. 選取統(tǒng)計(jì)量Z=,假設(shè)H0為真,那么ZN0,1. 對(duì)給定的顯著性程度=0.05,求z/2使PZz/2=,這里z/2=z0.025=1.96.

13、 計(jì)算統(tǒng)計(jì)量Z的觀察值:z0= =3.05. 判斷:由于z0=3.05z0.025=1.96,所以在顯著性程度=0.05下否認(rèn)H0,即不能認(rèn)為這批產(chǎn)品的平均抗斷強(qiáng)度是32.50 kg·cm-2.把上面的檢驗(yàn)過(guò)程加以概括,得到了關(guān)于方差的正態(tài)總體期望值的檢驗(yàn)步驟:a 提出待檢驗(yàn)的假設(shè)H0:=0;H1:0.b 構(gòu)造統(tǒng)計(jì)量Z,并計(jì)算其觀察值z(mì)0:Z=,z0=.c 對(duì)給定的顯著性程度,根據(jù)PZz/2=,PZz/2=/2,PZz/2=1-/2查標(biāo)準(zhǔn)正態(tài)分布表,得雙側(cè)分位點(diǎn)z/2.d 作出判斷:根據(jù)H0的回絕域假設(shè)z0z/2,那么回絕H0,承受H1;假設(shè)z0z/2,那么承受H0.2 方差2未知,

14、檢驗(yàn)t檢驗(yàn)法t-test設(shè)總體XN,2,方差2未知,檢驗(yàn)H0:=0;H1:0.由于2未知,便不是統(tǒng)計(jì)量,這時(shí)我們自然想到用2的無(wú)偏估計(jì)量樣本方差S2代替2,由于tn-1,應(yīng)選取樣本的函數(shù)t= 8.4圖8-2作為統(tǒng)計(jì)量,當(dāng)H0為真=0時(shí)ttn-1,對(duì)給定的檢驗(yàn)顯著性程度,由Ptt/2n-1=,Ptt/2n-1=/2,見(jiàn)圖8-2,直接查t分布表,得t分布分位點(diǎn)t/2n-1.利用樣本觀察值,計(jì)算統(tǒng)計(jì)量t的觀察值t0=,因此原假設(shè)H0的回絕域?yàn)閠0=t/2n-1. 8.5所以,假設(shè)t0t/2n-1,那么回絕H0,承受H1;假設(shè)t0t/2n-1,那么承受原假設(shè)H0.上述利用t統(tǒng)計(jì)量得出的檢驗(yàn)法稱為t檢驗(yàn)

15、法.在實(shí)際中,正態(tài)總體的方差常為未知,所以我們常用t檢驗(yàn)法來(lái)檢驗(yàn)關(guān)于正態(tài)總體均值的問(wèn)題.例8.3 用某儀器間接測(cè)量溫度,重復(fù)5次,所得的數(shù)據(jù)是1250°,1265°,1245°,1260°,1275°,而用別的準(zhǔn)確方法測(cè)得溫度為1277°可看作溫度的真值,試問(wèn)此儀器間接測(cè)量有無(wú)系統(tǒng)偏向?這里假設(shè)測(cè)量值X服從N,2分布.解 問(wèn)題是要檢驗(yàn)H0:=0=1277;H1:0.由于2未知即儀器的精度不知道,我們選取統(tǒng)計(jì)量t=.當(dāng)H0為真時(shí),ttn-1,t的觀察值為t0=3.對(duì)于給定的檢驗(yàn)程度=0.05,由Ptt/2n-1=,Ptt/2n-1=/2

16、,Ptt0.0254=0.025,查t分布表得雙側(cè)分位點(diǎn)t/2n-1=t0.0254=2.776.因?yàn)閠03t0.0254=2.776,故應(yīng)回絕H0,認(rèn)為該儀器間接測(cè)量有系統(tǒng)偏向.3 雙邊檢驗(yàn)與單邊檢驗(yàn)上面討論的假設(shè)檢驗(yàn)中,H0為=0,而備擇假設(shè)H1:0意思是可能大于0,也可能小于0,稱為雙邊備擇假設(shè),而稱形如H0:=0,H1:0的假設(shè)檢驗(yàn)為雙邊檢驗(yàn).有時(shí)我們只關(guān)心總體均值是否增大,例如,試驗(yàn)新工藝以進(jìn)步材料的強(qiáng)度,這時(shí)所考慮的總體的均值應(yīng)該越大越好,假設(shè)我們能判斷在新工藝下總體均值較以往正常消費(fèi)的大,那么可考慮采用新工藝.此時(shí),我們需要檢驗(yàn)假設(shè)H0:=0;H1:0. 8.6我們?cè)谶@里作了不言

17、而喻的假定,即新工藝不可能比舊的更差,形如8.6的假設(shè)檢驗(yàn),稱為右邊檢驗(yàn),類似地,有時(shí)我們需要檢驗(yàn)假設(shè)H0:=0;H1:0. 8.7形如8.7的假設(shè)檢驗(yàn),稱為左邊檢驗(yàn),右邊檢驗(yàn)與左邊檢驗(yàn)統(tǒng)稱為單邊檢驗(yàn).下面來(lái)討論單邊檢驗(yàn)的回絕域.設(shè)總體XN,2,2為,x1,x2,xn是來(lái)自X的樣本觀察值.給定顯著性程度,我們先求檢驗(yàn)問(wèn)題H0:=0;H1:0.的回絕域.取檢驗(yàn)統(tǒng)計(jì)量Z=,當(dāng)H0為真時(shí),Z不應(yīng)太大,而在H1為真時(shí),由于X是的無(wú)偏估計(jì),當(dāng)偏大時(shí),X也偏大,從而Z往往偏大,因此回絕域的形式為Z=k,k待定.因?yàn)楫?dāng)H0為真時(shí),N0,1,由P回絕H0H0為真=P=得k=z,故回絕域?yàn)閆=z. 8.8類似地

18、,左邊檢驗(yàn)問(wèn)題H0:=0;H1:0.的回絕域?yàn)閆=-z. 8.9例8.4 從甲地發(fā)送一個(gè)信號(hào)到乙地,設(shè)發(fā)送的信號(hào)值為,由于信號(hào)傳送時(shí)有噪聲迭加到信號(hào)上,這個(gè)噪聲是隨機(jī)的,它服從正態(tài)分布N0,22,從而乙地接到的信號(hào)值是一個(gè)服從正態(tài)分布N,22的隨機(jī)變量.設(shè)甲地發(fā)送某信號(hào)5次,乙地收到的信號(hào)值為:8.4 10.5 9.1 9.6 9.9由以往經(jīng)歷,信號(hào)值為8,于是乙方猜測(cè)甲地發(fā)送的信號(hào)值為8,能否承受這種猜測(cè)?取=0.05.解 按題意需檢驗(yàn)假設(shè)H0:=8;H1:8.這是右邊檢驗(yàn)問(wèn)題,其回絕域如8.8式所示,即 Z= z0.05=1.645.而如今z0=1.681.645,所以回絕H0,認(rèn)為發(fā)出的

19、信號(hào)值8.2.單個(gè)正態(tài)總體方差的假設(shè)檢驗(yàn)檢驗(yàn)法-test1 雙邊檢驗(yàn)設(shè)總體XN,2,未知,檢驗(yàn)假設(shè)H0:2=02;H1:202.其中02為常數(shù).由于樣本方差S2是2的無(wú)偏估計(jì),當(dāng)H0為真時(shí),比值一般來(lái)說(shuō)應(yīng)在1附近擺動(dòng),而不應(yīng)過(guò)分大于1或過(guò)分小于1,由第六章知當(dāng)H0為真時(shí)=n-1. 8.10所以對(duì)于給定的顯著性程度有圖8-3圖8-3Pn-1n-1=1-. 8.11對(duì)于給定的,查分布表可求得分布分位點(diǎn)n-1與n-1.由8.11知,H0的承受域是 n-1 n-1; 8.12H0的回絕域?yàn)閚-1或n-1. 8.13這種用服從分布的統(tǒng)計(jì)量對(duì)個(gè)單正態(tài)總體方差進(jìn)展假設(shè)檢驗(yàn)的方法,稱為檢驗(yàn)法.例8.5 某廠消

20、費(fèi)的某種型號(hào)的電池,其壽命長(zhǎng)期以來(lái)服從方差2=5000小時(shí)2的正態(tài)分布,現(xiàn)有一批這種電池,從它的消費(fèi)情況來(lái)看,壽命的波動(dòng)性有所改變,現(xiàn)隨機(jī)抽取26只電池,測(cè)得其壽命的樣本方差s2=9200小時(shí)2.問(wèn)根據(jù)這一數(shù)據(jù)能否推斷這批電池的壽命的波動(dòng)性較以往有顯著的變化取=0.02?解 此題要求在=0.02下檢驗(yàn)假設(shè)H0:2=5000;H1:25000.如今n=26,n-1=44.314, n-1= =11.524,02=5000.由8.13回絕域?yàn)?4.314或11.524由觀察值s2=9200得=4644.314,所以回絕H0,認(rèn)為這批電池壽命的波動(dòng)性較以往有顯著的變化.2 單邊檢驗(yàn)右檢驗(yàn)或左檢驗(yàn)設(shè)總

21、體XN,2,未知,檢驗(yàn)假設(shè)H0:202;H1:202.右檢驗(yàn)由于XN,2,故隨機(jī)變量=n-1.當(dāng)H0為真時(shí),統(tǒng)計(jì)量=.對(duì)于顯著性程度,有Pn-1=圖8-4圖8-4.于是有Pn-1Pn-1=.可見(jiàn),當(dāng)很小時(shí),n-1是小概率事件,在一次的抽樣中認(rèn)為不可能發(fā)生,所以H0的回絕域是:=n-1右檢驗(yàn). 8.14類似地,可得左檢驗(yàn)假設(shè)H0:202,H1:202的回絕域?yàn)閚-1左檢驗(yàn). 8.15例8.6 今進(jìn)展某項(xiàng)工藝革新,從革新后的產(chǎn)品中抽取25個(gè)零件,測(cè)量其直徑,計(jì)算得樣本方差為s2=0.00066,革新前零件直徑的方差2=0.0012,設(shè)零件直徑服從正態(tài)分布,問(wèn)革新后消費(fèi)的零件直徑的方差是否顯著減???

22、=0.05解 1 提出假設(shè)H0:202=0.0012;H1:2<02.2 選取統(tǒng)計(jì)量=.=n-1,且當(dāng)H0為真時(shí),3 對(duì)于顯著性程度=0.05,查分布表得n-1=13.848,當(dāng)H0為真時(shí),P< n-1P=.故回絕域?yàn)?lt; n-1=13.848.4 根據(jù)樣本觀察值計(jì)算的觀察值=13.2.5 作判斷:由于=13.2 n-1=13.848,即落入回絕域中,所以回絕H0:202,即認(rèn)為革新后消費(fèi)的零件直徑的方差小于革新前消費(fèi)的零件直徑的方差.最后我們指出,以上討論的是在均值未知的情況下,對(duì)方差的假設(shè)檢驗(yàn),這種情況在實(shí)際問(wèn)題中較多.至于均值的情況下,對(duì)方差的假設(shè)檢驗(yàn),其方法類似,只是所

23、選的統(tǒng)計(jì)量為=.當(dāng)2=02為真時(shí),n.關(guān)于單個(gè)正態(tài)總體的假設(shè)檢驗(yàn)可列表8-2.表8-2檢驗(yàn)參數(shù)條件H0H1H0的回絕域檢驗(yàn)用的統(tǒng)計(jì)量自由度分位點(diǎn)數(shù)學(xué)期望2已知=000000|Z|z/2ZzZ-zZ=±z/2z-z2未知=000000tt/2ttt-tt=n-1±t/2t-t方差未知2=02202202202202202=n-1已知2=02202202202202202=n注:上表中H0中的不等號(hào)改成等號(hào),所得的回絕域不變.第三節(jié) 兩個(gè)正態(tài)總體的假設(shè)檢驗(yàn)上一節(jié)介紹了單個(gè)正態(tài)總體的數(shù)學(xué)期望與方差的檢驗(yàn)問(wèn)題,在實(shí)際工作中還常碰到兩個(gè)正態(tài)總體的比較問(wèn)題.1.兩正態(tài)總體數(shù)學(xué)期望假設(shè)檢

24、驗(yàn)1 方差,關(guān)于數(shù)學(xué)期望的假設(shè)檢驗(yàn)Z檢驗(yàn)法設(shè)XN1,12,YN2,22,且X,Y互相獨(dú)立,12與22,要檢驗(yàn)的是H0:1=2;H1:12.雙邊檢驗(yàn)怎樣尋找檢驗(yàn)用的統(tǒng)計(jì)量呢?從總體X與Y中分別抽取容量為n1,n2的樣本X1,X2,及Y1,Y2,由于,E-=E-E=1-2,D-=D+D=,故隨機(jī)變量-也服從正態(tài)分布,即-N1-2,.從而N0,1.于是我們按如下步驟判斷.a 選取統(tǒng)計(jì)量 Z=, 8.16當(dāng)H0為真時(shí),ZN0,1.b 對(duì)于給定的顯著性程度,查標(biāo)準(zhǔn)正態(tài)分布表求z/2使PZz/2=,或PZz/2=1-/2. 8.17c 由兩個(gè)樣本觀察值計(jì)算Z的觀察值z(mì)0:z0=.d 作出判斷:假設(shè)z0z/

25、2,那么回絕假設(shè)H0,承受H1;假設(shè)z0z/2,那么與H0相容,可以承受H0.例8.7 A,B兩臺(tái)車床加工同一種軸,如今要測(cè)量軸的橢圓度.設(shè)A車床加工的軸的橢圓度XN1,12,B車床加工的軸的橢圓度YN2,22,且12=0.0006mm2,22=0.0038mm2,現(xiàn)從A,B兩臺(tái)車床加工的軸中分別測(cè)量了n1=200,n2=150根軸的橢圓度,并計(jì)算得樣本均值分別為=0.081mm,=0.060mm.試問(wèn)這兩臺(tái)車床加工的軸的橢圓度是否有顯著性差異?給定=0.05解 提出假設(shè)H0:1=2;H1:12. 選取統(tǒng)計(jì)量Z=,在H0為真時(shí),ZN0,1. 給定=0.05,因?yàn)槭请p邊檢驗(yàn),/2=0.025.P

26、Zz/2=0.05, PZz/2=0.025,PZz/2=1-0.025=0.975.查標(biāo)準(zhǔn)正態(tài)分布表,得z/2=z0.025=1.96. 計(jì)算統(tǒng)計(jì)量Z的觀察值z(mì)z0=3.95. 作判斷:由于z0=3.951.96=z/2,故回絕H0,即在顯著性程度=0.05下,認(rèn)為兩臺(tái)車床加工的軸的橢圓度有顯著差異.用Z檢驗(yàn)法對(duì)兩正態(tài)總體的均值作假設(shè)檢驗(yàn)時(shí),必須知道總體的方差,但在許多實(shí)際問(wèn)題中總體方差12與22往往是未知的,這時(shí)只能用如下的t檢驗(yàn)法.2 方差12,22未知,關(guān)于均值的假設(shè)檢驗(yàn)t檢驗(yàn)法設(shè)兩正態(tài)總體X與Y互相獨(dú)立,XN1,12,YN2,22,12,22未知,但知12=22,檢驗(yàn)假設(shè)H0:1=2

27、;H1:12.雙邊檢驗(yàn)從總體X,Y中分別抽取樣本X1,X2,與Y1,Y2,那么隨機(jī)變量t=tn1+n2-2,式中Sw2=,S12,S22分別是X與Y的樣本方差.當(dāng)假設(shè)H0為真時(shí),統(tǒng)計(jì)量t= tn1+n2-2. 8.18對(duì)給定的顯著性程度,查t分布得t/2n1+n2-2,使得Ptt/2n1+n2-2=. 8.19再由樣本觀察值計(jì)算t的觀察值t0=, 8.20最后作出判斷:假設(shè)t0t/2n1+n2-2,那么回絕H0;假設(shè)t0t/2n1+n2-2,那么承受H0.例8.8 在一臺(tái)自動(dòng)車床上加工直徑為2.050毫米的軸,如今每相隔兩小時(shí),各取容量都為10的樣本,所得數(shù)據(jù)列表如表8-3所示.表8-3零件加

28、工編號(hào)12345678910第一個(gè)樣本2.0662.0632.0682.0602.0672.0632.0592.0622.0622.060第二個(gè)樣本2.0632.0602.0572.0562.0592.0582.0622.0592.0592.057假設(shè)直徑的分布是正態(tài)的,由于樣本是取自同一臺(tái)車床,可以認(rèn)為12=22=2,而2是未知常數(shù).問(wèn)這臺(tái)自動(dòng)車床的工作是否穩(wěn)定?取=0.01解 這里實(shí)際上是12=22=2,但2未知的情況下檢驗(yàn)假設(shè)H0:1=2;H1:12.我們用t檢驗(yàn)法,由樣本觀察值算得:=2.063, =2.059,s12=0.00000956, s22=0.00000489,sw2=0.

29、0000072.由8.20式計(jì)算得t0=3.3.對(duì)于=0.01,查自由度為18的t分布表得t0.00518=2.878.由于t0=3.3t0.00518=2.878,于是回絕原假設(shè)H0:1=2.這說(shuō)明兩個(gè)樣本在消費(fèi)上是有差異的,可能這臺(tái)自動(dòng)車床受時(shí)間的影響而消費(fèi)不穩(wěn)定.2. 兩正態(tài)總體方差的假設(shè)檢驗(yàn)F檢驗(yàn)法F-test1 雙邊檢驗(yàn)設(shè)兩正態(tài)總體XN1,12,YN2,22,X與Y獨(dú)立,X1,X2,與Y1,Y2,分別是來(lái)自這兩個(gè)總體的樣本,且1與2未知.如今要檢驗(yàn)假設(shè)H0:12=22;H1:1222.在原假設(shè)H0成立下,兩個(gè)樣本方差的比應(yīng)該在1附近隨機(jī)地?cái)[動(dòng),所以這個(gè)比不能太大又不能太小.于是我們選

30、取統(tǒng)計(jì)量F=. 8.21顯然,只有當(dāng)F接近1時(shí),才認(rèn)為有12=22.由于隨機(jī)變量F*= Fn1-1,n2-1,所以當(dāng)假設(shè)H0:12=22成立時(shí),統(tǒng)計(jì)量F= Fn1-1,n2-1.對(duì)于給定的顯著性程度,可以由F分布表求得臨界值n1-1,n2-1與F/2n1-1,n2-1使得 P n1-1,n2-1FF/2n1-1,n2-1=1-圖8-5,由此可知H0的承受區(qū)域是n1-1,n2-1FF/2n1-1,n2-1;而H0的回絕域?yàn)镕n1-1,n2-1,或 FF/2n1-1,n2-1.然后,根據(jù)樣本觀察值計(jì)算統(tǒng)計(jì)量F的觀察值,假設(shè)F的觀察值落在回絕域中,那么回絕H0,承受H1;假設(shè)F的觀察值落在承受域中,

31、那么承受H0.圖8-5例8.9 在例8.8中我們認(rèn)為兩個(gè)總體的方差12=22,它們是否真的相等呢?為此我們來(lái)檢驗(yàn)假設(shè)H0:12=22給定=0.1.解 這里n1=n2=10,s12=0.00000956,s22=0.00000489,于是統(tǒng)計(jì)量F的觀察值為F=0.00000956/0.00000489=1.95.查F分布表得F/2n1-1,n2-1=F0.059,9=3.18,F(xiàn)1-/2n1-1,n2-1=F0.959,9=1/F0.059,9=1/3.18.由樣本觀察值算出的F滿足F0.959,9=1/3.18F=1.953.18=F0.059,9.可見(jiàn)它不落入回絕域,因此不能回絕原假設(shè)H0:

32、12=22,從而認(rèn)為兩個(gè)總體的方差無(wú)顯著差異.注意:在1與2時(shí),要檢驗(yàn)假設(shè)H0:12=22,其檢驗(yàn)方法類同均值未知的情況,此時(shí)所采用的檢驗(yàn)統(tǒng)計(jì)量是:F=Fn1,n2.其回絕域參看表8-4.表8-4檢驗(yàn)參數(shù)條件H0H1H0的回絕域檢驗(yàn)用的統(tǒng)計(jì)量自由度分位點(diǎn)均值12,22已知1=21212121212|Z|z/2ZzZ-zZ=±z/2z-z12,22未知12=221=21212121212tt/2ttt-tt=n1+n2-2±t/2t-t方差1,2未知12=2212221222122212221222FF/2或FF1-/2FFFF1-F=n1-1,n2-1F/2或F1-/2FF

33、F1-1,2已知12=221222122122212221222FF/2或FF1-/2FFFF1-F=n1,n2F/2或F1-/2FFF1- 2 單邊檢驗(yàn)可作類似的討論,限于篇幅,這里不作介紹了.第四節(jié) 總體分布函數(shù)的假設(shè)檢驗(yàn)上兩節(jié)中,我們?cè)诳傮w分布形式為的前提下,討論了參數(shù)的檢驗(yàn)問(wèn)題.然而在實(shí)際問(wèn)題中,有時(shí)不能確知總體服從什么類型的分布,此時(shí)就要根據(jù)樣本來(lái)檢驗(yàn)關(guān)于總體分布的假設(shè).例如檢驗(yàn)假設(shè):“總體服從正態(tài)分布等.本節(jié)僅介紹檢驗(yàn)法.所謂檢驗(yàn)法是在總體的分布為未知時(shí),根據(jù)樣本值x1,x2,xn來(lái)檢驗(yàn)關(guān)于總體分布的假設(shè)H0:總體X的分布函數(shù)為Fx;H1:總體X的分布函數(shù)不是Fx 8.22的一種方

34、法這里的備擇假設(shè)H1可不必寫出.注意,假設(shè)總體X為離散型,那么假設(shè)8.22相當(dāng)于H0:總體X的分布律為PX=xi=pi,i=1,2,;8.23假設(shè)總體X為連續(xù)型,那么假設(shè)8.22相當(dāng)于H0:總體X的概率密度為fx. 8.24在用檢驗(yàn)法檢驗(yàn)假設(shè)H0時(shí),假設(shè)在假設(shè)H0下Fx的形式,而其參數(shù)值未知,此時(shí)需先用極大似然估計(jì)法估計(jì)參數(shù),然后再作檢驗(yàn).檢驗(yàn)法的根本思想與方法如下:1 將隨機(jī)試驗(yàn)可能結(jié)果的全體分為k個(gè)互不相容的事件A1,A2,Ak=,AiAj=Æ,ij;i,j=1,2,k,于是在H0為真時(shí),可以計(jì)算概率=PAii=1,2,k.2 尋找用于檢驗(yàn)的統(tǒng)計(jì)量及相應(yīng)的分布,在n次試驗(yàn)中,事件

35、Ai出現(xiàn)的頻率與概率往往有差異,但由大數(shù)定律可以知道,假設(shè)樣本容量n較大一般要求n至少為50,最好在100以上,在H0成立條件下的值應(yīng)該比較小,基于這種想法,皮爾遜使用= 8.25作為檢驗(yàn)H0的統(tǒng)計(jì)量,并證明了如下的定理.定理8.1 假設(shè)n充分大n50,那么當(dāng)H0為真時(shí)不管H0中的分布屬什么分布,統(tǒng)計(jì)量8.25總是近似地服從自由度為k-r-1的分布,其中r是被估計(jì)的參數(shù)的個(gè)數(shù).3 對(duì)于給定的檢驗(yàn)程度,查表確定臨界值使P=,從而得到H0的回絕域?yàn)?4由樣本值x1,x2,xn計(jì)算的值,并與比較.5 作結(jié)論:假設(shè),那么回絕H0,即不能認(rèn)為總體分布函數(shù)為Fx;否那么承受H0.例8.10 一本書的一頁(yè)中

36、印刷錯(cuò)誤的個(gè)數(shù)X是一個(gè)隨機(jī)變量,現(xiàn)檢查了一本書的100頁(yè),記錄每頁(yè)中印刷錯(cuò)誤的個(gè)數(shù),其結(jié)果如表8-5所示.表8-5錯(cuò)誤個(gè)數(shù)i01234567頁(yè)數(shù)fi36401920210AiA 0A 1A 2A 3A 4A 5A 6A7其中fi是觀察到有i個(gè)錯(cuò)誤的頁(yè)數(shù).問(wèn)能否認(rèn)為一頁(yè)書中的錯(cuò)誤個(gè)數(shù)X服從泊松分布取=0.05?解 由題意首先提出假設(shè):H0:總體X服從泊松分布.PX=i=,i=0,1,2,這里H0中參數(shù)為未知,所以需先來(lái)估計(jì)參數(shù).由最大似然估計(jì)法得=1.將試驗(yàn)結(jié)果的全體分為A0,A1,A7兩兩不相容的事件.假設(shè)H0為真,那么PX=i有估計(jì),i=0,1,2,.例如計(jì)算結(jié)果如表8-6所示.將其中有些n

37、pi5的組予以適當(dāng)合并,使新的每一組內(nèi)有npi5,如表8-6所示,此處并組后k=4,但因在計(jì)算概率時(shí),估計(jì)了一個(gè)未知參數(shù),故計(jì)算結(jié)果為=1.460表8-6.因?yàn)?5.9911.46,所以在顯著性程度為0.05下承受H0,即認(rèn)為總體服從泊松分布.表8-6AifiA036e-136.788-0.7880.017A140e-136.7883.2120.280A219e-1/218.3940.6060.020A3A4A5A6A720210e-1/6e-1/24e-1/120e-1/7206.1311.5330.3070.0510.008-3.031.1431.460例8.11 研究混凝土抗壓強(qiáng)度的分布

38、.200件混凝土制件的抗壓強(qiáng)度以分組形式列出表8-7.n=200.要求在給定的檢驗(yàn)程度=0.05下檢驗(yàn)假設(shè)H0:抗壓強(qiáng)度XN,2.表8-7壓強(qiáng)區(qū)間×98kPa頻數(shù)fi190200102002102621022056220230642302403024025014解 原假設(shè)所定的正態(tài)分布的參數(shù)是未知的,我們需先求與2的極大似然估計(jì)值.由第七章知,與2的極大似然估計(jì)值為,.設(shè)為第i組的組中值,我們有=221,=152,=12.33.原假設(shè)H0改寫成X是正態(tài)N221,12.332分布,計(jì)算每個(gè)區(qū)間的理論概率值, i=1,2,6,其中,.為了計(jì)算出統(tǒng)計(jì)量之值,我們把需要進(jìn)展的計(jì)算列表如下表8

39、-8.表8-8壓強(qiáng)區(qū)間X頻數(shù)fi標(biāo)準(zhǔn)化區(qū)間i,i+119020010-,-1.700.045910.1120021026-1.70,-0.890.14228.45.760.2021022056-0.89,-0.080.28156.20.040.0022023064-0.08,0.730.29959.817.640.29230240300.73,1.540.17134.217.640.52240250141.54,+0.06212.42.560.231.0002001.35從上面計(jì)算得出的觀察值為1.35.在檢驗(yàn)程度=0.05下,查自由度m=6-2-1=3的分布表,得到臨界值=7.815.由于=

40、1.357.815=,不能回絕原假設(shè),所以認(rèn)為混凝土制件的抗壓強(qiáng)度的分布是正態(tài)分布N221,152.小 結(jié)有關(guān)總體分布的未知參數(shù)或未知分布形式的種種論斷叫做統(tǒng)計(jì)假設(shè).一般統(tǒng)計(jì)假設(shè)分為原假設(shè)H0在實(shí)際問(wèn)題中至關(guān)重要的假設(shè)及與原假設(shè)H0對(duì)立假設(shè)即是備擇假設(shè)H1.假設(shè)檢驗(yàn)就是人們根據(jù)樣本提供的信息作出“承受H0、回絕H1或“回絕H0、承受H1的判斷.假設(shè)檢驗(yàn)的思想是小概率原理,即小概率事件在一次試驗(yàn)中幾乎不會(huì)發(fā)生.這種原理是人們處理實(shí)際問(wèn)題中公認(rèn)的原那么.由于樣本的隨機(jī)性,當(dāng)H0為真時(shí),我們可能會(huì)作出回絕H0、承受H1的錯(cuò)誤判斷棄真錯(cuò)誤或當(dāng)H0不真時(shí),我們可能會(huì)作出承受H0、回絕H1的錯(cuò)誤判斷取偽錯(cuò)

41、誤.假設(shè)檢驗(yàn)的兩類錯(cuò)誤真實(shí)情況未知所作決策承受H0回絕H0H0為真正確犯第一類錯(cuò)誤H0不真犯第二類錯(cuò)誤正確當(dāng)樣本容量n固定時(shí),我們無(wú)法同時(shí)控制犯二類錯(cuò)誤,即減小犯第一類錯(cuò)誤的概率,就會(huì)增大犯第二類錯(cuò)誤的概率,反之亦然.在假設(shè)檢驗(yàn)中我們主要控制減小犯第一類錯(cuò)誤的概率.使P回絕H0|H0為真,其中很小.0<<1,稱為檢驗(yàn)的顯著性程度,這種只對(duì)犯第一類錯(cuò)誤的概率加以控制而不考慮犯第二類錯(cuò)誤的概率的檢驗(yàn)稱為顯著性假設(shè)檢驗(yàn).單個(gè)、兩個(gè)正態(tài)總體的均值、方差的假設(shè)檢驗(yàn)是本章重點(diǎn)問(wèn)題,讀者需掌握Z(yǔ)檢驗(yàn)法、檢驗(yàn)法、t檢驗(yàn)法等.這些檢驗(yàn)法中原假設(shè)H0備擇假設(shè)H1及H0的回絕域分別見(jiàn)表8-2、表8-4. 重要術(shù)語(yǔ)及主題原假設(shè) 備擇假設(shè) 檢驗(yàn)統(tǒng)計(jì)量 單邊檢驗(yàn) 雙邊檢驗(yàn)顯著性程度 回絕域 顯著性檢驗(yàn) 一個(gè)正態(tài)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論