




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第4章假設(shè)檢驗(yàn)主要內(nèi)容4.1假設(shè)檢驗(yàn)的概念與步驟4.2正態(tài)均值的檢驗(yàn)4.3兩正態(tài)均值差的推斷4.4成對(duì)數(shù)據(jù)的比較4.5正態(tài)方差的推斷4.6比率的推斷*4.7廣義似然比檢驗(yàn)由樣本到總體的推理稱為統(tǒng)計(jì)推斷。英國(guó)統(tǒng)計(jì)學(xué)家R.A.費(fèi)希爾認(rèn)為常用的統(tǒng)計(jì)推斷有三種基本形式,它們是●抽樣分布;●參數(shù)估計(jì),又可分為點(diǎn)估計(jì)與區(qū)間估計(jì);●假設(shè)檢驗(yàn),又可分為參數(shù)檢驗(yàn)與非參數(shù)檢驗(yàn)。其中抽樣分布與參數(shù)估計(jì)在前幾章已有敘述,今后還會(huì)不斷補(bǔ)充。從這一章開(kāi)始將敘述假設(shè)檢驗(yàn),并討論假設(shè)檢驗(yàn)與區(qū)間估計(jì),確定樣本量之間的關(guān)系。假設(shè)檢驗(yàn)是統(tǒng)計(jì)學(xué)中最具特色的部分,其統(tǒng)計(jì)味甚濃。從建立假設(shè),尋找檢驗(yàn)統(tǒng)計(jì)量,構(gòu)造拒絕域(或計(jì)算p值),直到最后作出判斷等各個(gè)步驟上都能體現(xiàn)多種統(tǒng)計(jì)思想的亮點(diǎn)。假設(shè)檢驗(yàn)的思維方式也獨(dú)具一格,從其他數(shù)學(xué)分支學(xué)不到這種判斷問(wèn)題的思路。不犯錯(cuò)誤、不冒風(fēng)險(xiǎn)的判斷是不存在的,問(wèn)題在于設(shè)法控制犯錯(cuò)誤的概率。4.1假設(shè)檢驗(yàn)的概念與步驟例4.1.1某廠生產(chǎn)的化纖長(zhǎng)度X服從正態(tài)分布N(μ,0.042),其中正態(tài)均值μ的設(shè)計(jì)值為1.40。每天都要對(duì)“μ=1.40”作例行檢驗(yàn),以觀察生產(chǎn)是否正常進(jìn)行。若不正常,需對(duì)生產(chǎn)設(shè)備進(jìn)行調(diào)整和再檢驗(yàn),直到正常為止。某日從生產(chǎn)線上隨機(jī)抽取25根化纖,測(cè)得其長(zhǎng)度值為x1,x2,…,xn(n=25),算得其平均長(zhǎng)度=1.38,問(wèn)當(dāng)日生產(chǎn)是否正常?4.1.1假設(shè)檢驗(yàn)問(wèn)題幾點(diǎn)評(píng)論:●這不是一個(gè)參數(shù)估計(jì)問(wèn)題?!襁@里要對(duì)命題“μ=1.40”給出回答:“是”或“否”?!袢舭汛嗣}看做一個(gè)假設(shè),并記為“H0:μ=1.40”,對(duì)命題的判斷轉(zhuǎn)化為對(duì)假設(shè)H0的檢驗(yàn),此類問(wèn)題稱為(統(tǒng)計(jì))假設(shè)檢驗(yàn)問(wèn)題?!窦僭O(shè)檢驗(yàn)問(wèn)題在生產(chǎn)實(shí)際和科學(xué)研究中常會(huì)遇到,如新藥是否有效?新工藝是否可減少不合格品率?不同質(zhì)料鞋底的耐磨性是否有顯著差異?這類問(wèn)題都可歸結(jié)為某個(gè)假設(shè)的檢驗(yàn)問(wèn)題。4.1.1假設(shè)檢驗(yàn)問(wèn)題4.1.2假設(shè)檢驗(yàn)的步驟假設(shè)檢驗(yàn)的基本思想是:根據(jù)所獲樣本,運(yùn)用統(tǒng)計(jì)分析方法對(duì)總體X的某種假設(shè)H0作出判斷。1.建立假設(shè)一般假設(shè)檢驗(yàn)問(wèn)題需要建立兩個(gè)假設(shè):
(4.1.1)原假設(shè)H0是我們要檢驗(yàn)的假設(shè),在這里H0的含義是“與設(shè)計(jì)值一致”或“當(dāng)日生產(chǎn)正?!?。備擇假設(shè)H1是在原假設(shè)被拒絕時(shí)而應(yīng)接受的假設(shè)。
在參數(shù)假設(shè)檢驗(yàn)中,假設(shè)都是參數(shù)空間Θ內(nèi)的一個(gè)非空子集。在例4.1.1中平均長(zhǎng)度μ的參數(shù)空間為Θ={μ:-∞<μ<∞},其原假設(shè)H0:μ∈Θ0,其中Θ0={μ:μ=1.40}是單元素集,又稱為簡(jiǎn)單假設(shè)。備擇假設(shè)H1:μ∈Θ1,其中Θ1={μ:μ≠1.40}是多元素集,又稱為復(fù)雜假設(shè)。一般來(lái)說(shuō),參數(shù)空間Θ中任意兩個(gè)不相交的非空子集都可組成一個(gè)參數(shù)假設(shè)檢驗(yàn)問(wèn)題。對(duì)備擇假設(shè)還有一點(diǎn)要說(shuō)明:假如備擇假設(shè)H1位于原假設(shè)的右側(cè)或左側(cè),則稱該檢驗(yàn)問(wèn)題為單側(cè)檢驗(yàn)問(wèn)題。假如備擇假設(shè)H1位于原假設(shè)H0的兩側(cè)則稱其為雙側(cè)檢驗(yàn)問(wèn)題。4.1.2假設(shè)檢驗(yàn)的步驟2.選擇檢驗(yàn)統(tǒng)計(jì)量,確定拒絕域的形式在H0對(duì)H1的檢驗(yàn)問(wèn)題中涉及正態(tài)均值μ,樣本均值
是μ的最好估計(jì),且~N(μ,σ2/n)。由于
的方差σ2/n比
的方差σ2縮小n倍,使用
的分布更容易把
與μ0=1.40區(qū)分開(kāi)來(lái)(見(jiàn)圖4.1.1)。4.1.2假設(shè)檢驗(yàn)的步驟在σ已知為σ0和原假設(shè)H0:μ=μ0為真的情況下,經(jīng)標(biāo)準(zhǔn)化變換可得
(4.1.4)這里的u就是今后使用的檢驗(yàn)統(tǒng)計(jì)量,而且|u|的大小可以用來(lái)區(qū)分是否拒絕H0,即
|u|越大,應(yīng)傾向于拒絕H0
|u|越小,應(yīng)傾向于不拒絕H0為便于區(qū)分拒絕H0與不拒絕H0,需要在u軸上找一個(gè)臨界值c,使得當(dāng)|u|≥c時(shí),拒絕H0當(dāng)|u|<c時(shí),不拒絕H0并稱u軸上的區(qū)域{u:|u|≥c}={|u|≥c}為該雙側(cè)檢驗(yàn)問(wèn)題的拒絕域,記為W。4.1.2假設(shè)檢驗(yàn)的步驟接受域中有兩類樣本點(diǎn):●一類樣本點(diǎn)使原假設(shè)H0為真,是應(yīng)該接受的;●另一類樣本點(diǎn)所提供的信息不足以拒絕原假設(shè)H0,不宜列入W,只能保留在
內(nèi),待有新的樣本信息后再議。因此,的準(zhǔn)確稱呼應(yīng)是“不拒絕域”,可人們不習(xí)慣此種說(shuō)法。本書(shū)中約定:“不拒絕域”與“接受域”兩種說(shuō)法是等同的,指的就是,它含有“接受”與“保留”兩類樣本點(diǎn),要進(jìn)一步再區(qū)分“接受”與“保留”已無(wú)法由一個(gè)樣本來(lái)確定。
4.1.2假設(shè)檢驗(yàn)的步驟4.1.2假設(shè)檢驗(yàn)的步驟這一判斷過(guò)程很像法庭法官判案過(guò)程,法官辦案的邏輯是這樣的,他首先建立假設(shè)H0:“被告無(wú)罪”,誰(shuí)說(shuō)被告有罪誰(shuí)要拿出證據(jù)來(lái)。原告拿出一次貪污,或一次盜竊,或一次販毒的證據(jù)(相當(dāng)于一個(gè)樣本)后,若證據(jù)確鑿,經(jīng)雙方陳述和辯論,若法官認(rèn)定罪行成立,就拒絕假設(shè)H0,并立即判刑入獄。若法官認(rèn)為證據(jù)不足,則不會(huì)定罪。如此判案在法律界稱為“無(wú)罪推定論”。這樣一來(lái),監(jiān)獄里的人幾乎都是有罪的,但也要看到,監(jiān)獄外的人不全是好人。國(guó)內(nèi)外多年實(shí)踐表明,這樣判案是合理的,合乎邏輯的,對(duì)監(jiān)獄外的人再區(qū)分“好”與“不好”比區(qū)別“有罪”與“無(wú)罪”不知要難上幾百倍。這就是我們?cè)诩僭O(shè)檢驗(yàn)中把注意力放在確定“拒絕域”的理由。3.給出顯著性水平α,定出臨界值在假設(shè)檢驗(yàn)中可能犯的錯(cuò)誤有如下兩類(見(jiàn)圖4.1.2)。第Ⅰ類錯(cuò)誤(拒真錯(cuò)誤):原假設(shè)H0為真,但由于抽樣的隨機(jī)性,樣本落在拒絕域W內(nèi),從而導(dǎo)致拒絕H0,其發(fā)生概率記為α,又稱為顯著性水平。第Ⅱ類錯(cuò)誤(取偽錯(cuò)誤):原假設(shè)H0不真,但由于抽樣的隨機(jī)性,樣本落在
內(nèi),從而導(dǎo)致接受H0,其發(fā)生概率為β。4.1.2假設(shè)檢驗(yàn)的步驟例4.1.2計(jì)算例4.1.1的雙側(cè)檢驗(yàn)問(wèn)題中犯兩類錯(cuò)誤的概率α與β。一般理論研究表明:●在固定樣本量n下,要減小α必導(dǎo)致增大β;●在固定樣本量n下,要減小β必導(dǎo)致增大α;●要使α與β皆小,只有不斷增大樣本量n才能實(shí)現(xiàn),這在實(shí)際中常不可行。4.1.2假設(shè)檢驗(yàn)的步驟如何處理α與β之間不易調(diào)和的矛盾呢?很多統(tǒng)計(jì)學(xué)家根據(jù)實(shí)際使用情況提出如下建議:(1)在樣本量n已固定的場(chǎng)合,主要控制犯第Ⅰ類錯(cuò)誤的概率,并構(gòu)造出“水平為α的檢驗(yàn)”,它的具體定義如下:定義4.1.1在一個(gè)假設(shè)檢驗(yàn)問(wèn)題中,先選定一個(gè)數(shù)α(0<α<1),若一個(gè)檢驗(yàn)犯第Ⅰ類錯(cuò)誤的概率不超過(guò)α,即
P(犯第Ⅰ類錯(cuò)誤)≤α則稱該檢驗(yàn)是水平為α的檢驗(yàn),其中α稱為顯著性水平。(2)在有需要和可能的場(chǎng)合,適當(dāng)選擇樣本量n去控制犯第Ⅱ類錯(cuò)誤的概率。這一點(diǎn)將在后面討論。4.1.2假設(shè)檢驗(yàn)的步驟4.判斷上述檢驗(yàn)問(wèn)題的判斷法則如下:●當(dāng)根據(jù)樣本計(jì)算的檢驗(yàn)統(tǒng)計(jì)量的值落入拒絕域W內(nèi),則拒絕H0,即接受H1。●當(dāng)根據(jù)樣本計(jì)算的檢驗(yàn)統(tǒng)計(jì)量的值未落入拒絕域W內(nèi),則接受H0。4.1.2假設(shè)檢驗(yàn)的步驟4.1.2假設(shè)檢驗(yàn)的步驟綜上所述,進(jìn)行假設(shè)檢驗(yàn)都要經(jīng)過(guò)上述四步程序,即(1)建立假設(shè):原假設(shè)H0與備擇假設(shè)H1;(2)選擇檢驗(yàn)統(tǒng)計(jì)量,確定拒絕域W的形式;(3)給出顯著性水平α,定出臨界值;(4)判斷:是拒絕H0還是接受H0。定義4.1.2設(shè)檢驗(yàn)問(wèn)題
H0:θ∈Θ0,
H1:θ∈Θ1的拒絕域?yàn)閃,則樣本觀察值x=(x1,x2,…,xn)落在拒絕域W內(nèi)的概率稱為該檢驗(yàn)的勢(shì)函數(shù),記為
g(θ)=Pθ(x∈W),
θ∈Θ0∪Θ1?Θ(4.1.8)例4.1.3某廠制造的產(chǎn)品長(zhǎng)期以來(lái)不合格品率不超過(guò)0.01。某天開(kāi)工后,為檢驗(yàn)生產(chǎn)過(guò)程是否穩(wěn)定,隨機(jī)抽檢了100件產(chǎn)品,發(fā)現(xiàn)其中有2件不合格品。試在0.10水平上判斷該天生產(chǎn)是否穩(wěn)定。
4.1.3勢(shì)函數(shù)4.2正態(tài)均值的檢驗(yàn)設(shè)x1,x2,…,xn是來(lái)自正態(tài)總體N(μ,σ2)的一個(gè)樣本,關(guān)于正態(tài)均值μ的檢驗(yàn)問(wèn)題常有如下三種形式:
Ⅰ.H0:μ≤μ0
vs
H1:μ>μ0
(4.2.1)
Ⅱ.H0:μ≥μ0
vs
H1:μ<μ0
(4.2.2)
Ⅲ.H0:μ=μ0
vs
H1:μ≠μ0(4.2.3)其中μ0是一個(gè)已知常數(shù)。由于正態(tài)方差σ2已知與否對(duì)選擇μ的檢驗(yàn)有影響,故要分兩種情況討論,具體是●σ已知時(shí),用u檢驗(yàn);●σ未知時(shí),用t檢驗(yàn)。4.2.1正態(tài)均值μ的u檢驗(yàn)(σ已知)(1)先對(duì)檢驗(yàn)問(wèn)題Ⅰ的特殊情況,原假設(shè)縮為一點(diǎn)的檢驗(yàn)問(wèn)題Ⅰ':
Ⅰ'.H'0:μ=μ0
vs
H1:μ>μ0(4.2.4)建立水平為α的檢驗(yàn)。(2)為了獲得檢驗(yàn)問(wèn)題Ⅱ的水平為α的檢驗(yàn),我們仿照前面的辦法先壓縮其原假設(shè)為H'0:μ=μ0,獲得水平為α的檢驗(yàn)后再拓展原假設(shè)。(3)檢驗(yàn)問(wèn)題Ⅲ的水平為α的檢驗(yàn)已在例4.1.1和例4.1.2中作過(guò)詳細(xì)討論,它的拒絕域
構(gòu)成檢驗(yàn)問(wèn)題Ⅲ的水平為α的檢驗(yàn)。4.2.1正態(tài)均值μ的u檢驗(yàn)(σ已知)
(4)小結(jié)。我們研究了五對(duì)假設(shè)檢驗(yàn)問(wèn)題,利用勢(shì)函數(shù)的單調(diào)性,把檢驗(yàn)問(wèn)題Ⅰ與Ⅰ'歸為一類,把檢驗(yàn)問(wèn)題Ⅱ與Ⅱ'歸為一類。這樣就把這五對(duì)假設(shè)檢驗(yàn)問(wèn)題分為三類,分別建立水平為α的檢驗(yàn)及其拒絕域。注意拒絕域與備擇假設(shè)中的不等號(hào)的方向是相同的(見(jiàn)圖4.2.4).最后,這五對(duì)假設(shè)檢驗(yàn)所用的檢驗(yàn)統(tǒng)計(jì)量是相同的,都用u統(tǒng)計(jì)量,故所建立的水平為α的檢驗(yàn)都稱為u檢驗(yàn)。4.2.1正態(tài)均值μ的u檢驗(yàn)(σ已知)4.2.1正態(tài)均值μ的u檢驗(yàn)(σ已知)例4.2.1微波爐在爐門(mén)關(guān)閉時(shí)的輻射量是一個(gè)重要的質(zhì)量指標(biāo)。某廠該指標(biāo)服從正態(tài)分布N(μ,σ2),長(zhǎng)期以來(lái)σ=0.1,且均值都符合要求,不超過(guò)0.12。為檢查近期產(chǎn)品的質(zhì)量,抽查了25臺(tái),得其爐門(mén)關(guān)閉時(shí)輻射量的均值=0.1203。試問(wèn)在α=0.05水平上該廠微波爐爐門(mén)關(guān)閉時(shí)輻射量是否升高了?
4.2.2正態(tài)均值μ的t檢驗(yàn)(σ未知)這里將在σ未知時(shí)考察前面提出的三類檢驗(yàn)問(wèn)題:
Ⅰ.H0:μ≤μ0
vs
H1:μ>μ0
Ⅱ.H0:μ≥μ0
vs
H1:μ<μ0
Ⅲ.H0:μ=μ0
vs
H1:μ≠μ0如今不能再用u作檢驗(yàn)統(tǒng)計(jì)量了,因u中含有未知參數(shù)σ。一個(gè)自然想法是用樣本標(biāo)準(zhǔn)差s去代替u中的σ,從而形成t統(tǒng)計(jì)量,其分布是自由度為n-1的t分布,即
4.2.2正態(tài)均值μ的t檢驗(yàn)(σ未知)由于t統(tǒng)計(jì)量與u統(tǒng)計(jì)量很類似,故經(jīng)類似于4.2.1小節(jié)中的討論可知,上述三個(gè)檢驗(yàn)問(wèn)題的水平為α的檢驗(yàn)的拒絕域(見(jiàn)圖4.2.5)4.2.2正態(tài)均值μ的t檢驗(yàn)(σ未知)例4.2.2根據(jù)某地環(huán)境保護(hù)法規(guī)定,傾入河流的廢水中某種有毒化學(xué)物質(zhì)的平均含量不得超過(guò)3ppm(1ppm=10-6=百萬(wàn)分之一)。該地區(qū)環(huán)保組織對(duì)沿河各廠進(jìn)行檢查,測(cè)定每日傾入河流的廢水中該物質(zhì)的含量(單位:ppm)為:
3.1
3.2
3.3
2.9
3.5
3.4
2.5
4.3
3.0
3.4
2.9
3.6
3.2
3.0
2.7
3.5
2.9
3.3
3.3
3.1試在顯著性水平α=0.05上判斷該廠是否符合環(huán)保規(guī)定(假定廢水中有毒物質(zhì)含量X~N(μ,σ2))。4.2.2正態(tài)均值μ的t檢驗(yàn)(σ未知)4.2.3用p值作判斷在一個(gè)假設(shè)檢驗(yàn)問(wèn)題中選擇不同的顯著性水平有時(shí)會(huì)導(dǎo)致不同的結(jié)論,而顯著性水平的選擇又帶有人為因素,因此對(duì)判斷的結(jié)果不宜解釋得過(guò)死。為使這種解釋有一個(gè)寬松的余地,統(tǒng)計(jì)學(xué)家提出“p值”的概念,并用它來(lái)代替拒絕域作判斷。這一想法隨著計(jì)算機(jī)的普及日益受到人們的關(guān)注.下面用一個(gè)例子說(shuō)明這一過(guò)程。4.2.3用p值作判斷
例4.2.3一支香煙中的尼古丁含量X服從正態(tài)分布N(μ,1),合格標(biāo)準(zhǔn)規(guī)定μ不能超過(guò)1.5mg。為對(duì)一批香煙的尼古丁含量是否合格作判斷,可建立如下假設(shè):
H0:μ≤1.5
vs
H1:μ>1.5這是在方差已知情況下對(duì)正態(tài)分布的均值作單側(cè)檢驗(yàn),所用的檢驗(yàn)統(tǒng)計(jì)量為:
拒絕域是W={u≥u1-α}?,F(xiàn)隨機(jī)抽取一盒(20支)香煙,測(cè)得平均每支香煙的尼古丁含量為=1.97mg,則可求得檢驗(yàn)統(tǒng)計(jì)量的值為u0=2.10。4.2.3用p值作判斷表4.2.2對(duì)4個(gè)不同的顯著性水平α分別列出相應(yīng)的拒絕域和所下的結(jié)論。從表4.2.2中可看出,隨著α的減少,臨界值u1-α在增加,致使判斷結(jié)論由拒絕H0轉(zhuǎn)到接受H0??梢?jiàn),不同的α?xí)玫讲煌慕Y(jié)論。在這個(gè)過(guò)程中不變的是檢驗(yàn)統(tǒng)計(jì)量的觀察值u0=2.10,它與臨界值u1-α的位置誰(shuí)左誰(shuí)右(即誰(shuí)大誰(shuí)小)決定了對(duì)原假設(shè)H0是拒絕還是接受。u1-α與u0的比較等價(jià)于如下兩個(gè)尾部概率的比較:●α=P(u≥u1-α),即顯著性水平α是檢驗(yàn)統(tǒng)計(jì)量u的分布N(0,1)的尾部概率。在這個(gè)例子中尾部概率在右尾部。●p=P(u≥u0),這也是一個(gè)尾部概率,也可用N(0,1)算出。在u0=2.10時(shí),p=P(u≥2.10)=1-Φ(2.10)=0.01794.2.3用p值作判斷這兩個(gè)尾部概率在分布的同一端,是可比的。當(dāng)α>p=0.0179時(shí),u0=2.10在拒絕域內(nèi),從而拒絕H0。當(dāng)α<p=0.0179時(shí),u0=2.10在拒絕域外,從而保留H0。當(dāng)α=p=0.0179時(shí),u0=2.10在拒絕域邊界上,也拒絕H0,可見(jiàn)p是拒絕原假設(shè)H0的最小顯著性水平。這個(gè)p=0.0179就是將要介紹的該檢驗(yàn)的p值。這個(gè)例子中討論的尾部概率具有一般性,借此可給出一般場(chǎng)合下p值的定義,以及另一個(gè)判斷法則。4.2.3用p值作判斷定義4.2.1在一個(gè)假設(shè)檢驗(yàn)問(wèn)題中,拒絕原假設(shè)H0的最小顯著性水平稱為p值。利用p值和給定的顯著性水平α可以建立如下判斷法則:●若α≥p值,則拒絕原假設(shè)H0;●若α<p值,則接受原假設(shè)H0。例4.2.4任一檢驗(yàn)問(wèn)題的p值可用相應(yīng)檢驗(yàn)統(tǒng)計(jì)量的分布(如標(biāo)準(zhǔn)正態(tài)分布、t分布等)算得。4.2.3用p值作判斷4.2.3用p值作判斷關(guān)于這個(gè)新的判斷法則(指用p值作判斷)有以下幾點(diǎn)評(píng)論:●新判斷法則與原判斷法則(見(jiàn)4.1.2小節(jié))是等價(jià)的。●新判斷法則跳過(guò)拒絕域(回避了構(gòu)造拒絕域的過(guò)程),簡(jiǎn)化了判斷過(guò)程,但要計(jì)算檢驗(yàn)的p值?!袢我粰z驗(yàn)問(wèn)題的p值都可用相應(yīng)檢驗(yàn)統(tǒng)計(jì)量的分布(如標(biāo)準(zhǔn)正態(tài)分布、t分布、χ2分布等)算得。例4.2.5某廠制造的產(chǎn)品長(zhǎng)期以來(lái)不合格品率不超過(guò)0.01,某天開(kāi)工后隨機(jī)抽檢了100件產(chǎn)品,發(fā)現(xiàn)其中有2件不合格品,試在0.10水平上判斷該天生產(chǎn)是否正常?4.2.4假設(shè)檢驗(yàn)與置信區(qū)間的對(duì)偶關(guān)系參數(shù)的雙側(cè)檢驗(yàn)與置信區(qū)間就會(huì)發(fā)現(xiàn)它們之間有密切聯(lián)系。譬如所用的檢驗(yàn)統(tǒng)計(jì)量與樞軸量,實(shí)際上是同一個(gè)量;檢驗(yàn)的顯著性水平α與置信區(qū)間的置信水平1-α是相互對(duì)立的兩事件的概率,若水平為α的檢驗(yàn)的拒絕域?yàn)閃,則其對(duì)立事件(接受域)就是相應(yīng)參數(shù)的1-α置信區(qū)間。反之,用置信區(qū)間也可作假設(shè)檢驗(yàn),若原假設(shè)H0:θ=θ0在某1-α置信區(qū)間內(nèi),則應(yīng)接受H0;否則拒絕H0。從而也可建立雙側(cè)檢驗(yàn)的拒絕域。這種對(duì)應(yīng)關(guān)系稱為對(duì)偶關(guān)系,這種對(duì)偶關(guān)系在單側(cè)檢驗(yàn)和置信限也存在。
4.2.4假設(shè)檢驗(yàn)與置信區(qū)間的對(duì)偶關(guān)系以正態(tài)均值μ為例具體說(shuō)明這種對(duì)偶關(guān)系(1)正態(tài)總體N(μ,σ2)的均值μ的如下雙側(cè)檢驗(yàn)
Ⅲ.H0:μ=μ0
vs
H1
μ≠μ0(4.2.7)(2)正態(tài)總體N(μ,σ2)的均值μ的如下單側(cè)檢驗(yàn)問(wèn)題
Ⅱ.H0:μ≥μ0
vs
H1:μ<μ0(3)正態(tài)總體N(μ,σ2)的均值μ的如下單側(cè)檢驗(yàn)問(wèn)題
Ⅰ.H0:μ≤μ0
vs
H1:μ>μ0(4)假設(shè)檢驗(yàn)與置信區(qū)間之間的聯(lián)系不是單向的,而是雙向的。4.2.4假設(shè)檢驗(yàn)與置信區(qū)間的對(duì)偶關(guān)系4.2.4假設(shè)檢驗(yàn)與置信區(qū)間的對(duì)偶關(guān)系(5)在σ未知場(chǎng)合,只需用s替換σ,用t分布分位數(shù)替換標(biāo)準(zhǔn)正態(tài)分布分位數(shù),上述討論仍然有效,對(duì)偶關(guān)系仍然成立。(6)若把參數(shù)μ換為σ2,則只要能找到正態(tài)方差σ2的檢驗(yàn)問(wèn)題的檢驗(yàn)統(tǒng)計(jì)量,就可用其接受域獲得σ2的置信區(qū)間或單側(cè)置信限。(7)參數(shù)的假設(shè)檢驗(yàn)與參數(shù)的置信區(qū)間(或置信限)之間的對(duì)偶關(guān)系是由其理論結(jié)構(gòu)決定的。假設(shè)檢驗(yàn)中使用的檢驗(yàn)統(tǒng)計(jì)量與置信區(qū)間中所使用的樞軸量是相同的,但其注意力不同。假設(shè)檢驗(yàn)的注意力放在拒絕域上,而置信區(qū)間的注意力放在接受域上。(8)注意:用p值作檢驗(yàn)時(shí),不可能建立上述對(duì)偶關(guān)系。4.2.4假設(shè)檢驗(yàn)與置信區(qū)間的對(duì)偶關(guān)系例4.2.6白熾燈泡的壽命(單位:小時(shí))服從正態(tài)分布。按標(biāo)準(zhǔn)工藝生產(chǎn)此種燈泡,其平均壽命為θ0=1400。某廠為提高白熾燈泡的平均壽命,改進(jìn)了當(dāng)前的生產(chǎn)工藝,并試制了一批新的燈泡。為了考察新工藝能否提高平均壽命,需要進(jìn)行假設(shè)檢驗(yàn)。為此設(shè)置如下一對(duì)假設(shè):
H0:θ=θ0=1400
vs
H1:θ>θ0我們?nèi)绱嗽O(shè)置原假設(shè)H0是希望能獲得拒絕H0的結(jié)論。下面我們用置信下限來(lái)作檢驗(yàn)。4.2.5大樣本下的u檢驗(yàn)在4.2.1小節(jié)中討論的“在σ已知下正態(tài)均值μ的u檢驗(yàn)”還可在大樣本場(chǎng)合(如n>30)擴(kuò)大其使用范圍。為此要解除它的一些約束?!袷紫冉獬罢龖B(tài)性”約束。●其次還可解除對(duì)“已知σ”限制。例4.2.7某市2009年每戶每月平均花費(fèi)在食品上的費(fèi)用不超過(guò)600元,該市為了解2010年此種費(fèi)用是否有變化,特委托該市某市場(chǎng)調(diào)查公司作抽樣調(diào)查。該公司對(duì)該市100戶作了調(diào)查,算得此項(xiàng)花費(fèi)平均為642元,標(biāo)準(zhǔn)差為141元。試問(wèn)該市2010年此項(xiàng)平均花費(fèi)與2009年是否有顯著差異。4.2.6控制犯兩類錯(cuò)誤概率確定樣本量在4.1節(jié)中曾指出,犯兩類錯(cuò)誤的概率α與β都依賴于樣本量n。本小節(jié)將在正態(tài)總體標(biāo)準(zhǔn)差σ已知場(chǎng)合對(duì)正態(tài)均值μ的單側(cè)和雙側(cè)檢驗(yàn)分別討論這個(gè)問(wèn)題。(1)對(duì)單側(cè)檢驗(yàn)問(wèn)題
H0:μ≤μ0
vs
H1:μ>μ0
H0:μμ0
vs
H1:μ<μ0
經(jīng)計(jì)算可得,4.2.6控制犯兩類錯(cuò)誤概率確定樣本量(2)對(duì)雙側(cè)檢驗(yàn)問(wèn)題
H0:μ=μ0
vs
H1:μ≠μ0經(jīng)計(jì)算,可得:例4.2.8某廠生產(chǎn)的化纖長(zhǎng)度X服從正態(tài)分布N(μ,0.042),其中μ的設(shè)計(jì)值為1.40,每天都要對(duì)“μ=1.40”作例行檢驗(yàn),一旦均值變成1.38,產(chǎn)品就發(fā)生了質(zhì)量問(wèn)題。那么我們應(yīng)該抽多少樣品進(jìn)行檢驗(yàn),才能保證在μ=1.40時(shí)犯第Ⅰ類錯(cuò)誤的概率不超過(guò)0.05,在μ=1.42時(shí)犯第Ⅱ類錯(cuò)誤的概率不超過(guò)0.10?*4.2.7兩個(gè)注釋在實(shí)際中用假設(shè)檢驗(yàn)有兩點(diǎn)要注意。1.注意區(qū)別統(tǒng)計(jì)顯著性與實(shí)際顯著性例4.2.9一汽車制造商聲稱,某型號(hào)轎車在高速公路上每加侖汽油燃料平均可行駛35英里。一消費(fèi)者組織試驗(yàn)了39輛此種型號(hào)的轎車,發(fā)現(xiàn)燃料消耗的平均值為34.5英里/加侖。在正態(tài)分布N(μ,1.52)假設(shè)下對(duì)如下單側(cè)檢驗(yàn)問(wèn)題
H0:μ=35,
H1:μ<35進(jìn)行u檢驗(yàn),若取α=0.05,uα=-1.96,故拒絕域W={u<-1.96}。另一方面,可算得u統(tǒng)計(jì)量的觀察值
u0=
-2.08由于-2.08<-1.96,故應(yīng)拒絕原假設(shè)H0,可認(rèn)為34.5與35在統(tǒng)計(jì)上有顯著差異,但實(shí)際工作者都認(rèn)為這二者之間沒(méi)有實(shí)際顯著性。*4.2.7兩個(gè)注釋一個(gè)被拒絕的原假設(shè)意味著有統(tǒng)計(jì)顯著性,但未必意味著都有實(shí)際顯著性。特別在大樣本場(chǎng)合或精確測(cè)量場(chǎng)合常有這種情況發(fā)生,即使與原假設(shè)之間的微小差別都將被認(rèn)為有統(tǒng)計(jì)顯著性,但未必有實(shí)際顯著性。*4.2.7兩個(gè)注釋2.顯著性水平α的選擇選擇α要注意如下兩個(gè)方面:●α應(yīng)是較小的數(shù),但不易過(guò)小。這是為了控制犯第Ⅰ類錯(cuò)誤(棄真錯(cuò)誤)的概率和制約犯第Ⅱ類錯(cuò)誤(取偽錯(cuò)誤)的概率。●另一方面也要注意,α的選擇與判斷發(fā)生錯(cuò)誤時(shí)要付出的代價(jià)大小有關(guān)。4.3兩正態(tài)均值差的推斷設(shè)x1,x2,…,xn是來(lái)自正態(tài)總體的一個(gè)樣本,y1,y2,…,ym是來(lái)自另一正態(tài)總體的一個(gè)樣本,且兩個(gè)樣本獨(dú)立(見(jiàn)圖4.3.1)。兩個(gè)正態(tài)均值μ1和μ2的比較常有如下三個(gè)檢驗(yàn)問(wèn)題:
Ⅰ.H0:μ1≤μ2
vs
H1:μ1>μ2
Ⅱ.H0:μ1≥μ2
vs
H1:μ1<μ2
Ⅲ.H0:μ1=μ2
vs
H1:μ1≠μ2這三個(gè)檢驗(yàn)問(wèn)題分別等價(jià)于如下三個(gè)檢驗(yàn)問(wèn)題:
Ⅰ.H0:μ1-μ2≤0
vs
H1:μ1-μ2>0
Ⅱ.H0:μ1-μ2≥0
vs
H1:μ1-μ2<0
Ⅲ.H0:μ1-μ2=0
vs
H1:μ1-μ2≠0由于兩個(gè)正態(tài)均值μ1與μ2常用各自的樣本均值
與
估計(jì),其差的分布容易獲得:但該分布含有兩個(gè)多余參數(shù)
與,給尋找水平為α的檢驗(yàn)帶來(lái)困難。目前在幾種特殊場(chǎng)合尋找到水平為α的檢驗(yàn),在一般場(chǎng)合,至今只尋找到水平近似為α的檢驗(yàn),水平精確為α的檢驗(yàn)至今尚未找到,這在統(tǒng)計(jì)發(fā)展史上就是有名的Behrens-Fisher問(wèn)題。對(duì)兩正態(tài)均值的推斷將分為兩種情況進(jìn)行討論:(1)方差
與
已知;(2)方差
與
未知。本節(jié)討論(1)。4.3.1兩正態(tài)均值差的u檢驗(yàn)(方差已知)
先考察如下檢驗(yàn)問(wèn)題:
H'0:μ1=μ2,
H1:μ1>μ2(4.3.2)在
與
已知場(chǎng)合,在H’0為真情況下,上述兩樣本均值差的分布為:
或因此可選用u作為檢驗(yàn)統(tǒng)計(jì)量。在該檢驗(yàn)中,拒絕域?yàn)閃={u≥u1-α}經(jīng)討論可得,問(wèn)題Ⅰ、Ⅱ、Ⅲ的拒絕域分別為:WⅠ={u≥u1-α}、WⅡ={u≤uα}、WⅢ={|u|≥u1-α/2}4.3.1兩正態(tài)均值差的u檢驗(yàn)(方差已知)例4.3.1某開(kāi)發(fā)商對(duì)減少底漆的烘干時(shí)間非常感興趣。將選擇兩種配方的底漆:配方1是原標(biāo)準(zhǔn)配方;配方2是在原配方中增加干燥材料,以減少烘干時(shí)間。開(kāi)發(fā)商選20個(gè)相同樣品,其中10個(gè)涂上配方1的漆,另10個(gè)涂上配方2的漆。這20個(gè)樣品涂漆順序是隨機(jī)的,經(jīng)試驗(yàn),兩個(gè)樣本的平均烘干時(shí)間分別為=121分鐘和=112分鐘。根據(jù)經(jīng)驗(yàn),烘干時(shí)間的標(biāo)準(zhǔn)差都是8分鐘,不會(huì)受到新材料的影響?,F(xiàn)要在α=0.05下對(duì)新配方能否減少烘干時(shí)間作出檢驗(yàn)。4.3.1兩正態(tài)均值差的u檢驗(yàn)(方差已知)在兩正態(tài)總體方差
與
已知場(chǎng)合,其均值差μ1-μ2的1-α置信區(qū)間和置信限都可從相應(yīng)的水平α的檢驗(yàn)(雙側(cè)或單側(cè))的接受域
,,獲得,也可以從如下的樞軸量獲得:兩條途徑得到相同結(jié)果?!瘭?-μ2的1-α置信區(qū)間為;●μ1-μ2的1-α置信下限為
;●μ1-μ2的1-α置信上限為4.3.1兩正態(tài)均值差的u檢驗(yàn)(方差已知)上述置信區(qū)間或置信限還有兩個(gè)用途:(1)用置信區(qū)間作兩正態(tài)均值差檢驗(yàn)很方便,只要查看區(qū)間[(μ1-μ2)L,(μ1-μ2)U],或[(μ1-μ2)L,∞),或(-∞,(μ1-μ2)U]中是否含有零點(diǎn)。若含有零點(diǎn),則接受原假設(shè)H0,否則拒絕H0。(2)控制置信區(qū)間長(zhǎng)度還可確定樣本量。例4.3.2某種飛機(jī)上用的鋁制加強(qiáng)桿有兩種類型,它們的抗拉強(qiáng)度(kg/mm2)都服從正態(tài)分布。由生產(chǎn)過(guò)程知其標(biāo)準(zhǔn)差分別為σ1=1.2與σ2=1.5?,F(xiàn)要求兩類加強(qiáng)桿的平均抗拉強(qiáng)度之差μ1-μ2的0.90置信區(qū)間,使置信區(qū)間長(zhǎng)度不超過(guò)2.5kg/mm2需要多少樣本量。*4.3.2控制犯兩類錯(cuò)誤概率確定樣本量在雙側(cè)檢驗(yàn)問(wèn)題Ⅲ中,可用α課確確定犯第Ⅱ類錯(cuò)誤的概率β,此時(shí),可確定需要的樣本量為:在單側(cè)檢驗(yàn)問(wèn)題Ⅰ或Ⅱ中,在給定犯第Ⅱ類錯(cuò)誤概率為β之下,所需的樣本量(n=m)為:
*4.3.2控制犯兩類錯(cuò)誤概率確定樣本量例4.3.3為說(shuō)明所需樣本量的計(jì)算,我們繼續(xù)考察例4.3.1。若兩真實(shí)平均烘干時(shí)間差δ=μ1-μ2=10分鐘,希望以概率0.9能檢測(cè)出這差異,這時(shí)犯第Ⅱ類錯(cuò)誤概率β=1-0.9=0.1。在單側(cè)檢驗(yàn)問(wèn)題Ⅰ下,若取α=0.05,則所需樣本量n≈11。在上述諸條件下,要區(qū)分μ1和μ2間相距10分鐘需要樣本量n=m=11,兩個(gè)樣本共需22個(gè)樣品。若要區(qū)分μ1-μ2=9分鐘,需要樣本量為:n≈14。每個(gè)樣本量增加了3個(gè)??倶颖玖繛?8,需增加6個(gè),這是要檢驗(yàn)的兩正態(tài)均值間距離縮小了的緣故。4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)在兩個(gè)方差
與
都未知場(chǎng)合,兩正態(tài)均值差μ1-μ2的假設(shè)檢驗(yàn)的研究要分幾種情況討論。●兩正態(tài)方差未知但相等,即==σ2?!駜烧龖B(tài)方差未知且不等,即
≠
?!翊髽颖緢?chǎng)合,即n與m都較大。下面將逐個(gè)討論,同時(shí)利用對(duì)偶關(guān)系指出μ1-μ2的置信區(qū)間與置信限。
4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)1.==σ2若記兩相互獨(dú)立樣本的樣本均值分別為
與,則其差
其中共同方差σ2可用兩個(gè)樣本的合樣本作出估計(jì),經(jīng)計(jì)算,可得σ2的一個(gè)無(wú)偏估計(jì):因此,可構(gòu)造檢驗(yàn)統(tǒng)計(jì)量4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)對(duì)上述三個(gè)檢驗(yàn)問(wèn)題構(gòu)造水平為α的檢驗(yàn),其拒絕域分別為:
WⅠ={t≥t1-α(n+m-2)}
WⅡ={t≤tα(n+m-2)}(4.3.11)
WⅢ={|t|≥t1-α/2(n+m-2)}這些檢驗(yàn)都稱為雙樣本t檢驗(yàn)。使用這些t檢驗(yàn)要有兩個(gè)前提:一是兩個(gè)總體都要是正態(tài)或近似正態(tài);二是方差相等。有一項(xiàng)研究成果值得參考,當(dāng)來(lái)自兩正態(tài)總體的兩樣本量相等(n=m)時(shí),上述t檢驗(yàn)對(duì)方差相等的假設(shè)是很穩(wěn)健的,或者說(shuō)不很敏感,即兩個(gè)方差略有相差,t檢驗(yàn)結(jié)果仍然是可信的。故在比較兩正態(tài)均值時(shí)盡量選擇樣本量相等去做。4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)利用對(duì)偶關(guān)系,可立即由接受域,,寫(xiě)出μ1-μ2的1-α置信區(qū)間。其中sw如式(4.3.8)所示。容易看出,μ1-μ2的1-α單側(cè)置信上限為:μ1-μ2的1-α單側(cè)置信下限為:4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)例4.3.4某公司的生產(chǎn)中正在使用催化劑A,另一種更便宜的催化劑B問(wèn)世。公司認(rèn)為:使用催化劑B如果不能使收益明顯提高就繼續(xù)使用催化劑A。公司收益大小可用回收率表示。試驗(yàn)車間為此各選8個(gè)樣品分別進(jìn)行試驗(yàn),其回收率如表4.3.1所示。現(xiàn)要對(duì)兩種催化劑平均回收率μA與μB是否相等作出檢驗(yàn)。
4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)
4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)2.≠
當(dāng)我們不能合理地假設(shè)未知方差
與
相等時(shí),要檢驗(yàn)兩均值相等至今尚無(wú)精確方法,下面敘述的是一較好的近似檢驗(yàn)。若,兩者獨(dú)立,則故在μ1=μ2時(shí):4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)當(dāng)
與
分別用其無(wú)偏估計(jì),代替后,記
(4.3.12)這時(shí)t*就不再服從N(0,1)分布了,也無(wú)理由說(shuō)它服從t分布,但其形式很像t統(tǒng)計(jì)量。因此人們稱其為t化統(tǒng)計(jì)量,并設(shè)法用t統(tǒng)計(jì)量去擬合,結(jié)果發(fā)現(xiàn),取
(4.3.13)4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)若l為非整數(shù)時(shí)取最接近的整數(shù),則t*近似服從自由度是l的t分布,即t*~t(l)。于是可用t*作為檢驗(yàn)統(tǒng)計(jì)量,對(duì)上述三類檢驗(yàn)問(wèn)題分別得到如下拒絕域:
(4.3.14)
利用對(duì)偶關(guān)系,可從式(4.3.14)的對(duì)立事件寫(xiě)出對(duì)應(yīng)的置信區(qū)間與置信限。具體是:μ1-μ2的近似1-α置信區(qū)間為:4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)其中l(wèi)如式(4.3.13)所示。類似地,也可寫(xiě)出μ1-μ2的近似1-α單側(cè)置信上限為:而μ1-μ2的近似1-α置信下限為:4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)3.大樣本場(chǎng)合當(dāng)n與m都較大時(shí),式(4.3.13)中的l也隨之增大,譬如在n=m=31時(shí),可算得l≥30。大家知道,當(dāng)l≥30時(shí)自由度為l的t分布就很近似標(biāo)準(zhǔn)正態(tài)分布N(0,1),故在n與m都較大時(shí),可將式(4.3.12)中的t*改記為u,且u近似服從N(0,1)。從而可用雙樣本的u檢驗(yàn)得到上述三類檢驗(yàn)問(wèn)題的拒絕域:
(4.3.15)4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)利用對(duì)偶關(guān)系,可從上述拒絕域,獲得接受域,最后改寫(xiě)為置信區(qū)間與置信限。此時(shí)μ1-μ2的近似1-α置信區(qū)間為:類似可得μ1-μ2的近似1-α單側(cè)置信上限為:μ1-μ2的近似1-α單側(cè)置信下限為:4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)4.3.3兩正態(tài)均值差的t檢驗(yàn)(方差未知)例4.3.5設(shè)甲、乙兩種礦石中含鐵量分別服從N(μ1,)與N(μ2,)?,F(xiàn)分別從兩種礦石中各取若干樣品測(cè)其含鐵量,其樣本量、樣本均值和樣本無(wú)偏方差分別為:甲礦石:n=10,
=16.01,
=10.80乙礦石:m=5,
=18.98,
=0.27試在α=0.01水平下檢驗(yàn)“甲礦石含鐵量不低于乙礦石的含鐵量”這種傳統(tǒng)看法是否成立。4.4成對(duì)數(shù)據(jù)的比較4.4.1成對(duì)數(shù)據(jù)的t檢驗(yàn)在對(duì)兩正態(tài)均值μ1與μ2進(jìn)行比較時(shí)有一種特殊情況值得注意。當(dāng)對(duì)兩個(gè)感興趣總體的觀察值是成對(duì)收集的時(shí)候,每一對(duì)觀察值(xi,yi)是在近似相同條件下而用不同方式獲得的,為了比較兩種方式對(duì)觀察值的影響差異是否顯著而進(jìn)行多次重復(fù)試驗(yàn)。例4.4.1為比較兩種谷物種子A與B的平均產(chǎn)量的高低,特選取10塊土地,每塊按面積均分為兩小塊,分別種植A與B兩種種子。生長(zhǎng)期間的施肥等田間管理在20小塊土地上都一樣,表4.4.1列出各小塊土地上的單位產(chǎn)量。試問(wèn):兩種種子A與B的單位產(chǎn)量在顯著性水平α=0.05下有無(wú)顯著差別?4.4.1成對(duì)數(shù)據(jù)的t檢驗(yàn)4.4.1成對(duì)數(shù)據(jù)的t檢驗(yàn)在成對(duì)數(shù)據(jù)場(chǎng)合還有兩對(duì)單側(cè)檢驗(yàn)問(wèn)題:Ⅰ.H0:μd≤0,H1:μd>0Ⅱ.H0:μd≥0,H1:μd<0它們?nèi)钥墒褂萌缦聇統(tǒng)計(jì)量:其拒絕域分別為:
WⅠ={t≥t1-α(n-1)},
WⅡ={t≤tα(n-1)}利用對(duì)偶關(guān)系,可從上述諸拒絕域?qū)懗鰞烧龖B(tài)均值差的1-α置信區(qū)間4.4.1成對(duì)數(shù)據(jù)的t檢驗(yàn)
例4.4.2某工廠的兩個(gè)實(shí)驗(yàn)室每天同時(shí)從工廠的冷卻水中取樣,分別測(cè)定水中的含氯量各一次,表4.4.2給出了11天的記錄。試求兩實(shí)驗(yàn)室測(cè)定的含氯量的均值差μd的0.95置信區(qū)間。4.4.2成對(duì)與不成對(duì)數(shù)據(jù)的處理在需要對(duì)兩正態(tài)均值進(jìn)行比較時(shí),數(shù)據(jù)收集有兩種方式:●不成對(duì)收集。兩總體常處于獨(dú)立狀態(tài),并不成對(duì),常用雙樣本t檢驗(yàn)?!癯蓪?duì)收集。兩總體常呈較強(qiáng)的正相關(guān)狀態(tài),常用單樣本t檢驗(yàn)。在實(shí)際中我們?cè)趦煞N數(shù)據(jù)收集方法的選擇上,要根據(jù)實(shí)際情況決定。譬如:●在個(gè)體差異較大時(shí)常用成對(duì)數(shù)據(jù)收集法,即在一個(gè)個(gè)體上先后作兩種不同處理,收集成對(duì)數(shù)據(jù)?!裨趥€(gè)體差異較小,且施行兩種處理結(jié)果相關(guān)性也小時(shí),可用獨(dú)立樣本采集方法(不成對(duì)數(shù)據(jù)收集方法)。這樣的方法可提高數(shù)據(jù)使用效率。4.4.2成對(duì)與不成對(duì)數(shù)據(jù)的處理
例4.4.3為了比較用于做皮鞋后跟兩種材料(A與B)的耐磨性能,選取15名成年在職男子,每人穿一雙新鞋,其中一只用材料A做后跟,另一只用材料B做后跟,每只后跟厚度都是10mm。一個(gè)月后再測(cè)厚度,所測(cè)數(shù)據(jù)列于表4.4.3中?,F(xiàn)要求對(duì)兩種材料是否同樣耐磨作出判斷。4.5正態(tài)方差的推斷4.5.1正態(tài)方差σ2的χ2檢驗(yàn)設(shè)x1,x2,…,xn是來(lái)自正態(tài)總體N(μ,σ2)的一個(gè)樣本,關(guān)于正態(tài)方差σ2的檢驗(yàn)問(wèn)題常有如下三種形式:
Ⅰ.H0:σ2≤
vs
H1:σ2>
Ⅱ.H0:σ2≥
vs
H1:σ2<
Ⅲ.H0:σ2=
vs
H1:σ2≠
其中
是一個(gè)已知常數(shù)。對(duì)于以上三種情況,可選擇檢驗(yàn)統(tǒng)計(jì)量4.5.1正態(tài)方差σ2的χ2檢驗(yàn)上述三種情況的檢驗(yàn)拒絕域如下圖所示:4.5.1正態(tài)方差σ2的χ2檢驗(yàn)上述三個(gè)檢驗(yàn)問(wèn)題的水平為的檢驗(yàn)統(tǒng)稱檢驗(yàn)。綜合于表4.5.1中,如下表所示:4.5.1正態(tài)方差σ2的χ2檢驗(yàn)關(guān)于χ2檢驗(yàn)還應(yīng)指出下面幾個(gè)注釋。(1)上述所列的五個(gè)檢驗(yàn)不僅用于正態(tài)方差檢驗(yàn),還可用于正態(tài)標(biāo)準(zhǔn)差檢驗(yàn),因?yàn)榧僭O(shè)H‘0:σ≤σ0與假設(shè)H0:σ2≤
是等價(jià)的,故其檢驗(yàn)法則也是相同的。(2)上述諸檢驗(yàn)的p值亦可由卡方分布算得。(3)利用對(duì)偶關(guān)系,由各種檢驗(yàn)問(wèn)題的接受域改寫(xiě)成正態(tài)方差σ2和正態(tài)標(biāo)準(zhǔn)差的置信限與置信區(qū)間。詳見(jiàn)表4.5.2。4.5.1正態(tài)方差σ2的χ2檢驗(yàn)4.5.1正態(tài)方差σ2的χ2檢驗(yàn)
例4.5.1某種導(dǎo)線的電阻服從N(μ,σ2),μ未知,其中一個(gè)質(zhì)量指標(biāo)是電阻標(biāo)準(zhǔn)差不得大于0.005Ω?,F(xiàn)從中抽取了9根導(dǎo)線測(cè)其電阻,測(cè)得樣本標(biāo)準(zhǔn)差s=0.0066,試問(wèn)在α=0.05水平上能否認(rèn)為這批導(dǎo)線的電阻波動(dòng)合格?例4.5.2某光譜儀可測(cè)材料中各金屬含量(百分含量),為估計(jì)該臺(tái)光譜儀的測(cè)量誤差,特選出大小相同、金屬含量不同的5個(gè)試塊,設(shè)每一試塊的測(cè)量值都服從方差相同的正態(tài)分布,其均值可不同。如今對(duì)每一試塊各重復(fù)獨(dú)立地測(cè)量5次,分別計(jì)算各試塊的樣本標(biāo)準(zhǔn)差,它們是
s1=0.09,
s2=0.11,
s3=0.14,
s4=0.10,
s5=0.11試求光譜儀測(cè)量值標(biāo)準(zhǔn)差σ的0.95置信區(qū)間。4.5.1正態(tài)方差σ2的χ2檢驗(yàn)*例4.5.3某種鋼板每塊重量X(單位:kg)服從正態(tài)分布,它有一項(xiàng)質(zhì)量指標(biāo)是鋼板重量的方差Var(X)不得超過(guò)0.018?,F(xiàn)從某天生產(chǎn)的鋼板中隨機(jī)抽取25塊,測(cè)其重量,算得樣本方差s2=0.025。(1)該鋼板重量的方差是否滿足要求。(2)求該種鋼板重量標(biāo)準(zhǔn)差σ的0.95置信區(qū)間。討論:這個(gè)置信區(qū)間長(zhǎng)度為0.0965,廠方認(rèn)為較大,若想把此置信區(qū)間長(zhǎng)度縮小到0.05,其他不變,應(yīng)取多少樣本量為宜?4.5.2兩正態(tài)方差比的F檢驗(yàn)設(shè)x1,x2,…,xn是來(lái)自正態(tài)總體N(μ1,)的一個(gè)樣本,y1,y2,…,ym是來(lái)自另一個(gè)正態(tài)總體N(μ2,)的一個(gè)樣本,且兩個(gè)樣本相互獨(dú)立。關(guān)于兩個(gè)正態(tài)方差比較常有如下三類檢驗(yàn)問(wèn)題:Ⅰ.H0:≤
vs
H1:>
Ⅱ.H0:≥
vs
H1:<
Ⅲ.H0:=
vs
H1:≠
此時(shí),可選擇作為檢驗(yàn)統(tǒng)計(jì)量。4.5.2兩正態(tài)方差比的F檢驗(yàn)4.5.2兩正態(tài)方差比的F檢驗(yàn)幾個(gè)注釋:(1)上述五個(gè)檢驗(yàn)的拒絕域也適用相應(yīng)兩個(gè)正態(tài)標(biāo)準(zhǔn)差比的檢驗(yàn)。(2)上述諸檢驗(yàn)的p值亦可用F(n-1,m-1)分布算得。(3)利用對(duì)偶關(guān)系,可由各檢驗(yàn)的接受域改寫(xiě)為兩正態(tài)方差比的置信區(qū)間與置信限,對(duì)其開(kāi)方即得兩正態(tài)標(biāo)準(zhǔn)差之比的置信區(qū)間和置信限。4.5.2兩正態(tài)方差比的F檢驗(yàn)例4.5.4甲、乙兩臺(tái)機(jī)床分別加工某種機(jī)械軸,軸的直徑分別服從正態(tài)分布N(μ1,)與N(μ2,)。為比較兩臺(tái)機(jī)床的加工精度與平均直徑有無(wú)顯著差異,從各自加工的軸中分別抽取若干根軸測(cè)其直徑(單位:mm),結(jié)果如表4.5.4所示(取α=0.05)。4.6比率的推斷比率是指特定的一組個(gè)體(人或物等)在總體中所占的比例,如不合格品率、命中率、電視節(jié)目收視率、男嬰出生率、色盲率、某年齡段的死亡率、某項(xiàng)政策的支持率等。比率p是在實(shí)際中常遇到的一種參數(shù)。比率p可看做某二點(diǎn)分布b(1,p)中的一個(gè)參數(shù),若X~b(1,p),則X僅可能取0或1兩個(gè)值,且E(X)=p,Var(X)=p(1-p)。這一節(jié)將討論有關(guān)p的假設(shè)檢驗(yàn)、置信區(qū)間與樣本量確定等統(tǒng)計(jì)推斷問(wèn)題。其中比率p的置信區(qū)間在3.3節(jié)中已作詳盡討論,這里就不再重復(fù)了。4.6.1比率p的假設(shè)檢驗(yàn)設(shè)x1,x2,…,xn是來(lái)自二點(diǎn)分布b(1,p)的一個(gè)樣本,其中參數(shù)p的檢驗(yàn)常有如下三個(gè)類型:
Ⅰ.H0:p≤p0
vs
H1:p>p0
Ⅱ.H0:p≥p0
vs
H1:p<p0
Ⅲ.H0:p=p0
vs
H1:p≠p0其中p0給定。在樣本量n給定時(shí),樣本之和(即累計(jì)頻數(shù))服從二項(xiàng)分布,即4.6.1比率p的假設(shè)檢驗(yàn)下面分小樣本和大樣本兩種情況下對(duì)P的假設(shè)檢驗(yàn)進(jìn)行討論。1.小樣本方法
在檢驗(yàn)問(wèn)題Ⅰ中,犯第Ⅰ類錯(cuò)誤(拒真錯(cuò)誤)概率可用二項(xiàng)分布計(jì)算:在3.3節(jié)中曾指出:α(p)是p的增函數(shù),故要使上式成立只要控制p=p0處達(dá)到α即可,即
(4.6.1)上式最后使用不等號(hào)是由于T是離散分布之故,等式成立是罕見(jiàn)的。4.6.1比率p的假設(shè)檢驗(yàn)類似的討論可知,檢驗(yàn)問(wèn)題Ⅱ的拒絕域WⅡ的臨界值c'是滿足如下不等式的最大正整數(shù):
(4.6.2)而檢驗(yàn)問(wèn)題Ⅲ的拒絕域WⅢ的第一個(gè)臨界值c1是滿足如下不等式的最大正整數(shù):
(4.6.3)而第二個(gè)臨界值c2是滿足如下不等式的最小正整數(shù):
(4.6.4)4.6.1比率p的假設(shè)檢驗(yàn)例4.6.1在n=12,p0=0.4場(chǎng)合,分別確定上述三個(gè)檢驗(yàn)問(wèn)題的拒絕域。4.6.1比率p的假設(shè)檢驗(yàn)2.大樣本方法在大樣本場(chǎng)合,二項(xiàng)概率計(jì)算困難,這時(shí)可用二項(xiàng)分布的正態(tài)近似,即當(dāng)T~b(n,p),E(T)=np,Var(T)=np(1-p),按中心極限定理,當(dāng)樣本量n較大時(shí),當(dāng)p=p0時(shí)有
(4.6.6)這樣就把檢驗(yàn)統(tǒng)計(jì)量T轉(zhuǎn)化為檢驗(yàn)統(tǒng)計(jì)量u。由于u與T是同增同減的量,當(dāng)用u代替T時(shí),三個(gè)檢驗(yàn)問(wèn)題的拒絕域形式不變。當(dāng)給定顯著性水平α后,下述三個(gè)檢驗(yàn)問(wèn)題的水平為α檢驗(yàn)的拒絕域分別為:(其中u如式(4.6.6)所示)4.6.1比率p的假設(shè)檢驗(yàn)WⅠ={u≥u1-α}WⅡ={u≤uα}WⅢ={|u|≥u1-α/2}在使用比率p的檢驗(yàn)中所涉及數(shù)據(jù)都為成敗型數(shù)據(jù)(成功與失敗、合格與不合格等)。在很多場(chǎng)合都可大量收集,花費(fèi)也不大,故比率p的大樣本u檢驗(yàn)常被選用。使用中還需注意:不僅要樣本量n較大,還要求p不要很靠近0或1,且使np≥5和n(1-p)≥5都要滿足。4.6.1比率p的假設(shè)檢驗(yàn)例4.6.2某廠的產(chǎn)品不合格品率不超過(guò)3%,在一次例行檢查中隨機(jī)抽檢200只,發(fā)現(xiàn)有8個(gè)不合格品,試問(wèn)在α=0.05下能否認(rèn)為不合格品率不超過(guò)3%?*4.6.2控制犯兩類錯(cuò)誤概率確定樣本量在對(duì)比率p作檢驗(yàn)時(shí),控制犯兩類錯(cuò)誤概率α與β可確定所需最少樣本量。這一小節(jié)將在大樣本場(chǎng)合討論這個(gè)問(wèn)題。討論將對(duì)單側(cè)檢驗(yàn)問(wèn)題與雙側(cè)檢驗(yàn)問(wèn)題分別進(jìn)行。1.對(duì)單側(cè)檢驗(yàn)問(wèn)題在單側(cè)檢驗(yàn)的情況下,控制犯兩類錯(cuò)誤概率α與β可確定所需最少樣本量為2.對(duì)雙側(cè)檢驗(yàn)問(wèn)題在單側(cè)檢驗(yàn)的情況下,控制犯兩類錯(cuò)誤概率α與β可確定所需最少樣本量為*4.6.2控制犯兩類錯(cuò)誤概率確定樣本量例4.6.3某儀器廠向某電容器廠訂購(gòu)大批量電容器,雙方約定:(1)當(dāng)電容器廠提供的產(chǎn)品的不合格品率p≤1%時(shí),儀器廠應(yīng)以高概率0.95接受;(2)當(dāng)產(chǎn)品的不合格品率p≥2.4%時(shí),儀器廠將以高于0.90的概率拒收。按此要求應(yīng)抽取多少產(chǎn)品進(jìn)行檢驗(yàn)才能保證雙方利益呢?4.6.3兩個(gè)比率差的大樣本檢驗(yàn)
1.兩個(gè)比率差的假設(shè)檢驗(yàn)兩個(gè)比率差的檢驗(yàn)問(wèn)題常有如下三種形式:Ⅰ.H0:p1-p2≤0,
H1:p1-p2>0Ⅱ.H0:p1-p2≥0,
H1:p1-p2<0Ⅲ.H0:p1-p2=0,
H1:p1-p2≠0其中p1與p2分別用各自樣本均值
給出估計(jì)。在n與m都很大的場(chǎng)合,與
都近似服從正態(tài)分布??紤]到兩樣本的獨(dú)立性,兩者之差也近似服從正態(tài)分布。4.6.3兩個(gè)比率差的大樣本檢驗(yàn)可以證明:上述三種檢驗(yàn)問(wèn)題都在p1=p2時(shí)犯第Ⅰ類錯(cuò)誤的概率最大,故只要在p1=p2=p處使犯第Ⅰ類錯(cuò)誤的概率為α,就可獲得水平為α的檢驗(yàn)。而在p1=p2=p時(shí),可用合樣本的頻率來(lái)估計(jì)p,即用
(4.6.12)估計(jì)共同的P,這時(shí)可用如下的檢驗(yàn)統(tǒng)計(jì)量:
(4.6.13)
4.6.3兩個(gè)比率差的大樣本檢驗(yàn)對(duì)給定的顯著性水平α,前述三個(gè)檢驗(yàn)問(wèn)題的拒絕域分別為:
WⅠ={u≥u1-α}
WⅡ={u≤uα}
WⅢ={|u|≥u1-α/2}若設(shè)u0為從兩樣本用式(4.6.13)算得的檢驗(yàn)統(tǒng)計(jì)量u的觀察值,則上述三個(gè)檢驗(yàn)問(wèn)題的p值分別為:
pⅠ=P(u≥u0)
pⅡ=P(u≤u0)
pⅢ=P(|u|≥|u0|)=2P(u≥|u0|)4.6.3兩個(gè)比率差的大樣本檢驗(yàn)例4.6.4甲、乙兩廠生產(chǎn)同一種產(chǎn)品,為比較兩廠的產(chǎn)品質(zhì)量是否一致,現(xiàn)隨機(jī)從甲廠的產(chǎn)品中抽取300件,發(fā)現(xiàn)有14件不合格品,在乙廠的產(chǎn)品中抽取400件,發(fā)現(xiàn)有25件不合格品。在α=0.05水平下檢驗(yàn)兩廠的不合格品率有無(wú)顯著差異。4.6.3兩個(gè)比率差的大樣本檢驗(yàn)
2.兩個(gè)比率差的置信區(qū)間在大樣本場(chǎng)合,p1-p2的近似1-α置信區(qū)間為:而p1-p2的近似1-α單側(cè)置信上限為:p1-p2的近似1-α單側(cè)置信下限為:4.6.3兩個(gè)比率差的大樣本檢驗(yàn)例4.6.5在一個(gè)由85個(gè)(汽車發(fā)動(dòng)機(jī)用的)機(jī)軸組成的樣本中有10個(gè)表面加工較為粗糙而成為次品。對(duì)表面拋光進(jìn)行改進(jìn),隨之又得75個(gè)機(jī)軸組成的第二個(gè)樣本,其中5件為次品。現(xiàn)要求兩個(gè)次品率差的95%置信區(qū)間。4.6.3兩個(gè)比率差的大樣本檢驗(yàn)*3.控制犯兩類錯(cuò)誤概率確定樣本量為確定起見(jiàn),我們將在雙側(cè)檢驗(yàn)問(wèn)題下和兩樣本量相等n=m場(chǎng)合計(jì)算犯第Ⅱ類錯(cuò)誤的概率β。根據(jù)算出的概率,可以得出樣本量n的表達(dá)式:4.6.3兩個(gè)比率差的大樣本檢驗(yàn)例4.6.6在α=0.05與β=0.10場(chǎng)合,考察區(qū)分p1與p2所需的樣本量。此時(shí)u1-α/2=u0.975=1.96,u1-β=u0.9=1.282。以下為確定起見(jiàn)先考慮區(qū)別p1=0.01,p2=0.05時(shí)所需樣本量。
*4.7廣義似然比檢驗(yàn)4.7.1廣義似然比檢驗(yàn)設(shè)x=(x1,x2,…,xn)是來(lái)自密度函數(shù)p(x;θ)的一個(gè)樣本,而參數(shù)θ的似然函數(shù)記為L(zhǎng)(θ;x)=p(xi;θ),其中參數(shù)空間為Θ={θ}。又設(shè)Θ0與Θ1為Θ的兩個(gè)非空不相交的子集(即Θ0∩Θ1=?),且Θ0∪Θ1=Θ??疾烊缦碌募僭O(shè)檢驗(yàn)問(wèn)題:
H0:θ∈Θ0
vs
H1:θ∈Θ1(4.7.1)設(shè)
是似然函數(shù)L(θ;x)在參數(shù)空間Θ上的最大似然估計(jì),即
滿足
4.7.1廣義似然比檢驗(yàn)又設(shè)
是似然函數(shù)L(θ;x)在原假設(shè)Θ0上的最大似然估計(jì),即由于兩個(gè)似然函數(shù)值L(;x)與L(;x)都與θ無(wú)關(guān),且都是樣本x的函數(shù),故其比值也與θ無(wú)關(guān),也是樣本x的函數(shù),故是統(tǒng)計(jì)量,這個(gè)統(tǒng)計(jì)量稱為廣義似然比統(tǒng)計(jì)量。
4.7.1廣義似然比檢驗(yàn)還可看出:λ(x)是檢驗(yàn)統(tǒng)計(jì)量,因?yàn)棣?x)的大小能區(qū)分檢驗(yàn)問(wèn)題(4.7.1)中的原假設(shè)H0與備擇假設(shè)H1,在樣本x給定下,似然函數(shù)是θ出現(xiàn)可能性大小的一種度量。如今在廣義似然比統(tǒng)計(jì)量λ(x)中分母相對(duì)固
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度科技研發(fā)領(lǐng)域自愿出資入股協(xié)議
- 2025年度貴金屬首飾典當(dāng)借款服務(wù)協(xié)議
- 二零二五年度互聯(lián)網(wǎng)企業(yè)職工勞動(dòng)合同優(yōu)化方案
- 二零二五年度電子行業(yè)經(jīng)典實(shí)習(xí)期勞動(dòng)合同模板
- 建筑工程測(cè)量(第一章)-緒論
- 物業(yè)管理權(quán)交予合同
- 發(fā)言稿字體格式
- 2025年佛山貨運(yùn)資格證繼續(xù)教育模擬考試
- 勞務(wù)派遣小時(shí)工協(xié)議
- 《初中英語(yǔ)語(yǔ)法專題教學(xué)課教案》
- 藍(lán)曬創(chuàng)作方案
- 醫(yī)院隔離技術(shù)標(biāo)準(zhǔn)2023
- 探討630MW超臨界機(jī)組深度調(diào)峰安全技術(shù)措施
- 紅色旅游線路
- 柔性印刷技術(shù)課件
- 膝骨關(guān)節(jié)炎中醫(yī)診療指南
- 北京電子科技職業(yè)學(xué)院招聘考試題庫(kù)2024
- 貸款的培訓(xùn)課件
- 無(wú)人系統(tǒng)自主控制
- 化工原理陳敏恒課件
- 景區(qū)保安投標(biāo)方案(技術(shù)方案)
評(píng)論
0/150
提交評(píng)論