版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第4章假設(shè)檢驗主要內(nèi)容4.1假設(shè)檢驗的概念與步驟4.2正態(tài)均值的檢驗4.3兩正態(tài)均值差的推斷4.4成對數(shù)據(jù)的比較4.5正態(tài)方差的推斷4.6比率的推斷*4.7廣義似然比檢驗由樣本到總體的推理稱為統(tǒng)計推斷。英國統(tǒng)計學(xué)家R.A.費希爾認為常用的統(tǒng)計推斷有三種基本形式,它們是●抽樣分布;●參數(shù)估計,又可分為點估計與區(qū)間估計;●假設(shè)檢驗,又可分為參數(shù)檢驗與非參數(shù)檢驗。其中抽樣分布與參數(shù)估計在前幾章已有敘述,今后還會不斷補充。從這一章開始將敘述假設(shè)檢驗,并討論假設(shè)檢驗與區(qū)間估計,確定樣本量之間的關(guān)系。假設(shè)檢驗是統(tǒng)計學(xué)中最具特色的部分,其統(tǒng)計味甚濃。從建立假設(shè),尋找檢驗統(tǒng)計量,構(gòu)造拒絕域(或計算p值),直到最后作出判斷等各個步驟上都能體現(xiàn)多種統(tǒng)計思想的亮點。假設(shè)檢驗的思維方式也獨具一格,從其他數(shù)學(xué)分支學(xué)不到這種判斷問題的思路。不犯錯誤、不冒風(fēng)險的判斷是不存在的,問題在于設(shè)法控制犯錯誤的概率。4.1假設(shè)檢驗的概念與步驟例4.1.1某廠生產(chǎn)的化纖長度X服從正態(tài)分布N(μ,0.042),其中正態(tài)均值μ的設(shè)計值為1.40。每天都要對“μ=1.40”作例行檢驗,以觀察生產(chǎn)是否正常進行。若不正常,需對生產(chǎn)設(shè)備進行調(diào)整和再檢驗,直到正常為止。某日從生產(chǎn)線上隨機抽取25根化纖,測得其長度值為x1,x2,…,xn(n=25),算得其平均長度=1.38,問當(dāng)日生產(chǎn)是否正常?4.1.1假設(shè)檢驗問題幾點評論:●這不是一個參數(shù)估計問題?!襁@里要對命題“μ=1.40”給出回答:“是”或“否”?!袢舭汛嗣}看做一個假設(shè),并記為“H0:μ=1.40”,對命題的判斷轉(zhuǎn)化為對假設(shè)H0的檢驗,此類問題稱為(統(tǒng)計)假設(shè)檢驗問題?!窦僭O(shè)檢驗問題在生產(chǎn)實際和科學(xué)研究中常會遇到,如新藥是否有效?新工藝是否可減少不合格品率?不同質(zhì)料鞋底的耐磨性是否有顯著差異?這類問題都可歸結(jié)為某個假設(shè)的檢驗問題。4.1.1假設(shè)檢驗問題4.1.2假設(shè)檢驗的步驟假設(shè)檢驗的基本思想是:根據(jù)所獲樣本,運用統(tǒng)計分析方法對總體X的某種假設(shè)H0作出判斷。1.建立假設(shè)一般假設(shè)檢驗問題需要建立兩個假設(shè):
(4.1.1)原假設(shè)H0是我們要檢驗的假設(shè),在這里H0的含義是“與設(shè)計值一致”或“當(dāng)日生產(chǎn)正常”。備擇假設(shè)H1是在原假設(shè)被拒絕時而應(yīng)接受的假設(shè)。
在參數(shù)假設(shè)檢驗中,假設(shè)都是參數(shù)空間Θ內(nèi)的一個非空子集。在例4.1.1中平均長度μ的參數(shù)空間為Θ={μ:-∞<μ<∞},其原假設(shè)H0:μ∈Θ0,其中Θ0={μ:μ=1.40}是單元素集,又稱為簡單假設(shè)。備擇假設(shè)H1:μ∈Θ1,其中Θ1={μ:μ≠1.40}是多元素集,又稱為復(fù)雜假設(shè)。一般來說,參數(shù)空間Θ中任意兩個不相交的非空子集都可組成一個參數(shù)假設(shè)檢驗問題。對備擇假設(shè)還有一點要說明:假如備擇假設(shè)H1位于原假設(shè)的右側(cè)或左側(cè),則稱該檢驗問題為單側(cè)檢驗問題。假如備擇假設(shè)H1位于原假設(shè)H0的兩側(cè)則稱其為雙側(cè)檢驗問題。4.1.2假設(shè)檢驗的步驟2.選擇檢驗統(tǒng)計量,確定拒絕域的形式在H0對H1的檢驗問題中涉及正態(tài)均值μ,樣本均值
是μ的最好估計,且~N(μ,σ2/n)。由于
的方差σ2/n比
的方差σ2縮小n倍,使用
的分布更容易把
與μ0=1.40區(qū)分開來(見圖4.1.1)。4.1.2假設(shè)檢驗的步驟在σ已知為σ0和原假設(shè)H0:μ=μ0為真的情況下,經(jīng)標(biāo)準(zhǔn)化變換可得
(4.1.4)這里的u就是今后使用的檢驗統(tǒng)計量,而且|u|的大小可以用來區(qū)分是否拒絕H0,即
|u|越大,應(yīng)傾向于拒絕H0
|u|越小,應(yīng)傾向于不拒絕H0為便于區(qū)分拒絕H0與不拒絕H0,需要在u軸上找一個臨界值c,使得當(dāng)|u|≥c時,拒絕H0當(dāng)|u|<c時,不拒絕H0并稱u軸上的區(qū)域{u:|u|≥c}={|u|≥c}為該雙側(cè)檢驗問題的拒絕域,記為W。4.1.2假設(shè)檢驗的步驟接受域中有兩類樣本點:●一類樣本點使原假設(shè)H0為真,是應(yīng)該接受的;●另一類樣本點所提供的信息不足以拒絕原假設(shè)H0,不宜列入W,只能保留在
內(nèi),待有新的樣本信息后再議。因此,的準(zhǔn)確稱呼應(yīng)是“不拒絕域”,可人們不習(xí)慣此種說法。本書中約定:“不拒絕域”與“接受域”兩種說法是等同的,指的就是,它含有“接受”與“保留”兩類樣本點,要進一步再區(qū)分“接受”與“保留”已無法由一個樣本來確定。
4.1.2假設(shè)檢驗的步驟4.1.2假設(shè)檢驗的步驟這一判斷過程很像法庭法官判案過程,法官辦案的邏輯是這樣的,他首先建立假設(shè)H0:“被告無罪”,誰說被告有罪誰要拿出證據(jù)來。原告拿出一次貪污,或一次盜竊,或一次販毒的證據(jù)(相當(dāng)于一個樣本)后,若證據(jù)確鑿,經(jīng)雙方陳述和辯論,若法官認定罪行成立,就拒絕假設(shè)H0,并立即判刑入獄。若法官認為證據(jù)不足,則不會定罪。如此判案在法律界稱為“無罪推定論”。這樣一來,監(jiān)獄里的人幾乎都是有罪的,但也要看到,監(jiān)獄外的人不全是好人。國內(nèi)外多年實踐表明,這樣判案是合理的,合乎邏輯的,對監(jiān)獄外的人再區(qū)分“好”與“不好”比區(qū)別“有罪”與“無罪”不知要難上幾百倍。這就是我們在假設(shè)檢驗中把注意力放在確定“拒絕域”的理由。3.給出顯著性水平α,定出臨界值在假設(shè)檢驗中可能犯的錯誤有如下兩類(見圖4.1.2)。第Ⅰ類錯誤(拒真錯誤):原假設(shè)H0為真,但由于抽樣的隨機性,樣本落在拒絕域W內(nèi),從而導(dǎo)致拒絕H0,其發(fā)生概率記為α,又稱為顯著性水平。第Ⅱ類錯誤(取偽錯誤):原假設(shè)H0不真,但由于抽樣的隨機性,樣本落在
內(nèi),從而導(dǎo)致接受H0,其發(fā)生概率為β。4.1.2假設(shè)檢驗的步驟例4.1.2計算例4.1.1的雙側(cè)檢驗問題中犯兩類錯誤的概率α與β。一般理論研究表明:●在固定樣本量n下,要減小α必導(dǎo)致增大β;●在固定樣本量n下,要減小β必導(dǎo)致增大α;●要使α與β皆小,只有不斷增大樣本量n才能實現(xiàn),這在實際中常不可行。4.1.2假設(shè)檢驗的步驟如何處理α與β之間不易調(diào)和的矛盾呢?很多統(tǒng)計學(xué)家根據(jù)實際使用情況提出如下建議:(1)在樣本量n已固定的場合,主要控制犯第Ⅰ類錯誤的概率,并構(gòu)造出“水平為α的檢驗”,它的具體定義如下:定義4.1.1在一個假設(shè)檢驗問題中,先選定一個數(shù)α(0<α<1),若一個檢驗犯第Ⅰ類錯誤的概率不超過α,即
P(犯第Ⅰ類錯誤)≤α則稱該檢驗是水平為α的檢驗,其中α稱為顯著性水平。(2)在有需要和可能的場合,適當(dāng)選擇樣本量n去控制犯第Ⅱ類錯誤的概率。這一點將在后面討論。4.1.2假設(shè)檢驗的步驟4.判斷上述檢驗問題的判斷法則如下:●當(dāng)根據(jù)樣本計算的檢驗統(tǒng)計量的值落入拒絕域W內(nèi),則拒絕H0,即接受H1?!癞?dāng)根據(jù)樣本計算的檢驗統(tǒng)計量的值未落入拒絕域W內(nèi),則接受H0。4.1.2假設(shè)檢驗的步驟4.1.2假設(shè)檢驗的步驟綜上所述,進行假設(shè)檢驗都要經(jīng)過上述四步程序,即(1)建立假設(shè):原假設(shè)H0與備擇假設(shè)H1;(2)選擇檢驗統(tǒng)計量,確定拒絕域W的形式;(3)給出顯著性水平α,定出臨界值;(4)判斷:是拒絕H0還是接受H0。定義4.1.2設(shè)檢驗問題
H0:θ∈Θ0,
H1:θ∈Θ1的拒絕域為W,則樣本觀察值x=(x1,x2,…,xn)落在拒絕域W內(nèi)的概率稱為該檢驗的勢函數(shù),記為
g(θ)=Pθ(x∈W),
θ∈Θ0∪Θ1?Θ(4.1.8)例4.1.3某廠制造的產(chǎn)品長期以來不合格品率不超過0.01。某天開工后,為檢驗生產(chǎn)過程是否穩(wěn)定,隨機抽檢了100件產(chǎn)品,發(fā)現(xiàn)其中有2件不合格品。試在0.10水平上判斷該天生產(chǎn)是否穩(wěn)定。
4.1.3勢函數(shù)4.2正態(tài)均值的檢驗設(shè)x1,x2,…,xn是來自正態(tài)總體N(μ,σ2)的一個樣本,關(guān)于正態(tài)均值μ的檢驗問題常有如下三種形式:
Ⅰ.H0:μ≤μ0
vs
H1:μ>μ0
(4.2.1)
Ⅱ.H0:μ≥μ0
vs
H1:μ<μ0
(4.2.2)
Ⅲ.H0:μ=μ0
vs
H1:μ≠μ0(4.2.3)其中μ0是一個已知常數(shù)。由于正態(tài)方差σ2已知與否對選擇μ的檢驗有影響,故要分兩種情況討論,具體是●σ已知時,用u檢驗;●σ未知時,用t檢驗。4.2.1正態(tài)均值μ的u檢驗(σ已知)(1)先對檢驗問題Ⅰ的特殊情況,原假設(shè)縮為一點的檢驗問題Ⅰ':
Ⅰ'.H'0:μ=μ0
vs
H1:μ>μ0(4.2.4)建立水平為α的檢驗。(2)為了獲得檢驗問題Ⅱ的水平為α的檢驗,我們仿照前面的辦法先壓縮其原假設(shè)為H'0:μ=μ0,獲得水平為α的檢驗后再拓展原假設(shè)。(3)檢驗問題Ⅲ的水平為α的檢驗已在例4.1.1和例4.1.2中作過詳細討論,它的拒絕域
構(gòu)成檢驗問題Ⅲ的水平為α的檢驗。4.2.1正態(tài)均值μ的u檢驗(σ已知)
(4)小結(jié)。我們研究了五對假設(shè)檢驗問題,利用勢函數(shù)的單調(diào)性,把檢驗問題Ⅰ與Ⅰ'歸為一類,把檢驗問題Ⅱ與Ⅱ'歸為一類。這樣就把這五對假設(shè)檢驗問題分為三類,分別建立水平為α的檢驗及其拒絕域。注意拒絕域與備擇假設(shè)中的不等號的方向是相同的(見圖4.2.4).最后,這五對假設(shè)檢驗所用的檢驗統(tǒng)計量是相同的,都用u統(tǒng)計量,故所建立的水平為α的檢驗都稱為u檢驗。4.2.1正態(tài)均值μ的u檢驗(σ已知)4.2.1正態(tài)均值μ的u檢驗(σ已知)例4.2.1微波爐在爐門關(guān)閉時的輻射量是一個重要的質(zhì)量指標(biāo)。某廠該指標(biāo)服從正態(tài)分布N(μ,σ2),長期以來σ=0.1,且均值都符合要求,不超過0.12。為檢查近期產(chǎn)品的質(zhì)量,抽查了25臺,得其爐門關(guān)閉時輻射量的均值=0.1203。試問在α=0.05水平上該廠微波爐爐門關(guān)閉時輻射量是否升高了?
4.2.2正態(tài)均值μ的t檢驗(σ未知)這里將在σ未知時考察前面提出的三類檢驗問題:
Ⅰ.H0:μ≤μ0
vs
H1:μ>μ0
Ⅱ.H0:μ≥μ0
vs
H1:μ<μ0
Ⅲ.H0:μ=μ0
vs
H1:μ≠μ0如今不能再用u作檢驗統(tǒng)計量了,因u中含有未知參數(shù)σ。一個自然想法是用樣本標(biāo)準(zhǔn)差s去代替u中的σ,從而形成t統(tǒng)計量,其分布是自由度為n-1的t分布,即
4.2.2正態(tài)均值μ的t檢驗(σ未知)由于t統(tǒng)計量與u統(tǒng)計量很類似,故經(jīng)類似于4.2.1小節(jié)中的討論可知,上述三個檢驗問題的水平為α的檢驗的拒絕域(見圖4.2.5)4.2.2正態(tài)均值μ的t檢驗(σ未知)例4.2.2根據(jù)某地環(huán)境保護法規(guī)定,傾入河流的廢水中某種有毒化學(xué)物質(zhì)的平均含量不得超過3ppm(1ppm=10-6=百萬分之一)。該地區(qū)環(huán)保組織對沿河各廠進行檢查,測定每日傾入河流的廢水中該物質(zhì)的含量(單位:ppm)為:
3.1
3.2
3.3
2.9
3.5
3.4
2.5
4.3
3.0
3.4
2.9
3.6
3.2
3.0
2.7
3.5
2.9
3.3
3.3
3.1試在顯著性水平α=0.05上判斷該廠是否符合環(huán)保規(guī)定(假定廢水中有毒物質(zhì)含量X~N(μ,σ2))。4.2.2正態(tài)均值μ的t檢驗(σ未知)4.2.3用p值作判斷在一個假設(shè)檢驗問題中選擇不同的顯著性水平有時會導(dǎo)致不同的結(jié)論,而顯著性水平的選擇又帶有人為因素,因此對判斷的結(jié)果不宜解釋得過死。為使這種解釋有一個寬松的余地,統(tǒng)計學(xué)家提出“p值”的概念,并用它來代替拒絕域作判斷。這一想法隨著計算機的普及日益受到人們的關(guān)注.下面用一個例子說明這一過程。4.2.3用p值作判斷
例4.2.3一支香煙中的尼古丁含量X服從正態(tài)分布N(μ,1),合格標(biāo)準(zhǔn)規(guī)定μ不能超過1.5mg。為對一批香煙的尼古丁含量是否合格作判斷,可建立如下假設(shè):
H0:μ≤1.5
vs
H1:μ>1.5這是在方差已知情況下對正態(tài)分布的均值作單側(cè)檢驗,所用的檢驗統(tǒng)計量為:
拒絕域是W={u≥u1-α}?,F(xiàn)隨機抽取一盒(20支)香煙,測得平均每支香煙的尼古丁含量為=1.97mg,則可求得檢驗統(tǒng)計量的值為u0=2.10。4.2.3用p值作判斷表4.2.2對4個不同的顯著性水平α分別列出相應(yīng)的拒絕域和所下的結(jié)論。從表4.2.2中可看出,隨著α的減少,臨界值u1-α在增加,致使判斷結(jié)論由拒絕H0轉(zhuǎn)到接受H0。可見,不同的α?xí)玫讲煌慕Y(jié)論。在這個過程中不變的是檢驗統(tǒng)計量的觀察值u0=2.10,它與臨界值u1-α的位置誰左誰右(即誰大誰小)決定了對原假設(shè)H0是拒絕還是接受。u1-α與u0的比較等價于如下兩個尾部概率的比較:●α=P(u≥u1-α),即顯著性水平α是檢驗統(tǒng)計量u的分布N(0,1)的尾部概率。在這個例子中尾部概率在右尾部?!駊=P(u≥u0),這也是一個尾部概率,也可用N(0,1)算出。在u0=2.10時,p=P(u≥2.10)=1-Φ(2.10)=0.01794.2.3用p值作判斷這兩個尾部概率在分布的同一端,是可比的。當(dāng)α>p=0.0179時,u0=2.10在拒絕域內(nèi),從而拒絕H0。當(dāng)α<p=0.0179時,u0=2.10在拒絕域外,從而保留H0。當(dāng)α=p=0.0179時,u0=2.10在拒絕域邊界上,也拒絕H0,可見p是拒絕原假設(shè)H0的最小顯著性水平。這個p=0.0179就是將要介紹的該檢驗的p值。這個例子中討論的尾部概率具有一般性,借此可給出一般場合下p值的定義,以及另一個判斷法則。4.2.3用p值作判斷定義4.2.1在一個假設(shè)檢驗問題中,拒絕原假設(shè)H0的最小顯著性水平稱為p值。利用p值和給定的顯著性水平α可以建立如下判斷法則:●若α≥p值,則拒絕原假設(shè)H0;●若α<p值,則接受原假設(shè)H0。例4.2.4任一檢驗問題的p值可用相應(yīng)檢驗統(tǒng)計量的分布(如標(biāo)準(zhǔn)正態(tài)分布、t分布等)算得。4.2.3用p值作判斷4.2.3用p值作判斷關(guān)于這個新的判斷法則(指用p值作判斷)有以下幾點評論:●新判斷法則與原判斷法則(見4.1.2小節(jié))是等價的?!裥屡袛喾▌t跳過拒絕域(回避了構(gòu)造拒絕域的過程),簡化了判斷過程,但要計算檢驗的p值?!袢我粰z驗問題的p值都可用相應(yīng)檢驗統(tǒng)計量的分布(如標(biāo)準(zhǔn)正態(tài)分布、t分布、χ2分布等)算得。例4.2.5某廠制造的產(chǎn)品長期以來不合格品率不超過0.01,某天開工后隨機抽檢了100件產(chǎn)品,發(fā)現(xiàn)其中有2件不合格品,試在0.10水平上判斷該天生產(chǎn)是否正常?4.2.4假設(shè)檢驗與置信區(qū)間的對偶關(guān)系參數(shù)的雙側(cè)檢驗與置信區(qū)間就會發(fā)現(xiàn)它們之間有密切聯(lián)系。譬如所用的檢驗統(tǒng)計量與樞軸量,實際上是同一個量;檢驗的顯著性水平α與置信區(qū)間的置信水平1-α是相互對立的兩事件的概率,若水平為α的檢驗的拒絕域為W,則其對立事件(接受域)就是相應(yīng)參數(shù)的1-α置信區(qū)間。反之,用置信區(qū)間也可作假設(shè)檢驗,若原假設(shè)H0:θ=θ0在某1-α置信區(qū)間內(nèi),則應(yīng)接受H0;否則拒絕H0。從而也可建立雙側(cè)檢驗的拒絕域。這種對應(yīng)關(guān)系稱為對偶關(guān)系,這種對偶關(guān)系在單側(cè)檢驗和置信限也存在。
4.2.4假設(shè)檢驗與置信區(qū)間的對偶關(guān)系以正態(tài)均值μ為例具體說明這種對偶關(guān)系(1)正態(tài)總體N(μ,σ2)的均值μ的如下雙側(cè)檢驗
Ⅲ.H0:μ=μ0
vs
H1
μ≠μ0(4.2.7)(2)正態(tài)總體N(μ,σ2)的均值μ的如下單側(cè)檢驗問題
Ⅱ.H0:μ≥μ0
vs
H1:μ<μ0(3)正態(tài)總體N(μ,σ2)的均值μ的如下單側(cè)檢驗問題
Ⅰ.H0:μ≤μ0
vs
H1:μ>μ0(4)假設(shè)檢驗與置信區(qū)間之間的聯(lián)系不是單向的,而是雙向的。4.2.4假設(shè)檢驗與置信區(qū)間的對偶關(guān)系4.2.4假設(shè)檢驗與置信區(qū)間的對偶關(guān)系(5)在σ未知場合,只需用s替換σ,用t分布分位數(shù)替換標(biāo)準(zhǔn)正態(tài)分布分位數(shù),上述討論仍然有效,對偶關(guān)系仍然成立。(6)若把參數(shù)μ換為σ2,則只要能找到正態(tài)方差σ2的檢驗問題的檢驗統(tǒng)計量,就可用其接受域獲得σ2的置信區(qū)間或單側(cè)置信限。(7)參數(shù)的假設(shè)檢驗與參數(shù)的置信區(qū)間(或置信限)之間的對偶關(guān)系是由其理論結(jié)構(gòu)決定的。假設(shè)檢驗中使用的檢驗統(tǒng)計量與置信區(qū)間中所使用的樞軸量是相同的,但其注意力不同。假設(shè)檢驗的注意力放在拒絕域上,而置信區(qū)間的注意力放在接受域上。(8)注意:用p值作檢驗時,不可能建立上述對偶關(guān)系。4.2.4假設(shè)檢驗與置信區(qū)間的對偶關(guān)系例4.2.6白熾燈泡的壽命(單位:小時)服從正態(tài)分布。按標(biāo)準(zhǔn)工藝生產(chǎn)此種燈泡,其平均壽命為θ0=1400。某廠為提高白熾燈泡的平均壽命,改進了當(dāng)前的生產(chǎn)工藝,并試制了一批新的燈泡。為了考察新工藝能否提高平均壽命,需要進行假設(shè)檢驗。為此設(shè)置如下一對假設(shè):
H0:θ=θ0=1400
vs
H1:θ>θ0我們?nèi)绱嗽O(shè)置原假設(shè)H0是希望能獲得拒絕H0的結(jié)論。下面我們用置信下限來作檢驗。4.2.5大樣本下的u檢驗在4.2.1小節(jié)中討論的“在σ已知下正態(tài)均值μ的u檢驗”還可在大樣本場合(如n>30)擴大其使用范圍。為此要解除它的一些約束?!袷紫冉獬罢龖B(tài)性”約束?!衿浯芜€可解除對“已知σ”限制。例4.2.7某市2009年每戶每月平均花費在食品上的費用不超過600元,該市為了解2010年此種費用是否有變化,特委托該市某市場調(diào)查公司作抽樣調(diào)查。該公司對該市100戶作了調(diào)查,算得此項花費平均為642元,標(biāo)準(zhǔn)差為141元。試問該市2010年此項平均花費與2009年是否有顯著差異。4.2.6控制犯兩類錯誤概率確定樣本量在4.1節(jié)中曾指出,犯兩類錯誤的概率α與β都依賴于樣本量n。本小節(jié)將在正態(tài)總體標(biāo)準(zhǔn)差σ已知場合對正態(tài)均值μ的單側(cè)和雙側(cè)檢驗分別討論這個問題。(1)對單側(cè)檢驗問題
H0:μ≤μ0
vs
H1:μ>μ0
H0:μμ0
vs
H1:μ<μ0
經(jīng)計算可得,4.2.6控制犯兩類錯誤概率確定樣本量(2)對雙側(cè)檢驗問題
H0:μ=μ0
vs
H1:μ≠μ0經(jīng)計算,可得:例4.2.8某廠生產(chǎn)的化纖長度X服從正態(tài)分布N(μ,0.042),其中μ的設(shè)計值為1.40,每天都要對“μ=1.40”作例行檢驗,一旦均值變成1.38,產(chǎn)品就發(fā)生了質(zhì)量問題。那么我們應(yīng)該抽多少樣品進行檢驗,才能保證在μ=1.40時犯第Ⅰ類錯誤的概率不超過0.05,在μ=1.42時犯第Ⅱ類錯誤的概率不超過0.10?*4.2.7兩個注釋在實際中用假設(shè)檢驗有兩點要注意。1.注意區(qū)別統(tǒng)計顯著性與實際顯著性例4.2.9一汽車制造商聲稱,某型號轎車在高速公路上每加侖汽油燃料平均可行駛35英里。一消費者組織試驗了39輛此種型號的轎車,發(fā)現(xiàn)燃料消耗的平均值為34.5英里/加侖。在正態(tài)分布N(μ,1.52)假設(shè)下對如下單側(cè)檢驗問題
H0:μ=35,
H1:μ<35進行u檢驗,若取α=0.05,uα=-1.96,故拒絕域W={u<-1.96}。另一方面,可算得u統(tǒng)計量的觀察值
u0=
-2.08由于-2.08<-1.96,故應(yīng)拒絕原假設(shè)H0,可認為34.5與35在統(tǒng)計上有顯著差異,但實際工作者都認為這二者之間沒有實際顯著性。*4.2.7兩個注釋一個被拒絕的原假設(shè)意味著有統(tǒng)計顯著性,但未必意味著都有實際顯著性。特別在大樣本場合或精確測量場合常有這種情況發(fā)生,即使與原假設(shè)之間的微小差別都將被認為有統(tǒng)計顯著性,但未必有實際顯著性。*4.2.7兩個注釋2.顯著性水平α的選擇選擇α要注意如下兩個方面:●α應(yīng)是較小的數(shù),但不易過小。這是為了控制犯第Ⅰ類錯誤(棄真錯誤)的概率和制約犯第Ⅱ類錯誤(取偽錯誤)的概率?!窳硪环矫嬉惨⒁?α的選擇與判斷發(fā)生錯誤時要付出的代價大小有關(guān)。4.3兩正態(tài)均值差的推斷設(shè)x1,x2,…,xn是來自正態(tài)總體的一個樣本,y1,y2,…,ym是來自另一正態(tài)總體的一個樣本,且兩個樣本獨立(見圖4.3.1)。兩個正態(tài)均值μ1和μ2的比較常有如下三個檢驗問題:
Ⅰ.H0:μ1≤μ2
vs
H1:μ1>μ2
Ⅱ.H0:μ1≥μ2
vs
H1:μ1<μ2
Ⅲ.H0:μ1=μ2
vs
H1:μ1≠μ2這三個檢驗問題分別等價于如下三個檢驗問題:
Ⅰ.H0:μ1-μ2≤0
vs
H1:μ1-μ2>0
Ⅱ.H0:μ1-μ2≥0
vs
H1:μ1-μ2<0
Ⅲ.H0:μ1-μ2=0
vs
H1:μ1-μ2≠0由于兩個正態(tài)均值μ1與μ2常用各自的樣本均值
與
估計,其差的分布容易獲得:但該分布含有兩個多余參數(shù)
與,給尋找水平為α的檢驗帶來困難。目前在幾種特殊場合尋找到水平為α的檢驗,在一般場合,至今只尋找到水平近似為α的檢驗,水平精確為α的檢驗至今尚未找到,這在統(tǒng)計發(fā)展史上就是有名的Behrens-Fisher問題。對兩正態(tài)均值的推斷將分為兩種情況進行討論:(1)方差
與
已知;(2)方差
與
未知。本節(jié)討論(1)。4.3.1兩正態(tài)均值差的u檢驗(方差已知)
先考察如下檢驗問題:
H'0:μ1=μ2,
H1:μ1>μ2(4.3.2)在
與
已知場合,在H’0為真情況下,上述兩樣本均值差的分布為:
或因此可選用u作為檢驗統(tǒng)計量。在該檢驗中,拒絕域為W={u≥u1-α}經(jīng)討論可得,問題Ⅰ、Ⅱ、Ⅲ的拒絕域分別為:WⅠ={u≥u1-α}、WⅡ={u≤uα}、WⅢ={|u|≥u1-α/2}4.3.1兩正態(tài)均值差的u檢驗(方差已知)例4.3.1某開發(fā)商對減少底漆的烘干時間非常感興趣。將選擇兩種配方的底漆:配方1是原標(biāo)準(zhǔn)配方;配方2是在原配方中增加干燥材料,以減少烘干時間。開發(fā)商選20個相同樣品,其中10個涂上配方1的漆,另10個涂上配方2的漆。這20個樣品涂漆順序是隨機的,經(jīng)試驗,兩個樣本的平均烘干時間分別為=121分鐘和=112分鐘。根據(jù)經(jīng)驗,烘干時間的標(biāo)準(zhǔn)差都是8分鐘,不會受到新材料的影響?,F(xiàn)要在α=0.05下對新配方能否減少烘干時間作出檢驗。4.3.1兩正態(tài)均值差的u檢驗(方差已知)在兩正態(tài)總體方差
與
已知場合,其均值差μ1-μ2的1-α置信區(qū)間和置信限都可從相應(yīng)的水平α的檢驗(雙側(cè)或單側(cè))的接受域
,,獲得,也可以從如下的樞軸量獲得:兩條途徑得到相同結(jié)果?!瘭?-μ2的1-α置信區(qū)間為;●μ1-μ2的1-α置信下限為
;●μ1-μ2的1-α置信上限為4.3.1兩正態(tài)均值差的u檢驗(方差已知)上述置信區(qū)間或置信限還有兩個用途:(1)用置信區(qū)間作兩正態(tài)均值差檢驗很方便,只要查看區(qū)間[(μ1-μ2)L,(μ1-μ2)U],或[(μ1-μ2)L,∞),或(-∞,(μ1-μ2)U]中是否含有零點。若含有零點,則接受原假設(shè)H0,否則拒絕H0。(2)控制置信區(qū)間長度還可確定樣本量。例4.3.2某種飛機上用的鋁制加強桿有兩種類型,它們的抗拉強度(kg/mm2)都服從正態(tài)分布。由生產(chǎn)過程知其標(biāo)準(zhǔn)差分別為σ1=1.2與σ2=1.5。現(xiàn)要求兩類加強桿的平均抗拉強度之差μ1-μ2的0.90置信區(qū)間,使置信區(qū)間長度不超過2.5kg/mm2需要多少樣本量。*4.3.2控制犯兩類錯誤概率確定樣本量在雙側(cè)檢驗問題Ⅲ中,可用α課確確定犯第Ⅱ類錯誤的概率β,此時,可確定需要的樣本量為:在單側(cè)檢驗問題Ⅰ或Ⅱ中,在給定犯第Ⅱ類錯誤概率為β之下,所需的樣本量(n=m)為:
*4.3.2控制犯兩類錯誤概率確定樣本量例4.3.3為說明所需樣本量的計算,我們繼續(xù)考察例4.3.1。若兩真實平均烘干時間差δ=μ1-μ2=10分鐘,希望以概率0.9能檢測出這差異,這時犯第Ⅱ類錯誤概率β=1-0.9=0.1。在單側(cè)檢驗問題Ⅰ下,若取α=0.05,則所需樣本量n≈11。在上述諸條件下,要區(qū)分μ1和μ2間相距10分鐘需要樣本量n=m=11,兩個樣本共需22個樣品。若要區(qū)分μ1-μ2=9分鐘,需要樣本量為:n≈14。每個樣本量增加了3個。總樣本量為28,需增加6個,這是要檢驗的兩正態(tài)均值間距離縮小了的緣故。4.3.3兩正態(tài)均值差的t檢驗(方差未知)在兩個方差
與
都未知場合,兩正態(tài)均值差μ1-μ2的假設(shè)檢驗的研究要分幾種情況討論?!駜烧龖B(tài)方差未知但相等,即==σ2?!駜烧龖B(tài)方差未知且不等,即
≠
?!翊髽颖緢龊?即n與m都較大。下面將逐個討論,同時利用對偶關(guān)系指出μ1-μ2的置信區(qū)間與置信限。
4.3.3兩正態(tài)均值差的t檢驗(方差未知)1.==σ2若記兩相互獨立樣本的樣本均值分別為
與,則其差
其中共同方差σ2可用兩個樣本的合樣本作出估計,經(jīng)計算,可得σ2的一個無偏估計:因此,可構(gòu)造檢驗統(tǒng)計量4.3.3兩正態(tài)均值差的t檢驗(方差未知)對上述三個檢驗問題構(gòu)造水平為α的檢驗,其拒絕域分別為:
WⅠ={t≥t1-α(n+m-2)}
WⅡ={t≤tα(n+m-2)}(4.3.11)
WⅢ={|t|≥t1-α/2(n+m-2)}這些檢驗都稱為雙樣本t檢驗。使用這些t檢驗要有兩個前提:一是兩個總體都要是正態(tài)或近似正態(tài);二是方差相等。有一項研究成果值得參考,當(dāng)來自兩正態(tài)總體的兩樣本量相等(n=m)時,上述t檢驗對方差相等的假設(shè)是很穩(wěn)健的,或者說不很敏感,即兩個方差略有相差,t檢驗結(jié)果仍然是可信的。故在比較兩正態(tài)均值時盡量選擇樣本量相等去做。4.3.3兩正態(tài)均值差的t檢驗(方差未知)利用對偶關(guān)系,可立即由接受域,,寫出μ1-μ2的1-α置信區(qū)間。其中sw如式(4.3.8)所示。容易看出,μ1-μ2的1-α單側(cè)置信上限為:μ1-μ2的1-α單側(cè)置信下限為:4.3.3兩正態(tài)均值差的t檢驗(方差未知)例4.3.4某公司的生產(chǎn)中正在使用催化劑A,另一種更便宜的催化劑B問世。公司認為:使用催化劑B如果不能使收益明顯提高就繼續(xù)使用催化劑A。公司收益大小可用回收率表示。試驗車間為此各選8個樣品分別進行試驗,其回收率如表4.3.1所示。現(xiàn)要對兩種催化劑平均回收率μA與μB是否相等作出檢驗。
4.3.3兩正態(tài)均值差的t檢驗(方差未知)
4.3.3兩正態(tài)均值差的t檢驗(方差未知)2.≠
當(dāng)我們不能合理地假設(shè)未知方差
與
相等時,要檢驗兩均值相等至今尚無精確方法,下面敘述的是一較好的近似檢驗。若,兩者獨立,則故在μ1=μ2時:4.3.3兩正態(tài)均值差的t檢驗(方差未知)當(dāng)
與
分別用其無偏估計,代替后,記
(4.3.12)這時t*就不再服從N(0,1)分布了,也無理由說它服從t分布,但其形式很像t統(tǒng)計量。因此人們稱其為t化統(tǒng)計量,并設(shè)法用t統(tǒng)計量去擬合,結(jié)果發(fā)現(xiàn),取
(4.3.13)4.3.3兩正態(tài)均值差的t檢驗(方差未知)若l為非整數(shù)時取最接近的整數(shù),則t*近似服從自由度是l的t分布,即t*~t(l)。于是可用t*作為檢驗統(tǒng)計量,對上述三類檢驗問題分別得到如下拒絕域:
(4.3.14)
利用對偶關(guān)系,可從式(4.3.14)的對立事件寫出對應(yīng)的置信區(qū)間與置信限。具體是:μ1-μ2的近似1-α置信區(qū)間為:4.3.3兩正態(tài)均值差的t檢驗(方差未知)其中l(wèi)如式(4.3.13)所示。類似地,也可寫出μ1-μ2的近似1-α單側(cè)置信上限為:而μ1-μ2的近似1-α置信下限為:4.3.3兩正態(tài)均值差的t檢驗(方差未知)3.大樣本場合當(dāng)n與m都較大時,式(4.3.13)中的l也隨之增大,譬如在n=m=31時,可算得l≥30。大家知道,當(dāng)l≥30時自由度為l的t分布就很近似標(biāo)準(zhǔn)正態(tài)分布N(0,1),故在n與m都較大時,可將式(4.3.12)中的t*改記為u,且u近似服從N(0,1)。從而可用雙樣本的u檢驗得到上述三類檢驗問題的拒絕域:
(4.3.15)4.3.3兩正態(tài)均值差的t檢驗(方差未知)利用對偶關(guān)系,可從上述拒絕域,獲得接受域,最后改寫為置信區(qū)間與置信限。此時μ1-μ2的近似1-α置信區(qū)間為:類似可得μ1-μ2的近似1-α單側(cè)置信上限為:μ1-μ2的近似1-α單側(cè)置信下限為:4.3.3兩正態(tài)均值差的t檢驗(方差未知)4.3.3兩正態(tài)均值差的t檢驗(方差未知)例4.3.5設(shè)甲、乙兩種礦石中含鐵量分別服從N(μ1,)與N(μ2,)?,F(xiàn)分別從兩種礦石中各取若干樣品測其含鐵量,其樣本量、樣本均值和樣本無偏方差分別為:甲礦石:n=10,
=16.01,
=10.80乙礦石:m=5,
=18.98,
=0.27試在α=0.01水平下檢驗“甲礦石含鐵量不低于乙礦石的含鐵量”這種傳統(tǒng)看法是否成立。4.4成對數(shù)據(jù)的比較4.4.1成對數(shù)據(jù)的t檢驗在對兩正態(tài)均值μ1與μ2進行比較時有一種特殊情況值得注意。當(dāng)對兩個感興趣總體的觀察值是成對收集的時候,每一對觀察值(xi,yi)是在近似相同條件下而用不同方式獲得的,為了比較兩種方式對觀察值的影響差異是否顯著而進行多次重復(fù)試驗。例4.4.1為比較兩種谷物種子A與B的平均產(chǎn)量的高低,特選取10塊土地,每塊按面積均分為兩小塊,分別種植A與B兩種種子。生長期間的施肥等田間管理在20小塊土地上都一樣,表4.4.1列出各小塊土地上的單位產(chǎn)量。試問:兩種種子A與B的單位產(chǎn)量在顯著性水平α=0.05下有無顯著差別?4.4.1成對數(shù)據(jù)的t檢驗4.4.1成對數(shù)據(jù)的t檢驗在成對數(shù)據(jù)場合還有兩對單側(cè)檢驗問題:Ⅰ.H0:μd≤0,H1:μd>0Ⅱ.H0:μd≥0,H1:μd<0它們?nèi)钥墒褂萌缦聇統(tǒng)計量:其拒絕域分別為:
WⅠ={t≥t1-α(n-1)},
WⅡ={t≤tα(n-1)}利用對偶關(guān)系,可從上述諸拒絕域?qū)懗鰞烧龖B(tài)均值差的1-α置信區(qū)間4.4.1成對數(shù)據(jù)的t檢驗
例4.4.2某工廠的兩個實驗室每天同時從工廠的冷卻水中取樣,分別測定水中的含氯量各一次,表4.4.2給出了11天的記錄。試求兩實驗室測定的含氯量的均值差μd的0.95置信區(qū)間。4.4.2成對與不成對數(shù)據(jù)的處理在需要對兩正態(tài)均值進行比較時,數(shù)據(jù)收集有兩種方式:●不成對收集。兩總體常處于獨立狀態(tài),并不成對,常用雙樣本t檢驗?!癯蓪κ占?。兩總體常呈較強的正相關(guān)狀態(tài),常用單樣本t檢驗。在實際中我們在兩種數(shù)據(jù)收集方法的選擇上,要根據(jù)實際情況決定。譬如:●在個體差異較大時常用成對數(shù)據(jù)收集法,即在一個個體上先后作兩種不同處理,收集成對數(shù)據(jù)。●在個體差異較小,且施行兩種處理結(jié)果相關(guān)性也小時,可用獨立樣本采集方法(不成對數(shù)據(jù)收集方法)。這樣的方法可提高數(shù)據(jù)使用效率。4.4.2成對與不成對數(shù)據(jù)的處理
例4.4.3為了比較用于做皮鞋后跟兩種材料(A與B)的耐磨性能,選取15名成年在職男子,每人穿一雙新鞋,其中一只用材料A做后跟,另一只用材料B做后跟,每只后跟厚度都是10mm。一個月后再測厚度,所測數(shù)據(jù)列于表4.4.3中?,F(xiàn)要求對兩種材料是否同樣耐磨作出判斷。4.5正態(tài)方差的推斷4.5.1正態(tài)方差σ2的χ2檢驗設(shè)x1,x2,…,xn是來自正態(tài)總體N(μ,σ2)的一個樣本,關(guān)于正態(tài)方差σ2的檢驗問題常有如下三種形式:
Ⅰ.H0:σ2≤
vs
H1:σ2>
Ⅱ.H0:σ2≥
vs
H1:σ2<
Ⅲ.H0:σ2=
vs
H1:σ2≠
其中
是一個已知常數(shù)。對于以上三種情況,可選擇檢驗統(tǒng)計量4.5.1正態(tài)方差σ2的χ2檢驗上述三種情況的檢驗拒絕域如下圖所示:4.5.1正態(tài)方差σ2的χ2檢驗上述三個檢驗問題的水平為的檢驗統(tǒng)稱檢驗。綜合于表4.5.1中,如下表所示:4.5.1正態(tài)方差σ2的χ2檢驗關(guān)于χ2檢驗還應(yīng)指出下面幾個注釋。(1)上述所列的五個檢驗不僅用于正態(tài)方差檢驗,還可用于正態(tài)標(biāo)準(zhǔn)差檢驗,因為假設(shè)H‘0:σ≤σ0與假設(shè)H0:σ2≤
是等價的,故其檢驗法則也是相同的。(2)上述諸檢驗的p值亦可由卡方分布算得。(3)利用對偶關(guān)系,由各種檢驗問題的接受域改寫成正態(tài)方差σ2和正態(tài)標(biāo)準(zhǔn)差的置信限與置信區(qū)間。詳見表4.5.2。4.5.1正態(tài)方差σ2的χ2檢驗4.5.1正態(tài)方差σ2的χ2檢驗
例4.5.1某種導(dǎo)線的電阻服從N(μ,σ2),μ未知,其中一個質(zhì)量指標(biāo)是電阻標(biāo)準(zhǔn)差不得大于0.005Ω?,F(xiàn)從中抽取了9根導(dǎo)線測其電阻,測得樣本標(biāo)準(zhǔn)差s=0.0066,試問在α=0.05水平上能否認為這批導(dǎo)線的電阻波動合格?例4.5.2某光譜儀可測材料中各金屬含量(百分含量),為估計該臺光譜儀的測量誤差,特選出大小相同、金屬含量不同的5個試塊,設(shè)每一試塊的測量值都服從方差相同的正態(tài)分布,其均值可不同。如今對每一試塊各重復(fù)獨立地測量5次,分別計算各試塊的樣本標(biāo)準(zhǔn)差,它們是
s1=0.09,
s2=0.11,
s3=0.14,
s4=0.10,
s5=0.11試求光譜儀測量值標(biāo)準(zhǔn)差σ的0.95置信區(qū)間。4.5.1正態(tài)方差σ2的χ2檢驗*例4.5.3某種鋼板每塊重量X(單位:kg)服從正態(tài)分布,它有一項質(zhì)量指標(biāo)是鋼板重量的方差Var(X)不得超過0.018?,F(xiàn)從某天生產(chǎn)的鋼板中隨機抽取25塊,測其重量,算得樣本方差s2=0.025。(1)該鋼板重量的方差是否滿足要求。(2)求該種鋼板重量標(biāo)準(zhǔn)差σ的0.95置信區(qū)間。討論:這個置信區(qū)間長度為0.0965,廠方認為較大,若想把此置信區(qū)間長度縮小到0.05,其他不變,應(yīng)取多少樣本量為宜?4.5.2兩正態(tài)方差比的F檢驗設(shè)x1,x2,…,xn是來自正態(tài)總體N(μ1,)的一個樣本,y1,y2,…,ym是來自另一個正態(tài)總體N(μ2,)的一個樣本,且兩個樣本相互獨立。關(guān)于兩個正態(tài)方差比較常有如下三類檢驗問題:Ⅰ.H0:≤
vs
H1:>
Ⅱ.H0:≥
vs
H1:<
Ⅲ.H0:=
vs
H1:≠
此時,可選擇作為檢驗統(tǒng)計量。4.5.2兩正態(tài)方差比的F檢驗4.5.2兩正態(tài)方差比的F檢驗幾個注釋:(1)上述五個檢驗的拒絕域也適用相應(yīng)兩個正態(tài)標(biāo)準(zhǔn)差比的檢驗。(2)上述諸檢驗的p值亦可用F(n-1,m-1)分布算得。(3)利用對偶關(guān)系,可由各檢驗的接受域改寫為兩正態(tài)方差比的置信區(qū)間與置信限,對其開方即得兩正態(tài)標(biāo)準(zhǔn)差之比的置信區(qū)間和置信限。4.5.2兩正態(tài)方差比的F檢驗例4.5.4甲、乙兩臺機床分別加工某種機械軸,軸的直徑分別服從正態(tài)分布N(μ1,)與N(μ2,)。為比較兩臺機床的加工精度與平均直徑有無顯著差異,從各自加工的軸中分別抽取若干根軸測其直徑(單位:mm),結(jié)果如表4.5.4所示(取α=0.05)。4.6比率的推斷比率是指特定的一組個體(人或物等)在總體中所占的比例,如不合格品率、命中率、電視節(jié)目收視率、男嬰出生率、色盲率、某年齡段的死亡率、某項政策的支持率等。比率p是在實際中常遇到的一種參數(shù)。比率p可看做某二點分布b(1,p)中的一個參數(shù),若X~b(1,p),則X僅可能取0或1兩個值,且E(X)=p,Var(X)=p(1-p)。這一節(jié)將討論有關(guān)p的假設(shè)檢驗、置信區(qū)間與樣本量確定等統(tǒng)計推斷問題。其中比率p的置信區(qū)間在3.3節(jié)中已作詳盡討論,這里就不再重復(fù)了。4.6.1比率p的假設(shè)檢驗設(shè)x1,x2,…,xn是來自二點分布b(1,p)的一個樣本,其中參數(shù)p的檢驗常有如下三個類型:
Ⅰ.H0:p≤p0
vs
H1:p>p0
Ⅱ.H0:p≥p0
vs
H1:p<p0
Ⅲ.H0:p=p0
vs
H1:p≠p0其中p0給定。在樣本量n給定時,樣本之和(即累計頻數(shù))服從二項分布,即4.6.1比率p的假設(shè)檢驗下面分小樣本和大樣本兩種情況下對P的假設(shè)檢驗進行討論。1.小樣本方法
在檢驗問題Ⅰ中,犯第Ⅰ類錯誤(拒真錯誤)概率可用二項分布計算:在3.3節(jié)中曾指出:α(p)是p的增函數(shù),故要使上式成立只要控制p=p0處達到α即可,即
(4.6.1)上式最后使用不等號是由于T是離散分布之故,等式成立是罕見的。4.6.1比率p的假設(shè)檢驗類似的討論可知,檢驗問題Ⅱ的拒絕域WⅡ的臨界值c'是滿足如下不等式的最大正整數(shù):
(4.6.2)而檢驗問題Ⅲ的拒絕域WⅢ的第一個臨界值c1是滿足如下不等式的最大正整數(shù):
(4.6.3)而第二個臨界值c2是滿足如下不等式的最小正整數(shù):
(4.6.4)4.6.1比率p的假設(shè)檢驗例4.6.1在n=12,p0=0.4場合,分別確定上述三個檢驗問題的拒絕域。4.6.1比率p的假設(shè)檢驗2.大樣本方法在大樣本場合,二項概率計算困難,這時可用二項分布的正態(tài)近似,即當(dāng)T~b(n,p),E(T)=np,Var(T)=np(1-p),按中心極限定理,當(dāng)樣本量n較大時,當(dāng)p=p0時有
(4.6.6)這樣就把檢驗統(tǒng)計量T轉(zhuǎn)化為檢驗統(tǒng)計量u。由于u與T是同增同減的量,當(dāng)用u代替T時,三個檢驗問題的拒絕域形式不變。當(dāng)給定顯著性水平α后,下述三個檢驗問題的水平為α檢驗的拒絕域分別為:(其中u如式(4.6.6)所示)4.6.1比率p的假設(shè)檢驗WⅠ={u≥u1-α}WⅡ={u≤uα}WⅢ={|u|≥u1-α/2}在使用比率p的檢驗中所涉及數(shù)據(jù)都為成敗型數(shù)據(jù)(成功與失敗、合格與不合格等)。在很多場合都可大量收集,花費也不大,故比率p的大樣本u檢驗常被選用。使用中還需注意:不僅要樣本量n較大,還要求p不要很靠近0或1,且使np≥5和n(1-p)≥5都要滿足。4.6.1比率p的假設(shè)檢驗例4.6.2某廠的產(chǎn)品不合格品率不超過3%,在一次例行檢查中隨機抽檢200只,發(fā)現(xiàn)有8個不合格品,試問在α=0.05下能否認為不合格品率不超過3%?*4.6.2控制犯兩類錯誤概率確定樣本量在對比率p作檢驗時,控制犯兩類錯誤概率α與β可確定所需最少樣本量。這一小節(jié)將在大樣本場合討論這個問題。討論將對單側(cè)檢驗問題與雙側(cè)檢驗問題分別進行。1.對單側(cè)檢驗問題在單側(cè)檢驗的情況下,控制犯兩類錯誤概率α與β可確定所需最少樣本量為2.對雙側(cè)檢驗問題在單側(cè)檢驗的情況下,控制犯兩類錯誤概率α與β可確定所需最少樣本量為*4.6.2控制犯兩類錯誤概率確定樣本量例4.6.3某儀器廠向某電容器廠訂購大批量電容器,雙方約定:(1)當(dāng)電容器廠提供的產(chǎn)品的不合格品率p≤1%時,儀器廠應(yīng)以高概率0.95接受;(2)當(dāng)產(chǎn)品的不合格品率p≥2.4%時,儀器廠將以高于0.90的概率拒收。按此要求應(yīng)抽取多少產(chǎn)品進行檢驗才能保證雙方利益呢?4.6.3兩個比率差的大樣本檢驗
1.兩個比率差的假設(shè)檢驗兩個比率差的檢驗問題常有如下三種形式:Ⅰ.H0:p1-p2≤0,
H1:p1-p2>0Ⅱ.H0:p1-p2≥0,
H1:p1-p2<0Ⅲ.H0:p1-p2=0,
H1:p1-p2≠0其中p1與p2分別用各自樣本均值
給出估計。在n與m都很大的場合,與
都近似服從正態(tài)分布??紤]到兩樣本的獨立性,兩者之差也近似服從正態(tài)分布。4.6.3兩個比率差的大樣本檢驗可以證明:上述三種檢驗問題都在p1=p2時犯第Ⅰ類錯誤的概率最大,故只要在p1=p2=p處使犯第Ⅰ類錯誤的概率為α,就可獲得水平為α的檢驗。而在p1=p2=p時,可用合樣本的頻率來估計p,即用
(4.6.12)估計共同的P,這時可用如下的檢驗統(tǒng)計量:
(4.6.13)
4.6.3兩個比率差的大樣本檢驗對給定的顯著性水平α,前述三個檢驗問題的拒絕域分別為:
WⅠ={u≥u1-α}
WⅡ={u≤uα}
WⅢ={|u|≥u1-α/2}若設(shè)u0為從兩樣本用式(4.6.13)算得的檢驗統(tǒng)計量u的觀察值,則上述三個檢驗問題的p值分別為:
pⅠ=P(u≥u0)
pⅡ=P(u≤u0)
pⅢ=P(|u|≥|u0|)=2P(u≥|u0|)4.6.3兩個比率差的大樣本檢驗例4.6.4甲、乙兩廠生產(chǎn)同一種產(chǎn)品,為比較兩廠的產(chǎn)品質(zhì)量是否一致,現(xiàn)隨機從甲廠的產(chǎn)品中抽取300件,發(fā)現(xiàn)有14件不合格品,在乙廠的產(chǎn)品中抽取400件,發(fā)現(xiàn)有25件不合格品。在α=0.05水平下檢驗兩廠的不合格品率有無顯著差異。4.6.3兩個比率差的大樣本檢驗
2.兩個比率差的置信區(qū)間在大樣本場合,p1-p2的近似1-α置信區(qū)間為:而p1-p2的近似1-α單側(cè)置信上限為:p1-p2的近似1-α單側(cè)置信下限為:4.6.3兩個比率差的大樣本檢驗例4.6.5在一個由85個(汽車發(fā)動機用的)機軸組成的樣本中有10個表面加工較為粗糙而成為次品。對表面拋光進行改進,隨之又得75個機軸組成的第二個樣本,其中5件為次品。現(xiàn)要求兩個次品率差的95%置信區(qū)間。4.6.3兩個比率差的大樣本檢驗*3.控制犯兩類錯誤概率確定樣本量為確定起見,我們將在雙側(cè)檢驗問題下和兩樣本量相等n=m場合計算犯第Ⅱ類錯誤的概率β。根據(jù)算出的概率,可以得出樣本量n的表達式:4.6.3兩個比率差的大樣本檢驗例4.6.6在α=0.05與β=0.10場合,考察區(qū)分p1與p2所需的樣本量。此時u1-α/2=u0.975=1.96,u1-β=u0.9=1.282。以下為確定起見先考慮區(qū)別p1=0.01,p2=0.05時所需樣本量。
*4.7廣義似然比檢驗4.7.1廣義似然比檢驗設(shè)x=(x1,x2,…,xn)是來自密度函數(shù)p(x;θ)的一個樣本,而參數(shù)θ的似然函數(shù)記為L(θ;x)=p(xi;θ),其中參數(shù)空間為Θ={θ}。又設(shè)Θ0與Θ1為Θ的兩個非空不相交的子集(即Θ0∩Θ1=?),且Θ0∪Θ1=Θ??疾烊缦碌募僭O(shè)檢驗問題:
H0:θ∈Θ0
vs
H1:θ∈Θ1(4.7.1)設(shè)
是似然函數(shù)L(θ;x)在參數(shù)空間Θ上的最大似然估計,即
滿足
4.7.1廣義似然比檢驗又設(shè)
是似然函數(shù)L(θ;x)在原假設(shè)Θ0上的最大似然估計,即由于兩個似然函數(shù)值L(;x)與L(;x)都與θ無關(guān),且都是樣本x的函數(shù),故其比值也與θ無關(guān),也是樣本x的函數(shù),故是統(tǒng)計量,這個統(tǒng)計量稱為廣義似然比統(tǒng)計量。
4.7.1廣義似然比檢驗還可看出:λ(x)是檢驗統(tǒng)計量,因為λ(x)的大小能區(qū)分檢驗問題(4.7.1)中的原假設(shè)H0與備擇假設(shè)H1,在樣本x給定下,似然函數(shù)是θ出現(xiàn)可能性大小的一種度量。如今在廣義似然比統(tǒng)計量λ(x)中分母相對固
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《論孟選錄》課件
- 《保守力和勢能》課件
- TZJCFO 0002-2024 數(shù)據(jù)資產(chǎn)財務(wù)登記業(yè)務(wù)指南
- 2017年中國共產(chǎn)黨執(zhí)政歷史和人民的選擇
- 超級經(jīng)典21個哲理啟示寓言故事
- 《講課腦血管病》課件
- 江蘇省連云港市灌云縣2025屆高考數(shù)學(xué)倒計時模擬卷含解析
- 北京市朝陽區(qū)市級名校2025屆高考英語四模試卷含解析
- 2025屆遼寧省普通高中學(xué)高考臨考沖刺語文試卷含解析
- 山東省寧陽市2025屆高考沖刺押題(最后一卷)英語試卷含解析
- 中建塔樓幕墻屋面環(huán)軌拆卸專項施工方案
- 《化肥與種植業(yè)生產(chǎn)》課件
- 護理值班與交班制度
- 第15課《做個講公德的孩子》(課件)心理健康二年級上冊北師大版
- 《工業(yè)互聯(lián)網(wǎng)平臺規(guī)劃設(shè)計方案》
- 高職班家長會
- 《失血性休克查房》課件
- 機械CAD、CAM-形考任務(wù)三-國開-參考資料
- 2024年幼兒園衛(wèi)生保健工作總結(jié)(6篇)
- 紀檢監(jiān)察干部隊伍理論業(yè)務(wù)應(yīng)知應(yīng)會知識測試題庫
- 國測省測四年級勞動質(zhì)量檢測試卷
評論
0/150
提交評論