版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第八章 假設(shè)檢驗 假設(shè)檢驗是統(tǒng)計推斷的一個主要部分.在科學(xué)研究, 日常工作甚至生活中經(jīng)常對某一件事情提出疑問. 解決疑問的過程往往是先做一個和疑問相關(guān)的假設(shè), 然后在這個假設(shè)下去尋找有關(guān)的證據(jù).如果得到的證據(jù)是和假設(shè)相矛盾的, 就要否定這個假設(shè).8.1 假設(shè)檢驗的概念 當(dāng)總體分布函數(shù)完全未知或只知其形式、但不知其參數(shù)的情況,為推斷總體的性質(zhì),提出某些關(guān)于總體的假設(shè)。 為判斷所作的假設(shè)是否正確, 從總體中抽取樣本, 根據(jù)樣本的取值, 按一定的原則進行檢驗。 何為假設(shè)檢驗?最后, 作出接受或拒絕所作假設(shè)的決定. 其理論背景為實際推斷原理,即“小概率原理”,其想法和前面的最大似然類似:如果實際觀測到
2、的數(shù)據(jù)在某假設(shè)下不太可能出現(xiàn), 則認(rèn)為該假設(shè)錯誤。我們主要討論的假設(shè)檢驗的內(nèi)容有參數(shù)檢驗非參數(shù)檢驗: 總體均值、均值差的檢驗總體方差、方差比的檢驗分布擬合檢驗假設(shè)檢驗的理論依據(jù)例1: 一條新建的南北交通干線全長10公里.公路穿過一個隧道(長度忽略不計),隧道南面3.5公里, 北面6.5公里. 在剛剛通車的一個月中, 隧道南發(fā)生了3起交通事故, 而隧道北沒有發(fā)生交通事故,能否認(rèn)為隧道南的路面更容易發(fā)生交通事故?分析: p表示一起交通事故發(fā)生在隧道南的概率.p=0.35表示隧道南北的路面發(fā)生交通事故的可能性相同.p0.35表示隧道南的路面發(fā)生交通事故的概率比隧道北的路面發(fā)生交通事故的概率大. H0
3、: p=0.35. 再作一個備擇假設(shè) H1: p 0.35.在本問題中,如果判定H0不對,就應(yīng)當(dāng)承認(rèn)H1.-為了作出正確的判斷, 先作一個原假設(shè)檢驗: 三起交通事故的發(fā)生是相互獨立的。 如果H0為真, 則每一起事故發(fā)生在隧道南的概率都是0.35, 于是這三起交通事故都發(fā)生在隧道南的概率是 P= 0.353 0.043.這是一個很小的概率, 一般不容易發(fā)生. 所以我們否定H0, 認(rèn)為隧道南的路面發(fā)生交通事故的概率比隧道北大. 因為當(dāng)隧道南北的路面發(fā)生交通事故的概率相同, 而3起交通事故又都出現(xiàn)在隧道南時, 我們才犯錯誤。犯錯誤的概率正是P=0.043. 于是, 我們判斷正確的概率是1-0.043
4、=95.7%做出以上結(jié)論也有可能犯錯誤。(1) 根據(jù)問題的背景, 提出原假設(shè) H0: p=0.35, 及其備擇假設(shè) H1: p0.35.(2) 在H0 成立的假設(shè)下, 計算觀測數(shù)據(jù)出現(xiàn)的概率P. 如果P很小(一般用0.05衡量), 就應(yīng)當(dāng)否定H0, 承認(rèn) H1; 假設(shè)檢驗中的基本概念和檢驗思想注: 為了簡便, 我們把以上的原假設(shè)和備擇假設(shè)記作 H0: p=0.35 vs H1: p0.35. 其中的vs是versus的縮寫. 如果P不是很小, 也不必急于承認(rèn)H0, 這是因為證據(jù)往往還不夠充分. 如果繼續(xù)得到的觀測數(shù)據(jù)還不能使得P降低下來, 再承認(rèn)H0不遲. 例 2: 某產(chǎn)品的出廠檢驗規(guī)定: 次
5、品率 p 不超過4%才能出廠. 現(xiàn)從一萬件產(chǎn)品中任意抽查12件發(fā)現(xiàn)3件次品, 問該批產(chǎn)品能否出廠?若抽查結(jié)果發(fā)現(xiàn)1件次品, 問能否出廠?解: 提出原假設(shè)和備擇假設(shè)在H0成立時這不是 小概率事件, 沒理由拒絕原假設(shè)。在不準(zhǔn)備繼續(xù)抽樣的情況下,作出接受原假設(shè)的決定, 即該批產(chǎn)品可以出廠.這是 小概率事件, 故可認(rèn)為原假設(shè)不成立, 即該批產(chǎn)品次品率p0.04 , 則該批產(chǎn)品不能出廠.若抽查結(jié)果發(fā)現(xiàn)1件次品, 則在H0成立時參數(shù)檢驗的一般提法 一般來講, 設(shè)X1, X2,Xn是來自總體X的樣本, 是總體X的未知參數(shù), 但是已知 0 1, 它們是互不相交的參數(shù)集合. 對于假設(shè) H0: 0 vs H1:
6、1, 根據(jù)樣本,構(gòu)造一個檢驗統(tǒng)計量T 和檢驗法則: 若與T的取值有關(guān)的一個小概率事件W發(fā)生,則否定H0,否則接受H0,而且要求此時稱W為拒絕域,為檢驗水平。 -否定H0 解決假設(shè)檢驗的問題時, 無論作出否定還是接受原假設(shè)H0的決定, 都有可能犯錯誤. (1) H0為真, 統(tǒng)計推斷的結(jié)果否定H0, 犯第一類 錯誤, 犯該錯誤的概率不超過。(2) H0為假, 統(tǒng)計推斷的結(jié)果接受H0, 犯第二類 錯誤,我們記犯該錯誤的概率為。我們稱否定H0時犯的錯誤為第一類錯誤, 接受H0時犯的錯誤為第二類錯誤. 具體如下, 在正確的統(tǒng)計推斷前提下,犯錯誤的原因總是隨機因素造成的。要有效減少犯錯誤的概率,只好增加觀
7、測數(shù)據(jù),或在可能的情況下提高數(shù)據(jù)的質(zhì)量,這相當(dāng)于降低數(shù)據(jù)的樣本方差。 在例1.1中, 如果第一起交通事故發(fā)生后, 就斷定隧道南更容易發(fā)生交通事故, 犯第一類錯誤的概率是0.35.當(dāng)?shù)诙鸾煌ㄊ鹿拾l(fā)生后, 斷定隧道南更容易發(fā)生交通事故, 犯第一類錯誤的概率是0.352=0.1225.如果第四起交通事故又發(fā)生在隧道南, 否定p=0.35時犯第一類錯誤的概率是0.354=0.015.例1.:第一類錯誤與第二類錯誤的比較 一個有20多年教齡的教師聲稱他上課從來不“點名”. 如何判定他講的話是真實的? 確立原假設(shè)H0: 他沒有點過名, 然后再調(diào)查H0是否為真. 當(dāng)調(diào)查了他教過的3個班, 都說他沒有點過名
8、, 這時如果承認(rèn)H0, 犯錯誤的概率還是較大的. 當(dāng)調(diào)查了他教過的10個班, 都說他沒有點過名, 這時承認(rèn)H0 犯錯誤的概率會明顯減少。 如果調(diào)查了他教過的30個班, 都說他沒有點過名, 這時承認(rèn)H0犯錯誤的概率就會很小了??上д{(diào)查30個班是很難做到的! 反過來, 在調(diào)查中只要有人證實這位老師點過名, 就可以否定H0了(不論調(diào)查了幾個班), 并且這樣做犯錯誤的概率很小. 例1.2告訴我們, 要否定原假設(shè)H0是比較簡單的, 只要觀測到了H0下小概率事件就可以。 要承認(rèn)H0就比較費力了: 必須有足夠多的證據(jù)(樣本量), 才能夠以較大的概率保證H0的真實. 一般情況下,原假設(shè)應(yīng)當(dāng)和已有的事實相悖,以
9、利于得到否定原假設(shè)的結(jié)果。假設(shè)檢驗步驟(三部曲) 根據(jù)實際問題所關(guān)心的內(nèi)容,建立H0與H1。(原假設(shè)應(yīng)當(dāng)和已有的事實相悖) 假設(shè)H0為真時,選擇合適的統(tǒng)計量T, 并確定檢驗水平為 的拒絕域。 根據(jù)樣本值計算,并作出相應(yīng)的判斷.8.2 正態(tài)均值的假設(shè)檢驗A. 已知 時, 的正態(tài)檢驗法例 4: 一臺方差是0.8克的自動包裝機在流水線上包裝凈重500克的袋裝白糖. 現(xiàn)隨機抽取了9袋白糖, 測得凈重如下(單位:克): 499.12 499.48 499.25 499.53 500.82 499.11 498.52 500.01 498.87. 能否認(rèn)為包裝機在正常工作? 分析: 9袋白糖中有7袋凈重少
10、于500克, 似乎凈重0=500不對. 但是, 方差是0.8克, 也可能是由于包裝機的隨機誤差導(dǎo)致了以上的數(shù)據(jù).解: 將包裝機包裝的袋裝白糖的凈重視為總體X, 則X N ( 2), 其中2 =0.8已知,未知. 在H0下, 用Xj表示第 j 袋白糖的凈重, 則X1,X2,X9是來自總體X的n=9個樣本. 提出假設(shè) H0: =0 vs H1: 0. 若要求對于標(biāo)準(zhǔn)正態(tài)分布,c應(yīng)為其上/2分位數(shù)z/2,于是拒絕域為本例中,如果取=0.05, 則 根據(jù)抽樣數(shù)據(jù),得|z| = 1.97時, 小概率事件發(fā)生了, 于是否定原假設(shè)H0. 在例4中,稱為檢驗的顯著性水平, 簡稱為顯著性水平, 檢驗水平, 或水
11、平(level); Z稱為檢驗統(tǒng)計量; |Z| z/2稱為檢驗的拒絕域或否定域; -由于這種檢驗方法是基于正態(tài)分布的方法, 所以又稱為正態(tài)檢驗法或Z檢驗法.- 拒絕域是一個事件, 它的發(fā)生與否由|Z|, 從而由觀測樣本X1,X2,.,Xn決定.- 如果事件|Z| z/2發(fā)生了, 就稱檢驗是顯著的. 這時否定H0, 犯第一類錯誤的概率不超過。 在例4中, 如果取檢驗水平 =0.04, 則臨界值z /2 =2.054 . 這時|z|=1.972.054, 不能否定H0. 這說明在不同的檢驗水平下可以得到不同的檢驗結(jié)果. 降低犯第一類錯誤的概率, 就會使得拒絕域減小,從而拒絕H0的機會變小,接受H0
12、的機會變大。 0 0 0 0 0正態(tài) 檢驗法 (2 已知)原假設(shè) H0備擇假設(shè) H1檢驗統(tǒng)計量及其H0為真時的分布拒絕域 在例4中, 從實際數(shù)據(jù)計算得到 |z|=1.97. 如果拒絕域取成 |Z| 1.97, 則剛剛能夠拒 絕H0. 這時犯第一類錯誤的概率是 P=P(|Z|1.97)=0.0488. 我們稱P=0.0488是檢驗的P值(P-value). B. P 值檢驗法 P值越小, 數(shù)據(jù)提供的否定H0的證據(jù)越充分.如果檢驗的顯著性水平是事先給定的, 當(dāng)P值小于等于, 就要否定H0.C.未知時,均值 的t 檢驗法例 5: 在例4中如果9個袋裝白糖的樣品是從超級市場倉庫中隨機抽樣得到的, 能否
13、認(rèn)為這批500克袋裝白糖的平均重量是500克? 標(biāo)準(zhǔn)差未知, 可用樣本標(biāo)準(zhǔn)差S代替.解: 對0=500克, 仍作假設(shè) H0: = 0 vs H1: 0.在H0下, 從 7.3節(jié)的定理3.6知道檢驗統(tǒng)計量 說明在H0下, T在0附近取值是正常的, 如果|T|取值較大就應(yīng)當(dāng)拒絕H0. 根據(jù)分位數(shù)t/2(n-1)的性質(zhì), 有 P(|T| t/2(n-1)= .于是H0的顯著性水平為的拒絕域是 |T| t/2(n-1) 取=0.05, 查表得到t0.05/2(8)=2.306. 拒絕域為 作出以上判斷也有可能犯錯誤, 但是犯錯誤的概率不超過 0.05.經(jīng)過計算得到 S=0.676, |T|= 2.60
14、9 2.306, 所以應(yīng)當(dāng)否定H0, 認(rèn)為500. D.未知時,均值 的單邊檢驗法例6:在例5中, 抽查的9袋白糖的平均重量為499.412克可以引起我們的懷疑. 這批袋裝白糖的平均重量是否不足呢? 解:為了解決這個問題, 我們提出假設(shè) H0: 500 vs H1: 500 如果否定了H0, 就認(rèn)定這批袋裝白糖的份量不足. 由于在H0下, 不知道 的具體值, 所以T的分布是未知的. 但是這時有H0: 500 vs H1: 500因為 P(T -t(n-1) P( T0 -t(n-1)= , 所以可以構(gòu)造拒絕域為 T -t(n-1)當(dāng)T -t(n-1), 應(yīng)當(dāng)否定H0 在本例中, 查表得到-t0
15、.05(8)=-1.86, T=-2.609-1.86, 所以應(yīng)當(dāng)否定H0. 認(rèn)定這批袋裝白糖的分量不足。這時, 犯錯誤的概率不超過0.05. 由于這種檢驗方法是基于t分布的方法, 所以又稱為t 檢驗法.注意:由于 ,故原假設(shè)通常設(shè)為 500,易被拒絕,以便得出顯著性結(jié)論。 同理,對于來自總體的樣本未知時,在檢驗水平假設(shè)這時在H0下有下,因此,所以,原假設(shè)的拒絕域為分析例2.1和2.3的問題背景就會看出, 在例2.1中應(yīng)當(dāng)作雙邊檢驗因為多裝和少裝白糖都是不符合生產(chǎn)標(biāo)準(zhǔn)的.在例2.3中只需要作單邊檢驗因為超市只需要知道袋裝白糖不缺斤少兩就夠了. 0 0 0 0 0T 檢驗法 ( 2 未知)原假設(shè) H0備擇假設(shè) H1檢驗統(tǒng)計量及其H0為真時的分布拒絕域例7: 某廠生產(chǎn)小型馬達(dá), 其說明書上寫著: 這種小型馬達(dá)在正常負(fù)載下平均消耗電流不會超過0.8 安培. 現(xiàn)隨機抽取16臺馬達(dá)試驗, 求得平均消耗電流為0.92安培, 消耗電流的標(biāo)準(zhǔn)差為0.32安培. 假設(shè)馬達(dá)所消耗的電流服從正態(tài)分布, 取顯著性水平為 = 0.05, 問根據(jù)這個樣本, 能否否定廠方的斷言?解 根據(jù)題意待檢假設(shè)可設(shè)為 H0 : 0.8 vs H1 : 0.8 未
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度智能城市建設(shè)項目承包合同4篇
- 2025年度智能水電安裝與維護一體化承包合同范文4篇
- 2024版廣告合同購銷
- 2025年度建筑節(jié)能環(huán)保材料研發(fā)與應(yīng)用合同2篇
- 2025年度企業(yè)內(nèi)部采購人員廉潔自律合作協(xié)議3篇
- 2025年度特種車輛充電樁定制與安裝合同4篇
- 2024鐵路客運服務(wù)合同范本3篇
- 2025年度智慧城市建設(shè)項目承包合同規(guī)范3篇
- 2025年度智能農(nóng)業(yè)化肥代銷合作協(xié)議范本4篇
- 中國藍(lán)寶石襯底材料行業(yè)市場調(diào)查研究及發(fā)展戰(zhàn)略規(guī)劃報告
- 2023年上海英語高考卷及答案完整版
- 西北農(nóng)林科技大學(xué)高等數(shù)學(xué)期末考試試卷(含答案)
- 金紅葉紙業(yè)簡介-2 -紙品及產(chǎn)品知識
- 《連鎖經(jīng)營管理》課程教學(xué)大綱
- 《畢淑敏文集》電子書
- 頸椎JOA評分 表格
- 員工崗位能力評價標(biāo)準(zhǔn)
- 定量分析方法-課件
- 朱曦編著設(shè)計形態(tài)知識點
- 110kV變電站工程預(yù)算1
- 某系統(tǒng)安全安全保護設(shè)施設(shè)計實施方案
評論
0/150
提交評論