版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、假設檢驗的任務與基本原理及實例分析12目錄假設檢驗的任務與基本原理假設檢驗的基本思想假設檢驗的一般步驟假設檢驗的兩類錯誤實例分析3 上章介紹的參數(shù)估計理論,是利用樣本構造適當?shù)慕y(tǒng)計量對總體的未知參數(shù)進行估計。 在實際應用中,有另一類問題是對總體參數(shù)或總體分布提出一個命題,然后根據(jù)樣本對該命題的真假性作出判斷。如判斷有關早稻的平均畝產(chǎn)量的某一命題是否為真;如判斷某種產(chǎn)品的次品率是否符合要求;再如判斷某種建筑材料的抗斷強度指標Y 是否服從正態(tài)分布等。引言4 引例1 生產(chǎn)流水線上的袋裝糖果的重量服從正態(tài)分布,按規(guī)定袋裝糖果的重量的均值應為0.5(千克)。一批袋裝糖果出廠前進行抽樣檢查,抽查了5袋,質(zhì)
2、量分別為:,。問這一批袋裝糖果是否合格? 可該例關心的問題歸結為一個理論問題:總體分布N(, 2),參數(shù)未知。要根據(jù)抽得的樣本值對命題袋裝糖果是否合格,即 = 0,記作H0,作出“是”或“否”的判斷。 H0稱為一個統(tǒng)計假設,具體的判斷規(guī)則稱為該假設的一個檢驗。5 引例2. 某廠有一大批產(chǎn)品,按規(guī)定次品率不得超過3%才能出廠,今從中隨機地抽取50件。發(fā)現(xiàn)有4件次品。問這批產(chǎn)品能否出廠? 本例關心的問題是:如何根據(jù)抽樣所得的次品頻率fA /n=4/50,來推斷整批產(chǎn)品的次品率是否超過了3%。即要檢驗假設H0: 次品率 p 3%,是否成立。6 引例3. 在一實驗中,每隔一定時間間隔觀察一次計數(shù)器上記
3、錄的某種鈾放射出的 粒子的個數(shù)X,獨立觀察100次的數(shù)據(jù)如下: i 0,1,2, 3, 4, 5, 6, 7,8,9,10,11 fi 1,5,16,17,26,11,9, 9,2, 1,2, 1其中fi 是觀察到有i個 粒子的個數(shù)。試問X是否服從泊松分布。 該例題要檢驗的假設H0是:總體 X 服從“泊松分布”是否成立?7 假設檢驗可分為兩種:如引例1引例2是關于參數(shù)的假設檢驗, 即是總體分布的類型已知,但含有有限個未知參數(shù),這樣關于總體分布的假設檢驗問題就可轉(zhuǎn)化為關于分布中未知參數(shù)的假設檢驗了。另一種是非參數(shù)假設檢驗。即是關于總體分布的假設檢驗不能轉(zhuǎn)化成分布中未知參數(shù)的假設檢驗。如引例3是非
4、參數(shù)假設檢驗是有關總體分布的假設檢驗。 8 第八章 假設檢驗這類問題稱作假設檢驗問題 . 在本節(jié)中,我們將討論不同于參數(shù)估計的另一類重要的統(tǒng)計推斷問題. 這就是根據(jù)樣本的信息檢驗關于總體的某個假設是否正確.假設檢驗參數(shù)假設檢驗非參數(shù)假設檢驗總體分布已知,檢驗關于未知參數(shù)的某個假設總體分布未知時的假設檢驗問題9一、假設檢驗的任務與基本原理1、分類及基本任務參數(shù)檢驗:在總體分布類型已知的的前提下對總體參數(shù)及有關性質(zhì)進行判斷。非參數(shù)檢驗:總體分布的類型部分或全部未知,檢驗的目的是作出一般性的推斷,如分布的類型,兩變量是否獨立,分布是否相同等。10問題的提出對總體分布中的某些未知參數(shù)或分布的形式作某種
5、假設,然后通過抽取的樣本,對假設的正確性進行判斷的問題,稱為假設檢驗問題.同參數(shù)估計一樣,假設檢驗是數(shù)理統(tǒng)計的主要內(nèi)容之一.在實際中,有很多這樣的問題需要人們?nèi)ソ鉀Q.11例1 某藥廠生產(chǎn)一種抗菌素,已知在正常生產(chǎn)情況下,每瓶抗菌素的某項主要指標服從均值為的正態(tài)分布.某日開工后,測得5瓶的數(shù)據(jù)如下:,問該日生產(chǎn)是否正常?用表示該日生產(chǎn)的一瓶抗菌素的某項主要指標.如果已知N(a,),那么問題就是要檢驗假設“a=23”是否成立.12例2 為了研究一種新化肥對種植小麥的效力,選用13塊條件相同面積相等的土地進行試驗,各塊產(chǎn)量如下(單位:公斤): 施肥的:34,35,30,33,34,32; 未施肥的:
6、29,27,32,28,32,31,31.問這種化肥對小麥產(chǎn)量是否有顯著影響?用與分別表示在一塊土地上施肥與未施肥情況下小麥的產(chǎn)量.如果已知它們分別服從N(a1,1)與N(a2,2)分布,那么問題就是檢驗假設“a1= a2”是否成立?13例3 認為某電話交換臺在某段時間接到的呼叫次數(shù)服從泊松分布,是否正確,如何判斷.14例1和例2這樣一類假設是在總體分布類型已知的情況下,僅僅涉及到未知參數(shù)的統(tǒng)計假設,稱為參數(shù)假設.例3這樣一類假設是在未知總體分布類型的情況下,對總體分布類型或者總體分布的某些特性提出的統(tǒng)計假設,稱為非參數(shù)假設.15這些例子所代表的問題是很廣泛的,其共同點就是先對總體分布中某些參
7、數(shù)或?qū)傮w分布的類型作某種假設,然后根據(jù)抽取的樣本值作出拒絕還是不拒絕所作假設的結論.今后,把對總體的分布所作的假設用H0表示,并稱為原假設或零假設(null hypothesis).為了評價一個檢驗的好壞,除了要考慮原假設H0外,還需要同時考慮另外一個備選的假設H1, H1稱為對立假設或者備擇(選)假設(alternative hypothesis).16假設檢驗問題的一般提法是,在給定的備擇假設H1下對原假設H0作出判斷,若拒絕原假設H0,那就意味著接受備擇假設H1,否則就不拒絕原假設H0.稱之為對H0的顯著性檢驗.在對假設H0的檢驗中,需要從樣本出發(fā),建立一個法則,一旦樣本值確定后,利用
8、所制定的法則,即可作出是拒絕H0還是不拒絕H0的結論.17如何確定原假設和對立假設? 原假設H0是研究的起點,在沒有其他 信息情況下原假設被看作可被 可接受的真實狀態(tài)。由于檢驗方法是概率意義下的反證法,所以拒絕原假設是有說服力的,而接受原假設是沒有說服力的,因此應該把希望否定的假設放在原假設。比如有的結果已經(jīng)經(jīng)歷了長時間的考驗不應該輕易否定,就可以放在原假設。對立假設H1通常我們真正的感興趣的,接受對立假設可能意味著某種特別意義的結論,或某種重要的決斷,因此對統(tǒng)計作判斷前,在處理H0時總是偏于是保守,在沒有充分的證據(jù)時,不應該輕易拒絕H0,或者不能輕易接受H1。如何確定原假設與對立假設,這與個
9、人的著眼點有關,有時交換原假設與對立假設,會得出截然相反的檢驗結論。18二、假設檢驗的基本思想假設檢驗使用的是概率反證法思想,先對檢驗的對象提出某種假設,然后根據(jù)抽樣結果,利用小概率原理(小概率事件在一次試驗或現(xiàn)象中是幾乎不可能發(fā)生的)作出拒絕或者接受假設的判斷。19 假設檢驗的基本思想方法 1. 假設檢驗推理的理論根據(jù)是:“實際統(tǒng)計推斷原理”(小概率原理)- 即認為概率很小的事件在一次實驗中幾乎(一般)是不會發(fā)生的。在概率論中介紹了伯努利大數(shù)定律,即對任意 0, 該定律說明當獨立重復試驗次數(shù)n充分大時,某事件A發(fā)生的頻率fA /n與事件A發(fā)生的概率 p 非常接近。p很小,如p,大約100次試
10、驗 A可能發(fā)生一次,顯然一次試驗n=1中,A發(fā)生的可能性幾乎是0。20 小概率原理是在長期大量實踐中總結出來的原理,是人們在實踐中廣泛采用的一個原理,也叫實際統(tǒng)計推斷原理。 概率小到什么程度才叫小概率事件呢?在假設檢驗中,一般把概率不超過,或等的事件,稱為小概率事件。21 2. 假設檢驗的基本思想方法是基于具有概率性質(zhì)的反證法。類似于純粹數(shù)學中的反證法,我們可先假定要檢驗的假設 H0 正確,并在此前提下,構造一個適當?shù)男「怕适录?。根?jù)實際推斷原理,概率很小的事件在一次試驗中一般是不發(fā)生的。因此,在H0正確的基礎上,如果得到的數(shù)據(jù)表明這個小概率事件發(fā)生了,它與小概率原理相矛盾,說明H0正確的假定
11、很可能是錯誤的,應拒絕該假設;如果沒有發(fā)生,則無法拒絕H0,此時,一般是接受該假設,也可根據(jù)問題作進一步研究。22 例1: 設有一大批產(chǎn)品,要檢驗這批產(chǎn)品的次品率p是否是?從這批產(chǎn)品中隨機地取出5件產(chǎn)品檢查,有4件次品,1件正品,依此樣本如何判斷p是否是0.1. 解:先做假設, 記 H0: p。在H0為真的條件下計算P (5件產(chǎn)品中有4件次品1件正品) 但是事件A發(fā)生了,這與“小概率原理”矛盾。在H0為真的條件下上述計算是正確的,所以矛盾的產(chǎn)生認為是由H0造成的,故應否定,認為p。23 由上述討論看出:為了檢驗H0是否成立,先假定H0 成立,再由抽樣所提供的信息,看是否有不合理的事情發(fā)生。如果
12、在H0 為真的條件下,計算都是正確的,但小概率事件發(fā)生了,產(chǎn)生了不合理現(xiàn)象,這說明假設不正確,這時要拒絕H0 或否定H0 。如果小概率事件沒有發(fā)生,沒有產(chǎn)生不合理的現(xiàn)象,就沒有充分的理由否定H0 ,就不能拒絕H0 ,這時稱H0 相容,可以認為H0 成立。這就是假設檢驗的基本思想。24P81 例8.1.1 某工廠金工車間生產(chǎn)一種鉚釘,鉚釘直徑的標準定為a0=2cm. 現(xiàn)為提高產(chǎn)量,采用了一種新工藝,現(xiàn)從新工藝生產(chǎn)的鉚釘中隨機抽取100個,分別測其直徑,計算得平均值 . 問: 與a0之間的差異,純粹是試驗或測試的誤差造成的,還是反映了工藝條件的改革使得鉚釘直徑發(fā)生了顯著性的變化.25分析:假定鉚釘
13、直徑N(a ,02) (標準為a0=2cm.0已知) 與a0之間的差異: 的產(chǎn)生有兩種原因: 一是試驗或測試的誤差造成的, 二是工藝條件的改革使得鉚釘直徑發(fā)生了顯著性變化.抽樣的總體N(a0 ,0)抽樣的總體N(a , 02), aa026問題歸結為:提出假設: 原(零)假設H0: a=a0 (2cm) 備擇假設H1: aa0 考慮差異: , 進一步的, 在原假設H0成立的情況下,認為樣本取自總體 :N(a0 ,02)2728假設檢驗的基本思想是以小概率原理作為拒絕假設H0的依據(jù).具體一點說,設有某個假設H0要檢驗,先假設H0是正確的,在此假定下,構造一個概率不超過 (08000 按照新菜單運
14、營的平均營業(yè)額比按照老菜單運營的平均營業(yè)額低: 8000 按照新老菜單運營的平均營業(yè)額有顯著差別: 8000 我們從中選擇一個命題作為拋棄H0 后可供選擇的命題,記為H1 ,如: H1: 8000, 稱其為備擇假設36在該例中,我們采用如下兩個命題H0 : = 0=8000 原假設H1 : 0=8000 備擇假設37(2) 我們的做法是:先假定H0 為成立,然后用樣本(X1, Xn)去判斷其真?zhèn)巍?由于樣本(X1, Xn)所含信息較分散,因此需要構造一個統(tǒng)計量T(X1, Xn)來做判斷,稱該統(tǒng)計量為檢驗統(tǒng)計量。假設檢驗的任務是判斷H0 是否為真。 尋找檢驗統(tǒng)計量T(X1, Xn) 在本例中,我
15、們用樣本均值 作為檢驗統(tǒng)計量。38 檢驗法則: 當 T(x1, xn)C 時拒絕H0,否則接受H0令W=(x1, xn) :T(x1, xn) C ,稱其為檢驗的拒絕域,它的邊界點稱為檢驗的臨界點令A=(x1, xn) :T(x1, xn) C ,稱其為檢驗的接受域 在本例中,當假定 H0 為真時,即 H0: = 8000 時, 的觀測值 應該圍繞在8000附近。如果遠離8000,那么就有理由懷疑H0不真。如今8300離8000算近還是算遠?或者, 與8000差別多遠,才能拒絕H0 ?這就需要一個界限,記為c:39 在本例中,當假定 H0 為真時,即 H0: = 8000 時, 的觀測值 應該
16、圍繞在8000附近。如果遠離8000,那么就有理由懷疑H0不真。如今8300離8000算近還是算遠?或者, 離8000差別多遠,才能拒絕H0 ?這就需要一個界限,記為c:當 | 8000 | c 時,拒絕 H0 ;當 | 8000 | c 時,接受 H0 ; 這里 c 是檢驗的臨界值,拒絕域為W=(x1,xn): | 8000 | c , 接受域為 A=(x1,xn): | 8000 | c 40 在假設檢驗中,人們總是關心拒絕域,這是因為如今我們手中只有一個樣本,用一個樣本去證明一個命題是正確的,在邏輯上是不充分的;但用一個反例(如樣本)去推翻一個命題,理由是充足的。當不能否定原假設H0時,
17、只能將原假設H0當作為真保留下來。41(3) 顯著水平與臨界值 由于是依據(jù)一個樣本對H0真假與否作出判斷的,當實際 H0為真時仍有可能作出拒絕H0的判斷,這是一種錯誤。我們無法排除犯這類錯誤的可能性,因此自然希望將犯這類錯誤的概率控制在一定的限度內(nèi),即給出一個較小的數(shù)(0 1),使P(拒絕H0| H0為真 ) 稱為檢驗的顯著水平 根據(jù)上式確定檢驗的臨界點42在本例中, 要使P(拒絕H0| H0為真 )= 我們看其中的含義:這里 “H0: =0=8000”為真,即指樣本 X1,X9 實際來自總體 N(8000, 6402), 此時根據(jù)檢驗法則: P(拒絕H0| H0為真)本例檢驗法則:當 | 8
18、000 | c 時,拒絕 H0 43“H0: =0=8000”為真,由分位數(shù)的定義,有: P(拒絕H0| H0為真)即 于是本例的拒絕域為 44由于 若取 ,則在H0為真時,事件 為小概率事件。通常在一次試驗中,小概率事件是難以發(fā)生的。倘若該小概率事件在一次試驗中發(fā)生了,人們就有理由懷疑 不是一個小概率事件。這一矛盾導致人們不相信原假設H0為真,從而否定原假設。45于是本例的檢驗法則為:-當 | 8000 | (640/3)u/2 時,拒絕 H0 ;-當 | 8000 | (640/3)u/2 時,接受 H0 ;具體地,計算9天的平均營業(yè)額,查表, u/2= u。由于所以接受H0,認為新菜單對
19、平均每天的營業(yè)額沒有顯著影響。46假設檢驗中的基本概念(1)假設:關于總體分布的某個命題(2)原假設:把需要檢驗的假設稱為原假設, 記為H0(3)備擇假設:在拒絕原假設后,可供選擇的 一個命題稱為備擇假設,它可以是原假 設對立面的全體,或其中的一部分,記為H147(4)檢驗統(tǒng)計量:用于判斷原假設成立與否的統(tǒng)計量稱為檢驗統(tǒng)計量。(5)拒絕域:使原假設H0 被拒絕的樣本觀測值所組成的區(qū)域稱為檢驗的拒絕域 接受域:保留原假設H0的樣本觀測值所組成的區(qū)域稱為檢驗的接受域48(6)顯著水平:控制P(拒絕H0| H0為真 ) 中的 稱為檢驗的顯著水平。拒絕域(否定域):49四、假設檢驗的兩類錯誤從上面的討
20、論可以看出,處理假設檢驗問題的推理方法類似于數(shù)學中的反證法,即假設命題H0成立,如果推出了矛盾,則否定命題H0.但是,這里又區(qū)別于數(shù)學中的反證法,因為在作出拒絕的結論時,所依據(jù)的矛盾并不是形式邏輯下絕對的矛盾,而是基于小概率原理,即認為在一次實驗中小概率事件A實際不可能出現(xiàn).人們對假設H0作出判斷的依據(jù)是在一次實驗中看小概率事件A是否出現(xiàn),而小概率事件A是否出現(xiàn)又是由一次抽樣的結果來判斷的,由于抽樣的隨機性,人們無論拒絕H0,還是接受H0,都不會百分之百正確,有可能犯以下兩類錯誤:50 第一類錯誤:原假設H0為真,但由于樣本的隨機性,使樣本觀測值落入拒絕域,從而作出拒絕H0的結論,這類錯誤稱第一類錯誤,它發(fā)生的概率稱為犯第一類錯誤的概率,也稱為“拒真概率”。等于顯著水平P(拒絕H0| H0為真 ) = PT(x1, xn) C| H0為真= P(x1, xn) W | H0為真 = 51 第二類錯誤:原假設H0為假,但由于樣本的隨機性,使樣本觀測值落入接受域,從而作出保留H0的結論,這類錯誤稱第二類錯誤,它發(fā)生的概率稱為犯第二類錯誤的概率,也稱為“取偽概率”。P(接受H0| H0為假 )= P接受H0 | H1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度長租公寓合作開發(fā)合同范本
- 五金采購合同范本標準版
- 2025年度旅游項目合作終止合同協(xié)議書
- 二零二五年度彩鋼房屋頂雨水收集利用合同3篇
- 2025年度會議餐飲服務合同匯編
- 2025年度教育培訓合同延期補充協(xié)議范本
- 2025年度會議室租賃及場地布置合同范本
- 2025年度貨運代理報關服務合同范本(年度修訂)
- 二零二四年度企業(yè)融資授信擔保合同模板3篇
- 2025年度化妝品行業(yè)綠色生產(chǎn)技術合作合同
- 2025年方大萍安鋼鐵招聘筆試參考題庫含答案解析
- 2025年電力工程施工企業(yè)發(fā)展戰(zhàn)略和經(jīng)營計劃
- 2024東莞市勞動局制定的勞動合同范本
- 2024年大學本科課程教育心理學教案(全冊完整版)
- 主題二任務二 《探究身邊信息技術的奧秘》 教學設計 2023-2024學年桂科版初中信息技術七年級上冊
- 中國血管通路專家共識解讀
- 開學前幼兒園安全培訓
- 《裝配式蒸壓加氣混凝土外墻板保溫系統(tǒng)構造》中
- 《建設工程監(jiān)理》課件
- 2019版新人教版高中英語必修+選擇性必修共7冊詞匯表匯總(帶音標)
- 中層領導的高績效管理
評論
0/150
提交評論