第十二章假設(shè)檢驗(yàn)_第1頁
第十二章假設(shè)檢驗(yàn)_第2頁
第十二章假設(shè)檢驗(yàn)_第3頁
第十二章假設(shè)檢驗(yàn)_第4頁
第十二章假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第十二章 假設(shè)檢驗(yàn),假設(shè)檢驗(yàn)的基本原理 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),第十二章 假設(shè)檢驗(yàn),假設(shè)檢驗(yàn)是對總體的分布函數(shù)的形式或分布中某些參數(shù)做出某種假設(shè),然后通過抽取樣本,構(gòu)造適當(dāng)?shù)慕y(tǒng)計量,對假設(shè)的正確性進(jìn)行判斷的過程,前面我們討論了在總體分布族已知的情況下,如何根據(jù)樣本去得到參數(shù)的優(yōu)良估計.但有時,我們并不需要估計某個參數(shù)的具體值而只需驗(yàn)證它是否滿足某個條件,這就是統(tǒng)計假設(shè)檢驗(yàn)問題,第十二章 假設(shè)檢驗(yàn),假設(shè)檢驗(yàn),參數(shù)假設(shè)檢驗(yàn),非參數(shù)假設(shè)檢驗(yàn),總體分布已知, 檢驗(yàn)關(guān)于未知參數(shù) 的某個假設(shè),總體分布未知時的 假設(shè)檢驗(yàn)問題,第一節(jié) 檢驗(yàn)的基本原理,一、檢驗(yàn)問題的提法 假設(shè)檢驗(yàn)是既同估計密切聯(lián)系,但又

2、有重要區(qū)別的一種推斷方法。 例如:某種電子元件壽命X服從參數(shù)為的指數(shù)分布,隨機(jī)抽取其中的n件。測得其壽命數(shù)據(jù), 問題,這批元件的平均壽命是多少? 問題,按規(guī)定該型號元件當(dāng)壽命不小于5000(h)為合格,問該批元件是否合格? 問題是對總體未知參數(shù)=E(X)=1/作出估計。回答“是多少?”,是定量的。問題則是對假設(shè)“這批元件合格”做出接受還是拒絕的回答,因而是定性的,對上述例子,還可做更細(xì)致考察,設(shè)想如基于一次觀察 數(shù)據(jù)算出的估計值 ,我們能否就此接受“這批 元件合格”的這一假設(shè)呢?盡管 但這個估計僅僅 是一次試驗(yàn)的結(jié)果,能否保證下一次測試結(jié)果也能得到的 估計值大于5000呢?也就是說從觀察數(shù)據(jù)得

3、到的結(jié)果 與參考值5000的差異僅僅是偶然的呢?還是總體均值確實(shí) 有大于5000的“趨勢”,這些問題是以前沒有研究過的。一般而言,估計問題是回答總體分布的未知參數(shù)是多少?或范圍有多大?而假設(shè)檢驗(yàn)問題則是回答觀察到的數(shù)據(jù)差異只是機(jī)會差異,還是反映了總體的真實(shí)差異?因此兩者對問題的提法有本質(zhì)不同,第一節(jié) 檢驗(yàn)的基本原理,下面通過一個例子介紹 原假設(shè)和備擇假設(shè),二.原假設(shè)和備擇假設(shè),第一節(jié) 檢驗(yàn)的基本原理,例1(酒精含量) 一種無需醫(yī)生處方即可達(dá)到的治療咳嗽和鼻塞的藥。按固定其酒精含量為5.今從一出廠的一批藥中隨機(jī)抽取10瓶,測試其酒精含量得到的10個含量的百分?jǐn)?shù),5.01, 4.87, 5.11,

4、 5.21, 5.03, 4.96, 4.78, 4.98, 4.88, 5.06,如果酒精含量服從正態(tài)分布N(,0.00016),問該批藥品的酒精含量是否合乎規(guī)定,任務(wù): 通過樣本推斷X的均值是否等于5,假設(shè):上面的任務(wù)就是要通過樣本去檢驗(yàn)“X的均值=5”這樣一個假設(shè)是否成立.(在數(shù)理統(tǒng)計中把“X的均值=5”這樣一個待檢驗(yàn)的假設(shè)記作“H0:=5”稱為 “原假設(shè)”或 “零假設(shè)”.表明數(shù)據(jù)的“差異”是偶然的,總體沒有 “變異”發(fā)生,原假設(shè)的對立面是“X的均值10”記作“H1:10”稱為“對立假設(shè)”或“備擇假設(shè)”.表明數(shù)據(jù)的“差異”不是偶然的,是總體 “變異”的表現(xiàn). 把它們合寫在一起就是:H0:

5、=10 H1:10,原假設(shè)H0表明含量符合規(guī)定,這個5也稱之為期望數(shù),盡管10個數(shù)據(jù)都5與有出入,這只是抽樣的隨機(jī)性所致;備擇假設(shè)H1表明總體均值已經(jīng)偏離了期望數(shù)5,數(shù)據(jù)與期望數(shù)5的差異是其表現(xiàn),必須在原假設(shè)與備擇 假設(shè)之間作一選擇,檢驗(yàn)統(tǒng)計量是構(gòu)造一個適當(dāng)?shù)哪芏攘坑^察數(shù)與原假 設(shè)下的期望數(shù)之間的差異程度的統(tǒng)計量,此統(tǒng)計量為檢驗(yàn)統(tǒng)計量,特點(diǎn):在原假設(shè)H0下分布式完全一致或者說可以計算,因而通過標(biāo)準(zhǔn)化 可得到檢驗(yàn)統(tǒng)計量,三.檢驗(yàn)統(tǒng)計量,本例的觀察數(shù)通過樣本平均 表示,它是的一 個無偏估計,而H0在下的期望數(shù)為=5,在H0下,從試驗(yàn)數(shù)據(jù)判斷是否導(dǎo)致一個矛盾的結(jié)果,一個重要的依據(jù)是小概率事件的實(shí)際推

6、斷原理. 看例1,由觀察數(shù)據(jù),可算得的 觀察值為4.989,代入統(tǒng)計量Z的表達(dá)式,得Z的觀察值為,四.否定論證及實(shí)際推斷原理,否定論證是假設(shè)檢驗(yàn)的重要推理方法,其要旨是: 先假定原假設(shè)H0成立,如果從試驗(yàn)觀察數(shù)據(jù)及此假定 將導(dǎo)致一個矛盾的結(jié)果,則必須否定這個原假設(shè);反之, 如果不出矛盾的結(jié)果,就不能否定原假設(shè),在H0下,Z服從標(biāo)準(zhǔn)正態(tài)分布,對于特定的一次試驗(yàn),統(tǒng)計量Z取得觀察值-2.7509,是十分罕見的,以至于實(shí)際不會發(fā)生.事實(shí)上,當(dāng)H0成立時,事件,發(fā)生的機(jī)會只有5(如圖,這是一個小概率事件.今從試驗(yàn)數(shù)據(jù)得到Z=-2.7509,由于 表明這一小概率事件在該次試驗(yàn)中發(fā)生,這與實(shí)際推斷原理矛盾

7、.因此否定原假設(shè).至此本例已獲得解答,即基于數(shù)據(jù)該批藥品的酒精含量不符合規(guī)定,注意: 在否定論中最終能否得出矛盾的結(jié)果,取決于數(shù)據(jù),第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),一.假設(shè)檢驗(yàn)的兩類錯誤,一類錯誤是,當(dāng)H0為真時,因?yàn)楸M管事件A|H0是小概率事件,但仍有可能發(fā)生,即樣本觀察值(x1,x2,.,xn)R時,按檢驗(yàn)法則將拒絕原假設(shè)H0,這種錯誤稱為第一類錯誤,根據(jù)檢驗(yàn)法則,若A發(fā)生則拒絕H0,否則接受H0.這不免要犯二類錯誤,第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),一.假設(shè)檢驗(yàn)的兩類錯誤,另一類錯誤是,當(dāng)原假設(shè)H0不真,即H1為真時,A也有可能不發(fā)生,即樣本觀察值(x1,x2,.,xn)R*,

8、按檢驗(yàn)法則將接受原假設(shè)H0,這種錯誤稱為第二類錯誤,第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),正確,正確,注意:不可能消除這兩種錯誤,而只能控制發(fā)生 這兩類錯誤之一的概率,一.假設(shè)檢驗(yàn)的兩類錯誤,第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),我們當(dāng)然希望獨(dú)兩類錯誤的概率都很小,但在樣本容量n固定時是無法做到的.基于這種情況,且因?yàn)槿藗兂30丫芙^H0比錯誤地接受H0看得更重些.因此人們希望在控制犯第一類錯誤的概率的條件下,盡量使犯第二類錯誤的概率小,但這也是不容易的,有時甚至是不可能的.于是人們不得不降低要求,只對犯第一類錯誤的概率加以限制,而不考慮犯第二錯誤的概率,在這種原則下,尋找臨界域C時只涉及原假設(shè)

9、H0,而不涉及備擇假設(shè)H1,這種統(tǒng)計假設(shè)問題稱為顯著性檢驗(yàn)問題. 對給定的犯第一類錯誤的概率稱為顯著性水平,第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),二.顯著水平檢驗(yàn)法,顯著水平檢驗(yàn)法: 在數(shù)據(jù)收集之前就已經(jīng)設(shè)定好一個檢驗(yàn)規(guī)則,即文獻(xiàn)上稱之為拒絕域R,使得當(dāng)樣本觀察值落入R就拒絕H0,對拒絕域R的要求是:在H0 下樣本落入R為一小概率事件,即對預(yù)先給定的01有,P(樣本落入R|H0,此時稱R所代表的檢驗(yàn)為顯著水平的檢驗(yàn),第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),1) 根據(jù)問題的要求建立原假設(shè)H0和備擇假設(shè)H1,假設(shè)檢驗(yàn)的方法步驟,2) 選取檢驗(yàn)統(tǒng)計量T(X1,X2,.,Xn),要求T不含任何參數(shù),以便

10、計算H0為真時的條件概率,3) 給定顯著性水平,求出使PTR|H0的臨界域C,4) 若樣本觀察值T(x1,x2,.,xn)R,則拒絕原假設(shè)H0,否則接受H0,第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),1).方差已知時總體均值的假設(shè)檢驗(yàn),1 兩個正態(tài)總體的假設(shè)檢驗(yàn),第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),找臨界值u/2示意圖,第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),作為未知參數(shù)的點(diǎn)估計,因此 偏小應(yīng)該拒絕H0.若H0成立,例3 某降價盒裝餅干,其包裝上的廣告上稱每盒質(zhì)量為269g. 但有顧客投訴,鈣餅干質(zhì)量不足269g。為此質(zhì)檢部門從準(zhǔn)備出 廠的一批盒裝餅干中,隨機(jī)

11、抽取30盒,由測得的30個質(zhì)量數(shù)據(jù) 算出樣本平均為268.假設(shè)盒裝餅干質(zhì)量服從正態(tài)分布N(,22), 以顯著水平=0.05檢驗(yàn)該產(chǎn)品廣告是否真實(shí),解: 依題意,可設(shè)原假設(shè)H0:=269 備擇假設(shè) H1:269,則有,則在下ZN(0,1),即Z的分布已知,因而Z可以做檢驗(yàn)統(tǒng)計量, 偏小等價于Z偏小,從而得到拒絕域的形式如下,其中k待定,稱之為臨界值,0.05,為求顯著水平0.05的檢驗(yàn),只需選取k使得,查表可得,因而得到水平0.05檢驗(yàn)的拒絕域,代入數(shù)據(jù)得Z=-2.74,顯然小于臨界值-1.645,因而依據(jù)檢驗(yàn) 規(guī)則應(yīng)該拒絕H0,即該盒裝廣告又不是廣告行為,第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),

12、. 方差未知時總體均值的雙側(cè)假設(shè)檢驗(yàn),第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),找臨界值t/2示意圖,0,a/2,a/2,ta/2(n-1,ta/2(n-1,第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),其中未知.今用S*代替,得到t的統(tǒng)計量,例4. 在例3中,若盒裝餅干重量服從正態(tài)分布N(,2), 與2均未知,已知樣本平均 ,修正樣本標(biāo)準(zhǔn)差為S*=1.8,求解相同的問題,解: 此時不能使用Z作為統(tǒng)計量,因?yàn)闃?biāo)準(zhǔn)化變量為,由正態(tài)總體抽樣分布基本定理可知,在H0下,可得到拒絕域的形式如下,其中k待定,稱之為臨界值,0.05,為求顯著水平0.05的檢驗(yàn),只需選取k使得,因

13、而得到水平0.05檢驗(yàn)的拒絕域,代入數(shù)據(jù)得t=-3.044,顯然小于臨界值-1.699,因而依據(jù)檢驗(yàn) 規(guī)則應(yīng)該拒絕H0,即該盒裝廣告有不實(shí)廣告行為,第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),2 兩個正態(tài)總體的假設(shè)檢驗(yàn),第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),1). 方差已知時均值的雙側(cè)假設(shè)檢驗(yàn),因?yàn)?當(dāng)H0成立時,統(tǒng)計量,第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),從而,對于給定的顯著性水平,拒絕域?yàn)?第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),2).方差未知時均值的雙側(cè)假設(shè)檢驗(yàn),第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),第二節(jié) 顯著水平檢驗(yàn)法與正態(tài)總體檢驗(yàn),例5. 為評估某地區(qū)中學(xué)教學(xué)改革后教學(xué)質(zhì)量情況,分別在1995年,1999年舉行兩次數(shù)學(xué)考試,考生是從該地區(qū)中學(xué)的17歲學(xué)生中隨機(jī)抽取,每次100個。兩次考試的平均得分分別為63.5,67.0.假定兩次數(shù)學(xué)考試成績服從正態(tài)分布N(,2), N(,2 ),分別在下列情況下,對顯著水平=0.05檢驗(yàn)該地區(qū)數(shù)學(xué)成績有無提高,1). 已知1=2.1, 2=2.2,2). 假設(shè)1=2=但未知,且兩次考試成績的樣本方差為S12=1.92,S22=2.012,解: 由題意,可設(shè)原假設(shè)H0:1=2,備擇假設(shè)H1:12.分別記1995年的樣本平均為 ,1999年的為 ,可用 作1-2的點(diǎn)估計,因此當(dāng) 偏

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論