第七章假設(shè)檢驗_第1頁
第七章假設(shè)檢驗_第2頁
第七章假設(shè)檢驗_第3頁
第七章假設(shè)檢驗_第4頁
第七章假設(shè)檢驗_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章假設(shè)檢驗§7.1假設(shè)檢驗的基本思想(小概率事件在一次實驗中不會發(fā)生)前一章中我們討論了如何根據(jù)樣本去得到總體的分布所含參數(shù)的優(yōu)良估計.以這樣得到的估計值作為參數(shù)的已知值得到的一個總體必須跟真實的總體作比較,考察它們之間是否在統(tǒng)計的意義上相合。顯然,這種比較只能在樣本的基礎(chǔ)上進(jìn)行。怎么比較才能得到一個有較大把握的結(jié)論呢?這就是我們這章所要講的統(tǒng)計假設(shè)檢驗問題。一、假設(shè)檢驗的一個實際問題問題7.1.1一種零件采用自動生產(chǎn)線生產(chǎn),零件的壽命(單位:小時)服從正態(tài)分布?,F(xiàn)在工廠改良了生產(chǎn)技術(shù),假設(shè)零件的壽命仍服從正態(tài)分布且方差不變。為檢驗零件的壽命是否有提高,質(zhì)檢人員在某天生產(chǎn)的零件中隨機抽取40個進(jìn)行檢驗,測得平均壽命為2020小時。試問在新技術(shù)下生產(chǎn)的零件壽命是否得到了提高?現(xiàn)在的問題就是要判斷新技術(shù)下零件的平均壽命?還是與以前一樣依然是2000小時?如果是前者,我們說新產(chǎn)品壽命有顯著提高;若是后者,就是說沒有。我們把任意一個有關(guān)未知分布的假設(shè)稱為統(tǒng)計假設(shè)或簡稱假設(shè)。上面的問題中我們把兩種情況用假設(shè)來表示。假設(shè)表示新技術(shù)下零件壽命沒有顯著增加;假設(shè)表示新技術(shù)下零件壽命有顯著提高。我們把第一個假設(shè)作為原假設(shè),用符號表示;第二個假設(shè)作為備擇假設(shè),用符號表示。至于為什么要把第一個作為原假設(shè),第二個作為備擇假設(shè)呢?通常是把要拒絕的作為原假設(shè),要準(zhǔn)備接受的作為備擇假設(shè)。在上面的問題中,我們當(dāng)然希望零件壽命有提高,所以把沒有提高作為原假設(shè),有提高作為備擇假設(shè)。在許多問題中,總體分布的類型是已知的,僅是一個或幾個參數(shù)未知,只要對這一個或幾個未知參數(shù)的值作出假設(shè),就可以確定總體分布。這種僅涉及到總體分布的未知參數(shù)的統(tǒng)計假設(shè)稱為參數(shù)假設(shè)。如上面的問題就是參數(shù)假設(shè)檢驗問題。另一種要對總體分布類型進(jìn)行假設(shè)的叫做非參數(shù)假設(shè)。如,在問題7.1.1中,確定了總體分布,是一個簡單假設(shè),而是一個復(fù)合假設(shè)。二、假設(shè)檢驗的目的和基本方法假設(shè)檢驗的目的就是要根據(jù)數(shù)據(jù)來確定是否拒絕原假設(shè)。為此,我們必須先從樣本出發(fā),構(gòu)造一個合適的檢驗統(tǒng)計量與拒絕域,然后根據(jù)樣本觀測值作判斷:當(dāng)時拒絕原假設(shè),接受備擇假設(shè);否則不拒絕原假設(shè)。我們知道,樣本均值是總體均值的“好”的估計,可以選取作為檢驗統(tǒng)計量;根據(jù)備擇假設(shè),拒絕域應(yīng)該形如,其中臨界值的確定與下面兩類錯誤有關(guān)。三、假設(shè)檢驗的兩類錯誤由于樣本的隨機性,進(jìn)行判斷時,可能犯兩類錯誤。一類錯誤是:當(dāng)為真時,樣本卻落入了,使得我們拒絕,這種錯誤稱為第一類錯誤。其發(fā)生的概率稱為犯第一類錯誤的概率。通常記為,即P(拒絕|為真)=拒真概率上面例子中可寫為另一類錯誤為:當(dāng)為真時,樣本沒有落入,這時我們不拒絕,這種錯誤稱為第二類錯誤,其發(fā)生的概率稱為犯第二類錯誤的概率,通常記為,即P(不拒絕|為真)=受偽概率上面例子中可寫為我們把兩類錯誤歸納為下表:表7.1.1假設(shè)檢驗的兩類錯誤總體樣本犯第一類錯誤(接受)(接受)犯第二類錯誤犯兩類錯誤的概率當(dāng)然是越小越好,但是當(dāng)樣本容量n固定時,,不能同時都小,即變小時,就變大;而變小時,就變大。只有當(dāng)樣本容量n增大時,才有可能使兩者同時變小。在實際應(yīng)用中,人們常遵循Neyman-Pearson原則:在控制犯第一類錯誤的概率的條件下,尋找拒絕域(或檢驗法則),使得犯第二類錯誤的概率達(dá)到最小。不過,基于Neyman-Pearson原則的最優(yōu)檢驗不一定存在。四、顯著性假設(shè)檢驗問題如果只控制犯第一類錯誤的概率,而不考慮犯第二類錯誤的概率,那么尋找拒絕域只涉及原假設(shè),而與備擇假設(shè)無關(guān),這種統(tǒng)計假設(shè)檢驗問題稱為顯著性假設(shè)檢驗問題,此時又稱為檢驗的顯著性水平。對于問題7.1.1,如果只考慮顯著性假設(shè)檢驗問題,則臨界值由確定:由§5.3定理5.3.2(1,因此,故。取顯著性水平,拒絕域為?,F(xiàn)在抽樣檢查的結(jié)果是,即樣本觀測值落入拒絕域,因此,我們有充分理由拒絕原假設(shè),接受備擇假設(shè),即可認(rèn)為新技術(shù)下零件壽命有顯著提高。注:(1)假設(shè)檢驗是根據(jù)小概率事件的實際不可能性原理來進(jìn)行推斷的。在原假設(shè)成立時,是小概率事件。若小概率事件竟然發(fā)生,我們就有理由懷疑前提假設(shè),從而作出拒絕原假設(shè)的判斷。(2)假設(shè)檢驗的結(jié)論與選取的顯著性水平有關(guān)。上例中,若改取顯著性水平,則拒絕域變?yōu)椋藭r沒有充分理由拒絕原假設(shè),即尚不能認(rèn)為新技術(shù)下零件壽命有顯著提高。五、顯著性假設(shè)檢驗的一般步驟(1)

根據(jù)實際問題提出原假設(shè)與備擇假設(shè),即說明要檢驗的假設(shè)的內(nèi)容;(2)

選取合適的檢驗統(tǒng)計量,并在原假設(shè)成立的條件下確定的分布;(3)

根據(jù)問題的需要適當(dāng)選取檢驗的顯著性水平(一般較小),確定拒絕域;(4)根據(jù)樣本觀測值計算檢驗統(tǒng)計量的值,從而對是否拒絕原假設(shè)作出判斷。六、利用P值(P-value)進(jìn)行決策顯著性水平是在檢驗之前確定的,這也就是說事先確定了拒絕域。這樣,不論檢驗統(tǒng)計量的值是大還是小,只要它的值落入拒絕域就拒絕原假設(shè),否則就不拒絕原假設(shè)。這種固定的顯著性水平對檢驗結(jié)果的可靠性起一種度量作用。但不足的是,是犯第一類錯誤的上限控制值,它只是提供檢驗結(jié)論可靠性的一個大致范圍,而對于一個特定的假設(shè)檢驗問題,卻無法給出觀測數(shù)據(jù)與原假設(shè)之間不一致程度的精確度量。即是說,僅從顯著水平來比較,如果選擇的值相同,則所有檢驗結(jié)論的可靠性都一樣。P值就是當(dāng)原假設(shè)為真時得到樣本觀測結(jié)果或更極端情況發(fā)生的概率,也稱為觀察到的顯著性水平。如果原假設(shè)是正確的話,很小的P值告訴我們得到這樣的數(shù)據(jù)是多么的不可能。不可能得到的數(shù)據(jù),就是原假設(shè)不成立的合理證據(jù)。我們永遠(yuǎn)不會知道原假設(shè)是否正確,就象我們永遠(yuǎn)也不知道天有多高一樣。如果P值為5%,我們只能說:在原假設(shè)成立的條件下,這樣的數(shù)據(jù)只有5%的可能性會發(fā)生。P值是反映實際觀測到的數(shù)據(jù)與原假設(shè)之間不一致的程度的一個概率值。P越小,說明實際觀測到的數(shù)據(jù)與之間不一致的程度就越大,檢驗的結(jié)果也就越顯著。P值也是用于確定是否拒絕原假設(shè)的另一個重要工具,它有效地補充了提供的關(guān)于檢驗可靠性的有限信息。在現(xiàn)代統(tǒng)計檢驗中,不再需要給出或之類傳統(tǒng)的顯著性水平。P值提供了更多的信息,它讓人們可以選擇任意水平來評估結(jié)果是否具有統(tǒng)計上的顯著性。只要你認(rèn)為這么大的P值算是顯著了,你就可以在這樣的P值水平上拒絕原假設(shè)。當(dāng)然,傳統(tǒng)的顯著性水平,如、、等,已被人們普遍接受為“拒絕原假設(shè)足夠證據(jù)”的標(biāo)準(zhǔn)。大概可以說:代表有“一些證據(jù)”不利于原假設(shè);代表有“適度證據(jù)”不利于原假設(shè);代表有“很強證據(jù)”不利于原假設(shè)。下面給出P值的計算公式,其中表示檢驗統(tǒng)計量的樣本觀測值:(1)左側(cè)檢驗:P值等于(2)右側(cè)檢驗:P值等于(3)雙側(cè)檢驗:P值等于。常用統(tǒng)計軟件(如SAS,SPSS)都會給出統(tǒng)計檢驗方法的P值,本書將使用Excel進(jìn)行計算,具體內(nèi)容和操作過程將在后面詳細(xì)介紹。對于不同檢驗的P值,可以用下面的圖來表示。置信水平P值的P值的臨界值臨界值雙側(cè)檢驗P值左側(cè)檢驗P值右側(cè)檢驗圖7.1.1利用P值進(jìn)行決策的規(guī)則十分簡單。不論是單側(cè)還是雙側(cè)檢驗,決策的準(zhǔn)則都是:如果P值,拒絕;否則,不拒絕?;氐絾栴}7.1.1,這是右側(cè)檢驗問題,檢驗的P值為因為,所以在顯著性水平下有充分理由拒絕原假設(shè),接受備擇假設(shè),即可認(rèn)為新技術(shù)下零件壽命有顯著增加。下面將顯著性假設(shè)檢驗問題利用P值進(jìn)行決策的的具體步驟總結(jié)如下:第一步:根據(jù)實際問題提出原假設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論