第七章 假設(shè)檢驗_第1頁
第七章 假設(shè)檢驗_第2頁
第七章 假設(shè)檢驗_第3頁
第七章 假設(shè)檢驗_第4頁
第七章 假設(shè)檢驗_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章假設(shè)檢驗

假設(shè)檢驗的基本問題

一個總體參數(shù)的檢驗

二個總體參數(shù)的檢驗第一節(jié)假設(shè)檢驗的基本問題一、假設(shè)檢驗的陳述

由統(tǒng)計資料得知,2007年某地新生兒的平均體重為3190克,現(xiàn)從2008年的新生兒中隨機抽取100個,測得其平均體重為3210克,問2008年的新生兒與2007年相比,體重有無顯著差異。用統(tǒng)計的語言來說,“假設(shè)”就是對總體參數(shù)的具體數(shù)值所作的陳述。在假設(shè)檢驗中,首先需要提出兩種假設(shè),即原假設(shè)和備擇假設(shè)。原假設(shè),通常是研究者想收集證據(jù)予以反對的假設(shè),由于原假設(shè)(H)用0修飾,所以也稱為零假設(shè)。備擇假設(shè),通常是研究者想收集證據(jù)予以支持的假設(shè),也稱為研究假設(shè)、替換假設(shè),用H1或Ha表示。備擇假設(shè)通常是用于支持你自己的看法。假設(shè)的形式:H0——原假設(shè),H1——備擇假設(shè)雙尾/側(cè)檢驗:H0:μ=μ0

,H1:μ≠μ0單尾/側(cè)檢驗:左側(cè)檢驗:H0:μ≥μ0

,H1:μ<μ0

右側(cè)檢驗:H0:μ≤μ0

,H1:μ>μ0幾點說明:第一,原假設(shè)和備擇假設(shè)是一個完備事件組,而且相互對立。第二,在建立假設(shè)時,通常是先確定備擇假設(shè),然后再確定原假設(shè)。第三,在假設(shè)檢驗中,等號“=”總是放在原假設(shè)上。第四,在面對某一實際問題時,原假設(shè)和備擇假設(shè)可能是截然相反的。第五,假設(shè)檢驗的目的主要是收集證據(jù)來拒絕原假設(shè)。二、假設(shè)檢驗規(guī)則與兩類錯誤

1、確定檢驗規(guī)則差異臨界點判斷C拒絕H0C不拒絕H02、兩類錯誤

I類錯誤——棄真錯誤,發(fā)生的概率為α。

II類錯誤——取偽錯誤,發(fā)生的概率為β。檢驗決策H0為真H0非真拒絕H0犯I類錯誤(α)正確不拒絕H0正確犯II類錯誤(β)(a)(b)拒絕域假設(shè)檢驗中犯兩類錯誤的情況第一類錯誤:H0本身成立,但通過檢驗卻否定了它,犯了“棄真”錯誤,也叫Ⅰ型錯誤(typeⅠerror)、а錯誤。Ⅰ型錯誤,就是把非真實差異錯判為真實差異,即H0:μ1=μ2為真,卻接受了HA:μ1≠μ2

。第二類錯誤:H0本身不成立,但通過檢驗卻接受了它,犯了“取偽”錯誤,也叫II型錯誤(typeIIerror)、β錯誤。II型錯誤,真實差異錯判為非真實差異,即HA:μ1≠μ2為真,卻未能否定H0:μ1=μ2。

統(tǒng)計檢驗是基于“小概率事件實際不可能性原理”來否定H0

,但在一次試驗中小概率事件并不是絕對不會發(fā)生的。如果我們抽得一個樣本,它雖然來自與H0對應(yīng)的抽樣總體,但計算所得的統(tǒng)計量卻落入了否定域中,因而否定了H0,于是犯了Ⅰ型錯誤。發(fā)生第Ⅰ類錯誤的概率也常被用于檢驗結(jié)論的可靠性度量,假設(shè)檢驗中犯的第Ⅰ類錯誤的概率被稱為顯著性水平,記為α。

Ⅱ型錯誤概率β值的大小較難確切估計,它只有與特定的HA結(jié)合起來才有意義。一般與顯著水平α、原總體的標(biāo)準(zhǔn)差σ、樣本含量n、以及相互比較的兩樣本所屬總體平均數(shù)之差μ1-μ2等因素有關(guān)。在其它因素確定時,α值越小,β越大;反之,α值越大,β值越??;樣本含量及μ1-μ2越大、均數(shù)標(biāo)準(zhǔn)誤σ越小,β值越小。

由于β值的大小與α值的大小有關(guān),所以在選用檢驗的顯著水平時應(yīng)考慮到犯Ⅰ、Ⅱ型錯誤所產(chǎn)生后果嚴(yán)重性的大小,還應(yīng)考慮到試驗的難易及試驗結(jié)果的重要程度。若一個試驗耗費大,可靠性要求高,不允許反復(fù),那么α值應(yīng)取小些;當(dāng)一個試驗結(jié)論的使用事關(guān)重大,容易產(chǎn)生嚴(yán)重后果,如藥物的毒性試驗,α值亦應(yīng)取小些。對于一些試驗條件不易控制,試驗誤差較大的試驗,可將α值放寬到0.1,甚至放寬到0.25。三、檢驗統(tǒng)計量與拒絕域根據(jù)樣本觀測結(jié)果計算得到的,并據(jù)以對原假設(shè)和備擇假設(shè)做出決策的某個樣本統(tǒng)計量,稱為檢驗統(tǒng)計量。檢驗統(tǒng)計量實際上是總體參數(shù)的點估計量,但點估計量并不能直接作為檢驗的統(tǒng)計量。只有將其標(biāo)準(zhǔn)化后,才能用于度量它與原假設(shè)的參數(shù)值之間的差異程度。對點估計量標(biāo)準(zhǔn)化的依據(jù)則是:①原假設(shè)為真;②點估計量的抽樣分布。實際上,假設(shè)檢驗中所有的檢驗統(tǒng)計量都是標(biāo)準(zhǔn)化檢驗統(tǒng)計量,它反映了點估計量與假設(shè)的總體參數(shù)相比相差多少個標(biāo)準(zhǔn)差。為敘述方便,通常將標(biāo)準(zhǔn)化檢驗統(tǒng)計量簡稱為檢驗統(tǒng)計量。①設(shè)有總體:,σ2已知。②隨機抽樣:樣本均值④確定α值⑤查概率表,知臨界值⑥計算Z值,作出判斷:③標(biāo)準(zhǔn)化:,拒絕H0。若,接受H0;若建立總體假設(shè)(1)抽樣得到樣本觀察值(2)根據(jù)具體決策要求確定α(4)選擇統(tǒng)計量確定H0為真時的抽樣分布(3)(5)確定分布上的臨界點C和檢驗規(guī)則(7)比較并作出檢驗判斷(6)計算檢驗統(tǒng)計量的數(shù)值【例】由統(tǒng)計資料得知,2007年某地新生兒的平均體重為3190克,標(biāo)準(zhǔn)差為80,現(xiàn)從2008年的新生兒中隨機抽取100個,測得其平均體重為3210克,問2008年的新生兒與2007年相比,體重有無顯著差異(α=0.05)。假設(shè)檢驗的流程如下:1.提出原假設(shè)和備擇假設(shè):

H0:μ=3190(克),H1:μ≠3190(克)2.確定適當(dāng)?shù)臋z驗統(tǒng)計量,并計算其數(shù)值:3.確定4.做出判斷,拒絕H0

四、利用P值進(jìn)行決策如果原假設(shè)H0為真,所得到的樣本結(jié)果會像實際觀測結(jié)果那么極端或更極端的概率,稱為P值,也稱為觀察到的顯著性水平。P值與原假設(shè)的對或錯的概率無關(guān),它是關(guān)于數(shù)據(jù)的概率。P值告訴我們:在某個總體的許多樣本中,某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度。也就是說,P值是當(dāng)原假設(shè)正確時,得到所觀測的數(shù)據(jù)的概率。

如前例,據(jù)隨機抽樣測得2008年的樣本均值為3210克,與2007年的總體均值3190克相差20克,20克的差異究竟是大還是小。換句話說,如果原假設(shè)成立,即2008年新生兒體重的總體均值與2007年新生兒體重的總體均值相同,那么隨機抽取出n=100的樣本,其均值大于3210克的概率有多大呢?這個概率稱為P值,所以P值就是當(dāng)原假設(shè)為真時所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率。如果P值很小,說明這種情況發(fā)生的概率很小,而如果出現(xiàn)了,根據(jù)小概率原理,我們就有理由拒絕原假設(shè),P值越小,我們拒絕原假設(shè)的理由就越充分。計算P值的一般表達(dá)式(1):左側(cè)檢驗:P值是當(dāng)時,檢驗統(tǒng)計量小于或等于根據(jù)實際觀測樣本數(shù)據(jù)計算得到的檢驗統(tǒng)計量值的概率,即P值=計算P值的一般表達(dá)式(2):右側(cè)檢驗:P值是當(dāng)時,檢驗統(tǒng)計量小于或等于根據(jù)實際觀測樣本數(shù)據(jù)計算得到的檢驗統(tǒng)計量值的概率,即P值=計算P值的一般表達(dá)式(3):雙側(cè)檢驗:P值是當(dāng)時,檢驗統(tǒng)計量小于或等于根據(jù)實際觀測樣本數(shù)據(jù)計算得到的檢驗統(tǒng)計量值的概率,即P值=在已知P值的條件下,將其與給定的顯著性水平α值進(jìn)行比較,單側(cè)檢驗中,P值位于抽樣分布的一側(cè),而雙側(cè)檢驗P值位于分布的兩側(cè),每一側(cè)的P值為1/2。如果P值<α,拒絕原假設(shè);如果P值>α,不拒絕原假設(shè)。第二節(jié)一個總體均值、比例和方差

的假設(shè)檢驗一、總體均值的檢驗

【例】一種罐裝飲料采用自動生產(chǎn)線生產(chǎn),每罐的容量是255ml,標(biāo)準(zhǔn)差為5ml。為檢驗每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機抽取了40罐進(jìn)行檢驗,測得每罐平均容量為255.8ml。取顯著性水平α=0.05,檢驗該天生產(chǎn)的飲料容量是否符合標(biāo)準(zhǔn)要求。解:提出的原假設(shè)和備擇假設(shè)為:計算檢驗統(tǒng)計量的具體數(shù)值:顯著性水平α=0.05,得由于所以,不拒絕原假設(shè)。檢驗結(jié)果表明:樣本提供的證據(jù)不足以推翻原假設(shè),因此不能證明該天生產(chǎn)的飲料不符合標(biāo)準(zhǔn)要求。方法二:用P值進(jìn)行檢驗

1.用EXCEL計算P值

2.比較P值

P=0.312495>α=0.05

3.作出決策由于P值=0.312495遠(yuǎn)遠(yuǎn)大于α=0.05,所以不拒絕原假設(shè),得到的結(jié)論與前面的相同。

【例】某機床廠加工一種零件,根據(jù)經(jīng)驗知道,該廠加工的零件的橢圓度漸近服從正態(tài)分布,其總體均值為0.081mm,今另換一種新機床進(jìn)行加工,取200個零件進(jìn)行檢驗,得到橢圓度均值為0.076mm,樣本標(biāo)準(zhǔn)差為0.025mm,問新機床加工零件的橢圓度總體均值與以前有無明顯差別。解:提出的原假設(shè)和備擇假設(shè)為:計算檢驗統(tǒng)計量的具體數(shù)值:顯著性水平α=0.05,得由于所以,拒絕原假設(shè)。可以認(rèn)為新老機床加工零件的橢圓度的均值有顯著差異。方法二:用P值進(jìn)行檢驗

1.用EXCEL計算P值

2.比較P值

P=0.004655>α=0.05

3.作出決策由于P值=0.004655遠(yuǎn)遠(yuǎn)小于α=0.05,所以拒絕原假設(shè),得到的結(jié)論與前面的相同。

【例】某批發(fā)商欲從廠家購進(jìn)一批燈泡,根據(jù)合同規(guī)定燈泡的使用壽命平均不能低于1000小時。已知燈泡燃燒壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為200小時。在總體中隨機抽取了100個燈泡,得知樣本均值為960小時,批發(fā)商是否應(yīng)該購買這批燈泡?解:提出的原假設(shè)和備擇假設(shè)為:計算檢驗統(tǒng)計量的具體數(shù)值:顯著性水平α=0.05,得由于所以,拒絕原假設(shè),即這批燈泡的使用壽命低于1000小時,批發(fā)商不應(yīng)購買這批燈泡。方法二:用P值進(jìn)行檢驗

1.用EXCEL計算P值

2.比較P值

P=0.02275<α=0.05

3.作出決策由于P值=0.02275小于α=0.05,所以拒絕原假設(shè),得到的結(jié)論與前面的相同?!锶绻诖死募僭O(shè)檢驗中,取顯著性水平α=0.02,會發(fā)生什么?

雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式檢驗統(tǒng)計量Α與拒絕域P值決策準(zhǔn)則大樣本情況下一個總體均值的檢驗方法P<α,拒絕H0小樣本的檢驗方法【例】一種汽車配件的平均長度要求為12cm,高于低于該標(biāo)準(zhǔn)均被認(rèn)為是不合格的。汽車生產(chǎn)企業(yè)在購進(jìn)配件時,通常是經(jīng)過招標(biāo),然后對中標(biāo)的配件提供商提供的樣品進(jìn)行檢驗,以決定是否購進(jìn)?,F(xiàn)對一個配件提供商提供的10個樣本進(jìn)行了檢驗,結(jié)果如下:

12.2

10.8

12.0

11.8

11.9

12.4

11.3

12.2

12.0

12.3

假設(shè)該供貨商生產(chǎn)的配件服從正態(tài)分布,在0.05的顯著性水平下,檢驗該供應(yīng)商提供的配件是否符合要求?解:依題意建立如下原假設(shè)和備擇假設(shè):

H0:μ=12

H1:μ≠12根據(jù)樣本數(shù)據(jù)計算得:由于n=10<30,為小樣本,采用t檢驗統(tǒng)計量:根據(jù)自由度(n-1)=10-1=9,查t分布表得:由于不拒絕原假設(shè),樣本提供的證據(jù)不足以推翻原假設(shè)。供應(yīng)商提供的配件可以認(rèn)為是符合要求的。方法二:用P值進(jìn)行檢驗

1.用EXCEL計算P值

2.比較P值

P=0.498469786

>α=0.05

3.作出決策由于P值大于α=0.05,所以不拒絕原假設(shè),得到的結(jié)論與前面的相同。雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式檢驗統(tǒng)計量Α與拒絕域P值決策準(zhǔn)則小樣本情況下一個總體均值的檢驗方法P<α,拒絕H0二、總體比例的檢驗條件檢驗統(tǒng)計量H0、H1

拒絕域P值決策準(zhǔn)則二項分布np≥5n(1-p)≥5H0:π=π0H1:π≠π0P<α,拒絕H0H0:π≥π0H1:π<π0H0:π≤π0H1:π>π0【例】一項統(tǒng)計結(jié)果聲稱,某市老年人口(年齡在65歲以上)所占的比例為14.7%,該市老年人口研究會為了檢驗該項統(tǒng)計是否可靠,隨機抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上,調(diào)查結(jié)果是否支持該市老年人口比例為14.7%的看法(α=0.05)?解:H0:π=14.7%

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論