假設(shè)檢驗總結(jié)課件_第1頁
假設(shè)檢驗總結(jié)課件_第2頁
假設(shè)檢驗總結(jié)課件_第3頁
假設(shè)檢驗總結(jié)課件_第4頁
假設(shè)檢驗總結(jié)課件_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第6章假設(shè)檢驗第一節(jié)假設(shè)檢驗的基本概念第二節(jié)參數(shù)的假設(shè)檢驗第三節(jié)非參數(shù)假設(shè)檢驗第6章假設(shè)檢驗第一節(jié)假設(shè)檢驗的基本概念假設(shè)檢驗在統(tǒng)計方法中的地位參數(shù)估計假設(shè)檢驗統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計假設(shè)檢驗在統(tǒng)計方法中的地位參數(shù)估計假設(shè)檢驗統(tǒng)計方法描述統(tǒng)計推第一節(jié)假設(shè)檢驗的基本概念1、原假設(shè)和備擇假設(shè)2、檢驗統(tǒng)計量3、接受域和拒絕域4、顯著性水平5、雙側(cè)檢驗與單側(cè)檢驗6、假設(shè)檢驗中的兩類錯誤第一節(jié)假設(shè)檢驗的基本概念1、原假設(shè)和備擇假設(shè)什么是假設(shè)?

(hypothesis)對總體參數(shù)的具體數(shù)值所作的陳述總體參數(shù)包括總體均值、比率、方差等分析之前必須陳述我認為這種新藥的療效比原有的藥物更有效!什么是假設(shè)?

(hypothesis)對總體參數(shù)的具體數(shù)什么是假設(shè)檢驗?

(hypothesistest)先對總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過程有參數(shù)檢驗和非參數(shù)檢驗邏輯上運用反證法,統(tǒng)計上依據(jù)小概率原理什么是假設(shè)檢驗?

(hypothesistest)先對總假設(shè)檢驗的基本思想...因此我們拒絕假設(shè)

=50...如果這是總體的假設(shè)均值樣本均值m=50抽樣分布H0這個值不像我們應(yīng)該得到的樣本均值...20假設(shè)檢驗的基本思想...因此我們拒絕假設(shè)=50..總體假設(shè)檢驗的過程抽取隨機樣本均值

x

=20我認為人口的平均年齡是50歲提出假設(shè)

拒絕假設(shè)別無選擇!作出決策總體假設(shè)檢驗的過程抽取隨機樣本均值

x=原假設(shè)與備擇假設(shè)原假設(shè)與備擇假設(shè)原假設(shè)

(nullhypothesis)在假設(shè)檢驗時首先要提出一個假設(shè),就稱原假設(shè)。又稱零假設(shè)或虛擬假設(shè),通常用H0表示例如:在質(zhì)量管理中假設(shè)在正常的情況下,零件的平均長度應(yīng)是2厘米,就建立

原假設(shè)

(nullhypothesis)在假設(shè)檢驗時首先要在提出原假設(shè)的同時,還要制定另一個假設(shè)稱做備擇假設(shè)。原假設(shè)是待檢驗的假設(shè),備擇假設(shè)則是原假設(shè)被拒絕后替換的假設(shè)。因為對于任何一個假設(shè)檢驗問題所有可能的結(jié)果都應(yīng)包含在兩個假設(shè)之內(nèi),非此即彼。如上述例子中零件長度要么等于2厘米,要么不等于2厘米,備擇假設(shè)通常用

表示,因此可以建立

備擇假設(shè)(alternativehypothesis)在提出原假設(shè)的同時,還要制定另一個假設(shè)稱做備擇假設(shè)。備擇假設(shè)【例】一種電子元件的生產(chǎn)標準是直徑為0.1cm,為對生產(chǎn)過程進行控制,質(zhì)量檢測人員定期對一臺加工設(shè)備檢查,確定這臺設(shè)備生產(chǎn)的電子元件是否符合標準要求。如果元件的平均直徑大于或小于0.1cm,則表明生產(chǎn)過程不正常,必須進行調(diào)整。試建立用來檢驗生產(chǎn)過程是否正常的原假設(shè)和備擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過程不正?!?。建立的原假設(shè)和備擇假設(shè)為

H0:

0.1cmH1:

0.1cm【例】一種電子元件的生產(chǎn)標準是直徑為0.1cm,為對生產(chǎn)過【例】某廠家聲稱,所生產(chǎn)的某品牌燈管壽命不低于4000小時,經(jīng)銷商在對該燈管經(jīng)銷前,有關(guān)研究人員想通過抽檢其中的一批燈管來驗證該生產(chǎn)廠家的聲稱是否屬實。試建立用于檢驗的原假設(shè)和備擇假設(shè)。提出假設(shè)(例題分析)解:研究者想搜集證據(jù)予以證明的假設(shè)應(yīng)該是“燈管壽命低于4000小時”。于是原假設(shè)和備擇假設(shè)應(yīng)設(shè)定為

H0:

4000H1:

<4000【例】某廠家聲稱,所生產(chǎn)的某品牌燈管壽命不低于4000小時,【例】一家研究機構(gòu)估計,某縣60歲以下人群中初中及其以下文化程度的人口所占比重超過10%。為驗證這一估計是否正確,該研究機構(gòu)隨機抽取了一個樣本進行檢驗。試建立用于檢驗的原假設(shè)與備擇假設(shè)。提出假設(shè)(例題分析)解:研究者想搜集證據(jù)予以支持的假設(shè)是“該縣60歲以下人群中初中及其以下文化程度的人口所占比重超過10%”。于是原假設(shè)和備擇假設(shè)應(yīng)設(shè)定為:

H0:

10%H1:

10%【例】一家研究機構(gòu)估計,某縣60歲以下人群中初中及其以下文化原假設(shè)和備擇假設(shè)是一個完備事件組,而且相互對立在一項假設(shè)檢驗中,原假設(shè)和備擇假設(shè)必有一個成立,而且只有一個成立先確定備擇假設(shè),再確定原假設(shè)等號“=”總是放在原假設(shè)上因研究目的不同,對同一問題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)提出假設(shè)(結(jié)論與建議)原假設(shè)和備擇假設(shè)是一個完備事件組,而且相互對立提出假設(shè)對原假設(shè)檢驗時必然要樣本的數(shù)據(jù)來判斷。對樣本數(shù)據(jù)進行加工并用來判斷是否接受原假設(shè)的統(tǒng)計量稱為檢驗統(tǒng)計量。例如上面列舉的原假設(shè)

那么樣本均值就可以作為檢驗統(tǒng)計量,有時為了方便還將樣本均值標準化為,稱為Z統(tǒng)計量。2、檢驗統(tǒng)計量(teststatistic)對原假設(shè)檢驗時必然要樣本的數(shù)據(jù)來判斷。對樣本數(shù)據(jù)進行加工并用3、接受域和拒絕域假設(shè)檢驗根據(jù)檢驗統(tǒng)計量的具體結(jié)果來判別是否接受H0因此在假設(shè)為真的情況下將抽樣所有可能結(jié)果組成的樣本空間劃分為兩部分:一部分是原假設(shè)為真時允許范圍內(nèi)的變動,應(yīng)該接受原假設(shè),因此稱作接受域;另一部分是超出了一定的界限,當原假設(shè)為真時只有很小的概率出現(xiàn),因而當統(tǒng)計量的結(jié)果落入這一區(qū)域便應(yīng)拒絕原假設(shè),這一區(qū)域稱作拒絕域。接受域和拒絕域之間的分割點通常稱作臨界值3、接受域和拒絕域假設(shè)檢驗根據(jù)檢驗統(tǒng)計量的具體結(jié)果來判別是否4、顯著性水平例如:有一批產(chǎn)品1000件,生產(chǎn)商聲稱只有一件為次品,那么隨機抽取一個進行檢查時,通常不會抽到次品,因為抽中次品的概率為千分之一,但如果在一次抽取中抽到了次品,顯然就有理由懷疑生產(chǎn)者的聲稱,認為1000件中只有一件次品的說法是假的。在假設(shè)檢驗時也是如此。我們確定了原假設(shè)為真時的可能范圍為接受域,而落入拒絕域是個小概率事件。一旦落入拒絕域,就要拒絕原假設(shè)而接受備擇假設(shè)。小概率常用

表示,也稱顯著性水平。4、顯著性水平例如:有一批產(chǎn)品1000件,生產(chǎn)商聲稱只有一件5、雙側(cè)檢驗與單側(cè)檢驗5、雙側(cè)檢驗與單側(cè)檢驗假設(shè)檢驗根據(jù)實際的需要可以分為雙側(cè)檢驗和單側(cè)檢驗。單側(cè)檢驗分為左側(cè)檢驗和右側(cè)檢驗。雙側(cè)檢驗指客體的指標過大和過小都不符合要求,因此都需要加以檢驗,這時檢驗的拒絕域就位于圖形的兩側(cè)。雙側(cè)檢驗與單側(cè)檢驗假設(shè)檢驗根據(jù)實際的需要可以分為雙側(cè)檢驗和單側(cè)檢驗。雙側(cè)檢驗與兩類錯誤與顯著性水平兩類錯誤與顯著性水平假設(shè)檢驗中的兩類錯誤1. 第Ⅰ類錯誤(棄真錯誤)原假設(shè)為真時拒絕原假設(shè)第Ⅰ類錯誤的概率記為被稱為顯著性水平2. 第Ⅱ類錯誤(取偽錯誤)原假設(shè)為假時未拒絕原假設(shè)第Ⅱ類錯誤的概率記為(Beta)假設(shè)檢驗中的兩類錯誤1. 第Ⅰ類錯誤(棄真錯誤)

的關(guān)系你不能同時減少兩類錯誤!和的關(guān)系就像翹翹板,小就大,大就小和的關(guān)系你不能同時減少兩類錯誤!和的關(guān)系影響的因素1. 總體參數(shù)的真值隨著假設(shè)的總體參數(shù)的減少而增大2. 顯著性水平當減少時增大3. 總體標準差當增大時增大4. 樣本容量n當n減少時增大影響的因素1. 總體參數(shù)的真值顯著性水平

(significantlevel)1. 是一個概率值2. 原假設(shè)為真時,拒絕原假設(shè)的概率被稱為抽樣分布的拒絕域3. 常用的

值有0.01,0.05,0.104. 由研究者事先確定顯著性水平

(significantlevel)1. 檢驗統(tǒng)計量與拒絕域檢驗統(tǒng)計量與拒絕域決策規(guī)則給定顯著性水平,查表得出相應(yīng)的臨界值z或z/2,t或t/2將檢驗統(tǒng)計量的值與水平的臨界值進行比較作出決策雙側(cè)檢驗:|統(tǒng)計量|

>臨界值,拒絕H0左側(cè)檢驗:統(tǒng)計量<-臨界值,拒絕H0右側(cè)檢驗:統(tǒng)計量>臨界值,拒絕H0決策規(guī)則給定顯著性水平,查表得出相應(yīng)的臨界值z或z/2假設(shè)檢驗步驟的總結(jié)(一)提出原假設(shè)和備擇假設(shè)(二)確定適當?shù)臋z驗統(tǒng)計量(三)規(guī)定顯著性水平(四)計算檢驗統(tǒng)計量的值(五)作出統(tǒng)計決策假設(shè)檢驗步驟的總結(jié)(一)提出原假設(shè)和備擇假設(shè)第二節(jié)參數(shù)的假設(shè)檢驗一、單個總體的均值檢驗二、單一樣本的比例檢驗三、兩個總體均值之差的檢驗四、兩個總體比例之差的檢驗第二節(jié)參數(shù)的假設(shè)檢驗一、單個總體的均值檢驗一、單個總體,的檢驗

1、正態(tài)總體且2已知[例]某廠商聲稱其新開發(fā)的釣魚線的強度服從正態(tài)分布,且平均強度為8kg,標準差為0.5kg。現(xiàn)從中隨機抽出50條,測試結(jié)果為平均強度為7.85kg,問能否接受廠商的聲稱?(=0.05)解:H0:=8H1:8

-Z/20Z/2一、單個總體,的檢驗

1、正態(tài)總體且2已知-Z/2[例]某廠商聲稱其新開發(fā)的釣魚線的強度服從正態(tài)分布,且平均強度不超過8kg,標準差為0.5kg?,F(xiàn)從中隨機抽出50條,測試結(jié)果為平均強度為8.1kg,可否認為其平均強度比8kg高?(=0.05)解:H0:8H1:>8

x0[例]某廠商聲稱其新開發(fā)的釣魚線的強度服從正態(tài)分布,且平均強2、正態(tài)總體,2未知

[例]某種金屬線的抗拉強度X~N(10620,2

),據(jù)說目前有所下降。為此從新生產(chǎn)的產(chǎn)品中任取10根,測得樣本均值10600kg,樣本標準差為81kg??煞裾J為其平均抗拉強度比過去下降了?(=0.05)解:H0:10620H1:<10620-1.8302、正態(tài)總體,2未知

[例]某種金屬線的抗拉強度X~N(13、非正態(tài)分布或總體分布形式未知

STAT[例]一食品加工者關(guān)心500g的水果罐頭是否裝得太滿?,F(xiàn)隨機抽取一個容量為50的樣本,發(fā)現(xiàn)平均重量為510g,標準差為8g。試根據(jù)0.05的顯著性水平檢驗罐頭是否裝得太滿?解:H0:500H1:>500

1.6453、非正態(tài)分布或總體分布形式未知

STAT[例]一食品加工者二、單個總體,比例的檢驗STAT(一)確定假設(shè)1、H0:P=P0H1:PP0

2、H0:PP0H1:PP03、H0:PP0H1:PP0(二)檢驗統(tǒng)計量當n很大(≥30),且nP和n(1–P)兩者均大于等于5時,二、單個總體,比例的檢驗STAT(一)確定假設(shè)STAT[例]據(jù)以往調(diào)查,購買某企業(yè)產(chǎn)品的顧客中30歲以上的男子占50%。該企業(yè)關(guān)心這個比例是否有變,于是隨機抽取400名顧客進行調(diào)查,結(jié)果有210人為30歲以上的男子。該廠希望在0.05的顯著性水平下檢驗這個比例是否有變。解:H0:P=50%H1:P50%

-1.961.96STAT[例]據(jù)以往調(diào)查,購買某企業(yè)產(chǎn)品的顧客中30歲以上的三、兩個總體平均數(shù)之差的假設(shè)檢驗

STAT(一)確定假設(shè)1、H0:1–2=0H1:1–202、H0:1–20H1:1–203、H0:1–20H1:1–2

0(二)確定檢驗統(tǒng)計量正態(tài)總體、2未知但相等三、兩個總體平均數(shù)之差的假設(shè)檢驗

STAT(一)確定假設(shè)正態(tài)STAT[例]兩種方法生產(chǎn)的產(chǎn)品抗拉強度都近似服從正態(tài)分布。方法1的標準差1=6kg,方法2的標準差2=8kg?,F(xiàn)從方法1和方法2生產(chǎn)的產(chǎn)品中分別抽取容量為12、16的樣本,其樣本均值分別40kg和34kg。管理部門想知道這兩種方法生產(chǎn)出來的產(chǎn)品的平均抗拉強度是否相同(=0.05)建立假設(shè):H0:1–2=0H1:1–20STAT[例]兩種方法生產(chǎn)的產(chǎn)品抗拉強度都近似服從正態(tài)分布。四、兩個總體比率之差的假設(shè)檢驗STAT(一)確定假設(shè)1、H0:P1=P2H1:P1P2

2、H0:P1P2H1:P1P23、H0:P1P2H1:P1P2(二)檢驗統(tǒng)計量當n很大(>30),且np和n(1–p)兩者均大于5時,四、兩個總體比率之差的假設(shè)檢驗STAT(一)確定假設(shè)STAT[例]一保險機構(gòu)稱,對于新出臺的某一險種,沿海地區(qū)的人們的喜愛程度要高于內(nèi)地的人們。為此進行的一次抽樣調(diào)查顯示:沿海和內(nèi)地人們的喜愛程度分別為0.65、0.55,樣本容量為300、400人??煞裾J為沿海比內(nèi)地更喜愛這一險種(=0.01)。建立假設(shè):H0:P1

P20

H1:P1P20STAT[例]一保險機構(gòu)稱,對于新出臺的某一險種,沿海地區(qū)的第三節(jié)非參數(shù)檢驗一、什么是非參數(shù)假設(shè)檢驗1.非參數(shù)檢驗:它泛指參數(shù)假設(shè)檢驗以外的各種檢驗。2.非參數(shù)檢驗的特點·非參數(shù)檢驗不依賴于總體分布?!し菂?shù)假設(shè)檢驗適用于較低的計量水平,如等級、順序的計量等?!こ3S糜趨?shù)以外的檢驗,如隨機變量是否服從某種規(guī)律、某種分布的擬合優(yōu)度檢驗,數(shù)據(jù)是否隨機的游程檢驗等。3.由于非參數(shù)檢驗只應(yīng)用于順序等計量,沒有充分利用信息,其效率不如參數(shù)檢驗,有些數(shù)據(jù)可以同時使用參數(shù)檢驗和非參數(shù)檢驗。第三節(jié)非參數(shù)檢驗一、什么是非參數(shù)假設(shè)檢驗二、χ2檢驗(一)分類數(shù)據(jù)的擬合優(yōu)度檢驗1.如何探討數(shù)據(jù)規(guī)律顯示數(shù)據(jù)規(guī)律性的方法:頻數(shù)分布表,能否了解數(shù)據(jù)來自某一分布或與某一理論分布相一致的程度如何?——χ2檢驗直方圖和統(tǒng)計量的檢測可能給出了一些探索性的假設(shè)。然而,這些應(yīng)該用一些較為正規(guī)的方式來加以論證。擬合優(yōu)度檢驗給出了統(tǒng)計意義上的證據(jù)來檢驗有關(guān)分布的假設(shè)。最為通用的擬合優(yōu)度檢驗是卡方檢驗(χ2)。擬合優(yōu)度的卡方檢驗的假設(shè)為:H0:抽樣數(shù)據(jù)來自于一個特殊的分布(如正態(tài)分布)H1:抽樣數(shù)據(jù)不是來自于這個特殊的分布二、χ2檢驗(一)分類數(shù)據(jù)的擬合優(yōu)度檢驗2.利用χ2進行擬合優(yōu)度檢驗的步驟第一步,先將觀測到的數(shù)據(jù)分類,假設(shè)分成m類,每類中的頻數(shù)為,或記為i(i=1,2,…,m)。第二步:根據(jù)觀測結(jié)果似乎服從某一理論分布的規(guī)律,需要進一步檢驗。按照理論分布,各類的頻數(shù)應(yīng)為ei=nPi(i=1,2,…,m),其中Pi為根據(jù)理論分布,觀測發(fā)生在第i類的概率。第三步:計算統(tǒng)計量如果理論分布的參數(shù)是預先給定的(已知的),則χ2統(tǒng)計量服從自由度為m-1的χ2分布。若理論分布的參數(shù)是未知的,需要用樣本觀測值來估計時,χ2統(tǒng)計量服從自由度為m-r-1的χ2分布,其中r為需要估計的參數(shù)的個數(shù)。第四步:根據(jù)顯著性水平a查χ2分布表求相應(yīng)的臨界值χ2

a。χ2>χ2

a時,拒絕原假設(shè),說明樣本觀測并非來自該理論分布。2.利用χ2進行擬合優(yōu)度檢驗的步驟第一步,先將觀測到的數(shù)據(jù)分例題分析p184-185例6.10和6.11例題分析p184-185例6.10和6.11(二)χ2分布的獨立性檢驗在獨立性檢驗中的χ2統(tǒng)計量為其中(二)χ2分布的獨立性檢驗在獨立性檢驗中的χ2統(tǒng)計量為例題分析p187例6.12例題分析p187例6.12或者用公式或者用公式例題分析p189例6.13例題分析p189例6.13三、秩和檢驗(等級和檢驗)當總體不符合正態(tài)分布時,轉(zhuǎn)換成等級,然后檢驗,這一類的檢驗統(tǒng)稱為秩和檢驗。(一)曼-惠特尼U檢驗它假設(shè)兩個樣本分別來自兩個總體,目的是檢驗這兩個總體的均值是否有顯著的差別。三、秩和檢驗(等級和檢驗)當總體不符合正態(tài)分布時,轉(zhuǎn)換成等級2.具體步驟第一步:把兩組數(shù)據(jù)混和在一起,按照大小順序編排等級。最小的為1,其次為2等等,兩個數(shù)據(jù)和三個數(shù)據(jù)相等如何處理?若有兩個數(shù)據(jù)相等,且它們在按大小順序編排好的數(shù)列里是第m和第m+1個數(shù)據(jù),則它們的等級(也稱作秩)都是m+(m+1)/2=2m+1/2。同理,若有3個數(shù)據(jù)相等,且它們在按大小順序編排好的數(shù)據(jù)列里第m,第m+1和第m+2位數(shù)據(jù),則它們的等級都是3m+3/3=m+1。第二步:分別求兩個樣本的等級和。設(shè)第一個樣本的等級和為W1,第二個樣本的等級和為W2,則有W1+W2=n(n+1)/2。第三步:計算曼-惠特尼U檢驗統(tǒng)計量2.具體步驟第一步:把兩組數(shù)據(jù)混和在一起,按照大小順序編排等第四步:作出判斷對于n1n2都比較小的情形,可以查附表6得到臨界值Ua,在U<Ua時拒絕H0:。在原假設(shè)為真的情況下,可以證明隨機變量U的均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論