第七章 假設(shè)檢驗(yàn)_第1頁
第七章 假設(shè)檢驗(yàn)_第2頁
第七章 假設(shè)檢驗(yàn)_第3頁
第七章 假設(shè)檢驗(yàn)_第4頁
第七章 假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

參數(shù)估計和假設(shè)檢驗(yàn)是統(tǒng)計推斷的兩個組成部分,都是利用樣本對總體進(jìn)行某種推斷,但推斷的角度不同。參數(shù)估計討論的是用樣本統(tǒng)計量估計總體參數(shù)的方法。假設(shè)檢驗(yàn)討論的是用樣本信息去檢驗(yàn)對總體參數(shù)的某種假設(shè)是否成立的程序和方法。學(xué)習(xí)目標(biāo):1.理解假設(shè)檢驗(yàn)的基本思想和基本步驟;

2.理解假設(shè)檢驗(yàn)的兩類錯誤及其關(guān)系;

3.熟練掌握總體均數(shù)的假設(shè)檢驗(yàn)方法;

4.熟練利用SPSS對總體方差、總體率及樣本正態(tài)性進(jìn)行各種假設(shè)檢驗(yàn)。第八章假設(shè)檢驗(yàn)一、什么是假設(shè)檢驗(yàn)我們以一個實(shí)例來講解:根據(jù)1989年的統(tǒng)計資料,某地女性新生兒的平均體重為3190克。為判斷該地1990年的女性新生兒體重與1989年相比有無顯著差異,從該地1990年的女性新生兒中隨機(jī)抽取30人,測得其平均體重為3210克。從樣本數(shù)據(jù)看,1990年女新生兒體重比1989年略高,但這種差異可能是由于抽樣的隨機(jī)性帶來的,也許這兩年新生兒的體重并沒有顯著差異。究竟是否存在顯著差異?可以先假設(shè)這兩年新生兒的體重沒有顯著差異,然后利用樣本信息檢驗(yàn)這個假設(shè)能否成立。先對推斷的總體參數(shù)或分布提出某種假設(shè),然后通過樣本統(tǒng)計量去驗(yàn)證這個假設(shè)是否成立,這一過程稱為假設(shè)檢驗(yàn),亦稱顯著性檢驗(yàn)。假設(shè)檢驗(yàn)分為參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn);參數(shù)檢驗(yàn)是已知總體分布,對總體的某個參數(shù)提出假設(shè)(原假設(shè)H0),用樣本來檢驗(yàn)這個假設(shè)是否正確(是接受還是拒絕原假設(shè)H0);非參數(shù)檢驗(yàn)是對總體分布提出假設(shè)(原假設(shè)H0),用樣本來檢驗(yàn)這個假設(shè)是否正確(是接受還是拒絕原假設(shè)H0)。第一節(jié)假設(shè)檢驗(yàn)概述二、假設(shè)檢驗(yàn)的基本原理小概率原理——發(fā)生概率很小的隨機(jī)事件(小概率事件)在一次實(shí)驗(yàn)中幾乎是不可能發(fā)生的。根據(jù)這一原理,可以先假設(shè)總體參數(shù)的某項(xiàng)取值為真,也就是假設(shè)其發(fā)生的可能性很大,然后抽取一個樣本進(jìn)行觀察,如果樣本信息顯示出現(xiàn)了與事先假設(shè)相反的結(jié)果且與原假設(shè)差別很大,則說明原來假定的小概率事件在一次實(shí)驗(yàn)中發(fā)生了,這是一個違背小概率原理的不合理現(xiàn)象,因此有理由懷疑和拒絕原假設(shè);否則不能拒絕原假設(shè)。例如:某廠產(chǎn)品合格率為99%,從一批(100件)產(chǎn)品中隨機(jī)抽取一件,恰好是次品的概率為1%。隨機(jī)抽取一件是次品幾乎是不可能的,但是這種情況發(fā)生了,我們有理由懷疑該廠的合格率為99%.這時我們犯錯誤的概率是1%。著名的英國統(tǒng)計家RonaldFisher把20分之1作為標(biāo)準(zhǔn),也就是0.05,從此0.05或比0.05小的概率都被認(rèn)為是小概率Fisher沒有任何深奧的理由解釋他為什么選擇0.05,只是說他忽然想起來的。第一節(jié)假設(shè)檢驗(yàn)概述三、假設(shè)檢驗(yàn)的基本思想...因此我們拒絕假設(shè)x=50...如果這是總體的真實(shí)均值樣本均值x=50抽樣分布H0這個值不像我們應(yīng)該得到的樣本均值...20第一節(jié)假設(shè)檢驗(yàn)概述四、假設(shè)檢驗(yàn)的步驟1.提出統(tǒng)計假設(shè)原假設(shè)(也稱零假設(shè)或無效假設(shè)),用H0表示,通常為被比較的兩者無差異,如μ1=μ2;備擇假設(shè)(也稱對立假設(shè)),用H1表示,通常為原假設(shè)被否定時準(zhǔn)備選擇的假設(shè),如μ1≠μ2,可能是μ1<μ2或μ1>μ2等等。應(yīng)該注意:⑴對任一假設(shè)檢驗(yàn)問題,其所有可能結(jié)果均應(yīng)包括在所提出的兩個對立假設(shè)中,原假設(shè)與對立假設(shè)總有一個、也只能有一個成立。⑵原假設(shè)一定要有等號:=或≦或≥。原假設(shè)不是隨意提出的,應(yīng)該本著“不輕易拒絕原假設(shè)”的原則。第一節(jié)假設(shè)檢驗(yàn)概述四、假設(shè)檢驗(yàn)的步驟2.確定檢驗(yàn)方法,計算檢驗(yàn)統(tǒng)計量檢驗(yàn)統(tǒng)計量的選擇是根據(jù)研究目的與要求、數(shù)據(jù)資料的分布、樣本含量的大小等確定的。常用的檢驗(yàn)方法有u檢驗(yàn)、t檢驗(yàn)、F檢驗(yàn)和χ2檢驗(yàn)等。u檢驗(yàn)(單尾和雙尾)

t檢驗(yàn)(單尾和雙尾)u檢驗(yàn)(單尾和雙尾)u、2檢驗(yàn)(單尾和雙尾)均值總體率方差第一節(jié)假設(shè)檢驗(yàn)概述四、假設(shè)檢驗(yàn)的步驟3.確定顯著性水平α,求出臨界值顯著性水平α是當(dāng)原假設(shè)為正確時被拒絕的概率,是由研究者事先確定的。顯著性水平的大小應(yīng)根據(jù)研究需要的精確度和可靠性而定。通常取α=0.05或α=0.01,即接受原假設(shè)的決定是正確的可能性(概率)為95%或99%。根據(jù)給定的顯著性水平α,查表得出相應(yīng)的臨界值,同時指定拒絕域。第一節(jié)假設(shè)檢驗(yàn)概述四、假設(shè)檢驗(yàn)的步驟4.作出統(tǒng)計推斷結(jié)論將計算的檢驗(yàn)統(tǒng)計量與臨界值作比較,如果前者(絕對值)<后者,說明檢驗(yàn)統(tǒng)計量的值落在接受域內(nèi),概率P>α,接受H0,拒絕H1,差別無統(tǒng)計學(xué)意義;如果前者(絕對值)≥后者,說明檢驗(yàn)統(tǒng)計量的值落拒絕域內(nèi),概率P≦α,拒絕H0,接受H1,差別有統(tǒng)計學(xué)意義。通常將:P>0.05稱為“差別不具顯著性”;0.01<P≦0.05稱為“差別具顯著性”,常以“*”表示;P≦0.01,稱為“差別具高度顯著性”,常以“**”表示。抽樣分布H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域1-α置信水平第一節(jié)假設(shè)檢驗(yàn)概述五、假設(shè)檢驗(yàn)的兩類錯誤假設(shè)檢驗(yàn)是依據(jù)小概率原理進(jìn)行判斷的,這就決定了統(tǒng)計結(jié)論仍有犯錯誤的可能。兩類錯誤:“棄真”錯誤(第I類錯誤):H0為真時卻被拒絕,犯錯概率為α;“納偽”錯誤(第II類錯誤):H0為假時卻被接受。犯錯概率為β。

假設(shè)檢驗(yàn)中各種可能結(jié)果的概率

接受H0拒絕H0,接受H1H0

為真1-α(正確決策)α(棄真錯誤)H0

為偽β(取偽錯誤)1-β(正確決策)第一節(jié)假設(shè)檢驗(yàn)概述假設(shè)檢驗(yàn)兩類錯誤關(guān)系的圖示

以單側(cè)上限檢驗(yàn)為例,設(shè)H0

:X≤X0,H1:X>X0從上圖可以看出,如果臨界值沿水平方向右移,α將變小而β變大,即若減小α錯誤,就會增大犯β錯誤的機(jī)會;如果臨界值沿水平方向左移,α將變大而β變小,即若減小β錯誤,也會增大犯α錯誤的機(jī)會。要想減少α與β,一個方法就是要增大樣本容量n。圖(a):

X≤X0H0為真圖(b):X>X0

H0為偽第一節(jié)假設(shè)檢驗(yàn)概述六、單雙側(cè)檢驗(yàn)根據(jù)假設(shè)的形式不同,假設(shè)檢驗(yàn)可以分為雙側(cè)假設(shè)檢驗(yàn)和單側(cè)假設(shè)檢驗(yàn)。若原假設(shè)是總體參數(shù)等于某一數(shù)值,如H0:X=X0,即備擇假設(shè)H1:X≠X0,那么只要X<X0和X>X0二者中有一個成立,就可以否定原假設(shè)。這種假設(shè)檢驗(yàn)稱為雙側(cè)檢驗(yàn)。若原假設(shè)是總體參數(shù)大于等于或小于等于某一數(shù)值,如H0:X≥X0(即H1:X<X0);或H0:X≤X0(即H1:X>X0),那么對于前者當(dāng)X<X0時,對于后者當(dāng)X>X0時,可以否定原假設(shè)。這種假設(shè)檢驗(yàn)稱為單側(cè)檢驗(yàn)??梢苑譃樽髠?cè)檢驗(yàn)(H1:X<X0)和右側(cè)檢驗(yàn)(H1:X>X0)。第一節(jié)假設(shè)檢驗(yàn)概述一、μ=μ0的假設(shè)檢驗(yàn)(一個正態(tài)總體均數(shù)的檢驗(yàn))根據(jù)隨機(jī)變量的分布情況、方差是否已知及樣本含量的大小,若假設(shè)H0:μ=μ0成立,則檢驗(yàn)統(tǒng)計量計算公式如下表:第二節(jié)均數(shù)的假設(shè)檢驗(yàn)總體分布樣本容量σ2已知σ2未知正態(tài)分布小樣本n<30

大樣本n≥30

非正態(tài)分布小樣本n<30

大樣本n≥30

【例8-1】已知我國健康成年男子安靜時的脈搏服從正態(tài)分布,其平均數(shù)為72次/分,標(biāo)準(zhǔn)差為6.4次/分。隨機(jī)抽測某體院四年級36名男生安靜時的脈搏,其平均數(shù)68.2次/分,標(biāo)準(zhǔn)差為3.1次/分。試問體院四年級男生安靜時的脈搏與一般健康成年男子安靜時的脈搏是否相同?(取α=0.05)。解:從題意可知,μ0=72,σ=6.4,x=68.2,S=3.1,n=36。(1)建立假設(shè):H0:μ=μ0=72,H1:μ≠μ0(2)計算統(tǒng)計量:(3)根據(jù)顯著性水平α=0.05,查表得雙側(cè)檢驗(yàn)臨界值:u0.05/2=1.96(4)作出統(tǒng)計推斷結(jié)論:因?yàn)楱Ou∣=3.562>u0.05/2=1.96,P<0.05,差異具顯著性,拒絕H0,接受H1。可以認(rèn)為體院四年級男生安靜時的脈搏與健康成年男子安靜時的脈搏存在著差異。u01.96-1.960.025拒絕H0拒絕H00.025第二節(jié)均數(shù)的假設(shè)檢驗(yàn)【例8-2】已知我國女籃運(yùn)動員的縱跳成績服從正態(tài)分布,平均成績?yōu)?0厘米,隨機(jī)抽測某省隊11名女籃運(yùn)動員,測得縱跳成績平均值為61.91厘米,標(biāo)準(zhǔn)差為7.09厘米,試問該省隊女籃運(yùn)動員的縱跳成績與我國女籃運(yùn)動員的縱跳成績有無差別?(取α=0.05)。解:本題σ未知,μ0=60,x=61.91,S=7.09,n=11。(1)建立假設(shè):H0:μ=μ0=60,H1:μ≠μ0(2)計算統(tǒng)計量:(3)根據(jù)顯著性水平α=0.05,查表得雙側(cè)檢驗(yàn)臨界值:t0.05/2(10)=2.228(4)作出統(tǒng)計推斷結(jié)論:因?yàn)楱Ot∣=0.893<t0.05/2(10)=2.228,P>0.05,差異不具顯著性,接受H0。可以認(rèn)為該省女籃運(yùn)動員的縱跳成績與我國女籃運(yùn)動員的縱跳成績沒有差別。第二節(jié)均數(shù)的假設(shè)檢驗(yàn)t02.228-2.2280.025拒絕H0拒絕H00.025總體分布方差是否齊性σ2已知σ2未知正態(tài)分布齊性

非齊性

非正態(tài)分布要求n1n2足夠大

二、

μ1=μ2的假設(shè)檢驗(yàn)(兩個總體均值的檢驗(yàn))假設(shè)有兩個總體的獨(dú)立樣本,樣本含量分別為n1,n2。若假設(shè)H0:μ1=μ2成立,則檢驗(yàn)統(tǒng)計量計算公式如下表:服從自由度為的t分布要求n1、n2≥30要求n1、n2≥100第二節(jié)均數(shù)的假設(shè)檢驗(yàn)三、配對(匹配)檢驗(yàn)在分組設(shè)計中,常常采用配對設(shè)計。將受試對象按某些重要特征相近的原則配成對子,每對中的兩個個體隨機(jī)地給予兩種處理,稱為隨機(jī)配對設(shè)計。配對設(shè)計方式有:兩種同質(zhì)受試對象分別接受兩種不同的處理;同一受試對象分別接受兩種不同的處理;對同一受試對象處理前后的結(jié)果進(jìn)行比較,也稱自身對照。應(yīng)用配對設(shè)計可以減少實(shí)驗(yàn)的誤差和個體差異,排除對處理因素的干擾,提高檢驗(yàn)的靈敏度。這種設(shè)計的樣本數(shù)據(jù)是成對出現(xiàn)的。當(dāng)變量服從正態(tài),采用配對試驗(yàn),可以用配對試驗(yàn)的t檢驗(yàn)。若變量X1、X2分別服從正態(tài)分布,則X1-X2也服從正態(tài)分布。當(dāng)原假設(shè)μd=0(μd是每對觀察值的差值d=X1-X2所屬總體的均數(shù))成立,而σd未知,用樣本值替代,則有:服從自由度為n-1的t分布。其中d、Sd分別是d的平均數(shù)和標(biāo)準(zhǔn)差,n是所配的對數(shù)。其接受域、拒絕域同μ=μ0的t檢驗(yàn)。第二節(jié)均數(shù)的假設(shè)檢驗(yàn)【例8-3】某研究所為研究長時間持續(xù)運(yùn)動對血尿酸濃度的影響,讓10名男青年在自行車功力計上持續(xù)運(yùn)動兩小時,測得運(yùn)動前后的血尿酸濃度(mg%)數(shù)據(jù)如下表,試問長時間持續(xù)運(yùn)動對人體血尿酸濃度有無影響?(取α=0.01)。序號12345678910Σ運(yùn)動前5.44.83.63.45.75.53.63.85.24.5運(yùn)動后6.64.85.46.06.35.54.85.06.55.8dd2第二節(jié)均數(shù)的假設(shè)檢驗(yàn)解:(1)建立假設(shè):H0:μd=0,H1:μd≠0(2)計算統(tǒng)計量:(3)根據(jù)顯著性水平α=0.01,查表得雙側(cè)檢驗(yàn)臨界值:t0.01/2(9)=3.250(4)作出統(tǒng)計推斷結(jié)論:因?yàn)楱Ot∣=4.524>t0.01/2(9)=3.250,P<0.01,差異具高度顯著性,拒絕H0。可以認(rèn)為長時間持續(xù)運(yùn)動對人體血尿酸濃度有影響。序號12345678910Σ運(yùn)動前5.44.83.63.45.75.53.63.85.24.5運(yùn)動后6.64.85.46.06.35.54.85.06.55.8d-1.20-1.8-2.6-0.60-1.2-1.2-1.3-1.3-11.2d21.4403.246.760.3601.441.441.691.6918.1第二節(jié)均數(shù)的假設(shè)檢驗(yàn)在研究工作中,有時僅僅用平均水平對其總體進(jìn)行分析還不夠。例如,試想通過考試成績對一種新教法的效果進(jìn)行判定,經(jīng)教學(xué)實(shí)驗(yàn),新教法與舊教法考試成績均數(shù)屬同一總體,即新舊教法的平均水平相同,通常就認(rèn)為二者沒有差別。但是檢驗(yàn)離散程度時發(fā)現(xiàn)σ>σ0,也就是說,新教法拉大了學(xué)生成績之間的差距,即新教法可能對好的學(xué)生提高成績有促進(jìn)作用,而對差生來說更加不適應(yīng),新教法具有較強(qiáng)的針對性。所以不能說新教法的效果等同于舊教法。由此可見,研究工作中有時還需要進(jìn)行方差的假設(shè)檢驗(yàn)。另外,兩個獨(dú)立小樣本均值的檢驗(yàn)也需要了解方差是否齊性,即對方差進(jìn)行檢驗(yàn)。第三節(jié)方差的假設(shè)檢驗(yàn)一、

σ=σ0的假設(shè)檢驗(yàn)(一個正態(tài)總體方差檢驗(yàn))當(dāng)隨機(jī)變量服從正態(tài)分布x~N(μ,σ),從總體中抽取樣本觀測值為x1、x2…xn,如原假設(shè)σ=σ0成立,則有服從自由度為n-1的χ2分布。式中S2為σ2的估計值,

σ02為已知總體方差。對于顯著性水平α,其拒絕域和接受域如下圖:一個總方差檢驗(yàn)拒絕域與接受域第三節(jié)方差的假設(shè)檢驗(yàn)二、

σ1=σ2的假設(shè)檢驗(yàn)(兩個正態(tài)總體方差檢驗(yàn))當(dāng)隨機(jī)變量服從正態(tài)分布,x1~N(μ1,σ1),x2~N(μ2,σ2),從總體中抽取樣本觀測值為x11,x12…x1n;x21,x22…x2n,如原假設(shè)σ1=σ2成立,則有服從自由度為(n1-1,n2-1)的F分布,為了查表方面,設(shè)定S12>S22,對于顯著性水平α,拒絕域?yàn)镕≥F

α/2

(n1-1,n2-1),接受域?yàn)镕<F

α/2(n1-1,n2-1)

,如下圖兩個總方差檢驗(yàn)拒絕域與接受域第三節(jié)方差的假設(shè)檢驗(yàn)率是定性資料常用的描述指標(biāo),指某事發(fā)生的頻繁程度,如命中率、成功率、達(dá)標(biāo)率等。對率的假設(shè)檢驗(yàn)常用u檢驗(yàn)和χ2檢驗(yàn)。一、總體率的u檢驗(yàn)當(dāng)np與n(1-p)均大于5,p與(1-p)均大于0.01時,p近似正態(tài)分布,可用u檢驗(yàn)。第四節(jié)率的假設(shè)檢驗(yàn)x1、x2分別為兩樣本事件發(fā)生的次數(shù)二、總體率的χ2檢驗(yàn)χ2檢驗(yàn),它是一種用途較廣的檢驗(yàn)方法,除了可用于方差的檢驗(yàn)外,還可用于兩個或兩個以上樣本率或構(gòu)成比之間的檢驗(yàn),也可用于數(shù)據(jù)分布類型的檢驗(yàn)。總體率的χ2檢驗(yàn)是利用列聯(lián)表的形式,檢驗(yàn)實(shí)際頻數(shù)和理論頻數(shù)的差別是否是由抽樣誤差所引起的,達(dá)到由樣本率(或樣本構(gòu)成比)來推斷總體率(或總體構(gòu)成比)的目的。所謂列聯(lián)表是指由兩個以上的變量進(jìn)行交叉分類的頻數(shù)分布表。將橫向變量(行)的劃分類別視為R(row),縱向變量(列)的劃分類別視為C(column),則可以將每一個具體的列聯(lián)表稱為行×列列聯(lián)表,也可稱為R×C列聯(lián)表??傮w率的χ2檢驗(yàn)又稱為R×C列聯(lián)表的χ2檢驗(yàn)檢驗(yàn)統(tǒng)計量:第四節(jié)率的假設(shè)檢驗(yàn)近似服從自由度為df=(r-1)(c-1)的χ2分布。式中Aij是位于第i行第i列交叉處的實(shí)際頻數(shù),Tij是位于第i行第i列交叉處的理論頻數(shù)。理論頻數(shù)Tij的計算公式為:ni是A所在行的合計,nj是A所在列的合計,n是多個樣本數(shù)的合計。(A-T)反映實(shí)際頻數(shù)與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論