單變量推論統(tǒng)計(jì):假設(shè)檢驗(yàn)_第1頁(yè)
單變量推論統(tǒng)計(jì):假設(shè)檢驗(yàn)_第2頁(yè)
單變量推論統(tǒng)計(jì):假設(shè)檢驗(yàn)_第3頁(yè)
單變量推論統(tǒng)計(jì):假設(shè)檢驗(yàn)_第4頁(yè)
單變量推論統(tǒng)計(jì):假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、編輯ppt1第七講第七講 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)編輯ppt2第一節(jié) 假設(shè)檢驗(yàn)的基本問(wèn)題 一、假設(shè)檢驗(yàn)的基本概念一、假設(shè)檢驗(yàn)的基本概念 對(duì)對(duì)總體總體的概率分布或分布參數(shù)作的概率分布或分布參數(shù)作出某種出某種“假設(shè)假設(shè)”,根據(jù)抽樣得到的,根據(jù)抽樣得到的樣樣本觀測(cè)值本觀測(cè)值,運(yùn)用社會(huì)統(tǒng)計(jì)的分析方法,運(yùn)用社會(huì)統(tǒng)計(jì)的分析方法,檢驗(yàn)檢驗(yàn)這種這種“假設(shè)假設(shè)”是否正確是否正確,從而決,從而決定定接受或拒絕接受或拒絕“假設(shè)假設(shè)”,這就是本講這就是本講要討論的假設(shè)檢驗(yàn)問(wèn)題要討論的假設(shè)檢驗(yàn)問(wèn)題。編輯ppt31、什么是假設(shè)? 假設(shè)假設(shè):定義為一個(gè)調(diào)研:定義為一個(gè)調(diào)研者或管理者對(duì)被調(diào)查總者或管理者對(duì)被調(diào)查總體的某些特征所做的一

2、體的某些特征所做的一種假定或猜想。本講所種假定或猜想。本講所討論的假設(shè)都是經(jīng)驗(yàn)假討論的假設(shè)都是經(jīng)驗(yàn)假設(shè),而非理論假設(shè)。設(shè),而非理論假設(shè)。是是對(duì)總體參數(shù)的一種假設(shè)。對(duì)總體參數(shù)的一種假設(shè)。 常見(jiàn)的是對(duì)總體均值或常見(jiàn)的是對(duì)總體均值或比例和方差的檢驗(yàn);比例和方差的檢驗(yàn); 在分析之前,被檢驗(yàn)的在分析之前,被檢驗(yàn)的參數(shù)將被假定取一確定參數(shù)將被假定取一確定值。值。我認(rèn)為到我認(rèn)為到KFC消費(fèi)的人消費(fèi)的人平均花費(fèi)平均花費(fèi)15元!元!編輯ppt42、社會(huì)調(diào)查中常見(jiàn)的假設(shè)檢驗(yàn)問(wèn)題社會(huì)調(diào)查中常見(jiàn)的假設(shè)檢驗(yàn)問(wèn)題 根據(jù)以往資料,某地女青年的平均初婚年齡根據(jù)以往資料,某地女青年的平均初婚年齡=20=20歲,但今年根據(jù)歲,但

3、今年根據(jù)100100名女青年的隨機(jī)抽樣名女青年的隨機(jī)抽樣調(diào)查,調(diào)查, =21=21歲,問(wèn)能否認(rèn)為該地女青年的初婚歲,問(wèn)能否認(rèn)為該地女青年的初婚年齡比以往有所推遲年齡比以往有所推遲? 根據(jù)隨機(jī)抽樣調(diào)查,文化程度高的家庭,平均根據(jù)隨機(jī)抽樣調(diào)查,文化程度高的家庭,平均子女?dāng)?shù)也要少些。兩者呈負(fù)相關(guān)子女?dāng)?shù)也要少些。兩者呈負(fù)相關(guān)r=- -0.3。問(wèn)這。問(wèn)這樣的結(jié)論是否具有普遍意義?樣的結(jié)論是否具有普遍意義? 可見(jiàn),假設(shè)的內(nèi)容,都是數(shù)量化的內(nèi)容可見(jiàn),假設(shè)的內(nèi)容,都是數(shù)量化的內(nèi)容(=20=20?r=-0.3r=-0.3),而驗(yàn)證的依據(jù),都是憑),而驗(yàn)證的依據(jù),都是憑借抽樣調(diào)查所得到的結(jié)果。(抽樣必須從借抽樣調(diào)

4、查所得到的結(jié)果。(抽樣必須從總體總體隨機(jī)抽?。╇S機(jī)抽取)X編輯ppt5什么是假設(shè)什么是假設(shè)? 對(duì)總體參數(shù)的一種看法對(duì)總體參數(shù)的一種看法 總體參數(shù)包括總體參數(shù)包括總體均值、總體均值、比例、方差比例、方差等等 分析分析之前之前必需陳述必需陳述編輯ppt6概念概念事先對(duì)總體參數(shù)或分布形式作出某種假設(shè)事先對(duì)總體參數(shù)或分布形式作出某種假設(shè)然后利用樣本信息來(lái)判斷原假設(shè)是否成立然后利用樣本信息來(lái)判斷原假設(shè)是否成立類型類型參數(shù)假設(shè)檢驗(yàn)(參數(shù)假設(shè)檢驗(yàn)(檢驗(yàn)法、檢驗(yàn)法、t檢驗(yàn)法等檢驗(yàn)法等)非非參數(shù)假設(shè)檢驗(yàn)(參數(shù)假設(shè)檢驗(yàn)(在總體方差未知或知道甚少的情況下,在總體方差未知或知道甚少的情況下,利用樣本數(shù)據(jù)對(duì)總體分布形態(tài)

5、等進(jìn)行推斷的方法,在推斷利用樣本數(shù)據(jù)對(duì)總體分布形態(tài)等進(jìn)行推斷的方法,在推斷過(guò)程中不涉及有關(guān)總體分布的參數(shù),如卡方檢驗(yàn)過(guò)程中不涉及有關(guān)總體分布的參數(shù),如卡方檢驗(yàn))3. 特點(diǎn)特點(diǎn)采用邏輯上的反證法采用邏輯上的反證法依據(jù)統(tǒng)計(jì)上的小概率原理依據(jù)統(tǒng)計(jì)上的小概率原理什么是假設(shè)檢驗(yàn)?什么是假設(shè)檢驗(yàn)?編輯ppt7. 因此我們因此我們拒絕假設(shè)拒絕假設(shè) = 20. 如果這是如果這是總體的真實(shí)總體的真實(shí)均值均值m m = 50H0這個(gè)值不像這個(gè)值不像我們應(yīng)該得我們應(yīng)該得到的樣本均到的樣本均值值 .假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)的基本思想編輯ppt83. 小概率原理小概率原理 小概率原理小概率原理是假設(shè)檢驗(yàn)的是假設(shè)檢驗(yàn)的

6、基本依據(jù)基本依據(jù),即,即認(rèn)為認(rèn)為小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生的小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生的。當(dāng)進(jìn)行假設(shè)檢驗(yàn)時(shí),先假設(shè)當(dāng)進(jìn)行假設(shè)檢驗(yàn)時(shí),先假設(shè)H0正確,在此假設(shè)下,正確,在此假設(shè)下,若小概率事件若小概率事件A A出現(xiàn)的概率很小,例如出現(xiàn)的概率很小,例如P(A)=0.01,經(jīng)過(guò)取樣試驗(yàn)后,經(jīng)過(guò)取樣試驗(yàn)后,A出現(xiàn)了,則違反了出現(xiàn)了,則違反了上述原理,我們認(rèn)為這是一個(gè)不合理的結(jié)果。例上述原理,我們認(rèn)為這是一個(gè)不合理的結(jié)果。例如,我們每天從電視、報(bào)紙上都能看到交通事故如,我們每天從電視、報(bào)紙上都能看到交通事故的發(fā)生,但人們絕不會(huì)因此而放棄交通工具的使的發(fā)生,但人們絕不會(huì)因此而放棄交

7、通工具的使用。用?!疤字腥颂字腥恕泵刻鞄в陚恪⒂晷灰曌鞴秩?。每天帶雨傘、雨鞋而被視作怪人??梢?jiàn),人們總是在不自覺(jué)地運(yùn)用小概率原理??梢?jiàn),人們總是在不自覺(jué)地運(yùn)用小概率原理。編輯ppt9 這時(shí),我們只能懷疑作為小概率事件這時(shí),我們只能懷疑作為小概率事件A的前提假設(shè)的前提假設(shè)H0的正確性,于是否定的正確性,于是否定H0。反之,。反之,如果試驗(yàn)中如果試驗(yàn)中A沒(méi)有出現(xiàn),我們就沒(méi)有理由否沒(méi)有出現(xiàn),我們就沒(méi)有理由否定假設(shè)定假設(shè)H0,從而做出接受,從而做出接受H0的結(jié)論。的結(jié)論。 下面我們通過(guò)實(shí)例來(lái)說(shuō)明假設(shè)檢驗(yàn)的基下面我們通過(guò)實(shí)例來(lái)說(shuō)明假設(shè)檢驗(yàn)的基本思想及推理方法。本思想及推理方法。編輯ppt104、原假

8、設(shè)和備擇假設(shè)、原假設(shè)和備擇假設(shè)原假設(shè)原假設(shè)H0是關(guān)于總體均值而非樣本統(tǒng)計(jì)量的假設(shè)是關(guān)于總體均值而非樣本統(tǒng)計(jì)量的假設(shè)總是假設(shè)原假設(shè)是正確的總是假設(shè)原假設(shè)是正確的原假設(shè)可能被接受也可能被拒絕原假設(shè)可能被接受也可能被拒絕備擇假設(shè)備擇假設(shè)H1是原假設(shè)的對(duì)立是原假設(shè)的對(duì)立備擇假設(shè)可能被接受也可能被拒絕備擇假設(shè)可能被接受也可能被拒絕備擇假設(shè)是試圖要建立的檢驗(yàn)備擇假設(shè)是試圖要建立的檢驗(yàn)編輯ppt11二、假設(shè)檢驗(yàn)的基本思路與方法二、假設(shè)檢驗(yàn)的基本思路與方法編輯ppt12(1)建立假設(shè)建立假設(shè)(2)求抽樣分布求抽樣分布(4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量計(jì)算檢驗(yàn)統(tǒng)計(jì)量(3)選擇顯著性選擇顯著性水平和否定域水平和否定域(5)判定

9、判定所所所所包有包有含統(tǒng)含統(tǒng)的計(jì)的計(jì)步檢步檢驟驗(yàn)驟驗(yàn) 根據(jù)以往多年的統(tǒng)計(jì)表明,宜賓學(xué)院根據(jù)以往多年的統(tǒng)計(jì)表明,宜賓學(xué)院社會(huì)統(tǒng)計(jì)學(xué)社會(huì)統(tǒng)計(jì)學(xué)的平均成績(jī)?yōu)榈钠骄煽?jī)?yōu)?0分,隨機(jī)分,隨機(jī)抽取抽取100個(gè)學(xué)生,其平均成績(jī)?yōu)閭€(gè)學(xué)生,其平均成績(jī)?yōu)?0分,問(wèn)今分,問(wèn)今年宜賓學(xué)院年宜賓學(xué)院社會(huì)統(tǒng)計(jì)學(xué)社會(huì)統(tǒng)計(jì)學(xué)成績(jī)是否下降?成績(jī)是否下降?編輯ppt13提出原假設(shè)和備擇假設(shè)提出原假設(shè)和備擇假設(shè) 什么是原假設(shè)?什么是原假設(shè)?(Null Hypothesis)1. 待檢驗(yàn)的假設(shè),又稱待檢驗(yàn)的假設(shè),又稱“0假設(shè)假設(shè)”2. 如果錯(cuò)誤地作出決策會(huì)導(dǎo)致一系列后果如果錯(cuò)誤地作出決策會(huì)導(dǎo)致一系列后果3. 總是有等號(hào)總是有等號(hào)

10、, 或或 4. 表示為表示為 H0H0:m m 某一數(shù)值某一數(shù)值 指定為指定為 = 號(hào),即號(hào),即 或或 例如例如, H0:m m 3190(元)(元)為什么叫為什么叫0 0假設(shè)假設(shè)編輯ppt14什么是備擇假設(shè)?什么是備擇假設(shè)?(Alternative Hypothesis)1. 與原假設(shè)對(duì)立的假設(shè)與原假設(shè)對(duì)立的假設(shè)2. 總是有不等號(hào)總是有不等號(hào): , 或或 3. 表示為表示為 H1H1:m m 某一數(shù)值,或某一數(shù)值,或m m 某一數(shù)值某一數(shù)值例如例如, H1:m m 3910(元元),或,或m m 3910(3910(元元) )編輯ppt15什么檢驗(yàn)統(tǒng)計(jì)量?什么檢驗(yàn)統(tǒng)計(jì)量?u 用于假設(shè)檢驗(yàn)問(wèn)題

11、的統(tǒng)計(jì)量用于假設(shè)檢驗(yàn)問(wèn)題的統(tǒng)計(jì)量u 選擇統(tǒng)計(jì)量的方法與參數(shù)估計(jì)相同,需考慮選擇統(tǒng)計(jì)量的方法與參數(shù)估計(jì)相同,需考慮是大樣本還是小樣本是大樣本還是小樣本總體方差已知還是未知總體方差已知還是未知檢驗(yàn)統(tǒng)計(jì)量的基本形式為檢驗(yàn)統(tǒng)計(jì)量的基本形式為nxzm0編輯ppt16規(guī)定顯著性水平規(guī)定顯著性水平 什么是顯著性水平?什么是顯著性水平?1. 是一個(gè)概率值是一個(gè)概率值2. 原假設(shè)為真時(shí),拒絕原假設(shè)的概率原假設(shè)為真時(shí),拒絕原假設(shè)的概率 被稱為抽樣分布的拒絕域被稱為抽樣分布的拒絕域3. 表示為表示為 (alpha) 常用的常用的 值有值有0.01, 0.05, 0.104. 由研究者事先確定由研究者事先確定編輯pp

12、t17作出統(tǒng)計(jì)決策作出統(tǒng)計(jì)決策計(jì)算檢驗(yàn)的統(tǒng)計(jì)量計(jì)算檢驗(yàn)的統(tǒng)計(jì)量根據(jù)給定的顯著性水平根據(jù)給定的顯著性水平 ,查表得出相應(yīng),查表得出相應(yīng)的臨界值的臨界值Z Z 或或Z Z /2 /2將檢驗(yàn)統(tǒng)計(jì)量的值與將檢驗(yàn)統(tǒng)計(jì)量的值與 水平的臨界值進(jìn)水平的臨界值進(jìn)行比較行比較得出接受或拒絕原假設(shè)的結(jié)論得出接受或拒絕原假設(shè)的結(jié)論編輯ppt18兩類錯(cuò)誤分析 小概率原理是假設(shè)檢驗(yàn)的基本依據(jù),然而,對(duì)于小小概率原理是假設(shè)檢驗(yàn)的基本依據(jù),然而,對(duì)于小概率事件,無(wú)論其概率多么小,還是可能發(fā)生的,概率事件,無(wú)論其概率多么小,還是可能發(fā)生的,所以,利用小概率原理為基礎(chǔ)的假設(shè)檢驗(yàn)方法進(jìn)行所以,利用小概率原理為基礎(chǔ)的假設(shè)檢驗(yàn)方法進(jìn)行

13、檢驗(yàn),可能會(huì)做出錯(cuò)誤的判斷,主要有兩種形式檢驗(yàn),可能會(huì)做出錯(cuò)誤的判斷,主要有兩種形式 (1)原假設(shè))原假設(shè)H0實(shí)際是正確的,但卻錯(cuò)誤地拒絕了實(shí)際是正確的,但卻錯(cuò)誤地拒絕了H0,這樣就犯了這樣就犯了“棄真棄真”的錯(cuò)誤,通常稱為第一類錯(cuò)誤。的錯(cuò)誤,通常稱為第一類錯(cuò)誤。由于僅當(dāng)所考慮的小概率事件由于僅當(dāng)所考慮的小概率事件A發(fā)生時(shí)才拒絕發(fā)生時(shí)才拒絕H0,所以犯第一類錯(cuò)誤的概率就是條件概率:所以犯第一類錯(cuò)誤的概率就是條件概率:(2)原假設(shè))原假設(shè)H0實(shí)際是不正確的,但是卻錯(cuò)誤地接受實(shí)際是不正確的,但是卻錯(cuò)誤地接受了了H0,這樣就犯了,這樣就犯了“納偽納偽”的錯(cuò)誤,通常稱為第二的錯(cuò)誤,通常稱為第二類錯(cuò)誤。

14、犯第二類錯(cuò)誤的概率記為類錯(cuò)誤。犯第二類錯(cuò)誤的概率記為 。)|(00真拒HHP編輯ppt19編輯ppt20X編輯ppt21 我們自然希望犯這兩類錯(cuò)誤的概率越小越好。但當(dāng)樣本容量n確定后,犯這兩類錯(cuò)誤的概率不可能同時(shí)被控制,通常在我們根據(jù)歷史經(jīng)驗(yàn)選取恰當(dāng)?shù)娘@著性水平后,通過(guò)擴(kuò)大樣本容量n的方式來(lái)使第二類錯(cuò)誤的概率減小。編輯ppt22陪審團(tuán)審判陪審團(tuán)審判裁決裁決實(shí)際情況實(shí)際情況無(wú)罪無(wú)罪有罪有罪無(wú)罪無(wú)罪正確正確錯(cuò)誤錯(cuò)誤有罪有罪錯(cuò)誤錯(cuò)誤正確正確H0 檢驗(yàn)檢驗(yàn)決策決策實(shí)際情況實(shí)際情況H0為真為真H0為假為假接受接受H01 - 第二類錯(cuò)第二類錯(cuò)誤誤( ()拒絕拒絕H0第一類錯(cuò)第一類錯(cuò)誤誤( ()功效功效(1

15、-(1-)編輯ppt23 錯(cuò)誤和錯(cuò)誤和 錯(cuò)誤的關(guān)系錯(cuò)誤的關(guān)系你不能同時(shí)減你不能同時(shí)減少兩類錯(cuò)誤少兩類錯(cuò)誤!編輯ppt24第二節(jié)第二節(jié) 單一總體參數(shù)的假設(shè)檢驗(yàn)單一總體參數(shù)的假設(shè)檢驗(yàn)Z 檢驗(yàn)檢驗(yàn)(單尾和雙尾)(單尾和雙尾) t 檢驗(yàn)檢驗(yàn)(單尾和雙尾)(單尾和雙尾)Z 檢驗(yàn)檢驗(yàn)(單尾和雙尾)(單尾和雙尾) c c2 2檢驗(yàn)檢驗(yàn)(單尾和雙尾)(單尾和雙尾)均值均值一個(gè)總體一個(gè)總體比例比例方差方差編輯ppt25 建立假設(shè)的三種情況:建立假設(shè)的三種情況:計(jì)依據(jù))人均收入是否提高的統(tǒng)可以得出結(jié)論,作為月元元( 871:871:10mmHH農(nóng)村居民月人均收入水平的評(píng)估農(nóng)村居民月人均收入水平的評(píng)估編輯ppt26

16、 檢驗(yàn)中學(xué)老師對(duì)學(xué)生平均成績(jī)承諾的有效性:檢驗(yàn)中學(xué)老師對(duì)學(xué)生平均成績(jī)承諾的有效性:的陳述)懷疑中學(xué)老師教學(xué)水平( 6 .67:6 .67:10mmHH中學(xué)老師對(duì)學(xué)生學(xué)習(xí)成績(jī)的承諾中學(xué)老師對(duì)學(xué)生學(xué)習(xí)成績(jī)的承諾編輯ppt27 統(tǒng)計(jì)報(bào)表的驗(yàn)證:統(tǒng)計(jì)報(bào)表的驗(yàn)證:拒絕報(bào)表數(shù)據(jù))元元( 2235:2235:10mmHH統(tǒng)計(jì)數(shù)據(jù)是否真實(shí)的依據(jù)統(tǒng)計(jì)數(shù)據(jù)是否真實(shí)的依據(jù)編輯ppt28雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn) ( (假設(shè)的形式假設(shè)的形式) )假設(shè)假設(shè)研究的問(wèn)題研究的問(wèn)題雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)右側(cè)檢驗(yàn)H0m m = m m0 0m m m m0 0m m m m0 0H1m m m m0

17、 0m m m m0 0編輯ppt29 根據(jù)否定域位置根據(jù)否定域位置的不同,可以將的不同,可以將假設(shè)檢驗(yàn)分為雙假設(shè)檢驗(yàn)分為雙側(cè)檢驗(yàn)和單側(cè)檢側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)。驗(yàn)。 在統(tǒng)計(jì)中,在統(tǒng)計(jì)中,必須把否定域必須把否定域分配到抽樣分分配到抽樣分布的兩端的檢布的兩端的檢驗(yàn),被稱為雙驗(yàn),被稱為雙側(cè)檢驗(yàn)。側(cè)檢驗(yàn)。 在統(tǒng)計(jì)中,可以事先能在統(tǒng)計(jì)中,可以事先能預(yù)測(cè)偏差方向,因而可以預(yù)測(cè)偏差方向,因而可以把否定域集中到抽樣分布把否定域集中到抽樣分布更合適的一端的檢驗(yàn),被更合適的一端的檢驗(yàn),被稱為單側(cè)檢驗(yàn)。稱為單側(cè)檢驗(yàn)。 雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)編輯ppt30雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)(原假設(shè)與備擇假設(shè)的確定)雙側(cè)檢驗(yàn)屬

18、于雙側(cè)檢驗(yàn)屬于決策中的假設(shè)檢驗(yàn)決策中的假設(shè)檢驗(yàn)。也就是說(shuō),。也就是說(shuō),不論是拒絕不論是拒絕H0還是接受還是接受H0,我們都必需采,我們都必需采取相應(yīng)的行動(dòng)措施。取相應(yīng)的行動(dòng)措施。例如,某單位職工上月平均收入為例如,某單位職工上月平均收入為2100元,元,本月大于或小于本月大于或小于2100元均屬于發(fā)生變化。元均屬于發(fā)生變化。建立的原假設(shè)與備擇假設(shè)應(yīng)為建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: m m 2100 H1: m m 2100編輯ppt31雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)(確定假設(shè)的步驟)1. 某單位職工上月平均收入為某單位職工上月平均收入為2100元,本月調(diào)查了元,本月調(diào)查了100名職工,平均收入為名職工,

19、平均收入為2200元,標(biāo)準(zhǔn)差為元,標(biāo)準(zhǔn)差為15元。元。問(wèn)該單位職工本月平均收入與上月相比是否有變化?問(wèn)該單位職工本月平均收入與上月相比是否有變化?2. 步驟步驟 從統(tǒng)計(jì)角度陳述問(wèn)題從統(tǒng)計(jì)角度陳述問(wèn)題 (m m = 2100) 從統(tǒng)計(jì)角度提出相反的問(wèn)題從統(tǒng)計(jì)角度提出相反的問(wèn)題 (m m 2100) 必需互斥和窮盡必需互斥和窮盡 提出原假設(shè)提出原假設(shè) (m m = 2100) 提出備擇假設(shè)提出備擇假設(shè) (m m 2100) 有有 符號(hào)符號(hào)編輯ppt32雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)(確定假設(shè)的步驟)1. 某單位職工上月平均收入為某單位職工上月平均收入為2100元,本月調(diào)查了元,本月調(diào)查了100名職工,平均收入為

20、名職工,平均收入為2200元,標(biāo)準(zhǔn)差為元,標(biāo)準(zhǔn)差為15元。問(wèn)元。問(wèn)該單位職工本月平均收入與上月相比是否有變化?該單位職工本月平均收入與上月相比是否有變化?解解首先建立虛無(wú)假設(shè)(首先建立虛無(wú)假設(shè)(H0)和研究假設(shè)()和研究假設(shè)(H1)即有)即有H0 :=2100 =2100 H1 :m m 2100選擇顯著性水平選擇顯著性水平=0.05=0.05,查標(biāo)準(zhǔn)正態(tài)分布得,查標(biāo)準(zhǔn)正態(tài)分布得由于由于Z=6.67Z=6.67 所以,拒絕虛無(wú)假設(shè),所以,拒絕虛無(wú)假設(shè),即從總體上說(shuō),該單位職工平均收入與上月相即從總體上說(shuō),該單位職工平均收入與上月相比有變化。比有變化。96. 12/05. 0Z67. 6100/

21nSXZm96. 12/05. 0Z編輯ppt33雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)(顯著性水平與拒絕域 ) /2 編輯ppt34雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)(顯著性水平與拒絕域 ) /2 編輯ppt35雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)(顯著性水平與拒絕域 ) /2 編輯ppt36雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)(顯著性水平與拒絕域 ) /2 編輯ppt37 例例 一位研究者試圖檢驗(yàn)?zāi)骋簧鐣?huì)調(diào)查所運(yùn)用一位研究者試圖檢驗(yàn)?zāi)骋簧鐣?huì)調(diào)查所運(yùn)用的抽樣程序,該項(xiàng)調(diào)查是由一些缺乏經(jīng)驗(yàn)的訪問(wèn)員進(jìn)的抽樣程序,該項(xiàng)調(diào)查是由一些缺乏經(jīng)驗(yàn)的訪問(wèn)員進(jìn)行的。研究者懷疑屬于干部和知識(shí)分子的家庭抽得過(guò)行的。研究者懷疑屬于干部和知識(shí)分子的家庭抽得過(guò)多。過(guò)去的統(tǒng)計(jì)

22、資料表明,該街區(qū)的家庭收入是多。過(guò)去的統(tǒng)計(jì)資料表明,該街區(qū)的家庭收入是7500元,標(biāo)準(zhǔn)差是元,標(biāo)準(zhǔn)差是1500元;此次調(diào)查共抽取元;此次調(diào)查共抽取100個(gè)家庭樣個(gè)家庭樣本平均收入是本平均收入是7900元。問(wèn):該研究人員是否有理由懷元。問(wèn):該研究人員是否有理由懷疑該樣本有偏估?(選用疑該樣本有偏估?(選用=0.05)總體均值和成數(shù)的單樣本檢驗(yàn)1已知,對(duì)總體均值的檢驗(yàn)已知,對(duì)總體均值的檢驗(yàn)實(shí)際上是要檢驗(yàn)實(shí)際上是要檢驗(yàn)“隨隨機(jī)抽樣機(jī)抽樣”這個(gè)零假設(shè)這個(gè)零假設(shè) 編輯ppt38 解解 根據(jù)題意,可做如下假設(shè),并做單側(cè)檢驗(yàn)根據(jù)題意,可做如下假設(shè),并做單側(cè)檢驗(yàn) 因因=0.05,查表得,查表得Z 0.05=1

23、.65,故否定域?yàn)椋史穸ㄓ驗(yàn)楦鶕?jù)中心極限定理,檢驗(yàn)統(tǒng)計(jì)量根據(jù)中心極限定理,檢驗(yàn)統(tǒng)計(jì)量計(jì)算得計(jì)算得 檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量Z的計(jì)算表明,樣本均值比總體均值大的計(jì)算表明,樣本均值比總體均值大267個(gè)個(gè)標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)差( ),超過(guò)了顯著性水平規(guī)定的臨界值,調(diào)查者應(yīng)該),超過(guò)了顯著性水平規(guī)定的臨界值,調(diào)查者應(yīng)該否定否定“隨機(jī)抽樣隨機(jī)抽樣”的零假設(shè)。也就是說(shuō),由于抽樣在程序上不合的零假設(shè)。也就是說(shuō),由于抽樣在程序上不合要要求,這項(xiàng)社會(huì)調(diào)查有必要重新組織。求,這項(xiàng)社會(huì)調(diào)查有必要重新組織。 7500:7500:10mmHH)1,010015007500 N(X Z65.167.2100150075007900

24、 Z65. 1ZX編輯ppt39 中心極限定理實(shí)際解決了大樣本均值的檢驗(yàn)問(wèn)中心極限定理實(shí)際解決了大樣本均值的檢驗(yàn)問(wèn)題。假定樣本比較大題。假定樣本比較大(n50,這在社會(huì)調(diào)查中一般,這在社會(huì)調(diào)查中一般都能得到滿足都能得到滿足),樣本均值的抽樣分布就與總體分布,樣本均值的抽樣分布就與總體分布無(wú)關(guān),而服從正態(tài)分布。當(dāng)無(wú)關(guān),而服從正態(tài)分布。當(dāng)H0成立時(shí),樣本均值的成立時(shí),樣本均值的觀察值比較集中地分布在總體均值觀察值比較集中地分布在總體均值周?chē)?;?dāng)周?chē)划?dāng)H0不不成立時(shí),成立時(shí), 將對(duì)將對(duì)有明顯偏離的趨勢(shì)。因而,我們有明顯偏離的趨勢(shì)。因而,我們可以在選定的顯著性水平上,通過(guò)計(jì)算檢驗(yàn)統(tǒng)計(jì)量可以在選定的顯

25、著性水平上,通過(guò)計(jì)算檢驗(yàn)統(tǒng)計(jì)量Z,對(duì)零假設(shè)進(jìn)行檢定。,對(duì)零假設(shè)進(jìn)行檢定。 注:當(dāng)注:當(dāng)未知時(shí),只要樣本量很大,就可用未知時(shí),只要樣本量很大,就可用S來(lái)代替來(lái)代替 。但對(duì)于小樣本,。但對(duì)于小樣本,Z檢驗(yàn)就要用檢驗(yàn)就要用 t 檢驗(yàn)來(lái)檢驗(yàn)來(lái)替代了,而且還必須嚴(yán)格限于正態(tài)總體。替代了,而且還必須嚴(yán)格限于正態(tài)總體。X編輯ppt40 解解 根據(jù)題意,可作如下的假設(shè),并做雙側(cè)檢驗(yàn)根據(jù)題意,可作如下的假設(shè),并做雙側(cè)檢驗(yàn) H0:2330元元 H1:2330元元因因0.05,查正態(tài)分布表得,查正態(tài)分布表得Z/21.96,故否定域,故否定域|Z|1.96 計(jì)算檢驗(yàn)統(tǒng)計(jì)量計(jì)算檢驗(yàn)統(tǒng)計(jì)量 Z 1.20196 所以,不能

26、認(rèn)為該單位人均月收入不是所以,不能認(rèn)為該單位人均月收入不是2330元,即不能元,即不能認(rèn)為該統(tǒng)計(jì)報(bào)表有誤。認(rèn)為該統(tǒng)計(jì)報(bào)表有誤。 nX/mnSX/m81例例 某單位統(tǒng)計(jì)報(bào)表顯示,人均月收入為某單位統(tǒng)計(jì)報(bào)表顯示,人均月收入為2330元,為了驗(yàn)元,為了驗(yàn)證證該統(tǒng)計(jì)報(bào)表的正確性,作了共該統(tǒng)計(jì)報(bào)表的正確性,作了共81人的抽樣調(diào)查,樣本人均月收入人的抽樣調(diào)查,樣本人均月收入為為2350元,標(biāo)準(zhǔn)差為元,標(biāo)準(zhǔn)差為150元,問(wèn)能否說(shuō)明該統(tǒng)計(jì)報(bào)表顯示的人均元,問(wèn)能否說(shuō)明該統(tǒng)計(jì)報(bào)表顯示的人均 收入的數(shù)字有誤收入的數(shù)字有誤(取顯著性水平取顯著性水平0.05)。 此乃此乃“總體均值總體均值”零

27、假設(shè)的檢驗(yàn)零假設(shè)的檢驗(yàn)編輯ppt41 )%95(88096. 105. 003. 3-5021880871880H808 220,50n11的可靠程度否定原假設(shè)即有有誤的。,可以認(rèn)為統(tǒng)計(jì)報(bào)表是元均收入為據(jù)抽樣調(diào)查不能認(rèn)為人因此拒絕原假設(shè),即根,體平均數(shù)存在顯著差異,說(shuō)明樣本平均數(shù)和總因?yàn)闀r(shí),對(duì)應(yīng)的臨界值元:元;:解:)代替未知,用:選擇檢驗(yàn)統(tǒng)計(jì)量(當(dāng)方法mmmZZZnSXZHS 為了驗(yàn)證統(tǒng)計(jì)報(bào)表的正確性,作了共五十人的抽樣調(diào)查,人為了驗(yàn)證統(tǒng)計(jì)報(bào)表的正確性,作了共五十人的抽樣調(diào)查,人均收入的結(jié)果有:均收入的結(jié)果有: ,問(wèn)能否證明統(tǒng)計(jì)報(bào),問(wèn)能否證明統(tǒng)計(jì)報(bào)表中人均收入表中人均收入=880=880元是

28、正確的(顯著性水平元是正確的(顯著性水平=0.05=0.05)。)。 假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系元元,21871SX編輯ppt42元。假設(shè)推翻了原小概率事件,從而也就說(shuō)出現(xiàn)了出來(lái)的區(qū)間內(nèi),也就是樣本計(jì)算未包含在),即:的區(qū)間為:的就不否定原假設(shè)如果求出的區(qū)間包含(區(qū)間估計(jì)):方法,880%9588082. 687 865.18( 502196. 187196. 195%,2mmmmnXHO 編輯ppt43單側(cè)檢驗(yàn)單側(cè)檢驗(yàn)(原假設(shè)與備擇假設(shè)的確定)檢驗(yàn)檢驗(yàn)研究中的假設(shè)研究中的假設(shè)將所研究的假設(shè)作為備擇假設(shè)將所研究的假設(shè)作為備擇假設(shè)H1將認(rèn)為研究結(jié)果是無(wú)效的說(shuō)法或理論作將認(rèn)為

29、研究結(jié)果是無(wú)效的說(shuō)法或理論作為原假設(shè)為原假設(shè)H0?;蛘哒f(shuō),把希望?;蛘哒f(shuō),把希望(想要想要)證明證明的假設(shè)作為備擇假設(shè)的假設(shè)作為備擇假設(shè)1. 先確立備擇假設(shè)先確立備擇假設(shè)H1編輯ppt44單側(cè)檢驗(yàn)單側(cè)檢驗(yàn)(原假設(shè)與備擇假設(shè)的確定)n 例如,根據(jù)抽樣調(diào)查,九個(gè)人的平均例如,根據(jù)抽樣調(diào)查,九個(gè)人的平均初婚年齡是初婚年齡是23.5歲,該地區(qū)平均初婚歲,該地區(qū)平均初婚年齡是否超過(guò)年齡是否超過(guò)20歲?歲?屬于研究中的假設(shè)屬于研究中的假設(shè)建立的原假設(shè)與備擇假設(shè)應(yīng)為建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: m m 20 H1: m m 20編輯ppt45單側(cè)檢驗(yàn)單側(cè)檢驗(yàn)(原假設(shè)與備擇假設(shè)的確定)檢驗(yàn)檢驗(yàn)?zāi)稠?xiàng)聲明的

30、有效性某項(xiàng)聲明的有效性將所作出的說(shuō)明將所作出的說(shuō)明(聲明聲明)作為原假設(shè)作為原假設(shè)對(duì)該說(shuō)明的質(zhì)疑作為備擇假設(shè)對(duì)該說(shuō)明的質(zhì)疑作為備擇假設(shè)先確立原假設(shè)先確立原假設(shè)H01. 除非我們有證據(jù)表明除非我們有證據(jù)表明“聲明聲明”無(wú)效,否則無(wú)效,否則就應(yīng)認(rèn)為該就應(yīng)認(rèn)為該“聲明聲明”是有效的是有效的編輯ppt46 2.小樣本總體均值的檢驗(yàn)(學(xué)生小樣本總體均值的檢驗(yàn)(學(xué)生t分布)分布) 中心極限定理解決了大樣本均值的檢驗(yàn)問(wèn)題。但中心極限定理解決了大樣本均值的檢驗(yàn)問(wèn)題。但是當(dāng)是當(dāng)n較小時(shí),用這種方法求出的概率可能是錯(cuò)誤的,較小時(shí),用這種方法求出的概率可能是錯(cuò)誤的,有必要做某種修正。于是有人設(shè)計(jì)了另一種檢驗(yàn)統(tǒng)計(jì)有必

31、要做某種修正。于是有人設(shè)計(jì)了另一種檢驗(yàn)統(tǒng)計(jì)量量) 1(1ntnSXtm 這個(gè)統(tǒng)計(jì)量最初是由戈塞特這個(gè)統(tǒng)計(jì)量最初是由戈塞特(1876一一1937)用筆名用筆名“學(xué)生學(xué)生”發(fā)表,所以這個(gè)統(tǒng)計(jì)量的抽樣分布稱為學(xué)生發(fā)表,所以這個(gè)統(tǒng)計(jì)量的抽樣分布稱為學(xué)生t分布。比較分布。比較t和和Z,我們注意到它們的分子相同,而分,我們注意到它們的分子相同,而分母卻稍有不同:母卻稍有不同:為為S所代替所代替(這一點(diǎn)無(wú)須解釋這一點(diǎn)無(wú)須解釋);根號(hào)下是根號(hào)下是n1。編輯ppt47 當(dāng)當(dāng)Z為為t替代時(shí),雖用因子替代時(shí),雖用因子n1所導(dǎo)致的修正看起所導(dǎo)致的修正看起來(lái)不大,但在樣本容量較小時(shí),這種修正就會(huì)起很大來(lái)不大,但在樣本容

32、量較小時(shí),這種修正就會(huì)起很大作用了。所以當(dāng)不知道作用了。所以當(dāng)不知道值、且樣本容量較小時(shí),我值、且樣本容量較小時(shí),我們應(yīng)該考慮應(yīng)用們應(yīng)該考慮應(yīng)用t分布而不是分布而不是Z分布。分布。 采用采用n1的的原因:樣本數(shù)原因:樣本數(shù)據(jù)的離散程度據(jù)的離散程度小于總體數(shù)據(jù)小于總體數(shù)據(jù)的離散程度。的離散程度。 n1實(shí)際為自實(shí)際為自由度數(shù)由度數(shù)k。編輯ppt48 例例 已知初婚年齡服從正態(tài)分布。根據(jù)已知初婚年齡服從正態(tài)分布。根據(jù)10人的調(diào)人的調(diào)查有查有 = 23.5歲,歲,S=3歲,問(wèn)是否可以認(rèn)為該地區(qū)的平歲,問(wèn)是否可以認(rèn)為該地區(qū)的平均初婚年齡已超過(guò)均初婚年齡已超過(guò)20歲?(歲?(=0.01) 解解 H0:m

33、m=20;H1:m m20 因?yàn)橐驗(yàn)閚小,又不知小,又不知值,因此用值,因此用t檢驗(yàn)檢驗(yàn) 對(duì)自由度對(duì)自由度9來(lái)講,單側(cè)檢驗(yàn)和顯著性水平來(lái)講,單側(cè)檢驗(yàn)和顯著性水平0.01,查,查表知否定域?yàn)楸碇穸ㄓ驗(yàn)閠值等于或大于值等于或大于 2.821。再計(jì)算檢驗(yàn)統(tǒng)計(jì)量。再計(jì)算檢驗(yàn)統(tǒng)計(jì)量X821. 25 . 39/3205 .231nSXtm 因此拒絕因此拒絕H0,即可以認(rèn)為在顯著性水平為,即可以認(rèn)為在顯著性水平為0.01的的條件下,該地區(qū)的初婚年齡已超過(guò)條件下,該地區(qū)的初婚年齡已超過(guò)20歲。歲。編輯ppt49單側(cè)檢驗(yàn)單側(cè)檢驗(yàn)(顯著性水平與拒絕域 ) 編輯ppt50左側(cè)檢驗(yàn)左側(cè)檢驗(yàn)(顯著性水平與拒絕域 )

34、H0值值臨界值臨界值樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量拒絕域拒絕域接受域接受域置信水平置信水平編輯ppt51左側(cè)檢驗(yàn)左側(cè)檢驗(yàn)(顯著性水平與拒絕域 ) 編輯ppt52右側(cè)檢驗(yàn)右側(cè)檢驗(yàn)(顯著性水平與拒絕域 ) 編輯ppt53右側(cè)檢驗(yàn)右側(cè)檢驗(yàn)(顯著性水平與拒絕域 ) 編輯ppt54提出原假設(shè)提出原假設(shè): H0: m m 25%選擇備擇假設(shè)選擇備擇假設(shè): H1: : m m 25% 右側(cè)檢驗(yàn)右側(cè)檢驗(yàn)(例子)編輯ppt55 3.大樣本成數(shù)的檢驗(yàn)大樣本成數(shù)的檢驗(yàn) 有時(shí),需要對(duì)總體中具有某種特征的單位有時(shí),需要對(duì)總體中具有某種特征的單位在總體中所占的的比例在總體中所占的的比例 p(即總體成數(shù))作(即總體成數(shù))作顯著性檢驗(yàn)

35、,如人口中的失業(yè)率、學(xué)齡兒童顯著性檢驗(yàn),如人口中的失業(yè)率、學(xué)齡兒童中的失學(xué)率等等。成數(shù)檢驗(yàn)與二項(xiàng)檢驗(yàn)的聯(lián)中的失學(xué)率等等。成數(shù)檢驗(yàn)與二項(xiàng)檢驗(yàn)的聯(lián)系是不言而愈的。因?yàn)樵诙?xiàng)檢驗(yàn)中,隨機(jī)系是不言而愈的。因?yàn)樵诙?xiàng)檢驗(yàn)中,隨機(jī)變量是樣本的變量是樣本的“成功成功”次數(shù)次數(shù)x。而在成數(shù)檢驗(yàn)中,。而在成數(shù)檢驗(yàn)中,隨機(jī)變量是樣本的隨機(jī)變量是樣本的“成功成功”比例比例 (即樣本(即樣本成數(shù)),這樣在成數(shù)),這樣在 n 一定的情況下,顯然有一定的情況下,顯然有 ppnxnq1nxp 編輯ppt56 既然既然 是一個(gè)隨機(jī)變量,那么把具體概率賦予樣是一個(gè)隨機(jī)變量,那么把具體概率賦予樣本成數(shù)的每一個(gè)取值,我們就得到了樣

36、本成數(shù)的抽樣本成數(shù)的每一個(gè)取值,我們就得到了樣本成數(shù)的抽樣分布。根據(jù)中心極限定理,我們不難想見(jiàn),當(dāng)分布。根據(jù)中心極限定理,我們不難想見(jiàn),當(dāng)n足夠大足夠大時(shí),樣本成數(shù)的抽樣分布也服從正態(tài)分布。由于數(shù)學(xué)時(shí),樣本成數(shù)的抽樣分布也服從正態(tài)分布。由于數(shù)學(xué)上很容易證明上很容易證明 , ,這樣一來(lái),這樣一來(lái),對(duì)于大樣本對(duì)于大樣本(n30,np5),成數(shù)的檢驗(yàn)統(tǒng)計(jì)量,成數(shù)的檢驗(yàn)統(tǒng)計(jì)量 Z 可表示可表示為為npqpD)(npqppZ/pppE)(編輯ppt57 例例 某地區(qū)成年男性中吸煙者占某地區(qū)成年男性中吸煙者占64%,經(jīng)過(guò)戒煙,經(jīng)過(guò)戒煙宣傳后進(jìn)行抽樣調(diào)查,發(fā)現(xiàn)宣傳后進(jìn)行抽樣調(diào)查,發(fā)現(xiàn)100名被調(diào)查者中,有名

37、被調(diào)查者中,有55人是吸煙者,試問(wèn)戒煙宣傳是否有成效(人是吸煙者,試問(wèn)戒煙宣傳是否有成效(=0.05) 解解 已知已知n10030,npl000.64645,故可使,故可使用正態(tài)檢驗(yàn)。又知用正態(tài)檢驗(yàn)。又知 0.55,p0.64,q0.36,則,則 H0: p=0.64 H1: p0.64 據(jù)題意,選擇單側(cè)檢驗(yàn),因據(jù)題意,選擇單側(cè)檢驗(yàn),因0.05,查正態(tài)分布表得否定域?yàn)椋檎龖B(tài)分布表得否定域?yàn)?|Z|165 。再計(jì)算檢驗(yàn)統(tǒng)計(jì)量。再計(jì)算檢驗(yàn)統(tǒng)計(jì)量 因此,否定零假設(shè),即認(rèn)為戒煙宣傳收到了顯著成效。因此,否定零假設(shè),即認(rèn)為戒煙宣傳收到了顯著成效。65. 188. 1100/36. 064. 064. 055. 0npqppZp編輯ppt58練習(xí):練習(xí): 1. 為了檢驗(yàn)統(tǒng)計(jì)報(bào)表的正確性,作了共為了檢驗(yàn)統(tǒng)計(jì)報(bào)表的正確性,作了共50人的抽樣調(diào)查,人人的抽樣調(diào)查,人均收入為均收入為871元,標(biāo)準(zhǔn)差為元,標(biāo)準(zhǔn)差為21元,問(wèn)能否證明統(tǒng)計(jì)報(bào)表中人均收入元,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論