單變量推論統(tǒng)計(jì):假設(shè)檢驗(yàn)_第1頁
單變量推論統(tǒng)計(jì):假設(shè)檢驗(yàn)_第2頁
單變量推論統(tǒng)計(jì):假設(shè)檢驗(yàn)_第3頁
單變量推論統(tǒng)計(jì):假設(shè)檢驗(yàn)_第4頁
單變量推論統(tǒng)計(jì):假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第七講 假設(shè)檢驗(yàn),第一節(jié) 假設(shè)檢驗(yàn)的基本問題,一、假設(shè)檢驗(yàn)的基本概念 對總體的概率分布或分布參數(shù)作出某種“假設(shè)”,根據(jù)抽樣得到的樣本觀測值,運(yùn)用社會統(tǒng)計(jì)的分析方法,檢驗(yàn)這種“假設(shè)”是否正確,從而決定接受或拒絕“假設(shè)”,這就是本講要討論的假設(shè)檢驗(yàn)問題。,1、什么是假設(shè)?,假設(shè):定義為一個調(diào)研者或管理者對被調(diào)查總體的某些特征所做的一種假定或猜想。本講所討論的假設(shè)都是經(jīng)驗(yàn)假設(shè),而非理論假設(shè)。是對總體參數(shù)的一種假設(shè)。 常見的是對總體均值或比例和方差的檢驗(yàn); 在分析之前,被檢驗(yàn)的參數(shù)將被假定取一確定值。,我認(rèn)為到KFC消費(fèi)的人平均花費(fèi)15元!,2、社會調(diào)查中常見的假設(shè)檢驗(yàn)問題,根據(jù)以往資料,某地女青年的

2、平均初婚年齡=20歲,但今年根據(jù)100名女青年的隨機(jī)抽樣調(diào)查, =21歲,問能否認(rèn)為該地女青年的初婚年齡比以往有所推遲? 根據(jù)隨機(jī)抽樣調(diào)查,文化程度高的家庭,平均子女?dāng)?shù)也要少些。兩者呈負(fù)相關(guān)r=-0.3。問這樣的結(jié)論是否具有普遍意義? 可見,假設(shè)的內(nèi)容,都是數(shù)量化的內(nèi)容(=20?r=-0.3),而驗(yàn)證的依據(jù),都是憑借抽樣調(diào)查所得到的結(jié)果。(抽樣必須從總體隨機(jī)抽取),什么是假設(shè)?,對總體參數(shù)的一種看法 總體參數(shù)包括總體均值、比例、方差等 分析之前必需陳述,概念 事先對總體參數(shù)或分布形式作出某種假設(shè) 然后利用樣本信息來判斷原假設(shè)是否成立 類型 參數(shù)假設(shè)檢驗(yàn)(檢驗(yàn)法、t檢驗(yàn)法等) 非參數(shù)假設(shè)檢驗(yàn)(在

3、總體方差未知或知道甚少的情況下,利用樣本數(shù)據(jù)對總體分布形態(tài)等進(jìn)行推斷的方法,在推斷過程中不涉及有關(guān)總體分布的參數(shù),如卡方檢驗(yàn)) 3. 特點(diǎn) 采用邏輯上的反證法 依據(jù)統(tǒng)計(jì)上的小概率原理,什么是假設(shè)檢驗(yàn)?,假設(shè)檢驗(yàn)的基本思想,3. 小概率原理,小概率原理是假設(shè)檢驗(yàn)的基本依據(jù),即認(rèn)為小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生的。當(dāng)進(jìn)行假設(shè)檢驗(yàn)時,先假設(shè)H0正確,在此假設(shè)下,若小概率事件A出現(xiàn)的概率很小,例如P(A)=0.01,經(jīng)過取樣試驗(yàn)后,A出現(xiàn)了,則違反了上述原理,我們認(rèn)為這是一個不合理的結(jié)果。例如,我們每天從電視、報(bào)紙上都能看到交通事故的發(fā)生,但人們絕不會因此而放棄交通工具的使用?!疤字腥恕泵刻鞄?/p>

4、雨傘、雨鞋而被視作怪人。可見,人們總是在不自覺地運(yùn)用小概率原理。,這時,我們只能懷疑作為小概率事件A的前提假設(shè)H0的正確性,于是否定H0。反之,如果試驗(yàn)中A沒有出現(xiàn),我們就沒有理由否定假設(shè)H0,從而做出接受H0的結(jié)論。 下面我們通過實(shí)例來說明假設(shè)檢驗(yàn)的基本思想及推理方法。,4、原假設(shè)和備擇假設(shè),原假設(shè)H0 是關(guān)于總體均值而非樣本統(tǒng)計(jì)量的假設(shè) 總是假設(shè)原假設(shè)是正確的 原假設(shè)可能被接受也可能被拒絕 備擇假設(shè)H1 是原假設(shè)的對立 備擇假設(shè)可能被接受也可能被拒絕 備擇假設(shè)是試圖要建立的檢驗(yàn),二、假設(shè)檢驗(yàn)的基本思路與方法,假設(shè)檢驗(yàn)的步驟 提出原假設(shè)和備擇假設(shè) 確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量 規(guī)定顯著性水平 計(jì)算檢

5、驗(yàn)統(tǒng)計(jì)量的值 作出統(tǒng)計(jì)決策,(1)建立假設(shè),(2)求抽樣分布,(4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量,(3)選擇顯著性水平和否定域,(5)判定,所所 包有含統(tǒng) 的計(jì) 步檢 驟驗(yàn),根據(jù)以往多年的統(tǒng)計(jì)表明,宜賓學(xué)院社會統(tǒng)計(jì)學(xué)的平均成績?yōu)?0分,隨機(jī)抽取100個學(xué)生,其平均成績?yōu)?0分,問今年宜賓學(xué)院社會統(tǒng)計(jì)學(xué)成績是否下降?,提出原假設(shè)和備擇假設(shè), 什么是原假設(shè)?(Null Hypothesis) 1. 待檢驗(yàn)的假設(shè),又稱“0假設(shè)” 2. 如果錯誤地作出決策會導(dǎo)致一系列后果 3. 總是有等號 , 或 4. 表示為 H0 H0: 某一數(shù)值 指定為 = 號,即 或 例如, H0: 3190(元),為什么叫0假設(shè),什么是備

6、擇假設(shè)?(Alternative Hypothesis) 1. 與原假設(shè)對立的假設(shè) 2. 總是有不等號: , 或 3. 表示為 H1 H1: 某一數(shù)值,或 某一數(shù)值 例如, H1: 3910(元),或 3910(元),提出原假設(shè)和備擇假設(shè),什么檢驗(yàn)統(tǒng)計(jì)量? 用于假設(shè)檢驗(yàn)問題的統(tǒng)計(jì)量 選擇統(tǒng)計(jì)量的方法與參數(shù)估計(jì)相同,需考慮 是大樣本還是小樣本 總體方差已知還是未知 檢驗(yàn)統(tǒng)計(jì)量的基本形式為,確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,規(guī)定顯著性水平,什么是顯著性水平? 1. 是一個概率值 2. 原假設(shè)為真時,拒絕原假設(shè)的概率 被稱為抽樣分布的拒絕域 3. 表示為 (alpha) 常用的 值有0.01, 0.05, 0.

7、10 4. 由研究者事先確定,作出統(tǒng)計(jì)決策,計(jì)算檢驗(yàn)的統(tǒng)計(jì)量 根據(jù)給定的顯著性水平,查表得出相應(yīng)的臨界值Z或Z/2 將檢驗(yàn)統(tǒng)計(jì)量的值與 水平的臨界值進(jìn)行比較 得出接受或拒絕原假設(shè)的結(jié)論,兩類錯誤分析,小概率原理是假設(shè)檢驗(yàn)的基本依據(jù),然而,對于小概率事件,無論其概率多么小,還是可能發(fā)生的,所以,利用小概率原理為基礎(chǔ)的假設(shè)檢驗(yàn)方法進(jìn)行檢驗(yàn),可能會做出錯誤的判斷,主要有兩種形式 (1)原假設(shè)H0實(shí)際是正確的,但卻錯誤地拒絕了H0,這樣就犯了“棄真”的錯誤,通常稱為第一類錯誤。由于僅當(dāng)所考慮的小概率事件A發(fā)生時才拒絕H0,所以犯第一類錯誤的概率就是條件概率: (2)原假設(shè)H0實(shí)際是不正確的,但是卻錯誤

8、地接受了H0,這樣就犯了“納偽”的錯誤,通常稱為第二類錯誤。犯第二類錯誤的概率記為。,我們自然希望犯這兩類錯誤的概率越小越好。但當(dāng)樣本容量n確定后,犯這兩類錯誤的概率不可能同時被控制,通常在我們根據(jù)歷史經(jīng)驗(yàn)選取恰當(dāng)?shù)娘@著性水平后,通過擴(kuò)大樣本容量n的方式來使第二類錯誤的概率減小。,H0: 無罪,假設(shè)檢驗(yàn)中的兩類錯誤 (決策結(jié)果),假設(shè)檢驗(yàn)就好像一場審判過程,統(tǒng)計(jì)檢驗(yàn)過程, 錯誤和 錯誤的關(guān)系,第二節(jié) 單一總體參數(shù)的假設(shè)檢驗(yàn),建立假設(shè)的三種情況:,農(nóng)村居民月人均收入水平的評估,檢驗(yàn)中學(xué)老師對學(xué)生平均成績承諾的有效性:,中學(xué)老師對學(xué)生學(xué)習(xí)成績的承諾,統(tǒng)計(jì)報(bào)表的驗(yàn)證:,統(tǒng)計(jì)數(shù)據(jù)是否真實(shí)的依據(jù),雙側(cè)檢

9、驗(yàn)與單側(cè)檢驗(yàn) (假設(shè)的形式),根據(jù)否定域位置的不同,可以將假設(shè)檢驗(yàn)分為雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)。,在統(tǒng)計(jì)中,必須把否定域分配到抽樣分布的兩端的檢驗(yàn),被稱為雙側(cè)檢驗(yàn)。,在統(tǒng)計(jì)中,可以事先能預(yù)測偏差方向,因而可以把否定域集中到抽樣分布更合適的一端的檢驗(yàn),被稱為單側(cè)檢驗(yàn)。,雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn),雙側(cè)檢驗(yàn)(原假設(shè)與備擇假設(shè)的確定),雙側(cè)檢驗(yàn)屬于決策中的假設(shè)檢驗(yàn)。也就是說,不論是拒絕H0還是接受H0,我們都必需采取相應(yīng)的行動措施。 例如,某單位職工上月平均收入為2100元,本月大于或小于2100元均屬于發(fā)生變化。 建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: = 2100 H1: 2100,雙側(cè)檢驗(yàn)(確定假設(shè)的步驟),1

10、. 某單位職工上月平均收入為2100元,本月調(diào)查了100名職工,平均收入為2200元,標(biāo)準(zhǔn)差為15元。問該單位職工本月平均收入與上月相比是否有變化? 2. 步驟 從統(tǒng)計(jì)角度陳述問題 ( = 2100) 從統(tǒng)計(jì)角度提出相反的問題 ( 2100) 必需互斥和窮盡 提出原假設(shè) ( = 2100) 提出備擇假設(shè) ( 2100) 有 符號,雙側(cè)檢驗(yàn)(確定假設(shè)的步驟),1. 某單位職工上月平均收入為2100元,本月調(diào)查了100名職工,平均收入為2200元,標(biāo)準(zhǔn)差為15元。問該單位職工本月平均收入與上月相比是否有變化? 解首先建立虛無假設(shè)(H0)和研究假設(shè)(H1)即有H0 :=2100 H1 : 2100

11、選擇顯著性水平=0.05,查標(biāo)準(zhǔn)正態(tài)分布得 由于Z=6.67 所以,拒絕虛無假設(shè),即從總體上說,該單位職工平均收入與上月相比有變化。,雙側(cè)檢驗(yàn)(顯著性水平與拒絕域 ),雙側(cè)檢驗(yàn)(顯著性水平與拒絕域 ),雙側(cè)檢驗(yàn)(顯著性水平與拒絕域 ),雙側(cè)檢驗(yàn)(顯著性水平與拒絕域 ),例 一位研究者試圖檢驗(yàn)?zāi)骋簧鐣{(diào)查所運(yùn)用 的抽樣程序,該項(xiàng)調(diào)查是由一些缺乏經(jīng)驗(yàn)的訪問員進(jìn) 行的。研究者懷疑屬于干部和知識分子的家庭抽得過 多。過去的統(tǒng)計(jì)資料表明,該街區(qū)的家庭收入是7500 元,標(biāo)準(zhǔn)差是1500元;此次調(diào)查共抽取100個家庭樣 本平均收入是7900元。問:該研究人員是否有理由懷 疑該樣本有偏估?(選用=0.05)

12、,總體均值和成數(shù)的單樣本檢驗(yàn),1已知,對總體均值的檢驗(yàn),實(shí)際上是要檢驗(yàn)“隨機(jī)抽樣”這個零假設(shè),解 根據(jù)題意,可做如下假設(shè),并做單側(cè)檢驗(yàn) 因=0.05,查表得Z 0.05=1.65,故否定域?yàn)?根據(jù)中心極限定理,檢驗(yàn)統(tǒng)計(jì)量 計(jì)算得 檢驗(yàn)統(tǒng)計(jì)量Z的計(jì)算表明,樣本均值比總體均值大267個 標(biāo)準(zhǔn)差( ),超過了顯著性水平規(guī)定的臨界值,調(diào)查者應(yīng)該 否定“隨機(jī)抽樣”的零假設(shè)。也就是說,由于抽樣在程序上不合要 求,這項(xiàng)社會調(diào)查有必要重新組織。,中心極限定理實(shí)際解決了大樣本均值的檢驗(yàn)問 題。假定樣本比較大(n50,這在社會調(diào)查中一般 都能得到滿足),樣本均值的抽樣分布就與總體分布 無關(guān),而服從正態(tài)分布。當(dāng)H0

13、成立時,樣本均值的 觀察值比較集中地分布在總體均值周圍;當(dāng)H0不 成立時, 將對有明顯偏離的趨勢。因而,我們 可以在選定的顯著性水平上,通過計(jì)算檢驗(yàn)統(tǒng)計(jì)量 Z,對零假設(shè)進(jìn)行檢定。 注:當(dāng)未知時,只要樣本量很大,就可用S 來代替 。但對于小樣本,Z檢驗(yàn)就要用 t 檢驗(yàn)來 替代了,而且還必須嚴(yán)格限于正態(tài)總體。,解 根據(jù)題意,可作如下的假設(shè),并做雙側(cè)檢驗(yàn) H0:2330元 H1:2330元 因0.05,查正態(tài)分布表得Z/21.96,故否定域|Z|1.96 計(jì)算檢驗(yàn)統(tǒng)計(jì)量 Z 1.20196 所以,不能認(rèn)為該單位人均月收入不是2330元,即不能 認(rèn)為該統(tǒng)計(jì)報(bào)表有誤。,例 某單位統(tǒng)計(jì)報(bào)表顯示,人均月收入

14、為2330元,為了驗(yàn)證 該統(tǒng)計(jì)報(bào)表的正確性,作了共81人的抽樣調(diào)查,樣本人均月收入 為2350元,標(biāo)準(zhǔn)差為150元,問能否說明該統(tǒng)計(jì)報(bào)表顯示的人均 收入的數(shù)字有誤(取顯著性水平0.05)。,此乃“總體均值”零假設(shè)的檢驗(yàn),為了驗(yàn)證統(tǒng)計(jì)報(bào)表的正確性,作了共五十人的抽樣調(diào)查,人均收入的結(jié)果有: ,問能否證明統(tǒng)計(jì)報(bào)表中人均收入=880元是正確的(顯著性水平=0.05)。,單側(cè)檢驗(yàn)(原假設(shè)與備擇假設(shè)的確定),檢驗(yàn)研究中的假設(shè) 將所研究的假設(shè)作為備擇假設(shè)H1 將認(rèn)為研究結(jié)果是無效的說法或理論作為原假設(shè)H0?;蛘哒f,把希望(想要)證明的假設(shè)作為備擇假設(shè) 先確立備擇假設(shè)H1,單側(cè)檢驗(yàn)(原假設(shè)與備擇假設(shè)的確定)

15、,例如,根據(jù)抽樣調(diào)查,九個人的平均初婚年齡是23.5歲,該地區(qū)平均初婚年齡是否超過20歲? 屬于研究中的假設(shè) 建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: 20 H1: 20,單側(cè)檢驗(yàn)(原假設(shè)與備擇假設(shè)的確定),檢驗(yàn)?zāi)稠?xiàng)聲明的有效性 將所作出的說明(聲明)作為原假設(shè) 對該說明的質(zhì)疑作為備擇假設(shè) 先確立原假設(shè)H0 除非我們有證據(jù)表明“聲明”無效,否則就應(yīng)認(rèn)為該“聲明”是有效的,2.小樣本總體均值的檢驗(yàn)(學(xué)生t分布) 中心極限定理解決了大樣本均值的檢驗(yàn)問題。但是當(dāng)n較小時,用這種方法求出的概率可能是錯誤的,有必要做某種修正。于是有人設(shè)計(jì)了另一種檢驗(yàn)統(tǒng)計(jì)量,這個統(tǒng)計(jì)量最初是由戈塞特(1876一1937)用筆名

16、“學(xué)生”發(fā)表,所以這個統(tǒng)計(jì)量的抽樣分布稱為學(xué)生t分布。比較t和Z,我們注意到它們的分子相同,而分母卻稍有不同:為S所代替(這一點(diǎn)無須解釋);根號下是n1。,當(dāng)Z為t替代時,雖用因子n1所導(dǎo)致的修正看起 來不大,但在樣本容量較小時,這種修正就會起很大 作用了。所以當(dāng)不知道值、且樣本容量較小時,我 們應(yīng)該考慮應(yīng)用t分布而不是Z分布。,采用n1的原因:樣本數(shù)據(jù)的離散程度小于總體數(shù)據(jù)的離散程度。 n1實(shí)際為自由度數(shù)k。,例 已知初婚年齡服從正態(tài)分布。根據(jù)10人的調(diào) 查有 = 23.5歲,S=3歲,問是否可以認(rèn)為該地區(qū)的平 均初婚年齡已超過20歲?(=0.01) 解 H0:=20;H1:20 因?yàn)閚小,

17、又不知值,因此用t檢驗(yàn) 對自由度9來講,單側(cè)檢驗(yàn)和顯著性水平0.01,查 表知否定域?yàn)閠值等于或大于 2.821。再計(jì)算檢驗(yàn)統(tǒng)計(jì)量,因此拒絕H0,即可以認(rèn)為在顯著性水平為0.01的條件下,該地區(qū)的初婚年齡已超過20歲。,單側(cè)檢驗(yàn)(顯著性水平與拒絕域 ),左側(cè)檢驗(yàn)(顯著性水平與拒絕域 ),左側(cè)檢驗(yàn)(顯著性水平與拒絕域 ),右側(cè)檢驗(yàn)(顯著性水平與拒絕域 ),右側(cè)檢驗(yàn)(顯著性水平與拒絕域 ),提出原假設(shè): H0: 25% 選擇備擇假設(shè): H1: : 25%,學(xué)生中經(jīng)常上網(wǎng)的人數(shù)超過25%嗎? (屬于研究中的假設(shè),先提出備擇假設(shè)),右側(cè)檢驗(yàn)(例子),3.大樣本成數(shù)的檢驗(yàn) 有時,需要對總體中具有某種特征

18、的單位在總體中所占的的比例 p(即總體成數(shù))作顯著性檢驗(yàn),如人口中的失業(yè)率、學(xué)齡兒童中的失學(xué)率等等。成數(shù)檢驗(yàn)與二項(xiàng)檢驗(yàn)的聯(lián)系是不言而愈的。因?yàn)樵诙?xiàng)檢驗(yàn)中,隨機(jī) 變量是樣本的“成功”次數(shù)x。而在成數(shù)檢驗(yàn)中,隨機(jī)變量是樣本的“成功”比例 (即樣本成數(shù)),這樣在 n 一定的情況下,顯然有,既然 是一個隨機(jī)變量,那么把具體概率賦予樣本成數(shù)的每一個取值,我們就得到了樣本成數(shù)的抽樣分布。根據(jù)中心極限定理,我們不難想見,當(dāng)n足夠大時,樣本成數(shù)的抽樣分布也服從正態(tài)分布。由于數(shù)學(xué) 上很容易證明 , ,這樣一來,對于大樣本(n30,np5),成數(shù)的檢驗(yàn)統(tǒng)計(jì)量 Z 可表示為,例 某地區(qū)成年男性中吸煙者占64%,經(jīng)

19、過戒煙宣傳后進(jìn)行抽樣調(diào)查,發(fā)現(xiàn)100名被調(diào)查者中,有55人是吸煙者,試問戒煙宣傳是否有成效(=0.05),解 已知n10030,npl000.64645,故可使用正態(tài)檢驗(yàn)。又知 0.55,p0.64,q0.36,則 H0: p=0.64 H1: p0.64 據(jù)題意,選擇單側(cè)檢驗(yàn),因0.05,查正態(tài)分布表得否定域?yàn)?|Z|165 。再計(jì)算檢驗(yàn)統(tǒng)計(jì)量 因此,否定零假設(shè),即認(rèn)為戒煙宣傳收到了顯著成效。,練習(xí):,1. 為了檢驗(yàn)統(tǒng)計(jì)報(bào)表的正確性,作了共50人的抽樣調(diào)查,人 均收入為871元,標(biāo)準(zhǔn)差為21元,問能否證明統(tǒng)計(jì)報(bào)表中人均收入880元是正確的? (=0.05) 2. 許多人在周末睡懶覺以彌補(bǔ)工作日的睡眠不足。最佳睡眠協(xié) 會的報(bào)告說,我們之中有61%的人

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論