假設(shè)檢驗在統(tǒng)計方法中的地位_第1頁
假設(shè)檢驗在統(tǒng)計方法中的地位_第2頁
假設(shè)檢驗在統(tǒng)計方法中的地位_第3頁
假設(shè)檢驗在統(tǒng)計方法中的地位_第4頁
假設(shè)檢驗在統(tǒng)計方法中的地位_第5頁
已閱讀5頁,還剩122頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Statistics假設(shè)檢驗在統(tǒng)計方法中的地位參數(shù)估計假設(shè)檢驗統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計利用樣本統(tǒng)計量去估計總體的參數(shù)假設(shè)總體參數(shù),用樣本信息去檢驗這個假設(shè)是否成立第6章 假設(shè)檢驗6.1 假設(shè)檢驗的基本問題 6.2 一個總體參數(shù)的檢驗6.3 兩個總體參數(shù)的檢驗6.4 檢驗問題的進一步說明學(xué)習(xí)目標了解假設(shè)檢驗的基本思想 掌握假設(shè)檢驗的步驟對實際問題作假設(shè)檢驗利用P - 值進行假設(shè)檢驗正常人的平均體溫是37oC嗎? 當問起健康的成年人體溫是多少時,多數(shù)人的回答是37oC,這似乎已經(jīng)成了一種共識。下面是一個研究人員測量的50個健康成年人的體溫數(shù)據(jù) 37.136.936.937.136.436.936.

2、636.236.736.937.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037.036.137.0正常人的平均體溫是37oC嗎? 根據(jù)樣本數(shù)據(jù)計算的平均值是36.8oC ,標準差為0.36oC 根據(jù)參數(shù)估計方法得到的健康成年人平均體溫的95%的置信區(qū)間為(36.7,36.9)。研究人員發(fā)現(xiàn)這個區(qū)間內(nèi)并沒有包括37oC 因此提出“不應(yīng)該再把37oC作為

3、正常人體溫的一個有任何特定意義的概念”我們應(yīng)該放棄“正常人的平均體溫是37oC”這個共識嗎?本章的內(nèi)容就將提供一套標準統(tǒng)計程序來檢驗這樣的觀點6.1 假設(shè)檢驗的基本問題6.1.1 假設(shè)問題的提出6.1.2 假設(shè)的表達式6.1.3 兩類錯誤6.1.4 假設(shè)檢驗的流程6.1.5 利用P值進行決策6.1.6 單側(cè)檢驗總體假設(shè)檢驗的過程抽取隨機樣本均值 x = 20我認為人口的平均年齡是50歲 提出假設(shè) 拒絕假設(shè) 別無選擇! 作出決策假設(shè)檢驗的基本思想. 因此我們拒絕假設(shè) = 50. 如果這是總體的假設(shè)均值樣本均值m = 50抽樣分布H0這個值不像我們應(yīng)該得到的樣本均值 .20假設(shè)檢驗 在假設(shè)檢驗中,

4、一般要設(shè)立一個原假設(shè);而設(shè)立該假設(shè)的動機主要是企圖利用人們掌握的反映現(xiàn)實世界的數(shù)據(jù)來找出假設(shè)和現(xiàn)實的矛盾,從而否定這個假設(shè)。假設(shè)檢驗 在多數(shù)統(tǒng)計教科書中(除了理論探討之外),假設(shè)檢驗都是以否定原假設(shè)為目標。如否定不了,那就說明證據(jù)不足,無法否定原假設(shè)。但這不能說明原假設(shè)正確。很多教科書在這個問題上不適當?shù)赜谩敖邮茉僭O(shè)”的說法,犯了明顯的低級邏輯錯誤。 假設(shè)檢驗的過程和邏輯 首先要提出一個原假設(shè),比如某正態(tài)總體的均值等于5(m=5)。這種原假設(shè)也稱為零假設(shè)(null hypothesis),記為H0與此同時必須提出對立假設(shè),比如總體均值大于5(m5)。對立假設(shè)又稱為備選假設(shè)或備擇假設(shè)(alte

5、rnative hypothesis)記為記為H1或Ha假設(shè)檢驗的過程和邏輯 根據(jù)零假設(shè)(不是備選假設(shè)?。?,我們可以得到該檢驗統(tǒng)計量的分布;然后再看這個統(tǒng)計量的數(shù)據(jù)實現(xiàn)值(realization)屬不屬于小概率事件。也就是說把數(shù)據(jù)代入檢驗統(tǒng)計量,看其值是否落入零假設(shè)下的小概率范疇如果的確是小概率事件,那么我們就有可能拒絕零假設(shè),否則我們說沒有足夠證據(jù)拒絕零假設(shè)。假設(shè)檢驗的過程和邏輯 注意:零假設(shè)和備選假設(shè)在我們涉及的假設(shè)檢驗中并不對稱。檢驗統(tǒng)計量的分布是從零假設(shè)導(dǎo)出的, 因此, 如果有矛盾, 當然就不利于零假設(shè)了。不發(fā)生矛盾也不說明備選假設(shè)有問題。 假設(shè)問題的提出什么是假設(shè)?(hypothes

6、is) 對總體參數(shù)的的數(shù)值所作的一種陳述總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述我認為這種新藥的療效比原有的藥物更有效!什么是假設(shè)檢驗? (hypothesis testing)事先對總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來判斷原假設(shè)是否成立有參數(shù)假設(shè)檢驗和非參數(shù)假設(shè)檢驗采用邏輯上的反證法,依據(jù)統(tǒng)計上的小概率原理小概率是在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)提出原假設(shè)和備擇假設(shè) 什么是原假設(shè)?(null hypothesis)1.待檢驗的假設(shè),又稱“0假設(shè)”2.研究者想收集證據(jù)予以反對的假設(shè)3.總是有等號 ,

7、或4.表示為 H0H0: 某一數(shù)值 指定為 = 號,即 或 例如, H0: 3190(克) 什么是備擇假設(shè)?(alternative hypothesis)與原假設(shè)對立的假設(shè),也稱“研究假設(shè)”研究者想收集證據(jù)予以支持的假設(shè)總是有不等號: , 或 備擇假設(shè)通常用于表達研究者自己傾向于支持的看法,然后就是想辦法收集證據(jù)拒絕原假設(shè),以支持備擇假設(shè),表示為 H1H1: 某一數(shù)值,或 某一數(shù)值例如, H1: 3910(克),或 3910(克)注意:零假設(shè)和備選假設(shè)在我們涉及的假設(shè)檢驗中并不對稱。提出原假設(shè)和備擇假設(shè)假設(shè)檢驗中的兩類錯誤(決策風(fēng)險)兩類錯誤與顯著性水平研究者總是希望能做出正確的決策,但由于

8、決策是建立在樣本信息的基礎(chǔ)之上,而樣本又是隨機的,因而就有可能犯錯誤原假設(shè)和備擇假設(shè)不能同時成立,決策的結(jié)果要么拒絕H0,要么不拒絕H0。決策時總是希望當原假設(shè)正確時沒有拒絕它,當原假設(shè)不正確時拒絕它,但實際上很難保證不犯錯誤 第類錯誤(錯誤)拒真錯誤原假設(shè)為正確時拒絕原假設(shè)第類錯誤的概率記為,被稱為顯著性水平第類錯誤(錯誤)納偽錯誤原假設(shè)為錯誤時未拒絕原假設(shè)第類錯誤的概率記為(Beta)H0: 無罪假設(shè)檢驗中的兩類錯誤(決策結(jié)果)陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確H0 檢驗決策實際情況H0為真H0為假未拒絕H0正確決策(1 a)第類錯誤(b )拒絕H0第類錯誤(a )正確

9、決策(1-b )假設(shè)檢驗就好像一場審判過程統(tǒng)計檢驗過程 錯誤和 錯誤的關(guān)系你要同時減少兩類錯誤的惟一辦法是增加樣本容量!和 的關(guān)系就像翹翹板,小 就大, 大 就小兩類錯誤的控制一般來說,對于一個給定的樣本,如果犯第類錯誤的代價比犯第類錯誤的代價相對較高,則將犯第類錯誤的概率定得低些較為合理;反之,如果犯第類錯誤的代價比犯第類錯誤的代價相對較低,則將犯第類錯誤的概率定得高些一般來說,發(fā)生哪一類錯誤的后果更為嚴重,就應(yīng)該首要控制哪類錯誤發(fā)生的概率。但由于犯第類錯誤的概率是可以由研究者控制的,因此在假設(shè)檢驗中,人們往往先控制第類錯誤的發(fā)生概率檢驗?zāi)芰?power of test)拒絕一個錯誤的原假設(shè)

10、的能力根據(jù) 的定義, 是指沒有拒絕一個錯誤的原假設(shè)的概率。這也就是說,1- 則是指拒絕一個錯誤的原假設(shè)的概率,這個概率被稱為檢驗?zāi)芰?也被稱為檢驗的勢或檢驗的功效(power)可解釋為正確地拒絕一個錯誤的原假設(shè)的概率假設(shè)檢驗的流程提出假設(shè)確定適當?shù)臋z驗統(tǒng)計量規(guī)定顯著性水平計算檢驗統(tǒng)計量的值作出統(tǒng)計決策 什么是檢驗統(tǒng)計量?1.用于假設(shè)檢驗決策的統(tǒng)計量2.選擇統(tǒng)計量的方法與參數(shù)估計相同,需考慮是大樣本還是小樣本總體方差已知還是未知3.檢驗統(tǒng)計量的基本形式為確定適當?shù)臋z驗統(tǒng)計量規(guī)定顯著性水平(significant level) 什么是顯著性水平?1.是一個概率值2.原假設(shè)為真時,拒絕原假設(shè)的概率被

11、稱為抽樣分布的拒絕域3.表示為 (alpha)常用的 值有0.01, 0.05, 0.104.由研究者事先確定依據(jù)什么做出決策?若假設(shè)為H0:m=500, H1:m500。樣本均值為495,拒絕H0嗎?樣本均值為502,拒絕H0嗎?做出拒絕或不拒絕原假設(shè)的依據(jù)是什么?傳統(tǒng)上,做出決策所依據(jù)的是樣本統(tǒng)計量,現(xiàn)代檢驗中人們直接使用由統(tǒng)計量算出的犯第類錯誤的概率,即所謂的P值 作出統(tǒng)計決策計算檢驗的統(tǒng)計量根據(jù)給定的顯著性水平,查表得出相應(yīng)的臨界值z或z/2, t或t/2, F或F/2將檢驗統(tǒng)計量的值與 水平的臨界值進行比較得出拒絕或不拒絕原假設(shè)的結(jié)論利用P值進行決策檢驗統(tǒng)計量在零假設(shè)下,等于這個樣本

12、的數(shù)據(jù)實現(xiàn)值或更加極端值的概率稱為p-值(p-value)。左側(cè)檢驗時,P-值為曲線上方小于等于檢驗統(tǒng)計量部分的面積右側(cè)檢驗時,P-值為曲線上方大于等于檢驗統(tǒng)計量部分的面積顯然得到很小p-值意味著小概率事件發(fā)生了。如果小概率事件發(fā)生,是相信零假設(shè),還是相信數(shù)據(jù)呢?當然是相信數(shù)據(jù)。于是就拒絕零假設(shè)。即,若p值 ,不拒絕 H0若p-值 /2, 不拒絕 H0若p-值 /2, 拒絕 H0P值是關(guān)于數(shù)據(jù)的概率P值反映的是在某個總體的許多樣本中某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度,它是當原假設(shè)正確時,得到目前這個樣本數(shù)據(jù)的概率比如,要檢驗全校學(xué)生的平均生活費支出是否等于500元,檢驗的假設(shè)為H0:=500;H1:50

13、0 。假定抽出一個樣本算出的樣本均值600元,得到的值為P=0.02,這個0.02是指如果平均生活費支出真的是500元的話,那么,從該總體中抽出一個均值為600的樣本的概率僅為0.02。如果你認為這個概率太小了,就可以拒絕原假設(shè),因為如果原假設(shè)正確的話,幾乎不可能抓到這樣的一個樣本,既然抓到了,就表明這樣的樣本不在少數(shù),所以原假設(shè)是不對的p值越小,你拒絕原假設(shè)的理由就越充分 要證明原假設(shè)不正確,P值要多小,才能令人信服呢?原假設(shè)的可信度有多高?如果H0所代表的假設(shè)是人們多年來一直相信的,就需要很強的證據(jù)(小的P值)才能說服他們拒絕的結(jié)論是什么?如果拒絕H0而肯定H1 ,你就需要有很強的證據(jù)顯示

14、要支持H1。比如,H1代表要花很多錢把產(chǎn)品包裝改換成另一種包裝,你就要有很強的證據(jù)顯示新包裝一定會增加銷售量(因為拒絕H0要花很高的成本)多大的P 值合適?實際上,計算機軟件僅僅給出p-值,而不給出a。這有很多方便之處。比如a=0.05,而假定我們得到的p-值等于0.001。這時我們?nèi)绻捎胮-值作為新的顯著性水平,即a=0.001,于是可以說,我們拒絕零假設(shè),顯著性水平為0.001。拒絕零假設(shè)時犯錯誤的概率實際只是千分之一而不是百分之五。在這個意義上,p-值又稱為觀測的顯著性水平(observed significant level)。在統(tǒng)計軟件輸出p-值的位置,有的用“p-value”,有

15、的用significant的縮寫“Sig”就是這個道理。關(guān)于“臨界值”的注:作為概率的顯著性水平a實際上相應(yīng)于一個檢驗統(tǒng)計量取值范圍的一個臨界值(critical value),a值定義為統(tǒng)計量取臨界值或更極端的值的概率等于a。也就是說,“統(tǒng)計量的實現(xiàn)值比臨界值更極端”等價于“p-值小于a”。使用臨界值的概念進行的檢驗不計算p-值。只比較統(tǒng)計量的取值和臨界值的大小。使用臨界值而不是p-值來判斷拒絕與否是前計算機時代的產(chǎn)物。當時計算p-值不易,只有采用臨界值的概念。但從給定的a求臨界值同樣也不容易,好在習(xí)慣上僅僅在教科書中列出相應(yīng)于特定分布的幾個有限的a臨界值(比如a=0.05,a=0.025,

16、a=0.01,a=0.005,a=0.001等等),或者根據(jù)分布表反過來查臨界值(很不方便也很粗糙)?,F(xiàn)在計算機軟件都不給出a和臨界值,但都給出p-值和統(tǒng)計量實現(xiàn)值,讓用戶自己決定顯著性水平是多少。 拒絕H0P 值決策與統(tǒng)計量的比較拒絕H0的兩個統(tǒng)計量的不同顯著性Z拒絕H00統(tǒng)計量1 P1 值統(tǒng)計量2 P2 值拒絕H0臨界值雙側(cè)檢驗和單側(cè)檢驗雙側(cè)檢驗與單側(cè)檢驗 (假設(shè)的形式)假設(shè)研究的問題雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗H0m = m0m m0m m0H1m m0m m0雙側(cè)檢驗(原假設(shè)與備擇假設(shè)的確定)屬于決策中的假設(shè)檢驗不論是大于還是小于 ,都必需采取相應(yīng)的行動措施例如,某種零件的尺寸,要求其平均

17、長度為10cm,大于或小于10cm均屬于不合格我們想要證明(檢驗)大于或小于這兩種可能性中的任何一種是否成立建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: = 10 H1: 10雙側(cè)檢驗(顯著性水平與拒絕域 )抽樣分布H0值臨界值臨界值a/2 a/2 樣本統(tǒng)計量拒絕域拒絕域1 - 置信水平單側(cè)檢驗(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1 - 置信水平假設(shè)檢驗不能證明原假設(shè)正確假設(shè)檢驗的目的主要是收集證據(jù)拒絕原假設(shè),而支持你所傾向的備擇假設(shè)假設(shè)檢驗只提供不利于原假設(shè)的證據(jù)。因此,當拒絕原假設(shè)時,表明樣本提供的證據(jù)證明它是錯誤的,當沒有拒絕原假設(shè)時,我們也沒法證明它是正確的,因為假設(shè)檢驗

18、的程序沒有提供它正確的證據(jù)這與法庭上對被告的定罪類似:先假定被告是無罪的,直到你有足夠的證據(jù)證明他是有罪的,否則法庭就不能認定被告有罪。當證據(jù)不足時,法庭的裁決是“被告無罪”,但這里也沒有證明被告就是清白的假設(shè)檢驗不能證明原假設(shè)正確假設(shè)檢驗得出的結(jié)論都是根據(jù)原假設(shè)進行闡述的我們要么拒絕原假設(shè),要么不拒絕原假設(shè)當不能拒絕原假設(shè)時,我們也從來不說“接受原假設(shè)”,因為沒有證明原假設(shè)是真的采用“接受”原假設(shè)的說法,則意味著你證明了原假設(shè)是正確的沒有足夠的證據(jù)拒絕原假設(shè)并不等于你已經(jīng)“證明”了原假設(shè)是真的,它僅僅意味著目前還沒有足夠的證據(jù)拒絕原假設(shè),只表示手頭上這個樣本提供的證據(jù)還不足以拒絕原假設(shè)“不拒

19、絕”的表述方式實際上意味著沒有得出明確的結(jié)論假設(shè)檢驗不能證明原假設(shè)正確“接受”的說法有時會產(chǎn)生誤導(dǎo)這種說法似乎暗示著原假設(shè)已經(jīng)被證明是正確的了實事上,H0的真實值我們永遠也無法知道,不知道真實值是什么,又怎么能證明它是什么?H0只是對總體真實值的一個假定值,由樣本提供的信息也就自然無法證明它是否正確采用“不拒絕”的表述方法更合理一些,因為這種表述意味著樣本提供的證據(jù)不夠強大,因而沒有足夠的理由拒絕,這不等于已經(jīng)證明原假設(shè)正確 假設(shè)檢驗不能證明原假設(shè)正確假設(shè)檢驗不能證明原假設(shè)正確假設(shè)檢驗中通常是先確定顯著性水平,這就等于控制了第類錯誤的概率,但犯第類錯誤的概率卻是不確定的在拒絕H0時,犯第類錯誤

20、的概率不超過給定的顯著性水平,當樣本結(jié)果顯示沒有充分理由拒絕原假設(shè)時,也難以確切知道第類錯誤發(fā)生的概率采用“不拒絕”而不采用“接受”的表述方式,在多數(shù)場合下便避免了錯誤發(fā)生的風(fēng)險因為“接受”所得結(jié)論可靠性將由第類錯誤的概率來測量,而的控制又相對復(fù)雜,有時甚至根本無法知道的值,除非你能確切給出 ,否則就不宜表述成“接受”原假設(shè)統(tǒng)計上顯著不一定有實際意義當拒絕原假設(shè)時,我們稱樣本結(jié)果是統(tǒng)計上顯著的(statistically Significant)當不拒絕原假設(shè)時,我們稱樣本結(jié)果是統(tǒng)計上不顯著的在“顯著”和“不顯著”之間沒有清楚的界限,只是在P值越來越小時,我們就有越來越強的證據(jù),檢驗的結(jié)果也就

21、越來越顯著“顯著的”(Significant)一詞的意義在這里并不是“重要的”,而是指“非偶然的”一項檢驗在統(tǒng)計上是“顯著的”,意思是指:這樣的(樣本)結(jié)果不是偶然得到的,或者說,不是靠機遇能夠得到的如果得到這樣的樣本概率(P)很小,則拒絕原假設(shè)在這么小的概率下竟然得到了這樣的一個樣本,表明這樣的樣本經(jīng)常出現(xiàn),所以,樣本結(jié)果是顯著的統(tǒng)計上顯著不一定有實際意義統(tǒng)計上顯著不一定有實際意義在進行決策時,我們只能說P值越小,拒絕原假設(shè)的證據(jù)就越強,檢驗的結(jié)果也就越顯著但P值很小而拒絕原假設(shè)時,并不一定意味著檢驗的結(jié)果就有實際意義因為假設(shè)檢驗中所說的“顯著”僅僅是“統(tǒng)計意義上的顯著”一個在統(tǒng)計上顯著的結(jié)

22、論在實際中卻不見得就很重要,也不意味著就有實際意義因為P值與樣本的大小密切相關(guān),樣本量越大,檢驗統(tǒng)計量的P值也就越大,P值就越小,就越有可能拒絕原假設(shè)統(tǒng)計上顯著不一定有實際意義如果你主觀上要想拒絕原假設(shè)那就一定能拒絕它這類似于我們通常所說的“欲加之罪,何患無辭”只要你無限制擴大樣本量,幾乎總能拒絕原假設(shè)當樣本量很大時,解釋假設(shè)檢驗的結(jié)果需要小心在大樣本情況下,總能把與假設(shè)值的任何細微差別都能查出來,即使這種差別幾乎沒有任何實際意義在實際檢驗中,不要刻意追求“統(tǒng)計上的”顯著性,也不要把統(tǒng)計上的顯著性與實際意義上的顯著性混同起來一個在統(tǒng)計上顯著的結(jié)論在實際中卻不見得很重要,也不意味著就有實際意義6

23、.2 一個總體參數(shù)的檢驗 6.2.1 總體均值的檢驗 6.2.2 總體比例的檢驗 6.2.3 總體方差的檢驗第 6 章 假設(shè)檢驗6.2.1 總體均值的檢驗 (大樣本)6.2 一個總體參數(shù)的檢驗總體均值的檢驗 (大樣本)1.假定條件大樣本(n30)2.使用z檢驗統(tǒng)計量 2 已知: 2 未知:總體均值的檢驗( 2 已知)(例題分析大樣本)【例6-4】一種罐裝飲料采用自動生產(chǎn)線生產(chǎn),每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平=0.05 ,檢驗該天生產(chǎn)的飲料容量是否符合標準要求?

24、雙側(cè)檢驗綠色健康飲品綠色健康飲品255255總體均值的檢驗( 2 已知)(例題分析大樣本)H0 : = 255H1 : 255 = 0.05n = 40臨界值(c):檢驗統(tǒng)計量:決策:結(jié)論: 用Excel中的【NORMSDIST】函數(shù)得到的雙尾檢驗P=0.312945不拒絕H0沒有證據(jù)表明該天生產(chǎn)的飲料不符合標準要求 z01.96-1.960.005拒絕 H0拒絕 H00.005總體均值的檢驗(z檢驗) (P 值的計算與應(yīng)用)第1步:進入Excel表格界面,直接點擊【fx】第2步:在函數(shù)分類中點擊【統(tǒng)計】,并在函數(shù)名 菜單下選擇【NORMSDIST】,然后【確定】第3步:將 z 的絕對值1.0

25、1錄入,得到的函數(shù)值為 0.843752345 P值=2(1-0.843752345)=0.312495 P值遠遠大于,故不拒絕H0總體均值的檢驗( 2 未知) (例題分析大樣本)【例6-5】一種機床加工的零件尺寸絕對平均誤差為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機抽取50個進行檢驗。利用這些樣本數(shù)據(jù),檢驗新機床加工的零件尺寸的平均誤差與舊機床相比是否有顯著降低? (=0.01) 左側(cè)檢驗50個零件尺寸的誤差數(shù)據(jù) (mm)1.261.191.310.971.811.130.961.06

26、1.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86總體均值的檢驗(例題分析大樣本)H0 : 1.35H1 : 1.35 = 0.01n = 50臨界值(c):檢驗統(tǒng)計量: 拒絕H0新機床加工的零件尺寸的平均誤差與舊機床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.01總體均值的檢驗 (P 值的計算與應(yīng)用大樣

27、本)第1步:進入Excel表格界面,直接點擊【fx】第2步:在函數(shù)分類中點擊【統(tǒng)計】,并在函數(shù)名的菜單下選 擇【ZTEST】,然后【確定】第3步:在所出現(xiàn)的對話框【Array】框中,輸入原始數(shù)據(jù)所 在區(qū)域 ;在【X】后輸入?yún)?shù)的某一假定值(這里為 1.35);在【Sigma】后輸入已知的總體標準差(若總 體標準差未知則可忽略不填,系統(tǒng)將自動使用樣本 標準差代替) 第4步:用1減去得到的函數(shù)值0.995421023 即為P值 P值=1-0.995421023=0.004579 P值5200 = 0.05n = 36臨界值(c):檢驗統(tǒng)計量: 拒絕H0 (P = 0.000088 = 0.05)改

28、良后的新品種產(chǎn)量有顯著提高 決策:結(jié)論:z0拒絕H00.051.645總體均值的檢驗(z檢驗) (P 值的圖示)抽樣分布P = 0.000088 01.645a =0.05拒絕H01 - 計算出的樣本統(tǒng)計量=3.75P 值總體均值的檢驗 (小樣本)1.假定條件總體服從正態(tài)分布小樣本(n =0.05,故不拒絕H0 總體均值的檢驗 (用SPSS進行檢驗小樣本t檢驗)第1步:選擇【Analyze】下拉菜單,并選擇【Compare MeansOne- Samples T Test】選項,進入主對話框第2步:將檢驗變量(零件長度)選入【Test Variable(s)】;在【Test Value】框內(nèi)輸

29、入假設(shè)值(本題為12)第3步:點擊【Options】,選擇所需的置信水平(隱含值為95%)。點擊【Continue】回到主對話框。點擊【OK】用SPSS進行檢驗SPSS總體均值的檢驗 (用SPSS進行檢驗小樣本t檢驗)不拒絕H0。沒有證據(jù)表明該供貨商提供的零件不符合要求 一個總體均值的檢驗(作出判斷) 是否已知小樣本量n大 是否已知否 t 檢驗否z 檢驗是z 檢驗 是z 檢驗6.2.2 總體比例的檢驗6.2 一個總體參數(shù)的檢驗總體比例檢驗假定條件總體服從二項分布可用正態(tài)分布來近似(大樣本)檢驗的 z 統(tǒng)計量 0為假設(shè)的總體比例總體比例的檢驗 (例題分析)【例6-8】一種以休閑和娛樂為主題的雜志

30、,聲稱其讀者群中有80%為女性。為驗證這一說法是否屬實,某研究部門抽取了由200人組成的一個隨機樣本,發(fā)現(xiàn)有146個女性經(jīng)常閱讀該雜志。分別取顯著性水平 =0.05和=0.01 ,檢驗該雜志讀者群中女性的比例是否為80%?它們的P值各是多少?雙側(cè)檢驗總體比例的檢驗 (例題分析)H0 : = 80%H1 : 80% = 0.05n = 200臨界值(c):檢驗統(tǒng)計量:拒絕H0 (P = 0.013328 = 0.01)沒有證據(jù)表明“該雜志聲稱讀者群中有80%為女性”的看法不正確 決策:結(jié)論:z02.58-2.580.005拒絕 H0拒絕 H00.0056.2.3 總體方差的檢驗6.2 一個總體參

31、數(shù)的檢驗總體方差的檢驗 ( 2檢驗) 檢驗一個總體的方差或標準差假設(shè)總體近似服從正態(tài)分布使用 2分布檢驗統(tǒng)計量假設(shè)的總體方差總體方差的檢驗(例題分析)【例6-9】啤酒生產(chǎn)企業(yè)采用自動生產(chǎn)線灌裝啤酒,每瓶的裝填量為640ml,但由于受某些不可控因素的影響,每瓶的裝填量會有差異。此時,不僅每瓶的平均裝填量很重要,裝填量的方差同樣很重要。如果方差很大,會出現(xiàn)裝填量太多或太少的情況,這樣要么生產(chǎn)企業(yè)不劃算,要么消費者不滿意。假定生產(chǎn)標準規(guī)定每瓶裝填量的標準差不應(yīng)超過4ml。企業(yè)質(zhì)檢部門抽取了10瓶啤酒進行檢驗,得到的樣本標準差為s=3.8ml。試以0.05的顯著性水平檢驗裝填量的標準差是否符合要求?朝

32、日BEER朝日BEER朝日BEER朝日總體方差的檢驗(例題分析)H0 : 2 42H1 : 2 42 = 0.10df = 10 - 1 = 9臨界值(s):統(tǒng)計量:不拒絕H0 (p=0.52185)沒有證據(jù)表明裝填量的標準差不符合要求 2016.9190 =0.05決策:結(jié)論:6.3 兩個總體參數(shù)的檢驗 6.3.1 兩個總體均值之差的檢驗 6.3.2 兩個總體比例之差的檢驗 6.3.3 兩個總體方差比的檢驗第 6 章 假設(shè)檢驗6.3.1 兩個總體均值之差的檢驗6.3 兩個總體參數(shù)的檢驗兩個總體均值之差的檢驗 (獨立大樣本)1.假定條件兩個樣本是獨立的隨機樣本正態(tài)總體或非正態(tài)總體大樣本(n13

33、0和 n230)2.檢驗統(tǒng)計量 12 , 22 已知: 12 , 22 未知:兩個總體均值之差的檢驗 (例題分析獨立大樣本)【例6-10】某公司對男女職員的平均小時工資進行了調(diào)查,獨立抽取了具有同類工作經(jīng)驗的男女職員的兩個隨機樣本,并記錄下兩個樣本的均值、方差等資料如右表。在顯著性水平為0.05的條件下,能否認為男性職員與女性職員的平均小時工資存在顯著差異? 兩個樣本的有關(guān)數(shù)據(jù) 男性職員女性職員n1=44n1=32x1=75x2=70S12=64 S22=42.25兩個總體均值之差的檢驗 (例題分析獨立大樣本)H0 :1- 2 = 0H1 :1- 2 0 = 0.05n1 = 44,n2 =

34、32臨界值(c):檢驗統(tǒng)計量:決策:結(jié)論: 拒絕H0該公司男女職員的平均小時工資之間存在顯著差異 z01.96-1.960.025拒絕 H0拒絕 H00.025兩個總體均值之差的檢驗 (獨立小樣本: 12, 22 已知)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布 12, 22已知檢驗統(tǒng)計量兩個總體均值之差的檢驗 (獨立小樣本:12,22 未知但12=22)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布12、22未知但相等,即12=22檢驗統(tǒng)計量其中:自由度:兩個總體均值之差的檢驗 (獨立小樣本:12,22 未知且不等1222)假定條件兩個總體都是正態(tài)分布12,22未知且不相等,即1222樣本量

35、不相等,即n1n2檢驗統(tǒng)計量自由度:兩個總體均值之差的檢驗 (例題分析獨立小樣本,12=22) 【例6-11】甲、乙兩臺機床同時加工某種同類型的零件,已知兩臺機床加工的零件直徑(單位:cm)分別服從正態(tài)分布,并且有12=22 。為比較兩臺機床的加工精度有無顯著差異,分別獨立抽取了甲機床加工的8個零件和乙機床加工的7個零件,通過測量得到如下數(shù)據(jù) 。在=0.05的顯著性水平下,樣本數(shù)據(jù)是否提供證據(jù)支持 “兩臺機床加工的零件直徑不一致”的看法?兩臺機床加工零件的樣本數(shù)據(jù) (cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.

36、2兩個總體均值之差的檢驗 (例題分析12=22)H0 :1- 2 = 0H1 :1- 2 0 = 0.05n1 = 8,n2 = 7臨界值(c):檢驗統(tǒng)計量:決策:結(jié)論: 不拒絕H0沒有證據(jù)表明兩臺機床加工的零件直徑不一致t02.160-2.1600.025拒絕 H0拒絕 H00.025兩個總體均值之差的檢驗 (用Excel進行檢驗)第1步:將原始數(shù)據(jù)輸入到Excel工作表格中 第2步:選擇【工具】下拉菜單并選擇【數(shù)據(jù)分析】選項 第3步:在【數(shù)據(jù)分析】對話框中選擇 【t-檢驗:雙樣本等方 差假設(shè)】第4步:當對話框出現(xiàn)后 在【變量1的區(qū)域】方框中輸入第1個樣本的數(shù)據(jù)區(qū)域 在【變量2的區(qū)域】方框中

37、輸入第2個樣本的數(shù)據(jù)區(qū)域 在【假設(shè)平均差】方框中輸入假定的總體均值之差 在【】方框中輸入給定的顯著性水平(本例為0.05) 在【輸出選項】選擇計算結(jié)果的輸出位置,然后【確 定】進行檢驗Excel兩個總體均值之差的檢驗 (用Excel進行檢驗)Excel的輸出結(jié)果兩個總體均值之差的檢驗 (例題分析獨立小樣本,1222) 【例6-12】甲、乙兩臺機床同時加工某種同類型的零件,已知兩臺機床加工的零件直徑(單位:cm)分別服從正態(tài)分布,并且有1222 。為比較兩臺機床的加工精度有無顯著差異,分別獨立抽取了甲機床加工的8個零件和乙機床加工的7個零件,通過測量得到如下數(shù)據(jù) 。在=0.05的顯著性水平下,樣

38、本數(shù)據(jù)是否提供證據(jù)支持 “兩臺機床加工的零件直徑不一致”的看法?兩臺機床加工零件的樣本數(shù)據(jù) (cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.2兩個總體均值之差的檢驗 (用Excel進行檢驗)第1步:將原始數(shù)據(jù)輸入到Excel工作表格中 第2步:選擇“工具”下拉菜單并選擇【數(shù)據(jù)分析】選項 第3步:在【數(shù)據(jù)分析】對話框中選擇 【t-檢驗:雙樣本異方 差假設(shè)】第4步:當對話框出現(xiàn)后 在【變量1的區(qū)域】方框中輸入第1個樣本的數(shù)據(jù)區(qū)域 在【變量2的區(qū)域】方框中輸入第2個樣本的數(shù)據(jù)區(qū)域 在【假設(shè)平均差】方框中輸入假定的總體均

39、值之差 在【】方框中輸入給定的顯著性水平(本例為0.05) 在【輸出選項】選擇計算結(jié)果的輸出位置,然后【確 定】進行檢驗Excel兩個總體均值之差的檢驗 (用Excel進行檢驗)Excel的輸出結(jié)果用SPSS進行檢驗(獨立小樣本,12=22 ;1222) 在用SPSS中進行檢驗時,需要把兩個樣本的觀測值作為一個變量輸入(本例為“零件尺寸”),然后設(shè)計另一個變量用于標記每個觀測值所屬的樣本(本例為“機床”,1表示機床1,2表示機床2)第1步:選擇【Analyze】【Compare MeansIndependent-Samples T Test 】進入主對話框第2步:檢驗變量(零件尺寸)選入【Te

40、st Variable(s)】, 將分組變量(機床)選入【Grouping Variable(s)】,并選擇【Define Groups】,在【Group1后輸入1】,在【Group2后輸入2】,點擊【Continue】回到主對話框。點擊【OK】進行檢驗SPSS兩個總體均值之差的檢驗 (用SPSS進行檢驗)ESPSS的輸出結(jié)果Levenes Test for Equality of Variances:檢驗兩個總體方差相等的假設(shè)兩個總體均值之差的檢驗(配對樣本)假定條件兩個總體配對差值構(gòu)成的總體服從正態(tài)分布配對差是由差值總體中隨機抽取的 數(shù)據(jù)配對或匹配(重復(fù)測量 (前/后)檢驗統(tǒng)計量樣本差值均

41、值樣本差值標準差匹配樣本 (數(shù)據(jù)形式) 觀察序號樣本1樣本2差值1x11x21d1 = x11 - x212x12x22d2 = x12 - x22MMMMix1ix2idi = x1i - x2iMMMMnx1nx2ndn = x1n- x2n兩個總體均值之差的檢驗 (例題分析配對樣本) 【例6-13】某飲料公司開發(fā)研制出一新產(chǎn)品,為比較消費者對新老產(chǎn)品口感的滿意程度,該公司隨機抽選一組消費者(8人),每個消費者先品嘗一種飲料,然后再品嘗另一種飲料,兩種飲料的品嘗順序是隨機的,而后每個消費者要對兩種飲料分別進行評分(0分10分),評分結(jié)果如下表。取顯著性水平 =0.05,該公司是否有證據(jù)認為

42、消費者對兩種飲料的評分存在顯著差異? 兩種飲料平均等級的樣本數(shù)據(jù)舊飲料54735856新飲料66743976兩個總體均值之差的檢驗 (用Excel進行檢驗配對樣本)第1步:選擇“工具”下拉菜單,并選擇【數(shù)據(jù)分析】選項第3步:在分析工具中選擇【t 檢驗:平均值成對二樣本分析】第4步:當出現(xiàn)對話框后 在【變量1的區(qū)域】方框內(nèi)鍵入變量1的數(shù)據(jù)區(qū)域 在【變量2的區(qū)域】方框內(nèi)鍵入變量2的數(shù)據(jù)區(qū)域 在【假設(shè)平均差】方框內(nèi)鍵入假設(shè)的差值(這里為0) 在【】框內(nèi)鍵入給定的顯著性水平,然后【確定】 進行檢驗Excel配對總體均值之差的檢驗 (用Excel進行檢驗)Excel的輸出結(jié)果兩個總體均值之差的檢驗 (用

43、SPSS進行檢驗配對樣本)第1步:選擇【Analyze】下拉菜單,并選擇【Compare MeansPaired- Samples T Test】選項,進入主對話框第2步:將兩個樣本同時選入【Paired Variables】第3步:點擊【Options】,選擇所需的置信水平(隱含值為95%)。點擊【Continue】回到主對話框。點擊【OK】進行檢驗SPSS配對總體均值之差的檢驗 (用SPSS進行檢驗)SPSS的輸出結(jié)果兩個總體均值之差的檢驗 (TTEST函數(shù)的應(yīng)用 )函數(shù)語法:TTEST(array1,array2,tails,type) 說明:【Array1】為樣本1的數(shù)據(jù)區(qū)域 【array2】為樣本2的數(shù)據(jù)區(qū)域 【tails】表示分布曲線的尾數(shù)如果tails=1,返回分布的單尾概率如果tails=2,返回分布的雙尾概率【type】為檢驗的類型1代表配對樣本檢驗1代表雙樣本等方差假設(shè)3代表雙樣本異方差假設(shè)用TTEST進行檢驗Excel兩個總體均值之差的檢驗(方法總

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論