第7章參數(shù)假設(shè)檢驗_第1頁
第7章參數(shù)假設(shè)檢驗_第2頁
第7章參數(shù)假設(shè)檢驗_第3頁
第7章參數(shù)假設(shè)檢驗_第4頁
第7章參數(shù)假設(shè)檢驗_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第七章 參數(shù)假設(shè)檢驗假設(shè)檢驗的概念 假設(shè)檢驗(顯著性檢驗):事先對總體參數(shù)或總體分布形式作出一個假設(shè),然后利用樣本信息判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定應(yīng)接受或否定原假設(shè)。 參數(shù)檢驗:已知總體分布,猜出總體的某個參數(shù)(假設(shè)H0),用一組樣本來檢驗這個假設(shè)是否正確(接受或拒絕假設(shè)H0) 非參數(shù)檢驗:猜出總體分布(假設(shè)H0),用一組樣本檢驗該假設(shè)是否正確一、假設(shè)檢驗的基本思想p某企業(yè)生產(chǎn)一種零件,過去的大量資料表明,零件的平均長度為4厘米,標(biāo)準(zhǔn)差為0.1厘米。工藝改革后,抽查了100個零件,測得樣本的平均長度為3.94厘米。現(xiàn)問:工藝改革前后零件的平均長度是否發(fā)生顯

2、著變化?p分析:樣本平均長度與原平均長度出現(xiàn)差異不外乎二種可能,一是改革后平均長度不變,但由于抽樣的隨機(jī)性使樣本平均數(shù)與總體平均數(shù)存在誤差;二是由于工藝條件的變化,使總體平均數(shù)發(fā)生顯著變化。因此可以這樣推斷,如果樣本平均數(shù)與總體平均數(shù)之間差異不大,未超出抽樣誤差范圍,則認(rèn)為總體平均數(shù)不變;反之,如果樣本平均數(shù)與總體平均數(shù)之間的差異超出抽樣誤差的范圍,則認(rèn)為總體平均數(shù)發(fā)生顯著變化。一、假設(shè)檢驗的基本思想00/ 20/ 2(0,1),/(1),*/ xNnxZxZnn根據(jù)抽樣分布定理,如果對總體平均數(shù)的假設(shè)為真,則給定置信度 時,應(yīng)有即樣本平均數(shù)與總體平均 數(shù)之差屬于抽樣誤差范 圍,反之,樣本平均

3、數(shù) 與總體平均數(shù)之差超過抽樣誤差范圍,說明原假設(shè)不正確。因為 很小,這一小概率事件的出現(xiàn)是不合理的,從而有必要懷疑導(dǎo)致這一小概率事件發(fā)生的前提假設(shè),即拒絕原假設(shè)。一、假設(shè)檢驗的基本思想著變化顯革前后零件的長度有了定原假設(shè),推斷工藝改居然發(fā)生了,因此應(yīng)否一小概率事件次,而一次抽樣中,這生次的重復(fù)試驗中才會發(fā)事件在是小概率事件,這一而于是,則,給定假設(shè)本例中,110058. 2/5100/1 . 0495. 3/58. 201. 04,100, 1 . 0,95. 30, 2/02/nxZnxZnx假設(shè)檢驗的特點:假設(shè)檢驗所采用的邏輯推理是反證法,為檢驗?zāi)硞€假設(shè)是否成立,先假定它是正確的,然后根據(jù)

4、抽樣理論和樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)合理與否的依據(jù)是“小概率事件實際不可能發(fā)生的原理”。即一次觀察中小概率事件發(fā)生了,則認(rèn)為原假設(shè)是不合理的;反之,小概率事件沒有出現(xiàn),則認(rèn)為原假設(shè)合理。因此,假設(shè)檢驗的反證法是帶有概率性質(zhì)的反證法,并非嚴(yán)格的邏輯證明.假設(shè)檢驗是基于樣本資料進(jìn)行總體特征的推斷,而這種推斷是在一定的置信概率下進(jìn)行。二、假設(shè)檢驗的步驟p1、提出原假設(shè)和備擇假設(shè)p原假設(shè)(零假設(shè)):正待檢驗的假設(shè),記為H0 0;備擇假設(shè)(對立假設(shè)):拒絕原假設(shè)后可供選擇的假設(shè),記為H1 1,p二者必須對立,檢驗結(jié)果二者取其一。p原假設(shè)的提出根據(jù)所檢驗問題的具體背

5、景而定,采取“不輕易拒絕原假設(shè)”的原則,即把沒有充分理由不能輕易否定的命題作為原假設(shè),而相應(yīng)地把沒有把握就不能輕易肯定的命題作為備擇假設(shè)p假設(shè)的三種形式:p(1)雙側(cè)檢驗 H0: 0,H1: 0;p(2)左側(cè)檢驗 H0: 0,H1: 0二、假設(shè)檢驗的步驟p2、選擇適當(dāng)?shù)慕y(tǒng)計量,并確定其分布形式n不同的假設(shè)檢驗問題需選用不同的統(tǒng)計量作為檢驗統(tǒng)計量p3、選擇顯著性水平,確定臨界值n顯著性水平表示H0為真時拒絕原假設(shè)的概率,即拒絕原假設(shè)所冒的風(fēng)險,假設(shè)檢驗應(yīng)用小概率事件實際不發(fā)生的原理,小概率為,通常取0.1、0.05或0.01n給定,就可以確定接受區(qū)域和拒絕區(qū)域p4、作出結(jié)論n計算檢驗統(tǒng)計量的具體

6、值,與臨界值比較,作出拒絕或接受原假設(shè)的結(jié)論。三、假設(shè)檢驗的兩類錯誤p當(dāng)我們依據(jù)樣本數(shù)據(jù),來判斷 H H0 0對或不對時,我們可能犯錯誤。例如,當(dāng)我們判斷H H0 0不對時,就相當(dāng)于拒絕了H H0 0 ,接受了H H1 1。這時,我們可能犯錯誤:在H H0 0 成立的情況下,我們卻拒絕了H H0 0 。我們把這件事記為:“拒絕H H0 0 | H H0 0是對的”。p我們當(dāng)然希望犯錯誤的概率很小,例如,1%,5%之類(記這個概率為),也就是概率P P拒絕H0| H0為真,很小。稱這類錯誤,為很小。稱這類錯誤,為“第一類錯誤第一類錯誤”,也就,也就是是“棄真棄真”錯誤。錯誤。三、假設(shè)檢驗的兩類錯

7、誤p事實上還可能發(fā)生另一類錯誤:“存?zhèn)巍卞e誤。p如果我們假設(shè)H0是不對的,但計算的結(jié)果卻接受H0(記為“接收H0| H0為假”),就犯了存?zhèn)五e誤。p當(dāng)然,我們也希望所犯的“存?zhèn)巍钡腻e誤的概率很小,也就是P接收H0| H0為假 =,很?。ㄍǔH?%,或1%)。這種錯誤,稱為第二類錯誤p習(xí)慣上,一般采用“棄真”錯誤的概率很小的準(zhǔn)則四四、一個正態(tài)總體下的參數(shù)假設(shè)檢驗、一個正態(tài)總體下的參數(shù)假設(shè)檢驗【總體【總體X服從N(,2)與2的參數(shù)假設(shè)檢驗?!縫關(guān)于正態(tài)母體均值關(guān)于正態(tài)母體均值 的假設(shè)檢驗的假設(shè)檢驗p本節(jié)討論:關(guān)于均值的假設(shè)檢驗的如下三種情況:p1)已知已知方差2,假設(shè)( 是某個確切的數(shù)字),通過樣

8、本觀察值x1,x2,, xn,檢驗H0是否成立(使棄真錯誤棄真錯誤概率很小,即概率PP拒絕拒絕H H0 0| H| H0 0為真為真 很?。?。p2)未知未知方差2,假設(shè),通過樣本觀察值x1,x2,, xn,檢驗H0是否成立(使棄真的錯誤棄真的錯誤的概率很小,也就是概率PP拒絕拒絕H H0 0| H| H0 0為真為真 很?。?。p3)未知未知方差2,假設(shè),通過樣本觀察值x1,x2,, xn,檢驗H0是否成立(使棄真的錯誤棄真的錯誤的概率很小,也就是概率PP拒絕拒絕H H0 0| H| H0 0為真為真 很小)。1)已知方差2,檢驗假設(shè) H0 :=0p例1. 已知機(jī)器生產(chǎn)出來的零件直徑服從正態(tài)分布

9、,已知方差2為0.09(毫米2),假設(shè)H0:均值=10(毫米)。現(xiàn)在有一組樣本觀察值:10.01,10.02,10.02,9.99。請判斷假設(shè)H0是否正確。p首先,應(yīng)當(dāng)找出一個的統(tǒng)計量,我們知道當(dāng)X服從正態(tài)分布時,統(tǒng)計量 p 可以由樣本算出,所以,z可以算出。分布,服從)10(/)(NnXZx分析思路設(shè),即拒絕原假設(shè)。概率事件發(fā)生的前提假有必要懷疑導(dǎo)致這一小是不合理的,從而的出現(xiàn)很小,這一小概率事件假設(shè)不正確。因為樣誤差范圍,說明原抽與總體平均數(shù)之差超過圍,反之,樣本平均數(shù)數(shù)之差屬于抽樣誤差范均,樣本平均數(shù)與總體平即時,應(yīng)有為真,則給定置信度平均數(shù)的假設(shè)如果對總體果原假設(shè)成立,則根據(jù)抽樣分布定

10、理,如 /*,/)1 (),1 , 0(/Z2/02/00nZxZnxNnx接受原假設(shè)。因此的把握拒絕原假設(shè),圍之內(nèi),我們沒有之差屬于誤差允許的范體平均數(shù)這說明樣本平均數(shù)與總于是,則,給定假設(shè)本例中,95067. 04/3 . 01001.10/96. 105. 010, 4, 3 . 0,01.10, 2/02/ZnxZnx 2.5% 2.5% k k95%查表標(biāo)準(zhǔn)正態(tài)分布概率表(0.975所對應(yīng)的)k = z z0.0250.025 = 1.96注意:一些習(xí)慣格式與術(shù)語注意:一些習(xí)慣格式與術(shù)語p習(xí)慣格式:原假設(shè)原假設(shè)(或零假設(shè)零假設(shè))H0:=0,p 備擇假設(shè)備擇假設(shè)H1:0p若拒絕H0,就

11、相當(dāng)于備擇假設(shè)H1(0)可能發(fā)生。此時,稱為雙尾檢驗雙尾檢驗。p若取=0.05,則z0.025 記為z/2 。 稱為顯著性水稱為顯著性水平平,也是犯棄真錯誤的概率。p當(dāng)然,也可取=0.01,或其他值(在0與1之間),它反映出犯錯誤的不同的概率。2)未知方差2,檢驗假設(shè):=0,p例2. 已知生產(chǎn)出來的零件直徑服從正態(tài)分布,現(xiàn)有假設(shè)H0:均值=10(毫米)。這個假設(shè)可以是生產(chǎn)標(biāo)準(zhǔn)所要求的。現(xiàn)在有一組樣本觀察值:10.01,10.02,10.02,9.99。請判斷假設(shè)H0是否正確。p同樣,先要找出一個統(tǒng)計量,滿足pA)已經(jīng)知其分布和參數(shù)。pB)在題目的條件下,可以依據(jù)樣本,算出這個統(tǒng)計量的值。我們知

12、道統(tǒng)計量 服從t(n-1)分布。它滿足上述A、B兩個條件:nSx/)(T分析思路設(shè),即拒絕原假設(shè)。概率事件發(fā)生的前提假有必要懷疑導(dǎo)致這一小是不合理的,從而的出現(xiàn)很小,這一小概率事件假設(shè)不正確。因為樣誤差范圍,說明原抽與總體平均數(shù)之差超過圍,反之,樣本平均數(shù)數(shù)之差屬于抽樣誤差范均,樣本平均數(shù)與總體平即時,應(yīng)有為真,則給定置信度平均數(shù)的假設(shè)如果對總體原假設(shè)成立,則果根據(jù)抽樣分布定理,如 /*,/)1 (),1(/ t 2/02/00nstxtnsxntnsx2.5%2.5% k k 如果k的右邊的概率是0.025,就記k為t0.025,于是, P (| T | t0.025 ) = 0.05 如果

13、|t|真的 t0.025了,那么就拒絕拒絕H0,此時,犯“棄真棄真”錯誤的概率只有0.05p查t(3)表,/2=0.025 所對應(yīng)的t t0.0250.025,得出t t0.0250.025 =3.1823.182。p 現(xiàn)在,依據(jù)題目的條件,可以算出p也就是p |t|=1.4140p同樣,先要找出一個已經(jīng)知分布和參數(shù)的統(tǒng)計量,并且,在上述題目的條件下,能夠算出這個統(tǒng)計量的值。p選擇統(tǒng)計量分布服從)1(/)(ntnSXtp棄真概率PP拒絕拒絕H H0 0,認(rèn)為,認(rèn)為0 | |=0為真為真=p它應(yīng)當(dāng)很小,那么,就應(yīng)當(dāng)有 P ( t t0.05 ) = 0.05p注意:此時的備擇假設(shè)注意:此時的備擇

14、假設(shè)H H1 1是是0,也就是應(yīng)有,也就是應(yīng)有 1010,由,由t t式式知,這可能會導(dǎo)致知,這可能會導(dǎo)致t t很大,所以,這里僅考慮很大,所以,這里僅考慮t k的概率為的概率為的的式子,這決定了只能從單側(cè)來考慮式子,這決定了只能從單側(cè)來考慮k的取值,也就是單尾檢驗的取值,也就是單尾檢驗)p如果t真的大于t0.05了,那么就拒絕拒絕H H0 0,此時,犯錯誤的概率只有0.05,查t(3)表,=0.05所對應(yīng)的t t0.050.05,得出2.35342.3534。p現(xiàn)在,依據(jù)題目的條件,可以算出x14.140002.04)101.10(/)(nsxtp也就是 t=14.14 t t0.050.0

15、5=2.3534p 所以,拒絕假設(shè)H0,接受備擇假設(shè)備擇假設(shè)H H1 1,認(rèn)為,認(rèn)為0 =10(抗剪強(qiáng)度單位),也就是該用新材料后,抗剪強(qiáng)度提高了。此時犯錯誤錯誤的概率為0.05p1)先要找出一個已經(jīng)知分布和參數(shù)已經(jīng)知分布和參數(shù)的統(tǒng)計量統(tǒng)計量,并且,在題目的條件下,能夠算出這個統(tǒng)計量算出這個統(tǒng)計量的值。的值。p2)在概率PP拒絕拒絕H H0 0| H| H0 0為真為真=很小的條件下,由查出臨界值。進(jìn)而比較計算出的統(tǒng)計量的值與臨界值的大小,判斷是拒絕還是接受H H0 0p3)從“原假設(shè)與備擇假設(shè)”,判斷是雙尾檢驗還是單尾檢驗p p值:與查表找臨界點的等價判別法值:與查表找臨界點的等價判別法p1

16、. 1. 雙尾檢驗的情形雙尾檢驗的情形( (以以T T統(tǒng)計量為例統(tǒng)計量為例) )p此前,通過比較統(tǒng)計值此前,通過比較統(tǒng)計值(如t、z)與臨界值與臨界值(k)之間的大小關(guān)之間的大小關(guān)系,來判斷拒絕還是接受零假設(shè)(系,來判斷拒絕還是接受零假設(shè)( =0 ?)的。?)的。p其圖解是:其圖解是: 接受t = 0 即=10的區(qū)域k=t0.025=3.1821P(Tt0.025)=0.025t ?p由上圖可知:由上圖可知:pt tk k(t t0 0的情形)等價于:的情形)等價于:t t的外側(cè)的概率的外側(cè)的概率 /2/2(雙(雙尾情形)尾情形)pt tk k臨界值(即臨界值(即t t0.0250.025,參

17、見上圖),等價于,參見上圖),等價于t t的外側(cè)的概的外側(cè)的概率率 /2 /2(0.0250.025) p總之,在雙尾檢驗的情形下,比較總之,在雙尾檢驗的情形下,比較t t與臨界值與臨界值k k,與比較,與比較t t的外側(cè)概率的外側(cè)概率1 1P(Tt)P(Tt)和和 /2/2,是等價的。,是等價的。p 據(jù)此,我們定義雙尾檢驗情況下統(tǒng)計值據(jù)此,我們定義雙尾檢驗情況下統(tǒng)計值t t的的p p值為:統(tǒng)值為:統(tǒng)計值計值t t的的“外側(cè)外側(cè)”概率的兩倍。即概率的兩倍。即p 雙尾檢驗情況下:雙尾檢驗情況下:t t的的p p值值2 2(1 1P(Tt)P(Tt))p本書把本書把“統(tǒng)計值統(tǒng)計值t t的的p p值

18、值”稱為統(tǒng)計值稱為統(tǒng)計值t t的顯著性概率。的顯著性概率。p今后,今后,(SPSS(SPSS就是這樣處理的就是這樣處理的) )p若若p p ,則表明落在由所決定的分界點的外側(cè),應(yīng)當(dāng),則表明落在由所決定的分界點的外側(cè),應(yīng)當(dāng)拒絕拒絕H H0 0,接受,接受H H1 1。p若若p p ,則表明落在由所決定的分界點的內(nèi)側(cè),應(yīng)當(dāng),則表明落在由所決定的分界點的內(nèi)側(cè),應(yīng)當(dāng)接受接受H H0 0。p2. 2. 單尾檢驗的情形單尾檢驗的情形( (以以T T統(tǒng)計量為例統(tǒng)計量為例) )p在單尾檢驗的情況下,由于已經(jīng)先驗地得知在單尾檢驗的情況下,由于已經(jīng)先驗地得知與0的關(guān)系( 0 或0 ),因此,只用考慮前面的一半的情

19、形,不用除以2。p在單尾檢驗的情形下,統(tǒng)計值t的p值1P(Tt) p若若p p ,則表明落在由所決定的分界點的外側(cè),則表明落在由所決定的分界點的外側(cè),應(yīng)當(dāng)拒絕應(yīng)當(dāng)拒絕H H0 0,接受,接受H H1 1。p若若p p ,則表明落在由所決定的分界點的內(nèi)側(cè),則表明落在由所決定的分界點的內(nèi)側(cè),應(yīng)當(dāng)接受應(yīng)當(dāng)接受H H0 0。p 這與雙尾的情形統(tǒng)一起來了。pSPSS會輸出統(tǒng)計值的p值,從此就不用查表了。而且可以。關(guān)于正態(tài)母體的方差2的檢驗關(guān)于方差的假設(shè)檢驗,分如下兩種情況:p1)未知均值,假設(shè)H0:總體方差2=20,通過樣本觀察值x1,x2,, xn,檢驗H0是否成立(使棄真的概率很小)。p2)未知均值

20、,假設(shè)H0:總體方差220,通過樣本觀察值x1,x2,, xn,檢驗H0是否成立 (使棄真的概率很?。1)未知均值,檢驗假設(shè)H0:總體方差2=20是否成立p 例2.4 已知生產(chǎn)出來的零件直徑服從正態(tài)分布,長期以來直徑的均方差=0.3毫米,現(xiàn)材質(zhì)改進(jìn),抽出20個樣本,(為方便,不列出這20個樣本的數(shù)據(jù),僅給出由這20個樣本計算出來的樣本方差s2=0.16)。請判斷該生產(chǎn)線的方差是否改變。p此時的檢驗假設(shè)可以定為:pH0:總體方差 2 2= 2 20=0.09,H1:總體方差 2 2 2 20。p 同樣,先要找出一個已經(jīng)知分布和參數(shù)已經(jīng)知分布和參數(shù)的統(tǒng)計量統(tǒng)計量,并且,在上述題目的條件下,能夠

21、算出這個統(tǒng)計量算出這個統(tǒng)計量的值的值。p由第二章,我們知道統(tǒng)計量p顯然這個統(tǒng)計量滿足上述條件:分布及參數(shù)均已知,而且把0.3代入式中的 后,可以用樣本值算出統(tǒng)計量的值。p注意到: (n-1)(n-1)關(guān)于關(guān)于y y軸是不對稱的。當(dāng)軸是不對稱的。當(dāng) 確定后,確定后,若若 S S2大,則大,則 大;若大;若S S2小,則小,則 小。小。)分布(服從1)1(2222nSn222p按照棄真概率很小的思路,有按照棄真概率很小的思路,有p PP拒絕拒絕H H0 0, , 2 20.09,| | 2 2=0.09為真為真=很小p即: P ( /2 ) = /2,p或: P ( 1-/2) = /2p如果代入

22、S2后,上述括號里面的事情發(fā)生了,就應(yīng)當(dāng)拒絕拒絕H H0 0。否則,就接受H H0 0。p由題目條件,可算出p查表得: 0.025(19)=32.9, 0.975(19)=8.91p現(xiàn)在, =33.7778 0.025(19)=32.9 p所以,拒絕H H0 0,此時,我們有95%的把握拒絕原假設(shè),犯錯誤的概率只有0.0522227778.3316. 009. 019) 1(2202sn2222p2 2)未知均值)未知均值 ,檢驗假設(shè),檢驗假設(shè)H H0 0:總體方差:總體方差 2 22 20 0是否成立是否成立p 例2.5 已知生產(chǎn)出來的零件直徑服從正態(tài)分布,長期以來直長期以來直徑的均方差徑的

23、均方差 =0.3=0.3毫米,毫米,現(xiàn)材質(zhì)改進(jìn),抽出9個樣本,(為方便,不列出這9個樣本的數(shù)據(jù),給出由這9個樣本計算出來的方差s2=0.352)。請判斷該生產(chǎn)線的方差是否會小于方差是否會小于0.09。p此問題與例3相似,檢驗的目標(biāo)有所不同。p可安排假設(shè)如下:pH0:總體方差 2 2 = 2 20 =0.09, (注意,這里H0的安排,采用的是國外一些教材的安排方法,與國內(nèi)的許多教材不一樣)pH1:總體方差 2 20.25),從而斷定是否能夠聘用。p顯然,這是一個單側(cè)檢驗的問題。 p應(yīng)聘者答10道題,相當(dāng)于得到10個樣本:X1,X2,, X10。p我們不能用統(tǒng)計量 做檢驗,因為我們。(僅僅知道其

24、均值與方差)。p但我們,即二項分布B(10,p)B(10,p),并且可以計算出統(tǒng)計量Y的值,可用Y來做假設(shè)檢驗。p注意,Y就是答對題目的個數(shù)(因為答錯時Xi=0)。p設(shè):設(shè):r r是是Y Y的觀察值的觀察值。p當(dāng)答對題目的個數(shù)r r大于等于閾值大于等于閾值k k時,就拒絕時,就拒絕H H0 0,認(rèn)為應(yīng)答者的p0.25。p此時,概率,即把“p=0.25的人,判斷為p0.25的人”的比率,很小。p于是應(yīng)有:XX=rkkrP的所有大于等于答對的題目數(shù))(p式中,k是拒絕H H0 0的答對的最少題目數(shù)。p由二項分布的如下概率公式 ,可得下表:回答正確(正面)的(正面)的次數(shù)rP(正面=r)自下而上的累

25、計概率的累計概率00.05631.000010.18770.943720.28160.756030.25030.447440.14600.224150.05840.07810.016270.00310.003580.00040.000490.00000.0000100.00000.0000由此可以看出,取r=6時,由所有大于等于的所有大于等于的r計算出的概率之計算出的概率之和和0.0197=0.05。 rnrpprnrP)1 ()(正面次數(shù)一個一個0-10-1總體的大樣本比例值的參數(shù)檢驗總體的大樣本比例值的參數(shù)檢驗 p例:例:某公司要招聘工程師。出了100道“正誤”選擇題。問:至少應(yīng)當(dāng)答對幾道

26、題,才能考慮錄???p總體是0-1分布B(1,p),p0.5。p樣本是一個應(yīng)聘者答100個問題的正誤:X1,X2,, X100,p總分Y,服從二項分布二項分布B(100,p)B(100,p)。p像上題那樣計算,n100,量太大了,p改用大樣本大樣本(中中心極限定理心極限定理),完全已知,并且可由樣本計算出統(tǒng)計值完全已知,并且可由樣本計算出統(tǒng)計值z。所以可用來檢驗。npppXZ/)1 ( 要求:np10 n(1-p)10Xp于是,我們有假設(shè)p H0 :p=0.5=0.5(回答者猜答案,不聘用)p H1:p0.5(回答者依據(jù)知識選擇答案,聘用)p 這是一個單尾檢驗(one-tail test)的問題

27、。p若H0成立,則Z應(yīng)當(dāng)很?。ǎ?。,接受H1:回答者與猜答案猜答案有顯著差異。p此時,仍然可有犯錯誤,但。p如果應(yīng)聘者得了如果應(yīng)聘者得了6262分分(即 =0.62),則容易算出 z 100/5 . 05 . 05 . 062. 0=2.4,查表,z=2.33,=0.01。z z,所以拒絕H0,在在1%的置信水平上,的置信水平上,62分與分與50分有顯著區(qū)別,分有顯著區(qū)別,不是瞎猜的不是瞎猜的,可以及格可以及格。此時,靠瞎猜猜到62分的概率不超過1%。若取=0.0233 ,可以算出60分與50分有顯著差別,可及格。 x七、兩個正態(tài)母體下的參數(shù)假設(shè)檢驗七、兩個正態(tài)母體下的參數(shù)假設(shè)檢驗p概述概述p

28、設(shè):獲得來自兩個母體的相互獨立的樣本(來自兩個母體的相互獨立的樣本(x x1 1,x x2 2,, x, xn n)與()與(y y1 1,y y2 2,, y, ym m),完成如下4種情況的參數(shù)檢驗問題:p1)未知均值1,2,檢驗假設(shè)H0:總體方差 2 21= 2 22,p2)未知均值1,2,檢驗備擇假設(shè)H1: 2 21 2 22p上兩種檢驗,又稱為對方差齊性的檢驗方差齊性的檢驗。p3)未知方差 2 21, 2 22,但知道知道 2 21= 2 22(稱為方差齊性),檢驗假設(shè)H0:1=2 p4)未知方差 2 21, 2 22,但知道知道 2 21 2 22(稱為非齊次方差),檢驗假設(shè)H0:

29、1=2 應(yīng)當(dāng)是:1), H0成立時, 3)p 1), H0不成立時, 4)p 2)單尾檢驗,可獨立進(jìn)行。p(關(guān)于相互獨立的樣本的說明見下頁)(關(guān)于相互獨立的樣本的說明見下頁)相互獨立的兩組樣本相互獨立的兩組樣本p如果兩組樣本:兩組樣本:x x1 1,x x2 2,, x, xn n 與與 y y1 1,y y2 2,, y, ym m,可以各自相互獨立地顛倒樣本的順序,而不影響檢驗結(jié)果,那么,這兩組樣本就是相互獨立的。p在SPSS的數(shù)據(jù)存放中,相互獨立的兩組樣本是排在同相互獨立的兩組樣本是排在同一列的一列的。p區(qū)別兩組樣本的標(biāo)志,是靠另一個變量(分類變量)靠另一個變量(分類變量)。p存放方式,

30、見下圖。 值變量值變量 分類變量分類變量 數(shù)字?jǐn)?shù)字1 x 數(shù)字?jǐn)?shù)字2 x 數(shù)字?jǐn)?shù)字n x 數(shù)字?jǐn)?shù)字n+1 y 數(shù)字?jǐn)?shù)字n+2 y 數(shù)字?jǐn)?shù)字n+m y樣本存放方式樣本存放方式p四種類型的假設(shè)檢驗的要點四種類型的假設(shè)檢驗的要點 p對問題對問題1 1)未知1,2,p由于H0是 2 21= 2 22,F(xiàn)統(tǒng)計量p可簡化為p F=SF=S1 12 2 / / S S2 22 2 服從 F ( n-1, m-1) 分布p備擇假設(shè)H1: 2 21 2 22,這是雙尾檢驗。p注意F分布是非對稱的。所以檢驗分析式為p P F f/2 = /2p PF f = p以下,只要計算出f值,與查表值f比較,就行了。p對問

31、題對問題3 3),已知 2 21= 2 22,要檢驗:,12,p在在 2 21 1=2 22 2條件下,有條件下,有:p(式中,n是X的樣本數(shù),m是Y的樣本數(shù))p由于H0是1=2,所以:分布服從)2(/1/1)2/() 1() 1()()(222121mntmnmnSmSnYXTmnmnsmsnyxt/1/1)2/() 1() 1()(2221把計算出來的t值,與t t0.0250.025(若=0.05)比較: 若 | t | t t0.0250.025,則拒絕H0,12, 若 | t | t t0.0250.025,則接受H0:1=2p對問題對問題4 4)已知 2 21 2 22(稱為非齊次

32、方差),p要檢驗H0:1=2 12,p此時,此時,SPSSSPSS使用如下統(tǒng)計量,檢驗兩個正態(tài)總體的均值使用如下統(tǒng)計量,檢驗兩個正態(tài)總體的均值(見盧紋岱,(見盧紋岱,20002000):):p p把計算出來的t值,與t t0.0250.025(若=0.05)比較:p 若 | t | t t0.0250.025,則拒絕H0,12,p 若 | t | t t0.0250.025,則接受H0:1=2mSnSYXT/)()(22212111p關(guān)于兩個正態(tài)分布總體的參數(shù)檢驗的小結(jié)關(guān)于兩個正態(tài)分布總體的參數(shù)檢驗的小結(jié):p 用樣本(x x1 1,x x2 2,, x, xn n)與()與(y y1 1,y

33、y2 2,, y, ym m),來檢驗。p1 1)檢驗方差()檢驗方差( 2 21 1=2 22 2),用),用F F統(tǒng)計量(未知統(tǒng)計量(未知 1 1, 2 2)p2 2)檢驗方差()檢驗方差( 2 21 1 2 22 2),用),用F F統(tǒng)計量(未知統(tǒng)計量(未知 1 1, 2 2)p F=SF=S1 12 2 / / S S2 22 2 服從 F ( n-1, m-1) 分布p3 3)檢驗均值)檢驗均值(是否),用T統(tǒng)計量():p4 4)檢驗均值)檢驗均值(是否),用T統(tǒng)計量():分布服從)2(/1/1)2/() 1() 1()()(222121mntmnmnSmSnYXTmSnSYXT/)

34、()(22212111兩個T統(tǒng)計量,均不用記憶。p1) 兩個任意總體的均值任意總體的均值比較,大樣本時,用中心極限定理中心極限定理,化為。問題,應(yīng)用廣泛應(yīng)用廣泛。p2) 例:兩臺設(shè)備兩臺設(shè)備生產(chǎn)的產(chǎn)品的某種性質(zhì),p 兩種工藝兩種工藝的產(chǎn)品某種性能,p 兩批原料兩批原料生產(chǎn)的產(chǎn)品某種效果,p 兩種藥品兩種藥品的療效,p 兩種飼料兩種飼料的效果,p 兩種治療方法兩種治療方法的效果,p 兩種訓(xùn)練方法兩種訓(xùn)練方法的效果,p 兩種學(xué)習(xí)方法兩種學(xué)習(xí)方法的效果,p 兩種激勵方法兩種激勵方法的效果,p 兩種組織方法兩種組織方法的效果,p 兩種(稅收、投資等)政策兩種(稅收、投資等)政策的效果等。兩個對象,可以

35、一個是before,一個是after;也可以兩個同時兩個同時,都要求兩組樣本相互獨立相互獨立。p3) 有些問題的數(shù)據(jù)是數(shù)據(jù)是的(如學(xué)生的(如學(xué)生2 2門課的成績)門課的成績)p 要用來處理:令(此時nm),再用方法,檢驗檢驗p 從而,得出的均值有無顯著差異。p :p1 1)非配對的數(shù)據(jù)(樣本觀察值)的形式與)非配對的數(shù)據(jù)(樣本觀察值)的形式與SPSSSPSS中的存放中的存放:p 總體總體1 1:x x1 1,x x2 2,, x, xn np 總體總體2 2:y y1 1,y y2 2, y ym m, p在SPSS中的存放方法,。p2)配對的數(shù)據(jù)(樣本觀察值)的形式與配對的數(shù)據(jù)(樣本觀察值)

36、的形式與SPSSSPSS中的存放中的存放:p 總體總體1 1:x x1 1,x x2 2,, x, xn np 總體總體2 2:y y1 1,y y2 2, y yn n, p在SPSS中的存放方法,。p值變量值變量 分類變量分類變量p 數(shù)字?jǐn)?shù)字1 1 x xp 數(shù)字?jǐn)?shù)字2 2 x xp p 數(shù)字?jǐn)?shù)字n n x xp 數(shù)字?jǐn)?shù)字n+1 n+1 y yp 數(shù)字?jǐn)?shù)字n+2 n+2 y yp p 數(shù)字?jǐn)?shù)字n+mn+m y y樣本存放方式樣本存放方式變量變量x 變量變量y x1 y1 x2 y2 xn yn樣本存放方式樣本存放方式大樣本下兩個任意總體的均值檢驗大樣本下兩個任意總體的均值檢驗 p大樣本下,

37、兩個任意總體均值檢驗問題大樣本下,兩個任意總體均值檢驗問題p因為是大樣本,所以每個總體的隨機(jī)樣本的均值函數(shù)隨機(jī)樣本的均值函數(shù)都近似地服從正態(tài)分布正態(tài)分布。p設(shè)兩組樣本X1,X2,, Xn1,Y1,Y2,, Yn2 的容量n1,n2,足夠大,則p所以,在已知兩個總體方差已知兩個總體方差的情況下,有p p在未知未知兩個總體方差情況下,有(Neter, John et al,1993) ),(22212121nnNYX近似服從),(近似服從)()(1022212121NnnYXZ),(近似服從)()(1022212121NnSnSYXZn,T分布N分布p大樣本下兩個大樣本下兩個0-10-1總體的比例

38、值(即均值)檢驗問題總體的比例值(即均值)檢驗問題p本節(jié)所介紹的問題,在管理科學(xué)、一般社會科學(xué)和相當(dāng)多的在管理科學(xué)、一般社會科學(xué)和相當(dāng)多的自然科學(xué)中,有著廣泛的應(yīng)用自然科學(xué)中,有著廣泛的應(yīng)用。 p問題:兩個總體B(1,p1), B(1,p2),p 兩組獨立獨立樣本X1,X2,, Xn1,Y1,Y2,, Yn2 p要求檢驗H0:p1p2=0, H1:p1p20,p 近似服從N(0,1)。p設(shè)X的樣本中具有某性質(zhì)的樣本數(shù)具有某性質(zhì)的樣本數(shù)為r1,Y的樣本中具有某性具有某性質(zhì)的樣本數(shù)質(zhì)的樣本數(shù)為r2。 上式中的p p由由 來估計來估計:21)(1)(12121用求出求出z后后,比較z與z/2,就可以

39、斷定拒絕或接受H0。p例:例: 有一個奶酪進(jìn)口商靠郵寄廣告來銷售產(chǎn)品。在圣誕節(jié)前,進(jìn)口商設(shè)計了兩種不同的廣告方案(layout),為了想知道方案案1 1是否比方案是否比方案2 2更好更好,該進(jìn)口商從它的客戶名單中隨機(jī)地抽取了樣本進(jìn)行實驗,結(jié)果如下:p這是個單尾檢驗:H0:p1p2=0,H1: p1p20 p由上頁公式,可算出=0.24,進(jìn)而算出z=0.81,取=0.05,差表得z=1.645,顯然,z0.05 ,表明t在t t0.0250.025的左邊,接受H0 )p解釋95%的差值置信區(qū)間(差值置信區(qū)間( Confidence Interval of the Difference )的上下界

40、:p由上一章第五節(jié),未知總體方差未知總體方差的均值均值的置信區(qū)間是:nsntx) 1(2/從第一張表第一張表,可知 =10.01;樣本均值的標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)差(Std. Error of sample Mean) =0.00707 ;查表知t0.025(3)=3.1824,于是,可以算出95%的置信區(qū)間的下上界為:(9.9875,10.0325),用上述置信區(qū)間的端點值端點值欲被檢驗的總體均值 (=10) ,就得到SPSS中置信區(qū)間的新的表達(dá)(-0.0125,0.0325)。這就是第二張表格中“95%的差值置信區(qū)間”。只要 ns/xp例例已知去年某市小學(xué)五年級學(xué)生400米的平均成績是100秒,今年

41、該市測得60個五年級學(xué)生的400米成績,檢驗該市五年級學(xué)生的400米的平均成績是否有改變?p數(shù)據(jù)文件“CH6參檢1小學(xué)生400米v提高?” p此檢驗的假設(shè)是:pH H0 0:該校五年級學(xué)生的400米的平均成績?nèi)詾?00秒。pH H1 1:該校五年級學(xué)生的400米的平均成績不為100秒。p用SPSS的檢驗過程是:p點擊p從左框中選取要分析的變量,放入右框(Test variables)中。p在右框下方的“Test value” 空格中,填入母體均值假設(shè)0值(100秒)p點擊右下的Options按鈕,選擇1-值,如95%,99%等p點擊OK,機(jī)器給出檢驗結(jié)果p(演示上述點擊過程)輸出結(jié)果輸出結(jié)果O

42、 On ne e- -S Sa am mp pl le e S St ta at ti is st ti ic cs s60105.385038.820075.01165小學(xué)生跑400米的時間NMeanStd.DeviationStd. ErrorMeanOne-Sample TestOne-Sample Test1.07459.2875.3850-4.643315.4133小學(xué)生跑400米的時間tdfSig.(2-tailed)MeanDifferenceLowerUpper95% ConfidenceInterval of theDifferenceTest Value = 100p結(jié)果說

43、明結(jié)果說明1 1:在one-sample test表格中,在sig(2-tailed)名稱下的值0.287,是p值。 p0.05,表明統(tǒng)計值t落在t t0.0250.025的左邊,應(yīng)當(dāng)接受假設(shè)H0(該校五年級學(xué)生的400米的平均成績?nèi)詾?00秒。)。p結(jié)果說明結(jié)果說明2 2:在one-sample test表格的右端,給出的是差值差值的95%置信區(qū)間p同上例,未知總體方差未知總體方差的均值均值的置信區(qū)間是:p由One-sample Statistics表, =105.385, =5.0116p而當(dāng)n45時,t/2 (n-1) 近似于z/2 ??刹槌鰖0.025 = 1.96。于是可計算出置信區(qū)

44、間的端點為(95.3567,115.4133),從而計算出(減去100秒)差值置信區(qū)間為(-4.6433,15.4133) 。p可以看出,只要 。nsntx)1(2/ns/x這里所說這里所說是指,樣本是指,樣本x x1 1,x x2 2,, x, xn n與與y y1 1,y y2 2,, y, ym m,可以獨立顛倒,可以獨立顛倒順序,而不對問題產(chǎn)生影響。例如,調(diào)查對象是某單位的職工,一組樣順序,而不對問題產(chǎn)生影響。例如,調(diào)查對象是某單位的職工,一組樣本是男職工的工資,另一組樣本是女職工的工資。你可以任意顛倒職工本是男職工的工資,另一組樣本是女職工的工資。你可以任意顛倒職工的順序,而不對問題

45、產(chǎn)生影響。的順序,而不對問題產(chǎn)生影響。 p本小節(jié)用SPSS處理重點處理如下四類檢驗問題中的B與C。pA)未知均值,檢驗兩組樣本的母體的方差齊性:方差齊性: 2 21= 2 22?pB)在兩個正態(tài)母體具有方差齊性在兩個正態(tài)母體具有方差齊性的前提下,檢驗兩組樣本的母體的均值均值是否相等是否相等(1=2?)pC)在兩個正態(tài)母體不具有方差齊性在兩個正態(tài)母體不具有方差齊性時,檢驗兩組樣本的母體的均值是否均值是否相等相等。pD)作為A)的延伸,檢驗 2 21 2 22?即單尾檢驗問題。相互獨立的兩組樣本的相互獨立的兩組樣本的T T檢驗(檢驗(Independent-Sample T testIndepen

46、dent-Sample T test)p在檢驗兩組樣本的均值是否相同時,所用的用的T T統(tǒng)計量,統(tǒng)計量,因兩組樣本是否具有方差齊性,而不同因兩組樣本是否具有方差齊性,而不同。p因此,在做均值檢驗前,要先做方差齊性檢驗。pSPSS 對方差齊性方差齊性的檢驗,所使用的仍然是F統(tǒng)計量p F=S12 / S22 服從 F ( n-1, m-1) 分布pSPSS把這個檢驗稱為Levene檢驗(Levene test for Equality of variance)。p例例用兩種激勵方法(A與B),對同樣工種的A、B兩個兩個班組進(jìn)行激勵(每個班組7個人。當(dāng)然兩個班組的人數(shù)可以不同),測得激勵后業(yè)績增長(

47、%),見數(shù)據(jù)文件“CH6CH7獨立檢驗激勵實驗齊” (注注意獨立樣本在意獨立樣本在SPSSSPSS中的存放方式中的存放方式)。問:兩種激勵方法的平均激勵效果,有無顯著差異?p讀入數(shù)據(jù)后,p1)點擊 。系統(tǒng)彈出一個窗口,。p2)從左框變量名中選出“激勵效果激勵效果”變量,用箭頭,放入右邊Test Variables框中p3)從左框變量名中選出“激勵方法激勵方法”變量,用箭頭放入右邊Grouping框中。此時,該框下面的Define GroupsDefine Groups按鈕被激活按鈕被激活。p4)點擊Define Groups按鈕,機(jī)器彈出一個小對話框。要求輸入兩個組的變量值。對于本例的性別而言

48、,可把“0”輸入group1,把“1”輸入group2。p對對Define GroupsDefine Groups對話框的進(jìn)一步說明對話框的進(jìn)一步說明:如果分組變量如果分組變量是個連續(xù)變量,機(jī)器彈出的窗口與本例彈出的窗口不是個連續(xù)變量,機(jī)器彈出的窗口與本例彈出的窗口不同,在同,在group1group1與與group2group2之下,還有一個選項(之下,還有一個選項(cut cut pointpoint),要求你輸入一個分界值),要求你輸入一個分界值( (適合于把連續(xù)變量分為兩組,一組是臨界值,一組是臨界值) )。p5)點擊Continue,返回主窗口。p6)點擊Options按鈕,在彈出對

49、話框中,你可選擇1-值,如95%,99%等。p7)點擊OK,則機(jī)器輸出結(jié)果輸出結(jié)果:輸出結(jié)果:G Gr ro ou up p S St ta at ti is st ti ic cs s717.0143.63095.23848716.5143.50474.19077AB兩種激勵方法A法B法兩法的激勵效果(業(yè)績增長%)NMeanStd.DeviationStd. ErrorMeanI In nd de ep pe en nd de en nt t S Sa am mp pl le es s T Te es st t.121.7341.63712.128.5000.30539 -.16540 1.

50、165401.637 11.448.129.5000.30539 -.16897 1.16897Equal variancesassumedEqual variancesnot assumed兩法的激勵效果(業(yè)績增長%)FSig.Levenes Test forEquality ofVariancestdfSig.(2-tailed)MeanDifferenceStd. ErrorDifference LowerUpper95% ConfidenceInterval of theDifferencet-test for Equality of Means輸出結(jié)果說明:輸出結(jié)果說明:p 注意注意

51、:首先,從“Independent sample test”表(第2張表)中數(shù)字可知,F(xiàn)檢驗(Levene檢驗)表明方差齊性成立(f的顯著性概率p= 0.7340.05),兩種激勵方法的效果的方差沒有明顯差方差沒有明顯差異異。p 所以,觀察檢驗的值,應(yīng)當(dāng)用上面一行應(yīng)當(dāng)用上面一行的結(jié)果(Equal variance assumed)。此時,t統(tǒng)計量的顯著性(雙尾)概率p=0.1280.05,即 t假設(shè)檢驗( =0=0)通過,兩種激勵方法的平均效果沒有明顯差異。xy例題p某證券公司從某城市某區(qū)的營業(yè)點抽樣調(diào)查得到散戶股民的賣出、買進(jìn)和投資的有關(guān)數(shù)據(jù),問不同文化程度的股民的證券投資額、證券市場外的收

52、入和入市年份有無顯著差異?(P175)配對樣本的配對樣本的T T檢驗(檢驗(Paired-sample T testPaired-sample T test) p這里所說配對樣本配對樣本是指,樣本樣本x x1 1,x x2 2,, x, xn n與與y y1 1,y y2 2,, , y yn n,獨立顛倒順序。如果獨立顛倒,就會改變問題獨立顛倒順序。如果獨立顛倒,就會改變問題的性質(zhì)的性質(zhì)。例如,用兩套問卷測量20個管理人員的素質(zhì),兩套問卷的滿分都是200分。兩套問卷的測量結(jié)果x x1 1,x x2 2,, , x xn n與與y y1 1,y y2 2,, y, yn n,就不能獨立顛倒順序。因每一個被測量的人都有兩個分值( x xi i與與y yi i )。如果獨立地顛倒其中任何一組樣本的順序,則被測人的一個分值就被改變了。p例例: :用兩套問卷測量20個管理人員的素質(zhì),兩套問卷的滿分都 是 2 0 0 分 。 兩 套 問 卷 的 測 量 結(jié) 果 見 數(shù) 據(jù) 文 件“CH4CH6CH7配對問卷實驗差值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論