《統(tǒng)計(jì)學(xué)-基于R》第6章-假設(shè)檢驗(yàn)(R3)_第1頁(yè)
《統(tǒng)計(jì)學(xué)-基于R》第6章-假設(shè)檢驗(yàn)(R3)_第2頁(yè)
《統(tǒng)計(jì)學(xué)-基于R》第6章-假設(shè)檢驗(yàn)(R3)_第3頁(yè)
《統(tǒng)計(jì)學(xué)-基于R》第6章-假設(shè)檢驗(yàn)(R3)_第4頁(yè)
《統(tǒng)計(jì)學(xué)-基于R》第6章-假設(shè)檢驗(yàn)(R3)_第5頁(yè)
已閱讀5頁(yè),還剩93頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)分析

(方法與案例)

作者賈俊平版權(quán)所有違者必究StatisticswithR統(tǒng)計(jì)學(xué)R語(yǔ)言第6章假設(shè)檢驗(yàn)6.1

假設(shè)檢驗(yàn)的原理6.2

總體均值的檢驗(yàn)6.3

總體比例的檢驗(yàn)6.4總體方差的檢驗(yàn)6.5非參數(shù)檢驗(yàn)ypothesis

testH6.1假設(shè)檢驗(yàn)的基本原理

6.1.1提出假設(shè)

6.1.2做出決策

6.1.3表述結(jié)果

6.1.4效應(yīng)量第6章假設(shè)檢驗(yàn)6.1.1提出假設(shè)6.1假設(shè)檢驗(yàn)的原理2018-9-25什么是假設(shè)?

(hypothesis)

在參數(shù)檢驗(yàn)中,對(duì)總體參數(shù)的具體數(shù)值所作的陳述就一個(gè)總體而言,總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述2018-9-25什么是假設(shè)檢驗(yàn)?

(hypothesistest)先對(duì)總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的統(tǒng)計(jì)方法有參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)邏輯上運(yùn)用反證法,統(tǒng)計(jì)上依據(jù)小概率原理小概率是在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)2018-9-25原假設(shè)

(nullhypothesis)又稱(chēng)“0假設(shè)”,研究者想收集證據(jù)予以反對(duì)的假設(shè),用H0表示所表達(dá)的含義總是指參數(shù)沒(méi)有變化或變量之間沒(méi)有關(guān)系或總體分布于某種理論分布無(wú)差異

最初被假設(shè)是成立的,之后根據(jù)樣本數(shù)據(jù)確定是否有足夠的證據(jù)拒絕它總是有符號(hào)

,

H0:

=某一數(shù)值H0:

某一數(shù)值H0:

某一數(shù)值例如,H0:

10cmnull2018-9-25也稱(chēng)“研究假設(shè)”,研究者想收集證據(jù)予以支持的假設(shè),用H1或Ha表示所表達(dá)的含義是總體參數(shù)發(fā)生了變化或變量之間有某種關(guān)系或總體分布于某種理論分布有差異

備擇假設(shè)通常用于表達(dá)研究者自己傾向于支持的看法,然后就是想辦法收集證據(jù)拒絕原假設(shè),以支持備擇假設(shè)

總是有符號(hào)

,

H1:

某一數(shù)值H1:

某一數(shù)值H1:

<某一數(shù)值備擇假設(shè)(alternativehypothesis)alternative2018-9-25備擇假設(shè)沒(méi)有特定的方向性,并含有符號(hào)“

”的假設(shè)檢驗(yàn),稱(chēng)為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailedtest)

備擇假設(shè)具有特定的方向性,并含有符號(hào)“>”或“<”的假設(shè)檢驗(yàn),稱(chēng)為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)備擇假設(shè)的方向?yàn)椤?lt;”,稱(chēng)為左側(cè)檢驗(yàn)

備擇假設(shè)的方向?yàn)椤?gt;”,稱(chēng)為右側(cè)檢驗(yàn)

雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)2018-9-25雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)

(假設(shè)的形式)假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)H0:m

=m0H0:m

m0H0:m

m0備擇假設(shè)H1:m

≠m0H1:m

<m0H1:m

>m0以總體均值的檢驗(yàn)為例2018-9-25【例6-1】一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為15cm,為對(duì)生產(chǎn)過(guò)程進(jìn)行控制,質(zhì)量監(jiān)測(cè)人員定期對(duì)一臺(tái)加工機(jī)床檢查,確定這臺(tái)機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于15cm,則表明生產(chǎn)過(guò)程不正常,必須進(jìn)行調(diào)整。試陳述用來(lái)檢驗(yàn)生產(chǎn)過(guò)程是否正常的原假設(shè)和被擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過(guò)程不正常”。建立的原假設(shè)和備擇假設(shè)為

H0:

15cmH1:

15cm

2018-9-25【例6-2】飲用水瓶子上的標(biāo)簽提出假設(shè)(例題分析)解:研究者抽檢的意圖是傾向于證實(shí)瓶子上標(biāo)簽的說(shuō)法并不屬實(shí)。建立的原假設(shè)和備擇假設(shè)為

H0:

400H1:

<400鈣≥400鎂≥50鉀≥35鈉≥80偏硅酸≥180PH值(250C)7.3

0.52018-9-25原假設(shè)和備擇假設(shè)是一個(gè)完備事件組,而且相互對(duì)立在一項(xiàng)假設(shè)檢驗(yàn)中,原假設(shè)和備擇假設(shè)必有一個(gè)成立,而且只有一個(gè)成立先確定備擇假設(shè),再確定原假設(shè)等號(hào)“=”總是放在原假設(shè)上因研究目的不同,對(duì)同一問(wèn)題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)提出假設(shè)(結(jié)論與建議)6.1.2做出決策6.1假設(shè)檢驗(yàn)的原理2018-9-25兩類(lèi)錯(cuò)誤與顯著性水平研究者總是希望能做出正確的決策,但由于決策是建立在樣本信息的基礎(chǔ)之上,而樣本又是隨機(jī)的,因而就有可能犯錯(cuò)誤原假設(shè)和備擇假設(shè)不能同時(shí)成立,決策的結(jié)果要么拒絕H0,要么不拒絕H0。決策時(shí)總是希望當(dāng)原假設(shè)正確時(shí)沒(méi)有拒絕它,當(dāng)原假設(shè)不正確時(shí)拒絕它,但實(shí)際上很難保證不犯錯(cuò)誤第Ⅰ類(lèi)錯(cuò)誤(

錯(cuò)誤)原假設(shè)為正確時(shí)拒絕原假設(shè)第Ⅰ類(lèi)錯(cuò)誤的概率記為

,被稱(chēng)為顯著性水平第Ⅱ類(lèi)錯(cuò)誤(

錯(cuò)誤)原假設(shè)為錯(cuò)誤時(shí)未拒絕原假設(shè)第Ⅱ類(lèi)錯(cuò)誤的概率記為

(Beta)

2018-9-25兩類(lèi)錯(cuò)誤的控制一般來(lái)說(shuō),對(duì)于一個(gè)給定的樣本,如果犯第Ι類(lèi)錯(cuò)誤的代價(jià)比犯第Ⅱ類(lèi)錯(cuò)誤的代價(jià)相對(duì)較高,則將犯第Ⅰ類(lèi)錯(cuò)誤的概率定得低些較為合理;反之,如果犯第Ι類(lèi)錯(cuò)誤的代價(jià)比犯第Ⅱ類(lèi)錯(cuò)誤的代價(jià)相對(duì)較低,則將犯第Ⅰ類(lèi)錯(cuò)誤的概率定得高些一般來(lái)說(shuō),發(fā)生哪一類(lèi)錯(cuò)誤的后果更為嚴(yán)重,就應(yīng)該首要控制哪類(lèi)錯(cuò)誤發(fā)生的概率。但由于犯第Ι類(lèi)錯(cuò)誤的概率是可以由研究者控制的,因此在假設(shè)檢驗(yàn)中,人們往往先控制第Ι類(lèi)錯(cuò)誤的發(fā)生概率2018-9-25顯著性水平

(significantlevel)事先確定的用于拒絕原假設(shè)H0時(shí)所必須的證據(jù)能夠容忍的犯第Ⅰ類(lèi)錯(cuò)誤的最大概率(上限值)原假設(shè)為真時(shí),拒絕原假設(shè)的概率抽樣分布的拒絕域表示為

(alpha)

常用的

值有0.01,0.05,0.10由研究者事先確定

2018-9-25決策的依據(jù)若假設(shè)為H0:

=500,H1:

<500。樣本均值為495,拒絕H0嗎?樣本均值為502,拒絕H0嗎?做出拒絕或不拒絕原假設(shè)的依據(jù)是什么?傳統(tǒng)上,做出決策所依據(jù)的是樣本統(tǒng)計(jì)量,現(xiàn)代檢驗(yàn)中人們直接使用由統(tǒng)計(jì)量算出的犯第Ⅰ類(lèi)錯(cuò)誤的概率,即所謂的P值2018-9-25根據(jù)樣本觀(guān)測(cè)結(jié)果計(jì)算出對(duì)原假設(shè)和備擇假設(shè)做出決策某個(gè)樣本統(tǒng)計(jì)量對(duì)樣本估計(jì)量的標(biāo)準(zhǔn)化結(jié)果原假設(shè)H0為真點(diǎn)估計(jì)量的抽樣分布檢驗(yàn)統(tǒng)計(jì)量(teststatistic)

2018-9-25用統(tǒng)計(jì)量決策

(雙側(cè)檢驗(yàn))2018-9-25用統(tǒng)計(jì)量決策

(左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn))2018-9-25統(tǒng)計(jì)量決策規(guī)則給定顯著性水平

,查表得出相應(yīng)的臨界值z(mì)

或z

/2,t

或t

/2將檢驗(yàn)統(tǒng)計(jì)量的值與

水平的臨界值進(jìn)行比較作出決策雙側(cè)檢驗(yàn):I統(tǒng)計(jì)量的值I>臨界值,拒絕H0左側(cè)檢驗(yàn):統(tǒng)計(jì)量的值<-臨界值,拒絕H0右側(cè)檢驗(yàn):統(tǒng)計(jì)量的值>臨界值,拒絕H02018-9-25用P值決策

(P-value)如果原假設(shè)為真,所得到的樣本結(jié)果會(huì)像實(shí)際觀(guān)測(cè)結(jié)果那么極端或更極端的概率P值告訴我們:如果原假設(shè)是正確的話(huà),我們得到得到目前這個(gè)樣本數(shù)據(jù)的可能性有多大,如果這個(gè)可能性很小,就應(yīng)該拒絕原假設(shè)被稱(chēng)為觀(guān)察到的(或?qū)崪y(cè)的)顯著性水平?jīng)Q策規(guī)則:若p值<

,拒絕H02018-9-25雙側(cè)檢驗(yàn)的P值2018-9-25左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)的P值2018-9-25P值是關(guān)于數(shù)據(jù)的概率P值原假設(shè)的對(duì)或錯(cuò)的概率無(wú)關(guān)它反映的是在某個(gè)總體的許多樣本中某一類(lèi)數(shù)據(jù)出現(xiàn)的經(jīng)常程度,它是當(dāng)原假設(shè)正確時(shí),得到目前這個(gè)樣本數(shù)據(jù)的概率比如,要檢驗(yàn)全校學(xué)生的平均生活費(fèi)支出是否等于500元,檢驗(yàn)的假設(shè)為H0:

=500;H0:

500。假定抽出一個(gè)樣本算出的樣本均值600元,得到的值為P=0.02,這個(gè)0.02是指如果平均生活費(fèi)支出真的是500元的話(huà),那么,從該總體中抽出一個(gè)均值為600的樣本的概率僅為0.02。如果你認(rèn)為這個(gè)概率太小了,就可以拒絕原假設(shè),因?yàn)槿绻僭O(shè)正確的話(huà),幾乎不可能抓到這樣的一個(gè)樣本,既然抓到了,就表明這樣的樣本不在少數(shù),所以原假設(shè)是不對(duì)的值越小,你拒絕原假設(shè)的理由就越充分2018-9-25

要證明原假設(shè)不正確,P值要多小,才能令人信服呢?原假設(shè)的可信度又多高?如果H0所代表的假設(shè)是人們多年來(lái)一直相信的,就需要很強(qiáng)的證據(jù)(小的P值)才能說(shuō)服他們拒絕的結(jié)論是什么?如果拒絕H0而肯定H1

,你就需要有很強(qiáng)的證據(jù)顯示要支持H1。比如,H1代表要花很多錢(qián)把產(chǎn)品包裝改換成另一種包裝,你就要有很強(qiáng)的證據(jù)顯示新包裝一定會(huì)增加銷(xiāo)售量(因?yàn)榫芙^H0要花很高的成本)多大的P值合適?2018-9-25有了P值,我們并不需要用5%或1%這類(lèi)傳統(tǒng)的顯著性水平。P值提供了更多的信息,它讓我們可以選擇任意水平來(lái)評(píng)估結(jié)果是否具有統(tǒng)計(jì)上的顯著性,從而可根據(jù)我們的需要來(lái)決定是否要拒絕原假設(shè)只要你認(rèn)為這么大的P值就算是顯著了,你就可以在這樣的P值水平上拒絕原假設(shè)傳統(tǒng)的顯著性水平,如1%、5%、10%等等,已經(jīng)被人們普遍接受為“拒絕原假設(shè)足夠證據(jù)”的標(biāo)準(zhǔn),我們大概可以說(shuō):10%代表有“一些證據(jù)”不利于原假設(shè);5%代表有“適度證據(jù)”不利于原假設(shè);1%代表有“很強(qiáng)證據(jù)”不利于原假設(shè)固定顯著性水平是否有意義2018-9-25用P值進(jìn)行檢驗(yàn)比根據(jù)統(tǒng)計(jì)量檢驗(yàn)提供更多的信息統(tǒng)計(jì)量檢驗(yàn)是我們事先給出的一個(gè)顯著性水平,以此為標(biāo)準(zhǔn)進(jìn)行決策,無(wú)法知道實(shí)際的顯著性水平究竟是多少比如,根據(jù)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)時(shí),只要統(tǒng)計(jì)量的值落在拒絕域,我們拒絕原假設(shè)得出的結(jié)論都是一樣的,即結(jié)果顯著。但實(shí)際上,統(tǒng)計(jì)量落在拒絕域不同的地方,實(shí)際的顯著性是不同的。比如,統(tǒng)計(jì)量落在臨界值附近與落在遠(yuǎn)離臨界值的地方,實(shí)際的顯著性就有較大差異。而P值給出的是實(shí)際算出的顯著水平,它告訴我們實(shí)際的顯著性水平是多少P值決策與統(tǒng)計(jì)量的比較2018-9-25P值決策與統(tǒng)計(jì)量的比較6.1.3表述結(jié)果6.1假設(shè)檢驗(yàn)的原理2018-9-25假設(shè)檢驗(yàn)不能證明原假設(shè)正確假設(shè)檢驗(yàn)的目的主要是收集證據(jù)拒絕原假設(shè),而支持你所傾向的備擇假設(shè)假設(shè)檢驗(yàn)只提供不利于原假設(shè)的證據(jù)。因此,當(dāng)拒絕原假設(shè)時(shí),表明樣本提供的證據(jù)證明它是錯(cuò)誤的,當(dāng)沒(méi)有拒絕原假設(shè)時(shí),我們也沒(méi)法證明它是正確的,因?yàn)榧僭O(shè)檢驗(yàn)的程序沒(méi)有提供它正確的證據(jù)2018-9-25假設(shè)檢驗(yàn)不能證明原假設(shè)正確當(dāng)不能拒絕原假設(shè)時(shí),我們也從來(lái)不說(shuō)“接受原假設(shè)”,因?yàn)闆](méi)有證明原假設(shè)是真的沒(méi)有足夠的證據(jù)拒絕原假設(shè)并不等于你已經(jīng)“證明”了原假設(shè)是真的,它僅僅意為著目前還沒(méi)有足夠的證據(jù)拒絕原假設(shè),只表示手頭上這個(gè)樣本提供的證據(jù)還不足以拒絕原假設(shè)“不拒絕”的表述方式實(shí)際上意味著沒(méi)有得出明確的結(jié)論2018-9-25統(tǒng)計(jì)上顯著不一定有實(shí)際意義當(dāng)拒絕原假設(shè)時(shí),我們稱(chēng)樣本結(jié)果是統(tǒng)計(jì)上顯著的(statisticallySignificant)當(dāng)不拒絕原假設(shè)時(shí),我們稱(chēng)樣本結(jié)果是統(tǒng)計(jì)上不顯著的在“顯著”和“不顯著”之間沒(méi)有清除的界限,只是在P值越來(lái)越小時(shí),我們就有越來(lái)越強(qiáng)的證據(jù),檢驗(yàn)的結(jié)果也就越來(lái)越顯著2018-9-25統(tǒng)計(jì)上顯著不一定有實(shí)際意義在進(jìn)行決策時(shí),我們只能說(shuō)P值越小,拒絕原假設(shè)的證據(jù)就越強(qiáng),檢驗(yàn)的結(jié)果也就越顯著但P值很小而拒絕原假設(shè)時(shí),并不一定意味著檢驗(yàn)的結(jié)果就有實(shí)際意義因?yàn)榧僭O(shè)檢驗(yàn)中所說(shuō)的“顯著”僅僅是“統(tǒng)計(jì)意義上的顯著”一個(gè)在統(tǒng)計(jì)上顯著的結(jié)論在實(shí)際中卻不見(jiàn)得就很重要,也不意味著就有實(shí)際意義因?yàn)橹蹬c樣本的大小密切相關(guān),樣本量越大,檢驗(yàn)統(tǒng)計(jì)量的P值也就越大,P值就越小,就越有可能拒絕原假設(shè)6.1.4效應(yīng)量6.1假設(shè)檢驗(yàn)的原理2018-9-25效應(yīng)量

(effectsize)假設(shè)檢驗(yàn)拒絕原假設(shè)后,表示參數(shù)與假設(shè)值之間差異顯著,但這一結(jié)果并未有告訴我們差異的大小(程度)。度量這種差異的統(tǒng)計(jì)量就是效應(yīng)量,它描述了結(jié)果的差異程度是小、中還是大效應(yīng)量的提出者是JacobCohen(1988),他提供了不同檢驗(yàn)效應(yīng)量小、中、大的度量標(biāo)準(zhǔn)6.2總體均值的檢驗(yàn)

6.2.1一個(gè)總體均值的檢驗(yàn)

6.2.2兩個(gè)總體均值之差的檢驗(yàn)第6章假設(shè)檢驗(yàn)6.2.1一個(gè)總體均值的檢驗(yàn)6.2總體均值的檢驗(yàn)2018-9-25一個(gè)總體均值的檢驗(yàn)

(大樣本)假定條件大樣本(n

30)使用z檢驗(yàn)統(tǒng)計(jì)量

2

已知:

2

未知:2018-9-25總體均值的檢驗(yàn)(

2

未知)

(例題分析—大樣本)【例6-3】檢驗(yàn)空氣中PM2.5的含量(

=0.05)

82.674.779.987.573.879.887.068.368.578.086.276.975.789.980.285.185.189.277.757.565.380.274.768.897.675.080.176.685.176.181.672.593.577.880.784.577.383.382.285.5load("C:/example/ch6/example6_3.RData")library(BSDA)z.test(example6_3$PM2.5值,mu=81,sigma.x=sd(example6_3$PM2.5值),alternative="less",conf.level=0.95)2018-9-25總體均值的檢驗(yàn)(

2

未知)

(例題分析—大樣本)2018-9-25一個(gè)總體均值的檢驗(yàn)

(小樣本)假定條件總體服從正態(tài)分布小樣本(n<

30)檢驗(yàn)統(tǒng)計(jì)量

2

已知:

2

未知:2018-9-25單樣本t檢驗(yàn)的效應(yīng)量

2018-9-25總體均值的檢驗(yàn)

(例題分析—小樣本)load("C:/example/ch6/example6_4.RData")t.test(example6_5$厚度,mu=55)【例6-4】檢驗(yàn)磚的厚度#計(jì)算效應(yīng)量load("C:/example/ch6/example6_4.RData")library(lsr)cohensD(example6_4$厚度,mu=5)6.2.2兩個(gè)總體均值之差的檢驗(yàn)6.2總體均值的檢驗(yàn)2018-9-25兩個(gè)總體均值之差的檢驗(yàn)

(獨(dú)立大樣本)定條件兩個(gè)樣本是獨(dú)立的隨機(jī)樣本正態(tài)總體或非正態(tài)總體大樣本(n1

30和n2

30)檢驗(yàn)統(tǒng)計(jì)量

12

,

22

已知:

12

,

22

未知:2018-9-25load("C:/example/ch6/example6_5.RData")library(BSDA)z.test(example6_5$男生上網(wǎng)時(shí)間,example6_5$女生上網(wǎng)時(shí)間,sigma.x=sd(example6_5$男生上網(wǎng)時(shí)間),sigma.y=sd(example6_5$女生上網(wǎng)時(shí)間),alternative="two.sided")兩個(gè)總體均值之差的檢驗(yàn)

(例題分析—獨(dú)立大樣本)【例6-5】檢驗(yàn)?zāi)信畬W(xué)生上網(wǎng)的平均時(shí)間2018-9-25兩個(gè)總體均值之差的檢驗(yàn)

(獨(dú)立小樣本:

12,

22

已知)假定條件兩個(gè)獨(dú)立的小樣本兩個(gè)總體都是正態(tài)分布

12,

22已知檢驗(yàn)統(tǒng)計(jì)量2018-9-25兩個(gè)總體均值之差的檢驗(yàn)

(獨(dú)立小樣本:

12,

22

未知但

12=

22)假定條件兩個(gè)獨(dú)立的小樣本兩個(gè)總體都是正態(tài)分布

12、

22未知但相等,即

12=

22檢驗(yàn)統(tǒng)計(jì)量其中:自由度:2018-9-25兩個(gè)總體均值之差的檢驗(yàn)

(獨(dú)立小樣本:

12,

22

未知且不等

12

22)假定條件兩個(gè)總體都是正態(tài)分布

12,

22未知且不相等,即

12

22樣本量不相等,即n1

n2檢驗(yàn)統(tǒng)計(jì)量自由度:2018-9-25獨(dú)立樣本t檢驗(yàn)的效應(yīng)量

2018-9-25兩個(gè)總體均值之差的檢驗(yàn)

(例題分析—獨(dú)立小樣本,

12=

22)#假設(shè)方差相等

#假設(shè)方差不相等

#計(jì)算效應(yīng)量

【例6-6】檢驗(yàn)燈泡的平均使用壽命load("C:/example/ch6/example6_6.RData")t.test(example6_6$甲企業(yè),example6_6$乙企業(yè),var.equal=TRUE)t.test(example6_6$甲企業(yè),example6_6$乙企業(yè),var.equal=FALSE)library(lsr)cohensD(example6_6$甲企業(yè),example6_6$乙企業(yè))2018-9-25兩個(gè)總體均值之差的檢驗(yàn)

(配對(duì)樣本)假定條件兩個(gè)總體配對(duì)差值構(gòu)成的總體服從正態(tài)分布配對(duì)差是由差值總體中隨機(jī)抽取的

數(shù)據(jù)配對(duì)或匹配(重復(fù)測(cè)量(前/后))檢驗(yàn)統(tǒng)計(jì)量樣本差值均值樣本差值標(biāo)準(zhǔn)差2018-9-25配對(duì)樣本t檢驗(yàn)的效應(yīng)量

2018-9-25#配對(duì)樣本t檢驗(yàn)#計(jì)算效應(yīng)量?jī)蓚€(gè)總體均值之差的檢驗(yàn)

(例題分析—配對(duì)樣本)

【例6-7】檢驗(yàn)消費(fèi)者對(duì)兩款飲料的評(píng)分load("C:/example/ch6/example6_7.RData")t.test(example6_7$舊款飲料,example6_7$新款飲料,paired=TRUE)

library(lsr)cohensD(example6_7$舊款飲料,example6_7$新款飲料,method="paired")6.3總體比例的檢驗(yàn)

6.3.1一個(gè)總體比例的檢驗(yàn)

6.3.2兩個(gè)總體比例之差的檢驗(yàn)第6章假設(shè)檢驗(yàn)6.3.1一個(gè)總體比例的檢驗(yàn)6.3總體比例的檢驗(yàn)2018-9-25總體比例檢驗(yàn)假定條件總體服從二項(xiàng)分布可用正態(tài)分布來(lái)近似(大樣本)檢驗(yàn)的z統(tǒng)計(jì)量

0為假設(shè)的總體比例2018-9-25n<-2000p<-450/2000pi0<-0.25z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)

p_value<-1-pnorm(z)

data.frame(z,p_value)總體比例的檢驗(yàn)

(例題6—8)【例6-8】檢驗(yàn)收視率是否達(dá)到制作人的預(yù)期6.3.2兩個(gè)總體比例之差的檢驗(yàn)6.3總體比例的檢驗(yàn)2018-9-25假定條件兩個(gè)總體都服從二項(xiàng)分布可以用正態(tài)分布來(lái)近似檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)H0:

1-

2=0檢驗(yàn)H0:

1-

2=d0兩個(gè)總體比例之差的檢驗(yàn)2018-9-25n1<-200;n2<-200p1<-0.27;p2<-0.35

p<-(p1*n1+p2*n2)/(n1+n2)z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))

p_value<-pnorm(z)

data.frame(z,p_value)總體比例差的檢驗(yàn)

(例題6—9)

【例6-9】檢驗(yàn)上網(wǎng)收費(fèi)2018-9-25n1<-300;n2<-300p1<-33/300;p2<-84/300d0<-0.08z<-((p1-p2)-0.08)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)p_value<-pnorm(z)data.frame(z,p_value)總體比例差的檢驗(yàn)

(例題6—10)

【例6-10】檢驗(yàn)兩種生產(chǎn)方法6.4總體方差的檢驗(yàn)

6.4.1一個(gè)總體方差的檢驗(yàn)

6.4.2兩個(gè)總體方差比的檢驗(yàn)第6章假設(shè)檢驗(yàn)6.4.1一個(gè)總體方差的檢驗(yàn)6.4總體方差的檢驗(yàn)2018-9-25總體方差的檢驗(yàn)

(

2檢驗(yàn))

檢驗(yàn)一個(gè)總體的方差或標(biāo)準(zhǔn)差假設(shè)總體近似服從正態(tài)分布使用

2分布檢驗(yàn)統(tǒng)計(jì)量假設(shè)的總體方差2018-9-25

總體方差的檢驗(yàn)

(卡方分布圖)2018-9-25load("C:/example/ch6/example6_11.RData")library(TeachingDemos)sigma.test(example6_11$填裝量,sigmasq=16,alternative="greater")總體方差的檢驗(yàn)

(例題6—11)【例6-11】檢驗(yàn)填裝量的方差6.4.2兩個(gè)總體方差比的檢驗(yàn)6.4總體方差的檢驗(yàn)2018-9-25兩個(gè)總體方差比的檢驗(yàn)

(F

檢驗(yàn))假定條件兩個(gè)總體都服從正態(tài)分布,且方差相等兩個(gè)獨(dú)立的隨機(jī)樣本檢驗(yàn)統(tǒng)計(jì)量2018-9-25load("C:/example/ch6/example6_6.RData")var.test(example6_6[,1],example6_6[,2],alternative="two.sided")兩個(gè)總體方差比的檢驗(yàn)

(例題分析)【例6-12】檢驗(yàn)兩家企業(yè)燈泡使用壽命的方差比6.5

非參數(shù)檢驗(yàn)

6.5.1總體分布的檢驗(yàn)

6.5.2總體位置參數(shù)的檢驗(yàn)第6章假設(shè)檢驗(yàn)2018-9-25非參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)(如t檢驗(yàn),F(xiàn)檢驗(yàn)等)通常都是在假定總體服從正態(tài)分布或總體分布形式已知的條件下進(jìn)行的,而且要求所分析的數(shù)據(jù)是數(shù)值型的當(dāng)總體的概率分布形式未知,或者無(wú)法對(duì)總體的概率分布做出假定時(shí),參數(shù)檢驗(yàn)方法往往會(huì)失效非參數(shù)檢驗(yàn)(nonparametrictest)方法不僅對(duì)總體的分布要求很少,對(duì)數(shù)據(jù)類(lèi)型的要求也比參數(shù)檢驗(yàn)寬松當(dāng)數(shù)據(jù)不適合用參數(shù)檢驗(yàn)時(shí),非參數(shù)檢驗(yàn)往往得出理想的結(jié)果6.5.1總體分布的檢驗(yàn)6.5非參數(shù)檢驗(yàn)2018-9-25數(shù)據(jù)的正態(tài)性檢驗(yàn)對(duì)數(shù)據(jù)畫(huà)出頻數(shù)分布的直方圖或莖葉圖若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與上面給出的正態(tài)曲線(xiàn)應(yīng)該相似繪制正態(tài)概率圖。有時(shí)也稱(chēng)為分位數(shù)—分位數(shù)圖或稱(chēng)Q-Q圖或稱(chēng)為P-P圖用于考察觀(guān)測(cè)數(shù)據(jù)是否符合某一理論分布,如正態(tài)分布、指數(shù)分布、t分布等等P-P圖是根據(jù)觀(guān)測(cè)數(shù)據(jù)的累積概率與理論分布(如正態(tài)分布)的累積概率的符合程度繪制的Q-Q圖則是根據(jù)觀(guān)測(cè)值的實(shí)際分位數(shù)與理論分布(如正態(tài)分布)的分位數(shù)繪制的Shapiro-Wilk和K-S正態(tài)性檢驗(yàn)2018-9-25不同分布形狀對(duì)應(yīng)的Q-Q圖

(解讀Q-Q圖)2018-9-25Q-Q圖和P-P圖#繪制Q-Q圖load("C:/example/ch6/example6_3.RData")par(mfrow=c(1,2),cex=0.8,mai=c(0.7,0.7,0.2,0.1))qqnorm(example6_3$PM2.5值,xlab="期望正態(tài)值",ylab="觀(guān)測(cè)值",datax=TRUE,main="正態(tài)Q-Q圖")qqline(example6_3$PM2.5值,datax=TRUE,col="red")

#繪制P-P圖f<-ecdf(example6_3$PM2.5值)p1<-f(example6_3$PM2.5值)p2<-pnorm(example6_3$PM2.5值,mean(example6_3$PM2.5值),sd(example6_3$PM2.5值))plot(p1,p2,xlab="觀(guān)測(cè)的累積概率",ylab="期望的累積概率",main="正態(tài)P-P圖")abline(a=0,b=1,col="red")【例6—13】檢驗(yàn)PM2.5是否服從正態(tài)分布檢驗(yàn)該城市2018-9-25Shapiro檢驗(yàn)

2018-9-25Shapiro檢驗(yàn)#Shapiro檢驗(yàn)—Shapiro-Wilk正態(tài)性檢驗(yàn)【例6—14】檢驗(yàn)磚的厚度是否服從正態(tài)分布load("C:/example/ch6/example6_4.RData")shapiro.test(example6_4$厚度)2018-9-25Kolmogorov-Smirnov檢驗(yàn)

2018-9-25Kolmogorov-Smirnov檢驗(yàn)

2018-9-25Kolmogorov-Smirnov檢驗(yàn)

【例6—15】檢驗(yàn)磚的厚度是否服從正態(tài)分布

load("C:/example/ch6/example6_4.RData")ks.test(example6_4$厚度,"pnorm",mean(example6_4$厚度),sd(example6_4$厚度))6.5.2總體位置參數(shù)的檢驗(yàn)6.5總體分布的檢驗(yàn)2018-9-25總體位置參數(shù)檢驗(yàn)只有一個(gè)總體時(shí),通常關(guān)心總體的某個(gè)位置參數(shù)(如中位數(shù))是否等于某個(gè)假定值,檢驗(yàn)方法主要是Wilcoxon符號(hào)秩檢驗(yàn)當(dāng)有兩個(gè)總體時(shí),通常關(guān)心兩個(gè)總體的位置參數(shù)是否相同。對(duì)于獨(dú)立樣本,采用Mann-Whitney檢驗(yàn),對(duì)于配對(duì)樣本,則采用兩個(gè)配對(duì)樣本的Wilcoxon符號(hào)秩檢驗(yàn)2018-9-25秩就是一組數(shù)據(jù)按照從小到大的順序排列之后,每一個(gè)觀(guān)測(cè)值所在的位置用一般符號(hào)R來(lái)表示,假定一組數(shù)據(jù),按照從小到大的順序排列,在所有觀(guān)測(cè)值中排第位,那么的秩即為也是一個(gè)統(tǒng)計(jì)量,它測(cè)度的是數(shù)據(jù)觀(guān)測(cè)值的相對(duì)大小,大多數(shù)非參數(shù)檢驗(yàn)方法正是利用秩的這一性質(zhì)來(lái)排除總體分布未知的障礙的。當(dāng)然,也有一些非參數(shù)方法并不涉及秩的性質(zhì)秩的概念

(rank)2018-9-25很多情況下,數(shù)據(jù)中會(huì)出現(xiàn)相同的觀(guān)測(cè)值,那么對(duì)它們進(jìn)行排序后,這些相同觀(guān)測(cè)值的排名顯然是并列的,也就是說(shuō)它們的秩是相等的,這種情況被稱(chēng)為數(shù)據(jù)中的“結(jié)”對(duì)于結(jié)的處理,通常是以它們排序后所處位置的平均值作為它們共同的秩當(dāng)一個(gè)數(shù)據(jù)中結(jié)比較多時(shí),某些非參數(shù)檢驗(yàn)中原假設(shè)下檢驗(yàn)統(tǒng)計(jì)量的分布就會(huì)受到影響,從而需要對(duì)統(tǒng)計(jì)量進(jìn)行修正(一般情況下,軟件會(huì)自動(dòng)作出修正)結(jié)的處理

(ties)2018-9-25檢驗(yàn)總體參數(shù)(如中位數(shù))是否等于某個(gè)假定的值。它是對(duì)符號(hào)檢驗(yàn)的一種改進(jìn),彌補(bǔ)了符號(hào)檢驗(yàn)的不足,要比單純的符號(hào)檢驗(yàn)更準(zhǔn)確一些(對(duì)應(yīng)的參數(shù)檢驗(yàn)—單樣本均值t檢驗(yàn))檢驗(yàn)步驟計(jì)算各樣本觀(guān)察值與假定的中位數(shù)的差值,并取絕對(duì)值將差值的絕對(duì)值排序,并找出它們的秩計(jì)算檢驗(yàn)統(tǒng)計(jì)量和P值,并作出決策總體中位數(shù)的Wilcoxon符號(hào)秩檢驗(yàn)(Wilcoxonsignedrankstest)2018-9-25【例6-16】檢驗(yàn)磚的厚度中位數(shù)是否等于5cm總體中位數(shù)的Wilcoxon符號(hào)秩檢驗(yàn)#總體中位數(shù)的wilcox.test符號(hào)秩檢驗(yàn)load("C:/example/ch6/example6_4.RData")wilcox.test(example6_4$厚度,m=5)2018-9-25也稱(chēng)為Mann-WhitneyU檢驗(yàn)(Mann-WhitneyUtest),或稱(chēng)為Wilcoxon秩和檢驗(yàn)用于確定兩個(gè)總體間是否存在差異的一種非參數(shù)檢驗(yàn)方法(對(duì)應(yīng)的參數(shù)方法—兩個(gè)獨(dú)立樣本的t檢驗(yàn)或z檢驗(yàn))Mann-Whitney檢驗(yàn)不需要諸如總體服從正態(tài)分布且方差相同等之類(lèi)的假設(shè),但要求是兩個(gè)獨(dú)立隨機(jī)樣本的數(shù)據(jù)至少是順序數(shù)據(jù)與Wilcoxon符號(hào)秩檢驗(yàn)不同,它不是基于相關(guān)樣本,而是使用兩個(gè)獨(dú)立樣本兩個(gè)獨(dú)立樣本

Mann-Whitney檢驗(yàn)2018-9-25設(shè)X、Y是兩個(gè)連續(xù)的總體,其累積分布函數(shù)為Fx和Fy,從兩個(gè)總體中分別抽取兩個(gè)獨(dú)立樣本:(x1,x2,…,xm)和(y1,y2,…,yn)若要檢驗(yàn)兩個(gè)總體是

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論