第7章假設(shè)檢驗(yàn)_第1頁(yè)
第7章假設(shè)檢驗(yàn)_第2頁(yè)
第7章假設(shè)檢驗(yàn)_第3頁(yè)
第7章假設(shè)檢驗(yàn)_第4頁(yè)
第7章假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩134頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本原理總體參數(shù)假設(shè)檢驗(yàn)非參數(shù)檢驗(yàn)(本科)第7章假設(shè)檢驗(yàn)ppt課件第一節(jié)假設(shè)檢驗(yàn)的基本原理假設(shè)檢驗(yàn)的基本原理假設(shè)檢驗(yàn)的規(guī)則與兩類錯(cuò)誤檢驗(yàn)功效(本科)第7章假設(shè)檢驗(yàn)ppt課件一、假設(shè)檢驗(yàn)的基本原理假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的另一項(xiàng)重要組成部分,是參數(shù)估計(jì)的延續(xù),是對(duì)參數(shù)估計(jì)在統(tǒng)計(jì)上的驗(yàn)證與補(bǔ)充。它首先對(duì)考察總體的分布形式或總體的某些未知參數(shù)事先做出某些假設(shè),然后根據(jù)檢驗(yàn)對(duì)象構(gòu)造合適的檢驗(yàn)統(tǒng)計(jì)量并經(jīng)過(guò)數(shù)理統(tǒng)計(jì)分析,確定在假設(shè)下,該檢驗(yàn)統(tǒng)計(jì)量的抽樣分布;在給定的顯著性水平下,從抽樣分布中得出鑒別對(duì)原先假設(shè)的拒絕域和接受域的臨界值;之后由所抽取的樣本資料計(jì)算樣本統(tǒng)計(jì)量,并將樣本統(tǒng)計(jì)量與臨界統(tǒng)計(jì)量進(jìn)行比較,從而對(duì)所提出的原假設(shè)做出統(tǒng)計(jì)判斷:是接受還是拒絕原假設(shè)。也就是從樣本中所蘊(yùn)含的信息來(lái)對(duì)總體情況進(jìn)行判斷。(本科)第7章假設(shè)檢驗(yàn)ppt課件假設(shè)檢驗(yàn)所遵循的推斷依據(jù)是統(tǒng)計(jì)中的“小概率原理”:小概率事件在一次試驗(yàn)中幾乎是不會(huì)發(fā)生的。舉個(gè)例子來(lái)說(shuō),在10000件的產(chǎn)品中,如果只有1件是次品,那么可以得知,在一次試驗(yàn)中隨機(jī)抽取1件產(chǎn)品,它為次品的概率就為0.01%,此概率是非常小的。或者是說(shuō),在一次隨機(jī)抽樣試驗(yàn)中,次品幾乎是不會(huì)被抽到的。反過(guò)來(lái),如果從這批產(chǎn)品中隨機(jī)抽取1件,恰好是次品,那么,我們就有理由懷疑該批產(chǎn)品的次品率不是很小,否則就不會(huì)那么容易地抽到次品。因此,有足夠的理由否認(rèn)該批產(chǎn)品的次品率很低的假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件通常概率要多大才能算得上是小概率呢?假設(shè)檢驗(yàn)中把這個(gè)小概率稱為顯著性水平

,其取值的大小與我們能否做出正確判斷有著相當(dāng)大的關(guān)系。然而,

的取值并沒有固定的標(biāo)準(zhǔn),只能根據(jù)實(shí)際需要來(lái)確定。一般地,

取0.05(5%),對(duì)于一些比較嚴(yán)格的情況,例如在一些高精密質(zhì)量檢驗(yàn)的假設(shè)檢驗(yàn)中,它可以取0.01或者更小。

越小,所做出的拒絕原假設(shè)的判斷的說(shuō)服力就越強(qiáng)。當(dāng)然,不管

有多么地小,也不能代表小概率事件沒有發(fā)生的可能,這也正是假設(shè)檢驗(yàn)與數(shù)學(xué)上“反證法”的不同之處。所以,對(duì)于拒絕或者接受,都只是統(tǒng)計(jì)意義上的,并不是完全意義上的。這一點(diǎn)在學(xué)習(xí)假設(shè)檢驗(yàn)過(guò)程中是容易被疏忽的。(本科)第7章假設(shè)檢驗(yàn)ppt課件事先建立假設(shè),是假設(shè)檢驗(yàn)中關(guān)鍵的一項(xiàng)工作。它包括原假設(shè)和備選假設(shè)兩部分。原假設(shè)是建立在假定原來(lái)總體沒有發(fā)生變化的基礎(chǔ)之上的,也就是總體參數(shù)沒有顯著變化。備選假設(shè)是原假設(shè)的對(duì)立,是在否認(rèn)原假設(shè)之后所要接受的內(nèi)容,通常這是我們真正感興趣的一個(gè)判斷。例如在上面的例子中,如果想確認(rèn)次品率是否為0.01%,我們可以分別建立原假設(shè)和備選假設(shè)為:H0:ρ0=0.01%,H1:ρ0≠0.01%

;如果我們想確認(rèn)次品率是否大于(小于)0.01%,那么對(duì)應(yīng)的備選假設(shè)為:H1:ρ0>0.01%(或ρ0<0.01%),原假設(shè)與前面相同。由此可見,備選假設(shè)與原假設(shè)的建立不是隨意的,而是要根據(jù)研究的需要來(lái)確定的。(本科)第7章假設(shè)檢驗(yàn)ppt課件應(yīng)當(dāng)指出,在假設(shè)檢驗(yàn)中,相對(duì)而言,當(dāng)原假設(shè)被拒絕時(shí),我們能夠以較大的把握肯定備選假設(shè)的成立;而當(dāng)原假設(shè)不能被拒絕時(shí),我們并不能斷定原假設(shè)確實(shí)成立。例如,當(dāng)給定的α為0.01時(shí),如果檢驗(yàn)統(tǒng)計(jì)量的取值落入其發(fā)生概率不超過(guò)0.04但又大于0.01的區(qū)域時(shí),我們不能拒絕原假設(shè)。但事實(shí)上,在原假設(shè)成立的前提下,其發(fā)生的概率最多只有0.04,因此難以斷定原假設(shè)成立。如果將顯著水平定為0.05,則原假設(shè)就會(huì)被拒絕。(本科)第7章假設(shè)檢驗(yàn)ppt課件假設(shè)檢驗(yàn)按照所檢驗(yàn)內(nèi)容的不同,可以分為參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。對(duì)已知總體分布的某個(gè)未知參數(shù)進(jìn)行的檢驗(yàn),稱為參數(shù)檢驗(yàn);對(duì)總體的分布形式進(jìn)行的檢驗(yàn),則稱為非參數(shù)檢驗(yàn)。本章將分別對(duì)這兩類檢驗(yàn)進(jìn)行介紹。(本科)第7章假設(shè)檢驗(yàn)ppt課件二、假設(shè)檢驗(yàn)的規(guī)則與兩類錯(cuò)誤(一)假設(shè)檢驗(yàn)的規(guī)則綜合上面假設(shè)檢驗(yàn)的原理分析,給出假設(shè)檢驗(yàn)的步驟:1.根據(jù)實(shí)際應(yīng)用問題確定合適的原假設(shè)H0和備選假設(shè)H1;2.確定檢驗(yàn)統(tǒng)計(jì)量,通過(guò)數(shù)理統(tǒng)計(jì)分析確定該統(tǒng)計(jì)量的抽樣分布;3.給定檢驗(yàn)的顯著性水平

α,在原假設(shè)成立的條件下,結(jié)合備選假設(shè)的定義,由檢驗(yàn)統(tǒng)計(jì)量的抽樣分布情況求出相應(yīng)的臨界值,該臨界值為原假設(shè)的接受域與拒絕域的分界值;4.從樣本資料計(jì)算檢驗(yàn)的樣本統(tǒng)計(jì)量,并將其與臨界值進(jìn)行比較,判斷是否接受或拒絕原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件上面步驟中,對(duì)檢驗(yàn)統(tǒng)計(jì)量抽樣分布的確認(rèn)屬于高深的概率數(shù)理統(tǒng)計(jì)的研究?jī)?nèi)容,本處我們不作探討。從檢驗(yàn)程序我們可以看出,統(tǒng)計(jì)量的取值范圍可以分為接受域和拒絕域兩個(gè)區(qū)域。拒絕域正就是統(tǒng)計(jì)量取值的小概率區(qū)域。按照我們將這個(gè)拒絕域安排在所檢驗(yàn)統(tǒng)計(jì)量的抽樣分布的某一側(cè)還是兩端,可以將檢驗(yàn)分為單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)。單側(cè)檢驗(yàn)中,又可以根據(jù)拒絕域,是在左側(cè)還是在右側(cè)而分為左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)。對(duì)于上述的情況,我們可以通過(guò)服從檢驗(yàn)統(tǒng)計(jì)量的分布圖來(lái)形象表示:(本科)第7章假設(shè)檢驗(yàn)ppt課件

圖7-1雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)圖中的陰影部分為拒絕域,對(duì)應(yīng)的分別是雙側(cè)、左單側(cè)、右單側(cè)檢驗(yàn)。(本科)第7章假設(shè)檢驗(yàn)ppt課件實(shí)際應(yīng)用中,是采用雙側(cè)檢驗(yàn)還是單側(cè)檢驗(yàn)?單側(cè)檢驗(yàn)中,是采用左單側(cè)還是右單側(cè)呢?例如,某公司采取了新的銷售方案,我們想檢驗(yàn)新方案下銷售收入是否與實(shí)施前的有差異,即是否等同于原來(lái)的銷售收入水平,對(duì)該情況的檢驗(yàn)就是雙側(cè)檢驗(yàn)。如果我們想檢驗(yàn)新方案下的銷售收入水平是否有所提高,此時(shí)檢驗(yàn)就轉(zhuǎn)化為單側(cè)檢驗(yàn)了,而且是右側(cè)檢驗(yàn)。同理,如果想檢驗(yàn)收入水平是否低于實(shí)施前的收入水平,就要采用單側(cè)檢驗(yàn)中的左側(cè)檢驗(yàn)。也就是說(shuō),選用雙側(cè)、左側(cè)或右側(cè)檢驗(yàn)時(shí),要結(jié)合備選假設(shè)來(lái)考慮。又如,前面提到的次品率的例子中,如果備選假設(shè)為

H1:ρ0≠0.01%,就是雙側(cè)檢驗(yàn);如果備選假設(shè)為H1:ρ0<(或>)0.01%,就是屬于左(右)單側(cè)檢驗(yàn)。(本科)第7章假設(shè)檢驗(yàn)ppt課件在檢驗(yàn)規(guī)則中,我們經(jīng)常碰到兩種重要的檢驗(yàn)方法:

z檢驗(yàn)與t檢驗(yàn)。1.z檢驗(yàn)。又稱為正態(tài)分布檢驗(yàn),該檢驗(yàn)認(rèn)為所檢驗(yàn)的統(tǒng)計(jì)量服從正態(tài)分布。例如,從正態(tài)分布總體中抽取一個(gè)樣本,則樣本均值

服從正態(tài)分布

;從一般非正態(tài)分布總體中抽樣,當(dāng)樣本容量

n很大時(shí),樣本均值

近似地服從正態(tài)分布

,其中

,

為總體標(biāo)準(zhǔn)差。因?yàn)榻y(tǒng)計(jì)量

~N(0,1),

所以,我們可以利用標(biāo)準(zhǔn)正態(tài)分布來(lái)進(jìn)行檢驗(yàn)。根據(jù)給定的顯著性水平,從標(biāo)準(zhǔn)正態(tài)分布的臨界表中查得臨界值

,將z統(tǒng)計(jì)量的取值與臨界值比較來(lái)判斷能否拒絕原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件2.t檢驗(yàn)。在檢驗(yàn)中,當(dāng)總體的標(biāo)準(zhǔn)差

σ未知時(shí),需要用樣本標(biāo)準(zhǔn)差

來(lái)代替,從而構(gòu)成統(tǒng)計(jì)量

。同樣,從t分布的臨界表中查得臨界值

,并將樣本統(tǒng)計(jì)量的

值與其比較做出判斷。(本科)第7章假設(shè)檢驗(yàn)ppt課件(二)

p值檢驗(yàn)在上面的檢驗(yàn)步驟中,判斷最后是接受原假設(shè)還是拒絕原假設(shè)依據(jù)是,計(jì)算的樣本統(tǒng)計(jì)量的數(shù)值與檢驗(yàn)統(tǒng)計(jì)量的臨界值的大小比較。此外,我們也可以根據(jù)計(jì)算的概率值p來(lái)判斷能否拒絕原假設(shè),這就是p值檢驗(yàn)?,F(xiàn)在在眾多流行的統(tǒng)計(jì)計(jì)量軟件中(如SAS,SPSS,EXCEL等),最后的結(jié)果表中都給出了p值。(本科)第7章假設(shè)檢驗(yàn)ppt課件p值檢驗(yàn)的原理:建立原假設(shè)后,在假定原假設(shè)成立的情況下,參照備選假設(shè),可以計(jì)算出檢驗(yàn)統(tǒng)計(jì)量超過(guò)或者小于(還要依照分布的不同、單側(cè)檢驗(yàn)、雙側(cè)檢驗(yàn)的差異而定)由樣本所計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量的數(shù)值的概率,這便是p值;而后將此p值與事先給出的顯著性水平α進(jìn)行比較,如果p值小于α,也就是說(shuō),原假設(shè)對(duì)應(yīng)的為小概率事件,根據(jù)上述的“小概率原理”,我們就可以否定原假設(shè),而接受對(duì)應(yīng)的備選假設(shè)。如果p值大于α,我們不就能否定原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件例如,對(duì)應(yīng)上面的

檢驗(yàn)中,如果是雙側(cè)檢驗(yàn),根據(jù)上面的說(shuō)明,可以計(jì)算

,

若p≤α,那么我們就可以否認(rèn)原假設(shè),反之不能否定原假設(shè)。p值檢驗(yàn)與前面介紹的方法得出的結(jié)論是一致的。(本科)第7章假設(shè)檢驗(yàn)ppt課件(三)兩類錯(cuò)誤在假設(shè)檢驗(yàn)中,對(duì)假設(shè)的檢驗(yàn)判斷是依據(jù)樣本實(shí)際資料所計(jì)算的統(tǒng)計(jì)量的值與臨界值的比較來(lái)做出的。由于樣本的隨機(jī)性、樣本信息的分散性等原因,這種合理的“以偏概全”式的假設(shè)檢驗(yàn),總是無(wú)法讓我們百分百的肯定所做出結(jié)論的正確性。也就是說(shuō),我們有可能會(huì)做出錯(cuò)誤的判斷,這種風(fēng)險(xiǎn)是客觀存在的。例如,實(shí)際上依據(jù)真實(shí)總體情況,我們應(yīng)該接受原假設(shè)H0,但根據(jù)樣本信息,卻做出拒絕H0的錯(cuò)誤結(jié)論,稱這種錯(cuò)誤為“棄真”錯(cuò)誤;此外,我們也可能犯這樣的錯(cuò)誤:實(shí)際的總體情況是應(yīng)該拒絕原假設(shè),而我們卻接受了它,稱此為“納偽”錯(cuò)誤。(本科)第7章假設(shè)檢驗(yàn)ppt課件對(duì)于上述的兩類錯(cuò)誤,我們都希望能盡量減少其發(fā)生的概率。因此需要對(duì)它們的概率進(jìn)行簡(jiǎn)要分析。在假設(shè)中,我們給出了顯著性水平α(概率值),在“小概率事件是幾乎不會(huì)發(fā)生的”原理上,如果樣本資料的信息與總體信息之間的差異出現(xiàn)的概率小于等于α,那么可以認(rèn)為在一次試驗(yàn)中該事件不會(huì)發(fā)生(發(fā)生的可能性α很小),從而我們就拒絕了原假設(shè)。這就是說(shuō),有α的可能性發(fā)生原假設(shè)是真實(shí)的卻被拒絕的情況。所以顯著性水平α就是我們犯“棄真”錯(cuò)誤的可能性大小。α越小,則犯“棄真”錯(cuò)誤的可能性就越小。因而,可以根據(jù)實(shí)際需要對(duì)顯著性水平α加以控制,一般取

α=0.05(或者α=0.1),這就保證犯“棄真”錯(cuò)誤的可能性不超過(guò)5%(或者1%)。如果要求更加嚴(yán)格,α可取更小的數(shù)值。(本科)第7章假設(shè)檢驗(yàn)ppt課件通常記β為犯“納偽”錯(cuò)誤的可能性大小。由于兩類錯(cuò)誤是一對(duì)矛盾,在其他條件不變的情況下,減少犯“棄真”錯(cuò)誤的可能性(α),勢(shì)必增大犯“納偽”錯(cuò)誤的可能性(β),也就是說(shuō),β的大小和顯著性水平α的大小成相反方向變化。(本科)第7章假設(shè)檢驗(yàn)ppt課件兩類錯(cuò)誤發(fā)生的概率

的相對(duì)關(guān)系可由下面的圖形來(lái)表示:圖7-2兩類錯(cuò)誤

從圖7-2中,我們也可以看出,當(dāng)真實(shí)分布與待判別分布越遠(yuǎn)離時(shí),在α一定下,β將越??;也就是說(shuō),當(dāng)差別比較明顯時(shí),我們犯錯(cuò)誤的可能性會(huì)更小,反之亦然。真實(shí)βα假設(shè)(本科)第7章假設(shè)檢驗(yàn)ppt課件表7-1假設(shè)檢驗(yàn)兩類錯(cuò)誤接

受拒

絕原假設(shè)為真正確的結(jié)論(1-α)

“棄真”錯(cuò)誤(α)

原假設(shè)為假“納偽”錯(cuò)誤

(β)正確的結(jié)論(1-

β)(本科)第7章假設(shè)檢驗(yàn)ppt課件三、檢驗(yàn)功效由于β為犯“納偽”錯(cuò)誤的可能性大小,或者說(shuō)

β表示出現(xiàn)接受不真實(shí)的原假設(shè)的結(jié)論的概率,那么1-β就是指出現(xiàn)拒絕不真實(shí)的原假設(shè)的概率。若1-β的數(shù)值越接近于1,表明不真實(shí)的原假設(shè)幾乎都能夠被拒絕。誠(chéng)然,如果1-β的數(shù)值接近于0,表明犯“納偽”錯(cuò)誤的可能性很大。因此,1-β可以用來(lái)表明所做假設(shè)檢驗(yàn)工作好壞的一個(gè)指標(biāo),我們稱之為檢驗(yàn)功效。它的數(shù)值表明我們做出正確決策的概率為1-β。一個(gè)好的檢驗(yàn)法則總是希望犯兩類錯(cuò)誤的可能性α與β都很小,但是這在一般場(chǎng)合下是很難實(shí)現(xiàn)的。要使得α小,必然導(dǎo)致β大,若要使

β小,必導(dǎo)致α增大。(本科)第7章假設(shè)檢驗(yàn)ppt課件在實(shí)際檢驗(yàn)中,一般首先控制犯“棄真”錯(cuò)誤的概率,也就是事先給出的顯著性水平α的數(shù)值盡量地小,在其它條件不變的情況下,增加犯“納偽”錯(cuò)誤的可能性,即β增大,從而使得檢驗(yàn)功效(1-β)減弱。在此情況下,如何增強(qiáng)檢驗(yàn)功效?解決的唯一辦法只有增大樣本容量,這樣既能保證滿足取得較小的α,又能取得較小的β值,一舉兩得。然而實(shí)際上樣本容量的取得是有限制的,只能根據(jù)實(shí)際來(lái)確定。(本科)第7章假設(shè)檢驗(yàn)ppt課件第二節(jié)總體參數(shù)假設(shè)檢驗(yàn)總體均值的假設(shè)檢驗(yàn)兩個(gè)總體均值之差的檢驗(yàn)總體成數(shù)的假設(shè)檢驗(yàn)總體均值的假設(shè)檢驗(yàn)兩個(gè)正態(tài)總體方差比的檢驗(yàn)(本科)第7章假設(shè)檢驗(yàn)ppt課件總體參數(shù)假設(shè)檢驗(yàn)就是檢驗(yàn)已知分布形式(本節(jié)主要考慮正態(tài)分布)的總體的某些參數(shù)(例如均值或者方差)是否與事先所做的假設(shè)存在顯著性差異,又稱為顯著性檢驗(yàn)。主要包括對(duì)總體均值和總體方差的假設(shè)檢驗(yàn)。本節(jié)分各種情況對(duì)這兩方面的檢驗(yàn)進(jìn)行介紹。(本科)第7章假設(shè)檢驗(yàn)ppt課件一、總體均值的假設(shè)檢驗(yàn)總體均值的假設(shè)檢驗(yàn)就是檢驗(yàn)由樣本信息所推斷的當(dāng)前總體均值是否與事先假設(shè)的總體均值存在顯著性差異。設(shè)樣本X1,X2,…,Xn來(lái)自于正態(tài)總體N(μ,σ2),樣本均值為

,樣本的標(biāo)準(zhǔn)差為s2,對(duì)于均值μ的檢驗(yàn)問題。(本科)第7章假設(shè)檢驗(yàn)ppt課件(一)總體方差σ2已知對(duì)于雙側(cè)檢驗(yàn),建立的假設(shè)為:H0:μ=μ0,H1:μ≠μ0其中

為一個(gè)給定已知的常數(shù)。對(duì)于左(右)單側(cè)檢驗(yàn)來(lái)說(shuō),建立的假設(shè)為:H0:μ=μ0,H1:μ<(或>)μ0可以利用上面介紹過(guò)的z檢驗(yàn)法,構(gòu)造檢驗(yàn)統(tǒng)計(jì)量

(7.1)在原假設(shè)成立的條件下,該統(tǒng)計(jì)量的分布為:z

~N(0,1)。(本科)第7章假設(shè)檢驗(yàn)ppt課件從而在給定的顯著性水平α下,我們可從標(biāo)準(zhǔn)正態(tài)分布表中查得臨界值

(對(duì)應(yīng)于左、右單側(cè)檢驗(yàn)的臨界值分別為-z1-α和z1-α)。根據(jù)樣本資料及假設(shè),計(jì)算出樣本統(tǒng)計(jì)量的值z(mì)。這樣,我們便可以得出原假設(shè)的拒絕域?yàn)椋海▽?duì)雙側(cè)檢驗(yàn)而言)z<-z1-α(對(duì)于左單側(cè)檢驗(yàn)而言)z>z1-α(對(duì)于右單側(cè)檢驗(yàn)而言)當(dāng)z值處于拒絕域中時(shí),我們就可拒絕原假設(shè),否則不能拒絕原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件(二)總體方差σ2未知總體方差σ2未知時(shí)對(duì)于均值μ的假設(shè)檢驗(yàn),類似上面方差σ2已知時(shí)的做法。對(duì)于雙側(cè)檢驗(yàn),建立的假設(shè)為:H0:μ=μ0,H1:μ≠μ0對(duì)于左(右)單側(cè)檢驗(yàn)來(lái)說(shuō),建立的假設(shè)為:H0:μ=μ0,H1:μ<(或>)μ0只是在構(gòu)造檢驗(yàn)統(tǒng)計(jì)量時(shí),不是利用z檢驗(yàn)法。而是在原假設(shè)成立的條件下,利用t檢驗(yàn)法,構(gòu)造檢驗(yàn)統(tǒng)計(jì)量~t(n-1) (7.2)(本科)第7章假設(shè)檢驗(yàn)ppt課件其中

為樣本標(biāo)準(zhǔn)差。t統(tǒng)計(jì)量就是用樣本標(biāo)準(zhǔn)差s來(lái)代替z統(tǒng)計(jì)量中未知的總體標(biāo)準(zhǔn)差σ。對(duì)于臨界值,在t分布表中查得臨界值

(雙側(cè)檢驗(yàn))、-t1-α(n-1)(左單側(cè)檢驗(yàn))、t1-α(n-1)(右單側(cè)檢驗(yàn))。(本科)第7章假設(shè)檢驗(yàn)ppt課件根據(jù)樣本資料及假設(shè),計(jì)算出樣本統(tǒng)計(jì)量的值t。這樣,可以得出對(duì)原假設(shè)的拒絕域?yàn)椋簶颖窘y(tǒng)計(jì)量的值t滿足

(雙側(cè)檢驗(yàn))t<-t1-α(n-1)(左單側(cè)檢驗(yàn))t>t1-α(n-1)(右單側(cè)檢驗(yàn))當(dāng)t值落入拒絕域,就拒絕原假設(shè),否則不能拒絕原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件這里應(yīng)該注意的是,在實(shí)際中不能夠確定總體是否滿足正態(tài)分布,但是樣本容量n很大。根據(jù)中心極限定理,該總體分布近似服從正態(tài)分布,對(duì)該總體均值的檢驗(yàn)可以依據(jù)上面的總體方差未知的程序來(lái)進(jìn)行。對(duì)于小樣本情況,我們也是根據(jù)上面的t檢驗(yàn)來(lái)進(jìn)行。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-1】為了考察某種類型的電子元件的使用壽命情況,假定該電子元件使用壽命的分布為正態(tài)分布。而且根據(jù)歷史記錄得知該分布的參數(shù)為:平均使用壽命μ為100(小時(shí)),標(biāo)準(zhǔn)差

σ=10(小時(shí))?,F(xiàn)在隨機(jī)抽取100個(gè)該類型的元件,測(cè)得平均壽命為102(小時(shí)),給定顯著性水平α=0.05,問該類型的電子元件的使用壽命是否有明顯的提高。(本科)第7章假設(shè)檢驗(yàn)ppt課件解:此題為單側(cè)檢驗(yàn),且是右單側(cè)檢驗(yàn)。以μ表示元件的平均使用壽命(小時(shí)),則(1)建立假設(shè) H0:μ=100,即平均使用壽命無(wú)明顯變化; H1:μ>100,即使用壽命有明顯提高。(2)確定檢驗(yàn)統(tǒng)計(jì)量及其分布

N(0,1)(本科)第7章假設(shè)檢驗(yàn)ppt課件(3)確定臨界值右單側(cè)檢驗(yàn)的臨界值為zα。由于給定的顯著性水平α=0.05,那么雙側(cè)概率水平為2×0.05=0.1,則F(zα)=1-0.1=0.9,查正態(tài)分布表得到zα=1.645,即為臨界值。(本科)第7章假設(shè)檢驗(yàn)ppt課件(4)計(jì)算樣本統(tǒng)計(jì)量并判斷根據(jù)樣本資料,計(jì)算樣本統(tǒng)計(jì)量:由于計(jì)算的樣本統(tǒng)計(jì)量z>1.645,所以拒絕原假設(shè)H0,可以認(rèn)為該類型的電子元件的使用壽命確實(shí)有所提高。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-2】在上例中,如果抽出的100個(gè)樣本元件,測(cè)得其平均使用壽命為98(小時(shí)),其余條件相同,試問該類型元件的使用壽命是否有顯著性下降。(本科)第7章假設(shè)檢驗(yàn)ppt課件解:此例為左單側(cè)檢驗(yàn)問題。(1)建立的假設(shè)檢驗(yàn)為 H0:μ=100,無(wú)明顯變化;H1:μ<100

,有顯著性下降。(2)確定檢驗(yàn)統(tǒng)計(jì)量及其分布在原假設(shè)成立下,檢驗(yàn)統(tǒng)計(jì)量為:~

N(0,1)(本科)第7章假設(shè)檢驗(yàn)ppt課件(3)確定臨界值此時(shí)左側(cè)臨界值為-zα,根據(jù)上面的結(jié)果,得到臨界值為-zα=-1.645(4)計(jì)算樣本統(tǒng)計(jì)量并做出判斷:樣本統(tǒng)計(jì)量為:由于-z<-1.645,所以拒絕原假設(shè)H0,說(shuō)明該類型元件的使用壽命有顯著性下降。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-3】某糖果生產(chǎn)基地,生產(chǎn)的標(biāo)準(zhǔn)是每袋糖果的凈重為500(克)。今從一批生產(chǎn)中抽出10袋,實(shí)際測(cè)得每袋糖果的凈重(克)為: 512503498507496489499501496506給定顯著性水平α=0.01,試問該批的生產(chǎn)是否正常。(本科)第7章假設(shè)檢驗(yàn)ppt課件解:該例中,所檢驗(yàn)問題是糖果凈重是否符合500克的標(biāo)準(zhǔn),屬于雙側(cè)檢驗(yàn)問題。(1)建立假設(shè) H0:μ=500,H1:μ≠500(2)確定臨界值由于是雙側(cè)檢驗(yàn),所以應(yīng)該有兩個(gè)臨界值:上臨界值、下臨界值。又因總體的標(biāo)準(zhǔn)差σ未知,需要用樣本標(biāo)準(zhǔn)差s來(lái)代替,因此,統(tǒng)計(jì)量服從的是自由度ν=n-1的t分布,而非正態(tài)分布。此例中n=10,α=0.01,則自由度ν=10-1=9,查t分布表得到,上臨界值tα/2(ν)=t0.005(9)=3.25,由于分布的對(duì)稱性,下臨界值為tα/2(ν)=t0.005(9)=3.25。(本科)第7章假設(shè)檢驗(yàn)ppt課件(3)計(jì)算樣本統(tǒng)計(jì)量在計(jì)算樣本統(tǒng)計(jì)量之前需要先計(jì)算樣本均值和樣本標(biāo)準(zhǔn)差:

樣本均值:

(克)

樣本標(biāo)準(zhǔn)差:

(克)

檢驗(yàn)的樣本統(tǒng)計(jì)量:

(4)判斷:根據(jù)樣本計(jì)算的統(tǒng)計(jì)量t=0.335∈[-3.25,3-25],所以不能拒絕原假設(shè),也即,在99%的置信度下,可以認(rèn)為該批生產(chǎn)正常。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-4】承上例,假定所要檢驗(yàn)的是該批生產(chǎn)是否顯著地高于標(biāo)準(zhǔn)。(本科)第7章假設(shè)檢驗(yàn)ppt課件解:這樣檢驗(yàn)問題就變?yōu)閱蝹?cè)檢驗(yàn)了,而且是右單側(cè)問題。(1)建立假設(shè) H0:μ≤500,H1:μ>500(2)確定臨界值由于是屬于單側(cè)檢驗(yàn),所以只有一個(gè)臨界值;N=10,α=0.01,查表得到該臨界值為 tα

(ν)=t0.01(9)=2.821(本科)第7章假設(shè)檢驗(yàn)ppt課件(3)計(jì)算樣本統(tǒng)計(jì)量跟上例的計(jì)算一樣,此處略,得到樣本統(tǒng)計(jì)量t=0.335

(4)判斷由于實(shí)際的樣本統(tǒng)計(jì)量t=0.335<臨界值t0.01(9)=2.821,所以不能拒絕原假設(shè),可以認(rèn)為該類生產(chǎn)沒有顯著地高于標(biāo)準(zhǔn)。該結(jié)論與上例的結(jié)論相符。(本科)第7章假設(shè)檢驗(yàn)ppt課件二、兩個(gè)總體均值之差的檢驗(yàn)兩個(gè)總體均值之差的檢驗(yàn),就是對(duì)兩個(gè)不同總體的均值之間的差異性是否顯著所進(jìn)行的檢驗(yàn)。為了分析的簡(jiǎn)化與方便,我們假定x是取自于均值為μx

、方差為

的正態(tài)總體X的一個(gè)樣本,y是取自于均值為

μy、方差

的正態(tài)總體Y的一個(gè)樣本,樣本容量分別為

,且假定此兩樣本相互獨(dú)立。

、

、

為對(duì)應(yīng)的樣本均值與樣本方差,顯著性水平為α。下面我們分總體方差已知和未知兩種情況,來(lái)分析總體均值的差異顯著性檢驗(yàn)。(本科)第7章假設(shè)檢驗(yàn)ppt課件(一)兩總體方差

已知

雙側(cè)檢驗(yàn)原假設(shè)為H0:μx=μy,備選假設(shè)為H1:μx≠μy根據(jù)上面的假定和抽樣分布理論,我們可以得到:~

N(0,1)

(7.3)所以在原假設(shè)成立下,構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量為:~

N(0,1)

(7.4)(本科)第7章假設(shè)檢驗(yàn)ppt課件在顯著性水平α下,我們查標(biāo)準(zhǔn)正態(tài)分布表得到臨界值

。將樣本資料代入所構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量,得到樣本統(tǒng)計(jì)量z。若

,則拒絕原假設(shè);反之,則不能拒絕原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件⑵

左單側(cè)檢驗(yàn)原假設(shè)為H0:μx=μy,備選假設(shè)為H1:μx<μy此時(shí)可從標(biāo)準(zhǔn)正態(tài)分布表查得的臨界值為z1-α。檢驗(yàn)的拒絕域?yàn)椋簔<-z1-α。(本科)第7章假設(shè)檢驗(yàn)ppt課件⑶

右單側(cè)檢驗(yàn)原假設(shè)為H0:μx=μy,備選假設(shè)變?yōu)镠1:μx<μy此時(shí)的臨界值也為z1-α。檢驗(yàn)的拒絕域?yàn)椋?z>z1-α。(本科)第7章假設(shè)檢驗(yàn)ppt課件(二)兩總體方差

未知但相等在兩方差未知但相等的情況下,我們根據(jù)抽樣分布理論知:~t(n1+n2-2)

(7.5)對(duì)于雙、單側(cè)檢驗(yàn),原假設(shè)都是相同的,均為H0:μx=μy。只是在雙側(cè)檢驗(yàn)時(shí),備選假設(shè)H1:μx≠μy

;在左單側(cè)檢驗(yàn)時(shí),備選假設(shè)為H1:μx<μy

;在右單側(cè)檢驗(yàn)時(shí),備選假設(shè)為H1:μx>μy

。(本科)第7章假設(shè)檢驗(yàn)ppt課件在原假設(shè)成立的情況下,根據(jù)上面的公式,我們可以構(gòu)造如下的檢驗(yàn)統(tǒng)計(jì)量:~t(n1+n2-2)

(7.6)可以根據(jù)樣本資料的數(shù)據(jù),計(jì)算樣本檢驗(yàn)統(tǒng)計(jì)量的數(shù)值。(本科)第7章假設(shè)檢驗(yàn)ppt課件對(duì)于雙側(cè)檢驗(yàn),可以從t分布表中查得臨界值

,此時(shí)原假設(shè)的拒絕域?yàn)椋?/p>

。反之就不能拒絕原假設(shè)。對(duì)于左、右單側(cè)檢驗(yàn),從

分布表中查得臨界值t1-α(n1+n2-2);左單側(cè)檢驗(yàn)拒絕原假設(shè)的范圍是:t<-t1-α(n1+n2-2)。右單側(cè)檢驗(yàn)拒絕原假設(shè)的范圍為:t<-t1-α(n1+n2-2)。若t在拒絕域之外,則不能拒絕原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-5】將某小學(xué)一年級(jí)學(xué)生隨機(jī)分為兩組,對(duì)其中一組運(yùn)用新型的教學(xué)方式,稱為新型組,另一組按照傳統(tǒng)的教學(xué)方式稱為傳統(tǒng)組。經(jīng)過(guò)六個(gè)月后,對(duì)該年級(jí)學(xué)生進(jìn)行成績(jī)測(cè)試。假設(shè)兩組成績(jī)的總體標(biāo)準(zhǔn)差相同。從新型組抽取31名學(xué)生,求得其平均成績(jī)?yōu)?8.06,標(biāo)準(zhǔn)差為9.36;同樣的,從傳統(tǒng)組抽取31名,求得的平均成績(jī)?yōu)?6.30,標(biāo)準(zhǔn)差為10.12。假設(shè)兩組成績(jī)的總體標(biāo)準(zhǔn)差相同。比較兩組學(xué)生的平均成績(jī)是否有顯著性差異。(本科)第7章假設(shè)檢驗(yàn)ppt課件解:此題屬于在兩總體方差未知(但是假定兩方差相等)下,檢驗(yàn)兩組均值是否有差異的問題。依題意有,(1)建立假設(shè)。H0:μx=μy,

備選假設(shè)H1:μx≠μy

;(2)

構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為~t

(n+n2-2)

(本科)第7章假設(shè)檢驗(yàn)ppt課件其中由于相等的標(biāo)準(zhǔn)差σ未知,我們用

來(lái)估計(jì)。(3)確定臨界值。

從t分布表中查得臨界值

。(4)計(jì)算樣本統(tǒng)計(jì)量及判斷。將樣本資料代入檢驗(yàn)統(tǒng)計(jì)量得到

因而有

,不能拒絕原假設(shè),即兩組的均值沒有顯著性差異。(本科)第7章假設(shè)檢驗(yàn)ppt課件三、總體成數(shù)的假設(shè)檢驗(yàn)成數(shù)是反應(yīng)現(xiàn)象數(shù)量結(jié)構(gòu)的指標(biāo)。例如就業(yè)率、升學(xué)率、產(chǎn)品合格率等等。要考察總體成數(shù)是否發(fā)生顯著性變化,可以通過(guò)樣本成數(shù)來(lái)對(duì)其進(jìn)行假設(shè)檢驗(yàn)。與對(duì)總體均值的假設(shè)檢驗(yàn)類似,總體成數(shù)的假設(shè)檢驗(yàn)包括單樣本和多樣本(本處只考慮兩樣本情況)總體成數(shù)檢驗(yàn)。(本科)第7章假設(shè)檢驗(yàn)ppt課件(一)單樣本成數(shù)檢驗(yàn)當(dāng)樣本容量比較大時(shí),按照中心極限定理,分布以正態(tài)分布為極限。因而,對(duì)總體成數(shù)的假設(shè)檢驗(yàn)可以借助正態(tài)分布來(lái)進(jìn)行。建立假設(shè):,構(gòu)建的檢驗(yàn)統(tǒng)計(jì)量為

(7.7)服從標(biāo)準(zhǔn)正態(tài)分布,即z~

N(0,1)其中,P代表樣本的成數(shù),ρ代表總體的成數(shù)。,

(本科)第7章假設(shè)檢驗(yàn)ppt課件對(duì)于顯著性水平α

,可以通過(guò)查標(biāo)準(zhǔn)正態(tài)分布表,得到臨界值

。從樣本數(shù)據(jù)中計(jì)算得出

樣本成數(shù)P代入檢驗(yàn)統(tǒng)計(jì)量,得到樣本統(tǒng)計(jì)量Z。將樣本統(tǒng)計(jì)量與臨界值進(jìn)行比較,若

,則拒絕原假設(shè);反之則不能拒絕原假設(shè)。當(dāng)然,如果對(duì)應(yīng)的原假設(shè)是單邊的,即H0:ρ≥(或≤)ρ0,則對(duì)應(yīng)的臨界值是z1-α。若

,則拒絕原假設(shè);反之,則不能拒絕原假設(shè)。我們以例子來(lái)說(shuō)明單樣本成數(shù)檢驗(yàn)的過(guò)程。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-6】某牌子的冰箱生產(chǎn)商聲明,其產(chǎn)品在該地區(qū)的市場(chǎng)占有率為60%。為了檢驗(yàn)該說(shuō)法的正確與否,我們?cè)谠摰貐^(qū)隨機(jī)調(diào)查了100名購(gòu)買了冰箱的消費(fèi)者,其中有57人購(gòu)買的是該牌子的冰箱,試問該生產(chǎn)商的聲明是否可靠?(α=0.05)(本科)第7章假設(shè)檢驗(yàn)ppt課件解:經(jīng)分析,本例屬于雙側(cè)檢驗(yàn)。樣本市場(chǎng)占有率

(1)建立假設(shè):H0:ρ=60%,H1:ρ≠60%(2)檢驗(yàn)統(tǒng)計(jì)量:

~N(0,1)(3)計(jì)算臨界值:在5%的顯著性水平下,從標(biāo)準(zhǔn)正態(tài)分布表中可以查得臨界值為:

(本科)第7章假設(shè)檢驗(yàn)ppt課件(4)計(jì)算樣本統(tǒng)計(jì)量及判斷:

樣本統(tǒng)計(jì)量

,因而,我們不能拒絕原假設(shè),即生產(chǎn)商的聲明是可靠的。(本科)第7章假設(shè)檢驗(yàn)ppt課件(二)兩個(gè)樣本總體成數(shù)差的檢驗(yàn)如果要考察兩個(gè)總體的成數(shù)之間是否有顯著性差異,可以用兩樣本總體成數(shù)差檢驗(yàn)。假定對(duì)應(yīng)兩總體的樣本容量分別為n1、n2,當(dāng)n1、n2都比較大時(shí),我們可以構(gòu)造如下的檢驗(yàn)統(tǒng)計(jì)量,該檢驗(yàn)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。

~N(0,1)(7.8)(本科)第7章假設(shè)檢驗(yàn)ppt課件若建立的原假設(shè)為H0:ρ1=ρ2,相應(yīng)的臨界值為

;若建立的原假設(shè)為H0:ρ1≥(或≤)ρ2,則相應(yīng)的臨界值為z1-α。能否拒絕原假設(shè)的判斷規(guī)則如前面所述。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-7】考察專業(yè)股票分析師和普通股民對(duì)整個(gè)股票市場(chǎng)走勢(shì)的判斷是否存在顯著性差異。在100名的專業(yè)股票分析師中,有55%的人認(rèn)為股票市場(chǎng)將上升,在150名普通股民中,有48%的持相同觀點(diǎn)。試問,專業(yè)分析師和普通股民的觀點(diǎn)是否存在顯著性差異(α=0.05)。(本科)第7章假設(shè)檢驗(yàn)ppt課件解:根據(jù)題設(shè),已知

。建立原假設(shè)

,備選假設(shè)

根據(jù)樣本資料計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值從標(biāo)準(zhǔn)正態(tài)分布表查出α=0.05時(shí)的臨界值為

。因?yàn)?/p>

,所以不能拒絕原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件四、正態(tài)總體方差的假設(shè)檢驗(yàn)方差是反映現(xiàn)象在數(shù)量上變異程度的指標(biāo),反映變化的均衡程度。對(duì)于正態(tài)總體方差的檢驗(yàn)主要有兩種:一是檢驗(yàn)總體方差是否顯著等于某一給定的確定值;二是檢驗(yàn)總體方差是否顯著性地在某個(gè)給定的范圍內(nèi)。在參數(shù)估計(jì)中,我們已經(jīng)知道,可以用樣本方差

是總體方差

σ2的無(wú)偏估計(jì)。樣本方差計(jì)算公式中的(n-1)為自由度,說(shuō)明樣本中有(n-1)個(gè)樣本單位的取值是可以獨(dú)立確定的,這是由于分子中

的約束使得獨(dú)立的樣本單位少了一個(gè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件所建立的原假設(shè)為

,備選假設(shè)為

檢驗(yàn)統(tǒng)計(jì)量為:

(7.9)

或者是

(7.10)在原假設(shè)成立的條件下,該統(tǒng)計(jì)量服從自由度為n-1的

分布,即

(7.11)(本科)第7章假設(shè)檢驗(yàn)ppt課件χ2分布曲線全部處于第一象限,其中唯一參數(shù)是自由度。當(dāng)自由度大于30時(shí),分布曲線接近于正態(tài)分布。圖7-3為χ2分布曲線的演示圖。圖7-3χ2分布圖(本科)第7章假設(shè)檢驗(yàn)ppt課件如圖中所示,有

。根據(jù)顯著性水平α和自由度n-1,查χ2分布表可以得到臨界值

。若檢驗(yàn)統(tǒng)計(jì)量

,則拒絕原假設(shè);反之不能拒絕原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-8】已知生產(chǎn)某型號(hào)的螺釘廠,在正常條件下,其螺釘長(zhǎng)度服從正態(tài)分布N(4.0,0.04)(單位為厘米)?,F(xiàn)在我們對(duì)某日生產(chǎn)的螺釘隨機(jī)抽取6個(gè),測(cè)得其長(zhǎng)度為4.1,3.6,3.8,4.2,4.1,3.9,試問該日生產(chǎn)的螺釘總體標(biāo)準(zhǔn)差是否正常?

(α=0.05)(本科)第7章假設(shè)檢驗(yàn)ppt課件解:可以計(jì)算出樣本標(biāo)準(zhǔn)差

,該假設(shè)檢驗(yàn)的過(guò)程如下:(1)建立假設(shè):

,

;(2)檢驗(yàn)統(tǒng)計(jì)量:

;(3)臨界值:從χ2分布表可得到臨界值

;(4)計(jì)算樣本統(tǒng)計(jì)量及其判斷。

所以,不能拒絕原假設(shè),可以認(rèn)為該日生產(chǎn)的螺釘總體標(biāo)準(zhǔn)差正常。(本科)第7章假設(shè)檢驗(yàn)ppt課件五、兩個(gè)正態(tài)總體方差比的檢驗(yàn)假定有兩個(gè)樣本,分別為

,

,兩樣本容量分別為n1

和n2

,且相互獨(dú)立。其中

分別為兩正態(tài)分布總體的均值和方差。又

分別為兩樣本方差,下面分兩情況對(duì)方差比

進(jìn)行檢驗(yàn)。

(本科)第7章假設(shè)檢驗(yàn)ppt課件(一)兩總體均值μx

、μy已知在兩總體均值已知的情況下,我們用樣本方差去估計(jì)兩總體的方差

。此時(shí)樣本方差的計(jì)算式子如下:

式中,兩個(gè)樣本方差的分母(自由度)都為各自的樣本容量。根據(jù)抽樣分布理論知:

,且統(tǒng)計(jì)量

(7.12)即統(tǒng)計(jì)量F服從F分布。

(本科)第7章假設(shè)檢驗(yàn)ppt課件建立假設(shè):

。對(duì)于雙側(cè)檢驗(yàn),

。在原假設(shè)成立下,檢驗(yàn)統(tǒng)計(jì)量為:~

(7.13)根據(jù)顯著性水平

和自由度,查F分布表可以得到兩個(gè)臨界值:

。若樣本統(tǒng)計(jì)量F滿足:

,那么就可在

概率水平下拒絕原假設(shè)。反之,如果計(jì)算的樣本統(tǒng)計(jì)量值在區(qū)域

之中,那么我們就不能拒絕原假設(shè)?!ū究疲┑?章假設(shè)檢驗(yàn)ppt課件對(duì)于左單側(cè)檢驗(yàn),建立的備選假設(shè)為

,據(jù)以判斷的臨界值為

,拒絕域?yàn)闃颖窘y(tǒng)計(jì)量

。對(duì)于右單側(cè)檢驗(yàn),建立的備選假設(shè)為

,據(jù)以判斷的臨界值為

,拒絕域?yàn)闃颖窘y(tǒng)計(jì)量

。(本科)第7章假設(shè)檢驗(yàn)ppt課件(二)兩樣本均值μx

、μy未知在兩總體均值未知下,我們用如下計(jì)算式子的樣本方差去估計(jì)兩總體的方差

式中,

,

分別為兩樣本平均值,兩個(gè)樣本方差的分母(自由度)都為各自的樣本容量減去1。由于

,有統(tǒng)計(jì)量~

(7.14)從而可將其作為檢驗(yàn)統(tǒng)計(jì)量。

(本科)第7章假設(shè)檢驗(yàn)ppt課件建立的原假設(shè)為

,在原假設(shè)成立的情況下,檢驗(yàn)統(tǒng)計(jì)量~

(7.15)對(duì)于雙側(cè)檢驗(yàn),備選假設(shè)為

,當(dāng)樣本統(tǒng)計(jì)量

時(shí),拒絕原假設(shè);反之則不能拒絕原假設(shè)。

(本科)第7章假設(shè)檢驗(yàn)ppt課件對(duì)于左單側(cè)檢驗(yàn),備選假設(shè)為

,據(jù)以判斷的臨界值為

,拒絕域?yàn)闃颖窘y(tǒng)計(jì)量

。對(duì)于右單側(cè)檢驗(yàn),備選假設(shè)為

,據(jù)以判斷的臨界值為

,拒絕域?yàn)闃颖窘y(tǒng)計(jì)量

。

(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-9】為了比較兩個(gè)地區(qū)(甲、乙)居民人均月收入不平均的差異,分別在兩個(gè)地區(qū)調(diào)查8戶和7戶的人均月收入為(假設(shè)收入都服從正態(tài)分布):試問甲區(qū)的人均月收入的不均衡性是否不大于乙區(qū)的。

表7-2各地區(qū)人均收入甲地區(qū)120090085095012008001300-乙地區(qū)15001650145021001850165015001400(本科)第7章假設(shè)檢驗(yàn)ppt課件解:人均月收入的不均衡性可以用方差(或者是標(biāo)準(zhǔn)差)來(lái)表征,因而問題就轉(zhuǎn)化為檢驗(yàn)兩地區(qū)人均月收入方差(標(biāo)準(zhǔn)差)的差異性。從調(diào)查的樣本資料中,我們可以得到

,, ,(1)建立假設(shè):

,

(2)檢驗(yàn)統(tǒng)計(jì)量:

(本科)第7章假設(shè)檢驗(yàn)ppt課件(3)臨界值:從

分布表中查得臨界值為

(4)樣本統(tǒng)計(jì)量的計(jì)算及判斷:所以不能拒絕原假設(shè),即不能認(rèn)為甲區(qū)的人均月收入波動(dòng)較小。(本科)第7章假設(shè)檢驗(yàn)ppt課件第三節(jié)

非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述χ2檢驗(yàn)符號(hào)檢驗(yàn)等級(jí)相關(guān)(本科)第7章假設(shè)檢驗(yàn)ppt課件秩和檢驗(yàn)游程檢驗(yàn)

等級(jí)相關(guān)(本科)第7章假設(shè)檢驗(yàn)ppt課件一、非參數(shù)檢驗(yàn)概述前面介紹的各種假設(shè)檢驗(yàn)都是在總體分布形式已知或者假定總體分布的前提下做出判斷。但在實(shí)際問題中,可能無(wú)法獲知或者不一定很了解總體的分布類型,而只能通過(guò)樣本來(lái)檢驗(yàn)關(guān)于總體分布的假設(shè)。這種檢驗(yàn)方法稱為非參數(shù)檢驗(yàn)。(本科)第7章假設(shè)檢驗(yàn)ppt課件非參數(shù)檢驗(yàn)是相對(duì)于參數(shù)檢驗(yàn)而言的,是檢驗(yàn)總體分布函數(shù)的統(tǒng)計(jì)方法。兩種檢驗(yàn)方法具有共同點(diǎn):都對(duì)總體的某種數(shù)量關(guān)系、特征做出假設(shè),都建立原假設(shè)和備選假設(shè),都是根據(jù)實(shí)際樣本統(tǒng)計(jì)量與臨界值的比較做出對(duì)假設(shè)的判斷。其區(qū)別在于:參數(shù)檢驗(yàn)需要對(duì)總體分布做某些限制性的假定,該假定要求總體的分布類型是已知的,未知的只有分布中的某些參數(shù)是否發(fā)生變動(dòng),而且大多檢驗(yàn)是建立在高斯等人的正態(tài)分布理論上。如果對(duì)總體的分布不了解或者了解很少,那么參數(shù)檢驗(yàn)的結(jié)果會(huì)更加不可靠,甚至?xí)l(fā)生很大偏差。而非參數(shù)檢驗(yàn)卻不依賴于對(duì)總體分布或參數(shù)的知識(shí),不對(duì)總體分布加以限制性的假定,亦稱為自由分布檢驗(yàn)。(本科)第7章假設(shè)檢驗(yàn)ppt課件由此可見,非參數(shù)檢驗(yàn)與傳統(tǒng)的參數(shù)檢驗(yàn)比較有一些優(yōu)缺點(diǎn):對(duì)檢驗(yàn)的限制更少,更加避免先見偏差,具有較好的穩(wěn)健性;可以在更少樣本資料要求的情況下進(jìn)行,在一定程度上彌補(bǔ)有些實(shí)際中樣本資料不足等的缺陷;可以彌補(bǔ)上述參數(shù)檢驗(yàn)中碰到的無(wú)法運(yùn)用的屬性資料問題,然而,同時(shí)也就可能損失了其中所包含的另外信息。(本科)第7章假設(shè)檢驗(yàn)ppt課件二、χ2檢驗(yàn)χ2檢驗(yàn)是利用χ2分布的原理,通過(guò)對(duì)樣本數(shù)據(jù)進(jìn)行分析來(lái)對(duì)樣本所屬的總體情況進(jìn)行判斷的一種檢驗(yàn)方法。在第一節(jié)中,我們也用過(guò)χ2檢驗(yàn),不過(guò)是在了解總體的分布類型的情況下來(lái)應(yīng)用的。本小節(jié)中將介紹χ2檢驗(yàn)在非參數(shù)檢驗(yàn)中的應(yīng)用,包括分布擬合檢驗(yàn)和獨(dú)立性檢驗(yàn)。(本科)第7章假設(shè)檢驗(yàn)ppt課件(一)分布擬合檢驗(yàn)在實(shí)際中,往往并非總是知道所研究總體的分布狀況,但卻可以得到取自于該總體的樣本。那么,就期望根據(jù)來(lái)自于該總體的樣本資料信息去推斷、檢驗(yàn)總體分布是否與指定分布吻合。該檢驗(yàn)的假設(shè)為

,

其中F(x)為總體的分布函數(shù),F(xiàn)0(x)是某個(gè)事先假定的總體分布函數(shù)。(本科)第7章假設(shè)檢驗(yàn)ppt課件χ2檢驗(yàn)的步驟為:(1)建立假設(shè):

,

。(2)將樣本資料數(shù)據(jù)值按區(qū)間進(jìn)行適當(dāng)?shù)膭澐郑悍譃閙個(gè)區(qū)間,各個(gè)區(qū)間的分界值為Xi,其中

,同時(shí)應(yīng)保證各個(gè)區(qū)間互不相容。(3)計(jì)算在各個(gè)樣本區(qū)間內(nèi)的實(shí)際頻數(shù)

),也即為樣本數(shù)值落在各個(gè)區(qū)間的樣本個(gè)數(shù)。當(dāng)原假設(shè)H0為真時(shí),計(jì)算落在各個(gè)區(qū)間的理論概率值:

,從而計(jì)算出各個(gè)區(qū)間的理論頻率數(shù)為npi。其中n為樣本容量。(本科)第7章假設(shè)檢驗(yàn)ppt課件(4)調(diào)整區(qū)間:由于該檢驗(yàn)要求樣本容量n足夠大,以及nPi不能太小。根據(jù)經(jīng)驗(yàn),一般要求n≥50,nPi>5。如果nPi≤5,則將nPi≤5的樣本合并。(5)構(gòu)造并計(jì)算統(tǒng)計(jì)量:當(dāng)原假設(shè)為真時(shí),樣本實(shí)際頻數(shù)fi應(yīng)該與理論頻數(shù)nPi接近,即

不應(yīng)太大。根據(jù)K.皮爾遜的研究,可以構(gòu)造如下的檢驗(yàn)統(tǒng)計(jì)量~

(7.12)其中k為待估計(jì)的參數(shù)個(gè)數(shù)。其余符號(hào)含義與上述同。(本科)第7章假設(shè)檢驗(yàn)ppt課件(6)計(jì)算臨界值:在給定顯著性水平

α下,查χ2

分布表得到臨界值

。這樣就得到拒絕原假設(shè)的值域:

(7)進(jìn)行判斷:如果計(jì)算的樣本統(tǒng)計(jì)量χ2

確實(shí)大于

,那么就可以拒絕原假設(shè),否則不能拒絕原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-10】欲檢驗(yàn)?zāi)硞€(gè)骰子是否均勻,可以通過(guò)檢驗(yàn)各個(gè)點(diǎn)數(shù)的出現(xiàn)是否是隨機(jī)的。我們隨機(jī)投出骰子102次,將得到的點(diǎn)數(shù)記錄下來(lái);出現(xiàn)各個(gè)點(diǎn)數(shù)的次數(shù)見表7-3。表7-3骰子出現(xiàn)各種點(diǎn)數(shù)的次數(shù)點(diǎn)

數(shù)123456合計(jì)出現(xiàn)的次數(shù)191620151418102(本科)第7章假設(shè)檢驗(yàn)ppt課件解:記各個(gè)點(diǎn)數(shù)出現(xiàn)的次數(shù)為X,其分布未知,依據(jù)題意我們可以對(duì)其分布建立假設(shè),即 H0:X服從均勻分布,也即X的分布滿足 , ; H1:X不服從均勻分布。在原假設(shè)下,各個(gè)點(diǎn)數(shù)出現(xiàn)的期望頻數(shù)均為

(次)。根據(jù)(7.16)式可以得到:(本科)第7章假設(shè)檢驗(yàn)ppt課件查表得到臨界值為

,

因而,我們不能拒絕原假設(shè),可以認(rèn)為該骰子是均勻的。(本科)第7章假設(shè)檢驗(yàn)ppt課件(二)獨(dú)立性檢驗(yàn)顧名思義,該檢驗(yàn)主要是考察多個(gè)變量之間是否有關(guān)聯(lián),如果變量之間沒有關(guān)聯(lián)性,那么就說(shuō)變量之間是相互獨(dú)立的。這里的變量主要是指定類、定序資料。為了分析變量之間的關(guān)聯(lián)性,需要將資料整理成列聯(lián)表的形式。列聯(lián)表是多行多列縱橫交錯(cuò)所形成的一個(gè)表體。我們以例子說(shuō)明列聯(lián)表的形式以及如何將獨(dú)立性檢驗(yàn)化為列聯(lián)表并進(jìn)行檢驗(yàn)分析的程序。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-11】抽樣調(diào)查某地區(qū)500名待業(yè)人員,這些人員中文化程度為高中及以上的有104人(男44人),初中的有96人(男36人),小學(xué)及以下的有300人(男140人)。問此調(diào)查結(jié)果能否說(shuō)明待業(yè)人員中的文化程度與性別是相互獨(dú)立的。(本科)第7章假設(shè)檢驗(yàn)ppt課件解:根據(jù)調(diào)查結(jié)果,我們可將數(shù)據(jù)整理成列聯(lián)表,見表7-4。表7-4待業(yè)人員文化程度與性別列聯(lián)表高中及以上初中小學(xué)及以下合計(jì)比重男44(46)36(42)140(132)2200.440女60(58)60(54)160(168)2800.560合計(jì)10496300500-—比重0.2080.1920.600—1

文化程度性別(本科)第7章假設(shè)檢驗(yàn)ppt課件列聯(lián)表中,括號(hào)內(nèi)的數(shù)值為該處的期望值,其計(jì)算方法為:該格子所對(duì)應(yīng)的行合計(jì)與列合計(jì)的乘積,再除以總合計(jì)。例如,性別為男且文化程度為高中及以上所對(duì)應(yīng)的期望值為

,其它各個(gè)格子對(duì)應(yīng)的期望值也如此計(jì)算得到。在得出對(duì)應(yīng)的期望值后,就可以應(yīng)用χ2檢驗(yàn)。(本科)第7章假設(shè)檢驗(yàn)ppt課件從χ2分布表可查到臨界值為

,其中的自由度為

。比較可得到樣本χ2值小于臨界值,所以我們不能否定原假設(shè),也就是待業(yè)人員中的文化程度與性別不顯著。(本科)第7章假設(shè)檢驗(yàn)ppt課件三、符號(hào)檢驗(yàn)符號(hào)檢驗(yàn)是非參數(shù)檢驗(yàn)中最簡(jiǎn)單又最常用的方法之一,它既適用于單樣本,又適用于配對(duì)樣本。(本科)第7章假設(shè)檢驗(yàn)ppt課件(一)單樣本的符號(hào)檢驗(yàn)在單樣本的情況下,符號(hào)檢驗(yàn)適用于檢驗(yàn)總體中位數(shù)是否在某一指定的位置。反映一個(gè)總體分布位置的參數(shù)主要有均值和中位數(shù)。均值反映的是分布數(shù)列的重心位置,而中位數(shù)則是反映分布數(shù)列中上下兩邊次數(shù)相等的中央位置,也就是說(shuō)在數(shù)列中,有一半的數(shù)值在此中位數(shù)之上,而另一半在中位數(shù)之下。當(dāng)分布為對(duì)稱時(shí),中位數(shù)上下兩邊的數(shù)值的位置是一致的,當(dāng)分布不對(duì)稱時(shí),兩者就有差異。在偏斜度較大時(shí),檢驗(yàn)中位數(shù)往往比檢驗(yàn)均值更有實(shí)際意義。因?yàn)榫祵?duì)離群值的敏感性較大,而中位數(shù)相對(duì)而言敏感性較小,從而更能客觀地反映樣本數(shù)據(jù)的分布情況。中位數(shù)檢驗(yàn)的基本原理是,假設(shè)總體中位數(shù)的真值

,然后在實(shí)際抽取的容量為n的樣本中,將每個(gè)觀測(cè)值xi

均減去A,并只記錄其差值的符號(hào),即為

(7.17)(本科)第7章假設(shè)檢驗(yàn)ppt課件若

,就略去不計(jì)。接著分別計(jì)算“+”的個(gè)數(shù)(用

表示)和“–”的個(gè)數(shù)(用

表示)。理論上,當(dāng)中位數(shù)

為真時(shí),得到的正負(fù)號(hào)個(gè)數(shù)應(yīng)該接近相等,即

。若從樣本中得到的

相差較遠(yuǎn),那么就有理由拒絕

。該檢驗(yàn)中所用的判別標(biāo)準(zhǔn)是由二項(xiàng)分布臨界值提供的,在大樣本下,可由正態(tài)分布來(lái)逼近。下面用例子來(lái)說(shuō)明檢驗(yàn)的具體過(guò)程。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-12】從大學(xué)某系男女新生中,隨機(jī)抽取20名,測(cè)得體重?cái)?shù)據(jù)如下(公斤):給定顯著性水平

α=0.1,用符號(hào)檢驗(yàn)判定中位數(shù)是否與

有顯著性差異。表7-5某大學(xué)新生體重?cái)?shù)據(jù)表5360476157455551584848645358515649606252(本科)第7章假設(shè)檢驗(yàn)ppt課件解:(1)建立假設(shè)

,

(2)將各個(gè)數(shù)據(jù)均減去原假設(shè)所設(shè)定的中位數(shù)55,并把各個(gè)正負(fù)號(hào)記錄下來(lái)。如果數(shù)據(jù)與中位數(shù)一致,則略去。得到:n+=9,n-=10,

因此n=

n++n-=19(3)計(jì)算臨界值:由于是雙側(cè)檢驗(yàn),檢驗(yàn)水平為α=0.05,查《二項(xiàng)分布臨界值表》,當(dāng)n=18時(shí),臨界值為13。(本科)第7章假設(shè)檢驗(yàn)ppt課件(4)進(jìn)行判斷:由于

,所以不能拒絕原假設(shè),即可以認(rèn)為總體體重的中位數(shù)為55(公斤)。(本科)第7章假設(shè)檢驗(yàn)ppt課件(二)配對(duì)樣本的符號(hào)檢驗(yàn)上面的檢驗(yàn)是針對(duì)單個(gè)總體的情況,實(shí)際中,有可能要同時(shí)對(duì)兩個(gè)總體的分布進(jìn)行比較。假定X、Y分別為從總體F1(X)、F2(X)中抽取的樣本,它們的樣本容量均為

,且兩個(gè)樣本的觀測(cè)值是一一對(duì)應(yīng)的。建立的假設(shè)為H0

:F1(X)=F2(Y), H1

:F1(X)≠F2(Y)

。在原假設(shè)成立的條件下,樣本中Xi大于相對(duì)應(yīng)的Yi的個(gè)數(shù)應(yīng)該與Xi小于相對(duì)應(yīng)的Yi的個(gè)數(shù)大致相等,這些個(gè)數(shù)滿足二項(xiàng)分布。因而,可以利用此特征來(lái)進(jìn)行檢驗(yàn),或者是說(shuō),利用此特征來(lái)設(shè)立檢驗(yàn)的統(tǒng)計(jì)量。(本科)第7章假設(shè)檢驗(yàn)ppt課件設(shè)配對(duì)樣本Xi、Yi序列中,Xi>Yi

的個(gè)數(shù)為r+,Xi<Yi的個(gè)數(shù)為r-,

不考慮Xi=Yi的個(gè)數(shù),所以有r++r-≤n。取r=max(r+,r-),在顯著性水平

α下,有

p{r≥r(α)}=α。臨界值

r(α)是根據(jù)二項(xiàng)分布的原理來(lái)求得的,也可以從臨界值表查得。如果r≥r(α),我們就拒絕原假設(shè),否則就不能拒絕原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-13】假定在某項(xiàng)比賽中,某兩位裁判(A,B)分別對(duì)該項(xiàng)賽事中的10位選手的在場(chǎng)上的綜合表現(xiàn)做出評(píng)分,分?jǐn)?shù)為0-10分,數(shù)據(jù)如下:試用符號(hào)檢驗(yàn)法檢驗(yàn)這兩位裁判裁定的成績(jī)是否有顯著性差異。(α=0.05)表7-6兩裁判的裁定分?jǐn)?shù)表12345678910裁判

8.29.08.89.37.99.18.68.88.49.0裁判

7.98.88.69.48.49.08.98.78.09.3差值的符號(hào)+++--+-++-(本科)第7章假設(shè)檢驗(yàn)ppt課件解:首先提出假設(shè) H0

:兩位裁判的判定成績(jī)無(wú)顯著性差異, H1:兩位裁判的判定成績(jī)有顯著性差異。根據(jù)上面所述的方法,將兩位裁判的判定成績(jī)之間差值的符號(hào)列在表7-6的最后一行。從而有 r+=6,r-=4,r=max(r+,r-)=6在

α=0.05,n=10時(shí),從二項(xiàng)分布表或者是符號(hào)檢驗(yàn)表中可以查得臨界值

,由于

,所以不能拒絕原假設(shè),即不能認(rèn)為兩位裁判的裁定成績(jī)有顯著性差異。(本科)第7章假設(shè)檢驗(yàn)ppt課件(三)非配對(duì)樣本的符號(hào)檢驗(yàn)與上面介紹的配對(duì)樣本的情況類似,不同的只是從所考察的兩總體中分別抽取的樣本的容量不一定相等。假定兩樣本X,Y的容量分別為n1,n2

。此時(shí)原假設(shè)仍為H0

:F1(X)=F2(Y)。(本科)第7章假設(shè)檢驗(yàn)ppt課件對(duì)于該檢驗(yàn),可以將資料轉(zhuǎn)化成列聯(lián)表的形式,并利用上面介紹的χ2

檢驗(yàn)來(lái)進(jìn)行分析。具體的方法為:將所抽取的兩組樣本資料混和在一起,將此(n1+n2

)個(gè)觀測(cè)值按照遞增或遞減的順序進(jìn)行排序,求得中位數(shù)Me。分別將兩樣本中大于或小于中位數(shù)Me的個(gè)數(shù)(頻數(shù))以列聯(lián)表的形式列出。這樣我們就可利用前面的χ2檢驗(yàn)。此處不重述,僅以例子說(shuō)明。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-14】有某商品銷售人員甲、乙每月的銷售額數(shù)據(jù),如表所示(單位:元),只是兩組數(shù)據(jù)并不成對(duì)出現(xiàn),甲有10個(gè)樣本值,而乙只有8個(gè)樣本值?,F(xiàn)要求用符號(hào)檢驗(yàn)法對(duì)這兩位銷售人員的銷售額的分布是否一致進(jìn)行檢驗(yàn)。(α=0.05)表7-7商品銷售人員月銷售數(shù)據(jù)12345678910甲2563260022301986300028003130202318691896乙19992980340425672479258130221880--(本科)第7章假設(shè)檢驗(yàn)ppt課件解:由于兩組銷售額分布形式無(wú)法得知,不能用上節(jié)所介紹的參數(shù)檢驗(yàn)方法,只能用非參數(shù)檢驗(yàn)方法來(lái)進(jìn)行檢驗(yàn)。依據(jù)題意,建立假設(shè): H0

:兩組銷售額的分布一致 H1:兩組銷售額的分布有顯著性差異將兩組數(shù)據(jù)合在一起,求得中位數(shù)Me=2565,從而將每組銷售額分為大于和小于中位數(shù)兩部分,得到列聯(lián)表(見表7-8)(本科)第7章假設(shè)檢驗(yàn)ppt課件表7-8轉(zhuǎn)化的列聯(lián)表大于中位數(shù)小于中位數(shù)合計(jì)甲4610乙538合計(jì)9918(本科)第7章假設(shè)檢驗(yàn)ppt課件根據(jù)χ2

的計(jì)算公式得到:查表得到臨界值

。

,所以不能拒絕原假設(shè),兩組銷售額分布沒有顯著性差異。(本科)第7章假設(shè)檢驗(yàn)ppt課件四、秩和檢驗(yàn)秩和檢驗(yàn)是一種用樣本秩代替樣本值的檢驗(yàn)方法,用該法可以檢驗(yàn)兩個(gè)總體的分布函數(shù)是否相等的問題。所謂秩,就是樣本觀測(cè)值在序列中的排序號(hào)。具體的檢驗(yàn)步驟為: 1.建立假設(shè)H0

:F1(X)=F2(X),H1

:F1(X)≠F2(X)

2.從這兩個(gè)總體

中X、Y分別抽取樣本容量為n1、n2

的兩個(gè)樣本,n1+n2=n。不失一般性,我們假定n1<n2。將兩組樣本混合,并將所有的樣本單位值按小到大排序,每個(gè)樣本單位對(duì)應(yīng)的序號(hào)稱為該樣本單位的秩。對(duì)于相同數(shù)值的樣本單位,它們具有相同的秩,且都等于它們的次序平均值。(本科)第7章假設(shè)檢驗(yàn)ppt課件 3.計(jì)算取自總體X的樣本的秩和T,即將該樣本的所有樣本單位的秩加總。T取可能的最小值是當(dāng)X的樣本單位都排在Y的樣本單位的前面時(shí),即

。T取可能的最大值是在當(dāng)X的樣本單位都排在Y的樣本單位的后面時(shí),此時(shí)有

。如果兩個(gè)總體的分布沒有顯著性差異,則T值不會(huì)太大或太小,而是靠近最大值和最小值的中間,即為

。因此,可以將T作為秩和檢驗(yàn)的統(tǒng)計(jì)量。當(dāng)T的實(shí)際值超過(guò)臨界值時(shí),就可以拒絕兩總體的分布沒有顯著性差異的原假設(shè)。(本科)第7章假設(shè)檢驗(yàn)ppt課件這里應(yīng)該注意,由于T的分布與n1、n2

的大小有關(guān),所以臨界值的確定可以分為小樣本和大樣本兩類。對(duì)于小樣本(n1、n2都未超過(guò)10),臨界值的數(shù)值可以通過(guò)查《秩和檢驗(yàn)值表》求得上、下限。對(duì)于大樣本(n1、n2都超過(guò)10),此時(shí)變量T近似服從正態(tài)分布,該分布的均值

、標(biāo)準(zhǔn)差σT分別為:

(7.18)

(7.19)(本科)第7章假設(shè)檢驗(yàn)ppt課件此時(shí),可以將T標(biāo)準(zhǔn)化為z統(tǒng)計(jì)量

(7.20)然后通過(guò)查找正態(tài)分布表來(lái)確定臨界值。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-15】設(shè)(25,23,22,23,21,23,19,20)和(28,26,24,25,23,20,18,21,15)為兩個(gè)簡(jiǎn)單隨機(jī)樣本,試用秩和檢驗(yàn)法判斷這兩組數(shù)據(jù)是否來(lái)自于同一總體。(本科)第7章假設(shè)檢驗(yàn)ppt課件解:依據(jù)所述步驟有:(1)建立假設(shè): H0

:兩組數(shù)據(jù)來(lái)自同一總體,H1:兩組數(shù)據(jù)來(lái)自不同總體。(2)將兩組數(shù)據(jù)混和并按照由小到大的順序排序,得到各組對(duì)應(yīng)于每個(gè)數(shù)值的排序號(hào)分別為:(14,9,8,9,6,9,3,4)和(17,16,13,14,9,4,2,6,1),其中如果有多個(gè)數(shù)值是一致的,我們?nèi)∑湫蛱?hào)的平均值。(本科)第7章假設(shè)檢驗(yàn)ppt課件(3)由題知n1=8,n2=9,所以取第一組數(shù)據(jù)的秩和為統(tǒng)計(jì)量,即有檢驗(yàn)統(tǒng)計(jì)量T=14+9+8+…+4=62。(4)判斷。由于兩組樣本容量都小于10,所以我們可以從《秩和檢驗(yàn)值表》查得上、下限的臨界值。臨界值為

。由于檢驗(yàn)統(tǒng)計(jì)量介于兩個(gè)臨界值之間,所以不能拒絕原假設(shè),即可以認(rèn)為兩組樣本是來(lái)自于同一總體的。(本科)第7章假設(shè)檢驗(yàn)ppt課件五、游程檢驗(yàn)游程檢驗(yàn)用來(lái)檢驗(yàn)樣本是否隨機(jī)地取自于總體。如果樣本所具有的某個(gè)特征的分布越無(wú)序,越無(wú)規(guī)律性,就越能說(shuō)明樣本的隨機(jī)性。我們通過(guò)游程的概念,來(lái)表征這種分布的特征,并根據(jù)對(duì)游程的分析來(lái)加以判斷。所謂游程,是指依時(shí)間或其他順序排列的有序數(shù)列中,具有相同的事件或符號(hào)的連續(xù)部分。對(duì)應(yīng)地,同類游程出現(xiàn)的次數(shù),則稱為該類的游程數(shù),通俗的講,就是連成一片的事件或字符的片數(shù)。不同類游程數(shù)的總和,稱為總游程數(shù),記為R。(本科)第7章假設(shè)檢驗(yàn)ppt課件【例7-16】設(shè)有一序列為1111222221122111111121。在序列中,共出現(xiàn)了兩類的字符:“

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論