統(tǒng)計(jì)學(xué)概論課件(曾五一)ch05_第1頁
統(tǒng)計(jì)學(xué)概論課件(曾五一)ch05_第2頁
統(tǒng)計(jì)學(xué)概論課件(曾五一)ch05_第3頁
統(tǒng)計(jì)學(xué)概論課件(曾五一)ch05_第4頁
統(tǒng)計(jì)學(xué)概論課件(曾五一)ch05_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章假設(shè)檢驗(yàn)第一節(jié)假設(shè)檢驗(yàn)概述第二節(jié)總體參數(shù)檢驗(yàn)第三節(jié)非參數(shù)檢驗(yàn)1第一節(jié)假設(shè)檢驗(yàn)概述一、假設(shè)檢驗(yàn)的基本概念假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的另一種方式,它與區(qū)間估計(jì)的差別主要在于:區(qū)間估計(jì)是用給定的大概率推斷出總體參數(shù)的范圍,而假設(shè)檢驗(yàn)是以小概率為標(biāo)準(zhǔn),對(duì)總體的狀況所做出的假設(shè)進(jìn)行判斷。假設(shè)檢驗(yàn)與區(qū)間估計(jì)結(jié)合起來,構(gòu)成完整的統(tǒng)計(jì)推斷內(nèi)容。假設(shè)檢驗(yàn)分為兩類:一類是參數(shù)假設(shè)檢驗(yàn),另一類是非參數(shù)假設(shè)檢驗(yàn)。本章分別討論這兩類檢驗(yàn)方法。2小概率原理:即指概率很小的事件在一次試驗(yàn)中實(shí)際上不可能出現(xiàn)。這種事件稱為“實(shí)際不可能事件”。3例1:消費(fèi)者協(xié)會(huì)接到消費(fèi)者投訴,指控品牌紙包裝飲料存在容量不足,有欺騙消費(fèi)者之嫌。包裝上標(biāo)明的容量為250毫升。消費(fèi)者協(xié)會(huì)從市場(chǎng)上隨機(jī)抽取50盒該品牌紙包裝飲品,測(cè)試發(fā)現(xiàn)平均含量為248毫升,小于250毫升。這是生產(chǎn)中正常的波動(dòng),還是廠商的有意行為?消費(fèi)者協(xié)會(huì)能否根據(jù)該樣本數(shù)據(jù),判定飲料廠商欺騙了消費(fèi)者呢?4消費(fèi)者協(xié)會(huì)實(shí)際要進(jìn)行的是一項(xiàng)統(tǒng)計(jì)檢驗(yàn)工作。檢驗(yàn)總體平均=250是否成立。這就是一個(gè)原假設(shè)(nullhypothesis),通常用表示,即::=2505與原假設(shè)對(duì)立的是備選假設(shè)(alternativehypothesis),備選假設(shè)是在原假設(shè)被否定時(shí)另一種可能成立的結(jié)論。備選假設(shè)比原假設(shè)還重要,這要由實(shí)際問題來確定,一般把期望出現(xiàn)的結(jié)論作為備選假設(shè)。6構(gòu)造一個(gè)統(tǒng)計(jì)量來決定是“接受原假設(shè),拒絕備選假設(shè)”,還是“拒絕原假設(shè),接受備選假設(shè)”。對(duì)不同的問題,要選擇不同的檢驗(yàn)統(tǒng)計(jì)量。檢驗(yàn)統(tǒng)計(jì)量確定后,就要利用該統(tǒng)計(jì)的分布以及由實(shí)際問題中所確定的顯著性水平,來進(jìn)一步確定檢驗(yàn)統(tǒng)計(jì)量拒絕原假設(shè)的取值范圍,即拒絕域。在給定的顯著性水平α下,檢驗(yàn)統(tǒng)計(jì)量的可能取值范圍被分成兩部分:小概率區(qū)域與大概率區(qū)域。小概率區(qū)域就是概率不超過顯著性水平α的區(qū)域,是原假設(shè)的拒絕區(qū)域;大概率區(qū)域是概率為1-α的區(qū)域,是原假設(shè)的接受區(qū)域。7二、兩種類型的錯(cuò)誤

接受拒絕真實(shí)判斷正確棄真錯(cuò)誤(第一類錯(cuò)誤或α錯(cuò)誤)

不真實(shí)取偽錯(cuò)誤(第二類錯(cuò)誤或β錯(cuò)誤)

判斷正確8三、檢驗(yàn)功效在犯第一類錯(cuò)誤概率得到控制的條件下,犯取偽錯(cuò)誤的概率也要盡可能地小,或者說,不取偽的概率1-β應(yīng)盡可能增大。1-β越大,意味著當(dāng)原假設(shè)不真實(shí)時(shí),檢驗(yàn)判斷出原假設(shè)不真實(shí)的概率越大,檢驗(yàn)的判別能力就越好;1-β越小,意味著當(dāng)原假設(shè)不真實(shí)時(shí),檢驗(yàn)結(jié)論判斷出原假設(shè)不真實(shí)的概率越小,檢驗(yàn)的判別能力就越差??梢?-β是反映統(tǒng)計(jì)檢驗(yàn)判別能力大小的重要標(biāo)志,我們稱之為檢驗(yàn)功效或檢驗(yàn)力。9第二節(jié)總體參數(shù)檢驗(yàn)一、單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)α/21–αα/2-Zα/2

Zα/2

α–Zα0

α0Zα雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)10用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn),使用左側(cè)檢驗(yàn)還是右側(cè)檢驗(yàn),決定于備選假設(shè)中的不等式形式與方向。與“不相等”對(duì)應(yīng)的是雙側(cè)檢驗(yàn),與“小于”相對(duì)應(yīng)的是左側(cè)檢驗(yàn),與“大于”相對(duì)應(yīng)的是右側(cè)檢驗(yàn)。11二、參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)都是先對(duì)樣本所屬總體的性質(zhì)作出若干的假定,或?qū)傮w的分布形狀加以限定,然后對(duì)總體的有關(guān)參數(shù)情況進(jìn)行統(tǒng)計(jì)假設(shè)檢驗(yàn)。因此,參數(shù)檢驗(yàn)又稱為限定分布檢驗(yàn)。如在總體服從正態(tài)分布條件下,對(duì)其均值進(jìn)行檢驗(yàn)。下面通過具體例子來說明參數(shù)檢驗(yàn)方法。12在例1中,按歷史資料,總體的標(biāo)準(zhǔn)差是4毫升。我們通過檢驗(yàn)總體均值是否等于250毫升,來判斷飲料廠商是否欺騙了消費(fèi)者。程序如下:13第一步:確定原假設(shè)與備選假設(shè)。:=250;:<250以上的備選假設(shè)是總體均值小于250毫升,因?yàn)橄M(fèi)者協(xié)會(huì)希望通過樣本數(shù)據(jù)推斷出廠商的欺騙行為(大于250毫升一般不會(huì)發(fā)生)。因此使用左側(cè)檢驗(yàn)。14第二步:構(gòu)造出檢驗(yàn)統(tǒng)計(jì)量。我們知道,如果總體的標(biāo)準(zhǔn)差已知,則正態(tài)總體(正常情況下,生產(chǎn)飲料的容量服從正態(tài)分布)的抽樣平均數(shù),也服從正態(tài)分布,對(duì)它進(jìn)行標(biāo)準(zhǔn)化變換,可得到:

可用z作為檢驗(yàn)統(tǒng)計(jì)量。15第三步:確定顯著性水平,確定拒絕域。通常顯著水平由實(shí)際問題確定,我們這里取α=0.05,左側(cè)檢驗(yàn),拒絕域安排在左邊,查標(biāo)準(zhǔn)正態(tài)分布表得臨界值:-=-1.645,拒絕域是z<-1.645。16第四步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的數(shù)值。樣本平均數(shù),n=50,代入檢驗(yàn)統(tǒng)計(jì)量得:17第五步:判斷。檢驗(yàn)統(tǒng)計(jì)量的樣本取值落入拒絕域。拒絕原假設(shè),接受備選假設(shè),認(rèn)為有足夠的證據(jù)說明該種紙包飲料的平均容量小于包裝盒上注明的250毫升,廠商有欺詐之嫌。18總體標(biāo)準(zhǔn)差未知時(shí)對(duì)總體均值檢驗(yàn)經(jīng)常用t統(tǒng)計(jì)量:但是,在大樣本場(chǎng)合(樣本容量n大于30時(shí)),t-統(tǒng)計(jì)量與標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計(jì)量近似,通常用z檢驗(yàn)代替t檢驗(yàn)。19總體成數(shù)的檢驗(yàn)當(dāng)樣本容量較大時(shí),下列統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布:

上式中,ρ代表總體的成數(shù),p代表樣本的成數(shù)。以上的z統(tǒng)計(jì)量可以用作總體成數(shù)檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量。20例2:某企業(yè)聲明有30%以上的消費(fèi)者對(duì)其產(chǎn)品質(zhì)量滿意。如果隨機(jī)調(diào)查600名消費(fèi)者,表示對(duì)該企業(yè)產(chǎn)品滿意的有220人。試在顯著性水平α=0.05下,檢驗(yàn)調(diào)查結(jié)果是否支持企業(yè)的自我聲明。21解:第一步:作出假設(shè)。:ρ=30%,:ρ>30%。以上的備選假設(shè)是企業(yè)自我聲明的結(jié)論,我們希望該企業(yè)說的是實(shí)話。因此使用右側(cè)檢驗(yàn)。22第二步:構(gòu)造z檢驗(yàn)統(tǒng)計(jì)量。第三步:確定拒絕域。顯著水平α=0.05,查標(biāo)準(zhǔn)正態(tài)分布表得臨界值:=1.645,拒絕域是z>1.645。23第四步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的數(shù)值。樣本成數(shù)p=220/600=0.37,總體假設(shè)的成數(shù)ρ=0.3,代入z檢驗(yàn)統(tǒng)計(jì)量得:24第五步:判斷。檢驗(yàn)統(tǒng)計(jì)量的樣本取值z(mì)=3.5>1.645,落入拒絕域。拒絕原假設(shè),接受備選假設(shè),認(rèn)為樣本數(shù)據(jù)證明該企業(yè)聲明屬實(shí)。25三、p-值檢驗(yàn)p-值檢驗(yàn)就是通過計(jì)算p-值,再將它與顯著性水平α作比較,決定拒絕還是接受原假設(shè)。所謂p-值就是拒絕原假設(shè)所需的最低顯著性水平。p-值判斷的原則是:如果p-值小于給定的顯著性水平α,則拒絕原假設(shè);否則,接受原假設(shè)?;蛘撸庇^來說就是:如果p-值很小,拒絕原假設(shè),p-值很大,接受原假設(shè)。請(qǐng)大家注意的是這里的p-值是指概率,不要與成數(shù)指標(biāo)相混淆。26z檢驗(yàn)的p-值:檢驗(yàn)統(tǒng)計(jì)量為z統(tǒng)計(jì)量的p-值計(jì)算公式,表示檢驗(yàn)統(tǒng)計(jì)量的抽樣數(shù)據(jù),則p-值的計(jì)算方法如下:如果:,p-值=2 如果:,p-值= 如果:,p-值=27例3:利用p-值檢驗(yàn)重新檢驗(yàn)例1。解:第一、第二步與例1完全相同,故省略之。第三步:計(jì)算樣本統(tǒng)計(jì)的數(shù)值。樣本平均數(shù),n=50,代入檢驗(yàn)統(tǒng)計(jì)量得:28第四步:計(jì)算p-值。使用左側(cè)檢驗(yàn),p-值=。查標(biāo)準(zhǔn)正態(tài)分布表得:p-值=[1-F(3.54)]/2=(1-0.9998)/2=0.000129第五步:判斷。p-值小于給出的顯著性水平(0.05),拒絕原假設(shè),接受備選假設(shè),與例1的結(jié)論相同。30第三節(jié)非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)是對(duì)總體的分布不作任何限制的統(tǒng)計(jì)檢驗(yàn)。故非參數(shù)檢驗(yàn)又稱為自由分布檢驗(yàn)。正因?yàn)槿绱?,非參?shù)檢驗(yàn)成為管理科學(xué)中應(yīng)用較為廣泛的一種統(tǒng)計(jì)檢驗(yàn)方法。31一、自由分布檢驗(yàn)概述自由分布檢驗(yàn)對(duì)比參數(shù)檢驗(yàn),具有以下優(yōu)點(diǎn):首先,檢驗(yàn)條件比較寬松,適應(yīng)性強(qiáng)。其次,自由分布檢驗(yàn)的方法比較靈活,用途廣泛。對(duì)于那些不能進(jìn)行加、減、乘、除運(yùn)算的定類數(shù)據(jù)與定序數(shù)據(jù),可使用符號(hào)檢驗(yàn)、秩和檢驗(yàn)等方法進(jìn)行檢驗(yàn)。再次,自由分布檢驗(yàn)的計(jì)算相對(duì)簡(jiǎn)單。由于自由分布的檢驗(yàn)方法不用復(fù)雜計(jì)算,一般使用計(jì)數(shù)方法就可以了,它的計(jì)數(shù)過程與結(jié)果都比較簡(jiǎn)單、直觀與明顯。32自由分布檢驗(yàn)缺點(diǎn):由于它對(duì)原始數(shù)據(jù)中包含的信息利用得不夠充分,檢驗(yàn)的功效相對(duì)較弱。當(dāng)總體的分布形式已知時(shí),基于這種分布類型的參數(shù)方法,一般說來比非參數(shù)方法為佳。例如,對(duì)于一批資料,可同時(shí)適用于參數(shù)的t-檢驗(yàn)、非參數(shù)的符秩檢驗(yàn)和符號(hào)檢驗(yàn)。其檢驗(yàn)功效是,t-檢驗(yàn)的最好,符秩檢驗(yàn)次之,符號(hào)檢驗(yàn)最差。這主要是由于符號(hào)檢驗(yàn)對(duì)信息的利用最不充分。33二、符號(hào)檢驗(yàn)該方法是建立在以正、負(fù)號(hào)表示樣本數(shù)據(jù)與假設(shè)參數(shù)值差異關(guān)系基礎(chǔ)上的,因此稱之為符號(hào)檢驗(yàn)。該方法既適用于單樣本場(chǎng)合,也適用于配對(duì)樣本場(chǎng)合。34(一)單樣本場(chǎng)合的符號(hào)檢驗(yàn)中位數(shù)檢驗(yàn)::=A樣本每個(gè)數(shù)據(jù)都減去A,只記錄其差數(shù)的符號(hào)。n+與n-分別是正、負(fù)符號(hào)的個(gè)數(shù),當(dāng)原假設(shè)為真是時(shí),n+與n-應(yīng)該很接近;若兩者相差太遠(yuǎn),就有有理由拒絕原假設(shè)。35例4:設(shè)有20個(gè)工人,他們一天生產(chǎn)的產(chǎn)品件數(shù),抽樣結(jié)果如下:168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,171,186,167,170。試以α=0.10的檢驗(yàn)水平,判定總體中位數(shù)是否是160。36解:第一步:作出假設(shè)。:=160,:160由備選假設(shè)知,這個(gè)檢驗(yàn)是雙側(cè)的。第二步:計(jì)數(shù)。對(duì)樣本數(shù)據(jù),大于160的記下“+”,小于160的記下“-”,等于160的,予以剔除(以0記之),結(jié)果如下:++0+++--+++-++0+++++計(jì)數(shù)以上“+”的個(gè)數(shù)是n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論