比率p的假設(shè)檢驗_第1頁
比率p的假設(shè)檢驗_第2頁
比率p的假設(shè)檢驗_第3頁
比率p的假設(shè)檢驗_第4頁
比率p的假設(shè)檢驗_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余8頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 比率P的假設(shè)檢驗及其應(yīng)用比率P的假設(shè)檢驗及其應(yīng)用摘要:假設(shè)檢驗是統(tǒng)計推斷的另一項重要內(nèi)容,它與參數(shù)估計類似,但角度不同。參數(shù)估計是利用樣本信息推斷未知的總體參數(shù),而假設(shè)檢驗則是先對總體參數(shù)提出一個假設(shè)值,然后利用樣本信息判斷這一假設(shè)是否成立。本文將主要介紹總體比率的假設(shè)檢驗的原理和方法,以及其在各種生活實例中的應(yīng)用,從而更深的了解假設(shè)檢驗在各種統(tǒng)計方法中的重要作用。關(guān)鍵詞:假設(shè)檢驗;總體比率;檢驗統(tǒng)計量;拒絕域Hypothesis Testing and Its Application of Ratio PAbstract:Hypothesis testing is another impo

2、rtant content to statistical inference, and it is similar to parameter estimation, but the Angle is different. Parameter estimation is use sample information to infer an unknown population parameter, and the hypothesis testing is a hypothesis is proposed first in the overall parameters, and then usi

3、ng the sample information to determine whether the hypothesis is established. This article mainly introduces the overall rate of the principle and method of hypothesis testing, and its application in all kinds of living examples, thus deeper understanding of the hypothesis testing plays an important

4、 part in all kinds of statistical methods.Key words:hypothesis testing;the overall rate;test statistics;rejection region目錄1、 假設(shè)檢驗的基本問題(一)假設(shè)檢驗的概述 (二)假設(shè)檢驗的基本步驟 (三)檢驗的P值二、總體比率的假設(shè)檢驗及其應(yīng)用 (一)單個總體比率的假設(shè)檢驗 1.單個總體比率的精確檢驗及其應(yīng)用 2.單個總體比率的大樣本檢驗及其應(yīng)用(二)兩個總體比率的假設(shè)檢驗 1.兩個總體比率之差的精確檢驗及其應(yīng)用 2.兩個總體比率之差的大樣本檢驗及其應(yīng)用一、假設(shè)檢驗的基本問題

5、(一)假設(shè)檢驗的概述 假設(shè)檢驗是統(tǒng)計推斷的一項重要組成部分,它在各種統(tǒng)計方法中都有極其重要的應(yīng)用。假設(shè)檢驗通過首先對總體參數(shù)提出的一個假設(shè),然后利用樣本信息推斷這個假設(shè)是否成立這樣一個過程,來判斷承認(rèn)還是拒絕該假設(shè)。(二)假設(shè)檢驗的基本步驟1.建立假設(shè) 在假設(shè)檢驗中,通常把被檢驗的假設(shè)叫做原假設(shè),用表示,當(dāng)原假設(shè)被拒絕時接受的假設(shè)叫做備擇假設(shè),用表示。在任一假設(shè)檢驗中,原假設(shè)與備擇假設(shè)都是相互對立的,且二者只能居其一。2.選擇檢驗統(tǒng)計量 建立假設(shè)后,對于是否接受原假設(shè)則需要根據(jù)某一統(tǒng)計量出現(xiàn)的數(shù)值,從概率意義上判斷來完成,這個統(tǒng)計量稱為檢驗統(tǒng)計量。 3.顯著性水平 檢驗的結(jié)果不一定是真實的情況

6、,所以說,檢驗是有可能犯錯誤的。在假設(shè)檢驗中可能會犯的錯誤有兩類:一是原假設(shè)為真卻拒絕原假設(shè),稱這種錯誤為第一類錯誤,其發(fā)生的概率叫做犯第一類錯誤的概率,或稱為拒真概率,在假設(shè)檢驗中把犯第一類錯誤的概率稱為顯著性水平,通常用表示,即另一種錯誤是原假設(shè)為假卻接受原假設(shè),稱這種錯誤為第二類錯誤,其發(fā)生的概率叫做犯第二類錯誤的概率,或稱為受偽概率,通常用表示,即 這兩類錯誤之間也存在著這樣的關(guān)系:當(dāng)減小時,會隨之增大;當(dāng)減小時,會隨之增大。這個現(xiàn)象不是偶然的,而具有一般性,也就是說,在樣本容量不變的前提下,找到一個使和都減小的檢驗是不可能的,唯一能使和同時減小的方法是增大樣本容量。 在假設(shè)檢驗中,發(fā)

7、生哪一類錯誤的后果更為嚴(yán)重,就應(yīng)首先減小哪類錯誤發(fā)生的概率,通常情況下允許犯第一類錯誤的概率,盡量減小犯第二類錯誤的概率,一般取和,表示發(fā)生的概率很小。4.給出拒絕域拒絕域是指使原假設(shè)被拒絕的樣本觀測值所在的區(qū)域,用表示。若統(tǒng)計量的值落在拒絕域內(nèi),則拒絕原假設(shè);反之,則接受原假設(shè)。5. 由樣本值計算結(jié)果(三)檢驗的值假設(shè)檢驗的判斷還有另外一種形式,即計算檢驗的值,檢驗的值就是在一個假設(shè)檢驗中,可以利用樣本觀測值做出拒絕原假設(shè)的最小顯著性水平。將檢驗的值與心目中的顯著性水平進(jìn)行比較,就可以很容易的做出檢驗的結(jié)論。判斷如下: 如果,則在顯著性水平下拒絕原假設(shè); 如果,則在顯著性水平下接受原假設(shè)。

8、二、總體比率的假設(shè)檢驗及其應(yīng)用 (一)單個總體比率的假設(shè)檢驗1.單個總體比率的精確檢驗及其應(yīng)用下文所提到的比例可將其看作某事件發(fā)生的概率,即為兩點分布中的參數(shù)。做次獨(dú)立試驗,用標(biāo)記事件發(fā)生的次數(shù),則。 (1)設(shè)為兩點分布的樣本,考慮右側(cè)假設(shè)檢驗:,給出拒絕域,由于為整數(shù),所以取非負(fù)整數(shù)值。但是對于給定的,不一定找到恰好的,使對此情況比較常見的辦法是,找一個,使若取,相當(dāng)于提高檢驗的顯著性水平,若取,則相當(dāng)于降低檢驗的顯著性水平,由于取可以保證 的左側(cè)不大于,所以取可得到水平為的檢驗。由此可以類似推出,對于假設(shè)檢驗問題 檢驗的拒絕域可以為為滿足的最大正整數(shù)。對于假設(shè)檢驗問題檢驗的拒絕域為其中為滿

9、足的最大整數(shù),為滿足的最小整數(shù)。(2)應(yīng)用例1.1.1 在一次模擬考試后,某班級的班主任對這次的成績做了一次統(tǒng)計,統(tǒng)計結(jié)果發(fā)現(xiàn)有的同學(xué)達(dá)到了80分以上,現(xiàn)從該班級隨機(jī)抽取20名同學(xué),其中有5位同學(xué)成績在80分以上。在顯著性水平下,能否認(rèn)為這次的統(tǒng)計結(jié)果屬實? 解:由題意可知:這是一個關(guān)于單個總體比率的雙側(cè)假設(shè)檢驗問題,由于,故可用精確檢驗的方法進(jìn)行檢驗。設(shè)該班級學(xué)生成績達(dá)到80分以上的比率為p,x表示20名學(xué)生中成績達(dá)到80分以上的人數(shù),則。 現(xiàn)建立假設(shè): 拒絕域為:,下求和 由前面可知:為滿足的最大整數(shù),為滿足的最小整數(shù),又因故,又有故,所以拒絕域為,由于觀測值5不在拒絕域內(nèi),也就是說未落入

10、拒絕域,即接受原假設(shè),可以認(rèn)為這次的統(tǒng)計結(jié)果屬實。 例1.1.2 某工廠在一次對產(chǎn)品質(zhì)量的調(diào)查中顯示,該產(chǎn)生產(chǎn)的產(chǎn)品優(yōu)質(zhì)品率不低于,為了驗證這一結(jié)論,該產(chǎn)隨機(jī)從生產(chǎn)的產(chǎn)品中抽取了15件產(chǎn)品,其中發(fā)現(xiàn)有3件是優(yōu)質(zhì)品。問:在顯著性水平下,能否認(rèn)為這次的調(diào)查結(jié)果屬實?并給出檢驗的值。 解:由題意可知:這是一個關(guān)于總體比例的左側(cè)的假設(shè)檢驗。設(shè)表示該工廠產(chǎn)品的優(yōu)質(zhì)品率,表示抽取的15件產(chǎn)品中的優(yōu)質(zhì)品數(shù),則可有。 先建立假設(shè): 檢驗的拒絕域為:,下計算的值。 由于,所以可取,檢驗的拒絕域為,因題中得到的優(yōu)質(zhì)品數(shù)為3,未落入拒絕域,故接受原假設(shè),可以認(rèn)為這次的調(diào)查結(jié)果屬實。 本題也可通過計算檢驗的值得出結(jié)論

11、,用表示服從二項分布的隨機(jī)變量,則檢驗的值為:由于檢驗的P值,故接受原假設(shè),所以可以認(rèn)為這次的調(diào)查結(jié)果屬實。2.單個總體比率的大樣本檢驗及其應(yīng)用(1)設(shè)樣本取自兩點分布總體其中表示樣本比例,為對總體比率的某一假設(shè)值。當(dāng)很大,和都大于5時,樣本比例近似服從均值為,方差為的正態(tài)分布,而標(biāo)準(zhǔn)化檢驗統(tǒng)計量,則近似服從標(biāo)準(zhǔn)正態(tài)分布。 在給定顯著性水平的條件下,表1總結(jié)了大樣本情況下總體比例檢驗的一般方法。 表1.大樣本情況下單個總體比率的檢驗方法 雙側(cè)檢驗左側(cè)檢驗 右側(cè)檢驗假設(shè)形式檢驗統(tǒng)計量拒絕域(2)應(yīng)用例1.2.1政府在對消費(fèi)者的一項調(diào)查中表明,的居民的早餐飲料是牛奶。某一城市的牛奶商卻認(rèn)為,該城市

12、的居民早餐飲用牛奶的比例應(yīng)該更高。為了證明這一說法,該生產(chǎn)商隨機(jī)抽取了一個500人的隨機(jī)樣本,其中有120人早餐飲用牛奶。在的顯著水平下,檢驗該生產(chǎn)商的說法是否屬實? 解:由題意可知,這是一個右側(cè)檢驗。要證實生產(chǎn)商的說法是否屬實,即要證明早餐引用牛奶的人數(shù)比例是否大于,由于,樣本比例,大于30,和都大于5,故可用正態(tài)分布逼近。 現(xiàn)建立假設(shè): 檢驗統(tǒng)計量為: 由于,經(jīng)查表有,因為,落入了拒絕域,故拒絕原假設(shè),即該生產(chǎn)商的說法屬實,也就是可以認(rèn)為這個城市的拒絕早餐飲用牛奶的比例高于。 例1.2.2 某位關(guān)心空氣保護(hù)的公共福利社團(tuán)的代表人宣稱:“在工業(yè)發(fā)展日漸迅速的今天,空氣污染成了人們關(guān)心的大問題

13、。在某一工業(yè)區(qū)域內(nèi),能夠遵守政府制定的空氣污染標(biāo)準(zhǔn)法則的工廠不足,但是環(huán)境保護(hù)局的負(fù)責(zé)人卻認(rèn)為至少有的工廠是遵守這個標(biāo)準(zhǔn)法則的。因此這個環(huán)境保護(hù)局的負(fù)責(zé)人從這個工業(yè)區(qū)內(nèi)隨機(jī)選取了70家工廠,并且發(fā)現(xiàn)其中的42家是遵守這個法則的。在顯著性水平為下,驗證真正的比率是否少于? 解:由題意可知,此題為一左側(cè)檢驗。樣本比率,已知大于30,均大于5,故可以用正態(tài)分布逼近。 建立假設(shè): 檢驗統(tǒng)計量為: 由于,且,未落入拒絕域,因此不能否定原假設(shè),即使觀察的樣本比率少于,但也不能否定遵守法則的工廠的真正比率不少于這個原假設(shè),所以可以認(rèn)為,真正的比率并未少于。(二)兩個總體比率的假設(shè)檢驗 1.兩個總體比率之差的

14、精確檢驗及其應(yīng)用 2.兩個總體比率之差的大樣本檢驗及其應(yīng)用(1)設(shè)兩個獨(dú)立樣本和分別取自二項分布總體和,其中和分別為兩個獨(dú)立總體的比例,和分別為它們的樣本比例,且的數(shù)學(xué)期望和標(biāo)準(zhǔn)差分別為:在上式中,和分別表示兩個總體的樣本容量。當(dāng),和都大于或等于5時,由中心極限定理可知,近似地服從正態(tài)分布。由于兩個總體的比例和是未知的,則需要用兩個樣本的比例和估計,即兩個樣本比例之差抽樣分布的標(biāo)準(zhǔn)差。 此時有: 對于兩個總體比率之差的檢驗分為兩種情況:一種是檢驗兩個總體比率之差是否為0,當(dāng)原假設(shè)成立時,即的最佳估計量是將兩個樣本的結(jié)果聯(lián)合起來,得到一個合并的比例,其中,表示樣本1中具有某種特征單位的個數(shù),表示

15、樣本2中具有某種特征單位的個數(shù)。故兩個總體比率之差的檢驗統(tǒng)計量就可以表示為: 第二種情況是:兩個總體比率之差為某一不為0的常數(shù),即時,在這種情況下可以直接用兩個樣本的比例和相應(yīng)估計兩個總體的的比例和,繼而得到兩個總體比率之差的檢驗統(tǒng)計量為:,由上面的推導(dǎo)計算可以將兩個總體比率之差的大樣本檢驗方法概括在表2中。 表2.兩個總體比率的大樣本檢驗方法雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式檢驗統(tǒng)計量檢驗 檢驗 拒絕域(2)應(yīng)用例2.2.1 政府對某一行業(yè)的兩個公司進(jìn)行了一項調(diào)查,調(diào)查內(nèi)容為這兩個公司的員工是希望得到特定增加的基本工資,還是希望得到特定增加的各種福利費(fèi)用。在A公司隨機(jī)抽取的180名員工中,有8

16、0人愿意增加各種福利費(fèi)用;在B公司隨機(jī)抽取的250名員工中,有120人希望增加各種福利費(fèi)用。在顯著水平下,是否可以認(rèn)為這兩個公司中希望增加各種福利費(fèi)用的員工比例有顯著差異? 解:由題意可知,這是一個兩個總體比例是否為0的假設(shè)檢驗。已知,。 建立假設(shè): 檢驗統(tǒng)計量為: 由于,拒絕域為,又,未落入拒絕域內(nèi),故接受原假設(shè),可以認(rèn)為兩個公司中希望增加各種福利費(fèi)用的員工比例沒有顯著差異。 例2.2.2 為了發(fā)展旅游事業(yè),一些介紹當(dāng)?shù)芈糜挝幕穆糜问謨?,都由?dāng)局的旅游管理部門向有需要的旅游者免費(fèi)提供。有研究人員表明,需要旅游手冊的旅游者與不需要旅游手冊的旅游者在各個旅游消費(fèi)方面存在著一些差異?,F(xiàn)有兩個由3

17、66名需要旅游手冊者與488名不需要旅游手冊者組成的隨即樣本,對于樣本中的成員最近一次離家三天或三天以上的度假或是愉悅的旅行提出幾個問題。其一為:“就這次旅行來說,你個人認(rèn)為是積極的(即包括一些刺激,具有挑戰(zhàn)性的事件或有意義的教育活動),還是消極的(大多數(shù)時間用于休息和放松)?”在下表中給出了消極度假的人數(shù),現(xiàn)根據(jù)給出的數(shù)據(jù)是否能說明,需要旅游手冊者消極度假的可能性比不需要旅游手冊者?。浚ǎ?。手冊需要者手冊不需要者被檢查人數(shù)366488消極度假人數(shù)280420 解:由題意可知:這也是一個兩個總體比率之差是否為0的假設(shè)檢驗。已知:,。 現(xiàn)建立假設(shè): 檢驗統(tǒng)計量為: 由于,這是一個左側(cè)檢驗,因,落入了拒絕域,故拒絕原假設(shè),所以可以說明需要旅游手冊者消極度假的可能性比不需要旅游手冊者小。甲車間乙車間樣本數(shù)200220不合格品數(shù)160165 例2.2.3 在某工廠的一項質(zhì)量調(diào)查結(jié)果中表明,該廠的甲車間生產(chǎn)的產(chǎn)品里不合格品的比率比乙車間生產(chǎn)的產(chǎn)品里不合格品的比率大,現(xiàn)從甲乙兩個車間隨機(jī)抽取兩個獨(dú)立樣本,其中從家車間抽取200個產(chǎn)品,不合格品數(shù)為160個;從乙車間抽取220個產(chǎn)品,不合格品數(shù)為165

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論