概率論與數(shù)理統(tǒng)計(jì)ch8假設(shè)檢驗(yàn)_第1頁
概率論與數(shù)理統(tǒng)計(jì)ch8假設(shè)檢驗(yàn)_第2頁
概率論與數(shù)理統(tǒng)計(jì)ch8假設(shè)檢驗(yàn)_第3頁
概率論與數(shù)理統(tǒng)計(jì)ch8假設(shè)檢驗(yàn)_第4頁
概率論與數(shù)理統(tǒng)計(jì)ch8假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩129頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1第八章假設(shè)檢驗(yàn)

關(guān)鍵詞: 假設(shè)檢驗(yàn) 正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)擬合優(yōu)度檢驗(yàn)

28.1假設(shè)檢驗(yàn)

統(tǒng)計(jì)推斷的另一類重要問題是假設(shè)檢驗(yàn)問題。它包括(1)已知總體分布的形式,需對(duì)其中的未知參數(shù)給出假設(shè)檢驗(yàn).—參數(shù)檢驗(yàn)(2)總體的分布形式完全未知的情況下,對(duì)總體的分布或數(shù)字特征進(jìn)行假設(shè)檢驗(yàn).—非參數(shù)檢驗(yàn)例1

設(shè)某種清漆的9個(gè)樣品,其干燥時(shí)間(以小時(shí)計(jì))分別為:

6.05.75.56.57.05.85.26.15.0

根據(jù)以往經(jīng)驗(yàn),干燥時(shí)間的總體服從正態(tài)分布N(6.0,0.36),現(xiàn)根據(jù)樣本檢驗(yàn)均值是否與以往有顯著差異?(一)問題的提出例2

一種攝影藥品被其制造商聲稱其貯藏壽命是均值180天、標(biāo)準(zhǔn)差不多于10天的正態(tài)分布。某位使用者擔(dān)心標(biāo)準(zhǔn)差可能超過10天。他隨機(jī)選取12個(gè)樣品并測(cè)試,得到樣本標(biāo)準(zhǔn)差為14天。根據(jù)樣本有充分證據(jù)證明標(biāo)準(zhǔn)差大于10天嗎?5例3

孟德爾遺傳理論斷言,當(dāng)兩個(gè)品種的豆雜交時(shí),圓的和黃的、起皺的和黃的、圓的和綠的、起皺的和綠的豆的頻數(shù)將以比例9:3:3:1發(fā)生。在檢驗(yàn)這個(gè)理論時(shí),孟德爾分別得到頻數(shù)315、101、108、32、這些數(shù)據(jù)提供充分證據(jù)拒絕該理論嗎?假設(shè):(二)檢驗(yàn)統(tǒng)計(jì)量和拒絕域?qū)?的統(tǒng)計(jì)分析(三)兩類錯(cuò)誤由于樣本的隨機(jī)性,任一檢驗(yàn)規(guī)則在應(yīng)用時(shí),都有可能發(fā)生錯(cuò)誤的判斷。第I類錯(cuò)誤:拒絕真實(shí)的原假設(shè)(棄真)第II類錯(cuò)誤:接受錯(cuò)誤的原假設(shè)(取偽)原假設(shè)為真原假設(shè)不真根據(jù)樣本拒絕原假設(shè)第I類錯(cuò)誤正確根據(jù)樣本接受原假設(shè)正確第II類錯(cuò)誤171920處理假設(shè)檢驗(yàn)問題的基本步驟

8.2單個(gè)正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)293031323334思考題:比較與你能寫出右邊假設(shè)問題檢驗(yàn)的拒絕域嗎?363738394041424344例

某種元件的壽命X(以小時(shí)記)服從正態(tài)分布均未知?,F(xiàn)測(cè)得16只元件的壽命如下:

280101212224379179264222362168250149260485170問是否有理由認(rèn)為元件的平均壽命大于225(小時(shí))?(取顯著性水平為0.05)沒有落在拒絕域內(nèi),故不能拒絕原假設(shè),認(rèn)為元件的平均壽命不大于225小時(shí)。問:若將原假設(shè)和備擇假設(shè)互換,即考慮左邊檢驗(yàn)檢驗(yàn)結(jié)果怎么樣?請(qǐng)給出合理的解釋。一般地,在有關(guān)參數(shù)的假設(shè)檢驗(yàn)中,備擇假設(shè)是我們根據(jù)樣本資料希望得到支持的假設(shè)。49例3

要求某種元件的平均使用壽命不得低于1000小時(shí),生產(chǎn)者從一批這種元件中隨機(jī)抽取25件,測(cè)得其平均壽命為950小時(shí),標(biāo)準(zhǔn)差為100小時(shí)。已知這批元件的壽命服從正態(tài)分布。試在顯著性水平0.05下確定這批元件是否合格?50t落在拒絕域內(nèi),故拒絕原假設(shè),認(rèn)為這批元件的平均壽命小于1000小時(shí),不合格。525355例4:為了試驗(yàn)兩種不同谷物種子的優(yōu)劣,選取了十塊土質(zhì)不同的土地,并將每塊土地分為面積相同的兩部分,分別種植這兩種種子。設(shè)在每塊土地的兩部分人工管理等條件完全一樣。下面給出各塊土地上的產(chǎn)量。

土地12345678910種子A(xi)23352942392937343528種子B(yi)26393540382436274127di=xi-yi-3-4-621517-61問:以這兩種種子種植的谷物產(chǎn)量是否有顯著的差異(取顯著性水平為0.05)?5657在Excel中的實(shí)現(xiàn)-------TTEST函數(shù)本例的分析步驟如下:(1)

將兩品種種子的產(chǎn)量數(shù)據(jù)輸入Excel表中,設(shè)數(shù)據(jù)區(qū)域分別為A1:A10和B1:B10;(2)下拉菜單“插入”選項(xiàng)卡═>單擊“函數(shù)”═>在類別的下拉式菜單中選擇“統(tǒng)計(jì)”═>選“TTEST”;(3)

在“Array1”文本框中輸入“A1:A10”,在“Array2”文本框中輸入“B1:B10”,“Tails”文本框中輸入”2”(“1”代表單尾概率,”2”代表雙尾概率),“Type”文本框中輸入“1”(“1”代表成對(duì)數(shù)據(jù)的t檢驗(yàn),“2”代表方差齊性的兩樣本t檢驗(yàn),“3”代表異方差的兩樣本t檢驗(yàn));(4)點(diǎn)擊Enter鍵,即顯示P_值為“0.889921”,因此認(rèn)為兩品種種子產(chǎn)量沒有顯著差異。60616263656667從資料來看想要支持的結(jié)論是:新品種蘋果的重量差異小68例2

一種攝影藥品被其制造商聲稱其貯藏壽命是均值180天、標(biāo)準(zhǔn)差不多于10天的正態(tài)分布。某位使用者擔(dān)心標(biāo)準(zhǔn)差可能超過10天。他隨機(jī)選取12個(gè)樣品并測(cè)試,得到樣本標(biāo)準(zhǔn)差為14天。根據(jù)樣本有充分證據(jù)證明標(biāo)準(zhǔn)差大于10天嗎?(取顯著水平為0.05)70717273747576777879808182838485

例7:某廠使用兩種不同的原料A,B生產(chǎn)同一類型產(chǎn)品。各在一周的產(chǎn)品中取樣分析。取用原料A生產(chǎn)的樣品220件,測(cè)得平均重量為2.46(公斤),樣本標(biāo)準(zhǔn)差s=0.57(公斤)。取用原料B生產(chǎn)的樣品205件,測(cè)得平均重量為2.55(公斤),樣本標(biāo)準(zhǔn)差為0.48(公斤)。設(shè)兩樣本獨(dú)立,來自兩個(gè)方差相同的獨(dú)立正態(tài)總體。問在水平0.05下能否認(rèn)為用原料B的產(chǎn)品平均重量μ2較用原料A的產(chǎn)品平均重量μ1為大。

8687(二)比較兩個(gè)正態(tài)總體方差的檢驗(yàn)888990

例7:兩臺(tái)機(jī)床生產(chǎn)同一個(gè)型號(hào)的滾珠,從甲機(jī)床生產(chǎn)的滾珠中抽取8個(gè),從乙機(jī)床生產(chǎn)的滾珠中抽取9個(gè),測(cè)得這些滾珠的直徑(毫米)如下:甲機(jī)床15.014.815.215.414.915.115.214.8乙機(jī)床15.215.014.815.114.614.815.114.515.091929394在Excel中的實(shí)現(xiàn)----FTSET函數(shù)和TTEST函數(shù)

利用FTSET函數(shù)作方差齊性檢驗(yàn),再利用TTEST函數(shù)進(jìn)行兩樣本的均值比較。本例的分析步驟如下:(1)

將兩組數(shù)據(jù)輸入Excel表中,設(shè)數(shù)據(jù)區(qū)域分別為A1:A8和B1:B9;(2)下拉菜單“插入”選項(xiàng)卡═>單擊“函數(shù)”═>在類別的下拉式菜單中選擇“統(tǒng)計(jì)”═>選“FTEST”;(3)

在“Array1”文本框中輸入“A1:A8”,在“Array2”文本框中輸入“B1:B9”,并點(diǎn)擊Enter鍵,即顯示P_值為“0.7752”,因此認(rèn)為兩總體方差相同.(4)重新下拉菜單“插入”選項(xiàng)卡═>單擊“函數(shù)”═>在類別的下拉式菜單中選擇“統(tǒng)計(jì)”═>選“TTEST”;(5)

在“Array1”文本框中輸入“A1:A8”,在“Array2”文本框中輸入“B1:B9”,“Tails”文本框中輸入”1”(“1”代表單尾概率,”2”代表雙尾概率),“Type”文本框中輸入“2”(“1”代表成對(duì)數(shù)據(jù)的t檢驗(yàn),“2”代表方差齊性的兩樣本t檢驗(yàn),“3”代表異方差的兩樣本t檢驗(yàn));(6)點(diǎn)擊Enter鍵,即顯示P_值為“0.0979”,因此在顯著水平為0.1下,拒絕原假設(shè)(7)

若在步驟(5)中的“Tails”文本框中輸入”2”,并點(diǎn)擊Enter鍵,即顯示P_值為“0.19587”,因此在顯著水平0.1下,接受原假設(shè)1008.4假設(shè)檢驗(yàn)與區(qū)間估計(jì)作假設(shè)檢驗(yàn)時(shí),對(duì)參數(shù)有一個(gè)先驗(yàn)的認(rèn)識(shí)(例如μ=μ0),但由于某種情形的出現(xiàn)(如工藝改良等),猜測(cè)真實(shí)參數(shù)值可能發(fā)生了變化,所以假設(shè)檢驗(yàn)的目的是:根據(jù)樣本確認(rèn)參數(shù)是否真的發(fā)生了改變。作區(qū)間估計(jì)時(shí),對(duì)參數(shù)沒有先驗(yàn)的認(rèn)識(shí),但確定參數(shù)是固定不變的,只是未知,所以區(qū)間估計(jì)的目的是:根據(jù)樣本對(duì)參數(shù)進(jìn)行估計(jì);但置信區(qū)間與假設(shè)檢驗(yàn)的拒絕域之間又有密切的關(guān)系。101102103104105106107108109110待估參數(shù)

原假設(shè)樞軸量

檢驗(yàn)統(tǒng)計(jì)量

分布置信區(qū)間拒絕域

一個(gè)正態(tài)總體兩個(gè)正態(tài)總體正態(tài)總體均值、方差的置信區(qū)間與假設(shè)檢驗(yàn)1128.5擬合優(yōu)度檢驗(yàn)

前面介紹的各種檢驗(yàn)都是在總體服從正態(tài)分布前提下,對(duì)參數(shù)進(jìn)行假設(shè)檢驗(yàn)的。實(shí)際中可能遇到這樣的情形,總體服從何種理論分布并不知道,要求我們直接對(duì)總體分布提出一個(gè)假設(shè)。113

例如,要檢驗(yàn)在計(jì)算機(jī)上產(chǎn)生隨機(jī)數(shù)的一個(gè)程序。指令該程序產(chǎn)生0到9之間的100個(gè)單個(gè)數(shù)字。觀察整數(shù)的頻數(shù)如下表。那么以0.05的顯著性水平,有充分的理由相信該批整數(shù)不是均勻產(chǎn)生的嗎?整數(shù)0123456789頻數(shù)1187710108111414114

例如,從1500到1931年的432年間,每年爆發(fā)戰(zhàn)爭(zhēng)的次數(shù)可以看作一個(gè)隨機(jī)變量,據(jù)統(tǒng)計(jì),這432年間共爆發(fā)了299次戰(zhàn)爭(zhēng),具體數(shù)據(jù)如下:戰(zhàn)爭(zhēng)次數(shù)X01234發(fā)生X次戰(zhàn)爭(zhēng)的年數(shù)22314248154通常假設(shè)每年爆發(fā)戰(zhàn)爭(zhēng)的次數(shù)服從泊松分布。那么上面的數(shù)據(jù)是否有充分的理由推翻每年爆發(fā)戰(zhàn)爭(zhēng)的次數(shù)服從泊松分布假設(shè)?115注意:在擬合優(yōu)度檢驗(yàn)中,一般地,把想要支持結(jié)論放在原假設(shè)。116117118119120121

例:從1500到1931年的432年間,每年爆發(fā)戰(zhàn)爭(zhēng)的次數(shù)可以看作一個(gè)隨機(jī)變量,據(jù)統(tǒng)計(jì),這432年間共爆發(fā)了299次戰(zhàn)爭(zhēng),具體數(shù)據(jù)如下:戰(zhàn)爭(zhēng)次數(shù)X01234發(fā)生X次戰(zhàn)爭(zhēng)的年數(shù)22314248154通常假設(shè)每年爆發(fā)戰(zhàn)爭(zhēng)的次數(shù)服從泊松分布。那么上面的數(shù)據(jù)是否有充分的理由推翻每年爆發(fā)戰(zhàn)爭(zhēng)的次數(shù)服從泊松分布假設(shè)?122戰(zhàn)爭(zhēng)次數(shù)x01234實(shí)測(cè)頻數(shù)22314248154概率估計(jì)0.5020.3460.1190.0270.006理論頻數(shù)21714951123124例2

孟德爾遺傳理論斷言,當(dāng)兩個(gè)品種的豆雜交時(shí),圓的和黃的、起皺的和黃的、圓的和綠的、起皺的和綠的豆的頻數(shù)將以比例9:3:3:1發(fā)生。在檢驗(yàn)這個(gè)理論時(shí),孟德爾分別得到頻數(shù)315、101、108、32、這些數(shù)據(jù)提供充分證據(jù)拒絕該理論嗎?125126豆子狀態(tài)x1234實(shí)測(cè)頻數(shù)31510110832

概率9/163/163/161/16理論頻數(shù)312.75104.25104.2534.75127141148132138154142150146155158150140147148144150149145149158143141144144126140144142141140145135147146141136140146142137148154137139143140131143141149148135148152143144141143147146150132142142143153149146149138142149142137134144146147140142140137152145例3

下面列出了84個(gè)伊特拉斯坎(Etruscan)人男子的頭顱的最大寬度(mm),試檢驗(yàn)這些數(shù)據(jù)是否來自正態(tài)總體(取α=0.1)128解為粗略了解數(shù)據(jù)的分布情況,先畫出直方圖。步驟如下:1.找出數(shù)據(jù)的最小值、最大值為126、158,取區(qū)間[124.5,159.5],它能覆蓋[126,158];2.將區(qū)間[124.5,159.5]等分為7個(gè)小區(qū)間,小區(qū)間的長度Δ=(159.5-124.5)/7=5,Δ稱為組距,小區(qū)間的端點(diǎn)稱為組限,建立下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論