本章主要內(nèi)容.doc_第1頁
本章主要內(nèi)容.doc_第2頁
本章主要內(nèi)容.doc_第3頁
本章主要內(nèi)容.doc_第4頁
本章主要內(nèi)容.doc_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

“假設(shè)檢驗”-統(tǒng)計學(xué)第七章講稿 本章主要內(nèi)容 第一節(jié):假設(shè)檢驗的一般問題;第二節(jié):總體均值的參數(shù)檢驗;第三節(jié):總體成數(shù)的參數(shù)檢驗;第四節(jié):總體方差的參數(shù)檢驗假設(shè)檢驗與參數(shù)估計一齊構(gòu)成推斷統(tǒng)計學(xué)的主要內(nèi)容第一節(jié) 假設(shè)檢驗的一般問題主要討論:假設(shè)檢驗的概念、假設(shè)檢驗的步驟、假設(shè)檢驗中的小概率原理、假設(shè)檢驗中的兩類錯誤和雙側(cè)檢驗單側(cè)檢驗所謂假設(shè)檢驗就是對一個關(guān)于總體參數(shù)或總體分布形式的假設(shè),利用樣本資料來檢驗其真或偽的可能性。對總體參數(shù)(平均數(shù)、成數(shù)、方差等)所作的假設(shè)進(jìn)行檢驗稱為參數(shù)假設(shè)檢驗,簡稱參數(shù)檢驗(parametric tests);對總體分布形式的假設(shè)進(jìn)行檢驗一般稱為非參數(shù)檢驗或自由分布檢驗。這里只討論總體參數(shù)的假設(shè)檢驗,即參數(shù)檢驗。例 某品牌飲料紙包裝上標(biāo)明的容量為250毫升,標(biāo)準(zhǔn)差為4毫升。消費者協(xié)會從市場上隨機(jī)抽取50盒該飲料,發(fā)現(xiàn)其平均含量僅為248毫升。據(jù)此,可否斷定飲料廠商欺騙了消費者?解:樣本均值低于廠商聲稱的平均含量,其原因有兩種:一是由抽樣誤差引起的,這時樣本均值與總體均值之差不會超出一定的抽樣誤差范圍(以抽樣平均誤差的若干倍度量);二是由飲料廠商短斤少兩引起,這時樣本均值與總體均值之差就會超出一定的抽樣誤差范圍。抽樣誤差范圍是與概率保證程度相聯(lián)系的。對于正態(tài)分布總體,若取概率保證程度為99%,則樣本均值與總體均值之差大于抽樣平均誤差的-2.58倍即發(fā)生的概率只有1%,這是個小概率事件。對于一次抽樣而言,可認(rèn)為小概率事件實際上不會發(fā)生。若假設(shè)本例總體均值=250也就是說,對于一次抽樣的結(jié)果,小概率事件卻發(fā)生了,這是不合常理的。從樣本信息看應(yīng)拒絕這一假設(shè),即紙包裝飲料的容量不足250毫升,廠商有欺詐故意。 假設(shè)檢驗的基本思想是:先做出一個假設(shè),然后依據(jù)小概率事件在一次抽樣中實際上不會發(fā)生的推斷原則,看這一假設(shè)是否會導(dǎo)致不合理的結(jié)果,從而判斷是否拒絕原假設(shè)。假設(shè)檢驗的步驟:1. 提出原假設(shè)(Null Hypothesis)和備擇假設(shè)(Alternative Hypothesis)原假設(shè)又稱零假設(shè),是對未知總體參數(shù)做出的、正待檢驗的假設(shè)。備擇假設(shè)是對立假設(shè),其含義是,一旦否定原假設(shè),這個假設(shè)供你選擇。根據(jù)具體問題,備擇假設(shè)可由三種選擇:(1)備擇假設(shè):,這種類型的假設(shè)檢驗稱為雙側(cè)檢驗。(2)備擇假設(shè):,這種類型的假設(shè)檢驗稱為右側(cè)檢驗。(3)備擇假設(shè):,這種類型的假設(shè)檢驗稱為左側(cè)檢驗。2. 設(shè)計檢驗統(tǒng)計量所設(shè)計的檢驗統(tǒng)計量應(yīng)與原假設(shè)相關(guān)即與待檢驗的參數(shù)相關(guān),且能夠知道當(dāng)原假設(shè)為真時該統(tǒng)計量的具體分布。3. 給定顯著性水平和確定相應(yīng)的臨界值顯著性水平表示假設(shè)為真時拒絕原假設(shè)的概率,也就是拒絕原假設(shè)所冒的風(fēng)險,用表示。一般取值很小,常取0.1、0.05、0.01。給定了顯著性水平,也就確定了原假設(shè)的接受區(qū)域和拒絕區(qū)域。這兩個區(qū)域的交界點就是臨界值。4. 依據(jù)假設(shè)檢驗的規(guī)則,由樣本資料計算出檢驗統(tǒng)計量的實際值,與臨界值比較,視實際值落入接受區(qū)域還是拒絕區(qū)域,做出接受或拒絕原假設(shè)的結(jié)論。假設(shè)檢驗中,拒絕原假設(shè)是在認(rèn)為小概率事件在一次抽樣中實際上不會發(fā)生的前提下做出的,事實上小概率事件有時也可能發(fā)生;接受原假設(shè),是因為拒絕它的理由還不充分,并非認(rèn)為它絕對正確。因此,由假設(shè)檢驗做出的判斷不可能百分之百正確。一般來說,決策結(jié)果可歸納以下四種情況:假設(shè)檢驗決策結(jié)果表是真實的是不真實的拒絕第類錯誤()正確接受正確第類錯誤()由假設(shè)檢驗做出的決策既可能犯“棄真錯誤”又可能犯“取偽錯誤”。“棄真錯誤”稱作假設(shè)檢驗的“第類錯誤”,“取偽錯誤”稱作假設(shè)檢驗的“第類錯誤”。假設(shè)檢驗犯第類錯誤的原因是,在原假設(shè)為真的情況下,檢驗統(tǒng)計量不巧剛好落入小概率的拒絕區(qū)域。因而,第類錯誤發(fā)生的概率就是顯著性水平。第類錯誤發(fā)生的概率記為。概率與是密切相關(guān)的,在樣本一定的條件下,減小,就增大了;反之,亦然。這里用法庭對被告進(jìn)行審判的實例來說明。由于法庭采用無罪推定的審判準(zhǔn)則,在證明被告有罪之前先假定他是無罪的,即原假設(shè):被告無罪,備擇假設(shè):被告有罪。法庭可能犯的第類錯誤是:被告無罪但判他有罪,即冤枉了好人;第類錯誤是:被告有罪但判他無罪,即放過了壞人。為了減少冤枉好人的概率,應(yīng)盡可能接受原假設(shè),判被告無罪,而這有可能增大了放過壞人的概率;反過來,為了不放過壞人,減少放過壞人的概率,相應(yīng)地就又增加了冤枉好人的可能性。當(dāng)然,這只是在一定的證據(jù)下的兩難選擇。如果進(jìn)一步收集有關(guān)的證據(jù),在充分的證據(jù)下,就有可能做到既不冤枉好人,又不放過壞人。鑒于犯第類與第類錯誤的概率與的相互關(guān)系,在一定的樣本容量下,期望兩者都非常小是困難的。從而,在假設(shè)檢驗中,內(nèi)曼(J. Neyman)和皮爾生(Egon S. Pearson)提出了一個原則,即在控制犯第類錯誤的概率的條件下,盡可能使犯第類錯誤的概率減小。在假設(shè)檢驗實踐中,該原則的含義是,原假設(shè)要受到維護(hù),使它不致被輕易否定,若要否定原假設(shè),必須有充分的理由。第二節(jié) 總體均值的參數(shù)檢驗一、單個正態(tài)總體均值的檢驗樣本來自正態(tài)總體(一) 如果總體方差已知-檢驗構(gòu)造檢驗統(tǒng)計量: 當(dāng)時,服從。給定顯著性水平,則有(1) 檢驗規(guī)則為:當(dāng)時,拒絕;當(dāng)時,不能拒絕(2) 檢驗規(guī)則為:當(dāng)時,拒絕;當(dāng)時,不能拒絕(3) 檢驗規(guī)則為:當(dāng)時,拒絕;當(dāng)時,不能拒絕【例】某機(jī)床廠加工一種零件,根據(jù)經(jīng)驗知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為m0=0.081mm,總體標(biāo)準(zhǔn)差為s = 0.025 。今換一種新機(jī)床進(jìn)行加工,抽取n=200個零件進(jìn)行檢驗,得到的橢圓度為0.076mm。試問新機(jī)床加工零件的橢圓度的均值與以前有無顯著差異?(a0.05)【解】依題意建立假設(shè):0.081 :0.081根據(jù)檢驗統(tǒng)計量 =0.05,則由標(biāo)準(zhǔn)正態(tài)分布表,得。從而拒絕。有證據(jù)表明新機(jī)床加工的零件的橢圓度與以前有顯著差異【例】某企業(yè)職工上月平均獎金為402元,本月隨機(jī)抽取50人來調(diào)查,其平均獎金為412.4元?,F(xiàn)假定本月職工收入服從正態(tài)分布,問在0.05的顯著性水平下,能否認(rèn)為該企業(yè)職工平均獎金本月比上月有明顯提高?【解】依題意建立假設(shè):402 :402檢驗統(tǒng)計量 顯著性水平=0.05,則由標(biāo)準(zhǔn)正態(tài)分布表,得。從而拒絕,即認(rèn)為該企業(yè)職工平均獎金本月比上月有明顯提高。(二) 如果總體方差未知-檢驗構(gòu)造檢驗統(tǒng)計量: 其中是樣本標(biāo)準(zhǔn)差 (7.2)當(dāng)時,根據(jù)抽樣分布理論,統(tǒng)計量服從。給定顯著性水平,則有(1) 檢驗規(guī)則為:當(dāng)時,拒絕;當(dāng)時,不能拒絕(2) 檢驗規(guī)則為:當(dāng)時,拒絕;當(dāng)時,不能拒絕(3) 檢驗規(guī)則為:當(dāng)時,拒絕;當(dāng)時,不能拒絕【例】某廠采用自動包裝機(jī)分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,每包標(biāo)準(zhǔn)重量為1000克。某日隨機(jī)抽查9包,測得樣本平均重量為986克,樣本標(biāo)準(zhǔn)差為24克。試問在0.05的顯著性水平上,能否認(rèn)為這天自動包裝機(jī)工作正常?【解】依題意建立假設(shè): :根據(jù)檢驗統(tǒng)計量 顯著性水平=0.05,則由分布表,得。從而不能拒絕,沒有證據(jù)表明這天自動包裝機(jī)工作不正常。t檢驗一般用于小樣本檢驗,往往是已知服從正態(tài)總體但方差未知。隨著樣本容量n(30)的增大,t分布趨近于標(biāo)準(zhǔn)正態(tài)分布。所以在大樣本情形下,總體方差未知時對總體均值的假設(shè)檢驗可近似采用z檢驗。對于非正態(tài)總體,大樣本的情況下,在對總體均值假設(shè)檢驗時,也可采用z檢驗,如果未知,可以用s替代。二、兩個正態(tài)總體均值之差的檢驗樣本來自正態(tài)總體,來自正態(tài)總體(一) 如果兩個總體方差和已知構(gòu)造檢驗統(tǒng)計量: 當(dāng)時,服從。因此,采用檢驗。【例】 假設(shè)某種羊毛的含脂率服從正態(tài)分布,且處理前后的方差均為36。處理前采10個樣,測得平均含脂率為27.3,處理后采8個樣,測得平均含脂率為13.75,問處理前后羊毛含脂率有無顯著變化()?解 依題意建立假設(shè): :根據(jù)檢驗統(tǒng)計量(7.3) 由標(biāo)準(zhǔn)正態(tài)分布表,得。從而拒絕,即認(rèn)為處理前后羊毛含脂率有顯著變化。(二) 如果兩個總體方差和未知但相等構(gòu)造檢驗統(tǒng)計量: (7.4)其中:當(dāng)時,服從。因此,采用檢驗?!纠磕硰U水中的鎘含量服從正態(tài)分布,現(xiàn)用標(biāo)準(zhǔn)方法與新方法同時測定該樣本中鎘含量。其中新方法測定10次,平均測定結(jié)果為5.28ug/L,標(biāo)準(zhǔn)差為1.11ug/L;標(biāo)準(zhǔn)方法測定9次,平均測定結(jié)果為4.03ug/L,標(biāo)準(zhǔn)差為1.04ug/L。問兩種測定結(jié)果有無顯著性差異?【解】依題意建立假設(shè): :根據(jù)檢驗統(tǒng)計量(7.4) 取顯著性水平=0.05,。從而,拒絕,即認(rèn)為兩種測定結(jié)果有顯著性差異。三、兩個非正態(tài)總體均值之差的檢驗樣本和來自兩個非正態(tài)總體,當(dāng)樣本容量和較大()時構(gòu)造檢驗統(tǒng)計量:或 當(dāng)時,服從或近似服從。因此,兩個非正態(tài)總體均值之差的檢驗可采用檢驗。第三節(jié) 總體成數(shù)的參數(shù)檢驗一、單個總體成數(shù)的檢驗所謂成數(shù)是指具有某一特征的總體單位在總體中所占的比重,用表示。如果將具有該特征的總體單位賦值“1”,不具有該特征的總體單位賦值“0”,則成數(shù)為總體均值,相應(yīng)的總體方差為(1-)。同理,樣本成數(shù)是一種樣本均值。在大樣本情況下,并且、,根據(jù)中心極限定理,樣本成數(shù)服從。構(gòu)造檢驗統(tǒng)計量 當(dāng)時,服從標(biāo)準(zhǔn)正態(tài)分布,因此,總體成數(shù)的檢驗采用檢驗。【例】某研究者估計本市居民家庭的電腦擁有率為30%?,F(xiàn)隨機(jī)抽查了200的家庭,其中68個家庭擁有電腦。試問研究者的估計是否可信?(a = 0.05)【解】依題意建立假設(shè):=30% :30%根據(jù)檢驗統(tǒng)計量 因為,從而不能拒絕,即沒有證據(jù)表明研究者的估計不可信。【例】某公司負(fù)責(zé)人發(fā)現(xiàn)開出去的發(fā)票有大量筆誤,而且斷定這些發(fā)票中,錯誤的發(fā)票占20%以上。隨機(jī)檢查400張,發(fā)現(xiàn)錯誤的發(fā)票占25%。這是否可以證明負(fù)責(zé)人的判斷正確(顯著性水平為0.05)?【解】依題意建立假設(shè):0.2 :0.2根據(jù)檢驗統(tǒng)計量(7.6) 因為,從而拒絕,即認(rèn)為負(fù)責(zé)人的判斷正確。二、兩個總體成數(shù)之差的檢驗在大樣本條件下,兩個樣本成數(shù)之差的抽樣分布近似為正態(tài)分布。若令由于含有未知參數(shù)和,所以不能成為檢驗統(tǒng)計量。當(dāng)=時,和的聯(lián)合估計值為,故標(biāo)準(zhǔn)差的估計值為:取檢驗統(tǒng)計量 于是,在大樣本條件下,當(dāng)=時,近似服從標(biāo)準(zhǔn)正態(tài)分布。因此,兩個總體成數(shù)之差的檢驗可采用檢驗?!纠?.10】為了研究地勢對小麥銹病發(fā)病率的影響,調(diào)查了低洼地麥田小麥378株,其中銹病株342株,還調(diào)查了高坡地麥田小麥396株,其中銹病株313株。若取顯著性水平為0.01,比較兩塊麥田小麥銹病發(fā)病率是否有顯著差異?!窘狻恳李}意建立假設(shè) , 根據(jù)檢驗統(tǒng)計量(7.7) 取=0.01,=2.58,從而拒絕,即認(rèn)為兩塊麥田小麥銹病發(fā)病率有顯著差異。第四節(jié) 總體方差的參數(shù)檢驗一、一個正態(tài)總體方差的檢驗總體方差是用樣本方差來估計的。根據(jù)抽樣分布理論,檢驗統(tǒng)計量 服從。給定顯著性水平,則有:(1) 檢驗規(guī)則為:當(dāng)或時拒絕,否則不能拒絕(2) 檢驗規(guī)則為:當(dāng)時拒絕,否則不能拒絕(3) 檢驗規(guī)則為:當(dāng)拒絕,否則不能拒絕【例】根據(jù)長期正常生產(chǎn)的資料可知,某廠所產(chǎn)維尼綸的纖度服從正態(tài)分布,其方差為0.0025?,F(xiàn)從某日產(chǎn)品中隨機(jī)抽取20根,測得樣本方差為0.0042。試判斷該日纖度的波動與平日有無顯著差異?(顯著性水平為0.05)?【解】依題意建立假設(shè) 根據(jù)檢驗統(tǒng)計量顯著性水平,接受域為8.907,32.852,因此,不能拒絕原假設(shè)。二、兩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論