假設檢驗與方差分析_第1頁
假設檢驗與方差分析_第2頁
假設檢驗與方差分析_第3頁
假設檢驗與方差分析_第4頁
假設檢驗與方差分析_第5頁
已閱讀5頁,還剩83頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第六章

假設檢驗與方差分析主講人:馬嵐1參數(shù)估計和假設檢驗是統(tǒng)計推斷的兩個組成局部,它們都是利用樣本對總體進行某種推斷,然而推斷的角度不同。參數(shù)估計討論的是用樣本統(tǒng)計量估計總體參數(shù)的方法,總體參數(shù)在估計前是未知的。而在參數(shù)假設檢驗中,那么是先對總體參數(shù)的值提出一個假設,然后利用樣本信息去檢驗這個假設是否成立。因此,本章所討論的內(nèi)容,是如何利用樣本信息,對假設成立與否做出判斷的一套程序。2假設檢驗在統(tǒng)計方法中的地位統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設檢驗3本章內(nèi)容介紹第一節(jié)假設檢驗的根本原理第二節(jié)總體均值的假設檢驗第三節(jié)總體比例的假設檢驗第四節(jié)總體方差的假設檢驗第五節(jié)單因子方差分析4★§1假設檢驗的根本原理5一、假設檢驗的概念所謂假設檢驗,就是事先對總體的參數(shù)或總體分布形式做出一個假設,然后利用抽取的樣本信息來判斷這個假設〔原假設〕是否合理,即判斷總體的真實情況與原假設是否存在顯著的系統(tǒng)性差異,所以假設檢驗又被稱為顯著性檢驗。67二、假設檢驗的步驟一個完整的假設檢驗過程,包括以下幾個步驟:〔1〕提出假設;〔2〕構(gòu)造適當?shù)臋z驗統(tǒng)計量,并根據(jù)樣本計算統(tǒng)計量的具體數(shù)值;〔3〕規(guī)定顯著性水平,建立檢驗規(guī)那么;〔4〕做出判斷。8〔一〕提出原假設和備擇假設原假設一般用H0表示,通常是設定總體參數(shù)等于某值,或服從某個分布函數(shù)等;備擇假設是與原假設互相排斥的假設,原假設與備擇假設不可能同時成立。所謂假設檢驗問題實質(zhì)上就是要判斷H0是否正確,假設拒絕原假設H0,那么意味著接受備擇假設H1。在假設檢驗中,“=〞總是放在原假設上。見下例。9例如,1989年出生的嬰兒體重平均為3190克,可以提出一個命題〔假設〕:“1990年出生的嬰兒與1989年出生的嬰兒在體重上沒有什么差異〞,于是可以這樣表示:原假設與備擇假設互斥,肯定原假設,意味著拒絕備擇假設;否認原假設,意味著接受備擇假設。10〔二〕確定適當?shù)臋z驗統(tǒng)計量,并計算統(tǒng)計量的具體數(shù)值檢驗統(tǒng)計量是根據(jù)所抽取樣本計算的用于檢驗原假設是否成立的隨機變量。檢驗統(tǒng)計量中應當含有所要檢驗的總體參數(shù)。檢驗統(tǒng)計量還應該在“H0成立〞的前提下有的分布,從而便于計算出現(xiàn)某種特定的觀測結(jié)果的概率。1112〔三〕規(guī)定顯著性水平顯著性水平是指當原假設為正確時人們卻把它拒絕了的概率或風險。這個概率是人為確定的,通常取α=0.05或0.01。這說明,當作出接受原假設的決定時,其正確的可能性〔概率〕為95%或99%。13〔四〕作出判斷根據(jù)顯著性水平和統(tǒng)計量的分布,可以找出接受域和拒絕域的臨界點用計算出的檢驗統(tǒng)計量的值與臨界點值相比較,就可以作出接受原假設或拒絕原假設的統(tǒng)計決策。14三、假設檢驗中的小概率原理假設檢驗的根本思路是應用小概率原理。所謂小概率原理,是指發(fā)生概率很小的隨機事件在一次實驗中是幾乎不可能發(fā)生的。根據(jù)這一原理,可以作出是否接受原假設的決定。見下例。15例如,有一個廠商稱其產(chǎn)品的合格率很高,可以得到99%,那么從一批產(chǎn)品中〔如100件〕隨機抽取1件,這一件恰好是次品的概率就非常小,只有1%。如果廠商的宣稱是真的,隨機抽取1件是次品的情況就幾乎不可能發(fā)生的;但如果這種情況確實發(fā)生了,就有理由疑心原來的假設,即產(chǎn)品中只有1%次品的假設是否成立,這時就可以推翻原來的假設,可以做出廠商的宣稱是假的這樣一個推斷。16進行推斷的依據(jù)就是小概率原理。當然,推斷也可能會犯錯誤,即這100件產(chǎn)品中確實只有1件是次品,而恰好在一次抽取中被抽到了。所以上例中犯這種錯誤的概率是1%,即我們在冒1%的風險作出廠商宣稱是假的這樣一個推斷。這里的1%即顯著性水平。17四、假設檢驗中的兩類錯誤假設檢驗是由局部來推斷總體,因而假設檢驗不可能絕對準確,它也可能犯錯誤。所謂的犯錯誤有兩種類型:一類錯誤是原假設為真卻被拒絕了,犯這種錯誤的概率用α來表示,也稱作α錯誤或棄真錯誤;另一類錯誤是原假設為偽卻被接受了,犯這種錯誤的概率用β來表示,也稱作β錯誤或取偽錯誤。見下表。18沒有拒絕H0拒絕H0H0為真1-α(正確決策)α(棄真錯誤)H0為偽β(取偽錯誤)1-β(正確決策)19

你不能同時減少兩類錯誤!和的關系就像翹翹板,小就大,大就小20自然,人們希望犯這兩類錯誤的概率越小越好,但對于一定的樣本量n,不能同時做到使這兩類錯誤的概率都很小。使α和β同時變小的方法為:增大樣本量。但樣本量不可能沒有限制,否那么就會使抽樣調(diào)查失去意義。因此,在假設檢驗中,就有一個對兩類錯誤進行控制的問題。21五、雙側(cè)檢驗和單側(cè)檢驗圖6-1雙側(cè)、單側(cè)檢驗的拒絕域分布α/21–α

α/2–Zα/2

Zα/2

α–Zα0

α0Zα(a)雙側(cè)檢驗(b)左側(cè)檢驗(c)右側(cè)檢驗22表6-1拒絕域的單、雙側(cè)與備擇假設之間的對應關系拒絕域位置P-值檢驗的顯著性水平判斷標準原假設備擇假設雙側(cè)α/2H0:θ=θ0H1:θ≠θ0左單側(cè)αH0:θ≥θ0H1:θ<θ0右單側(cè)αH0:θ≤θ0H1:θ>θ023在統(tǒng)計的假設檢驗中,一般是把“不能輕易否認的命題〞作為原假設,把“需要驗證的問題〞作為備擇假設。什么是“不能輕易否認的命題〞?一般來說,原有的理論、原有的看法、原有的狀況、或者說是那些保守的、歷史的、經(jīng)驗的,在沒有充分論據(jù)證明其錯誤前總是被假定為正確的,作為原假設,處于被保護的位置,而那些猜測的、可能的、預期的取為備擇假設。假設檢驗的目的就是要用事實驗證原來的理論、看法、狀況等是否成立,或更明確地說,是希望用事實推翻原假設。2425六、假設檢驗中的P值與臨界值〔一〕P-值規(guī)那么所謂P-值,實際上是檢驗統(tǒng)計量超過(大于或小于)具體樣本觀測值的概率。如果P-值小于所給定的顯著性水平,那么認為原假設不太可能成立;如果P-值大于所給定的標準,那么認為沒有充分的證據(jù)否認原假設。262728〔二〕臨界值規(guī)那么根據(jù)所提出的顯著性水平標準〔它是概率密度曲線的尾部面積〕查表得到相應的檢驗統(tǒng)計量的數(shù)值,稱作臨界值。用檢驗統(tǒng)計量的觀測值與臨界值作比較,觀測值落在臨界值所劃定的尾部〔稱之為拒絕域〕內(nèi),便拒絕原假設;觀測值落在臨界值劃定的尾部之外〔稱之為不能拒絕域〕的范圍內(nèi),那么認為拒絕原假設的證據(jù)缺乏。29圖6-1雙側(cè)、單側(cè)檢驗的拒絕域分配α/21–α

α/2–Zα/2

Zα/2

α–Zα0

α0Zα(a)雙側(cè)檢驗(b)左側(cè)檢驗(c)右側(cè)檢驗30顯然,P-值規(guī)那么和臨界值規(guī)那么是等價的。在做檢驗的時候,只用其中一個規(guī)那么即可。P-值規(guī)那么較之臨界值規(guī)那么具有更明顯的優(yōu)點。這主要是:第一,它更加簡捷;第二,在值規(guī)那么的檢驗結(jié)論中,對于犯第一類錯誤的概率的表述更加精確。推薦使用P-值規(guī)那么。31★§2總體均值的假設檢驗一、單個總體均值的檢驗二、雙總體均值是否相等的檢驗32一、單個總體均值的檢驗33343536總體均值的檢驗

(檢驗統(tǒng)計量)總體是否?用樣本標準差S代替t檢驗小樣本容量n否是z檢驗

z檢驗大3738394041由于P值>0.05,所以不拒絕原假設,即樣本數(shù)據(jù)沒有充分證據(jù)說明這天的自動包裝機工作不正常。42434445464748二、雙總體均值是否相等的檢驗495051525354【例題】某工廠為了比較兩種裝配方法的效率,分別組織了兩組員工,每組9人,一組采用新的裝配方法,另外一組采用舊的裝配方法。假設兩組員工設備的裝配時間均服從正態(tài)分布,兩總體的方差相等但未知?,F(xiàn)有18個員工的設備裝配時間見表6-2,根據(jù)這些數(shù)據(jù),是否有理由認為新的裝配方法更節(jié)約時間?〔顯著性水平0.05〕表6-2兩組員工設備的裝配時間單位:小時新方法(x2)353129253440273231舊方法(x1)3237353841443531345556§3總體比例的假設檢驗一、單個總體比例的檢驗二、兩個總體比例是否相等的檢驗57一、單個總體比例的假設檢驗5859【例題】一項調(diào)查結(jié)果聲稱,某市小學生每月零花錢到達200元的比例為40%,某科研機構(gòu)為了檢驗這個調(diào)查是否可靠,隨機抽選了100名小學生,發(fā)現(xiàn)有47人每月零花錢到達200元,調(diào)查結(jié)果能否證實早先調(diào)查40%的看法?〔〕6061二、兩個總體的比例是否相等的檢驗6263§4總體方差的假設檢驗一、單個總體方差的假設檢驗二、兩個總體方差比的假設檢驗64一、單個總體方差的假設檢驗在假設檢驗中,有時需要檢驗正態(tài)總體的方差。如,在產(chǎn)品質(zhì)量檢驗中,質(zhì)量標準是通過不同類型的指標反映的,有些屬于均值類型,如尺寸、重量、抗拉強度等;有些屬于比例類型,如產(chǎn)品合格率、廢品率等;有些屬于方差類型,如尺寸的方差、重量的方差、抗拉強度的方差等。在這里,方差反映著產(chǎn)品的穩(wěn)定性。方差大,說明產(chǎn)品的性能不穩(wěn)定,波動大。65666768二、兩個總體方差比的假設檢驗如果欲檢驗兩個總體方差是否相等,可以通過兩個方差之比是否等于1來進行。實際中會遇到關注兩個總體方差是否相等的問題,如比較兩個生產(chǎn)過程的穩(wěn)定性,比較兩種投資方案的風險等。前面討論兩個總體均值之差檢驗時,假定兩個總體方差相等或不等,事實上,在許多情況下總體方差是否相等事先往往并不知道,因此在進行兩個總體均值之差檢驗之前,也可以先進行兩個總體方差是否相等的檢驗,由此獲得所需要的信息。697071§5單因子方差分析一、問題的提出二、方差分析的檢驗統(tǒng)計量三、關于方差分析的兩點說明72一、問題的提出【例題】在一組給定的條件下飼養(yǎng)小雞所增加的體重服從正態(tài)分布。某養(yǎng)雞場欲檢驗四種飼料配方對小雞增重的影響是否不相同〔假定已經(jīng)經(jīng)過檢驗說明不同飼料配方下的小雞增重方差相等〕。為此,他們對四組初始條件完全相同的小雞,在完全相同的其他飼養(yǎng)條件下,分別使用四種不同的飼料配方進行喂養(yǎng)。所得到的增重數(shù)據(jù)如表6-3。73飼料配方i小雞序號j38周后小雞個體增重yij(克)123456配方13704204504901730配方24903804003905004102570配方33303404003804701920配方44104804004203804102500160016201650168013508208720表6-3四種不同飼料配方下小雞的增重情況74對于前述例題對于類似本例的問題,一般地,把隨機變量分組的數(shù)目記作m,我們可建立以下假設:75二、方差分析的檢驗統(tǒng)計量76777879【例題】利用表6-3中的數(shù)據(jù)進行單因子方差分析〔顯著水平為α=0.05〕。80818283表6-4方差分析表變異來源離差平方和自由度均方差值P-值臨界值組間7112.1432370.7141.012320.4115733.196774組內(nèi)39811.67172341.863總計46923.8

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論