似然比檢驗與分布擬合檢驗_第1頁
似然比檢驗與分布擬合檢驗_第2頁
似然比檢驗與分布擬合檢驗_第3頁
似然比檢驗與分布擬合檢驗_第4頁
似然比檢驗與分布擬合檢驗_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第七章假設(shè)檢驗

§7.1假設(shè)檢驗的根本思想與概念§7.2正態(tài)總體參數(shù)假設(shè)檢驗§7.3其它分布參數(shù)的假設(shè)檢驗§7.4似然比檢驗與分布擬合檢驗§7.5正態(tài)性檢驗§7.4似然比檢驗與分布擬合檢驗7.4.1似然比檢驗設(shè)是來自密度函數(shù)〔或分布率〕為的總體的簡單樣本,考慮檢驗問題:一個比較直觀且自然方法是考慮似然比當(dāng)較大時,拒絕原假設(shè),這種檢驗方法稱為似然比檢驗。例1對正態(tài)總體,方差,檢驗問題似然比為否那么,接受,令那么因為均且,拒絕域為的單調(diào)增函數(shù),故由等式所以是可得。這樣檢驗統(tǒng)計量可取為這是通常的單邊檢驗。對一般的假設(shè)檢驗問題檢驗的拒絕域為定義似然比檢驗統(tǒng)計量為其中臨界值可由確定。下面也通過例子說明其具體應(yīng)用。似然比對正態(tài)總體,方差未知,檢驗問題這里當(dāng)未知時,其極大似然估計分別為當(dāng)時,極大似然估計為所以似然比為假設(shè)令,那么當(dāng)成立時,~且是單調(diào)增函數(shù),因此由可得臨界值為這樣檢驗統(tǒng)計量為拒絕域為當(dāng)成立時,~且是單調(diào)增函數(shù),因此由當(dāng)然也可令,那么這是通常的雙邊檢驗。拒絕域為這樣檢驗統(tǒng)計量也可以為可得臨界值為可以證明這時的檢驗和檢驗是等價的。從上述兩個例子可得求似然比檢驗的一般步驟:〔1〕在內(nèi)求的極大似然估計,在內(nèi)求的極大似然估計增函數(shù)時,由求臨界值〔2〕計算并化簡使成形式,滿足兩個要求,是的單調(diào)增函數(shù)或單調(diào)減函數(shù);當(dāng)成立時,的分布完全?!?〕減函數(shù)時,由求臨界值〔4〕檢驗統(tǒng)計量取為增函數(shù)時,拒絕域為減函數(shù)時,拒絕域為其一:其二:注:〔1〕正態(tài)總體下參數(shù)的檢驗根本都是似然比檢驗〔2〕似然比檢驗可用于檢驗樣本來自兩個不同類型分布之一,樣本來自正態(tài)總體族樣本來自雙參數(shù)指數(shù)分布族其中如〔3〕似然比檢驗適應(yīng)面廣,〔4〕一般情形下,難獲得,總體均可以構(gòu)造,且構(gòu)造的檢驗常具有一些優(yōu)良性質(zhì),如在某種意義下具有最有性。因此臨界值的求法有兩種。其一,利用Monte-Carlo模擬計算;其二,當(dāng)樣本容量很大時,利用似然比統(tǒng)計量的極限分布近似給出。正態(tài)總體和非正態(tài)似然比統(tǒng)計量的精確分布很先考慮總體分布只取有限個值的情況

設(shè)總體X可以分成k類,記為

,現(xiàn)對該總體作了n次觀測,k個類出現(xiàn)的頻數(shù)分別為:檢驗如下假設(shè):n1,…,nk,且其中諸且7.4.2分布擬合檢驗一總體分布離散情況

在之前的比例問題的假設(shè)檢驗中,對于大樣本的數(shù)據(jù)1、諸pi均時

對于比例問題:P(X=1)=p,P(X=0)=1–p

假設(shè)檢驗:H0:p=p0;H1:p

p0。 樣本統(tǒng)計:1的頻數(shù)為k,0的頻數(shù)為n–k。我們有從二項分布〔0-1數(shù)據(jù)〕的情形入手與之對應(yīng)地,我們有如下等價的檢驗統(tǒng)計量注意到即也可以寫成:總體分類A1(X=1)A2(X=0)合計理論頻數(shù)E1=np0E2=n(1–p0)n觀測頻數(shù)O1=kO2=n–kn該檢驗的檢驗統(tǒng)計量及其分布:再考慮更一般的情形對于多項分布問題:假設(shè)檢驗:數(shù)據(jù)結(jié)構(gòu):總體分類A1(X=1)……Ak(X=k)合計理論頻數(shù)E1=np10……Ek=npk0n觀測頻數(shù)O1……Osn英國統(tǒng)計學(xué)家K.Pearson提出如下檢驗統(tǒng)計量:在近似計算方面,盡可能要求所有觀測頻數(shù)Oi≥5,容許個別為3或4;否那么,對某些類進行合并。(7.4.2)并證明在H0成立時對充分大的n,(7.4.2)

給出的檢驗統(tǒng)計量近似服從自由度為k-1的分布。如果H0成立,那么對每一類Ai,其頻率ni/n與概率pi應(yīng)較接近。即觀測頻數(shù)ni與理論頻數(shù)npi應(yīng)相差不大。反之,假設(shè)觀測頻數(shù)ni與理論頻數(shù)npi相差較大,那么應(yīng)拒絕原假設(shè)。據(jù)此,我們可以得到如下的拒絕域形式拒絕域為:例7.4.1為募集社會福利基金,某地方政府發(fā)行福利彩票,中彩者用搖大轉(zhuǎn)盤的方法確定最后中獎金額。大轉(zhuǎn)盤均分為20份,其中金額為5萬、10萬、20萬、30萬、50萬、100萬的分別占2份、4份、6份、4份、2份、2份。假定大轉(zhuǎn)盤是均勻的,那么每一點朝下是等可能的,于是搖出各個獎項的概率如下:概率0.10.20.30.20.10.1額度5萬10萬20萬30萬50萬100萬現(xiàn)20人參加搖獎,搖得5萬、10萬、20萬、30萬、50萬和100萬的人數(shù)分別為2、6、6、3、3、0,由于沒有一個人搖到100萬,于是有人疑心大轉(zhuǎn)盤是不均勻的,那么該疑心是否成立呢?這就需要對轉(zhuǎn)盤的均勻性作檢驗。解:這是一個典型的分布擬合優(yōu)度檢驗,總體共有6類,其發(fā)生概率分別為0.1、0.2、0.3、

0.2、0.1和0.1,選用如下卡方檢驗統(tǒng)計量檢驗拒絕域為:這里k=6,由本例數(shù)據(jù)可以算出假設(shè)取=0.05,那么查附表3知=由于未落入拒絕域,故接受原假設(shè),沒有理由認(rèn)為轉(zhuǎn)盤不均勻。本例中,以T記服從

的隨機變量,則使用統(tǒng)計軟件可以算出這個p值就反映了數(shù)據(jù)與假設(shè)的分布擬合程度的上下,p值越大,擬合越好。在分布擬合檢驗中使用p值也是方便的。2、諸pi不完全時假設(shè)諸由r(r<k)個未知參數(shù)確定,即首先給出

的極大似然估計然后給出諸

的極大似然估計

Fisher證明了

在H0成立時近似服從自由度為k-r-1的

分布,于是檢驗拒絕域為例7.4.2

盧瑟福在2608個等時間間隔內(nèi)觀測一枚放射性物質(zhì)放射的粒子數(shù)X,表7.4.1是觀測結(jié)果的匯總,其中ni表示2608次觀測中放射粒子數(shù)為i的次數(shù)。

ni572033835255324082731394527106i012345678910

11試?yán)迷摻M數(shù)據(jù)檢驗該放射物質(zhì)在單位時間內(nèi)放射出的粒子數(shù)是否服從泊松分布。

解:本例中,要檢驗總體是否服從泊松分布。

觀測到0,1,…,11共12個不同取值,這相當(dāng)于把總體分成k=12類。這里有一個未知參數(shù)

,采用極大似然估計,

=將

代入可以估計出諸

。選用檢驗統(tǒng)計量列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.01207.66730.16580.12580.0158合計26081.00002068=12.8967i假設(shè)取=0.05,那么本例中

=12.8967<18.307,故接受原假設(shè)。拒絕域為使用統(tǒng)計軟件可以計算出此處檢驗的p值是0.2295。

自1965年1月1日至1971年2月9日共2231天中,全世界記錄到里氏震級4級和4級以上地震共162次,統(tǒng)計如下:二、連續(xù)情形的離散化我們通過一個例子來看怎么利用卡方擬合檢驗處理連續(xù)總體的情形例7.4.3(X表示相繼兩次地震間隔天數(shù),Y表示出現(xiàn)的頻數(shù))試檢驗相繼兩次地震間隔天數(shù)X服從指數(shù)分布.由最大似然估計法得因X為連續(xù)型隨機變量,將

X的可能取值區(qū)間分為k=9個互不重疊的子區(qū)間如下的概率密度

:0XH解:=163.5633503126171086680.27880.21960.15270.10620.07390.05140.03580.02480.056845.165635.575224.737417.204411.97188.32685.79964.01769.201655.351927.013227.327016.79808.35307.68606.207314.826913.2192例3的擬合檢驗計算表在H0

為真的前提下,X

的分布函數(shù)的估計為故在水平0.05下接受H0,認(rèn)為樣本服從指數(shù)分布.有估計概率)(

iiAPp=Kolmogorov的D檢驗當(dāng)我們需要檢驗一組觀測值是否來自某一總體時,我們常采用所謂kolmogorov的D檢驗法。假設(shè)檢驗:這里為一事先給定的完全已知的連續(xù)分布函數(shù)檢驗統(tǒng)計量:1933年kolmogorov證明了當(dāng)成立時,有該極限與無關(guān)。該檢驗方法與連續(xù)情形的卡方檢驗方法相比要好,靈敏度較高。該檢驗方法只適用于總體理論分布完全已知的情形若總體理論分布含有未知參數(shù),即為的情形,雖然我們也可以采用的估計量類似于前面作替換,但此時的kolmogorov的檢驗方法就不如卡方擬合檢驗了。列聯(lián)表是將觀測數(shù)據(jù)按兩個或更多屬性(定性變量)分類時所列出的頻數(shù)表。例如,對隨機抽取的1000人按性別〔男或女〕及色覺(正?;蛏?兩個屬性分類,得到如下二維列聯(lián)表,又稱2×2表或四格表。7.4.2

列聯(lián)表的獨立性檢驗?zāi)?3565女38218性別視覺正常色盲一般,若總體中的個體可按兩個屬性A與B分類,A有r個類,B有c個類從總體中抽取大小為n的樣本,設(shè)其中有個個體既屬于類又屬于類,稱為頻數(shù),將r

c個排列為一個r行c列的二維列聯(lián)表,簡稱r

c表(表7.4.3)。表7.4.3r

c列聯(lián)表列聯(lián)表分析的基本問題是:考察各屬性之間有無關(guān)聯(lián),即判別兩屬性是否獨立。如在前例中,問題是:一個人是否色盲與其性別是否有關(guān)?在r

c表中,若以

分別表示總體中的個體僅屬于

,僅屬于

和同時屬于

的概率,可得一個二維離散分布表(表7.4.4),則“A、B兩屬性獨立”的假設(shè)可以表述為表7.4.4

二維離散分布表這就變?yōu)樯弦恍」?jié)中諸

不完全已知時的分布擬合檢驗。這里諸

共有rc個參數(shù),在原假設(shè)H0成立時,這rc個參數(shù)

由r+c個參數(shù)

決定。在這r+c后個參數(shù)中存在兩個約束條件:

所以,此時

實際上由r+c-2個獨立參數(shù)所確定。據(jù)此,檢驗統(tǒng)計量為

在H0成立時,上式服從自由度為rc-(r+c-2)-1的

分布。其中諸

是在H0成立下得到的

的極大似然估計,其表達式為

對給定的顯著性水平

,檢驗的拒絕域為:例7.4.3為研究兒童智力開展與營養(yǎng)的關(guān)系,某研究機構(gòu)調(diào)查了1436名兒童,得到如表7.4.5的數(shù)據(jù),試在顯著性水平0.05下判斷智力開展與營養(yǎng)有無關(guān)系。表7.4.5兒童智力與營養(yǎng)的調(diào)查數(shù)據(jù)營養(yǎng)良好營

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論