似然比檢驗與分布擬合檢驗_第1頁
似然比檢驗與分布擬合檢驗_第2頁
似然比檢驗與分布擬合檢驗_第3頁
似然比檢驗與分布擬合檢驗_第4頁
似然比檢驗與分布擬合檢驗_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章假設檢驗

§7.1假設檢驗的根本思想與概念§7.2正態(tài)總體參數假設檢驗§7.3其它分布參數的假設檢驗§7.4似然比檢驗與分布擬合檢驗§7.5正態(tài)性檢驗§7.4似然比檢驗與分布擬合檢驗7.4.1似然比檢驗設是來自密度函數〔或分布率〕為的總體的簡單樣本,考慮檢驗問題:一個比較直觀且自然方法是考慮似然比當較大時,拒絕原假設,這種檢驗方法稱為似然比檢驗。例1對正態(tài)總體,方差,檢驗問題似然比為否那么,接受,令那么因為均且,拒絕域為的單調增函數,故由等式所以是可得。這樣檢驗統計量可取為這是通常的單邊檢驗。對一般的假設檢驗問題檢驗的拒絕域為定義似然比檢驗統計量為其中臨界值可由確定。下面也通過例子說明其具體應用。似然比對正態(tài)總體,方差未知,檢驗問題這里當未知時,其極大似然估計分別為當時,極大似然估計為所以似然比為假設令,那么當成立時,~且是單調增函數,因此由可得臨界值為這樣檢驗統計量為拒絕域為當成立時,~且是單調增函數,因此由當然也可令,那么這是通常的雙邊檢驗。拒絕域為這樣檢驗統計量也可以為可得臨界值為可以證明這時的檢驗和檢驗是等價的。從上述兩個例子可得求似然比檢驗的一般步驟:〔1〕在內求的極大似然估計,在內求的極大似然估計增函數時,由求臨界值〔2〕計算并化簡使成形式,滿足兩個要求,是的單調增函數或單調減函數;當成立時,的分布完全?!?〕減函數時,由求臨界值〔4〕檢驗統計量取為增函數時,拒絕域為減函數時,拒絕域為其一:其二:注:〔1〕正態(tài)總體下參數的檢驗根本都是似然比檢驗〔2〕似然比檢驗可用于檢驗樣本來自兩個不同類型分布之一,樣本來自正態(tài)總體族樣本來自雙參數指數分布族其中如〔3〕似然比檢驗適應面廣,〔4〕一般情形下,難獲得,總體均可以構造,且構造的檢驗常具有一些優(yōu)良性質,如在某種意義下具有最有性。因此臨界值的求法有兩種。其一,利用Monte-Carlo模擬計算;其二,當樣本容量很大時,利用似然比統計量的極限分布近似給出。正態(tài)總體和非正態(tài)似然比統計量的精確分布很先考慮總體分布只取有限個值的情況

設總體X可以分成k類,記為

,現對該總體作了n次觀測,k個類出現的頻數分別為:檢驗如下假設:n1,…,nk,且其中諸且7.4.2分布擬合檢驗一總體分布離散情況

在之前的比例問題的假設檢驗中,對于大樣本的數據1、諸pi均時

對于比例問題:P(X=1)=p,P(X=0)=1–p

假設檢驗:H0:p=p0;H1:p

p0。 樣本統計:1的頻數為k,0的頻數為n–k。我們有從二項分布〔0-1數據〕的情形入手與之對應地,我們有如下等價的檢驗統計量注意到即也可以寫成:總體分類A1(X=1)A2(X=0)合計理論頻數E1=np0E2=n(1–p0)n觀測頻數O1=kO2=n–kn該檢驗的檢驗統計量及其分布:再考慮更一般的情形對于多項分布問題:假設檢驗:數據結構:總體分類A1(X=1)……Ak(X=k)合計理論頻數E1=np10……Ek=npk0n觀測頻數O1……Osn英國統計學家K.Pearson提出如下檢驗統計量:在近似計算方面,盡可能要求所有觀測頻數Oi≥5,容許個別為3或4;否那么,對某些類進行合并。(7.4.2)并證明在H0成立時對充分大的n,(7.4.2)

給出的檢驗統計量近似服從自由度為k-1的分布。如果H0成立,那么對每一類Ai,其頻率ni/n與概率pi應較接近。即觀測頻數ni與理論頻數npi應相差不大。反之,假設觀測頻數ni與理論頻數npi相差較大,那么應拒絕原假設。據此,我們可以得到如下的拒絕域形式拒絕域為:例7.4.1為募集社會福利基金,某地方政府發(fā)行福利彩票,中彩者用搖大轉盤的方法確定最后中獎金額。大轉盤均分為20份,其中金額為5萬、10萬、20萬、30萬、50萬、100萬的分別占2份、4份、6份、4份、2份、2份。假定大轉盤是均勻的,那么每一點朝下是等可能的,于是搖出各個獎項的概率如下:概率0.10.20.30.20.10.1額度5萬10萬20萬30萬50萬100萬現20人參加搖獎,搖得5萬、10萬、20萬、30萬、50萬和100萬的人數分別為2、6、6、3、3、0,由于沒有一個人搖到100萬,于是有人疑心大轉盤是不均勻的,那么該疑心是否成立呢?這就需要對轉盤的均勻性作檢驗。解:這是一個典型的分布擬合優(yōu)度檢驗,總體共有6類,其發(fā)生概率分別為0.1、0.2、0.3、

0.2、0.1和0.1,選用如下卡方檢驗統計量檢驗拒絕域為:這里k=6,由本例數據可以算出假設取=0.05,那么查附表3知=由于未落入拒絕域,故接受原假設,沒有理由認為轉盤不均勻。本例中,以T記服從

的隨機變量,則使用統計軟件可以算出這個p值就反映了數據與假設的分布擬合程度的上下,p值越大,擬合越好。在分布擬合檢驗中使用p值也是方便的。2、諸pi不完全時假設諸由r(r<k)個未知參數確定,即首先給出

的極大似然估計然后給出諸

的極大似然估計

Fisher證明了

在H0成立時近似服從自由度為k-r-1的

分布,于是檢驗拒絕域為例7.4.2

盧瑟福在2608個等時間間隔內觀測一枚放射性物質放射的粒子數X,表7.4.1是觀測結果的匯總,其中ni表示2608次觀測中放射粒子數為i的次數。

ni572033835255324082731394527106i012345678910

11試利用該組數據檢驗該放射物質在單位時間內放射出的粒子數是否服從泊松分布。

解:本例中,要檢驗總體是否服從泊松分布。

觀測到0,1,…,11共12個不同取值,這相當于把總體分成k=12類。這里有一個未知參數

,采用極大似然估計,

=將

代入可以估計出諸

。選用檢驗統計量列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.01207.66730.16580.12580.0158合計26081.00002068=12.8967i假設取=0.05,那么本例中

=12.8967<18.307,故接受原假設。拒絕域為使用統計軟件可以計算出此處檢驗的p值是0.2295。

自1965年1月1日至1971年2月9日共2231天中,全世界記錄到里氏震級4級和4級以上地震共162次,統計如下:二、連續(xù)情形的離散化我們通過一個例子來看怎么利用卡方擬合檢驗處理連續(xù)總體的情形例7.4.3(X表示相繼兩次地震間隔天數,Y表示出現的頻數)試檢驗相繼兩次地震間隔天數X服從指數分布.由最大似然估計法得因X為連續(xù)型隨機變量,將

X的可能取值區(qū)間分為k=9個互不重疊的子區(qū)間如下的概率密度

:0XH解:=163.5633503126171086680.27880.21960.15270.10620.07390.05140.03580.02480.056845.165635.575224.737417.204411.97188.32685.79964.01769.201655.351927.013227.327016.79808.35307.68606.207314.826913.2192例3的擬合檢驗計算表在H0

為真的前提下,X

的分布函數的估計為故在水平0.05下接受H0,認為樣本服從指數分布.有估計概率)(

iiAPp=Kolmogorov的D檢驗當我們需要檢驗一組觀測值是否來自某一總體時,我們常采用所謂kolmogorov的D檢驗法。假設檢驗:這里為一事先給定的完全已知的連續(xù)分布函數檢驗統計量:1933年kolmogorov證明了當成立時,有該極限與無關。該檢驗方法與連續(xù)情形的卡方檢驗方法相比要好,靈敏度較高。該檢驗方法只適用于總體理論分布完全已知的情形若總體理論分布含有未知參數,即為的情形,雖然我們也可以采用的估計量類似于前面作替換,但此時的kolmogorov的檢驗方法就不如卡方擬合檢驗了。列聯表是將觀測數據按兩個或更多屬性(定性變量)分類時所列出的頻數表。例如,對隨機抽取的1000人按性別〔男或女〕及色覺(正?;蛏?兩個屬性分類,得到如下二維列聯表,又稱2×2表或四格表。7.4.2

列聯表的獨立性檢驗男53565女38218性別視覺正常色盲一般,若總體中的個體可按兩個屬性A與B分類,A有r個類,B有c個類從總體中抽取大小為n的樣本,設其中有個個體既屬于類又屬于類,稱為頻數,將r

c個排列為一個r行c列的二維列聯表,簡稱r

c表(表7.4.3)。表7.4.3r

c列聯表列聯表分析的基本問題是:考察各屬性之間有無關聯,即判別兩屬性是否獨立。如在前例中,問題是:一個人是否色盲與其性別是否有關?在r

c表中,若以

分別表示總體中的個體僅屬于

,僅屬于

和同時屬于

的概率,可得一個二維離散分布表(表7.4.4),則“A、B兩屬性獨立”的假設可以表述為表7.4.4

二維離散分布表這就變?yōu)樯弦恍」?jié)中諸

不完全已知時的分布擬合檢驗。這里諸

共有rc個參數,在原假設H0成立時,這rc個參數

由r+c個參數

決定。在這r+c后個參數中存在兩個約束條件:

所以,此時

實際上由r+c-2個獨立參數所確定。據此,檢驗統計量為

在H0成立時,上式服從自由度為rc-(r+c-2)-1的

分布。其中諸

是在H0成立下得到的

的極大似然估計,其表達式為

對給定的顯著性水平

,檢驗的拒絕域為:例7.4.3為研究兒童智力開展與營養(yǎng)的關系,某研究機構調查了1436名兒童,得到如表7.4.5的數據,試在顯著性水平0.05下判斷智力開展與營養(yǎng)有無關系。表7.4.5兒童智力與營養(yǎng)的調查數據營養(yǎng)良好營

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論