第八章假設(shè)檢驗(分布擬合檢驗)_第1頁
第八章假設(shè)檢驗(分布擬合檢驗)_第2頁
第八章假設(shè)檢驗(分布擬合檢驗)_第3頁
第八章假設(shè)檢驗(分布擬合檢驗)_第4頁
第八章假設(shè)檢驗(分布擬合檢驗)_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第八章假設(shè)檢驗(續(xù))在前面的課程中,我們已經(jīng)了解了假設(shè)檢驗的基本思想,并討論了當(dāng)總體分布為正態(tài)時,關(guān)于其中未知參數(shù)的假設(shè)檢驗問題.然而可能遇到這樣的情形,總體服從何種理論分布并不知道,要求我們直接對總體分布提出一個假設(shè).§4.分布擬合檢驗

例1.從1500到1931年的432年間,每年爆發(fā)戰(zhàn)爭的次數(shù)可以看作一個隨機變量,椐統(tǒng)計,這432年間共爆發(fā)了299次戰(zhàn)爭,數(shù)據(jù)如下:戰(zhàn)爭次數(shù)X01234

22314248154

發(fā)生X次戰(zhàn)爭的年數(shù)在概率論中,大家對泊松分布產(chǎn)生的一般條件已有所了解,容易想到,每年爆發(fā)戰(zhàn)爭的次數(shù),可以用一個泊松隨機變量來近似描述.也就是說,我們可以假設(shè)每年爆發(fā)戰(zhàn)爭次數(shù)分布X近似泊松分布.上面的數(shù)據(jù)能否證實X

具有泊松分布的假設(shè)是正確的?現(xiàn)在的問題是:又如,某鐘表廠對生產(chǎn)的鐘進行精確性檢查,抽取100個鐘作試驗,撥準(zhǔn)后隔24小時以后進行檢查,將每個鐘的誤差(快或慢)按秒記錄下來.問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)分布?K.皮爾遜這是一項很重要的工作,不少人把它視為近代統(tǒng)計學(xué)的開端.解決這類問題的工具是英國統(tǒng)計學(xué)家K.皮爾遜在1900年發(fā)表的一篇文章中引進的所謂

檢驗法.

檢驗法是在總體X的分布未知時,根據(jù)來自總體的樣本,檢驗關(guān)于總體分布的假設(shè)的一種檢驗方法.

H0:總體X的分布函數(shù)為F(x)

然后根據(jù)樣本的經(jīng)驗分布和所假設(shè)的理論分布之間的吻合程度來決定是否接受原假設(shè).這種檢驗通常稱作擬合優(yōu)度檢驗,它是一種非參數(shù)檢驗.使用檢驗法對總體分布進行檢驗時,我們先提出原假設(shè):在用

檢驗假設(shè)H0時,若在H0下分布類型已知,但其參數(shù)未知,這時需要先用極大似然估計法估計參數(shù),然后作檢驗.檢驗法分布擬合的

的基本原理和步驟如下:檢驗法3.根據(jù)所假設(shè)的理論分布,可以算出總體X的值落入每個Ai的概率pi,于是npi就是落入Ai的樣本值的理論頻數(shù).1.將總體X的取值范圍分成k個互不重迭的小區(qū)間,記作A1,A2,…,

Ak.2.把落入第i個小區(qū)間Ai的樣本值的個數(shù)記作fi,稱為實測頻數(shù).所有實測頻數(shù)之和f1+f2+…+

fk等于樣本容量n.標(biāo)志著經(jīng)驗分布與理論分布之間的差異的大小.皮爾遜引進如下統(tǒng)計量表示經(jīng)驗分布與理論分布之間的差異:統(tǒng)計量的分布是什么?在理論分布已知的條件下,npi是常量實測頻數(shù)理論頻數(shù)或如果理論分布F(x)中有r個未知參數(shù)需用相應(yīng)的估計量來代替,那么當(dāng)時,統(tǒng)計量的分布漸近(k-r-1)個自由度的分布.皮爾遜證明了如下定理:如果理論分布F(x)中有r個未知參數(shù)需用相應(yīng)的估計量來代替,那么當(dāng)時,統(tǒng)計量的分布漸近(k-r-1)個自由度的分布.若原假設(shè)中的理論分布F(x)已經(jīng)完全給定,那么當(dāng)

時,統(tǒng)計量的分布漸近(k-1)個自由度的分布.若原假設(shè)中的理論分布F(x)已經(jīng)完全給定,那么當(dāng)

時,統(tǒng)計量為了便于理解,我們對定理作一點直觀的說明.是k個近似正態(tài)的變量的平方和.這些變量之間存在著一個制約關(guān)系:故統(tǒng)計量漸近(k-1)個自由度的分布.在理論分布F(x)完全給定的情況下,每個pi

都是確定的常數(shù).由棣莫佛-拉普拉斯中心極限定理,當(dāng)n充分大時,實測頻數(shù)fi

漸近正態(tài),因此在F(x)尚未完全給定的情況下,每個未知參數(shù)用相應(yīng)的估計量代替,就相當(dāng)于增加一個制約條件,因此,自由度也隨之減少一個.若有r個未知參數(shù)需用相應(yīng)的估計量來代替,自由度就減少r個.此時統(tǒng)計量漸近(k-r-1)個自由度的分布.如果根據(jù)所給的樣本值X1,X2,…,Xn算得統(tǒng)計量的實測值落入拒絕域,則拒絕原假設(shè),否則就認(rèn)為差異不顯著而接受原假設(shè).得拒絕域:(不需估計參數(shù))(估計r個參數(shù))查分布表可得臨界值,使得根據(jù)這個定理,對給定的顯著性水平,皮爾遜定理是在n無限增大時推導(dǎo)出來的,因而在使用時要注意n要足夠大,以及npi

不太小這兩個條件.根據(jù)計算實踐,要求n不小于50,以及npi

都不小于5.否則應(yīng)適當(dāng)合并區(qū)間,使npi滿足這個要求.讓我們回到開始的一個例子,檢驗每年爆發(fā)戰(zhàn)爭次數(shù)分布是否服從泊松分布.提出假設(shè)H0:X服從參數(shù)為的泊松分布按參數(shù)為0.69的泊松分布,計算事件X=i的概率pi

,=0.69將有關(guān)計算結(jié)果列表如下:pi的估計是,i=0,1,2,3,4根據(jù)觀察結(jié)果,得參數(shù)的極大似然估計為因H0所假設(shè)的理論分布中有一個未知參數(shù),故自由度為4-1-1=2.x

0

1

2

34fi

223142481540.580.310.180.010.02n

216.7149.551.612.02.16

0.1830.3760.2511.623戰(zhàn)爭次數(shù)實測頻數(shù)14.162.43將n<5的組予以合并,即將發(fā)生3次及4次戰(zhàn)爭的組歸并為一組.故認(rèn)為每年發(fā)生戰(zhàn)爭的次數(shù)X服從參數(shù)為0.69的泊松分布.按=0.05,自由度為4-1-1=2查分布表得=5.991=2.43<5.991,由于統(tǒng)計量的實測值未落入否定域.奧地利生物學(xué)家孟德爾進行了長達八年之久的豌豆雜交試驗,并根據(jù)試驗結(jié)果,運用他的數(shù)理知識,發(fā)現(xiàn)了遺傳的基本規(guī)律.

例2.我們以遺傳學(xué)上的一項偉大發(fā)現(xiàn)為例說明統(tǒng)計方法在研究自然界和人類社會的規(guī)律性時,是起著積極的、主動的作用.孟德爾子二代子一代…黃色純系…綠色純系他的一組觀察結(jié)果為:黃70,綠27近似為2.59:1,與理論值相近.根據(jù)他的理論,子二代中,黃、綠之比近似為3:1,由于隨機性,觀察結(jié)果與3:1總有些差距,因此有必要去考察某一大小的差異是否已構(gòu)成否定3:1理論的充分根據(jù),這就是如下的檢驗問題.這里,n=70+27=97,k=2,檢驗孟德爾的3:1理論:提出假設(shè)H0:p1=3/4,p2=1/4理論頻數(shù)為:

np1=72.75,np2=24.25實測頻數(shù)為70,27.由于統(tǒng)計量的實測值統(tǒng)計量~自由度為k-1=1=0.4158<3.841,按=0.05,自由度為1,查分布表得=3.841未落入否定域.故認(rèn)為試驗結(jié)果符合孟德爾的3:1理論.這些試驗及其它一些試驗,都顯示孟德爾的3:1理論與實際是符合的.這本身就是統(tǒng)計方法在科學(xué)中的一項

重要應(yīng)用.用于客觀地評價理論上的某個結(jié)論是否與觀察結(jié)果相符,以作為該理論是否站得住腳的印證.例3.自1965年1月1日至1971年2月9日共2231天中,全世界紀(jì)錄到里氏震級4記和5級以上的地震162次,統(tǒng)計如下試檢驗相繼兩次地震間隔天數(shù)是否符合指數(shù)分布。α=0.05相繼兩次地震間隔的天數(shù)xi0-45-910-1415-1920-2425-2930-3435-39≥40出現(xiàn)的頻數(shù)fi50312617108668(1)解:本例是檢驗假設(shè)H0:X的概率密度為此處的參數(shù)θ未知,先利用極大似然估計求出θ的估計為將總體X可能取值的區(qū)間[0,∞)分為9個互不重疊的子區(qū)間

i=1,2,…,9。若為真,則X的分布函數(shù)是由此式得概率pi=P(Ai)的估計:于是可以得到下面的表:13.2192-0.78080.0461i[ai,ai+1)fi1[0,4.5)500.278845.1656-4.83440.51752[4.5,9.5)310.219635.57524.57520.58843[9.5,14.5)260.152724.7374-1.26260.06444[14.5,19.5)170.106217.20440.20440.00245[19.5,24.5)100.073911.97181.97180.32486[24.5,29.5)80.05148.32680.32680.01267[29.5,34.5)60.03585.7996-0.20040.00698[34.5,39.5)60.02484.01769[39.5,+∞)80.05689.2016Σ1.5631結(jié)論:因為:教材上的另一例留給同學(xué)們自己看.由于這種檢驗的計算量相對較大,一般要用統(tǒng)計軟件包來實現(xiàn).這一講我們介紹了擬合優(yōu)度的

檢驗法.在對總體的分布進行檢驗時經(jīng)常使用.

§5.秩和檢驗法設(shè)從總體F(x)和G(x)中分別抽出了樣本容量n1與n2的樣本(X1,X2,…,Xn1),(X1,X2,…,Xn2),檢驗假設(shè):

H0:F(x)=G(x)設(shè):n1≤n2。把兩個樣本的觀測數(shù)據(jù)和在一起從小到大的次序排列,并進行統(tǒng)一計數(shù)1,2,…,n1+n2

。每個數(shù)據(jù)在排列中所對應(yīng)的序數(shù)稱為該數(shù)據(jù)的秩。相同數(shù)據(jù)用他們的平均值來做秩。將容量小的樣本的觀測值的秩之和記為T。以T為檢驗統(tǒng)計量。如果H0成立,則(X1,X2,…,Xn1),(X1,X2,…,Xn2)可以看作取自同一總體的容量為n1+n2的樣本值。(x1,x2,…,xn1),(x1,x2,…,xn2)中諸元素的秩,應(yīng)該隨機地、分散地在自然數(shù)1,2,…,n1+n2

中取值,一般他們不應(yīng)過分集中取較小或過分集中取較大的值。由于n1(n1+1)/2≤T≤n1n2+n2(n2+1)/2

則當(dāng)H0為真時,秩和T一般不應(yīng)取太靠近該不等式兩端的值。因而當(dāng)T取過小或過大的值時我們就拒絕H0

。威爾科克遜(Wilcoxon)給出了T的臨界值表。在給定顯著性水平α下,差表求出T1,T2,使P{T1<T<T2}=1-α

若T1<T<T2,則接受H0

。即認(rèn)為F(x)與G(x)差異不顯著。若T≤T1或T≥T2,則拒絕H0,即認(rèn)為F(x)與G(x)差異顯著。實際計算時,取P{T≤T1}≤α/2的最大整數(shù)和P{T≥T2}≤α/2的最小整數(shù)。例1.用兩種材料的燈絲制造燈泡,今分別隨機抽取若干

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論