應(yīng)用數(shù)理統(tǒng)計-擬合優(yōu)度檢驗_第1頁
應(yīng)用數(shù)理統(tǒng)計-擬合優(yōu)度檢驗_第2頁
應(yīng)用數(shù)理統(tǒng)計-擬合優(yōu)度檢驗_第3頁
應(yīng)用數(shù)理統(tǒng)計-擬合優(yōu)度檢驗_第4頁
應(yīng)用數(shù)理統(tǒng)計-擬合優(yōu)度檢驗_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

考慮位置----刻度參數(shù)分布族:設(shè)X1,...,Xn是抽自連續(xù)型分布F的樣本,考慮的假設(shè)檢驗問題是

擬合優(yōu)度檢驗Q-Q圖

H0:FL0={G:G(x)=F0((x)/),R,

>0}

H1:FL0其中連續(xù)、嚴(yán)格單調(diào)遞增的分布函數(shù)F0(.)是給定的,參數(shù),

的取值決定分布族中的具體分布.

令Zi=F(Xi),以F01記F0的反函數(shù),則當(dāng)H0成立時,F(x)=F0((x)/)

H0:FL0={G:G(x)=F0((x)/),R,

>0}

H1:FL0對于某和成立。從而

F01(Zi)=F01(F0((Xi)/)))=(Xi)/

于是

Xi

=F01(Zi)+(4.1)Xi

=F01(Zi)+(4.1),Zi=F(Xi)=F0((Xi)/),

Zi

Fn(Xi)(4.2)其中Fn(x)是由X1,...,Xn得到的經(jīng)驗分布函數(shù)。由式(4.1)和式(4.2)得

Xi

F01(Fn(Xi))+

式(4.1)表明:Xi和

F01(Zi)

呈線性關(guān)系,即點

{(F01(Zi),Xi),i=1,...,n}在一條直線上。由于和知,無法算出

Zi。注意到Zi

是分布函數(shù)在

Xi處的值,而分布函數(shù)可以由經(jīng)驗分布函數(shù)來估計,故Zi近似地可以表示為特別對順序統(tǒng)計量X(i),有Fn(X(i))=i/n,所以

X(i)

F01(i/n)+上式右邊當(dāng)i=n時,一般無法算出。為此,使用時常在該公式中加入一個連續(xù)性校正常數(shù)c,取Xi

F01(Fn(Xi))+常取c=0.5或0.25。這里,我們約定取c=0.25。由此得到于是,為檢驗H0作圖如下:把點

標(biāo)在直角坐標(biāo)系中,當(dāng)原假設(shè)H0成立時,諸點構(gòu)成的點陣將呈一直線,且該直線的斜率可作為的估計,截距可作為的估計,這種圖稱為Q-Q散點圖。

通過Q-Q散點圖,若點陣不呈直線狀態(tài),則認(rèn)為H0不成立。此時,圖形可能呈現(xiàn)各種各樣的情況。幾種典型的情況如下:(1)點陣構(gòu)成的圖形呈中心對稱的反S型,中部點的密度較大,這表明比起由

給定的橫坐標(biāo)來,樣本中最大的一些值和最小的一些值比較突出,樣本值相對比較分散,總體分布可能比原假設(shè)下的分布族中的分布重尾。對稱性則表明,兩個分布族的密度曲線的形狀類似。

圖4.1b中樣本來自于Canchy分布,F(xiàn)0為N(0,1),Canchy分布與N(0,1)分布密度函數(shù)圖形見下圖,其中紅線為N(0,1)密度函數(shù),藍(lán)線為Canchy分布的密度函數(shù),其為:

(2)點陣構(gòu)成的圖形呈中心對稱的S型,中部點的密度較大,如圖4.1c所示。這表明樣本兩端的值比起由

給定的橫坐標(biāo)來相對變化較慢,從而樣本取值比較集中,總體分布可能比原假設(shè)下的分布族中的分布輕尾。圖c中樣本來自于正態(tài)分布,F(xiàn)0為Laplace分布。N(0,1)分布與Laplace分布的密度函數(shù)圖形見下圖,其中紅線為N(0,1)密度函數(shù),藍(lán)線為Laplace分布的密度函數(shù)

(3)在其他非典型的情況下,Q-Q散點圖的分析比較復(fù)雜。比如,4.1d中,由于F0取為N(0,1),可以看出總體的分布是偏態(tài)的,并且右側(cè)尾部較正態(tài)分布重。有時還可檢測出異常點的存在。所謂異常點,是指“遠(yuǎn)離”其他數(shù)據(jù)點的觀測值。如在圖4.2a中,點P遠(yuǎn)離直線,而其他諸點在一直線周圍,這時認(rèn)為點P所對應(yīng)的數(shù)據(jù)點可能是異常點。如果圖形分為比較明顯的兩個部分,如圖4.2b的形狀,那么,可能意味著總體的分布是混合的。皮爾遜2----檢驗法

前面的圖方法直觀易行,但不能從數(shù)量上反映樣本與給定分布擬合的程度。Pearson

2

檢驗可以解決這個問題。

Pearson

2

檢驗是一種最常用的檢驗總體分布為某個已知分布的檢驗方法,它用K.Pearson提出的2統(tǒng)計量來衡量經(jīng)驗分布與假設(shè)的理論分布間的差異。此法可以用來檢驗總體是否服從任何一個預(yù)先給定的分布,而這個預(yù)先給定的分布可以是離散的,也可以是連續(xù)的。皮爾遜定理設(shè)A1,A2,…,Am是完備事件組,即

其中,P(Ai)=pi(pi是已知的),i=1,2,…,m。fi

是n

次獨立重復(fù)試驗中Ai

發(fā)生的次數(shù)。則當(dāng)n時

的極限分布是2

(m1)。設(shè)總體X的分布是H0:P(X=zi)=pi,i=1,2,…,m(1)0pi1

是已知量

,樣本值是x1,…,xn,fi是樣本值中取值為zi

的個數(shù),i=1,2,…,m

現(xiàn)進(jìn)行了n次獨立重復(fù)試驗;記事件(X=zi)=Ai,i=1,2,…,m;fi是n次獨立重復(fù)試驗中Ai出現(xiàn)的頻數(shù)。我們用檢驗統(tǒng)計量拒絕域為W={2>c}.當(dāng)n很大時,一般n50時給定顯著水平,要使c=1-2(m-1),這樣可得H0

的拒絕域為:W={2>c}例1.有七臺自動車床獨立的生產(chǎn)同一種產(chǎn)品。在某一段時間內(nèi),統(tǒng)計產(chǎn)生了238件次品,其情況如下表:機(jī)床號一二三四五六七

次品件數(shù)36232931346025試問次品的產(chǎn)生是否與機(jī)床有關(guān)?(=0.05)

其中Ai表示第i臺機(jī)床產(chǎn)生次品。該假設(shè)的拒絕域為:經(jīng)計算給定

=0.05,查

2分布表得所以在顯著水平

=0.05下,拒絕H0,認(rèn)為生產(chǎn)次品的情況與機(jī)床有關(guān)。因為皮爾遜定理的推廣定理設(shè)X1,...,Xn為來自總體X的樣本,需檢驗其中1,...,r為未知參數(shù)。在H0為真的條件下,用極大似然估計法得到未知參數(shù)的估計則當(dāng)n時的極限分布是

2(mr1),其中m是將實數(shù)軸分成不相交區(qū)間的個數(shù),pi是H0為真且(1,...,r)=時,總體取值落入第i個小區(qū)間的概率,稱其為理論概率,npi稱為理論頻數(shù),fi是樣本觀測值落入第i個小區(qū)間的個數(shù),稱其為實際頻數(shù).

在實際應(yīng)用中,當(dāng)n很大時,上述統(tǒng)計量

2近似服從分布2(mr1),為了檢驗H0,對給定的,由2分布表可查得

1-2(mr1),使得從而可得到的拒絕域由于使用了近似服從

2分布的檢驗統(tǒng)計量,所以該檢驗也稱為

2—檢驗法。

在使用

2---檢驗法時要注意兩點:樣本容量n要求很大,一般n50;劃分區(qū)間的個數(shù)m不宜太小也不宜過大,實際應(yīng)用中,一般取6m20,同時要求在每個小區(qū)間上fi

5

(或npi5)

。如果不滿足這個條件就要把相鄰的區(qū)間合并,直到滿足條件為止。由此,小區(qū)間的個數(shù)不是一開始就確定不變的;另外上述

2公式也可變成如下形式進(jìn)行計算:

以下具體列出

2檢驗法一般步驟:(a)根據(jù)問題提出假設(shè)H0,在H0成立的條件下計算未知參數(shù)的極大似然估計;(b)把實數(shù)軸分為m個不相交的區(qū)間(ai,ai+1),i=1,2,...,m,其中a1可取,am+1可取+;(c)計算概率pi=P(ai

<X

ai+1)=F(ai+1)F(ai),i=1,2,...,m,計算出理論頻數(shù)npi;(d)計算樣本觀測值x1,...,xn落在(ai,ai+1)中的個數(shù)fi,i=1,2,...,m;

(e)一般采用表格形式來計算出統(tǒng)計量2的值;

(f)對給定的顯著水平,查臨界值12(mr1)。

(g)若

2>1

2(mr1),則拒絕;

不難看出2檢驗總體分布實際上不是完全檢驗F(x)=F0(x),而是檢驗F(ai)=F0(ai),i=1,…,m-1。不過由于ai選取的隨機(jī)性以及F(x)的光滑和單調(diào)性,所以這樣檢驗的結(jié)果同實際情況相差不會太大。例2.

在一實驗中,每隔一定時間間隔觀察一次計數(shù)器上記錄的某種鈾放射出的

粒子的個數(shù)X,獨立觀察100次的數(shù)據(jù)如下:

i01234567891011fi1516172611992121其中fi是觀察到有i個

粒子的個數(shù)。試問X是否服從泊松分布。解:根據(jù)題意,提出假設(shè)H0:X~(),理論分布()的參數(shù)

未知。首先在H0為真條件下,用最大似然估計法得到

的最大似然估計值此時檢驗假設(shè)寫為H0:X~(4.2)。

根據(jù)所給數(shù)據(jù)情況,將(,+)分為m=12個小區(qū)間,(,0],(0,1],(1,2],(2,3],(9,10],(10,+],數(shù)出樣本觀測值落在每個小區(qū)間上的個數(shù)。當(dāng)H0為真時,由已知的X~(4.2),計算各小區(qū)間上的pi:小區(qū)間fi

npi

fi-npi

(fi-npi)2(fi-npi)2/npi(,0]11.51.83.240.415(0,1]56.3(1,2]1613.22.87.840.594(2,3]1718.51.52.250.122(3,4]2619.46.643.562.245(4,5]1116.35.328.091.725(5,6]911.42.45.760.505(6,7]96.92.14.410.629(7,8]23.6(8,9]11.7(9,10]20.70.50.250.038(10,+]10.5在表中,已將fi的值不超過5的小區(qū)間與鄰近的小區(qū)間合并,合并以后的小區(qū)間的個數(shù)為m=8。H0的拒絕域為

給定顯著水平

=0.05,由

2分布表查得由于所以在顯著水平

=0.05下,接受H0,認(rèn)為X服從泊松分布(4.2)

例3一車間生產(chǎn)一批某種車軸,加工的車軸長度是一個隨機(jī)變量X(單位:cm)。現(xiàn)從這批產(chǎn)品中抽取容量為120的樣本,測得樣本值如下表。判斷軸長X是否服從正態(tài)分布。216203197208206209206208202203206213218207208202194203213211193213208208204206204206208209213203206196201208207213208207210208211211214220211203216224211209218

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論