對總體分布函數F(x)的假設檢驗_第1頁
對總體分布函數F(x)的假設檢驗_第2頁
對總體分布函數F(x)的假設檢驗_第3頁
對總體分布函數F(x)的假設檢驗_第4頁
對總體分布函數F(x)的假設檢驗_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂一、對總體分布函數一、對總體分布函數F(x)的假設檢驗的假設檢驗二、對隨機變量的獨立性、相關性的假設檢驗二、對隨機變量的獨立性、相關性的假設檢驗例如,例如,1 . 考察某一產品的質量指標打算用正態(tài)分布模型考察某一產品的質量指標打算用正態(tài)分布模型2. 考察一種元件的壽命打算用指數分布模型考察一種元件的壽命打算用指數分布模型3. 一個骰子是否是均勻的?一個骰子是否是均勻的?假設假設 H0:XN( , 2)假設假設 H0 :X服從參數為服從參數為 的的指數分布指數分布假設假設 H0 :這個骰子是均勻的這個骰子是均勻的這里主要介紹擬合優(yōu)度檢驗(這里

2、主要介紹擬合優(yōu)度檢驗(卡方檢驗法)??ǚ綑z驗法)。H0: F(x)= F0(x), H1: F(x) F0(x)8.3 8.3 非參數假設檢驗非參數假設檢驗山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂1111min , max iiki ni nxaxa ()其其中中使使兩兩個個尾尾部部區(qū)區(qū)間間中中樣樣本本點點非非空空 卡方檢驗卡方檢驗(K. Pearson,擬合優(yōu)度檢驗),擬合優(yōu)度檢驗) 設設 X為未知總體,為未知總體,(x1,x2,xn)為大樣本為大樣本(n50),欲檢驗,欲檢驗H0: F(x)= F0(x), H1: F(x) F0(x)把實數軸把實數軸(-,+)分成分成k個互

3、不相交的區(qū)間:個互不相交的區(qū)間: (-, a1, (a1, a2, , (ak-2, ak-1, (ak-1, + ) 記記a0=-, ak=+ , Ii=(ak-2, ak-1 (i=1,2,k-1) , Ik=(ak-1, + ), ni為樣本觀測值(為樣本觀測值(X的取值)落在第的取值)落在第i個小區(qū)間個小區(qū)間Ii 的個數的個數, pi 為為X取值落入第取值落入第i個小區(qū)間個小區(qū)間Ii的概率,的概率,0pi1, i=1,2, ,k,則則 pi= P ai-1X ai = F0(ai)F0(ai-1),i=1,2,k.221()kiiiinnpnp構造統(tǒng)計量:構造統(tǒng)計量:8.3 8.3 非

4、參數假設檢驗非參數假設檢驗山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂 K. Pearson和和R.A.Fisher聯(lián)合證明了:聯(lián)合證明了: 定理定理 不論不論F0(x)是何分布函數,只要是何分布函數,只要n充分大充分大(n50),當假設,當假設H0成立時,上述成立時,上述 2統(tǒng)計量都近似地服從自由度為統(tǒng)計量都近似地服從自由度為k-r-1的的 2 分布。分布。其中其中r是是F0(x)中未知參數的個數。中未知參數的個數。 稱稱ni為為實測頻數實測頻數,vi=npi為為理論頻數理論頻數。稱這類檢驗為。稱這類檢驗為擬合優(yōu)度擬合優(yōu)度檢驗檢驗。 對于給定的對于給定的 ,查,查 2分布表得臨界值

5、分布表得臨界值 2(k-r-1),使使*if22221()(1)(1)kiiiinnpPkrPkrnp 由樣本值計算出由樣本值計算出 2 統(tǒng)計量的值,當統(tǒng)計量的值,當 2 2 2( (k k- -r r-1)-1) 時拒絕時拒絕H0 2 2 2( (k k- -r r-1)-1) 時接受時接受H0 可見,皮爾遜定理(準則)適用于實測頻數與理論頻數相比可見,皮爾遜定理(準則)適用于實測頻數與理論頻數相比較的問題。較的問題。山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂 幾點注釋幾點注釋 若分布函數若分布函數F0(x)的類型未知,可由實際問題分析或由樣本的類型未知,可由實際問題分析或由樣本

6、觀察數據的直方圖來推測。觀察數據的直方圖來推測。 若已知若已知F0(x) 分布類型,還有分布類型,還有r個參數未知時,須先個參數未知時,須先用極大用極大似然估計法求出未知參數的估計值,似然估計法求出未知參數的估計值,然后再作假設。然后再作假設。 此檢驗要求一定是大樣本,一般此檢驗要求一定是大樣本,一般n50。至于。至于k的大小,對的大小,對于正態(tài)總體,樣本容量于正態(tài)總體,樣本容量n與區(qū)間個數與區(qū)間個數k要滿足漸近最優(yōu)關系要滿足漸近最優(yōu)關系k=1.87(n-1)0.4 若理論頻數若理論頻數vi=npi5時,則將相臨的小區(qū)間合并,直至全時,則將相臨的小區(qū)間合并,直至全部部npi 5(合并區(qū)間的同時

7、,也將實測頻數合并),合并后的小(合并區(qū)間的同時,也將實測頻數合并),合并后的小區(qū)間數設為區(qū)間數設為k*,則此時,則此時 2統(tǒng)計量的由度變?yōu)榻y(tǒng)計量的由度變?yōu)?df = k*-r-1手工計算時常采用公式手工計算時常采用公式2211kiiinnnpN50100200 500 1000200010000k9121622305674山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂209,x*if10100()()(198)0198209()( 1.68)0.046542.77pF aFF 200(201)(198)201 209198209()()42.7742.77pFF = (-1.22)-

8、 (-1.68)=0.0647.類似地算得類似地算得: p3=0.1124, p4=0.1547, p5=0.1813, p6=0.1695, p7=0.1286, p8=0.0793, p9=0.0630. 例例1 設從總體設從總體X中抽取中抽取120個樣本觀察值,經計算整理得下表,個樣本觀察值,經計算整理得下表,試檢驗試檢驗X服從正態(tài)分布。(服從正態(tài)分布。( =0.05) 組號組號小區(qū)間小區(qū)間ni1(-,19862(198,20173(201,204144(204,207205(207,210236(210,213227(213,216148(216,21989(219,+)6120 解解

9、 這里只給出了分布類型,有兩這里只給出了分布類型,有兩個待估參數個待估參數 與與 2。 用極大似然法對用極大似然法對 與與 2作出估計,得到作出估計,得到2242.77s故提出假設故提出假設 H0: X N( 209 , 42.77) H1: X不服從不服從 N(209, 42.77)山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂由由 n =120,算得統(tǒng)計量的值,算得統(tǒng)計量的值220.0520.05(1)(92 1)(6)12.592kr) 1(22rk由于由于所以接受所以接受H0,認為,認為X N(209 ,42.77).221()1.1402.kiiiinnpnp=0.05, k

10、=9, r=2. 查表得臨界值查表得臨界值山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂6111(2.5 133 7.5 4520020012.5 15 17.5 422.5 227.5 1)5iiixn x 0, 00,2 . 0)(2 . 0 xxexfx 解解 首先,用樣本觀察值對未知參數首先,用樣本觀察值對未知參數 作極大似然估計。以作極大似然估計。以xi表示區(qū)間表示區(qū)間(ti-1, ti)的中點(也稱為組中值),則的中點(也稱為組中值),則2.0511x故提出假設故提出假設 H0:X服從服從 =0.2的指數分布的指數分布. 當當H0為真時,有為真時,有0,00,1)(2 .

11、0 xxexFx 例例2 對對200個電池做壽命試驗,個電池做壽命試驗,(ti-1,ti)表示以小時計的時間區(qū)間表示以小時計的時間區(qū)間(i=1,2,6),在,在 =0.05下,試檢驗電池壽命下,試檢驗電池壽命X服從指數分布。服從指數分布。組序組序(ti-1, ti)ni1(0, 5)1332(5, 10)453(10, 15)154(15, 20)45(20, 25)26(25, 30)1200山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂2421()1.29iiiinnpnp由由 =0.05 得得991. 5)2() 1(205. 02rk 類似地算出:類似地算出:p3 =0.085

12、5, p4 =0.03147, p5 =0.0016, p6 =0.0043. 各各vi=npi分別為:分別為:126.42, 46.52, 17.10, 6.30, 2.32, 0.84. 由于由于v5和和v6都小于都小于5,且合并后仍小于,且合并后仍小于5,故與,故與v4合并合并.2325. 0)5()10(105212eeFFXPp6321. 01)5()0()5(5011eFFFXPp組序組序nivi=npini-npi(ni-npi)2/npi1133126.426.580.342524546.521.520.049731517.102.100.2579479.462.460.639

13、7 2002001.29 由于由于 2 2 2( (k k- -r r-1)-1),故接受,故接受H0,即認為,即認為X服從參數服從參數 = 0.2的的指數分布。指數分布。山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂516 . 01iiinxnx6 . 0!6 . 0expixii解解 先用極大似然估計法求先用極大似然估計法求 估計值估計值(i =1,2,3,4,5) 例例3 從同類產品中,任取從同類產品中,任取n = 200 批,質檢結果如下表,其中批,質檢結果如下表,其中xi表示各批產品中次品數,表示各批產品中次品數,ni表示有表示有xi件次品的批數,試在件次品的批數,試在顯著顯

14、著性水平性水平 =0.05下,檢驗次品件數下,檢驗次品件數X 服從泊松分布。服從泊松分布。于是認為于是認為F0(x)是參數為是參數為 =0.6的泊松分布的分布函數,分布律為的泊松分布的分布函數,分布律為檢驗假設為檢驗假設為 H0: X服從服從 =0.6的泊松分布的泊松分布序序號號12345xi01234 ni116562242200山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂,5488. 0! 06 . 06 . 001ep32928698. 0! 16 . 06 . 012ep當當 H0成立時,算得成立時,算得2 =2.5509243,由于由于 2 2(kr1),所以接受,所以接受

15、H0,即認為,即認為X服從服從 =0.6的的泊松分布。泊松分布。210. 9) 114() 1(201. 0201. 0rk 類似地算出類似地算出 p3=0.098761, p4=0.0197572, p5=0.00296. 再算出理論頻數再算出理論頻數npi分別為分別為 109.7623,65.8574,19.7572,3.9514,0.5927. 山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂ki 12理論頻數理論頻數)(實測頻數2統(tǒng)計量統(tǒng)計量kiiiinpnpn122)(實質是實質是 選講內容:選講內容: 1. 適合性檢驗適合性檢驗 適合性檢驗適合性檢驗是用樣本提供的信息去推斷總

16、體分布是否適合某是用樣本提供的信息去推斷總體分布是否適合某種已知的規(guī)律。種已知的規(guī)律。 例例4 某地區(qū)某地區(qū)1993年新生嬰兒年新生嬰兒1284個,其中男嬰個,其中男嬰692個,試問嬰個,試問嬰兒的性別比是否正常?兒的性別比是否正常?( =0.01) 解解 檢驗假設為檢驗假設為 H0:男:男:女女=1:1 , H1:男:男:女女1:1 當當H0為真時,有為真時,有山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂7882. 7642)642592(642)642692(22212i理論頻數理論頻數)(實測頻數2635. 6) 1 () 1(201. 02k)1(22k 選講內容:選講內容:

17、 1. 適合性檢驗適合性檢驗對于對于 0.01,查表得臨界值,查表得臨界值由于由于所以拒絕所以拒絕H0,即認為該地區(qū),即認為該地區(qū)1993年新生嬰兒性別的比例失調。年新生嬰兒性別的比例失調。山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂3125.10613399189Av 例例5 按孟德爾遺傳學說,將兩種豌豆雜交后,可產出數量之按孟德爾遺傳學說,將兩種豌豆雜交后,可產出數量之比為比為 9:3:3:1 的的 A、B、C、D 四種不同的種子。今在一試驗中四種不同的種子。今在一試驗中共收了共收了189粒種子,粒種子,A、B、C、D各類型的分別為各類型的分別為102粒、粒、30粒、粒、42粒和

18、粒和5粒。問在粒。問在 =0.01下,該結果是否符合孟德爾遺傳學說的下,該結果是否符合孟德爾遺傳學說的結果結果? 選講內容:選講內容: 1. 適合性檢驗適合性檢驗 解解 檢驗假設為檢驗假設為H0:A:B:C:D=9:3:3:1,即試驗結果適合孟德爾學說,即試驗結果適合孟德爾學說實測頻數為實測頻數為102,30,42和和15,且當,且當H0成立時理論頻數為成立時理論頻數為 同樣可計算出同樣可計算出B、C、D型種子的理論頻數依次為型種子的理論頻數依次為vB=35.4375,vC=35.4375,vD=11.8125.山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂3125.106)3125.

19、106102()(24122i理論頻數理論頻數實測頻數0846.38125.11)8125.1115(4375.35)4375.3542(4375.35)4375.3530(222345.11)3() 1(201. 02k) 1(201. 02k由由 =0.01得臨界值得臨界值由于由于于是有于是有故接受故接受H0,即認為試驗結果與孟德爾學說的結果相符合。,即認為試驗結果與孟德爾學說的結果相符合。 選講內容:選講內容: 1. 適合性檢驗適合性檢驗山東農業(yè)大學 概率論與數理統(tǒng)計 主講人:程述漢 蘇本堂獨立性檢驗是對兩個總體,或兩組資料,或一總體的兩種指獨立性檢驗是對兩個總體,或兩組資料,或一總體的兩種指標(分類、特性、特征)等之間的獨立性所進行的檢驗。因此,標(分類、特性、特征)等之間的獨立性所進行的檢驗。因此,若設若設X和和Y是兩個總體(或一個總體的兩個指標),則其假設應是兩個總體(或一個總體的兩個指標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論