研九講非參數(shù)假設(shè)檢驗(yàn)PPT學(xué)習(xí)教案_第1頁(yè)
研九講非參數(shù)假設(shè)檢驗(yàn)PPT學(xué)習(xí)教案_第2頁(yè)
研九講非參數(shù)假設(shè)檢驗(yàn)PPT學(xué)習(xí)教案_第3頁(yè)
研九講非參數(shù)假設(shè)檢驗(yàn)PPT學(xué)習(xí)教案_第4頁(yè)
研九講非參數(shù)假設(shè)檢驗(yàn)PPT學(xué)習(xí)教案_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、會(huì)計(jì)學(xué)1研九講非參數(shù)假設(shè)檢驗(yàn)研九講非參數(shù)假設(shè)檢驗(yàn) 在前面的課程中,我們已經(jīng)了解了假設(shè)檢驗(yàn)的基本思想,并討論了當(dāng)總體分布為正態(tài)時(shí),關(guān)于其中未知參數(shù)的假設(shè)檢驗(yàn)問(wèn)題 . 然而可能遇到這樣的情形,總體服從何種理論分布并不知道,要求我們直接對(duì)總體分布提出一個(gè)假設(shè) .一一 皮爾遜皮爾遜 擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)2 例如,從1500到1931年的432年間,每年爆發(fā)戰(zhàn)爭(zhēng)的次數(shù)可以看作一個(gè)隨機(jī)變量,椐統(tǒng)計(jì),這432年間共爆發(fā)了299次戰(zhàn)爭(zhēng),具體數(shù)據(jù)如下:第1頁(yè)/共45頁(yè)戰(zhàn)爭(zhēng)次數(shù)X01234 22314248154 發(fā)生 X次戰(zhàn)爭(zhēng)的年數(shù) 在概率論中,大家對(duì)泊松分布產(chǎn)生的一般條件已有所了解,容易想到,每年爆發(fā)戰(zhàn)爭(zhēng)

2、的次數(shù),可以用一個(gè)泊松隨機(jī)變量來(lái)近似描述 . 也就是說(shuō),我們可以假設(shè)每年爆發(fā)戰(zhàn)爭(zhēng)次數(shù)分布X近似泊松分布.第2頁(yè)/共45頁(yè)上面的數(shù)據(jù)能否證實(shí)X 具有泊松分布的假設(shè)是正確的?現(xiàn)在的問(wèn)題是:又如,某鐘表廠對(duì)生產(chǎn)的鐘進(jìn)行精確性檢查,抽取100個(gè)鐘作試驗(yàn),撥準(zhǔn)后隔24小時(shí)以后進(jìn)行檢查,將每個(gè)鐘的誤差(快或慢)按秒記錄下來(lái).問(wèn)該廠生產(chǎn)的鐘的誤差是否服從正態(tài)分布?第3頁(yè)/共45頁(yè)再如,某工廠制造一批骰子,聲稱它是均勻的.為檢驗(yàn)骰子是否均勻,要把骰子實(shí)地投擲若干次,統(tǒng)計(jì)各點(diǎn)出現(xiàn)的頻率與1/6的差距.也就是說(shuō),在投擲中,出現(xiàn)1點(diǎn),2點(diǎn),6點(diǎn)的概率都應(yīng)是1/6.得到的數(shù)據(jù)能否說(shuō)明“骰子均勻”的假設(shè)是可信的?問(wèn)題是

3、:第4頁(yè)/共45頁(yè)K.皮爾遜 這是一項(xiàng)很重要的工作,不少人把它視為近代統(tǒng)計(jì)學(xué)的開(kāi)端. 解決這類問(wèn)題的工具是英國(guó)統(tǒng)計(jì)學(xué)家K.皮爾遜在1900年發(fā)表的一篇文章中引進(jìn)的所謂 檢驗(yàn)法.2 檢驗(yàn)法是在總體X 的分布未知時(shí),根據(jù)來(lái)自總體的樣本,檢驗(yàn)關(guān)于總體分布的假設(shè)的一種檢驗(yàn)方法. 2 本節(jié)我們將介紹本節(jié)我們將介紹2 擬合擬合檢驗(yàn)法檢驗(yàn)法第5頁(yè)/共45頁(yè) H0:總體X的分布函數(shù)為F(x) H1:總體X的分布函數(shù)不是F(x) 然后根據(jù)樣本的經(jīng)驗(yàn)分布和所假設(shè)的理論分布之間的吻合程度來(lái)決定是否接受原假設(shè). 使用 對(duì)總體分布進(jìn)行檢驗(yàn)時(shí),我們先提出原假設(shè):2檢驗(yàn)法 這種檢驗(yàn)通常稱作擬合優(yōu)度檢驗(yàn),它是一種非參數(shù)假設(shè)檢

4、驗(yàn). 擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)2 第6頁(yè)/共45頁(yè) 在用在用 檢驗(yàn)假設(shè)檢驗(yàn)假設(shè)H0時(shí),若在時(shí),若在H0下分布下分布類型已知,但其參數(shù)未知,這時(shí)需要先用極大似類型已知,但其參數(shù)未知,這時(shí)需要先用極大似然估計(jì)法估計(jì)參數(shù),然后作檢驗(yàn)然估計(jì)法估計(jì)參數(shù),然后作檢驗(yàn). 2檢驗(yàn)法分布擬合的 的基本原理和步驟如下:2 檢驗(yàn)法我們只介紹理論分布類型完全已知的情況我們只介紹理論分布類型完全已知的情況(1)將n個(gè)樣本值按大小順序排列,取min1inixa max1inixb 將將a,b并等分成并等分成k個(gè)小區(qū)間(每個(gè)小個(gè)小區(qū)間(每個(gè)小區(qū)間內(nèi)的樣本點(diǎn)數(shù)不要小于區(qū)間內(nèi)的樣本點(diǎn)數(shù)不要小于5個(gè)),用個(gè)),用 表示第表示第i

5、個(gè)個(gè)小區(qū)間小區(qū)間 上上樣本點(diǎn)的個(gè)數(shù)樣本點(diǎn)的個(gè)數(shù). 為頻率為頻率if,1iitt nfi第7頁(yè)/共45頁(yè)原假設(shè)原假設(shè):)()(:0 xFxFH )(xF fi 稱為稱為實(shí)測(cè)頻數(shù)實(shí)測(cè)頻數(shù). ,畫出頻率的直方圖,從直方圖估,畫出頻率的直方圖,從直方圖估 出總體出總體X的分布,定出總體的分布,定出總體X的分布函數(shù)的分布函數(shù)設(shè) 在H0成立的條件下,有1iiitXtPp )()(1 iiitFtFp研究 與 的差異程度?;蛘哒f(shuō) 與 的差ifnfiip inp異程度。異程度。第8頁(yè)/共45頁(yè) kiiiinpnpf122)( iinpf 標(biāo)志著經(jīng)驗(yàn)分布與理論分布之間的差異的大小.皮爾遜引進(jìn)如下統(tǒng)計(jì)量表示經(jīng)驗(yàn)分

6、布與理論分布之間的差異:統(tǒng)計(jì)量 的分布是什么?2 在理論分布已知的條件下,npi是常量實(shí)測(cè)頻數(shù)理論頻數(shù)2.根據(jù)所假設(shè)的理論分布根據(jù)所假設(shè)的理論分布,可以算出總體可以算出總體X的值落入每的值落入每個(gè)個(gè)Ai的概率的概率 pi , 于是于是npi就是落入就是落入Ai的樣本值的的樣本值的理論理論頻數(shù)頻數(shù)第9頁(yè)/共45頁(yè)皮爾遜證明了如下定理: kiiiinpnpf122)( 若原假設(shè)中的理論分布若原假設(shè)中的理論分布F(x)已經(jīng)完全給定已經(jīng)完全給定,那么當(dāng)那么當(dāng) 時(shí),統(tǒng)計(jì)量時(shí),統(tǒng)計(jì)量 n的分布漸近(k-1)個(gè)自由度的 分布.2 如果理論分布F(x)中有r個(gè)未知參數(shù)需用相應(yīng)的估計(jì)量來(lái)代替,那么當(dāng) 時(shí),統(tǒng)計(jì)量

7、 的分布漸近 (k-r-1)個(gè)自由度的 分布.n2 2 為了便于理解,我們對(duì)定理作一點(diǎn)直觀的說(shuō)明.第10頁(yè)/共45頁(yè)是k個(gè)近似正態(tài)的變量的平方和. kiiiinpnpf122)( 這些變量之間存在著一個(gè)制約關(guān)系: kiiiiinpnpfp10)(故統(tǒng)計(jì)量 漸近(k-1)個(gè)自由度的 分布.2 2 在理論分布F(x)完全給定的情況下,每個(gè)pi 都是確定的常數(shù). 由棣莫佛拉普拉斯中心極限定理,當(dāng)n充分大時(shí),實(shí)測(cè)頻數(shù) fi 漸近正態(tài),因此第11頁(yè)/共45頁(yè) 在F(x)尚未完全給定的情況下,每個(gè)未知參數(shù)用相應(yīng)的估計(jì)量代替,就相當(dāng)于增加一個(gè)制約條件,因此,自由度也隨之減少一個(gè). 若有r個(gè)未知參數(shù)需用相應(yīng)的

8、估計(jì)量來(lái)代替,自由度就減少r個(gè).此時(shí)統(tǒng)計(jì)量 漸近(k-r-1)個(gè)自由度的 分布.2 2 根據(jù)這個(gè)定理,對(duì)給定的顯著性水平 , 查 分布表可得臨界值2 2 ,使得 )(22P第12頁(yè)/共45頁(yè) 如果根據(jù)所給的樣本值 X1,X2, ,Xn算得統(tǒng)計(jì)量 的實(shí)測(cè)值落入拒絕域,則拒絕原假設(shè),否則就認(rèn)為差異不顯著而接受原假設(shè).2 得拒絕域:) 1(22k ) 1(22rk (不需估計(jì)參數(shù))(估計(jì)r 個(gè)參數(shù)) 皮爾遜定理是在n無(wú)限增大時(shí)推導(dǎo)出來(lái)的,因而在使用時(shí)要注意 n要足夠大,以及npi 不太小這兩個(gè)條件. 根據(jù)計(jì)算實(shí)踐,要求n不小于50,以及npi 都不小于 5. 否則應(yīng)適當(dāng)合并區(qū)間,使npi滿足這個(gè)要求

9、 .第13頁(yè)/共45頁(yè) 讓我們回到開(kāi)始的一個(gè)例子,檢驗(yàn)每年爆發(fā)戰(zhàn)爭(zhēng)次數(shù)分布是否服從泊松分布.69. 0 X 將有關(guān)計(jì)算結(jié)果列表如下:按參數(shù)為0.69的泊松分布,計(jì)算事件X=i 的概率pi ,pi的估計(jì)是,i=0,1,2,3,4!69. 069. 0iepii提出假設(shè)提出假設(shè)H0: X服從參數(shù)為服從參數(shù)為 的泊松分布的泊松分布 根據(jù)觀察結(jié)果,得參數(shù) 的極大似然估計(jì)為 第14頁(yè)/共45頁(yè)x 0 1 2 3 4fi 223 142 48 15 4 0.58 0.31 0.18 0.01 0.02n 216.7 149.5 51.6 12.0 2.16 iiinpnpf2)(0.1830.376 0.

10、251 1.623戰(zhàn)爭(zhēng)次數(shù)實(shí)測(cè)頻數(shù)ip ip 14.162.43 因H0所假設(shè)的理論分布中有一個(gè)未知參數(shù)(?),故自由度為4-1-1=2.將n 5 的組予以合并,即將發(fā)生3次及4次戰(zhàn)爭(zhēng)的組歸并為一組.ip 第15頁(yè)/共45頁(yè) 故認(rèn)為每年發(fā)生戰(zhàn)爭(zhēng)的次數(shù)X服從參數(shù)為0.69的泊松分布.按按 =0.05,自由度為,自由度為4-1-1=2查查 分布表得分布表得2 =5.991)2(205. 0 2 =2.435.991,由于統(tǒng)計(jì)量2 的實(shí)測(cè)值未落入否定域.第16頁(yè)/共45頁(yè) 奧地利生物學(xué)家孟德?tīng)栠M(jìn)行了長(zhǎng)達(dá)奧地利生物學(xué)家孟德?tīng)栠M(jìn)行了長(zhǎng)達(dá)八年之久的豌豆雜交試驗(yàn)八年之久的豌豆雜交試驗(yàn), 并根據(jù)試驗(yàn)結(jié)并根據(jù)試

11、驗(yàn)結(jié)果果,運(yùn)用他的數(shù)理知識(shí)運(yùn)用他的數(shù)理知識(shí), 發(fā)現(xiàn)了遺傳的基本發(fā)現(xiàn)了遺傳的基本規(guī)律規(guī)律. 在此,我們以遺傳學(xué)上的一項(xiàng)偉大發(fā)現(xiàn)為例,說(shuō)明統(tǒng)計(jì)方法在研究自然界和人類社會(huì)的規(guī)律性時(shí),是起著積極的、主動(dòng)的作用.孟德?tīng)柕?7頁(yè)/共45頁(yè)子二代子一代黃色純系綠色純系他的一組觀察結(jié)果為:黃70,綠27近似為2.59:1,與理論值相近. 根據(jù)他的理論,子二代中, 黃、綠之比 近似為3:1,第18頁(yè)/共45頁(yè) 由于隨機(jī)性,觀察結(jié)果與3:1總有些差距,因此有必要去考察某一大小的差異是否已構(gòu)成否定3:1理論的充分根據(jù),這就是如下的檢驗(yàn)問(wèn)題.這里,n=70+27=97, k=2,檢驗(yàn)孟德?tīng)柕?:1理論:提出假設(shè)H0:

12、 p1=3/4, p2=1/4理論頻數(shù)為: np1=72.75, np2=24.25實(shí)測(cè)頻數(shù)為70,27.第19頁(yè)/共45頁(yè)2 由于統(tǒng)計(jì)量的實(shí)測(cè)值2122)(iiiinpnpf 統(tǒng)計(jì)量) 1 (2 自由度為k-1=12 =0.41583.841,按按 =0.05,自由度為,自由度為1,查,查 分布表得分布表得2 =3.841) 1 (205. 0 未落入否定域.故認(rèn)為試驗(yàn)結(jié)果符合孟德?tīng)柕?:1理論.第20頁(yè)/共45頁(yè) 這些試驗(yàn)及其它一些試驗(yàn),都顯 示孟德?tīng)柕?: 1理論與實(shí)際是符合的. 這本身就是統(tǒng)計(jì)方法在科學(xué)中的一項(xiàng) 重要應(yīng)用.用于客觀地評(píng)價(jià)理論上的某個(gè)結(jié)論是否與觀察結(jié)果相符,以作為該理論是

13、否站得住腳的印證.第21頁(yè)/共45頁(yè) 3.5.2皮爾遜皮爾遜 擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn) (二二)理論分布帶參數(shù)的情況理論分布帶參數(shù)的情況 2 在許多實(shí)際問(wèn)題中在許多實(shí)際問(wèn)題中,理論分布常常只是類型已知理論分布常常只是類型已知,但但其中含有若干個(gè)未知參數(shù)。例如其中含有若干個(gè)未知參數(shù)。例如,未知未知20,)(),;( xxF這這 時(shí)檢驗(yàn)問(wèn)題為時(shí)檢驗(yàn)問(wèn)題為),;()(:100mxFxFH 第22頁(yè)/共45頁(yè)m1,設(shè)分別為當(dāng)分別為當(dāng)H。成立時(shí)未知參數(shù)。成立時(shí)未知參數(shù)m,1的點(diǎn)估計(jì)的點(diǎn)估計(jì),記記)(1m,計(jì)算計(jì)算kiaFaFpiii, 2 , 1, );();(100iipp 代替用得到得到Pearso

14、n統(tǒng)計(jì)量統(tǒng)計(jì)量)17. 3()(122kiiiipnpnnRAFisher證明了對(duì)滿足一定條件的點(diǎn)估計(jì)證明了對(duì)滿足一定條件的點(diǎn)估計(jì)m1,上述統(tǒng)計(jì)量上述統(tǒng)計(jì)量 的極限分布為的極限分布為2) 1(2mk第23頁(yè)/共45頁(yè)于是于是H。的否定域?yàn)?。的否定域?yàn)? 1(212mk由于按由于按Fisher的條件去求點(diǎn)估計(jì)量的條件去求點(diǎn)估計(jì)量m1,往需要用數(shù)值方法求解。為此往需要用數(shù)值方法求解。為此,在實(shí)際應(yīng)用當(dāng)中在實(shí)際應(yīng)用當(dāng)中,常用常用很麻煩很麻煩,往往m,1的極大似然估計(jì)代替的極大似然估計(jì)代替m1,這時(shí)統(tǒng)計(jì)量這時(shí)統(tǒng)計(jì)量2的極限分布不一定是的極限分布不一定是) 1(2mk這時(shí)仍取這時(shí)仍取) 1(212mk作

15、為作為H。的否定域。的否定域。現(xiàn)在我們以現(xiàn)在我們以X為一維為例把為一維為例把Pearson 檢驗(yàn)的具體做檢驗(yàn)的具體做法歸納如下法歸納如下:2第24頁(yè)/共45頁(yè)(1)將總體)將總體X的值域的值域(-,)劃分為劃分為 個(gè)互不相交的區(qū)間個(gè)互不相交的區(qū)間 的大小和作直方圖時(shí)一致的大小和作直方圖時(shí)一致,但注意使但注意使 每個(gè)每個(gè) 或或 不能太小,一般不要小于不能太小,一般不要小于5kkkiIi., 2 , 1,ipninp(2)在)在H。成立之下。成立之下,求出未知參數(shù)的極大似然估計(jì)求出未知參數(shù)的極大似然估計(jì);(3)在)在H。 成立的條件下成立的條件下,計(jì)算計(jì)算 或或 之值之值;ipip (4)算出)算

16、出 中樣本值的個(gè)數(shù)中樣本值的個(gè)數(shù),并計(jì)算并計(jì)算Pearson統(tǒng)計(jì)量的統(tǒng)計(jì)量的 值值 ;iI2(5)查查 分布表分布表,找出找出 或或 2) 1(21mk) 1(21k第25頁(yè)/共45頁(yè)(vi)若)若 或或 則拒絕則拒絕H。,否則接受否則接受H。) 1(212mk) 1(212k例例3.161991年某校工科研究生有年某校工科研究生有60名以數(shù)理統(tǒng)計(jì)作為名以數(shù)理統(tǒng)計(jì)作為學(xué)位課學(xué)位課,考試成績(jī)?nèi)缦驴荚嚦煽?jī)?nèi)缦?93 75 83 93 91 85 84 82 77 76 77 95 9489 91 88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 75 66

17、85 70 94 84 83 82 8078 74 73 76 70 86 76 90 89 71 66 86 73 80 94 79 78 77 63 53 55第26頁(yè)/共45頁(yè)試問(wèn)考試成績(jī)是否服從正態(tài)分布試問(wèn)考試成績(jī)是否服從正態(tài)分布)10. 0(解:解:設(shè)設(shè)X為考試成績(jī)?yōu)榭荚嚦煽?jī),其分布函數(shù)為其分布函數(shù)為F(x),則檢驗(yàn)問(wèn)題為則檢驗(yàn)問(wèn)題為)()(:0 xxFH我們知道成績(jī)分不及格我們知道成績(jī)分不及格(60以下以下),及格及格(6070),中中(7080),良良(8090),優(yōu)優(yōu)(90以上以上)故我們?nèi)」饰覀內(nèi)?90,80,70,604321aaaa它們將實(shí)軸分成它們將實(shí)軸分成5個(gè)互不相交

18、的區(qū)間個(gè)互不相交的區(qū)間,從而將樣本分成從而將樣本分成5組。在組。在H。成立的條件下成立的條件下,參數(shù)參數(shù) 的極大似然估計(jì)為的極大似然估計(jì)為2,226 . 9,80計(jì)算計(jì)算)5 , 4 , 3 , 2 , 1(ipi表示表示 服從正太分布服從正太分布)(xFniiniiXXnx1221)(1,n1極大似然估計(jì)公式:第27頁(yè)/共45頁(yè)0188. 0)8 . 2(1)8 . 2()6 . 98060(1 p1304. 00188. 0)04. 1(0188. 0)6 . 98070(2 p3508. 01492. 05 . 0)04. 1()6 . 98080(3 p3508. 05 . 08508

19、. 05 . 0)6 . 98090(4 p1492. 08508. 01)6 . 98090(15 p第28頁(yè)/共45頁(yè)因?yàn)橐驗(yàn)?128. 10188. 0601 pn所以我們把第一、二個(gè)區(qū)間合并成一個(gè)所以我們把第一、二個(gè)區(qū)間合并成一個(gè),這樣共有這樣共有4個(gè)個(gè)不相交的區(qū)間不相交的區(qū)間,相應(yīng)的樣本分成相應(yīng)的樣本分成4組組,并列表并列表622. 04685. 0952. 81492. 011),9040001. 0048.213508. 021)90,8030522. 0048.213508. 020)80,7021012. 0952. 81492. 08)70,(160)60(60)(21 i

20、iiiiiiippnppnaai第29頁(yè)/共45頁(yè)而而706. 2)1()1(29 . 021 mk查附表查附表4得得故接受故接受H。認(rèn)為考試成績(jī)服從正態(tài)分布。認(rèn)為考試成績(jī)服從正態(tài)分布。 三三 方法用于檢驗(yàn)獨(dú)立性方法用于檢驗(yàn)獨(dú)立性706. 2622. 02 2 每個(gè)人按其是否吸煙可分成兩類每個(gè)人按其是否吸煙可分成兩類,按其是否患有某種按其是否患有某種疾病也可分成兩類。如要研究在某個(gè)行業(yè)工作的人中疾病也可分成兩類。如要研究在某個(gè)行業(yè)工作的人中,吸煙與患肺癌是否有關(guān)吸煙與患肺癌是否有關(guān),則可從這一群人中隨機(jī)抽取若則可從這一群人中隨機(jī)抽取若干個(gè)干個(gè),一一記錄其是否吸煙和是否患肺癌一一記錄其是否吸煙和

21、是否患肺癌,用所得資料用所得資料去去進(jìn)行統(tǒng)計(jì)分析。進(jìn)行統(tǒng)計(jì)分析。第30頁(yè)/共45頁(yè) 這類問(wèn)題在應(yīng)用上很常見(jiàn)這類問(wèn)題在應(yīng)用上很常見(jiàn),理論模型是理論模型是:設(shè)隨機(jī)向量設(shè)隨機(jī)向量(X,Y),X的可能取值是的可能取值是1,2,.,r,Y的可能取值是的可能取值是1,2,.,s.現(xiàn)在對(duì)現(xiàn)在對(duì)(X,Y) 進(jìn)行了進(jìn)行了n次獨(dú)立觀察次獨(dú)立觀察,發(fā)現(xiàn)發(fā)現(xiàn)“X=i,Y=j”的次的次數(shù)為數(shù)為 ,要據(jù)此檢驗(yàn)要據(jù)此檢驗(yàn)ijn)(獨(dú)立獨(dú)立與與18. 3:0YXH這個(gè)假設(shè)。若記這個(gè)假設(shè)。若記F(x,y)為為(X,Y)的聯(lián)合分布函數(shù)的聯(lián)合分布函數(shù), 為為X的分布函數(shù)的分布函數(shù), 為為Y的分布函數(shù)的分布函數(shù),則則X與與Y獨(dú)立獨(dú)立

22、,就是對(duì)任意實(shí)數(shù)就是對(duì)任意實(shí)數(shù)(x,y)有有)(1xF)(2xF)19. 3()()(),(21xFxFyxF 第31頁(yè)/共45頁(yè)在這種問(wèn)題中在這種問(wèn)題中,常把數(shù)據(jù)排列為如下表常把數(shù)據(jù)排列為如下表第32頁(yè)/共45頁(yè)這種表稱為列聯(lián)表這種表稱為列聯(lián)表(Contingency Table).表中表中記 riijjsjijinnnn11,jiijpjYPpiXPpjYiXP )(,)(,),(如果獨(dú)立性成立如果獨(dú)立性成立,則對(duì)一切則對(duì)一切i和和j,有有jiijppp 因此檢驗(yàn)問(wèn)題變成因此檢驗(yàn)問(wèn)題變成)20. 3(, 2 , 1;, 2 , 1,:0sjripppHjiij 第33頁(yè)/共45頁(yè)如果如果

23、已知已知,則我們可以按則我們可以按Pearson 統(tǒng)計(jì)量的建統(tǒng)計(jì)量的建立方法立方法,令令 ijp2 riijijijsjnpnpn1212)( 則由則由Pearson的結(jié)論知的結(jié)論知 以以 為極限分布。為極限分布。但這里但這里 并不知道并不知道,因此因此,我們可用它們的極大似然估我們可用它們的極大似然估計(jì)計(jì) 代替。注意到代替。注意到H。 成立時(shí)成立時(shí),2 )1(2 rs ijpijp 因此因此,這等價(jià)于求這等價(jià)于求 的極大似然估計(jì)的極大似然估計(jì),類似例類似例2.9,注注意到意到j(luò)ipp jiijppp 第34頁(yè)/共45頁(yè) 111111sjjsriirpppp和關(guān)于關(guān)于 的似然函數(shù)為的似然函數(shù)為

24、jipp )21. 3(1 1 )(1111111111 sjnjrininsjjnriinrisjjijisrijppppppL作方程組。作方程組。)22. 3(1, 2 , 10log1, 2 , 10log sjLpriLpji第35頁(yè)/共45頁(yè)解得解得 的極大似然估計(jì)為的極大似然估計(jì)為jipp )23. 3(, 2 , 1, 2 , 1,sjnnprinnpjjii 從而得到統(tǒng)計(jì)量從而得到統(tǒng)計(jì)量)24. 3() 1()()(1211211212 rijiijsjrijijiijsjrijijiijsjnnnnnnnnnnnppnppnn第36頁(yè)/共45頁(yè)在在H。成立的條件下。成立的條件

25、下,當(dāng)當(dāng)n時(shí)時(shí), 的極限分布為的極限分布為2)1)(1()12(22 srsrrs 因此因此,可取可取)1)(1(221 sr 作為作為H。的拒絕域,當(dāng)。的拒絕域,當(dāng)n很大時(shí)很大時(shí),這檢驗(yàn)的真實(shí)水平接近這檢驗(yàn)的真實(shí)水平接近 對(duì)對(duì)X、Y連續(xù)取值的情況連續(xù)取值的情況,與(一)中的與(一)中的2類似類似,可以將其可以將其離散化:設(shè)離散化:設(shè)為(為(X,Y)的樣本。具體做法)的樣本。具體做法:),( ,),(),(2211nnYXYXYX2第37頁(yè)/共45頁(yè)(1)將將X的觀察值范圍(一的觀察值范圍(一,)分成)分成r個(gè)互不相交的個(gè)互不相交的區(qū)間區(qū)間,將將Y的觀察值范圍(一的觀察值范圍(一,)分成)分成

26、s個(gè)互不相交個(gè)互不相交的區(qū)間的區(qū)間,這樣就組成了這樣就組成了rs個(gè)互不相交的小矩形個(gè)互不相交的小矩形;(2)求出樣本落入各個(gè)小矩形的實(shí)測(cè)頻數(shù)求出樣本落入各個(gè)小矩形的實(shí)測(cè)頻數(shù);(3)當(dāng)當(dāng)H。成立時(shí)。成立時(shí),建立統(tǒng)計(jì)量建立統(tǒng)計(jì)量) 1()(1211212 rijiijsjrijijiijsjnnnnnnnnnnn第38頁(yè)/共45頁(yè)當(dāng)當(dāng)n充分大時(shí)充分大時(shí), 漸近于漸近于 分布。分布。在水平在水平 下下,當(dāng)當(dāng) 時(shí)時(shí),拒絕拒絕 H。 否則就接受否則就接受H。)1)(1(2 sr 2 )1)(1(221 sr 特別特別,當(dāng)當(dāng)r=s=2時(shí)時(shí),得到得到22列聯(lián)表列聯(lián)表,也常稱為四格表也常稱為四格表(Fourf

27、old Table)是應(yīng)用最廣的一種是應(yīng)用最廣的一種,這時(shí)這時(shí))25. 3 ()(21212211222112nnnnnnnnn極限分布為極限分布為 )1(2 第39頁(yè)/共45頁(yè)例例3.2 某研究所推出一種感冒特效新藥某研究所推出一種感冒特效新藥,為證明為證明其療效其療效,選擇選擇200名患者為志愿者名患者為志愿者,將他們均分為兩將他們均分為兩組組,分別不服藥或服藥分別不服藥或服藥,觀察三日后痊愈的情況觀察三日后痊愈的情況,得出得出下列數(shù)據(jù)下列數(shù)據(jù)痊愈痊愈者者未痊愈者未痊愈者合合 計(jì)計(jì)未服藥未服藥者者 服藥者服藥者合合 計(jì)計(jì)48 52 10056 44 100 104 96 200 問(wèn)新藥是否確有明顯療效問(wèn)新藥是否確有明顯療效?第40頁(yè)/共45頁(yè)例例3.17見(jiàn)例見(jiàn)例3.2題中設(shè)題中設(shè) =0.25解解:每個(gè)對(duì)象考察兩個(gè)指標(biāo)每個(gè)對(duì)象考察兩個(gè)指標(biāo):X一一是否痊愈一一是否痊愈,Y一一是否一

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論