數(shù)理統(tǒng)計(jì)假設(shè)檢驗(yàn)_第1頁
數(shù)理統(tǒng)計(jì)假設(shè)檢驗(yàn)_第2頁
數(shù)理統(tǒng)計(jì)假設(shè)檢驗(yàn)_第3頁
數(shù)理統(tǒng)計(jì)假設(shè)檢驗(yàn)_第4頁
數(shù)理統(tǒng)計(jì)假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1.假設(shè)檢驗(yàn)的基本概念假設(shè)檢驗(yàn)的基本概念2.Neyman-Pearson范式范式3.和假設(shè)檢驗(yàn)有關(guān)的兩個(gè)問題和假設(shè)檢驗(yàn)有關(guān)的兩個(gè)問題4.廣義似然比檢驗(yàn)廣義似然比檢驗(yàn)5.單樣本檢驗(yàn)的幾個(gè)實(shí)例單樣本檢驗(yàn)的幾個(gè)實(shí)例6.兩個(gè)樣本的比較兩個(gè)樣本的比較7.實(shí)驗(yàn)設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì) 理解假設(shè)檢驗(yàn)的直觀概念和理解假設(shè)檢驗(yàn)的直觀概念和Neyman-Pearson范式范式 了解假設(shè)檢驗(yàn)方法的可能缺陷了解假設(shè)檢驗(yàn)方法的可能缺陷 掌握廣義似然比檢驗(yàn)掌握廣義似然比檢驗(yàn) 掌握正態(tài)、多項(xiàng)、泊松總體的假設(shè)檢驗(yàn)掌握正態(tài)、多項(xiàng)、泊松總體的假設(shè)檢驗(yàn) 掌握掌握Hanging Rootogram和概率圖和概率圖 掌握兩個(gè)獨(dú)立樣本的比較掌握兩個(gè)

2、獨(dú)立樣本的比較 理解實(shí)驗(yàn)設(shè)計(jì)理解實(shí)驗(yàn)設(shè)計(jì)假設(shè)檢驗(yàn)的基本概念假設(shè)檢驗(yàn)的基本概念Neyman-Pearson范式范式 Neyman-Pearson引理引理 顯著性水平的確定和顯著性水平的確定和p-值值一致最優(yōu)檢驗(yàn)一致最優(yōu)檢驗(yàn)和假設(shè)檢驗(yàn)有關(guān)的兩個(gè)問題和假設(shè)檢驗(yàn)有關(guān)的兩個(gè)問題置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系如何選擇原假設(shè)如何選擇原假設(shè)廣義似然比檢驗(yàn)廣義似然比檢驗(yàn) 廣義似然比方法廣義似然比方法 多項(xiàng)分布的廣義似然比檢驗(yàn)多項(xiàng)分布的廣義似然比檢驗(yàn) 泊松分布的廣義似然比檢驗(yàn)泊松分布的廣義似然比檢驗(yàn)單樣本檢驗(yàn)的幾個(gè)實(shí)例單樣本檢驗(yàn)的幾個(gè)實(shí)例兩個(gè)樣本的比較兩個(gè)樣本的比較1.假設(shè)檢驗(yàn)的基本概念

3、假設(shè)檢驗(yàn)的基本概念 硬幣猜測游戲硬幣猜測游戲 用似然比用似然比likelihood ratio和和貝葉斯方法處理這個(gè)問題貝葉斯方法處理這個(gè)問題 正面朝上的概率硬幣0 0.5硬幣1 0.7猜硬幣中的似然比 如果你在10次拋擲中看到2次正面朝上。則P0(2)/P1(2)=30。這就是似然比。 硬幣0出現(xiàn)這個(gè)結(jié)果的機(jī)會(huì)是硬幣1的30倍0000(, )( |) ()(| )( )( )P HxP x HP HP HxP xP x000111(|)()(|)(|)()(|)P HxP HP x HP HxP HP x H猜硬幣中的似然比 根據(jù)拋擲結(jié)果計(jì)算出的后驗(yàn)概率成為評(píng)判根據(jù)拋擲結(jié)果計(jì)算出的后驗(yàn)概率成

4、為評(píng)判標(biāo)準(zhǔn)標(biāo)準(zhǔn)C是臨界值是臨界值critical value猜硬幣中的錯(cuò)判概率 假定c=1。則判別規(guī)則如下: 因?yàn)榻Y(jié)果有隨機(jī)性,這個(gè)規(guī)則導(dǎo)致錯(cuò)判 錯(cuò)誤分成兩類:H0為真的時(shí)候拒絕H0, H0為假的時(shí)候接受H0006,;6,XHXH則接受則拒絕臨界值c對(duì)錯(cuò)判概率的影響 假定c=0.1,即先驗(yàn)概率有差異 不用貝葉斯方法不用貝葉斯方法 規(guī)避了先驗(yàn)概率的決定規(guī)避了先驗(yàn)概率的決定 對(duì)兩個(gè)假設(shè)區(qū)別對(duì)待,一個(gè)成為原假設(shè)對(duì)兩個(gè)假設(shè)區(qū)別對(duì)待,一個(gè)成為原假設(shè)H0(null hypotheses),另一個(gè)成為備擇,另一個(gè)成為備擇假設(shè)假設(shè)H1(alternative hypotheses) 由此導(dǎo)致在有些場合下選擇原

5、假設(shè)的困難由此導(dǎo)致在有些場合下選擇原假設(shè)的困難 第第I類錯(cuò)誤類錯(cuò)誤(Type I Error),H0為真的時(shí)候拒絕為真的時(shí)候拒絕H0 檢驗(yàn)的顯著性水平檢驗(yàn)的顯著性水平(significance level),第,第I類類錯(cuò)誤的概率,通常記為錯(cuò)誤的概率,通常記為 第第II類錯(cuò)誤類錯(cuò)誤(Type I Error),H0為假的時(shí)候接受為假的時(shí)候接受H0,其概率記為,其概率記為 檢驗(yàn)的功效檢驗(yàn)的功效(power), H0為假的時(shí)候拒絕為假的時(shí)候拒絕H0,其概率記為其概率記為 檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量(test statistics) 拒絕域拒絕域(rejection region)和接受域和接受域(acc

6、eptance region) 原分布原分布(null distribution),在原假設(shè)為真的條,在原假設(shè)為真的條件檢驗(yàn)統(tǒng)計(jì)量所服從的分布件檢驗(yàn)統(tǒng)計(jì)量所服從的分布1,nXX2是來自正態(tài)總體的隨機(jī)樣本總體方差已知0011:HH事先給定顯著性水平20210211211exp()2( )( )1exp()2niiniiXffXXX方差已知的正態(tài)2201102)nXnn(0000()/XxP XxPnn00( )/xzn置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系0011:HH00|Xx00|PXx0(/2)Xxz0|(/2)XXz0(/2)(/2)XXzXz(/2),(/2)XXXz

7、Xz置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理A引理A )() :( )100 1)C XXA 0000假定對(duì)中的每個(gè)都存在一個(gè)假設(shè)H : =的 水平為 的檢驗(yàn),該檢驗(yàn)的接收域記為A(。則是 的一個(gè)(的置信區(qū)間。 置信區(qū)間和假設(shè)檢驗(yàn):引理置信區(qū)間和假設(shè)檢驗(yàn):引理A證明證明A是一個(gè)檢驗(yàn)在水平 下的接收域,所以有00()|1PA X引理A證明 則按照則按照C(X)的定義的定義0000( )|()|1PCPA XX置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理B00000()100 1)%( )|1()|( )C XPCAC XXX00假定是 的一個(gè)(

8、的置信域,即對(duì)每個(gè)都有則假設(shè)H : = 的一個(gè)檢驗(yàn)的水平為 的一個(gè)接收域?yàn)橐鞡 證明 0000()|( )|1PAPC XX廣義似然比檢驗(yàn)廣義似然比檢驗(yàn)(Generalized Likelihood Ratio Test)似然比檢驗(yàn)在對(duì)兩個(gè)簡單假設(shè)進(jìn)行檢驗(yàn)的時(shí)候是最優(yōu)的。本節(jié)介紹的廣義似然比檢驗(yàn)將能夠處理比較復(fù)雜的假設(shè)形式。其原理和似然比有相似之處。1001101(,)( | ),nXXfHHXx假定觀測值有一個(gè)聯(lián)合密度或者頻數(shù)函數(shù)。規(guī)定規(guī)定。一個(gè)比較自然的度量兩個(gè)假設(shè)可信程度的指標(biāo)是兩個(gè)假設(shè)的似然比。廣義似然比檢驗(yàn)廣義似然比檢驗(yàn)因?yàn)樵趦蓚€(gè)假設(shè)中,參數(shù)都有多個(gè)可能取值,所以在可能的參數(shù)集合上

9、取最大值是一個(gè)可以考慮的 01*maxlik( )maxlik( )0*maxlik( )maxlik( ) 出于數(shù)學(xué)處理上的考慮,把分母改成在整個(gè)參數(shù)集合上取最大值廣義似然比檢驗(yàn):廣義似然比檢驗(yàn):方差未知正態(tài)總體的均值檢驗(yàn)方差未知正態(tài)總體的均值檢驗(yàn)2100100010,i.i.d.:,|,nXXHH 正態(tài)分布,均值為 ,方差未知。要檢驗(yàn)的假設(shè)為在這里充當(dāng)三個(gè)參數(shù)空間分別為0*maxlik( )maxlik( ) 看的分子和分母0,是單點(diǎn) 分子很簡單分母要在整個(gè)實(shí)數(shù)域上求最大值這個(gè)問題已經(jīng)解決過廣義似然比檢驗(yàn):廣義似然比檢驗(yàn):方差未知正態(tài)總體的均值檢驗(yàn)方差未知正態(tài)總體的均值檢驗(yàn)20211exp

10、()2niniX似然比統(tǒng)計(jì)量的分子是122211exp()2niniXX似然比統(tǒng)計(jì)量的分母是122202111exp()()2nniiiiXXX 22021112log()()nniiiiXXX 廣義似然比檢驗(yàn):廣義似然比檢驗(yàn):方差未知正態(tài)總體的均值檢驗(yàn)方差未知正態(tài)總體的均值檢驗(yàn)22200112200()()()-2ln()nniiiiXXXn Xn XH 利用恒等式可知在/比較大的時(shí)候應(yīng)該拒絕多項(xiàng)分布的廣義似然比檢驗(yàn)多項(xiàng)分布的廣義似然比檢驗(yàn)100011:( ),!max( )( )!mxxmpmHppnppxx .則似然比的分子是考慮多項(xiàng)分布的似然比檢驗(yàn)??紤]多項(xiàng)分布的似然比檢驗(yàn)。1111:

11、,!max( )( )!mxxmpmHmmnppxx如果有 個(gè)格子是不受約束的.即所有元素之和為1的維非負(fù)向量.似然比的分母是多項(xiàng)分布的廣義似然比檢驗(yàn)多項(xiàng)分布的廣義似然比檢驗(yàn)/iipxn根據(jù)前面學(xué)過的極大似然估計(jì),分母在時(shí)取最大值1111111!( )( )!( )!mimxxxmmmixxiimmnppxxpnpppxx 似然比是11,( )2log2log2logiimmiiiiiiiixnppOnpOEp 由于有 ,( )iiiiOnp Enp其中Pearson卡方統(tǒng)計(jì)量和似然比卡方統(tǒng)計(jì)量和似然比221( )( )miiiiPearsonxnpnp 通常用來檢驗(yàn)擬合優(yōu)度(goodness

12、 of fit)的卡方(chi-square)統(tǒng)計(jì)量可以證明在H0成立的條件下,Pearson統(tǒng)計(jì)量和似然比漸近等價(jià),這里用Taylor展開做一直觀解釋。 Pearson卡方統(tǒng)計(jì)量和似然比卡方統(tǒng)計(jì)量和似然比12log2log( )miiiipnpp 002000( )logTaylor11( )()()2xf xxxxf xxxxxx在 附近的展開為211( )2log2( )( )mmiiiiiiippnppnp 21( )( )miiiinxnpnp右邊第一項(xiàng)為0,這是因?yàn)閮山M概率之和都等于1。右邊第二項(xiàng)求和號(hào)里面分子分母同乘以 可得Handy-Weinberg均衡均衡 在參數(shù)估計(jì)的例子中

13、引入了Handy-Weinberg均衡.4247對(duì) 進(jìn)行最大似然估計(jì),得到估計(jì)值Bacterial Clump 用顯微鏡檢查用顯微鏡檢查0.01毫升牛奶中的細(xì)菌群的數(shù)量毫升牛奶中的細(xì)菌群的數(shù)量.計(jì)量方法是每個(gè)方格子里的數(shù)量計(jì)量方法是每個(gè)方格子里的數(shù)量 看起來用泊松分布是不錯(cuò)的看起來用泊松分布是不錯(cuò)的 以下數(shù)據(jù)來自以下數(shù)據(jù)來自Bliss and Fisher (1953)2.44Bacterial Clump22675.4,6,(0.005)18.55 自由度為Fisher重新檢驗(yàn)孟德爾重新檢驗(yàn)孟德爾(Mendel)的數(shù)據(jù)的數(shù)據(jù)現(xiàn)代基因理論的結(jié)果現(xiàn)代基因理論的結(jié)果孟德爾的觀測結(jié)果孟德爾的觀測結(jié)果

14、2log.618 Pearson卡方統(tǒng)計(jì)量卡方統(tǒng)計(jì)量0.604泊松散布度檢驗(yàn)泊松散布度檢驗(yàn)(dispersion test)1,nnxx1給定一組計(jì)數(shù)結(jié)果要檢驗(yàn)的原假設(shè)是這些結(jié)果來自同一個(gè)參數(shù)為 的泊松分布,備擇假設(shè)是來自參數(shù)分別為的泊松分布泊松分布的特點(diǎn)是均值和方差相等111/!/!iiiiinxxinxxinxiiiiiXnexxexex 原假設(shè)下的 的極大似然估計(jì)是。分母中的 意味著個(gè)不同的參數(shù)。則似然比等于泊松散布度檢驗(yàn)泊松散布度檢驗(yàn)(dispersion test)112log2log()2logniiiiniiixxxxxxxx 似然比檢驗(yàn)統(tǒng)計(jì)量為2112log()niixxx 利

15、用泰勒展開可以得到一個(gè)近似表達(dá)式泊松散布度檢驗(yàn)泊松散布度檢驗(yàn)(dispersion test)近似公式可以有如下解釋:等于方差估計(jì)值除以近似公式可以有如下解釋:等于方差估計(jì)值除以均值估計(jì)值的比率的均值估計(jì)值的比率的n倍倍泊松分布的方差和均值相等,但一般情況下的數(shù)據(jù)泊松分布的方差和均值相等,但一般情況下的數(shù)據(jù)的方差大于均值。因此這個(gè)檢驗(yàn)稱為散布度檢驗(yàn)的方差大于均值。因此這個(gè)檢驗(yàn)稱為散布度檢驗(yàn)比如負(fù)二項(xiàng)分布和泊松分布相比就具有比如負(fù)二項(xiàng)分布和泊松分布相比就具有更大的散布程度更大的散布程度2 / x比率有時(shí)用來計(jì)量集群程度泊松散布度檢驗(yàn):石棉纖維泊松散布度檢驗(yàn):石棉纖維泊松散布度檢驗(yàn):細(xì)菌菌落泊松散

16、布度檢驗(yàn):細(xì)菌菌落22.44,4.591.88Pearsonx在細(xì)菌菌落例子里,我們用卡方檢驗(yàn)來檢驗(yàn)牛奶中的菌落數(shù)是否服從泊松分布。這批數(shù)據(jù)的方差對(duì)均值的比等于而不是12752.7nTx檢驗(yàn)統(tǒng)計(jì)量399p在原假設(shè)下,檢驗(yàn)統(tǒng)計(jì)量服從自由度為的卡方分布。這里可以利用正態(tài)近似估算該統(tǒng)計(jì)量的 值。399752.7399(752.7)2 3992 399 1(12.5)0TP TP 更多的評(píng)估擬合優(yōu)度的方法 Hanging rootograms Probability plots 正態(tài)性檢驗(yàn)Hanging rootograms 原理:用圖象展示觀測值和擬合值的直方圖之間的差異 演示數(shù)據(jù):來自Martin

17、, Gudzinowicz and Fanger 1975,共152 通常會(huì)用正態(tài)分布來擬合所得到的數(shù)據(jù)Hanging rootograms-1(,)jjxx根據(jù)觀測值可以估計(jì)均值和標(biāo)準(zhǔn)差如果服從的是正態(tài)分布,則觀測值落在區(qū)間的概率應(yīng)該是1jjjxxxxp ,jjnjnnp樣本量為則落入第 個(gè)區(qū)間的觀測值個(gè)數(shù)的期望值或者擬合值等于Hanging rootogramshanging histogramjjnn畫出的直方圖,可以得到差異的Probability plots(1)(2)( )( )0,1,(order statisitcs)()1njXXXjE Xn考慮來自均勻分布的樣本量為n的樣本

18、。將排序后的樣本取值記為這些是所謂的次序統(tǒng)計(jì)量??梢宰C明要對(duì)一組數(shù)據(jù)對(duì)某個(gè)理論分布的擬合程度進(jìn)行定性判斷,概率圖是極為有用的一種圖形工具這意味著可以比較排序后的觀測值和它們的期望值Probability plots(1)( ),1/(1), /(1)nXXnn n具體方法是繪制排序后的觀測值和期望值的散點(diǎn)圖均勻均勻概率圖均勻均勻概率圖Probability plots1100,YYYY假定生成的方法是每個(gè) 都等于兩個(gè)獨(dú)立的均勻分布隨機(jī)變量的均值。則 應(yīng)該服從三角而不是均勻分布4 ,00.5( )44 ,0.51yyf yyy(1)( ),1/(1), /(1)nYYnn n繪制和的散點(diǎn)圖。概率

19、圖概率圖00.20.40.60.810.00.20.40.60.81.0顯然這條曲線不是線性的均勻均勻-三角概率圖三角概率圖概率圖:概率積分變換概率圖:概率積分變換probability integral transformation()0,1XXYFX如果連續(xù)型隨機(jī)變量 有嚴(yán)格遞增的累積分布函數(shù),則服從上的均勻分布。1( ),()/(1)nkXXF Xkn給定樣本,繪制對(duì)的散點(diǎn)圖。其等價(jià)形式是1( )1kkXFn對(duì)概率圖:特定的概率圖:特定的F(x)( )FxF xG有些 的形式為是位置參數(shù)是尺度參數(shù)( )11( )11kkXkGnkXGn繪制散點(diǎn)圖對(duì)或者對(duì)1()1kkXGn如果模型無誤,則

20、有概率圖:概率圖:Michelson光速測定實(shí)驗(yàn)結(jié)果光速測定實(shí)驗(yàn)結(jié)果正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)31134114coefficient of skewness1()coefficient of kurtosis1()niiniiXXnbsXXnbs樣本的偏度系數(shù)樣本的峰度系數(shù)正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)比較兩個(gè)獨(dú)立樣本比較兩個(gè)獨(dú)立樣本(Independent Samples)比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布2121,nXmYXXYY來自均值為方差為的正態(tài)分布;來自均值為方差也為的正態(tài)分布XY如果把 理解為處理組的觀測值則 可以理解為對(duì)照組的觀測值XYXY計(jì)量差異

21、,其估計(jì)量為211,XYXYNnm 比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布方差已知方差已知2()()(0,1)11XYXYZXYZNnm如果已知,則可以根據(jù)下面的 構(gòu)造的一個(gè)置信區(qū)間11()(/2)XYznm比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布方差未知方差未知2222pooled sample variance(1)(1)2XYpnsmssn m一般情況下,未知,需要估計(jì)合并之后的樣本方差2211/(1)()nXiisnXX其中11A,()()112nmXYiipXXYYXYYXtsnmmnt定理.如果是獨(dú)立樣本,也是獨(dú)立樣本且和獨(dú)立,則服從自由度

22、為的 分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布方差未知方差未知2222()()11(1)(1)12XYpXYXYUsnmnsmsVmn定理定理A的證明的證明統(tǒng)計(jì)量可以表示為U/V.U服從標(biāo)準(zhǔn)正態(tài)分布.V等于卡方隨機(jī)變量除以其分布自由度.U/V服從t分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布方差未知方差未知11pX Yssnm記-2A. A100 1)%()(/2)XYXYm nX Yts推論在定理 的假設(shè)下,的一個(gè)(置信區(qū)間為比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布方差未知,例方差未知,例A問題:問題:今有今有A和和B兩種決定冰

23、的熱功當(dāng)量的方法兩種決定冰的熱功當(dāng)量的方法此處放箱線圖比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布方差未知,例方差未知,例A2280.02.02479.98.0311270.0007178190.027AaBbabppXsXsssss .0411.012138ABABpXXXXss自由度為自由度為19的的t分布的分布的.975分位點(diǎn)等于分位點(diǎn)等于2.0931995%(.025)ABABXXXXts置信區(qū)間為()即即(.015,.065)兩樣本假設(shè)檢驗(yàn)兩樣本假設(shè)檢驗(yàn)1023:XYXYXYXYHHHHX YX Yts檢驗(yàn)假設(shè)的統(tǒng)計(jì)量為雙側(cè)備擇假設(shè)雙側(cè)備擇假設(shè) two-sided a

24、lternative單側(cè)備擇假設(shè)單側(cè)備擇假設(shè) one-sided alternative122232,| |(/2),( ),( )n mn mn mHttHttH tt 對(duì)于對(duì)于對(duì)于兩樣本假設(shè)檢驗(yàn),續(xù)例兩樣本假設(shè)檢驗(yàn),續(xù)例A0:3.3311ABABpHXXtsnm對(duì)做雙側(cè)檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量為19(.005)2.8613.33.01t臨界值。以水平拒絕原假設(shè)。顯然,認(rèn)為兩種方法之間無差異是幾乎沒有疑義的。檢驗(yàn)檢驗(yàn)H0對(duì)對(duì)H1等價(jià)于似然比檢驗(yàn)等價(jià)于似然比檢驗(yàn)000,(,),XYXYXYH 參數(shù)的所有可能取值空間未知參數(shù)2222(1/2)() /(1/2)() /221111lik(,)22iXiY

25、nmXYXYijee 222211()()(,)log2log221()()2XYnmiXjYijmnmnlXY 取對(duì)數(shù)求最大值:似然比的分子部分求最大值:似然比的分子部分0mn00在下,我們得到的是一個(gè)來自正態(tài)總體樣本量為的樣本,均值和標(biāo)準(zhǔn)差未知其最大似然估計(jì)分別為0111nmijijXYmn222000111()()nmijijXYmn22000()()(,)log2log222mnmnmnl 求最大值:似然比的分母部分求最大值:似然比的分母部分21,XY為了得到下的最大似然估計(jì)和可以求對(duì)數(shù)似然的微分212122241111()0()01()()022nXiimYjjnmXYijijXYm

26、nXY2221111()()XYnmXYijijXYXYmn似然比的計(jì)算結(jié)果似然比的計(jì)算結(jié)果2211()()(,)log2log222XYm nm nm nl 似然比的分母部分是2120log2mn似然比的對(duì)數(shù)為22200011222111()()()()nmijijnmijijXYXXYY似然比檢驗(yàn)在下列值比較大的時(shí)候拒絕原假設(shè)分子部分的變換分子部分的變換220011220011()()()()()()nniiiimmjjjjXXXn XYYYm Y01()nXmYnXmYmnmnmn00()()m XYXmnn YXYmn22211()()nmijijmnXXYYXYmn222111()(

27、)nmijijXYmnmnXXYY在比較大的時(shí)候拒絕原假設(shè)2211|()()nmijijXYXXYY其等價(jià)形式為如果方差不相等22Var()XYssXYnm如果兩個(gè)總體的方差不相等,則對(duì)的一個(gè)自然估計(jì)是以它為以它為t統(tǒng)計(jì)量的分母,所得到的統(tǒng)計(jì)量不再服從統(tǒng)計(jì)量的分母,所得到的統(tǒng)計(jì)量不再服從t分布,分布,但近似服從自由度為下述結(jié)果取整之后的結(jié)果的但近似服從自由度為下述結(jié)果取整之后的結(jié)果的t分布分布2222222(/ )(/)df(/ )(/)11XYXYsnsmsnsmnm教材例11.2.1.1待處理教材例11.2.1.1下面是對(duì)數(shù)變換的模型下面是對(duì)數(shù)變換的模型(1),1,(1),1,loglog

28、log(1),1,logloglog(1),1,iXijYjiXijYjXinYjmXinYjm變異系數(shù)變異系數(shù)(coefficient of variation)(),1,(),1,iXjYXXYYE XinE Yjm XYXY一個(gè)分布的標(biāo)準(zhǔn)差和均值的比率稱為變異系數(shù)一個(gè)分布的標(biāo)準(zhǔn)差和均值的比率稱為變異系數(shù)(coefficient of variation)對(duì)于變換后的數(shù)據(jù),對(duì)于變換后的數(shù)據(jù),t統(tǒng)計(jì)量為統(tǒng)計(jì)量為.917,p-值為值為.37。沒有理由拒絕原假設(shè)。沒有理由拒絕原假設(shè)。95%置信區(qū)間是置信區(qū)間是(-.61,.23).61log.23.541.26XYXY這意味著或者功效(power

29、)XY1. 實(shí)際差異, =|-|。差異越大,功效越大。2. 檢驗(yàn)的水平 。顯著性水平越高,檢驗(yàn)的功效越大。3.總體標(biāo)準(zhǔn)差 ,這是掩蓋“信號(hào)”的噪聲強(qiáng)度。標(biāo)準(zhǔn)差越小,則檢驗(yàn)功效越大。計(jì)算功效對(duì)于在規(guī)劃實(shí)驗(yàn)時(shí)確定樣本量的大小具有重要意義。計(jì)算功效對(duì)于在規(guī)劃實(shí)驗(yàn)時(shí)確定樣本量的大小具有重要意義。檢驗(yàn)的功效是在原假設(shè)為假的時(shí)候拒絕原假設(shè)的概率。檢驗(yàn)的功效是在原假設(shè)為假的時(shí)候拒絕原假設(shè)的概率。影響兩樣本影響兩樣本t檢驗(yàn)的四個(gè)要素包括:檢驗(yàn)的四個(gè)要素包括:4.nm樣本量 和 。樣本量越大,則功效越大。功效的計(jì)算1:XYH t如果要用精確分布計(jì)算必要的樣本量,就必須使用非中心 分布。不過在樣本量比較大的情況下

30、,可以用正態(tài)近似。22, ,11Var()2nXYnnn 假設(shè)都已經(jīng)給定,兩個(gè)樣本量都是 。00:XYXYHH考慮2/|(/2)2|(/2)XYZnZzXYzn檢驗(yàn)統(tǒng)計(jì)量為拒絕域,即XY 時(shí)檢驗(yàn)的功效是檢驗(yàn)統(tǒng)計(jì)量落入拒絕域的概率,即2|(/2)PXYzn2()(/2)PXYzn2()(/2)PXYzn ()(/2)2/2/2/21(/2)XYznPnnzn 2(/2)zn 對(duì)功效的影響0一般說來,隨著 遠(yuǎn)離 點(diǎn),上述兩項(xiàng)之中有一項(xiàng)會(huì)變得非常小例A。兩樣本比較。樣本量均為18,來自正態(tài)總體,標(biāo)準(zhǔn)差都是5,顯著性水平.05。1.96.12525nn如果希望能夠以.9的概率發(fā)現(xiàn) =1的差異,需要多大

31、樣本量?這時(shí) 0,所以可以忽略第二項(xiàng)。解得非參數(shù)方法:Mann-Whitney檢驗(yàn)這個(gè)檢驗(yàn)也叫這個(gè)檢驗(yàn)也叫Wilcoxon秩和檢驗(yàn)秩和檢驗(yàn)(Wilcoxon Rank Sum Test)將將m+n次實(shí)驗(yàn)分配給處理組和對(duì)照組,次實(shí)驗(yàn)分配給處理組和對(duì)照組,隨機(jī)抽取隨機(jī)抽取n個(gè)分配給對(duì)照組,剩下的個(gè)分配給對(duì)照組,剩下的m個(gè)給處理組個(gè)給處理組要檢驗(yàn)的原假設(shè)是處理沒有效應(yīng)。要檢驗(yàn)的原假設(shè)是處理沒有效應(yīng)。如果原假設(shè)通過檢驗(yàn),就說明結(jié)果中的差異是由隨機(jī)化造成的如果原假設(shè)通過檢驗(yàn),就說明結(jié)果中的差異是由隨機(jī)化造成的統(tǒng)計(jì)量的計(jì)算方法如下統(tǒng)計(jì)量的計(jì)算方法如下1、將、將m+n個(gè)觀測值放在一起,按照升序排列。個(gè)觀測值

32、放在一起,按照升序排列。(為簡化問題,假定沒有并列名次。實(shí)際上,出現(xiàn)并列(為簡化問題,假定沒有并列名次。實(shí)際上,出現(xiàn)并列名次并不影響我們的計(jì)算)。名次并不影響我們的計(jì)算)。2、計(jì)算來自對(duì)照組的觀測值的秩的和、計(jì)算來自對(duì)照組的觀測值的秩的和3、如果秩和太大或者太小就可以拒絕原假設(shè)、如果秩和太大或者太小就可以拒絕原假設(shè)Mann-Whitney檢驗(yàn)的簡單例子4位受試,隨機(jī)抽取其中兩名進(jìn)入處理組,剩下兩名在對(duì)照組位受試,隨機(jī)抽取其中兩名進(jìn)入處理組,剩下兩名在對(duì)照組表中的數(shù)據(jù)是實(shí)驗(yàn)結(jié)果(響應(yīng)值),括號(hào)中出現(xiàn)的是這個(gè)值的秩表中的數(shù)據(jù)是實(shí)驗(yàn)結(jié)果(響應(yīng)值),括號(hào)中出現(xiàn)的是這個(gè)值的秩對(duì)照組的秩和等于對(duì)照組的秩和

33、等于7,處理組的秩和等于,處理組的秩和等于3這個(gè)差異足以讓我們相信在處理組和對(duì)照組的結(jié)果之間這個(gè)差異足以讓我們相信在處理組和對(duì)照組的結(jié)果之間存在系統(tǒng)的差別嗎?讓我們來做一個(gè)概率計(jì)算。存在系統(tǒng)的差別嗎?讓我們來做一個(gè)概率計(jì)算。Mann-Whitney檢驗(yàn)的簡單例子Mann-Whitney檢驗(yàn)的關(guān)鍵思想是:檢驗(yàn)的關(guān)鍵思想是:我們可以用顯式公式計(jì)算原假設(shè)下的秩和分布。我們可以用顯式公式計(jì)算原假設(shè)下的秩和分布。在原假設(shè)下,所有觀測值的秩的組合在原假設(shè)下,所有觀測值的秩的組合都是等概率的。這樣一共有都是等概率的。這樣一共有4!=24種結(jié)果。種結(jié)果。特別地,處理組的結(jié)果的秩特別地,處理組的結(jié)果的秩有有6種

34、,也應(yīng)該是等概率出現(xiàn)的。種,也應(yīng)該是等概率出現(xiàn)的。Mann-Whitney檢驗(yàn)mnm但是計(jì)算方法是一樣的。對(duì)照組的秩可能組合一共有個(gè),都是等概率的。分別計(jì)算出所有這些組合的和就可以得到檢驗(yàn)的null distribution。實(shí)際中的檢驗(yàn)問題不可能有這么小的m和n11*(1)min( ,)nRRn mnRRR R 是比較小的樣本量, 是這個(gè)樣本的秩和。Mann-Whitney檢驗(yàn):例A數(shù)據(jù)來自教材數(shù)據(jù)來自教材423頁,例頁,例A排序結(jié)果,有并列排名并列排名的處理方式:比如有4個(gè)值都等于79.97。它們占據(jù)的名次為3,4,5和6,則每個(gè)數(shù)的秩都等于(3+4+5+6)/4=4.5*518(8 13

35、 1)12551RRRR Mann-Whitney檢驗(yàn):例A 5360查表可知,雙側(cè)檢驗(yàn)在 =.01水平下的臨界值是;在 =.05水平下的臨界值是。Mann-Whitney檢驗(yàn):定理A12,()Var()mYYYY YYTFGE TT的秩和記為 ??梢缘玫皆谠僭O(shè)下的和。A,(1)()2(1)Var()12YYFGm mnE Tmn mnT定理如果則有證明提示:利用教材7.3.1的定理A和BMann-Whitney檢驗(yàn):定理A的證明21,2,()Var()1YYYTmnmmE TmNmTmN在原假設(shè)下,是從總體中以無放回方式抽取的一個(gè)樣本量為 的隨機(jī)樣本的和,自然等于樣本均值的 倍。22212

36、112NNN其中 為總體規(guī)模, 和分別為總體均值和方差。Mann-Whitney檢驗(yàn)1.Mann-Whitney檢驗(yàn)不依賴正態(tài)假設(shè)2.用排序名次取代實(shí)際數(shù)字,對(duì)離群值不敏感3.可以證明,如果正態(tài)假設(shè)成立,則Mann-Whitney檢驗(yàn)和t分布的功效幾乎相等4.下面我們用另一種觀點(diǎn)看待Mann-Whitney檢驗(yàn),.()XFYGP XY樣本 來自分布樣本 來自分布考慮計(jì)量處理效應(yīng)的指標(biāo)Mann-Whitney檢驗(yàn)111,10,nmijijijijXYZZmn如果的一個(gè)自然的估計(jì)值為,其中否則( )( )1,0,ijijXYV如果為了建立 和秩和之間的關(guān)系,考慮否則1111nmnmijijijijijijZVVZ顯然有,因?yàn)槭菍?duì)的一個(gè)重排。Mann-Whitney檢驗(yàn)(1)(2)11()(nmijijmVYXYXYX小于的 的個(gè)數(shù))+ 小于的 的個(gè)數(shù))+ 小于的 的個(gè)數(shù))( )(1)1(2)2,1,2,kykyyYRYXRYXR在合并樣本中的秩記為則小于的 的個(gè)數(shù)為小于的 的個(gè)數(shù)為余者類推。12111111)2)(1)2(1)2nmijyyymijmmmyiyiiiiyVRRRmm mRiRm mT (Mann-Whitney檢驗(yàn)0A:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論