第四章統(tǒng)計(jì)推斷

上傳人：x*** IP屬地：湖北上傳時(shí)間：2023-12-14 格式：PPTX 頁數(shù)：145 大?。?.25MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩140頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)推斷(statisticalinference)第四章第四章統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷由一個(gè)樣本或一糸列樣本所得的結(jié)果來推斷總體的特征假設(shè)檢驗(yàn)參數(shù)估計(jì)分析誤差產(chǎn)生的原因任務(wù)確定差異的性質(zhì)排除誤差干擾對(duì)總體特征做出正確判斷第四章第一節(jié)第二節(jié)第三節(jié)第四節(jié)第五節(jié)假設(shè)檢驗(yàn)的原理與方法樣本平均數(shù)的假設(shè)檢驗(yàn)樣本頻率的假設(shè)檢驗(yàn)參數(shù)的區(qū)間估計(jì)與點(diǎn)估計(jì)方差的同質(zhì)性檢驗(yàn)第一節(jié)假設(shè)檢驗(yàn)的原理與方法6Fisher的思想－顯著性檢驗(yàn)例.女士品茶的試驗(yàn)：一種飲料由牛奶與茶按一定比例混合而成，可以先倒茶后牛奶(TM)或反過來(MT).某女士聲稱她可以鑒別是TM還是MT.設(shè)計(jì)以下試驗(yàn)來檢驗(yàn)好的說法是否可信.準(zhǔn)備8杯飲料TM和MT各半，隨機(jī)排成一列讓女士依次品嘗，并告訴她TM和MT各4杯，請(qǐng)她指出哪4杯是TM,設(shè)她全說對(duì)了。7Fisher推理過程如下：引進(jìn)一個(gè)假設(shè)H:該女士無鑒別能力其意是：當(dāng)H正確時(shí)，不論該女士如何做，她事實(shí)上只能從所提供的8杯中隨機(jī)地挑選4杯作為TM.從8杯中挑出4杯，不同的挑法有P(4,8)＝70種，其中只有一種是全部挑對(duì)。因此，若女士全部選對(duì)，則我們必須承認(rèn)，下述兩個(gè)情況必發(fā)生其一：1.H不成立，即該女士確有一定的鑒別力；2.發(fā)生了一件，其概率為1/70的事件.81/70是一個(gè)較小的概率，所以4杯全選對(duì)這個(gè)結(jié)果，是一個(gè)不利于假設(shè)H的顯著的證據(jù)。據(jù)此，我們否定H.這樣一個(gè)推理過程就叫顯著性檢驗(yàn).如果該女士說對(duì)3杯，則挑中杯數(shù)>=3的概率為17/70=0.243.不是一個(gè)很小的概率。試驗(yàn)結(jié)果沒有提供不利于假設(shè)H的顯著證據(jù).1/70的概率雖然不大，但在一次試驗(yàn)中發(fā)生總非不可能。人們對(duì)這種問題的態(tài)度，與事情的重要性及可能的后果有關(guān)。要得到一個(gè)判斷的決定，須指定一個(gè)閾值α(0.01,0.05,0.1等).只要計(jì)算的概率小于α?xí)r，才認(rèn)為結(jié)果在統(tǒng)計(jì)學(xué)意義上的顯著的，并導(dǎo)致否定H。9如在此例中當(dāng)取α=0.01時(shí)，即使4杯全對(duì)也不認(rèn)為結(jié)果是顯著的，而若取α=0.05,則認(rèn)為是顯著的了.α稱為檢驗(yàn)所用的顯著性水平.α愈低，獲得顯著結(jié)果愈難，所以導(dǎo)致的否定H的結(jié)論愈覺可信.10Fishe顯著性檢驗(yàn)的思想有一個(gè)明確的假設(shè)H設(shè)計(jì)一定的試驗(yàn)，觀察某變量X.X要有這樣的性質(zhì)：當(dāng)H成立時(shí)，X有已知分布指定一個(gè)閾值α將p與α比較，p<α?xí)r否定H.一概念：

假設(shè)檢驗(yàn)（hypothesistest）又稱顯著性檢驗(yàn)（significancetest）,就是根據(jù)總體的理論分布和小概率原理，對(duì)未知或不完全知道的總體提出兩種彼此對(duì)立的假設(shè)，然后由樣本的實(shí)際結(jié)果，經(jīng)過一定的計(jì)算，作出在一定概率意義上應(yīng)該接受的那種假設(shè)的推斷。第一節(jié)假設(shè)檢驗(yàn)小概率原理

概率很小的事件在一次抽樣試驗(yàn)中實(shí)際是幾乎不可能發(fā)生的。

=0.05/0.01

如果假設(shè)一些條件，并在假設(shè)的條件下能夠準(zhǔn)確地算出事件Ａ出現(xiàn)的概率α為很小，則在假設(shè)條件下的n次獨(dú)立重復(fù)試驗(yàn)中，事件A將按預(yù)定的概率發(fā)生，而在一次試驗(yàn)中則幾乎不可能發(fā)生。假設(shè)檢驗(yàn)參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)平均數(shù)的檢驗(yàn)頻率的檢驗(yàn)方差的檢驗(yàn)秩和檢驗(yàn)符號(hào)檢驗(yàn)游程檢驗(yàn)秩相關(guān)檢驗(yàn)二、假設(shè)檢驗(yàn)的步驟

治療前

＝126

2＝240

N(126,240）治療后n＝6x＝136

未知那么＝0?即克矽平對(duì)治療矽肺是否有效？例：設(shè)矽肺病患者的血紅蛋白含量具平均數(shù)

0＝126(mg/L)，

2＝240

(mg/L)2的正態(tài)分布?，F(xiàn)用克矽平對(duì)6位矽肺病患者進(jìn)行治療，治療后化驗(yàn)測得其平均血紅蛋白含量x=136(mg/L)。1、提出假設(shè)對(duì)立無效假設(shè)/零假設(shè)/檢驗(yàn)假設(shè)備擇假設(shè)/對(duì)應(yīng)假設(shè)

＝

誤差效應(yīng)處理效應(yīng)H0HA例：克矽平治療矽肺病是否能提高血紅蛋白含量？平均數(shù)的假設(shè)檢驗(yàn)檢驗(yàn)治療后的總體平均數(shù)

是否還是治療前的126(mg/L)？x-

0＝136-126＝10(mg/L)這一差數(shù)是由于治療造成的，還是抽樣誤差所致。本例中零假設(shè)是指治療后的血紅蛋白平均數(shù)仍和治療前一樣，二者來自同一總體，接受零假設(shè)則表示克矽平?jīng)]有療效。而相對(duì)立的備擇假設(shè)表示拒絕H0，治療后的血紅蛋白平均數(shù)和治療前的平均數(shù)來自不同總體，即克矽平有療效。H0:μ=μ0=126(mg/L)HA:μ≠μ0

2、確定顯著水平

＝0.05顯著水平*極顯著水平**能否定H0的人為規(guī)定的概率標(biāo)準(zhǔn)稱為顯著水平，記作

。

統(tǒng)計(jì)學(xué)中，一般認(rèn)為概率小于0.05或0.01的事件為小概率事件,所以在小概率原理基礎(chǔ)上建立的假設(shè)檢驗(yàn)也常取

=0.05和

=0.01兩個(gè)顯著水平

。P<

＝0.01

＝0.053、選定檢驗(yàn)方法，計(jì)算檢驗(yàn)統(tǒng)計(jì)量，確定概率值u=x-

136-126=√40=1.581P(u>1.581)=2×0.0571=0.1142

根據(jù)研究設(shè)計(jì)的類型和統(tǒng)計(jì)推斷的目的選擇使用不同的檢驗(yàn)方法。例：4、作出推斷結(jié)論：是否接受假設(shè)P>

小概率原理接受H0否定HA否定H0接受HA可能正確可能錯(cuò)誤例：上例中

P＝0.1142>0.05所以接受H0，從而得出結(jié)論：使用克矽平治療前后血紅蛋白含量未發(fā)現(xiàn)有顯著差異，其差值10應(yīng)歸于誤差所致。21基本步驟1.寫出零假設(shè)（H0）和備選假設(shè)（HA）；2.確定檢驗(yàn)統(tǒng)計(jì)量；3.確定顯著性水平α；4.根據(jù)數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值；5.根據(jù)這個(gè)實(shí)現(xiàn)值計(jì)算p-值；6.進(jìn)行判斷：如果p-值小于或等于，就拒絕零假設(shè)，這時(shí)犯（第一類）錯(cuò)誤的概率最多為α；如果p-值大于α，就不拒絕零假設(shè)，因?yàn)樽C據(jù)不足。三、雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)在上述檢驗(yàn)中，無效假設(shè)H0:μ1=μ2與備擇假設(shè)HA:μ1≠μ2

。此時(shí)，備擇假設(shè)中包括了μ1＜μ2或μ1＞μ2兩種可能。此時(shí)，在α水平上否定域?yàn)?-∞，uα]和(uα，＋∞]，對(duì)稱地分配在u分布曲線的兩側(cè)尾部，每側(cè)的概率為α/2。這種利用兩尾概率進(jìn)行的檢驗(yàn)叫雙側(cè)檢驗(yàn)，也叫雙尾檢驗(yàn)，uα為雙側(cè)檢驗(yàn)的臨界u值。但在有些情況下，雙側(cè)檢驗(yàn)不一定符合實(shí)際情況。顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))抽樣分布0臨界值臨界值a/2a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H01-

置信水平

抽樣分布0

a/2a/2

樣本統(tǒng)計(jì)量u拒絕H0拒絕H01-

置信水平顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))0臨界值臨界值

a/2a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-

置信水平

0P(-1.96x<x<

+1.96

x)=0.95-1.96x+1.96x0.950.0250.025臨界值：+u

x左尾右尾否定區(qū)否定區(qū)接受區(qū)u

+1.96x

0P(-2.58x<x<

+2.58

x)=0.99-2.58x+2.58x0.990.0050.005臨界值：+2.58x左尾右尾雙尾檢驗(yàn)(two-sidedtest)否定區(qū)否定區(qū)接受區(qū)假設(shè)檢驗(yàn)的兩個(gè)否定區(qū)分別位于分布的兩尾，稱為雙尾檢驗(yàn)。若無效假設(shè)H0：μ1=μ2，備擇假設(shè)HA為μ1＜μ2，此時(shí)H0的否定域在u分布曲線的左尾。在α水平上，H0的否定域?yàn)?-∞，uα]，左側(cè)的概率為α。這種利用一尾概率進(jìn)行的檢驗(yàn)叫單尾檢驗(yàn)。此時(shí)，uα為單側(cè)檢驗(yàn)的臨界u值。單側(cè)檢驗(yàn)的uα=雙側(cè)檢驗(yàn)的u2α。同一資料雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)所得的結(jié)論不一定相同。例如，我們已經(jīng)知道新藥的療效不可能低于舊藥，于是其無效假設(shè)H0：μ≤μ0，備擇假設(shè)HA：μ＞μ0，否定區(qū)只有一個(gè)。進(jìn)行左尾檢驗(yàn)。反之，無效假設(shè)H0：μ≥μ0，備擇假設(shè)HA：μ＜μ0，需要進(jìn)行右尾檢驗(yàn)。顯著性水平和拒絕域(單側(cè)檢驗(yàn))0

a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平

：≥0HA

：<0顯著性水平和拒絕域

(左側(cè)檢驗(yàn))0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平觀察到的樣本統(tǒng)計(jì)量顯著性水平和拒絕域

(左側(cè)檢驗(yàn))0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域(右側(cè)檢驗(yàn))0

a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平觀察到的樣本統(tǒng)計(jì)量

：≤0HA

：>0顯著性水平和拒絕域

(右側(cè)檢驗(yàn))0

a樣本統(tǒng)計(jì)量抽樣分布1-

置信水平拒絕H00.950.950.050.051.64-1.64H0

：≤0HA

：>0假設(shè)：否定區(qū)H0

：≥0HA

：<0左尾檢驗(yàn)右尾檢驗(yàn)單尾檢驗(yàn)(one-sidedtest)接受區(qū)接受區(qū)單尾檢驗(yàn)左尾檢驗(yàn)右尾檢驗(yàn)0.950.950.050.051.64-1.64否定區(qū)接受區(qū)接受區(qū)否定區(qū)只在一側(cè)u0.05=1.64u0.01=2.33單尾檢驗(yàn)分位數(shù)雙尾檢驗(yàn)分位數(shù)u0.05=1.96u0.01=2.58

２

２否定區(qū)否定區(qū)否定區(qū)接受區(qū)接受區(qū)查表時(shí)，單尾概率乘以2等于雙尾概率＞四、顯著水平與兩種類型的錯(cuò)誤在顯著性檢驗(yàn)中，否定或接受無效假設(shè)的依據(jù)是“小概率事件實(shí)際不可能性原理”。用來確定否定或接受無效假設(shè)的概率標(biāo)準(zhǔn)叫顯著水平，記作α。在生物學(xué)研究中常取α=0.05或α=0.01。特殊情況下也可選α=0.10或α=0.001等。如果試驗(yàn)中難以控制的因素較多，試驗(yàn)誤差可能較大，則顯著水平可選低些，即α值取大些。反之，如試驗(yàn)耗費(fèi)較大，對(duì)精確度的要求較高，不容許反復(fù)，或者試驗(yàn)結(jié)論的應(yīng)用事關(guān)重大，則所選顯著水平應(yīng)高些，即α值應(yīng)該小些。顯著性檢驗(yàn)的接受還是否定無效假設(shè)，都沒有100%的把握。在檢驗(yàn)無效假設(shè)時(shí)可能犯兩類錯(cuò)誤。第一類錯(cuò)誤是真實(shí)情況為H0成立，卻否定了它，犯了“棄真”錯(cuò)誤，也叫α錯(cuò)誤。就是把非真實(shí)差異錯(cuò)判為真實(shí)差異，即H0：μ=μ0為真，卻接受了HA：μ≠μ0。犯錯(cuò)誤的概率為0.05%。第二類錯(cuò)誤是H0不成立，卻接受了它，犯了“納偽”錯(cuò)誤，也叫β錯(cuò)誤。就是把真實(shí)差異錯(cuò)判為非真實(shí)差異，即HA：μ≠μ0為真，卻未能否定H0：μ=μ0。假設(shè)檢驗(yàn)的兩類錯(cuò)誤

H0正確

H0錯(cuò)誤否定H0

錯(cuò)誤()推斷正確(1-)接受H0

推斷正確(1-)

錯(cuò)誤()第一類錯(cuò)誤（typeIerror），又稱棄真錯(cuò)誤或

錯(cuò)誤;第二類錯(cuò)誤（typeII

error

），又稱納偽錯(cuò)誤或

錯(cuò)誤當(dāng)H0錯(cuò)誤而正確拒絕H0的概率稱為檢驗(yàn)功效(power)

錯(cuò)誤和

錯(cuò)誤的關(guān)系

你不能同時(shí)減少兩類錯(cuò)誤!

和

的關(guān)系就像翹翹板，

小

就大，

大

就小

錯(cuò)誤和

錯(cuò)誤的關(guān)系1.在提高顯著水平，即減小α值時(shí)，為了減小犯Ⅱ型錯(cuò)誤的概率，可適當(dāng)增大樣本含量。2.我們的愿望是α值不越過某個(gè)給定值，如α=0.05或0.01的前提下，通過試驗(yàn)設(shè)計(jì)和增大樣本含量，使σ值減小，是減少兩類錯(cuò)誤的關(guān)鍵。第二節(jié)樣本平均數(shù)的假設(shè)檢驗(yàn)一、大樣本平均數(shù)的假設(shè)檢驗(yàn)—u檢驗(yàn)（一）一個(gè)樣本平均數(shù)的u檢驗(yàn)根據(jù)總體方差σ2是否已知，分為兩種情況。1、總體方差σ2已知時(shí)的u檢驗(yàn)2、總體方差σ2未知時(shí)的u檢驗(yàn)總體均值的檢驗(yàn)(大樣本)1.假定條件正態(tài)總體或非正態(tài)總體大樣本(n

30)2.使用u檢驗(yàn)統(tǒng)計(jì)量已知：未知：1、總體方差σ2已知時(shí)的u檢驗(yàn)檢驗(yàn)一個(gè)樣本平均數(shù)的總體平均數(shù)μ是否屬于某一指定平均數(shù)為μ0的總體。不論樣本容量是否大于30，均可采用u檢驗(yàn)法。例題：某漁場按規(guī)定方法育鰱魚苗一月齡平均體長為7.25cm,標(biāo)準(zhǔn)差為1.58cm,為提高魚苗的質(zhì)量,現(xiàn)采用一種新方法育苗,一月齡時(shí)隨機(jī)抽取100尾進(jìn)行測量,測得平均體長為7.65cm,試問新方法育苗與規(guī)定方法育苗有無顯著差異?這里的總體σ=1.58cm，σ2為已知，故采用u檢驗(yàn)；又新育苗法的平均體長可能高，也可能低，用雙尾檢驗(yàn)。檢驗(yàn)步驟為：(1)假設(shè)H0:μ=μ0=7.25cm,月齡體長相同。對(duì)HA:μ≠μ0(2)選取顯著水平α=0.05(3)檢驗(yàn)計(jì)算:=(7.65-7.25)/0.158=2.532(4)推斷:u分布中,當(dāng)α=0.05時(shí),u0.05=1.96。實(shí)得|u|＞1.96,P＜0.05,故否定H0,接受HA。新育苗法與規(guī)定育苗方法有顯著差異。u01.96-1.960.025拒絕H0拒絕H00.0252、總體方差σ2未知時(shí)的u檢驗(yàn)當(dāng)σ2未知時(shí),只要樣本容量n＞30可用樣本方差s2來代替總體方差σ2。仍可用u檢驗(yàn)法。例：生產(chǎn)某種紡織品,要求棉花纖維長度為30mm以上,現(xiàn)有一棉花品種,以n=400進(jìn)行抽查,測得其纖維平均長度為30.2mm,標(biāo)準(zhǔn)差為2.5mm,問該棉花品種纖維長度是否符合紡織品的生產(chǎn)?由題意,μ=30.0,=30.2,s=2.5,σ2未知,但n=400為大樣本,可用s2代替σ2進(jìn)行u檢驗(yàn);由于棉花只有大于30mm才符合要求,用單尾檢驗(yàn)。(1)假設(shè)H0:μ≤30mm,達(dá)不到要求。對(duì)HA:μ＞30mm,(2)確定顯著水平α=0.05(3)檢驗(yàn)計(jì)算:

=(30.2-30.0)/0.125=1.6(4)推斷:當(dāng)α=0.05時(shí),單尾檢驗(yàn)u0.05=1.645。實(shí)得|u|＜1.645,P＞0.05,故接受H0,否定HA。認(rèn)為該棉花品種纖維長度不符合紡織品的生產(chǎn)的要求。（二）兩個(gè)樣本平均數(shù)比較的u檢驗(yàn)要檢驗(yàn)兩個(gè)樣本平均數(shù)和所屬的總體平均數(shù)μ1和μ2是否來自同一個(gè)整體。在兩個(gè)樣本總體方差σ12和σ22已知，或σ12和σ22未知，但兩個(gè)都是大樣本。即n1≥30和n2≥30時(shí)，可用u檢驗(yàn)。在進(jìn)行兩個(gè)大樣本平均數(shù)的比較時(shí)，需要計(jì)算樣本平均數(shù)差數(shù)的標(biāo)準(zhǔn)誤σ2和u值。當(dāng)σ12和σ22已知，上式分母表達(dá)式為標(biāo)準(zhǔn)誤σ。當(dāng)兩個(gè)大樣本方差σ12和σ22未知時(shí)，可用樣本平均數(shù)差數(shù)的標(biāo)準(zhǔn)誤

代替。當(dāng)，計(jì)算公式為：上式分母表達(dá)式為標(biāo)準(zhǔn)誤。例：根據(jù)多年的資料，某雜交黑麥從播種到開花的天數(shù)的標(biāo)準(zhǔn)差為6.9d,現(xiàn)在相同實(shí)驗(yàn)條件下采用兩種方法取樣調(diào)查,A法調(diào)查400株,得出從播種到開花的平均天數(shù)為69.5d;B法調(diào)查200株,得出從播種到開花的平均天數(shù)為70.3d;試比較兩種調(diào)查方法所得黑麥從播種到開花的天數(shù)有無顯著差別。依題意,總體方差σ2=σ12=σ22=(6.9d)2,n1=400,n2=200,故用u檢驗(yàn);又不知A.B法的開花天數(shù)是否相同,需用雙尾檢驗(yàn)。(1)假設(shè)H0:μ1=μ2,天數(shù)相同;對(duì)HA:μ≠μ0(2)取顯著水平α=0.05(3)檢驗(yàn)計(jì)算:=-1.338

(4)推斷:由于實(shí)得|u|＜u0.05=1.96,P＞0.05,故接受H0,否定HA。兩種調(diào)查方法沒有顯著差異。例：為了比較”RRIM603”和”PB86”兩個(gè)橡膠品種割膠產(chǎn)量,分別隨機(jī)抽樣55株和117株進(jìn)行割膠,割膠平均產(chǎn)量分別為95.4ml/株和77.6ml/株,割膠產(chǎn)量的方差分別為936.36(ml/株)2和800.89(ml/株)2,試檢驗(yàn)兩個(gè)橡膠品種在割膠產(chǎn)量上是否有顯著差別。依題意,x1=95.4ml/株,x2=77.6ml/株,s12=936.36(ml/株)2,s22=800.89(ml/株)2,n1=55,n2=107,總體方差未知,但為大樣本,可用u檢驗(yàn)。(1)假設(shè)H0:μ1=μ2,割膠產(chǎn)量沒有顯著差別;對(duì)HA:μ≠μ0(2)規(guī)定顯著水平α=0.01(3)檢驗(yàn)計(jì)算:(4)推斷:實(shí)得|u|＞u0.01=2.58，P＜0.01,故否定H0,接受HA。即可以得出兩種割膠產(chǎn)量差異極顯著。二、小樣本平均數(shù)的假設(shè)檢驗(yàn)—t檢驗(yàn)當(dāng)樣本容量n＜30且總體方差σ2未知時(shí)，檢驗(yàn)樣本平均數(shù)與總體平均數(shù)μ的差異顯著性，就必須使用t檢驗(yàn)。在生物學(xué)研究中，具有重要意義。（一）一個(gè)樣本的假設(shè)檢驗(yàn)這是總體方差σ2未知，樣本容量n＜30的平均數(shù)是否屬于平均數(shù)為μ0總體的一種t檢驗(yàn)方法。因?yàn)樾颖镜膕2和σ2相差較大，故遵循自由度df=n-1的t分布。例：某魚塘水中的含氧量多年平均為4.5mg/L1，現(xiàn)在該魚塘設(shè)10個(gè)點(diǎn)采集水樣，測定水中的含氧量分別為：4.33，4.63，3.89，4.14，4.78，4.64，4.52，4.55，4.48，4.26mg/L1，試檢驗(yàn)該次抽樣測定的水中含氧量與多年平均值有無顯著差別。此題σ2未知，且n=10，為小樣本，故用t檢驗(yàn)；該次測定的水中含氧量可能高，也可能低，故用雙尾檢驗(yàn)。(1)假設(shè)H0:μ=μ0=4.5mg/L1,對(duì)HA:μ≠μ0(2)選取顯著水平α=0.05(3)檢驗(yàn)計(jì)算:查附表3,當(dāng)df=n-1=9時(shí)，t0.05=2.262,實(shí)得|t|＜t0.05,

故P＞0.05;(4)推斷:接受H0,否定HA。該次抽樣測定的水中含氧量與多年平均值無顯著差別。(二)成組數(shù)據(jù)平均數(shù)比較的假設(shè)檢驗(yàn)

在實(shí)際工作中還經(jīng)常會(huì)遇到推斷兩個(gè)樣本平均數(shù)差異是否顯著的問題，以了解兩樣本所屬總體的平均數(shù)是否相同。對(duì)于兩樣本平均數(shù)差異顯著性檢驗(yàn)，因試驗(yàn)設(shè)計(jì)不同，一般可分為兩種情況：非配對(duì)設(shè)計(jì)兩樣本平均數(shù)的差異顯著性檢驗(yàn)和配對(duì)設(shè)計(jì)兩樣本平均數(shù)的差異顯著性檢驗(yàn)。屬于非配對(duì)設(shè)計(jì)兩樣本平均數(shù)的差異顯著性檢驗(yàn)非配對(duì)設(shè)計(jì)或成組設(shè)計(jì)是指當(dāng)進(jìn)行只有兩個(gè)處理的試驗(yàn)時(shí)，將試驗(yàn)單位完全隨機(jī)地分成兩個(gè)組，然后對(duì)兩組隨機(jī)施加一個(gè)處理。在這種設(shè)計(jì)中兩組的試驗(yàn)單位相互獨(dú)立，所得的二個(gè)樣本相互獨(dú)立，其含量不一定相等。1.兩樣本的總體方差σ12和σ22未知時(shí)的檢驗(yàn)首先用樣本方差s12和s22進(jìn)行加權(quán)求出平均數(shù)差數(shù)的方差se2，作為對(duì)σ2的估計(jì)，計(jì)算se2，然后計(jì)算計(jì)算公式為:當(dāng)n1=n2=n時(shí)，上式變?yōu)?具有自由度df=(n1-1)+(n2-1)=n1+n2-2例：用高蛋白和低蛋白兩種飼料飼養(yǎng)一月齡的大白鼠，在三個(gè)月時(shí)，測定兩組大白鼠的增重(g)，兩組數(shù)據(jù)分別為:高蛋白組:134,146,106,119,124,161,107,83,113,129,97,123;低蛋白組:70,118,101,85,107,132,94。問兩種飼料飼養(yǎng)的大白鼠增重有否差異？本題σ12和σ22未知，且為小樣本，用t檢驗(yàn)；因不知增重的高低，故用雙尾檢驗(yàn)。(1)假設(shè)H0:μ1=μ2，對(duì)HA:μ≠μ0(2)取顯著水平α=0.05(3)檢驗(yàn)計(jì)算:平均數(shù)差數(shù)的方差為:查附表3，df=12+7-2=17，t0.05=2.110，現(xiàn)實(shí)得|t|<t0.05，故P>0.05；(4)推斷：接受H0，認(rèn)為兩種飼料飼養(yǎng)的大白鼠增重沒有顯著差異。2.兩樣本的總體方差σ12和σ22未知，且σ12≠σ22（可由F檢驗(yàn)得知），但n1=n2=n時(shí)的t檢驗(yàn)與可假設(shè)兩總體方差σ12=σ22的情況一樣,只是查t表時(shí)，所用的自由度df=n-1，而不是2(n-1)。例：兩個(gè)小麥品種的千粒重(g)的調(diào)查結(jié)果如下：品種甲50,47,42,43,39,51,43,38,44,37；品種乙36,38,37,38,36,39,37,35,33,37。試檢驗(yàn)兩品種千粒重有無顯著差別。此題n1=n2=10，經(jīng)F檢驗(yàn)，得知兩品種的千粒重的方差有顯著不同。(1)假設(shè)H0:μ1=μ2，對(duì)HA:μ≠μ0(2)取顯著水平α=0.05(3)檢驗(yàn)計(jì)算：查附表3，df=10-1=9，t0.05=2.262，現(xiàn)實(shí)得|t|>t0.05，故P<0.05；(4)推斷：否定H0，接受HA，認(rèn)為兩品種千粒重有顯著差異,甲顯著高于乙。3.兩樣本的總體方差σ12和σ22未知，且σ12≠σ22，n1≠n2時(shí)的檢驗(yàn)這種情況所構(gòu)成的統(tǒng)計(jì)數(shù)t不再服從相應(yīng)的t分布，因而只能進(jìn)行近似的t檢驗(yàn)。由于σ12≠σ22，所以兩樣本平均差數(shù)的標(biāo)準(zhǔn)誤不能用加權(quán)方差，需要用兩樣本方差s12和s22分別估計(jì)總體方差σ12和σ22，即有：t檢驗(yàn)時(shí)，需先計(jì)算R和df‘，再查t表得臨界值。例：測定冬小麥A的蛋白質(zhì)含量10次，得平均數(shù)為14.3，s12=1.621；測定冬小麥B的蛋白質(zhì)含量5次，得平均數(shù)為11.7，s12=0.135。試檢驗(yàn)兩者蛋白質(zhì)含量是否有顯著差異。經(jīng)F檢驗(yàn)，得知兩者蛋白質(zhì)含量的方差有顯著不同，又由于n1≠n2，故需計(jì)算df‘

，作近似t檢驗(yàn)。用雙尾檢驗(yàn)。(1)假設(shè)H0:μ1=μ2，對(duì)HA:μ≠μ0(2)取顯著水平α=0.01(3)檢驗(yàn)計(jì)算：查附表3，df’=12，t0.01=3.056，現(xiàn)實(shí)得|t|>t0.01，故P<0.01；(4)推斷：否定H0，接受HA，認(rèn)為兩品種蛋白質(zhì)含量有極顯著差異。(三)成對(duì)數(shù)據(jù)平均數(shù)比較的假設(shè)檢驗(yàn)配對(duì)設(shè)計(jì)兩樣本平均數(shù)的差異顯著性檢驗(yàn)。配對(duì)設(shè)計(jì)是指先根據(jù)配對(duì)的要求將試驗(yàn)單位兩兩配對(duì)，然后將配成對(duì)的兩個(gè)試驗(yàn)單位隨機(jī)地分配到兩個(gè)處理組中。要求配成對(duì)子的兩個(gè)試驗(yàn)單位的初始條件盡量一致。在假設(shè)檢驗(yàn)時(shí)，只要假設(shè)兩個(gè)樣本的總體差數(shù)μd=μ1-μ2=0。設(shè)兩個(gè)樣本的變量分別為x1和x2，共配成n對(duì)，各對(duì)的差數(shù)為d=x1－x2，則樣本差數(shù)平均數(shù)和樣本差數(shù)方差為：樣本差數(shù)平均數(shù)的標(biāo)準(zhǔn)誤為：若設(shè)H0:μd=0具有自由度df=n-1例：在研究飲食中缺乏v-E與肝中v-A的關(guān)系時(shí)，將試驗(yàn)動(dòng)物按性別、體重等配成8對(duì)，并將每對(duì)中的兩頭試驗(yàn)動(dòng)物用隨機(jī)分配法分配在正常飼料組和v-E缺乏組，然后將試驗(yàn)動(dòng)物殺死，測定其肝中v-A的含量，其結(jié)果為，教材P68表4.11（IU國際單位/g）試檢驗(yàn)兩組飼料對(duì)動(dòng)物肝中v-A含量的作用是否有顯著差異。此題為配對(duì)數(shù)據(jù)，兩組飼料對(duì)動(dòng)物肝中v-A含量的作用多少不明確，故用雙尾檢驗(yàn)。(1)假設(shè)H0:μd=0，對(duì)HA:μd≠0(2)確定顯著水平α=0.01(3)檢驗(yàn)計(jì)算：查附表3，df=8-1=7，此時(shí)t0.01=3.499，現(xiàn)實(shí)得|t|>t0.01，故P<0.01；(4)推斷：否定H0，接受HA，認(rèn)為兩組飼料對(duì)動(dòng)物肝中v-A含量的作用有極顯著差異。正常飼料組動(dòng)物肝中v-A含量明顯高。第三節(jié)樣本頻率的假設(shè)檢驗(yàn)由具有兩個(gè)屬性類別的質(zhì)量性狀利用統(tǒng)計(jì)次數(shù)法計(jì)算出的頻率資料，如成活率、死亡率、孵化率、感染率、陽性率等是服從二項(xiàng)分布的。樣本頻率的假設(shè)檢驗(yàn)應(yīng)按二項(xiàng)分布(p+q)2進(jìn)行。當(dāng)樣本含量n較大，0.1≤p≤0.9時(shí)，且np和nq均大于5時(shí)，二項(xiàng)分布(p+q)n接近于正態(tài)分布。近似地用u檢驗(yàn)法。一、一個(gè)樣本頻率的假設(shè)檢驗(yàn)這是檢驗(yàn)該樣本頻率是否來自總體頻率為p0的二項(xiàng)總體，即差異顯著性。根據(jù)n和p的大小，檢驗(yàn)方法是不一樣的。當(dāng)np或nq<5時(shí)，則由二項(xiàng)式(p+q)n展開式直接檢驗(yàn)。當(dāng)np或nq>5時(shí)，二項(xiàng)式接近正態(tài)分布，可用u檢驗(yàn)，但需進(jìn)行連續(xù)性矯正。當(dāng)np和nq>30時(shí)，可不進(jìn)行連續(xù)性矯正。樣本頻率的標(biāo)準(zhǔn)誤為：不需進(jìn)行連續(xù)性矯正時(shí)，u值計(jì)算：需進(jìn)行連續(xù)性矯正時(shí)，uc值計(jì)算：【例4.12】有一批蔬菜種子的平均發(fā)芽率p0=0.85，現(xiàn)隨機(jī)抽取500粒，用種衣劑進(jìn)行浸種處理，結(jié)果有445粒發(fā)芽，試檢驗(yàn)種衣劑對(duì)種子芽率有無影響。本題中，p0=0.85，n=500，由于np和nq>30，不進(jìn)行連續(xù)性矯正。(1)假設(shè)H0:p=p0=0.85，對(duì)HA:p≠p0(2)確定顯著水平α=0.05(3)檢驗(yàn)計(jì)算：q=1-p=1-0.85=0.15(4)推斷：由于|u|>u0.05，P<0.05，故否定H0，接受HA，認(rèn)為用種衣劑對(duì)種子芽率有顯著的影響。【例4.13】規(guī)定種蛋的孵化率P0>0.80為合格,現(xiàn)對(duì)一批種蛋隨機(jī)抽取100枚進(jìn)行孵化檢驗(yàn)，結(jié)果有78枚孵化，問這批種蛋是否合格？此例中，np、nq>5，nq＜30，需進(jìn)行連續(xù)性矯正。又只有孵化率＜0.80才認(rèn)為不合格，故采用單尾檢驗(yàn)。(1)假設(shè)H0:p≤p0不合格，對(duì)HA:p＞p0(2)確定顯著水平α=0.05(3)檢驗(yàn)計(jì)算：q=1-p=1-0.80=0.20(4)推斷：由于|u|＜u0.05，P＞0.05，故接受H0，認(rèn)為這批種蛋不合格。二、兩個(gè)樣本頻率的假設(shè)檢驗(yàn)檢驗(yàn)服從二項(xiàng)分布的兩個(gè)樣本頻率差異顯著性。其目的在于檢驗(yàn)兩個(gè)樣本頻率、所在的兩個(gè)二項(xiàng)總體頻率P1、P2是否相同。當(dāng)兩樣本的np、nq均大于5時(shí)，可以近似地采用u檢驗(yàn)法進(jìn)行檢驗(yàn)，但在np和（或）nq小于或等于30時(shí)，需作連續(xù)性矯正。兩個(gè)樣本頻率差數(shù)標(biāo)準(zhǔn)誤為：x1、x2分別代表兩樣本中某屬性出現(xiàn)的次數(shù)，n1、n2為樣本容量。不需要進(jìn)行連續(xù)性矯正的u值為(也可用t代替u)：需要進(jìn)行連續(xù)性矯正的uc值為(也可用tc代替uc)：【例4.14】研究地勢(shì)對(duì)小麥銹病發(fā)病的影響,調(diào)查低洼地麥田378株，其中銹病株342株，調(diào)查高地麥田396株，其中銹病株313株，試比較兩塊麥田銹病發(fā)病率是否有顯著差異？本題np和nq＞30，不需連續(xù)性矯正。又不知發(fā)病率高低，故用雙尾檢驗(yàn)。(1)假設(shè)H0:p1=p2，對(duì)HA:p1≠p2(2)確定顯著水平α=0.01(3)檢驗(yàn)計(jì)算：(4)推斷：由于|u|＞u0.01，P＜0.01，故否定H0

，接受HA，認(rèn)為兩塊地的發(fā)病率有顯著的差異。【例4.15】某漁場發(fā)生藥物中毒，抽查甲池29尾魚中有20尾死亡，抽查乙池28尾魚中有21尾死亡，試檢驗(yàn)兩池魚的死亡率是否有差異。本題np和nq＜30，需進(jìn)行連續(xù)性矯正。采用雙尾檢驗(yàn)。(1)假設(shè)H0:p1=p2，對(duì)HA:p1≠p2(2)確定顯著水平α=0.05(3)檢驗(yàn)計(jì)算：當(dāng)df=29＋28－2＝55時(shí)，t0.05=2.004，|t|＜t0.05，P＞0.05；(4)推斷：由于，故接受H0，認(rèn)為發(fā)生藥物中毒后兩池魚的死亡率沒有顯著差異。

第四節(jié)參數(shù)的區(qū)間估計(jì)與點(diǎn)估計(jì)所謂參數(shù)估計(jì)就是用樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù)，分為點(diǎn)估計(jì)和區(qū)間估計(jì)。將樣本統(tǒng)計(jì)量直接作為總體相應(yīng)參數(shù)的估計(jì)值叫點(diǎn)估計(jì)。區(qū)間估計(jì)是在一定概率保證下指出總體參數(shù)的可能范圍，所給出的可能范圍叫置信區(qū)間。給出的概率保證稱為置信度或置信概率。一、參數(shù)區(qū)間估計(jì)與點(diǎn)估計(jì)的原理樣本平均數(shù)近似服從正態(tài)分布,因而,當(dāng)概率水平α=0.05或0.01時(shí),即置信度為P=1-α=0.95或0.99的條件下,有：總體μ置信度為1-α的置信區(qū)間:區(qū)間估計(jì)與點(diǎn)估計(jì)抽樣分布0臨界值=1.96臨界值=-1.96a/2=0.025

a/2=0.025

樣本統(tǒng)計(jì)量拒絕H0拒絕H01-

=0.95置信水平區(qū)間估計(jì)的圖示

95%的樣本

-1.96

+1.96

x99%的樣本

-2.58

+2.58x90%的樣本

-1.65

+1.65

x對(duì)于某一概率標(biāo)準(zhǔn)α，則有通式：uα為正態(tài)分布下置信度P=1-α?xí)r的u臨界值。為μ的1-α置信區(qū)間，下限L1和上限L2為：區(qū)間(L1,L2)便是用樣本平均數(shù)對(duì)總體平均數(shù)μ的置信度P=1-α的區(qū)間估計(jì)。可用：表示樣本平均數(shù)對(duì)總體平均數(shù)μ的置信度為P=1-α的點(diǎn)估計(jì)。當(dāng)α=0.05時(shí)，包含有μ的置信度為0.95的區(qū)間估計(jì)與點(diǎn)估計(jì)為:當(dāng)α=0.01時(shí)，包含有μ的置信度為0.99的區(qū)間估計(jì)與點(diǎn)估計(jì)為:二.總體平均數(shù)μ的區(qū)間估計(jì)與點(diǎn)估計(jì)當(dāng)總體方差σ2為已知或未知但為大樣本時(shí)，可以利用樣本平均數(shù)和總體方差σ2作出在置信度為P=1-α的總體平均數(shù)μ的區(qū)間估計(jì)(見原理)。當(dāng)樣本為小樣本且總體方差σ2未知時(shí)，σ2需由樣本方差s2估計(jì)于是置信度為P=1-α的總體平均數(shù)μ的區(qū)間估計(jì)與點(diǎn)估計(jì)為：【例】測得某批25個(gè)小麥樣本的平均蛋白質(zhì)含量14.5%，已知σ=2.50%，試進(jìn)行95%置信度下的蛋白質(zhì)含量的區(qū)間估計(jì)與點(diǎn)估計(jì)。本例σ為已知,置信度為P=1-α=0.95,即α=0.05,查表2得u0.05=1.96,由σ可求出：于是蛋白質(zhì)含量的區(qū)間估計(jì):蛋白質(zhì)含量的點(diǎn)估計(jì)：例：從某漁場收蝦的總體中，隨機(jī)取20尾對(duì)蝦，測得平均體長120mm，標(biāo)準(zhǔn)差s=15mm，試估計(jì)置信度為99%的對(duì)蝦總體平均數(shù)。本例中，由于由于總體方差未知，需用s2估計(jì)σ2。查附表3，當(dāng)df=20-1=19時(shí)，t0.01=2.861。計(jì)算如下：于是對(duì)蝦體長的區(qū)間估計(jì)為：對(duì)蝦體長的點(diǎn)估計(jì)為：三、兩個(gè)總體平均數(shù)差數(shù)μ1-μ2的區(qū)間估計(jì)與點(diǎn)估計(jì)以及兩個(gè)總體頻率差數(shù)p1-p2的區(qū)間估計(jì)與點(diǎn)估計(jì)。同學(xué)們自學(xué)四、總體頻率ρ的置信區(qū)間與點(diǎn)估計(jì)樣本頻率只是總體頻率ρ的點(diǎn)估計(jì)值。頻率的置信區(qū)間則是在一定置信度下對(duì)總體頻率作出區(qū)間估計(jì)。求總體數(shù)的置信區(qū)間有兩種方法：正態(tài)近似法和查表法，這里僅介紹正態(tài)近似法。在置信度P=1-α下，對(duì)一個(gè)總體頻率p的區(qū)間估計(jì)為：其置信區(qū)間的下限和上限為：總體頻率的點(diǎn)估計(jì)為：當(dāng)樣本容量較小或者np、nq遠(yuǎn)小于30時(shí)，對(duì)總體頻率p的區(qū)間估計(jì)和點(diǎn)估計(jì)需要作連續(xù)性矯正，矯正公式為：總體頻率p的點(diǎn)估計(jì)L為：【例】調(diào)查100株玉米，得到20株有玉米螟害，即或np=20。試進(jìn)行置信度為95%的玉米螟危害率的區(qū)間估計(jì)和點(diǎn)估計(jì)。由公式當(dāng)α=0.05時(shí)，u0.05=1.96。于是置信度為95%的玉米螟危害率的區(qū)間估計(jì)為：玉米螟危害率的點(diǎn)估計(jì)為：第六節(jié)方差的同質(zhì)性檢驗(yàn)對(duì)于樣本的平均數(shù)、頻率的假設(shè)是以方差的同質(zhì)性為前提的，否則假設(shè)檢驗(yàn)的結(jié)論是不正確的。就是指各個(gè)總體的方差是相同的。方差同質(zhì)性檢驗(yàn)就是要從各樣本的方差來推斷其總體方差是否相同。一、一個(gè)樣本方差的同質(zhì)性檢驗(yàn)我們知道χ2:若用樣本平均數(shù)估計(jì)總體平均數(shù)時(shí):根據(jù)樣本方差為:χ2

為:上式中，分子表示樣本的離散度，分母表示總體方差，其χ2服從自由度為n-1的χ2分布。附表4列出的為單尾(右尾)概率。所以進(jìn)行右尾檢驗(yàn)時(shí)，否定區(qū)為；進(jìn)行左尾檢驗(yàn)時(shí)，否定區(qū)為；

20χα2χ1-α2

例：已知某農(nóng)田受到重金屬污染，經(jīng)抽樣測定其鉛濃度為4.2，4.5，3.6，4.7，4.0，3.8，3.7，4.2μg/g，方差為0.150(μg/g)2，試檢驗(yàn)受到污染的農(nóng)田鉛濃度的方差是否與正常鉛濃度的方差0.065(μg/g)2相同。此題為一個(gè)樣本方差與總體方差的同質(zhì)性檢驗(yàn)。(1)假設(shè)H0:σ2=0.065,對(duì)HA:σ2≠0.065(2)確定顯著水平α=0.05(3)檢驗(yàn)計(jì)算:查附表4，當(dāng)df=8-1=7時(shí)，現(xiàn)實(shí)得：(4)推斷：否定H0，接受HA

，即樣本方差與總體方差是不同質(zhì)的，認(rèn)為受到污染的方差與正常的方差有顯著差異。

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第四章統(tǒng)計(jì)推斷

文檔簡介

溫馨提示

最新文檔

評(píng)論

第四章統(tǒng)計(jì)推斷

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔