版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
統(tǒng)計推斷(statisticalinference)第四章第四章統(tǒng)計推斷統(tǒng)計推斷由一個樣本或一糸列樣本所得的結(jié)果來推斷總體的特征假設(shè)檢驗參數(shù)估計分析誤差產(chǎn)生的原因任務(wù)確定差異的性質(zhì)排除誤差干擾對總體特征做出正確判斷第四章第一節(jié)第二節(jié)第三節(jié)第四節(jié)第五節(jié)假設(shè)檢驗的原理與方法樣本平均數(shù)的假設(shè)檢驗樣本頻率的假設(shè)檢驗參數(shù)的區(qū)間估計與點估計方差的同質(zhì)性檢驗第一節(jié)假設(shè)檢驗的原理與方法6Fisher的思想-顯著性檢驗例.女士品茶的試驗:一種飲料由牛奶與茶按一定比例混合而成,可以先倒茶后牛奶(TM)或反過來(MT).某女士聲稱她可以鑒別是TM還是MT.設(shè)計以下試驗來檢驗好的說法是否可信.準備8杯飲料TM和MT各半,隨機排成一列讓女士依次品嘗,并告訴她TM和MT各4杯,請她指出哪4杯是TM,設(shè)她全說對了。7Fisher推理過程如下:引進一個假設(shè)H:該女士無鑒別能力其意是:當H正確時,不論該女士如何做,她事實上只能從所提供的8杯中隨機地挑選4杯作為TM.從8杯中挑出4杯,不同的挑法有P(4,8)=70種,其中只有一種是全部挑對。因此,若女士全部選對,則我們必須承認,下述兩個情況必發(fā)生其一:1.H不成立,即該女士確有一定的鑒別力;2.發(fā)生了一件,其概率為1/70的事件.81/70是一個較小的概率,所以4杯全選對這個結(jié)果,是一個不利于假設(shè)H的顯著的證據(jù)。據(jù)此,我們否定H.這樣一個推理過程就叫顯著性檢驗.如果該女士說對3杯,則挑中杯數(shù)>=3的概率為17/70=0.243.不是一個很小的概率。試驗結(jié)果沒有提供不利于假設(shè)H的顯著證據(jù).1/70的概率雖然不大,但在一次試驗中發(fā)生總非不可能。人們對這種問題的態(tài)度,與事情的重要性及可能的后果有關(guān)。要得到一個判斷的決定,須指定一個閾值α(0.01,0.05,0.1等).只要計算的概率小于α時,才認為結(jié)果在統(tǒng)計學意義上的顯著的,并導(dǎo)致否定H。9如在此例中當取α=0.01時,即使4杯全對也不認為結(jié)果是顯著的,而若取α=0.05,則認為是顯著的了.α稱為檢驗所用的顯著性水平.α愈低,獲得顯著結(jié)果愈難,所以導(dǎo)致的否定H的結(jié)論愈覺可信.10Fishe顯著性檢驗的思想有一個明確的假設(shè)H設(shè)計一定的試驗,觀察某變量X.X要有這樣的性質(zhì):當H成立時,X有已知分布指定一個閾值α將p與α比較,p<α時否定H.一概念:
假設(shè)檢驗(hypothesistest)又稱顯著性檢驗(significancetest),就是根據(jù)總體的理論分布和小概率原理,對未知或不完全知道的總體提出兩種彼此對立的假設(shè),然后由樣本的實際結(jié)果,經(jīng)過一定的計算,作出在一定概率意義上應(yīng)該接受的那種假設(shè)的推斷。第一節(jié)假設(shè)檢驗小概率原理
概率很小的事件在一次抽樣試驗中實際是幾乎不可能發(fā)生的。
=0.05/0.01
如果假設(shè)一些條件,并在假設(shè)的條件下能夠準確地算出事件A出現(xiàn)的概率α為很小,則在假設(shè)條件下的n次獨立重復(fù)試驗中,事件A將按預(yù)定的概率發(fā)生,而在一次試驗中則幾乎不可能發(fā)生。假設(shè)檢驗參數(shù)檢驗非參數(shù)檢驗平均數(shù)的檢驗頻率的檢驗方差的檢驗秩和檢驗符號檢驗游程檢驗秩相關(guān)檢驗二、假設(shè)檢驗的步驟
治療前
0
=126
2=240
N(126,240)治療后n=6x=136
未知那么=0?即克矽平對治療矽肺是否有效?例:設(shè)矽肺病患者的血紅蛋白含量具平均數(shù)
0=126(mg/L),
2=240
(mg/L)2的正態(tài)分布?,F(xiàn)用克矽平對6位矽肺病患者進行治療,治療后化驗測得其平均血紅蛋白含量x=136(mg/L)。1、提出假設(shè)對立無效假設(shè)/零假設(shè)/檢驗假設(shè)備擇假設(shè)/對應(yīng)假設(shè)
0
=
0
誤差效應(yīng)處理效應(yīng)H0HA例:克矽平治療矽肺病是否能提高血紅蛋白含量?平均數(shù)的假設(shè)檢驗檢驗治療后的總體平均數(shù)
是否還是治療前的126(mg/L)?x-
0=136-126=10(mg/L)這一差數(shù)是由于治療造成的,還是抽樣誤差所致。本例中零假設(shè)是指治療后的血紅蛋白平均數(shù)仍和治療前一樣,二者來自同一總體,接受零假設(shè)則表示克矽平?jīng)]有療效。而相對立的備擇假設(shè)表示拒絕H0,治療后的血紅蛋白平均數(shù)和治療前的平均數(shù)來自不同總體,即克矽平有療效。H0:μ=μ0=126(mg/L)HA:μ≠μ0
2、確定顯著水平
=0.05顯著水平*極顯著水平**能否定H0的人為規(guī)定的概率標準稱為顯著水平,記作
。
統(tǒng)計學中,一般認為概率小于0.05或0.01的事件為小概率事件,所以在小概率原理基礎(chǔ)上建立的假設(shè)檢驗也常取
=0.05和
=0.01兩個顯著水平
。P<
=0.01
=0.053、選定檢驗方法,計算檢驗統(tǒng)計量,確定概率值u=x-
x
136-126=√40=1.581P(u>1.581)=2×0.0571=0.1142
根據(jù)研究設(shè)計的類型和統(tǒng)計推斷的目的選擇使用不同的檢驗方法。例:4、作出推斷結(jié)論:是否接受假設(shè)P>
P<
小概率原理接受H0否定HA否定H0接受HA可能正確可能錯誤例:上例中
P=0.1142>0.05所以接受H0,從而得出結(jié)論:使用克矽平治療前后血紅蛋白含量未發(fā)現(xiàn)有顯著差異,其差值10應(yīng)歸于誤差所致。21基本步驟1.寫出零假設(shè)(H0)和備選假設(shè)(HA);2.確定檢驗統(tǒng)計量;3.確定顯著性水平α;4.根據(jù)數(shù)據(jù)計算檢驗統(tǒng)計量的實現(xiàn)值;5.根據(jù)這個實現(xiàn)值計算p-值;6.進行判斷:如果p-值小于或等于,就拒絕零假設(shè),這時犯(第一類)錯誤的概率最多為α;如果p-值大于α,就不拒絕零假設(shè),因為證據(jù)不足。三、雙側(cè)檢驗與單側(cè)檢驗在上述檢驗中,無效假設(shè)H0:μ1=μ2與備擇假設(shè)HA:μ1≠μ2
。此時,備擇假設(shè)中包括了μ1<μ2或μ1>μ2兩種可能。此時,在α水平上否定域為(-∞,uα]和(uα,+∞],對稱地分配在u分布曲線的兩側(cè)尾部,每側(cè)的概率為α/2。這種利用兩尾概率進行的檢驗叫雙側(cè)檢驗,也叫雙尾檢驗,uα為雙側(cè)檢驗的臨界u值。但在有些情況下,雙側(cè)檢驗不一定符合實際情況。顯著性水平和拒絕域
(雙側(cè)檢驗)抽樣分布0臨界值臨界值a/2a/2
樣本統(tǒng)計量拒絕H0拒絕H01-
置信水平
抽樣分布0
a/2a/2
樣本統(tǒng)計量u拒絕H0拒絕H01-
置信水平顯著性水平和拒絕域
(雙側(cè)檢驗)0臨界值臨界值a/2
a/2
樣本統(tǒng)計量拒絕H0拒絕H0抽樣分布1-
置信水平顯著性水平和拒絕域
(雙側(cè)檢驗)0臨界值臨界值
a/2a/2
樣本統(tǒng)計量拒絕H0拒絕H0抽樣分布1-
置信水平顯著性水平和拒絕域
(雙側(cè)檢驗)0臨界值臨界值a/2
a/2
樣本統(tǒng)計量拒絕H0拒絕H0抽樣分布1-
置信水平
0P(-1.96x<x<
+1.96
x)=0.95-1.96x+1.96x0.950.0250.025臨界值:+u
x左尾右尾否定區(qū)否定區(qū)接受區(qū)u
+1.96x
0P(-2.58x<x<
+2.58
x)=0.99-2.58x+2.58x0.990.0050.005臨界值:+2.58x左尾右尾雙尾檢驗(two-sidedtest)否定區(qū)否定區(qū)接受區(qū)假設(shè)檢驗的兩個否定區(qū)分別位于分布的兩尾,稱為雙尾檢驗。若無效假設(shè)H0:μ1=μ2,備擇假設(shè)HA為μ1<μ2,此時H0的否定域在u分布曲線的左尾。在α水平上,H0的否定域為(-∞,uα],左側(cè)的概率為α。這種利用一尾概率進行的檢驗叫單尾檢驗。此時,uα為單側(cè)檢驗的臨界u值。單側(cè)檢驗的uα=雙側(cè)檢驗的u2α。同一資料雙側(cè)檢驗與單側(cè)檢驗所得的結(jié)論不一定相同。例如,我們已經(jīng)知道新藥的療效不可能低于舊藥,于是其無效假設(shè)H0:μ≤μ0,備擇假設(shè)HA:μ>μ0,否定區(qū)只有一個。進行左尾檢驗。反之,無效假設(shè)H0:μ≥μ0,備擇假設(shè)HA:μ<μ0,需要進行右尾檢驗。顯著性水平和拒絕域(單側(cè)檢驗)0
a樣本統(tǒng)計量拒絕H0抽樣分布1-
置信水平
H0
:≥0HA
:<0顯著性水平和拒絕域
(左側(cè)檢驗)0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-
置信水平觀察到的樣本統(tǒng)計量顯著性水平和拒絕域
(左側(cè)檢驗)0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-
置信水平顯著性水平和拒絕域(右側(cè)檢驗)0
a樣本統(tǒng)計量拒絕H0抽樣分布1-
置信水平觀察到的樣本統(tǒng)計量
H0
:≤0HA
:>0顯著性水平和拒絕域
(右側(cè)檢驗)0
a樣本統(tǒng)計量抽樣分布1-
置信水平拒絕H00.950.950.050.051.64-1.64H0
:≤0HA
:>0假設(shè):否定區(qū)H0
:≥0HA
:<0左尾檢驗右尾檢驗單尾檢驗(one-sidedtest)接受區(qū)接受區(qū)單尾檢驗左尾檢驗右尾檢驗0.950.950.050.051.64-1.64否定區(qū)接受區(qū)接受區(qū)否定區(qū)只在一側(cè)u0.05=1.64u0.01=2.33單尾檢驗分位數(shù)雙尾檢驗分位數(shù)u0.05=1.96u0.01=2.58
2
2否定區(qū)否定區(qū)否定區(qū)接受區(qū)接受區(qū)查表時,單尾概率乘以2等于雙尾概率>四、顯著水平與兩種類型的錯誤在顯著性檢驗中,否定或接受無效假設(shè)的依據(jù)是“小概率事件實際不可能性原理”。用來確定否定或接受無效假設(shè)的概率標準叫顯著水平,記作α。在生物學研究中常取α=0.05或α=0.01。特殊情況下也可選α=0.10或α=0.001等。如果試驗中難以控制的因素較多,試驗誤差可能較大,則顯著水平可選低些,即α值取大些。反之,如試驗耗費較大,對精確度的要求較高,不容許反復(fù),或者試驗結(jié)論的應(yīng)用事關(guān)重大,則所選顯著水平應(yīng)高些,即α值應(yīng)該小些。顯著性檢驗的接受還是否定無效假設(shè),都沒有100%的把握。在檢驗無效假設(shè)時可能犯兩類錯誤。第一類錯誤是真實情況為H0成立,卻否定了它,犯了“棄真”錯誤,也叫α錯誤。就是把非真實差異錯判為真實差異,即H0:μ=μ0為真,卻接受了HA:μ≠μ0。犯錯誤的概率為0.05%。第二類錯誤是H0不成立,卻接受了它,犯了“納偽”錯誤,也叫β錯誤。就是把真實差異錯判為非真實差異,即HA:μ≠μ0為真,卻未能否定H0:μ=μ0。假設(shè)檢驗的兩類錯誤
H0正確
H0錯誤否定H0
錯誤()推斷正確(1-)接受H0
推斷正確(1-)
錯誤()第一類錯誤(typeIerror),又稱棄真錯誤或
錯誤;第二類錯誤(typeII
error
),又稱納偽錯誤或
錯誤當H0錯誤而正確拒絕H0的概率稱為檢驗功效(power)
錯誤和
錯誤的關(guān)系
你不能同時減少兩類錯誤!
和
的關(guān)系就像翹翹板,
小
就大,
大
就小
錯誤和
錯誤的關(guān)系1.在提高顯著水平,即減小α值時,為了減小犯Ⅱ型錯誤的概率,可適當增大樣本含量。2.我們的愿望是α值不越過某個給定值,如α=0.05或0.01的前提下,通過試驗設(shè)計和增大樣本含量,使σ值減小,是減少兩類錯誤的關(guān)鍵。第二節(jié)樣本平均數(shù)的假設(shè)檢驗一、大樣本平均數(shù)的假設(shè)檢驗—u檢驗(一)一個樣本平均數(shù)的u檢驗根據(jù)總體方差σ2是否已知,分為兩種情況。1、總體方差σ2已知時的u檢驗2、總體方差σ2未知時的u檢驗總體均值的檢驗(大樣本)1.假定條件正態(tài)總體或非正態(tài)總體大樣本(n
30)2.使用u檢驗統(tǒng)計量已知:未知:1、總體方差σ2已知時的u檢驗檢驗一個樣本平均數(shù)的總體平均數(shù)μ是否屬于某一指定平均數(shù)為μ0的總體。不論樣本容量是否大于30,均可采用u檢驗法。例題:某漁場按規(guī)定方法育鰱魚苗一月齡平均體長為7.25cm,標準差為1.58cm,為提高魚苗的質(zhì)量,現(xiàn)采用一種新方法育苗,一月齡時隨機抽取100尾進行測量,測得平均體長為7.65cm,試問新方法育苗與規(guī)定方法育苗有無顯著差異?這里的總體σ=1.58cm,σ2為已知,故采用u檢驗;又新育苗法的平均體長可能高,也可能低,用雙尾檢驗。檢驗步驟為:(1)假設(shè)H0:μ=μ0=7.25cm,月齡體長相同。對HA:μ≠μ0(2)選取顯著水平α=0.05(3)檢驗計算:=(7.65-7.25)/0.158=2.532(4)推斷:u分布中,當α=0.05時,u0.05=1.96。實得|u|>1.96,P<0.05,故否定H0,接受HA。新育苗法與規(guī)定育苗方法有顯著差異。u01.96-1.960.025拒絕H0拒絕H00.0252、總體方差σ2未知時的u檢驗當σ2未知時,只要樣本容量n>30可用樣本方差s2來代替總體方差σ2。仍可用u檢驗法。例:生產(chǎn)某種紡織品,要求棉花纖維長度為30mm以上,現(xiàn)有一棉花品種,以n=400進行抽查,測得其纖維平均長度為30.2mm,標準差為2.5mm,問該棉花品種纖維長度是否符合紡織品的生產(chǎn)?由題意,μ=30.0,=30.2,s=2.5,σ2未知,但n=400為大樣本,可用s2代替σ2進行u檢驗;由于棉花只有大于30mm才符合要求,用單尾檢驗。(1)假設(shè)H0:μ≤30mm,達不到要求。對HA:μ>30mm,(2)確定顯著水平α=0.05(3)檢驗計算:
=(30.2-30.0)/0.125=1.6(4)推斷:當α=0.05時,單尾檢驗u0.05=1.645。實得|u|<1.645,P>0.05,故接受H0,否定HA。認為該棉花品種纖維長度不符合紡織品的生產(chǎn)的要求。(二)兩個樣本平均數(shù)比較的u檢驗要檢驗兩個樣本平均數(shù)和所屬的總體平均數(shù)μ1和μ2是否來自同一個整體。在兩個樣本總體方差σ12和σ22已知,或σ12和σ22未知,但兩個都是大樣本。即n1≥30和n2≥30時,可用u檢驗。在進行兩個大樣本平均數(shù)的比較時,需要計算樣本平均數(shù)差數(shù)的標準誤σ2和u值。當σ12和σ22已知,上式分母表達式為標準誤σ。當兩個大樣本方差σ12和σ22未知時,可用樣本平均數(shù)差數(shù)的標準誤
代替。當,計算公式為:上式分母表達式為標準誤。例:根據(jù)多年的資料,某雜交黑麥從播種到開花的天數(shù)的標準差為6.9d,現(xiàn)在相同實驗條件下采用兩種方法取樣調(diào)查,A法調(diào)查400株,得出從播種到開花的平均天數(shù)為69.5d;B法調(diào)查200株,得出從播種到開花的平均天數(shù)為70.3d;試比較兩種調(diào)查方法所得黑麥從播種到開花的天數(shù)有無顯著差別。依題意,總體方差σ2=σ12=σ22=(6.9d)2,n1=400,n2=200,故用u檢驗;又不知A.B法的開花天數(shù)是否相同,需用雙尾檢驗。(1)假設(shè)H0:μ1=μ2,天數(shù)相同;對HA:μ≠μ0(2)取顯著水平α=0.05(3)檢驗計算:=-1.338
(4)推斷:由于實得|u|<u0.05=1.96,P>0.05,故接受H0,否定HA。兩種調(diào)查方法沒有顯著差異。例:為了比較”RRIM603”和”PB86”兩個橡膠品種割膠產(chǎn)量,分別隨機抽樣55株和117株進行割膠,割膠平均產(chǎn)量分別為95.4ml/株和77.6ml/株,割膠產(chǎn)量的方差分別為936.36(ml/株)2和800.89(ml/株)2,試檢驗兩個橡膠品種在割膠產(chǎn)量上是否有顯著差別。依題意,x1=95.4ml/株,x2=77.6ml/株,s12=936.36(ml/株)2,s22=800.89(ml/株)2,n1=55,n2=107,總體方差未知,但為大樣本,可用u檢驗。(1)假設(shè)H0:μ1=μ2,割膠產(chǎn)量沒有顯著差別;對HA:μ≠μ0(2)規(guī)定顯著水平α=0.01(3)檢驗計算:(4)推斷:實得|u|>u0.01=2.58,P<0.01,故否定H0,接受HA。即可以得出兩種割膠產(chǎn)量差異極顯著。二、小樣本平均數(shù)的假設(shè)檢驗—t檢驗當樣本容量n<30且總體方差σ2未知時,檢驗樣本平均數(shù)與總體平均數(shù)μ的差異顯著性,就必須使用t檢驗。在生物學研究中,具有重要意義。(一)一個樣本的假設(shè)檢驗這是總體方差σ2未知,樣本容量n<30的平均數(shù)是否屬于平均數(shù)為μ0總體的一種t檢驗方法。因為小樣本的s2和σ2相差較大,故遵循自由度df=n-1的t分布。例:某魚塘水中的含氧量多年平均為4.5mg/L1,現(xiàn)在該魚塘設(shè)10個點采集水樣,測定水中的含氧量分別為:4.33,4.63,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26mg/L1,試檢驗該次抽樣測定的水中含氧量與多年平均值有無顯著差別。此題σ2未知,且n=10,為小樣本,故用t檢驗;該次測定的水中含氧量可能高,也可能低,故用雙尾檢驗。(1)假設(shè)H0:μ=μ0=4.5mg/L1,對HA:μ≠μ0(2)選取顯著水平α=0.05(3)檢驗計算:查附表3,當df=n-1=9時,t0.05=2.262,實得|t|<t0.05,
故P>0.05;(4)推斷:接受H0,否定HA。該次抽樣測定的水中含氧量與多年平均值無顯著差別。(二)成組數(shù)據(jù)平均數(shù)比較的假設(shè)檢驗
在實際工作中還經(jīng)常會遇到推斷兩個樣本平均數(shù)差異是否顯著的問題,以了解兩樣本所屬總體的平均數(shù)是否相同。對于兩樣本平均數(shù)差異顯著性檢驗,因試驗設(shè)計不同,一般可分為兩種情況:非配對設(shè)計兩樣本平均數(shù)的差異顯著性檢驗和配對設(shè)計兩樣本平均數(shù)的差異顯著性檢驗。屬于非配對設(shè)計兩樣本平均數(shù)的差異顯著性檢驗非配對設(shè)計或成組設(shè)計是指當進行只有兩個處理的試驗時,將試驗單位完全隨機地分成兩個組,然后對兩組隨機施加一個處理。在這種設(shè)計中兩組的試驗單位相互獨立,所得的二個樣本相互獨立,其含量不一定相等。1.兩樣本的總體方差σ12和σ22未知時的檢驗首先用樣本方差s12和s22進行加權(quán)求出平均數(shù)差數(shù)的方差se2,作為對σ2的估計,計算se2,然后計算計算公式為:當n1=n2=n時,上式變?yōu)?具有自由度df=(n1-1)+(n2-1)=n1+n2-2例:用高蛋白和低蛋白兩種飼料飼養(yǎng)一月齡的大白鼠,在三個月時,測定兩組大白鼠的增重(g),兩組數(shù)據(jù)分別為:高蛋白組:134,146,106,119,124,161,107,83,113,129,97,123;低蛋白組:70,118,101,85,107,132,94。問兩種飼料飼養(yǎng)的大白鼠增重有否差異?本題σ12和σ22未知,且為小樣本,用t檢驗;因不知增重的高低,故用雙尾檢驗。(1)假設(shè)H0:μ1=μ2,對HA:μ≠μ0(2)取顯著水平α=0.05(3)檢驗計算:平均數(shù)差數(shù)的方差為:查附表3,df=12+7-2=17,t0.05=2.110,現(xiàn)實得|t|<t0.05,故P>0.05;(4)推斷:接受H0,認為兩種飼料飼養(yǎng)的大白鼠增重沒有顯著差異。2.兩樣本的總體方差σ12和σ22未知,且σ12≠σ22(可由F檢驗得知),但n1=n2=n時的t檢驗與可假設(shè)兩總體方差σ12=σ22的情況一樣,只是查t表時,所用的自由度df=n-1,而不是2(n-1)。例:兩個小麥品種的千粒重(g)的調(diào)查結(jié)果如下:品種甲50,47,42,43,39,51,43,38,44,37;品種乙36,38,37,38,36,39,37,35,33,37。試檢驗兩品種千粒重有無顯著差別。此題n1=n2=10,經(jīng)F檢驗,得知兩品種的千粒重的方差有顯著不同。(1)假設(shè)H0:μ1=μ2,對HA:μ≠μ0(2)取顯著水平α=0.05(3)檢驗計算:查附表3,df=10-1=9,t0.05=2.262,現(xiàn)實得|t|>t0.05,故P<0.05;(4)推斷:否定H0,接受HA,認為兩品種千粒重有顯著差異,甲顯著高于乙。3.兩樣本的總體方差σ12和σ22未知,且σ12≠σ22,n1≠n2時的檢驗這種情況所構(gòu)成的統(tǒng)計數(shù)t不再服從相應(yīng)的t分布,因而只能進行近似的t檢驗。由于σ12≠σ22,所以兩樣本平均差數(shù)的標準誤不能用加權(quán)方差,需要用兩樣本方差s12和s22分別估計總體方差σ12和σ22,即有:t檢驗時,需先計算R和df‘,再查t表得臨界值。例:測定冬小麥A的蛋白質(zhì)含量10次,得平均數(shù)為14.3,s12=1.621;測定冬小麥B的蛋白質(zhì)含量5次,得平均數(shù)為11.7,s12=0.135。試檢驗兩者蛋白質(zhì)含量是否有顯著差異。經(jīng)F檢驗,得知兩者蛋白質(zhì)含量的方差有顯著不同,又由于n1≠n2,故需計算df‘
,作近似t檢驗。用雙尾檢驗。(1)假設(shè)H0:μ1=μ2,對HA:μ≠μ0(2)取顯著水平α=0.01(3)檢驗計算:查附表3,df’=12,t0.01=3.056,現(xiàn)實得|t|>t0.01,故P<0.01;(4)推斷:否定H0,接受HA,認為兩品種蛋白質(zhì)含量有極顯著差異。(三)成對數(shù)據(jù)平均數(shù)比較的假設(shè)檢驗配對設(shè)計兩樣本平均數(shù)的差異顯著性檢驗。配對設(shè)計是指先根據(jù)配對的要求將試驗單位兩兩配對,然后將配成對的兩個試驗單位隨機地分配到兩個處理組中。要求配成對子的兩個試驗單位的初始條件盡量一致。在假設(shè)檢驗時,只要假設(shè)兩個樣本的總體差數(shù)μd=μ1-μ2=0。設(shè)兩個樣本的變量分別為x1和x2,共配成n對,各對的差數(shù)為d=x1-x2,則樣本差數(shù)平均數(shù)和樣本差數(shù)方差為:樣本差數(shù)平均數(shù)的標準誤為:若設(shè)H0:μd=0具有自由度df=n-1例:在研究飲食中缺乏v-E與肝中v-A的關(guān)系時,將試驗動物按性別、體重等配成8對,并將每對中的兩頭試驗動物用隨機分配法分配在正常飼料組和v-E缺乏組,然后將試驗動物殺死,測定其肝中v-A的含量,其結(jié)果為,教材P68表4.11(IU國際單位/g)試檢驗兩組飼料對動物肝中v-A含量的作用是否有顯著差異。此題為配對數(shù)據(jù),兩組飼料對動物肝中v-A含量的作用多少不明確,故用雙尾檢驗。(1)假設(shè)H0:μd=0,對HA:μd≠0(2)確定顯著水平α=0.01(3)檢驗計算:查附表3,df=8-1=7,此時t0.01=3.499,現(xiàn)實得|t|>t0.01,故P<0.01;(4)推斷:否定H0,接受HA,認為兩組飼料對動物肝中v-A含量的作用有極顯著差異。正常飼料組動物肝中v-A含量明顯高。第三節(jié)樣本頻率的假設(shè)檢驗由具有兩個屬性類別的質(zhì)量性狀利用統(tǒng)計次數(shù)法計算出的頻率資料,如成活率、死亡率、孵化率、感染率、陽性率等是服從二項分布的。樣本頻率的假設(shè)檢驗應(yīng)按二項分布(p+q)2進行。當樣本含量n較大,0.1≤p≤0.9時,且np和nq均大于5時,二項分布(p+q)n接近于正態(tài)分布。近似地用u檢驗法。一、一個樣本頻率的假設(shè)檢驗這是檢驗該樣本頻率是否來自總體頻率為p0的二項總體,即差異顯著性。根據(jù)n和p的大小,檢驗方法是不一樣的。當np或nq<5時,則由二項式(p+q)n展開式直接檢驗。當np或nq>5時,二項式接近正態(tài)分布,可用u檢驗,但需進行連續(xù)性矯正。當np和nq>30時,可不進行連續(xù)性矯正。樣本頻率的標準誤為:不需進行連續(xù)性矯正時,u值計算:需進行連續(xù)性矯正時,uc值計算:【例4.12】有一批蔬菜種子的平均發(fā)芽率p0=0.85,現(xiàn)隨機抽取500粒,用種衣劑進行浸種處理,結(jié)果有445粒發(fā)芽,試檢驗種衣劑對種子芽率有無影響。本題中,p0=0.85,n=500,由于np和nq>30,不進行連續(xù)性矯正。(1)假設(shè)H0:p=p0=0.85,對HA:p≠p0(2)確定顯著水平α=0.05(3)檢驗計算:q=1-p=1-0.85=0.15(4)推斷:由于|u|>u0.05,P<0.05,故否定H0,接受HA,認為用種衣劑對種子芽率有顯著的影響?!纠?.13】規(guī)定種蛋的孵化率P0>0.80為合格,現(xiàn)對一批種蛋隨機抽取100枚進行孵化檢驗,結(jié)果有78枚孵化,問這批種蛋是否合格?此例中,np、nq>5,nq<30,需進行連續(xù)性矯正。又只有孵化率<0.80才認為不合格,故采用單尾檢驗。(1)假設(shè)H0:p≤p0不合格,對HA:p>p0(2)確定顯著水平α=0.05(3)檢驗計算:q=1-p=1-0.80=0.20(4)推斷:由于|u|<u0.05,P>0.05,故接受H0,認為這批種蛋不合格。二、兩個樣本頻率的假設(shè)檢驗檢驗服從二項分布的兩個樣本頻率差異顯著性。其目的在于檢驗兩個樣本頻率、所在的兩個二項總體頻率P1、P2是否相同。當兩樣本的np、nq均大于5時,可以近似地采用u檢驗法進行檢驗,但在np和(或)nq小于或等于30時,需作連續(xù)性矯正。兩個樣本頻率差數(shù)標準誤為:x1、x2分別代表兩樣本中某屬性出現(xiàn)的次數(shù),n1、n2為樣本容量。不需要進行連續(xù)性矯正的u值為(也可用t代替u):需要進行連續(xù)性矯正的uc值為(也可用tc代替uc):【例4.14】研究地勢對小麥銹病發(fā)病的影響,調(diào)查低洼地麥田378株,其中銹病株342株,調(diào)查高地麥田396株,其中銹病株313株,試比較兩塊麥田銹病發(fā)病率是否有顯著差異?本題np和nq>30,不需連續(xù)性矯正。又不知發(fā)病率高低,故用雙尾檢驗。(1)假設(shè)H0:p1=p2,對HA:p1≠p2(2)確定顯著水平α=0.01(3)檢驗計算:(4)推斷:由于|u|>u0.01,P<0.01,故否定H0
,接受HA,認為兩塊地的發(fā)病率有顯著的差異?!纠?.15】某漁場發(fā)生藥物中毒,抽查甲池29尾魚中有20尾死亡,抽查乙池28尾魚中有21尾死亡,試檢驗兩池魚的死亡率是否有差異。本題np和nq<30,需進行連續(xù)性矯正。采用雙尾檢驗。(1)假設(shè)H0:p1=p2,對HA:p1≠p2(2)確定顯著水平α=0.05(3)檢驗計算:當df=29+28-2=55時,t0.05=2.004,|t|<t0.05,P>0.05;(4)推斷:由于,故接受H0,認為發(fā)生藥物中毒后兩池魚的死亡率沒有顯著差異。
第四節(jié)參數(shù)的區(qū)間估計與點估計所謂參數(shù)估計就是用樣本統(tǒng)計量來估計總體參數(shù),分為點估計和區(qū)間估計。將樣本統(tǒng)計量直接作為總體相應(yīng)參數(shù)的估計值叫點估計。區(qū)間估計是在一定概率保證下指出總體參數(shù)的可能范圍,所給出的可能范圍叫置信區(qū)間。給出的概率保證稱為置信度或置信概率。一、參數(shù)區(qū)間估計與點估計的原理樣本平均數(shù)近似服從正態(tài)分布,因而,當概率水平α=0.05或0.01時,即置信度為P=1-α=0.95或0.99的條件下,有:總體μ置信度為1-α的置信區(qū)間:區(qū)間估計與點估計抽樣分布0臨界值=1.96臨界值=-1.96a/2=0.025
a/2=0.025
樣本統(tǒng)計量拒絕H0拒絕H01-
=0.95置信水平區(qū)間估計的圖示
95%的樣本
-1.96
x
+1.96
x99%的樣本
-2.58
x
+2.58x90%的樣本
-1.65
x
+1.65
x對于某一概率標準α,則有通式:uα為正態(tài)分布下置信度P=1-α時的u臨界值。為μ的1-α置信區(qū)間,下限L1和上限L2為:區(qū)間(L1,L2)便是用樣本平均數(shù)對總體平均數(shù)μ的置信度P=1-α的區(qū)間估計??捎茫罕硎緲颖酒骄鶖?shù)對總體平均數(shù)μ的置信度為P=1-α的點估計。當α=0.05時,包含有μ的置信度為0.95的區(qū)間估計與點估計為:當α=0.01時,包含有μ的置信度為0.99的區(qū)間估計與點估計為:二.總體平均數(shù)μ的區(qū)間估計與點估計當總體方差σ2為已知或未知但為大樣本時,可以利用樣本平均數(shù)和總體方差σ2作出在置信度為P=1-α的總體平均數(shù)μ的區(qū)間估計(見原理)。當樣本為小樣本且總體方差σ2未知時,σ2需由樣本方差s2估計于是置信度為P=1-α的總體平均數(shù)μ的區(qū)間估計與點估計為:【例】測得某批25個小麥樣本的平均蛋白質(zhì)含量14.5%,已知σ=2.50%,試進行95%置信度下的蛋白質(zhì)含量的區(qū)間估計與點估計。本例σ為已知,置信度為P=1-α=0.95,即α=0.05,查表2得u0.05=1.96,由σ可求出:于是蛋白質(zhì)含量的區(qū)間估計:蛋白質(zhì)含量的點估計:例:從某漁場收蝦的總體中,隨機取20尾對蝦,測得平均體長120mm,標準差s=15mm,試估計置信度為99%的對蝦總體平均數(shù)。本例中,由于由于總體方差未知,需用s2估計σ2。查附表3,當df=20-1=19時,t0.01=2.861。計算如下:于是對蝦體長的區(qū)間估計為:對蝦體長的點估計為:三、兩個總體平均數(shù)差數(shù)μ1-μ2的區(qū)間估計與點估計以及兩個總體頻率差數(shù)p1-p2的區(qū)間估計與點估計。同學們自學四、總體頻率ρ的置信區(qū)間與點估計樣本頻率只是總體頻率ρ的點估計值。頻率的置信區(qū)間則是在一定置信度下對總體頻率作出區(qū)間估計。求總體數(shù)的置信區(qū)間有兩種方法:正態(tài)近似法和查表法,這里僅介紹正態(tài)近似法。在置信度P=1-α下,對一個總體頻率p的區(qū)間估計為:其置信區(qū)間的下限和上限為:總體頻率的點估計為:當樣本容量較小或者np、nq遠小于30時,對總體頻率p的區(qū)間估計和點估計需要作連續(xù)性矯正,矯正公式為:總體頻率p的點估計L為:【例】調(diào)查100株玉米,得到20株有玉米螟害,即或np=20。試進行置信度為95%的玉米螟危害率的區(qū)間估計和點估計。由公式當α=0.05時,u0.05=1.96。于是置信度為95%的玉米螟危害率的區(qū)間估計為:玉米螟危害率的點估計為:第六節(jié)方差的同質(zhì)性檢驗對于樣本的平均數(shù)、頻率的假設(shè)是以方差的同質(zhì)性為前提的,否則假設(shè)檢驗的結(jié)論是不正確的。就是指各個總體的方差是相同的。方差同質(zhì)性檢驗就是要從各樣本的方差來推斷其總體方差是否相同。一、一個樣本方差的同質(zhì)性檢驗我們知道χ2:若用樣本平均數(shù)估計總體平均數(shù)時:根據(jù)樣本方差為:χ2
為:上式中,分子表示樣本的離散度,分母表示總體方差,其χ2服從自由度為n-1的χ2分布。附表4列出的為單尾(右尾)概率。所以進行右尾檢驗時,否定區(qū)為;進行左尾檢驗時,否定區(qū)為;
20χα2χ1-α2
例:已知某農(nóng)田受到重金屬污染,經(jīng)抽樣測定其鉛濃度為4.2,4.5,3.6,4.7,4.0,3.8,3.7,4.2μg/g,方差為0.150(μg/g)2,試檢驗受到污染的農(nóng)田鉛濃度的方差是否與正常鉛濃度的方差0.065(μg/g)2相同。此題為一個樣本方差與總體方差的同質(zhì)性檢驗。(1)假設(shè)H0:σ2=0.065,對HA:σ2≠0.065(2)確定顯著水平α=0.05(3)檢驗計算:查附表4,當df=8-1=7時,現(xiàn)實得:(4)推斷:否定H0,接受HA
,即樣本方差與總體方差是不同質(zhì)的,認為受到污染的方差與正常的方差有顯著差異。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 04版專業(yè)市場調(diào)研合同
- 2024年度噸不銹鋼帶打印功能電子地磅秤物流運輸合同
- 2024年度旅游景點開發(fā)與運營承包合同
- const成員函數(shù)性能分析與優(yōu)化技術(shù)
- 2024年度增強現(xiàn)實應(yīng)用設(shè)計協(xié)議
- 2024年度影視制作合同:電影制作與發(fā)行合作協(xié)議
- 2024年實習生委托培訓(xùn)合同書
- 2024年工程質(zhì)量檢測與安全評估合同
- 住宅建筑的租賃與共有產(chǎn)權(quán)住房模式考核試卷
- 冰球場地墊子維護設(shè)施考核試卷
- 幼兒園中班健康教案《腸胃小鬧鐘》含反思
- 裝配式建筑精裝修裝配施工方法
- GB∕T 24789-2022 用水單位水計量器具配備和管理通則
- 亞馬遜開店基本操作介紹課件(同名1242)
- 三年級語文上冊課件-《15.搭船的鳥》 (共18張PPT)部編版
- 畫法幾何 華中科大-新2-1
- 研學旅行概論教學課件匯總完整版電子教案
- NYT 393-綠色食品 農(nóng)藥使用準則
- TSG Z8001-2019特種設(shè)備無損檢測人員考核規(guī)則-高清正版
- 人教版八上名著閱讀《昆蟲記》分章練習(含答案)
- 醫(yī)護人員服務(wù)禮儀及行為規(guī)范-PPT課件
評論
0/150
提交評論