版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第五章 統(tǒng)計假設(shè)測驗 上章主要討論了從總體到樣本的關(guān)系,本章將討論逆命題從樣本到總體的問題,即統(tǒng)計推斷問題。抽樣分布統(tǒng)計假設(shè)測驗統(tǒng)計假設(shè)測驗hypothesis test參數(shù)估計parametric estimate第一節(jié)第一節(jié) 統(tǒng)計假設(shè)測驗的基本原理統(tǒng)計假設(shè)測驗的基本原理第二節(jié)第二節(jié) 平均數(shù)的假設(shè)測驗平均數(shù)的假設(shè)測驗第三節(jié)第三節(jié) 二項資料的百分數(shù)假設(shè)測驗二項資料的百分數(shù)假設(shè)測驗第四節(jié)第四節(jié) 參數(shù)的區(qū)間估計參數(shù)的區(qū)間估計第五章統(tǒng)計假設(shè)測驗 統(tǒng)計假設(shè)測驗又叫顯著性測驗,是統(tǒng)計學中的一個重要內(nèi)容。統(tǒng)計假設(shè)測驗的方法很多,常用的有u測驗、t測驗和 測驗等。2第一節(jié)第一節(jié) 統(tǒng)計假設(shè)測驗的基本原理統(tǒng)計假
2、設(shè)測驗的基本原理 統(tǒng)計假設(shè)測驗的意義 統(tǒng)計假設(shè)測驗的步驟 兩類錯誤 兩尾測驗與一尾測驗一、統(tǒng)計假設(shè)測驗的意義一、統(tǒng)計假設(shè)測驗的意義 例如,根據(jù)國家標準,大豆籽粒蛋白質(zhì)含量高于45%的品種為高蛋白品種。某種子公司對一大豆新品種隨機抽取5個樣品進行測定,得平均蛋白質(zhì)含量為46.5%。我們能否據(jù)此認為該大豆品種就是高蛋白品種? 專家組將攻關(guān)片所有田塊進行編號,隨機抽取了2號、5號、8號共3塊示范田。經(jīng)實打?qū)嵤蘸螅?塊示范田的畝產(chǎn)分別為901.1公斤、938.2公斤、940.5公斤,百畝片平均畝產(chǎn)為926.6公斤。超級稻試驗田畝產(chǎn)達926.6公斤假設(shè)測驗的意義 統(tǒng)計假設(shè)測驗的目的在于判明,試驗的表面差
3、異主要是試驗的真實差異造成的,還是試驗誤差造成的,從而得到可靠的結(jié)論。111y222y)()(212121 yy表面差異表面差異真實差異真實差異試驗誤差試驗誤差如何判斷造成這種差異的原因?權(quán)衡的尺度如何掌握呢? 只要設(shè)定一概率標準,表面效應(yīng)屬于誤差的概率不大于這一標準,便可推論表面效應(yīng)不大可能屬誤差所致,而是新品種優(yōu)越。 概率很小的事件在一次抽樣試驗中實際是幾乎不可能發(fā)生的。 =0.05/0.01統(tǒng)計假設(shè)檢驗的基本原理 小概率事件不可能發(fā)生原理 小概率事件在一次試驗中幾乎不會發(fā)生 如果某事件在一次試驗中發(fā)生了,我們可認為它不是一個小概率事件 如果在某個假設(shè)下應(yīng)當是小概率的事件在一次試驗中發(fā)生了
4、,可認為該假設(shè)不能成立統(tǒng)計假設(shè)測驗的基本思想 按研究目的提出一個假設(shè),然后再計算該假設(shè)出現(xiàn)的概率,最后依概率的大小判斷假設(shè)是否成立,從而推斷處理效應(yīng)是否存在(反證法)。這就是統(tǒng)計假設(shè)測驗的基本思想。 法官判定一個人是否犯罪,首先是假定他法官判定一個人是否犯罪,首先是假定他“無罪無罪”(H0),),然后通過偵察尋找證據(jù),如果證據(jù)充分則拒絕然后通過偵察尋找證據(jù),如果證據(jù)充分則拒絕 “無罪無罪”的假的假定(定(H0),判嫌疑人有罪;否則只能暫且認為),判嫌疑人有罪;否則只能暫且認為“無罪無罪”的假的假定(定(H0)成立。)成立。統(tǒng)計假設(shè)測驗統(tǒng)計假設(shè)測驗: 根據(jù)某種實際需要,對未知的或不完全知道的總體
5、提出兩種彼此對立的假設(shè);然后由樣本的實際結(jié)果,經(jīng)過一定的計算,做出在一定概率意義上應(yīng)當接受哪種假設(shè)的測驗。00:H無效假設(shè)無效假設(shè)(null hypothesis)(null hypothesis):假設(shè)所研究兩個總體參數(shù)假設(shè)所研究兩個總體參數(shù)( (平均數(shù)平均數(shù)) ) 相等。也就是假設(shè)表面效應(yīng)是由誤差造成的,兩個總體之相等。也就是假設(shè)表面效應(yīng)是由誤差造成的,兩個總體之間沒有真實差異。間沒有真實差異。 備擇假設(shè)備擇假設(shè)( alternative hypothesis )( alternative hypothesis ):和無效假設(shè)相對應(yīng)的一和無效假設(shè)相對應(yīng)的一個統(tǒng)計假設(shè)個統(tǒng)計假設(shè) 。 如果否定
6、了無效假設(shè),則必接受備擇假設(shè);同理,如果接如果否定了無效假設(shè),則必接受備擇假設(shè);同理,如果接受了無效假設(shè),當然也就否定了備擇假設(shè)。受了無效假設(shè),當然也就否定了備擇假設(shè)。 0:AH顯著水平*極顯著水平*在進行無效假設(shè)和備擇假設(shè)后,要確定一個否定在進行無效假設(shè)和備擇假設(shè)后,要確定一個否定H H0 0的的概概率率標準,這個概率標準稱為標準,這個概率標準稱為顯著水平顯著水平,記作,記作 。 統(tǒng)計學中,一般認為概率小于統(tǒng)計學中,一般認為概率小于0.050.05或或0.010.01的事件為小的事件為小概率事件概率事件, ,所以在小概率原理基礎(chǔ)上建立的假設(shè)檢驗也常所以在小概率原理基礎(chǔ)上建立的假設(shè)檢驗也常取取
7、 =0.05=0.05和和 =0.01=0.01兩個顯著水平兩個顯著水平 。P 0.010.05 某地區(qū)的當?shù)匦←溒贩N產(chǎn)量為某地區(qū)的當?shù)匦←溒贩N產(chǎn)量為300kg/ 667m2 ,標,標準差準差為75(kg),而現(xiàn)有一新品種通過,而現(xiàn)有一新品種通過25個小區(qū)的試個小區(qū)的試驗,算得其樣本平均產(chǎn)量為驗,算得其樣本平均產(chǎn)量為330kg/667m2, , 那么新那么新品種樣本所屬總體與當?shù)仄贩N這個總體是否有顯著品種樣本所屬總體與當?shù)仄贩N這個總體是否有顯著差異呢?差異呢?即新品種與老品種之間不存在真實的差異,樣本平均數(shù)和總體平即新品種與老品種之間不存在真實的差異,樣本平均數(shù)和總體平均數(shù)之間的差數(shù):均數(shù)之間
8、的差數(shù): 330330300=30(kg)300=30(kg)屬隨機誤差。屬隨機誤差。 0:AH即新品種與老品種之間存在真實的差異即新品種與老品種之間存在真實的差異300:00H備擇假設(shè):備擇假設(shè): 無效假設(shè):無效假設(shè):1 1 、提出假設(shè)、提出假設(shè)2 2 、 確定顯著水平確定顯著水平0.05顯著水平*極顯著水平*P 0.01 在承認無效假設(shè)的前提下可知,從已知總體中抽取樣本容在承認無效假設(shè)的前提下可知,從已知總體中抽取樣本容量為量為n=25的樣本,該樣本平均數(shù)的抽樣分布具正態(tài)分布形狀:的樣本,該樣本平均數(shù)的抽樣分布具正態(tài)分布形狀:yny3 3 、計算無效假設(shè)正確的概率、計算無效假設(shè)正確的概率標
9、準誤標準誤平均數(shù)平均數(shù))k(300g)(kg152575 在假設(shè)在假設(shè) 為正確的條件下,根據(jù)正態(tài)分布理論算出從為正確的條件下,根據(jù)正態(tài)分布理論算出從的總體中,抽取到的總體中,抽取到 的樣本的概率:的樣本的概率:0H)(kgy330 查附表查附表3,當,當u=2時,時,P(概率概率)界于界于0.04和和0.05之間。之間。 215300330yyu3 3 、計算無效假設(shè)正確的概率、計算無效假設(shè)正確的概率)(kg300095. 096. 196. 1yyyP025. 096. 1yyP025. 096. 1yyP025. 0)96. 1(yyP025. 0)96. 1(yyP 因此,在因此,在 的
10、抽樣分布中,落在的抽樣分布中,落在( )區(qū)間內(nèi)的有區(qū)間內(nèi)的有95%,落在這一區(qū)間外的只有,落在這一區(qū)間外的只有5%。 yyy96. 196. 1,計算接受區(qū)和否定區(qū)計算接受區(qū)和否定區(qū) 如果以如果以5%概率作為接受或否定概率作為接受或否定H0的界限,則上述區(qū)間的界限,則上述區(qū)間( )為接受假設(shè)的區(qū)域,簡稱為接受假設(shè)的區(qū)域,簡稱接受區(qū)接受區(qū)( acceptance region )( acceptance region ); 和和 為否定假設(shè)為否定假設(shè)的區(qū)域,簡稱的區(qū)域,簡稱否定區(qū)否定區(qū)( rejection region )( rejection region )。 yy96. 196. 1,y
11、y96. 1yy96. 1 P( -1.96 y y +1.96 y) =0.95 -1.96 y +1.96 y0.950.0250.025臨界值:臨界值:左尾右尾否定區(qū)否定區(qū)接受區(qū) + 1.96 y差異達顯著水平差異達顯著水平 P( -2.58 y yP 本例中本例中 P 0假設(shè):否定區(qū)H0 : 0 HA : 0左尾檢驗右尾檢驗單尾檢驗單尾檢驗(one-sided test)接受區(qū)接受區(qū)u 0.05=1.64u 0.01=2.33單尾檢驗雙尾檢驗u 0.05=1.96u 0.01=2.58 否定區(qū)否定區(qū)否定區(qū)接受區(qū)接受區(qū)查表時,單尾概率等于雙尾概率乘以2四四 、兩類錯誤、兩類錯誤假設(shè)檢驗的
12、兩類錯誤假設(shè)檢驗的兩類錯誤H0正確正確 H0 錯誤錯誤否定否定H0 第一類錯誤(第一類錯誤(type I error),又稱棄真錯誤或),又稱棄真錯誤或 錯誤錯誤;第二類錯誤(第二類錯誤( type II error ) ,又稱納偽錯誤或,又稱納偽錯誤或 錯誤錯誤 錯誤錯誤( ( ) )推斷正確推斷正確 錯誤錯誤( ( ) )接受接受H H0 0推斷正確推斷正確0.025 = 00.950.025錯誤犯第一類錯誤的概率等于顯著水平值犯第一類錯誤的原因:小概率事件不可能發(fā)生原理犯第一類錯誤的原因:小概率事件不可能發(fā)生原理 第一類錯誤第一類錯誤無效假設(shè)本來是正確的,但假設(shè)測驗結(jié)果否定了它。c1c2
13、2552702853003153303453600270.6329.4 第二類錯誤第二類錯誤無效假設(shè)本來是錯誤的,但假設(shè)測驗結(jié)果接受了它。C1C22 2 0 u -u 犯第二類錯誤的概率等于重疊部分的面積,記為值犯第二類錯誤的原因:原假設(shè)的抽樣分布與真實的抽樣分布犯第二類錯誤的原因:原假設(shè)的抽樣分布與真實的抽樣分布發(fā)生部分重疊發(fā)生部分重疊 例:已知總體的均值例:已知總體的均值 =300,其平均數(shù)抽樣標準誤為,其平均數(shù)抽樣標準誤為15,被抽樣總體的平均數(shù)被抽樣總體的平均數(shù) 315kg、標準誤也為、標準誤也為15。09621531562701.u9601531543292.u查附表查附表2,P(u
14、12.96)=0.0015,P(u20.96)=0.8315,故有故有 =P(u20.96)P(u1 2.96)=0.83150.0015=0.83或或83%C1C2 0 u -u 顯著性水平: 越小,越大, 越大,越小值值c1c22552702853003153303453600270.6329.4總體平均數(shù)之差總體平均數(shù)之差c1c2255270285300315330345360037539015%假設(shè)總體與真實分布總體平均數(shù)之差越大,越小總體平均數(shù)之差總體平均數(shù)之差c1c2255270285300315330345360037539015%總體方差總體方差c1c2255270285300
15、3153303453600375390兩個分布的總體方差越小,越小樣本含量 n越大,越小C1C22 2 0 u -u 影響 II 型錯誤概率大小的因素 顯著性水平:越大,越小 樣本含量 n:n越大,越小 假設(shè)總體與真實分布總體平均數(shù)之差越大,越小 兩個分布的總體方差越小,越小兩類錯誤既有聯(lián)系又有區(qū)別 錯誤只在否定H0時發(fā)生 錯誤只在接受H0時發(fā)生錯誤增加 錯誤減小 錯誤減小 錯誤增加結(jié)論結(jié)論提提出出假假設(shè)設(shè)確確定定顯顯著著水水平平計計算算統(tǒng)統(tǒng)計計量量統(tǒng)統(tǒng)計計推推斷斷 統(tǒng)計假設(shè)檢驗的步驟:第二節(jié)第二節(jié) 平均數(shù)的假設(shè)測驗平均數(shù)的假設(shè)測驗一、一、t 分布分布二、單個樣本平均數(shù)的假設(shè)測驗二、單個樣本平
16、均數(shù)的假設(shè)測驗三、兩個樣本平均數(shù)相比較的假設(shè)測驗三、兩個樣本平均數(shù)相比較的假設(shè)測驗 從正態(tài)總體抽取的樣本,無論樣本容量多大,其樣本平均數(shù) 的抽樣分布必成正態(tài)分布,具有:_yny22_y記作N(,2/n)。yyu服從標準正態(tài)分布服從標準正態(tài)分布NN(0 0,1 1)復習復習 若從一個非正態(tài)總體中隨機抽樣,抽出的樣本平均數(shù) 分布不一定屬于正態(tài)分布,但當樣本容量n足夠大時,從這總體抽出樣本平均數(shù)的抽樣分布趨于正態(tài)分布,具有平均數(shù)和方差2/n。這稱之為中心極限定理。_yyyu服從標準正態(tài)分布服從標準正態(tài)分布NN(0 0,1 1)_yny22_記作N(,2/n)。復習復習n 在總體方差在總體方差2 2
17、已知時,可以直接計算:已知時,可以直接計算:ny22_yyun2 2 未知,但樣本容量相當大時,可用未知,但樣本容量相當大時,可用s s2 2直接作為直接作為2 2 估計值時應(yīng)用。估計值時應(yīng)用。t 分布分布 當樣本容量不太大當樣本容量不太大( (n30df30時,其曲線接近正態(tài)分布曲線,時,其曲線接近正態(tài)分布曲線,dfdf時則和正態(tài)分布曲線重合時則和正態(tài)分布曲線重合yySt t分布曲線與橫軸所圍成的面積為分布曲線與橫軸所圍成的面積為1 1。同標準正態(tài)分布曲線一樣,統(tǒng)計應(yīng)用中最為關(guān)心的是同標準正態(tài)分布曲線一樣,統(tǒng)計應(yīng)用中最為關(guān)心的是t t分布曲線下的面積(即概率)與橫軸分布曲線下的面積(即概率)
18、與橫軸t t值間關(guān)系。值間關(guān)系。為使用方便,統(tǒng)計學家編制不同自由度為使用方便,統(tǒng)計學家編制不同自由度dfdf下的下的t t值表。值表。在相同的自由度在相同的自由度dfdf時,時,t t值越大,概率值越大,概率P P越小越小。1因此在假設(shè)測驗時,當算得的| t|t時,表明其屬于隨機誤差的概率小于規(guī)定的顯著水平,因而可否定無效假設(shè)。反之,若算得的| t| t ,則接受無效假設(shè)。 2dfdf增大,增大,t t分布接近正態(tài)分布,即分布接近正態(tài)分布,即t t值接近值接近u u值。值。需要解決的問題:需要解決的問題:樣本樣本平均數(shù)平均數(shù)總體總體均數(shù)均數(shù)推斷推斷?已知已知樣本樣本隨機抽樣隨機抽樣總體總體對單
19、個樣本平均數(shù)的檢驗對單個樣本平均數(shù)的檢驗單個樣本平均數(shù)的假設(shè)測驗單個樣本平均數(shù)的假設(shè)測驗 測驗?zāi)骋粯颖緶y驗?zāi)骋粯颖?所屬總體平均數(shù)是否和某一指定的總所屬總體平均數(shù)是否和某一指定的總體平均數(shù)相同。體平均數(shù)相同。 u測驗測驗 適用范圍:適用范圍: 1. 1. 總體方差已知總體方差已知 2. 2. 總體方差未知,但樣本容量很大總體方差未知,但樣本容量很大 t測驗測驗 適用范圍:總體方差未知,而樣本容量又很小適用范圍:總體方差未知,而樣本容量又很小y 例:某地區(qū)的當?shù)匦←溒贩N一般例:某地區(qū)的當?shù)匦←溒贩N一般667m2產(chǎn)產(chǎn)300kg,并從多,并從多年種植結(jié)果獲得其標準差年種植結(jié)果獲得其標準差為75(kg
20、),而現(xiàn)有某新品種通過,而現(xiàn)有某新品種通過25個個小區(qū)的試驗,計得其樣本平均產(chǎn)量為每小區(qū)的試驗,計得其樣本平均產(chǎn)量為每667m2330kg, 那么新那么新品種樣本所屬總體與當?shù)仄贩N這個總體是否有顯著差異呢?品種樣本所屬總體與當?shù)仄贩N這個總體是否有顯著差異呢?總體總體 2 已知,故可用已知,故可用u 測驗測驗測驗步驟如下:測驗步驟如下: (1)提出假設(shè)提出假設(shè): H0:= 0= 300,即新品種的產(chǎn)量與原當?shù)仄贩N的產(chǎn)量相等;即新品種的產(chǎn)量與原當?shù)仄贩N的產(chǎn)量相等; 對對HA: 0 ,即新品種的產(chǎn)量與原當?shù)仄贩N的產(chǎn)量不相等。即新品種的產(chǎn)量與原當?shù)仄贩N的產(chǎn)量不相等。152575ny(2)確定顯著水平)
21、確定顯著水平 值值:(3) 計算統(tǒng)計量計算統(tǒng)計量:215300330yyu(4)統(tǒng)計推斷統(tǒng)計推斷: =0.05,u0.05=1.96由于由于uu0.05,p0.05,故否定,故否定H0:= 0,接受,接受HA: 0 ,即新品種的產(chǎn)量與原當?shù)仄贩N的產(chǎn)量之間存在顯著差異。,即新品種的產(chǎn)量與原當?shù)仄贩N的產(chǎn)量之間存在顯著差異。 例例5.1 某春小麥良種的千粒重某春小麥良種的千粒重 34g,現(xiàn)自外地,現(xiàn)自外地引入一高產(chǎn)品種,在引入一高產(chǎn)品種,在8個小區(qū)種植,得其千粒重個小區(qū)種植,得其千粒重(g)為:為:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,問,問新引入品種的千粒
22、重與當?shù)亓挤N有無顯著差異?新引入品種的千粒重與當?shù)亓挤N有無顯著差異?0總體總體 為未知,又是小樣本,故需用為未知,又是小樣本,故需用t 測驗;測驗;2新引入品種千粒重可能高于也可能低于當?shù)亓挤N,故需作兩尾測驗。新引入品種千粒重可能高于也可能低于當?shù)亓挤N,故需作兩尾測驗。對對HA: 0,即新引入品種千粒重與當?shù)亓挤N千粒重之間差異顯著;即新引入品種千粒重與當?shù)亓挤N千粒重之間差異顯著;(3) 測驗計算:測驗計算:g.nsss6411g.nssy58006920.syty 現(xiàn)實得現(xiàn)實得|t|0.05。接受接受H0: 0= 34g,即新引入品種千粒重與當?shù)?,即新引入品種千粒重與當?shù)亓挤N千粒重指定值沒有顯
23、著差異。良種千粒重指定值沒有顯著差異。g././.y235872818)634637635(83188)7281(6346376352222./.SS =0.05測驗步驟為:測驗步驟為:(1)提出假設(shè):)提出假設(shè):H0: = 0= 34g,即新引入品種與當?shù)亓挤N千粒重之間無顯著差異;即新引入品種與當?shù)亓挤N千粒重之間無顯著差異;(2)確定顯著水平)確定顯著水平 值:值:(4)統(tǒng)計推斷:)統(tǒng)計推斷:t0.05,7=2.365兩個樣本平均數(shù)的假設(shè)測驗的目的在于,測驗這兩個樣本所屬的總體平均數(shù)有無顯著差異。 三、兩個樣本平均數(shù)相比較的假設(shè)測驗三、兩個樣本平均數(shù)相比較的假設(shè)測驗2121 yy兩個總體平均
24、數(shù)的比較兩個總體平均數(shù)的比較為了比較兩個總體均數(shù)的差異,不可能對兩個總體的所有個體進行測定,只能通過樣本來推斷總體。分別從兩個總體隨機抽取一定數(shù)量的個體,從而獲得兩個獨立的樣本,然后通過對樣本數(shù)據(jù)的分析來對兩個總體平均數(shù)有無差異進行檢驗。兩個總體平均數(shù)的比較兩個總體平均數(shù)的比較;,樣本方差為樣本平均數(shù)為的樣本,量為由該總體抽取了一個含,方差為為設(shè)第一個總體的平均數(shù)2111211Syn;,樣本方差為樣本平均數(shù)為的樣本,量為由該總體抽取了一個含,方差為為設(shè)第二個總體的平均數(shù)2222222ySn?21?21yy 11y,22y, 如果兩個樣本的各個變量是從各自總體中隨機抽如果兩個樣本的各個變量是從各
25、自總體中隨機抽取的,兩個樣本之間的變量取的,兩個樣本之間的變量沒有任何關(guān)聯(lián)沒有任何關(guān)聯(lián),即兩個抽,即兩個抽樣樣本彼此獨立,則不論兩樣本的容量是否相同,所樣樣本彼此獨立,則不論兩樣本的容量是否相同,所得數(shù)據(jù)皆為得數(shù)據(jù)皆為成組數(shù)據(jù)成組數(shù)據(jù)。兩組數(shù)據(jù)以。兩組數(shù)據(jù)以組平均數(shù)組平均數(shù)作為相互作為相互比較的標準,來檢驗其差異的顯著性。比較的標準,來檢驗其差異的顯著性。 將性質(zhì)相同的兩個供試單位配成一對,并設(shè)有多個配對,將性質(zhì)相同的兩個供試單位配成一對,并設(shè)有多個配對,然后對每一配對的兩個供試單位分別隨機地給予不同處理,所然后對每一配對的兩個供試單位分別隨機地給予不同處理,所得觀察值為成對數(shù)據(jù)。得觀察值為成
26、對數(shù)據(jù)。 配成對子的兩配成對子的兩個實驗單位的個實驗單位的初始條件應(yīng)盡初始條件應(yīng)盡量一致,不同量一致,不同實驗對子之間,實驗對子之間,實驗單位的初實驗單位的初始條件可以有始條件可以有差異。差異。把同一重復內(nèi)二個把同一重復內(nèi)二個實驗單位的初始條實驗單位的初始條件的差異減少到最件的差異減少到最低限度,使實驗處低限度,使實驗處理效應(yīng)不被實驗單理效應(yīng)不被實驗單位的差異而夸大或位的差異而夸大或縮小,提高實驗精縮小,提高實驗精確度。確度。配配對對的的要要求求配配對對的的目目的的田忌賽馬田忌賽馬 第一場第一場 第二場第二場 第三場第三場齊威王齊威王 上等馬上等馬 中等馬中等馬 下等馬下等馬田田 忌忌本場勝者
27、本場勝者第一次第一次第二次第二次 第一場第一場 第二場第二場 第三場第三場齊威王齊威王 上等馬上等馬 中等馬中等馬 下等馬下等馬田田 忌忌本場勝者本場勝者齊威王齊威王齊威王齊威王齊威王齊威王齊威王齊威王田田 忌忌田田 忌忌上等馬上等馬中等馬中等馬下等馬下等馬下等馬下等馬上等馬上等馬中等馬中等馬 如果兩個處理為完全隨機設(shè)計的兩個處理,各供試如果兩個處理為完全隨機設(shè)計的兩個處理,各供試單位彼此獨立,不論兩個處理的樣本容量是否相同,所單位彼此獨立,不論兩個處理的樣本容量是否相同,所得數(shù)據(jù)皆稱為成組數(shù)據(jù),以得數(shù)據(jù)皆稱為成組數(shù)據(jù),以組組(處理處理)平均數(shù)平均數(shù)作為相互比作為相互比較的標準。較的標準。 成
28、組數(shù)據(jù)的平均數(shù)比較又依兩個樣本所屬的總體方成組數(shù)據(jù)的平均數(shù)比較又依兩個樣本所屬的總體方差差( 和和 )是否已知是否已知、是否相等是否相等而采用不同的測驗方法。而采用不同的測驗方法。2122( (一一) ) 成組數(shù)據(jù)的平均數(shù)比較成組數(shù)據(jù)的平均數(shù)比較 21 22 由抽樣分布的公式知,兩樣本平均數(shù)由抽樣分布的公式知,兩樣本平均數(shù) 和和 的差數(shù)標準的差數(shù)標準誤誤 ,在,在 和和 是已知時為:是已知時為: 1y2y21yy 212222212121nnyy21)()(2121yyyyu 在假設(shè)在假設(shè) 下,正態(tài)離差下,正態(tài)離差u值為值為 ,故可對兩樣本平均數(shù)的差異作出假設(shè)測驗。故可對兩樣本平均數(shù)的差異作出
29、假設(shè)測驗。21)(21yyyyu0:210H(1) (1) 兩個樣本的總體方差兩個樣本的總體方差 和和 已知時已知時用用u測驗測驗 例例5.2 據(jù)以往資料,已知某小麥品種每平方米產(chǎn)量的據(jù)以往資料,已知某小麥品種每平方米產(chǎn)量的 ,今在該品種的一塊地上用,今在該品種的一塊地上用A、B兩法取樣,兩法取樣,法取法取12個樣點,得每平方米產(chǎn)量個樣點,得每平方米產(chǎn)量 =1.2(kg);B法法取取8個樣點,得個樣點,得 =1.4(kg)。試比較。試比較A、B兩法的每平兩法的每平方米產(chǎn)量是否有顯著差異?方米產(chǎn)量是否有顯著差異?22)(4 . 0kg1y2y因兩個樣本的總體方差因兩個樣本的總體方差 和和 已知,
30、所以用已知,所以用u u測驗測驗212221:AH05. 096. 105. 0u 4022212.8,1221nn)(2887022212121kg.nnyy6902121.yyuyy 因為實得因為實得|u|0.05,故接故接 受受 , 即即A、B兩種取樣方法所得的每平方米產(chǎn)量沒兩種取樣方法所得的每平方米產(chǎn)量沒 有顯著差異。有顯著差異。 210:H210:H測驗步驟:(1)提出假設(shè):)提出假設(shè):(2)確定顯著水平:)確定顯著水平:(3)檢驗計算:)檢驗計算:(4)統(tǒng)計)統(tǒng)計 推斷推斷:即 A、B兩法的每平方米產(chǎn)量相同;即即A、B兩法的每平方米產(chǎn)量差異顯著) 1 , 0(N(2)當)當1 12
31、 2 和和2 22 2未知,兩樣本都為大樣本時未知,兩樣本都為大樣本時21)()y(2121yysyu2121yysyyuH0: 1=2=時時 22212121nsnssyy用用u測驗測驗 21 22 22221 首先,從樣本變異算出平均數(shù)差數(shù)的均方首先,從樣本變異算出平均數(shù)差數(shù)的均方 ,作為對,作為對 的估計的估計 2es1)(1)()()(21222211nnyyyySSSSse21212(3 3)在兩個樣本的總體方差)在兩個樣本的總體方差 和和 為未知,而兩個樣為未知,而兩個樣本又為小樣本,但可假定本又為小樣本,但可假定 時,用時,用t t 測驗。測驗。2方平均值,又稱為合并均是兩個樣本
32、均方的加權(quán)2es 21 22 22221 其兩樣本其兩樣本平均數(shù)的差數(shù)標準誤平均數(shù)的差數(shù)標準誤為:為:221221nsnsseeyy于是有:于是有:21)()(2121yysyyt由于假設(shè)由于假設(shè) 210:H21)(21yysyyt故故自由度自由度 ) 1() 1(21nn(3 3)在兩個樣本的總體方差)在兩個樣本的總體方差 和和 為未知,而兩個樣為未知,而兩個樣本又為小樣本,但可假定本又為小樣本,但可假定 時,用時,用t t 測驗。測驗。例例5.3 調(diào)查某農(nóng)場每畝調(diào)查某農(nóng)場每畝30萬苗和萬苗和35萬苗的稻田各萬苗的稻田各5塊,得畝產(chǎn)量塊,得畝產(chǎn)量(單單位:位:kg)于表于表5.2,試測驗兩種
33、密度畝產(chǎn)量的差異顯著性。,試測驗兩種密度畝產(chǎn)量的差異顯著性。 y1(30萬苗萬苗)y2(35萬苗萬苗)400450420440435445460445425420表表5.2 兩種密度的稻田畝產(chǎn)兩種密度的稻田畝產(chǎn)(kg)(kg)因為是小樣本,且總體方差未知,故需用t測驗,又由于事先并不知兩種密度的產(chǎn)量孰高孰低,故用兩尾測驗。(1)提出假設(shè):提出假設(shè): , 即兩種密度的總體產(chǎn)量沒有差異,即兩種密度的總體產(chǎn)量沒有差異, 對對 ,即兩種密度的總體產(chǎn)量差異顯著。,即兩種密度的總體產(chǎn)量差異顯著。210:H0:AH(2)確定顯著水平:確定顯著水平: =0.05 ,t0.05,8=2.3061y(3)測驗計算
34、測驗計算: =428kg =440kg SS1=1930 SS2=550 2y3104455019302es 故故 測驗步驟為:測驗步驟為:)(136.115310221kgsyy(4)統(tǒng)計推斷:統(tǒng)計推斷:現(xiàn)實得現(xiàn)實得|t|=1.080.05。推斷:。推斷:接受假設(shè)接受假設(shè) ,兩種密度的畝產(chǎn)量沒有顯著差異。,兩種密度的畝產(chǎn)量沒有顯著差異。 210:H08. 1)(2121yysyyt例例5.4 研究矮壯素使玉米矮化的效果,在抽穗研究矮壯素使玉米矮化的效果,在抽穗期測定噴矮壯素小區(qū)期測定噴矮壯素小區(qū)8株、對照區(qū)玉米株、對照區(qū)玉米9株,其株高結(jié)果如表株,其株高結(jié)果如表5.3。試作假設(shè)測。試作假設(shè)測
35、驗。驗。y1(噴矮壯素噴矮壯素)y2(對照對照)160170160270200180160250200270170290150270210230170表表5.3 噴矮壯素與否的噴矮壯素與否的玉米株高玉米株高(cm)(cm)因為是小樣本,且總體方差未知,故需因為是小樣本,且總體方差未知,故需用用t測驗,又由于矮壯素只可能矮化無測驗,又由于矮壯素只可能矮化無效而不可能促進植侏長高故用一尾測驗效而不可能促進植侏長高故用一尾測驗。(3)測驗計算測驗計算: =176.3cm, =233.3cm, SS1=3787.5 SS2=184001y2y故有故有 17.147921212ssssse)(688.1
36、81121221cmnnsseyy(4)統(tǒng)計推斷統(tǒng)計推斷:現(xiàn)實得:現(xiàn)實得 t =3.05t0.05=1.753,P3.106,Pt0.01,故,故P0.01,因此 00d:H否定0dA:H接受)(387587)12(1)15(個個./d)(99716743167個個.sd測驗步驟:即兩種處理對飩化病毒效果相同;即兩種處理對飩化病毒效果相同;即兩種處理對飩化病毒效果差異顯著。即兩種處理對飩化病毒效果差異顯著。(2 2)確定顯著水平:)確定顯著水平:t0.01,6=3.707 。 (4) (4)統(tǒng)計推斷:統(tǒng)計推斷:即即A、B兩法對飩化病毒的效應(yīng)有極顯著差異。兩法對飩化病毒的效應(yīng)有極顯著差異。 研究
37、某種新肥料能否比原肥料每研究某種新肥料能否比原肥料每畝增產(chǎn)畝增產(chǎn)5kg以上皮棉,選土壤和以上皮棉,選土壤和其他條件最近似的相鄰小區(qū)組成其他條件最近似的相鄰小區(qū)組成一對,其中一區(qū)施新肥料,另一一對,其中一區(qū)施新肥料,另一區(qū)施原肥料作對照,重復區(qū)施原肥料作對照,重復9次。次。產(chǎn)量結(jié)果見表產(chǎn)量結(jié)果見表5.5。試測驗新肥。試測驗新肥料能否比原肥料每畝增產(chǎn)料能否比原肥料每畝增產(chǎn)5kg以以上皮棉?上皮棉?表表5.5 兩種肥料的皮棉產(chǎn)量兩種肥料的皮棉產(chǎn)量( (kg) )重復區(qū)y1(新肥料)y(對照)d67.460.66.872.866.66.268.464.93.566.061.84.270.861.79.
38、169.667.22.467.262.44.868.961.37.662.656.75.9因為要測驗新肥料能否比對照增產(chǎn)因為要測驗新肥料能否比對照增產(chǎn)5kg,故采用一尾測驗。,故采用一尾測驗。例例5.750d:H5dA:H050. (3)測驗計算:)測驗計算: 87070056155.sdtd實得實得|t|0.05,因此50d:H接受)(61595509)952686(公公斤斤/ /畝畝././.d)(700) 19(99)550(9526862222公公斤斤/ /畝畝./.sd測驗步驟:(1)提出假設(shè):)提出假設(shè):(2)確定顯著水平:)確定顯著水平:(4)統(tǒng)計推斷:)統(tǒng)計推斷:即新肥料比對照
39、每畝增收不超過新肥料比對照每畝增收不超過5kg;即新肥料比對照每畝可增收即新肥料比對照每畝可增收5kg以上。以上。, t0.05,8=1.860(一尾概率一尾概率) 。即認為新肥料較原肥料每畝增收皮棉不超過即認為新肥料較原肥料每畝增收皮棉不超過5kg。 比較所依據(jù)的條件不同。比較所依據(jù)的條件不同。 成對:假定各個配對的成對:假定各個配對的差數(shù)差數(shù)來自差數(shù)的分布為正態(tài)的總體來自差數(shù)的分布為正態(tài)的總體,具有具有 N(0, ); 每一配對的兩個供試單位是每一配對的兩個供試單位是彼此相關(guān)彼此相關(guān)的。的。 成組:假定成組:假定兩個樣本兩個樣本皆來自具有共同皆來自具有共同(或不同或不同)方差的正態(tài)總體,方
40、差的正態(tài)總體, 兩個樣本的各個供試單位都是兩個樣本的各個供試單位都是彼此獨立彼此獨立的。的。 2d成對數(shù)據(jù)和成組數(shù)據(jù)平均數(shù)比較的不同成對數(shù)據(jù)和成組數(shù)據(jù)平均數(shù)比較的不同:在實踐上,如將成對數(shù)據(jù)按成組數(shù)據(jù)的方法比較,容易使統(tǒng)在實踐上,如將成對數(shù)據(jù)按成組數(shù)據(jù)的方法比較,容易使統(tǒng)計推斷發(fā)生第二類錯誤,即不能鑒別應(yīng)屬顯著的差異。故在計推斷發(fā)生第二類錯誤,即不能鑒別應(yīng)屬顯著的差異。故在應(yīng)用時需嚴格區(qū)別。應(yīng)用時需嚴格區(qū)別。第四節(jié):參數(shù)的區(qū)間估計第四節(jié):參數(shù)的區(qū)間估計一、參數(shù)區(qū)間估計的原理一、參數(shù)區(qū)間估計的原理三、兩個總體平均數(shù)差數(shù)的區(qū)間估計三、兩個總體平均數(shù)差數(shù)的區(qū)間估計二、總體平均數(shù)的區(qū)間估計二、總體平均
41、數(shù)的區(qū)間估計四、區(qū)間估計與假設(shè)測驗四、區(qū)間估計與假設(shè)測驗一、一、 參數(shù)區(qū)間估計的原理參數(shù)區(qū)間估計的原理 所謂所謂參數(shù)的區(qū)間估計參數(shù)的區(qū)間估計,是指在是指在一定的概率保證之下一定的概率保證之下,由由樣本結(jié)果對總體參數(shù)估計出一個范圍或區(qū)間,這個區(qū)間或樣本結(jié)果對總體參數(shù)估計出一個范圍或區(qū)間,這個區(qū)間或范圍能夠覆蓋總體參數(shù)。范圍能夠覆蓋總體參數(shù)。 這個區(qū)間稱這個區(qū)間稱置信區(qū)間置信區(qū)間( confidence interval )( confidence interval ),區(qū)間的上、,區(qū)間的上、下限稱為下限稱為置信限置信限( confidence limit )( confidence limit
42、),區(qū)間的長度稱為,區(qū)間的長度稱為置信置信距距。 一般以一般以L1和和L2分別表示置信下限和上限。分別表示置信下限和上限。 保證該區(qū)間能覆蓋參數(shù)的概率以保證該區(qū)間能覆蓋參數(shù)的概率以P=(1 )表示,稱表示,稱為為置信系數(shù)或置信度置信系數(shù)或置信度。 00.950.95(接受區(qū))(接受區(qū))0.0250.025接受區(qū)接受區(qū) 0-1.96 y 0+1.96 y95. 0)96. 196. 1(yyyP05. 0)96. 1()96. 1(yyyPyP95. 0)96. 196. 1(yyyP99. 0)58. 258. 2(yyyP95. 0)96. 196. 1(yyyP95. 0)96. 196.
43、 1( yyyyP95. 0)96. 196. 1(yyyyP95. 0)96. 196. 1(yyyyP99. 0)58. 258. 2(yyyyP 得:各項減 得:y各項減 得:1-各項乘 :于是有 :同理推廣到一般有:95. 0)96. 196. 1(yyyyP99. 0)58. 258. 2(yyyyP1)(yyuyuyP于是得到在置信度P=(1-)時,對的置信區(qū)間為:)()(yyuyuy)(),(21yyuyLuyL并有: 由于對應(yīng)于(1- )置信度的臨界值u或t 皆隨置信度的增大而 , 因而以(1- )估計總體參數(shù)的置信區(qū)間時,取大的置信度,必然置信區(qū)間 ,而其估計的準確度也就 。
44、 如欲使置信度大,同時也使估計準確度較大,則必須 或 。 增大較大較小減小試驗誤差增大樣本容量在實際應(yīng)用中,應(yīng)合理選取概率顯著水平在實際應(yīng)用中,應(yīng)合理選取概率顯著水平的大小,不能認為的大小,不能認為取值越小越好。取值越小越好。二、二、 總體平均數(shù)總體平均數(shù)的置信限的置信限(一)在總體方差2為已知,或總體方差未知但或總體方差未知但為大樣本為大樣本時)()(yyuyuyyyuyLuyL21,的置信區(qū)間為: 例例5.13 某棉花株行圃某棉花株行圃36個單行的皮棉平個單行的皮棉平均產(chǎn)量為均產(chǎn)量為 kg,已知,已知 =0.3kg,求,求99%置信度下該株行圃單行皮棉產(chǎn)量置信度下該株行圃單行皮棉產(chǎn)量 的置
45、的置信區(qū)間。信區(qū)間。 14.y 在置信度在置信度P=(1 )=99%下,由附表下,由附表3查得查得 u0.01=2.58;并算得并算得 05. 03630/.y)05. 058. 21 . 4()05. 058. 21 . 4( 推斷:估計該株行圃單行皮棉平均產(chǎn)量在推斷:估計該株行圃單行皮棉平均產(chǎn)量在4.04.2kg之間,之間,此估計值的可靠度有此估計值的可靠度有99%。 2 . 40 . 4故故99%置信區(qū)間為置信區(qū)間為即即 (二)、在總體方差2為未知時)()(yystystyyystyLstyL21, 2需由樣本均方s2估計,于是置信區(qū)間為: 例例5.14 例例5.1已算得某春小麥良種在已
46、算得某春小麥良種在8個小區(qū)的千粒重平均數(shù)個小區(qū)的千粒重平均數(shù) , 。試估計在置信度為試估計在置信度為95%時該品種的千粒時該品種的千粒重范圍。重范圍。g235.y g580.sy 由附表由附表4查得查得 v =7時時 t0.05=2.365,)58. 0365. 22 .35()58. 0365. 22 .35( 推斷:該品種總體千粒重在推斷:該品種總體千粒重在33.836.6g之間的置信度為之間的置信度為95%。在表達時亦可寫作。在表達時亦可寫作 形式,即該品種總體千粒形式,即該品種總體千粒重重95%置信度的區(qū)間是置信度的區(qū)間是35.2(2.3650.58)=35.21.4(g) ,即即33
47、.836.6g。 6 .368 .33ysty)()(yystysty故有故有即即代入公式:代入公式:三、兩總體平均數(shù)差數(shù)三、兩總體平均數(shù)差數(shù)(1- 2)的置信限的置信限(一)在兩總體方差已知或總體方差未知但為大樣本時(一)在兩總體方差已知或總體方差未知但為大樣本時2121)()(212121yyyyuyyuyy2121)()(212211yyyyuyyLuyyL 例例5.15 5.15 測得高農(nóng)選測得高農(nóng)選1號甘薯號甘薯332株的單株平均產(chǎn)量,株的單株平均產(chǎn)量, 1550(g), 5.350(g),白皮白心甘薯白皮白心甘薯282株,株, 1250(g), 3.750(g)。試估計兩品種單株平
48、均產(chǎn)量的相差在試估計兩品種單株平均產(chǎn)量的相差在95%置信度置信度下的置信區(qū)間。下的置信區(qū)間。1y1s2y2s18503605028273332352221.yy 因而,因而,95%的置信限為:的置信限為: L1=(750-600)1.9618=114.7(g) L2=(750-600)+1.9618=185.3(g) 故高農(nóng)選故高農(nóng)選1號甘薯的單株平均產(chǎn)量比白皮白心甘薯多號甘薯的單株平均產(chǎn)量比白皮白心甘薯多114.7185.7(g),這個估計有,這個估計有95%的把握。的把握。(二二) 在兩總體方差為未知時在兩總體方差為未知時, 有兩種情況:有兩種情況: 1. 假設(shè)兩總體方差相等假設(shè)兩總體方差
49、相等,即,即 : 的的1-置信區(qū)間為:置信區(qū)間為: 22221212121212121yyyystyystyy)()(并有并有 21)(211yystyyL21)(212yystyyL 以上的以上的 為平均數(shù)差數(shù)標準誤,為平均數(shù)差數(shù)標準誤, 是置信度為是置信度為1 ,自由度為自由度為 v =n1+n22 時時 t 分布的臨界值。分布的臨界值。21yyst 例例5.16 試估計試估計表表5.2資料兩種密度資料兩種密度667m2產(chǎn)量差數(shù)在置產(chǎn)量差數(shù)在置信度為信度為99%時的置信區(qū)間。時的置信區(qū)間。 在前面已算得:在前面已算得: 4281y4402y1361121.syy由附表由附表查得查得 v =8 時,時,t0.01=3.355 故有故有 L1=(428440)(3.35511.136)= 49.4, L2=(428440)+(3.35511.136)=25.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024租房合同的注意事項舉例
- 新概念英語第四冊第七單元語法與句型(教學用)
- 工程防疫方案
- 學校校園封閉管理制度
- 廠級安全培訓試題及參考答案(B卷)
- 安全標準化安全培訓試題帶下載答案
- 2025年高考語文一輪復習考點微專題:詞語辨析(原卷版)
- 家長會園長演講稿(7篇)
- 小班幼兒評語大全
- 簡易施工合同協(xié)議書
- 年度人力資源預算編制
- 愛麗絲夢游仙境讀書分享
- 《狂犬病暴露預防處置工作規(guī)范(2023年版)》解讀課件
- 學籍信息更改申請表
- 氣候年景評估方法
- 一例骶尾部Ⅳ期壓瘡患者傷口的護理
- 中學開展性別平等教育的工作情況匯報多篇合集
- 高中化學課程思政的內(nèi)涵及實施
- 仿生科學與技術(shù)
- 2017年單獨招生考試技能模擬試題3
- 創(chuàng)業(yè)公司預算表格式
評論
0/150
提交評論