第三章總體均數(shù)的估計與假設檢驗_第1頁
第三章總體均數(shù)的估計與假設檢驗_第2頁
第三章總體均數(shù)的估計與假設檢驗_第3頁
第三章總體均數(shù)的估計與假設檢驗_第4頁
第三章總體均數(shù)的估計與假設檢驗_第5頁
已閱讀5頁,還剩118頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1 1第三章第三章 總體均數(shù)的估計與假設檢驗總體均數(shù)的估計與假設檢驗流行病與衛(wèi)生統(tǒng)計學系流行病與衛(wèi)生統(tǒng)計學系2 2內內 容容1. 1. 均數(shù)的抽樣誤差與標準誤均數(shù)的抽樣誤差與標準誤2. t2. t分布(分布(t- distributiont- distribution)3. 3. 總體均數(shù)的估計總體均數(shù)的估計4. t4. t檢驗檢驗5. 5. 假設檢驗注意事項假設檢驗注意事項6. 6. 正態(tài)性檢驗和兩樣本方差比較的正態(tài)性檢驗和兩樣本方差比較的F F檢驗檢驗3 3第一節(jié)第一節(jié) 均數(shù)的抽樣誤差均數(shù)的抽樣誤差與標準誤與標準誤統(tǒng)計推斷:由樣本信息推斷總體特征統(tǒng)計推斷:由樣本信息推斷總體特征。4 4樣本

2、統(tǒng)計指標樣本統(tǒng)計指標(統(tǒng)計量)(統(tǒng)計量)總體統(tǒng)計指標總體統(tǒng)計指標(參數(shù))(參數(shù))正態(tài)(分布)總體:正態(tài)(分布)總體: 可可 利用樣本均數(shù)推斷總體均數(shù)利用樣本均數(shù)推斷總體均數(shù)2 (,)N jjXS 167.41, 2.74 165.56, 6.57 168.20, 5.36 165.69, 5.09 nj=10 100 個 =167.7cm =5.3cm X1,X2,X3,Xi, 5 5jngjXjS 例例3-13-1 若某市若某市19991999年年1818歲男生身高服從均數(shù)歲男生身高服從均數(shù)=167.7cm=167.7cm、標準差、標準差 =5.3cm=5.3cm的正態(tài)分布。對該總的正態(tài)分布

3、。對該總體進行隨機抽樣,每次抽體進行隨機抽樣,每次抽1010人,(人,( =10=10),共抽得),共抽得100100個樣本(個樣本( =100=100),計算得每個樣本均數(shù)),計算得每個樣本均數(shù) 及及標準差標準差6 6 將此將此100100個樣本均數(shù)看成個樣本均數(shù)看成新變量值新變量值,則這,則這100100個個樣本均數(shù)構成一樣本均數(shù)構成一新分布新分布,繪制直方圖,繪制直方圖7 7 ,各樣本均數(shù),各樣本均數(shù) 未必等于總體均數(shù);未必等于總體均數(shù); 各樣本均數(shù)間存在差異;各樣本均數(shù)間存在差異; 樣本均數(shù)的分布為中間多,兩邊少,左右基本樣本均數(shù)的分布為中間多,兩邊少,左右基本對稱。對稱。 樣本均數(shù)的

4、變異范圍較之原變量的變異范圍大樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小。大縮小。100100個樣本均數(shù)的均數(shù)為個樣本均數(shù)的均數(shù)為167.69cm167.69cm、標準差為、標準差為1.69cm1.69cmXX 樣本均數(shù)的抽樣分布具有如下特點:樣本均數(shù)的抽樣分布具有如下特點:1 1、抽樣誤差:、抽樣誤差: 抽樣誤差:抽樣誤差:由于抽樣和個體變異導由于抽樣和個體變異導致的統(tǒng)計量和參數(shù)間的差值致的統(tǒng)計量和參數(shù)間的差值 均數(shù)的抽樣誤差:均數(shù)的抽樣誤差:由于抽樣造成的樣由于抽樣造成的樣本均數(shù)與總體均數(shù)的差別,樣本均數(shù)本均數(shù)與總體均數(shù)的差別,樣本均數(shù)間的差別間的差別 8 89 9以以n=60n=60

5、為界限為界限1010標準誤:標準誤:表示樣本統(tǒng)計量抽樣誤差大表示樣本統(tǒng)計量抽樣誤差大小的統(tǒng)計指標小的統(tǒng)計指標均數(shù)標準誤:均數(shù)標準誤:說明均數(shù)抽樣誤差的說明均數(shù)抽樣誤差的大小,計算公式:大小,計算公式:(3-1)Xn2、標準誤標準誤(standard error, SE)實質:樣本均數(shù)的標準差實質:樣本均數(shù)的標準差1111數(shù)理統(tǒng)計證明:數(shù)理統(tǒng)計證明: 1212若用樣本標準差若用樣本標準差S S來估計來估計 , (3-2)降低抽樣誤差的途徑有降低抽樣誤差的途徑有:通過增加樣本含量通過增加樣本含量通過設計減少通過設計減少SXSSn1313第二節(jié)第二節(jié) t 分布分布 (t-distribution)t

6、分布概述 抽樣誤差的分布規(guī)律 樣本 總體 t分布 理論 手段 (橋梁) 目的14141515 一、一、t 分布的概念分布的概念 16161717, 1XXXtnSSn 式中式中 為自由度為自由度(degree of freedom, df) 3實際工作中,由于實際工作中,由于 未知,用未知,用 代替,代替,則則 ,服從,服從t t 分布分布 XXS() /XXS1818二、二、t 分布的圖形與特征分布的圖形與特征 分布只有一個參數(shù),即自由度t1919 t-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0(標準正態(tài)曲線)=5=1f(t)圖3-3 不同自由度下的t 分布圖

7、20201特征:特征: 21212 參參 數(shù)數(shù) (on ly on e): 3 t界界 值值 表表 : 詳詳 見見 附附 表表 2, 可可 反反 映映 t分分 布布 曲曲 下下 的的 面面 積積 。 單單 側側 概概 率率 或或 單單 尾尾 概概 率率 : 用用,t表表 示示 ; 雙雙 側側 概概 率率 或或 雙雙 尾尾 概概 率率 : 用用/2,t 表表 示示 。 2 t界值表:界值表:詳見附表詳見附表2,可反映,可反映t分布曲線下的面積。分布曲線下的面積。單側概率或單尾概率:用單側概率或單尾概率:用 表示;表示;雙側概率或雙尾概率:用雙側概率或雙尾概率:用 表示。表示。 2參數(shù)參數(shù)(onl

8、y one): 3t 界界值表:詳見附表值表:詳見附表 2,可反映,可反映 t 分布曲下的面積。分布曲下的面積。 單側概率或單尾概率:用單側概率或單尾概率:用,t 表示;表示; 雙側概率或雙尾概率:用雙側概率或雙尾概率:用/2,t表示。表示。 2222-tt02323 0.05,10101.812t,單=0.05,則有 (1.812)0.05 (1.812)0.05P tP t 或 0.05/ 2,10102.228t,雙=0.05,則有 (2.228)(2.228)0.05P tP t 舉例:舉例: 2424第三節(jié)第三節(jié) 總體均數(shù)的估計總體均數(shù)的估計2525一、參數(shù)估計一、參數(shù)估計 用樣本統(tǒng)

9、計量推斷總體參數(shù)用樣本統(tǒng)計量推斷總體參數(shù)總體均數(shù)估計:總體均數(shù)估計:用樣本均數(shù)(和標準用樣本均數(shù)(和標準差)推斷總體均數(shù)差)推斷總體均數(shù)26262727 總體均數(shù)的區(qū)間估計:總體均數(shù)的區(qū)間估計:按預先給定的概按預先給定的概率率(1 )所確定的包含未知總體均數(shù)的一個所確定的包含未知總體均數(shù)的一個范圍范圍 如給定如給定 =0.05,=0.05,該范圍稱為參數(shù)的該范圍稱為參數(shù)的95%95%可信區(qū)間或置信區(qū)間可信區(qū)間或置信區(qū)間 如給定如給定 =0.01,=0.01,該范圍稱為參數(shù)的該范圍稱為參數(shù)的99%99%可信區(qū)間或置信區(qū)間可信區(qū)間或置信區(qū)間2區(qū)間估計區(qū)間估計(interval estimation

10、):總體均數(shù)可信區(qū)間的計算需考慮:(1)總體標準差是否已知(2)樣本含量n的大小通常有兩類方法:(1)t分布法(2)u分布法2828二、總體均數(shù)可信區(qū)間的計算二、總體均數(shù)可信區(qū)間的計算2929 1. 1. 單一總體均數(shù)的可信區(qū)間單一總體均數(shù)的可信區(qū)間 XXStX或StX,單側1-可信區(qū)間則為:(1)未知:按t分布 雙側1-可信區(qū)間則為:),(, 2/, 2/, 2/, 2/XvXvXvXvStXStXStXStX3030 例3-2 在例3-1中抽得第15號樣本得均數(shù) (cm),標準差 (cm),求其總體均數(shù)的95可信區(qū)間95.166X64. 3S3131323233333434例例3-33-3

11、 某地抽取正常成年人某地抽取正常成年人200200名,名,測得其血清膽固醇的均數(shù)為測得其血清膽固醇的均數(shù)為3.643.64 mmol/Lmmol/L,標準差為,標準差為1.201.20mmol/Lmmol/L,估計,估計該地正常成年人血清膽固醇均數(shù)的該地正常成年人血清膽固醇均數(shù)的95%95%可信區(qū)間??尚艆^(qū)間。 3535 故該地正常成年人血清膽固醇均數(shù)的雙側故該地正常成年人血清膽固醇均數(shù)的雙側95%95%可信區(qū)間為可信區(qū)間為(3.47, 3.81)mmol(3.47, 3.81)mmol L L。36361212/2,()XXXXtS1212(1)(1)2nnnn2. 2. 兩總體均數(shù)之差的可

12、信區(qū)間兩總體均數(shù)之差的可信區(qū)間: : 從從 相等,相等,但但 不等的兩個正態(tài)總體不等的兩個正態(tài)總體NN( ( 1 1, , 2 2) )和和NN( ( 2 2, , 2 2) )進行隨機抽樣。則進行隨機抽樣。則兩總體均數(shù)之差兩總體均數(shù)之差( ( 1 1- - 2 2) )的的雙側雙側1- 1- 可信區(qū)間可信區(qū)間為為37373838同理,兩總體均數(shù)之差同理,兩總體均數(shù)之差( ( 1 1- - 2 2) )的單側的單側1- 1- 可信區(qū)間為可信區(qū)間為當兩樣本的樣本含量均較大時當兩樣本的樣本含量均較大時( (如如n n1 1和和n n2 2均大于均大于60)60),可按正態(tài)分布處理,可按正態(tài)分布處理

13、121212,()()XXXXtS 121212,()()XXXXtS 3939 例例3-4 3-4 為了解氨甲喋呤為了解氨甲喋呤(MTX)(MTX)對外周血對外周血IL-2IL-2水平的影響,某醫(yī)生將水平的影響,某醫(yī)生將6161名哮喘患者隨機分為名哮喘患者隨機分為兩組。其中對照組兩組。其中對照組2929例例( )( ),采用安慰劑;實驗,采用安慰劑;實驗組組3232例例( )( ),采用小劑量氨甲喋呤,采用小劑量氨甲喋呤(MTX)(MTX)進行治進行治療。測得療。測得對照組治療前對照組治療前IL-2IL-2的均數(shù)為的均數(shù)為20.10 20.10 IU/ml ( )IU/ml ( ),標準差為

14、,標準差為7.02 IU/ml ( )7.02 IU/ml ( );試驗組試驗組治療前治療前IL-2IL-2的均數(shù)為的均數(shù)為16.89 IU/ml ( )16.89 IU/ml ( ),標準差,標準差為為8.46 IU/ml ( )8.46 IU/ml ( )。問兩組治療前基線的。問兩組治療前基線的IL-2IL-2總總體均數(shù)相差有多大?體均數(shù)相差有多大? 1n2n1X2X2S1S4040第一步:第一步: 1222(29 1) 7.02(32 1) 8.4611()2.002329 32 229 32XXS 41411. 95%1. 95%的可信區(qū)間的理解:的可信區(qū)間的理解:(1 1)所要估計的

15、總體參數(shù)有)所要估計的總體參數(shù)有95%95%的可能性在我們所估計的可能性在我們所估計的可信區(qū)間內的可信區(qū)間內(2 2)從正態(tài)總體中隨機抽取)從正態(tài)總體中隨機抽取100100個樣本,可算得個樣本,可算得100100個樣個樣本均數(shù)和標準差,也可算得本均數(shù)和標準差,也可算得100100個均數(shù)的可信區(qū)間,平均個均數(shù)的可信區(qū)間,平均約有約有9595個可信區(qū)間包含了總體均數(shù)個可信區(qū)間包含了總體均數(shù) (3 3)但在實際工作中,只能根據(jù)一次試驗結果估計可信)但在實際工作中,只能根據(jù)一次試驗結果估計可信區(qū)間,我們就認為該區(qū)間包含了總體均數(shù)區(qū)間,我們就認為該區(qū)間包含了總體均數(shù) 4242三、可信區(qū)間的確切涵義三、可

16、信區(qū)間的確切涵義 2.2.可信區(qū)間的兩個要素可信區(qū)間的兩個要素(1 1)準確度:)準確度:用可信度(用可信度(1 1 )表示:)表示:即區(qū)間包含即區(qū)間包含總體均數(shù)總體均數(shù) 的理論概率大小的理論概率大小 。當然它愈接近當然它愈接近1 1愈好,如愈好,如99%99%的可信區(qū)間比的可信區(qū)間比95%95%的可信的可信區(qū)間要好區(qū)間要好 。(2 2)精確度:)精確度:即區(qū)間的寬度即區(qū)間的寬度 區(qū)間愈窄愈好,如區(qū)間愈窄愈好,如95%95%的可信區(qū)間比的可信區(qū)間比99%99%的可信區(qū)間的可信區(qū)間要好要好 。4343 當當n n確定時,上述兩者互相矛盾確定時,上述兩者互相矛盾提高準確度(可信度),則精確度降低提

17、高準確度(可信度),則精確度降低(可信區(qū)間會變寬),勢必降低可信區(qū)間的實際(可信區(qū)間會變寬),勢必降低可信區(qū)間的實際應用價值,故不能籠統(tǒng)認為應用價值,故不能籠統(tǒng)認為99%99%可信區(qū)間比可信區(qū)間比95%95%可信區(qū)間要好可信區(qū)間要好相反,在實際應用中,相反,在實際應用中,95%95%可信區(qū)間更為常用可信區(qū)間更為常用4444在可信度確定的情況下,增加樣本含量可在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度減小區(qū)間寬度,提高精確度4545表表3-2 3-2 總體均數(shù)的可信區(qū)間與參考值范圍的區(qū)別總體均數(shù)的可信區(qū)間與參考值范圍的區(qū)別四、總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別四、總體均數(shù)可信區(qū)

18、間與參考值范圍的區(qū)別4646回回 顧顧均數(shù)的抽樣誤差:均數(shù)的抽樣誤差:由于抽樣造成的樣本均數(shù)與總體均數(shù)的差別,樣本由于抽樣造成的樣本均數(shù)與總體均數(shù)的差別,樣本均數(shù)間的差別均數(shù)間的差別均數(shù)標準誤:均數(shù)標準誤:說明均數(shù)抽樣誤差的大小說明均數(shù)抽樣誤差的大小XnXSSn, 1XXXtnSSnt值服從值服從t分布分布t界值:界值:單側概率或單尾概率:用單側概率或單尾概率:用t , 表示表示 雙側概率或雙尾概率:用雙側概率或雙尾概率:用t /2, 表示表示總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計:按預先給定的概率按預先給定的概率(1 )所確定的所確定的包含未知總體均數(shù)的一個范圍包含未知總體均數(shù)的一個范圍474

19、71. 1. 單一總體均數(shù)的可信區(qū)間單一總體均數(shù)的可信區(qū)間 ),(,2/,2/,2/,2/XvXvXvXvStXStXStXStX雙雙 側側單單 側側XXStX或StX,(1) 未知,未知,n小?。?) 未知,未知,n足夠大足夠大 呢?呢?(3) 已知呢?已知呢?2. 2. 兩總體均數(shù)之差的可信區(qū)間兩總體均數(shù)之差的可信區(qū)間1212/2,()XXXXtS雙雙 側側單單 側側121212,() ()XXXXt S121212,()()XXXXt S4848第四節(jié)第四節(jié) t t 檢驗檢驗49491 1、樣本均數(shù)、樣本均數(shù) 與已知某總體均數(shù)與已知某總體均數(shù) 比較的比較的t t檢驗檢驗 目的:推斷一個未

20、知總體均數(shù) 與已知總體均 數(shù) 是否有差別,用單樣本設計2 2、兩個樣本均數(shù)、兩個樣本均數(shù) 與與 比較的比較的t t檢驗檢驗目的:推斷兩個未知總體均數(shù) 與 是否有差 別,用成組設計3 3、配對設計資料均數(shù)比較的、配對設計資料均數(shù)比較的t t檢驗檢驗目的:推斷兩個未知總體均數(shù) 與 是否有差 別用配對設計X1X2X01212t t 檢驗(檢驗(student student t t 檢驗)檢驗)對于大樣本對于大樣本, ,也可以近似用也可以近似用u u檢驗檢驗t檢驗和檢驗和u u檢驗的應用條件檢驗的應用條件: :1. 1. t t檢驗應用條件檢驗應用條件: :樣本含量樣本含量n n較小時較小時( (如

21、如n n60)60)(1)(1)資料服從正態(tài)分布資料服從正態(tài)分布 (2)(2)方差齊性方差齊性(homogeneity of variance)(homogeneity of variance)2. 2. u u 檢驗應用條件檢驗應用條件: :樣本含量樣本含量n n較大,或較大,或n n雖小但總體標準差已知雖小但總體標準差已知 (1)(1)正態(tài)分布正態(tài)分布 (2)(2)方差齊性方差齊性(homogeneity of variance)(homogeneity of variance)50505151 假設檢驗過去稱顯著性檢驗。它是利假設檢驗過去稱顯著性檢驗。它是利用小概率反證法思想,從問題的對

22、立面用小概率反證法思想,從問題的對立面( (H H0 0) )出發(fā)間接判斷要解決的問題出發(fā)間接判斷要解決的問題( (H H1 1) )是是否成立。根據(jù)否成立。根據(jù)H H0 0成立的假設成立的假設, ,計算檢驗計算檢驗統(tǒng)計量,最后獲得統(tǒng)計量,最后獲得P P值來判斷值來判斷 假設檢驗假設檢驗基本思想及步驟例3-5 某醫(yī)生測量了3636名從事鉛作業(yè)男名從事鉛作業(yè)男性工人性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標準差為25.74g/L。問從從事鉛作業(yè)工人的血紅蛋白含量事鉛作業(yè)工人的血紅蛋白含量是否不同于正常成年男性平均值正常成年男性平均值140g/L140g/L?130.83g/L 14

23、0g/L原因: 1.可能是總體均數(shù)不同 2.是抽樣造成的 525253531. 1.建立檢驗假設,確定檢驗水準建立檢驗假設,確定檢驗水準 (選用單側或雙側檢驗)(選用單側或雙側檢驗)(1 1)無效假設又稱零假設,記為)無效假設又稱零假設,記為H H0 0(2 2)備擇假設又稱對立假設,記為)備擇假設又稱對立假設,記為H H1 1對于檢驗假設,須注意:對于檢驗假設,須注意: 檢驗假設是針對總體而言檢驗假設是針對總體而言 H H0 0和和H H1 1是相互聯(lián)系,對立的假設,后面的結論是根據(jù)是相互聯(lián)系,對立的假設,后面的結論是根據(jù)H H0 0和和H H1 1作出的,因此兩者不是可有可無,而是缺一不可

24、作出的,因此兩者不是可有可無,而是缺一不可5454 H H1 1的內容直接反映了檢驗單雙側。的內容直接反映了檢驗單雙側。若若H H1 1中只是中只是 0 0 或或 0 0,則此檢驗為,則此檢驗為單側檢驗。它不僅考慮有無差異,而且還單側檢驗。它不僅考慮有無差異,而且還考慮差異的方向考慮差異的方向 單雙側檢驗的確定,首先根據(jù)專業(yè)單雙側檢驗的確定,首先根據(jù)專業(yè)知識,其次根據(jù)所要解決的問題來確定知識,其次根據(jù)所要解決的問題來確定。一般認為雙側檢驗較保守和穩(wěn)妥一般認為雙側檢驗較保守和穩(wěn)妥5555 (3 3)檢驗水準)檢驗水準 ,過去稱顯著性水準,是預,過去稱顯著性水準,是預先規(guī)定的概率值,它確定了先規(guī)定

25、的概率值,它確定了小概率事件的標小概率事件的標準準。在實際工作中常取。在實際工作中常取 = = 0.050.05??筛鶕?jù)不可根據(jù)不同研究目的給予不同設置同研究目的給予不同設置5656 根據(jù)變量和資料類型、設計方案、統(tǒng)計推斷的目的、根據(jù)變量和資料類型、設計方案、統(tǒng)計推斷的目的、是否滿足特定條件等(如是否滿足特定條件等(如數(shù)據(jù)的分布類型數(shù)據(jù)的分布類型)選擇相應的檢)選擇相應的檢驗統(tǒng)計量驗統(tǒng)計量 2. 2. 計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量130.83 1402.138, 36 13525.7436t 57573. 3. 確定確定P P值值P P的含義的含義是指是指從從H H0 0規(guī)定的總體隨機抽樣,抽

26、得規(guī)定的總體隨機抽樣,抽得等于及大于等于及大于( (或或/ /和等于及小于和等于及小于) )現(xiàn)有樣本獲得的現(xiàn)有樣本獲得的檢驗統(tǒng)計量檢驗統(tǒng)計量( (如如t t、u u等等) )值的概率值的概率 例例3-53-5的的P P值可用圖值可用圖3-53-5說明,說明,P P為在為在 = 0 0=140g/L=140g/L的前提條件下隨機抽樣,其的前提條件下隨機抽樣,其 t t 小小于及等于于及等于-2.138-2.138和大于及等于和大于及等于2.1382.138的概率的概率 5858t-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0f(t)0.0.1.2.3.4P圖圖3-5

27、 3-5 例例3-53-5中中P P值示意圖值示意圖5959若若 ,按所取檢驗水準,按所取檢驗水準 ,拒絕,拒絕H0,接受,接受H1,下下“有差別有差別”的結論的結論統(tǒng)計學依據(jù):統(tǒng)計學依據(jù):在在H0成立的條件下,得到現(xiàn)有檢驗成立的條件下,得到現(xiàn)有檢驗結果的概率小于結果的概率小于 ,因為小概率事件不可能在一,因為小概率事件不可能在一次試驗中發(fā)生,所以拒絕次試驗中發(fā)生,所以拒絕H0P6060 若若 ,是否也能下,是否也能下“無差別無差別”或或“相等相等”的結的結論?論? PP不能。正確的說法是按所取檢驗水準不能。正確的說法是按所取檢驗水準 ,接受接受H H1 1的統(tǒng)計證的統(tǒng)計證據(jù)不足。據(jù)不足。其統(tǒng)

28、計學依據(jù)是,其統(tǒng)計學依據(jù)是,在在H H1 1成立的條件下,如果試驗成立的條件下,如果試驗樣本少,也同樣可以得到樣本少,也同樣可以得到 的檢驗結果的檢驗結果,我們不知道,我們不知道下下“無差別無差別”或或“相等相等”的結論犯錯誤的概率有多大,也的結論犯錯誤的概率有多大,也就是說,就是說,假設檢驗方法不能為我們提供相信假設檢驗方法不能為我們提供相信“無差別無差別”結結論正確的概率保證論正確的概率保證一、單樣本一、單樣本 T T 檢驗檢驗 (ONE SAMPLE / GROUP T-TEST) 即樣本均數(shù)即樣本均數(shù) (代表未知總體均數(shù)(代表未知總體均數(shù) )與已知總)與已知總體均數(shù)體均數(shù) 0 0( (

29、一般為理論值、標準值或經(jīng)過大量觀察所一般為理論值、標準值或經(jīng)過大量觀察所得穩(wěn)定值等得穩(wěn)定值等) )的比較。其檢驗統(tǒng)計量按下式計算的比較。其檢驗統(tǒng)計量按下式計算61610, 1XXXXtnSSnSnX6262 例例3-53-5 某醫(yī)生測量了某醫(yī)生測量了3636名從事鉛作業(yè)男性工人的血紅蛋白名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為含量,算得其均數(shù)為130.83g/L130.83g/L,標準差為,標準差為25.74g/L25.74g/L。問從事鉛。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L140g/L? (1)(1)建立檢

30、驗假設,確定檢驗水準建立檢驗假設,確定檢驗水準H H0 0: : = 0 0 =140g/L=140g/L,即鉛作業(yè)男性工人平均血紅,即鉛作業(yè)男性工人平均血紅 蛋白含量與正常成年男性平均值相等蛋白含量與正常成年男性平均值相等H H1 1: : 0 0=140g/L=140g/L,即鉛作業(yè)男性工人平均血紅,即鉛作業(yè)男性工人平均血紅 蛋白含量與正常成年男性平均值不等蛋白含量與正常成年男性平均值不等 =0.05=0.056363 (2) (2)計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量 本例n36, 130.83g/L,S25.74g/L,0140g/L。按公式(3-15)X130.83 1402.138, 36

31、 13525.7436t 6464(3)(3)確定確定P P值,作出推斷結論值,作出推斷結論 2.1382.138t 35, 2/02. 035, 2/05. 0138. 2tt 以=35、 查附表2的t界值表,因 ,故雙尾概率0.02P0.05。按 = 0.05水準,拒絕H0,接受H1,有統(tǒng)計學意義結合本題可認為從事鉛作業(yè)的男性工人平均血紅蛋白含量低于正常成年男性 6565配對配對t t 檢驗適用于配對設計的計量資料檢驗適用于配對設計的計量資料配對設計類型:配對設計類型:兩同質受試對象分別接受兩種不同的處理;兩同質受試對象分別接受兩種不同的處理;同一受試對象分別接受兩種不同處理;同一受試對象

32、分別接受兩種不同處理;同一受試對象同一受試對象(一種一種)處理前后。處理前后。 0 , 1dddddddtnSSnSn二、配對二、配對t t 檢驗檢驗 (paired / matched t-test)d為每對數(shù)據(jù)得差值Sd為差值得標準差n為對子數(shù) 為差值的樣本均數(shù)d 為差值樣本均數(shù)得標準誤dS 例例3-6 3-6 為比較兩種方法對乳酸飲料中為比較兩種方法對乳酸飲料中脂肪含量測定結果是否不同,某人隨機脂肪含量測定結果是否不同,某人隨機抽取了抽取了1010份乳酸飲料制品,分別用脂肪份乳酸飲料制品,分別用脂肪酸水解法和哥特里羅紫法測定其結果酸水解法和哥特里羅紫法測定其結果如表如表3-33-3第第(

33、1)(3)(1)(3)欄。問兩法測定結果欄。問兩法測定結果是否不同?是否不同?66666767編 號 (1) 哥特里羅紫法 (2) 脂肪酸水解法 (3) 差值d (4)=(2)(3) 1 0.840 0.580 0.260 2 0.591 0.509 0.082 3 0.674 0.500 0.174 4 0.632 0.316 0.316 5 0.687 0.337 0.350 6 0.978 0.517 0.461 7 0.750 0.454 0.296 8 0.730 0.512 0.218 9 1.200 0.997 0.203 10 0.870 0.506 0.364 2.724 表

34、表3-3 3-3 兩種方法對乳酸飲料中脂肪含量的測定結果兩種方法對乳酸飲料中脂肪含量的測定結果(%)(%) 6868 (1)(1)建立檢驗假設,確定檢驗水準建立檢驗假設,確定檢驗水準H H0 0: d d0 0,即兩種方法的測定結果相同,即兩種方法的測定結果相同H H1 1: d d00,即兩種方法的測定結果不同,即兩種方法的測定結果不同 =0.05=0.05(2)(2)計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量本例本例n n=10=10, d d =2.724=2.724, d d 2 2=0.8483=0.8483, /2.724/100.2724dd n222()(2.724)0.8483100.10

35、87110 1dddnSn6969(3)(3)確定確定P P值,作出推斷結論值,作出推斷結論查附表查附表2 2的的t t界值表得界值表得P P0.0010.50。按=0.05 水準,不拒絕H0 0,無統(tǒng)計學意義。還不能認為阿卡波糖膠囊與拜唐平膠囊對空腹血糖的降糖效果不同 7676 若變量變換后總體方差齊性若變量變換后總體方差齊性 可采用可采用t t 檢檢驗驗( (如兩樣本幾何均數(shù)的如兩樣本幾何均數(shù)的t t 檢驗,就是將原始數(shù)據(jù)取檢驗,就是將原始數(shù)據(jù)取對數(shù)后進行對數(shù)后進行t t 檢驗檢驗) ) 若變量變換后總體方差仍然不齊若變量變換后總體方差仍然不齊 可采用可采用t t 檢驗或檢驗或Wilcox

36、onWilcoxon秩和檢驗秩和檢驗2221若兩總體方差不等( )?77771211222212121 1nXXtnSSnn12121222,22XXXXStSttSS 2.2. Cochran & Cox Cochran & Cox近似近似t t 檢驗檢驗 (t t 檢驗)檢驗) 調整 t 界值7878注意:當n1n2n時,v1v2v,tt,tt,v, 實際上沒有起到校正的作用,采用縮小自由度的方式,vn-1(不是2n-2)用雙尾概率時,t為t2,t,v1和t,v2取t/2,v1和t/2,v27979例例3-83-8 在上述例在上述例3-73-7國產(chǎn)四類新藥阿卡波糖膠囊的國產(chǎn)

37、四類新藥阿卡波糖膠囊的降血糖效果研究中,測得用拜唐蘋膠囊的對照組降血糖效果研究中,測得用拜唐蘋膠囊的對照組2020例病人和用阿卡波糖膠囊的試驗組例病人和用阿卡波糖膠囊的試驗組2020例病人,其例病人,其8 8周周時糖化血紅蛋白時糖化血紅蛋白HbAHbA1 1c(%)c(%)下降值下降值如如表表3-53-5。問用兩。問用兩種不同藥物的病人其種不同藥物的病人其HbAHbA1 1c c下降值是否不同?下降值是否不同?8080分 組 n X S 對 照 組 20 1.46 1.36 試 驗 組 20 1.13 0.70 表表3-5 對照組和試驗組對照組和試驗組HbA1c下降值下降值(%) 對照組方差是

38、試驗組方差的對照組方差是試驗組方差的3.773.77倍,倍,經(jīng)方差齊性檢驗,認為兩組的總體經(jīng)方差齊性檢驗,認為兩組的總體方差不等,故采用方差不等,故采用近似近似 t t 檢驗檢驗8181 (1)(1)建立檢驗假設,確定檢驗水準建立檢驗假設,確定檢驗水準( (略略) )(2)(2)計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量 22121.46 1.13 0.965, 1.360.70202020 119, 20 119t 8282220.05/2221.360.702.0932.09320202.0931.360.702020t(3)(3)確定確定P P值,作出推斷結論值,作出推斷結論 查查t t界值表界值表t

39、 t0.05/20.05/2, ,19=2.09319=2.093。由由t t =0.965=0.9650.050.05。按。按 =0.05=0.05水準,不拒絕水準,不拒絕H H0 0,無統(tǒng)計學意義。還不能認為用兩,無統(tǒng)計學意義。還不能認為用兩種不同藥物的病人其種不同藥物的病人其HbA1cHbA1c下降值不同下降值不同83831212222122221244222212121212()(), ()()1111XXXXSSSSnnttSSSSnnnnnn 3. Satterthwaite3. Satterthwaite近似近似t t檢驗檢驗 : : 而而SatterthwaiteSattert

40、hwaite法法則是對自由度校正則是對自由度校正848422222221.360.70()202028.41.360.70(202020 120 1() 以=28.428、t=0.965查附表2的t界值表得0.20P0.40。結論同前按按SatterthwaiteSatterthwaite法法對例對例3-83-8做檢驗,得做檢驗,得85851212222122221244222212121212()(), 22()()1111XXXXSSSSnnttSSSSnnnnnn 4.Welch法近似t檢驗 Welch法也是對自由度進行校正校正公式為8686對例3-8,如按Welch法,則2222222

41、(1.3620)(0.7020)229.41.3620(0.702020 120 1()以=29.429、t =0.965查附表2的t界值表得0.20P0.40。結論同前8787第五節(jié)第五節(jié) 假設檢驗注意事項假設檢驗注意事項一、一、I I型錯誤和型錯誤和II II型錯誤型錯誤 假設檢驗是利用小概率反證法思想,假設檢驗是利用小概率反證法思想,根據(jù)根據(jù)P P值判斷結果,此推斷結論具有概率性,值判斷結果,此推斷結論具有概率性,因而無論因而無論拒絕拒絕還是還是不拒絕不拒絕HH0 0,都可能犯錯誤,都可能犯錯誤8888表表3-8 3-8 可能發(fā)生的兩類錯誤可能發(fā)生的兩類錯誤假設檢驗的結果假設檢驗的結果

42、客觀實際客觀實際 拒絕拒絕 H0 “接受”“接受”H0 H0成立成立 I 型錯誤型錯誤( ) 推斷正確推斷正確(1 ) H0不成立不成立 即即 H1成立成立 推斷正確推斷正確(1 ) II 型錯誤型錯誤( ) 89899090 I I 型錯誤:型錯誤:“實際無差別,但下了有差別的結實際無差別,但下了有差別的結論論”,假陽性錯誤假陽性錯誤。犯這種錯誤的概率是。犯這種錯誤的概率是 (其其值等于檢驗水準值等于檢驗水準) II II型錯誤:型錯誤:“實際有差別,但下了不拒絕實際有差別,但下了不拒絕H H0 0的結的結論論”,假陰性錯誤假陰性錯誤。犯這種錯誤的概率是。犯這種錯誤的概率是 (其其值未知值未

43、知) 但但 n n 一定時,一定時, 增大,增大, 則減少則減少 1- 1- :檢驗效能:檢驗效能(powerpower): :當當兩總體確有差別,兩總體確有差別,按按檢驗水準檢驗水準 所能發(fā)現(xiàn)這種差別的能力所能發(fā)現(xiàn)這種差別的能力9191圖圖3-6 I3-6 I型錯誤與型錯誤與II II型錯誤示意圖型錯誤示意圖( (以單側以單側u u檢驗為例檢驗為例) ) H1: 0 成立 界值 0 1 1 9292減少減少I I型錯誤型錯誤的主要方法:假設檢驗時設定小的主要方法:假設檢驗時設定小 值值減少減少II II型錯誤型錯誤的主要方法:的主要方法:提高提高檢驗效能檢驗效能提高提高檢驗效能的最有效方法:

44、檢驗效能的最有效方法:增加樣本量增加樣本量如何如何選擇合適的樣本量:選擇合適的樣本量:實驗設計實驗設計二、假設檢驗應注意的問題二、假設檢驗應注意的問題1. 1.要有嚴密的研究設計要有嚴密的研究設計 這是假設檢驗的前提。這是假設檢驗的前提。組組間應均衡,具有可比性,間應均衡,具有可比性,除對比的主要因素外,除對比的主要因素外,影響結果的因素在對比組間應相同或相近其它可影響結果的因素在對比組間應相同或相近其它可能能保證均衡性的方法主要是保證均衡性的方法主要是從同質總體中隨機抽取從同質總體中隨機抽取樣本,或隨機分配樣本樣本,或隨機分配樣本93932.不同的資料應選用不同檢驗方法 應根據(jù)應根據(jù)分析目的

45、、資料類型以及分布、分析目的、資料類型以及分布、設計方案的種類、樣本含量大小等選設計方案的種類、樣本含量大小等選用適當?shù)臋z驗方法用適當?shù)臋z驗方法94943.3.正確理解正確理解“顯著性顯著性”一詞的含義一詞的含義 差別有或無統(tǒng)計學意義,過去稱差別有或無差別有或無統(tǒng)計學意義,過去稱差別有或無“顯著性顯著性”,是對樣本統(tǒng)計量與總體參數(shù)或樣,是對樣本統(tǒng)計量與總體參數(shù)或樣本統(tǒng)計量之間的比較而言本統(tǒng)計量之間的比較而言相應推斷為:相應推斷為:可以可以認為或還不能認為認為或還不能認為兩個或多兩個或多個總體參數(shù)有差別個總體參數(shù)有差別95954.4.結論不能絕對化結論不能絕對化 因統(tǒng)計結論具有概率性質,故因統(tǒng)計

46、結論具有概率性質,故“肯定肯定”、“一定一定”、“必定必定”等詞不要使用等詞不要使用報告結論時,最好列出報告結論時,最好列出檢驗統(tǒng)計量的值,盡檢驗統(tǒng)計量的值,盡量寫出具體的量寫出具體的P P值或值或P P值的確切范圍,值的確切范圍,如寫如寫成成P P=0.040=0.040或或0.020.02P P0.050.05,而不簡單寫,而不簡單寫成成P P0.0500為正偏態(tài),為正偏態(tài), 1 1000為尖峭為尖峭峰,峰, 2 200.500.50,偏度,偏度P P0.500.50。按。按 =0.10=0.10水準,水準,不拒絕不拒絕H H0 0,無統(tǒng)計學意義。還不能認為這些樣,無統(tǒng)計學意義。還不能認為

47、這些樣本均數(shù)的總體不服從正態(tài)分布本均數(shù)的總體不服從正態(tài)分布 二、兩樣本方差比較的二、兩樣本方差比較的F F檢驗檢驗 兩小樣本兩小樣本T T 檢驗時,檢查兩樣本方差代表的總體方差是否檢驗時,檢查兩樣本方差代表的總體方差是否相等相等110110211122221() 1()nSFnS較 大較 小11111122122212SS數(shù)理統(tǒng)計理論證明:數(shù)理統(tǒng)計理論證明:當當H H0 0( )( )成立時,成立時, 服從服從F F分布。分布。F F分布曲線的形狀由兩個參數(shù)分布曲線的形狀由兩個參數(shù)1 1=n n1 11 1和和2 2=n n2 21 1決定,決定,F(xiàn) F的取值范圍為的取值范圍為0 0。圖。圖3

48、-103-10為為1 1=1=1、2 2=10=10和和1 1=5=5、2 2=10=10時時F F分布的圖形分布的圖形 12,(,)F 122,(,)F 統(tǒng)計學家為應用的方便編制了附表統(tǒng)計學家為應用的方便編制了附表3 3的的F F界值表,界值表,表中單尾或單側的界值用表中單尾或單側的界值用 表表示,雙尾或雙側的界值則用示,雙尾或雙側的界值則用 表示表示 112112求得求得F F值后,查值后,查F F界值表得界值表得P P值值( (F F值愈大,值愈大,P P值值愈小愈小) ),然后按所取的,然后按所取的 水準作出推斷結論水準作出推斷結論113113 f(F) F 0 1 2 3 4 5 0

49、.0 0.2 0.4 0.6 0.8 1.0 1=10, 2 1=10, 2=1 圖圖3-10 3-10 不同自由度時不同自由度時F F分布的圖形分布的圖形114114H0:2221, H1:2221, =0.10 22123.06011.598,2.420520 119, 20 119F 例例3-10 3-10 對例對例3-73-7,用,用F F 檢驗判斷兩總體空腹血糖下降檢驗判斷兩總體空腹血糖下降值的方差是否不等。值的方差是否不等。 (1) (1) 建立檢驗假設,確定檢驗水準建立檢驗假設,確定檢驗水準(2) (2) 計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量115115 (3) (3) 確定確定P P值,作出推斷結論值,作出推斷結論 0.10, (20,19)F以以 1 1=19=19、 2 2=19=19查附表查附表3 3的的F F界值表。因界值表。因1.5982.15= 1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論