第04章 抽樣誤差與假設(shè)檢驗(yàn)ppt課件_第1頁
第04章 抽樣誤差與假設(shè)檢驗(yàn)ppt課件_第2頁
第04章 抽樣誤差與假設(shè)檢驗(yàn)ppt課件_第3頁
第04章 抽樣誤差與假設(shè)檢驗(yàn)ppt課件_第4頁
第04章 抽樣誤差與假設(shè)檢驗(yàn)ppt課件_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 第四章第四章 抽樣誤差與假設(shè)檢驗(yàn)抽樣誤差與假設(shè)檢驗(yàn) Sampling Error and Sampling Error and Hypothesis TestHypothesis Test 寧波大學(xué)醫(yī)學(xué)院沈其君寧波大學(xué)醫(yī)學(xué)院沈其君問題提出問題提出 研討方法:對(duì)總體進(jìn)展研討,抽樣研討 除對(duì)關(guān)乎國(guó)計(jì)民生和嚴(yán)重危害人民安康的需對(duì)總體進(jìn)展研討外,普通用抽樣研討 有些領(lǐng)域只能用抽樣研討方法 研討的目的是對(duì)總體下結(jié)論,而研討信息來自樣本問題提出 樣本統(tǒng)計(jì)量樣本均數(shù)與總體參數(shù)總體均數(shù)有否差別? 假設(shè)有差別,其規(guī)律如何?用什么目的來衡量? 怎樣用樣本信息來推斷總體,從而作出結(jié)論。第一節(jié)第一節(jié) 均數(shù)的抽樣誤差

2、與規(guī)范均數(shù)的抽樣誤差與規(guī)范誤誤一、均數(shù)的抽樣誤差一、均數(shù)的抽樣誤差 1X3X總體 100X1X2X一個(gè)摸擬實(shí)驗(yàn):n=100, 反復(fù)抽100個(gè)樣本。問題: 100個(gè)樣本均數(shù)和1個(gè)總體均數(shù)能否一樣?即能否一樣即能否一樣12,3,100,XX XX與123,100,S S SS與 是否相同?抽樣誤差的概念由于抽樣而引起的樣本均數(shù)與總體均數(shù)間差別由于抽樣而引起的樣本均數(shù)與總體均數(shù)間差別稱為均數(shù)抽樣誤差稱為均數(shù)抽樣誤差其他統(tǒng)計(jì)目的在樣本與總體間也存在著抽樣誤其他統(tǒng)計(jì)目的在樣本與總體間也存在著抽樣誤差差由于抽樣而引起的樣本統(tǒng)計(jì)目的與總體參數(shù)間由于抽樣而引起的樣本統(tǒng)計(jì)目的與總體參數(shù)間的差別稱為抽樣誤差的差別

3、稱為抽樣誤差本質(zhì)是個(gè)體存在差別,本質(zhì)是個(gè)體存在差別, 二、抽樣誤差的分布二、抽樣誤差的分布 實(shí)際上可以證明:假設(shè)從正態(tài)總體實(shí)際上可以證明:假設(shè)從正態(tài)總體 中,反復(fù)多次隨機(jī)抽取樣本含量固定為中,反復(fù)多次隨機(jī)抽取樣本含量固定為n n 的樣本,那么這些樣本均數(shù)的樣本,那么這些樣本均數(shù) 也服從正態(tài)也服從正態(tài)分布,即分布,即 的總體均數(shù)仍為的總體均數(shù)仍為 。2N( ,) XX抽樣分布抽樣分布 抽樣分布表示圖抽樣分布表示圖 中心極限定理中心極限定理: : 當(dāng)樣本含量很大的情況下,無論原始丈量變量服當(dāng)樣本含量很大的情況下,無論原始丈量變量服從什么分布,從什么分布, 的抽樣分布均近似正態(tài)。的抽樣分布均近似正態(tài)

4、。 X抽樣分布抽樣分布 抽樣分布表示圖抽樣分布表示圖 三、規(guī)范誤三、規(guī)范誤Standard Error 樣本均數(shù)的規(guī)范差稱為規(guī)范誤。樣本均樣本均數(shù)的規(guī)范差稱為規(guī)范誤。樣本均數(shù)的變異越小闡明估計(jì)越準(zhǔn)確,因此可以數(shù)的變異越小闡明估計(jì)越準(zhǔn)確,因此可以用規(guī)范誤表示抽樣誤差的大小:用規(guī)范誤表示抽樣誤差的大?。?實(shí)踐中總體規(guī)范差實(shí)踐中總體規(guī)范差 往往未知,故只能往往未知,故只能求得樣本均數(shù)規(guī)范誤的估計(jì)值求得樣本均數(shù)規(guī)范誤的估計(jì)值 : nXXSnSSX 例例4.1 在某地隨機(jī)抽查成年男子在某地隨機(jī)抽查成年男子140人,計(jì)算得紅人,計(jì)算得紅細(xì)胞均數(shù)細(xì)胞均數(shù)4.771012/L,規(guī)范差,規(guī)范差0.38 1012

5、/L ,試計(jì),試計(jì)算均數(shù)的規(guī)范誤。算均數(shù)的規(guī)范誤。 規(guī)范誤是抽樣分布的重要特征之一,可用于衡量規(guī)范誤是抽樣分布的重要特征之一,可用于衡量抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)間抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)間估計(jì)和對(duì)不同組之間的參數(shù)進(jìn)展比較。估計(jì)和對(duì)不同組之間的參數(shù)進(jìn)展比較。120.380.032( 10 /L)140XSSn第二節(jié)t分布t值與t分布的引入Xu1.961.960.0250.025X0N(,2)N(0,1)2XN (,) XuXXu XXtS樣本均數(shù)正態(tài)分布樣本均數(shù)正態(tài)分布察看值正態(tài)分布察看值正態(tài)分布t分布分布規(guī)范正態(tài)分布規(guī)范正態(tài)分布S替代替代t分布分布 特征特征

6、 不服從規(guī)范正態(tài)分布,小樣本時(shí)服從自在度=n-1的t分布 t分布曲線是以0為中心的對(duì)稱分布 自在度較小時(shí),曲線峰的高度低于規(guī)范正態(tài)曲線,且曲線峰的寬度也較規(guī)范正態(tài)分布曲線峰狹,尾部面積大于規(guī)范正態(tài)曲線尾部面積,而且自在度越小,t分布的這種特征越明顯 翹尾低狹峰XSXt分布分布 特征特征 自在度越大,t分布越接近于正態(tài)分布;當(dāng)自在度逼近時(shí),t分布趨向于規(guī)范正態(tài)分布。 自在度不同,曲線形狀不同, t分布是一簇曲線概率概率、自在度、自在度 與與t值關(guān)系值關(guān)系t界值界值 規(guī)范正態(tài)分布中規(guī)范正態(tài)分布中u值大小與尾部面積概率值大小與尾部面積概率有關(guān),有關(guān),以以 (單側(cè)和單側(cè)和u/2雙側(cè)表示;雙側(cè)表示; 在

7、在t分布中,當(dāng)自在度一定時(shí)分布中,當(dāng)自在度一定時(shí)越小,越小,|t|越大;越大; 在在一定時(shí),自在度越小,一定時(shí),自在度越小,|t|越大,大于越大,大于u值值 在在t分布中,分布中,t值與值與、的大小有關(guān);的大小有關(guān); 在單側(cè)時(shí)尾部面積取單側(cè)在單側(cè)時(shí)尾部面積取單側(cè)t 界值表示為界值表示為t , ,雙側(cè)時(shí)表示為雙側(cè)時(shí)表示為t/2, ,其意義為,其意義為 u單 側(cè) ,()Ptt 或 ,()Pt t 概率概率、自在度、自在度 與與t值關(guān)系值關(guān)系t界值界值 一定自在度一定自在度 和概率和概率下的下的 t值值t , , t/2, 可經(jīng)過查可經(jīng)過查t界值表界值表附表獲附表獲得;得; 例如例如 =9,單側(cè)單側(cè)

8、=0.05 ,查附表得單側(cè),查附表得單側(cè) t0.05,9=1.833 自在度自在度n-135-134 ,查附表,查附表2,得,得t0.05/2,34=2.032 第三節(jié)第三節(jié) 總體均數(shù)的估計(jì)總體均數(shù)的估計(jì) 一、可信區(qū)間的概念一、可信區(qū)間的概念(Confidence Interval(Confidence Interval 區(qū)間估計(jì):指按預(yù)先給定的概率,計(jì)算出一個(gè)區(qū)間,區(qū)間估計(jì):指按預(yù)先給定的概率,計(jì)算出一個(gè)區(qū)間, 使它可以包含未知的總體均數(shù)。事先給定的概率使它可以包含未知的總體均數(shù)。事先給定的概率 稱為可信度,通常取稱為可信度,通常取 。 參數(shù)估計(jì)參數(shù)估計(jì)點(diǎn)估計(jì):不思索抽樣誤差,如點(diǎn)估計(jì):不思

9、索抽樣誤差,如區(qū)間估計(jì):思索抽樣誤差區(qū)間估計(jì):思索抽樣誤差195. 01X二、可信區(qū)間的計(jì)算二、可信區(qū)間的計(jì)算 一一 知知nXu/95. 096. 1/96. 1nXP95. 096. 196. 1nXnXP)96.1 ,96.1(XXXX),(2/2/XXuXuX普通情況普通情況其中其中 為規(guī)范正態(tài)分布的雙側(cè)界值。為規(guī)范正態(tài)分布的雙側(cè)界值。 2/u 可信區(qū)間:可信區(qū)間:v 5v 1v ( )f t規(guī)范正態(tài)分布二二 未知未知 通常未知,這時(shí)可以用其估通常未知,這時(shí)可以用其估計(jì)量計(jì)量S S 替代,但替代,但 已不再服從規(guī)已不再服從規(guī)范正態(tài)分布,而是服從著名的范正態(tài)分布,而是服從著名的 t t 分

10、布。分布。)/()(nSX 圖4-2 不同自在度的 t 分布圖 可信區(qū)間的計(jì)算可信區(qū)間的計(jì)算: : 計(jì)算可信區(qū)間的原理與前完全一樣,僅僅是兩計(jì)算可信區(qū)間的原理與前完全一樣,僅僅是兩側(cè)概率的界值有些差別。即側(cè)概率的界值有些差別。即1)/()(2/)(2/tnSXtP). .()(2/)(2/XXStXStX,可信區(qū)間:可信區(qū)間: 需求留意:在小樣本情況下,運(yùn)用這一公式的需求留意:在小樣本情況下,運(yùn)用這一公式的條件是原始變量服從正態(tài)分布。在大樣本情況下條件是原始變量服從正態(tài)分布。在大樣本情況下如如n100),n100),也可以用也可以用 交換交換 近似計(jì)算。近似計(jì)算。2/u2/t 例例4.2 4.

11、2 某醫(yī)生測(cè)得某醫(yī)生測(cè)得2525名動(dòng)脈粥樣硬化患者血漿名動(dòng)脈粥樣硬化患者血漿纖維蛋白原含量的均數(shù)為纖維蛋白原含量的均數(shù)為3.32 g/L3.32 g/L,規(guī)范差為,規(guī)范差為0.57 0.57 g/Lg/L,試計(jì)算該種病人血漿纖維蛋白原含量總體均,試計(jì)算該種病人血漿纖維蛋白原含量總體均數(shù)的數(shù)的95%95%可信區(qū)間??尚艆^(qū)間。下限:下限:上限:上限:(g/L) 09. 325/57. 0064. 232. 3.)(2/XStX(g/L) 56. 325/57. 0064. 232. 3.)(2/XStX 例例4.3 4.3 試計(jì)算例試計(jì)算例4.14.1中該地成年男子紅細(xì)胞總體中該地成年男子紅細(xì)胞總

12、體均數(shù)的均數(shù)的95%95%可信區(qū)間??尚艆^(qū)間。 本例屬于大樣本,可采用正態(tài)近似的方法計(jì)算本例屬于大樣本,可采用正態(tài)近似的方法計(jì)算可信區(qū)間。由于可信區(qū)間。由于 ,那么,那么95%95%可信區(qū)間為:可信區(qū)間為:14038.077.4n,)L/10(71. 4140/38. 096. 177. 4.122/XSuX)L/10(83. 4140/38. 096. 177. 4.122/XSuX下限:下限:上限:上限: 三、模擬實(shí)驗(yàn)三、模擬實(shí)驗(yàn) 模擬抽樣成年男子紅細(xì)胞數(shù)。設(shè)定模擬抽樣成年男子紅細(xì)胞數(shù)。設(shè)定: : 產(chǎn)生產(chǎn)生100100個(gè)隨機(jī)樣本,分別計(jì)算其個(gè)隨機(jī)樣本,分別計(jì)算其95%95%的可信的可信區(qū)間

13、,結(jié)果用圖示的方法表示。從圖可以看區(qū)間,結(jié)果用圖示的方法表示。從圖可以看出:絕大多數(shù)可信區(qū)間包含總體參數(shù)出:絕大多數(shù)可信區(qū)間包含總體參數(shù) ,只需只需6 6個(gè)可信區(qū)間沒有包含總體參數(shù)用星號(hào)個(gè)可信區(qū)間沒有包含總體參數(shù)用星號(hào)標(biāo)志。標(biāo)志。14039.075.4n,754. 圖4-2 模擬抽樣成年男子紅細(xì)胞數(shù)100次的95%可信區(qū)間表示圖 )14039.075.4(n,* 第三節(jié)第三節(jié) 假設(shè)檢驗(yàn)的意義和步驟假設(shè)檢驗(yàn)的意義和步驟 (Hypothesis Test) (Hypothesis Test) 一、問題提出一、問題提出 例:新藥與傳統(tǒng)有效藥的對(duì)比研討例:新藥與傳統(tǒng)有效藥的對(duì)比研討經(jīng)過有差別的兩樣本均

14、數(shù)推斷兩總體均數(shù)能經(jīng)過有差別的兩樣本均數(shù)推斷兩總體均數(shù)能否一樣否一樣假設(shè)檢驗(yàn)或稱顯著性檢驗(yàn)假設(shè)檢驗(yàn)或稱顯著性檢驗(yàn)統(tǒng)計(jì)推斷:參數(shù)估計(jì)與假設(shè)檢驗(yàn)。統(tǒng)計(jì)推斷:參數(shù)估計(jì)與假設(shè)檢驗(yàn)。 二、假設(shè)檢驗(yàn)的根本思想 例例5.1 5.1 以往經(jīng)過大規(guī)模調(diào)查知某地新生兒出生以往經(jīng)過大規(guī)模調(diào)查知某地新生兒出生體重為體重為3.30kg.3.30kg.從該地難產(chǎn)兒中隨機(jī)抽取從該地難產(chǎn)兒中隨機(jī)抽取3535名名新生兒作為研討樣本新生兒作為研討樣本, ,平均出生體重為平均出生體重為3.42kg,3.42kg,規(guī)范差為規(guī)范差為0.40kg,0.40kg,問該地難產(chǎn)兒出生體重能否問該地難產(chǎn)兒出生體重能否與普通新生兒體重不同與普通新

15、生兒體重不同? ? 本例知總體均數(shù)本例知總體均數(shù)0=3.30kg0=3.30kg,但總體規(guī)范差,但總體規(guī)范差未知未知,n=35,n=35為小樣本為小樣本, ,樣本均數(shù)樣本均數(shù)3.42kg3.42kg,S=0.40kgS=0.40kg。 1.差別來源的兩種能夠性 樣本均數(shù)與總體均數(shù)的差別僅僅由抽樣誤差引起,兩總體本質(zhì)上無差別,稱差別無統(tǒng)計(jì)學(xué)意義,或無顯著性; 差別不僅僅由抽樣誤差引起,兩總體均數(shù)本質(zhì)上有差別,稱差別有統(tǒng)計(jì)學(xué)意義,或差別有顯著性 怎樣來判別兩種能夠性,無妨先假設(shè)一種情況, 2.檢驗(yàn)假設(shè) 無效假設(shè),零假設(shè)H0:0,該地難產(chǎn)兒與普通新生兒平均出生體重一樣 備擇假設(shè)H1:0,該地難產(chǎn)兒與

16、普通新生兒平均出生體重不同 這是反證法思想 假定治療前后血清甘油三酯檢測(cè)結(jié)果的差值服從正態(tài)分布,假設(shè)假定治療前后血清甘油三酯檢測(cè)結(jié)果的差值服從正態(tài)分布,假設(shè) 那么那么 服從服從t t 分布。分布。 根據(jù)根據(jù) t t 分布可以計(jì)算出有如此大差別的概率分布可以計(jì)算出有如此大差別的概率P P ,假設(shè),假設(shè)P P 值很小,即值很小,即計(jì)算出的計(jì)算出的t t 值超出了給定的界限,那么傾向于回絕值超出了給定的界限,那么傾向于回絕H0H0,以為治療前后有,以為治療前后有差別。差別。 0:0dHnSdtd/0圖圖4-3 4-3 利用利用t t 分布進(jìn)展假設(shè)檢驗(yàn)原理表示圖分布進(jìn)展假設(shè)檢驗(yàn)原理表示圖 二、假設(shè)檢驗(yàn)

17、的根本步驟二、假設(shè)檢驗(yàn)的根本步驟 1. 1.建立假設(shè)和確定檢驗(yàn)水準(zhǔn)建立假設(shè)和確定檢驗(yàn)水準(zhǔn) 無效假設(shè)無效假設(shè)H0(null hypothesis)H0(null hypothesis)指需求檢驗(yàn)的指需求檢驗(yàn)的假設(shè),備擇假設(shè)假設(shè),備擇假設(shè)H1(alternative H1(alternative hypothesis)hypothesis)指在指在H0H0成立證據(jù)缺乏的情況下成立證據(jù)缺乏的情況下而被接受的假設(shè)。例如建立治療前后血清甘而被接受的假設(shè)。例如建立治療前后血清甘油三酯療效的無效假設(shè)和備擇假設(shè)分別為油三酯療效的無效假設(shè)和備擇假設(shè)分別為 0:0dH0:1dH 檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn) 是預(yù)先規(guī)定的回絕

18、域的概率值,實(shí)是預(yù)先規(guī)定的回絕域的概率值,實(shí)踐中普通取踐中普通取 。 05. 0 闡明 :備擇假設(shè)有雙側(cè)和單側(cè)兩種情況。雙側(cè)檢驗(yàn)指不論正方向還是負(fù)方向的誤差,假設(shè)顯著地超出檢驗(yàn)水準(zhǔn)那么回絕H0, 即為雙側(cè)檢驗(yàn);單側(cè)檢驗(yàn)指僅在出現(xiàn)正方向或負(fù)方向誤差超出規(guī)定的水準(zhǔn)時(shí)那么回絕H0 ,如治療后血清甘油三酯下降的假設(shè)可表示為 ):H :Hd1d10(或 001d:H 雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)應(yīng)如何選擇,需根據(jù)研討目的雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)應(yīng)如何選擇,需根據(jù)研討目的和專業(yè)知識(shí)而定。普通情況下,雙側(cè)檢驗(yàn)更為穩(wěn)妥,和專業(yè)知識(shí)而定。普通情況下,雙側(cè)檢驗(yàn)更為穩(wěn)妥,由于對(duì)一樣的樣本,雙側(cè)檢驗(yàn)得出有顯著性差別的結(jié)由于對(duì)一樣的樣

19、本,雙側(cè)檢驗(yàn)得出有顯著性差別的結(jié)論,單側(cè)檢驗(yàn)也一定是顯著的。論,單側(cè)檢驗(yàn)也一定是顯著的。 2. 2.選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量 根據(jù)資料類型、研討設(shè)計(jì)方案和統(tǒng)計(jì)推斷的目的,選擇適根據(jù)資料類型、研討設(shè)計(jì)方案和統(tǒng)計(jì)推斷的目的,選擇適當(dāng)?shù)臋z驗(yàn)方法,不同檢驗(yàn)方法各有其相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量及計(jì)當(dāng)?shù)臋z驗(yàn)方法,不同檢驗(yàn)方法各有其相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量及計(jì)算公式。許多假設(shè)檢驗(yàn)方法是以檢驗(yàn)統(tǒng)計(jì)量來命名的,如算公式。許多假設(shè)檢驗(yàn)方法是以檢驗(yàn)統(tǒng)計(jì)量來命名的,如 t t 檢驗(yàn)、檢驗(yàn)、u u檢驗(yàn)、檢驗(yàn)、F F檢驗(yàn)和檢驗(yàn)和 檢驗(yàn)等。檢驗(yàn)等。 3. 3.確定確定P P 值并做出統(tǒng)計(jì)推斷結(jié)論值并做出統(tǒng)計(jì)推斷結(jié)論 查表得到檢驗(yàn)用的臨界值,然后將算得的統(tǒng)計(jì)量與回絕域查表得到檢驗(yàn)用的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論