醫(yī)學(xué)統(tǒng)計(jì)學(xué)總體均數(shù)估計(jì)和假設(shè)檢驗(yàn)課件_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)總體均數(shù)估計(jì)和假設(shè)檢驗(yàn)課件_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)總體均數(shù)估計(jì)和假設(shè)檢驗(yàn)課件_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)總體均數(shù)估計(jì)和假設(shè)檢驗(yàn)課件_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)總體均數(shù)估計(jì)和假設(shè)檢驗(yàn)課件_第5頁(yè)
已閱讀5頁(yè),還剩115頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、總體均數(shù)估計(jì)與假設(shè)檢驗(yàn)尹家祥大理學(xué)院公共衛(wèi)生學(xué)院總體均數(shù)估計(jì)與假設(shè)檢驗(yàn)尹家祥總體均數(shù)的估計(jì)總體均數(shù)的估計(jì)普查(overall survey)是了解總體特征的最好方法。抽樣研究(sampling study)的目的就是要用樣本信息來(lái)推斷相應(yīng)總體的特征,這一過(guò)程稱為統(tǒng)計(jì)推斷(statistical inference)。統(tǒng)計(jì)推斷包括兩方面的內(nèi)容:總體參數(shù)的估計(jì)和假設(shè)檢驗(yàn)(顯著性檢驗(yàn))。普查(overall survey)是了解總體特征的最好方法三類誤差系統(tǒng)誤差(systematic error):由于受試對(duì)象、研究者、儀器設(shè)備、研究方法、非實(shí)驗(yàn)因素影響等確定性原因造成,有一定傾向性或規(guī)律性的誤差。

2、可以避免。隨機(jī)誤差(random error):由于多種無(wú)法控制的偶然因素引起,對(duì)同一樣品多次測(cè)量數(shù)據(jù)的不一致。無(wú)傾向性,不可避免。抽樣誤差(sampling error):由個(gè)體變異產(chǎn)生的、由于抽樣而造成的樣本均數(shù)與樣本均數(shù)及樣本均數(shù)與總體均數(shù)之間的差異稱為均數(shù)的抽樣誤差。三類誤差系統(tǒng)誤差(systematic error):由于受抽樣誤差的概念 總體樣本統(tǒng)計(jì)推斷抽樣抽樣誤差 抽樣誤差產(chǎn)生的根本原因是個(gè)體變異、產(chǎn)生的直接原因是抽樣。只要有抽樣,抽樣誤差就不可避免。抽樣誤差的概念 總體樣本統(tǒng)計(jì)推斷抽樣抽樣誤差 抽樣誤差產(chǎn)生的抽樣抽樣誤差。 。 。 。 。 。 。 。 。 。 。 。 。 。No

3、rmal distribution抽樣抽樣誤差。Normal distribution樣本均數(shù)的分布特點(diǎn)各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)間存在差異。樣本均數(shù)分布很有規(guī)律,在正態(tài)總體中隨機(jī)抽取例數(shù)為n的樣本,樣本均數(shù)服從正態(tài)分布。樣本均數(shù)間相差較小,其變異范圍較原變量值的變異范圍縮小。在偏態(tài)總體中隨機(jī)抽樣,當(dāng)n足夠大時(shí)(n60),也近似正態(tài)分布。樣本均數(shù)的分布特點(diǎn)各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)間存該資料是一個(gè)正偏峰的分布,用電腦從中隨機(jī)抽取樣本含量分別為5,10,30和50的樣本各1000次,計(jì)算樣本均數(shù)并繪制4個(gè)直方圖。原始數(shù)據(jù)該資料是一個(gè)正偏峰的分布,用電腦從中隨機(jī)抽取樣本含量

4、分別為5 (b)n=5 (c)n=10 (d) n=30 (e) n=50 (b)n=5 (c)n=10 1)從正態(tài)總體N(,2)中,隨機(jī)抽取例數(shù)為n的多個(gè)樣本,樣本均數(shù) 服從正態(tài)分布;即使是從偏態(tài)總體中隨機(jī)抽樣,當(dāng)n足夠大時(shí)(如n30), 也近似正態(tài)分布。數(shù)理統(tǒng)計(jì)推理和中心極限定理表明: 2)從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)或偏態(tài)總體中抽取例數(shù)為n的樣本,樣本均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤為 。 1)從正態(tài)總體N(,2)中,隨機(jī)抽取例數(shù)為n的多標(biāo)準(zhǔn)誤的概念 用于表示均數(shù)抽樣誤差的指標(biāo)叫樣本均數(shù)的標(biāo)準(zhǔn)差,根據(jù)其實(shí)際意義,常稱作樣本均數(shù)的標(biāo)準(zhǔn)誤(standard error)。標(biāo)準(zhǔn)誤的概念 用于表示均數(shù)抽樣誤差的

5、指標(biāo)叫 標(biāo)準(zhǔn)誤的大小與的大小成正比,與n的平方根成反比,而為定值,說(shuō)明可以通過(guò)增加樣本例數(shù)來(lái)減少標(biāo)準(zhǔn)誤,以降低抽樣誤差。未知,用樣本標(biāo)準(zhǔn)差S來(lái)估計(jì)總體標(biāo)準(zhǔn)差。用 來(lái)表示均數(shù)抽樣誤差的大小。(標(biāo)準(zhǔn)誤的理論值)(標(biāo)準(zhǔn)誤的估計(jì)值) 標(biāo)準(zhǔn)誤的大小與的大小成正比,與n的平方根成反比,而為隨著 n S 穩(wěn)定 Sx 0均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比,與樣本例數(shù)n的平方根成反比。因此,減少抽樣誤差最有效的辦法:增加樣本例數(shù)隨著 n S 穩(wěn)定 Sx 例 1 2000年某研究所隨機(jī)調(diào)查某地健康成年男子27人,得到血紅蛋白的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L 。試估計(jì)該樣本均數(shù)的抽樣誤差。例 1 2000年某研究所

6、隨機(jī)調(diào)查某地健康成年男子27人標(biāo)準(zhǔn)誤的應(yīng)用反映抽樣誤差大?。簶?biāo)準(zhǔn)誤越大,抽樣誤差越大;反映均數(shù)的可靠性:越大,樣本均數(shù)的抽樣誤差越大,(用樣本均數(shù)推算總體均數(shù)的)可靠性差;反之,越小,均數(shù)抽樣誤差越小,(用樣本均數(shù)推算總體均數(shù)的)可靠性好。用于進(jìn)行假設(shè)檢驗(yàn)。標(biāo)準(zhǔn)誤的應(yīng)用反映抽樣誤差大?。簶?biāo)準(zhǔn)誤越大,抽樣誤差越大;標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別和聯(lián)系區(qū)別:概念不同:標(biāo)準(zhǔn)差是描述觀察值(個(gè)體值)之間的變異程度,S越小,均數(shù)的代表性越好;標(biāo)準(zhǔn)誤是描述樣本均數(shù)的抽樣誤差,Sx越小,均數(shù)的可靠性越高;用途不同:標(biāo)準(zhǔn)差與均數(shù)結(jié)合估計(jì)參考值范圍,計(jì)算變異系數(shù),計(jì)算標(biāo)準(zhǔn)誤等。標(biāo)準(zhǔn)誤用于估計(jì)參數(shù)的可信區(qū)間,進(jìn)行假設(shè)檢驗(yàn)等

7、。與樣本含量的關(guān)系不同: 當(dāng)樣本含量 n 足夠大時(shí),標(biāo)準(zhǔn)差趨向穩(wěn)定;而標(biāo)準(zhǔn)誤隨n的增大而減小,甚至趨于0 。聯(lián)系:標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤均為變異指標(biāo),當(dāng)樣本含量不變時(shí),標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比。標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別和聯(lián)系區(qū)別:t 分布 在統(tǒng)計(jì)應(yīng)用中,可以把任何一個(gè)均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布N(,2)轉(zhuǎn)變?yōu)?0,=1的標(biāo)準(zhǔn)正態(tài)分布,即將正態(tài)變量值X用 來(lái)代替。由于 服從正態(tài)分布,故服從標(biāo)準(zhǔn)正態(tài)分布N (0,1)。t 分布服從標(biāo)準(zhǔn)正態(tài)分布N (0,1)。 實(shí)際資料的分析中,由于 往往未知,故標(biāo)準(zhǔn)化轉(zhuǎn)換演變?yōu)椋悍?n-1的t分布,即: 實(shí)際資料的分析中,由于 往往未服從=n-t-分布(f)-degree of

8、 freedom自由度= n-1t-分布(f)-degree of freedom自由度 t 分布曲線下面積規(guī)律:t 分布曲線下總面積仍為1或100%t 分布曲線下面積以0為中心左右對(duì)稱。t 分布是一簇曲線,故t分布曲線下固定面積(如95%或99%)的界值不是一個(gè)常量,而是隨自由度的大小而變化 。 t 分布曲線下面積規(guī)律:t 分布曲線下總面積仍為1或100t 分布曲線特點(diǎn): 1) t 分布曲線是單峰分布,它以0為中心,左右對(duì)稱。 2)t 分布的形狀與樣本例數(shù)n有關(guān)。自由度越小,則 越大,t 值越分散,曲線的峰部越矮,尾部則偏高。 3) 當(dāng) n時(shí),則S逼近,t 分布逼近標(biāo)準(zhǔn)正態(tài)分布。 t 分布不

9、是一條曲線,而是一簇曲線。t 分布的圖形和 t 分布表t 分布曲線特點(diǎn):t 分布的圖形和 t 分布表總體參數(shù)估計(jì)統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。參數(shù)估計(jì)就是用樣本指標(biāo)(統(tǒng)計(jì)量)來(lái)估計(jì)總體指標(biāo)(參數(shù))。參數(shù)估計(jì):點(diǎn)估計(jì)(point estimation):用相應(yīng)樣本統(tǒng)計(jì)量直接作為其總體參數(shù)的估計(jì)值。如用 估計(jì)、S估計(jì)等。其方法雖簡(jiǎn)單,但未考慮抽樣誤差的大小。 區(qū)間估計(jì)(interval estimation):按一定的概率(1)估計(jì)總體均數(shù)所在范圍(置信區(qū)間)??傮w參數(shù)估計(jì)統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。參數(shù)估計(jì)就是用樣 ,即認(rèn)為2000年該地所有健康成年男性血紅蛋白量的總體均數(shù)為125g/L

10、。1. 點(diǎn)估計(jì): 用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值。 例 2 2000年某研究所測(cè)得某地27例健康成年男性血紅蛋白量的樣本均數(shù)為125g/L,試估計(jì)其總體均數(shù)。 ,即認(rèn)為2000年該地所有健康成年男2. 區(qū)間估計(jì):按預(yù)先給定的置信水平(1)估計(jì)總體參數(shù)的可能位置,該范圍就稱為總體參數(shù)的1置信區(qū)間(confidence interval CI)。 預(yù)先給定的概率(1)稱為置信度,常取95%或99%。如無(wú)特別說(shuō)明,一般取雙側(cè)95%。 置信區(qū)間由兩個(gè)數(shù)值即置信限(下限和上限)構(gòu)成。2. 區(qū)間估計(jì):按預(yù)先給定的置信水平(1)估計(jì)總體參數(shù)的通式: (雙側(cè)) (1)已知,按標(biāo)準(zhǔn)正態(tài)分布原理計(jì)算由z分布

11、,標(biāo)準(zhǔn)正態(tài)曲線下有95%的z值在1.96之間。95%的雙側(cè)置信區(qū)間:99%的雙側(cè)置信區(qū)間:總體均數(shù)可信區(qū)間的計(jì)算通式: (雙側(cè)) (1) 0 2.52.5-t0.05t0.05 0 通式: (雙側(cè))(2)未知但樣本例數(shù)n足夠大(n50)時(shí) 由t分布可知,自由度越大,t分布越逼近標(biāo)準(zhǔn)正態(tài)分布,此時(shí)t曲線下約有95%的t值在1.96之間,即95%的雙側(cè)置信區(qū)間:99%的雙側(cè)置信區(qū)間:通式: (雙側(cè))(2)例 3 某市2000年隨機(jī)測(cè)量了90名19歲健康男大學(xué)生的身高,其均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm,,試估計(jì)該地19歲健康男大學(xué)生的身高的95%置信區(qū)間。該市19歲健康男大學(xué)生的身高的95

12、%置信區(qū)間(171.3,173.1)cm例 3 某市2000年隨機(jī)測(cè)量了90名19歲健康男大學(xué)生的身(3)未知且樣本例數(shù)n 較小時(shí),按t 分布原理,此時(shí) 某自由度的t曲線下約有95%的t值在t0.05/2()之間, 通式:95%的雙側(cè)置信區(qū)間:99%的雙側(cè)置信區(qū)間:t/2, 是按自由度=n-1,由附表2查得的t值。(3)未知且樣本例數(shù)n 較小時(shí),按t 分布原理,此時(shí) 通式例 4 已知某地27例健康成年男性血紅蛋白量的均數(shù)為 ,標(biāo)準(zhǔn)差S=15g/L ,試問(wèn)該地健康成年男性血紅蛋白量的95%和99%置信區(qū)間。本例n=27,S=1595%CI:99%CI:例 4 已知某地27例健康成年男性血紅蛋白量

13、的均數(shù)為 可信區(qū)間的確切涵義 從總體中作隨機(jī)抽樣,進(jìn)行重復(fù)抽樣的試驗(yàn)中,平均有1a的可信區(qū)間包含了總體參數(shù),有a的可信區(qū)間不包括總體均數(shù)。即犯錯(cuò)誤的概率為a,而a是小概率事件,對(duì)一次試驗(yàn)的可能性小,因此,實(shí)際應(yīng)用中就認(rèn)為總體均數(shù)在算得的可信區(qū)間內(nèi)??尚艆^(qū)間的確切涵義 從總體中作隨機(jī)抽樣,95%的可信區(qū)間的理解(1)所要估計(jì)的總體參數(shù)有95%的可能在我們所估計(jì)的可信區(qū)間內(nèi)。(2)從正態(tài)總體中隨機(jī)抽取100個(gè)樣本,可算得100個(gè)樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個(gè)均數(shù)的可信區(qū)間,平均約有95個(gè)可信區(qū)間包含了總體均數(shù)。(3)但在實(shí)際工作中,只能根據(jù)一次試驗(yàn)結(jié)果估計(jì)可信區(qū)間,我們就認(rèn)為該區(qū)間包含了總體均

14、數(shù)。95%的可信區(qū)間的理解(1)所要估計(jì)的總體參數(shù)有95%的可能可信區(qū)間的兩個(gè)要素準(zhǔn)確度(accuracy):反映在可信度(1)的大小。1越接近1,就越準(zhǔn)確。如可信度99%比95%準(zhǔn)確。精確度(precision):反映在區(qū)間的長(zhǎng)度。長(zhǎng)度越小越好, 在例數(shù)n確定的情況下,二者呈反比關(guān)系:準(zhǔn)確度, 精確度(范圍變寬)。要兼顧準(zhǔn)確度和精確度,一般取95%可信區(qū)間??尚艆^(qū)間的兩個(gè)要素準(zhǔn)確度(accuracy):反映在可信度(可信區(qū)間與參考值范圍區(qū)別意義不同正常值范圍是指絕大多數(shù)觀察值在某個(gè)范圍可信區(qū)間是指按一定的可信度估計(jì)總體均數(shù)(參數(shù))的所在范圍計(jì)算公式不同可信區(qū)間參考值范圍應(yīng)用不同可信區(qū)間:估計(jì)

15、總體均數(shù)參考值范圍:判斷某項(xiàng)指標(biāo)是否正??尚艆^(qū)間與參考值范圍區(qū)別意義不同假設(shè)檢驗(yàn)假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn)(hypothesis test)也稱顯著性檢驗(yàn)(significance test),是用來(lái)判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起的?還是本質(zhì)差別造成的?由于存在抽樣誤差,從總體中隨機(jī)抽樣所得的樣本均數(shù)與總體均數(shù)之間存在誤差,從同一總體中抽取的樣本均數(shù)之間也有誤差。假設(shè)檢驗(yàn)原理 假設(shè)檢驗(yàn)(hypothesis test例 5 某醫(yī)生測(cè)量了36名從事鉛作業(yè)的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問(wèn)從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140

16、g/L?例 5 某醫(yī)生測(cè)量了36名從事鉛作業(yè)的血紅蛋白含量,算得例 50=140g/L已知總體X=130.83g/LS=25.74g/L未知總體=例 50=140g/L已知總體X=130.83g/L未知 完全由抽樣誤差引起,比較的均數(shù)來(lái)源于同一總體;的原因假設(shè)檢驗(yàn)計(jì)算 的概率判斷。 來(lái)自于不同的總體,均數(shù)之間存在本質(zhì)差別。 完全由抽樣誤差引起,比較的均數(shù)來(lái)源于同一總體;的原0X差異完全由抽樣誤差引起0X差異完全由抽樣誤差引起0X差異完全由抽樣誤差引起0X差異完全由抽樣誤差引起0X來(lái)自于不同的總體0X來(lái)自于不同的總體0X來(lái)自于不同的總體0X來(lái)自于不同的總體假設(shè)檢驗(yàn)的基本思想小概率思想:小概率事件

17、:在一次試驗(yàn)中認(rèn)為基本上不可能發(fā)生。小概率事件的概率是相對(duì)的,統(tǒng)計(jì)分析時(shí)就是預(yù)先規(guī)定檢驗(yàn)水準(zhǔn)(size of a test),用表示,反證法思想:當(dāng)檢驗(yàn)假設(shè)H0成立時(shí),用合適的統(tǒng)計(jì)方法獲得現(xiàn)在樣本的概率大?。≒值)。如果是小概率事件,則推斷假設(shè)是假的,因此拒絕它;如果不是小概率事件,則不能認(rèn)為假設(shè)是假的,也因此不能拒絕它。假設(shè)檢驗(yàn)的基本思想小概率思想:假設(shè)檢驗(yàn)的基本步驟 1、建立假設(shè)和確定檢驗(yàn)水準(zhǔn) 2、選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量 3、確定P值和作出推斷結(jié)論 假設(shè)檢驗(yàn)的基本步驟 1、建立假設(shè)和確定檢驗(yàn)水準(zhǔn) 2、選定檢驗(yàn)1、建立假設(shè)和確定檢驗(yàn)水準(zhǔn) (1)兩個(gè)假設(shè) 無(wú)效假設(shè): H0:u=u0 備擇

18、假設(shè): H1: uu01、建立假設(shè)和確定檢驗(yàn)水準(zhǔn) (1)兩個(gè)假設(shè) 無(wú)效假設(shè):對(duì)于假設(shè)檢驗(yàn),須注意:檢驗(yàn)的假設(shè)是針對(duì)總體而言,而不是針對(duì)樣本; H0和H1是相互聯(lián)系、對(duì)立的假設(shè),后面的結(jié)論是根據(jù)H0和H1作出的,因此,兩者不是可有可無(wú),而是缺一不可; H0是無(wú)效假設(shè),其假設(shè)通常是:某兩個(gè)總體參數(shù)相等,或兩個(gè)總體參數(shù)之差等于0等等。 H1的內(nèi)容反映了檢驗(yàn)的單雙側(cè)。對(duì)于假設(shè)檢驗(yàn),須注意:?jiǎn)蝹?cè)檢驗(yàn):在比較兩種藥物的療效時(shí),根據(jù)專業(yè)知識(shí)可認(rèn)為新藥不會(huì)比舊藥差,只關(guān)心新藥是否比舊藥好(至多相同,絕對(duì)排除出現(xiàn)相反的可能性),可用單側(cè)檢驗(yàn)。 (2) 確定單側(cè)或雙側(cè)檢驗(yàn) 根據(jù)專業(yè)知識(shí)和研究目的而定單側(cè)檢驗(yàn):在比

19、較兩種藥物的療效時(shí),根據(jù)專業(yè)知識(shí)可認(rèn)為新藥不會(huì)雙側(cè)檢驗(yàn):在比較兩種藥物的療效時(shí),事先不能確定哪種藥的療效較好,只關(guān)心兩藥的療效有無(wú)差別,要用雙側(cè)檢驗(yàn)。 雙側(cè)檢驗(yàn)若有差別,單側(cè)檢驗(yàn)肯定有差別;反之,單側(cè)檢驗(yàn)若有差別,雙側(cè)檢驗(yàn)不一定有差別。 雙側(cè)檢驗(yàn):在比較兩種藥物的療效時(shí),事先不能確定哪種藥的療效較 甲均數(shù)與乙均數(shù)相比: 可能高,也可能低 雙側(cè)檢驗(yàn) 肯定不會(huì)低(或高) 單側(cè)檢驗(yàn)H1 :0 0 1 2 1 2 甲均數(shù)與乙均數(shù)相比: 肯定不會(huì)低(或高) 醫(yī)學(xué)統(tǒng)計(jì)學(xué)總體均數(shù)估計(jì)和假設(shè)檢驗(yàn)課件 (3) 確定檢驗(yàn)水準(zhǔn)(顯著性水準(zhǔn)) 一般0.05,發(fā)生第一類錯(cuò)誤的概率,即H0實(shí)際成立,但拒絕H0的概率。 (

20、3) 確定檢驗(yàn)水準(zhǔn)(顯著性水準(zhǔn)) 2、選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量 不同設(shè)計(jì)、不同的資料類型和不同的推斷目的,選用不同的檢驗(yàn)方法。 2、選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量 不同設(shè)計(jì)、不3、確定P值 P值是指由所規(guī)定的總體作隨機(jī)抽樣, 獲得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。 手工計(jì)算:一般是通過(guò)查界值表獲得。 統(tǒng)計(jì)軟件:直接給出精確的P值3、確定P值手工計(jì)算:一般是通過(guò)查界值表獲得。 統(tǒng)計(jì)軟件:直4、作出推斷結(jié)論(含統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論)統(tǒng)計(jì)結(jié)論: 拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義。 專業(yè)結(jié)論:可認(rèn)為 不同或不等。當(dāng) P時(shí), 將獲得的事后概率P與事先規(guī)定的概率進(jìn)行比較。4、

21、作出推斷結(jié)論(含統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論)統(tǒng)計(jì)結(jié)論:專業(yè)結(jié)論:當(dāng)P時(shí), 統(tǒng)計(jì)結(jié)論: 不拒絕H0,差異無(wú)統(tǒng)計(jì)學(xué)意義專業(yè)結(jié)論: 還不能認(rèn)為 不同或不等。當(dāng)P時(shí), 專業(yè)結(jié)論:假設(shè)檢驗(yàn)的特點(diǎn): 1、統(tǒng)計(jì)檢驗(yàn)的假設(shè)是關(guān)于總體特征的假設(shè); 2、用于檢驗(yàn)的方法是以檢驗(yàn)統(tǒng)計(jì)量的抽樣分布為理論根據(jù)的; 3、作出的結(jié)論是概率性的,不是絕對(duì)的肯定或絕對(duì)的否定。(無(wú)論是拒絕H0或不拒絕H0,都有可能發(fā)生錯(cuò)誤) 假設(shè)檢驗(yàn)的特點(diǎn):假設(shè)檢驗(yàn)中值與P值的區(qū)別:1、假設(shè)檢驗(yàn)中值是檢驗(yàn)水準(zhǔn),是拒絕或不拒絕H0的概率標(biāo)準(zhǔn)。的大小是人為選定的,一般取0.05。2、P值是指在H0所規(guī)定的總體中作隨機(jī)抽樣,獲得等于或大于(等于或小于)現(xiàn)有樣本

22、統(tǒng)計(jì)量的概率。通過(guò)P值與值的比較來(lái)確定拒絕或不拒絕H0。 假設(shè)檢驗(yàn)中值與P值的區(qū)別: 未知 兩樣本較小(n1與n250) 兩樣本均數(shù)比較時(shí),兩樣本的總體方差相等(即方差齊) 上述都要求:資料服從對(duì)稱或正態(tài)分布。t檢驗(yàn)適用條件 未知t檢驗(yàn)適用條件 已知,x與比較 兩大樣本(n1與n250)均數(shù)比較 上述兩種情況都要求:資料服從對(duì)稱或正態(tài)分布。u檢驗(yàn)適用條件 已知,x與比較u檢驗(yàn)適用條件t檢驗(yàn)和u檢驗(yàn)類型 1、樣本均數(shù)與總體均數(shù)的比較t檢驗(yàn) 2、配對(duì)設(shè)計(jì)差值均數(shù)與總體均數(shù)0的比較t檢驗(yàn) 3、兩樣本均數(shù)的比較t檢驗(yàn) 4、兩樣本幾何均數(shù)的比較t檢驗(yàn) 5、兩大樣本均數(shù)比較u檢驗(yàn) t檢驗(yàn)和u檢驗(yàn)類型1、單

23、樣本t檢驗(yàn) 樣本均數(shù)代表的未知總體均數(shù)和已知總體均數(shù)0的比較0理論值、標(biāo)準(zhǔn)值、穩(wěn)定值X1、單樣本t檢驗(yàn) 樣本均數(shù)代表的未知總體均數(shù) 樣本均數(shù)與已知總體均數(shù)(一般為理論值、標(biāo)準(zhǔn)值或大量觀測(cè)所得的穩(wěn)定值)的比較,目的是推斷樣本所代表的總體與已知總體是否相等。根據(jù)是否已知和樣本含量n的大小,選用u檢驗(yàn)或t檢驗(yàn)。 t檢驗(yàn)計(jì)算公式為:t檢驗(yàn)計(jì)算公式為:例 5 某醫(yī)生測(cè)量了36名從事鉛作業(yè)的血紅蛋白含量,算得其均數(shù)為 =130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問(wèn)從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?例 5 某醫(yī)生測(cè)量了36名從事鉛作業(yè)的血紅蛋白含量,算得其例 50=140

24、g/L已知總體 =130.83g/LS=25.74g/L未知總體=例 50=140g/L已知總體 =130.83g/L檢驗(yàn)步驟: 例 5建立假設(shè)和確定檢驗(yàn)水準(zhǔn) H0:=0=140g/L H1:0=140g/L 雙側(cè)=0.05檢驗(yàn)步驟: 例 5建立假設(shè)和確定檢驗(yàn)水準(zhǔn)選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量本例n=36, =130.83g/L,S=25.74g/L, 0=140g/L,按下式 v=n-1=36-1=35選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量v=n-1=36-1=35例 5確定P值 以v=35查附表2,t界值表,得: (v一定時(shí),t值越大,P值越小) 例 5確定P值(v一定時(shí),t值越大,P值越小) 查t值

25、表時(shí),先查P=0.05時(shí)的界值。 當(dāng)P0.05時(shí),需繼續(xù)往P更大的一側(cè)查,直到最大的P值為止。 如使用統(tǒng)計(jì)軟件,會(huì)給出確切的概率值。注意 查t值表時(shí),先查P=0.05時(shí)的界 今0.02P0. 05,按=0.05水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義(統(tǒng)計(jì)結(jié)論),可認(rèn)為從事鉛作業(yè)的男性工人平均血紅蛋白量低于正常成年男性(專業(yè)結(jié)論)。 作出推斷結(jié)論(統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論) 今0.02P0. 05,按=0.05水準(zhǔn),t0.05,v 0.05 不拒絕H0 無(wú)統(tǒng)計(jì)學(xué)意義 t0.05 ,v 0.05 拒絕H0,接受H1 有統(tǒng)計(jì)學(xué)意義 t0.01 ,v 0.01 拒絕H0,接受H1 有統(tǒng)計(jì)學(xué)意義t值、P值

26、與統(tǒng)計(jì)結(jié)論的關(guān)系(0.05)t值 P值 結(jié)論 差異的統(tǒng)計(jì)學(xué)意義t0.05,v 0.05 不拒絕例 6 根據(jù)大量調(diào)查已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在某山區(qū)隨機(jī)調(diào)查了30名健康男子,求得脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.5次/分。能否認(rèn)為該山區(qū)的成年男子的脈搏均數(shù)與一般男子的脈搏均數(shù)相等?例 6 根據(jù)大量調(diào)查已知健康成年男子的脈搏均數(shù)為72次/分。例 60=72次/分已知總體 =74.2次/分S=6.5次/分未知總體=例 60=72次/分已知總體 =74.2次/分未知總檢驗(yàn)步驟: 例 6建立假設(shè)和確定檢驗(yàn)水準(zhǔn) H0:=0=72次/分 H1:0=72次/分 雙側(cè)=0.05檢驗(yàn)步驟

27、: 例 6建立假設(shè)和確定檢驗(yàn)水準(zhǔn)選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量本例n=30, =74.2,S=6.5, 0=72,按下式 v=n-1=30-1=29選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量v=n-1=30-1=29作出推斷結(jié)論 今P0. 05,按=0.05水準(zhǔn),不拒絕H0,差異無(wú)統(tǒng)計(jì)學(xué)意義(統(tǒng)計(jì)結(jié)論),尚不能認(rèn)為該山區(qū)的成年男子的脈搏均數(shù)高于一般男子的脈搏均數(shù)(專業(yè)結(jié)論)。 作出推斷結(jié)論2、配對(duì)t檢驗(yàn)(paired t-test) (1)同質(zhì)的兩個(gè)受試對(duì)象配成對(duì)子分別接受兩種不同的處理。 (2)同一樣品用兩種方法(或儀器等)檢驗(yàn)的結(jié)果或同一受試對(duì)象分別接受兩種不同處理。 (3)同一受試對(duì)象接受(一種)處理前

28、后。 (這是難點(diǎn)也是重點(diǎn),易和成組設(shè)計(jì)的兩樣本t檢驗(yàn)相混淆)2、配對(duì)t檢驗(yàn)(paired t-test) (1)同質(zhì)例 7 隨機(jī)選擇9窩中年大鼠,每窩中取兩只雌性大鼠隨機(jī)地分入甲、乙兩組,甲組大鼠不接受任何處理(即空白對(duì)照),乙組中的每只大鼠接受3mg/Kg的內(nèi)毒素。分別測(cè)得兩組大鼠的肌酐(mg/L)測(cè)定結(jié)果如下。 窩別編號(hào): 1 2 3 4 5 6 7 8 9 甲(對(duì)照)組:6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 乙(處理)組:7.5 3.8 6.3 4.3 5.3 7.3 5.6 7.9 7.2 例 7 隨機(jī)選擇9窩中年大鼠,每窩中取兩只雌性大鼠隨機(jī)地分例

29、8 檢驗(yàn)血磷含量有甲、乙兩種方法,其中,乙法具有快速、簡(jiǎn)便等優(yōu)點(diǎn)?,F(xiàn)用甲、乙兩法檢測(cè)相同的血液樣品,所得結(jié)果如下表。 問(wèn):檢驗(yàn)甲乙兩法檢出血磷是否相同,用何統(tǒng)計(jì)方法? 樣本號(hào) 1 2 3 4 5 6 7 乙 法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲 法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 例 8 檢驗(yàn)血磷含量有甲、乙兩種方法,其中,乙法具有快速、例 9 某腦電圖室觀察家兔注射AT3前后腦電圖波形的變化,觀測(cè)結(jié)果如下。試分析注射AT3前后腦電圖波形是否發(fā)生了顯著性變化。 注射AT3前后腦電圖波形的變化率(%) 家兔編號(hào) 注射前

30、 注射后 1 29 37 2 28 44 3 38 52 4 29 35 5 34 41 6 41 43例 9 某腦電圖室觀察家兔注射AT3前后腦電圖波形的變化, 醫(yī)學(xué)研究中將配對(duì)計(jì)量資料也可分為: 同源配對(duì):同一對(duì)象處理前后的數(shù)據(jù),同一樣品用兩種方法測(cè)定的結(jié)果。 異源配對(duì):將實(shí)驗(yàn)對(duì)象配成對(duì)子,對(duì)每一對(duì)子中的兩個(gè)實(shí)驗(yàn)對(duì)象給予兩種不同的處理,以推斷兩種處理的效果有無(wú)差別。 醫(yī)學(xué)研究中將配對(duì)計(jì)量資料也可分為:1 10 62 13 93 7 4: : :n 8 5病人號(hào) 治療前 治療后某藥治療前后的血沉(mm/h)同源配對(duì)(自身配對(duì))1 10 1 10 62 13 93 7 4: : :n 8 5樣

31、品號(hào) 甲 乙同一批樣品用兩方法測(cè)定的結(jié)果同源配對(duì)1 10 1 A1a1 9 62 A2a2 8 33 A3a3 5 1: : : :n Anan 10 5 編號(hào) 甲 乙 甲指標(biāo) 乙指標(biāo)異源配對(duì)1 A1a1 9 注意:配對(duì)t檢驗(yàn)的實(shí)質(zhì)同于單樣本的t檢驗(yàn),以上述第一種情況,兩同質(zhì)受試對(duì)象配對(duì)分別接受兩種不同的處理為例。若兩種處理效應(yīng)相同,即1=2,則12=0(當(dāng)成已知總體均數(shù)0)。因此,可將此類資料看成是差值的樣本均數(shù) 所代表的未知總體均數(shù)d 與已知總體均數(shù)0= 0的比較。 注意:配對(duì)t檢驗(yàn)的實(shí)質(zhì)同于單樣本的t檢驗(yàn),以上述第一配對(duì)t檢驗(yàn)計(jì)算公式: 0 為差數(shù)的總體均數(shù) d 為成對(duì)數(shù)據(jù)之差(差數(shù))的

32、均數(shù)Sd 為差數(shù)均數(shù)的標(biāo)準(zhǔn)差配對(duì)t檢驗(yàn)計(jì)算公式: 0 為差數(shù)的總體均數(shù) 3、兩個(gè)獨(dú)立樣本t檢驗(yàn)應(yīng)用條件: (1)兩樣本均數(shù)來(lái)自正態(tài)總體 (2)兩樣本的方差齊 在正式的統(tǒng)計(jì)分析中,先要看方差是否齊,如果不齊,要選方差不齊的結(jié)果! 注:在一般的統(tǒng)計(jì)軟件中,都會(huì)同時(shí)給出方差齊性檢驗(yàn)的結(jié)果3、兩個(gè)獨(dú)立樣本t檢驗(yàn)應(yīng)用條件: 注:在一般的完全隨機(jī)設(shè)計(jì)資料的兩種類型: 1、選擇一定數(shù)量的觀察對(duì)象,將它們隨機(jī)分成兩組或多組,分別給予不同處理; 2、從兩組或多組具有不同特征的人群中,分別隨機(jī)抽取一定數(shù)量的樣本,比較某一指標(biāo)在不同特征人群中是否相等。完全隨機(jī)設(shè)計(jì)資料的兩種類型:兩小樣本均數(shù)比較t檢驗(yàn)t檢驗(yàn) 方差不

33、齊 方差齊變量變換 秩和檢驗(yàn) t檢驗(yàn)-兩個(gè)小樣本均數(shù)的比較兩小樣本均數(shù)比較t檢驗(yàn)t檢驗(yàn) 方差不齊 方差齊變量變換 秩 (1)總體方差相等時(shí)的檢驗(yàn) 當(dāng)兩總體方差相等,即 時(shí),可將兩總體方差合并,求兩者的共同方差-合并方差 。 (1)總體方差相等時(shí)的檢驗(yàn) 兩樣本t檢驗(yàn)計(jì)算公式即: 兩樣本t檢驗(yàn)計(jì)算公式即:例 10 為研究國(guó)產(chǎn)四類新藥阿卡波糖膠囊的降血糖效果,某醫(yī)院用40名II型糖尿病病人進(jìn)行同期隨機(jī)對(duì)照試驗(yàn)。試驗(yàn)者將這些病人隨機(jī)等分到試驗(yàn)組(用阿卡波糖膠囊)和對(duì)照組(用拜唐蘋膠囊),分別測(cè)得試驗(yàn)開(kāi)始前和8周后的空腹血糖,算得空腹血糖下降值見(jiàn)下表,能否認(rèn)為該國(guó)產(chǎn)四類新藥阿卡波糖膠囊與拜唐蘋膠囊對(duì)空腹

34、血糖的降糖效果不同?例 10 為研究國(guó)產(chǎn)四類新藥阿卡波糖膠囊的降血糖效果,某醫(yī)院 試驗(yàn)組和對(duì)照組空腹血糖下降值(mmol/L) -0.70 -5.60 2.00 2.80 0.70 3.50 4.00 5.80 7.10 -0.50 試驗(yàn)組X1 (n1=20) 2.50 -1.60 1.70 3.00 0.40 4.50 4.60 2.50 6.00 -1.40 3.70 6.50 5.00 5.20 0.80 0.20 0.60 3.40 6.60 -1.10 對(duì)照組X2 (n2=20) 6.00 3.80 2.00 1.60 2.00 2.20 1.20 3.10 1.70 -2.00 試

35、驗(yàn)組和對(duì)照組空腹血糖下降值(mmol/L) -0.70醫(yī)學(xué)統(tǒng)計(jì)學(xué)總體均數(shù)估計(jì)和假設(shè)檢驗(yàn)課件 (2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量 (2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量 (3)確定P值,作出推斷結(jié)論 (3)確定P值,作出推斷結(jié)論 U檢驗(yàn)-兩個(gè)大樣本均數(shù)的比較 當(dāng)兩個(gè)大樣本含量較大(均100)時(shí),可用u檢驗(yàn)。U檢驗(yàn)-兩個(gè)大樣本均數(shù)的比較兩種職業(yè)的血清膽固醇水平(mmol/L) 職業(yè)類型 人數(shù) 均值 標(biāo)準(zhǔn)差 教師 537 4.8 0.72 工人 643 4.6 0.81 例 11 某醫(yī)生研究血清膽固醇水平與職業(yè)的關(guān)系,得調(diào)查資料如下表,問(wèn)兩種職業(yè)的血清膽固醇水平是否不同??jī)煞N職業(yè)的血清膽固醇水平(mmol/L) 職業(yè)類型 假設(shè):H

36、0 :12 H1 :12 0.05計(jì)算u值448.464381.053772.06.48.4222221212_1_nSnSxxu- 假設(shè):H0 :12 H1 :12 確定P值 u 2.58 P 0.01 統(tǒng)計(jì)推斷結(jié)論 P 0.01 ,在0.05水準(zhǔn)上拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義??烧J(rèn)為教師的血清膽固醇水平高于工人。 確定P值 統(tǒng)計(jì)推斷結(jié)論1.96 0.05 不拒絕H0 無(wú)1.96 0.05 拒絕H0,接受H1 有2.58 0.01 拒絕H0,接受H1 有高度u值、P值與統(tǒng)計(jì)結(jié)論的關(guān)系(0.05)u值* P值 結(jié)論 差異的統(tǒng)計(jì)學(xué)意義 *為雙側(cè),單側(cè)u界值為1.645、2.326。1.9

37、6 0.05 不拒絕H兩個(gè)樣本幾何均數(shù)比較 1、應(yīng)用條件: a.兩樣本的對(duì)數(shù)值均來(lái)自正態(tài)總體 b.兩樣本的對(duì)數(shù)值的方差齊 2、檢驗(yàn)公式 與兩樣本均數(shù)的t檢驗(yàn)和u檢驗(yàn)公式相同,只是原始數(shù)據(jù)要作對(duì)數(shù)變換,用對(duì)數(shù)值的均數(shù)和標(biāo)準(zhǔn)差代公式。 兩個(gè)樣本幾何均數(shù)比較 1、應(yīng)用條件:2、檢驗(yàn)公式 與兩樣本3、檢驗(yàn)步驟 在使用統(tǒng)計(jì)軟件進(jìn)行分析時(shí),先將原始數(shù)據(jù)取對(duì)數(shù),然后用對(duì)數(shù)值作一般的t檢驗(yàn)。注意啦!檢驗(yàn)步驟同兩樣本均數(shù)比較的t檢驗(yàn)3、檢驗(yàn)步驟 在使用統(tǒng)計(jì)軟件進(jìn)行分析時(shí),先將原始數(shù)據(jù)可信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系(1)可信區(qū)間亦可用于回答假設(shè)檢驗(yàn)問(wèn)題。(2)可信區(qū)間比假設(shè)檢驗(yàn)還可提供更多的信息。 但這并不意味著可以完

38、全用可信區(qū)間代替假設(shè)檢驗(yàn)。假設(shè)檢驗(yàn)得到的P值可以較精確地說(shuō)明結(jié)論的概率保證,而可信區(qū)間只能告訴我們?cè)谒疁?zhǔn)上有無(wú)統(tǒng)計(jì)意義,卻不能象P值那樣提供精確的概率。 可信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系(1)可信區(qū)間亦可用于回答假設(shè)檢驗(yàn)問(wèn)例 5 某醫(yī)生測(cè)量了36名從事鉛作業(yè)的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問(wèn)從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L? 95%CI為(122.12,139.54)g/L 140g/L例 5 某醫(yī)生測(cè)量了36名從事鉛作業(yè)的血紅蛋白含量,算得有實(shí)際意義有統(tǒng)計(jì)意義,可能有實(shí)際意義有統(tǒng)計(jì)意義,無(wú)實(shí)際意義無(wú)統(tǒng)計(jì)意義,樣本例數(shù)太少確實(shí)無(wú)差別有實(shí)際意義值H0有實(shí)際意義有統(tǒng)計(jì)意義,可能有實(shí)際意義有統(tǒng)計(jì)意義,無(wú)實(shí)際意義無(wú)變量變換 實(shí)際資料若不滿足正態(tài)性或/和方差齊性的假定,尤其當(dāng)是小樣本資料時(shí),這時(shí)如用一般的t檢驗(yàn)可能會(huì)導(dǎo)致偏離真實(shí)結(jié)果較遠(yuǎn)。對(duì)于明顯偏離上述應(yīng)用條件的資料,可通過(guò)變量變換的方法加以改善。 變量變換 實(shí)際資料若不滿足正態(tài)性或/和方 變量變換是將原始數(shù)據(jù)作某種函數(shù)轉(zhuǎn)換,如轉(zhuǎn)換為對(duì)數(shù)值,以達(dá)到某種分析的目的。(一)變量變換的定義 變量變換是將原始數(shù)據(jù)作某種函數(shù)轉(zhuǎn)換,如轉(zhuǎn)換為適當(dāng)?shù)暮瘮?shù)轉(zhuǎn)換可使 目的同時(shí)達(dá)到。(二)變量變換的目的 使各組達(dá)到方差齊性; 使資料轉(zhuǎn)換為正態(tài)分布,以滿足方

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論