醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第六章_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第六章_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第六章_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第六章_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第六章_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1第六章統(tǒng)計(jì)推斷基礎(chǔ)

公共衛(wèi)生學(xué)院白志茂

zhimaobai@163.com2統(tǒng)計(jì)方法的結(jié)構(gòu)36.1抽樣誤差與標(biāo)準(zhǔn)誤6.1.1

抽樣誤差

抽樣誤差:在抽樣研究中產(chǎn)生的樣本統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)之間的差異總體樣本抽樣4來自同一總體的若干樣本的統(tǒng)計(jì)量之間,也會(huì)存在誤差,這種誤差也反映了樣本統(tǒng)計(jì)量和總體參數(shù)間的差異總體樣本1樣本2樣本n5抽樣誤差的表現(xiàn)形式:(1)樣本統(tǒng)計(jì)量與總體參數(shù)間的差異(2)不同樣本統(tǒng)計(jì)量間的差異總體樣本抽樣總體樣本1樣本2樣本n6抽樣誤差的類型:根據(jù)資料的性質(zhì)和指標(biāo)的類型不同,抽樣誤差有多種(1)均數(shù)的抽樣誤差(2)率的抽樣誤差由于生物間的個(gè)體差異是客觀存在的,因此在抽樣研究過程中,抽樣誤差是不可避免的抽樣誤差具有一定規(guī)律性76.1.2標(biāo)準(zhǔn)誤

樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤除了反映樣本統(tǒng)計(jì)量之間的離散程度外,同時(shí)也反映樣本統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)間的差異,即抽樣誤差大小??傮w樣本1樣本2樣本n8最常用的標(biāo)準(zhǔn)誤有兩種,即均數(shù)的標(biāo)準(zhǔn)誤和率的標(biāo)準(zhǔn)誤91)均數(shù)的標(biāo)準(zhǔn)誤

將來自同一總體的若干個(gè)樣本均數(shù)看作一組新的觀察值,研究這些樣本均數(shù)的頻數(shù)分布,包括集中趨勢(shì)與離散趨勢(shì),可計(jì)算樣本均數(shù)的均數(shù)與標(biāo)準(zhǔn)差

總體樣本1樣本2樣本n10【例】某市16歲女中學(xué)生的身高分布服從均數(shù)(

)為155.4cm,標(biāo)準(zhǔn)差(

)為5.3cm的正態(tài)分布。作抽樣模擬試驗(yàn),每次隨機(jī)抽出10個(gè)觀察值(即樣本例數(shù)n=10),共抽取100個(gè)樣本

11當(dāng)原始觀察值的分布為正態(tài)分布時(shí),樣本均數(shù)的頻數(shù)分布基本接近正態(tài)分布。統(tǒng)計(jì)理論還證明,如果原始觀察值分布為偏態(tài)分布,當(dāng)樣本例數(shù)n較大時(shí),其樣本均數(shù)的分布仍近似服從正態(tài)分布12均數(shù)標(biāo)準(zhǔn)誤反映來自同一總體的樣本均數(shù)的離散程度以及樣本均數(shù)與總體均數(shù)的差異程度,即均數(shù)的抽樣誤差大小均數(shù)標(biāo)準(zhǔn)誤的計(jì)算理論值:估計(jì)值:可適當(dāng)增加樣本例數(shù)和減少觀察值的離散程度(如選擇同質(zhì)性較好的總體)來減少抽樣誤差。13均數(shù)標(biāo)準(zhǔn)誤的用途衡量樣本均數(shù)的可靠性估計(jì)總體均數(shù)的可信區(qū)間用于均數(shù)的假設(shè)檢驗(yàn)142)率的標(biāo)準(zhǔn)誤

率的標(biāo)準(zhǔn)誤衡量樣本率的離散趨勢(shì)和率的抽樣誤差的統(tǒng)計(jì)指標(biāo)。率的標(biāo)準(zhǔn)誤愈大,則樣本率的離散程度愈高,率的抽樣誤差愈大,反之亦然總體樣本1樣本2樣本n15率的標(biāo)準(zhǔn)誤的計(jì)算

若總體率π為已知,當(dāng)樣本例數(shù)為n時(shí)若總體率π未知,則以樣本率代入,求得率的標(biāo)準(zhǔn)誤的估計(jì)值166.1.3t分布

英國統(tǒng)計(jì)學(xué)家Gosset(1876-1937)17t分布曲線是一簇對(duì)稱于0的曲線。隨著自由度增大,t分布曲線逐漸逼近標(biāo)準(zhǔn)正態(tài)曲線,當(dāng)自由度為無窮大時(shí),t分布曲線和標(biāo)準(zhǔn)正態(tài)曲線完全吻合18單側(cè)(雙側(cè))t界值(t分位數(shù))196.2參數(shù)估計(jì)6.2.1參數(shù)估計(jì)的意義反映總體特征的統(tǒng)計(jì)指標(biāo)稱為參數(shù)(parameter)

在抽樣研究中,對(duì)總體參數(shù)的估計(jì)是統(tǒng)計(jì)推斷的主要內(nèi)容之一。

參數(shù)估計(jì)就是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)。206.2.2估計(jì)方法

點(diǎn)估計(jì)(pointestimation)用樣本統(tǒng)計(jì)量的值直接作為總體參數(shù)的估計(jì)值優(yōu)缺點(diǎn):估計(jì)方法簡單易行,但未考慮抽樣誤差21區(qū)間估計(jì)(intervalestimation)

以一定概率估計(jì)總體參數(shù)在哪個(gè)范圍內(nèi)的這種估計(jì)方法稱為區(qū)間估計(jì)總體均數(shù)的區(qū)間估計(jì)總體率π的區(qū)間估計(jì)22在正態(tài)分布N(μ,σ2)中,若總體標(biāo)準(zhǔn)差σ已知時(shí),總體均數(shù)μ的區(qū)間估計(jì)

簡寫為

(1)總體均數(shù)的區(qū)間估計(jì)

1σ已知時(shí)23按正態(tài)分布的原理,總體均數(shù)的區(qū)間估計(jì)簡寫為

2σ未知時(shí),n足夠大24【例6.1】已知某地150名正常成人脈搏均數(shù)73.53次/分,標(biāo)準(zhǔn)差11.30次/分,試估計(jì)該地正常成人脈搏總體均數(shù)95%可信區(qū)間。25

根據(jù)t分布的原理,當(dāng)α=0.05時(shí),有95%的t值在-t0.025,

υ

到t0.025,

υ

間,即P(-t0.025,

υ<t<t0.025,

υ)=0.95,因此總體均數(shù)的95%可信區(qū)間估計(jì)

簡寫為

3σ未知,n不是很大26【例6.2】隨機(jī)抽取某地健康男子26人,測(cè)得該樣本的血紅蛋白均數(shù)為13.25g/dL,標(biāo)準(zhǔn)差為0.70g/dL,問該地健康男子血紅蛋白總體均數(shù)的95%可信區(qū)間是多少?

解:27(2)總體率π的區(qū)間估計(jì)①樣本例數(shù)n較小時(shí),特別是當(dāng)p接近0或1時(shí),可用查表法(附表5百分率的可信區(qū)間)?!纠?.3】某衛(wèi)生防疫站隨機(jī)檢查某小學(xué)學(xué)生30人的糞便,發(fā)現(xiàn)5人蛔蟲卵陽性,試問該校學(xué)生蛔蟲感染率的95%可信區(qū)間是多少?解:本例n=30,X=5,查附表5,得6-35,即該校學(xué)生蛔蟲感染率的95%可信區(qū)間為6-35%28②樣本例數(shù)n足夠大,且樣本率p和(1-p)都不太小時(shí),如np與n(1-p)都大于5時(shí),樣本率p的抽樣分布近似正態(tài)分布,29【例6.4】某地人群中隨機(jī)抽取144人,檢查乙型肝炎表面抗原攜帶狀況得陽性率為9.20%,求該地人群的乙型肝炎表面抗原陽性率的95%可信區(qū)間。按式(6.4)計(jì)算,當(dāng)P=9.20%,n=144時(shí)解:

總體率的95%可信區(qū)間為

(0.0920-1.96

0.0241,0.0920+1.96

0.0241)=(0.0448,0.1392)306.3假設(shè)檢驗(yàn)的基本思想與步驟6.3.1假設(shè)檢驗(yàn)的基本思想什么是假設(shè)檢驗(yàn)(顯著性檢驗(yàn)):對(duì)總體是否具備某種特征做出推斷。我認(rèn)為中國人比日本人高31

假設(shè)是對(duì)總體特征(總體參數(shù))的一種看法

總體參數(shù)包括總體均值、總體方差、總體率等分析之前必需陳述

事先對(duì)總體參數(shù)作出某種假設(shè)然后利用樣本信息來判斷原假設(shè)是否成立32采用邏輯上的反證法反證法:要證明某個(gè)結(jié)論不成立,先假定此結(jié)論成立。在假定此結(jié)論成立的前提下,若能推求出矛盾(和已知條件矛盾,或與公理、定理矛盾),則說明原來的假定不成立。假設(shè)檢驗(yàn)是看是否與小概率原理矛盾。33依據(jù)統(tǒng)計(jì)上的小概率原理小概率原理:小概率事件在一次試驗(yàn)中實(shí)際上是不會(huì)發(fā)生的例如:民航飛機(jī)失事是小概率事件,大家還敢坐飛機(jī)就是基于小概率原理34總體

假設(shè)檢驗(yàn)的過程

(提出假設(shè)→抽取樣本→作出決策)抽取隨機(jī)樣本均值

X=20

我認(rèn)為人口的平均年齡是50歲

提出假設(shè)

拒絕假設(shè)!別無選擇.作出決策35某商家宣稱他的一大批雞蛋“壞(變質(zhì))蛋率為1%”。為了對(duì)這批雞蛋的質(zhì)量(即“壞(變質(zhì))蛋率為1%”)做出判斷,顧客與商家約定,從中隨機(jī)抽取5個(gè)做檢查。結(jié)果4個(gè)“好蛋”,1個(gè)“壞蛋”。根據(jù)這一檢查結(jié)果,幾乎任何一位顧客都會(huì)對(duì)“壞(變質(zhì))蛋率為1%”的廣告詞發(fā)生懷疑。36在“壞(變質(zhì))蛋率為1%”的前提下,5個(gè)雞蛋樣品中出現(xiàn)一個(gè)壞蛋的機(jī)會(huì)很小的(概率為0.049)發(fā)生機(jī)會(huì)很小的事件竟然在一次抽樣中出現(xiàn)了,人們懷疑前提條件(“壞(變質(zhì))蛋率為1%”)的真實(shí)性。這一思維上升到統(tǒng)計(jì)理論便是小概率原理”。37【例6.5】已知正常人脈搏均數(shù)()為72次/分,作為總體均數(shù)?,F(xiàn)隨機(jī)抽取某病患者81人,測(cè)得脈搏均數(shù)()為74.8次/分,標(biāo)準(zhǔn)差(s)為8.7次/分。試問能否認(rèn)為該病患者脈搏與正常成人脈搏均數(shù)不同?

病人脈搏正常人脈搏返回38引起病人的樣本均數(shù)(74.8)與已知正常人脈搏總體均數(shù)(72)差異的兩種可能:一是該病實(shí)際上并不引起脈搏改變(),它們的差異僅僅是由于抽樣誤差所致;二是這類病人的脈搏均數(shù)確實(shí)與正常成人脈搏均數(shù)不同()。39先對(duì)研究總體的特征建立一個(gè)假設(shè)以待我們?nèi)z驗(yàn),這個(gè)假設(shè)稱為檢驗(yàn)假設(shè)(hypothesistobetested),記作H0與檢驗(yàn)假設(shè)H0有聯(lián)系而相對(duì)立的假設(shè),稱為備擇假設(shè)(alternativehypothesis),記作H140雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)及其選取41在H0成立的條件下,根據(jù)現(xiàn)有樣本觀測(cè)值,可以計(jì)算相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的分布

42統(tǒng)計(jì)拒絕域和接受域:注意:拒絕域和接受域的劃分取決于檢驗(yàn)水準(zhǔn)的大小。抽樣分布0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量t拒絕域拒絕域接受域1-

置信水平43檢驗(yàn)水準(zhǔn)記作α,它是由檢驗(yàn)統(tǒng)計(jì)量的分布曲線與橫軸中處于拒絕域的這些值上面那部分面積的數(shù)值。α是指檢驗(yàn)假設(shè)H0本應(yīng)成立,而由于樣本的信息拒絕了H0的可能性大小的度量抽樣分布0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量t拒絕域拒絕域接受域1-

置信水平44由樣本計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的值,如果出現(xiàn)在拒絕域內(nèi),則拒絕檢驗(yàn)假設(shè)。這時(shí)習(xí)慣上稱為統(tǒng)計(jì)上有顯著性;臨界值臨界值

a/2a/2

樣本統(tǒng)計(jì)量拒絕域拒絕域接受域抽樣分布1-

置信水平45如果檢驗(yàn)統(tǒng)計(jì)量的值出現(xiàn)在接受域內(nèi)時(shí),則接受檢驗(yàn)假設(shè),稱為統(tǒng)計(jì)上無顯著性臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量拒絕域拒絕域接受域抽樣分布1-

置信水平46P值:如果檢驗(yàn)假設(shè)H0為真時(shí),由所觀測(cè)到的樣本計(jì)算檢驗(yàn)統(tǒng)計(jì)量獲得現(xiàn)有數(shù)值以及更不利于檢驗(yàn)假設(shè)的數(shù)值的可能性(概率)47雙側(cè)假設(shè)檢驗(yàn)P值:絕對(duì)值大于等于這個(gè)值的概率抽樣分布0統(tǒng)計(jì)量值-統(tǒng)計(jì)量值p/2p/2

樣本統(tǒng)計(jì)量t1-p48單側(cè)假設(shè)檢驗(yàn)P值:大于等于這個(gè)值的概率或小于等于這個(gè)值的概率用P值推斷:P≤α,拒絕H0,接受H1;P>α?xí)r,不拒絕H0496.3.2假設(shè)檢驗(yàn)的步驟

1)建立檢驗(yàn)假設(shè)(H0)和備擇假設(shè)(H1)2)確定檢驗(yàn)水準(zhǔn)α和單、雙側(cè)一般取α=0.05

3)選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量4)確定P值5)推斷結(jié)論

506.4t檢驗(yàn)和u檢驗(yàn)假設(shè)檢驗(yàn)的方法常以選定的檢驗(yàn)統(tǒng)計(jì)量的分布而命名

例如:統(tǒng)計(jì)學(xué)中常用的t檢驗(yàn),卡方檢驗(yàn),F(xiàn)檢驗(yàn)等。

6.4.1t檢驗(yàn)

1)t檢驗(yàn)的應(yīng)用條件(1)當(dāng)樣本例數(shù)n較小,樣本取自正態(tài)總體,總體標(biāo)準(zhǔn)差未知。(2)在作兩個(gè)樣本均數(shù)比較時(shí),還要求兩樣本相應(yīng)的總體方差相等,稱為方差齊性。512)樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)推斷樣本所屬的未知的總體均數(shù)與已知的另一總體均數(shù)是否相等。

檢驗(yàn)統(tǒng)計(jì)量為:

例題6.5就是這種t檢驗(yàn)。

南京7歲男童身高北京7歲男童身高樣本523)配對(duì)設(shè)計(jì)數(shù)值資料的t檢驗(yàn)

【例6.6】為研究一種新藥對(duì)女性血清膽固醇含量是否有影響,對(duì)20名女性根據(jù)同年齡和體重相近的原則配成10對(duì)。每對(duì)中一個(gè)服用新藥,另一個(gè)服用不含活性,但形態(tài)、顏色與新藥相同的安慰劑,經(jīng)一段時(shí)間后,測(cè)定血清膽固醇含量(mmol/L),結(jié)果見表6.2第(1)~(3)欄,問服新藥與服安慰劑血清膽固醇含量有無差別?53差值d的總體若新藥對(duì)血清膽固醇沒有影響,則理論上差值d的總體均值應(yīng)為0。54(1)建立檢驗(yàn)假設(shè)與備擇假設(shè)(2)確定檢驗(yàn)水準(zhǔn)和單、雙側(cè)

本例α=0.05,雙側(cè)

(3)計(jì)算統(tǒng)計(jì)量

55其中56(4)確定P值

(5)判斷結(jié)論

按α=0.05水準(zhǔn),不拒絕H0,可以認(rèn)為服用該新藥不影響女性血清膽醇。

57【例6.7】某醫(yī)師用一種中藥治療高血壓患者,觀察患者治療前后舒張壓(kPa)變化(見表6.3),問該中藥是否對(duì)高血壓患者治療前后舒張壓有影響?58591)建立

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論