醫(yī)學(xué)統(tǒng)計學(xué) 第06章 參數(shù)估計與假設(shè)檢驗 學(xué)習(xí)課件_第1頁
醫(yī)學(xué)統(tǒng)計學(xué) 第06章 參數(shù)估計與假設(shè)檢驗 學(xué)習(xí)課件_第2頁
醫(yī)學(xué)統(tǒng)計學(xué) 第06章 參數(shù)估計與假設(shè)檢驗 學(xué)習(xí)課件_第3頁
醫(yī)學(xué)統(tǒng)計學(xué) 第06章 參數(shù)估計與假設(shè)檢驗 學(xué)習(xí)課件_第4頁
醫(yī)學(xué)統(tǒng)計學(xué) 第06章 參數(shù)估計與假設(shè)檢驗 學(xué)習(xí)課件_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第六章參數(shù)估計與假設(shè)檢驗

ParameterestimationandHypothesisTest總體:研究對象(某項變量值)的全體。樣本:總體中隨機抽取的一部分研究對象。統(tǒng)計量:從樣本計算出來的統(tǒng)計指標(biāo)。參數(shù):描述總體的統(tǒng)計指標(biāo)。幾個概念統(tǒng)計描述:計量(集中水平、變異大小)、計數(shù)(相對數(shù))統(tǒng)計推斷:用樣本信息推論總體特征的過程。參數(shù)估計:

用樣本的統(tǒng)計指標(biāo)(統(tǒng)計量),對總體統(tǒng)計指標(biāo)(參數(shù))進行估計假設(shè)檢驗:又稱顯著性檢驗,是指通過樣本間存在的差別對樣本所代表的總體間是否存在著差別做出判斷。第一節(jié)參數(shù)估計一、抽樣誤差

假定健康成年男子紅細胞服從總體均數(shù)

=4.75,總體標(biāo)準(zhǔn)差

=0.38的正態(tài)分布N(4.75,0.382)(一)均數(shù)的抽樣誤差

將此100個樣本均數(shù)看成新變量值,則這100個樣本均數(shù)構(gòu)成一新分布,繪制直方圖。從正態(tài)分布總體N(4.75,0.382)隨機抽樣所得樣本均數(shù)分布樣本均數(shù)的抽樣分布具有以下特點1.各樣本均數(shù)未必等于總體均數(shù);2.樣本均數(shù)之間存在差異;3.樣本均數(shù)的分布為中間多,兩邊少,左右基本對稱4.樣本均數(shù)的變異較之原變量的變異大大縮小抽樣誤差

均數(shù)的抽樣誤差:由于抽樣造成的樣本均數(shù)與總體均數(shù)之間的差別原因:1)抽樣

2)個體差異

如何度量抽樣誤差的大???數(shù)理統(tǒng)計可以證明:

的總體均數(shù)為

;而的標(biāo)準(zhǔn)差比原個體值的標(biāo)準(zhǔn)差

要小,為區(qū)別兩者,的標(biāo)準(zhǔn)差用表示樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤(standarderror,SE)樣本均數(shù)的標(biāo)準(zhǔn)差稱均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean,SEM),反映樣本均數(shù)的抽樣誤差抽樣誤差抽樣誤差實際用樣本標(biāo)準(zhǔn)差來估計總體標(biāo)準(zhǔn)差,從而得到標(biāo)準(zhǔn)誤的估計值樣本均數(shù)標(biāo)準(zhǔn)誤的大小與標(biāo)準(zhǔn)差成正比,與樣本含量n的平方根成反比,即在同一總體中隨機抽樣,樣本含量n越大,抽樣誤差越小。在實際應(yīng)用中可通過增加樣本含量n來減小樣本均數(shù)的標(biāo)準(zhǔn)誤,從而降低抽樣誤差。偏態(tài)分布總體中抽樣數(shù)理統(tǒng)計理論表明:對于任意分布,無論是正態(tài)還是偏態(tài),只要n足夠大,則樣本均數(shù)的分布近似服從正態(tài)分布:均數(shù)的標(biāo)準(zhǔn)誤:例子例2000年某研究者隨機調(diào)查某地健康成年男子27人,得到血紅蛋白量的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試估計該樣本均數(shù)的抽樣誤差。均數(shù)標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤聯(lián)系與區(qū)別均數(shù)標(biāo)準(zhǔn)差均數(shù)標(biāo)準(zhǔn)誤含義測量值的離散程度樣本均數(shù)的離散程度(統(tǒng)計量對參數(shù)的離散度)計算大小大小用途描述測量值離散程度、計算cv、計算正常值范圍、計算標(biāo)準(zhǔn)誤參數(shù)可信區(qū)間的估計假設(shè)檢驗聯(lián)系都是離散程度的指標(biāo),標(biāo)準(zhǔn)誤是通過標(biāo)準(zhǔn)差來計算(二)率的抽樣誤差樣本率(p)和總體率(π)的差異稱為率的抽樣誤差(samplingerrorofrate),用率的標(biāo)準(zhǔn)誤(standarderrorofrate)度量。如果總體率π未知,用樣本率p估計率的標(biāo)準(zhǔn)誤例:為了了解某藥的療效,對100名患者治療的結(jié)果進行調(diào)查,結(jié)果為80人有效,有效率為80%。則樣本率的抽樣誤差為多少?解:已知n=100,p=0.80

二、總體均數(shù)的估計(一)t分布的概念

式中為自由度(degreeoffreedom,df)

3.實際工作中,由于未知,用代替,則不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從t分布。

t分布(t-distribution)英國統(tǒng)計學(xué)家W.S.Gosset于1908年以“Student”筆名發(fā)表論文,證明它服從自由度

=

n

1的t分布,即

~t分布,

=

n

1t分布又稱Studentt分布(Student’st-distribution)t分布十分有用,它是小樣本統(tǒng)計推斷的理論基礎(chǔ)。t分布的圖形與特征

1.特征:

t界值表:詳見附表,可反映t分布曲線下的面積。單側(cè)面積或單尾面積為

時的t值:用表示;雙側(cè)面積或雙尾面積為

時的t值:用表示。

2.t分布曲線下面積

-tt0舉例:

2.t分布曲線下面積

更一般的表示方法如圖中陰影部分所示為:單側(cè):P(t

t

,

)=

和P(t

t

,

)=

雙側(cè):P(t

t

/2,

)+P(t

t

/2,

)=

參數(shù)估計:用樣本統(tǒng)計量推斷總體參數(shù)總體均數(shù)估計:用樣本均數(shù)(和標(biāo)準(zhǔn)差)推斷總體均數(shù)。(1)點估計(pointestimation)(2)區(qū)間估計(intervalestimation)(二)總體均數(shù)的估計用相應(yīng)樣本統(tǒng)計量直接作為其總體參數(shù)的估計值其方法簡單,但未考慮抽樣誤差的大小S1.點估計(pointestimation):可信區(qū)間:也稱為置信區(qū)間(confidenceinterval,CI)

按預(yù)先給定的概率(1

),計算一個區(qū)間,使它能夠包含未知的總體參數(shù)。(1

)稱為可信度計算得到的區(qū)間稱為可信區(qū)間一般

=0.05,為95%的可信區(qū)間或置信區(qū)間2.區(qū)間估計(intervalestimation)95%CI:(下限,上限)需考慮:(1)總體標(biāo)準(zhǔn)差

是否已知(2)樣本含量n的大小通常有兩類方法:(1)t分布法(2)正態(tài)近似法區(qū)間估計方法(1)

已知時:按Z分布(標(biāo)準(zhǔn)正態(tài)分布)這種情況很少!!

雙側(cè)(1

)可信區(qū)間

(2)未知:按t分布例:已知某地27名健康成年男子的血紅蛋白量均數(shù)=125g/L,標(biāo)準(zhǔn)差S=15g/L。試問該市地健康正常成年男子血紅蛋白血清膽固醇平均含量的95%置信區(qū)間和99%置信區(qū)間各是多少?解:本例n=27,

=27–1=26,查t界值表,

=0.05時,雙側(cè)

t0.05/2,26=2.056,

=0.01時,雙側(cè)

t0.01/2,26=2.779;95%CI:125

2.056

=(119.06,130.94)g/L99%CI:125

2.779=(116.98,133.02)g/L該市健康成年男子血紅蛋白平均含量:95%置信區(qū)間為(119.06,130.94)g/L,99%置信區(qū)間為(116.98,133.02)g/L。(3)未知但n較大:按正態(tài)分布近似估計

雙側(cè)(1

)可信區(qū)間

1.96=172.2

1.96

=(171.3,173.1)

該市2000年19歲健康男大學(xué)生平均身高的95%置信區(qū)間為(171.3,173.1)cm。例某市2000年隨機測量了90名19歲健康男大學(xué)生的身高,其均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm,試估計該市2000年19歲健康男大學(xué)生平均身高的95%置信區(qū)間。三、總體率的區(qū)間估計總體率的可信區(qū)間(confidenceintervalofrate):根據(jù)樣本率推算總體率可能所在的范圍點估計區(qū)間估計正態(tài)近似法查表法條件:n足夠大,且np

和n(1-p)均大于51-α可信區(qū)間為:

(p-Zα/2Sp,p+Zα/2Sp)(一)正態(tài)近似法解:

(p-Z0.05/2Sp,p+Z0.05/2Sp)

=(0.80-1.96×0.04,0.80+1.96×0.04)

=(0.7216,0.8784)即總體率的95%可信區(qū)間為(72.16%~87.84%)。試估計p=0.80,Sp=0.04的總體率95%可信區(qū)間。注意:如果計算獲得的可信區(qū)間下限小于0%,上限大于100%,則將下限直接定為0%,上限直接定為100%條件:當(dāng)樣本含量n較小時,比如n≤50,可查附表:百分率的可信限,得到總體率的可信區(qū)間。(二)查表法例子某眼科醫(yī)院在某校抽查了6年級學(xué)生30名,其中患近視眼的學(xué)生12名,求該校6年級學(xué)生患近視眼率的95%可信區(qū)間。

1.95%的可信區(qū)間的理解:(1)計算出的可信區(qū)間有95%的可能性包含了總體參數(shù),即包含總體參數(shù)的概率達到95%。(2)從正態(tài)總體中隨機抽取100個樣本,可算得100個樣本均數(shù),也可算得100個可信區(qū)間,平均約有95個可信區(qū)間包含了總體均數(shù)。(3)但在實際工作中,只能根據(jù)一次試驗結(jié)果估計可信區(qū)間,我們就認(rèn)為該區(qū)間包含了總體均數(shù)

。注意:一般不說總體參數(shù)落在此區(qū)間內(nèi)的概率為95%!原因在于總體參數(shù)是常量,是固定值??尚艆^(qū)間的確切涵義

2.可信區(qū)間的兩個要素(1)準(zhǔn)確度:用可信度(1

)表示:即區(qū)間包含總體均數(shù)

的理論概率大小。當(dāng)然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間準(zhǔn)確度要好(2)精確度:即區(qū)間的寬度區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間精確度要好

當(dāng)n確定時,上述兩者互相矛盾。提高準(zhǔn)確度(可信度),則精確度降低(可信區(qū)間會變寬),勢必降低可信區(qū)間的實際應(yīng)用價值,故不能籠統(tǒng)認(rèn)為99%可信區(qū)間比95%可信區(qū)間要好。在實際應(yīng)用中,95%可信區(qū)間更為常用。在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別第二節(jié)假設(shè)檢驗

hypothesistest一、基本原理假設(shè)檢驗(hypothesistest),有時也稱顯著性檢驗(significancetest)是在兩種相反的假設(shè)之間做出決定的一個過程它將選擇方案表述為兩種對立的假設(shè),然后對其中的一個假設(shè)進行檢驗,根據(jù)證據(jù)的強弱來決定是否接受這個假設(shè)例子(假設(shè))

已知北方農(nóng)村兒童前囟門閉合月齡為14.1月。某研究人員從東北某縣(缺鈣地區(qū))抽取100名兒童,得前囟門閉合月齡均值為15.2月,標(biāo)準(zhǔn)差為5.08月。問該縣兒童前囟門閉合月齡平均否遲于一般兒童?

研究背景:研究缺鈣對幼兒生長發(fā)育的影響研究結(jié)果可供選擇的結(jié)論(假設(shè))有哪些?1、該縣兒童總體平均閉合月齡與一般兒童沒有差異2、該縣兒童總體平均閉合月齡遲于一般兒童兩種假設(shè)在統(tǒng)計上的含義抽樣研究存在抽樣誤差!!總體均數(shù)=14.1樣本1樣本2μ1=14.1樣本1樣本2樣本3從總體1中抽樣μ2≠14.1從總體2中抽樣均數(shù)與μ1=14.1之間的差異是抽樣誤差造成均數(shù)與μ1=14.1之間的差異是本質(zhì)差異造成μ1=14.1樣本總體1μ2≠14.1總體2????即:需要推斷15.2與14.1之間的差異是由抽樣誤差造成,還是由本質(zhì)差異造成的?μ0=14.1記樣本所代表的總體為μ1,我們可以將這兩種差異表達為兩種對立的假設(shè)μ1假設(shè)1:觀察到的差異是由抽樣誤差造成的,其總體沒有差異,即,μ1=μ0

稱為:零假設(shè)(NullHypothesis),

或原假設(shè)、無效假設(shè)符號表示:H0假設(shè)2:觀察到的差異是由本質(zhì)差異造成的,其總體本來就不同,即,μ1≠μ0

稱為:備擇假設(shè)(AlternativeHypothesis)符號表示:H1注意:所有的假設(shè)檢驗都是對零假設(shè)(H0)進行檢驗!!

在目前觀察結(jié)果的狀況下,收集“否定H0的證據(jù)”,證據(jù)的強弱用概率p表示,概率越小證據(jù)越強,否定H0的理由就越充分。備擇假設(shè):有時也叫研究假設(shè),它表示研究者希望得到的結(jié)論。研究者習(xí)慣稱備擇假設(shè)為“陽性結(jié)論”;而將零假設(shè)稱為“陰性結(jié)論”假設(shè)檢驗是建立在抽樣分布、小概率事件原理基礎(chǔ)上的,對樣本差別性質(zhì)進行風(fēng)險推斷的一種邏輯思維方法.

它是利用反證法思想,從問題的對立面(實際觀察到有差異,但假設(shè)兩總體沒有差異,即H0)出發(fā)間接判斷要解決的問題(兩總體真有差異,即H1)是否成立。假設(shè)在H0成立的條件下計算檢驗統(tǒng)計量,獲得P值,根據(jù)小概率原理來判斷是否否定H0。假設(shè)檢驗基本思想理解兩點:反證法思想、小概率原理二、假設(shè)檢驗的基本步驟零假設(shè)H0:μ=14.1備擇假設(shè)

H1:

μ>14

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論