第六章總體均數(shù)的估計(jì)(講)課件_第1頁(yè)
第六章總體均數(shù)的估計(jì)(講)課件_第2頁(yè)
第六章總體均數(shù)的估計(jì)(講)課件_第3頁(yè)
第六章總體均數(shù)的估計(jì)(講)課件_第4頁(yè)
第六章總體均數(shù)的估計(jì)(講)課件_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章

總體均數(shù)的估計(jì)

景學(xué)安2023/7/201

[學(xué)習(xí)要求]

了解:置信區(qū)間的正確使用。

熟悉:定量資料抽樣研究的特點(diǎn)。

掌握:均數(shù)抽樣誤差和標(biāo)準(zhǔn)誤的概念、計(jì)算公式和應(yīng)用;t分布和z分布的概念、特征和兩者的聯(lián)系與區(qū)別;總體均數(shù)置信區(qū)間的概念和計(jì)算公式;標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)誤的區(qū)別和聯(lián)系。

2023/7/202第一節(jié)

均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

一、樣本均數(shù)的抽樣分布

在醫(yī)學(xué)科學(xué)研究中,往往采取抽樣研究(samplingstudy)的方法,即從研究的總體中隨機(jī)抽取部分觀察單位作為樣本,然后根據(jù)樣本信息來(lái)推論總體特征,即為統(tǒng)計(jì)推斷(statisticalinference)。然而,由于總體的變量值存在變異,樣本均數(shù)往往不等于總體均數(shù)。如表6.1。2023/7/203┊樣本1樣本2樣本3樣本k2023/7/204定量資料抽樣研究的特點(diǎn):

1.從同一正態(tài)總體中抽取樣本含量n相等的許多樣本,這些樣本均數(shù)的分布仍是以總體均數(shù)為中心呈正態(tài)分布;或者雖然總體呈偏態(tài)分布,但樣本含量足夠大時(shí),樣本均數(shù)的分布仍近似正態(tài)分布。見(jiàn)圖6.1和圖6.3

2.理論上,如表6.1,μ=4.5,。3.樣本均數(shù)間的變異小于原始變量的變異,即,并隨樣本含量的增加,樣本均數(shù)間的變異逐步縮小。見(jiàn)圖6.1。如表6.1資料,σ=0.2,=0.041。2023/7/205

4.來(lái)自正態(tài)總體的樣本均數(shù)的分布為正態(tài)分布N()。范圍內(nèi)包含95%的樣本均數(shù)范圍內(nèi)包含99%的樣本均數(shù)如表6.1資料,實(shí)際范圍內(nèi)包含了96個(gè)樣本均數(shù),占96%。2023/7/206

二、均數(shù)的標(biāo)準(zhǔn)誤

由于隨機(jī)抽樣引起的樣本均數(shù)與總體均數(shù)之間以及樣本均數(shù)之間的差異稱(chēng)為均數(shù)的抽樣誤差(samplingerrorofmean)。樣本均數(shù)的標(biāo)準(zhǔn)差稱(chēng)為均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean,SEM),用符號(hào)表示,它反映了各樣本均數(shù)圍繞總體均數(shù)μ的離散程度,也用來(lái)表示樣本均數(shù)的抽樣誤差的大小。

1.均數(shù)標(biāo)準(zhǔn)誤的計(jì)算2023/7/207

數(shù)理統(tǒng)計(jì)已經(jīng)證明:均數(shù)標(biāo)準(zhǔn)誤的大小與總體標(biāo)準(zhǔn)差成正比,而與樣本含量的平方根成反比,即如表6.1資料,σ=0.2,n=20,即實(shí)際工作中總體標(biāo)準(zhǔn)差σ往往是不知道的,而只知道樣本標(biāo)準(zhǔn)差S,所以只能用S代替σ,求得標(biāo)準(zhǔn)誤的估計(jì)值,即:2023/7/208

例6.1隨機(jī)抽取某地正常成年男性200名,測(cè)得其血清膽固醇的均數(shù)為3.64mmmol/L,標(biāo)準(zhǔn)差為1.2mmol/L,試估計(jì)其均數(shù)的標(biāo)準(zhǔn)誤。2.均數(shù)標(biāo)準(zhǔn)誤的應(yīng)用

⑴表示抽樣誤差的大小,從而說(shuō)明樣本均數(shù)的可靠性。⑵進(jìn)行總體均數(shù)的區(qū)間估計(jì)。⑶進(jìn)行均數(shù)的t檢驗(yàn)。2023/7/209第二節(jié)

t分布一、t分布的概念上一章已說(shuō)明,正態(tài)變量X采用z=(X-μ)/σ變換,則一般的正態(tài)分布N(μ,σ)即變換為標(biāo)準(zhǔn)正態(tài)分布N(0,1)。又因從正態(tài)總體抽取的樣本均數(shù)服從正態(tài)分布N(μ,),同樣可作正態(tài)變量的z變換,即2023/7/2010而實(shí)際工作中由于σ未知,也未知,故往往是用作為的估計(jì)值,此時(shí)對(duì)采用的不是z變換而是t變換了,即t值有大有小,有正有負(fù),其頻數(shù)分布是一種連續(xù)性分布,這就是統(tǒng)計(jì)上著名的t分布(t-distribution)。t分布于1908年由英國(guó)統(tǒng)計(jì)學(xué)家W.S.Gosset以“Student”筆名發(fā)表,故又稱(chēng)Studentt

分布(Students’t-distribution)。,ν=n-12023/7/2011二、t分布曲線(xiàn)的特征

圖6.4自由度為1、5、∞時(shí)的t分布曲線(xiàn)2023/7/2012由圖6.4可見(jiàn):①t分布曲線(xiàn)是單峰分布,以0為中心,左右兩側(cè)對(duì)稱(chēng);②曲線(xiàn)的中間比標(biāo)準(zhǔn)正態(tài)曲線(xiàn)(z分布曲線(xiàn))低,兩側(cè)翹得比標(biāo)準(zhǔn)正態(tài)曲線(xiàn)略高;③當(dāng)樣本含量越?。▏?yán)格地說(shuō)是自由度ν=n-1越?。瑃分布與z分布差別越大;當(dāng)ν逐漸增大時(shí),t分布逐漸逼近于z分布,當(dāng)ν=∞時(shí),t分布就完全成為z分布。所以t分布曲線(xiàn)是隨自由度的變動(dòng)而變化的一簇曲線(xiàn)。

2023/7/2013三、t界值我們常把自由度為ν的t分布曲線(xiàn)下雙側(cè)尾部合計(jì)面積或單側(cè)尾部面積為指定概率α?xí)r,則橫軸上相應(yīng)的t界值分別記為或。如當(dāng)ν=20,雙側(cè)α=0.05時(shí),記為t0.05/2,20;當(dāng)ν=22,單側(cè)α=0.01時(shí),記為t0.01,22。對(duì)于或值,可根據(jù)ν和α值,查附表3,t界值表。0t0t2023/7/2014由于t分布是以0為中心的對(duì)稱(chēng)分布,t界值表中只列出正值,故查附表3時(shí),不管t值正負(fù)只用絕對(duì)值。由t界值表可知:①在相同ν,單側(cè)概率α和雙側(cè)概率2α的t界值相同,即單側(cè)=雙側(cè),如單側(cè)t0.05,20=雙側(cè)t0.1/2,20;②對(duì)于相同的自由度ν,α值越小,值越大,反之越小;③對(duì)于相同的α值,自由度ν越小,值越大,反之越小。當(dāng)ν=∞時(shí),則,故查z界值即可查ν=∞的t界值。

2023/7/2015t分布是t檢驗(yàn)的理論基礎(chǔ)。│t│值與樣本均數(shù)和總體均數(shù)之差成正比,與標(biāo)準(zhǔn)誤成反比。在t分布中│t│值越大,其兩側(cè)或單側(cè)以外的面積所占曲線(xiàn)下總面積的比重就越小,說(shuō)明在抽樣中獲得此│t│值以及更大│t│值的機(jī)會(huì)就越小,這種機(jī)會(huì)的大小是用概率P來(lái)表示的。

│t│值越大,則P值越小;反之,│t│值越小,P值越大。根據(jù)上述的意義,│t│≥,則P≤α;反之,│t│<,則P>α。2023/7/2016第三節(jié)

總體均數(shù)的估計(jì)用樣本指標(biāo)(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)(參數(shù))稱(chēng)為參數(shù)估計(jì),是統(tǒng)計(jì)推斷的一個(gè)重要方面。觀察樣本均數(shù)的目的之一,是為了估計(jì)總體均數(shù)。估計(jì)總體均數(shù)的方法有兩種,即點(diǎn)值估計(jì)(pointestimation)和區(qū)間估計(jì)(intervalestimation)。一、點(diǎn)值估計(jì)點(diǎn)值估計(jì)是直接用樣本均數(shù)作為總體均數(shù)的估計(jì)值。例如上述某市120名12歲健康男孩身高均數(shù)為143.07cm,可作為該市全部12歲健康男孩的平均身高的估計(jì)值。2023/7/2017二、區(qū)間估計(jì)

區(qū)間估計(jì)是按一定的概率(1-α)估計(jì)包含總體均數(shù)可能的范圍,該范圍亦稱(chēng)總體均數(shù)的置信區(qū)間(confidenceinterval,CI)。1-α稱(chēng)為置信度(亦稱(chēng)可信度),常取1-α為0.95和0.99,即總體均數(shù)的95%置信區(qū)間和99%置信區(qū)間。1-α(如95%)可信區(qū)間的含義是:總體均數(shù)被包含在該區(qū)間內(nèi)的可能性是1-α(95%),沒(méi)有被包含的可能性為α(5%)??傮w均數(shù)μ可信區(qū)間的計(jì)算,可根據(jù)資料的條件選用不同的方法。

(一)總體均數(shù)置信區(qū)間的估計(jì)

2023/7/2018

1.σ未知且n較小(n<100)

按t分布的原理計(jì)算置信區(qū)間。1-α置信區(qū)間為,即

公式推導(dǎo):在t分布中,1-α的t值位于

區(qū)間內(nèi),即于是得可信區(qū)間為1-α?xí)r,計(jì)算總體均數(shù)可信區(qū)間的通式為2023/7/2019

表6.1資料模擬抽樣100個(gè)樣本均數(shù),在計(jì)算的100個(gè)95%置信區(qū)間中,有95個(gè)區(qū)間包含總體均數(shù)(4.5),有5個(gè)個(gè)區(qū)間包含總體均數(shù)。例6.3

在某地成年男子中隨機(jī)抽取了25人,測(cè)其脈率,得到脈率均數(shù)為72次/min,標(biāo)準(zhǔn)差為8次/min。試估計(jì)該地成年男子脈率總體均數(shù)的95%置信區(qū)間。即寫(xiě)成2023/7/2020ν=n-1=25-1=24,α取雙側(cè)0.05,查附表3,t值表得雙側(cè)t0.05/2,24

=2.064。按式6.6得:95%的置信區(qū)間為72±2.064×1.6,即(68.7,75.3)。故該地成年男子脈率總體均數(shù)的95%置信區(qū)間為68.7~75.3(次/min)。

2.σ已知或n較大(n≥100)

(1)σ已知時(shí),服從于Z分布,按Z分布的原理計(jì)算置信區(qū)間。1-α可信區(qū)間為:,即本例n=25,S=8次/min,算得樣本均數(shù)的標(biāo)準(zhǔn)誤為2023/7/2021

如Z

0.05/2=1.96,Z0.01/2=2.58

(2)n較大時(shí),t分布接近于Z分布,即tα/2,ν接近于Zα/2,為了計(jì)算方便,1-α可信區(qū)間近似為:

2023/7/2022

例6.4

隨機(jī)抽取某地200名40歲以上正常人,測(cè)定取空腹血糖值,其均數(shù)為4.91mmol/L,標(biāo)準(zhǔn)差為0.72mmol/L,試估計(jì)該地40歲以上正常人群空腹血糖的總體均數(shù)的95%置信區(qū)間。由于樣本例數(shù)較大,可按正態(tài)近似法估計(jì),α=0.05,雙側(cè)Z0.05/2=1.96,,故95%置信區(qū)間為:4.91±1.96×0.0509,即(4.81,5.01)mmol/L。

2023/7/2023(二)兩總體均數(shù)差值置信區(qū)間的估計(jì)

在實(shí)際工作中

,我們經(jīng)常想了解兩個(gè)不同總體均數(shù)差值的大小,如正常成年男、女的血紅蛋白平均相差多少?冠心病患者和正常人的血清膽固醇酯平均相差多少?等等。

一般用作為(μ1-μ2)的點(diǎn)估計(jì)值,但是由于存在抽樣誤差,往往需要對(duì)兩總體均數(shù)的差值進(jìn)行置信區(qū)間的估計(jì)。

數(shù)理統(tǒng)計(jì)證明,分別來(lái)自?xún)蓚€(gè)正態(tài)總體和的和,只要,其之差仍服從于

的正態(tài)分布。2023/7/2024

式中,稱(chēng)為兩均數(shù)之差的標(biāo)準(zhǔn)誤,其計(jì)算公式為,如果轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布,則~N(0,1)總體均數(shù)差值的(1-α)置信區(qū)間為:

但在實(shí)踐工作中,總體標(biāo)準(zhǔn)差σ是未知的,只能用樣本標(biāo)準(zhǔn)差S來(lái)代替,兩均數(shù)之差的標(biāo)準(zhǔn)誤估計(jì)值為:2023/7/2025式中,S2稱(chēng)為兩均數(shù)合并的方差,計(jì)算公式為:上式如果n1=n2,則2023/7/2026總體均數(shù)差值的(1-α)置信區(qū)間為:服從于ν=n-1的t分布。

例6.5測(cè)定28例結(jié)核病患者和34例對(duì)照者的腦脊液中鎂(mmol/L)的含量,結(jié)果見(jiàn)表6.5,試估計(jì)結(jié)核病人和對(duì)照者的腦脊液中鎂含量的總體均數(shù)之差的95%置信區(qū)間。ν=n1+n2-22023/7/2027

表6.5兩對(duì)比組腦脊液中鎂含量(mmol/L)組別例數(shù)均數(shù)標(biāo)準(zhǔn)差結(jié)核組對(duì)照組28341.041.280.170.14本例假定兩組方差齊性,即本例ν=28+34-2=60,查t界值表,t0.05/2,60=2.000,2023/7/2028

(1.28-1.04)±2.00×0.0395=0.161~0.319(mmol/L),即兩總體均數(shù)之差的95%置信區(qū)間為(0.161,0.319)mmol/L。

(三)置信區(qū)間的正確應(yīng)用

1.從以上計(jì)算置信區(qū)間的計(jì)算公式可以看出,標(biāo)準(zhǔn)誤愈小,估計(jì)總體均數(shù)可信區(qū)間的范圍也愈窄,說(shuō)明樣本均數(shù)與總體均數(shù)愈接近,對(duì)總體均數(shù)的估計(jì)也愈精確;反之,標(biāo)準(zhǔn)誤愈大,估計(jì)總體均數(shù)可信區(qū)間的范圍也愈寬,說(shuō)明樣本均數(shù)距總體均數(shù)愈遠(yuǎn),對(duì)總體均數(shù)的估計(jì)也愈差。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論