衛(wèi)生統(tǒng)計學專題六:總體均數(shù)與總體率的估計_第1頁
衛(wèi)生統(tǒng)計學專題六:總體均數(shù)與總體率的估計_第2頁
衛(wèi)生統(tǒng)計學專題六:總體均數(shù)與總體率的估計_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、專題六 總體均數(shù)與總體率的估計樣本均數(shù)(或樣本率)不能直接作為總體均數(shù)(或總體率)的估計,而應該考慮抽樣誤差的存在,借助抽樣分布對總體均數(shù)(或總體率)做出估計。一、均數(shù)的抽樣誤差由個體變異產(chǎn)生的,隨機抽樣引起的樣本統(tǒng)計量與總體參數(shù)之間的差異稱為抽樣誤差。在抽樣研究中,抽樣誤差是不可避免的。二、樣本均數(shù)的分布及標準誤樣本均數(shù)的分布:服從正態(tài)分布,樣本均數(shù)大部分分布在總體均數(shù)的左右,中間多,兩邊少,左右基本對稱。標準誤樣本均數(shù)的變異程度用樣本均數(shù)的標準差來描述,樣本均數(shù)的標準差稱為均數(shù)的標準誤,簡稱為標準誤,符號。說明個樣本均數(shù)圍繞總體均數(shù)的離散程度,可用來反映樣本均數(shù)的抽樣誤差的大小。在抽樣研究

2、中,總體標準差常常未知,一般用樣本標準差作為總體標準差的估計值。理論公式: 實際公式:注:越大,樣本均數(shù)分布越分散,樣本均數(shù)與總體均數(shù)的差別越大,抽樣誤差越大,由樣本均數(shù)估計總體均數(shù)的可靠性越小。越小,樣本均數(shù)分布越集中,樣本均數(shù)與總體均數(shù)的差別越小,抽樣誤差越小,由樣本均數(shù)估計總體均數(shù)的可靠性越大。 標準差與標準誤的區(qū)別:標準差表示個體差異的大??;標準誤描述樣本均數(shù)的變異程度,說明抽樣誤差的大小。標準差描述資料的頻數(shù)分布狀況,可用于制定醫(yī)學參考值范圍;而標準誤用于總體均數(shù)的區(qū)間估計和假設檢驗。以樣本含量n從正態(tài)總體n(,)或偏態(tài)總體隨機抽樣,樣本均數(shù)仍服從或者近似正態(tài)分布n(,)。標準誤的大

3、小與標準差成正比,與樣本含量n的平方根成反比。在實際工作中,可通過適當增加樣本含量來減小抽樣誤差。三、t分布 根據(jù)數(shù)理統(tǒng)計和中心極限定理:從均數(shù)為,標準差為的正態(tài)總體中,隨機抽取例數(shù)為n的樣本,樣本均數(shù)均服從均數(shù)為,標準差為的正態(tài)分布;即使從均數(shù)為,標準差為的偏態(tài)總體中隨機抽樣,當樣本含量足夠大時,樣本均數(shù)的分布逐漸逼近于均數(shù)為,標準差為的正態(tài)分布。已知樣本均數(shù)服從正態(tài)分布,對正態(tài)變量實施z變換,使得正態(tài)分布n(,)變換為標準正態(tài)分布n(0,1)。實際工作中,總體標準差常常未知,一般用樣本標準差作為總體標準差的估計值,此時對樣本均數(shù)進行的不再是z變換而是t變換。理論證明該統(tǒng)計量服從自由度為n-

4、1的t分布。t= =n-1t分布曲線與分布的特征如右圖,t分布的特征有:單峰分布,在t=0處最高,且以0為中心左右對稱。不同自由度對應不同的t分布,t分布曲線是一簇曲線。越小,t值越分散,曲線越平闊,尾部越高;隨著增大, t值越集中,曲線越尖峭,尾部越低。趨于時,t分布逼近標準正態(tài)分布(z分布)?!菊f明】t分布的極限分布為z分布。t分布不是一條曲線,是一簇曲線,不同曲線下面積的分布是不同的,相同面積可對應不同t界值,相同t界值可對應不同面積。 t分布中,無論自由度為多少時,t分布曲線下的面積都為1。t界值表統(tǒng)計學家將t分布曲線下的尾部面積(即概率p)與橫軸t值間的關系編制了不同自由度下的t界值

5、表(參見教材附表4)。 t界值表:橫標目為自由度,縱標目為概率p。 t界值:表中數(shù)字表示當和p 確定時,單側(cè)或雙側(cè)尾部面積p對應的t界值。 若p等于某預指定的,則: 單側(cè)尾端概率 (one-tailed probability)的t界值,即單側(cè)尾部面積p對應的t界值用t,表示。 雙側(cè)尾端概率 (two-tailed probability)的t界值,即兩側(cè)尾部面積p對應的t界值用t/2,表示。t分布規(guī)律 單側(cè):p(t-t,)=或p(tt,)=。 雙側(cè):p(t-t/2,)p(tt/2,)=,則圖中非陰影部分面積的概率為p(-t/2,tt/2,)=1-從t界值表可以看出:自由度相同時,t界值越大其

6、對應的p值越小,反之亦然。概率p(或尾部面積)相等時,越大,t界值越小。t界值相等時,雙側(cè)概率為單側(cè)概率的兩倍。=時,t界值即為z界值。例如,t0.05/2,=z0.05/2=1.96四、總體均數(shù)的估計統(tǒng)計推斷的內(nèi)容:參數(shù)估計(包括點估計與區(qū)間估計)和假設檢驗。參數(shù)估計:指用樣本指標(統(tǒng)計量)估計總體指標(參數(shù))。點估計方法:將樣本統(tǒng)計量直接作為總體參數(shù)的估計值。缺點:未考慮抽樣誤差的影響,估計的正確程度很難評價。區(qū)間估計方法:按事先給定的概率(1-),估計包含未知總體參數(shù)的一個可能范圍,該范圍稱為參數(shù)的可信區(qū)間或置信區(qū)間(ci)。 (1-):可信度或置信度,也可表示為100(1-)%,常取9

7、5% 可信區(qū)間通常由兩個可信限或置信限表示,較小者稱為下限(l),較大者稱為上限(u)??傮w均數(shù)可信區(qū)間的計算z分布法已知時,則z=服從標準正態(tài)分布n(0,1),此時p(-z/2zz/2)=1-,代入z通過推導可得:總體均數(shù)雙側(cè)可信區(qū)間為:(,)或簡寫為 單側(cè)可信區(qū)間為: 或未知時,但n足夠大(n50)時,接近,t分布逼近z分布,則總體均數(shù)雙側(cè)可信區(qū)間為:(,)或簡寫為 單側(cè)可信區(qū)間為: 或t分布法未知時,t=服從自由度為n-1的t分布,此時p(-t/2,tt/2,)=1-,代入t通過推導可得:總體均數(shù)雙側(cè)可信區(qū)間為:(,)或簡寫為 單側(cè)可信區(qū)間為: 或【說明】當未知時,無論n是否足夠大,可信

8、區(qū)間均可采用t分布法計算,采用t界值計算的可信區(qū)間更加確切??傮w均數(shù)的95%可信區(qū)間的含義 在實際研究中,一次抽樣可得一個可信區(qū)間,有95%可能包括總體均數(shù)??傮w均數(shù)的95%可信區(qū)間既可信又精密。五、二項分布對于n次獨立的試驗,如果每次試驗結果出現(xiàn)且只出現(xiàn)對立事件a與之一,在每次試驗中出現(xiàn)a的概率是常數(shù)(01),因而出現(xiàn)對立事件的概率是1-,則稱這一串重復的獨立試驗為n重貝努力試驗,簡稱bernolli試驗。bernolli試驗條件:每次試驗只有兩種互斥的結果;在相同條件下獨立重復n次試驗,所謂“獨立”即各次實驗結果互不影響;每次試驗中a發(fā)生的概率都相同,各次試驗條件相同。二項分布的概念一般地

9、,在一個n重貝努力試驗中,令x表示時間a發(fā)生的次數(shù),則隨機變量x所有可能的取值為0,1,2, ,n,且其概率函數(shù)為p(x=k)= k=0,1,2, ,n 稱隨機變量x服從參數(shù)為n和的二項分布,記為xb(n,)。二項分布的概率 二項分布是一種離散型概率分布。二項分布的概率之和等于1,即=+(1-)n=1單側(cè)累積概率: 至多m例陽性:p(xm) 至少m例陽性:p(xm)=1-p(xm-1)二項分布的均數(shù)與標準差設xb(n,),則有陽性結果發(fā)生數(shù)x的總體均數(shù)=n;總體方差 總體標準差根據(jù)中心極限定理,在n較大,n與n(1-)較接近時,二項分布接近于正態(tài)分布;當n時,二項分布b(n,)的極限分布是總體

10、均數(shù)位n,總體方差為n(1-)的正態(tài)分布nn,n(1-)。六、poisson分布poisson分布的概念若隨機變量x的可能取值為0,1,2,其概率分布為p(x=k)= ,k=0,1,2,;則稱x服從參數(shù)為的poisson分布,記為x()。k為觀察單位中某稀有時間發(fā)生的次數(shù);0,為某一常數(shù);e=2.7182是自然對數(shù)的底數(shù)。poisson分布的應用泊松分布是一種重要的離散型概率分布,用于描述在單位時間或空間內(nèi)隨機事件發(fā)生的次數(shù)。特點:罕見事件(發(fā)生概率很?。┒^察例數(shù)n很大的二項分布,可將較難計算的二項分布轉(zhuǎn)換為泊松分布去處理。為泊松分布所依賴的唯一參數(shù),表示單位時間(或單位面積、單位空間)內(nèi)某

11、隨機事件平均發(fā)生數(shù),即總體均數(shù)。poisson分布的圖形=n值越小,分布越不對稱,隨的增大,poisson分布趨于對稱。注:當=20時,泊松分布接近于正態(tài)分布,在實際工作中,當20時,就可以用正態(tài)分布來近似地處理泊松分布的問題。poisson分布的特征總體均數(shù)與總體方差相等??杉有裕簃個互相獨立的隨機變量x1,x2,xm分別服從1,2,m的泊松分布,則其和x1+x2+xm也服從均數(shù)為1+2+m的泊松分布。 可加性的應用:將若干個相互獨立的小觀察單位合并成一個大的觀察單位,從而使均數(shù)20,以便將服從泊松分布的資料按正態(tài)分布近似處理。七、總體率的估計抽樣資料計算樣本率不能直接代替總體率,而應該對總體率進行估計。率的抽樣誤差與標準誤由于抽樣引起的樣本率與總體率的差異稱為率的抽樣誤差。率的抽樣誤差亦可以用率的標準誤p來度量。當總體率未知時,以樣本率p作為的估計值。p=(n為樣本含量) sp=總體率的估計根據(jù)樣本率也可以對總體率做出點估計和區(qū)間估計。利用樣本資料估計二項分布總體率的1-的可信區(qū)間,一般取0.05或0.01。對于n50,且p接近于0或1時,可直接查表法得到總體率的1-的可信區(qū)間。(附表5)注:附表5中僅列出xn/2的部分,當xn/2時,可以用n-x查表,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論