總體均數(shù)與總體率_第1頁
總體均數(shù)與總體率_第2頁
總體均數(shù)與總體率_第3頁
總體均數(shù)與總體率_第4頁
總體均數(shù)與總體率_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于總體均數(shù)和總體率第一張,PPT共六十二頁,創(chuàng)作于2022年6月第一節(jié) 均數(shù)抽樣誤差與t分布欲了解總體的特征,最直接的方法是對總體中的每個觀察單位進行測量,通過整理分析得到總體參數(shù),但這在醫(yī)學(xué)研究實際中往往是不可能實現(xiàn)的。通常應(yīng)用抽樣研究,通過樣本指標(biāo)來了解總體特征。第二張,PPT共六十二頁,創(chuàng)作于2022年6月抽樣研究所得樣本均數(shù)會不會恰好等于未知的總體均數(shù)呢?如果固定樣本含量n從同一總體中進行多次抽樣,所得樣本均數(shù)又會如何呢?第三張,PPT共六十二頁,創(chuàng)作于2022年6月假設(shè)已知某地30歲-40歲正常男性血清總膽固醇的均值為5.0mmol/L,標(biāo)準(zhǔn)差為0.6mmol/L?,F(xiàn)從該總體中進行

2、隨機抽樣,每次抽取30名正常男子,并測得他們的血清總膽固醇水平,最終共抽取100份樣本,并計算出每份樣本的均數(shù)。第四張,PPT共六十二頁,創(chuàng)作于2022年6月第五張,PPT共六十二頁,創(chuàng)作于2022年6月由個體變異產(chǎn)生的,隨機抽樣引起的樣本統(tǒng)計量與總體參數(shù)之間的差異稱為抽樣誤差(sampling error)。抽樣造成的樣本均數(shù)與總體均數(shù)間的差異就稱為均數(shù)的抽樣誤差。在抽樣研究中,抽樣誤差是不可避免的,但抽樣誤差分布具有一定的規(guī)律性。第六張,PPT共六十二頁,創(chuàng)作于2022年6月圖3-1 從正態(tài)分布總體N(5.0, 0.62)中隨機抽樣所得樣本均數(shù)的分布第七張,PPT共六十二頁,創(chuàng)作于2022

3、年6月樣本均數(shù)大部分分布在總體均數(shù)5.0的左右,中間多、兩邊少,左右基本對稱,服從正態(tài)分布,并且樣本均數(shù)的變異范圍比原變量的變異范圍要小很多。第八張,PPT共六十二頁,創(chuàng)作于2022年6月樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤,簡稱標(biāo)準(zhǔn)誤,用符號 表示。均數(shù)的標(biāo)準(zhǔn)誤說明各樣本均數(shù) 圍繞總體均數(shù) 的離散程度,可用來反映樣本均數(shù)的抽樣誤差大小。第九張,PPT共六十二頁,創(chuàng)作于2022年6月中心極限定理從正態(tài)總體 N (, 2) 中,隨機抽取例數(shù)為 n 的樣本,樣本均數(shù)也服從正態(tài)分布;即使從偏態(tài)總體隨機抽樣,當(dāng) n 足夠大時(n 50),樣本均數(shù)近似正態(tài)分布。第十張,PPT共六十二頁,創(chuàng)作于2022年6月

4、從均數(shù)為,標(biāo)準(zhǔn)差為 的正態(tài)或偏態(tài)總體中,抽取例數(shù)為 n 的樣本,樣本均數(shù)的總體均數(shù)也為 ,標(biāo)準(zhǔn)差與原標(biāo)準(zhǔn)差成正比,與樣本例數(shù)的平方根成反比。第十一張,PPT共六十二頁,創(chuàng)作于2022年6月第十二張,PPT共六十二頁,創(chuàng)作于2022年6月 越大,樣本均數(shù)的分布越分散,樣本均數(shù)與總體均數(shù)的差別越大,抽樣誤差越大,由樣本均數(shù)估計總體均數(shù)的可靠性越小。反之, 越小,樣本均數(shù)的分布越集中,樣本均數(shù)與總體均數(shù)的差別越小,抽樣誤差越小,由樣本均數(shù)估計總體均數(shù)的可靠性越大。第十三張,PPT共六十二頁,創(chuàng)作于2022年6月 的大小與 成正比,與 成反比。當(dāng)固定不變時,樣本含量n增大, 減小。因此,在實際工作中,

5、可通過適當(dāng)增加樣本含量來減小抽樣誤差。第十四張,PPT共六十二頁,創(chuàng)作于2022年6月 常未知,用 S 估計,因此均數(shù)標(biāo)準(zhǔn)誤的估計值為第十五張,PPT共六十二頁,創(chuàng)作于2022年6月t 分布的演化第十六張,PPT共六十二頁,創(chuàng)作于2022年6月 常未知,若用 ,這時對樣本均數(shù)進行的不是 Z變換而是 t 變換 統(tǒng)計量 t 不再服從N(0,1)標(biāo)準(zhǔn)正態(tài)分布第十七張,PPT共六十二頁,創(chuàng)作于2022年6月英國統(tǒng)計學(xué)家 W. S. Gosset 于1908年以 “Student” 筆名發(fā)表論文,證明統(tǒng)計量 t 服從v = n-1的t分布第十八張,PPT共六十二頁,創(chuàng)作于2022年6月又稱為Studen

6、t t分布 (Students t-distribution)第十九張,PPT共六十二頁,創(chuàng)作于2022年6月t 分布的圖形及特征第二十張,PPT共六十二頁,創(chuàng)作于2022年6月t 分布的特征為: 以0為中心,左右對稱的單峰分布 越小,t值越分散,峰越矮,尾越高 增大,t分布逐漸逼近Z分布, 時,t分布即為Z分布第二十一張,PPT共六十二頁,創(chuàng)作于2022年6月t 界值表橫標(biāo)目:自由度縱標(biāo)目:概率 P (曲線下面積) 表中數(shù)字:自由度為 ,概率P 為時,所對應(yīng)的 t 界值,記為t, 第二十二張,PPT共六十二頁,創(chuàng)作于2022年6月單側(cè): 或雙側(cè): 即第二十三張,PPT共六十二頁,創(chuàng)作于202

7、2年6月在相同自由度時,t 的絕對值越大,P 越小在相同 P 值時,自由度越大所對應(yīng)的 t 界值越小在相同 t 值時,雙側(cè)概率 P 為單側(cè)概率 P 的兩倍 時,t界值即為Z界值第二十四張,PPT共六十二頁,創(chuàng)作于2022年6月第二節(jié) 總體均數(shù)的點估計與區(qū)間估計點估計(point estimation):將樣本統(tǒng)計量直接作為總體參數(shù)的估計值區(qū)間估計(interval estimation):按事先給定的概率 ,估計包含未知總體參數(shù)的一個可能范圍第二十五張,PPT共六十二頁,創(chuàng)作于2022年6月區(qū)間估計的實質(zhì)假設(shè)某個總體的均數(shù)為,需要找到兩個量A和B,使得在一個比較高的可信度下 (如95%),區(qū)間

8、(A, B)能包含 。即P(A 50)第三十張,PPT共六十二頁,創(chuàng)作于2022年6月 例6-3中,因n=120 , , ,試求該地正常成年男性 血清膽固醇平均水平的95可信區(qū)間。 即(3.55,4.17)mmol/L 第三十一張,PPT共六十二頁,創(chuàng)作于2022年6月例6-1 從某地隨機抽取120名30歲-40歲正常男性,得其血清總膽固醇水平的均數(shù)為4.95mmol/L,標(biāo)準(zhǔn)差為0.64mmol/L,試估計該地30歲-40歲正常男性血清總膽固醇平均水平的95%可信區(qū)間。第三十二張,PPT共六十二頁,創(chuàng)作于2022年6月因n=120,屬于未知但n足夠大,又均數(shù)為4.95mmol/L,標(biāo)準(zhǔn)差為0

9、.64mmol/L ,故該地30歲-40歲正常男性血清總膽固醇平均水平的95%可信區(qū)間為 即(4.84,5.06)mmol/L第三十三張,PPT共六十二頁,創(chuàng)作于2022年6月當(dāng)未知n 較小-t/2, v 0 t/2, v 第三十四張,PPT共六十二頁,創(chuàng)作于2022年6月可信區(qū)間的涵義從總體中作隨機抽樣,每個樣本可以算得一個可信區(qū)間。如95%可信區(qū)間意味著做100次抽樣,算得100個可信區(qū)間,平均有95個估計正確。在實際研究中,一般只進行一次抽樣,算得一個可信區(qū)間,對于這個可信區(qū)間來說,我們就認(rèn)為該區(qū)間包含了總體均數(shù) ,把握度為95%。第三十五張,PPT共六十二頁,創(chuàng)作于2022年6月圖6-

10、5 從N(0, 1)中隨機抽樣算得的100個95可信區(qū)間(n=10)第三十六張,PPT共六十二頁,創(chuàng)作于2022年6月可信區(qū)間的兩個要素可信度:可靠性,即1-。一般取90%、95,可人為控制區(qū)間的寬度:區(qū)間的大小(區(qū)間的長度),越小越好必須二者兼顧第三十七張,PPT共六十二頁,創(chuàng)作于2022年6月均數(shù)的可信區(qū)間與參考值范圍的區(qū)別第三十八張,PPT共六十二頁,創(chuàng)作于2022年6月第三節(jié) 總體率的點估計與區(qū)間估計第三十九張,PPT共六十二頁,創(chuàng)作于2022年6月一、二項分布如某實驗中小白鼠染毒后死亡概率P為0.8,則生存概率為=1-P=0.2,1、對一只小白鼠進行實驗的結(jié)果為:死(概率為P)或生(

11、概率為1-P)2、對二只小白鼠(甲乙)進行實驗的結(jié)果為:甲乙均死(概率為P2)、甲死乙生概率為P(1-P)、乙死甲生概率為(1-P)P或甲乙均生概率為(1-P)2,概率相加得P2+P(1-P)+(1-P)P+(1-P)2=P+(1-P)23、依此類推,對n只小白鼠進行實驗,所有可能結(jié)果的概率相加得Pn+cn1P(1-P)n-1+.+cnxPx(1-P)n-x+.+(1-P)x=P+(1-P)n 其中n為樣本含量,即事件發(fā)生總數(shù),x為某事件出現(xiàn)次數(shù),cnxPx(1-P)n-x為二項式通式,cnx=n!/x!(n-x)!, P為總體率。 因此,二項分布是說明結(jié)果只有兩種情況的n次實驗中發(fā)生某種結(jié)果

12、為x次的概率分布。其概率密度為:P(x)=cnxPx(1-P)n-x, x=0,1,.n。:第四十張,PPT共六十二頁,創(chuàng)作于2022年6月二項分布的圖形第四十一張,PPT共六十二頁,創(chuàng)作于2022年6月當(dāng)=0.5時,分布對稱;當(dāng) 0.5,分布呈偏態(tài);當(dāng)0.5時分布呈負(fù)偏態(tài);特別是當(dāng)n值不是很大時,偏離0.5愈遠(yuǎn),分布愈偏第四十二張,PPT共六十二頁,創(chuàng)作于2022年6月隨著n的增大,二項分布逐漸逼近正態(tài)分布。如 =0.30,n=5和n=10時,圖形呈偏態(tài),當(dāng)n=30時,圖形已接近正態(tài)分布。一般地說,如果n或n(1-)大于5時,??捎谜龖B(tài)近似原理處理二項分布問題第四十三張,PPT共六十二頁,創(chuàng)

13、作于2022年6月二項分布的性質(zhì) :累積概率(1)二項分布的概率之和等于1第四十四張,PPT共六十二頁,創(chuàng)作于2022年6月(2)單側(cè)累積概率至多有m例陽性的概率(下側(cè)累積概率)至少有m例陽性的概率(上側(cè)累積概率)第四十五張,PPT共六十二頁,創(chuàng)作于2022年6月二項分布的性質(zhì) :均數(shù)和方差陽性結(jié)果發(fā)生數(shù)X的總體均數(shù)總體方差總體標(biāo)準(zhǔn)差第四十六張,PPT共六十二頁,創(chuàng)作于2022年6月二項分布的抽樣分布及其性質(zhì)二項分布的隨機抽樣性質(zhì)仍然被中心極限定理所反映在n足夠大時,樣本率近似服從正態(tài)分布樣本率p的均數(shù)等于樣本率p的標(biāo)準(zhǔn)差(率的標(biāo)準(zhǔn)誤)第四十七張,PPT共六十二頁,創(chuàng)作于2022年6月二、Po

14、isson 分布當(dāng)二項分布中n很大,p很小時,二項分布就變?yōu)镻oisson分布,Poisson分布實際上是二項分布的極限分布法國數(shù)學(xué)家Simeon Denis Poisson (1781-1840) 1837年在關(guān)于判斷的概率之研究一文中提出的描述隨機現(xiàn)象的一種常用分布 第四十八張,PPT共六十二頁,創(chuàng)作于2022年6月Poisson分布也是一種重要的離散型概率分布,用于研究單位時間、單位人群、單位空間內(nèi),某稀有事件發(fā)生次數(shù)的分布單位體積水中細(xì)菌數(shù)單位體積空氣中粉塵數(shù)單位時間內(nèi)放射性物質(zhì)放射出的質(zhì)點數(shù)單位空間中某些昆蟲數(shù)一定人群中惡性腫瘤或罕見非傳染性疾病患病數(shù)或死亡數(shù)第四十九張,PPT共六十

15、二頁,創(chuàng)作于2022年6月可以認(rèn)為滿足以下三個條件的隨機變量服從Poisson分布:平穩(wěn)性:X的取值與觀察單位的位置無關(guān),只與觀察單位的大小有關(guān)獨立性:在某個觀察單位上X的取值與前面各觀察單位上X的取值獨立(無關(guān))普通性:在充分小的觀察單位上X的取值最多為1第五十張,PPT共六十二頁,創(chuàng)作于2022年6月Poisson分布的概率函數(shù)若隨機變量的概率函數(shù)為:則稱此變量服從Poisson分布,記為第五十一張,PPT共六十二頁,創(chuàng)作于2022年6月Poisson分布的累計概率第五十二張,PPT共六十二頁,創(chuàng)作于2022年6月Poisson分布的圖形第五十三張,PPT共六十二頁,創(chuàng)作于2022年6月P

16、oisson分布的性質(zhì) 均數(shù)和方差Poisson分布的均數(shù)和方差相等,均為 ;即第五十四張,PPT共六十二頁,創(chuàng)作于2022年6月Poisson分布中均數(shù)的抽樣分布及其性質(zhì)在足夠大時,Poisson分布的平均計數(shù)近似正態(tài)分布平均計數(shù)的標(biāo)準(zhǔn)誤n=1時(1個單位),第五十五張,PPT共六十二頁,創(chuàng)作于2022年6月三、總體率的估計根據(jù)樣本率,也可以對總體率做出點估計和區(qū)間估計。我們用樣本率p作為總體率的點估計值??傮w率的點估計亦未考慮其抽樣誤差大小,而總體率的區(qū)間估計克服了點估計的缺陷。第五十六張,PPT共六十二頁,創(chuàng)作于2022年6月利用樣本資料可估計二項分布總體率的1- 可信區(qū)間, 取0.05

17、或0.01。對于 ,且 接近于0或1時,可直接查表得到總體率的(1-)可信區(qū)間。第五十七張,PPT共六十二頁,創(chuàng)作于2022年6月例6-6 某醫(yī)院應(yīng)用氨芐青霉素治療呼吸道感染,45例患者中有2例發(fā)生過敏反應(yīng)。試估計過敏反應(yīng)發(fā)生率的95%可信區(qū)間。p70對例6-6資料,查百分率的可信區(qū)間表,n=45 的行與X=2 的列交叉處的數(shù)值為1-15, 即氨芐青霉素過敏反應(yīng)發(fā)生率的95%可信區(qū)間為(1%,15%)。第五十八張,PPT共六十二頁,創(chuàng)作于2022年6月當(dāng)n足夠大,且p和1-p 均不太小,如np和n(1-p)均大于5時, 的抽樣分布逼近正態(tài)分布。此時,可根據(jù)正態(tài)分布的特性計算總體率的可信區(qū)間。第五十九張,PPT共六十二頁,創(chuàng)作于2022年6月例6-7 為了解某地18歲以上城市居民的高血壓患病率,從社區(qū)中隨機抽取500人進行調(diào)查,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論