正態(tài)分布參考值抽樣誤差課件_第1頁
正態(tài)分布參考值抽樣誤差課件_第2頁
正態(tài)分布參考值抽樣誤差課件_第3頁
正態(tài)分布參考值抽樣誤差課件_第4頁
正態(tài)分布參考值抽樣誤差課件_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Normal distribution,1,PPT學(xué)習(xí)交流,例 某地用隨機抽樣方法檢查了140名成年男子的紅細(xì)胞數(shù),檢測結(jié)果如表21,正態(tài)分布和醫(yī)學(xué)參考值范圍,2,PPT學(xué)習(xí)交流,某地140名正常男子紅細(xì)胞數(shù)頻數(shù)表,3,PPT學(xué)習(xí)交流,直方圖,4,PPT學(xué)習(xí)交流,f(x)=(fi/n),以頻率為縱坐標(biāo),5,PPT學(xué)習(xí)交流,隨著組段不斷分細(xì)和觀察人數(shù)的增多,直條頂端將逐漸接近于一條光滑的曲線,如下圖。這條曲線稱為頻率密度曲線,呈中間高、兩邊低、左右對稱,形狀似座鐘。類似于數(shù)學(xué)上的正態(tài)分布曲線。 因為頻率的總和等于1,故橫軸上曲線下的面積等于1。,頻率密度 f(x)=(fi/n)/i,(i0.1)

2、,6,PPT學(xué)習(xí)交流,7,PPT學(xué)習(xí)交流,這條所描述的分布,便近似于我們通常所說的正態(tài)概率分布,簡稱正態(tài)分布。,正態(tài)分布是自然界最常見的一種分布,例如,測量的誤差、人體的身高、體重、許多生化指標(biāo)的值(例如血壓、血紅蛋白含量、紅細(xì)胞數(shù)等等)等都屬于正態(tài)分布或近似正態(tài)分布。還有些偏態(tài)資料可經(jīng)數(shù)據(jù)轉(zhuǎn)換成正態(tài)或近似正態(tài)分布,例如抗體滴度、血鉛值等。,8,PPT學(xué)習(xí)交流,一、正態(tài)分布的密度函數(shù),式中為總體均數(shù),為總體標(biāo)準(zhǔn)差,為圓周率,e為自然對數(shù)的底,x為變量,當(dāng)、已知,以x為橫軸,f(x)為縱軸,即可給出正態(tài)分布曲線的圖形。,9,PPT學(xué)習(xí)交流,二、 正態(tài)分布的特征 1.正態(tài)分布在橫軸上方,均數(shù)處最高

3、,以均數(shù)為中心,左右對稱。 2.正態(tài)分布的X取值范圍理論上沒有邊界,X離越遠(yuǎn),f(X)值越接近0,但不會等于0。 3.正態(tài)分布曲線下的面積分布有一定的規(guī)律。,所有的正態(tài)分布曲線,在左右任意個標(biāo)準(zhǔn)差范圍內(nèi)面積相同。,10,PPT學(xué)習(xí)交流,4.正態(tài)分布完全由兩個參數(shù)即均數(shù)與標(biāo)準(zhǔn)差決定,其中是位置參數(shù),是變異參數(shù)。常用N(,2 )來表示。,11,PPT學(xué)習(xí)交流,0、1的標(biāo)準(zhǔn)正態(tài)分布,12,PPT學(xué)習(xí)交流,標(biāo)準(zhǔn)正態(tài)分布曲線及其面積分布,13,PPT學(xué)習(xí)交流,三、正態(tài)分布的應(yīng)用 不少醫(yī)學(xué)現(xiàn)象服從正態(tài)分布或近似正態(tài)分布 確定醫(yī)學(xué)參考值范圍 質(zhì)量控制圖 正態(tài)分布是很多統(tǒng)計方法的理論基礎(chǔ),14,PPT學(xué)習(xí)交流

4、,醫(yī)學(xué)參考值范圍的估計,1. 醫(yī)學(xué)參考值范圍的概念 指特定的“正常”人群的解剖、生理、生化指標(biāo)及組織代謝產(chǎn)物含量等數(shù)據(jù)中大多數(shù)個體的取值所在的范圍。 2. 醫(yī)學(xué)參考值范圍的確定要求 確定研究總體,例如 “正常人”。 選擇足夠數(shù)量的觀察對象。 統(tǒng)一測定方法,控制實驗誤差,保證數(shù)據(jù)的可靠性。 決定取單側(cè)范圍還是雙側(cè)范圍值 選擇恰當(dāng)?shù)陌俜址秶?15,PPT學(xué)習(xí)交流,醫(yī)學(xué)參考值范圍的估計,3. 醫(yī)學(xué)參考值范圍的計算方法,正態(tài)分布法 百分位數(shù)法,16,PPT學(xué)習(xí)交流,正態(tài)分布法 適用于正態(tài)或近似分布資料,式中 為均數(shù),s為標(biāo)準(zhǔn)差,u值可根據(jù)要求查表。,公式為:,17,PPT學(xué)習(xí)交流,常用的u界值,18,

5、PPT學(xué)習(xí)交流,19,PPT學(xué)習(xí)交流,例,某地調(diào)查正常成年男子144人的紅細(xì)胞數(shù)近似正態(tài)分布,得均數(shù)為5.38(1012/L),標(biāo)準(zhǔn)差為0.44(1012/L),試估計該地成年男子紅細(xì)胞數(shù)的95%參考值范圍。,20,PPT學(xué)習(xí)交流,百分位數(shù)法: 適用于偏態(tài)分布資料,例如白細(xì)胞數(shù)的95參考值范圍:因為白細(xì)胞數(shù)無論過高或過低均屬異常,則分別計算P2.5和P97.5,這是雙側(cè)95參考值范圍。,21,PPT學(xué)習(xí)交流,例 某年某市調(diào)查了200例正常成人血鉛含量(g/100g)如下,試估計該市成人血鉛含量95醫(yī)學(xué)參考值范圍(用百分位數(shù)法計算)。,22,PPT學(xué)習(xí)交流,23,PPT學(xué)習(xí)交流,練習(xí)1: 調(diào)查某

6、地120名健康女性血紅蛋白,直方圖顯示,其分布近似于正態(tài)分布,其血紅蛋白平均值為117.4(g/L),標(biāo)準(zhǔn)差為10.2 (g/L),試估計該地健康女性血紅蛋白的95醫(yī)學(xué)參考值范圍。,血紅蛋白過高、過低均為異常,應(yīng)按雙側(cè)計算:,24,PPT學(xué)習(xí)交流,一、均數(shù)的抽樣分布與抽樣誤差,抽樣研究的目的就是要用樣本信息來推斷總體特征。由于存在個體變異,樣本均數(shù)(X)往往不等于總體均數(shù)(),因此抽樣后各個樣本均數(shù)也往往不等于總體均數(shù),且各個樣本均數(shù)間也不一定都相等。這種由抽樣造成的樣本均數(shù)與總體均數(shù)的差異或各樣本均數(shù)之間的差異稱為抽樣誤差,抽樣誤差是不可避免的。,數(shù)值變量的參數(shù)估計,25,PPT學(xué)習(xí)交流,2

7、6,PPT學(xué)習(xí)交流,27,PPT學(xué)習(xí)交流,110名20歲健康男大學(xué)生的身高均數(shù)為172.73cm。,28,PPT學(xué)習(xí)交流,已知f110,fX19000,需要在該表中增加fx2欄,由第(3)、(4)欄相乘,再將該欄數(shù)據(jù)相加,將fX2代入公式,29,PPT學(xué)習(xí)交流,110名20歲男大學(xué)生的平均身高X172.73cm,標(biāo)準(zhǔn)差s4.09cm。,假設(shè)該110個身高數(shù)值作為假設(shè)的有限總體,即: 172.73cm, 4.09cm,現(xiàn)在從該總體中隨機抽10個學(xué)生身高為1號樣本。,計算得: X1=173.22cm s1=4.05cm,30,PPT學(xué)習(xí)交流,重復(fù)100次剛才的抽樣,得到100個樣本(每個樣本含量均

8、為10個),可算得100個樣本均數(shù)X。,31,PPT學(xué)習(xí)交流,各樣本均數(shù)的均數(shù)X172.66 cm,172.73cm,32,PPT學(xué)習(xí)交流,樣本均數(shù)的抽樣分布具有以下特點: 各樣本均數(shù)未必等于總體均數(shù); 樣本均數(shù)之間存在差異; 樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù),中間多、兩邊少,左右基本對稱,也服從正態(tài)分布; 樣本均數(shù)的變異較之原變量的變異大大縮小。,33,PPT學(xué)習(xí)交流,總體均數(shù)為,標(biāo)準(zhǔn)差,樣本1( ,s),樣本2( ,s),樣本3( ,s),樣本m( ,s),抽樣,樣本量為n,34,PPT學(xué)習(xí)交流,根據(jù)正態(tài)分布原理,若隨機變量X服從正態(tài)分布,則樣本均數(shù)X也服從正態(tài)分布。,隨機變量 X:

9、N(, 2) 樣本均數(shù) :N(, ),35,PPT學(xué)習(xí)交流,均數(shù)的標(biāo)準(zhǔn)誤及計算 反映均數(shù)抽樣誤差大小的指標(biāo)是樣本均數(shù) X 的標(biāo)準(zhǔn)差簡稱標(biāo)準(zhǔn)誤(理論值),用 表示,或SE、SEM。 由于在實際抽樣研究中往往未知,通常用某一樣本標(biāo)準(zhǔn)差s來替代,得標(biāo)準(zhǔn)誤的估計值 (通常也簡稱為標(biāo)準(zhǔn)誤),其計算公式為:,36,PPT學(xué)習(xí)交流,以1號樣本 =173.22cm,s1=4.05cm為例:,均數(shù)的標(biāo)準(zhǔn)誤及計算,37,PPT學(xué)習(xí)交流,一般情況下未知,常用 估計抽樣誤差的大小,也即 的估計值。,例 2000年某研究者隨機調(diào)查某地健康成年男子27人,得到血紅蛋白量的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試估計該樣

10、本均數(shù)的抽樣誤差。,將X=125g/L,s= 15g/L,n=27代入,38,PPT學(xué)習(xí)交流,例:已知 s6.85, n100 則樣本均數(shù)的抽樣誤差 為多少?,39,PPT學(xué)習(xí)交流,標(biāo)準(zhǔn)誤的應(yīng)用 1.反映樣本均數(shù)的可靠性; 標(biāo)準(zhǔn)誤反映抽樣誤差的大小。標(biāo)準(zhǔn)誤大,表示抽樣誤差大,則樣本均數(shù)估計總體均數(shù)的可靠性差。反之,標(biāo)準(zhǔn)誤小,抽樣誤差小,樣本均數(shù)估計總體均數(shù)的可靠性好。 2.估計總體均數(shù)的可信區(qū)間; 3.用于均數(shù)的假設(shè)檢驗。,40,PPT學(xué)習(xí)交流,二、總體均數(shù)的可信區(qū)間估計,即用樣本指標(biāo)(統(tǒng)計量)估計總體指標(biāo)(參數(shù)) 有兩種常用方法: 點估計和區(qū)間估計 (一)點估計:樣本均數(shù)( )就是總體均數(shù)的

11、點估計值() 該法簡單,但未考慮抽樣誤差,而抽樣誤差在抽樣研究中是不可忽視的。,41,PPT學(xué)習(xí)交流,(二)區(qū)間估計: 結(jié)合樣本統(tǒng)計量和標(biāo)準(zhǔn)誤可以確定一個具有一定可信度的包含總體參數(shù)的區(qū)間,該區(qū)間稱為總體參數(shù)的1可信區(qū)間(confidence interval,CI),42,PPT學(xué)習(xí)交流,即按一定的概率估計未知總體均數(shù)的所在范圍。 習(xí)慣上用總體均數(shù)的95%(或99%)可信區(qū)間,表示該區(qū)間包含總體均數(shù)的概率為95%(或99%),用此范圍估計總體平均數(shù),表示100次抽樣中,有 95(99)次包含總體均數(shù)。,例如:總體均數(shù)的可信區(qū)間,43,PPT學(xué)習(xí)交流,(1)未知,但樣本例數(shù)n足夠大(如n 50

12、),總體均數(shù)的1雙側(cè)可信區(qū)間為,總體均數(shù)95%的雙側(cè)可信區(qū)間為:,總體均數(shù)可信區(qū)間的計算,總體均數(shù)99%的雙側(cè)可信區(qū)間為:,44,PPT學(xué)習(xí)交流,例 某市2000年隨機測量了90名19歲健康男大學(xué)生的身高,其均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm,試估計該市2000年19歲健康男大學(xué)生平均身高的95可信區(qū)間。,本例n90,可按正態(tài)分布近似法計算,故該市2000年19歲健康男大學(xué)生平均身高的95可信區(qū)間為(171.3,173.1)cm。,45,PPT學(xué)習(xí)交流,t 分 布,46,PPT學(xué)習(xí)交流,前面講過,通過u變換,可將正態(tài)分布N(, 2)轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布N(0,1)。同樣,若從正態(tài)分布N(,

13、 2)總體中隨機抽樣并算得多個樣本均數(shù) ,它們?nèi)苑目傮w均數(shù)為,總體標(biāo)準(zhǔn)差為 的正態(tài)分布 N(, ),則 服從,47,PPT學(xué)習(xí)交流,標(biāo)準(zhǔn)正態(tài)分布N(0,1)。在實際工作中,往往是未知,常用 替代 ,即,這時,對正態(tài)變量X采取的不是u變換而是t變換了,t值的分布稱為t分布。,48,PPT學(xué)習(xí)交流,49,PPT學(xué)習(xí)交流,1.單峰分布,以0為中心,左右對稱; 2.t分布是一簇曲線,其形態(tài)變化與自由度的大小有關(guān) n-1。越小, 與 的差別越大,t值越分散,曲線的峰部越矮,尾部越粗。越大,t分布越接近于標(biāo)準(zhǔn)正態(tài)分布。,t分布的特征:,50,PPT學(xué)習(xí)交流,自由度分別為1、5、的t分布,51,PPT學(xué)習(xí)

14、交流,由于t分布不是一條曲線,而是一簇曲線。因此,t分布曲線下面積的95%或99%界值不是一個常量,而是隨著自由度大小而變化的。為便于使用,可根據(jù)t界值表查找。,52,PPT學(xué)習(xí)交流,53,PPT學(xué)習(xí)交流,(2)未知,且n較小時,,總體均數(shù)可信區(qū)間的計算,或簡寫為:,54,PPT學(xué)習(xí)交流,df5時,,若“砍去”t分布雙側(cè)尾部面積0.055,則有95的t值滿足:,55,PPT學(xué)習(xí)交流,例 已知某地27名健康成年男子的血紅蛋白量的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試問該地健康成年男子的血紅蛋白平均含量的95可信區(qū)間和99可信區(qū)間各是多少?,將X=125g/L,s=15g/L,n=27代入 同時查t界值表:t0.05/2,26=2.056, t0.01/2,26=2.779,56,PPT學(xué)習(xí)交流,練習(xí)1 要減小抽樣誤差,最切實可行的方法是。 (1)增加樣本例數(shù) (2)控制個體變異 (3)遵循隨機化原則 (4)嚴(yán)格挑選觀察對象,57,PPT學(xué)習(xí)交流,練習(xí)2 某地調(diào)查正常成年男子14

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論