概率分布正態(tài)分布_第1頁
概率分布正態(tài)分布_第2頁
概率分布正態(tài)分布_第3頁
概率分布正態(tài)分布_第4頁
概率分布正態(tài)分布_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第五講 概率分布正態(tài)分布1.1 1.1 正態(tài)分布的概念和函數(shù)正態(tài)分布的概念和函數(shù)1.2 1.2 正態(tài)分布曲線的特征正態(tài)分布曲線的特征1.31.3 正態(tài)曲線的標化正態(tài)曲線的標化1.4 1.4 曲線下面積的分布規(guī)律曲線下面積的分布規(guī)律1. 1.5 5 正態(tài)分布在醫(yī)學中的應用正態(tài)分布在醫(yī)學中的應用正態(tài)分布及其應用【典型案例分析典型案例分析】舉例:舉例: 隨機調(diào)查某醫(yī)院隨機調(diào)查某醫(yī)院14021402例待分娩孕例待分娩孕婦,測得她們的體重,試述其體重頻數(shù)分婦,測得她們的體重,試述其體重頻數(shù)分布的特征。布的特征。引子:引子:表表5-1 某醫(yī)院某醫(yī)院1402例分娩孕婦體重頻數(shù)分布例分娩孕婦體重頻數(shù)分布 0.

2、000.020.040.060.0848-56-64-72-80-體重(kg)體重頻率密度 作圖作圖:以體重測量值為以體重測量值為橫軸橫軸,以頻率與組距的,以頻率與組距的比值為比值為縱軸縱軸作出直方圖。作出直方圖。1. 由于該直方圖的縱軸由于該直方圖的縱軸表示在每個組段內(nèi)單位表示在每個組段內(nèi)單位長度所占有的頻率,相長度所占有的頻率,相當于當于頻率密度頻率密度,因此將,因此將此圖稱為此圖稱為頻率密度圖頻率密度圖。 圖圖5-1 體重頻率密度圖體重頻率密度圖 2. 面積面積=頻率頻率由于頻率的總和為由于頻率的總和為1,所以該曲線下橫軸上所以該曲線下橫軸上的面積為的面積為1 。 .0.000.020.

3、040.060.0848-56-64-72-80-體重(kg)體重頻率密度若將各直條頂端的中點順次連接起來若將各直條頂端的中點順次連接起來,得一條折線。當樣得一條折線。當樣本量本量n越來越大時,折線就越來越接近一條光滑的曲線越來越大時,折線就越來越接近一條光滑的曲線。 圖5-1 體重頻率密度圖 圖5-2 概率密度曲線示意圖 推推 斷:斷:測得一個孕婦體重在測得一個孕婦體重在54-68kg54-68kg的概率有多大?的概率有多大?孕婦體重在哪個范圍內(nèi)算是正常的呢?孕婦體重在哪個范圍內(nèi)算是正常的呢?故對連續(xù)性隨機變量而言:故對連續(xù)性隨機變量而言:變量某區(qū)間取值的概率變量某區(qū)間取值的概率 = = 正

4、態(tài)曲線該變量區(qū)間的面正態(tài)曲線該變量區(qū)間的面積積密度 正態(tài)分布正態(tài)分布( normal distribution):是描述連續(xù)型:是描述連續(xù)型隨機變量最重要的分布。其分布曲線叫正態(tài)分布隨機變量最重要的分布。其分布曲線叫正態(tài)分布曲線,呈中間高,兩邊低,左右基本對稱的曲線,呈中間高,兩邊低,左右基本對稱的“鐘鐘型型”曲線,近似于數(shù)學上的正態(tài)分布,曲線,近似于數(shù)學上的正態(tài)分布,又稱高斯又稱高斯分布(分布(Gauss distribution)。正態(tài)分布正態(tài)分布( (normal distribution)德莫佛最早發(fā)現(xiàn)了二項概率德莫佛最早發(fā)現(xiàn)了二項概率的一個近似公式,這一公式被的一個近似公式,這一公式

5、被認為是正態(tài)分布的首次露面。認為是正態(tài)分布的首次露面。正態(tài)分布在十九世紀前葉由正態(tài)分布在十九世紀前葉由高斯加以推廣,所以通常稱為高斯加以推廣,所以通常稱為高斯分布高斯分布( (Gauss distribution)。德莫佛德莫佛高高 斯斯10馬克的錢幣馬克的錢幣 醫(yī)學研究中許多正常人的生理,生化指標、測醫(yī)學研究中許多正常人的生理,生化指標、測量誤差等多呈正態(tài)分布或近似正態(tài)分布。量誤差等多呈正態(tài)分布或近似正態(tài)分布。許多非正態(tài)分布資料,當樣本含量足夠大時,許多非正態(tài)分布資料,當樣本含量足夠大時,也可以用正態(tài)分布作為它的極限分布形式。也可以用正態(tài)分布作為它的極限分布形式。有時也可將非正態(tài)分布資料轉化

6、為正態(tài)分布來有時也可將非正態(tài)分布資料轉化為正態(tài)分布來處理。處理。正態(tài)分布在醫(yī)學研究中的重要作用:正態(tài)分布在醫(yī)學研究中的重要作用:醫(yī)學研究中:醫(yī)學研究中:正態(tài)分布的密度函數(shù)正態(tài)分布的密度函數(shù),即正態(tài)曲線的函數(shù)表達式:即正態(tài)曲線的函數(shù)表達式:XeXfX,21)(222/)( 式中,式中,為為總體均數(shù),總體均數(shù),為為總體標準差,總體標準差,為圓周率,為圓周率,e為為自然對數(shù)的底,僅自然對數(shù)的底,僅x為變量。為變量。 當當x確定后,確定后, f(x)為為X相應的縱坐標高度,則相應的縱坐標高度,則X服從參數(shù)服從參數(shù)為為和和2的正態(tài)分布(的正態(tài)分布( normal distribution),記作記作XN

7、( ,2 )。)。 XeXfX,21)(222/)(總體均數(shù)總體均數(shù)總體標準差總體標準差(一)正態(tài)分布的兩個參數(shù):(一)正態(tài)分布的兩個參數(shù): 和和 是正態(tài)分布的是正態(tài)分布的兩個參數(shù)兩個參數(shù), 和和決定了決定了x的概率分布;習慣上用的概率分布;習慣上用 N (, 2)表示均數(shù)為表示均數(shù)為 ,標,標準差為準差為的正態(tài)分布。的正態(tài)分布。 當給定不同的當給定不同的 x 值后,就可以根據(jù)此方程求得相應的值后,就可以根據(jù)此方程求得相應的縱坐標高度(頻數(shù)),并可繪制出正態(tài)曲線的圖形,記縱坐標高度(頻數(shù)),并可繪制出正態(tài)曲線的圖形,記作作XN(,2) :正態(tài)分布曲線正態(tài)分布曲線:高峰位于中間,兩側逐漸下降并完

8、全對:高峰位于中間,兩側逐漸下降并完全對稱,曲線兩端永遠不與橫軸相交的稱,曲線兩端永遠不與橫軸相交的“鐘型鐘型”曲線。曲線。當當固定不變時,固定不變時,越大,曲線沿橫軸越大,曲線沿橫軸越向右移動;反之,越向右移動;反之, 越小,則曲線沿橫軸越向左移越小,則曲線沿橫軸越向左移動,所以動,所以叫正態(tài)曲線叫正態(tài)曲線N(, 2)的)的位置參數(shù)位置參數(shù), 。1. 位置參數(shù):位置參數(shù): 圖圖5-4 正態(tài)分布位置隨參數(shù)正態(tài)分布位置隨參數(shù)變換示意圖變換示意圖=1=1.5=22. 形狀參數(shù)形狀參數(shù): 圖圖5-6 正態(tài)分布形態(tài)隨參數(shù)正態(tài)分布形態(tài)隨參數(shù)變換示意圖變換示意圖 當當固定不變時,固定不變時,越大,曲線越平

9、闊;越大,曲線越平闊; 越小,曲線越尖峭,越小,曲線越尖峭, 叫叫正態(tài)曲線正態(tài)曲線N(, 2)的)的形形狀參數(shù)狀參數(shù)。 (二)正態(tài)分布圖形的特征:(二)正態(tài)分布圖形的特征:1. 對稱性:關于對稱性:關于x=對稱對稱2. 集中性:集中性: 正態(tài)曲線在橫軸上方,正態(tài)曲線在橫軸上方, 當當x=時時, f (x)取最大值,即均數(shù)位于曲線的最高處。取最大值,即均數(shù)位于曲線的最高處。3. 對對頻率密度正態(tài)分布圖,橫軸上頻率密度正態(tài)分布圖,橫軸上曲線下的面積為曲線下的面積為1。4. 是正態(tài)曲線的位置參數(shù),決定曲線在橫軸上的位置;是正態(tài)曲線的位置參數(shù),決定曲線在橫軸上的位置; 增大曲線沿橫軸向右移,增大曲線沿

10、橫軸向右移, 減小曲線沿橫軸向左移。減小曲線沿橫軸向左移。5.是正態(tài)曲線的形狀參數(shù),是正態(tài)曲線的形狀參數(shù),越大數(shù)據(jù)越分散,曲線越越大數(shù)據(jù)越分散,曲線越“矮胖矮胖”,越小數(shù)據(jù)越集中,曲線越越小數(shù)據(jù)越集中,曲線越“瘦高瘦高” 。 為了應用方便,常將正態(tài)概率函數(shù)中的為了應用方便,常將正態(tài)概率函數(shù)中的 x 作如作如下變量代換,令:下變量代換,令: Z稱為標準正態(tài)變量。把稱為標準正態(tài)變量。把u代入概率密度函數(shù)代入概率密度函數(shù) ,得標準正態(tài)分布的概率密度函數(shù):得標準正態(tài)分布的概率密度函數(shù): 相對于正態(tài)變量相對于正態(tài)變量 x,Z 沒有度量單位。根據(jù)沒有度量單位。根據(jù) u 的不同取值,可繪出標準正態(tài)分布的圖形

11、。的不同取值,可繪出標準正態(tài)分布的圖形。xZueZu,21)2/j(2任意正態(tài)分布曲線任意正態(tài)分布曲線 XN(,2)標準正態(tài)分布曲線標準正態(tài)分布曲線XN(0,1) 將一般正態(tài)分布曲線的將一般正態(tài)分布曲線的 的位置平移到原點,再的位置平移到原點,再以標準差以標準差為橫軸單位,這樣就把原來個別的正態(tài)分布為橫軸單位,這樣就把原來個別的正態(tài)分布轉換為一般的標準正態(tài)分布轉換為一般的標準正態(tài)分布 N(0,1),亦稱為),亦稱為Z分布分布(或(或 分布分布)。)。 正態(tài)曲線下的面積分布有一定的規(guī)律性:正態(tài)曲線下的面積分布有一定的規(guī)律性: 因正態(tài)曲線下累計頻數(shù)的總和等于因正態(tài)曲線下累計頻數(shù)的總和等于 100%

12、 或或 1,則:,則:橫軸上曲線下的面積(概率)就等于橫軸上曲線下的面積(概率)就等于 100% 或或 1;均數(shù)兩側的面積(概率)各占均數(shù)兩側的面積(概率)各占 50%。實際工作中常需了解橫軸上某一區(qū)間曲線下面積占實際工作中常需了解橫軸上某一區(qū)間曲線下面積占總面積的百分比,以便估計該區(qū)間的頻數(shù)占總頻數(shù)的百總面積的百分比,以便估計該區(qū)間的頻數(shù)占總頻數(shù)的百分比(即頻數(shù)分布情況)。這就需要采用定積分的辦法,分比(即頻數(shù)分布情況)。這就需要采用定積分的辦法,對函數(shù)式對函數(shù)式 (1) 或或 (2) 定積分,算得從定積分,算得從 - 到到 x,或從,或從 - 到到 Z 的累計面積(概率)。的累計面積(概率

13、)。 .x圖 6 正態(tài)分布(左)及標準正態(tài)曲線下(右)的累計面積dxexFxx)2/()(2221)(ZdZZ2221)(jeZZ/ 由于引入了標準正態(tài)變量由于引入了標準正態(tài)變量 Z 值,只需對標準正值,只需對標準正態(tài)公式求定積分,求其曲線下從態(tài)公式求定積分,求其曲線下從 -到任意到任意Z 值的累值的累計面積,并制成專用的計面積,并制成專用的 Z 值表(見附表);這樣值表(見附表);這樣對對于其它任意的正態(tài)分布于其它任意的正態(tài)分布N(, 2) ,都可以通過變量,都可以通過變量代換轉化為標準正態(tài)分布代換轉化為標準正態(tài)分布,通過查表就完成其概率,通過查表就完成其概率計算問題。計算問題。1. 左半側

14、左半側 Z 值對應面積的查法:值對應面積的查法:1. 標準正態(tài)分布區(qū)間(標準正態(tài)分布區(qū)間(-1, 1 )的面積占總面積的)的面積占總面積的68.26% 2. 標準正態(tài)分布區(qū)間(標準正態(tài)分布區(qū)間(-1.96,1.96)的面積占總面積的)的面積占總面積的95% 3. 標準正態(tài)分布區(qū)間(標準正態(tài)分布區(qū)間(-2.58,2.58)的面積占總面積的)的面積占總面積的99% 標準正態(tài)分布曲線下面積規(guī)律標準正態(tài)分布曲線下面積規(guī)律舉例:舉例: 當當 Z = -1.96時,左側的累計面積時,左側的累計面積= 0.025(該區(qū)間累(該區(qū)間累計頻數(shù)占總例數(shù)的計頻數(shù)占總例數(shù)的 2.5%),記作),記作 P(Z1.96)

15、 = 0.025 。 當當 Z = 1.96時,時, 左側累計面積為左側累計面積為 0.975,可記作,可記作 P(Z1.96)=0.975, 此時此時P(Z1.96)=0.025 。2.左半側左半側Z 值對應面積的查法:標準正態(tài)分布是以值對應面積的查法:標準正態(tài)分布是以 0 為中為中心左右對稱,所以該表只計算曲線下一半的面積即可心左右對稱,所以該表只計算曲線下一半的面積即可 。舉例:舉例:求求 Z = - 0.5 -1.5之間的面積。之間的面積。 查表找出查表找出 Z = -0.5 時的對應面積為時的對應面積為 0.3085,再,再查出查出 Z = -1.5 時的對應面積時的對應面積 0.0

16、668,相減即可。,相減即可。 即:即:P(Z = - 0.5 -1.5)= P(Z = - 0.5) - P(Z = -1.5) = 0.3085- 0.0668 = 0.24173. 查任意兩個查任意兩個 Z 值間的面積:值間的面積:的面積到u(1)曲線下橫軸上的總面積為)曲線下橫軸上的總面積為100%(2)表中曲線下面積為)表中曲線下面積為(- ,Z)(3)標準正態(tài)曲線下的面積以)標準正態(tài)曲線下的面積以0為對稱,即為對稱,即如區(qū)間如區(qū)間(- ,-1.96)與區(qū)間與區(qū)間(1.96,+ ) 的面積相等。的面積相等。小結小結:F(F(Z)1F()1F(Z) )對標準正態(tài)分布曲線對標準正態(tài)分布曲

17、線4. 求一般正態(tài)分布求一般正態(tài)分布N(,2)曲線下的面積:曲線下的面積: 先求先求 u 值:值: 根據(jù)根據(jù) Z 值在表中查出相應的面積值值在表中查出相應的面積值當總體均數(shù)和總體標準差未知時,就用樣本均數(shù)當總體均數(shù)和總體標準差未知時,就用樣本均數(shù)和樣本標準差來代替計算。和樣本標準差來代替計算。 所以對正態(tài)分布或近似正態(tài)分布資料,只要求出所以對正態(tài)分布或近似正態(tài)分布資料,只要求出均數(shù)和標準差,便可就其頻數(shù)分布作出概略估計了。均數(shù)和標準差,便可就其頻數(shù)分布作出概略估計了。,sxxZxZ未知:已知:,舉例舉例:已知已知 120 名名 12 歲男孩身高均數(shù)為歲男孩身高均數(shù)為 143 cm,標,標準差為

18、準差為 5.8 cm,試估計該地,試估計該地 12 歲男孩身高在歲男孩身高在 135 cm 以下者有多少人?以下者有多少人? 答:答:1. 首先計算首先計算 Z 值:值:3. 據(jù)概率計算人數(shù)據(jù)概率計算人數(shù):身高在身高在 135 cm 以下者有:以下者有:1208.38% =10人人 2. 查查 Z 值表:值表: 當當 u = -1.38 時,左側尾部面積時,左側尾部面積 0.0838,即身高,即身高在在 135cm 以下者占總人數(shù)的以下者占總人數(shù)的 8.38%。38. 18 . 5143135sxxZ常用的正態(tài)分布、標準正態(tài)分布曲線下面積規(guī)律常用的正態(tài)分布、標準正態(tài)分布曲線下面積規(guī)律正態(tài)分布正

19、態(tài)分布標準正態(tài)分布標準正態(tài)分布面積規(guī)律面積規(guī)律 1.64 01.6490.00%1.9601.9695.00%2.5802.5899.00%(一)(一) 制定醫(yī)學參考值范圍制定醫(yī)學參考值范圍 參考值范圍參考值范圍(reference range):指所謂:指所謂“正常人正常人”的解剖、的解剖、生理、生化等指標的波動范圍。生理、生化等指標的波動范圍。制定方法:制定方法:制定參考值范圍時,首先要確定一批樣本含量足夠制定參考值范圍時,首先要確定一批樣本含量足夠大的大的“正常人正常人”。所謂。所謂“正常人正常人”不是指不是指“健康健康人人”,而是指排除了影響所研究指標的疾病和有關,而是指排除了影響所研

20、究指標的疾病和有關因素的同質(zhì)人群,必須是隨機選擇的大樣本。因素的同質(zhì)人群,必須是隨機選擇的大樣本。而后根據(jù)指標的實際用途確定而后根據(jù)指標的實際用途確定單側或雙側界值單側或雙側界值,根,根據(jù)研究目的和使用要求選定適當?shù)陌俜纸缰?,常用?jù)研究目的和使用要求選定適當?shù)陌俜纸缰?,常?5%。 .單側臨界值單側臨界值:標準正態(tài)分布單側尾部面積等于:標準正態(tài)分布單側尾部面積等于時所對應時所對應的正側變量值,記作的正側變量值,記作Z Z。雙側臨界值雙側臨界值:標準正態(tài)分布雙側尾部面積之和等于:標準正態(tài)分布雙側尾部面積之和等于時所時所對應的正側變量值,記作對應的正側變量值,記作Z Z/2/2。以不同的方法計算參

21、考值范圍:以不同的方法計算參考值范圍:(1)正態(tài)分布法:正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料適用于正態(tài)或近似正態(tài)分布資料表表5-2 常用參考值范圍的制定常用參考值范圍的制定 雙側界值單側下限單側上限sZX2a/sXaZsZX a 舉例舉例1:調(diào)查某地調(diào)查某地120名健康女性血紅蛋白,直方圖名健康女性血紅蛋白,直方圖顯示其分布近似正態(tài),試估計該地健康女性血紅蛋顯示其分布近似正態(tài),試估計該地健康女性血紅蛋白的白的95%參考值范圍。參考值范圍。 解析解析: 1. 分布近似正態(tài)分布近似正態(tài)2. 過高過低均為異常過高過低均為異常3. 求上、下界值求上、下界值正態(tài)分布法求參考值范圍正態(tài)分布法求參考值范

22、圍設定雙側界值設定雙側界值)/(39.1372 .1096. 14 .11796. 1lgsx上界:上界:)/(41.972 .1096. 14 .11796. 1lgsx下界:下界:所以,該地健康女性血紅蛋白的所以,該地健康女性血紅蛋白的95%參考值范圍是參考值范圍是(97.41,137.39)g/l。 舉例舉例2: 某地調(diào)查某地調(diào)查120名健康成年男性的第一秒肺通名健康成年男性的第一秒肺通氣量得均數(shù)氣量得均數(shù) X =4.2(L), 標準差標準差S =0.7(L),試據(jù)此估,試據(jù)此估計其第一秒肺通氣量的計其第一秒肺通氣量的95%參考值范圍。參考值范圍。 解析解析: 1. 分布近似正態(tài)分布近似

23、正態(tài)2. 僅過低為異常僅過低為異常3. 求下界值求下界值正態(tài)分布法求參考值范圍正態(tài)分布法求參考值范圍單側下限單側下限下界:下界:所以,該地健康成年男子第一秒肺通氣量的所以,該地健康成年男子第一秒肺通氣量的95%參參考值范圍為不低于考值范圍為不低于3.05(L)。)。 05L. 37 . 064. 12 . 464. 1SX(2)百分位法:百分位法:特別適用于偏態(tài)分布資料以及資料特別適用于偏態(tài)分布資料以及資料 中一端或兩端無確切數(shù)值的資料。中一端或兩端無確切數(shù)值的資料。如如95%參考值范圍:參考值范圍: 雙側界值雙側界值單側下限單側下限單側上限單側上限P 2.5和和P 97.5P 5 P 95)

24、%(LxxfnxfiLP計算公式:計算公式:舉例舉例:定出生體重低于:定出生體重低于2500g的嬰兒為低體重兒,若的嬰兒為低體重兒,若由某項研究得某地嬰兒出生體重均數(shù)為由某項研究得某地嬰兒出生體重均數(shù)為3200g ,標,標準差為準差為350g,估計當年出生低體重兒所占的比例。,估計當年出生低體重兒所占的比例。(二)估計頻數(shù)分布(二)估計頻數(shù)分布 解析解析:1. 分布近似正態(tài),分布近似正態(tài), X= 3200g ,S=350g。2. 轉化為標準正態(tài)分布,求轉化為標準正態(tài)分布,求u 值值查查u值表值表 說明說明標準正態(tài)曲線下標準正態(tài)曲線下 (-,-2)的面積為)的面積為2.28%,故本,故本題正態(tài)曲

25、線題正態(tài)曲線(-,2500g)的比例為)的比例為2.28% ,即,即X1.96所以可認為小蘗堿含量不正常。所以可認為小蘗堿含量不正常。 某地某地1998年抽樣調(diào)查了年抽樣調(diào)查了100名名18歲男大學生身歲男大學生身高,其均數(shù)高,其均數(shù)=172.70cm,標準差標準差=4.01 cm。(1)估計該地估計該地18歲男大學生身高在歲男大學生身高在168 cm以下以下者占該地者占該地18歲男大學生總數(shù)的百分數(shù);歲男大學生總數(shù)的百分數(shù); (2)估計該地估計該地18歲男大學生身高在歲男大學生身高在177 cm以下以下者占該地者占該地18歲男大學生總數(shù)的百分數(shù)。歲男大學生總數(shù)的百分數(shù)。答案答案:17. 101. 470.172168) 1 (sXXu 查附表得, (u)=0.1210,即該地18歲男大學生身高在168 cm以下者占該地18歲男大學生總數(shù)的12.10%。07. 101. 470.172177)2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論