2.1第四節(jié)正態(tài)分布及標準誤ppt課件_第1頁
2.1第四節(jié)正態(tài)分布及標準誤ppt課件_第2頁
2.1第四節(jié)正態(tài)分布及標準誤ppt課件_第3頁
2.1第四節(jié)正態(tài)分布及標準誤ppt課件_第4頁
2.1第四節(jié)正態(tài)分布及標準誤ppt課件_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第四節(jié)第四節(jié) 正態(tài)分布及標準誤正態(tài)分布及標準誤 本次課要點:本次課要點: l1、熟悉正態(tài)分布、標準正態(tài)分布的概念;掌 握其主要特征及其應(yīng)用; l2、掌握醫(yī)學(xué)參考值的概念及其范圍的制定方 法。 l3、了解均數(shù)標準誤的意義及計算 l4、掌握總體均數(shù)可信區(qū)間的概念及計算方法 第四節(jié) 正態(tài)分布 (normal distribution) 一、正態(tài)分布的概念一、正態(tài)分布的概念 1. 圖形圖形 正態(tài)分布正態(tài)分布 u=(X- )/ 標準正態(tài)分布標準正態(tài)分布 高峰位于中央均數(shù)所在處)、兩側(cè)逐漸降低且左右對稱、不與橫軸高峰位于中央均數(shù)所在處)、兩側(cè)逐漸降低且左右對稱、不與橫軸 相交的光滑曲線。正態(tài)分布是一種重要

2、的連續(xù)型分布。相交的光滑曲線。正態(tài)分布是一種重要的連續(xù)型分布。 正態(tài)曲線正態(tài)曲線normal curve在橫軸上方均數(shù)處最高;在橫軸上方均數(shù)處最高; 正態(tài)分布以均數(shù)為中心,左右對稱;正態(tài)分布以均數(shù)為中心,左右對稱; 正態(tài)分布有兩個參數(shù),即均數(shù)正態(tài)分布有兩個參數(shù),即均數(shù)與標準差與標準差,常用,常用 N(,)表示,用表示,用N0,1表示標準正態(tài)分布。其位置與表示標準正態(tài)分布。其位置與 均數(shù)有關(guān),形狀與標準差有關(guān)。標準差大,離散程度大,正均數(shù)有關(guān),形狀與標準差有關(guān)。標準差大,離散程度大,正 態(tài)分布曲線則態(tài)分布曲線則“胖胖”,反之,那么,反之,那么“瘦瘦”; 正態(tài)分布的面積分布有一定的規(guī)律性。正態(tài)分布

3、的面積分布有一定的規(guī)律性。 二二 正態(tài)分布分布曲線的特征正態(tài)分布分布曲線的特征 三三 正態(tài)曲線下面積的分布規(guī)律正態(tài)曲線下面積的分布規(guī)律 統(tǒng)計學(xué)家求出了標準正態(tài)分布從統(tǒng)計學(xué)家求出了標準正態(tài)分布從- 到(到(-u的面積。的面積。 實際工作中經(jīng)常要用的面積分布規(guī)律有以下三點:實際工作中經(jīng)常要用的面積分布規(guī)律有以下三點: 三三 正態(tài)曲線下面積的分布規(guī)律正態(tài)曲線下面積的分布規(guī)律 正態(tài)曲線下的面積規(guī)律正態(tài)曲線下的面積規(guī)律 -1.96 +1.96 2.5%2.5% 95% 正態(tài)曲線下的面積規(guī)律正態(tài)曲線下的面積規(guī)律 -1.64 +1.64 5%5% 90% 正態(tài)曲線下的面積規(guī)律正態(tài)曲線下的面積規(guī)律 -2.58

4、+2.58 0.5%0.5% 99% 三、正態(tài)分布的應(yīng)用 1. 1. 估計參考值范圍;估計參考值范圍; 2. 2. 估計總體參數(shù)的可信區(qū)間;估計總體參數(shù)的可信區(qū)間; 3. 3. 差異顯著性檢驗;差異顯著性檢驗; 4. 4. 質(zhì)量控制。質(zhì)量控制。 1、估計頻數(shù)分布、估計頻數(shù)分布 l出生體重低于2500g為低體重兒,某市嬰兒出 生體重均數(shù)3200g,標準差為s=350g。設(shè)該資 料服從正態(tài)分布,試求該地低體重兒占該地所 有出生嬰兒的比例。 計算:計算: 首先計算標準離差: 查標準正態(tài)分布表: (-2)=0.0228 結(jié)果:估計低體重兒的比例為2.28%. 25003200 2 350 u 參考值范

5、圍參考值范圍(reference interval) l參考值范圍又稱正常值范圍(normal range)。 l什么是參考值范圍: l是絕大多數(shù)正常人的某觀察指標所在的范圍。 l絕大多數(shù):90%,95%,99%等等。 l確定參考值范圍的意義: l用于判斷正常與異常。 l“正常人的定義: l排除了影響所研究的指標的疾病和有關(guān)因素的 同質(zhì)的人群。 參考值范圍確定的原則參考值范圍確定的原則 l選定足夠例數(shù)的同質(zhì)的正常人作為研究對象 l控制檢測誤差 l判斷是否分組(性別,年齡組) l單、雙側(cè)問題 l選擇百分界值(90%,95%) l確定可疑范圍 參考值范圍的估計方法:正態(tài)分布法參考值范圍的估計方法:

6、正態(tài)分布法 2.5%2.5% 95% -1.96+1.96 參考值范圍的估計方法:百分位數(shù)法參考值范圍的估計方法:百分位數(shù)法 P2.5 P97.5 95%參考值范圍的估計方法參考值范圍的估計方法 方法雙側(cè) 單側(cè)下限單側(cè)上限 正態(tài)分布法 百分位數(shù)法 P2.5P97.5 P5 P95 1.96Xs 1.64Xs 1.64Xs 例:參考值范圍的計算例:參考值范圍的計算 l某地調(diào)查了200名成年女子的平均血清總蛋白為 73.5(g/L),標準差3.9 (g/L),試估計該地成年女子血 清總蛋白95的參考值范圍。 l由得95參考值范圍: l下限: 1.96s=73.51.963.9=65.9(g/L)

7、l上限: 1.96s=73.51.963.9=81.1(g/L) l 此可作為判斷該地區(qū)成年女子血清總蛋白含量 正常與否的參考值。 X X 單側(cè)與雙側(cè)參考值范圍單側(cè)與雙側(cè)參考值范圍 l根據(jù)醫(yī)學(xué)專業(yè)知識確定! l雙側(cè):白細胞計數(shù),血清總膽固醇, l單側(cè):上限: 轉(zhuǎn)氨酶,尿鉛,發(fā)汞 l 下限: 肺活量,IQ, 第五節(jié) 均數(shù)的抽樣誤差及應(yīng)用 一、概念一、概念 誤差:實測值與真值之差。誤差:實測值與真值之差。 (1 1系統(tǒng)誤差:在收集資料過程中產(chǎn)生的誤差,值恒定不系統(tǒng)誤差:在收集資料過程中產(chǎn)生的誤差,值恒定不 變,遵循一定的規(guī)律變化。變,遵循一定的規(guī)律變化。 (2 2隨機誤差:一類不恒定、隨機、變化的

8、誤差。如抽樣隨機誤差:一類不恒定、隨機、變化的誤差。如抽樣 誤差。誤差。 2. 2. 抽樣:從總體中獲得有代表性樣本的過程。抽樣:從總體中獲得有代表性樣本的過程。 3.3.均數(shù)的抽樣誤差:均數(shù)的抽樣誤差: 由抽樣而造成的樣本均數(shù)與總體均數(shù)由抽樣而造成的樣本均數(shù)與總體均數(shù) 的差異或各樣本均數(shù)的差異。的差異或各樣本均數(shù)的差異。 抽樣誤差的定義抽樣誤差的定義 l假如事先知道某地七歲男童的平均身高為119.41cm。為了估計 七歲男童的平均身高總體均數(shù)),研究者從所有符合要求的七 歲男童中每次抽取100人,共計抽取了三次。 119.41cm = 4.38cm 118.21cm =4.45cm X s

9、120.18cm =4.90cm X s 120.81cm =4.33cm X s 抽樣誤差的定義抽樣誤差的定義 l三次抽樣得到了不同的結(jié)果,原因何在? 個體變異隨機抽樣 不同男童的 身高不同 每次抽到的 人幾乎不同 抽樣誤差 【定義】由于個體變異的存在,在抽樣研究中產(chǎn) 生樣本統(tǒng)計量和總體參數(shù)之間的差異,稱為抽 樣誤差。 各種參數(shù)都有抽樣誤差,這里我們以均數(shù)為研究 對象 抽樣誤差的定義抽樣誤差的定義 n x : 總體標準差總體標準差 n:樣本含量:樣本含量 n x n s s x S : S : 樣本標準差樣本標準差 計算公式計算公式 反映均數(shù)抽樣誤差大小的指標。樣本均數(shù)的反映均數(shù)抽樣誤差大小

10、的指標。樣本均數(shù)的 標準差。標準誤越小,說明樣本均數(shù)與總體標準差。標準誤越小,說明樣本均數(shù)與總體 均數(shù)越接近,樣本均數(shù)的代表性越好均數(shù)越接近,樣本均數(shù)的代表性越好 意義意義 二、標準誤二、標準誤 例:對某地成年男性紅細胞數(shù)的抽樣調(diào)查中,隨例:對某地成年男性紅細胞數(shù)的抽樣調(diào)查中,隨 機抽取了機抽取了100名成年男性,調(diào)查得到其均數(shù)是名成年男性,調(diào)查得到其均數(shù)是 5.38 /L ,標準差為,標準差為0.44 /L,求其標準,求其標準 誤。誤。 依題意,依題意,n=100;s=0.441012/L。 計算得到標準誤為計算得到標準誤為: 例題:例題: 044. 0 100 44. 0 n s s X

11、12 10 12 10 (1012/L1012/L) 12 10 標準誤的意義標準誤的意義 l反映了樣本統(tǒng)計量樣本均數(shù),樣本率分布 的離散程度,體現(xiàn)了抽樣誤差的大小。 l標準誤越大,說明樣本統(tǒng)計量樣本均數(shù),樣 本率的離散程度越大,即用樣本統(tǒng)計量來直 接估計總體參數(shù)越不可靠。反之亦然。 l標準誤的大小與標準差有關(guān),在例數(shù)n一定時, 從標準差大的總體中抽樣,標準誤較大;而當 總體一定時,樣本例數(shù)越多,標準誤越小。說 明我們可以通過增加樣本含量來減少抽樣誤差 的大小。 樣本均數(shù)的抽樣分布規(guī)律樣本均數(shù)的抽樣分布規(guī)律 l中心極限定理 l從均數(shù)為,標準差為的正態(tài)總體中隨機抽 樣,樣本均數(shù)服從均數(shù)為,標準差

12、為 的正態(tài)分布。 l從均數(shù)為,標準差為的任意總體中隨機抽 樣,當樣本含量足夠大時,樣本均數(shù)近似服從 均數(shù)為,標準差為 的正態(tài)分布。 l n n t分布的演化分布的演化 l根據(jù)中心極限定理的內(nèi)容,當樣本含量足夠大 時,對從均數(shù)為,標準差為的任意總體中 隨機抽樣所得的樣本均數(shù)進行標準化變換,有 (0,1) i i X N n t分布的演化分布的演化 l由于總體標準差往往是未知的,此時往往用樣 本標準差代替總體標準差, l這里,為自由度,取值為n-1 l由W.S. Gosset提出 X tt sn t分布的圖形分布的圖形 自由度分別為1、5、 時的 t 分布 t分布的性質(zhì)分布的性質(zhì) lt分布為一簇單

13、峰分布曲線,高峰在0的位置上,說明 從正態(tài)總體中隨機抽樣所得樣本計算出的t值接近0的 可能性較大。 lt分布以0為中心,左右對稱。 l分布的高峰位置比 u 分布低,尾部高。 lt分布與自由度有關(guān),自由度越小,t分布的峰越低, 而兩側(cè)尾部翹得越高;自由度逐漸增大時,t分布逐漸 逼近標準正態(tài)分布;當自由度為無窮大時,t分布就是 標準正態(tài)分布。 l每一自由度下的t分布曲線都有其自身分布規(guī)律。t界 值表 。 t t界值表界值表 單側(cè): P(t =t,)= 雙側(cè): P(t =t,)= 即:P(-t,t t,)= 1- 例 查t界值表得t值表達式 t 0.05,10=2.228 (雙側(cè)) t 0.05,1

14、0=1.812 (單側(cè)) -tt0 統(tǒng)計推斷統(tǒng)計推斷 l所謂統(tǒng)計推斷(statistical inference), 是指如何抽樣,以及如何用樣本性質(zhì)推 斷總體特征。 l參數(shù)估計(parameter estimation) l點估計 l區(qū)間估計 l假設(shè)檢驗(hypothesis testing) 參數(shù)估計之一:點估計參數(shù)估計之一:點估計 l用樣本統(tǒng)計量作為總體參數(shù)的估計 l 例如: l 用樣本均數(shù)作為總體均數(shù)的一個估計 點估計的缺陷點估計的缺陷 區(qū)間估計區(qū)間估計 l可信區(qū)間的定義 l總體均數(shù)之可信區(qū)間的求解 l可信區(qū)間的要素 l正確理解可信區(qū)間的含義 區(qū)間估計區(qū)間估計 【例4.1】 隨機抽取某

15、地25名正常成年男子,測 得該樣本的脈搏均數(shù)為73.6次/分,標準差為 6.5次/分,估計正常成年男子脈搏總體均數(shù)。 區(qū)間估計的實質(zhì)區(qū)間估計的實質(zhì) l假設(shè)某個總體的均數(shù)為,需要找到兩個量A 和B,使得在一個比較高的可信度下(如95%), 區(qū)間(A,B)能包含。即 lP(AB)=0.95 可信區(qū)間的定義可信區(qū)間的定義 l按一定的概率或可信度(1-)用一個區(qū)間 來估計總體參數(shù)所在的范圍,該范圍通常 稱為參數(shù)的可信區(qū)間或者置信區(qū)間 (confidence interval,CI),預(yù)先給定的概 率(1-)稱為可信度或者置信度 (confidence level),常取95%或99%。 l可信區(qū)間(C

16、L, CU )是一開區(qū)間 CL、CU 稱為可信限 均數(shù)的均數(shù)的(1-)100%可信區(qū)間可信區(qū)間 /2,/2, /2,/2, /2,/2, () 1 () 1 () 1 x xx Pttt x Ptt s P x tsxts -t/2, v 0 t/2, v 1- /2 /2 /2, ()P tt 均數(shù)的均數(shù)的95%可信區(qū)間可信區(qū)間 l樣本含量不是很大時, l樣本含量較大時,t分布逼近u分布 0.0250.025 , XX XusXus 0.025,0.025, , XX XtsXts 例:例: 【例4.1】 隨機抽取某地25名正常成年男子,測 得該樣本的脈搏均數(shù)為73.6次/分,標準差為6.5 次/分,求該地正常成年男子脈搏總體均數(shù)95% 的可信區(qū)間。 【例4.2】 某市2019年120名7歲男童的身高 =123.62(cm),標準差s=4.75(cm),計算該市7 歲男童總體均數(shù)90%的可信區(qū)間。 可信區(qū)間的兩個要素可信區(qū)間的兩個要素 l可信度Confidence):準確性,可靠性,即1- 。 l一般取90%,95,可人為控制 l精確性(Precision):區(qū)間的大小,越小越好。 l必須二者兼顧 95%可信區(qū)間的含義可信區(qū)間的含義 -2 -1 0 1 2 按這種

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論