統(tǒng)計_正態(tài)分布_抽樣誤差_第1頁
統(tǒng)計_正態(tài)分布_抽樣誤差_第2頁
統(tǒng)計_正態(tài)分布_抽樣誤差_第3頁
統(tǒng)計_正態(tài)分布_抽樣誤差_第4頁
統(tǒng)計_正態(tài)分布_抽樣誤差_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 第三講 正態(tài)分布 抽樣誤差1一、正態(tài)分布及其應(yīng)用一、正態(tài)分布及其應(yīng)用正態(tài)分布正態(tài)分布正態(tài)分布的概念正態(tài)分布的概念正態(tài)曲線下面積的分布規(guī)律正態(tài)曲線下面積的分布規(guī)律標準正態(tài)分布標準正態(tài)分布正態(tài)分布的應(yīng)用正態(tài)分布的應(yīng)用 估計頻數(shù)分布估計頻數(shù)分布估計參考值范圍估計參考值范圍 質(zhì)量控制質(zhì)量控制理論分布的基礎(chǔ)理論分布的基礎(chǔ) 2 正態(tài)分布的概念正態(tài)分布的概念3正態(tài)分布的概念正態(tài)分布的概念v頻數(shù)分布概念頻數(shù)分布概念頻數(shù)集中在均數(shù)周圍,左右基本對稱,離均數(shù)愈近頻數(shù)集中在均數(shù)周圍,左右基本對稱,離均數(shù)愈近數(shù)據(jù)愈多,離均數(shù)愈遠數(shù)據(jù)愈少數(shù)據(jù)愈多,離均數(shù)愈遠數(shù)據(jù)愈少如果觀察數(shù)不斷增多,組距不斷細分,直方圖的邊如果觀察

2、數(shù)不斷增多,組距不斷細分,直方圖的邊線將逐漸接近一條光滑曲線線將逐漸接近一條光滑曲線這條曲線數(shù)學(xué)上稱為正態(tài)曲線這條曲線數(shù)學(xué)上稱為正態(tài)曲線以均數(shù)為中心,兩以均數(shù)為中心,兩側(cè)對稱并逐漸下降,永遠不與橫軸相交的一條鐘型曲側(cè)對稱并逐漸下降,永遠不與橫軸相交的一條鐘型曲線線4正態(tài)分布的特性正態(tài)分布的特性v正態(tài)分布曲線的正態(tài)分布曲線的特點特點集中性集中性 對稱性對稱性 均勻變動性均勻變動性曲線的位置和形狀與兩個參數(shù)有關(guān)曲線的位置和形狀與兩個參數(shù)有關(guān),5正態(tài)分布的特性正態(tài)分布的特性v正態(tài)分布曲線的參數(shù) 為位置參數(shù):恒定時,增大,曲線沿橫軸向右移動;減小,曲線沿橫軸向左移動 為形狀參數(shù):恒定時,越大,曲線越寬

3、,表示數(shù)據(jù)越分散;越小,曲線越窄,表示數(shù)據(jù)越集中-5-4-3-2-101234532126正態(tài)曲線下的面積分布圖正態(tài)曲線下的面積分布圖7當資料近似正正態(tài)分布時,可以當資料近似正正態(tài)分布時,可以 作為作為的估計值,的估計值,以以S作為作為的估計值,估計正態(tài)曲線下面積的分布規(guī)的估計值,估計正態(tài)曲線下面積的分布規(guī)律律sx sx58.2sx96.1x8標準正態(tài)分布標準正態(tài)分布v標準正態(tài)分布:標準正態(tài)分布:N( 0,1 )v數(shù)據(jù)經(jīng)標準化后,使數(shù)據(jù)經(jīng)標準化后,使=0,=1時的正態(tài)分布時的正態(tài)分布 轉(zhuǎn)換方式轉(zhuǎn)換方式v任何一個正態(tài)分布,都可以通過變換,成為標任何一個正態(tài)分布,都可以通過變換,成為標準正態(tài)分布準

4、正態(tài)分布SXXuxu9正態(tài)分布的應(yīng)用正態(tài)分布的應(yīng)用v頻數(shù)估計頻數(shù)估計v估計醫(yī)學(xué)正常參考值范圍估計醫(yī)學(xué)正常參考值范圍v質(zhì)量控制質(zhì)量控制v統(tǒng)計統(tǒng)計方法的理論基礎(chǔ)方法的理論基礎(chǔ)10頻數(shù)估計suxsxxu正態(tài)分布正態(tài)分布標準正態(tài)分布標準正態(tài)分布11估計醫(yī)學(xué)正常參考值范圍估計醫(yī)學(xué)正常參考值范圍v研究對象的選擇研究對象的選擇估計范圍確定(估計范圍確定(80%、90%、95%、99%)單雙側(cè)的確定單雙側(cè)的確定方法的選擇方法的選擇v正態(tài)分布正態(tài)分布v偏態(tài)分布偏態(tài)分布)961961(S.XS,.X)6451(S.X )6451(S.X 5 .975 . 2pp 與955pp 或12正態(tài)分布的應(yīng)用正態(tài)分布的應(yīng)用v

5、質(zhì)量控制質(zhì)量控制 作為上下警戒值作為上下警戒值 作為上下控制值作為上下控制值v統(tǒng)計統(tǒng)計方法的理論基礎(chǔ)方法的理論基礎(chǔ)u 檢驗、檢驗、t 分布、分布、F 分布、二項分布、分布、二項分布、2 分布等分布等sx2sx313常用常用u u 值表值表正常值范圍正常值范圍() 單側(cè)單側(cè) 雙側(cè)雙側(cè) 80 0.842 1.282 90 1.282 1.645 95 1.645 1.960 98 2.054 2.326 99 2.326 2.57614常用百分位數(shù)表常用百分位數(shù)表正常值范圍正常值范圍() 單側(cè)單側(cè)(低側(cè)低側(cè) 高側(cè)高側(cè)) 雙側(cè)雙側(cè) 80 P20 P80 P10 P90 90 P10 P90 P5 P

6、95 95 P5 P95 P2.5 P97.5 98 P2 P98 P1 P99 99 P1 P99 P0.5 P99.515二、抽樣誤差及其應(yīng)用二、抽樣誤差及其應(yīng)用v抽樣誤差的概念抽樣誤差的概念v抽樣誤差的應(yīng)用抽樣誤差的應(yīng)用參數(shù)估計參數(shù)估計假設(shè)檢驗假設(shè)檢驗16抽樣誤差的概念抽樣誤差的概念v抽樣誤差抽樣誤差由抽樣研究引起的樣本統(tǒng)計量與總體參數(shù)間的差異由抽樣研究引起的樣本統(tǒng)計量與總體參數(shù)間的差異均數(shù)的抽樣誤差均數(shù)的抽樣誤差v兩種表現(xiàn)形式兩種表現(xiàn)形式樣本統(tǒng)計量與總體參數(shù)間的差異樣本統(tǒng)計量與總體參數(shù)間的差異樣本統(tǒng)計量間的差異樣本統(tǒng)計量間的差異v抽樣誤差產(chǎn)生的原因抽樣誤差產(chǎn)生的原因抽樣研究抽樣研究個體

7、變異個體變異17標準誤標準誤( (standard errorstandard error,SE)SE)v樣本統(tǒng)計量的標準差稱為標準誤樣本統(tǒng)計量的標準差稱為標準誤,用來衡量抽樣誤差的用來衡量抽樣誤差的大小。大小。v標準誤與個體變異標準誤與個體變異 成正比,與樣本含量成正比,與樣本含量n n的平方根成反的平方根成反比。比。v標準誤理論值標準誤理論值nX18標準誤標準誤( (standard errorstandard error,SE)SE)v實際工作中,實際工作中, 往往是未知的,一般可用樣本標準往往是未知的,一般可用樣本標準差差s s代替代替 v標準誤的估計值標準誤的估計值v因為標準差因為標

8、準差s s隨樣本含量的增加而趨于穩(wěn)定,故增隨樣本含量的增加而趨于穩(wěn)定,故增加樣本含量可以降低抽樣誤差加樣本含量可以降低抽樣誤差nssX19t t分布的概念分布的概念v設(shè)某一變量Xi服從正態(tài)分布N(,),則 服從標準正態(tài)分布v即iX) 1 , 0(,.,),(,.,321321服從標準正態(tài)分布服從正態(tài)分布XXXNXXX20t t分布的概念分布的概念v從正態(tài)分布N(,)的總體中隨機抽樣并計算多個樣本均數(shù) ,它們服從總體均數(shù)為,總體標準差為 的正態(tài)分布,則 也服從標準正態(tài)分布。v jXXjX) 1 , 0(,.,),(,.,321321服從標準正態(tài)分布服從正態(tài)分布XXXXXXXNXXXX21t t分

9、布的概念分布的概念nsXsXtXXXsv實際工作中, 由于 未知,則用 代替,則 服從t分布vt分布(t-distribution)主要用于參數(shù)估計及t檢驗。英國統(tǒng)計學(xué)家W.S.Gosset于1908年在生物統(tǒng)計雜志上發(fā)表該論文時用的是筆名“Student”,故t分布又稱Student t分布。XsX22t分布的特征vt分布為一簇單峰分布曲線分布為一簇單峰分布曲線vt分布以分布以0為中心,左右對稱為中心,左右對稱vt分布與自由度分布與自由度 有關(guān),自由度越小,有關(guān),自由度越小,t分布的峰越低,而兩側(cè)分布的峰越低,而兩側(cè)尾部翹得越高;自由度逐漸增大時,尾部翹得越高;自由度逐漸增大時,t分布逐漸逼

10、近標準正分布逐漸逼近標準正態(tài)分布;當自由度為無窮大時,態(tài)分布;當自由度為無窮大時,t分布就是標準正態(tài)分布分布就是標準正態(tài)分布 23不同自由度下的t分布 24參數(shù)估計(parameter estimation) v由樣本信息估計總體參數(shù) 點估計(point estimation)區(qū)間估計(interval estimation) 25點估計 v直接用樣本統(tǒng)計量作為總體參數(shù)的估計值 方法簡單,但未考慮抽樣誤差的大小在實際問題中,總體參數(shù)往往是未知的,但它們是固定的值,并不是隨機變量值。而樣本統(tǒng)計量隨樣本的不同而不同,屬隨機的 26區(qū)間估計v按一定的概率或可信度(1- )用一個區(qū)間估計總體參數(shù)所在范

11、圍,這個范圍稱作可信度為1- 的可信區(qū)間(confidence interval, CI),又稱置信區(qū)間 。這種估計方法稱為區(qū)間估計。 27均數(shù)的可信區(qū)間 v總體均數(shù)的(1- )可信區(qū)間定義為v當樣本含量較大時,例如n100,t分布近似標準正態(tài)分布,此時可用標準正態(tài)分布代替t分布,作為可信區(qū)間的近似計算。相應(yīng)的100(1-)可信區(qū)間為 XXstXstX,XXsuXsuX,28可信區(qū)間的確切涵義 v可信度為95% 的可信區(qū)間的確切涵義是:每100個樣本所算得的100個可信區(qū)間,平均有95個包含了總體參數(shù) 。29可信區(qū)間的兩個要素 v可靠性 反映為可信度1- 的大小 v精確性 用區(qū)間長度CUCL衡量 30可信區(qū)間與參考值范圍的區(qū)別 v可信區(qū)間用于估計總體參數(shù),總體參數(shù)只有一個 。v參考值范圍用于估計變量值的分布范圍,變量值可能很多甚至無限 。v95%的可信區(qū)間中的95%是可信度,即所求可信區(qū)間包含總體參數(shù)的可信程度為95%v95%的參考值范圍中的95%是一個比例,即所求參考值范圍包含了95%的正常人。31v標準差標準差意義:描述原始數(shù)據(jù)意義:描述原始數(shù)據(jù)的離散程度。衡量均的離散程度。衡量均數(shù)對原始數(shù)據(jù)的代表數(shù)對原始數(shù)據(jù)的代表性性與與n的關(guān)系的關(guān)系 應(yīng)用:應(yīng)用:v頻數(shù)分布估計(醫(yī)頻數(shù)分布估計(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論