總體均數(shù)估計ppt課件_第1頁
總體均數(shù)估計ppt課件_第2頁
總體均數(shù)估計ppt課件_第3頁
總體均數(shù)估計ppt課件_第4頁
總體均數(shù)估計ppt課件_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 第六章第六章 參數(shù)估計根底參數(shù)估計根底總體總體樣本樣本統(tǒng)計推斷:用樣本信息推斷總體特征,包括參數(shù)統(tǒng)計推斷:用樣本信息推斷總體特征,包括參數(shù)估計和假設(shè)檢驗。估計和假設(shè)檢驗。 圖示:總體與樣本圖示:總體與樣本1x1x3x1x2x5x4x 抽樣實驗抽樣實驗n=5n=5 抽樣實驗抽樣實驗n=10n=10 抽樣實驗抽樣實驗n=30n=30 10001000份樣本抽樣計算結(jié)果份樣本抽樣計算結(jié)果總體的總體的均數(shù)均數(shù)總體標總體標準差準差s s均數(shù)的均數(shù)的均數(shù)均數(shù)均數(shù)標準差均數(shù)標準差n n=5=55.005.000.500.504.994.990.22120.22120.22360.2236n n=10=10

2、5.005.000.500.505.005.000.15800.15800.15810.1581n n=30=305.005.000.500.505.005.000.09200.09200.09130.0913nsnS 3 3個抽樣實驗結(jié)果圖示個抽樣實驗結(jié)果圖示0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均數(shù)頻數(shù)0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均數(shù)頻數(shù)050

3、1001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均數(shù)頻數(shù)2212. 0; 5XSn0920. 0;30XSn1580. 0;10XSn 各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)未必等于總體均數(shù); 各樣本均數(shù)間存在差別;各樣本均數(shù)間存在差別; 樣本均數(shù)的分布為中間多,兩邊少,左右根本樣本均數(shù)的分布為中間多,兩邊少,左右根本對稱。對稱。 樣本均數(shù)的變異范圍較之原變量的變異范圍大樣本均數(shù)的變異范圍較之原變量的變異范圍大大減少。大減少。 樣本均數(shù)的抽樣分布具有如下特點 中心極限定理:中心極限定理:1

4、1從正態(tài)總體中作隨機抽樣,那么樣本均數(shù)服從正態(tài)總體中作隨機抽樣,那么樣本均數(shù)服從正態(tài)分布;從偏態(tài)總體中作隨機抽樣,樣本含從正態(tài)分布;從偏態(tài)總體中作隨機抽樣,樣本含量量n n足夠大足夠大n n3030那么樣本均數(shù)近似服從正態(tài)那么樣本均數(shù)近似服從正態(tài)分布。分布。xs s2 2從總體均數(shù)為從總體均數(shù)為,規(guī)范差為,規(guī)范差為的正態(tài)總體中的正態(tài)總體中抽取例數(shù)為抽取例數(shù)為n n的樣本,樣本均數(shù)的總體均數(shù)為的樣本,樣本均數(shù)的總體均數(shù)為,規(guī)范差為規(guī)范差為 。 樣本頻率的抽樣分與抽樣誤差樣本頻率的抽樣分與抽樣誤差黑球的比例為黑球的比例為20%,反復(fù)摸球,反復(fù)摸球50次,次,計算摸到黑球的頻率?計算摸到黑球的頻率?

5、黑球比例黑球比例(%)樣本頻數(shù)樣本頻數(shù)樣本頻率樣本頻率(%)黑球比例黑球比例(%)樣本頻數(shù)樣本頻數(shù)樣本頻率樣本頻率(%)822.00221111.001044.00241111.001288.002666.001477.002833.00161111.003044.00181313.003211.00201919.00合計合計 100100.00 表表6-3 =20%的隨機抽樣結(jié)果的隨機抽樣結(jié)果n=50 一、抽樣誤差與規(guī)范誤一、抽樣誤差與規(guī)范誤1.1.抽樣誤差:由于抽樣呵斥的樣本統(tǒng)計量與總體抽樣誤差:由于抽樣呵斥的樣本統(tǒng)計量與總體參數(shù)以及樣本統(tǒng)計量與樣本統(tǒng)計量之間的差別。參數(shù)以及樣本統(tǒng)計量與樣

6、本統(tǒng)計量之間的差別。 抽樣誤差是不可防止的,但可以估計。抽樣誤差是不可防止的,但可以估計。2.2.規(guī)范誤規(guī)范誤(Standard error(Standard error,SE)SE):規(guī)范誤為樣本:規(guī)范誤為樣本均數(shù)的規(guī)范差,用均數(shù)的規(guī)范差,用 表示,是闡明樣本均數(shù)抽表示,是闡明樣本均數(shù)抽樣誤差的大小的目的,描畫樣本均數(shù)的離散程度,樣誤差的大小的目的,描畫樣本均數(shù)的離散程度,反映用樣本均數(shù)估計或推斷總體均數(shù)的可靠性。反映用樣本均數(shù)估計或推斷總體均數(shù)的可靠性。xs 3.規(guī)范誤的計算規(guī)范誤的計算nxs ss s nSSx 均數(shù)的規(guī)范誤與規(guī)范差成正比,與樣本例數(shù)的平均數(shù)的規(guī)范誤與規(guī)范差成正比,與樣本

7、例數(shù)的平方根成反比。方根成反比。 假設(shè)規(guī)范差固定不變時,可添加假設(shè)規(guī)范差固定不變時,可添加n n而減少抽樣誤而減少抽樣誤差。差。 對于二項分布,對于二項分布,XB(n,),那么樣本頻率那么樣本頻率其規(guī)范誤:其規(guī)范誤:nnXpp)1( s s nppnppSp)1(1)1( 實踐中,實踐中, 普通未知,普通未知,常用樣本頻率常用樣本頻率p近似替代近似替代那么其規(guī)范誤:那么其規(guī)范誤: 4. 規(guī)范誤的運用規(guī)范誤的運用1 1表示抽樣誤差大小,描畫表示抽樣誤差大小,描畫n n一樣樣本一樣樣本統(tǒng)計量的離散程度,反映用樣本統(tǒng)計量估計或統(tǒng)計量的離散程度,反映用樣本統(tǒng)計量估計或推斷總體參數(shù)的可靠性;推斷總體參數(shù)

8、的可靠性;2 2用于估計總體參數(shù)的可信區(qū)間;用于估計總體參數(shù)的可信區(qū)間;3 3用于進展樣本均數(shù)用于進展樣本均數(shù)/ /頻率的假設(shè)檢驗。頻率的假設(shè)檢驗。 二、二、t 分布的概念分布的概念 , 1XXXtnSSn 式中式中 為自在度為自在度(degree of freedom, df) 3實踐任務(wù)中,由于實踐任務(wù)中,由于 未知,用未知,用 替代,那么替代,那么 不再服從規(guī)范不再服從規(guī)范正態(tài)分布,而服從正態(tài)分布,而服從t 分布。分布。 XsXS() /XXS )1 , 0(),(2NzNXxxzx s s s s nSxSxtx/ )1 , 0(),(2NzNXxz s s s s 4. t 分布曲線

9、的特征:分布曲線的特征:1 1t t 分布是一簇曲線。它受自在度的影響,自在分布是一簇曲線。它受自在度的影響,自在度不同曲線外形不同。度不同曲線外形不同。2 2是是t t 分布曲線的參數(shù):分布曲線的參數(shù): n n越小,越小,越小,曲線越平緩越小,曲線越平緩 n n越大,越大,越大,曲線越峻峭越大,曲線越峻峭 nn,曲線近似于規(guī)范正態(tài)分布曲線。,曲線近似于規(guī)范正態(tài)分布曲線。3 3以以0 0為中心,左右對稱呈鐘形。為中心,左右對稱呈鐘形。4 4規(guī)范正態(tài)分布是規(guī)范正態(tài)分布是t t 分布的特例。分布的特例。 2 參參 數(shù)數(shù) (on ly on e): 3 t界界 值值 表表 : 詳詳 見見 附附 表表

10、 2, 可可 反反 映映 t分分 布布 曲曲 下下 的的 面面 積積 。 單單 側(cè)側(cè) 概概 率率 或或 單單 尾尾 概概 率率 : 用用,t表表 示示 ; 雙雙 側(cè)側(cè) 概概 率率 或或 雙雙 尾尾 概概 率率 : 用用/2,t 表表 示示 。 t界值表:詳見附表界值表:詳見附表2,可反映,可反映t分布曲分布曲線下的面積。線下的面積。單側(cè)概率或單尾概率:用單側(cè)概率或單尾概率:用 表示;表示;雙側(cè)概率或雙尾概率:用雙側(cè)概率或雙尾概率:用 表示。表示。 2參數(shù)參數(shù)(only one): 3t 界界值表:詳見附表值表:詳見附表 2,可反映,可反映 t 分布曲下的面積。分布曲下的面積。 單側(cè)概率或單尾概

11、率:用單側(cè)概率或單尾概率:用,t 表示;表示; 雙側(cè)概率或雙尾概率:用雙側(cè)概率或雙尾概率:用/2,t表示。表示。 -tt0 三、總體參數(shù)的估計三、總體參數(shù)的估計1.1.參數(shù)估計:用樣本統(tǒng)計量估計總體參數(shù)。包括點參數(shù)估計:用樣本統(tǒng)計量估計總體參數(shù)。包括點估計和區(qū)間估計。估計和區(qū)間估計。1 1點估計點估計(Point Estimation)(Point Estimation):直接用樣本目的:直接用樣本目的作為總體參數(shù)的估計;作為總體參數(shù)的估計;2 2區(qū)間估計區(qū)間估計(Interval Estimation) (Interval Estimation) :用預(yù)先給:用預(yù)先給定的概率可信度、把握度定

12、的概率可信度、把握度1-1-估計總體參數(shù)所估計總體參數(shù)所在的范圍。此范圍稱為置信區(qū)間可信區(qū)間:在的范圍。此范圍稱為置信區(qū)間可信區(qū)間:Confidence Interval, CIConfidence Interval, CI 1點估計點估計(point estimation) 用相應(yīng)樣本統(tǒng)計量直接作為其總體參數(shù)用相應(yīng)樣本統(tǒng)計量直接作為其總體參數(shù)的估計值。的估計值。、S估計估計s s 代替代替,用,用代替代替如用如用sx其方法雖簡單,但未思索抽樣誤差的大小。其方法雖簡單,但未思索抽樣誤差的大小。 按預(yù)先給定的概率(1)所確定的包含未知總體參數(shù)的一個范圍。 總體均數(shù)的區(qū)間估計:按預(yù)先給定的概率(1

13、)所確定的包含未知總體均數(shù)的一個范圍。 如給定=0.05,該范圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間; 如給定=0.01,該范圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。2區(qū)間估計區(qū)間估計(interval estimation): 總體均數(shù)置信區(qū)間的計算需思索:總體均數(shù)置信區(qū)間的計算需思索: 1總體規(guī)范差總體規(guī)范差能否知,能否知, 2樣本含量樣本含量n的大小的大小 通常有兩類方法:通常有兩類方法: 1 t分布法分布法 2z分布法分布法總體均數(shù)置信區(qū)間的計算總體均數(shù)置信區(qū)間的計算 總體均數(shù)置信區(qū)間的計算總體均數(shù)置信區(qū)間的計算1、t分布法分布法 當總體規(guī)范差當總體規(guī)范差未知且未知且n50時時)即即(xx

14、xstxstxstx ,2/,2/,2/, 總體均數(shù)的雙側(cè)總體均數(shù)的雙側(cè)1-置信區(qū)間置信區(qū)間總體均數(shù)的單側(cè)總體均數(shù)的單側(cè)1-置信區(qū)間置信區(qū)間xxstxstx ,2/,2/ LgstxLgstxtxx/)02.133,98.116(2715779. 2125/)94.130,06.119(2715056. 2125.779. 201. 0,056. 2t0.0526,1-n2 27,n26,2/01. 026,2/05. 0262/01. 00.05/2,26 ,時,時,時,雙側(cè)時,雙側(cè),查附表查附表本例本例 2、正態(tài)分布近似法、正態(tài)分布近似法 當當知知 或或 未知,但未知,但 n50 時時)即

15、(即(xxxzxzxzxs ss ss s 2/2/2/, 總體均數(shù)的雙側(cè)總體均數(shù)的雙側(cè)1-置信區(qū)間置信區(qū)間)即即(xxxszxszxszx2/2/2/, 總體均數(shù)的單側(cè)總體均數(shù)的單側(cè)1-置信區(qū)間置信區(qū)間xxzxzxs s s s 或或xxszxszx 或或 例3-3 某地抽取正常成年人200名,測得其血清膽固醇的均數(shù)為3.64 mmol/L,規(guī)范差為1.20mmol/L,估計該地正常成年人血清膽固醇均數(shù)的95%置信區(qū)間。 故該地正常成年人血清膽固醇均數(shù)的雙側(cè)95%可信區(qū)間為(3.47, 3.81)mmolL。 參數(shù)估計的方法:參數(shù)估計的方法:1 1知,根據(jù)正態(tài)分布原理,知,根據(jù)正態(tài)分布原理,

16、95%95%、99%CI99%CI:2 2未知,未知,n n較小,據(jù)較小,據(jù)t t分布原理:分布原理:95%95%、99%CI99%CI:xxs s96. 1 xSx58. 2 xStx ,05. 0 xStx ,01. 0 3 3未知,未知,n n較大,據(jù)近似正態(tài)分布原理,較大,據(jù)近似正態(tài)分布原理, xSx96. 1 xxs s58. 2 正態(tài)分布法 樣本含量n足夠大, np與n(1-p)均5時 ,pSzp2/ 總體概率的置信區(qū)間計算總體概率的置信區(qū)間計算 For example例例6-6 6-6 用某種儀器檢查已確診的乳腺癌患者用某種儀器檢查已確診的乳腺癌患者120120名,名,檢出乳腺癌

17、患者檢出乳腺癌患者9494例,檢出率為例,檢出率為78.3%78.3%。估計該儀。估計該儀器乳腺癌總體檢出率的器乳腺癌總體檢出率的95%95%置信區(qū)間。置信區(qū)間。 95%95%的置信區(qū)間為:的置信區(qū)間為: 該儀器乳腺癌總體檢出率的該儀器乳腺癌總體檢出率的95%95%置信區(qū)間置信區(qū)間 70.9%70.9%,85.7% 85.7% 857.0709.0120)783.01(783.096.1783.0)1(2/05.02/ nppZpSzpp 查表法查表法 當樣本含量較小如當樣本含量較小如n50n50,npnp或或n(1n(1p)5p)5時,樣本率的分布呈二項分布,總體率的置信時,樣本率的分布呈二

18、項分布,總體率的置信區(qū)間可據(jù)二項分布的實際求得。區(qū)間可據(jù)二項分布的實際求得。 例例6-7 6-7 某醫(yī)院用某藥治療腦動脈硬化癥某醫(yī)院用某藥治療腦動脈硬化癥2222例,例,其中顯效者其中顯效者1010例。問該藥總顯效率的例。問該藥總顯效率的95%95%置信置信區(qū)間為多少?區(qū)間為多少? 本例本例n=22, X=10, n=22, X=10, 查附表查附表6 6478478頁,得此兩頁,得此兩數(shù)相交處的數(shù)值為數(shù)相交處的數(shù)值為24246868,即該藥總顯效率的,即該藥總顯效率的95%95%置信區(qū)間為置信區(qū)間為24%24%,68%68%。 三置信區(qū)間確實切涵義三置信區(qū)間確實切涵義 1. 95%的置信區(qū)間的了解:的置信區(qū)間的了解:1所要估計的總體參數(shù)有所要估計的總體參數(shù)有95%的能夠在我們所估的能夠在我們所估計的置信區(qū)間內(nèi)。計的置信區(qū)間內(nèi)。2從正態(tài)總體中隨機抽取從正態(tài)總體中隨機抽取100個樣本,可算得個樣本,可算得100個樣本均數(shù)和規(guī)范差,也可算得個樣本均數(shù)和規(guī)范差,也可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論