抽樣誤差與區(qū)間估計(jì)_第1頁
抽樣誤差與區(qū)間估計(jì)_第2頁
抽樣誤差與區(qū)間估計(jì)_第3頁
抽樣誤差與區(qū)間估計(jì)_第4頁
抽樣誤差與區(qū)間估計(jì)_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章 抽樣誤差與區(qū)間估計(jì)()第一節(jié) 均數(shù)的抽樣誤差·統(tǒng)計(jì)推斷:用樣本的信息去推斷總體特征的方法稱為統(tǒng)計(jì)推斷(statistical inference)。·抽樣誤差(sampling error):樣本指標(biāo)與總體指標(biāo)(參數(shù))的差別要點(diǎn):由個(gè)體變異引起的、不可避免的、有規(guī)律性的·抽樣實(shí)驗(yàn):表4-1,圖4-1表4-1 從總體N(4.83, 0.522)中抽出100個(gè)樣本(n=10)的、S、t值與的95%的可信區(qū)間 tCI樣本號(hào)St值95%CI樣本號(hào)St值95%CI14.580.38-2.014.314.85515.240.642.074.785.7024.900.4

2、50.594.585.22524.890.660.324.425.3634.760.49-0.394.415.11534.830.400.054.545.1144.660.49-1.004.315.02544.850.400.204.565.1354.900.390.624.625.17554.890.590.374.475.3164.920.301.054.715.13565.030.501.324.675.3974.630.43-1.374.324.94574.940.730.514.415.4684.960.650.664.495.42584.680.34-1.264.444.9394.

3、830.450.054.505.15594.520.49-1.954.174.87104.540.67-1.324.065.02604.860.350.394.615.12114.900.500.494.545.26614.780.57-0.214.385.19124.880.700.264.385.38625.000.730.764.475.52135.040.441.544.725.35635.160.462.344.835.48144.700.59-0.664.275.12644.830.860.024.215.44154.760.37-0.554.495.02654.990.461.1

4、64.665.31164.820.34-0.044.575.06664.430.59-2.064.014.86174.970.470.994.635.30674.850.520.184.485.22184.990.441.244.685.31685.110.671.374.635.59195.090.521.634.725.46695.150.522.004.785.53204.910.360.794.655.17704.500.81-1.233.925.08214.970.461.034.645.30715.110.432.124.805.42224.650.68-0.814.165.137

5、25.170.462.434.845.50234.780.60-0.234.345.21734.830.520.084.465.20244.850.580.154.435.27744.770.46-0.374.445.09254.780.55-0.224.395.17754.790.65-0.144.335.26264.880.460.394.555.20765.050.481.524.715.40274.770.41-0.354.485.06775.000.580.974.585.42284.720.42-0.764.415.02784.780.38-0.354.505.05294.920.

6、520.614.555.30794.770.51-0.314.415.13304.820.340.034.585.07804.470.44-2.504.154.79314.650.48-1.144.304.99814.890.670.324.415.37324.770.23-0.654.614.94824.790.51-0.174.435.15334.560.52-1.604.194.93834.820.430.004.515.13344.890.590.404.475.32844.290.65-2.573.824.76354.810.43-0.074.515.11854.710.42-0.8

7、54.415.01364.710.29-1.224.504.91864.940.560.704.545.34374.680.61-0.724.245.12874.410.50-2.574.064.77384.920.540.574.535.30884.970.431.124.665.28395.010.571.034.605.42894.920.330.934.685.15404.950.620.664.515.39904.900.680.394.425.39414.900.500.504.545.26915.000.491.164.655.35424.870.670.254.395.3592

8、4.680.72-0.594.175.20434.950.640.674.505.41935.090.701.224.595.59444.850.510.224.495.22944.620.52-1.184.255.00454.970.281.634.765.17954.640.44-1.314.324.95464.900.550.464.515.30964.750.39-0.534.475.04474.530.54-1.694.154.92974.630.64-0.924.175.09484.720.56-0.554.325.13984.930.231.494.765.09494.630.7

9、3-0.824.115.15994.870.590.284.455.30504.700.53-0.694.325.081004.790.39-0.224.515.07tCI樣本均數(shù)圖4-1 100個(gè)樣本均數(shù)的直方圖頻數(shù)·抽樣實(shí)驗(yàn)結(jié)果提示:(1)樣本均數(shù)以為中心呈正態(tài)分布 ,誤差服從正態(tài)分布 (2)離樣本均數(shù)的散程度為 ·標(biāo)準(zhǔn)誤(standard error):度量抽樣誤差大小的指標(biāo)(統(tǒng)計(jì)量),其實(shí)質(zhì)是樣本指標(biāo)的變異程度,(聯(lián)系抽樣實(shí)驗(yàn):樣本均數(shù)的標(biāo)準(zhǔn)差稱為樣本均數(shù)的標(biāo)準(zhǔn)誤)可推導(dǎo)出計(jì)算公式為:(4-1) 此公式幾乎不實(shí)用,不妨稱之為理論標(biāo)準(zhǔn)誤用樣本S代替s,得樣本標(biāo)準(zhǔn)誤為:

10、(4-2) ·標(biāo)準(zhǔn)誤意義:(1)標(biāo)準(zhǔn)誤小表示樣本均數(shù)可靠性越大(2)樣本均數(shù)結(jié)合標(biāo)準(zhǔn)誤,對(duì)總體作統(tǒng)計(jì)推斷(后述)例4-1隨機(jī)抽取某地200名成年男性的紅細(xì)胞數(shù)均數(shù)為4.95×1012/L,標(biāo)準(zhǔn)差為0.57×1012/L,估計(jì)其抽樣誤差。 (1012/L)所以該樣本的抽樣誤差為0.04×1012/L。第二節(jié) 均數(shù)的抽樣誤差的分布t分布·標(biāo)準(zhǔn)化變換:·標(biāo)準(zhǔn)化值的分布:(1)已知總體標(biāo)準(zhǔn)差s時(shí),服從標(biāo)準(zhǔn)正態(tài)分布 ,標(biāo)準(zhǔn)化的誤差服從標(biāo)準(zhǔn)正態(tài)分布 (2)未知總體標(biāo)準(zhǔn)差s時(shí),服從t分布(3)大樣本時(shí),近似服從標(biāo)準(zhǔn)正態(tài)分布·t分布:, (

11、4-3) 為自由度(degree of freedom),每個(gè)自由度都對(duì)應(yīng)一條分布曲線¥(標(biāo)準(zhǔn)正態(tài)分布)5圖4-2不同自由度下t分布·t分布的特征:以0為中心,左右對(duì)稱的單峰分布;(外觀:)t分布曲線是一簇曲線,其形態(tài)變化與自由度的大小有關(guān)。自由度越小,則t值越分散,曲線越低平;自由度逐漸增大時(shí),t分布逐漸逼近u分布(標(biāo)準(zhǔn)正態(tài)分布);(參數(shù):+n)當(dāng)趨于時(shí),t分布即為u分布。(面積:尾巴較大、界值較大)·t分布界值表(Page406)雙側(cè)t0.10(30) 單側(cè)t0.05(30) 1.679 第三節(jié) 總體均數(shù)的可信區(qū)間估計(jì)·點(diǎn)估計(jì):估計(jì)總體參數(shù)在某一點(diǎn)上

12、,如·區(qū)間估計(jì):估計(jì)總體參數(shù)在某一范圍內(nèi),如·可信度/置信度/把握度:區(qū)間估計(jì)時(shí),估計(jì)正確的概率約定a錯(cuò)誤概率,則可信度為(1a) t4_1常用可信度為95%,99%;往后僅以95%可信度為例一、s未知且n較?。喊磘分布的原理用式(4-4)估計(jì)可信區(qū)間(4-4) 或?qū)懗?t4_1例4-2由隨機(jī)抽查某地30名20歲男大學(xué)生身高均數(shù)資料得,=172.01cm,S=4.20cm,試估計(jì)該地20歲男大學(xué)生身高總體均數(shù)的95可信區(qū)間。本例n=30,則29,查附表2,t界值表,雙側(cè)t0.05(29)=2.045,按式(4-4)計(jì)算:所以該地20歲男大學(xué)生身高均數(shù)的95可信區(qū)間為170.

13、42cm173.60cm。二、s未知但n足夠大: 這時(shí)t分布近似服從標(biāo)準(zhǔn)正態(tài)分布(4-5) 例4-3根據(jù)例4-1資料,估計(jì)該地正常成年男子紅細(xì)胞數(shù)的總體均數(shù)的95%可信區(qū)間。本例n=200, 4.95, =0.57, 雙側(cè)1.96,本資料的n較大,所以可按式(4-5)計(jì)算:該地正常成年男性紅細(xì)胞數(shù)的總體均數(shù)的95可信區(qū)間為4.87 ×1012/L5.03×1012/L。三、s已知(不論樣本大?。喊凑龖B(tài)分布原理(4-6) ·正確與精確問題:區(qū)間越大,可信度越大正確率越高,精確度越小區(qū)間越小,可信度越小正確率越低,精確度越大第四節(jié) 方差的抽樣誤差與可信區(qū)間估計(jì)(略)

14、是正態(tài)總體的一個(gè)樣本,樣本方差為,則并且分布與無關(guān),故有P(<)=1-由此得,當(dāng)總體的參數(shù)都為未知時(shí),方差的100(1)可信區(qū)間為 (4-7) 例4-4隨機(jī)抽查了某地區(qū)80名血吸蟲病人,測得血紅蛋白均數(shù)為95g/L,標(biāo)準(zhǔn)差為15g/L,試估計(jì)總體方差。本例n=80,=225,若求總體方差95可信區(qū)間, 查界值表得,按式(4-7)得故該地區(qū)血吸蟲感染者的血紅蛋白的總體方差的點(diǎn)估計(jì)值為225g/L,95%區(qū)間估計(jì)值為166.70311.02g/L。第五節(jié) 率的抽樣誤差與可信區(qū)間估計(jì)·大樣本才計(jì)算率·率的可信區(qū)間用正態(tài)近似法一、率的抽樣誤差率的抽樣誤差可用率的標(biāo)準(zhǔn)誤來表示&

15、#183;理論公式:(4-8) 式中為率的標(biāo)準(zhǔn)誤,為總體率,n為樣本例數(shù)??傮w率在·應(yīng)用公式:(4-9) 例4-5如抽樣調(diào)查某地4060歲的成年男性高血壓患病得P=0.1410,n=780,估計(jì)抽樣誤差。根據(jù)式(4-9),求得標(biāo)準(zhǔn)誤為 ·率的標(biāo)準(zhǔn)誤意義:類似均數(shù)標(biāo)準(zhǔn)誤的意義二、總體率的可信區(qū)間估計(jì)1.查表法:n£50,且P接近0或1的資料例4-6某新藥的毒理研究中,用20只小白鼠作急性毒性實(shí)驗(yàn),死亡3只,估計(jì)該藥急性致死率的95%可信區(qū)間。解:從附表7查得,在n=20與X=3縱列交叉處的數(shù)值為338,即該藥急性致死率的95%的可信區(qū)間為3%38%。注意附表7中的X

16、值只列出了部分,當(dāng),應(yīng)以值查表,求總體陰性率的可信區(qū)間,然后用1減去陰性率可信區(qū)間,即得陽性率的可信區(qū)間。如要估計(jì)例4-6資料的生存率的95%可信區(qū)間,就不能從附表7中直接查得,應(yīng)先按例4-6求出急性致死率的95%可信區(qū)間,然后計(jì)算(1-38%,1-3%)=(62%,97%),即該藥急性毒性實(shí)驗(yàn)的生存率95可信區(qū)間為62%97%。2.正態(tài)近似法當(dāng)n足夠大,且nP和n(1-P)均大于5時(shí)(,)(4-10) 例4-7 例4-5資料,估計(jì)該地4060歲成年男性高血壓病患病率??尚艆^(qū)間計(jì)算如下:(0.1410-1.96´0.0125,0.14101.96´0.0125)(0.116

17、5,0.1655)所以,該地區(qū)4060歲成年男性高血壓患病率的95可信區(qū)間為11.6516.55。 聯(lián)系:數(shù)據(jù)/變量分布的概況分布的特征數(shù)分布的應(yīng)用樣本數(shù)據(jù)x 頻數(shù)分布表頻數(shù)分布圖 描述指標(biāo)(,Sx)參考范圍 隨機(jī)變量X ,誤差-m概率分布表概率分布圖 總體參數(shù)() ()置信區(qū)間 m:假設(shè)檢驗(yàn) P(Z³k|m=m0)=?· H0:m=m0· P值是樣本信息支持H0的概率· P(Z³k|m=m0)= 在H0: m=m0條件下,誤差不小于當(dāng)前統(tǒng)計(jì)量值k的概率 例如,單側(cè):P(Z³1.96|m=m0)=0.025,雙側(cè):P(|Z|³1.96|m=m0) =0.05假設(shè)檢驗(yàn)注意事項(xiàng)要點(diǎn):(1)可比性:病情是干擾(混雜)因素,例如A組輕病人多B組重病人多,無可比性(2)P小差別大:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論