樣本均數(shù)的抽樣誤差與置信區(qū)間_第1頁(yè)
樣本均數(shù)的抽樣誤差與置信區(qū)間_第2頁(yè)
樣本均數(shù)的抽樣誤差與置信區(qū)間_第3頁(yè)
樣本均數(shù)的抽樣誤差與置信區(qū)間_第4頁(yè)
樣本均數(shù)的抽樣誤差與置信區(qū)間_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章 樣本均數(shù)的抽樣誤差與置信區(qū)間 聯(lián)系:數(shù)據(jù)/變量在離散點(diǎn)或區(qū)間上分布分布特征數(shù)應(yīng)用樣本數(shù)據(jù)x 頻數(shù)分布表頻數(shù)分布圖描述指標(biāo)()參考值范圍隨機(jī)變量X ,誤差概率分布表概率分布圖總體參數(shù)() ()置信區(qū)間3.1 樣本均數(shù)的分布·從同一總體中獨(dú)立抽取多份樣本, 他們的均數(shù)常大小不一, 這說(shuō)明樣本均數(shù)存在變異。通過(guò)電腦實(shí)驗(yàn)來(lái)認(rèn)識(shí)樣本均數(shù)的變異規(guī)律一、正態(tài)總體樣本均數(shù)的分布實(shí)驗(yàn)3.1 從正態(tài)分布總體抽樣的實(shí)驗(yàn) 假定正常男子的紅血球計(jì)數(shù)服從正態(tài)分布N(4.6602, 0.57462),隨機(jī)抽取1000份樣本, 每份含n5個(gè)個(gè)體。樣本均數(shù)依然是一個(gè)隨機(jī)變量, 且 (1) 各樣本均數(shù)未必等于總

2、體均數(shù)(,誤差?); (2) 樣本均數(shù)之間存在差異(,變異); (3) 樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù),中間多、兩邊少, 左右基本對(duì)稱(對(duì)稱、正態(tài)?); (4) 樣本均數(shù)的變異范圍較原變量變異范圍大大縮小(); (5) 隨著樣本量的增大, 樣本均數(shù)變異范圍逐漸縮小()。圖3.1 從正態(tài)分布總體抽樣的實(shí)驗(yàn)結(jié)果原正態(tài)總體N(4.6602, 0.57462);直方圖是樣本均數(shù)的分布(Luo: 這里橫坐標(biāo)為,若改為便是誤差分布圖的形狀不變)3.74.14.54.95.35.73.74.14.54.95.35.73.74.14.54.95.35.7n=5 n=10 n=30(a) (b) (c)

3、表3_2實(shí)3_1a 表3.1 從N(4.6602, 0.57462)中隨機(jī)抽樣, 樣本量為5, 100份獨(dú)立樣本的均數(shù)、標(biāo)準(zhǔn)差和總體均數(shù)的95%置信區(qū)間(單位:1012 /L)樣本號(hào)均數(shù)標(biāo)準(zhǔn)差95%置信區(qū)間樣本號(hào)均數(shù)標(biāo)準(zhǔn)差95%置信區(qū)間15.00.56884.2939, 5.7062514.48.40063.9827, 4.977324.72.34704.2891, 5.1509524.32.54873.6388, 5.001234.24.57633.5246, 4.9554534.88.37324.4167, 5.343444.64.59493.9014, 5.3786544.68.3524

4、4.2425, 5.117554.60.40054.1028, 5.0972554.80.58664.0717, 5.528364.80.81863.7837, 5.8163564.52.35044.0850, 4.955074.68.45024.1211, 5.2389574.88.68694.0272, 5.732884.32.82253.2989, 5.3411584.80.52324.1505, 5.449594.72.59643.9796, 5.4604594.80.27944.4531, 5.1469104.40.44963.8418, 4.9582604.76.58234.037

5、1, 5.4830114.60.56833.8944, 5.3056614.76.70833.8807, 5.6394124.60.34014.1778, 5.0222624.12.57933.4008, 4.8392134.60.66483.7746, 5.4254634.72.44194.1714, 5.2686144.76.62743.9811, 5.5389644.44.28184.0902, 4.7898154.20.68863.3451, 5.0549654.921.02673.6454, 6.1947164.64.30914.2562, 5.0238664.80.71913.90

6、73, 5.6927174.96.42234.4357, 5.4843674.72.43614.1786, 5.2614184.96.40834.4532, 5.4669684.84.58734.1109, 5.5691194.68.58753.9506, 5.4094694.36.48923.7527, 4.9673204.84.53404.1771, 5.5030704.76.33534.3437, 5.1763214.92.28524.5659, 5.2741714.40.43093.8650, 4.9350224.60.45174.0392, 5.1608724.68.68803.82

7、59, 5.5341234.44.43333.9021, 4.9779734.60.43014.0661, 5.1339244.96.37114.4993, 5.4207744.48.64113.6841, 5.2759254.64.47424.0513, 5.228775*4.16.39273.6724, 4.6476264.96.53494.2959, 5.6241764.52.54873.8388, 5.2012274.48.47783.8868, 5.0732774.36.39303.8721, 4.8479284.68.38184.2061, 5.153978*5.04.20524.

8、7853, 5.2947294.68.62893.8992, 5.4608794.56.99633.3231, 5.7969305.28.64674.4771, 6.0829804.80.62434.0249, 5.5751314.84.67244.0053, 5.674781*4.00.20903.7405, 4.2595324.52.32034.1224, 4.9176824.64.34144.2162, 5.0638334.76.58414.0348, 5.4852835.04.40504.5372, 5.5428344.48.20844.2213, 4.7388844.52.53533

9、.8555, 5.1845355.04.66464.2149, 5.8651854.44.32764.0333, 4.8467364.56.39124.0743, 5.0457864.60.37974.1287, 5.0713374.68.51834.0366, 5.3234874.48.28014.1322, 4.8278384.80.74453.8758, 5.7242884.64.24734.3330, 4.9471394.72.72603.8187, 5.621389*5.32.39824.8256, 5.8144404.68.85673.6165, 5.7435904.92.3473

10、4.4888, 5.3512414.561.02413.2887, 5.8313914.72.29414.3548, 5.0852424.76.67863.9175, 5.6025924.44.42733.9096, 4.9704435.04.51764.3974, 5.6826934.48.35944.0338, 4.9262444.52.36584.0659, 4.9741944.92.44564.3668, 5.4732454.52.59443.7821, 5.2580954.64.47584.0494, 5.2306464.72.50244.0963, 5.3437964.76.851

11、63.7027, 5.8173475.12.63544.3312, 5.9088974.64.45604.0739, 5.2061484.76.58374.0354, 5.4846984.36.33683.9419, 4.778149*4.04.35953.5937, 4.4863994.56.61973.7907, 5.3293504.52.60943.7634, 5.27661004.60.45664.0331, 5.1669* 由這份樣本估計(jì)的95%置信區(qū)間實(shí)際上并未復(fù)蓋總體均數(shù)圖3_1 表3.2 從N(4.6602, 0.57462)中隨機(jī)抽取1000份獨(dú)立樣本, 其均數(shù)的頻數(shù)分布組段

12、下限(1012 /L)頻數(shù)頻率(%)累積頻率(%)3.60- 1 0.1 0.13.80- 5 0.5 0.64.00- 32 3.2 3.84.20-11711.715.54.40-22922.938.44.60-30430.468.84.80-21821.890.65.00- 76 7.698.25.20- 15 1.599.75.40- 3 0.3 100.0合計(jì)1000100.0·理論上可以證明, 從正態(tài)分布N(m, s2)的總體中隨機(jī)抽取含量為n的樣本,其樣本均數(shù)N(m, s2 /n)。·樣本均數(shù)的標(biāo)準(zhǔn)差習(xí)慣上又稱為樣本均數(shù)的標(biāo)準(zhǔn)誤(standard error)

13、,簡(jiǎn)稱標(biāo)準(zhǔn)誤。值得注意的是如下的普遍規(guī)律:或 (3.1) ·實(shí)際應(yīng)用中往往總體標(biāo)準(zhǔn)差s未知, 人們只能用樣本標(biāo)準(zhǔn)差S代替s,從而獲得的估計(jì)值,則有 (3.2) ·為方便計(jì),可稱為理論標(biāo)準(zhǔn)誤,為樣本標(biāo)準(zhǔn)誤。二、非正態(tài)總體樣本均數(shù)的分布實(shí)驗(yàn)3.2 從正偏峰的分布總體抽樣的實(shí)驗(yàn)(1) 隨著樣本量的增大, 樣本均數(shù)分布的對(duì)稱性逐漸改善, 樣本量為30時(shí), 樣本均數(shù)的分布接近正態(tài)分布; (2) 隨著樣本量的增大, 樣本均數(shù)的變異范圍逐漸變窄。1234578n=5(b)123456789n=10(c)123456789n=20(d)123456789n=30(e)圖3.2 從正偏峰的分

14、布總體分布抽樣實(shí)驗(yàn)的結(jié)果(a)是原分布,正偏峰;其它為不同樣本含量時(shí)樣本均數(shù)的直方圖123456789(a)實(shí)驗(yàn)3.3 從不對(duì)稱鉤形分布的總體抽樣的實(shí)驗(yàn) 圖3.3(a): (1) 樣本均數(shù)分布再不象個(gè)鉤子, 樣本量很小時(shí)就象正態(tài)分布了; (2) 隨著樣本量的增大, 樣本均數(shù)的變異范圍也逐漸變窄。·以上兩項(xiàng)實(shí)驗(yàn)的結(jié)果具有普遍性。理論上可以證明, 非正態(tài)總體樣本均數(shù)的分布并不是正態(tài)分布;但當(dāng)樣本量較大時(shí)(例如,n30), 樣本均數(shù)的分布接近正態(tài)分布。圖3_1123456789n=5(b)123456789n=10(c)123456789n=20(d)123456789n=30(e)圖3.

15、3 從不對(duì)稱鉤形分布總體抽樣實(shí)驗(yàn)的結(jié)果(a)是原分布,呈鉤形;其它為不同樣本含量時(shí)樣本均數(shù)的直方圖123456789(a)3.2 t分布一、標(biāo)準(zhǔn)正態(tài)離差和標(biāo)準(zhǔn)t離差 ·標(biāo)準(zhǔn)正態(tài)離差便服從標(biāo)準(zhǔn)正態(tài)分布, 記為(3.3) ·若s未知,用樣本標(biāo)準(zhǔn)差S代替s,以代替它們不盡相同,即有變異,因而比多了一種與自由度有關(guān)的變異。于1908年用筆名Student研究了它的分布規(guī)律, 稱之t分布, 記為, v=n-1(3.4) ·不妨稱為標(biāo)準(zhǔn)t離差(standard t deviate)。n(讀作nunju:)是t分布的自由度,不同的自由度對(duì)應(yīng)于不同的t分布曲線。二、t分布的圖形與

16、t分布表實(shí)驗(yàn)3.1(續(xù)) 標(biāo)準(zhǔn)正態(tài)離差和標(biāo)準(zhǔn)t離差 對(duì)前述實(shí)驗(yàn)3.1所得1000份隨機(jī)樣本分別計(jì)算標(biāo)準(zhǔn)正態(tài)離差和標(biāo)準(zhǔn)t離差, 并繪制相應(yīng)的直方圖, 如圖3.4(a)和(b)所示。·本書(shū)附表5給出了t分布的雙側(cè)尾部面積和對(duì)應(yīng)的t界值。對(duì)應(yīng)于同樣大小的尾部面積a,t界值比正態(tài)分布界值要大。-5-3-10135(a)-5-3-10135(b)圖3.4 從N(4.6602,0.57462)中隨機(jī)抽取1000份獨(dú)立樣本,n=5(a)樣本均數(shù)的標(biāo)準(zhǔn)正態(tài)離差的直方圖;(b)樣本均數(shù)的標(biāo)準(zhǔn)t離差的直方圖圖3.5 標(biāo)準(zhǔn)正態(tài)分布和t分布的圖形=時(shí)的t分布即標(biāo)準(zhǔn)正態(tài)分布012345-1-2-3-4-50.

17、00.10.20.30.4n=3n=1n=¥ (標(biāo)準(zhǔn)正態(tài)分布)3.3 正態(tài)分布總體均數(shù)的置信區(qū)間·95%置信區(qū)間:設(shè)N(m, s2 ), m和s未知,由t分布面積規(guī)律可知:-t0.05t0.05(3.3) ·經(jīng)移項(xiàng)化簡(jiǎn),可改寫(xiě)為(3.4) 置信程度為95%;換言之,這樣估計(jì)100次,約有95次正確。·應(yīng)用公式為(, ),或(3.5) ·(1-a)置信區(qū)間:(, )(3.6) ·可稱為置信區(qū)間的精度,它等于置信區(qū)間寬度的一半,意指置信區(qū)間的兩端點(diǎn)離樣本均數(shù)有多遠(yuǎn)。表3_1 實(shí)驗(yàn)3.1(續(xù)) 置信區(qū)間與置信水平 對(duì)于前述從正態(tài)總體隨機(jī)抽取

18、的每一份樣本均可按(3.5)式各計(jì)算總體均數(shù)的一個(gè)95%置信區(qū)間。表3.1的第4列給出了由前100份樣本作出的的95%置信區(qū)間。不難發(fā)現(xiàn), 多數(shù)區(qū)間(95個(gè))覆蓋了總體均數(shù)4.6602, 但第49, 75, 78, 81和89號(hào)這5個(gè)樣本算出的區(qū)間卻“撲空”了,即這樣的區(qū)間估計(jì)95%正確,5%錯(cuò)誤。換言之,當(dāng)我們依據(jù)一個(gè)樣本均數(shù),對(duì)總體均數(shù)只作一次區(qū)間估計(jì)時(shí),其置信度為95%。例3.1 從某類患者中隨機(jī)抽取20例, 其血沉(mm/h)的均數(shù)為9.15, 標(biāo)準(zhǔn)差為2.13。假定該類患者的血沉值服從正態(tài)分布, 試估計(jì)總體均數(shù)的95%置信區(qū)間和99%置信區(qū)間。解 =9.15, s=2.13, n=2

19、0, =10.15和8.15 =10.51和7.78·置信水平由95%提高到99%, 置信區(qū)間便由窄變寬, 估計(jì)的精度下降。若既要提高置信水平, 又要估計(jì)的精度好, 就必須縮小s或加大n。s反映客觀存在的個(gè)體差異, 通常無(wú)法縮小, 但加大樣本量是行之有效的辦法。3.4 兩正態(tài)總體均數(shù)之差的置信區(qū)間·設(shè)有標(biāo)準(zhǔn)差相等而均數(shù)不等的兩個(gè)正態(tài)總體N(m1, s2)和N(m2, s2),均未知。·N(m1,s2/n1), N(m2, s2/n2),仍服從正態(tài)分布()N(m1-m2, s2(1/n1 +1/n2 )(3.7)()N(m1-m2, )(3.7) ·的標(biāo)準(zhǔn)

20、正態(tài)離差服從標(biāo)準(zhǔn)正態(tài)分布, 即 N(0, 1)(3.8) N(0, 1)(3.8) Luo: 如果m1=m2,N(0, 1)(假設(shè)檢驗(yàn))·現(xiàn)s2未知,服從t分布。即的標(biāo)準(zhǔn)t離差 t分布,v=n1+n2(3.9) t分布,v=n1+n2(3.9) 其中, Sc2稱為兩樣本的合并方差:Sc2 =(3.10) Sc2的自由度為S12和S22的自由度之和, (n1 -1)+(n2 -1)= n1+n2-2, 因而, t分布的自由度也是n1n22。·以下公式不講解了:t0.05 t0.05(3.11)(3.12)(-)-t0.05,(-)+t0.05)(3.13)( ),( )+)(

21、3.14)例3.2 某地隨機(jī)抽取40歲正常男子20名和40歲正常女子15名, 測(cè)定紅細(xì)胞計(jì)數(shù), 男女樣本均數(shù)和樣本標(biāo)準(zhǔn)差分別為 =4.66, s1 =0.47和=4.18, s2 =0.45, 試計(jì)算40歲正常男女紅細(xì)胞計(jì)數(shù)總體均數(shù)之差的95%置信區(qū)間。(單位: 1012 /L)解 例3.3 假定某地健康成年男女的紅細(xì)胞計(jì)數(shù)(1012 /L)分別服從均數(shù)不等、標(biāo)準(zhǔn)差相等的二個(gè)正態(tài)分布?,F(xiàn)有男女各一份隨機(jī)樣本, 樣本量n1=300, n2=250, 均數(shù)和標(biāo)準(zhǔn)差分別為 =4.66, s1 =0.47和 =4.18, s2 =0.39。試估計(jì)男女紅細(xì)胞計(jì)數(shù)的總體均數(shù)之差的95%置信區(qū)間。解 3.5 二項(xiàng)分布總體概率以及概率之差的置信區(qū)間1. 二項(xiàng)分布總體概率的置信區(qū)間 ·大樣本時(shí),利用P近似地服從正態(tài)分布的性質(zhì)進(jìn)行估計(jì)。(3.1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論