




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、第 6 章 抽樣與參數(shù)估計統(tǒng)計學第 6章 抽樣與參數(shù)估計6.1 抽樣與抽樣分布抽樣與抽樣分布6.2 參數(shù)估計的基本方法參數(shù)估計的基本方法 6.3 一個總體參數(shù)的一個總體參數(shù)的區(qū)間估計區(qū)間估計6.4 兩個總體參數(shù)的兩個總體參數(shù)的區(qū)間估計區(qū)間估計6.5 樣本容量的確定樣本容量的確定學習目標理解抽樣方法與抽樣分布理解抽樣方法與抽樣分布估計量與估計值的概念估計量與估計值的概念點估計與區(qū)間估計的區(qū)別點估計與區(qū)間估計的區(qū)別總體均值的區(qū)間估計方法總體均值的區(qū)間估計方法總體比例的區(qū)間估計方法總體比例的區(qū)間估計方法樣本容量的確定方法樣本容量的確定方法參數(shù)估計在統(tǒng)計方法中的地位參數(shù)估計參數(shù)估計假設檢驗假設檢驗o統(tǒng)
2、計方法統(tǒng)計方法描述統(tǒng)計描述統(tǒng)計推斷統(tǒng)計推斷統(tǒng)計6.1 抽樣與 抽樣分布什么是抽樣推斷什么是抽樣推斷概率抽樣方法概率抽樣方法抽樣分布抽樣分布統(tǒng)計量統(tǒng)計量與正態(tài)分布有關的幾個分布與正態(tài)分布有關的幾個分布一、統(tǒng)計推斷的過程二、抽樣方法抽樣方法簡簡單單隨隨機機抽抽樣樣分分層層抽抽樣樣整整群群抽抽樣樣系系統(tǒng)統(tǒng)抽抽樣樣多多階階段段抽抽樣樣概概率率抽抽樣樣方方便便抽抽樣樣判判斷斷抽抽樣樣自自愿愿樣樣本本滾滾雪雪球球抽抽樣樣配配額額抽抽樣樣非非概概率率抽抽樣樣抽抽樣樣方方式式三、抽樣分布在重復選取容量為n的樣本時,由每一個樣本算出的該統(tǒng)計量數(shù)值的相對頻數(shù)分布或概率分布 是一種理論分布隨機變量是 樣本統(tǒng)計量樣本
3、統(tǒng)計量n樣本均值, 樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量長遠穩(wěn)定的信息,是進行推斷的理論基礎,也是抽樣推斷科學性的重要依據(jù) 抽樣分布 (sampling distribution)抽樣分布 (sampling distribution)樣本均值的抽樣分布容量相同的所有可能樣本的樣本均值的概率分布一種理論概率分布進行推斷總體均值的理論基礎樣本均值的抽樣分布樣本均值的抽樣分布(例題分析)5 .21NxNii25. 1)(122NxNii樣本均值的抽樣分布 (例題分析)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,
4、21,11第二個觀察值第二個觀察值第一個第一個觀察值觀察值所有可能的所有可能的n = 2 的樣本(共的樣本(共16個)個)樣本均值的抽樣分布 (例題分析)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第二個觀察值第一個第一個觀察值觀察值16個樣本的均值(個樣本的均值(x)樣本均值的分布與總體分布的比較 (例題分析)5 . 2X625. 02X樣本均值的抽樣分布與中心極限定理X5x50 x5 . 2x中心極限定理(central limit theorem) xn x 抽樣分布與總體分布的關系正態(tài)分布正態(tài)分布非正態(tài)分布
5、非正態(tài)分布正態(tài)分布正態(tài)分布正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布樣本均值的數(shù)學期望樣本均值的方差n重復抽樣n不重復抽樣樣本均值的抽樣分布(數(shù)學期望與方差)(XEnX22122NnNnX樣本均值的抽樣分布(數(shù)學期望與方差)為樣本數(shù)目MnMXnixiX222122625. 016)5 . 20 . 4()5 . 20 . 1 ()(5 . 2160 . 45 . 10 . 11MXniiX樣本比例的抽樣分布總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比n不同性別的人與全部人數(shù)之比n合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為比例(proportion)NNNN101
6、或nnPnnP101或容量相同的所有可能樣本的樣本比例的概率分布當樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似 一種理論概率分布推斷總體總體比例的理論基礎樣本比例的抽樣分布樣本比例的數(shù)學期望樣本比例的方差n重復抽樣n不重復抽樣樣本比例的抽樣分布(數(shù)學期望與方差)(PEnP)1 (21)1 (2NnNnP抽樣平均誤差的計算注意事項抽樣平均誤差的計算注意事項在實際工作中,在實際工作中, 和和P均不可知,因此,一般均不可知,因此,一般,或者,或者則抽樣平均誤差則抽樣平均誤差的最終計算公式:的最終計算公式:o1.重復抽樣條件下:重復抽樣條件下:nsx2nppp)1 ( o2.不重復抽樣條件下:不
7、重復抽樣條件下:)1-(2NnNnsx)1()1 (NnNnppp抽樣平均誤差的計算抽樣平均誤差的計算例例1:某燈泡廠對某燈泡廠對10000個產(chǎn)品進行使用壽命個產(chǎn)品進行使用壽命檢驗,隨機抽取檢驗,隨機抽取2%的產(chǎn)品進行測試,得到的產(chǎn)品進行測試,得到資料如表所示:資料如表所示:o試按上述資料,計算:試按上述資料,計算:o(1)產(chǎn)品平均壽命的抽樣誤差)產(chǎn)品平均壽命的抽樣誤差o(2)若壽命在)若壽命在1000小時以上為合格品,小時以上為合格品,求合格品率的抽樣誤差。求合格品率的抽樣誤差。使用時間(小時)使用時間(小時)x x產(chǎn)品數(shù)量產(chǎn)品數(shù)量f f 900以下以下 900950 9501000 100
8、01050 10501100 11001150 11501200 1200以上以上 2 4 11 71 84 18 7 3合 計200四、統(tǒng)計量(statistic)設X1,X2,Xn是從總體X中抽取的容量為n的一個 樣 本 , 如 果 由 此 樣 本 構(gòu) 造 一 個 函 數(shù)T(X1,X2,Xn),不依賴于任何未知參數(shù),則稱函數(shù)T(X1,X2,Xn)是一個統(tǒng)計量n樣本均值、樣本比例、樣本方差等都是統(tǒng)計量統(tǒng)計量是樣本的一個函數(shù)統(tǒng)計量是統(tǒng)計推斷的基礎次序統(tǒng)計量一組樣本觀測值X1,X2,Xn由小到大的排序o X(1)X(2) X(i) X(n) 后,稱X(1),X(2),X(n)為次序統(tǒng)計量 中位數(shù)
9、、分位數(shù)、四分位數(shù)等都是次序統(tǒng)計量五、與正態(tài)分布有關的幾個分布由阿貝(Abbe) 于1863年首先給出,后來由海爾墨特(Hermert)和卡皮爾遜(KPearson) 分別于1875年和1900年推導出來設 ,則令 ,則 Y 服從自由度為1的2分布,即 當總體 ,從中抽取容量為n的樣本,則2分布(2 distribution),(2NX) 1 , 0( NXz2zY ) 1 (2Y),(2NX) 1()(2212nxxnii分布的變量值始終為正 分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱 期望為:E(2)=n,方差為:D(2)=2n(n為自由度)
10、可加性:若U和V為兩個獨立的2分布隨機變量,U2(n1),V2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布 2分布(性質(zhì)和特點)2分布(圖示)t 分布t 分布圖示由統(tǒng)計學家費希爾(R.A.Fisher) 提出的,以其姓氏的第一個字母來命名設若U為服從自由度為n1的2分布,即U2(n1),V為服從自由度為n2的2分布,即V2(n2),且U和V相互獨立,則稱F為服從自由度n1和n2的F分布,記為F分布(F distribution)21nVnUF ),(21nnFFF分布(圖示)6.2 參數(shù)估計的基本方法估計量與估計值估計量與估計值點估計與區(qū)間估計點估計與區(qū)間估計估計量與估計值估計
11、量:用于估計總體參數(shù)的隨機變量n如樣本均值,樣本比例、樣本方差等n例如: 樣本均值就是總體均值 的一個估計量參數(shù)用 表示,估計量用 表示估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值n如果樣本均值 x =80,則80就是的估計值估計量與估計值 (estimator & estimated value)點估計與區(qū)間估計參數(shù)估計的方法估估 計計 方方 法法點點 估估 計計區(qū)間估計區(qū)間估計點估計 (point estimate)用樣本的估計量直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計例如:用兩個樣本均值之差直接作為總體均值之差的估計2.沒有給出估計值接近總體參數(shù)程度的信息點估計的方法
12、有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等區(qū)間估計 (interval estimate)在點估計的基礎上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量n比如,某班級平均分數(shù)在7585之間,置信水平是95% 區(qū)間估計的圖示XXzX2將構(gòu)造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平 表示為 (1 - n 為是總體參數(shù)未在區(qū)間內(nèi)的比例 常用的置信水平值有 99%, 95%, 90%n相應的相應的 為0.01,0.05,0.10置信水平 由樣本統(tǒng)計量所構(gòu)造
13、的總體參數(shù)的估計區(qū)間稱為置信區(qū)間統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間 用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值n我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個置信區(qū)間 (confidence interval)置信區(qū)間與置信水平 xxX影響區(qū)間寬度的因素1.總體數(shù)據(jù)的離散程度,用 來測度樣本容量,2.置信水平 (1 - ),影響 z 的大小nX6.3 總體均值的區(qū)間估計正態(tài)總體且方差已知,或正態(tài)總體且方差已知,或 非正態(tài)總體,方差非正
14、態(tài)總體,方差未知未知,大樣本大樣本正態(tài)總體,方差未知、小樣本正態(tài)總體,方差未知、小樣本6.3 一個總體參數(shù)的區(qū)間估計總體參數(shù)總體參數(shù)符號表示符號表示樣本統(tǒng)計量樣本統(tǒng)計量均值比例方差2XP2S總體均值的區(qū)間估計 (正態(tài)總體、已知,或非正態(tài)總體、大樣本)總體均值的區(qū)間估計o1.假定條件n總體服從正態(tài)分布,且方差() 已知n如果不是正態(tài)分布,可由正態(tài)分布來近似 (n 30)2.總體均值 在1-置信水平下的置信區(qū)間為)(22未知或nszxnzx)(1122未知或NnNnszxNnNnzx總體均值的區(qū)間估計(例題分析)915. 096. 14 .212nzx總體均值的區(qū)間估計(例題分析)28.109,4
15、4.10192.336.105251096.136.1052nzx36.105x總體均值的區(qū)間估計(例題分析)36個投保人年齡的數(shù)據(jù)個投保人年齡的數(shù)據(jù) 233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計(例題分析)63.41,37.3713.25 .393677.7645.15 .392nszx5 .39x77. 7s總體均值的區(qū)間估計 (正態(tài)總體、未知、小樣本)總體均值的區(qū)間估計 (小樣本)1.假定條件n總體服從正態(tài)分布,且方差() 未知n小樣本 (n 30)2.使用 t 分布統(tǒng)計
16、量)1(ntnSXtnStX2t 分布總體均值的區(qū)間估計(例題分析)16燈泡使用壽命的數(shù)據(jù)燈泡使用壽命的數(shù)據(jù) 1510152014801500145014801510152014801490153015101460146014701470總體均值的區(qū)間估計(例題分析)2 .1503, 8 .14762 .1314901677.24131.214902ntx1490 x77.24s總體比例的區(qū)間估計大樣本重復抽樣時的估計方法大樣本重復抽樣時的估計方法大樣本不重復抽樣時的估計方法大樣本不重復抽樣時的估計方法總體比例的區(qū)間估計總體比例的區(qū)間估計o1.假定條件n總體服從二項分布n可以由正態(tài)分布來近似2
17、.使用正態(tài)分布統(tǒng)計量) 1 , 0()1 (NnPPPZ)()-1 ()1 (22未知時或nPPzPnzP總體比例的區(qū)間估計(例題分析)%35.74%,65.55%35. 9%65100%)651%(6596. 1%65)1 (2nppzp總體方差的區(qū)間估計總體方差的區(qū)間估計o1.估計一個總體的方差或標準差o2.假設總體服從正態(tài)分布3.總體方差 2 的點估計量為s2,且11222nsn111122122222nsnnsn總體方差的區(qū)間估計(圖示)總體方差的區(qū)間估計(例題分析)25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8
18、115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3總體方差的區(qū)間估計(例題分析)4011.12)24() 1(2975. 0212n3641.39)24() 1(2025. 022n39.18083.564011.1221.931253641.3921.9312522一個總體參數(shù)的區(qū)間估計(小結(jié))均值均值比例比例方差方差大樣本大樣本小樣本小樣本大樣本大樣本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知
19、未知t t分布分布6.4 兩個總體參數(shù)的區(qū)間估計6.4.1 兩個總體均值之差的區(qū)間估計兩個總體均值之差的區(qū)間估計6.4.2 兩個總體比例之差的區(qū)間估計兩個總體比例之差的區(qū)間估計6.4.3 兩個總體方差比的區(qū)間估計兩個總體方差比的區(qū)間估計兩個總體參數(shù)的區(qū)間估計總體參數(shù)總體參數(shù)符號表示符號表示樣本統(tǒng)計量樣本統(tǒng)計量均值差比例差方差比2121222121xx 21pp 2221ss兩個總體均值之差的區(qū)間估計(獨立大樣本)兩個總體均值之差的估計(大樣本)o1.假定條件兩個總體都服從正態(tài)分布,1、 2已知若不是正態(tài)分布, 可以用正態(tài)分布來近似(n130和n230)兩個樣本是獨立的隨機樣本使用正態(tài)分布統(tǒng)計量
20、 z) 1 , 0()()(2221212121Nnnxxz兩個總體均值之差的估計 (大樣本)o1.1, 2已知時,兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為222121221)(nnzxx222121221)(nsnszxx兩個總體均值之差的估計(例題分析) 兩個樣本的有關數(shù)據(jù)兩個樣本的有關數(shù)據(jù) 中學中學1中學中學2n1=46n1=33S1=5.8 S2=7.2861x782x兩個總體均值之差的估計(例題分析)97.10,03. 5(97. 28332 . 7468 . 596. 1)7886()(22222121221nsnszxx兩個總體均值之差的區(qū)間估計(獨立小樣本)兩個總體
21、均值之差的估計(小樣本: 12 22 )o1.假定條件兩個總體都服從正態(tài)分布兩個總體方差未知但相等:1=2兩個獨立的小樣本(n130和n230)總體方差的合并估計量2) 1() 1(212222112nnsnsnsp21221211nnsnsnsppp兩個總體均值之差的估計(小樣本: 1222 )兩個樣本均值之差的標準化)2(11)()(21212121nntnnsxxtp21221221112nnsnntxxp兩個總體均值之差的估計(例題分析)兩個方法組裝產(chǎn)品所需的時間兩個方法組裝產(chǎn)品所需的時間 方法方法1方法方法228.336.027.631.730.137.222.226.029.038
22、.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5兩個總體均值之差的估計(例題分析)5 .321x996.1521s8 .282x358.1922s677.1721212358.19) 112(996.15) 112(2ps56. 37 . 3121121677.170739. 2)8 .285 .32(兩個總體均值之差的估計(小樣本: 12 22 )o1.假定條件兩個總體都服從正態(tài)分布兩個總體方差未知且不相等:12兩個獨立的小樣本(n130和n230)使用統(tǒng)計量)()()(2221212121vtnsnsxxt兩個總體均值之差
23、的估計(小樣本: 1222 )o兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為222121221)(nsnsvtxx1222221121212222121nnsnnsnsnsv兩個總體均值之差的估計(例題分析)兩個方法組裝產(chǎn)品所需的時間兩個方法組裝產(chǎn)品所需的時間 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.2兩個總體均值之差的估計(例題分析)5 .321x996.1521s875.272x014.2322s13188.13188014.2311212996
24、.158014.2312996.15222v433. 4625. 48014.2312996.151604. 2)875.275 .32(兩個總體均值之差的區(qū)間估計(匹配樣本)兩個總體均值之差的估計(匹配大樣本)假定條件兩個匹配的大樣本(n1 30和n2 30)兩個總體各觀察值的配對差服從正態(tài)分布兩個總體均值之差d =1-2在1- 置信水平下的置信區(qū)間為nzdd2兩個總體均值之差的估計(匹配小樣本)假定條件兩個匹配的小樣本(n1 30和n2 30)兩個總體各觀察值的配對差服從正態(tài)分布 兩個總體均值之差d=1-2在1- 置信水平下的置信區(qū)間為nsntdd) 1(2兩個總體均值之差的估計(例題分析
25、) 10名學生兩套試卷的得分名學生兩套試卷的得分 學生編號學生編號試卷試卷A試卷試卷B差值差值d17871726344193726111489845691741754951-27685513876601698577810553916兩個總體均值之差的估計(例題分析)11101101dniindd53. 61)(12dniidndds67. 4111053. 62622. 211) 1(2nsntdd兩個總體比例之差區(qū)間的估計o1.假定條件兩個總體服從二項分布可以用正態(tài)分布來近似兩個樣本是獨立的o2.兩個總體比例之差1- 2在1- 置信水平下的置信區(qū)間為兩個總體比例之差的區(qū)間估計22211122
26、1)1 ()1 (nppnppzpp兩個總體比例之差的估計(例題分析)兩個總體比例之差的估計 (例題分析)%32.19,%68. 6%32. 6%13400%)321 (%32500%)451 (%4596. 1%32%45兩個總體方差比的區(qū)間估計兩個總體方差比的區(qū)間估計o1.比較兩個總體的方差比用兩個樣本的方差比來判斷如果S12/ S22接近于1,說明兩個總體方差很接近如果S12/ S22遠離1,說明兩個總體方差之間存在差異2.總體方差比在1-置信水平下的置信區(qū)間為212221222122221FssFss),(1),(1222121nnFnnF兩個總體方差比的區(qū)間估計(圖示)兩個總體方差比的區(qū)間估計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 腦??祻徒】到逃c解析
- 初中信息技術課件網(wǎng)站app
- 神經(jīng)外科多學科協(xié)作診療模式
- 血管損傷護理查房
- 大班幼兒疾病防治健康教育
- 教育政策對教師開展議題式教學的支持與挑戰(zhàn)
- 二零二五年度文化創(chuàng)意產(chǎn)業(yè)合作變更合同條款補充協(xié)議
- 2025版綠色節(jié)能型辦公室改造項目合同樣本
- 2025版爆破工程環(huán)保驗收合同范本
- 2025年財務擔保人信用責任合同范本
- 校園清廉建設活動方案
- 韶光新豐縣豐城街道辦事處招聘執(zhí)法輔助人員筆試真題2024
- 檢查檢驗結(jié)果互認工作管理制度
- 高速公路服務區(qū)保潔培訓
- 硬膜外血腫的護理常規(guī)
- 光伏電站安全生產(chǎn)管理制度匯編
- 農(nóng)村小學生科技活動方案
- 四川省涼山彝族自治州2023-2024學年八年級下學期7月期末考試數(shù)學試卷(含答案)
- 電腦設備報廢管理制度
- 2025-2030年中國工業(yè)大數(shù)據(jù)行業(yè)市場深度調(diào)研及前景趨勢與投資研究報告
- 2025年北京高考物理試卷真題(含答案解析)
評論
0/150
提交評論