




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1. 抽樣誤差 Sampling error n抽樣(chu yn)誤差n中心極限定理n標(biāo)準(zhǔn)誤n抽樣(chu yn)分布n參數(shù)估計第1頁/共80頁第一頁,共81頁。了解(lioji)抽樣誤差的重要性總體(zngt)同質(zhì)、個體變異總體(zngt)參數(shù)未知樣本代表性、抽樣誤差隨機(jī)抽樣樣本統(tǒng)計量已知統(tǒng)計推斷風(fēng) 險2第2頁/共80頁第二頁,共81頁。3抽樣誤差 假如事先知道某地七歲男童的平均身高為119.41cm119.41cm。為了估計七歲男童的平均身高(總體均數(shù)),研究者從所有符合要求的七歲男童中每次抽取(chu q)100(chu q)100人,共計抽取(chu q)(chu q)了三次。119
2、.41cm= 4.38cmXs118.21cm=4.45cm Xs120.18cm=4.90cm Xs120.81cm=4.33cm 第3頁/共80頁第三頁,共81頁。抽樣誤差nsampling error,sampling variabilityn 由抽樣引起(ynq)的樣本統(tǒng)計量與總體參數(shù)間的差別。n 原因:個體變異抽樣n 表現(xiàn):n樣本統(tǒng)計量與總體參數(shù)間的差別n不同樣本統(tǒng)計量間的差別n 抽樣誤差是不可避免的!n 抽樣誤差是有規(guī)律的! 4第4頁/共80頁第四頁,共81頁。5模擬(mn)試驗(yàn) 假設(shè)一個(y )已知總體,從該總體中抽樣,對每個樣本計算樣本統(tǒng)計量(均數(shù)、方差等),觀察樣本統(tǒng)計量的分
3、布規(guī)律抽樣分布規(guī)律。 考察: 不同的分布 不同的樣本含量對統(tǒng)計量的影響。第5頁/共80頁第五頁,共81頁。6均數(shù)的模擬(mn)試驗(yàn) 從不同總體中進(jìn)行抽樣,觀察(gunch)均數(shù)的抽樣分布規(guī)律。 正態(tài)總體 偏三角分布總體 均勻分布總體 指數(shù)分布總體 雙峰分布總體 考察: 樣本均數(shù)的均數(shù)與總體均數(shù)有何關(guān)系? 樣本均數(shù)的標(biāo)準(zhǔn)差與總體標(biāo)準(zhǔn)差有何關(guān)系? 樣本均數(shù)的分布形狀如何? 不同的樣本含量對上述性質(zhì)的影響如何?第6頁/共80頁第六頁,共81頁。7正態(tài)分布樣本(yngbn)均數(shù)的分布樣本樣本編號編號n=4樣本樣本均數(shù)均數(shù)樣本樣本標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差最小值最小值最大值最大值抽樣抽樣誤差誤差19898104979
4、9.42.997104-0.6299981009597.81.795100-2.2310310910995104.16.1951094.1493949910096.43.193100-3.6510410590106101.26.4901061.26104921038395.68.683104-4.4799107949799.44.994107-0.68100103969297.94.192103-2.199297949494.31.99297-5.710100102959798.22.895102-1.8從從N(100,62)中隨機(jī)抽樣,樣本含量中隨機(jī)抽樣,樣本含量(hnling)為為4的的
5、10份獨(dú)立樣本的份獨(dú)立樣本的均數(shù)、標(biāo)準(zhǔn)差、抽樣誤差均數(shù)、標(biāo)準(zhǔn)差、抽樣誤差第7頁/共80頁第七頁,共81頁。8樣本(yngbn)均數(shù)的均數(shù)和標(biāo)準(zhǔn)差 1011199.497.898.298.41001010iiXX 22199.498.498.298.42.82101101634niiXXXsn 第8頁/共80頁第八頁,共81頁。結(jié)論(jiln) 1 各樣本均數(shù)未必等于(dngy)總體均數(shù); 樣本均數(shù)間存在差異;9第9頁/共80頁第九頁,共81頁。 由抽樣實(shí)驗(yàn)所得的1000個樣本作出其均數(shù) 分布直方圖。曲線(qxin)是對抽樣得到的1000個 數(shù)據(jù)擬合的分布曲線(qxin)。 X10第10頁/共8
6、0頁第十頁,共81頁。11從N(100,62)中隨機(jī)抽樣,樣本(yngbn)含量為4的1000個樣本(yngbn)均數(shù)的頻率分布圖0.05.1.1580.090.0100.0110.0120.0Sample Mean正態(tài)總體分布樣本(yngbn)均數(shù)服從正態(tài)分布第11頁/共80頁第十一頁,共81頁。結(jié)論(jiln)2 的分布很有規(guī)律,圍繞著,中間多,兩邊少,左右基本對稱; 樣本均數(shù)的變異范圍較之原變量(binling)的變異范圍大大縮??;X12第12頁/共80頁第十二頁,共81頁。13 Sampling Distributionof sample means Sampling Distribu
7、tionof sample means Sampling Distributionof sample means Population BX XPopulation C XPopulation DXPopulation An=10n=4n=25n=2Sampling Distributionof sample meansSampling distribution for means 第13頁/共80頁第十三頁,共81頁。14結(jié)論(jiln)3n隨著樣本含量的增加,變異越小,樣本均數(shù)的變異范圍逐漸縮?。磺遗c樣本含量的平方根成反比n對稱分布接近(jijn)正態(tài)分布的速度,大于非對稱分布。分布越偏,
8、接近(jijn)正態(tài)分布所需樣本含量就越大。n隨著樣本含量的增加,均數(shù)的均數(shù)就越接近(jijn)總體均數(shù);第14頁/共80頁第十四頁,共81頁。2.中心極限(jxin)定理 central limit theorem n抽樣誤差n中心極限定理(dngl)n標(biāo)準(zhǔn)誤n抽樣分布n參數(shù)估計第15頁/共80頁第十五頁,共81頁。16從N(100,62)中隨機(jī)抽樣,樣本(yngbn)含量為4的1000個樣本(yngbn)均數(shù)的頻率分布圖0.05.1.1580.090.0100.0110.0120.0Sample Mean正態(tài)總體分布樣本(yngbn)均數(shù)服從正態(tài)分布第16頁/共80頁第十六頁,共81頁。中
9、心極限定理(central limit theorem) Case 1: 從正態(tài)分布總體(zngt)N(,2),中隨機(jī)抽樣(每個樣本的含量為n),可得無限多個樣本,每個樣本計算樣本均數(shù),則樣本均數(shù)也服從正態(tài)分布。樣本均數(shù)的均數(shù)為 ;樣本均數(shù)的標(biāo)準(zhǔn)差為 。 xn 17第17頁/共80頁第十七頁,共81頁。18第18頁/共80頁第十八頁,共81頁。19第19頁/共80頁第十九頁,共81頁。中心極限(jxin)定理Case 2:從非正態(tài)(nonnormal)分布總體(均數(shù)為,方差為2)中隨機(jī)抽樣(每個樣本(yngbn)的含量為n),可得無限多個樣本(yngbn),每個樣本(yngbn)計算樣本(yn
10、gbn)均數(shù),則只要樣本(yngbn)含量足夠大(n50),樣本(yngbn)均數(shù)也近似服從正態(tài)分布。樣本(yngbn)均數(shù)的均數(shù)為 ;樣本(yngbn)均數(shù)的標(biāo)準(zhǔn)差為 。 xn 20第20頁/共80頁第二十頁,共81頁。3.標(biāo)準(zhǔn)(biozhn)誤 standard error n抽樣誤差n中心極限定理n標(biāo)準(zhǔn)(biozhn)誤n抽樣分布n參數(shù)估計第21頁/共80頁第二十一頁,共81頁。標(biāo)準(zhǔn)(biozhn)誤(standard error)n樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)的標(biāo)準(zhǔn)樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。差稱為均數(shù)的標(biāo)準(zhǔn)誤。n均數(shù)的標(biāo)準(zhǔn)誤表示樣本均數(shù)的
11、變異度。均數(shù)的標(biāo)準(zhǔn)誤表示樣本均數(shù)的變異度。n當(dāng)總體標(biāo)準(zhǔn)差未知時,用樣本標(biāo)準(zhǔn)差代替,當(dāng)總體標(biāo)準(zhǔn)差未知時,用樣本標(biāo)準(zhǔn)差代替,n前者前者(qin zh)(qin zh)稱為理論標(biāo)準(zhǔn)誤,后者稱為樣本標(biāo)稱為理論標(biāo)準(zhǔn)誤,后者稱為樣本標(biāo)準(zhǔn)誤。準(zhǔn)誤。 xn xssn22中心(zhngxn)極限定理第22頁/共80頁第二十二頁,共81頁。23標(biāo)準(zhǔn)(biozhn)誤的意義 反映了樣本統(tǒng)計量分布的離散程度,體現(xiàn)了抽樣誤差的大小(dxio)(dxio)。 標(biāo)準(zhǔn)誤越大,說明樣本統(tǒng)計量的離散程度越大,即用樣本統(tǒng)計量來直接估計總體參數(shù)越不精確。反之亦然。 標(biāo)準(zhǔn)誤的大小(dxio)(dxio)與標(biāo)準(zhǔn)差有關(guān),在例數(shù)n n一定時
12、,從標(biāo)準(zhǔn)差大的總體中抽樣,標(biāo)準(zhǔn)誤較大;而當(dāng)總體一定時,樣本例數(shù)越多,標(biāo)準(zhǔn)誤越小。說明我們可以通過增加樣本含量來減少抽樣誤差的大小(dxio)(dxio)。 xssn第23頁/共80頁第二十三頁,共81頁。4. 抽樣(chu yn)分布(1) t-distribution n抽樣(chu yn)誤差n中心極限定理n標(biāo)準(zhǔn)誤n抽樣(chu yn)分布n參數(shù)估計第24頁/共80頁第二十四頁,共81頁。正態(tài)分布的標(biāo)準(zhǔn)化變化(binhu)n若 X N(,) , 則 。 (0,1)XN n因 ,則 。 (0,1)XXuN XXN( ,) 25第25頁/共80頁第二十五頁,共81頁。從正態(tài)分布總體(zngt)
13、中1000次抽樣的 u 值的分布(n=4)Fractionu-4-3-2-1012340.05.1.15.2均數(shù)為 0.007559標(biāo)準(zhǔn)差為 1.006294 26總體(zngt)方差已知第26頁/共80頁第二十六頁,共81頁。t 分布(fnb)的概念n實(shí)際工作中,總體方差未知。所以,用樣本方差代替(dit)總體方差,n此時 的分布如何?XXs 27第27頁/共80頁第二十七頁,共81頁。從正態(tài)分布總體(zngt)中1000次抽樣的 值的分布(n=4)Fractiont-8-6-4-2024680.05.1.15.2.25.3.35均數(shù)為 0.05696標(biāo)準(zhǔn)差為 1.55827 XXs 28第
14、28頁/共80頁第二十八頁,共81頁。t 分布(fnb)的概念n用樣本方差代替總體方差,此時(c sh)n不服從正態(tài)分布。 XXs 29第29頁/共80頁第二十九頁,共81頁。 1908年,年,W.S.Gosset (1876-1937)以筆名以筆名(bmng)Student發(fā)表了著名的發(fā)表了著名的t分布,分布,證明了:證明了: 設(shè)從正態(tài)分布設(shè)從正態(tài)分布N(,2)中隨機(jī)抽取含量為中隨機(jī)抽取含量為n的樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為的樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為 和和s,設(shè):,設(shè):XXXts則t值服從(fcng)自由度為n-1的t分布(t-distribution)。t 分布(fnb)的概念(1)n
15、XXtts 記為:30第30頁/共80頁第三十頁,共81頁。圖圖 自由度分別自由度分別(fnbi)為為1、5、時的時的t分布分布t分布(fnb)圖形 f(t) =(標(biāo)準(zhǔn)正態(tài)曲線標(biāo)準(zhǔn)正態(tài)曲線) =5 =10.10.2-4-3-2-1012340.331第31頁/共80頁第三十一頁,共81頁。t分布(fnb)的特征t分布(fnb)是一簇曲線,當(dāng)不同時,曲線形狀不同;單峰分布(fnb),以0為中心,左右對稱;當(dāng)逼近時,t分布(fnb)逼近u分布(fnb),故標(biāo)準(zhǔn)正態(tài)分布(fnb)是t分布(fnb)的特例;t分布(fnb)曲線下面積是有規(guī)律的。請看演示(ynsh)t 分布32第32頁/共80頁第三十二
16、頁,共81頁。t界值表n表上陰影部分,表示t,以外的尾部面積占總面積百分?jǐn)?shù),即概率P。n表中數(shù)據(jù)表示與確定(qudng)時相應(yīng)的t界值(critical value),常記為t,。33第33頁/共80頁第三十三頁,共81頁。-t0t抽樣抽樣(chu yn)總體總體(zngt)樣本樣本(yngbn)t1t2t3t4tn-3tn-2tn-1tn統(tǒng)計量統(tǒng)計量分布t分布表明,從正態(tài)分布總體中隨機(jī)抽取的樣本,由樣本計算的t值接近0的可能性較大,遠(yuǎn)離0的可能性較小。 XXts34第34頁/共80頁第三十四頁,共81頁。 例如(lr),當(dāng)=10,單尾概率=0.05時,查表得單尾t0.05,10=1.812,
17、則: P(t-1.812)=0.05 或P(t1.812)=0.05表明:按t分布的規(guī)律,從正態(tài)分布總體中抽取樣本含量(hnling)為n=11的樣本,則由該樣本計算的t值大于等于1.812的概率為0.05,或者小于等于-1.812的概率亦為0.05。-1.81200.050.051.81235第35頁/共80頁第三十五頁,共81頁。例如(lr),當(dāng)=10,雙尾概率=0.05時,查表得雙尾t0.05,102.228,則: P(t-2.228)+P(t2.228)0.05或:P(-2.228t2.228)=1-0.05=0.95。表明:按t分布的規(guī)律(gul),從正態(tài)分布總體中抽取樣本含量為n=
18、11的樣本,則由該樣本計算的t值大于等于2.228的概率為0.025,小于等于-2.228的概率亦為0.025。-2.22800.0250.0252.22836第36頁/共80頁第三十六頁,共81頁。 單尾:P(t- t , )= ,或P(tt , )= 雙尾:P(t- t /2, )+P(tt /2, )= , 即P(-t /2, t100n=120100,標(biāo)準(zhǔn)正態(tài)分布代替t t分布,u0.10=1.64u0.10=1.64 142.67 142.67 1.64 1.64 0.5477= 141.770.5477= 141.77143.57143.57即該市1212歲男童平均身高(shn o
19、)(shn o)的9090可信區(qū)間為:141.77141.77143.57(cm)143.57(cm),可認(rèn)為該市1212歲男童平均身高(shn o)(shn o)在141.77141.77143.57(cm)143.57(cm)之間 。 第63頁/共80頁第六十三頁,共81頁。6 )均數(shù)之差的(1-)100%可信區(qū)間(q jin)例4.3 轉(zhuǎn)鐵蛋白含量(page41)正常人:n1=12,病人:n2=15,問題:兩組平均(pngjn)相差多少?12271.89, 10.38235.21, 14.39XsXs第64頁/共80頁第六十四頁,共81頁。問題(wnt): 正常(zhngchng)組 病
20、人組 2?均 數(shù): 235.21ug/dl標(biāo)準(zhǔn)差: 14.39ug/dl 1?均 數(shù): 271.89ug/dl標(biāo)準(zhǔn)差: 10.28ug/dl 1- 2 ?1236.68XX第65頁/共80頁第六十五頁,共81頁。與均數(shù)之差有關(guān)的抽樣與均數(shù)之差有關(guān)的抽樣(chu yn)分布分布 “均數(shù)之差”與“均數(shù)之差的標(biāo)準(zhǔn)誤”之比,服從自由度 = n1+n2 -2的 t 分布。樣本(yngbn)含量較大時,服從標(biāo)準(zhǔn)正態(tài)分布。1212122 nnXXXXtts 1212 (0,1)XXXXtNs 第66頁/共80頁第六十六頁,共81頁。合并合并(hbng)方差與均數(shù)之差的方差與均數(shù)之差的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤n合并方差(
21、fn ch)(方差(fn ch)的加權(quán)平均)n均數(shù)之差的標(biāo)準(zhǔn)誤222112212(1)(1)2Cnsnssnn 1221211()CXXssnn 第67頁/共80頁第六十七頁,共81頁。計算(j sun):則合并(hbng)方差為:自由度為=n1+n2-2=12+15-2=25、0.05的t界值為:t0.05,25=2.060 ,則兩組均數(shù)之差的95可信區(qū)間(q jin)為:(271.89235.21 ) 2.060 4.95 = 26.48 46.883679.1632151239.141438.1011222cs95. 41511213679.1631121221nnsscXX第68頁/共
22、80頁第六十八頁,共81頁。結(jié)論(jiln): 病 毒 性 肝 炎 患 者 ( h u n z h ) 的 血 清 轉(zhuǎn) 鐵 蛋 白 含 量 較 正 常 人 平 均 低36.68(g/dl),其95可信區(qū)間為26.4846.88(g/dl)。 第69頁/共80頁第六十九頁,共81頁。 可信區(qū)間一旦形成,它要么包含總體參數(shù),要么不包含總體參數(shù),二者必居其一,無概率可言。所謂9595的可信度是針對(zhndu)(zhndu)可信區(qū)間的構(gòu)建方法而言的。 以均數(shù)的可信區(qū)間為例,其涵義是:如果重復(fù)100100次抽樣,每次樣本含量均為n n,每個樣本均按 構(gòu)建可信區(qū)間,則在此100100個可信區(qū)間內(nèi),理論上
23、有9595個包含總體均數(shù),而有5 5個不包含總體均數(shù)。 XstX,05. 0正確理解可信區(qū)間(q jin):第70頁/共80頁第七十頁,共81頁。95%可信區(qū)間(q jin)的含義-2 -1 0 1 2 按這種方法構(gòu)建的可信區(qū)間,理 論 上 平 均(pngjn)每100次,有95次可以估計到總體參數(shù)。第71頁/共80頁第七十一頁,共81頁。正確理解可信區(qū)間(q jin)的涵義 在區(qū)間估計中,總體參數(shù)雖未知,但卻是固定的值(且只有(zhyu)(zhyu)一個),而不是隨機(jī)變量值 。第72頁/共80頁第七十二頁,共81頁。下列說法(shuf)正確嗎?算得某95%95%的可信區(qū)間(q jin)(q
24、jin),則: 總體參數(shù)有95%95%的可能落在該區(qū)間(q jin)(q jin)。 有95%95%的總體參數(shù)在該區(qū)間(q jin)(q jin)內(nèi)。 該區(qū)間(q jin)(q jin)包含95%95%的總體參數(shù)。 該區(qū)間(q jin)(q jin)有95%95%的可能包含總體參數(shù)。 該區(qū)間(q jin)(q jin)包含總體參數(shù),可信度為95%95%。第73頁/共80頁第七十三頁,共81頁??尚艆^(qū)間與參考值范圍(fnwi)的區(qū)別 可信區(qū)間用于估計(gj)(gj)總體參數(shù),總體參數(shù)只有一個 。 參考值范圍用于估計(gj)(gj)變量值的分布范圍,變量值可能很多甚至無限 。 95%95%的可信區(qū)間中的95%95%是可信度,即所求可信區(qū)間包含總體參數(shù)的可信程度為95%95% 95
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 4《不做“小馬虎”》(教學(xué)設(shè)計) 2023-2024學(xué)年統(tǒng)編版道德與法治一年級下冊
- 河北對外經(jīng)貿(mào)職業(yè)學(xué)院《生物合成藥物學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣州東華職業(yè)學(xué)院《織物產(chǎn)品結(jié)構(gòu)與工藝(二)》2023-2024學(xué)年第二學(xué)期期末試卷
- 鄭州工程技術(shù)學(xué)院《國外文學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 河源廣東河源紫金縣專門學(xué)校駐校教官招聘7人筆試歷年參考題庫附帶答案詳解
- 新疆農(nóng)業(yè)大學(xué)《工作分析》2023-2024學(xué)年第二學(xué)期期末試卷
- 梅河口康美職業(yè)技術(shù)學(xué)院《緬甸語閱讀》2023-2024學(xué)年第二學(xué)期期末試卷
- 凍土共振柱試驗(yàn)機(jī)項(xiàng)目效益評估報告
- Unit 5 In the Park Lesson 2(教學(xué)設(shè)計)-2024-2025學(xué)年人教新起點(diǎn)版英語二年級上冊
- 重慶城市科技學(xué)院《建筑結(jié)構(gòu)與平法識圖》2023-2024學(xué)年第二學(xué)期期末試卷
- 小學(xué)生勤儉節(jié)約課件
- 化工行業(yè)生產(chǎn)過程安全管理升級策略方案
- 慢性胰腺炎病教學(xué)查房
- 中考英語復(fù)習(xí)閱讀理解-主旨大意題、推理判斷題
- 電解質(zhì)溶液的圖像分析(原卷版)-2025年高考化學(xué)一輪復(fù)習(xí)講義(新教材新高考)
- 2025年中考?xì)v史一輪復(fù)習(xí)知識清單:隋唐時期
- 【生物】蒸騰作用- 2024-2025學(xué)年七年級上冊生物(北師大版2024)
- 《井巷掘進(jìn)作業(yè)》課件
- 提高鋁合金外窗防滲漏施工一次合格率
- 銀行保安服務(wù) 投標(biāo)方案(技術(shù)方案)
- 農(nóng)村砍樹賠償合同模板
評論
0/150
提交評論