版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第三章 抽樣誤差Sampling Error易洪剛Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University.主要內(nèi)容抽樣誤差中心極限定理規(guī)范誤分布 2 分布F分布 .1. 抽樣誤差 Sampling Error 抽樣誤差中心極限定理規(guī)范誤統(tǒng)計(jì)分布.了解抽樣誤差的重要性總體同質(zhì)、個(gè)體變異總體參數(shù)未知樣本代表性、抽樣誤差隨機(jī)抽樣樣本統(tǒng)計(jì)量知統(tǒng)計(jì)推斷風(fēng) 險(xiǎn).抽樣誤差sampling error,sampling variability 由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間
2、的差別。 緣由:個(gè)體變異抽樣 表現(xiàn):樣本統(tǒng)計(jì)量與總體參數(shù)間的差別不同樣本統(tǒng)計(jì)量間的差別 抽樣誤差是不可防止的! 抽樣誤差是有規(guī)律的! .假設(shè)一個(gè)知總體,從該總體中抽樣,對(duì)每個(gè)樣本計(jì)算樣本統(tǒng)計(jì)量(均數(shù)、方差等),察看樣本統(tǒng)計(jì)量的分布規(guī)律抽樣分布規(guī)律。均數(shù)的模擬實(shí)驗(yàn).均數(shù)的模擬實(shí)驗(yàn)調(diào)查:樣本均數(shù)的均數(shù)與總體均數(shù)有何關(guān)系?樣本均數(shù)的規(guī)范差與總體規(guī)范差有何關(guān)系?樣本均數(shù)的分布外形如何?不同的樣本含量對(duì)上述性質(zhì)的影響如何?.抽樣分布規(guī)律 = 5.0 = 0.5樣本含量n =10抽樣次數(shù)m =100 =5.19 S =0.42 =5.04 S = 0.44紅細(xì)胞計(jì)數(shù) =5.03 S =0.52.Fract
3、ionx2.52.83.13.43.744.34.64.95.25.55.86.16.46.777.37.67.90.1.2.3圖 正態(tài)分布N5.00,0.502總體分布.結(jié)論 1各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)間存在差別;. 由抽樣實(shí)驗(yàn)所得的100個(gè)樣本作出其均數(shù)分布直方圖如圖4.1。曲線(xiàn)是對(duì)抽樣得到的100個(gè) 數(shù)據(jù)擬合的分布曲線(xiàn)。 .Fraction2.52.83.13.43.744.34.64.95.25.55.86.16.46.777.37.67.90.1.2.3.4.5.6.7.8.91圖 從正態(tài)分布N5.00,0.502總體中抽樣樣本均數(shù)的分布 .圖 從正態(tài)分布N5.00,0.
4、502總體中抽樣樣本均數(shù)的分布 Fraction4.14.44.755.35.65.90.1.2.3.4.5.結(jié)論2 的分布很有規(guī)律,圍繞著,中間多,兩邊少,左右根本對(duì)稱(chēng);樣本均數(shù)的變異范圍較之原變量的變異范圍大大減少;.2.中心極限定理 Central Limit Theorem 抽樣誤差中心極限定理規(guī)范誤分布.中心極限定理(central limit theorem) 一從均數(shù)為、規(guī)范差為 的正態(tài)總體中,獨(dú)立隨機(jī)抽取例數(shù)為n的樣本,樣本均數(shù) 的分布服從正態(tài)分布;樣本均數(shù)的均數(shù)為 ;樣本均數(shù)的規(guī)范差為 。.不同類(lèi)型的總體分布,對(duì)于統(tǒng)計(jì)量分布有何影響?正態(tài)分布總體偏三角分布總體均勻分布總體指數(shù)
5、分布總體雙峰分布總體中心極限定理.中心極限定理 二從非正態(tài)(nonnormal)分布總體(均數(shù)為,方差為)中隨機(jī)抽樣(每個(gè)樣本的含量為n),可得無(wú)限多個(gè)樣本,每個(gè)樣本計(jì)算樣本均數(shù),那么只需樣本含量足夠大(n50),樣本均數(shù)也近似服從正態(tài)分布。樣本均數(shù)的均數(shù)為 ;樣本均數(shù)的規(guī)范差為 。.3.規(guī)范誤 standard error 抽樣誤差中心極限定理規(guī)范誤分布.規(guī)范誤(standard error)樣本統(tǒng)計(jì)量的規(guī)范差稱(chēng)為規(guī)范誤。樣本均數(shù)的規(guī)范差稱(chēng)為均數(shù)的規(guī)范誤。均數(shù)的規(guī)范誤表示樣本均數(shù)的變異度。當(dāng)總體規(guī)范差未知時(shí),用樣本規(guī)范差替代,前者稱(chēng)為實(shí)際規(guī)范誤,后者稱(chēng)為樣本規(guī)范誤。.與規(guī)范差的關(guān)系1、意義上
6、規(guī)范差描畫(huà)個(gè)體值之間的變異,即察看值間的離散程度;而規(guī)范誤是描畫(huà)統(tǒng)計(jì)量的抽樣誤差,即樣本統(tǒng)計(jì)量和總體參數(shù)的接近程度;2、用途上規(guī)范差常用于表現(xiàn)察看值的動(dòng)搖范圍;規(guī)范誤常表示抽樣誤差的大小,估計(jì)總體參數(shù)可信區(qū)間。3、與樣本含量規(guī)范差是隨著樣本含量的增多,逐漸趨于穩(wěn)定。規(guī)范誤是隨著樣本含量的增多,逐漸減少。區(qū)別.與規(guī)范差的關(guān)系首先,規(guī)范差和規(guī)范誤都是變異目的,闡明個(gè)體之間的變異用規(guī)范差,闡明統(tǒng)計(jì)量之間的變異用規(guī)范誤。其次,當(dāng)樣本含量不變時(shí),規(guī)范差大,規(guī)范誤亦越大,均數(shù)的規(guī)范誤與規(guī)范差成正比。聯(lián)系.4. t分布 t-distribution 抽樣誤差中心極限定理規(guī)范誤分布.正態(tài)分布的規(guī)范化變化假設(shè)
7、X N(,) , 那么 。 因 ,那么 。 .從正態(tài)分布總體中1000次抽樣的 u 值的分布(n=4)Fractionu-4-3-2-1012340.05.1.15.2均數(shù)為 0.007559規(guī)范差為 1.006294 .t 分布的概念實(shí)踐任務(wù)中,總體方差未知。所以,用樣本方差替代總體方差,此時(shí) 的分布如何?.從正態(tài)分布總體中1000次抽樣的 值的分布(n=4)Fractiont-8-6-4-2024680.05.1.15.2.25.3.35均數(shù)為 0.05696規(guī)范差為 1.55827 .t 分布的概念用樣本方差替代總體方差,此時(shí)不服從正態(tài)分布。.1908年,W.S.Gosset (1876
8、-1937)以筆名Student發(fā)表了著名的t分布,證明了:設(shè)從正態(tài)分布N(,2)中隨機(jī)抽取含量為n的樣本,樣本均數(shù)和規(guī)范差分別為 和s,設(shè):那么t值服從自在度為n-1的t分布。t 分布的概念記為:.圖 自在度分別為1、5、時(shí)的t分布t分布圖形 f(t) =(規(guī)范正態(tài)曲線(xiàn)) =5 =10.10.2-4-3-2-1012340.3.t分布的特征t分布是一簇曲線(xiàn),當(dāng)不同時(shí),曲線(xiàn)外形不同;單峰分布,以0為中心,左右對(duì)稱(chēng);當(dāng)逼近時(shí),t分布逼近u分布,故規(guī)范正態(tài)分布是t分布的特例;t分布曲線(xiàn)下面積是有規(guī)律的。請(qǐng)看演示t 分布.t界值表表上陰影部分,表示t,以外的尾部面積占總面積百分?jǐn)?shù),即概率P。表中數(shù)據(jù)
9、表示與確定時(shí)相應(yīng)的t界值critical value,常記為t,。.-t0t抽樣總體樣本t1t2t3t4tn-3tn-2tn-1tn統(tǒng)計(jì)量分布t分布闡明,從正態(tài)分布總體中隨機(jī)抽取的樣本,由樣本計(jì)算的t值接近0的能夠性較大,遠(yuǎn)離0的能夠性較小。 .例如,當(dāng)=10,單尾概率=0.05時(shí),查表得單尾t0.05,10=1.812,那么:P(t-1.812)=0.05或P(t1.812)=0.05闡明:按t分布的規(guī)律,從正態(tài)分布總體中抽取樣本含量為n=11的樣本,那么由該樣本計(jì)算的t值大于等于1.812的概率為0.05,或者小于等于-1.812的概率亦為0.05。-1.81200.050.051.812
10、.例如,當(dāng)=10,雙尾概率=0.05時(shí),查表得雙尾t0.05,102.228,那么: P(t-2.228)+P(t2.228)0.05或:P(-2.228t2.228)=1-0.05=0.95。闡明:按t分布的規(guī)律,從正態(tài)分布總體中抽取樣本含量為n=11的樣本,那么由該樣本計(jì)算的t值大于等于2.228的概率為0.025,小于等于-2.228的概率亦為0.025。-2.22800.0250.0252.228.單尾:P(t- t,)=,或P(tt,)=雙尾:P(t- t/2,)+P(tt/2,)=, 即P(-t/2,t t/2,)=1-t0tt分布曲線(xiàn)下面積規(guī)律.5. 2分布 chi-distri
11、bution 抽樣誤差中心極限定理規(guī)范誤分布. 2 分布 設(shè)從正態(tài)分布N(,2)中隨機(jī)抽取含量為n的樣本,樣本均數(shù)和規(guī)范差分別為 和s,設(shè):2值服從自在度為n-1的2分布(2-distribution) .=4=3=520246810120.00.10.20.30.40.5f(2)=1=2=6 2 分布 請(qǐng)看演示 c2 分布.2分布的特征 (1) 2分布為一簇單峰正偏態(tài)分布曲線(xiàn) ;隨的逐漸加大,分布趨于對(duì)稱(chēng)。(2) 自在度為的2分布,其均數(shù)為,方差為2。(3) 自在度為的2分布實(shí)踐上是個(gè)規(guī)范正態(tài)分布變量之平方和。 2=u12+ u22+ uv2 .3.840.050.0250.0251.96-
12、1.962分布與正態(tài)分布的關(guān)系.(4) 每一自在度下的2分布曲線(xiàn)都有其本身分布規(guī)律。自在度為1的2分布界值0.00.10.20.30.40.53.840.05.2分布是方差的抽樣分布。 2分布闡明,從正態(tài)分布的總體中隨機(jī)抽樣,所得樣本的方差s2接近于總體方差2的能夠性大,遠(yuǎn)離總體方差的能夠性小。即2值接近其均數(shù)n-1的能夠性大,遠(yuǎn)離n-1的能夠性小。2分布的特征 .自在度10時(shí),20.025,1020.48,20.975,103.25。從正態(tài)分布的總體中隨機(jī)抽樣,得到的樣本其2值大于等于20.48的概率為0.025,小于等于3.25的概率亦為0.025。P(23.25)+P(220.48)0.
13、05 2分布的特征 .2分布近似描畫(huà)具有某種屬性的實(shí)踐頻數(shù)Ai與實(shí)際頻數(shù)Ti之間的抽樣誤差 2分布的特征 .6. F分布 F-distribution 抽樣誤差中心極限定理規(guī)范誤分布.F分布 設(shè)從兩個(gè)方差相等的正態(tài)分布N(1,2)和N(2,2)總體中隨機(jī)抽取含量分別為n1和n2的樣本,樣本均數(shù)和規(guī)范差分別為 、s1和 和s2。設(shè):那么F值服從自在度為(n1-1,n2-1)的F分布(F-distribution)。 .F分布的特征 (1) F分布為一簇單峰正偏態(tài)分布曲線(xiàn),與兩個(gè)自在度有關(guān)。 (2) 假設(shè)F服從自在度為(1,2)的F分布,那么其倒數(shù)1/F服從自在度為(2,1)的F分布。(3) 自在度為(1,2)的F分布,其均數(shù)為2/(2-2),與第一自在度無(wú)關(guān)。(4) 第一自在度11時(shí),F(xiàn)分布實(shí)踐上是t分布之平方;第二自在度2時(shí),F(xiàn)分布實(shí)踐上等于2分布。 請(qǐng)看演示F分布.(5) 每一對(duì)自在度下的F分布曲線(xiàn)下的面積分布規(guī)律。 PFF分布的特征 .F分布闡明,從兩個(gè)方差相等的正態(tài)分布總體中隨機(jī)抽取含量分別為n1和n2的樣本,計(jì)算所得F值,應(yīng)接近v2/(v2-2)。F(0.05;20,20)= 2.12
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度年福建省高校教師資格證之高等教育心理學(xué)自我檢測(cè)試卷A卷附答案
- 2024年度山西省高校教師資格證之高等教育法規(guī)通關(guān)提分題庫(kù)及完整答案
- 2024年合成膠粘劑項(xiàng)目投資申請(qǐng)報(bào)告代可行性研究報(bào)告
- 2024年私人損害賠償自愿協(xié)議
- 高校食品專(zhuān)業(yè)實(shí)驗(yàn)室安全管理探究
- 新形勢(shì)下企業(yè)經(jīng)濟(jì)管理創(chuàng)新思路探究
- 2024年商業(yè)樓宇化糞池建造協(xié)議范例
- 2024年加工區(qū)租賃協(xié)議
- 2024年度工程地質(zhì)勘察協(xié)議范本
- 2024屆安徽省安大附中高三下學(xué)期第一次診斷測(cè)試數(shù)學(xué)試題
- 時(shí)間介詞in,on,at的區(qū)別 教學(xué)課件
- 強(qiáng)度計(jì)算.常用材料的強(qiáng)度特性:陶瓷材料:陶瓷材料的抗彎強(qiáng)度計(jì)算
- 形勢(shì)與政策24秋-專(zhuān)題測(cè)驗(yàn)1-5-國(guó)開(kāi)-參考資料
- 2024年宗教知識(shí)競(jìng)賽測(cè)試題庫(kù)及答案(共100題)
- 湖北省危險(xiǎn)廢物監(jiān)管物聯(lián)網(wǎng)系統(tǒng)管理計(jì)劃填報(bào)說(shuō)明
- 大學(xué)生就業(yè)指南攻略課件
- 智能算力數(shù)據(jù)中心風(fēng)險(xiǎn)評(píng)估與應(yīng)對(duì)措施
- 八年級(jí)數(shù)學(xué)上冊(cè)第一學(xué)期期中綜合測(cè)試卷(湘教版 2024年秋)
- 公司法教案第四章公司法律制度
- 電氣設(shè)備故障預(yù)測(cè)與健康管理分析篇
- 中考語(yǔ)文知識(shí)點(diǎn)專(zhuān)題27 名著《紅星照耀中國(guó)》知識(shí)點(diǎn)
評(píng)論
0/150
提交評(píng)論