版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、抽樣誤差及可信區(qū)間Sampling Error & Confidence IntervalMedical Statistics醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第四講主要內(nèi)容抽樣誤差t 分布均數(shù)的可信區(qū)間 2主要內(nèi)容抽樣誤差抽樣誤差的定義抽樣誤差的表現(xiàn)抽樣誤差的規(guī)律性標(biāo)準(zhǔn)誤t 分布均數(shù)的可信區(qū)間 3抽樣誤差的定義假如某地成年男子血紅蛋白的總體均數(shù)為137.6g/L,標(biāo)準(zhǔn)差為10.8g/L。某研究者從該地所有成年男子中進(jìn)行了兩次隨機(jī)抽樣,每次抽取100人。結(jié)果如下:樣本1:132.811.2樣本2:140.312.8 4抽樣誤差的定義兩次抽樣得到了不同的結(jié)果,原因何在?個(gè)體變異隨機(jī)抽樣不同成人的血紅蛋白水平不同每次抽
2、到的人幾乎不同抽樣誤差 5抽樣誤差的定義由于個(gè)體變異的存在,在抽樣研究中產(chǎn)生樣本統(tǒng)計(jì)量和總體參數(shù)之間的差異,稱為抽樣誤差(sampling error)。注意:各種參數(shù)都有抽樣誤差,我們以均數(shù)為研究對(duì)象。 6主要內(nèi)容抽樣誤差抽樣誤差的定義抽樣誤差的表現(xiàn)抽樣誤差的規(guī)律性標(biāo)準(zhǔn)誤t 分布均數(shù)的可信區(qū)間 7抽樣誤差的表現(xiàn)抽樣誤差的表現(xiàn)樣本均數(shù)和總體均數(shù)間的差別樣本均數(shù)和樣本均數(shù)間的差別 8抽樣誤差的重要性總體同質(zhì)個(gè)體、個(gè)體變異總體參數(shù)未知樣本代表性、抽樣誤差隨機(jī)抽樣 樣本統(tǒng)計(jì)量 已知統(tǒng)計(jì)推斷風(fēng) 險(xiǎn) 9主要內(nèi)容抽樣誤差抽樣誤差的定義抽樣誤差的表現(xiàn)抽樣誤差的規(guī)律性標(biāo)準(zhǔn)誤t 分布均數(shù)的可信區(qū)間 10抽樣誤差
3、的規(guī)律性 既然抽樣誤差是有規(guī)律的,那么到底它的分布規(guī)律到底是怎樣的? 11蒙特-卡洛實(shí)驗(yàn) (Monte-Carlo Method) 12SAMPLE 1:x11 x12 x13 x14.x1nSAMPLE 2:x21 x22 x23 x24.x2nSAMPLE k:xk1 xk2 xk3 xk4.xkn原始總體k個(gè)樣本均數(shù)的頻數(shù)分布圖我們觀察到:從正態(tài)總體中隨機(jī)抽樣,其樣本均數(shù)服從正態(tài)分布;從任意總體中隨機(jī)抽樣,當(dāng)樣本含量足夠大時(shí),其樣本均數(shù)的分布逐漸逼近正態(tài)分布;樣本均數(shù)之均數(shù)的位置始終在總體均數(shù)的附近;隨著樣本含量的增加,樣本均數(shù)的離散程度越來(lái)越小,表現(xiàn)為樣本均數(shù)的分布范圍越來(lái)越窄,其高峰
4、越來(lái)越尖。 13樣本均數(shù)是總體均數(shù)的無(wú)偏估計(jì);樣本均數(shù)的標(biāo)準(zhǔn)差是抽樣誤差的度量; 14中心極限定理 (central limit theorem)從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)總體中隨機(jī)抽樣,樣本均數(shù)服從均數(shù)為,標(biāo)準(zhǔn)差為 的正態(tài)分布。從均數(shù)為,標(biāo)準(zhǔn)差為的任意總體中隨機(jī)抽樣,當(dāng)樣本含量足夠大時(shí),樣本均數(shù)近似服從均數(shù)為,標(biāo)準(zhǔn)差為 的正態(tài)分布。 15主要內(nèi)容抽樣誤差抽樣誤差的定義抽樣誤差的表現(xiàn)抽樣誤差的規(guī)律性標(biāo)準(zhǔn)誤t 分布均數(shù)的可信區(qū)間 16標(biāo)準(zhǔn)誤的定義樣本統(tǒng)計(jì)量(如均數(shù))也服從一定的分布;與描述觀測(cè)值離散趨勢(shì)的指標(biāo)類似,樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差就反映了從某個(gè)總體中隨機(jī)抽樣所得樣本之統(tǒng)計(jì)量分布的離散程度。用樣本
5、統(tǒng)計(jì)量的標(biāo)準(zhǔn)差來(lái)反映抽樣誤差的大小。又稱標(biāo)準(zhǔn)誤(standard error)。 17樣本均數(shù)的標(biāo)準(zhǔn)誤的計(jì)算其中,為總體標(biāo)準(zhǔn)差,n為抽樣的樣本例數(shù)在研究工作時(shí),由于總體標(biāo)準(zhǔn)差常常未知,可以利用樣本標(biāo)準(zhǔn)差近似估計(jì) 18標(biāo)準(zhǔn)誤的意義反映了樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)分布的離散程度,體現(xiàn)了抽樣誤差的大小。標(biāo)準(zhǔn)誤越大,說(shuō)明樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)的離散程度越大,即用樣本統(tǒng)計(jì)量來(lái)直接估計(jì)總體參數(shù)越不可靠。反之亦然。標(biāo)準(zhǔn)誤的大小與標(biāo)準(zhǔn)差有關(guān),在例數(shù)n一定時(shí),從標(biāo)準(zhǔn)差大的總體中抽樣,標(biāo)準(zhǔn)誤較大;而當(dāng)總體一定時(shí),樣本例數(shù)越多,標(biāo)準(zhǔn)誤越小。說(shuō)明我們可以通過(guò)增加樣本含量來(lái)減少抽樣誤差的大小。 19主要內(nèi)容
6、抽樣誤差t 分布均數(shù)的可信區(qū)間 20中心極限定理 (central limit theorem)從均數(shù)為 ,標(biāo)準(zhǔn)差為 的正態(tài)總體中隨機(jī)抽樣,樣本均數(shù)服從均數(shù)為 ,標(biāo)準(zhǔn)差為 的正態(tài)分布。從均數(shù)為 ,標(biāo)準(zhǔn)差為 的任意總體中隨機(jī)抽樣,當(dāng)樣本含量足夠大時(shí),樣本均數(shù)近似服從均數(shù)為 ,標(biāo)準(zhǔn)差為 的正態(tài)分布。 21根據(jù)中心極限定理的內(nèi)容,當(dāng)樣本含量足夠大時(shí),對(duì)從均數(shù)為,標(biāo)準(zhǔn)差為的任意總體中隨機(jī)抽樣所得的樣本均數(shù)進(jìn)行標(biāo)準(zhǔn)化變換,有t 分布由于總體標(biāo)準(zhǔn)差往往是未知的,此時(shí)往往用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,這里,為自由度,取值為n-1由W. S. Gosset (以筆名 Student)提出,W.S. Gosset
7、, 1876-1937t 分布的圖形 24 f(t) = (標(biāo)準(zhǔn)正態(tài)曲線) =5 =10.10.2-4-3-2-1012340.3t 分布的性質(zhì)t分布為一簇單峰分布曲線,高峰在0的位置上,說(shuō)明從正態(tài)總體中隨機(jī)抽樣所得樣本計(jì)算出的t值接近0的可能性較大。t分布以0為中心,左右對(duì)稱。分布的高峰位置比 u 分布低,尾部高。t分布與自由度有關(guān),自由度越小,t分布的峰越低,而兩側(cè)尾部翹得越高;自由度逐漸增大時(shí),t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)自由度為無(wú)窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布。每一自由度下的t分布曲線都有其自身分布規(guī)律。t界值表 。單側(cè): P(t =t,)= 雙側(cè): P(t =t,)= 即:P(-t
8、,t t,)= 1-例 查 t 界值表得 t 值表達(dá)式 t 0.05,10=2.228 (雙側(cè)) t 0.05,10=1.812 (單側(cè))-tt0/2/2t 界值表主要內(nèi)容抽樣誤差t 分布均數(shù)的可信區(qū)間參數(shù)估計(jì)均數(shù)的可信區(qū)間均數(shù)之差的可信區(qū)間正確應(yīng)用 27統(tǒng)計(jì)推斷所謂統(tǒng)計(jì)推斷(statistical inference),是指如何抽樣,以及如何用樣本性質(zhì)推斷總體特征。參數(shù)估計(jì)(parameter estimation)假設(shè)檢驗(yàn)(hypothesis testing)參數(shù)估計(jì)點(diǎn)估計(jì)(Point Estimation)區(qū)間估計(jì) (Interval Estimation)參數(shù)估計(jì)之一:點(diǎn)估計(jì)用樣本統(tǒng)
9、計(jì)量作為總體參數(shù)的估計(jì)。 例如: 用樣本均數(shù)作為總體均數(shù)的一個(gè)估計(jì) =142.72 S= 9.25 x1,x2,x3x10=?cm =?cm x1,x2,x3,x4N =143.37 S= 5.23x1,x2,x3x10 =144.07 S= 4.72 x1,x2,x3x10樣本含量n =10點(diǎn)估計(jì)的缺陷主要內(nèi)容抽樣誤差t 分布均數(shù)的可信區(qū)間參數(shù)估計(jì)均數(shù)的可信區(qū)間均數(shù)之差的可信區(qū)間正確應(yīng)用 32區(qū)間估計(jì)的定義【例4.1】 隨機(jī)抽取12名口腔癌患者,測(cè)得該樣本的發(fā)鋅含量為253.05g/g,標(biāo)準(zhǔn)差為85.95g/g ,估計(jì)口腔癌患者發(fā)鋅含量的總體均數(shù)。區(qū)間估計(jì)的實(shí)質(zhì)假設(shè)某個(gè)總體的均數(shù)為,需要找到
10、兩個(gè)量A和B,使得在一個(gè)比較高的可信度下(如95%),區(qū)間(A,B)能包含。即P(A100)下限:上限: 37實(shí)例按一定的概率或可信度(1-)用一個(gè)區(qū)間來(lái)估計(jì)總體參數(shù)所在的范圍,該范圍通常稱為參數(shù)的可信區(qū)間或者置信區(qū)間(confidence interval,CI),預(yù)先給定的概率(1-)稱為可信度或者置信度(confidence level),常取95%或99%。 可信區(qū)間(CL, CU )是一開區(qū)間 CL、CU 稱為可信限。例:【例4.1】隨機(jī)抽取12名口腔癌患者,測(cè)得該樣本的發(fā)鋅含量為253.05g/g,標(biāo)準(zhǔn)差為85.95g/g,估計(jì)口腔癌患者發(fā)鋅含量的總體均數(shù)。【例4.2】 某地120
11、名12歲男孩身高均數(shù)142.67cm,標(biāo)準(zhǔn)差0.5477cm,計(jì)算該市12歲男童總體均數(shù)90%的可信區(qū)間。主要內(nèi)容抽樣誤差t 分布均數(shù)的可信區(qū)間參數(shù)估計(jì)均數(shù)的可信區(qū)間均數(shù)之差的可信區(qū)間正確應(yīng)用 40均數(shù)之差可信區(qū)間的計(jì)算 正常組 肝炎組 2?均 數(shù): 231.86ug/dL標(biāo)準(zhǔn)差:12.17ug/dL 1?均 數(shù):273.18ug/dL標(biāo)準(zhǔn)差:9.77ug/dL 1- 2 ?與均數(shù)之差有關(guān)的抽樣分布“均數(shù)之差”與“均數(shù)之差的標(biāo)準(zhǔn)誤”之比,服從自由度 = n1+n2 -2的 t 分布。樣本含量較大時(shí),服從標(biāo)準(zhǔn)正態(tài)分布。 42合并方差(方差的加權(quán)平均)均數(shù)之差的標(biāo)準(zhǔn)誤 43 44主要內(nèi)容抽樣誤差t
12、 分布均數(shù)的可信區(qū)間參數(shù)估計(jì)均數(shù)的可信區(qū)間均數(shù)之差的可信區(qū)間正確應(yīng)用 45可信區(qū)間的兩個(gè)要素可信度(Confidence):準(zhǔn)確性,可靠性,即1-。一般取90%,95,可人為控制精確性(Precision):區(qū)間的大小,越小越好。必須二者兼顧可信區(qū)間的寬度可信度越大,可信區(qū)間越寬,說(shuō)明用該區(qū)間來(lái)估計(jì)總體參數(shù)(總體均數(shù))越可靠。標(biāo)準(zhǔn)差越小,可信區(qū)間就越窄,意味著如果總體內(nèi)變異程度較小時(shí),在相同的可信度下,只需要一個(gè)比較窄的可信區(qū)間就可以估計(jì)總體均數(shù)。隨著樣本含量的增加,可信區(qū)間逐漸變窄。正確理解可信區(qū)間可信度為95%的CI的涵義:每100個(gè)樣本,按同樣方法計(jì)算95%的CI,平均有95%的CI包含了總體參數(shù)。這里的95%,指的是方法本身!而不是某個(gè)區(qū)間!總體參數(shù)雖未知,但卻是固定的值,而不是隨機(jī)變量值 。95%可信區(qū)間的含義-2 -1 0 1 2 按這種方法構(gòu)建的可信區(qū)間,理論上平均每100次,有95次可以估計(jì)到總體參數(shù)??偨Y(jié)個(gè)體變異和抽樣誤差標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤: 50總結(jié)抽樣誤差的規(guī)律性抽樣分布統(tǒng)計(jì)推斷均數(shù)的可信區(qū)間 51下列說(shuō)法正確嗎?算得某95%的可信區(qū)間,則: 總體參數(shù)有95%的可
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度生態(tài)公園綠化養(yǎng)護(hù)與設(shè)施管理服務(wù)合同范本4篇
- 2025年度智能充電樁運(yùn)維服務(wù)合同范本4篇
- 二零二五年度臨時(shí)法律顧問(wèn)人員派遣協(xié)議4篇
- 2025年度茶葉加工設(shè)備維護(hù)與保養(yǎng)合同4篇
- 2025至2030年中國(guó)嵌入式保潔柜數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年鐵制六角螺絲項(xiàng)目可行性研究報(bào)告
- 2025年藥物光照試驗(yàn)箱項(xiàng)目可行性研究報(bào)告
- 2025年紫砂巖板材項(xiàng)目可行性研究報(bào)告
- 2025至2030年中國(guó)三氟三氯乙烷數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年時(shí)尚太陽(yáng)鏡項(xiàng)目可行性研究報(bào)告
- 廣東佛山生育保險(xiǎn)待遇申請(qǐng)表
- 廣西水功能區(qū)劃報(bào)告-廣西水利信息網(wǎng)
- 機(jī)關(guān)單位檔案業(yè)務(wù)培訓(xùn)課件20170714
- ??怂咕S修保養(yǎng)使用手冊(cè)
- 人力資源部各崗位績(jī)效考核表
- 原材料試驗(yàn)工作程序與質(zhì)量管理制度
- 人教版八年級(jí)下冊(cè)英語(yǔ)單詞默寫(可直接打印)
- 糖廠熱力衡算(6000噸每天)
- 燃?xì)庥邢薰疚kU(xiǎn)作業(yè)安全管理規(guī)定
- 北京市刑事訴訟律師事務(wù)所函(擔(dān)任訴訟代理人適用)格式文書(2020版)
- XX鎮(zhèn)“我為群眾辦實(shí)事”滿意度調(diào)查問(wèn)卷
評(píng)論
0/150
提交評(píng)論