均數(shù)的抽樣誤差和總體均數(shù)估計臨本_第1頁
均數(shù)的抽樣誤差和總體均數(shù)估計臨本_第2頁
均數(shù)的抽樣誤差和總體均數(shù)估計臨本_第3頁
均數(shù)的抽樣誤差和總體均數(shù)估計臨本_第4頁
均數(shù)的抽樣誤差和總體均數(shù)估計臨本_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于均數(shù)的抽樣誤差和總體均數(shù)估計臨本第1頁,課件共62頁,創(chuàng)作于2023年2月參數(shù)估計包括:點估計與區(qū)間估計2.假設(shè)檢驗統(tǒng)計推斷的兩部分內(nèi)容:統(tǒng)計推斷:用樣本信息推論總體的特征。第2頁,課件共62頁,創(chuàng)作于2023年2月總體樣本隨機抽取部分觀察單位

μ?

推斷inference參數(shù)估計第3頁,課件共62頁,創(chuàng)作于2023年2月一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤第4頁,課件共62頁,創(chuàng)作于2023年2月2009年某市18歲男生身高N(167.7,5.32)的抽樣示意圖

第5頁,課件共62頁,創(chuàng)作于2023年2月

將此100個樣本均數(shù)看成新變量值,則這100個樣本均數(shù)構(gòu)成一新分布,繪制頻數(shù)圖從正態(tài)分布總體N(167.7,5.32)隨機抽樣所得樣本均數(shù)分布第6頁,課件共62頁,創(chuàng)作于2023年2月①

,各樣本均數(shù)未必等于總體均數(shù);②

各樣本均數(shù)間存在差異;③

樣本均數(shù)的分布為中間多,兩邊少,左右基本對稱。

④樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小。可算得這100個樣本均數(shù)的均數(shù)為167.69cm、標(biāo)準(zhǔn)差為1.69cm。

樣本均數(shù)分布具有如下特點:第7頁,課件共62頁,創(chuàng)作于2023年2月8從正態(tài)分布總體中以固定n抽樣時,樣本均數(shù)的分布仍服從正態(tài)分布。

當(dāng)樣本含量n足夠大時,即使從偏態(tài)分布總體中以固定n抽樣,其樣本均數(shù)的分布也近似服從正態(tài)分布。理論上可以證明,第8頁,課件共62頁,創(chuàng)作于2023年2月抽樣誤差:

由個體變異產(chǎn)生的、抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差別原因:1)抽樣

2)個體差異第9頁,課件共62頁,創(chuàng)作于2023年2月由于變異的存在,抽樣研究所造成的樣本均數(shù)與總體均數(shù)的差異,以及各樣本均數(shù)間的差異稱為均數(shù)的抽樣誤差。抽樣誤差在抽樣研究中是不可避免的,但只要嚴(yán)格遵循隨機化抽樣的原則,就能估計抽樣誤差的大小。1.均數(shù)的抽樣誤差的概念第10頁,課件共62頁,創(chuàng)作于2023年2月表示樣本統(tǒng)計量抽樣誤差大小的統(tǒng)計指標(biāo)。標(biāo)準(zhǔn)誤:說明抽樣誤差的大小,總體計算公式2、標(biāo)準(zhǔn)誤(standarderror,SE)實質(zhì):樣本均數(shù)的標(biāo)準(zhǔn)差第11頁,課件共62頁,創(chuàng)作于2023年2月若用樣本標(biāo)準(zhǔn)差s

來估計,

(7-28)當(dāng)樣本例數(shù)n一定時,標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比當(dāng)標(biāo)準(zhǔn)差一定時,標(biāo)準(zhǔn)誤與樣本含量n的平方根呈反比。通過增加樣本含量n來降低抽樣誤差。第12頁,課件共62頁,創(chuàng)作于2023年2月抽樣調(diào)查150名3歲女孩的身高均數(shù)為92.79cm,標(biāo)準(zhǔn)差為4.61cm,則其標(biāo)準(zhǔn)誤是多少?例子:第13頁,課件共62頁,創(chuàng)作于2023年2月1、反映樣本均數(shù)的可靠性;2、估計總體均數(shù)的置信區(qū)間;3、用于均數(shù)的假設(shè)檢驗。標(biāo)準(zhǔn)誤的應(yīng)用:第14頁,課件共62頁,創(chuàng)作于2023年2月指標(biāo)意義應(yīng)用標(biāo)準(zhǔn)差(s)衡量變量值變異程度,s越大表示變量值變異程度越大,s越小表示變量值變異程度越小描述正態(tài)分布(近似正態(tài)分布)資料的頻數(shù)分布;醫(yī)學(xué)參考值范圍的估計標(biāo)準(zhǔn)誤()樣本均數(shù)的變異程度,表示抽樣誤差的大小。標(biāo)準(zhǔn)誤越大表示抽樣誤差越大,樣本均數(shù)的可靠性越小;標(biāo)準(zhǔn)誤越小表示抽樣誤差越小,樣本均數(shù)的可靠性越大總體均數(shù)區(qū)間估計;兩個或多個總體均數(shù)間比較的假設(shè)檢驗標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別第15頁,課件共62頁,創(chuàng)作于2023年2月第16頁,課件共62頁,創(chuàng)作于2023年2月二、t分布(一)t分布概念第17頁,課件共62頁,創(chuàng)作于2023年2月隨機變量XN(m,s2)標(biāo)準(zhǔn)正態(tài)分布N(0,12)z變換第18頁,課件共62頁,創(chuàng)作于2023年2月第19頁,課件共62頁,創(chuàng)作于2023年2月

式中為自由度(degreeoffreedom,df)

3.實際工作中,由于未知,用代替,則不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從t分布。

第20頁,課件共62頁,創(chuàng)作于2023年2月均數(shù)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Studentt分布自由度:n-1第21頁,課件共62頁,創(chuàng)作于2023年2月0t分布一簇曲線0N(0,1)n足夠大時,(1)(2)(3)以固定n隨機抽樣英國統(tǒng)計學(xué)家Gosset第22頁,課件共62頁,創(chuàng)作于2023年2月(二)t分布的圖形與特征

分布只有一個參數(shù),即自由度第23頁,課件共62頁,創(chuàng)作于2023年2月

圖不同自由度下的t分布圖第24頁,課件共62頁,創(chuàng)作于2023年2月t分布與標(biāo)準(zhǔn)正態(tài)分布第25頁,課件共62頁,創(chuàng)作于2023年2月第26頁,課件共62頁,創(chuàng)作于2023年2月1.特征:

第27頁,課件共62頁,創(chuàng)作于2023年2月2、t界值表:詳見P312,可反映t分布曲線下的面積。單側(cè)概率或單尾概率:用

表示;雙側(cè)概率或雙尾概率:用表示。

第28頁,課件共62頁,創(chuàng)作于2023年2月-tt0第29頁,課件共62頁,創(chuàng)作于2023年2月

由t界值表可知:

★相同自由度時,︱t︱越大,概率P越小。

★相同t值時,雙側(cè)概率是單側(cè)概率的兩倍?!铴?∞時,t分布即為Z分布,故t界值表中最后一行是Z界值。第30頁,課件共62頁,創(chuàng)作于2023年2月t分布的分位數(shù)(雙側(cè)t界值)/2/21-t/2,-t/2,第31頁,課件共62頁,創(chuàng)作于2023年2月1-t,t分布的分位數(shù)(單側(cè)t界值)第32頁,課件共62頁,創(chuàng)作于2023年2月舉例:第33頁,課件共62頁,創(chuàng)作于2023年2月三、總體均數(shù)的置信區(qū)間估計用樣本統(tǒng)計量推斷總體參數(shù)。總體均數(shù)估計:用樣本均數(shù)推斷總體均數(shù)。第34頁,課件共62頁,創(chuàng)作于2023年2月點估計(pointestimation):用相應(yīng)樣本統(tǒng)計量直接作為其總體參數(shù)的估計值。如用

估計μ、s估計

等。其方法雖簡單,但未考慮抽樣誤差的大小。第35頁,課件共62頁,創(chuàng)作于2023年2月

按預(yù)先給定的概率(1)所確定的包含未知總體參數(shù)的一個范圍。總體均數(shù)的區(qū)間估計:按預(yù)先給定的概率(1)所確定的包含未知總體均數(shù)的一個范圍。

如給定=0.05,該范圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間;如給定=0.01,該范圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。2.區(qū)間估計(intervalestimation):第36頁,課件共62頁,創(chuàng)作于2023年2月計算總體均數(shù)可信區(qū)間需考慮:(1)總體標(biāo)準(zhǔn)差是否已知,(2)樣本含量n的大小通常有兩類方法:(1)t分布法

(2)z分布法第37頁,課件共62頁,創(chuàng)作于2023年2月1.當(dāng)未知且n較小時,由于服從t分布,可按t分布原理估計總體均數(shù)的可信區(qū)間。由于即故總體均數(shù)(1-)100%的可信區(qū)間為第38頁,課件共62頁,創(chuàng)作于2023年2月2、當(dāng)未知但n足夠大時(n>100),t分布近似u分布,可以u界值代替t界值,估計總體均數(shù)的可信區(qū)間。3、當(dāng)已知時,可按正態(tài)分布的原理,估計總體均數(shù)的可信區(qū)間。第39頁,課件共62頁,創(chuàng)作于2023年2月例

某地抽取正常成年人200名,測得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間。

故該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間為(3.47,3.81)mmolL。第40頁,課件共62頁,創(chuàng)作于2023年2月41四、置信區(qū)間的確切涵義第41頁,課件共62頁,創(chuàng)作于2023年2月42

1.95%的可信區(qū)間的理解:(1)我們所估計的可信區(qū)間有95%的可能包含所要估計的總體參數(shù)。(2)從正態(tài)總體中隨機抽取100個樣本,可算得100個樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個均數(shù)的可信區(qū)間,平均約有95個可信區(qū)間包含了總體均數(shù)。(3)但在實際工作中,只能根據(jù)一次試驗結(jié)果估計可信區(qū)間,我們就認(rèn)為該區(qū)間包含了總體均數(shù)。

第42頁,課件共62頁,創(chuàng)作于2023年2月43

2.可信區(qū)間的兩個要素(1)準(zhǔn)確度:用可信度(1)表示:即區(qū)間包含總體均數(shù)的理論概率大小。當(dāng)然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好。(2)精確度:反映在區(qū)間的寬度上。區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好。第43頁,課件共62頁,創(chuàng)作于2023年2月44

當(dāng)n確定時,上述兩者互相矛盾。提高準(zhǔn)確度(可信度),則精確度降低(可信區(qū)間會變寬),勢必降低可信區(qū)間的實際應(yīng)用價值,故不能籠統(tǒng)認(rèn)為99%可信區(qū)間比95%可信區(qū)間要好。相反,在實際應(yīng)用中,95%可信區(qū)間更為常用。在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。第44頁,課件共62頁,創(chuàng)作于2023年2月第45頁,課件共62頁,創(chuàng)作于2023年2月一、假設(shè)檢驗的基本原理第四節(jié)t檢驗第46頁,課件共62頁,創(chuàng)作于2023年2月■

假設(shè)檢驗的基本原理反證法:當(dāng)一件事情的發(fā)生只有兩種可能A和B,為了肯定一種情況A,但又不能直接證實A,這時否定另一種可能B,則間接肯定了A。概率論(小概率):如果一件事情發(fā)生的概率很小,那么在一次試驗時,我們說這個事件是”不會發(fā)生的”。從一般的常識可知,這句話在大多數(shù)情況下是正確的,但有犯錯誤的時候,因為概率小也是有可能發(fā)生的。第47頁,課件共62頁,創(chuàng)作于2023年2月■

假設(shè)檢驗的基本原理假設(shè)檢驗是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷。問題實質(zhì)上都是希望通過樣本統(tǒng)計量與總體參數(shù)的差別,或兩個樣本統(tǒng)計量的差別,來推斷總體參數(shù)是否不同。這種識別的過程,就是本章介紹的假設(shè)檢驗(hypothesistest)。

第48頁,課件共62頁,創(chuàng)作于2023年2月

例15.13根據(jù)大量調(diào)查,已知一般健康成年男子的脈搏均數(shù)為72次/min。某醫(yī)生在某山區(qū)隨機抽查100名健康成年男子,求得其脈搏均數(shù)為76.2次/min,標(biāo)準(zhǔn)差為4.0次/min,能否認(rèn)為該山區(qū)的健康成年男子脈搏均數(shù)高于一般健康成年男子的脈搏均數(shù)?第49頁,課件共62頁,創(chuàng)作于2023年2月

0=72次/min

山區(qū)健康成年男子一般健康成年男子第50頁,課件共62頁,創(chuàng)作于2023年2月假設(shè)檢驗的基本思想

據(jù)專業(yè)知識,有兩種可能:=0或≠0

直接證明是哪種結(jié)果都很困難,利用反證法。假設(shè)=0,然后借助一定的分布,觀察實測樣本情況是否屬于小概率事件。

如果實測樣本情況屬于小概率事件,則認(rèn)為原先的假設(shè)是錯的,拒絕這個假設(shè);

如果實測樣本情況不屬于小概率事件,則不拒絕原來的假設(shè)。第51頁,課件共62頁,創(chuàng)作于2023年2月假設(shè)檢驗的一般步驟(一)建立檢驗假設(shè)(hypothesisundertest),確定檢驗水準(zhǔn)無效假設(shè)或零假設(shè)(nullhypothesis)H0:=0假定總體參數(shù)相同備擇假設(shè)或?qū)α⒓僭O(shè)(alternativehypothesis)H1:≠0或

>0(<0)

假定總體參數(shù)不相同,即差別不是由于抽樣誤差所致。第52頁,課件共62頁,創(chuàng)作于2023年2月注意:假設(shè)針對的是總體;H0和

H1是互斥的;單側(cè)、雙側(cè)的選擇。第53頁,課件共62頁,創(chuàng)作于2023年2月

樣本均數(shù)所代表的未知總體均數(shù)與已知總體均數(shù)0的比較

目的H0H1雙側(cè)檢驗是否≠0

=0≠0單側(cè)檢驗是否>0

=0

>0

是否<0

=0<0

第54頁,課件共62頁,創(chuàng)作于2023年2月檢驗水準(zhǔn)(sizeoftes

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論