均數(shù)的抽樣誤差和總體均數(shù)估計(jì)臨本_第1頁(yè)
均數(shù)的抽樣誤差和總體均數(shù)估計(jì)臨本_第2頁(yè)
均數(shù)的抽樣誤差和總體均數(shù)估計(jì)臨本_第3頁(yè)
均數(shù)的抽樣誤差和總體均數(shù)估計(jì)臨本_第4頁(yè)
均數(shù)的抽樣誤差和總體均數(shù)估計(jì)臨本_第5頁(yè)
已閱讀5頁(yè),還剩57頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于均數(shù)的抽樣誤差和總體均數(shù)估計(jì)臨本參數(shù)估計(jì)包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2.假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷的兩部分內(nèi)容:統(tǒng)計(jì)推斷:用樣本信息推論總體的特征。第2頁(yè),共62頁(yè),2024年2月25日,星期天總體樣本隨機(jī)抽取部分觀察單位

μ?

推斷inference參數(shù)估計(jì)第3頁(yè),共62頁(yè),2024年2月25日,星期天一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤第4頁(yè),共62頁(yè),2024年2月25日,星期天2009年某市18歲男生身高N(167.7,5.32)的抽樣示意圖

第5頁(yè),共62頁(yè),2024年2月25日,星期天

將此100個(gè)樣本均數(shù)看成新變量值,則這100個(gè)樣本均數(shù)構(gòu)成一新分布,繪制頻數(shù)圖從正態(tài)分布總體N(167.7,5.32)隨機(jī)抽樣所得樣本均數(shù)分布第6頁(yè),共62頁(yè),2024年2月25日,星期天①

,各樣本均數(shù)未必等于總體均數(shù);②

各樣本均數(shù)間存在差異;③

樣本均數(shù)的分布為中間多,兩邊少,左右基本對(duì)稱。

④樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小??伤愕眠@100個(gè)樣本均數(shù)的均數(shù)為167.69cm、標(biāo)準(zhǔn)差為1.69cm。

樣本均數(shù)分布具有如下特點(diǎn):第7頁(yè),共62頁(yè),2024年2月25日,星期天8從正態(tài)分布總體中以固定n抽樣時(shí),樣本均數(shù)的分布仍服從正態(tài)分布。

當(dāng)樣本含量n足夠大時(shí),即使從偏態(tài)分布總體中以固定n抽樣,其樣本均數(shù)的分布也近似服從正態(tài)分布。理論上可以證明,第8頁(yè),共62頁(yè),2024年2月25日,星期天抽樣誤差:

由個(gè)體變異產(chǎn)生的、抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差別原因:1)抽樣

2)個(gè)體差異第9頁(yè),共62頁(yè),2024年2月25日,星期天由于變異的存在,抽樣研究所造成的樣本均數(shù)與總體均數(shù)的差異,以及各樣本均數(shù)間的差異稱為均數(shù)的抽樣誤差。抽樣誤差在抽樣研究中是不可避免的,但只要嚴(yán)格遵循隨機(jī)化抽樣的原則,就能估計(jì)抽樣誤差的大小。1.均數(shù)的抽樣誤差的概念第10頁(yè),共62頁(yè),2024年2月25日,星期天表示樣本統(tǒng)計(jì)量抽樣誤差大小的統(tǒng)計(jì)指標(biāo)。標(biāo)準(zhǔn)誤:說(shuō)明抽樣誤差的大小,總體計(jì)算公式2、標(biāo)準(zhǔn)誤(standarderror,SE)實(shí)質(zhì):樣本均數(shù)的標(biāo)準(zhǔn)差第11頁(yè),共62頁(yè),2024年2月25日,星期天若用樣本標(biāo)準(zhǔn)差s

來(lái)估計(jì),

(7-28)當(dāng)樣本例數(shù)n一定時(shí),標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比當(dāng)標(biāo)準(zhǔn)差一定時(shí),標(biāo)準(zhǔn)誤與樣本含量n的平方根呈反比。通過(guò)增加樣本含量n來(lái)降低抽樣誤差。第12頁(yè),共62頁(yè),2024年2月25日,星期天抽樣調(diào)查150名3歲女孩的身高均數(shù)為92.79cm,標(biāo)準(zhǔn)差為4.61cm,則其標(biāo)準(zhǔn)誤是多少?例子:第13頁(yè),共62頁(yè),2024年2月25日,星期天1、反映樣本均數(shù)的可靠性;2、估計(jì)總體均數(shù)的置信區(qū)間;3、用于均數(shù)的假設(shè)檢驗(yàn)。標(biāo)準(zhǔn)誤的應(yīng)用:第14頁(yè),共62頁(yè),2024年2月25日,星期天指標(biāo)意義應(yīng)用標(biāo)準(zhǔn)差(s)衡量變量值變異程度,s越大表示變量值變異程度越大,s越小表示變量值變異程度越小描述正態(tài)分布(近似正態(tài)分布)資料的頻數(shù)分布;醫(yī)學(xué)參考值范圍的估計(jì)標(biāo)準(zhǔn)誤()樣本均數(shù)的變異程度,表示抽樣誤差的大小。標(biāo)準(zhǔn)誤越大表示抽樣誤差越大,樣本均數(shù)的可靠性越??;標(biāo)準(zhǔn)誤越小表示抽樣誤差越小,樣本均數(shù)的可靠性越大總體均數(shù)區(qū)間估計(jì);兩個(gè)或多個(gè)總體均數(shù)間比較的假設(shè)檢驗(yàn)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別第15頁(yè),共62頁(yè),2024年2月25日,星期天第16頁(yè),共62頁(yè),2024年2月25日,星期天二、t分布(一)t分布概念第17頁(yè),共62頁(yè),2024年2月25日,星期天隨機(jī)變量XN(m,s2)標(biāo)準(zhǔn)正態(tài)分布N(0,12)z變換第18頁(yè),共62頁(yè),2024年2月25日,星期天第19頁(yè),共62頁(yè),2024年2月25日,星期天

式中為自由度(degreeoffreedom,df)

3.實(shí)際工作中,由于未知,用代替,則不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從t分布。

第20頁(yè),共62頁(yè),2024年2月25日,星期天均數(shù)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Studentt分布自由度:n-1第21頁(yè),共62頁(yè),2024年2月25日,星期天0t分布一簇曲線0N(0,1)n足夠大時(shí),(1)(2)(3)以固定n隨機(jī)抽樣英國(guó)統(tǒng)計(jì)學(xué)家Gosset第22頁(yè),共62頁(yè),2024年2月25日,星期天(二)t分布的圖形與特征

分布只有一個(gè)參數(shù),即自由度第23頁(yè),共62頁(yè),2024年2月25日,星期天

圖不同自由度下的t分布圖第24頁(yè),共62頁(yè),2024年2月25日,星期天t分布與標(biāo)準(zhǔn)正態(tài)分布第25頁(yè),共62頁(yè),2024年2月25日,星期天第26頁(yè),共62頁(yè),2024年2月25日,星期天1.特征:

第27頁(yè),共62頁(yè),2024年2月25日,星期天2、t界值表:詳見(jiàn)P312,可反映t分布曲線下的面積。單側(cè)概率或單尾概率:用

表示;雙側(cè)概率或雙尾概率:用表示。

第28頁(yè),共62頁(yè),2024年2月25日,星期天-tt0第29頁(yè),共62頁(yè),2024年2月25日,星期天

由t界值表可知:

★相同自由度時(shí),︱t︱越大,概率P越小。

★相同t值時(shí),雙側(cè)概率是單側(cè)概率的兩倍?!铴?∞時(shí),t分布即為Z分布,故t界值表中最后一行是Z界值。第30頁(yè),共62頁(yè),2024年2月25日,星期天t分布的分位數(shù)(雙側(cè)t界值)/2/21-

t/2,-t/2,第31頁(yè),共62頁(yè),2024年2月25日,星期天

1-

t,t分布的分位數(shù)(單側(cè)t界值)第32頁(yè),共62頁(yè),2024年2月25日,星期天舉例:第33頁(yè),共62頁(yè),2024年2月25日,星期天三、總體均數(shù)的置信區(qū)間估計(jì)用樣本統(tǒng)計(jì)量推斷總體參數(shù)??傮w均數(shù)估計(jì):用樣本均數(shù)推斷總體均數(shù)。第34頁(yè),共62頁(yè),2024年2月25日,星期天點(diǎn)估計(jì)(pointestimation):用相應(yīng)樣本統(tǒng)計(jì)量直接作為其總體參數(shù)的估計(jì)值。如用

估計(jì)μ、s估計(jì)

等。其方法雖簡(jiǎn)單,但未考慮抽樣誤差的大小。第35頁(yè),共62頁(yè),2024年2月25日,星期天

按預(yù)先給定的概率(1

)所確定的包含未知總體參數(shù)的一個(gè)范圍??傮w均數(shù)的區(qū)間估計(jì):按預(yù)先給定的概率(1

)所確定的包含未知總體均數(shù)的一個(gè)范圍。

如給定

=0.05,該范圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間;如給定

=0.01,該范圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。2.區(qū)間估計(jì)(intervalestimation):第36頁(yè),共62頁(yè),2024年2月25日,星期天計(jì)算總體均數(shù)可信區(qū)間需考慮:(1)總體標(biāo)準(zhǔn)差

是否已知,(2)樣本含量n的大小通常有兩類方法:(1)t分布法

(2)z分布法第37頁(yè),共62頁(yè),2024年2月25日,星期天1.當(dāng)未知且n較小時(shí),由于服從t分布,可按t分布原理估計(jì)總體均數(shù)的可信區(qū)間。由于即故總體均數(shù)(1-)100%的可信區(qū)間為第38頁(yè),共62頁(yè),2024年2月25日,星期天2、當(dāng)未知但n足夠大時(shí)(n>100),t分布近似u分布,可以u(píng)界值代替t界值,估計(jì)總體均數(shù)的可信區(qū)間。3、當(dāng)已知時(shí),可按正態(tài)分布的原理,估計(jì)總體均數(shù)的可信區(qū)間。第39頁(yè),共62頁(yè),2024年2月25日,星期天例

某地抽取正常成年人200名,測(cè)得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計(jì)該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間。

故該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間為(3.47,3.81)mmol

L。第40頁(yè),共62頁(yè),2024年2月25日,星期天41四、置信區(qū)間的確切涵義第41頁(yè),共62頁(yè),2024年2月25日,星期天42

1.95%的可信區(qū)間的理解:(1)我們所估計(jì)的可信區(qū)間有95%的可能包含所要估計(jì)的總體參數(shù)。(2)從正態(tài)總體中隨機(jī)抽取100個(gè)樣本,可算得100個(gè)樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個(gè)均數(shù)的可信區(qū)間,平均約有95個(gè)可信區(qū)間包含了總體均數(shù)。(3)但在實(shí)際工作中,只能根據(jù)一次試驗(yàn)結(jié)果估計(jì)可信區(qū)間,我們就認(rèn)為該區(qū)間包含了總體均數(shù)

。

第42頁(yè),共62頁(yè),2024年2月25日,星期天43

2.可信區(qū)間的兩個(gè)要素(1)準(zhǔn)確度:用可信度(1

)表示:即區(qū)間包含總體均數(shù)

的理論概率大小。當(dāng)然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好。(2)精確度:反映在區(qū)間的寬度上。區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好。第43頁(yè),共62頁(yè),2024年2月25日,星期天44

當(dāng)n確定時(shí),上述兩者互相矛盾。提高準(zhǔn)確度(可信度),則精確度降低(可信區(qū)間會(huì)變寬),勢(shì)必降低可信區(qū)間的實(shí)際應(yīng)用價(jià)值,故不能籠統(tǒng)認(rèn)為99%可信區(qū)間比95%可信區(qū)間要好。相反,在實(shí)際應(yīng)用中,95%可信區(qū)間更為常用。在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。第44頁(yè),共62頁(yè),2024年2月25日,星期天第45頁(yè),共62頁(yè),2024年2月25日,星期天一、假設(shè)檢驗(yàn)的基本原理第四節(jié)t檢驗(yàn)第46頁(yè),共62頁(yè),2024年2月25日,星期天■

假設(shè)檢驗(yàn)的基本原理反證法:當(dāng)一件事情的發(fā)生只有兩種可能A和B,為了肯定一種情況A,但又不能直接證實(shí)A,這時(shí)否定另一種可能B,則間接肯定了A。概率論(小概率):如果一件事情發(fā)生的概率很小,那么在一次試驗(yàn)時(shí),我們說(shuō)這個(gè)事件是”不會(huì)發(fā)生的”。從一般的常識(shí)可知,這句話在大多數(shù)情況下是正確的,但有犯錯(cuò)誤的時(shí)候,因?yàn)楦怕市∫彩怯锌赡馨l(fā)生的。第47頁(yè),共62頁(yè),2024年2月25日,星期天■

假設(shè)檢驗(yàn)的基本原理假設(shè)檢驗(yàn)是利用小概率反證法思想,從問(wèn)題的對(duì)立面(H0)出發(fā)間接判斷要解決的問(wèn)題(H1)是否成立。然后在H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量,最后獲得P值來(lái)判斷。問(wèn)題實(shí)質(zhì)上都是希望通過(guò)樣本統(tǒng)計(jì)量與總體參數(shù)的差別,或兩個(gè)樣本統(tǒng)計(jì)量的差別,來(lái)推斷總體參數(shù)是否不同。這種識(shí)別的過(guò)程,就是本章介紹的假設(shè)檢驗(yàn)(hypothesistest)。

第48頁(yè),共62頁(yè),2024年2月25日,星期天

例15.13根據(jù)大量調(diào)查,已知一般健康成年男子的脈搏均數(shù)為72次/min。某醫(yī)生在某山區(qū)隨機(jī)抽查100名健康成年男子,求得其脈搏均數(shù)為76.2次/min,標(biāo)準(zhǔn)差為4.0次/min,能否認(rèn)為該山區(qū)的健康成年男子脈搏均數(shù)高于一般健康成年男子的脈搏均數(shù)?第49頁(yè),共62頁(yè),2024年2月25日,星期天

0=72次/min

山區(qū)健康成年男子一般健康成年男子第50頁(yè),共62頁(yè),2024年2月25日,星期天假設(shè)檢驗(yàn)的基本思想

據(jù)專業(yè)知識(shí),有兩種可能:=0或≠0

直接證明是哪種結(jié)果都很困難,利用反證法。假設(shè)=0,然后借助一定的分布,觀察實(shí)測(cè)樣本情況是否屬于小概率事件。

如果實(shí)測(cè)樣本情況屬于小概率事件,則認(rèn)為原先的假設(shè)是錯(cuò)的,拒絕這個(gè)假設(shè);

如果實(shí)測(cè)樣本情況不屬于小概率事件,則不拒絕原來(lái)的假設(shè)。第51頁(yè),共62頁(yè),2024年2月25日,星期天假設(shè)檢驗(yàn)的一般步驟(一)建立檢驗(yàn)假設(shè)(hypothesisundertest),確定檢驗(yàn)水準(zhǔn)無(wú)效假設(shè)或零假設(shè)(nullhypothesis)H0:=0假定總體參數(shù)相同備擇假設(shè)或?qū)α⒓僭O(shè)(alternativehypothesis)H1:≠0或

>0(<0)

假定總體參數(shù)不相同,即差別不是由于抽樣誤差所致。第52頁(yè),共62頁(yè),2024年2月25日,星期天注意:假設(shè)針對(duì)的是總體;H0和

H1是互斥的;單側(cè)、雙側(cè)的選擇。第53頁(yè),共62頁(yè),2024年2月25日,星期天

樣本均數(shù)所代表的未知總體均數(shù)與已知總體均數(shù)0的比較

目的H0H1雙側(cè)檢驗(yàn)是否≠

=0

0單側(cè)檢驗(yàn)是否>0

=0

>0

是否<0

=0<0

第54頁(yè),共62頁(yè),2024年2月25日,星期天檢驗(yàn)水準(zhǔn)(sizeoftest)也稱顯著性水準(zhǔn)(significancelevel),符

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論