數(shù)值變量的統(tǒng)計(jì)推斷1課件_第1頁(yè)
數(shù)值變量的統(tǒng)計(jì)推斷1課件_第2頁(yè)
數(shù)值變量的統(tǒng)計(jì)推斷1課件_第3頁(yè)
數(shù)值變量的統(tǒng)計(jì)推斷1課件_第4頁(yè)
數(shù)值變量的統(tǒng)計(jì)推斷1課件_第5頁(yè)
已閱讀5頁(yè),還剩167頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十五章數(shù)值變量的統(tǒng)計(jì)推斷第十五章數(shù)值變量的統(tǒng)計(jì)推斷14十二月20222回顧上一章內(nèi)容:集中趨勢(shì)指標(biāo):算術(shù)均數(shù)、中位數(shù)、幾何均數(shù)離散趨勢(shì)指標(biāo):全距、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)正態(tài)分布:概念、特征、面積規(guī)律、應(yīng)用醫(yī)學(xué)參考值估計(jì):步驟、估計(jì)方法計(jì)量資料的統(tǒng)計(jì)描述:12十二月20222回顧上一章內(nèi)容:集中趨勢(shì)指標(biāo):計(jì)量資214十二月20223均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤總體均數(shù)的估計(jì)假設(shè)檢驗(yàn)的基本原理與步驟t檢驗(yàn)與u檢驗(yàn)方差分析兩類(lèi)錯(cuò)誤假設(shè)及假設(shè)檢驗(yàn)的注意事項(xiàng)本次講授內(nèi)容12十二月20223均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤本次講授內(nèi)容314十二月20224統(tǒng)計(jì)推斷(Statisticalinference):用樣本信息推論總體特征的過(guò)程。即采用樣本統(tǒng)計(jì)量對(duì)相應(yīng)總體參數(shù)所做的非確定性的推估。主要包括:參數(shù)估計(jì)假設(shè)檢驗(yàn)第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月20224統(tǒng)計(jì)推斷(Statisticali414十二月20225第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤參數(shù)估計(jì):

運(yùn)用統(tǒng)計(jì)學(xué)原理,用從樣本計(jì)算出來(lái)的統(tǒng)計(jì)指標(biāo)量,對(duì)總體統(tǒng)計(jì)指標(biāo)量進(jìn)行估計(jì)。假設(shè)檢驗(yàn):又稱(chēng)顯著性檢驗(yàn),是指由樣本間存在的差別對(duì)樣本所代表的總體間是否存在著差別做出判斷。方法:均數(shù)的參數(shù)估計(jì)、均數(shù)u檢驗(yàn)、均數(shù)t檢驗(yàn)12十二月20225第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤參數(shù)5總體參數(shù):μ=155.4㎝,

σ=5.3㎝X~N(155.4㎝,(5.3㎝)2)12100n=30x1=156.7n=30x2=158.1n=30x100=156.6……13歲女學(xué)生身高第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

總體參數(shù):μ=155.4㎝,12100n=30x16數(shù)值變量的統(tǒng)計(jì)推斷1課件7從正態(tài)總體N(155.4,5.32)抽樣得到100個(gè)樣本均數(shù)的頻數(shù)分布組段(cm)頻數(shù)頻率(%)152.6~11.0153.2~44.0153.8~44.0154.4~2222.0155.0~2525.0155.6~2121.0156.2~1717.0156.8~33.0157.4~22.0158.0~159.611.0合計(jì)100100.0100個(gè)樣本平均數(shù)的頻數(shù)分布圖

(直方圖)從正態(tài)總體N(155.4,5.32)抽樣得到100個(gè)樣本均數(shù)8

理論上可以證明:若從正態(tài)總體中,反復(fù)多次隨機(jī)抽取樣本含量固定為n的樣本,那么這些樣本均數(shù)也服從正態(tài)分布,即的總體均數(shù)仍為,樣本均數(shù)的標(biāo)準(zhǔn)差為。抽樣分布抽樣分布示意圖抽樣分布抽樣分布示意圖9一.抽樣誤差:由于抽樣而引起的樣本均數(shù)與總體均數(shù)之間、樣本均數(shù)與樣本均數(shù)之間的差異稱(chēng)為抽樣誤差。特點(diǎn):不可避免!可以計(jì)算或估計(jì)其大小。一.抽樣誤差:1014十二月202211通過(guò)增加樣本含量n來(lái)降低抽樣誤差。某一個(gè)樣本的標(biāo)準(zhǔn)差該樣本的個(gè)體例數(shù)二.標(biāo)準(zhǔn)誤(standarderror,SE)及其計(jì)算即樣本均數(shù)的標(biāo)準(zhǔn)差,可用于衡量抽樣誤差的大小。因通常σ未知,用S來(lái)估計(jì)。計(jì)算標(biāo)準(zhǔn)誤采用下式:第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月202211通過(guò)增加樣本含量n來(lái)降低抽樣誤差。1114十二月20224個(gè)抽樣實(shí)驗(yàn)結(jié)果比較12十二月20224個(gè)抽樣實(shí)驗(yàn)結(jié)果比較1214十二月202213標(biāo)準(zhǔn)誤的特點(diǎn):當(dāng)樣本例數(shù)n一定時(shí),標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比;當(dāng)標(biāo)準(zhǔn)差一定時(shí),標(biāo)準(zhǔn)誤與樣本含量n的平方根呈反比。意義:反映樣本均數(shù)間離散程度。反映抽樣誤差的大小。標(biāo)準(zhǔn)誤越小,抽樣誤差越小,用樣本均數(shù)估計(jì)總體均數(shù)的可靠性越大。第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月202213標(biāo)準(zhǔn)誤的特點(diǎn):第一節(jié)均數(shù)的抽樣誤1314十二月202214例15-1:某地150名3歲女孩平均身高為92.8CM,標(biāo)準(zhǔn)差為4.6CM,求其標(biāo)準(zhǔn)誤。未知S

代替第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月202214未知第一節(jié)均數(shù)的抽樣誤差1414十二月202215三.標(biāo)準(zhǔn)誤的應(yīng)用反映樣本均數(shù)的可靠性,衡量抽樣誤差大小估計(jì)總體均數(shù)的可信區(qū)間用于假設(shè)檢驗(yàn)第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月202215三.標(biāo)準(zhǔn)誤的應(yīng)用第一節(jié)均數(shù)的抽樣1514十二月202216區(qū)別:標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)差定義反映抽樣誤差反映個(gè)體變異公式用途總體均數(shù)可信區(qū)間醫(yī)學(xué)參考值范圍進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)計(jì)算標(biāo)準(zhǔn)誤、CV聯(lián)系:當(dāng)n一定時(shí)標(biāo)準(zhǔn)差大,標(biāo)準(zhǔn)誤也大補(bǔ)充內(nèi)容:

標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別與聯(lián)系第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月202216區(qū)別:標(biāo)準(zhǔn)誤1614十二月202217第二節(jié)

總體均數(shù)的估計(jì)隨機(jī)變量xN(,2)

標(biāo)準(zhǔn)正態(tài)分布N(0,12)

抽樣

樣本均數(shù)

N(,2/n)

標(biāo)準(zhǔn)正態(tài)分布N(0,12)

未知

S

代替u變換Studentt分布自由度:n-1t變換12十二月202217第二節(jié)總體均數(shù)的估計(jì)標(biāo)準(zhǔn)正1714十二月202218

m個(gè)樣本的均數(shù)

標(biāo)準(zhǔn)誤t值總體為N的m個(gè)樣本(樣本大小為n)的t值t分布12十二月202218

標(biāo)準(zhǔn)誤t值總體為N的m個(gè)樣本(樣18圖15-1自由度分別為1、5、∞的t分布標(biāo)準(zhǔn)正態(tài)分布圖15-1自由度分別為1、5、∞的t分布標(biāo)準(zhǔn)正態(tài)分布1914十二月202220t分布的圖形與特征①以0為中心,左右對(duì)稱(chēng)的單峰分布;②t分布曲線(xiàn)是一簇曲線(xiàn),其形態(tài)變化與自由度的大小有關(guān)。自由度越小,則t值越分散,t分布曲線(xiàn)的峰部越矮而尾部翹得越高;說(shuō)明尾部面積(概率P)就越大;與u分布曲線(xiàn)相比,t分布低平;自由度逐漸增大時(shí),t分布逐漸逼近u分布(標(biāo)準(zhǔn)正態(tài)分布);當(dāng)趨于∞時(shí),

逼近,t分布即為u分布。t分布12十二月202220t分布的圖形與特征t分布2014十二月202221附表

t界值表(228頁(yè))12十二月202221附表t界值表(2221自由度概率P單側(cè)0.250.200.100.050.0250.01雙側(cè)0.500.400.200.100.050.0211.001.3763.0786.31412.70631.8220.8161.0611.8862.9204.3036.965…100.700.8791.3721.8122.2282.764…500.6790.8491.2991.6762.0092.403…1000.6770.8451.291.6601.9842.3640.6750.8421.2821.6451.9602.326自由度概率P單側(cè)0.250.200.100.050.02502214十二月202223如左圖所示,圖中的陰影部分表示以外尾部面積占總面積的百分?jǐn)?shù),即概率。如查表單側(cè),表示從正態(tài)總體作樣本例數(shù)n為11的隨機(jī)抽樣,其t值服從ν=n-1=11-1=10的t分布。1.812理論上:v=10,單α=0.05,則有:一般表示:

t分布12十二月202223如左圖所示,圖中的陰影部分表示2314十二月202224如圖所示:相同自由度下,雙側(cè)P值為單側(cè)P值得兩倍。t界值表中,2.228-2.228

t分布12十二月202224如圖所示:2.228-2.2282414十二月202225參數(shù)估計(jì):用樣本均數(shù)估計(jì)總體均數(shù)。參數(shù)的估計(jì)點(diǎn)值估計(jì):由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)區(qū)間估計(jì):獲得一個(gè)可信區(qū)間(confidenceinterval,CI)——由樣本數(shù)據(jù)估計(jì)得到的、100(1)%可能包含未知總體參數(shù)的一個(gè)范圍值。第二節(jié)總體均數(shù)的估計(jì)12十二月202225參數(shù)估計(jì):用樣本均數(shù)估計(jì)總體均數(shù)。2514十二月202226

1、點(diǎn)(值)估計(jì):用相應(yīng)樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值。即用估計(jì)其方法雖簡(jiǎn)單,但未考慮抽樣誤差的大小一、可信區(qū)間的概念12十二月2022261、點(diǎn)(值)估計(jì):一、可信區(qū)間的2614十二月2022272、區(qū)間估計(jì)概念:按照預(yù)先給定的概率(可信度)估計(jì)的未知總體參數(shù)的范圍??尚艆^(qū)間(confidenceinterval,CI)是根據(jù)一定的可信度估計(jì)得到的區(qū)間。一、可信區(qū)間的概念12十二月2022272、區(qū)間估計(jì)一、可信區(qū)間的概念2714十二月202228總體均數(shù)的可信區(qū)間(1)σ已知,按u分布,95%和99%可信區(qū)間:

(2)σ未知,且n較小,按t分布(3)σ未知但n足夠大,按u分布二、總體均數(shù)可信區(qū)的計(jì)算12十二月202228總體均數(shù)的可信區(qū)間二、總體均數(shù)可信2814十二月202229二、總體均數(shù)可信區(qū)的計(jì)算例15-2隨機(jī)抽取某地10名男孩出生體重,測(cè)得其平均體重為3.21kg,標(biāo)準(zhǔn)差S為0.47kg,試估計(jì)該地男孩出生體重的總體均數(shù)的95%置信區(qū)間。12十二月202229二、總體均數(shù)可信區(qū)的計(jì)算例15-22914十二月20223012十二月2022303014十二月20223195%的可信區(qū)間表示:如果從同一總體中重復(fù)抽取100個(gè)獨(dú)立樣本,將可能有95個(gè)可信區(qū)間包括總體均數(shù),有5個(gè)可信區(qū)間不包括總體均數(shù)。對(duì)于一次估計(jì)的可信區(qū)間,可能有95%的正確率,但仍有5%的可信區(qū)間估計(jì)錯(cuò)誤。三、可信區(qū)間的涵義12十二月20223195%的可信區(qū)間表示:如果從同一總31模擬抽樣成年男子紅細(xì)胞數(shù)100次的95%可信區(qū)間示意圖

******模擬抽樣成年男子紅細(xì)胞數(shù)100次的95%可信區(qū)間示意圖***3214十二月202233四、總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別12十二月202233四、總體均數(shù)可信區(qū)間與參考值范圍的33第三節(jié)假設(shè)檢驗(yàn)的基本原理與步驟一、假設(shè)檢驗(yàn)(HypothesisTesting)的基本原理例15.4:

根據(jù)大量調(diào)查,已知一般健康成年男子的脈博均數(shù)為72次/min,某醫(yī)生在某山區(qū)隨機(jī)調(diào)查100名健康男子,得其脈搏均數(shù)為76.2次/min,標(biāo)準(zhǔn)差為4.0次/min。能否認(rèn)為該山區(qū)的健康成年男子脈搏均數(shù)高于一般成年男子脈搏均數(shù)?第三節(jié)假設(shè)檢驗(yàn)的基本原理與步驟一、假設(shè)檢驗(yàn)(Hypoth3414十二月202235n=100已知總體一般成年男性脈搏未知總體山區(qū)成年男子脈搏?12十二月202235n=100已知總體未知總體?3514十二月202236差異的原因:

(1)由于抽樣誤差造成的.(實(shí)際上

=0

,但由于抽樣誤差不能很好代表0

)(2)可能由于地區(qū)等環(huán)境因素的影響,樣本所代表的總體與已知總體確實(shí)不同:012十二月202236差異的原因:36下面我們用一例說(shuō)明這個(gè)原則:兩個(gè)盒子,各裝有100個(gè)球.小概率事件在一次試驗(yàn)中不會(huì)發(fā)生.一個(gè)盒子中的白球和紅球數(shù)99個(gè)白球一個(gè)紅球…99個(gè)另一盒中的白球和紅球數(shù)99個(gè)紅球一個(gè)白球…99個(gè)下面我們用一例說(shuō)明這個(gè)原則:兩個(gè)盒子,各裝有100個(gè)球.小概37將盒子密封,現(xiàn)從兩盒中隨機(jī)取出一個(gè)盒子,問(wèn)這個(gè)盒子里是白球99個(gè)還是紅球99個(gè)?將盒子密封,現(xiàn)從兩盒中隨機(jī)取出一個(gè)盒子,問(wèn)這個(gè)盒子里是白球938我們不妨先假設(shè):這個(gè)盒子里有99個(gè)白球.現(xiàn)在我們從中隨機(jī)摸出一個(gè)球,發(fā)現(xiàn)是此時(shí)你如何判斷這個(gè)假設(shè)是否成立呢?我們不妨先假設(shè):這個(gè)盒子里有99個(gè)白球.現(xiàn)在我們從中隨機(jī)摸出39假設(shè)其中真有99個(gè)白球,摸出紅球的概率只有1/100,這是小概率事件.小概率事件在一次試驗(yàn)中竟然發(fā)生了,不能不使人懷疑所作的假設(shè).小概率反證法.小概率事件在一次試驗(yàn)中不會(huì)發(fā)生.假設(shè)其中真有99個(gè)白球,摸出紅球的概率只有1/100,這是小4014十二月202241假設(shè)檢驗(yàn)的基本步驟1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)2.選定檢驗(yàn)統(tǒng)計(jì)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.確定P值,作出推斷結(jié)論12十二月202241假設(shè)檢驗(yàn)的基本步驟1.建立假設(shè),41無(wú)效假設(shè)(nullhypothesis),記為H0,又稱(chēng)原假設(shè),表示目前的差異是由于抽樣誤差引起的。備擇假設(shè)(alternativehypothesis),記為H1,又稱(chēng)對(duì)立假設(shè),表示目前的差異是主要由于本質(zhì)上的差別引起。兩個(gè)假設(shè)既有聯(lián)系又互相獨(dú)立,應(yīng)該包括兩種(也是所有)可能的判斷。要做出抉擇。1、建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)

1、建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)

1、建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)

1、建立檢驗(yàn)假設(shè),確定檢驗(yàn)水4214十二月202243(1)根據(jù)專(zhuān)業(yè)知識(shí)

事先不知道會(huì)出現(xiàn)什么結(jié)果——雙側(cè)事先知道只能出現(xiàn)某種結(jié)果——單側(cè)如:難產(chǎn)兒的出生體重與一般嬰兒出生體重大

〉---單側(cè)一般預(yù)實(shí)驗(yàn)有探索性質(zhì),對(duì)結(jié)果的考慮思路應(yīng)寬些,多雙側(cè)(2)問(wèn)題的提法如:可否據(jù)此認(rèn)為該山區(qū)成年男子的脈搏數(shù)高于一般成年男子的脈搏均數(shù)?

*通常用雙側(cè)(除非有充足的理由選用單側(cè)之外,一般選用保守的雙側(cè)較穩(wěn)妥)單、雙側(cè)檢驗(yàn)的選擇:12十二月202243(1)根據(jù)專(zhuān)業(yè)知識(shí)單、雙側(cè)檢驗(yàn)的選4314十二月202244檢驗(yàn)水準(zhǔn)(sizeofatest)亦稱(chēng)顯著性水準(zhǔn)(significancelevel),用α表示,在實(shí)際工作中α常取0.05。意義:假設(shè)檢驗(yàn)時(shí),根據(jù)研究的目的或要求預(yù)先規(guī)定的概率值,是判定小概率事件發(fā)生的標(biāo)準(zhǔn)(H0)或閾值;亦是允許結(jié)果出現(xiàn)第一類(lèi)錯(cuò)誤的概率。α取值并非一成不變,可根據(jù)研究目的給予不同設(shè)置。1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)12十二月202244檢驗(yàn)水準(zhǔn)(sizeofate4414十二月202245注意:H0,H1和α的確定,以及單雙側(cè)檢驗(yàn)的選擇,都應(yīng)結(jié)合研究設(shè)計(jì),在未獲得樣本結(jié)果之前決定,而不要受樣本結(jié)果的影響。

假設(shè)檢驗(yàn)是針對(duì)總體而不是針對(duì)樣本。1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)12十二月202245注意:1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)4514十二月202246要根據(jù)研究設(shè)計(jì)的類(lèi)型和統(tǒng)計(jì)推斷的目的選用不同的檢驗(yàn)方法,如:兩樣本均數(shù)的比較用t檢驗(yàn),兩樣本率的比較用卡方檢驗(yàn)……

所有檢驗(yàn)統(tǒng)計(jì)量都是在H0成立的前提條件下計(jì)算的。2、選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量12十二月202246要根據(jù)研究設(shè)計(jì)的類(lèi)型和統(tǒng)計(jì)推斷的目4614十二月202247P值是指在H0所規(guī)定的總體作隨機(jī)抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。例如求得t=10.5,v=99,α=0.05,

P是在μ=μ0的前提條件下隨機(jī)抽樣,得到

t≤-10.5和t>10.5的概率-10.510.5

P

P3、確定P值,作出推斷結(jié)論12十二月202247P值是指在H0所規(guī)定的總體作隨機(jī)抽4714十二月2022480-t0.05/2,νt0.05/2,ν95%2.5%2.5%拒絕域拒絕域假設(shè)檢驗(yàn)12十二月2022480-t0.05/2,νt0.05/4814十二月202249如何下結(jié)論?P>0.05,按α=0.05檢驗(yàn)水準(zhǔn),不拒絕H0,差異無(wú)統(tǒng)計(jì)學(xué)意義(差異無(wú)顯著性),尚不能認(rèn)為……不同或不等。P≤0.05,按α=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義(差異有顯著性),可以認(rèn)為……不同或不等。推斷結(jié)論=統(tǒng)計(jì)結(jié)論+專(zhuān)業(yè)結(jié)論。統(tǒng)計(jì)結(jié)論只說(shuō)明有無(wú)統(tǒng)計(jì)學(xué)意義(statisticalsignificance),而不能說(shuō)明專(zhuān)業(yè)上的差異大小。它必須同專(zhuān)業(yè)結(jié)論有機(jī)結(jié)合,才能得出恰如其分、符合客觀(guān)實(shí)際的最終結(jié)論。3、確定P值,作出推斷結(jié)論12十二月202249如何下結(jié)論?3、確定P值,作出推斷4914十二月202250注意:①不拒絕H0不等于接受H0,因?yàn)榇藭r(shí)證據(jù)不足??蓵簳r(shí)“接受”它,或“陰性待診”。②推斷結(jié)論時(shí),對(duì)H0只能說(shuō):拒絕或不拒絕;對(duì)H1只能說(shuō):接受H1。正確理解結(jié)論的概率性(都隱含著犯錯(cuò)誤的可能性)。3、確定P值,作出推斷結(jié)論12十二月202250注意:3、確定P值,作出推斷結(jié)論5014十二月202251第四節(jié)

t檢驗(yàn)與u檢驗(yàn)樣本均數(shù)與總體均數(shù)比較(單樣本u檢驗(yàn)、t

檢驗(yàn))配對(duì)設(shè)計(jì)的差值均數(shù)與總體均數(shù)0的比較(配對(duì)樣本t

檢驗(yàn))完全隨機(jī)設(shè)計(jì)的兩個(gè)樣本均數(shù)的比較(兩樣本u檢驗(yàn)、t檢驗(yàn))

12十二月202251第四節(jié)t檢驗(yàn)與u檢驗(yàn)樣本均數(shù)與5114十二月202252第四節(jié)t

檢驗(yàn)與u檢驗(yàn)t

檢驗(yàn)應(yīng)用條件:①總體標(biāo)準(zhǔn)差σ未知且n較小時(shí)(n<100),樣本取自正態(tài)分布的總體;②兩小樣本均數(shù)比較時(shí),還要求兩樣本所屬的總體方差相等,;條件略有偏離,也可。u檢驗(yàn)應(yīng)用條件:

①總體標(biāo)準(zhǔn)差σ已知;②總體標(biāo)準(zhǔn)差σ未知,但樣本含量較大(n>100)12十二月202252第四節(jié)t檢驗(yàn)與u檢驗(yàn)t檢驗(yàn)應(yīng)5214十二月202253即樣本均數(shù)代表的未知總體均數(shù)μ和已知總體均數(shù)μ0的比較

已知的總體均數(shù):一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過(guò)大量觀(guān)察所得的穩(wěn)定值一、樣本均數(shù)與總體均數(shù)的比較12十二月202253即樣本均數(shù)代表的未知總體均數(shù)5314十二月202254計(jì)算檢驗(yàn)統(tǒng)計(jì)量u值或t值一、樣本均數(shù)與總體均數(shù)的比較12十二月202254計(jì)算檢驗(yàn)統(tǒng)計(jì)量u值或t值一、樣本均5414十二月202255例15-5:

某市某年抽查了150名2歲男孩的體重,得平均體重為11.18kg,標(biāo)準(zhǔn)差為1.23kg.而同期全國(guó)九城市大量調(diào)查得同齡男孩的平均體重為11kg.問(wèn)該市2歲男孩的平均體重與全國(guó)的同期水平有無(wú)差別?一、樣本均數(shù)與總體均數(shù)的比較解題思路:μ0=11kg一個(gè)已知總體,一個(gè)大樣本——

單樣本u檢驗(yàn)根據(jù)題目問(wèn)題和專(zhuān)業(yè)知識(shí)——雙側(cè)檢驗(yàn)12十二月202255例15-5:某市某年抽查了155514十二月202256(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ

=μ0H1:μ

μ0α=0.05一、樣本均數(shù)與總體均數(shù)的比較12十二月202256(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:5614十二月202257(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量

已知

一、樣本均數(shù)與總體均數(shù)的比較12十二月202257(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量57(3)確定P值和做出推斷結(jié)論

本例u=1.792,查u界值表,u0.05/2=1.96.u=1.792<1.96,所以P>0.05故在

=0.05的水準(zhǔn),不拒絕H0,差別沒(méi)有統(tǒng)計(jì)學(xué)意義。專(zhuān)業(yè)的結(jié)論:尚不能認(rèn)為該市2歲男孩的平均體重與全國(guó)的同期水平不同。(3)確定P值和做出推斷結(jié)論58例15.615例長(zhǎng)期服用某種避孕藥的婦女,其血清膽固醇含量的均數(shù)為6.5mmol/L,標(biāo)準(zhǔn)差為0.7mmol/L,一般健康婦女血清膽固醇含量的均數(shù)為4.4mmol/L,問(wèn)長(zhǎng)期服用該種避孕藥的婦女其血清膽固醇含量的均數(shù)與一般健康婦女有無(wú)差別?例15.615例長(zhǎng)期服用某種避孕藥的婦女,其血清膽固醇含5914十二月202260(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ=μ0H1:μ≠μ0α=0.05一、樣本均數(shù)與總體均數(shù)的比較12十二月202260(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:6014十二月202261(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量

已知

一、樣本均數(shù)與總體均數(shù)的比較12十二月202261(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量6114十二月202262(3)確定P值,作出推斷結(jié)論查t界值表t0.05/2,14=2.145

Pt0.052.145>P11.667P<0.05,按α=0.05檢驗(yàn)水準(zhǔn),拒絕H0

,接受H1;可認(rèn)為長(zhǎng)期服用該種避孕藥的婦女其血清膽固醇含量的均數(shù)與一般健康婦女的差別有統(tǒng)計(jì)學(xué)意義,服用該種避孕藥的婦女其血清膽固醇含量的均數(shù)高于一般健康婦女.一、樣本均數(shù)與總體均數(shù)的比較12十二月202262(3)確定P值,作出推斷結(jié)論P(yáng)t06214十二月202263

假陰性假陽(yáng)性

第六節(jié)I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤12十二月202263第六節(jié)I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤6314十二月202264

Ⅰ類(lèi)錯(cuò)誤與Ⅱ類(lèi)錯(cuò)誤的關(guān)系(以單側(cè)檢驗(yàn)為例)不拒絕H0,假設(shè)檢驗(yàn)的結(jié)果拒絕H012十二月202264Ⅰ類(lèi)錯(cuò)誤與Ⅱ類(lèi)錯(cuò)誤的關(guān)系(以單側(cè)6414十二月202265I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤

Ⅰ類(lèi)錯(cuò)誤---拒絕了成立的無(wú)效假設(shè)H0所犯的錯(cuò)誤稱(chēng)為Ⅰ類(lèi)錯(cuò)誤(“棄真”)。其概率大小用α表示。常稱(chēng)之為檢驗(yàn)水準(zhǔn)

Ⅱ類(lèi)錯(cuò)誤---接受了不成立的無(wú)效假設(shè)H0所犯的錯(cuò)誤稱(chēng)為Ⅱ類(lèi)錯(cuò)誤(“存?zhèn)巍?,其概率大小用β表示。12十二月202265I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤6514十二月202266

是預(yù)先規(guī)定允許犯I型錯(cuò)誤概率的最大值,由研究者確定,可取單尾亦可取雙尾。

II類(lèi)錯(cuò)誤的概率大小用表示,值需要估算。1稱(chēng)檢驗(yàn)效能(powerofatest),過(guò)去稱(chēng)把握度。意義是當(dāng)兩總體確有差別,按檢驗(yàn)水準(zhǔn)所能檢出其差異的能力。通常要求達(dá)到0.8以上。樣本含量固定前提下,愈小,愈大;愈大,愈小。若要同時(shí)減小和,唯一方法是增加樣本含量n。I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤12十二月202266是預(yù)先規(guī)定允許犯I型錯(cuò)誤概率6614十二月202267若重點(diǎn)減少(如一般假設(shè)檢驗(yàn)),一般取=0.05;若重點(diǎn)減少(如方差齊性檢驗(yàn),正態(tài)性檢驗(yàn)等),一般取=0.10或0.20甚至更高。拒絕H0,只可能犯I類(lèi)錯(cuò)誤,不可能犯II類(lèi)錯(cuò)誤;

“接受”H0,只可能犯II類(lèi)錯(cuò)誤,不可能犯I類(lèi)錯(cuò)誤。I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤12十二月202267若重點(diǎn)減少(如一般假設(shè)檢驗(yàn)),一6714十二月202268二、配對(duì)設(shè)計(jì)的差值均數(shù)與總體均數(shù)0的比較常見(jiàn)的配對(duì)設(shè)計(jì)主要有以下情形:①異體配對(duì):將條件近似的觀(guān)察對(duì)象兩兩配成對(duì)子,對(duì)子中的兩個(gè)個(gè)體分別給予不同的處理。(目的是比較不同方法之間的差異)②自身配對(duì):同一受試對(duì)象處理前后或不同部位測(cè)定值的比較。(目的是判斷此處理有無(wú)作用)③自身配對(duì):同一受試對(duì)象(或樣品)分別接受兩種不同方法的處理。(目的是比較不同方法之間的差異)12十二月202268二、配對(duì)設(shè)計(jì)的差值均數(shù)與總體均數(shù)068對(duì)子號(hào)A藥B藥dd21106416213941636339411101151010006743978263688539

∑d=24∑d2=96例15.7按性別相同、年齡相近、病情相近把16例某病患者配成8對(duì),每對(duì)分別給予A藥和B藥治療,現(xiàn)測(cè)得治療后的血沉(mm/h)結(jié)果如下,問(wèn):不同藥物治療后病人血沉水平是否有差異?

表15-3不同藥物治療后某病患者的血沉值(mm/h)二、配對(duì)設(shè)計(jì)的差值均數(shù)與總體均數(shù)0的比較對(duì)子號(hào)A藥B藥dd2110641621394163633946914十二月202270自身配對(duì)舉例:表1克矽平治療前后血清粘蛋白(mg/L)

12十二月202270自身配對(duì)舉例:表1克矽平治療前后7014十二月202271表2A、B兩法乳腺癌檢出率比較自身配對(duì)舉例12十二月202271表2A、B兩法乳腺癌檢出率7114十二月202272配對(duì)t檢驗(yàn)的基本原理:

假設(shè)兩種處理的效應(yīng)相同,即μ1=μ2

,則μ1-μ2=0,即可看成是差值的樣本均數(shù)所代表的未知總體均數(shù)μd

與已知總體均數(shù)μ0=0的比較,此時(shí),我們可套用前述t檢驗(yàn)的公式。二、配對(duì)設(shè)計(jì)的差值均數(shù)與總體均數(shù)0的比較12十二月202272配對(duì)t檢驗(yàn)的基本原理:二7214十二月202273

H0:μd=

0

H1:μd≠0

α=0.05(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量二、配對(duì)樣本t檢驗(yàn)12十二月202273H0:μd=0(1)7314十二月202274⑶確定P值,做出推斷結(jié)論自由度ν=n-1=8-1=7,查表2,t界值表,t0.05/2,7=2.365,t0.01/2,7=3.499。今t=4.582>t0.01/2,7

,故P<0.01,故按α=0.05水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義;可以認(rèn)為不同藥物治療后病人血沉水平不同。二、配對(duì)樣本t檢驗(yàn)12十二月202274⑶確定P值,做出推斷結(jié)論二、配對(duì)樣7414十二月202275三、完全隨機(jī)設(shè)計(jì)的兩個(gè)樣本均數(shù)的比較或?qū)⑹茉噷?duì)象隨機(jī)分到兩個(gè)處理組;比較兩種處理是否有差別;從2個(gè)總體中隨機(jī)抽取兩個(gè)樣本;比較某一指標(biāo)在不同特征人群中是否相等;目的是推斷2個(gè)總體均數(shù)是否相等;比較的兩個(gè)樣本含量相等時(shí)抽樣誤差最小適用條件:1、正態(tài)性2、方差齊性12十二月202275三、完全隨機(jī)設(shè)計(jì)的兩個(gè)樣本均數(shù)的比75(一)U檢驗(yàn)當(dāng)兩樣本含量均較大,如均大于100(一)U檢驗(yàn)當(dāng)兩樣本含量均較大,如均大于10076例15-8

某醫(yī)師為研究血清膽固醇水平與職業(yè)的關(guān)系,得調(diào)查資料如表15-4,問(wèn)兩種職業(yè)的血清膽固醇水平是否不同?表15-4兩種職業(yè)的血清膽固醇水平職業(yè)類(lèi)型人數(shù)均值標(biāo)準(zhǔn)差教師5374.80.72工人6434.60.81例15-8某醫(yī)師為研究血清膽固醇水平與職業(yè)的關(guān)系,得調(diào)查資7714十二月202278⑴建立假設(shè),確定檢驗(yàn)水準(zhǔn)

H0:μ1=μ2,…

H1:μ1≠μ2,…α=0.0512十二月202278⑴建立假設(shè),確定檢驗(yàn)水準(zhǔn)78(一)U檢驗(yàn)⑵選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量(一)U檢驗(yàn)⑵選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量7914十二月202280⑶確定P值,判斷結(jié)果

查U界值表,u0.01/2=2.58,今2.58<4.448,故P<0.01,故按α=0.05水準(zhǔn),拒絕H0,接受H1,可認(rèn)為教師的血清膽固醇水平高于工人。12十二月202280⑶確定P值,判斷結(jié)果8014十二月202281三、兩樣本t檢驗(yàn)12十二月202281三、兩樣本t檢驗(yàn)81例15.9

某醫(yī)師分別抽取原發(fā)性高血壓病人25例和腦卒中病人27例,測(cè)定其尿酸的含量,結(jié)果見(jiàn)表15-5.問(wèn)原發(fā)性高血壓病人和腦卒中病人的尿酸含量有無(wú)差別?表15-5原發(fā)性高血壓病人與腦卒中病人的尿酸含量(mmol/L)組別人數(shù)均值標(biāo)準(zhǔn)差原發(fā)性高血壓25221.786.1腦卒中27246.596.9例15.9某醫(yī)師分別抽取原發(fā)性高血壓病人25例和腦卒中病人8214十二月202283⑴建立假設(shè),確定檢驗(yàn)水準(zhǔn)

H0:μ1=μ2,…

H1:μ1≠μ2,…α=0.05⑵選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量t值三、兩樣本t檢驗(yàn)12十二月202283⑴建立假設(shè),確定檢驗(yàn)水準(zhǔn)三、兩樣8314十二月202284三、兩樣本t檢驗(yàn)12十二月202284三、兩樣本t檢驗(yàn)8414十二月202285⑶確定P值,做出推斷結(jié)論

v=(n1-1)+(n2-1)=50,查t界值表,t0.05/2,50=2.009,今︱t︱=0.973

<t0.05/2,50

,故P>0.05,故按α=0.05水準(zhǔn),不拒絕H0,尚不能認(rèn)為原發(fā)性高血壓病人和腦卒中病人的尿酸含量不同。三、兩樣本t檢驗(yàn)12十二月202285⑶確定P值,做出推斷結(jié)論三、兩樣本85SPSS軟件謝謝SPSS軟件謝謝86第十五章數(shù)值變量的統(tǒng)計(jì)推斷第十五章數(shù)值變量的統(tǒng)計(jì)推斷14十二月202288回顧上一章內(nèi)容:集中趨勢(shì)指標(biāo):算術(shù)均數(shù)、中位數(shù)、幾何均數(shù)離散趨勢(shì)指標(biāo):全距、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)正態(tài)分布:概念、特征、面積規(guī)律、應(yīng)用醫(yī)學(xué)參考值估計(jì):步驟、估計(jì)方法計(jì)量資料的統(tǒng)計(jì)描述:12十二月20222回顧上一章內(nèi)容:集中趨勢(shì)指標(biāo):計(jì)量資8814十二月202289均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤總體均數(shù)的估計(jì)假設(shè)檢驗(yàn)的基本原理與步驟t檢驗(yàn)與u檢驗(yàn)方差分析兩類(lèi)錯(cuò)誤假設(shè)及假設(shè)檢驗(yàn)的注意事項(xiàng)本次講授內(nèi)容12十二月20223均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤本次講授內(nèi)容8914十二月202290統(tǒng)計(jì)推斷(Statisticalinference):用樣本信息推論總體特征的過(guò)程。即采用樣本統(tǒng)計(jì)量對(duì)相應(yīng)總體參數(shù)所做的非確定性的推估。主要包括:參數(shù)估計(jì)假設(shè)檢驗(yàn)第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月20224統(tǒng)計(jì)推斷(Statisticali9014十二月202291第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤參數(shù)估計(jì):

運(yùn)用統(tǒng)計(jì)學(xué)原理,用從樣本計(jì)算出來(lái)的統(tǒng)計(jì)指標(biāo)量,對(duì)總體統(tǒng)計(jì)指標(biāo)量進(jìn)行估計(jì)。假設(shè)檢驗(yàn):又稱(chēng)顯著性檢驗(yàn),是指由樣本間存在的差別對(duì)樣本所代表的總體間是否存在著差別做出判斷。方法:均數(shù)的參數(shù)估計(jì)、均數(shù)u檢驗(yàn)、均數(shù)t檢驗(yàn)12十二月20225第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤參數(shù)91總體參數(shù):μ=155.4㎝,

σ=5.3㎝X~N(155.4㎝,(5.3㎝)2)12100n=30x1=156.7n=30x2=158.1n=30x100=156.6……13歲女學(xué)生身高第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

總體參數(shù):μ=155.4㎝,12100n=30x192數(shù)值變量的統(tǒng)計(jì)推斷1課件93從正態(tài)總體N(155.4,5.32)抽樣得到100個(gè)樣本均數(shù)的頻數(shù)分布組段(cm)頻數(shù)頻率(%)152.6~11.0153.2~44.0153.8~44.0154.4~2222.0155.0~2525.0155.6~2121.0156.2~1717.0156.8~33.0157.4~22.0158.0~159.611.0合計(jì)100100.0100個(gè)樣本平均數(shù)的頻數(shù)分布圖

(直方圖)從正態(tài)總體N(155.4,5.32)抽樣得到100個(gè)樣本均數(shù)94

理論上可以證明:若從正態(tài)總體中,反復(fù)多次隨機(jī)抽取樣本含量固定為n的樣本,那么這些樣本均數(shù)也服從正態(tài)分布,即的總體均數(shù)仍為,樣本均數(shù)的標(biāo)準(zhǔn)差為。抽樣分布抽樣分布示意圖抽樣分布抽樣分布示意圖95一.抽樣誤差:由于抽樣而引起的樣本均數(shù)與總體均數(shù)之間、樣本均數(shù)與樣本均數(shù)之間的差異稱(chēng)為抽樣誤差。特點(diǎn):不可避免!可以計(jì)算或估計(jì)其大小。一.抽樣誤差:9614十二月202297通過(guò)增加樣本含量n來(lái)降低抽樣誤差。某一個(gè)樣本的標(biāo)準(zhǔn)差該樣本的個(gè)體例數(shù)二.標(biāo)準(zhǔn)誤(standarderror,SE)及其計(jì)算即樣本均數(shù)的標(biāo)準(zhǔn)差,可用于衡量抽樣誤差的大小。因通常σ未知,用S來(lái)估計(jì)。計(jì)算標(biāo)準(zhǔn)誤采用下式:第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月202211通過(guò)增加樣本含量n來(lái)降低抽樣誤差。9714十二月20224個(gè)抽樣實(shí)驗(yàn)結(jié)果比較12十二月20224個(gè)抽樣實(shí)驗(yàn)結(jié)果比較9814十二月202299標(biāo)準(zhǔn)誤的特點(diǎn):當(dāng)樣本例數(shù)n一定時(shí),標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比;當(dāng)標(biāo)準(zhǔn)差一定時(shí),標(biāo)準(zhǔn)誤與樣本含量n的平方根呈反比。意義:反映樣本均數(shù)間離散程度。反映抽樣誤差的大小。標(biāo)準(zhǔn)誤越小,抽樣誤差越小,用樣本均數(shù)估計(jì)總體均數(shù)的可靠性越大。第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月202213標(biāo)準(zhǔn)誤的特點(diǎn):第一節(jié)均數(shù)的抽樣誤9914十二月2022100例15-1:某地150名3歲女孩平均身高為92.8CM,標(biāo)準(zhǔn)差為4.6CM,求其標(biāo)準(zhǔn)誤。未知S

代替第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月202214未知第一節(jié)均數(shù)的抽樣誤差10014十二月2022101三.標(biāo)準(zhǔn)誤的應(yīng)用反映樣本均數(shù)的可靠性,衡量抽樣誤差大小估計(jì)總體均數(shù)的可信區(qū)間用于假設(shè)檢驗(yàn)第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月202215三.標(biāo)準(zhǔn)誤的應(yīng)用第一節(jié)均數(shù)的抽樣10114十二月2022102區(qū)別:標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)差定義反映抽樣誤差反映個(gè)體變異公式用途總體均數(shù)可信區(qū)間醫(yī)學(xué)參考值范圍進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)計(jì)算標(biāo)準(zhǔn)誤、CV聯(lián)系:當(dāng)n一定時(shí)標(biāo)準(zhǔn)差大,標(biāo)準(zhǔn)誤也大補(bǔ)充內(nèi)容:

標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別與聯(lián)系第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤12十二月202216區(qū)別:標(biāo)準(zhǔn)誤10214十二月2022103第二節(jié)

總體均數(shù)的估計(jì)隨機(jī)變量xN(,2)

標(biāo)準(zhǔn)正態(tài)分布N(0,12)

抽樣

樣本均數(shù)

N(,2/n)

標(biāo)準(zhǔn)正態(tài)分布N(0,12)

未知

S

代替u變換Studentt分布自由度:n-1t變換12十二月202217第二節(jié)總體均數(shù)的估計(jì)標(biāo)準(zhǔn)正10314十二月2022104

m個(gè)樣本的均數(shù)

標(biāo)準(zhǔn)誤t值總體為N的m個(gè)樣本(樣本大小為n)的t值t分布12十二月202218

標(biāo)準(zhǔn)誤t值總體為N的m個(gè)樣本(樣104圖15-1自由度分別為1、5、∞的t分布標(biāo)準(zhǔn)正態(tài)分布圖15-1自由度分別為1、5、∞的t分布標(biāo)準(zhǔn)正態(tài)分布10514十二月2022106t分布的圖形與特征①以0為中心,左右對(duì)稱(chēng)的單峰分布;②t分布曲線(xiàn)是一簇曲線(xiàn),其形態(tài)變化與自由度的大小有關(guān)。自由度越小,則t值越分散,t分布曲線(xiàn)的峰部越矮而尾部翹得越高;說(shuō)明尾部面積(概率P)就越大;與u分布曲線(xiàn)相比,t分布低平;自由度逐漸增大時(shí),t分布逐漸逼近u分布(標(biāo)準(zhǔn)正態(tài)分布);當(dāng)趨于∞時(shí),

逼近,t分布即為u分布。t分布12十二月202220t分布的圖形與特征t分布10614十二月2022107附表

t界值表(228頁(yè))12十二月202221附表t界值表(22107自由度概率P單側(cè)0.250.200.100.050.0250.01雙側(cè)0.500.400.200.100.050.0211.001.3763.0786.31412.70631.8220.8161.0611.8862.9204.3036.965…100.700.8791.3721.8122.2282.764…500.6790.8491.2991.6762.0092.403…1000.6770.8451.291.6601.9842.3640.6750.8421.2821.6451.9602.326自由度概率P單側(cè)0.250.200.100.050.025010814十二月2022109如左圖所示,圖中的陰影部分表示以外尾部面積占總面積的百分?jǐn)?shù),即概率。如查表單側(cè),表示從正態(tài)總體作樣本例數(shù)n為11的隨機(jī)抽樣,其t值服從ν=n-1=11-1=10的t分布。1.812理論上:v=10,單α=0.05,則有:一般表示:

t分布12十二月202223如左圖所示,圖中的陰影部分表示10914十二月2022110如圖所示:相同自由度下,雙側(cè)P值為單側(cè)P值得兩倍。t界值表中,2.228-2.228

t分布12十二月202224如圖所示:2.228-2.22811014十二月2022111參數(shù)估計(jì):用樣本均數(shù)估計(jì)總體均數(shù)。參數(shù)的估計(jì)點(diǎn)值估計(jì):由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)區(qū)間估計(jì):獲得一個(gè)可信區(qū)間(confidenceinterval,CI)——由樣本數(shù)據(jù)估計(jì)得到的、100(1)%可能包含未知總體參數(shù)的一個(gè)范圍值。第二節(jié)總體均數(shù)的估計(jì)12十二月202225參數(shù)估計(jì):用樣本均數(shù)估計(jì)總體均數(shù)。11114十二月2022112

1、點(diǎn)(值)估計(jì):用相應(yīng)樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值。即用估計(jì)其方法雖簡(jiǎn)單,但未考慮抽樣誤差的大小一、可信區(qū)間的概念12十二月2022261、點(diǎn)(值)估計(jì):一、可信區(qū)間的11214十二月20221132、區(qū)間估計(jì)概念:按照預(yù)先給定的概率(可信度)估計(jì)的未知總體參數(shù)的范圍??尚艆^(qū)間(confidenceinterval,CI)是根據(jù)一定的可信度估計(jì)得到的區(qū)間。一、可信區(qū)間的概念12十二月2022272、區(qū)間估計(jì)一、可信區(qū)間的概念11314十二月2022114總體均數(shù)的可信區(qū)間(1)σ已知,按u分布,95%和99%可信區(qū)間:

(2)σ未知,且n較小,按t分布(3)σ未知但n足夠大,按u分布二、總體均數(shù)可信區(qū)的計(jì)算12十二月202228總體均數(shù)的可信區(qū)間二、總體均數(shù)可信11414十二月2022115二、總體均數(shù)可信區(qū)的計(jì)算例15-2隨機(jī)抽取某地10名男孩出生體重,測(cè)得其平均體重為3.21kg,標(biāo)準(zhǔn)差S為0.47kg,試估計(jì)該地男孩出生體重的總體均數(shù)的95%置信區(qū)間。12十二月202229二、總體均數(shù)可信區(qū)的計(jì)算例15-211514十二月202211612十二月20223011614十二月202211795%的可信區(qū)間表示:如果從同一總體中重復(fù)抽取100個(gè)獨(dú)立樣本,將可能有95個(gè)可信區(qū)間包括總體均數(shù),有5個(gè)可信區(qū)間不包括總體均數(shù)。對(duì)于一次估計(jì)的可信區(qū)間,可能有95%的正確率,但仍有5%的可信區(qū)間估計(jì)錯(cuò)誤。三、可信區(qū)間的涵義12十二月20223195%的可信區(qū)間表示:如果從同一總117模擬抽樣成年男子紅細(xì)胞數(shù)100次的95%可信區(qū)間示意圖

******模擬抽樣成年男子紅細(xì)胞數(shù)100次的95%可信區(qū)間示意圖***11814十二月2022119四、總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別12十二月202233四、總體均數(shù)可信區(qū)間與參考值范圍的119第三節(jié)假設(shè)檢驗(yàn)的基本原理與步驟一、假設(shè)檢驗(yàn)(HypothesisTesting)的基本原理例15.4:

根據(jù)大量調(diào)查,已知一般健康成年男子的脈博均數(shù)為72次/min,某醫(yī)生在某山區(qū)隨機(jī)調(diào)查100名健康男子,得其脈搏均數(shù)為76.2次/min,標(biāo)準(zhǔn)差為4.0次/min。能否認(rèn)為該山區(qū)的健康成年男子脈搏均數(shù)高于一般成年男子脈搏均數(shù)?第三節(jié)假設(shè)檢驗(yàn)的基本原理與步驟一、假設(shè)檢驗(yàn)(Hypoth12014十二月2022121n=100已知總體一般成年男性脈搏未知總體山區(qū)成年男子脈搏?12十二月202235n=100已知總體未知總體?12114十二月2022122差異的原因:

(1)由于抽樣誤差造成的.(實(shí)際上

=0

,但由于抽樣誤差不能很好代表0

)(2)可能由于地區(qū)等環(huán)境因素的影響,樣本所代表的總體與已知總體確實(shí)不同:012十二月202236差異的原因:122下面我們用一例說(shuō)明這個(gè)原則:兩個(gè)盒子,各裝有100個(gè)球.小概率事件在一次試驗(yàn)中不會(huì)發(fā)生.一個(gè)盒子中的白球和紅球數(shù)99個(gè)白球一個(gè)紅球…99個(gè)另一盒中的白球和紅球數(shù)99個(gè)紅球一個(gè)白球…99個(gè)下面我們用一例說(shuō)明這個(gè)原則:兩個(gè)盒子,各裝有100個(gè)球.小概123將盒子密封,現(xiàn)從兩盒中隨機(jī)取出一個(gè)盒子,問(wèn)這個(gè)盒子里是白球99個(gè)還是紅球99個(gè)?將盒子密封,現(xiàn)從兩盒中隨機(jī)取出一個(gè)盒子,問(wèn)這個(gè)盒子里是白球9124我們不妨先假設(shè):這個(gè)盒子里有99個(gè)白球.現(xiàn)在我們從中隨機(jī)摸出一個(gè)球,發(fā)現(xiàn)是此時(shí)你如何判斷這個(gè)假設(shè)是否成立呢?我們不妨先假設(shè):這個(gè)盒子里有99個(gè)白球.現(xiàn)在我們從中隨機(jī)摸出125假設(shè)其中真有99個(gè)白球,摸出紅球的概率只有1/100,這是小概率事件.小概率事件在一次試驗(yàn)中竟然發(fā)生了,不能不使人懷疑所作的假設(shè).小概率反證法.小概率事件在一次試驗(yàn)中不會(huì)發(fā)生.假設(shè)其中真有99個(gè)白球,摸出紅球的概率只有1/100,這是小12614十二月2022127假設(shè)檢驗(yàn)的基本步驟1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)2.選定檢驗(yàn)統(tǒng)計(jì)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.確定P值,作出推斷結(jié)論12十二月202241假設(shè)檢驗(yàn)的基本步驟1.建立假設(shè),127無(wú)效假設(shè)(nullhypothesis),記為H0,又稱(chēng)原假設(shè),表示目前的差異是由于抽樣誤差引起的。備擇假設(shè)(alternativehypothesis),記為H1,又稱(chēng)對(duì)立假設(shè),表示目前的差異是主要由于本質(zhì)上的差別引起。兩個(gè)假設(shè)既有聯(lián)系又互相獨(dú)立,應(yīng)該包括兩種(也是所有)可能的判斷。要做出抉擇。1、建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)

1、建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)

1、建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)

1、建立檢驗(yàn)假設(shè),確定檢驗(yàn)水12814十二月2022129(1)根據(jù)專(zhuān)業(yè)知識(shí)

事先不知道會(huì)出現(xiàn)什么結(jié)果——雙側(cè)事先知道只能出現(xiàn)某種結(jié)果——單側(cè)如:難產(chǎn)兒的出生體重與一般嬰兒出生體重大

〉---單側(cè)一般預(yù)實(shí)驗(yàn)有探索性質(zhì),對(duì)結(jié)果的考慮思路應(yīng)寬些,多雙側(cè)(2)問(wèn)題的提法如:可否據(jù)此認(rèn)為該山區(qū)成年男子的脈搏數(shù)高于一般成年男子的脈搏均數(shù)?

*通常用雙側(cè)(除非有充足的理由選用單側(cè)之外,一般選用保守的雙側(cè)較穩(wěn)妥)單、雙側(cè)檢驗(yàn)的選擇:12十二月202243(1)根據(jù)專(zhuān)業(yè)知識(shí)單、雙側(cè)檢驗(yàn)的選12914十二月2022130檢驗(yàn)水準(zhǔn)(sizeofatest)亦稱(chēng)顯著性水準(zhǔn)(significancelevel),用α表示,在實(shí)際工作中α常取0.05。意義:假設(shè)檢驗(yàn)時(shí),根據(jù)研究的目的或要求預(yù)先規(guī)定的概率值,是判定小概率事件發(fā)生的標(biāo)準(zhǔn)(H0)或閾值;亦是允許結(jié)果出現(xiàn)第一類(lèi)錯(cuò)誤的概率。α取值并非一成不變,可根據(jù)研究目的給予不同設(shè)置。1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)12十二月202244檢驗(yàn)水準(zhǔn)(sizeofate13014十二月2022131注意:H0,H1和α的確定,以及單雙側(cè)檢驗(yàn)的選擇,都應(yīng)結(jié)合研究設(shè)計(jì),在未獲得樣本結(jié)果之前決定,而不要受樣本結(jié)果的影響。

假設(shè)檢驗(yàn)是針對(duì)總體而不是針對(duì)樣本。1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)12十二月202245注意:1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)13114十二月2022132要根據(jù)研究設(shè)計(jì)的類(lèi)型和統(tǒng)計(jì)推斷的目的選用不同的檢驗(yàn)方法,如:兩樣本均數(shù)的比較用t檢驗(yàn),兩樣本率的比較用卡方檢驗(yàn)……

所有檢驗(yàn)統(tǒng)計(jì)量都是在H0成立的前提條件下計(jì)算的。2、選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量12十二月202246要根據(jù)研究設(shè)計(jì)的類(lèi)型和統(tǒng)計(jì)推斷的目13214十二月2022133P值是指在H0所規(guī)定的總體作隨機(jī)抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。例如求得t=10.5,v=99,α=0.05,

P是在μ=μ0的前提條件下隨機(jī)抽樣,得到

t≤-10.5和t>10.5的概率-10.510.5

P

P3、確定P值,作出推斷結(jié)論12十二月202247P值是指在H0所規(guī)定的總體作隨機(jī)抽13314十二月20221340-t0.05/2,νt0.05/2,ν95%2.5%2.5%拒絕域拒絕域假設(shè)檢驗(yàn)12十二月2022480-t0.05/2,νt0.05/13414十二月2022135如何下結(jié)論?P>0.05,按α=0.05檢驗(yàn)水準(zhǔn),不拒絕H0,差異無(wú)統(tǒng)計(jì)學(xué)意義(差異無(wú)顯著性),尚不能認(rèn)為……不同或不等。P≤0.05,按α=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義(差異有顯著性),可以認(rèn)為……不同或不等。推斷結(jié)論=統(tǒng)計(jì)結(jié)論+專(zhuān)業(yè)結(jié)論。統(tǒng)計(jì)結(jié)論只說(shuō)明有無(wú)統(tǒng)計(jì)學(xué)意義(statisticalsignificance),而不能說(shuō)明專(zhuān)業(yè)上的差異大小。它必須同專(zhuān)業(yè)結(jié)論有機(jī)結(jié)合,才能得出恰如其分、符合客觀(guān)實(shí)際的最終結(jié)論。3、確定P值,作出推斷結(jié)論12十二月202249如何下結(jié)論?3、確定P值,作出推斷13514十二月2022136注意:①不拒絕H0不等于接受H0,因?yàn)榇藭r(shí)證據(jù)不足??蓵簳r(shí)“接受”它,或“陰性待診”。②推斷結(jié)論時(shí),對(duì)H0只能說(shuō):拒絕或不拒絕;對(duì)H1只能說(shuō):接受H1。正確理解結(jié)論的概率性(都隱含著犯錯(cuò)誤的可能性)。3、確定P值,作出推斷結(jié)論12十二月202250注意:3、確定P值,作出推斷結(jié)論13614十二月2022137第四節(jié)

t檢驗(yàn)與u檢驗(yàn)樣本均數(shù)與總體均數(shù)比較(單樣本u檢驗(yàn)、t

檢驗(yàn))配對(duì)設(shè)計(jì)的差值均數(shù)與總體均數(shù)0的比較(配對(duì)樣本t

檢驗(yàn))完全隨機(jī)設(shè)計(jì)的兩個(gè)樣本均數(shù)的比較(兩樣本u檢驗(yàn)、t檢驗(yàn))

12十二月202251第四節(jié)t檢驗(yàn)與u檢驗(yàn)樣本均數(shù)與13714十二月2022138第四節(jié)t

檢驗(yàn)與u檢驗(yàn)t

檢驗(yàn)應(yīng)用條件:①總體標(biāo)準(zhǔn)差σ未知且n較小時(shí)(n<100),樣本取自正態(tài)分布的總體;②兩小樣本均數(shù)比較時(shí),還要求兩樣本所屬的總體方差相等,;條件略有偏離,也可。u檢驗(yàn)應(yīng)用條件:

①總體標(biāo)準(zhǔn)差σ已知;②總體標(biāo)準(zhǔn)差σ未知,但樣本含量較大(n>100)12十二月202252第四節(jié)t檢驗(yàn)與u檢驗(yàn)t檢驗(yàn)應(yīng)13814十二月2022139即樣本均數(shù)代表的未知總體均數(shù)μ和已知總體均數(shù)μ0的比較

已知的總體均數(shù):一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過(guò)大量觀(guān)察所得的穩(wěn)定值一、樣本均數(shù)與總體均數(shù)的比較12十二月202253即樣本均數(shù)代表的未知總體均數(shù)13914十二月2022140計(jì)算檢驗(yàn)統(tǒng)計(jì)量u值或t值一、樣本均數(shù)與總體均數(shù)的比較12十二月202254計(jì)算檢驗(yàn)統(tǒng)計(jì)量u值或t值一、樣本均14014十二月2022141例15-5:

某市某年抽查了150名2歲男孩的體重,得平均體重為11.18kg,標(biāo)準(zhǔn)差為1.23kg.而同期全國(guó)九城市大量調(diào)查得同齡男孩的平均體重為11kg.問(wèn)該市2歲男孩的平均體重與全國(guó)的同期水平有無(wú)差別?一、樣本均數(shù)與總體均數(shù)的比較解題思路:μ0=11kg一個(gè)已知總體,一個(gè)大樣本——

單樣本u檢驗(yàn)根據(jù)題目問(wèn)題和專(zhuān)業(yè)知識(shí)——雙側(cè)檢驗(yàn)12十二月202255例15-5:某市某年抽查了1514114十二月2022142(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ

=μ0H1:μ

μ0α=0.05一、樣本均數(shù)與總體均數(shù)的比較12十二月202256(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:14214十二月2022143(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量

已知

一、樣本均數(shù)與總體均數(shù)的比較12十二月202257(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量143(3)確定P值和做出推斷結(jié)論

本例u=1.792,查u界值表,u0.05/2=1.96.u=1.792<1.96,所以P>0.05故在

=0.05的水準(zhǔn),不拒絕H0,差別沒(méi)有統(tǒng)計(jì)學(xué)意義。專(zhuān)業(yè)的結(jié)論:尚不能認(rèn)為該市2歲男孩的平均體重與全國(guó)的同期水平不同。(3)確定P值和做出推斷結(jié)論144例15.615例長(zhǎng)期服用某種避孕藥的婦女,其血清膽固醇含量的均數(shù)為6.5mmol/L,標(biāo)準(zhǔn)差為0.7mmol/L,一般健康婦女血清膽固醇含量的均數(shù)為4.4mmol/L,問(wèn)長(zhǎng)期服用該種避孕藥的婦女其血清膽固醇含量的均數(shù)與一般健康婦女有無(wú)差別?例15.615例長(zhǎng)期服用某種避孕藥的婦女,其血清膽固醇含14514十二月2022146(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ=μ0H1:μ≠μ0α=0.05一、樣本均數(shù)與總體均數(shù)的比較12十二月202260(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:14614十二月2022147(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量

已知

一、樣本均數(shù)與總體均數(shù)的比較12十二月202261(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量14714十二月2022148(3)確定P值,作出推斷結(jié)論查t界值表t0.05/2,14=2.145

Pt0.052.145>P11.667P<0.05,按α=0.05檢驗(yàn)水準(zhǔn),拒絕H0

,接受H1;可認(rèn)為長(zhǎng)期服用該種避孕藥的婦女其血清膽固醇含量的均數(shù)與一般健康婦女的差別有統(tǒng)計(jì)學(xué)意義,服用該種避孕藥的婦女其血清膽固醇含量的均數(shù)高于一般健康婦女.一、樣本均數(shù)與總體均數(shù)的比較12十二月202262(3)確定P值,作出推斷結(jié)論P(yáng)t014814十二月2022149

假陰性假陽(yáng)性

第六節(jié)I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤12十二月202263第六節(jié)I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤14914十二月2022150

Ⅰ類(lèi)錯(cuò)誤與Ⅱ類(lèi)錯(cuò)誤的關(guān)系(以單側(cè)檢驗(yàn)為例)不拒絕H0,假設(shè)檢驗(yàn)的結(jié)果拒絕H012十二月202264Ⅰ類(lèi)錯(cuò)誤與Ⅱ類(lèi)錯(cuò)誤的關(guān)系(以單側(cè)15014十二月2022151I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤

Ⅰ類(lèi)錯(cuò)誤---拒絕了成立的無(wú)效假設(shè)H0所犯的錯(cuò)誤稱(chēng)為Ⅰ類(lèi)錯(cuò)誤(“棄真”)。其概率大小用α表示。常稱(chēng)之為檢驗(yàn)水準(zhǔn)

Ⅱ類(lèi)錯(cuò)誤---接受了不成立的無(wú)效假設(shè)H0所犯的錯(cuò)誤稱(chēng)為Ⅱ類(lèi)錯(cuò)誤(“存?zhèn)巍?,其概率大小用β表示。12十二月202265I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤15114十二月2022152

是預(yù)先規(guī)定允許犯I型錯(cuò)誤概率的最大值,由研究者確定,可取單尾亦可取雙尾。

II類(lèi)錯(cuò)誤的概率大小用表示,值需要估算。1稱(chēng)檢驗(yàn)效能(powerofatest),過(guò)去稱(chēng)把握度。意義是當(dāng)兩總體確有差別,按檢驗(yàn)水準(zhǔn)所能檢出其差異的能力。通常要求達(dá)到0.8以上。樣本含量固定前提下,愈小,愈大;愈大,愈小。若要同時(shí)減小和,唯一方法是增加樣本含量n。I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤12十二月202266是預(yù)先規(guī)定允許犯I型錯(cuò)誤概率15214十二月2022153若重點(diǎn)減少(如一般假設(shè)檢驗(yàn)),一般取=0.05;若重點(diǎn)減少(如方差齊性檢驗(yàn),正態(tài)性檢驗(yàn)等),一般取=0.10或0.20甚至更高。拒絕H0,只可能犯I類(lèi)錯(cuò)誤,不可能犯II類(lèi)錯(cuò)誤;

“接受”H0,只可能犯II類(lèi)錯(cuò)誤,不可能犯I類(lèi)錯(cuò)誤。I類(lèi)錯(cuò)誤和II類(lèi)錯(cuò)誤12十二月202267若重點(diǎn)減少(如一般假設(shè)檢驗(yàn)),一15314十二月2022154二、配對(duì)設(shè)計(jì)的差值均數(shù)與總體均數(shù)0的比較常見(jiàn)的配對(duì)設(shè)計(jì)主要有以下情形:①異體配對(duì):將條件近似的觀(guān)察對(duì)象兩兩配成對(duì)子,對(duì)子中的兩個(gè)個(gè)體分別給予不同的處理。(目的是比較不同方法之間的差異)②自身配對(duì):同一受試對(duì)象處理前后或不同部位測(cè)定值的比較。(目的是判斷此

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論