第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件_第1頁
第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件_第2頁
第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件_第3頁
第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件_第4頁
第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件_第5頁
已閱讀5頁,還剩145頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二節(jié)正態(tài)分布參考值范圍的估計(jì)

一、正態(tài)分布的概念和特征第二節(jié)正態(tài)分布參考值范圍的估計(jì)22(一)概念:正態(tài)曲線呈對(duì)稱鐘形,均數(shù)所在處最高,兩側(cè)逐漸下降,兩端在無窮處與橫軸無限接近。(一)概念:正態(tài)曲線呈對(duì)稱鐘形,均數(shù)所在處最高,兩側(cè)逐漸下降23第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件24二、標(biāo)準(zhǔn)正態(tài)分布(u變換)將每個(gè)x值轉(zhuǎn)變成u值使均數(shù)為0(=0),標(biāo)準(zhǔn)差為1(=1),則正態(tài)分布N(,)

標(biāo)準(zhǔn)正態(tài)分布N(0,1)(u分布)二、標(biāo)準(zhǔn)正態(tài)分布(u變換)25第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件26

(二)正態(tài)分布的特征

1、正態(tài)曲線在橫軸上方,且均數(shù)所在處最高;2、正態(tài)分布以均數(shù)為中心,左右對(duì)稱;

3、正態(tài)分布有兩個(gè)參數(shù)N(),

4、正態(tài)分布的面積分布有一定的規(guī)律性.(二)正態(tài)分布的特征27正態(tài)分布的圖形由兩個(gè)參數(shù)決定:位置參數(shù)(總體均數(shù))變異度參數(shù)(總體標(biāo)準(zhǔn)差)正態(tài)分布的圖形由兩個(gè)參數(shù)決定:28

1、

越大,曲線沿橫軸向右移動(dòng);反之越小,則向左移動(dòng)。2、越大,數(shù)據(jù)越分散,曲線越“矮胖”;越小,表示數(shù)據(jù)越集中,曲線越“瘦高”。1、越大,曲線沿橫軸向右移動(dòng);反之越小,29(4)正態(tài)曲線下面積分布規(guī)律

a.正態(tài)曲線與橫軸間的面積為1或100%b.以均數(shù)為中心,正態(tài)曲線下對(duì)區(qū)間面積相等。c.在范圍內(nèi)的面積占68.27%在范圍內(nèi)的面積占95%在范圍內(nèi)的面積占99%(4)正態(tài)曲線下面積分布規(guī)律30在范圍內(nèi)的面積占68.27%在范圍內(nèi)的面積占95%在范圍內(nèi)的面積占99%在范圍內(nèi)的面積占68.27%31在正態(tài)曲線下面積分布有一定規(guī)律,其分布可通過其密度函數(shù)積分求得:為了免去計(jì)算的麻煩,統(tǒng)計(jì)學(xué)家已編制出標(biāo)準(zhǔn)正態(tài)分布曲線下的面積(表9-8,P299)在正態(tài)曲線下面積分布有一定規(guī)律,32第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件33應(yīng)用時(shí)應(yīng)注意:(1)如u已知,可直接查表。(2)如u未知,先按求出u值,再查表。(3)表中只列出負(fù)值,如果u為正值,可按負(fù)值查表。應(yīng)用時(shí)應(yīng)注意:34練習(xí)1:標(biāo)準(zhǔn)正態(tài)曲線下(-1.76,0)的面積占總面積的百分?jǐn)?shù)。練習(xí)2:標(biāo)準(zhǔn)正態(tài)曲線下(0,1.20)的面積占總面積的百分?jǐn)?shù)。練習(xí)3:標(biāo)準(zhǔn)正態(tài)曲線下(-1.76,1.20)的面積占總面積的百分?jǐn)?shù)。練習(xí)4:試估計(jì)成年男子尿酸濃度在300以下的比例。練習(xí)1:標(biāo)準(zhǔn)正態(tài)曲線下(-1.76,0)的面積占總面積的百分35練習(xí)4:試估計(jì)成年男子尿酸濃度在300以下的比例。(1)先求出u值:(2)查表得:

Φ(-1.50)=0.0668練習(xí)4:試估計(jì)成年男子尿酸濃度在30036三、參考值范圍的估計(jì)醫(yī)學(xué)參考值范圍:大部分正常人的形態(tài)、功能、代謝產(chǎn)物的生理、生化、指標(biāo)常數(shù)。三、參考值范圍的估計(jì)37制定參考值范圍的基本步驟:1、從正常人的總體中抽樣,且樣本量要足夠(通常n≥100),抽樣遵循隨機(jī)化原則;2、控制測量誤差3、判定是否需要分組確定參考值范圍。

制定參考值范圍的基本步驟:384、決定取單側(cè)還是雙側(cè)。該指標(biāo)過大過小均為異常雙側(cè)該指標(biāo)僅過大或過小為異常單側(cè)5、選定合適的百分界限(常用95%)4、決定取單側(cè)還是雙側(cè)。395、選定合適的百分界限(常用95%)5、選定合適的百分界限(常用95%)40

6、根據(jù)資料的分布類型選定適當(dāng)?shù)姆椒ㄟM(jìn)行參考值范圍的估計(jì)。正態(tài)分布資料正態(tài)分布法對(duì)數(shù)正態(tài)分布資料對(duì)數(shù)正態(tài)分布法偏態(tài)分布資料百分位數(shù)法6、根據(jù)資料的分布類型選定適當(dāng)?shù)姆椒?1第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件42α為可信度:如制定95%參考值范圍:則α=0.05制定99%參考值范圍:則α=0.01Uα可通過查表求得如:雙側(cè)的U0.05=1.960,U0.01=2.576單側(cè)的U0.05=1.645,U0.01=2.326α為可信度:如制定95%參考值范圍:則α=0.0543例9-11利用表9-1的資料求95%的參考值范圍例9-11利用表9-1的資料求95%的參考值范圍44例9-12利用表9-7的資料計(jì)算7歲男童血鉛95%的參考值范圍例9-12利用表9-7的資料計(jì)算7歲男童血鉛95%的參考值45練習(xí):公共汽車的車門高度是根據(jù)正常成年男子的身高來制定的,如正常成年男子的身高均數(shù)為170cm,標(biāo)準(zhǔn)差為10cm,今欲要求有99%的成年男子上車時(shí)不會(huì)碰到頭,車門高度應(yīng)為多高。練習(xí):公共汽車的車門高度是根據(jù)正常成年男子的身高來制定的,如46第三節(jié)數(shù)值變量資料的統(tǒng)計(jì)推斷第三節(jié)47學(xué)習(xí)要點(diǎn):1.掌握均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤的概念;2.了解t分布的概念與特征;3.熟悉總體均數(shù)的區(qū)間估計(jì);4.熟悉假設(shè)檢驗(yàn)的基本原理和步驟;5.掌握t檢驗(yàn)和u檢驗(yàn)的方法;6.了解兩類錯(cuò)誤和假設(shè)檢驗(yàn)的注意事項(xiàng)。學(xué)習(xí)要點(diǎn):1.掌握均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤的概念;48一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤一、均數(shù)的抽樣誤差統(tǒng)計(jì)推斷(statisticalinference)用樣本的信息推論總體的特征。參數(shù)估計(jì)統(tǒng)計(jì)推斷假設(shè)檢驗(yàn)一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤一、均數(shù)的抽樣誤差4914歲女生

(身高)120人

均數(shù)的抽樣誤差----由于抽樣造成的樣本均數(shù)與總體均數(shù)、樣本均數(shù)之間的差異。14歲女生(身高)120人均數(shù)的抽樣誤差---50樣本1樣本2樣本k總體均數(shù)···樣本1樣本2樣本k總體均數(shù)···51根據(jù)中心極限定理:1.從正態(tài)總體中抽樣,抽取樣本含量為n的樣本,樣本均數(shù)服從正態(tài)分布。即使是從偏態(tài)總體中抽樣,在樣本含量足夠(n>50)大時(shí),也近似正態(tài)分布。2.從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)或偏態(tài)總體中抽樣樣本例數(shù)為n的樣本,新樣本組成的數(shù)據(jù)中,樣本均數(shù)為,標(biāo)準(zhǔn)差根據(jù)中心極限定理:1.從正態(tài)總體中抽樣,抽取樣本含量為n的52標(biāo)準(zhǔn)誤:樣本均數(shù)的標(biāo)準(zhǔn)差。反映各均數(shù)間的離散程度。標(biāo)準(zhǔn)誤的意義:描述抽樣誤差的大小,越小,說明抽樣誤差越小,樣本均數(shù)越接近總體均數(shù),用代表的可靠性越高。標(biāo)準(zhǔn)誤:樣本均數(shù)的標(biāo)準(zhǔn)差。反映各均數(shù)間的離散程度。標(biāo)準(zhǔn)誤53標(biāo)準(zhǔn)誤的計(jì)算(P300)均數(shù)的標(biāo)準(zhǔn)誤

以某地14歲健康女生身高的標(biāo)準(zhǔn)差σ=5.30cm及每個(gè)樣本包含的例數(shù)10代入公式9-18,求得

標(biāo)準(zhǔn)誤的計(jì)算(P300)以某地14歲健康女生身高的標(biāo)準(zhǔn)差σ=54應(yīng)用時(shí),用樣本標(biāo)準(zhǔn)差來代替總體標(biāo)準(zhǔn)差,則標(biāo)準(zhǔn)誤的估計(jì)值為:???減少抽樣誤差的有效途徑應(yīng)用時(shí),用樣本標(biāo)準(zhǔn)差來代替總體標(biāo)準(zhǔn)差,則標(biāo)準(zhǔn)誤的55均數(shù)標(biāo)準(zhǔn)誤的用途:①可用來衡量樣本均數(shù)的可靠性。②與樣本均數(shù)結(jié)合,可用于估計(jì)總體均數(shù)的置信區(qū)間;③可用于進(jìn)行均數(shù)的假設(shè)檢驗(yàn)。均數(shù)標(biāo)準(zhǔn)誤的用途:56S與的區(qū)別與聯(lián)系:1、區(qū)別2、聯(lián)系標(biāo)準(zhǔn)誤和標(biāo)準(zhǔn)差成正比,和樣本含量的開方成反比。 區(qū)別標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤意義衡量個(gè)體觀察值的離散程度衡量均數(shù)的變異程度用途用于制定參考值范圍反映抽樣誤差的大小與n的關(guān)系n越大,標(biāo)準(zhǔn)差越穩(wěn)定n越大,標(biāo)準(zhǔn)誤越小S與的區(qū)別與聯(lián)系:區(qū)別標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤意義衡量個(gè)體觀察57二、t分布u變換(將正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布)

t

變換

二、t分布58

全國14歲女生(身高)120人120人120人120人…………(t分布)(u分布)…………全國14歲女生(身高)120人120人120人120人…59t分布特征:(1)單峰分布,以0為中心左右對(duì)稱。(2)t分布是一簇曲線,其形狀受ν的影響。t分布特征:60t分布與標(biāo)準(zhǔn)正態(tài)分布(u分布)區(qū)別:*t分布曲線峰部較矮,尾部稍翹。*n(自由度)越大,t分布與u分布越接近;當(dāng)時(shí),t分布=u分布。t分布與標(biāo)準(zhǔn)正態(tài)分布(u分布)區(qū)別:61t界值表:(表9-9P302)t界值表的特征:

⑴自由度相同時(shí)越大,概率P越??;⑵雙側(cè)概率P為單側(cè)概率P的兩倍。

自由度為,概率為(檢驗(yàn)水準(zhǔn))時(shí),t的界值記為。t界值表:(表9-9P302)t界值表的特征:62第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件63t界值表的查法:

=?通常取0.05或0.01

(t越大,概率P越?。?.2623.2501.962.58當(dāng)n≥50,為大樣本(t分布=u分布),可用來代替t界值表的查法:(t越大,概率P越?。?.2664

三、總體均數(shù)的置信區(qū)間估計(jì)

統(tǒng)計(jì)描述統(tǒng)計(jì)分析參數(shù)估計(jì)---用樣本指標(biāo)估統(tǒng)計(jì)推斷計(jì)總體指標(biāo)假設(shè)檢驗(yàn)三、總體均數(shù)的置信區(qū)間估計(jì)65點(diǎn)估計(jì)---用估計(jì)參數(shù)估計(jì)區(qū)間估計(jì)---按一定的概率估計(jì)總體均數(shù)落在某個(gè)范圍這個(gè)范圍稱之為:

總體均數(shù)的置信區(qū)間CI

,為開區(qū)間用()表示。如(140.2,144.3),說明總體均數(shù)在140.2~144.3之間,但不包含上限(144.3)及下限(140.2)兩個(gè)值。點(diǎn)估計(jì)---用66

總體均數(shù)置信區(qū)間(可信區(qū)間)的計(jì)算2)小樣本或未知----按t分布

總體均數(shù)置信區(qū)間(可信區(qū)間)的計(jì)算67

總體均數(shù)置信區(qū)間(可信區(qū)間)的計(jì)算2)小樣本或未知----按t分布

95%置信區(qū)間99%置信區(qū)間

總體均數(shù)置信區(qū)間(可信區(qū)間)的計(jì)算68總體均數(shù)置信區(qū)間(可信區(qū)間)的計(jì)算1)已知

95%置信區(qū)間99%置信區(qū)間總體均數(shù)置信區(qū)間(可信區(qū)間)的計(jì)算69

總體均數(shù)置信區(qū)間(可信區(qū)間)的計(jì)算3)大樣本----按u分布

95%置信區(qū)間99%置信區(qū)間總體均數(shù)置信區(qū)間(可信區(qū)間)的計(jì)算70例9-13隨機(jī)抽取某地健康男子20人,測得該樣本的收縮壓均數(shù)為118.4mmHg,標(biāo)準(zhǔn)差S為10.8mmHg,試估計(jì)該地男子收縮壓總體均數(shù)的95%置信區(qū)間。例9-13隨機(jī)抽取某地健康男子20人,測得該樣本的收縮壓71此為小樣本,應(yīng)按

t

分布。收縮壓過高過低均為異常,故取雙側(cè)。95%置信區(qū)間:

代入數(shù)據(jù)

()

即(113.3,123.5)此為小樣本,應(yīng)按t分布。72置信區(qū)間的兩個(gè)要素:1.準(zhǔn)確度:反映在的大小上。2.精確度:反映在區(qū)間的長度上。在樣本含量一定的情況下二者是矛盾的。常用的95%置信區(qū)間。置信區(qū)間的兩個(gè)要素:1.準(zhǔn)確度:反映在的大小上。73

均數(shù)置信區(qū)間與參考值范圍的區(qū)別

95%置信區(qū)間:從至范圍有95%的可能性包含了總體均數(shù)。95%正常值范圍:一組觀察值中,有95%個(gè)體(頻數(shù))的觀察值在至范圍內(nèi)。均數(shù)置信區(qū)間與參考值范圍的區(qū)別74四、假設(shè)檢驗(yàn)的基本思想和步驟(一)假設(shè)檢驗(yàn)的基本思想—利用反證法的思想例9-14某地抽樣調(diào)查了280名健康成年男性的血紅蛋白含量,其均數(shù)為136.0g/L,標(biāo)準(zhǔn)差為6.0g/L。已知正常成年男性血紅蛋白的均數(shù)為140.0g/L。試問能否認(rèn)為該地抽樣調(diào)查的280名成年男性的血紅蛋白含量與正常成年男性的血紅蛋白含量的均數(shù)不同?四、假設(shè)檢驗(yàn)的基本思想和步驟(一)假設(shè)檢驗(yàn)的基本思想—利用反75差異的原因:

(2)由于抽樣誤差造成的.(實(shí)際上,但由于抽樣誤差不能很好代表)(1)該地成年男性的血紅蛋白含量與正常成年男性的血紅蛋白含量的均數(shù)不同()

差異的原因:76μ0=140.0g/Lμn=280

=136.0g/LS=6.0g/L已知總體未知總體μ0=140.0g/Lμn=280=136.0g/L已77(二)假設(shè)檢驗(yàn)的基本步驟1、建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:(無效假設(shè))μ=μ0H1:(備擇假設(shè))μ>μ0檢驗(yàn)水準(zhǔn)的意義及確定2、選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量3、確定P值,作出推斷結(jié)論P(yáng)值:在H0成立的情況下,獲得比現(xiàn)有統(tǒng)計(jì)量更極端的概率。(二)假設(shè)檢驗(yàn)的基本步驟1、建立假設(shè),確定檢驗(yàn)水準(zhǔn)μ=μ078

(推斷的結(jié)論=統(tǒng)計(jì)結(jié)論+專業(yè)結(jié)論)

P>0.05,按檢驗(yàn)水準(zhǔn),不拒絕H0,差異無統(tǒng)計(jì)學(xué)意義(差異無顯著性),還不能認(rèn)為……不同或不等。

P≤0.05,按檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義(差異有顯著性),可以認(rèn)為……不同或不等,誰高誰低。

P≤0.01,按檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,差異有高度統(tǒng)計(jì)學(xué)意義(差異有高度顯著性),可以認(rèn)為……不同或不等,誰高誰低。140g/L(推斷的結(jié)論=統(tǒng)計(jì)結(jié)論+專業(yè)結(jié)論)P>0.05,按79

假設(shè)檢驗(yàn)的目的就是判斷差異的原因:求出由抽樣誤差造成此差異的可能性(概率P)有多大!若P較大(P>0.05),認(rèn)為是由于抽樣誤差造成的。原因(1),實(shí)際上若P較小(P≤0.05),認(rèn)為不是由于抽樣誤差造成的。原因(2),實(shí)際上>假設(shè)檢驗(yàn)的目的就是判斷差異的原因:80單、雙側(cè)檢驗(yàn)的選擇:

1、根據(jù)專業(yè)知識(shí)事先不知道會(huì)出現(xiàn)什么結(jié)果雙側(cè)事先知道只能出現(xiàn)某種結(jié)果單側(cè)2、問題的提法P289例9-14雙側(cè)

P382第8題

單側(cè)*通常用雙側(cè)(除非有充足的理由選用單側(cè)之外,一般選用保守的雙側(cè)較穩(wěn)妥)單、雙側(cè)檢驗(yàn)的選擇:81

確定P值:(用求出的t值與查表查出的t值比較)查t值表:

(t越大,P越小)(1)求出t=1.833,P>0.05(2)求出t=4.18,

P<0.01(3)求出t=2.96,0.01<P<0.05(簡寫為P<0.05)(4)求出t=3.25,P=0.01Pt0.050.013.2502.2621.833P>0.054.18P<0.01P<0.052.96確定P值:(t82

假設(shè)檢驗(yàn)的思路是:首先對(duì)未知或不完全知道的總體提出一個(gè)假設(shè),然后借助一定的分布,觀察實(shí)測樣本情況是否屬于小概率事件。一般把概率P≤0.05的事件稱為小概率事件,小概率事件在一次觀察中可以認(rèn)為是不會(huì)發(fā)生的,如實(shí)測樣本情況屬于小概率事件,則認(rèn)為原先的假設(shè)是錯(cuò)的,拒絕這個(gè)假設(shè);如實(shí)測樣本情況不屬于小概率事件,則不拒絕原來的假設(shè)。當(dāng)然,小概率事件在一次觀察中還是可能發(fā)生的,若我們恰好碰上,則假設(shè)檢驗(yàn)的結(jié)論就是錯(cuò)誤的,不過因?yàn)樾「怕适录l(fā)生的概率小,所以犯這種錯(cuò)誤的概率也小。假設(shè)檢驗(yàn)的思路是:首先對(duì)未知或不完全知道的總體提83第四節(jié)t檢驗(yàn)和u檢驗(yàn)t檢驗(yàn)應(yīng)用條件:

①當(dāng)n<100時(shí),要求樣本取自正態(tài)分布的總體,總體標(biāo)準(zhǔn)差未知;②兩小樣本均數(shù)比較時(shí),要求兩樣本總體方差相等(σ12=σ22)。第四節(jié)t檢驗(yàn)和u檢驗(yàn)t檢驗(yàn)應(yīng)用條件:84一、樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)(即:樣本均數(shù)代表的未知總體均數(shù)μ和已知總體均數(shù)μ0的比較)一、樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)(即:樣本均數(shù)代表的未知總85例9-15已知某小樣本中含CaCO3的真值是20.7mg/L。現(xiàn)用某法重復(fù)測定該小樣本15次,CaCO3含量(mg/L)分別為:20.99,20.41,20.62,20.75,20.10,20.00,20.80,20.91,22.60,22.30,20.99,20.41,20.50,23.00,22.60。問該法測得的均數(shù)與真值有無差別?例9-15已知某小樣本中含CaCO3的真值是20.7mg86(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ=μ0即該法測得的均數(shù)與真值無差別H1:μ≠μ0即該法測得的均數(shù)與真值有差別(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ=μ0即該法87(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量n=25<100,故選用t檢驗(yàn)。已知=21.13(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量n=25<100,故選用t88(3)確定P值,作出推斷結(jié)論

查t界值表

為單側(cè)檢驗(yàn)Pt0.050.012.9772.145P>0.051.70P>0.05,按檢驗(yàn)水準(zhǔn),不拒絕H0,無統(tǒng)計(jì)學(xué)意義。尚不能認(rèn)為該法測得的均數(shù)與真值不同。(3)確定P值,作出推斷結(jié)論P(yáng)t0.050.012.977289二、配對(duì)設(shè)計(jì)的均數(shù)比較常見的配對(duì)設(shè)計(jì)主要有以下情形:①自身比較:同一受試對(duì)象處理前后。②同一受試對(duì)象分別接受兩種不同的處理。③將條件近似的觀察對(duì)象兩兩配成對(duì)子,對(duì)子中的兩個(gè)個(gè)體分別給予不同的處理。二、配對(duì)設(shè)計(jì)的均數(shù)比較常見的配對(duì)設(shè)計(jì)主要有以下情形:90配對(duì)t檢驗(yàn)的基本原理:

假設(shè)兩種處理的效應(yīng)相同,即μ1=μ2,則μ1-μ2=0,即可看成是差值的樣本均數(shù)所代表的未知總體均數(shù)μd與已知總體均數(shù)μ0=0的比較,此時(shí),我們可套用前述t檢驗(yàn)的公式。配對(duì)t檢驗(yàn)的基本原理:91例9-16應(yīng)用某藥治療8例高血壓患者,觀察患者治療前后舒張壓變化情況,如表9-10,問該藥是否對(duì)高血壓患者治療前后舒張壓變化有影響?表9-10用某藥治療高血壓患者前后舒張壓變化情況病人編號(hào)舒張壓(mmHg)差值dd2治療前治療后⑴⑵⑶⑷=⑵-⑶1968886421121084163108102636410298416598100-246100964167106102416810092864合計(jì)--36232例9-16應(yīng)用某藥治療8例高血壓患者,觀察患者治療前后舒92H0:該藥對(duì)舒張壓無影響。H1:該藥對(duì)舒張壓有影響。H0:該藥對(duì)舒張壓93Pt0.050.012.365P<0.014.023.499⑶確定P值,判斷結(jié)果

自由度ν=n-1=8-1=7,查表9-9t界值表,t0.05,7=2.365,今4.02>2.365,故P<0.05,故按α=0.05水準(zhǔn),拒絕H0,接受H1,認(rèn)為差異有高度顯著性,可以認(rèn)為該藥有降低舒張壓的作用。Pt0.050.012.365P<0.014.023.49994三、兩個(gè)樣本均數(shù)比較大樣本(n>50)----u檢驗(yàn)小樣本---正態(tài)分布資料t檢驗(yàn)偏態(tài)分布資料秩和檢驗(yàn)三、兩個(gè)樣本均數(shù)比較大樣本(n>50)----u檢驗(yàn)951、兩個(gè)大樣本均數(shù)的比較1、兩個(gè)大樣本均數(shù)的比較96

例9-17

某地隨機(jī)抽取正常男性新生兒175名,測得血中甘油三酯濃度的均數(shù)為0.425mmol/L,標(biāo)準(zhǔn)差為0.254mmol/L;隨機(jī)抽取正常女性新生兒167名,測得甘油三酯濃度的均數(shù)為0.438mmol/L,標(biāo)準(zhǔn)差為0.292mmol/L,問男、女新生兒的甘油三酯濃度有無差別?例9-17某地隨機(jī)抽取正常男性新生兒175名,測得血中97⑴建立假設(shè),確定檢驗(yàn)水準(zhǔn)

H0:μ1=μ2

H1:μ1≠μ2

α=0.05⑵選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量u值

⑴建立假設(shè),確定檢驗(yàn)水準(zhǔn)98(3)查u界值表(t界值表中自由度為的一行),u=0.438<1.96,故P>0.05,按=0.05水準(zhǔn),不拒絕H0,差異無統(tǒng)計(jì)學(xué)意義;尚不能認(rèn)為正常男女新生兒血中甘油三酯濃度均數(shù)不同。(3)查u界值表(t界值表中自由度為的一行)992、兩個(gè)小樣本均數(shù)的比較2、兩個(gè)小樣本均數(shù)的比較100例9-18兩組雄性大鼠分別飼以高蛋白和低蛋白飼料,觀察每只大鼠在實(shí)驗(yàn)第28天到84天之間所增加的體重,見表9-11。問用兩種不同飼料喂養(yǎng)大鼠后,體重的增加有無差別?表9-11用兩種不同蛋白質(zhì)含量飼料喂養(yǎng)大鼠后體重增加的克數(shù)高蛋白組1341461041191241611078311312997123低蛋白組701181018510713294例9-18兩組雄性大鼠分別飼以高蛋白和低蛋白飼料,觀察每101⑴建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:μ1=μ2H1:μ1≠μ2α=0.05⑵選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量t值⑴建立假設(shè),確定檢驗(yàn)水準(zhǔn)102第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件103⑶確定P值,判斷結(jié)果查表9-9t界值表,t0.05,17=2.110,今1.891<2.110,故P>0.05,故按α=0.05水準(zhǔn),不拒絕H0,尚不能認(rèn)為兩種飼料喂養(yǎng)大鼠后體重的增加是不同的。PP=?t=1.891P=0.05tP=0.01t=2.110t=2.898⑶確定P值,判斷結(jié)果PP=?t=1.891P=0.05tP104四、假設(shè)檢驗(yàn)應(yīng)注意的問題1、假設(shè)檢驗(yàn)應(yīng)有嚴(yán)格的抽樣設(shè)計(jì)2、要注意選用的假設(shè)檢驗(yàn)方法的應(yīng)用條件3、正確區(qū)分差別有無統(tǒng)計(jì)意義與有無專業(yè)上的實(shí)際意義4、結(jié)論不能絕對(duì)化5、假設(shè)檢驗(yàn)的單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)的選擇

四、假設(shè)檢驗(yàn)應(yīng)注意的問題1、假設(shè)檢驗(yàn)應(yīng)有嚴(yán)格的抽樣設(shè)計(jì)105注意:兩型錯(cuò)類和檢驗(yàn)效能Ⅰ型錯(cuò)類:“棄真值”拒絕實(shí)際上成立的H0Ⅱ型錯(cuò)類:“存?zhèn)沃怠苯邮軐?shí)際上不成立的H0Ⅰ型錯(cuò)類的大小為,Ⅱ型錯(cuò)類的大小一般較難計(jì)算,當(dāng)n固定時(shí),越大越小,反之亦然。檢驗(yàn)效能():若兩總體確有差異,有的把握得出差異有統(tǒng)計(jì)學(xué)意義的結(jié)論注意:兩型錯(cuò)類和檢驗(yàn)效能Ⅰ型錯(cuò)類:“棄真值”拒絕實(shí)際上成106Ⅰ型錯(cuò)誤和Ⅱ型錯(cuò)誤由樣本推斷的結(jié)果真實(shí)結(jié)果拒絕H0不拒絕H0

H0成立Ⅰ型錯(cuò)誤a推斷正確(1-a

)

H0不成立推斷正確(1-b)Ⅱ型錯(cuò)誤bⅠ型錯(cuò)誤和Ⅱ型錯(cuò)誤107ab減少(增加)I型錯(cuò)誤,將會(huì)增加(減少)II型錯(cuò)誤增大n同時(shí)降低a與ba與b間的關(guān)系ab減少(增加)I型錯(cuò)誤,將會(huì)增加(減少)II型錯(cuò)誤a與108思考題:1、兩樣本比較作t檢驗(yàn),差別有顯著性時(shí),P值越小說明A兩樣本均數(shù)差別越大B兩總體均數(shù)差別越大C兩總體均數(shù)差別越小D越有理由認(rèn)為兩樣本均數(shù)不同E越有理由認(rèn)為兩總體均數(shù)不同思考題:1、兩樣本比較作t檢驗(yàn),差別有顯著性時(shí),P值越1092、在兩樣本比較作t檢驗(yàn)中,無效假設(shè)是:A兩樣本均數(shù)不等B兩樣本均數(shù)相等C兩總體均數(shù)不等D兩總體均數(shù)相等E樣本均數(shù)等于總體均數(shù)2、在兩樣本比較作t檢驗(yàn)中,無效假設(shè)是:110計(jì)算題:1、一藥廠為了解生產(chǎn)某藥(同一批次)之有效成分含量是否符合國家規(guī)定的標(biāo)準(zhǔn),隨機(jī)抽取了該藥10片,得均數(shù)為103.0mg,標(biāo)準(zhǔn)差為2.22mg。試估計(jì)該批藥劑的有效成分的平均含量計(jì)算題:1、一藥廠為了解生產(chǎn)某藥(同一批次)之有效成分含量是1112、通過大量資料得知某地20歲男子平均身高為1.68米,今隨機(jī)測量當(dāng)?shù)?6名20歲男子,得其平均身高為1.72米,標(biāo)準(zhǔn)差為0.14米。問當(dāng)?shù)噩F(xiàn)在20歲男子是否比以往高?3、將鉤端螺旋體病人的血清隨機(jī)分為兩組,分別用標(biāo)準(zhǔn)株和水生株作凝溶試驗(yàn),測得數(shù)據(jù)如下,問兩組的平均效價(jià)是否相同?2、通過大量資料得知某地20歲男子平均身高為1.68米,今隨1124、比較兩種方法對(duì)乳酸飲料中脂肪含量測定結(jié)果是否不同,某人隨機(jī)抽取了10份乳酸飲料,分別用脂肪酸水解法和哥特里-羅紫法測定,結(jié)果見表。問兩法測定結(jié)果是否不同?4、比較兩種方法對(duì)乳酸飲料中脂肪含量測定結(jié)果是否不同,某人隨113第五節(jié)方差分析第五節(jié)方差分析114目的要求:1.掌握方差分析的用途、應(yīng)用條件、基本思想;2.熟悉完全隨機(jī)設(shè)計(jì)多個(gè)樣本均數(shù)比較方差分析;3.了解隨機(jī)區(qū)組設(shè)計(jì)多個(gè)樣本均數(shù)比較方差分析;4.熟悉多個(gè)樣本均數(shù)間的兩兩比較的q檢驗(yàn)。目的要求:115方差分析

方差分析(AnalysisofVariance)簡寫為ANOVA,是由英國統(tǒng)計(jì)學(xué)家Fisher提出,也叫F檢驗(yàn)。方差分析方差分析(AnalysisofVar116兩個(gè)均數(shù)的比較t檢驗(yàn),u檢驗(yàn)多個(gè)均數(shù)的比較

1.檢驗(yàn)次數(shù)增多Why?2.易犯一類錯(cuò)誤兩個(gè)均數(shù)的比較t檢驗(yàn),u檢驗(yàn)1.檢驗(yàn)次數(shù)增多Why?2117如要進(jìn)行5個(gè)樣本做兩兩比較,次比較,如果,那么每次不犯一類錯(cuò)誤的可能性是(1-0.05)1=0.95,10次不犯一類錯(cuò)誤的可能性是(1-0.05)10=0.59,犯一類錯(cuò)誤的可能性是1-0.59=0.41>>0.05,顯然使犯一類錯(cuò)誤的可能性增加了.如要進(jìn)行5個(gè)樣本做兩兩比較,118方差分析的應(yīng)用:(1)用于兩個(gè)或多個(gè)樣本均數(shù)的比較(2)兩個(gè)或多個(gè)研究因素的交互作用(3)回歸方程的線性假設(shè)檢驗(yàn)(4)方差齊性檢驗(yàn)方差分析的應(yīng)用:119方差分析的應(yīng)用條件:

1.各樣本是相互獨(dú)立的隨機(jī)樣本2.各樣本都來自正態(tài)總體3.各總體方差相等。方差分析的應(yīng)用條件:120一、方差分析的基本思想

把全部觀察值之間的變異——總變異,按設(shè)計(jì)的要求分為兩個(gè)或多個(gè)部分,每一部分有一定意義,其中至少有一部分表示各組均數(shù)間的變異,另一部分表示誤差。然后再計(jì)算變異間的比值F。若F值接近1,可認(rèn)為處理因素?zé)o作用;若F值遠(yuǎn)大于1,且大于或等于F界值表中的某界值時(shí),可認(rèn)為處理因素有作用。一、方差分析的基本思想把全部觀察121復(fù)習(xí):方差R甲組2628303234308乙組2829303134308差值 -4-2 0 2 4復(fù)習(xí):方差R甲組2628303234308乙組2829303122總體方差樣本方差總體方差樣本方差123ABCD2.622.822.913.922.232.763.023.002.362.433.283.322.402.733.183.042.402.693.103.32例9-19

用四種不同的飼料喂養(yǎng)大白鼠,每組4只,然后測其肝重占體重的比值(肝體比值%)(見下表)。試比較四組均數(shù)間有無差異。表9-14四組資料的肝重占體重比值(%)的測定結(jié)果一、方差分析的基本思想ABCD2.622.822.913.922.124

從以上資料可看出,四個(gè)組的16個(gè)數(shù)據(jù)各不相同,這種變異稱為總變異,反映了個(gè)體變異和測量誤差(隨機(jī)誤差)和處理因素的共同作用,可以分解成兩部分:即(1)組間變異:四組肝體比值均數(shù)各不相等(此變異反映了處理因素的作用,以及隨機(jī)誤差的作用)(2)組內(nèi)變異:各組內(nèi)部大鼠的肝體比值各不相等(此變異主要反映的是隨機(jī)誤差的作用)從以上資料可看出,四個(gè)組的16個(gè)數(shù)據(jù)125各部分變異的計(jì)算:

①總變異(全部數(shù)據(jù)大小不等)用總離均差平方和來表示。

表9-14四組資料的肝重占體重比值(%)的測定結(jié)果ABCD2.622.822.913.922.232.763.023.002.362.433.283.322.402.733.183.049.6110.7412.3913.282.402.693.103.32各部分變異的計(jì)算:①總變異(全部數(shù)據(jù)大小不126

②組間變異(由于所接受的處理因素不同而致各組間大小不等)用組間離均差平方和來表示。ABCD2.622.822.913.922.232.763.023.002.362.433.283.322.402.733.183.049.6110.7412.3913.282.402.693.103.32表9-14四組資料的肝重占體重比值(%)的測定結(jié)果②組間變異(由于所接受的處理因素不同而致各組間大小127③組內(nèi)變異(同一處理組內(nèi)部試驗(yàn)數(shù)據(jù)大小不等)用組內(nèi)離均差平方和來表示。

③組內(nèi)變異(同一處理組內(nèi)部試驗(yàn)數(shù)據(jù)大小不等)用組內(nèi)離均差平方128三個(gè)變異之間的關(guān)系:

其中:

三個(gè)變異之間的關(guān)系:其中:129

變異度除與離均差平方和的大小有關(guān)外,還與其自由度有關(guān),由于各部分自由度不相等,因此各部分離均差平方和不能直接比較,須除以相應(yīng)的自由度,該比值稱均方差,簡稱均方(MS)。

。變異度除與離均差平方和的大小有關(guān)外130方差分析的基本思想:

組內(nèi)變異

組間變異

總變異(各組內(nèi)部數(shù)值大小不等)它反映了的肝體比值隨機(jī)誤差。(各組間樣本均數(shù)大小不等)它反映了飼料對(duì)體比值的影響,也包括了隨機(jī)誤差。處理因素的影響方差分析的基本思想:總(各組內(nèi)部數(shù)值大小不等)131F==組間變異組內(nèi)變異飼料對(duì)肝臟系數(shù)影響所致的變異+隨機(jī)誤差引起的變異隨機(jī)誤差引起的變異

假如飼料對(duì)肝臟系數(shù)無影響(即處理因素不起作用),則在理論上,F(xiàn)=1。由于抽樣誤差的影響,F(xiàn)值往往并不恰好等于1,而是近于1。反之,若飼料對(duì)肝臟系數(shù)有影響,組間變異就會(huì)增大,F(xiàn)值將明顯大于1。要大到多少才有統(tǒng)計(jì)學(xué)意義呢?可查F界值表,得P值,按P值的大小作出推斷結(jié)論。處理因素所致的變異F=組間變異組內(nèi)變異飼料對(duì)肝臟系數(shù)影132

可見,方差分析的基本思想就是把全部觀察值之間的變異——總變異,按設(shè)計(jì)的要求分為兩個(gè)或多個(gè)部分,每一部分有一定意義,其中至少有一部分表示各組均數(shù)間的變異,另一部分表示誤差。然后再計(jì)算變異間的比值F。若F值接近1,可認(rèn)為處理因素?zé)o作用;若F值遠(yuǎn)大于1,且大于或等于F界值表中的某界值時(shí),可認(rèn)為處理因素有作用。可見,方差分析的基本思想就是把全部觀察值之133二、完全隨機(jī)設(shè)計(jì)的方差分析(一)完全隨機(jī)設(shè)計(jì)完全隨機(jī)設(shè)計(jì)是采用完全隨機(jī)化的分組方法,將全部試驗(yàn)對(duì)象分配到k個(gè)處理組,通過比較各組均數(shù)之間差別有無統(tǒng)計(jì)學(xué)意義,以推斷處理因素的效應(yīng)。二、完全隨機(jī)設(shè)計(jì)的方差分析(一)完全隨機(jī)設(shè)計(jì)134變異來源離均差平方和SS自由度ν均方MSF總ΣX2-CN-1組間(處理組間)k-1SS組間∕ν組間MS組間∕MS組內(nèi)組內(nèi)(誤差)SS總-SS組間N-kSS組內(nèi)∕ν組內(nèi)表9-13單因素方差分析的計(jì)算公式(P297)表中:C=,N=Σni,k為處理組數(shù)。(二)變異分解變異來源離均差平方和自由度均方F總ΣX2-CN-1組間k-1135

1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:四組大白鼠肝體比值相等。H1:四組大白鼠肝體比值不等或不全相等。

2.選定檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量F值(三)分析步驟1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)(三)分析步驟136第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件137第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件138第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件139第九章-數(shù)值變量的統(tǒng)計(jì)分析下課件1403.確定P值,判斷結(jié)果

查F界值表,得F0.05(3,12)=3.49,

F0.01(3,12)=5.95,本例F=10.24,故P<0.01按水準(zhǔn),拒絕H0,接受H1,有統(tǒng)計(jì)學(xué)意義;可以認(rèn)為經(jīng)四種不同飼料喂養(yǎng)后大白鼠肝體比值的均數(shù)不同或不全相同。

3.確定P值,判斷結(jié)果141

注意:如果P<0.05,拒絕H0,差異有統(tǒng)計(jì)學(xué)意義,并不表明任何兩組之間均有差別,要了解哪兩組間有差別,哪兩組間沒差別,需進(jìn)一步作兩兩比較。注意:如果P<0.05,拒絕H0,差異有統(tǒng)計(jì)142三、隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析(一)隨機(jī)區(qū)組設(shè)計(jì)隨機(jī)區(qū)組設(shè)計(jì),又稱配伍組設(shè)計(jì),是配對(duì)設(shè)計(jì)的擴(kuò)展。

具體做法是:先按條件相同或相近的研究對(duì)象配成區(qū)組(block),再將各區(qū)組內(nèi)的研究對(duì)象隨機(jī)分配到不同的處理組,比較各組均數(shù)之間差別有無統(tǒng)計(jì)學(xué)意義,以推斷處理因素的效應(yīng)。三、隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析(一)隨機(jī)區(qū)組設(shè)計(jì)143例9-20在抗癌藥物篩選試驗(yàn)中,擬用20只小白鼠按體重相近者歸為一個(gè)區(qū)組,一共五個(gè)區(qū)組,每個(gè)區(qū)組各有四只小白鼠。分別觀察四種藥物對(duì)小白鼠移植性肉瘤(S180)的抑瘤效果,結(jié)果見表9-17。問四種藥物的抑瘤效果有無差別?例9-20在抗癌藥物篩選試驗(yàn)中,擬用20只小白鼠按體重相144表9-17四種藥物抑瘤效果(瘤重,克)P299表9-17四種藥物抑瘤效果(瘤重,克)P299145

該設(shè)計(jì)的特點(diǎn):(1)該設(shè)計(jì)包含兩個(gè)因素,一個(gè)是處理因素,一個(gè)是區(qū)組因素(two-wayANOVA);(2)各區(qū)組及處理組的受試對(duì)象數(shù)相等,(區(qū)組的例數(shù)就是處理組數(shù),處理組的例數(shù)就是區(qū)組數(shù))各處理組的受試對(duì)象生物學(xué)特性較均衡,可減少試驗(yàn)誤差,提高假設(shè)檢驗(yàn)的效率。該設(shè)計(jì)的特點(diǎn):146

隨機(jī)區(qū)組設(shè)計(jì)的方差分析除推斷k個(gè)處理的差別有無統(tǒng)計(jì)學(xué)意義外,還可比較b區(qū)組間的差別有無統(tǒng)計(jì)學(xué)意義。

隨機(jī)區(qū)組設(shè)計(jì)的方差分析除推斷k個(gè)處理的差別有無147所有20只小白鼠的瘤重均不同:總變異每種藥物5只小白鼠的瘤重均數(shù)不同:處理組間的變異每個(gè)區(qū)組4只小白鼠的瘤重均數(shù)不同:區(qū)組間的變異

各種變異之間的關(guān)系是:

(二)

變異分解所有20只小白鼠的瘤重均不同:總變異(二)

變異分解148(1)總變異:反映全部試驗(yàn)數(shù)據(jù)間大小不等的狀況,(2)處理組間變異:A、B、C、D四種藥物組間的均數(shù)大小不等,(3)區(qū)組間變異:5個(gè)區(qū)組間測量值的均數(shù)大小不等,(4)誤差變異:反映隨機(jī)誤差產(chǎn)生的變異,(1)總變異:反映全部試驗(yàn)數(shù)據(jù)間大小不等的狀況,149表9-16隨機(jī)區(qū)組設(shè)計(jì)方差分析的計(jì)算公式P298表中:C=,N=Σni,k為處理組數(shù)。表9-16隨機(jī)區(qū)組設(shè)計(jì)方差分析的計(jì)算公式P298表中:C150例9-20在抗癌藥物篩選試驗(yàn)中,擬用20只小白鼠按體重相近者歸為一個(gè)區(qū)組,一共五個(gè)區(qū)組,每個(gè)區(qū)組各有四只小白鼠。分別觀察四種藥物對(duì)小白鼠移植性肉瘤(S180)的抑瘤效果,結(jié)果見表9-17。問四種藥物的抑瘤效果有無差別?(三)分析步驟(結(jié)合例9-20)

例9-20在抗癌藥物篩選試驗(yàn)中,擬用20只小白鼠按體重相1511.建立假設(shè),確定檢驗(yàn)水準(zhǔn)

藥物間:H0:四種藥物的抑瘤作用相同,即μ

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論