計(jì)量資料統(tǒng)計(jì)推斷_第1頁(yè)
計(jì)量資料統(tǒng)計(jì)推斷_第2頁(yè)
計(jì)量資料統(tǒng)計(jì)推斷_第3頁(yè)
計(jì)量資料統(tǒng)計(jì)推斷_第4頁(yè)
計(jì)量資料統(tǒng)計(jì)推斷_第5頁(yè)
已閱讀5頁(yè),還剩75頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣誤差與假設(shè)檢驗(yàn)均數(shù)的抽樣誤差和總體均數(shù)的估計(jì)(一)、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤統(tǒng)計(jì)推斷

用樣本的信息推論總體的特征。參數(shù)估計(jì)統(tǒng)計(jì)推斷假設(shè)檢驗(yàn)健康女性體溫102人

均數(shù)的抽樣誤差----由于抽樣造成的樣本均數(shù)與總體均數(shù)、樣本均數(shù)之間的差異?!鏄颖?樣本2樣本k總體均數(shù)···根據(jù)中心極限定理:1.從正態(tài)總體中抽樣,抽取樣本含量為n的樣本,樣本均數(shù)服從正態(tài)分布。即使是從偏態(tài)總體中抽樣,在樣本含量足夠(n>50)大時(shí),

也近似正態(tài)分布。2.從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)或偏態(tài)總體中抽樣樣本例數(shù)為n的樣本,新樣本組成的數(shù)據(jù)中,樣本均數(shù)為,標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤:樣本均數(shù)的標(biāo)準(zhǔn)差反映各均數(shù)間的離散程度。標(biāo)準(zhǔn)誤的意義:

描述抽樣誤差的大小,越小,說(shuō)明抽樣誤差越小,樣本均數(shù)越接近總體均數(shù),用代表的可靠性越高。標(biāo)準(zhǔn)誤的計(jì)算均數(shù)的標(biāo)準(zhǔn)誤

以某地14歲健康女生身高的標(biāo)準(zhǔn)差σ=5.30cm及每個(gè)樣本包含的例數(shù)10代入公式,求得

均數(shù)標(biāo)準(zhǔn)誤的用途:①可用來(lái)衡量樣本均數(shù)的可靠性。②與樣本均數(shù)結(jié)合,可用于估計(jì)總體均數(shù)的可信區(qū)間;③可用于進(jìn)行均數(shù)的假設(shè)檢驗(yàn)。應(yīng)用時(shí),用樣本標(biāo)準(zhǔn)差來(lái)代替總體標(biāo)準(zhǔn)差,則標(biāo)準(zhǔn)誤的估計(jì)值為:???減少抽樣誤差的有效途徑(二)t分布u變換(將正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布)t變換

全國(guó)14歲女生(身高)120人120人120人120人…………(t分布)(u分布)…………t分布特征:(1)單峰分布,以0為中心左右對(duì)稱(chēng)。(2)t分布是一簇曲線(xiàn),其形狀受ν的影響。t分布與標(biāo)準(zhǔn)正態(tài)分布(u

分布)區(qū)別:*

t分布曲線(xiàn)峰部較矮,尾部稍翹。*

n(自由度)越大,t

分布與u

分布越接近;當(dāng)時(shí),t

分布=u

分布。t分布的特征:t界值表:(附錄9-P261)t界值表的特征:

⑴自由度相同時(shí)越大,概率P越小;⑵雙側(cè)概率P為單側(cè)概率P的兩倍。

自由度為,概率為(檢驗(yàn)水準(zhǔn))時(shí),

t

的界值記為。t界值表的查法:

=?通常取0.05或0.01

(t

越大,概率P

越?。?.2623.2501.962.58當(dāng)n≥50,為大樣本(t分布=u

分布),可用來(lái)代替

(三)總體均數(shù)的可信區(qū)間估計(jì)

統(tǒng)計(jì)描述統(tǒng)計(jì)分析參數(shù)估計(jì)---用樣本指標(biāo)估統(tǒng)計(jì)推斷計(jì)總體指標(biāo)假設(shè)檢驗(yàn)點(diǎn)估計(jì)---用估計(jì)參數(shù)估計(jì)區(qū)間估計(jì)---按一定的概率估計(jì)總體均數(shù)落在某個(gè)范圍這個(gè)范圍稱(chēng)之為:

總體均數(shù)的可信區(qū)間CI

,用區(qū)間()表示。如(37.02,37.10),說(shuō)明總體均數(shù)在37.02~37.10之間,但不包含上限(37.10)及下限(37.02)兩個(gè)值??傮w均數(shù)可信區(qū)間的計(jì)算1)已知

95%置信區(qū)間

99%置信區(qū)間

未知時(shí)總體均數(shù)可信區(qū)間的計(jì)算2)大樣本----按u

分布

95%置信區(qū)間

99%置信區(qū)間例7-15102名健康女大學(xué)生口腔溫度總體均數(shù)為=37.06℃,標(biāo)準(zhǔn)差S=0.198℃,標(biāo)準(zhǔn)誤=0.0196℃,試估計(jì)該地健康女大學(xué)生口腔溫度總體均數(shù)95%可信區(qū)間和99%可信區(qū)間。95%可信區(qū)間為37.06±1.96×0.0196,(37.02,37.10)99%可信區(qū)間為37.06±2.58×0.0196,(37.01,37.11)某市2001年120名7歲男童的身高=123.62

(cm)S=4.75(cm),計(jì)算該市7歲男童總體均數(shù)90%的可信區(qū)間。

n=120>100,故可以用標(biāo)準(zhǔn)正態(tài)分布代替t分布,u0.01=1.645==

總體均數(shù)可信區(qū)間的計(jì)算3)小樣本或未知----按

t分布

95%置信區(qū)間

99%置信區(qū)間

隨機(jī)抽取某地健康男子20人,測(cè)得該樣本的收縮壓均數(shù)為118.4mmHg,標(biāo)準(zhǔn)差S為10.8mmHg,試估計(jì)該地男子收縮壓總體均數(shù)的95%置信區(qū)間。此為小樣本,應(yīng)按

t

分布。收縮壓過(guò)高過(guò)低均為異常,故取雙側(cè)。95%置信區(qū)間:

代入數(shù)據(jù)

(

)

即(113.3,123.5)隨機(jī)抽查某地30名40-44歲哈薩克族成年男性的骨密度,測(cè)得骨密度均數(shù)資料,=187.11mg/cm2,試估計(jì)該地40-44歲哈薩克族成年男性的骨密度總體均數(shù)的95%可信區(qū)間N=30,則v=29,查附表2,t界值表,t0.05/2,29=2.045可信區(qū)間的兩個(gè)要素:1.準(zhǔn)確度:反映在的大小上。2.精確度:反映在區(qū)間的長(zhǎng)度上。在樣本含量一定的情況下二者是矛盾的。常用的95%置信區(qū)間。

均數(shù)可信區(qū)間與參考值范圍的區(qū)別

95%可信區(qū)間:從至范圍有95%的可能性包含了總體均數(shù)。95%正常值范圍:一組觀察值中,有95%個(gè)體(頻數(shù))的觀察值在至范圍內(nèi)。六、均數(shù)的假設(shè)檢驗(yàn)(一)假設(shè)檢驗(yàn)的基本思想—利用反證法的思想例

某地抽樣調(diào)查了25名健康成年男性的脈搏,,其均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.5次/分。已知正常成年男性脈搏的均數(shù)為72次/分。試問(wèn)能否認(rèn)為該地抽樣調(diào)查的25名成年男性的脈搏與正常成年男性脈搏的均數(shù)不同?μ0=72次/分μn=25

=74.2次/分

S=6.5次/分已知總體未知總體差異的原因:

(1)由于抽樣誤差造成的.(實(shí)際上,但由于抽樣誤差不能很好代表)(2)該地成年男性的脈搏與正常成年男性脈搏均數(shù)不同()

假設(shè)檢驗(yàn)的目的就是判斷差異的原因:

求出由抽樣誤差造成此差異的可能性(概率P)有多大

!若P

較大(P>0.05),認(rèn)為是由于抽樣誤差造成的。原因(1),實(shí)際上若P

較小(P≤0.05),認(rèn)為不是由于抽樣誤差造成的。原因(2),實(shí)際上>(二)假設(shè)檢驗(yàn)的基本步驟1、建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:(無(wú)效假設(shè))μ=μ0H1:(備擇假設(shè))μ>μ0檢驗(yàn)水準(zhǔn)的意義及確定2、選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量3、確定P值,作出推斷結(jié)論

(推斷的結(jié)論=統(tǒng)計(jì)結(jié)論+專(zhuān)業(yè)結(jié)論)

P>0.05,按檢驗(yàn)水準(zhǔn),不拒絕H0,差異無(wú)統(tǒng)計(jì)學(xué)意義(差異無(wú)顯著性),還不能認(rèn)為……不同或不等。

P≤0.05

,按檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,

差異有統(tǒng)計(jì)學(xué)意義(差異有顯著性)

,可以認(rèn)為……不同或不等。

P≤0.01,按檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,差異有高度統(tǒng)計(jì)學(xué)意義(差異有高度顯著性)

,可以認(rèn)為……不同或不等。72次/分

單、雙側(cè)檢驗(yàn)的選擇:

1、根據(jù)專(zhuān)業(yè)知識(shí)事先不知道會(huì)出現(xiàn)什么結(jié)果雙側(cè)事先知道只能出現(xiàn)某種結(jié)果單側(cè)*通常用雙側(cè)(除非有充足的理由選用單側(cè)之外,

一般選用保守的雙側(cè)較穩(wěn)妥)

確定P值:(用求出的t值與查表查出的t

值比較)查t

值表:

(t

越大,P

越小)

(1)求出t=1.833,P>0.05

(2)求出t=4.18,

P<0.01

(3)求出t=2.96,

0.01<P<0.05(簡(jiǎn)寫(xiě)為P<0.05)

(4)求出t=3.25,P=0.01Pt0.050.013.2502.2621.833P>0.054.18P<0.01P<0.052.96

假設(shè)檢驗(yàn)的思路是:首先對(duì)未知或不完全知道的總體提出一個(gè)假設(shè),然后借助一定的分布,觀察實(shí)測(cè)樣本情況是否屬于小概率事件。一般把概率P≤0.05的事件稱(chēng)為小概率事件,小概率事件在一次觀察中可以認(rèn)為是不會(huì)發(fā)生的,如實(shí)測(cè)樣本情況屬于小概率事件,則不拒絕原來(lái)的假設(shè);如實(shí)測(cè)樣本情況不屬于小概率事件,則拒絕原來(lái)的假設(shè)。當(dāng)然,小概率事件在一次觀察中還是可能發(fā)生的,若我們恰好碰上,則假設(shè)檢驗(yàn)的結(jié)論就是錯(cuò)誤的,不過(guò)因?yàn)樾「怕适录l(fā)生的概率小,所以犯這種錯(cuò)誤的概率也小。(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ=μ0即山區(qū)成年男子平均脈搏數(shù)與一般成年男子相等H1:μ>μ0

即山區(qū)成年男子平均脈搏數(shù)高于一般成年男子(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量(3)確定P值,作出推斷結(jié)論T界值表,得t0.1,24=1.711,t<t0.1,24,故P>0.1

t檢驗(yàn)和u檢驗(yàn)t檢驗(yàn)應(yīng)用條件:

①當(dāng)n<100時(shí),要求樣本取自正態(tài)分布的總體,總體標(biāo)準(zhǔn)差未知;②兩小樣本均數(shù)比較時(shí),要求兩樣本總體方差相等(σ12=σ22)。一、樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)(即:樣本均數(shù)代表的未知總體均數(shù)μ和已知總體均數(shù)μ0的比較)例9-15已知某小樣本中含CaCO3的真值是20.7mg/L?,F(xiàn)用某法重復(fù)測(cè)定該小樣本15次,CaCO3含量(mg/L)分別為:20.99,20.41,20.62,20.75,20.10,20.00,20.80,20.91,22.60,22.30,20.99,20.41,20.50,23.00,22.60。問(wèn)該法測(cè)得的均數(shù)與真值有無(wú)差別?(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ=μ0即該測(cè)量方法所得均數(shù)與真值相等H1:μ≠μ0

即該測(cè)量方法所得均數(shù)與真值不相等(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量n=25<100,故選用t檢驗(yàn)。已知=21.13(3)確定P值,作出推斷結(jié)論

查t界值表

為單側(cè)檢驗(yàn)Pt0.050.012.9772.145P>0.051.70P>0.05,按檢驗(yàn)水準(zhǔn),不拒絕H0,無(wú)統(tǒng)計(jì)學(xué)意義。尚不能認(rèn)為該法測(cè)得的均數(shù)與真值不同。二、配對(duì)設(shè)計(jì)的均數(shù)比較常見(jiàn)的配對(duì)設(shè)計(jì)主要有以下情形:①自身比較:同一受試對(duì)象處理前后。②同一受試對(duì)象分別接受兩種不同的處理。③將條件近似的觀察對(duì)象兩兩配成對(duì)子,對(duì)子中的兩個(gè)個(gè)體分別給予不同的處理。配對(duì)t檢驗(yàn)的基本原理:

假設(shè)兩種處理的效應(yīng)相同,即μ1=μ2

,則μ1-μ2=0,即可看成是差值的樣本均數(shù)所代表的未知總體均數(shù)μd與已知總體均數(shù)μ0=0的比較,此時(shí),我們可套用前述t檢驗(yàn)的公式。例9-16應(yīng)用某藥治療8例高血壓患者,觀察患者治療前后舒張壓變化情況,如表9-10,問(wèn)該藥是否對(duì)高血壓患者治療前后舒張壓變化有影響?表9-10用某藥治療高血壓患者前后舒張壓變化情況病人編號(hào)舒張壓(mmHg)差值dd2治療前治療后⑴⑵⑶⑷=⑵-⑶1

96

88

8642

112

108

4163

108

102

6364

102

98

4165

98

100

-246

100

96

4167

106

102

4168

100

92

864合計(jì)--36232

H0:

該藥對(duì)舒張壓無(wú)影響。

H1:

該藥對(duì)舒張壓有影響。Pt0.050.012.365P<0.014.023.499⑶確定P值,判斷結(jié)果

自由度ν=n-1=8-1=7,查表9-9t界值表,t0.05,7=2.365,今4.02>2.365,故P<0.05,故按α=0.05水準(zhǔn),拒絕H0,接受H1,認(rèn)為差異有高度顯著性,可以認(rèn)為該藥有降低舒張壓的作用。三、兩個(gè)樣本均數(shù)比較的t檢驗(yàn)大樣本(n>50)----u檢驗(yàn)小樣本---正態(tài)分布資料t檢驗(yàn)偏態(tài)分布資料秩和檢驗(yàn)1、兩個(gè)大樣本均數(shù)的比較

例9-17

某地隨機(jī)抽取正常男性新生兒175名,測(cè)得血中甘油三酯濃度的均數(shù)為0.425mmol/L,標(biāo)準(zhǔn)差為0.254mmol/L;隨機(jī)抽取正常女性新生兒167名,測(cè)得甘油三酯濃度的均數(shù)為0.438mmol/L,標(biāo)準(zhǔn)差為0.292mmol/L,問(wèn)男、女新生兒的甘油三酯濃度有無(wú)差別?⑴建立假設(shè),確定檢驗(yàn)水準(zhǔn)

H0:μ1=μ2

H1:μ1≠μ2

α=0.05⑵選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量u值

(3)查u界值表(t界值表中自由度為的一行),u=0.438<1.96,故P>0.05,按=0.05水準(zhǔn),不拒絕H0,差異無(wú)統(tǒng)計(jì)學(xué)意義;尚不能認(rèn)為正常男女新生兒血中甘油三酯濃度均數(shù)不同。

單樣本均數(shù)的u檢驗(yàn)適用于當(dāng)n較大(如n>50)或已知時(shí)。檢驗(yàn)統(tǒng)計(jì)量分別為P121例8-2

例1995年,已知某地20歲應(yīng)征男青年的平均身高為168.5cm。2003年,在當(dāng)?shù)?0歲應(yīng)征男青年中隨機(jī)抽取85人,平均身高為171.2cm,標(biāo)準(zhǔn)差為5.3cm,問(wèn)2003年當(dāng)?shù)?0歲應(yīng)征男青年的身高與1995年相比是否不同?

檢驗(yàn)界值u0.05/2=1.96,u0.01/2=2.58,u>u0.01/2,得P<0.01,按α=0.05水準(zhǔn),拒絕H0,接受H1,2003年當(dāng)?shù)?0歲應(yīng)征男青年與1995年相比,差別有統(tǒng)計(jì)學(xué)意義。2、兩個(gè)小樣本均數(shù)的比較例9-18兩組雄性大鼠分別飼以高蛋白和低蛋白飼料,觀察每只大鼠在實(shí)驗(yàn)第28天到84天之間所增加的體重,見(jiàn)表9-11。問(wèn)用兩種不同飼料喂養(yǎng)大鼠后,體重的增加有無(wú)差別?表9-11用兩種不同蛋白質(zhì)含量飼料喂養(yǎng)大鼠后體重增加的克數(shù)高蛋白組1341461041191241611078311312997123低蛋白組

70118101

85107132

94⑴建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:μ1=μ2H1:μ1≠μ2α=0.05⑵選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量t值⑶確定P值,判斷結(jié)果查表9-9t界值表,t0.05,17=2.110,今1.891<2.110,故P>0.05,故按α=0.05水準(zhǔn),不拒絕H0,尚不能認(rèn)為兩種飼料喂養(yǎng)大鼠后體重的增加是不同的。PP=?t=1.891P=0.05tP=0.01t=2.110t=2.898四兩獨(dú)立樣本方差的齊性檢驗(yàn)

兩獨(dú)立小樣本均數(shù)的t檢驗(yàn),除要求兩組數(shù)據(jù)均應(yīng)服從正態(tài)分布外,還要求兩組數(shù)據(jù)相應(yīng)的兩總體方差相等,即方差齊性。但即使兩總體方差相等,兩個(gè)樣本方差也會(huì)有抽樣誤差,兩個(gè)樣本方差不等是否能用抽樣誤差解釋?zhuān)靠蛇M(jìn)行方差齊性檢驗(yàn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論