總體均數(shù)估計(jì)_第1頁(yè)
總體均數(shù)估計(jì)_第2頁(yè)
總體均數(shù)估計(jì)_第3頁(yè)
總體均數(shù)估計(jì)_第4頁(yè)
總體均數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩79頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1第六章

總體均數(shù)的估計(jì)

2西南財(cái)經(jīng)大學(xué)近日發(fā)布《中國(guó)家庭金融調(diào)查報(bào)告》,報(bào)告顯示截至2011年8月,中國(guó)家庭資產(chǎn)平均為121.69萬(wàn)元,城市家庭平均為247.60萬(wàn)元,農(nóng)村家庭平均為37.70萬(wàn)元。有網(wǎng)民說(shuō),看到這個(gè)數(shù)字第一個(gè)反應(yīng)是自己“被平均了”。(據(jù)《現(xiàn)代快報(bào)》)3

10%的家庭收入占整個(gè)社會(huì)總收入的57%,5%家庭收入占整個(gè)社會(huì)總收入的44%,說(shuō)明中國(guó)家庭收入不均等。

——李宏彬

中國(guó)城市家庭平均資產(chǎn)有200多萬(wàn),但平均資產(chǎn)的中位數(shù)只有40.5萬(wàn)。兩者差距越大,表明財(cái)產(chǎn)分布越不均。

——甘犁

4城鎮(zhèn)單位職工平均工資(1952-2007)

567891011@火炮大師

:昨天晚上,老弟說(shuō)去協(xié)和醫(yī)院給我嬸掛號(hào)看病。。。結(jié)果被工作人員告知,要排隊(duì)掛號(hào)的話,得排3天。。。我就XXX的?。。∵@年頭看病也太恐怖了吧。。。廢話少說(shuō)。。。上圖。。。你沒(méi)有看錯(cuò)。。。這不是收容所。。。這都是排隊(duì)掛號(hào)的。。。。

12主要內(nèi)容均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤t分布總體均數(shù)的估計(jì)13一、均數(shù)的抽樣誤差總體樣本隨機(jī)抽樣推斷14

由于個(gè)體變異產(chǎn)生的,隨機(jī)抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異或各樣本統(tǒng)計(jì)量之間的差異稱為抽樣誤差。1.抽樣誤差(samplingerror)15

常把這種由抽樣研究造成的樣本均數(shù)與總體均數(shù)間的差異稱為均數(shù)的抽樣誤差。

由抽樣研究造成的樣本率與總體率間的差異稱為率的抽樣誤差。16

抽樣誤差是不可避免的,但能估計(jì)其大小。常用樣本均數(shù)的標(biāo)準(zhǔn)差作為衡量均數(shù)抽樣誤差大小的尺度。即均數(shù)標(biāo)準(zhǔn)誤。2.標(biāo)準(zhǔn)誤(Standarderror)17σ標(biāo)準(zhǔn)誤示意圖xμσpopulationx18抽樣試驗(yàn)

從正態(tài)分布總體N(5.00,0.502)中,每次隨機(jī)抽取樣本含量n=5,并計(jì)算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計(jì)算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對(duì)1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實(shí)驗(yàn);比較計(jì)算結(jié)果。19抽樣試驗(yàn)(n=5)2021抽樣試驗(yàn)(n=10)2223抽樣試驗(yàn)(n=30)24251000份樣本抽樣計(jì)算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913263個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示:27抽樣實(shí)驗(yàn)小結(jié)1.均數(shù)的均數(shù)圍繞總體均數(shù)上下波動(dòng)。2.均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤

與總體標(biāo)準(zhǔn)差相差一個(gè)常數(shù)的倍數(shù),即3.從正態(tài)總體N(m,s2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(m,s2/n)

。281.從正態(tài)分布N(

,

2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布,樣本均數(shù)的總體均數(shù)仍為

,樣本均數(shù)的標(biāo)準(zhǔn)差為2.即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布;3.隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄。中心極限定理centrallimittheorem29從同一個(gè)總體做3次抽樣的結(jié)果圖示:30標(biāo)準(zhǔn)誤(standarderror)樣本均數(shù)的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤,是說(shuō)明均數(shù)抽樣誤差大小的指標(biāo),大,抽樣誤差大;反之,小,抽樣誤差小。標(biāo)準(zhǔn)誤的計(jì)算:標(biāo)準(zhǔn)誤的估計(jì)值:31影響標(biāo)準(zhǔn)誤大小的因素

的大小與

成正比與樣本含量n的平方根成反比32例6.1隨機(jī)抽取某地正常成年男性200名,測(cè)得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,試估計(jì)抽樣誤差:33例子6.2兩文獻(xiàn)表述有何區(qū)別34標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別:(1)概念不同

標(biāo)準(zhǔn)差是描述樣本個(gè)體值間的變異,標(biāo)準(zhǔn)差小,說(shuō)明變量值圍繞均數(shù)的波動(dòng)小,均數(shù)的代表性好。

標(biāo)準(zhǔn)誤是描述樣本均數(shù)的抽樣誤差,標(biāo)準(zhǔn)誤越小,表示樣本均數(shù)圍繞總體均數(shù)的波動(dòng)越小。35(2)用途不同

標(biāo)準(zhǔn)差表示變量值對(duì)均數(shù)的波動(dòng)大小,當(dāng)資料呈正態(tài)分布時(shí),與均數(shù)結(jié)合估計(jì)正常值范圍、計(jì)算變異系數(shù)、標(biāo)準(zhǔn)誤等。標(biāo)準(zhǔn)誤表示樣本統(tǒng)計(jì)量對(duì)總體參數(shù)的波動(dòng)情況,用于估計(jì)參數(shù)的可信區(qū)間、進(jìn)行假設(shè)檢驗(yàn)。361)兩者均為變異指標(biāo);2)樣本含量不變時(shí),均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比;3)兩者均可與均數(shù)結(jié)合使用(但描述的內(nèi)容各不相同)。(3)聯(lián)系37在應(yīng)用過(guò)程中要注意標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別:383940414243444546t分布

t分布的由來(lái)t分布的特征t分布曲線下的面積47總體

樣本均數(shù)

中心極限定理標(biāo)準(zhǔn)正態(tài)分布

標(biāo)準(zhǔn)正態(tài)分布

未知t分布

t分布的由來(lái)變量變換48如果抽取例數(shù)n=5的樣本k個(gè),每個(gè)樣本又都可以按公式(9.20)計(jì)算出一個(gè)t值,可將k個(gè)t值編制成頻數(shù)表,作出直方圖,當(dāng)k無(wú)限增大時(shí),則可得到一條光滑的曲線。

(9.20

)同理,如果抽取例數(shù)n=10時(shí),仍能得到一條t分布曲線,因此,當(dāng)n變化時(shí),就可以得到不同的t分布曲線,如下圖49xμpopulation

t1

t2

t3

tkN=5N=5N=5N=550xμpopulation

t1

t2

t3

tkN=10N=10N=10N=10圖3.2自由度分別為4、9、∞的t分布

52t分布曲線的特點(diǎn)

①單峰分布,曲線在t=0處最高,并以t=0為中心左右對(duì)稱②與正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高(見(jiàn)紅線)③其形態(tài)變化與自由度

的大小有關(guān)。自由度

越小,則t值越分散,曲線越低平;隨自由度增大,曲線逐漸接近正態(tài)分布。53

它與樣本例數(shù)n或自由度ν

有關(guān),某個(gè)自由度對(duì)應(yīng)于一條t分布曲線。當(dāng)n或ν不同時(shí),曲線形狀不同。當(dāng)

時(shí),t分布趨近于標(biāo)準(zhǔn)正態(tài)分布。自由度:ν=n-1隨機(jī)變量能夠自由取值的個(gè)數(shù)54t分布曲線下面積規(guī)律t分布曲線下總面積仍為1或100%由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個(gè)常量,而是隨自由度的大小而變化,如附表3。55附表3,t分布表的特點(diǎn)附表3的橫標(biāo)目為自由度

,縱標(biāo)目為概率P,表中數(shù)值為其相應(yīng)的t界值,記作t

,

;t取值于某個(gè)區(qū)間的概率P相當(dāng)與橫軸上該區(qū)間與曲線所夾面積。附表3給出了t分布曲線下單側(cè)或雙側(cè)尾部面積所對(duì)應(yīng)的界值;雙側(cè)t0.05/2,9=2.262=單側(cè)t0.025.9單側(cè)t0.05,9=1.833雙側(cè)t0.05/2,∞=1.96=單側(cè)t0.025,∞單側(cè)t0.05,∞=1.64t分布曲線下面積57附表3只列出正值,若計(jì)算的t值為負(fù)值時(shí),可用其絕對(duì)值查表。其通式為雙側(cè):P(t≤-t

/2,

)+P(t≥t

/2,

)=

單側(cè):P(t≤-t

,

)=

或P(t≥t

,

)=

圖中非陰影部分面積的概率為,P(-t

/2,

<t<t

/2,

)=1-

-t

,

t

,

2.5%2.5%0以下附圖的陰影部分表示t

,

以外尾部面積的概率。59二、總體均數(shù)的估計(jì)

參數(shù)的估計(jì)點(diǎn)估計(jì):由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)缺點(diǎn):沒(méi)有考慮抽樣誤差。區(qū)間估計(jì):在一定可信度下,同時(shí)考慮抽樣誤差。601.點(diǎn)估計(jì)11名18歲男大學(xué)生身高均數(shù)資料得,

=172.25cm,S=3.31cm,試估計(jì)該地18歲男大學(xué)生身高總體均數(shù)?答:該地18歲男大學(xué)生身高總體均數(shù)為172.25cm612.區(qū)間估計(jì)

概念:即按一定的概率(1-

)估計(jì)總體均數(shù)所在的范圍。概率(1-

)稱為置信度。常取95%和99%,又稱置信區(qū)間(ConfidenceInterval,CI)。

62

有1-α的把握認(rèn)為該區(qū)間包含了總體參數(shù)。而非總體參數(shù)落在該范圍的可能性為α。

置信區(qū)間的含義

63置信區(qū)間的確切含義

95%置信區(qū)間:從總體中作隨機(jī)抽樣,作100次抽樣,每個(gè)樣本可算得一個(gè)置信區(qū)間,得100個(gè)置信區(qū)間,平均有95個(gè)可信區(qū)間包括μ(估計(jì)正確),只有5個(gè)可信區(qū)間不包括μ(估計(jì)錯(cuò)誤)。圖100個(gè)來(lái)自N(0,1)的樣本所估計(jì)的可信區(qū)間示意

65一次抽樣算得的置信區(qū)間,當(dāng)

=0.05時(shí),95%CI估計(jì)正確的概率為0.95,估計(jì)錯(cuò)誤的概率小于或等于0.05,即有95%的可能性包含了總體均數(shù)。

66置信區(qū)間的兩個(gè)要素

準(zhǔn)確度:反映在置信度(1-

)的大小上,即置信區(qū)間包含總體均數(shù)的可能性大小,從準(zhǔn)確度的角度看,愈接近1愈好,如置信度99%比95%好。精密度:反映在置信區(qū)間的長(zhǎng)度上,用區(qū)間長(zhǎng)度CU-CL衡量。即長(zhǎng)度愈小精密度愈好。67

在抽樣誤差確定的情況下,二者是相互矛盾的,若提高了可信度,可信區(qū)間勢(shì)必增大,精密度下降。一般情況下,常用95%置信區(qū)間。

在置信度確定的情況下,增加樣本含量可減小區(qū)間寬度。68

資料不同,總體均數(shù)的估計(jì)方法也不同,根據(jù)資料的條件,計(jì)算方法有三種:總體均數(shù)的置信區(qū)間估計(jì)方法(1)

未知,且n?。喊磘分布原理計(jì)算可信區(qū)間。

-t

,

t

,

2.5%2.5%0

由于:則:70所以,總體均數(shù)的100(1-α)%可信區(qū)間的通式為:

71例6.3:在某地成年男子中隨機(jī)抽取25人,測(cè)得其脈搏均數(shù)為72次/min,標(biāo)準(zhǔn)差為8次/min。試估計(jì)該地成年男性脈搏總體均數(shù)的95%置信區(qū)間。

=(68.7,75.3)次/分

根據(jù)樣本計(jì)算,可推斷該地成年男性脈搏總體均數(shù)的95%置信區(qū)間為(68.7,75.3)次/分。72(2)

未知,但n足夠大時(shí)(n>100),t分布逼近z分布。按z

分布原理計(jì)算可信區(qū)間。z

-z

由于:則:所以,總體均數(shù)的100(1-α)%之置信區(qū)間的通式為:

74例

測(cè)得某地110名18歲男大學(xué)生身高=172.73cm,s=4.09cm,估計(jì)該地18歲男大學(xué)生身高均數(shù)的95%可信區(qū)間。

本例n=110,=172.73cm,s=4.09cm,雙側(cè)z0.05/2=1.96按式(3.7)計(jì)算:即:該地18歲男大學(xué)生身高均數(shù)的95%可信區(qū)間為171.97cm~173.49cm75(3)σ已知:故可按正態(tài)分布原理估計(jì)總體均數(shù)的可信區(qū)間,計(jì)算公式為:76

未知,且n小

已知:

未知,但n足夠大:三種情況兩總體均數(shù)差值的置信區(qū)間(自學(xué))

假設(shè)正態(tài)總體和,當(dāng),均未知,但時(shí),則兩總體均數(shù)之差()的雙側(cè)()置信區(qū)間為:其中,,當(dāng)n1,n2均較大時(shí),差值的置信區(qū)間為:78例6.5測(cè)定28例結(jié)核病患者和34例對(duì)照者的腦脊液中鎂(mmol/L)的含量,結(jié)果見(jiàn)表6.5,試估計(jì)結(jié)核病人和對(duì)照者的腦脊液中鎂含量的總體均數(shù)之差的95%置信區(qū)間。

表6.5兩對(duì)比組腦脊液中鎂含量(mmol)

組別例數(shù)均數(shù)標(biāo)準(zhǔn)差結(jié)核組281.040.17對(duì)照組341.280.14解:假定兩組方差齊,根據(jù)公式6.7,6.8,6.9可得:

故兩總體均數(shù)之差的95%可信區(qū)間為(0.16,0.32)mmol/L80可信區(qū)間的注意問(wèn)題1.可信區(qū)間的涵義意思是從總體中作隨機(jī)抽樣,每個(gè)樣本可以算得一個(gè)可信區(qū)間。如95%可信區(qū)間意味著做100次抽樣,算得100個(gè)可信區(qū)間,平均有95個(gè)估計(jì)正確,估計(jì)錯(cuò)誤的只有5次。5%是小概率事件,實(shí)際發(fā)生的可能性很小,當(dāng)然這種估計(jì)方法會(huì)有5%犯錯(cuò)誤的風(fēng)險(xiǎn)。812.可信

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論