參數(shù)估計基礎_第1頁
參數(shù)估計基礎_第2頁
參數(shù)估計基礎_第3頁
參數(shù)估計基礎_第4頁
參數(shù)估計基礎_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第五章總體均數(shù)的估計和假設檢驗

第一節(jié)均數(shù)的抽樣誤差與標準誤第二節(jié)t分布第三節(jié)總體均數(shù)的估計第四節(jié)假設檢驗的一般步驟第五節(jié)均數(shù)的t檢驗和z檢驗第六節(jié)均數(shù)的區(qū)間估計與假設檢驗的關系第七節(jié)假設檢驗的兩型錯誤和檢驗功效第五章總體均數(shù)的估計和假設檢驗第一節(jié)均數(shù)的抽樣誤差與標準誤第二節(jié)t分布第三節(jié)總體均數(shù)的估計第四節(jié)假設檢驗的一般步驟第五節(jié)均數(shù)的t檢驗和z檢驗第六節(jié)均數(shù)的區(qū)間估計與假設檢驗的關系第七節(jié)假設檢驗的兩型錯誤和檢驗功效第一節(jié)均數(shù)的抽樣誤差與標準誤

常用的統(tǒng)計推斷方法:參數(shù)估計和假設檢驗

總體μσ樣本統(tǒng)計推斷?隨機抽樣

N(155.4,5.32)156.7158.1155.6155.2…4.985.206.355.64…156.66.35Sii100個n=30假定某年某地所有13歲女學生身高服從正態(tài)分布N(155.4,5.32)圖5-1某年某地13歲女生身高N(155.4,5.32)的抽樣示意圖

第一節(jié)均數(shù)的抽樣誤差與標準誤

第一節(jié)均數(shù)的抽樣誤差與標準誤

抽樣誤差

由于個體間存在差異及抽樣造成的樣本統(tǒng)計量與總體參數(shù)之間的差異。第一節(jié)抽樣分布與抽樣誤差

表5-2從N(155.4,5.32)抽樣得到中的100個樣本均數(shù)的頻數(shù)分布(ni=30)第一節(jié)均數(shù)的抽樣誤差與標準誤

將此100個樣本均數(shù)看成新變量值,則這100個樣本均數(shù)構(gòu)成一新分布,繪制直方圖。圖5-2從正態(tài)分布總體N(155.4,5.32)隨機抽樣所得樣本均數(shù)分布151152153154155156157158159160根據(jù)正態(tài)分布原理,若隨機變量X服從正態(tài)分布,則樣本均數(shù)也服從正態(tài)分布1.各樣本均數(shù)未必等于總體均數(shù);2.樣本均數(shù)之間存在差異;3.樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù)(155.4cm),中間多、兩邊少,左右基本對稱,也服從正態(tài)分布。4.樣本均數(shù)的變異較之原變量的變異大大縮小樣本均數(shù)的抽樣分布具有以下特點:第一節(jié)均數(shù)的抽樣誤差與標準誤

用于表示均數(shù)抽樣誤差大小的指標,也叫樣本均數(shù)的標準差,通常稱為樣本均數(shù)的標準誤。用于衡量抽樣誤差的大小。標準誤(SE)

第一節(jié)均數(shù)的抽樣誤差與標準誤

標準誤的計算公式因通常σ未知,計算標準誤采用下式:均數(shù)的標準誤意義:反映抽樣誤差的大小。標準誤越小,抽樣誤差越小,用樣本均數(shù)估計總體均數(shù)的可靠性越大。與樣本量的關系:

S一定,n↑,標準誤↓第一節(jié)均數(shù)的抽樣誤差與標準誤

X1S1X2

S2

XiSiXnSnxσN(μσ2)

標準誤示意圖X服從什么分布?例5-1

為了解某地13歲女生的身高,在該地隨機抽取了30名13歲女生測量身高,結(jié)果算出均數(shù)=156.70cm,標準差=4.98cm。求其標準誤的大小。

第一節(jié)均數(shù)的抽樣誤差與標準誤

中心極限定理:第一節(jié)均數(shù)的抽樣誤差與標準誤

均數(shù)隨機變量XN(μ,σ2)標準正態(tài)分布N(0,12)Z變換標準正態(tài)分布N(0,12)Studentt分布自由度:n-1第二節(jié)

t分布又稱Studentt分布。實際上,t分布十分有用,它是總體均數(shù)的區(qū)間估計和假設檢驗的理論基礎。英國統(tǒng)計學家W.S.Gosset于1908年以“Student”筆名發(fā)表論文,證明它服從自由度

=n

1的t分布,即t分布,

=n

1(5-7)

第二節(jié)

t分布一、t分布的概念從前述實驗4.1的13歲女學生身高這個正態(tài)總體中分別作樣本量為3和50的隨機抽樣,各抽取1000份樣本,并分別得到1000個樣本均數(shù)及其標準誤。對它們分別作(5-6)式的t轉(zhuǎn)變換,并將t值繪制相應的直方圖(見實驗5-4)。二、t分布的圖形和t界值表第二節(jié)

t分布第二節(jié)

t分布第二節(jié)

t分布υ=∞(標準正態(tài)分布)υ=5υ=1012345-1-2-3-4-5f(t)0.10.20.3圖5-3不同自由度下的t分布圖第二節(jié)

t分布

t值的分布與自由度

有關(實際是樣本含量n不同)。t

分布的圖形不是一條曲線,而是一簇曲線。二、t分布的圖形和t界值表①單峰分布,以0為中心,左右對稱,類似于標準正態(tài)分布。②自由度

越小,t值越分散,曲線的峰部越矮,尾部越高;③隨著自由度

逐漸增大,t分布逐漸逼近標準正態(tài)分布;當趨于時,t分布就完全成為標準正態(tài)分布,故標準正態(tài)分布是t分布的特例。υ=∞(標準正態(tài)分布)υ=5υ=1012345-1-2-3-4-5f(t)0.10.20.3圖5-3不同自由度下的t分布圖第二節(jié)

t分布t分布的特征:二、t分布的圖形和t界值表統(tǒng)計學家將t分布曲線下的尾部面積(即概率P)與橫軸t值間的關系編制了不同自由度下的t界值表(附表2)。單側(cè)概率:用t,υ表示雙側(cè)概率:用t/2,υ表示第二節(jié)

t分布二、t分布的圖形和t界值表-tt0當

=10,單側(cè)概率P=0.05時,由表中查得單側(cè)t0.05,10=2.228當

=10,雙側(cè)概率P=0.05時,由表中查得雙側(cè)t0.05/2,10=1.812二、t分布的圖形和t界值表單側(cè):P(t

t0.05,10)=0.05

和P(t

t0.05,10)=0.05雙側(cè):P(t

t0.05/2,10)+P(t

t0.05/2,10)=0.051.8122.228-2.228tν=10的t分布圖二、t分布的圖形和t界值表單側(cè):P(t

t,)=

和P(t

t,)=雙側(cè):P(t

t/2,)+P(t

t/2,)=二、t分布的圖形和t界值表從t界值表中或表的右上角圖列亦可看出:①在相同自由度時,│t│值越大,概率P越??;②而在相同t值時,雙側(cè)概率P為單側(cè)概率P的兩倍,即t0.10/2,16=t0.05,16=1.746。-tt0二、t分布的圖形和t界值表t分布又稱Studentt分布,實際上十分有用,它是總體均數(shù)的區(qū)間估計和假設檢驗的理論基礎。第二節(jié)

t分布第三節(jié)總體均數(shù)的估計參數(shù)估計:指用樣本指標(統(tǒng)計量)估計總體指標(參數(shù))。參數(shù)估計點估計區(qū)間估計缺點:沒有考慮抽樣誤差根據(jù)樣本均數(shù)計算出有(1)把握的包含總體均數(shù)的一個數(shù)值范圍稱為總體均數(shù)的置信區(qū)間(CI),1

稱為置信度。第三節(jié)總體均數(shù)的估計總體均數(shù)的95%(或99%)置信區(qū)間置信度:

值一般取0.05或0.01,故1

為0.95或0.99。區(qū)間估計:第三節(jié)總體均數(shù)的估計當我們據(jù)一份樣本對總體均數(shù)只作一次區(qū)間估計時,我們宣布“總體均數(shù)μ在此可信區(qū)間范圍內(nèi)”,這句話可信的程度為95%區(qū)間估計:總體均數(shù)的95%置信區(qū)間的確切含義為:第三節(jié)總體均數(shù)的估計

例5-1

為了解某地13歲女生的身高,在該地隨機抽取了30名13歲女生測量身高,結(jié)果算出均數(shù)=156.70cm,標準差=4.98cm。求該地13歲女生平均身高的置信區(qū)間。

例5-2

均數(shù)=156.70cm,總體標準差=5.3cm。求該地13歲女生平均身高的置信區(qū)間。

例5-3

在某市成人中隨機抽取400人測脈搏,計算得到均數(shù)=74.5次/分,標準差=6次/分。求該市成人平均脈搏的置信區(qū)間。

第三節(jié)總體均數(shù)的估計總體均數(shù)的置信區(qū)間的計算

未知,且n較?。璽分布法

已知,或

未知但n足夠大--Z分布法1.t分布方法(未知,且n較?。┑谌?jié)總體均數(shù)的估計總體均數(shù)的置信區(qū)間的計算解:本例n=30,

=30–1=29,查t界值表,

=0.05,t0.05/2,29=2.045,95%CL:156.72.045=(154.8,158.6)g/L第三節(jié)總體均數(shù)的估計

例5-1為了解某地13歲女生的身高,在該地隨機抽取了30名13歲女生測量身高,結(jié)果算出均數(shù)=156.70cm,標準差=4.98cm。求該地13歲女生平均身高的置信區(qū)間。

該地13歲女生平均身高的95%置信區(qū)間:

(154.8,158.6)cm,第三節(jié)總體均數(shù)的估計2.正態(tài)分布近似方法(

已知,或

未知但n足夠大)

z/2

總體均數(shù)的置信區(qū)間的計算總體均數(shù)的雙側(cè)(1-α)置信區(qū)間為

z/2

Z0.05/2=1.96Z0.05=1.645第三節(jié)總體均數(shù)的估計2.正態(tài)分布近似方法(

已知,或

未知但n足夠大)總體均數(shù)的置信區(qū)間的計算Z0.05/2=1.96Z0.05=1.645

例5-3

在某市成人中隨機抽取400人測脈搏,計算得到均數(shù)=74.5次/分,標準差=6次/分。求該市成人平均脈搏的置信區(qū)間。

第三節(jié)總體均數(shù)的估計1.96=74.51.96(73.9,75.1)例5-4某市2000年隨機測量了90名19歲健康男大學生的身高,其均數(shù)為172.2cm,標準差為4.5cm,試估計該市2000年19歲健康男大學生平均身高的95%置信區(qū)間。第三節(jié)總體均數(shù)的估計該市2000年19歲健康男大學生平均身高的95%置信區(qū)間為(171.3,173.1)cm。1.96=172.21.96(171.3,173.1)Z0.05/2=1.96Z0.05=1.645可信區(qū)間的確切涵義(1)所要估計的總體參數(shù)有95%的可能在我們所估計的可信區(qū)間內(nèi)。(2)從正態(tài)總體中隨機抽取100個樣本,可算得100個樣本均數(shù)和標準差,也可算得100個均數(shù)的可信區(qū)間,平均約有95個可信區(qū)間包含了總體均數(shù)。(3)但在實際工作中,只能根據(jù)一次試驗結(jié)果估計可信區(qū)間,我們就認為該區(qū)間包含了總體均數(shù)。1.95%的可信區(qū)間的理解:(1)準確度:用可信度(1)表示:即區(qū)間包含總體均數(shù)的理論概率大小。當然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好。(2)精確度:即區(qū)間的寬度區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好??尚艆^(qū)間的確切涵義2.可信區(qū)間的兩個要素可信區(qū)間的確切涵義2.可信區(qū)間的兩個要素當n確定時,上述兩者互相矛盾。在實際應用中,95%可信區(qū)間更為常用。在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度??傮w均數(shù)可信區(qū)間與參考值范圍的區(qū)別區(qū)別點總體均數(shù)可信區(qū)間參考值范圍含義按預先給定的概率,確定未知參數(shù)

的可能范圍。實際上,一次抽樣算得的可信區(qū)間要么包含了總體均數(shù),要么不包含。但可以說:當

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論