06-抽樣分布與參數(shù)估計(jì)_第1頁
06-抽樣分布與參數(shù)估計(jì)_第2頁
06-抽樣分布與參數(shù)估計(jì)_第3頁
06-抽樣分布與參數(shù)估計(jì)_第4頁
06-抽樣分布與參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第六章 抽樣分布與參數(shù)估計(jì)抽樣分布、參數(shù)估計(jì)和假設(shè)檢驗(yàn)是推斷統(tǒng)計(jì)的三個(gè)中心內(nèi)容第一節(jié) 抽樣分布基本概念統(tǒng)計(jì)量:由樣本構(gòu)造出來,不依賴于任何總體參數(shù)的函數(shù)。參數(shù):描述總體分布狀況的數(shù)。抽樣分布抽樣分布:統(tǒng)計(jì)量的分布形式統(tǒng)計(jì)量的分布依賴于總體的分布,同時(shí)與抽樣方式也存在相關(guān)。一般討論統(tǒng)計(jì)量的抽樣分布時(shí),總是基于有放回的簡單隨機(jī)抽樣。有放回簡單隨機(jī)抽樣:從總體中抽出一個(gè)單位后,將其放回總體,再抽選下一個(gè)單位。有放回簡單隨機(jī)抽樣的各個(gè)樣本單位之間是相互獨(dú)立的。抽樣分布的實(shí)驗(yàn)使用1999年中國2159個(gè)縣級(jí)行政區(qū)人口數(shù)資料進(jìn)行實(shí)驗(yàn)。從所有縣中,分別隨機(jī)抽選10、30、100、200個(gè)縣,計(jì)算其人口數(shù)的平

2、均數(shù)。將同一實(shí)驗(yàn)反復(fù)進(jìn)行200次,觀察平均數(shù)的分布規(guī)律。說明:為簡化實(shí)驗(yàn)起見,在此進(jìn)行的是無放回實(shí)驗(yàn),結(jié)果與有放回的情況略有差異。樣本均值的抽樣分布特征N30時(shí),樣本均值服從正態(tài)分布。樣本均值以總體均值為期望值樣本均值的標(biāo)準(zhǔn)差為總體標(biāo)準(zhǔn)差除以樣本量的平方根。樣本均值分布與中心極值定理正態(tài)總體中,樣本均值的分布仍為正態(tài)分布。非正態(tài)總體,根據(jù)中心極值定理樣本均值抽樣特征的推導(dǎo)無放回條件下的簡單隨機(jī)抽樣無放回條件下抽樣公式的簡化f=n/N,稱為抽樣比由上述的推導(dǎo)可見,在總體單位數(shù)特別大的情況下,有放回與無放回抽樣的效果是相同的。例題:關(guān)于撲克牌的游戲 從一副撲克牌(52張)中,有放回地抽出30張,其

3、平均點(diǎn)數(shù)的分布規(guī)律如何?如果以點(diǎn)數(shù)來賭勝負(fù),什么區(qū)間的勝率是95%?第二節(jié) 參數(shù)估計(jì)主要討論總體平均數(shù)的參數(shù)估計(jì)參數(shù)估計(jì)的一般問題參數(shù)估計(jì):用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)。估計(jì)量與估計(jì)值用于估計(jì)總體參數(shù)的樣本統(tǒng)計(jì)量的名稱叫估計(jì)量;根據(jù)一個(gè)具體樣本計(jì)算出來的估計(jì)量的數(shù)值叫估計(jì)值。點(diǎn)估計(jì)與區(qū)間估計(jì)點(diǎn)估計(jì)是用樣本統(tǒng)計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值。區(qū)間估計(jì)(Interval Estimate)是在點(diǎn)估計(jì)的基礎(chǔ)上給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍??傮w參數(shù)的估計(jì)區(qū)間,稱為置信區(qū)間。置信度如果將構(gòu)造置信區(qū)間的步驟重復(fù)多次,置信區(qū)間中包含總體真值的次數(shù)所占的比例稱為置信水平(Confidence Leve

4、l)。也可稱為置信度或置信系數(shù)(Confidence Coefficient)。置信度與置信區(qū)間的關(guān)系以正態(tài)分布為例,當(dāng)置信度為P時(shí),置信區(qū)間為-t,+t其中,為期望值,為標(biāo)準(zhǔn)差。T稱為概率度,以下為對(duì)應(yīng)關(guān)系評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)無偏性(Unbiasedness)估計(jì)量的期望值等于總體參數(shù)值。有效性(Efficiency)估計(jì)量的標(biāo)準(zhǔn)差最小。一致性(Consistency)大樣本獲得的估計(jì)量比小樣本更接近總體參數(shù)值。有放回條件下的簡單隨機(jī)抽樣依據(jù):樣本平均數(shù)的分布特征1樣本量n30時(shí),樣本平均數(shù)服從正態(tài)分布2樣本平均數(shù)以總體平均數(shù)為期望值3樣本平均數(shù)的方差為導(dǎo)入:估計(jì)樣本平均數(shù)的范圍某總體方差為10

5、0,平均值為40,抽出一個(gè)36個(gè)單位構(gòu)成的樣本,試在95的置信度水平下,估計(jì)樣本平均數(shù)的范圍。從前例逆推已知某總體方差為100,其一個(gè)由36個(gè)單位組成的樣本的平均數(shù)為50,試在95的置信度水平下,估計(jì)總體平均數(shù)的置信區(qū)間??傮w標(biāo)準(zhǔn)差的替代對(duì)總體均值進(jìn)行估計(jì)時(shí),需要使用到總體標(biāo)準(zhǔn)差的數(shù)值。當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可以使用樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的替代。例題:估計(jì)總體平均數(shù)一次調(diào)查中獲得了36個(gè)樣本的數(shù)據(jù)如下23 35 39 27 36 44 36 42 46 43 31 3342 53 45 54 47 24 34 28 39 36 44 4039 49 38 34 48 50 34 39 45 4

6、8 45 32試在95%的置信度水平下,估計(jì)總體平均數(shù)的置信區(qū)間。計(jì)算結(jié)果計(jì)算樣本平均數(shù):X=39.5計(jì)算樣本標(biāo)準(zhǔn)差:s=7.7736令:總體標(biāo)準(zhǔn)差=樣本標(biāo)準(zhǔn)差,計(jì)算抽樣誤差為 1.295695%置信度對(duì)應(yīng)的T值為1.96得總體平均數(shù)的置信區(qū)間為:上限:39.5+1.961.2956=42.04下限:39.5-1.961.2956=36.96對(duì)計(jì)算結(jié)果的說明嚴(yán)格地說,在這個(gè)例子中,不應(yīng)當(dāng)根據(jù)正態(tài)分布進(jìn)行估計(jì),而應(yīng)當(dāng)使用T分布進(jìn)行估計(jì)。如果使用T分布,自由度為35,95%置信度的概率度(t)是2.03,而非1.96。計(jì)算出來的置信區(qū)間比正態(tài)分布的情況要略大一些。置信區(qū)間略大的原因,在于使用S替代

7、總體標(biāo)準(zhǔn)差時(shí),本身也包含了一定的誤差。實(shí)踐中,社會(huì)調(diào)查的樣本量一般都比較大,正態(tài)分布與T分布的差異不明顯,因此可以用正態(tài)分布進(jìn)行近似分析。例如,當(dāng)樣本量為200時(shí),T分布的95%概率度為1.9719,與正態(tài)分布的1.96已經(jīng)沒有太大區(qū)別了。第三節(jié) 常見的參數(shù)估計(jì)題型本章為選修內(nèi)容,涉及到數(shù)理統(tǒng)計(jì)中較多知識(shí),需要通過習(xí)題來加以掌握。估計(jì)中的要點(diǎn)參數(shù)估計(jì)是從統(tǒng)計(jì)量的抽樣分布入手,利用統(tǒng)計(jì)量的分布特征,倒推出總體參數(shù)的置信區(qū)間。所有分布特征,都是基于統(tǒng)計(jì)量的抽樣分布總體參數(shù)是常數(shù),統(tǒng)計(jì)量是隨機(jī)變量。在參數(shù)估計(jì)時(shí),將統(tǒng)計(jì)量視為常數(shù),總體參數(shù)視為變量。注意:這種說法是不嚴(yán)格的,因?yàn)榭傮w參數(shù)是常數(shù),不是隨

8、機(jī)變量助記方法一個(gè)總體參數(shù)總體均值正態(tài)總體,方差已知;或非正態(tài)總體,大樣本,方差已知。注意:Z取a/2的原因在于此時(shí)置信區(qū)間是最小的。一個(gè)總體參數(shù)總體均值正態(tài)總體,方差未知t分布以正態(tài)分布為漸近分布,一般當(dāng)n大于30時(shí),t分布與正態(tài)分布已經(jīng)十分接近,可以使用正態(tài)分布來進(jìn)行處理總體比例的區(qū)間估計(jì)在大樣本的情況下,樣本比例P的抽樣分布為正態(tài)分布??梢岳谜龖B(tài)分布進(jìn)行區(qū)間估計(jì)。比例估計(jì)的標(biāo)準(zhǔn)差比例估計(jì)的情況下,如果未知總體方差,可以用樣本方差替代。嚴(yán)格的計(jì)算公式應(yīng)當(dāng)為 在實(shí)踐中,經(jīng)常直接使用p(1-p)作為近似。一個(gè)總體總體方差正態(tài)總體的條件下,樣本方差服從n-1個(gè)自由度的卡方分布。兩個(gè)總體參數(shù)均值

9、之差兩個(gè)總體均值之差:獨(dú)立樣本,大樣本兩個(gè)總體參數(shù)均值之差兩個(gè)總體均值之差:獨(dú)立樣本,小樣本兩個(gè)總體的方差未知,但相等;兩個(gè)總體的方差未知,不相等,但樣本量相等;兩個(gè)總體的方差未知,不相等,樣本量不相等。均使用T分布,主要區(qū)別在于方差的計(jì)算方法和自由度。兩個(gè)總體均值之差:匹配樣本一個(gè)樣本中的數(shù)據(jù)與另一樣本相對(duì)應(yīng),可以直接計(jì)算對(duì)應(yīng)樣本的差的分布。大樣本情況下:兩總體均值之差服從正態(tài)分布。小樣本情況下:假定均值之差服從正態(tài)分布,使用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,計(jì)算T分布。兩個(gè)總體參數(shù)比例之差比例之差:大樣本下,服從正態(tài)分布。在估計(jì)時(shí)使用樣本標(biāo)準(zhǔn)差替代。兩個(gè)總體的方差比樣本方差比的抽樣分布為F分布???/p>

10、得:第四節(jié) 樣本量的計(jì)算樣本量的確定估計(jì)總體均值時(shí)樣本量的確定總體標(biāo)準(zhǔn)差的確定根據(jù)以往的經(jīng)驗(yàn)數(shù)值推算通過試訪問推算采用序貫抽樣方法在比例估計(jì)時(shí),使用p(1-p)的最大值替代。比例估計(jì)時(shí),方差為:p(1-p)可知,p(1-p)的最大值為0.25。比例估計(jì)時(shí)的樣本量推算在校園內(nèi)估計(jì)學(xué)生擁有手機(jī)的比例,希望在95%的置信水平下,估計(jì)的絕對(duì)誤差不超過5個(gè)百分點(diǎn)(5%),求樣本量思考題:收視率估計(jì)某電視臺(tái)欲在95%的置信度水平下,對(duì)電視節(jié)目的收視率作為有效的估計(jì),試考慮樣本量應(yīng)當(dāng)為多少?問題:若確定估計(jì)絕對(duì)誤差為5%,則樣本為385戶,是否可行?若考慮估計(jì)相對(duì)誤差為10%,則樣本量應(yīng)當(dāng)為多少?其他樣本量

11、估計(jì)的情況估計(jì)樣本比例時(shí)樣本量的確定估計(jì)兩個(gè)總體均值之差時(shí)樣本量的確定估計(jì)兩個(gè)總體比例之差時(shí)樣本量的確定以上問題,均可通過參數(shù)估計(jì)的公式進(jìn)行逆推求得。第五節(jié) 其他抽樣方式的討論分層抽樣W:各層單位數(shù)所占比重2:層內(nèi)方差整群抽樣R與r:群的總數(shù)和樣本群數(shù)量2:群間方差多階段抽樣F:抽樣比 N和M:一級(jí)和二級(jí)單位的單位數(shù)S2:一級(jí)與二級(jí)單位的方差設(shè)計(jì)效應(yīng) 當(dāng)deff因子小于1時(shí),說明抽樣設(shè)計(jì)的效率高于SRS。 如果一個(gè)復(fù)雜抽樣的deff因子可以估計(jì),對(duì)應(yīng)相同精度的簡單隨機(jī)抽樣樣本量n,復(fù)雜抽樣設(shè)計(jì)的樣本量n為:N=ndeff謝謝觀看/歡迎下載BY FAITH I MEAN A VISION OF

12、GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES. BY FAITH I BY FAITH內(nèi)容總結(jié)第六章 抽樣分布與參數(shù)估計(jì)。一般討論統(tǒng)計(jì)量的抽樣分布時(shí),總是基于有放回的簡單隨機(jī)抽樣。有放回簡單隨機(jī)抽樣的各個(gè)樣本單位之間是相互獨(dú)立的。用于估計(jì)總體參數(shù)的樣本統(tǒng)計(jì)量的名稱叫估計(jì)量。根據(jù)一個(gè)具體樣本計(jì)算出來的估計(jì)量的數(shù)值叫估計(jì)值。點(diǎn)估計(jì)是用樣本統(tǒng)計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值。區(qū)間估計(jì)(Interval Estimate)是在點(diǎn)估計(jì)的基礎(chǔ)上給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍。試在95%的置信度水平下,估計(jì)總體平均數(shù)的置信區(qū)間。計(jì)算出來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論