06-抽樣分布與參數估計_第1頁
06-抽樣分布與參數估計_第2頁
06-抽樣分布與參數估計_第3頁
06-抽樣分布與參數估計_第4頁
06-抽樣分布與參數估計_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第六章 抽樣分布與參數估計抽樣分布、參數估計和假設檢驗是推斷統(tǒng)計的三個中心內容第一節(jié) 抽樣分布基本概念統(tǒng)計量:由樣本構造出來,不依賴于任何總體參數的函數。參數:描述總體分布狀況的數。抽樣分布抽樣分布:統(tǒng)計量的分布形式統(tǒng)計量的分布依賴于總體的分布,同時與抽樣方式也存在相關。一般討論統(tǒng)計量的抽樣分布時,總是基于有放回的簡單隨機抽樣。有放回簡單隨機抽樣:從總體中抽出一個單位后,將其放回總體,再抽選下一個單位。有放回簡單隨機抽樣的各個樣本單位之間是相互獨立的。抽樣分布的實驗使用1999年中國2159個縣級行政區(qū)人口數資料進行實驗。從所有縣中,分別隨機抽選10、30、100、200個縣,計算其人口數的平

2、均數。將同一實驗反復進行200次,觀察平均數的分布規(guī)律。說明:為簡化實驗起見,在此進行的是無放回實驗,結果與有放回的情況略有差異。樣本均值的抽樣分布特征N30時,樣本均值服從正態(tài)分布。樣本均值以總體均值為期望值樣本均值的標準差為總體標準差除以樣本量的平方根。樣本均值分布與中心極值定理正態(tài)總體中,樣本均值的分布仍為正態(tài)分布。非正態(tài)總體,根據中心極值定理樣本均值抽樣特征的推導無放回條件下的簡單隨機抽樣無放回條件下抽樣公式的簡化f=n/N,稱為抽樣比由上述的推導可見,在總體單位數特別大的情況下,有放回與無放回抽樣的效果是相同的。例題:關于撲克牌的游戲 從一副撲克牌(52張)中,有放回地抽出30張,其

3、平均點數的分布規(guī)律如何?如果以點數來賭勝負,什么區(qū)間的勝率是95%?第二節(jié) 參數估計主要討論總體平均數的參數估計參數估計的一般問題參數估計:用樣本統(tǒng)計量去估計總體的參數。估計量與估計值用于估計總體參數的樣本統(tǒng)計量的名稱叫估計量;根據一個具體樣本計算出來的估計量的數值叫估計值。點估計與區(qū)間估計點估計是用樣本統(tǒng)計量的某個取值直接作為總體參數的估計值。區(qū)間估計(Interval Estimate)是在點估計的基礎上給出總體參數估計的一個區(qū)間范圍??傮w參數的估計區(qū)間,稱為置信區(qū)間。置信度如果將構造置信區(qū)間的步驟重復多次,置信區(qū)間中包含總體真值的次數所占的比例稱為置信水平(Confidence Leve

4、l)。也可稱為置信度或置信系數(Confidence Coefficient)。置信度與置信區(qū)間的關系以正態(tài)分布為例,當置信度為P時,置信區(qū)間為-t,+t其中,為期望值,為標準差。T稱為概率度,以下為對應關系評價估計量的標準無偏性(Unbiasedness)估計量的期望值等于總體參數值。有效性(Efficiency)估計量的標準差最小。一致性(Consistency)大樣本獲得的估計量比小樣本更接近總體參數值。有放回條件下的簡單隨機抽樣依據:樣本平均數的分布特征1樣本量n30時,樣本平均數服從正態(tài)分布2樣本平均數以總體平均數為期望值3樣本平均數的方差為導入:估計樣本平均數的范圍某總體方差為10

5、0,平均值為40,抽出一個36個單位構成的樣本,試在95的置信度水平下,估計樣本平均數的范圍。從前例逆推已知某總體方差為100,其一個由36個單位組成的樣本的平均數為50,試在95的置信度水平下,估計總體平均數的置信區(qū)間。總體標準差的替代對總體均值進行估計時,需要使用到總體標準差的數值。當總體標準差未知時,可以使用樣本標準差作為總體標準差的替代。例題:估計總體平均數一次調查中獲得了36個樣本的數據如下23 35 39 27 36 44 36 42 46 43 31 3342 53 45 54 47 24 34 28 39 36 44 4039 49 38 34 48 50 34 39 45 4

6、8 45 32試在95%的置信度水平下,估計總體平均數的置信區(qū)間。計算結果計算樣本平均數:X=39.5計算樣本標準差:s=7.7736令:總體標準差=樣本標準差,計算抽樣誤差為 1.295695%置信度對應的T值為1.96得總體平均數的置信區(qū)間為:上限:39.5+1.961.2956=42.04下限:39.5-1.961.2956=36.96對計算結果的說明嚴格地說,在這個例子中,不應當根據正態(tài)分布進行估計,而應當使用T分布進行估計。如果使用T分布,自由度為35,95%置信度的概率度(t)是2.03,而非1.96。計算出來的置信區(qū)間比正態(tài)分布的情況要略大一些。置信區(qū)間略大的原因,在于使用S替代

7、總體標準差時,本身也包含了一定的誤差。實踐中,社會調查的樣本量一般都比較大,正態(tài)分布與T分布的差異不明顯,因此可以用正態(tài)分布進行近似分析。例如,當樣本量為200時,T分布的95%概率度為1.9719,與正態(tài)分布的1.96已經沒有太大區(qū)別了。第三節(jié) 常見的參數估計題型本章為選修內容,涉及到數理統(tǒng)計中較多知識,需要通過習題來加以掌握。估計中的要點參數估計是從統(tǒng)計量的抽樣分布入手,利用統(tǒng)計量的分布特征,倒推出總體參數的置信區(qū)間。所有分布特征,都是基于統(tǒng)計量的抽樣分布總體參數是常數,統(tǒng)計量是隨機變量。在參數估計時,將統(tǒng)計量視為常數,總體參數視為變量。注意:這種說法是不嚴格的,因為總體參數是常數,不是隨

8、機變量助記方法一個總體參數總體均值正態(tài)總體,方差已知;或非正態(tài)總體,大樣本,方差已知。注意:Z取a/2的原因在于此時置信區(qū)間是最小的。一個總體參數總體均值正態(tài)總體,方差未知t分布以正態(tài)分布為漸近分布,一般當n大于30時,t分布與正態(tài)分布已經十分接近,可以使用正態(tài)分布來進行處理總體比例的區(qū)間估計在大樣本的情況下,樣本比例P的抽樣分布為正態(tài)分布。可以利用正態(tài)分布進行區(qū)間估計。比例估計的標準差比例估計的情況下,如果未知總體方差,可以用樣本方差替代。嚴格的計算公式應當為 在實踐中,經常直接使用p(1-p)作為近似。一個總體總體方差正態(tài)總體的條件下,樣本方差服從n-1個自由度的卡方分布。兩個總體參數均值

9、之差兩個總體均值之差:獨立樣本,大樣本兩個總體參數均值之差兩個總體均值之差:獨立樣本,小樣本兩個總體的方差未知,但相等;兩個總體的方差未知,不相等,但樣本量相等;兩個總體的方差未知,不相等,樣本量不相等。均使用T分布,主要區(qū)別在于方差的計算方法和自由度。兩個總體均值之差:匹配樣本一個樣本中的數據與另一樣本相對應,可以直接計算對應樣本的差的分布。大樣本情況下:兩總體均值之差服從正態(tài)分布。小樣本情況下:假定均值之差服從正態(tài)分布,使用樣本標準差代替總體標準差,計算T分布。兩個總體參數比例之差比例之差:大樣本下,服從正態(tài)分布。在估計時使用樣本標準差替代。兩個總體的方差比樣本方差比的抽樣分布為F分布???/p>

10、得:第四節(jié) 樣本量的計算樣本量的確定估計總體均值時樣本量的確定總體標準差的確定根據以往的經驗數值推算通過試訪問推算采用序貫抽樣方法在比例估計時,使用p(1-p)的最大值替代。比例估計時,方差為:p(1-p)可知,p(1-p)的最大值為0.25。比例估計時的樣本量推算在校園內估計學生擁有手機的比例,希望在95%的置信水平下,估計的絕對誤差不超過5個百分點(5%),求樣本量思考題:收視率估計某電視臺欲在95%的置信度水平下,對電視節(jié)目的收視率作為有效的估計,試考慮樣本量應當為多少?問題:若確定估計絕對誤差為5%,則樣本為385戶,是否可行?若考慮估計相對誤差為10%,則樣本量應當為多少?其他樣本量

11、估計的情況估計樣本比例時樣本量的確定估計兩個總體均值之差時樣本量的確定估計兩個總體比例之差時樣本量的確定以上問題,均可通過參數估計的公式進行逆推求得。第五節(jié) 其他抽樣方式的討論分層抽樣W:各層單位數所占比重2:層內方差整群抽樣R與r:群的總數和樣本群數量2:群間方差多階段抽樣F:抽樣比 N和M:一級和二級單位的單位數S2:一級與二級單位的方差設計效應 當deff因子小于1時,說明抽樣設計的效率高于SRS。 如果一個復雜抽樣的deff因子可以估計,對應相同精度的簡單隨機抽樣樣本量n,復雜抽樣設計的樣本量n為:N=ndeff謝謝觀看/歡迎下載BY FAITH I MEAN A VISION OF

12、GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES. BY FAITH I BY FAITH內容總結第六章 抽樣分布與參數估計。一般討論統(tǒng)計量的抽樣分布時,總是基于有放回的簡單隨機抽樣。有放回簡單隨機抽樣的各個樣本單位之間是相互獨立的。用于估計總體參數的樣本統(tǒng)計量的名稱叫估計量。根據一個具體樣本計算出來的估計量的數值叫估計值。點估計是用樣本統(tǒng)計量的某個取值直接作為總體參數的估計值。區(qū)間估計(Interval Estimate)是在點估計的基礎上給出總體參數估計的一個區(qū)間范圍。試在95%的置信度水平下,估計總體平均數的置信區(qū)間。計算出來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論