抽樣分布與抽樣誤差_第1頁
抽樣分布與抽樣誤差_第2頁
抽樣分布與抽樣誤差_第3頁
抽樣分布與抽樣誤差_第4頁
抽樣分布與抽樣誤差_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章抽樣推斷第一節(jié)抽樣及抽樣分布指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機會一、抽樣推斷的涵義及特點按照隨機原則

從調查對象中抽取一部分單位進行調查,并根據樣本推斷總體數量特征的一種統(tǒng)計方法1、抽樣推斷的涵義按隨機原則抽取樣本單位目的是推斷總體的數量特征抽樣誤差可以事先計算并控制2、抽樣推斷的特點設總體中個總體單位某項標志的標志值分別為,其中具有某種屬性的有個單位,不具有某種屬性的有個單位,則⒈總體平均數(又叫總體均值):指被估計的總體指標,又被稱為全及指標二、總體參數⒉總體單位標志值的標準差:⒊總體單位標志值的方差:⒋總體成數:⒌總體是非標志的標準差:⒍總體是非標志的方差:設樣本中個樣本單位某項標志的標志值分別為,其中具有和不具有某種屬性的樣本單位數目分別為和個,則⒈樣本平均數(又叫樣本均值):指根據樣本單位的標志值計算的用以估計和推斷相應總體指標的綜合指標,又被稱為估計量或統(tǒng)計量三、樣本指標⒉樣本的標準差:⒊樣本的方差:為自由度為的無偏估計為的無偏估計⒋樣本成數:⒌樣本單位是非標志的標準差:⒍樣本單位是非標志的方差:為的無偏估計為的無偏估計四、抽樣方法1、重復抽樣又被稱作重置抽樣、有放回抽樣2、不重復抽樣又被稱作不重置抽樣、不放回抽樣五、抽樣組織方式1·簡單隨機抽樣(純隨機抽樣)——對總體單位逐一編號,然后按隨機原則直接從總體中抽出若干單位構成樣本應用僅適用于規(guī)模不大、內部各單位標志值差異較小的總體是最簡單、最基本、最符合隨機原則,但同時也是抽樣誤差最大的抽樣組織形式2·類型抽樣(分層抽樣)——將總體全部單位分類,形成若干個類型組,然后從各類型中分別抽取樣本單位組成樣本。總體N樣本n等額抽取等比例抽取最優(yōu)抽取······能使樣本結構更接近于總體結構,提高樣本的代表性;能同時推斷總體指標和各子總體的指標3·等距抽樣(機械抽樣或系統(tǒng)抽樣)——將總體單位按某一標志排序,而后按一定的間隔抽取樣本單位?!ぁぁぁぁぁるS機起點半距起點對稱起點(總體單位按某一標志排序)按無關標志排隊,其抽樣效果相當于簡單隨機抽樣;按有關標志排隊,其抽樣效果相當于類型抽樣。4·整群抽樣(集團抽樣)——將總體全部單位分為若干“群”,然后隨機抽取一部分“群”,被抽中群體的所有單位構成樣本例:總體群數R=16樣本群數r=4ABCDEFGHIJKLMNOPLHPD樣本容量簡單、方便,能節(jié)省人力、物力、財力和時間,但其樣本代表性可能較差5·多階段抽樣——指分兩個或兩個以上的階段來完成抽取樣本單位的過程例:在某省100多萬農戶抽取1000戶調查農戶生產性投資情況。第一階段:從該省所有縣中抽取5個縣第二階段:從被抽中的5個縣中各抽4個鄉(xiāng)第三階段:從被抽中的20個鄉(xiāng)中各抽5個村第四階段:從被抽中的100個村中各抽10戶樣本n=100×10=1000(戶)六、樣本容量和樣本個數n≥30,為大樣本;n<30,為小樣本樣本容量指樣本中含有的總體單位的數目,通常用n來表示。確定適當樣本容量的意義:若n過大,調查工作量增大,體現不出抽樣調查的優(yōu)越性;若n

過小,抽樣誤差會增大,抽樣推斷就會失去價值。在重復選取容量為n的樣本時,由樣本平均數的所有可能取值形成的相對頻數分布一種理論概率分布推斷總體平均數的理論基礎

七、樣本平均數(均值)的抽樣分布樣本平均數的抽樣分布

(例題分析)【例】設一個總體,含有4個元素(個體),即總體單位數N=4。4個個體分別為x1=1,x2=2,x3=3,x4=4??傮w的平均數、方差及分布如下總體分布14230.1.2.3平均數和方差樣本均值的抽樣分布

(例題分析)

現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.5μ=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x樣本平均數的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x的數學期望為μ,方差為σ2/n。即x~N(μ,σ2/n)樣本比例的抽樣分布總體(或樣本)中具有某種屬性的單位與全部單位總數之比不同性別的人與全部人數之比合格品(或不合格品)與全部產品總數之比總體比例可表示為樣本比例可表示為

比例

(proportion)在重復選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數分布一種理論概率分布當樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似推斷總體比例的理論基礎

樣本比例的抽樣分布樣本比例的數學期望樣本比例的方差重復抽樣不重復抽樣樣本比例的抽樣分布

(數學期望與方差)一、抽樣誤差的概念二、抽樣平均誤差三、抽樣極限誤差第二節(jié)抽樣誤差指樣本估計量與總體參數之間數量上的差異,僅指由于按照隨機原則抽取樣本而產生的代表性誤差,不包括登記性誤差和系統(tǒng)偏差抽樣誤差抽樣平均誤差的計算公式⒈樣本平均數的抽樣平均誤差重復抽樣時:不重復抽樣時:⒉樣本成數的抽樣平均誤差重復抽樣時:不重復抽樣時:抽樣平均誤差的計算公式影響抽樣誤差的因素總體各單位的差異程度(即標準差的大?。涸酱?,抽樣誤差越大;樣本單位數的多少:越大,抽樣誤差越?。怀闃臃椒ǎ翰恢貜统闃拥某闃诱`差比重復抽樣的抽樣誤差?。怀闃咏M織方式:簡單隨機抽樣的誤差最大。抽樣極限誤差指在一定的概率保證程度下,抽樣誤差不允許超過的某一給定范圍,也稱作允許誤差、誤差范圍、誤差置信限等抽樣極限誤差的計算公式(大樣本條件下)樣本平均數的極限誤差:⒈樣本成數的極限誤差:⒉Z為概率度,是給定概率保證程度下樣本均值偏離總體均值的抽樣平均誤差的倍數。Z與相應的概率保證程度存在一一對應關系,常用Z值及相應的概率保證程度為:

z值概率保證程度

1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973抽樣極限誤差的計算公式(大樣本條件下)第三節(jié)參數估計一、點估計二、區(qū)間估計三、樣本容量的確定一、點估計指直接以樣本指標來估計總體指標,也叫定值估計簡單,具體明確優(yōu)點缺點無法控制誤差,僅適用于對推斷的準確程度與可靠程度要求不高的情況評價估計量的標準無偏性

(unbiasedness)無偏性:估計量抽樣分布的數學期望等于被估計的總體參數P(

)BA無偏有偏有效性

(efficiency)有效性:對同一總體參數的兩個無偏點估計量,有更小標準差的估計量更有效

AB的抽樣分布的抽樣分布P(

)一致性

(consistency)一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數AB較小的樣本容量較大的樣本容量P(

)二、區(qū)間估計指根據樣本指標和抽樣極限誤差以一定的可靠程度推斷總體指標的可能范圍;其中,被推斷的總體指標的下限與上限所包括的區(qū)間稱為置信區(qū)間,估計的可靠程度也稱為置信度。(這里只討論常用的大樣本的情況)總體平均數的區(qū)間估計表達式其中,為極限誤差總體成數的區(qū)間估計表達式其中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論