抽樣理論與方法:分層隨機抽樣課件_第1頁
抽樣理論與方法:分層隨機抽樣課件_第2頁
抽樣理論與方法:分層隨機抽樣課件_第3頁
抽樣理論與方法:分層隨機抽樣課件_第4頁
抽樣理論與方法:分層隨機抽樣課件_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、分層隨機抽樣4.1 概述 一、分層抽樣(stratified sampling)、分層隨機抽樣(stratified random sampling)分層抽樣:將容量為N的總體分成L個不相重疊的子總體,子總體的大小分別為N1、 N2、 NL,皆已知,且 則每個子總體就稱為層。從每層中獨立地進行抽樣,這樣的抽樣方法稱為分層抽樣。分層隨機抽樣:在分層抽樣中,如果每層中的抽樣都是簡單隨機抽樣,則這樣的分層抽樣稱為分層隨機抽樣。二、分層抽樣的適用場合不僅需要估計總體參數(shù),也需要估計各層參數(shù)。便于管理,按現(xiàn)成的地理分布或行政劃分來分層。希望樣本中能包含各個部分,以增加代表性。把一個內(nèi)部差異很大的總體分成

2、幾個內(nèi)部比較相似的子總體(層)進行分層抽樣,可以提高估計量的精度。如果有極端值,也可以把它們分離出來形成一層。即“層間方差大,層內(nèi)方差小”。三、進行分層抽樣時,應(yīng)注意的方面層內(nèi)抽樣設(shè)計的選擇。分層變量的選擇。各層樣本量的分配,樣本總量的確定。層數(shù)。層的分界。4.2 簡單估計量及其性質(zhì)對總體均值或總值的估計:例4.1 總體由1000人組成,按以往的收入情況將總體分成兩層:第一層(高收入層),20人;第二層(低收入層),980人。從第一層隨機抽取2人,調(diào)查上月收入,得數(shù)據(jù)(單位:元)1200及1600;從第二層隨機抽取8人,調(diào)查上月收入,得數(shù)據(jù)(單位:元)220、230、180、320、400、3

3、40、280、360。估計這1000人上月平均收入。解: 對比:一、分層抽樣中,例3. 調(diào)查某地區(qū)的居民奶制品年消費支出,以居民戶為抽樣單元,根據(jù)經(jīng)濟及收入水平將居民戶分為層,每層按簡單隨機抽樣抽取戶,調(diào)查數(shù)據(jù)如下,估計該地區(qū)居民奶制品年消費總支出及估計的標準差。樣本戶奶制品年消費支出解:(3)該地區(qū)居民奶制品年消費總支出的置信度為95%的置信區(qū)間為例3.3:某市進行家庭收入調(diào)查,分城鎮(zhèn)居民及農(nóng)村居民兩部分抽樣,在全部城鎮(zhèn)居民23560戶中隨機抽取300戶,在全部農(nóng)村居民148420戶中隨機抽取250戶,調(diào)查結(jié)果是城鎮(zhèn)年平均戶收入為15180元,標準差為2972元;農(nóng)村年平均戶收入為9856元

4、,標準差為2546元。求全市年平均戶收入的置信度為90%的置信區(qū)間。解:3、分層隨機抽樣中,總體比例P的簡單估計估計的性質(zhì)(1)(2)(3)(4)4例:在某行業(yè)技術(shù)人員中,按年齡分層,調(diào)查會使用計算機者所占的比例。數(shù)據(jù)如下: 試估計總體中會計算機者占的比例。解:3.3 各層樣本量的分配在分層隨機抽樣中,假設(shè)樣本量n固定1.比例分配:指按各層層權(quán)(各層單元數(shù)占總體單元數(shù)的比例)進行分配。例:假設(shè)某公司欲估計某類產(chǎn)品的用戶的每年平均支出。企劃人員擬就整個潛在用戶的名單,共8000戶。 采用分層隨機抽樣抽取樣本200戶,求按比例分配時各層樣本量。解:例. 某電視臺要在某地區(qū)的住戶中,調(diào)查該臺的晚間新

5、聞的收視率。該地區(qū)包括3個縣,共有67401家住戶。假定該電視臺采用等比例分層隨機抽樣分別從三個縣抽取住戶,樣本量為1500。每個縣的總戶數(shù)以及抽樣數(shù)據(jù)列表如下: 求該地區(qū)新聞收視率的95%的置信區(qū)間。解:分層隨機抽樣時,收視率P的估計為: 收視率P的置信度為95%的近似置信區(qū)間為:即有95%的把握可以認為,該地區(qū)的新聞收視率在22.1%26.5%之間。2.最優(yōu)分配:例.在例3.2中,樣本量仍為n=40,則按比例分配和Neyman分配時,各層的樣本量為多少?例. 在例3.3中,樣本量仍為n=550。 城鎮(zhèn)居民23560戶,農(nóng)村居民148420戶。 城鎮(zhèn)居民與農(nóng)村居民的年收入的標準差分別為S1=

6、3000元,S2=2500元。 對城鎮(zhèn)居民與農(nóng)村居民抽樣平均每戶的費用比為1:2。 試求城鎮(zhèn)與農(nóng)村兩層比例分配與最優(yōu)分配的樣本量。又若不考慮費用因素,那么最優(yōu)分配的結(jié)果如何?解:例3.:調(diào)查某地區(qū)的居民奶制品年消費支出,以居民戶為抽樣單元,根據(jù)經(jīng)濟及收入水平將居民戶分為層,每層按簡單隨機抽樣抽取戶,調(diào)查數(shù)據(jù)如下,估計該地區(qū)居民奶制品年消費總支出及估計的標準差。表:樣本戶奶制品年消費支出解:按比例分配時, 對于Neyman分配,例:在例3.3中,樣本量仍為n=550,城鎮(zhèn)居民與農(nóng)村居民年收入的標準差估計分別為3000元和2500元,對城鎮(zhèn)居民與農(nóng)村居民抽樣品均每戶的費用比為1:2,試求(1)城鎮(zhèn)

7、與農(nóng)村兩層比例分配樣本量;(2)最優(yōu)分配的樣本量。解:(1)按比例分配時, (2)對于Neyman分配,4.4 樣本總量的確定1.在分層隨機抽樣中,影響樣本總量n的因素:(1)只討論對總體參數(shù)的精度要求;(2)樣本量的分配形式。2.在估計總體均值時,若精度要求給定,樣本總量n的確定公式:證明:*例:某流水線生產(chǎn)了1500件產(chǎn)品,為估計產(chǎn)品的合格率,將產(chǎn)品按早、中、晚班分成三層。各班產(chǎn)量分別為:早班550件,中班500件,晚班450件。根據(jù)以往的情況,每班合格率均在95%左右。若要求以95%的把握使估計量的絕對誤差不超過2%,分別確定按比例配置和按Neyman配置時總樣本量和各層樣本量。解:例:

8、(續(xù)例3.2)如果要求在置信度95%下,相對誤差不超過10%,則按比例分配和Neyman分配時,總樣本量分別為多少?解:3.在估計總體均值時,若總費用給定,精度最高時,樣本總量n的確定公式:4.5 分層時的若干問題1.抽樣效果分析(1)分層隨機抽樣與簡單隨機抽樣的比較 在相同的樣本量下,比較二者的估計量的方差的大小。分層隨機抽樣以比例分配為代表。 (2)最優(yōu)分配(以Neyman為例)與比例分配在精度上的比較 理論上講,最優(yōu)分配的精度應(yīng)高于相同樣本量的任何其他分配。當然,也高于比例分配的精度。但最優(yōu)分配在精度上的改進有多大呢?*最優(yōu)分配對于估計總體比例P的情形較少使用。(除非特別小或特別大)2.

9、層的劃分()層的劃分原則一種原則是僅為滿足估計部分(即子總體)參數(shù)的需要或為了組織實施的便利。另一種原則是盡可能提高抽樣精度,減少估計量的方差。需要選擇恰當?shù)淖兞孔兞孔鳛榉謱訕酥尽?分層標志的選擇:可以是調(diào)查指標的前期值可以是與調(diào)查指標有較大線性相關(guān)的指標。例如交通運輸量的調(diào)查中,車輛的噸位是與其兩個主要指標:運量與周轉(zhuǎn)量密切相關(guān)的。(2)層權(quán)對估計量的影響 (3)最優(yōu)分層如何確定各層的分點:下面介紹一種確定層界的快速近似法累積平方根法。它是由Dalenius和Hodges提出的。其做法:將分層變量的分布的累積平方根進行等分來獲得最優(yōu)分層,所以成為累積平方根法。例:某地區(qū)電信部門在對利用電話上網(wǎng)的居民家庭安裝ADSL意愿進行調(diào)查時,以轄區(qū)內(nèi)最近三個月有電話上網(wǎng)支出的居民用戶為總體(上網(wǎng)電話費為0.02元/分鐘),并準備按上網(wǎng)電話費支出(記為x)進行分層,試確定各層的分點。居民家庭上網(wǎng)電話費支出分布如下頁表所示 *計算累積頻數(shù)時,應(yīng)注意x的取值區(qū)間不是等長的。30元以下,以5元為間距,計算時,按 累積;30-100元,以10元為間距,計算時,按 累積;100元以上,以50元為間距,計算時,按 累積。解:若取層數(shù)為4,則應(yīng)每隔2712.949/4=678.237分一層。 分點應(yīng)使得累積 最接近678.237, 2* 678.237 =1356.474,3* 678.2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論