抽樣理論與方法:分層隨機(jī)抽樣課件_第1頁(yè)
抽樣理論與方法:分層隨機(jī)抽樣課件_第2頁(yè)
抽樣理論與方法:分層隨機(jī)抽樣課件_第3頁(yè)
抽樣理論與方法:分層隨機(jī)抽樣課件_第4頁(yè)
抽樣理論與方法:分層隨機(jī)抽樣課件_第5頁(yè)
已閱讀5頁(yè),還剩59頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、分層隨機(jī)抽樣4.1 概述 一、分層抽樣(stratified sampling)、分層隨機(jī)抽樣(stratified random sampling)分層抽樣:將容量為N的總體分成L個(gè)不相重疊的子總體,子總體的大小分別為N1、 N2、 NL,皆已知,且 則每個(gè)子總體就稱為層。從每層中獨(dú)立地進(jìn)行抽樣,這樣的抽樣方法稱為分層抽樣。分層隨機(jī)抽樣:在分層抽樣中,如果每層中的抽樣都是簡(jiǎn)單隨機(jī)抽樣,則這樣的分層抽樣稱為分層隨機(jī)抽樣。二、分層抽樣的適用場(chǎng)合不僅需要估計(jì)總體參數(shù),也需要估計(jì)各層參數(shù)。便于管理,按現(xiàn)成的地理分布或行政劃分來(lái)分層。希望樣本中能包含各個(gè)部分,以增加代表性。把一個(gè)內(nèi)部差異很大的總體分成

2、幾個(gè)內(nèi)部比較相似的子總體(層)進(jìn)行分層抽樣,可以提高估計(jì)量的精度。如果有極端值,也可以把它們分離出來(lái)形成一層。即“層間方差大,層內(nèi)方差小”。三、進(jìn)行分層抽樣時(shí),應(yīng)注意的方面層內(nèi)抽樣設(shè)計(jì)的選擇。分層變量的選擇。各層樣本量的分配,樣本總量的確定。層數(shù)。層的分界。4.2 簡(jiǎn)單估計(jì)量及其性質(zhì)對(duì)總體均值或總值的估計(jì):例4.1 總體由1000人組成,按以往的收入情況將總體分成兩層:第一層(高收入層),20人;第二層(低收入層),980人。從第一層隨機(jī)抽取2人,調(diào)查上月收入,得數(shù)據(jù)(單位:元)1200及1600;從第二層隨機(jī)抽取8人,調(diào)查上月收入,得數(shù)據(jù)(單位:元)220、230、180、320、400、3

3、40、280、360。估計(jì)這1000人上月平均收入。解: 對(duì)比:一、分層抽樣中,例3. 調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出,以居民戶為抽樣單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶分為層,每層按簡(jiǎn)單隨機(jī)抽樣抽取戶,調(diào)查數(shù)據(jù)如下,估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及估計(jì)的標(biāo)準(zhǔn)差。樣本戶奶制品年消費(fèi)支出解:(3)該地區(qū)居民奶制品年消費(fèi)總支出的置信度為95%的置信區(qū)間為例3.3:某市進(jìn)行家庭收入調(diào)查,分城鎮(zhèn)居民及農(nóng)村居民兩部分抽樣,在全部城鎮(zhèn)居民23560戶中隨機(jī)抽取300戶,在全部農(nóng)村居民148420戶中隨機(jī)抽取250戶,調(diào)查結(jié)果是城鎮(zhèn)年平均戶收入為15180元,標(biāo)準(zhǔn)差為2972元;農(nóng)村年平均戶收入為9856元

4、,標(biāo)準(zhǔn)差為2546元。求全市年平均戶收入的置信度為90%的置信區(qū)間。解:3、分層隨機(jī)抽樣中,總體比例P的簡(jiǎn)單估計(jì)估計(jì)的性質(zhì)(1)(2)(3)(4)4例:在某行業(yè)技術(shù)人員中,按年齡分層,調(diào)查會(huì)使用計(jì)算機(jī)者所占的比例。數(shù)據(jù)如下: 試估計(jì)總體中會(huì)計(jì)算機(jī)者占的比例。解:3.3 各層樣本量的分配在分層隨機(jī)抽樣中,假設(shè)樣本量n固定1.比例分配:指按各層層權(quán)(各層單元數(shù)占總體單元數(shù)的比例)進(jìn)行分配。例:假設(shè)某公司欲估計(jì)某類產(chǎn)品的用戶的每年平均支出。企劃人員擬就整個(gè)潛在用戶的名單,共8000戶。 采用分層隨機(jī)抽樣抽取樣本200戶,求按比例分配時(shí)各層樣本量。解:例. 某電視臺(tái)要在某地區(qū)的住戶中,調(diào)查該臺(tái)的晚間新

5、聞的收視率。該地區(qū)包括3個(gè)縣,共有67401家住戶。假定該電視臺(tái)采用等比例分層隨機(jī)抽樣分別從三個(gè)縣抽取住戶,樣本量為1500。每個(gè)縣的總戶數(shù)以及抽樣數(shù)據(jù)列表如下: 求該地區(qū)新聞收視率的95%的置信區(qū)間。解:分層隨機(jī)抽樣時(shí),收視率P的估計(jì)為: 收視率P的置信度為95%的近似置信區(qū)間為:即有95%的把握可以認(rèn)為,該地區(qū)的新聞收視率在22.1%26.5%之間。2.最優(yōu)分配:例.在例3.2中,樣本量仍為n=40,則按比例分配和Neyman分配時(shí),各層的樣本量為多少?例. 在例3.3中,樣本量仍為n=550。 城鎮(zhèn)居民23560戶,農(nóng)村居民148420戶。 城鎮(zhèn)居民與農(nóng)村居民的年收入的標(biāo)準(zhǔn)差分別為S1=

6、3000元,S2=2500元。 對(duì)城鎮(zhèn)居民與農(nóng)村居民抽樣平均每戶的費(fèi)用比為1:2。 試求城鎮(zhèn)與農(nóng)村兩層比例分配與最優(yōu)分配的樣本量。又若不考慮費(fèi)用因素,那么最優(yōu)分配的結(jié)果如何?解:例3.:調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出,以居民戶為抽樣單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶分為層,每層按簡(jiǎn)單隨機(jī)抽樣抽取戶,調(diào)查數(shù)據(jù)如下,估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及估計(jì)的標(biāo)準(zhǔn)差。表:樣本戶奶制品年消費(fèi)支出解:按比例分配時(shí), 對(duì)于Neyman分配,例:在例3.3中,樣本量仍為n=550,城鎮(zhèn)居民與農(nóng)村居民年收入的標(biāo)準(zhǔn)差估計(jì)分別為3000元和2500元,對(duì)城鎮(zhèn)居民與農(nóng)村居民抽樣品均每戶的費(fèi)用比為1:2,試求(1)城鎮(zhèn)

7、與農(nóng)村兩層比例分配樣本量;(2)最優(yōu)分配的樣本量。解:(1)按比例分配時(shí), (2)對(duì)于Neyman分配,4.4 樣本總量的確定1.在分層隨機(jī)抽樣中,影響樣本總量n的因素:(1)只討論對(duì)總體參數(shù)的精度要求;(2)樣本量的分配形式。2.在估計(jì)總體均值時(shí),若精度要求給定,樣本總量n的確定公式:證明:*例:某流水線生產(chǎn)了1500件產(chǎn)品,為估計(jì)產(chǎn)品的合格率,將產(chǎn)品按早、中、晚班分成三層。各班產(chǎn)量分別為:早班550件,中班500件,晚班450件。根據(jù)以往的情況,每班合格率均在95%左右。若要求以95%的把握使估計(jì)量的絕對(duì)誤差不超過(guò)2%,分別確定按比例配置和按Neyman配置時(shí)總樣本量和各層樣本量。解:例:

8、(續(xù)例3.2)如果要求在置信度95%下,相對(duì)誤差不超過(guò)10%,則按比例分配和Neyman分配時(shí),總樣本量分別為多少?解:3.在估計(jì)總體均值時(shí),若總費(fèi)用給定,精度最高時(shí),樣本總量n的確定公式:4.5 分層時(shí)的若干問(wèn)題1.抽樣效果分析(1)分層隨機(jī)抽樣與簡(jiǎn)單隨機(jī)抽樣的比較 在相同的樣本量下,比較二者的估計(jì)量的方差的大小。分層隨機(jī)抽樣以比例分配為代表。 (2)最優(yōu)分配(以Neyman為例)與比例分配在精度上的比較 理論上講,最優(yōu)分配的精度應(yīng)高于相同樣本量的任何其他分配。當(dāng)然,也高于比例分配的精度。但最優(yōu)分配在精度上的改進(jìn)有多大呢?*最優(yōu)分配對(duì)于估計(jì)總體比例P的情形較少使用。(除非特別小或特別大)2.

9、層的劃分()層的劃分原則一種原則是僅為滿足估計(jì)部分(即子總體)參數(shù)的需要或?yàn)榱私M織實(shí)施的便利。另一種原則是盡可能提高抽樣精度,減少估計(jì)量的方差。需要選擇恰當(dāng)?shù)淖兞孔兞孔鳛榉謱訕?biāo)志。 分層標(biāo)志的選擇:可以是調(diào)查指標(biāo)的前期值可以是與調(diào)查指標(biāo)有較大線性相關(guān)的指標(biāo)。例如交通運(yùn)輸量的調(diào)查中,車輛的噸位是與其兩個(gè)主要指標(biāo):運(yùn)量與周轉(zhuǎn)量密切相關(guān)的。(2)層權(quán)對(duì)估計(jì)量的影響 (3)最優(yōu)分層如何確定各層的分點(diǎn):下面介紹一種確定層界的快速近似法累積平方根法。它是由Dalenius和Hodges提出的。其做法:將分層變量的分布的累積平方根進(jìn)行等分來(lái)獲得最優(yōu)分層,所以成為累積平方根法。例:某地區(qū)電信部門在對(duì)利用電話上網(wǎng)的居民家庭安裝ADSL意愿進(jìn)行調(diào)查時(shí),以轄區(qū)內(nèi)最近三個(gè)月有電話上網(wǎng)支出的居民用戶為總體(上網(wǎng)電話費(fèi)為0.02元/分鐘),并準(zhǔn)備按上網(wǎng)電話費(fèi)支出(記為x)進(jìn)行分層,試確定各層的分點(diǎn)。居民家庭上網(wǎng)電話費(fèi)支出分布如下頁(yè)表所示 *計(jì)算累積頻數(shù)時(shí),應(yīng)注意x的取值區(qū)間不是等長(zhǎng)的。30元以下,以5元為間距,計(jì)算時(shí),按 累積;30-100元,以10元為間距,計(jì)算時(shí),按 累積;100元以上,以50元為間距,計(jì)算時(shí),按 累積。解:若取層數(shù)為4,則應(yīng)每隔2712.949/4=678.237分一層。 分點(diǎn)應(yīng)使得累積 最接近678.237, 2* 678.237 =1356.474,3* 678.2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論