抽樣理論與方法：分層隨機(jī)抽樣課件

上傳人：世*** IP屬地：貴州上傳時(shí)間：2022-08-21 格式：PPT 頁(yè)數(shù)：64 大?。?.94MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩59頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、分層隨機(jī)抽樣4.1 概述一、分層抽樣（stratified sampling)、分層隨機(jī)抽樣(stratified random sampling)分層抽樣：將容量為N的總體分成L個(gè)不相重疊的子總體，子總體的大小分別為N1、 N2、 NL，皆已知，且則每個(gè)子總體就稱為層。從每層中獨(dú)立地進(jìn)行抽樣，這樣的抽樣方法稱為分層抽樣。分層隨機(jī)抽樣：在分層抽樣中，如果每層中的抽樣都是簡(jiǎn)單隨機(jī)抽樣，則這樣的分層抽樣稱為分層隨機(jī)抽樣。二、分層抽樣的適用場(chǎng)合不僅需要估計(jì)總體參數(shù)，也需要估計(jì)各層參數(shù)。便于管理，按現(xiàn)成的地理分布或行政劃分來(lái)分層。希望樣本中能包含各個(gè)部分，以增加代表性。把一個(gè)內(nèi)部差異很大的總體分成

2、幾個(gè)內(nèi)部比較相似的子總體（層）進(jìn)行分層抽樣，可以提高估計(jì)量的精度。如果有極端值，也可以把它們分離出來(lái)形成一層。即“層間方差大，層內(nèi)方差小”。三、進(jìn)行分層抽樣時(shí)，應(yīng)注意的方面層內(nèi)抽樣設(shè)計(jì)的選擇。分層變量的選擇。各層樣本量的分配，樣本總量的確定。層數(shù)。層的分界。4.2 簡(jiǎn)單估計(jì)量及其性質(zhì)對(duì)總體均值或總值的估計(jì)：例4.1 總體由1000人組成，按以往的收入情況將總體分成兩層：第一層（高收入層），20人；第二層（低收入層），980人。從第一層隨機(jī)抽取2人，調(diào)查上月收入，得數(shù)據(jù)（單位：元）1200及1600；從第二層隨機(jī)抽取8人，調(diào)查上月收入，得數(shù)據(jù)（單位：元）220、230、180、320、400、3

3、40、280、360。估計(jì)這1000人上月平均收入。解：對(duì)比：一、分層抽樣中，例3. 調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出，以居民戶為抽樣單元，根據(jù)經(jīng)濟(jì)及收入水平將居民戶分為層，每層按簡(jiǎn)單隨機(jī)抽樣抽取戶，調(diào)查數(shù)據(jù)如下，估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及估計(jì)的標(biāo)準(zhǔn)差。樣本戶奶制品年消費(fèi)支出解：（3）該地區(qū)居民奶制品年消費(fèi)總支出的置信度為95%的置信區(qū)間為例3.3：某市進(jìn)行家庭收入調(diào)查，分城鎮(zhèn)居民及農(nóng)村居民兩部分抽樣，在全部城鎮(zhèn)居民23560戶中隨機(jī)抽取300戶，在全部農(nóng)村居民148420戶中隨機(jī)抽取250戶，調(diào)查結(jié)果是城鎮(zhèn)年平均戶收入為15180元，標(biāo)準(zhǔn)差為2972元；農(nóng)村年平均戶收入為9856元

4、，標(biāo)準(zhǔn)差為2546元。求全市年平均戶收入的置信度為90%的置信區(qū)間。解：3、分層隨機(jī)抽樣中，總體比例P的簡(jiǎn)單估計(jì)估計(jì)的性質(zhì)（1）（2）(3)(4)4例：在某行業(yè)技術(shù)人員中，按年齡分層，調(diào)查會(huì)使用計(jì)算機(jī)者所占的比例。數(shù)據(jù)如下：試估計(jì)總體中會(huì)計(jì)算機(jī)者占的比例。解：3.3 各層樣本量的分配在分層隨機(jī)抽樣中，假設(shè)樣本量n固定1.比例分配：指按各層層權(quán)（各層單元數(shù)占總體單元數(shù)的比例）進(jìn)行分配。例：假設(shè)某公司欲估計(jì)某類產(chǎn)品的用戶的每年平均支出。企劃人員擬就整個(gè)潛在用戶的名單，共8000戶。采用分層隨機(jī)抽樣抽取樣本200戶，求按比例分配時(shí)各層樣本量。解：例. 某電視臺(tái)要在某地區(qū)的住戶中,調(diào)查該臺(tái)的晚間新

5、聞的收視率。該地區(qū)包括3個(gè)縣,共有67401家住戶。假定該電視臺(tái)采用等比例分層隨機(jī)抽樣分別從三個(gè)縣抽取住戶，樣本量為1500。每個(gè)縣的總戶數(shù)以及抽樣數(shù)據(jù)列表如下：求該地區(qū)新聞收視率的95%的置信區(qū)間。解：分層隨機(jī)抽樣時(shí)，收視率P的估計(jì)為：收視率P的置信度為95%的近似置信區(qū)間為：即有95%的把握可以認(rèn)為，該地區(qū)的新聞收視率在22.1%26.5%之間。2.最優(yōu)分配：例.在例3.2中，樣本量仍為n=40，則按比例分配和Neyman分配時(shí)，各層的樣本量為多少？例. 在例3.3中，樣本量仍為n=550。城鎮(zhèn)居民23560戶，農(nóng)村居民148420戶。城鎮(zhèn)居民與農(nóng)村居民的年收入的標(biāo)準(zhǔn)差分別為S1=

6、3000元,S2=2500元。對(duì)城鎮(zhèn)居民與農(nóng)村居民抽樣平均每戶的費(fèi)用比為1：2。試求城鎮(zhèn)與農(nóng)村兩層比例分配與最優(yōu)分配的樣本量。又若不考慮費(fèi)用因素，那么最優(yōu)分配的結(jié)果如何？解：例3.：調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出，以居民戶為抽樣單元，根據(jù)經(jīng)濟(jì)及收入水平將居民戶分為層，每層按簡(jiǎn)單隨機(jī)抽樣抽取戶，調(diào)查數(shù)據(jù)如下，估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及估計(jì)的標(biāo)準(zhǔn)差。表：樣本戶奶制品年消費(fèi)支出解：按比例分配時(shí)，對(duì)于Neyman分配，例：在例3.3中，樣本量仍為n=550，城鎮(zhèn)居民與農(nóng)村居民年收入的標(biāo)準(zhǔn)差估計(jì)分別為3000元和2500元，對(duì)城鎮(zhèn)居民與農(nóng)村居民抽樣品均每戶的費(fèi)用比為1：2，試求（1）城鎮(zhèn)

7、與農(nóng)村兩層比例分配樣本量；（2）最優(yōu)分配的樣本量。解：（1）按比例分配時(shí)，（2）對(duì)于Neyman分配，4.4 樣本總量的確定1.在分層隨機(jī)抽樣中，影響樣本總量n的因素：（1）只討論對(duì)總體參數(shù)的精度要求；（2）樣本量的分配形式。2.在估計(jì)總體均值時(shí)，若精度要求給定，樣本總量n的確定公式：證明：*例：某流水線生產(chǎn)了1500件產(chǎn)品，為估計(jì)產(chǎn)品的合格率，將產(chǎn)品按早、中、晚班分成三層。各班產(chǎn)量分別為：早班550件，中班500件，晚班450件。根據(jù)以往的情況，每班合格率均在95%左右。若要求以95%的把握使估計(jì)量的絕對(duì)誤差不超過(guò)2%，分別確定按比例配置和按Neyman配置時(shí)總樣本量和各層樣本量。解：例：

8、（續(xù)例3.2）如果要求在置信度95%下，相對(duì)誤差不超過(guò)10%，則按比例分配和Neyman分配時(shí)，總樣本量分別為多少？解：3.在估計(jì)總體均值時(shí)，若總費(fèi)用給定，精度最高時(shí)，樣本總量n的確定公式：4.5 分層時(shí)的若干問(wèn)題1.抽樣效果分析（1）分層隨機(jī)抽樣與簡(jiǎn)單隨機(jī)抽樣的比較在相同的樣本量下，比較二者的估計(jì)量的方差的大小。分層隨機(jī)抽樣以比例分配為代表。（2）最優(yōu)分配（以Neyman為例）與比例分配在精度上的比較理論上講，最優(yōu)分配的精度應(yīng)高于相同樣本量的任何其他分配。當(dāng)然，也高于比例分配的精度。但最優(yōu)分配在精度上的改進(jìn)有多大呢？*最優(yōu)分配對(duì)于估計(jì)總體比例P的情形較少使用。（除非特別小或特別大）2.

9、層的劃分（）層的劃分原則一種原則是僅為滿足估計(jì)部分（即子總體）參數(shù)的需要或?yàn)榱私M織實(shí)施的便利。另一種原則是盡可能提高抽樣精度，減少估計(jì)量的方差。需要選擇恰當(dāng)?shù)淖兞孔兞孔鳛榉謱訕?biāo)志。分層標(biāo)志的選擇：可以是調(diào)查指標(biāo)的前期值可以是與調(diào)查指標(biāo)有較大線性相關(guān)的指標(biāo)。例如交通運(yùn)輸量的調(diào)查中，車輛的噸位是與其兩個(gè)主要指標(biāo)：運(yùn)量與周轉(zhuǎn)量密切相關(guān)的。（2）層權(quán)對(duì)估計(jì)量的影響（3）最優(yōu)分層如何確定各層的分點(diǎn)：下面介紹一種確定層界的快速近似法累積平方根法。它是由Dalenius和Hodges提出的。其做法：將分層變量的分布的累積平方根進(jìn)行等分來(lái)獲得最優(yōu)分層，所以成為累積平方根法。例：某地區(qū)電信部門在對(duì)利用電話上網(wǎng)的居民家庭安裝ADSL意愿進(jìn)行調(diào)查時(shí)，以轄區(qū)內(nèi)最近三個(gè)月有電話上網(wǎng)支出的居民用戶為總體（上網(wǎng)電話費(fèi)為0.02元/分鐘），并準(zhǔn)備按上網(wǎng)電話費(fèi)支出（記為x）進(jìn)行分層，試確定各層的分點(diǎn)。居民家庭上網(wǎng)電話費(fèi)支出分布如下頁(yè)表所示 *計(jì)算累積頻數(shù)時(shí),應(yīng)注意x的取值區(qū)間不是等長(zhǎng)的。30元以下，以5元為間距，計(jì)算時(shí)，按累積；30-100元，以10元為間距，計(jì)算時(shí)，按累積；100元以上，以50元為間距，計(jì)算時(shí)，按累積。解：若取層數(shù)為4，則應(yīng)每隔2712.949/4=678.237分一層。分點(diǎn)應(yīng)使得累積最接近678.237， 2* 678.237 =1356.474，3* 678.2

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

抽樣理論與方法：分層隨機(jī)抽樣課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

抽樣理論與方法：分層隨機(jī)抽樣課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔