版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第2章 簡(jiǎn)單隨機(jī)抽樣SRS2.1 定義及其抽選方法2.2 簡(jiǎn)單估計(jì)量及其性質(zhì)2.3 樣本量確實(shí)定2.4 設(shè)計(jì)效應(yīng)2.5 逆抽樣 .2.1定義與符號(hào)簡(jiǎn)單隨機(jī)抽樣也稱為純隨機(jī)抽樣。從含有 N 個(gè)單元的總體中抽取 n 個(gè)單元組成樣本,假設(shè)抽樣是不放回的,那么一切能夠的樣本有 個(gè),假設(shè)每個(gè)樣本被抽中的概率一樣,都為 ,這種抽樣方法就是簡(jiǎn)單隨機(jī)抽樣。詳細(xì)抽樣時(shí),通常是逐個(gè)抽取樣本單元,直到抽滿n個(gè)單元為止。 有限.放回簡(jiǎn)單隨機(jī)抽樣不放回簡(jiǎn)單隨機(jī)抽樣放回簡(jiǎn)單隨機(jī)抽樣(SRS with replacement)當(dāng)從總體N個(gè)抽樣單元中抽取n個(gè)抽樣單元時(shí),假設(shè)依次抽取單元時(shí),不論以前能否被抽中過(guò),每次都從N個(gè)抽
2、樣單元中隨機(jī)抽取,這時(shí),一切能夠的樣本為 ? 個(gè)(思索樣本單元的順序),每個(gè)樣本被抽中的概率為?放回簡(jiǎn)單隨機(jī)抽樣在每次抽取樣本單元時(shí),都將前一次抽取的樣本單元放回總體,因此,總體的構(gòu)造不變,抽樣是相互獨(dú)立進(jìn)展的,這一點(diǎn)是它與不放回簡(jiǎn)單隨機(jī)抽樣的主要不同之處。放回簡(jiǎn)單隨機(jī)抽樣的樣本量不受總體大小的限制,可以是恣意的。.簡(jiǎn)單隨機(jī)抽樣的抽取原那么:1按隨機(jī)原那么取樣;2每個(gè)抽樣單元被抽中的概率都是知的或事先確定的;3每個(gè)抽樣單元被抽中的概率都是相等的。一切能夠樣本每個(gè)樣本被抽中的概率一樣一切能夠樣本每個(gè)樣本被抽中的概率一樣.【例2.1】設(shè)總體有5個(gè)單元1、2、3、4、5,按放回簡(jiǎn)單隨機(jī)抽樣的方式抽取
3、2個(gè)單元,那么一切能夠的樣本為25個(gè)思索樣本單元的順序:1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5.(2)不放回簡(jiǎn)單隨機(jī)抽樣(SRS without replacement)當(dāng)從總體N個(gè)抽樣單元中依次抽取n個(gè)抽樣單元時(shí),每個(gè)被抽中的單元不再放回總體,而是從總體剩下的單元中進(jìn)展抽樣。不放回簡(jiǎn)單隨機(jī)抽樣的樣本量要受總體大小的限制。在實(shí)踐任務(wù)中,更多的采用不放回簡(jiǎn)單隨機(jī)抽樣。. 【例2.2】設(shè)總體有5個(gè)單元1、2、3、4、5,按不放回簡(jiǎn)單隨機(jī)抽樣的方式抽取2個(gè)單元,那么一切能夠的樣本為個(gè):1,
4、22,33,44,51,32,43,51,42,51,5.符號(hào) 大寫(xiě)符號(hào)表示總體的標(biāo)志值,用小寫(xiě)符號(hào)表示樣本的標(biāo)志值 總 體樣 本 .總體目的值上面帶符號(hào)“的表示由樣本得到的總體目的的估計(jì)。 稱 為抽樣比,記為f 。估計(jì)量的方差用大寫(xiě)的V表示,對(duì) 的樣本估計(jì),不用 而用 表示。 .二、抽選方法1抽簽法 2隨機(jī)數(shù)法隨機(jī)數(shù)表、隨機(jī)數(shù)骰子、搖獎(jiǎng)機(jī)、計(jì)算機(jī)產(chǎn)生的偽隨機(jī)數(shù) 隨機(jī)數(shù)表法:N=327 n5討論: (1) 總體編號(hào)為135,在0099中產(chǎn)生隨機(jī)數(shù),假設(shè)=00或35,那么丟棄重抽。 (2) 總體編號(hào)為135,在0099中產(chǎn)生隨機(jī)數(shù),以除以35,余數(shù)作為被抽中的數(shù),假設(shè)余數(shù)為0,那么被抽中的數(shù)為3
5、5。.三、位置與作用優(yōu)點(diǎn)簡(jiǎn)單直觀實(shí)際根底缺陷N很大時(shí)難以獲得抽樣框樣本分散不易實(shí)施,調(diào)查費(fèi)用高很少單獨(dú)運(yùn)用,普通結(jié)合其他方法運(yùn)用沒(méi)有其他信息時(shí)運(yùn)用多變量復(fù)雜數(shù)據(jù)分析.2.2 簡(jiǎn)單估計(jì)量及其性質(zhì) 判別下面要估計(jì)的總體目的量分別屬于什么類型?調(diào)查城市居民家庭平均用電量。估計(jì)湖中魚(yú)的數(shù)量。測(cè)試日光燈的壽命。估計(jì)居民家庭用于做飯菜及飲用的用水量占家庭總用水量的比重。估計(jì)嬰兒出生性別比。檢測(cè)食鹽中碘含量。. 一、對(duì)總體均值的估計(jì) 以樣本均值作為總體均值的估計(jì)性質(zhì)1:對(duì)于簡(jiǎn)單隨機(jī)抽樣, 是 的無(wú)偏估計(jì)。 .例設(shè)總體為0,1,3,5,6,計(jì)算總體均值 =3、總體方差 =5.2和 =6.5;給出全部 的樣本,
6、并驗(yàn)證 及 。 1010.5-2.50.52031.5-1.54.53052.5-0.512.540630185132-126153087163.50.512.58354129364.51.54.510平均565.52.50.5306.5方差1.95樣本編號(hào)單元1單元2樣本均值-樣本方差. 證明 性質(zhì)1 對(duì)于固定的有限總體,估計(jì)量的期望是對(duì)一切能夠樣本求平均得到的,因此總體中每個(gè)特定的單元 在不同的樣本中出現(xiàn)的次數(shù)。 .證明 性質(zhì)1對(duì)稱性論證法 由于每個(gè)單元出如今總體一切能夠樣本中的次數(shù)一樣,因此 一定是 的倍數(shù),且這個(gè)倍數(shù)就是 , .性質(zhì)2:對(duì)于有限總體的方差定義 :性質(zhì)2:對(duì)于簡(jiǎn)單隨機(jī)抽樣
7、, 的方差式中: 為抽樣比, 為有限總體校正系數(shù)。 .證明性質(zhì)2對(duì)稱論證法: 中的求和是對(duì) 項(xiàng)的, 中的求和是對(duì) 項(xiàng)的.每個(gè)特定單位被選入樣本的概率: =Pi=故其定義為:* 不放回抽樣* 每個(gè)樣本被抽中的概率為* 每個(gè)單位被選入樣本的概率 利用無(wú)限總體實(shí)際. Mean =隨機(jī)變量.證明性質(zhì)2.簡(jiǎn)單隨機(jī)抽樣下,簡(jiǎn)單估計(jì)量估計(jì)精度影響要素: 估計(jì)量的方差 是衡量估計(jì)量精度的度量。影響估計(jì)量方差的要素主要是樣本量n,總體大小N和總體方差 。通常N很大,當(dāng)f0.05時(shí),可將 近似取為1。 總體方差是我們無(wú)法改動(dòng)的;因此,在簡(jiǎn)單隨機(jī)抽樣的條件下,只需經(jīng)過(guò)加大樣本量來(lái)提高估計(jì)量的精度。 . 性質(zhì)3: 的
8、樣本無(wú)偏估計(jì)為: 證明 :.大樣本下,抽樣調(diào)查估計(jì)量漸進(jìn)正態(tài) .【例2.3】我們從某個(gè)=100的總體中抽出一個(gè)大小為=10的簡(jiǎn)單隨機(jī)樣本,要估計(jì)總體平均程度并給出置信度為95%的區(qū)間估計(jì)。序號(hào)1234567891045204661508.由置信度95%對(duì)應(yīng)的 ,因此,可以以95%的把握說(shuō)總體平均程度大約在 之間,即2.4295和7.5705之間。.有放回簡(jiǎn)單隨機(jī)抽樣.二、對(duì)總體總量的估計(jì) .【例2.4】續(xù)例2.3。估計(jì)總體總量,并給出在置信度95%的條件下,估計(jì)的極限相對(duì)誤差。在置信度95%下, 的極限相對(duì)誤差為:.三、對(duì)總體比例的估計(jì) 某一類特征的單元占總體單元數(shù)中的比例P.將總體單元按能否
9、具有這種特征劃分為兩類,設(shè)總體中有個(gè)單元具有A這個(gè)特征,假設(shè)對(duì)每個(gè)單元都定義目的值 .總體方差: .估計(jì)量 性質(zhì)5:對(duì)于簡(jiǎn)單隨機(jī)抽樣, 是 P 的無(wú)偏估計(jì)。 的方差為: .證明. 【例2.5】 某超市新開(kāi)張一段時(shí)間之后,為改良銷售效力環(huán)境,欲調(diào)查附近幾個(gè)小區(qū)居民到該超市購(gòu)物的稱心度,該超市與附近幾個(gè)小區(qū)的居委會(huì)獲得聯(lián)絡(luò),在總體中按簡(jiǎn)單隨機(jī)抽樣抽取了一個(gè)大小為=200人的樣本,調(diào)查發(fā)現(xiàn)對(duì)該超市購(gòu)物環(huán)境表示稱心或根本稱心的居民有130位,要估計(jì)對(duì)該超市購(gòu)物環(huán)境持一定態(tài)度居民的比例,并在置信度95%下,給出估計(jì)的近似置信區(qū)間、極限絕對(duì)誤差。假定這時(shí)的抽樣比可以忽略。.95%近似置信區(qū)間為 58.37
10、%,71.63% .2.3 樣本量確實(shí)定費(fèi)用 總費(fèi)用 固定費(fèi)用 可變費(fèi)用 設(shè)計(jì)費(fèi)分析費(fèi)辦公費(fèi)管理費(fèi)場(chǎng)租費(fèi)等訪問(wèn)員費(fèi)交通費(fèi)禮品費(fèi)費(fèi)等.STEPS所需求的精度找出樣本量與精度之間的關(guān)系估計(jì)所需的數(shù)值,求解 n如超出預(yù)算,調(diào)整精度值重新計(jì)算.精度margin of error對(duì)精度的要求通常以允許最大絕對(duì)誤差絕對(duì)誤差限或允許最大相對(duì)誤差 相對(duì)誤差限來(lái)表示。 .樣本量足夠大時(shí),可用正態(tài)分布近似 變異系數(shù) .Sample Size n0為反復(fù)抽樣條件下的樣本量當(dāng)N很大時(shí), 0, n n0,wr與wor幾乎沒(méi)有區(qū)別。.總體參數(shù)為P的情形. f0.05 .總體方差的估計(jì)根據(jù)預(yù)調(diào)查數(shù)據(jù)或以前文獻(xiàn)資料根據(jù)數(shù)據(jù)的
11、分布粗略估算S,例如全距/4,全距/ 6對(duì)于比例估計(jì),假設(shè)P在0.5附近,可根據(jù)PQ在P=0.5時(shí)到達(dá)極大值來(lái)對(duì)樣本量進(jìn)展計(jì)算 .假設(shè)時(shí)間允許,且總體在時(shí)間上變化不快,調(diào)查可以分為兩步,首先確定一個(gè)可以接受的樣本量,調(diào)查后對(duì)估計(jì)精度進(jìn)展計(jì)算,假設(shè)精度到達(dá)要求,那么不再進(jìn)展下一步,否那么,計(jì)算為到達(dá)精度要求所需的樣本量,再調(diào)查補(bǔ)充樣本經(jīng)過(guò)定性分析 ,最好是對(duì)總體變異系數(shù)進(jìn)展分析并估計(jì),由于變異系數(shù)通常變化不大.樣本量設(shè)計(jì)中的誤區(qū) 1. 估計(jì)精度越高越好嗎? 簡(jiǎn)單隨機(jī)抽樣估計(jì)比例P的樣本量與誤差當(dāng)P=0.5時(shí) 樣本量 誤差d 50 0.14 100 0.10 500 0.045 1000 0.03
12、2 10000 0.0098 對(duì)精度要求的判別非常重要。為得到最小誤差而選擇最大樣本量不是好的選擇。.2. 樣本量與總體規(guī)模N有關(guān)嗎?按照總體比例確定樣本量適宜嗎?例:簡(jiǎn)單隨機(jī)抽樣估計(jì)P,置信度95%,允許誤差5%,在P=0.5條件下 總體規(guī)模N 所需樣本量n 50 44 100 80 500 222 1000 286 5000 370 10000 385 100000 398 1000000 400 10000000 400 .抽樣調(diào)查中的樣本量 由此可知,在精度要求一樣條件下,在北京市進(jìn)展一項(xiàng)調(diào)查和在全國(guó)進(jìn)展一項(xiàng)調(diào)查,樣本量的差別并不大。 總體規(guī)模越大,進(jìn)展抽樣調(diào)查的效率越高。 假設(shè)分類、
13、分區(qū)、分層分別進(jìn)展估計(jì),如何處置? 對(duì)于多工程,如何處置?.其他影響要素1. 所研討問(wèn)標(biāo)題的量的個(gè)數(shù)2. 調(diào)查表的回收率 例如回收率估計(jì)為80%,那么應(yīng)接觸的樣本量為計(jì)算出所需樣本量的1.25倍;3.非抽樣誤差4.資源限制5.有效樣本etc. 定義:簡(jiǎn)單隨機(jī)抽樣的樣本估計(jì)量的方差與復(fù)雜抽樣的樣本估 計(jì) 量的方差的比率。 Deff Var 為復(fù)雜樣本估計(jì)量的方差。2.4 設(shè)計(jì)效果(Design effect, Deff).設(shè)計(jì)效應(yīng)基什L. Kish提出 比較不同抽樣方法的效率. 不放回簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單估計(jì)量的方差 某個(gè)抽樣設(shè)計(jì)在同樣樣本量條件下估計(jì)量的方差。 . Deff的作用: 1評(píng)價(jià)抽樣設(shè)計(jì)的一個(gè)根據(jù), 假設(shè)deff1, 那么抽樣設(shè)計(jì)比簡(jiǎn)單隨機(jī)抽樣的效率低。2計(jì)算樣本量如多階段抽樣的 Deff大約在22.5之間。 n= n(deff) n為簡(jiǎn)單隨機(jī)抽樣所需樣本量。.放回簡(jiǎn)單隨機(jī)抽樣的deff為: 常用于復(fù)雜抽樣樣本量確實(shí)定;在一定精度條件下,簡(jiǎn)單隨機(jī)抽樣所需的樣本量比較容易得到,復(fù)雜抽樣的樣本量為, .2.5 稀有事件的抽樣問(wèn)題假設(shè)估計(jì)的是非常稀有事件的比例,這時(shí)總體比例很小,用極限相對(duì)誤差比極限絕對(duì)誤差更好
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)考版2025屆高考?xì)v史一輪復(fù)習(xí)課后限時(shí)集訓(xùn)二十七20世紀(jì)以來(lái)中國(guó)的重大思想理論成果含解析北師大版
- 2024-2025學(xué)年高中政治第二單元為人民服務(wù)的政府4.1政府的權(quán)力:依法行使作業(yè)含解析新人教版必修2
- 影視版權(quán)采購(gòu)合同范例
- 小程序合同范例
- 原木采購(gòu)合同模板
- 室外廣告合同范例
- 報(bào)勞務(wù)合同范例
- 廣電聘用演員合同范例
- 庫(kù)存紙箱購(gòu)銷合同范例
- 幕墻施工施工合同范例
- 家紡面料未來(lái)發(fā)展趨勢(shì)報(bào)告
- 生物技術(shù)與生物醫(yī)學(xué)
- 專業(yè)知識(shí)的敏捷和迭代
- 2024年酒店業(yè)前景與發(fā)展趨勢(shì)
- 傳染病監(jiān)測(cè)與預(yù)警系統(tǒng)建設(shè)
- 高層建筑火災(zāi)逃生與自救策略
- 學(xué)校食堂消防安全知識(shí)培訓(xùn)
- 企業(yè)職工代表大會(huì)條例
- 總監(jiān)理工程師個(gè)人工作總結(jié)
- DLT1249-2013 架空輸電線路運(yùn)行狀態(tài)評(píng)估技術(shù)導(dǎo)則
- 肛腸科患者的營(yíng)養(yǎng)支持與飲食調(diào)理實(shí)踐
評(píng)論
0/150
提交評(píng)論