抽樣調(diào)查2簡單隨機(jī)抽樣_第1頁
抽樣調(diào)查2簡單隨機(jī)抽樣_第2頁
抽樣調(diào)查2簡單隨機(jī)抽樣_第3頁
抽樣調(diào)查2簡單隨機(jī)抽樣_第4頁
抽樣調(diào)查2簡單隨機(jī)抽樣_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Chap2簡單隨機(jī)抽樣

2.2簡單估計(jì)法(SE)

2.1定義與符號

調(diào)

2.5樣本量的確定

2.6其它相關(guān)問題

2.3比率估計(jì)量

2.4回歸估計(jì)量5/6/20231第一頁,共八十一頁?!?.1定義與符號一、定義與符號

(一)定義上述抽樣就稱為不放回簡單隨機(jī)抽樣

定義2.1:設(shè)有限總體共有N個(gè)單元,一次整批抽取n個(gè)單元使得每個(gè)單元被抽中的概率都相等,任何n個(gè)不同單元的組合(樣本)都有相同的概率被抽中,這種抽樣方法稱為簡單隨機(jī)抽樣法,所抽到的樣本為簡單隨機(jī)樣本。

5/6/20232第二頁,共八十一頁。

定義2.2:(在具體實(shí)施過程中,)從總體中逐個(gè)等概率抽取單元(每次抽取到尚未入樣的任何一個(gè)單元的概率都相等),直到抽滿n個(gè)為止。如果每次抽中一個(gè)單元,然后放回總體,重新抽取。這樣一個(gè)單元有可能被重復(fù)抽中,故又稱重復(fù)抽樣。5/6/20233第三頁,共八十一頁。

定義2.3按照從總體的N個(gè)單元中抽取n個(gè)單元的所有可能不同的組合構(gòu)造所有可能的CNn個(gè)樣本,從CNn個(gè)樣本隨機(jī)抽取一個(gè)樣本,使每個(gè)樣本被抽中的概率都等于1/CNn.上述三中定義其實(shí)是完全等價(jià)的,而定義2.2在實(shí)際中容易實(shí)施。5/6/20234第四頁,共八十一頁。例2.1設(shè)總體有5個(gè)單元(1,2,3,4,5),按有放回簡單隨機(jī)抽樣的方式抽取容量為2的樣本,則所有可能樣本為個(gè),如表2.1。

表2.1放回簡單隨機(jī)抽樣所有可能樣本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,55/6/20235第五頁,共八十一頁。例2.2上述總體按不放回簡單隨機(jī)抽樣方式抽取容量為2的樣本,則所有可能樣本為個(gè),如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2不放回簡單隨機(jī)抽樣所有可能樣本5/6/20236第六頁,共八十一頁。(二)樣本分布與符號從總體抽樣單元。假設(shè)順序被抽中的樣本單元的號碼為(入樣號碼),則樣本為,稱為抽樣比(Samplingfraction)。中逐個(gè)不放回抽取n個(gè)作為隨機(jī)變量樣本有什么分布呢?5/6/20237第七頁,共八十一頁。1y1,…yn同分布但不相互獨(dú)立,其共同分布列為2(yi,yj)的聯(lián)合分布列均同(y1,y2)5/6/20238第八頁,共八十一頁。表2.3符號總體參數(shù)樣本統(tǒng)計(jì)量5/6/20239第九頁,共八十一頁。二、抽樣方法(一)抽簽法

制作N個(gè)外形相同的簽,將它們充分混合,然后一次抽取n個(gè)簽,或一次抽取一個(gè)但不放回,抽取n次得到n個(gè)簽。則這n個(gè)簽上所對應(yīng)號碼表示入樣的單元號。例如:某中學(xué)為了解學(xué)生身體素質(zhì)的基本狀況,從全校N=1200人中抽取一個(gè)簡單樣本n=100人進(jìn)行檢查。5/6/202310第十頁,共八十一頁。1隨機(jī)數(shù)表(二)隨機(jī)數(shù)法如上例,N=1200,則在表中隨機(jī)連續(xù)取四列,順序往下,選出前面100個(gè)不同(不放回抽樣)的0001~1200之間的數(shù)字。如果不夠100個(gè),可隨機(jī)再取四列,同樣操作,直至抽取100個(gè)止。5/6/202311第十一頁,共八十一頁。Simplerandomsampling5/6/202312第十二頁,共八十一頁。Tableofrandomnumbers5/6/202313第十三頁,共八十一頁。2隨機(jī)數(shù)骰子隨機(jī)數(shù)骰子是由均勻材質(zhì)制成的正20面體,每個(gè)面上刻有一個(gè)0~9的數(shù)字,且每個(gè)數(shù)字只出現(xiàn)在兩個(gè)面上。要產(chǎn)生一個(gè)m位數(shù)的隨機(jī)數(shù)(如m=4,N=1200),則將m(m=4)個(gè)顏色不同的骰子盒中,并規(guī)定每個(gè)顏色代表的位數(shù),蓋上蓋子,充分搖動盒子后,打開讀出各色骰子的數(shù)字,即可得一個(gè)隨機(jī)數(shù)。重復(fù)上述過程,直至產(chǎn)生了n個(gè)滿足條件的隨機(jī)數(shù)。5/6/202314第十四頁,共八十一頁。3利用統(tǒng)計(jì)軟件直接抽取法大部分統(tǒng)計(jì)軟件都有產(chǎn)生隨機(jī)數(shù)的功能,快捷方便。不過產(chǎn)生的是偽隨機(jī)數(shù),有一定循環(huán)周期的。簡單介紹一下利用EXCEL產(chǎn)生隨機(jī)數(shù)的方法.

5/6/202315第十五頁,共八十一頁。5/6/202316第十六頁,共八十一頁。5/6/202317第十七頁,共八十一頁。5/6/202318第十八頁,共八十一頁?!?.2簡單估計(jì)法(SE)一、總體均值的估計(jì)(一)簡單估計(jì)定義

………………..(2.6)

(二)簡單估計(jì)量的性質(zhì)引理2.1從大小為N的總體中抽取一個(gè)樣本容量為n的簡單隨機(jī)樣本,則總體中每個(gè)特定的單元入樣的概率為n/N,兩個(gè)特定單元入樣的概率為n(n-1)/N(N-1)。

5/6/202319第十九頁,共八十一頁。

引理2.2從大小為N的總體中抽取一個(gè)樣本容量為n的簡單隨機(jī)樣本。若令:則:5/6/202320第二十頁,共八十一頁。(二)簡單估計(jì)量的性質(zhì)

定理2.1上述簡單估計(jì)是無偏的,即

定理2.2上述簡單估計(jì)的方差(均方誤差)為:……….(2.12/2.18)

5/6/202321第二十一頁,共八十一頁。證明(P35證法1對稱證法):為0注意樣本分布5/6/202322第二十二頁,共八十一頁。推論2.7的無偏估計(jì)為………..(2.25)

證明:只須說明樣本方差是總體方差的無偏估計(jì)即可。注意5/6/202323第二十三頁,共八十一頁。

例2.3從某個(gè)N=100的總體重抽取一個(gè)容量n=10的簡單隨機(jī)樣本,要估計(jì)總體平均水平,并給出置信度為95%的置信區(qū)間估計(jì)。如表2.4序號1234567891045204661508表2.4簡單隨機(jī)樣本指標(biāo)

5/6/202324第二十四頁,共八十一頁。5/6/202325第二十五頁,共八十一頁。(三)有放回簡單隨機(jī)抽樣的簡單估計(jì)量由于故有放回抽樣的精度低于不放回抽樣的精度。5/6/202326第二十六頁,共八十一頁。說明:1抽樣調(diào)查中的估計(jì)量與傳統(tǒng)數(shù)理統(tǒng)計(jì)中估計(jì)量的區(qū)別(見表2.5)表2.5抽樣理論與傳統(tǒng)數(shù)理統(tǒng)計(jì)關(guān)于樣本均值性質(zhì)異同比較抽樣理論數(shù)理統(tǒng)計(jì)理論假設(shè)樣本之間不獨(dú)立,所以可能樣本最多個(gè),欲估計(jì)總體特征為,當(dāng)n=N時(shí)可以求出樣本之間獨(dú)立,所有可能樣本最多為無限多個(gè);欲估計(jì)總體特征為總體(一般是隨機(jī)變量X)期望μ,一般不能通過樣本求出符號、定義期望方差5/6/202327第二十七頁,共八十一頁。2總體方差一般也是未知的,故計(jì)算估計(jì)量方差(估計(jì))值時(shí)總是用樣本方差直接去估計(jì)它,因?yàn)樵摴烙?jì)無偏,故這樣做相對是合理的。3

對于無限總體的簡單隨機(jī)抽樣(或有限總體有放回簡單抽樣)估計(jì)中由于N一般很大,

即從有限總體抽樣得到簡單隨機(jī)樣本均值得方差是從無限總體抽樣得的獨(dú)立樣本均值的方差的1-f倍,要小些,這意味著對同等樣本量,不放回簡單隨機(jī)抽樣的精度高于有放回的。由于樣本點(diǎn)不會重復(fù),樣本量相同時(shí)所包含的有效樣本點(diǎn)更多,因此信息更多,效果當(dāng)然好些。1-f又被稱為有限總體校正系數(shù)。5/6/202328第二十八頁,共八十一頁。4樣本容量n越大,估計(jì)量方差越小。當(dāng)樣本容量一定時(shí),總體方差越大,估計(jì)量方差越大。由于總體方差是固定的,因此在簡單隨機(jī)抽樣的條件下,要提高估計(jì)量精度就只有增加樣本容量了。但增加樣本容量也會帶來計(jì)算量驟增和成本增加,所以是矛盾的一對,需要找到合適的平衡點(diǎn)。5/6/202329第二十九頁,共八十一頁。二、總體總量的估計(jì)(一)簡單估計(jì)量…………….(2.7)(二)估計(jì)量性質(zhì)推論2.12.42.8

……….(2.13)…………….(2.19)…………….(2.26)5/6/202330第三十頁,共八十一頁。例2.4(續(xù)例2.3)估計(jì)總體總量,并給出置信度為95%條件下的估計(jì)相對誤差

。三、總體比例的估計(jì)將總體分為兩類,一類具有該特征的單元A個(gè),另一類不具有該特征的單元N-A個(gè)。調(diào)查的目的是估計(jì)或A

若令則5/6/202331第三十一頁,共八十一頁。(一)估計(jì)量的定義(二)估計(jì)量性質(zhì)推論2.22.52.9對于簡單隨機(jī)抽樣,p是P無偏估計(jì)。p的方差為

方差的無偏估計(jì)……(2.27)……(2.20)5/6/202332第三十二頁,共八十一頁。例2.5某超市開張一段時(shí)間后,為改進(jìn)銷售服務(wù)環(huán)境,欲調(diào)查附近幾個(gè)小區(qū)居民到該超市購物的滿意度。該超市與附近一個(gè)小區(qū)的居委會取得聯(lián)系,在總體中按簡單隨機(jī)抽樣抽取了一個(gè)大小為n=200人的樣本。調(diào)查發(fā)現(xiàn)對購物表示滿意或基本滿意的居民有130人,估計(jì)對該超市購物環(huán)境持肯定態(tài)度的居民的比例,并在置信度95%條件下,給出估計(jì)的絕對誤差和置信區(qū)間,假設(shè)抽樣比可以忽略。5/6/202333第三十三頁,共八十一頁。(2)樣本協(xié)方差是總體協(xié)方差的無偏估計(jì).

(2.22,2.23)(2.29)考慮二維總體5/6/202334第三十四頁,共八十一頁。證明:仍采用對稱法(P40證法1)(1)注意樣本分布注意為05/6/202335第三十五頁,共八十一頁。(1)證法2:(構(gòu)造性)展開5/6/202336第三十六頁,共八十一頁。(2)注意由(1)5/6/202337第三十七頁,共八十一頁。一、概念與作用(一)概念比率(Ratio)與比例(Proportion)區(qū)別(二)作用§2.3比率估計(jì)量及其性質(zhì)一種場合是待估的總體參數(shù)R是兩個(gè)變量比值。如人口密度,恩格爾系數(shù)等。

分子分母均為r.v.分子為r.v.5/6/202338第三十八頁,共八十一頁。另一種應(yīng)用場合,雖然待估的參數(shù)是某個(gè)研究變量的均值或總體總量,它本來可以通過樣本均值加以估計(jì),但是為了提高估計(jì)的效率,它通過引進(jìn)一個(gè)輔助變量xi,來計(jì)算比率,即再通過這一比率乘以總體已知的輔助變量均值或總量來達(dá)到估計(jì)的目的。5/6/202339第三十九頁,共八十一頁。二、應(yīng)用條件(1)輔助變量(auxiliaryvariable)資料易得或已知(2)輔助變量與目標(biāo)變量之間存在高度相關(guān)性且相關(guān)性穩(wěn)定。(3)樣本量一般要求比較大三、簡單隨機(jī)抽樣下的比率估計(jì)5/6/202340第四十頁,共八十一頁。(一)定義

比率估計(jì)量(ratioestimator)又稱比估計(jì)。(2.30)(2.31)5/6/202341第四十一頁,共八十一頁。(二)比率估計(jì)的性質(zhì)引理2.3定理2.6推論2.115/6/202342第四十二頁,共八十一頁。引理2.4證:當(dāng)n充分大時(shí)5/6/202343第四十三頁,共八十一頁。定理2.7推論2.125/6/202344第四十四頁,共八十一頁。因而方差估計(jì)有兩種思路…(2.39)…(2.40)5/6/202345第四十五頁,共八十一頁。例2.6i123456均值XiYi011331151882910464.518表4.1假設(shè)的總體數(shù)據(jù)5/6/202346第四十六頁,共八十一頁。解:i樣本簡單估計(jì)比率估計(jì)123456789101112131415均值1,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.7517.686445/6/202347第四十七頁,共八十一頁。5/6/202348第四十八頁,共八十一頁。解5/6/202349第四十九頁,共八十一頁。例2.7(P51例2.4)

在二十世紀(jì)90年代初的一項(xiàng)工資研究中,人們發(fā)現(xiàn)IT行業(yè)中,從業(yè)者的現(xiàn)薪與起薪之間相關(guān)系數(shù)ρ高達(dá)0.88,已知某IT企業(yè)474名員工的評鑒起薪為17016.00元/年,現(xiàn)根據(jù)對100個(gè)按簡單隨機(jī)抽樣方式選出的員工現(xiàn)薪的調(diào)查結(jié)果,估計(jì)該企業(yè)員工的現(xiàn)薪平均水平。數(shù)據(jù)如下:,,5/6/202350第五十頁,共八十一頁。解:簡單估計(jì)95%的置信區(qū)間比率估計(jì)95%的置信區(qū)間5/6/202351第五十一頁,共八十一頁。例2.8某縣在對船舶月完成的貨運(yùn)量進(jìn)行調(diào)查,對運(yùn)管部門登記的船舶臺帳進(jìn)行整理后獲得注冊船舶2860艘,載重噸位154626噸。從2860艘船舶中抽取一個(gè)n=10的簡單隨機(jī)樣本。調(diào)查得到樣本船舶月完成的貨運(yùn)量及其載重噸位如表4.2(單位:噸)要估計(jì)該縣船舶月完成貨運(yùn)量1234578015001005376600100505010206789102170182314501581370120150802050表4.2樣本船舶貨運(yùn)量及載重噸位數(shù)據(jù)5/6/202352第五十二頁,共八十一頁。解5/6/202353第五十三頁,共八十一頁。5/6/202354第五十四頁,共八十一頁。

(三)消除比率估計(jì)偏倚的方法5/6/202355第五十五頁,共八十一頁。

哈特利-羅斯(Hartley-Ross,1954)提出的估計(jì)量(2.51)于是可以令5/6/202356第五十六頁,共八十一頁。事實(shí)上:5/6/202357第五十七頁,共八十一頁。例2.9

5/6/202358第五十八頁,共八十一頁。四、比率估計(jì)的效率≈1/25/6/202359第五十九頁,共八十一頁?!?.4回歸估計(jì)量及其性質(zhì)比率估計(jì)成為最優(yōu)線性估計(jì)的條件:(1)樣本點(diǎn)(yi,xi)形成過原點(diǎn)的直線(2)yi對直線的偏差與xi成比例5/6/202360第六十頁,共八十一頁。一、回歸估計(jì)的定義二、β是已知常數(shù)時(shí)(記為β0)

定理2.8

5/6/202361第六十一頁,共八十一頁。Q:“β0取何值時(shí),回歸估計(jì)量的精度最高,即最?。俊倍ɡ?.9:三、由樣本回歸系數(shù)計(jì)算得到

(2.56Y對X回歸系數(shù))定理2.10這時(shí)的均值估計(jì)量是漸近無偏估計(jì)注意b并不是B的無偏估計(jì)5/6/202362第六十二頁,共八十一頁。定理2.11

它的一個(gè)近似估計(jì)為:5/6/202363第六十三頁,共八十一頁。例2.10續(xù)例2.85/6/202364第六十四頁,共八十一頁。四、精度比較1回歸估計(jì)總優(yōu)于簡單估計(jì),除非ρ=0

2比率估計(jì)優(yōu)于簡單估計(jì)的條件

3回歸估計(jì)優(yōu)于比率估計(jì)的條件是五、多變量回歸估計(jì)(略)5/6/202365第六十五頁,共八十一頁。§2.5樣本量的確定一、總體均值情形1給定標(biāo)準(zhǔn)誤差上限,求滿足條件的最小n

5/6/202366第六十六頁,共八十一頁。

2給定絕對誤差上限及信度,求滿足條件的最小n有放回,不放回3給定相對誤差上限及信度,求滿足條件的最小n有放回不放回5/6/202367第六十七頁,共八十一頁。4給定相對標(biāo)準(zhǔn)誤差上限γ,求滿足條件

的最小n.放回不放回例2.6在例2.3中,如果要求以95%的把握保證相對誤差不超過10%,樣本量應(yīng)該取多少?5/6/202368第六十八頁,共八十一頁。5/6/202369第六十九頁,共八十一頁。二、總體總量情形作業(yè)考慮各種情行的公式例欲估計(jì)一個(gè)農(nóng)村的每月平均副業(yè)收入,已知該村共有1000戶農(nóng)戶,月副業(yè)收入的標(biāo)準(zhǔn)差不超過300元。(1)現(xiàn)要求置信度為95%,估計(jì)每戶月副業(yè)收入的誤差不超過50元,應(yīng)抽取多少戶作為樣本?(2)若每戶調(diào)查費(fèi)用為15元,調(diào)查管理費(fèi)用為800元,該項(xiàng)調(diào)查預(yù)計(jì)費(fèi)用是多少?5/6/202370第七十頁,共八十一頁。例如果上例目的是要估計(jì)全村1000戶一月的副業(yè)總收入,允許總量的誤差為40000,置信度為95%,應(yīng)抽取多少樣本?

三、總體參數(shù)P的情形四、總體參數(shù)的預(yù)先估計(jì)5/6/202371第七十一頁,共八十一頁。(1)根據(jù)以往的經(jīng)驗(yàn)數(shù)據(jù)例如對同類問題獲得過一個(gè)樣本量n0為的簡單隨機(jī)樣本,并且已知在一定置信度下(比如95%),該調(diào)查對總體均值(或總量)估計(jì)的相對誤差上限為r0,則在相同的置信度下,如果希望本次調(diào)查的相對誤差上限為r,則在抽樣比可以忽略的情況下,可以近似地計(jì)算出本次調(diào)查所需的樣本量:作業(yè)證明上述結(jié)論5/6/202372第七十二頁,共八十一頁。(2)在正式調(diào)查前進(jìn)行試點(diǎn)調(diào)查,根據(jù)試點(diǎn)調(diào)查的結(jié)果作出估計(jì),或者采用兩步抽樣(3)沒有同類調(diào)查經(jīng)驗(yàn),又不能進(jìn)行預(yù)調(diào)查,則只能通過有經(jīng)驗(yàn)的專家作一些定性分析,對總體變異系數(shù)C(比較穩(wěn)定)作出估計(jì)。

(4)注意:針對總體參數(shù)為P時(shí)情形

當(dāng)估計(jì)P<0.5,則選取較大的P,如若估計(jì)P為[0.3,0.4]則選取P為0.4當(dāng)估計(jì)P>0.5,則選取較小的P,如若估計(jì)P為[0.6,0.8]則選取P為0.6若對P一無所知則取P=0.5。5/6/202373第七十三頁,共八十一頁。例2.7某銷售公司希望了解全部3000家客戶對公司的滿意度,決定用電話調(diào)查一個(gè)簡單隨機(jī)樣本。這時(shí)銷售公司希望以95%的把握保證客戶滿意度比例P在樣本比例[p-10%,p+10%]范圍內(nèi),但對總體比例P無法給出一個(gè)大致范圍。這時(shí)調(diào)查多少個(gè)客戶,才能保證滿足要求?5/6/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論