抽樣調查-簡單隨機抽樣培訓課件(共95頁).ppt_第1頁
抽樣調查-簡單隨機抽樣培訓課件(共95頁).ppt_第2頁
抽樣調查-簡單隨機抽樣培訓課件(共95頁).ppt_第3頁
抽樣調查-簡單隨機抽樣培訓課件(共95頁).ppt_第4頁
抽樣調查-簡單隨機抽樣培訓課件(共95頁).ppt_第5頁
已閱讀5頁,還剩90頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、返回2.1 2.1 定義與符號定義與符號 一、定義簡單隨機抽樣:從含有N個單元的總體中隨機 抽取n個單元組成樣本。1.若抽樣是放回的,則所有可能的樣本有nN個,每個樣本被抽中的概率為 ,這種抽樣方法稱為放回簡單隨機抽樣。nN1nNC2.若抽樣是不放回的,則所有可能的樣本有個,每個樣本被抽中的概率為nNC1,這種抽樣方法稱為不放回簡單隨機抽樣。返回1.1.簡單隨機抽樣是等概抽樣簡單隨機抽樣是等概抽樣, ,即每個總體單元即每個總體單元都有相同的入樣概率都有相同的入樣概率; ;2.2.隨機抽取是有嚴格要求的隨機抽取是有嚴格要求的, ,不是隨便抽取,不是隨便抽取,必須按照某一隨機原則進行。必須按照某一

2、隨機原則進行。注意注意返回【例 2.1】設總體有5個單元(1,2,3,4,5),按放回簡單隨機抽樣的方式抽2個單元,則所有可能的樣本為2552個(考慮樣本單元的順序)1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,5(放回簡單隨機抽樣所有可能的樣本)返回【例 2.2】設總體有5個單元(1,2,3,4,5),按不放回簡單隨機抽樣的方式抽2個單元,則所有可1,21,31,41,52,32,42,53,43,54,5(不放回簡單隨機抽樣所有可能的樣本)能的樣本為個。10nNC在實際工作中,更多地采用不

3、放回簡單隨機抽樣,所以在實際工作中,更多地采用不放回簡單隨機抽樣,所以以下討論的簡單隨機抽樣一般都指不放回簡單隨機抽樣以下討論的簡單隨機抽樣一般都指不放回簡單隨機抽樣.返回二、符號大寫字母表示總體單元的標志值:如小寫字母表示樣本單元的標志值:如NYYY,21nyyy,21調查的總體目標量主要有:總體總量 Y;總體均值 Y;總體某一指標的比例 P;兩個總體總量的比率 R。對估計精度進行計算時,要涉及到總體方差和樣本方差等。下面分別列出:返回總體方差樣本方差NiiYYNS122)(11niiyyns122)(11還有一些其他符號,分別說明如下:返回總 體NNiiYYYYY211NYYYYNYNNi

4、i2111NiiYNNAP11(10或iY)XYXYXYRNiiNii11,NiiYYNS122)(1121NN樣 本將左邊式子中將左邊式子中的大寫字母改的大寫字母改為小寫字母為小寫字母。返回總體指標值上面帶符號“”的表示由樣本得到的總體指標的估計。如RPYY,稱為RPYY,的估計。估計量的方差用V表示,如);(YV標準差用S表示,如).()(YVYS對)(YV的樣本估計不用)(YV而用)(Yv.)()()(表示的估計用YvYsYS稱Nn為抽樣比,記為f.返回2.2 簡單估計量及其性質 無論調查對象是何種總體參數(shù),其實所有估計無論調查對象是何種總體參數(shù),其實所有估計量通常都是樣本均值的某種線性

5、組合,因此在抽樣量通常都是樣本均值的某種線性組合,因此在抽樣中不管討論何種估計的基本性質,都只圍繞樣本均中不管討論何種估計的基本性質,都只圍繞樣本均值進行。而對樣本均值這個核心估計量的研究則分值進行。而對樣本均值這個核心估計量的研究則分為兩個方面:為兩個方面:一方面是求樣本均值對所有可能樣本的數(shù)學期望一方面是求樣本均值對所有可能樣本的數(shù)學期望 (檢驗估計量是否無偏)。(檢驗估計量是否無偏)。另一方面是求樣本均值對所有可能樣本的方差另一方面是求樣本均值對所有可能樣本的方差 (檢驗估計量誤差的大?。?。(檢驗估計量誤差的大?。7祷?為了討論簡單估計的性質,首先我們來看兩為了討論簡單估計的性質,首先

6、我們來看兩個引理:個引理: 引理一 從大小為從大小為N的總體中抽取一個樣本量的總體中抽取一個樣本量為為n的簡單隨機樣本,則總體中每個特定單元的的簡單隨機樣本,則總體中每個特定單元的入樣概率為:入樣概率為:兩個特定單元都入樣的概率為:兩個特定單元都入樣的概率為:Nn1122NnNnCCnNnN返回NnCCnNnN/112222nNCCjY) 1() 1(/2222NNnnCCCnNnNnNCnNCiY引理一引理一的證明:在的證明:在N N個單元中取個單元中取n n個單元為樣本,個單元為樣本,共有共有 個樣本。在個樣本。在 個樣本中,包含某個樣本中,包含某個特定單元個特定單元 的樣本數(shù)為:的樣本數(shù)

7、為: 每個樣本被每個樣本被抽中的概率為:抽中的概率為: 。 1111nNCCiY同時包含兩個特定單元同時包含兩個特定單元 的樣本數(shù)為的樣本數(shù)為 每個樣本被抽中的概率為每個樣本被抽中的概率為:返回 引理二 從總體規(guī)模為從總體規(guī)模為N N的總體中抽取一個樣的總體中抽取一個樣本量為本量為n的簡單隨機樣本。若對總體中的每個單的簡單隨機樣本。若對總體中的每個單元元 ,引進隨機變量,引進隨機變量 如下:如下:iYia), 2 , 10, 1NiYYaiii不入樣(,若入樣若由二項分布可知:由二項分布可知:返回1) 1() 1() 1()()()(),cov()1 ()1 ()0()1 ()()() 1()

8、 1() 1() 1(1 (0) 1() 1(1)()1 (01)(2222NfffNNnnaEaEaaEaaffNnfNnfaEaEaVNNnnNNnnNNnnaaEfNnNnaEjijijiiiijii) 1() 1(10,) 1() 1(110,1NNnnaaPNNnnaaPNnaPNnaPjijiii所以,不難推出:所以,不難推出:返回簡單估計量的性質 u YyE)(是性質1Y的無偏估計,即y 下面我們用兩種與數(shù)理統(tǒng)計中不同的方法下面我們用兩種與數(shù)理統(tǒng)計中不同的方法來證明這一性質。來證明這一性質。思考思考:為什么不能用數(shù)理為什么不能用數(shù)理統(tǒng)計中常用的方法?統(tǒng)計中常用的方法?返回有了這些

9、準備,我們很容易證明YyE)(YYNnnNnYnaEYnyEYanynyNiiNiiiNiiNiiinii111111)(1)(1)(11根據(jù)前面提到的關于根據(jù)前面提到的關于 的定義,有下式的定義,有下式ia返回 第二種方法證明 u YyE)(證明:對于一個大小為N的總體,樣本量為n的簡單隨機樣本有nNC個,因此返回NiiNnNnNnNnNiiCiinNnCinNYYNYCYCYCnnCYYYnCyyynCyEnnNnN11121111112111)(1)(1)(11)(21返回其他幾個估計量的無偏性可容易推出:其他幾個估計量的無偏性可容易推出:1、對于總體總量YYNyNEYEyNY)()(,

10、2、對于總體比例PpEPEpP)()(,返回y性質2對于簡單隨機抽樣, 的方差為:式中,n為樣本量;f=Nn為抽樣比;1-f為有限總體校正系數(shù)。V(y)=221SnfSNnnN(2.5)返回證明方法一證明方法一)1()1(1)(1111)(112)1(11)1(2)1(1),cov(2)(111)(2112211212212212211NiiNiiNiiNiiNjijiNiijNjiiNiijijNjiiiNiiNiiiniiYNNYNnfYNYNNnNfYYNYfNnnNfNnYYfNnYnaaYYaVYnYanVynVyV返回)1()()1(1)()1(1)1(1221122212fnSY

11、YNnfYYNnfYNYNnfNiiNiiNii即21)(SnfyV返回 證明方法二:由定義212212)(1)1()()(YyEnYynEYyEyVniinii)(1)(12212YyYyEnYyEnjjiinii2121)()(YYNnYyEniinii而 )() 1() 1()(YYYYNNnnYyYyEjjiijjii 返回 因此有)(1)(1)(2212YyYyEnYyEnyVjjiinii)() 1() 1(1)(12212YYYYNNnnnYYNnnjjiinii)() 1() 1(1)(1221YYYYNnnYYnNjjiiNii)(11)(112121YYNnYYNnNiiN

12、ii返回NiNiiiYYNnYYNnnN1122)(11)()111 (121)(11YYNnNnNNii221)(111SnNnNYYNNnNnNii 21)(SnfyV即返回性質3 V(y)的無偏估計為:21snf2s式中,為樣本方差。)(yv212)(11yynsnii)()(11221YynYynnii證明:將 改寫成:2s返回由前面性質1證明用過的對稱論證法有:由性質2有:22121) 1()()(SNNnYYNnYyENiinii2221)(SnNnNSnfYyE返回)()(11)(2212YynEYyEnsEnii)1(1122SnNnNnSNNnn22)()1()1(SnNNn

13、nNS返回下面我們從關系式21)(SnfyV可以推出其他幾個估計量的方差)1 (111)()(1)()()(222PNPnnfpVPVSnfNyVNyNVYV返回 總體總量的估計量方差是總體均值方差的直接總體總量的估計量方差是總體均值方差的直接推導,下面我們來推導總體比例估計量的方差。推導,下面我們來推導總體比例估計量的方差。即可。(只需證明此時)111)1 (111)(2PNPNSPNPNnfPV返回 設設N N個樣本單元中有個樣本單元中有N1N1個具有某一特個具有某一特性性, ,即有即有N1N1個單元取值為個單元取值為1,1,有有N-N1N-N1個單元個單元取值為取值為0.0.)()1 (

14、112112112NNNNNNNNSNNNNNNNNNNNN11111)(11)1 (11PNPN返回同理對樣本方差有)1 (11pnpns)1 (111)(PNPNnfPV因此返回)1 (11)1 (111)()(1)()(22ppnfpnpnnfpvPvsnfNyNvYv同樣下面我們從關系式21)(snfyv可以推出返回估計量的方差是衡量估計量精度的度量。)(yV 從式可以看出,影響估計量方差的因素有:21)(SnfyV樣本量n; 總體未入樣比率1-f;2S 總體方差分析見教材P38,39返回 N N通常很大,當通常很大,當f0.05f0.05時,可將時,可將1-1-f f近似取為近似取為

15、1 1,這時影響估計量方差的,這時影響估計量方差的主要因素是樣本量主要因素是樣本量n n和總體方差和總體方差 。 的大小是我們無法改變的,因此,要的大小是我們無法改變的,因此,要提高估計量的精度就只有加大樣本量。提高估計量的精度就只有加大樣本量。2S2S注 意返回【例2.3】我們從某個N=100的總體中抽出一個大小為n=10的簡單隨機樣本,要估計總體平均水平并給出置信度95%的置信區(qū)間。序號i1 2 3 4 5 6 7 8 9 104 5 2 0 4 6 6 15 0 8iy解:依題意,N=100,n=10,f=1 . 010010樣本均值為:5105011niiyny返回樣本方差為:111.

16、199172)(11212yynsnii因此,總體平均值的估計為:5yYy的方差為:y的方標準差為:s.3115. 1)()(YvY的置信度95%的置信區(qū)間為:)(.2YszyY即 2.4295,7.5705.72. 1111.19101 . 0112snf)(Yv返回niiyny11,的無偏估計是Yy。其方差為:V(22111)nsnNNy的無偏估計為)(yV21)(snyvu 放回簡單隨機抽樣簡單估計量返回 注意:不放回時的方差為放回時的約1-f倍,而1-f1,因此不放回抽樣的估計精度比放回抽樣的估計精度高。返回【例2.4】我們從某個N=100的總體中抽出一個大小為n=10的簡單隨機樣本,

17、要估計總體總量并給出在置信度95%的條件下,估計量的相對誤差。序號i1 2 3 4 5 6 7 8 9 104 5 2 0 4 6 6 15 0 8iY解 依題意,N=100,由例2.3可知:1111.19, 52sy,因此,對總體總量的估計為:Y=1005=500 。返回對V(Y)的樣本估計為:17201111.19101 . 01100)(2Yv0其標準差為:1488.131)()(Yvys因此,在置信度95%的條件下(對應的t=1.96),Y的相對誤差為:5141. 05001488.13196. 1)(YYst=51.41%返回【例2.5】解:已知 n=200, a=130, 1-f1

18、%65200130nap 某超市開張一段時間之后,為改進銷售服務環(huán)境,欲調查附近幾個小區(qū)居民到該超市購物的滿意度。該超市與附近幾個小區(qū)居委會取得聯(lián)系,在整體中按簡單隨機機樣,抽取了一個大小為n=200人的樣本。調查發(fā)現(xiàn)對該超市購物環(huán)境表示滿意或基本滿意的居民有130位,要估計對該超市購物環(huán)境持肯定態(tài)度居民的比例,并在置信度95%條件下,給出估計的絕對誤差和置信區(qū)間。假定這時的抽樣比可以忽略。返回在置信度95%的條件下,估計的絕對誤差為:%63. 60338. 096. 1)(pstp的95%置信區(qū)間為: 0.650338. 096. 10338. 0)()(pvps001143. 011)(p

19、qnfpv返回2.3 比率估計量及其性質 用樣本均值作為總體均值的簡單估計量,具有用樣本均值作為總體均值的簡單估計量,具有無偏等很多優(yōu)良性質,且完全不依賴其它總體信息。無偏等很多優(yōu)良性質,且完全不依賴其它總體信息。但是,若我們有與調查變量相關的其它信息(通常但是,若我們有與調查變量相關的其它信息(通常稱為輔助變量信息)可以利用,則估計的精度可以稱為輔助變量信息)可以利用,則估計的精度可以大大提高。這就是我們下面要講的比率估計和回歸大大提高。這就是我們下面要講的比率估計和回歸估計。估計。一、估計的概念返回設設 主要變量為:主要變量為:Y Y 輔助變量為:輔助變量為:X X 兩變量的比率為:兩變量

20、的比率為:XYXYR總體均值的比估計:總體均值的比估計:XRyYRR其中其中xyrR返回二、比率估計的特點及注意事項1 1、使用比估計首先要知道輔助變量的總體均值、使用比估計首先要知道輔助變量的總體均值(或總體總量),調查時,既要觀測主要變量的(或總體總量),調查時,既要觀測主要變量的值還要觀測輔助變量的值;值還要觀測輔助變量的值;2 2、輔助變量必須與主要變量高度相關且整體上、輔助變量必須與主要變量高度相關且整體上應相當穩(wěn)定;應相當穩(wěn)定;3 3、比估計雖然不是無偏的,但其精度要高于簡、比估計雖然不是無偏的,但其精度要高于簡單估計量很多。單估計量很多。下面我們看一個下面我們看一個簡單估計簡單估

21、計與與比估計比估計對比的例題對比的例題返回【例】對以下假設的總體(N=6),用簡單隨機抽樣抽取 n=2 的樣本,比較簡單隨機抽樣比率估計及簡單估計的性質。i123456均值XiYi011331151882910464.518解: 對這個總體,我們列出所有可能的1526C個樣本,以比較簡單估計與比率估計的性質。返回 i 樣本簡單估計( )比率估計( )1234567891011121314151,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518

22、1817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.75yRy返回由此,可以算出:18155 .3762151)(151iiyyE86667.97)(151)(1512iiyEyyV68644.171575.181818151)(151iRiRyyE31356. 01868644.17)()(YyEyBRR151282345. 2)(151)(iRRiRyEyyV92177. 2)31356. 0(82345. 2)()()(22RRRyByVyMSE返回總結1 1、從計算表格中可以看出,均值的比估計很穩(wěn)

23、定,、從計算表格中可以看出,均值的比估計很穩(wěn)定,而均值的簡單估計則波動劇烈。而均值的簡單估計則波動劇烈。2 2、雖然比率估計是有偏估計,但偏倚不大,而估計、雖然比率估計是有偏估計,但偏倚不大,而估計量方差要比簡單估計的方差小得多。量方差要比簡單估計的方差小得多。3 3、比估計是一種很好的估計量,是提高估計精度的、比估計是一種很好的估計量,是提高估計精度的最有效的途徑。最有效的途徑。4 4、思考思考:比估計為什么能大幅度地提高估計精度?比估計為什么能大幅度地提高估計精度?返回對于簡單隨機抽樣對于簡單隨機抽樣, n, n較大時較大時, ,比率估計具有以下性質:比率估計具有以下性質:2122121)

24、(111)()(111)()(1111)()()()()()(iNiiRiNiiRiNiiRRRXYNnfNYVRXYNnfyVRXYNnfXrVRVYYNRXNYEYRXyERrERE返回關于比率估計我們要說明(或證明)以下幾個問題:1 1、均值的比率估計不是無偏的;、均值的比率估計不是無偏的;2 2、偏倚是怎么產生的;、偏倚是怎么產生的;3 3、均值比率估計的均方誤差;、均值比率估計的均方誤差;4 4、均方誤差的估計。、均方誤差的估計。返回第一個問題可從上面的例題給予說明:31356. 0)()(68644.17)(,18YyEyByEYRRR第二個問題我們可以從下面的表達式說明:XRXx

25、yyR這里這里 是常量,是常量, 是隨機變量。估計量不是是隨機變量。估計量不是隨機變量的線性函數(shù)。因此,估計量的偏倚是由隨機變量的線性函數(shù)。因此,估計量的偏倚是由R R的有偏性造成的的有偏性造成的. .Xxy,返回第三個問題,我們來證明R估計的偏倚)1 (1)(1 1)1 (1)(1121XXxXXXxXXxXXXxXXxXxxxRyRxyRR,其中返回因此0)()()1 (2XRYxRyEXXxxRyXxRyXXxXxRyRR由于因而偏倚主要來自于等式右邊的第二項,由xyyxSSnfSnfXxYyEXxyE11)()(221)()(xSnfXxEXxxE返回因此,偏倚的主要項為:因此,偏倚的

26、主要項為:)(1)()(1)(2xyxSSRSXnfXxxREXxyEXRRE同樣我們可以推出:同樣我們可以推出:212)(1111)()(iNiiRXYNnfXrVRV)2(12222yxxyRSSRSXnf返回21)(111)(iNiiRRXYNnfyV)2(1222yxxyRSSRSnf212)(111)(iNiiRRXYNnfNYV)2()1 (2222yxxyRSSRSnfN返回對上述方差分別給出樣本估計式如下:對上述方差分別給出樣本估計式如下:)2(1)(2222yxxyrssrsXnfRv)2(1)()(2222yxxyRrssrsnfRvXyv)2(1)()(222222yxx

27、yRrssrsnfNRvXNYv返回【例2.2】某縣在對船舶調查月完成的貨運量進行調查時,對運管部門登記的船舶臺帳進行整理后獲得注冊船舶2860艘,載重噸位154626噸。從2860艘船舶中抽取一個n=10的簡單隨機樣本,調查得到樣本船舶調查月完成的貨運量及其載重噸位如表(單位:噸),要推算該縣船舶調查月完成的貨運量。返回 i i1234578015001005376600100505010206789102170182314501581370120150802050iyiyixix解:已知:N=2860, n=10, X=154626 由表可得, 2 .1123101101iiyy65101

28、101iixx1012207.421179)(1101iiyyys返回1012211.2161)(1101iixxxs101222.23382)( )(1101iiiyxyyxxs因此,對該縣船舶在調查月完成貨運量的比率估計為:2671937154626652 .1123XxyYR方差的估計為:)2()1 ()(2222yxxyRsRsRsnfNYv=2.106171110返回RY標準差的估計為:458930)()(RRYvYs如果用簡單估計對貨運量進行估計,則,3212352yNY11221043303. 3)1 ()(ysnfNYv585921)()(YvYs由此,得到比率估計量設計效應為

29、:6135. 0)()(YvYvdeffR對于本問題對于本問題, ,比率估計量比率估計量比簡單估計量的效率高比簡單估計量的效率高! !返回【例2.3】在一項工資研究中,人們發(fā)現(xiàn)IT行業(yè)中,從業(yè)者的現(xiàn)薪與起薪之間相關系數(shù)高達0.88,已知某IT企業(yè)474名員工的平均起薪為17016.00元/年,現(xiàn)根據(jù)對100個按簡單隨機抽樣方式選出的員工現(xiàn)薪的調查結果,估計該企業(yè)員工的現(xiàn)薪平均水平。已知:. 9 .102802243,2014300,23.453189043, 6 .18642, 5 .3848222xxyysssxy返回【解】1、在簡單估計條件下,4 .357579523.4531890431

30、00474/10011)(5 .384822snfyvyY的95%的近似置信區(qū)間為:Y8 .42188,18.34776)(),(2/2/yvzyyvzy此處教材有誤此處教材有誤(P51)返回064. 26 .186425 .38482xyR2、在比率估計條件下,44.470564)2(1)(8 .3512417016064. 2222xyxyRRsRsRsnfyvXRy的95%的近似置信區(qū)間為:Y35.36469,32.33780)(),(2/2/RRRRyvzyyvzy返回下面我們從理論上來比較簡單估計與比率估計的誤差下面我們從理論上來比較簡單估計與比率估計的誤差)2(1)(1)(2222

31、xxyyRySRSSRSnfyVSnfyV比率估計量精度高于簡單估計量的充要條件是:比率估計量精度高于簡單估計量的充要條件是:yxyxxyxyxxyyRCCSRSSSRSRSnfSRSSRSnfyVyV2120201)2(10)()(222222返回也就是說,時,當yxyxCCSRS212比率估計比簡單估計更為精確。比率估計比簡單估計更為精確。尤其是當尤其是當 時,只要相關系數(shù)時,只要相關系數(shù) ,比率估計就要優(yōu)于簡單估計。比率估計就要優(yōu)于簡單估計。yxCC 21比率估計的其他問題看教材比率估計的其他問題看教材P53P53返回2.4 回歸估計量及其性質一、回歸估計的定義對于簡單隨機抽樣,總體均值

32、Y和總體總量的回歸估計量(regression estimatior)的定義為:Y)()(XxyxXyylrlryNY式中,xy,是樣本均值;為事先設定的一個常數(shù)如果=0,則回歸估計量就是簡單估計量;如果,xy則回歸估計量就是比率估計量。返回二、為常數(shù)的情形當回歸系數(shù)為事先給定的常數(shù)時,或以前為相同目的進行的調查所得到的iY對iX的樣本回歸系數(shù)穩(wěn)定在某個數(shù)值上,取最近一次調查所得的作為設定值。性質2 對于簡單隨機抽樣回歸估計量,作為Y及Y 的回歸估計,lrlrYy及都是無偏的。即,)(YyElr.)()(YyNEYElrlrlrlrYy和的方差分別為:返回)2(1)(02202yxxylrSS

33、SnfyV)2()1 ()(022022yxxylrSSSnfNYV式中,yxxySSS,22分別是Y,X的總體方差和總體協(xié)方差;yxxysss,22分別是Y,X的樣本方差和樣本協(xié)方差。)()(lrlrYVyV和的樣本估計量為:)2(1)(02202yxxylrsssnfyv)2()1 ()(022022yxxylrsssnfNYv返回BSSSSnfdyVdxxyyxxlr202000)22(1)()2(1)(02202yxxylrSSSnfyV我們對上式兩端關于我們對上式兩端關于 求導數(shù),得:求導數(shù),得:0返回因此當因此當0取總體回歸系數(shù)取總體回歸系數(shù)NiiNiiixyxXXXXYYSSB1

34、212)()()(lryV達到最小,即達到最小,即時,時,)1 (1)(1)(22222minyxylrSnfSBSnfyV式中式中,為為iYiX總體相關系數(shù)??傮w相關系數(shù)。返回三、為樣本回歸系數(shù)的情形如果需要通過樣本來確定,很自然地,我們會想到用總體回歸系數(shù)的最小二乘估計,也就是樣本回歸系數(shù):niiniiixyxxxxxyyssb1212)()(這時簡單隨機抽樣回歸估計量)(xXbyylr是有偏的。但當樣本量n充分大時,估計量的偏倚趨于零。因此,類似比率估計量,回歸估計量也是漸近無偏的。返回且有)1 (1)()(22ylrlrSnfyVyMSE)(lryMSE的一個近似估計為:niiilrx

35、xbyynnfyv12)()()2(1)()(21112222xyesbsnnnfsnf返回【例4.5】( (續(xù)續(xù)P72P72的例的例4.2)4.2)利用回歸估計量推算該縣船舶利用回歸估計量推算該縣船舶調查月完成的貨運量調查月完成的貨運量. .解:根據(jù)例根據(jù)例4.24.2中的計算結果可得樣本回歸系數(shù)中的計算結果可得樣本回歸系數(shù): :8195.1011.216122.233822xyxssb89.1004)652860154626(8195.102 .1123)(xXbyylr從而從而返回因此,該縣船舶調查月完成的貨運量的回歸估計為:287398289.10042860lryNY52.18921

36、8)(212222xyesbsnns為了估計 ,先計算回歸殘差方差:)(lrYV112221054232. 152.189218)28601101(2860)1 ()(elrsnfNYv所以返回對于同一個題,我們來比較三種估計量的誤差差異對于同一個題,我們來比較三種估計量的誤差差異287398289.10042860lrlryNY112210542. 1)1 ()(ylrsnfNYv2671937154626652 .1123XxyYR11222210106. 2)2()1 ()(yxxyRsRsRsnfNYv,3212352yNY11221043303. 3)1 ()(ysnfNYv返回 與

37、例與例4.24.2的結果比較,對于本問題回的結果比較,對于本問題回歸估計優(yōu)于比率估計,而比率估計又優(yōu)于歸估計優(yōu)于比率估計,而比率估計又優(yōu)于簡單估計;簡單估計; 回歸估計優(yōu)于比率估計的原因是回歸回歸估計優(yōu)于比率估計的原因是回歸直線可以不通過原點。直線可以不通過原點。 比較上述估計量的優(yōu)劣,一般是通過比較上述估計量的優(yōu)劣,一般是通過比較它們的均方誤差或方差大小來進行。比較它們的均方誤差或方差大小來進行。返回 關于簡單估計、比率估計、回歸估計的估計量方差比較簡單估計量:21)(ySnfyV比率估計量:)2(1)(222yxxyRRSSRSnfyV回歸估計量:)1 (1)(22ylrSnfyV返回由此

38、可以看出由此可以看出(在不考慮偏倚的情況下)有以下結論:有以下結論:2.比率估計量優(yōu)于簡單估計量的條件是:yxCC23.回歸估計量優(yōu)于比率估計量的條件是:0)(2yxSRS在不考慮偏倚時,回歸估計總是優(yōu)于比率估計在不考慮偏倚時,回歸估計總是優(yōu)于比率估計1.1.回歸估計量總是優(yōu)于簡單估計量,除非回歸估計量總是優(yōu)于簡單估計量,除非即一般而言有即一般而言有0)()(yVyVlr返回 如果不忽略偏倚,全面考慮比率估計和回歸估計的均方誤差MSE,那情況會怎么樣呢? 下面我們通過教材P61.表213的實際例題來分析比較。(略,看教材)返回2.4 簡單隨機抽樣的實施一、樣本量的確定原理 我們知道我們知道n

39、n的大小會影響抽樣誤差,因為如果的大小會影響抽樣誤差,因為如果n n越接近越接近N N,則抽樣誤差就會越接近于零,這一點,則抽樣誤差就會越接近于零,這一點也清楚地體現(xiàn)在下面的式子里。也清楚地體現(xiàn)在下面的式子里。222)(11)11(1)(yyySyVNnSNnSnfyV三個因素決定三個因素決定 n n返回 在上式中,在上式中,N N是已知的,是已知的,S S是無法知道的,所以要考是無法知道的,所以要考考慮影響考慮影響n n的重點應該是抽樣誤差。的重點應該是抽樣誤差。 習慣上,不以習慣上,不以 作為調查精度指標,而是用置信度作為調查精度指標,而是用置信度 和絕對誤差限度和絕對誤差限度 替代抽樣誤

40、差替代抽樣誤差)(yV1dYy|)(yV1)()(|1|yVdyVYyPdYyP根據(jù)雙側分位點的定義有根據(jù)雙側分位點的定義有返回222/222/22/2/11.)()(1)(|ySzdNnzdyVyVdzzyVYyP或下面我們分別觀察等式右端各部分對下面我們分別觀察等式右端各部分對n n的影響。的影響。返回0.900.950.991.6451.962.58 n1.191.73置信度對樣本量n的影響12/z0n0n0n絕對誤差限度d對樣本量n的影響d0.140.100.040.03n4995566964這里這里25. 0,95. 01 ,100002ySN返回總體方差對樣本量n的影響00.090

41、.160.210.240.25n11362403133563702yS這里這里05. 0,95. 01 ,10000dN下面我們把置信度設為:下面我們把置信度設為:絕對誤差設為:絕對誤差設為:總體方差設為:總體方差設為:來觀察總體規(guī)模來觀察總體規(guī)模N N對樣本量對樣本量n n的影響的影響;95. 01;05. 0d25. 02yS返回總體規(guī)??傮w規(guī)模N樣本容量樣本容量n5044100795002171000278500035710000370100000383100000038410000000384 總體規(guī)??傮w規(guī)模N對樣本量對樣本量n的影響的影響返回二、樣本量的確定步驟第一步:確定委托單位認可的估計精度水平,包括絕對誤差d和置信水平;第二步:按照保守原則(寧大勿?。?,實施對總體方差的預估;第三步:根據(jù)上述給定的估計精度和總體方差的預估值并考慮總體N的大小,以簡單抽樣及回答率100%為前提條件,按下面的式子計算初始樣本量n222/2222/222/201/1yyySzNdSNzSzdNn返回第四步:確定抽樣方法,并根據(jù)不同抽樣方法的抽樣確定抽樣方法,并根據(jù)不同抽樣方法的抽樣效應效應deffdeff對樣本容量進行調整:對樣本容量進行調整:deffnn01)()(yVyVdeffsrs簡單隨機抽樣的簡單隨機抽樣的分層隨機抽

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論