抽樣調(diào)查-比率、回歸與差值估計培訓(xùn)課件_第1頁
抽樣調(diào)查-比率、回歸與差值估計培訓(xùn)課件_第2頁
抽樣調(diào)查-比率、回歸與差值估計培訓(xùn)課件_第3頁
抽樣調(diào)查-比率、回歸與差值估計培訓(xùn)課件_第4頁
抽樣調(diào)查-比率、回歸與差值估計培訓(xùn)課件_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

§4.1引言

一、概念在實際工作中,如果除了調(diào)查的目標(biāo)量以外,還有其他指標(biāo)的信息,稱這些指標(biāo)為輔助變量,(auxiliaryariable)。人們總希望利用輔助變量與目標(biāo)量之間的關(guān)系來提高估計的精度。這就是本章所要介紹的方法(不是抽樣方法,而是估計方法)。第一頁,共五十九頁。通常使用的方法是:利用調(diào)查指標(biāo)與輔助變量之間的關(guān)系構(gòu)造比率估計量和回歸估計量。例如,要調(diào)查家庭教育支出,則家庭的總支出就是輔助變量,家庭用于教育的支出占總支出的比重就構(gòu)成了比率估計量。第二頁,共五十九頁。二、應(yīng)用條件

(1)比率估計、回歸估計需要用到輔助變量的總體均值或總體總量;(2)如果輔助變量的總體均值或總體總量未知又要利用比率估計或回歸估計,則可采用二重抽樣的方法;(3)比率估計是有偏估計,因此需要有足夠的樣本量才能保證估計的有效。第三頁,共五十九頁。三、符號說明設(shè)調(diào)查指標(biāo)為,輔助變量為總體總量:總體均值:總體方差:第四頁,共五十九頁。樣本均值:樣本方差:總體協(xié)方差:樣本協(xié)方差:總體相關(guān)系數(shù):樣本相關(guān)系數(shù):第五頁,共五十九頁。§4.2比率估計一、簡單隨機抽樣下的比率估計1.定義比率估計量(ratioestimator)又稱比估計對于簡單隨機抽樣,總體均值和總體總量Y的比率估計為:總體比率:總體比率估計量:第六頁,共五十九頁。2.比估計的性質(zhì)簡單隨機抽樣比率估計是有偏的,其偏倚的階為,當(dāng)樣本量n較大時,估計量的偏倚趨于零.因此,比率估計是漸近無偏的.性質(zhì)1

對于簡單隨機抽樣比率估計,當(dāng)樣本量n較大時,是漸近無偏的.即的方差為:第七頁,共五十九頁。第八頁,共五十九頁?;蚴街蟹謩e為Y,X的總體方差和總體協(xié)方差;分別為Y,X的樣本方差和樣本協(xié)方差.可通過估計.第九頁,共五十九頁。【例4.1】對以下假設(shè)的總體(N=6),用簡單隨機抽樣抽取n=2的樣本,比較簡單隨機抽樣比率估計及簡單估計的性質(zhì)。i123456均值XiYi011331151882910464.518解:對這個總體,我們列出所有可能的個樣本,以比較簡單估計與比率估計的性質(zhì)。第十頁,共五十九頁。i樣本簡單估計()比率估計()1234567891011121314151,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.5181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.75第十一頁,共五十九頁。由此,可以算出:第十二頁,共五十九頁。

由計算結(jié)果可以看出:

簡單估計是無偏的,而比率估計是有偏的。簡單估計量的方差遠遠大于比例估計量的方差,比率估計的偏倚不大,其均方誤差也比簡單估計的方差小得多。因此,對這個總體,比率估計比簡單估計的效率高。第十三頁,共五十九頁?!纠?.2】某縣在對船舶調(diào)查月完成的貨運量進行調(diào)查時,對運管部門登記的船舶臺帳進行整理后獲得注冊船舶2860艘,載重噸位154626噸。從2860艘船舶中抽取一個n=10的簡單隨機樣本,調(diào)查得到樣本船舶調(diào)查月完成的貨運量及其載重噸位如表(單位:噸),要推算該縣船舶調(diào)查月完成的貨運量。第十四頁,共五十九頁。ii1234578015001005376600100505010206789102170182314501581370120150802050解:已知:N=2860,n=10,X=154626由表可得第十五頁,共五十九頁。因此,對該縣船舶在調(diào)查月完成貨運量的比率估計為:方差的估計為:=2.10617×第十六頁,共五十九頁。標(biāo)準(zhǔn)差的估計為:如果用簡單估計對貨運量進行估計,則由此,得到比率估計量設(shè)計效應(yīng)為:對于本問題,比率估計量比簡單估計量的效率高!第十七頁,共五十九頁。3.消除比率估計偏倚的方法

由于比率估計是有偏估計,在小樣本時,其偏倚不能忽略.則需要通過改善估計量或改變抽樣方法使比率估計成為無偏估計.1.無偏的比率估計量第一種:Hartley--Ross估計量式中第十八頁,共五十九頁。第二種:Mickey估計量其中,分別是在n個樣本數(shù)據(jù)中去掉第i個樣本數(shù)據(jù)后剩下的n-1個樣本數(shù)據(jù)的平均值.第十九頁,共五十九頁。二、分層隨機抽樣下的比率估計1.分別比率估計總體均值總體總量的分層比率估計(separateRatioestimator)為:總體均值:總體總量:層權(quán)L:層數(shù)為的比率估計,為比率估計第二十頁,共五十九頁。比率估計量的方差:式中,分別為第i層指標(biāo)Y,X的方差及相關(guān)系數(shù).

分別比率估計量要求每一層的樣本量都比較大,否則,偏倚可能比較大.第二十一頁,共五十九頁。2.聯(lián)合比率估計(combinedratioestimator)總體均值:總體總量:式中:表示的無偏估計;表示的無偏估計.均方誤差為:第二十二頁,共五十九頁。3.分別比率估計量與聯(lián)合比率估計量的比較一般而言,分別比率估計量的方差小于聯(lián)合比率估計量的方差。但當(dāng)每層的樣本量不太大時,還是采用聯(lián)合比率估計量更可靠些,因為這時分別比率估計量的偏倚很大,從而使總的均方誤差增大。實際使用時,如果各層的樣本量都較大,且有理由認為各層的比率Rh差異較大,則分別比率估計優(yōu)于聯(lián)合比率估計。當(dāng)各層的樣本量不大,或各層比率Rh差異很小,則聯(lián)合比率估計更好些。第二十三頁,共五十九頁。【例4.4】

某市1996年對950家港口生產(chǎn)單位完成的吞吐量進行了調(diào)查,1997年欲對全市港口生產(chǎn)單位完成的吞吐量進行調(diào)查。對港口生產(chǎn)單位按非國有(h=1)和國有(h=2)分為兩層,單位數(shù)分別為800家和150家,分別在兩層中調(diào)查了10家和15家港口生產(chǎn)單位,調(diào)查數(shù)據(jù)如下表,試計算1997年全市港口生產(chǎn)單位完成的吞吐量。1997年國有和非國有企業(yè)調(diào)查數(shù)據(jù)如下頁第二十四頁,共五十九頁。ixiyiixiyi19580149553022202102210320335938433604964120117423040051771805600651625325861000880730234977005608332286811001230927221597208231013797103103901147846512817650139191160141160107015735698第二十五頁,共五十九頁。(將上述數(shù)據(jù)計算的中間結(jié)果列于P77的表中)1.按分別比率估計量估計第二十六頁,共五十九頁。2.按聯(lián)合比率估計量估計

按聯(lián)合比率估計量估計比按分別比率估計量估計要好一些!第二十七頁,共五十九頁。三、比率估計的效率1.與簡單估計的比較簡單估計量是無偏的,而比率估計量是漸近無偏的.因此,這里只比較當(dāng)n比較大的情形.由以前的討論可知:由此看出,比率估計量優(yōu)于簡單估計量的條件是:有當(dāng)?shù)诙隧?,共五十九頁?.比率估計成為最優(yōu)線性估計的條件⑴與的關(guān)系是過原點的直線;⑵對這條直線的方差與成比例。比率估計量優(yōu)于簡單估計量。特別當(dāng)時,,這里,第二十九頁,共五十九頁?!?.3回歸估計一、回歸估計的定義對于簡單隨機抽樣,總體均值和總體總量的回歸估計量(regressionestimatior)的定義為:式中,是樣本均值;為事先設(shè)定的一個常數(shù)如果β=0,則回歸估計量就是簡單估計量;如果則回歸估計量就是比率估計量。第三十頁,共五十九頁。二、為常數(shù)的情形當(dāng)回歸系數(shù)為事先給定的常數(shù)時,或以前為相同目的進行的調(diào)查所得到的對的樣本回歸系數(shù)穩(wěn)定在某個數(shù)值上,取最近一次調(diào)查所得的作為設(shè)定值。性質(zhì)2對于簡單隨機抽樣回歸估計量,作為及Y的回歸估計,都是無偏的。即的方差分別為:第三十一頁,共五十九頁。式中,分別是Y,X的總體方差和總體協(xié)方差;分別是Y,X的樣本方差和樣本協(xié)方差。的樣本估計量為:第三十二頁,共五十九頁。當(dāng)取總體回歸系數(shù)達到最小,即時,式中,為總體相關(guān)系數(shù)。第三十三頁,共五十九頁。三、β為樣本回歸系數(shù)的情形如果β需要通過樣本來確定,很自然地,我們會想到用總體回歸系數(shù)的最小二乘估計,也就是樣本回歸系數(shù):這時簡單隨機抽樣回歸估計量是有偏的。但當(dāng)樣本量n充分大時,估計量的偏倚趨于零。因此,類似比率估計量,回歸估計量也是漸近無偏的。第三十四頁,共五十九頁。且有的一個近似估計為:第三十五頁,共五十九頁。【例4.5】(續(xù)P72的例4.2)利用回歸估計量推算該縣船舶調(diào)查月完成的貨運量.解:根據(jù)例4.2中的計算結(jié)果可得樣本回歸系數(shù):從而第三十六頁,共五十九頁。因此,該縣船舶調(diào)查月完成的貨運量的回歸估計為:為了估計,先計算回歸殘差方差:所以第三十七頁,共五十九頁?!衽c例4.2的結(jié)果比較,對于本問題回歸估計優(yōu)于比率估計,而比率估計又優(yōu)于簡單估計;

●回歸估計優(yōu)于比率估計的原因是回歸直線沒有通過原點。

●比較上述估計量的優(yōu)劣,一般是通過比較它們的均方誤差或方差大小來進行。第三十八頁,共五十九頁。簡單估計量、比率估計量、回歸估計量的比較簡單估計量:比率估計量回歸估計量第三十九頁,共五十九頁。由此可以看出:2.比率估計量優(yōu)于簡單估計量的條件是:3.回歸估計量優(yōu)于比率估計量的條件是:即回歸估計量總是優(yōu)于比率估計量.1.回歸估計量總是優(yōu)于簡單估計量,除非即一般而言有第四十頁,共五十九頁。四、分層隨機抽樣下的回歸估計1.分別回歸估計(separateregressionestimator)總體均值的估計:總體總量的估計:第四十一頁,共五十九頁。

當(dāng)各層的回歸系數(shù)為事先給定的常數(shù)時,分別回歸估計量是無偏的。其方差為:其中是第h層的回歸系數(shù)第四十二頁,共五十九頁。并且當(dāng)時,達到最小,即通常未知,可用回歸系數(shù)作為的估計:第四十三頁,共五十九頁。注意(1)分別回歸估計量是有偏的,但當(dāng)每一層的樣本量都很大時,估計的偏倚可以忽略,其方差近似為:(2)這里是子總體的回歸系數(shù),是子總體樣本的回歸系數(shù),前者是未知的,后者是可知的。第四十四頁,共五十九頁。方差的樣本估計值為:式中,

分別回歸估計量要求每一層的樣本量都較大,如果這個條件得不到滿足,則分別回歸估計量的偏倚可能很大,這時,采用聯(lián)合回歸估計量更好些。第四十五頁,共五十九頁。2.聯(lián)合回歸估計(combinedregressionestimator)總體均值的估計:總體總量的估計:式中,分別為的分層估計。是無偏的,其方差為:第四十六頁,共五十九頁。并且,只要β取時,達到最小。當(dāng)回歸系數(shù)未知時,取β為的樣本估計:這時,聯(lián)合回歸估計量是有偏的,但當(dāng)樣本量n較大時,估計的偏倚可以忽略,其方差近似為:第四十七頁,共五十九頁。方差的樣本估計為:3.分別回歸估計與聯(lián)合回歸估計的比較當(dāng)回歸系數(shù)設(shè)定時,分別回歸估計優(yōu)于聯(lián)合回歸估計當(dāng)回歸系數(shù)由樣本估計時,如果各層的樣本量不太小,采用分別回歸估計為宜.否則,采用聯(lián)合回歸估計為好.第四十八頁,共五十九頁。【例4.6】(續(xù)例4.4)利用回歸估計量估計該市港口生產(chǎn)單位1997年完成的吞吐量。解:樣本回歸系數(shù):h=1,非國有h=2,國有1.070170.856402則按分別回歸估計量估計:(見P85)第四十九頁,共五十九頁。按聯(lián)合回歸估計量估計:(見教材P86)

從本題看,聯(lián)合回歸估計量比分別回歸估計量要優(yōu)一些!第五十頁,共五十九頁?!?.4差值估計如果調(diào)查時所用的輔助變量為目標(biāo)量最近的普查結(jié)果,或者回歸估計的回歸系數(shù)接近于己于1這時可以采用差值估計(differenceestimayor)??傮w均值的差值估計為:式中第五十一頁,共五十九頁。性質(zhì)3作為β=1的回歸估計量,的無偏估計,其方差為:將的樣本估計值代入上式,就可得到的樣本估計.第五十二頁,共五十九頁?!纠?.7】(續(xù)例4.4)利用差值估計量估計該市港口生產(chǎn)單位1997年完成的吞吐量,并與前面的估計量及精度進行比較.解:由于輔助變量是上年的普查資料,且樣本回歸系數(shù)接近于1,因此可以采用差值估計.第五十三頁,共五十九頁。

下面比較本例所用的五個估計量,看看它們的優(yōu)劣,其具體數(shù)據(jù)如下表:第五十四頁,共五十九頁。估計方法總量估計標(biāo)準(zhǔn)差估計變異系數(shù)分別比率估計272536.69588.480.035182聯(lián)合比率估計271956.19289.440.034158分別回歸估計270556.39480.110.035039聯(lián)合回歸估計271753.49238.960.033998差值估計271910.09269.110.034089第五十五頁,共五十九頁。結(jié)果分析1.本題中,五種估計量的精度非常接近,聯(lián)合回歸估計量稍好些;2.對于簡單隨

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論