比估計與回歸估計_第1頁
比估計與回歸估計_第2頁
比估計與回歸估計_第3頁
比估計與回歸估計_第4頁
比估計與回歸估計_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、第五章第五章 比估計與回歸估計比估計與回歸估計侯天宇侯天宇1.1 引言 1.比估計與回歸估計的使用條件:(1)調(diào)查主要指標與輔助變量間有正線性相關關系正線性相關關系; 比估計與回歸估計的使用效果的好壞取決于輔助變量的選擇,要盡可能選擇與調(diào)查指標相關程度的大小。 (如果輔助變量與調(diào)查主要指標間有負線性相關關系,則要采取乘積估計。)(2)適用面廣,可以用于簡單隨機抽樣,也可用于分層隨機抽樣等;(3)估計 或Y時 ,一般要求輔助變量的總體總量或均值是已知的。Y簡單估計:在沒有其他相關輔助變量信息可以利用的情況下,用樣本特征直接估計總體特征,且樣本特征與欲估的總體特征除了寫法之分外,完全同形同構(gòu),簡單

2、易記,因此有簡單線性估計。身不屬于比率估計量。,它本比率估計量的核心成分是簡單估計量,是構(gòu)成R1.2 比估計一、簡單隨機抽樣下的比估計:一、簡單隨機抽樣下的比估計:1.比估計定義:比估計定義: 比率:(1)R的比率估計量:XYXYR均值之比率:總體的兩個指標總量或稱為比率估計量。則xyR .是樣本兩個指標的均值,對于簡單隨機抽樣,若xy(2)2.比估計的性質(zhì):比估計的性質(zhì):對于簡單隨機抽樣,(1)比估計是有偏的,但當n大時,(2)XRNXRYXXRYXRyYYRR),(已知的比估計量:及RRE)()2(1)2(11)(1)()(22222222122xyxyxxyyNiiiSRSSRSXnfS

3、RRSSXnfNRXYXnfRVRMSE證明:RREnXXRYXxRyEXxRyExxRyERREXxnxxRyRxyRR)(大時,當)()()()(大時,當0) 1 ( 11)()(111001)()()()()2(122122222222222NRXYXnfRMSERVNRXYnfSnfgVGgEgEgExRyExRygXRYGNiRXYGXxRyERRERMSERMSERVRRERERENiiiNiiigiii)()()()()()()(則,對每個總體單元,令)()(又)()()2(1)2(11)()(2)(11)()(11)(1)()(2222222212222122122xyxyxx

4、yyNiiiiiNiiiNiiiSRSSRSXnfSRRSSXnfNXXRXXYYRYYXnfNXRRXYYXnfNRXYXnfRVRMSE3.比估計的方差估計:比估計的方差估計: (1)該估計是有偏的,但具有漸近無偏性。)2(11)(1)()(2222122xxyyNiiiSRRSSXnfNRXYXnfRVRMSE)2(11)(1)(的漸近無偏估計為:)(已知時,當22221221xxyyniiisRsRsXnfnxRyXnfRvRVX1)(12NRXYNiii其中估計可用niiixRyn12)(11(2)例:某小區(qū)有1920戶,從中隨機抽取了70戶,調(diào)查各戶的住房面積(單位:平方米)和家庭

5、人口,得數(shù)據(jù): 試對人均住房面積作點估計和置信度為95%的區(qū)間估計。5 .7264,1110, 7 .52940260, 4 .182170170127012701701iiiiiiiiiiixyxyxy)2(111)(22221221xxyyniiisRsRsxnfnxRyxnfRvRVX)()(的漸近無偏估計為:未知時,當 解:01. 72604 .1821701701iiiixyR085. 011)(1222nxRyxnfRvRVniii)()(的漸近無偏估計為:92.56372)(7012270170127012iiiiiiiiiixRxyRyxRy58. 744. 6%952121,

6、)(,)(的置信區(qū)間為:的置信度為RvuRRvuRR3.估計估計R時樣本量的確定:時樣本量的確定:22222/100022222/122222/12/112222,其中11解得:)()Y(11,其中1)(大時,當,的絕對誤差限為1的置信度為如果dXSnNnndXNSdXSnRVdRXNSSXnfRVndRdddNiiidd估計。未知時,也可由)(11由的樣本,抽一個容量為也可以通過試點調(diào)查時計,可以通過以往的資料估122,2xXxRynsnSniiidd4.估計估計 時樣本量的確定:時樣本量的確定:2222/10002222/12222/12/11222,其中11解得:)()Y(11,其中1)

7、(大時,當,的絕對誤差限為1如果置信度為dSnNnnNdSdSnYVdRXNSSnfYVnddddRNiiiddRRY例:某公司有1000名職工,為了估計職工今年與去年病假工時的比率,要抽一個容量為n的簡單隨機樣本進行調(diào)查。先隨機抽了10人作試點調(diào)查,數(shù)據(jù)如下:編號去年病假工時今年病假工時1121322425315154303253236626247101281516902101412希望以置信度95%,使估計R的絕對誤差不超過0.01,應抽容量為多大的樣本?已知公司職工去年病假工時為16300。解:05. 1178187101101iiiixyR4245,4066,4463178,18710

8、110121012101101iiiiiiiiiiixyxyxy由試點調(diào)查的數(shù)據(jù)得:5222/1210122701221011012101210603. 296. 101. 03 .1610001630016300474. 3)(91265.312)(dVXXxRysxRxyRyxRyiiidiiiiiiiiii,已知334100050215021,50200220NnnnVXSnd例:審計員想把一個醫(yī)院的財產(chǎn)的現(xiàn)在價值與記錄價值作一比較。從計算機存儲的記錄里查到,醫(yī)院的財產(chǎn)有2100項,共計價值950000元。為了估計現(xiàn)在的價值,擬在2100項目中隨機抽取n項。因為沒有信息可用來確定n,先隨

9、機抽了15項,獲得數(shù)據(jù)整理如下: 試確定n,使估計量的絕對誤差不超過500元(置信度為95%)。表示現(xiàn)在的價值。值,表示從計算機查到的價其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .24215115121511512151解:表示現(xiàn)在的價值。值,表示從計算機查到的價其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .2421511512151151215198. 00 .2425 .237151151iiiixyR406210050415041504)21005

10、00(4444. 796. 100222222/10NnnndSnd4444. 7)(1412218.1042)(151221512215115121512iiidiiiiiiiiiixRysxRxyRyxRy4.比估計與簡單估計的比較:比估計與簡單估計的比較:單估計更精確。,即比估計較相應的簡21,則特別若2/2/20)2(1)2(11)()()得:2()1(1)(的方差為:的簡單估計)2()2(1)(的方差為:的比估計足夠大時,當)1(2222222222yxyxyxyxxyxxyxyyRyxyxyRRCCCCYSXSSRSSRSSRnfSRSSRSnfSnfyVyVSnfyVyYSRSS

11、RSnfyVyYn5.消除比估計偏倚的方法:消除比估計偏倚的方法: 小樣本時,比估計的偏倚不能忽略。 有偏估計成為無偏估計的方法:(1)無偏的比率型估計量(2)改變抽樣方法二、分層隨機抽樣下的比估計二、分層隨機抽樣下的比估計 在大樣本時, 1. 分別比估計:分別比估計:若 各層的樣本量比較大時,各層可分別進行比估計,再進行加權(quán)平均,所得估計量稱為分別比估計。 LhxhhxyhhyhhhhLhhNihihhihhhLhRhhLhhhstLhhhhLhRhhLhhhstSRSRSnfWNXRYnfWyVWYVWYVXRWyWYWYh1222211221212111)2(11)(1)()()(方差2

12、. 聯(lián)合比估計:聯(lián)合比估計:若 某些層的樣本量比較小時,可以采用聯(lián)合比估計。對兩個指標先求總體均值或總和的分層估計,然后用它們構(gòu)造比估計,所得估計量稱為聯(lián)合比估計。 LhxhxyhyhhhhRcststcRcSRRSSnfWyVXxyXRy12222)2(1)(方差3. 分別比估計與聯(lián)合比估計的比較:分別比估計與聯(lián)合比估計的比較:1.3 回歸估計Linear regression 估計精度就比較高。為常數(shù))。這時,用比(可以認為又比較大,相關系數(shù)的回歸直線通過原點,關于如果。估計其實質(zhì)是用,已知計量:簡單隨機抽樣中的比估aaxyxyXYxyXXxyYiiiiR)(的特征數(shù)呢?的信息來估計調(diào)查指

13、標如何利用輔助指標,的回歸直線不通過原點關于如果yxxyii1.簡單隨機抽樣中的回歸估計量:簡單隨機抽樣中的回歸估計量:對于簡單隨機抽樣,總體均值和總體總和的回歸估計量分別為:lrlrYNYXxXbyY)(已知,其中YYEyYxXyYYXxxxyyyxyxylrlrlrlriiiiiiiii)(性質(zhì):記為以后)(的回歸估計為時,當)(的回歸值時,事先給定常數(shù))若(據(jù)結(jié)構(gòu):具有一元線性回歸的數(shù)與假定1000YYEXRXxyxXxyyyxyRxXyyyyxXyyYlrlrlrlrlr)(:性質(zhì))(即回歸估計為比估計)(時,當計)(即回歸估計為差估(時,當計)(即回歸估計為簡單估時,當)(的回歸估計

14、為時,事先給定常數(shù)若110:00000)()(:性質(zhì)22002212xxyylrSSSnfyV)的無偏估計。()是()(性質(zhì):)()()()(去估計均值的回歸估計就是用樣本或者說:(,其中(換個角度:證明:)()(:性質(zhì)lrxxyylrxxyyNiiiNiiiZlriiiniiniiilrxxyylryVsssnfyvSSSnfXXYYNnfYXXYNnfSnfyVYzYxXyzzznxXynxXyySSSnfyVi22002220022102102011002200221211111111)1)(1)212,即總體殘差方差。1)(1)1(的相關系數(shù)。與為數(shù),的(有限)總體回歸系關于為其中)1

15、(1)(且)達到最小值,(時,)()(當?shù)淖罴阎担┒ɡ恚海?2122222min212100NiiNiiiyylrlrxxyNiiNiiieNEYYNSxyxyBSnfyVyVBSSXXXXYY證明:)()(時,當)(得)(令)()(22min2020220022002110, 021ylrxxylrxxylrxxyylrSnfyVBSSdyVdBSSdydVSSSnfyV)(21)(2121211,1122212212222121yxyyxxyyniiiniieelrylrlrlrlrniiniiiiiiiibssnnlblnxxbyynyynssnfyvnSnfyVyMSEnYyEnxXb

16、yyYxxxxyybBBxyxy)()()(其中樣本殘差)(大時性質(zhì):當)()()(大時,性質(zhì):當)(大時,性質(zhì):當)(的回歸估計為:)()(一般是未知的,本回歸系數(shù)。根據(jù)樣本計算時,為樣)若(據(jù)結(jié)構(gòu):具有一元線性回歸的數(shù)與假定例:總體由75308個農(nóng)場組成,設yi為第i個農(nóng)場養(yǎng)牛的頭數(shù), xi為第i個農(nóng)場的面積。已知農(nóng)場平均面積為31.25英畝,選取一個樣本容量為2055的簡單隨機樣本。經(jīng)計算得: 試估計每個農(nóng)場平均養(yǎng)牛頭數(shù)及標準差。763.10073375525.35717915.27410065.30,53.12xxxyyylllxy解:355. 0 xxxyllb74.12)65.30

17、25.31(355. 053.12)(xXbyylr187.0)()(035.0)(2111)(2lrlrxyyyelryvysbllnnfsnfyv標準差為二、分層隨機抽樣下的回歸估計二、分層隨機抽樣下的回歸估計 在大樣本時, 1. 分別回歸估計:分別回歸估計:若各層的樣本量比較大時,各層可分別進行回歸估計,再進行加權(quán)平均,所得估計量稱為分別回歸估計。 LhehhhhlrshLhhyhhhhLhlrhhLhhhlrshLhhhhhhLhlrhhLhhhlrssnfWYvSnfWyVWYVWYVxXyWyWYWY122122212121111:11)()(:)()(未知時,當方差的樣本估計)(

18、)(未知時,當方差2. 聯(lián)合回歸估計:聯(lián)合回歸估計:若 某些層的樣本量比較小時,可以采用聯(lián)合比估計。對兩個指標先求總體均值或總和的分層估計,然后用它們構(gòu)造回歸估計,所得估計量稱為聯(lián)合回歸估計。 LhxhcxyhcyhhhhlrclrcLhxhhhhLhxyhhhhcststlrcSBSBSnfWyVyVSnfWSnfWBxXyy1222212212)2(111:)()()達到最小,即(時,取當當回歸系數(shù)未知時,方差LhxhcxyhcyhhhhlrcLhxhhhhLhxyhhhhcsbsbsnfWyvsnfWsnfWb1222212212)2(111)(時,取當3. 分別回歸估計與聯(lián)合回歸估計的

19、比較:分別回歸估計與聯(lián)合回歸估計的比較:1.3 等概率整群抽樣估計11niiniiyyM11niittniiyYM yMM2221122()()11( )11NNiiiiiiiiYYMMYYffV ynMNnMN222221()(1)( )( )( )1NiiitiYYMNfV YM V yN M V ynN估計量的方差分別是:21222222111()1( )111(2)1niiiinnniiiiiiiiyyMfv ynmnfyyMyM ynmn)(yV與 的樣本估計分別是:)(YV22122222111()(1)( )1(1)1(2)1niiinnniiiiiiiyyMNfv YnnNfy

20、yMyM ynn例:某縣有33個鄉(xiāng),726個村,該年度某種作物總種植面積30525畝,現(xiàn)采用等概抽樣隨機抽出10個鄉(xiāng),要求估計全縣總產(chǎn)量,計算抽樣誤差。 調(diào)查資料如下:樣本鄉(xiāng)編號村莊數(shù) Mi作物總產(chǎn)量(鄉(xiāng)) yi(萬公斤)種植面積(鄉(xiāng)) xi(畝)iiiMyy 123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合計 209 257.1 8940 分別采用幾種方法估計1 無

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論