比估計(jì)與回歸估計(jì)_第1頁(yè)
比估計(jì)與回歸估計(jì)_第2頁(yè)
比估計(jì)與回歸估計(jì)_第3頁(yè)
比估計(jì)與回歸估計(jì)_第4頁(yè)
比估計(jì)與回歸估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩42頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章第五章 比估計(jì)與回歸估計(jì)比估計(jì)與回歸估計(jì)侯天宇侯天宇1.1 引言 1.比估計(jì)與回歸估計(jì)的使用條件:(1)調(diào)查主要指標(biāo)與輔助變量間有正線性相關(guān)關(guān)系正線性相關(guān)關(guān)系; 比估計(jì)與回歸估計(jì)的使用效果的好壞取決于輔助變量的選擇,要盡可能選擇與調(diào)查指標(biāo)相關(guān)程度的大小。 (如果輔助變量與調(diào)查主要指標(biāo)間有負(fù)線性相關(guān)關(guān)系,則要采取乘積估計(jì)。)(2)適用面廣,可以用于簡(jiǎn)單隨機(jī)抽樣,也可用于分層隨機(jī)抽樣等;(3)估計(jì) 或Y時(shí) ,一般要求輔助變量的總體總量或均值是已知的。Y簡(jiǎn)單估計(jì):在沒(méi)有其他相關(guān)輔助變量信息可以利用的情況下,用樣本特征直接估計(jì)總體特征,且樣本特征與欲估的總體特征除了寫法之分外,完全同形同構(gòu),簡(jiǎn)單

2、易記,因此有簡(jiǎn)單線性估計(jì)。身不屬于比率估計(jì)量。,它本比率估計(jì)量的核心成分是簡(jiǎn)單估計(jì)量,是構(gòu)成R1.2 比估計(jì)一、簡(jiǎn)單隨機(jī)抽樣下的比估計(jì):一、簡(jiǎn)單隨機(jī)抽樣下的比估計(jì):1.比估計(jì)定義:比估計(jì)定義: 比率:(1)R的比率估計(jì)量:XYXYR均值之比率:總體的兩個(gè)指標(biāo)總量或稱為比率估計(jì)量。則xyR .是樣本兩個(gè)指標(biāo)的均值,對(duì)于簡(jiǎn)單隨機(jī)抽樣,若xy(2)2.比估計(jì)的性質(zhì):比估計(jì)的性質(zhì):對(duì)于簡(jiǎn)單隨機(jī)抽樣,(1)比估計(jì)是有偏的,但當(dāng)n大時(shí),(2)XRNXRYXXRYXRyYYRR),(已知的比估計(jì)量:及RRE)()2(1)2(11)(1)()(22222222122xyxyxxyyNiiiSRSSRSXnfS

3、RRSSXnfNRXYXnfRVRMSE證明:RREnXXRYXxRyEXxRyExxRyERREXxnxxRyRxyRR)(大時(shí),當(dāng))()()()(大時(shí),當(dāng)0) 1 ( 11)()(111001)()()()()2(122122222222222NRXYXnfRMSERVNRXYnfSnfgVGgEgEgExRyExRygXRYGNiRXYGXxRyERRERMSERMSERVRRERERENiiiNiiigiii)()()()()()()(則,對(duì)每個(gè)總體單元,令)()(又)()()2(1)2(11)()(2)(11)()(11)(1)()(2222222212222122122xyxyxx

4、yyNiiiiiNiiiNiiiSRSSRSXnfSRRSSXnfNXXRXXYYRYYXnfNXRRXYYXnfNRXYXnfRVRMSE3.比估計(jì)的方差估計(jì):比估計(jì)的方差估計(jì): (1)該估計(jì)是有偏的,但具有漸近無(wú)偏性。)2(11)(1)()(2222122xxyyNiiiSRRSSXnfNRXYXnfRVRMSE)2(11)(1)(的漸近無(wú)偏估計(jì)為:)(已知時(shí),當(dāng)22221221xxyyniiisRsRsXnfnxRyXnfRvRVX1)(12NRXYNiii其中估計(jì)可用niiixRyn12)(11(2)例:某小區(qū)有1920戶,從中隨機(jī)抽取了70戶,調(diào)查各戶的住房面積(單位:平方米)和家庭

5、人口,得數(shù)據(jù): 試對(duì)人均住房面積作點(diǎn)估計(jì)和置信度為95%的區(qū)間估計(jì)。5 .7264,1110, 7 .52940260, 4 .182170170127012701701iiiiiiiiiiixyxyxy)2(111)(22221221xxyyniiisRsRsxnfnxRyxnfRvRVX)()(的漸近無(wú)偏估計(jì)為:未知時(shí),當(dāng) 解:01. 72604 .1821701701iiiixyR085. 011)(1222nxRyxnfRvRVniii)()(的漸近無(wú)偏估計(jì)為:92.56372)(7012270170127012iiiiiiiiiixRxyRyxRy58. 744. 6%952121,

6、)(,)(的置信區(qū)間為:的置信度為RvuRRvuRR3.估計(jì)估計(jì)R時(shí)樣本量的確定:時(shí)樣本量的確定:22222/100022222/122222/12/112222,其中11解得:)()Y(11,其中1)(大時(shí),當(dāng),的絕對(duì)誤差限為1的置信度為如果dXSnNnndXNSdXSnRVdRXNSSXnfRVndRdddNiiidd估計(jì)。未知時(shí),也可由)(11由的樣本,抽一個(gè)容量為也可以通過(guò)試點(diǎn)調(diào)查時(shí)計(jì),可以通過(guò)以往的資料估122,2xXxRynsnSniiidd4.估計(jì)估計(jì) 時(shí)樣本量的確定:時(shí)樣本量的確定:2222/10002222/12222/12/11222,其中11解得:)()Y(11,其中1)

7、(大時(shí),當(dāng),的絕對(duì)誤差限為1如果置信度為dSnNnnNdSdSnYVdRXNSSnfYVnddddRNiiiddRRY例:某公司有1000名職工,為了估計(jì)職工今年與去年病假工時(shí)的比率,要抽一個(gè)容量為n的簡(jiǎn)單隨機(jī)樣本進(jìn)行調(diào)查。先隨機(jī)抽了10人作試點(diǎn)調(diào)查,數(shù)據(jù)如下:編號(hào)去年病假工時(shí)今年病假工時(shí)1121322425315154303253236626247101281516902101412希望以置信度95%,使估計(jì)R的絕對(duì)誤差不超過(guò)0.01,應(yīng)抽容量為多大的樣本?已知公司職工去年病假工時(shí)為16300。解:05. 1178187101101iiiixyR4245,4066,4463178,18710

8、110121012101101iiiiiiiiiiixyxyxy由試點(diǎn)調(diào)查的數(shù)據(jù)得:5222/1210122701221011012101210603. 296. 101. 03 .1610001630016300474. 3)(91265.312)(dVXXxRysxRxyRyxRyiiidiiiiiiiiii,已知334100050215021,50200220NnnnVXSnd例:審計(jì)員想把一個(gè)醫(yī)院的財(cái)產(chǎn)的現(xiàn)在價(jià)值與記錄價(jià)值作一比較。從計(jì)算機(jī)存儲(chǔ)的記錄里查到,醫(yī)院的財(cái)產(chǎn)有2100項(xiàng),共計(jì)價(jià)值950000元。為了估計(jì)現(xiàn)在的價(jià)值,擬在2100項(xiàng)目中隨機(jī)抽取n項(xiàng)。因?yàn)闆](méi)有信息可用來(lái)確定n,先隨

9、機(jī)抽了15項(xiàng),獲得數(shù)據(jù)整理如下: 試確定n,使估計(jì)量的絕對(duì)誤差不超過(guò)500元(置信度為95%)。表示現(xiàn)在的價(jià)值。值,表示從計(jì)算機(jī)查到的價(jià)其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .24215115121511512151解:表示現(xiàn)在的價(jià)值。值,表示從計(jì)算機(jī)查到的價(jià)其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .2421511512151151215198. 00 .2425 .237151151iiiixyR406210050415041504)21005

10、00(4444. 796. 100222222/10NnnndSnd4444. 7)(1412218.1042)(151221512215115121512iiidiiiiiiiiiixRysxRxyRyxRy4.比估計(jì)與簡(jiǎn)單估計(jì)的比較:比估計(jì)與簡(jiǎn)單估計(jì)的比較:?jiǎn)喂烙?jì)更精確。,即比估計(jì)較相應(yīng)的簡(jiǎn)21,則特別若2/2/20)2(1)2(11)()()得:2()1(1)(的方差為:的簡(jiǎn)單估計(jì))2()2(1)(的方差為:的比估計(jì)足夠大時(shí),當(dāng))1(2222222222yxyxyxyxxyxxyxyyRyxyxyRRCCCCYSXSSRSSRSSRnfSRSSRSnfSnfyVyVSnfyVyYSRSS

11、RSnfyVyYn5.消除比估計(jì)偏倚的方法:消除比估計(jì)偏倚的方法: 小樣本時(shí),比估計(jì)的偏倚不能忽略。 有偏估計(jì)成為無(wú)偏估計(jì)的方法:(1)無(wú)偏的比率型估計(jì)量(2)改變抽樣方法二、分層隨機(jī)抽樣下的比估計(jì)二、分層隨機(jī)抽樣下的比估計(jì) 在大樣本時(shí), 1. 分別比估計(jì):分別比估計(jì):若 各層的樣本量比較大時(shí),各層可分別進(jìn)行比估計(jì),再進(jìn)行加權(quán)平均,所得估計(jì)量稱為分別比估計(jì)。 LhxhhxyhhyhhhhLhhNihihhihhhLhRhhLhhhstLhhhhLhRhhLhhhstSRSRSnfWNXRYnfWyVWYVWYVXRWyWYWYh1222211221212111)2(11)(1)()()(方差2

12、. 聯(lián)合比估計(jì):聯(lián)合比估計(jì):若 某些層的樣本量比較小時(shí),可以采用聯(lián)合比估計(jì)。對(duì)兩個(gè)指標(biāo)先求總體均值或總和的分層估計(jì),然后用它們構(gòu)造比估計(jì),所得估計(jì)量稱為聯(lián)合比估計(jì)。 LhxhxyhyhhhhRcststcRcSRRSSnfWyVXxyXRy12222)2(1)(方差3. 分別比估計(jì)與聯(lián)合比估計(jì)的比較:分別比估計(jì)與聯(lián)合比估計(jì)的比較:1.3 回歸估計(jì)Linear regression 估計(jì)精度就比較高。為常數(shù))。這時(shí),用比(可以認(rèn)為又比較大,相關(guān)系數(shù)的回歸直線通過(guò)原點(diǎn),關(guān)于如果。估計(jì)其實(shí)質(zhì)是用,已知計(jì)量:簡(jiǎn)單隨機(jī)抽樣中的比估aaxyxyXYxyXXxyYiiiiR)(的特征數(shù)呢?的信息來(lái)估計(jì)調(diào)查指

13、標(biāo)如何利用輔助指標(biāo),的回歸直線不通過(guò)原點(diǎn)關(guān)于如果yxxyii1.簡(jiǎn)單隨機(jī)抽樣中的回歸估計(jì)量:簡(jiǎn)單隨機(jī)抽樣中的回歸估計(jì)量:對(duì)于簡(jiǎn)單隨機(jī)抽樣,總體均值和總體總和的回歸估計(jì)量分別為:lrlrYNYXxXbyY)(已知,其中YYEyYxXyYYXxxxyyyxyxylrlrlrlriiiiiiiii)(性質(zhì):記為以后)(的回歸估計(jì)為時(shí),當(dāng))(的回歸值時(shí),事先給定常數(shù))若(據(jù)結(jié)構(gòu):具有一元線性回歸的數(shù)與假定1000YYEXRXxyxXxyyyxyRxXyyyyxXyyYlrlrlrlrlr)(:性質(zhì))(即回歸估計(jì)為比估計(jì))(時(shí),當(dāng)計(jì))(即回歸估計(jì)為差估(時(shí),當(dāng)計(jì))(即回歸估計(jì)為簡(jiǎn)單估時(shí),當(dāng))(的回歸估計(jì)

14、為時(shí),事先給定常數(shù)若110:00000)()(:性質(zhì)22002212xxyylrSSSnfyV)的無(wú)偏估計(jì)。()是()(性質(zhì):)()()()(去估計(jì)均值的回歸估計(jì)就是用樣本或者說(shuō):(,其中(換個(gè)角度:證明:)()(:性質(zhì)lrxxyylrxxyyNiiiNiiiZlriiiniiniiilrxxyylryVsssnfyvSSSnfXXYYNnfYXXYNnfSnfyVYzYxXyzzznxXynxXyySSSnfyVi22002220022102102011002200221211111111)1)(1)212,即總體殘差方差。1)(1)1(的相關(guān)系數(shù)。與為數(shù),的(有限)總體回歸系關(guān)于為其中)1

15、(1)(且)達(dá)到最小值,(時(shí),)()(當(dāng)?shù)淖罴阎担┒ɡ恚海?2122222min212100NiiNiiiyylrlrxxyNiiNiiieNEYYNSxyxyBSnfyVyVBSSXXXXYY證明:)()(時(shí),當(dāng))(得)(令)()(22min2020220022002110, 021ylrxxylrxxylrxxyylrSnfyVBSSdyVdBSSdydVSSSnfyV)(21)(2121211,1122212212222121yxyyxxyyniiiniieelrylrlrlrlrniiniiiiiiiibssnnlblnxxbyynyynssnfyvnSnfyVyMSEnYyEnxXb

16、yyYxxxxyybBBxyxy)()()(其中樣本殘差)(大時(shí)性質(zhì):當(dāng))()()(大時(shí),性質(zhì):當(dāng))(大時(shí),性質(zhì):當(dāng))(的回歸估計(jì)為:)()(一般是未知的,本回歸系數(shù)。根據(jù)樣本計(jì)算時(shí),為樣)若(據(jù)結(jié)構(gòu):具有一元線性回歸的數(shù)與假定例:總體由75308個(gè)農(nóng)場(chǎng)組成,設(shè)yi為第i個(gè)農(nóng)場(chǎng)養(yǎng)牛的頭數(shù), xi為第i個(gè)農(nóng)場(chǎng)的面積。已知農(nóng)場(chǎng)平均面積為31.25英畝,選取一個(gè)樣本容量為2055的簡(jiǎn)單隨機(jī)樣本。經(jīng)計(jì)算得: 試估計(jì)每個(gè)農(nóng)場(chǎng)平均養(yǎng)牛頭數(shù)及標(biāo)準(zhǔn)差。763.10073375525.35717915.27410065.30,53.12xxxyyylllxy解:355. 0 xxxyllb74.12)65.30

17、25.31(355. 053.12)(xXbyylr187.0)()(035.0)(2111)(2lrlrxyyyelryvysbllnnfsnfyv標(biāo)準(zhǔn)差為二、分層隨機(jī)抽樣下的回歸估計(jì)二、分層隨機(jī)抽樣下的回歸估計(jì) 在大樣本時(shí), 1. 分別回歸估計(jì):分別回歸估計(jì):若各層的樣本量比較大時(shí),各層可分別進(jìn)行回歸估計(jì),再進(jìn)行加權(quán)平均,所得估計(jì)量稱為分別回歸估計(jì)。 LhehhhhlrshLhhyhhhhLhlrhhLhhhlrshLhhhhhhLhlrhhLhhhlrssnfWYvSnfWyVWYVWYVxXyWyWYWY122122212121111:11)()(:)()(未知時(shí),當(dāng)方差的樣本估計(jì))(

18、)(未知時(shí),當(dāng)方差2. 聯(lián)合回歸估計(jì):聯(lián)合回歸估計(jì):若 某些層的樣本量比較小時(shí),可以采用聯(lián)合比估計(jì)。對(duì)兩個(gè)指標(biāo)先求總體均值或總和的分層估計(jì),然后用它們構(gòu)造回歸估計(jì),所得估計(jì)量稱為聯(lián)合回歸估計(jì)。 LhxhcxyhcyhhhhlrclrcLhxhhhhLhxyhhhhcststlrcSBSBSnfWyVyVSnfWSnfWBxXyy1222212212)2(111:)()()達(dá)到最小,即(時(shí),取當(dāng)當(dāng)回歸系數(shù)未知時(shí),方差LhxhcxyhcyhhhhlrcLhxhhhhLhxyhhhhcsbsbsnfWyvsnfWsnfWb1222212212)2(111)(時(shí),取當(dāng)3. 分別回歸估計(jì)與聯(lián)合回歸估計(jì)的

19、比較:分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較:1.3 等概率整群抽樣估計(jì)11niiniiyyM11niittniiyYM yMM2221122()()11( )11NNiiiiiiiiYYMMYYffV ynMNnMN222221()(1)( )( )( )1NiiitiYYMNfV YM V yN M V ynN估計(jì)量的方差分別是:21222222111()1( )111(2)1niiiinnniiiiiiiiyyMfv ynmnfyyMyM ynmn)(yV與 的樣本估計(jì)分別是:)(YV22122222111()(1)( )1(1)1(2)1niiinnniiiiiiiyyMNfv YnnNfy

20、yMyM ynn例:某縣有33個(gè)鄉(xiāng),726個(gè)村,該年度某種作物總種植面積30525畝,現(xiàn)采用等概抽樣隨機(jī)抽出10個(gè)鄉(xiāng),要求估計(jì)全縣總產(chǎn)量,計(jì)算抽樣誤差。 調(diào)查資料如下:樣本鄉(xiāng)編號(hào)村莊數(shù) Mi作物總產(chǎn)量(鄉(xiāng)) yi(萬(wàn)公斤)種植面積(鄉(xiāng)) xi(畝)iiiMyy 123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合計(jì) 209 257.1 8940 分別采用幾種方法估計(jì)1 無(wú)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論