抽樣調(diào)查——比估計_第1頁
抽樣調(diào)查——比估計_第2頁
抽樣調(diào)查——比估計_第3頁
抽樣調(diào)查——比估計_第4頁
抽樣調(diào)查——比估計_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第五章 比估計與回歸估計5.1 比估計比估計一、使用比估計的兩種情況一、使用比估計的兩種情況即即之之比比值值均均值值)體體的的兩兩個個指指標(biāo)標(biāo)總總量量(或或所所需需估估計計的的目目標(biāo)標(biāo)值值是是總總,1.1.比值比值( (或比率或比率) )XYXYR 例例: :絕對貧困絕對貧困以上以上勉強(qiáng)度日勉強(qiáng)度日小康小康富裕富裕最富裕最富裕以下以下消費(fèi)性總支出金額消費(fèi)性總支出金額食品支出金額食品支出金額恩格爾系數(shù)恩格爾系數(shù)所占的比例。即:所占的比例。即:性總支出金額中性總支出金額中指食品支出金額在消費(fèi)指食品支出金額在消費(fèi)恩格爾系數(shù)恩格爾系數(shù)6 . 06 . 05 . 05 . 04 . 04 . 03 .

2、03 . 0: XYR金金額額平平均均每每戶戶消消費(fèi)費(fèi)性性總總支支出出平平均均每每戶戶食食品品支支出出額額爾爾系系數(shù)數(shù)一一個個國國家家或或地地區(qū)區(qū)的的恩恩格格 城鄉(xiāng)居民家庭人均收入及恩格爾系數(shù)年份城鎮(zhèn)居民家庭人均可支配收入(元)農(nóng)村居民家庭人均純收入(元)城鎮(zhèn)居民家庭恩格爾系數(shù) (%)農(nóng)村居民家庭恩格爾系數(shù)(%)1978343.4133.657.567.71980477.6191.356.961.81985739.1397.653.357.819901510.2686.354.258.819954283.01577.750.158.620006280.02253.439.449.1200168

3、59.62366.438.247.720027702.82475.637.746.220038472.22622.237.145.620049421.62936.437.747.2200510493.03254.936.745.5200611759.53587.035.843.0元元以以上上)(元元)(元元)(元元)(:的的每每盒盒最最高高價價格格范范圍圍是是若若會會購購買買,您您所所能能承承受受)不不會會()會會(,您您會會不不會會購購買買?假假如如市市場場上上有有奶奶酪酪出出售售1141093862541.221.1,其他元高價格范圍是人會購買且能承受的最,第,其他人會購買奶酪,第人,設(shè)總

4、體有元者所占的比例。能承受的最高價格在要估計會購買的人中,05410154iYiXNii 例例: “: “篩選性篩選性”問題問題XYXYRNiiNii 11因此,要估計的是因此,要估計的是 例例:1802:1802年,法國的年,法國的LaplaceLaplace受政府委托進(jìn)行法受政府委托進(jìn)行法國人口的估計與推算。推算方法如下:國人口的估計與推算。推算方法如下:已知)已知)總體的出生人口數(shù)總體的出生人口數(shù)總體的人口總數(shù)總體的人口總數(shù)(XYR 2.2.利用輔助變量的信息改進(jìn)估計的精度利用輔助變量的信息改進(jìn)估計的精度35.28 樣樣本本的的出出生生人人口口總總數(shù)數(shù)樣樣本本的的人人口口數(shù)數(shù)RRXY 即

5、總體的人口總數(shù)即總體的人口總數(shù)已知已知的比估計量:的比估計量:XXRYYR, 利用輔助變量的信息改進(jìn)估計的精度利用輔助變量的信息改進(jìn)估計的精度XRYXYR ,因此,因此已知已知的比估計量:的比估計量:XXRYYR, 已知已知的比估計量:的比估計量:XXRYYR, XYR 比比值值估估計計量量已知已知的比估計量:的比估計量:XXRYYR, 計計估估比比 比估計的使用條件:比估計的使用條件:(1)調(diào)查變量與輔助變量間有正線性相關(guān)關(guān)系,且大致呈正比例; (如果輔助變量與調(diào)查變量間有負(fù)線性相關(guān)關(guān)系,則要采取乘積估計。)(2)估計 或Y時 ,一般要求輔助變量的總體總量或均值是已知的。(3)適用面廣,可以

6、用于簡單隨機(jī)抽樣,也可用于分層隨機(jī)抽樣、整群抽樣、多階抽樣等;Y二、簡單隨機(jī)抽樣下的比估計二、簡單隨機(jī)抽樣下的比估計1.1.比值估計量:比值估計量:XYR xy 對對于于簡簡單單隨隨機(jī)機(jī)抽抽樣樣Xxy XRYR 的比估計量:的比估計量:及及YY . 2xyR 對對于于簡簡單單隨隨機(jī)機(jī)抽抽樣樣XxyXRYR 2.2.比估計的性質(zhì):比估計的性質(zhì): 對于簡單隨機(jī)抽樣RREnxyR )() 1 (大時,大時,是有偏的。但當(dāng)是有偏的。但當(dāng)1)(1)()()2(122 NRXYXnfRVRMSENiii)2(1)2(122222222xyxyxxyySRSSRSXnfSRRSSXnf 證明:RREnXXR

7、YXxRyEXxRyExxRyERREXxnxxRyRxyRR)(大時,當(dāng))()()()(大時,當(dāng)0) 1 ( 11)()(111001)()()()()2(122122222222222NRXYXnfRMSERVNRXYnfSnfgVGgEgEgExRyExRygXRYGNiRXYGXxRyERRERMSERMSERVRRERERENiiiNiiigiii)()()()()()()(則,對每個總體單元,令)()(又)()()2(1)2(11)()(2)(11)()(11)(1)()(2222222212222122122xyxyxxyyNiiiiiNiiiNiiiSRSSRSXnfSRRSS

8、XnfNXXRXXYYRYYXnfNXRRXYYXnfNRXYXnfRVRMSE(3)比估計的方差估計1)(1)()(122NRXYXnfRVRMSENiii)2(1)(22221xxyysRsRsXnfRvRVX )(的的漸漸近近無無偏偏估估計計為為已已知知時時,當(dāng)當(dāng) NiiiRXYN12)(11估計估計可用可用 niiixRyn12)(11)2(12222xxyySRRSSXnf 11122 nxRyXnfniii)()2(111)(22221221xxyyniiisRsRsxnfnxRyxnfRvRVXxX )()(的漸近無偏估計為的漸近無偏估計為,則,則代替代替未知時,用未知時,用當(dāng)當(dāng)

9、例:某小區(qū)有例:某小區(qū)有19201920戶,從中隨機(jī)抽取了戶,從中隨機(jī)抽取了7070戶,戶,調(diào)查各戶的住房面積(單位:平方米)和家調(diào)查各戶的住房面積(單位:平方米)和家庭人口,得數(shù)據(jù):庭人口,得數(shù)據(jù): 試對人均住房面積作點(diǎn)估計和置信度為試對人均住房面積作點(diǎn)估計和置信度為95%95%的的區(qū)間估計。區(qū)間估計。7264.5xy1110 x52940.7,y260 x1821.4,y701iii701i2i701i2i701ii701ii 解:解:01. 72604 .1821701701 iiiixyR085. 011)(1222 nxRyxnfRvRVniii)()(的漸近無偏估計為:的漸近無偏估

10、計為:92.56372)(7012270170127012 iiiiiiiiiixRxyRyxRy 58. 744. 6%952121,)(,)(的置信區(qū)間為:的置信區(qū)間為:的置信度為的置信度為 RvuRRvuRR 3.3.比估計與簡單估計的比較比估計與簡單估計的比較21)()2(ySnfyVyY 的方差為:的方差為:的簡單估計的簡單估計)2(1)() 1 (222xyxyRRSRSSRSnfyVyYn 的的方方差差為為:的的比比估估計計足足夠夠大大時時,當(dāng)當(dāng)02(12(11)()(21222222)得:)得:()(xyxxyxyyRSRSSRnfSRSSRSnfSnfyVyV 單估計更精確。

11、單估計更精確。,即比估計較相應(yīng)的簡,即比估計較相應(yīng)的簡,則,則特別若特別若212/2/2 yxyxyxyxCCCCYSXSSRS 4.估計R時樣本量的確定:VXSnNnnVXNSVXSnRxyNSSXnfRVnVRdddNiiidd2200022221222211111,,其中解得:)(,其中)(大時,當(dāng)?shù)姆讲钌舷逓槿绻烙嫛N粗獣r,也可由)(由的樣本,抽一個容量為也可以通過試點(diǎn)調(diào)查時計,可以通過以往的資料估,xXxRynsnSniiidd122211估計估計 時樣本量的確定:時樣本量的確定:2222/10002222/12222/12/1122211111,1dSnNnnNdSdSnYVdR

12、xyNSSnfYVnddddRNiiiddR,其中解得:)()(,其中)(大時,當(dāng)?shù)慕^對誤差限為如果置信度為Y例:某公司有1000名職工,為了估計職工今年與去年病假工時的比率,要抽一個容量為n的簡單隨機(jī)樣本進(jìn)行調(diào)查。先隨機(jī)抽了10人作試點(diǎn)調(diào)查,數(shù)據(jù)如下:編號去年病假工時今年病假工時1121322425315154303253236626247101281516902101412希望以置信度95%,使估計R的絕對誤差不超過0.01,應(yīng)抽容量為多大的樣本?已知公司職工去年病假工時為16300。解:05. 1178187101101iiiixyR4245,4066,4463178,187101101

13、21012101101iiiiiiiiiiixyxyxy由試點(diǎn)調(diào)查的數(shù)據(jù)得:5222/1210122701221011012101210603. 296. 101. 03 .1610001630016300474. 3)(91265.312)(dVXXxRysxRxyRyxRyiiidiiiiiiiiii,已知334100050215021,50200220NnnnVXSnd例:審計員想估計一個醫(yī)院的財產(chǎn)的現(xiàn)在價值。從計算機(jī)存儲的記錄里查到,醫(yī)院的財產(chǎn)有2100項,共計價值950000元。為了估計現(xiàn)在的價值,擬在2100項目中隨機(jī)抽取n項。因為沒有信息可用來確定n,先隨機(jī)抽了15項,獲得數(shù)據(jù)整

14、理如下: 試確定n,使估計量的絕對誤差不超過500元(置信度為95%)。表示現(xiàn)在的價值。值,表示從計算機(jī)查到的價其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .24215115121511512151解:表示現(xiàn)在的價值。值,表示從計算機(jī)查到的價其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .2421511512151151215198. 00 .2425 .237151151iiiixyR406210050415041504)2100500(4444. 796

15、. 100222222/10NnnndSnd4444. 7)(1412218.1042)(151221512215115121512iiidiiiiiiiiiixRysxRxyRyxRy三、分層隨機(jī)抽樣下的比估計三、分層隨機(jī)抽樣下的比估計 在大樣本時, 1. 分別比估計:分別比估計:若 各層的樣本量比較大時,各層可分別進(jìn)行比估計,再進(jìn)行加權(quán)平均,所得估計量稱為分別比估計。 LhxhhxyhhyhhhhLhhNihihhihhhLhRhhLhhhRsLhhhhLhRhhLhhhRsSRSRSnfWNXRYnfWyVWYVWYVXRWyWYWYh1222211221212111)2(11)(1)(

16、)()(方差2. 聯(lián)合比估計:聯(lián)合比估計:若 某些層的樣本量比較小時,可以采用聯(lián)合比估計。對兩個指標(biāo)先求總體均值或總和的分層估計,然后用它們構(gòu)造比估計,所得估計量稱為聯(lián)合比估計。 LhxhxyhyhhhhRcststcRcSRRSSnfWyVXxyXRy12222)2(1)(方差5.2 回歸估計Linear regression 估計精度就比較高。為常數(shù))。這時,用比(可以認(rèn)為又比較大,相關(guān)系數(shù)的回歸直線通過原點(diǎn),關(guān)于如果。估計其實質(zhì)是用,已知的比估計量:簡單隨機(jī)抽樣中aaxyxyXYxyXXxyYYiiiiR)(的特征數(shù)呢?的信息來估計調(diào)查指標(biāo)如何利用輔助指標(biāo),的回歸直線不通過原點(diǎn)關(guān)于如果y

17、xxyii1.簡單隨機(jī)抽樣中的回歸估計量:簡單隨機(jī)抽樣中的回歸估計量:對于簡單隨機(jī)抽樣,總體均值和總體總和的回歸估計量分別為:lrlrYNYXxXbyY)(已知,其中YYEyYxXyYYXxxxyyyxyxylrlrlrlriiiiiiiii)(性質(zhì):記為以后)(的回歸估計為時,當(dāng))(的回歸值時,事先給定常數(shù))若(據(jù)結(jié)構(gòu):具有一元線性回歸的數(shù)與假定1000YYEXRXxyxXxyyyxyRxXyyyyxXyyYlrlrlrlrlr)(:性質(zhì))(即回歸估計為比估計)(時,當(dāng)計)(即回歸估計為差估(時,當(dāng)計)(即回歸估計為簡單估時,當(dāng))(的回歸估計為時,事先給定常數(shù)若110:00000)()(:性

18、質(zhì)22002212xxyylrSSSnfyV)的無偏估計。()是()(性質(zhì):)()()()(去估計均值的回歸估計就是用樣本或者說:(,其中(換個角度:證明:)()(:性質(zhì)lrxxyylrxxyyNiiiNiiiZlriiiniiniiilrxxyylryVsssnfyvSSSnfXXYYNnfYXXYNnfSnfyVYzYxXyzzznxXynxXyySSSnfyVi22002220022102102011002200221211111111)1)(1)212,即總體殘差方差。)(的相關(guān)系數(shù)。與為數(shù),的(有限)總體回歸系關(guān)于為其中)()(且)達(dá)到最小值,(時,)()(當(dāng)?shù)淖罴阎担┒ɡ恚海∟ii

19、NiiiyylrlrxxyNiiNiiieNEYYNSxyxyBSnfyVyVBSSXXXXYY12122222min2121001)(1111證明:)()(時,當(dāng))(得)(令)()(22min2020220022002110, 021ylrxxylrxxylrxxyylrSnfyVBSSdyVdBSSdydVSSSnfyV)(21)(2121211,1122212212222121yxyyxxyyniiiniieelrylrlrlrlrniiniiiiiiiibssnnlblnxxbyynyynssnfyvnSnfyVyMSEnYyEnxXbyyYxxxxyybBBxyxy)()()(其中樣本殘差)(大時性質(zhì):當(dāng))()()(大時,性質(zhì):當(dāng))(大時,性質(zhì):當(dāng))(的回歸估計為:)()(一般是未知的,本回歸系數(shù)。根據(jù)樣本計算時,為樣)若(據(jù)結(jié)構(gòu):具有一元線性回歸的數(shù)與假定例:例:總體由75308個農(nóng)場組成,設(shè)yi為第i個農(nóng)場養(yǎng)牛的頭數(shù), xi為第i個農(nóng)場的面積。已知農(nóng)場平均面積為31.25英畝,選取一個樣本容量為2055的簡單隨機(jī)樣本。經(jīng)計算得: 試估計每個農(nóng)場平均養(yǎng)牛頭數(shù)及標(biāo)準(zhǔn)差。763.1007

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論