第四章 比估計與回歸估計_第1頁
第四章 比估計與回歸估計_第2頁
第四章 比估計與回歸估計_第3頁
第四章 比估計與回歸估計_第4頁
第四章 比估計與回歸估計_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、第四章 比估計與回歸估計n第一節(jié) 概述n第二節(jié) 比估計n第三節(jié) 回歸估計n第四節(jié) 分層比估計與分層回歸估計n一、問題的提出一、問題的提出 在許多實際問題中常常涉及兩個調(diào)查變量(指標)Y 和X 。對于包含N個抽樣單元的總體除了對總體信息進行估計外,常常要估計總體比率R。總體比率在形式上總是表現(xiàn)為兩個變量總值或均值之比。 在涉及兩個變量的抽樣調(diào)查中,有兩種情況需要應用比率估計量。一種情況是利用雙變量樣本對總體比率進行估計需應用比率估計量,此時兩個變量均為調(diào)查變量。另一種情況是一個變量為調(diào)查變量,另一個變量表現(xiàn)為與調(diào)查變量有密切關系的輔助變量,在對調(diào)查變量總體總值、總體均值等目標量進行估計時,利用已

2、知的輔助變量信息構(gòu)造比率估計量可以改進估計的精度。 基于這種考慮利用已知的輔助變量信息構(gòu)造比率估計量就可使估計精度加以改進。比估計回歸估計第一節(jié)第一節(jié) 概述概述n二、輔助變量的選擇二、輔助變量的選擇輔助變量與調(diào)查變量之間存在較密切的相關性或線性關系;輔助變量的有關資料是能夠事先掌握的;要求樣本容量比較大。因為小樣本時,比率估計是一個有偏的估計,只有樣本量比較大時,偏誤可以忽略不計。n例1:設某縣農(nóng)村的33戶家庭收支調(diào)查資料,其中家庭人數(shù)X1,收入X2,食品支出Y, (假設是月度資料,數(shù)據(jù)省略,僅說明問題) 要求估計: (1)每個家庭每月用于食品的支出; (2)平均每人用于食品的支出; (3)食

3、品支出占收入的比重。 分析:在要求(2)中,要求估計平均每人用于食品的支出,顯然須將33 戶的食品支出相加,33戶家庭人數(shù)相加,然后相比,因此這本身就是一個比率估計的問題。又如要求(3)中要求估計食品支出占收入的比重,看來似乎是個比例問題,但從現(xiàn)有材料以戶作為抽樣單位,食品支出和收入都是隨機變量,因此也是一個比率估計問題。只有要求(1)是一個均值的簡單估計問題。舉舉 例例n分析:確切的含糖總量只有把全部橘子做成橘子汁以后進行加工提煉才能得到,因此必須用抽樣的方法。 思路一:假設現(xiàn)在用簡單隨機抽樣的方法從中抽取n個橘子為樣本,一種簡單的估計推斷方法是測定每個橘子的含糖量y1,y2,yn。然后計算

4、樣本平均數(shù) ,來估計總體平均數(shù) ,最后用橘子的總數(shù)N乘以每個橘子的平均含糖量來估計總的含糖量。這種方法實行起來比較苦難,因為橘子的總數(shù)N不容易數(shù)清,此外,如果橘子的大小差別很大時也不容易估計精確。 思路二:利用一個輔助變量,因為每個橘子的含糖量yi與他們的重量xi有密切聯(lián)系,呈現(xiàn)高度相關。因此當我們在測定n個橘子的含糖量的同時,也測定其重量,得到橘子的含糖量與重量之間的一個比率,如果我們知道橘子的總重量,就可以通過以下的關系求得總含糖量:yY例2:有一批橘子,欲估計其含糖總量。xyXY樣本重量樣本含糖量總重量總含糖量第二節(jié) 比估計n一、定義及基本性質(zhì)一、定義及基本性質(zhì)1、總體比率:樣本比率:根

5、據(jù)樣本中調(diào)查變量與輔助變量的資料,通過計算樣本比率來估計總體比率,進而利用此資料對調(diào)查標志的總體平均數(shù)和總體標志總量進行估計的方法稱為比估計。XYRorXYRxyRorxyR2、樣本比率對總體比率的估計是有偏誤的。當樣本容量n充分大時,這種偏誤趨近于03、估計總體平均數(shù)及總體標志總量 稱為比估計量XRNXxyXRYRXYXYRXxyXRYXRYXYRYYR,4、樣本估計量的均方誤差5、估計量的方差22)(1111)(iiRXYXNnfRMSE22)(1111)()(iiRXYXNnfRMSERV)()()()()()()(2222RVXNYVNYNVYVRVXXRVYVRRRR6、相對方差、相

6、對協(xié)方差)2(2)(112222222XYXYxyXYiiCCCYRSSRSRXYN)2(1)()()()(222222XYXYRRCCCnfRRVYYVYYVcv二、方差估計及置信區(qū)間二、方差估計及置信區(qū)間1、方差估計均是有偏估計量很難比較兩者優(yōu)劣)2(1)()2(1)(2222222221xyxyxyxysRsRsxnfRvsRsRsXnfRv)2()1 ()()2(1)(2222222xyxyRxyxyRsRsRsnfNYvsRsRsnfYv2、置信區(qū)間當 時,當上述條件不滿足時,1 . 0)(, 1 . 0)(,30ycvxcvn)(, )(RvuRRvuR2222222221 )()

7、2()1(xyxxyyxxyxycucccucccucuRxysnfxyscxsnfxscysnfyscyxxyxyxxxyyy11,122222222222其中: 例:例:某街區(qū)有2000戶居民家庭,按簡單隨機抽樣方法抽出其中33戶家庭,調(diào)查其兩項指標:食物消費額(y),月收入(x),調(diào)查結(jié)果如下: 試用比率估計方法,以95%的可靠程度估計月收入中食物消費所占比重的置信區(qū)間。16002722836064958010160642 .544322xyxxyyiiii 例:例:交通運輸統(tǒng)計中有三個重要的指標,即運量、周轉(zhuǎn)量與平均運距,其中平均運距是總周轉(zhuǎn)量除以運量所得的商,為估計公路載貨汽車的平均

8、運距,在總體中用簡單隨機抽樣抽取32輛貨車,記錄每輛車在一個月內(nèi)的運量xi與周轉(zhuǎn)量yi,統(tǒng)計計算結(jié)果如下: 試估計平均運距R并給出它90%的置信區(qū) 間。1 .19972619.417710029993597429550022xyxyiisssxy相關系數(shù):)2(1)2(1)(222222yxxyxyxyRyxxySSRSRSnfRSSRSnfyVSSSn三、比估計的效果分析三、比估計的效果分析如果 兩種方法的估計效果基本相同。如果 比估計優(yōu)于簡單估計。兩種方法的優(yōu)劣可以歸結(jié)為相關系數(shù)是否大于1/2。022xyxCCC022xyxCCC 例:某系統(tǒng)共有N=687個單位,為預估當年全系統(tǒng)的工資總額

9、,用簡單隨機抽樣抽取一個n=26個單位的樣本,對樣本的資料統(tǒng)計如下: 已知上一年全系統(tǒng)工資總額(X)為70523.16萬元。試估計當年全系統(tǒng)的工資總額及估計的近似標準差 。3624.82590140.76738663.889696622.10019455.10922yxxysssxy第三節(jié)第三節(jié) 回歸估計回歸估計n一、定義一、定義回歸估計是通過對調(diào)查變量Y以及該變量有線性關系的輔助變量X建立回歸方程,然后運用回歸方程對總體指標進行推斷、估計的方法。在直角坐標系中,比估計表現(xiàn)為通過原點的回歸直線,而回歸估計可以通過原點,也可以不通過。比估計只能有一個輔助變量,而回歸估計可以利用多個輔助變量。總體

10、均值的回歸估計量定義為:總體總量的回歸估計量定義為: 差估計量 簡單估計量 比估計量)()(XxyxXyylrlrlryNY XxyyxyyyxXyylrlrlr01因此說,簡單估計量和比估計量都是回歸估計的特例。n 二、二、為設定常數(shù)為設定常數(shù))(0 xXyYlr)2(1)()2(1)(02020202xyxylrxyxylrsssnfYvSSSnfYVn例:例:設某縣有53個鄉(xiāng)鎮(zhèn),已知某年度小麥總播種面積為795000畝,現(xiàn)抽取10個鄉(xiāng)調(diào)查結(jié)果為總播種面積為152000畝,小麥總產(chǎn)量6262.4萬公斤,要求依以上資料對該縣平均每個鄉(xiāng)鎮(zhèn)的小麥總產(chǎn)量和全縣的小麥總產(chǎn)量作出回歸分析。(0=0.0

11、4)三、三、 為樣本回歸系數(shù)為樣本回歸系數(shù)22)()()(xyxiiilrssxxyyxxbxXbyY)1 (1)2(1)()(22222yyxxylrlrSnfbSSbSnfYVYMSE)(2111)(2222xyelrsbsnnnfsnfYvn例例1 1:某系統(tǒng)共有N=687個單位,為預估當年全系統(tǒng)的工資總額,用簡單隨機抽樣抽取一個n=26個單位的樣本,對樣本的資料統(tǒng)計如下: 上一年全系統(tǒng)工資總額(X)為70523.16萬元。試運用回歸估計計算當年全系統(tǒng)的工資總額及估計的近似標準差。3624.82590140.76738663.889696622.10019455.10922yxxysss

12、xy四、回歸估計量與比估計量及一般樣本四、回歸估計量與比估計量及一般樣本 平均數(shù)的比較平均數(shù)的比較在大樣本下,回歸估計總是優(yōu)于簡單估計量。在大樣本下,回歸估計總是優(yōu)于比估計。第四節(jié) 分層比估計與分層回歸估計n一、分別比估計與聯(lián)合比估計一、分別比估計與聯(lián)合比估計分別比估計:在分層隨機抽樣中,對每層樣本考慮比估計,然后進行加權(quán)平均或相加,所得的估計量稱為分別比估計分別比估計hhhhRhhRSRShhRSRhhhhhhhhhhhhhXxyWyWyYYWYyXRYXRYxyRXYR)2(1)2(1)()(22222222yhxhhhxhyhhhhxyhhxhyhhhhRSRShhhRSRSSSRSRS

13、nfWSRSRSnfWYVYMSEXxyyNY)()()(2RSRSRSYVNYVYMSE聯(lián)合比估計聯(lián)合比估計在分層隨機抽樣中,對兩個指標先求總體均值或總和的分層估計,然后用它們構(gòu)造比估計,所得的估計量為聯(lián)合比估計聯(lián)合比估計。)2()1 ()(,2222xyhxhyhhhhRCcRCcRChhhsthhhstststcRSSRSnfWYVXRYXRYxWxyWyxyRn二、分別回歸估計與聯(lián)合回歸估計二、分別回歸估計與聯(lián)合回歸估計分別回歸估計:在分層隨機抽樣中,對每層均值或每層總量作回歸估計,然后再加權(quán)平均或相加)2()1 ()()(2222xyhhxhhyhhhhlrshhhhhlrsSbSb

14、SnfWYVxXbyWY)2()1 ()(2222xyhcxhcyhhhhRCsRsRsnfWYv)2()1 ()(),(,2222xhyxhyhhhhhlrclrclrcststlrchhhsthhhstSSSnfWyVyNYxXyyxWxyWy聯(lián)合回歸估計:在分層隨機抽樣中,先對 及 作分層簡單估計,再 與 作聯(lián)合回歸估計。YXYY)1 () 1()2()1 ()(222hyhhhhhhlrsrsnnnfWYvhxhcyxhcyhhhhlrchhxhhhhhyxhhhcsbsbsnfWyvnsfWnsfWb)2()1 ()()1 ()1 (2222222n三、各種估計量的比較與選擇三、各種

15、估計量的比較與選擇對于兩種形式的比估計及兩種回歸系數(shù)都需要從樣本估計的回歸估計,估計量都是有偏的;對于分別估計,要求每層樣本量都較大,若某些層樣本量不夠大,建議采用聯(lián)合估計;回歸估計在小樣本時偏倚可能更大,這時采用比估計;若每層的樣本量都較大,每層的比估計或回歸估計都較有效,且每層的 或 相差較大,則分別估計比聯(lián)合估計更有效,估計量方差更??;若各層的回歸系數(shù)接近1,則可采用差估計。hhRn例:例:已知某市中央直屬單位及市屬單位1986年專業(yè)技術(shù)人員總數(shù),欲通過抽樣調(diào)查估計1988年年底全市專業(yè)技術(shù)人員的總數(shù)Y。抽樣按中直單位與市屬單位分層隨機抽取,前者抽15年單位,后者抽20個單位,數(shù)據(jù)如下表所示。已知中直單位N1=135個,1986年底總?cè)藬?shù)為X1=75650;市屬單位N2=1228個,1986底總?cè)藬?shù)為X2=315612人。估計該市1988年專業(yè)技術(shù)人員總數(shù)。中直單位市屬單位ixiyiixiyiixiyiixiyi1234567

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論