




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Economics 20 - Prof. Anderson1多元回歸分析Multiple Regression Analysis y = b0 + b1x1 + b2x2 + . . . bkxk + u 7. 模型設(shè)定與數(shù)據(jù)問題Specification and Data Problems模型設(shè)定和數(shù)據(jù)問題1、誤差的異方差性可以看做是一種模型誤設(shè),但它只是相對(duì)次要的一種。無論什么原因,如果誤差u與解釋變量相關(guān),我們就稱xj為內(nèi)生解釋變量。遺漏一個(gè)關(guān)鍵變量能導(dǎo)致誤差與某些解釋變量相關(guān),在這種情況下,模型就存在函數(shù)形式的誤設(shè)問題。Economics 20 - Prof. Anderson3函數(shù)設(shè)
2、定問題Functional Form如果一個(gè)多元回歸模型沒有正確地確定解釋變量和被解釋變量之間的關(guān)系,那就存在函數(shù)形式的誤設(shè)問題。 若真實(shí)模型為:而我們估計(jì)了:Economics 20 - Prof. Anderson4函數(shù)設(shè)定問題Functional Form (續(xù)) 遺漏重要解釋變量并非模型形式誤設(shè)的唯一可能。 如上述例子中被解釋變量沒有取對(duì)數(shù),而是使用了水平值。 在許多情形下,使用某些變量的對(duì)數(shù)形式和添加二次項(xiàng),就足以發(fā)現(xiàn)經(jīng)濟(jì)學(xué)中的許多非線性關(guān)系。聯(lián)合排除性約束的F檢驗(yàn)是偵察模型誤設(shè)的有力工具。比如,如果所增加的平方項(xiàng)是顯著的,就可以把它放在模型中。Economics 20 - Prof
3、. Anderson5拉姆齊的RESET檢驗(yàn) RESET 是依靠一個(gè)類似于懷特檢驗(yàn)的竅門。 不是直接增加解釋變量的函數(shù)形式,而是增加和檢驗(yàn)的函數(shù)形式:y = b0 + b1x1 + + bkxk + d12 + d23 +error 檢驗(yàn): H0: d1 = 0, d2 = 0 ,可以使用 FF2,n-k-3 或 LM22進(jìn)行檢驗(yàn)。對(duì)非嵌套模型的米宗和理查德檢驗(yàn)(Mizon and Richard,1986)對(duì)于下面兩個(gè)模型:構(gòu)造一個(gè)更大的模型對(duì)非嵌套模型的米宗和理查德檢驗(yàn)(Mizon and Richard,1986)該模型為:對(duì)應(yīng)的虛擬假設(shè)為針對(duì)對(duì)數(shù)模型針對(duì)水平值模型Economics 2
4、0 - Prof. Anderson8戴維森麥金農(nóng)檢驗(yàn) (Davidson-Makinon Test)在兩個(gè)非嵌套模型的比較中,使用一個(gè)模型中的 在另一個(gè)模型中進(jìn)行回歸,并檢驗(yàn)其顯著性。 若顯著,表明另一個(gè)模型需要修改。Economics 20 - Prof. Anderson9比較下面兩個(gè)模型:Economics 20 - Prof. Anderson10 如果拒絕H0,表明水平值模型有問題。 或者檢驗(yàn):如果拒絕H0,表明對(duì)數(shù)值模型有問題。 Economics 20 - Prof. Anderson11代理變量Proxy Variables 假如由于一個(gè)重要的解釋變量缺乏資料而導(dǎo)致模型誤設(shè)怎
5、么辦? 通過使用代理變量可以避免或減輕遺漏變量的偏誤。Economics 20 - Prof. Anderson12例9.1 IQ做為能力的代理變量考慮下面的工資決定方程:不過,因?yàn)槟芰茈y觀察到,故使用能力的代理變量。比如IQ遺漏變量與解釋變量相關(guān),會(huì)導(dǎo)致的偏誤。Economics 20 - Prof. Anderson13更一般的方程為:不過,因?yàn)閤3* 很難觀察到,故使用其代理變量。即估計(jì):我們不知道x3* ,但知道x3Economics 20 - Prof. Anderson14代理變量Proxy Variables (續(xù)) 為了得到b1 和 b2的無偏估計(jì)量,我們需要什么條件呢?1、
6、u 與x1, x2 , x3*和 x3無關(guān)。它表明一旦模型中包括了x1, x2 , x3* ,代理變量x3就不重要了。2、v 與 x1, x2 和 x3無關(guān)。 E(x3* | x1, x2, x3) = E(x3* | x3) = d0 + d3x3 x3是x3* 的好代理變量,一旦給定了x3,x3*與x1, x2 無關(guān)。 Economics 20 - Prof. Anderson15將經(jīng)過變換,實(shí)際上是對(duì)下式進(jìn)行回歸: y = (b0 + b3d0) + b1x1+ b2x2 + b3d3x3 + (u + b3v)Economics 20 - Prof. Anderson16代理變量Pro
7、xy Variables (續(xù)) 如果沒有上述假定,我們得到的估計(jì)量就是有偏誤的。 比如說:未觀測(cè)變量與代理變量x3之間的真實(shí)關(guān)系為: x3* = d0 + d1x1 + d2x2 + d3x3 + v3 回歸式為: y = (b0 + b3d0) + (b1 + b3d1) x1+ (b2 + b3d2) x2 + b3d3x3 + (u + b3v3) 偏誤的大小和方向取決于b3 和 dj的大小和方向。Economics 20 - Prof. Anderson17 自變量 (1) (2) (3) edu0.065(O.006) 0.054(0.007) 0.018(0.041)exper
8、0.014(0.003) 0.014(0.003) 0.014(0.003) tenure0.012(0.002)0.011(0.002)0.011(0.002) married0.199(0.039) 0.200(0.039) 0.201 (0.039) South-0.091(0.026) -0.08(0.026)-0.08(0.026) urban 0.184(0.027) 0.182(0.027) 0.184(0.027) black-0.188(0.038) -0.143(0.039) -0.147(0.04)IQ 0.036(0.001) -0.009 (0.0052) Educ.
9、IQ 0.00034(0.00038)R2 0.253 0.263 0.263Economics 20 - Prof. Anderson18第一列是沒有能力的代理變量IQ,教育的回報(bào)為6.5。當(dāng)在模型中增加了代理變量IQ后,教育的回報(bào)為5.4。一個(gè)在其他方面相同的黑人比白人少掙14.3%。在該模型中加入能力和教育的交互項(xiàng)后,教育和能力的顯著性水平都降低,該交互項(xiàng)本身也不顯著。第(2)列的模型較好。 Economics 20 - Prof. Anderson19滯后因變量可做代理變量Lagged Dependent Variables 假如模型中有未觀測(cè)到的變量,而你又找不到合適的代理變量怎么辦
10、?可以包括一個(gè)被解釋變量的滯后項(xiàng)來代表所有那些對(duì)被解釋變量有影響的遺漏變量。 顯然,你必須考慮滯后的y和現(xiàn)在的y 是相關(guān)的,這樣做才有意義。Economics 20 - Prof. Anderson20例94 一個(gè)關(guān)于城市犯罪率的模型該模型用1987年的失業(yè)率,執(zhí)法支出來解釋犯罪率。為了控制決定犯罪率的其他因素,模型中包含了1982年的犯罪率。把滯后期的犯罪率包括進(jìn)來,目的是更好地估計(jì)執(zhí)法支出和失業(yè)率對(duì)犯罪的影響。因變量log(crmrte87)Economics 20 - Prof. Anderson21 自變量 (1) (2) Umem87 -0.029(0.032) 0.009(0.02
11、) Log(lawexpc87) 0.203 (0.173) -0.14(0.109)Log(crmrte82) 1.194(0.132) 截距 0.076(0.821) 觀測(cè)次數(shù) 46 46R2 0.057 0.68Economics 20 - Prof. Anderson22測(cè)量誤差Measurement Error 有時(shí),我們有所要的變量,但它卻有測(cè)量誤差。舉例: 當(dāng)調(diào)查收入時(shí),被調(diào)查對(duì)象可能會(huì)故意隱瞞收入。也可能是由于時(shí)間久遠(yuǎn)或缺乏準(zhǔn)確的記錄。如你在過去的一年里工作了多少小時(shí),或當(dāng)你的小孩很小時(shí)你雇人照看小孩的周數(shù)是多少?因變量 y 的測(cè)量誤差不同于自變量 x的測(cè)量誤差。Economi
12、cs 20 - Prof. Anderson23因變量中的測(cè)量誤差 把測(cè)量誤差定義為測(cè)量值與實(shí)際值之差: e0 = y y* 這樣, 實(shí)際回歸式為: y = b0 + b1x1 + + bkxk + u + e0 什么情況下OLS 能得到無偏的估計(jì)量? 如果e0 和 xj都不相關(guān),估計(jì)量就是無偏的。 如果 E(e0) 0 ,那么 b0 是有偏的。 與沒有測(cè)量誤差時(shí)相比方差要大。Economics 20 - Prof. Anderson24實(shí)際儲(chǔ)蓄saving*與報(bào)告的儲(chǔ)蓄saving不一致是很正常的,但關(guān)鍵是測(cè)量誤差是否與模型中的解釋變量inc, size,edu, age等因素相關(guān)。收入越高
13、的家庭報(bào)告的儲(chǔ)蓄越不準(zhǔn)確嗎?或受教育水平越高的人報(bào)告的儲(chǔ)蓄越準(zhǔn)確嗎?或年齡越大的人報(bào)告的儲(chǔ)蓄越可信嗎??jī)?chǔ)蓄函數(shù)中的測(cè)量誤差Economics 20 - Prof. Anderson25解釋變量中的測(cè)量誤差 把測(cè)量誤差定義為:e1 = x1 x1* 假定 E(e1) = 0 將 x1* =x1 e1帶入y = b0 + b1 x1* + u ,可得: y = b0 + b1x1 + (u b1e1) 測(cè)量誤差對(duì)OLS 估計(jì)量的影響取決于e1 和 x1 , x1*相關(guān)的假定。 假定Cov(x1, e1) = 0 OLS是無偏的,方差更大。Economics 20 - Prof. Anderson2
14、6解釋變量中的測(cè)量誤差 (續(xù)) 假設(shè) Cov(x1*, e1) = 0, 這種情況被稱為經(jīng)典含變量誤差假定,那么: Cov(x1, e1) = E(x1e1) = E(x1*e1) + E(e12) = 0 + se2上式表明x1 與誤差項(xiàng)是相關(guān)的,所以 估計(jì)量是有偏的。Economics 20 - Prof. Anderson27解釋變量中的測(cè)量誤差 (續(xù)) 注意,相乘的誤差項(xiàng)為:Var(x1*)/Var(x1) 因?yàn)?Var(x1*)/Var(x1) 1,估計(jì)量是偏向于0的,稱之為衰減偏誤 (attenuation bias)。多元回歸中情況會(huì)更復(fù)雜一些,但在經(jīng)典含變量誤差假定下仍會(huì)出現(xiàn)衰
15、減偏誤。(估計(jì)參數(shù)的顯著性下降)Economics 20 - Prof. Anderson28例94 解釋變量中的測(cè)量誤差家庭收入很容易被誤測(cè)如果CEV成立,測(cè)量誤差導(dǎo)致衰減偏誤。 Economics 20 - Prof. Anderson29數(shù)據(jù)缺失(Missing Data) 是問題嗎?如果模型中變量之一的觀測(cè)值有缺失的數(shù)據(jù),該觀測(cè)將不被使用。 如果數(shù)據(jù)的缺失是隨機(jī)的,那么就只使用那些沒有缺失數(shù)據(jù)的觀測(cè)值就可以了。 如果數(shù)據(jù)的缺失是系統(tǒng)性的,就會(huì)出現(xiàn)問題。比如說,高收入的個(gè)人拒絕提供收入數(shù)據(jù)。Economics 20 - Prof. Anderson30非隨機(jī)樣本Nonrandom Sam
16、ples 如果樣本是基于x 變量而選擇的,就稱為外生樣本選擇,在這種情況下,估計(jì)量是無偏的。如果樣本是基于 y 變量而選擇的, 就稱為內(nèi)生樣本選擇。在這種情況下,就會(huì)出現(xiàn)樣本選擇偏差。Economics 20 - Prof. Anderson31外生樣本選擇假如數(shù)據(jù)是基于35歲以上的人做的調(diào)查,我們就得到了所有成年人的一個(gè)非隨機(jī)樣本。仍然可得到無偏和一致估計(jì)量,因?yàn)榭傮w的特征適用于任何一個(gè)子樣本。Economics 20 - Prof. Anderson32內(nèi)生樣本選擇假如只有財(cái)富小于100萬的人被包括在樣本中,估計(jì)量一般是有偏的和不一致的。Economics 20 - Prof. Ander
17、son33異常值Outliers 有時(shí)某一次觀測(cè)可能與其他觀測(cè)有很大的不同,并且對(duì)回歸結(jié)果有很大的影響。有時(shí)異常值是由于數(shù)據(jù)輸入時(shí)發(fā)生錯(cuò)誤造成的,因此,做統(tǒng)計(jì)摘要很重要。 有時(shí)觀測(cè)值確實(shí)與其他值不一樣。Economics 20 - Prof. Anderson34異常值Outliers (續(xù)) 當(dāng)發(fā)生明顯的輸入錯(cuò)誤時(shí),修正觀測(cè)值是很合理的。 當(dāng)確實(shí)有極端的異常值時(shí),舍棄該觀測(cè)值是很合理的。不過,讀者更愿意看到有異常值和沒有異常值時(shí)的對(duì)比。Economics 20 - Prof. Anderson36例96 州的嬰兒死亡率 (20.43) (2.60) (1.51) (0.287) n=51 R2=0.139 infmort表示嬰兒死亡率,pcinc代表人均收入,physic表示10萬居民擁有的醫(yī)生數(shù),popul表示人口總數(shù)。人均收
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 我國(guó)體教融合研究的概況、熱點(diǎn)與展望
- 協(xié)議用工合同范本
- 制作混凝土合同范本
- 危修橋合同范本
- “沉淀溶解平衡”單元教學(xué)設(shè)計(jì)初探
- 勞務(wù)派遣解除合同范本
- 農(nóng)村房租改造合同范本
- 2025年山東省建筑安全員知識(shí)題庫(kù)及答案
- 單位飯?zhí)媒ㄔO(shè)合同范本
- 代銷及推廣合同范本
- 小學(xué)語文六年級(jí)上閱讀總24篇(附答案)
- v建筑主墩雙壁鋼圍堰施工工藝資料
- 人教版新課標(biāo)小學(xué)美術(shù)二年級(jí)下冊(cè)全冊(cè)教案
- 病歷書寫基本規(guī)范及相關(guān)法律解析
- 我國(guó)互聯(lián)網(wǎng)公司資本結(jié)構(gòu)分析-以新浪公司為例
- 【藍(lán)天幼兒園小一班早期閱讀現(xiàn)狀的調(diào)查報(bào)告(含問卷)7800字(論文)】
- 2023年全國(guó)職業(yè)院校技能大賽賽項(xiàng)-ZZ005 裝配式建筑構(gòu)件安裝賽項(xiàng)模塊一理論賽題
- 第二次全國(guó)土地調(diào)查技術(shù)規(guī)程完整版
- 客戶答謝活動(dòng)承包合同
- AQ/T 5201-2007 涂裝工程安全設(shè)施驗(yàn)收規(guī)范(正式版)
- 華南師范大學(xué)333教育綜合專業(yè)碩士歷年考研真題匯編(含部分答案)合集
評(píng)論
0/150
提交評(píng)論