版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
伍德里奇《計量經(jīng)濟(jì)學(xué)導(dǎo)論》復(fù)習(xí)筆記和課后習(xí)題詳解■含有定
性信息的多元回歸分析:二值變量
第7章含有定性信息的多元回歸分析:二值(或虛擬)變量
7.1復(fù)習(xí)筆記
考點一:帶有虛擬自變量的回歸*****
1.對定性信息的描述
定性信息是指通常以二值信息(0-1)的形式出現(xiàn)的信息,如性別、
是否結(jié)婚等。在計量經(jīng)濟(jì)學(xué)中,二值變量又稱為虛擬變量。
2.只有一個虛擬自變量
(1)只有一個虛擬自變量的簡單模型
考慮決定小時工資的簡單模型:wage=[30+60female+pleduc
根據(jù)多元回歸的解釋方式,表示控制不變時,
+uo60educfemale
變化1單位給wage帶來的變化。假定零條件均值假定E(u|female,
educ)=0成立,那么:50=E(wage|female=1,educ)-E
(wage|female=0,educ),其中female=1表示女性,female
=0表示男性。可以發(fā)現(xiàn),在任意教育水平下,男性與女性的工資差異
是固定的,女性工資比男性工資多
60o
除了P0之外,模型中只需要引入一個虛擬變量。因為female+
所以引入兩個虛擬變量會導(dǎo)致完全多重共線性,即虛擬變
male=lz
量陷阱。
(2)當(dāng)因變量為log(y)時,對虛擬解釋變量系數(shù)的解釋
當(dāng)變量中有一個或多個虛擬變量,且因變量以對數(shù)的形式存在時,
虛擬變量的系數(shù)可以
理解為百分比的變化。將虛擬變量的系數(shù)乘以100,表示的是在
保持所有其他因素不變時y的百分?jǐn)?shù)差異,精確的百分?jǐn)?shù)差異為:
其中八
100-[exp(Api)-l]e
Pl是一個虛擬變量的系數(shù)。3.使用多類別虛擬變量
(1)在方程中包括虛擬變量的一般原則
如果回歸模型具有g(shù)組或g類不同截距,一種方法是在模型中包
含g-1個虛擬變量和一個截距?;M的截距是模型的總截距,某一組
的虛擬變量系數(shù)表示該組與基組在截距上的估計差異。如果在模型中
引入g個虛擬變量和一個截距,將會導(dǎo)致虛擬變量陷阱。
另一種方法是只包括g個虛擬變量,而沒有總截距。這種方法存
在兩個實際的缺陷:①對于相對基組差別的檢驗變得更繁瑣;②在模
型不包含總截距時,回歸軟件通常都會改變R2的計算方法。具體而
言,就是公式R2=1-SSR/SST中的總平方和SST,被一個沒有將y
i減去其均值的總平方和SST0取代,由此得到的R02=l-SSR/SST
0稱為未中心化的R2,從而有可能使得擬合優(yōu)度指標(biāo)失效。SST0的
計算公式為:
2
01SSTn
iiy==1(2)通過虛擬變量來包含序數(shù)信息
假設(shè)要估計城市信用等級對市政債券利率(MBR)的影響。城市
信用等級是一個序數(shù)變量,范圍是0~4,稱這個變量為CR??梢詫?/p>
CR的每個值都定義一個虛擬變量。由于有5個類別,所以可包括4個
虛擬變量,將零信用等級定為基組并省略。若CR=1,則CR1=1,
否貝I」CR1=O;若CR=2,貝UCR2=1,否貝!JCR2=0,以止匕類推。
因止匕,可以轉(zhuǎn)化為估計模型:MBR=PO+61CR1+62CR2+
63CR3+64CR4+其他因素。
以61為例,系數(shù)的解釋為:61為信用等級為1級的城市和信用
等級為0級的城市之間在MBR上的差異(保持其他因素不變)。
考點二:涉及虛擬變量的交互作用★★★★
1.虛擬變量之間的交互作用
具有定量意義的變量在回歸模型中可以具有交互作用,類似的,
虛擬變量也能產(chǎn)生交互作用。虛擬變量的交互作用就是在模型中引入
虛擬變量的乘積形式。
2.容許出現(xiàn)不同的斜率
(1)不含交互項的模型
在多元回歸模型中存在任意幾個組之間的截距不同的情況。在有
些情況下,虛擬變量也可與非虛擬的解釋變量有交互作用,從而出現(xiàn)
不同的斜率。
考慮模型:log(wage)=(pO+SOfemale)+(01+
Slfemale)educ+u。當(dāng)female=0時,模型可以寫成:log
(wage)=pO+pleduc+u;當(dāng)female=1時,模型變?yōu)椋簂og
度量的是男性和女性
(wage)=(30+60+(pl+51)educ+uo60
在截距上的差異,而61度量男性和女性在斜率(即受教育回報)上的
差異。
(2)含有交互項的模型
考慮模型:log(wage)=p0+80female+pleduc+
一個重要的假設(shè)是,男性和女性受教育的回報是
81female-educ+uo
相同的,這可以表述成H0:81=0。這意味著log(wage)對educ
的斜率對男性和女性而言無差異。在這個虛擬假設(shè)之下,允許在不同
教育水平下,男性和女性的工資存在差異,但性別工資差異在各種相
同教育水平上必須相同。
若對受教育程度相同的男性和女性的平均工資相同這個假設(shè)感興
趣,則50和61都必須同時為零。必須使用F檢驗來檢驗虛擬假設(shè)H0:
80=0,81=0o
3.檢驗不同組之間回歸函數(shù)上的差別
在含有k個解釋變量和1個截距項的一般模型中,假設(shè)有兩組g二
和。對和將模型寫成:
1g=2g=lg=2y=Pg,O+pg,lxl+pg,
2x2+...+0g,kxk+uo
檢驗這兩組的截距和所有斜率都相同,就意味著產(chǎn)生了k+1個約
束??梢哉J(rèn)為無約束模型除了截距和變量本身外,還有一組虛擬變量
和交互項,那么其自由度為n-2(k+1).無約束模型的殘差平方和
可通過兩個分離的回歸得到,這兩個不同回歸分別對應(yīng)著兩個不同的
組,令SSR1(SSR2)表示針對第一組(第二組)估計式所得到的殘
差平方和,它涉及nl(n2)個觀測。而約束模型的殘差平方和就是將
兩組混合在一起并估計同一個方程時所得到的SSRp。
在此基礎(chǔ)上,就可以計算F統(tǒng)計量:F={[SSRp-(SSR1+
SSR2)]/(SSRl+SSR2)}-{[n-2(k-1)]/(k+1)}o其中,n為
總觀測次數(shù)。在計量經(jīng)濟(jì)學(xué)中,這也被稱為鄒至莊統(tǒng)計量。鄒至莊檢
驗的一個重要局限是原假設(shè)要求各組之間不存在任何差異。但在更多
情況下,允許組間的截距不同,然后再來檢驗斜率的差別會更有意義。
鄒至莊檢驗的步驟包括:
(1)分別對兩組數(shù)據(jù)進(jìn)行回歸估計得到殘差平方和SSR1和SSR2,
兩者之和即為無約束模型的殘差平方和。
(2)將兩組數(shù)據(jù)混合進(jìn)行估計得到殘差平方和SSRp,這就是為
受約束回歸殘差平方和。
(3)構(gòu)造F統(tǒng)計量,并與給定顯著水平下F的臨界值進(jìn)行比較。
若F值大于臨界值,
則拒絕原假設(shè),即說明兩個回歸函數(shù)存在差異。
考點三:二值因變量:線性概率模型★★★★
1.線性概率模型
考慮模型:y=BO+Blxl+02x2+...+Bkxk+uo在零條件均
值假定MLR.4成立時,E(y|x)=po+plx1+p2x2+...+pkxke
當(dāng)y是一個取值為0和1的二值變量時,P(y=l|x)=E(y|x)
總是成立的。因此有:P(y=1|x)=p0+plx1+p2x2+...+pkx
ko這意味著成功的概率p(x)=P(y=l|x)是所有x變量的一個
線性函數(shù)。
方程P(y=1|x)=p0+plx1+p2x2+...+0kxk是二值響應(yīng)
模型的一個例子,P(y=l|x)被稱為響應(yīng)概率。因為響應(yīng)概率是所
有參數(shù)P的線性函數(shù),所以這類模型又被稱為線性概率模型(LPM)。
在LPM中,在保持其他因素不變時,印度量因xj的變化導(dǎo)致成功概
率的變化(j=1,2k):?P(y=l|x)=Pj?xje
2.線性概率預(yù)測
以二值變量為因變量進(jìn)行預(yù)測時,預(yù)測的概率可能不會落在0~1
區(qū)間內(nèi)。令八yi表示擬合值,定義預(yù)測值iy在八yi1.5時取值為1,
并在八
yi
<0.5時取值為0?,F(xiàn)在,便得到一組預(yù)測值iy,這些預(yù)測值和y
i一樣,取值不是。便是1。利用yi和iy
的數(shù)據(jù),就可以得到正確預(yù)測yi=1和yi=0的頻率以及全部正
確預(yù)測的比例。若用百分比表示全部正確預(yù)測的比例,便是二值因變
量擬合優(yōu)度的一個廣泛使用的指標(biāo)。
3.線性概率模型可能存在異方差性
當(dāng)y是二值變量時,以x為條件的方差為:Var(y|x)=p(x)
[1-p(x)]0其中,p(x)=pO+plxl+...+pkxko這意味著,除
非概率與任何一個自變量都不相關(guān),否則,線性概率模型中就一定存
在著異方差性。因此,由于y的二值特性,線性概率模型違背了一個
高斯?馬爾可夫假定。
4.離散因變量的回歸結(jié)果解釋
一般地,在假設(shè)MLR.1和MLR.4下:E(y|xl,x2,xk)
=P0+plxl+p2x2+...+pkxkopj是指在其他條件不變時,xj的增
加對y的期望值的影響。給定一組xj值,擬合值
A
p0+Aplxl+Ap2x2+...+Apkxk就是E(y|xl,x2,,xk)
的一個估計。因此Mj是當(dāng)?xj=1時,對y的平均變動的估計(保持
其他因素不變)。
7.2課后習(xí)題詳解
一、習(xí)題
1.利用SLEEP75中的數(shù)據(jù)(也可參見第3章習(xí)題3),我們得到
如下估計方程:
sleep=3840X3-0.1bytotwrk-11.7\educ-8.70砍c+().1+87.75mHc
(235.11)(0.018)(5.86)(11.21)(0.134)(34.33)
/i?706?R)?0/23.F-0.117
變量sleep是每周晚上睡眠的總分鐘數(shù),totwrk是每周花在工作
上的總分鐘數(shù),educ和age則以年為單位,而male是一個性別虛擬
變量。
(i)所有其他因素不變,有沒有男性比女性睡眠更多的證據(jù)?這
個證據(jù)有多強(qiáng)?
(ii)工作與睡眠之間有統(tǒng)計顯著的取舍關(guān)系嗎?所估計的取舍關(guān)
系是什么樣的?
(iii)為了檢驗?zāi)挲g在其他因素不變的情況下對睡眠沒有影響這
個原假設(shè),你還需要另外做什么回歸?
答:(i)變量male的回歸系數(shù)是87.75,根據(jù)估計結(jié)果可知,男
性每周的睡眠時間要比女性每周的睡眠時間多近一個半小時。又因為
tmale=87.75/34.33-2.56
其值接近于99%的置信水平下的雙側(cè)檢驗的臨界值(大約為
2.58),因此男性比女性睡眠更多的證據(jù)是相當(dāng)強(qiáng)的。
(ii)變量totwrk的t統(tǒng)計量的值為:
ttotwrk=-0.163/0.018*-9.06
這是非常顯著的。這個系數(shù)表明每周平均多工作一個小時(60分
鐘),對應(yīng)的平均每周晚上睡眠將減少0.163x60,9.8(分鐘)。
(iii)需要對不含變量age和age2的模型進(jìn)行回歸,以便得到R
r2,即受約束模型的R2。當(dāng)模型中含有變量age和age2時,當(dāng)且僅
當(dāng)兩個變量age和age2前的系數(shù)均為0時,才表明年齡在其他因素
不變的情況下對睡眠沒有影響這個原假設(shè)成立。
2BWGHT中的數(shù)據(jù),可估計出如下方程:
log(hwfiht)=4.66一0.0044c/g,v+0.0093log(^famine)+0.016parity
(0.22)(0.0009)(0.0059)(0.006)
+O.O27male+0.055white
(0.010)(0.013)
/1=I388.R2=0.0472
和
log(hwfiht)=4.65-O.OO52c7g.v+0.011Olog(famine)
(0.38)(0.0010)(0.0085)
+0.017parity+0.034/wa/e
(0.006)(0.011)
+0,045while-0.0030molheduc+0.0032fatheduc
(0.015)(0.0030)(0.0026)
^=1191./?2=0.0493
變量定義和例4.9中一樣,但我們增加了兩個虛擬變量:一個虛擬
變量表明孩子是不是男孩,另一個虛擬變量則表明這個孩子是不是白
人。
(i)在第一個方程中,解釋變量cigs的系數(shù)。具體而言,每天多
抽10根煙對出生體重有何影響?
(ii)在第一個方程中,保持其他因素不變,預(yù)計一個白人孩子的
出生體重比一個非白人孩子重多少?這個差異是統(tǒng)計顯著的嗎?
(iii)評價motheduc的估計影響和統(tǒng)計顯著性。
(iv)從這些給定信息中,為什么不能計算出檢驗motheduc和
fatheduc聯(lián)合顯著性的F統(tǒng)計量?為了計算這個統(tǒng)計量,還需要做些
什么?
答[(i:如果變量cigs每增加10根,即每天多抽10根煙,則:
Alog(6wg/?/)=-0.0044x10=-0.044
即嬰兒出生體重將減少大約4.4%。
(ii)在第一個方程中,保持其他因素不變,預(yù)計一個白人孩子比
一個非白人孩子的出生體重多5.5%。另外,twhite*4.23,在一般常
用的顯著性水平下都是顯著的。因此,一個白人孩子與一個非白人孩
子的出生體重在統(tǒng)計上是有顯著差異的。
(iii)如果母親的教育年限每增加1年,孩子的出生體重將增加
這個影響是很小的,其因此母親的受教育年
0.3%,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版油氣田鉆井技術(shù)服務(wù)質(zhì)量承包合同3篇
- 2025年度環(huán)保型廠房設(shè)計與施工總承包合同3篇
- 二零二四年在線教育平臺軟件全國代理銷售合同模板2篇
- 2025年度全國范圍內(nèi)土地測繪技術(shù)服務(wù)合同范文3篇
- 2024年地基買賣合同附帶地基檢測及質(zhì)量認(rèn)證3篇
- 2025年大棚農(nóng)業(yè)綠色生產(chǎn)技術(shù)引進(jìn)合同3篇
- 2025年度綠色建筑:知識產(chǎn)權(quán)許可與環(huán)保建材合同3篇
- 2025年智慧能源物業(yè)工程承包及節(jié)能服務(wù)合同3篇
- 2025年度林業(yè)資源綜合利用承包合同樣本3篇
- 2024年高端手表定制與銷售合同
- 2024版塑料購銷合同范本買賣
- 【高一上】【期末話收獲 家校話未來】期末家長會
- JJF 2184-2025電子計價秤型式評價大綱(試行)
- GB/T 44890-2024行政許可工作規(guī)范
- 有毒有害氣體崗位操作規(guī)程(3篇)
- 兒童常見呼吸系統(tǒng)疾病免疫調(diào)節(jié)劑合理使用專家共識2024(全文)
- 二年級下冊加減混合豎式練習(xí)360題附答案
- TSG11-2020 鍋爐安全技術(shù)規(guī)程
- 汽輪機(jī)盤車課件
- 異地就醫(yī)備案個人承諾書
- 蘇教版五年級數(shù)學(xué)下冊解方程五種類型50題
評論
0/150
提交評論