




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、計(jì)量經(jīng)濟(jì)學(xué)概念公式第1章一、數(shù)據(jù)類型:截面、時(shí)間序列、面板1. 橫截面數(shù)據(jù)(cross-sectional data set)定義:對給定的某個(gè)時(shí)間點(diǎn)的個(gè)人、家庭、企業(yè)、城市、洲、國家或者一系列其他單位采集的樣本所構(gòu)成的數(shù)據(jù)集。常被用于勞動(dòng)經(jīng)濟(jì)學(xué)、健康經(jīng)濟(jì)學(xué)和農(nóng)村經(jīng)濟(jì)學(xué)中。重要特征:數(shù)據(jù)假定是從總體中通過隨機(jī)抽樣而得到。2. 時(shí)間序列數(shù)據(jù)(time series data)定義:在不同時(shí)間點(diǎn)上收集到的數(shù)據(jù),這類數(shù)據(jù)反映了某一事物、現(xiàn)象等隨時(shí)間的變化狀態(tài)或程度。如我國國內(nèi)生產(chǎn)總值從1949到2015的變化就是時(shí)間序列數(shù)據(jù)。3. 面板或縱列數(shù)據(jù)(panel data)定義:由數(shù)據(jù)集中每個(gè)橫截面單位
2、的一個(gè)時(shí)間序列組成與混合橫截面數(shù)據(jù)區(qū)別:面板數(shù)據(jù)的同一橫截面數(shù)據(jù)單位都被跟蹤了一段特定的時(shí)期。面板數(shù)據(jù)前后年份的樣本是相同的,具有可比性。但是混合橫截面數(shù)據(jù)前后年份的樣本很可能大部分不相同,不具有可比性。面板數(shù)據(jù)的優(yōu)點(diǎn):對同一單位的多次觀測,使我們能控制觀測單位的某些觀測不到的特征使我們能研究決策行為或結(jié)果中滯后的重要性。四、用數(shù)據(jù)度量因果效應(yīng),其他條件不變的概念1. 因果效應(yīng)經(jīng)濟(jì)學(xué)家的目標(biāo)就是要推定一個(gè)變量對另一個(gè)變量具有因果關(guān)系我們希望去解釋:什么導(dǎo)致一些事情發(fā)生?是這個(gè)因素還是那個(gè)因素?假設(shè)在現(xiàn)實(shí)世界中,X(自變量,一個(gè)可能的原因)確實(shí)是Y(因變量,被解釋的變量),那我們就能預(yù)見數(shù)據(jù)分析
3、支持以下假設(shè):如果X的數(shù)值增加,Y的數(shù)值也增加。但由于存在誤差或數(shù)據(jù)不足,統(tǒng)計(jì)檢驗(yàn)可能出錯(cuò)或被錯(cuò)誤地解釋。2. 其他條件不變(ceteris paribus)意味著“其他(相關(guān))因素保持不變”。在因果關(guān)系中,其他條件不變是具有重要作用的。多元回歸中,所得到的“其他因素不變的效應(yīng)”,并非是通過在實(shí)際抽樣中,固定其他因素不變。多元回歸分析的優(yōu)勢,在于它使我們能在非實(shí)驗(yàn)環(huán)境中去做自然科學(xué)家在受控實(shí)驗(yàn)中所能做的事情:保持其它因素不變。第2章一、回歸分析的基本概念現(xiàn)代意義的回歸是一個(gè)被解釋變量對若干個(gè)解釋變量依存關(guān)系的研究,回歸的實(shí)質(zhì)是由固定的解釋變量去估計(jì)被解釋變量的平均值。二、回歸分析的常用術(shù)語因變
4、量、被解釋變量、相應(yīng)變量、被預(yù)測變量、回歸子自變量、解釋變量、控制變量、預(yù)測變量、回歸元、協(xié)變量誤差項(xiàng)、干擾項(xiàng),表示除x之外其他影響y的因素,包括沒有觀測到的和不可觀測到的斜率參數(shù),代表了回歸元的邊際效果,是研究的主要興趣所在截距參數(shù)三、回歸中的四個(gè)重要概念1. 總體回歸模型(Population Regression Model,PRM)-代表了總體變量間的真實(shí)關(guān)系。2. 總體回歸函數(shù)(Population Regression Function,PRF)-代表了總體變量間的依存規(guī)律。3. 樣本回歸函數(shù)(Sample Regression Function,SRF)-代表了樣本顯示的變量關(guān)系
5、。4. 樣本回歸模型(Sample Regression Model,SRM)-代表了樣本顯示的變量依存規(guī)律??傮w回歸模型與樣本回歸模型的主要區(qū)別是:描述的對象不同??傮w回歸模型描述總體中變量y與x的相互關(guān)系,而樣本回歸模型描述所關(guān)的樣本中變量y與x的相互關(guān)系。建立模型的依據(jù)不同??傮w回歸模型是依據(jù)總體全部觀測資料建立的,樣本回歸模型是依據(jù)樣本觀測資料建立的。模型性質(zhì)不同??傮w回歸模型不是隨機(jī)模型,而樣本回歸模型是一個(gè)隨機(jī)模型,它隨樣本的改變而改變。 總體回歸模型與樣本回歸模型的聯(lián)系是:樣本回歸模型是總體回歸模型的一個(gè)估計(jì)式,之所以建立樣本回歸模型,目的是用來估計(jì)總體回歸模型。四、線性回歸的含
6、義線性:被解釋變量是關(guān)于參數(shù)的線性函數(shù)(可以不是解釋變量的線性函數(shù)),至于y和x與我們所關(guān)注的被解釋變量和解釋變量有何聯(lián)系,并沒有限制。五、線性回歸模型的基本假設(shè)1. 簡單線性回歸的基本假定對模型和變量的假定:假定SLR.1:線性于參數(shù)在總體模型中,因變量y與自變量x和誤差(干擾)u的關(guān)系如下:其中,和分別表示總體的截距和斜率參數(shù)。假定SLR.2:隨機(jī)抽樣我們具有一個(gè)服從總體模型方程的隨機(jī)樣本,其樣本容量為n。假定SLR.3:解釋變量樣本有波動(dòng)性x的樣本結(jié)果即,不是完全相同的數(shù)值。對隨機(jī)擾動(dòng)項(xiàng)u的假定(零均值假定、同方差假定、無自相關(guān)假定、隨機(jī)擾動(dòng)與解釋變量不相關(guān)假定、正態(tài)性假定)假定SLR.
7、4:零均值假定給定解釋變量的任何值,誤差的期望值都為零。換言之,。假定SLR.5:同方差假定給定解釋變量的任何值,誤差都具有相同的方差,換言之,2. 多元線性回歸模型的基本假定:假定MLR.1:線性于參數(shù)總體模型可寫成其中,是我們所關(guān)心的未知數(shù),而u是無法觀測到的隨機(jī)誤差或隨機(jī)干擾。假定MLR.2:隨機(jī)抽樣我們有一個(gè)含有n次觀測的隨機(jī)樣本,它來自假定MLR.1中的總體模型。假定MLR.3:不存在完全共線性在樣本(因而在總體中),沒有一個(gè)自變量是常數(shù),自變量之間也不存在嚴(yán)格的線性關(guān)系。兩個(gè)變量完全相關(guān),最簡單的情形就是一個(gè)變量是另一個(gè)變量的常數(shù)倍。自變量可能完全線性相關(guān)的另一種方式是,一個(gè)自變量
8、恰好是其他自變量的線性函數(shù)。重要的是我們要注意到,MLR.3 允許變量之間有相關(guān)關(guān)系,只是不能是完全相關(guān)。同一變量的不同非線性函數(shù)也都可以出現(xiàn)在回歸元中。假定MLR.4:條件均值為零給定自變量的任何值,誤差u的期望值為零。換句話說,。假定MLR.5:同方差性給定任意解釋變量值,誤差u都具有相同的方差。換言之,。假定MLR.6:正態(tài)性假定總體誤差u獨(dú)立于解釋變量,而且服從均值為零和方差為的正態(tài)分布就橫截面回歸中的應(yīng)用而言,假定MLR.1-MLR.6被稱為經(jīng)典線性模型假定(CML),因此我們將這6個(gè)假定的模型稱為經(jīng)典線性模型(CLM)。假定MLR.4:零均值和零相關(guān) / 隨機(jī)擾動(dòng)與解釋變量不相關(guān)假
9、定對所有的,都有和。補(bǔ)充假定:無自相關(guān)假定(不序列相關(guān)) 隨機(jī)誤差項(xiàng)的條件不序列相關(guān)性表明在給定解釋變量任意兩個(gè)不同的值時(shí),對應(yīng)的隨即誤差項(xiàng)不相關(guān)??梢缘葍r(jià)表示為:六、普通最小二乘法(原理、推導(dǎo))1. 普通最小二乘法原理:給定一組樣本觀測值,假如模型參數(shù)估計(jì)量已經(jīng)求得,并且是最合理的參數(shù)估計(jì)量,那么樣本回歸函數(shù)應(yīng)該能夠最好地?cái)M合樣本數(shù)據(jù),即樣本回歸線上的點(diǎn)與真實(shí)觀測點(diǎn)的“總體誤差”應(yīng)該盡可能地小。因此普通最小二乘法估計(jì)參數(shù)的原則是以“殘差平方和最小”。即:min 推導(dǎo):殘差平方和 對上述殘差平方和Q分別對、求偏導(dǎo)數(shù),可以得到此方程最小化問題的一階條件:這兩個(gè)方程與前面的矩條件完全一致,可以用相
10、同的方法求解參數(shù)。2. 矩估計(jì)方法零條件均值假定E(u|x) = E(u) = 0有兩個(gè)意義:(1) E(u) = 0;(2) E(u|x) = E(u)。根據(jù)本書附錄中條件期望性質(zhì)5(Property CE.5,p.719),由(2)可得Cov(u,x)=0。又因?yàn)镃ov(u,x) = E(u-E(u)x-E(x)= E(ux) - E(u)E(x)= E(ux)。故有E(ux) =0。假定對于一個(gè)總體(population),存在簡單回歸方程:假定零條件均值假定成立: E(u|x) = E(u) = 0。于是有:(1) E(u)=0(2) E(ux)=0將代入上述等式(1) 、(2),得:
11、(3)(4)(3)、 (4) 稱為總體的矩條件。從總體中隨機(jī)抽取一個(gè)樣本容量為n的隨機(jī)樣本,用,i表示單個(gè)樣本(observation)的編號,n是樣本總量。,表示第i個(gè)樣本的相應(yīng)的變量。每一觀測樣本i均應(yīng)滿足:。將前面所假定的總體矩條件(3)、(4)應(yīng)用于樣本中,這種方法稱為矩估計(jì)法(method of moments)。與總體中的矩條件(3)、(4)相對應(yīng),在樣本中相應(yīng)的矩條件(sample counterparts)為:求解關(guān)于、的方程組(3)、(4)。根據(jù)樣本均值的定義以及加總的性質(zhì),可將條件(3)變換為或者代入條件(4)得到 因此OLS估計(jì)的斜率為OLS估計(jì)的截距為其中,假定。七、O
12、LS的代數(shù)性質(zhì)1. OLS殘差和及其樣本均值均為零。代數(shù)表示。由OLS的一階條件得出。2. 回歸元和OLS殘差的樣本協(xié)方差為零。代數(shù)表示。由OLS的一階條件得出。3. 點(diǎn)總在OLS回歸線上。代數(shù)表示??梢杂赏茖?dǎo)出。4. 擬合值的樣本平均值與的樣本平均值相等。代數(shù)表示。5. 擬合值與殘差之間的樣本協(xié)方差為零。代數(shù)表示。八、擬合優(yōu)度R21. 定義(1)總平方和總平方和(SST), 是y在樣本中所有變動(dòng)的測度指標(biāo),即它度量了y在樣本中的總分散程度。將總平方和除以n-1,可得到y(tǒng)的樣本方差。(2)解釋平方和回歸模型所解釋的平方和 (SSE),是yi的擬合值的在樣本中的變動(dòng)程度的測度指標(biāo)。(3)殘差平方
13、和殘差平方和(SSR)是殘差的樣本變異程度的測度指標(biāo),表示模型所未解釋的y的變動(dòng)。(4)離差平方和的分解 又因?yàn)?,所以得證2. 定義“擬合優(yōu)度”是模型對樣本數(shù)據(jù)的擬合程度。檢驗(yàn)方法是構(gòu)造一個(gè)可以表征擬合程度的指標(biāo)判定系數(shù)又稱決定系數(shù)。 (1),表示回歸平方和與總離差平方和之比;反映了樣本回歸線對樣本觀測值擬合優(yōu)劣程度的一種描述; 在解釋時(shí),我們通常把它擴(kuò)大100倍,得到一個(gè)百分?jǐn)?shù),所以100* 是y的樣本波動(dòng)中被x解釋部分的百分比。 (2) ; (3) 回歸模型中所包含的解釋變量越多,越大!九、改變度量單位對OLS統(tǒng)計(jì)量的影響一般而言,當(dāng)因變量乘上常數(shù)c,而自變量不改變時(shí),OLS 的截距和斜率
14、估計(jì)量也要乘上c。若自變量被除以或乘以一個(gè)非零常數(shù)c,則OLS斜率系數(shù)也會(huì)分別被乘以或者除以c??梢?,改變自變量的度量單位一般不改變截距值。十、函數(shù)形式(對數(shù)、半對數(shù)模型系數(shù)的解釋)(1):X變化一個(gè)單位Y變化單位。(2): X變化1%,Y變化%,表示彈性。(3):X變化一個(gè)單位,Y變化百分之100(4):X變化1%,Y變化%。十一、OLS無偏性O(shè)LS的無偏估計(jì)為定理2.1:OLS的無偏性利用假定SLR.1至SLR.4,對、的任何值,我們都有 和 換言之,對而言是無偏,對而言是無偏的。引理:(1)(2)(3)推導(dǎo):于是有1. cov(x,u)=02. 左邊應(yīng)該是估計(jì)值十二、OLS估計(jì)量的抽樣方
15、差定理2.2:OLS估計(jì)量的抽樣方差在假定SLR.1-SLR.5下,以樣本值為條件,有證明:十三、誤差方差的估計(jì)由OLS的兩個(gè)一階條件給出了OLS殘差所必須滿足的兩個(gè)約束條件??紤]這些限制的一個(gè)方法是:如果我們知道殘差中的n-2個(gè),就能通過這兩個(gè)約束條件得到另外兩個(gè)殘差。因此OLS殘差只有n-2個(gè)自由度(degrees of freedom)。因而的無偏估計(jì)量為定理2.3:的無偏估計(jì)在假定SLR.1至SLR.5下,我們有證明:對上式進(jìn)行平均得到 上式減下式得到因此對所有i求和,又得到取期望得也就是說實(shí)際值因此,其中十四、OLS估計(jì)量的性質(zhì)(1)線性:是指參數(shù)估計(jì)值和分別為觀測值的線性組合。(2
16、)無偏性:是指和的期望值分別是總體參數(shù)和。(3)最優(yōu)性(最小方差性):是指最小二乘估計(jì)量和在在各種線性無偏估計(jì)中,具有最小方差。十五、高斯-馬爾可夫定理1. 多元回歸的高斯-馬爾科夫定理定理3.4 高斯-馬爾科夫定理在假定MLR.1到MLR.5下,分別是的最優(yōu)無偏線性估計(jì)量。最優(yōu)性,這里最優(yōu)被定義為最小方差。2. 簡單回歸的高斯馬爾科夫假定定理2.1:OLS的無偏性(內(nèi)容&證明參見第一章)十六、OLS參數(shù)估計(jì)量的概率分布若假定遵從以0為均值,為方差的正態(tài)分布,則也遵循正態(tài)分布。即在正態(tài)性的假定下,我們可以得到1. ,也是正態(tài)分布的 十七、OLS隨機(jī)誤差項(xiàng)u的方差的估計(jì)在估計(jì)的參數(shù)和的方差表達(dá)式
17、中,都含有隨機(jī)擾動(dòng)項(xiàng)u的方差。又稱為總體方差。由于實(shí)際上是未知的,因此和的方差實(shí)際上無法計(jì)算,這就需要對其進(jìn)行估計(jì)。由于隨機(jī)擾動(dòng)項(xiàng)不可觀測,只能從的估計(jì)值殘差出發(fā),對總體進(jìn)行估計(jì)??梢宰C明,的最小二乘估計(jì)為 它是關(guān)于的無偏估計(jì)。十八、對零條件均值的理解假定MLR.4:條件均值為零給定自變量的任何值,誤差u的期望值為零。換句話說, 。假定SLR.4:零均值假定給定解釋變量的任何值,誤差的期望值都為零。換言之, 。(1)限定總體中x和u的關(guān)系對一個(gè)隨機(jī)樣本,這個(gè)假定意味著對所有的i=1,2,n,都有。(2)技術(shù)簡化我們可以以樣本中的值為條件推導(dǎo)OLS,x非隨機(jī)變量,cov(x,u)=0習(xí)題:4、5
18、、6;C2、C3、C4第3章 多元回歸分析:估計(jì)一、變量系數(shù)的解釋(剔除、控制其他因素的影響) 對斜率系數(shù)的解釋:在控制其他解釋變量(X2)不變的條件下,X1變化一個(gè)單位對Y的影響;或者,在剔除了其他解釋變量的影響之后,X1的變化對Y的單獨(dú)影響!二、多元線性回歸模型中對隨機(jī)擾動(dòng)項(xiàng)u的假定,除了零均值假定、同方差假定、無自相關(guān)假定、隨機(jī)擾動(dòng)與解釋變量不相關(guān)假定、正態(tài)性假定以外,還要求滿足無多重共線性假定。定理3.2:在假定MLR.1到MLR.5之下,以自變量的樣本值為條件,對所有的,都有其中是的總體樣本波動(dòng),而則是將對所有其他自變量(并包含一個(gè)截距項(xiàng))進(jìn)行回歸所得到的。在我們詳盡的研究估計(jì)值方差
19、之前,我們要注意,在得到這個(gè)公式的過程中,用到了所有 高斯-馬爾科夫假定。雖然OLS的無偏性不需要同方差假定,但是要讓上述式子成立,則必然要求同方差。的大小在實(shí)踐中也很重要。方差越大,則意味著估計(jì)量越不精確,也就是置信區(qū)間越大和假設(shè)檢驗(yàn)越不準(zhǔn)確。1. 多重共線性的概念:若,則,兩個(gè)或多個(gè)自變量之間高度相關(guān)(不完全相關(guān)),被稱為多重共線性。多重共線性不違背假定MLR.3,但是我們也不能確定一個(gè)臨界值來說明是否存在多重共線性。例如=0.9意味著在的樣本變異中,90%都可以由回歸模型中的其他自變量來解釋。即與其他的自變量有很強(qiáng)的相關(guān)關(guān)系。2. 多重共線性的后果(1)OLS估計(jì)量方差變大(2)核心是O
20、LS估計(jì)量和它的標(biāo)準(zhǔn)差相比有多大(3)對樣本數(shù)據(jù)敏感(4)難估計(jì)某個(gè)特定解釋變量的影響3. 多重共線性的檢驗(yàn)(1)相關(guān)系數(shù)(2)擬合優(yōu)度(3)VIF膨脹因子(4)特征值4. 多重共線性的處理(1)收集跟多數(shù)據(jù)(2)去掉部分解釋變量,但會(huì)導(dǎo)致模型偏誤(3)合并解釋變量三、多元線性回歸模型最小二乘法1. 多元線性回歸模型參數(shù)的最小二乘估計(jì)式(1)首先考慮兩個(gè)自變量的模型:建模的原理依舊是使得殘差平方和達(dá)到最小的估計(jì)值為其中是利用現(xiàn)有樣本將對進(jìn)行簡單回歸而得到的OLS殘差。原來用的是均值,現(xiàn)在用的是估計(jì)值因此,度量的是,在排除變量的影響之后, x1對y的影響。(2)在含有k個(gè)自變量的情形中。在選擇估
21、計(jì)值時(shí),我們最小化了殘差平方和這個(gè)最小化問題可以使用多元微積分求解,OLS的一階條件為 在一個(gè)含有k個(gè)解釋變量的一般模型中,仍然可以寫成(3.22)式(證明見本章附錄3A.2):殘差是來自對,的回歸。因此,度量的是,在排除,等變量的影響之后,對的影響。證明理解cov(x,u)=0是樣本回歸模型的性質(zhì)。x是擬合出來的值。:(3)最小二乘法(OLS)公式證明:最小二乘法就是選擇一條直線,使其殘差平方和達(dá)到最小值的方法。即選擇,使得下式最小。求解方程組:2. 參數(shù)估計(jì)式的分布性質(zhì)及期望、方差和標(biāo)準(zhǔn)誤差(1)參數(shù)估計(jì)式的分布性質(zhì)直接從單變量模型推廣,可得OLS擬合值和殘差的某些重要性質(zhì)。(a)殘差的樣
22、本平均值為零,即;(b)每個(gè)自變量和OLS殘差之間的樣本協(xié)方差為零,于是OLS擬合值和OLS殘差之間的樣本協(xié)方差也為零。于是OLS擬合值和OLS殘差之間的樣本協(xié)方差也為零。(c)點(diǎn)總位于樣本OLS回歸線上。(2)參數(shù)估計(jì)式的期望定理3.1:OLS的無偏性在假定MLR.1至MLR.4下,下式對總體參數(shù)的任意值都成立:即OLS估計(jì)量是總體參數(shù)的無偏估計(jì)量。證明:如我們所知,估計(jì)值不可能是無偏的,因?yàn)橐粋€(gè)估計(jì)值就是從一個(gè)特定的樣本得到的固定值,它通常都不等于總體參數(shù)。我們說OLS在四個(gè)假定下是無偏的是指當(dāng)我們將用來得到OLS估計(jì)值的程序用到各種可能的隨機(jī)樣本時(shí),這個(gè)程序是無偏的。(3)參數(shù)估計(jì)式的方
23、差協(xié)方差矩陣因?yàn)槭莃的均值因?yàn)榫翟谥本€上b的協(xié)方差矩陣為定理3.2:OLS斜率估計(jì)量的抽樣方差在假定MLR.1到MLR.5之下,以自變量的樣本值為條件,對所有的j=1,2,k都有其中SST是的總樣本變異,而是將對其他所有其他自變量進(jìn)行回歸得到的。(4)參數(shù)估計(jì)式的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)差(a)為了估計(jì)下一章構(gòu)造置信區(qū)間,我們還要根據(jù)估計(jì)量的標(biāo)準(zhǔn)差(b)由于未知,我們用代替,得到的標(biāo)準(zhǔn)誤 如果誤差表現(xiàn)出異方差性,那么上述公式給出的標(biāo)準(zhǔn)誤就不是的一個(gè)可靠估計(jì)量。異方差的出現(xiàn),盡管不會(huì)導(dǎo)致的偏誤,但是會(huì)導(dǎo)致的常用公式導(dǎo)致偏誤,從而使得標(biāo)準(zhǔn)誤無效。3. 在基本假定滿足的條件下,多元線性回歸模型最小二乘估計(jì)式是最
24、佳線性無偏估計(jì)式提出問題:在假定MLR.1-MLR.4下,OLS估計(jì)是無偏的,但在這個(gè)假定下還有其他許多的無偏估計(jì)量,那么還有其他的無偏估計(jì)量的方差比OLS估計(jì)量的方差還小么?如果我們適當(dāng)限制這些估計(jì)量的范圍,我們將證明,在所有的無偏線性估計(jì)量當(dāng)中,OLS是最好的一個(gè)。即在MLR.1-MLR.5的前提下,OLS估計(jì)量是最優(yōu)線性無偏估計(jì)量(BLUE)。(1)無偏性在當(dāng)前背景下,如果的一個(gè)估計(jì)量,比方說,對任意的都有,那么就說是的無偏估計(jì)量。(2)線性性具有線性性的充要條件是,能表示成因變量的一個(gè)線性函數(shù),其中是自變量樣本值的一個(gè)函數(shù)。(3)最優(yōu)性這里最優(yōu)被定義為最小方差。定理3.4 高斯-馬爾科
25、夫定理在假定MLR.1到MLR.5下,分別是的最優(yōu)無偏線性估計(jì)量。高斯-馬爾科夫定理辨明了估計(jì)多元回歸模型時(shí)使用OLS的合理性,但是注意,如有高斯馬爾科夫假設(shè)中有一個(gè)不成立,那么該定理就是不成立的。四、估計(jì)的回歸模型多元線性回歸模型的一般形式其中為截距項(xiàng),為斜率參數(shù),u為誤差項(xiàng)(干擾項(xiàng))。關(guān)鍵性假設(shè):即所有不可觀測誤差項(xiàng)中所有因素都與解釋變量無關(guān),無法觀測因素均值為零。五、殘差的方差和協(xié)方差矩陣 1. 殘差的方差我們現(xiàn)在來研究的無偏估計(jì)量。在一般的多元回歸情形中,的無偏估計(jì)量是方程中n-k-1是含有n個(gè)觀測量和k個(gè)自變量的一般OLS問題的自由度。由于在一個(gè)含有k個(gè)自變量和一個(gè)截距項(xiàng)的模型有k+
26、1個(gè)參數(shù)。因此我們有df=觀測次數(shù)-估計(jì)參數(shù)個(gè)數(shù)=n-(k+1)從技術(shù)上講,除以n-k-1是因?yàn)闅埐钇椒胶偷钠谕禐橛捎诤?,因此在?shí)行OLS估計(jì)時(shí)施加了k+1個(gè)限制。意味著,給定殘差n-k-1個(gè)方程,就能得到剩余的k+1個(gè)殘差。定理3.3 的無偏估計(jì)在高斯-馬爾科夫假定MLR.1-MLR.5下的正平方根稱作回歸標(biāo)準(zhǔn)誤或SER,SER是誤差項(xiàng)標(biāo)準(zhǔn)差的估計(jì)量2. 估計(jì)的方差的協(xié)方差矩陣是:六、擬合優(yōu)度1. 與簡單回歸模型中一樣,我們定義總平方和SST=解釋平方和SSE=殘差平方和SSR=2. 判定系數(shù)(1)總是介于0到1之間。一個(gè)接近于1的判定系數(shù)表明OLS給出了一個(gè)良好的擬合,一個(gè)于0的判定系數(shù)
27、表明OLS給出了一個(gè)糟糕的擬合。(2)還可以證明等于的實(shí)際值與擬合值相關(guān)系數(shù)的平方,即: (3)在多元回歸中,有關(guān)R2的一個(gè)重要事實(shí)是,在回歸中多增加一個(gè)自變量后,它絕對不會(huì)減少,而且通常會(huì)增大。所以用R2判斷是否在模型中增加一個(gè)或幾個(gè)變量不是很恰當(dāng)。在后面章節(jié)我們會(huì)給出一個(gè)新指標(biāo):調(diào)整的。一般情況下,計(jì)量經(jīng)濟(jì)學(xué)家關(guān)心的是好的估計(jì)量而不是高的擬合優(yōu)度。七、遺漏變量偏誤1. 簡單情形現(xiàn)在假設(shè)我們是遺漏了一個(gè)實(shí)際應(yīng)該包括在模型中的變量,通常稱為排出一個(gè)有關(guān)變量(excluding a relevant variable)或者對模型設(shè)定不足。推導(dǎo)遺漏一個(gè)重要變量所導(dǎo)致的偏誤,是誤設(shè)分析(misspe
28、cification analysis)的一個(gè)例子,我們從含有兩個(gè)變量的模型入手:并假設(shè)模型滿足MLR.1-MLR.4。(1)由于疏忽或者數(shù)據(jù)不足,我們在排除的情況下估計(jì)這個(gè)模型得到:由之前的關(guān)系(簡單回歸和多元回歸估計(jì)值的比較 P66)其中和是對、的多元回歸斜率估計(jì)量。是對的簡單回歸的斜率估計(jì)量,只與自變量有關(guān)。證明:解方程組 得到故 證畢(2)由多元回歸的無偏性我們有的偏誤為 和之間的關(guān)系還表明,它們在兩種明顯的情況下回相等:(a)樣本中對的偏效應(yīng)為0,即(b)樣本中和不相關(guān),即證明:由于是與的協(xié)方差與的樣本方差的比值,所以當(dāng)且僅當(dāng)和不相關(guān)時(shí),是無偏的。2. 遺漏變量的誤差進(jìn)行經(jīng)濟(jì)學(xué)中的經(jīng)
29、驗(yàn)研究時(shí),掌握與偏誤有關(guān)的術(shù)語很重要。在以上模型前提下,若,我們稱有向上的偏誤,若,我們稱有向下的偏誤。向零的偏誤指比更接近零的情況,如果為正,則向下的偏誤就是向零的偏誤;反之,如果為負(fù),則向上的偏誤就是向零的偏誤。3. 一般情形一個(gè)解釋變量與誤差之間存在相關(guān)性,那么一般會(huì)導(dǎo)致所有的OLS估計(jì)量都產(chǎn)生偏差。例如:總體模型滿足假定MLR.1-MLR.4,但我們遺漏了變量,并且估計(jì)的模型為現(xiàn)假設(shè)與無關(guān),但與相關(guān),此時(shí)和通常都是有偏的,唯一的例外是和不相關(guān)。因?yàn)槭聦?shí)上,當(dāng)和不相關(guān), 證明即使是上述簡單的模型,也很難判斷偏誤的方向。若且,就有的偏誤為正。習(xí)題:1、2、6、7、8、10;C2、C5、C6
30、第4章 多元回歸分析一、經(jīng)典線性模型假定假定MLR.6:正態(tài)性假定總體誤差u獨(dú)立于解釋變量,而且服從均值為零和方差為的正態(tài)分布就橫截面回歸中的應(yīng)用而言,假定MLR.1-MLR.6被稱為經(jīng)典線性模型假定(CML),因此我們將這6個(gè)假定的模型稱為經(jīng)典線性模型(CLM)。在CLM假定下,OLS的估計(jì)量比在高斯-馬爾科夫假定下的估計(jì)量更加的有效??梢宰C明,在CML假定下,OLS是最小方差無偏估計(jì)。甚至不需要將比較限制在的線性估計(jì)量內(nèi)??偨Y(jié)CLM的一個(gè)簡便表達(dá)式為:在任何一個(gè)應(yīng)用中是否可以假定u的正態(tài)性,實(shí)際上是一個(gè)經(jīng)驗(yàn)問題。例如,由于工資不可能是負(fù)數(shù),因此嚴(yán)格的講,它不可能服從于正態(tài)分布。而且,因?yàn)榇?/p>
31、在最低工資法,總體中有一定比例的人恰好得到最低工資,這也與正態(tài)分布性質(zhì)相矛盾。以往的經(jīng)驗(yàn)表明,對工資而言,正態(tài)分布不是一個(gè)好的假設(shè)。通常通過一種變換,特別是取對數(shù),可以得到一個(gè)更為接近正態(tài)性質(zhì)的分布。同樣這也是一個(gè)經(jīng)驗(yàn)問題。在有些例子當(dāng)中,假定MLR.6明顯是錯(cuò)誤的,然而對于大樣本容量來說,誤差的非正態(tài)性質(zhì)算不上是一個(gè)非常嚴(yán)重的問題(漸近正態(tài))。因此目前我們姑且認(rèn)可誤差的正態(tài)性假設(shè)。二、正態(tài)抽樣分布定理4.1:正態(tài)抽樣分布在CLM假定MLR.1-MLR.6下,以自變量的樣本值為條件,有由定理3.2有因此,證明:其中是對其他自變量進(jìn)行回歸的第i個(gè)殘差,而是這個(gè)回歸的殘差平方和。三、變量顯著性檢驗(yàn)
32、,t檢驗(yàn) 1. 基本原理(1)假設(shè)檢驗(yàn)原理:概率性質(zhì)的反證法 (2)小概率事件原理:小概率事件在1次試驗(yàn)中幾乎是不可能發(fā)生。(3)一般做法:(a)給出一個(gè)假定; (b)先假定成立,在此假定下,構(gòu)造一個(gè)小概率事件A; (c)進(jìn)行一次試驗(yàn)(如抽得一個(gè)容量為n的樣本),觀察試驗(yàn)結(jié)果,看事件A是否發(fā)生。(d)如果A發(fā)生,則違反了小概率事件原理,就拒絕;反之,則接受。2. 標(biāo)準(zhǔn)化估計(jì)量的t分布本節(jié)將對總體回歸模型中的單個(gè)參數(shù)的假設(shè)進(jìn)行檢驗(yàn)??傮w模型可寫作:而且它滿足CLM假設(shè)。為了構(gòu)造假設(shè)檢驗(yàn),我們有如下結(jié)論,定理4.2:標(biāo)準(zhǔn)化估計(jì)量的t分布在CLM假設(shè)MLR.1-MLR.6下,其中,k+1是總體回歸模
33、型中未知參數(shù)的個(gè)數(shù)。3. 有關(guān)t檢驗(yàn)的術(shù)語(1)原假設(shè)。含義:在零假設(shè)下,第個(gè)解釋變量對的局部效應(yīng)為0,即在其他不變的情況,對沒有影響。(2)我們用來檢驗(yàn)原假設(shè)的統(tǒng)計(jì)量被稱為的t統(tǒng)計(jì)量,定義為t統(tǒng)計(jì)量度量了估計(jì)值相對0偏離了多少個(gè)估計(jì)量的標(biāo)準(zhǔn)差。切確的拒絕法則取決于對立假設(shè)和所選擇的檢驗(yàn)顯著性水平(即當(dāng)為真時(shí)拒絕它的概率)。(3)對立假設(shè)(a)單側(cè)對立假設(shè)(b)雙側(cè)對立假設(shè)(4)臨界值我們需要知道顯著性水平和自由度。例如對5%顯著性水平上的檢驗(yàn)和n-k-1=28個(gè)自由度(a)單側(cè)臨界值為c=1.701,拒絕域?yàn)椋坏M足條件就拒絕原假設(shè),認(rèn)為,即第j個(gè)自變量對y有偏效應(yīng)。 (b)雙側(cè)臨界值四、
34、檢驗(yàn)值的其他假設(shè) 如果我們想對形如的假設(shè)進(jìn)行檢驗(yàn),需要更一般的t統(tǒng)計(jì)量 考慮校園犯罪和注冊人數(shù)的模型,才是有意義的。五、P值1. 定義定義:給定t統(tǒng)計(jì)量的的觀測值,能拒絕虛擬假設(shè)的最小顯著水平被稱為檢驗(yàn)的p值。假設(shè)自由度為40,算得 t 值為2.423,對應(yīng)5%和1%的臨界值分別為2.021 和 2.704。我們是否應(yīng)當(dāng)拒絕零假設(shè)?提前確定顯著水平可能會(huì)隱藏關(guān)于假設(shè)檢驗(yàn)的一些有用信息。另一種想法:如果將算得的t 統(tǒng)計(jì)量作為臨界值,那么使得零假設(shè)被拒絕的最小顯著水平是多少?這個(gè)水平稱為p 值。對于雙邊檢驗(yàn)2. 性質(zhì)(1)P值是一個(gè)概率,介于0與1 之間。(2)P值很好總結(jié)了經(jīng)驗(yàn)證據(jù)拒絕虛擬假設(shè)的
35、強(qiáng)弱。小p值是拒絕虛擬假設(shè)的證據(jù),大p值則不能提供拒絕虛擬假設(shè)的證據(jù)。例如p值=0.5,有50%的概率觀察一個(gè)t統(tǒng)計(jì)量值,它至少和我們據(jù)計(jì)算得到的t統(tǒng)計(jì)量一樣大。這是拒絕的弱證據(jù)。(3)一旦p值被確定下來,在任何理想的顯著水平下都能進(jìn)行經(jīng)典檢驗(yàn)。如果用表示顯著性水平,那么(a)若值,則拒絕原假設(shè)(b)若值,則不能拒絕原假設(shè)(4)單側(cè)檢驗(yàn)的p值。因此,只需將雙側(cè)檢驗(yàn)的p值除以2即可。六、實(shí)際顯著性與統(tǒng)計(jì)顯著性一個(gè)變量的的統(tǒng)計(jì)了顯著性完全由得大小決定,而一個(gè)變量的經(jīng)濟(jì)顯著性則與的符號與大小均有關(guān)。 因此如果是統(tǒng)計(jì)顯著的,那要么很大,要么很小。在實(shí)踐中,區(qū)分導(dǎo)致t統(tǒng)計(jì)量統(tǒng)計(jì)顯著的原因很重要。七、檢驗(yàn)
36、參數(shù)的一個(gè)線性組合假設(shè)如何對涉及不止一個(gè)參數(shù)的單個(gè)假設(shè)進(jìn)行檢驗(yàn)??紤]原假設(shè),在多數(shù)情況下,我們關(guān)心的對立假設(shè)是在大專的一年比不上在大學(xué)的一年。這可以表示為。變形一下得到:和為了及時(shí)我們估計(jì)量中的抽樣誤差,我們將這個(gè)差值除以標(biāo)準(zhǔn)誤,將其標(biāo)磚化。一旦我們得到該檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)的過程就一如從前。檢驗(yàn)不同參數(shù)之間的關(guān)系之所以比檢驗(yàn)一個(gè)單獨(dú)參數(shù)更困難,只是因?yàn)橐玫?。為了求出,我們首先得到這個(gè)差值的方差。由于而且和分別是和的無偏估計(jì)量,所以又其中,表示的一個(gè)估計(jì)量。這里我們將和之差定義為一個(gè)新參數(shù)。于是我們想檢驗(yàn)對t統(tǒng)計(jì)量用表示就是關(guān)鍵是如何找到。我們的做法是通過改寫模型,以使得直接作為方程中的自變量出
37、現(xiàn)。由于,我們將帶入重新整理方程。八、理解排除性約束1. 虛擬假設(shè)除了檢驗(yàn)參數(shù)的單個(gè)約束外,我們常常還需要檢驗(yàn)關(guān)于基本參數(shù)的多重假設(shè),我們首先從檢驗(yàn)一組自變量時(shí)候?qū)σ蜃兞慷紱]有影響這個(gè)首要問題開始。我們考慮如下虛擬假設(shè)該假設(shè)由3個(gè)排除性約束構(gòu)成,這是多重約束的一個(gè)例子,對多重約束進(jìn)行的檢驗(yàn)被稱為多重假設(shè)檢驗(yàn)。對于該例子,合適的對立假設(shè)為我們該如何檢驗(yàn)式(4.29)呢?人們不禁想到使用t統(tǒng)計(jì)量以分別決定每個(gè)變量是否顯著,但是這種方式是不合適的!這是因?yàn)?,一個(gè)特定的t統(tǒng)計(jì)量只能檢驗(yàn)一個(gè)對其他參數(shù)沒有任何限制的假設(shè),此外,我們還需要對付三個(gè)結(jié)果每一個(gè)t統(tǒng)計(jì)量對應(yīng)一個(gè)結(jié)果。我們需要一個(gè)聯(lián)合檢驗(yàn)這些排除
38、性約束的方法。2. 對排除性約束的檢驗(yàn)對比下面兩個(gè)估計(jì)模型:(1)不受約束模型SSR=183.186 =0.6278 (2)受約束模型SSR=198.311 =0.5971對比兩個(gè)估計(jì)模型,正如我們所想,受約束模型的SSR較大而擬合優(yōu)度較小。我們需要決定的是SSR從不受約束模型到受約束模型的增加,是否足以拒絕。因此,我們需要一種方法,能合并這兩個(gè)SSR的信息,得到一個(gè)在下分布已知的統(tǒng)計(jì)量。我們不妨針對一般情形推導(dǎo)這個(gè)檢驗(yàn)統(tǒng)計(jì)量,將具有k的自變量的不受約束模型寫成假設(shè)我們排除了q個(gè)排除性約束要檢驗(yàn):,虛擬假設(shè)表示為:當(dāng)從不受約束模型到受約束模型時(shí),SSR的相對增加對假設(shè)檢驗(yàn)而言是有意義的,因此定
39、義F統(tǒng)計(jì)量如下:其中,是受約束模型的殘差平方和,是不受約束模型的殘差平方和。由于不可能比小,所以F統(tǒng)計(jì)量總是非負(fù)的。九、多個(gè)線性約束的檢驗(yàn):F檢驗(yàn)1. 自由度q是所施加的約束數(shù),是受約束模型與不受約束模型的自由度之差。即,q=分子自由度=分母中SSR要除以不受約束模型的自由度n-k-1=分母自由度=在下,2. 拒絕法令c是分布的第95個(gè)百分位,拒絕法為(1)如果,我們就說是聯(lián)合統(tǒng)計(jì)顯著的;(2)如果,我們就說是聯(lián)合不顯著的。3. F統(tǒng)計(jì)量和t統(tǒng)計(jì)量之間的關(guān)系檢驗(yàn)單個(gè)變量排除性的F統(tǒng)計(jì)量,等于t統(tǒng)計(jì)量的平方。因?yàn)榫哂蟹植?,所以在雙側(cè)對立假設(shè)下,這兩種方法得到的結(jié)果相同。4. F統(tǒng)計(jì)量的型5. 計(jì)
40、算F檢驗(yàn)的p值 表示一個(gè)自由度為(q,n-k-1)的F隨機(jī)變量,F(xiàn)是檢驗(yàn)統(tǒng)計(jì)量的實(shí)際值。F統(tǒng)計(jì)量的p值與t統(tǒng)計(jì)量的p值具有相同的解釋給定虛擬假設(shè)是正確的,觀察到的F值至少和我們所得到的F值一樣大的概率。很小的p值就是拒絕的證據(jù)。同時(shí),如同t檢驗(yàn)一樣,一旦計(jì)算了p值,F(xiàn)檢驗(yàn)就可以在任何顯著水平下進(jìn)行。6. 回歸整體顯著性的F檢驗(yàn)虛擬假設(shè)上述假設(shè)相當(dāng)于有k個(gè)約束,而當(dāng)我們施加這些假設(shè)時(shí),我們得到受約束模型該估計(jì)模型的,因?yàn)闆]有解釋變量,所以y中的變異一點(diǎn)都沒有得到解釋。因此該假設(shè)下的F統(tǒng)計(jì)量可以寫成其中就是y對回歸的通常。7. 回歸整體顯著性的F統(tǒng)計(jì)量只有在所有自變量的聯(lián)合排除性時(shí)才有效。有時(shí)稱之
41、為檢驗(yàn)回歸的整體顯著性。有些模型看上去很小,卻有著高度顯著的F統(tǒng)計(jì)量。這就解釋了我們?yōu)槭裁匆?jì)算F統(tǒng)計(jì)量來檢驗(yàn)聯(lián)合顯著性,而不是只看的大小。十、報(bào)告回歸結(jié)果在實(shí)證研究中如何報(bào)告回歸結(jié)果:1. OLS系數(shù)估計(jì)值 & 解釋第一,所估計(jì)的OLS系數(shù)估計(jì)值總應(yīng)該報(bào)告。對于分析中的關(guān)鍵變量,你應(yīng)該對所估計(jì)的系數(shù)作出解釋。比如這個(gè)估計(jì)是不是一個(gè)彈性?是否有什么經(jīng)濟(jì)含義?2. 標(biāo)準(zhǔn)誤第二,標(biāo)準(zhǔn)誤總是應(yīng)該與所估計(jì)的系數(shù)一起包括進(jìn)來。因?yàn)闃?biāo)準(zhǔn)誤迫使我們認(rèn)真考慮被檢驗(yàn)的虛擬假設(shè),虛擬假設(shè)并非總是總體參數(shù)為零。同時(shí),有了標(biāo)準(zhǔn)誤更易得到置信區(qū)間。3. 擬合優(yōu)度 & 觀測次數(shù)第三,回歸的擬合優(yōu)度應(yīng)該被報(bào)告我們看到它除了
42、提供一種度量之外,還使得計(jì)算排除性約束F統(tǒng)計(jì)量相對簡單。同時(shí)觀測次數(shù)也應(yīng)該報(bào)告。4. 最后,如果幾個(gè)方程由許多不同的自變量來估計(jì),我們可能要對不同的人群估計(jì)同一個(gè)方程,或者我們解釋的是不同的因變量,這些情形下,最好將結(jié)果歸納在一個(gè)表格中,表中應(yīng)該標(biāo)明因變量而自變量則應(yīng)該在第一列。習(xí)題:1、2、3、4、6、7、10、11;C3、C5、C8第六章 多元回歸分析:專題一、測度單位對OLS統(tǒng)計(jì)量的影響1. 變與不變(1)因變量乘以常數(shù)c,截距和斜率的估計(jì)值都擴(kuò)大為原來的c倍(2)自變量被乘以非零常數(shù)c,那么其系數(shù)就除以c。截距的估計(jì)值不受影響。(3)當(dāng)因變量以對數(shù)形式出現(xiàn),改變度量單位不會(huì)影響斜率系數(shù)
43、,只影響截距(4)不會(huì)因y或x的單位變化而變化,SSR、SST、SSE和SER不變。(5)數(shù)據(jù)的測度單位改變時(shí),t統(tǒng)計(jì)量和F統(tǒng)計(jì)量不發(fā)生改變(6)怎樣度量數(shù)據(jù)只起非實(shí)質(zhì)性的作用,比如減少所估計(jì)系數(shù)中小數(shù)點(diǎn)后零的個(gè)數(shù)。(7)合理的選擇度量單位,可以改進(jìn)所估計(jì)方程的形象,使結(jié)果更好看,而沒有本質(zhì)的改變。2. 系數(shù)在計(jì)量應(yīng)用中,有時(shí)會(huì)用一個(gè)難以解釋的尺度來度量一個(gè)關(guān)鍵變量。此時(shí)我們往往關(guān)心的是自變量變化其標(biāo)準(zhǔn)差一定倍數(shù)時(shí),對因變量的影響。有時(shí)候?qū)λ凶兞慷紭?biāo)準(zhǔn)化再回歸有其用處。這意味對每個(gè)變量都計(jì)算z得分。新的系數(shù)是傳統(tǒng)上把它們成為標(biāo)準(zhǔn)化系數(shù)或系數(shù)。系數(shù)的含義是如果x提高一倍的標(biāo)準(zhǔn)差,那么y就變化b
44、倍的標(biāo)準(zhǔn)差。于是我們不是以y或x的原有單位來度量其影響,而是以標(biāo)準(zhǔn)差為單位。二、進(jìn)一步理解對數(shù)模型1. 使用對數(shù)模型性質(zhì)(1)取對數(shù)后變量的斜率系數(shù),不隨變量測度單位改變。(2)如果y和x都取對數(shù)形式,斜率系數(shù)給出對彈性的一個(gè)直接估計(jì)。(3)對于y0的模型,使用ln(y)作因變量的模型,通常比使用y作因變量的模型更接近CLM假定,取對數(shù)可以緩解條件分布的異方差性和偏態(tài)性。2. 對數(shù)變化的近似值 & 精確值計(jì)算(1)對數(shù)變化近似等于百分比變化,對數(shù)變化越大,這種近似就越不準(zhǔn)確。考慮以下模型:(2)可給出y精確百分比變化:3. 什么類型的變量經(jīng)常用對數(shù)形式?(1)肯定為正的錢數(shù):工資,薪水,企業(yè)銷
45、售額和企業(yè)市值。(2)非常大的正整數(shù)變量:如人口,雇員總數(shù)和學(xué)校注冊人數(shù)等。(3)以年度量的變量通常以原有形式出現(xiàn):教育年數(shù)、工作經(jīng)歷、年齡等。4. 對數(shù)形式的限制(1)一個(gè)變量取零或負(fù)值,則不能使用對數(shù)。(2)如果y非負(fù)但可以取零,則有時(shí)使用log(1+y)(3)當(dāng)y取對數(shù)形式時(shí),更難以預(yù)測原變量的值,因?yàn)樵P驮试S我們預(yù)測log(y)而不是y。(4)將y作因變量的模型與lny作因變量的模型不能比較,它們解釋的是不同變量的變化。三、二次式的模型1. 二次式的導(dǎo)數(shù)經(jīng)濟(jì)學(xué)中,為了描述遞增或遞減的邊際效應(yīng),常常用二次函數(shù)。y = b0 + b1x + b2x2 + u2. 二次式的轉(zhuǎn)折點(diǎn)很容易被計(jì)
46、算出來,可以看看是否有意義轉(zhuǎn)折點(diǎn)x*:表面上很小的變量平方的系數(shù)可能實(shí)際上有重要的意義,它代表了變化的斜率。四、交互項(xiàng)的模型y = b0 + b1x1 + b2x2 + b3x1x2 + u我們不能單獨(dú)將b1解釋為關(guān)于x1,y變化的度量,我們需要將b3也考慮進(jìn)來。交互項(xiàng)使得解釋變量的偏效應(yīng)如x1取決于另一個(gè)變量的水平,如x2。在建立交互項(xiàng)之前,集中x1和x2的值到我們關(guān)心的值周圍會(huì)更有意義。具有交互項(xiàng)的模型解釋可能很棘手。X1上的系數(shù)1衡量了當(dāng)x2=0時(shí)x1對y的偏效應(yīng),這可能是不可能的或是我們不關(guān)心的。因此需要對模型進(jìn)行變形,如。這樣的話,當(dāng)時(shí),。五、擬合優(yōu)度基于的大小來選擇一組解釋變量,可
47、能會(huì)導(dǎo)致一些不合理的模型。經(jīng)典線性模型假定中沒有要求必須大于某個(gè)特定值。小的意味著沒有對影響y的其他因素進(jìn)行解釋。小的不意味u與自變量相關(guān)。無偏估計(jì)與的大小無關(guān)。在方程中增加變量時(shí), 的相對變化十分有用。不同的因變量模型,不能比較。六、修正可決系數(shù)的作用和方法。1. 修正可決系數(shù)的作用調(diào)整過的的優(yōu)點(diǎn)在于它對向模型增加自變量施加了懲罰。在回歸中增加一個(gè)新的變量,不會(huì)下降,調(diào)整的可能會(huì)下降。調(diào)整可能為負(fù),負(fù)表示它相對自由度個(gè)數(shù)而言是個(gè)很差的擬合模型。2. 修正可決系數(shù)的方法或者習(xí)題:1、3、4、7;C2、C3、C5、C9、C12第7章 虛擬變量一、虛擬變量的定義在經(jīng)驗(yàn)研究中,經(jīng)常會(huì)遇到定性因素,如
48、:性別、行業(yè)、季節(jié)、地理等。定性信息:一個(gè)人是男是女;一個(gè)人受否受過高等教育等。定性信息一般通過定義一個(gè)二值變量(binary variable)或0-1變量刻畫(取值 1 或 0)。在計(jì)量經(jīng)濟(jì)學(xué)中,它們被稱為虛擬變量(dummy variable)。二、如何引入虛擬變量如果一個(gè)變量分成N組,引入該變量的虛擬變量形式是只能放入N-1個(gè)虛擬變量。定義一個(gè)虛擬變量時(shí),我們必須決定哪個(gè)取值為1,哪個(gè)取值為0。好的定義方式會(huì)使方程設(shè)定和解釋都更清楚。三、虛擬變量系數(shù)的解釋:不同組均值的差(基準(zhǔn)組或?qū)φ战M與處理組)1. 只有一個(gè)自變量的情況(1)考慮如下小時(shí)工資的簡單模型:系數(shù)的含義是:給定同等教育程度
49、,是女性與男性之間在小時(shí)工資上的差別。因此,系數(shù)決定了勞動(dòng)市場是否對女性存在歧視。這可以解釋為截距變化(intercept shift):If d = 0, then y = b0 + b1x + uIf d = 1, then y = (b0 + d0) + b1x + ud = 0的情形是基組或基準(zhǔn)組 (base group)。(2)虛擬變量系數(shù)的解釋注意事項(xiàng)例7.1 小時(shí)工資方程(WAGE1)中,我們估計(jì)方程估計(jì)結(jié)果:可以看出,平均來說,女性每小時(shí)比男性少掙1.81美元。但是,注意到在我們的回歸中控制了edu和exper和tenure,所以這1.81美元的工資差距不能由男女在受教育水平和
50、工作經(jīng)歷上的平均差距來解釋。取消其他解釋變量,可以得到:比較這兩個(gè)模型的female系數(shù)。第二個(gè)方程為男性和女性這兩組之間進(jìn)行均值比較檢驗(yàn)提供了一個(gè)簡單的方法。(3)因變量為log(y)時(shí),對虛擬變量系數(shù)的解釋female的系數(shù)意味著,在edu和exper的相同水平上,女性比男性約少掙34.4%。當(dāng)log(y)是一個(gè)模型的因變量時(shí),將虛擬變量的系數(shù)乘上100,可解釋為y在保持所有其他因素不變的情況下的百分比差異。事實(shí)上,精確的百分比差異是在我們的模型中,這個(gè)精確值是2. 使用多類別虛擬變量(1)可以在回歸方程中使用幾個(gè)虛擬自變量來控制具有多種類別的事物,任何分類變量都可以轉(zhuǎn)換為一系列的虛擬變量
51、。例7.6 對數(shù)小時(shí)工資方程單身男性是基組。(2)使用虛擬變量表示不同組的一般原則(a)如果回歸模型有g(shù)組或g類不同截距,需設(shè)置g-1個(gè)虛擬變量和一個(gè)截距。包含g個(gè)虛擬變量和一個(gè)截距,將導(dǎo)致虛擬變量陷阱。(b)基組的截距就是模型的總截距(c)某一組的虛擬變量系數(shù),則表示了該組與基組之間在截距上的估計(jì)差異。四、以下幾種模型形式表達(dá)的不同含義; 其中D是二值虛擬變量,X是連續(xù)的變量。1):截距項(xiàng)不同;當(dāng)時(shí),基準(zhǔn)組的截距為,的斜率是;當(dāng)時(shí),處理組的截距為,的斜率還是。因此,在X相同的條件下,處理組與對照組相差單位的y。2):斜率不同; 當(dāng)時(shí),基準(zhǔn)組截距是,的斜率是;當(dāng)時(shí),處理組的截距是,的斜率是。因
52、此,度量了基準(zhǔn)組和處理組在的回報(bào)上的差異。3):截距項(xiàng)與斜率都不同;當(dāng)時(shí),基準(zhǔn)組截距是,的斜率是;當(dāng)時(shí),處理組的截距是,的斜率是。因此,度量了基準(zhǔn)組和處理組在截距上的差異;度量了基準(zhǔn)組和處理組在的回報(bào)上的差異。五、虛擬變量陷阱考慮如下小時(shí)工資的簡單模型:這里的定性信息(性別)有2種狀態(tài),因此只設(shè)1個(gè)虛擬變量即可。如果在我們的模型中也包括虛擬變量male。由于male+female=1這將導(dǎo)致完全共線性。當(dāng)使用過多的虛擬變量來描述一定組數(shù)的數(shù)據(jù)時(shí),就會(huì)掉進(jìn)虛擬變量陷阱。因此,在這個(gè)模型中,我們選擇男性為基組(base group)。六、虛擬變量的交互作用1. 虛擬變量與非虛擬的解釋變量的交互作用
53、,使得出現(xiàn)不同的斜率這里,度量了男人和女人截距上的差異,而度量了男人和女人教育回報(bào)的差異(斜率)。 2. 斜率和截距的不同圖(a)的意思是,各種受教育程度的女人的工資都比同等教育程度的男人少。圖(b)的意思是,女人在受教育程度很低時(shí)工資比男人少,但隨著受教育程度的提高,這種差距逐步縮小,并最終會(huì)超過同等受教育程度男人的工資。3. 檢驗(yàn)(1)要檢驗(yàn)?zāi)信芙逃貓?bào)是否相同,用t檢驗(yàn)(2)要檢驗(yàn)受教育水平相等的男女平均工資是否相同,用F檢驗(yàn)習(xí)題:2、4、9;C2、C3、C6、C7、C11第8章 異方差一、異方差的后果1. 什么是異方差( Heteroskedasticity )?同方差假定意味著條件
54、于解釋變量,不可觀測誤差的方差為常數(shù)。如果u 的方差隨x變化,那么誤差是異方差的。對于模型:如果出現(xiàn)即對于不同的樣本點(diǎn),隨機(jī)誤差項(xiàng)的方差不再是常數(shù),而互不相同,則認(rèn)為出現(xiàn)了異方差性(Heteroskedasticity)。2. 異方差的后果(1)在OLS無偏性和一致性的證明中,同方差的假定沒有起到什么作用。OLS估計(jì)量還具有無偏性和一致性。(2)在有效性的證明中利用了同方差的假定。OLS估計(jì)量不具有有效性。(3)估計(jì)量的方差在沒有同方差假定的情況下是有偏的。如果存在異方差,那么估計(jì)值的標(biāo)準(zhǔn)差是有偏的。(4)如果標(biāo)準(zhǔn)差有偏,我們就不能應(yīng)用通常的t統(tǒng)計(jì)量或F統(tǒng)計(jì)量來進(jìn)行統(tǒng)計(jì)推斷。變量的顯著性檢驗(yàn)失去意義(5) R平方和調(diào)整后的R平方仍可以很好地度量擬合優(yōu)度。(6)模型的預(yù)測失效。二、異方差穩(wěn)健標(biāo)準(zhǔn)誤OLS在異方差時(shí)仍然有用,計(jì)量經(jīng)濟(jì)學(xué)家已經(jīng)知道
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度保密技術(shù)合作保密費(fèi)及保密期限協(xié)議
- 二零二五年度養(yǎng)老服務(wù)業(yè)勞動(dòng)合同違約賠償及服務(wù)質(zhì)量標(biāo)準(zhǔn)合同
- 2025年度購房合同簽訂及后續(xù)房產(chǎn)增值服務(wù)協(xié)議
- 2025年法拍房屋拍賣議價(jià)及成交保障合同
- 二零二五年度大型光伏發(fā)電站項(xiàng)目設(shè)備安裝合同
- 二零二五年度青少年輔導(dǎo)班退費(fèi)條款及輔導(dǎo)效果承諾協(xié)議
- 二零二五年度智慧醫(yī)療合同-嚴(yán)格責(zé)任原則下的遠(yuǎn)程醫(yī)療服務(wù)協(xié)議
- 2025年度離婚撫養(yǎng)協(xié)議書:子女撫養(yǎng)、教育支持與財(cái)產(chǎn)分割協(xié)議
- 2025年度特色飲品餐飲特許經(jīng)營協(xié)議
- 2025年景德鎮(zhèn)貨運(yùn)從業(yè)資格證在哪里練題
- GB/T 30797-2014食品用洗滌劑試驗(yàn)方法總砷的測定
- GB/T 20057-2012滾動(dòng)軸承圓柱滾子軸承平擋圈和套圈無擋邊端倒角尺寸
- GB/T 19808-2005塑料管材和管件公稱外徑大于或等于90mm的聚乙烯電熔組件的拉伸剝離試驗(yàn)
- GB/T 10051.1-2010起重吊鉤第1部分:力學(xué)性能、起重量、應(yīng)力及材料
- 2022年人民交通出版社股份有限公司招聘筆試試題及答案解析
- 班組建設(shè)工作體系課件
- 第章交通調(diào)查與數(shù)據(jù)分析課件
- 穆斯林太巴熱咳慶念詞文
- 軟硬結(jié)合板的設(shè)計(jì)制作與品質(zhì)要求課件
- 中醫(yī)院情志養(yǎng)生共64張課件
- 慢性心功能不全護(hù)理查房
評論
0/150
提交評論