版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、計(jì)量經(jīng)濟(jì)學(xué)概念公式第 1章一、數(shù)據(jù)類型:截面、時間序列、面板1. 橫截面數(shù)據(jù)(cross-sectional data se) t定義:對給定的某個時間點(diǎn)的個人、家庭、企業(yè)、城市、洲、國家或者一系列其他單位采集的樣本所構(gòu)成的數(shù)據(jù)集。常被用于勞動經(jīng)濟(jì)學(xué)、健康經(jīng)濟(jì)學(xué)和農(nóng)村經(jīng)濟(jì)學(xué)中。重要特征:數(shù) 據(jù)假定是從總體中通過隨機(jī)抽樣而得到。2. 時間序列數(shù)據(jù)(time series data)定義: 在不同時間點(diǎn)上收集到的數(shù)據(jù),這類數(shù)據(jù)反映了某一事物、現(xiàn)象等隨時間的變化狀態(tài)或程度。如我國國內(nèi)生產(chǎn)總值從1949 到 2015 的變化就是時間序列數(shù)據(jù)。3. 面板或縱列數(shù)據(jù)(panel data)定義:由數(shù)據(jù)集中
2、每個橫截面單位的一個時間序列組成與混合橫截面數(shù)據(jù)區(qū)別:面板數(shù)據(jù)的同一橫截面數(shù)據(jù)單位都被跟蹤了一段特定的時期。面板數(shù)據(jù)前后年份的樣本是相同的,具有可比性。但是混合橫截面數(shù)據(jù)前后年份的樣本很可能大部分不相同,不具有可比性。面板數(shù)據(jù)的優(yōu)點(diǎn):對同一單位的多次觀測,使我們能控制觀測單位的某些觀測不到的特征使我們能研究決策行為或結(jié)果中滯后的重要性。四、用數(shù)據(jù)度量因果效應(yīng),其他條件不變的概念1. 因果效應(yīng)經(jīng)濟(jì)學(xué)家的目標(biāo)就是要推定一個變量對另一個變量具有因果關(guān)系我們希望去解釋:什么導(dǎo)致一些事情發(fā)生?是這個因素還是那個因素?假設(shè)在現(xiàn)實(shí)世界中,X (自變量,一個可能的原因)確實(shí)是Y (因變量,被解釋的變量),那我
3、們就能預(yù)見數(shù)據(jù)分析支持以下假設(shè):如果 X的 數(shù)值增加,Y 的數(shù)值也增加。但由于存在誤差或數(shù)據(jù)不足,統(tǒng)計(jì)檢驗(yàn)可能出錯或被錯誤地解釋。2. 其他條件不變(ceteris paribus)意味著 “其他 (相關(guān)) 因素保持不變”。 在因果關(guān)系中,其他條件不變是具有重要作用的。多元回歸中,所得到的“其他因素不變的效應(yīng)”,并非是通過在實(shí)際抽樣中,固定其他因素不變。 多元回歸分析的優(yōu)勢,在于它使我們能在非實(shí)驗(yàn)環(huán)境中去做自然科學(xué)家在受控實(shí)驗(yàn)中所能做的事情:保持其它因素不變。、回歸分析的基本概念現(xiàn)代意義的回歸是一個被解釋變量對若干個解釋變量依存關(guān)系的研究,回歸的實(shí)質(zhì)是由固定的解釋變量去估計(jì)被解釋變量的平均值。
4、二、回歸分析的常用術(shù)語y因變量、被解釋變量、相應(yīng)變量、被預(yù)測變量、回歸子x 自變量、解釋變量、控制變量、預(yù)測變量、回歸元、協(xié)變量誤差項(xiàng)、干擾項(xiàng),表示除x之外其他影響y的因素,包括沒有觀測到的和不可觀測 到的斜率參數(shù),代表了回歸元的邊際效果,是研究的主要興趣所在-2 截距參數(shù)三、回歸中的四個重要概念1 .總體回歸模型(Population Regression Model , PRM)yt = P0+PXt +Ut-代表了總體變量間的真實(shí)關(guān)系。2 .總體回歸函數(shù)(Population Regression Function , PRFE(yt) = 00+01%-代表了總體變量間的依存規(guī)律。3
5、.樣本回歸函數(shù)(Sample Regression Function , SRFyt =%+以 +et-代表了樣本顯示的變量關(guān)系。4 .樣本回歸模型(Sample Regression Model , SRM?t = K +因xt -代表了樣本顯示的變量依存規(guī)律??傮w回歸模型與樣本回歸模型的主要區(qū)別是:描述的對象不同??傮w回歸模型描述總體中變量 y與x的相互關(guān)系,而樣本回歸模型描 述所關(guān)的樣本中變量y與x的相互關(guān)系。建立模型的依據(jù)不同??傮w回歸模型是依據(jù)總體全部觀測資料建立的,樣本回歸模型是依據(jù)樣本觀測資料建立的。模型性質(zhì)不同。總體回歸模型不是隨機(jī)模型,而樣本回歸模型是一個隨機(jī)模型,它隨樣 本
6、的改變而改變。總體回歸模型與樣本回歸模型的聯(lián)系是:樣本回歸模型是總體回歸模型的一個估計(jì)式,之所以建立樣本回歸模型,目的是用來估計(jì)總體回歸模型。四、線性回歸的含義線性:被解釋變量是關(guān)于參數(shù)的線性函數(shù)(可以不是解釋變量的線性函數(shù)),至于y和x與我們所關(guān)注的被解釋變量和解釋變量有何聯(lián)系,并沒有限制。五、線性回歸模型的基本假設(shè)1 .簡單線性回歸的基本假定對模型和變量的假定:假定SLR.1:線性于參數(shù)在總體模型中,因變量y與自變量x和誤差(干擾)u的關(guān)系如下:其中,兔和耳分別表示總體的截距和斜率參數(shù)。假定SLR.2:隨機(jī)抽樣我們具有一個服從總體模型方程的隨機(jī)樣本 (k, yi ):(i =1,2,L n
7、 » ,其樣本容量為n。假定SLR.3:解釋變量樣本有波動性x的樣本結(jié)果即x :i =1,L ,n,不是完全相同的數(shù)值。對隨機(jī)擾動項(xiàng)u的假定(零均值假定、同方差假定、無自相關(guān)假定、隨機(jī)擾動與解釋變量 不相關(guān)假定、正態(tài)性假定)假定SLR.4:零均值假定給定解釋變量的任何值,誤差的期望值都為零。換言之, E(u|x)=0。假定SLR.5:同方差假定給定解釋變量的任何值,誤差都具有相同的方差,換言之, Var(u|x) =。22 .多元線性回歸模型的基本假定:假定MLR.1 :線性于參數(shù)總體模型可寫成其中,P。,E,L ,印是我們所關(guān)心的未知數(shù),而u是無法觀測到的隨機(jī)誤差或隨機(jī)干擾。假定M
8、LR.2 :隨機(jī)抽樣我們有一個含有n次觀測的隨機(jī)樣本(xi, X2,L , xk, yi ): i=1,2,L , n,它來自假定MLR.1中的總體模型假定MLR.3 :不存在完全共線性在樣本(因而在總體中),沒有一個自變量是常數(shù),自變量之間也不存在嚴(yán)格的線性關(guān)系。兩個變量完全相關(guān),最簡單的情形就是一個變量是另一個變量的常數(shù)倍。自變量可能完全線性相關(guān)的另一種方式是,一個自變量恰好是其他自變量的線性函數(shù)。重要的是我們要注意到,MLR.3允許變量之間有相關(guān)關(guān)系,只是不能是完全相關(guān)。同一變量的不同非線性函數(shù)也都可以出現(xiàn)在回歸元中。假定MLR.4 :條件均值為零給定自變量的任何值,誤差u的期望值為零。
9、換句話說,E(u|xi, X2,L , Xk )=0o假定MLR.5 :同方差性給定任意解釋變量值,誤差u都具有相同的方差。換言之,Var(u|xi, x2,L , Xk )=仃2。假定MLR.6 :正態(tài)性假定總體誤差u獨(dú)立于解釋變量, X2,L , Xk,而且服從均值為零和方差為仃2的正態(tài)分布就橫截面回歸中的應(yīng)用而言,假定 MLR.1-MLR.6被稱為經(jīng)典線性模型假定(CML),因此我 們將這6個假定的模型稱為經(jīng)典線性模型(CLM )。假定MLR.4零均值和零相關(guān)/隨機(jī)擾動與解釋變量不相關(guān)假定對所有的 j =1,2,L , k ,都有 E(u ) = 0和Cov(Xj, u)=0。補(bǔ)充假定:
10、無自相關(guān)假定(不序列相關(guān))隨機(jī)誤差項(xiàng)N的條件不序列相關(guān)性表明在給定解釋變量任意兩個不同的值時,對應(yīng)的隨即誤差項(xiàng)不相關(guān)。可以等價表示為:六、普通最小二乘法(原理、推導(dǎo))1.普通最小二乘法原理:給定一組樣本觀測值(X, yQ:(i=1,2,L n ),假如模型參數(shù)估計(jì)量已經(jīng)求得,并且是最合理的參數(shù)估計(jì)量,那么樣本回歸函數(shù)應(yīng)該能夠最好地?cái)M合樣本數(shù)據(jù),即樣本回歸線上的點(diǎn)與真實(shí)觀測點(diǎn)的“總體誤差”應(yīng)該盡可能地小。因此普通最小二乘法估計(jì)參數(shù)的原則是以“殘 差平方和最小”。即: nmin ” (Yi M)2(?0,?i)i 1推導(dǎo):殘差平方和對上述殘差平方和Q分別對 周、此求偏導(dǎo)數(shù),可以得到此方程最小化問題
11、的一階條件: 這兩個方程與前面的矩條件完全一致,可以用相同的方法求解參數(shù)。2.矩估計(jì)方法零條件均值假定E(u|x) = E(u) = 0有兩個意義:(1) E(u) = 0; (2) E(u|x) = E(u)。根據(jù)本書附 錄中條件期望性質(zhì) 5 (Property CE.5, p.719),由(2)可得 Cov(u, x)=0。又因?yàn)?Cov(u, x)= E(u-E(u)x-E(x)= E(ux) - E(u)E(x)= E(ux)。故有 E(ux) =0。假定對于一個總體(population),存在簡單回歸方程:假定零條件均值假定成立:E(u|x) = E(u) = 0o于是有: E(u
12、)=0(2) E(ux)=0將卜=丫 P°Ax代入上述等式(1)、,得:(3)E y。-)x =0(4) E x y - p - x =0(3)、(4)稱為總體的矩條件。從總體中隨機(jī)抽取一個樣本容量為n的隨機(jī)樣本,用(x, yi ):(i=1,2,L n ) , i表示單個樣本(observation)的編號,n是樣本總量。xi , yi表示第i個樣本的相應(yīng)的變量。每一觀測 樣本i均應(yīng)滿足:y =P。+PiX +/。將前面所假定的總體矩條件(3)、(4)應(yīng)用于樣本中,這種 方法稱為矩估計(jì)法(method of moments) 0與總體中的矩條件(3)、(4)相對應(yīng),在樣本中相應(yīng)的矩
13、條件(sample counterparts為: n(3') n£ (y -肉-邑xi )=0 i 1 n(4') n'Z x(y - 因-Wx )=0 i W求解關(guān)于0、Pi的方程組(3)、(4')。根據(jù)樣本均值的定義以及加總的性質(zhì),可將條件(3')變換為 y =此+暇x或者熊=y - % x代入條件(4')得到因此OLS估計(jì)的斜率為OLS估計(jì)的截距為n 2其中,彳貿(mào)定z (x -x ) >0 o i 1七、OLS的代數(shù)性質(zhì)n1 . OLS殘差和及其樣本均值均為零。代數(shù)表示 £ U? = 0。i4n由OLS的一階條件得
14、出n'£ (yi %用為)=0。 i 1 n2 .回歸元和OLS殘差的樣本協(xié)方差為零。代數(shù)表示 Z xiC?=0。 y n由OLS的一階條件得出n,£ Xi(y -坊-用x )=0。 i 13 .點(diǎn)(XY)總在ols回歸線上。代數(shù)表示y =用十邑x。n可以由naz (yi 耳-用xi )=0推導(dǎo)出。 i 14 .擬合值的樣本平均值與yi的樣本平均值相等。代數(shù)表示5 .擬合值與殘差之間的樣本協(xié)方差為零。代數(shù)表示Z務(wù)密=0。八、擬合優(yōu)度R21.定義2(1)總平方和SST =工(yi - y )總平方和(SST),是y在樣本中所有變動的測度指標(biāo),即它度量了y在樣本中的總分
15、散程度。將總平方和除以n-1,可得到y(tǒng)的樣本方差。 2(2)解釋平萬和SSE = £ (? -y )回歸模型所解釋的平方和(SSE),是yi的擬合值的在樣本中的變動程度的測度指標(biāo)。(3)殘差平方和SSR=£ U?2殘差平方和(SSR)是殘差的樣本變異程度的測度指標(biāo),表示模型所未解釋的y的變動。(4)離差平方和的分解 TSS = ESS+RSS又因?yàn)椤? ? ? -y =0所以得證2.定義“擬合優(yōu)度”是模型對樣本數(shù)據(jù)的擬合程度。檢驗(yàn)方法是構(gòu)造一個可以表征擬合程度的 指標(biāo)判定系數(shù)又稱決定系數(shù)。c SSE SST - SSR SSR(1) R2= =1,表示回歸平方和與總離差平方
16、和之比;反映了樣SST SST SST本回歸線對樣本觀測值擬合優(yōu)劣程度的一種描述;在解釋R2時,我們通常把它擴(kuò)大100倍,得到一個百分?jǐn)?shù),所以100* R2是y的樣本波動中被x解釋部分的百分比。 2(2) R =0,1;(3)回歸模型中所包含的解釋變量越多,R2越大!九、改變度量單位對OLS統(tǒng)計(jì)量的影響一般而言,當(dāng)因變量乘上常數(shù)c,而自變量不改變時,OLS的截距和斜率估計(jì)量也要乘上 c。若自變量被除以或乘以一個非零常數(shù) c,則OLS斜率系數(shù)也會分別被乘以或者除以 c??梢?, 改變自變量的度量單位一般不改變截距值。十、函數(shù)形式(對數(shù)、半對數(shù)模型系數(shù)的解釋)(1)年=用+?必:X變化一個單位Y變化
17、曲單位。(2) lnY?=?0+?/nXi : X 變化 1%, Y 變化?1 ,表示彈性。(3)皿丫 = ?0+?兇:X變化一個單位,Y變化百分之100?1(4) Y? = ?0 +?11nxi : X 變化 1% , Y 變化?i % 0H一、OLS無偏性O(shè)LS的無偏估計(jì)為定理2.1: OLS的無偏性利用假定SLR.1至SLR.4,對P。、久的任何值,我們都有E(此)=Po 和 E 陰)=Pi換言之,熊對兔而言是無偏,但對Pi而言是無偏的。引理:n_nx y ; xi -x Vi 1(1)工(Xi x)=o i 1 nnn(2) Z(K -x X yi - y ) = £ (x
18、-x )v - £ x - i 1i 1i 1nn/ n n(3) SST =Z (x -xX Xi x )=£ (x -x)Xi £ x -nx ix =£ (k x )x i 4i 4i 1i =4推導(dǎo):于是有A _1n1nE(:i)=:i (=)" E(diUi) - Li() diE(u)SSTx i 4SSTx t1 n”(廣 di*0 = 1SSTx y十二、OLS估計(jì)量的抽樣方差定理22 OLS估計(jì)量的抽樣方差在假定SLR.1-SLR.5下,以樣本值I, x2,L , xn)為條件,有證明:十三、誤差方差的估計(jì)由OLS的兩個一階條
19、件給出了 OLS殘差所必須滿足的兩個約束條件??紤]這些限制的一個方法是:如果我們知道殘差中的n-2個,就能通過這兩個約束條件得到另外兩個殘差。因此OLS殘差只有n-2個自由度(degrees of freedom)。因而。2的無偏估計(jì)量為定理2.3:仃2的無偏估計(jì)在彳貿(mào)定SLR.1至SLR.5下,我們有E (仃2 ”。2證明:對上式進(jìn)行平均得到上式減下式得到因此對所有i求和,又得到取期望得-n-2E(2(附月以-(Ui uxx x»=E 2(用邛i ) SST V)因此e i SSR =,其中 ssr=£ n (Ui _U 2 苞 n U2n -2tt十四、OLS估計(jì)量的性
20、質(zhì)(1)線性:是指參數(shù)估計(jì)值 網(wǎng)和網(wǎng)分別為觀測值yt的線性組合。(2)無偏性:是指 此和此的期望值分別是總體參數(shù)P。和口。(3)最優(yōu)性(最小方差性):是指最小二乘估計(jì)量 題和留在在各種線性無偏估計(jì)中,具 有最小方差。十五、高斯-馬爾可夫定理1 .多元回歸的高斯-馬爾科夫定理定理3.4高斯-馬爾科夫定理在假定MLR.1到MLR.5下,由3Pi,L ,此分別是久,/L , 一的最優(yōu)無偏線性估計(jì)量。最 優(yōu)性,這里最優(yōu)被定義為最小方差。2 .簡單回歸的高斯馬爾科夫假定定理2.1: OLS的無偏性(內(nèi)容&證明參見第一章)十六、OLS參數(shù)估計(jì)量的概率分布若假定U遵從以0為均值,仃2為方差的正態(tài)分布
21、,則Y也遵循正態(tài)分布。即在Ui正態(tài)性 的假定下,我們可以得到1. P0, Pi也是正態(tài)分布的十七、OLS隨機(jī)誤差項(xiàng)u的方差。2的估計(jì) 方差。由于0r2實(shí)際上是未知的,因此P0和Pl的方差實(shí)際上無法計(jì)算,這就需要對其進(jìn)行估計(jì)。在估計(jì)的參數(shù) 支和3的方差表達(dá)式中,都含有隨機(jī)擾動項(xiàng)u的方差仃2_ 2仃又稱為總體由于隨機(jī)擾動項(xiàng)Ui不可觀測,只能從Ui估計(jì)值一一殘差e出發(fā),對總體進(jìn)行估計(jì)??梢宰C明,。2的最小二乘估計(jì)為它是關(guān)于。2的無偏估計(jì)。十八、對零條件均值的理解假定MLR.4 :條件均值為零給定自變量的任何值,誤差u的期望值為零。換句話說,E(u|xi, X2,L , xC=0 o假定SLR.4:零
22、均值假定給定解釋變量的任何值,誤差的期望值都為零。換言之,E(u|x)=0。(1)限定總體中X和U的關(guān)系對一個隨機(jī)樣本,這個假定意味著對所有的i=1,2,n,都有E(uilx )=0。(2)技術(shù)簡化我們可以以樣本中的xi值為條件推導(dǎo)OLS, x非隨機(jī)變量,cov (x, u) =0習(xí)題:4、5、6; C2、C3、C4第3章多元回歸分析:估計(jì)一、變量系數(shù)的解釋(剔除、控制其他因素的影響)對斜率系數(shù)?i的解釋:在控制其他解釋變量(X2)不變的條件下,X1變化一個單位對 Y的影響;或者,在剔除了其他解釋變量的影響之后,X1的變化對Y的單獨(dú)影響!二、多元線性回歸模型中對隨機(jī)擾動項(xiàng) u的假定,除了零均值
23、假定、同方差假定、無自相關(guān)假 定、隨機(jī)擾動與解釋變量不相關(guān)假定、正態(tài)性假定以外,還要求滿足無多重共線性假定。定理3.2:在假定MLR.1到MLR.5之下,以自變量的樣本值為條件,對所有的j = 1,2,L , k , 都有2其中SST =£ ijxj -xj )是xj的總體樣本波動,而R2則是將xj對所有其他自變量(并包含一個截距項(xiàng))進(jìn)行回歸所得到的 R2。在我們詳盡的研究估計(jì)值方差之前,我們要注意,在得到這個公式的過程中,用到了所有高斯-馬爾科夫假定。雖然OLS的無偏性不需要同方差假定,但是要讓上述式子成立,則必然 要求同方差。Var(% )的大小在實(shí)踐中也很重要。方差越大,則意味
24、著估計(jì)量越不精確,也就 是置信區(qū)間越大和假設(shè)檢驗(yàn)越不準(zhǔn)確。1 .多重共線性的概念:若R2 t 1 ,則Vr (伊j )tg,兩個或多個自變量之間高度相關(guān)(不完全相關(guān)),被稱為多重共線性。多重共線性不違背假定 MLR.3,但是我們也不能確定一個臨界值來說明是否存在多重共線 性。例如R2=0.9意味著在Xj的樣本變異中,90%都可以由回歸模型中的其他自變量來解釋。 即Xj與其他的自變量有很強(qiáng)的相關(guān)關(guān)系。2 .多重共線性的后果(1) OLS估計(jì)量方差變大(2)核心是OLS估計(jì)量和它的標(biāo)準(zhǔn)差相比有多大(3)對樣本數(shù)據(jù)敏感(4)難估計(jì)某個特定解釋變量的影響3 .多重共線性的檢驗(yàn)(1)相關(guān)系數(shù)(2)擬合優(yōu)
25、度3 3) VIF膨脹因子(4)特征值4 .多重共線性的處理(1)收集跟多數(shù)據(jù)(2)去掉部分解釋變量,但會導(dǎo)致模型偏誤(3)合并解釋變量三、多元線性回歸模型最小二乘法1 .多元線性回歸模型參數(shù)的最小二乘估計(jì)式(1)首先考慮兩個自變量的模型:建模的原理依舊是使得殘差平方和達(dá)到最小P1的估計(jì)值為其中人是利用現(xiàn)有樣本將2對X2進(jìn)行簡單回歸而得到的OLS殘差。因此,Pi度量的是,在排除X2變量的影響之后,x1對y的影響。(2)在含有k個自變量的情形中。在選擇估計(jì)值時,我們最小化了殘差平方和這個最小化問題可以使用多元微積分求解,OLS的一階條件為在一個含有k個解釋變量的一般模型中,仍然可以寫成(3.22
26、)式(證明見本章附錄3A.2):殘差A(yù)il是來自Xi對X2,,Xk的回歸。因此,Pi度量的是,在排除X2,,Xk等變量的影響之后,入對y的影響。證明:(3)最小二乘法(OLS)公式證明:最小二乘法就是選擇一條直線,使其殘差平方和達(dá)到最小值的方法。即選擇P ,使得下式 最小。求解方程組:2 .參數(shù)估計(jì)式的分布性質(zhì)及期望、方差和標(biāo)準(zhǔn)誤差(1)參數(shù)估計(jì)式的分布性質(zhì)直接從單變量模型推廣,可得OLS擬合值和殘差的某些重要性質(zhì)。(a)殘差的樣本平均值為零,即y=y;(b)每個自變量和OLS殘差之間的樣本協(xié)方差為零,于是 OLS擬合值和OLS殘差之間 的樣本協(xié)方差也為零。于是 OLS擬合值和OLS殘差之間的
27、樣本協(xié)方差也為零。(c)點(diǎn)(X1, X2ll|Xk,y)總位于樣本 OLS 回歸線上 y = P0 + P1 Xi+川 + PkXk。(2)參數(shù)估計(jì)式的期望定理3.1: OLS的無偏性在假定MLR.1至MLR.4下,下式對總體參數(shù) 月的任意值都成立:即OLS估計(jì)量是總體參數(shù)的無偏估計(jì)量。證明:如我們所知,估計(jì)值不可能是無偏的,因?yàn)橐粋€估計(jì)值就是從一個特定的樣本得到的固定 值,它通常都不等于總體參數(shù)。我們說OLS在四個假定下是無偏的是指當(dāng)我們將用來得到OLS估計(jì)值的程序用到各種可能的隨機(jī)樣本時,這個程序是無偏的。(3)參數(shù)估計(jì)式的方差協(xié)方差矩陣因?yàn)閎 =(X'X),X'(X ;)
28、 = : (X'X)X ;b的協(xié)方差矩陣為定理3.2: OLS斜率估計(jì)量的抽樣方差在假定MLR.1到MLR.5之下,以自變量的樣本值為條件,對所有的 j=1,2,k都有 其中SST是xj的總樣本變異,而R2是將xj對其他所有其他自變量進(jìn)行回歸得到的 R2。(4)參數(shù)估計(jì)式的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)差P j的標(biāo)準(zhǔn)差(a)為了估計(jì)下一章構(gòu)造置信區(qū)間,我們還要根據(jù)估計(jì)量(b)由于仃未知,我們用。代替,得到P的標(biāo)準(zhǔn)誤如果誤差表現(xiàn)出異方差性,那么上述公式給出的標(biāo)準(zhǔn)誤就不是 sd(P j )的一個可靠估計(jì)量異方差的出現(xiàn),盡管不會導(dǎo)致 叫的偏誤,但是會導(dǎo)致Var(Pj )的常用公式導(dǎo)致偏誤,從而使 得標(biāo)準(zhǔn)誤無效。
29、3 .在基本假定滿足的條件下,多元線性回歸模型最小二乘估計(jì)式是最佳線性無偏估計(jì)式提出問題:在假定MLR.1-MLR.4下,OLS估計(jì)是無偏的,但在這個假定下還有其他許多的無偏估計(jì)量,那么還有其他的無偏估計(jì)量的方差比OLS估計(jì)量的方差還小么?如果我們適當(dāng)限制這些估計(jì)量的范圍,我們將證明,在所有的無偏線性估計(jì)量當(dāng)中,OLS是最好的一個。即在 MLR.1-MLR.5的前提下,OLS估計(jì)量是最優(yōu)線性無偏估計(jì)量(BLUE)。(1)無偏性在當(dāng)前背景下,如果Pj的一個估計(jì)量,比方說,對任意的412川,Pk都有E(Pj)=Pj, 那么就說久是鳥的無偏估計(jì)量(2)線性性3具有線性性的充要條件是,Pj能表示成因變
30、量的一個線性函數(shù) 3=£ nwjyi,其中wj 是自變量樣本值的一個函數(shù)。(3)最優(yōu)性這里最優(yōu)被定義為最小方差。定理3.4高斯-馬爾科夫定理在假定MLR.1到MLR.5下,網(wǎng)pj ,及分別是 鼠Pj ,久的最優(yōu)無偏線性估計(jì)量高斯-馬爾科夫定理辨明了估計(jì)多元回歸模型時使用OLS的合理性,但是注意,如有高斯馬爾科夫假設(shè)中有一個不成立,那么該定理就是不成立的。四、估計(jì)的回歸模型多元線性回歸模型的一般形式其中鳧為截距項(xiàng),(白邛2川|邛卜)為斜率參數(shù),u為誤差項(xiàng)(干擾項(xiàng))。關(guān)鍵性假設(shè): 即所有不可觀測誤差項(xiàng)中所有因素都與解釋變量無關(guān),無法觀測因素均值為零。五、殘差的方差和協(xié)方差矩陣1 . 殘差
31、的方差我們現(xiàn)在來研究Q2的無偏估計(jì)量。在一般的多元回歸情形中,仃2的無偏估計(jì)量是方程中n-k-1是含有n個觀測量和k個自變量的一般OLS問題的自由度。由于在一個含有k個自變量和一個截距項(xiàng)的模型有 k+1個參數(shù)。因此我們有df二觀測次數(shù)-估計(jì)參數(shù)個數(shù)=n-(k+1)從技術(shù)上講,除以n-k-1是因?yàn)闅埐钇椒胶偷钠谕禐?nn由于£ Ui =0和£ xjui =0 ,因此在實(shí)行OLS估計(jì)時施加了 k+1個限制。意味著,給定殘差 i 1i 1n-k-1個方程,就能得到剩余的k+1個殘差。定理3.3。2的無偏估計(jì)在高斯-馬爾科夫假定MLR.1-MLR.5下2仃的正平方根稱作回歸標(biāo)準(zhǔn)誤
32、或 SER, SER是誤差項(xiàng)標(biāo)準(zhǔn)差的估計(jì)量2 .估計(jì)的方差的協(xié)方差矩陣是:六、擬合優(yōu)度1 .與簡單回歸模型中一樣,我們定義2總平萬和SST=' yy2解釋平萬和SSE=< ?i -y2殘差平方和SSR=£ U2 =(y -yi )2.判定系數(shù)(1) R2總是介于0到1之間。一個接近于1的判定系數(shù)表明OLS給出了一個良好的擬合,一個于0的判定系數(shù)表明OLS給出了一個糟糕的擬合(2)還可以證明R2等于yi的實(shí)際值與擬合值相關(guān)系數(shù)的平方,即:(3)在多元回歸中,有關(guān) R2的一個重要事實(shí)是,在回歸中多增加一個自變量后,它絕 對不會減少,而且通常會增大。所以用R2判斷是否在模型中
33、增加一個或幾個變量不是很恰當(dāng)。 在后面章節(jié)我們會給出一個新指標(biāo):調(diào)整的R2。一般情況下,計(jì)量經(jīng)濟(jì)學(xué)家關(guān)心的是好的估計(jì)量而不是高的擬合優(yōu)度。七、遺漏變量偏誤1 .簡單情形現(xiàn)在假設(shè)我們是遺漏了一個實(shí)際應(yīng)該包括在模型中的變量,通常稱為排出一個有關(guān)變量 (excluding a relevant variably或者對模型設(shè)定不足。推導(dǎo)遺漏一個重要變量所導(dǎo)致的偏誤, 是誤設(shè)分析(misspecification analysis的一個例子,我們從含有兩個變量的模型入手:并假設(shè)模型滿足 MLR.1-MLR.4。(1)由于疏忽或者數(shù)據(jù)不足,我們在排除 X2的情況下估計(jì)這個模型得到:由之前的關(guān)系(簡單回歸和
34、多元回歸估計(jì)值的比較P66)其中B1和燈是y對'、X2的多元回歸斜率估計(jì)量。&是X2對X1的簡單回歸的斜率估計(jì)量, 只與自變量有關(guān)。證明:解方程組得到故證畢(2)由多元回歸的無偏性我們有3的偏誤為A和Pi之間的關(guān)系還表明,它們在兩種明顯的情況下回相等:(a)樣本中X2對y的偏效應(yīng)為0,即3=0(b)樣本中x1和x2不相關(guān),即a=0證明:由于61是X1與X2的協(xié)方差與X1的樣本方差的比值,所以當(dāng)且僅當(dāng)X1和X2不相關(guān)時, 日1是無偏的。2 .遺漏變量的誤差進(jìn)行經(jīng)濟(jì)學(xué)中的經(jīng)驗(yàn)研究時,掌握與偏誤有關(guān)的術(shù)語很重要。在以上模型前提下,若E(Pi )>P1,我們稱Pi有向上的偏誤,若
35、E(Pi)<P1,我們稱Pi有向下的偏誤。向零的偏誤指E (% )比R更接近零的情況,如果 R為正,則Pi向下的偏誤就是向零的偏誤;反之,如果月為負(fù),則Bi向上的偏誤就是向零的偏誤。3 . 一般情形一個解釋變量與誤差之間存在相關(guān)性,那么一般會導(dǎo)致所有的OLS估計(jì)量都產(chǎn)生偏差。例如:總體模型滿足假定MLR.1-MLR.4,但我們遺漏了變量X3 ,并且估計(jì)的模型為現(xiàn)假設(shè)X2與X3無關(guān),但Xi與X3相關(guān),此時3和比通常都是有偏的,唯一的例外是Xi和X2 不相關(guān)。因?yàn)槭聦?shí)上,當(dāng)Xi和X2不相關(guān),證明即使是上述簡單的模型,也很難判斷偏誤的方向。若?3>0且Corr(Xi,X3)>0,就
36、有Pi的偏誤為正。習(xí)題:1、2、6、7、8、10; C2、C5、C6第4章多元回歸分析一、經(jīng)典線性模型假定假定MLR.6 :正態(tài)性假定總體誤差u獨(dú)立于解釋變量Xi, X2,L , Xk,而且服從均值為零和方差為仃2的正態(tài)分布 就橫截面回歸中的應(yīng)用而言,假定 MLR.i-MLR.6被稱為經(jīng)典線性模型假定(CML),因此我 們將這6個假定的模型稱為經(jīng)典線性模型(CLM )。在CLM假定下,OLS的估計(jì)量比在高斯-馬爾科夫假定下的估計(jì)量更加的有效??梢宰C 明,在CML假定下,OLS是最小方差無偏估計(jì)。甚至不需要將比較限制在y的線性估計(jì)量內(nèi)。 總結(jié)CLM的一個簡便表達(dá)式為:在任何一個應(yīng)用中是否可以假定
37、 u的正態(tài)性,實(shí)際上是一個經(jīng)驗(yàn)問題。例如,由于工資不 可能是負(fù)數(shù),因此嚴(yán)格的講,它不可能服從于正態(tài)分布。而且,因?yàn)榇嬖谧畹凸べY法,總體中 有一定比例的人恰好得到最低工資,這也與正態(tài)分布性質(zhì)相矛盾。以往的經(jīng)驗(yàn)表明,對工資而 言,正態(tài)分布不是一個好的假設(shè)。通常通過一種變換,特別是取對數(shù),可以得到一個更為接近 正態(tài)性質(zhì)的分布。同樣這也是一個經(jīng)驗(yàn)問題。在有些例子當(dāng)中,假定 MLR.6明顯是錯誤的,然而對于大樣本容量來說,誤差的非正態(tài)性質(zhì)算不上是一個非常嚴(yán)重的問題(漸近正態(tài))因此目前我們姑且認(rèn)可誤差的正態(tài)性假設(shè)。二、正態(tài)抽樣分布定理4.1:正態(tài)抽樣分布在CLM假定MLR.1-MLR.6下,以自變量的樣本
38、值為條件,有由定理3.2有因此,證明:其中人是對其他自變量進(jìn)行回歸的第i個殘差,而SSR是這個回歸的殘差平方和。三、變量顯著性檢驗(yàn),t檢驗(yàn)1 .基本原理(1)假設(shè)檢驗(yàn)原理:概率性質(zhì)的反證法(2)小概率事件原理:小概率事件在 1次試驗(yàn)中幾乎是不可能發(fā)生。(3) 一般做法:(a)給出一個假定H0;(b)先假定Ho成立,在此假定下,構(gòu)造一個小概率事件 A;(c)進(jìn)行一次試驗(yàn)(如抽得一個容量為n的樣本),觀察試驗(yàn)結(jié)果,看事件 A是否發(fā)生。(d)如果A發(fā)生,則違反了小概率事件原理,就拒絕 H。;反之,則接受H。2 .標(biāo)準(zhǔn)化估計(jì)量的t分布本節(jié)將對總體回歸模型中的單個參數(shù)的假設(shè)進(jìn)行檢驗(yàn)。總體模型可寫作:而且
39、它滿足CLM假設(shè)。為了構(gòu)造假設(shè)檢驗(yàn),我們有如下結(jié)論,定理4.2:標(biāo)準(zhǔn)化估計(jì)量的t分布在 CLM 假設(shè) MLR.1-MLR.6 下,其中,k+1是總體回歸模型中未知參數(shù)的個數(shù)。3 .有關(guān)t檢驗(yàn)的術(shù)語(1)原假設(shè)H0:Pj =0。含義:在零假設(shè)下,第j個解釋變量Xj對y的局部效應(yīng)為0,即 在其他不變的情況,Xj對y沒有影響。(2)我們用來檢驗(yàn)原假設(shè)的統(tǒng)計(jì)量被稱為 P j的t統(tǒng)計(jì)量,定義為t統(tǒng)計(jì)量tpj度量了估計(jì)值 %相對0偏離了多少個估計(jì)量的標(biāo)準(zhǔn)差。切確的拒絕法則取決于對 立假設(shè)和所選擇的檢驗(yàn)顯著性水平(即當(dāng) Ho為真時拒絕它的概率)(3)對立假設(shè)(a)單側(cè)對立假設(shè)Hj 0(b)雙側(cè)對立假設(shè)Hi:
40、pj =0(4)臨界值我們需要知道顯著性水平和自由度。 例如對5%顯著性水平上的檢驗(yàn)和n-k-1=28個自由度(a)單側(cè)臨界值為c=1.701,拒絕域?yàn)閠p >1.701, 一旦滿足條件就拒絕原假設(shè) H。,認(rèn) 為Pj=0,即第j個自變量對y有偏效應(yīng)。(b)雙側(cè)臨界值四、檢驗(yàn)B值的其他假設(shè)如果我們想對形如Ho: Pj =5的假設(shè)進(jìn)行檢驗(yàn),需要更一般的t統(tǒng)計(jì)量考慮校園犯罪和注冊人數(shù)的模型,Pj >1才是有意義的。五、P值1 .定義定義:給定t統(tǒng)計(jì)量的的觀測值,能拒絕虛擬假設(shè)的最小顯著水平被稱為檢驗(yàn)的p值。假設(shè)自由度為40,算得t值為2.423,對應(yīng)5%和1%的臨界值分別為2.021和2
41、.704。我 們是否應(yīng)當(dāng)拒絕零假設(shè)?提前確定顯著水平可能會隱藏關(guān)于假設(shè)檢驗(yàn)的一些有用信息。另一種想法:如果將算得的t統(tǒng)計(jì)量作為臨界值,那么使得零假設(shè)被拒絕的最小顯著水平 是多少?這個水平稱為p值。對于雙邊檢驗(yàn)2 .性質(zhì)(1) P值是一個概率,介于0與1之間。(2) P值很好總結(jié)了經(jīng)驗(yàn)證據(jù)拒絕虛擬假設(shè)的強(qiáng)弱。小 p值是拒絕虛擬假設(shè)的證據(jù),大p 值則不能提供拒絕虛擬假設(shè)的證據(jù)。例如 p值=0.5,有50%的概率觀察一個t統(tǒng)計(jì)量值,它至 少和我們據(jù)計(jì)算得到的t統(tǒng)計(jì)量一樣大。這是拒絕 小的弱證據(jù)。(3) 一且p值被確定下來,在任何理想的顯著水平下都能進(jìn)行經(jīng)典檢驗(yàn)。如果用 «表示 顯著性水平,
42、那么(a)若口 > p值,則拒絕原假設(shè)(b)若口 <p值,則不能拒絕原假設(shè)(4)單側(cè)檢驗(yàn)的p值pvalue = P(Tt)。因此,只需將雙側(cè)檢驗(yàn)的p值除以2即可。六、實(shí)際顯著性與統(tǒng)計(jì)顯著性一個變量的Xj的統(tǒng)計(jì)了顯著性完全由t口得大小決定,而一個變量的經(jīng)濟(jì)顯著性則與 腦的 符號與大小均有關(guān)。因此如果t 口是統(tǒng)計(jì)顯著的,那要么Pj很大,要么se(Pj X艮小。在實(shí)踐中,區(qū)分導(dǎo)致t統(tǒng) 計(jì)量統(tǒng)計(jì)顯著的原因很重要。七、檢驗(yàn)參數(shù)的一個線性組合假設(shè)如何對涉及不止一個參數(shù) E的單個假設(shè)進(jìn)行檢驗(yàn)。考慮原假設(shè)Ho: Pi =?2,在多數(shù)情況下,我們關(guān)心的對立假設(shè)是在大專的一年比不上在大學(xué)的一年。這可以
43、表示為Hi:Pi <?2 0變形一下得到:H0 : P1 P2 =0和 H1 : P1 P2 <0為了及時我們估計(jì)量中的抽樣誤差,我們將這個差值除以標(biāo)準(zhǔn)誤,將其標(biāo)磚化。一旦我們得到該檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)的過程就一如從前。檢驗(yàn)不同參數(shù)之間的關(guān)系之所以比檢驗(yàn)一個單獨(dú)參數(shù)更困難,只是因?yàn)橐玫絪e(Pi-?2)o為了求出se(Pi-與),我們首先得到這個差值的方差。由于-2 _2)T和se(p2 J分別是Va”3 )和Var(P2 )的無偏估計(jì)量,所以又其中,s2表示Cov( B1, B2 )的一個估計(jì)量。這里我們將4和3之差定義為一個新參數(shù)4=3-尾。于是我們想檢驗(yàn)H0 :日1 =0對 H
44、1 :日1 <0t統(tǒng)計(jì)量用0表示就是關(guān)鍵是如何找到se9i )。我們的做法是通過改寫模型,以使得為直接作為方程中的自變量出現(xiàn)。由于0i =Pi-P2,我們將Pi =目+曳帶入重新整理方程。八、理解排除性約束1 .虛擬假設(shè)除了檢驗(yàn)參數(shù)的單個約束外,我們常常還需要檢驗(yàn)關(guān)于基本參數(shù)的多重假設(shè),我們首先從 檢驗(yàn)一組自變量時候?qū)σ蜃兞慷紱]有影響這個首要問題開始。我們考慮如下虛擬假設(shè)該假設(shè)由3個排除性約束構(gòu)成,這是多重約束的一個例子,對多重約束進(jìn)行的檢驗(yàn)被稱為 多重假設(shè)檢驗(yàn)。對于該例子,合適的對立假設(shè)為我們該如何檢驗(yàn)式(4.29)呢?人們不禁想到使用t統(tǒng)計(jì)量以分別決定每個變量是否顯著, 但是這種方式
45、是不合適的!這是因?yàn)椋粋€特定的 t統(tǒng)計(jì)量只能檢驗(yàn)一個對其他參數(shù)沒有任何 限制的假設(shè),止匕外,我們還需要對付三個結(jié)果一一每一個t統(tǒng)計(jì)量對應(yīng)一個結(jié)果。我們需要一個聯(lián)合檢驗(yàn)這些排除性約束的方法。2 .對排除性約束的檢驗(yàn)對比下面兩個估計(jì)模型:(1)不受約束模型SSR=183.186 R2 =0.6278(2)受約束模型SSR=198.311 R2 =0.5971對比兩個估計(jì)模型,正如我們所想,受約束模型的 SSR較大而擬合優(yōu)度較小。我們需要 決定的是SSR從不受約束模型到受約束模型的增加,是否足以拒絕 H。因此,我們需要一種 方法,能合并這兩個SSR的信息,得到一個在H。下分布已知的統(tǒng)計(jì)量。我們不妨
46、針對一般情形推導(dǎo)這個檢驗(yàn)統(tǒng)計(jì)量,將具有k的自變量的不受約束模型寫成假設(shè)我們排除了 q個排除性約束要檢驗(yàn):xy4dII儕,虛擬假設(shè)表示為:當(dāng)從不受約束模型到受約束模型時,SSR的相對增加對假設(shè)檢驗(yàn)而言是有意義的,因此定 義F統(tǒng)計(jì)量如下:其中,SSR是受約束模型的殘差平方和,SS%是不受約束模型的殘差平方和。由于 SSR 不可能比SSR/、,所以F統(tǒng)計(jì)量總是非負(fù)的。九、多個線性約束的檢驗(yàn):F檢驗(yàn)1 .自由度q是所施加的約束數(shù),是受約束模型與不受約束模型的自由度之差。即,q二分子自由度=dfr -dfur分母中SSR要除以不受約束模型的自由度n-k-1二分母自由度=d3在 H 0 下,F(xiàn) Fq,n
47、北2 .拒絕法令C是Fq,n*分布的第95個百分位,拒絕法為(1)如果F >c,我們就說Xkq%H|,Xk是聯(lián)合統(tǒng)計(jì)顯著的;(2)如果F <c,我們就說Xkq和川,Xk是聯(lián)合不顯著的。3 . F統(tǒng)計(jì)量和t統(tǒng)計(jì)量之間的關(guān)系檢驗(yàn)單個變量排除性的F統(tǒng)計(jì)量,等于t統(tǒng)計(jì)量的平方。因?yàn)榫哂蠪i'n分布,所以 在雙側(cè)對立假設(shè)下,這兩種方法得到的結(jié)果相同。4 . F統(tǒng)計(jì)量的R2型5 .計(jì)算F檢驗(yàn)的p值中表示一個自由度為(q, n-k-1)的F隨機(jī)變量,F(xiàn)是檢驗(yàn)統(tǒng)計(jì)量的實(shí)際值。F統(tǒng)計(jì)量的p 值與t統(tǒng)計(jì)量的p值具有相同的解釋一一給定虛擬假設(shè)是正確的, 觀察到的F值至少和我們所 得到的F值一樣大
48、的概率。很小的p值就是拒絕Ho的證據(jù)。同時,如同t檢驗(yàn)一樣,一旦計(jì) 算了 p值,F(xiàn)檢驗(yàn)就可以在任何顯著水平下進(jìn)行。6 .回歸整體顯著性的F檢驗(yàn)虛擬假設(shè)上述假設(shè)相當(dāng)于有k個約束,而當(dāng)我們施加這些假設(shè)時,我們得到受約束模型該估計(jì)模型的R2=0,因?yàn)闆]有解釋變量,所以y中的變異一點(diǎn)都沒有得到解釋。因此該 假設(shè)下的F統(tǒng)計(jì)量可以寫成其中R2就是y對Xi*|,Xk回歸的通常R2。7 .回歸整體顯著性的F統(tǒng)計(jì)量只有在所有自變量的聯(lián)合排除性時才有效。有時稱之為檢驗(yàn)回歸的整體顯著性。有些模型 看上去R2很小,卻有著高度顯著的F統(tǒng)計(jì)量。這就解釋了我們?yōu)槭裁匆?jì)算 F統(tǒng)計(jì)量來檢驗(yàn) 聯(lián)合顯著性,而不是只看R2的大小。
49、十、報(bào)告回歸結(jié)果在實(shí)證研究中如何報(bào)告回歸結(jié)果:1 . OLS系數(shù)估計(jì)值&解釋第一,所估計(jì)的OLS系數(shù)估計(jì)值總應(yīng)該報(bào)告。對于分析中的關(guān)鍵變量,你應(yīng)該對所估計(jì)的系數(shù)作出解釋。比如這個估計(jì)是不是一個彈性? 是否有什么經(jīng)濟(jì)含義?2 .標(biāo)準(zhǔn)誤第二,標(biāo)準(zhǔn)誤總是應(yīng)該與所估計(jì)的系數(shù)一起包括進(jìn)來。因?yàn)闃?biāo)準(zhǔn)誤迫使我們認(rèn)真考慮被檢驗(yàn)的虛擬假設(shè),虛擬假設(shè)并非總是總體參數(shù)為零。同時, 有了標(biāo)準(zhǔn)誤更易得到置信區(qū)問。3 .擬合優(yōu)度&觀測次數(shù)第三,回歸的擬合優(yōu)度R2應(yīng)該被報(bào)告我們看到它除了提供一種度量之外, 還使得計(jì)算排除性約束F統(tǒng)計(jì)量相對簡單。同時觀測 次數(shù)也應(yīng)該報(bào)告。4 .最后,如果幾個方程由許多不同的自
50、變量來估計(jì),我們可能要對不同的人群估計(jì)同一 個方程,或者我們解釋的是不同的因變量,這些情形下,最好將結(jié)果歸納在一個表格中,表中 應(yīng)該標(biāo)明因變量而自變量則應(yīng)該在第一列。習(xí)題:1、2、3、4、6、7、10、11; C3、C5、C8第六章多元回歸分析:專題一、測度單位對OLS統(tǒng)計(jì)量的影響1 .變與不變(1)因變量乘以常數(shù)c,截距和斜率的估計(jì)值都擴(kuò)大為原來的 c倍(2)自變量Xj被乘以非零常數(shù)c,那么其系數(shù)就除以co截距的估計(jì)值不受影響。(3)當(dāng)因變量以對數(shù)形式出現(xiàn),改變度量單位不會影響斜率系數(shù),只影響截距(4) R2不會因y或x的單位變化而變化,SSR SST、SSE和SER不變。(5)數(shù)據(jù)的測度單
51、位改變時,t統(tǒng)計(jì)量和F統(tǒng)計(jì)量不發(fā)生改變(6)怎樣度量數(shù)據(jù)只起非實(shí)質(zhì)性的作用,比如減少所估計(jì)系數(shù)中小數(shù)點(diǎn)后零的個數(shù)。(7)合理的選擇度量單位,可以改進(jìn)所估計(jì)方程的形象,使結(jié)果更好看,而沒有本質(zhì)的 改變。2 . P系數(shù)在計(jì)量應(yīng)用中,有時會用一個難以解釋的尺度來度量一個關(guān)鍵變量。此時我們往往關(guān)心的 是自變量變化其標(biāo)準(zhǔn)差一定倍數(shù)時, 對因變量的影響。有時候?qū)λ凶兞慷紭?biāo)準(zhǔn)化再回歸有其 用處。這意味對每個變量都計(jì)算 z得分。新的系數(shù)是傳統(tǒng)上把它們成為標(biāo)準(zhǔn)化系數(shù)或B系數(shù)。B系數(shù)的含義是如果x提高一倍的標(biāo)準(zhǔn)差,那么 y就變化b倍的標(biāo)準(zhǔn)差。于是我們不是以y或x的原有單位來度量其影響,而是以標(biāo)準(zhǔn)差為單 位。二、
52、進(jìn)一步理解對數(shù)模型1 .使用對數(shù)模型性質(zhì)(1)取對數(shù)后變量的斜率系數(shù),不隨變量測度單位改變。(2)如果y和x都取對數(shù)形式,斜率系數(shù)給出對彈性的一個直接估計(jì)。(3)對于y>0的模型,使用ln(y)作因變量的模型,通常比使用y作因變量的模型更接近CLM假定,取對數(shù)可以緩解條件分布的異方差性和偏態(tài)性。2 .對數(shù)變化的近似值&精確值計(jì)算(1)對數(shù)變化近似等于百分比變化,對數(shù)變化越大,這種近似就越不準(zhǔn)確??紤]以下模型:(2)可給出y精確百分比變化:3 .什么類型的變量經(jīng)常用對數(shù)形式?(1)肯定為正的錢數(shù):工資,薪水,企業(yè)銷售額和企業(yè)市值。(2)非常大的正整數(shù)變量:如人口,雇員總數(shù)和學(xué)校注冊
53、人數(shù)等。(3)以年度量的變量通常以原有形式出現(xiàn):教育年數(shù)、工作經(jīng)歷、年齡等。4 .對數(shù)形式的限制(1) 一個變量取零或負(fù)值,則不能使用對數(shù)。(2)如果y非負(fù)但可以取零,則有時使用log(1+y)(3)當(dāng)y取對數(shù)形式時,更難以預(yù)測原變量的值,因?yàn)樵P驮试S我們預(yù)測10g(y)而不是y o(4)將y作因變量的模型與1ny作因變量的模型不能比較R2 ,它們解釋的是不同變量的 變化。三、二次式的模型1 .二次式的導(dǎo)數(shù)經(jīng)濟(jì)學(xué)中,為了描述遞增或遞減的邊際效應(yīng),常常用二次函數(shù)。y = I。+ :1x + :2乂2 + u2 .二次式的轉(zhuǎn)折點(diǎn)很容易被計(jì)算出來,可以看看是否有意義轉(zhuǎn)折點(diǎn)x* :表面上很小的變量平
54、方的系數(shù)可能實(shí)際上有重要的意義,它代表了變化的斜率 四、交互項(xiàng)的模型y = '0 + 洛 + :2、2 + :3、1、2 + u我們不能單獨(dú)將?1解釋為關(guān)于x1, y變化的度量,我們需要將?3也考慮進(jìn)來。交立項(xiàng)使得解釋變量的偏效應(yīng)如 x1取決于另一個變量的水平,如 x20在建立交互項(xiàng)之前,集中x1和x2的值到我們關(guān)心的值周圍會更有意義。具有交互項(xiàng)的模型解釋可能很棘手。 X1上的系數(shù)B 1衡量了當(dāng)x2=0時x1對y的偏效應(yīng), 這可能是不可能的或是我們不關(guān)心的。因此需要對模型進(jìn)行變形,如x2' = x2 -X20這樣的話,當(dāng) x2' = 0 時,x2 =x2o 五、擬合優(yōu)度
55、基于R2的大小來選擇一組解釋變量,可能會導(dǎo)致一些不合理的模型。經(jīng)典線性模型假定中沒有要求 R2必須大于某個特定值。小的R2意味著沒有對影響y的其他因素進(jìn)行解釋。小的R2不意味u與自變量相關(guān)。無偏估計(jì)與R2的大小無關(guān)。在方程中增加變量時,R2的相對變化十分有用。不同的因變量模型,不能比較R2。六、修正可決系數(shù)的作用和方法。1 .修正可決系數(shù)的作用調(diào)整過的R2的優(yōu)點(diǎn)在于它對向模型增加自變量施加了懲罰。在回歸中增加一個新的變量,R2不會下降,調(diào)整的R2可能會下降。調(diào)整R2可能為負(fù),負(fù)表示它相對自由度個數(shù)而言是個很差的擬合模型。2 .修正可決系數(shù)的方法或者習(xí)題:1、3、4、7; C2、C3、C5、C9
56、、C12第7章虛擬變量一、虛擬變量的定義在經(jīng)驗(yàn)研究中,經(jīng)常會遇到定性因素,如:性別、行業(yè)、季節(jié)、地理等。定性信息:一個人是男是女;一個人受否受過高等教育等。定性信息一般通過定義一個二 值變量(binary variable)或0-1變量刻畫(取值1或0)。在計(jì)量經(jīng)濟(jì)學(xué)中,它們被稱為虛擬 變量(dummy variable)。二、如何引入虛擬變量如果一個變量分成N組,引入該變量的虛擬變量形式是只能放入 N-1個虛擬變量。定義 一個虛擬變量時,我們必須決定哪個取值為 1,哪個取值為00好的定義方式會使方程設(shè)定和 解釋都更清楚。三、虛擬變量系數(shù)的解釋:不同組均值的差(基準(zhǔn)組或?qū)φ战M與處理組)1 .只有一個自變量的情況(1)考慮如下小時工資的簡單模型:系數(shù)之的含義是:給定同等教育程度,說是女性與男性之間在小時工資上的差別。因此,系數(shù)為決定了勞
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商標(biāo)權(quán)知識產(chǎn)權(quán)轉(zhuǎn)讓合同
- 債權(quán)轉(zhuǎn)讓合同范例
- 戶外廣告合同樣本格式模板
- 二手車輛買賣協(xié)議范本
- 2024年接送服務(wù)合同標(biāo)準(zhǔn)范本
- 股份協(xié)議書合同股份協(xié)議書2024年
- 房屋買賣代理合同范文
- 2024年離婚協(xié)議書官方范本
- 2024年購買香蕉的買賣合同范本
- 2024年居間公司股份轉(zhuǎn)讓合同
- 2023年高考物理一輪復(fù)習(xí)練習(xí)題:靜電場及其應(yīng)用(含基礎(chǔ)、提升兩套)
- 遼寧省大連市中山區(qū)2024-2025學(xué)年九年級上學(xué)期期中化學(xué)試題
- 高速公路項(xiàng)目竣工決算審計(jì)服務(wù)投標(biāo)方案(技術(shù)方案)
- 天津市天津市紅橋區(qū)2024-2025學(xué)年八年級上學(xué)期10月期中英語試題
- 八年級物理上冊 第二章 二 物體的質(zhì)量及其測量說課稿 (新版)北師大版
- 湘教版(2024新版)七年級上冊數(shù)學(xué)期中考試模擬測試卷(含答案)
- 期中試題-2024-2025學(xué)年六年級上冊語文統(tǒng)編版
- 中建測評2024二測題庫及答案
- 教科版六年級科學(xué)上冊期中測試卷附答案
- 錢塘江河口概況
- 全國中學(xué)生物理競賽集錦(電磁學(xué))
評論
0/150
提交評論