




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、經(jīng)典線性模型:設(shè)定和估計(jì)2022-2-241主要內(nèi)容 經(jīng)典線性回歸模型 假設(shè) 設(shè)定 估計(jì) 數(shù)據(jù)問題:多重共線性、缺失、異常值 線性估計(jì)的軟件操作 主要基于鮑姆第四章內(nèi)容和Greene第2,3,4章的部分內(nèi)容。2022-2-2421.1 經(jīng)典線性回歸模型多元線性回歸可以表示多元線性回歸可以表示“其他條件不變時,自變量對因變量的偏效其他條件不變時,自變量對因變量的偏效應(yīng)應(yīng)”,通用形式為:通用形式為: 例如: 對某商品的需求和收入、價格有關(guān); 工資方程里年齡和教育效應(yīng) 影響經(jīng)濟(jì)增長的因素:資本、勞動力、人力資本、區(qū)位因素、基礎(chǔ)設(shè)施等 我們我們假設(shè)樣本中每一個觀測值都是由如下過程生成的:假設(shè)樣本中每一
2、個觀測值都是由如下過程生成的:121122,KKKiyf x xxxxx是未知待估參數(shù), 是無法觀測的滿足一定限制條件的誤差項(xiàng)。1122iiiiKKiyxxxiiy的觀測值為一個確定性部分與一個隨機(jī)性部分 之和。擾動項(xiàng)(誤差項(xiàng)) 隨機(jī)擾動項(xiàng)因“擾動”了原本穩(wěn)定的關(guān)系而得名: 無法包含所有可能產(chǎn)生影響的因素,被忽略的以誤差項(xiàng)表示; 測量誤差,如資本存量、受教育程度; 經(jīng)濟(jì)理論有定義,現(xiàn)實(shí)無可觀測的對應(yīng),如永久收入。 2022-2-244例:工資與受教育程度2022-2-245 一個簡單的回歸模型可以表示為:,表示其他因素不變時教育對收入的影響。一般隨著年紀(jì)的增加,收入提高。加入年紀(jì)的影響:和表示
3、呢?許多事實(shí)表明,收入增長的速度在后期比初期要慢,再擴(kuò)展什為么意思:12221232312earningseducationearnings=education=0earningseducationageearningseduc 、和表示什么意思呢?多元線性回歸的一個關(guān)鍵特點(diǎn),是能夠容許我們進(jìn)行在概數(shù)據(jù)中觀測不到的上試驗(yàn)?zāi)钸M(jìn)行。234234ationageage矩陣標(biāo)注*11112111221222221211 = =KKnnnnKnKKKyxxxyxxxyxxxyxxX :;kiixkxXxxxX注,約定的表示方法:表示一個變量;表示一個 列 向量;表示一個矩陣表示第 個變量表示第i個觀測形
4、成的列向量,也就是說表示的一行。1,2,iiiiiyinyx 類似的,用,表示模型對應(yīng)的單獨(dú)觀測值。的觀測值為一個確定性部分和一個隨機(jī)性部分 之和。y = X +用矩陣形式可將線性回歸表示為:經(jīng)典線性模型的假定(CLM)線性:線性: y=X+ ,或?qū)δ硢蝹€觀測 滿秩(可識別)滿秩(可識別):不存在任何自變量之間的完全線性關(guān)系,否則參數(shù)是不可識別的。零條件期望(嚴(yán)格外生性)零條件期望(嚴(yán)格外生性):Ei |X=0。樣本中第i次觀測到的干擾的期望值,不是任何一次觀測到的自變量的函數(shù)。也就是說自變量不能為預(yù)測干擾項(xiàng)提供信息。并且Ei =EXEi |X=0.球形干擾:同方差和無自相關(guān)正態(tài)性:干擾項(xiàng)服從
5、均值為0和方差為常數(shù)的正態(tài)分布,2022-2-247iiiyx 2var| ,|0,iijcovij XX2|0,N XI注:除非特殊情況確定不含截距,否則X的第一列都是1.回歸模型的線性形式注意,線性注意,線性是指 參數(shù)和干擾項(xiàng)進(jìn)入方程的形式, 而不是指變量之間的關(guān)系。Ey|x = 1 f1() + 2 f2() + + K fK(). fk() 可以是數(shù)據(jù)的任何函數(shù).例如: 簡單線性模型:二次多項(xiàng)式模型:對數(shù)線性 常彈性 模型:半對數(shù)模型:超越對數(shù)模型:2120kkk0101kkklklkkly=Xyxxlnylnxlnyxt; ylnxlnylnx1/2lnx lnx*例:超越對數(shù)模型2
6、022-2-249 111|ln0211|ln0,exp lnlnln,ln1,1,.,1ln/lnln1 +/lnlnln2KkkKKkkkKKklkkly= g xxxxyfxxyffxxfxxx xxx0超越對數(shù)函數(shù)通常認(rèn)為是對未知函數(shù)的二階近似。首先,將函數(shù)寫成,基于一個簡單變換,將原函數(shù)變化為將上述函數(shù)在點(diǎn)處進(jìn)行二階泰勒展開,于是:0111lnln 1lnlnlnln2KKKkkklklkkllyxxxx x0這個函數(shù)及其導(dǎo)數(shù)在處是常數(shù),因此可以整理=,成線性回歸模型可以解釋為對某種未知函數(shù)關(guān)系的一種近似。 00000000yf xxyf xf xfxxxf xx fxfxxx根據(jù)泰
7、勒級數(shù)近似方法,將在 處進(jìn)行一階泰勒展開:例:工資方程 其中,WAGE=工資率;S=接受教育年限,TENURE=當(dāng)前工作崗位的持續(xù)年限,EXPER=勞動經(jīng)驗(yàn)(即當(dāng)前與以往的工作總年限)。該方程滿足線性形式,y=log(WAGE)。因變量取對數(shù)形式,稱為“半對數(shù)形式”,該方程是通過下述的工資率水平與自變量的非非線性關(guān)系得到的: 半對數(shù)形式的回歸系數(shù)解釋成百分比的變化而非水平變化,如1 =0.05表示增加1年的教育大約能提高5%的工資水平。 對數(shù)形式的變換相當(dāng)于數(shù)量的百分比變化2022-2-24100123logiiiiiWAGESTENUREEXPER 0123expexpexpexpexpii
8、iWAGESTENUREEXPER滿秩 矩陣X列滿秩, 即X的列線性獨(dú)立,并且最少有K個觀測值。 下面的模型中存在一種精確的線性關(guān)系,違背了該假設(shè),參數(shù)無法估計(jì)。2022-2-241112342233441234 Cnonlabor incomesalarytotal incometotal incomesalarynonlabor incomeaaaaCnonlabor incomesalarytotal income 其中,令為任意數(shù)。模型可以重新表示為: 例:完全共線性:例:完全共線性:An Unidentified (But Valid)Theory of Art Appreciati
9、onEnhanced Monet Area Effect Model: Height and Width EffectsLog(Price) = + 1 log Area + 2 log Aspect Ratio + 3 log Height + 4 Signature + (Aspect Ratio = Height/Width). This is a perfectly respectable theory of art prices. However, it is not possible to learn about the parameters from data on prices
10、, areas, aspect ratios, heights and signatures.log Height=1/2*(log Area + log Aspect Ratio )零條件均值:嚴(yán)格外生性2022-2-2413 121.|0=02.=. iijijijijKiEEE xE xEE xEXx0y | XX即自變量與誤差項(xiàng)正交。于是有:干擾項(xiàng)是從某個總體中完全隨機(jī)的抽取的,回歸函數(shù)所涉及的不可觀測因素都和可觀測因素系統(tǒng)的不相關(guān)。經(jīng)典回歸模型的圖示2022-2-24141.2 模型的估計(jì):最小二乘法 線性模型的未知參數(shù)是我們要估計(jì)的對象。注意總體參數(shù)(、)和樣本估計(jì)值(b、e)的區(qū)
11、別。2022-2-2415; ,iiiiiiiiiiiiiiiyeyyeyx bx bx x bxbx b干擾項(xiàng):對任意的 值,我們用殘差來估計(jì) :根據(jù)定義:總體量 是未知參數(shù),希望用來估計(jì)它們:選擇一個向量使得擬合線接近數(shù)據(jù)點(diǎn)。誤差項(xiàng)殘差項(xiàng)總體回歸樣本回歸*OLS估計(jì)量的正規(guī)方程 最小二乘估計(jì)量最小化殘差平方和 2022-2-2416022000110000min:2 (1 1)/ (K 1) (-2)(nK)(n 1) = (-2)(Kn)(n 1) = K 1nniiiiieyFOC bx b(y-Xb )(y-Xb )(y-Xb )(y-Xb )X(y-Xb ) = 0b =-1 1
12、1 K 1 K 1 .: =OLSbXy = XXbbXXXyb注意:標(biāo)量對向量的導(dǎo)數(shù)是向量令 為解稱為估計(jì)量。這里注意估計(jì)量是個隨機(jī)變量。如果解釋變量只包含一個常數(shù)項(xiàng)呢?如果解釋變量只包含一個常數(shù)項(xiàng)呢?*矩方法估計(jì)量矩法估計(jì)量是由矩條件定義的,矩條件被假定對總體矩是成立的,當(dāng)用不可觀測總體矩的樣本對應(yīng)形式代替總體矩時,就能得到參數(shù)的可行估計(jì)量。零條件均值意味著:每個解釋變量和誤差項(xiàng)都不相關(guān)。見鮑姆P65.2022-2-2417交叉矩陣*2022-2-241822111121111212212112122122121112112.=.nnniiiiiiiiKiiiiiKnnnniiiiiiii
13、KiiiiiKinnniiKiiiKiiiKiKiiKixx xx xxx xx xx xxx xx xxx xx xx xxx xx xXX = 21211212111. =. = . 1.iKiiniiiiKikiiniiikniiiniiixxxxxxKKxxxyyKxXy =x xx例子:工資方程的估計(jì)2022-2-2419數(shù)據(jù)來自Wooldridge,wage10123log wageeducexpertenureub1b2b3b0=X XbX y1.3 OLS估計(jì)的代數(shù)特征 1.殘差和等于0。 2.每個自變量和殘差之間的樣本協(xié)方差為0. 3.總是經(jīng)過均值點(diǎn)。 4.回歸擬合值的均值等
14、于實(shí)際數(shù)據(jù)的均值。這一結(jié)論來自第一條。2022-2-242010niie110 nni iiieEixx0或理解為正交條件的樣本形式。 yykk:01XXbXy = -X y-Xb = -Xe = 0Xxx eX根據(jù)一階條件(正規(guī)方程組):因此,對 的每一列,都有。如果 的第一列都是 ,那么:e,nyy = Xb+i y = i Xb+i exb除以 得2022-2-2421+ =0,0,iiiiiiiyeyeeex b模型預(yù)測的值 擬合值 低于真實(shí)值;模型預(yù)測的值 擬合值 高于真實(shí)值;1.4* 分塊回歸2022-2-2422回歸模型回歸模型: y = X1 1 + X2 2 + (總體) =
15、 X1b1 + X2b2 + e (樣本)221FrischWaughLovell112yXXyXXXb定理:在向量 對兩組變量和的線性最小二乘回歸中,將對做回歸并得到殘差,然后將的每一列對做回歸并得到一組殘差,將前者所得殘差對后者所得殘差集再做回歸,就可以得到子向量系數(shù) 。這個過程被稱為剔除(partialing out)或凈化(netting out)X1 的影響,因此多元回歸中的系數(shù)通常又稱為偏回歸系數(shù)(partial regression coefficients)。應(yīng)用:時間序列數(shù)據(jù)的“detrending” 汽油消費(fèi)數(shù)據(jù)X = 1, year, PG, Y, y = G . 完整回
16、歸系數(shù): 去趨勢后回歸系數(shù):2022-2-2423“Detrend the data” means compute the residuals from the regressions of the variables on a constant and a time trend. 1.5 擬合優(yōu)度:中心化的R22022-2-2424 將每個觀測值解釋部分和未解釋部分直觀上講,若 到其均值的離差比殘差可以更多的解釋 的離差,則回歸的擬合程度看起來就越好。iiiiiiyyeyy = yy + exy222 (SST) (SSR) (SSE) SST SSR SSE,總平方和,回歸平方和,殘差平方
17、和則有:iiiyyyye度量y的變異中能由x的變異加以解釋的比例,介于01之間。2212111 niiniieSSRSSERSSTSSTyy* 非中心化的R2 當(dāng)自變量中不包含常數(shù)時,R2 可能為負(fù)值,相關(guān)的另一概念為非中心化的R2 。2022-2-242521ucR e ey y ,0y y = y +ey +e = y y +e ey ebX e因?yàn)檎{(diào)整R方2022-2-2426222*2*21zyzyzRRRrrXXXXyz表示控制變量 后 和 之間的偏相關(guān)系數(shù)222212122/11111/1/1,1 /()12niiniiRRenKnKnRRnnKyynRRnnK 0e ey M y
18、而調(diào)整包含了對添加變量引起自由度變化的懲罰增加變量時如果平方和下降不夠快,可能下降一定小于因?yàn)槔篟方和調(diào)整R方2022-2-2427201234lwageageageeducationkids22599.45810.041625.0844281110.0410.03194285 RR方差分析表 SS:平方和 Residual SS:殘差平方和,n-K個自由度,K包含常數(shù)項(xiàng) Total SS:總平方和,n-1個自由度 Model SS:回歸平方和,K-1個自由度 df:自由度 MS:均方。等于平方和除以自由度2022-2-2428R方和模型比較 R2 是對y和x線性關(guān)系的一種度量,難以擬合非線
19、性的關(guān)系; R2 =0.99就好嗎?非穩(wěn)定時間序列往往存在“偽回歸” 不同模型比較的因變量要統(tǒng)一。如對數(shù)-水平值的選擇。Y的變異和lnY的變異不是一碼事。 只有在一個包含常數(shù)項(xiàng)的線性方程中使用最小二乘法, R2 才能理解為x的變異解釋了多少y的變異。2022-2-2429系數(shù)估計(jì)值與系數(shù) 有時候也線性回歸也以系數(shù)進(jìn)行報(bào)告,表示當(dāng)自變量變化一個標(biāo)準(zhǔn)差時因變量變動多少個標(biāo)準(zhǔn)差。 系數(shù)絕對值的大小可以表示變量的影響力。2022-2-2430*=/, *z,/iyyxyyys表示 變換或標(biāo)準(zhǔn)化1.6 OLS估計(jì)量的有限樣本特征估計(jì)值和估計(jì)量的區(qū)別估計(jì)量的特征 抽樣分布“有限樣本特征” 是與 “漸進(jìn)”
20、或 “大樣本” 特征對應(yīng)的。有限樣本性質(zhì)是指對于任意給定樣本容量n都成立的估計(jì)量分布特征OLS估計(jì)量的有限樣本特征 (a)無偏性無偏性。E(b|X)=,OLS估計(jì)量是一個線性無偏估計(jì)量 (b)方差的表達(dá)式: (Gauss-Markov定理) OLS估計(jì)量是有效有效的線性無偏估計(jì)量(BLUE),換言之,對于任意的y的線性函數(shù)構(gòu)成的無偏估計(jì)量c,都存在矩陣形式的關(guān)系式:var(c|X) var(b|X)2022-2-243212varb|XX X證明:無偏性*2022-2-2433 =+| -1-1-1-1Xb =X XX yX XXX + X XX Xb | XX XX Xbb | X真 實(shí) 參
21、 數(shù)抽 樣 誤 差以為 條 件 取 條 件 期 望 :根 據(jù) 期 望 迭 代 定 律 可 以 得 到 無 條 件 期 望 :EEEEE對這個結(jié)論的解釋是,對任意觀測集X,最小二乘估計(jì)量的期望值都是 ,因此當(dāng)我們將其在X的所有可能值上進(jìn)行平均時,它的無條件均值仍是 。最小二乘估計(jì)的抽樣分布:OLS估計(jì)量的無偏性2022-2-2434N=100,b=0.5我們從一個標(biāo)準(zhǔn)正態(tài)分布抽取兩個樣本,分別包含了對wi 和xi 的10000個隨機(jī)抽樣。然后生成一組i =0.5 wi , 和yi =0.5+0.5xi + i ,并把它作為總體。我們從這個總體中抽取500個各包含100個觀測值的隨機(jī)樣本,并對每個
22、樣本計(jì)算最小二乘斜率系數(shù)。0204060Frequency.3.4.5.6.7bRep #5001.6.1 遺漏變量問題模型誤設(shè)主要包括遺漏變量或冗余變量。假設(shè)一個正確的模型為: y = X1 1 + X2 2 + 如果我們錯誤的只是 y 對 X1 進(jìn)行了回歸 b1 = (X1 X1)-1X1 y = (X1 X1)-1X1 (X1 1 + X2 2 + ) = 1 + (X1 X1)-1X1 X2 2 + (X1 X1)-1X1 Eb1 = 1 + (X1 X1)-1X1 X2 2除非除非X1 X2=0或或 2=0,否則b1就有偏誤。 正交回歸:如果多遠(yuǎn)回歸中的變量不相關(guān)(即正交),那么多元
23、回歸系數(shù)與正交回歸:如果多遠(yuǎn)回歸中的變量不相關(guān)(即正交),那么多元回歸系數(shù)與逐個進(jìn)行簡單回歸的系數(shù)相同。逐個進(jìn)行簡單回歸的系數(shù)相同。2022-2-2435注意:偏誤的方向,取決于 2和X2的每一列對X1回歸所得系數(shù).這個偏誤不會隨著抽樣增加或樣本容量變大而消失。應(yīng)用:遺漏變量問題2022-2-2436根據(jù)微觀經(jīng)濟(jì)知識,需求函數(shù)可以表示為: log(Quantity) = 0+1log(Price) + 2Iog(Income) + 如果 Quantity 只對 Price 回歸,忘記了Income 變量. 結(jié)果會怎樣?The U.S. Gasoline Market, 52 Yearly Ob
24、servations, 1953-2004-12.8-12.6-12.4-12.2-12Log Gasoline Consumption33.544.55lnPGlnG=-13.36+0.299lnPGSimple Regression of lnG on a Constant and lnPG遺漏變量 在時間序列里, 1 0 CovPrice,Income 0 in time series data.因此,短回歸會高估價格系數(shù),甚至超過了0改變了符號。112CovPrice,IncomeEb = +VarPrice1.6.2 冗余變量正確的模型是y = X1 1 + 而錯誤的估計(jì)了 y =
25、X1 1 + X2 2 + 首先,包含冗余變量不會引起偏差。因?yàn)槿绻?2 = 0, 那么 Eb1.2 = 1. 其次,可以證明,包含冗余變量將提高提高估計(jì)的方差,也就是說估計(jì)將更加不準(zhǔn)確,尤其是冗余變量與解釋變量相關(guān)性較強(qiáng)時。2022-2-2438OLS估計(jì)量的方差*2022-2-2439 擾動項(xiàng)的假設(shè): i 零均值并且與其他任何 j 都不相關(guān); Vari|X = 2. i 的方差不依賴于樣本中的任何數(shù)據(jù). 22varvar| =|=|=EEE -1-1-1-1-1-1-1b|Xb |Xb- b-XXXXX XXXXXX X X XXXXXI X XXXX212222n0.00.0Var|.0
26、0000. XI221varniibxx|X當(dāng)只有常數(shù)和一個解釋變量時 注意:x的變異越大方差越小。高斯高斯-馬爾可夫馬爾可夫定理定理*2022-2-2440高斯高斯-馬爾可夫定理:在回歸元矩陣為馬爾可夫定理:在回歸元矩陣為X的經(jīng)典線性回歸中,的經(jīng)典線性回歸中,OLS估計(jì)量估計(jì)量b是是的最小方差線性無偏估計(jì)量。對任意一個的最小方差線性無偏估計(jì)量。對任意一個常數(shù)向量常數(shù)向量w,經(jīng)典回歸模型中,經(jīng)典回歸模型中w 的最小方差線性無偏估的最小方差線性無偏估計(jì)也都是計(jì)也都是wb.方差最小,我們稱方差最小,我們稱b是是有效估計(jì)。有效估計(jì)。1.6.3 最小二乘估計(jì)方差2022-2-244122,Root M
27、SEsnKsse e均方誤差就是 的平方根121/212 . b|XX XX X估計(jì)量 的標(biāo)準(zhǔn)誤,就是這個矩陣的第k個主對角元素的平方根kkkkEstVarsbse bs附:s2 無偏性的證明* Hayashi(2000),P.21 Greene,ed6,PP51,4.62022-2-2442例: Mroz 已婚婦女工資方程2022-2-2443協(xié)方差矩陣201234lwageageageeducationkids2ss*方差估計(jì):bootstrap法方法:1. 使用整個樣本估計(jì): - b2. 重復(fù) R 次:從樣本容量為n的樣本中有放回抽取n次,得到一個新樣本,估計(jì) 得到 b(r). 3. 估
28、計(jì)系數(shù)方差 V = (1/R)r b(r) - bb(r) - b2022-2-2444應(yīng)用:工資方程2022-2-24451.7 OLS估計(jì)量的大樣本特征* 1. 一致性。b是經(jīng)典回歸模型中 的一致估計(jì)量(consistent estimator)。 證明見Greene,P65-66. 2.漸進(jìn)正態(tài)分布2022-2-2446plimb 2211120plim,1/,/.nidQnNnnnK X XbQX XQe e如果服從均值為 ,方差為的獨(dú)立分布,假設(shè)存在則實(shí)踐中,用估計(jì)用估計(jì)1.8 區(qū)間估計(jì)2022-2-244712222222221/21/2CLMOLS,/Pr1kkkkkkkkkkk
29、kkkkknKkkkbkkbNbkbNSzSsbSbts SnKsnKbtsbtsb | XX X從前面的內(nèi)容知道,在條件下估計(jì)量服從:對于第 個系數(shù),有:,對其標(biāo)準(zhǔn)化有:在未知的情況下,用估計(jì)的替換,得到:因此,置信區(qū)間構(gòu)造為:1.9 多重共線性問題 高斯馬爾科夫定理指出,在所有線性無偏估計(jì)量中,最小二乘估計(jì)量具有最小的方差。但并不保證其在任何絕對意義上都有較小方差。 系數(shù)bk的方差可以表示為(Greene,P59): 其他條件不變,xk與其他變量相關(guān)程度越高(R2 ),其系數(shù)方差越大; 其他條件不變,xk的變動程度越大,方差越小; 其他條件不變,總體回歸擬合的越好(2越?。?,估計(jì)方差越小。
30、2022-2-24482kn22kikki 122kkVarb | = 1 R(xx )RxRX表示對所有其他變量回歸所得。如果有一個自變量可以表示為其他自變量的線性組合,則存在完全如果有一個自變量可以表示為其他自變量的線性組合,則存在完全共線共線性性.Stata可以自動識別完全共線性,主要問題來自近似共線性??梢宰詣幼R別完全共線性,主要問題來自近似共線性。高度相關(guān)產(chǎn)生的問題 數(shù)據(jù)的微小變化導(dǎo)致參數(shù)估計(jì)值的大幅波動 盡管系數(shù)具有聯(lián)合顯著性且回歸的R2 值較高,但系數(shù)標(biāo)準(zhǔn)差較大,顯著性水平較低 系數(shù)可能具有“錯誤的”符號或不合理的大小。2022-2-2449多重共線性的判斷 1. 簡單相關(guān)系數(shù):
31、0.8以上就有一些問題了; 2.回歸的F值大但系數(shù)t值都不顯著。 3.方差膨脹因子: 一般認(rèn)為超過5就存在一定問題。 4.XX的條件數(shù):矩陣最大特征根和最小特征根之比的平方根。大大條件數(shù)意味著小的X的變化能引起估計(jì)系數(shù)大大變動。超過20一般就有問題了。2022-2-24502.1/ 1kVIFR例(E.4.6):朗利數(shù)據(jù)2022-2-2451例:朗利數(shù)據(jù)2022-2-2452僅僅是否包含最后一個年度觀測值,估計(jì)結(jié)果差異巨大!方差膨脹因子01234+EmployYearPriceGNPArmed對多重共線性的處理 1.增加樣本信息;2.刪除變量(潛在遺漏偏物); 3.包含所有變量回歸,疑問變量是
32、否顯著,如顯著保留,如不顯著,丟棄; 4.主成分,對系數(shù)經(jīng)濟(jì)含義2022-2-2453應(yīng)用:電影票房2022-2-24542022-2-24551.10 異常值* 在樣本較小的情況下,異常值會對估計(jì)系數(shù)產(chǎn)生較大影響。 異常值的識別:標(biāo)準(zhǔn)化殘差和學(xué)生化殘差2022-2-2456 2/ 1Studentized112iiiiiiiiiiiiiiiesVar eehee ihnKh e exX Xx標(biāo)準(zhǔn)化殘差 standized residual :學(xué)生化殘差 residual :其中,如果學(xué)生化殘差或標(biāo)準(zhǔn)化殘差超過 ,認(rèn)為是可能的異常值。應(yīng)用:莫奈名畫的拍賣價格-4-2024246810Log A
33、reaLog PriceFitted valuesFIGURE 4.9 Log Price vs. Log Area for Monet Paintings.2022-2-2457估計(jì)命令返回的數(shù)值2022-2-2458use wage1.dta,clearregress lwage educ exper tenureereturn list*注意e(sample),當(dāng)觀測值包含在估計(jì)樣本中時,e(sample)函數(shù)為1,否則為0.如果有缺省值,樣本統(tǒng)計(jì)(如均值)可能與估計(jì)樣本不同。Summarize x if e(sample)1.11 報(bào)告回歸結(jié)果 學(xué)術(shù)論文有一定的規(guī)范,尤其是多個回歸結(jié)果
34、,表格的安排。 estimates table estout命令2022-2-2459例子:波士頓房價模型2022-2-2460VariableModel1Model2Model3Model4rooms0.369-0.8210.2550.02010.1830.0185rooms20.08890.014ldist0.237-0.157-0.1340.02550.05050.0431stratio-0.0775-0.05250.00660.0059lnox-1.22-0.9540.1350.117_cons7.6211.313.611.10.1270.5840.3040.318r2_a0.3990
35、.50.4240.581rmse0.3170.2890.3110.265N506506506506* p0.05, * p0.01, * p legend label collabels(none) varlabels(_cons Constant). estout *, cells(b(star fmt(%7.3f) se(par) stats(r2_a N, fmt(%7.3f %5.0g) labels(R-squared) /2022-2-2461* p0.05, * p0.01, * p legend label collabels(none) varlabels(_cons Con
36、stant). estout *, cells(b(star fmt(%7.3f) se(par) stats(r2_a N, fmt(%7.3f %5.0g) labels(R-squared) /附錄:OLS推導(dǎo)2022-2-2462 00000000000-12min/220=/=2SSSS bbe e = (y -Xb )(y -Xb )by y2y Xbb X XbbbX yX XbbX Xb X ybX XX ybb bX X展開得:滿足最小二乘正規(guī)方程組:二階條件:可以證明其為正定矩陣。附錄:高斯-馬爾可夫定理的證明2022-2-2463附錄:LS的方差(1.7 多重共線性)12
37、22122n2ii 12i: = + + Variance of c c .Varc = * * * = .* * R R = 1 - , (zz)* * 1R(zz Xz|XyXzbX XX zzXzzzM zzzzzX zzzz模型的方差是逆矩陣右下角的元素其中對回歸的殘差向量此回歸的為于是 z|Xz|Xn2i 1221n22ii 1) . ,Varc = 1R(zz)Xz|XzM z因此文獻(xiàn)選讀 N. Gregory Mankiw; David Romer; David N. Weil, 1992,A Contribution to the Empirics of Economic Gr
38、owth, The Quarterly Journal of Economics, Vol. 107, No. 2. (May, 1992), pp. 407-437.2022-2-2465附錄:不同數(shù)據(jù)類型的Stata估計(jì)命令數(shù)據(jù)類型數(shù)據(jù)類型估計(jì)命令估計(jì)命令Linearregress,cnreg,areg,treatreg,ivregress,qreg,boxcox,frontier,mvreg,sureg,reg3,xtreg,xtgls,xtrc,xtpcse,xtregar,xtmixed,xtivreg,xthtaylor,xtabond,xtfrontierNonlinear LSnlBinarylogit,logistic,probit,cloglog,glogit,slogit,hetprob,scobit,ivprobit,heckprob,xtlogit,xtprobit,xtcloglogMultinomialmlogit,clogit,asclogit,nlogit,ologit,rol
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 東莞日產(chǎn)購車合同范例
- 業(yè)務(wù)提成居間合同范例
- 麗水預(yù)售合同范例公示
- 體系合同范例
- 中介工程協(xié)議合同范例
- 代理售卡合同范例
- 買賣土地流轉(zhuǎn)合同范例
- 上海租房合同范本里
- 公會線下合同范例
- 買方采購材料合同范例
- 林木林地權(quán)屬爭議處理申請書
- 阿里云+跨國企業(yè)上云登陸區(qū)(Landing+Zone)白皮書
- 家鄉(xiāng)鹽城城市介紹江蘇鹽城介紹課件
- 市政工程施工安全檢查標(biāo)準(zhǔn)
- 銀行整村授信工作經(jīng)驗(yàn)材料工作總結(jié)匯報(bào)報(bào)告2篇
- 四川事業(yè)單位工作人員收入分配制度改革實(shí)施意見
- 陜西省2023第二屆長安杯大中小學(xué)國家安全知識競賽題庫及答案
- 基建礦井應(yīng)急救援預(yù)案之綜合應(yīng)急預(yù)案匯編(完整版)資料
- GA/T 830-2021尸體解剖檢驗(yàn)室建設(shè)規(guī)范
- 《PEP英語六年級下冊Unit3Readandwrite》東城虎英小學(xué)王曉惠
- GB/T 3778-2021橡膠用炭黑
評論
0/150
提交評論