計(jì)量經(jīng)濟(jì)學(xué)5教材講義_第1頁
計(jì)量經(jīng)濟(jì)學(xué)5教材講義_第2頁
計(jì)量經(jīng)濟(jì)學(xué)5教材講義_第3頁
計(jì)量經(jīng)濟(jì)學(xué)5教材講義_第4頁
計(jì)量經(jīng)濟(jì)學(xué)5教材講義_第5頁
已閱讀5頁,還剩121頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2023/3/25廈門大學(xué)管理學(xué)院

易英1第5章單方程回歸模型的幾個(gè)專題5.1虛擬變量5.2模型設(shè)定5.3模型變量的觀測(cè)誤差5.4隨機(jī)解釋變量5.1虛擬變量

2023/3/25廈門大學(xué)管理學(xué)院易英2虛擬變量(Dummyvariables)在回歸分析中,常常碰到這樣一種情況,即因變量的波動(dòng)不僅依賴于那種能夠很容易按某種尺度定量化的變量(如收入、產(chǎn)出、價(jià)格、身高、體重等),而且依賴于某些定性的變量(如性別、地區(qū)、季節(jié))。這些變量只表示某種特征的存在與不存在,所以稱為定性變量。把定性變量包括在模型中的方法是將它們量化。由于定性變量通常是表明某種特征或?qū)傩允欠翊嬖?,所以量化的方法是取?或1,用1表示具有某一“品質(zhì)”或?qū)傩?,?表示不具有該“品質(zhì)”或?qū)傩?。這種變量在計(jì)量經(jīng)濟(jì)學(xué)中稱為“虛擬變量(dummyvariable)”。虛擬變量例如:你在研究學(xué)歷和收入之間的關(guān)系,在你的樣本中,有各種學(xué)歷的職員,你打算研究在此關(guān)系中,學(xué)歷是否會(huì)導(dǎo)致差別??梢詫⒍ㄐ砸蛩氐挠绊懹锰摂M變量引入模型。本科以上學(xué)歷本科以下學(xué)歷虛擬變量關(guān)于定性變量中的哪個(gè)類別取0,哪個(gè)類別取1,是任意的,不影響檢驗(yàn)結(jié)果。定性變量中取值為0所對(duì)應(yīng)的類別稱作基礎(chǔ)類別(basecategory)。虛擬變量當(dāng)一個(gè)定性變量含有m個(gè)類別或?qū)傩詴r(shí),不能把虛擬變量的值設(shè)成如下形式當(dāng)一個(gè)定性變量含有m個(gè)類別或?qū)傩詴r(shí),也不能設(shè)m個(gè)虛擬變量,這會(huì)導(dǎo)致多重共線性。錯(cuò)誤!虛擬變量若定性變量含有m個(gè)類別或?qū)傩裕瑧?yīng)引入m-1個(gè)虛擬變量,否則會(huì)導(dǎo)致多重共線性,稱作虛擬變量陷阱(dummyvariabletrap)。回歸模型可以只用虛擬變量作解釋變量,也可以用定量變量和虛擬變量一起作解釋變量。例如:設(shè)公司職員的年薪(Y)與工齡(X)和學(xué)歷(D)有關(guān)。學(xué)歷分為大專以下、本科和研究生。應(yīng)設(shè)兩個(gè)虛擬變量:可以將年薪函數(shù)模型寫為:2023/3/25廈門大學(xué)管理學(xué)院易英8虛擬變量若有m個(gè)定性變量,每個(gè)定性變量含有mi個(gè)類別或?qū)傩?,則引入個(gè)虛擬變量。例如:研究居民住房消費(fèi),考慮到城鄉(xiāng)差異和不同收入層次的影響,模型設(shè)定為:2023/3/25廈門大學(xué)管理學(xué)院

易英9虛擬變量的引入方式加法類型:虛擬變量與其它解釋變量在模型中是相加關(guān)系,其作用是改變了設(shè)定模型的截距水平。乘法類型:將虛擬變量與其他解釋變量相乘作為新的變量出現(xiàn)在模型中。一般根據(jù)分析先判斷定性因素的影響類型,再選擇用加法或乘法方式設(shè)定虛擬變量。實(shí)際應(yīng)用中,一般直接用加法和乘法方式引入虛擬變量,用t檢驗(yàn)判斷是否顯著從而確定虛擬變量的引入。2023/3/25廈門大學(xué)管理學(xué)院易英10用虛擬變量測(cè)量截距的變動(dòng)用虛擬變量測(cè)量截距的變動(dòng)例5.1例5.1例5.1用虛擬變量測(cè)量截距的變動(dòng)2023/3/25廈門大學(xué)管理學(xué)院易英16yctd1yct用虛擬變量測(cè)量斜率的變動(dòng)例5.2

例5.22023/3/25廈門大學(xué)管理學(xué)院易英21例5.2例5.2用虛擬變量測(cè)量斜率的變動(dòng)2023/3/25廈門大學(xué)管理學(xué)院易英24例5.2用虛擬變量測(cè)量斜率的變動(dòng)Chow檢驗(yàn)結(jié)果顯著,說明發(fā)生了結(jié)構(gòu)性變化,參數(shù)是不穩(wěn)定的。虛擬變量進(jìn)行結(jié)構(gòu)變動(dòng)檢驗(yàn)與傳統(tǒng)的鄒檢驗(yàn)相比,虛擬變量的有點(diǎn):鄒檢驗(yàn)是在“擾動(dòng)項(xiàng)同方差”的假設(shè)下得到的,不適用于異方差的情形。在異方差情形下,仍可使用虛擬變量法,只需估計(jì)時(shí)使用異方差穩(wěn)健的標(biāo)準(zhǔn)誤即可。鄒檢驗(yàn)并不提供究竟是截距項(xiàng)還是斜率變動(dòng)的信息,而虛擬變量法則可以則可以同時(shí)提供這些信息。2023/3/25廈門大學(xué)管理學(xué)院易英27虛擬變量在異常值問題中的應(yīng)用現(xiàn)實(shí)中一些突發(fā)事件或情況對(duì)經(jīng)濟(jì)活動(dòng)和經(jīng)濟(jì)關(guān)系造成短暫但卻是很顯著的影響。這些影響既不能看作微小的隨機(jī)擾動(dòng),又不會(huì)決定或改變長(zhǎng)期的經(jīng)濟(jì)關(guān)系或規(guī)律。這在數(shù)據(jù)上表現(xiàn)為一個(gè)脫離基本趨勢(shì)的異常值。如果存在這種情況,而建立模型時(shí)又沒有預(yù)先處理或剔出這種影響,就會(huì)表現(xiàn)為誤差項(xiàng)在相應(yīng)點(diǎn)上存在均值非零的問題。即誤差項(xiàng)ut的均值為:因?yàn)樽钚《朔▽?duì)偏差較大的異常值敏感,異常值會(huì)使回歸分析結(jié)果出現(xiàn)較大偏差。2023/3/25廈門大學(xué)管理學(xué)院易英28異常值的發(fā)現(xiàn)與判斷殘差序列分析是從技術(shù)角度發(fā)現(xiàn)和判斷異常值問題的基本方法。方法:在模型假設(shè)成立的前提下,回歸殘差是服從正態(tài)分布的隨機(jī)變量,故根據(jù)正態(tài)分布的性質(zhì),其取值95%左右的概率應(yīng)分布在均值加減2倍標(biāo)準(zhǔn)差的范圍內(nèi)。如果有個(gè)別殘差落在2倍標(biāo)準(zhǔn)差范圍外,則可能存在異常值。但是如果有多個(gè)殘差落在2倍標(biāo)準(zhǔn)差范圍外,也可能是存在系統(tǒng)性偏差。即2023/3/25廈門大學(xué)管理學(xué)院易英29Stata對(duì)極端值的判斷Stata可以計(jì)算觀測(cè)數(shù)據(jù)的影響力regyx1x2x3predictlev,leverage(得到所有解釋變量的lev)gsort-lev(將所有觀測(cè)數(shù)據(jù)按lev的降序排列)sumlev(查看lev的最大值與平均值)listlevin1/3(列出從第1到第3個(gè)數(shù)據(jù)的lev值)2023/3/25廈門大學(xué)管理學(xué)院易英30如何處理極端觀測(cè)值檢查是否因數(shù)據(jù)輸入有誤對(duì)極端觀測(cè)值的個(gè)體背景進(jìn)行調(diào)查,如果是由于研究問題無關(guān)的特殊現(xiàn)象所致,必要時(shí)可以刪除極端數(shù)據(jù)。也可以同時(shí)做全樣本和刪除極端觀測(cè)值的樣本的回歸,讓讀者自行判斷。2023/3/25廈門大學(xué)管理學(xué)院易英31異常值問題的處理以雙變量模型為例2023/3/25廈門大學(xué)管理學(xué)院易英32例5.3已知上海市1981-2002年城市居民人均可支配收入(X)和人均消費(fèi)支出(Y),建立如下消費(fèi)函數(shù)模型:是否有異常值問題,如何處理?2023/3/25廈門大學(xué)管理學(xué)院易英332023/3/25廈門大學(xué)管理學(xué)院易英34例5.32023/3/25廈門大學(xué)管理學(xué)院易英352023/3/25廈門大學(xué)管理學(xué)院易英36例5.32023/3/25廈門大學(xué)管理學(xué)院易英37例5.32023/3/25廈門大學(xué)管理學(xué)院易英38例5.32023/3/25廈門大學(xué)管理學(xué)院易英39例5.32023/3/25廈門大學(xué)管理學(xué)院易英40例5.32023/3/25廈門大學(xué)管理學(xué)院易英415.2模型設(shè)定2023/3/25廈門大學(xué)管理學(xué)院易英42模型的選擇在實(shí)踐中,尋找一個(gè)真正正確的模型非常不容易,或許我們永遠(yuǎn)無法得知真實(shí)的模型是什么,但我們希望能夠找到一個(gè)相對(duì)精確反映現(xiàn)實(shí)的模型。2023/3/25簡(jiǎn)約性(parsimony):模型是無法完全把握現(xiàn)實(shí)的,在建模過程中一定程度的抽象或簡(jiǎn)化是不可避免的,簡(jiǎn)約原則表明模型應(yīng)盡可能簡(jiǎn)單??勺R(shí)別性(identifiability):對(duì)于給定的數(shù)據(jù),估計(jì)的參數(shù)值必須是唯一的。擬合優(yōu)度(goodnessoffit):回歸分析的基本思想是用模型中所包含的解釋變量來盡可能地解釋應(yīng)變量的變化。理論一致性(theoretical):在構(gòu)建模型時(shí)必須有一些理論基礎(chǔ)。無論擬合優(yōu)度多好,一旦模型中系數(shù)符號(hào)有誤,就不是好的模型。預(yù)測(cè)能力(predictivepower):對(duì)模型有效性的唯一檢驗(yàn)就是將預(yù)測(cè)值與經(jīng)驗(yàn)值相比較廈門大學(xué)管理學(xué)院易英43判斷模型的標(biāo)準(zhǔn)2023/3/25遺漏相關(guān)變量(omittingrelevantvariables

)包括不必要的變量(includingirrevelantvariables

)采用了錯(cuò)誤的函數(shù)形式(wrongfunctionalform

)廈門大學(xué)管理學(xué)院易英44導(dǎo)致模型失效的設(shè)定偏誤2023/3/25廈門大學(xué)管理學(xué)院易英45模型設(shè)定偏誤的后果當(dāng)模型設(shè)定出現(xiàn)偏誤時(shí),模型估計(jì)結(jié)果也會(huì)與“實(shí)際”有偏差。這種偏差的性質(zhì)與程度與模型設(shè)定偏誤的類型密切相關(guān)。2023/3/25廈門大學(xué)管理學(xué)院易英46例如,如果“正確”的模型為而我們將模型設(shè)定為

即設(shè)定模型時(shí)漏掉了一個(gè)相關(guān)的解釋變量X2。這類錯(cuò)誤稱為遺漏相關(guān)變量。

遺漏相關(guān)變量

遺漏相關(guān)變量產(chǎn)生的后果稱為遺漏變量偏差(omittedvariablebias)。2023/3/25廈門大學(xué)管理學(xué)院易英47例如,設(shè)正確的模型為

Y=0+1X1+2X2+卻對(duì)

Y=0+1X1+v進(jìn)行回歸,那么將造成:遺漏相關(guān)變量偏誤2023/3/25廈門大學(xué)管理學(xué)院易英48(1)如果漏掉的X2與X1相關(guān),則OLS估計(jì)量在小樣本下有偏,在大樣本下非一致。(2)如果X2與X1不相關(guān),則1的估計(jì)滿足無偏性與一致性;但這時(shí)0的估計(jì)卻是有偏的。遺漏相關(guān)變量偏誤(5)通常的置信區(qū)間和假設(shè)檢驗(yàn)過程不再可靠。2023/3/25廈門大學(xué)管理學(xué)院易英49無關(guān)變量的誤選例如,如果正確的模型為

Y=0+1X1+2X2+但我們將模型設(shè)定為

Y=0+1X1+2X2+3X3+即設(shè)定模型時(shí),多選了一個(gè)無關(guān)解釋變量。采用包含無關(guān)解釋變量的模型進(jìn)行估計(jì)帶來的偏誤,稱為包含無關(guān)變量偏誤(includingirrelevantvariablebias)。2023/3/25廈門大學(xué)管理學(xué)院易英50例如,Y=0+1X1+v(*)為正確模型,但卻估計(jì)了

Y=0+1X1+2X2+(**)那么將造成的后果是:包含無關(guān)變量的偏誤2023/3/25廈門大學(xué)管理學(xué)院易英51(1)對(duì)(**)式進(jìn)行OLS估計(jì),可得到無偏且一致的估計(jì)量。(2)誤差項(xiàng)方差的估計(jì)量也是正確的。(3)建立在t檢驗(yàn)和F檢驗(yàn)基礎(chǔ)上的置信區(qū)間和建設(shè)檢驗(yàn)仍然是有效的。(4)但是,OLS估計(jì)量卻不具有最小方差性。即包括多余變量的主要問題是估計(jì)系數(shù)的方差會(huì)變大,置信區(qū)間變寬,就更容易接受零假設(shè):真實(shí)的系數(shù)值為0。造成對(duì)真實(shí)參數(shù)的概率推斷精確性降低。(5)另外,增加不必要的變量會(huì)消耗自由度,并可能導(dǎo)致多重共線性。2023/3/25廈門大學(xué)管理學(xué)院易英52當(dāng)選取了錯(cuò)誤函數(shù)形式并對(duì)其進(jìn)行估計(jì)時(shí),帶來的偏誤稱錯(cuò)誤函數(shù)形式偏誤(wrongfunctionalformbias)。容易判斷,這種偏誤是全方位的。

例如,如果“真實(shí)”的回歸函數(shù)為卻估計(jì)線性式

顯然,兩者的參數(shù)具有完全不同的經(jīng)濟(jì)含義,且估計(jì)結(jié)果一般也是不相同的。

錯(cuò)誤函數(shù)形式的偏誤2023/3/25檢驗(yàn)的基本思想:如果模型中誤選了無關(guān)變量,則其系數(shù)的真值應(yīng)為零。因此,只須對(duì)無關(guān)變量系數(shù)的顯著性進(jìn)行檢驗(yàn)??捎胻檢驗(yàn)與F檢驗(yàn)完成。t檢驗(yàn):檢驗(yàn)?zāi)?個(gè)變量是否應(yīng)包括在模型中;F檢驗(yàn):檢驗(yàn)若干個(gè)變量是否應(yīng)同時(shí)包括在模型中

廈門大學(xué)管理學(xué)院易英53檢驗(yàn)是否含有無關(guān)變量解釋變量個(gè)數(shù)的選擇選擇解釋變量的個(gè)數(shù)K以最大化調(diào)整決定系數(shù)選擇解釋變量的個(gè)數(shù)K使赤池信息準(zhǔn)則指標(biāo)(AIC)最小化選擇解釋變量的個(gè)數(shù)K使施瓦茨信息準(zhǔn)則指標(biāo)(SIC)最小化大樣本中SIC是一致估計(jì),而AIC不是一致估計(jì)。但現(xiàn)實(shí)樣本通常有限,而SIC準(zhǔn)則對(duì)解釋變量過多的懲罰太嚴(yán)厲可能導(dǎo)致模型過小,故AIC準(zhǔn)則仍然很常用。Stata命令.regyx1x2x3.testx1檢驗(yàn)x1的系數(shù)是否為0.estatic計(jì)算信息準(zhǔn)則2023/3/25廈門大學(xué)管理學(xué)院易英56Eviews提供的多余變量檢驗(yàn)選擇Equation工具欄中的View/CoefficientTests/RedundantVariables-LikelihoodRatio,然后在對(duì)話框中輸入需要檢驗(yàn)的變量,相互間至少用一空格隔開。輸出結(jié)果給出F統(tǒng)計(jì)量和似然比統(tǒng)計(jì)量及其概率(原假設(shè):被檢驗(yàn)變量系數(shù)為0

)。LR統(tǒng)計(jì)量服從漸近2分布,自由度等于約束條件數(shù),即刪去變量數(shù)??梢杂糜跈z驗(yàn)LS(只能是線性)、TSLS、ARCH、LOGIT和PROBIT估計(jì)的方程。2023/3/25廈門大學(xué)管理學(xué)院易英57Eviews提供的遺漏變量檢驗(yàn)選擇View/CoefficientTests/OmittedVariables—LikelihoodRation,在打開的對(duì)話框中輸入需要檢驗(yàn)的變量,用至少一個(gè)空格相互隔開。該檢驗(yàn)?zāi)芙o現(xiàn)有方程添加變量,考察添加的變量是否對(duì)應(yīng)變量的解釋有顯著作用。原假設(shè)H0是添加變量不顯著。檢驗(yàn)的輸出是F統(tǒng)計(jì)量和似然比(LR)統(tǒng)計(jì)量及各自P值,以及在備選假設(shè)下無約束模型估計(jì)結(jié)果。F統(tǒng)計(jì)量基于約束和無約束回歸殘差平方和之差。LR統(tǒng)計(jì)量服從漸近2分布,自由度等于約束條件數(shù),即加入變量數(shù)??梢杂糜跈z驗(yàn)LS(只能是線性)、TSLS、ARCH、LOGIT和PROBIT估計(jì)的方程。問題1一個(gè)估計(jì)某行業(yè)CEO薪水的回歸模型為問:此模型中是否有函數(shù)設(shè)定的偏誤?試以10%和5%的顯著性水平進(jìn)行檢驗(yàn)。2023/3/25廈門大學(xué)管理學(xué)院易英58答案所以:在10%顯著性水平下拒絕H0假設(shè),模型有設(shè)定偏誤;在5%顯著性水平下不拒絕H0假設(shè),模型沒有設(shè)定偏誤。2023/3/25廈門大學(xué)管理學(xué)院易英592023/3/25廈門大學(xué)管理學(xué)院易英60問題22023/3/25廈門大學(xué)管理學(xué)院易英61答案2023/3/25廈門大學(xué)管理學(xué)院易英62問題32023/3/25廈門大學(xué)管理學(xué)院易英63答案2023/3/25廈門大學(xué)管理學(xué)院易英64例5.485個(gè)國(guó)家的生命預(yù)期為了評(píng)估收入和獲得保健對(duì)生命預(yù)期的影響,我們收集了85個(gè)國(guó)家的數(shù)據(jù)。應(yīng)變量是生命預(yù)期(life),解釋變量收入(income)與醫(yī)療(medical)。2023/3/25廈門大學(xué)管理學(xué)院易英65例5.485個(gè)國(guó)家的生命預(yù)期模型1DependentVariable:LIFE Method:LeastSquares Date:10/27/08Time:14:06 Sample:185 Includedobservations:85

Variable Coefficient Std.Error t-Statistic Prob.

C 39.43802 1.948595 20.23921 0.0000 INCOME0.000542 0.000122 4.441731 0.0000 MEDICAL0.283303 0.028444 9.959961 0.0000

R-squared 0.774146

Meandependentvar 63.1341 AdjustedR-squared0.768637

S.D.dependentvar 10.54996S.E.ofregression 5.074547

Akaikeinfocriterion 6.121008Sumsquaredresid2111.584

Schwarzcriterion 6.207219Loglikelihood -257.1428

F-statistic 140.5332Durbin-Watsonstat1.983983

Prob(F-statistic) 0.0000002023/3/25廈門大學(xué)管理學(xué)院易英66例5.485個(gè)國(guó)家的生命預(yù)期模型2DependentVariable:LIFE Method:LeastSquares Date:10/27/08Time:14:07 Sample:185 Includedobservations:85

Variable Coefficient Std.Error t-Statistic Prob.

C 40.50828 1.945597 20.82049 0.0000 INCOME 0.001632 0.000468 3.484867 0.0008 MEDICAL 0.249936 0.030931 8.080385 0.0000 INCOME*INCOME-6.28E-08 2.61E-08 -2.406097 0.0184

R-squared 0.789212

Meandependentvar 63.13412AdjustedR-squared0.781405

S.D.dependentvar 10.54996S.E.ofregression4.932545

Akaikeinfocriterion 6.075503Sumsquaredresid1970.730

Schwarzcriterion 6.190451Loglikelihood -254.2089

F-statistic 101.0906Durbin-Watsonstat2.050328

Prob(F-statistic) 0.0000002023/3/25廈門大學(xué)管理學(xué)院易英67例5.485個(gè)國(guó)家的生命預(yù)期模型3DependentVariable:LIFE Method:LeastSquares Date:10/27/08Time:14:08 Sample:185 Includedobservations:85 Variable CoefficientStd.Error t-Statistic Prob.

C 43.166254.309185 10.01726 0.0000 INCOME 0.001448 0.000540 2.683621 0.0088 MEDICAL 0.149126 0.148977 1.001003 0.3198 INCOME*INCOME-5.54E-08 2.82E-08 -1.961287 0.0533 MEDICAL*MEDICAL0.000850 0.001229 0.691858 0.4910

R-squared 0.790465

Meandependentvar 63.13412AdjustedR-squared0.779989

S.D.dependentvar 10.54996S.E.ofregression 4.948496

Akaikeinfocriterion 6.093067Sumsquaredresid1959.009

Schwarzcriterion 6.236752Loglikelihood-253.9553

F-statistic 75.44961Durbin-Watsonstat2.050113

Prob(F-statistic) 0.0000002023/3/25廈門大學(xué)管理學(xué)院易英68例5.485個(gè)國(guó)家的生命預(yù)期先驗(yàn)地預(yù)期收入和生命預(yù)期、獲得保健與生命預(yù)期之間正相關(guān)。模型1驗(yàn)證了這一預(yù)期。模型2增加了收入平方變量,目的在于驗(yàn)證生命預(yù)期對(duì)收入是以遞增的速率變化還是以遞減的速率變化。結(jié)果表明是遞減的速率變化。模型3增加了獲得保健平方變量,目的在于驗(yàn)證生命預(yù)期對(duì)獲得保健是以遞增的速率變化還是以遞減的速率變化。結(jié)果表明是遞增速率。但是系數(shù)卻不是統(tǒng)計(jì)顯著的,而且獲得保健系數(shù)也不再是統(tǒng)計(jì)顯著的。(獲得保健平方變量是一個(gè)多余的變量)2023/3/25利用Eviews的多余變量檢驗(yàn)對(duì)模型3的中的獲得保健平方變量(MEDICAL*MEDICAL)檢驗(yàn)輸出如下:從概率值可以看出不顯著,所以不能拒絕原假設(shè)(變量系數(shù)為0),可知模型3的中的獲得保健平方變量(MEDICAL*MEDICAL)是多余的變量可以刪去。廈門大學(xué)管理學(xué)院易英69例5.485個(gè)國(guó)家的生命預(yù)期RedundantVariables:MEDICAL*MEDICAL F-statistic 0.478668

Prob.F(1,80) 0.4910 Loglikelihoodratio 0.507069Prob.Chi-Square(1) 0.4764 2023/3/25利用Eviews的遺漏變量檢驗(yàn)對(duì)模型1的中的收入平方變量(INCOME*INCOME)檢驗(yàn)輸出如下:如果給定5%的顯著性水平,概率值表明是顯著的,所以拒絕原假設(shè)(變量系數(shù)為0),可知模型1遺漏收入平方變量(INCOME*INCOME)。廈門大學(xué)管理學(xué)院易英71例5.485個(gè)國(guó)家的生命預(yù)期OmittedVariables:INCOME*INCOME F-statistic 5.789301

Prob.F(1,81) 0.0184 Loglikelihoodratio 5.867907Prob.Chi-Square(1) 0.0154 2023/3/25廈門大學(xué)管理學(xué)院易英73在任何情況下,對(duì)估計(jì)模型的殘差圖進(jìn)行檢查都是建模過程中不可或缺的重要內(nèi)容。殘差圖示法殘差檢驗(yàn)2023/3/25廈門大學(xué)管理學(xué)院易英74(a)趨勢(shì)變化:模型設(shè)定時(shí)可能遺漏了一隨著時(shí)間的推移而持續(xù)上升的變量

(b)循環(huán)變化:模型設(shè)定時(shí)可能遺漏了一隨著時(shí)間的推移而呈現(xiàn)循環(huán)變化的變量

殘差序列變化圖2023/3/25廈門大學(xué)管理學(xué)院易英75

模型函數(shù)形式設(shè)定偏誤時(shí)殘差序列呈現(xiàn)正負(fù)交替變化

圖示:一元回歸模型中,真實(shí)模型呈冪函數(shù)形式,但卻選取了線性函數(shù)進(jìn)行回歸。

2023/3/25廈門大學(xué)管理學(xué)院易英76Eviews殘差檢驗(yàn)----

Correlogram-Q-statistics:相關(guān)圖和Q統(tǒng)計(jì)量該檢驗(yàn)計(jì)算指定滯后期殘差的自相關(guān)和偏自相關(guān)系數(shù),給出用于檢驗(yàn)序列相關(guān)的的Ljung-BoxQ統(tǒng)計(jì)量(原假設(shè):無序列相關(guān)),可用于LS,TSLS,非線性LS等模型估計(jì)出來的殘差。選擇Equation工具欄中的View/ResidualTests/Correlogram-Q-Statistics2023/3/25對(duì)模型1利用Eviews的殘差檢驗(yàn)的相關(guān)圖和Q統(tǒng)計(jì)量輸出如下:右側(cè)概率值表明不顯著,說明模型1的隨機(jī)誤差項(xiàng)無序列相關(guān)??梢则?yàn)證LM檢驗(yàn)也是無序列相關(guān)。廈門大學(xué)管理學(xué)院易英77例5.485個(gè)國(guó)家的生命預(yù)期2023/3/25廈門大學(xué)管理學(xué)院易英78Eviews殘差檢驗(yàn)----

Histgram-NormalityTest:直方圖和正態(tài)檢驗(yàn)直方圖和正態(tài)檢驗(yàn):顯示殘差直方圖和檢驗(yàn)正態(tài)性的Jarque-Bera統(tǒng)計(jì)量。如果殘差服從正態(tài)分布,直方圖應(yīng)呈鐘型,J-B統(tǒng)計(jì)量應(yīng)不顯著(很?。_m用于LS,TSLS,非線性LS等模型。選擇Equation工具欄中的View/ResidualTests/HistogramNormality顯示直方圖和J-B統(tǒng)計(jì)量。在原假設(shè):誤差正態(tài)分布下,J-B統(tǒng)計(jì)量應(yīng)服從2分布,自由度為2。2023/3/25對(duì)模型1利用Eviews的殘差檢驗(yàn)的直方圖和正態(tài)檢驗(yàn)輸出如下:

JB統(tǒng)計(jì)量的概率值表明不顯著,說明模型1的殘差服從正態(tài)分布。廈門大學(xué)管理學(xué)院易英79例5.485個(gè)國(guó)家的生命預(yù)期2023/3/25是拉姆齊(Ramsey)于1969年提出的RESET檢驗(yàn)(regressionerrorspecificationtest)。RESET檢驗(yàn)可以用于檢驗(yàn)是否遺漏變量,也可用于檢驗(yàn)函數(shù)形式是否設(shè)定偏誤?;舅枷耄喝绻孪戎肋z漏了哪個(gè)變量,只需將此變量引入模型,估計(jì)并檢驗(yàn)其參數(shù)是否顯著不為零即可。通常不知道遺漏了哪個(gè)變量,RESET檢驗(yàn)中采用所設(shè)定模型中被解釋變量Y的估計(jì)值?的若干次冪來充當(dāng)“替代”變量。廈門大學(xué)管理學(xué)院易英80RESET(回歸誤差設(shè)定)檢驗(yàn)2023/3/25廈門大學(xué)管理學(xué)院易英81(1)根據(jù)模型估計(jì)出Y值,(2)(3)把替代變量納入模型進(jìn)行估計(jì)(4)根據(jù)R2old和R2new進(jìn)行F檢驗(yàn),如果在所選顯著性水平下F值是統(tǒng)計(jì)顯著的,則原始模型是錯(cuò)誤設(shè)定的。(新增變量個(gè)數(shù)---q,新模型中參數(shù)個(gè)數(shù)---k+1)

用RESET檢驗(yàn)(步驟)2023/3/25廈門大學(xué)管理學(xué)院易英82例如,在一元回歸中,假設(shè)真實(shí)的函數(shù)形式是非線性的,用泰勒定理將其近似地表示為多項(xiàng)式:因此,如果設(shè)定了線性模型,就意味著遺漏了相關(guān)變量X12、X13

,等等。因此,在一元回歸中,可通過檢驗(yàn)(*)式中的各高次冪參數(shù)的顯著性來判斷是否將非線性模型誤設(shè)成了線性模型。(*)用RESET檢驗(yàn)函數(shù)形式是否設(shè)定偏誤2023/3/25廈門大學(xué)管理學(xué)院易英83對(duì)多元回歸,非線性函數(shù)可能是關(guān)于若干個(gè)或全部解釋變量的非線性。

例如,估計(jì)Y=0+1X1+2X2+,但卻懷疑真實(shí)的函數(shù)形式是非線性的。這時(shí),只需以估計(jì)出的?的若干次冪為“替代”變量,進(jìn)行類似于如下模型的估計(jì)再判斷各“替代”變量的參數(shù)是否顯著地不為零即可。

用RESET檢驗(yàn)函數(shù)形式是否設(shè)定偏誤2023/3/25廈門大學(xué)管理學(xué)院易英84例5.5美國(guó)進(jìn)口貨物的支出

給出的數(shù)據(jù)包括1968~1987年美國(guó)進(jìn)口貨物的支出(Y),個(gè)人可支配收入(X)數(shù)據(jù)(億元)。2023/3/25廈門大學(xué)管理學(xué)院易英85首先僅做進(jìn)口支出(Y)對(duì)個(gè)人可支配收入(X)的回歸,得:例5.5美國(guó)進(jìn)口貨物的支出DependentVariable:Y Method:LeastSquares Date:10/27/08Time:11:17 Sample:19681987 Includedobservations:20 Variable Coefficient Std.Error t-Statistic Prob.

C -261.1565 31.32764 -8.336297 0.0000 X 0.245250 0.014760 16.61635 0.0000

R-squared0.938797

Meandependentvar 253.0500AdjustedR-squared0.935397

S.D.dependentvar 85.79656S.E.ofregression 21.80705Akaikeinfocriterion 9.096983Sumsquaredresid8559.854

Schwarzcriterion 9.196556Loglikelihood -88.96983

F-statistic 276.103 Durbin-Watsonstat0.593949

Prob(F-statistic) 0.000000 2023/3/25廈門大學(xué)管理學(xué)院易英86例5.5美國(guó)進(jìn)口貨物的支出圖表明殘差隨估計(jì)的Y值呈現(xiàn)某種變動(dòng)樣式(可能是曲線形式)。如果把估計(jì)的Y值以某種形式納入模型,則會(huì)提高R2值。2023/3/25廈門大學(xué)管理學(xué)院易英87考慮如下模型:例5.5美國(guó)進(jìn)口貨物的支出DependentVariable:Y Method:LeastSquares Date:10/31/11Time:13:41 Sample:19681987 Includedobservations:20 Variable Coefficient Std.Error t-Statistic Prob.

C -1021.589 446.7175 -2.286880 0.0362 X 0.833408 0.324953 2.564699 0.0208 YF*YF -0.012219 0.005396 -2.264368 0.0378 YF*YF*YF1.84E-05 6.91E-06 2.655620 0.0173 R-squared 0.976040

Meandependentvar 253.0500AdjustedR-squared0.971547

S.D.dependentvar 85.79656S.E.ofregression 14.47210

Akaikeinfocriterion 8.359179Sumsquaredresid3351.067

Schwarzcriterion 8.558325Loglikelihood -79.59179

F-statistic 217.2584 Durbin-Watsonstat 1.269998

Prob(F-statistic) 0.0000002023/3/25廈門大學(xué)管理學(xué)院易英88例5.5美國(guó)進(jìn)口貨物的支出

計(jì)算F統(tǒng)計(jì)量對(duì)于自由度為(2,16),在1%顯著水平下,F(xiàn)臨界值為6.23,故是統(tǒng)計(jì)顯著的,即模型是錯(cuò)誤設(shè)定的(實(shí)際上趨勢(shì)變量應(yīng)該納入模型)。2023/3/25廈門大學(xué)管理學(xué)院易英89RESET檢驗(yàn)的Eviews操作選擇Equation工具欄中的View\StabilityTest\RamseyRESETTest2023/3/25廈門大學(xué)管理學(xué)院易英90例5.5美國(guó)進(jìn)口貨物的支出RamseyRESETTest: F-statistic 12.43493

Prob.F(2,16) 0.0006

Loglikelihoodratio18.75609

Prob.Chi-Square(2) 0.0001 TestEquation: DependentVariable:Y Method:LeastSquaresSample:19681987 Includedobservations:20 Variable Coefficient Std.Error t-Statistic Prob.

C -1021.589 446.7175 -2.286880 0.0362 X 0.833408 0.324953 2.564699 0.0208 FITTED^2-0.012219 0.005396 -2.264368 0.0378 FITTED^31.84E-05 6.91E-06 2.655620 0.0173 R-squared 0.976040

Meandependentvar 253.0500AdjustedR-squared 0.971547S.D.dependentvar 85.79656S.E.ofregression 14.47210

Akaikeinfocriterion 8.359179Sumsquaredresid 3351.067Schwarzcriterion 8.558325Loglikelihood -79.59179

Hannan-Quinncriter. 8.398054F-statistic 217.2584

Durbin-Watsonstat 1.269998Prob(F-statistic) 0.000000 Stata做RESET檢驗(yàn).regyx1x2x3.estatovtest使用.estatovtest,rhs使用解釋變量的冪(ovtest表示omittedvariabletest)例5.5美國(guó)進(jìn)口貨物的支出.regyx2023/3/25廈門大學(xué)管理學(xué)院易英93例5.5美國(guó)進(jìn)口貨物的支出例5.5美國(guó)進(jìn)口貨物的支出2023/3/25廈門大學(xué)管理學(xué)院易英95兩個(gè)模型的決定系數(shù)都很高,如何在兩個(gè)模型之間選擇呢??jī)蓚€(gè)模型的R2值不能直接比較,因?yàn)椴皇峭粋€(gè)因變量。但是從RESET檢驗(yàn)看,第2個(gè)模型好于第1個(gè)模型。例5.5美國(guó)進(jìn)口貨物的支出2023/3/25廈門大學(xué)管理學(xué)院易英96RESET檢驗(yàn)RESET檢驗(yàn)的優(yōu)勢(shì)是簡(jiǎn)單易行,無需設(shè)定備擇模型,但這也導(dǎo)致在知道模型錯(cuò)誤設(shè)定時(shí)卻不能幫助我們選擇正確的模型。故RESET檢驗(yàn)主要用作診斷工具。Stata的Linktest連接檢驗(yàn)(linktest)最早由Tukey(1949)與Pregibon(1979,1980)提出?!斑B接”指將解釋變量與被解釋變量連接在一起的函數(shù)形式是否正確。首先進(jìn)行以下回歸然后檢驗(yàn)H0:δ2=0

,即擬合值平方的系數(shù)是否為0。如果模型設(shè)定正確,則不應(yīng)對(duì)被解釋變量還有解釋力。所以,如果拒絕H0,則認(rèn)為模型設(shè)定有誤,可考慮加入非線性項(xiàng)或改變回歸的函數(shù)形式(如取對(duì)數(shù))。例5.5美國(guó)進(jìn)口貨物的支出結(jié)果顯示,擬合值平方項(xiàng)(_hatsq)顯著,故存在模型設(shè)定偏誤。例5.5美國(guó)進(jìn)口貨物的支出取對(duì)數(shù),結(jié)果顯示擬合值平方項(xiàng)(_hatsq)仍然顯著,存在模型設(shè)定偏誤。引入高階項(xiàng),結(jié)果顯示擬合值平方項(xiàng)(_hatsq)不顯著,故不存在模型設(shè)定偏誤。例5.5美國(guó)進(jìn)口貨物的支出5.3模型變量的觀測(cè)誤差

2023/3/25廈門大學(xué)管理學(xué)院易英1012023/3/25廈門大學(xué)管理學(xué)院易英102觀測(cè)誤差在實(shí)踐中,由于種種原因(如無報(bào)告誤差、計(jì)算誤差等),因變量和解釋變量存在測(cè)量誤差。測(cè)量誤差的后果取決于誤差產(chǎn)生于因變量還是解釋變量。2023/3/25廈門大學(xué)管理學(xué)院易英103因變量中的測(cè)量誤差后果OLS估計(jì)量是無偏的OLS估計(jì)量的方差也是無偏的但是估計(jì)量的估計(jì)方差比沒有度量誤差時(shí)的大。因?yàn)橐蜃兞康恼`差加入到了誤差項(xiàng)。故因變量的測(cè)量誤差引起的后果不太嚴(yán)重。2023/3/25廈門大學(xué)管理學(xué)院易英104解釋變量中的測(cè)量誤差后果OLS估計(jì)量是有偏的OLS估計(jì)量也是不一致的,即即使樣本容量足夠大,OLS估計(jì)量仍然是有偏的。顯然,解釋變量的測(cè)量誤差是一個(gè)嚴(yán)重的問題。實(shí)踐中最重要的建議:確保變量的數(shù)據(jù)盡可能準(zhǔn)確,避免記錄、舍入和遺漏誤差,如果不同時(shí)期變量的定義不同,則要確保數(shù)據(jù)的可比性。變量測(cè)量誤差的檢驗(yàn)----

Hausman檢驗(yàn)(1)對(duì)回歸模型采用OLS法得到參數(shù)估計(jì)量(2)對(duì)可能存在測(cè)量誤差的解釋變量,選擇與其相關(guān)的工具變量,將可能存在測(cè)量誤差的解釋變量對(duì)工具變量進(jìn)行回歸,獲得回歸殘差w(3)將回歸殘差w加入(1)中的回歸表達(dá)式,再進(jìn)行OLS估計(jì),得到w的參數(shù)估計(jì)值及假設(shè)檢驗(yàn)結(jié)果(4)w的系數(shù)t檢驗(yàn)顯著,則解釋變量確實(shí)存在測(cè)量誤差,反之不存在測(cè)量誤差2023/3/25廈門大學(xué)管理學(xué)院易英105例5.6研究某地區(qū)出口額與國(guó)內(nèi)生產(chǎn)總值的關(guān)系,回歸模型為

Yt=b0+b1Xt+ut懷疑X可能有觀測(cè)誤差會(huì)影響分析結(jié)果,采用豪斯曼檢驗(yàn)。用居民儲(chǔ)蓄Z作為工具變量。

2023/3/25廈門大學(xué)管理學(xué)院易英106例5.62023/3/25廈門大學(xué)管理學(xué)院易英107例5.6W的t檢驗(yàn)顯著,說明解釋變量存在觀測(cè)誤差。2023/3/25廈門大學(xué)管理學(xué)院易英108例5.65.4隨機(jī)解釋變量

2023/3/25廈門大學(xué)管理學(xué)院易英110隨機(jī)解釋變量單方程線性計(jì)量模型假設(shè)解釋變量是確定性變量,并且與隨機(jī)誤差項(xiàng)不相關(guān)。違背這一基本假設(shè)的問題被稱為隨機(jī)解釋變量問題。在古典假設(shè)下,OLS估計(jì)量具有線性、無偏和有效性。其中無偏性和有效性的證明用到了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論