計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論第四版完整教學(xué)課件_第1頁
計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論第四版完整教學(xué)課件_第2頁
計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論第四版完整教學(xué)課件_第3頁
計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論第四版完整教學(xué)課件_第4頁
計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論第四版完整教學(xué)課件_第5頁
已閱讀5頁,還剩610頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論第四版完整教學(xué)課件spring2012邢恩泉2計(jì)量經(jīng)濟(jì)學(xué)計(jì)量經(jīng)濟(jì)學(xué)介紹第一章:計(jì)量經(jīng)濟(jì)學(xué)的性質(zhì)與經(jīng)濟(jì)數(shù)據(jù)spring2012邢恩泉3計(jì)量經(jīng)濟(jì)學(xué)介紹spring2012授課老師介紹教材及參考資料學(xué)習(xí)目標(biāo)授課計(jì)劃考核方式教材杰弗里.M.伍德里奇(JeffreyM.Wooldridge):《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論(第四版)》,中國人民大學(xué)出版社中文版邢恩泉4spring2012參考資料邢恩泉5spring2012古扎拉蒂:《經(jīng)濟(jì)計(jì)量學(xué)精要》,機(jī)械工業(yè)出版社王升:《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論》,清華大學(xué)出版社學(xué)習(xí)目標(biāo)比如經(jīng)濟(jì)思維能力;分析問題能力;運(yùn)用相關(guān)軟件能力;運(yùn)用于實(shí)際尤其是資本市場的能力;能夠撰寫較為規(guī)范的經(jīng)濟(jì)學(xué)經(jīng)驗(yàn)論文邢恩泉6spring2012授課計(jì)劃第一章

計(jì)量經(jīng)濟(jì)學(xué)的性質(zhì)與經(jīng)濟(jì)數(shù)據(jù)第一篇

橫截面數(shù)據(jù)的回歸分析第二章

簡單回歸模型第三章

多元回歸分析:估計(jì)第四章

多元回歸分析:推斷第九章

模型設(shè)定和數(shù)據(jù)問題的深入探討spring2012邢恩泉7授課計(jì)劃第二篇

時間序列數(shù)據(jù)的回歸分析第十章

時間序列數(shù)據(jù)的基本回歸分析第十一章 OLS用于時間序列數(shù)據(jù)的其他問題第三篇

高深專題探討第十三章

跨時橫截面的混合:簡單面板數(shù)據(jù)方法第十四章

高深的面板數(shù)據(jù)方法第十六章

聯(lián)立方程模型spring2012邢恩泉8考核方式比如平時作業(yè);平時考勤;期末考試等。Eg:平時考勤 10%平時作業(yè) 20%期末考試(閉卷考試) 70%邢恩泉9spring2012邢恩泉10第一章:計(jì)量經(jīng)濟(jì)學(xué)的性質(zhì)與經(jīng)濟(jì)數(shù)據(jù)spring2012什么是計(jì)量經(jīng)濟(jì)學(xué)經(jīng)驗(yàn)經(jīng)濟(jì)分析的步驟經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)計(jì)量經(jīng)濟(jì)分析中的因果關(guān)系和其他條件不變的概念什么是計(jì)量經(jīng)濟(jì)學(xué)定義:Econometricsisnotjusteconomicsstatistics,noreconomictheory,norapplicationofmathematicstoeconomics.Itistheunificationofthethree.邢恩泉11spring2012什么是計(jì)量經(jīng)濟(jì)學(xué)計(jì)量經(jīng)濟(jì)學(xué)的用處檢驗(yàn)經(jīng)濟(jì)模型解釋經(jīng)濟(jì)人的行為政策制定非實(shí)驗(yàn)數(shù)據(jù)與實(shí)驗(yàn)數(shù)據(jù)非實(shí)驗(yàn)數(shù)據(jù)(nonexperimentaldata)實(shí)驗(yàn)數(shù)據(jù)(experimentaldata)spring2012邢恩泉12經(jīng)驗(yàn)經(jīng)濟(jì)分析的步驟經(jīng)驗(yàn)分析(empiricalanalysis)定義:利用數(shù)據(jù)來檢驗(yàn)?zāi)硞€理論或者估計(jì)某種關(guān)系與實(shí)證分析(positiveanalysis)的區(qū)別:positiveanalysis和empiricalanalysis均是屬于實(shí)證范疇,不涉及到規(guī)范范疇的價值判斷,但是positiveanalysis更多地是從理論角度來描述,而empirical更多地是從實(shí)踐的角度來得出量化的結(jié)論。邢恩泉13spring2012經(jīng)驗(yàn)經(jīng)濟(jì)分析的步驟經(jīng)驗(yàn)分析步驟對所關(guān)心的問題進(jìn)行詳細(xì)的了解構(gòu)造一個經(jīng)濟(jì)模型大多數(shù)是運(yùn)用規(guī)范的分析工具得出經(jīng)濟(jì)模型(教材例1.1)也有些模型是從不甚規(guī)范的推理中得到的(教材例1.2)將經(jīng)濟(jì)模型變成計(jì)量模型邢恩泉14spring2012經(jīng)驗(yàn)經(jīng)濟(jì)分析的步驟

邢恩泉15spring2012經(jīng)驗(yàn)經(jīng)濟(jì)分析的步驟邢恩泉16spring2012經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)橫截面數(shù)據(jù)(cross-sectionaldataset)定義:對給定的某個時間點(diǎn)的個人、家庭、企業(yè)、城市、洲、國家或者一系列其他單位采集的樣本所構(gòu)成的數(shù)據(jù)集。常被用于勞動經(jīng)濟(jì)學(xué)、健康經(jīng)濟(jì)學(xué)和農(nóng)村經(jīng)濟(jì)學(xué)中。邢恩泉17spring2012經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)橫截面數(shù)據(jù)隨機(jī)抽樣在一個純粹的橫截面分析中,我們應(yīng)該忽略數(shù)據(jù)搜集中細(xì)小的時間差別隨機(jī)抽樣樣本的不隨機(jī)可能。比如家庭財(cái)富調(diào)查中富人更愿意瞞報財(cái)產(chǎn)數(shù)額樣本相對總體較大時不能保證觀測值是獨(dú)立抽取的spring2012邢恩泉18經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)obsnowageeducexperfemalemarried13.11121023.241222113311200468440155.31270168.7516901711.25181500851251093.612261010182516810128.1313310138.77121501145.51218001522.21231011617.33161401177.51210111810.63131610193.6121311204.5123611216.88121110228.48122901236.3316910240.5312310spring2012邢恩泉19經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)時間序列數(shù)據(jù)(timeseriesdata)定義:在不同時間點(diǎn)上收集到的數(shù)據(jù),這類數(shù)據(jù)反映了某一事物、現(xiàn)象等隨時間的變化狀態(tài)或程度。如我國國內(nèi)生產(chǎn)總值從1949到2009的變化就是時間序列數(shù)據(jù)。邢恩泉20spring2012經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)時間序列數(shù)據(jù)時間序列分析比橫截面數(shù)據(jù)分析更為困難的一個關(guān)鍵原因是我們很少假設(shè)經(jīng)濟(jì)數(shù)據(jù)的觀測獨(dú)立于時間。比如由于GDP的趨勢從這個季度到下一個季度保持著相當(dāng)?shù)姆€(wěn)定性,所以對上一個季度GDP的一些了解會告訴我們本季度GDP的可能范圍。spring2012邢恩泉21經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)年份國民國內(nèi)生產(chǎn)

人均國內(nèi)總收入總值第一產(chǎn)業(yè)第二產(chǎn)業(yè)

第三產(chǎn)業(yè)生產(chǎn)總值

工業(yè)建筑業(yè)(元)200098000.599214.614944.745555.940033.65522.338714.078582001108068.2109655.215781.349512.343580.65931.744361.686222002119095.7120332.716537.053896.847431.36465.549898.993982003135174.0135822.817381.762436.354945.57490.856004.7105422004159586.7159878.321412.773904.365210.08694.364561.3123362005185808.6184937.422420.087598.177230.810367.374919.3141852006217522.7216314.424040.0103719.591310.912408.688554.9165002007267763.7265810.328627.0125831.4110534.915296.5111351.9201692008316228.8314045.433702.0149003.4130260.218743.2131340.0237082009343464.7340506.935226.0157638.8135239.922398.8147642.125575spring2012邢恩泉22經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)混合橫截面數(shù)據(jù)(pooledcrosssection)定義:有些數(shù)據(jù)既有橫截面數(shù)據(jù)的特點(diǎn),又有時間序列的特點(diǎn)。例如,假設(shè)對中國家庭進(jìn)行了兩次橫截面數(shù)據(jù)的調(diào)查,一次在2000年,一次在2010年。為了擴(kuò)大我們的樣本容量,我們可以將這兩年的數(shù)據(jù)合并為一個混合橫截面數(shù)據(jù)。邢恩泉23spring2012經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)spring2012邢恩泉24經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)面板或縱列數(shù)據(jù)(paneldata)定義:由數(shù)據(jù)集中每個橫截面單位的一個時間序列組成與混合橫截面數(shù)據(jù)區(qū)別:面板數(shù)據(jù)前后年份的樣本是相同的,具有可比性。但是混合橫截面數(shù)據(jù)前后年份的樣本很可能大部分不相同,不具有可比性。邢恩泉25spring2012邢恩泉26spring2012計(jì)量經(jīng)濟(jì)分析中的因果關(guān)系和其他條件不變的概念因果效應(yīng)經(jīng)濟(jì)學(xué)家的目標(biāo)就是要推定一個變量對另一個變量具有因果關(guān)系其他條件不變在因果關(guān)系中,其他條件不變是具有重要作用的邢恩泉27spring2012第二章

簡單回歸模型簡單回歸模型的定義普通最小二乘法的推導(dǎo)OLS的操作技巧度量單位的函數(shù)形式OLS估計(jì)量的期望值和方差過原點(diǎn)回歸邢恩泉28spring2012簡單回歸模型的定義

spring2012邢恩泉29簡單回歸模型的定義簡單回歸模型定義的幾個討論公式變量與參數(shù)的解釋用x解釋y時面臨的三個問題該公式的不足該公式的假設(shè)spring2012邢恩泉30簡單回歸模型的定義——公式變量與參數(shù)的解釋Y:被稱為因變量(dependentvariable)、被解釋變量、被預(yù)測變量、回歸子X:被稱為自變量(independentvariable)、解釋變量、預(yù)測變量、回歸元、協(xié)變量spring2012邢恩泉31簡單回歸模型的定義——公式變量與參數(shù)的解釋YXDependentVariableIndependentVariableExplainedVariableExplanatoryVariableResponseVariableControlVariablePredictedVariablePredictorVariableRegressandRegressorspring2012邢恩泉32簡單回歸模型的定義——公式變量與參數(shù)的解釋

spring2012邢恩泉33簡單回歸模型的定義——用x解釋y時面臨的三個問題

spring2012邢恩泉34簡單回歸模型的定義——該公式的不足

spring2012邢恩泉35簡單回歸模型的定義——該公式的假設(shè)

spring2012邢恩泉36spring2012邢恩泉37簡單回歸模型的定義——該公式的假設(shè)

spring2012邢恩泉38簡單回歸模型的定義——該公式的假設(shè)spring2012邢恩泉39..x1x2E(y|x)=b0+b1xyf(y)簡單回歸模型的定義——該公式的假設(shè)

spring2012邢恩泉40普通最小二乘法的推導(dǎo)

spring2012邢恩泉41普通最小二乘法的推導(dǎo)——總體回歸線和總體回歸函數(shù)spring2012邢恩泉42....y4y1y2y3x1x2x3x4}}{{u1u2u3u4xyE(y|x)=b0+b1x普通最小二乘法的推導(dǎo)由E(u)=0和cov(x,u)=E(xu)=0相應(yīng)得出E(y–b0–b1x)=0和E[x(y–b0–b1x)]=0給定一個樣本,我們選擇估計(jì)值和,使得spring2012邢恩泉43普通最小二乘法的推導(dǎo)第一個方程可以得到,可以看出得出斜率估計(jì)值,我們就可以得出截距估計(jì)值spring2012邢恩泉44普通最小二乘法的推導(dǎo)對第二個方程求解可得:spring2012邢恩泉45普通最小二乘法的推導(dǎo)spring2012邢恩泉46普通最小二乘法的推導(dǎo)——最小化殘差平方和(附錄2A)

spring2012邢恩泉47普通最小二乘法的推導(dǎo)——樣本回歸線(OLS回歸線)和樣本回歸函數(shù)spring2012邢恩泉48....y4y1y2y3x1x2x3x4}}{{?1?2?3?4xy普通最小二乘法的推導(dǎo)——樣本回歸線和樣本回歸函數(shù)

中的符號讀作cap它是總體回歸函數(shù)E(y|x)=b0+b1x的一個樣本估計(jì)。總體回歸函數(shù)是固定而又未知的,切記這一點(diǎn)非常重要針對截距是0的情況,將在第六節(jié)中介紹spring2012邢恩泉49OLS的操作技巧

spring2012邢恩泉50OLS的操作技巧——擬合值和殘差

spring2012邢恩泉51OLS的操作技巧——OLS統(tǒng)計(jì)量的代數(shù)性質(zhì)OLS殘差和及其樣本均值均為零代數(shù)表示由OLS的一階級條件得出spring2012邢恩泉52OLS的操作技巧——OLS統(tǒng)計(jì)量的代數(shù)性質(zhì)回歸元和OLS殘差的樣本協(xié)方差為零代數(shù)表示由OLS的一階條件得出spring2012邢恩泉53OLS的操作技巧——OLS統(tǒng)計(jì)量的代數(shù)性質(zhì)點(diǎn)總在OLS回歸線上代數(shù)表示可以由推導(dǎo)出spring2012邢恩泉54OLS的操作技巧——OLS統(tǒng)計(jì)量的代數(shù)性質(zhì)

spring2012邢恩泉55OLS的操作技巧——擬合優(yōu)度定義總平方和SST

解釋平方和SSE

殘差平方和SSR

spring2012邢恩泉56OLS的操作技巧——擬合優(yōu)度SST=SSE+SSR的證明spring2012邢恩泉57OLS的操作技巧——擬合優(yōu)度判定系數(shù)我們定義R2=SSE/SST=1–SSR/SST為判定系數(shù),總是介于0到1之間一個接近于1的判定系數(shù)表明OLS給出了一個良好的擬合,一個于0的判定系數(shù)表明OLS給出了一個糟糕的擬合spring2012邢恩泉58度量單位和函數(shù)形式改變度量單位對OLS統(tǒng)計(jì)量的影響在簡單回歸中加入非線性因素“線性”回歸的含義spring2012邢恩泉59改變度量單位對OLS統(tǒng)計(jì)量的影響一般而言,當(dāng)因變量乘上常數(shù)c,而自變量不改變時,OLS的截距和斜率估計(jì)量也要乘上c如果定義roedec=roe/100,那么樣本回歸線將會從(estimatedsalary)=963.191+18.501roe改變到(estimatedsalary)=963.191+1850.1roedecspring2012邢恩泉60在簡單回歸中加入非線性因素非線性因素的必要性:線性關(guān)系并不適合所有的經(jīng)濟(jì)學(xué)運(yùn)用通過對因變量和自變量進(jìn)行恰當(dāng)?shù)亩x,我們可以在簡單回歸分析中非常容易地處理許多y和x之間的非線性關(guān)系例子:工資—教育模型,見下頁spring2012邢恩泉61在簡單回歸中加入非線性因素——自然對數(shù)形式

spring2012邢恩泉62在簡單回歸中加入非線性因素——自然對數(shù)形式

spring2012邢恩泉63在簡單回歸中加入非線性因素——自然對數(shù)形式spring2012邢恩泉64在簡單回歸中加入非線性因素——自然對數(shù)形式

spring2012邢恩泉65“線性”回歸的含義

spring2012邢恩泉66OLS估計(jì)量的期望值和方差OLS的無偏性O(shè)LS估計(jì)量的方差spring2012邢恩泉67OLS的無偏性我們首先在一組簡單假定的基礎(chǔ)上構(gòu)建OLS的無偏性。假定SLR.1(線性于參數(shù))在總體模型中,因變量y與自變量x的誤差項(xiàng)u的關(guān)系如下:

其中,和分別表示總體的截距和斜率參數(shù)。spring2012邢恩泉68OLS的無偏性假定SLR.2(隨機(jī)抽樣)我們具有一個服從從整體模型方程

的隨機(jī)樣本{:i=1,2…n},其樣本容量為n.spring2012邢恩泉69OLS的無偏性假定SLR.3(解釋變量的樣本有變異)x的樣本結(jié)果即{,i=1,…,n}不是完全相同的數(shù)值。spring2012邢恩泉70OLS的無偏性假定SLR.4(零條件均值)給定解釋變量的任何值,誤差的期望值都是零。換言之,E(u|x)=0恒成立spring2012邢恩泉71OLS的無偏性定理2.1OLS的無偏性

利用假定SLR.1-SLR.4,對的任何值,我們都有,換言之公式的推導(dǎo):引理:

spring2012邢恩泉72OLS的無偏性

spring2012邢恩泉73OLS的無偏性于是有spring2012邢恩泉74OLS的無偏性spring2012邢恩泉75OLS估計(jì)量的方差除了知道的抽樣分布是以為中心的以外,知道我們預(yù)期的究竟離多遠(yuǎn)也非常重要。在其他條件不變的情況下,這就容許我們從所有的無偏估計(jì)量中選擇一個最佳估計(jì)量。度量估計(jì)量分布的分散程度,最容易操作的一個指標(biāo)就是其方差或者標(biāo)準(zhǔn)差。為了便于表示出估計(jì)量的方差,這里我們加入條假設(shè)SLR.5spring2012邢恩泉76OLS估計(jì)量的方差假定SLR.5(同方差性)給定解釋變量的任何值,誤差都具有相同的方差,換言之:Var(u|x)=同方差的假定簡化了方差的計(jì)算,而且還意味著OLS具有某種有效性。然而當(dāng)Var(u|x)是x的函數(shù)事,往往就會出現(xiàn)異方差的情形。spring2012邢恩泉77一個工資方程中的異方差性其他條件不變情況下,educ對wage的影響時無偏估計(jì)量,我們假定E(u|educ)=0,若同時假定Var(u|x)=,即工資相對于其均值的波動不依賴于受教育水平。在現(xiàn)實(shí)中這或許不太可能。這是因?yàn)榻邮芰烁嘟逃娜丝赡苡懈鼜V泛的興趣和更多的就業(yè)機(jī)會,從而導(dǎo)致收教育程度越高,工資變異越大;受教育水平越低,工資變異越小。圖形見下張PPT

spring2012邢恩泉78spring2012邢恩泉79OLS估計(jì)量的方差

spring2012邢恩泉80誤差方差的估計(jì)由前面我們知道OLS的殘差滿足兩個約束:

如果我們知道了殘差中的n-2個,就能夠通過以上約束求出剩余兩個殘差。因此OLS的殘差只有n-2個自由度,我們得到的無偏估計(jì):spring2012邢恩泉81誤差方差的估計(jì)定理2.3的無偏估計(jì)

在假定SLR.1-SLR.5下,我們有

spring2012邢恩泉82過原點(diǎn)的回歸某些情形下,我們希望如下約束:x=0時,y的期望值也是0.此時原本有非零截距的回歸模型就變換成無截距的模型。規(guī)范回歸模型:此時估計(jì)值例如:若收入(x)為零時,那么所得稅(y)也必須是零,此時適用于無截距線性回歸。spring2012邢恩泉83spring2012邢恩泉84謝謝!第三章

多元回歸分析:估計(jì)使用多元回歸分析的動因普通最小二乘法的操作和解釋OLS估計(jì)量的期望值OLS估計(jì)量的方差OLS的有效性:高斯-馬爾科夫定理邢恩泉85spring2012使用多元回歸模型的動因?qū)嶋H研究中更多時候?qū)σ蜃兞坑杏绊懙淖宰兞總€數(shù)將不只一個,需要進(jìn)行多元回歸例1:

在對小時工資的研究中,除了教育水平之外,工作經(jīng)歷也是一個顯著的影響因素,因此需要增加自變量個數(shù),建立多元回歸模型。spring2012邢恩泉86多元線性回歸模型的一般形式

spring2012邢恩泉87如何得到OLS估計(jì)值首先考慮兩個自變量的模型:

建模的原理依舊是使得達(dá)到最小。要理解OLS在做什么,重要的是理解自變量角標(biāo)的含義。下標(biāo)i表示觀測序號,這里假設(shè)有n個觀測變量。第二個下標(biāo)只是區(qū)別不同自變量的方法。在之前的例子中,分別表示樣本中第i個人的教育程度和工作經(jīng)歷。spring2012邢恩泉88如何得到OLS估計(jì)值在含有k個自變量的情形中。在選擇估計(jì)值時,我們最小化了殘差平方和

這個最小化問題可以使用多元微積分求解。OLS的一階條件:spring2012邢恩泉89如何得到OLS估計(jì)值如同簡單回歸里那樣

稱為OLS回歸線,

為截距估計(jì)值,

為斜率估計(jì)值。為了表明已經(jīng)進(jìn)行了一個OLS回歸分析,我們將方程中的y,x1,x2..xk用其變量名稱取代(如wage,educ,exper等)

spring2012邢恩泉90對OLS回歸方程的解釋估計(jì)值具有偏效應(yīng)或其他情況不變得解釋。從方程中我們可以得到

所以我們能在給定x1,x2的變化時預(yù)測y

值得變化。特別的,當(dāng)=0時,有

關(guān)鍵是通過把x2包含在模型中,我們所得到的x1的系數(shù)可解釋為在其他條件不變的情況下的影響。這正是多元回歸分析如此有用的原因所在。spring2012邢恩泉91例2:小時工資方程我們在log(wage)的方程中包括educ(教育水平),exper(工作經(jīng)歷),

和tenure(任現(xiàn)職的任期),估計(jì)的方程:系數(shù)0.092意味著,在保持educ和exper不變的情況下,多受一年教育者的log(wage)提高0.092即9.2%。spring2012邢恩泉92“保持其他因素不變”的含義因?yàn)槎嘣貧w分析中的偏效應(yīng)解釋可能導(dǎo)致一些混淆,所以我們要盡量避免這個問題。多元回歸分析使我們能在非實(shí)驗(yàn)中進(jìn)行自然科學(xué)家在受控實(shí)驗(yàn)室中所能做的事情:保持其他因素不變spring2012邢恩泉93同時改變不止一個變量有時我們想改變一個以上的變量,同時看看由此對因變量的影響,通過回歸方程很容易做到。在例2中,當(dāng)一人在同一企業(yè)工作過1年,保持educ不變,exper和tenure都增加一年時,對工資的總影響為:spring2012邢恩泉94OLS的擬合值和殘差對觀測i,其擬合值為

它只是將第i個自變量值代入回歸方程所得的預(yù)測值。OLS最小化了預(yù)測誤差平方的平均值,但對任何一個觀測的誤差都沒說明。第i個觀測的殘差被定義為:若,意味著yi被預(yù)測的過低;反之說明yi被預(yù)測的過高。spring2012邢恩泉95OLS的擬合值和殘差直接從單變量模型推廣,可得OLS擬合值和殘差的某些重要性質(zhì)。1.殘差的樣本平均值為零2.每個自變量和OLS殘差之間的樣本協(xié)方差為零,于是OLS擬合值和OLS殘差之間的樣本協(xié)方差也為零3.點(diǎn)總位于樣本OLS回歸線上。spring2012邢恩泉96對多元回歸“排除其他變量影響”的解釋

spring2012邢恩泉97簡單回歸與多元回歸估計(jì)值的比較

spring2012邢恩泉98簡單回歸與多元回歸估計(jì)值的比較

spring2012邢恩泉99例3:401(k)養(yǎng)老金計(jì)劃匹配率mrate是指對于一個員工所投入的每一美元的養(yǎng)老金,企業(yè)為員工匹配的數(shù)量。參與率prate是指有資格擁有一個401(k)賬戶的員工中參與此計(jì)劃的百分比。變量age是401(k)養(yǎng)老金計(jì)劃的實(shí)施年數(shù)。將prate對mrate和age進(jìn)行回歸:

spring2012邢恩泉100例3:401(k)養(yǎng)老金計(jì)劃如果我們不控制age,將prate對mrate進(jìn)行簡單歸可以得到:

可見兩種回歸式子相差不大。

spring2012邢恩泉101擬合優(yōu)度與簡單回歸中一樣,我們定義總平方和SST

解釋平方和SSE

殘差平方和SSR

spring2012邢恩泉102擬合優(yōu)度判定系數(shù)我們定義R2=SSE/SST=1–SSR/SST為判定系數(shù),總是介于0到1之間一個接近于1的判定系數(shù)表明OLS給出了一個良好的擬合,一個于0的判定系數(shù)表明OLS給出了一個糟糕的擬合spring2012邢恩泉103擬合優(yōu)度還可以證明R2

等于yi的實(shí)際值與擬合值相關(guān)系數(shù)的平方,即:spring2012邢恩泉104過原點(diǎn)的回歸

spring2012邢恩泉105OLS估計(jì)值的期望值我們現(xiàn)在轉(zhuǎn)而討論,在估計(jì)一個產(chǎn)生樣本的總體模型的參數(shù)時,OLS所具有的統(tǒng)計(jì)性質(zhì)。特別的,我們討論四個假定,這些假定都是對簡單回歸模型假定的直接推廣,而且在這些假定下,OLS估計(jì)量是總體參數(shù)的無偏估計(jì)值spring2012邢恩泉106OLS估計(jì)值的期望值

spring2012邢恩泉107OLS估計(jì)值的期望值假定MLR.2(隨機(jī)抽樣)

我們有一個包含n次觀測的隨機(jī)樣本它來自MLR.1中的總體模型。

spring2012邢恩泉108OLS估計(jì)值的期望值假定MLR.3(不存在完全共線性)

在樣本(因而在總體中),沒有一個自變量是常數(shù),自變量之間不存在嚴(yán)格(完全)的線性關(guān)系。我們現(xiàn)在必須關(guān)注所有自變量之間的關(guān)系,如果方程中有一個自變量是其他自變量的額線性組合,那么我們說這個模型遇到了完全共線性問題。spring2012邢恩泉109OLS估計(jì)值的期望值重要的是我們要注意到,MLR.3允許變量之間有相關(guān)關(guān)系,只是不能是完全相關(guān)。例4:將考試分?jǐn)?shù)與教育支出(expend)和家庭收入(avginc)的模型中:我們充分預(yù)料expend與avginc之間可能相關(guān),學(xué)生家庭收入高的學(xué)校,傾向于對每個學(xué)生在教育上支出更多。MLR.3只是排除了expend與avginc之間完全相關(guān)的情形。

spring2012邢恩泉110OLS估計(jì)值的期望值兩個變量完全相關(guān),最簡單的情形就是一個變量是另一個變量的常數(shù)倍。當(dāng)研究者把同一個變量在不同的單位下兩次進(jìn)入同一個回歸方程,就會出現(xiàn)完全線性相關(guān)的額情形。例如在估計(jì)消費(fèi)與收入的模型中,將收入以美元和千美元為單位分別最為自變量是毫無意義的。也是違背了MLR.3的spring2012邢恩泉111OLS估計(jì)值的期望值同一變量的不同非線性函數(shù)也都可以出現(xiàn)在回歸元中。比如模型

就不違背假定MLR.3,因?yàn)閤2=inc*inc雖然是x1=inc的一個函數(shù),但是并不是一個線性函數(shù)。在模型中引入inc*inc是推廣函數(shù)形式的一種有用方法。

spring2012邢恩泉112OLS估計(jì)值的期望值自變量可能完全線性相關(guān)的另一種方式是,一個自變量恰好是其他自變量的線性函數(shù)。例5:考慮競選支出和得票率的關(guān)系,有兩位競選者A和B,為了使每個候選人支出與總支出隔離開來,設(shè)定模型:顯然有x3=x1+x2,因而違背了假定MLR.3spring2012邢恩泉113OLS估計(jì)值的期望值假定MLR.4(條件均值為零)給定自變量的任何值,誤差u的期望值為零。換句話說,E(u|x1,x2…xk)=0通常情況下,漏掉一個與x1,x2…xk中任何一個自變量相關(guān)的因素,都有可能導(dǎo)致MLR.4不成立。

使用多元回歸分析,我們能包含解釋變量中的許多因素,與簡單回歸相比,多元回歸分析出現(xiàn)漏掉一些變量的可能性要小很多。spring2012邢恩泉114OLS估計(jì)值的期望值當(dāng)假定MLR.4成立時,我們常說我們具有外生解釋變量。如果處于某種原因xj仍與u有關(guān),那么我就成xj是內(nèi)生解釋變量。雖然“外生”和“內(nèi)生”的術(shù)語源于聯(lián)立方程分析,但內(nèi)生解釋變量一詞涵蓋了一個解釋變量可能與誤差項(xiàng)相關(guān)的一切情況。spring2012邢恩泉115OLS的無偏性

spring2012邢恩泉116對“無偏”的理解如我們所知,估計(jì)值不可能是無偏的,因?yàn)橐粋€估計(jì)值就是從一個特定的樣本得到的固定值,它通常都不等于總體參數(shù)。我們說OLS在四個假定下是無偏的是指當(dāng)我們將用來得到OLS估計(jì)值的程序用到各種可能的隨機(jī)樣本時,這個程序是無偏的。spring2012邢恩泉117回歸模型中包含了無關(guān)變量

spring2012邢恩泉118回歸模型中包含了無關(guān)變量

spring2012邢恩泉119遺漏變量的偏誤:簡單情形現(xiàn)在假設(shè)我們是遺漏了一個實(shí)際應(yīng)該包括在模型中的變量,通常稱為排出一個有關(guān)變量或者對模型設(shè)定不足。推導(dǎo)遺漏一個重要變量所導(dǎo)致的偏誤,是誤設(shè)分析的一個例子,我們從含有兩個變量的模型入手:

并假設(shè)模型滿足MLR.1-MLR.4

spring2012邢恩泉120遺漏變量的偏誤:簡單情形由于疏忽或者數(shù)據(jù)不足,我們在排除X2的情況下估計(jì)這個模型得到:

例6:假設(shè)薪資與教育程度、天賦有關(guān)即

由于能力不可觀測,我們轉(zhuǎn)而用模型其中

spring2012邢恩泉121遺漏變量的偏誤:簡單情形

spring2012邢恩泉122遺漏變量的偏誤:簡單情形

spring2012邢恩泉123遺漏變量的偏誤:簡單情形

spring2012邢恩泉124遺漏變量的偏誤:簡單情形

spring2012邢恩泉125遺漏變量的誤差

spring2012邢恩泉126遺漏變量的偏誤:一般情形

spring2012邢恩泉127遺漏變量的偏誤:一般情形

spring2012邢恩泉128遺漏變量的偏誤:一般情形

spring2012邢恩泉129遺漏變量的偏誤:一般情形

spring2012邢恩泉130OLS估計(jì)量的方差除了知道估計(jì)量的趨勢之外,我們還想度量其在樣本分布中的分散情況。在求出方差之前,我們增加一個同方差假定,其次我們在下面可以看到,如果增加了同方差的假定,OLS具有一個重要的性質(zhì),即有效性。假定MLR.5(同方差性)

給定任意解釋變量值,誤差u都具有相同的方差,換言之:Var(u|x1,..xk)=spring2012邢恩泉131OLS估計(jì)量的方差在方程

中,同方差性要求不可觀測的誤差項(xiàng)不依賴于教育水平,工作經(jīng)歷和現(xiàn)有任期水平。

即Var(u|educ,exper,tenure)=否則就會出現(xiàn)異方差性。假定MLR.1-MLR.5一起被稱為(橫截面回歸的)高斯-馬爾科夫假定。迄今為止,我們對假定的表述都只使用于隨機(jī)抽樣的橫截面分析。對于時間序列或面板數(shù)據(jù),該假定將更加困難。spring2012邢恩泉132OLS估計(jì)量的方差接下來的討論中,我們將用x表示(x1,…,xk)的集合,于是在工資例子中x=(educ,exper,tenure)。我們可以將MLR.1和MLR.4寫成E(y|x)=假定MLR.5表示為:

Var(y|x)=spring2012邢恩泉133OLS估計(jì)量的方差

spring2012邢恩泉134OLS估計(jì)量的方差在我們詳盡的研究估計(jì)值方差之前,我們要注意,在得到這個公式的過程中,用到了所有高斯-馬爾科夫假定。雖然OLS的無偏性不需要同方差假定,但是要讓上述式子成立,則必然要求同方差。

的大小在實(shí)踐中也很重要。方差越大,則意味著估計(jì)量越不精確,也就是置信區(qū)間越大和假設(shè)檢驗(yàn)越不準(zhǔn)確。spring2012邢恩泉135OLS方差的成分:多重共線性

spring2012邢恩泉136OLS方差成分:多重共線性xj的總樣本變異,SSTj。由定理3.2的表達(dá)式,xj的樣本變異越大,則估計(jì)值的方差越小。因此我們希望xj的取值越分散越好。擴(kuò)大樣本容量可以提高每一個先變量的變異。當(dāng)我們從總體中抽樣時,隨著樣本量的越來越大,SSTj將無限遞增。若SSTj很小,那么估計(jì)值的方差將很大,但是只要SSTj不為零,都是不違背假定MLR.3的spring2012邢恩泉137OLS方差成分:多重共線性自變量之間的線性關(guān)系,.的回歸只是涉及到

原模型的自變量,其中xj是作為因變量而出現(xiàn)的??紤]k=2的情形:

于是其中是x1對x2進(jìn)行簡單回歸得到的擬合優(yōu)度。越接近1,表明x1與x2高度相關(guān),且此時越大。spring2012邢恩泉138OLS方差成分:多重共線性

spring2012邢恩泉139OLS方差成分:多重共線性若1,則,兩個或者多個自變量之間高度(但不完全)相關(guān)被稱為多重共線性。多重共線性不違背假定MLR.3,但是我們也不能確定一個臨界值來說明是否存在多重共線性。例如=0.9意味著在xj的樣本變異中,90%都可以由回歸模型中的其他自變量來解釋。即xj與其他的自變量有很強(qiáng)的相關(guān)關(guān)系。spring2012邢恩泉140OLS方差成分:多重共線性

spring2012邢恩泉141OLS方差成分:多重共線性

spring2012邢恩泉142誤設(shè)模型中的方差

spring2012邢恩泉143誤設(shè)模型中的方差

spring2012邢恩泉144誤設(shè)模型中的方差我們考慮兩個估計(jì)量的方差。

可以看出來,除非x1與x2不相關(guān),那么總有我們假設(shè)x1與x2不相關(guān),可以得到如下結(jié)論:

spring2012邢恩泉145誤設(shè)模型中的方差

spring2012邢恩泉146OLS估計(jì)量的標(biāo)準(zhǔn)誤

spring2012邢恩泉147OLS估計(jì)量的標(biāo)準(zhǔn)誤df=觀測次數(shù)-估計(jì)參數(shù)個數(shù)=n-(k+1)從技術(shù)上講,除以n-k-1是因?yàn)闅埐钇椒胶偷钠谕禐镋(SSR)=(n-k-1)這一事實(shí)。由于,因此在施行OLS估計(jì)時施加了k+1個限制。意味著,給定殘差的n-k-1個方程,就能得到剩余的k+1個殘差。

spring2012邢恩泉148OLS估計(jì)量的標(biāo)準(zhǔn)誤定理3.3的無偏估計(jì)

在高斯-馬爾科夫假定MLR.1-MLR.5下,

的正平方根稱作回歸標(biāo)準(zhǔn)誤或SER.SER是誤差項(xiàng)標(biāo)準(zhǔn)差的估計(jì)量。為了下一章構(gòu)造置信區(qū)間,我們還要估計(jì)的標(biāo)準(zhǔn)差,也就是平方根

spring2012邢恩泉149OLS估計(jì)量的標(biāo)準(zhǔn)誤

spring2012邢恩泉150OLS的有效性:高斯馬爾科夫定理提出問題:在假定MLR.1-MLR.4下,OLS估計(jì)是無偏的,但在這個假定下還有其他許多的無偏估計(jì)量,那么還有其他的無偏估計(jì)量的方差比OLS估計(jì)量的方差還小么?如果我們適當(dāng)限制這些估計(jì)量的范圍,我們將證明,在所有的無偏線性估計(jì)量當(dāng)中,OLS是最好的一個。即在MLR.1-MLR.5的前提下,OLS估計(jì)量是最優(yōu)線性無偏估計(jì)量(BLUE).spring2012邢恩泉151OLS的有效性:高斯馬爾科夫定理

spring2012邢恩泉152OLS的有效性:高斯馬爾科夫定理最優(yōu)性,這里最優(yōu)被定義為最小方差。解釋完三個性質(zhì)我們有以下定理:定理3.4高斯-馬爾科夫定理

在假定MLR.1-MLR.5下,分別是最優(yōu)線性無偏估計(jì)量。高斯-馬爾科夫定理辨明了估計(jì)多元回歸模型時使用OLS的合理性,但是注意,如有高斯馬爾科夫假設(shè)中有一個不成立,那么該定理就是不成立的。spring2012邢恩泉153spring2012邢恩泉154謝謝!第四章

多元回歸分析:推斷OLS估計(jì)量的抽樣分布檢驗(yàn)對單個總體參數(shù)的假設(shè):t檢驗(yàn)置信區(qū)間檢驗(yàn)關(guān)于參數(shù)的一個線性組合假設(shè)對多個線性約束的檢驗(yàn):F檢驗(yàn)報告回歸結(jié)果邢恩泉155spring2012OLS估計(jì)量的抽樣分布

spring2012邢恩泉156OLS估計(jì)量的抽樣分布

spring2012邢恩泉157OLS估計(jì)量的抽樣分布

spring2012邢恩泉158OLS估計(jì)量的抽樣分布在任何一個應(yīng)用中是否可以假定u的正態(tài)性,實(shí)際上是一個經(jīng)驗(yàn)問題。例如,沒有一個定理會認(rèn)為取決于educ,exper,tenure的wage服從正態(tài)分布。由于工資不可能是負(fù)數(shù),因此嚴(yán)格的講,它不可能服從于正態(tài)分布。而且,因?yàn)榇嬖谧畹凸べY法,總體中有一定比例的人恰好得到最低工資,這也與正態(tài)分布性質(zhì)相矛盾。以往的經(jīng)驗(yàn)表明,對工資而言,正態(tài)分布不是一個好的假設(shè)。spring2012邢恩泉159OLS估計(jì)量的抽樣分布通常通過一種變換,可以得到一個更為接近正態(tài)性質(zhì)的分布。比如log(wage)之類的,同樣這也是一個經(jīng)驗(yàn)問題。在有些例子當(dāng)中,假定MLR.6明顯是錯誤的,然而在書本第5章我們將看到,對于大樣本容量來說,誤差的非正態(tài)性質(zhì)算不上是一個非常嚴(yán)重的問題。因此目前我們姑且認(rèn)可誤差的正態(tài)性假設(shè)。spring2012邢恩泉160OLS估計(jì)量的抽樣分布

spring2012邢恩泉161OLS估計(jì)量的抽樣分布

spring2012邢恩泉162單個總體參數(shù)檢驗(yàn):t檢驗(yàn)本節(jié)將對總體回歸模型中的單個參數(shù)的假設(shè)進(jìn)行檢驗(yàn)??傮w模型可寫作:

而且它滿足CLM假設(shè)。為了構(gòu)造假設(shè)檢驗(yàn),我們有如下結(jié)論,定理4.2標(biāo)準(zhǔn)化估計(jì)量的t分布

在CLM假設(shè)MLR.1-MLR.6下,

,其中,k+1是總體回歸模型中未知參數(shù)的個數(shù)。

spring2012邢恩泉163單個總體參數(shù)檢驗(yàn):t檢驗(yàn)

spring2012邢恩泉164單個總體參數(shù)檢驗(yàn):t檢驗(yàn)

spring2012邢恩泉165單個總體參數(shù)檢驗(yàn):t檢驗(yàn)

spring2012邢恩泉166對單側(cè)對立假設(shè)的檢驗(yàn)

spring2012邢恩泉167對單側(cè)對立假設(shè)的檢驗(yàn)

spring2012邢恩泉168對單側(cè)對立假設(shè)的檢驗(yàn)在5%的顯著水平上“足夠大”的定義是,在含有n-k-1個自由度的t分布中,處在百分位中第95位的數(shù)值,用c表示。換句話說,拒絕法則就是在下列情況下

,Ho在5%的顯著性水平下被拒絕并支持H1。通過我們對臨界值c的選取,當(dāng)Ho正確時,對所有隨機(jī)樣本有5%的可能性會拒絕Ho。spring2012邢恩泉169對單側(cè)對立假設(shè)的檢驗(yàn)

spring2012邢恩泉170例子2:學(xué)生成績與學(xué)校規(guī)模

spring2012邢恩泉171例子2:學(xué)生成績與學(xué)校規(guī)模我們首先對enroll的估計(jì)系數(shù)做t檢驗(yàn),由于n-k-1=408-3-1=404,所以我們可以使用標(biāo)準(zhǔn)正太分布臨界值。虛擬假設(shè)是Ho:,

enroll的t統(tǒng)計(jì)量是-0.0002/0.00022=-0.91,由于-0.91大于5%的顯著水平臨界值-1.65,因此我們不能在5%的顯著水平上拒絕Ho假設(shè)。實(shí)際上即使是15%的顯著水平的臨界值-1.04也小于-0.91,在15%的水平也不能拒絕Ho

邢恩泉172例子2:學(xué)生成績與學(xué)校規(guī)模另一方面,由于totcomp的t統(tǒng)計(jì)量是4.6,所以即使顯著水平為1%,它也是統(tǒng)計(jì)顯著的。變量staff的t統(tǒng)計(jì)量是1.2,所以即使顯著性水平是10%,我們也不能拒絕假設(shè):

,而支持

spring2012邢恩泉173雙側(cè)對立假設(shè)

spring2012邢恩泉174雙側(cè)對立假設(shè)若對立假設(shè)是雙側(cè)的,我們要考慮t統(tǒng)計(jì)值的絕對值。拒絕的法則是:

。

為了找到適當(dāng)?shù)腸,我們首先確定一個顯著性水平,比如5%,對一個雙側(cè)檢驗(yàn),選擇c要使得t分布兩端的面積都等于2.5%,換句話說,c就是含有n-k-1個自由度的第97.5個百分位。當(dāng)n-k-1=25時候,雙側(cè)檢驗(yàn)的顯著水平是5%的臨界值是2.060.spring2012邢恩泉175雙側(cè)對立假設(shè)

spring2012邢恩泉176例3:大學(xué)GPA的決定因素

spring2012邢恩泉177例3:大學(xué)GPA的決定因素由于自由度為137很大,足以用標(biāo)準(zhǔn)正太分布來近似,以顯著水平5%的臨界值為1.96.顯著水平為1%的臨界值為2.58hsGPA的t統(tǒng)計(jì)量是4.38,這在很小的顯著水平上都是顯著的。于是我們說hsGPA在任何慣常的顯著水平上都是統(tǒng)計(jì)顯著的。Skipped的t統(tǒng)計(jì)量是-0.083/0.026=-3.19,所以在1%的顯著水平上的是統(tǒng)計(jì)顯著的。(因?yàn)?.19>2.58)spring2012邢恩泉178

spring2012邢恩泉179

我們可以用一般t統(tǒng)計(jì)量針對單側(cè)或者雙側(cè)對立假設(shè)做檢驗(yàn)。比如,如果虛擬假設(shè)和對立假設(shè)分別是

那么我們得到單側(cè)對立假設(shè)臨界值的方法和前面一樣,不同之處在于我們?nèi)绾巫層?jì)算t統(tǒng)計(jì)量,而不是在于我們?nèi)绾蔚玫竭m當(dāng)?shù)腸值。spring2012邢恩泉180例4:校園犯罪和注冊人數(shù)

spring2012邢恩泉181例4:校園犯罪和注冊人數(shù)

spring2012邢恩泉182例4:校園犯罪和注冊人數(shù)

spring2012邢恩泉183

spring2012邢恩泉184t檢驗(yàn)的p值給定t統(tǒng)計(jì)量的的觀測值,能拒絕虛擬假設(shè)的最小顯著水平被稱為檢驗(yàn)的p值。比如,對于一個假設(shè),我們得到t統(tǒng)計(jì)量等于1.85,而自由度為40,在5%的顯著水平下臨界值為2.021,因此不能拒絕Ho。我們從而可以知道檢驗(yàn)的p值>5%。通過計(jì)算t隨機(jī)變量在絕對值上大于1.85的概率,我們就可以得到該檢驗(yàn)的p值。p值就是我們用檢驗(yàn)統(tǒng)計(jì)量的值作為檢驗(yàn)臨界值時相應(yīng)的檢驗(yàn)水平。spring2012邢恩泉185t檢驗(yàn)的p值

spring2012邢恩泉186t檢驗(yàn)的p值在df=40,t值=1.85的例子中,計(jì)算的p值=P(|T|>1.85)=2P(T>1.85)=

2*0.0359=0.0718.spring2012邢恩泉187t檢驗(yàn)的p值

spring2012邢恩泉188對經(jīng)典假設(shè)檢驗(yàn)用語的提醒當(dāng)Ho未被拒絕時,我們喜歡說“在x%的水平上,我們不能拒絕Ho”,而不是說,“在x%的水平上,我們接受Ho”。這是因?yàn)榭赡軐τ诓煌募僭O(shè),我們都不能加以拒絕。不能拒絕某一假設(shè)并不意味著我們就要接受這個假設(shè)。spring2012邢恩泉189經(jīng)濟(jì)或?qū)嶋H顯著性與統(tǒng)計(jì)顯著性

spring2012邢恩泉190例5:養(yǎng)老金計(jì)劃參與率

spring2012邢恩泉191例5:養(yǎng)老金計(jì)劃參與率但是,從實(shí)踐意義上看,totemp的系數(shù)有多大?保持mrate和age不變,如果一個企業(yè)增加10000個雇員,參與率也就只下降1.3個百分點(diǎn),即雇員人數(shù)對參與率的影響有限,即使它在慣常水平上是統(tǒng)計(jì)顯著的。spring2012邢恩泉192一些準(zhǔn)則1.檢查統(tǒng)計(jì)顯著性。如果該統(tǒng)計(jì)量是統(tǒng)計(jì)顯著的,那就接著討論系數(shù)的大小,以對其實(shí)際或經(jīng)濟(jì)上的重要性有所認(rèn)識。2.如果一個變量在通常的顯著水平上(10%,5%,1%)上不是統(tǒng)計(jì)顯著的,那你仍可能要問,這個變量對y是否具有預(yù)期的影響,而這個影響在實(shí)踐中是否很大,如果很大,那就應(yīng)該對t統(tǒng)計(jì)量計(jì)算一個p值,對于小樣本容量,有時可以使得p值大到0.20。spring2012邢恩泉193一些準(zhǔn)則通常發(fā)現(xiàn),t統(tǒng)計(jì)量很小的變量都具有“錯誤的”符號。實(shí)際上,這些情況可以忽略,我們斷定這些變量在統(tǒng)計(jì)上不顯著。一個在實(shí)踐中具有很大影響且具有出乎的符號的顯著變量,遠(yuǎn)非我們想象的那么簡單,而且難以解決,為了解決這個問題,人們通常要對模型和數(shù)據(jù)的性質(zhì)做更多的思考。spring2012邢恩泉194置信區(qū)間

spring2012邢恩泉195置信區(qū)間

spring2012邢恩泉196置信區(qū)間

spring2012邢恩泉197置信區(qū)間

spring2012邢恩泉198例6:研發(fā)指出模型

spring2012邢恩泉199例6:研發(fā)指出模型

spring2012邢恩泉200置信區(qū)間

spring2012邢恩泉201檢驗(yàn)參數(shù)的一個線性組合假設(shè)

spring2012邢恩泉202檢驗(yàn)參數(shù)的一個線性組合假設(shè)

spring2012邢恩泉203檢驗(yàn)參數(shù)的一個線性組合假設(shè)為了解釋我們估計(jì)量中的抽樣誤差,我們將這個差值除以標(biāo)準(zhǔn)誤,將其標(biāo)準(zhǔn)化。

(4.20)一旦我們得到該檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)的過程就一如從前。我們選擇一個顯著水平,根據(jù)df得到一個臨界值,根據(jù)本例的假設(shè),拒絕法則的形式就是t<-c?;蛘?,我們計(jì)算t統(tǒng)計(jì)量后,再計(jì)算p值。

spring2012邢恩泉204檢驗(yàn)參數(shù)的一個線性組合假設(shè)

spring2012邢恩泉205檢驗(yàn)參數(shù)的一個線性組合假設(shè)

spring2012邢恩泉206檢驗(yàn)參數(shù)的一個線性組合假設(shè)

spring2012邢恩泉207檢驗(yàn)參數(shù)的一個線性組合假設(shè)

spring2012邢恩泉208檢驗(yàn)參數(shù)的一個線性組合假設(shè)

spring2012邢恩泉209檢驗(yàn)參數(shù)的一個線性組合假設(shè)

spring2012邢恩泉210檢驗(yàn)參數(shù)的一個線性組合假設(shè)變換后方程中唯一不能從變換前方程中得到的就是系數(shù)-0.0102的標(biāo)準(zhǔn)誤0.0069,從而t統(tǒng)計(jì)量值=

-0.0102/0.0069=-1.48.相對于單邊對立假設(shè),p值約為0.07,所有有證據(jù)拒絕式spring2012邢恩泉211檢驗(yàn)參數(shù)的一個線性組合假設(shè)

spring2012邢恩泉212對多個線性約束的檢驗(yàn):F檢驗(yàn)除了檢驗(yàn)參數(shù)的單個約束外,我們常常還需要檢驗(yàn)關(guān)于基本參數(shù)的多重假設(shè),我們首先從檢驗(yàn)一組自變量時候?qū)σ蜃兞慷紱]有影響這個首要問題開始。spring2012邢恩泉213對排除性約束的檢驗(yàn)我們考慮美國棒球職業(yè)聯(lián)盟球員薪水的模型(4.28)

其中,salary表示總薪水,years表示加入聯(lián)盟年數(shù),gamesyr表示平均每年參賽次數(shù),bavg表示職業(yè)擊球率,hrunsyr表示平均每年本壘打次數(shù),rbisyr表示每年擊球跑壘得分。spring2012邢恩泉214對排除性約束的檢驗(yàn)我們考慮如下虛擬假設(shè)該假設(shè)由3個排除性約束構(gòu)成,這是多重約束的一個例子,對多重約束進(jìn)行的檢驗(yàn)被稱為多重假設(shè)檢驗(yàn)。對于該例子,合適的對立假設(shè)為我們該如何檢驗(yàn)式(4.29)呢?人們不禁想到使用t統(tǒng)計(jì)量以分別決定每個變量是否顯著,但是這種方式是不合適的!

spring2012邢恩泉215對排除性約束的檢驗(yàn)這是因?yàn)椋粋€特定的t統(tǒng)計(jì)量只能檢驗(yàn)一個對其他參數(shù)沒有任何限制的假設(shè),此外,我們還需要對付三個結(jié)果——每一個t統(tǒng)計(jì)量對應(yīng)一個結(jié)果。怎樣在5%的顯著水平上拒絕Ho呢,應(yīng)該要求所有者3個或其中一個的t統(tǒng)計(jì)量在5%的水平上顯著嗎?這些都是用t統(tǒng)計(jì)量難以解決的問題。我們需要一個聯(lián)合檢驗(yàn)這些排除性約束的方法。spring2012邢恩泉216對排除性約束的檢驗(yàn)

spring2012邢恩泉217對排除性約束的檢驗(yàn)針對雙側(cè)對立假設(shè),bavg,hrunsyr,rbisyr中沒有一個變量具有在5%的水平上顯著的t統(tǒng)計(jì)量。于是從三個t統(tǒng)計(jì)量來看,我們不能拒絕Ho。但是這個結(jié)論是錯誤的!知道殘差平方和SSR并不能告訴我們Ho的真?zhèn)危芨嬖V我們當(dāng)我們將bavg,hrunsyr,rbisyr從模型中去掉時SSR會增加多少。因?yàn)楫?dāng)我們從模型中去掉變量時SSR總是增加的。spring2012邢恩泉218對排除性約束的檢驗(yàn)

spring2012邢恩泉219對排除性約束的檢驗(yàn)對比兩個估計(jì)模型,正如我們所想,受約束模型的SSR較大而擬合優(yōu)度較小。我們需要決定的是SSR從不受約束模型到受約束模型的增加,是否足以拒絕Ho。因此,我們需要一種方法,能合并這兩個SSR的信息,得到一個在Ho下分布已知的統(tǒng)計(jì)量。我們不妨針對一般情形推導(dǎo)這個檢驗(yàn)統(tǒng)計(jì)量,將具有k的自變量的不受約束模型寫成

spring2012邢恩泉220對排除性約束的檢驗(yàn)

spring2012邢恩泉221對排除性約束的檢驗(yàn)

spring2012邢恩泉222對排除性約束的檢驗(yàn)其中q是所施加的約束數(shù),

q=分子自由度=,即q是受約束模型與不受約束模型的自由度之差。分母中SSR要除以不受約束模型的自由度:n-k-1=分母自由度=在棒球聯(lián)盟例子中,n=353,k=5,q=3,

因此=347,=350spring2012邢恩泉223對排除性約束的檢驗(yàn)

spring2012邢恩泉224對排除性約束的檢驗(yàn)

spring2012邢恩泉225對排除性約束的檢驗(yàn)226對排除性約束的檢驗(yàn)對于棒球聯(lián)盟的例子里,分子自由度為3,分母自由度為347,顯著水平是5%的臨界值是2.60,而1%的臨界值是3.78.如果F大于3.78,我們就在1%的水平上拒絕虛擬假設(shè),如果F大于2.60那么我們就在5%的水平上拒絕虛擬假設(shè)。我們回頭來檢驗(yàn)我們本節(jié)之初的假設(shè):

spring2012邢恩泉227對排除性約束的檢驗(yàn)這個數(shù)字遠(yuǎn)大于自由度為3和347的F分布在顯著性水平為1%的臨界值,所以我們合理的拒絕bavg,hrunsyr,rbisyr對薪水沒有影響的假設(shè)。鑒于三個變量的t統(tǒng)計(jì)量都不顯著,聯(lián)合檢驗(yàn)的結(jié)果卻是顯著的,這結(jié)果有些令人吃驚。事實(shí)情況是,hrunsyr和rbisyr兩個變量高度相關(guān),而這種多重共線性,則讓我們難以發(fā)現(xiàn)每個變量的偏效應(yīng)。但是這種多重共線性對于聯(lián)合假設(shè)的F分布而言就沒有那么重要了。spring2012邢恩泉228F統(tǒng)計(jì)量和t統(tǒng)計(jì)量之間的關(guān)系

spring2012邢恩泉229F統(tǒng)計(jì)量和t統(tǒng)計(jì)量之間的關(guān)系

spring2012邢恩泉230

spring2012邢恩泉231計(jì)算F檢驗(yàn)的p值

spring2012邢恩泉232計(jì)算F檢驗(yàn)的p值P值與t統(tǒng)計(jì)量的p值具有相同的解釋:給定虛擬假設(shè)是正確的,觀察到的F值至少和我們所得到的F值一樣大的概率。很小的p值就是拒絕Ho的證據(jù)。同時,如同t檢驗(yàn)一樣,一旦計(jì)算了p值,F(xiàn)檢驗(yàn)就可以在任何顯著水平下進(jìn)行。spring2012邢恩泉233回歸整體顯著性的F統(tǒng)計(jì)量大多數(shù)回歸軟件包還對一組特定的排除性約束進(jìn)行了例行檢驗(yàn)。無論是哪個模型,這些約束都具有相同的解釋。在含有k個自變量的模型中,我們可以把虛擬假設(shè)寫成這個假設(shè)認(rèn)為解釋變量中沒有一個能影響y,用參數(shù)表示這個假設(shè)可以寫成

spring2012邢恩泉234回歸整體顯著性的F統(tǒng)計(jì)量

spring2012邢恩泉235回歸整體顯著性的F統(tǒng)計(jì)量

spring2012邢恩泉236檢驗(yàn)一般的線性約束

spring2012邢恩泉237檢驗(yàn)一般的線性約束

spring2012邢恩泉238檢驗(yàn)一般的線性約束

spring2012邢恩泉239報告回歸結(jié)果在本章結(jié)束之際,我們就如何對相對復(fù)雜的經(jīng)驗(yàn)研究報告多元回歸結(jié)果給出一些指導(dǎo)性原則。第一,所估計(jì)的OLS系數(shù)估計(jì)值總應(yīng)該報告。對于分析中的關(guān)鍵變量,你應(yīng)該對所估計(jì)的系數(shù)作出解釋。比如這個估計(jì)是不是一個彈性?是否有什么經(jīng)濟(jì)含義?第二,標(biāo)準(zhǔn)誤總是應(yīng)該與所估計(jì)的系數(shù)一起包括進(jìn)來。因?yàn)闃?biāo)準(zhǔn)誤迫使我們spring2012邢恩泉240報告回歸結(jié)果

spring2012邢恩泉241報告回歸結(jié)果納在一個表格中,表中應(yīng)該標(biāo)明因變量,而自變量則應(yīng)該列在第一位。如下面薪水-福利模型結(jié)果顯示出,分別有1個、3個、5個自變量時的回歸模型,通過表格的形式將會一目了然。spring2012邢恩泉242spring2012邢恩泉243spring2012邢恩泉244謝謝!第五章

時間序列數(shù)據(jù)的基本回歸分析時間序列數(shù)據(jù)的性質(zhì)時間序列回歸模型的例子經(jīng)典假設(shè)下OLS的有限樣本性質(zhì)函數(shù)形式、虛擬變量和指數(shù)趨勢和季節(jié)性邢恩泉245spring2012時間序列數(shù)據(jù)的性質(zhì)時間序列數(shù)據(jù)區(qū)別于橫截面數(shù)據(jù)一個明顯特點(diǎn)是,時間序列數(shù)據(jù)集是按照時間順序排列的。在社會科學(xué)里,為了分析時間序列數(shù)據(jù),我們必須承認(rèn)過去可能會影響未來,而不是相反。為了強(qiáng)調(diào)時間序列的適當(dāng)排序,我們列出了美國通脹率和失業(yè)率的部分?jǐn)?shù)據(jù)。spring2012邢恩泉246時間序列數(shù)據(jù)的性質(zhì)spring2012邢恩泉247時間序列數(shù)據(jù)的性質(zhì)橫截面數(shù)據(jù)和時間序列數(shù)據(jù)的另一個區(qū)別在于對隨機(jī)性的認(rèn)識。橫截面數(shù)據(jù)為什么被視為隨機(jī)結(jié)果,這不難理解:從總體中抽取不同的樣本,通常會得到自變量、因變量的不同取值。因此通過不同的隨機(jī)樣本計(jì)算出來的OLS估計(jì)值通常也是不同的,這就是我們認(rèn)為OLS統(tǒng)計(jì)量是隨機(jī)變量的原因。那我們該怎樣認(rèn)識時間序列的隨機(jī)性呢?很明顯,時間序列滿足作為隨機(jī)變量所要求的直觀條件spring2012邢恩泉248時間序列數(shù)據(jù)的性質(zhì)例如,我們不知道道瓊斯指數(shù)在下一個交易日收盤時會是多少,我們也不知道我國下一年的年產(chǎn)出增長會是多少。既然這些變量的結(jié)果都是無法事先預(yù)料的,它們當(dāng)然應(yīng)該被視為隨機(jī)變量。規(guī)范的,一個標(biāo)有時間角標(biāo)的隨機(jī)變量序列被稱作一個隨機(jī)過程,或時間序列過程。當(dāng)我們搜集一個時間序列數(shù)據(jù)集時,我們便得到該隨機(jī)過程的一個可能結(jié)果或?qū)崿F(xiàn)。我們只能看到一個實(shí)現(xiàn),因?yàn)槲覀儾荒茏寱r間倒轉(zhuǎn)重新開始。spring2012邢恩泉249時間序列數(shù)據(jù)的性質(zhì)然而,如果特定歷史條件有所不同,我們通常會得到這個隨機(jī)過程的另一種不同的實(shí)現(xiàn),這正是我們把時間序列看做隨機(jī)變量的原因。一個時間序列過程的所有可能的實(shí)現(xiàn)集,便相當(dāng)于橫截面分析中的總體,時間序列數(shù)據(jù)集的樣本容量就是我們觀察變量的時期數(shù)。spring2012邢恩泉250時間序列回歸模型的例子這一節(jié)我們討論時間序列模型的兩個例子,它們在經(jīng)驗(yàn)時間序列分析中很有用,而且很容易用普通最小二乘來估計(jì)。這兩個模型是:1,靜態(tài)模型2,有限分布滯后模型spring2012邢恩泉251靜態(tài)模型

spring2012邢恩泉252靜態(tài)模型

spring2012邢恩泉253靜態(tài)模型這樣得到一個靜態(tài)回歸模型:借助這個模型,我們希望能夠估計(jì)出:比如在其他條件不變的情況下,提高定罪率對犯罪互動的影響。

spring2012邢恩泉254有限分布滯后模型在有限分布滯后模型(FDL)中,我們允許一個或多個變量對y的影響有一定的時滯。例如,考察如下模型:其中g(shù)hf表示生育率,pe是個人所得稅減免的實(shí)際金額。我們希望從整體上看一看,生育孩子的決策是否與生孩子的稅收價值有關(guān)。由(5.4)看出,生育孩子的決策并非直接源于個人所得稅減免的變化。

spring2012邢恩泉255有限分布滯后模型考慮更一般的模型:

它是一個2階FDL,我們假設(shè)z在t之前所有時期都等于c,在t期z值增加到c+1,然后再t+1期再回到原水平。即有:為集中研究其他條件不變時z對y的影響,設(shè)每個時期的誤差是0,那么:

spring2012邢恩泉256有限分布滯后模型

spring2012邢恩泉257有限分布滯后模型

spring2012邢恩泉258有限分布滯后模型

spring2012邢恩泉259有限分布滯后模型

spring2012邢恩泉260有限分布滯后模型

spring2012邢恩泉261有限分布滯后模型

spring2012邢恩泉262標(biāo)注時間的慣例

spring2012邢恩泉263OLS的無偏性

spring2012邢恩泉264OLS的無偏性

spring2012邢恩泉265OLS的無偏性表10.2spring2012邢恩泉266OLS的無偏性假定TS.2(無完全共線性)

在樣本中(并因而在潛在的時間序列過程中),沒有任何自變量是恒定不變的或者是其他自變量的一個完全線性組合。在第三章,我們在橫截面數(shù)據(jù)背景中詳細(xì)討論這個假定。這個問題對時間序列數(shù)據(jù)而言在本質(zhì)上是一樣的。spring2012邢恩泉267OLS的無偏性

spring2012邢恩泉268OLS的無偏性

spring2012邢恩泉269OLS的無偏性

spring2012邢恩泉270OLS的無偏性

spring2012邢恩泉271OLS的無偏性

spring2012邢恩泉272OLS的無偏性嚴(yán)格外生的解釋變量無法對y在過去發(fā)生的變化做出反應(yīng)。農(nóng)業(yè)生產(chǎn)函數(shù)中諸如降雨量之類的因素就滿足這樣的要求:未來年份的降雨量不受現(xiàn)在或過去產(chǎn)量的影響。但是,類似于勞動投入量這種變量可能就不是嚴(yán)格外生的變量,因?yàn)樗怯赊r(nóng)民選擇的,而農(nóng)民可能根據(jù)上一年的產(chǎn)量來調(diào)整勞動投入。政策變量,如貨幣供給,福利開支,都會受到結(jié)果變量過去值的影響。spring2012邢恩泉273OLS的無偏性即使TS.3不太現(xiàn)實(shí),但為了得到OLS估計(jì)量的無偏性,我們還是要以它為出發(fā)點(diǎn)。對靜態(tài)和有限分布滯后模型的大多數(shù)分析,都通過做解釋變量非隨機(jī)這個更強(qiáng)的假定來確保TS.3的成立。spring2012邢恩泉274OLS的無偏性

spring2012邢恩泉275OLS估計(jì)量的方差和高斯-馬爾科夫定理

spring2012邢恩泉276OLS估計(jì)量的方差和高斯-馬爾科夫定理

spring2012邢恩泉277OLS估計(jì)量的方差和高斯-馬爾科夫定理

spring2012邢恩泉278OLS估計(jì)量的方差和高斯-馬爾科夫定理假定TS.1-TS.5是時間序列應(yīng)用中適當(dāng)?shù)母咚?馬爾科夫假定,但它們也有其他用途。有時這五個假定能在橫截面應(yīng)用中得到滿足,即便隨機(jī)抽樣不是一個合理假定。比如我們有一個市一級的橫截面數(shù)據(jù)集,某些解釋變量在同一個州之內(nèi)的不同城市之間可能相關(guān),比如財(cái)產(chǎn)稅率或人均福利支出。只要各個城市的誤差彼此無關(guān),不同解釋變量的相關(guān)不會導(dǎo)致驗(yàn)證高斯-馬爾

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論