完整的計量經(jīng)濟學課件 計量經(jīng)濟學課件第五章線性回歸的_第1頁
完整的計量經(jīng)濟學課件 計量經(jīng)濟學課件第五章線性回歸的_第2頁
完整的計量經(jīng)濟學課件 計量經(jīng)濟學課件第五章線性回歸的_第3頁
完整的計量經(jīng)濟學課件 計量經(jīng)濟學課件第五章線性回歸的_第4頁
完整的計量經(jīng)濟學課件 計量經(jīng)濟學課件第五章線性回歸的_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第五章 線性回歸的定式偏差,線性回歸的定式偏差,本章討論變量關系非線性、存在異常值、規(guī)律性擾動和解釋變量缺落等導致的線性回歸模型前兩條假設不成立的定式偏差,包括它們對線性回歸分析的影響、判斷和處理的方法等。,線性回歸的定式偏差,第一節(jié) 變量關系非線性 第二節(jié) 異常值 第三節(jié) 規(guī)律性擾動 第四節(jié) 解釋變量缺落 第五節(jié) 參數(shù)變化,第一節(jié) 變量關系非線性,(一)問題 (二)發(fā)現(xiàn)和判斷 (三)問題的處理和非線性回歸 1.泰勒級數(shù)展開法 2.非線性最小二乘法,(一)問題,例:變量之間的真實關系 其中 滿足 和線性回歸模型的其他假設。 使用的模型 因為 所以 不可能 始終為0。,例:變量之間的真實關系 其

2、中 滿足 和線性回歸模型的其他假設。 使用的模型 變換 后模型為 因為 不可能始終為0。 回歸分析的有效性失去了保障,(二)發(fā)現(xiàn)和判斷,用數(shù)理經(jīng)濟分析方法,對模型的關系進行更深入的分析。 根據(jù)數(shù)據(jù)及其分布圖形、散點圖進行直接判斷。 非線性變量關系的殘差序列圖,(三)問題的處理和非線性回歸,1、模型修正和變換 恢復模型的合理非線性形式 然后再變換成線性模型,泰勒級數(shù)展開法,2、泰勒級數(shù)展開法 假設一個非線性的變量關系為: 在 處對 作泰勒級數(shù)展開:,整理可得: 若令: 可以得到: 泰勒級數(shù)展開的反復迭代,3、非線性最小二乘法 (非線性最優(yōu)化等) 直接用eviews軟件進行估計。,例51:,某地總

3、消費和收入兩個變量的數(shù)據(jù)如下表所示。y為總收入,c是消費,散點圖,c在eviews中專門用于表示常數(shù)項,因此用cc表示消費。,線性回歸結(jié)果,殘差序列圖,非線性回歸結(jié)果,第二節(jié) 異常值,問題 異常值的發(fā)現(xiàn)和判斷 問題的處理,(一) 問題,現(xiàn)實經(jīng)濟中常常存在這樣的情況,一些突發(fā)事件或變化對經(jīng)濟活動或經(jīng)濟關系造成短暫的但確實很顯著的沖擊影響。 這些影響既不能被看作微小的隨機擾動,但又不會決定或改變長期的經(jīng)濟關系。這種情況在經(jīng)濟數(shù)據(jù)中反映出來,就會表現(xiàn)為一個脫離基本趨勢的異常值。 如果所研究的經(jīng)濟問題或者相關數(shù)據(jù)中存在這種情況,建立線性回歸模型時又沒有預先處理或剔除這種影響,就會表現(xiàn)為模型誤差項在相應

4、時點存在均值非0的問題。,(一) 問題的特征,例如變量 和 在長期的關系中,基本上都滿足線性回歸模型的各個假設,但在時刻 有了一個突發(fā)情況,如果仍然用線性回歸模型 這個模型的誤差項 的均值,實際上就是,(一) 問題的特征,這種情況如果不作處理,那么線性回歸結(jié)果就會差強人意。 因為此時適用普通最小二乘法的前提條件即模型的第二條假設不成立,參數(shù)估計量的性質(zhì)和相關統(tǒng)計推斷都會失效。,(二)發(fā)現(xiàn)和判斷,克服異常值對線性回歸分析影響的前提,是發(fā)現(xiàn)和判斷異常值是否存在和在哪些時點存在。 方法一是分析經(jīng)濟問題的相關背景情況,包括對經(jīng)濟現(xiàn)象、相關社會經(jīng)濟事件、以及數(shù)據(jù)序列的直接分析。 方法二是進行殘差序列分析

5、。這是從技術角度發(fā)現(xiàn)和判斷異常值問題的基本方法。因為異常值只是個別情況,因此即使模型存在異常值問題,最小二乘估計仍是一致估計量,回歸殘差仍然能很好的近似得出模型的誤差項,回歸殘差中會包含由于異常值所導致模型誤差項均值非0的信息。,(二)發(fā)現(xiàn)和判斷,基本方法:回歸殘差序列分析 具體方法:模型假定成立的前提下,殘差服從正態(tài)分布 根據(jù)殘差序列計算殘差的標準差 用 去除各個殘差,如果發(fā)現(xiàn)某個殘差 存在 的情況時,應該高度懷疑模型在時點 存在異常值問題,(二)發(fā)現(xiàn)和判斷,異常值的檢驗 注意有經(jīng)濟意義的根據(jù)。,(三)問題的處理,問題 方法:引入一個針對性的虛擬變量,定義式為 得到一個新的回歸模型,(三)問

6、題的處理,由于兩個模型的誤差項之間有關系 因此,例:p66,引入虛擬變量后的回歸結(jié)果,引入虛擬變量后的回歸殘差圖,第三節(jié) 規(guī)律性擾動,問題 問題的發(fā)現(xiàn)與判斷 問題的處理,一、問題,除了異常值問題以外,周期性或其它規(guī)律性擾動,也會使線性回歸模型的誤差項偏離零均值的假設。 此外,在橫截面數(shù)據(jù)計量經(jīng)濟分析中,觀測對象的性別、年齡、受教育程度等特征差異,也是規(guī)律性擾動因素。 這些問題不影響變量關系的總體趨勢,但都會對變量關系產(chǎn)生規(guī)律性影響,如果不預先加以處理或排除掉,就會導致誤差項均值非零的問題出現(xiàn),影響回歸分析的效果。,一、問題,例如,變量y的季度數(shù)據(jù)中,第一季度總會受到一個季節(jié)性因素的影響。 如果

7、我們忽視這種影響,用兩變量模型,或多元模型,研究y的規(guī)律,就會遇到誤差項非0問題,即,二、問題的發(fā)現(xiàn)和判斷,經(jīng)濟問題背景分析 回歸殘差序列圖分析 兩種分析相結(jié)合,確定其是否屬于規(guī)律性擾動,三、問題的處理,解決規(guī)律性擾動問題的方法之一就是對數(shù)據(jù)進行統(tǒng)計平滑處理,消除季節(jié)性或其他周期性擾動的影響。但這樣容易產(chǎn)生兩個問題:一是不能區(qū)別趨勢因素和季節(jié)性擾動,不能真正確定所研究變量關系的具體變化軌跡,二是容易導致誤差序列自相關問題。因此,它不是克服規(guī)律性擾動對線性回歸分析影響的好方法 處理規(guī)律性擾動的較好方法是引進虛擬變量,有時需要引進多個虛擬變量。,例如(1),在上個例子中,第一季度存在季節(jié)性因素的影

8、響,在這個例子中,可使用虛擬變量,把模型改為,或,那么新模型的誤差項就不再存在均值非0的問題,回歸分析的效果就能得到保證。,例如(2),如果第一季度受到一種季節(jié)性因素影響,第三季度受到另一種方向和力度不同的因素的擾動,那么可以引進兩個虛擬變量,即,和,將兩個虛擬變量引入模型,模型變?yōu)?或,對于截面數(shù)據(jù)計量分析的例子,對于截面數(shù)據(jù)計量分析中,觀測對象特征差異導致的規(guī)律性擾動,也可以利用虛擬變量加以處理。 如觀測對象的性別是一個影響因素,解決的辦法就是在模型中引進虛擬變量,即,這個虛擬變量就能解決由于觀測對象的性別因素所導致的誤差項均值非0問題。,注 意,利用虛擬變量解決擾動問題時,引進虛擬變量是

9、有限度的,因為引進一個虛擬變量就意味著要多估計一個參數(shù)和損失一個自由度,對回歸分析的效果有不利影響。 引進虛擬變量要注意“虛擬變量陷阱”。即屬性和類別的個數(shù)與虛擬變量個數(shù)一致,模型無截距。如上述季節(jié)性擾動模型同時引進對應全部4個季節(jié)的,按照類似規(guī)則定義的四個虛擬變量 那么因為這4個虛擬變量相加等于1,則當這四個變量同時出現(xiàn)在一個模型中,必然導致解釋變量嚴格線性相關,導致模型的崩潰。同樣,在考慮性別因素時,若同時引進男性和女性兩個虛擬變量也會落入虛擬變量陷阱,所以,引進虛擬變量時,應該謹慎。,例題 (考慮性別的一個回歸模型),看年薪和教齡之間的散點圖,不加虛擬變量的回歸結(jié)果,加上虛擬變量后的回歸

10、結(jié)果,第四節(jié) 解釋變量缺落,問題 發(fā)現(xiàn)與判斷 問題的處理,問題,解釋變量缺落,也是引起誤差項均值非0問題的常見原因。 所謂解釋變量缺落,就是線性回歸模型設定的變量關系中,忽略了某些重要的、對被解釋變量有趨勢性影響的因素。 被忽略的因素對被解釋變量的影響,會從誤差項中表現(xiàn)出來,導致誤差不再是純粹的隨機擾動。,例如,若真實的變量關系為,若采用變量關系,發(fā)現(xiàn)和判斷:經(jīng)濟背景分析和殘差序列分析,e,問題的處理,根據(jù)找到的原因即缺落的解釋變量,針對性的加入該缺落的解釋變量,就可以解決問題。,第五節(jié) 參數(shù)變化,問題 發(fā)現(xiàn)和判斷 問題的解決,問題,參數(shù)改變是指在考察期間(樣本數(shù)據(jù)范圍),變量關系中的參數(shù)發(fā)生

11、變化,這種問題也可以被理解為模型的穩(wěn)定性問題。 這時實際上不能用同一個線性回歸模型研究變量在整個考察期間的關系。 如果忽視這種模型參數(shù)變化,也會導致誤差項均值非0問題。,問題,以兩變量線性關系在考察期【0,t】中的t時刻參數(shù)發(fā)生變化為例。這種情況下,真實的變量關系可以用【0,t】和【t,t】兩個時期中的兩個模型分別表示,即,其中, 和 都滿足均值為0和線性回歸模型的其它假設,且,如果忽略模型參數(shù)的變化,用同一變量關系,代表y和x在整個【0,t】時期的關系,那么在兩個時期中的誤差項就分別為,和,因此,兩個時期誤差項的均值分別為,和,很顯然,除非 和 同時成立,否則 的均值不可能在兩個時期都始終為

12、0。 因此在參數(shù)發(fā)生改變時,必然導致誤差項均值非0的問 題。,二、發(fā)現(xiàn)和判斷,發(fā)現(xiàn)和判斷模型參數(shù)改變的基本方法,也是經(jīng)濟問題背景分析和殘差序列分析相結(jié)合。 如果以i為橫軸,殘差e為縱軸的殘差序列分布,存在某個時期附近轉(zhuǎn)折的情況,就應該考慮變量關系在該時刻可能存在參數(shù)改變。,鄒檢驗,以懷疑發(fā)生結(jié)構(gòu)參數(shù)變化的時點為界,把觀測樣本分為兩組(每組樣本容量必須大于模型的解釋變量數(shù)), 分別為兩個子樣本的樣本容量。 對兩個子樣本和全樣本分別進行回歸,將兩組子樣本回歸的殘差平方和加總得到 ,稱為無約束的殘差平方和,它的自由度為 全樣本的回歸殘差平方和為 ,自由度為 稱為有約束的殘差平方和。用“有約束的殘差平方和”減去“無約束的殘差平方和”,自由度為k+1。,鄒檢驗,f(k+1, ),左表給出19701991年各年的個人儲蓄y和個人收入x的數(shù)據(jù) ,均以10億美元計。 用鄒檢驗以判明從時期19701980年到時期19811991年儲蓄收入關系是否出現(xiàn)顯著變化。,f【(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論