使用eviews做線性回歸方程_第1頁(yè)
使用eviews做線性回歸方程_第2頁(yè)
使用eviews做線性回歸方程_第3頁(yè)
使用eviews做線性回歸方程_第4頁(yè)
使用eviews做線性回歸方程_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Glossary: ls(least squares)最小二乘法 R-sequared樣本決定系數(shù)(R2):值為0-1,越接近1表示擬合越好,>0.8認(rèn)為可以接受,但是R2隨因變量的增多而增大,解決這個(gè)問(wèn)題使用來(lái)調(diào)整 Adjust R-seqaured() S.E of regression回歸標(biāo)準(zhǔn)誤差 Log likelihood對(duì)數(shù)似然比:殘差越小,L值越大,越大說(shuō)明模型越正確 Durbin-Watson stat:DW統(tǒng)計(jì)量,0-4之間 Mean dependent var因變量的均值 S.D. dependent var因變量的標(biāo)準(zhǔn)差 Akaike info criter

2、ion赤池信息量(AIC)(越小說(shuō)明模型越精確) Schwarz ctiterion:施瓦茲信息量(SC)(越小說(shuō)明模型越精確) Prob(F-statistic)相伴概率 fitted(擬合值) 線性回歸的基本假設(shè): 1.自變量之間不相關(guān) 2.隨機(jī)誤差相互獨(dú)立,且服從期望為0,標(biāo)準(zhǔn)差為的正態(tài)分布 3.樣本個(gè)數(shù)多于參數(shù)個(gè)數(shù) 建模方法: ls y c x1 x2 x3 . x1 x2 x3的選擇先做各序列之間的簡(jiǎn)單相關(guān)系數(shù)計(jì)算,選擇同因變量相關(guān)系數(shù)大而自變量相關(guān)系數(shù)小的一些變量。模型的實(shí)際業(yè)務(wù)含義也有指導(dǎo)意義,比如m1同gdp肯定是相關(guān)的。 模型的建立是簡(jiǎn)單的,復(fù)雜的是模型的檢驗(yàn)、評(píng)價(jià)和之后的調(diào)

3、整、擇優(yōu)。 模型檢驗(yàn): 1)方程顯著性檢驗(yàn)(F檢驗(yàn)):模型擬合樣本的效果,即選擇的所有自變量對(duì)因變量的解釋力度 F大于臨界值則說(shuō)明拒絕0假設(shè)。 Eviews給出了拒絕0假設(shè)(所有系統(tǒng)為0的假設(shè))犯錯(cuò)誤(第一類錯(cuò)誤或錯(cuò)誤)的概率(收尾概率或相伴概率)p值,若p小于置信度(如0.05)則可以拒絕0假設(shè),即認(rèn)為方程顯著性明顯。 2)回歸系數(shù)顯著性檢驗(yàn)(t檢驗(yàn)):檢驗(yàn)每一個(gè)自變量的合理性 |t|大于臨界值表示可拒絕系數(shù)為0的假設(shè),即系數(shù)合理。t分布的自由度為n-p-1,n為樣本數(shù),p為系數(shù)位置 3)DW檢驗(yàn):檢驗(yàn)殘差序列的自相關(guān)性,檢驗(yàn)基本假設(shè)2(隨機(jī)誤差相互獨(dú)立) 殘差:模型計(jì)算值與資料實(shí)測(cè)值之差為

4、殘差 0<=dw<=dl 殘差序列正相關(guān),du<dw<4-du 無(wú)自相關(guān), 4-dl<dw<=4負(fù)相關(guān) ,若不在以上3個(gè)區(qū)間則檢驗(yàn)失敗,無(wú)法判斷 demo中的dw=0.141430 ,dl=1.73369,du=1.7786,所以存在正相關(guān) 模型評(píng)價(jià) 目的:不同模型中擇優(yōu) 1)樣本決定系數(shù)R-squared及修正的R-squared R-squared=SSR/SST 表示總離差平方和中由回歸方程可以解釋部分的比例,比例越大說(shuō)明回歸方程可以解釋的部分越多。 Adjust R-seqaured=1-(n-1)/(

5、n-k)(1-R2) 2)對(duì)數(shù)似然值(Log Likelihood,簡(jiǎn)記為L(zhǎng)) 殘差越小,L越大 3)AIC準(zhǔn)則 AIC= -2L/n+2k/n, 其中L為 log likelihood,n為樣本總量,k為參數(shù)個(gè)數(shù)。 AIC可認(rèn)為是反向修正的L,AIC越小說(shuō)明模型越精確。 4)SC準(zhǔn)則 SC= -2L/n + k*ln(n)/n 用法同AIC非常接近 預(yù)測(cè)forecast root mean sequared error(RMSE)均方根誤差 Mean Absolute Error(MAE)平均絕對(duì)誤差 這兩個(gè)變量取決于因變量的絕對(duì)值, MAPE(Mean Abs. Percent Error

6、)平均絕對(duì)百分誤差,一般的認(rèn)為MAPE<10則認(rèn)為預(yù)測(cè)精度較高 Theil Inequality Coefficient(希爾不等系數(shù))值為0-1,越小表示擬合值和真實(shí)值差異越小。 偏差率(bias Proportion),bp,反映預(yù)測(cè)值和真實(shí)值均值間的差異 方差率(variance Proportion),vp,反映預(yù)測(cè)值和真實(shí)值標(biāo)準(zhǔn)差的差異 協(xié)變率(covariance Proportion),cp,反映了剩余的誤差 以上三項(xiàng)相加等于1。 預(yù)測(cè)比較理想是bp,vp比較小,值集中在cp上。 eviews不能直接計(jì)算出預(yù)測(cè)值的置信區(qū)間,需要通過(guò)置信區(qū)間的上下限公式來(lái)計(jì)算。如何操

7、作? 其他 1)Chow檢驗(yàn) chow's breakpoint檢驗(yàn) 零假設(shè)是:兩個(gè)子樣本擬合的方程無(wú)顯著差異。有差異則說(shuō)明關(guān)系中結(jié)構(gòu)發(fā)生改變 demo中 Chow Breakpoint Test: 1977Q1 F-statistic 2.95511837136742 Prob. F(3,174) 0.0339915698953355 Log likelihood ratio 8.94507926849178 Prob. Chi-Square(3) 0.0300300700620291 p值<0.05,可拒絕0假設(shè),即認(rèn)為各個(gè)因素的影響強(qiáng)弱發(fā)生了改變。 問(wèn)題是如何才能準(zhǔn)

8、確的找到這個(gè)或這幾個(gè)斷點(diǎn)?目前的方法是找殘差擴(kuò)大超出邊線的那個(gè)點(diǎn),但這是不準(zhǔn)確的,在demo中1975Q2的殘差超出,但是chow's breakpoint檢驗(yàn)的兩個(gè)p值都接近0.2,1976Q3開(kāi)始兩個(gè)p值才小于0.05,并且有逐漸減小之勢(shì)。 chow's forecast檢驗(yàn) 用斷點(diǎn)隔斷樣本,用之前的樣本建立回歸模型,然后用這個(gè)模型對(duì)后一段進(jìn)行預(yù)測(cè),檢驗(yàn)這個(gè)模型對(duì)后續(xù)樣本的擬合程度。 0假設(shè)是:模型與后段樣本無(wú)顯著差異 demo中的1976Q4作為break point,得到兩個(gè)p值為0,即認(rèn)為兩段樣本的系數(shù)應(yīng)該是不同的。 2)自變量的選擇 testadd檢驗(yàn): 操作方法是

9、: eqation name.testadd ser1 ser2 . 0假設(shè):應(yīng)該將該變量引入方程 檢驗(yàn)統(tǒng)計(jì)量:wald,LR 結(jié)果:通過(guò)兩個(gè)p值(Prob. F,Prob Chi-sequare)看是否拒絕原假設(shè) testdrop檢驗(yàn): 操作方法是: eqation name.testdrop ser1 ser2 . 0假設(shè):應(yīng)該將該變量剔除 檢驗(yàn)統(tǒng)計(jì)量:wald,LR 結(jié)果:通過(guò)兩個(gè)p值(Prob. F,Prob Chi-sequare)看是否拒絕原假設(shè) 含定性變量的回歸模型 分為:自變量含定性變量,因變量含定性變量。后一種情況較為復(fù)雜 建立dummy 變量(名義變量):用D表示 當(dāng)變量有

10、m種情況時(shí),需要引入m-1個(gè)dummy變量 處理辦法:把定性變量定義成0.1.2等數(shù)值后和一般變量同樣處理 常見(jiàn)問(wèn)題及對(duì)策 1)多重共線性(multicollinearity): p個(gè)回歸變量之間存在嚴(yán)格或近似的線性關(guān)系 診斷方法: 1.如果模型的R-sequared很大,F(xiàn)檢驗(yàn)通過(guò),但是某些系統(tǒng)的t檢驗(yàn)沒(méi)通過(guò) 2.某些自變量系數(shù)之間的簡(jiǎn)單相關(guān)系數(shù)很大 3.回歸系數(shù)符號(hào)與簡(jiǎn)單相關(guān)系統(tǒng)符號(hào)相反 以上3條發(fā)生都有理由懷疑存在多重共線性 方差擴(kuò)大因子(variance inflation factor VIFj)是診斷多重共線性的常用手段。 VIFj為矩陣(X X)-1第j個(gè)對(duì)角元素cjj=1/(1

11、-R2j)(j=1,2,p) 其中R2j為以作為cj因變量,其余p-1個(gè)自變量作為自變量建立多元回歸模型所得的樣本決定系數(shù),所以R2j越大則說(shuō)明自變量之間自相關(guān)性越大,此時(shí)也越大,可以認(rèn)為VIFj>10(R2j>0.9)則存在多重共線性。 還可以使用VIFj的平均數(shù)作為判斷標(biāo)準(zhǔn),如果avg(VIFj)遠(yuǎn)大于10則認(rèn)為存在多重共線性。 eviews里如何使用VIF法?-建立方程,然后手工建立scalar vif。demo中GDP和PR的vif為66,存在多重共線性? 只有一個(gè)自變量的方程是否會(huì)失效?此時(shí)dw值只有0.01遠(yuǎn)小于dl,說(shuō)明GDP遠(yuǎn)遠(yuǎn)不是PR能決定的。結(jié)合

12、testdrop將PR去除,兩個(gè)p值為0,說(shuō)明不能把PR去除。 在eviews中當(dāng)自變量存在嚴(yán)重的多重共線性時(shí)將不能給出參數(shù)估計(jì)值,而會(huì)報(bào)錯(cuò):nearly singular matrix 多重共線性的處理: 1.剔除自變量,選擇通過(guò)testdrop實(shí)驗(yàn),并且vif值最大的那個(gè) 2.差分法,在建立方程時(shí)填入 ls m1-m1(-1) c gdp-gdp(-1) pr-pr(-1)。m1(-1)表示上一個(gè)m1 差分法常常會(huì)丟失一些信息,使用時(shí)應(yīng)謹(jǐn)慎。 demo中得到的模型,c 的p值0.11, pr-pr(-1)的p值為0.60,說(shuō)明參數(shù)無(wú)效。 2)異方差性(Herteroskedasticity

13、) 即隨機(jī)誤差項(xiàng)不滿足基本假設(shè)的同方差性,異方差性說(shuō)明隨機(jī)誤差中有些項(xiàng)對(duì)因變量的影響是不同于其他項(xiàng)的。 一般地,截面數(shù)據(jù)做樣本時(shí)出現(xiàn)異方差性的可能較大,或者說(shuō)都存在異方差性 若存在異方差性,用OLS估計(jì)出來(lái)的參數(shù),可能導(dǎo)致估計(jì)值雖然是無(wú)偏的,但不是有效的。 (截面數(shù)據(jù)就是同一時(shí)間點(diǎn)上各個(gè)主體的數(shù)據(jù),比如2007年各省的GDP數(shù)據(jù)放在一起就是一組截面數(shù)據(jù) 與之相對(duì)的是時(shí)間序列數(shù)據(jù) 如河北省從00年到07年的數(shù)據(jù)就是一組時(shí)間序列數(shù)據(jù) 兩者綜合叫面板數(shù)據(jù) ) 00年到07年各省的數(shù)據(jù)綜合在一起就叫面板數(shù)據(jù) 診斷方法: 1.圖示法,以因變量作為橫坐標(biāo),以殘差項(xiàng)為縱坐標(biāo),根據(jù)散點(diǎn)圖判斷是否存在相關(guān)性。

14、(選擇兩個(gè)序列作為group打開(kāi),先選中的序列將作為group的縱坐標(biāo)) 2.戈里瑟(Glejser)檢驗(yàn): ? 3.懷特(White)檢驗(yàn): 用e2作為因變量,原先的自變量及自變量的平方(還可以加上各自變量之間的相互乘積)作為自變量 建立模型。 懷特檢驗(yàn)的統(tǒng)計(jì)量為:m=n*R2(n是樣本容量,R2是新模型的擬合優(yōu)度), m 2(k) k為新模型除常數(shù)項(xiàng)之外的自變量個(gè)數(shù) 零假設(shè):模型不存在異方差性 操作:在估計(jì)出來(lái)的方程中,view-residual tests-White Herteroskedasticity(no cross/cross) 分別為是否含自變量交叉項(xiàng) demo中的兩個(gè)p值為

15、0,所以拒絕零假設(shè),認(rèn)為存在嚴(yán)重的異方差性。 異方差性的處理: 1.加權(quán)最小二乘法(WLS weighted least sequare)。 最常用的方法,一般用于異方差形式可知的情況。基本思路是賦予殘差的每個(gè)觀測(cè)值不同的權(quán)數(shù),從而使模型的隨機(jī)誤差項(xiàng)具有相同的方差。 2.自相關(guān)相容協(xié)方差(Heteroskedasticity and antocorrelation consistent convariances HAC) 用于異方差性形式未知時(shí)。在建模時(shí)在options中選擇Heteroskedasticity consistent convariances 再?gòu)膚hite,newey-wes

16、t中選擇一種。 HAC不改變參數(shù)的點(diǎn)估計(jì),改變的知識(shí)估計(jì)標(biāo)準(zhǔn)差。如何改變標(biāo)準(zhǔn)差? 3)自相關(guān)性 殘差項(xiàng)不滿足相互獨(dú)立的假設(shè)。一般的,經(jīng)濟(jì)時(shí)間序列中自相關(guān)現(xiàn)象較為常見(jiàn),這主要是經(jīng)濟(jì)變量的滯后性帶來(lái)的。 自相關(guān)性將導(dǎo)致參數(shù)估計(jì)值雖然是無(wú)偏的,但不是有效的。 診斷方法: 1.繪制殘差序列圖。如果序列圖成鋸齒形或循環(huán)狀的變化,可以判定存在自相關(guān) 2.回歸檢驗(yàn)法: 以殘差e(t)為被解釋變量,以各種可能的相關(guān)變量,如 e(t-1) e(t-2)作為自變量,選擇顯著的最優(yōu)擬合模型作為自相關(guān)的形式。demo中以 ls residm1 c residm1(-1) residm1(-2)后 發(fā)現(xiàn)c的p值為0.5

17、4,做testdrop實(shí)驗(yàn),兩個(gè)p值都>0.5 可以將c剔除。剔除c后: Dependent Variable: RESIDM1 Method: Least Squares Date: 12/29/07 Time: 11:26 Sample (adjusted): 1952Q3 1996Q4 Included observations: 178 after adjustments Variable Coefficient Std. Error t-Statistic Prob. RESIDM1(-1) 1.215361 0.077011 15.78173 0.0000 RESIDM1(-2) -0.271664 0.078272 -3.470763 0.0007 R-squared 0.868569 Mean dependent var 0.011855 Adjusted R-squared 0.867823 S.D. dependent var 26.91138 S.E. of regression 9.783961

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論