回歸分析回歸診斷PPT學習教案_第1頁
回歸分析回歸診斷PPT學習教案_第2頁
回歸分析回歸診斷PPT學習教案_第3頁
回歸分析回歸診斷PPT學習教案_第4頁
回歸分析回歸診斷PPT學習教案_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、會計學1回歸分析回歸診斷回歸分析回歸診斷n數(shù)據(jù)也需要考慮n還有模型的設定第1頁/共120頁第2頁/共120頁第3頁/共120頁第4頁/共120頁6線性回歸模型中的異常點分析第5頁/共120頁出異常,這通常是我們的研究興趣所在。第6頁/共120頁大研究者的重視,自Bernoulli首次提出了異常點的概念,接下來對異常點的概念、類型以及處理問題的討論一直沒有停止過。第7頁/共120頁第8頁/共120頁計量檢驗方法及影響分析研究。第9頁/共120頁第10頁/共120頁第11頁/共120頁第12頁/共120頁第13頁/共120頁第14頁/共120頁第15頁/共120頁第16頁/共120頁第17頁/共1

2、20頁異常點第18頁/共120頁第19頁/共120頁第20頁/共120頁第21頁/共120頁第22頁/共120頁第23頁/共120頁已知20條河流流域的有關測量數(shù)據(jù).研究者感興趣的是,河流周邊地區(qū)土地的利用程度對水污染(平均氮濃度)有何影響河流農田覆蓋率森林覆蓋率住宅地占土地總面積百分比工業(yè)及商業(yè)用地占總面積百分比春夏秋冬各季度采集到的樣本的平均氮濃度mg/升RiverAgrForestRsdntialComIndlNitrogenOlean26631.20.291.1Cassadaga29570.70.091.01Oatka54261.80.581.9Neversink2841.91.981

3、Hackensack32729.43.111.99Wappinger19613.40.561.42Fishkill16605.61.112.04Honeoye 40431.30.241.65Susquehanna28621.10.151.01Chenango26600.90.231.21East Canada6840.50.120.73Saranac3810.80.350.8Ausable2890.70.350.76Black6820.50.150.87Schoharie22700.90.220.8Raquette4750.40.180.87 Oswegatchie21560.50.130.6

4、6Cohocton40491.10.131.25第24頁/共120頁第25頁/共120頁回歸統(tǒng)計回歸統(tǒng)計Multiple RMultiple R0.8422570.842257R SquareR Square0.7093980.709398Adjusted R Adjusted R SquareSquare0.6319040.631904標準誤差標準誤差0.2649190.264919觀測值觀測值2020方差分析方差分析dfdfSSSSMSMSF FSignificanSignificance Fce F回歸分析回歸分析4 42.5698462.5698460.6424620.6424629.

5、1542319.1542310.0005960.000596殘差殘差15151.0527291.0527290.0701820.070182總計總計19193.6225753.622575CoefficienCoefficientsts標準誤差標準誤差t Statt StatP-valueP-valueLower 95%Lower 95%Upper 95%Upper 95%InterceptIntercept1.7222141.7222141.2340821.2340821.3955431.3955430.1831690.183169-0.90817-0.908174.3525964.3525

6、96X 1X 10.0058090.0058090.0150340.0150340.38640.38640.7046260.704626-0.02624-0.026240.0378530.037853X 2X 2-0.01297-0.012970.0139310.013931-0.93083-0.930830.366680.36668-0.04266-0.042660.0167260.016726X 3X 3-0.00723-0.007230.033830.03383-0.21362-0.213620.833720.83372-0.07933-0.079330.064880.06488X 4X

7、 40.3050280.3050280.1638170.1638171.8620071.8620070.082310.08231-0.04414-0.044140.6541950.654195第26頁/共120頁回歸統(tǒng)計回歸統(tǒng)計Multiple RMultiple R0.9250640.925064R SquareR Square0.8557440.855744Adjusted R Adjusted R SquareSquare0.8145280.814528標準誤差標準誤差0.1925040.192504觀測值觀測值1919方差分析方差分析dfdfSSSSMSMSF F回歸分析回歸分析4 4

8、3.0776523.0776520.7694130.76941320.7624220.76242殘差殘差14140.5188110.5188110.0370580.037058總計總計18183.5964633.596463CoefficientsCoefficients標準誤差標準誤差t Statt StatP-valueP-valueInterceptIntercept1.0994711.0994710.9116360.9116361.2060421.2060420.2477880.247788X Variable 1X Variable 10.0101370.0101370.010984

9、0.0109840.9228730.9228730.3717050.371705X Variable 2X Variable 2-0.00759-0.007590.0102220.010222-0.74244-0.742440.4700980.470098X Variable 3X Variable 3-0.12379-0.123790.0393370.039337-3.14698-3.146980.0071340.007134X Variable 4X Variable 41.5289561.5289560.3437190.3437194.4482734.4482730.0005510.00

10、0551第27頁/共120頁第28頁/共120頁第29頁/共120頁第30頁/共120頁目標不同,所考慮的影響亦有所不同。強影響點第31頁/共120頁第32頁/共120頁第33頁/共120頁第34頁/共120頁有影響的觀測值(圖示)第35頁/共120頁第36頁/共120頁有影響的觀測值存在影響值的趨勢第37頁/共120頁不存在影響值的趨勢有影響的觀測值存在影響值的趨勢第38頁/共120頁第39頁/共120頁第40頁/共120頁第41頁/共120頁第42頁/共120頁第43頁/共120頁第44頁/共120頁第45頁/共120頁第46頁/共120頁第47頁/共120頁第48頁/共120頁第49頁/

11、共120頁影響的各種度量第50頁/共120頁第51頁/共120頁第52頁/共120頁第53頁/共120頁第54頁/共120頁影響點第55頁/共120頁第56頁/共120頁第57頁/共120頁第58頁/共120頁第59頁/共120頁第60頁/共120頁第61頁/共120頁第62頁/共120頁第63頁/共120頁第64頁/共120頁第65頁/共120頁第66頁/共120頁第67頁/共120頁不能說明全部變量間的線性無關的,因為線性關系可能存在與多個預測變量之間.第68頁/共120頁第69頁/共120頁能是數(shù)據(jù)中含信息量最多的點。第70頁/共120頁第71頁/共120頁誤、刪除異常點或降低他們的權重

12、、變換數(shù)據(jù)、考慮不同的模型、重新收集或補充更多的數(shù)據(jù)。第72頁/共120頁第73頁/共120頁 設 Y=0+ 1X1+v (*) 為正確模型,但卻估計了 Y=0+1X1+2X2+ (*) 如果2=0,則(*)與(*)相同,因此,可將(*)式視為以2=0為約束的(*)式的特殊形式。包含無關變量偏誤包含無關變量偏誤第74頁/共120頁 由于所有的經典假設都滿足,因此對 Y=0+1X1+2X2+ (*)式進行OLS估計,可得到無偏無偏且一致一致的估計量。 但是,但是,OLS估計量卻不具有最小方差性。估計量卻不具有最小方差性。Y=0+ 1X1+v 中X1的方差:2121)(ixVarY=0+1X1+2

13、X2+ 中X1的方差:)1 ()(2212121xxirxVar 當X1與X2完全線性無關時: )()(11VarVar 否則:)()(11VarVar注意:注意:第75頁/共120頁2. 遺漏解釋變量遺漏解釋變量第76頁/共120頁22110XXY而我們將模型設定為 vXY110即設定模型時漏掉了一個相關的解釋變量。 動態(tài)設定偏誤動態(tài)設定偏誤:遺漏相關變量表現(xiàn)為對Y或X滯后項的遺漏 。 第77頁/共120頁 設正確的模型為 Y=0+1X1+2X2+卻對 Y=0+ 1X1+v進行回歸,得2111iiixyx遺漏相關變量偏誤遺漏相關變量偏誤第78頁/共120頁將正確模型 Y=0+1X1+2X2+

14、 的離差形式 iiiixxy2211代入2111iiixyx得21121212121221112111)()(iiiiiiiiiiiiiixxxxxxxxxxyx(1)如果漏掉的X2與X1相關,則式中的第二項在小樣本下求期望與大樣本下求概率極限都不會為零,從而使得OLSOLS估估計量在小樣本下有偏,在大樣本下非一致計量在小樣本下有偏,在大樣本下非一致。第79頁/共120頁 (2)如果X2與X1不相關,則1的估計滿足無偏性與一致性;但這時0的估計卻是有偏的。 由 Y=0+ 1X1+v 得2121)(ixVar由 Y=0+1X1+2X2+ 得 )1 ()()(22122212221222121xx

15、iiiiiirxxxxxxVar第80頁/共120頁 例如,如果“真實”的回歸函數(shù)為 eXAXY2121但卻將模型設定為 vXXY22110 顯然,兩者的參數(shù)具有完全不同的經濟含義,且估計結果一般也是不相同的。 3.模型形式的誤設模型形式的誤設第81頁/共120頁第82頁/共120頁 可用可用t 檢驗與檢驗與F檢驗完成。檢驗完成。 檢驗的基本思想檢驗的基本思想: :如果模型中誤選了無關變量,則其系數(shù)的真值應為零。因此,只須對無關變量系數(shù)的顯著性進行檢驗。 t t檢驗檢驗:檢驗某1個變量是否應包括在模型中; F F檢驗檢驗:檢驗若干個變量是否應同時包括在模型中 模型設定偏誤的檢驗模型設定偏誤的檢

16、驗 1、檢驗是否含有無關變量、檢驗是否含有無關變量 第83頁/共120頁2、檢驗是否有相關變量的遺漏或函數(shù)形式設定偏、檢驗是否有相關變量的遺漏或函數(shù)形式設定偏誤誤第84頁/共120頁趨勢變化趨勢變化 :模型設定時可能遺漏了一隨著時間的推移而持續(xù)上升的變量 循環(huán)變化:循環(huán)變化:模型設定時可能遺漏了一隨著時間的推移而呈現(xiàn)循環(huán)變化的變量 第85頁/共120頁 模型函數(shù)形式設定偏誤時殘差序列呈現(xiàn)正負模型函數(shù)形式設定偏誤時殘差序列呈現(xiàn)正負交替變化交替變化 第86頁/共120頁 3、檢驗是否有相關變量的遺漏或函數(shù)形式、檢驗是否有相關變量的遺漏或函數(shù)形式設定偏誤設定偏誤第87頁/共120頁 例如例如,先估計

17、 Y=0+ 1X1+v 得 110XY3221110YYXY 然后再利用F F檢驗檢驗來判斷是否增加這些“替代”變量。 若僅增加一個“替代”變量,也可通過t t檢驗檢驗來判斷。 第88頁/共120頁313212110XXXY因此,如果設定了線性模型,就意味著遺漏了相關變量X12、 X13 ,等等。 因此,在一元回歸中,可通過檢驗各高次冪參數(shù)的顯著性來判斷是否將非線性模型誤設成了線性模型。(*) RESET檢驗也可用來檢驗函數(shù)形式設定偏誤的問題。檢驗也可用來檢驗函數(shù)形式設定偏誤的問題。 第89頁/共120頁 對多元回歸,非線性函數(shù)可能是關于若干個或全部解釋變量的非線性,這時可按遺漏變量的程序進行

18、檢驗。 例如,估計 Y=0+1X1+2X2+但卻懷疑真實的函數(shù)形式是非線性的。322122110YYXXY 這時,只需以估計出的的若干次冪為“替代”變量,進行類似于如下模型的估計再判斷各“替代”變量的參數(shù)是否顯著地不為零即可。 第90頁/共120頁ttGDPM020. 091.152 例例:建立了中國商品進口M與GDP的一元線性關系:并發(fā)現(xiàn)具有強烈的一階自相關性。 序列相關性的主要原因之一可能就是建模時遺漏了重要的相關變量造成的。 下面進行RESET檢驗。 R2=0.9484第91頁/共120頁320759. 80028. 0072. 0860. 3tttMEMGDPM (-0.085) (8

19、.274) (-6.457) (6.692) R2=0.9842)1(/()1 (/ )(222qknRqRRFURU5 .22)424/()984. 01 (2/ )948. 0984. 0( 在=5%下,查得臨界值F0.05(2, 20)=3.49判斷:拒絕原模型與引入新變量的模型可決系數(shù)無顯著差異的假設,表明原模型確實存在遺漏相關變量的設定偏誤。 第92頁/共120頁第93頁/共120頁 因此,只須檢驗只須檢驗IVIV估計量與估計量與OLSOLS估計量是否有估計量是否有顯著差異來檢驗解釋變量與隨機擾動項是否同期顯著差異來檢驗解釋變量與隨機擾動項是否同期無關。無關。對一元線性回歸模型 Y=

20、0+1X+所檢驗的假設是 H0:X與無同期相關。 第94頁/共120頁設一元樣本回歸模型為 iiieXY10以Z為工具變量,則IV估計量為: iiiixzyziiiiiiiiixzezxzexz11)(*) (*)式表明,IV估計量與OLS估計量無差異當且僅當ziei=0,即工具變量與OLS估計的殘差項無關。 第95頁/共120頁檢驗時,求Y關于X與Z的OLS回歸式: iiiZXY10 在實際檢驗中,豪斯蔓檢驗主要針對多元回歸進行,而且也不是直接對工具變量回歸,而是對以各工具變量為自變量、分別以各解釋變量為因變量進行回歸。 第96頁/共120頁如對二元回歸模型 iiiiXXY22110iiiiiXXXXY221122110 通過增加解釋變量的增加解釋變量的F F檢驗檢驗,檢驗聯(lián)合假設: H0:1=2=0 。 拒絕原假設,就意味著(*)式中的解釋變量與隨機擾動項相關。 (*)第97頁/共120頁模型設定的方法模型設

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論