回歸分析回歸診斷PPT學(xué)習(xí)教案_第1頁
回歸分析回歸診斷PPT學(xué)習(xí)教案_第2頁
回歸分析回歸診斷PPT學(xué)習(xí)教案_第3頁
回歸分析回歸診斷PPT學(xué)習(xí)教案_第4頁
回歸分析回歸診斷PPT學(xué)習(xí)教案_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、會計學(xué)1回歸分析回歸診斷回歸分析回歸診斷n數(shù)據(jù)也需要考慮n還有模型的設(shè)定第1頁/共120頁第2頁/共120頁第3頁/共120頁第4頁/共120頁6線性回歸模型中的異常點分析第5頁/共120頁出異常,這通常是我們的研究興趣所在。第6頁/共120頁大研究者的重視,自Bernoulli首次提出了異常點的概念,接下來對異常點的概念、類型以及處理問題的討論一直沒有停止過。第7頁/共120頁第8頁/共120頁計量檢驗方法及影響分析研究。第9頁/共120頁第10頁/共120頁第11頁/共120頁第12頁/共120頁第13頁/共120頁第14頁/共120頁第15頁/共120頁第16頁/共120頁第17頁/共1

2、20頁異常點第18頁/共120頁第19頁/共120頁第20頁/共120頁第21頁/共120頁第22頁/共120頁第23頁/共120頁已知20條河流流域的有關(guān)測量數(shù)據(jù).研究者感興趣的是,河流周邊地區(qū)土地的利用程度對水污染(平均氮濃度)有何影響河流農(nóng)田覆蓋率森林覆蓋率住宅地占土地總面積百分比工業(yè)及商業(yè)用地占總面積百分比春夏秋冬各季度采集到的樣本的平均氮濃度mg/升RiverAgrForestRsdntialComIndlNitrogenOlean26631.20.291.1Cassadaga29570.70.091.01Oatka54261.80.581.9Neversink2841.91.981

3、Hackensack32729.43.111.99Wappinger19613.40.561.42Fishkill16605.61.112.04Honeoye 40431.30.241.65Susquehanna28621.10.151.01Chenango26600.90.231.21East Canada6840.50.120.73Saranac3810.80.350.8Ausable2890.70.350.76Black6820.50.150.87Schoharie22700.90.220.8Raquette4750.40.180.87 Oswegatchie21560.50.130.6

4、6Cohocton40491.10.131.25第24頁/共120頁第25頁/共120頁回歸統(tǒng)計回歸統(tǒng)計Multiple RMultiple R0.8422570.842257R SquareR Square0.7093980.709398Adjusted R Adjusted R SquareSquare0.6319040.631904標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差0.2649190.264919觀測值觀測值2020方差分析方差分析dfdfSSSSMSMSF FSignificanSignificance Fce F回歸分析回歸分析4 42.5698462.5698460.6424620.6424629.

5、1542319.1542310.0005960.000596殘差殘差15151.0527291.0527290.0701820.070182總計總計19193.6225753.622575CoefficienCoefficientsts標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差t Statt StatP-valueP-valueLower 95%Lower 95%Upper 95%Upper 95%InterceptIntercept1.7222141.7222141.2340821.2340821.3955431.3955430.1831690.183169-0.90817-0.908174.3525964.3525

6、96X 1X 10.0058090.0058090.0150340.0150340.38640.38640.7046260.704626-0.02624-0.026240.0378530.037853X 2X 2-0.01297-0.012970.0139310.013931-0.93083-0.930830.366680.36668-0.04266-0.042660.0167260.016726X 3X 3-0.00723-0.007230.033830.03383-0.21362-0.213620.833720.83372-0.07933-0.079330.064880.06488X 4X

7、 40.3050280.3050280.1638170.1638171.8620071.8620070.082310.08231-0.04414-0.044140.6541950.654195第26頁/共120頁回歸統(tǒng)計回歸統(tǒng)計Multiple RMultiple R0.9250640.925064R SquareR Square0.8557440.855744Adjusted R Adjusted R SquareSquare0.8145280.814528標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差0.1925040.192504觀測值觀測值1919方差分析方差分析dfdfSSSSMSMSF F回歸分析回歸分析4 4

8、3.0776523.0776520.7694130.76941320.7624220.76242殘差殘差14140.5188110.5188110.0370580.037058總計總計18183.5964633.596463CoefficientsCoefficients標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差t Statt StatP-valueP-valueInterceptIntercept1.0994711.0994710.9116360.9116361.2060421.2060420.2477880.247788X Variable 1X Variable 10.0101370.0101370.010984

9、0.0109840.9228730.9228730.3717050.371705X Variable 2X Variable 2-0.00759-0.007590.0102220.010222-0.74244-0.742440.4700980.470098X Variable 3X Variable 3-0.12379-0.123790.0393370.039337-3.14698-3.146980.0071340.007134X Variable 4X Variable 41.5289561.5289560.3437190.3437194.4482734.4482730.0005510.00

10、0551第27頁/共120頁第28頁/共120頁第29頁/共120頁第30頁/共120頁目標(biāo)不同,所考慮的影響亦有所不同。強影響點第31頁/共120頁第32頁/共120頁第33頁/共120頁第34頁/共120頁有影響的觀測值(圖示)第35頁/共120頁第36頁/共120頁有影響的觀測值存在影響值的趨勢第37頁/共120頁不存在影響值的趨勢有影響的觀測值存在影響值的趨勢第38頁/共120頁第39頁/共120頁第40頁/共120頁第41頁/共120頁第42頁/共120頁第43頁/共120頁第44頁/共120頁第45頁/共120頁第46頁/共120頁第47頁/共120頁第48頁/共120頁第49頁/

11、共120頁影響的各種度量第50頁/共120頁第51頁/共120頁第52頁/共120頁第53頁/共120頁第54頁/共120頁影響點第55頁/共120頁第56頁/共120頁第57頁/共120頁第58頁/共120頁第59頁/共120頁第60頁/共120頁第61頁/共120頁第62頁/共120頁第63頁/共120頁第64頁/共120頁第65頁/共120頁第66頁/共120頁第67頁/共120頁不能說明全部變量間的線性無關(guān)的,因為線性關(guān)系可能存在與多個預(yù)測變量之間.第68頁/共120頁第69頁/共120頁能是數(shù)據(jù)中含信息量最多的點。第70頁/共120頁第71頁/共120頁誤、刪除異常點或降低他們的權(quán)重

12、、變換數(shù)據(jù)、考慮不同的模型、重新收集或補充更多的數(shù)據(jù)。第72頁/共120頁第73頁/共120頁 設(shè) Y=0+ 1X1+v (*) 為正確模型,但卻估計了 Y=0+1X1+2X2+ (*) 如果2=0,則(*)與(*)相同,因此,可將(*)式視為以2=0為約束的(*)式的特殊形式。包含無關(guān)變量偏誤包含無關(guān)變量偏誤第74頁/共120頁 由于所有的經(jīng)典假設(shè)都滿足,因此對 Y=0+1X1+2X2+ (*)式進(jìn)行OLS估計,可得到無偏無偏且一致一致的估計量。 但是,但是,OLS估計量卻不具有最小方差性。估計量卻不具有最小方差性。Y=0+ 1X1+v 中X1的方差:2121)(ixVarY=0+1X1+2

13、X2+ 中X1的方差:)1 ()(2212121xxirxVar 當(dāng)X1與X2完全線性無關(guān)時: )()(11VarVar 否則:)()(11VarVar注意:注意:第75頁/共120頁2. 遺漏解釋變量遺漏解釋變量第76頁/共120頁22110XXY而我們將模型設(shè)定為 vXY110即設(shè)定模型時漏掉了一個相關(guān)的解釋變量。 動態(tài)設(shè)定偏誤動態(tài)設(shè)定偏誤:遺漏相關(guān)變量表現(xiàn)為對Y或X滯后項的遺漏 。 第77頁/共120頁 設(shè)正確的模型為 Y=0+1X1+2X2+卻對 Y=0+ 1X1+v進(jìn)行回歸,得2111iiixyx遺漏相關(guān)變量偏誤遺漏相關(guān)變量偏誤第78頁/共120頁將正確模型 Y=0+1X1+2X2+

14、 的離差形式 iiiixxy2211代入2111iiixyx得21121212121221112111)()(iiiiiiiiiiiiiixxxxxxxxxxyx(1)如果漏掉的X2與X1相關(guān),則式中的第二項在小樣本下求期望與大樣本下求概率極限都不會為零,從而使得OLSOLS估估計量在小樣本下有偏,在大樣本下非一致計量在小樣本下有偏,在大樣本下非一致。第79頁/共120頁 (2)如果X2與X1不相關(guān),則1的估計滿足無偏性與一致性;但這時0的估計卻是有偏的。 由 Y=0+ 1X1+v 得2121)(ixVar由 Y=0+1X1+2X2+ 得 )1 ()()(22122212221222121xx

15、iiiiiirxxxxxxVar第80頁/共120頁 例如,如果“真實”的回歸函數(shù)為 eXAXY2121但卻將模型設(shè)定為 vXXY22110 顯然,兩者的參數(shù)具有完全不同的經(jīng)濟含義,且估計結(jié)果一般也是不相同的。 3.模型形式的誤設(shè)模型形式的誤設(shè)第81頁/共120頁第82頁/共120頁 可用可用t 檢驗與檢驗與F檢驗完成。檢驗完成。 檢驗的基本思想檢驗的基本思想: :如果模型中誤選了無關(guān)變量,則其系數(shù)的真值應(yīng)為零。因此,只須對無關(guān)變量系數(shù)的顯著性進(jìn)行檢驗。 t t檢驗檢驗:檢驗?zāi)?個變量是否應(yīng)包括在模型中; F F檢驗檢驗:檢驗若干個變量是否應(yīng)同時包括在模型中 模型設(shè)定偏誤的檢驗?zāi)P驮O(shè)定偏誤的檢

16、驗 1、檢驗是否含有無關(guān)變量、檢驗是否含有無關(guān)變量 第83頁/共120頁2、檢驗是否有相關(guān)變量的遺漏或函數(shù)形式設(shè)定偏、檢驗是否有相關(guān)變量的遺漏或函數(shù)形式設(shè)定偏誤誤第84頁/共120頁趨勢變化趨勢變化 :模型設(shè)定時可能遺漏了一隨著時間的推移而持續(xù)上升的變量 循環(huán)變化:循環(huán)變化:模型設(shè)定時可能遺漏了一隨著時間的推移而呈現(xiàn)循環(huán)變化的變量 第85頁/共120頁 模型函數(shù)形式設(shè)定偏誤時殘差序列呈現(xiàn)正負(fù)模型函數(shù)形式設(shè)定偏誤時殘差序列呈現(xiàn)正負(fù)交替變化交替變化 第86頁/共120頁 3、檢驗是否有相關(guān)變量的遺漏或函數(shù)形式、檢驗是否有相關(guān)變量的遺漏或函數(shù)形式設(shè)定偏誤設(shè)定偏誤第87頁/共120頁 例如例如,先估計

17、 Y=0+ 1X1+v 得 110XY3221110YYXY 然后再利用F F檢驗檢驗來判斷是否增加這些“替代”變量。 若僅增加一個“替代”變量,也可通過t t檢驗檢驗來判斷。 第88頁/共120頁313212110XXXY因此,如果設(shè)定了線性模型,就意味著遺漏了相關(guān)變量X12、 X13 ,等等。 因此,在一元回歸中,可通過檢驗各高次冪參數(shù)的顯著性來判斷是否將非線性模型誤設(shè)成了線性模型。(*) RESET檢驗也可用來檢驗函數(shù)形式設(shè)定偏誤的問題。檢驗也可用來檢驗函數(shù)形式設(shè)定偏誤的問題。 第89頁/共120頁 對多元回歸,非線性函數(shù)可能是關(guān)于若干個或全部解釋變量的非線性,這時可按遺漏變量的程序進(jìn)行

18、檢驗。 例如,估計 Y=0+1X1+2X2+但卻懷疑真實的函數(shù)形式是非線性的。322122110YYXXY 這時,只需以估計出的的若干次冪為“替代”變量,進(jìn)行類似于如下模型的估計再判斷各“替代”變量的參數(shù)是否顯著地不為零即可。 第90頁/共120頁ttGDPM020. 091.152 例例:建立了中國商品進(jìn)口M與GDP的一元線性關(guān)系:并發(fā)現(xiàn)具有強烈的一階自相關(guān)性。 序列相關(guān)性的主要原因之一可能就是建模時遺漏了重要的相關(guān)變量造成的。 下面進(jìn)行RESET檢驗。 R2=0.9484第91頁/共120頁320759. 80028. 0072. 0860. 3tttMEMGDPM (-0.085) (8

19、.274) (-6.457) (6.692) R2=0.9842)1(/()1 (/ )(222qknRqRRFURU5 .22)424/()984. 01 (2/ )948. 0984. 0( 在=5%下,查得臨界值F0.05(2, 20)=3.49判斷:拒絕原模型與引入新變量的模型可決系數(shù)無顯著差異的假設(shè),表明原模型確實存在遺漏相關(guān)變量的設(shè)定偏誤。 第92頁/共120頁第93頁/共120頁 因此,只須檢驗只須檢驗IVIV估計量與估計量與OLSOLS估計量是否有估計量是否有顯著差異來檢驗解釋變量與隨機擾動項是否同期顯著差異來檢驗解釋變量與隨機擾動項是否同期無關(guān)。無關(guān)。對一元線性回歸模型 Y=

20、0+1X+所檢驗的假設(shè)是 H0:X與無同期相關(guān)。 第94頁/共120頁設(shè)一元樣本回歸模型為 iiieXY10以Z為工具變量,則IV估計量為: iiiixzyziiiiiiiiixzezxzexz11)(*) (*)式表明,IV估計量與OLS估計量無差異當(dāng)且僅當(dāng)ziei=0,即工具變量與OLS估計的殘差項無關(guān)。 第95頁/共120頁檢驗時,求Y關(guān)于X與Z的OLS回歸式: iiiZXY10 在實際檢驗中,豪斯蔓檢驗主要針對多元回歸進(jìn)行,而且也不是直接對工具變量回歸,而是對以各工具變量為自變量、分別以各解釋變量為因變量進(jìn)行回歸。 第96頁/共120頁如對二元回歸模型 iiiiXXY22110iiiiiXXXXY221122110 通過增加解釋變量的增加解釋變量的F F檢驗檢驗,檢驗聯(lián)合假設(shè): H0:1=2=0 。 拒絕原假設(shè),就意味著(*)式中的解釋變量與隨機擾動項相關(guān)。 (*)第97頁/共120頁模型設(shè)定的方法模型設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論