最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第1頁(yè)
最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第2頁(yè)
最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第3頁(yè)
最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第4頁(yè)
最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第5頁(yè)
已閱讀5頁(yè),還剩85頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 最小二乘法(OLS)和線性回歸模型1第1頁(yè)本章關(guān)鍵點(diǎn)最小二乘法基本原理和計(jì)算方法經(jīng)典線性回歸模型基本假定BLUE統(tǒng)計(jì)量性質(zhì)t檢驗(yàn)和置信區(qū)間檢驗(yàn)原理及步驟多變量模型回歸系數(shù)F檢驗(yàn)預(yù)測(cè)類型及評(píng)判預(yù)測(cè)標(biāo)準(zhǔn)好模型含有特征2第2頁(yè)第一節(jié) 最小二乘法基本屬性一、相關(guān)回歸基本介紹 金融、經(jīng)濟(jì)變量之間關(guān)系,大致上能夠分為兩種: (1)函數(shù)關(guān)系:Y=f(X1,X2,.,XP),其中Y值是由Xi(i=1,2.p)所唯一確定。 (2)相關(guān)關(guān)系: Y=f(X1,X2,.,XP) ,這里Y值不能由Xi(i=1,2.p)準(zhǔn)確唯一確定。3第3頁(yè)圖2-1 貨幣供給量和GDP散點(diǎn)圖4第4頁(yè)圖2-1表示是我國(guó)貨幣供給量M

2、2(y)與經(jīng)過(guò)季節(jié)調(diào)整GDP(x)之間關(guān)系(數(shù)據(jù)為1995年第一季度到第二季度季度數(shù)據(jù))。5第5頁(yè)但有時(shí)候我們想知道當(dāng)x改變一單位時(shí),y平均改變多少,能夠看到,因?yàn)閳D中全部點(diǎn)都相正確集中在圖中直線周圍,所以我們能夠以這條直線大致代表x與y之間關(guān)系。假如我們能夠確定這條直線,我們就能夠用直線斜率來(lái)表示當(dāng)x改變一單位時(shí)y改變程度,由圖中點(diǎn)確定線過(guò)程就是回歸。 6第6頁(yè)對(duì)于變量間相關(guān)關(guān)系,我們能夠依據(jù)大量統(tǒng)計(jì)資料,找出它們?cè)跀?shù)量改變方面規(guī)律(即“平均”規(guī)律),這種統(tǒng)計(jì)規(guī)律所揭示關(guān)系就是回歸關(guān)系(regressive relationship),所表示數(shù)學(xué)方程就是回歸方程(regression equ

3、ation)或回歸模型(regression model)。7第7頁(yè)圖2-1中直線可表示為 (2.1) 依據(jù)上式,在確定、情況下,給定一個(gè)x值,我們就能夠得到一個(gè)確定y值,然而依據(jù)式(2.1)得到y(tǒng)值與實(shí)際y值存在一個(gè)誤差(即圖2-1中點(diǎn)到直線距離)。 8第8頁(yè)假如我們以表示誤差,則方程(2.1)變?yōu)椋?即: 其中t(=1,2,3,.,T)表示觀察數(shù)。 (2.2)(2.3)式(2.3)即為一個(gè)簡(jiǎn)單雙變量回歸模型(因其僅含有兩個(gè)變量x, y)基本形式。 9第9頁(yè)其中yt被稱作因變量(dependent variable)、 被解釋變量(explained variable)、 結(jié)果變量(effe

4、ct variable);xt被稱作自變量(independent variable)、解釋變量(explanatory variable)、 原因變量(causal variable)10第10頁(yè)、為參數(shù)(parameters),或稱回歸系數(shù)(regression coefficients);t通常被稱為隨機(jī)誤差項(xiàng)(stochastic error term),或隨機(jī)擾動(dòng)項(xiàng)(random disturbance term),簡(jiǎn)稱誤差項(xiàng),在回歸模型中它是不確定,服從隨機(jī)分布(對(duì)應(yīng),yt也是不確定,服從隨機(jī)分布)。 11第11頁(yè)為何將t 包含在模型中?(1)有些變量是觀察不到或者是無(wú)法度量,又或

5、者影響因變量yt原因太多;(2)在yt度量過(guò)程中會(huì)發(fā)生偏誤,這些偏誤在模型中是表示不出來(lái);(3)外界隨機(jī)原因?qū)t影響也極難模型化,比如:恐怖事件、自然災(zāi)害、設(shè)備故障等。12第12頁(yè)二、參數(shù)最小二乘預(yù)計(jì)(一) 方法介紹本章所介紹是普通最小二乘法(ordinary least squares,簡(jiǎn)記OLS);最小二乘法基本標(biāo)準(zhǔn)是:最優(yōu)擬合直線應(yīng)該使各點(diǎn)到直線距離和最小,也可表述為距離平方和最小。假定依據(jù)這一原理得到、預(yù)計(jì)值為 、 ,則直線可表示為 。13第13頁(yè)直線上yt值,記為 ,稱為擬合值(fitted value),實(shí)際值與擬合值差,記為 ,稱為殘差(residual) ,能夠看作是隨機(jī)誤差

6、項(xiàng) 預(yù)計(jì)值。 依據(jù)OLS基本標(biāo)準(zhǔn),使直線與各散點(diǎn)距離平方和最小,實(shí)際上是使殘差平方和(residual sum of squares, 簡(jiǎn)記RSS) 最小,即最小化: RSS= = (2.4) 14第14頁(yè)依據(jù)最小化一階條件,將式2.4分別對(duì)、求偏導(dǎo),并令其為零,即可求得結(jié)果以下 :(2.5) (2.6) 15第15頁(yè)(二)一些基本概念1.總體(the population)和樣本(the sample)總體是指待研究變量全部數(shù)據(jù)集合,能夠是有限,也能夠是無(wú)限;而樣本是總體一個(gè)子集。2、總體回歸方程(the population regression function,簡(jiǎn)記PRF),樣本回歸方

7、程(the sample regression function,簡(jiǎn)記SRF)。16第16頁(yè)總體回歸方程(PRF)表示變量之間真實(shí)關(guān)系,有時(shí)也被稱為數(shù)據(jù)生成過(guò)程(DGP),PRF中、值是真實(shí)值,方程為:+ (2. 7)樣本回歸方程(SRF)是依據(jù)所選樣本估算變量之間關(guān)系函數(shù),方程為: 注意:SRF中沒(méi)有誤差項(xiàng),依據(jù)這一方程得到是總體因變量期望值(2.8) 17第17頁(yè)于是方程(2.7)能夠?qū)憺椋?(2.9)總體y值被分解為兩部分:模型擬合值( )和殘差項(xiàng)( )。18第18頁(yè)3.線性關(guān)系對(duì)線性第一個(gè)解釋是指:y是x線性函數(shù),比如,y= 。對(duì)線性第二種解釋是指:y是參數(shù)一個(gè)線性函數(shù),它能夠不是變量

8、x線性函數(shù)。 比如,y= 就是一個(gè)線性回歸模型, 但 則不是。在本課程中,線性回歸一詞總是對(duì)指參數(shù)為線性一個(gè)回歸(即參數(shù)只以一次方出現(xiàn)),對(duì)解釋變量x則能夠是或不是線性。19第19頁(yè)有些模型看起來(lái)不是線性回歸,但經(jīng)過(guò)一些基本代數(shù)變換能夠轉(zhuǎn)換成線性回歸模型。比如, (2.10) 能夠進(jìn)行以下變換: (2.11)令 、 、 ,則方程(2. 11)變?yōu)椋?(2.12) 能夠看到,模型2.12即為一線性模型。 20第20頁(yè)4.預(yù)計(jì)量(estimator)和預(yù)計(jì)值(estimate)預(yù)計(jì)量是指計(jì)算系數(shù)方程;而預(yù)計(jì)值是指預(yù)計(jì)出來(lái)系數(shù)數(shù)值。21第21頁(yè)三、最小二乘預(yù)計(jì)量性質(zhì)和分布(一) 經(jīng)典線性回歸模型基本

9、假設(shè)(1) ,即殘差含有零均值;(2)var ,即殘差含有常數(shù)方差,且對(duì)于全部x值是有限;(3)cov ,即殘差項(xiàng)之間在統(tǒng)計(jì)意義上是相互獨(dú)立;(4)cov ,即殘差項(xiàng)與變量x無(wú)關(guān);(5)tN ,即殘差項(xiàng)服從正態(tài)分布22第22頁(yè)(二)最小二乘預(yù)計(jì)量性質(zhì)假如滿足假設(shè)(1)(4),由最小二乘法得到預(yù)計(jì)量 、 含有一些特征,它們是最優(yōu)線性無(wú)偏預(yù)計(jì)量(Best Linear Unbiased Estimators,簡(jiǎn)記BLUE)。23第23頁(yè)預(yù)計(jì)量(estimator):意味著 、 是包含著真實(shí)、值預(yù)計(jì)量;線性(linear):意味著 、 與隨機(jī)變量y之間是線性函數(shù)關(guān)系;無(wú)偏(unbiased):意味著

10、平均而言,實(shí)際得到 、 值與其真實(shí)值是一致;最優(yōu)(best):意味著在全部線性無(wú)偏預(yù)計(jì)量里,OLS預(yù)計(jì)量 含有最小方差。 24第24頁(yè)(三) OLS預(yù)計(jì)量方差、標(biāo)準(zhǔn)差和其概率分布1.OLS預(yù)計(jì)量方差、標(biāo)準(zhǔn)差。 給定假設(shè)(1)(4),預(yù)計(jì)量標(biāo)準(zhǔn)差計(jì)算方程以下 :其中, 是殘差預(yù)計(jì)標(biāo)準(zhǔn)差。 (2.21) (2.22)25第25頁(yè)參數(shù)預(yù)計(jì)量標(biāo)準(zhǔn)差含有以下性質(zhì):(1)樣本容量T越大,參數(shù)預(yù)計(jì)值標(biāo)準(zhǔn)差越?。唬?) 和 都取決于s2。 s2是殘差方差預(yù)計(jì)量。 s2越大,殘差分布就越分散,這么模型不確定性也就越大。假如s2很大,這意味著預(yù)計(jì)直線不能很好地?cái)M合散點(diǎn);26第26頁(yè)(3)參數(shù)預(yù)計(jì)值方差與 成反比。

11、 其值越小,散點(diǎn)越集中,這么就越難準(zhǔn)確地預(yù)計(jì)擬合直線;相反,假如 越大,散點(diǎn)越分散,這么就能夠輕易地預(yù)計(jì)出擬合直線,而且可信度也大得多。比較圖22就能夠清楚地看到這點(diǎn)。 27第27頁(yè)圖22 直線擬合和散點(diǎn)集中度關(guān)系28第28頁(yè)(4) 項(xiàng)只影響截距標(biāo)準(zhǔn)差,不影響斜率標(biāo)準(zhǔn)差。理由是: 衡量是散點(diǎn)與y軸距離。 越大,散點(diǎn)離y軸越遠(yuǎn),就越難準(zhǔn)確地預(yù)計(jì)出擬合直線與y軸交點(diǎn)(即截距);反之,則相反。29第29頁(yè)2OLS預(yù)計(jì)量概率分布給定假設(shè)條件(5),即 ,則 也服從正態(tài)分布系數(shù)預(yù)計(jì)量也是服從正態(tài)分布:(2.30) (2.31)30第30頁(yè)需要注意是:假如殘差不服從正態(tài)分布,即假設(shè)(5)不成立,但只要CL

12、RM其它假設(shè)條件還成立,且樣本容量足夠大,則通常認(rèn)為系數(shù)預(yù)計(jì)量還是服從正態(tài)分布。 其標(biāo)準(zhǔn)正態(tài)分布為: (2.32) (2.33)31第31頁(yè)不過(guò),總體回歸方程中系數(shù)真實(shí)標(biāo)準(zhǔn)差是得不到,只能得到樣本系數(shù)標(biāo)準(zhǔn)差( 、 )。用樣本標(biāo)準(zhǔn)差去替換總體標(biāo)準(zhǔn)差會(huì)產(chǎn)生不確定性,而且 、 將不再服從正態(tài)分布,而服從自由度為T-2t分布,其中T為樣本容量 即: (2.34) (2.35)32第32頁(yè)3.正態(tài)分布和t分布關(guān)系圖2-3 正態(tài)分布和t分布形狀比較33第33頁(yè) 從圖形上來(lái)看,t分布尾比較厚,均值處最大值小于正態(tài)分布。 伴隨t分布自由度增大,其對(duì)應(yīng)臨界值顯著減小,當(dāng)自由度趨向于無(wú)窮時(shí),t分布就服從標(biāo)準(zhǔn)正態(tài)分

13、布了。 所以正態(tài)分布能夠看作是t分布一個(gè)特例。34第34頁(yè)第二節(jié) 一元線性回歸模型統(tǒng)計(jì)檢驗(yàn) 一、擬合優(yōu)度(goodness of fit statistics)檢驗(yàn) 擬合優(yōu)度可用R2 表示:模型所要解釋 是y相對(duì)于其均值波動(dòng)性,即 (總平方和,the total sum of squares, 簡(jiǎn)記TSS),這一平方和能夠分成兩部分: 35第35頁(yè) = + (2.36) 是被模型所解釋部分,稱為回歸平方和(the explained sum of squares,簡(jiǎn)記ESS); 是不能被模型所解釋殘差平方和(RSS),即 =36第36頁(yè)TSS、ESS、RSS關(guān)系以下列圖來(lái)表示愈加直觀一些: 圖

14、24 TSS、ESS、RSS關(guān)系37第37頁(yè)擬合優(yōu)度 因?yàn)?TSS=ESS+RSS所以 R2 (2.39) (2.37) (2.38) R2越大,說(shuō)明回歸線擬合程度越好;R2越小,說(shuō)明回歸線擬合程度越差。由上可知,經(jīng)過(guò)考查R2大小,我們就能粗略地看出回歸線優(yōu)劣。38第38頁(yè)不過(guò),R2作為擬合優(yōu)度一個(gè)衡量標(biāo)準(zhǔn)也存在一些問(wèn)題: (1)假如模型被重新組合,被解釋變量發(fā)生了改變,那么R2也將隨之改變,所以含有不一樣被解釋變量模型之間是無(wú)法來(lái)比較R2大小。39第39頁(yè) (2)增加了一個(gè)解釋變量以后, R2只會(huì)增大而不會(huì)減小,除非增加那個(gè)解釋變量之前系數(shù)為零,但在通常情況下該系數(shù)是不為零,所以只要增加解釋

15、變量, R2就會(huì)不停增大,這么我們就無(wú)法判斷出這些解釋變量是否應(yīng)該包含在模型中。 (3)R2值經(jīng)常會(huì)很高,到達(dá)0.9或更高,所以我們無(wú)法判斷模型之間到底孰優(yōu)孰劣。40第40頁(yè)為了處理上面第二個(gè)問(wèn)題,我們通慣用調(diào)整過(guò)R2來(lái)代替未調(diào)整過(guò)R2 。對(duì)R2進(jìn)行調(diào)整主要是考慮到在引進(jìn)一個(gè)解釋變量時(shí),會(huì)失去對(duì)應(yīng)自由度。調(diào)整過(guò)R2用 來(lái)表示,公式為: 其中T為樣本容量 ,K為自變量個(gè)數(shù) (2.40)41第41頁(yè)二、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)基本任務(wù)是依據(jù)樣本所提供信息,對(duì)未知總體分布一些方面假設(shè)做出合了解釋假設(shè)檢驗(yàn)程序是,先依據(jù)實(shí)際問(wèn)題要求提出一個(gè)論斷,稱為零假設(shè)(null hypothesis)或原假設(shè),記為H0(普

16、通并列有一個(gè)備擇假設(shè)(alternative hypothesis),記為H1 )然后依據(jù)樣本相關(guān)信息,對(duì)H0真?zhèn)芜M(jìn)行判斷,做出拒絕H0或不能拒絕H0決議。42第42頁(yè)假設(shè)檢驗(yàn)基本思想是概率性質(zhì)反證法。概率性質(zhì)反證法依據(jù)是小概率事件原理。該原理認(rèn)為“小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生”。在原假設(shè)H0下結(jié)構(gòu)一個(gè)事件(即檢驗(yàn)統(tǒng)計(jì)量),這個(gè)事件在“原假設(shè)H0是正確”條件下是一個(gè)小概率事件,假如該事件發(fā)生了,說(shuō)明“原假設(shè)H0是正確”是錯(cuò)誤,因?yàn)椴粦?yīng)該出現(xiàn)小概率事件出現(xiàn)了,應(yīng)該拒絕原假設(shè)H0 。43第43頁(yè)假設(shè)檢驗(yàn)有兩種方法:置信區(qū)間檢驗(yàn)法(confidence interval approach)

17、和顯著性檢驗(yàn)法(test of significance approach)。顯著性檢驗(yàn)法中最慣用是t檢驗(yàn)和F檢驗(yàn),前者是對(duì)單個(gè)變量系數(shù)顯著性檢驗(yàn),后者是對(duì)多個(gè)變量系數(shù)聯(lián)合顯著性檢驗(yàn)。44第44頁(yè)(一)t檢驗(yàn)下面我們?cè)敿?xì)介紹對(duì)方程(2.3)系數(shù)進(jìn)行t檢驗(yàn)主要步驟。 (1)用OLS方法回歸方程(2.3),得到預(yù)計(jì)值 及其標(biāo)準(zhǔn)差 。 (2)假定我們建立零假設(shè)是: ,備則假設(shè)是 (這是一個(gè)雙側(cè)檢驗(yàn))。45第45頁(yè)則我們建立統(tǒng)計(jì)量 服從自由度為T-2t分布。(3)選擇一個(gè)顯著性水平(通常是5%),我們就能夠在t分布中確定拒絕區(qū)域和非拒絕區(qū)域,如圖2-5。假如選擇顯著性水平為5%,則表明有5%分布將落在

18、拒絕區(qū)域 46第46頁(yè) 圖2-5 雙側(cè)檢驗(yàn)拒絕區(qū)域和非拒絕區(qū)域分布47第47頁(yè)(4)選定顯著性水平后,我們就能夠依據(jù)t分布表求得自由度為T-2臨界值,當(dāng)檢驗(yàn)統(tǒng)計(jì)值絕對(duì)值大于臨界值時(shí),它就落在拒絕區(qū)域,所以我們拒絕原假設(shè),而接收備則假設(shè)。反之則相反。能夠看到,t檢驗(yàn)基本原理是假如參數(shù)假設(shè)值與預(yù)計(jì)值差異很大,就會(huì)造成小概率事件發(fā)生,從而造成我們拒絕參數(shù)假設(shè)值。 48第48頁(yè)(二)置信區(qū)間法仍以方程2.3系數(shù)為例,置信區(qū)間法基本思想是建立圍繞預(yù)計(jì)值 一定限制范圍,推斷總體參數(shù)是否在一定置信度下落在此區(qū)間范圍內(nèi)。 置信區(qū)間檢驗(yàn)主要步驟(所建立零假設(shè)同 t檢驗(yàn))。49第49頁(yè)(1)用OLS法回歸方程(2

19、.3),得到預(yù)計(jì)值 及其標(biāo)準(zhǔn)差 。(2)選擇一個(gè)顯著性水平(通常為5%),這相當(dāng)于選擇95%置信度。查t分布表,取得自由度為T-2臨界值 。(3)所建立置信區(qū)間為( , ) (2.41)50第50頁(yè)(4)假如零假設(shè)值 落在置信區(qū)間外,我們就拒絕 原假設(shè);反之,則不能拒絕。需要注意是,置信區(qū)間檢驗(yàn)都是雙側(cè)檢驗(yàn),盡管在理論上建立單側(cè)檢驗(yàn)也是可行。51第51頁(yè) (三)t檢驗(yàn)與置信區(qū)間檢驗(yàn)關(guān)系在顯著性檢驗(yàn)法下,當(dāng) 絕對(duì)值小于臨界值時(shí),即: (2.42) 時(shí),我們不能拒絕原假設(shè)。對(duì)式(2.41)變形,我們能夠得到: (2.43)能夠看到,式(2.43)恰好是置信區(qū)間法置信區(qū)間式(2.41),所以,實(shí)際上

20、t檢驗(yàn)法與置信區(qū)間法提供結(jié)果是完全一樣。52第52頁(yè) (四)第一類錯(cuò)誤和第二類錯(cuò)誤假如有一個(gè)零假設(shè)在5顯著性水平下被拒絕了,有可能這個(gè)拒絕是不正確,這種錯(cuò)誤被稱為第一類錯(cuò)誤,它發(fā)生概率為5。另外一個(gè)情況是,我們得到95一個(gè)置信區(qū)間,落在這個(gè)區(qū)間零假設(shè)我們都不能拒絕,當(dāng)我們接收一個(gè)零假設(shè)時(shí)候也可能犯錯(cuò)誤,因?yàn)榛貧w系數(shù)真實(shí)值可能是該區(qū)間內(nèi)另外一個(gè)值,這一錯(cuò)誤被稱為第二類錯(cuò)誤。在選擇顯著性水平時(shí)人們面臨抉擇:降低犯第一類錯(cuò)誤概率就會(huì)增加犯第二類錯(cuò)誤概率。53第53頁(yè)(五)P值P值是計(jì)量經(jīng)濟(jì)結(jié)果對(duì)應(yīng)準(zhǔn)確顯著性水平。P值度量是犯第一類錯(cuò)誤概率,即拒絕正確零假設(shè)概率。P值越大,錯(cuò)誤地拒絕零假設(shè)可能性就越大

21、;p值越小,拒絕零假設(shè)時(shí)就越放心?,F(xiàn)在許多統(tǒng)計(jì)軟件都能計(jì)算各種統(tǒng)計(jì)量p值,如Eviews、Stata等。54第54頁(yè)第三節(jié) 多變量線性回歸模型統(tǒng)計(jì)檢驗(yàn)一、多變量模型簡(jiǎn)單介紹考查下面這個(gè)方程: t=1,2,3.T (2.44)對(duì)y產(chǎn)生影響解釋變量共有k-1(x2t,x3t,xkt)個(gè),系數(shù)(12.k)分別衡量了解釋變量對(duì)因變量y邊際影響程度。55第55頁(yè)方程(2.44)矩陣形式為 這里:y是T1矩陣,X是Tk矩陣,是k1矩陣,u是T1矩陣(2.46)56第56頁(yè)在多變量回歸中殘差向量為:(2.47) 殘差平方和為: (2.48)57第57頁(yè)能夠得到多變量回歸系數(shù)預(yù)計(jì)表示式 (2.49)一樣我們能

22、夠得到多變量回歸模型殘差樣本方差(2.50)參數(shù)協(xié)方差矩陣 (2.51)58第58頁(yè)二、擬合優(yōu)度檢驗(yàn)在多變量模型中,我們想知道解釋變量一起對(duì)因變量y變動(dòng)解釋程度。我們將度量這個(gè)信息量稱為多元判定系數(shù)R2。在多變量模型中,下面這個(gè)等式也成立:TSS=ESS+RSS (2.52)其中,TSS為總離差平方和;ESS為回歸平方和;RSS為殘差平方和。59第59頁(yè)與雙變量模型類似,定義以下:即,R2是回歸平方和與總離差平方和比值;與雙變量模型唯一不一樣是,ESS值與多個(gè)解釋變量相關(guān)。R2值在0與1之間,越靠近于1,說(shuō)明預(yù)計(jì)回歸直線擬合得越好。(2.53)60第60頁(yè)能夠證實(shí): (2.54)所以, (2.

23、55)61第61頁(yè)三、假設(shè)檢驗(yàn)(一)、t檢驗(yàn)在多元回歸模型中,t統(tǒng)計(jì)量為:(2.56) 均服從自由度為(n-k)t分布。下面檢驗(yàn)過(guò)程跟雙變量線性回歸模型檢驗(yàn)過(guò)程一樣。 62第62頁(yè)(二)、F檢驗(yàn)F檢驗(yàn)第一個(gè)用途是對(duì)全部回歸系數(shù)全為0零假設(shè)檢驗(yàn)。第二個(gè)用途是用來(lái)檢驗(yàn)相關(guān)部分回歸系數(shù)聯(lián)合檢驗(yàn),就方法而言,兩種用途是完全沒(méi)有差異,下面我們將以第二個(gè)用途為例,對(duì)F檢驗(yàn)進(jìn)行介紹。 63第63頁(yè)為了解聯(lián)合檢驗(yàn)是怎樣進(jìn)行,考慮以下多元回歸模型: (2.57)這個(gè)模型稱為無(wú)約束回歸模型(unrestricted regression),因?yàn)殛P(guān)于回歸系數(shù)沒(méi)有任何限制。 64第64頁(yè)假設(shè)我們想檢驗(yàn)其中q個(gè)回歸系數(shù)

24、是否同時(shí)為零,為此改寫公式(2.57),將全部變量分為兩組,第一組包含k-q個(gè)變量(包含常項(xiàng)),第二組包含q個(gè)變量: (2.58) 65第65頁(yè)假如假定全部后q個(gè)系數(shù)都為零,即建立零假設(shè): ,則修正模型將變?yōu)橛屑s束回歸模型(restricted regression)(零系數(shù)條件): (2.59)66第66頁(yè)關(guān)于上述零假設(shè)檢驗(yàn)很簡(jiǎn)單。若從模型中去掉這q個(gè)變量,對(duì)有約束回歸方程(2.59)進(jìn)行預(yù)計(jì)話,得到誤差平方和 必定會(huì)比對(duì)應(yīng)無(wú)約束回歸方程誤差平方和 大。假如零假設(shè)正確,去掉這q個(gè)變量對(duì)方程解釋能力影響不大。當(dāng)然,零假設(shè)檢驗(yàn)依賴于限制條件數(shù)目,即被設(shè)定為零系數(shù)個(gè)數(shù),以及無(wú)約束回歸模型自由度。6

25、7第67頁(yè)檢驗(yàn)統(tǒng)計(jì)量為: (2.60)在這里,分子是誤差平方和增加與零假設(shè)所隱含參數(shù)限制條件個(gè)數(shù)之比;分母是模型誤差平方和與無(wú)條件模型自由度之比。假如零假設(shè)為真,式(2.60)中統(tǒng)計(jì)量將服從分子自由度為q,分母自由度為N-KF分布。 68第68頁(yè)對(duì)回歸系數(shù)子集F檢驗(yàn)與對(duì)整個(gè)回歸方程F檢驗(yàn)做法一樣。選定顯著性水平,比如1或5,然后將檢驗(yàn)統(tǒng)計(jì)量值與F分布臨界值進(jìn)行比較。假如統(tǒng)計(jì)量值大于臨界值,我們拒絕零假設(shè),認(rèn)為這組變量在統(tǒng)計(jì)上是顯著。普通標(biāo)準(zhǔn)是,必須對(duì)兩個(gè)方程分別進(jìn)行預(yù)計(jì),方便正確地利用這種F檢驗(yàn)。 69第69頁(yè)F檢驗(yàn)與R2有親密聯(lián)絡(luò)?;叵?,則 , (2.61)兩個(gè)統(tǒng)計(jì)量含有相同因變量,所以

26、將上面兩個(gè)方程代入(2.60),檢驗(yàn)統(tǒng)計(jì)量能夠?qū)懗桑?(2.62) 70第70頁(yè)第四節(jié) 預(yù)測(cè)一、預(yù)測(cè)概念和類型(一)預(yù)測(cè)概念 金融計(jì)量學(xué)中,所謂預(yù)測(cè)就是依據(jù)金融經(jīng)濟(jì)變量過(guò)去和現(xiàn)在發(fā)展規(guī)律,借助計(jì)量模型對(duì)其未來(lái)發(fā)展趨勢(shì)和情況進(jìn)行描述、分析,形成科學(xué)假設(shè)和判斷。 71第71頁(yè)(二)預(yù)測(cè)原理?xiàng)l件期望(conditional expectations),在t期Yt+1期條件期望值記作 ,它表示是在全部已知t期信息條件下,Y在t+1期期望值。假定在t期,我們要對(duì)因變量Y下一期(即t+1期)值進(jìn)行預(yù)測(cè),則記作 。 72第72頁(yè) 在t期對(duì)Y下一期全部預(yù)測(cè)值中,Y條件期望值是最優(yōu)(即含有最小方差),所以,我們

27、有: (2.65) 73第73頁(yè)(三)預(yù)測(cè)類型:(1)無(wú)條件預(yù)測(cè)和有條件預(yù)測(cè)所謂無(wú)條件預(yù)測(cè),是指預(yù)測(cè)模型中全部解釋變量值都是已知,在此條件下所進(jìn)行預(yù)測(cè)。所謂有條件預(yù)測(cè),是指預(yù)測(cè)模型中一些解釋變量值是未知,所以想要對(duì)被解釋變量進(jìn)行預(yù)測(cè),必須首先預(yù)測(cè)解釋變量值。74第74頁(yè)(2)樣本內(nèi)(in-sample)預(yù)測(cè)和樣本外(out-of-sample)預(yù)測(cè)所謂樣本內(nèi)預(yù)測(cè)是指用全部觀察值來(lái)預(yù)計(jì)模型,然后用預(yù)計(jì)得到模型對(duì)其中一部分觀察值進(jìn)行預(yù)測(cè)。樣本外預(yù)測(cè)是指將全部觀察值分為兩部分,一部分用來(lái)預(yù)計(jì)模型,然后用預(yù)計(jì)得到模型對(duì)另一部分?jǐn)?shù)據(jù)進(jìn)行預(yù)測(cè)。 75第75頁(yè)(3)事前預(yù)測(cè)和事后模擬顧名思義,事后模擬就是我

28、們已經(jīng)取得要預(yù)測(cè)值實(shí)際值,進(jìn)行預(yù)測(cè)是為了評(píng)價(jià)預(yù)測(cè)模型好壞。事前預(yù)測(cè)是我們?cè)诓恢酪蜃兞空鎸?shí)值情況下對(duì)其預(yù)測(cè)。 76第76頁(yè)(4)一步向前(one-step-ahead)預(yù)測(cè)和多步向前(multi-step-ahead)預(yù)測(cè)所謂一步向前預(yù)測(cè),是指僅對(duì)下一期變量值進(jìn)行預(yù)測(cè),比如在t期對(duì)t+1期值進(jìn)行預(yù)測(cè),在t+1期對(duì)t+2期值進(jìn)行預(yù)測(cè)等。多步向前預(yù)測(cè)則不但是對(duì)下一期值進(jìn)行預(yù)測(cè),也對(duì)更下期值進(jìn)行預(yù)測(cè),比如在t期對(duì)t+1期、t+2期、t+r期值進(jìn)行預(yù)測(cè)。 77第77頁(yè)二、預(yù)測(cè)評(píng)價(jià)標(biāo)準(zhǔn)、平均預(yù)測(cè)誤差平方和(mean squared error,簡(jiǎn)記MSE)平均預(yù)測(cè)誤差絕對(duì)值(mean absolute

29、error,簡(jiǎn)記MAE)。變量MSE定義為:MSE= (2.66)其中 預(yù)測(cè)值, 實(shí)際值,T時(shí)段數(shù)78第78頁(yè)變量MAE定義以下: MAE= ,變量定義同前 (2.67)能夠看到,MSE和MAE度量是誤差絕對(duì)大小,只能經(jīng)過(guò)與該變量平均值比較來(lái)判斷誤差大小,誤差越大,說(shuō)明模型預(yù)測(cè)效果越不理想。 79第79頁(yè)2、Theil不相等系數(shù) 其定義為: (2.68)注意,U分子就是MSE平方根,而分母使得U總在0與1之間。假如U=0,則對(duì)全部t, 完全擬合;假如U=1,則模型預(yù)測(cè)能力最差。所以,Theil不等系數(shù)度量是誤差相對(duì)大小。80第80頁(yè)Theil不等系數(shù)能夠分解成以下有用形式:其中 分別是序列 和 平均值和標(biāo)準(zhǔn)差, 是它們相關(guān)系數(shù),即: (2.69) 81第81頁(yè)定義不相等比比如下: (2.70) (2.71) (2.72)82第82頁(yè)偏誤百分比 表示系統(tǒng)誤差,因?yàn)樗攘渴悄M序列與實(shí)際序列之間偏離程度。方差百分比 表示是模型中變量重復(fù)其實(shí)際改變程度能力。協(xié)方差百分比

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論