最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件

上傳人：積*** IP屬地：江蘇上傳時(shí)間：2022-09-22 格式：PPTX 頁(yè)數(shù)：90 大?。?39.12KB 積分：70 舉報(bào) 版權(quán)申訴

最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第2頁(yè)

最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第3頁(yè)

最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第4頁(yè)

最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第5頁(yè)

已閱讀5頁(yè)，還剩85頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章最小二乘法（OLS）和線性回歸模型1第1頁(yè)本章關(guān)鍵點(diǎn)最小二乘法基本原理和計(jì)算方法經(jīng)典線性回歸模型基本假定BLUE統(tǒng)計(jì)量性質(zhì)t檢驗(yàn)和置信區(qū)間檢驗(yàn)原理及步驟多變量模型回歸系數(shù)F檢驗(yàn)預(yù)測(cè)類型及評(píng)判預(yù)測(cè)標(biāo)準(zhǔn)好模型含有特征2第2頁(yè)第一節(jié) 最小二乘法基本屬性一、相關(guān)回歸基本介紹金融、經(jīng)濟(jì)變量之間關(guān)系，大致上能夠分為兩種：（1）函數(shù)關(guān)系：Y=f(X1,X2,.,XP)，其中Y值是由Xi（i=1,2.p）所唯一確定。（2）相關(guān)關(guān)系: Y=f(X1,X2,.,XP) ，這里Y值不能由Xi（i=1,2.p）準(zhǔn)確唯一確定。3第3頁(yè)圖2-1 貨幣供給量和GDP散點(diǎn)圖4第4頁(yè)圖2-1表示是我國(guó)貨幣供給量M

2、2（y）與經(jīng)過(guò)季節(jié)調(diào)整GDP（x）之間關(guān)系（數(shù)據(jù)為1995年第一季度到第二季度季度數(shù)據(jù)）。5第5頁(yè)但有時(shí)候我們想知道當(dāng)x改變一單位時(shí)，y平均改變多少，能夠看到，因?yàn)閳D中全部點(diǎn)都相正確集中在圖中直線周圍，所以我們能夠以這條直線大致代表x與y之間關(guān)系。假如我們能夠確定這條直線，我們就能夠用直線斜率來(lái)表示當(dāng)x改變一單位時(shí)y改變程度，由圖中點(diǎn)確定線過(guò)程就是回歸。 6第6頁(yè)對(duì)于變量間相關(guān)關(guān)系，我們能夠依據(jù)大量統(tǒng)計(jì)資料，找出它們?cè)跀?shù)量改變方面規(guī)律（即“平均”規(guī)律），這種統(tǒng)計(jì)規(guī)律所揭示關(guān)系就是回歸關(guān)系（regressive relationship）,所表示數(shù)學(xué)方程就是回歸方程（regression equ

3、ation）或回歸模型（regression model）。7第7頁(yè)圖2-1中直線可表示為（2.1）依據(jù)上式，在確定、情況下，給定一個(gè)x值，我們就能夠得到一個(gè)確定y值，然而依據(jù)式（2.1）得到y(tǒng)值與實(shí)際y值存在一個(gè)誤差（即圖2-1中點(diǎn)到直線距離）。 8第8頁(yè)假如我們以表示誤差，則方程（2.1）變?yōu)椋?即：其中t（=1,2,3,.,T）表示觀察數(shù)。（2.2）（2.3）式（2.3）即為一個(gè)簡(jiǎn)單雙變量回歸模型（因其僅含有兩個(gè)變量x, y）基本形式。 9第9頁(yè)其中yt被稱作因變量（dependent variable）、被解釋變量（explained variable）、結(jié)果變量（effe

4、ct variable）；xt被稱作自變量（independent variable）、解釋變量（explanatory variable）、原因變量（causal variable）10第10頁(yè)、為參數(shù)（parameters）,或稱回歸系數(shù)（regression coefficients）；t通常被稱為隨機(jī)誤差項(xiàng)（stochastic error term）,或隨機(jī)擾動(dòng)項(xiàng)（random disturbance term）,簡(jiǎn)稱誤差項(xiàng)，在回歸模型中它是不確定，服從隨機(jī)分布（對(duì)應(yīng)，yt也是不確定，服從隨機(jī)分布）。 11第11頁(yè)為何將t 包含在模型中？（1）有些變量是觀察不到或者是無(wú)法度量，又或

5、者影響因變量yt原因太多；（2）在yt度量過(guò)程中會(huì)發(fā)生偏誤，這些偏誤在模型中是表示不出來(lái)；（3）外界隨機(jī)原因?qū)t影響也極難模型化，比如：恐怖事件、自然災(zāi)害、設(shè)備故障等。12第12頁(yè)二、參數(shù)最小二乘預(yù)計(jì)(一) 方法介紹本章所介紹是普通最小二乘法（ordinary least squares,簡(jiǎn)記OLS）;最小二乘法基本標(biāo)準(zhǔn)是：最優(yōu)擬合直線應(yīng)該使各點(diǎn)到直線距離和最小，也可表述為距離平方和最小。假定依據(jù)這一原理得到、預(yù)計(jì)值為、，則直線可表示為。13第13頁(yè)直線上yt值，記為，稱為擬合值（fitted value）,實(shí)際值與擬合值差，記為，稱為殘差（residual），能夠看作是隨機(jī)誤差

6、項(xiàng) 預(yù)計(jì)值。依據(jù)OLS基本標(biāo)準(zhǔn)，使直線與各散點(diǎn)距離平方和最小，實(shí)際上是使殘差平方和（residual sum of squares, 簡(jiǎn)記RSS）最小，即最小化： RSS= = （2.4） 14第14頁(yè)依據(jù)最小化一階條件，將式2.4分別對(duì)、求偏導(dǎo)，并令其為零，即可求得結(jié)果以下 :（2.5）（2.6） 15第15頁(yè)（二）一些基本概念1.總體（the population）和樣本（the sample）總體是指待研究變量全部數(shù)據(jù)集合，能夠是有限，也能夠是無(wú)限；而樣本是總體一個(gè)子集。2、總體回歸方程（the population regression function，簡(jiǎn)記PRF），樣本回歸方

7、程（the sample regression function，簡(jiǎn)記SRF）。16第16頁(yè)總體回歸方程（PRF）表示變量之間真實(shí)關(guān)系，有時(shí)也被稱為數(shù)據(jù)生成過(guò)程（DGP），PRF中、值是真實(shí)值，方程為：+ （2. 7）樣本回歸方程（SRF）是依據(jù)所選樣本估算變量之間關(guān)系函數(shù)，方程為：注意：SRF中沒(méi)有誤差項(xiàng)，依據(jù)這一方程得到是總體因變量期望值（2.8） 17第17頁(yè)于是方程（2.7）能夠?qū)憺椋?（2.9）總體y值被分解為兩部分：模型擬合值（）和殘差項(xiàng)（）。18第18頁(yè)3.線性關(guān)系對(duì)線性第一個(gè)解釋是指：y是x線性函數(shù)，比如，y= 。對(duì)線性第二種解釋是指：y是參數(shù)一個(gè)線性函數(shù)，它能夠不是變量

8、x線性函數(shù)。比如，y= 就是一個(gè)線性回歸模型，但則不是。在本課程中，線性回歸一詞總是對(duì)指參數(shù)為線性一個(gè)回歸（即參數(shù)只以一次方出現(xiàn)），對(duì)解釋變量x則能夠是或不是線性。19第19頁(yè)有些模型看起來(lái)不是線性回歸，但經(jīng)過(guò)一些基本代數(shù)變換能夠轉(zhuǎn)換成線性回歸模型。比如，（2.10）能夠進(jìn)行以下變換：（2.11）令、、，則方程（2. 11）變?yōu)椋?（2.12）能夠看到，模型2.12即為一線性模型。 20第20頁(yè)4.預(yù)計(jì)量（estimator）和預(yù)計(jì)值（estimate）預(yù)計(jì)量是指計(jì)算系數(shù)方程；而預(yù)計(jì)值是指預(yù)計(jì)出來(lái)系數(shù)數(shù)值。21第21頁(yè)三、最小二乘預(yù)計(jì)量性質(zhì)和分布（一）經(jīng)典線性回歸模型基本

9、假設(shè)（1），即殘差含有零均值；（2）var ,即殘差含有常數(shù)方差，且對(duì)于全部x值是有限；（3）cov ，即殘差項(xiàng)之間在統(tǒng)計(jì)意義上是相互獨(dú)立；（4）cov ，即殘差項(xiàng)與變量x無(wú)關(guān)；（5）tN ,即殘差項(xiàng)服從正態(tài)分布22第22頁(yè)（二）最小二乘預(yù)計(jì)量性質(zhì)假如滿足假設(shè)(1)(4)，由最小二乘法得到預(yù)計(jì)量、含有一些特征，它們是最優(yōu)線性無(wú)偏預(yù)計(jì)量（Best Linear Unbiased Estimators，簡(jiǎn)記BLUE）。23第23頁(yè)預(yù)計(jì)量（estimator）：意味著、是包含著真實(shí)、值預(yù)計(jì)量；線性（linear）：意味著、與隨機(jī)變量y之間是線性函數(shù)關(guān)系；無(wú)偏（unbiased）：意味著

10、平均而言，實(shí)際得到、值與其真實(shí)值是一致；最優(yōu)（best）：意味著在全部線性無(wú)偏預(yù)計(jì)量里，OLS預(yù)計(jì)量含有最小方差。 24第24頁(yè)(三) OLS預(yù)計(jì)量方差、標(biāo)準(zhǔn)差和其概率分布1.OLS預(yù)計(jì)量方差、標(biāo)準(zhǔn)差。給定假設(shè)(1)(4)，預(yù)計(jì)量標(biāo)準(zhǔn)差計(jì)算方程以下 :其中，是殘差預(yù)計(jì)標(biāo)準(zhǔn)差。（2.21）（2.22）25第25頁(yè)參數(shù)預(yù)計(jì)量標(biāo)準(zhǔn)差含有以下性質(zhì)：（1）樣本容量T越大，參數(shù)預(yù)計(jì)值標(biāo)準(zhǔn)差越?。唬?）和都取決于s2。 s2是殘差方差預(yù)計(jì)量。 s2越大，殘差分布就越分散，這么模型不確定性也就越大。假如s2很大，這意味著預(yù)計(jì)直線不能很好地?cái)M合散點(diǎn)；26第26頁(yè)（3）參數(shù)預(yù)計(jì)值方差與成反比。

11、其值越小，散點(diǎn)越集中，這么就越難準(zhǔn)確地預(yù)計(jì)擬合直線；相反，假如越大，散點(diǎn)越分散，這么就能夠輕易地預(yù)計(jì)出擬合直線，而且可信度也大得多。比較圖22就能夠清楚地看到這點(diǎn)。 27第27頁(yè)圖22 直線擬合和散點(diǎn)集中度關(guān)系28第28頁(yè)（4）項(xiàng)只影響截距標(biāo)準(zhǔn)差，不影響斜率標(biāo)準(zhǔn)差。理由是：衡量是散點(diǎn)與y軸距離。越大，散點(diǎn)離y軸越遠(yuǎn)，就越難準(zhǔn)確地預(yù)計(jì)出擬合直線與y軸交點(diǎn)（即截距）；反之，則相反。29第29頁(yè)2OLS預(yù)計(jì)量概率分布給定假設(shè)條件(5)，即，則也服從正態(tài)分布系數(shù)預(yù)計(jì)量也是服從正態(tài)分布：（2.30）（2.31）30第30頁(yè)需要注意是：假如殘差不服從正態(tài)分布，即假設(shè)(5)不成立，但只要CL

12、RM其它假設(shè)條件還成立，且樣本容量足夠大，則通常認(rèn)為系數(shù)預(yù)計(jì)量還是服從正態(tài)分布。其標(biāo)準(zhǔn)正態(tài)分布為：（2.32）（2.33）31第31頁(yè)不過(guò)，總體回歸方程中系數(shù)真實(shí)標(biāo)準(zhǔn)差是得不到，只能得到樣本系數(shù)標(biāo)準(zhǔn)差（、）。用樣本標(biāo)準(zhǔn)差去替換總體標(biāo)準(zhǔn)差會(huì)產(chǎn)生不確定性，而且、將不再服從正態(tài)分布，而服從自由度為T-2t分布，其中T為樣本容量即： (2.34) (2.35)32第32頁(yè)3.正態(tài)分布和t分布關(guān)系圖2-3 正態(tài)分布和t分布形狀比較33第33頁(yè) 從圖形上來(lái)看，t分布尾比較厚，均值處最大值小于正態(tài)分布。伴隨t分布自由度增大，其對(duì)應(yīng)臨界值顯著減小，當(dāng)自由度趨向于無(wú)窮時(shí)，t分布就服從標(biāo)準(zhǔn)正態(tài)分

13、布了。所以正態(tài)分布能夠看作是t分布一個(gè)特例。34第34頁(yè)第二節(jié) 一元線性回歸模型統(tǒng)計(jì)檢驗(yàn) 一、擬合優(yōu)度(goodness of fit statistics)檢驗(yàn) 擬合優(yōu)度可用R2 表示：模型所要解釋是y相對(duì)于其均值波動(dòng)性，即（總平方和，the total sum of squares，簡(jiǎn)記TSS），這一平方和能夠分成兩部分： 35第35頁(yè) = + （2.36）是被模型所解釋部分，稱為回歸平方和（the explained sum of squares，簡(jiǎn)記ESS）；是不能被模型所解釋殘差平方和（RSS）,即 =36第36頁(yè)TSS、ESS、RSS關(guān)系以下列圖來(lái)表示愈加直觀一些：圖

14、24 TSS、ESS、RSS關(guān)系37第37頁(yè)擬合優(yōu)度因?yàn)?TSS=ESS+RSS所以 R2 （2.39）（2.37）（2.38） R2越大，說(shuō)明回歸線擬合程度越好；R2越小，說(shuō)明回歸線擬合程度越差。由上可知，經(jīng)過(guò)考查R2大小，我們就能粗略地看出回歸線優(yōu)劣。38第38頁(yè)不過(guò)，R2作為擬合優(yōu)度一個(gè)衡量標(biāo)準(zhǔn)也存在一些問(wèn)題：（1）假如模型被重新組合，被解釋變量發(fā)生了改變，那么R2也將隨之改變，所以含有不一樣被解釋變量模型之間是無(wú)法來(lái)比較R2大小。39第39頁(yè) （2）增加了一個(gè)解釋變量以后， R2只會(huì)增大而不會(huì)減小，除非增加那個(gè)解釋變量之前系數(shù)為零，但在通常情況下該系數(shù)是不為零，所以只要增加解釋

15、變量， R2就會(huì)不停增大，這么我們就無(wú)法判斷出這些解釋變量是否應(yīng)該包含在模型中。（3）R2值經(jīng)常會(huì)很高，到達(dá)0.9或更高，所以我們無(wú)法判斷模型之間到底孰優(yōu)孰劣。40第40頁(yè)為了處理上面第二個(gè)問(wèn)題，我們通慣用調(diào)整過(guò)R2來(lái)代替未調(diào)整過(guò)R2 。對(duì)R2進(jìn)行調(diào)整主要是考慮到在引進(jìn)一個(gè)解釋變量時(shí)，會(huì)失去對(duì)應(yīng)自由度。調(diào)整過(guò)R2用來(lái)表示，公式為：其中T為樣本容量，K為自變量個(gè)數(shù) （2.40）41第41頁(yè)二、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)基本任務(wù)是依據(jù)樣本所提供信息，對(duì)未知總體分布一些方面假設(shè)做出合了解釋假設(shè)檢驗(yàn)程序是，先依據(jù)實(shí)際問(wèn)題要求提出一個(gè)論斷，稱為零假設(shè)（null hypothesis）或原假設(shè)，記為H0（普

16、通并列有一個(gè)備擇假設(shè)（alternative hypothesis）,記為H1 ）然后依據(jù)樣本相關(guān)信息，對(duì)H0真?zhèn)芜M(jìn)行判斷，做出拒絕H0或不能拒絕H0決議。42第42頁(yè)假設(shè)檢驗(yàn)基本思想是概率性質(zhì)反證法。概率性質(zhì)反證法依據(jù)是小概率事件原理。該原理認(rèn)為“小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生”。在原假設(shè)H0下結(jié)構(gòu)一個(gè)事件（即檢驗(yàn)統(tǒng)計(jì)量），這個(gè)事件在“原假設(shè)H0是正確”條件下是一個(gè)小概率事件，假如該事件發(fā)生了，說(shuō)明“原假設(shè)H0是正確”是錯(cuò)誤，因?yàn)椴粦?yīng)該出現(xiàn)小概率事件出現(xiàn)了，應(yīng)該拒絕原假設(shè)H0 。43第43頁(yè)假設(shè)檢驗(yàn)有兩種方法：置信區(qū)間檢驗(yàn)法（confidence interval approach）

17、和顯著性檢驗(yàn)法（test of significance approach）。顯著性檢驗(yàn)法中最慣用是t檢驗(yàn)和F檢驗(yàn)，前者是對(duì)單個(gè)變量系數(shù)顯著性檢驗(yàn)，后者是對(duì)多個(gè)變量系數(shù)聯(lián)合顯著性檢驗(yàn)。44第44頁(yè)（一）t檢驗(yàn)下面我們?cè)敿?xì)介紹對(duì)方程（2.3）系數(shù)進(jìn)行t檢驗(yàn)主要步驟。（1）用OLS方法回歸方程（2.3），得到預(yù)計(jì)值及其標(biāo)準(zhǔn)差。（2）假定我們建立零假設(shè)是：，備則假設(shè)是（這是一個(gè)雙側(cè)檢驗(yàn))。45第45頁(yè)則我們建立統(tǒng)計(jì)量服從自由度為T-2t分布。（3）選擇一個(gè)顯著性水平（通常是5%）,我們就能夠在t分布中確定拒絕區(qū)域和非拒絕區(qū)域，如圖2-5。假如選擇顯著性水平為5%，則表明有5%分布將落在

18、拒絕區(qū)域 46第46頁(yè) 圖2-5 雙側(cè)檢驗(yàn)拒絕區(qū)域和非拒絕區(qū)域分布47第47頁(yè)（4）選定顯著性水平后，我們就能夠依據(jù)t分布表求得自由度為T-2臨界值，當(dāng)檢驗(yàn)統(tǒng)計(jì)值絕對(duì)值大于臨界值時(shí)，它就落在拒絕區(qū)域，所以我們拒絕原假設(shè)，而接收備則假設(shè)。反之則相反。能夠看到，t檢驗(yàn)基本原理是假如參數(shù)假設(shè)值與預(yù)計(jì)值差異很大，就會(huì)造成小概率事件發(fā)生，從而造成我們拒絕參數(shù)假設(shè)值。 48第48頁(yè)(二）置信區(qū)間法仍以方程2.3系數(shù)為例，置信區(qū)間法基本思想是建立圍繞預(yù)計(jì)值一定限制范圍，推斷總體參數(shù)是否在一定置信度下落在此區(qū)間范圍內(nèi)。置信區(qū)間檢驗(yàn)主要步驟（所建立零假設(shè)同 t檢驗(yàn)）。49第49頁(yè)（1）用OLS法回歸方程（2

19、.3），得到預(yù)計(jì)值及其標(biāo)準(zhǔn)差。（2）選擇一個(gè)顯著性水平（通常為5%），這相當(dāng)于選擇95%置信度。查t分布表，取得自由度為T-2臨界值。（3）所建立置信區(qū)間為（，）（2.41）50第50頁(yè)（4）假如零假設(shè)值落在置信區(qū)間外，我們就拒絕原假設(shè)；反之，則不能拒絕。需要注意是，置信區(qū)間檢驗(yàn)都是雙側(cè)檢驗(yàn)，盡管在理論上建立單側(cè)檢驗(yàn)也是可行。51第51頁(yè) （三）t檢驗(yàn)與置信區(qū)間檢驗(yàn)關(guān)系在顯著性檢驗(yàn)法下，當(dāng) 絕對(duì)值小于臨界值時(shí)，即：（2.42）時(shí)，我們不能拒絕原假設(shè)。對(duì)式（2.41）變形，我們能夠得到：（2.43）能夠看到，式（2.43）恰好是置信區(qū)間法置信區(qū)間式（2.41），所以，實(shí)際上

20、t檢驗(yàn)法與置信區(qū)間法提供結(jié)果是完全一樣。52第52頁(yè) （四）第一類錯(cuò)誤和第二類錯(cuò)誤假如有一個(gè)零假設(shè)在5顯著性水平下被拒絕了，有可能這個(gè)拒絕是不正確，這種錯(cuò)誤被稱為第一類錯(cuò)誤，它發(fā)生概率為5。另外一個(gè)情況是，我們得到95一個(gè)置信區(qū)間，落在這個(gè)區(qū)間零假設(shè)我們都不能拒絕，當(dāng)我們接收一個(gè)零假設(shè)時(shí)候也可能犯錯(cuò)誤，因?yàn)榛貧w系數(shù)真實(shí)值可能是該區(qū)間內(nèi)另外一個(gè)值，這一錯(cuò)誤被稱為第二類錯(cuò)誤。在選擇顯著性水平時(shí)人們面臨抉擇：降低犯第一類錯(cuò)誤概率就會(huì)增加犯第二類錯(cuò)誤概率。53第53頁(yè)（五）P值P值是計(jì)量經(jīng)濟(jì)結(jié)果對(duì)應(yīng)準(zhǔn)確顯著性水平。P值度量是犯第一類錯(cuò)誤概率，即拒絕正確零假設(shè)概率。P值越大，錯(cuò)誤地拒絕零假設(shè)可能性就越大

21、；p值越小，拒絕零假設(shè)時(shí)就越放心?，F(xiàn)在許多統(tǒng)計(jì)軟件都能計(jì)算各種統(tǒng)計(jì)量p值，如Eviews、Stata等。54第54頁(yè)第三節(jié) 多變量線性回歸模型統(tǒng)計(jì)檢驗(yàn)一、多變量模型簡(jiǎn)單介紹考查下面這個(gè)方程： t=1,2,3.T (2.44)對(duì)y產(chǎn)生影響解釋變量共有k-1（x2t,x3t,xkt）個(gè)，系數(shù)（12.k）分別衡量了解釋變量對(duì)因變量y邊際影響程度。55第55頁(yè)方程（2.44）矩陣形式為這里：y是T1矩陣，X是Tk矩陣，是k1矩陣，u是T1矩陣（2.46）56第56頁(yè)在多變量回歸中殘差向量為：（2.47）殘差平方和為：（2.48）57第57頁(yè)能夠得到多變量回歸系數(shù)預(yù)計(jì)表示式（2.49）一樣我們能

22、夠得到多變量回歸模型殘差樣本方差（2.50）參數(shù)協(xié)方差矩陣（2.51）58第58頁(yè)二、擬合優(yōu)度檢驗(yàn)在多變量模型中，我們想知道解釋變量一起對(duì)因變量y變動(dòng)解釋程度。我們將度量這個(gè)信息量稱為多元判定系數(shù)R2。在多變量模型中，下面這個(gè)等式也成立：TSS=ESS+RSS （2.52）其中，TSS為總離差平方和；ESS為回歸平方和；RSS為殘差平方和。59第59頁(yè)與雙變量模型類似，定義以下：即，R2是回歸平方和與總離差平方和比值；與雙變量模型唯一不一樣是，ESS值與多個(gè)解釋變量相關(guān)。R2值在0與1之間，越靠近于1，說(shuō)明預(yù)計(jì)回歸直線擬合得越好。（2.53）60第60頁(yè)能夠證實(shí)：（2.54）所以，（2.

23、55）61第61頁(yè)三、假設(shè)檢驗(yàn)（一）、t檢驗(yàn)在多元回歸模型中，t統(tǒng)計(jì)量為：（2.56）均服從自由度為（n-k）t分布。下面檢驗(yàn)過(guò)程跟雙變量線性回歸模型檢驗(yàn)過(guò)程一樣。 62第62頁(yè)（二）、F檢驗(yàn)F檢驗(yàn)第一個(gè)用途是對(duì)全部回歸系數(shù)全為0零假設(shè)檢驗(yàn)。第二個(gè)用途是用來(lái)檢驗(yàn)相關(guān)部分回歸系數(shù)聯(lián)合檢驗(yàn)，就方法而言，兩種用途是完全沒(méi)有差異，下面我們將以第二個(gè)用途為例，對(duì)F檢驗(yàn)進(jìn)行介紹。 63第63頁(yè)為了解聯(lián)合檢驗(yàn)是怎樣進(jìn)行，考慮以下多元回歸模型：（2.57）這個(gè)模型稱為無(wú)約束回歸模型（unrestricted regression），因?yàn)殛P(guān)于回歸系數(shù)沒(méi)有任何限制。 64第64頁(yè)假設(shè)我們想檢驗(yàn)其中q個(gè)回歸系數(shù)

24、是否同時(shí)為零，為此改寫公式（2.57），將全部變量分為兩組，第一組包含k-q個(gè)變量（包含常項(xiàng)），第二組包含q個(gè)變量：（2.58） 65第65頁(yè)假如假定全部后q個(gè)系數(shù)都為零，即建立零假設(shè)：，則修正模型將變?yōu)橛屑s束回歸模型（restricted regression）（零系數(shù)條件）：（2.59）66第66頁(yè)關(guān)于上述零假設(shè)檢驗(yàn)很簡(jiǎn)單。若從模型中去掉這q個(gè)變量，對(duì)有約束回歸方程（2.59）進(jìn)行預(yù)計(jì)話，得到誤差平方和必定會(huì)比對(duì)應(yīng)無(wú)約束回歸方程誤差平方和大。假如零假設(shè)正確，去掉這q個(gè)變量對(duì)方程解釋能力影響不大。當(dāng)然，零假設(shè)檢驗(yàn)依賴于限制條件數(shù)目，即被設(shè)定為零系數(shù)個(gè)數(shù)，以及無(wú)約束回歸模型自由度。6

25、7第67頁(yè)檢驗(yàn)統(tǒng)計(jì)量為：（2.60）在這里，分子是誤差平方和增加與零假設(shè)所隱含參數(shù)限制條件個(gè)數(shù)之比；分母是模型誤差平方和與無(wú)條件模型自由度之比。假如零假設(shè)為真，式（2.60）中統(tǒng)計(jì)量將服從分子自由度為q，分母自由度為N-KF分布。 68第68頁(yè)對(duì)回歸系數(shù)子集F檢驗(yàn)與對(duì)整個(gè)回歸方程F檢驗(yàn)做法一樣。選定顯著性水平，比如1或5，然后將檢驗(yàn)統(tǒng)計(jì)量值與F分布臨界值進(jìn)行比較。假如統(tǒng)計(jì)量值大于臨界值，我們拒絕零假設(shè)，認(rèn)為這組變量在統(tǒng)計(jì)上是顯著。普通標(biāo)準(zhǔn)是，必須對(duì)兩個(gè)方程分別進(jìn)行預(yù)計(jì)，方便正確地利用這種F檢驗(yàn)。 69第69頁(yè)F檢驗(yàn)與R2有親密聯(lián)絡(luò)?；叵?,則，（2.61）兩個(gè)統(tǒng)計(jì)量含有相同因變量，所以

26、將上面兩個(gè)方程代入（2.60），檢驗(yàn)統(tǒng)計(jì)量能夠?qū)懗桑?（2.62） 70第70頁(yè)第四節(jié) 預(yù)測(cè)一、預(yù)測(cè)概念和類型（一）預(yù)測(cè)概念金融計(jì)量學(xué)中，所謂預(yù)測(cè)就是依據(jù)金融經(jīng)濟(jì)變量過(guò)去和現(xiàn)在發(fā)展規(guī)律，借助計(jì)量模型對(duì)其未來(lái)發(fā)展趨勢(shì)和情況進(jìn)行描述、分析，形成科學(xué)假設(shè)和判斷。 71第71頁(yè)（二）預(yù)測(cè)原理?xiàng)l件期望（conditional expectations），在t期Yt+1期條件期望值記作，它表示是在全部已知t期信息條件下，Y在t+1期期望值。假定在t期，我們要對(duì)因變量Y下一期（即t+1期）值進(jìn)行預(yù)測(cè)，則記作。 72第72頁(yè) 在t期對(duì)Y下一期全部預(yù)測(cè)值中，Y條件期望值是最優(yōu)（即含有最小方差），所以，我們

27、有：（2.65） 73第73頁(yè)（三）預(yù)測(cè)類型：（1）無(wú)條件預(yù)測(cè)和有條件預(yù)測(cè)所謂無(wú)條件預(yù)測(cè)，是指預(yù)測(cè)模型中全部解釋變量值都是已知，在此條件下所進(jìn)行預(yù)測(cè)。所謂有條件預(yù)測(cè)，是指預(yù)測(cè)模型中一些解釋變量值是未知，所以想要對(duì)被解釋變量進(jìn)行預(yù)測(cè)，必須首先預(yù)測(cè)解釋變量值。74第74頁(yè)（2）樣本內(nèi)（in-sample）預(yù)測(cè)和樣本外（out-of-sample）預(yù)測(cè)所謂樣本內(nèi)預(yù)測(cè)是指用全部觀察值來(lái)預(yù)計(jì)模型，然后用預(yù)計(jì)得到模型對(duì)其中一部分觀察值進(jìn)行預(yù)測(cè)。樣本外預(yù)測(cè)是指將全部觀察值分為兩部分，一部分用來(lái)預(yù)計(jì)模型，然后用預(yù)計(jì)得到模型對(duì)另一部分?jǐn)?shù)據(jù)進(jìn)行預(yù)測(cè)。 75第75頁(yè)（3）事前預(yù)測(cè)和事后模擬顧名思義，事后模擬就是我

28、們已經(jīng)取得要預(yù)測(cè)值實(shí)際值，進(jìn)行預(yù)測(cè)是為了評(píng)價(jià)預(yù)測(cè)模型好壞。事前預(yù)測(cè)是我們?cè)诓恢酪蜃兞空鎸?shí)值情況下對(duì)其預(yù)測(cè)。 76第76頁(yè)（4）一步向前（one-step-ahead）預(yù)測(cè)和多步向前（multi-step-ahead）預(yù)測(cè)所謂一步向前預(yù)測(cè)，是指僅對(duì)下一期變量值進(jìn)行預(yù)測(cè)，比如在t期對(duì)t+1期值進(jìn)行預(yù)測(cè)，在t+1期對(duì)t+2期值進(jìn)行預(yù)測(cè)等。多步向前預(yù)測(cè)則不但是對(duì)下一期值進(jìn)行預(yù)測(cè)，也對(duì)更下期值進(jìn)行預(yù)測(cè)，比如在t期對(duì)t+1期、t+2期、t+r期值進(jìn)行預(yù)測(cè)。 77第77頁(yè)二、預(yù)測(cè)評(píng)價(jià)標(biāo)準(zhǔn)、平均預(yù)測(cè)誤差平方和（mean squared error，簡(jiǎn)記MSE）平均預(yù)測(cè)誤差絕對(duì)值（mean absolute

29、error,簡(jiǎn)記MAE）。變量MSE定義為：MSE= （2.66）其中預(yù)測(cè)值，實(shí)際值，T時(shí)段數(shù)78第78頁(yè)變量MAE定義以下： MAE= ，變量定義同前（2.67）能夠看到，MSE和MAE度量是誤差絕對(duì)大小，只能經(jīng)過(guò)與該變量平均值比較來(lái)判斷誤差大小，誤差越大，說(shuō)明模型預(yù)測(cè)效果越不理想。 79第79頁(yè)2、Theil不相等系數(shù) 其定義為：（2.68）注意，U分子就是MSE平方根，而分母使得U總在0與1之間。假如U=0，則對(duì)全部t，完全擬合；假如U=1，則模型預(yù)測(cè)能力最差。所以，Theil不等系數(shù)度量是誤差相對(duì)大小。80第80頁(yè)Theil不等系數(shù)能夠分解成以下有用形式：其中分別是序列和平均值和標(biāo)準(zhǔn)差，是它們相關(guān)系數(shù)，即：（2.69） 81第81頁(yè)定義不相等比比如下：（2.70）（2.71）（2.72）82第82頁(yè)偏誤百分比表示系統(tǒng)誤差，因?yàn)樗攘渴悄M序列與實(shí)際序列之間偏離程度。方差百分比表示是模型中變量重復(fù)其實(shí)際改變程度能力。協(xié)方差百分比

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

最小二乘法和線性回歸市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔