內(nèi)蒙古財(cái)經(jīng)大學(xué)計(jì)量經(jīng)濟(jì)學(xué)課件第二章 簡(jiǎn)單線性回歸模型_第1頁
內(nèi)蒙古財(cái)經(jīng)大學(xué)計(jì)量經(jīng)濟(jì)學(xué)課件第二章 簡(jiǎn)單線性回歸模型_第2頁
內(nèi)蒙古財(cái)經(jīng)大學(xué)計(jì)量經(jīng)濟(jì)學(xué)課件第二章 簡(jiǎn)單線性回歸模型_第3頁
內(nèi)蒙古財(cái)經(jīng)大學(xué)計(jì)量經(jīng)濟(jì)學(xué)課件第二章 簡(jiǎn)單線性回歸模型_第4頁
內(nèi)蒙古財(cái)經(jīng)大學(xué)計(jì)量經(jīng)濟(jì)學(xué)課件第二章 簡(jiǎn)單線性回歸模型_第5頁
已閱讀5頁,還剩113頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)量經(jīng)濟(jì)學(xué),第二章簡(jiǎn)單線性回歸模型,2,從2004中國國際旅游交易會(huì)上獲悉,到2020年,中國旅游業(yè)總收入將超過3000億美元,相當(dāng)于國內(nèi)生產(chǎn)總值的8%至11%。(資料來源:國際金融報(bào)2004年11月25日第二版)是什么決定性的因素能使中國旅游業(yè)總收入到2020年達(dá)到3000億美元?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?怎樣具體測(cè)定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系?,引子:中國旅游業(yè)總收入將超過3000億美元嗎?,3,第二章簡(jiǎn)單線性回歸模型,本章主要討論:回歸分析與回歸函數(shù)簡(jiǎn)單線性回歸模型參數(shù)的估計(jì)擬合優(yōu)度的度量回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)回歸模型預(yù)測(cè),4,第一節(jié)回歸分析與回歸

2、方程,本節(jié)基本內(nèi)容:回歸與相關(guān)總體回歸函數(shù)隨機(jī)擾動(dòng)項(xiàng)樣本回歸函數(shù),5,(一).經(jīng)濟(jì)變量間的相互關(guān)系確定性的函數(shù)關(guān)系不確定性的統(tǒng)計(jì)關(guān)系相關(guān)關(guān)系(為隨機(jī)變量)沒有關(guān)系,一、回歸與相關(guān)(對(duì)統(tǒng)計(jì)學(xué)的回顧),6,7,相關(guān)關(guān)系的類型從涉及的變量數(shù)量看簡(jiǎn)單相關(guān)多重相關(guān)(復(fù)相關(guān))從變量相關(guān)關(guān)系的表現(xiàn)形式看線性相關(guān)散布圖接近一條直線非線性相關(guān)散布圖接近一條曲線從變量相關(guān)關(guān)系變化的方向看正相關(guān)變量同方向變化,同增同減負(fù)相關(guān)變量反方向變化,一增一減不相關(guān),8,9,和都是相互對(duì)稱的隨機(jī)變量線性相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由于抽樣波動(dòng),樣本相關(guān)系數(shù)是

3、個(gè)隨機(jī)變量,其統(tǒng)計(jì)顯著性有待檢驗(yàn)相關(guān)系數(shù)只能反映線性相關(guān)程度,不能確定因果關(guān)系,不能說明相關(guān)關(guān)系具體接近哪條直線計(jì)量經(jīng)濟(jì)學(xué)關(guān)心:變量間的因果關(guān)系及隱藏在隨機(jī)性后面的統(tǒng)計(jì)規(guī)律性,這有賴于回歸分析方法,使用相關(guān)系數(shù)時(shí)應(yīng)注意,10,1“回歸”一詞的歷史淵源英國統(tǒng)計(jì)學(xué)家F.高爾頓(F.Galton:18221911)。高爾頓和他的學(xué)生K.皮爾遜(K.Pearson:18561936)在研究父母身高與其子女身高的遺傳問題時(shí),觀察了1078對(duì)夫婦,并按照父母身高進(jìn)行了分組,發(fā)現(xiàn):父母身高高的,其子女的平均身高也高;父母身高矮的,其子女的平均身高也矮,但給定父母的身高,兒女輩的平均身高卻趨于或者“回歸”到全

4、體人口的平均身高的趨勢(shì)。這一趨勢(shì)被pearson證實(shí)。從而產(chǎn)生了“回歸”一詞。如下圖:,(四)回歸的含義,11,(四)回歸的含義,1“回歸”一詞的歷史淵源,可以看出:第一:對(duì)應(yīng)于特定身高父母的家庭,其子女身高是一個(gè)概率分布。第二:對(duì)應(yīng)于父母身高為60英寸的家庭,其子女的平均身高要高于父母;對(duì)應(yīng)于父母身高為70英寸的家庭,其子女的平均身高要低于父母,但總體上,隨著父母身高的增加,子女的平均身高也在增加。,12,1“回歸”一詞的歷史淵源以每對(duì)夫婦的平均身高作為x,而取他們的一個(gè)成年兒子的身高作為y,將結(jié)果在平面直角坐標(biāo)系上繪成散點(diǎn)圖,發(fā)現(xiàn)趨勢(shì)近乎一條直線,這條直線成為回歸直線,根據(jù)高爾頓的估計(jì),該

5、回歸方程為正是因?yàn)樽哟纳砀哂谢氐酵g人平均身高的這種趨勢(shì),才使人類的身高在一定時(shí)間相對(duì)穩(wěn)定,沒有出現(xiàn)父輩個(gè)子高其子女更高,父輩個(gè)子矮其子女更矮的兩極分化現(xiàn)象。正是為了描述這種有趣的現(xiàn)象,高爾頓引進(jìn)了“回歸”這個(gè)名詞來描述父輩身高x與子代身高y的關(guān)系,(四)回歸的含義,13,2回歸的現(xiàn)代釋義在現(xiàn)代意義上,回歸分析是用來研究一個(gè)變量(稱之為被解釋變量(explainedvariable)或應(yīng)變量(dependentvariable)與另一個(gè)或多個(gè)變量(稱為解釋變量(explanatoryvariable)或自變量(independentvariable)之間的依賴關(guān)系。其目的是通過解釋變量的給定

6、值來預(yù)測(cè)被解釋變量的平均值或某個(gè)特定值。這種一個(gè)變量依賴于另一個(gè)或幾個(gè)變量并相隨變動(dòng)的例子在社會(huì)生活中有好多。例如支出與收入的關(guān)系、失業(yè)率與通貨膨脹率的關(guān)系(菲利普斯曲線)、廣告效果(及廣告后的銷售量)與廣告費(fèi)用、廣告媒介、廣告密度的關(guān)系等(見教材P12-13)?;貧w分析就是研究這種變量之間相隨變動(dòng)的關(guān)系。,(四)回歸的含義,14,(四)回歸的含義,2回歸的現(xiàn)代釋義回歸分析所要解決的問題:1.確定被解釋變量與解釋變量之間的回歸模型,并根據(jù)樣本觀測(cè)值對(duì)回歸模型中的參數(shù)進(jìn)行估計(jì),給出回歸方程;2.對(duì)回歸方程中的參數(shù)和方程本身進(jìn)行顯著性檢驗(yàn);3.評(píng)價(jià)解釋變量對(duì)被解釋變量的貢獻(xiàn)并對(duì)其重要性進(jìn)行識(shí)別;4

7、.利用所求得的回歸方程,并根據(jù)解釋變量的給定值對(duì)被解釋變量進(jìn)行預(yù)測(cè),對(duì)解釋變量進(jìn)行控制。,15,二總體回歸函數(shù),1總體回歸函數(shù)(PRF)例:為了研究每周家庭消費(fèi)支出Y與每周家庭可支配收入X的關(guān)系,現(xiàn)從某居民區(qū)隨機(jī)抽取100戶家庭,并按照每周家庭人均可支配收入的多少把100戶家庭分成10組,如下表所示:根據(jù)下表理解:條件分布;條件均值,16,二總體回歸函數(shù),1總體回歸函數(shù)(PRF),17,二總體回歸函數(shù),1總體回歸函數(shù)(PRF),18,二總體回歸函數(shù),1總體回歸函數(shù)(PRF),19,二總體回歸函數(shù),1總體回歸函數(shù)(PRF),20,總體回歸函數(shù)(PRF)的概念(PopulationRegressi

8、onFunction)每一個(gè)條件均值E(Y/Xi)都是Xi的一個(gè)函數(shù)(1)其中f(Xi)表示解釋變量Xi某個(gè)函數(shù)(1)稱為雙變量總體回歸函數(shù).它表明在給定Xi下的Y分布的條件均值與Xi有函數(shù)關(guān)系,二總體回歸函數(shù),21,二總體回歸函數(shù),2總體回歸函數(shù)的形式,如果X與Y之間存在線性關(guān)系,PRF則為,稱以上為一元線性回歸方程(對(duì)元、線性的理解),22,對(duì)“線性”一詞的理解對(duì)變量為線性:Y的條件期望值是X的線性函數(shù),如,非線性如:,對(duì)參數(shù)為線性:Y的條件期望值是各參數(shù)的線性函數(shù),如:,非線性如:,本課程研究的“線性”主要針對(duì)參數(shù)而言,包含兩種情況:對(duì)參數(shù)和變量均為線性;對(duì)參數(shù)為線性而對(duì)變量X則為非線性

9、,23,二總體回歸函數(shù),3總體回歸模型,總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對(duì)某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。,記,稱為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個(gè)不可觀測(cè)的隨機(jī)變量,又稱為隨機(jī)干擾項(xiàng)(randomdisturbance)或隨機(jī)誤差項(xiàng)(randomerror)。,24,二總體回歸函數(shù),3總體回歸模型,個(gè)別家庭的消費(fèi)支出為:,即,給定收入水平Xi,個(gè)別家庭的支出可表示為兩部分之和:,(1)該收入水平下所有家庭的平均消費(fèi)支出E(Y|Xi),稱為系統(tǒng)性(systematic)或確定性(determin

10、istic)部分。(2)偏離所有家庭平均消費(fèi)支出E(Y|Xi)的程度,是其他隨機(jī)或非確定性(nonsystematic)部分。,(*),25,二總體回歸函數(shù),3總體回歸模型,(*)式稱為總體回歸函數(shù)(方程)PRF的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響。由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)學(xué)模型,因此也稱為總體回歸模型。,26,1樣本回歸函數(shù)(SRF)總體回歸模型中,兩參數(shù)是未知的,因此總體回歸模型的具體位置是未知的,因此,必須根據(jù)抽取的隨機(jī)樣本,依照某種準(zhǔn)則對(duì)參數(shù)進(jìn)行估計(jì)。為了得到兩參數(shù)的估計(jì)量,先從表2.4中隨機(jī)抽取一個(gè)樣本,得到以下觀測(cè)值:,三

11、樣本回歸函數(shù),27,1樣本回歸函數(shù)(SRF)表:從表2.4中隨機(jī)抽取的一個(gè)樣本觀測(cè)值,三樣本回歸函數(shù),如果根據(jù)以上給出的觀測(cè)值并根據(jù)已定的準(zhǔn)則估計(jì)出了參數(shù)和,記作并記,的估計(jì)量,的估計(jì)量,28,1樣本回歸函數(shù)(SRF)由代入得:樣本回歸模型稱方程為樣本回歸函數(shù)(SRF)它是總體回歸函數(shù)的估計(jì)。由于樣本回歸函數(shù)中的兩參數(shù)是根據(jù)隨機(jī)抽取的樣本以及給定的估計(jì)準(zhǔn)則得到的,這就產(chǎn)生了一個(gè)問題,即由于抽樣的隨機(jī)性,如果另抽一個(gè)樣本,完全可以得到另外一組參數(shù)估計(jì)量。設(shè)另一組觀測(cè)量為下表所示:,三樣本回歸函數(shù),29,1樣本回歸函數(shù)(SRF)表:從表2.4中隨機(jī)抽取的一個(gè)樣本觀測(cè)值,三樣本回歸函數(shù),根據(jù)這組觀測(cè)

12、值得到另一組不同于估計(jì)量.設(shè)由這兩組估計(jì)量構(gòu)成的兩個(gè)樣本回歸函數(shù)分別是SRF1及SRF2,見下圖:,30,1樣本回歸函數(shù)(SRF),三樣本回歸函數(shù),左圖兩個(gè)樣本回歸所對(duì)應(yīng)的回歸直線,究竟哪個(gè)才能代表總體回歸函數(shù)對(duì)對(duì)應(yīng)的回歸直線呢,在總體函數(shù)未知的情況下,準(zhǔn)確的回答這一問題較為困難。但是可以得出:第一,兩個(gè)樣本回歸函數(shù)都是總體回歸函數(shù)的估計(jì);第二,在實(shí)踐中,一般總體回歸函數(shù)是未知的,Y的觀測(cè)值只有一組,這樣既不可避免產(chǎn)生誤差。,31,2總體回歸函數(shù)與樣本回歸函數(shù)的關(guān)系,三樣本回歸函數(shù),在總體回歸模型中,在取得了解釋變量與被解釋變量的觀測(cè)值后,可估計(jì)出樣本回歸模型和樣本回歸函數(shù),即:,樣本,32,

13、回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF,其關(guān)系如右圖為:,即,根據(jù),估計(jì),三樣本回歸函數(shù),2總體回歸函數(shù)與樣本回歸函數(shù)的關(guān)系,這就要求:設(shè)計(jì)一方法,構(gòu)造SRF,以使SRF盡可能接近PRF,33,四、隨機(jī)誤差項(xiàng),在回歸分析中,隨機(jī)誤差項(xiàng)起著關(guān)鍵的作用,這不僅由于隨機(jī)誤差項(xiàng)含有豐富的內(nèi)容,而且用總體回歸模型可知,被解釋變量的特性完全由它確定。因此很有必要分析隨機(jī)誤差項(xiàng)的定義及其來源,34,總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對(duì)某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。,稱為觀察值Yi圍繞它的期望值E(Y|Xi)的偏差或離差(d

14、eviation),是一個(gè)不可觀測(cè)的隨機(jī)變量,又稱為隨機(jī)干擾項(xiàng)(stochasticdisturbance)或隨機(jī)誤差項(xiàng)(stochasticerror)。,四、隨機(jī)誤差項(xiàng),記,1隨機(jī)誤差項(xiàng)的含義,35,這一偏差由于條件期望的未知性以及觀測(cè)值的隨機(jī)性,誤差項(xiàng)可正可負(fù)。但在給定解釋變量的情況下,假定其數(shù)學(xué)期望為零。含義:雖然一次觀測(cè)器誤差項(xiàng)有正有負(fù),但多次重復(fù)觀測(cè)所得到的平均誤差為零,即大量的隨機(jī)干擾因素對(duì)被解釋變量的總影響由于相互抵消而為零,這也表明,回歸直線通過條件鈞值。,四、隨機(jī)誤差項(xiàng),1隨機(jī)誤差項(xiàng)的含義,36,2隨機(jī)誤差項(xiàng)的內(nèi)容,四、隨機(jī)誤差項(xiàng),1)被省略而未進(jìn)入回歸方程但又影響被解釋變

15、量的因素;2)變量觀測(cè)值的觀測(cè)誤差的影響;3)變量替代造成的影響;4)模型關(guān)系的設(shè)定誤差的影響;5)隨機(jī)因素的影響。,37,第二節(jié)簡(jiǎn)單線性回歸模型的最小二乘估計(jì),本節(jié)基本內(nèi)容:簡(jiǎn)單線性回歸的基本假定普通最小二乘法OLS回歸線的性質(zhì)參數(shù)估計(jì)式的統(tǒng)計(jì)性質(zhì),38,一、簡(jiǎn)單線性回歸的基本假定,1.為什么要作基本假定?模型中有隨機(jī)擾動(dòng),估計(jì)的參數(shù)是隨機(jī)變量,只有對(duì)隨機(jī)擾動(dòng)的分布作出假定,才能確定所估計(jì)參數(shù)的分布性質(zhì),也才可能進(jìn)行假設(shè)檢驗(yàn)和區(qū)間估計(jì)只有具備一定的假定條件,所作出的估計(jì)才具有較好的統(tǒng)計(jì)性質(zhì)。,39,(1)對(duì)模型和變量的假定如假定解釋變量是非隨機(jī)的,或者雖然是隨機(jī)的,但與擾動(dòng)項(xiàng)是不相關(guān)的假定解

16、釋變量在重復(fù)抽樣中為固定值假定變量和模型無設(shè)定誤差,2、基本假定的內(nèi)容,40,又稱高斯假定、古典假定假定1:零均值假定在給定的條件下,的條件期望為零假定2:同方差假定在給定的條件下,的條件方差為某個(gè)常數(shù),(2)對(duì)隨機(jī)擾動(dòng)項(xiàng)的假定,41,假定3:無自相關(guān)假定隨機(jī)擾動(dòng)項(xiàng)的逐次值互不相關(guān)假定4:隨機(jī)擾動(dòng)與解釋變量不相關(guān),42,假定5:對(duì)隨機(jī)擾動(dòng)項(xiàng)分布的正態(tài)性假定即假定服從均值為零、方差為的正態(tài)分布(說明:正態(tài)性假定不影響對(duì)參數(shù)的點(diǎn)估計(jì),但對(duì)確定所估計(jì)參數(shù)的分布性質(zhì)是需要的。且根據(jù)中心極限定理,當(dāng)樣本容量趨于無窮大時(shí),的分布會(huì)趨近于正態(tài)分布。所以正態(tài)性假定是合理的),43,的分布性質(zhì),由于的分布性質(zhì)決

17、定了的分布性質(zhì)。對(duì)的一些假定可以等價(jià)地表示為對(duì)的假定:假定1:零均值假定假定2:同方差假定假定3:無自相關(guān)假定假定5:正態(tài)性假定,44,OLS的基本思想不同的估計(jì)方法可得到不同的樣本回歸參數(shù)和,所估計(jì)的也不同。理想的估計(jì)方法應(yīng)使與的差即剩余越小越好因可正可負(fù),所以可以取最小即,二、普通最小二乘法(rdinaryLeastSquares),45,正規(guī)方程和估計(jì)式,用克萊姆法則求解得觀測(cè)值形式的OLS估計(jì)式:,取偏導(dǎo)數(shù)為0,得正規(guī)方程,46,為表達(dá)得更簡(jiǎn)潔,或者用離差形式OLS估計(jì)式:注意其中:而且樣本回歸函數(shù)可寫為,用離差表現(xiàn)的OLS估計(jì)式,47,三、OLS回歸線的性質(zhì),可以證明:回歸線通過樣本

18、均值估計(jì)值的均值等于實(shí)際觀測(cè)值的均值,48,剩余項(xiàng)的均值為零應(yīng)變量估計(jì)值與剩余項(xiàng)不相關(guān),解釋變量與剩余項(xiàng)不相關(guān),49,四、參數(shù)估計(jì)式的統(tǒng)計(jì)性質(zhì),(一)參數(shù)估計(jì)式的評(píng)價(jià)標(biāo)準(zhǔn)1.無偏性前提:重復(fù)抽樣中估計(jì)方法固定、樣本數(shù)不變、經(jīng)重復(fù)抽樣的觀測(cè)值,可得一系列參數(shù)估計(jì)值參數(shù)估計(jì)值的分布稱為的抽樣分布,密度函數(shù)記為如果,稱是參數(shù)的無偏估計(jì)式,否則稱是有偏的,其偏倚為(見圖1.2),50,圖1.2,51,前提:樣本相同、用不同的方法估計(jì)參數(shù),可以找到若干個(gè)不同的估計(jì)式目標(biāo):努力尋求其抽樣分布具有最小方差的估計(jì)式最小方差準(zhǔn)則,或稱最佳性準(zhǔn)則(見圖1.3)既是無偏的同時(shí)又具有最小方差的估計(jì)式,稱為最佳無偏估計(jì)

19、式。,2.最小方差性,52,53,4.漸近性質(zhì)(大樣本性質(zhì)),思想:當(dāng)樣本容量較小時(shí),有時(shí)很難找到最佳無偏估計(jì),需要考慮樣本擴(kuò)大后的性質(zhì)一致性:當(dāng)樣本容量n趨于無窮大時(shí),如果估計(jì)式依概率收斂于總體參數(shù)的真實(shí)值,就稱這個(gè)估計(jì)式是的一致估計(jì)式。即或漸近有效性:當(dāng)樣本容量n趨于無窮大時(shí),在所有的一致估計(jì)式中,具有最小的漸近方差。(見圖1.4),54,55,(二)OLS估計(jì)式的統(tǒng)計(jì)性質(zhì),由OLS估計(jì)式可以看出由可觀測(cè)的樣本值和唯一表示。因存在抽樣波動(dòng),OLS估計(jì)是隨機(jī)變量OLS估計(jì)式是點(diǎn)估計(jì)式,56,1.線性特征是的線性函數(shù),2.無偏特性(證明見教材P37)3.最小方差特性(證明見教材P68附錄21)

20、在所有的線性無偏估計(jì)中,OLS估計(jì)具有最小方差結(jié)論:在古典假定條件下,OLS估計(jì)式是最佳線性無偏估計(jì)式(BLUE),OLS估計(jì)式的統(tǒng)計(jì)性質(zhì)高斯定理,57,第三節(jié)擬合優(yōu)度的度量,本節(jié)基本內(nèi)容:什么是擬合優(yōu)度總變差的分解可決系數(shù),58,一、什么是擬合優(yōu)度?,概念:樣本回歸線是對(duì)樣本數(shù)據(jù)的一種擬合,不同估計(jì)方法可擬合出不同的回歸線,擬合的回歸線與樣本觀測(cè)值總有偏離。樣本回歸線對(duì)樣本觀測(cè)數(shù)據(jù)擬合的優(yōu)劣程度擬合優(yōu)度擬合優(yōu)度的度量建立在對(duì)總變差分解的基礎(chǔ)上,59,二、總變差的分解,分析Y的觀測(cè)值、估計(jì)值與平均值的關(guān)系將上式兩邊平方加總,可證得(TSS)(ESS)(RSS),60,總變差(TSS):應(yīng)變量Y

21、的觀測(cè)值與其平均值的離差平方和(總平方和)解釋了的變差(ESS):應(yīng)變量Y的估計(jì)值與其平均值的離差平方和(回歸平方和)剩余平方和(RSS):應(yīng)變量觀測(cè)值與估計(jì)值之差的平方和(未解釋的平方和),61,變差分解的圖示,62,三、可決系數(shù),以TSS同除總變差等式兩邊:或定義:回歸平方和(解釋了的變差ESS)在總變差(TSS)中所占的比重稱為可決系數(shù),用表示:或,63,作用:可決系數(shù)越大,說明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)小,說明模型對(duì)樣本觀測(cè)值的擬合程度越差。特點(diǎn):可決系數(shù)取值范圍:隨抽樣波動(dòng),樣本可決系數(shù)是隨抽樣而變動(dòng)的隨機(jī)變量可決系數(shù)是非負(fù)的統(tǒng)計(jì),可

22、決系數(shù)的作用和特點(diǎn),64,可決系數(shù)與相關(guān)系數(shù)的關(guān)系,(1)聯(lián)系數(shù)值上,可決系數(shù)等于應(yīng)變量與解釋變量之間簡(jiǎn)單相關(guān)系數(shù)的平方:,65,可決系數(shù)與相關(guān)系數(shù)的關(guān)系,(2)區(qū)別,66,運(yùn)用可決系數(shù)時(shí)應(yīng)注意,可決系數(shù)只是說明列入模型的所有解釋變量對(duì)因變量的聯(lián)合的影響程度,不說明模型中每個(gè)解釋變量的影響程度(在多元中)回歸的主要目的如果是經(jīng)濟(jì)結(jié)構(gòu)分析,不能只追求高的可決系數(shù),而是要得到總體回歸系數(shù)可信的估計(jì)量,可決系數(shù)高并不表示每個(gè)回歸系數(shù)都可信任如果建模的目的只是為了預(yù)測(cè)因變量值,不是為了正確估計(jì)回歸系數(shù),一般可考慮有較高的可決系數(shù),67,第四節(jié)回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),本節(jié)基本內(nèi)容:OLS估計(jì)的分布

23、性質(zhì)回歸系數(shù)的區(qū)間估計(jì)回歸系數(shù)的假設(shè)檢驗(yàn),68,問題的提出,為什么要作區(qū)間估計(jì)?OLS估計(jì)只是通過樣本得到的點(diǎn)估計(jì),不一定等于真實(shí)參數(shù),還需要找到真實(shí)參數(shù)的可能范圍,并說明其可靠性為什么要作假設(shè)檢驗(yàn)?OLS估計(jì)只是用樣本估計(jì)的結(jié)果,是否可靠?是否抽樣的偶然結(jié)果?還有待統(tǒng)計(jì)檢驗(yàn)。區(qū)間估計(jì)和假設(shè)檢驗(yàn)都是建立在確定參數(shù)估計(jì)值概率分布性質(zhì)的基礎(chǔ)上。,69,一、OLS估計(jì)的分布性質(zhì),基本思想是隨機(jī)變量,必須確定其分布性質(zhì)才可能進(jìn)行區(qū)間估計(jì)和假設(shè)檢驗(yàn)是服從正態(tài)分布的隨機(jī)變量,決定了也是服從正態(tài)分布的隨機(jī)變量,是的線性函數(shù),決定了也是服從正態(tài)分布的隨機(jī)變量,只要確定的期望和方差,即可確定的分布性質(zhì),70,的

24、期望:(無偏估計(jì))的方差和標(biāo)準(zhǔn)誤差(標(biāo)準(zhǔn)誤差是方差的算術(shù)平方根)注意:以上各式中未知,其余均是樣本觀測(cè)值,的期望和方差,71,可以證明(見教材P70附錄2.2)的無偏估計(jì)為(n-2為自由度,即可自由變化的樣本觀測(cè)值個(gè)數(shù)),對(duì)隨機(jī)擾動(dòng)項(xiàng)方差的估計(jì),72,在已知時(shí),將作標(biāo)準(zhǔn)化變換,73,(1)當(dāng)樣本為大樣本時(shí),用估計(jì)的參數(shù)標(biāo)準(zhǔn)誤差對(duì)作標(biāo)準(zhǔn)化變換,所得Z統(tǒng)計(jì)量仍可視為標(biāo)準(zhǔn)正態(tài)變量(根據(jù)中心極限定理)(2)當(dāng)樣本為小樣本時(shí),可用代替,去估計(jì)參數(shù)的標(biāo)準(zhǔn)誤差,用估計(jì)的參數(shù)標(biāo)準(zhǔn)誤差對(duì)作標(biāo)準(zhǔn)化變換,所得的t統(tǒng)計(jì)量不再服從正態(tài)分布(這時(shí)分母也是隨機(jī)變量),而是服從t分布:,當(dāng)未知時(shí),74,二、回歸系數(shù)的區(qū)間估計(jì)

25、,概念:對(duì)參數(shù)作出的點(diǎn)估計(jì)是隨機(jī)變量,雖然是無偏估計(jì),但還不能說明估計(jì)的可靠性和精確性,需要找到包含真實(shí)參數(shù)的一個(gè)范圍,并確定這個(gè)范圍包含參數(shù)真實(shí)值的可靠程度。在確定參數(shù)估計(jì)式概率分布性質(zhì)的基礎(chǔ)上,可找到兩個(gè)正數(shù)和(),使得區(qū)間包含真實(shí)的概率為,即這樣的區(qū)間稱為所估計(jì)參數(shù)的置信區(qū)間。,75,一般情況下,總體方差未知,用無偏估計(jì)去代替,由于樣本容量較小,統(tǒng)計(jì)量t不再服從正態(tài)分布,而服從t分布??捎胻分布去建立參數(shù)估計(jì)的置信區(qū)間。,回歸系數(shù)區(qū)間估計(jì)的方法,76,選定,查t分布表得顯著性水平為,自由度為的臨界值,則有即,77,三、回歸系數(shù)的假設(shè)檢驗(yàn),1.假設(shè)檢驗(yàn)的基本思想為什么要作假設(shè)檢驗(yàn)?所估計(jì)的

26、回歸系數(shù)、和方差都是通過樣本估計(jì)的,都是隨抽樣而變動(dòng)的隨機(jī)變量,它們是否可靠?是否抽樣的偶然結(jié)果呢?還需要加以檢驗(yàn)。,78,對(duì)回歸系數(shù)假設(shè)檢驗(yàn)的方式,計(jì)量經(jīng)濟(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗(yàn)的。目的:對(duì)簡(jiǎn)單線性回歸,判斷解釋變量是否是被解釋變量的顯著影響因素。在一元線性模型中,就是要判斷是否對(duì)具有顯著的線性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。,79,一般情況下,總體方差未知,只能用去代替,可利用t分布作t檢驗(yàn),給定,查t分布表得如果或者則拒絕原假設(shè),而接受備擇假設(shè)如果則接受原假設(shè),2.回歸系數(shù)的檢驗(yàn)方法,80,P,81,用P值判斷參數(shù)的顯著性,假設(shè)檢驗(yàn)的p值:p值是根據(jù)既

27、定的樣本數(shù)據(jù)所計(jì)算的統(tǒng)計(jì)量,拒絕原假設(shè)的最小顯著性水平。統(tǒng)計(jì)分析軟件中通常都給出了檢驗(yàn)的p值。,82,83,本節(jié)主要內(nèi)容:回歸分析結(jié)果的報(bào)告被解釋變量平均值預(yù)測(cè)被解釋變量個(gè)別值預(yù)測(cè),第五節(jié)回歸模型預(yù)測(cè),84,一、回歸分析結(jié)果的報(bào)告,經(jīng)過模型的估計(jì)、檢驗(yàn),得到一系列重要的數(shù)據(jù),為了簡(jiǎn)明、清晰、規(guī)范地表述這些數(shù)據(jù),計(jì)量經(jīng)濟(jì)學(xué)通常采用了以下規(guī)范化的方式:例如:回歸結(jié)果為,85,二、被解釋變量平均值預(yù)測(cè),1.基本思想運(yùn)用計(jì)量經(jīng)濟(jì)模型作預(yù)測(cè):指利用所估計(jì)的樣本回歸函數(shù),用解釋變量的已知值或預(yù)測(cè)值,對(duì)預(yù)測(cè)期或樣本以外的被解釋變量數(shù)值作出定量的估計(jì)。計(jì)量經(jīng)濟(jì)預(yù)測(cè)是一種條件預(yù)測(cè):條件:模型設(shè)定的關(guān)系式不變所估

28、計(jì)的參數(shù)不變解釋變量在預(yù)測(cè)期的取值已作出預(yù)測(cè)對(duì)應(yīng)變量的預(yù)測(cè)分為平均值預(yù)測(cè)和個(gè)別值預(yù)測(cè)對(duì)應(yīng)變量的預(yù)測(cè)又分為點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè),86,預(yù)測(cè)值、平均值、個(gè)別值的相互關(guān)系,是真實(shí)平均值的點(diǎn)估計(jì),也是對(duì)個(gè)別值的點(diǎn)估計(jì),個(gè)別值,87,2.Y平均值的點(diǎn)預(yù)測(cè),將解釋變量預(yù)測(cè)值直接代入估計(jì)的方程這樣計(jì)算的是一個(gè)點(diǎn)估計(jì)值,88,3.Y平均值的區(qū)間預(yù)測(cè),基本思想:由于存在抽樣波動(dòng),預(yù)測(cè)的平均值不一定等于真實(shí)平均值,還需要對(duì)作區(qū)間估計(jì)。為對(duì)Y作區(qū)間預(yù)測(cè),必須確定平均值預(yù)測(cè)值的抽樣分布,必須找出與和都有關(guān)的統(tǒng)計(jì)量,89,90,91,三、應(yīng)變量個(gè)別值預(yù)測(cè),基本思想:既是對(duì)平均值的點(diǎn)預(yù)測(cè),也是對(duì)個(gè)別值的點(diǎn)預(yù)測(cè)由于存在隨機(jī)擾動(dòng)

29、的影響,的平均值并不等于的個(gè)別值為了對(duì)的個(gè)別值作區(qū)間預(yù)測(cè),需要尋找與預(yù)測(cè)值和個(gè)別值有關(guān)的統(tǒng)計(jì)量,并要明確其概率分布,92,具體作法:,已知剩余項(xiàng)是與預(yù)測(cè)值及個(gè)別值都有關(guān)的變量,并且已知服從正態(tài)分布,且可證明當(dāng)用代替時(shí),對(duì)標(biāo)準(zhǔn)化的變量t為,93,94,應(yīng)變量Y區(qū)間預(yù)測(cè)的特點(diǎn),1、平均值的預(yù)測(cè)值與真實(shí)平均值有誤差,主要是受抽樣波動(dòng)影響個(gè)別值的預(yù)測(cè)值與真實(shí)個(gè)別值的差異,不僅受抽樣波動(dòng)影響,而且還受隨機(jī)擾動(dòng)項(xiàng)的影響,95,2、平均值和個(gè)別值預(yù)測(cè)區(qū)間都不是常數(shù),是隨的變化而變化的3、預(yù)測(cè)區(qū)間上下限與樣本容量有關(guān),當(dāng)樣本容量時(shí)個(gè)別值的預(yù)測(cè)誤差只決定于隨機(jī)擾動(dòng)的方差,96,97,第六節(jié)案例分析,提出問題:改

30、革開放以來隨著中國經(jīng)濟(jì)的快速發(fā)展,居民的消費(fèi)水平也不斷增長(zhǎng)。但全國各地區(qū)經(jīng)濟(jì)發(fā)展速度不同,居民消費(fèi)水平也有明顯差異。為了分析什么是影響各地區(qū)居民消費(fèi)支出有明顯差異的最主要因素,并分析影響因素與消費(fèi)水平的數(shù)量關(guān)系,可以建立相應(yīng)的計(jì)量經(jīng)濟(jì)模型去研究。研究范圍:全國各省市2002年城市居民家庭平均每人每年消費(fèi)截面數(shù)據(jù)模型。,98,理論分析:影響各地區(qū)城市居民人均消費(fèi)支出的因素有多種,但從理論和經(jīng)驗(yàn)分析,最主要的影響因素應(yīng)是居民收入。從理論上說可支配收入越高,居民消費(fèi)越多,但邊際消費(fèi)傾向大于0,小于1。建立模型:其中:Y城市居民家庭平均每人每年消費(fèi)支出(元)X城市居民人均年可支配收入(元),99,數(shù)據(jù):從2002年中國統(tǒng)計(jì)年鑒中得到,100,(接上頁數(shù)據(jù)表),101,估計(jì)參數(shù),具體操作:使用EViews軟件包。估計(jì)結(jié)果:,假定模型中隨機(jī)擾動(dòng)滿足基本假定,可用OLS法。,102,表示為,103,1.可決系數(shù):模型整體上擬合好。2.系數(shù)顯著性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論