版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2023/2/212023/2/21經(jīng)典計(jì)量經(jīng)濟(jì)學(xué)模型
.2023/2/222023/2/22第一節(jié)回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念
二、總體回歸函數(shù)三、隨機(jī)擾動(dòng)項(xiàng)四、樣本回歸函數(shù)(SRF)2023/2/232023/2/23
回歸分析概述
(1)確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。(2)統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。一、變量間的關(guān)系及回歸分析的基本概念
1、變量間的關(guān)系經(jīng)濟(jì)變量之間的關(guān)系,大體可分為兩類:2023/2/242023/2/24
由于變量間關(guān)系的隨機(jī)性,回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當(dāng)解釋變量取某個(gè)確定值時(shí),與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值。
例1:一個(gè)假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。即如果知道了家庭的月收入,能否預(yù)測該社區(qū)家庭的平均月消費(fèi)支出水平。
二、總體回歸函數(shù)
為達(dá)到此目的,將該100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費(fèi)支出。2023/2/252023/2/252023/2/262023/2/26
(1)由于不確定因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支出不完全相同;(2)但由于調(diào)查的完備性,給定收入水平X的消費(fèi)支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)是已知的,如:P(Y=561|X=800)=1/4。因此,給定收入X的值Xi,可得消費(fèi)支出Y的條件均值(conditionalmean)或條件期望(conditionalexpectation):
E(Y|X=Xi)該例中:E(Y|X=800)=605分析:2023/2/27..2023/2/27收入水平800110014001700200023002600290032003500條件概率
1/4
1/61/111/131/131/141/131/10
1/9
1/6條件均值605825104512651485170519252145236525852023/2/282023/2/28
描出散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費(fèi)支出Y(元)
2023/2/292023/2/29概念:
在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(populationregressionline),或更一般地稱為總體回歸曲線(populationregressioncurve)。稱為(雙變量)總體回歸函數(shù)(populationregressionfunction,PRF)。
相應(yīng)的函數(shù):2023/2/2102023/2/210
回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。含義:
函數(shù)形式:可以是線性或非線性的。
例中,將居民消費(fèi)支出看成是其可支配收入的線性函數(shù)時(shí):為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)。2023/2/2112023/2/211
三、隨機(jī)擾動(dòng)項(xiàng)
總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對(duì)某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個(gè)不可觀測的隨機(jī)變量,又稱為隨機(jī)干擾項(xiàng)(stochasticdisturbance)或隨機(jī)誤差項(xiàng)(stochasticerror)。記2023/2/2122023/2/212例中,個(gè)別家庭的消費(fèi)支出為:
(*)式稱為總體回歸函數(shù)(方程)PRF的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響。
(1)該收入水平下所有家庭的平均消費(fèi)支出E(Y|Xi),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分。(2)其他隨機(jī)或非確定性(nonsystematic)部分i。即,給定收入水平Xi,個(gè)別家庭的支出可表示為兩部分之和:(*)
由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)學(xué)模型,因此也稱為總體回歸模型。2023/2/2132023/2/213隨機(jī)誤差項(xiàng)主要包括下列因素的影響:1)在解釋變量中被忽略的因素的影響;2)變量觀測值的觀測誤差的影響;3)模型關(guān)系的設(shè)定誤差的影響;4)其它隨機(jī)因素的影響。產(chǎn)生并設(shè)計(jì)隨機(jī)誤差項(xiàng)的主要原因:1)理論的含糊性;2)數(shù)據(jù)的欠缺;3)節(jié)省原則。2023/2/2142023/2/214
四、樣本回歸函數(shù)(SRF)
問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?
問:能否從該樣本估計(jì)總體回歸函數(shù)PRF?回答:能
例2在例1的總體中有如下一個(gè)樣本,
總體的信息往往無法掌握,現(xiàn)實(shí)的情況只能是在一次觀測中得到總體的一個(gè)樣本。2023/2/2152023/2/215該樣本的散點(diǎn)圖(scatterdiagram):
樣本散點(diǎn)圖近似于一條直線,畫一條直線以盡好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為樣本回歸線(sampleregressionlines)。
記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sampleregressionfunction,SRF)。
2023/2/2162023/2/216
這里將樣本回歸線看成總體回歸線的近似替代則
注意:2023/2/2172023/2/217
樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機(jī)形式:
由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型(sampleregressionmodel)。2023/2/2182023/2/218
▼回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。注意:這里PRF可能永遠(yuǎn)無法知道。即,根據(jù)
估計(jì)2023/2/2192023/2/219第二節(jié)一元線性回歸模型的參數(shù)估計(jì)
一、一元線性回歸模型的基本假設(shè)二、參數(shù)的普通最小二乘估計(jì)(OLS)三、最小二乘估計(jì)量的性質(zhì)四、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)
2023/2/2202023/2/220單方程計(jì)量經(jīng)濟(jì)學(xué)模型分為兩大類:線性模型和非線性模型線性模型中,變量之間的關(guān)系呈線性關(guān)系非線性模型中,變量之間的關(guān)系呈非線性關(guān)系
一元線性回歸模型:只有一個(gè)解釋變量
i=1,2,…,nY為被解釋變量,X為解釋變量,0與1為待估參數(shù),為隨機(jī)干擾項(xiàng)2023/2/2212023/2/221
回歸分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準(zhǔn)確地估計(jì)總體回歸函數(shù)(模型)PRF。
估計(jì)方法有多種,其種最廣泛使用的是普通最小二乘法(ordinaryleastsquares,OLS)。
為保證參數(shù)估計(jì)量具有良好的性質(zhì),通常對(duì)模型提出若干基本假設(shè)。
注:實(shí)際這些假設(shè)與所采用的估計(jì)方法緊密相關(guān)。2023/2/2222023/2/222
一、線性回歸模型的基本假設(shè)
假設(shè)1、解釋變量X是確定性變量,不是隨機(jī)變量;假設(shè)2、隨機(jī)誤差項(xiàng)具有零均值、同方差和不序列相關(guān)性:
E(i)=0i=1,2,…,nVar(i)=2i=1,2,…,nCov(i,j)=0i≠ji,j=1,2,…,n
假設(shè)3、隨機(jī)誤差項(xiàng)與解釋變量X之間不相關(guān):
Cov(Xi,i)=0i=1,2,…,n
假設(shè)4、服從零均值、同方差、零協(xié)方差的正態(tài)分布i~N(0,2)i=1,2,…,n2023/2/2232023/2/223
1、如果假設(shè)1、2滿足,則假設(shè)3也滿足;
2、如果假設(shè)4滿足,則假設(shè)2也滿足。
以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯(Gauss)假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型(ClassicalLinearRegressionModel,CLRM)。
2023/2/2242023/2/224
另外,在進(jìn)行模型回歸時(shí),還有兩個(gè)暗含的假設(shè):
假設(shè)5:隨著樣本容量的無限增加,解釋變量X的樣本方差趨于一有限常數(shù)。即
假設(shè)6:回歸模型是正確設(shè)定的
假設(shè)5旨在排除時(shí)間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變量,因?yàn)檫@類數(shù)據(jù)不僅使大樣本統(tǒng)計(jì)推斷變得無效,而且往往產(chǎn)生所謂的偽回歸問題(spuriousregressionproblem)。假設(shè)6也被稱為模型沒有設(shè)定偏誤(specificationerror)2023/2/2252023/2/225案例分析
某地個(gè)人儲(chǔ)蓄Y,個(gè)人可支配收入X。根據(jù)經(jīng)濟(jì)理論建立計(jì)量經(jīng)濟(jì)模型2023/2/2262023/2/226圖形檢驗(yàn)
2023/2/2272023/2/227二、參數(shù)的普通最小二乘估計(jì)(OLS)
給定一組樣本觀測值(Xi,Yi)(i=1,2,…n)要求樣本回歸函數(shù)盡可能好地?cái)M合這組值.
普通最小二乘法(Ordinaryleastsquares,OLS)給出的判斷標(biāo)準(zhǔn)是:二者之差的平方和最小。2023/2/2282023/2/229求平方和的極值2023/2/2302023/2/230方程組(*)稱為正規(guī)方程組(normalequations)。
2023/2/231可以寫成.2023/2/2312023/2/2322023/2/232
例2:在上述家庭可支配收入-消費(fèi)支出例中,對(duì)于所抽出的一組樣本數(shù),參數(shù)估計(jì)的計(jì)算可通過下面的表2.2.1進(jìn)行。
2023/2/2332023/2/233因此,由該樣本估計(jì)的回歸方程為:
2023/2/234幾個(gè)常用的結(jié)果.2023/2/2342023/2/235....35(1)、估計(jì)殘差均值為零2023/2/22023/2/236..2023/2/236..36(2)、估計(jì)殘差與自變量不相關(guān)
(Residualsareunrelatedwithindependentvariable)2023/2/22023/2/237..37(3)、Y的真實(shí)值和擬合值有共同的均值2023/2/22023/2/2382023/2/238記上述參數(shù)估計(jì)量可以寫成:
稱為OLS估計(jì)量的離差形式(deviationform)。由于參數(shù)的估計(jì)結(jié)果是通過最小二乘法得到的,故稱為普通最小二乘估計(jì)量(ordinaryleastsquaresestimators)。
2023/2/2392023/2/239順便指出,記則有
可得
(**)式也稱為樣本回歸函數(shù)的離差形式。(**)注意:在計(jì)量經(jīng)濟(jì)學(xué)中,往往以小寫字母表示對(duì)均值的離差。
2023/2/2402023/2/240
三、最小二乘估計(jì)量的性質(zhì)
當(dāng)模型參數(shù)估計(jì)出后,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。
一個(gè)用于考察總體的估計(jì)量,可從如下幾個(gè)方面考察其優(yōu)劣性:
(1)線性性,即它是否是另一隨機(jī)變量的線性函數(shù);
(2)無偏性,即它的均值或期望值是否等于總體的真實(shí)值;
(3)有效性,即它是否在所有線性無偏估計(jì)量中具有最小方差。2023/2/2412023/2/241(4)漸近無偏性,即樣本容量趨于無窮大時(shí),是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無窮大時(shí),它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無窮大時(shí),是否它在所有的一致估計(jì)量中具有最小的漸近方差。
這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì)。擁有這類性質(zhì)的估計(jì)量稱為最佳線性無偏估計(jì)量(bestlinerunbiasedestimator,BLUE)。
當(dāng)不滿足小樣本性質(zhì)時(shí),需進(jìn)一步考察估計(jì)量的大樣本或漸近性質(zhì):2023/2/2422023/2/242高斯—馬爾可夫定理(Gauss-Markovtheorem)
在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)量是具有最小方差的線性無偏估計(jì)量。2023/2/2432023/2/243證:易知故同樣地,容易得出
2023/2/2442023/2/2442023/2/2452023/2/24545(2)證明最小方差性2023/2/2462023/2/246462023/2/2472023/2/247
由于最小二乘估計(jì)量擁有一個(gè)“好”的估計(jì)量所應(yīng)具備的小樣本特性,它自然也擁有大樣本特性。
2023/2/248總體2023/2/248
在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(populationregressionline),或更一般地稱為總體回歸曲線(populationregressioncurve)。2023/2/249樣本.總體的信息往往無法掌握,現(xiàn)實(shí)的情況只能是在一次觀測中得到總體的一個(gè)樣本。記樣本回歸線的函數(shù)形式為:同樣地,樣本回歸函數(shù)也有如下的隨機(jī)形式:2023/2/2492023/2/250回歸分析的主要目的根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。根據(jù):估計(jì):2023/2/2502023/2/2512023/2/2512023/2/2512023/2/252估計(jì)假設(shè)條件:對(duì)隨機(jī)擾動(dòng)項(xiàng)的五個(gè)假定估計(jì)方法:最小二乘法估計(jì)結(jié)果:參數(shù)具有線性性、無偏性、有效性2023/2/2522023/2/2532023/2/253
四、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)
2023/2/2542023/2/2552023/2/2552023/2/2562023/2/2562、隨機(jī)誤差項(xiàng)的方差2的估計(jì)
由于隨機(jī)項(xiàng)i不可觀測,只能從i的估計(jì)——?dú)埐頴i出發(fā),對(duì)總體方差進(jìn)行估計(jì)。
2又稱為總體方差。
可以證明,2的最小二乘估計(jì)量為它是關(guān)于2的無偏估計(jì)量。
2023/2/2572023/2/2572023/2/2582023/2/2592023/2/2592023/2/2602023/2/260第三節(jié)一元線性回歸模型統(tǒng)計(jì)檢驗(yàn)
一、擬合優(yōu)度檢驗(yàn)
二、變量的顯著性檢驗(yàn)
三、參數(shù)的置信區(qū)間
2023/2/2612023/2/261回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。
盡管從統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì)。2023/2/2622023/2/262
一、擬合優(yōu)度檢驗(yàn)
擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與樣本觀測值之間擬合程度的檢驗(yàn)。
度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R2
問題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測值,為什么還要檢驗(yàn)擬合程度?2023/2/2632023/2/263
1、總離差平方和的分解
已知由一組樣本觀測值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線
2023/2/2642023/2/264
如果Yi=?i即實(shí)際觀測值落在樣本回歸“線”上,則擬合最好??烧J(rèn)為,“離差”全部來自回歸線,而與“殘差”無關(guān)。2023/2/2652023/2/265
對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:記總體平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares)2023/2/266總體平方和(TotalSumofSquares)回歸平方和(RegressionSumofSquares)殘差平方和(ErrorSumofSquares)
對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:2023/2/2672023/2/267TSS=ESS+RSS
Y的觀測值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機(jī)勢力(RSS)。在給定樣本中,TSS不變,如果實(shí)際觀測點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此
擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS2023/2/2682023/2/2682、可決系數(shù)R2統(tǒng)計(jì)量
稱R2為(樣本)可決系數(shù)/判定系數(shù)(coefficientofdetermination)。
可決系數(shù)的取值范圍:[0,1]R2越接近1,說明實(shí)際觀測點(diǎn)離樣本線越近,擬合優(yōu)度越高。2023/2/2692023/2/2702023/2/2712023/2/271
在例2.1.1的收入-消費(fèi)支出例中,
注:可決系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是隨著抽樣的不同而不同。為此,對(duì)可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn)。
2023/2/2722023/2/272
二、變量的顯著性檢驗(yàn)
回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。在一元線性模型中,就是要判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。
變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)。計(jì)量經(jīng)濟(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗(yàn)的。
2023/2/2732023/2/273
1、假設(shè)檢驗(yàn)
所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法。先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的2023/2/274復(fù)習(xí)某商品標(biāo)準(zhǔn)規(guī)定重量u250克,標(biāo)準(zhǔn)差σ3克,重量服從正態(tài)分布。任意抽取100件,平均重量251克,規(guī)定顯著性水平α為0.05,問該批商品重量是否符合要求。1、提出假設(shè):H0u≠250;H1
u=2502、統(tǒng)計(jì)量:
由X~N(250,9)
服從N(0,1)分布。2023/2/274:::::~2023/2/275復(fù)習(xí)3、確定顯著性水平α=0.054、統(tǒng)計(jì)量分布的臨界值5、觀察z是否小于下端或大于上端的臨界值,作出否定或接受原假設(shè)的判斷。2023/2/2752023/2/2762023/2/276
2、變量的顯著性檢驗(yàn)
2023/2/2772023/2/277
檢驗(yàn)步驟:
(1)對(duì)總體參數(shù)提出假設(shè)
H0:1=0,H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值(3)給定顯著性水平,查t分布表,得臨界值t/2(n-2)(4)比較,判斷若|t|>t/2(n-2),則拒絕H0
,接受H1
;若|t|
t/2(n-2),則拒絕H1
,接受H0
;2023/2/2782023/2/278
對(duì)于一元線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn):
在上述收入-消費(fèi)支出例中,首先計(jì)算2的估計(jì)值
2023/2/2792023/2/279t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為:
給定顯著性水平=0.05,查t分布表得臨界值t0.05/2(8)=2.306|t1|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費(fèi)支出的主要解釋變量;
|t0|<2.306,表明在95%的置信度下,無法拒絕截距項(xiàng)為零的假設(shè)。
2023/2/2802023/2/280
假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)。
三、參數(shù)的置信區(qū)間
2023/2/2812023/2/281
如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間(confidenceinterval);
1-稱為置信系數(shù)(置信度)(confidencecoefficient),
稱為顯著性水平(levelofsignificance);置信區(qū)間的端點(diǎn)稱為置信限(confidencelimit)或臨界值(criticalvalues)。2023/2/2822023/2/282一元線性模型中,i(i=1,2)的置信區(qū)間:在變量的顯著性檢驗(yàn)中已經(jīng)知道:
意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2,t/2)的概率是(1-)。表示為:
即2023/2/2832023/2/283于是得到:(1-)的置信度下,i的置信區(qū)間是
在上述收入-消費(fèi)支出例中,如果給定
=0.01,查表得:由于于是,1、0的置信區(qū)間分別為:(0.6345,0.9195)
(-433.32,226.98)
2023/2/2842023/2/284
由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。
要縮小置信區(qū)間,需
(1)增大樣本容量n,因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越??;同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減??;
(2)提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。2023/2/2852023/2/285
例、消費(fèi)模型
例收入與消費(fèi)支出的關(guān)系。GDP:
國內(nèi)生產(chǎn)總值(當(dāng)年價(jià))CS1:居民消費(fèi)(當(dāng)年價(jià))cs=cs1/pInc=GDP(1-t)/p2023/2/2862023/2/286
該兩組數(shù)據(jù)是1978~2002年的時(shí)間序列數(shù)據(jù)(timeseriesdata);
1、建立模型
擬建立如下一元回歸模型
采用Eviews軟件進(jìn)行回歸分析的結(jié)果見下表
前述收入-消費(fèi)支出例中的數(shù)據(jù)是截面數(shù)據(jù)(cross-sectionaldata)。2023/2/2872023/2/287一般可寫出如下回歸分析結(jié)果:
(3.56)(49.82)R2=0.9908F=2482.37DW=0.36932023/2/2882023/2/288
2、模型檢驗(yàn)
R2=0.9908T值:α:3.56,β:49.82
臨界值:t0.05/2(25)=2.063、預(yù)測
點(diǎn)估計(jì):Cs(2003)=414.88+0.5123737=12935.63(元)
2023/2/2882023/2/289第四節(jié)多元線性回歸模型
一、多元線性回歸模型
二、多元線性回歸模型的基本假定
2023/2/2892023/2/290例題:需求函數(shù)2023/2/2902023/2/2912023/2/291
一、多元線性回歸模型
多元線性回歸模型:表現(xiàn)在線性回歸模型中的解釋變量有多個(gè)。
一般表現(xiàn)形式:i=1,2…,n其中:k為解釋變量的數(shù)目,j稱為回歸參數(shù)(regressioncoefficient)。習(xí)慣上:把常數(shù)項(xiàng)看成為一虛變量的系數(shù),該虛變量的樣本觀測值始終取1。這樣:模型中解釋變量的數(shù)目為(k+1)2023/2/2922023/2/292也被稱為總體回歸函數(shù)的隨機(jī)表達(dá)形式。它的非隨機(jī)表達(dá)式為:
方程表示:各變量X值固定時(shí)Y的平均響應(yīng)。
j也被稱為偏回歸系數(shù),表示在其他解釋變量保持不變的情況下,Xj每變化1個(gè)單位時(shí),Y的均值E(Y)的變化;
或者說j給出了Xj的單位變化對(duì)Y均值的“直接”或“凈”(不含其他變量)影響。2023/2/2932023/2/293總體回歸模型n個(gè)隨機(jī)方程的矩陣表達(dá)式為
其中2023/2/2942023/2/294樣本回歸函數(shù):用來估計(jì)總體回歸函數(shù)其隨機(jī)表示式:
ei稱為殘差或剩余項(xiàng)(residuals),可看成是總體回歸函數(shù)中隨機(jī)擾動(dòng)項(xiàng)i的近似替代。
樣本回歸函數(shù)的矩陣表達(dá):或其中:2023/2/2952023/2/295二、多元線性回歸模型的基本假定
假設(shè)1,解釋變量是非隨機(jī)的或固定的,且各X之間互不相關(guān)(無多重共線性)。
假設(shè)2,隨機(jī)誤差項(xiàng)具有零均值、同方差及不序列相關(guān)性
假設(shè)3,解釋變量與隨機(jī)項(xiàng)不相關(guān)假設(shè)4,隨機(jī)項(xiàng)滿足正態(tài)分布
2023/2/2962023/2/296上述假設(shè)的矩陣符號(hào)表示式:
假設(shè)1,n(k+1)矩陣X是非隨機(jī)的,且X的秩=k+1,即X滿秩。假設(shè)2,假設(shè)3,E(X’)=0,即
2023/2/29705001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費(fèi)支出Y(元)2023/2/2982023/2/298假設(shè)4,向量
有一多維正態(tài)分布,即
同一元回歸一樣,多元回歸還具有如下兩個(gè)重要假設(shè):假設(shè)5,樣本容量趨于無窮時(shí),各解釋變量的方差趨于有界常數(shù),即n∞時(shí),或
其中:Q為一非奇異固定矩陣,矩陣x是由各解釋變量的離差為元素組成的nk階矩陣假設(shè)6,回歸模型的設(shè)定是正確的。
2023/2/2992023/2/299第五節(jié)多元線性回歸模型的估計(jì)和檢驗(yàn)
估計(jì)方法:OLS2023/2/21002023/2/2100一、普通最小二乘估計(jì)對(duì)于隨機(jī)抽取的n組觀測值如果樣本函數(shù)的參數(shù)估計(jì)值已經(jīng)得到,則有:
i=1,2…n根據(jù)最小二乘原理,參數(shù)估計(jì)值應(yīng)該是下列方程組的解
其中2023/2/21012023/2/2101于是得到關(guān)于待估參數(shù)估計(jì)值的正規(guī)方程組:
2023/2/21022023/2/2102正規(guī)方程組的矩陣形式即由于X’X滿秩,故有
2023/2/2103.將上述過程用矩陣表示如下:
2023/2/2104矩陣導(dǎo)數(shù).2023/2/2105使用的公式.2023/2/2106
.2023/2/2107根據(jù)矩陣求導(dǎo)法則可得:2023/2/21082023/2/21082023/2/21092023/2/21092023/2/21102023/2/2110隨機(jī)誤差項(xiàng)的方差的無偏估計(jì)
可以證明,隨機(jī)誤差項(xiàng)的方差的無偏估計(jì)量為
2023/2/21112023/2/2111
二
、參數(shù)估計(jì)量的性質(zhì)
在滿足基本假設(shè)的情況下,其結(jié)構(gòu)參數(shù)的普通最小二乘估計(jì)、最大或然估計(jì)及矩估計(jì)仍具有:
線性性、無偏性、有效性。
同時(shí),隨著樣本容量增加,參數(shù)估計(jì)量具有:
漸近無偏性、漸近有效性、一致性。
1、線性性
其中,C=(X’X)-1X’為一僅與固定的X有關(guān)的行向量
2023/2/21122023/2/2112
2、無偏性
這里利用了假設(shè):E(X’)=0
3、有效性(最小方差性)
2023/2/21132023/2/2113其中利用了
和2023/2/21142023/2/2114三、
可決系數(shù).2023/2/21152023/2/2115.
1、可決系數(shù)與調(diào)整的可決系數(shù)則
總離差平方和的分解2023/2/21162023/2/2116由于
=0所以有:
2023/2/21172023/2/2117
可決系數(shù)該統(tǒng)計(jì)量越接近于1,模型的擬合優(yōu)度越高。
問題:在應(yīng)用過程中發(fā)現(xiàn),如果在模型中增加一個(gè)解釋變量,R2往往增大
這就給人一個(gè)錯(cuò)覺:要使得模型擬合得好,只要增加解釋變量即可。
但是,現(xiàn)實(shí)情況往往是,由增加解釋變量個(gè)數(shù)引起的R2的增大與擬合好壞無關(guān),R2需調(diào)整。2023/2/21182023/2/2118
調(diào)整的可決系數(shù)(adjustedcoefficientofdetermination)
在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個(gè)數(shù)對(duì)擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為總體平方和的自由度。2023/2/21192023/2/21192023/2/21202023/2/2120
四、方程的顯著性檢驗(yàn)(F檢驗(yàn))
方程的顯著性檢驗(yàn),旨在對(duì)模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。
1、方程顯著性的F檢驗(yàn)
即檢驗(yàn)?zāi)P?/p>
Yi=0+1X1i+2X2i++kXki+ii=1,2,,n中的參數(shù)j是否顯著不為0。
可提出如下原假設(shè)與備擇假設(shè):
H0:0=1=2==k=0H1:j不全為02023/2/21212023/2/2121
F檢驗(yàn)的思想來自于總離差平方和的分解式:
TSS=ESS+RSS
如果這個(gè)比值較大,則X的聯(lián)合體對(duì)Y的解釋程度高,可認(rèn)為總體存在線性關(guān)系,反之總體上可能不存在線性關(guān)系。
因此,可通過該比值的大小對(duì)總體線性關(guān)系進(jìn)行推斷。2023/2/21222023/2/2122
根據(jù)數(shù)理統(tǒng)計(jì)學(xué)中的知識(shí),在原假設(shè)H0成立的條件下,統(tǒng)計(jì)量
服從自由度為(k,n-k-1)的F分布
給定顯著性水平,可得到臨界值F(k,n-k-1),由樣本求出統(tǒng)計(jì)量F的數(shù)值,通過
F
F(k,n-k-1)或FF(k,n-k-1)來拒絕或接受原假設(shè)H0,以判定原方程總體上的線性關(guān)系是否顯著成立。2023/2/21232023/2/2123例題2023/2/21242023/2/2124
2、關(guān)于擬合優(yōu)度檢驗(yàn)與方程顯著性檢驗(yàn)關(guān)系的討論
由可推出:與或2023/2/21252023/2/2125
五、變量的顯著性檢驗(yàn)(t檢驗(yàn))
方程的總體線性關(guān)系顯著每個(gè)解釋變量對(duì)被解釋變量的影響都是顯著的
因此,必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn),以決定是否作為解釋變量被保留在模型中。這一檢驗(yàn)是由對(duì)變量的t檢驗(yàn)完成的。2023/2/21262023/2/2126
1、t統(tǒng)計(jì)量
由于
以cii表示矩陣(X’X)-1
主對(duì)角線上的第i個(gè)元素,于是參數(shù)估計(jì)量的方差為:
其中2為隨機(jī)誤差項(xiàng)的方差,在實(shí)際計(jì)算時(shí),用它的估計(jì)量代替:
2023/2/21272023/2/2127因此,可構(gòu)造如下t統(tǒng)計(jì)量
2023/2/21282023/2/2128
2、t檢驗(yàn)
設(shè)計(jì)原假設(shè)與備擇假設(shè):
H1:i0
給定顯著性水平,可得到臨界值t/2(n-k-1),由樣本求出統(tǒng)計(jì)量t的數(shù)值,通過
|t|
t/2(n-k-1)或|t|t/2(n-k-1)來拒絕或接受原假設(shè)H0,從而判定對(duì)應(yīng)的解釋變量是否應(yīng)包括在模型中。
H0:i=0
(i=1,2…k)
2023/2/21292023/2/2129注意:一元線性回歸中,t檢驗(yàn)與F檢驗(yàn)一致
一方面,t檢驗(yàn)與F檢驗(yàn)都是對(duì)相同的原假設(shè)H0:1=0
進(jìn)行檢驗(yàn);
另一方面,兩個(gè)統(tǒng)計(jì)量之間有如下關(guān)系:
2023/2/21302023/2/2130例題2023/2/21312023/2/2131
六、參數(shù)的置信區(qū)間
參數(shù)的置信區(qū)間用來考察:在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 五校聯(lián)考九年級(jí)上學(xué)期語文開學(xué)考試卷
- 菠蘿幼兒課件教學(xué)課件
- 過渡合同范本(2篇)
- 股份協(xié)議書(2篇)
- 學(xué)生會(huì)培訓(xùn)演講外聯(lián)部
- 四川機(jī)電高級(jí)技工學(xué)校災(zāi)后恢復(fù)重建項(xiàng)目施工組織設(shè)計(jì)
- 南京工業(yè)大學(xué)浦江學(xué)院《路由交換技術(shù)》2023-2024學(xué)年期末試卷
- 簡單專業(yè)分包合同(2篇)
- 南京工業(yè)大學(xué)《影視與影像(視聽語言與創(chuàng)意表達(dá))》2021-2022學(xué)年第一學(xué)期期末試卷
- 南京工業(yè)大學(xué)《土質(zhì)學(xué)與土力學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 重慶市社會(huì)保險(xiǎn)登記表
- GB/T 17396-2022液壓支柱用熱軋無縫鋼管
- 國家開放大學(xué)《植物生理學(xué)》形考作業(yè)1-3+話題討論1-3參考答案
- GB/T 39415.1-2020包裝袋特征性能規(guī)范方法第1部分:紙袋
- GB 26512-2021商用車駕駛室乘員保護(hù)
- Tio2材料的性質(zhì)及應(yīng)用-課件
- 教育科研專題講座課件
- 建筑工程常用英語詞匯
- 熱工基礎(chǔ)第一章
- 2022版小學(xué)英語新課標(biāo)詳細(xì)解讀中小學(xué)英語教師培訓(xùn)PPT模板
- 塔式起重機(jī)安裝、使用、拆卸專項(xiàng)方案
評(píng)論
0/150
提交評(píng)論