第六章-第七章：一元線性回歸模型-課件

上傳人：塞*** IP屬地：貴州上傳時(shí)間：2023-07-23 格式：PPT 頁(yè)數(shù)：112 大小：1.31MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩107頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章-第七章

一元線性回歸模型（雙變量模型）

回歸分析概述

一元線性回歸模型的參數(shù)估計(jì)

一元線性回歸模型檢驗(yàn)一元線性回歸模型預(yù)測(cè)實(shí)例§2.1回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù)（PRF）三、隨機(jī)擾動(dòng)項(xiàng)四、樣本回歸函數(shù)（SRF)一、變量間的關(guān)系及回歸分析的基本概念1.變量間的關(guān)系（1）確定性關(guān)系或函數(shù)關(guān)系：研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。（2）統(tǒng)計(jì)依賴或相關(guān)關(guān)系：研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。注：給定一個(gè)半徑，有唯一的一個(gè)圓面積與之對(duì)應(yīng)；但給定一個(gè)施肥量，與之對(duì)應(yīng)的農(nóng)作物產(chǎn)量并不能確定，即不會(huì)取唯一值。

函數(shù)關(guān)系：變量之間依一定的函數(shù)形式形成的一一對(duì)應(yīng)關(guān)系稱為函數(shù)關(guān)系。若兩個(gè)變量分別記作y和x，則當(dāng)y與x之間存在函數(shù)關(guān)系時(shí)，x值一旦被指定，y值就是唯一確定的。函數(shù)關(guān)系可以用公式確切的反映出來(lái)，一般記為y=f(x)。

例如，某種商品的銷售額y與銷售量x之間的關(guān)系，在銷售價(jià)格p一定的條件下，只要給定一個(gè)商品銷售量，就有一個(gè)唯一確定的商品銷售額與之對(duì)應(yīng)，用公式表示為y=px。

統(tǒng)計(jì)關(guān)系：兩個(gè)變量之間存在某種依存關(guān)系，但變量Y并不是由變量X唯一確定的，它們之間沒(méi)有嚴(yán)格的一一對(duì)應(yīng)關(guān)系。兩個(gè)變量之間的這種關(guān)系就是統(tǒng)計(jì)關(guān)系，也稱為相關(guān)關(guān)系。

例如：同樣收入的家庭，用于食品的消費(fèi)支出往往并不相同。因?yàn)閷?duì)家庭食品費(fèi)用的影響，不僅有家庭收入的多少，還有家庭人口，生活習(xí)慣等因素，所以，家庭食品費(fèi)用支出與家庭收入之間不是函數(shù)關(guān)系，而是相關(guān)關(guān)系。對(duì)變量間統(tǒng)計(jì)關(guān)系的考察主要是通過(guò)相關(guān)分析(correlationanalysis)和回歸分析(regressionanalysis)來(lái)完成的。相關(guān)分析主要研究隨機(jī)變量間的相關(guān)形式及相關(guān)程度。變量間相關(guān)的形式有線性相關(guān)與非線性相關(guān)之分；變量間相關(guān)程度的大小可以通過(guò)相關(guān)系數(shù)來(lái)測(cè)量。具有相關(guān)關(guān)系的變量間有時(shí)存在著因果關(guān)系，這時(shí)可以通過(guò)回歸分析來(lái)研究它們間的具體依存關(guān)系。注：變量間有因果關(guān)系，可以用回歸分析來(lái)研究；但回歸分析研究一個(gè)變量對(duì)另一個(gè)（些）變量的具體依賴關(guān)系時(shí)，它們并不意味著一定有因果關(guān)系，有無(wú)因果關(guān)系，一定要根據(jù)具體的經(jīng)濟(jì)理論來(lái)判斷（比如凱恩斯的消費(fèi)理論）。注意①不線性相關(guān)并不意味著不相關(guān)。②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系。③回歸分析研究一個(gè)變量對(duì)另一個(gè)（些）變量的具體依賴關(guān)系，但它們并不意味著一定有因果關(guān)系。④相關(guān)分析對(duì)稱地對(duì)待任何（兩個(gè)）變量，兩個(gè)變量都被看作是隨機(jī)的。回歸分析對(duì)變量的處理方法存在不對(duì)稱性，即區(qū)分應(yīng)變量（被解釋變量）和自變量（解釋變量）：前者是隨機(jī)變量，后者不是。（gm01,3.11)2.回歸分析的基本概念回歸分析(regressionanalysis)是研究一個(gè)變量關(guān)于另一個(gè)（些）變量的具體依賴關(guān)系的計(jì)算方法和理論。其目的在于通過(guò)后者的已知或設(shè)定值，去估計(jì)和（或）預(yù)測(cè)前者的（總體）均值。被解釋變量（ExplainedVariable）或應(yīng)變量（DependentVariable）。解釋變量（ExplanatoryVariable）或自變量（IndependentVariable）。回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ)，其主要內(nèi)容包括：（1）根據(jù)樣本觀察值對(duì)經(jīng)濟(jì)計(jì)量模型參數(shù)進(jìn)行估計(jì)，求得回歸方程；（2）對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn)；（3）利用回歸方程進(jìn)行分析、評(píng)價(jià)及預(yù)測(cè)。二、總體回歸函數(shù)回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值，考察被解釋變量的總體均值，即當(dāng)解釋變量取某個(gè)確定值時(shí)，與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值。例2.1：一個(gè)假想的社區(qū)有100戶家庭組成，要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系，即根據(jù)家庭的每月可支配收入，考察該社區(qū)家庭每月消費(fèi)支出的平均水平。為達(dá)到此目的，將該100戶家庭劃分為組內(nèi)收入差不多的10組，以分析每一收入組的家庭消費(fèi)支出。由于不確定因素的影響，對(duì)同一收入水平X，不同家庭的消費(fèi)支出不完全相同；但由于調(diào)查的完備性，給定收入水平X的消費(fèi)支出Y的分布是確定的，即以X的給定值為條件的Y的條件分布（Conditionaldistribution）是已知的，例如：P(Y=561|X=800）=1/4。因此，給定收入X的值Xi，可得消費(fèi)支出Y的條件均值（conditionalmean）或條件期望（conditionalexpectation）：E(Y|X=Xi)。該例中：E(Y|X=800)=605描出散點(diǎn)圖發(fā)現(xiàn)：隨著收入的增加，消費(fèi)“平均地說(shuō)”也在增加，且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。05001000150020002500300035005001000150020002500300035004000每月可支配收入X（元）每月消費(fèi)支出Y（元）********************XY雖然Y的所有條件期望都落在一條直線上，但是相同的X卻對(duì)應(yīng)著不同的Y。總體回歸函數(shù)的確定形式不能完全體現(xiàn)因變量的個(gè)別值與解釋變量的固定值之間的統(tǒng)計(jì)依賴關(guān)系。********************************************************************************在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線（populationregressionline），或更一般地稱為總體回歸曲線（populationregressioncurve）。稱為（雙變量）總體回歸函數(shù)（populationregressionfunction,PRF）。

相應(yīng)的函數(shù)：含義：回歸函數(shù)（PRF）說(shuō)明被解釋變量Y的平均狀態(tài)（總體條件期望）隨解釋變量X變化的規(guī)律。

函數(shù)形式：可以是線性或非線性的。

例2.1中，將居民消費(fèi)支出看成是其可支配收入的線性函數(shù)時(shí):

為一線性函數(shù)。其中，0，1是未知參數(shù)，稱為回歸系數(shù)（regressioncoefficients）。三、隨機(jī)擾動(dòng)項(xiàng)總體回歸函數(shù)說(shuō)明在給定的收入水平Xi下，該社區(qū)家庭平均的消費(fèi)支出水平。但對(duì)某一個(gè)別的家庭，其消費(fèi)支出可能與該平均水平有偏差。稱為觀察值（每個(gè)家庭的消費(fèi)支出）圍繞它的期望值的離差（deviation），是一個(gè)不可觀測(cè)的隨機(jī)變量，又稱為隨機(jī)干擾項(xiàng)（stochasticdisturbance）或隨機(jī)誤差項(xiàng)（stochasticerror）。例2.1中，給定收入水平Xi

（如800元）,個(gè)別家庭（如消費(fèi)支出為638元的家庭）的支出可表示為兩部分之和：（1）該收入水平下所有家庭（此處為4個(gè)家庭）的平均消費(fèi)支出E(Y|Xi)（如2420/4=605），稱為系統(tǒng)性（systematic）或確定性（deterministic)部分；（2）其他隨機(jī)或非確定性（nonsystematic)部分i。（此處為33元）。即638元（個(gè)別家庭消費(fèi)支出）=605元（平均消費(fèi)支出）+33元（偏離平均數(shù)的誤差值）稱為總體回歸函數(shù)（PRF）的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外，還受其他因素的隨機(jī)性影響。由于方程中引入了隨機(jī)項(xiàng)，成為計(jì)量經(jīng)濟(jì)學(xué)模型，因此也稱為總體回歸模型。在總體回歸函數(shù)中引入隨機(jī)干擾項(xiàng)，主要有以下幾個(gè)方面的原因：（1）代表未知的影響因素。（2）代表殘缺數(shù)據(jù)。即使所有的影響變量都被包含在模型中，也會(huì)有某些變量的數(shù)據(jù)無(wú)法取得。比如，經(jīng)濟(jì)理論中，居民消費(fèi)支出除受可支配收入影響外，還受財(cái)富擁有量的影響，但后者在實(shí)踐中往往是無(wú)法收集到的。這時(shí)模型中不得不省略掉這一變量，而將其納入隨機(jī)干擾項(xiàng)中。（3）代表眾多細(xì)小影響因素。（4）代表數(shù)據(jù)觀測(cè)誤差。由于某些主客觀的原因，在取得觀察數(shù)據(jù)時(shí)，往往存在測(cè)量誤差，這些觀測(cè)誤差也被納入隨機(jī)干擾項(xiàng)。（5）代表模型設(shè)定誤差。模型的真實(shí)函數(shù)形式往往是未知的。實(shí)際設(shè)定的模型可能與真實(shí)的模型有誤差。（6）變量的內(nèi)在隨機(jī)性。由于某些變量所固有的內(nèi)在隨機(jī)性，也會(huì)對(duì)被解釋變量產(chǎn)生隨機(jī)性影響。四、樣本回歸函數(shù)（SRF）問(wèn)題：能從一次抽樣中獲得總體的近似的信息嗎？如果可以，如何從抽樣中獲得總體的近似信息？例2.2：在例2.1的總體中有如下一個(gè)樣本，能否從該樣本估計(jì)總體回歸函數(shù)PRF？

回答：能表2.1.3

家庭消費(fèi)支出與可支配收入的一個(gè)隨機(jī)樣本

800

1100

1400

1700

2000

2300

2600

2900

3200

3500

594

638

1122

1155

1408

1595

1969

2078

2585

2530

該樣本的散點(diǎn)圖（scatterdiagram)：

畫(huà)一條直線以盡好地?cái)M合該散點(diǎn)圖，由于樣本取自總體，可以該直線近似地代表總體回歸線。該直線稱為樣本回歸線（sampleregressionlines）。

記樣本回歸線的函數(shù)形式為：稱為樣本回歸函數(shù)（sampleregressionfunction，SRF）。

注意：這里將樣本回歸線看成總體回歸線的近似替代則樣本回歸函數(shù)的隨機(jī)形式，即樣本回歸模型：同樣地，樣本回歸函數(shù)也有如下的隨機(jī)形式：

由于方程中引入了隨機(jī)項(xiàng)，成為計(jì)量經(jīng)濟(jì)模型，因此也稱為樣本回歸模型（sampleregressionmodel）。

iiiiieXYY++=+=10????bbm

▼回歸分析的主要目的：根據(jù)樣本回歸函數(shù)SRF，估計(jì)總體回歸函數(shù)PRF。即，根據(jù)

估計(jì)注意：這里PRF可能永遠(yuǎn)無(wú)法知道。小結(jié)：1.總體回歸函數(shù)2.樣本回歸函數(shù)3.總體回歸模型

4.樣本回歸模型iiieXY++=10??bb§2.2一元線性回歸模型的參數(shù)估計(jì)

一、一元線性回歸模型的基本假設(shè)二、參數(shù)的普通最小二乘估計(jì)（OLS)三*、參數(shù)估計(jì)的最大或然法(ML)四、最小二乘估計(jì)量的性質(zhì)五、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)

說(shuō)明單方程計(jì)量經(jīng)濟(jì)學(xué)模型分為兩大類：線性模型和非線性模型線性模型中，變量之間的關(guān)系呈線性關(guān)系非線性模型中，變量之間的關(guān)系呈非線性關(guān)系一元線性回歸模型：只有一個(gè)解釋變量i=1,2,…,nY為被解釋變量，X為解釋變量，0與1為待估參數(shù)，為隨機(jī)干擾項(xiàng)回歸分析的主要目的是要通過(guò)樣本回歸函數(shù)（模型）SRF盡可能準(zhǔn)確地估計(jì)總體回歸函數(shù)（模型）PRF。估計(jì)方法有多種，其中最廣泛使用的是普通最小二乘法（ordinaryleastsquares,OLS）。為保證參數(shù)估計(jì)量具有良好的性質(zhì)，通常對(duì)模型提出若干基本假設(shè)。實(shí)際這些假設(shè)與所采用的估計(jì)方法緊密相關(guān)。

一、線性回歸模型的基本假設(shè)

假設(shè)1.解釋變量X是確定性變量，不是隨機(jī)變量。如

假設(shè)2.隨機(jī)誤差項(xiàng)具有零均值、同方差和不序列相關(guān)性：

E(i)=0i=1,2,…,nVar(i)=2i=1,2,…,nCov(i,j)=0i≠ji,j=1,2,…,n

同方差：隨機(jī)干擾項(xiàng)的條件方差恒定X1:假設(shè)經(jīng)濟(jì)學(xué)0801全班30名同學(xué)個(gè)人可支配收入都是每月600元/人；Y：現(xiàn)實(shí)中消費(fèi)支出水平有30個(gè)不同的值，并用一個(gè)方差度量這30個(gè)取值的離散程度。X2:假設(shè)全班30名同學(xué)個(gè)人可支配收入增加到每月800元/人；Y：現(xiàn)實(shí)中消費(fèi)支出水平有30個(gè)不同的值，并用一個(gè)方差度量這30個(gè)取值的離散程度按照同方差假設(shè)，以上兩個(gè)方差的值是一樣的。

同方差：隨機(jī)干擾項(xiàng)的條件方差恒定

異方差：隨機(jī)干擾項(xiàng)的條件方差不一樣X(jué)1:假設(shè)全班30名同學(xué)個(gè)人可支配收入都是每月600元/人；Y：現(xiàn)實(shí)中消費(fèi)支出水平有30個(gè)不同的值，并用一個(gè)方差度量這30個(gè)取值的離散程度X2:假設(shè)全班30名同學(xué)個(gè)人可支配收入增加到每月800元/人；Y：現(xiàn)實(shí)中消費(fèi)支出水平有30個(gè)不同的值，并用一個(gè)方差度量這30個(gè)取值的離散程度按照異方差假設(shè)，以上兩個(gè)方差的值是不一樣的。任意兩個(gè)誤差項(xiàng)即隨機(jī)擾動(dòng)項(xiàng)不相關(guān)假設(shè)

（不序列相關(guān)）X1:假設(shè)全班30名同學(xué)個(gè)人可支配收入都是每月600元/人；Y：現(xiàn)實(shí)中消費(fèi)支出水平有30個(gè)不同的值。

那么30個(gè)不同的消費(fèi)支出數(shù)額可求出一個(gè)平均數(shù)。每一個(gè)人的實(shí)際消費(fèi)支出額與這個(gè)平均數(shù)的差額就是誤差項(xiàng)的取值。那么每個(gè)人都有一個(gè)誤差項(xiàng)的取值，任意兩個(gè)誤差項(xiàng)的取值應(yīng)當(dāng)是不相關(guān)的。（預(yù)測(cè)股票的走勢(shì)就像預(yù)測(cè)一只鳥(niǎo)下一步要飛到哪根樹(shù)枝上一樣）度量?jī)蓚€(gè)隨機(jī)變量的線性關(guān)系表明隨機(jī)誤差項(xiàng)是個(gè)隨機(jī)變量。由于假定任何兩個(gè)誤差項(xiàng)是不相關(guān)的，所以任何兩個(gè)Y值也是不相關(guān)的。因?yàn)?，假定給定β值和X值，Y隨著取值的變化而變化。附注：相關(guān)系數(shù)假設(shè)3.隨機(jī)誤差項(xiàng)與解釋變量X之間不相關(guān)：

Cov(Xi,i)=0i=1,2,…,n

如果X是非隨機(jī)機(jī)的（即為固定值），則該假設(shè)自動(dòng)滿足。因?yàn)橐粋€(gè)固定值與一個(gè)隨機(jī)變量之間當(dāng)然不相關(guān)。假設(shè)4.服從正態(tài)分布

i~N(0,2

)i=1,2,…,n

推導(dǎo)：誤差項(xiàng)代表了沒(méi)有納入回歸模型的其他所有影響因素。因?yàn)檫@些影響因素中，每種因素對(duì)Y的影響都很微弱。如果所有這些影響因素都是隨機(jī)的，并用μ代表所有這些影響因素之和，那么根據(jù)中心極限定理，可以假設(shè)誤差項(xiàng)服從正態(tài)分布

以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯（Gauss）假設(shè)，滿足該假設(shè)的線性回歸模型，也稱為經(jīng)典線性回歸模型（ClassicalLinearRegressionModel,CLRM）。

附注：中心極限定理一般來(lái)說(shuō)，如果一個(gè)隨機(jī)變量是由大量的相互獨(dú)立的隨機(jī)因素的影響所造成，而每個(gè)因素的作用又是很微小的，那么這個(gè)隨機(jī)變量趨于正態(tài)分布。

另外，在進(jìn)行模型回歸時(shí)，還有兩個(gè)暗含的假設(shè)：

假設(shè)5（暫時(shí)不學(xué)習(xí)）.隨著樣本容量的無(wú)限增加，解釋變量X的樣本方差趨于一有限常數(shù)。即

假設(shè)6.回歸模型是正確設(shè)定的

假設(shè)5旨在排除時(shí)間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變量，因?yàn)檫@類數(shù)據(jù)不僅使大樣本統(tǒng)計(jì)推斷變得無(wú)效，而且往往產(chǎn)生所謂的偽回歸問(wèn)題（spuriousregressionproblem）。（暫時(shí)不學(xué)習(xí)）假設(shè)6也被稱為模型沒(méi)有設(shè)定偏誤（specificationerror）二、參數(shù)的普通最小二乘估計(jì)（OLS）

給定一組樣本觀測(cè)值（Xi,Yi）（i=1,2,…n）要求樣本回歸函數(shù)盡可能好地?cái)M合這組值.

普通最小二乘法（Ordinaryleastsquares,OLS）給出的判斷標(biāo)準(zhǔn)是：二者之差的平方和最小。表2.1.3

家庭消費(fèi)支出與可支配收入的一個(gè)隨機(jī)樣本

800

1100

1400

1700

2000

2300

2600

2900

3200

3500

594

638

1122

1155

1408

1595

1969

2078

2585

2530

根據(jù)微積分學(xué)的運(yùn)算，當(dāng)Q對(duì)β的估計(jì)量的一階偏導(dǎo)數(shù)為0時(shí)，Q達(dá)到最小。方程組（*）稱為正規(guī)方程組（normalequations）。

記上述參數(shù)估計(jì)量可以寫(xiě)成：

稱為OLS估計(jì)量的離差形式（deviationform）。由于參數(shù)的估計(jì)結(jié)果是通過(guò)最小二乘法得到的，故稱為普通最小二乘估計(jì)量（ordinaryleastsquaresestimators）。

順便指出，記

則有

可得

（**）式也稱為樣本回歸函數(shù)的離差形式。（**）注意：在計(jì)量經(jīng)濟(jì)學(xué)中，往往以小寫(xiě)字母表示對(duì)均值的離差。

四、最小二乘估計(jì)量的性質(zhì)

當(dāng)模型參數(shù)估計(jì)出后，需考慮參數(shù)估計(jì)值的精度，即是否能代表總體參數(shù)的真值，或者說(shuō)需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。

一個(gè)用于考察總體的估計(jì)量，可從如下幾個(gè)方面考察其優(yōu)劣性：

（1）線性性，即它是否是另一隨機(jī)變量的線性函數(shù)；（2）無(wú)偏性，即它的均值或期望值是否等于總體的真實(shí)值；（3）有效性，即它是否在所有線性無(wú)偏估計(jì)量中具有最小方差。

這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì)。因?yàn)橐坏┠彻烙?jì)量具有該類性質(zhì)，它是不以樣本的大小而改變的。擁有這類性質(zhì)的估計(jì)量稱為最佳線性無(wú)偏估計(jì)量（bestlinerunbiasedestimator,BLUE）。

（4）漸近無(wú)偏性，即樣本容量趨于無(wú)窮大時(shí)，是否估計(jì)量的均值序列趨于總體真值；（5）一致性，即樣本容量趨于無(wú)窮大時(shí)，它是否依概率收斂于總體的真值（即隨著樣本容量的增加，估計(jì)量接近參數(shù)的真實(shí)值）；（6）漸近有效性，即樣本容量趨于無(wú)窮大時(shí)，是否它在所有的一致估計(jì)量中具有最小的漸近方差。

當(dāng)不滿足小樣本性質(zhì)時(shí)，需進(jìn)一步考察估計(jì)量的大樣本或漸近性質(zhì)：高斯—馬爾可夫定理(Gauss-Markovtheorem)

在給定經(jīng)典線性回歸的假定下，最小二乘估計(jì)量是具有最小方差的線性無(wú)偏估計(jì)量。理解：根據(jù)從總體中抽取的另外一個(gè)隨機(jī)樣本也可以通過(guò)普通最小二乘法計(jì)算出兩個(gè)參數(shù)估計(jì)值。進(jìn)一步地，其它的樣本同樣會(huì)計(jì)算出參數(shù)估計(jì)值。表2.1.3

家庭消費(fèi)支出與可支配收入的另外一個(gè)隨機(jī)樣本

800

1100

1400

1700

2000

2300

2600

2900

3200

3500

561

748

1012

1210

1364

1672

1881

2189

2486

2629

理解：在前面由100戶家庭組成的總體中，若抽取10個(gè)樣本出來(lái)。那么每一個(gè)樣本可以通過(guò)普通最小二乘法進(jìn)行參數(shù)估計(jì)。截距項(xiàng)就有10個(gè)不同的估計(jì)值，同理，解釋變量前面的系數(shù)也有10個(gè)不同的估計(jì)值。如果用其它的方法（非普通最小二乘估計(jì)法）來(lái)進(jìn)行參數(shù)估計(jì)，同樣也會(huì)得到截距項(xiàng)的10個(gè)不同的估計(jì)值，以及解釋變量前面的系數(shù)的10個(gè)不同的估計(jì)值。比較以下數(shù)據(jù)的大?。河肙LS法求出的10個(gè)截距值的方差用非OLS法求出的10個(gè)截距值的方差結(jié)果：用OLS法求出的10個(gè)截距值的方差最小

普通最小二乘估計(jì)量（ordinaryleastSquaresEstimators）稱為最佳線性無(wú)偏估計(jì)量（bestlinearunbiasedestimator,BLUE）比較以下數(shù)據(jù)的大?。河肙LS法求出的解釋變量前系數(shù)的10個(gè)估計(jì)值的方差用非OLS法求出的解釋變量前系數(shù)的10個(gè)估計(jì)值的方差結(jié)果：用OLS法估計(jì)的解釋變量前系數(shù)的10個(gè)估計(jì)值的方差最小埋伏筆：參數(shù)估計(jì)量在此有10個(gè)具體的估計(jì)值，因此參數(shù)估計(jì)量本身就是一個(gè)隨機(jī)變量，進(jìn)而有必要探討參數(shù)估計(jì)量的概率分布,而概率分布的數(shù)字特征主要有兩個(gè)，一個(gè)是期望，一個(gè)是方差。

由于最小二乘估計(jì)量擁有一個(gè)“好”的估計(jì)量所應(yīng)具備的小樣本特性，它自然也擁有大樣本特性。

五、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)（教材P125）附注：

由于μ服從正態(tài)分布，μi~N（0

,σ2），而Y是μ的線性組合，即因此，Y也服從正態(tài)分布

Yi~N（β0+β1Xi,σ2）又因?yàn)椋荵i的線性組合，所以，也服從正態(tài)分布。2.隨機(jī)誤差項(xiàng)的方差2的估計(jì)2又稱為總體方差。

由于隨機(jī)項(xiàng)i不可觀測(cè)，只能從i的估計(jì)——?dú)埐頴i出發(fā)，對(duì)總體方差進(jìn)行估計(jì)。可以證明，2的最小二乘估計(jì)量為它是關(guān)于2的無(wú)偏估計(jì)量。

§2.3一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)

一、擬合優(yōu)度檢驗(yàn)二、變量的顯著性檢驗(yàn)三、參數(shù)的置信區(qū)間說(shuō)明回歸分析是要通過(guò)樣本所估計(jì)的參數(shù)來(lái)代替總體的真實(shí)參數(shù)，或者說(shuō)是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計(jì)性質(zhì)上已知，如果有足夠多的重復(fù)抽樣，參數(shù)的估計(jì)值的期望（均值）就等于其總體的參數(shù)真值，但在一次抽樣中，估計(jì)值不一定就等于該真值。那么，在一次抽樣中，參數(shù)的估計(jì)值與真值的差異有多大，是否顯著，這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì)。

一、擬合優(yōu)度檢驗(yàn)

擬合優(yōu)度檢驗(yàn)：對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。度量擬合優(yōu)度的指標(biāo)：判定系數(shù)（可決系數(shù)）R2

問(wèn)題：采用普通最小二乘估計(jì)方法，已經(jīng)保證了樣本回歸線最好地?cái)M合了樣本觀測(cè)點(diǎn)，為什么還要檢驗(yàn)擬合程度？

回答：在一個(gè)特定的條件下做得最好的并不一定就是高質(zhì)量的。比方，假如你采用最好的學(xué)習(xí)方法學(xué)習(xí)計(jì)量經(jīng)濟(jì)學(xué)（該方法冠名為“普通最小二乘學(xué)習(xí)法”，可以保證你取得最好的考試成績(jī)。但是這個(gè)最好成績(jī)也有可能通過(guò)考核發(fā)現(xiàn)只有55分（不及格），但已經(jīng)是你的最好成績(jī)了；也有可能是99分，但不管怎樣，要通過(guò)考核才知道這個(gè)對(duì)于你來(lái)說(shuō)的最好成績(jī)到底是多少分?？傊瑢?duì)于你來(lái)說(shuō)的最好成績(jī)，不一定就是高分。1、總離差平方和的分解

已知由一組樣本觀測(cè)值（Xi,Yi），i=1,2…,n得到如下樣本回歸直線

表2.1.3

家庭消費(fèi)支出(Y)與可支配收入(X)的一個(gè)隨機(jī)樣本

X800

1100

1400

1700

2000

2300

2600

2900

3200

3500

594

638

1122

1155

1408

1595

1969

2078

2585

2530

注：如果Yi=?i

即實(shí)際觀測(cè)值落在樣本回歸“線”上，則Y的第i個(gè)觀察值與樣本均值的離差，全部來(lái)自樣本回歸擬合值與樣本均值的離差，即完全可由樣本回歸線解釋，表明在該點(diǎn)處實(shí)現(xiàn)完全擬合（擬合最好）。這時(shí)可認(rèn)為，“離差”全部來(lái)自回歸線，而與“殘差”無(wú)關(guān)。

對(duì)于所有的樣本點(diǎn)（本例為10個(gè)樣本點(diǎn)），則需考慮這些點(diǎn)（家庭消費(fèi)支出的10個(gè)數(shù)額）與樣本均值（即家庭消費(fèi)支出10個(gè)數(shù)額的均值）離差的平方和,可以證明：TSS=ESS+RSS記總體平方和（TotalSumofSquares）回歸平方和（ExplainedSumofSquares）殘差平方和（ResidualSumofSquares

）

Y的觀測(cè)值圍繞其均值的總離差(totalvariation)可分解為兩部分：一部分來(lái)自回歸線(ESS)，另一部分則來(lái)自隨機(jī)勢(shì)力(RSS)。在給定樣本中，TSS不變，如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近，則ESS在TSS中占的比重越大。因此，擬合優(yōu)度：回歸平方和ESS/Y的總離差TSS2、可決系數(shù)R2統(tǒng)計(jì)量

稱R2為（樣本）可決系數(shù)/判定系數(shù)（coefficientofdetermination)。

可決系數(shù)的取值范圍：[0，1]R2越接近1，說(shuō)明實(shí)際觀測(cè)點(diǎn)離樣本線越近，擬合優(yōu)度越高。

在例2.1.1的收入－消費(fèi)支出例中，

注：可決系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是隨著抽樣的不同而不同。為此，對(duì)可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn)，這將在第3章中進(jìn)行。

二、變量的顯著性檢驗(yàn)

回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。在一元線性模型中，就是要判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。

變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)。

計(jì)量經(jīng)濟(jì)學(xué)中，主要是針對(duì)變量的參數(shù)真值是否為零來(lái)進(jìn)行顯著性檢驗(yàn)的。

1、假設(shè)檢驗(yàn)

所謂假設(shè)檢驗(yàn)，就是事先對(duì)總體參數(shù)（或總體分布形式）作出一個(gè)假設(shè)，然后利用樣本信息來(lái)判斷原假設(shè)是否合理，即判斷樣本信息與原假設(shè)是否有顯著差異，從而決定是否接受或否定原假設(shè)。假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法先假定原假設(shè)正確，然后根據(jù)樣本信息，觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理，從而判斷是否接受原假設(shè)。判斷結(jié)果合理與否，是基于“小概率事件不易發(fā)生”這一原理的2、變量的顯著性檢驗(yàn)

檢驗(yàn)步驟：

（1）對(duì)總體參數(shù)提出假設(shè)

H0：1=0，H1：10（2）以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量，并由樣本計(jì)算其值（3）給定顯著性水平，查t分布表得臨界值t/2(n-2)

(4)比較，判斷若|t|>t/2(n-2)，則拒絕H0

，接受H1

；若|t|t/2(n-2)，則拒絕H1

，接受H0

；對(duì)于一元線性回歸方程中的0，可構(gòu)造如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn)：

順便指出，記

則有

可得

（**）式也稱為樣本回歸函數(shù)的離差形式。（**）注意：在計(jì)量經(jīng)濟(jì)學(xué)中，往往以小寫(xiě)字母表示對(duì)均值的離差。

知識(shí)回顧：在上述收入—消費(fèi)支出例中，首先計(jì)算2的估計(jì)值t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為：

給定顯著性水平=0.05，查t分布表得臨界值

t0.05/2(8)=2.306|t1|>2.306，說(shuō)明家庭可支配收入在95%的置信度下顯著，即是消費(fèi)支出的主要解釋變量；

|t0|<2.306,表明在95%的置信度下，無(wú)法拒絕截距項(xiàng)為零的假設(shè)。

EVIEWS演算過(guò)程：

表2.1.3

家庭消費(fèi)支出(Y)與可支配收入(X)的一個(gè)隨機(jī)樣本

X800

1100

1400

1700

2000

2300

2600

2900

3200

3500

594

638

1122

1155

1408

1595

1969

2078

2585

2530

假設(shè)檢驗(yàn)可以通過(guò)一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍（如是否為零），但它并沒(méi)有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。

三、參數(shù)的置信區(qū)間

要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值，往往需要通過(guò)構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”，來(lái)考察它以多大的可能性（概率）包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)。

如果存在這樣一個(gè)區(qū)間，稱之為置信區(qū)間（confidenceinterval）；

1-稱為置信系數(shù)（置信度）（confidencecoefficient），

稱為顯著性水平（levelofsignificance）；置信區(qū)間的端點(diǎn)稱為置信限（confidencelimit）或臨界值（criticalvalues）。一元線性模型中，i(i=1，2）的置信區(qū)間:在變量的顯著性檢驗(yàn)中已經(jīng)知道：

意味著，如果給定置信度（1-），從分布表中查得自由度為(n-2)的臨界值，那么t值處在(-t/2,t/2)的概率是(1-)。表示為：

即于是得到:(1-)的置信度下,i的置信區(qū)間是

在上述收入-消費(fèi)支出例中，如果給定

=0.01，查表得：

由于于是，1、0的置信區(qū)間分別為：（0.6345,0.9195)

（-433.32,226.98）

由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度，因此置信區(qū)間越小越好。要縮

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第六章-第七章：一元線性回歸模型-課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第六章-第七章：一元線性回歸模型-課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔