版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
計(jì)量經(jīng)濟(jì)學(xué)第二章一元線性回歸模型1計(jì)量經(jīng)濟(jì)學(xué)第二章1從2004中國國際旅游交易會(huì)上獲悉,到2020年,中國旅游業(yè)總收入將超過3000億美元,相當(dāng)于國內(nèi)生產(chǎn)總值的8%至11%。(資料來源:國際金融報(bào)2004年11月25日第二版)◆是什么決定性的因素能使中國旅游業(yè)總收入到2020年達(dá)到3000億美元?◆旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?◆怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系?引子:
中國旅游業(yè)總收入將超過3000億美元嗎?2從2004中國國際旅游交易會(huì)上獲悉,到2020年,中國引子:應(yīng)當(dāng)考慮的問題:(1)確定作為研究對(duì)象的經(jīng)濟(jì)變量
(如中國旅游業(yè)總收入)(2)分析影響研究對(duì)象變動(dòng)的主要因素
(如中國居民收入的增長)(3)分析各種影響因素與所研究經(jīng)濟(jì)現(xiàn)象的相互關(guān)系
(決定相互聯(lián)系的數(shù)學(xué)關(guān)系式)(4)確定所研究的經(jīng)濟(jì)問題與影響因素間具體的數(shù)量關(guān)系
(需要特定的方法)(5)分析并檢驗(yàn)所得數(shù)量結(jié)論的可靠性
(需要統(tǒng)計(jì)檢驗(yàn))(6)運(yùn)用數(shù)量研究結(jié)果作經(jīng)濟(jì)分析和預(yù)測
(對(duì)數(shù)量分析的實(shí)際應(yīng)用)3應(yīng)當(dāng)考慮的問題:32.1回歸分析概述(1)確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。(2)統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。一、回歸與相關(guān)(對(duì)統(tǒng)計(jì)學(xué)的回顧)
1、變量間的關(guān)系經(jīng)濟(jì)變量之間的關(guān)系,大體可分為兩類:42.1回歸分析概述(1)確定性關(guān)系或函數(shù)關(guān)系:研究的對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的:例如:
函數(shù)關(guān)系:統(tǒng)計(jì)依賴關(guān)系/統(tǒng)計(jì)相關(guān)關(guān)系:5對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correla
2、相關(guān)關(guān)系◆相關(guān)關(guān)系的描述
相關(guān)關(guān)系最直觀的描述方式——坐標(biāo)圖(散布圖)
Y
X62、相關(guān)關(guān)系◆相關(guān)關(guān)系的描述6◆相關(guān)關(guān)系的類型
●
從涉及的變量數(shù)量看簡單相關(guān)多重相關(guān)(復(fù)相關(guān))●
從變量相關(guān)關(guān)系的表現(xiàn)形式看線性相關(guān)——散布圖接近一條直線非線性相關(guān)——散布圖接近一條曲線●
從變量相關(guān)關(guān)系變化的方向看
正相關(guān)——變量同方向變化,同增同減
負(fù)相關(guān)——變量反方向變化,一增一減
不相關(guān)7◆相關(guān)關(guān)系的類型
●
從涉及的變量數(shù)量
3、相關(guān)程度的度量—相關(guān)系數(shù)
X和Y的總體線性相關(guān)系數(shù):
其中:Var(X)-----X的方差Var(Y)-----Y的方差Cov(X,Y)-----X和Y的協(xié)方差
X和Y的樣本線性相關(guān)系數(shù):
其中:Xi和Yi分別是變量X和Y的樣本觀測值,和分別是變量X和Y樣本值的平均值83、相關(guān)程度的度量—相關(guān)系數(shù)X和Y的總體線性相關(guān)●
X和Y都是相互對(duì)稱的隨機(jī)變量,●
線性相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系●
樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由于抽樣波動(dòng),樣本相關(guān)系數(shù)是個(gè)隨機(jī)變量,其統(tǒng)計(jì)顯著性有待檢驗(yàn)●
相關(guān)系數(shù)只能反映線性相關(guān)程度,不能確定因果關(guān)系,不能說明相關(guān)關(guān)系具體接近哪條直線
計(jì)量經(jīng)濟(jì)學(xué)關(guān)心:變量間的因果關(guān)系及隱藏在隨機(jī)性后面的統(tǒng)計(jì)規(guī)律性,這有賴于回歸分析方法使用相關(guān)系數(shù)時(shí)應(yīng)注意:9●
X和Y都是相互對(duì)稱的隨機(jī)變量,使用相關(guān)系
①不線性相關(guān)并不意味著不相關(guān);
②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;③回歸分析/相關(guān)分析研究一個(gè)變量對(duì)另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。
④相關(guān)分析對(duì)稱地對(duì)待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的?;貧w分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分被解釋變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是。▲注意:10▲注意:104、回歸分析回歸的古典意義:高爾頓遺傳學(xué)的回歸概念(父母身高與子女身高的關(guān)系)回歸的現(xiàn)代意義:一個(gè)被解釋變量對(duì)若干解釋變量依存關(guān)系的研究回歸的目的(實(shí)質(zhì)):
由固定的解釋變量去估計(jì)被解釋變量的平均值114、回歸分析回歸的古典意義:11●Y的條件分布:當(dāng)解釋變量X取某固定值時(shí)(條件),Y的值不確定,Y的不同取值形成一定的分布,這是Y的條件分布?!馳的條件期望:對(duì)于X的每一個(gè)取值,Y對(duì)Y所形成的分布確定其期望或均值,稱為Y的條件期望或條件均值E(Y∣)
注意幾個(gè)概念12●Y的條件分布:注意幾個(gè)概念12
回歸線與回歸函數(shù)
●回歸線:對(duì)于每一個(gè)X的取值,都有Y的條件期望E(Y∣)與之對(duì)應(yīng),代表這些Y的條件期望的點(diǎn)的軌跡所形成的直線或曲線,稱為回歸線。●回歸函數(shù):被解釋變量Y的條件期望E(Y∣)隨解釋變量X的的變化而有規(guī)律的變化,如果把Y的條件期望E(Y∣)表現(xiàn)為X的某種函數(shù)E(Y∣)=f()這個(gè)函數(shù)稱為回歸函數(shù)。回歸函數(shù)分為:總體回歸函數(shù)樣本回歸函數(shù)13回歸線與回歸函數(shù)●回歸線:對(duì)于每一個(gè)X的取值,每月家庭可支配收入X100015002000250030003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每960121013101432183510682319248828563201月125913401520188520662321258729003288家132414001615194321852365265030213399庭1448165020372210239827893064消1489171220782289248728533142費(fèi)1538177821792313251329343274支160018412298239825383110出17021886231624232567
Y1900238724532610201224982487271025892586900115014001650190021502400265029003150舉例:假如已知100個(gè)家庭構(gòu)成的總體二、總體回歸函數(shù)(PRF)14每月家庭可支配收入X10001500200二、總體回歸函數(shù)(PRF)1、總體回歸函數(shù)的概念
前提:假如已知所研究的經(jīng)濟(jì)現(xiàn)象的總體被解釋變量Y和解釋變量X的每個(gè)觀測值,可以計(jì)算出總體被解釋變量Y的條件均值E(Y∣),并將其表現(xiàn)為解釋變量X的某種函數(shù)這個(gè)函數(shù)稱為總體回歸函數(shù)(PRF)15二、總體回歸函數(shù)(PRF)1、總體回歸函數(shù)的概念152、總體回歸函數(shù)的表現(xiàn)形式
(1)條件均值表現(xiàn)形式假如Y的條件均值E(Y∣)是解釋變量X的線性函數(shù),可表示為:
(2)個(gè)別值表現(xiàn)形式(隨機(jī)設(shè)定形式)對(duì)于一定的,Y的各個(gè)別值分布在的周圍,若令各個(gè)別值與條件均值的偏差為,顯然是隨機(jī)變量則有
162、總體回歸函數(shù)的表現(xiàn)形式
(1)條件均值表現(xiàn)形式16●實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是未知的,只能根據(jù)經(jīng)濟(jì)理論和實(shí)踐經(jīng)驗(yàn)去設(shè)定?!坝?jì)量”的目的就是尋求PRF?!窨傮w回歸函數(shù)中Y與X的關(guān)系可是線性的,也可是非線性的。3、注意幾點(diǎn)17●實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是未知的,只能根據(jù)經(jīng)濟(jì)理論就變量而言是線性的——Y的條件均值是X的線性函數(shù)就參數(shù)而言是線性的——Y的條件均值是參數(shù)β的線性函數(shù)判斷:
變量、參數(shù)均”線性”
參數(shù)“線性”,變量”非線性”變量“線性”,參數(shù)”非線性”計(jì)量經(jīng)濟(jì)學(xué)中線性回歸模型主要指就參數(shù)是“線性”對(duì)線性回歸模型“線性”的兩種解釋:18就變量而言是線性的對(duì)線性回歸模型“線性”的兩種解釋:18
三、隨機(jī)擾動(dòng)項(xiàng)u
◆概念各個(gè)值與條件均值的偏差代表排除在模型以外的所有因素對(duì)Y的影響。◆性質(zhì):是期望為0有一定分布的隨機(jī)變量重要性:隨機(jī)擾動(dòng)項(xiàng)的性質(zhì)決定著計(jì)量經(jīng)濟(jì)方法的選擇19三、隨機(jī)擾動(dòng)項(xiàng)u
◆概念19◆引入隨機(jī)擾動(dòng)項(xiàng)的原因●
未知影響因素的代表●
無法取得數(shù)據(jù)的已知影響因素的代表●
眾多細(xì)小影響因素的綜合代表●
模型的設(shè)定誤差●
變量的觀測誤差●
變量內(nèi)在隨機(jī)性20◆引入隨機(jī)擾動(dòng)項(xiàng)的原因●
未知影響因素的代表20四、樣本回歸函數(shù)(SRF)樣本回歸線:對(duì)于X的一定值,取得Y的樣本觀測值,可計(jì)算其條件均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。樣本回歸函數(shù):如果把被解釋變量Y的樣本條件均值表示為解釋變量X的某種函數(shù),這個(gè)函數(shù)稱為樣本回歸函數(shù)(SRF)。Y
X
21四、樣本回歸函數(shù)(SRF)樣本回歸線:21SRF的特點(diǎn)
●每次抽樣都能獲得一個(gè)樣本,就可以擬合一條樣本回歸線,所以樣本回歸線隨抽樣波動(dòng)而變化,可以有許多條(SRF不唯一)。Y
SRF1
SRF2
X●樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致?!駱颖净貧w線還不是總體回歸線,至多只是未知總體回歸線的近似表現(xiàn)。22SRF的特點(diǎn)
●每次抽樣都能獲得一個(gè)樣本,就可以擬合一條樣本
樣本回歸函數(shù)如果為線性函數(shù),可表示為
其中:是與相對(duì)應(yīng)的Y的樣本條件均值和分別是樣本回歸函數(shù)的參數(shù)被解釋變量Y的實(shí)際觀測值不完全等于樣本條件均值,二者之差用表示,稱為剩余項(xiàng)或殘差項(xiàng):
或者樣本回歸函數(shù)的表現(xiàn)形式23樣本回歸函數(shù)如果為線性函數(shù),可表示為樣本回歸函數(shù)的表現(xiàn)形
對(duì)樣本回歸的理解如果能夠獲得和的數(shù)值,顯然:●和是對(duì)總體回歸函數(shù)參數(shù)和的估計(jì)●是對(duì)總體條件期望E(Y∣)的估計(jì)●
在概念上類似總體回歸函數(shù)中的,可視為對(duì)的估計(jì)。24對(duì)樣本回歸的理解如果能夠獲得和樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系
SRF
PRF
A
X
25樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系回歸分析的目的:
用樣本回歸函數(shù)SRF去估計(jì)總體回歸函數(shù)PRF。由于樣本對(duì)總體總是存在代表性誤差,SRF總會(huì)過高或過低估計(jì)PRF。要解決的問題:尋求一種規(guī)則和方法,使得到的SRF的參數(shù)和盡可能“接近”總體回歸函數(shù)中的參數(shù)和。這樣的“規(guī)則和方法”有多種,最常用的是最小二乘法26回歸分析的目的:262.2一元線性回歸模型的最小二乘估計(jì)用樣本去估計(jì)總體回歸函數(shù),除了樣本以外,還需要一些前提條件——假定條件一·簡單線性回歸的基本假定◆為什么要作基本假定?●模型中有隨機(jī)擾動(dòng),估計(jì)的參數(shù)是隨機(jī)變量,只有對(duì)隨機(jī)擾動(dòng)的分布作出假定,才能確定所估計(jì)參數(shù)的分布性質(zhì),也才可能進(jìn)行假設(shè)檢和區(qū)間估計(jì)●只有具備一定的假定條件,所作出的估計(jì)才具有較好的統(tǒng)計(jì)性質(zhì)。272.2一元線性回歸模型的最小二乘估計(jì)用樣本去估計(jì)總體回歸函基本假定的內(nèi)容
◆對(duì)模型和變量的假定◆對(duì)隨機(jī)擾動(dòng)項(xiàng)的假定
1、對(duì)模型和變量的假定
●假定解釋變量X是非隨機(jī)的,或者雖然是隨機(jī)的,但與擾動(dòng)項(xiàng)u是不相關(guān)的。
●假定解釋變量X在重復(fù)抽樣中為固定值。
●假定變量和模型無設(shè)定誤差。28基本假定的內(nèi)容◆對(duì)模型和變量的假定282、線性回歸模型的基本假設(shè)(1)隨機(jī)誤差項(xiàng)的零均值假設(shè)
E(ui)=0i=1,2,…,nE(Yi)=0+1Xi(2)隨機(jī)誤差項(xiàng)的同方差假設(shè)Var(ui)=u2i=1,2,…,nVar(Yi)=u2(3)隨機(jī)誤差項(xiàng)無自相關(guān)
Cov(ui,uj)=0i≠j;i,j=1,2,…,nCov(Yi,Yj)=0292、線性回歸模型的基本假設(shè)(1)隨機(jī)誤差項(xiàng)的零均值假設(shè)29
以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯(Gauss)假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型(ClassicalLinearRegressionModel,CLRM)。
4、隨機(jī)誤差項(xiàng)與解釋變量X之間不相關(guān):Cov(Xi,ui)=0i=1,2,…,n*********************************************一般在對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn),還假設(shè)u正態(tài)分布ui~N(0,u2)i=1,2,…,n30以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)或高二、參數(shù)的普通最小二乘估計(jì)(OLS)
1、普通最小二乘法的原理給定一組樣本觀測值(Xi,Yi)(i=1,2,…n)要求樣本回歸函數(shù)盡可能好地?cái)M合這組值.
普通最小二乘法(Ordinaryleastsquares,OLS)給出的判斷標(biāo)準(zhǔn)是:二者之差的平方和最小。31二、參數(shù)的普通最小二乘估計(jì)(OLS)1、普通最小二乘法的原方程組(*)稱為正規(guī)方程組(normalequations)。
2、正規(guī)方程組32方程組(*)稱為正規(guī)方程組(normalequations記上述參數(shù)估計(jì)量可以寫成:
稱為OLS估計(jì)量的離差形式(deviationform)。
3、回歸系數(shù)的估計(jì)量由正規(guī)方程組33記上述參數(shù)估計(jì)量可以寫成:稱為OLS估計(jì)量的離差形式(de
由于參數(shù)的估計(jì)結(jié)果是通過最小二乘法得到的,故稱為普通最小二乘估計(jì)量(ordinaryleastsquaresestimators)。注意:OLS估計(jì)量可由觀測值計(jì)算;OLS估計(jì)量是點(diǎn)估計(jì)量;一旦從樣本數(shù)據(jù)得到OLS估計(jì)值,就可畫出樣本回歸線。34由于參數(shù)的估計(jì)結(jié)果是通過最小二乘法得到的,故稱為順便指出,記則有
可得
(**)式也稱為樣本回歸函數(shù)的離差形式。(**)注意:在計(jì)量經(jīng)濟(jì)學(xué)中,往往以小寫字母表示對(duì)均值的離差。
35順便指出,記則有可得(**)式也稱為樣本回歸函數(shù)的離差4、樣本回歸線的性質(zhì)364、樣本回歸線的性質(zhì)363737性質(zhì)3:殘差和等于零,即38性質(zhì)3:殘差和等于零,即3839394040
三、最小二乘估計(jì)量的性質(zhì)當(dāng)模型參數(shù)估計(jì)出后,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。一個(gè)用于考察總體的估計(jì)量,可從如下幾個(gè)方面考察其優(yōu)劣性:
(1)線性性,即它是否是另一隨機(jī)變量的線性函數(shù);
(2)無偏性,即它的均值或期望值是否等于總體的真實(shí)值;
(3)有效性,即它是否在所有線性無偏估計(jì)量中具有最小方差。41三、最小二乘估計(jì)量的性質(zhì)當(dāng)模型參數(shù)估計(jì)出(4)漸近無偏性,即樣本容量趨于無窮大時(shí),是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無窮大時(shí),它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無窮大時(shí),是否它在所有的一致估計(jì)量中具有最小的漸近方差。
這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì)。擁有這類性質(zhì)的估計(jì)量稱為最佳線性無偏估計(jì)量(bestlinerunbiasedestimator,BLUE)。
當(dāng)不滿足小樣本性質(zhì)時(shí),需進(jìn)一步考察估計(jì)量的大樣本或漸近性質(zhì):42(4)漸近無偏性,即樣本容量趨于無窮大時(shí),是否它的均值序列趨高斯—馬爾可夫定理(Gauss-Markovtheorem)
在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)量是具有最小方差的線性無偏估計(jì)量。43高斯—馬爾可夫定理(Gauss-Markovtheorem普通最小二乘估計(jì)量(ordinaryleastSquaresEstimators)稱為最佳線性無偏估計(jì)量(bestlinearunbiasedestimator,BLUE)
44普通最小二乘估計(jì)量(ordinaryleastSq四、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)
45四、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)4546462、隨機(jī)誤差項(xiàng)u的方差2的估計(jì)由于隨機(jī)項(xiàng)ui不可觀測,只能從ui的估計(jì)——?dú)埐頴i出發(fā),對(duì)總體方差進(jìn)行估計(jì)。
2又稱為總體方差。
可以證明,2的最小二乘估計(jì)量為它是關(guān)于2的無偏估計(jì)量。
472、隨機(jī)誤差項(xiàng)u的方差2的估計(jì)由于隨機(jī)項(xiàng)ui不可觀測48482.3
一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)
一、擬合優(yōu)度檢驗(yàn)
二、變量的顯著性檢驗(yàn)
三、參數(shù)的置信區(qū)間
492.3一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)一、擬合優(yōu)度檢驗(yàn)回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì)。50回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說
一、擬合優(yōu)度檢驗(yàn)
擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與樣本觀測值之間擬合程度的檢驗(yàn)。
度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R2
問題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測值,為什么還要檢驗(yàn)擬合程度?51一、擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與1、總離差平方和的分解
已知由一組樣本觀測值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線
521、總離差平方和的分解已知由一組樣本觀測值(Xi,Y如果Yi=?i即實(shí)際觀測值落在樣本回歸“線”上,則擬合最好??烧J(rèn)為,“離差”全部來自回歸線,而與“殘差”無關(guān)。53如果Yi=?i即實(shí)際觀測值落在樣本回歸“線
對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:記總體平方和回歸平方和殘差平方和54對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平TSS=ESS+RSS
Y的觀測值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(RSS),另一部分則來自隨機(jī)勢力(RSS)。在給定樣本中,TSS不變,如果實(shí)際觀測點(diǎn)離樣本回歸線越近,則RSS在TSS中占的比重越大,因此
擬合優(yōu)度:回歸平方和RSS/Y的總離差TSS55TSS=ESS+RSSY的觀測值圍繞其均值的總2、可決系數(shù)R2統(tǒng)計(jì)量
稱R2為(樣本)可決系數(shù)/判定系數(shù)(coefficientofdetermination)。
可決系數(shù)的取值范圍:[0,1]R2越接近1,說明實(shí)際觀測點(diǎn)離樣本線越近,擬合優(yōu)度越高。562、可決系數(shù)R2統(tǒng)計(jì)量稱R2為(樣本)可決系數(shù)/判定系
二、變量的顯著性檢驗(yàn)
回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。在一元線性模型中,就是要判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。
變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)。
計(jì)量經(jīng)計(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗(yàn)的。
57二、變量的顯著性檢驗(yàn)回歸分析是要判斷解釋
1、假設(shè)檢驗(yàn)
所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法。先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的581、假設(shè)檢驗(yàn)所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)2、變量的顯著性檢驗(yàn)
592、變量的顯著性檢驗(yàn)59
檢驗(yàn)步驟:
(1)對(duì)總體參數(shù)提出假設(shè)H0:1=0,H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值(3)給定顯著性水平,查t分布表,得臨界值t/2(n-2)(4)比較,判斷若|t|>t/2(n-2),則拒絕H0,接受H1;若|t|
t/2(n-2),則拒絕H1,接受H0;60檢驗(yàn)步驟:(1)對(duì)總體參數(shù)提出假設(shè)(2)以原假設(shè)用P值判斷參數(shù)的顯著性假設(shè)檢驗(yàn)的p值:
p值是根據(jù)既定的樣本數(shù)據(jù)所計(jì)算的統(tǒng)計(jì)量,拒絕原假設(shè)的最小顯著性水平統(tǒng)計(jì)分析軟件中通常都給出了檢驗(yàn)的p值方法:將給定的顯著性水平與p值比較:?若值,則在顯著性水平下拒絕原假設(shè),即認(rèn)為X對(duì)Y有顯著影響?若值,則在顯著性水平下接受原假設(shè),即認(rèn)為X對(duì)Y沒有顯著影響規(guī)則:當(dāng)時(shí),P值越小,越能拒絕原假設(shè)61用P值判斷參數(shù)的顯著性假設(shè)檢驗(yàn)的p值:61
假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)。
三、參數(shù)的置信區(qū)間
62假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間(confidenceinterval);
1-稱為置信系數(shù)(置信度)(confidencecoefficient),
稱為顯著性水平(levelofsignificance);置信區(qū)間的端點(diǎn)稱為置信限(confidencelimit)或臨界值(criticalvalues)。63如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間(confide一元線性模型中,i(i=0,1)的置信區(qū)間:在變量的顯著性檢驗(yàn)中已經(jīng)知道:
意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2,t/2)的概率是(1-)。表示為:
即64一元線性模型中,i(i=0,1)的置信區(qū)間:在變量的顯著
由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。
要縮小置信區(qū)間,需
(1)增大樣本容量n,因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越小;同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減小;
(2)提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。65由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)2.4一元線性回歸分析的應(yīng)用:預(yù)測問題一、回歸分析結(jié)果的報(bào)告經(jīng)過模型的估計(jì)、檢驗(yàn),得到一系列重要的數(shù)據(jù),為了簡明、清晰、規(guī)范地表述這些數(shù)據(jù),計(jì)量經(jīng)濟(jì)學(xué)通常采用以下規(guī)范化的方式:例如:回歸結(jié)果為=24.4545+0.5091(6.4138)(0.0357)標(biāo)準(zhǔn)誤差SEt=(3·8128)(14.2605)t統(tǒng)計(jì)量=0.9621df=8可決系數(shù)和自由度F=202.87DW=2.3F統(tǒng)計(jì)量
DW統(tǒng)計(jì)量662.4一元線性回歸分析的應(yīng)用:預(yù)測問題一、回歸分析結(jié)果的報(bào)二、被解釋變量平均值預(yù)測1、基本思想●運(yùn)用計(jì)量經(jīng)濟(jì)模型作預(yù)測是利用所估計(jì)的樣本回歸函數(shù),用解釋變量的已知值或預(yù)測值,對(duì)預(yù)測期或樣本以外的被解釋變量數(shù)值作出定量的估計(jì)?!裼?jì)量經(jīng)濟(jì)預(yù)測是一種條件預(yù)測:
條件:模型設(shè)定的關(guān)系式不變所估計(jì)的參數(shù)不變
解釋變量在預(yù)測期的取值已作出預(yù)測對(duì)被解釋變量的預(yù)測分為平均值預(yù)測和個(gè)別值預(yù)測對(duì)被解釋變量的預(yù)測又分為點(diǎn)預(yù)測和區(qū)間預(yù)測67二、被解釋變量平均值預(yù)測1、基本思想67預(yù)測值、平均值、個(gè)別值的相互關(guān)系:
Y
是真實(shí)平均值的點(diǎn)估計(jì),也是對(duì)個(gè)別值的點(diǎn)估計(jì)個(gè)別值真實(shí)平均值點(diǎn)預(yù)測值68預(yù)測值、平均值、個(gè)別值的相互關(guān)系:2、Y平均值的點(diǎn)預(yù)測
將解釋變量預(yù)測值直接代入估計(jì)的方程這樣計(jì)算的是一個(gè)點(diǎn)估計(jì)值
692、Y平均值的點(diǎn)預(yù)測
將解釋變量預(yù)測值直接代入估計(jì)的方程3、Y平均值的區(qū)間預(yù)測
基本思想:●由于存在抽樣波動(dòng),預(yù)測的平均值不一定等于真實(shí)平均值,還需要對(duì)作區(qū)間估計(jì)●為對(duì)Y作區(qū)間預(yù)測,必須確定平均值預(yù)測值的抽樣分布●
必須找出與和都有關(guān)的統(tǒng)計(jì)量703、Y平均值的區(qū)間預(yù)測
基本思想:70
具體作法(從的分布分析)
已知
可以證明
服從正態(tài)分布(為什么?),將其標(biāo)準(zhǔn)化,當(dāng)未知時(shí),只得用代替,這時(shí)有71具體作法(從的分布分析)
已知給定顯著性水平α,查t分布表,得自由度n-2的臨界值則有Y平均值的置信度為的預(yù)測區(qū)間為72給定顯著性水平α,查t分布表,得自由度n-2的臨界值三、被解釋變量個(gè)別值預(yù)測
基本思想:●既是對(duì)Y平均值的點(diǎn)預(yù)測,也是對(duì)Y個(gè)別值的點(diǎn)預(yù)測?!裼捎诖嬖陔S機(jī)擾動(dòng)的影響,Y的平均值并不等于Y的個(gè)別值●為了對(duì)Y的個(gè)別值作區(qū)間預(yù)測,需要尋找與預(yù)測值和個(gè)別值有關(guān)的統(tǒng)計(jì)量,并要明確其概率分布73三、被解釋變量個(gè)別值預(yù)測
基本思想:73
具體作法:
已知剩余項(xiàng)是與預(yù)測值和個(gè)別值都有關(guān)的變量,并且已知服從正態(tài)分布,且可證明當(dāng)用代替時(shí),對(duì)標(biāo)準(zhǔn)化的變量t為
74具體作法:
已知剩余項(xiàng)構(gòu)建個(gè)別值置信區(qū)間給定顯著性水平,查t分布表得自由度為N—2的臨界值,則有
因此,一元回歸時(shí)Y的個(gè)別值的置信度為1-α的預(yù)測區(qū)間上下限為
75構(gòu)建個(gè)別值置信區(qū)間給定顯著性水平,查t分布表得自由
被解釋變量Y區(qū)間預(yù)測的特點(diǎn):
1、Y平均值的預(yù)測值與真實(shí)平均值有誤差,主要是受抽樣波動(dòng)影響Y個(gè)別值的預(yù)測值與真實(shí)個(gè)別值的差異,不僅受抽樣波動(dòng)影響,而且還受隨機(jī)擾動(dòng)項(xiàng)的影響2、平均值和個(gè)別值預(yù)測區(qū)間都不是常數(shù),是隨的變化而變化的3、預(yù)測區(qū)間上下限與樣本容量有關(guān),當(dāng)樣本容量n→∞時(shí),個(gè)別值的預(yù)測誤差只決定于隨機(jī)擾動(dòng)的方差。
76被解釋變量Y區(qū)間預(yù)測的特點(diǎn):
1、Y平均值的預(yù)測值與真實(shí)各種預(yù)測值的關(guān)系
Y平均值預(yù)測區(qū)間
Y個(gè)別值的預(yù)測區(qū)間
77各種預(yù)測值的關(guān)系
Y平均值預(yù)測2.5案例分析提出問題:改革開放以來隨著中國經(jīng)濟(jì)的快速發(fā)展,居民的消費(fèi)水平也不斷增長。但全國各地區(qū)經(jīng)濟(jì)發(fā)展速度不同,居民消費(fèi)水平也有明顯差異。為了分析什么是影響各地區(qū)居民消費(fèi)支出有明顯差異的最主要因素,并分析影響因素與消費(fèi)水平的數(shù)量關(guān)系,可以建立相應(yīng)的計(jì)量經(jīng)濟(jì)模型去研究。研究范圍:全國各省市2002年城市居民家庭平均每人每年消費(fèi)截面數(shù)據(jù)模型。理論分析:影響各地區(qū)城市居民人均消費(fèi)支出的因素有多種,但從理論和經(jīng)驗(yàn)分析,最主要的影響因素應(yīng)是居民收入。從理論上說可支配收入越高,居民消費(fèi)越多,但邊際消費(fèi)傾向大于0,小于1。建立模型:其中:Y—城市居民家庭平均每人每年消費(fèi)支出(元)
X—城市居民人均年可支配收入(元)782.5案例分析提出問題:改革開放以來隨著中國經(jīng)濟(jì)的快速數(shù)據(jù)收集:從2002年《中國統(tǒng)計(jì)年鑒》中得到數(shù)據(jù):地區(qū)城市居民家庭平均每人每年消費(fèi)支出(元)Y城市居民人均年可支配收入(元)X北京天津河北山西內(nèi)蒙古遼寧吉林黑龍江上海江蘇浙江安徽福建江西山東河南湖北10284.607191.965069.284710.964859.885342.644973.884462.0810464.006042.608713.084736.526631.684549.325596.324504.685608.9212463.929337.566679.685234.356051.066524.526260.166100.5613249.808177.6411715.606032.409189.366334.647614.366245.406788.5279數(shù)據(jù)收集:從2002年《中國統(tǒng)計(jì)年鑒》中得到數(shù)據(jù):地(接上頁數(shù)據(jù)表)地區(qū)城市居民家庭平均每人每年消費(fèi)支出(元)Y城市居民人均年可支配收入(元)X湖南廣東廣西海南重慶四川貴州云南西藏陜西甘肅青海寧夏新疆5574.728988.485413.445459.646360.245413.084598.285827.926952.445278.045064.245042.526104.925636.406958.5611137.207315.326822.727238.046610.805944.087240.568079.126330.846151.446170.526067.446899.6480(接上頁數(shù)據(jù)表)地區(qū)城市居民家庭平均每人每年消費(fèi)估計(jì)參數(shù):假定模型中隨機(jī)擾動(dòng)滿足基本假定,可用OLS法。具體操作:使用EViews軟件包。估計(jì)結(jié)果:81估計(jì)參數(shù):假定模型中隨機(jī)擾動(dòng)滿足基本假定,可用OLS法。具體表示為
模型檢驗(yàn):
1、可決系數(shù):模型整體上擬合好。2、系數(shù)顯著性檢驗(yàn):給定,查t分布表,在自由度為n-2=29時(shí)臨界值為因?yàn)閠=20.44023>說明“城鎮(zhèn)人均可支配收入”對(duì)“城鎮(zhèn)人均消費(fèi)支出”有顯著影響。3、用P值檢驗(yàn):>>p=0.0000(287.2649)(0.036928)t=(0.982520)(20.54026)
F=421.9023df=2982
4、經(jīng)濟(jì)意義檢驗(yàn):估計(jì)的X的系數(shù)為0·758511,說明城鎮(zhèn)居民人均可支配收入每增加1元,人均年消費(fèi)支出平均將增加0·758511元。這符合經(jīng)濟(jì)理論對(duì)邊際消費(fèi)傾向的界定。
5、經(jīng)濟(jì)預(yù)測:
點(diǎn)預(yù)測:西部地區(qū)的城市居民人均年可支配收入第一步爭取達(dá)到1000美元(按現(xiàn)有匯率即人民幣8270元),代入估計(jì)的模型得第二步再爭取達(dá)到1500美元(即人民幣12405元),利用所估計(jì)的模型可預(yù)測這時(shí)城市居民可能達(dá)到的人均年消費(fèi)支出水平
834、經(jīng)濟(jì)意義檢驗(yàn):估計(jì)的X的系數(shù)為0·758511,說明城鎮(zhèn)平均值區(qū)間預(yù)測上下限:區(qū)間預(yù)測:
即是說:平均值置信度95%的預(yù)測區(qū)間為(6393.03,6717.23)元。平均值置信度95%的預(yù)測區(qū)間為(9292.33,10090.83)元。個(gè)別值區(qū)間預(yù)測(略)84平均值區(qū)間預(yù)測上下限:區(qū)間預(yù)測:即是說:平均值置信度95%復(fù)習(xí):計(jì)量經(jīng)濟(jì)學(xué)“四大過程”模型設(shè)計(jì):理論假說理論模型計(jì)量模型模型估計(jì):數(shù)據(jù)估計(jì)方法模型檢驗(yàn):經(jīng)濟(jì)統(tǒng)計(jì)計(jì)量模型應(yīng)用:經(jīng)濟(jì)預(yù)測政策評(píng)價(jià)結(jié)構(gòu)分析檢驗(yàn)和發(fā)展經(jīng)濟(jì)理論85復(fù)習(xí):計(jì)量經(jīng)濟(jì)學(xué)“四大過程”模型設(shè)計(jì):模型估計(jì):模型檢驗(yàn):模模型設(shè)定總體回歸模型樣本回歸模型E(ui)=0Var(ui)=2Cov(ui,uj)=0(i≠j)Cov(Xj,uj)=0
86模型設(shè)定總體回歸模型E(ui)=086模型估計(jì)87模型估計(jì)87模型檢驗(yàn)(1)擬合優(yōu)度檢驗(yàn)(樣本決定系數(shù))(2)標(biāo)準(zhǔn)差(3)顯著性檢驗(yàn)(4)區(qū)間估計(jì)88模型檢驗(yàn)(1)擬合優(yōu)度檢驗(yàn)88模型應(yīng)用(1)點(diǎn)預(yù)測(2)區(qū)間預(yù)測89模型應(yīng)用(1)點(diǎn)預(yù)測89
THANKS第二章結(jié)束了!90THANKS第二章結(jié)束了!90計(jì)量經(jīng)濟(jì)學(xué)第二章一元線性回歸模型91計(jì)量經(jīng)濟(jì)學(xué)第二章1從2004中國國際旅游交易會(huì)上獲悉,到2020年,中國旅游業(yè)總收入將超過3000億美元,相當(dāng)于國內(nèi)生產(chǎn)總值的8%至11%。(資料來源:國際金融報(bào)2004年11月25日第二版)◆是什么決定性的因素能使中國旅游業(yè)總收入到2020年達(dá)到3000億美元?◆旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?◆怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系?引子:
中國旅游業(yè)總收入將超過3000億美元嗎?92從2004中國國際旅游交易會(huì)上獲悉,到2020年,中國引子:應(yīng)當(dāng)考慮的問題:(1)確定作為研究對(duì)象的經(jīng)濟(jì)變量
(如中國旅游業(yè)總收入)(2)分析影響研究對(duì)象變動(dòng)的主要因素
(如中國居民收入的增長)(3)分析各種影響因素與所研究經(jīng)濟(jì)現(xiàn)象的相互關(guān)系
(決定相互聯(lián)系的數(shù)學(xué)關(guān)系式)(4)確定所研究的經(jīng)濟(jì)問題與影響因素間具體的數(shù)量關(guān)系
(需要特定的方法)(5)分析并檢驗(yàn)所得數(shù)量結(jié)論的可靠性
(需要統(tǒng)計(jì)檢驗(yàn))(6)運(yùn)用數(shù)量研究結(jié)果作經(jīng)濟(jì)分析和預(yù)測
(對(duì)數(shù)量分析的實(shí)際應(yīng)用)93應(yīng)當(dāng)考慮的問題:32.1回歸分析概述(1)確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。(2)統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。一、回歸與相關(guān)(對(duì)統(tǒng)計(jì)學(xué)的回顧)
1、變量間的關(guān)系經(jīng)濟(jì)變量之間的關(guān)系,大體可分為兩類:942.1回歸分析概述(1)確定性關(guān)系或函數(shù)關(guān)系:研究的對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的:例如:
函數(shù)關(guān)系:統(tǒng)計(jì)依賴關(guān)系/統(tǒng)計(jì)相關(guān)關(guān)系:95對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correla
2、相關(guān)關(guān)系◆相關(guān)關(guān)系的描述
相關(guān)關(guān)系最直觀的描述方式——坐標(biāo)圖(散布圖)
Y
X962、相關(guān)關(guān)系◆相關(guān)關(guān)系的描述6◆相關(guān)關(guān)系的類型
●
從涉及的變量數(shù)量看簡單相關(guān)多重相關(guān)(復(fù)相關(guān))●
從變量相關(guān)關(guān)系的表現(xiàn)形式看線性相關(guān)——散布圖接近一條直線非線性相關(guān)——散布圖接近一條曲線●
從變量相關(guān)關(guān)系變化的方向看
正相關(guān)——變量同方向變化,同增同減
負(fù)相關(guān)——變量反方向變化,一增一減
不相關(guān)97◆相關(guān)關(guān)系的類型
●
從涉及的變量數(shù)量
3、相關(guān)程度的度量—相關(guān)系數(shù)
X和Y的總體線性相關(guān)系數(shù):
其中:Var(X)-----X的方差Var(Y)-----Y的方差Cov(X,Y)-----X和Y的協(xié)方差
X和Y的樣本線性相關(guān)系數(shù):
其中:Xi和Yi分別是變量X和Y的樣本觀測值,和分別是變量X和Y樣本值的平均值983、相關(guān)程度的度量—相關(guān)系數(shù)X和Y的總體線性相關(guān)●
X和Y都是相互對(duì)稱的隨機(jī)變量,●
線性相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系●
樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由于抽樣波動(dòng),樣本相關(guān)系數(shù)是個(gè)隨機(jī)變量,其統(tǒng)計(jì)顯著性有待檢驗(yàn)●
相關(guān)系數(shù)只能反映線性相關(guān)程度,不能確定因果關(guān)系,不能說明相關(guān)關(guān)系具體接近哪條直線
計(jì)量經(jīng)濟(jì)學(xué)關(guān)心:變量間的因果關(guān)系及隱藏在隨機(jī)性后面的統(tǒng)計(jì)規(guī)律性,這有賴于回歸分析方法使用相關(guān)系數(shù)時(shí)應(yīng)注意:99●
X和Y都是相互對(duì)稱的隨機(jī)變量,使用相關(guān)系
①不線性相關(guān)并不意味著不相關(guān);
②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;③回歸分析/相關(guān)分析研究一個(gè)變量對(duì)另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。
④相關(guān)分析對(duì)稱地對(duì)待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的?;貧w分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分被解釋變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是?!⒁猓?00▲注意:104、回歸分析回歸的古典意義:高爾頓遺傳學(xué)的回歸概念(父母身高與子女身高的關(guān)系)回歸的現(xiàn)代意義:一個(gè)被解釋變量對(duì)若干解釋變量依存關(guān)系的研究回歸的目的(實(shí)質(zhì)):
由固定的解釋變量去估計(jì)被解釋變量的平均值1014、回歸分析回歸的古典意義:11●Y的條件分布:當(dāng)解釋變量X取某固定值時(shí)(條件),Y的值不確定,Y的不同取值形成一定的分布,這是Y的條件分布?!馳的條件期望:對(duì)于X的每一個(gè)取值,Y對(duì)Y所形成的分布確定其期望或均值,稱為Y的條件期望或條件均值E(Y∣)
注意幾個(gè)概念102●Y的條件分布:注意幾個(gè)概念12
回歸線與回歸函數(shù)
●回歸線:對(duì)于每一個(gè)X的取值,都有Y的條件期望E(Y∣)與之對(duì)應(yīng),代表這些Y的條件期望的點(diǎn)的軌跡所形成的直線或曲線,稱為回歸線?!窕貧w函數(shù):被解釋變量Y的條件期望E(Y∣)隨解釋變量X的的變化而有規(guī)律的變化,如果把Y的條件期望E(Y∣)表現(xiàn)為X的某種函數(shù)E(Y∣)=f()這個(gè)函數(shù)稱為回歸函數(shù)。回歸函數(shù)分為:總體回歸函數(shù)樣本回歸函數(shù)103回歸線與回歸函數(shù)●回歸線:對(duì)于每一個(gè)X的取值,每月家庭可支配收入X100015002000250030003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每960121013101432183510682319248828563201月125913401520188520662321258729003288家132414001615194321852365265030213399庭1448165020372210239827893064消1489171220782289248728533142費(fèi)1538177821792313251329343274支160018412298239825383110出17021886231624232567
Y1900238724532610201224982487271025892586900115014001650190021502400265029003150舉例:假如已知100個(gè)家庭構(gòu)成的總體二、總體回歸函數(shù)(PRF)104每月家庭可支配收入X10001500200二、總體回歸函數(shù)(PRF)1、總體回歸函數(shù)的概念
前提:假如已知所研究的經(jīng)濟(jì)現(xiàn)象的總體被解釋變量Y和解釋變量X的每個(gè)觀測值,可以計(jì)算出總體被解釋變量Y的條件均值E(Y∣),并將其表現(xiàn)為解釋變量X的某種函數(shù)這個(gè)函數(shù)稱為總體回歸函數(shù)(PRF)105二、總體回歸函數(shù)(PRF)1、總體回歸函數(shù)的概念152、總體回歸函數(shù)的表現(xiàn)形式
(1)條件均值表現(xiàn)形式假如Y的條件均值E(Y∣)是解釋變量X的線性函數(shù),可表示為:
(2)個(gè)別值表現(xiàn)形式(隨機(jī)設(shè)定形式)對(duì)于一定的,Y的各個(gè)別值分布在的周圍,若令各個(gè)別值與條件均值的偏差為,顯然是隨機(jī)變量則有
1062、總體回歸函數(shù)的表現(xiàn)形式
(1)條件均值表現(xiàn)形式16●實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是未知的,只能根據(jù)經(jīng)濟(jì)理論和實(shí)踐經(jīng)驗(yàn)去設(shè)定?!坝?jì)量”的目的就是尋求PRF?!窨傮w回歸函數(shù)中Y與X的關(guān)系可是線性的,也可是非線性的。3、注意幾點(diǎn)107●實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是未知的,只能根據(jù)經(jīng)濟(jì)理論就變量而言是線性的——Y的條件均值是X的線性函數(shù)就參數(shù)而言是線性的——Y的條件均值是參數(shù)β的線性函數(shù)判斷:
變量、參數(shù)均”線性”
參數(shù)“線性”,變量”非線性”變量“線性”,參數(shù)”非線性”計(jì)量經(jīng)濟(jì)學(xué)中線性回歸模型主要指就參數(shù)是“線性”對(duì)線性回歸模型“線性”的兩種解釋:108就變量而言是線性的對(duì)線性回歸模型“線性”的兩種解釋:18
三、隨機(jī)擾動(dòng)項(xiàng)u
◆概念各個(gè)值與條件均值的偏差代表排除在模型以外的所有因素對(duì)Y的影響。◆性質(zhì):是期望為0有一定分布的隨機(jī)變量重要性:隨機(jī)擾動(dòng)項(xiàng)的性質(zhì)決定著計(jì)量經(jīng)濟(jì)方法的選擇109三、隨機(jī)擾動(dòng)項(xiàng)u
◆概念19◆引入隨機(jī)擾動(dòng)項(xiàng)的原因●
未知影響因素的代表●
無法取得數(shù)據(jù)的已知影響因素的代表●
眾多細(xì)小影響因素的綜合代表●
模型的設(shè)定誤差●
變量的觀測誤差●
變量內(nèi)在隨機(jī)性110◆引入隨機(jī)擾動(dòng)項(xiàng)的原因●
未知影響因素的代表20四、樣本回歸函數(shù)(SRF)樣本回歸線:對(duì)于X的一定值,取得Y的樣本觀測值,可計(jì)算其條件均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。樣本回歸函數(shù):如果把被解釋變量Y的樣本條件均值表示為解釋變量X的某種函數(shù),這個(gè)函數(shù)稱為樣本回歸函數(shù)(SRF)。Y
X
111四、樣本回歸函數(shù)(SRF)樣本回歸線:21SRF的特點(diǎn)
●每次抽樣都能獲得一個(gè)樣本,就可以擬合一條樣本回歸線,所以樣本回歸線隨抽樣波動(dòng)而變化,可以有許多條(SRF不唯一)。Y
SRF1
SRF2
X●樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致?!駱颖净貧w線還不是總體回歸線,至多只是未知總體回歸線的近似表現(xiàn)。112SRF的特點(diǎn)
●每次抽樣都能獲得一個(gè)樣本,就可以擬合一條樣本
樣本回歸函數(shù)如果為線性函數(shù),可表示為
其中:是與相對(duì)應(yīng)的Y的樣本條件均值和分別是樣本回歸函數(shù)的參數(shù)被解釋變量Y的實(shí)際觀測值不完全等于樣本條件均值,二者之差用表示,稱為剩余項(xiàng)或殘差項(xiàng):
或者樣本回歸函數(shù)的表現(xiàn)形式113樣本回歸函數(shù)如果為線性函數(shù),可表示為樣本回歸函數(shù)的表現(xiàn)形
對(duì)樣本回歸的理解如果能夠獲得和的數(shù)值,顯然:●和是對(duì)總體回歸函數(shù)參數(shù)和的估計(jì)●是對(duì)總體條件期望E(Y∣)的估計(jì)●
在概念上類似總體回歸函數(shù)中的,可視為對(duì)的估計(jì)。114對(duì)樣本回歸的理解如果能夠獲得和樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系
SRF
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 沈陽理工大學(xué)《傳感與測試技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 國有土地委托經(jīng)營管理合同
- 合同編504條與民法典61條
- 大班音樂課件P《春雨沙沙》
- 2024年六盤水客運(yùn)從業(yè)資格證考試一點(diǎn)通
- 2024個(gè)人短期借款合同書
- 會(huì)議備忘錄范文6篇-20220308150300
- 2024中國工商銀行借貸合同范本
- 2024版家政服務(wù)合同樣本
- 2024個(gè)人小額貸款合同書范本
- (完整版)新概念英語第一冊單詞表(打印版)
- 美食行業(yè)外賣平臺(tái)配送效率提升方案
- 中國民用航空局信息中心招聘筆試題庫2024
- 芯片設(shè)計(jì)基礎(chǔ)知識(shí)題庫100道及答案(完整版)
- 2025屆高考語文一輪復(fù)習(xí):文言文概括和分析 課件
- 年產(chǎn)10萬套新能源車電池托盤項(xiàng)目可行性研究報(bào)告寫作模板-申批備案
- 《大學(xué)美育》 課件 4.模塊五 第二十四章 時(shí)空綜合的影視藝術(shù)之美
- 2022-2023學(xué)年廣東省廣州市天河區(qū)六年級(jí)(上)期末數(shù)學(xué)試卷(含答案)
- 2024年全國職業(yè)院校技能大賽高職組(智慧物流賽項(xiàng))考試題庫(含答案)
- 2024年新人教版七年級(jí)上冊歷史 第11課 西漢建立和“文景之治”
- 北師大版(三起)(2024)三年級(jí)上冊英語Unit 1 Family單元測試卷(含答案)
評(píng)論
0/150
提交評(píng)論