計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型_第1頁
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型_第2頁
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型_第3頁
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型_第4頁
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一節(jié)概念第二節(jié)回歸模型第三節(jié)參數(shù)的最小二乘估計(jì)第四節(jié)模型檢驗(yàn)第五節(jié)預(yù)測(cè)小結(jié)第2章一元線性回歸模型第一節(jié)基本概念

1.確定性關(guān)系若一個(gè)變量能夠被一個(gè)或若干個(gè)其它變量的數(shù)值按某一規(guī)律唯一地確定。函數(shù)關(guān)系

2.非確定性關(guān)系(相關(guān)關(guān)系或回歸關(guān)系)若一個(gè)變量不能根據(jù)其它有關(guān)變量的數(shù)值精確地求出其數(shù)值,但可以通過大量的統(tǒng)計(jì)資料得出它們之間的數(shù)量變化規(guī)律。

3.相關(guān)分析主要研究變量之間的相互關(guān)聯(lián)程度,用相關(guān)系數(shù)表示。包括簡(jiǎn)單相關(guān)和多重相關(guān)(復(fù)相關(guān))。

4.回歸分析(RegressionAnalysis)研究一個(gè)變量(因變量)對(duì)于一個(gè)或多個(gè)其他變量(解釋變量)的數(shù)量依存關(guān)系。其目的在于根據(jù)已知的解釋變量的數(shù)值來估計(jì)或預(yù)測(cè)因變量的總體平均值。

分析被解釋變量與解釋變量之間的統(tǒng)計(jì)依賴關(guān)系,目的在于通過后者的已知或設(shè)定值去估計(jì)或預(yù)測(cè)前者的均值。這里:前一個(gè)變量被稱為被解釋變量(ExplainedVariable)或因變量(DependentVariable),后一個(gè)(些)變量被稱為解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)?;貧w分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:

(1)根據(jù)樣本觀察值對(duì)經(jīng)濟(jì)計(jì)量模型參數(shù)進(jìn)行估計(jì),求得回歸方程;(2)對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn);(3)利用回歸方程進(jìn)行分析、評(píng)價(jià)及預(yù)測(cè)。例如,

函數(shù)關(guān)系:統(tǒng)計(jì)依賴關(guān)系/統(tǒng)計(jì)相關(guān)關(guān)系:對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的.相關(guān)系數(shù):統(tǒng)計(jì)依賴關(guān)系

回歸分析正相關(guān)相關(guān)分析

不相關(guān)負(fù)相關(guān)正相關(guān)線性相關(guān)不相關(guān)負(fù)相關(guān)有因果關(guān)系無因果關(guān)系非線性相關(guān)①不線性相關(guān)并不意味著不相關(guān);

②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;③回歸分析/相關(guān)分析研究一個(gè)變量對(duì)另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。

④相關(guān)分析對(duì)稱地對(duì)待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的?;貧w分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分因變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是?!⒁猓耗成鐓^(qū)家庭可支配收入(X)和消費(fèi)支出(Y)統(tǒng)計(jì)X800110014001700200023002600290032003500Y5616388691023125414081650196920902299594748913110013091452173819912134232162781492411441364155117492046217825306388479791155139715951804206822662629

93510121210140816501848210123542860

96810451243147416721881218924862871

1078125414961683192522332552

1122129814961716196922442585

1155133115621749201322992640

118813641573177120352310

12101408160618042101

1430165018702112

1485171619472200

2002

共計(jì)242049501149516445193052387025025214502128515510平均60582510451265148517051925214523652585

根據(jù)每個(gè)家庭的收入和支出繪出散點(diǎn)圖,大致可看出二者間的關(guān)系:在統(tǒng)計(jì)意義上,二者成正比。

通過對(duì)收入和支出的調(diào)查結(jié)果,處于不同收入階層的居民有一個(gè)平均的支出水平,這一支出水平Y(jié)與收入X大致呈線性關(guān)系。

圖中的這條通過各收入階層平均支出額的直線,描述了這一依賴關(guān)系。我們把這條線稱為回歸直線。YX60514002000260035008003200總體回歸模型:

樣本回歸模型:總體回歸模型第二節(jié)回歸模型:

YX140020003200800樣本回歸模型2600一、幾個(gè)概念1.條件分布(Conditionaldistribution):以X取定值為條件的Y的條件分布。2.條件概率(Conditionalprobability):給定X的Y的概率,記為P(Y|X)。例如,P(Y=594|X=800)=1/4;P(Y=1551|X=2300)=1/14。3.條件期望(conditionalExpectation):給定X的Y的期望值,記為E(Y|X)。例如,E(Y|X=800)=561×1/4+594×1/4+627×1/4+638×1/4=6054.總體回歸曲線(PopularRegressionCurve)(總體回歸曲線的幾何意義):當(dāng)解釋變量給定值時(shí)因變量的條件期望值的軌跡。二、總體回歸函數(shù)(PopularRegressionFunction,PRF)

E(Y|Xi)=f(Xi)當(dāng)PRF的函數(shù)形式為線性函數(shù),則有,E(Y|Xi)=0+1Xi其中0和1為未知而固定的參數(shù),稱為回歸系數(shù)。0和1

分別稱為截距和斜率系數(shù)。上述方程也稱為線性總體回歸函數(shù)。三、“線性”的含義“線性”可作兩種解釋:對(duì)變量為線性,對(duì)參數(shù)為線性。一般“線性回歸”一詞總是指對(duì)參數(shù)為線性的一種回歸(即參數(shù)只以它的1次方出現(xiàn))。四、PRF的隨機(jī)設(shè)定將個(gè)別的Yi圍繞其期望值的離差(Deviation)表述如下:

ui=Yi-E(Y|Xi)或Yi=E(Y|Xi)+ui其中ui為隨機(jī)誤差項(xiàng)(Stochasticerror)或隨機(jī)干擾項(xiàng)(Stochasticdisturbance)。線性總體回歸函數(shù):

PRF:Yi=0+1Xi+ui=E(Y|Xi)+ui隨機(jī)誤差項(xiàng)主要包括下列因素的影響:1)在解釋變量中被忽略的因素的影響;2)變量觀測(cè)值的觀測(cè)誤差的影響;3)模型關(guān)系的設(shè)定誤差的影響;4)其它隨機(jī)因素的影響。產(chǎn)生并設(shè)計(jì)隨機(jī)誤差項(xiàng)的主要原因:1)理論的含糊性;理論不能完全說明影響因變量的所有影響因素。2)數(shù)據(jù)的欠缺;無法獲得有關(guān)數(shù)據(jù)。3)簡(jiǎn)化原則。盡可能使回歸模型簡(jiǎn)單。五、隨機(jī)擾動(dòng)項(xiàng)的意義

六、樣本回歸函數(shù)(SRF,SampleRegression

Function)由于在大多數(shù)情況下,我們不可能得到X、Y的所有可能的數(shù)值,只能用抽樣的方法,取得X、Y的樣本觀測(cè)值,用樣本回歸方程SRF去擬合總體回歸方程PRF。X(收入)800110014001700200023002600290032003500Y(支出)59463811221155140815951969207825852530樣本1樣本2樣本回歸函數(shù)SRF:

在回歸分析中,我們用SRF估計(jì)PRF。X(收入)800110014001700200023002600290032003500Y(支出)62781411221298156217162013229925852860第三節(jié)參數(shù)的最小二乘估計(jì)(LeastSquaresEstimation,LSE)考慮回歸模型:其中ui是除了X以外的其它若干隨機(jī)因素。一、最小二乘估計(jì)的基本假定1、零均值。隨機(jī)擾動(dòng)項(xiàng)ui的均值為零。即,E(ui|Xi)=02、同方差。隨機(jī)擾動(dòng)項(xiàng)ui的方差相等。即

Var(ui|Xi)=E[(ui-E(ui))|Xi]2

=E(ui2|Xi)2=23、無自相關(guān)。各個(gè)擾動(dòng)項(xiàng)無自相關(guān)。即:4、隨機(jī)擾動(dòng)項(xiàng)ui解釋變量Xi不相關(guān)。即Cov(ui,Xi)=E[ui-Eui][Xi-EXi]=0i=1,2,…,n5、ui服從正態(tài)分布,即ui~N(0,δ2),i=1,2,…,n二、普通最小二乘估計(jì)(OrdinaryLeastSquares,OLS)基本思路:用樣本回歸函數(shù)估計(jì)總體回歸函數(shù)。估計(jì)估計(jì)出的參數(shù)使殘差的平方和最小。真實(shí)值用根據(jù)最大化的一階條件:例1,已知某商品的需求量Y(萬噸)隨價(jià)格X(元)變化的統(tǒng)計(jì)資料如下,求需求量Y隨價(jià)格X變化的回歸方程。年份1991199219931994199519961997199819992000需求量10075807050659010011065價(jià)格5766875439幾個(gè)常用結(jié)果:三、最小二乘估計(jì)OLS的性質(zhì)(高斯-馬爾柯夫定理)

在所有線性無偏估計(jì)量中,OLS估計(jì)量有最小方差,即OLS是BLUE(BestLinearUnbiasedEstimator)。

1.線性性

2.無偏性

3.最小方差性(1)線性性:為Yi的線性函數(shù)

2、無偏性:最小二乘估計(jì)

的數(shù)學(xué)期望值分別等于總體回歸系數(shù)的值

3、最小方差性:

OLS估計(jì)量

在所有線性無偏估計(jì)量中,具有最小方差。即四、最小二乘估計(jì)的方差第四節(jié)模型檢驗(yàn)一、經(jīng)濟(jì)意義檢驗(yàn)檢驗(yàn)所建的模型的是否符合經(jīng)濟(jì)理論,主要是檢驗(yàn)?zāi)P蛥?shù)的符號(hào)和大小是否與經(jīng)濟(jì)理論以及人們的經(jīng)驗(yàn)一致二、統(tǒng)計(jì)檢驗(yàn)

1、擬合優(yōu)度檢驗(yàn)(判定系數(shù))

擬合優(yōu)度檢驗(yàn)是指對(duì)樣本回歸線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。度量擬合程度的指標(biāo)是判定系數(shù)R2

?;舅悸罚阂蜃兞縔的總變異,能夠被X的變異解釋的比例越大,則說明OLS回歸線對(duì)總體的解釋程度越好,反之就越差??偟碾x差平方和的分解:PRFXiXSRFY估計(jì)的Y值圍繞其均值的總變異。

未被解釋的Y值圍繞回歸線的Y值的變異。

總離差平方和(TSS):說明實(shí)際的Y值圍繞其均值的總變異。

R2測(cè)度了在Y的總變異中,由回歸模型解釋的部分所占的比例。R2越高,回歸模型擬合的程度就越好。

R2的性質(zhì):(1)非負(fù)。(2)0≤R2≤1其它表達(dá)方式:定義擬合優(yōu)度R2:例2:對(duì)例1進(jìn)行擬合優(yōu)度檢驗(yàn),并說明其意義。82.73%2、相關(guān)系數(shù)檢驗(yàn)

相關(guān)系數(shù):表示兩個(gè)隨機(jī)變量之間的相關(guān)程度。定義為:以樣本方差和樣本協(xié)方差估計(jì)X、Y的方差和協(xié)方差,樣本相關(guān)系數(shù)為:

樣本相關(guān)系數(shù)的平方與擬合優(yōu)度相等,但二者的意義不同。(擬合優(yōu)度是回歸分析中提出的,而相關(guān)系數(shù)是相關(guān)分析中提出的。)相關(guān)系數(shù)檢驗(yàn)的步驟:例3,對(duì)例1進(jìn)行相關(guān)系數(shù)檢驗(yàn)。3、F檢驗(yàn)(總體回歸方程顯著性檢驗(yàn))三大分布:t:標(biāo)準(zhǔn)正態(tài)除以卡方開方的分布(注意自由度)F:兩個(gè)獨(dú)立的卡方變量之商的分布(注意自由度):若干個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)平方和的分布F檢驗(yàn)的步驟:離差平方和平方和SS自由度DF均方差MSF值F臨界值顯著性ESS1ESS/1******/RSSn-2RSS/n-2TSSn-1方差分析(analysisofvariance,ANOVA)

表思路:若ESS/RSS比較大,則X對(duì)Y的解釋程度就比較高,可以推測(cè)總體存在線性關(guān)系。一般情況下,擬合優(yōu)度R2與F檢驗(yàn)具有一致性:例4,對(duì)例1進(jìn)行F檢驗(yàn)解:TSS=3272.5ESS=2707.5RSS=565F*=(2707.5×8)/565=38.3338.33>F0.05(1,8)=5.32

因此,回歸方程顯著成立.

方差分析表:AnalysisofVarianceSOURCEDFSSMSFpRegression12707.52707.538.340.000Error8565.070.6Total93272.54、t檢驗(yàn)(參數(shù)顯著性檢驗(yàn))T檢驗(yàn)的步驟:例5,對(duì)例1進(jìn)行t檢驗(yàn)。三、預(yù)測(cè)(PredictionForecast)(一)點(diǎn)預(yù)測(cè)點(diǎn)預(yù)測(cè)的兩種解釋:X0YX12(二)區(qū)間預(yù)測(cè)(IntervalEstimation)

1、總體均值E(Y0|X0)的區(qū)間預(yù)測(cè)區(qū)間估計(jì)(預(yù)測(cè)):為了判斷點(diǎn)估計(jì)與真值的接近程度,可以通過構(gòu)造以估計(jì)值為中心的一個(gè)區(qū)間(隨機(jī)的),以該區(qū)間包括了真值的概率來確定估計(jì)值接近真值的程度。-t/2t/2o/2/22、總體個(gè)別值Y0的區(qū)間預(yù)測(cè)各種預(yù)測(cè)值的關(guān)系XY0Y的均值的區(qū)間預(yù)測(cè)Y的個(gè)別值的區(qū)間預(yù)測(cè)例6,在例1中,若X0=10,求Y0及E(Y0|X0)的預(yù)測(cè)值和預(yù)測(cè)區(qū)間

六、案例分析小結(jié):一元線性回歸分析的主要步驟1、建立回歸模型研究某一經(jīng)濟(jì)現(xiàn)象,先根據(jù)經(jīng)濟(jì)理論,選擇具有因果關(guān)系的兩個(gè)變量(Y,X),建立線性回歸模型,確定解釋變量和被解釋變量。如果不明確兩個(gè)變量是否為線性關(guān)系,也可以根據(jù)散點(diǎn)圖來分析。建立回歸模型可以是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論