經(jīng)典計量經(jīng)濟學模型_第1頁
經(jīng)典計量經(jīng)濟學模型_第2頁
經(jīng)典計量經(jīng)濟學模型_第3頁
經(jīng)典計量經(jīng)濟學模型_第4頁
經(jīng)典計量經(jīng)濟學模型_第5頁
已閱讀5頁,還剩142頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2022-5-1012022-5-101經(jīng)典計量經(jīng)濟學模型經(jīng)典計量經(jīng)濟學模型.2022-5-1022022-5-102第一節(jié)第一節(jié) 回歸分析概述回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念一、變量間的關(guān)系及回歸分析的基本概念 二、總體回歸函數(shù)二、總體回歸函數(shù)三、隨機擾動項三、隨機擾動項四、樣本回歸函數(shù)(四、樣本回歸函數(shù)(SRFSRF)2022-5-1032022-5-103 回歸分析概述回歸分析概述 (1)確定性關(guān)系確定性關(guān)系或函數(shù)關(guān)系:函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機變量間的關(guān)系。 (2 2)統(tǒng)計依賴)統(tǒng)計依賴或相關(guān)關(guān)系:相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機變量間的關(guān)系。一、變量間的關(guān)系及回

2、歸分析的基本概念一、變量間的關(guān)系及回歸分析的基本概念 1 1、變量間的關(guān)系、變量間的關(guān)系 經(jīng)濟變量之間的關(guān)系,大體可分為兩類:2022-5-1042022-5-104 由于變量間關(guān)系的隨機性,回歸分析關(guān)心的是根回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值均值,即當解釋變量取某個確定值時,與之統(tǒng)計相關(guān)的被解釋變量所有可能出現(xiàn)的對應(yīng)值的平均值。 例例1 1:一個假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費支出家庭消費支出Y Y與每月家庭可支配收入家庭可支配收入X X的關(guān)系。 即如果知道了家庭的月收入,能否預(yù)測該社區(qū)家庭

3、的平均月消費支出水平。 二、總體回歸函數(shù)二、總體回歸函數(shù) 為達到此目的,將該100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費支出。2022-5-1052022-5-105表表 2.1.1 某某社社區(qū)區(qū)家家庭庭每每月月收收入入與與消消費費支支出出統(tǒng)統(tǒng)計計表表 每月家庭可支配收入X(元) 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627

4、814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 17

5、71 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 每 月 家 庭 消 費 支 出 Y (元) 2002 共計 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510 2022-5-1062022-5-106 (1)由于不確定因素的影響,對同一收入水平X,不同家庭的消費支出不完全相同; (2)但由于調(diào)查的完備性,給定收入水平X的消費支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布條件分布(Conditional distri

6、butionConditional distribution)是已知的,如: P(Y=561|X=800)=1/4。因此,給定收入X的值Xi,可得消費支出Y的條件條件均值均值(conditional mean)或條件期望條件期望(conditional expectation): E(Y|X=Xi)該例中:E(Y | X=800)=605分析:分析:2022-5-107.2022-5-107收入水平800 1100 1400 1700 2000 2300 2600 2900 3200 3500條件概率 1/4 1/6 1/11 1/13 1/13 1/14 1/13 1/10 1/9 1/6條

7、件均值605825 1045 1265 1485 1705 1925 2145 2365 25852022-5-1082022-5-108 描出散點圖發(fā)現(xiàn):隨著收入的增加,消費“平均地說平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線總體回歸線。05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費支出Y(元) 2022-5-1092022-5-109 概念:概念: 在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線總體回歸線(population reg

8、ression line),或更一般地稱為總體回歸曲線總體回歸曲線(population regression curve)。)()|(iiXfXYE稱為(雙變量)總體回歸函數(shù)(總體回歸函數(shù)(population regression function, PRF, PRF)。 相應(yīng)的函數(shù):2022-5-10102022-5-1010 回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。 含義:含義: 函數(shù)形式:函數(shù)形式: 可以是線性或非線性的。 例中,將居民消費支出看成是其可支配收入的線性函數(shù)時: iiXXYE10)|(為一線性函數(shù)。線性函數(shù)。其中,0,1是未知

9、參數(shù),稱為回歸系數(shù)回歸系數(shù)(regression coefficients)。2022-5-10112022-5-1011 三、隨機擾動項三、隨機擾動項 總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費支出水平。 但對某一個別的家庭,其消費支出可能與該平均水平有偏差。)|(iiiXYEY 稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差離差(deviationdeviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(隨機干擾項(stochastic disturbancestochastic disturbance)或隨隨機誤差項(機誤差項(stochastic erro

10、rstochastic error)。 記2022-5-10122022-5-1012例中,個別家庭的消費支出為: (*)式稱為總體回歸函數(shù)(方程)總體回歸函數(shù)(方程)PRFPRF的隨機設(shè)的隨機設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機性影響。響外,還受其他因素的隨機性影響。 (1)該收入水平下所有家庭的平均消費支出E(Y|Xi),稱為系統(tǒng)性(系統(tǒng)性(systematicsystematic)或確定性(確定性(deterministic)deterministic)部分部分。 (2)其他隨機隨機或非確定性非確定性(no

11、nsystematicnonsystematic)部分部分 i i。即,給定收入水平Xi ,個別家庭的支出可表示為兩部分之和:(*) 由于方程中引入了隨機項,成為計量經(jīng)濟學模型,因此也稱為總體回歸模型??傮w回歸模型。2022-5-10132022-5-1013隨機誤差項主要包括下列因素的影響:隨機誤差項主要包括下列因素的影響:1)在解釋變量中被忽略的因素的影響;2)變量觀測值的觀測誤差的影響;3)模型關(guān)系的設(shè)定誤差的影響;4)其它隨機因素的影響。產(chǎn)生并設(shè)計隨機誤差項的主要原因:產(chǎn)生并設(shè)計隨機誤差項的主要原因:1)理論的含糊性;2)數(shù)據(jù)的欠缺;3)節(jié)省原則。2022-5-10142022-5-1

12、014 四、樣本回歸函數(shù)(四、樣本回歸函數(shù)(SRFSRF) 問題:問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息? 問:能否從該樣本估計總體回歸函數(shù)PRF?回答:能 例例2 2在例1的總體中有如下一個樣本, 總體的信息往往無法掌握,現(xiàn)實的情況只能是在一次觀測中得到總體的一個樣本。2022-5-10152022-5-1015該樣本的散點圖散點圖(scatter diagram): 樣本散點圖近似于一條直線,畫一條直線以盡好地擬合該散點圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為樣本回歸線(樣本回歸線(sample regression lin

13、essample regression lines)。)。 記樣本回歸線的函數(shù)形式為:iiiXXfY10)(稱為樣本回歸函數(shù)(樣本回歸函數(shù)(sample regression functionsample regression function,SRFSRF)。 2022-5-10162022-5-1016 這里將樣本回歸線樣本回歸線看成總體回歸線總體回歸線的近似替代則 注意:注意:2022-5-10172022-5-1017 樣本回歸函數(shù)的隨機形式樣本回歸函數(shù)的隨機形式/ /樣本回歸模型樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機形式: iiiiieXYY10式中,ie稱為(樣樣本本)殘

14、殘差差(或剩剩余余)項項(residual) ,代表了其他影響iY的隨機因素的集合,可看成是i的估計量i。 由于方程中引入了隨機項,成為計量經(jīng)濟模型,因此也稱為樣本回歸模型(樣本回歸模型(sample regression modelsample regression model)。 2022-5-10182022-5-1018 回歸分析的主要目的回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計總體回歸函數(shù)PRF。注意:注意:這里PRF可能永遠無法知道。即,根據(jù) iiiiieXeYY10估計iiiiiXXYEY10)|(2022-5-10192022-5-1019第二節(jié)第二節(jié) 一元線性回歸模型

15、的參數(shù)估計一元線性回歸模型的參數(shù)估計 一、一元線性回歸模型的基本假設(shè)一、一元線性回歸模型的基本假設(shè) 二、參數(shù)的普通最小二乘估計(二、參數(shù)的普通最小二乘估計(OLSOLS) 三、最小二乘估計量的性質(zhì)三、最小二乘估計量的性質(zhì) 四、參數(shù)估計量的概率分布及隨機干四、參數(shù)估計量的概率分布及隨機干 擾項方差的估計擾項方差的估計 2022-5-10202022-5-1020單方程計量經(jīng)濟學模型分為兩大類: 線性模型和非線性模型線性模型中,變量之間的關(guān)系呈線性關(guān)系非線性模型中,變量之間的關(guān)系呈非線性關(guān)系 一元線性回歸模型一元線性回歸模型:只有一個解釋變量 iiiXY10i=1,2,nY為被解釋變量,X為解釋變

16、量,0與1為待估待估參數(shù)參數(shù), 為隨機干擾項隨機干擾項2022-5-10212022-5-1021 回歸分析的主要目的回歸分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準確地估計總體回歸函數(shù)(模型)PRF。 估計方法估計方法有多種,其種最廣泛使用的是普通普通最小二乘法最小二乘法(ordinary least squares, OLS)。 為保證參數(shù)估計量具有良好的性質(zhì),通常對為保證參數(shù)估計量具有良好的性質(zhì),通常對模型提出若干基本假設(shè)。模型提出若干基本假設(shè)。 注:實際這些假設(shè)與所采用的估計方法緊密相關(guān)。 2022-5-10222022-5-1022 一、線性回歸模型的基本假設(shè)一、線性回歸

17、模型的基本假設(shè) 假設(shè)1、解釋變量X是確定性變量,不是隨機變量; 假設(shè)2、隨機誤差項具有零均值、同方差和不序列相關(guān)性: E(i)=0 i=1,2, ,n Var (i)=2 i=1,2, ,n Cov(i, j)=0 ij i,j= 1,2, ,n 假設(shè)3、隨機誤差項與解釋變量X之間不相關(guān): Cov(Xi, i)=0 i=1,2, ,n 假設(shè)4、服從零均值、同方差、零協(xié)方差的正態(tài)分布 iN(0, 2 ) i=1,2, ,n2022-5-10232022-5-1023 1、如果假設(shè)1、2滿足,則假設(shè)3也滿足; 2、如果假設(shè)4滿足,則假設(shè)2也滿足。 以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)經(jīng)典假設(shè)或高斯

18、(高斯(GaussGauss)假設(shè))假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型經(jīng)典線性回歸模型(Classical Linear Regression Model, CLRM)。 2022-5-10242022-5-1024 另外另外,在進行模型回歸時,還有兩個暗含的假設(shè): 假設(shè)5:隨著樣本容量的無限增加,解釋變量X的樣本方差趨于一有限常數(shù)。即nQnXXi,/)(2 假設(shè)6:回歸模型是正確設(shè)定的 假設(shè)5旨在排除時間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變量,因為這類數(shù)據(jù)不僅使大樣本統(tǒng)計推斷變得無效,而且往往產(chǎn)生所謂的偽回歸問題偽回歸問題(spurious regression p

19、roblem)。 假設(shè)6也被稱為模型沒有設(shè)定偏誤設(shè)定偏誤(specification error)2022-5-10252022-5-1025案例分析案例分析 某地個人儲蓄某地個人儲蓄Y Y,個人可支配收入,個人可支配收入X X。 根據(jù)經(jīng)濟理論建立計量經(jīng)濟模型2022-5-10262022-5-1026圖形檢驗 2022-5-10272022-5-1027二、參數(shù)的普通最小二乘估計(二、參數(shù)的普通最小二乘估計(OLSOLS) 給定一組樣本觀測值(Xi, Yi)(i=1,2,n)要求樣本回歸函數(shù)盡可能好地擬合這組值. 普通最小二乘法普通最小二乘法(Ordinary least squares,

20、OLS)給出的判斷標準是:二者之差的平方和niiiniXYYYQ121021)()(最小。2022-5-10282022-5-1029求平方和的極值iiiiiiiiiXXYXYQXYXYQ)(2)()(2)(101210110021002022-5-10302022-5-1030方程組(*)稱為正規(guī)方程組(正規(guī)方程組(normal equationsnormal equations)。 2022-5-1031可以寫成 .2022-5-1031XYxyxXXYYXXiiiiii10221)()(2022-5-10322022-5-1032 例例2:在上述家庭可支配收入可支配收入- -消費支出消費

21、支出例中,對于所抽出的一組樣本數(shù),參數(shù)估計的計算可通過下面的表2.2.1進行。 表表 2.2.1 參參數(shù)數(shù)估估計計的的計計算算表表 iX iY ix iy iiyx 2ix 2iy 2iX 2iY 1 800 594 -1350 -973 1314090 1822500 947508 640000 352836 2 1100 638 -1050 -929 975870 1102500 863784 1210000 407044 3 1400 1122 -750 -445 334050 562500 198381 1960000 1258884 4 1700 1155 -450 -412 185

22、580 202500 170074 2890000 1334025 5 2000 1408 -150 -159 23910 22500 25408 4000000 1982464 6 2300 1595 150 28 4140 22500 762 5290000 2544025 7 2600 1969 450 402 180720 202500 161283 6760000 3876961 8 2900 2078 750 511 382950 562500 260712 8410000 4318084 9 3200 2585 1050 1018 1068480 1102500 1035510

23、10240000 6682225 10 3500 2530 1350 963 1299510 1822500 926599 12250000 6400900 求和 21500 15674 5769300 7425000 4590020 53650000 29157448 平均 2150 1567 2022-5-10332022-5-1033777. 07425000576930021iiixyx172.1032150777. 0156700XY因此,由該樣本估計的回歸方程為: iiXY777. 0172.1032022-5-1034幾個常用的結(jié)果 .2022-5-10342022-5-1035

24、. . .35(1)、估計殘差均值為零000)(0)(211101001210eneeXYXYeXYYYeniiniiiiiiniiiiiii2022-5-102022-5-1036. .2022-5-1036. .36(2)、估計殘差與自變量不相關(guān)(Residuals are unrelated with independent variable)2022-5-100)(010iiiiiXXYXe2022-5-1037. .37(3)、Y的真實值和擬合值有共同的均值2022-5-101010iiiiiiiiiiiiiiiyyyyeyyeyyxyuxy2022-5-10382022-5-103

25、8記22221)(iiiiXnXXXxiiiiiiiiYXnYXYYXXyx1)(上述參數(shù)估計量可以寫成: XYxyxiii1021稱為OLS估計量的離差形式(離差形式(deviation form)。)。 由于參數(shù)的估計結(jié)果是通過最小二乘法得到的,故稱為普通普通最小二乘估計量(最小二乘估計量(ordinary least squares estimators)。 2022-5-10392022-5-1039順便指出 ,記YYyii則有 iniiieXXeXXy111010)()()(可得 iixy1(*)式也稱為樣本回歸函數(shù)樣本回歸函數(shù)的離差形式離差形式。(*)注意:注意: 在計量經(jīng)濟學中,

26、往往以小寫字母表示對均值的離差。 2022-5-10402022-5-1040 三、最小二乘估計量的性質(zhì)三、最小二乘估計量的性質(zhì) 當模型參數(shù)估計出后,需考慮參數(shù)估計值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計量的統(tǒng)計性質(zhì)。 一個用于考察總體的估計量,可從如下幾個方面考察其優(yōu)劣性: (1 1)線性性)線性性,即它是否是另一隨機變量的線性函數(shù); (2 2)無偏性)無偏性,即它的均值或期望值是否等于總體的真實值; (3 3)有效性)有效性,即它是否在所有線性無偏估計量中具有最小方差。2022-5-10412022-5-1041(4 4)漸近無偏性)漸近無偏性,即樣本容量趨于無窮大時,是

27、否它的均值序列趨于總體真值;(5 5)一致性)一致性,即樣本容量趨于無窮大時,它是否依概率收斂于總體的真值;(6 6)漸近有效性)漸近有效性,即樣本容量趨于無窮大時,是否它在所有的一致估計量中具有最小的漸近方差。 這三個準則也稱作估計量的小樣本性質(zhì)。小樣本性質(zhì)。 擁有這類性質(zhì)的估計量稱為最佳線性無偏估計最佳線性無偏估計量量(best liner unbiased estimator, BLUEbest liner unbiased estimator, BLUE)。 當不滿足小樣本性質(zhì)時,需進一步考察估計量的大樣本或漸近性質(zhì):大樣本或漸近性質(zhì):2022-5-10422022-5-1042高斯高

28、斯馬爾可夫定理馬爾可夫定理(Gauss-Markov theorem)(Gauss-Markov theorem) 在給定經(jīng)典線性回歸的假定下,最小二乘估計量是具有最小方差的線性無偏估計量。2022-5-10432022-5-10432 2、無無偏偏性性,即估計量0、1的均值(期望)等于總體回歸參數(shù)真值0與1 證:證:iiiiiiiiiikXkkXkYk10101)(易知02iiixxk1iiXk故iik111111)()()(iiiiEkkEE同樣地,容易得出 0000)()()()(iiiiEwEwEE2022-5-10442022-5-10443 3、有有效效性性(最最小小方方差差性性)

29、 ,即在所有線性無偏估計量中,最小二乘估計量0、1具有最小方差。 (1)先求0與1的方差 )var()var()var()var(21021iiiiiiikXkYk22222iiixxx221020)/1 ()var()var()var(iiiiiikXnXwYw2222222221121iiiiixxXkXnnkXkXnn22222222221iiiiixnXxnXnxxXn2022-5-10452022-5-104545(2)證明最小方差性假設(shè)*1是其他方法得到的關(guān)于1的線性無偏估計量: iiYc*1其中,iiidkc,id為不全為零的常數(shù)。iiiiiiiiiXccXcYEcYcEE101

30、0*1)()()()(由*1的無偏性,即1*1)(E可知: 110iiiXcc從而有: 0ic,1iiXc2022-5-10462022-5-104646*1的方差 2222*1)var()var()var()var(iiiiiiiccYcYc =iiiiiidkdkdk22222222)(由于 2)(iiiiiiiikckkckdk =011222222iiiiiiiiiiixxkxcXcXkcxx故 22122222222*1)var(1)var(iiiiiddxdk因為 02id所以 )var()var(1*1當0id, (ni,2 , 1)等號成立,此時:iikc ,*1就是 OLS

31、估計量1。2022-5-10472022-5-1047 由于最小二乘估計量擁有一個由于最小二乘估計量擁有一個“好好”的估計量的估計量所應(yīng)具備的小樣本特性,它自然也擁有大樣本特性所應(yīng)具備的小樣本特性,它自然也擁有大樣本特性。 )/lim()/lim()lim()lim()lim()lim(212111nxPnxPxxPPkPPiiiiiiii1110),(QQXCov2022-5-1048總體2022-5-1048 在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線總體回歸線(population regression line),或更一般地稱為總體回歸曲線總體回歸曲線(popula

32、tion regression curve)。iiXXYE10)|(2022-5-1049樣本 .總體的信息往往無法掌握,現(xiàn)實的情況只能是在一次觀測中得到總體的一個樣本。 記樣本回歸線的函數(shù)形式為: 同樣地,樣本回歸函數(shù)也有如下的隨機形式: 2022-5-1049iiiXXfY10)(iiiiieXYY102022-5-1050回歸分析的主要目的回歸分析的主要目的 根據(jù)樣本回歸函數(shù)SRF,估計總體回歸函數(shù)PRF。 根據(jù): 估計:2022-5-1050iiiiieXeYY10iiiiiXXYEY10)|(2022-5-10512022-5-10512022-5-10512022-5-1052估計

33、 假設(shè)條件:對隨機擾動項的五個假定 估計方法:最小二乘法 估計結(jié)果:參數(shù)具有線性性、無偏性、有效性2022-5-10522022-5-10532022-5-1053 四、參數(shù)估計量的概率分布及隨機干擾四、參數(shù)估計量的概率分布及隨機干擾項方差的估計項方差的估計 1、參數(shù)估計量、參數(shù)估計量0和和1的概率分布的概率分布 ),(2211ixN),(22200iixnXN2022-5-1054222222211)()()(iiiiiixxxkkVarVar2022-5-10552022-5-105522/1ix2220iixnX 2022-5-10562022-5-10562 2、隨機誤差項隨機誤差項

34、的方差的方差 2 2的估計的估計 由于隨機項 i不可觀測,只能從 i的估計殘差ei i出發(fā),對總體方差進行估計。 2又稱為總體方差總體方差。 可以證明可以證明,2的最小二乘估計量最小二乘估計量為222nei它是關(guān)于2的無偏估計量。 2022-5-10572022-5-10572222222221122222112221122211211221121122110110)2(2) 1()2)()()(2)()(22)()()()(2)()()()()(2)()()()(.)(. neEnxxxxEeExxxxkxkxxxkxxxxyyexyXYxyXYiiiiiiiiiiiiiiiiiiiiiii

35、iiiiiiiiiiiiiiiiiiiiiiiiiii2022-5-1058222222222222112)(2(2()2()1()2()()(ijijiiiiiiiiiiiixxxxExxxEnnEExE2022-5-10592022-5-1059在隨機誤差項的方差2估計出后,參數(shù)0和1的方方差差和標標準準差差的估計量分別是: 1的樣本方差: 2221ixS 1的樣本標準差: 21ixS 0的樣本方差: 22220iixnXS 0的樣本標準差: 220iixnXS 2022-5-10602022-5-1060第三節(jié)第三節(jié) 一元線性回歸模型統(tǒng)計檢驗一元線性回歸模型統(tǒng)計檢驗 一、擬合優(yōu)度檢驗一、

36、擬合優(yōu)度檢驗 二、變量的顯著性檢驗二、變量的顯著性檢驗 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 2022-5-10612022-5-1061 回歸分析回歸分析是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù),或者說是用樣本回歸線代替總體回歸線。 盡管從統(tǒng)計性質(zhì)統(tǒng)計性質(zhì)上已知,如果有足夠多的重復(fù) 抽樣,參數(shù)的估計值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計值不一定就等于該真值。 那么,在一次抽樣中,參數(shù)的估計值與真值的差異有多大,是否顯著,這就需要進一步進行統(tǒng)計檢驗統(tǒng)計檢驗。 主要包括擬合優(yōu)度檢驗擬合優(yōu)度檢驗、變量的顯著性檢驗顯著性檢驗及參數(shù)的區(qū)間估計區(qū)間估計。2022-5-10622

37、022-5-1062 一、擬合優(yōu)度檢驗一、擬合優(yōu)度檢驗 對樣本回歸直線與樣本觀測值之間擬合程度的檢驗。 :判定系數(shù)判定系數(shù)(可決可決系數(shù)系數(shù))R R2 2 問題:問題:采用普通最小二乘估計方法,已經(jīng)保證了模型最好地擬合了樣本觀測值,為什么還要檢驗擬合程度?2022-5-10632022-5-1063 1 1、總離差平方和的分解、總離差平方和的分解 已知由一組樣本觀測值(X Xi i,Y,Yi i),i=1,2,n得到如下樣本回歸直線 iiXY10iiiiiiiyeYYYYYYy)()(2022-5-10642022-5-1064 如果Yi=i 即實際觀測值落在樣本回歸“線”上,則擬合最好擬合最

38、好??烧J為,“離差”全部來自回歸線,而與“殘差”無關(guān)。2022-5-10652022-5-1065 對于所有樣本點,則需考慮這些點與樣本均值離差的平方和,可以證明:記22)(YYyTSSii總體平方和總體平方和(Total Sum of Squares)22)(YYyESSii回歸平方和(回歸平方和(Explained Sum of Squares)22)(iiiYYeRSS殘差平方和(殘差平方和(Residual Sum of Squares )2022-5-106622)(YYyTSSii總體平方和總體平方和(Total Sum of Squares)22)(YYyRSSii回歸平方和(回

39、歸平方和(Regression Sum of Squares)22)(iiiYYeESS殘差平方和(殘差平方和(Error Sum of Squares ) 對于所有樣本點,則需考慮這些點與樣本均值離差的平方和,可以證明:2022-5-10672022-5-1067TSS=ESS+RSS Y的觀測值圍繞其均值的總離差總離差(total (total variation)variation)可分解為兩部分:一部分來自回歸線一部分來自回歸線(ESS)(ESS),另一部分則來自隨機勢力,另一部分則來自隨機勢力(RSS)(RSS)。在給定樣本中,TSS不變, 如果實際觀測點離樣本回歸線越近,則ESSE

40、SS在TSSTSS中占的比重越大,因此 擬合優(yōu)度:回歸平方和擬合優(yōu)度:回歸平方和ESS/YESS/Y的總離差的總離差TSSTSS2022-5-10682022-5-1068TSSRSSTSSESSR1記22 2、可決系數(shù)可決系數(shù)R R2 2統(tǒng)計量統(tǒng)計量 稱 R R2 為(樣本)可決系數(shù)(樣本)可決系數(shù)/ /判定系數(shù)判定系數(shù)(coefficient of determination)coefficient of determination)。 可決系數(shù)可決系數(shù)的取值范圍取值范圍:0,1 R R2 2越接近越接近1 1,說明實際觀測點離樣本線越近,擬,說明實際觀測點離樣本線越近,擬合優(yōu)度越高合優(yōu)度

41、越高。2022-5-10692022-5-10702022-5-10712022-5-1071在實際計算可決系數(shù)時,在1已經(jīng)估計出后: 22212iiyxR 在例2.1.1的收入收入- -消費支出消費支出例中, 9766. 045900207425000)777. 0(222212iiyxR 注:可決系數(shù)是一個非負的統(tǒng)計量。它也是注:可決系數(shù)是一個非負的統(tǒng)計量。它也是隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)計可靠性也應(yīng)進行檢驗。計可靠性也應(yīng)進行檢驗。 2022-5-10722022-5-1072 二、變量的顯著性檢驗二、變量的顯著性檢驗 回歸分析回歸

42、分析是要判斷解釋變量解釋變量X X是否是被解釋變被解釋變量量Y Y的一個顯著性的影響因素。 在一元線性模型一元線性模型中,就是要判斷X X是否對Y Y具有顯著的線性性影響。這就需要進行變量的顯變量的顯著性檢驗。著性檢驗。 變量的顯著性檢驗所應(yīng)用的方法是數(shù)理統(tǒng)計變量的顯著性檢驗所應(yīng)用的方法是數(shù)理統(tǒng)計學中的假設(shè)檢驗學中的假設(shè)檢驗。 計量經(jīng)濟學中,主要是針對變量的參數(shù)真計量經(jīng)濟學中,主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的。值是否為零來進行顯著性檢驗的。 2022-5-10732022-5-1073 1 1、假設(shè)檢驗、假設(shè)檢驗 所謂假設(shè)檢驗假設(shè)檢驗,就是事先對總體參數(shù)或總體分就是事先對總體

43、參數(shù)或總體分布形式作出一個假設(shè),然后利用樣本信息來判斷布形式作出一個假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)有顯著差異,從而決定是否接受或否定原假設(shè)。 假設(shè)檢驗采用的邏輯推理方法是反證法。假設(shè)檢驗采用的邏輯推理方法是反證法。 先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。 判斷結(jié)果合理與否,是基于判斷結(jié)果合理與否,是基于“小概率事件不小概率事件不易發(fā)生易發(fā)生”這一原理的這一原理的2022-5-1074復(fù)習 某商品標準規(guī)定重量u250克,

44、標準差3克,重量服從正態(tài)分布。任意抽取100件,平均重量251克,規(guī)定顯著性水平為0.05,問該批商品重量是否符合要求。 1、提出假設(shè):H0 u250 ; H1 u=250 2、統(tǒng)計量: 由XN (250,9) 服從N(0,1)分布。2022-5-1074nuxzNx/)100/9 ,250(:2022-5-1075復(fù)習 3、確定顯著性水平=0.05 4、統(tǒng)計量分布的臨界值 5、觀察z是否小于下端或大于上端的臨界值,作出否定或接受原假設(shè)的判斷。2022-5-107595. 0)96. 1100/3250/96. 1(xnuxzP2022-5-10762022-5-1076 2 2、變量的顯著性

45、檢驗、變量的顯著性檢驗 ),(2211ixN)2(1112211ntSxti2022-5-10772022-5-1077 檢驗步驟:檢驗步驟: (1)對總體參數(shù)提出假設(shè) H0: 1=0, H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計量,并由樣本計算其值11St (3)給定顯著性水平,查t分布表,得臨界值t /2(n-2)(4) 比較,判斷 若 |t| t /2(n-2),則拒絕H0 ,接受H1 ; 若 |t| t /2(n-2),則拒絕H1 ,接受H0 ;2022-5-10782022-5-1078 對于一元線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計量進行顯著性檢驗: )2(0022200ntSxnXti

46、i在上述收入-消費支出例中,首先計算2的估計值 134022107425000777. 04590020222221222nxyneiii0425. 00018. 07425000/13402221ixS41.98742500010/53650000134022220iixnXS2022-5-10792022-5-1079t統(tǒng)計量的計算結(jié)果分別為: 29.180425. 0777. 0111St048. 141.9817.103000St 給定顯著性水平=0.05,查t分布表得臨界值 t 0.05/2(8)=2.306 |t1|2.306,說明家庭可支配收入在家庭可支配收入在95%95%的的置

47、信度下顯著,即是消費支出的主要解釋變量;置信度下顯著,即是消費支出的主要解釋變量; |t0|2.306,表明在95%的置信度下,無法拒絕截距項為零的假設(shè)。 2022-5-10802022-5-1080 假設(shè)檢驗假設(shè)檢驗可以通過一次抽樣的結(jié)果檢驗總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。 要判斷樣本參數(shù)的估計值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個以樣本參數(shù)的估計值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實的參數(shù)值。這種方法就是參數(shù)檢驗的置信區(qū)間估計置信區(qū)間估計。 三、參數(shù)的置信區(qū)間三

48、、參數(shù)的置信區(qū)間 2022-5-10812022-5-10811)(P 如 果 存 在 這 樣 一 個 區(qū) 間 , 稱 之 為 置 信 區(qū) 間置 信 區(qū) 間(confidence interval); 1-稱為置信系數(shù)置信系數(shù)(置信度置信度)(confidence coefficient), 稱為顯著性水平顯著性水平(level of significance);置信區(qū)間的端點稱為置信限置信限(confidence limit)或臨界值臨界值(critical values)。2022-5-10822022-5-1082一元線性模型中,一元線性模型中, i i ( (i i=1=1,2 2)的

49、置信區(qū)間)的置信區(qū)間: :在變量的顯著性檢驗中已經(jīng)知道: )2(ntstiii 意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2, t/2)的概率是(1- )。表示為: Pttt()221即Ptstiii()221Ptstsiiiii()2212022-5-10832022-5-1083于是得到:(1-)的置信度下, i i的置信區(qū)間是 (,)iitstsii22 在上述收入收入- -消費支出消費支出例中,如果給定 =0.01,查表得: 355. 3)8()2(005. 02tnt由于042. 01S41.980S于是,1、0的置信區(qū)間分別為:

50、(0.6345,0.9195) (-433.32,226.98) 2022-5-10842022-5-1084 由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。 要縮小置信區(qū)間,需 (1 1)增大樣本容量)增大樣本容量n n,因為在同樣的置信水平下,n越大,t分布表中的臨界值越小;同時,增大樣本容量,還可使樣本參數(shù)估計量的標準差減小; (2 2)提高模型的擬合優(yōu)度)提高模型的擬合優(yōu)度,因為樣本參數(shù)估計量的標準差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。2022-5-10852022-5-1085 例、消費模型例、消費模型 例例 收入與

51、消費支出的關(guān)系。GDP: 國內(nèi)生產(chǎn)總值國內(nèi)生產(chǎn)總值(當年價)CS1:居民消費居民消費(當年價)cs = cs1/pInc = GDP(1-t)/p2022-5-10862022-5-1086 該兩組數(shù)據(jù)是19782002年的時間序列數(shù)據(jù)時間序列數(shù)據(jù)(time series data); 1、建立模型、建立模型 擬建立如下一元回歸模型 采用Eviews軟件軟件進行回歸分析的結(jié)果見下表 前述收入收入-消費支出例消費支出例中的數(shù)據(jù)是截面數(shù)據(jù)截面數(shù)據(jù)(cross-sectional data)。tttuinccs2022-5-10872022-5-1087一般可寫出如下回歸分析結(jié)果: (3.56) (

52、49.82) R2=0.9908 F=2482.37 DW=0.3693 ttinccs51. 088.4142022-5-10882022-5-1088 2、模型檢驗、模型檢驗 R2=0.9908T值:3.56, :49.82 臨界值: t0.05/2(25)=2.063、預(yù)測、預(yù)測 點估計:Cs(2003)=414.88+ 0.5123737= 12935.63(元) 2022-5-10882022-5-1089第四節(jié)第四節(jié) 多元線性回歸模型多元線性回歸模型 一、多元線性回歸模型一、多元線性回歸模型 二、多元線性回歸模型的基本假定二、多元線性回歸模型的基本假定 2022-5-1089202

53、2-5-1090例題:需求函數(shù)2022-5-10902022-5-10912022-5-1091 一、多元線性回歸模型一、多元線性回歸模型 多元線性回歸模型多元線性回歸模型: :表現(xiàn)在線性回歸模型中的解釋變量有多個。 一般表現(xiàn)形式一般表現(xiàn)形式:ikikiiiXXXY 22110i=1,2,n其中:k為解釋變量的數(shù)目,j稱為回歸參數(shù)(regression coefficient)。 習慣上:把常數(shù)項看成為一虛變量的系數(shù),該虛變量的樣本觀測值始終取1。這樣: 模型中解釋變量的數(shù)目為(k+1) 2022-5-10922022-5-1092ikikiiiXXXY 22110也被稱為總體回歸函數(shù)的隨機表

54、達形式。它 的非隨機表達式為:kikiikiiiiXXXXXXYE 2211021),|( 方程表示:各變量X值固定時Y的平均響應(yīng)。 j也被稱為偏回歸系數(shù),表示在其他解釋變量保持不變的情況下,Xj每變化1個單位時,Y的均值E(Y)的變化; 或者說j給出了Xj的單位變化對Y均值的“直接”或“凈”(不含其他變量)影響。2022-5-10932022-5-1093總體回歸模型n個隨機方程的矩陣表達式為 XY其中)1(212221212111111knknnnkkXXXXXXXXXX1)1(210kk121nn2022-5-10942022-5-1094樣本回歸函數(shù):用來估計總體回歸函數(shù)kikiiii

55、XXXY22110其隨機表示式: ikikiiiieXXXY22110 ei稱為殘差或剩余項(residuals),可看成是總體回歸函數(shù)中隨機擾動項i的近似替代。 樣本回歸函數(shù)的矩陣表達: XY或eXY其中:k10neee21e2022-5-10952022-5-1095二、多元線性回歸模型的基本假定二、多元線性回歸模型的基本假定 假設(shè)1,解釋變量是非隨機的或固定的,且各X之間互不相關(guān)(無多重共線性)。 假設(shè)2,隨機誤差項具有零均值、同方差及不序列相關(guān)性0)(iE22)()(iiEVar0)(),(jijiECovnjiji, 2 , 1, 假設(shè)3,解釋變量與隨機項不相關(guān) 0),(ijiXCo

56、v假設(shè)4,隨機項滿足正態(tài)分布 ), 0(2Nikj,2 , 1 2022-5-10962022-5-1096上述假設(shè)的矩陣符號表示 式: 假設(shè)1,n(k+1)矩陣X是非隨機的,且X的秩=k+1,即X滿秩。 假設(shè)2, 0)()()(11nnEEEEnnEE11)( 21121nnnEI22211100)var(),cov(),cov()var(nnn假設(shè)3,E(X)=0,即 0)()()(11iKiiiiiKiiiiEXEXEXXE2022-5-109705001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月

57、消費支出Y(元)2022-5-10982022-5-1098假設(shè)4,向量 有一多維正態(tài)分布,即 ),(2I0N 同一元回歸一樣,多元回歸還具有如下兩個重要假設(shè): 假設(shè)5,樣本容量趨于無窮時,各解釋變量的方差趨于有界常數(shù),即n時, jjjijiQXXnxn22)(11或Qxxn1 其中:Q為一非奇異固定矩陣,矩陣x是由各解釋變量的離差為元素組成的nk階矩陣 knnkxxxx1111x假設(shè)6,回歸模型的設(shè)定是正確的。 2022-5-10992022-5-1099第五節(jié)第五節(jié) 多元線性回歸模型的估計和檢驗多元線性回歸模型的估計和檢驗 估計方法:OLS2022-5-101002022-5-10100一

58、、普通最小二乘估計一、普通最小二乘估計對于隨機抽取的n組觀測值kjniXYjii, 2 , 1 , 0, 2 , 1),(如果樣本函數(shù)樣本函數(shù)的參數(shù)估計值已經(jīng)得到,則有: KikiiiiXXXY22110i=1,2n根據(jù)最小二乘原理最小二乘原理,參數(shù)估計值應(yīng)該是下列方程組的解 0000210QQQQk其中2112)(niiiniiYYeQ2122110)(nikikiiiXXXY2022-5-101012022-5-10101于是得到關(guān)于待估參數(shù)估計值的正規(guī)方程組正規(guī)方程組: kiikikikiiiiikikiiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)()(

59、)()(221102222110112211022110 解該(k+1)個方程組成的線性代數(shù)方程組,即可得到(k+1)個待估參數(shù)的估計值, , ,jjk 012 。2022-5-101022022-5-10102正規(guī)方程組正規(guī)方程組的矩陣形式矩陣形式nknkknkkiikikikiiiikiiYYYXXXXXXXXXXXXXXXXn212111211102112111111即YXX)X(由于X XX X滿秩,故有 YXXX1)(2022-5-10103.將上述過程用矩陣表示如下將上述過程用矩陣表示如下:2022-5-10104 矩陣導數(shù) . nmmmnnmnnnffffffffffffffff

60、ffff)()()()()()()()()()()(),(),()()(,)(,)()(),()(,212221212111212121212022-5-10105 使用的公式 .)(,21222211121121AAAaaaaaaaaaAnnnnnnn 2022-5-10106 .212212211122211211222222112121122111112222121121211121222121212111212221121121)()()()()()()()(aaaaaaaaaaaaaaaaAaaaaaaaaaaaAf2022-5-10107根據(jù)矩陣求導法則可得:2022-5-1010

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論