一元線性模型_第1頁(yè)
一元線性模型_第2頁(yè)
一元線性模型_第3頁(yè)
一元線性模型_第4頁(yè)
一元線性模型_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章一元線性回歸模型基本要求:1、了解相關(guān)與回歸的概念2、理解線性回歸模型的假定3、掌握普通最小二乘法4、理解最小二乘估計(jì)量的性質(zhì)5、會(huì)進(jìn)行回歸模型的檢驗(yàn)第一節(jié)一元線性回歸模型概述一、相關(guān)與回歸的基本概念(一)變量之間的關(guān)系各種經(jīng)濟(jì)變量之間的關(guān)系,一般可以分成兩類(lèi),即完全確定的關(guān)系和非確定性的依存關(guān)系。確定性關(guān)系或函數(shù)關(guān)系如果一個(gè)變量值能被一個(gè)或若干個(gè)其他變量值按某一規(guī)律唯一的確定,則這類(lèi)變量之間就具有完全確定的關(guān)系。例如,當(dāng)每噸水的價(jià)格為P元時(shí),居民應(yīng)繳納的水費(fèi)Y(元)與用水量X(噸)之間的關(guān)系可表示為Y=PX。非確定性關(guān)系如果變量之間既存在密切的數(shù)量關(guān)系,又不能由一個(gè)(或幾個(gè))變量之值精確的求出另一個(gè)變量之值,但在大量統(tǒng)計(jì)資料的基礎(chǔ)上,可以判別這類(lèi)變量之間的數(shù)量變化具有一定的規(guī)律性,也稱(chēng)為統(tǒng)計(jì)相關(guān)關(guān)系。例如消費(fèi)支出Y與可支配收入X之間有一定的關(guān)系,在一定范圍內(nèi),收入增加,在理論上可以估計(jì)出增加的消費(fèi)支出額。但應(yīng)看到,可支配收入雖然是影響消費(fèi)支出的重要因素,卻不是唯一的因素。因此,根據(jù)可支配收入并不能精確的求出消費(fèi)支出,也就不能用精確的函數(shù)關(guān)系表達(dá)式來(lái)表示這兩個(gè)變量之間的關(guān)系。計(jì)量經(jīng)濟(jì)學(xué)就是研究變量間的非確定關(guān)系的,變量間的統(tǒng)計(jì)相關(guān)關(guān)系可以通過(guò)相關(guān)分析和回歸分析來(lái)研究。(二)相關(guān)分析1、涵義相關(guān)分析是通過(guò)對(duì)經(jīng)濟(jì)現(xiàn)象的依存關(guān)系的分析,找出現(xiàn)象間的相互依存的形式和相關(guān)程度,以及依存關(guān)系的變動(dòng)規(guī)律。2、類(lèi)型一一從變量間的依存形式看,可分為線性相關(guān)和非線性相關(guān)。線性相關(guān)反映變量間的依存關(guān)系可以近似的表示為一條直線;變量間的依存關(guān)系近似的表示為一條曲線則稱(chēng)為非線性相關(guān)。3、指標(biāo)從變量間的相關(guān)程度看,可以通過(guò)相關(guān)系數(shù)來(lái)度量。兩個(gè)變量之間的相關(guān)程度可以用簡(jiǎn)單相關(guān)系數(shù)來(lái)衡量;多個(gè)變量之間的相關(guān)程度可以用復(fù)相關(guān)系數(shù)、偏相關(guān)系數(shù)等來(lái)衡量。(三)回歸分析回歸的定義回歸分析是研究某一被解釋變量(因變量)與另一個(gè)或多個(gè)解釋變量(自變量)間的依存關(guān)系,其目的在于根據(jù)已知的解釋變量值或固定的解釋變量值(重復(fù)抽樣)來(lái)估計(jì)和預(yù)測(cè)被解釋變量的總體平均值。在研究某一社會(huì)經(jīng)濟(jì)現(xiàn)象的發(fā)展變化規(guī)律時(shí),所研究的現(xiàn)象或?qū)ο蠓Q(chēng)為被解釋變量,它是分析的對(duì)象,把引起這一現(xiàn)象變化的因素稱(chēng)為解釋變量,它是引起這一現(xiàn)象變化的原因。被解釋變量則反映了解釋變量變化的結(jié)果?;貧w模型的分類(lèi)(1)按模型中自變量的多少,分為一元回歸模型和多元回歸模型。一元回歸模型是指只包含一個(gè)解釋變量的回歸模型多元回歸模型是指包含兩個(gè)或兩個(gè)以上解釋變量的回歸模型。(2)按模型中參數(shù)與被解釋變量之間是否線性,分為線性回歸模型和非線性回歸模型。對(duì)于“線性”的解釋?zhuān)阂环N是就變量而言是線性的,即線性回歸模型是指解釋變量與被解釋變量之間呈線性關(guān)系;另一種是就參數(shù)而言是線性的,即線性回歸模型是指參數(shù)與被解釋變量之間呈線性關(guān)系;非線性回歸模型是指參數(shù)與被解釋變量之間呈非線性關(guān)系。就回歸模型而言,通常“線性”是就參數(shù)而言的。(3)按模型中方程數(shù)目的多少,分為單一方程模型和聯(lián)立方程模型。單一方程模型是指只包含一個(gè)方程的回歸模型;聯(lián)立方程模型是指包含兩個(gè)或兩個(gè)以上方程的回歸模型。相關(guān)與回歸的關(guān)系相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析則是相關(guān)分析的深入和繼續(xù)。相關(guān)分析需要依靠回歸分析來(lái)表現(xiàn)變量之間數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來(lái)表現(xiàn)變量之間數(shù)量變化的相關(guān)程度。相關(guān)分析只研究變量之間相關(guān)的方向和程度,不能推斷變量之間相互關(guān)系的具體形式,也無(wú)法從一個(gè)變量的變化來(lái)推測(cè)另一個(gè)變量的變化情況。注意避免“虛假回歸”:只有當(dāng)變量之間存在高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。如果在沒(méi)有對(duì)變量之間是否相關(guān)以及相關(guān)方向和程度做出正確判斷之前,就進(jìn)行回歸分析,很容易造成“虛假回歸”。二者的區(qū)別:在相關(guān)分析中涉及的變量不存在自變量和因變量的劃分問(wèn)題,變量之間的關(guān)系是對(duì)等的;而在回歸分析中,則必須根據(jù)研究對(duì)象的性質(zhì)和研究分析的目的,對(duì)變量進(jìn)行自變量和因變量的劃分。因此,在回歸分析中,變量之間的關(guān)系是不對(duì)等的。在相關(guān)分析中所有的變量都必須是隨機(jī)變量;而在回歸分析中,自變量是給定的,因變量才是隨機(jī)的,即將自變量的給定值代入回歸方程后,所得到的因變量的估計(jì)值不是惟一確定的,而會(huì)表現(xiàn)出一定的隨機(jī)波動(dòng)性。相關(guān)分析主要是通過(guò)一個(gè)指標(biāo)即相關(guān)系數(shù)來(lái)反映變量之間相關(guān)程度的大小,由于變量之間是對(duì)等的,因此相關(guān)系數(shù)是惟一確定的。而在回歸分析中,對(duì)于互為因果的兩個(gè)變量,則有可能存在多個(gè)回歸方程。二一元線性回歸模型總體回歸函數(shù)1、總體回歸函數(shù)假若我們要研究的問(wèn)題是某市n戶城鎮(zhèn)居民家庭的可支配收入x和消費(fèi)支出y之間的關(guān)系,則全體N戶居民家庭構(gòu)成了研究的總體。表2-1給出了全部居民家庭可支配收入和消費(fèi)支出統(tǒng)計(jì)資料。表2-1居民家庭可支配收入和消費(fèi)支出統(tǒng)計(jì)表可支配收入(X)消費(fèi)支出(Y)戶數(shù)平均消費(fèi)支出XYY…Y???YNE(Y1X)111121j1N111XYY…Y???YNE(Y1X)221222j2N222......XYY…Y???YNE(Y1X)ii1i2ijii......XYY…Y???YNE(Y1X)kk1k2kjkNkkk從表2-1可以看出:對(duì)于某一收入水平X,(i=1,2,…,k),有N\N=N1+N2+…+Nk)戶居民家庭消費(fèi)支出與其對(duì)應(yīng),反映出在某一收入水平下有關(guān)消費(fèi)支出的條件分布。根據(jù)該條件分布,可以計(jì)算出在某一收入水平下平均消費(fèi)支出E(Y/X),即條件均值。從表2-1還可以看出:對(duì)于每i一收入水平Xi,僅有唯一的一個(gè)條件均值E(Y/Xi)與其對(duì)應(yīng),這種一一對(duì)應(yīng)的關(guān)系構(gòu)成了函數(shù)關(guān)系,該函數(shù)稱(chēng)為總體回歸函數(shù)(PopulationRegressionFunction,PRF)。記為:E(Y/Xi)=f(Xi)(2-1)總體回歸函數(shù)反映了給定X/.的Y分布的總體均值隨X的變化而變化的關(guān)系。2、回歸系數(shù):P°和七總體回歸函數(shù)f(*)若采用線性函數(shù)的形式,有:E(Y/Xj)=?!?P1Xj(2-2)其中P。和七是未知而固定的參數(shù),稱(chēng)為回歸系數(shù)(RegressionCoefficients),P°稱(chēng)為截距系數(shù)(InterceptCoefficients),p]稱(chēng)為斜率系數(shù)(SlopeCoefficients)o該函數(shù)稱(chēng)為線性總體回歸函數(shù)??傮w回歸函數(shù)的隨機(jī)設(shè)定E(Y/X〔)描述了在某一收入水平下平均消費(fèi)支出水平,但是對(duì)于某一戶居民的家庭消費(fèi)支出Y不一定恰好與該水平一致,或多或少地存在一些偏差。該偏差用P表示,并定義:TOC\o"1-5"\h\zii\o"CurrentDocument"七二Y-E(Y/Xj)(2-3)則有:\o"CurrentDocument"Y=E(Y/X)+p=P+PX+p(2-4)jjj01jj式(2-4)中已反映了除收入之外眾多影響消費(fèi)支出的因素的綜合影響,是一個(gè)不能觀測(cè)的隨機(jī)變量,稱(chēng)為隨機(jī)誤差項(xiàng)(StochasticError)。式(2-4)為總體回歸函數(shù)的隨機(jī)設(shè)定形式。樣本回歸函數(shù)根據(jù)總體資料可以建立總體回歸函數(shù),揭示被解釋變量隨解釋變量的變化而變化的規(guī)律。但在大多數(shù)實(shí)際情況中,總體的信息往往無(wú)法全部獲得,我們所掌握的不過(guò)是與某些固定的X值相對(duì)應(yīng)的Y值的樣本。需要根據(jù)已知的樣本信息去估計(jì)總體回歸函數(shù)。假定現(xiàn)在不知道建立總體回歸函數(shù)的總體資料,僅僅掌握來(lái)自總體的一組樣本數(shù)據(jù),例如,根據(jù)調(diào)查得到某市職工個(gè)人月可支配收入與月消費(fèi)支出數(shù)據(jù)資料(見(jiàn)表2-2)表2-2某市職工個(gè)人月可支配收入與月消費(fèi)支出調(diào)查資料單位:元/月序號(hào)12345678910可支配收入(X)800100012001400160018002000220024002600消費(fèi)支出(Y)700650900950110011501200140015501500根據(jù)以上樣本數(shù)據(jù)擬合一個(gè)線性方程:(2-5)該方程式稱(chēng)為樣本回歸函數(shù)(SampleRegressionFunction,SRF)。比較式(2-2)與(2-5),假若充分地“接近”P(pán),并且耽也充分地“接近”P(pán),就可以0011

用樣本回歸函數(shù)Y去估計(jì)總體回歸函數(shù)E(YIX.)。所以Y亦稱(chēng)為E(YIX.)的估計(jì)量;吭稱(chēng)為P的i1i1U0八.估計(jì)量"1稱(chēng)為°1的估計(jì)量。.一八?一式(2-5)中Y.與實(shí)際的值存在一定的偏差,該偏差e用表示。定乂:ii(2-6)Y=Y+e=P+BX+e(2-6)iii01iie稱(chēng)為樣本剩余項(xiàng),也稱(chēng)為殘差。圖2-1總體回歸函數(shù)與樣本回歸函數(shù)的關(guān)系X1i第二節(jié)一元線性回歸模型參數(shù)估計(jì)e稱(chēng)為樣本剩余項(xiàng),也稱(chēng)為殘差。圖2-1總體回歸函數(shù)與樣本回歸函數(shù)的關(guān)系X1i一■古典線性回歸模型的假定以一元線性回歸模型Y=P0+P1Xi+也為例,古典線性回歸模型的假定如下:假定1:在給定X的條件下,光的條件均值為零。即,EglXg假定2:在給定任意X、X.的條件下,已、氣不相關(guān)。即,Cov(光.,"=0。假定3:對(duì)于每一個(gè)XJ的條件方差是一個(gè)等于戒的常數(shù)。即,V*I婦*)=。2。假定4:在給定Xj的條件下,Xj和已不相關(guān)。即,Cov(^.,勺=0。滿足以上四個(gè)假定的線性回歸模型稱(chēng)為古典線性回歸模型「所謂“古典”是作為一種標(biāo)準(zhǔn)或規(guī)范來(lái)使用的,凡是不滿足以上假定的回歸模型,就不是“古典”回歸模型。在前述假定下,用最小二乘法得到的回歸參數(shù)的估計(jì)值,按照高斯一馬爾可夫定理(Gauss-MarkovTheorem)的意義來(lái)說(shuō),是“最優(yōu)的”。假定5:對(duì)于每一個(gè)光都服從于均值為零、方差為。2正態(tài)分布。即,光?N(0,。2)滿足以上五個(gè)假定的線性回歸模型稱(chēng)為古典正態(tài)線性回歸模型。'

二,?通最小二乘法(一)最小二乘原理利用樣本回歸函數(shù)估計(jì)總體回歸函數(shù),是根據(jù)一個(gè)給定的包含〃組X和y觀測(cè)數(shù)據(jù)的樣本,建…人.......一^立樣本回歸函數(shù),使估計(jì)值y.盡可能接近觀測(cè)值y?。最小二乘原理就是根據(jù)使樣本剩余的平方和達(dá)到最小的準(zhǔn)則,確定模型中的參數(shù),建立樣本回歸函數(shù)。(二)最小二乘估計(jì)量1、計(jì)算、推導(dǎo)由e=y-Y=Y-B-BX,得TOC\o"1-5"\h\ziiii01(2-7)£e2=£(Y-B-BX)2ii01i(2-7)對(duì)于給定的樣本,£e2的大小取決于B和B的大小,即£e2是B和B的函數(shù)。按照最小i01i01二乘原理,要求所選定的B和6應(yīng)使£e2最小,要做到這一點(diǎn),可以借助微積分中求極值的方法,01i用£e2分別對(duì)6和B求偏導(dǎo)數(shù),并令其為零,滿足該條件的6和B可以使£e2最小。即:0101正e2鄧’用£e2分別對(duì)6和B求偏導(dǎo)數(shù),并令其為零,滿足該條件的6和B可以使£e2最小。即:0101正e2鄧’0可得到:2(y-B0,4—。即1Xi)=°乙(y—B0-B]x.)x=0(2-8)整理后有:£y=,B+bSXv1Vv£xy=B0£x+B]£X2(2-9)求解得:八n£XY-£X£YB1=n£x2-(£x)2'iiB旦-B呈0n1n(2-10)(2-11)(2-12)£(X—X)(Y—Y)iX—X)2i(2-12)(2-13)一、(2-13)一、則°1=X’-X,£xy=亍ii£x2iy,=匕-Y(離差)(2-14)以上°0和°]是根據(jù)最小二乘原理求得的,故稱(chēng)為普通最小二乘估計(jì)量。2、實(shí)例利用表2-2的樣本資料建立最小二乘回歸模型的過(guò)程如下:表2-3計(jì)算表序號(hào)X.Y,xyX2x.yX2i1800700-900-41081000016810036900064000021000650-700-460490000211600322000100000031200900-500-21025000044100105000144000041400950-300-1609000025600480001960000516001100-100-101000010010002560000618001150100401000016004000324000072000120030090900008100270004000000822001400500290250000841001450004840000924001550700440490000193600308000576000010260015009003908100001521003510006760000合計(jì)1700011100003300000889000168000032200000平均17001110£xy1680000▽ii==0.5091£x23300000i—q—=Y—°X—q—=Y—°X=1110-0.5091x1700=244.54551°0樣本回歸函數(shù)為:Y=244.5455+0.5091Xii上式表明,該市職工每月可支配收入若是增加100元,職工將會(huì)拿出其中的50.91元用于消費(fèi)。(三)普通最小二乘回歸直線的性質(zhì)回歸直線具有以下性質(zhì):回歸直線通過(guò)樣本均值。估計(jì)值匕的均值等于觀測(cè)值匕的均值。剩余項(xiàng)e的均值為零。Z剩余項(xiàng)e?與估計(jì)量匕不相關(guān)。剩余項(xiàng)e?與解釋變量X,不相關(guān)。三,■小二乘估計(jì)量的性質(zhì)(一)線性性最小二乘法計(jì)算的估計(jì)量是隨機(jī)變量七的線性函數(shù)。1.%的線性由式(2-14)得:八^xyEx(Y-Y)YxYYExYxY&=——=——i_i=——i—?=——I1Ex2Ex2Ex2Ex2Ex2=E^L(這里Ex=0)Ex2iix,Ex2i有:p=EkY1ii2.P的線性0由式(2-13)得:p=Y—Bx=1Zy—ZkYX=z(I—kX)Y01niiinii(2-15)…1、二令h=kX有:p=EhY0ii(2-16)(二)無(wú)偏性.........如果估計(jì)量8的均值等于總體參數(shù)真值8,則該估計(jì)量就是無(wú)偏估計(jì)量。8的無(wú)偏性1由式(2-15)得:8二£kY1因?yàn)椋骸阫=0,ii£kx=1

ii所以:81=81+£k巴二£k(8+8x+r)=8£k+8£kxi01ii0i1ii(2-17)(2-18(2-18)(2-19)(2-20)則8就是8的最佳由此可得:E(|3)=E(8+£kp)=E(8)+E(£kp)=8+£kE(^)二811ii1ii1ii1即:E(8)=811、8的無(wú)偏性0由式(2-16)可得:8=8+£hp00iia一E(8)=800(三)有效性(最佳無(wú)偏性)在所有關(guān)于總體參數(shù)真值8的無(wú)偏估計(jì)量中,若估計(jì)量8具有最小方差,無(wú)偏估計(jì)量。L8]的有效性由式(2-17)可得:Var(P)=Var(P+£k日)

11i=Var(P)+Var(£k日)E1iiVar(k四.)=£k2Var(u)i=b2乙k2i=b2£[;]2(2-21)八.....A設(shè)P*是用其他估計(jì)方法得到的關(guān)于七的線性無(wú)偏估計(jì)量。由其線性性質(zhì)可知P11對(duì)其求方差可得:Var(P*)=Var£((?-k)+k)Y=b2£(①-k)2+Var(P)\o"CurrentDocument"1iiiiii1=加Y,ii這里b2£(①—k)2>0,所以有:Var(P*)>Var(P)11八2.p0的有效性同理,由式(2-16)可得:£y2/dX2Var(P)Yib20n£x2i(2-22)”設(shè)P0*是用其他估計(jì)方法得到的關(guān)于P0的線性無(wú)偏估計(jì)量,則有:A與對(duì)P的有效性分析相同1Var(P*)>Var(P)00結(jié)論:在古典線性回歸模型的假定下,最小二乘估計(jì)量在所有線性無(wú)偏估計(jì)量中,具有最小方差,這一結(jié)論即是著名的高斯-馬爾可夫(Gauss-Markov)定理。、估計(jì)量P0和P1的分布1、理論基礎(chǔ)對(duì)于一個(gè)古典正態(tài)線性回歸模型,即同時(shí)滿足第二節(jié)中假定5的古典線性回歸模型,其隨機(jī)擾動(dòng)項(xiàng)u服從正態(tài)分布。由于Y是u的線性函數(shù),而P和P又分別是Y的線性函數(shù),根據(jù)正態(tài)分布iii01iKA的性質(zhì)可知,P和P也服從正態(tài)分布。01由以上分析可知:E(P)=P,E(P)=P0011Var(p)=^^ib2,Var(p)=bb0nZx2i從而有:rZx2)亍ib2U0nZX2/4?P0?NP,在上面計(jì)算P和P方差的表達(dá)式中,除了隨機(jī)擾動(dòng)項(xiàng)的方差b2之外,01都是可以根據(jù)樣本資料估計(jì)的??梢杂胋2的無(wú)偏估計(jì)量42來(lái)代替b2計(jì)算『和&的方差。01Ze2人一?b2=Ln—2(2-23)Ze2可以根據(jù)式(2-8)計(jì)算,也可以由下式計(jì)算:iZe:=Zy:+P:Zx22、實(shí)例對(duì)于例題2-1.Zy2+p2Zx2b2=i1i-(2-24)n—2889000—0.50912x330000010—2=4212.0909ZX—3220000(X4212.0909/Var(P)=年ib2==4109.980nZx210x3300000iS(P0)=JVar(P0)=64.1091b24212.0909Var(P1)=L^3300000-ic?Z~一一一S(P1)=dVar(p1)=0.0357。第三節(jié)顯著性檢驗(yàn)一,擬合優(yōu)度與相關(guān)系數(shù)檢驗(yàn)(一)擬合優(yōu)度與可決系數(shù)擬合優(yōu)度是指樣本回歸直線對(duì)觀測(cè)數(shù)據(jù)擬合的優(yōu)劣程度。我們所希望的就是圍繞回歸直線的剩余盡可能的小。擬合優(yōu)度通常用可決系數(shù)來(lái)度量??蓻Q系數(shù)是樣本回歸直線對(duì)數(shù)據(jù)擬合程度的綜合度量。在雙變量的情況下,通常用r2表示可決系數(shù)??蓻Q系數(shù)是建立在對(duì)被解釋變量總變差分解的基礎(chǔ)之上。圖2-2總變差分解圖圖2-2中,觀測(cè)值Y的離差y=Y-Y=Y-Y+Y-Y=e+§。/iiiiiii.、—.其中,舍=Y?-Y,是樣本回歸直線所確定的估計(jì)值與平均值的差;人....Cj=Yi-Y?,是樣本觀測(cè)值與回歸直線所確定的估計(jì)值之差。y越大,e越小,估計(jì)值與觀測(cè)值越接近,該點(diǎn)擬合的越好;反之,擬合的越差。當(dāng)y=y時(shí),iiii完全擬合。采用£y2指標(biāo)進(jìn)行分析,該指標(biāo)稱(chēng)為總變差或總離差平方和,簡(jiǎn)記為tss。i£y2=£(e+y)2'=£e:'+£y2+2£ey根據(jù)£ey=0,所以有II(2-25)其中,2y:=£(匕-Y)2,稱(chēng)為回歸平方和,簡(jiǎn)記為ESS;2e=2(Y.-Y?)2,稱(chēng)為殘差平方和,簡(jiǎn)記為RSS。這樣式(2-25)也可以記為:TSS=RSS+ESS(2-26)當(dāng)根據(jù)樣本采用最小二乘法確定了一條回歸直線時(shí),TSS的大小是一定的。ESS越大,RSS越小,該回歸直線擬合的越好;反之,擬合的越差。1、定義:r2=E||,r2稱(chēng)為(樣本)可決系數(shù),它是最常用的回歸直線擬合優(yōu)度的度量,表示TSS由回歸模型做出解釋的變差在總變差中所占的比重。TSS-RSSTSS由式(2-26)得(2-27)RSS=1-——TSSTSS-RSSTSS(2-27)上式表明,若樣本剩余RSS越小,r2的值就越大,擬合優(yōu)度越好;反之,RSS越大,r2的值就越小,擬合優(yōu)度越差。2、可決系數(shù)r2還可以按以下推導(dǎo)出的公式求得:2、(2-28)(2-29)(2-30)=Y-Y=(任+任X)-(任+任X)=BxTOC\o"1-5"\h\z01i011iESS2y22(Bx)2穴2x2TSS=*==P^芥iii(2-28)(2-29)(2-30)由式(2-14)和(2-27)可得:對(duì)于例題2-1,(對(duì)于例題2-1,(2xy)2

r2=__i'V(2x2)(2y2)II168000023300000x889000=0.96213、r2具有以下兩個(gè)性質(zhì)(1)r2是一個(gè)非負(fù)數(shù)。(2)r2的取值范圍是:0<r2<1Or2=1意味著完全擬合,r2=0意味著被解釋變量與解釋變量之間沒(méi)有線性關(guān)系,0<r2<1時(shí),r2越接近于1擬合效果越好。(二)相關(guān)系數(shù)檢驗(yàn)1.相關(guān)系數(shù)相關(guān)系數(shù)是兩個(gè)變量之間的相關(guān)程度的度量。定義:£(X-X)J-Y)乙yr=Li=ii-;Z(X.—X)£Q—Y)\,2必k:?T(2-31)在一元線性回歸中,相關(guān)系數(shù)在數(shù)值上是可決系數(shù)開(kāi)平方。可以根據(jù)下式計(jì)算:r=土偵r2(2-32)r具有以下性質(zhì):(1)它可以是正值也可以是負(fù)值,其符號(hào)取決于式(2-31)中分子的符號(hào)。(2)它的取值范圍在-1和+1之間,即-1<r<+1。(3)它的性質(zhì)是對(duì)稱(chēng)的,X與Y的相關(guān)系數(shù)rxy和Y與X的相關(guān)系數(shù)ryx是相同的,都是r。(4)它只是線性聯(lián)系或線性相關(guān)的度量,不用來(lái)描述非線性關(guān)系。2.相關(guān)系數(shù)檢驗(yàn)法相關(guān)系數(shù)檢驗(yàn)法是在建立一元線性回歸模型之后,考察兩個(gè)變量之間是否具有顯著的線性相關(guān)關(guān)系,相關(guān)系數(shù)檢驗(yàn)法的步驟如下:(1)根據(jù)相關(guān)系數(shù)的計(jì)算公式計(jì)算相關(guān)系數(shù)r。(2)給定顯著性水平a,根據(jù)a和從相關(guān)系數(shù)臨界值表中查出相關(guān)系數(shù)臨界值[偵-2)的值,比較r與ra(n-2)的值。若|r|>^(n-2),表明兩變量在顯著性水平a時(shí)線性相關(guān)關(guān)系顯著;否則|r|<[(n-2)表明兩變量在顯著性水平a時(shí)線性相關(guān)關(guān)系不顯著。二回歸系數(shù)估計(jì)量的檢驗(yàn)(t檢驗(yàn))進(jìn)行回歸系數(shù)估計(jì)量的檢驗(yàn)方法隨所構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量不同而不同,應(yīng)用最為普遍的是t檢驗(yàn)。(一)t統(tǒng)計(jì)量回歸系數(shù)估計(jì)量服從正態(tài)分布:.rZx2)。。頊,》"21,i/(。?NP,i1vb2用b2的無(wú)偏估計(jì)量S2羊來(lái)代替b2時(shí),可以構(gòu)造t統(tǒng)計(jì)量:B-PB-P—i=i七(P「^b7~(2-33)p-pp-p-0_^-0Se(p0)(2-34)所構(gòu)造的t統(tǒng)計(jì)量服從自由度為n-2的t分布。即t?t(n-2)(二)回歸系數(shù)估計(jì)量的t檢驗(yàn)步驟一'??、.??…一一.?一卜面以估計(jì)量p]為例,介紹t檢驗(yàn)的步驟。提出假設(shè)原假設(shè)H0:p1=0備擇假設(shè)H1:p產(chǎn)0給定顯著性水平,查t分布表獲得臨界值t(n-2),對(duì)于例2-1,在顯著性水平a=0.05,n-2=8o.2時(shí),查t分布表,得到:t(n-2)=2.306。o23.根據(jù)式(2-33)利用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量t的值A(chǔ)Cp-p0.5091===14.2605Se(p)0.03574.進(jìn)行比較,做出判斷若ltl>t(n-2),差異顯著,拒絕原假設(shè),接受備擇假設(shè)o2若ltl<t(n-2),差異不顯著,接受原假設(shè)(見(jiàn)圖2-3)。o23.4.本例中,14.2605>2.306,即ItQt.n-2),差異顯著,拒絕?!?的假設(shè)。2圖2-32圖2-3陰影部分為t檢驗(yàn)的否定域三,方程的整體性檢驗(yàn)(F檢驗(yàn))(一)方差分析由式(2-25)可知:£旻二2+£y2或TSS=RSS+ESS對(duì)總平方和(TSS)的這兩個(gè)分量進(jìn)行研究,就稱(chēng)為從回歸角度進(jìn)行的方差分析(AnalysisofVariance,AOV)。每個(gè)平方和都具有相應(yīng)的自由度,假定給n個(gè)變量賦予數(shù)值,在計(jì)算平方和時(shí),總有k個(gè)變量可以自由取值,即是這k個(gè)變量線性獨(dú)立,我們說(shuō)這個(gè)平方和的自由度為k。與每一個(gè)平方和相聯(lián)系的是它們的自由度。對(duì)于一元線性回歸模型,TSS有n-1個(gè)自由度;ESS有1個(gè)自由度;RSS有n-2個(gè)自由度。平方和與自由度之比即為平均平方和。將平方和、自由度及平均平方和列成一個(gè)表,該表稱(chēng)為方差分析表(見(jiàn)表2-4)。表2-4方差分析表(二)F檢驗(yàn)統(tǒng)計(jì)量定義從方差分析的角度進(jìn)行的回歸模型整體性檢驗(yàn)所采用的檢驗(yàn)統(tǒng)計(jì)量是F統(tǒng)計(jì)量。檢驗(yàn)統(tǒng)計(jì)量F反映平均回歸平方和與平均剩余平方和的比較?!陎;F=—(2-35)£e2'n-2且F服從自由度為1和n-2的F分布。即:F?F(1,n-2)可以推導(dǎo),F(xiàn)與可決系數(shù)r2有以下關(guān)系_r2,~,、F=(n-2)(2-36)1—r2利用檢驗(yàn)統(tǒng)計(jì)量是F可以對(duì)回歸方程進(jìn)行顯著性檢驗(yàn),即F檢驗(yàn)。(三)方程的整體性檢驗(yàn)(F檢驗(yàn))的步驟1.提出假設(shè)原假設(shè)H0:楫=0備擇假設(shè)H1:p產(chǎn)0

給定顯著性水平a,查F分布表獲得臨界值Fa(1,n-2),對(duì)于例2-1,在顯著性水平a=0.05,n-2=8時(shí),查F分布表,得到:F005根據(jù)式(2-35)利用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量F的值.(1,8)=5.32。F=4£X=855303.273=203.0591乙e2/n-24212.0909i(1,8)=5.32。進(jìn)行比較,做出判斷若F〉Fa(1,n-2),差異顯著,拒絕原假設(shè),接受備擇假設(shè);若F<Fa(1,n-2),差異不顯著,接受原假設(shè)(見(jiàn)圖2-4)。本例中,203.0591〉5.32,即F〉F0.05(1,8),差異顯著,拒絕。尸0的假設(shè),方程顯著不為零。P(F)p{F〉F(1,n-2)}=a

p{F<4(1n-2)}=1-aF(1,n-2)圖2-4陰影部分為F檢驗(yàn)的否定域第四節(jié)一元線性回歸模型案例及預(yù)測(cè)預(yù)測(cè)就是利用模型已含有過(guò)去和現(xiàn)在的樣本數(shù)據(jù)或信息擬合的回歸模型,對(duì)被解釋變量的可能值做出定量的估計(jì)。一,點(diǎn)預(yù)測(cè)根據(jù)樣本數(shù)據(jù),利用最小二乘法,可以得到最小二乘估計(jì)值,建立一元回歸的預(yù)測(cè)模型。根據(jù)預(yù)測(cè)模型可以在給定X的條件下,求得Y的估計(jì)值,并進(jìn)行點(diǎn)預(yù)測(cè)。根據(jù)樣本數(shù)據(jù),得到以下樣本回歸函數(shù)Y=B+Bxi01i當(dāng)X.=X時(shí),Y=B+BX,Y為點(diǎn)預(yù)測(cè)值。1000100例如,根據(jù)所給樣本數(shù)據(jù),建立了如下樣本回歸函數(shù)Y=244.5455+0.5091Xii一.--若已知家庭月可支配收入X.=1600兀,根據(jù)上述模型,可預(yù)測(cè)家庭的月消費(fèi)支出%為:人一%=244.5455+0.5091x1600=1059.11(兀):向預(yù)測(cè)分為兩類(lèi):預(yù)測(cè)對(duì)應(yīng)于給定X條件下的個(gè)別Y值。這類(lèi)預(yù)測(cè)我們稱(chēng)為個(gè)別值預(yù)測(cè)。(一)均值預(yù)測(cè)即,對(duì)應(yīng)于給定X條件下的Y的總體均值的預(yù)測(cè)。當(dāng)給定X=X0時(shí),匕=Y0,Y0是總體均值E(Y0|X。)的一個(gè)估計(jì)值。人....且Y0服從于均值為叫1X0)的正態(tài)分布。根據(jù)正態(tài)分布與檢驗(yàn)統(tǒng)計(jì)量小關(guān)系,有:人Y—E(YIX)t=-000-se([)(2-37)….一....八?■八服從于自由度為〃-2的t分布。式中Se(*)為*的標(biāo)準(zhǔn)誤差EJi板+.給定顯著性水平a有:(2-38)Y—E(YIX)—tV^0—Z<taSe(Y)a202」或:PY—tS(Y)<E(YIX)<Y+1S(Y)0ae0000ae01-22(2-39)上式表明,在重復(fù)抽樣中,若構(gòu)造100個(gè)這樣的區(qū)間,將會(huì)有(1-a)x100以上的區(qū)間包含總體均值E(Y0IX0)。建立所預(yù)測(cè)的總體均值E(Y0IX0)的置信區(qū)間為:Y—tS(Y),Y+1S(Y)0ae00ae022(2-40)對(duì)于前述例題,S(Y)=6[1+普又)2■n乙o(eeso(s(e(2-41)TOCS(Y)=6[1+普又)2■n乙o(eeso(s(e(2-41)nLx2Ii,,4212.0909x仁+1600—1700)2]"103300000J=,4212.0909x給定顯著性水平o=0.05,n-2=8時(shí),查t分布表,得到:10025=2.306從而—tS(Y)=1059.11-2.306x20.8320=1011.67(元)0Oe02+1S(Y)=1059.11+2.306x20.8320=1107.14(元)0Oe02P11011.67<E(Y0IX0)<1107.14]=95%即每月可支配收入為1600元的家庭,其平均消費(fèi)支出在1011.07元至1107.14元之間的概率為95%。(二)個(gè)別值預(yù)測(cè)即,對(duì)應(yīng)于給定X條件下的個(gè)別Y值的預(yù)測(cè)。.….八當(dāng)給定X=X時(shí),Y=Y,Y=Y,殘差為e,e=Y—Y。0i0i00000可以證明e服從于均值為零的正態(tài)分布。根據(jù)正態(tài)分布與檢驗(yàn)統(tǒng)計(jì)量t的關(guān)系,有:服從于自由度為n-2的t分布。式中Se(e0)為e0的標(biāo)準(zhǔn)誤差,(2-42)S(e)3:1+1+(X。-又)2e0yn£x2給定顯著性水平o有:(2-42)O(ees-1o.O(ees2或:「.一八一]PY—tS(e)<Y<Y+1S(e)=1—o(2-43)0oe000oe0L22」上式表明,在重復(fù)抽樣中,若構(gòu)造100個(gè)這樣的區(qū)間,將會(huì)有(1-o)X100以上的區(qū)間包含個(gè)

別值*。建立所預(yù)測(cè)的個(gè)別值Y0的置信區(qū)間為:Y-1Y-1S(e),L。,°對(duì)于前述例題,七+1S(%)2(2-44)7~:>楠21+1+(X"X)2InLx2'viJ1(X-X)2Se(e0)=%1+n+^x^ECL__1(1600-1700)2)=|4212.0909x"+仍+(3300000'J=68.1620給定顯著性水平a=0.05。n-2=8時(shí),查t分布表,得到:10025=2.306從而=.C,、,一、—tS(e)=1059.11-2.306x68.1620=901.92(兀)0de02q_‘c,、,一、+1S(e)=1059.11+2.306x68.1620=1216.29(兀)0以e02尸后01.92<Y0<1216.29〕=95%7~:>楠21+1+(X"X)2InLx2'viJ即每月可支配收入為1600元的家庭,以家庭消費(fèi)支出在901.92元至1216.29元之間的概率為95%。三、一元回歸模型實(shí)例分析(一)研究目的依據(jù)1996-2005年《中國(guó)統(tǒng)計(jì)年鑒》提供的資料,經(jīng)過(guò)整理,獲得以下農(nóng)村居民人均消費(fèi)支出和人均純收入的數(shù)據(jù)如表2-5:表2-5農(nóng)村居民1995-2004人均消費(fèi)支出和人均純收入數(shù)據(jù)資料單位:元年度1995199619971998199920002001200220032004人均純收入1577.741926.072090.132161.982210.342253.422366.402475.632622.242936.40人均消費(fèi)支出1310.361572.081617.151590.331577.421670.131741.091834.311943.302184.65(二)建立模型以農(nóng)村居民人均純收入為解釋變量X,農(nóng)村居民人均消費(fèi)支出為被解釋變量Y,分析Y隨X的變化

而變化的因果關(guān)系。考察樣本數(shù)據(jù)的分布并結(jié)合有關(guān)經(jīng)濟(jì)理論,建立一元線性回歸模型如下:匕=。0坨*f根據(jù)表2-5編制計(jì)算各參數(shù)的基礎(chǔ)數(shù)據(jù)計(jì)算表。求得:歹=2262.035Y=1704.082x2=1264471.423iy2=516634.011ixy=78885

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論