一元線性回歸模型的置信區(qū)間與預(yù)測_第1頁
一元線性回歸模型的置信區(qū)間與預(yù)測_第2頁
一元線性回歸模型的置信區(qū)間與預(yù)測_第3頁
一元線性回歸模型的置信區(qū)間與預(yù)測_第4頁
一元線性回歸模型的置信區(qū)間與預(yù)測_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2.5 一元線性回歸模型的置信區(qū)間與預(yù)測多元線性回歸模型的置信區(qū)間問題包括參數(shù)估計量的置信區(qū)間和被解釋變量預(yù)測值的置信區(qū)間兩個方面,在數(shù)理統(tǒng)計學(xué)中屬于區(qū)間估計問題。所謂區(qū)間估計是研究用未知參數(shù)的點估計值(從一組樣本觀測值算得的)作為近似值的精確程度和誤差范圍,是一個必須回答的重要問題。一、參數(shù)估計量的置信區(qū)間在前面的課程中,我們已經(jīng)知道,線性回歸模型的參數(shù)估計量是隨機變量的函數(shù),即:,所以它也是隨機變量。在多次重復(fù)抽樣中,每次的樣本觀測值不可能完全相同,所以得到的點估計值也不可能相同?,F(xiàn)在我們用參數(shù)估計量的一個點估計值近似代表參數(shù)值,那么,二者的接近程度如何?以多大的概率達到該接近程度?這就要

2、構(gòu)造參數(shù)的一個區(qū)間,以點估計值為中心的一個區(qū)間(稱為置信區(qū)間),該區(qū)間以一定的概率(稱為置信水平)包含該參數(shù)。即回答以何種置信水平位于之中,以及如何求得a。在變量的顯著性檢驗中已經(jīng)知道 (2.5.1)這就是說,如果給定置信水平,從t分布表中查得自由度為(n-k-1)的臨界值,那么t值處在的概率是。表示為即于是得到:在()的置信水平下的置信區(qū)間是i=0,1 (2.5.3)在某例子中,如果給定,查表得從回歸計算中得到根據(jù)(2.5.2)計算得到的置信區(qū)間分別為和(0.1799,0.2401)顯然,參數(shù)的置信區(qū)間要小。在實際應(yīng)用中,我們當(dāng)然希望置信水平越高越好,置信區(qū)間越小越好。如何才能縮小置信區(qū)間?

3、從(2.5.3)式中不難看出:(1)增大樣本容量n。在同樣的置信水平下,n越大,從t分布表中查得自由度為(n-k-1)的臨界值越?。煌瑫r,增大樣本容量,在一般情況下可使估計值的標準差減小,因為式中分母的增大是肯定的,分子并不一定增大。(2)更主要的是提高模型的擬合度,以減小殘差平方和。設(shè)想一種極端情況,如果模型完全擬合樣本觀測值,殘差平方和為0,則置信區(qū)間也為0。(3)提高樣本觀測值的分散度。在一般情況下,樣本觀測值越分散,標準差越小。置信水平與置信區(qū)間是矛盾的。置信水平越高,在其他情況不變時,臨界值越大,置信區(qū)間越大。如果要求縮小置信區(qū)間,在其他情況不變時,就必須降低對置信水平的要求。二、預(yù)

4、測值的置信區(qū)間1、 點預(yù)測計量經(jīng)濟學(xué)模型的一個重要應(yīng)用是經(jīng)濟預(yù)測。對于模型,如果給定樣本以外的解釋變量的觀測值,有因是前述樣本點以外的解釋變量值,所以和是不相關(guān)的。引用已有的OLS的估計值,可以得到被解釋變量的點預(yù)測值: (2.5.4)但是,嚴格地說,這只是被解釋變量的預(yù)測值的估計值,而不是預(yù)測值。原因在于兩方面:一是模型中的參數(shù)估計量是不確定的,正如上面所說的;二是隨機項的影響。所以,我們得到的僅是預(yù)測值的一個估計值,預(yù)測值僅以某一個置信水平處于以該估計值為中心的一個區(qū)間中。于是,又是一個區(qū)間估計問題。2、 區(qū)間預(yù)測如果已經(jīng)知道實際的預(yù)測值,那么預(yù)測誤差為顯然,是一隨機變量,可以證明而 因為

5、由原樣本的OLS估計值求得,而與原樣本不相關(guān),故有:,可以計算出來: (2.5.5) (2.5.6)因和均服從正態(tài)分布,可利用它們的性質(zhì)構(gòu)造統(tǒng)計量,求區(qū)間預(yù)測值。利用構(gòu)造統(tǒng)計量為:將用估計值代入上式,有這樣,可得顯著性水平下的置信區(qū)間為 (2.5.7)(2.5.7)式稱為的均值區(qū)間預(yù)測。同理,利用構(gòu)造統(tǒng)計量,有 將用估計值代入上式,有:根據(jù)置信區(qū)間的原理,得顯著性水平下的置信區(qū)間:(2.5.8) 上式稱為的個值區(qū)間預(yù)測,顯然,在同樣的下,個值區(qū)間要大于均值區(qū)間。(2.5.7)和(2.5.8)也可表述為:的均值或個值落在置信區(qū)間內(nèi)的概率為,即為預(yù)測區(qū)間的置信度。或者說,當(dāng)給定解釋變量值后,只能得

6、到被解釋變量或其均值以的置信水平處于某區(qū)間的結(jié)論。經(jīng)常聽到這樣的說法,“如果給定解釋變量值,根據(jù)模型就可以得到被解釋變量的預(yù)測值為值”。這種說法是不科學(xué)的,也是計量經(jīng)濟學(xué)模型無法達到的。如果一定要給出一個具體的預(yù)測值,那么它的置信水平則為0;如果一定要回答解釋變量以100%的置信水平處在什么區(qū)間中,那么這個區(qū)間是。在實際應(yīng)用中,我們當(dāng)然也希望置信水平越高越好,置信區(qū)間越小越好,以增加預(yù)測的實用意義。如何才能縮小置信區(qū)間?從(2.5.5)和(2.5.6)式中不難看出:(1)增大樣本容量n。在同樣的置信水平下,n越大,從t分布表中查得自由度為(n-k-1)的臨界值越?。煌瑫r,增大樣本容量,在一般情

7、況下可使減小,因為式中分母的增大是肯定的,分子并不一定增大。(2)更主要的是提高模型的擬合優(yōu)度,以減小殘差平方和。設(shè)想一種極端情況,如果模型完全擬合樣本觀測值,殘差平方和為0,則置信區(qū)間長度也為0,預(yù)測區(qū)間就是一點。(3)提高樣本觀測值的分散度。在一般情況下,樣本觀測值越分散,作為分母的的值越大,致使區(qū)間縮小。置信水平與置信區(qū)間是矛盾的。置信水平越高,在其他情況不變時,臨界值越大,置信區(qū)間越大。如果要求縮小置信區(qū)間,在其他情況不變時,就必須降低對置信水平的要求。四、一元線性回歸模型參數(shù)估計實例為了幫助讀者理解一元線性回歸模型參數(shù)估計的原理,下面以我國國家財政文教科學(xué)衛(wèi)生事業(yè)費支出模型為例,不采

8、用計量經(jīng)濟學(xué)應(yīng)用軟件,用手工計算,進行模型的參數(shù)估計。經(jīng)分析得到,我國國家財政中用于文教科學(xué)衛(wèi)生事業(yè)費的支出,主要由國家財政收入決定,二者之間具有線性關(guān)系。于是可以建立如下的模型:其中,為第t年國家文教科學(xué)衛(wèi)生事業(yè)費支出額(億元),為第t年國家財政收入額(億元),為隨機誤差項,為待估計的參數(shù)。選取19911997年的數(shù)據(jù)為樣本,利用(2.2.6)和(2.2.7)的計算公式,分別計算參數(shù)估計值。表2.2.1 有關(guān)數(shù)據(jù)表年份EDFI19917083149-551-2351734-26-0.03719927933483-466-2017804-11-0.01419939584349-301-1151

9、1001-43-0.04519941278521819-2821196820.0641995146762422087421424430.02919961704740844519081685190.01119971904865164531511963-59-0.031有關(guān)中間計算結(jié)果如下: 由電腦計算的參數(shù)估計值為 全部統(tǒng)計結(jié)果如下表。從表中可看出,判定系數(shù)0.99,表示以國家財政收入額來解釋國家文教科學(xué)衛(wèi)生事業(yè)費支出額,在1991至1997年間,擬合度相當(dāng)理想。截距項的估計值對應(yīng)的t-統(tǒng)計量為0.47,不能通過顯著性檢驗,即不能推翻為0的假設(shè);而一次系數(shù)的估計值對應(yīng)的t-統(tǒng)計量為20.34,不

10、用查表即可知通過顯著性檢驗,即顯著不為0,因果關(guān)系成立。F-統(tǒng)計量的值為413.58,也表示方程系數(shù)顯著不為0。表一:Eviews計算結(jié)果Dependent Variable: EDMethod: Least SquaresDate: 09/21/02 Time: 16:22Sample: 1991 1997Included observations: 7VariableCoefficientStd. Errort-StatisticProb. C30.0523763.906910.4702520.6580FI0.2234190.01098620.336590.0000R-squared0.9

11、88055 Mean dependent var1258.857Adjusted R-squared0.985666 S.D. dependent var459.8972S.E. of regression55.06160 Akaike info criterion11.08974Sum squared resid15158.90 Schwarz criterion11.07428Log likelihood-36.81408 F-statistic413.5768Durbin-Watson stat1.644626 Prob(F-statistic)0.000005表二:不含截距項的Evie

12、ws計算結(jié)果:Dependent Variable: EDMethod: Least SquaresDate: 09/21/02 Time: 16:19Sample: 1991 1997Included observations: 7VariableCoefficientStd. Errort-StatisticProb. FI0.2283040.00333768.408770.0000R-squared0.987526 Mean dependent var1258.857Adjusted R-squared0.987526 S.D. dependent var459.8972S.E. of

13、regression51.36364 Akaike info criterion10.84730Sum squared resid15829.34 Schwarz criterion10.83957Log likelihood-36.96556 Durbin-Watson stat1.630622Dependent Variable: LEDMethod: Least SquaresDate: 09/21/02 Time: 16:21Sample: 1991 1997Included observations: 7VariableCoefficientStd. Errort-Statistic

14、Prob. C-1.5223290.383141-3.9732900.0106LFI1.0055630.04476422.463410.0000R-squared0.990188 Mean dependent var7.077084Adjusted R-squared0.988226 S.D. dependent var0.382958S.E. of regression0.041554 Akaike info criterion-3.288701Sum squared resid0.008634 Schwarz criterion-3.304156Log likelihood13.51045

15、 F-statistic504.6048Durbin-Watson stat1.930000 Prob(F-statistic)0.000003多元線性回歸模型的參數(shù)估計實例例2.3.1 建立中國消費模型。根據(jù)消費模型的一般形式,選擇消費總額為被解釋變量,國內(nèi)生產(chǎn)總值和前一年的消費總額為解釋變量,變量之間關(guān)系為簡單線性關(guān)系,選取1981年至1996年統(tǒng)計數(shù)據(jù)為樣本觀測值。樣本觀測值列于表2.3.1中。表2.3.1 中國消費數(shù)據(jù)表年份消費總額國內(nèi)生產(chǎn)總值前一年消費額年份消費總額國內(nèi)生產(chǎn)總值前一年消費額198133094901297619891055616466936019823638548933

16、09199011362183210556198340216076363819911314621280113621984469471644021199215952258641314619855773879246941993201823450115952198665421013357731994272164711120182198774511178465421995345295940527216198893601470474511996401726849834529以y代表消費總額,代表國內(nèi)生產(chǎn)總值,代表前一年消費總額,應(yīng)用計量經(jīng)濟分析軟件包TSP6.5中普通最小二乘法估計模型,得到下列結(jié)果: (

17、2.3.13)(6.83) (32.36) (5.70) 式中各項都是評價估計結(jié)果優(yōu)劣的重要標準,后面將逐一介紹。這里僅討論參數(shù)估計值。兩個解釋變量前的參數(shù)估計值分別為0.4809和0.1985,都為正數(shù),且都處于0與1之間,常數(shù)項的估計值也為正,這些參數(shù)估計值的經(jīng)濟含義是合理的。隨機誤差項的方差的估計值為33739.5。狼(現(xiàn)群主):職業(yè)數(shù)據(jù)分析師,IT男 過風(fēng)(舊群主):老板 旗下88家連鎖酒店要飯(群員):職業(yè)產(chǎn)品經(jīng)理,北京某私企 鐵心(群員):職業(yè)總助 某知名上市醫(yī)藥公司 路飛(群員):信息不明 志(群員):信息未知 石頭(群員):職業(yè)獵頭 重慶某私企單位 格格(群員):職業(yè)大佬 金融行業(yè) 影(群員):職業(yè)算法師 IT男北京某企業(yè)新

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論