![單方程回歸模型的幾個(gè)專題_第1頁](http://file4.renrendoc.com/view/d7fc65ce8f721c330c14d291d2c34ca7/d7fc65ce8f721c330c14d291d2c34ca71.gif)
![單方程回歸模型的幾個(gè)專題_第2頁](http://file4.renrendoc.com/view/d7fc65ce8f721c330c14d291d2c34ca7/d7fc65ce8f721c330c14d291d2c34ca72.gif)
![單方程回歸模型的幾個(gè)專題_第3頁](http://file4.renrendoc.com/view/d7fc65ce8f721c330c14d291d2c34ca7/d7fc65ce8f721c330c14d291d2c34ca73.gif)
![單方程回歸模型的幾個(gè)專題_第4頁](http://file4.renrendoc.com/view/d7fc65ce8f721c330c14d291d2c34ca7/d7fc65ce8f721c330c14d291d2c34ca74.gif)
![單方程回歸模型的幾個(gè)專題_第5頁](http://file4.renrendoc.com/view/d7fc65ce8f721c330c14d291d2c34ca7/d7fc65ce8f721c330c14d291d2c34ca75.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
單方程回歸模型的幾個(gè)專題第一頁,共一百二十五頁,編輯于2023年,星期五2.引入虛擬變量的作用引入虛擬變量的作用,在于將定性因素或?qū)傩砸蛩貙?duì)因變量的影響數(shù)量化。
(1)可以描述和測(cè)量定性(或?qū)傩裕┮蛩氐挠绊懀?/p>
(2)能夠正確反映經(jīng)濟(jì)變量之間的相互關(guān)系,提高模型的精度;
(3)便于處理異常數(shù)據(jù)。設(shè)置虛擬變量(即將異常數(shù)據(jù)作為一個(gè)特殊的定性因素)。例如:
7.1.2虛擬變量的設(shè)置
1.虛擬變量的設(shè)置規(guī)則
(1)一個(gè)因素多個(gè)屬性第二頁,共一百二十五頁,編輯于2023年,星期五
若定性因素有m個(gè)不同屬性或相互排斥的類型,在模型中則只能引入m-1個(gè)虛擬變量,否則會(huì)產(chǎn)生完全多重共線性。
例7.1.1
設(shè)居民住房消費(fèi)函數(shù)為第三頁,共一百二十五頁,編輯于2023年,星期五同類型居民對(duì)住房消費(fèi)支出是否有顯著影響。但在此例中,若引入m=2個(gè)虛擬變量:
例7.1.2
設(shè)公司職員的年薪(y)與工齡(x)和學(xué)歷(D)有關(guān)。學(xué)歷分成三種類型:大專以下、本科、研究生(一個(gè)定性因素,三個(gè)不同屬性)。為了反映“學(xué)歷”這個(gè)定性因素的影響,應(yīng)該設(shè)置兩個(gè)虛擬變量:第四頁,共一百二十五頁,編輯于2023年,星期五第五頁,共一百二十五頁,編輯于2023年,星期五
(2)多個(gè)定性因素多種不同屬性
例7.1.3
研究居民住房消費(fèi)函數(shù)時(shí),考慮到城鄉(xiāng)差異以及不同收入層次的影響,將消費(fèi)函數(shù)設(shè)定為第六頁,共一百二十五頁,編輯于2023年,星期五
(3)虛擬變量取值應(yīng)從分析問題的目的出發(fā)予以界定一般地,“1”表示這種屬性或特征存在,“0”表示這種屬性或特征不存在。而且設(shè)置虛擬變量時(shí),基礎(chǔ)類型、否定類型通常取值為0,而將比較類型、肯定類型取值為1。
(4)虛擬變量在單一方程中,可以作為解釋變量,也可以作為因變量
2.虛擬變量的引入方式
(1)加法類型所設(shè)定的計(jì)量經(jīng)濟(jì)模型中加入適當(dāng)?shù)奶摂M變量,此時(shí)虛擬變量與其他解釋變量在設(shè)定模型中是相加關(guān)系。其作用是改變了設(shè)定模型的截距水平。
例7.1.4
居民家庭的教育費(fèi)用支出除了受收入水平的影響之外,還與子女的年齡結(jié)構(gòu)密切相關(guān)。如果家庭中有適齡子女(6-21歲),教育費(fèi)用支出就多。因此,為了反映“子女年齡結(jié)構(gòu)”這一定性因素,設(shè)置虛擬變量:第七頁,共一百二十五頁,編輯于2023年,星期五第八頁,共一百二十五頁,編輯于2023年,星期五
圖7.1.1表明,在相同的收入水平情況下,有適齡子女家庭的教育費(fèi)用平均要比無適齡子女家庭的教育費(fèi)用多支a出個(gè)單位。圖7.1.1虛擬變量對(duì)截距的影響
第九頁,共一百二十五頁,編輯于2023年,星期五
(2)乘法類型
在所設(shè)定的計(jì)量經(jīng)濟(jì)模型中,將虛擬解釋變量與其他解釋變量相乘作為新的解釋變量出現(xiàn)在模型中,以達(dá)到其調(diào)整設(shè)定模型斜率系數(shù)的目的。乘法形式引入虛擬解釋變量的主要作用在于:①兩個(gè)回歸模型之間的比較;②因素之間的交互影響分析;③提高模型對(duì)現(xiàn)實(shí)經(jīng)濟(jì)現(xiàn)象的描述精度。
例7.1.5
隨著收入水平的提高,家庭教育費(fèi)用支出的邊際消費(fèi)傾向可能會(huì)發(fā)生變化。為了反映定性因素對(duì)斜率的影響,可以用乘法方式引入虛擬變量,將家庭教育費(fèi)用支出函數(shù)取成:第十頁,共一百二十五頁,編輯于2023年,星期五圖7.1.2虛擬變量對(duì)斜率的影響
第十一頁,共一百二十五頁,編輯于2023年,星期五
(3)一般方式
實(shí)際應(yīng)用中,一般是直接以加法和乘法方式引入虛擬變量,然后再利用t檢驗(yàn)判斷其系數(shù)是否顯著的不等于零,進(jìn)而確定虛擬變量的具體引入方式。我們還可以用加法模型與乘法模型相結(jié)合的方式建立模型來擬合經(jīng)濟(jì)發(fā)展出現(xiàn)轉(zhuǎn)折的情況。
例7.1.6
進(jìn)口商品消費(fèi)支出y主要取決于國(guó)民生產(chǎn)總值x的多少。我國(guó)改革開放前后,由于國(guó)家政策的變化,及改革開放后外資的大量引入等因素的影響,1978年前后,y和x
第十二頁,共一百二十五頁,編輯于2023年,星期五第十三頁,共一百二十五頁,編輯于2023年,星期五
例7.1.7:關(guān)于家庭儲(chǔ)蓄的模型隨機(jī)調(diào)查美國(guó)舊金山地區(qū)20個(gè)家庭的儲(chǔ)蓄情況,擬建立年儲(chǔ)蓄額y(千美元)對(duì)年收入x(千美元)的回歸模型。y和x的數(shù)據(jù)見表7.1.1。相應(yīng)散點(diǎn)圖見圖7.1.4。第十四頁,共一百二十五頁,編輯于2023年,星期五表7.1.1家庭年儲(chǔ)蓄額y與收入額x數(shù)據(jù)(單位:千美元)tyxDtyxD11.020.00110.39.0021.324.00120.06.0030.712.00131.018.0040.816.00142.020.0150.511.00150.412.0062.432.01160.714.0070.310.00171.515.0183.240.01181.616.0192.832.01190.615.00100.07.00200.614.00第十五頁,共一百二十五頁,編輯于2023年,星期五
圖7.1.4家庭年儲(chǔ)蓄額yt與收入額xt散點(diǎn)圖通過散點(diǎn)圖分析,可以給模型加入一個(gè)定性變量“住房狀況”,用D表示。虛擬變量D定義如下:第十六頁,共一百二十五頁,編輯于2023年,星期五第十七頁,共一百二十五頁,編輯于2023年,星期五
例7.1.8中國(guó)進(jìn)出口模型。中國(guó)進(jìn)出口貿(mào)易總額數(shù)據(jù)(1950-1884)見表7.1.2。試檢驗(yàn)改革開放前后該時(shí)間序列的斜率是否發(fā)生變化。表7.1.2中國(guó)進(jìn)出口貿(mào)易總額數(shù)據(jù)(單位:百億元人民幣)第十八頁,共一百二十五頁,編輯于2023年,星期五年份進(jìn)出口總額y時(shí)間x虛擬變量D1D1*x19500.41510019510.59520019520.64630019530.80940019540.84750019551.09860019561.08770019571.04580019581.28790019591.493100019601.284110019610.908120019620.809130019630.857140019640.975150019651.184160019661.271170019671.122180019681.0851900第十九頁,共一百二十五頁,編輯于2023年,星期五年份進(jìn)出口總額y時(shí)間x虛擬變量D1D1*x19691.069200019701.129210019711.209220019721.469230019732.205240019742.923250019752.904260019762.641270019772.725280019783.550290019794.5463013019805.6383113119817.3533213219827.7133313319838.60134134198412.01035135第二十頁,共一百二十五頁,編輯于2023年,星期五第二十一頁,共一百二十五頁,編輯于2023年,星期五圖7.1.8中國(guó)進(jìn)出口貿(mào)易總額序列圖圖和回歸直線圖
第二十二頁,共一百二十五頁,編輯于2023年,星期五
例7.1.9中國(guó)城鎮(zhèn)居民消費(fèi)函數(shù)
。
表7.1.2給出了中國(guó)1952-2005年城鎮(zhèn)居民人均可支配收入、人均消費(fèi)性支出(單位:元)數(shù)據(jù)。采用上述建模方法來建立我國(guó)城鎮(zhèn)居民消費(fèi)函數(shù)。表7.1.2中國(guó)1952-2005年城鎮(zhèn)居民人均可支配收入、人均消費(fèi)(單位:元)第二十三頁,共一百二十五頁,編輯于2023年,星期五年份可支配收入AI消費(fèi)支出AC年份可支配收入AI消費(fèi)支出AC1952110.13104.941980477.6412.441953121.76118.371981500.4456.841954121.82119.571982535.3471.001955124.47122.861983564.6505.921956138.24134.241984652.1559.441957137.74134.271985739.1673.201958143.98136.191986900.1798.961959150.24143.4619871002.1884.401960156.29150.2519881180.21103.981961132.30139.1219891373.91210.951962131.06135.5319901510.21278.891963136.40135.1419911700.61453.811964133.74130.8719922026.61671.731695141.30137.3119932577.42110.811966145.86142.0519943496.22851.341967149.47147.3319954283.03537.571968145.89144.0619964838.93919.471969151.23151.4119975160.34185.64第二十四頁,共一百二十五頁,編輯于2023年,星期五1970151.32152.8019985425.14331.611971161.95158.1719995854.04615.911972177.52172.4020006280.04998.001973182.36177.8220016859.65309.011974187.16182.6720027702.86029.881975189.21186.3320038472.26510.941976194.76190.8820049421.67182.101977202.45200.45200510493.07943.001978343.4311.16200611759.01979405.0361.80第二十五頁,共一百二十五頁,編輯于2023年,星期五
分析:由于1978-1991年我國(guó)實(shí)行的是有計(jì)劃的商品經(jīng)濟(jì)體制,以前為計(jì)劃經(jīng)濟(jì),1992年以后我國(guó)實(shí)行的市場(chǎng)經(jīng)濟(jì)體制。因此,可以設(shè)置兩個(gè)虛擬變量D1和D2:圖7.1.8中國(guó)城鎮(zhèn)居民人均可支配收入、人均消費(fèi)趨勢(shì)圖第二十六頁,共一百二十五頁,編輯于2023年,星期五
利用EViews軟件,輸入樣本數(shù)據(jù)AI、AC、D1和D2,然后在命令窗口鍵入:LSACCAID1D2(AI-343.4)*D1(AI-2026.6)*D2剔除不顯著的變量、消除自相關(guān)后,得到表7.1.3回歸結(jié)果。設(shè)定模型的數(shù)學(xué)表達(dá)式為:第二十七頁,共一百二十五頁,編輯于2023年,星期五表7.1.3我國(guó)城鎮(zhèn)居民消費(fèi)函數(shù)回歸結(jié)果第二十八頁,共一百二十五頁,編輯于2023年,星期五第二十九頁,共一百二十五頁,編輯于2023年,星期五
由此可以看出,我國(guó)城鎮(zhèn)居民消費(fèi)函數(shù)的特點(diǎn):1978年前后、1992年前后幾個(gè)時(shí)期的回歸結(jié)果在截距與斜率項(xiàng)上不同。1978年以前計(jì)劃經(jīng)濟(jì)時(shí)期我國(guó)城鎮(zhèn)居民邊際消費(fèi)傾向?yàn)?.85,1978-1991年我國(guó)實(shí)行的是有計(jì)劃的商品經(jīng)濟(jì)體制,城鎮(zhèn)居民邊際消費(fèi)傾向提高,達(dá)到為0.87,1992年以后我國(guó)實(shí)行的市場(chǎng)經(jīng)濟(jì)體制,自發(fā)消費(fèi)大幅度提高,但邊際消費(fèi)傾向在下降(僅為0.72)。第三十頁,共一百二十五頁,編輯于2023年,星期五變參數(shù)線性回歸模型(選學(xué))
如果模型參數(shù)取值呈連續(xù)變化的,稱為連續(xù)型確定性變參數(shù)線性回歸模型。
(1)截距系統(tǒng)變動(dòng)模型。即在回歸模型中僅截距項(xiàng)發(fā)生系統(tǒng)性變化,而斜率在整個(gè)樣本期內(nèi)不發(fā)生變化的變參數(shù)線性回歸模型。
(2)斜率系統(tǒng)變動(dòng)模型。即在回歸模型中僅有斜率項(xiàng)發(fā)生系統(tǒng)性變化,而截距在整個(gè)樣本期內(nèi)不發(fā)生變化變參數(shù)線性回歸模型。
(3)截距和斜率系統(tǒng)變動(dòng)模型。即在回歸模型中截距和斜率在樣本期內(nèi)都發(fā)生變動(dòng)的模型。其一般形式為:第三十一頁,共一百二十五頁,編輯于2023年,星期五
以1952-1991年我國(guó)城鎮(zhèn)居民人均可支配收入與人均消費(fèi)支出的數(shù)據(jù)資料表7.1.2為例,建立我國(guó)城鎮(zhèn)居民系統(tǒng)變參數(shù)消費(fèi)函數(shù)模型。對(duì)本例而言,要體現(xiàn)自發(fā)消費(fèi)支出和邊際消費(fèi)傾向隨經(jīng)濟(jì)發(fā)展過程的變動(dòng)狀況,應(yīng)取時(shí)間作為影響模型參數(shù)的外生變量。因此,可設(shè)定系統(tǒng)變參數(shù)模型為第三十二頁,共一百二十五頁,編輯于2023年,星期五第三十三頁,共一百二十五頁,編輯于2023年,星期五第三十四頁,共一百二十五頁,編輯于2023年,星期五
上述模型表明:
(1)b1和b3在統(tǒng)計(jì)上是高度顯著的,從而證明我國(guó)城鎮(zhèn)居民的消費(fèi)行為在1952~2005年間是不斷變化的。
由此可見,隨著時(shí)間的推移,我國(guó)城鎮(zhèn)居民的邊際消費(fèi)傾向呈逐年下降趨勢(shì),如1977年城鎮(zhèn)居民的邊際消費(fèi)傾向?yàn)?.92,到1991年下降為0.83,2005年下降至0.75。第三十五頁,共一百二十五頁,編輯于2023年,星期五7.1.3虛擬變量的特殊應(yīng)用
1.虛擬變量在季節(jié)調(diào)整模型中的應(yīng)用使用虛擬變量也可以反映季節(jié)因素的影響。例如,利用季度數(shù)據(jù)分析某公司利潤(rùn)y與銷售收入x之間的相互關(guān)系時(shí),為研究四個(gè)季度對(duì)利潤(rùn)的季節(jié)性影響,引入三個(gè)虛擬變量(設(shè)第1季度為基礎(chǔ)類型):第三十六頁,共一百二十五頁,編輯于2023年,星期五
例7.1.10
用虛擬變量處理季節(jié)數(shù)據(jù)模型中國(guó)1982-1988年市場(chǎng)用煤銷售量(yt)季節(jié)數(shù)據(jù)(《中國(guó)統(tǒng)計(jì)年鑒》1987,1989)見圖7.1.6與表7.1.4。第三十七頁,共一百二十五頁,編輯于2023年,星期五表7.1.4
中國(guó)市場(chǎng)用煤銷售量季節(jié)數(shù)據(jù)年與季度yttD4D3D2年與季度yttD4D3D21982.12599.810001985.33159.1150101982.22647.220011985.44483.2161001982.32912.730101986.12881.8170001982.44087.041001986.23308.7180011983.12806.550001986.33437.5190101983.22672.160011986.44946.8201001983.32943.670101987.13209.0210001983.44193.481001987.23608.1220011984.13001.990001987.33815.6230101984.22969.5100011987.45332.3241001984.33287.5110101988.13929.8250001984.44270.6121001988.24126.2260011985.13044.1130001988.34015.1270101985.23078.8140011988.44904.228100第三十八頁,共一百二十五頁,編輯于2023年,星期五
由于受取暖用煤的影響,每年第四季度的銷售量大大高于其它季度。圖7.1.7給出了直接用yt對(duì)t回歸的擬合直線。數(shù)據(jù)擬合效果不好。鑒于是季節(jié)數(shù)據(jù),初步設(shè)三個(gè)季節(jié)變量如下:第三十九頁,共一百二十五頁,編輯于2023年,星期五在EViews軟件中,生成D2數(shù)據(jù)的EViews命令是GENRD2=@SEAS(2),D3、D4類似。以時(shí)間t為解釋變量(1982年1季度取t=1,EViews命令是:GENRT=@TREND(1981:1))的煤銷售量(yt)模型回歸結(jié)果如表7.1.5所示。表7.1.5回歸結(jié)果第四十頁,共一百二十五頁,編輯于2023年,星期五
由于D3,D2的系數(shù)沒有顯著性,剔除虛擬變量D3,D2,得煤銷售量(yt)模型回歸結(jié)果如表7.1.6所示。表7.1.6回歸結(jié)果第四十一頁,共一百二十五頁,編輯于2023年,星期五第四十二頁,共一百二十五頁,編輯于2023年,星期五若不采用虛擬變量,yt對(duì)t直接回歸,得結(jié)果如表7.1.7所示。表7.1.7回歸結(jié)果第四十三頁,共一百二十五頁,編輯于2023年,星期五上式與式(7.1.9)相比,決定系數(shù)不足一半、F統(tǒng)計(jì)量明顯減小。從殘差圖7.1.8與圖7.1.9看,式(7.1.9)擬合優(yōu)度明顯高于式(7.1.10)。第四十四頁,共一百二十五頁,編輯于2023年,星期五2.虛擬變量在模型結(jié)構(gòu)穩(wěn)定性檢驗(yàn)中的應(yīng)用利用不同的樣本數(shù)據(jù)估計(jì)同一形式的計(jì)量經(jīng)濟(jì)模型,可能會(huì)得到不同的估計(jì)結(jié)果。如果估計(jì)的參數(shù)之間存在著顯著差異,則稱模型結(jié)構(gòu)是不穩(wěn)定的,反之則認(rèn)為是穩(wěn)定的。模型結(jié)構(gòu)的穩(wěn)定性檢驗(yàn)主要有兩個(gè)用途:一是分析模型結(jié)構(gòu)對(duì)樣本變化的敏感性,如多重共線性檢驗(yàn);二是比較兩個(gè)(或多個(gè))回歸模型之間的差異情況,即分析模型結(jié)構(gòu)是否發(fā)生了顯著變化。利用一些特定的統(tǒng)計(jì)檢驗(yàn)(如鄒氏檢驗(yàn)法,是美國(guó)計(jì)量經(jīng)濟(jì)學(xué)家鄒至莊教授于1960年提出的一種檢驗(yàn)兩個(gè)或兩個(gè)以上計(jì)量經(jīng)濟(jì)模型間是否存在差異的統(tǒng)計(jì)方法),可以檢驗(yàn)?zāi)P徒Y(jié)構(gòu)的穩(wěn)定性問題,使用虛擬變量也可以得到相同的檢驗(yàn)結(jié)果。設(shè)根據(jù)同一總體兩個(gè)樣本估計(jì)的回歸模型分別為第四十五頁,共一百二十五頁,編輯于2023年,星期五第四十六頁,共一百二十五頁,編輯于2023年,星期五為“相異回歸”(Dissimilarregressions)。上述情況中,只有第(1)種情況模型結(jié)構(gòu)是穩(wěn)定的,其余情況都表明模型結(jié)構(gòu)不穩(wěn)定。
3.虛擬變量在分段回歸中的應(yīng)用第四十七頁,共一百二十五頁,編輯于2023年,星期五第四十八頁,共一百二十五頁,編輯于2023年,星期五
回歸系數(shù)反映了獎(jiǎng)金的提高程度。使用虛擬變量既能如實(shí)描述不同階段的經(jīng)濟(jì)關(guān)系,又未減少估計(jì)模型時(shí)的樣本容量,保證了模型的估計(jì)精度。
4.虛擬變量在混合回歸中的應(yīng)用建估計(jì)模型時(shí),樣本容量越大則估計(jì)誤差越小。如果能同時(shí)獲得變量的時(shí)序數(shù)據(jù)和橫截面數(shù)據(jù)(簡(jiǎn)稱為TS—CS數(shù)據(jù)),是否可以將它們“混合”成一個(gè)樣本來估計(jì)模型?只要模型參數(shù)不隨時(shí)間而改變,并且在各個(gè)橫截面之間沒有差異,就可以使用混合樣本估計(jì)模型。
例7.1.11
表7.1.8為我國(guó)城鎮(zhèn)居民1998年、1999年全年人均消費(fèi)支出和可支配收入的統(tǒng)計(jì)資料(單位:元/年)。試使用混合樣本數(shù)據(jù)估計(jì)我國(guó)城鎮(zhèn)居民消費(fèi)函數(shù)。第四十九頁,共一百二十五頁,編輯于2023年,星期五表7.1.8我國(guó)城鎮(zhèn)居民人均消費(fèi)支出和可支配收入統(tǒng)計(jì)資料收入等級(jí)1998年1999年消費(fèi)支出Y收入XD消費(fèi)支出Y收入XD困難戶2214.472198.8802327.542325.701最低收入戶2397.602476.75O2523.102617.801低收入戶2979.273303.17O3137.343492.271中等偏下戶3503.244107.2603694.464363.781中等收入戶4179.645118.9904432.485512.121中等偏上戶4980.886370.5905347.096904.961高收入戶6003.217877.6906443.338631.941最高收入戶7593.9510962.108262.4212083.791第五十頁,共一百二十五頁,編輯于2023年,星期五第五十一頁,共一百二十五頁,編輯于2023年,星期五表7.1.9回歸結(jié)果
第五十二頁,共一百二十五頁,編輯于2023年,星期五
這表明1998年、1999年我國(guó)城鎮(zhèn)居民消費(fèi)函數(shù)并沒有顯著差異。因此,可以將兩年的樣本數(shù)據(jù)合并成一個(gè)樣本,估計(jì)城鎮(zhèn)居民的消費(fèi)函數(shù),結(jié)果如下(見表7.1.10)。第五十三頁,共一百二十五頁,編輯于2023年,星期五表7.1.10
回歸結(jié)果第五十四頁,共一百二十五頁,編輯于2023年,星期五
利用1998年、1999年數(shù)據(jù)分別估計(jì)我國(guó)城鎮(zhèn)居民消費(fèi)函數(shù)與合并1998年、1999年兩年的數(shù)據(jù)估計(jì)我國(guó)城鎮(zhèn)居民消費(fèi)函數(shù)表明,使用混合回歸明顯地降低了系數(shù)的估計(jì)誤差,t統(tǒng)計(jì)量值增大,顯著性增強(qiáng)(見表7.1.11)。表7.1.11利用不同樣本估計(jì)的消費(fèi)函數(shù)第五十五頁,共一百二十五頁,編輯于2023年,星期五
5.虛擬變量在異常值問題中的應(yīng)用
現(xiàn)實(shí)經(jīng)濟(jì)中常常存在這樣的情況,一些突發(fā)事件對(duì)經(jīng)濟(jì)活動(dòng)、經(jīng)濟(jì)關(guān)系造成短暫的,但卻是很顯著的沖擊影響。這種情況在經(jīng)濟(jì)數(shù)據(jù)上反映出來,就會(huì)表現(xiàn)為一個(gè)脫離基本趨勢(shì)的異常值。例如,變量y和x在長(zhǎng)期中的關(guān)系基本滿足線性回歸模型的各個(gè)假設(shè),但在時(shí)刻有一個(gè)突發(fā)情況,使得y出現(xiàn)一個(gè)C單位的暫時(shí)性波動(dòng)。那么如果用線性回歸模型第五十六頁,共一百二十五頁,編輯于2023年,星期五
(1)異常值的發(fā)現(xiàn)判斷用回歸殘差序列分析發(fā)現(xiàn)和判斷異常值問題的方法是:在模型假設(shè)成立的前提下,回歸殘差是服從正態(tài)分布的隨機(jī)變量,因此根據(jù)正態(tài)分布的性質(zhì),其取值95%左右的概率應(yīng)分布在均值加減2倍標(biāo)準(zhǔn)差的范圍內(nèi)。如果發(fā)現(xiàn)某個(gè)殘差出現(xiàn)第五十七頁,共一百二十五頁,編輯于2023年,星期五圖7.1.10異常值的殘差序列圖檢驗(yàn)可以直接根據(jù)EViews輸出的殘差序列圖判斷是否有異常值的可能性。
(2)異常值問題的處理
如果判斷模型存在異常值問題,必須作針對(duì)性的處理。例如,一個(gè)兩變量線性回歸模型
第五十八頁,共一百二十五頁,編輯于2023年,星期五第五十九頁,共一百二十五頁,編輯于2023年,星期五
下面舉例說明異常值的判斷和利用虛擬變量的處理方法。
例7.1.12
上海市1981-2002年城市居民人均可支配收入(x)和人均消費(fèi)性支出(y)數(shù)據(jù)見表7.1.12所示,建立如下消費(fèi)函數(shù)模型是否有異常值問題,如何處理?
第六十頁,共一百二十五頁,編輯于2023年,星期五年份可支配收入x消費(fèi)性支出y年份可支配收入x消費(fèi)性支出y19816375851992300925091982659576199342773530198368661519945868466919848347261995717258681985107599219968159676319861293117019978439682019871437128219988773686619881723164819991093282481989197618122000117188868199021821936200112883933619912485216720021325010464表7.1.12人均可支配收入(x)和消費(fèi)(y)第六十一頁,共一百二十五頁,編輯于2023年,星期五
利用EViews軟件,可以得到消費(fèi)函數(shù)模型的回歸結(jié)果(表7.1.13)和殘差序列圖(圖7.1.11)。表7.1.13消費(fèi)函數(shù)模型的回歸結(jié)果第六十二頁,共一百二十五頁,編輯于2023年,星期五圖7.1.11消費(fèi)函數(shù)殘差序列圖根據(jù)圖7.1.13中的殘差分布可以看出,1996、2001和2002年的回歸殘差絕對(duì)值,都大于2倍的殘差標(biāo)準(zhǔn)差,因此可能屬于異常值。第六十三頁,共一百二十五頁,編輯于2023年,星期五第六十四頁,共一百二十五頁,編輯于2023年,星期五第六十五頁,共一百二十五頁,編輯于2023年,星期五第六十六頁,共一百二十五頁,編輯于2023年,星期五第六十七頁,共一百二十五頁,編輯于2023年,星期五第六十八頁,共一百二十五頁,編輯于2023年,星期五
很顯然,根據(jù)回歸系數(shù)的標(biāo)準(zhǔn)差、t統(tǒng)計(jì)量值、決定系數(shù)、F統(tǒng)計(jì)量值等指標(biāo)看(見表7.1.17),回歸模型的效果有很大改進(jìn),而且虛擬變量的系數(shù)也都有顯著性。因此,引進(jìn)虛擬變量對(duì)原模型確實(shí)是一個(gè)改進(jìn)。表7.1.17引進(jìn)虛擬變量前后估計(jì)的消費(fèi)函數(shù)
再看引進(jìn)虛擬變量后回歸的殘差序列圖(見圖7.1.14),則現(xiàn)在是有多點(diǎn)而不是個(gè)別點(diǎn)在2倍標(biāo)準(zhǔn)差臨界值之外,而且都離臨界值不遠(yuǎn),并且2倍標(biāo)準(zhǔn)差的臨界值范圍也比未引進(jìn)虛擬變量時(shí)小了許多,因此可不再認(rèn)為存在異常值。第六十九頁,共一百二十五頁,編輯于2023年,星期五第七十頁,共一百二十五頁,編輯于2023年,星期五7.2模型的設(shè)定誤差7.2.1判斷計(jì)量經(jīng)濟(jì)模型優(yōu)劣的基本準(zhǔn)則
1.傳統(tǒng)建模方法的過程
2.傳統(tǒng)建模方法的思路
3.判斷計(jì)量經(jīng)濟(jì)模型優(yōu)劣的基本準(zhǔn)則
(1)模型應(yīng)力求簡(jiǎn)單。
(2)模型具有可識(shí)別性。
(3)模型具有較高的擬合優(yōu)度。
(4)模型應(yīng)與理論相一致。
(5)模型具有較好的超樣本功能。第七十一頁,共一百二十五頁,編輯于2023年,星期五7.2.2模型設(shè)定誤差的類型1.模型遺漏了重要的解釋變量第七十二頁,共一百二十五頁,編輯于2023年,星期五2.模型包含無關(guān)的解釋變量第七十三頁,共一百二十五頁,編輯于2023年,星期五
3.模型采用了不正確的函數(shù)形式
在某些情況下,研究者對(duì)模型變量的選擇正確,但因?yàn)槎喾N原因?qū)@些變量之間內(nèi)在關(guān)聯(lián)關(guān)系的判斷發(fā)生失誤,就可能對(duì)模型采用錯(cuò)誤的函數(shù)形式。對(duì)于上例,如果研究者誤認(rèn)為第七十四頁,共一百二十五頁,編輯于2023年,星期五7.2.3模型存在設(shè)定誤差的后果
1.模型遺漏重要變量的后果對(duì)于模型遺漏重要變量的后果,可以用一個(gè)二元線性模型遺漏一個(gè)重要變量的情況加以說明,至于多元模型中遺漏一個(gè)以上重要變量的后果,可以類推,只不過計(jì)算過程要復(fù)雜得多。假設(shè)正確的回歸模型為第七十五頁,共一百二十五頁,編輯于2023年,星期五第七十六頁,共一百二十五頁,編輯于2023年,星期五檢驗(yàn)的結(jié)果不可靠,也不可信。第七十七頁,共一百二十五頁,編輯于2023年,星期五2.模型包含無關(guān)變量的后果假設(shè)正確的模型是:第七十八頁,共一百二十五頁,編輯于2023年,星期五上述分析表明,相關(guān)變量的遺漏,損失的是無偏性和一致性;無關(guān)變量的誤選,其損失是失去有效性。第七十九頁,共一百二十五頁,編輯于2023年,星期五
3.模型遺漏重要解釋變量和引進(jìn)無關(guān)解釋變量的后果比較第一,模型中遺漏重要解釋變量的不良后果比模型中引入無關(guān)解釋變量的后果要嚴(yán)重得多。遺漏了重要解釋變量的模型是一個(gè)錯(cuò)誤的不可用的模型,而引進(jìn)了無關(guān)解釋變量的模型是一個(gè)精度不高、但仍具一定利用價(jià)值的模型。第二,雖然在模型引進(jìn)無關(guān)解釋變量的不良后果相對(duì)較小,但不能認(rèn)為在模型中包含無關(guān)解釋變量是可以容忍的。一般說來,模型設(shè)定是對(duì)偏誤與有效進(jìn)行權(quán)衡,偏愛哪一方取決于模型研究的目的。若建模目的是為了進(jìn)行準(zhǔn)確預(yù)測(cè),最小均方誤差(均方誤差=方差+偏誤的平方)則是兼顧有效性和無偏性的良好準(zhǔn)則。第八十頁,共一百二十五頁,編輯于2023年,星期五4.模型函數(shù)形式設(shè)定錯(cuò)誤的后果假設(shè)真實(shí)回歸模型為可見,真實(shí)的回歸模型實(shí)質(zhì)上是一個(gè)關(guān)于x的高次方程,誤將它設(shè)定為線性函數(shù),實(shí)質(zhì)上就是遺漏了真實(shí)方程中應(yīng)該包含的二次項(xiàng)和其余高次項(xiàng)。由此所產(chǎn)生的影響與遺漏相關(guān)解釋變量相類似。第八十一頁,共一百二十五頁,編輯于2023年,星期五
7.2.4模型設(shè)定誤差的檢驗(yàn)
1.模型是否包含無關(guān)解釋變量的檢驗(yàn)對(duì)模型中是否包含無關(guān)解釋變量的檢驗(yàn),就是對(duì)模型解釋變量的參數(shù)是否為零的檢驗(yàn)。如果發(fā)現(xiàn)模型中某個(gè)解釋變量的參數(shù)為零的可能性很大,這一解釋變量就是一個(gè)無關(guān)的變量,不應(yīng)當(dāng)包含在模型中。如果模型中每一個(gè)解釋變量的參數(shù)都不為零,則模型中就不包含無關(guān)解釋變量。第八十二頁,共一百二十五頁,編輯于2023年,星期五第八十三頁,共一百二十五頁,編輯于2023年,星期五
2.模型遺漏重要解釋變量和采用錯(cuò)誤函數(shù)形式的檢驗(yàn)
(1)殘差圖示法檢驗(yàn)這種檢驗(yàn)方法分三步進(jìn)行:第一步,對(duì)所構(gòu)建的模型應(yīng)用相宜的計(jì)量經(jīng)濟(jì)學(xué)方法進(jìn)行估計(jì),求出樣本估計(jì)式。第八十四頁,共一百二十五頁,編輯于2023年,星期五
圖7.2.1給出了殘差序列隨時(shí)間持續(xù)上升與呈現(xiàn)循環(huán)變化的兩類圖形。前者預(yù)示著模型設(shè)定時(shí)可能遺漏了一隨著時(shí)間的推移而持續(xù)上升的變量;后者則表明模型設(shè)定時(shí)可能遺漏了一隨著時(shí)間的推移而呈現(xiàn)循環(huán)變化的變量。(a)趨勢(shì)變化(b)循環(huán)變化圖7.2.1殘差序列變化圖第八十五頁,共一百二十五頁,編輯于2023年,星期五圖7.2.2模型函數(shù)形式設(shè)定偏誤時(shí)殘差序列呈現(xiàn)正負(fù)交替變化圖7.2.2給出了一元回歸模型中,真實(shí)模型呈冪函數(shù)形式,但卻選取了線性函數(shù)進(jìn)行回歸的情形。在這種情形下,容易知道殘差序列呈現(xiàn)先正、后負(fù)、再正的變化特征。第八十六頁,共一百二十五頁,編輯于2023年,星期五
(2)一般性設(shè)定偏誤檢驗(yàn):拉姆齊(Ramsey)的RESET檢驗(yàn)常用的判定方法是拉姆齊(Ramsey)于1969年提出RESET檢驗(yàn)(gressionerrorspecificationtest)。第八十七頁,共一百二十五頁,編輯于2023年,星期五第八十八頁,共一百二十五頁,編輯于2023年,星期五第八十九頁,共一百二十五頁,編輯于2023年,星期五第九十頁,共一百二十五頁,編輯于2023年,星期五表7.2.1某公司單位成本、產(chǎn)量指數(shù)和產(chǎn)量投入相關(guān)數(shù)據(jù)
年份單位成本產(chǎn)量指數(shù)要素投入成本年份單位成本產(chǎn)量指數(shù)要素投入成本1980365858019904281041151981422789319914428211719824298210719925117512819835436411519934888413419846625013019944998613519855716212819954579013519865097011619964849413919873999092199751680142198840894941998567721471989438100110199962660150第九十一頁,共一百二十五頁,編輯于2023年,星期五利用EViews軟件容易得到表7.2.2回歸結(jié)果。表7.2.2回歸結(jié)果第九十二頁,共一百二十五頁,編輯于2023年,星期五第九十三頁,共一百二十五頁,編輯于2023年,星期五表7.2.3檢驗(yàn)結(jié)果
第九十四頁,共一百二十五頁,編輯于2023年,星期五表7.2.4加入產(chǎn)量二次項(xiàng)后的回歸結(jié)果
第九十五頁,共一百二十五頁,編輯于2023年,星期五
可以看出,各項(xiàng)檢驗(yàn)指標(biāo)都進(jìn)一步趨好,而且也符合經(jīng)濟(jì)學(xué)意義。對(duì)該模型進(jìn)一步實(shí)施RESET檢驗(yàn),得如表7.2.5所示的檢驗(yàn)結(jié)果。
表7.2.5檢驗(yàn)結(jié)果第九十六頁,共一百二十五頁,編輯于2023年,星期五表7.2.6回歸結(jié)果
第九十七頁,共一百二十五頁,編輯于2023年,星期五第九十八頁,共一百二十五頁,編輯于2023年,星期五
7.3模型變量的觀測(cè)誤差在搜集與處理過程中由于受到各種因素的影響,使樣本數(shù)據(jù)存在著一定的誤差。例如,由于虛報(bào)和誤報(bào)數(shù)據(jù)、重復(fù)或遺漏數(shù)據(jù)、錯(cuò)誤抄錄數(shù)據(jù)而產(chǎn)生的登記性誤差;由于統(tǒng)計(jì)指標(biāo)口徑的不一致性或誤解指標(biāo)含義而產(chǎn)生的統(tǒng)計(jì)誤差;由于匯總計(jì)算而產(chǎn)生的數(shù)據(jù)整理誤差,等等。我們把這些誤差統(tǒng)稱為“觀測(cè)誤差”或“測(cè)量誤差”。
7.3.1模型變量存在觀測(cè)誤差的后果模型變量存在觀測(cè)誤差的后果,可以用一個(gè)簡(jiǎn)單的線性回歸模型為例加以說明。設(shè)真正的回歸模型為第九十九頁,共一百二十五頁,編輯于2023年,星期五第一百頁,共一百二十五頁,編輯于2023年,星期五這表明當(dāng)觀測(cè)誤差存在時(shí),OLS法常常低估真正的回歸參數(shù)。回歸變量中的觀測(cè)誤差問題是數(shù)據(jù)問題,目前計(jì)量經(jīng)濟(jì)學(xué)家們還提不出有效的解決方法。第一百零一頁,共一百二十五頁,編輯于2023年,星期五7.3.2觀測(cè)誤差的檢驗(yàn)關(guān)于觀測(cè)誤差存在與否的檢驗(yàn)是豪斯曼(Hausman)1978年提出的,豪斯曼檢驗(yàn)的具體步驟為
(1)對(duì)所研究的回歸模型,無論是否存在觀測(cè)誤差,先采用OLS法得到參數(shù)估計(jì)量;
(2)對(duì)可能存在觀測(cè)誤差的解釋變量,選擇與其相關(guān)的工具變量,將可能存在觀測(cè)誤差的解釋變量對(duì)選擇的工具變量進(jìn)行回歸,并獲得回歸殘差。第一百零二頁,共一百二十五頁,編輯于2023年,星期五
例7.3.1
我們研究某地區(qū)出口額與國(guó)內(nèi)生產(chǎn)總值的關(guān)系,擬建立回歸模型其觀測(cè)值數(shù)據(jù)如表7.3.1所示。表7.3.1某地區(qū)出口額與國(guó)內(nèi)生產(chǎn)總值統(tǒng)計(jì)數(shù)據(jù)年份出口額(y)國(guó)內(nèi)生產(chǎn)總值(x)儲(chǔ)蓄(z)1986580.57171.01214.71987808.98964.41622.619881082.110202.22237.619891470.011962.53073.319901766.714928.33801.519911956.016909.25146.9第一百零三頁,共一百二十五頁,編輯于2023年,星期五年份出口額(y)國(guó)內(nèi)生產(chǎn)總值(x)儲(chǔ)蓄(z)19911956.016909.25146.919922985.818547.97119.819933827.121617.89241.619944676.326638.111759.419955284.834634.415023.5199610421.846759.421518.8199712451.858478.129662.3199812576.467884.638520.8199915160.774462.646279.8200015223.678345.253407.5200116159.882067.559621.8200220634.489468.164332.4200322024.497314.873762.4200426947.9105172.386910.6200536287.9117251.9103617.7第一百零四頁,共一百二十五頁,編輯于2023年,星期五
但我們懷疑x可能有觀測(cè)誤差,會(huì)影響分析結(jié)果,于是我們采用豪斯曼(Hausman)檢驗(yàn)。
(1)我們用居民儲(chǔ)蓄z作為國(guó)內(nèi)生產(chǎn)總值x的工具變量。
(2)x對(duì)z作回歸得方程第一百零五頁,共一百二十五頁,編輯于2023年,星期五
7.4隨機(jī)解釋變量
7.4.1估計(jì)量的漸近統(tǒng)計(jì)性質(zhì)線性、無偏性和有效性是評(píng)價(jià)一個(gè)估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn)。在有些情況下,小樣本時(shí)的估計(jì)量不具有某種統(tǒng)計(jì)性質(zhì),但隨著樣本容量的增大,估計(jì)量逐漸具有了這種統(tǒng)計(jì)性質(zhì),此時(shí)稱之為估計(jì)量的漸近統(tǒng)計(jì)性質(zhì)。
1.漸近無偏性第一百零六頁,共一百二十五頁,編輯于2023年,星期五2.一致性
第一百零七頁,共一百二十五頁,編輯于2023年,星期五
因此,一致估計(jì)量一定是漸近無偏的,并且在真實(shí)值附近離散的程度隨樣本容量的增大逐漸趨于0。
7.4.2隨機(jī)解釋變量的概念與來源
1.隨機(jī)解釋變量的概念
如果解釋變量中某些為隨機(jī)變量,不為確定性變量,則稱模型存在隨機(jī)解釋變量問題。
2.隨機(jī)解釋變量的來源
模型中隨機(jī)解釋變量問題首先來源于省略解釋變量。被省略的解釋變量一般與模型中保留的解釋變量相關(guān),導(dǎo)致模型中的隨機(jī)誤差項(xiàng)與解釋變量相關(guān)。被解釋變量往往受到前若干期值的影響。當(dāng)模型中含有被解釋變量的滯后期變量時(shí),模型就存在隨機(jī)解釋變量問題。第一百零八頁,共一百二十五頁,編輯于2023年,星期五第一百零九頁,共一百二十五頁,編輯于2023年,星期五7.4.3隨機(jī)解釋變量的后果當(dāng)模型中存在隨機(jī)解釋變量時(shí),采用最小二乘法估計(jì)參數(shù)可能會(huì)帶來一些不良的結(jié)果。假定模型滿足除解釋變量非隨機(jī)的所有其他古典假設(shè),考慮利用一元線性回歸模型:第一百一十頁,共一百二十五頁,編輯于2023年,星期五第一百一十一頁,共一百二十五頁,編輯于2023年,星期五第一百一十二頁,共一百二十五頁,編輯于2023年,星期五第一百一十三頁,共一百二十五頁,編輯于2023年,星期五
7.4.4隨機(jī)解釋變量的修正方法:工具變量法
工具變量(InstrumentVariable—IV)法的基本思路是:當(dāng)隨機(jī)解釋變量與隨機(jī)誤差項(xiàng)相關(guān)時(shí),則尋找另一個(gè)變量,該變量與隨機(jī)解釋變量高度相關(guān),但與隨機(jī)誤差項(xiàng)不相關(guān),稱其為工具變量,用其替代隨機(jī)解釋變量。
1.選擇工具
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中山b2貨運(yùn)上崗證模擬考試
- 2024-2025學(xué)年高中化學(xué)專題3從礦物到基礎(chǔ)材料第1單元第1課時(shí)鋁及鋁合金練習(xí)含解析蘇教版必修1
- 人教版八年級(jí)地理上冊(cè)2.1《地形和地勢(shì)》聽課評(píng)課記錄1
- 蘇州蘇教版六年級(jí)上冊(cè)數(shù)學(xué)第2單元《2-4分?jǐn)?shù)乘分?jǐn)?shù)》聽評(píng)課記錄
- 師范生教育實(shí)習(xí)心得總結(jié)
- 教師學(xué)期工作總結(jié)
- 實(shí)驗(yàn)室培訓(xùn)計(jì)劃
- 人教部編版九年級(jí)歷史下冊(cè)聽課評(píng)課記錄:第6課《工業(yè)化國(guó)家的社會(huì)變化》
- 挖機(jī)抵押貸款合同范本
- 供應(yīng)商一件代發(fā)協(xié)議書范本
- 2025年江蘇南京水務(wù)集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 護(hù)理人文知識(shí)培訓(xùn)課件
- 建筑工程施工安全管理課件
- 2023年全國(guó)各地高考英語試卷:完形填空匯編(9篇-含解析)
- 五年級(jí)上冊(cè)數(shù)學(xué)習(xí)題課件 簡(jiǎn)便計(jì)算專項(xiàng)整理 蘇教版 共21張
- 疼痛科的建立和建設(shè)
- 運(yùn)動(dòng)技能學(xué)習(xí)PPT課件
- 第六編元代文學(xué)
- 高考語文古詩詞必背重點(diǎn)提綱
- 超星爾雅學(xué)習(xí)通《大學(xué)生心理健康教育(蘭州大學(xué)版)》章節(jié)測(cè)試含答案
- 2020譯林版高中英語選擇性必修二單詞默寫表
評(píng)論
0/150
提交評(píng)論