第七章線性回歸模型的擴展_第1頁
第七章線性回歸模型的擴展_第2頁
第七章線性回歸模型的擴展_第3頁
第七章線性回歸模型的擴展_第4頁
第七章線性回歸模型的擴展_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第七章線性回歸模型的擴展第一節(jié)

變量非線性回歸模型第二節(jié)

參數(shù)非線性回歸模型*第三節(jié)

虛擬解釋變量回歸模型第四節(jié)

虛擬被解釋變量回歸模型*2/3/20231山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室前幾章所討論的,都是基于橫截面數(shù)據(jù)的線性回歸模型,涉及的變量均是數(shù)值變量。實際上,許多經(jīng)濟變量之間并不存在線性關(guān)系,建模中涉及的許多變量也不直接表現(xiàn)為數(shù)值,而是屬于分類變量的范疇。為了擴大計量經(jīng)濟建模方法的適用范圍,本章擬將橫截面數(shù)據(jù)的線性回歸建模方法擴展到對非線性關(guān)系的分析,并將計量經(jīng)濟模型的變量類型從數(shù)值變量擴展到分類變量。2/3/20232山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室

線性回歸分析的前提是作為被解釋變量的經(jīng)濟變量與作為解釋變量的經(jīng)濟變量之間存在著線性關(guān)系。這里所說的線性是指解釋變量線性并且參數(shù)線性。但是,在眾多的經(jīng)濟現(xiàn)象中,分析經(jīng)濟變量之間的關(guān)系,根據(jù)某種經(jīng)濟理論和對實際經(jīng)濟問題的分析,所建立的經(jīng)濟模型往往不符合上面的線性要求,即模型是非線性的,稱為非線性模型(Non-linearModel)。非線性模型包括兩種情況:(1)解釋變量非線性,但是參數(shù)線性。(2)參數(shù)非線性。尤其參數(shù)非線性是對古典假定SLR.1和MLR.1的違背,對回歸分析影響很大。本節(jié)針對第一種情況進行討論,常用的變量非線性回歸模型包括對數(shù)函數(shù)模型、雙曲線模型和多項式模型。這類模型有一個共同特點,可以利用變量轉(zhuǎn)換等處理方法將模型線性化,線性化后的模型即可采用OLS方法進行參數(shù)估計。這類非線性模型被稱為內(nèi)蘊線性模型,或廣義線性模型。第一節(jié)變量非線性回歸模型2/3/20233山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室一、對數(shù)函數(shù)模型(一)雙對數(shù)函數(shù)模型回歸分析經(jīng)常使用的對數(shù)模型是雙對數(shù)函數(shù)模型(Double-logModel),考慮如下形式的需求-收入模型

(7.2)

(7.2)中的參數(shù)是以線性形式出現(xiàn)在模型中的,雖然(7.1)中原變量x和y之間是非線性的,但因變量與自變量的對數(shù)形式是線性的,因而稱雙對數(shù)函數(shù)模型。

對數(shù)函數(shù)模型的自變量和因變量中,至少有一種是原始變量的對數(shù)形式。具體分為以下兩種類型:兩邊取對數(shù),模型可變換為:

(7.1)2/3/20234山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室實際工作中,雙對數(shù)模型應(yīng)用非常廣泛,其原因在于,如果忽略誤差項,(7.2)是一條直線(y和x都是對數(shù)形式),所以它的斜率(β1)為一常數(shù),是y相對于x的彈性系數(shù):所以彈性為一常數(shù)。由于這個特殊的性質(zhì),雙對數(shù)模型又稱為不變(固定)彈性模型。

對這類模型可作如下代換,令雙對數(shù)模型可化為標準線性模型在古典假定滿足的情況下,可以使用OLS對模型進行估計。2/3/20235山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室對于多個解釋變量的情形,(7.2)式可以擴展為(7.3)稱為偏彈性系數(shù)。它度量了在其他變量不變的條件下,被解釋變量y對于解釋變量的彈性系數(shù)。如著名的柯布—道格拉斯(Cobb—Douglas)生產(chǎn)函數(shù)模型,就是這類模型的一個典型,我們下面舉例說明。例7-1表7-1列出了抽樣調(diào)查得到的某市19個規(guī)模以上制造業(yè)企業(yè)的投入產(chǎn)出數(shù)據(jù)。試用回歸分析法分析企業(yè)產(chǎn)出中各要素的貢獻及其特點。2/3/20236山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室企業(yè)產(chǎn)值Q(萬元)職工數(shù)L(人)固定資產(chǎn)K(萬元)大華1291.878742051.92麒麟1347.058952151.3雙劍1399.69172250.21衡麓1505.119572370.26六合1578.979532488.97春風(fēng)1652.869662606.61聯(lián)華1784.9110332754.66太岳1994.5710982953.78東海2123.2311753157.15荷佳2269.7711523376.42博世2411.9411543635.99科維2608.8112073918.47梅花2774.9812304223.82綠源2965.312964550.49人和3067.1213344846.77花都3290.313745205.33金鼎3540.5715925615.31謙祥3749.7714156098.25表7-1某市19個規(guī)模以上制造業(yè)企業(yè)的投入產(chǎn)出數(shù)據(jù)2/3/20237山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室用EViews建立雙對數(shù)模型,回歸結(jié)果如下:樣本回歸方程為:DependentVariable:LOG(Q)Method:LeastSquaresIncludedobservations:19afteradjustmentsVariableCoefficientStd.Errort-StatisticProb.

C-1.5452110.590710-2.6158550.0187LOG(L)0.3397010.1889871.7974790.0912LOG(K)0.8419100.0951418.8491220.0000

R-squared0.994499

Meandependentvar7.651499

AdjustedR-squared0.993811

S.D.dependentvar0.365836

S.E.ofregression0.028780

Akaikeinfocriterion-4.114328

Sumsquaredresid0.013253

Schwarzcriterion-3.965206

Loglikelihood42.08611

F-statistic1446.223

Durbin-Watsonstat0.432115Prob(F-statistic)0.0000002/3/20238山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室對樣本回歸方程解釋如下:斜率系數(shù)0.3397表示產(chǎn)出對勞動投入的彈性,即表明在資本投入保持不變的條件下,勞動投入每增加一個百分點,平均產(chǎn)出將增加0.3397個百分點。同樣地,在勞動投入保持不變的條件下,資本投入每增加一個百分點,產(chǎn)出將平均增加0.8419個百分點。兩個彈性系數(shù)相加為規(guī)模報酬系數(shù),其數(shù)值大于1,表明該市經(jīng)濟的特征很可能是規(guī)模報酬遞增的(如果數(shù)值等于1,屬于規(guī)模報酬不變;小于1,則屬于規(guī)模報酬遞減)。2/3/20239山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室根據(jù)單邊檢驗的結(jié)果,這兩個系數(shù)各自均是統(tǒng)計顯著的(這是用單邊檢驗,即,因為我們預(yù)期勞動力和資本對產(chǎn)出影響都是正向的),模型的F值也是高度顯著的(因為prob=0.0000),因此能夠拒絕零假設(shè):勞動力與資本對產(chǎn)出無影響。R2值為0.995,表明勞動力和資本(對數(shù))的變動解釋了大約99.5%的產(chǎn)出(對數(shù))的變動,說明了模型很好地擬合了樣本數(shù)據(jù)。

2/3/202310山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室(二)半對數(shù)函數(shù)模型線性模型與對數(shù)函數(shù)模型的混合就是半對數(shù)模型(Semi-logModels)。因變量是對數(shù)形式(對數(shù)-線性模型):

(7.4)

解釋變量是對數(shù)形式(線性-對數(shù)模型):

(7.5)

這兩個模型的參數(shù)是以線性形式出現(xiàn)的,雖然原變量之間是非線性的,但被解釋(解釋)變量的對數(shù)與解釋(被解釋)變量之間是線性關(guān)系,因此,半對數(shù)函數(shù)模型可以很容易地轉(zhuǎn)換成線性模型,并使用OLS估計參數(shù)。2/3/202311山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室對于半對數(shù)模型(7.4),顯然有可見,表示x每變化一個相對單位(變動率)對應(yīng)的y的平均絕對變動量,所以,半對數(shù)函數(shù)模型又稱增長率模型。(7.4)常用于度量由解釋變量相對變動率導(dǎo)致的被解釋變量平均變動的絕對數(shù)量;(7.5)常用于度量由解釋變量絕對量變化導(dǎo)致的被解釋變量的平均相對變動率。兩個模型中的斜率系數(shù)又被稱為半彈性(Semi-elasticity)系數(shù)。2/3/202312山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室二、雙曲線模型形如的模型,稱為雙曲線模型(Double-curveModel)。該模型刻畫了

y與x的反向變動關(guān)系,其顯著特點是隨著x的無限增大(即1/x接近于零),

y趨近于。令,原模型可化為線性形式即可用OLS的方法進行估計。菲利普斯曲線(PhillipsCurve)就是這個模型在經(jīng)濟分析中應(yīng)用的典型體現(xiàn)。菲利普斯曲線刻畫了通貨膨脹率與失業(yè)率的反向變動關(guān)系,如圖7-1。2/3/202313山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室失業(yè)率與通貨膨脹率負向相關(guān),同時通貨膨脹率變化有一個漸近底限。當(dāng)失業(yè)率x趨于無窮大時,通貨膨脹率y將取漸近值。0失業(yè)率菲利普斯曲線2/3/202314山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室三、多項式函數(shù)模型

多項式回歸模型(PolynomialRegressionModel)在生產(chǎn)與成本函數(shù)分析中被廣泛地使用。如果用y表示成本,x表示產(chǎn)出,則可以建立以下多項式模型,體現(xiàn)微觀經(jīng)濟分析中的二者關(guān)系:總成本(TC):邊際成本(MC)和平均成本(AC)的PRF為:(7.8)即總體回歸函數(shù)(PRF)為:2/3/202315山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室產(chǎn)出x成本y產(chǎn)出x成本yMCTCAC成本曲線如果模型的解釋變量為時間變量t,多項式函數(shù)模型又稱為曲線回歸模型,常常用于對非線性長期趨勢的擬合。有時為了反映自變量之間的交互影響,也需要用到多項式回歸模型。2/3/202316山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室如以y、x、z分別表示單位面積上的糧食產(chǎn)量、施肥量和灌溉用水量。由于施肥量和灌溉用水量對糧食產(chǎn)量的效應(yīng)之間存在交互影響,所以,可以建立以下模型:施肥量x對糧食產(chǎn)量y的總邊際影響是:是施肥量對糧食產(chǎn)量的直接效應(yīng)(假定灌溉用水量不變),是施肥量對糧食產(chǎn)量的間接效應(yīng),隨灌溉用水量的不同而變化,說明肥效的發(fā)揮取決于灌溉用水的多少。同樣,灌溉用水z對糧食產(chǎn)量y的總邊際影響也可以這樣分解。顯然,該模型比單純的二元回歸模型更符合實際情況。2/3/202317山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室例7-2表7-3給出了某市16個企業(yè)的產(chǎn)品產(chǎn)量(x)與單位產(chǎn)品成本(y)的抽樣調(diào)查數(shù)據(jù)。試研究二者的依存關(guān)系。企業(yè)序號產(chǎn)品產(chǎn)量(噸)x單位產(chǎn)品成本(元/噸)y企業(yè)序號產(chǎn)品產(chǎn)量(噸)x單位產(chǎn)品成本(元/噸)y143034629602310824103433106193068343232751175630514501315112738300755523108136953068656530761464730347588314615635298186653057167882962企業(yè)產(chǎn)品產(chǎn)量與單位產(chǎn)品成本數(shù)據(jù)2/3/202318山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室根據(jù)規(guī)模經(jīng)濟的原理,產(chǎn)品產(chǎn)量是單位產(chǎn)品成本變化的原因。為了明確二者的具體關(guān)系類型,使用EViews的Graph功能,繪制散點圖如下:2/3/202319山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室顯然,二者的關(guān)系不是線性關(guān)系??晒┻x擇的模型有以下兩種:雙曲線模型:半對數(shù)模型:分別擬合兩種模型,回歸結(jié)果整理如下:模型的估計值與t檢驗值的估計值與t檢驗值R2AICSCt檢驗值t檢驗值雙曲線半對數(shù)2489.77247.833.4413.18367183.6-646.28.70-7.510.840.8011.1411.3811.2311.48雙曲線模型和冪函數(shù)模型的系數(shù)均通過了顯著性檢驗,但前者無論是R2還是AIC、SC均好于后者,所以,最終的模型應(yīng)為雙曲線模型:2/3/202320山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室該回歸結(jié)果說明,單位產(chǎn)品成本隨產(chǎn)量的上升而下降,當(dāng)產(chǎn)品產(chǎn)量趨近于無窮大時,單位產(chǎn)品成本趨近于2489.7元/噸,這就是單位產(chǎn)品成本的理論最低值(實際上是可變成本部分)。四、Box-Cox變換在考察被解釋變量y和解釋變量的關(guān)系時,經(jīng)常用的兩種模型是線性模型和對數(shù)線性模型事實上,經(jīng)濟學(xué)家對被解釋變量和解釋變量之間的具體的函數(shù)關(guān)系并不是很清楚的。2/3/202321山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室由博克斯和考克斯(Box,Cox,1964)引進的Box-Cox變換對于利用樣本數(shù)據(jù)確定函數(shù)形式非常有益的。對一種關(guān)系中的所有變量進行某個變換就會得到一個由變換參數(shù)決定的函數(shù)族,線性和對數(shù)線性關(guān)系是這個函數(shù)族中的兩個特例。函數(shù)形式最終由估計的變換參數(shù)值確定。我們考慮變量z的下列Box-Cox變換:

時,;時,;時,,……。2/3/202322山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室對某個特殊的關(guān)系式的所有變量都進行Box-Cox變換可得到下列模型時,這個模型就是雙對數(shù)模型(7.13)。時,可得即它和線性模型(7.12)是等價的。對于其它的的值,確定其它的函數(shù)形式。

2/3/202323山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室也可以進行更一般的變換,它就是每個變量的變換參數(shù)不一樣。此時變換后得到的模型為可能有些變量以線性的形式出現(xiàn)(,有些變量以對數(shù)的形式出現(xiàn)(,有些變量以倒數(shù)的形式出現(xiàn)(,等等。這樣得到的函數(shù)族更大些,但是它也給我們估計參數(shù)帶來困難。接下來,我們需要做的事情就是利用樣本數(shù)據(jù)估計變換參數(shù)或()以及,得到估計的函數(shù)形式。一般采用極大似然估計方法估計參數(shù),在此不展開討論。2/3/202324山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室五、小結(jié)計量經(jīng)濟模型設(shè)定的重要方面是要使所設(shè)定的變量間函數(shù)形式能夠體現(xiàn)變量間的基本關(guān)系??傮w回歸模型是對總體回歸函數(shù)的描述,總體回歸函數(shù)正是計量經(jīng)濟要去估計的目標。但其真實的函數(shù)形式事先并不知道。所謂模型函數(shù)形式的設(shè)定,是指根據(jù)對變量間相互關(guān)系的已有認識,把y的條件期望設(shè)定為解釋變量x的某種函數(shù)。總體條件期望函數(shù),可以設(shè)定為各種具體的函數(shù)形式。在計量經(jīng)濟學(xué)的實踐中,通常把總體回歸函數(shù)的具體函數(shù)形式設(shè)定為初等函數(shù),應(yīng)當(dāng)注意的是不同函數(shù)形式中參數(shù)的經(jīng)濟意義有較大差異。常用的函數(shù)形式見課本P217表7-5(課件略)。2/3/202325山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室大多數(shù)模型中,邊際和彈性系數(shù)為變量,其大小取決于具體樣本點自變量或(和)因變量的取值。在實際應(yīng)用時,一般用代替具體的計算,得到的是平均的邊際效應(yīng)或彈性系數(shù)。2/3/202326山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室第三節(jié)虛擬變量虛擬變量含義虛擬解釋變量的回歸分類變量表現(xiàn)為多種狀態(tài)2/3/202327山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室迄今為止,本教材涉及的變量都是數(shù)值變量,諸如市場需求量、商品的價格、收入、產(chǎn)量等;但我們在建模時還經(jīng)常遇到另外一些“變量”,如職業(yè)、性別、地區(qū)、季節(jié)等等。例如,季節(jié)的變化會對某些商品的需求量產(chǎn)生影響;性別或者職業(yè)的不同,其收入水平可能會有很大的差異。再如,當(dāng)研究某一經(jīng)濟問題時還可能有些起暫時作用的“變量”,諸如在某一時期出現(xiàn)了戰(zhàn)爭、天災(zāi)、人禍等。諸如此類的“變量”都是分類變量,或稱為“非數(shù)值變量”、“定性變量”或“名義變量”。一、虛擬變量

2/3/202328山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室在計量經(jīng)濟建模過程中,有時候分類變量是不可缺少的。但由于在一般情況它們并不表現(xiàn)為具體的數(shù)值,為了將分類變量引入計量經(jīng)濟模型中,需要率先將其數(shù)量化,即轉(zhuǎn)化為所謂的“虛擬變量”(DummyVariable),又被稱為二元變量或二進制變量(BinaryVariable),一般用D來表示。

分類變量數(shù)量化的方法是,當(dāng)分類變量起作用時,賦值“D=1”;不起作用時,賦值“D=0”。通過定義虛擬變量,就可以將分類變量等同于數(shù)值變量,引入回歸模型之中。2/3/202329山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室計量經(jīng)濟模型中,虛擬變量可以發(fā)揮多方面的作用:比如,作為屬性因素的代表,如性別、所有制等;可以作為某些非精確計量的數(shù)量因素的代表,如受教育程度、管理者素質(zhì)等;作為某些偶然因素或政策因素的代表,如戰(zhàn)爭、災(zāi)害、改革前后等;實現(xiàn)分段回歸,研究斜率、截距的變動,或比較兩個回歸模型的結(jié)構(gòu)差異;作為時間序列分析中季節(jié)(月份)的代表;等等。2/3/202330山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室在計量經(jīng)濟學(xué)中,把包含有虛擬變量的模型稱為虛擬變量模型。常用的虛擬變量模型有三種類型:

1.解釋變量中只包含虛擬變量,作用是在假定其他因素都不變時,只研究分類變量是否使被解釋變量表現(xiàn)出顯著差異;

2.解釋變量中既含數(shù)值變量,又含虛擬變量,研究數(shù)值變量和虛擬變量同時對被解釋變量的影響;3.被解釋變量本身為虛擬變量的模型,即被解釋變量本身取值為0或1的模型,適于對某社會經(jīng)濟現(xiàn)象進行“是”與“否”的判斷研究。本節(jié)討論前兩種情形。2/3/202331山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室二、虛擬解釋變量的回歸

在計量經(jīng)濟模型中,加入虛擬解釋變量的途徑有兩種基本類型:一是加法類型;二是乘法類型。不同的途徑引入虛擬變量有不同的作用,加法方式引入虛擬變量改變的是模型的截距;乘法方式引入虛擬變量改變的是模型的斜率。(一)用虛擬變量表示不同截距的回歸—加法類型以加法類型引入虛擬解釋變量的模型,虛擬解釋變量與其他解釋變量是相加關(guān)系;從計量經(jīng)濟模型的意義看,其作用是改變了設(shè)定模型的截距水平。比如:2/3/202332山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室例

:研究性別與收入(yi)的關(guān)系:我們可以定義虛擬變量Di,Di=0時表示女性,Di=1時表示男性,即:對于線性回歸模型(7.18),若假設(shè)H0:β1=0成立,則說明收入與性別將沒有太大關(guān)系;若假設(shè)H0:β1=0不成立,則說明收入與性別有關(guān)。

以加法類型引入虛擬變量時,分為兩種情形:解釋變量只有分類變量而無數(shù)值變量;解釋變量既有數(shù)值變量又有分類變量。1.解釋變量只有分類變量而無數(shù)值變量的回歸2/3/202333山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室例7-4研究學(xué)歷與收入(yi)的關(guān)系:可以建立如下模型:2/3/202334山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室表7-6為從某城市隨機獲取的10名職工的學(xué)歷情況與最初參加工作時的起薪。試建立樣本回歸模型。起薪(元)教育(1=大學(xué),0=非大學(xué))起薪(元)教育(1=大學(xué),0=非大學(xué))2300150014002100250010011170013009001700220001001表7-6起薪與受教育程度數(shù)據(jù)2/3/202335山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室由結(jié)果可知,對應(yīng)的t檢驗值為2.3,在統(tǒng)計上顯著,說明學(xué)歷對收入有著顯著的影響,即說明受教育水平不同的兩類人群的起薪是不同的。由方程可得,大學(xué)畢業(yè)的起薪均值為2080元,而非大學(xué)畢業(yè)的起薪均值為1440元,前者比后者高出640元(的系數(shù))。最小二乘估計結(jié)果:2/3/202336山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室因為這種案例實際上是不同組別的均值比較,可以通過方差分析完成,這種情況的模型又被稱為方差分析模型。該例的excel方差分析結(jié)果如表7-7:組觀測數(shù)求和平均方差非大學(xué)572001440108000大學(xué)5104002080212000方差分析差異源SSdfMSFP-valueFcrit組間1024000110240006.40.0352655.317655組內(nèi)12800008160000總計23040009

表7-7excel方差分析輸出結(jié)果2/3/202337山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室2.解釋變量同時包含常規(guī)數(shù)值變量和虛擬變量的回歸例如,我們認為,某個企業(yè)工人的月工資(y)與工作崗位類型(分為一般崗位和特殊崗位)有關(guān),也與工作年限(x)有關(guān)?;貧w模型如下:(7.19)其中崗位類型用虛擬變量表示:于是有2/3/202338山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室因而可以看出(7.19)實際上是兩條截距不同、斜率相同的直線的組合,如圖7-4。這里斜率相同是在模型設(shè)定時隱含的假定。xy在的假設(shè)下,用t檢驗,可以進行工作崗位不同狀態(tài)時月工資是否存在差異的檢驗。2/3/202339山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室(二)用虛擬變量表示不同斜率的回歸——乘法類型以乘法類型引入虛擬解釋變量,是在所設(shè)定的計量經(jīng)濟模型中,將虛擬解釋變量與其他解釋變量相乘作為解釋變量,以表示模型中斜率系數(shù)的差異。以乘法類型引入虛擬解釋變量,可以進行兩個回歸模型的比較、進行因素間的交互影響分析和提高模型對現(xiàn)實經(jīng)濟現(xiàn)象的描述精度。1.回歸模型的比較——結(jié)構(gòu)變化檢驗以加法類型引入虛擬解釋變量,分類變量僅影響不同類型模型截距項,但是在現(xiàn)實經(jīng)濟生活中,分類變量也可能導(dǎo)致模型的斜率系數(shù)發(fā)生變化。2/3/202340山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室例如,隨著可支配收入水平的提高,城鄉(xiāng)居民的消費結(jié)構(gòu)將出現(xiàn)較大的差異,這種差異會表現(xiàn)在分類變量(如城鄉(xiāng)、職業(yè))對斜率的影響上。這類問題可歸結(jié)于兩個回歸模型的比較。例如,在研究城鄉(xiāng)之間儲蓄——收入總量關(guān)系時,所設(shè)定的模型為:城市:i代表城市居民家庭(7.21)

農(nóng)村:j代表農(nóng)村居民家庭(7.22)

其中,y為儲蓄總額(億元),x為收入總額(億元),

u為隨機擾動項。2/3/202341山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室如果我們分別將式(7.21)和式(7.22)對不同的人群作回歸,則可能得到以下四種結(jié)果:(1)表明這兩個回歸模型是相同的,或稱為重合回歸;(2)表明這兩個回歸模型僅在位置水平上(即截距水平上)存在差異,或稱為平行回歸;(3)表明這兩個回歸模型具有相同的位置水平(或起點相同)而變化速率不等,或稱為共點回歸;(4)表明這兩個回歸模型完全不相同,或稱為不同的回歸。2/3/202342山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室以上四種情形可用圖示法描述(見圖7-5):儲蓄收入11儲蓄收入1(a)重合回歸(b)平行回歸2/3/202343山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室11儲蓄收入

(d)不同的回歸(c)共點回歸11儲蓄收入2/3/202344山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室現(xiàn)在的問題是,當(dāng)我們運用樣本數(shù)據(jù)對模型(7.21)和模型(7.22)進行回歸后,如何界定所得結(jié)果在統(tǒng)計意義上屬于哪一種類型呢?這時可采用以乘法類型引入虛擬變量的方法,將模型(7.21)和模型(7.22)連接為一個模型:(7.23)其中,y為儲蓄總額(億元),x為收入總額(億元),

u為隨機擾動項,D為虛擬變量。顯然在式(7.23)中,以乘法類型引入了虛擬變量所形成的解釋變量為,以加法形式引入虛擬變量所形成的解釋變量是。2/3/202345山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室假如根據(jù)100個居民家庭調(diào)查數(shù)據(jù),對(7.23)式用OLS法估計得結(jié)果表明,截距和斜率差異系數(shù)、在統(tǒng)計意義下均為顯著的,說明城鄉(xiāng)之間的儲蓄——收入行為確實不相同。即農(nóng)村家庭(Di=0):城市家庭(Di=1):即2/3/202346山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室以乘法類型引入虛擬變量作回歸模型的比較和結(jié)構(gòu)變化檢驗有一些優(yōu)點:(1)用一個回歸替代了多個回歸,簡化了分析過程;(2)可以方便地對模型結(jié)構(gòu)的差異作各種假設(shè)檢驗;(3)合并了的回歸增加了自由度,提高了參數(shù)估計的精確性。但是,也應(yīng)注意合并后模型的應(yīng)服從基本假定,特別是所比較的方程的方差應(yīng)相同(如城鄉(xiāng)之間),否則會出現(xiàn)異方差問題,需要用WLS法進行校正。

2/3/202347山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室2.交互效應(yīng)分析

當(dāng)分析解釋變量對被解釋變量的影響時,不僅要分析解釋變量自身變動對被解釋變量的影響作用,而且還要深入分析解釋變量間的相互作用對被解釋變量的影響。在實際經(jīng)濟活動中,兩個分類變量對被解釋變量的影響可能存在一定的交互作用,即一個解釋變量的邊際效應(yīng)有時可能要依賴于另一個解釋變量。為描述這種交互作用,可以把兩個虛擬變量的乘積以加法形式引入模型。2/3/202348山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室考慮下列模型:(7.24)其中,為農(nóng)副產(chǎn)品生產(chǎn)總收益;為農(nóng)副產(chǎn)品生產(chǎn)投入;為代表油菜籽生產(chǎn)虛擬變量;為代表養(yǎng)蜂生產(chǎn)虛擬變量。

顯然(7.24)式描述了是否發(fā)展油菜籽生產(chǎn)與是否發(fā)展養(yǎng)蜂生產(chǎn)的差異對農(nóng)副產(chǎn)品總收益的影響。虛擬解釋變量和是以加法類型引入的,那么暗含著假設(shè):油菜籽生產(chǎn)和養(yǎng)蜂生產(chǎn)是分別獨立地影響農(nóng)副品生產(chǎn)總收益。2/3/202349山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室在發(fā)展油菜籽生產(chǎn)時,同時也發(fā)展養(yǎng)蜂生產(chǎn),所取得的農(nóng)副產(chǎn)品生產(chǎn)總收益,可能會高于不發(fā)展養(yǎng)蜂生產(chǎn)的情況。即在是否發(fā)展油菜籽生產(chǎn)與養(yǎng)蜂生產(chǎn)的虛擬變量和間,很可能存在著一定的交互作用,且這種交互影響對被解釋變量農(nóng)副產(chǎn)品生產(chǎn)收益會有影響。為了描述交互作用對被解釋變量的效應(yīng),在(7.24)式中以加法形式引入兩個虛擬解釋變量的乘積,即(7.25)(7.25)式中各變量的含義與(7.24)式相同。2/3/202350山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室基礎(chǔ)類型:為不發(fā)展油菜籽生產(chǎn),也不發(fā)展養(yǎng)蜂生產(chǎn)時農(nóng)副產(chǎn)品生產(chǎn)的平均總收益

(7.26)對比類型:為同時發(fā)展油菜籽生產(chǎn)和養(yǎng)蜂生產(chǎn)時,農(nóng)副產(chǎn)品生產(chǎn)的平均總收益(7.27)這里的截距水平由四項組成,其中:為是否發(fā)展油菜籽生產(chǎn)對農(nóng)副產(chǎn)品生產(chǎn)總收益的截距差異系數(shù);為是否發(fā)展養(yǎng)蜂生產(chǎn)對農(nóng)副產(chǎn)品生產(chǎn)總收益的截距差異系數(shù);為同時發(fā)展油菜籽生產(chǎn)和養(yǎng)蜂生產(chǎn)時對農(nóng)副產(chǎn)品生產(chǎn)總收益的交互效應(yīng)系數(shù)。2/3/202351山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室關(guān)于交互效應(yīng)是否存在,可借助于交互效應(yīng)虛擬解釋變量系數(shù)的顯著性檢驗來加以判斷。如果t檢驗表明交互效應(yīng)虛擬變量在統(tǒng)計意義上是顯著的,則說明交互效應(yīng)對存在顯著影響。3.分段線性回歸

有的社會經(jīng)濟現(xiàn)象的變動,會在解釋變量達到某個臨界值時發(fā)生突變,為了區(qū)分不同階段的截距和斜率可利用虛擬變量進行分段回歸。例如,某公司為了激勵公司銷售人員,按其銷售額的一定比例計提獎勵,但是銷售額在某一目標水平以下和以上時計提獎勵的方法不同。2/3/202352山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室當(dāng)銷售額高于時,計提獎勵額與銷售額的比例要高于銷售額低于時的比例,也就是高于時,獎勵額與銷售額的線性關(guān)系更為陡峭(如圖7-6所示)。為了確切地描述獎勵額度(y)與銷售額(x)間的關(guān)系,需要分兩段進行回歸。這種分段回歸可以用虛擬變量來實現(xiàn)。ⅠⅡ0圖7-6獎勵額與銷售額的關(guān)系2/3/202353山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室設(shè)虛擬變量D為:則獎勵額度()和銷售額()間的關(guān)系式可以統(tǒng)一地表示為:(7.28)為獎勵額,為銷售額,為已知的銷售目標臨界水平。利用統(tǒng)計資料估計(7.28)式的參數(shù),就可以得到不同斜率和截距的回歸方程:銷售額低于時:銷售額不低于:2/3/202354山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室是圖7-6中第Ⅰ段回歸直線的斜率,而則是第Ⅱ段回歸直線的斜率。只要檢驗的統(tǒng)計顯著性,就可以判斷在所設(shè)定的臨界水平處是否存在著“突變”。應(yīng)當(dāng)注意,在分段回歸中,第一、二段回歸不僅截距不同,而且斜率也不同。在分為兩段回歸時,使用了一個虛擬變量,容易推廣,分為k段回歸時,可用

k

-1個虛擬變量。2/3/202355山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室三、分類變量表現(xiàn)為多種狀態(tài)上面討論的定性(分類)變量其表現(xiàn)的狀態(tài)僅有兩種情況,如性別僅表現(xiàn)為男性和女性,學(xué)歷僅區(qū)分為“大學(xué)”和“非大學(xué)”。

但有時分類變量可表現(xiàn)為多種狀態(tài),如文化程度可區(qū)分為大學(xué)、中學(xué)、小學(xué)、文盲四種狀態(tài),省份分為東部、中部和西部三種狀態(tài),等等。

含此類分類變量模型的建立,應(yīng)避免犯以下兩類錯誤:第一,設(shè)置一個虛擬變量,分別用0,1,2,3,…表示其不同的狀態(tài)。此方法缺陷在于,它在設(shè)定模型時,假定各種狀態(tài)均值之間差量為固定值,這顯然與事實不符。2/3/202356山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室第二,設(shè)立與狀態(tài)數(shù)相同個數(shù)的虛擬變量,分別表示各個不同狀態(tài)。例如文化程度區(qū)分為大學(xué)、中學(xué)、小學(xué)、文盲四種狀態(tài),如果設(shè)置四個虛擬變量,即為:

此方法缺陷在于,由于D1+D2+D3+D4=1,如果模型存在常數(shù)項,這會使得多元回歸模型的自變量觀測值矩陣X不滿秩,產(chǎn)生完全的多重共線性。這類問題稱為“虛擬變量陷阱”(TrapofDummyVariable)。正確的虛擬變量設(shè)置方法是:如分類變量有k種表現(xiàn)狀態(tài),可引入(k-1)個虛擬變量。

2/3/202357山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室例7-5科學(xué)家認為某種藥用樹種中的藥用成分PDM含量可能隨著植物生長時間(樹齡)而增加,而且其基礎(chǔ)含量與種植地的地理環(huán)境有關(guān),但其變化速度與地理環(huán)境無關(guān)。某縣地理單元分為平原、山區(qū)和海島三種。隨機抽取20棵植株進行化驗,結(jié)果如表7-8所示。據(jù)此驗證上述假說。2/3/202358山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室植株序號PDM含量(y)樹齡(x)地理單元D1D2D3119.98510平原100232.83912海島001320.5778平原100435.42521山區(qū)010532.83920山區(qū)010631.0005海島001732.94915山區(qū)010836.99816海島001937.10220海島0011024.09230平原1001130.6355海島0011228.60211山區(qū)0101337.77918海島0011435.13522山區(qū)0101520.7363平原1001631.6095海島0011738.05918海島0011838.73029山區(qū)0101922.58819平原1002020.83016平原100表7-8樣本調(diào)查數(shù)據(jù)表2/3/202359山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室以代表樹齡,代表PDM含量,各地理單元植株中PDM含量隨樹齡增長率()相同,但基礎(chǔ)含量()不同。如果設(shè)置三個地理單元的虛擬變量如下科學(xué)家的假定實際上可以表述為:平原種植山區(qū)種植海島種植2/3/202360山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室引入地理單元虛擬變量建立如下模型:(7.29)此模型中只引入了代表平原和山區(qū)兩個地理單元的虛擬變量,分別為和

,代表海島的虛擬變量沒有引進。因此有下面的關(guān)系式:即和分別是種植在平原和山區(qū)植株的PDM含量基礎(chǔ)數(shù)值與海島植株相差的數(shù)額。2/3/202361山東財經(jīng)大學(xué)統(tǒng)計學(xué)院計量經(jīng)濟教研室上述模型的估計結(jié)果如表7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論