版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第七線性回歸模型的擴(kuò)展第1頁(yè),共62頁(yè),2023年,2月20日,星期一
前幾章所討論的,都是基于橫截面數(shù)據(jù)的線性回歸模型,涉及的變量均是數(shù)值變量。實(shí)際上,許多經(jīng)濟(jì)變量之間并不存在線性關(guān)系,建模中涉及的許多變量也不直接表現(xiàn)為數(shù)值,而是屬于分類變量的范疇。
為了擴(kuò)大計(jì)量經(jīng)濟(jì)建模方法的適用范圍,本章擬將橫截面數(shù)據(jù)的線性回歸建模方法擴(kuò)展到對(duì)非線性關(guān)系的分析,并將計(jì)量經(jīng)濟(jì)模型的變量類型從數(shù)值變量擴(kuò)展到分類變量。第2頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/142
線性回歸分析的前提是作為被解釋變量的經(jīng)濟(jì)變量與作為解釋變量的經(jīng)濟(jì)變量之間存在著線性關(guān)系。這里所說(shuō)的線性是指解釋變量線性并且參數(shù)線性。但是,在眾多的經(jīng)濟(jì)現(xiàn)象中,分析經(jīng)濟(jì)變量之間的關(guān)系,根據(jù)某種經(jīng)濟(jì)理論和對(duì)實(shí)際經(jīng)濟(jì)問(wèn)題的分析,所建立的經(jīng)濟(jì)模型往往不符合上面的線性要求,即模型是非線性的,稱為非線性模型(Non-linearModel)。非線性模型包括兩種情況:(1)解釋變量非線性,但是參數(shù)線性。(2)參數(shù)非線性。尤其參數(shù)非線性是對(duì)古典假定SLR.1和MLR.1的違背,對(duì)回歸分析影響很大。
本節(jié)針對(duì)第一種情況進(jìn)行討論,常用的變量非線性回歸模型包括對(duì)數(shù)函數(shù)模型、雙曲線模型和多項(xiàng)式模型。這類模型有一個(gè)共同特點(diǎn),可以利用變量轉(zhuǎn)換等處理方法將模型線性化,線性化后的模型即可采用OLS方法進(jìn)行參數(shù)估計(jì)。這類非線性模型被稱為內(nèi)蘊(yùn)線性模型,或廣義線性模型。第一節(jié)變量非線性回歸模型第3頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/143一、對(duì)數(shù)函數(shù)模型(一)雙對(duì)數(shù)函數(shù)模型
回歸分析經(jīng)常使用的對(duì)數(shù)模型是雙對(duì)數(shù)函數(shù)模型(Double-logModel),考慮如下形式的需求-收入模型(7.2)(7.2)中的參數(shù)是以線性形式出現(xiàn)在模型中的,雖然(7.1)中原變量x和y之間是非線性的,但因變量與自變量的對(duì)數(shù)形式是線性的,因而稱雙對(duì)數(shù)函數(shù)模型。
對(duì)數(shù)函數(shù)模型的自變量和因變量中,至少有一種是原始變量的對(duì)數(shù)形式。具體分為以下兩種類型:兩邊取對(duì)數(shù),模型可變換為:(7.1)第4頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/144
實(shí)際工作中,雙對(duì)數(shù)模型應(yīng)用非常廣泛,其原因在于,如果忽略誤差項(xiàng),(7.2)是一條直線(y和x都是對(duì)數(shù)形式),所以它的斜率(β1)為一常數(shù),是y相對(duì)于x的彈性系數(shù):
所以彈性為一常數(shù)。由于這個(gè)特殊的性質(zhì),雙對(duì)數(shù)模型又稱為不變(固定)彈性模型。
對(duì)這類模型可作如下代換,令雙對(duì)數(shù)模型可化為標(biāo)準(zhǔn)線性模型在古典假定滿足的情況下,可以使用OLS對(duì)模型進(jìn)行估計(jì)。第5頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/145對(duì)于多個(gè)解釋變量的情形,(7.2)式可以擴(kuò)展為(7.3)
稱為偏彈性系數(shù)。它度量了在其他變量不變的條件下,被解釋變量y對(duì)于解釋變量的彈性系數(shù)。如著名的柯布—道格拉斯(Cobb—Douglas)生產(chǎn)函數(shù)模型,就是這類模型的一個(gè)典型,我們下面舉例說(shuō)明。例7-1表7-1列出了抽樣調(diào)查得到的某市19個(gè)規(guī)模以上制造業(yè)企業(yè)的投入產(chǎn)出數(shù)據(jù)。試用回歸分析法分析企業(yè)產(chǎn)出中各要素的貢獻(xiàn)及其特點(diǎn)。第6頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/146企業(yè)產(chǎn)值Q(萬(wàn)元)職工數(shù)L(人)固定資產(chǎn)K(萬(wàn)元)大華1291.878742051.92麒麟1347.058952151.3雙劍1399.69172250.21衡麓1505.119572370.26六合1578.979532488.97春風(fēng)1652.869662606.61聯(lián)華1784.9110332754.66太岳1994.5710982953.78東海2123.2311753157.15荷佳2269.7711523376.42博世2411.9411543635.99科維2608.8112073918.47梅花2774.9812304223.82綠源2965.312964550.49人和3067.1213344846.77花都3290.313745205.33金鼎3540.5715925615.31謙祥3749.7714156098.25表7-1某市19個(gè)規(guī)模以上制造業(yè)企業(yè)的投入產(chǎn)出數(shù)據(jù)第7頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/147用EViews建立雙對(duì)數(shù)模型,回歸結(jié)果如下:樣本回歸方程為:DependentVariable:LOG(Q)Method:LeastSquaresIncludedobservations:19afteradjustmentsVariableCoefficientStd.Errort-StatisticProb.
C-1.5452110.590710-2.6158550.0187LOG(L)0.3397010.1889871.7974790.0912LOG(K)0.8419100.0951418.8491220.0000R-squared0.994499
Meandependentvar7.651499AdjustedR-squared0.993811
S.D.dependentvar0.365836S.E.ofregression0.028780
Akaikeinfocriterion-4.114328Sumsquaredresid0.013253
Schwarzcriterion-3.965206Loglikelihood42.08611
F-statistic1446.223Durbin-Watsonstat0.432115Prob(F-statistic)0.000000第8頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/148
對(duì)樣本回歸方程解釋如下:斜率系數(shù)0.3397表示產(chǎn)出對(duì)勞動(dòng)投入的彈性,即表明在資本投入保持不變的條件下,勞動(dòng)投入每增加一個(gè)百分點(diǎn),平均產(chǎn)出將增加0.3397個(gè)百分點(diǎn)。同樣地,在勞動(dòng)投入保持不變的條件下,資本投入每增加一個(gè)百分點(diǎn),產(chǎn)出將平均增加0.8419個(gè)百分點(diǎn)。兩個(gè)彈性系數(shù)相加為規(guī)模報(bào)酬系數(shù),其數(shù)值大于1,表明該市經(jīng)濟(jì)的特征很可能是規(guī)模報(bào)酬遞增的(如果數(shù)值等于1,屬于規(guī)模報(bào)酬不變;小于1,則屬于規(guī)模報(bào)酬遞減)。第9頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/149
根據(jù)單邊檢驗(yàn)的結(jié)果,這兩個(gè)系數(shù)各自均是統(tǒng)計(jì)顯著的(這是用單邊檢驗(yàn),即,因?yàn)槲覀冾A(yù)期勞動(dòng)力和資本對(duì)產(chǎn)出影響都是正向的),模型的F值也是高度顯著的(因?yàn)閜rob=0.0000),因此能夠拒絕零假設(shè):勞動(dòng)力與資本對(duì)產(chǎn)出無(wú)影響。R2值為0.995,表明勞動(dòng)力和資本(對(duì)數(shù))的變動(dòng)解釋了大約99.5%的產(chǎn)出(對(duì)數(shù))的變動(dòng),說(shuō)明了模型很好地?cái)M合了樣本數(shù)據(jù)。
第10頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1410(二)半對(duì)數(shù)函數(shù)模型線性模型與對(duì)數(shù)函數(shù)模型的混合就是半對(duì)數(shù)模型(Semi-logModels)。因變量是對(duì)數(shù)形式(對(duì)數(shù)-線性模型):
(7.4)
解釋變量是對(duì)數(shù)形式(線性-對(duì)數(shù)模型):
(7.5)
這兩個(gè)模型的參數(shù)是以線性形式出現(xiàn)的,雖然原變量之間是非線性的,但被解釋(解釋)變量的對(duì)數(shù)與解釋(被解釋)變量之間是線性關(guān)系,因此,半對(duì)數(shù)函數(shù)模型可以很容易地轉(zhuǎn)換成線性模型,并使用OLS估計(jì)參數(shù)。第11頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1411對(duì)于半對(duì)數(shù)模型(7.4),顯然有
可見(jiàn),表示x每變化一個(gè)相對(duì)單位(變動(dòng)率)對(duì)應(yīng)的y的平均絕對(duì)變動(dòng)量,所以,半對(duì)數(shù)函數(shù)模型又稱增長(zhǎng)率模型。(7.4)常用于度量由解釋變量相對(duì)變動(dòng)率導(dǎo)致的被解釋變量平均變動(dòng)的絕對(duì)數(shù)量;(7.5)常用于度量由解釋變量絕對(duì)量變化導(dǎo)致的被解釋變量的平均相對(duì)變動(dòng)率。兩個(gè)模型中的斜率系數(shù)又被稱為半彈性(Semi-elasticity)系數(shù)。第12頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1412二、雙曲線模型形如的模型,稱為雙曲線模型(Double-curveModel)。該模型刻畫(huà)了
y與x的反向變動(dòng)關(guān)系,其顯著特點(diǎn)是隨著x的無(wú)限增大(即1/x接近于零),
y趨近于。令,原模型可化為線性形式即可用OLS的方法進(jìn)行估計(jì)。
菲利普斯曲線(PhillipsCurve)就是這個(gè)模型在經(jīng)濟(jì)分析中應(yīng)用的典型體現(xiàn)。菲利普斯曲線刻畫(huà)了通貨膨脹率與失業(yè)率的反向變動(dòng)關(guān)系,如圖7-1。第13頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1413
失業(yè)率與通貨膨脹率負(fù)向相關(guān),同時(shí)通貨膨脹率變化有一個(gè)漸近底限。當(dāng)失業(yè)率x趨于無(wú)窮大時(shí),通貨膨脹率y將取漸近值。0失業(yè)率菲利普斯曲線第14頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1414三、多項(xiàng)式函數(shù)模型
多項(xiàng)式回歸模型(PolynomialRegressionModel)在生產(chǎn)與成本函數(shù)分析中被廣泛地使用。
如果用y表示成本,x表示產(chǎn)出,則可以建立以下多項(xiàng)式模型,體現(xiàn)微觀經(jīng)濟(jì)分析中的二者關(guān)系:總成本(TC):邊際成本(MC)和平均成本(AC)的PRF為:(7.8)即總體回歸函數(shù)(PRF)為:第15頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1415產(chǎn)出x成本y產(chǎn)出x成本yMCTCAC
成本曲線
如果模型的解釋變量為時(shí)間變量t,多項(xiàng)式函數(shù)模型又稱為曲線回歸模型,常常用于對(duì)非線性長(zhǎng)期趨勢(shì)的擬合。
有時(shí)為了反映自變量之間的交互影響,也需要用到多項(xiàng)式回歸模型。第16頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1416
如以y、x、z分別表示單位面積上的糧食產(chǎn)量、施肥量和灌溉用水量。由于施肥量和灌溉用水量對(duì)糧食產(chǎn)量的效應(yīng)之間存在交互影響,所以,可以建立以下模型:施肥量x對(duì)糧食產(chǎn)量y的總邊際影響是:
是施肥量對(duì)糧食產(chǎn)量的直接效應(yīng)(假定灌溉用水量不變),是施肥量對(duì)糧食產(chǎn)量的間接效應(yīng),隨灌溉用水量的不同而變化,說(shuō)明肥效的發(fā)揮取決于灌溉用水的多少。同樣,灌溉用水z對(duì)糧食產(chǎn)量y的總邊際影響也可以這樣分解。顯然,該模型比單純的二元回歸模型更符合實(shí)際情況。第17頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1417例7-2表7-3給出了某市16個(gè)企業(yè)的產(chǎn)品產(chǎn)量(x)與單位產(chǎn)品成本(y)的抽樣調(diào)查數(shù)據(jù)。試研究二者的依存關(guān)系。企業(yè)序號(hào)產(chǎn)品產(chǎn)量(噸)x單位產(chǎn)品成本(元/噸)y企業(yè)序號(hào)產(chǎn)品產(chǎn)量(噸)x單位產(chǎn)品成本(元/噸)y143034629602310824103433106193068343232751175630514501315112738300755523108136953068656530761464730347588314615635298186653057167882962
企業(yè)產(chǎn)品產(chǎn)量與單位產(chǎn)品成本數(shù)據(jù)第18頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1418
根據(jù)規(guī)模經(jīng)濟(jì)的原理,產(chǎn)品產(chǎn)量是單位產(chǎn)品成本變化的原因。為了明確二者的具體關(guān)系類型,使用EViews的Graph功能,繪制散點(diǎn)圖如下:第19頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1419
顯然,二者的關(guān)系不是線性關(guān)系。可供選擇的模型有以下兩種:雙曲線模型:半對(duì)數(shù)模型:分別擬合兩種模型,回歸結(jié)果整理如下:模型
的估計(jì)值與t檢驗(yàn)值
的估計(jì)值與t檢驗(yàn)值R2AICSCt檢驗(yàn)值t檢驗(yàn)值雙曲線半對(duì)數(shù)2489.77247.833.4413.18367183.6-646.28.70-7.510.840.8011.1411.3811.2311.48
雙曲線模型和冪函數(shù)模型的系數(shù)均通過(guò)了顯著性檢驗(yàn),但前者無(wú)論是R2還是AIC、SC均好于后者,所以,最終的模型應(yīng)為雙曲線模型:第20頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1420
該回歸結(jié)果說(shuō)明,單位產(chǎn)品成本隨產(chǎn)量的上升而下降,當(dāng)產(chǎn)品產(chǎn)量趨近于無(wú)窮大時(shí),單位產(chǎn)品成本趨近于2489.7元/噸,這就是單位產(chǎn)品成本的理論最低值(實(shí)際上是可變成本部分)。四、Box-Cox變換
在考察被解釋變量y和解釋變量的關(guān)系時(shí),經(jīng)常用的兩種模型是線性模型和對(duì)數(shù)線性模型事實(shí)上,經(jīng)濟(jì)學(xué)家對(duì)被解釋變量和解釋變量之間的具體的函數(shù)關(guān)系并不是很清楚的。第21頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1421
由博克斯和考克斯(Box,Cox,1964)引進(jìn)的Box-Cox變換對(duì)于利用樣本數(shù)據(jù)確定函數(shù)形式非常有益的。對(duì)一種關(guān)系中的所有變量進(jìn)行某個(gè)變換就會(huì)得到一個(gè)由變換參數(shù)決定的函數(shù)族,線性和對(duì)數(shù)線性關(guān)系是這個(gè)函數(shù)族中的兩個(gè)特例。函數(shù)形式最終由估計(jì)的變換參數(shù)值確定。
我們考慮變量z的下列Box-Cox變換:時(shí),;時(shí),;時(shí),,……。第22頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1422
對(duì)某個(gè)特殊的關(guān)系式的所有變量都進(jìn)行Box-Cox變換可得到下列模型
時(shí),這個(gè)模型就是雙對(duì)數(shù)模型(7.13)。時(shí),可得即它和線性模型(7.12)是等價(jià)的。對(duì)于其它的的值,確定其它的函數(shù)形式。
第23頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1423
也可以進(jìn)行更一般的變換,它就是每個(gè)變量的變換參數(shù)不一樣。此時(shí)變換后得到的模型為可能有些變量以線性的形式出現(xiàn)(,有些變量以對(duì)數(shù)的形式出現(xiàn)(,有些變量以倒數(shù)的形式出現(xiàn)(,等等。這樣得到的函數(shù)族更大些,但是它也給我們估計(jì)參數(shù)帶來(lái)困難。
接下來(lái),我們需要做的事情就是利用樣本數(shù)據(jù)估計(jì)變換參數(shù)或()以及,得到估計(jì)的函數(shù)形式。一般采用極大似然估計(jì)方法估計(jì)參數(shù),在此不展開(kāi)討論。第24頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1424五、小結(jié)
計(jì)量經(jīng)濟(jì)模型設(shè)定的重要方面是要使所設(shè)定的變量間函數(shù)形式能夠體現(xiàn)變量間的基本關(guān)系。總體回歸模型是對(duì)總體回歸函數(shù)的描述,總體回歸函數(shù)正是計(jì)量經(jīng)濟(jì)要去估計(jì)的目標(biāo)。但其真實(shí)的函數(shù)形式事先并不知道。所謂模型函數(shù)形式的設(shè)定,是指根據(jù)對(duì)變量間相互關(guān)系的已有認(rèn)識(shí),把y的條件期望設(shè)定為解釋變量x的某種函數(shù)??傮w條件期望函數(shù),可以設(shè)定為各種具體的函數(shù)形式。在計(jì)量經(jīng)濟(jì)學(xué)的實(shí)踐中,通常把總體回歸函數(shù)的具體函數(shù)形式設(shè)定為初等函數(shù),應(yīng)當(dāng)注意的是不同函數(shù)形式中參數(shù)的經(jīng)濟(jì)意義有較大差異。常用的函數(shù)形式見(jiàn)課本P217表7-5(課件略)。第25頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1425
大多數(shù)模型中,邊際和彈性系數(shù)為變量,其大小取決于具體樣本點(diǎn)自變量或(和)因變量的取值。在實(shí)際應(yīng)用時(shí),一般用代替具體的計(jì)算,得到的是平均的邊際效應(yīng)或彈性系數(shù)。第26頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1426第三節(jié)虛擬變量虛擬變量含義虛擬解釋變量的回歸分類變量表現(xiàn)為多種狀態(tài)第27頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1427
迄今為止,本教材涉及的變量都是數(shù)值變量,諸如市場(chǎng)需求量、商品的價(jià)格、收入、產(chǎn)量等;但我們?cè)诮r(shí)還經(jīng)常遇到另外一些“變量”,如職業(yè)、性別、地區(qū)、季節(jié)等等。例如,季節(jié)的變化會(huì)對(duì)某些商品的需求量產(chǎn)生影響;性別或者職業(yè)的不同,其收入水平可能會(huì)有很大的差異。再如,當(dāng)研究某一經(jīng)濟(jì)問(wèn)題時(shí)還可能有些起暫時(shí)作用的“變量”,諸如在某一時(shí)期出現(xiàn)了戰(zhàn)爭(zhēng)、天災(zāi)、人禍等。諸如此類的“變量”都是分類變量,或稱為“非數(shù)值變量”、“定性變量”或“名義變量”。一、虛擬變量
第28頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1428
在計(jì)量經(jīng)濟(jì)建模過(guò)程中,有時(shí)候分類變量是不可缺少的。但由于在一般情況它們并不表現(xiàn)為具體的數(shù)值,為了將分類變量引入計(jì)量經(jīng)濟(jì)模型中,需要率先將其數(shù)量化,即轉(zhuǎn)化為所謂的“虛擬變量”(DummyVariable),又被稱為二元變量或二進(jìn)制變量(BinaryVariable),一般用D來(lái)表示。
分類變量數(shù)量化的方法是,當(dāng)分類變量起作用時(shí),賦值“D=1”;不起作用時(shí),賦值“D=0”。通過(guò)定義虛擬變量,就可以將分類變量等同于數(shù)值變量,引入回歸模型之中。第29頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1429
計(jì)量經(jīng)濟(jì)模型中,虛擬變量可以發(fā)揮多方面的作用:比如,作為屬性因素的代表,如性別、所有制等;可以作為某些非精確計(jì)量的數(shù)量因素的代表,如受教育程度、管理者素質(zhì)等;作為某些偶然因素或政策因素的代表,如戰(zhàn)爭(zhēng)、災(zāi)害、改革前后等;實(shí)現(xiàn)分段回歸,研究斜率、截距的變動(dòng),或比較兩個(gè)回歸模型的結(jié)構(gòu)差異;作為時(shí)間序列分析中季節(jié)(月份)的代表;等等。第30頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1430
在計(jì)量經(jīng)濟(jì)學(xué)中,把包含有虛擬變量的模型稱為虛擬變量模型。常用的虛擬變量模型有三種類型:
1.解釋變量中只包含虛擬變量,作用是在假定其他因素都不變時(shí),只研究分類變量是否使被解釋變量表現(xiàn)出顯著差異;
2.解釋變量中既含數(shù)值變量,又含虛擬變量,研究數(shù)值變量和虛擬變量同時(shí)對(duì)被解釋變量的影響;
3.被解釋變量本身為虛擬變量的模型,即被解釋變量本身取值為0或1的模型,適于對(duì)某社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行“是”與“否”的判斷研究。本節(jié)討論前兩種情形。第31頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1431二、虛擬解釋變量的回歸
在計(jì)量經(jīng)濟(jì)模型中,加入虛擬解釋變量的途徑有兩種基本類型:一是加法類型;二是乘法類型。不同的途徑引入虛擬變量有不同的作用,加法方式引入虛擬變量改變的是模型的截距;乘法方式引入虛擬變量改變的是模型的斜率。(一)用虛擬變量表示不同截距的回歸—加法類型
以加法類型引入虛擬解釋變量的模型,虛擬解釋變量與其他解釋變量是相加關(guān)系;從計(jì)量經(jīng)濟(jì)模型的意義看,其作用是改變了設(shè)定模型的截距水平。比如:第32頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1432例:研究性別與收入(yi)的關(guān)系:我們可以定義虛擬變量Di,Di=0時(shí)表示女性,Di=1時(shí)表示男性,即:對(duì)于線性回歸模型(7.18),若假設(shè)H0:β1=0成立,則說(shuō)明收入與性別將沒(méi)有太大關(guān)系;若假設(shè)H0:β1=0不成立,則說(shuō)明收入與性別有關(guān)。
以加法類型引入虛擬變量時(shí),分為兩種情形:解釋變量只有分類變量而無(wú)數(shù)值變量;解釋變量既有數(shù)值變量又有分類變量。1.解釋變量只有分類變量而無(wú)數(shù)值變量的回歸第33頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1433例7-4研究學(xué)歷與收入(yi)的關(guān)系:可以建立如下模型:第34頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1434表7-6為從某城市隨機(jī)獲取的10名職工的學(xué)歷情況與最初參加工作時(shí)的起薪。試建立樣本回歸模型。起薪(元)教育(1=大學(xué),0=非大學(xué))起薪(元)教育(1=大學(xué),0=非大學(xué))2300150014002100250010011170013009001700220001001表7-6起薪與受教育程度數(shù)據(jù)第35頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1435
由結(jié)果可知,對(duì)應(yīng)的t檢驗(yàn)值為2.3,在統(tǒng)計(jì)上顯著,說(shuō)明學(xué)歷對(duì)收入有著顯著的影響,即說(shuō)明受教育水平不同的兩類人群的起薪是不同的。由方程可得,大學(xué)畢業(yè)的起薪均值為2080元,而非大學(xué)畢業(yè)的起薪均值為1440元,前者比后者高出640元(的系數(shù))。最小二乘估計(jì)結(jié)果:第36頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1436
因?yàn)檫@種案例實(shí)際上是不同組別的均值比較,可以通過(guò)方差分析完成,這種情況的模型又被稱為方差分析模型。該例的excel方差分析結(jié)果如表7-7:組觀測(cè)數(shù)求和平均方差非大學(xué)572001440108000大學(xué)5104002080212000方差分析差異源SSdfMSFP-valueFcrit組間1024000110240006.40.0352655.317655組內(nèi)12800008160000總計(jì)23040009
表7-7excel方差分析輸出結(jié)果第37頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/14372.解釋變量同時(shí)包含常規(guī)數(shù)值變量和虛擬變量的回歸例如,我們認(rèn)為,某個(gè)企業(yè)工人的月工資(y)與工作崗位類型(分為一般崗位和特殊崗位)有關(guān),也與工作年限(x)有關(guān)?;貧w模型如下:(7.19)其中崗位類型用虛擬變量表示:于是有第38頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1438
因而可以看出(7.19)實(shí)際上是兩條截距不同、斜率相同的直線的組合,如圖7-4。這里斜率相同是在模型設(shè)定時(shí)隱含的假定。xy在的假設(shè)下,用t檢驗(yàn),可以進(jìn)行工作崗位不同狀態(tài)時(shí)月工資是否存在差異的檢驗(yàn)。第39頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1439(二)用虛擬變量表示不同斜率的回歸——乘法類型
以乘法類型引入虛擬解釋變量,是在所設(shè)定的計(jì)量經(jīng)濟(jì)模型中,將虛擬解釋變量與其他解釋變量相乘作為解釋變量,以表示模型中斜率系數(shù)的差異。以乘法類型引入虛擬解釋變量,可以進(jìn)行兩個(gè)回歸模型的比較、進(jìn)行因素間的交互影響分析和提高模型對(duì)現(xiàn)實(shí)經(jīng)濟(jì)現(xiàn)象的描述精度。1.回歸模型的比較——結(jié)構(gòu)變化檢驗(yàn)以加法類型引入虛擬解釋變量,分類變量?jī)H影響不同類型模型截距項(xiàng),但是在現(xiàn)實(shí)經(jīng)濟(jì)生活中,分類變量也可能導(dǎo)致模型的斜率系數(shù)發(fā)生變化。第40頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1440例如,隨著可支配收入水平的提高,城鄉(xiāng)居民的消費(fèi)結(jié)構(gòu)將出現(xiàn)較大的差異,這種差異會(huì)表現(xiàn)在分類變量(如城鄉(xiāng)、職業(yè))對(duì)斜率的影響上。這類問(wèn)題可歸結(jié)于兩個(gè)回歸模型的比較。例如,在研究城鄉(xiāng)之間儲(chǔ)蓄——收入總量關(guān)系時(shí),所設(shè)定的模型為:城市:i代表城市居民家庭(7.21)農(nóng)村:j代表農(nóng)村居民家庭(7.22)其中,y為儲(chǔ)蓄總額(億元),x為收入總額(億元),
u為隨機(jī)擾動(dòng)項(xiàng)。第41頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1441
如果我們分別將式(7.21)和式(7.22)對(duì)不同的人群作回歸,則可能得到以下四種結(jié)果:(1)表明這兩個(gè)回歸模型是相同的,或稱為重合回歸;(2)表明這兩個(gè)回歸模型僅在位置水平上(即截距水平上)存在差異,或稱為平行回歸;(3)表明這兩個(gè)回歸模型具有相同的位置水平(或起點(diǎn)相同)而變化速率不等,或稱為共點(diǎn)回歸;(4)表明這兩個(gè)回歸模型完全不相同,或稱為不同的回歸。第42頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1442以上四種情形可用圖示法描述(見(jiàn)圖7-5):儲(chǔ)蓄收入11儲(chǔ)蓄收入1(a)重合回歸(b)平行回歸第43頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/144311儲(chǔ)蓄收入
(d)不同的回歸(c)共點(diǎn)回歸11儲(chǔ)蓄收入第44頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1444現(xiàn)在的問(wèn)題是,當(dāng)我們運(yùn)用樣本數(shù)據(jù)對(duì)模型(7.21)和模型(7.22)進(jìn)行回歸后,如何界定所得結(jié)果在統(tǒng)計(jì)意義上屬于哪一種類型呢?這時(shí)可采用以乘法類型引入虛擬變量的方法,將模型(7.21)和模型(7.22)連接為一個(gè)模型:(7.23)其中,y為儲(chǔ)蓄總額(億元),x為收入總額(億元),
u為隨機(jī)擾動(dòng)項(xiàng),D為虛擬變量。顯然在式(7.23)中,以乘法類型引入了虛擬變量所形成的解釋變量為,以加法形式引入虛擬變量所形成的解釋變量是。第45頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1445假如根據(jù)100個(gè)居民家庭調(diào)查數(shù)據(jù),對(duì)(7.23)式用OLS法估計(jì)得結(jié)果表明,截距和斜率差異系數(shù)、在統(tǒng)計(jì)意義下均為顯著的,說(shuō)明城鄉(xiāng)之間的儲(chǔ)蓄——收入行為確實(shí)不相同。即農(nóng)村家庭(Di=0):城市家庭(Di=1):即第46頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1446
以乘法類型引入虛擬變量作回歸模型的比較和結(jié)構(gòu)變化檢驗(yàn)有一些優(yōu)點(diǎn):(1)用一個(gè)回歸替代了多個(gè)回歸,簡(jiǎn)化了分析過(guò)程;(2)可以方便地對(duì)模型結(jié)構(gòu)的差異作各種假設(shè)檢驗(yàn);(3)合并了的回歸增加了自由度,提高了參數(shù)估計(jì)的精確性。但是,也應(yīng)注意合并后模型的應(yīng)服從基本假定,特別是所比較的方程的方差應(yīng)相同(如城鄉(xiāng)之間),否則會(huì)出現(xiàn)異方差問(wèn)題,需要用WLS法進(jìn)行校正。
第47頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/14472.交互效應(yīng)分析
當(dāng)分析解釋變量對(duì)被解釋變量的影響時(shí),不僅要分析解釋變量自身變動(dòng)對(duì)被解釋變量的影響作用,而且還要深入分析解釋變量間的相互作用對(duì)被解釋變量的影響。
在實(shí)際經(jīng)濟(jì)活動(dòng)中,兩個(gè)分類變量對(duì)被解釋變量的影響可能存在一定的交互作用,即一個(gè)解釋變量的邊際效應(yīng)有時(shí)可能要依賴于另一個(gè)解釋變量。為描述這種交互作用,可以把兩個(gè)虛擬變量的乘積以加法形式引入模型。第48頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1448考慮下列模型:(7.24)
其中,為農(nóng)副產(chǎn)品生產(chǎn)總收益;為農(nóng)副產(chǎn)品生產(chǎn)投入;為代表油菜籽生產(chǎn)虛擬變量;為代表養(yǎng)蜂生產(chǎn)虛擬變量。
顯然(7.24)式描述了是否發(fā)展油菜籽生產(chǎn)與是否發(fā)展養(yǎng)蜂生產(chǎn)的差異對(duì)農(nóng)副產(chǎn)品總收益的影響。虛擬解釋變量和是以加法類型引入的,那么暗含著假設(shè):油菜籽生產(chǎn)和養(yǎng)蜂生產(chǎn)是分別獨(dú)立地影響農(nóng)副品生產(chǎn)總收益。第49頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1449
在發(fā)展油菜籽生產(chǎn)時(shí),同時(shí)也發(fā)展養(yǎng)蜂生產(chǎn),所取得的農(nóng)副產(chǎn)品生產(chǎn)總收益,可能會(huì)高于不發(fā)展養(yǎng)蜂生產(chǎn)的情況。即在是否發(fā)展油菜籽生產(chǎn)與養(yǎng)蜂生產(chǎn)的虛擬變量和間,很可能存在著一定的交互作用,且這種交互影響對(duì)被解釋變量農(nóng)副產(chǎn)品生產(chǎn)收益會(huì)有影響。
為了描述交互作用對(duì)被解釋變量的效應(yīng),在(7.24)式中以加法形式引入兩個(gè)虛擬解釋變量的乘積,即(7.25)(7.25)式中各變量的含義與(7.24)式相同。第50頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1450
基礎(chǔ)類型:為不發(fā)展油菜籽生產(chǎn),也不發(fā)展養(yǎng)蜂生產(chǎn)時(shí)農(nóng)副產(chǎn)品生產(chǎn)的平均總收益(7.26)
對(duì)比類型:為同時(shí)發(fā)展油菜籽生產(chǎn)和養(yǎng)蜂生產(chǎn)時(shí),農(nóng)副產(chǎn)品生產(chǎn)的平均總收益(7.27)這里的截距水平由四項(xiàng)組成,其中:
為是否發(fā)展油菜籽生產(chǎn)對(duì)農(nóng)副產(chǎn)品生產(chǎn)總收益的截距差異系數(shù);為是否發(fā)展養(yǎng)蜂生產(chǎn)對(duì)農(nóng)副產(chǎn)品生產(chǎn)總收益的截距差異系數(shù);為同時(shí)發(fā)展油菜籽生產(chǎn)和養(yǎng)蜂生產(chǎn)時(shí)對(duì)農(nóng)副產(chǎn)品生產(chǎn)總收益的交互效應(yīng)系數(shù)。第51頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1451
關(guān)于交互效應(yīng)是否存在,可借助于交互效應(yīng)虛擬解釋變量系數(shù)的顯著性檢驗(yàn)來(lái)加以判斷。如果t檢驗(yàn)表明交互效應(yīng)虛擬變量在統(tǒng)計(jì)意義上是顯著的,則說(shuō)明交互效應(yīng)對(duì)存在顯著影響。3.分段線性回歸
有的社會(huì)經(jīng)濟(jì)現(xiàn)象的變動(dòng),會(huì)在解釋變量達(dá)到某個(gè)臨界值時(shí)發(fā)生突變,為了區(qū)分不同階段的截距和斜率可利用虛擬變量進(jìn)行分段回歸。例如,某公司為了激勵(lì)公司銷售人員,按其銷售額的一定比例計(jì)提獎(jiǎng)勵(lì),但是銷售額在某一目標(biāo)水平以下和以上時(shí)計(jì)提獎(jiǎng)勵(lì)的方法不同。第52頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1452
當(dāng)銷售額高于時(shí),計(jì)提獎(jiǎng)勵(lì)額與銷售額的比例要高于銷售額低于時(shí)的比例,也就是高于時(shí),獎(jiǎng)勵(lì)額與銷售額的線性關(guān)系更為陡峭(如圖7-6所示)。為了確切地描述獎(jiǎng)勵(lì)額度(y)與銷售額(x)間的關(guān)系,需要分兩段進(jìn)行回歸。這種分段回歸可以用虛擬變量來(lái)實(shí)現(xiàn)。ⅠⅡ0圖7-6獎(jiǎng)勵(lì)額與銷售額的關(guān)系第53頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1453設(shè)虛擬變量D為:則獎(jiǎng)勵(lì)額度()和銷售額()間的關(guān)系式可以統(tǒng)一地表示為:(7.28)
為獎(jiǎng)勵(lì)額,為銷售額,為已知的銷售目標(biāo)臨界水平。利用統(tǒng)計(jì)資料估計(jì)(7.28)式的參數(shù),就可以得到不同斜率和截距的回歸方程:銷售額低于時(shí):銷售額不低于:第54頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1454
是圖7-6中第Ⅰ段回歸直線的斜率,而則是第Ⅱ段回歸直線的斜率。只要檢驗(yàn)的統(tǒng)計(jì)顯著性,就可以判斷在所設(shè)定的臨界水平處是否存在著“突變”。應(yīng)當(dāng)注意,在分段回歸中,第一、二段回歸不僅截距不同,而且斜率也不同。在分為兩段回歸時(shí),使用了一個(gè)虛擬變量,容易推廣,分為k段回歸時(shí),可用
k-1個(gè)虛擬變量。第55頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1455三、分類變量表現(xiàn)為多種狀態(tài)
上面討論的定性(分類)變量其表現(xiàn)的狀態(tài)僅有兩種情況,如性別僅表現(xiàn)為男性和女性,學(xué)歷僅區(qū)分為“大學(xué)”和“非大學(xué)”。
但有時(shí)分類變量可表現(xiàn)為多種狀態(tài),如文化程度可區(qū)分為大學(xué)、中學(xué)、小學(xué)、文盲四種狀態(tài),省份分為東部、中部和西部三種狀態(tài),等等。
含此類分類變量模型的建立,應(yīng)避免犯以下兩類錯(cuò)誤:第一,設(shè)置一個(gè)虛擬變量,分別用0,1,2,3,…表示其不同的狀態(tài)。此方法缺陷在于,它在設(shè)定模型時(shí),假定各種狀態(tài)均值之間差量為固定值,這顯然與事實(shí)不符。第56頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1456第二,設(shè)立與狀態(tài)數(shù)相同個(gè)數(shù)的虛擬變量,分別表示各個(gè)不同狀態(tài)。例如文化程度區(qū)分為大學(xué)、中學(xué)、小學(xué)、文盲四種狀態(tài),如果設(shè)置四個(gè)虛擬變量,即為:
此方法缺陷在于,由于D1+D2+D3+D4=1,如果模型存在常數(shù)項(xiàng),這會(huì)使得多元回歸模型的自變量觀測(cè)值矩陣X不滿秩,產(chǎn)生完全的多重共線性。這類問(wèn)題稱為“虛擬變量陷阱”(TrapofDummyVariable)。正確的虛擬變量設(shè)置方法是:如分類變量有k種表現(xiàn)狀態(tài),可引入(k-1)個(gè)虛擬變量。
第57頁(yè),共62頁(yè),2023年,2月20日,星期一2023/4/1457例7-5科學(xué)家認(rèn)為某種藥用樹(shù)種中的藥用成分PDM含量可能隨著植物生長(zhǎng)時(shí)間(樹(shù)齡)而增加,而且其基礎(chǔ)含量與種植地的地理環(huán)境有關(guān),但其變化速度與地理環(huán)境無(wú)關(guān)。某縣地理單元分為平原、山區(qū)和海島三種。隨機(jī)抽取20棵植株進(jìn)行化驗(yàn),結(jié)果如表
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年仁愛(ài)科普版高二數(shù)學(xué)上冊(cè)階段測(cè)試試卷含答案
- 2024年福建生物工程職業(yè)技術(shù)學(xué)院高職單招數(shù)學(xué)歷年參考題庫(kù)含答案解析
- 2024瓷磚供應(yīng)商質(zhì)量檢測(cè)與評(píng)估合同
- 2025年蘇教版必修3地理上冊(cè)月考試卷含答案
- 2025年華東師大版七年級(jí)語(yǔ)文下冊(cè)階段測(cè)試試卷
- 二零二五年度廢棄電子產(chǎn)品拆解回收合同3篇
- 2025年人教版三年級(jí)英語(yǔ)下冊(cè)階段測(cè)試試卷含答案
- 2025年人教新課標(biāo)九年級(jí)英語(yǔ)上冊(cè)階段測(cè)試試卷
- 2025年滬教新版二年級(jí)語(yǔ)文上冊(cè)階段測(cè)試試卷含答案
- 2025年仁愛(ài)科普版九年級(jí)歷史下冊(cè)月考試卷
- 河南省鄭州外國(guó)語(yǔ)高中-【高二】【上期中】【把握現(xiàn)在 蓄力高三】家長(zhǎng)會(huì)【課件】
- 2025年中煤電力有限公司招聘筆試參考題庫(kù)含答案解析
- 企業(yè)內(nèi)部控制與財(cái)務(wù)風(fēng)險(xiǎn)防范
- 建設(shè)項(xiàng)目施工現(xiàn)場(chǎng)春節(jié)放假期間的安全管理方案
- 胃潴留護(hù)理查房
- 污水處理廠運(yùn)營(yíng)方案計(jì)劃
- 眼科慢病管理新思路
- 劉先生家庭投資理財(cái)規(guī)劃方案設(shè)計(jì)
- 寵物養(yǎng)護(hù)與經(jīng)營(yíng)-大學(xué)專業(yè)介紹
- 利潤(rùn)分配協(xié)議三篇
- 房屋租賃合同樣本樣本
評(píng)論
0/150
提交評(píng)論