選擇函數形式_第1頁
選擇函數形式_第2頁
選擇函數形式_第3頁
選擇函數形式_第4頁
選擇函數形式_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

選擇函數形式目錄6.1過原點回歸6.2尺度與測量單位6.3標準化變量的回歸6.4回歸模型的函數形式6.5怎樣測度彈性:對數線性模型6.6半對數模型:線性到對數與對數到線性模型6.7倒數模型6.8函數形式的選擇6.9關于隨機誤差項的性質第2頁,共58頁,2024年2月25日,星期天6.2尺度與測量單位1988-1997年美國私人國內總投資與國內生產總值GPDIBL=以1992年10億美元計私人國內總投資GPDIM=以1992年百萬美元計私人國內總投資GDPB=以1992年10億美元計國內生產總值GDPM=以1992年百萬美元計國內生產總值第3頁,共58頁,2024年2月25日,星期天假使在GPDI和GDP的回歸中某一研究者使用以10億美元計的數據,而另一研究者使用以百萬美元的同樣變量的數據。這兩種情形的回歸結果是否會是一樣的?為了回答Y和X的測量單位是否會造成回歸結果的任何差異這個問題,我們令:其中Y=GPDI,X=GDP。定義:其中w1

和w2

為常數,稱為尺度因子(scalefactors),w1

和w2

可以相等或相異。如果Y和X是以10億美元度量的而現在改用百萬美元去表示,則有第4頁,共58頁,2024年2月25日,星期天現考慮使用如下回歸:其中我們要找出以下每組變量之間的關系式:第5頁,共58頁,2024年2月25日,星期天把OLS法應用于新的回歸我們得到:

容易證明:第6頁,共58頁,2024年2月25日,星期天由此可以看出,當尺度因子相同時,即時,斜率系數及其標準差不受尺度從變到的影響。截距及其標準差放大或縮小了w1

倍。若X尺度不變(即w2=1),而Y的尺度按因子w1

改變,則斜率和截距系數以及各自的標準差都要乘以因子w1

。若Y尺度不變(即w1=1),而X尺度按因子w2

改變,則斜率系數及其標準誤要乘以因子1/w2

,截距系數及其標準差不變。第7頁,共58頁,2024年2月25日,星期天一個數值例子:1988-1997年美國GPDI與GDP的關系GPDI和GDP都以10億美元計算:GPDI和GDP都以百萬美元計算:如理論所示,(6.2.22)中截距及其標準差都是回歸(6.2.21)中相應值的1000倍(w1=1000),但斜率系數及其標準差不變。第8頁,共58頁,2024年2月25日,星期天一個數值例子:1988-1997年美國GPDI與GDP的關系若GPDI以10億美元計算而GDP以百萬美元計算:僅X改變尺度w2=1000,所以斜率系數及其標準差是(6.2.21)中的1/1000倍。若GPDI以百萬美元計而GDP以10億美元計算:如理論所示,X尺度不變,Y按w1改變,截距和斜率系數及其標準差都是它們在(6.2.21)中的1000倍。第9頁,共58頁,2024年2月25日,星期天為結果的解釋進一言因為斜率系數無非就是變化率,它的單位就是如下比率的單位:因變量Y的單位解釋變量X的單位

例如在回歸(6.2.21)中,斜率系數0.3016的意義是,GDP每改變一個單位,即10億美元,GPDI平均改變0.3016個10億美元。

在回歸(6.2.23)中,GDP的一個單位即1百萬美元的變化,平均導致GPDI的0.000302個10億美元的變化。

當然,這兩個結果從它們的GDP對GPDI的影響看是完全相同的;只不過用不同的測量單位來表示而已。

第10頁,共58頁,2024年2月25日,星期天6.3標準化變量的回歸剛才我們看到回歸子和回歸元的單位會影響到回歸系數的截距。如果我們把回歸子和回歸元表示成標準化變量,這種影響就可以避免。于是,在Y對X的回歸中,如果我們把這些變量重新定義為:其中=Y的樣本均值,=Y的樣本標準差,=X的樣本均值,=X的樣本標準差。變量和被稱為標準化變量(standardizedvariables.)第11頁,共58頁,2024年2月25日,星期天標準化變量的一個有趣特征是,其均值總是0,標準差總是1.注:樣本方差自由度為n-1,因為樣本中如果知道了均值,那么只需要知道其他n-1個數就可以把樣本中每個數都確定了。第12頁,共58頁,2024年2月25日,星期天于是我們對標準化變量做回歸:由于對標準化的回歸子和回歸元做回歸,所以截距項總是零。(截距=因變量的均值-斜率*回歸元的均值,對標準化變量而言,因變量和回歸元的均值都是零。)(6.3.5)是一個過原點的回歸。標準化變量的回歸系數(、表示)被稱為β系數。如何解釋β系數呢?其解釋是,如果標準化回歸元增加一個單位的標準差,則標準化回歸子平均增加單位個標準差(標準化變量的標準差為1)。與傳統模型不同,我們度量的變量影響用標準差為單位。(6.3.5)第13頁,共58頁,2024年2月25日,星期天回到上一例:其中GPDI和GDP以10億美元計。標準化變量的回歸結果為:解釋(6.3.6):若GDP提高1美元,則GPDI平均提高0.3美元.解釋(6.3.7):若GDP增加一個標準差,則GPDI平均約增加0.94個標準差。第14頁,共58頁,2024年2月25日,星期天標準化回歸模型與傳統模型相比有什么優(yōu)勢?1.若不止一個回歸,我們就能將它們放在同等地位直接進行比較。2.可以用β系數作為各個回歸元相對解釋力的一種度量。如果一個標準化回歸元的系數比模型中另一個標準化回歸元的系數大,那么前者就能比后者更多的解釋回歸子。注意:傳統模型的β系數與這里的β系數之間存在關系,在雙變量情形中,這種關系如下:因此,若知道回歸元和回歸子的樣本標準差,則可以將兩個β系數相互轉換。第15頁,共58頁,2024年2月25日,星期天6.4回歸模型的函數形式如第3章指出的,本課程主要考慮對參數為線性的模型,對變量則可以是或不是線性的。在下面的幾節(jié)中,我們考慮一些常用的回歸模型,它們也許對變量是非線性的,但對參數是線性的。或者可通過適當的變量代換而轉變?yōu)閷稻€性。具體討論如下的回歸模型:1.對數線性模型2.半對數線性模型3.倒數模型4.對數倒數模型第16頁,共58頁,2024年2月25日,星期天6.5怎樣測度彈性:對數線性模型考慮以指數回歸模型命名的如下模型:可表達為如果寫成其中,這個模型就是對參數α和β2

為線性,并且對變量Y和X的對數為線性,從而可用OLS回歸來估計。由于這一的線性性質,這種模型本稱為對數-對數(log-log),雙對數(doublelog)或對數線性(log-linear)模型。

(6.5.3)第17頁,共58頁,2024年2月25日,星期天如果經典線性回歸模型的假定均得到滿足,則可用OLS法估計(6.5.3)中的參數。令其中,。所得的OLS估計量和將分別是α和β2

的最優(yōu)線性無偏估計量。對數-對數模型一個使它普通應用的特點,是斜率系數β2

測度了Y對X的彈性,也就是由給定的X的百分比的變化引起的Y的百分比的變化。比如說,Y代表對某一商品的需求量,X代表其單位價格,則β2

測度了需求的價格彈性。如圖:圖6.3(a)給出了需求量與價格的關系,6.3(b)給出了價格彈性(-β2)的估計。第18頁,共58頁,2024年2月25日,星期天圖6.3不變彈性模型第19頁,共58頁,2024年2月25日,星期天對數線性模型的特點1.該模型假定Y與X之間的彈性系數β2在整個研究范圍內保持不變,因此又名不變彈性模型(constantelasticitymodel)。2.雖然和是α和β2

的無偏估計量,但β1

進入原始模型的參數估計本身是一個有篇估計量。然而在大多數實際問題中,截距項都居于次要地位,我們沒有必要為得到一個無偏估計量而發(fā)愁。在雙變量模型中,決定對數線性模型能否擬合好數據的簡單辦法,是描繪出lnY對lnX的散點圖,看是否差不多落在如圖6.3(b)那樣的直線上。第20頁,共58頁,2024年2月25日,星期天例:耐用品支出與個人消費總支出之間的關系表6.3給出了個人消費總支出(personalconsumptionexpenditure,PCEXP)、耐用品支出(expenditureondurablegoods,EXPDUR)、非耐用品支出(expenditureonnondurablegoods,EXPNONDUR)和勞務支出(expenditureonservices,EXPSERVICES)。假設我們想求耐用品支出(EXPDUR)對個人消費支出(PCEXP)的彈性。將耐用品支出的對數相對個人消費支出的對數描點。將看到二者之間存在線性關系。因此,雙對數模型可以適用。第21頁,共58頁,2024年2月25日,星期天運用@定義變量:serieslnexdur=@log(expdur)

serieslnpcex=@log(pcexp)第22頁,共58頁,2024年2月25日,星期天回歸結果如下:其中*表示p值極小。如結果所示,EXDUR對PECX的彈性約為1.90這表明,若個人消費支出提高1%,耐用品支出則提高約為1.9%。因此,耐用品支出很容易受到個人消費支出變動的影響。這就是耐用品生產者總是關注個人收入和個人消費支出變動的原因之一。第23頁,共58頁,2024年2月25日,星期天6.6半對數模型:線性到對數與對數到線性模型經濟學家,企業(yè)人員與政府常常對某些經濟變量,如人口、GNP、貨幣供給、就業(yè)、生產力、貿易赤字等等的增長率感興趣。假設我們相對表6.3中的數據求出個人勞務消費支出的增長率。令Yt

表示t時期對勞務的真實支出,Y0

表示勞務支出的初始值。復利公式:其中r是Y在時間上的復合的增長率。去自然對數,得現假設:則怎樣測量增長率:線性到對數模型第24頁,共58頁,2024年2月25日,星期天加一個干擾項得:此模型和任何其他線性模型一樣,也是對參數為線性的。唯一的區(qū)別,在于回歸子是Y的對數而回歸元是取值為1、2、3等的“時間”。此模型稱為半對數模型(semilogmodel),因為只有一個變量以對數形式出現。為便于敘述,只是回歸子取對數的模型叫做線性到對數模型。區(qū)別之前講的對數線性模型(意為取對數后為線性)。稍后將考慮回歸子是線性而回歸元是對數的模型,稱為對數到線性模型。第25頁,共58頁,2024年2月25日,星期天在此半對數模型中,斜率系數度量了給定回歸元(在本例中為時間變量t)取值的絕對改變時Y的恒定比例或相對改變量,也就是:

(6.6.7)如果將Y的相對該變量乘以100,則(6.6.7)將給出相對于回歸元X的絕對改變量的、Y的百分比變化或增長率。即100乘以β2

給出Y的增長率。100乘以β2

在文獻中被稱為Y對X的半彈性(semielasticity)。回歸子的相對改變量回歸元的絕對改變量第26頁,共58頁,2024年2月25日,星期天例:勞務支出的增長率根據增長模型,考慮表6.3中給出的勞務支出數據,得到回歸結果如下:解釋:1993年第1季度到1998年第3季度期間,勞務支出以(每季度)0.743%的速度增加。粗略的講,這等于2.97%的年增長率。截距項7.7890=研究期初EXS的對數,所以取其反對數則得到EXS期初值(1992年第4季度末)為2413.90(單位為10億美元)。如圖是方程給出的散點圖。第27頁,共58頁,2024年2月25日,星期天圖6.41972-1991年美國實際GDP的增長:半對數模型第28頁,共58頁,2024年2月25日,星期天瞬時與復合增長率。增長模型中的β2

給出瞬時(指一個時點)的增長率而不是復合(指一個時期)增長率。只需取β2

估計值的反對數,再減1,再乘以100%.對于該例,估計的斜率系數為0.00743。因此(antilog(0.00743)-1)=(e^0.00743-1)=0.00746或0.746%。因此,在該例中,勞務支出的復合增長率約為每季度0.746%,略高于0.743%的瞬時增長率。這是由于復合效應所致。第29頁,共58頁,2024年2月25日,星期天線性趨勢模型。有時研究者不去估計增長模型,而估計如下模型:不做lnY對時間的回歸,而是做Y對時間的回歸。該模型稱為線性趨勢模型(lineartrendmodel),并且把時間變量t取名為趨勢變量(trendvariable)。趨勢的意思,是一個變量的行為中一種持續(xù)上升或下降的運動。如果上式中的斜率系數為正,則Y有一種上升趨勢,如果它是負的,則Y有一下降趨勢。第30頁,共58頁,2024年2月25日,星期天考慮勞務支出數據,擬合線性趨勢模型的結果如下:該結果釋義如下:在1993年第1季度至1998年第3季度期間,勞務支出以每季度約200億美元的速度增加。即勞務支出有上漲的趨勢。增長模型與線性趨勢模型之間的取舍,有賴于人們對實際GDP的相對或絕對變化的偏好。盡管對于許多研究目的來說,相對變化更為重要。第31頁,共58頁,2024年2月25日,星期天在增長模型中,我們感興趣的是對X的一個絕對單位的變化,Y的百分比增長?,F在我們感興趣的是對X的一個百分比變化,找出Y的絕對變化量。這一模型可寫為:我們把這一模型稱為對數到線性模型。斜率系數β2

一個數的對數變化就是它的相對變化。對數到線性模型Y的變化lnX的變化Y的變化X的相對變化第32頁,共58頁,2024年2月25日,星期天用符號表示或這個方程即是說Y的絕對變化等于β2

乘以X的相對變化。如果后者乘以100,則該式給出了X變化1%時Y的絕對變化量。例如變化0.01個單位(或1%)時,Y的絕對變量是

。例如β2=500,那么Y的絕對變化量是0.01(500)=5.0因此,當人們用OLS來估計類似的回歸時,要將斜率系數的估計值乘以0.01.第33頁,共58頁,2024年2月25日,星期天例:印度食物支出回歸例3.2有關印度食物支出的例子。若描點則得到圖6.5中的散點圖。第34頁,共58頁,2024年2月25日,星期天恩格爾支出模型——德國統計學家ErnstEngel提出:用于食物的總支出以算術級增加,而總支出以幾何級數增加。如圖所示,食物支出比總支出增加的更緩慢,這可能是恩格爾法則的憑證。將數據擬合到對數線性模型的結果如下:約等于257的斜率系數意味著總支出每提高1%,導致樣本中的55個家庭的食物支出平均增加約2.57盧比(注意:將斜率系數乘以0.01)。注意一旦一個模型的函數形式已知,就可根據該定義計算彈性。彈性第35頁,共58頁,2024年2月25日,星期天6.7倒數模型

屬于以下類型的模型均稱為倒數(reciprocal)模型。

(6.7.1)雖然此模型對變量X是非線性的,但模型對β1

和β2

卻是線性的,因此它是一個線性回歸模型。特點:隨著X無限增大,項趨于零,而Y趨于極限或漸進值β1

。因此像(6.7.1)這樣的模型在結構上有一內在的漸近線或極限值。當變量X值無限增大時因變量將取此極限值。如圖為與(6.7.1)相符的一些可能形狀。第36頁,共58頁,2024年2月25日,星期天圖6.6倒數模型第37頁,共58頁,2024年2月25日,星期天圖6.764個國家中兒童死亡率與人均GNP的關系第38頁,共58頁,2024年2月25日,星期天考慮表6.4中給出的數據,目前主要考慮兒童死亡率(CM)和人均GNP這兩個變量,描出相應的點如上圖。此圖與圖6.6(a)相似:假定所有其他變量保持不變,隨著人均GNP的提高,預計兒童死亡率會因人們能承擔更多的健康醫(yī)療費用而下降。但這種關系不是一條直線:隨著人均GNP的增加,CM首先明顯下降,但隨著人均GNP繼續(xù)增加,CM的下降逐漸減弱。如果我們試圖擬合倒數模型,得到如下回歸結果:(@inv:reciprocal,1/x)隨著人均GNP無限增加,兒童死亡率趨近其漸進值,每千人中死亡82人。(1/PGNP)的正系數意味著CM與PGNP反向變化。第39頁,共58頁,2024年2月25日,星期天圖6.6(b)的重要應用之一,是宏觀經濟學中著名的菲利普斯曲線。如圖6.8表明,工資變化對失業(yè)水平的反應,存在有不對稱性:當失業(yè)率低于自然失業(yè)率(被定義為保持通貨膨脹不變所需要的失業(yè)率)Un

時,由失業(yè)的單位變化引起的工資上升,要快于當失業(yè)率高于自然水平時,由失業(yè)的同樣變化引起的工資下降。而β1

表示工資變化的漸進底線。菲利普斯曲線的這一具體特征可能源于工會的討價還價能力、最低工資規(guī)定、失業(yè)補貼等制度因素。第40頁,共58頁,2024年2月25日,星期天貨幣工資變化率,%自然失業(yè)率失業(yè)率,%第41頁,共58頁,2024年2月25日,星期天菲利普斯曲線幾經演變,一個相對近期的表述由OlivierBlanchard提供。令表示t時期的通貨膨脹率,其定義是價格水平(如消費者價格指數CPI)的百分比變化,令表示t時期的失業(yè)率,則現代版的菲利普斯曲線表述如下:其中=第t年的實際通貨膨脹率=在第(t-1)年對第t年通貨膨脹率的預期=第t年的實際失業(yè)率=第t年的自然失業(yè)率由于不能直接觀測,所以可以簡化假定,即今年的預期通貨膨脹率為去年的通貨膨脹率。第42頁,共58頁,2024年2月25日,星期天將這個假定帶入(6.7.3),并寫成標準形式:其中。該式說明,兩個時期之間通貨膨脹率的變化域當前的失業(yè)率線性相關。據經驗,預計β2

為負,而β1

為正。順帶一提,(6.7.3)中的菲利普斯曲線在文獻中被稱為修正的菲利普斯曲線或加速主義者菲利普斯曲線(表明低失業(yè)率導致通貨膨脹上升,并因而成為價格水平的。加速器)表6.5給出1960-1998年間的通貨膨脹率和失業(yè)率數據,其中通貨膨脹由消費者價格指數的逐年百分比(CPI膨脹)來度量,失業(yè)率指城市失業(yè)率。我們從數據可得通貨膨脹率的變化,并相對城市失業(yè)率描點。Eviews中由差分表示:datainflrate1/inflrate1=D(inflrate)第43頁,共58頁,2024年2月25日,星期天圖6.9修正的菲利普斯曲線第44頁,共58頁,2024年2月25日,星期天通過圖6.9可以看出,恰如所料,通貨膨脹率變化和失業(yè)率之間存在負向關系——低失業(yè)率導致通貨膨脹率的提高,并因此使價格水平加速提升,加速主義者菲利普斯曲線因此得名。從圖中并不能看出是直線回歸模型還是一個倒數回歸模型,我們做如下回歸:線性模型倒數模型這兩個模型的所有估計系數都是個別統計顯著的,所有的p值都低于0.005的水平。第45頁,共58頁,2024年2月25日,星期天模型(6.7.5)表明,若失業(yè)率下降1個百分點,則通貨膨脹率平均上升約0.7個百分點,反之亦然。模型(6.7.6)表明,即便失業(yè)率無限增加,通貨膨脹率的最大變化也只下降約3.25個百分點。從方程(6.7.5)可以計算出其背后的自然失業(yè)率:即自然失業(yè)率為6.06%。經濟學家認為自然失業(yè)率介于5%到6%之間。第46頁,共58頁,2024年2月25日,星期天對數雙曲線或對數倒數模型通過考率如下形式此為對數倒數模型。如圖所示Y首先以遞增的速度增加,然后以遞減的速度增加。這樣的模型可能適合于短期生產函數模型。如果勞動和資本是一個生產函數的投入,而且我們保持資本投入不變但增加勞動投入,則產出與勞動之間的短期關系就類似該圖。第47頁,共58頁,2024年2月25日,星期天6.8函數形式的選擇在雙變量情形中,通過描點就能基本上知道哪個模型合適,但涉及到多元回歸模型時,選擇將困難的多。在對經驗估計選擇適當模型時,需要大量技巧和經驗,但仍有一些指導原則可供參考:1.模型背后的理論(如菲利普斯曲線)可能給出一個特定的函數形式。2.最好能求出回歸子Y相對回歸元X的變化率(即斜率)和回歸子Y對回歸元X的彈性。如表6.6給出了各種模型的斜率和彈性系數公式:第48頁,共58頁,2024年2月25日,星期天表6.6線性對數線性線性到對數對數到線性倒數對數倒數模型方程斜率彈性第49頁,共58頁,2024年2月25日,星期天3.所選模型的系數應該滿足一定的先驗預期。如考慮汽車的需求是價格和其他變量的函數,那我們應該預期價格變量的系數為負。4.有時不止一個模型能不錯的擬合一個給定的數據集。如在修正的菲利普斯曲線一例中,我們對同樣的數據擬合了一個線性模型和一個倒數模型。在兩種情況下,系數都與先驗預期一直,也都是統計上顯著的。一個重要區(qū)別在于,線性模型的r2

值比倒數模型的r2

大。因此人們略微傾向于使用線性模型。但注意,在比較兩個r2

時,兩個模型的因變量必須相同,解釋變量可采用任何形式。5.不應該過分強調r2

這一度量,并非模型的r2

越大越好。下一章會討論,在模型中添加更多的回歸元,r2

會不斷增大。第50頁,共58頁,2024年2月25日,星期天6.9關于隨機誤差項的性質的注記考慮如下回歸模型:這是一個沒有誤差項的模型,為了估計的目的,可把此模型表達成三種不同形式:第51頁,共58頁,2024年2月25日,星期天對這些方程兩邊取對數得:其中像(6.9.2)這樣的模型本質上是線性回歸模型,因為通過適當的變換即可將該模型變成對參數α和β2

是線性的。但模型(6.9.4)本質上對參數非線性,因為ln(A+B)不等于lnA+lnB。沒有對其取對數的簡單方法。雖然(6.9.2)和(6.9.3)同是線性回歸模型,都可用OLS法加以估計,但要記得OLS的BLUE性質要求ui

有零均值、恒定方差和零自相關。還假定ui

是正態(tài)分布的。第52頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論