計(jì)量經(jīng)濟(jì)學(xué)課件:第08講 虛擬變量與模型選擇_第1頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)課件:第08講 虛擬變量與模型選擇_第2頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)課件:第08講 虛擬變量與模型選擇_第3頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)課件:第08講 虛擬變量與模型選擇_第4頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)課件:第08講 虛擬變量與模型選擇_第5頁(yè)
已閱讀5頁(yè),還剩92頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2021-9-28金融與統(tǒng)計(jì)學(xué)院3一、虛擬變量基本含義一、虛擬變量基本含義(dummy variable)虛擬變量又稱虛設(shè)變量、名義變量或啞變量,用以反映質(zhì)的屬性的一個(gè)人工變量,是量化了的質(zhì)變量,通常取值為0或1。引入啞變量可使線形回歸模型變得更復(fù)雜,但對(duì)問(wèn)題描述更簡(jiǎn)明,一個(gè)方程能達(dá)到倆個(gè)方程的作用,而且接近現(xiàn)實(shí)。 現(xiàn)實(shí)的經(jīng)濟(jì)活動(dòng)中,影響應(yīng)變量的因素除可以直接獲得實(shí)際觀測(cè)數(shù)據(jù)的定量變量外,還包括一些定性(屬性)因素。許多經(jīng)濟(jì)變量能夠定量度量,如:商品需求量、價(jià)格、收入、產(chǎn)量等。有一些影響經(jīng)濟(jì)變量的因素?zé)o法定量度量,如:職業(yè)、性別對(duì)收入的影響,戰(zhàn)爭(zhēng)、自然災(zāi)害對(duì)GDP的影響,季節(jié)對(duì)某些產(chǎn)品(如冷飲

2、)銷售的影響等等。為了在模型中反映這些定性因素的影響,提高模型的精度,需要將它們“量化”這種“量化”通常通過(guò)引入“虛擬變量”來(lái)完成。根據(jù)這些因素的屬性類型,構(gòu)造只取“0”或“1”的人工變量虛擬變量(Dummy Variables),記為D。例如,反映文程度的虛擬變量可取為例如,反映文程度的虛擬變量可取為:一般地,在虛擬變量的設(shè)置中:基礎(chǔ)類型、肯定類型取值為1;比較類型,否定類型取值為0。虛擬變量的作用:定性因素定量化非本科本科01D2021-9-28金融與統(tǒng)計(jì)學(xué)院6二、虛擬變量的設(shè)置原則二、虛擬變量的設(shè)置原則每一定性變量所需的虛擬變量個(gè)數(shù)要比該定性變量的類別數(shù)少1,即如果有m個(gè)定性變量,只在模

3、型中引入m-1個(gè)虛擬變量。 例:已知冷飲的銷售量Y除受k種定量變量的影響外,還受春、夏、秋、冬四季變化的影響,要考察該四季的影響,只需引入三個(gè)虛擬變量即可: 則冷飲銷售量的模型為: 在上述模型中,若再引入第四個(gè)虛擬變量 則冷飲銷售模型變量為:其它秋季其它夏季其它春季010101321iiiDDD其它冬季014iDiiiikikiiDDDXXY332211110 此時(shí),引入了四個(gè)虛擬變量,將會(huì)陷入虛擬變量陷阱,產(chǎn)生完全多重共線性問(wèn)題。iiiiikikiiDDDDXXY44332211110不指定其虛擬變量的那一組稱為基組、基準(zhǔn)、控制組、比較組、參照組或者省略組。基準(zhǔn)組的選擇取決于研究者的選擇,或

4、者所研究問(wèn)題的特殊性。所有其它組都與基組進(jìn)行比較。2021-9-28金融與統(tǒng)計(jì)學(xué)院9分離異常因素的影響。分離異常因素的影響。例如分析我國(guó)GDP的時(shí)間序列,必須考慮“文革”因素對(duì)國(guó)民經(jīng)濟(jì)的破壞性影響,剔除不可比的“文革”因素。 檢驗(yàn)不同屬性類型對(duì)因變量的作用。檢驗(yàn)不同屬性類型對(duì)因變量的作用。例如工資模型中的文化程度、季節(jié)對(duì)銷售額的影響。 提高模型的精度。提高模型的精度。相當(dāng)于將不同屬性的樣本合并,擴(kuò)大了樣本容量(增加了誤差自由度,從而降低了誤差方差) 三、虛擬變量的作用三、虛擬變量的作用2021-9-28金融與統(tǒng)計(jì)學(xué)院11加法方式加法方式在所設(shè)定的計(jì)量經(jīng)濟(jì)模型中,根據(jù)問(wèn)題中定性變量的影響作用,按

5、照虛擬變量設(shè)置規(guī)則,直接加入適當(dāng)?shù)奶摂M解釋變量,此時(shí),虛擬解釋變量與其他解釋變量是相加關(guān)系。加法形式引入虛擬解釋變量,作用在于改變模型的截距水平。加法方式引入虛擬解釋變量的基本假設(shè):定性解釋變量對(duì)于應(yīng)變量的影響,僅體現(xiàn)在不同屬性(類型)回歸模型的截距項(xiàng),即僅影響不同屬性模型的平均水平,而不影響不同屬性模型的相對(duì)變化。只有一個(gè)定性解釋變量(方差分析模型);一個(gè)定量解釋變量和一個(gè)兩種屬性定性解釋變量;一個(gè)定量解釋變量和一個(gè)兩種以上屬性定性解釋變量;一個(gè)定量解釋變量和兩個(gè)定性解釋變量的計(jì)量經(jīng)濟(jì)模型。只有一個(gè)定性解釋變量(方差分析模型) 如居民年可支配收入模型: 模型的含義在于,在其他因素不變的條件下

6、,男性與女性的年可支配收入是否存在差別。代表女性。代表男性,為虛擬變量,。為居民的年可支配收入其中,01iiiiiiiDDDYDY)0|() 1|(iiiiiDYEDYE:女性年平均可支配收入:男性年平均可支配收入滿足古典假設(shè)時(shí),有:當(dāng)誤差項(xiàng)。于改變模型的截距水平虛擬解釋變量的作用在,支配收入的部分。因此入不同于女性年平均可支配收則代表了男性年平均可配收入,而系數(shù)支代表了女性的年平均可因而,模型的截距項(xiàng)一個(gè)定量解釋變量和一個(gè)兩種屬性定性解釋變量 如:職工薪資模型 該模型中,假定誤差項(xiàng)滿足古典假設(shè),則女性。代表代表男性,表性別為虛擬解釋變量代代表工作年限,代表職員的年薪水,其中,01210iii

7、iiiiiiDDDXYDXYXDXYEXDXYEiiiiiii10120)0,|()() 1,|(女職員的薪水為:男職員的薪水為:存在顯著差異。員的平均薪金水平是否行檢驗(yàn),以判斷男女職的統(tǒng)計(jì)顯著性進(jìn)驗(yàn)對(duì)可以通過(guò)傳統(tǒng)的回歸檢。的平均薪水水平相差的變化率一樣,但兩者工平均薪水對(duì)工作年限同的截距。即,男女職斜率,但有不,則兩個(gè)函數(shù)有相同的假設(shè)2220 年 薪Y(jié) 男 職 工 女 職 工 工 齡X一個(gè)定量解釋變量和一個(gè)兩種以上屬性定性解釋變量 如,在橫截面數(shù)據(jù)基礎(chǔ)上,考慮個(gè)人保健支出對(duì)個(gè)人收入和教育水平的回歸。教育水平考慮三個(gè)層次:高中以下,高中,大學(xué)及其以上。模型設(shè)定為為虛擬解釋變量。代表個(gè)人收入,代

8、表個(gè)人保健支出,其中,DXYDDXYiiiiiii231210其他大學(xué)及以上其他高中01D01D21iiiiiiiiiXDDXYEXDDXYEXDDXYE13021120211021) 1, 0,|()0, 1,|()0, 0,|(大學(xué)及以上:高中:高中以下:人保健支出函數(shù)為:學(xué)及以上教育水平下個(gè)以下、高中、大滿足古典假設(shè)時(shí),高中隨機(jī)誤差項(xiàng)何意義如圖:,則上述三個(gè)函數(shù)的幾假定23 大學(xué)及以上 保健 高中 支出 高中以下 收入一個(gè)定量解釋變量和兩個(gè)定性解釋變量的計(jì)量經(jīng)濟(jì)模型 如,考慮性別和學(xué)歷的職工薪資模型。本科以下學(xué)歷。,表本科及以上學(xué)歷男性代變量:(表學(xué)歷)為虛擬解釋代表女性;代表男性,量:

9、表性別)為虛擬解釋變(代表工作年限,代表職員的年薪水,其中,0101111231210222iiiiiDDDDDDXYDDXY 于是,不同性別、不同學(xué)歷職工的平均薪金分別為:i32iii3iii2iiiiiX)1D, 1D,X|Y(EX)1D,0D,X|Y(EX)D, 1D,X|Y(EX)D,D,X|Y(E1021102110211021000)(平均薪水:男職工本科以上學(xué)歷的)(平均薪水:女職工本科以上學(xué)歷的)(平均薪水:男職工本科以下學(xué)歷的平均薪水:女職工本科以下學(xué)歷的結(jié)論:通過(guò)對(duì)前述模型進(jìn)行擴(kuò)展,可以推廣到多個(gè)定量解釋變量和多個(gè)定性解釋變量(兩個(gè)或兩個(gè)以上屬性)的情形。2021-9-28

10、金融與統(tǒng)計(jì)學(xué)院21乘法方式乘法方式加法方式引入虛擬變量,考察模型截距的截距的不同。而在不同。而在許多情況下,往往是斜率有變化,或斜率、截距同時(shí)發(fā)生變化或斜率、截距同時(shí)發(fā)生變化。斜率的變化可通過(guò)以乘法的方式引入虛擬斜率的變化可通過(guò)以乘法的方式引入虛擬變量變量:所設(shè)定的計(jì)量經(jīng)濟(jì)模型中,將虛擬解釋變量與其他解釋變量相乘作為新解釋變量,以達(dá)到調(diào)整設(shè)定模型斜率系數(shù)的目的。作用:結(jié)構(gòu)變化檢驗(yàn)、交互效應(yīng)分析、分段線性回歸回歸模型的比較結(jié)構(gòu)變化檢驗(yàn)、鄒至莊檢驗(yàn)(Chow Test)例:研究改革開放前后居民儲(chǔ)蓄收入總量關(guān)系時(shí)(1950-2008),設(shè)定模型:改革開放以后。代表代表改革開放以前,擬解釋變量:為虛代

11、表收入總額,代表儲(chǔ)蓄總額,其中,)()(10*111131210DDDXYXDDXYiiiiii的關(guān)系為:儲(chǔ)蓄和收入滿足古典假設(shè)時(shí),得到當(dāng)隨機(jī)誤差項(xiàng)i后發(fā)生變化。改革開放前收入總量關(guān)系是否在可以判定儲(chǔ)蓄的顯著性,和)中回歸系數(shù)通過(guò)檢驗(yàn)回歸模型(成為斜率差異系數(shù)。成為截距差異系數(shù),其中,)(以前:)()()(以后:323210131201*, 0|, 1|iiiiiiXXDYEXXDYE交互效應(yīng)分析 考慮服裝年支出費(fèi)用模型:代表本科以下學(xué)歷。以上學(xué)歷,代表本科及為虛擬解釋變量:表男性;代代表女性,為虛擬解釋變量:代表年收入,代表服裝年支出費(fèi)用,其中,)(010114321022211iiii21

12、21iDDDDDDXY*XDDDDYiiiiiiiiiiiiiXX,D,D|YEXX,D,D|YEXX,D,D|YEXX,D,D|YE40214102142021432102100011011)(男性本科以下:)()(女性本科以下:)()(男性本科及以上:)()(女性本科及以上:滿足古典假設(shè)時(shí),得到當(dāng)隨機(jī)誤差項(xiàng)效應(yīng)是否存在。性檢驗(yàn),可以判斷交互的顯著釋變量系數(shù)借助于交互效應(yīng)虛擬解的交互效應(yīng)系數(shù)。異系數(shù),成為本科女性服裝年均支出的截距差為本科及以上女性群體數(shù);年均支出的截距差異系為本科及以上群體服裝出的截距差異系數(shù);為女性群體服裝年均支其中:3321 因此,設(shè)定計(jì)量經(jīng)濟(jì)模型時(shí),不能忽視統(tǒng)因此,設(shè)

13、定計(jì)量經(jīng)濟(jì)模型時(shí),不能忽視統(tǒng)計(jì)顯著的交互效應(yīng)變量,否則將會(huì)導(dǎo)致模計(jì)顯著的交互效應(yīng)變量,否則將會(huì)導(dǎo)致模型的設(shè)定偏差。型的設(shè)定偏差。分段線性回歸 如,某公司為了激勵(lì)銷售人員,按其銷售額計(jì)提獎(jiǎng)勵(lì):當(dāng)銷售額在某一目標(biāo)水平以上或以下時(shí),計(jì)提獎(jiǎng)勵(lì)的方法不同。假設(shè):當(dāng)銷售額低于給定的目標(biāo)水平時(shí),計(jì)提的獎(jiǎng)勵(lì)額與銷售額呈線性關(guān)系;當(dāng)銷售額等于或高于目標(biāo)水平時(shí),計(jì)提的獎(jiǎng)勵(lì)額與銷售額呈線性關(guān)系,但線性關(guān)系更陡峭。建立模型為:。時(shí),;時(shí),變量:為虛擬額。為事先確定的目標(biāo)銷售為銷售額,為獎(jiǎng)勵(lì)額度,其中,)()(01*210iiiiiiiiiiiiiiiiDXXDXXDXXYXXDXY*iXXY變”。出是否存在“突界水平

14、就可判斷在所設(shè)定的臨的統(tǒng)計(jì)顯著性,)中(只要利用樣本數(shù)據(jù)檢驗(yàn))()()(:銷售額不低于)(:銷售額低于滿足古典假設(shè)時(shí),有:當(dāng)隨機(jī)誤差項(xiàng)*ii*iiiii*iiiii*iiX*XXY1D,X|YEXXD,X|YEX221201002021-9-28金融與統(tǒng)計(jì)學(xué)院29結(jié) 論如果要描述各種類型模型在截距水平上的差如果要描述各種類型模型在截距水平上的差異,則可用加法方式引入虛擬解釋變量;異,則可用加法方式引入虛擬解釋變量;如果要描述各種類型模型在斜率水平上的差如果要描述各種類型模型在斜率水平上的差異,則可用乘法方式引入虛擬解釋變量。異,則可用乘法方式引入虛擬解釋變量。虛擬解釋變量只是簡(jiǎn)單指出在其它解釋

15、變量虛擬解釋變量只是簡(jiǎn)單指出在其它解釋變量不變時(shí),被解釋變量可能存在的差異,但不不變時(shí),被解釋變量可能存在的差異,但不能給出導(dǎo)致差異存在的原因。能給出導(dǎo)致差異存在的原因。一個(gè)人或者在勞動(dòng)力行列中或者不在,從一個(gè)人或者在勞動(dòng)力行列中或者不在,從而勞動(dòng)力參與這個(gè)應(yīng)變量只能取兩個(gè)值:而勞動(dòng)力參與這個(gè)應(yīng)變量只能取兩個(gè)值:如果這個(gè)人在勞動(dòng)力行列中,則取值如果這個(gè)人在勞動(dòng)力行列中,則取值1 1;如果不在其中則取值如果不在其中則取值0 0??疾鞂W(xué)院教授是不是屬于工會(huì)成員,則工考察學(xué)院教授是不是屬于工會(huì)成員,則工會(huì)會(huì)員資格這個(gè)應(yīng)變量就是一個(gè)取值會(huì)會(huì)員資格這個(gè)應(yīng)變量就是一個(gè)取值0 0或或1 1的虛擬變量:的虛擬

16、變量:0 0表示非工會(huì)會(huì)員,表示非工會(huì)會(huì)員,1 1表示工表示工會(huì)會(huì)員。會(huì)會(huì)員。這些例子的一個(gè)特性是,應(yīng)變量屬于僅這些例子的一個(gè)特性是,應(yīng)變量屬于僅要求回答是或否這樣一種類型;就是說(shuō)要求回答是或否這樣一種類型;就是說(shuō)它是二分類的。處理二分類變量有四種它是二分類的。處理二分類變量有四種模型:模型:線性概率模型(線性概率模型(Linear Probability Linear Probability ModelModel)對(duì)數(shù)單位模型(對(duì)數(shù)單位模型(Logit ModelLogit Model)概率單位模型(概率單位模型(Probit ModelProbit Model)托比單位模型(托比單位模型(

17、Tobit ModelTobit Model)虛擬被解釋變量(響應(yīng)變量)不僅僅局虛擬被解釋變量(響應(yīng)變量)不僅僅局限于是或否的二分類型。限于是或否的二分類型。2021-9-28金融與統(tǒng)計(jì)學(xué)院33一、線性概率模型為了建立概念,構(gòu)造如下模型:該模型把二分變量Y表達(dá)為解釋變量X的函數(shù)。像(*)這樣的模型稱為線性概率模型。表示家庭年收入該家庭不擁有住房該家庭擁有住房其中,iiiiiX01Y(*)XY10因?yàn)椋琘在給定X下的條件期望可解釋為在給定X下事件(家庭擁有住宅)將發(fā)生的條件概率,即(*)X)X|Y(E)(E)X|Y(Piiiiii1001,則有假定模型(*)的條件期望事實(shí)上可解釋為Y的條件概率。

18、條件概率必須落在0與1之間。iiiiiiiiiiiiPX)X|Y(E*)*(*P)P1(P)Y(E0YP1YP10011)兩式,有)和(比較(有則由數(shù)學(xué)期望的定義,概率”(即事件不發(fā)生)的“率”(即事件發(fā)生)的概“令線形概率模型的估計(jì)將會(huì)面臨三個(gè)問(wèn)題:1、誤差項(xiàng)非正態(tài)性;2、誤差項(xiàng)的異方差性;4、可疑的擬合優(yōu)度系數(shù)不成立。、103)X|Y(Eii1 1、誤差項(xiàng)非正態(tài)性、誤差項(xiàng)非正態(tài)性 為了統(tǒng)計(jì)推斷的目的我們假設(shè)誤差項(xiàng)服為了統(tǒng)計(jì)推斷的目的我們假設(shè)誤差項(xiàng)服從正態(tài)分布,但在線性概率模型中誤差項(xiàng)從正態(tài)分布,但在線性概率模型中誤差項(xiàng)干擾的正態(tài)性不成立,而是服從兩點(diǎn)分布。干擾的正態(tài)性不成立,而是服從兩點(diǎn)分

19、布。因?yàn)橐驗(yàn)閕iiiiiiiiXYXYXY101010011時(shí),時(shí),有對(duì)參數(shù)估計(jì)不會(huì)有很大影響,OLS估計(jì)量為無(wú)偏估計(jì)量。隨樣本容量的增大,OLS點(diǎn)估計(jì)量的概率分布趨近于正態(tài)分布。因此,可以直接對(duì)線性概率模型進(jìn)行OLS估計(jì)。2 2、干擾項(xiàng)的異方差性、干擾項(xiàng)的異方差性 (* * * * *)式表明誤差項(xiàng)的方差具有異方)式表明誤差項(xiàng)的方差具有異方差性差性)(則,概率為時(shí),概率為時(shí),*)1 ()(,1011101010iiiiiiiiiiiiiiPPVarPXYPXYXY解決異方差問(wèn)題的一個(gè)方法是進(jìn)行數(shù)據(jù)變解決異方差問(wèn)題的一個(gè)方法是進(jìn)行數(shù)據(jù)變換,將模型(換,將模型(* *)兩邊除以)兩邊除以*)*(

20、*1)1 ()|(1)|(10iiiiiiiiiiiiiiwwXwwYwPPXYEXYE即(* * * * * *)中的誤差項(xiàng)為同方差,但權(quán)數(shù))中的誤差項(xiàng)為同方差,但權(quán)數(shù)w w是未知的。為了估計(jì)是未知的。為了估計(jì)w w,可采用兩步法:,可采用兩步法:模型的參數(shù)?;貧w,得到原線性概率行)做數(shù)據(jù)變換,然后進(jìn)對(duì)(、用;回歸,得到)進(jìn)行、對(duì)(OLS*w 2)Y(Yw OLS*iiii113、 不被滿足0(/)1iiE YX0Y1Y10Y)X|Y(Eiiiii時(shí)取時(shí)取法為:之間。解決辦和不一定在的估計(jì)值114、可疑的擬合優(yōu)度系數(shù)定性響應(yīng)回歸模型中,決定系數(shù)大多位于0.2至0.6之間,僅有少數(shù)情況時(shí)會(huì)比較

21、高。因此:在定性因變量的模型中應(yīng)避免使用決定系數(shù)作為一種摘要統(tǒng)計(jì)量。2021-9-28金融與統(tǒng)計(jì)學(xué)院43線性概率模型在邏輯上不是一個(gè)很有吸引力的模型,因?yàn)樗俣ǎ焊怕蔖是X的線性函數(shù),隨著X的變化,即X對(duì)P的邊際或增補(bǔ)效應(yīng)一直保持不變,而無(wú)論X的變化在何種水平上發(fā)生。這顯然不現(xiàn)實(shí)。因此,需要的是具有如下二分性質(zhì)的模型:二、Logit模型(Logistic regression)概率P隨X變化而變化,但不超出0-1范圍;P和X之間是非線性的,即:隨著X變小,概率P趨于零的速度越來(lái)越慢;隨著X增大,概率P趨于1的速度也越來(lái)越慢。因此,我們將討論滿足這些條件的對(duì)數(shù)單位模型(Logit Model)和

22、概率單位模型(Probit Model)。2021-9-28金融與統(tǒng)計(jì)學(xué)院45解釋住房所有權(quán)對(duì)收入的線性關(guān)系時(shí)的線性概率模型曾是:其中,其中X為收入,而Y1表示家庭擁有住房,但現(xiàn)在考慮如下住房所有權(quán)的表達(dá)式: :其中,iiiiPXXYE10)| 1()(*1111)| 1()(10iiZXiieeXYEPiiXZ102021-9-28金融與統(tǒng)計(jì)學(xué)院46方程(*)代表一個(gè)(累積)邏輯斯蒂分布函數(shù)為名的模型。估計(jì)時(shí),需要將(*)化為線性形式進(jìn)行估計(jì)。)滿足前述的兩點(diǎn)要求因此,方程(只見(jiàn)為非線性關(guān)系。與)且;變化到從,變化到從)隨著該模型中*XP210PX1iiii2021-9-28金融與統(tǒng)計(jì)學(xué)院4

23、7擁有住房的概率為P,則不擁有住房的概率為1-P:)()兩邊取對(duì)數(shù),得()(進(jìn)一步地,*XZPPLnL*eeePPee)X|Y(EPiiiiZZZiiZZiiiiiii1011111111111012021-9-28金融與統(tǒng)計(jì)學(xué)院48(*)中,P/(1-P)稱為機(jī)會(huì)比率,即所研究事件(屬性)“發(fā)生”(或“具有”)與“沒(méi)有發(fā)生”(或“不具有”)的概率之比(一個(gè)家庭將擁有住房的概率對(duì)不擁有住房的概率之比。)(*)中,機(jī)會(huì)比率的對(duì)數(shù)L不僅對(duì)X為線性,而且對(duì)參數(shù)也是線性。L被稱為對(duì)數(shù)單位模型(Logit Model)。2021-9-28金融與統(tǒng)計(jì)學(xué)院49對(duì)數(shù)單位模型的特點(diǎn)概率。,而是擁有住房本身的利于

24、擁有住房的機(jī)會(huì)比不是有水平,我們向估計(jì)的并)對(duì)于給定的某一收入值的大小;時(shí)測(cè)度了當(dāng))截距比如何變化;機(jī)會(huì)利于擁有住房的對(duì)數(shù)著收入變化一單位,有的變化,即隨每單位變化導(dǎo)致的給出)斜率系數(shù)本身并不是;為線性,但概率對(duì))的限制;,不受變到從,變到從)5LX4LX3PXL210L10P0011把對(duì)數(shù)單位模型寫成如下形式:如果對(duì)這個(gè)模型用微觀數(shù)據(jù)或個(gè)體數(shù)據(jù)直接估計(jì)會(huì)遇到一些問(wèn)題,例如當(dāng)P=1或P=0時(shí),L取不到有意義的值,在這種情形下只有用最大似然估計(jì)求解(Eviews、Minitab等軟件有固定的過(guò)程完成)。另外一種估計(jì)方法,當(dāng)我們擁有的數(shù)據(jù)如下表所示時(shí)可以用OLS求解。)(*XZPPLnLiiiii

25、101右表是家庭收入、對(duì)應(yīng)的家庭總數(shù)和擁有住房的家庭數(shù)量表:XNn6408850121060181380281510045207036256539305033354030402520根據(jù)上表計(jì)算出對(duì)應(yīng)每個(gè)收入水平,擁有住房的概率值根據(jù)估計(jì)的P可以得到估計(jì)的對(duì)數(shù)單位線性模型。iiiNnP)(*XPPLnLiiii101不能用OLS直接估計(jì)(*),因?yàn)殡S機(jī)誤差項(xiàng)的性質(zhì)還沒(méi)考慮。隨機(jī)誤差項(xiàng)的滿足如下分布:模型存在異方差。考慮使用加權(quán)最小二乘法,權(quán)重為:)P(PN,Niiii11021iiiiiii)P(PN,PP112得到:代替用2021-9-28金融與統(tǒng)計(jì)學(xué)院54估計(jì)對(duì)數(shù)單位模型的步驟:1 1、對(duì)

26、每一收入水平,計(jì)算擁有住房的概率、對(duì)每一收入水平,計(jì)算擁有住房的概率。2 2、求每一的對(duì)數(shù)單位、求每一的對(duì)數(shù)單位3 3、作如下變換、作如下變換消除異方差,其中。消除異方差,其中。4 4、OLSOLS估計(jì)上式。估計(jì)上式。5 5、按普通最小二乘法建立置信區(qū)間和假設(shè)檢驗(yàn)。、按普通最小二乘法建立置信區(qū)間和假設(shè)檢驗(yàn)。iXiiiPn N12iiiiiiiw Lww Xw ulniL /(1iP)iPiXiiiwN P(1)iP2021-9-28金融與統(tǒng)計(jì)學(xué)院55三、Probit模型為了解釋二分應(yīng)變量,有必要使用適當(dāng)CDF。對(duì)數(shù)單位模型使用的是累積邏輯斯蒂函數(shù),實(shí)際應(yīng)用中發(fā)現(xiàn)正態(tài)CDF效果也不錯(cuò)。使用正態(tài)C

27、DF的估計(jì)模型通常稱為概率單位模型。引入概率單位模型有兩種途徑:一是模仿前面邏輯斯蒂函數(shù)的形式,直接用正態(tài)分布函數(shù)替換;二是依據(jù)麥克法登(2000年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng))的效用理論或行為的理性選擇引入概率單位模型。2021-9-28金融與統(tǒng)計(jì)學(xué)院56下面根據(jù)效用理論或行為的合理性來(lái)闡明使用概率單位模型的動(dòng)機(jī)。I表示一種不可觀測(cè)的效用指數(shù),X表示收入,仍然研究家庭擁有住房的概率。則不可觀測(cè)的效用函數(shù)表示為:當(dāng)效用指數(shù)I越大時(shí),家庭擁有住房的概率越大。)(*XIiii10假定:),(Nt*dtedte)I(F)II(P)Y(PPIIIIIIiiXtItii*ii*i*i*i*i10212

28、11102222其中,)(的概率為:即件下,家庭擁有住房,服從正態(tài)分布的假定條在住房。有住房;否則,不擁有時(shí),該家庭擁,當(dāng)界值存在一個(gè)效用指數(shù)的臨( )iiPF I12iiIX1iP*Pr()iiII( )iiPF I1( )iiIFP1iP(a)(b)根據(jù)(*)可以得到:。和估計(jì)出,然后采用計(jì)算出由后的調(diào)查數(shù)據(jù),便可以如果我們有經(jīng)過(guò)分組以101011OLSIPX)P(F)I(FIiiiiii概率單位模型的估計(jì)步驟:無(wú)多大價(jià)值。樣本下有效,同時(shí),在大檢驗(yàn),但得到的結(jié)果只)用普通方式進(jìn)行假設(shè);和估計(jì)出最后結(jié)果數(shù)據(jù)轉(zhuǎn)換或用要進(jìn)行存在異方差性,因而需)由于隨機(jī)誤差項(xiàng)作為應(yīng)變量的觀測(cè)值;)用;表中得到

29、,從標(biāo)準(zhǔn)正態(tài)分布函數(shù))根據(jù);從分組數(shù)據(jù)中計(jì)算出21R5WLS4I3IP2P)i0iiiii2021-9-28金融與統(tǒng)計(jì)學(xué)院61對(duì)數(shù)單位模型與概率單位模型比較對(duì)數(shù)單位模型與概率單位模型比較雖然對(duì)數(shù)單位模型和概率單位模型給出性質(zhì)相同的結(jié)果,但是兩個(gè)模型參數(shù)的估計(jì)值不可直接比較。一般兩者參數(shù)有如下關(guān)系:LPM的系數(shù)與對(duì)數(shù)單位模型的系數(shù)有如下關(guān)系:probititlog.6250含有截距項(xiàng)不含截距項(xiàng)25. 0.itlogLPMitlogLPM2502502021-9-28金融與統(tǒng)計(jì)學(xué)院62實(shí)際應(yīng)用中,大多選用Logit模型(對(duì)數(shù)單位模型)。2021-9-28金融與統(tǒng)計(jì)學(xué)院63四、Tobit Model

30、(Tobins probit)Tobit模型是Probit模型的拓展Tobit是經(jīng)濟(jì)學(xué)家、1981年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者J托賓(James. Tobin) 1958年在研究耐用消費(fèi)品需求時(shí)首先提出的一個(gè)經(jīng)濟(jì)計(jì)量學(xué)模型。Tobit模型的一個(gè)重要特征是,解釋變量Xi 是可觀測(cè)的(即Xi 取實(shí)際觀測(cè)值),而被解釋變量Yi只能以受限制的方式被觀測(cè)到, 即觀察到的Yi 取值被限制在一定范圍內(nèi), 具體來(lái)講“無(wú)限制”觀測(cè)值均取實(shí)際的觀測(cè)值,“受限”觀測(cè)值均截取為某一特定值。2021-9-28金融與統(tǒng)計(jì)學(xué)院65測(cè)量誤差測(cè)量誤差應(yīng)變量存在觀測(cè)誤差應(yīng)變量存在觀測(cè)誤差自變量存在觀測(cè)誤差自變量存在觀測(cè)誤差參數(shù)估計(jì)值是

31、無(wú)偏的,但非有效出現(xiàn)隨機(jī)解釋變量。參數(shù)估計(jì)有偏、非有效、非一致。2021-9-28金融與統(tǒng)計(jì)學(xué)院66一、應(yīng)變量中的觀測(cè)誤差11101010)(E*XXY*YYYYXY*XYiiiiiiii*iii*ii*iii*i典假設(shè),有由于隨機(jī)誤差項(xiàng)滿足經(jīng))()()()變成于是,原模型(代替:觀測(cè)變量不可直接觀察,可利用由于表示當(dāng)前收入。表示永久性消費(fèi)支出,其中)(對(duì)模型:2021-9-28金融與統(tǒng)計(jì)學(xué)院67因此,雖然應(yīng)變量中的測(cè)量誤差不影響參數(shù)估計(jì)及其方差的無(wú)偏性,但這時(shí)所估計(jì)的方差,要大于沒(méi)有測(cè)量誤差時(shí)的方差。22222i1i11x)(Var*x)(Var*)中:模型()中:模型(的方差也不相同:差不

32、同,但由于兩個(gè)模型的標(biāo)準(zhǔn)2021-9-28金融與統(tǒng)計(jì)學(xué)院68二、解釋變量X中的觀測(cè)誤差)()()()變?yōu)椋簞t模型(代替:不可觀測(cè),因而用由于表示永久收入。表示當(dāng)前消費(fèi)支出,其中,)(假定模型是:*zXwXwXY*wXXXXXY*XYiiiiiiiiii*iii*i*iii*ii1011010102021-9-28金融與統(tǒng)計(jì)學(xué)院69去意義。將使得對(duì)參數(shù)的估計(jì)失相關(guān)的后果極其嚴(yán)重,與)()()(),()()()()(不相關(guān),因?yàn)椋号c假定不相關(guān)。但不能且與為零均值、序列獨(dú)立,假定iiwiiiiiiiiiiiiiiiiiiXzwwEXEXEzEzEXzCovwEzEE,wEXzw00002111202

33、1-9-28金融與統(tǒng)計(jì)學(xué)院70進(jìn)一步討論發(fā)現(xiàn)因此,當(dāng)測(cè)量誤差出現(xiàn)在解釋變量中時(shí),參數(shù)的一致性估計(jì)成為不可能。都是有偏估計(jì)。即使樣本容量再大,1221111limpXw2021-9-28金融與統(tǒng)計(jì)學(xué)院71三、測(cè)量誤差存在性的檢驗(yàn)豪斯曼檢驗(yàn)(Hausman Test):先對(duì)原方程進(jìn)行回歸,討論分析;當(dāng)懷疑某一自變量X有測(cè)量誤差時(shí),找出該變量的工具變量Z,將該自變量關(guān)于其工具變量回歸,求出其殘差序列( sed_X );將該殘差變量加入原回歸模型的自變量中,重新做回歸,對(duì)殘差變量sed_X的系數(shù)進(jìn)行t檢驗(yàn);原假設(shè)為H0:X不存在測(cè)量誤差,作出X有無(wú)測(cè)量誤差的判斷。2021-9-28金融與統(tǒng)計(jì)學(xué)院73一

34、、計(jì)量經(jīng)濟(jì)建模的傳統(tǒng)觀點(diǎn)被稱為平均經(jīng)濟(jì)回歸(AER)建模思想是:從含有一定個(gè)數(shù)的回歸元的一個(gè)模型開始,經(jīng)過(guò)診斷,然后把越來(lái)越多的變量加到模型中來(lái)。(從簡(jiǎn)單到復(fù)雜)韓德瑞(D.F.Hendry)的建模思想是由一般到簡(jiǎn)單,即由盡可能多變量進(jìn)行約化,直到最后幾個(gè)能通過(guò)檢驗(yàn)的變量。(從一般到簡(jiǎn)單)2021-9-28金融與統(tǒng)計(jì)學(xué)院74好模型的判斷標(biāo)準(zhǔn)(AER方法):節(jié)省性;以實(shí)用為標(biāo)準(zhǔn),模型盡可能簡(jiǎn)單節(jié)省性;以實(shí)用為標(biāo)準(zhǔn),模型盡可能簡(jiǎn)單識(shí)別性;識(shí)別性;同一參數(shù)必須有一個(gè)確定的估計(jì)值同一參數(shù)必須有一個(gè)確定的估計(jì)值擬合優(yōu)度;擬合優(yōu)度;擬合優(yōu)度是評(píng)價(jià)模型好壞的標(biāo)準(zhǔn)之一擬合優(yōu)度是評(píng)價(jià)模型好壞的標(biāo)準(zhǔn)之一理論一致性

35、;正確的系數(shù)符號(hào),以保證模型能給出理論一致性;正確的系數(shù)符號(hào),以保證模型能給出合理的經(jīng)濟(jì)意義上的解釋。合理的經(jīng)濟(jì)意義上的解釋。預(yù)測(cè)功效。預(yù)測(cè)是計(jì)量經(jīng)濟(jì)模型一個(gè)很重要的功能預(yù)測(cè)功效。預(yù)測(cè)是計(jì)量經(jīng)濟(jì)模型一個(gè)很重要的功能。2021-9-28金融與統(tǒng)計(jì)學(xué)院75二、設(shè)定誤差的類型漏掉相關(guān)變量包含無(wú)關(guān)變量錯(cuò)誤的函數(shù)形式2021-9-28金融與統(tǒng)計(jì)學(xué)院764i4iii4i4iiiiiiiiiiiiiiiiXvvXXXXYXvvXXYXXXY此時(shí)的誤差項(xiàng))包含無(wú)關(guān)變量:此時(shí)的誤差項(xiàng))漏掉相關(guān)變量。假設(shè)真實(shí)的函數(shù)為:以立方總成本函數(shù)為例332210332210332210212021-9-28金融與統(tǒng)計(jì)學(xué)院77

36、iiiiiXXXYln3332210)錯(cuò)誤的函數(shù)形式:2021-9-28金融與統(tǒng)計(jì)學(xué)院78三、設(shè)定誤差的后果漏掉相關(guān)變量包含無(wú)關(guān)變量2021-9-28金融與統(tǒng)計(jì)學(xué)院79漏掉相關(guān)變量110010102110222110)(、)(本容量多大,都有:非一致估計(jì)。即無(wú)論樣的有偏、是、相關(guān),則與)如果(則其后果為:而用如下模型擬合:掉但實(shí)際研究過(guò)程中,漏假設(shè)真實(shí)模型是:EEXX1vXYXXXY1iiiiiii2021-9-28金融與統(tǒng)計(jì)學(xué)院80檢驗(yàn)失效。正確結(jié)論,即估計(jì)量的檢驗(yàn)無(wú)法得到法正確估計(jì),導(dǎo)致參數(shù))隨機(jī)誤差項(xiàng)的方差無(wú)(方差的有偏估計(jì);的方差是)(仍然是有偏的;不相關(guān),此時(shí)與)即使(t43XX21

37、10212021-9-28金融與統(tǒng)計(jì)學(xué)院81包含無(wú)關(guān)變量不是有效估計(jì)量;)(的無(wú)偏的;、是、估計(jì)量)參數(shù)的(則其后果為:而用如下模型擬合:加一個(gè)無(wú)關(guān)的解釋變量但實(shí)際研究過(guò)程中,增假設(shè)真實(shí)模型是:110102211021102OLS1vXXYXXYiiiiiii2021-9-28金融與統(tǒng)計(jì)學(xué)院82兩種設(shè)定誤差的后果比較遺漏有關(guān)變量。遺漏有關(guān)變量。參數(shù)估計(jì)量有偏非一致,參數(shù)估計(jì)量有偏非一致,隨機(jī)誤差項(xiàng)的方差估計(jì)亦不正確,致使區(qū)隨機(jī)誤差項(xiàng)的方差估計(jì)亦不正確,致使區(qū)間估計(jì)和假設(shè)檢驗(yàn)都得不到正確的結(jié)論。間估計(jì)和假設(shè)檢驗(yàn)都得不到正確的結(jié)論。包含無(wú)關(guān)變量。包含無(wú)關(guān)變量。參數(shù)估計(jì)量無(wú)偏且一致,參數(shù)估計(jì)量無(wú)偏且

38、一致,隨機(jī)誤差項(xiàng)的方差估計(jì)量為非有效的估計(jì)隨機(jī)誤差項(xiàng)的方差估計(jì)量為非有效的估計(jì)量,參數(shù)的統(tǒng)計(jì)推斷精度降低。量,參數(shù)的統(tǒng)計(jì)推斷精度降低。因此,不能簡(jiǎn)單認(rèn)為與其略掉有關(guān)變量不因此,不能簡(jiǎn)單認(rèn)為與其略掉有關(guān)變量不如含有無(wú)關(guān)變量。如含有無(wú)關(guān)變量。2021-9-28金融與統(tǒng)計(jì)學(xué)院83四、設(shè)定誤差的檢驗(yàn)對(duì)多余變量的偵查名義與真實(shí)的顯著水平對(duì)遺漏變量和不正確的函數(shù)形式的檢驗(yàn)2021-9-28金融與統(tǒng)計(jì)學(xué)院84偵查多余變量依據(jù)。的取舍是否有理論上的些變量在模型中,而不考慮這型之外,顯著的就包含除在模驗(yàn)不顯著的變量都被排這樣意味著凡是參數(shù)檢檢驗(yàn)來(lái)建立模型。因?yàn)楹陀玫?,切記不可反?fù)使檢驗(yàn)。是否成立,可使用驗(yàn)是否

39、應(yīng)屬于模型,即檢和)要檢驗(yàn)的顯著性;)檢驗(yàn)檢驗(yàn)(接用是否應(yīng)屬于模型,可直)要檢驗(yàn)?zāi)硞€(gè)變量對(duì)于模型:FtFXX2)(setX1XXXYhkhkkkkkiiiii033221102021-9-28金融與統(tǒng)計(jì)學(xué)院85對(duì)遺漏變量和不正確函數(shù)形式的檢驗(yàn)的殘差圖為:則使用如下數(shù)據(jù),得到)(或者用線性函數(shù)擬合:)(如果用二次函數(shù)擬合:)(的總成本函數(shù)為:、殘差分析:假設(shè)真實(shí)aXYbXXYcXXXYiiiiiiiiiiii10221033221012021-9-28金融與統(tǒng)計(jì)學(xué)院86產(chǎn)出Y總成本X119322263240424452576260727482979350104202021-9-28金融與統(tǒng)計(jì)學(xué)院87圖形表明,如果模型遺漏了相關(guān)變量或者設(shè)定了錯(cuò)誤的函數(shù)形式,則其殘差圖必定會(huì)呈現(xiàn)明顯的樣式。2021-9-28金融與統(tǒng)計(jì)學(xué)院882、DW檢驗(yàn)從假定的模型求得從假定的模型求得OLS殘差;殘差;如果認(rèn)為假定模型中遺漏了自變量(如果認(rèn)為假定模型中遺漏了自變量(Z),則將殘則將殘差按差按Z遞增排列;遞增排列;從這樣排列的殘差計(jì)算從這樣排列的殘差計(jì)算d統(tǒng)計(jì)量;統(tǒng)計(jì)量;查查DW表:如果表:如果d值顯著,即可接受模型誤設(shè)的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論