微觀計量經(jīng)濟(jì)學(xué)模型課件_第1頁
微觀計量經(jīng)濟(jì)學(xué)模型課件_第2頁
微觀計量經(jīng)濟(jì)學(xué)模型課件_第3頁
微觀計量經(jīng)濟(jì)學(xué)模型課件_第4頁
微觀計量經(jīng)濟(jì)學(xué)模型課件_第5頁
已閱讀5頁,還剩156頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第五講 微觀計量經(jīng)濟(jì)學(xué)模型Microeconometric Models本講內(nèi)容1 二元離散選擇模型2 多元離散選擇模型3 計數(shù)數(shù)據(jù)模型4 選擇性樣本模型5 持續(xù)時間數(shù)據(jù)模型1 離散被解釋變量數(shù)據(jù)計量經(jīng)濟(jì)學(xué)模型二元選擇模型 Models with Discrete Dependent VariablesBinary Choice Model一、二元離散選擇模型的經(jīng)濟(jì)背景 二、二元離散選擇模型 三、二元Probit離散選擇模型及其參數(shù)估計 四、二元Logit離散選擇模型及其參數(shù)估計離散選擇模型起源于Fechner于1860年進(jìn)行的動物條件二元反射研究。1962年,Warner首次將它應(yīng)用于經(jīng)濟(jì)研

2、究領(lǐng)域,用以研究公共交通工具和私人交通工具的選擇問題。70、80年代,離散選擇模型被普遍應(yīng)用于經(jīng)濟(jì)布局、企業(yè)定點(diǎn)、交通問題、就業(yè)問題、購買決策等經(jīng)濟(jì)決策領(lǐng)域的研究。模型的估計方法主要發(fā)展于80年代初期。一、二元離散選擇模型的經(jīng)濟(jì)背景實(shí)際經(jīng)濟(jì)生活中的二元選擇問題研究選擇結(jié)果與影響因素之間的關(guān)系。影響因素包括兩部分:決策者的屬性和備選方案的屬性。對于單個方案的取舍。例如,購買者對某種商品的購買決策問題 ,求職者對某種職業(yè)的選擇問題,投票人對某候選人的投票決策,銀行對某客戶的貸款決策。由決策者的屬性決定。對于兩個方案的選擇。例如,兩種出行方式的選擇,兩種商品的選擇。由決策者的屬性和備選方案的屬性共同

3、決定。二、二元離散選擇模型1、原始模型對于二元選擇問題,可以建立如下計量經(jīng)濟(jì)學(xué)模型。其中Y為觀測值為1和0的決策被解釋變量;X為解釋變量,包括選擇對象所具有的屬性和選擇主體所具有的屬性。 左右端矛盾由于存在這兩方面的問題,所以原始模型不能作為實(shí)際研究二元選擇問題的模型。需要將原始模型變換為效用模型。這是離散選擇模型的關(guān)鍵。 具有異方差性 2、效用模型 作為研究對象的二元選擇模型第i個個體 選擇1的效用第i個個體 選擇0的效用注意,在模型中,效用是不可觀測的,人們能夠得到的觀測值仍然是選擇結(jié)果,即1和0。很顯然,如果不可觀測的U1U0,即對應(yīng)于觀測值為1,因?yàn)樵搨€體選擇公共交通工具的效用大于選擇

4、私人交通工具的效用,他當(dāng)然要選擇公共交通工具;相反,如果不可觀測的U1U0,即對應(yīng)于觀測值為0,因?yàn)樵搨€體選擇公共交通工具的效用小于選擇私人交通工具的效用,他當(dāng)然要選擇私人交通工具。3、最大似然估計 欲使得效用模型可以估計,就必須為隨機(jī)誤差項(xiàng)選擇一種特定的概率分布。兩種最常用的分布是標(biāo)準(zhǔn)正態(tài)分布和邏輯(logistic)分布,于是形成了兩種最常用的二元選擇模型Probit模型和Logit模型。最大似然函數(shù)及其估計過程如下:標(biāo)準(zhǔn)正態(tài)分布或邏輯分布的對稱性似然函數(shù) 在樣本數(shù)據(jù)的支持下,如果知道概率分布函數(shù)和概率密度函數(shù),求解該方程組,可以得到模型參數(shù)估計量。 1階極值條件三、二元Probit離散選

5、擇模型及其參數(shù)估計1、標(biāo)準(zhǔn)正態(tài)分布的概率分布函數(shù) 2、重復(fù)觀測值不可以得到情況下二元Probit離散選擇模型的參數(shù)估計 關(guān)于參數(shù)的非線性函數(shù),不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。應(yīng)用計量經(jīng)濟(jì)學(xué)軟件。這里所謂“重復(fù)觀測值不可以得到”,是指對每個決策者只有一個觀測值。如果有多個觀測值,也將其看成為多個不同的決策者。 例 貸款決策模型分析與建模:某商業(yè)銀行從歷史貸款客戶中隨機(jī)抽取78個樣本,根據(jù)設(shè)計的指標(biāo)體系分別計算它們的“商業(yè)信用支持度”(CC)和“市場競爭地位等級”(CM),對它們貸款的結(jié)果(JG)采用二元離散變量,1表示貸款成功,0表示貸款失敗。目的是研究JG與CC、CM

6、之間的關(guān)系,并為正確貸款決策提供支持。樣本觀測值CC=XYCM=SC該方程表示,當(dāng)CC和CM已知時,代入方程,可以計算貸款成功的概率JGF。例如,將表中第19個樣本觀測值CC=15、CM=1代入方程右邊,計算括號內(nèi)的值為0.1326552;查標(biāo)準(zhǔn)正態(tài)分布表,對應(yīng)于0.1326552的累積正態(tài)分布為0.5517;于是,JG的預(yù)測值JGF=10.5517=0.4483,即對應(yīng)于該客戶,貸款成功的概率為0.4483。輸出的估計結(jié)果模擬預(yù)測預(yù)測:如果有一個新客戶,根據(jù)客戶資料,計算的“商業(yè)信用支持度”(XY)和“市場競爭地位等級”(SC),代入模型,就可以得到貸款成功的概率,以此決定是否給予貸款。3、

7、重復(fù)觀測值可以得到情況下二元Probit離散選擇模型的參數(shù)估計 思路對每個決策者有多個重復(fù)(例如10次左右)觀測值。對第i個決策者重復(fù)觀測ni次,選擇yi=1的次數(shù)比例為pi,那么可以將pi作為真實(shí)概率Pi的一個估計量。建立 “概率單位模型” ,采用廣義最小二乘法估計 。實(shí)際中并不常用。對第i個決策者重復(fù)觀測n次,選擇yi=1的次數(shù)比例為pi,那么可以將pi作為真實(shí)概率Pi的一個估計量。 定義“觀測到的”概率單位 V的觀測值通過求解標(biāo)準(zhǔn)正態(tài)分布的概率分布函數(shù)的反函數(shù)得到 實(shí)際觀測得到的 四、二元Logit離散選擇模型及其參數(shù)估計1、邏輯分布的概率分布函數(shù) Brsch-Supan于1987年指出

8、: 如果選擇是按照效用最大化而進(jìn)行的,具有極限值的邏輯分布是較好的選擇,這種情況下的二元選擇模型應(yīng)該采用Logit模型。 2、重復(fù)觀測值不可以得到情況下二元logit離散選擇模型的參數(shù)估計 關(guān)于參數(shù)的非線性函數(shù),不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。應(yīng)用計量經(jīng)濟(jì)學(xué)軟件。 Probit0.9999991.0000000.4472330.0000003、重復(fù)觀測值可以得到情況下二元logit離散選擇模型的參數(shù)估計思路對每個決策者有多個重復(fù)(例如10次左右)觀測值。對第i個決策者重復(fù)觀測ni次,選擇yi=1的次數(shù)比例為pi,那么可以將pi作為真實(shí)概率Pi的一個估計量。建立“對數(shù)成

9、敗比例模型” ,采用廣義最小二乘法估計 。實(shí)際中并不常用。用樣本重復(fù)觀測得到的pi構(gòu)成“成敗比例”,取對數(shù)并進(jìn)行臺勞展開,有 邏輯分布的概率分布函數(shù) 2 離散被解釋變量數(shù)據(jù)計量經(jīng)濟(jì)學(xué)模型 多元選擇模型 Models with Discrete Dependent VariablesMultiple Choice Model一、多元離散選擇模型的經(jīng)濟(jì)背景 二、一般多元離散選擇Logit模型三、嵌套多元離散選擇模型四、排序多元離散選擇模型一、多元離散選擇模型的經(jīng)濟(jì)背景1、經(jīng)濟(jì)生活中的多元選擇問題一般的多元選擇問題 排序選擇問題將選擇對象按照某個準(zhǔn)則排隊,由決策者從中選擇。決策者對同一個選擇對象的偏

10、好程度。嵌套選擇問題2、社會生活中的多元選擇問題一般的多元選擇問題 出行方式選擇、職業(yè)選擇、無預(yù)算約束的購買選擇、無約束的遷移選擇排序選擇問題有預(yù)算約束的購買選擇、有約束的遷移選擇嵌套選擇問題家電購買選擇、選舉問題二、一般多元離散選擇Logit模型說明在多元離散選擇模型中,因?yàn)镻robit模型需要對多元正態(tài)分布的整體進(jìn)行評價,所以它的應(yīng)用受到限制。邏輯分布更適合于效用最大化時的分布選擇,所以應(yīng)用最多的多元離散選擇模型是Logit模型。Logit模型的似然函數(shù)能夠快速可靠地收斂,當(dāng)方案或者決策個體數(shù)量較大時,計算比較簡便。 一般多元選擇Logit模型的思路 如果決策者i在(J+1)項(xiàng)可供選擇方案

11、中選擇了第j項(xiàng),那么其效用模型為: 如果(J+1)個隨機(jī)誤差項(xiàng)互不相關(guān),并且服從類極值分布 選擇j的概率效用模型的解釋變量中包括所有影響選擇的因素,既包括決策者所具有的屬性,也包括備選方案所具有的屬性。備選方案所具有的屬性是隨著方案的變化而變化的。決策者所具有的屬性中一部分是隨著方案的變化而變化的,而一部分是不隨著方案的變化而變化的。用Zij表示隨著方案的變化而變化的那部分解釋變量,Wi表示不隨著方案的變化而變化的那部分解釋變量。 實(shí)用的一般多元Logit選擇模型又分3種情況。一是研究選擇某種方案的概率與決策者的特征變量之間的關(guān)系;二是研究選擇某種方案的概率與決策者的特征變量以及方案的特征變量

12、之間的關(guān)系;三是考慮到不同方案之間的相關(guān)性的情況。 Multinomial Logit Model多項(xiàng)式Logit模型名義Logit模型Conditional Logit Model 條件Logit模型 Nested Logit模型嵌套模型 多元名義Logit離散選擇模型及其參數(shù)估計 X中未包含備選方案所具有的屬性變量,而參數(shù)向量B對不同的選擇方案(即不同的方程)是不同的。 令B0=0,j=1,2,J 由對數(shù)似然函數(shù)最大化的一階條件,利用Newton 迭代方法可以迅速地得到方程組的解,得到模型的參數(shù)估計量。 另一種估計方法可以計算得到相對于基準(zhǔn)方案的對數(shù)概率比為: 兩點(diǎn)注意: 假設(shè)了原模型中(

13、J+1)個隨機(jī)誤差項(xiàng)互不相關(guān)。 對估計結(jié)果的解釋不同。如果對每個決策者進(jìn)行重復(fù)觀測,可以得到被解釋變量的觀測值。如果對每個決策者只進(jìn)行一次觀測,如何得到被解釋變量的觀測值?多元條件Logit離散選擇模型及其參數(shù)估計 選擇某種方案的概率不僅與決策者的特征變量有關(guān),而且也與方案的特征變量有關(guān),模型為: 區(qū)別在于X的下標(biāo)由對數(shù)似然函數(shù)最大化的一階條件,利用Newton 迭代方法可以迅速地得到方程組的解,得到模型的參數(shù)估計量。三、嵌套多元離散選擇模型1、問題的提出(J+1)個不同的選擇方案之間具有相關(guān)性,而且必須考慮這種相關(guān)性,表現(xiàn)為模型隨機(jī)誤差項(xiàng)相關(guān)??尚械乃悸肥菍ⅲ↗+1)個選擇方案分為L組,在每

14、組內(nèi)部的選擇方案之間不具有相關(guān)性,而組間則具有相關(guān)性。就是將條件Logit模型中隱含的齊次方差性條件放松,允許方差在組間可以不同,但在組內(nèi)仍然是同方差的。這樣的模型被稱為Nested Logit模型。 1、Nested Logit模型表示對選擇第l組產(chǎn)生影響的變量 表示在第l組內(nèi)對選擇第j種方案產(chǎn)生影響的變量定義第l組的“內(nèi)值”(Inclusive Value) 3、估計方法兩階段最大似然法,是一種有限信息估計方法。其具體步驟是:在組內(nèi),作為一個簡單的條件Logit模型,估計參數(shù);計算每組的“內(nèi)值”;將每組看成是一種選擇方案,再進(jìn)行簡單的條件Logit模型的估計,得到參數(shù)和T的估計量。此時用到

15、的貢獻(xiàn)變量是Zl和Il。完全信息最大似然法。將對數(shù)似然函數(shù)寫為: 比兩階段最大似然法更有效四、排序多元離散選擇模型Multivariate Choice Modelfor Ordered Dada1、問題的提出作為被解釋變量的(J+1)個選擇結(jié)果本身是排序的,J優(yōu)于(J1),2優(yōu)于1,1優(yōu)于0。決策者選擇不同的方案所得到的效用也是排序的。一般多元離散選擇模型中的效用關(guān)系不再適用。 2、效用關(guān)系選擇不同方案的效用關(guān)系:3、模型為了保證所有的概率都是正的,必須有 :假定服從正態(tài)分布,并且標(biāo)準(zhǔn)化為服從期望為0、方差為1的正態(tài)分布。那么可以得到選擇各個方案的概率 為正態(tài)分布的概率函數(shù)4、估計可以看作二

16、元Probit模型的推廣;采用最大似然法估計。3 離散計數(shù)數(shù)據(jù)模型(Models For Count Data) 一、問題的提出 二、泊松回歸模型 三、泊松回歸模型的擴(kuò)展一、問題的提出1、經(jīng)濟(jì)、社會活動中的計數(shù)數(shù)據(jù)問題發(fā)生事故次數(shù)的影響因素分析更換工作次數(shù)的影響因素分析婚姻問題研究2、計量模型中的計數(shù)數(shù)據(jù)問題通常計數(shù)數(shù)據(jù)模型的形式可以表示如下: 其中N代表被解釋變量,通常為正整數(shù),N和X之間的關(guān)系由經(jīng)濟(jì)理論決定。 該模型假定,通過調(diào)查能夠得到一組代表被解釋變量的數(shù)字(如0,1,2,3)以及相應(yīng)的解釋變量的觀察值。 建立模型的目的主要有兩點(diǎn):檢驗(yàn)從數(shù)據(jù)中可以觀察到的行為模式是否與理論預(yù)期相符;將

17、N和X之間的內(nèi)在聯(lián)系用數(shù)量化的方式表現(xiàn)出來。從理論上講,多元線性方程的參數(shù)估計方法也可以被應(yīng)用來分析計數(shù)數(shù)據(jù)模型問題。但是很容易發(fā)現(xiàn),計數(shù)數(shù)據(jù)中零元素和絕對值較小的數(shù)據(jù)出現(xiàn)得較為頻繁,而且離散特征十分明顯,利用這些特點(diǎn),可以找到更合適的估計方法。 七十年代末以來,許多學(xué)者在計數(shù)數(shù)據(jù)模型的處理方法方面作出了較大貢獻(xiàn),包括:Gilbert(1979)提出了泊松回歸模型,Hausman,Hall和Griliches(1984)提出了負(fù)二項(xiàng)回歸模型和Panel方法,Gourier,Monfort和Trogonon(1984)提出了仿最大似然法。其中,最先提出的泊松方法在研究計數(shù)數(shù)據(jù)模型問題中應(yīng)用得非常

18、廣泛。 二、泊松回歸模型1、泊松回歸模型泊松回歸模型假定,被解釋變量yi服從參數(shù)為i的泊松分布,其中i同解釋變量xi存在某種關(guān)系。該模型的初始方程為: 最常用的關(guān)于i的方程是對數(shù)線性模型,即 根據(jù)泊松分布的性質(zhì) 2、泊松回歸模型的ML估計是一個非線性模型,最簡單的方法是最大似然估計法。對數(shù)似然函數(shù)為: 可以利用Newton迭代法迅速地得到方程的參數(shù)估計值。由于對數(shù)似然函數(shù)的Hessian矩陣對任何x和的取值是負(fù)定的。即LnL在穩(wěn)定點(diǎn)有極大值,穩(wěn)定點(diǎn)指滿足一階條件的。 Newton-Raphson迭代:3、擬合優(yōu)度由于泊松模型的條件均值非線性,且回歸方程存在異方差,所以它不能產(chǎn)生類似于線性方程中

19、的R2統(tǒng)計量。學(xué)者提出了若干個替代性的統(tǒng)計量,用以衡量該模型的擬合優(yōu)度。 該統(tǒng)計量通過把泊松模型同只有一種觀察值的模型相比較的方法,考察該模型的擬合優(yōu)度。但是這個統(tǒng)計量有時為負(fù),而且會隨變量的減少而變小。 該統(tǒng)計量為各樣本觀察值的偏差之和。如果擬合達(dá)到完美狀態(tài),則該統(tǒng)計量為零。 分子和分母都衡量了模型在只有一種觀察值的模型基礎(chǔ)上的改進(jìn),分母為改進(jìn)的最大空間。所以該統(tǒng)計量的數(shù)值在0到1之間。 “仿R2”統(tǒng)計量 4、假設(shè)檢驗(yàn) 檢驗(yàn)解釋變量的約束??梢杂萌N標(biāo)準(zhǔn)的檢驗(yàn)方法來檢驗(yàn)泊松回歸模型的假設(shè)。Wald統(tǒng)計量。其中為2受到限制的解釋變量的參數(shù), LR統(tǒng)計量。分母描述受到限制后的方程的解釋變量的似然

20、概率。 三個統(tǒng)計量都服從2分布,自由度為受限變量的個數(shù)。如果統(tǒng)計值大于臨界值,則拒絕原假設(shè)。 5、例題輪船事故次數(shù)(accidents)與輪船型號(typea、b、c、d、e)、制造年份(year60、65、70、75)、投入使用年份(yearop60、75)和實(shí)際服務(wù)時間(servmonth)的關(guān)系研究。樣本:34注意入選的解釋變量部分參數(shù)的經(jīng)濟(jì)意義缺乏合理解釋。只作為試?yán)CCIDENTS = EXP(1.645572184*TYPEA + 2.353413299*TYPEB + 0.4488787812*TYPEC + 0.8131627072*TYPED + 1.401045748*

21、TYPEE - 0.6726004217*YEAR60 + 0.3731874354*YEAR65 + 0.7675535312*YEAR70 - 0.6994767419*YEAROP60 + 6.388715642e-05*SERVMONTH)用LR統(tǒng)計量進(jìn)行假設(shè)檢驗(yàn)0假設(shè)為:制造年份對事故次數(shù)無影響拒絕0假設(shè)預(yù)測結(jié)果與觀測值的比較OLS估計與計數(shù)數(shù)據(jù)估計擬合值的比較三、泊松回歸模型的擴(kuò)展1、不平均分布檢驗(yàn)(Overdispersion)泊松模型假定被解釋變量的均值等于方差,這是一個非常強(qiáng)的假設(shè),許多學(xué)者對此提出質(zhì)疑,并且發(fā)展了一些新的方法放松這一假設(shè)。首先介紹該假設(shè)條件是否成立的檢驗(yàn)。

22、基于回歸的檢驗(yàn)方法 Cameron和Trivedi在1990年提出 i是由泊松模型得出的被解釋變量的預(yù)測值 拉格朗日乘子檢驗(yàn)法基本思想也是放松泊松模型中均值等于方程的假設(shè)。泊松分布是負(fù)二項(xiàng)分布的一種特殊情況,當(dāng)對負(fù)二項(xiàng)分布的某個參數(shù)加以一定的限制條件后,就能夠得到泊松分布。在一般情況下,如果一個模型是在對另一個替代模型的參數(shù)加以限制的條件下得到的,那么就可以得到LM統(tǒng)計量。 wi的值取決于替代模型的分布函數(shù)。對負(fù)二項(xiàng)分布模型來說,這個權(quán)重為1。 2、負(fù)二項(xiàng)分布模型(Negative Binomial Regression Model) 由于泊松模型假定被解釋變量的均值等于方差,人們提出了許多替

23、代該模型的方法。其中應(yīng)用得較多的是負(fù)二項(xiàng)分布模型。Cameron和Trivedi在1986年提出負(fù)二項(xiàng)分布的一種形式。引入無法觀察的隨機(jī)影響來使泊松模型一般化 被解釋變量的條件分布 被解釋變量的分布 該分布是負(fù)二項(xiàng)分布的一種形式。其條件均值為i,條件方差為i(1+1/)i)。由概率密度可以求得最大似然函數(shù),再通過迭代法求出參數(shù)估計。對于負(fù)二項(xiàng)分布假設(shè)可以用Wald或者LR統(tǒng)計量進(jìn)行檢驗(yàn)。 負(fù)二項(xiàng)分布回歸模型ACCIDENTS = EXP(1.520444133*TYPEA + 2.270100317*TYPEB + 0.4581374106*TYPEC + 0.6449816375*TYPED

24、 + 1.358883951*TYPEE - 0.8616385402*YEAR60 + 0.2032389361*YEAR65 + 0.9661619692*YEAR70 - 0.7020190667*YEAROP60 + 7.402025976e-05*SERVMONTH)擬合效果沒有明顯改善3、零變換泊松模型(Hurdle and Zero-Altered Possion Models) 在某些情況下,被解釋變量為零值的產(chǎn)生過程與它取正值的過程差異很大。于是就有人提出了零變換泊松模型來描述這個事實(shí)。Mullahey(1986)最先提出了一個Hurdle模型,用白努利分布來描述被解釋變量分

25、別為零值和正值的概率。 改變了被解釋變量取零值的概率,但是所有取值的概率之和保持為1Mullahey(1986),Lambert(1992)等人還分析了在hurdle模型的一種擴(kuò)展情況,即假定被解釋變量的零值產(chǎn)生于兩個區(qū)域(regime)中的一個。在一個區(qū)域里,被解釋變量總是零,而另一個區(qū)域里,被解釋變量的取值符合泊松過程,既可能產(chǎn)生零,也可能產(chǎn)生其他數(shù)值。如Lambert對給定時間段內(nèi)生產(chǎn)的次品數(shù)量建立的模型,在生產(chǎn)過程得到控制的情形下,次品產(chǎn)出為零,而生產(chǎn)過程不受控制時,產(chǎn)生的次品數(shù)量服從泊松分布,既可能為零,也可能不為零。模型形式如下: 如果用z表示白努利分布的兩種情況,事件發(fā)生在區(qū)域1

26、時令z=0,發(fā)生在區(qū)域2時令z=1,并用y*表示區(qū)域2內(nèi)被解釋變量服從的泊松過程,則所有觀察值都可以表示為z y* 。 于是這個分離模型可表示為(式中F為設(shè)定的分布函數(shù)): Lambert(1992)和Greene(1994)考慮了許多方法,其中包括應(yīng)用logit和probit模型描述兩個區(qū)域各自的發(fā)生概率。這些修正的方法都改變了泊松過程,即均值和方差不再相等。關(guān)于分離模型的進(jìn)一步探討比較復(fù)雜,參考Greene的教科書和相關(guān)文獻(xiàn)。 4 受限被解釋變量數(shù)據(jù)模型選擇性樣本 Model with Limited Dependent Variable Selective Samples Model一、

27、經(jīng)濟(jì)生活中的受限被解釋變量問題 二、“截斷”問題的計量經(jīng)濟(jì)學(xué)模型 三、“歸并”問題的計量經(jīng)濟(jì)學(xué)模型 一、經(jīng)濟(jì)生活中的受限被解釋變量問題1、“截斷”(truncation)問題 由于條件限制,樣本不能隨機(jī)抽取,即不能從全部個體,而只能從一部分個體中隨機(jī)抽取被解釋變量的樣本觀測值,而這部分個體的觀測值都大于或者小于某個確定值。 “掐頭”或者“去尾”。消費(fèi)函數(shù)例題:被解釋變量最底200元、最高10000元。原因:抽樣。離散選擇模型的例題:銀行貸款,實(shí)際上是選擇性樣本,通常表現(xiàn)為“截斷樣本”。原因:問題的局限。能夠獲得貸款的企業(yè)是全部有貸款需求的企業(yè)中表現(xiàn)良好的一部分類似的實(shí)際問題很多2、“歸并” (

28、censoring)問題 將被解釋變量的處于某一范圍的樣本觀測值都用一個相同的值代替。 經(jīng)常出現(xiàn)在“檢查”、“調(diào)查”活動中,因此也稱為“檢查”(censoring) 問題。需求函數(shù)模型中用實(shí)際消費(fèi)量作為需求量的觀測值,如果存在供給限制,就出現(xiàn)“歸并”問題。被解釋變量觀測值存在最高和最低的限制。例如考試成績,最高100,最低0,出現(xiàn)“歸并”問題。 二、“截斷”問題的計量經(jīng)濟(jì)學(xué)模型1、思路如果一個單方程計量經(jīng)濟(jì)學(xué)模型,只能從“掐頭”或者“去尾”的連續(xù)區(qū)間隨機(jī)抽取被解釋變量的樣本觀測值,那么很顯然,抽取每一個樣本觀測值的概率以及抽取一組樣本觀測值的聯(lián)合概率,與被解釋變量的樣本觀測值不受限制的情況是不

29、同的。如果能夠知道在這種情況下抽取一組樣本觀測值的聯(lián)合概率函數(shù),那么就可以通過該函數(shù)極大化求得模型的參數(shù)估計量。2、截斷分布 如果服從均勻分布U(a, b),但是它只能在(c, b)內(nèi)取得樣本觀測值,那么取得每一個樣本觀測值的概率 為隨機(jī)變量分布范圍內(nèi)的一個常數(shù) 服從正態(tài)分布 是標(biāo)準(zhǔn)正態(tài)分布條件概率函數(shù) 3、截斷被解釋變量數(shù)據(jù)模型的最大似然估計 求解該1階極值條件,即可以得到模型的參數(shù)估計量。由于這是一個復(fù)雜的非線性問題,需要采用迭代方法求解,例如牛頓法。4、例題城鎮(zhèn)居民消費(fèi)模型-截斷樣本數(shù)據(jù)將這組樣本看成是在4500的條件下隨機(jī)抽取得到將這組樣本看成是在4000的條件下隨機(jī)抽取得到參數(shù)由 0

30、. 750072變化為似然函數(shù)值由228.6718減小為似然函數(shù)值為什么變???將這組樣本看成是在11500、4500條件下隨機(jī)抽取得到參數(shù)由 0. 750072變化為似然函數(shù)值由228.6718增大為似然函數(shù)值為什么增大?將這組樣本看成是在0條件下隨機(jī)抽取得到結(jié)果與OLS相同似然函數(shù)值減小似然函數(shù)值最小5、為什么截斷被解釋變量數(shù)據(jù)模型不能采用普通最小二乘估計 對于截斷被解釋變量數(shù)據(jù)計量經(jīng)濟(jì)學(xué)模型,如果仍然把它看作為經(jīng)典的線性模型,采用OLS估計,會產(chǎn)生什么樣的結(jié)果?因?yàn)閥i只能在大于a的范圍內(nèi)取得觀測值,那么yi的條件均值為: 由于被解釋變量數(shù)據(jù)的截斷問題,使得原模型變換為包含一個非線性項(xiàng)模型

31、。如果采用OLS直接估計原模型:實(shí)際上忽略了一個非線性項(xiàng);忽略了隨機(jī)誤差項(xiàng)實(shí)際上的異方差性。這就造成參數(shù)估計量的偏誤,而且如果不了解解釋變量的分布,要估計該偏誤的嚴(yán)重性也是很困難的。 6、Heckman兩步修正法 Sample Selection Bias as a Specification Error, Econometrica 47(1), 1979, P153-161市場工資方程 工作傾向方程 如何估計該模型?第一步,用probit模型估計,利用全部樣本;利用估計結(jié)果,計算i。第二步,利用選擇性樣本,將(1)作為一個待估計參數(shù),估計模型,得到1的估計。 三、“歸并”問題的計量經(jīng)濟(jì)學(xué)模型

32、1、思路以一種簡單的情況為例,討論“歸并”問題的計量經(jīng)濟(jì)學(xué)模型。即假設(shè)被解釋變量服從正態(tài)分布,其樣本觀測值以0為界,凡小于0的都?xì)w并為0,大于0的則取實(shí)際值。如果y*以表示原始被解釋變量,y以表示歸并后的被解釋變量,那么則有: 單方程線性“歸并”問題的計量經(jīng)濟(jì)學(xué)模型為: 如果能夠得到y(tǒng)i的概率密度函數(shù),那么就可以方便地采用最大似然法估計模型,這就是研究這類問題的思路。由于該模型是由Tobin于1958年最早提出的,所以也稱為Tobin模型。2、“歸并”變量的正態(tài)分布 由于原始被解釋變量y*服從正態(tài)分布,有 3、歸并被解釋變量數(shù)據(jù)模型的最大似然估計 該似然函數(shù)由兩部分組成,一部分對應(yīng)于沒有限制的

33、觀測值,是經(jīng)典回歸部分;一部分對應(yīng)于受到限制的觀測值。這是一個非標(biāo)準(zhǔn)的似然函數(shù),它實(shí)際上是離散分布與連續(xù)分布的混合。如何理解后一部分? 為什么要求和?如果樣本觀測值不是以0為界,而是以某一個數(shù)值a為界,則有 估計原理與方法相同。4、例題城鎮(zhèn)居民消費(fèi)模型-歸并樣本數(shù)據(jù)11123.8411040.34Censored(11000) 估計參數(shù)估計結(jié)果、似然函數(shù)值都與OLS估計差異較大。為什么似然函數(shù)值大于OLS估計?Censored(12000) 估計與OLS相同5、實(shí)際模型中的Truncation與Censored時間序列樣本,不考慮。截面上的全部個體作為樣本,不考慮Truncation。按照抽樣

34、理論選取截面上的部分個體作為樣本,不考慮Truncation。按照特定的規(guī)則選取截面上的部分個體作為樣本,必須考慮Truncation。截面數(shù)據(jù)作樣本,根據(jù)樣本觀測值的經(jīng)濟(jì)背景,決定是否考慮Censored。5 持續(xù)時間數(shù)據(jù)模型Duration Data Model 一、計量經(jīng)濟(jì)學(xué)中持續(xù)時間分析問題的提出二、Hazard比率與Hazard比率模型 一、計量經(jīng)濟(jì)學(xué)中持續(xù)時間分析問題的提出 經(jīng)濟(jì)生活中的持續(xù)時間問題 以某項(xiàng)活動的持續(xù)時間作為研究對象的經(jīng)濟(jì)問題。 失業(yè)問題罷工問題設(shè)備運(yùn)行時間問題 持續(xù)時間被解釋變量的計量經(jīng)濟(jì)學(xué)問題 以失業(yè)的持續(xù)時間分析為例,看看這類計量經(jīng)濟(jì)學(xué)問題的特征。以失業(yè)的持續(xù)

35、時間t 作為被解釋變量,以年齡、受教育程度、家庭狀況、工作經(jīng)歷、健康狀況等作為解釋變量,建立如下失業(yè)模型: 模型的個特點(diǎn):失業(yè)已經(jīng)持續(xù)的時間并不是失業(yè)持續(xù)時間的真實(shí)反映,不能作為失業(yè)持續(xù)時間的觀測值。取得部分解釋變量的樣本觀測值存在困難,因?yàn)樗鼈冊诔掷m(xù)時間內(nèi)是變化的。失業(yè)者關(guān)心的不是如何解釋失業(yè)已經(jīng)持續(xù)的時間,而是希望知道在觀測值t時刻之后的最短時間內(nèi)能夠重新就業(yè)的可能性為多大。 首先從上述持續(xù)時間被解釋變量計量經(jīng)濟(jì)學(xué)模型的第3個特征入手;并假設(shè)解釋變量的樣本觀測值在失業(yè)持續(xù)的時間內(nèi)是不變化的,即忽略上述第2個問題;然后再擴(kuò)展到兩類樣本數(shù)據(jù),即第個問題。二、Hazard比率與Hazard比率模型 Hazard比率 隨機(jī)變量T具有連續(xù)的概率密度函數(shù)f(t),t是T的一個觀測值,即事件已經(jīng)持續(xù)的時間。應(yīng)該有: 定義為生存函數(shù)事件在t之后的一個短時間內(nèi)結(jié)束的概率 稱為Hazard比率。事件以該比率在已經(jīng)持續(xù)t時間后結(jié)束。也稱風(fēng)險函數(shù)。 Hazard比率與t的概率密度函數(shù)f、條件分布函數(shù)F和生存函數(shù)S之間的關(guān)系 不考慮外生變量的Hazard比率模型 既然人們更關(guān)心事件在t之后的一個短時間內(nèi)結(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論