第八章(1)離散和受限被解釋變量模型_第1頁
第八章(1)離散和受限被解釋變量模型_第2頁
第八章(1)離散和受限被解釋變量模型_第3頁
第八章(1)離散和受限被解釋變量模型_第4頁
第八章(1)離散和受限被解釋變量模型_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第八章(1)離散和受限被解釋變量模型第一頁,共77頁。這些模型與方法,無論在計量經(jīng)濟學(xué)理論方面還是在實際應(yīng)用方面,都具有重要意義。但是,這些模型都形成了各自豐富的內(nèi)容體系,甚至是計量經(jīng)濟學(xué)的新分支學(xué)科,模型方法的數(shù)學(xué)過程較為復(fù)雜。本章只介紹其中最簡單的模型,以了解這些模型理論與方法的概念與思路。

第二頁,共77頁。§8.1二元選擇模型

BinaryChoiceModel一、二元離散選擇模型的經(jīng)濟背景二、二元離散選擇模型三、二元Probit離散選擇模型及其參數(shù)估計四、二元Logit離散選擇模型及其參數(shù)估計五、二元離散選擇模型的檢驗

第三頁,共77頁。說明在經(jīng)典計量經(jīng)濟學(xué)模型中,被解釋變量通常被假定為連續(xù)變量。離散被解釋變量數(shù)據(jù)計量經(jīng)濟學(xué)模型(ModelswithDiscreteDependentVariables)和離散選擇模型(DCM,DiscreteChoiceModel)。二元選擇模型(BinaryChoiceModel)和多元選擇模型(MultipleChoiceModel)。本節(jié)只介紹二元選擇模型。第四頁,共77頁。離散選擇模型起源于Fechner于1860年進行的動物條件二元反射研究。1962年,Warner首次將它應(yīng)用于經(jīng)濟研究領(lǐng)域,用以研究公共交通工具和私人交通工具的選擇問題。70、80年代,離散選擇模型被普遍應(yīng)用于經(jīng)濟布局、企業(yè)定點、交通問題、就業(yè)問題、購買決策等經(jīng)濟決策領(lǐng)域的研究。模型的估計方法主要發(fā)展于80年代初期。第五頁,共77頁。一、二元離散選擇模型的經(jīng)濟背景第六頁,共77頁。實際經(jīng)濟生活中的二元選擇問題研究選擇結(jié)果與影響因素之間的關(guān)系。影響因素包括兩部分:決策者的屬性和備選方案的屬性。對于單個方案的取舍。例如,購買者對某種商品的購買決策問題,求職者對某種職業(yè)的選擇問題,投票人對某候選人的投票決策,銀行對某客戶的貸款決策。由決策者的屬性決定。對于兩個方案的選擇。例如,兩種出行方式的選擇,兩種商品的選擇。由決策者的屬性和備選方案的屬性共同決定。第七頁,共77頁。二、二元離散選擇模型第八頁,共77頁。1、原始模型對于二元選擇問題,可以建立如下計量經(jīng)濟學(xué)模型。其中Y為觀測值為1和0的決策被解釋變量;X為解釋變量,包括選擇對象所具有的屬性和選擇主體所具有的屬性。

左右端矛盾第九頁,共77頁。由于存在這兩方面的問題,所以原始模型不能作為實際研究二元選擇問題的模型。需要將原始模型變換為效用模型。這是離散選擇模型的關(guān)鍵。

具有異方差性

第十頁,共77頁。2、效用模型

作為研究對象的二元選擇模型第i個個體選擇1的效用第i個個體選擇0的效用第十一頁,共77頁。注意,在模型中,效用是不可觀測的,人們能夠得到的觀測值仍然是選擇結(jié)果,即1和0。很顯然,如果不可觀測的U1>U0,即對應(yīng)于觀測值為1,因為該個體選擇公共交通工具的效用大于選擇私人交通工具的效用,他當(dāng)然要選擇公共交通工具;相反,如果不可觀測的U1≤U0,即對應(yīng)于觀測值為0,因為該個體選擇公共交通工具的效用小于選擇私人交通工具的效用,他當(dāng)然要選擇私人交通工具。第十二頁,共77頁。3、最大似然估計

欲使得效用模型可以估計,就必須為隨機誤差項選擇一種特定的概率分布。兩種最常用的分布是標(biāo)準(zhǔn)正態(tài)分布和邏輯(logistic)分布,于是形成了兩種最常用的二元選擇模型—Probit模型和Logit模型。最大似然函數(shù)及其估計過程如下:第十三頁,共77頁。標(biāo)準(zhǔn)正態(tài)分布或邏輯分布的對稱性似然函數(shù)第十四頁,共77頁。

在樣本數(shù)據(jù)的支持下,如果知道概率分布函數(shù)和概率密度函數(shù),求解該方程組,可以得到模型參數(shù)估計量。

1階極值條件第十五頁,共77頁。三、二元Probit離散選擇模型及其參數(shù)估計第十六頁,共77頁。1、標(biāo)準(zhǔn)正態(tài)分布的概率分布函數(shù)

第十七頁,共77頁。2、重復(fù)觀測值不可以得到情況下二元Probit離散選擇模型的參數(shù)估計

第十八頁,共77頁。關(guān)于參數(shù)的非線性函數(shù),不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。應(yīng)用計量經(jīng)濟學(xué)軟件。這里所謂“重復(fù)觀測值不可以得到”,是指對每個決策者只有一個觀測值。如果有多個觀測值,也將其看成為多個不同的決策者。第十九頁,共77頁。例8.1.1貸款決策模型分析與建模:某商業(yè)銀行從歷史貸款客戶中隨機抽取78個樣本,根據(jù)設(shè)計的指標(biāo)體系分別計算它們的“商業(yè)信用支持度”(CC)和“市場競爭地位等級”(CM),對它們貸款的結(jié)果(JG)采用二元離散變量,1表示貸款成功,0表示貸款失敗。目的是研究JG與CC、CM之間的關(guān)系,并為正確貸款決策提供支持。第二十頁,共77頁。樣本觀測值CC=XYCM=SC第二十一頁,共77頁。第二十二頁,共77頁。第二十三頁,共77頁。該方程表示,當(dāng)CC和CM已知時,代入方程,可以計算貸款成功的概率JGF。例如,將表中第19個樣本觀測值CC=15、CM=-1代入方程右邊,計算括號內(nèi)的值為0.1326552;查標(biāo)準(zhǔn)正態(tài)分布表,對應(yīng)于0.1326552的累積正態(tài)分布為0.5517;于是,JG的預(yù)測值JGF=1-0.5517=0.4483,即對應(yīng)于該客戶,貸款成功的概率為0.4483。輸出的估計結(jié)果第二十四頁,共77頁。模擬預(yù)測第二十五頁,共77頁。預(yù)測:如果有一個新客戶,根據(jù)客戶資料,計算的“商業(yè)信用支持度”(XY)和“市場競爭地位等級”(SC),代入模型,就可以得到貸款成功的概率,以此決定是否給予貸款。第二十六頁,共77頁。3、重復(fù)觀測值可以得到情況下二元Probit離散選擇模型的參數(shù)估計

思路對每個決策者有多個重復(fù)(例如10次左右)觀測值。對第i個決策者重復(fù)觀測ni次,選擇yi=1的次數(shù)比例為pi,那么可以將pi作為真實概率Pi的一個估計量。建立“概率單位模型”,采用廣義最小二乘法估計。實際中并不常用。第二十七頁,共77頁。四、二元Logit離散選擇模型及其參數(shù)估計第二十八頁,共77頁。1、邏輯分布的概率分布函數(shù)

第二十九頁,共77頁。B?rsch-Supan于1987年指出:

如果選擇是按照效用最大化而進行的,具有極限值的邏輯分布是較好的選擇,這種情況下的二元選擇模型應(yīng)該采用Logit模型。

第三十頁,共77頁。2、重復(fù)觀測值不可以得到情況下二元logit離散選擇模型的參數(shù)估計

關(guān)于參數(shù)的非線性函數(shù),不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。應(yīng)用計量經(jīng)濟學(xué)軟件。

第三十一頁,共77頁。第三十二頁,共77頁。第三十三頁,共77頁。第三十四頁,共77頁。Probit0.9999991.0000000.4472330.000000第三十五頁,共77頁。五、二元離散選擇模型的檢驗第三十六頁,共77頁。1、計量經(jīng)濟學(xué)模型中的兩類檢驗統(tǒng)計量基于LSR2總體顯著性F檢驗約束回歸的F檢驗基于MLWaldLR(likelihoodratio)LM(lagrangemultiplier)原理相同第三十七頁,共77頁。2、擬合檢驗P:樣本觀測值中被解釋變量等于1的比例。L0:模型中所有解釋變量的系數(shù)都為0時的似然函數(shù)值。LRI=1,即L=1,完全擬合。LRI=0,所有解釋變量完全不顯著,完全不擬合。第三十八頁,共77頁。LnL=-1.639954LnL0=-52.80224LRI=0.968942第三十九頁,共77頁。3、回代檢驗當(dāng)二元離散選擇模型被估計后,將所有樣本的解釋變量觀測值代入模型,計算得到每個樣本的被解釋變量選擇1的概率,與每個樣本被解釋變量的實際觀測值進行比較,以判斷模型的預(yù)測(回代)效果,是一種實際有效的模型檢驗方法。

概率閾值樸素選擇:p=0.5(1、0的樣本相當(dāng)時)先驗選擇:p=(選1的樣本數(shù)/全部樣本)(全樣本時)最優(yōu)閾值:犯第一類錯誤(棄真)最小原則第四十頁,共77頁。例8.1.1樸素選擇,即以0.5為閾值:除了2個樣本外,所有樣本都通過了回代檢驗。先驗選擇,即以選擇1的樣本的比例0.41為閾值:除了1個樣本外,所有樣本都通過了回代檢驗。第四十一頁,共77頁。實例—財務(wù)欺詐識別模型我國上市公司財務(wù)欺詐識別模型樣本:年度報告審計意見為“無法發(fā)表意見”或者“證監(jiān)會立案調(diào)查”等公司屬于財務(wù)欺詐樣本;年度報告審計意見為“標(biāo)準(zhǔn)無保留意見”和財務(wù)報表滿足“利潤×現(xiàn)金流量>0”的公司屬于配對樣本。解釋變量:開始選擇11個財務(wù)指標(biāo);通過T檢驗,確定6個指標(biāo):資產(chǎn)負債率、資產(chǎn)毛利率、資產(chǎn)周轉(zhuǎn)率、營運資金比率、應(yīng)收賬款周轉(zhuǎn)率、經(jīng)營活動現(xiàn)金流量/資產(chǎn)額。第四十二頁,共77頁。樣本:財務(wù)欺詐公司30,非財務(wù)欺詐公司30采用犯第一類錯誤最小原則確定最優(yōu)閾值為0.68欺詐樣本中,p<0.68,26個,占86.7%非欺詐樣本中,p>0.68,25個,占83.3%第四十三頁,共77頁。實例—上市公司并購被解釋變量:當(dāng)年發(fā)生并購行為為1,反之為0。解釋變量:凈利潤率、……,全流通虛變量。試圖研究全流通都并購的影響。樣本:1994-2008上市公司,并購樣本731,非并購樣本9835。采用先驗原則,P=5%模擬結(jié)果:并購樣本中:p>5%占53%非并購樣本中:p<5%占72%第四十四頁,共77頁。§8.2選擇性樣本模型

SelectiveSamplesModel一、經(jīng)濟生活中的選擇性樣本問題二、“截斷”問題的計量經(jīng)濟學(xué)模型三、“歸并”問題的計量經(jīng)濟學(xué)模型

第四十五頁,共77頁。TheBankofSwedenPrizeinEconomicSciencesinMemoryofAlfredNobel2000

"forhisdevelopmentoftheoryandmethodsforanalyzingselectivesamples”JamesJHeckmanUSA第四十六頁,共77頁。“ShadowPrices,MarketWagesandLabourSupply”,Econometrica42(4),1974,P679-694

發(fā)現(xiàn)并提出“選擇性樣本”問題。“SampleSelectionBiasasaSpecificationError”,Econometrica47(1),1979,P153-161

證明了偏誤的存在并提出了Heckman兩步修正法。第四十七頁,共77頁。一、經(jīng)濟生活中的選擇性樣本問題第四十八頁,共77頁。1、“截斷”(truncation)問題

由于條件限制,樣本不能隨機抽取,即不能從全部個體,而只能從一部分個體中隨機抽取被解釋變量的樣本觀測值,而這部分個體的觀測值都大于或者小于某個確定值。

“掐頭”或者“去尾”。例如消費函數(shù)模型:由于抽樣原因,被解釋變量樣本觀測值最低200元、最高10000元。例如農(nóng)戶貸款影響因素分析模型:如果調(diào)查了10000戶,其中只有6000戶在一年內(nèi)發(fā)生了貸款。僅以發(fā)生了貸款的6000戶的貸款額作為被解釋變量觀測值,顯然是將其它沒有發(fā)生貸款的4000戶“截斷”掉了。

第四十九頁,共77頁。2、“歸并”

(censoring)問題

將被解釋變量的處于某一范圍的樣本觀測值都用一個相同的值代替。經(jīng)常出現(xiàn)在“檢查”、“調(diào)查”活動中,因此也稱為“檢查”(censoring)問題。例如需求函數(shù)模型:用實際消費量作為需求量的觀測值,如果存在供給限制,就出現(xiàn)“歸并”問題。被解釋變量觀測值存在最高和最低的限制。例如考試成績,最高100,最低0,出現(xiàn)“歸并”問題。第五十頁,共77頁。二、“截斷”問題的計量經(jīng)濟學(xué)模型第五十一頁,共77頁。1、思路如果一個單方程計量經(jīng)濟學(xué)模型,只能從“掐頭”或者“去尾”的連續(xù)區(qū)間隨機抽取被解釋變量的樣本觀測值,那么很顯然,抽取每一個樣本觀測值的概率以及抽取一組樣本觀測值的聯(lián)合概率,與被解釋變量的樣本觀測值不受限制的情況是不同的。如果能夠知道在這種情況下抽取一組樣本觀測值的聯(lián)合概率函數(shù),那么就可以通過該函數(shù)極大化求得模型的參數(shù)估計量。第五十二頁,共77頁。2、截斷分布

如果ξ服從均勻分布U(a,b),但是它只能在(c,b)內(nèi)取得樣本觀測值,那么取得每一個樣本觀測值的概率α為隨機變量ξ分布范圍內(nèi)的一個常數(shù)第五十三頁,共77頁。ξ服從正態(tài)分布Φ是標(biāo)準(zhǔn)正態(tài)分布條件概率函數(shù)第五十四頁,共77頁。3、截斷被解釋變量數(shù)據(jù)模型的最大似然估計

第五十五頁,共77頁。第五十六頁,共77頁。求解該1階極值條件,即可以得到模型的參數(shù)估計量。由于這是一個復(fù)雜的非線性問題,需要采用迭代方法求解,例如牛頓法。第五十七頁,共77頁。4、例8.2.1:城鎮(zhèn)居民消費模型第五十八頁,共77頁。OLS估計:將樣本看為不受任何限制下隨機抽取的樣本

第五十九頁,共77頁。ML估計:將樣本看為在消費水平大于1000元、小于5000元的特定人群中隨機抽取的樣本

估計方法選擇樣本類型選擇截斷點選擇第六十頁,共77頁。第六十一頁,共77頁。5、為什么截斷被解釋變量數(shù)據(jù)模型不能采用普通最小二乘估計

對于截斷被解釋變量數(shù)據(jù)計量經(jīng)濟學(xué)模型,如果仍然把它看作為經(jīng)典的線性模型,采用OLS估計,會產(chǎn)生什么樣的結(jié)果?因為yi只能在大于a的范圍內(nèi)取得觀測值,那么yi的條件均值為:

第六十二頁,共77頁。第六十三頁,共77頁。由于被解釋變量數(shù)據(jù)的截斷問題,使得原模型變換為包含一個非線性項模型。如果采用OLS直接估計原模型:實際上忽略了一個非線性項;忽略了隨機誤差項實際上的異方差性。這就造成參數(shù)估計量的偏誤,而且如果不了解解釋變量的分布,要估計該偏誤的嚴(yán)重性也是很困難的。第六十四頁,共77頁。三、“歸并”問題的計量經(jīng)濟學(xué)模型第六十五頁,共77頁。1、思路以一種簡單的情況為例,討論“歸并”問題的計量經(jīng)濟學(xué)模型。即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論