版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、含有一個(gè)虛擬自變量的回歸第1頁(yè)/共58頁(yè)虛擬自變量(dummy variable)1.用數(shù)字代碼表示的定性自變量2.虛擬自變量可有不同的水平只有兩個(gè)水平的虛擬自變量比如,性別(男,女) 有兩個(gè)以上水平的虛擬自變量貸款企業(yè)的類型(家電,醫(yī)藥,其他) 3.虛擬變量的取值為0,1第2頁(yè)/共58頁(yè)虛擬自變量的回歸1.回歸模型中使用虛擬自變量時(shí),稱為虛擬自變量的回歸2.當(dāng)虛擬自變量只有兩個(gè)水平時(shí),可在回歸中引入一個(gè)虛擬變量比如,性別(男,女) 3.一般而言,如果定性自變量有k個(gè)水平,需要在回歸中模型中引進(jìn)k-1個(gè)虛擬變量第3頁(yè)/共58頁(yè)虛擬自變量的回歸(例題分析)第4頁(yè)/共58頁(yè)虛擬自變量的回歸(例題分
2、析)考試成績(jī)與性別的散點(diǎn)圖考試成績(jī)與性別的散點(diǎn)圖255075100性別考試成績(jī)男 女第5頁(yè)/共58頁(yè)虛擬自變量的回歸 (例題分析)引進(jìn)虛擬變量時(shí),回歸方程可寫:E(y) =0+ 1x男( x=0):E(y) =0男學(xué)生考試成績(jī)的期望值女(x=0 ):E(y) =0+ 11女學(xué)生考試成績(jī)的期望值注意:當(dāng)指定虛擬變量01時(shí)0總是代表與虛擬變量值0所對(duì)應(yīng)的那個(gè)分類變量水平的平均值1總是代表與虛擬變量值1所對(duì)應(yīng)的那個(gè)分類變量水平的平均響應(yīng)與虛擬變量值0所對(duì)應(yīng)的那個(gè)分類變量水平的平均值的差值,即 平均值的差值 =(0+ 1) - 0= 1第6頁(yè)/共58頁(yè)虛擬自變量的回歸(例題分析)第7頁(yè)/共58頁(yè)虛擬自
3、變量的回歸 (例題分析)引進(jìn)虛擬變量時(shí),回歸方程可寫: E(y) =0+ 1x1+ 2x2女( x2=0):E(y|女性) =0 +1x1男(x2=1):E(y|男性) =(0 + 2 ) +1x1 0的含義表示:女性職工的期望月工資收入 ( 0+ 2)的含義表示:男性職工的期望月工資收入 1含義表示:工作年限每增加1年,男性或女性工資的平均增加值 2含義表示:男性職工的期望月工資收入與女性職工的期望月工資收入之間的差值 (0+ 2) - 0= 2第8頁(yè)/共58頁(yè)非線性回歸非線性回歸第9頁(yè)/共58頁(yè)用虛擬自變量回歸解決方差分析問題第10頁(yè)/共58頁(yè)方差分析的回歸方法 (例題分析)引進(jìn)虛擬變量建
4、立回歸方程:E(Y)=0+ 1x1+ 2x2+3x3用Excel進(jìn)行回歸 0家電制造業(yè)投訴次數(shù)的平均值 ( 0+ 1)零售業(yè)投訴次數(shù)的平均值 ( 0+ 2)旅游業(yè)投訴次數(shù)的平均值 ( 0+ 3)航空公司投訴次數(shù)的平均值 第11頁(yè)/共58頁(yè) 關(guān)于虛擬應(yīng)變量的回歸:線性概率模型、對(duì)數(shù)單位、概率單位及托比模型1、虛擬應(yīng)變量、虛擬應(yīng)變量2、線性概率模型、線性概率模型(LPM)3、線性概率模型的估計(jì)問題、線性概率模型的估計(jì)問題4、一個(gè)線性概率模型的例子、一個(gè)線性概率模型的例子5、線性概率模型的應(yīng)用、線性概率模型的應(yīng)用6、線性概率模型以外的其他方法、線性概率模型以外的其他方法7、對(duì)數(shù)單位模型、對(duì)數(shù)單位模型
5、8、對(duì)數(shù)單位模型的估計(jì)、對(duì)數(shù)單位模型的估計(jì)9、對(duì)數(shù)單位模型例子、對(duì)數(shù)單位模型例子10、概率單位模型、概率單位模型11、概率單位模型的例子、概率單位模型的例子12、托比模型、托比模型第12頁(yè)/共58頁(yè)1虛擬應(yīng)變量在以前考慮的虛擬變量回歸模型中,我們隱含在以前考慮的虛擬變量回歸模型中,我們隱含假定應(yīng)變量假定應(yīng)變量Y Y是定量的,而解釋變量是定量的、是定量的,而解釋變量是定量的、定定性的或二者兼有。然而有的應(yīng)變量可以是二分性性的或二者兼有。然而有的應(yīng)變量可以是二分性質(zhì)質(zhì)的。如一個(gè)人或者在勞動(dòng)力行列中或者不在,從的。如一個(gè)人或者在勞動(dòng)力行列中或者不在,從而而勞動(dòng)力參與這個(gè)應(yīng)變量只能取兩個(gè)值:如果這個(gè)勞
6、動(dòng)力參與這個(gè)應(yīng)變量只能取兩個(gè)值:如果這個(gè)人人在勞動(dòng)力行列中,則取值在勞動(dòng)力行列中,則取值1 1;如果不在其中則取;如果不在其中則取值值0 0。又如考察學(xué)院教授是不是屬于工會(huì)成員,因。又如考察學(xué)院教授是不是屬于工會(huì)成員,因此此工會(huì)會(huì)員資格這個(gè)應(yīng)變量就是一個(gè)取值工會(huì)會(huì)員資格這個(gè)應(yīng)變量就是一個(gè)取值0 0或或1 1的虛的虛擬擬變量:變量:0 0表示非工會(huì)會(huì)員,表示非工會(huì)會(huì)員,1 1表示工會(huì)會(huì)員。表示工會(huì)會(huì)員。第13頁(yè)/共58頁(yè)這些例子的一個(gè)特性是,應(yīng)變量屬于僅要求這些例子的一個(gè)特性是,應(yīng)變量屬于僅要求回答是或否這樣一種類型;就是說它是二分回答是或否這樣一種類型;就是說它是二分類的。處理二分類變量有四中
7、模型:類的。處理二分類變量有四中模型:1.1.線性概率模型線性概率模型2.2.對(duì)數(shù)單位模型對(duì)數(shù)單位模型3.3.概率單位模型概率單位模型4.4.托比單位模型托比單位模型第14頁(yè)/共58頁(yè)2線性概率模型為了建立概念,考慮如下模型:為了建立概念,考慮如下模型: (1 .1) 其中其中 X=X=家庭收入家庭收入 Y=1 Y=1 如果該家庭擁有住宅如果該家庭擁有住宅 =0 =0 如果該家庭不擁有住宅如果該家庭不擁有住宅該模型把二分變量該模型把二分變量 表達(dá)為解釋變量表達(dá)為解釋變量 的函數(shù)。的函數(shù)。像(像(.1)這樣的模型,稱為線性概率模型。)這樣的模型,稱為線性概率
8、模型。因?yàn)?,因?yàn)椋?在給定在給定 下的條件期望下的條件期望 可可解釋為在給定解釋為在給定 下事件(家庭擁有住宅)將發(fā)下事件(家庭擁有住宅)將發(fā)生的條件概率,即生的條件概率,即12iiiYXu(/)iiE YX(1/)riiP YXiYiXiYiXiX第15頁(yè)/共58頁(yè)假定假定 , ,我們得到:我們得到: (.2)現(xiàn)在,令現(xiàn)在,令 (即事件發(fā)生)的概率,而(即事件發(fā)生)的概率,而 (即事件不發(fā)生)(即事件不發(fā)生)的概率。的概率。由數(shù)學(xué)期望定義有:由數(shù)學(xué)期望定義有: (1 .3) 比較(比較(.2)和()和(11.2.311.2.3)得:)
9、得: (11.2.411.2.4)( )0iE u12(/)iiiE YXX1iiPY10iiPY ( )0(1) 1( )iiiE YPPiP12(/)iiiE YXXP就是說,模型(就是說,模型(.1)的條件期望事實(shí)上可解釋)的條件期望事實(shí)上可解釋為為Y Y的條件概率。條件概率必須落在的條件概率。條件概率必須落在0 0與與1 1之間。之間。第16頁(yè)/共58頁(yè)3線性概率模型的估計(jì)問題我們不能用標(biāo)準(zhǔn)的我們不能用標(biāo)準(zhǔn)的OLSOLS法去估計(jì)線性概率模型。因法去估計(jì)線性概率模型。因?yàn)橛幸韵乱恍﹩栴}:為有以下一些問題: 干擾干擾 的非正態(tài)性的非正態(tài)性為了統(tǒng)計(jì)推斷的目的我們假設(shè)干擾服
10、從正態(tài)分布。為了統(tǒng)計(jì)推斷的目的我們假設(shè)干擾服從正態(tài)分布。但在線性概率模型中干擾的正態(tài)性不成立。我們把但在線性概率模型中干擾的正態(tài)性不成立。我們把(.1)寫為:)寫為: (.1) 當(dāng)當(dāng) 時(shí):時(shí): 當(dāng)當(dāng) 時(shí):時(shí): (.2)iuiiiiiuYX1iY 121iiuX 0iY 12iiuX 第17頁(yè)/共58頁(yè)顯然,我們不再可能假定干擾項(xiàng)是正態(tài)分布的:實(shí)顯然,我們不再可能假定干擾項(xiàng)是正態(tài)分布的:實(shí)際際上,它遵循二項(xiàng)分布。上,它遵循二項(xiàng)分布。干擾項(xiàng)的異方差性干擾項(xiàng)的異方差性由(由(.2)中可以得到)中可以得到 的概率分布:的概
11、率分布:當(dāng)當(dāng) 概率為概率為 ;當(dāng)當(dāng) 概率為概率為 ,進(jìn)而可得到:,進(jìn)而可得到:(11.3.4)(11.3.4) 12iiuX 1iP121iiuXiPvar( )(1)iiiuPP(1)iiPP第18頁(yè)/共58頁(yè)方程(方程(11.3.411.3.4)表明干擾項(xiàng)目)表明干擾項(xiàng)目 的方差為異方差的方差為異方差性。性。解決異方差問題的一個(gè)方法是進(jìn)行數(shù)據(jù)變換,將模解決異方差問題的一個(gè)方法是進(jìn)行數(shù)據(jù)變換,將模型型(.1)的兩邊除以)的兩邊除以 即,即, 得:得: (11.3.5)(11.3.5)(/)1(/)(1)iiiiiiE YXE YXPP12iiiiiXuwwwiwiiwYi
12、u第19頁(yè)/共58頁(yè)(11.3.511.3.5)中的干擾必定是同方差性的了。)中的干擾必定是同方差性的了。真真 是不知道的,從而權(quán)是不知道的,從而權(quán) 是不知是不知道的,為了估計(jì)道的,為了估計(jì) ,可采用如下兩步法:,可采用如下兩步法:1 1. .對(duì)(對(duì)(.1)作最小二乘回歸,暫且撇)作最小二乘回歸,暫且撇開異方差性問題。于是得到開異方差性問題。于是得到 真真 的的OLSOLS估計(jì)值。再由此求估計(jì)值。再由此求 的估計(jì)值的估計(jì)值 2.2.用估計(jì)值用估計(jì)值 做如同(做如同(11.3.511.3.5)的數(shù)據(jù))的數(shù)據(jù)變換,然后對(duì)變換后的數(shù)據(jù)做變換,然后對(duì)變換后的數(shù)據(jù)做OLSOLS回歸。
13、回歸。iw(/)iiE YXiwiY(/)iiE YXiw(1)iiiwYYiw第20頁(yè)/共58頁(yè) 不被滿足不被滿足在線性概率模型中在線性概率模型中 的估計(jì)量的估計(jì)量 不一定在不一定在0 0和和1 1之間,解決的辦法是當(dāng)之間,解決的辦法是當(dāng) 小于小于0 0時(shí)取時(shí)取0 0,大于,大于1 1時(shí)取時(shí)取1 1??梢傻臄M合優(yōu)度:可疑的擬合優(yōu)度: 值值在二分模型中計(jì)算出來的在二分模型中計(jì)算出來的 值較低。值較低。0(/)1iiE YX(/)iiE YXiYiY2R2R第21頁(yè)/共58頁(yè)4線性概率模型:一個(gè)數(shù)值例子我們用一個(gè)數(shù)值例子來說明線性概率模型的一我們用一個(gè)數(shù)值例子來說明線性概率模型的一些問題。給出些
14、問題。給出4040各家庭的住宅所有權(quán)各家庭的住宅所有權(quán)Y Y(1 1擁有住宅,擁有住宅,0 0不擁有住宅)和家庭收入不擁有住宅)和家庭收入X X(千美元)的虛構(gòu)數(shù)據(jù)。根據(jù)這些數(shù)據(jù),用(千美元)的虛構(gòu)數(shù)據(jù)。根據(jù)這些數(shù)據(jù),用OLSOLS估計(jì)的線性概率模型如下:估計(jì)的線性概率模型如下: (0.11280.1128)()(0.00820.0082) t t(-7.6984-7.6984)()(12.51512.515) (.1)0.94570.1021iiYX 20.8048R 第22頁(yè)/共58頁(yè)首先我們來解釋這一回歸。截距值首先我們來解釋這一回歸。截距值-0.9457-0.945
15、7給給出出零收入的家庭擁有自己的住房的概率。由于零收入的家庭擁有自己的住房的概率。由于是是負(fù)值,而概率又不可能是負(fù)值,我們就把該負(fù)值,而概率又不可能是負(fù)值,我們就把該值值當(dāng)作零看待,這樣做在本例中是說得過去的。當(dāng)作零看待,這樣做在本例中是說得過去的。斜率值斜率值0.10210.1021意味著收入每增加意味著收入每增加1 1單位,平均單位,平均地地說擁有住宅的概率增加說擁有住宅的概率增加0.10210.1021或約或約1010。當(dāng)。當(dāng)然,對(duì)某一給定的收入水平,我們可以從然,對(duì)某一給定的收入水平,我們可以從(.1)估計(jì)出擁有住宅的實(shí)際概率。例)估計(jì)出擁有住宅的實(shí)際概率。例如,對(duì)
16、于如,對(duì)于X X1212(1200012000美元),估計(jì)擁有住美元),估計(jì)擁有住宅宅的概率是的概率是第23頁(yè)/共58頁(yè)0.2795 0.2795 就是說,收入為就是說,收入為12000 12000 美元的家庭擁有住宅美元的家庭擁有住宅的的概率為概率為2828。對(duì)于上面的估計(jì)受異方差的影響,因此我們對(duì)于上面的估計(jì)受異方差的影響,因此我們可可以用以用WLSWLS來獲得更有效的估計(jì)值。由于某些來獲得更有效的估計(jì)值。由于某些是是負(fù)的,和某些負(fù)的,和某些 大于大于1 1,對(duì)于這些,對(duì)于這些 來說,來說, 將將是負(fù)的,因此刪去這些值是負(fù)的,因此刪去這些值 。得到的。得到的WLSWLS回歸為:回歸為:(/
17、12)0.945712(0.1021)iYX iYiYiYiw第24頁(yè)/共58頁(yè)(0.1206) (0.0069) t(-10.332) (17.454)(11.4.2)11.24560.1196iiiiiYXwww 20.9214R 第25頁(yè)/共58頁(yè)5線性概率模型的應(yīng)用例例11.111.1:科恩:科恩- -雷雷- -勒曼研究勒曼研究在為美國(guó)勞工部做的一項(xiàng)研究工作中,科恩、雷在為美國(guó)勞工部做的一項(xiàng)研究工作中,科恩、雷和勒和勒曼把各類勞工的曼把各類勞工的“勞動(dòng)力參與勞動(dòng)力參與”當(dāng)作一些社會(huì)當(dāng)作一些社會(huì)人口人口統(tǒng)計(jì)變量的函數(shù)來分析。在所有的回歸中應(yīng)變量統(tǒng)計(jì)變量的函數(shù)來分析。在所有的回歸中應(yīng)變量都
18、是都是一個(gè)虛擬變量:如果一個(gè)人參與勞動(dòng)隊(duì)伍,它就一個(gè)虛擬變量:如果一個(gè)人參與勞動(dòng)隊(duì)伍,它就取值取值1 1;如果不參與取值;如果不參與取值0 0。在表。在表16.316.3中我們復(fù)制了他中我們復(fù)制了他們幾們幾個(gè)虛擬變量回歸中的一個(gè)。個(gè)虛擬變量回歸中的一個(gè)。上述回歸是用上述回歸是用OLSOLS估計(jì)的,后又對(duì)它進(jìn)行異方差校估計(jì)的,后又對(duì)它進(jìn)行異方差校正,由于是大樣本所以結(jié)果相差不大,正,由于是大樣本所以結(jié)果相差不大,t t檢驗(yàn)和檢驗(yàn)和F F檢驗(yàn)檢驗(yàn)第26頁(yè)/共58頁(yè)現(xiàn)在轉(zhuǎn)到對(duì)結(jié)果的解釋,每一斜率系數(shù)都現(xiàn)在轉(zhuǎn)到對(duì)結(jié)果的解釋,每一斜率系數(shù)都給出對(duì)應(yīng)于解釋變量的一個(gè)給定單位變給出對(duì)應(yīng)于解釋變量的一個(gè)給定單
19、位變化,事件發(fā)生的條件概率的變化率。比化,事件發(fā)生的條件概率的變化率。比如說,變量如說,變量“6565歲及以上歲及以上”的系數(shù)的系數(shù)- -0.27530.2753表示在保持其他因素不變的情況表示在保持其他因素不變的情況下,該年齡組的婦女參與勞動(dòng)的概率要下,該年齡組的婦女參與勞動(dòng)的概率要低出低出2727?,F(xiàn)在考慮婚姻狀況和年齡的交互作用。表現(xiàn)在考慮婚姻狀況和年齡的交互作用。表中數(shù)據(jù)表明,從未結(jié)婚的女人(和基底中數(shù)據(jù)表明,從未結(jié)婚的女人(和基底類相比),類相比),其勞動(dòng)力參與概率要高出其勞動(dòng)力參與概率要高出2929,而年齡為而年齡為6565歲及以上的婦女,勞動(dòng)參與概率歲及以上的婦女,勞動(dòng)參與概率要
20、低出要低出2828。以下依此類推。仿照以上的程。以下依此類推。仿照以上的程序,不難解釋表序,不難解釋表16.316.3中其余系數(shù)中其余系數(shù)第27頁(yè)/共58頁(yè)6線性概率模型以外的其他方法線性概率模型的根本問題在于其在邏輯上不是一個(gè)很線性概率模型的根本問題在于其在邏輯上不是一個(gè)很有吸引力的模型,因?yàn)樗俣ㄓ形Φ哪P?,因?yàn)樗俣?隨隨X X而線性地增加,即而線性地增加,即X X的邊際或增補(bǔ)效應(yīng)一直保持不的邊際或增補(bǔ)效應(yīng)一直保持不變。這顯然不現(xiàn)實(shí)。變。這顯然不現(xiàn)實(shí)。因此我們需要的是具有如下二分性質(zhì)的模型:因此我們需要的是具有如下二分性質(zhì)的模型:(1 1)隨著)隨著 增加,增加, 也增加,但不超也增
21、加,但不超出出0-10-1這個(gè)區(qū)間。這個(gè)區(qū)間。(2 2) 和和 之間是非線性的,即之間是非線性的,即”隨著隨著 變小變小概概率趨于零的速度越來越慢,率趨于零的速度越來越慢,而隨著而隨著 變得很大,概變得很大,概率趨于率趨于1 1的速度也越來越慢的速度也越來越慢”。因此下面我們將討。因此下面我們將討論滿足這些條件的對(duì)數(shù)單位模型和概率單位模型論滿足這些條件的對(duì)數(shù)單位模型和概率單位模型(1/)iPE YXiX(1/)iiPE YXiPiXiXiX第28頁(yè)/共58頁(yè)7對(duì)數(shù)單位模型我們用住房所有權(quán)的例子說明對(duì)數(shù)單位模型的基本概念。我們用住房所有權(quán)的例子說明對(duì)數(shù)單位模型的基本概念。解釋住房所有權(quán)對(duì)收入的線
22、性關(guān)系時(shí)的解釋住房所有權(quán)對(duì)收入的線性關(guān)系時(shí)的線性概率模型曾是:線性概率模型曾是: (.1)其中其中X X為收入,而為收入,而Y Y1 1表示家庭擁有住房,但現(xiàn)表示家庭擁有住房,但現(xiàn)在考慮如下住房所有權(quán)的表達(dá)式在考慮如下住房所有權(quán)的表達(dá)式: : (.2) (.2)可以寫成:)可以寫成: (1 .3)12(1/)iiiPE YXX12()1(1/)1iiiXPE YXe11iiZPe12iiZX第29頁(yè)/共58頁(yè)方程(方程(11.7.311.7.3)代表一個(gè)(累積)代表一個(gè)(累積)邏輯斯蒂分布邏輯斯蒂分布函數(shù)為名的模型。
23、函數(shù)為名的模型。隨著隨著 從從 變到變到 , 從從0 0變到變到1 1,而且,而且 對(duì)對(duì)有非線性關(guān)系,這樣就滿足了上述兩點(diǎn)要求。有非線性關(guān)系,這樣就滿足了上述兩點(diǎn)要求。在進(jìn)行估計(jì)時(shí)我們可以將(在進(jìn)行估計(jì)時(shí)我們可以將(.2)化成線性)化成線性形式進(jìn)行估計(jì)。形式進(jìn)行估計(jì)。擁有住房的概率為擁有住房的概率為 ,則不擁有住房的概率,則不擁有住房的概率 是:是: (1 .4) (1 .5)iZiPiPiZiP(1)iP111iiZPe111iiiZZiZiPeePe第30頁(yè)/共58頁(yè)現(xiàn)在現(xiàn)在 就是有利于擁有住房的機(jī)會(huì)比就是有利于擁有住房的機(jī)會(huì)比率率一
24、個(gè)家庭將擁有住房的概率對(duì)不擁有住一個(gè)家庭將擁有住房的概率對(duì)不擁有住房的概率之比。房的概率之比。對(duì)(對(duì)(11.7.511.7.5)取自然對(duì)數(shù)得:)取自然對(duì)數(shù)得: (11.7.611.7.6)即機(jī)會(huì)比率的對(duì)數(shù)即機(jī)會(huì)比率的對(duì)數(shù) 不僅對(duì)不僅對(duì) 為線性,而且為線性,而且對(duì)對(duì)參數(shù)也是線性。參數(shù)也是線性。 被稱為對(duì)數(shù)單位模型。被稱為對(duì)數(shù)單位模型。1iiPPln()1iiiiPLZP12iXiLiX第31頁(yè)/共58頁(yè)像(像(11.7.611.7.6)這樣的模型取名為對(duì)數(shù)單位模型)這樣的模型取名為對(duì)數(shù)單位模型對(duì)數(shù)模型的特點(diǎn):對(duì)數(shù)模型的特點(diǎn):1 1、 從從0 0變到變到1 1,對(duì)數(shù)單位從,對(duì)數(shù)單位從 變到變到 2
25、 2、雖然、雖然 對(duì)對(duì) 為線性,但概率本身卻不然。為線性,但概率本身卻不然。3 3、斜率系數(shù)給出、斜率系數(shù)給出 每單位變化的每單位變化的 的變化,它告的變化,它告知人們隨著收入變化一單位,有利于擁有住房的知人們隨著收入變化一單位,有利于擁有住房的對(duì)數(shù)對(duì)數(shù)機(jī)會(huì)比率是怎樣變化的。截距是當(dāng)收入為機(jī)會(huì)比率是怎樣變化的。截距是當(dāng)收入為零時(shí)的有利于擁有住房的對(duì)數(shù)零時(shí)的有利于擁有住房的對(duì)數(shù)機(jī)會(huì)機(jī)會(huì)比率的值。比率的值。4 4、對(duì)給定的某個(gè)收入水平,我們其實(shí)想估計(jì)的并、對(duì)給定的某個(gè)收入水平,我們其實(shí)想估計(jì)的并不是有利于擁有住房的機(jī)會(huì)比,而是擁有住房本不是有利于擁有住房的機(jī)會(huì)比,而是擁有住房本身的概率。身的概率。
26、5 5、對(duì)數(shù)單位模型假定機(jī)會(huì)比率的對(duì)數(shù)與、對(duì)數(shù)單位模型假定機(jī)會(huì)比率的對(duì)數(shù)與 有線有線性關(guān)系性關(guān)系。PLXXLX第32頁(yè)/共58頁(yè)8對(duì)數(shù)單位模型的估計(jì)把對(duì)數(shù)單位模型寫成如下形式:把對(duì)數(shù)單位模型寫成如下形式:如果對(duì)這個(gè)模型用微觀數(shù)據(jù)直接估計(jì)會(huì)遇到一如果對(duì)這個(gè)模型用微觀數(shù)據(jù)直接估計(jì)會(huì)遇到一些問題,例如當(dāng)或時(shí),取不到有意義些問題,例如當(dāng)或時(shí),取不到有意義的值,在這種情形下只有用最大似然估計(jì)求解。的值,在這種情形下只有用最大似然估計(jì)求解。另外的一種估計(jì)方法,當(dāng)我們擁有的數(shù)據(jù)如下表另外的一種估計(jì)方法,當(dāng)我們擁有的數(shù)據(jù)如下表所示時(shí)可以用所示時(shí)可以用OLS求解。求解。12ln()1iiiiiPLXuP0iP
27、1iP iL第33頁(yè)/共58頁(yè)表11.4XNn6408850121060181380281510045207036256539305033354030402520第34頁(yè)/共58頁(yè)根據(jù)上表的數(shù)據(jù)求出根據(jù)上表的數(shù)據(jù)求出利用估計(jì)的可以得到估計(jì)的對(duì)數(shù)單位線性利用估計(jì)的可以得到估計(jì)的對(duì)數(shù)單位線性模型。模型。這時(shí)還不能用這時(shí)還不能用OLSOLS直接估計(jì),因?yàn)殡S機(jī)誤差項(xiàng)直接估計(jì),因?yàn)殡S機(jī)誤差項(xiàng)的的性質(zhì)還沒考慮。性質(zhì)還沒考慮。iiinPNiP1l n ()1iiiPLP2iX第35頁(yè)/共58頁(yè)隨機(jī)誤差項(xiàng)的滿足如下分布:隨機(jī)誤差項(xiàng)的滿足如下分布:顯然模型中存在異方差,因此我們考慮使用加權(quán)最小顯然模型中存在異方
28、差,因此我們考慮使用加權(quán)最小二乘法,權(quán)重取。用代替則可求出。二乘法,權(quán)重取。用代替則可求出。10,(1)iiiiuNN PP21iiPiP2i21(1)iiN PiP第36頁(yè)/共58頁(yè)總結(jié)估計(jì)對(duì)數(shù)單位模型的各個(gè)步驟:總結(jié)估計(jì)對(duì)數(shù)單位模型的各個(gè)步驟:1 1、對(duì)每一收入水平,計(jì)算擁有住房的概率、對(duì)每一收入水平,計(jì)算擁有住房的概率。2 2、求每一的對(duì)數(shù)單位、求每一的對(duì)數(shù)單位3 3、作如下變換、作如下變換消除異方差,其中。消除異方差,其中。4 4、用過原點(diǎn)回顧的、用過原點(diǎn)回顧的OLSOLS估計(jì)上式。估計(jì)上式。5 5、按普通最小二乘法建立置信區(qū)間和假設(shè)檢、按普通最小二乘法建立置信區(qū)間和假設(shè)檢驗(yàn)。驗(yàn)。iX
29、iiiPn N12iiiiiiiw Lww Xw ulniL /(1iP)iPiXiiiwN P(1)iP第37頁(yè)/共58頁(yè)9對(duì)數(shù)單位模型的例子這里只是通過演算一個(gè)數(shù)值問題,以促進(jìn)對(duì)這里只是通過演算一個(gè)數(shù)值問題,以促進(jìn)對(duì)對(duì)數(shù)單位模型的理解對(duì)數(shù)單位模型的理解( (具體數(shù)據(jù)略具體數(shù)據(jù)略) )。用加權(quán)最小二乘法可以求出如下結(jié)果:用加權(quán)最小二乘法可以求出如下結(jié)果:對(duì)于系數(shù)經(jīng)濟(jì)意義的解釋可以參照書上的解釋。對(duì)于系數(shù)經(jīng)濟(jì)意義的解釋可以參照書上的解釋。*221.59320.0787( 14.290)(14.4456)0.96370.2921iiiLwXtR 第38頁(yè)/共58頁(yè)10概率單位模型為了解釋二分應(yīng)變
30、量,有必要使用適當(dāng)為了解釋二分應(yīng)變量,有必要使用適當(dāng)CDFCDF。對(duì)數(shù)單位模型使用的是累積邏。對(duì)數(shù)單位模型使用的是累積邏輯斯蒂函數(shù)。在實(shí)際應(yīng)用中發(fā)現(xiàn)正態(tài)輯斯蒂函數(shù)。在實(shí)際應(yīng)用中發(fā)現(xiàn)正態(tài)CDFCDF效果也不錯(cuò)。使用正態(tài)效果也不錯(cuò)。使用正態(tài)CDFCDF的估的估計(jì)模型通常稱為概率單位模型。計(jì)模型通常稱為概率單位模型。引入概率單位模型有兩種途徑:一是模仿前面邏輯斯蒂函數(shù)的形式,直接引入概率單位模型有兩種途徑:一是模仿前面邏輯斯蒂函數(shù)的形式,直接用正態(tài)分布函數(shù)替換;二是依據(jù)用正態(tài)分布函數(shù)替換;二是依據(jù)麥克法登麥克法登的效用理論或行為的理性選擇的效用理論或行為的理性選擇引入概率單位模型。引入概率單位模型。
31、第39頁(yè)/共58頁(yè)下面根據(jù)效用理論闡明使用概率單位模型的動(dòng)機(jī)。下面根據(jù)效用理論闡明使用概率單位模型的動(dòng)機(jī)。表示一種不可觀測(cè)的效用指數(shù),表示收入,仍表示一種不可觀測(cè)的效用指數(shù),表示收入,仍然研究家庭擁有住房的概率。然研究家庭擁有住房的概率。當(dāng)越大時(shí),認(rèn)為擁有住房的概率越大。當(dāng)越大時(shí),認(rèn)為擁有住房的概率越大。現(xiàn)在假定有這樣一個(gè)臨界值,當(dāng)現(xiàn)在假定有這樣一個(gè)臨界值,當(dāng) 時(shí),該時(shí),該家庭擁有住房,否則不擁有。家庭擁有住房,否則不擁有。iIiX12iiIXiI*iI*iiII第40頁(yè)/共58頁(yè)在正態(tài)性假定下,的概率可由標(biāo)準(zhǔn)化正態(tài)在正態(tài)性假定下,的概率可由標(biāo)準(zhǔn)化正態(tài)CDFCDF算出。算出。t t是標(biāo)準(zhǔn)化正態(tài)
32、變量,。是標(biāo)準(zhǔn)化正態(tài)變量,。*iIII2*/21Pr(1)Pr()( )2iItiiiiPYIIF Iedt212/212iXtedt(0,1)tN第41頁(yè)/共58頁(yè)第42頁(yè)/共58頁(yè)( )iiPF I12iiIX1iP*Pr()iiII( )iiPF I1( )iiIFP1iP(a)(b)第43頁(yè)/共58頁(yè)根據(jù)獲得關(guān)于效用函數(shù)以及和的信息,根據(jù)獲得關(guān)于效用函數(shù)以及和的信息,可可得到:得到:如果我們掌握了表如果我們掌握了表16.716.7的分組數(shù)據(jù),便可由的分組數(shù)據(jù),便可由計(jì)計(jì)算出,一旦有了,就可很輕松的估計(jì)和算出,一旦有了,就可很輕松的估計(jì)和在對(duì)數(shù)單位分析中,被稱為正態(tài)等效離差在對(duì)數(shù)單位分析
33、中,被稱為正態(tài)等效離差(n.e.d.)(n.e.d.)。當(dāng)時(shí),將是負(fù)數(shù),在實(shí)。當(dāng)時(shí),將是負(fù)數(shù),在實(shí)際際中通常把中通常把5 5加到上,其結(jié)果稱為概率單位加到上,其結(jié)果稱為概率單位. .iI1211( )( )iiiIFIFP12iXiPiIiI12iI0.5iP iIiI第44頁(yè)/共58頁(yè)現(xiàn)在估計(jì)和。通過下面的式子:現(xiàn)在估計(jì)和。通過下面的式子:概率單位模型的估計(jì)步驟:概率單位模型的估計(jì)步驟:1 1、從分組數(shù)據(jù)中估計(jì)出。、從分組數(shù)據(jù)中估計(jì)出。2 2、根據(jù),從標(biāo)準(zhǔn)正態(tài)、根據(jù),從標(biāo)準(zhǔn)正態(tài)CDFCDF中求出中求出n.e.d.n.e.d.3 3、用作為回歸的應(yīng)變量。、用作為回歸的應(yīng)變量。4 4、由于隨機(jī)誤
34、差項(xiàng)存在異方差,因此還要進(jìn)行、由于隨機(jī)誤差項(xiàng)存在異方差,因此還要進(jìn)行數(shù)據(jù)轉(zhuǎn)換或用數(shù)據(jù)轉(zhuǎn)換或用WLSWLS估計(jì)出最后結(jié)果。估計(jì)出最后結(jié)果。5 5、用普通方式進(jìn)行假設(shè)檢驗(yàn),但得到的結(jié)果只、用普通方式進(jìn)行假設(shè)檢驗(yàn),但得到的結(jié)果只在大樣本下有效,同時(shí)已沒有多大價(jià)值在大樣本下有效,同時(shí)已沒有多大價(jià)值Pr. . .5obitned1212iiiIXuiPiPiIiI2R第45頁(yè)/共58頁(yè)11概率單位模型的例子根據(jù)所給的數(shù)據(jù),可以估計(jì)出如下結(jié)果。根據(jù)所給的數(shù)據(jù),可以估計(jì)出如下結(jié)果。以以n.e.d.n.e.d.作為應(yīng)變量:作為應(yīng)變量:以概率單位作為應(yīng)變量:以概率單位作為應(yīng)變量:除截距外,兩種回歸結(jié)果沒有差別。
35、除截距外,兩種回歸結(jié)果沒有差別。21.00880.0481( 17.330)(19.105)0.9786iiIXtR 2Pr3.9911 0.0481(68.560)(19.105)0.9786iiobitXtR第46頁(yè)/共58頁(yè)比較對(duì)數(shù)單位與概率單位的估計(jì)值比較對(duì)數(shù)單位與概率單位的估計(jì)值雖然對(duì)數(shù)單位模型和概率單位模型給出性質(zhì)雖然對(duì)數(shù)單位模型和概率單位模型給出性質(zhì)相同的結(jié)果,但是兩個(gè)模型參數(shù)的估計(jì)值不相同的結(jié)果,但是兩個(gè)模型參數(shù)的估計(jì)值不可直接比較。一般兩者參數(shù)有如下關(guān)系:可直接比較。一般兩者參數(shù)有如下關(guān)系:另外,另外,LPMLPM的系數(shù)與對(duì)數(shù)單位模型的系數(shù)有如的系數(shù)與對(duì)數(shù)單位模型的系數(shù)有如下下關(guān)系:關(guān)系:不含截距項(xiàng)不含截距項(xiàng)時(shí)時(shí)含有截距項(xiàng)含有截距項(xiàng)時(shí)時(shí)logPr0.625itobitlog0.25LPMitlog0.250.5LPMit第47頁(yè)/共58頁(yè)12托比模型托比模型是概率單位模型的延伸,他研究的托比模型是概率單位模型的延伸,他研究的是一類僅對(duì)某些觀測(cè)有應(yīng)變量的觀測(cè)值的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 斯美防務(wù)合作協(xié)議
- 2025年度個(gè)人商鋪出租信息發(fā)布合同2篇
- 2025版新能源發(fā)電線路建設(shè)項(xiàng)目合同書3篇
- 2025版文化遺址物業(yè)保護(hù)及轉(zhuǎn)讓合同范本匯編3篇
- 2025版外架班組勞務(wù)分包及技術(shù)創(chuàng)新合同3篇
- 2024年全國(guó)營(yíng)養(yǎng)師技能大賽江蘇省賽考試題庫(kù)(附答案) (二)
- 2025年全球及中國(guó)漸變折射率多模光纖行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2024年教育公共基礎(chǔ)知識(shí)筆記
- 2025版新型環(huán)保砂石料生產(chǎn)及銷售合作協(xié)議3篇
- 2025年度個(gè)人私有房屋購(gòu)買合同(家居定制服務(wù)版)3篇
- 垃圾處理廠工程施工組織設(shè)計(jì)
- 天皰瘡患者護(hù)理
- 機(jī)電一體化系統(tǒng)設(shè)計(jì)-第5章-特性分析
- 2025年高考物理復(fù)習(xí)壓軸題:電磁感應(yīng)綜合問題(原卷版)
- 雨棚鋼結(jié)構(gòu)施工組織設(shè)計(jì)正式版
- 2025年蛇年新年金蛇賀歲金蛇狂舞春添彩玉樹臨風(fēng)福滿門模板
- 《建筑制圖及陰影透視(第2版)》課件 4-直線的投影
- 2024-2030年中國(guó)IVD(體外診斷)測(cè)試行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略分析報(bào)告
- 碎紙機(jī)設(shè)計(jì)說明書
- 湖南省長(zhǎng)沙市青竹湖湘一外國(guó)語(yǔ)學(xué)校2021-2022學(xué)年八年級(jí)下學(xué)期期中語(yǔ)文試題
- 2024年股權(quán)代持協(xié)議經(jīng)典版(3篇)
評(píng)論
0/150
提交評(píng)論