模型設(shè)定和虛擬變量專題之虛擬變量課件_第1頁
模型設(shè)定和虛擬變量專題之虛擬變量課件_第2頁
模型設(shè)定和虛擬變量專題之虛擬變量課件_第3頁
模型設(shè)定和虛擬變量專題之虛擬變量課件_第4頁
模型設(shè)定和虛擬變量專題之虛擬變量課件_第5頁
已閱讀5頁,還剩93頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1第五講模型設(shè)定和虛擬變量專題

之虛擬變量

y=b0+b1x1+b2x2+...bkxk+u

1第五講模型設(shè)定和虛擬變量專題y=b0+b1x12前言前面有關(guān)多元回歸模型的因變量和自變量都具有定量的含義,如小時工資率、受教育年數(shù),大學(xué)平均成績、企業(yè)銷售水平等等。在經(jīng)驗分析中,每個變量的大小都傳遞了有用的信息,然而,經(jīng)驗分析還常常碰到定性的問題,如,一個人的性別、種族、企業(yè)所屬行業(yè)以及城市所處的地理位置等等,當(dāng)考慮這些因素作為變量時,則必須采用虛擬變量設(shè)置。2前言前面有關(guān)多元回歸模型的因變量和自變量都具有定量的含義前言其中,如果我們把上述定性變量作為自變量,就是本章要講的虛擬變量設(shè)置,并估計的問題。如果我們把上述定性變量作為因變量,則為線性概率模型,這些在微觀計量經(jīng)濟(jì)學(xué)中用的比較多,教材也闡述一些,但是本章不講解該部分的內(nèi)容,因為如果講清楚需要很足夠時間,如果提到當(dāng)講不清楚,不如不講,等后面以后再學(xué)之。3前言其中,如果我們把上述定性變量作為自變量,就是本章要講的問題定性問題經(jīng)常以二值信息形式出現(xiàn):一個人是男還是女,結(jié)婚與否,一個人有還沒有一臺電腦等等。該問題可通過定義一個二值變量(binaryvariable)或一個0-1變量來刻畫,此變量即為虛擬變量(dummyvariable)

那么如何引入虛擬變量呢?4問題定性問題經(jīng)常以二值信息形式出現(xiàn):一個人是男還是女,結(jié)婚與舉例:一個虛擬變量設(shè)置設(shè)置原理如下:

虛擬變量的取值

虛擬變量的作用:舉例,如類別變量性別變量5舉例:一個虛擬變量設(shè)置設(shè)置原理如下:5設(shè)置方式兩種設(shè)置方式:(1)

保留常數(shù)項和其中一個虛擬變量(2)

6設(shè)置方式兩種設(shè)置方式:6舉例:多虛擬變量舉例:季節(jié)變量有四個狀態(tài)7舉例:多虛擬變量舉例:季節(jié)變量有四個狀態(tài)7虛擬變量系數(shù)分析

通過例子的形式介紹虛擬變量系數(shù)的含義:例子:

虛擬變量

,那么在其他條件相同的情況下,女人總體上掙的錢要比男人少。8虛擬變量系數(shù)分析

通過例子的形式介紹虛擬變量系數(shù)的含義:89Exampleofd0>0xy{d0}b0y=(b0+d0)+b1xy=b0+b1xslope=b1d=0d=19Exampleofd0>0xy{d0}b0y=101011例7.1是否存在性別歧視注意t值檢驗,同時,通常的對一個常數(shù)和一個虛擬變量進(jìn)行簡單回歸時,是比較兩組均值的直接方法,要通常的t統(tǒng)計量生效,我們還必須假定同方差性,這就意味著,對男人和女人而言,工資的總體方程式相同的。11例7.1是否存在性別歧視注意t值檢驗,同時,通常的對一12例7.2擁有計算機與大學(xué)GPA12例7.2擁有計算機與大學(xué)GPA13例7.3培訓(xùn)津貼對培訓(xùn)小時數(shù)的影響問題的關(guān)鍵是:定性變量所度量的影響是否為因果性?辦法之一是,盡可能控制與虛擬變量及因變量相關(guān)的因素。13例7.3培訓(xùn)津貼對培訓(xùn)小時數(shù)的影響問題的關(guān)鍵是:定性變14當(dāng)因變量為log(y)時對虛擬變量系數(shù)的解釋當(dāng)自變量中有一個或多個虛擬變量時,因變量以對數(shù)形式出現(xiàn),虛擬變量的系數(shù)具有一種百分比解釋。在保持其他因素不變的情況下,一套殖民地建筑風(fēng)格的住房的賣價預(yù)計高出約5.4%。14當(dāng)因變量為log(y)時對虛擬變量系數(shù)的解釋當(dāng)自變量中有15當(dāng)y有較大比例變化時,如何更準(zhǔn)確估計y變化的百分比?15當(dāng)y有較大比例變化時,如何更準(zhǔn)確估計y變化的百分比?161617多元分類的虛擬變量在應(yīng)用研究中,我們需要使用多個虛擬變量。在控制性別的基礎(chǔ)上,研究婚姻狀態(tài)的影響;在區(qū)域研究中,往往區(qū)分東、中、西部;在省級面板數(shù)據(jù)中,甚至?xí)雗-1個地區(qū)虛擬變量。虛擬變量可以描述包含序數(shù)的信息:信用等級17多元分類的虛擬變量在應(yīng)用研究中,我們需要使用多個虛擬變量18例7.6工資方程估計一個工資對如下四組都不同的模型:已婚男人、已婚女人、單身男人、單身女人。首先選擇基組:單身男人,對剩下的每一組定義一個虛擬變量,并稱之為marrmal,marrfem,和singfem。因此,三個虛擬變量的估計量度量的都是與單身男人相比,工資的比例差異。18例7.6工資方程估計一個工資對如下四組都不同的模型:已19如果要比較特定兩組之間工資的差異,可以重新設(shè)定基組進(jìn)行回歸分析。例如,為檢驗單身女人和已婚女人之間的估計差異是否顯著,以已婚女人組作為基組重新估計得到:在方程中包括虛擬變量來象征不同組的一般原則:如果回歸模型有g(shù)組或g類不同的截距,在模型中則包含g-1個虛擬變量和一個1截距。19如果要比較特定兩組之間工資的差異,可以重新設(shè)定基組進(jìn)行回20通過虛擬變量來包含序數(shù)信息序數(shù)變量:穆迪或標(biāo)準(zhǔn)普爾對地方政府債券的質(zhì)量進(jìn)行了級別評定,假設(shè)等級范圍從零到四,零為最低的信用等級,四位最高的信用等級,記為CR。然而,很難有意義地解釋CR變化一個單位對MBR的影響。20通過虛擬變量來包含序數(shù)信息序數(shù)變量:穆迪或標(biāo)準(zhǔn)普爾對地方212122例7.7相貌吸引力對工資的影響在勞動力市場中,除了存在性別歧視之外,還可能存在相貌、身高等歧視。如果將樣本相貌分為三類:一般水平、低于一般水平、高于一般水平,并以一般水平組作為基組,分別對男人、女人估計方程得:22例7.7相貌吸引力對工資的影響在勞動力市場中,除了存在232324例7.8法學(xué)院排名對起薪的影響24例7.8法學(xué)院排名對起薪的影響252526涉及虛擬變量的交互作用虛擬變量之間的交互作用例7.6根據(jù)婚姻狀況和性別定義了四個類別,在模型中引入三個虛擬變量,以單身男性為基組研究了不同類別之間的工資差異。除此之外,還有什么方法?26涉及虛擬變量的交互作用虛擬變量之間的交互作用27此外,我們還可以在female和married分別出現(xiàn)的模型中,增加一個female和married的交互項,同樣可以進(jìn)行組別工資差異比較。27此外,我們還可以在female和married分別出現(xiàn)的28例7.9計算機使用對工資的影響28例7.9計算機使用對工資的影響29容許出現(xiàn)不同的斜率虛擬變量之間的交互項反映的是截距之間的差異,斜率并未發(fā)生變化。含義是:樣本回歸曲線是平行的。虛擬變量與非虛擬變量之間也有交互作用,使得出現(xiàn)不同的斜率。29容許出現(xiàn)不同的斜率虛擬變量之間的交互項反映的是截距之間的303031我們關(guān)心的兩個假設(shè):男性和女性受教育的回報是相同的。受教育水平相同的男性和女性的平均工資相同。31我們關(guān)心的兩個假設(shè):32例7.10對數(shù)小時工資方程32例7.10對數(shù)小時工資方程333334檢驗不同組之間回歸函數(shù)上的差別現(xiàn)在,我們考察的虛擬假設(shè)是:兩個總體或兩組具有同一個回歸函數(shù);對立假設(shè)是,各組間有一個或多個斜率是不同的。34檢驗不同組之間回歸函數(shù)上的差別現(xiàn)在,我們考察的虛擬假設(shè)是3535363637一般的檢驗方法:鄒至莊統(tǒng)計量37一般的檢驗方法:鄒至莊統(tǒng)計量38鄒至莊檢驗的步驟:確立回歸的一般模型,明確受約束模型和不受約束模型的自由度。(約束個數(shù):k+1)分別將兩組進(jìn)行回歸得到SSR1和SSR2。將兩組數(shù)據(jù)混合并重新估計模型得到受約束模型的殘差平方和SSR.運用公式計算鄒統(tǒng)計量,檢驗顯著性水平。38鄒至莊檢驗的步驟:確立回歸的一般模型,明確受約束模型和不3939407.5二值因變量:線性概率模型*迄今為止,我們討論的因變量均具有定量的含義。如果用多元回歸解釋一個定性事件,需引入二值因變量,即y只取0和1兩個值。例如,y表示一個成年人是否受過高中教育,或一個大學(xué)生在給定年份是否用過非法毒品等。407.5二值因變量:線性概率模型*迄今為止,我們討論的414142424317431744444545467.6對政策分析和項目評價的進(jìn)一步討論

——內(nèi)生性問題在社會科學(xué)研究中,對照組和處理組并不是隨機指定的,因此可能遭遇變量內(nèi)生性問題。467.6對政策分析和項目評價的進(jìn)一步討論

—474748自選擇(self-selection)問題個人自己選擇加入某種行為或項目的事實:參與并不是隨機決定的。48自選擇(self-selection)問題個人自己選擇加49謝謝!49謝謝!50第五講模型設(shè)定和虛擬變量專題

之虛擬變量

y=b0+b1x1+b2x2+...bkxk+u

1第五講模型設(shè)定和虛擬變量專題y=b0+b1x151前言前面有關(guān)多元回歸模型的因變量和自變量都具有定量的含義,如小時工資率、受教育年數(shù),大學(xué)平均成績、企業(yè)銷售水平等等。在經(jīng)驗分析中,每個變量的大小都傳遞了有用的信息,然而,經(jīng)驗分析還常常碰到定性的問題,如,一個人的性別、種族、企業(yè)所屬行業(yè)以及城市所處的地理位置等等,當(dāng)考慮這些因素作為變量時,則必須采用虛擬變量設(shè)置。2前言前面有關(guān)多元回歸模型的因變量和自變量都具有定量的含義前言其中,如果我們把上述定性變量作為自變量,就是本章要講的虛擬變量設(shè)置,并估計的問題。如果我們把上述定性變量作為因變量,則為線性概率模型,這些在微觀計量經(jīng)濟(jì)學(xué)中用的比較多,教材也闡述一些,但是本章不講解該部分的內(nèi)容,因為如果講清楚需要很足夠時間,如果提到當(dāng)講不清楚,不如不講,等后面以后再學(xué)之。52前言其中,如果我們把上述定性變量作為自變量,就是本章要講的問題定性問題經(jīng)常以二值信息形式出現(xiàn):一個人是男還是女,結(jié)婚與否,一個人有還沒有一臺電腦等等。該問題可通過定義一個二值變量(binaryvariable)或一個0-1變量來刻畫,此變量即為虛擬變量(dummyvariable)

那么如何引入虛擬變量呢?53問題定性問題經(jīng)常以二值信息形式出現(xiàn):一個人是男還是女,結(jié)婚與舉例:一個虛擬變量設(shè)置設(shè)置原理如下:

虛擬變量的取值

虛擬變量的作用:舉例,如類別變量性別變量54舉例:一個虛擬變量設(shè)置設(shè)置原理如下:5設(shè)置方式兩種設(shè)置方式:(1)

保留常數(shù)項和其中一個虛擬變量(2)

55設(shè)置方式兩種設(shè)置方式:6舉例:多虛擬變量舉例:季節(jié)變量有四個狀態(tài)56舉例:多虛擬變量舉例:季節(jié)變量有四個狀態(tài)7虛擬變量系數(shù)分析

通過例子的形式介紹虛擬變量系數(shù)的含義:例子:

虛擬變量

,那么在其他條件相同的情況下,女人總體上掙的錢要比男人少。57虛擬變量系數(shù)分析

通過例子的形式介紹虛擬變量系數(shù)的含義:858Exampleofd0>0xy{d0}b0y=(b0+d0)+b1xy=b0+b1xslope=b1d=0d=19Exampleofd0>0xy{d0}b0y=591060例7.1是否存在性別歧視注意t值檢驗,同時,通常的對一個常數(shù)和一個虛擬變量進(jìn)行簡單回歸時,是比較兩組均值的直接方法,要通常的t統(tǒng)計量生效,我們還必須假定同方差性,這就意味著,對男人和女人而言,工資的總體方程式相同的。11例7.1是否存在性別歧視注意t值檢驗,同時,通常的對一61例7.2擁有計算機與大學(xué)GPA12例7.2擁有計算機與大學(xué)GPA62例7.3培訓(xùn)津貼對培訓(xùn)小時數(shù)的影響問題的關(guān)鍵是:定性變量所度量的影響是否為因果性?辦法之一是,盡可能控制與虛擬變量及因變量相關(guān)的因素。13例7.3培訓(xùn)津貼對培訓(xùn)小時數(shù)的影響問題的關(guān)鍵是:定性變63當(dāng)因變量為log(y)時對虛擬變量系數(shù)的解釋當(dāng)自變量中有一個或多個虛擬變量時,因變量以對數(shù)形式出現(xiàn),虛擬變量的系數(shù)具有一種百分比解釋。在保持其他因素不變的情況下,一套殖民地建筑風(fēng)格的住房的賣價預(yù)計高出約5.4%。14當(dāng)因變量為log(y)時對虛擬變量系數(shù)的解釋當(dāng)自變量中有64當(dāng)y有較大比例變化時,如何更準(zhǔn)確估計y變化的百分比?15當(dāng)y有較大比例變化時,如何更準(zhǔn)確估計y變化的百分比?651666多元分類的虛擬變量在應(yīng)用研究中,我們需要使用多個虛擬變量。在控制性別的基礎(chǔ)上,研究婚姻狀態(tài)的影響;在區(qū)域研究中,往往區(qū)分東、中、西部;在省級面板數(shù)據(jù)中,甚至?xí)雗-1個地區(qū)虛擬變量。虛擬變量可以描述包含序數(shù)的信息:信用等級17多元分類的虛擬變量在應(yīng)用研究中,我們需要使用多個虛擬變量67例7.6工資方程估計一個工資對如下四組都不同的模型:已婚男人、已婚女人、單身男人、單身女人。首先選擇基組:單身男人,對剩下的每一組定義一個虛擬變量,并稱之為marrmal,marrfem,和singfem。因此,三個虛擬變量的估計量度量的都是與單身男人相比,工資的比例差異。18例7.6工資方程估計一個工資對如下四組都不同的模型:已68如果要比較特定兩組之間工資的差異,可以重新設(shè)定基組進(jìn)行回歸分析。例如,為檢驗單身女人和已婚女人之間的估計差異是否顯著,以已婚女人組作為基組重新估計得到:在方程中包括虛擬變量來象征不同組的一般原則:如果回歸模型有g(shù)組或g類不同的截距,在模型中則包含g-1個虛擬變量和一個1截距。19如果要比較特定兩組之間工資的差異,可以重新設(shè)定基組進(jìn)行回69通過虛擬變量來包含序數(shù)信息序數(shù)變量:穆迪或標(biāo)準(zhǔn)普爾對地方政府債券的質(zhì)量進(jìn)行了級別評定,假設(shè)等級范圍從零到四,零為最低的信用等級,四位最高的信用等級,記為CR。然而,很難有意義地解釋CR變化一個單位對MBR的影響。20通過虛擬變量來包含序數(shù)信息序數(shù)變量:穆迪或標(biāo)準(zhǔn)普爾對地方702171例7.7相貌吸引力對工資的影響在勞動力市場中,除了存在性別歧視之外,還可能存在相貌、身高等歧視。如果將樣本相貌分為三類:一般水平、低于一般水平、高于一般水平,并以一般水平組作為基組,分別對男人、女人估計方程得:22例7.7相貌吸引力對工資的影響在勞動力市場中,除了存在722373例7.8法學(xué)院排名對起薪的影響24例7.8法學(xué)院排名對起薪的影響742575涉及虛擬變量的交互作用虛擬變量之間的交互作用例7.6根據(jù)婚姻狀況和性別定義了四個類別,在模型中引入三個虛擬變量,以單身男性為基組研究了不同類別之間的工資差異。除此之外,還有什么方法?26涉及虛擬變量的交互作用虛擬變量之間的交互作用76此外,我們還可以在female和married分別出現(xiàn)的模型中,增加一個female和married的交互項,同樣可以進(jìn)行組別工資差異比較。27此外,我們還可以在female和married分別出現(xiàn)的77例7.9計算機使用對工資的影響28例7.9計算機使用對工資的影響78容許出現(xiàn)不同的斜率虛擬變量之間的交互項反映的是截距之間的差異,斜率并未發(fā)生變化。含義是:樣本回歸曲線是平行的。虛擬變量與非虛擬變量之間也有交互作用,使得出現(xiàn)不同的斜率。29容許出現(xiàn)不同的斜率虛擬變量之間的交互項反映的是截距之間的793080我們關(guān)心的兩個假設(shè):男性和女性受教育的回報是相同的。受教育水平相同的男性和女性的平均工資相同。31我們關(guān)心的兩個假設(shè):81例7.10對數(shù)小時工資方程32例7.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論