36-虛擬變量模型-計(jì)量經(jīng)濟(jì)學(xué)課件_第1頁(yè)
36-虛擬變量模型-計(jì)量經(jīng)濟(jì)學(xué)課件_第2頁(yè)
36-虛擬變量模型-計(jì)量經(jīng)濟(jì)學(xué)課件_第3頁(yè)
36-虛擬變量模型-計(jì)量經(jīng)濟(jì)學(xué)課件_第4頁(yè)
36-虛擬變量模型-計(jì)量經(jīng)濟(jì)學(xué)課件_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

§3.6含有虛擬變量的多元線(xiàn)性回歸模型

一、含有虛擬變量的模型一、虛擬變量的引入二、虛擬變量的設(shè)置原則

§3.6含有虛擬變量的多元線(xiàn)性回歸模型一、含有虛擬變量1一、含有虛擬變量的模型一、含有虛擬變量的模型21、虛擬變量(dummyvariables)許多經(jīng)濟(jì)變量是可以定量度量。一些影響經(jīng)濟(jì)變量的因素是無(wú)法定量度量。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。這種“量化”通常是通過(guò)引入“虛擬變量”來(lái)完成的。根據(jù)這些因素的屬性類(lèi)型,構(gòu)造只取“0”或“1”的人工變量,通常稱(chēng)為虛擬變量,記為D。虛擬變量只作為解釋變量。1、虛擬變量(dummyvariables)許多經(jīng)濟(jì)變量是3一般地,在虛擬變量的設(shè)置中:

基礎(chǔ)類(lèi)型、肯定類(lèi)型取值為1;比較類(lèi)型,否定類(lèi)型取值為0。例如,反映文程度的虛擬變量可取為:D=1,本科學(xué)歷D=0,非本科學(xué)歷虛擬變量能否取1、0以外的數(shù)值?一般地,在虛擬變量的設(shè)置中:42、虛擬變量模型同時(shí)含有一般解釋變量與虛擬變量的模型稱(chēng)為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。例如,一個(gè)以性別為虛擬變量考察企業(yè)職工薪金的模型:其中:Yi為企業(yè)職工的薪金;Xi為工齡;Di=1,若是男性,Di=0,若是女性。2、虛擬變量模型同時(shí)含有一般解釋變量與虛擬變量的模型稱(chēng)為虛擬5二、虛擬變量的引入二、虛擬變量的引入61、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(i)=0,則企業(yè)男、女職工的平均薪金為:1、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法7假定2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,男女職工平均薪金對(duì)工齡的變化率是一樣的,但兩者的平均薪金水平相差2。可以通過(guò)對(duì)2的統(tǒng)計(jì)顯著性進(jìn)行檢驗(yàn),以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。02假定2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,8將上例中的性別換成教育水平,教育水平考慮三個(gè)層次:高中以下、高中、大學(xué)及其以上。高中以下高中大學(xué)及以上將上例中的性別換成教育水平,教育水平考慮三個(gè)層次:高中以下、9在上例中同時(shí)引入性別和教育水平:在上例中同時(shí)引入性別和教育水平:10女職工本科以下學(xué)歷的平均薪金:女職工本科以上學(xué)歷的平均薪金:男職工本科以下學(xué)歷的平均薪金:男職工本科以上學(xué)歷的平均薪金:女職工本科以下學(xué)歷的平均薪金:女職工本科以上學(xué)歷的平均薪金:112、乘法方式加法方式引入虛擬變量,考察:截距的不同。許多情況下,斜率發(fā)生變化,或斜率、截距同時(shí)發(fā)生變化。斜率的變化可通過(guò)以乘法的方式引入虛擬變量來(lái)測(cè)度。2、乘法方式加法方式引入虛擬變量,考察:截距的不同。12例如,根據(jù)消費(fèi)理論,收入決定消費(fèi)。但是,農(nóng)村居民和城鎮(zhèn)居民的邊際消費(fèi)傾向往往是不同的。這種消費(fèi)傾向的不同可通過(guò)在消費(fèi)函數(shù)中引入虛擬變量來(lái)考察。農(nóng)村居民:城鎮(zhèn)居民:例如,根據(jù)消費(fèi)理論,收入決定消費(fèi)。但是,農(nóng)村居民和城鎮(zhèn)居民的133、同時(shí)引入加法與乘法形式的虛擬變量當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入加法與乘法形式的虛擬變量。對(duì)于一元模型,有兩組樣本,則有可能出現(xiàn)下述四種情況中的一種:

1=1,且2=2,即兩個(gè)回歸相同,稱(chēng)為重合回歸(CoincidentRegressions);11,但2=2,即兩個(gè)回歸的差異僅在其截距,稱(chēng)為平行回歸(ParallelRegressions);1=1,但22,即兩個(gè)回歸的差異僅在其斜率,稱(chēng)為匯合回歸(ConcurrentRegressions);11,且22,即兩個(gè)回歸完全不同,稱(chēng)為相異回歸(DissimilarRegressions)。3、同時(shí)引入加法與乘法形式的虛擬變量當(dāng)截距與斜率發(fā)生變化時(shí),144、例題判斷中國(guó)農(nóng)村居民與城鎮(zhèn)居民的消費(fèi)行為是否有顯著差異。被解釋變量:居民家庭人均生活消費(fèi)支出Y解釋變量:居民家庭人均工資收入X1、其他收入X2樣本:2013年31個(gè)地區(qū)農(nóng)村居民與城鎮(zhèn)居民人均數(shù)據(jù)虛擬變量Di:農(nóng)村居民取值1,城鎮(zhèn)居民取值0

4、例題判斷中國(guó)農(nóng)村居民與城鎮(zhèn)居民的消費(fèi)行為是否有顯著差異。15由變量顯著性檢驗(yàn)得到:在10%的顯著性水平下,Di和DiXi1是顯著的,而DiXi2不顯著。因此:2013年農(nóng)村居民的平均消費(fèi)支出要比城鎮(zhèn)居民少1573.9元;在其他條件不變的情況下,農(nóng)村居民與城鎮(zhèn)居民的工資收入都增加100元時(shí),農(nóng)村居民要比城鎮(zhèn)居民多支出19元用于生活消費(fèi);農(nóng)村居民與城鎮(zhèn)居民在其他收入方面有相同的增加量時(shí),兩者增加的消費(fèi)支出沒(méi)有顯著差異??傮w回歸模型樣本回歸函數(shù)由變量顯著性檢驗(yàn)得到:在10%的顯著性水平下,Di和DiXi16三、虛擬變量的設(shè)置原則三、虛擬變量的設(shè)置原則17每一定性變量(qualitativevariable)所需的虛擬變量個(gè)數(shù)要比該定性變量的狀態(tài)類(lèi)別數(shù)(categories)少1。即如果有m種狀態(tài),只在模型中引入m-1個(gè)虛擬變量。例如,季節(jié)定性變量有春、夏、秋、冬4種狀態(tài),只需要設(shè)置3個(gè)虛變量:

如果設(shè)置第4個(gè)虛變量,則出現(xiàn)“虛擬變量陷井”(DummyVariableTrap)。為什么?每一定性變量(qualitativevariable)所需18例如:包含季節(jié)變量的正確模型:解釋變量完全共線(xiàn)性錯(cuò)誤模型例如:包含季節(jié)變量的正確模型:解釋變量完全共線(xiàn)性錯(cuò)誤模型19如果在服裝需求函數(shù)模型中必須包含3個(gè)定性變量:季節(jié)(4種狀態(tài))、性別(2種狀態(tài))、職業(yè)(5種狀態(tài)),應(yīng)該設(shè)置多少虛變量?模型含常數(shù)項(xiàng)模型不含常數(shù)項(xiàng)如果在服裝需求函數(shù)模型中必須包含3個(gè)定性變量:季節(jié)(4種狀態(tài)20討論:定序定性變量可否按照狀態(tài)賦值?例如:表示居民對(duì)某種服務(wù)的滿(mǎn)意程度,分5種狀態(tài):非常不滿(mǎn)意、一般不滿(mǎn)意、無(wú)所謂、一般滿(mǎn)意、非常滿(mǎn)意。在模型中按照狀態(tài)分別賦值0、1、2、3、4或者-2、-1、0、1、2。被經(jīng)常采用,尤其在管理學(xué)、社會(huì)學(xué)研究領(lǐng)域。正確的方法:設(shè)置多個(gè)虛擬變量,理論上正確,帶來(lái)自由度損失。以定性變量為研究對(duì)象,構(gòu)造多元排序離散選擇模型,然后以模型結(jié)果對(duì)定性變量的各種狀態(tài)賦值。但需要更多的信息支持。賦值的方法等于是對(duì)虛變量方法中的各個(gè)虛變量的參數(shù)施加了約束,而這種約束經(jīng)常被檢驗(yàn)為錯(cuò)誤的。討論:定序定性變量可否按照狀態(tài)賦值?例如:表示居民對(duì)某種服務(wù)21§3.6含有虛擬變量的多元線(xiàn)性回歸模型

一、含有虛擬變量的模型一、虛擬變量的引入二、虛擬變量的設(shè)置原則

§3.6含有虛擬變量的多元線(xiàn)性回歸模型一、含有虛擬變量22一、含有虛擬變量的模型一、含有虛擬變量的模型231、虛擬變量(dummyvariables)許多經(jīng)濟(jì)變量是可以定量度量。一些影響經(jīng)濟(jì)變量的因素是無(wú)法定量度量。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。這種“量化”通常是通過(guò)引入“虛擬變量”來(lái)完成的。根據(jù)這些因素的屬性類(lèi)型,構(gòu)造只取“0”或“1”的人工變量,通常稱(chēng)為虛擬變量,記為D。虛擬變量只作為解釋變量。1、虛擬變量(dummyvariables)許多經(jīng)濟(jì)變量是24一般地,在虛擬變量的設(shè)置中:

基礎(chǔ)類(lèi)型、肯定類(lèi)型取值為1;比較類(lèi)型,否定類(lèi)型取值為0。例如,反映文程度的虛擬變量可取為:D=1,本科學(xué)歷D=0,非本科學(xué)歷虛擬變量能否取1、0以外的數(shù)值?一般地,在虛擬變量的設(shè)置中:252、虛擬變量模型同時(shí)含有一般解釋變量與虛擬變量的模型稱(chēng)為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。例如,一個(gè)以性別為虛擬變量考察企業(yè)職工薪金的模型:其中:Yi為企業(yè)職工的薪金;Xi為工齡;Di=1,若是男性,Di=0,若是女性。2、虛擬變量模型同時(shí)含有一般解釋變量與虛擬變量的模型稱(chēng)為虛擬26二、虛擬變量的引入二、虛擬變量的引入271、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(i)=0,則企業(yè)男、女職工的平均薪金為:1、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法28假定2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,男女職工平均薪金對(duì)工齡的變化率是一樣的,但兩者的平均薪金水平相差2??梢酝ㄟ^(guò)對(duì)2的統(tǒng)計(jì)顯著性進(jìn)行檢驗(yàn),以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。02假定2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,29將上例中的性別換成教育水平,教育水平考慮三個(gè)層次:高中以下、高中、大學(xué)及其以上。高中以下高中大學(xué)及以上將上例中的性別換成教育水平,教育水平考慮三個(gè)層次:高中以下、30在上例中同時(shí)引入性別和教育水平:在上例中同時(shí)引入性別和教育水平:31女職工本科以下學(xué)歷的平均薪金:女職工本科以上學(xué)歷的平均薪金:男職工本科以下學(xué)歷的平均薪金:男職工本科以上學(xué)歷的平均薪金:女職工本科以下學(xué)歷的平均薪金:女職工本科以上學(xué)歷的平均薪金:322、乘法方式加法方式引入虛擬變量,考察:截距的不同。許多情況下,斜率發(fā)生變化,或斜率、截距同時(shí)發(fā)生變化。斜率的變化可通過(guò)以乘法的方式引入虛擬變量來(lái)測(cè)度。2、乘法方式加法方式引入虛擬變量,考察:截距的不同。33例如,根據(jù)消費(fèi)理論,收入決定消費(fèi)。但是,農(nóng)村居民和城鎮(zhèn)居民的邊際消費(fèi)傾向往往是不同的。這種消費(fèi)傾向的不同可通過(guò)在消費(fèi)函數(shù)中引入虛擬變量來(lái)考察。農(nóng)村居民:城鎮(zhèn)居民:例如,根據(jù)消費(fèi)理論,收入決定消費(fèi)。但是,農(nóng)村居民和城鎮(zhèn)居民的343、同時(shí)引入加法與乘法形式的虛擬變量當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入加法與乘法形式的虛擬變量。對(duì)于一元模型,有兩組樣本,則有可能出現(xiàn)下述四種情況中的一種:

1=1,且2=2,即兩個(gè)回歸相同,稱(chēng)為重合回歸(CoincidentRegressions);11,但2=2,即兩個(gè)回歸的差異僅在其截距,稱(chēng)為平行回歸(ParallelRegressions);1=1,但22,即兩個(gè)回歸的差異僅在其斜率,稱(chēng)為匯合回歸(ConcurrentRegressions);11,且22,即兩個(gè)回歸完全不同,稱(chēng)為相異回歸(DissimilarRegressions)。3、同時(shí)引入加法與乘法形式的虛擬變量當(dāng)截距與斜率發(fā)生變化時(shí),354、例題判斷中國(guó)農(nóng)村居民與城鎮(zhèn)居民的消費(fèi)行為是否有顯著差異。被解釋變量:居民家庭人均生活消費(fèi)支出Y解釋變量:居民家庭人均工資收入X1、其他收入X2樣本:2013年31個(gè)地區(qū)農(nóng)村居民與城鎮(zhèn)居民人均數(shù)據(jù)虛擬變量Di:農(nóng)村居民取值1,城鎮(zhèn)居民取值0

4、例題判斷中國(guó)農(nóng)村居民與城鎮(zhèn)居民的消費(fèi)行為是否有顯著差異。36由變量顯著性檢驗(yàn)得到:在10%的顯著性水平下,Di和DiXi1是顯著的,而DiXi2不顯著。因此:2013年農(nóng)村居民的平均消費(fèi)支出要比城鎮(zhèn)居民少1573.9元;在其他條件不變的情況下,農(nóng)村居民與城鎮(zhèn)居民的工資收入都增加100元時(shí),農(nóng)村居民要比城鎮(zhèn)居民多支出19元用于生活消費(fèi);農(nóng)村居民與城鎮(zhèn)居民在其他收入方面有相同的增加量時(shí),兩者增加的消費(fèi)支出沒(méi)有顯著差異??傮w回歸模型樣本回歸函數(shù)由變量顯著性檢驗(yàn)得到:在10%的顯著性水平下,Di和DiXi37三、虛擬變量的設(shè)置原則三、虛擬變量的設(shè)置原則38每一定性變量(qualitativevariable)所需的虛擬變量個(gè)數(shù)要比該定性變量的狀態(tài)類(lèi)別數(shù)(categories)少1。即如果有m種狀態(tài),只在模型中引入m-1個(gè)虛擬變量。例如,季節(jié)定性變量有春、夏、秋、冬4種狀態(tài),只需要設(shè)置3個(gè)虛變量:

如果設(shè)置第4個(gè)虛變量,則出現(xiàn)“虛擬變量陷井”(DummyVariableTrap)。為什么?每一定性變量(qualitativevariable)所需39例如:包含季節(jié)變量的正確模型:解釋變量完全共線(xiàn)性錯(cuò)誤模型例如:包含季節(jié)變量的正確模型:解釋變量完全共線(xiàn)性錯(cuò)誤模型40如果在服裝需求函數(shù)模型中必須包含3個(gè)定性變量:季節(jié)(4種狀態(tài))、性別(2種狀態(tài))、職業(yè)(5種狀態(tài)),應(yīng)該設(shè)置多少虛變量?模型含常數(shù)項(xiàng)模型不含常數(shù)項(xiàng)如果在服裝需求函數(shù)模型中必須包含3個(gè)定性變量:季節(jié)(4種狀態(tài)41

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論