虛擬變量模型_第1頁
虛擬變量模型_第2頁
虛擬變量模型_第3頁
虛擬變量模型_第4頁
虛擬變量模型_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

虛擬變量模型第1頁,共51頁,2023年,2月20日,星期日

二態(tài)變量

1.1二態(tài)變量的概念

1.2二態(tài)變量的作用

1.3二態(tài)變量的設(shè)置規(guī)則

二態(tài)變量模型

2二態(tài)解釋變量模型

3二態(tài)被解釋變量模型第2頁,共51頁,2023年,2月20日,星期日1.1二態(tài)變量的概念

經(jīng)濟分析中接觸最多的是一些數(shù)值變量,諸如GDP,CPI等等。這些變量的共同特征是它們各自有一個合理的值域區(qū)間,當(dāng)變量變化時在值域區(qū)間內(nèi)取值。

但是人類的經(jīng)濟活動僅僅通過數(shù)值變量的描述還是不夠的,人的社會經(jīng)濟行為還與一些屬性因素相聯(lián)系,譬如收入在形成過程中,不同的性別所得到的收入是不一樣的;在城鄉(xiāng)、不同地區(qū)收入存在差距;再比如,在我國,經(jīng)濟的發(fā)展水平對于不同的區(qū)域有不同的表現(xiàn),等等。既然屬性因素同樣影響人的經(jīng)濟活動,經(jīng)濟問題的研究就需要屬性變量。第3頁,共51頁,2023年,2月20日,星期日設(shè)變量D表示某種屬性,該屬性有兩種類型,即當(dāng)屬性存在時D取值為1;當(dāng)屬性不存在時D取值為0。記為

該變量D即為二態(tài)變量。二態(tài)變量又稱虛擬變量、名義變量或啞變量,是用以反映質(zhì)的屬性的一個人工變量,是量化了的質(zhì)變量,通常取值為0或1,一般“1”代表某一屬性存在,“0”代表某一屬性不存在,即“是”或“否”,“男”或“女”等。第4頁,共51頁,2023年,2月20日,星期日1.2二態(tài)變量的作用引入虛擬變量的作用,在于將定性因素或?qū)傩砸蛩貙σ蜃兞康挠绊憯?shù)量化。

1.可以描述和測量定性(或?qū)傩裕┮蛩氐挠绊憽?.能夠正確反映經(jīng)濟變量之間的相互關(guān)系,提高模型的精度;例如在分段回歸中的應(yīng)用。3.便于處理異常數(shù)據(jù)。由于某些突發(fā)事件的存在,如戰(zhàn)爭、自然災(zāi)害,使原本比較穩(wěn)定的經(jīng)濟關(guān)系發(fā)生一段時間的混亂,此時可以利用虛擬變量。當(dāng)樣本資料存在異常數(shù)據(jù)時,一般有三種處理方式:一是在樣本容量較大的情況下直接剔除異常數(shù)據(jù);二是用平均數(shù)等方式修勻異常數(shù)據(jù);三是設(shè)置虛擬變量(即將異常數(shù)據(jù)作為一個特殊的定性因素)。第5頁,共51頁,2023年,2月20日,星期日1.3二態(tài)變量的設(shè)置規(guī)則1.一個定性因素多個屬性若一個定性因素有m個不同屬性或相互排斥的類型,在模型中則只能引入m-1個虛擬變量,否則會產(chǎn)生完全多重共線性。2.多個定性因素多種不同屬性如果有m個定性因素,且每個因素各含有mi個不同的屬性類型,則引入個虛擬變量。3.虛擬變量取值應(yīng)從分析問題的目的出發(fā)予以界定;通常將基礎(chǔ)類型、否定類型取值為0,而將比較類型、肯定類型以及我們將要研究的重點類型取值為1.4.虛擬變量在單一方程中,可以作為解釋變量,也可以作為因變量。

第6頁,共51頁,2023年,2月20日,星期日2二態(tài)解釋變量模型2.1加法引入規(guī)則2.1.1一個定性解釋變量2.1.2一個定量解釋變量和一個定性解釋變量2.1.3一個定量解釋變量和一個定性解釋變量,但有多個屬性類型2.1.4一個定量解釋變量和兩個以上定性解釋變量2.1.5對模型中存在異常值的修正2.1.6對季節(jié)因素的修正2.2乘法引入規(guī)則2.2.1檢驗?zāi)P偷慕Y(jié)構(gòu)是否發(fā)生了變化2.2.2交互效應(yīng)2.2.3分段線性回歸第7頁,共51頁,2023年,2月20日,星期日

2.1加法引入規(guī)則虛擬解釋變量與別的解釋變量以相加的關(guān)系出現(xiàn)在模型里。加法引入虛擬變量對模型產(chǎn)生的結(jié)果是只改變截距項。設(shè)模型為

式中,為虛擬變量,它與其它解釋變量是相加的關(guān)系。如果虛擬變量按這種方式引入模型,則稱虛擬變量按加法類型引入。第8頁,共51頁,2023年,2月20日,星期日2.1.1模型中只有一個定性解釋變量設(shè)模型形式為

其中,

為具有兩個屬性類型的定性變量。第9頁,共51頁,2023年,2月20日,星期日設(shè)為居民的年可支配收入,為虛擬變量,其取值表示為:=1表示城鎮(zhèn)居民;=0表示農(nóng)村居民。即該方程的意義在于,在其它因素不變的條件下,城鎮(zhèn)居民與農(nóng)村居民的收入是否具有顯著性差異。由此得到城鎮(zhèn)居民的年平均收入:

農(nóng)村居民的年平均收入為:

第10頁,共51頁,2023年,2月20日,星期日為了檢驗城鎮(zhèn)居民和農(nóng)村居民的差異對年平均收入的影響是否具有顯著性,可構(gòu)造假設(shè):

對上述模型進行回歸,利用樣本統(tǒng)計量對假設(shè)作出判斷(t檢驗)。只有一個定性解釋變量往往可用于檢驗一個屬性因素對被解釋變量的影響是否顯著性存在。

第11頁,共51頁,2023年,2月20日,星期日2.1.2模型中有一個定量解釋變量和一

個定性解釋變量設(shè)模型形式為

式中,為定量變量,為具有兩個屬性類型的定性變量。第12頁,共51頁,2023年,2月20日,星期日設(shè)為消費支出;為收入;為虛擬變量,即

上述表達式的意義在于,在收入不變的條件下,研究城鎮(zhèn)居民和農(nóng)村居民對消費的不同影響,即判斷城鄉(xiāng)居民在消費上是否存在顯著性差異。農(nóng)村居民年平均消費:

城鎮(zhèn)居民年平均消費:第13頁,共51頁,2023年,2月20日,星期日可以看出,城鎮(zhèn)居民和農(nóng)村居民兩種收入類型的斜率系數(shù)一樣,但截距不同。說明兩種類型的居民在收入的水平上存在的規(guī)模差異。這一假定也可通過對的顯著性檢驗,

t檢驗來判斷。第14頁,共51頁,2023年,2月20日,星期日2.1.3

模型中有一個定量解釋變量和一個定

性解釋變量,但有多個屬性類型

設(shè)模型形式為

式中,為定量變量,和為具有兩個屬性特征的定量變量。

第15頁,共51頁,2023年,2月20日,星期日設(shè)為年醫(yī)療保健費支出;為居民年可支配收入;如果將受教育程度分為三種類型:高中以下、高中、大專及大專以上,則引入虛擬變量為如下兩個

高中以下的年平均醫(yī)療保健費支出:

高中的年平均醫(yī)療保健費支出:

大專及大專以上年平均醫(yī)療保健費支出:第16頁,共51頁,2023年,2月20日,星期日對于模型

有類型假定高中以下高中大專及大專以上第17頁,共51頁,2023年,2月20日,星期日2.1.4模型中有一個定量解釋變量和兩個以上定

性解釋變量

設(shè)模型形式為

式中,為定量變量,和為具有兩個屬性特征的定量變量。

第18頁,共51頁,2023年,2月20日,星期日設(shè)為卷煙需求量;為居民可支配收入,考慮兩種不同屬性:不同區(qū)域的居民,即城鎮(zhèn)居民與農(nóng)村居民;不同性別,即男與女。因此各引入一個虛擬變量

第19頁,共51頁,2023年,2月20日,星期日農(nóng)村女性居民:農(nóng)村男性居民:

城鎮(zhèn)女性居民:

城鎮(zhèn)男性居民:

第20頁,共51頁,2023年,2月20日,星期日2.1.5對模型中存在異常值的修正設(shè)模型形式為由于某種突發(fā)因素的干擾,使得在時刻隨機誤差產(chǎn)生系統(tǒng)性偏離,表現(xiàn)為隨機誤差項在相應(yīng)時點存在均值非0的問題,即這時,可引入虛擬變量第21頁,共51頁,2023年,2月20日,星期日則

其中,,對求數(shù)學(xué)期望,有

表明新的隨機誤差項滿足零均值假定,從而可用OLS法對引入虛擬變量的模型求參數(shù)的估計。當(dāng)時,

當(dāng)時,第22頁,共51頁,2023年,2月20日,星期日例如:研究消費行為時,認(rèn)為消費水平C主要受到收入水平Y(jié)的影響,但對于正常年份和反常年份,消費行為的表現(xiàn)是不同的,這時可考慮引入虛擬變量

當(dāng)正常年份時,

當(dāng)反常年份時,進一步對參數(shù)估計,利用樣本統(tǒng)計量對總體參數(shù)作檢驗,從而可判斷正常年份消費行為與反常年份消費是否存在差異。第23頁,共51頁,2023年,2月20日,星期日2.1.6對季節(jié)因素的修正假設(shè)是具有某種季節(jié)特征的消費行為(如啤酒、汗衫等商品的消費),這時需要對季節(jié)波動進行調(diào)整,下面介紹利用虛擬變量來調(diào)整季節(jié)變化。季節(jié)為屬性因素,按自然屬性有4個不同的季節(jié)(春、夏、秋、冬),即4個屬性類型。因此,在有截距項的前提下,可引入3個虛擬變量,即

第24頁,共51頁,2023年,2月20日,星期日引入季節(jié)虛擬變量的模型為

第1季度,第2季度,第3季度,第4季度,第25頁,共51頁,2023年,2月20日,星期日2.2乘法引入規(guī)則以乘法形式引入虛擬變量,是在所設(shè)定的模型里,將虛擬解釋變量與其它解釋變量用乘積作為新的解釋變量。乘法引入虛擬解釋變量將改變模型中的斜率系數(shù)。設(shè)模型為

其中,為定量解釋變量,為虛擬變量。按上述形式引入虛擬變量即為乘法引入。第26頁,共51頁,2023年,2月20日,星期日2.2.1檢驗?zāi)P偷慕Y(jié)構(gòu)是否發(fā)生了變化設(shè)模型形式為

式中,

為儲蓄總額,

為收入總額,

為虛擬變量,即

改革開放后,平均儲蓄額為改革開放前,平均儲蓄額為

第27頁,共51頁,2023年,2月20日,星期日在上式中被稱為截距差異系數(shù),被稱為斜率差異系數(shù),它們分別代表改革開放前后儲蓄函數(shù)的截距與斜率存在的差異。結(jié)構(gòu)變化的專門檢驗——鄒氏檢驗檢驗的基本步驟:(1)設(shè)根據(jù)同一總體兩個樣本估計的回歸模型分別為:樣本1:

樣本2:第28頁,共51頁,2023年,2月20日,星期日第29頁,共51頁,2023年,2月20日,星期日2.2.2交互效應(yīng)在實際經(jīng)濟活動中,多個定性解釋變量對被解釋變量的影響可能存在一種交互影響,即一個變量的邊際效應(yīng)可能要依賴于另外變量的變動(即由于變量間的交互作用而對解釋變量的影響)。這時可用乘法引入虛擬變量的方法來表示。第30頁,共51頁,2023年,2月20日,星期日

設(shè)模型形式為

其中,

為農(nóng)副產(chǎn)品生產(chǎn)總收益,

為農(nóng)副產(chǎn)品生產(chǎn)投入,

為油菜籽生產(chǎn)虛擬變量,

為養(yǎng)蜂生產(chǎn)虛擬變量。第31頁,共51頁,2023年,2月20日,星期日但上述模型不能反映發(fā)展油菜生產(chǎn),同時又發(fā)展養(yǎng)蜂生產(chǎn),而在它們中間存在著一定的交互作用,這種交互作用對農(nóng)副產(chǎn)品生產(chǎn)總收益可能會帶來更大的影響。因此,反映交互作用可通過按乘法引入虛擬變量來解決:不發(fā)展油菜生產(chǎn),也不發(fā)展養(yǎng)蜂生產(chǎn):

同時發(fā)展油菜生產(chǎn)和養(yǎng)蜂生產(chǎn):

在實證分析中,可利用交互效應(yīng)虛擬解釋變量

系數(shù)的顯著性來加以判斷。第32頁,共51頁,2023年,2月20日,星期日2.2.3分段線性回歸在經(jīng)濟活動中,有時會存在影響因素在達到某個臨界值時發(fā)生結(jié)構(gòu)性變化,這時可利用虛擬變量來區(qū)分這種結(jié)構(gòu)性變化,即用虛擬變量表示來不同的截距和斜率的回歸。以研究銷售額對提取獎金的影響為例。第33頁,共51頁,2023年,2月20日,星期日設(shè)模型的形式為

式中,

為獎勵額度,

為銷售額,

為銷售公司按銷售額的一定比例計提獎勵的目標(biāo)水平值,即銷售額在

以下和以上計提的獎勵的方法不同(或計提的額度不同),則引入虛擬解釋變量為

當(dāng)銷售額度低于

時,

當(dāng)銷售額度高于

時,第34頁,共51頁,2023年,2月20日,星期日3二態(tài)被解釋變量模型3.1線性概率模型3.1.1線性概率模型的概念3.1.2線性概率模型的估計3.2Probit模型和Logit模型3.2.1Probit模型和Logit模型的產(chǎn)生背景3.2.2Probit模型和Logit模型的含義3.2.3Probit模型和Logit模型的估計參考:潘省初.《計量經(jīng)濟學(xué)中級教程》,清華大學(xué)出版社第35頁,共51頁,2023年,2月20日,星期日二態(tài)被解釋變量在有些情況下,我們可能需要建立被解釋變量為虛擬變量的回歸模型。在這種模型中,被解釋變量描述的是特征、選擇或者種類等不能定量化的東西,如乘公交還是自己開車去上班、考不考研等。在這些情況下,被解釋變量是定型變量,我們可以用定義虛擬變量的放大來刻畫它們。這種被解釋變量為虛擬變量的模型稱為定性選擇模型或定性響應(yīng)模型。這里簡要介紹線性概率模型、Probit模型、Logit模型第36頁,共51頁,2023年,2月20日,星期日3.1.1線性概率模型的概念設(shè)家庭購買住房的選擇主要受到家庭的收入水平,則用如下模型表示

其中為家庭的收入水平,為家庭購買住房的選擇,即

由于y是取值為0和1的隨機變量,并定義y取值為1的概率是p,則y的分布為

y01概率1-pp第37頁,共51頁,2023年,2月20日,星期日這樣y的數(shù)學(xué)期望為

顯然

從而

上述數(shù)學(xué)描述的經(jīng)濟學(xué)解釋是,因為選擇購買住房變量取值是1,其概率是p,并且這時對應(yīng)p的表示是一線性關(guān)系,因此,選擇家庭購買住房的概率是家庭收入x的一個線性函數(shù)。稱這一關(guān)系式為線性概率函數(shù)。第38頁,共51頁,2023年,2月20日,星期日3.1.2線性概率函數(shù)的估計對線性概率函數(shù)的估計存在以下困難:(1)隨機誤差項的非正態(tài)性表現(xiàn)。

表明

服從兩點分布,常規(guī)的顯著性檢驗出現(xiàn)問題。雖然U不是正態(tài)變量,考慮到中心極限定理,以及大樣本的情況,檢驗可以在漸近分布的意義下進行。第39頁,共51頁,2023年,2月20日,星期日(2)的異方差性。事實上,

上式中,p隨著i變動,是一個變動的量,則

的方差不是一個固定常數(shù)。第40頁,共51頁,2023年,2月20日,星期日利用加權(quán)最小二乘法修正異方差。取權(quán)數(shù)為

可以證明具有同方差。在具體估計線性概率模型時,用作為p的估計來計算權(quán)數(shù)的估計。第41頁,共51頁,2023年,2月20日,星期日(3)0≤E(yi∣xi)≤1不成立??朔@一問題可直接從對線性概率模型的估計,求出,用人工的方法定義當(dāng)>1時,取=1;當(dāng)<0時,取=0。但要比較好地解決這類問題,只能考慮采用新的估計方法,如Logit模型和Probit模型等。第42頁,共51頁,2023年,2月20日,星期日(4)LMP模型本身的先天不足。LMP模型假定自變量和Y=1的概率之間存在線性關(guān)系,而此關(guān)系往往不是線性的。(5)在線性概率模型中,以及不再是合適的擬合優(yōu)度測試。此問題不僅是線性概率模型的問題,而是所有定性選擇模型的問題。較好一點的測度是模型正確預(yù)測的觀測值的百分比。首先,我們將每一個預(yù)測值歸類為1或0.如果擬合值大于等于0.5,則認(rèn)為因變量的預(yù)測值為1,否則為0.然后將這些預(yù)測值與實際發(fā)生的情況相比較,計算正確預(yù)測的百分比:第43頁,共51頁,2023年,2月20日,星期日3.2.1Probit模型和Logit模型的產(chǎn)生背影鑒于線性概率模型上的缺點,我們應(yīng)對回歸模型作兩個方面的改進,使:(1)使解釋變量xi所對應(yīng)的所有預(yù)測值(概率值)都落在(0,1)之間;(2)同時對于所有的xi,當(dāng)xi增加時,希望yi也單調(diào)增加或單調(diào)減少。顯然所有連續(xù)性隨機變量的分布函數(shù)F(zi)都符合要求,我們常用的是logistic函數(shù)與正態(tài)分布函數(shù)。采用累積正態(tài)概率分布函數(shù)的模型稱作Probit模型,即用正態(tài)分布的累積概率作為Probit模型的預(yù)測概率;采用logistic函數(shù)的模型稱作logit模型。第44頁,共51頁,2023年,2月20日,星期日3.2.2Probit模型和Logit模型的含義

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論