計(jì)量經(jīng)濟(jì)學(xué)—理論和應(yīng)用5定性變量建模_第1頁
計(jì)量經(jīng)濟(jì)學(xué)—理論和應(yīng)用5定性變量建模_第2頁
計(jì)量經(jīng)濟(jì)學(xué)—理論和應(yīng)用5定性變量建模_第3頁
計(jì)量經(jīng)濟(jì)學(xué)—理論和應(yīng)用5定性變量建模_第4頁
計(jì)量經(jīng)濟(jì)學(xué)—理論和應(yīng)用5定性變量建模_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 計(jì)量經(jīng)濟(jì)學(xué)理論和應(yīng)用張紅霞張紅霞Zhanghx_c126 關(guān)于定性變量的建模關(guān)于定性變量的建模n定性變量作為解釋變量定性變量作為解釋變量 虛擬變量模型虛擬變量模型n定性變量作為被解釋變量定性變量作為被解釋變量 離散選擇模型離散選擇模型虛擬變量模型虛擬變量模型n虛擬變量的基本含義虛擬變量的基本含義n虛擬變量的引入虛擬變量的引入n虛擬變量的設(shè)置原則虛擬變量的設(shè)置原則虛擬變量的基本含義虛擬變量的基本含義n許多經(jīng)濟(jì)變量是許多經(jīng)濟(jì)變量是可以定量度量的,的,如:商品需求商品需求量、價(jià)格、收入、產(chǎn)量等量、價(jià)格、收入、產(chǎn)量等n但也有一些影響經(jīng)濟(jì)變量的因素但也有一些影響經(jīng)濟(jì)變量的因素?zé)o法定量度量,如:職業(yè)、性

2、別對(duì)收入的影響,戰(zhàn)爭(zhēng)、自然災(zāi)害職業(yè)、性別對(duì)收入的影響,戰(zhàn)爭(zhēng)、自然災(zāi)害對(duì)對(duì)GDP的影響,季節(jié)對(duì)某些產(chǎn)品(如冷飲)銷售的影響,季節(jié)對(duì)某些產(chǎn)品(如冷飲)銷售的影響等等。的影響等等。n為了在模型中能夠反映這些因素的影響,并提高為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們模型的精度,需要將它們“量化量化”,這種這種“量化量化”通常是通過引入通常是通過引入“虛擬變量虛擬變量”來完成的。來完成的。根據(jù)這些因素的屬性類型,構(gòu)造只取根據(jù)這些因素的屬性類型,構(gòu)造只取“0”或或“1”的人的人工變量,通常稱為工變量,通常稱為虛擬變量(dummy variables),記),記為為D。n例如,反映文

3、程度的虛擬變量可取為: 1, 本科學(xué)歷本科學(xué)歷 D= 0, 非本科學(xué)歷非本科學(xué)歷 一般地,在虛擬變量的設(shè)置中: 基礎(chǔ)類型、肯定類型取值為基礎(chǔ)類型、肯定類型取值為1; 比較類型,否定類型取值為比較類型,否定類型取值為0。虛擬變量的基本含義虛擬變量的基本含義概念: 同時(shí)含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型模型。 一個(gè)以性別為虛擬變量考察企業(yè)職工薪金的模型:一個(gè)以性別為虛擬變量考察企業(yè)職工薪金的模型:iiiiDXY210其中:Yi為企業(yè)職工的薪金,Xi為工齡, Di=1,若是男性,Di=0,若是女性。虛擬變量的基本含義虛擬變量的基本含義n 虛擬變量做為解釋變量引入模型有兩種基本方虛擬變量

4、做為解釋變量引入模型有兩種基本方式:式:加法方式和和乘法方式。iiiiXDXYE10)0,|( 企業(yè)男職工的平均薪金為:企業(yè)男職工的平均薪金為:iiiiXDXYE120)() 1,|( 上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。 在該模型中,如果仍假定E(i)=0,則 企業(yè)女職工的平均薪金為:企業(yè)女職工的平均薪金為: 1 1、加法方式、加法方式虛擬變量的引入虛擬變量的引入幾何意義:幾何意義:n假定假定 20,則兩個(gè)函數(shù)有相同的斜率,但有不同,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,男女職工平均薪金對(duì)工齡的變化的截距。意即,男女職工平均薪金對(duì)工齡的變化率是一樣的,但兩者的平均

5、薪金水平相差率是一樣的,但兩者的平均薪金水平相差 2。n可以通過傳統(tǒng)的回歸檢驗(yàn),對(duì)可以通過傳統(tǒng)的回歸檢驗(yàn),對(duì) 2的統(tǒng)計(jì)顯著性進(jìn)的統(tǒng)計(jì)顯著性進(jìn)行檢驗(yàn),以判斷企業(yè)男女職工的平均薪金水平是行檢驗(yàn),以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。否有顯著差異。 年薪 Y 男職工 女職工 工齡 X02虛擬變量的引入虛擬變量的引入 又例:在橫截面數(shù)據(jù)基礎(chǔ)上,考慮個(gè)人保健支出又例:在橫截面數(shù)據(jù)基礎(chǔ)上,考慮個(gè)人保健支出對(duì)個(gè)人收入和教育水平的回歸。對(duì)個(gè)人收入和教育水平的回歸。 教育水平考慮三個(gè)層次:高中以下,教育水平考慮三個(gè)層次:高中以下, 高中,高中, 大學(xué)及其以上大學(xué)及其以上 011D 其他高中 012D

6、其他大學(xué)及其以上模型可設(shè)定如下:iiiDDXY231210 這時(shí)需要引入兩個(gè)虛擬變量:虛擬變量的引入虛擬變量的引入 在在E( i)=0 的初始假定下,高中以下、高中、大的初始假定下,高中以下、高中、大學(xué)及其以上教育水平下個(gè)人保健支出的函數(shù):學(xué)及其以上教育水平下個(gè)人保健支出的函數(shù):n高中以下:高中以下:iiiXDDXYE1021)0, 0,|(n高中:高中:iiiXDDXYE12021)()0, 1,|(n大學(xué)及其以上:大學(xué)及其以上:iiiXDDXYE13021)() 1, 0,|( 假定32,其幾何意義: 大學(xué)教育 保健 高中教育 支出 低于中學(xué)教育 收入虛擬變量的引入虛擬變量的引入n 還可將

7、多個(gè)虛擬變量引入模型中以考察多種“定性”因素的影響。 如在上述職工薪金的例中,再引入代表學(xué)歷的虛在上述職工薪金的例中,再引入代表學(xué)歷的虛擬變量擬變量D2:iiiDDXY231210012D本科及以上學(xué)歷本科以下學(xué)歷職工薪金的回歸模型可設(shè)計(jì)為:虛擬變量的引入虛擬變量的引入女職工本科以下學(xué)歷的平均薪金:iiiXDDXYE13021)() 1, 0,|(女職工本科以上學(xué)歷的平均薪金:iiiXDDXYE132021)() 1, 1,|(iiiXDDXYE1021)0, 0,|(iiiXDDXYE12021)()0, 1,|(于是,不同性別、不同學(xué)歷職工的平均薪金分別為:男職工本科以下學(xué)歷的平均薪金:男

8、職工本科以上學(xué)歷的平均薪金:虛擬變量的引入虛擬變量的引入 2 2、乘法方式、乘法方式n加法方式引入虛擬變量,考察:截距的不同,加法方式引入虛擬變量,考察:截距的不同,n許多情況下:往往是斜率就有變化,或斜率、截許多情況下:往往是斜率就有變化,或斜率、截距同時(shí)發(fā)生變化。距同時(shí)發(fā)生變化。n斜率的變化可通過以乘法的方式引入虛擬變量來斜率的變化可通過以乘法的方式引入虛擬變量來測(cè)度。測(cè)度。 例例:根據(jù)消費(fèi)理論,消費(fèi)水平C主要取決于收入水平Y(jié),但在一個(gè)較長的時(shí)期,人們的消費(fèi)傾向會(huì)發(fā)生變化,尤其是在自然災(zāi)害、戰(zhàn)爭(zhēng)等反常年份,消費(fèi)傾向往往出現(xiàn)變化。這種消費(fèi)傾向的變化可通過在收入的系數(shù)中引入虛擬變量來考察。虛擬

9、變量的引入虛擬變量的引入tttttXDXC210n這里,虛擬變量這里,虛擬變量D以與以與X相乘的方式引入了模型中,相乘的方式引入了模型中,從而可用來考察消費(fèi)傾向的變化。從而可用來考察消費(fèi)傾向的變化。n假定假定E( i)= 0,上述模型所表示的函數(shù)可化為:上述模型所表示的函數(shù)可化為: 正常年份:ttttXDXCE)() 1,|(210 反常年份:ttttXDXCE10)0,|(如,設(shè)01tD反常年份正常年份消費(fèi)模型可建立如下:虛擬變量的引入虛擬變量的引入 當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入加當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入加法與乘法形式的虛擬變量。法與乘法形式的虛擬變量。n例,考察考察

10、1990年前后的中國居民的總儲(chǔ)蓄年前后的中國居民的總儲(chǔ)蓄-收入關(guān)收入關(guān)系是否已發(fā)生變化。系是否已發(fā)生變化。 表表5.1.1中給出了中國中給出了中國19792001年以城鄉(xiāng)儲(chǔ)年以城鄉(xiāng)儲(chǔ)蓄存款余額代表的居民儲(chǔ)蓄以及以蓄存款余額代表的居民儲(chǔ)蓄以及以GNP代表的居代表的居民收入的數(shù)據(jù)。民收入的數(shù)據(jù)。虛擬變量的引入虛擬變量的引入表表 5.1.1 19792001 年中國居民儲(chǔ)蓄與收入數(shù)據(jù)年中國居民儲(chǔ)蓄與收入數(shù)據(jù)(億元)(億元)90年前儲(chǔ)蓄GNP90年后儲(chǔ)蓄GNP19792814038.21991910721662.51980399.54517.8199211545.426651.91981523.748

11、60.3199314762.434560.51982675.45301.8199421518.846670.01983892.55957.4199529662.357494.919841214.77206.7199638520.866850.519851622.68989.1199746279.873142.719862237.610201.4199853407.576967.219873073.311954.5199959621.880579.419883801.514922.3200064332.488228.119895146.916917.8200173762.494346.41990

12、7034.218598.4以以Y為儲(chǔ)蓄,為儲(chǔ)蓄,X為收入,可令:為收入,可令:n1990年前:年前: Yi= 1+ 2Xi+ 1i i=1,2,n1 n1990年后:年后: Yi= 1+ 2Xi+ 2i i=1,2,n2 則有可能出現(xiàn)下述四種情況中的一種:則有可能出現(xiàn)下述四種情況中的一種:(1) 1= 1 ,且,且 2= 2 ,即兩個(gè)回歸相同,稱為,即兩個(gè)回歸相同,稱為重合回歸(Coincident Regressions);(2) 11 ,但但 2= 2 ,即兩個(gè)回歸的差異僅在其截距,即兩個(gè)回歸的差異僅在其截距,稱為稱為平行回歸(Parallel Regressions);(3) 1= 1

13、,但,但 22 ,即兩個(gè)回歸的差異僅在其斜,即兩個(gè)回歸的差異僅在其斜率,稱為率,稱為匯合回歸匯合回歸(Concurrent Regressions);(4) 11,且,且 22 ,即兩個(gè)回歸完全不同,稱為,即兩個(gè)回歸完全不同,稱為相異回歸(相異回歸(Dissimilar Regressions)。虛擬變量的引入虛擬變量的引入這一問題可通過引入乘法形式的虛擬變量來解決。這一問題可通過引入乘法形式的虛擬變量來解決。 將將n1與與n2次觀察值合并,并用以估計(jì)以下回歸:次觀察值合并,并用以估計(jì)以下回歸:iiiiiiXDDXY)(4310Di為引入的虛擬變量:01iD于是有:iiiiXXDYE10),

14、0|(iiiiXXDYE)()(), 1|(4130可分別表示1990年后期與前期的儲(chǔ)蓄函數(shù)。年后年前9090虛擬變量的引入虛擬變量的引入 在統(tǒng)計(jì)檢驗(yàn)中,如果在統(tǒng)計(jì)檢驗(yàn)中,如果 4=0的假設(shè)被拒絕,則的假設(shè)被拒絕,則說明兩個(gè)時(shí)期中儲(chǔ)蓄函數(shù)的斜率不同。說明兩個(gè)時(shí)期中儲(chǔ)蓄函數(shù)的斜率不同。n具體的回歸結(jié)果為: (-6.11) (22.89) (4.33) (-2.55) 由3與4的t檢驗(yàn)可知:參數(shù)顯著地不等于0,強(qiáng)烈示出兩個(gè)時(shí)期的回歸是相異的, 儲(chǔ)蓄函數(shù)分別為:儲(chǔ)蓄函數(shù)分別為:1990年前:1990年后:iiiiiXDDXY4765. 03 .138028881. 0154522R=0.9836ii

15、XY4116. 07 .1649iiXY8881. 015452虛擬變量的引入虛擬變量的引入 3 3、臨界指標(biāo)的虛擬變量的引入、臨界指標(biāo)的虛擬變量的引入 在經(jīng)濟(jì)發(fā)生轉(zhuǎn)折時(shí)期,可通過建立臨界指標(biāo)的虛在經(jīng)濟(jì)發(fā)生轉(zhuǎn)折時(shí)期,可通過建立臨界指標(biāo)的虛擬變量模型來反映。擬變量模型來反映。 例如,進(jìn)口消費(fèi)品數(shù)量進(jìn)口消費(fèi)品數(shù)量Y主要取決于國民收入主要取決于國民收入X的多少,中國在改革開放前后,的多少,中國在改革開放前后,Y對(duì)對(duì)X的回歸關(guān)系明的回歸關(guān)系明顯不同。顯不同。 這時(shí),可以這時(shí),可以t*=1979年為轉(zhuǎn)折期,以年為轉(zhuǎn)折期,以1979年年的國民收入的國民收入Xt*為臨界值,設(shè)如下虛擬變量:為臨界值,設(shè)如下虛

16、擬變量:01tD*tttt則進(jìn)口消費(fèi)品的回歸模型可建立如下:則進(jìn)口消費(fèi)品的回歸模型可建立如下:ttttttDXXXY)(*210虛擬變量的引入虛擬變量的引入 OLS法得到該模型的回歸方程為則兩時(shí)期進(jìn)口消費(fèi)品函數(shù)分別為:則兩時(shí)期進(jìn)口消費(fèi)品函數(shù)分別為:tttttDXXXY)(*210當(dāng)tt*=1979年,ttXY10當(dāng)tt*=1979年,titXXY)()(21*20虛擬變量的引入虛擬變量的引入 虛擬變量的個(gè)數(shù)須按以下原則確定: 每一定性變量所需的虛擬變量個(gè)數(shù)要比該定性變每一定性變量所需的虛擬變量個(gè)數(shù)要比該定性變量的類別數(shù)少量的類別數(shù)少1,即如果有,即如果有m個(gè)定性變量,只在模型個(gè)定性變量,只在模

17、型中引入中引入m-1個(gè)虛擬變量個(gè)虛擬變量。 例例: 已知冷飲的銷售量已知冷飲的銷售量Y除受除受k種定量變量種定量變量Xk的影的影響外,還受春、夏、秋、冬四季變化的影響,要考響外,還受春、夏、秋、冬四季變化的影響,要考察該四季的影響,只需引入三個(gè)虛擬變量即可:察該四季的影響,只需引入三個(gè)虛擬變量即可:011tD其他春季012tD其他夏季013tD其他秋季虛擬變量的設(shè)置原則虛擬變量的設(shè)置原則則冷飲銷售量的模型為:則冷飲銷售量的模型為:n在上述模型中,若再引入第四個(gè)虛擬變量在上述模型中,若再引入第四個(gè)虛擬變量ttttktkttDDDXXY332211110014tD其他冬季則冷飲銷售模型變量為:tt

18、tttktkttDDDDXXY44332211110其矩陣形式為:D)(X,Y虛擬變量的設(shè)置原則虛擬變量的設(shè)置原則 如果只取六個(gè)觀測(cè)值,其中春季與夏季取了兩次,秋、冬各取到一次觀測(cè)值,則式中的: 顯然,顯然,(X,D)中的第中的第1列可表示成后列可表示成后4列的線性組列的線性組合,從而合,從而(X,D)不滿秩,參數(shù)無法唯一求出。不滿秩,參數(shù)無法唯一求出。 這就是所謂的這就是所謂的“虛擬變量陷井虛擬變量陷井”,應(yīng)避免。,應(yīng)避免。000110010110001010010010100011)(616515414313212111kkkkkkXXXXXXXXXXXXDX,k104321虛擬變量的設(shè)置

19、原則虛擬變量的設(shè)置原則n習(xí)題習(xí)題n下表給出了1965-1970美國制造業(yè)利潤和銷售額的季度數(shù)據(jù)。假定利潤不僅與銷售額有關(guān),而且和季度因素有關(guān)。要求對(duì)下列兩種情況分別估計(jì)利潤模型 (1)如果認(rèn)為季度影響使利潤平均值發(fā)生變異,應(yīng)如何引入虛擬變量? (2)如果認(rèn)為季度影響使利潤對(duì)銷售額的變化率發(fā)生變異,如何引入虛擬變量?利潤銷售額利潤銷售額YXYX1965-I105031148621968-I12539148826II12092123968III10834121454IIV12201131917IV149471684091966-I12245129

20、9111969-II12213137828IIV12820145645IV143151833271967-I113491369891970-I12381170415II12615145126III11014141536III12174176712IV12730151776IV10985180370二元離散選擇模型二元離散選擇模型n定性變量作為被解釋變量時(shí),就是離散選定性變量作為被解釋變量時(shí),就是離散選擇模型。被解釋變量只存在兩種選擇,就擇模型。被解釋變量只存在兩種選

21、擇,就是二元離散選擇模型。是二元離散選擇模型。q線性概率模型(線性概率模型(LPM)qLogit模型模型qProbit模型模型線性概率模型線性概率模型nLinear Probability ModelkkkkXXXXYEuXXXY2211022110kkXXXXYPXYPXYPXYPXYEvariable sdichotomouY22110110011)是二值變量(如果線性概率模型線性概率模型n線性概率模型的解釋線性概率模型的解釋iiiiYYX的發(fā)生概率增加或者說的概率增加取值為個(gè)單位,增加表示11線性概率模型線性概率模型n線性概率模型的問題線性概率模型的問題 1、異方差、異方差 2、易出現(xiàn)無

22、法解釋的結(jié)果、易出現(xiàn)無法解釋的結(jié)果異方差異方差 iiiiiiiiiiiiiiiiiXXXXXXuEuXXYPXXYPuXY101021010210102101010111var101易出現(xiàn)無法解釋的結(jié)果易出現(xiàn)無法解釋的結(jié)果n預(yù)測(cè)時(shí)很難避免出現(xiàn)得到的預(yù)測(cè)時(shí)很難避免出現(xiàn)得到的Y值大于值大于1或或小于小于0的情況,為結(jié)果的解釋帶來困難。的情況,為結(jié)果的解釋帶來困難。解決思路解決思路kkkkXXGXYPXXXYP11011011Logit模型模型n又稱又稱Logistic模型,該模型克服了線性概模型,該模型克服了線性概率模型的取值范圍的弱點(diǎn)。率模型的取值范圍的弱點(diǎn)。kkkkkkXXexpXXexpXX

23、expXYP1101101101111Logit模型模型110111XiiiieppXYP有一個(gè)自變量。,為描述方便,假定只為記 Z 0 1 Logit模型模型XpplneppeeepeepiiXiiXXXiXXi1011111111110110110110110110不發(fā)生事件的概率:發(fā)生事件的概率:Logit模型模型過程大再減緩再快速增大的的增大,呈現(xiàn)先快速增隨著到,取對(duì)數(shù)后為到的取值范圍:發(fā)生比具有經(jīng)濟(jì)含義:事件的有三個(gè)好處:iiiiiiiiippplnppppppln10111Logit模型模型-6-4-2024600.20.40.60.81模型的解釋模型的解釋為等級(jí)。為推廣費(fèi)用;為價(jià)

24、格;的概率為需求量大于等于321321100056340000400446021101XXXpX.X.X.ppln模型的解釋模型的解釋n發(fā)生比和發(fā)生比率(發(fā)生比和發(fā)生比率(Odds and Odd Ratio)n發(fā)生比率是為了比較發(fā)生比而提出的指標(biāo)發(fā)生比率是為了比較發(fā)生比而提出的指標(biāo) 生比率兩個(gè)發(fā)生比之比即為發(fā)事件不發(fā)生概率事件發(fā)生概率odds模型的解釋模型的解釋n自變量為定量變量的解釋自變量為定量變量的解釋04460105634000040104460211011056340000400446021103213211321113211056340000400446021101056340000400446021101.XX.X.X.XXX.X.X.eoddsoddseeeeppoddseeeeX.X.X.expppoddsX.X.X.ppln模型的解釋模型的解釋n發(fā)生比的相對(duì)變化率發(fā)生比的相對(duì)變化率%e%oddsoddsodds.X10011000446011模型的解釋模型的解釋n自變量為定量變量的解釋自變量為定量變量的解釋

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論