版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、本資料來源本資料來源第七章第七章 含有定性信息的多元含有定性信息的多元回歸模型回歸模型-虛擬變量虛擬變量 一、虛擬變量的基本含義一、虛擬變量的基本含義 二、虛擬變量的引入二、虛擬變量的引入 三、虛擬變量的設(shè)置原則三、虛擬變量的設(shè)置原則 四、虛擬因變量的模型四、虛擬因變量的模型 -二值選擇的線性概率模型二值選擇的線性概率模型一、虛擬變量的基本含義l許多經(jīng)濟(jì)變量是可以定量度量可以定量度量的,如:如:商品需求量、價(jià)格、收入、產(chǎn)量等。l但也有一些影響經(jīng)濟(jì)變量的因素?zé)o法定量度量無法定量度量,如:如:職業(yè)、性別對(duì)收入的影響,戰(zhàn)爭、自然災(zāi)害對(duì)GDP的影響,季節(jié)對(duì)某些產(chǎn)品(如冷飲)銷售的影響等等。l為了在模型
2、中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。 這種這種“量化量化”通常是通過引入通常是通過引入“虛擬變量虛擬變量”來完成的。來完成的。根據(jù)這些因素的屬性類型,構(gòu)造只取根據(jù)這些因素的屬性類型,構(gòu)造只取“0”或或“1”的人工變量,的人工變量,通常稱為通常稱為虛擬變量(dummy variables),記為),記為D。l例如例如,反映文化程度的虛擬變量可取為,反映文化程度的虛擬變量可取為: 1, 本科學(xué)歷 D= 0, 非本科學(xué)歷l 一般地,在虛擬變量的設(shè)置中:l 基礎(chǔ)類型、肯定類型取值為基礎(chǔ)類型、肯定類型取值為1;l 比較類型,否定類型取值為比較類型,否定類型取值為0。概念: 同
3、時(shí)含有一般解釋變量與虛擬變量的模型同時(shí)含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型或者方差分析稱為虛擬變量模型或者方差分析(analysis-of variance: ANOVA)模型模型。 一個(gè)以性別為虛擬變量考察企業(yè)職工薪金的模型:iiiiDXY210其中:Yi為企業(yè)職工的薪金,Xi為工齡, Di=1,若是男性,Di=0,若是女性。二、虛擬變量的引入 虛擬變量做為解釋變量引入模型有兩種基本方式:加法方式加法方式和乘法方式乘法方式。 上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。 在該模型中,如果仍假定E(i)=0,則 企業(yè)女職工的平均薪金為:企業(yè)女職工的平均薪金為:1. 1.
4、 加法方式加法方式iiiiXDXYE10)0,|( 企業(yè)男職工的平均薪金為:企業(yè)男職工的平均薪金為:iiiiXDXYE120)() 1,|(幾何意義: 假定20,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,男女職工平均薪金對(duì)工齡的變化率是一樣的,但兩者的平均薪金水平相差2。l可以通過傳統(tǒng)的回歸檢驗(yàn),對(duì) 2的統(tǒng)計(jì)顯著性進(jìn)行檢驗(yàn),以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。 年薪Y(jié) 男職工 女職工 工齡X02 又例:在橫截面數(shù)據(jù)基礎(chǔ)上,考慮個(gè)人保:在橫截面數(shù)據(jù)基礎(chǔ)上,考慮個(gè)人保健支出對(duì)個(gè)人收入和教育水平的回歸。健支出對(duì)個(gè)人收入和教育水平的回歸。 教育水平考慮三個(gè)層次:高中以下, 高中, 大學(xué)
5、及其以上。 011D 其他高中 012D 其他大學(xué)及其以上 這時(shí)需要引入兩個(gè)虛擬變量:模型可設(shè)定如下:iiiDDXY231210 在在E( i)=0 的初始假定下,高中以下、高中、大學(xué)及的初始假定下,高中以下、高中、大學(xué)及其以上教育水平下個(gè)人保健支出的函數(shù):其以上教育水平下個(gè)人保健支出的函數(shù):l高中以下:iiiXDDXYE1021)0, 0,|( 高中:iiiXDDXYE12021)()0, 1,|( 大學(xué)及其以上:iiiXDDXYE13021)() 1, 0,|( 假定32,其幾何意義: 大學(xué)教育 保健 高中教育 支出 低于中學(xué)教育 收入 還可將多個(gè)虛擬變量引入模型中以考察多種“定性”因素的
6、影響。 如如在上述職工薪金的例中,再引入代表學(xué)歷的虛擬變量D2:iiiDDXY231210012D本科及以上學(xué)歷本科以下學(xué)歷職工薪金的回歸模型可設(shè)計(jì)為:女職工本科以下學(xué)歷的平均薪金:iiiXDDXYE13021)() 1, 0,|(女職工本科以上學(xué)歷的平均薪金:iiiXDDXYE132021)() 1, 1,|(iiiXDDXYE1021)0, 0,|(iiiXDDXYE12021)()0, 1,|(于是,不同性別、不同學(xué)歷職工的平均薪金分別為:男職工本科以下學(xué)歷的平均薪金:男職工本科以上學(xué)歷的平均薪金:2. 乘法方式l加法方式引入虛擬變量,考察:截距的不同。截距的不同。l許多情況下:往往是斜
7、率就有變化,或斜率、截距或斜率、截距同時(shí)發(fā)生變化同時(shí)發(fā)生變化。l斜率的變化可通過以乘法的方式引入虛擬變量來測(cè)斜率的變化可通過以乘法的方式引入虛擬變量來測(cè)度度。 例例:根據(jù)消費(fèi)理論,消費(fèi)水平C主要取決于收入水平Y(jié),但在一個(gè)較長的時(shí)期,人們的消費(fèi)傾向會(huì)發(fā)生變化,尤其是在自然災(zāi)害、戰(zhàn)爭等反常年份,消費(fèi)傾向往往出現(xiàn)變化。這種消費(fèi)傾向的變化可通過在收入的系數(shù)中引入虛擬變量來考察。tttttXDXC210如,設(shè)01tD反常年份正常年份消費(fèi)模型可建立如下:l這里,虛擬變量D以與X相乘的方式引入了模型中,從而可用來考察消費(fèi)傾向的變化。l假定E(i)= 0,上述模型所表示的函數(shù)可化為: 正常年份:ttttXDX
8、CE)() 1,|(210 反常年份:ttttXDXCE10)0,|( 當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入加法與乘法形式的虛擬變量。l例例,考察1990年前后的中國居民的總儲(chǔ)蓄-收入關(guān)系是否已發(fā)生變化。 表中給出了中國19792001年以城鄉(xiāng)儲(chǔ)蓄存款余額代表的居民儲(chǔ)蓄以及以GNP代表的居民收入的數(shù)據(jù)。表表5.1.1 19792001年年中中國國居居民民儲(chǔ)儲(chǔ)蓄蓄與與收收入入數(shù)數(shù)據(jù)據(jù)(億億元元)90年前儲(chǔ)蓄GNP90年后儲(chǔ)蓄GNP19792814038.21991910721662.51980399.54517.8199211545.426651.91981523.74860.31993147
9、62.434560.51982675.45301.8199421518.846670.01983892.55957.4199529662.357494.919841214.77206.7199638520.866850.519851622.68989.1199746279.873142.719862237.610201.4199853407.576967.219873073.311954.5199959621.880579.419883801.514922.3200064332.488228.119895146.916917.8200173762.494346.419907034.218598
10、.4 以以Y為儲(chǔ)蓄,為儲(chǔ)蓄,X為收入,可令:為收入,可令:l1990年前: Yi=1+2Xi+1i i=1,2,n1 l1990年后: Yi=1+2Xi+2i i=1,2,n2 則有可能出現(xiàn)下述四種情況中的一種:(1) 1=1 ,且2=2 ,即兩個(gè)回歸相同,稱為重合重合回歸回歸(Coincident Regressions);(2) 11 ,但2=2 ,即兩個(gè)回歸的差異僅在其截距,稱為平行回歸平行回歸(Parallel Regressions);(3) 1=1 ,但22 ,即兩個(gè)回歸的差異僅在其斜率,稱為匯合回歸匯合回歸(Concurrent Regressions);(4) 11,且22 ,
11、即兩個(gè)回歸完全不同,稱為相相異回歸異回歸(Dissimilar Regressions)。平行回歸平行回歸匯合回歸匯合回歸相異回歸相異回歸 可以運(yùn)用可以運(yùn)用鄒氏結(jié)構(gòu)變化的檢驗(yàn)。這一問題也可通過引入。這一問題也可通過引入乘法形式的虛擬變量來解決。乘法形式的虛擬變量來解決。 將n1與n2次觀察值合并,并用以估計(jì)以下回歸:iiiiiiXDDXY)(4310Di為引入的虛擬變量:01iD年后年前9090 于是有:iiiiXXDYE10), 0|(iiiiXXDYE)()(), 1|(4130可分別表示1990年后期與前期的儲(chǔ)蓄函數(shù)。 在統(tǒng)計(jì)檢驗(yàn)中,如果在統(tǒng)計(jì)檢驗(yàn)中,如果 3=0的假設(shè)被拒絕,則說明兩個(gè)
12、時(shí)的假設(shè)被拒絕,則說明兩個(gè)時(shí)期中儲(chǔ)蓄函數(shù)的截距不同,期中儲(chǔ)蓄函數(shù)的截距不同,如果如果 4=0的假設(shè)被拒絕,則說明兩的假設(shè)被拒絕,則說明兩個(gè)時(shí)期中儲(chǔ)蓄函數(shù)的斜率不同。個(gè)時(shí)期中儲(chǔ)蓄函數(shù)的斜率不同。l具體的回歸結(jié)果為:具體的回歸結(jié)果為: (-6.11) (22.89) (4.33) (-2.55) 由3與4的t檢驗(yàn)可知:參數(shù)顯著地不等于0,強(qiáng)烈示出兩個(gè)時(shí)期的回歸是相異的,儲(chǔ)蓄函數(shù)儲(chǔ)蓄函數(shù)分別為:分別為:1990年前:1990年后:iiiiiXDDXY4765. 03 .138028881. 0154522R=0.9836iiXY4116. 07 .1649iiXY8881. 015452鄒氏結(jié)構(gòu)變化
13、的檢驗(yàn)和虛擬變量法的比較l鄒檢驗(yàn)只是告訴我們結(jié)構(gòu)是否已經(jīng)變化,而不能告訴我們當(dāng)有變化時(shí)候是因?yàn)橹皇切甭氏喈惢蛑皇墙鼐嘞喈悾騼烧呔喈?。但是虛擬變量法不僅告訴我們兩個(gè)回歸是否有差異,而且落實(shí)到差異的起因由于截距或由于斜率或由于兩者。l我們只要做一個(gè)回歸,因?yàn)槠渌幕貧w可以方便地由它導(dǎo)出。l這個(gè)單一的回歸可以用來做各種假設(shè)檢驗(yàn)。l由于合并而增加了自由度,參數(shù)估計(jì)的相對(duì)精度也有所改進(jìn)。3. 臨界指標(biāo)的虛擬變量的引入(分段回歸) 在經(jīng)濟(jì)發(fā)生轉(zhuǎn)折時(shí)期,可通過建立臨界指標(biāo)的虛擬變量模型來反映。 例如,例如,進(jìn)口消費(fèi)品數(shù)量Y主要取決于國民收入X的多少,中國在改革開放前后,Y對(duì)X的回歸關(guān)系明顯不同。 01t
14、D*tttt則進(jìn)口消費(fèi)品的回歸模型可建立如下:則進(jìn)口消費(fèi)品的回歸模型可建立如下: ttttttDXXXY)(*210 這時(shí),可以t*=1979年為轉(zhuǎn)折期,以1979年的國民收入Xt*為臨界值,設(shè)如下虛擬變量: OLS法得到該模型的回歸方程為:法得到該模型的回歸方程為:則兩時(shí)期進(jìn)口消費(fèi)品函數(shù)分別為:tttttDXXXY)(*210當(dāng)tt*=1979年,ttXY10當(dāng)tt*=1979年,titXXY)()(21*20三、虛擬變量的設(shè)置原則 虛擬變量的個(gè)數(shù)須按以下原則確定:虛擬變量的個(gè)數(shù)須按以下原則確定: 每一定性變量所需的虛擬變量個(gè)數(shù)要比該定性每一定性變量所需的虛擬變量個(gè)數(shù)要比該定性變量的類別數(shù)少
15、變量的類別數(shù)少1,即如果有,即如果有m個(gè)定性變量,只在模個(gè)定性變量,只在模型中引入型中引入m-1個(gè)虛擬變量。個(gè)虛擬變量。 例例 已知冷飲的銷售量Y除受k種定量變量Xk的影響外,還受春、夏、秋、冬四季變化的影響,要考察該四季的影響,只需引入三個(gè)虛擬變量即可:011tD其他春季012tD其他夏季013tD其他秋季則冷飲銷售量的模型為:則冷飲銷售量的模型為:在上述模型中,若再引入第四個(gè)虛擬變量:ttttktkttDDDXXY332211110014tD其他冬季則冷飲銷售模型變量為:tttttktkttDDDDXXY44332211110其矩陣形式為:D)(X,Y 如果只取六個(gè)觀測(cè)值,其中春季與夏季取了兩
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)定制辦公臺(tái)式機(jī)采購合同
- 承包合同轉(zhuǎn)讓協(xié)議的變更
- 白酒二批經(jīng)銷商合同協(xié)議范本
- 居間及法律服務(wù)合同糾紛
- 街邊店鋪轉(zhuǎn)讓合同模板
- 環(huán)保廢鋼采購協(xié)議
- 項(xiàng)目設(shè)計(jì)招標(biāo)文件模板設(shè)計(jì)心得分享
- 網(wǎng)站故障排查服務(wù)合同
- 電梯設(shè)備運(yùn)營服務(wù)合同
- 質(zhì)物借款責(zé)任
- 2024年公安基礎(chǔ)知識(shí)考試題庫及答案
- 工程管理基礎(chǔ)知識(shí)單選題100道及答案
- 我用的短線選股法(此法選股100%成功)
- 2024年人工智能(AI)訓(xùn)練師職業(yè)技能鑒定考試題庫(濃縮500題)
- 三級(jí)公立醫(yī)院績效考核微創(chuàng)手術(shù)目錄(2022版)
- GB/T 15597.1-2024塑料聚甲基丙烯酸甲酯(PMMA)模塑和擠出材料第1部分:命名系統(tǒng)和分類基礎(chǔ)
- 2024版招投標(biāo)合同范本
- 漢字與對(duì)外漢語教學(xué)智慧樹知到期末考試答案章節(jié)答案2024年西北師范大學(xué)
- 貴州省黔南州2023-2024學(xué)年度上學(xué)期期末質(zhì)量監(jiān)測(cè)八年級(jí)物理試卷
- 籃球智慧樹知到期末考試答案章節(jié)答案2024年溫州理工學(xué)院
- 統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)-形成性考核三(項(xiàng)目6-項(xiàng)目8階段性測(cè)試權(quán)重25%)-國開-參考資料
評(píng)論
0/150
提交評(píng)論