




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)據(jù)數(shù)據(jù)(shj)統(tǒng)計與分析教程章含虛擬變量統(tǒng)計與分析教程章含虛擬變量的回歸模型的回歸模型第一頁,共22頁。一、虛擬變量的定義1.定性(dng xng)變量與定量變量定量變量:回歸模型定量變量:回歸模型(mxng)中有些變量是可以被度量的,如居民消費、國內(nèi)生產(chǎn)總值、出口總額等,這些變量被稱為中有些變量是可以被度量的,如居民消費、國內(nèi)生產(chǎn)總值、出口總額等,這些變量被稱為“定量變量定量變量”。定性變量:在經(jīng)濟現(xiàn)象的分析中還存在一些不能被度量的變量,如性別、種族、婚姻狀況、文化程度等,這些變量被稱為定性變量:在經(jīng)濟現(xiàn)象的分析中還存在一些不能被度量的變量,如性別、種族、婚姻狀況、文化程度等,這些變量被
2、稱為“定性變量定性變量”。 第1頁/共22頁第二頁,共22頁。一、虛擬(xn)變量的定義2.虛擬(xn)變量定義:定義:定性變量描述的是變量具有的性質(zhì),要將這樣的變量納入回歸模型中,需構(gòu)造定性變量描述的是變量具有的性質(zhì),要將這樣的變量納入回歸模型中,需構(gòu)造(guzo)人工變量,從而將定性變量進行量化處理。人工變量,從而將定性變量進行量化處理。在計量經(jīng)濟學(xué)中,將取值為在計量經(jīng)濟學(xué)中,將取值為“0”和和“1” 的人工變量稱作虛擬變量(的人工變量稱作虛擬變量(Dummy Variable),用字母),用字母D表示。當表示。當D取值為取值為0時,表示該變量不具備某種屬性;當時,表示該變量不具備某種屬性
3、;當D取值為取值為1時,表示該變量具有某種屬性。時,表示該變量具有某種屬性。 第2頁/共22頁第三頁,共22頁。一、虛擬(xn)變量的定義2.虛擬(xn)變量虛擬變量陷阱:虛擬變量陷阱:所謂的所謂的“虛擬變量陷阱虛擬變量陷阱”是指自變量(解釋變量)中包含了過多的虛擬變量,從而導(dǎo)致了模型出現(xiàn)多重共線性。當模型中既有整體截距又對每一組都設(shè)有一個是指自變量(解釋變量)中包含了過多的虛擬變量,從而導(dǎo)致了模型出現(xiàn)多重共線性。當模型中既有整體截距又對每一組都設(shè)有一個(y )虛擬變量時,就產(chǎn)生了虛擬變量陷阱。虛擬變量時,就產(chǎn)生了虛擬變量陷阱。第3頁/共22頁第四頁,共22頁。一、虛擬變量(binling)的
4、定義2.虛擬變量(binling)引入虛擬變量的原則:引入虛擬變量的原則:一般情況一般情況(qngkung)下,如果定性變量有下,如果定性變量有m類,并且模型不含有截距項時,應(yīng)引入類,并且模型不含有截距項時,應(yīng)引入m個虛擬變量;如果模型含有截距項,應(yīng)引入個虛擬變量;如果模型含有截距項,應(yīng)引入m-1個虛擬變量。個虛擬變量。第4頁/共22頁第五頁,共22頁。二、含虛擬變量(binling)的模型1.僅含一個虛擬變量(binling)在回歸模型中,解釋變量可以僅是一個虛擬變量,這樣在回歸模型中,解釋變量可以僅是一個虛擬變量,這樣(zhyng)的回歸模型被稱為方差分析模型。的回歸模型被稱為方差分析模型
5、。 例如:例如:yt =0 + 1Dt + t 假設(shè)被解釋變量假設(shè)被解釋變量yt為員工工資收入,為員工工資收入,Dt為虛擬解釋變量,取值為為虛擬解釋變量,取值為0或或1: 1,雇員為女性,雇員為女性Dt= 0,雇員為男性,雇員為男性第5頁/共22頁第六頁,共22頁。二、含虛擬變量(binling)的模型1.僅含一個虛擬變量(binling)如果該回歸模型的隨機誤差項滿足線性回歸模型的五個基本如果該回歸模型的隨機誤差項滿足線性回歸模型的五個基本(jbn)假定條件,則假定條件,則E(yt| Dt=1)= E(雇員工資收入(雇員工資收入|雇員為女性)雇員為女性)=0 + 1E(yt| Dt=0)=
6、E(雇員工資收入(雇員工資收入|雇員為男性)雇員為男性)=00 + 1表示女性雇員的平均工資收入,表示女性雇員的平均工資收入,0表示男性雇員的平均工資收入。表示男性雇員的平均工資收入。第6頁/共22頁第七頁,共22頁。二、含虛擬變量(binling)的模型1.僅含一個虛擬變量(binling)實驗:實驗:根據(jù)表根據(jù)表7-1中的數(shù)據(jù)顯示,建立解釋變量為虛擬變量的回歸模型。表中列出了中的數(shù)據(jù)顯示,建立解釋變量為虛擬變量的回歸模型。表中列出了24個不同性別個不同性別(xngbi)的企業(yè)員工的月工資收入情況,性別的企業(yè)員工的月工資收入情況,性別(xngbi)一列中一列中“1”表示女性員工,表示女性員工
7、,“0”表示男性員工。通過建立含有虛擬變量的回歸模型,試圖分析男女平均工資是否存有差距,如果有差距,那么差距是多少。表示男性員工。通過建立含有虛擬變量的回歸模型,試圖分析男女平均工資是否存有差距,如果有差距,那么差距是多少。 第7頁/共22頁第八頁,共22頁。二、含虛擬變量的模型(mxng)1.僅含一個虛擬變量實驗:實驗:回歸模型為回歸模型為yt =0 + 1Dt + t (t=1,2,n)其中,其中,yt表示企業(yè)表示企業(yè)(qy)員工的工資收入情況,員工的工資收入情況,Dt=0表示男性員工,表示男性員工,Dt=1表示女性員工。表示女性員工。第8頁/共22頁第九頁,共22頁。二、含虛擬變量的模型
8、(mxng)1.僅含一個虛擬變量實驗:實驗:第一步,建立類型為第一步,建立類型為“Unstructured/Undated”(未限定結(jié)構(gòu)(未限定結(jié)構(gòu)/未限定日期)的工作文件,在未限定日期)的工作文件,在“Data range”(數(shù)據(jù)范圍)中輸入觀測數(shù)據(jù)的樣本范圍,本例中所分析的數(shù)據(jù)為(數(shù)據(jù)范圍)中輸入觀測數(shù)據(jù)的樣本范圍,本例中所分析的數(shù)據(jù)為24個樣本,在個樣本,在“Names”中為該工資文件命名中為該工資文件命名(mng mng),如,如“工資與性別關(guān)系工資與性別關(guān)系”。然后單擊。然后單擊“OK”按鈕即可生成工作文件。按鈕即可生成工作文件。 第9頁/共22頁第十頁,共22頁。二、含虛擬變量(b
9、inling)的模型1.僅含一個虛擬變量(binling)實驗:實驗:第二步,在該工作文件中建立兩個序列對象,一個為第二步,在該工作文件中建立兩個序列對象,一個為“wage”,一個為,一個為“sex”。第三步,在第三步,在“wage”序列對象中輸入序列對象中輸入 “工資工資(gngz)”的數(shù)據(jù),在的數(shù)據(jù),在“sex”序列對象中輸入序列對象中輸入 “性別性別”的數(shù)據(jù)。的數(shù)據(jù)。第10頁/共22頁第十一頁,共22頁。二、含虛擬(xn)變量的模型1.僅含一個虛擬(xn)變量實驗:實驗:第四步,在工作文件中選擇主菜單欄中的第四步,在工作文件中選擇主菜單欄中的“Object”| “New Object”
10、| “Equation”選項,或者選項,或者(huzh)選擇選擇“Quick”| “Estimate Equation” 選項,打開如下所示的方程對話框。選項,打開如下所示的方程對話框。第11頁/共22頁第十二頁,共22頁。二、含虛擬變量的模型(mxng)1.僅含一個虛擬變量實驗:實驗:在在“Equation specification”(方程說明)中列出模型中的被解釋變量、常數(shù)項和解釋變量。在(方程說明)中列出模型中的被解釋變量、常數(shù)項和解釋變量。在“Estimation settings”(估計方法設(shè)定)中選擇(估計方法設(shè)定)中選擇“LS”,用普通最小二乘法對回歸,用普通最小二乘法對回歸(
11、hugu)模型進行估計。然后單擊模型進行估計。然后單擊“確定確定”按鈕即可得到如下估計結(jié)果。按鈕即可得到如下估計結(jié)果。第12頁/共22頁第十三頁,共22頁。二、含虛擬(xn)變量的模型1.僅含一個虛擬(xn)變量實驗實驗(shyn):虛擬變量的回歸方程結(jié)果可以表示為:虛擬變量的回歸方程結(jié)果可以表示為:Wage = 3478.869 595.0965 sext= (30.06899) (-3.482241)R2 = 0.35533 Adjusted- R2 = 0.326027 F=12.126 D.W.=2.232989結(jié)果表明,該企業(yè)的女性員工的平均工資水平為結(jié)果表明,該企業(yè)的女性員工的平均
12、工資水平為2883.7725(3478.869595.0965)元人民幣,該企業(yè)的男性員工的平均工資水平為)元人民幣,該企業(yè)的男性員工的平均工資水平為3478.869元人民幣。由此可見,女性的平均工資比男性少了元人民幣。由此可見,女性的平均工資比男性少了595.0965元。元。第13頁/共22頁第十四頁,共22頁。二、含虛擬變量的模型2. 同時含虛擬和定量(dngling)解釋變量當方程當方程(fngchng)的解釋變量中既有虛擬變量又有定量變量時,同樣可以用的解釋變量中既有虛擬變量又有定量變量時,同樣可以用OLS對模型進行估計。例如:對模型進行估計。例如:yt =0 + 1 xt+2Dt +
13、 t 第14頁/共22頁第十五頁,共22頁。二、含虛擬變量的模型(mxng)2. 同時含虛擬和定量解釋變量實驗:實驗:隨著科技的進步和人民生活水平的不斷提高,電腦越來越普及,許多家庭紛紛把個人電腦(隨著科技的進步和人民生活水平的不斷提高,電腦越來越普及,許多家庭紛紛把個人電腦(PC機)搬進家中。我們機)搬進家中。我們(w men)可以研究人們的收入水平、受教育程度與城鄉(xiāng)居民之間的關(guān)系。模型如下,可以研究人們的收入水平、受教育程度與城鄉(xiāng)居民之間的關(guān)系。模型如下,yt =0 + 1 xt+2D2t +3D3t + t (t=1,2,n)其中,其中,yt表示根據(jù)調(diào)查資料所得到的家庭所購買個人電腦情況
14、,表示根據(jù)調(diào)查資料所得到的家庭所購買個人電腦情況,xt表示家庭收入,表示家庭收入, D2 和和D3為虛擬解釋變量。為虛擬解釋變量。 第15頁/共22頁第十六頁,共22頁。二、含虛擬(xn)變量的模型2. 同時含虛擬(xn)和定量解釋變量實驗:實驗: 1,大專及以上學(xué)歷,大專及以上學(xué)歷D2 = 0,其他,其他 1,城鎮(zhèn)居民,城鎮(zhèn)居民D3 = 0,非城鎮(zhèn)居民,非城鎮(zhèn)居民根據(jù)表根據(jù)表7-2中的數(shù)據(jù)用普通最小二乘法(中的數(shù)據(jù)用普通最小二乘法(OLS)對模型進行估計,并分析)對模型進行估計,并分析(fnx)回歸結(jié)果。回歸結(jié)果。第16頁/共22頁第十七頁,共22頁。二、含虛擬變量的模型(mxng)2. 同
15、時含虛擬和定量解釋變量操作步驟:操作步驟:第一步,建立第一步,建立(jinl)類型為類型為“Unstructured/Undated”(未限定結(jié)構(gòu)(未限定結(jié)構(gòu)/未限定日期)的工作文件。未限定日期)的工作文件。第二步,在該工作文件中建立第二步,在該工作文件中建立(jinl)四個序列對象。四個序列對象。 “pc” 代表家庭擁有的電腦數(shù)量;代表家庭擁有的電腦數(shù)量;“rev”代表家庭每月收入;代表家庭每月收入;“edu”代表教育程度;代表教育程度;“city”表示城鄉(xiāng)居民情況。并把相應(yīng)的數(shù)據(jù)輸入到每個序列對象中。表示城鄉(xiāng)居民情況。并把相應(yīng)的數(shù)據(jù)輸入到每個序列對象中。第17頁/共22頁第十八頁,共22頁
16、。二、含虛擬變量的模型2. 同時(tngsh)含虛擬和定量解釋變量操作步驟:操作步驟:第三步,在工作文件中選擇主菜單欄中的第三步,在工作文件中選擇主菜單欄中的“Object”| “New Object” | “Equation”選項,打開方程對話框。在選項,打開方程對話框。在“Equation specification”(方程說明(方程說明(shumng))中輸入)中輸入“pc c rev edu city ”或或“pc=c(1)+c(2)*rev+c (3) *edu+c (4) *city”,在,在“Estimation settings”(估計方法設(shè)定)中選擇(估計方法設(shè)定)中選擇“L
17、S”。第18頁/共22頁第十九頁,共22頁。二、含虛擬(xn)變量的模型2. 同時含虛擬(xn)和定量解釋變量操作步驟:操作步驟:第四步,結(jié)果分析。第四步,結(jié)果分析。 右圖中,變量右圖中,變量edu和變量和變量city沒有沒有通過顯著性(通過顯著性(t)檢驗,說明這兩)檢驗,說明這兩個變量對因變量個變量對因變量pc的影響不顯著。的影響不顯著。因而,在所調(diào)查的樣本因而,在所調(diào)查的樣本(yngbn)中,被調(diào)中,被調(diào)查者的受教育程度以及是否是城查者的受教育程度以及是否是城鎮(zhèn)居民對擁有個人電腦的數(shù)量沒鎮(zhèn)居民對擁有個人電腦的數(shù)量沒有顯著的影響。有顯著的影響。 第19頁/共22頁第二十頁,共22頁。三、用虛擬變量法進行季節(jié)(jji)調(diào)整在使用虛擬變量法對時間序列進行季節(jié)性調(diào)整時,可以計算出每個季節(jié)對經(jīng)濟變量的影響。在使用虛擬變量法對時間序列進行季節(jié)性調(diào)整時,可以計算出每個季節(jié)對經(jīng)濟變量的影響。假設(shè)模型含有截距項,則四個季節(jié)包含了假設(shè)模型含有截距項,則四個季節(jié)包含了4種分類種分類(fn li),因而需要引入,因而需要引入3個虛擬變量(個虛擬變量(41)。用)。用Qi表示第表示第i個季度取值為個季度取值為1,其他季節(jié)取值為,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新疆師范大學(xué)《實驗室安全與法規(guī)》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶市主城區(qū)七校聯(lián)考2025年高三教學(xué)質(zhì)量檢測試題試卷(二)物理試題含解析
- 公共交通運營服務(wù)收費標準制度
- 第18課 清朝的邊疆治理 教案2024-2025學(xué)年七年級歷史下冊新課標
- 內(nèi)圓形吊頂施工方案
- 護坡植草施工方案
- 路基修復(fù)夜間施工方案
- 工程資料與施工方案
- 汽車隔音施工方案范本
- 2025年搞笑考試面試試題及答案
- 江蘇省藥品上市許可持有人藥品生產(chǎn)質(zhì)量安全主體責(zé)任正面清單、負面清單(2023年版)
- 2024年GINA哮喘防治指南修訂解讀課件
- 木地板合同范本
- 2024中交二航局分包合同范本
- 2024年社區(qū)工作者考試必背1000題題庫必背(必刷)
- 教育改革與發(fā)展
- 《形體訓(xùn)練》課件-勾繃腳訓(xùn)練
- 醫(yī)療器械(耗材)項目投標服務(wù)實施投標方案(技術(shù)方案)
- 監(jiān)控系統(tǒng)維護保養(yǎng)方案
- 2023年國家廣播電視總局無線電臺管理局考試真題及答案
- 房屋修繕工程技術(shù)規(guī)程 DG-TJ08-207-2008
評論
0/150
提交評論