版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)統(tǒng)計與分析教程章含虛擬變量的回數(shù)據(jù)統(tǒng)計與分析教程章含虛擬變量的回歸模型歸模型一、虛擬變量的定義1.定性變量與定量變量定量變量:定量變量:回歸模型中有些變量是可以被度量的,如居民消費、國內(nèi)生產(chǎn)總值、出口總額等,這些變量被稱為“定量變量定量變量”。定性變量定性變量:在經(jīng)濟現(xiàn)象的分析中還存在一些不能被度量的變量,如性別、種族、婚姻狀況、文化程度等,這些變量被稱為“定性變量定性變量”。 第1頁/共22頁一、虛擬變量的定義2.虛擬變量定義定義:定性變量描述的是變量具有的性質(zhì),要將這樣的變量納入回歸模型中,需構(gòu)造人工變量,從而將定性變量進(jìn)行量化處理。定性變量描述的是變量具有的性質(zhì),要將這樣的變量納入回
2、歸模型中,需構(gòu)造人工變量,從而將定性變量進(jìn)行量化處理。在計量經(jīng)濟學(xué)中,將取值為在計量經(jīng)濟學(xué)中,將取值為“0”和和“1” 的人工變量稱作虛擬變量(的人工變量稱作虛擬變量(Dummy Variable),用字母),用字母D表示。當(dāng)表示。當(dāng)D取值為取值為0時,表示該變量不具備某種屬性;當(dāng)時,表示該變量不具備某種屬性;當(dāng)D取值為取值為1時,表示該變量具有某種屬性。時,表示該變量具有某種屬性。 第2頁/共22頁一、虛擬變量的定義2.虛擬變量虛擬變量陷阱虛擬變量陷阱:所謂的所謂的“虛擬變量陷阱虛擬變量陷阱”是指自變量(解釋變量)中包含了過多的虛擬變量,從而導(dǎo)致了模型出現(xiàn)多重共線性。當(dāng)模型中既有整體截距又對
3、每一組都設(shè)有一個虛擬變量時,就產(chǎn)生了虛擬變量陷阱。是指自變量(解釋變量)中包含了過多的虛擬變量,從而導(dǎo)致了模型出現(xiàn)多重共線性。當(dāng)模型中既有整體截距又對每一組都設(shè)有一個虛擬變量時,就產(chǎn)生了虛擬變量陷阱。第3頁/共22頁一、虛擬變量的定義2.虛擬變量引入虛擬變量的原則引入虛擬變量的原則:一般情況下,如果定性變量有一般情況下,如果定性變量有m類,并且模型不含有截距項時,應(yīng)引入類,并且模型不含有截距項時,應(yīng)引入m個虛擬變量;如果模型含有截距項,應(yīng)引入個虛擬變量;如果模型含有截距項,應(yīng)引入m-1個虛擬變量。個虛擬變量。第4頁/共22頁二、含虛擬變量的模型1.僅含一個虛擬變量在回歸模型中,解釋變量可以僅是
4、一個虛擬變量,這樣的回歸模型被稱為方差分析模型。在回歸模型中,解釋變量可以僅是一個虛擬變量,這樣的回歸模型被稱為方差分析模型。 例如:yt =0 + 1Dt + t 假設(shè)被解釋變量yt為員工工資收入,Dt為虛擬解釋變量,取值為0或1: 1,雇員為女性,雇員為女性Dt= 0,雇員為男性,雇員為男性第5頁/共22頁二、含虛擬變量的模型1.僅含一個虛擬變量如果該回歸模型的隨機誤差項滿足線性回歸模型的五個基本假定條件,則E(yt| Dt=1)= E(雇員工資收入|雇員為女性)=0 + 1E(yt| Dt=0)= E(雇員工資收入|雇員為男性)=00 + 1表示女性雇員的平均工資收入,0表示男性雇員的平
5、均工資收入。第6頁/共22頁二、含虛擬變量的模型1.僅含一個虛擬變量實驗:根據(jù)表7-1中的數(shù)據(jù)顯示,建立解釋變量為虛擬變量的回歸模型。表中列出了24個不同性別的企業(yè)員工的月工資收入情況,性別一列中“1”表示女性員工,“0”表示男性員工。通過建立含有虛擬變量的回歸模型,試圖分析男女平均工資是否存有差距,如果有差距,那么差距是多少。 第7頁/共22頁二、含虛擬變量的模型1.僅含一個虛擬變量實驗:回歸模型為yt =0 + 1Dt + t (t=1,2,n)其中,yt表示企業(yè)員工的工資收入情況,Dt=0表示男性員工,Dt=1表示女性員工。第8頁/共22頁二、含虛擬變量的模型1.僅含一個虛擬變量實驗:第
6、一步,建立類型為“Unstructured/Undated”(未限定結(jié)構(gòu)/未限定日期)的工作文件,在“Data range”(數(shù)據(jù)范圍)中輸入觀測數(shù)據(jù)的樣本范圍,本例中所分析的數(shù)據(jù)為24個樣本,在“Names”中為該工資文件命名,如“工資與性別關(guān)系”。然后單擊“OK”按鈕即可生成工作文件。 第9頁/共22頁二、含虛擬變量的模型1.僅含一個虛擬變量實驗:第二步,在該工作文件中建立兩個序列對象,一個為“wage”,一個為“sex”。第三步,在“wage”序列對象中輸入 “工資”的數(shù)據(jù),在“sex”序列對象中輸入 “性別”的數(shù)據(jù)。第10頁/共22頁二、含虛擬變量的模型1.僅含一個虛擬變量實驗:第四步
7、,在工作文件中選擇主菜單欄中的“Object”| “New Object” | “Equation”選項,或者選擇“Quick”| “Estimate Equation” 選項,打開如下所示的方程對話框。第11頁/共22頁二、含虛擬變量的模型1.僅含一個虛擬變量實驗:在“Equation specification”(方程說明)中列出模型中的被解釋變量、常數(shù)項和解釋變量。在“Estimation settings”(估計方法設(shè)定)中選擇“LS”,用普通最小二乘法對回歸模型進(jìn)行估計。然后單擊“確定”按鈕即可得到如下估計結(jié)果。第12頁/共22頁二、含虛擬變量的模型1.僅含一個虛擬變量實驗:虛擬變量
8、的回歸方程結(jié)果可以表示為:Wage = 3478.869 595.0965 sext= (30.06899) (-3.482241)R2 = 0.35533 Adjusted- R2 = 0.326027 F=12.126 D.W.=2.232989結(jié)果表明,該企業(yè)的女性員工的平均工資水平為2883.7725(3478.869595.0965)元人民幣,該企業(yè)的男性員工的平均工資水平為3478.869元人民幣。由此可見,女性的平均工資比男性少了595.0965元。第13頁/共22頁二、含虛擬變量的模型2. 同時含虛擬和定量解釋變量當(dāng)方程的解釋變量中既有虛擬變量又有定量變量時,同樣可以用當(dāng)方程的
9、解釋變量中既有虛擬變量又有定量變量時,同樣可以用OLS對模型進(jìn)行估計。例如:對模型進(jìn)行估計。例如:yt =0 + 1 xt+2Dt + t 第14頁/共22頁二、含虛擬變量的模型2. 同時含虛擬和定量解釋變量實驗實驗:隨著科技的進(jìn)步和人民生活水平的不斷提高,電腦越來越普及,許多家庭紛紛把個人電腦(PC機)搬進(jìn)家中。我們可以研究人們的收入水平、受教育程度與城鄉(xiāng)居民之間的關(guān)系。模型如下,yt =0 + 1 xt+2D2t +3D3t + t (t=1,2,n)其中,yt表示根據(jù)調(diào)查資料所得到的家庭所購買個人電腦情況,xt表示家庭收入, D2 和D3為虛擬解釋變量。 第15頁/共22頁二、含虛擬變量
10、的模型2. 同時含虛擬和定量解釋變量實驗實驗: 1,大專及以上學(xué)歷,大專及以上學(xué)歷D2 = 0,其他,其他 1,城鎮(zhèn)居民,城鎮(zhèn)居民D3 = 0,非城鎮(zhèn)居民,非城鎮(zhèn)居民根據(jù)表7-2中的數(shù)據(jù)用普通最小二乘法(OLS)對模型進(jìn)行估計,并分析回歸結(jié)果。第16頁/共22頁二、含虛擬變量的模型2. 同時含虛擬和定量解釋變量操作步驟操作步驟:第一步,建立類型為“Unstructured/Undated”(未限定結(jié)構(gòu)/未限定日期)的工作文件。第二步,在該工作文件中建立四個序列對象。 “pc” 代表家庭擁有的電腦數(shù)量;“rev”代表家庭每月收入;“edu”代表教育程度;“city”表示城鄉(xiāng)居民情況。并把相應(yīng)的數(shù)
11、據(jù)輸入到每個序列對象中。第17頁/共22頁二、含虛擬變量的模型2. 同時含虛擬和定量解釋變量操作步驟操作步驟:第三步,在工作文件中選擇主菜單欄中的“Object”| “New Object” | “Equation”選項,打開方程對話框。在“Equation specification”(方程說明)中輸入“pc c rev edu city ”或“pc=c(1)+c(2)*rev+c (3) *edu+c (4) *city”,在“Estimation settings”(估計方法設(shè)定)中選擇“LS”。第18頁/共22頁二、含虛擬變量的模型2. 同時含虛擬和定量解釋變量操作步驟操作步驟:第四步
12、,結(jié)果分析。 右圖中,變量edu和變量city沒有通過顯著性(t)檢驗,說明這兩個變量對因變量pc的影響不顯著。因而,在所調(diào)查的樣本中,被調(diào)查者的受教育程度以及是否是城鎮(zhèn)居民對擁有個人電腦的數(shù)量沒有顯著的影響。 第19頁/共22頁三、用虛擬變量法進(jìn)行季節(jié)調(diào)整在使用虛擬變量法對時間序列進(jìn)行季節(jié)性調(diào)整時,可以計算出每個季節(jié)對經(jīng)濟變量的影響。在使用虛擬變量法對時間序列進(jìn)行季節(jié)性調(diào)整時,可以計算出每個季節(jié)對經(jīng)濟變量的影響。假設(shè)模型含有截距項,則四個季節(jié)包含了假設(shè)模型含有截距項,則四個季節(jié)包含了4種分類,因而需要引入種分類,因而需要引入3個虛擬變量(個虛擬變量(41)。用)。用Qi表示第表示第i個季度取值為個季度取值為1,其他季節(jié)取值為,其他季節(jié)取值為0這樣一個虛擬變量,則這樣一個虛擬變量,則Q1 + Q2 +
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年洗衣房租賃合同樣本3篇
- 2024年版權(quán)轉(zhuǎn)讓合同:關(guān)于某暢銷小說的版權(quán)轉(zhuǎn)讓及分成協(xié)議
- 2024-2025學(xué)年度廣西部分學(xué)校高一第一學(xué)期12月階段性考試歷史試題
- 主管護(hù)師(兒科護(hù)理)資格考試題庫(含各題型)
- 紙箱制作課程設(shè)計
- 中考語文散文閱讀的答題技巧
- 幼兒面試課程設(shè)計
- 愛國微課程設(shè)計
- 2024年用電監(jiān)察員(用電檢查員)技師職業(yè)鑒定考試題庫(含答案)
- 網(wǎng)絡(luò)營銷教學(xué)課程設(shè)計
- 水平井施工方案及措施
- 小學(xué)數(shù)學(xué)一年級上冊-期末測試卷(二)含答案-人教版
- 登金陵鳳凰臺
- 小學(xué)四年級數(shù)學(xué)上冊促銷問題
- 初中體育-50米跑教學(xué)設(shè)計學(xué)情分析教材分析課后反思
- 國內(nèi)外中學(xué)數(shù)學(xué)教學(xué)改革與發(fā)展
- 醫(yī)院藥品評價與遴選量化評分表
- 專業(yè)英語四級模擬試卷450(題后含答案及解析)
- 中等職業(yè)學(xué)校班主任能力比賽幼兒保育專業(yè)班級建設(shè)方案
- 50道《鄉(xiāng)土中國》期末專題訓(xùn)練習(xí)題(多題型含解析)
- 滕王閣序帶拼音全文譯文
評論
0/150
提交評論