第四章多元線性回歸模型PPT課件_第1頁
第四章多元線性回歸模型PPT課件_第2頁
第四章多元線性回歸模型PPT課件_第3頁
第四章多元線性回歸模型PPT課件_第4頁
第四章多元線性回歸模型PPT課件_第5頁
已閱讀5頁,還剩89頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第1頁/共94頁2021-11-172 假設被解釋變量假設被解釋變量Y Y是解釋變量是解釋變量X X1 1,X X2 2,X Xk k和隨機誤差項和隨機誤差項u u的線性函數,表達式為:的線性函數,表達式為:u.22110kkXXXY總體回歸模型總體回歸模型kkXXXYE.)(22110總體回歸線(方程)總體回歸線(方程)一、基本概念一、基本概念第2頁/共94頁2021-11-173 u210PXY)114. 0()003. 0()6 . 9(99. 0739. 0112. 07 .1162RPXY例例1 1: 其中其中:Y=:Y=在食品上的總支出在食品上的總支出; ; X= X=個人可支配收

2、入個人可支配收入; ; P= P=食品價格指數食品價格指數; ; 用美國用美國1959-19831959-1983年的數據(單位:年的數據(單位:1010億美元),得到如下回歸結果億美元),得到如下回歸結果(括號中數字為標準誤差):(括號中數字為標準誤差):第3頁/共94頁2021-11-174上例中斜率系數的含義說明如下:上例中斜率系數的含義說明如下: 價格不變的情況下,個人可支配收入每上升價格不變的情況下,個人可支配收入每上升1010億億美元(美元(1 1個個billionbillion),食品消費支出平均增加),食品消費支出平均增加1.121.12億億元(元(0.1120.112個個 b

3、illionbillion)。)。 收入不變的情況下,價格指數每上升一個點,食收入不變的情況下,價格指數每上升一個點,食品消費支出平均減少品消費支出平均減少7.397.39億元(億元(0.7390.739個個billionbillion)多元線性回歸模型中斜率系數的含義多元線性回歸模型中斜率系數的含義第4頁/共94頁2021-11-175 設(設( X X1i1i,X X2i2i,X Xkiki;Y Yi i),),i=1i=1,2 2,n n是對總體是對總體( X X1 1,X X2 2,X Xk k;Y Y)的)的n n次獨立次獨立樣本觀測值,則:樣本觀測值,則:niXXXYikikiii

4、, 2 , 1u.22110第5頁/共94頁2021-11-176nknknnnkkkkuXXXYuXXXYuXXXY.2211022222121021121211101對于對于n n組觀測值,即:組觀測值,即:第6頁/共94頁2021-11-177其矩陣形式為:其矩陣形式為:UXY121.nnYYYY) 1(1212111.1.1.1knknnkkXXXXXXX1211) 1(10.nnkkuuuU其中:其中:第7頁/共94頁2021-11-178設樣本(設樣本(X X1i1i,X X2i2i,X Xkiki;Y Yi i),),i=1i=1,2 2,n n),(),估計(k10k10.的估

5、計值。殘差項,擬合誤差,是的估計值或估計量;ik10k10i22110,.,.,.ikikiiieeXXXY樣本回歸模型樣本回歸模型第8頁/共94頁2021-11-179kikiiiXXXY.22110樣本回歸線(方程)樣本回歸線(方程)其矩陣形式為:其矩陣形式為:XY 其中其中: :121.nnYYYY1) 1(10.kk第9頁/共94頁2021-11-1710 多元線性回歸模型在滿足下列基本假設的多元線性回歸模型在滿足下列基本假設的情況下,可以采用普通最小二乘法(情況下,可以采用普通最小二乘法(OLSOLS)估計參)估計參數。數。(1 1)零均值:)零均值:即隨機誤差項是一個期望值或平均值

6、即隨機誤差項是一個期望值或平均值為零的隨機變量。為零的隨機變量。 E(E( ii) ) =0 i=1,2, =0 i=1,2, 則,則,Y Yii的期望值或平均值為:的期望值或平均值為: E(YE(Yii)=)= 0 0+ + 1 1X X1i1i + + 2 2X X2i2i + + + k kX Xkiki i=1,2, i=1,2, 二、多元線性回歸模型的基本假定二、多元線性回歸模型的基本假定第10頁/共94頁2021-11-1711矩陣表達式為:矩陣表達式為:00.00)(.)()(.)(2121nnuEuEuEuuuEUE第11頁/共94頁2021-11-1712(2 2)同方差)同

7、方差 對于解釋變量對于解釋變量X X1 1,X X2 2,X Xk k的所有觀的所有觀測值,隨機誤差項具有相同方差測值,隨機誤差項具有相同方差。 Var(Var( ii)=E()=E( ii2 2) ) = = 2 2 i=1,2, i=1,2, 則,則,Y Yii與與 ii具有相同的方差:具有相同的方差: Var(Var(Y Yii)=)= 2 2 i=1,2, i=1,2, 第12頁/共94頁2021-11-1713(3 3)無序列相關)無序列相關 Cov(Cov( i, i, j j)=)=E(E( ii j j)=)=0 0 ij iij i,j=1,2, j=1,2, 則,則,Cov

8、(Cov(Y Yi, i,Y Yj j)=)=E(E( ii j j)=)=0 0第13頁/共94頁2021-11-1714假設(假設(2 2)和()和(3 3)矩陣表達式為:)矩陣表達式為:22222122212121212212221212121212111.00.0.00.0)(.)()(.)(.)()()(.)()(.,.,.)( )()()(nnnnnnnnnnnnnnnnuEuuEuuEuuEuEuuEuuEuuEuEuuuuuuuuuuuuuuuEuuuuuuEUUEUEUUEUEUVar方差方差- -協(xié)方差矩陣協(xié)方差矩陣第14頁/共94頁2021-11-1715(4 4)解釋變

9、量)解釋變量X X1 1,X X2 2,X Xk k是確定性變量,不是隨機變量;并且解釋變量是確定性變量,不是隨機變量;并且解釋變量與隨機誤差項之間不相關。即與隨機誤差項之間不相關。即: : Cov(X Cov(Xij ij , j j)=0)=0 i=1,2 , i=1,2 , , k; j = 1,2,1,2,n第15頁/共94頁2021-11-1716(5 5) I I服從正態(tài)分布服從正態(tài)分布 iiN(0, N(0, 2 2 ) i=1,2, ) i=1,2, ,n,n 則則Y YiiN(N( 0 0+ + 1 1X X1i1i+ + 2 2X X2i2i+ + k kX Xki ki,

10、 , 2 2) ) i=1,2, i=1,2, ,n ,n第16頁/共94頁第17頁/共94頁2021-11-1718對于:對于:kikiiiiiXXYYYe.110殘差為:殘差為:k,.,10問題是選擇 ,使得殘差平方和最小。kikiiiXXXY.22110ni,.,2 , 1ikikiiieXXXY.22110第18頁/共94頁2021-11-1719要使殘差平方和要使殘差平方和:2110210.),.,(kikiiikXXYeQ0.,0,010kQQQ為為最小最小,則應有:,則應有:第19頁/共94頁2021-11-17200)().(2.0)().(20) 1().(211011101

11、1100kikikiikikikiikikiiXXXYQXXXYQXXYQ即:即:第20頁/共94頁2021-11-1721ikikikikikiiiikikiiikikiYXXXXXYXXXXXYXXn21101121110110. 化簡整理后我們得到如下化簡整理后我們得到如下k+1k+1個方程(即個方程(即正規(guī)正規(guī)方程組方程組):):第21頁/共94頁2021-11-1722)(XXXY即即:=2112111.kiikikiikiiikiiXXXXXXXXXXnk.10ikiiinknkknYXYXYYYYXXXXXX. .1.111212111211按矩陣形式,上述方程組可表示為:按矩陣

12、形式,上述方程組可表示為:YXXX正規(guī)方程組正規(guī)方程組 YX第22頁/共94頁2021-11-1723的的OLSOLS估計量估計量則參數的最小二乘估計值為:則參數的最小二乘估計值為: YXXX1)(第23頁/共94頁2021-11-17241. 1.最小樣本容量:最小樣本容量:是指從最小二乘原理出發(fā),欲得到參數估計量,不管其質量如何,所要求的樣本容量的下限。n k+12. 2.滿足基本要求的樣本容量滿足基本要求的樣本容量 即樣本容量必須不少于模型中解釋變量的數目(包括常數項)。這就是最小樣本容量。 一般經驗認為,當n 30或者至少n 3(k+1)時,才能滿足模型估計的基本要求。 第24頁/共9

13、4頁第25頁/共94頁2021-11-1726一、線性性一、線性性證明:證明: 令令A=A=(X XX X)-1-1X X 由古典假定(由古典假定(4 4),),X X1 1,X X2 2,X Xk k是非隨機是非隨機變量,所以矩陣變量,所以矩陣A A是一個非隨機的(是一個非隨機的(k+1k+1)n n階常數矩陣。階常數矩陣。AYYXXX1)(則:則:第26頁/共94頁2021-11-1727UXXXUXXXXXXXUXXXXYXXX11111)()()()()()()( 因為二、無偏性二、無偏性)()()()(11UEXXXUXXXEE證明:證明:第27頁/共94頁2021-11-1728

14、這表明,OLS估計量 是無偏估計量。kkkEEEE.)(.)()(.101010即:即: 第28頁/共94頁2021-11-1729)(EVar 這是一個(K+1)(K+1)矩陣,其主對角線上元素即構成 Var( ), 非主對角線元素是相應的協(xié)方差, 如下所示:為求Var( ),我們考慮:三、最小方差性(有效性)三、最小方差性(有效性)第29頁/共94頁2021-11-1730)(.),(),(.),(.)(),(),(.),()(1011010100kkkkkVarCovCovCovVarCovCovCovVar下面推導此矩陣的計算公式。下面推導此矩陣的計算公式。kkkkE.11001100

15、第30頁/共94頁2021-11-1731由上一段的結果,我們有:UXXX1)( 11UUXXXEXXX11XXXUUXXXEUU11XXXXXXEE121XXXIXXXn211XXXXXX21XX因此:第31頁/共94頁2021-11-173221)() (XXCovVar 如前所述,我們得到的實際上不僅是 的方差,而且是一個方差-協(xié)方差矩陣,為了反映這一事實,我們用下面的符號表示之:211011010100)()(),(),(.),(.)(),(),(.),()(XXVarCovCovCovVarCovCovCovVarKKKKK展開就是:第32頁/共94頁2021-11-1733 記記

16、C=C=(X XX X)-1-1= =(C Cijij) 則:則:kiCXXVariiiii, 1 , 0)()(1, 121, 112kjijiCXXCovjijiji, 1 , 0,)(),(1, 121, 112(最小方差性的證明略)(最小方差性的證明略)第33頁/共94頁2021-11-1734 對于對于Y=XY=X+U+U 以及標準假設條件(以及標準假設條件(1 1)- -(5 5),普通最小二乘估計量是最佳線),普通最小二乘估計量是最佳線性無偏估計量(性無偏估計量(BLUEBLUE)高斯高斯- -馬爾科夫定理馬爾科夫定理第34頁/共94頁2021-11-1735與一元線性模型相似,

17、與一元線性模型相似, 2的無偏估計量是:的無偏估計量是:) 1() 1(222knYXYYkneSei 我們在估計我們在估計0 0, , 1 1 , , , k k的過程中,失去了(的過程中,失去了(K+1K+1)個自由)個自由度。度。四、四、 2 2的估計的估計第35頁/共94頁2021-11-1736例例2:2: 企業(yè)管理費取決于兩種重點產品的產量,企業(yè)管理費取決于兩種重點產品的產量,線性回歸模型是:線性回歸模型是:Y=Y= 0 0+ + 1 1X X1 1+ + 2 2X X2 2+u+u年年 管理費用管理費用 A產品產量產品產量 B產品產量產品產量1335211438564324554

18、6樣本數據為:樣本數據為:第36頁/共94頁2021-11-17375 . 25 . 185 . 115 . 485 . 47 .261097620129812581551525155641421651411531538131XXYXXXXY;解:第37頁/共94頁2021-11-1738eXXYYXXX2115 . 15 . 24:5 . 15 . 2410976205 . 25 . 185 . 115 . 485 . 47 .26)(所以回歸模型為第38頁/共94頁2021-11-17395811. 15 . 275. 1)()(0917. 2175. 1)()(8356. 67 .267

19、5. 1)()(75. 1355 .10610815 .10610976205 . 15 . 241332122111102XXSeXXSeXXSeknYXYYYX1082YY的估計如下:隨機擾動項的方差第39頁/共94頁第40頁/共94頁2021-11-1741對于一元線性回歸模型:對于一元線性回歸模型: Y=Y=0 0+1 1X+uX+u2221YYeRii其中,e ei i2 2 =殘差平方和我們有: :一、多元樣本決定系數一、多元樣本決定系數R R2 2第41頁/共94頁2021-11-1742對于多元線性模型:uXXYkk.110TSSESSTSSRSSRYYeRii112222或我

20、們可用同樣的方法定義決定系數:第42頁/共94頁2021-11-1743 二、總離差平方和的分解二、總離差平方和的分解2222)(YnYYYnYYYTSSii22)()(YnYXYXYYYnYYESSTSSRSSYXYYYYeESSiii)(22第43頁/共94頁2021-11-1744將上述結果代入R2的公式,得到:222YnYYYnYXTSSRSSR決定系數決定系數R R2 2 的矩陣形式的矩陣形式第44頁/共94頁 殘差平方和的一個特點是,每當模型增加一個解釋變量,并用改殘差平方和的一個特點是,每當模型增加一個解釋變量,并用改變后的模型重新進行估計,殘差平方和的值會減小。由此可以推論,變

21、后的模型重新進行估計,殘差平方和的值會減小。由此可以推論,決定系數是一個與解釋變量的個數有關的量:決定系數是一個與解釋變量的個數有關的量: 解釋變量個數增加解釋變量個數增加eei i2 2減小減小R R2 2增大增大 這就給人一個這就給人一個:要使得模型擬合得好,就必須增加解釋變量:要使得模型擬合得好,就必須增加解釋變量。但是,在樣本容量一定的情況下,增加解釋變量必定使得自由度減。但是,在樣本容量一定的情況下,增加解釋變量必定使得自由度減少。所以用以檢驗擬合優(yōu)度的統(tǒng)計量必須能夠防止這種傾向。于是,少。所以用以檢驗擬合優(yōu)度的統(tǒng)計量必須能夠防止這種傾向。于是,實際中應用的統(tǒng)計量是在對進行調整后的。

22、實際中應用的統(tǒng)計量是在對進行調整后的。 第45頁/共94頁2021-11-17462R2R2R二、修正決定系數:二、修正決定系數:定義修正決定系數 (Adjusted )如下:) 1() 1(12nTSSknESSRTSSknESSn) 1() 1(1)1(1112Rknn第46頁/共94頁2021-11-1747q1.1.當當n n較大,較大,k k較小時,兩者相差不大。較小時,兩者相差不大。 q2.2.當當n n不是很大,而不是很大,而k k又較大時,兩者差別較明顯;又較大時,兩者差別較明顯;q3.3.當樣本容量一定時:當樣本容量一定時: (1 1)當)當k1k1時,時, (2 2)僅當)

23、僅當k=0k=0時,等號成立。即時,等號成立。即 (3 3)當)當k k增大時,二者的差異也隨之增大。增大時,二者的差異也隨之增大。 (4 4) 可能出現負值(無意義,取值為可能出現負值(無意義,取值為0 0) (當(當R R2 2 k/FFF ,拒絕,拒絕H H0 0;否;否則不拒絕則不拒絕H H0 0。F F值越大,值越大,方程的總體線性方程的總體線性關系關系越顯著。越顯著。F檢驗的步驟第52頁/共94頁2021-11-1753步驟如下:步驟如下: 1.1.建立假設建立假設 原假設原假設 H H0 0:1 1 = = 2 2 = = =k k= = 0 0 備擇假設備擇假設 H H1 1:

24、 i i不全為不全為0 0(i=1i=1,2 2,k k) 顯然,當顯然,當H H0 0成立時,即表示模型中被解釋成立時,即表示模型中被解釋變量與解釋變量之間不存在顯著的線性關系;變量與解釋變量之間不存在顯著的線性關系;當當H H1 1成立時,即表示模型的線性關系成立。成立時,即表示模型的線性關系成立。 注意:注意:一元線性回歸中,一元線性回歸中, F F檢驗與檢驗與t t檢驗一致檢驗一致 第53頁/共94頁2021-11-17542.2.在在H H0 0成立的條件下,構造統(tǒng)計量成立的條件下,構造統(tǒng)計量)1,()1/(/knkFknESSkRSSF 直觀上看,回歸平方和直觀上看,回歸平方和RS

25、SRSS是解釋變量整體對被解是解釋變量整體對被解釋變量釋變量Y Y的線性作用的結果,如果的線性作用的結果,如果RSS/ESSRSS/ESS的比值較大,的比值較大,則解釋變量整體對則解釋變量整體對Y Y的解釋程度高,可以認為總體存在的解釋程度高,可以認為總體存在線性關系;反之,總體可能不存在線性關系。線性關系;反之,總體可能不存在線性關系。因此因此, ,可可以通過該比值的大小對總體線性關系進行推斷。以通過該比值的大小對總體線性關系進行推斷。第54頁/共94頁2021-11-1755 給定顯著性水平給定顯著性水平 ,查,查F F分布分布表,可得到臨表,可得到臨界值界值F F ( (k,n-k-k,

26、n-k-1)1),由樣本求出統(tǒng)計量,由樣本求出統(tǒng)計量F F的數值。的數值。 若若F F F F ( (k,n-k-k,n-k-1),1),則拒絕則拒絕H H0 0,即回歸方程,即回歸方程顯著成立;顯著成立; 若若F F F F ( (k,n-k-k,n-k-1), 1), 則接受則接受H H0 0,即回歸方程,即回歸方程不顯著。不顯著。3.3.計算,判斷計算,判斷第55頁/共94頁2021-11-17561-F(k,n-k-1)Ff(F)拒絕域拒絕域顯著水平顯著水平的單側的單側 F F檢驗拒絕域檢驗拒絕域第56頁/共94頁2021-11-1757例例4 4:在某模型中,在某模型中,k=2,n=

27、16,k=2,n=16,給定給定=0.01,=0.01,查得查得0.010.01(2,13)=6.702,13)=6.70,而,而=28682.516.70,=28682.516.70,所以該所以該線性模型在線性模型在0.990.99的置信水平下顯著成立。的置信水平下顯著成立。第57頁/共94頁2021-11-1758二、解釋變量的顯著性檢驗(二、解釋變量的顯著性檢驗(t t檢驗)檢驗) 方程的總體線性總體線性關系顯著 每個解釋變量每個解釋變量對被解釋變量的影響都是顯著的。 因此,必須對每個解釋變量進行顯著性檢驗,以決定是否作為解釋變量被保留在模型中。 這一檢驗是由對變量的這一檢驗是由對變量的

28、t t檢驗完成的。檢驗完成的。第58頁/共94頁2021-11-17591. .t統(tǒng)計量統(tǒng)計量 由于由于參數估計量的方差為:參數估計量的方差為: kiCXXVariiiii, 1 , 0)()(1, 121, 112),(1, 12 iiiiCN第59頁/共94頁2021-11-1760因此,可構造如下t統(tǒng)計量: ii2i1,1 (1)()iitt nkSC 其中 2為隨機誤差項的方差,在實際計算時,用它的估計量代替: : 1122knkneiee第60頁/共94頁2021-11-17612.t檢驗 建立原假設與備擇假設:建立原假設與備擇假設: H H1 1: i i 0 0 給定顯著性水平給

29、定顯著性水平 ,可得到臨界值,可得到臨界值t t /2/2( (n-k-n-k-1)1),由樣本求出統(tǒng)計量由樣本求出統(tǒng)計量t t的數值,通過:的數值,通過: |t|t| t t /2/2( (n-k-n-k-1) 1) 或或 |t|t| t t /2/2( (n-k-n-k-1)1)來拒絕或接受原假設來拒絕或接受原假設H H0 0,從而,從而判定對應的解釋變判定對應的解釋變量是否應包括在模型中。量是否應包括在模型中。 H H0 0: i i=0=0(i=1,2i=1,2k k)第61頁/共94頁2021-11-1762三、回歸系數的置信區(qū)間三、回歸系數的置信區(qū)間ii2i1,1 (1)()iit

30、t nkSC給定顯著性水平給定顯著性水平 ,可得到臨界值,可得到臨界值t t /2/2( (n-k-n-k-1)1),)1()1(22iiStStknikni置信區(qū)間:置信區(qū)間:第62頁/共94頁第63頁/共94頁2021-11-1764 與一元線性回歸模型的作法類似,預測指與一元線性回歸模型的作法類似,預測指的是對各自變量的某一組具體值的是對各自變量的某一組具體值來預測與之相對應的因變量值來預測與之相對應的因變量值Y Y0 0。當然,要進。當然,要進行預測,有一個假設前提應當滿足,即行預測,有一個假設前提應當滿足,即擬合的擬合的模型在預測期也成立模型在預測期也成立。 ).(020100kXX

31、XX第64頁/共94頁2021-11-1765點預測值由已給定的諸點預測值由已給定的諸X X值對應的回歸值給出,即值對應的回歸值給出,即: 一、點預測一、點預測020210100.kkXXXY第65頁/共94頁2021-11-1766預測誤差可定義為:預測誤差可定義為:000YYe二、區(qū)間預測二、區(qū)間預測1.1.單個值的預測區(qū)間單個值的預測區(qū)間)(1 )()(1 )var(0)(0102022220102000XXXXSeSXXXXeeEeee則。代替未知,故用其中正態(tài)分布可以證明,證明略證明略第66頁/共94頁2021-11-1767)(1,)(1010200102000XXXXtYXXXX

32、tYYY的預測區(qū)間:的置信度為則,第67頁/共94頁2021-11-17682.2.均值的預測區(qū)間均值的預測區(qū)間0102201020)()()var(XXXXSXXXXe則可以證明:)(,)()/()/(102010200000XXXXtYXXXXtYXYEXYE的預測區(qū)間:的置信度為與單個值預測的與單個值預測的區(qū)別區(qū)別證明略證明略第68頁/共94頁第69頁/共94頁2021-11-1770 經過研究,發(fā)現家庭書刊消費水平受家庭經過研究,發(fā)現家庭書刊消費水平受家庭收入及戶主受教育年限的影響。收入及戶主受教育年限的影響。 Y Y家庭書刊消費水平(元家庭書刊消費水平(元/ /月);月); X X1

33、 1家庭收入(元家庭收入(元/ /月);月); X X2 2戶主受教育年限(年)戶主受教育年限(年) 若經調查得到一家庭的收入水平為若經調查得到一家庭的收入水平為X X1 1=4000=4000, X X2 2=20=20,要求預測,要求預測Y Y0 0。iiiiXXY22110第70頁/共94頁2021-11-1771YX1X21 14501027.282 2507.71045.293 3613.91225.8124 4563.41312.295 5501.51316.476 6781.51442.4157 7541.8164198 8611.11768.8109 91222.11981.2

34、181010793.21998.6141111660.82196101212792.72105.4121313580.82147.481414612.72154101515890.82231.414161611212611.81817171094.23143.416181812533624.620第71頁/共94頁2021-11-1772例例4.1 4.1 :某地區(qū)通過一個樣本容量為某地區(qū)通過一個樣本容量為722722的調查數據得到勞動力受教育的調查數據得到勞動力受教育的一個回歸方程為的一個回歸方程為 R R2 2=0.214=0.214式中,式中,Y Y為勞動力受教育年數,為勞動力受教育年數

35、,X X1 1為該勞動力家庭中兄弟姐妹的個數,為該勞動力家庭中兄弟姐妹的個數,X X2 2與與X X3 3分分別為母親與父親受到教育的年數。別為母親與父親受到教育的年數。 (1 1)X X1 1是否具有預期的影響?為什么?若是否具有預期的影響?為什么?若X X2 2與與X X3 3保持不變,為了使預測的受保持不變,為了使預測的受教育水平減少一年,需要教育水平減少一年,需要X X1 1增加多少?增加多少? (2 2)請對)請對X X2 2的系數給予適當的解釋。的系數給予適當的解釋。 (3 3)如果兩個勞動力都沒有兄弟姐妹,但其中一個的父母受教育的年數為)如果兩個勞動力都沒有兄弟姐妹,但其中一個的

36、父母受教育的年數為1212年,另一個的父母受教育的年數為年,另一個的父母受教育的年數為1616年,則兩人受教育的年數預期相差多少?年,則兩人受教育的年數預期相差多少?321210. 0131. 0094. 036.10XXXY第72頁/共94頁 補充:補充: 虛擬變量虛擬變量Dummy Variable第73頁/共94頁2021-11-17741 1、定義、定義 許多經濟變量是許多經濟變量是可以定量度量可以定量度量的。但也有一些的。但也有一些影響經濟變量的因素影響經濟變量的因素無法定量度量無法定量度量。 為了在模型中能夠反映這些因素的影響,并提為了在模型中能夠反映這些因素的影響,并提高模型的精

37、度,需要將它們高模型的精度,需要將它們“量化量化”。這種。這種“量化量化”通常是通過引入通常是通過引入“虛擬變量虛擬變量”來完成來完成的。的。 根據這些因素的屬性類型,構造只取根據這些因素的屬性類型,構造只取“0 0”或或“1 1”的 人 工 變 量 , 通 常 稱 為的 人 工 變 量 , 通 常 稱 為 虛 擬 變 量虛 擬 變 量 ( d u m m y d u m m y variablevariable),記為,記為D D。一、虛擬變量的概念及作用一、虛擬變量的概念及作用第74頁/共94頁2021-11-1775性別D1男性0女性城市與農村D1城市0農村例: 0 非本科學歷非本科學歷

38、 D= 1 本科學歷本科學歷 一般地,在虛擬變量的設置中:一般地,在虛擬變量的設置中: 基礎類型、否定類型取值為基礎類型、否定類型取值為0 0; 比較類型,肯定類型取值為比較類型,肯定類型取值為1 1。學歷第75頁/共94頁2021-11-17762 2、模型中引入虛擬變量的作用、模型中引入虛擬變量的作用(1 1)可以描述和測量定性因素的的影響。)可以描述和測量定性因素的的影響。(2 2)能夠正確反映經濟變量之間的相互關系,提高模型的精度。)能夠正確反映經濟變量之間的相互關系,提高模型的精度。 (相當于相當于將不同屬性的樣本合并,擴大了樣本容量將不同屬性的樣本合并,擴大了樣本容量)。 (3 3

39、)便于處理異常數據。)便于處理異常數據。第76頁/共94頁2021-11-1777二、虛擬變量的設置二、虛擬變量的設置1 1、虛擬變量的設置原則、虛擬變量的設置原則 (1 1)一個因素多個屬性)一個因素多個屬性 如果某定性因素有如果某定性因素有 m m 種互斥的屬性類種互斥的屬性類型,在模型中引入型,在模型中引入 m-1m-1 個虛擬變量。個虛擬變量。 如果不如此,如果不如此,m m個狀態(tài)引入個狀態(tài)引入m m個虛擬變個虛擬變量來表示,虛擬變量間會造成量來表示,虛擬變量間會造成完全多重共線完全多重共線性性。第77頁/共94頁011tD其他春季012tD其他夏季013tD其他秋季例1 1:性別有性

40、別有2 2個互斥的屬性,引用個互斥的屬性,引用2-1=12-1=1個虛擬個虛擬變量;變量;例2 2:文化程度分小學、初中、高中、大學、研文化程度分小學、初中、高中、大學、研究生究生5 5類,引用類,引用4 4個虛擬變量。個虛擬變量。例3 3:已知冷飲的已知冷飲的銷售量銷售量Y Y除受除受k k種定量變量種定量變量X Xk k的的影響外,還受影響外,還受春、夏、秋、冬四季春、夏、秋、冬四季變化的影響,變化的影響,要考察該四季的影響,只需引入要考察該四季的影響,只需引入三個虛擬變量三個虛擬變量即即可:可:第78頁/共94頁2021-11-1779則冷飲銷售量的模型為:則冷飲銷售量的模型為:在上述模

41、型中,若再引入第四個虛擬變量:在上述模型中,若再引入第四個虛擬變量:ttttktkttDDDXXY332211110014tD其他冬季則冷飲銷售模型變量為:則冷飲銷售模型變量為:tttttktkttDDDDXXY44332211110完全多重共線性完全多重共線性第79頁/共94頁2021-11-1780(2 2)多個因素多個屬性)多個因素多個屬性 K個定性變量,每個變量有mi個屬性類型(i=1,2,k) 虛擬變量個數為:kiim1) 1((3 3)虛擬變量在模型中,可以作解釋變量,也可)虛擬變量在模型中,可以作解釋變量,也可以作因變量。以作因變量。第80頁/共94頁2021-11-17812

42、2、虛擬變量的引入方式、虛擬變量的引入方式 虛擬變量作為解釋變量引入模型有兩種基本方式:加法方式加法方式和乘法方式乘法方式。第81頁/共94頁2021-11-1782例:例:研究女性在工作中是否受到歧視,設研究女性在工作中是否受到歧視,設Y Y表表示年薪,示年薪,X X表示工作年限,建立如下虛擬變量表示工作年限,建立如下虛擬變量模型:模型:uDXY210 0 女性女性 D= 1 男性男性 其中:(1 1)加法方式)加法方式作用:改變截距水平。 第82頁/共94頁2021-11-1783 Y 男性 女性 0+2 0 X 對估計結果應用t檢驗:若若2 2顯著異于顯著異于0 0,則說明存在性別歧視;

43、,則說明存在性別歧視;若若2 2不顯著異于不顯著異于0 0,則說明不存在性別歧視;,則說明不存在性別歧視;第83頁/共94頁2021-11-1784(2 2)乘法方式)乘法方式 用虛擬解釋變量與其他解釋變量相乘作為新的解釋變量,以達到調整模型斜率系數的目的。 例例:不同的家庭結構,家庭消費支出的MPC可能會發(fā)生變化。ttttotuXDaXbbY)(11有適齡子女0無適齡子女其中,D D第84頁/共94頁2021-11-1785Y 有適齡子女 無適齡子女 b0 X ttottotuXbbuXabbY11)(上式相當于下列兩式:a a是否顯著可以表明斜率在不同家庭結構下是否變化。第85頁/共94頁

44、2021-11-1786(3 3)一般方式(混合方式)一般方式(混合方式) 當截距與斜率發(fā)生變化時,則需要同時引入當截距與斜率發(fā)生變化時,則需要同時引入加法與乘法加法與乘法形式的虛擬變量。形式的虛擬變量。第86頁/共94頁2021-11-1787此式等價于下列兩式:此式等價于下列兩式:ttttttuXYuXY)()(112010男性:女性:例:例:如果男性與女性就業(yè)者的初始年薪和年薪增如果男性與女性就業(yè)者的初始年薪和年薪增加速度都有差異,則可以將加速度都有差異,則可以將加法模型加法模型和和乘法模型乘法模型結合起來。結合起來。ttttttuDXDXY2110D1男性0女性第87頁/共94頁202

45、1-11-1788(4 4)分段線性回歸)分段線性回歸 在經濟發(fā)生轉折時期,可通過建立臨界指標的虛擬變量模型來反映。 例如:進口消費品數量Y主要取決于國民收入X的多少,中國在改革開放前后,Y對X的回歸關系明顯不同。 這時,可以t*=1979年為轉折期,以1979年的國民收入Xt*為臨界值,設如下虛擬變量:01tD*tttt則進口消費品的回歸模型可建立如下:ttttttDXXXY)(*210第88頁/共94頁2021-11-1789OLS法得到該模型的回歸方程為:則兩時期進口消費品函數分別為:則兩時期進口消費品函數分別為:tttttDXXXY)(*210當tt*=1979年,ttXY10當t t*=1979年,t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論