版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第四章第四章 多元線性回歸模型多元線性回歸模型2021-11-122內(nèi)容提要內(nèi)容提要第一節(jié)第一節(jié) 多元線性回歸多元線性回歸模型的建立及假定條件模型的建立及假定條件第二節(jié)第二節(jié) 最小二乘法最小二乘法第三節(jié)第三節(jié) 最小二乘估計(jì)量的特性最小二乘估計(jì)量的特性第四節(jié)第四節(jié) 可決系數(shù)可決系數(shù)第五節(jié)第五節(jié) 顯著性檢驗(yàn)與置信區(qū)間顯著性檢驗(yàn)與置信區(qū)間第六節(jié)第六節(jié) 預(yù)測(cè)預(yù)測(cè)第七節(jié)第七節(jié) 案例分析案例分析2021-11-124 假設(shè)被解釋變量假設(shè)被解釋變量y y是解釋變量是解釋變量x x1 1,x x2 2,x xk k和和隨機(jī)誤差項(xiàng)隨機(jī)誤差項(xiàng)u u的線性函數(shù),表達(dá)式為:的線性函數(shù),表達(dá)式為:u.22110kkxx
2、xy總體回歸模型總體回歸模型kkxxxye.)(22110總體回歸線(方程)總體回歸線(方程)一、基本概念一、基本概念2021-11-125 u210pxy)114. 0()003. 0()6 . 9(99. 0739. 0112. 07 .1162rpxy例例1 1: 其中其中:y=:y=在食品上的總支出在食品上的總支出; ; x= x=個(gè)人可支配收入個(gè)人可支配收入; ; p= p=食品價(jià)格指數(shù)食品價(jià)格指數(shù); ; 用美國(guó)用美國(guó)1959-19831959-1983年的數(shù)據(jù)(單位:年的數(shù)據(jù)(單位:1010億美元),億美元),得到如下回歸結(jié)果(括號(hào)中數(shù)字為標(biāo)準(zhǔn)誤差):得到如下回歸結(jié)果(括號(hào)中數(shù)字為
3、標(biāo)準(zhǔn)誤差):2021-11-126上例中斜率系數(shù)的含義說(shuō)明如下:上例中斜率系數(shù)的含義說(shuō)明如下: 價(jià)格不變的情況下,個(gè)人可支配收入每上升價(jià)格不變的情況下,個(gè)人可支配收入每上升1010億億美元(美元(1 1個(gè)個(gè)billionbillion),食品消費(fèi)支出平均增加),食品消費(fèi)支出平均增加1.121.12億億元(元(0.1120.112個(gè)個(gè) billionbillion)。)。 收入不變的情況下,價(jià)格指數(shù)每上升一個(gè)點(diǎn),食收入不變的情況下,價(jià)格指數(shù)每上升一個(gè)點(diǎn),食品消費(fèi)支出平均減少品消費(fèi)支出平均減少7.397.39億元(億元(0.7390.739個(gè)個(gè)billionbillion)多元線性回歸模型中斜率系
4、數(shù)的含義多元線性回歸模型中斜率系數(shù)的含義2021-11-127 設(shè)(設(shè)( x x1i1i,x x2i2i,x xkiki;y yi i),),i=1i=1,2 2,n n是對(duì)總體是對(duì)總體( x x1 1,x x2 2,x xk k;y y)的)的n n次獨(dú)立樣次獨(dú)立樣本觀測(cè)值,則:本觀測(cè)值,則:nixxxyikikiii, 2 , 1u.221102021-11-128nknknnnkkkkuxxxyuxxxyuxxxy.2211022222121021121211101對(duì)于對(duì)于n n組觀測(cè)值,即:組觀測(cè)值,即:2021-11-129其矩陣形式為:其矩陣形式為:uxy121.nnyyyy) 1
5、(1212111.1.1.1knknnkkxxxxxxx1211) 1(10.nnkkuuuu其中:其中:2021-11-1210設(shè)樣本(設(shè)樣本(x x1i1i,x x2i2i,x xkiki;y yi i),),i=1i=1,2 2,n n),(),估計(jì)(k10k10.的估計(jì)值。殘差項(xiàng),擬合誤差,是的估計(jì)值或估計(jì)量;ik10k10i22110,.,.,.ikikiiieexxxy樣本回歸模型樣本回歸模型2021-11-1211kikiiixxxy.22110樣本回歸線(方程)樣本回歸線(方程)其矩陣形式為:其矩陣形式為:xy 其中其中: :121.nnyyyy1) 1(10.kk2021-1
6、1-1212 多元線性回歸模型在滿足下列基本假設(shè)的情況多元線性回歸模型在滿足下列基本假設(shè)的情況下,可以采用普通最小二乘法(下,可以采用普通最小二乘法(olsols)估計(jì)參數(shù)。)估計(jì)參數(shù)。(1 1)零均值:)零均值:即隨機(jī)誤差項(xiàng)是一個(gè)期望值或平即隨機(jī)誤差項(xiàng)是一個(gè)期望值或平均值為零的隨機(jī)變量。均值為零的隨機(jī)變量。 e(e( ii) ) =0 i=1,2, =0 i=1,2, 則,則,y yii的期望值或平均值為:的期望值或平均值為: e(ye(yi i)=)= 0 0+ + 1 1x x1i 1i + + 2 2x x2i 2i + + + k kx xki ki i=1,2, i=1,2, 二、
7、多元線性回歸模型的基本假定二、多元線性回歸模型的基本假定2021-11-1213矩陣表達(dá)式為:矩陣表達(dá)式為:00.00)(.)()(.)(2121nnueueueuuueue2021-11-1214(2 2)同方差)同方差 對(duì)于解釋變量對(duì)于解釋變量x x1 1,x x2 2,x xk k的所有觀測(cè)的所有觀測(cè)值,隨機(jī)誤差項(xiàng)具有相同方差值,隨機(jī)誤差項(xiàng)具有相同方差。 varvar( ( ii)=e()=e( ii2 2) ) = = 2 2 i=1,2, i=1,2, 則,則,y yii與與 ii具有相同的方差:具有相同的方差: varvar( (y yii)=)= 2 2 i=1,2, i=1,2
8、, 2021-11-1215(3 3)無(wú)序列相關(guān))無(wú)序列相關(guān) covcov( ( i, i, j j)=)=e(e( ii j j)=)=0 0 ij iij i,j=1,2, j=1,2, 則,則,covcov( (y yi, i,y yj j)=)=e(e( ii j j)=)=0 02021-11-1216假設(shè)(假設(shè)(2 2)和()和(3 3)矩陣表達(dá)式為:)矩陣表達(dá)式為:22222122212121212212221212121212111.00.0.00.0)(.)()(.)(.)()()(.)()(.,.,.)( )()()(nnnnnnnnnnnnnnnnueuueuueuueu
9、euueuueuueueuuuuuuuuuuuuuuueuuuuuueuueueuueueuvar方差方差- -協(xié)方差矩陣協(xié)方差矩陣2021-11-1217(4 4)解釋變量)解釋變量x x1 1,x x2 2,x xk k是確定性變是確定性變量,不是隨機(jī)變量;并且解釋變量與隨量,不是隨機(jī)變量;并且解釋變量與隨機(jī)誤差項(xiàng)之間不相關(guān)。機(jī)誤差項(xiàng)之間不相關(guān)。即即: : cov(x cov(xij ij , j j)=0)=0 i=1,2, i=1,2,k; j= 1,2,1,2,n2021-11-1218(5 5) i i服從正態(tài)分布服從正態(tài)分布 iin(0, n(0, 2 2 ) i=1,2, )
10、i=1,2, ,n,n 則則y yiin(n( 0 0+ + 1 1x x1i 1i+ + 2 2x x2i 2i+ + k kx xki ki, , 2 2) ) i=1,2, i=1,2, ,n ,n2021-11-1220對(duì)于:對(duì)于:kikiiiiixxyyye.110殘差為:殘差為:k,.,10問(wèn)題是選擇問(wèn)題是選擇 ,使得殘差平方和最小。,使得殘差平方和最小。kikiiixxxy.22110ni,.,2 , 1ikikiiiexxxy.221102021-11-1221要使殘差平方和要使殘差平方和:2110210.),.,(kikiiikxxyeq0.,0,010kqqq為為最小最小,
11、則應(yīng)有:,則應(yīng)有:2021-11-12220)().(2.0)().(20) 1().(2110111011100kikikiikikikiikikiixxxyqxxxyqxxyq即:即:2021-11-1223ikikikikikiiiikikiiikikiyxxxxxyxxxxxyxxn21101121110110. 化簡(jiǎn)整理后我們得到如下化簡(jiǎn)整理后我們得到如下k+1k+1個(gè)方程(即個(gè)方程(即正規(guī)正規(guī)方程組方程組):):2021-11-1224)(xxxy即即:=2112111.kiikikiikiiikiixxxxxxxxxxnk.10ikiiinknkknyxyxyyyyxxxxxx.
12、 .1.111212111211按矩陣形式,上述方程組可表示為:按矩陣形式,上述方程組可表示為:yxxx正規(guī)方程組正規(guī)方程組 yx2021-11-1225的的olsols估計(jì)量估計(jì)量則參數(shù)的最小二乘估計(jì)值為:則參數(shù)的最小二乘估計(jì)值為: yxxx1)(2021-11-12261. 1.最小樣本容量:最小樣本容量:是指從最小二乘原理出發(fā),欲得是指從最小二乘原理出發(fā),欲得到參數(shù)估計(jì)量,不管其質(zhì)量如何,所要求的樣本容量的下到參數(shù)估計(jì)量,不管其質(zhì)量如何,所要求的樣本容量的下限。限。n k+12. 2.滿足基本要求的樣本容量滿足基本要求的樣本容量 即樣本容量必須不少于模型中解釋變量的數(shù)即樣本容量必須不少于
13、模型中解釋變量的數(shù)目(包括常數(shù)項(xiàng))。這就是最小樣本容量。目(包括常數(shù)項(xiàng))。這就是最小樣本容量。 一般經(jīng)驗(yàn)認(rèn)為,當(dāng)一般經(jīng)驗(yàn)認(rèn)為,當(dāng)n 30或者至少或者至少n 3(k+1)時(shí),才能滿足模型估計(jì)的基本要求。時(shí),才能滿足模型估計(jì)的基本要求。 2021-11-1228一、線性性一、線性性證明:證明: 令令a=a=(x xx x)-1-1x x 由古典假定(由古典假定(4 4),),x x1 1,x x2 2,x xk k是非隨機(jī)變是非隨機(jī)變量,所以矩陣量,所以矩陣a a是一個(gè)非隨機(jī)的(是一個(gè)非隨機(jī)的(k+1k+1)n n階階常數(shù)矩陣。常數(shù)矩陣。ayyxxx1)(則:則:2021-11-1229uxxxu
14、xxxxxxxuxxxxyxxx11111)()()()()()()( 因?yàn)槎?、無(wú)偏性二、無(wú)偏性)()()()(11uexxxuxxxee證明:證明:2021-11-1230 這表明,這表明,ols估計(jì)量估計(jì)量 是無(wú)偏估計(jì)量。是無(wú)偏估計(jì)量。kkkeeee.)(.)()(.101010即:即: 2021-11-1231)(evar 這是一個(gè)(這是一個(gè)(k+1)(k+1)矩陣,其主對(duì)角線上元素矩陣,其主對(duì)角線上元素即構(gòu)成即構(gòu)成 var( ), 非主對(duì)角線元素是相應(yīng)的協(xié)方差非主對(duì)角線元素是相應(yīng)的協(xié)方差, 如下如下所示所示:為求為求var( ),我們考慮:我們考慮:三、最小方差性(有效性三、最小方差性
15、(有效性)2021-11-1232)(.),(),(.),(.)(),(),(.),()(1011010100kkkkkvarcovcovcovvarcovcovcovvar下面推導(dǎo)此矩陣的計(jì)算公式。下面推導(dǎo)此矩陣的計(jì)算公式。kkkke.110011002021-11-1233由上一段的結(jié)果,我們有:由上一段的結(jié)果,我們有:uxxx1)( 11uuxxxexxx11xxxuuxxxeuu11xxxxxxee121xxxixxxn211xxxxxx21xx因此:因此:2021-11-123421)() (xxcovvar 如前所述,我們得到的實(shí)際上不僅是如前所述,我們得到的實(shí)際上不僅是 的方差,
16、的方差,而且是一個(gè)方差而且是一個(gè)方差-協(xié)方差矩陣,為了反映這一事實(shí),我協(xié)方差矩陣,為了反映這一事實(shí),我們用下面的符號(hào)表示之:們用下面的符號(hào)表示之:211011010100)()(),(),(.),(.)(),(),(.),()(xxvarcovcovcovvarcovcovcovvarkkkkk展開(kāi)就是:展開(kāi)就是:2021-11-1235 記記 c=c=(x xx x)-1-1= =(c cijij) 則:則:kicxxvariiiii, 1 , 0)()(1, 121, 112kjijicxxcovjijiji, 1 , 0,)(),(1, 121, 112(最小方差性的證明略)(最小方差性
17、的證明略)2021-11-1236 對(duì)于對(duì)于y=xy=x+u+u 以及標(biāo)準(zhǔn)假設(shè)條件(以及標(biāo)準(zhǔn)假設(shè)條件(1 1)- -(5 5),普通最小二乘估計(jì)量是最佳線),普通最小二乘估計(jì)量是最佳線性無(wú)偏估計(jì)量(性無(wú)偏估計(jì)量(blueblue)高斯高斯- -馬爾科夫定理馬爾科夫定理2021-11-1237與一元線性模型相似,與一元線性模型相似, 2的無(wú)偏估計(jì)量是:的無(wú)偏估計(jì)量是:) 1() 1(222knyxyyknesei 我們?cè)诠烙?jì)我們?cè)诠烙?jì)0 0, , 1 1 , , , k k的過(guò)程中,失去了的過(guò)程中,失去了(k+1k+1)個(gè)自由度。)個(gè)自由度。四、四、 2 2的估計(jì)的估計(jì)2021-11-1238例
18、例2: 2: 企業(yè)管理費(fèi)取決于兩種重點(diǎn)產(chǎn)品的產(chǎn)量,線性企業(yè)管理費(fèi)取決于兩種重點(diǎn)產(chǎn)品的產(chǎn)量,線性回歸模型是:回歸模型是:y=y= 0 0+ + 1 1x x1 1+ + 2 2x x2 2+u+u年年 管理費(fèi)用管理費(fèi)用 a產(chǎn)品產(chǎn)量產(chǎn)品產(chǎn)量 b產(chǎn)品產(chǎn)量產(chǎn)品產(chǎn)量13352114385643245546樣本數(shù)據(jù)為:樣本數(shù)據(jù)為:2021-11-12395 . 25 . 185 . 115 . 485 . 47 .261097620129812581551525155641421651411531538131xxyxxxxy;解:2021-11-1240exxyyxxx2115 . 15 . 24:5 .
19、 15 . 2410976205 . 25 . 185 . 115 . 485 . 47 .26)(所以回歸模型為2021-11-12415811. 15 . 275. 1)()(0917. 2175. 1)()(8356. 67 .2675. 1)()(75. 1355 .10610815 .10610976205 . 15 . 241332122111102xxsexxsexxseknyxyyyx1082yy的估計(jì)如下:隨機(jī)擾動(dòng)項(xiàng)的方差2021-11-1243對(duì)于一元線性回歸模型:對(duì)于一元線性回歸模型: y=y=0 0+1 1x+ux+u2221yyerii其中,其中,e ei i2 2
20、=殘差平方和殘差平方和我們有我們有: :一、多元樣本決定系數(shù)一、多元樣本決定系數(shù)r r2 22021-11-1244對(duì)于多元線性模型:對(duì)于多元線性模型:uxxykk.110tssesstssrssryyerii112222或我們可用同樣的方法定義決定系數(shù):我們可用同樣的方法定義決定系數(shù):2021-11-1245 二、總離差平方和的分解二、總離差平方和的分解2222)(ynyyynyyytssii22)()(ynyxyxyyynyyesstssrssyxyyyyeessiii)(222021-11-1246將上述結(jié)果代入將上述結(jié)果代入r2的公式,得到:的公式,得到:222ynyyynyxtssr
21、ssr決定系數(shù)決定系數(shù)r r2 2 的矩陣形式的矩陣形式 殘差平方和的一個(gè)特點(diǎn)是,每當(dāng)模型增加一個(gè)殘差平方和的一個(gè)特點(diǎn)是,每當(dāng)模型增加一個(gè)解釋變量,并用改變后的模型重新進(jìn)行估計(jì),殘差解釋變量,并用改變后的模型重新進(jìn)行估計(jì),殘差平方和的值會(huì)減小。由此可以推論,決定系數(shù)是一平方和的值會(huì)減小。由此可以推論,決定系數(shù)是一個(gè)與解釋變量的個(gè)數(shù)有關(guān)的量:個(gè)與解釋變量的個(gè)數(shù)有關(guān)的量: 解釋變量個(gè)數(shù)增加解釋變量個(gè)數(shù)增加eei i2 2減小減小r r2 2增大增大 這就給人一個(gè)這就給人一個(gè):要使得模型擬合得好,就:要使得模型擬合得好,就必須增加解釋變量。但是,在樣本容量一定的情況必須增加解釋變量。但是,在樣本容量
22、一定的情況下,增加解釋變量必定使得自由度減少。所以用以下,增加解釋變量必定使得自由度減少。所以用以檢驗(yàn)擬合優(yōu)度的統(tǒng)計(jì)量必須能夠防止這種傾向。于檢驗(yàn)擬合優(yōu)度的統(tǒng)計(jì)量必須能夠防止這種傾向。于是,實(shí)際中應(yīng)用的統(tǒng)計(jì)量是在對(duì)進(jìn)行調(diào)整后的。是,實(shí)際中應(yīng)用的統(tǒng)計(jì)量是在對(duì)進(jìn)行調(diào)整后的。 2021-11-12482r2r2r二、修正決定系數(shù):二、修正決定系數(shù):定義修正決定系數(shù)定義修正決定系數(shù) (adjusted )如下:)如下:) 1() 1(12ntssknessrtssknessn) 1() 1(1)1(1112rknn2021-11-1249q1.1.當(dāng)當(dāng)n n較大,較大,k k較小時(shí),兩者相差不大。較小
23、時(shí),兩者相差不大。 q2.2.當(dāng)當(dāng)n n不是很大,而不是很大,而k k又較大時(shí),兩者差別較明顯;又較大時(shí),兩者差別較明顯;q3.3.當(dāng)樣本容量一定時(shí):當(dāng)樣本容量一定時(shí): (1 1)當(dāng))當(dāng)k1k1時(shí),時(shí), (2 2)僅當(dāng))僅當(dāng)k=0k=0時(shí),等號(hào)成立。即時(shí),等號(hào)成立。即 (3 3)當(dāng))當(dāng)k k增大時(shí),二者的差異也隨之增大。增大時(shí),二者的差異也隨之增大。 (4 4) 可能出現(xiàn)負(fù)值(無(wú)意義,取值為可能出現(xiàn)負(fù)值(無(wú)意義,取值為0 0) (當(dāng)當(dāng)r r2 2 k/fff ,拒絕,拒絕h h0 0;否;否則不拒絕則不拒絕h h0 0。f f值越大,值越大,方程的總體線性方程的總體線性關(guān)系關(guān)系越顯著。越顯著。
24、f檢驗(yàn)的步驟2021-11-1255步驟如下:步驟如下: 1.1.建立假設(shè)建立假設(shè) 原假設(shè)原假設(shè) h h0 0:1 1 = = 2 2 = = =k k= = 0 0 備擇假設(shè)備擇假設(shè) h h1 1: i i不全為不全為0 0(i=1i=1,2 2,k k) 顯然,當(dāng)顯然,當(dāng)h h0 0成立時(shí),即表示模型中被解釋成立時(shí),即表示模型中被解釋變量與解釋變量之間不存在顯著的線性關(guān)系;變量與解釋變量之間不存在顯著的線性關(guān)系;當(dāng)當(dāng)h h1 1成立時(shí),即表示模型的線性關(guān)系成立。成立時(shí),即表示模型的線性關(guān)系成立。 注意:注意:一元線性回歸中,一元線性回歸中, f f檢驗(yàn)與檢驗(yàn)與t t檢驗(yàn)一致檢驗(yàn)一致 202
25、1-11-12562.2.在在h h0 0成立的條件下,構(gòu)造統(tǒng)計(jì)量成立的條件下,構(gòu)造統(tǒng)計(jì)量)1,()1/(/knkfknesskrssf 直觀上看,回歸平方和直觀上看,回歸平方和rssrss是解釋變量整體對(duì)被解是解釋變量整體對(duì)被解釋變量釋變量y y的線性作用的結(jié)果,如果的線性作用的結(jié)果,如果rss/essrss/ess的比值較大,的比值較大,則解釋變量整體對(duì)則解釋變量整體對(duì)y y的解釋程度高,可以認(rèn)為總體存在的解釋程度高,可以認(rèn)為總體存在線性關(guān)系;反之,總體可能不存在線性關(guān)系。線性關(guān)系;反之,總體可能不存在線性關(guān)系。因此因此, ,可可以通過(guò)該比值的大小對(duì)總體線性關(guān)系進(jìn)行推斷。以通過(guò)該比值的大小
26、對(duì)總體線性關(guān)系進(jìn)行推斷。2021-11-1257 給定顯著性水平給定顯著性水平 ,查,查f f分布分布表,可得到臨表,可得到臨界值界值f f ( (k,n-k-k,n-k-1)1),由樣本求出統(tǒng)計(jì)量,由樣本求出統(tǒng)計(jì)量f f的數(shù)值。的數(shù)值。 若若f f f f ( (k,n-k-k,n-k-1),1),則拒絕則拒絕h h0 0,即回歸方程,即回歸方程顯著成立;顯著成立; 若若f f f f ( (k,n-k-k,n-k-1), 1), 則接受則接受h h0 0,即回歸方程,即回歸方程不顯著。不顯著。3.3.計(jì)算,判斷計(jì)算,判斷2021-11-12581-f(k,n-k-1)ff(f)拒絕域拒絕域
27、顯著水平顯著水平的單側(cè)的單側(cè) f f檢驗(yàn)拒絕域檢驗(yàn)拒絕域2021-11-1259例例4 4:在某模型中,在某模型中,k=2,n=16,k=2,n=16,給定給定=0.01,=0.01,查得查得0.010.01(2,13)=6.702,13)=6.70,而,而=28682.516.70,=28682.516.70,所以該所以該線性模型在線性模型在0.990.99的置信水平下顯著成立。的置信水平下顯著成立。2021-11-1260二、解釋變量的顯著性檢驗(yàn)(二、解釋變量的顯著性檢驗(yàn)(t t檢驗(yàn))檢驗(yàn)) 方程的方程的總體線性總體線性關(guān)系顯著關(guān)系顯著 每個(gè)解釋變量每個(gè)解釋變量對(duì)對(duì)被解釋變量的影響都是顯著
28、的。被解釋變量的影響都是顯著的。 因此,必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn),因此,必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn),以決定是否作為解釋變量被保留在模型中。以決定是否作為解釋變量被保留在模型中。 這一檢驗(yàn)是由對(duì)變量的這一檢驗(yàn)是由對(duì)變量的t t檢驗(yàn)完成的。檢驗(yàn)完成的。2021-11-12611. .t統(tǒng)計(jì)量統(tǒng)計(jì)量 由于由于參數(shù)估計(jì)量的方差為:參數(shù)估計(jì)量的方差為: kicxxvariiiii, 1 , 0)()(1, 121, 112),(1, 12 iiiicn2021-11-1262因此,可構(gòu)造如下因此,可構(gòu)造如下t統(tǒng)計(jì)量:統(tǒng)計(jì)量: ii2i1,1 (1)()iitt n ksc 其中其中 2為隨
29、機(jī)誤差項(xiàng)的方差,在實(shí)際計(jì)為隨機(jī)誤差項(xiàng)的方差,在實(shí)際計(jì)算時(shí),用它的估計(jì)量代替算時(shí),用它的估計(jì)量代替: : 1122knkneiee2021-11-12632.t檢驗(yàn)檢驗(yàn) 建立原假設(shè)與備擇假設(shè):建立原假設(shè)與備擇假設(shè): h h1 1: i i 0 0 給定顯著性水平給定顯著性水平 ,可得到臨界值,可得到臨界值t t /2/2( (n-k-n-k-1)1),由樣本求出統(tǒng)計(jì)量由樣本求出統(tǒng)計(jì)量t t的數(shù)值,通過(guò):的數(shù)值,通過(guò): |t|t| t t /2/2( (n-k-n-k-1) 1) 或或 |t|t| t t /2/2( (n-k-n-k-1)1)來(lái)拒絕或接受原假設(shè)來(lái)拒絕或接受原假設(shè)h h0 0,從而
30、,從而判定對(duì)應(yīng)的解釋變判定對(duì)應(yīng)的解釋變量是否應(yīng)包括在模型中。量是否應(yīng)包括在模型中。 h h0 0: i i=0=0(i=1,2i=1,2k k)2021-11-1264三、回歸系數(shù)的置信區(qū)間三、回歸系數(shù)的置信區(qū)間ii2i1,1 (1)()iitt n ksc 給定顯著性水平給定顯著性水平 ,可得到臨界值,可得到臨界值t t /2/2( (n-k-n-k-1)1),)1()1(22iiststknikni置信區(qū)間:置信區(qū)間:2021-11-1266 與一元線性回歸模型的作法類似,預(yù)測(cè)指與一元線性回歸模型的作法類似,預(yù)測(cè)指的是對(duì)各自變量的某一組具體值的是對(duì)各自變量的某一組具體值來(lái)預(yù)測(cè)與之相對(duì)應(yīng)的因
31、變量值來(lái)預(yù)測(cè)與之相對(duì)應(yīng)的因變量值y y0 0。當(dāng)然,要進(jìn)。當(dāng)然,要進(jìn)行預(yù)測(cè),有一個(gè)假設(shè)前提應(yīng)當(dāng)滿足,即行預(yù)測(cè),有一個(gè)假設(shè)前提應(yīng)當(dāng)滿足,即擬合的擬合的模型在預(yù)測(cè)期也成立模型在預(yù)測(cè)期也成立。 ).(020100kxxxx2021-11-1267點(diǎn)預(yù)測(cè)值由已給定的諸點(diǎn)預(yù)測(cè)值由已給定的諸x x值對(duì)應(yīng)的回歸值給出,即:值對(duì)應(yīng)的回歸值給出,即: 一、點(diǎn)預(yù)測(cè)一、點(diǎn)預(yù)測(cè)020210100.kkxxxy2021-11-1268預(yù)測(cè)誤差可定義為:預(yù)測(cè)誤差可定義為:000yye二、區(qū)間預(yù)測(cè)二、區(qū)間預(yù)測(cè)1.1.單個(gè)值的預(yù)測(cè)區(qū)間單個(gè)值的預(yù)測(cè)區(qū)間)(1 )()(1 )var(0)(0102022220102000xxxx
32、sesxxxxeeeeee則。代替未知,故用其中正態(tài)分布可以證明,證明略證明略2021-11-1269)(1,)(1010200102000xxxxtyxxxxtyyy的預(yù)測(cè)區(qū)間:的置信度為則,2021-11-12702.2.均值的預(yù)測(cè)區(qū)間均值的預(yù)測(cè)區(qū)間0102201020)()()var(xxxxsxxxxe則可以證明:)(,)()/()/(102010200000xxxxtyxxxxtyxyexye的預(yù)測(cè)區(qū)間:的置信度為與單個(gè)值預(yù)與單個(gè)值預(yù)測(cè)的區(qū)別測(cè)的區(qū)別證明略證明略2021-11-1272 經(jīng)過(guò)研究,發(fā)現(xiàn)家庭書刊消費(fèi)水平受家庭收經(jīng)過(guò)研究,發(fā)現(xiàn)家庭書刊消費(fèi)水平受家庭收入及戶主受教育年限的影
33、響。入及戶主受教育年限的影響。 y y家庭書刊消費(fèi)水平(元家庭書刊消費(fèi)水平(元/ /月);月); x x1 1家庭收入(元家庭收入(元/ /月);月); x x2 2戶主受教育年限(年)戶主受教育年限(年) 若經(jīng)調(diào)查得到一家庭的收入水平為若經(jīng)調(diào)查得到一家庭的收入水平為x x1 1=4000=4000, x x2 2=20=20,要求預(yù)測(cè),要求預(yù)測(cè)y y0 0。iiiixxy221102021-11-1273yx1x21 14501027.282 2507.71045.293 3613.91225.8124 4563.41312.295 5501.51316.476 6781.51442.415
34、7 7541.8164198 8611.11768.8109 91222.11981.2181010793.21998.6141111660.82196101212792.72105.4121313580.82147.481414612.72154101515890.82231.414161611212611.81817171094.23143.416181812533624.6202021-11-1274例例4.1 4.1 :某地區(qū)通過(guò)一個(gè)樣本容量為某地區(qū)通過(guò)一個(gè)樣本容量為722722的調(diào)查數(shù)據(jù)得的調(diào)查數(shù)據(jù)得到勞動(dòng)力受教育的一個(gè)回歸方程為到勞動(dòng)力受教育的一個(gè)回歸方程為 r r2 2=0.21
35、4=0.214式中,式中,y y為勞動(dòng)力受教育年數(shù),為勞動(dòng)力受教育年數(shù),x x1 1為該勞動(dòng)力家庭中兄弟姐為該勞動(dòng)力家庭中兄弟姐妹的個(gè)數(shù),妹的個(gè)數(shù),x x2 2與與x x3 3分別為母親與父親受到教育的年數(shù)。分別為母親與父親受到教育的年數(shù)。 (1 1)x x1 1是否具有預(yù)期的影響?為什么?若是否具有預(yù)期的影響?為什么?若x x2 2與與x x3 3保持不保持不變,為了使預(yù)測(cè)的受教育水平減少一年,需要變,為了使預(yù)測(cè)的受教育水平減少一年,需要x x1 1增加多少?增加多少? (2 2)請(qǐng)對(duì))請(qǐng)對(duì)x x2 2的系數(shù)給予適當(dāng)?shù)慕忉?。的系?shù)給予適當(dāng)?shù)慕忉尅?(3 3)如果兩個(gè)勞動(dòng)力都沒(méi)有兄弟姐妹,但其
36、中一個(gè)的父)如果兩個(gè)勞動(dòng)力都沒(méi)有兄弟姐妹,但其中一個(gè)的父母受教育的年數(shù)為母受教育的年數(shù)為1212年,另一個(gè)的父母受教育的年數(shù)為年,另一個(gè)的父母受教育的年數(shù)為1616年,則兩人受教育的年數(shù)預(yù)期相差多少?年,則兩人受教育的年數(shù)預(yù)期相差多少?321210. 0131. 0094. 036.10xxxy 補(bǔ)充: 虛擬變量dummy variable2021-11-12761 1、定義、定義 許多經(jīng)濟(jì)變量是許多經(jīng)濟(jì)變量是可以定量度量可以定量度量的。但也有一些影的。但也有一些影響經(jīng)濟(jì)變量的因素響經(jīng)濟(jì)變量的因素?zé)o法定量度量無(wú)法定量度量。 為了在模型中能夠反映這些因素的影響,并提高為了在模型中能夠反映這些因素
37、的影響,并提高模型的精度,需要將它們模型的精度,需要將它們“量化量化”。這種。這種“量化量化”通常是通過(guò)引入通常是通過(guò)引入“虛擬變量虛擬變量”來(lái)完成的。來(lái)完成的。 根據(jù)這些因素的屬性類型,構(gòu)造只取根據(jù)這些因素的屬性類型,構(gòu)造只取“0”0”或或“1”1”的 人 工 變 量 , 通 常 稱 為的 人 工 變 量 , 通 常 稱 為 虛 擬 變 量虛 擬 變 量 ( d u m m y d u m m y variablevariable),記為,記為d d。一、虛擬變量的概念及作用一、虛擬變量的概念及作用2021-11-1277性別性別d1男性男性0女性女性城市與農(nóng)村城市與農(nóng)村d1城市城市0農(nóng)村農(nóng)
38、村例:例: 0 非非 本本 科科 學(xué)學(xué) 歷歷 d= 1 本本 科科 學(xué)學(xué) 歷歷 一般地,在虛擬變量的設(shè)置中:一般地,在虛擬變量的設(shè)置中: 基礎(chǔ)類型、否定類型取值為基礎(chǔ)類型、否定類型取值為0 0; 比較類型,肯定類型取值為比較類型,肯定類型取值為1 1。學(xué)歷學(xué)歷2021-11-12782 2、模型中引入虛擬變量的作用、模型中引入虛擬變量的作用(1 1)可以描述和測(cè)量定性因素的的影響。)可以描述和測(cè)量定性因素的的影響。(2 2)能夠正確反映經(jīng)濟(jì)變量之間的相互關(guān))能夠正確反映經(jīng)濟(jì)變量之間的相互關(guān)系,提高模型的精度。系,提高模型的精度。 (相當(dāng)于將不同相當(dāng)于將不同屬性的樣本合并,擴(kuò)大了樣本容量屬性的樣
39、本合并,擴(kuò)大了樣本容量)。)。 (3 3)便于處理異常數(shù)據(jù)。)便于處理異常數(shù)據(jù)。2021-11-1279二、虛擬變量的設(shè)置二、虛擬變量的設(shè)置1 1、虛擬變量的設(shè)置原則、虛擬變量的設(shè)置原則 (1 1)一個(gè)因素多個(gè)屬性)一個(gè)因素多個(gè)屬性 如果某定性因素有如果某定性因素有 m m 種互斥的屬性類型種互斥的屬性類型,在模型中引入,在模型中引入 m-1m-1 個(gè)虛擬變量。個(gè)虛擬變量。 如果不如此,如果不如此,m m個(gè)狀態(tài)引入個(gè)狀態(tài)引入m m個(gè)虛擬變量來(lái)個(gè)虛擬變量來(lái)表示,虛擬變量間會(huì)造成表示,虛擬變量間會(huì)造成完全多重共線性完全多重共線性。011td其他春季012td其他夏季013td其他秋季例例1 1:性
40、別有性別有2 2個(gè)互斥的屬性,引用個(gè)互斥的屬性,引用2-1=12-1=1個(gè)虛擬個(gè)虛擬變量;變量;例例2 2:文化程度分小學(xué)、初中、高中、大學(xué)、研文化程度分小學(xué)、初中、高中、大學(xué)、研究生究生5 5類,引用類,引用4 4個(gè)虛擬變量。個(gè)虛擬變量。例例3 3:已知冷飲的已知冷飲的銷售量銷售量y y除受除受k k種定量變量種定量變量x xk k的的影響外,還受影響外,還受春、夏、秋、冬四季春、夏、秋、冬四季變化的影響,變化的影響,要考察該四季的影響,只需引入要考察該四季的影響,只需引入三個(gè)虛擬變量三個(gè)虛擬變量即即可:可:2021-11-1281則冷飲銷售量的模型為:則冷飲銷售量的模型為:在上述模型中,若
41、再引入第四個(gè)虛擬變量:在上述模型中,若再引入第四個(gè)虛擬變量:ttttktkttdddxxy332211110014td其他冬季則冷飲銷售模型變量為:則冷飲銷售模型變量為:tttttktkttddddxxy44332211110完全多重共線性完全多重共線性2021-11-1282(2 2)多個(gè)因素多個(gè)屬性)多個(gè)因素多個(gè)屬性 k個(gè)定性變量,每個(gè)變量有個(gè)定性變量,每個(gè)變量有mi個(gè)屬性類型(個(gè)屬性類型(i=1,2,k) 虛擬變量個(gè)數(shù)為:虛擬變量個(gè)數(shù)為:kiim1) 1((3 3)虛擬變量在模型中,可以作解釋變量,也可)虛擬變量在模型中,可以作解釋變量,也可以作因變量。以作因變量。2021-11-128
42、32 2、虛擬變量的引入方式、虛擬變量的引入方式 虛擬變量作為解釋變量引入模型有兩種基本虛擬變量作為解釋變量引入模型有兩種基本方式:方式:加法方式加法方式和和乘法方式乘法方式。2021-11-1284例:例:研究女性在工作中是否受到歧視,設(shè)研究女性在工作中是否受到歧視,設(shè)y y表表示年薪,示年薪,x x表示工作年限,建立如下虛擬變量表示工作年限,建立如下虛擬變量模型模型:udxy210 0 女女 性性 d = 1 男男 性性 其中:其中:(1 1)加法方式)加法方式作用:作用:改變截距水平。改變截距水平。 2021-11-1285 y 男性 女性 0+2 0 x 對(duì)估計(jì)結(jié)果應(yīng)用對(duì)估計(jì)結(jié)果應(yīng)用t
43、檢驗(yàn):檢驗(yàn):若若2 2顯著異于顯著異于0 0,則說(shuō)明存在性別歧視;,則說(shuō)明存在性別歧視;若若2 2不顯著異于不顯著異于0 0,則說(shuō)明不存在性別歧視;,則說(shuō)明不存在性別歧視;2021-11-1286(2)乘法方式 用虛擬解釋變量與其他解釋變量相乘作為新的用虛擬解釋變量與其他解釋變量相乘作為新的解釋變量,以達(dá)到調(diào)整模型斜率系數(shù)的目的。解釋變量,以達(dá)到調(diào)整模型斜率系數(shù)的目的。 例例:不同的家庭結(jié)構(gòu),家庭消費(fèi)支出的不同的家庭結(jié)構(gòu),家庭消費(fèi)支出的mpc可可能會(huì)發(fā)生變化。能會(huì)發(fā)生變化。ttttotuxdaxbby)(11有適齡子女有適齡子女0無(wú)適齡子女無(wú)適齡子女其中其中,d d2021-11-1287y
44、有適齡子女 無(wú)適齡子女 b0 x ttottotuxbbuxabby11)(上式相當(dāng)于下列兩式:上式相當(dāng)于下列兩式:a a是否顯著是否顯著可以表明斜率在可以表明斜率在不同家庭結(jié)構(gòu)下是否變化。不同家庭結(jié)構(gòu)下是否變化。2021-11-1288(3)一般方式(混合方式) 當(dāng)截距與斜率發(fā)生變化時(shí),則需要同當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入時(shí)引入加法與乘法加法與乘法形式的虛擬變量。形式的虛擬變量。2021-11-1289此式等價(jià)于下列兩式:此式等價(jià)于下列兩式:ttttttuxyuxy)()(112010男性:女性:例:例:如果男性與女性就業(yè)者的初始年薪和年薪增如果男性與女性就業(yè)者的初始年薪和年薪增加
45、速度都有差異,則可以將加速度都有差異,則可以將加法模型加法模型和和乘法模型乘法模型結(jié)合起來(lái)。結(jié)合起來(lái)。ttttttudxdxy2110d1男性男性0女性女性2021-11-1290(4)分段線性回歸 在經(jīng)濟(jì)發(fā)生轉(zhuǎn)折時(shí)期,可通過(guò)建立臨界指標(biāo)的虛擬變量在經(jīng)濟(jì)發(fā)生轉(zhuǎn)折時(shí)期,可通過(guò)建立臨界指標(biāo)的虛擬變量模型來(lái)反映。模型來(lái)反映。 例如例如:進(jìn)口消費(fèi)品數(shù)量進(jìn)口消費(fèi)品數(shù)量y主要取決于國(guó)民收入主要取決于國(guó)民收入x的多少,的多少,中國(guó)在改革開(kāi)放前后,中國(guó)在改革開(kāi)放前后,y對(duì)對(duì)x的回歸關(guān)系明顯不同。的回歸關(guān)系明顯不同。 這時(shí),可以這時(shí),可以t*=1979年為轉(zhuǎn)折期,以年為轉(zhuǎn)折期,以1979年的國(guó)民收入年的國(guó)民收入xt*為臨界值,設(shè)如下虛擬變量:為臨界值,設(shè)如下虛擬變量:01td*tttt則進(jìn)口消費(fèi)品的回歸模型可建立如下:則進(jìn)口消費(fèi)品的回歸模型可建立如下:ttttttdxxxy)(*2102021-11-1291ols法得到該模型的回歸方程為:則兩時(shí)期進(jìn)口消費(fèi)品函數(shù)分別為:則兩時(shí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年四川中建三局裝飾有限公司招聘筆試參考題庫(kù)含答案解析
- 2025年國(guó)網(wǎng)電力科學(xué)研究院武漢南瑞有限責(zé)任公司招聘筆試參考題庫(kù)附帶答案詳解
- 2025-2030全球高壓有載分接開(kāi)關(guān)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)醫(yī)用 PTFE 管行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025年度店鋪債權(quán)債務(wù)轉(zhuǎn)讓合同范本
- 2025年度店鋪?zhàn)赓U權(quán)轉(zhuǎn)讓及裝修設(shè)計(jì)咨詢服務(wù)合同3篇
- 二零二五年度車庫(kù)購(gòu)置與物業(yè)管理合作協(xié)議4篇
- 2024鐵路貨運(yùn)合同鐵路運(yùn)輸貨物交付與驗(yàn)收協(xié)議3篇
- 二零二五年度餐廚廢棄物處置與廢棄物處理設(shè)施改造合同3篇
- 2025年度個(gè)人與個(gè)人草原生態(tài)修復(fù)工程合同范本
- 南通市2025屆高三第一次調(diào)研測(cè)試(一模)地理試卷(含答案 )
- 2025年上海市閔行區(qū)中考數(shù)學(xué)一模試卷
- 2025中國(guó)人民保險(xiǎn)集團(tuán)校園招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 重癥患者家屬溝通管理制度
- 法規(guī)解讀丨2024新版《突發(fā)事件應(yīng)對(duì)法》及其應(yīng)用案例
- IF鋼物理冶金原理與關(guān)鍵工藝技術(shù)1
- 銷售提成對(duì)賭協(xié)議書范本 3篇
- 勞務(wù)派遣招標(biāo)文件范本
- EPC項(xiàng)目階段劃分及工作結(jié)構(gòu)分解方案
- 《跨學(xué)科實(shí)踐活動(dòng)4 基于特定需求設(shè)計(jì)和制作簡(jiǎn)易供氧器》教學(xué)設(shè)計(jì)
- 信息安全意識(shí)培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論