




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
計量經(jīng)濟(jì)學(xué)多元線性回歸第1頁,共56頁,2022年,5月20日,7點7分,星期三2本章大綱數(shù)據(jù)的測度單位換算對OLS統(tǒng)計量的影響對函數(shù)形式的進(jìn)一步討論擬合優(yōu)度和回歸元選擇的進(jìn)一步探討預(yù)測和殘差分析第2頁,共56頁,2022年,5月20日,7點7分,星期三3課堂提綱重新定義變量的影響估計系數(shù)R平方t統(tǒng)計量函數(shù)形式 對數(shù)函數(shù)形式含二次式的模型含交叉項的模型第3頁,共56頁,2022年,5月20日,7點7分,星期三4
重新定義變量為什么我們想這樣做?數(shù)據(jù)測度單位變換經(jīng)常被用于減少被估參數(shù)小數(shù)點后的零的個數(shù),這樣結(jié)果更好看一些。既然這樣做主要為了好看,我們希望本質(zhì)的東西不改變。第4頁,共56頁,2022年,5月20日,7點7分,星期三5
重新定義變量:一個例子以下模型反映了嬰兒出生體重與孕婦吸煙量和家庭收入之間的關(guān)系:(1)考慮如下單位變換:(2)出生體重單位由盎司變?yōu)榘?3)香煙的支數(shù)變?yōu)榘鼣?shù)估計結(jié)果列于下表
第5頁,共56頁,2022年,5月20日,7點7分,星期三6Table6.1Y(column)(1)bwght(2)bwghtlbs(3)bwghtX(rows)Cigs-0.4634(0.0916)-0.0289(0.0057)--Packs-----9.268(1.832)Faminc0.0927(0.0292)0.0058(0.0018)0.0927(0.0292)Intercept116.794(1.049)7.3109(0.0656)116.974(1.049)Observations138813881388R-squared0.02980.02980.0298SSR557,485.512177.5778557.485.51SER20.0631.253920.063第6頁,共56頁,2022年,5月20日,7點7分,星期三7
改變被解釋變量測度單位的影響因為1磅=16盎司,被解釋變量被除以16。比較第1列與第2列。(1)中被估參數(shù)/16=(2)中被估參數(shù)(1)中被估參數(shù)的標(biāo)準(zhǔn)差/16=(2)中被估參數(shù)的標(biāo)準(zhǔn)差(1)和(2)中t統(tǒng)計量相同R平方相同(1)中SSR/(16*16)=(2)中SSR(1)中SER(標(biāo)準(zhǔn)差)/16=(2)中SER第7頁,共56頁,2022年,5月20日,7點7分,星期三8改變解釋變量測度單位的影響現(xiàn)在香煙數(shù)量單位變?yōu)榘,F(xiàn)在比較第(1)列和第(3)列。變量faminc系數(shù)和截距項的估計值和其標(biāo)準(zhǔn)差分析同上。packs的系數(shù)估計值和標(biāo)準(zhǔn)差變?yōu)?0倍。t統(tǒng)計量相同R平方相同SSR相同SER相同第8頁,共56頁,2022年,5月20日,7點7分,星期三9重新定義變量改變變量y的測度單位會導(dǎo)致系數(shù)和標(biāo)準(zhǔn)差相應(yīng)的改變,所以解釋變量系數(shù)顯著性和對其解釋沒有改變。改變一個變量x的測度單位會導(dǎo)致該變量系數(shù)和標(biāo)準(zhǔn)差的相應(yīng)改變,所以所有解釋變量顯著性和對其解釋沒有改變。如果被解釋變量以對數(shù)形式出現(xiàn),改變被解釋變量度量單位對任何斜率系數(shù)沒有影響。來自log(cy)=log(c)+log(y),改變y測度單位將改變截距,不改變斜率系數(shù)。第9頁,共56頁,2022年,5月20日,7點7分,星期三10Beta系數(shù)考慮如下形式的樣本回歸方程:
?=200+20,000x1
+0.2x2我們能說x1是最重要的變量嗎?現(xiàn)在,查看以下各個變量的單位:y單位:美元x1單位:美分x2單位:千美元第10頁,共56頁,2022年,5月20日,7點7分,星期三11Beta系數(shù)上例揭示了什么問題?被估計系數(shù)的大小是不可比較的。一個相關(guān)的問題是,當(dāng)變量大小差別過大時,在回歸中因運算近似而導(dǎo)致的誤差會比較大。第11頁,共56頁,2022年,5月20日,7點7分,星期三12Beta系數(shù)有時,我們會看見“標(biāo)準(zhǔn)化系數(shù)”或“Beta系數(shù)”,這些名稱有著特殊的意義使用Beta系數(shù)是因為有時我們把y和各個x替換為標(biāo)準(zhǔn)化版本——也就是,減去均值后除以標(biāo)準(zhǔn)離差。系數(shù)反映對于一單位x的標(biāo)準(zhǔn)離差的y的標(biāo)準(zhǔn)離差。第12頁,共56頁,2022年,5月20日,7點7分,星期三13Beta系數(shù)第13頁,共56頁,2022年,5月20日,7點7分,星期三14Beta系數(shù)第14頁,共56頁,2022年,5月20日,7點7分,星期三15例子第15頁,共56頁,2022年,5月20日,7點7分,星期三16函數(shù)形式OLS也可以用在x和y不是嚴(yán)格線性的情況,通過使用非線性方程,使得關(guān)于參數(shù)仍為線性??梢匀,y(一個或全部)的自然對數(shù)可以用x的平方形式可以用x的交叉項第16頁,共56頁,2022年,5月20日,7點7分,星期三17對數(shù)模型的解釋如果模型是ln(y)=b0+b1ln(x)+ub1是y對于x的彈性如果模型是ln(y)=b0+b1x+ub1近似是,給定一單位x的改變,y的百分比變化,常被稱為半彈性。第17頁,共56頁,2022年,5月20日,7點7分,星期三18為什么使用對數(shù)模型?取對數(shù)后變量的斜率系數(shù),不隨變量測度單位改變。如果回歸元和回歸子都取對數(shù)形式,斜率系數(shù)給出對彈性的一個直接估計。對于y>0的模型,條件分布經(jīng)常偏斜或存在異方差,而ln(y)就小多了,所以ln(y)的分布窄多了,限制了異常(或極端)觀測值(outliers)的影響。第18頁,共56頁,2022年,5月20日,7點7分,星期三19一些經(jīng)驗法則什么類型的變量經(jīng)常用對數(shù)形式?肯定為正的錢數(shù):工資,薪水,企業(yè)銷售額和企業(yè)市值。非常大的變量:如人口,雇員總數(shù)和學(xué)校注冊人數(shù)等。什么類型的變量經(jīng)常用水平值形式?用年測量的變量:如教育年限,工作經(jīng)歷,任期年限和年齡可以以水平值或?qū)?shù)形式出現(xiàn)的變量:比例或百分比變量:失業(yè)率,養(yǎng)老保險金參與率等。第19頁,共56頁,2022年,5月20日,7點7分,星期三20對數(shù)形式的限制一個變量取零或負(fù)值,則不能使用對數(shù)。如果y非負(fù)但可以取零,則有時使用log(1+y)。當(dāng)數(shù)據(jù)并非多數(shù)為零時,使用log(1+y)估計,并且假定變量為log(y),解釋所得的估計值,是可以接受的。第20頁,共56頁,2022年,5月20日,7點7分,星期三21慎重使用對數(shù)形式注意到,當(dāng)y取對數(shù)形式時,更難以預(yù)測原變量的值,因為原模型允許我們預(yù)測log(y)而不是y。第21頁,共56頁,2022年,5月20日,7點7分,星期三22含二次式的模型對于形式為y=b0+b1x+b2x2+u的模型,我們不能單獨將b1解釋為關(guān)于x,y變化的度量,我們需要將b2也考慮進(jìn)來,因為第22頁,共56頁,2022年,5月20日,7點7分,星期三23如果感興趣的是,給定x的初始值和變動,預(yù)測y的變化,那么可以直接使用(1)。一般來說,我們可以使用x的平均值,中值,或上下四分位數(shù)來預(yù)測y,取決于我們感興趣的問題。含二次式的模型第23頁,共56頁,2022年,5月20日,7點7分,星期三24含二次式的模型第24頁,共56頁,2022年,5月20日,7點7分,星期三253.737.3724.4experwage第25頁,共56頁,2022年,5月20日,7點7分,星期三26
對含二次式模型的進(jìn)一步討論假如x的系數(shù)為正,x2的系數(shù)為負(fù)。那么,y首先隨x上升而上升,但最終轉(zhuǎn)向隨x上升而下降。第26頁,共56頁,2022年,5月20日,7點7分,星期三27
對含二次式模型的進(jìn)一步討論假如x的系數(shù)為負(fù),x2的系數(shù)為正。那么,y首先隨x上升而下降,但最終轉(zhuǎn)向隨x上升而上升。第27頁,共56頁,2022年,5月20日,7點7分,星期三28
交叉項對于形式為y=b0+b1x1+b2x2+b3x1x2+u的模型,我們不能單獨將b1解釋為關(guān)于x1,y變化的度量,我們需要將b3也考慮進(jìn)來,因為第28頁,共56頁,2022年,5月20日,7點7分,星期三擬合優(yōu)度每一個觀察值可被視為由解釋部分和未解釋部分構(gòu)成:定義:SST=SSE+SSR29第29頁,共56頁,2022年,5月20日,7點7分,星期三30擬合優(yōu)度(續(xù))我們怎樣衡量我們的樣本回歸線擬合樣本數(shù)據(jù)有多好呢?可以計算總平方和(SST)中被模型解釋的部分,稱此為回歸R2R2=SSE/SST=1–SSR/SST第30頁,共56頁,2022年,5月20日,7點7分,星期三31
更多關(guān)于R2當(dāng)回歸中加入另外的解釋變量時,R2通常會上升。如果OLS使此解釋變量取任何非零系數(shù),那么加入此變量之后,SSR降低了。實際操作中,被估計系數(shù)精確取零是極其罕見的,所以,當(dāng)加入一個新解釋變量后,一般來說,SSR會降低。第31頁,共56頁,2022年,5月20日,7點7分,星期三32
調(diào)整過的R2(TheAdjustedR-squared)因此,R2增加并不意味著加入新的變量一定會提高模型擬合度。調(diào)整過的R2是R2一個修正版本,當(dāng)加入新的解釋變量,調(diào)整過的R2不一定增加。第32頁,共56頁,2022年,5月20日,7點7分,星期三33
調(diào)整過的R2調(diào)整過的R2是1減去OLS殘差的樣本方差(修正過自由度之后)與y的樣本方差之比。調(diào)整過的R2的三個有用性質(zhì):因為(n-1)/(n-k-1)>1,所以調(diào)整過的R2總比R2小。加入一個解釋變量有兩個相反的效果。(1)SSR降低導(dǎo)致調(diào)整過的R2增加。(2)(n-1)/(n-k-1)增加導(dǎo)致調(diào)整過的R2降低。調(diào)整過的R2可能是負(fù)的,發(fā)生在以下情況:所有解釋變量使殘差平方和下降的太少,不足以抵消因子(n-1)/(n-k-1)。
R2只有在過原點回歸中才可能為負(fù)。第33頁,共56頁,2022年,5月20日,7點7分,星期三34
比較R2和AdjustedR2R2和調(diào)整過的R2告訴我們,解釋變量是否很好地預(yù)測了,或“解釋”了,手頭數(shù)據(jù)中被解釋變量的值。R2和調(diào)整過的R2并沒有告訴我們被包含變量是否統(tǒng)計顯著解釋變量是否是被解釋變量變動的真正原因是否有遺漏變量偏誤,或是否選取了最合適的解釋變量組合第34頁,共56頁,2022年,5月20日,7點7分,星期三35R2和AdjustedR2在決定某個變量是否應(yīng)該被加入模型時,R2和AdjustedR2并非理想的工具。決定一個解釋變量是否屬于模型的因素應(yīng)該是,該解釋變量在總體中對y的局部效應(yīng)是否為零。第35頁,共56頁,2022年,5月20日,7點7分,星期三36擬合優(yōu)度和解釋變量選擇的進(jìn)一步探討AdjustedR-Squared第36頁,共56頁,2022年,5月20日,7點7分,星期三37我們定義總體R2為:y的變異在總體中能被解釋變量解釋的比例,為調(diào)整過的R2仍不是總體R2的一個無偏估計量,因為兩個無偏估計量的比例不是一個無偏估計量。擬合優(yōu)度和解釋變量選擇的進(jìn)一步探討第37頁,共56頁,2022年,5月20日,7點7分,星期三38調(diào)整過的R2最根本的吸引力,在于它對向模型增加自變量的懲罰。如果我們向回歸模型加入一個新的解釋變量,當(dāng)且僅當(dāng)新變量的t統(tǒng)計量的絕對值大于1時,調(diào)整過的R2增加。擬合優(yōu)度和解釋變量選擇的進(jìn)一步探討第38頁,共56頁,2022年,5月20日,7點7分,星期三39利用調(diào)整的R2在兩個非嵌套模型中進(jìn)行選擇如果兩個模型中任何一個都不是另一個的特例,則兩個模型是非嵌套的。F統(tǒng)計量只允許我們檢驗嵌套的模型,因為有限制的模型是無限制模型的特例。我們需要一些在無嵌套模型間進(jìn)行選擇的指導(dǎo)。第39頁,共56頁,2022年,5月20日,7點7分,星期三40當(dāng)變量有不同函數(shù)形式時,通過比較調(diào)整過的R2,在不同的解釋變量的非嵌套組合中進(jìn)行選擇,是頗有價值的。例如,一個模型是y=b0+b1x1+b2log(x2), 另一個是y=b0+b1x1+b2x2+b3x22。 如果第一個模型調(diào)整過的R平方為0.3,而第二個為0.6,我們傾向于選擇第二個模型利用調(diào)整的R2在兩個非嵌套模型中進(jìn)行選擇第40頁,共56頁,2022年,5月20日,7點7分,星期三41
調(diào)整過的R2的限制:我們不能利用它在關(guān)于因變量函數(shù)形式不同的模型間進(jìn)行選擇利用調(diào)整的R2在兩個非嵌套模型中進(jìn)行選擇第41頁,共56頁,2022年,5月20日,7點7分,星期三42
預(yù)測分析:估計量第42頁,共56頁,2022年,5月20日,7點7分,星期三43預(yù)測分析:標(biāo)準(zhǔn)差第43頁,共56頁,2022年,5月20日,7點7分,星期三44
預(yù)測分析:置信區(qū)間第44頁,共56頁,2022年,5月20日,7點7分,星期三45預(yù)測分析:一個特殊y的置信區(qū)間第45頁,共56頁,2022年,5月20日,7點7分,星期三46預(yù)測分析:y0的預(yù)測區(qū)間第46頁,共56頁,2022年,5月20日,7點7分,星期三47預(yù)測分析:y0的預(yù)測區(qū)間第47頁,共56頁,2022年,5月20日,7點7分,星期三48有時,檢驗個體觀測值來看它的因變量高于還是低于預(yù)測值是有用的。也就是,檢驗個體觀測值的殘差。殘差分析第48頁,共56頁,2022年,5月20日,7點7分,星期三49殘差分析例:將房價對一些可觀測特點回歸,得預(yù)測值,算出殘差。殘差為負(fù)則說明根據(jù)可觀測因素房價偏低。負(fù)的程度最大值的大小說明我們還沒有控制因素的重要程度??蔀楦闹到㈩A(yù)測區(qū)間。第49頁,共56頁,2022年,5月20日,7點7分,星期三50
y=b0+b1x1+b2x2+...bkxk+u5.DummyVariables第50頁,共56頁,2022年,5月20日,7點7分,星期三51虛擬變量虛擬變量是一個取值為1或0的變量。例:male(=1ifaremale,0otherwise),south(=1ifinthesouth,0otherwise),etc.虛變量也稱二值變量。第51頁,共56頁,2022年,5月20日,7點7分,星期三52虛擬變量考慮只有一個解釋變量(x)和一個虛擬變量(d)的簡單模型。
y=b0+d0d+b1x+u
該模型可以看做是一個截距的變化。Thiscanbeinterpretedasaninterceptshift若d=0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度企業(yè)法人變更與股權(quán)收購合同
- 2025年度非婚生子女監(jiān)護(hù)權(quán)及生活費用保障協(xié)議
- 2025年度知識產(chǎn)權(quán)交易付款委托三方協(xié)議
- 二零二五年度企業(yè)反壟斷法律顧問服務(wù)協(xié)議
- 2025年度未成年人監(jiān)護(hù)權(quán)委托代理合同模板
- 2025年度甲級寫字樓辦公室合租管理合同
- 二零二五年度汽車保險代理合同
- 二零二五年度花卉租擺與植物養(yǎng)護(hù)服務(wù)合同
- 二零二五年度信用卡透支貸款協(xié)議書
- 二零二五年度銀行與交通企業(yè)物流金融合同標(biāo)準(zhǔn)
- 2025年內(nèi)蒙古北方職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫及答案一套
- 2025年安徽水利水電職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫(含答案)
- 中國瓶裝水飲用水項目投資可行性研究報告
- 山東省青島市市北區(qū)2024-2025學(xué)年七年級上學(xué)期期末考試英語試題(含答案+解析)
- 餐飲及食品安全管理制度
- 湖北省襄陽市襄州區(qū)2024-2025學(xué)年九年級上學(xué)期期末語文試題(含答案)
- 2025年安徽電氣工程職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫及答案1套
- 2025年房屋交易代持策劃協(xié)議書
- 課題申報參考:“四新”建設(shè)背景下教育創(chuàng)新與課程數(shù)字化實踐研究
- 2025年煙臺汽車工程職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試近5年常考版參考題庫含答案解析
- 2025年江蘇農(nóng)牧科技職業(yè)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
評論
0/150
提交評論