




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、.1stata回歸結(jié)果詳解付暢儉湘潭大學(xué)商學(xué)院.2數(shù)據(jù)來源于賈俊平統(tǒng)計學(xué)(第7版),第12章多元線性回歸noyx1x2x3x410.967.36.8551.921.1111.319.81690.934.81737.71773.743.280.87.21014.557.8199.716.51963.262.716.22.212.271.6107.410.71720.2812.5185.427.11843.89196.11.71055.9102.672.89.11464.3110.364.22.11142.7124132.211.22376.7130.858.661422.8143.5174.61
2、2.726117.11510.2263.515.634146.716379.38.91529.9170.214.80.6242.1180.473.55.91125.319124.75413.4206.8139.47.22864.32111.6368.216.832163.9221.695.73.81044.5231.2109.610.31467.9247.2196.215.81639.7253.2102.2121097.1.3.4第二列SS對應(yīng)的是誤差平方和,或稱變差。1.第一行為回歸平方和或回歸變差SSR,表示因變量的預(yù)測值對其平均值的總偏差。2.第二行為剩余平方和(也稱殘差平方和或剩余變差
3、)SSE,是因變量對其預(yù)測值的總偏差,這個數(shù)值越大,擬合效果越差,y的標(biāo)準(zhǔn)誤差即由SSE給出。3.第三行為總平方和或總變差SST,表示因變量對其平均值的總偏差。4.容易驗證249.37+63.28=312.65213.SST()312.65niiyy22111.SSR()()249.37nniiiiyyyy212.SSE()63.28niiiyy4.SSRSSESST第三列df是自由度(degree of freedom),第一行是回歸自由度dfr,等于變量數(shù)目,即dfr=m;第二行為殘差自由度dfe,等于樣本數(shù)目減去變量數(shù)目再減1,即有dfe=n-m-1;第三行為總自由度dft,等于樣本數(shù)目
4、減1,即有dft=n-1。對于本例,m=4,n=10,因此,dfr=4,dfe=n-m-1=20,dft=n-1=24。第四列MS是均方差,誤差平方和除以相應(yīng)的自由度1.第一行為回歸均方差MSR2.第二行為剩余均方差MSE,數(shù)值越小擬合效果越好SSR249.371.MSR62.34dfr4SSE63.282.MSE3.16dfe201.方差分析.5F值,用于線性關(guān)系的判定。結(jié)合P值對線性關(guān)系的顯著性進(jìn)行判斷,即棄真概率。所謂“棄真概率”即模型為假的概率,顯然1-P便是模型為真的概率,P值越小越好。對于本例,P=0.00000.0001,故置信度達(dá)到99.99%以上。62.3428(4,20)1
5、9.703.1640M SRFM SE222SSR 249.370.7976SST63.28/(1)(1)24(1 0.7976)1110.7571/120aRSSE dfenRRSST dftn m R- Squared為判定系數(shù)(determination coefficient),或稱擬合優(yōu)度(goodness of fit),它是相關(guān)系數(shù)的平方,也是SSR/SST,y的總偏差中自變量解釋的部分。Adjusted對應(yīng)的是校正的判定系數(shù)Root MSE為標(biāo)準(zhǔn)誤差(standard error),數(shù)值越小,擬合的效果越好Root MSE3.16401.7788MSE2.模型顯著性.6回歸系數(shù)
6、22var()*,(1)MSEjjjjjjjxjxjjjMSEMSEVIF RxSSTRSSTxVIF回歸系數(shù) 的標(biāo)準(zhǔn)誤差為 對其它自變量進(jìn)行回歸的判決系數(shù)即,方差為除以 中不能被其它自變量解釋的部分,變量x的方差擴大因子回歸系數(shù)標(biāo)準(zhǔn)誤差T值T值=Coef./Std. Err.P值置信區(qū)間置信區(qū)間(CI)0.0145294-invttail(20,0.025)*0.0830332=0.0145294-2.086*0.0830332=-0.15867480.0145294+2.086*0.0830332=0.18773353.回歸系數(shù)檢驗P值用于說明回歸系數(shù)的顯著性,一般來說P值0.1(*)表示
7、10%顯著水平顯著,P值0.05(*)表示5%顯著水平顯著, P值0.01(*)表示1%顯著水平顯著.732333.16403.1640var( )0.08303(1)1759.84(1 0.7392)458.91xMSESSTR4.系數(shù)標(biāo)準(zhǔn)誤差計算當(dāng)自變量只有兩個時,R2j就是這兩個變量的相關(guān)系數(shù)(pwcorr x2 x1)的平方.8對多元回歸“排除其它變量影響”的解釋.9.10簡單回歸和多元回歸估計值的比較.03789471= .0289094 + .1678986 * .05351630110112220111121221211= 02= 0yxyxxxxxyxx則因 此 , 在 以 下
8、 兩 種 情 況 下 會 相 等、 樣 本 中對的 偏 效 應(yīng) 為 0 , 即、 樣 本 中和不 相 關(guān) , 即.11tw (function t=tden(20,x),range(-3 3), xline(0.17 2.086)ttail(df,t) = p 計算單邊P值雙邊時P值加倍就行了如: ttail(20,0.17498)*2=0.863 invttail(df,p) = t 計算單邊臨界值在雙邊95%置信度,5%顯著水平時的臨界值為:t0=invttail(20,0.025)=2.0862.0860.17t0t0.0145294-invttail(20,0.025)*0.08303
9、32=0.0145294-2.086*0.0830332=-0.15867480.0145294+2.086*0.0830332=0.18773355.系數(shù)置信區(qū)間.12Stata中查臨界值和p值normalden(z)normal(z) invnormal(p)tden(df,t)t(df,t) invt(df,p)ttail(df,t) invttail(df,p)chi2den(df,x)chi2 (df,x) invchi2 (df,p)chi2tail(df,x) invchi2tail(df,p)Fden(df1,df2,x)F (df1,df2,x) invF (df1,df2,
10、p)Ftail(df1,df2,x) invFtail(df1,df2,p)Ftail(2,702,3.96)=0.0195=1-F(2,702,3.96).136.回歸結(jié)果的評價 (1)通過模型F檢驗說明線性關(guān)系是否成立。 (2)回歸系數(shù)符號是否與理論或預(yù)期相一致。 (3) 通過系數(shù)t檢驗說明y 與x關(guān)系統(tǒng)計顯著性。 (4)用判定系數(shù)說明回歸模型在多大程度上解釋了因變量y 取值的差異。 (5)畫殘差直方圖或正態(tài)概率圖考察誤差項 的正態(tài)性假定是否成立。.147.多重共線性判斷 出現(xiàn)下列情況,暗示存在多重共線性: (1 )模型中各對自變量之間顯著相關(guān)(相關(guān)系數(shù)檢驗)。 (2) 當(dāng)模型的線性關(guān)系F
11、檢驗顯著時,幾乎所有回歸系數(shù)的t 檢驗都不顯著。 (3) 回歸系數(shù)的正負(fù)號與預(yù)期的相反。 ( 4) 容忍度( tolerance) 與方差擴大因子(variance inflation factor , VIF) 。某個自變量的容忍度等于1 減去該自變量對其他k-1 個自變量的線性回歸的判定系數(shù), 容忍度越小,多重共線性越嚴(yán)重。方差擴大因子等于容忍度的倒數(shù),VIF 越大,多重共線性越嚴(yán)重, 一般認(rèn)為容忍度小于0.1 、VIF 大于10 時,存在嚴(yán)重的多重共線性。2211=1jjjjVIFRRx容忍度為 對其它自變量進(jìn)行回歸的判決系數(shù).15X3的VIF=3.83=1/(1-0.7392)=1/(
12、0.2608)=1/容忍度2211=1jjjjVIFRRx容忍度為 對其它自變量進(jìn)行回歸的判決系數(shù).16 不存在完全共線性假設(shè),允許自變量之間存在相關(guān)關(guān)系,只是不能完全相關(guān) 1、一個變量是另一個變量的常數(shù)倍,如同時放入不同度量單位的同一變量 2、同一變量的不同非線性函數(shù)可以成為回歸元,如consumeincome+income2 但ln( consume)ln(income)+ln(income2)共線性,應(yīng)為ln( consume)ln(income)+(lnincome)2 3、一個自變量是兩個或多個自變量和線性函數(shù).17回歸模型中包含無關(guān)變量01 122331233=0312OLSyxx
13、xuxxxxxx在控制了 和 之后, 對y沒有影響,即。變量 與 和 或許相關(guān),或許不相關(guān)。當(dāng)回歸模型中包含一個或多個無關(guān)變量,對模型進(jìn)行了過度設(shè)定,不影響估計的無偏性,但會影響估計的方差。.18遺漏變量偏誤012012wageeducabiluwageeducvvabilu但由于能力不觀測,因此估計模型為其中.19 遺漏相關(guān)變量偏誤遺漏相關(guān)變量偏誤 采用遺漏相關(guān)變量的模型進(jìn)行估計而帶來的偏誤稱為遺漏相關(guān)變量偏誤遺漏相關(guān)變量偏誤(omitting relevant variable bias)。設(shè)正確的模型為 Y=0+1X1+2X2+卻對 Y=0+ 1X1+v進(jìn)行回歸,得2111iiixyx.
14、20將正確模型 Y=0+1X1+2X2+ 的離差形式 iiiixxy2211代入2111iiixyx得21121212121221112111)()(iiiiiiiiiiiiiixxxxxxxxxxyx(1)如果漏掉的X2與X1相關(guān),則上式中的第二項在小樣本下求期望與大樣本下求概率極限都不會為零,從而使得OLSOLS估估計量在小樣本下有偏,在大樣本下非一致計量在小樣本下有偏,在大樣本下非一致。121121xx ,其中 是 對 回歸的斜率.21 (2)如果X2與X1不相關(guān),則1的估計滿足無偏性與一致性;但這時0的估計卻是有偏的。 由 Y=0+ 1X1+v 得2121)(ixVar由 Y=0+1X1+2X2+ 得)1 ()()(22122212221222121xxiiiiiirxxxx
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 城市綠化工程優(yōu)化方案計劃
- 地理課程在線學(xué)習(xí)平臺計劃
- 教育機構(gòu)2025年教學(xué)成果總結(jié)及計劃
- 一年級品德與法律知識教學(xué)計劃
- 2025學(xué)期少先隊員心理輔導(dǎo)計劃
- 高一語文期中考試復(fù)習(xí)計劃
- 2025年度醫(yī)療行業(yè)危險廢物管理計劃
- 蘇教版一年級下冊心理健康教育教學(xué)計劃
- 退休市場傳播顧問合同
- 國際交流項目教師培訓(xùn)經(jīng)費計劃
- 2024譯林版七年級英語下冊期中復(fù)習(xí):Unit1-Unit4詞組講義
- 護(hù)士助教面試題及答案
- 《分布式存儲技術(shù)》課件
- 智能化施工流程改進(jìn)技術(shù)措施
- 食品安全管理制度12項餐飲類
- talentq邏輯測試題及答案
- 員工職業(yè)道德與法律意識培訓(xùn)
- 頂名注冊公司協(xié)議書
- 腦病個案護(hù)理完整方案
- 六年級道德與法治上冊《日益重要的國際組織》
- 泥水平衡頂管施工工藝詳解
評論
0/150
提交評論