版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、三、線性回歸分析1 v相關(guān)性分析v回歸分析v多重共線性等相關(guān)檢驗和處理2 線性回歸分析的stata應用實例本部分用到的實例是Big Andys Burger Barn的銷售模型。Big Andy的漢堡銷售收入取決于單價和廣告支出水平 。因此,這個模型包含兩個解釋變量和一個常數(shù)項。其中,sales為指定城市的月銷售額并以千美仄元度量,price是以美元度量的單個漢堡的價格,advert為廣告支出,同樣以千美元度量。sales= 1 +2*price +3*advert+ 3 相關(guān)性分析相關(guān)性分析相關(guān)性分析主要目的是研究變量之間關(guān)系的密切程度。相關(guān)性分析的方法主要有:Pearson相關(guān)系數(shù)分析、K
2、endall T相關(guān)系數(shù)分析、Spearman秩相關(guān)系數(shù)分析以及偏相關(guān)系數(shù)分析。1. Pearson相關(guān)系數(shù)分析Pearson相關(guān)性分析是一個描述線性相關(guān)強度的量,取值于一1和1之間。 Pearson相關(guān)性分析的命令格式:correlate varlist if in weight ,correlate_ options pwcorr varlist if in weight ,correlate_ options correlate盡可能使用兩兩變量中所有沒有缺失的數(shù)據(jù)pwcorr只采用沒有任何缺失數(shù)據(jù)的完整觀測值4 選項含義means顯示變量的均值、標準差、最大最小信covariance顯
3、示協(xié)方差矩陣選項含義obs顯示計算每個相關(guān)系數(shù)時使用的觀測值個數(shù)sig顯示顯著性檢驗的P值print(#)在屏幕上僅顯示達到相應顯著性水平的相關(guān)系數(shù)star(#)在顯著的相關(guān)系數(shù)上打上星號listwise使用listwise的方法處理缺失值,這樣pwcorr就退化成correlate命令了。所謂listwis。方法是說,如果某一觀測值中某個或者多個變量出現(xiàn)缺失,則將整個觀測值刪掉,這也正是correlate命令使用的方法。對于沒有缺失值的數(shù)據(jù)集,這兩種方法沒有區(qū)別correlate選項說明pwcorr選項說明5 用pwcorr命令實現(xiàn)所有變量的Pearson相關(guān)系數(shù)分析,并在顯著性水平超過0.
4、05的相關(guān)系數(shù)上打上星號,其命令為: pwcorr , sig star(0.05)6 2. Kendall T相關(guān)系數(shù)分析Kendall T相關(guān)性分析是一個非參數(shù)度量變量間的相關(guān)性,其取值在一1和1之間。 Kendall T相關(guān)性分析的命令格式:ktau varlist if in weight , ktau _ options 選項含義print(#)在屏幕上僅顯示達到相應顯著性水平的相關(guān)系數(shù)star(#)在顯著的相關(guān)系數(shù)上打上星號7 用ktau命令實現(xiàn)所有變量的Kendall T相關(guān)系數(shù)分析,并在顯著性水平超過0.05的相關(guān)系數(shù)上打上星號,其命令為: ktau , star(0.05)8
5、 3. Spearman秩相關(guān)系數(shù)分析Spearman秩相關(guān)性分析也是一種不依賴于總體分布的非參數(shù)檢驗,取值也在一1和1之間。 Spearman秩相關(guān)性分析的命令格式:spearman varlist if in weight , spearman _ options 9 用spearman命令實現(xiàn)所有變量的Spearman秩相關(guān)系數(shù)分析,并在顯著性水平超過0.05的相關(guān)系數(shù)上打上星號,其命令為:spearman, star(0.05)10 4.偏相關(guān)系數(shù)分析雙變量相關(guān)分析是研究兩個變量之間的相關(guān)關(guān)系,有時在分析兩個變量之間相關(guān)關(guān)系時,往往會有其他變量的影響因素混合在里面,此時計算出來的相關(guān)系
6、數(shù)可能并不能真正反映兩個變量之間的關(guān)系。偏相關(guān)性分析的命令格式: pcorr varnamel varlist if in weight11 用pcorr命令實現(xiàn)偏相關(guān)分析,其命令為: pcorr, sales price advert12 回歸分析回歸分析 回歸分析時常用的Stata 命令有:regress , predict, test命令。regress, predict, test 是一組命令,它們完成各種簡單和多元的普通最小二乘法回歸。1.regress實現(xiàn)因變量對自變量的回歸regress命令的格式: regress depvar indepvarsif in weight opt
7、ions因變量自變量選項含義noconstant不加常數(shù)項做線性回歸hascons由用戶指定常數(shù)項的值level(#)設(shè)定置信水平(默認值為95% )beta報告標準化的beta系數(shù)noheader不報告輸出表名13 實現(xiàn)因變量為銷售收入,自變量為單價和廣告支出的線性回歸,其命令為: regress sales price advert表下方區(qū)域為基本的回歸結(jié)果。第1列依次為被解釋變量sales,解釋變量price、advert,截距項constant;第2列回歸系數(shù);第3列回歸系數(shù)的標準誤;第4列回歸系數(shù)的 t 統(tǒng)計量值;第5列p值;第6列95%的置信區(qū)間14 表左上方區(qū)域為方差分析表。第2
8、列從上到下依次為回歸平方和(SSE)、殘差平方和(SSR)和總離差平方和(SST);第3列為自由度,分別為k=2,n-k-1=75-2-1=72,n-1=75-1=74;第4列為均方和(MSS),由各項平方和除以相應的自由度得到。表右上方區(qū)域給出了樣本數(shù)(Number of obs)、判定系數(shù)(R-squared)、調(diào)整的判定系數(shù)(Adj R-squared)、F統(tǒng)計量的值、回歸方程標準誤 (Root MSE) 以及其他一些統(tǒng)計量的信息。15 2.predict計算擬合值和殘差predict命令的格式: predict type newvar if in,single_ options指定存儲
9、類型的格式變量名指定需要擬合值還是殘差值,若為resid,則是殘差計算前面所求回歸方程的擬合值和殘差。其命令分別為:predict y1predict e, resid16 3.test進行指定的檢驗test命令主要用來檢驗系數(shù)是否符合一定的關(guān)系.test命令的格式如下:test varl var2var3ktest var=Ctest varl=var2test varl=(var2+var3)/C檢驗多個變量的系數(shù)是否同時為零檢驗變量的系數(shù)是否為C檢驗兩個變量的系數(shù)是否相等檢驗多個變量之間存在的一些關(guān)系用test命令檢驗價格和廣告支出的系數(shù)是否同時為0,其命令為: test price a
10、dvertP值0.05,拒絕原假設(shè),即價格和廣告支出的系數(shù)不同時為017 相關(guān)檢驗和處理相關(guān)檢驗和處理回歸分析時通常需要檢驗數(shù)據(jù)是否存在多重共線、序列相關(guān)和異方差等問題,如果存在這些問題,則需要對其進行處理。1.多重共線性的檢驗和處理1.1stata中多重共線性檢驗的命令格式為:vif /該命令用來得到自變量的方差膨脹因子一般來說,判斷多重共線性的標準是(兩個標準必須同時滿足):*最大的vif大于10;*平均的vif大于1.由判斷標準可知不存在多重共線性18 1.2處理多重共線性的方法1.如果只關(guān)心方程的預測能力,則在整個方程顯著的條件下,可以不必關(guān)心具體的回歸系數(shù)。2.增加樣本容量,剔除導致
11、多重共線性的變量或者修改模型設(shè)定形式。3.對于時間序列樣本,通過使用差分模型可以一定程度上消除原模型中的多重共線性。4.嶺回歸方法。/thread-3035722-1-1.html19 2.異方差的檢驗和處理2.1stata中異方差檢驗的命令格式為:hettest或者imtest, white (懷特檢驗)判斷存在異方差的標準是:命令輸出結(jié)果的P值小于0.05,則拒絕原假設(shè),即存在異方差性。hettest和懷特檢驗輸出結(jié)果的p值均大于0.05故不存在異方差性20 2.2處理異方差性的方法1.在regress命令的options選項中選擇robust選項即
12、可;2.加權(quán)最小二乘法(WLS) 。21 3.序列相關(guān)的檢驗和處理2.1stata中檢驗序列相關(guān)性的方法:1.BG檢驗命令為:estat bgodfrey (默認p=1) estat bgodfrey,lags(p) estat bgodfrey, nomiss0 (使用不添加0的BG檢驗)2.box-pierce Q檢驗/ Ljung-Box Q命令為: reg y x1 x2 x3 predict el, resid wntestq el (使用stata提供的默認滯后期) wntestq el, lags(p) (使用自己設(shè)定的滯后期)3.DW檢驗:現(xiàn)在已經(jīng)不常用,因為其只能檢驗一階自相關(guān)。 命令為: estat dwatson22 3.2stata中處理序列相關(guān)性的方法:1. Newey穩(wěn)健性標準差 newey y x1 x2 x3, lag(p) (滯后階數(shù)必選)2.使用OLS+聚類穩(wěn)健的標準差(cluster robust st
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 標準砂石購銷合同文本
- 糧油采購及供應協(xié)議
- 購銷攝像機合同
- 飼料添加劑采購合同的合同風險防范
- 車庫出租合同書范例
- 云服務(wù)遷移合同
- 項目服務(wù)合同的法律責任認定
- 煤礦安全文明生產(chǎn)與質(zhì)量標準化
- 自駕車服務(wù)暢行無阻
- 家居采購合同的簽訂要點
- 全國第三屆職業(yè)技能大賽(數(shù)字孿生應用技術(shù))選拔賽理論考試題庫(含答案)
- 應用數(shù)理統(tǒng)計知到智慧樹章節(jié)測試課后答案2024年秋中國農(nóng)業(yè)大學
- 大國三農(nóng)II-農(nóng)業(yè)科技版智慧樹知到期末考試答案章節(jié)答案2024年中國農(nóng)業(yè)大學
- JBT 1472-2023 泵用機械密封 (正式版)
- 二級公立醫(yī)院績效考核三級手術(shù)目錄(2020版)
- 6人小品《沒有學習的人不傷心》臺詞完整版
- 部編本小學五年級上冊語文期末考試(選擇題)專項訓練題及答案
- 讀《讓兒童在問題中學數(shù)學》有感范文三篇
- 陳述句改成雙重否定句(課堂PPT)
- 人教版六年級數(shù)學上冊總復習教案
- 自閉癥兒童行為檢核表學前版
評論
0/150
提交評論