stata操作介紹之相關(guān)性分析(課堂PPT)_第1頁(yè)
stata操作介紹之相關(guān)性分析(課堂PPT)_第2頁(yè)
stata操作介紹之相關(guān)性分析(課堂PPT)_第3頁(yè)
stata操作介紹之相關(guān)性分析(課堂PPT)_第4頁(yè)
stata操作介紹之相關(guān)性分析(課堂PPT)_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、三、線性回歸分析1 v相關(guān)性分析v回歸分析v多重共線性等相關(guān)檢驗(yàn)和處理2 線性回歸分析的stata應(yīng)用實(shí)例本部分用到的實(shí)例是Big Andys Burger Barn的銷售模型。Big Andy的漢堡銷售收入取決于單價(jià)和廣告支出水平 。因此,這個(gè)模型包含兩個(gè)解釋變量和一個(gè)常數(shù)項(xiàng)。其中,sales為指定城市的月銷售額并以千美仄元度量,price是以美元度量的單個(gè)漢堡的價(jià)格,advert為廣告支出,同樣以千美元度量。sales= 1 +2*price +3*advert+ 3 相關(guān)性分析相關(guān)性分析相關(guān)性分析主要目的是研究變量之間關(guān)系的密切程度。相關(guān)性分析的方法主要有:Pearson相關(guān)系數(shù)分析、K

2、endall T相關(guān)系數(shù)分析、Spearman秩相關(guān)系數(shù)分析以及偏相關(guān)系數(shù)分析。1. Pearson相關(guān)系數(shù)分析Pearson相關(guān)性分析是一個(gè)描述線性相關(guān)強(qiáng)度的量,取值于一1和1之間。 Pearson相關(guān)性分析的命令格式:correlate varlist if in weight ,correlate_ options pwcorr varlist if in weight ,correlate_ options correlate盡可能使用兩兩變量中所有沒有缺失的數(shù)據(jù)pwcorr只采用沒有任何缺失數(shù)據(jù)的完整觀測(cè)值4 correlate選項(xiàng)說明pwcorr選項(xiàng)說明5 用pwcorr命令實(shí)現(xiàn)所

3、有變量的Pearson相關(guān)系數(shù)分析,并在顯著性水平超過0.05的相關(guān)系數(shù)上打上星號(hào),其命令為: pwcorr , sig star(0.05)6 2. Kendall T相關(guān)系數(shù)分析Kendall T相關(guān)性分析是一個(gè)非參數(shù)度量變量間的相關(guān)性,其取值在一1和1之間。 Kendall T相關(guān)性分析的命令格式:ktau varlist if in weight , ktau _ options 7 用ktau命令實(shí)現(xiàn)所有變量的Kendall T相關(guān)系數(shù)分析,并在顯著性水平超過0.05的相關(guān)系數(shù)上打上星號(hào),其命令為: ktau , star(0.05)8 3. Spearman秩相關(guān)系數(shù)分析Spear

4、man秩相關(guān)性分析也是一種不依賴于總體分布的非參數(shù)檢驗(yàn),取值也在一1和1之間。 Spearman秩相關(guān)性分析的命令格式:spearman varlist if in weight , spearman _ options 9 用spearman命令實(shí)現(xiàn)所有變量的Spearman秩相關(guān)系數(shù)分析,并在顯著性水平超過0.05的相關(guān)系數(shù)上打上星號(hào),其命令為:spearman, star(0.05)10 4.偏相關(guān)系數(shù)分析雙變量相關(guān)分析是研究?jī)蓚€(gè)變量之間的相關(guān)關(guān)系,有時(shí)在分析兩個(gè)變量之間相關(guān)關(guān)系時(shí),往往會(huì)有其他變量的影響因素混合在里面,此時(shí)計(jì)算出來的相關(guān)系數(shù)可能并不能真正反映兩個(gè)變量之間的關(guān)系。偏相關(guān)性

5、分析的命令格式: pcorr varnamel varlist if in weight11 用pcorr命令實(shí)現(xiàn)偏相關(guān)分析,其命令為: pcorr, sales price advert12 回歸分析回歸分析 回歸分析時(shí)常用的Stata 命令有:regress , predict, test命令。regress, predict, test 是一組命令,它們完成各種簡(jiǎn)單和多元的普通最小二乘法回歸。1.regress實(shí)現(xiàn)因變量對(duì)自變量的回歸regress命令的格式: regress depvar indepvarsif in weight options因變量自變量13 實(shí)現(xiàn)因變量為銷售收入,

6、自變量為單價(jià)和廣告支出的線性回歸,其命令為: regress sales price advert表下方區(qū)域?yàn)榛镜幕貧w結(jié)果。第1列依次為被解釋變量sales,解釋變量price、advert,截距項(xiàng)constant;第2列回歸系數(shù);第3列回歸系數(shù)的標(biāo)準(zhǔn)誤;第4列回歸系數(shù)的 t 統(tǒng)計(jì)量值;第5列p值;第6列95%的置信區(qū)間14 表左上方區(qū)域?yàn)榉讲罘治霰怼5?列從上到下依次為回歸平方和(SSE)、殘差平方和(SSR)和總離差平方和(SST);第3列為自由度,分別為k=2,n-k-1=75-2-1=72,n-1=75-1=74;第4列為均方和(MSS),由各項(xiàng)平方和除以相應(yīng)的自由度得到。表右上方區(qū)

7、域給出了樣本數(shù)(Number of obs)、判定系數(shù)(R-squared)、調(diào)整的判定系數(shù)(Adj R-squared)、F統(tǒng)計(jì)量的值、回歸方程標(biāo)準(zhǔn)誤 (Root MSE) 以及其他一些統(tǒng)計(jì)量的信息。15 2.predict計(jì)算擬合值和殘差predict命令的格式: predict type newvar if in,single_ options指定存儲(chǔ)類型的格式變量名指定需要擬合值還是殘差值,若為resid,則是殘差計(jì)算前面所求回歸方程的擬合值和殘差。其命令分別為:predict y1predict e, resid16 3.test進(jìn)行指定的檢驗(yàn)test命令主要用來檢驗(yàn)系數(shù)是否符合一定

8、的關(guān)系.test命令的格式如下:test varl var2var3ktest var=Ctest varl=var2test varl=(var2+var3)/C檢驗(yàn)多個(gè)變量的系數(shù)是否同時(shí)為零檢驗(yàn)變量的系數(shù)是否為C檢驗(yàn)兩個(gè)變量的系數(shù)是否相等檢驗(yàn)多個(gè)變量之間存在的一些關(guān)系用test命令檢驗(yàn)價(jià)格和廣告支出的系數(shù)是否同時(shí)為0,其命令為: test price advertP值0.05,拒絕原假設(shè),即價(jià)格和廣告支出的系數(shù)不同時(shí)為017 相關(guān)檢驗(yàn)和處理相關(guān)檢驗(yàn)和處理回歸分析時(shí)通常需要檢驗(yàn)數(shù)據(jù)是否存在多重共線、序列相關(guān)和異方差等問題,如果存在這些問題,則需要對(duì)其進(jìn)行處理。1.多重共線性的檢驗(yàn)和處理1.1

9、stata中多重共線性檢驗(yàn)的命令格式為:vif /該命令用來得到自變量的方差膨脹因子一般來說,判斷多重共線性的標(biāo)準(zhǔn)是(兩個(gè)標(biāo)準(zhǔn)必須同時(shí)滿足):*最大的vif大于10;*平均的vif大于1.由判斷標(biāo)準(zhǔn)可知不存在多重共線性18 1.2處理多重共線性的方法1.如果只關(guān)心方程的預(yù)測(cè)能力,則在整個(gè)方程顯著的條件下,可以不必關(guān)心具體的回歸系數(shù)。2.增加樣本容量,剔除導(dǎo)致多重共線性的變量或者修改模型設(shè)定形式。3.對(duì)于時(shí)間序列樣本,通過使用差分模型可以一定程度上消除原模型中的多重共線性。4.嶺回歸方法。/thread-3035722-1-1.html19 2.異方差的檢

10、驗(yàn)和處理2.1stata中異方差檢驗(yàn)的命令格式為:hettest或者imtest, white (懷特檢驗(yàn))判斷存在異方差的標(biāo)準(zhǔn)是:命令輸出結(jié)果的P值小于0.05,則拒絕原假設(shè),即存在異方差性。hettest和懷特檢驗(yàn)輸出結(jié)果的p值均大于0.05故不存在異方差性20 2.2處理異方差性的方法1.在regress命令的options選項(xiàng)中選擇robust選項(xiàng)即可;2.加權(quán)最小二乘法(WLS) 。21 3.序列相關(guān)的檢驗(yàn)和處理2.1stata中檢驗(yàn)序列相關(guān)性的方法:1.BG檢驗(yàn)命令為:estat bgodfrey (默認(rèn)p=1) estat bgodfrey,lags(p) estat bgodf

11、rey, nomiss0 (使用不添加0的BG檢驗(yàn))2.box-pierce Q檢驗(yàn)/ Ljung-Box Q命令為: reg y x1 x2 x3 predict el, resid wntestq el (使用stata提供的默認(rèn)滯后期) wntestq el, lags(p) (使用自己設(shè)定的滯后期)3.DW檢驗(yàn):現(xiàn)在已經(jīng)不常用,因?yàn)槠渲荒軝z驗(yàn)一階自相關(guān)。 命令為: estat dwatson22 3.2stata中處理序列相關(guān)性的方法:1. Newey穩(wěn)健性標(biāo)準(zhǔn)差 newey y x1 x2 x3, lag(p) (滯后階數(shù)必選)2.使用OLS+聚類穩(wěn)健的標(biāo)準(zhǔn)差(cluster robust standard error)面板數(shù)據(jù)中經(jīng)常使

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論