STATA在實(shí)證研究中的應(yīng)用_第1頁
STATA在實(shí)證研究中的應(yīng)用_第2頁
STATA在實(shí)證研究中的應(yīng)用_第3頁
STATA在實(shí)證研究中的應(yīng)用_第4頁
STATA在實(shí)證研究中的應(yīng)用_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

OutlineSTATA數(shù)據(jù)分析基礎(chǔ)1簡單回歸分析及STATA應(yīng)用2內(nèi)生性及STATA處理方法3DiscreteChoiceModel及STATA應(yīng)用4STATA數(shù)據(jù)分析基礎(chǔ)軟件名稱最新版本安裝文件大小SAS9.1.33GSPSS15.01CDStata10.094MGAUSS8.025M計(jì)量經(jīng)濟(jì)學(xué)專用Limdep/Nlogit9.0/4.03MShazam10.090MEviews6.0100MWinrat6.021MTSP5.0Rfree30MSTATA數(shù)據(jù)分析基礎(chǔ)Stata是一個(gè)用于分析和管理數(shù)據(jù)的功能強(qiáng)大又小巧玲瓏的實(shí)用統(tǒng)計(jì)分析軟件,由美國計(jì)算機(jī)資源中心(ComputerResourceCenter)研制。從1985到現(xiàn)在,已連續(xù)推出1.1,1.2,1.3,1.4,1.5,……及2.0,2.1,3.0,3.1,4.0,5.0,6.0,7.0.,8.0,9.0.,10.0等多個(gè)版本。Stata里不要修改原始數(shù)據(jù),不可恢復(fù)STATA數(shù)據(jù)分析基礎(chǔ)Stata主要功能數(shù)據(jù)管理功能統(tǒng)計(jì)分析功能統(tǒng)計(jì)分析:描述統(tǒng)計(jì)、交叉表格回歸分析:OLS,2SLS,Logit,Probit,Tobit,Heckman,GMM,Paneldata,Timeseries,Surveydata多變量分析:multivariateregression,clusteranalysis,抽樣和模擬:繪圖功能編程和矩陣運(yùn)算功能STATA數(shù)據(jù)分析基礎(chǔ)Stata軟件的特點(diǎn)Stata功能強(qiáng)大Stata軟件小巧Stata操作靈活、簡單,易學(xué)易用Stata編程語言簡單,容易上手Stata功能更新快STATA數(shù)據(jù)分析基礎(chǔ)三類文件數(shù)據(jù)文件:*.dta程序文件:*.do結(jié)果文件:*.log四個(gè)窗口和1個(gè)程序編輯器STATA數(shù)據(jù)分析基礎(chǔ)STATA的界面ResultWindowCommandWindowReviewWindowVariableWindowButtonsSTATA數(shù)據(jù)分析基礎(chǔ)STATA的界面Buttons:open,save,print,openlogfile,openviewer,bringresultswindowtofront,bringgraphwindowtofront,opendo-file,editwindow,browsewindow,continue,breakSTATA數(shù)據(jù)分析基礎(chǔ)Stata的運(yùn)行方式菜單操作:執(zhí)行菜單操作后,在結(jié)果窗口能夠顯示命令行和命令的結(jié)果命令行操作:在命令窗口中直接寫入命令,一次只能寫一行命令程序操作:利用doedit編輯do文件,執(zhí)行批量的命令STATA數(shù)據(jù)分析基礎(chǔ)如何導(dǎo)入數(shù)據(jù)直接輸入(通過edit窗口)粘貼數(shù)據(jù)(通過edit窗口)容易出錯(cuò)用命令從外部文件導(dǎo)入(insheet命令)insheet命令:Insheetusingfilename,options通過option指定外部文件類型Excel的sls文件不能直接讀取如何導(dǎo)出數(shù)據(jù)粘貼使用outsheet命令STATA數(shù)據(jù)分析基礎(chǔ)如何保存數(shù)據(jù)Save命令如何調(diào)用數(shù)據(jù)Use命令Usefilename,options查看內(nèi)存中的數(shù)據(jù)Browse命令List命令order命令STATA數(shù)據(jù)分析基礎(chǔ)練習(xí)數(shù)據(jù)導(dǎo)入STATA數(shù)據(jù)分析基礎(chǔ)do-file什么是do-file?通俗來說,do-file就是STATA命令和程序的記事本。使用do-file的理由?可追溯過往操作可以整合龐雜的命令,減少命令輸入便于發(fā)現(xiàn)錯(cuò)誤怎么打開do-file?ButtonDo-file中做注釋程序前打*號,換行///STATA數(shù)據(jù)分析基礎(chǔ)do-file如何寫do-file?規(guī)范的do-file應(yīng)該包括哪些內(nèi)容第一步:清理內(nèi)存,clear第二步:設(shè)定內(nèi)存,setmemory第三步:指定路徑cd:f/research/stata/….Use打開文件(比Globallibname方便)Globallibname“文件夾路徑”,用$libname代替該路徑第四部:打開log:CaplogcloseLogusingfilenameLog的暫停和開啟,logon/logoff查看log:viewd:\stata\data\auto.logclearsetmemory50mcd"F:\stataseminar\practisedata"caplogcloselogusingzheda.loglogonuse2006.datauseruralincome.dta,clearsumruralincomeviewzheda.logSTATA數(shù)據(jù)分析基礎(chǔ)數(shù)據(jù)的初步處理If語句,in語句和by語句生成新變量generate和egen(egen后面可以跟函數(shù),比generate功能強(qiáng)大)改名字Rename替換ReplaceSTATA中的邏輯運(yùn)算符And/or:&/|等于“==”,不等于“!=”(負(fù)值=)STATA數(shù)據(jù)分析基礎(chǔ)代數(shù)運(yùn)算邏輯運(yùn)算比較關(guān)系+加!不>大于-減~不<小于*乘|或>=不小于/除&和<=不大于^指數(shù)==等于sqrt()開方!=不等于~=不等于~=不等于+字符相加STATA數(shù)據(jù)分析基礎(chǔ)數(shù)據(jù)的初步處理刪除/保留變量或者觀測Drop/keep排序Sort與gsort的區(qū)別(gsort可以設(shè)置排序,多個(gè)變量排序)gsortvariable,option(降序在變量前加-)gsort-yearcode,generate(order)合并數(shù)據(jù)Merge(兩個(gè)或多個(gè)文件必須有一個(gè)唯一對應(yīng)的默認(rèn)值建立鏈接關(guān)系)

save2004_2006.dtasortyearcodesave,replacefile2004_2006.dtasaveduseruralincome.dta,clearsortyearcodemergeyearcodeusing2004_2006.dta需要檢查variables窗口是不是有1,2的情況存在,如果存在需要重新檢查續(xù)接數(shù)據(jù)Appenduse2004_2005.dta,clearappendusing2006.dtaSTATA數(shù)據(jù)分析基礎(chǔ)數(shù)據(jù)的初步處理貼標(biāo)簽LabelLabeldataLabelvardes(顯示命令)labelvarcode"省代碼“l(fā)abeldata"農(nóng)村收入“des

面板數(shù)據(jù)與截面數(shù)據(jù)轉(zhuǎn)換Reshapelongreshapewideruralincome,i(code)j(year)面板到截面Reshapewidereshape

longruralincome,i(code)j(year)截面到面板“壓縮”數(shù)據(jù)(如取平均值)Collapsecollapse(mean)ruralincome,by(code)STATA數(shù)據(jù)分析基礎(chǔ)數(shù)據(jù)的初步處理STATA中常用的operator生成dummyXi:i.year_n與_N的區(qū)別(_N默認(rèn)最大值)面板數(shù)據(jù)tssetcodeyear告訴stata是面板數(shù)據(jù),然后使用下面功能滯后算子l.差分算子d.截面數(shù)據(jù)滯后與滯前[_n+1][_n-1]bysortcode:gentry1=ruralincome[_n-1]bysort是通過code相同的變量才進(jìn)行命令STATA數(shù)據(jù)分析基礎(chǔ)練習(xí)數(shù)據(jù)處理STATA數(shù)據(jù)分析基礎(chǔ)STATA的描述統(tǒng)計(jì)功能Summarize—最常用的描述統(tǒng)計(jì)命令均值、方差、百分位數(shù)、最大值、最小值……usefinal.dta,clearsumTable—功能強(qiáng)大的表格統(tǒng)計(jì)命令(常用)多變量表、多變量表……Tabulate—簡寫為tab,是table的簡化版Count—數(shù)數(shù)命令Correlate—相關(guān)系數(shù)Pwcorr—correlate姊妹版Corr可以報(bào)告協(xié)方差,pwcorr可以報(bào)告p值(p值表示兩變量在多大的顯著程度上是相關(guān)的)Corr刪除所有缺失值,pwcorr僅刪除pairwise中的缺失值STATA數(shù)據(jù)分析基礎(chǔ)STATA的描述統(tǒng)計(jì)功能—畫圖直方圖Histogram,options(kden,normal)分布檢驗(yàn)的圖形QQ圖—qnorm,pnorm對稱分布—symplot均勻分布—quantile數(shù)學(xué)變換后的分布檢驗(yàn)—qladderSTATA數(shù)據(jù)分析基礎(chǔ)STATA的描述統(tǒng)計(jì)功能—畫圖Graph命令Graphbar/box/dot/pieGraphtwoway(雙變量圖)Graphtwowayline/scatter/connected(連線圖)……Graphmatrix(多個(gè)變量矩陣圖)STATA數(shù)據(jù)分析基礎(chǔ)練習(xí)數(shù)據(jù)的描述性統(tǒng)計(jì)簡單回歸分析與STATA應(yīng)用OLS的五個(gè)經(jīng)典假設(shè)1線形模型假設(shè)Y=Xβ+u2樣本隨機(jī)3E(u|x)=04不存在完全共線性5同方差假設(shè)其中前四個(gè)假設(shè)保證OLS估計(jì)量無偏,加上第五個(gè)假設(shè),使得OLS成為BLUE(BestLinearUnbiasedEstimator)如果假設(shè)不再滿足,則需要新的估計(jì)方法。簡單回歸分析與STATA應(yīng)用STATA的應(yīng)用估計(jì)命令Regdependentindependent,options預(yù)測值Predictnewvariable,option(xb,residuals)保存回歸結(jié)果eststore/drop/restoreusefinal.dtagenen=food/expenditureregruralincomeenpredictresidhat,residualseststoreols簡單回歸分析與STATA應(yīng)用STATA的應(yīng)用輸出回歸結(jié)果outregusing文件名,coefastrp3asterreplaceoutregusingoutcome.doc,3asterreplaceoutregusing文件名,coefastrse3asterappendoutregusingoutcome.doc,3asterappendoptioncoefastr:給系數(shù)加星號P:系數(shù)下面標(biāo)P值Se:系數(shù)下面標(biāo)標(biāo)準(zhǔn)誤差3aster:加3個(gè)星號,1%,5%,10%簡單回歸分析與STATA應(yīng)用各種統(tǒng)計(jì)檢驗(yàn)在STATA中的實(shí)現(xiàn)總體均值的檢驗(yàn)ttest總體方差的檢驗(yàn)sdtest相關(guān)性檢驗(yàn)Pwcorr正態(tài)分布檢驗(yàn)sktest/swilk簡單回歸分析與STATA應(yīng)用OLS中涉及的檢驗(yàn)回歸系數(shù)的檢驗(yàn)線性檢驗(yàn)Test非線性檢驗(yàn)testnl異方差estathettest多重共線性多重共線性的表現(xiàn):擬合優(yōu)度很大,但是系數(shù)顯著程度很低檢驗(yàn):系數(shù)之間的相關(guān)系數(shù),膨脹系數(shù)檢驗(yàn)(vif)解決:增加樣本容量,刪除共線變量,重新設(shè)定模型簡單回歸分析與STATA應(yīng)用練習(xí)OLS的STATA操作內(nèi)生性及STATA處理方法什么是內(nèi)生性公式上來說,內(nèi)生性會導(dǎo)致OLS的經(jīng)典假設(shè)E(u|x)=0不再成立,從而導(dǎo)致估計(jì)量不再一致。邏輯上來講,內(nèi)生性是因?yàn)榻忉屪兞颗c殘差相關(guān),而這意味著被解釋變量也會影響解釋變量,從而無法確定實(shí)證研究中常常關(guān)心的因果關(guān)系。內(nèi)生性產(chǎn)生的原因:測量誤差而e和u有關(guān)系遺漏重要變量反向因果關(guān)系內(nèi)生性及STATA處理方法什么是工具變量法工具變量法就是尋找一個(gè)外生的沖擊,來識別內(nèi)生變量對于被解釋變量的影響XYuIV內(nèi)生性及STATA處理方法IV選取的幾個(gè)標(biāo)準(zhǔn)IV⊥Y(iv與y無關(guān))IV與X相關(guān)IV選取的幾個(gè)例子教育與工資wage=f(educ,others)然而工資和教育可能都會受個(gè)人能力的影響,比如智商,內(nèi)生性問題出現(xiàn)了。第一個(gè)IV,母親的教育程度第二個(gè)IV,出生的季度Whichisbetter?內(nèi)生性及STATA處理方法IV選取的幾個(gè)例子教育與工資第一個(gè)IV,與educ關(guān)系密切,however,可能不是一個(gè)外生的iv第二個(gè)IV,是個(gè)外生的IV,however,可能與educ的關(guān)系不大,尤其是高學(xué)歷的人。入學(xué)法要求7歲才可上學(xué),同時(shí)要求年滿16歲才可以退學(xué)出生上學(xué)退學(xué)教育時(shí)間1990.1.11997.9.12006.1.17y4m1989.12.311996.9.12005.12.308y4m內(nèi)生性及STATA處理方法IV選取的幾個(gè)例子服兵役對收入的影響Income=f(serving,others)Serving和income可能與個(gè)人能力有關(guān),內(nèi)生性!draftlottery,對1月1日-12月31日,每天隨機(jī)賦1-365的整數(shù)。只有小于90才有資格當(dāng)兵。IV,draftlottery是否小于90內(nèi)生性及STATA處理方法兩階段最小二乘法(2SLS)第一階段,用其他解釋變量和工具變量回歸內(nèi)生變量第二階段,用第一階段得到的擬合值,運(yùn)行最初的方程常用的檢驗(yàn)關(guān)于IV的檢驗(yàn)Overidtest(檢驗(yàn)iv是否外生,原假設(shè)iv是外生的,工具變量數(shù)必須大于內(nèi)生變量數(shù))顯著性檢驗(yàn)(lv是否與x有直接關(guān)系)關(guān)于內(nèi)生性是否存在的檢驗(yàn)HausmantestHausmantest檢驗(yàn)結(jié)果2slsols如果一致則無內(nèi)生性內(nèi)生性及STATA處理方法有內(nèi)生性無內(nèi)生性O(shè)LSInconsistentBLUE2SLSConsistentConsistentlessefficient兩階段最小二乘法(2SLS)關(guān)于內(nèi)生性是否存在的檢驗(yàn)(ols和2sls的結(jié)果不一致就說明存在內(nèi)生性,把永遠(yuǎn)是一致的結(jié)果放在第一位{2sls},可能不不一致的放在第二位{ols})Hausmantest內(nèi)生性及STATA處理方法SeemingUncorrelatedRegression(SUR)內(nèi)生性及STATA處理方法方程組xandyendogenousvar(內(nèi)生變量),zpredeterminedvar(外生變量)(前定變量個(gè)數(shù)=內(nèi)生變量個(gè)數(shù)-1)前定變量個(gè)數(shù)>內(nèi)生變量個(gè)數(shù)-1則過度識別識別問題估計(jì)問題Reduceform(用前定變量表示內(nèi)生變量)Structureform2SLSRunendogenousvaronpredeterminedvarUsingfittedvalue,runstructureform內(nèi)生性及STATA處理方法RecursiveModel內(nèi)生性及STATA處理方法GeneralizedLeastSquareOls是GLS的一個(gè)特例內(nèi)生性及STATA處理方法3SLSStepone:treatendogeneity(y和z1,z2,IV1,IV2回歸;X和z1,z2,IV1,IV2回歸)Steptwo:estimateStepthree:identifysystemequations文章講評Challenging,complementingorassuming‘theMandateofHeaven’?Politicaldistrustandtheriseofself-governingsocialorganizationsinruralChina文章講評H1:Otherthingsbeingequal,villagers’politicaldistrustinlocalgovernmentsincreasestheirparticipationrateinself-governingsocialorganizations.H2:Otherthingsbeingequal,higherlevelofpublicgoodsinvestmentandelectionquality(a)directlyreducesvillagers’participationrateand(b)indirectlyreducesvillagers’participationrateviathechannelofincreasedpoliticaltrustinlocalgovernments.文章講評H3:Otherthingsbeingequal,(a)tensionbetweensub-villagelineagegroupsreducesvillagers’participationrateand(b)thenumberofancestralhalls/templesispositivelycorrelatedwithvillagers’participationrateinself-governingsocialorganizations.文章講評文章講評文章講評文章講評農(nóng)民組織對村莊公共融資的影響:掣肘還是助推?——農(nóng)村稅費(fèi)體制改革前后農(nóng)民負(fù)擔(dān)變化的啟示文章講評文章講評內(nèi)生性及STATA處理方法練習(xí)2SLS和3SLS的STATA操作LimitedDependentVarModelUnlimitedDependentLimitedDependentNoncategoric

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論