初級計量作業(yè)stata常用命令_第1頁
初級計量作業(yè)stata常用命令_第2頁
初級計量作業(yè)stata常用命令_第3頁
初級計量作業(yè)stata常用命令_第4頁
初級計量作業(yè)stata常用命令_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

formatx1%10.3f——將x110,小數(shù)點(diǎn)后取三位formatx1%10.3gx110,有效數(shù)字取三位formatx1%10.3ex110,采用科學(xué)formatx1%10.3fc——將x110,小數(shù)點(diǎn)后取三位,加入千分位分隔符formatx1%10.3gcx110,有效數(shù)字取三位,加入千分位分隔符use"C:\ sandSettings\xks\桌面\2006.dta",clearmergeusing"C:\ sandSettings\xks\桌面\1999.dta"use sandSettings\xks\桌面\2006.dtamergeidusing sandSettings\xks\桌面\1999.dtaunique(unique建議采用第法。sample50%的樣本,其余刪除sample50,count50個樣本,其余刪除browsex1x2ifx3>3(按所列變量與條件打開數(shù)據(jù)查看器editx1x2ifx3>3(按所列變量與條件打開數(shù)據(jù)編輯器)one-to-one數(shù)據(jù)源自statatutorial中的exampw1和第一步:將exampw1按v001~v003這三個編碼排序,并建立臨時數(shù)據(jù)庫tempw1uset:\statatut\exampw1.dta"su——summarize的簡寫sortv001v002v003save第二步:對exampw2use"t:\statatut\exampw2.dta"sortv001v002v003savetempw2第三步:使用tempw1數(shù)據(jù)庫,將其與tempw2usemergev001v002v003usingta_mergetabulate_mergeerasetempw1.dtaerasetempw2.dtadrop_merge數(shù)據(jù)源自statatutorial中的fac19和newfacuse"t:\statatut\fac19.dta"taregionappendusing"t:\statatut\newfac"taregion莖stemx1,line(2)(做x1的莖,每一個十分位的樹莖都被拆分成兩段來顯示,前半段為0~45~9)stemx1,width(2)(做x1的莖,每一個十分位的樹莖都被拆分成五段來顯示,每個小樹莖2)stemx1,round(100)(將x1除以100后再做x1的莖)采用autohistogrammpg,discretefrequencynormalx軸,1和5為值,(1)為單位histogramprice,fraction(fractionyfrequencyfraction這兩個選擇之外,該命令可替換為“percent”百分比,和“density”discrete就表示將price當(dāng)作連續(xù)變量來繪圖)histogramprice,percentby(foreign)histogrammpg,discreteby(foreign,histogrammpg,discretepercentby(foreign,total)graphtwowaylfitpriceweight||scatterprice(作出priceweight的回歸線圖——“l(fā)fit”priceweight的散點(diǎn)圖相疊加twowayscatterprice(做priceweight的散點(diǎn)圖,并在每個點(diǎn)上標(biāo)注“make”,即廠商的取值twowayscatterpriceweight||lfitprice(foreignpriceweight做散點(diǎn)圖和回歸線圖的疊加,twowayscatterpriceweight||lfitprice(foreignpriceweight做散點(diǎn)圖和回歸線圖的疊加,twowayscatterpriceweight[fweight=dis(畫出price和weight的散點(diǎn)圖,“msybol(oh表示每個點(diǎn)均為中空的圓圈,[fweight=discement]表示每個點(diǎn)的大小與discement的取值大小成比例)twowayconnectedy1time,yaxis(1)||y2(畫出y1和y2這兩個變量的時間點(diǎn)線圖,并將它們疊加在一個圖中,左邊“yaxis(1)”y1的度量,右邊“yaxis(2)”y2的)twowayliney1time,yaxis(1)||y2graphtwowayscattervar1var4||scattervar2var4||scattervar3graphtwowaylinevar1var4||linevar2var4||linevar3graphtwowayconnectedvar1var4||connectedvar2var4||connectedvar3graphmatrixabcgraphmatrixabc用auto數(shù)據(jù)集:graphmatrixpricempgweightlength,halfby(foreign,totalcol(1)(foreignprice等四個變量的散點(diǎn)圖矩陣,要求繪出總圖,并上下排graphboxy,over(x)(對應(yīng)x的每一個取值構(gòu)建y的箱型圖,并在y0.22處劃一條水平線graphbar(mean)對應(yīng)xy“mean”mediansumsd、p25、p75等graphbara1a2,over(b)(ba1a2的條形圖,a1a2graphdot(畫點(diǎn)圖,沿著水平刻度,在x的每一個取值水平所對應(yīng)的y的中位數(shù)上打點(diǎn)qnormrcharta1a2(畫出質(zhì)量控制Ra1a3的取值范圍ameans(計算變量x的算術(shù)平均值、幾何平均值和簡單調(diào)和平均值,均顯示樣本量和置信區(qū)間meanvar1[pweight=summarizeyx1statasummarizeskewnesskurtosisECELL有較大差異,建議不采用statasummarizevar1[aweight=var2],tabstatX1,stats(meannqmaxminsdvar(X1的算術(shù)平均值、樣本量、四分位線、最大最小值、標(biāo)準(zhǔn)差、方差和變異系數(shù))webusebitest(假設(shè)每次得到成功案例‘1’0.3quick所顯示的二項分布情況下,各種bitestidisy.disy.disy.disydisy.(計算在樣本總量為10,成功案例為3的樣本總體中,不重抽取4個樣本,其中有小于或2個為成功案例的概率)step1.用codebook、summarize、histogram、graphboxs、graphmatrix、stem看檢驗數(shù)據(jù)的codebookyx1x2summarizeyx1x2,detailgraphboxx1(箱圖graphmatrixyx1x2,half(畫出各個變量的兩兩x-y圖stemx1(做x1的莖step2.用tabulate、list細(xì)致尋找tabulatecodeifx1==值(作出x1等于值時code的頻數(shù)分布表,code表示地區(qū)、年份listcodeifx1==值(直接列出x1等于值時code的值,當(dāng)x1的錯誤過多時,不建議使listin20/l(l表示lastone,-202020個到倒數(shù)第step3.用rece命令替換recex1=?ifx1==值keepify<1000dropify>1000sortxgsort(對數(shù)據(jù)按x進(jìn)行升序排列g(shù)sort-(對數(shù)據(jù)按x進(jìn)行降序排列g(shù)sort-x,generate(id)(對數(shù)據(jù)按xid)orderyx3x1(將變量按照y、x3、x1、x2的順序排列)genx1`=exp(logx1)(將logx1數(shù)化genr61_100=1ifrank>=61&rank<=100(rank61100r61_100的取值1,其他為缺失值)00)genabs(x)(取x的絕對值)gentrunc(x)(x的整數(shù)部分genround(x)(x進(jìn)行四舍五入genround(x,y)(y為單位,對x進(jìn)行四舍五入gensqrt(x)(x的平方根genmod(x,y)(x/y的余數(shù)genreldif(x,y)(x與y的相對差異,即|x-genx=autocode(x,n,xmin,xmax)(x的值域,即xmax-xmin,分為等距的n份)genx=cond(x1>x2,x1,x2)(x1>x2成立,則取x1x1>x2不成立,則取x2)sortxgengx=group(n)(x分為盡量等規(guī)模的n個組egenzx1=std(x1),m(0s(1)(x101)egensdx1=sd(x1)(x1的標(biāo)準(zhǔn)差)egenmaxx1=max(x1)(最大值)egenminx1=min(x1)(最小值)egenmedx1=med(x1)(中數(shù))egenmodex1=mode(x1)(眾數(shù))egenrowsd=sd(x1x2x3)(得出x1、x2和x3聯(lián)合的標(biāo)準(zhǔn)差egenrowmean=mean(x1x2x3)(得出x1、x2和x3聯(lián)合的平均值egenrowmax=max(x1x2x3)(聯(lián)合最大值)egenrowmin=min(x1x2x3)(聯(lián)合最小值)egenrowmed=med(x1x2x3)(聯(lián)合中數(shù))egenrowmode=mode(x1x2x3)(聯(lián)合眾數(shù))egenrowtotal=total(x1x2x3)(聯(lián)合總數(shù))egenxrank=rank(x)(x各個值排序的情況下,獲得反映x值大小排序的xrank)數(shù)據(jù)計算器disy命令:disyx[12](顯示x的第十二個觀察值disychi2(n,x)(自由度為n的累計卡方分布disychi2tail(n,x)(自由度為n的反向累計卡方分布,chi2tail(n,x)=1-chi2(n,x))disyinvchi2(n,p)(卡方分布的逆運(yùn)算,若chi2(n,x)=p,那么invchi2(n,p)=x)disyinvchi2tail(n,p)(chi2tail的逆運(yùn)算)disyF(n1,n2,f)(分子、分母自由度分別為n1和n2的累計F分布disyFtail(n1,n2,f)(分子、分母自由度分別為n1和n2的反向累計F分布)disyinvF(n1,n2,P)(F分布的逆運(yùn)算,若F(n1,n2,f)=p,那么invF(n1,n2,p)=f)disyinvFtail(n1,n2,p)(Ftail的逆運(yùn)算)disytden(n,t)(自由度為n的t分布)disyttail(n,t)(自由度為n的反向累計t分布)disyinvttail(n,p)(ttail的逆運(yùn)算)labeldata~~~"(對現(xiàn)用的數(shù)據(jù)庫做標(biāo)記,"~~~"就是標(biāo)記,可自行填寫)labelvariablex"~~~"(對變量x做標(biāo)記)labelvaluesxlabel1(賦予變量x一組labeldefinelabel11"a1"2"a2"(定義的具體內(nèi)容:當(dāng)x=1時,標(biāo)記為a1,當(dāng)x=2時,標(biāo)a2)tabulatetab1x1-x7,sort(x1到x7的頻數(shù)表,并按照頻數(shù)以降序顯示行tablec1,c(nx1meanx1sdx1(c1的不同水平上列出x1的樣本量和平均值)autotablerep78foreign,c(nmpgmeanmpgsdmpgmedianmpg)centerrow元格中間,row表示計算行變量整體的統(tǒng)計量,col表示計算列變量整體的統(tǒng)計量)tabulatex1(做x1和x2的二維交互表,要求顯示獨(dú)立性檢驗chi2、似然比卡方獨(dú)立性檢驗lrchi2、對定序變量適用的等級相關(guān)系數(shù)g 和taub、以及對名義變量適用的V)tabulatex1x2,columnchi2(x1和x2的二維交互表,要求顯示列百分比和行變量和列變量的tab2x1-x7,allnofreq(x1到x7這七個變量兩兩地做二維交互表,不顯示頻數(shù):nofreq)byx3,sort:tabulatex1x2,nofreqcolchi2(同時進(jìn)行x3的每一個取值內(nèi)的x1和x2的二維交互tablex1x2x3,c(ferqmeanx1meanx2meanx3)tabstatX1X2,by(X3)stats(meannqmaxminsdvarcv)tabstatX1X2,by(X3)stats(meanrangeqsdvarcvp5p95median),[aw=X4](X4ttestX1=1countifX1==0countifgenX2=1ifcorrx1x2x3(做x1、x2、x3的相關(guān)系數(shù)表swilkx1x2x3(用Shapiro-WilkWtest對x1、x2、x3進(jìn)行正太性分析)sktestx1x2x3(對x1、x2、x3進(jìn)行正太性分析,可以求出峰度和偏度)ttestx1=x2(對x1、x2的均值是否相等進(jìn)行T檢驗)ttestx1,by(x2unequal(按x2的分組方式對x1進(jìn)行T檢驗,假設(shè)方差不齊性sdtestx1,by(x2)(按x2的分組方式對x1進(jìn)行方差齊性檢驗clusterkmeansyx1x2x3,——依據(jù)y、x1、x2、x3,將樣本分為nclusterkmeansyx1x2x3,k(3)measure(L1)"start"用于確定聚類的核,"everykth"表示將通過構(gòu)造三組樣本獲得聚類核:構(gòu)造方法為將方法,"L1"表示采用歐式距離的絕對值,也直接可采用歐式距離(L2)和歐式距離的平方(L2squaredsortc1c2(對c1和c2兩個分類變量排序byc1c2:regyx1x2x3(在c1、c2的各個水平上分別進(jìn)行回歸bysortc1c2:regyx1x2x3ifc3=1(逗號前面相當(dāng)于將上面兩步驟合一,既排序又回歸,逗號后面的“ifc3=1”表示只有在c3=1的情況下才進(jìn)行回歸)stepwise,pr(.2):regyx1x2x3(使用Backwardselection,去除P0.2時變量)stepwise,pe(.2):regyx1x2x3(使用forwardselection,去除P0.2時變量)stepwisepr(.2pe(.01):regyx1x2x3(使用backward-stepwiseselection,取P0.01stepwise,pe(.2forward:regyx1x2x3(使用forward-stepwiseselection)regyx1x2x3predictYhat,xbpredictu,residpredictstd,stdp(獲得y估計值的標(biāo)準(zhǔn)誤predictstdf,stdf(獲得y預(yù)測值的標(biāo)準(zhǔn)誤predictp,pr(1,12)(獲得y112之間的概率)predictrstu,rstudent(student的t值)predictlerg,leverage(獲得杠桿值)predictckd,cooksd(獲得cooksd)regyx1x2x3c1c2adjustx1x2x3,se(使得變量x1、x2和x3等于其均值,求y的預(yù)測值和標(biāo)準(zhǔn)誤adjustx1x2x3,stdfci(使得變量x1、x2和x3等于其均值,求y的預(yù)測值,預(yù)測標(biāo)準(zhǔn)誤和置adjustx1x2,by(c1seci(控制變量x1、x2,亦即取它們的均值,在分類變量c1的不同水平上求y預(yù)測值,標(biāo)準(zhǔn)誤和置信區(qū)間)adjustx1x2x3,by(c1stdfci(控制變量x1、x2、x3,亦即取它們的均值,在分類變量c1的不同水平上求y預(yù)測值,預(yù)測標(biāo)準(zhǔn)誤和置信區(qū)間)adjustx1x2,by(c1c2)seci(控制變量x1、x2,在分類變量c1、c2的不同水平上求y的預(yù)測adjustx1x2x3,by(c1c2stdfci(控制變量x1、x2、x3,在分類變量c1、c2的不同水平上求adjustx1=ax2=bx3=c,seci(當(dāng)x1=a、x2=b、x3=c時,求y的預(yù)測值、標(biāo)準(zhǔn)誤和置信區(qū)間)求y的預(yù)測值、標(biāo)準(zhǔn)誤和置信區(qū)間)adjustx1=ax2=bc1=1,by(c1)seci(當(dāng)x1=a、x2=b,并假設(shè)所有的樣本均為c1=1,求在分類變量c1的不同水平上,因為變量x3的均值不同,而導(dǎo)致的y的不同的預(yù)測值……)mvregY1Y2X1X2X3……(多元回歸mvregy1y2y3x1x3x3(多元回歸分析,y1y2y3為因變量,x1x3x3為自變量)mvreg之后才能進(jìn)行testy1](測試對y1testy1]:x1x2(測試對y1的回歸中x1、x2testx1x2x3(測試在所有的回歸中,x1、x2、x3testy1=y2](對y1的回歸和對y2的回歸系數(shù)相等test[y1=y2]:x1x2x3,mtest(y1和y2的回歸中,分別測試x1、x2、x3的系數(shù)是否相等,mtest這個命令,則測試他們的聯(lián)和統(tǒng)計)testy1=y2=y3](三個回歸的系數(shù)是否相等,可加mtest以分別測試testy1=y2=y3]:x1x2(測試三個回歸中的x1、x2mtest)est命令的用法:regyx1x2x3(不限于reg,也可ivreg、mvreg、reg3)eststoreAestreyestforA:sum(對A回歸結(jié)果中的各個變量運(yùn)行sum命令)regyx1x2x3ifc1==1(當(dāng)分類變量c1=1時,進(jìn)行y和諸x的回歸)regyx1x2x3,robust(回歸后顯示各個自變量的異方差-穩(wěn)健性標(biāo)準(zhǔn)誤)estatvif(回歸之后獲得VIF)estathettest,mtest(異方差檢驗)regyx1x2x3predictu,residgenusq=u^2regusqx1x2x3求F值disyR/(1-R)*n2/n1(n1表示分子除數(shù),n2表示分母除數(shù)disyLMdisyR*n(n表示總樣本量disywhite法:regyx1x2x3predictu,residgenusq=u^2predictygenysq=y^2regusqyysq求F值disyR/(1-R)*n2/n1(n1表示分子除數(shù),n2表示分母除數(shù)disyLMdisyR*n(n表示總樣本量disyF值和LM值轉(zhuǎn)換為P值令disyFtail(n1,n2,a)(利用F值求p值,n1表示分子除數(shù),n2表示分母除數(shù),a為F值)異方差的糾正——WLS(weightedleastsquareestimator)regyx1x2x3aw=x1](將x1作為異方差的來源,對方程進(jìn)行修正)regy/(x1^0.5)1/(x1^0.5)x1/(x1^0.5)x2/(x1^0.5)糾正異方差的常用套路(構(gòu)造h值regyx1x2x3predictu,residgenusq=u^2genlogusq=log(usq)reglogusqx1x2x3predictggenregyx1x2x3[aw=1/h]異方差hausman檢驗:regyx1x2x3eststoreA(將上述回歸結(jié)果到A中regyx1x2x3[aw=1/h]eststoreB當(dāng)因變量為對數(shù)形式時(log(y))yreglogyx1x2x3predictgenregym,noconstantm的系數(shù)為iy的預(yù)測值anovayg1g1|g2(g*g1和交互項g1|g2這兩種分類的y值是否存anovayd1d2d1*d2(d*d1、d2d1*d2的這三種分類的y值是否有組內(nèi)anovayd1d2x1d2*x1continuous(x1)(x*表示連續(xù)的控制變量)webusemanovay1y2y3=genderfracturegender*fracture(按、是否骨折及二者的交互項對y1、y2和y3進(jìn)行方差分析)manovay1genderfracturegender*fracture(y1為因變量webusenobetweengenmycons=1manovatest1test2test3=mycons,noconstantmatc=(1,0,-1\0,1,-1)manovatestmycons,(foreachvnameiny1y2y3{(確定y變量組reg`vname'x1x2x3(將y變量組中的各個變量與諸x變量進(jìn)行回歸分析,注意vname的標(biāo)}mvregy1y2y3=x1x2reg3reg3(y1=x1x2x3)(y2=x1x3x4)(y3=x1x2測試y1coefs0test[y1]test[y1=y2=y3],testy1=y2y1=y3commonconstant(constant表示包含截距項reg3(y1=y2x1x2)(y2=y1(2)reg3進(jìn)行reg3(y1=y2x1x2)(y2=y1x4),ols對兩個回歸結(jié)果進(jìn)行hausman檢驗:reg3(y1=x1x2x3)(y2=y1x4),2slseststoretwoslsreg3(y1=x1x2x3)(y2=y1x4),olseststoreols驗ols,equations(2:)hausmantwoslsols,alleqs(對所有方程一起進(jìn)行檢驗)檢驗忽略變量(模型的RESETregyx1x2x3estatovtest對變量ygeny_l1=y[_n-geny_l2=y[_n-gengen回歸元嚴(yán)格外生時AR(1)序列相關(guān)的檢驗regyx1x2predictu,residgenu_1=u[_n-1]regu回歸之后,u_1的序數(shù)如果不異于零,則該序列不相關(guān)用Durbin-WatsonStatistics檢驗序列相關(guān):tssetyear@(對時間序列回歸中代表時間的變量進(jìn)行定義)@regyx1x2@durbina,small@(small可以根據(jù)F值求出P值,以代替chi2值)@durbina,@(讓檢驗?zāi)茉趓obust、neway之后進(jìn)行)@durbina,smalllag(1/10@(lag110階的durbina,robustlag(1/10@(robust可進(jìn)行異方差—穩(wěn)健性回歸,避免未知形式的異方差)@bgodfrey@(利用Breusch-Godfreytest求出高階序列相關(guān))@數(shù)據(jù):survey源數(shù)據(jù):dataset文件夾中的1、定義surveysvysetpsuid[pweight=finalwgt],——定義primarysamplingunit為psuid——pweight為——定義stratumidentifer為stratid。可能是測試中被試的編號,1to312malegenmale=(==1)if —— svy,subpop(male):tabulatehighbpsizce,colobspearsonlrnull——subpop規(guī)定了以male為數(shù)據(jù)的范——tabulatehighbpsizce表示繪制行變量為highbp,列變量為sizce的表100%——obs表示列出每個單元格的樣本量,se表示列出每個單元格的標(biāo)準(zhǔn)誤,ci——pearson表示求取pearson'schi-squired,的卡方檢——lr表示求取likelihood——wald表示求取adjustedwa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論