stata統(tǒng)計分析與應(yīng)用筆記(共12頁)_第1頁
stata統(tǒng)計分析與應(yīng)用筆記(共12頁)_第2頁
stata統(tǒng)計分析與應(yīng)用筆記(共12頁)_第3頁
stata統(tǒng)計分析與應(yīng)用筆記(共12頁)_第4頁
stata統(tǒng)計分析與應(yīng)用筆記(共12頁)_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上第一章:Stata概述:help和search都是查找文件的命令但help用于查找精確的命令,search是模糊查找。還可使用help|contents 來分類查找第二章:數(shù)據(jù)管理:2.1變量和變量的取值:1.變量的命名:不能以數(shù)字開頭,區(qū)分大小寫,不能命名為系統(tǒng)變量名2.變量的取值類型:(1)字符型:字符變量存儲格式是str,str表示格式表示該變量的存儲最多可容納的字符數(shù)(2)數(shù)值型數(shù)據(jù):存儲格式:.long.float.double.Stata默認(rèn)將數(shù)字存儲為浮點(diǎn)數(shù)據(jù),而將計算結(jié)果存為雙浮點(diǎn)數(shù)據(jù)。(3)缺失數(shù)據(jù):一般僅用“.”表示3變量的顯示:(

2、1)數(shù)值變量的顯示格式:a.普通格式有%w.dg, %w.dgc(g表示普通,w表示整個顯示所占的字符數(shù),d表示顯示的數(shù)字中小數(shù)點(diǎn)后的位數(shù),c是要求Stata給出帶逗號“,”數(shù)字顯示格式如12345顯示為12,345)b固定格式有%w.df, %w.dfc(f表示固定)c.科學(xué)指數(shù)法格式:%w.de, (e表示科學(xué)計數(shù))(2)字符變量的顯示格式:僅有一種%s,%是提示符,#表示顯示字符數(shù),s表示字符變量顯示格式,默認(rèn)右對齊,后加“-”可改為左對齊。(3)使用format命令變量顯示格式:format varlist %fmt 或者 format %fmt varlist 4.變量的標(biāo)簽(1)添

3、加數(shù)據(jù)集的標(biāo)簽使用: label data “l(fā)able”(2)添加變量的標(biāo)簽使用:label variable varname “l(fā)able”(3)label為變量數(shù)值添加標(biāo)簽的語法有兩部分,先定義數(shù)值標(biāo)簽:label define lblname#“l(fā)able” #“l(fā)able”(lblname是標(biāo)簽名稱)然后將定義好的數(shù)值標(biāo)簽添加到變量上:label values varlist lblnamel.2.2創(chuàng)建一個新的數(shù)據(jù)集1.關(guān)于數(shù)據(jù)集操作的基本命令(1)browse 和edit 命令:browse 用于打開數(shù)據(jù)瀏覽器,edit命令用于打開數(shù)據(jù)編輯器Edit varlist if inb

4、rowse varlist if in(if和in 用于選擇需要的子集)(2)rename:rename old_varname new_varname(3)save命令:save filename ,save_options(,save_options可以指nolabel(不保存設(shè)定標(biāo)簽),replace(允許新文件覆蓋原文件),all主要用于編程(4)describe:用于產(chǎn)生一個對數(shù)據(jù)集的簡明總結(jié)格式:describe varlist ,memory_options(命令選項:simple,short,detail,fullnames)(5)list:用于顯示變量的數(shù)值,其后可以跟需要顯

5、示的變量名稱語法:list varlist if in ,options(命令選項包括:noobs(不顯示觀測值的數(shù)值),clean,separator,sepby,nolabel)(6)codebook:用于詳盡地描述變量的內(nèi)容,包括變量名稱、標(biāo)簽、賦值。語法:codebook varlist if in ,options(命令選項有header,notes,mv,problems,compact)2.舉例應(yīng)用:輸入原始數(shù)據(jù)定義變量名添加標(biāo)簽使用describe和codebook命令查看數(shù)據(jù)全貌保存數(shù)據(jù)到硬盤的工作目錄2.3導(dǎo)入已創(chuàng)建的數(shù)據(jù)集1.一般原則:(1)打開數(shù)據(jù)集前要用clear命令

6、清除內(nèi)存中的數(shù)據(jù)集 (2)可用 set memory 50m,permanently來設(shè)定空間 (3)讀入數(shù)據(jù)方法:可用use, edit, insheet,infile,infix,等 (4)在數(shù)據(jù)文件不是太大的情形下,使用Excel文件粘貼復(fù)制就可以完成數(shù)據(jù)讀入2.讀取格式為.dta的數(shù)據(jù)一般:use filename ,clear nolabel( clear nolabel是兩個選項)此時filename為當(dāng)前工作目錄下的文件3.利用Excel復(fù)制數(shù)據(jù)進(jìn)入Stata系統(tǒng)中2.4 Stata中的表達(dá)式1.算術(shù)符號:+ 、-、*、/、(乘方)、-(負(fù)號)2.關(guān)系符號(六種):=(等于),!

7、=(不等于),>,<,>=,<=3.邏輯符號:!(或),&(且),“|”(非)2.5 Stata中的常用函數(shù)2.6使用in、if和by語句定義數(shù)據(jù)子集許多命令都可以限制為對數(shù)據(jù)的個子集執(zhí)行,這就需要在命令中加上in或者if選擇條件1.in 的語法:command in range (command 是命令,range可以是數(shù)字#,也可以是從某數(shù)字到另一個觀測值“#/#”或者從某個數(shù)字到最后“#/1”,以及從開始到最后“f/#”2.if 的語法:command if exp (exp是需要滿足的表達(dá)式)3by 語句的使用:大多數(shù)Stata命令都允許使用by前置語句

8、,用來對某些變量具有相同賦值的樣本子集重復(fù)執(zhí)行命令,by的語法:by varlist:Stata_cmd bysort varlist:Stata_cmd (Stata_cmd表示要執(zhí)行的命令,bysort和by本質(zhì)相同,只不過前者先對varlist排序再分組,一般用bysort2.7 變量的相關(guān)操作1.建立新的變量generate generate語法:generate type newva=expif in(type是可選項用于指定創(chuàng)建的變量的類型,newva是新變量名稱,exp是賦值表達(dá)式注意:(1)一定要區(qū)分“=”和“=”(2)生成新變量中往往會產(chǎn)生缺失值2.更改已有的變量replac

9、eReplace的語法:replace oldvar =expif in ,nopromote選項nopromote阻止Stata改變變量的類型來適應(yīng)新的賦值,較少使用3.egen命令egen表示對generate命令的擴(kuò)展,它有自己一系列用于完成generate命令無法輕易完成的函數(shù) egen語法:egen type newvar =fcn(arguments) if in ,options(fcn是egen命令中特有的函數(shù),arguments表示表達(dá)式、變量名或者數(shù)字列表,它們依函數(shù)而定,選項也依函數(shù)而定2.8數(shù)值和字符串的轉(zhuǎn)換1.encode和decode命令encode命令可為已經(jīng)存在

10、的字符串變量添加一個去了標(biāo)簽的數(shù)值型變量decode 命令可以根據(jù)一個數(shù)值型變量和它的標(biāo)簽生成一個字符型變量,字符型到數(shù)值型變量語法:encode varname if in,generate(newvar) label (name)Varname表示要進(jìn)行轉(zhuǎn)換的變量,newvar表示要生成的新變量,label (name)是指定新變量的標(biāo)簽名,沒有的話,默認(rèn)與原變量相同數(shù)值型到字符型變量語法: decode varname if in,generate(newvar) maxlength (#)maxlength (#)用來指定新生變量的長度2.real函數(shù)real()用于從合適的字符串表達(dá)

11、式中得到數(shù)值,如real(“5.2”)+1=6.2如果字符串中不含數(shù)字則返回“.”2.9 生成分類變量和虛擬變量1.生成虛假變量虛擬變量的取值非此即彼,如female=1表示男性,female=0表示女性(1) 使用generate和replace生成虛擬變量, 如:use wage ,replace gen college=0replace college=1 if educ>=12list educ college in 1/10(2) 使用generate newvar=(varname>#)生成虛擬變量generate newvar=(varname>#)是一個生成虛

12、擬變量的快捷方式,在這個命令中,第一個等號表示定義:滿足其后小括號中的觀測案例將會在新的變量中定義為1,其余的情況則定義為0上(1)有程序generate college=(educ>=12)2.生成分類變量(1)generate加replace命令生成分類變量 如將edu6教育水平劃分為6個等級,和虛擬變量不同之處在于這是6組(3) recode命令recode類似replace也可對已有變量重新賦值,語法如下:recode varlist (rule)(rule),generate(newvar)(varlist 是需要進(jìn)行轉(zhuǎn)換賦值的變量名,rule是事先確定的轉(zhuǎn)換規(guī)則,選項,gen

13、erate(newvar)用于將轉(zhuǎn)換后的變量保存為一個新的變量recode的常見賦值規(guī)則有#=#,#=#,#/#=#,nonmissing=#,minssing=#如:recode x1(1=2)(2=1),gen(nx1)3.使用autocode()、recode()和group()3個函數(shù)生成分類變量語法:gen varlist =autocode(x,n,xmin,xmax) gen varlist =group(x)gen varlist =autocode(x,x1,x2,xn)2.10數(shù)據(jù)的整理(將存放在不同的數(shù)據(jù)文件里的數(shù)據(jù)文件合并)1.數(shù)據(jù)的橫向合并:指將兩個數(shù)據(jù)文件的變量加總

14、在一起。合并后數(shù)據(jù)的樣本不變,但變量的數(shù)目增加了,也就是使得數(shù)據(jù)文件變寬了。用merge命令語法:merge varlist using filename filename ,optionsvarlist指的是合并序號變量,filename用于合并兩個以上的數(shù)據(jù),易出錯。Options選項可以有:merge(newvar),update,replace,nokeep,nosummary2.數(shù)據(jù)的縱向合并:指的是把兩個數(shù)據(jù)的樣本加總在一起,合并后的數(shù)據(jù)變量數(shù)目不變,但樣本數(shù)目增加了,也就是使得數(shù)據(jù)變長了。用append命令語法:append using filename ,options (選項

15、有keep,nolabel,nonotes)3.數(shù)據(jù)的交叉合并:指的是把一個數(shù)據(jù)的個案和另外一個數(shù)據(jù)的個案交叉搭配生成新的數(shù)據(jù)。(1)用jobby進(jìn)行組內(nèi)交叉 語法:joinby varlist using filename ,options(2)用cross進(jìn)行一一交叉 語法:cross using filename4.數(shù)據(jù)的抽取:對于大型數(shù)據(jù),需抽取再分析sample 命令:sample # if in ,count by(groupvars)#是樣本容量(或樣本百分比),如果指定count,那么#就是樣本內(nèi)觀測值個數(shù);如果沒有指定count,那么#就是抽取樣本的百分比。by(groupv

16、ars)可進(jìn)行組內(nèi)抽取,還可以用set seed 5來保證每次抽取的樣本相同第三章 圖形繪制基礎(chǔ)3.1 Stata繪圖簡介用戶可用Graphics菜單制圖,但不推薦。1. 主要的圖形類型:直方圖、扇形圖、條形圖、散點(diǎn)圖、直線圖以及數(shù)據(jù)擬合圖(一維或二維圖),還可繪如盒形圖,長釘圖,圓點(diǎn)圖、面積圖以及其他常見圖。2. 圖形的組成部分與制圖命令的結(jié)構(gòu)3. 尋求幫助:help graph3.2 繪制散點(diǎn)圖1. 繪制散點(diǎn)圖的命令和最基本的使用:語法如下twoway scatter varlist if in weight ,options 以下三種也可識別scatter語句graph twoway s

17、catter twoway scatter scatter 如果命令后緊跟兩個變量名,則Stata會默認(rèn)第一個為y軸變量,第二個為x軸變量;如果命令后有兩個以上的變量,那么Stata會將除最后一個以外的變量作為y軸變量,而將最后一個變量當(dāng)成x軸變量。scatter 命令是graph twoway(二維繪圖命令)中最基本的一個,其它的都是在散點(diǎn)圖的基礎(chǔ)上進(jìn)行的。Scatter 繪圖還可以與其他類型二維制圖命令放在一起,繪制重疊的復(fù)合圖形比如:twoway (scatter)(line)(lfit)scatter |line|lfit.|2. 散點(diǎn)顯示選項的設(shè)定:包括形狀、顏色、大小3. 散點(diǎn)標(biāo)簽

18、選項:散點(diǎn)標(biāo)簽一般是指位于每個散點(diǎn)旁的用于說明散點(diǎn)所代表個體的文字。4. 連線選項的設(shè)定:用來設(shè)定如何用線將散點(diǎn)圖上各點(diǎn)連接起來,這樣可以更加清楚地看變動的趨勢5. 振蕩選項的設(shè)定:有時候,由于數(shù)據(jù)點(diǎn)太密集,甚至產(chǎn)生了重疊,使得在觀察數(shù)據(jù)中的趨勢受到影響,需要將這些數(shù)據(jù)點(diǎn)輕微的挪動位置,使得重合的數(shù)據(jù)點(diǎn)相互分開。使用jitter(#)選項3.3 二維繪圖選項3.2 主要講解了散點(diǎn)圖所特有的選項,這節(jié)講所有二維繪圖所共有的選項:標(biāo)題選項、坐標(biāo)選項、圖例選項、增加線選項,by選項、scheme選項、軸線選擇選項、圖形保存選項以及圖形輸出選項。1.坐標(biāo)軸尺度選項組的設(shè)定坐標(biāo)軸尺度選項:yscale(

19、axis_suboptions),設(shè)定y軸的外觀 xscale(axis_suboptions),設(shè)定x軸的外觀tscale(axis_suboptions),設(shè)定t軸的外觀還有子選項的設(shè)定,即設(shè)定坐標(biāo)軸尺度選項中可以填充的內(nèi)容2.坐標(biāo)軸刻度選項組的設(shè)定:用于控制坐標(biāo)軸的刻度和刻度的標(biāo)識3.坐標(biāo)軸選項組的設(shè)定:用于設(shè)定坐標(biāo)軸的標(biāo)題4.標(biāo)題選項組的設(shè)定:用于設(shè)定繪圖的標(biāo)題以解釋圖像的內(nèi)容5.圖例選項的設(shè)定:當(dāng)圖形中包含多個組別的相似內(nèi)容時,Stata將生成圖例。圖例表示圖形當(dāng)中不同符號對應(yīng)著的內(nèi)容,它使得讀者能夠輕松讀懂圖中不同符號的含義。6.by選項的設(shè)定:一旦設(shè)定選項by(),Stata會根

20、據(jù)括號中變量的不同取值重復(fù)作圖,因此by的依據(jù)往往是分類變量,比如性別、民族、國內(nèi)國外等。語法:by(varlist,byopts7.scheme選項的設(shè)定:控制圖形顯示格式8.軸線選擇選項的設(shè)定9.增加線選項的設(shè)定:用于在二維圖形上添加增加線10scale選項的設(shè)定:調(diào)整整個圖像包括文本、標(biāo)記和線段的大小11.圖形保存選項:Stata將本身生成的圖形存儲分為兩種形式:一種是內(nèi)存的激活狀態(tài),另一種是存入硬盤的狀態(tài)graph save my file ,replace,可將文件存儲到硬盤中,保存成myfile文件,replace表示覆蓋相同的名稱的文件12.圖形的輸出選項:(1)圖形打?。?)存

21、儲為其他格式第4章 其他圖形繪制4.1繪制曲線標(biāo)繪圖和連線標(biāo)繪圖1.繪制曲線標(biāo)繪圖:所謂曲線標(biāo)繪畫,就是其中點(diǎn)用線段連接起來的散點(diǎn)圖,不過新的選項可以控制曲線本身的特征曲線標(biāo)繪圖的命令語法:twoway line varlist if in ,options2.繪制連線標(biāo)繪圖:連線標(biāo)繪圖是將每個散點(diǎn)連接起來,但不隱藏點(diǎn)。命令:twoway connected varlist if in weight ,scatter_options4.2繪制擬合圖形1.繪制一次擬合圖形:實(shí)際分兩步,首先使用Stata使用yvar為因變量,xvar為自變量進(jìn)行一元線性回歸,然后得到y(tǒng)var的擬合值比如說是hat

22、,然后用hat對xva做曲線標(biāo)繪圖,同是復(fù)合原始數(shù)據(jù)的散點(diǎn)圖。命令:twoway lfit yvar xvwr if in weight ,options如:sysuse auto Scatter mpg weight | lfit mpg weight 2.繪制二次擬合圖形:命令 twoway qfit yvar xvar if in weight ,options如sysuse auto scatter mpg weight | qfit mpg weight 4. 繪制lowess擬合圖形:由于具有對擬合過程進(jìn)行控制的選項,lowess命令總的來說更為專業(yè)也更為強(qiáng)大。命令:twoway

23、lowess yvar xvwr if in weight ,options如:sysuse auto twoway scatter mpg weight | lfit mpg weight|lowess mpg weight4.3繪制條形圖命令:graph bar yvars if in weight ,options(繪制縱向條形圖) graph bar hyvars if in weight ,options (繪制橫向條形圖)1. 關(guān)于分類變量的講解2. 關(guān)于外形圖外觀的講解第5章 描述性統(tǒng)計分析描述性統(tǒng)計的統(tǒng)計量大致可分為三類:一是描述中心位置的度量;二是描述波動情況的度量;三是描述

24、數(shù)據(jù)集中一個觀測值相對位置的度量。另一個重要功能是分析異常值5.1描述性統(tǒng)計的原理1. 定性變量:頻率和頻數(shù)2. 定量變量:(1)集中趨勢的度量:算術(shù)平均、中位數(shù)和眾數(shù) (2)變異程度的度量:極差(最大和最小觀測值之差)、方差、和標(biāo)準(zhǔn)差(注意切比雪夫法則) (3)相對位置的度量:百分?jǐn)?shù)和z得分(100p百分位數(shù)是數(shù)據(jù)集的相對頻率分布中有100p%的面積位于它的左邊,有100(1-p)%的面積位于它的右邊,z=xi-xs (4)偏度和峰度:偏度系數(shù)SK=n(xi-x)4-3xi-x22(n-1)(n-1)(n-2)(n-3)S45.2 描述性統(tǒng)計量的Stata實(shí)現(xiàn)1使用summarize命令計算

25、和導(dǎo)出描述性統(tǒng)計量語法:summarize varlist if in weight ,options2.使用tabstat命令計算描述性統(tǒng)計量語法:tabstat varlist if in weight ,optionsTabstat與summarize的不一樣之處在于其by()選項允許對by()中變量不同的取值分別做描述性統(tǒng)計5.3探測異常值1.計算z得分命令:quietly summarize wage gen z=(wage-r(mean)/r(sd) list wage z if z>33. 箱線圖(不太理解)命令:graph box yvars if in weight ,

26、options graph hbox yvars if in weight ,options5.4 數(shù)據(jù)的正態(tài)性檢驗(yàn)和數(shù)據(jù)轉(zhuǎn)換正態(tài)性的檢驗(yàn)包括:圖形檢驗(yàn)、卡方檢驗(yàn)和其他統(tǒng)計檢驗(yàn)1. 分位正態(tài)圖的繪制的命令格式:qnorm varname if in,options2. 偏度-峰度檢驗(yàn):sktest varlist if in weight ,noadjust3. Shapiro-Wilk W檢驗(yàn) swilk varlist if in ,options4. Shapiro-Francia W檢驗(yàn) sfrancia varlist if in5. DAgostino檢驗(yàn) sktestdc var

27、list=esp if exp in range ,noadjust5.5 相關(guān)系數(shù) 常用的相關(guān)系數(shù)共有如下4類:pearson相關(guān)系數(shù)、Kendall相關(guān)系數(shù)、Spearman秩相關(guān)系數(shù)以及偏相關(guān)系數(shù)1. pearson相關(guān)系數(shù):correlatevarlist if in weight , correlate_options pwcorrvarlist if in weight , pwcorr_options2. spearman 和Kendall相關(guān)系數(shù):ktau wage educ exper tenure,star(.05)3. 偏相關(guān)系數(shù):pcorr varnamel varli

28、st if in weight第6章 列聯(lián)表分析6.1列聯(lián)表分析列聯(lián)表是分析兩個分類變量(名義變量或者定序變量)之間關(guān)系的基本統(tǒng)計方法1. 獨(dú)立性檢驗(yàn)統(tǒng)計量:常用到皮爾遜卡方統(tǒng)計量和似然比統(tǒng)計量2. 列聯(lián)表中的相關(guān)測量統(tǒng)計量:度量兩變量的關(guān)聯(lián)強(qiáng)度,可以考察各種相關(guān)測量統(tǒng)計量,對于名義變量而言,這些統(tǒng)計量有Phi系數(shù)、列聯(lián)系數(shù)、CramersV系數(shù);對于定序變量而言,可以使用統(tǒng)計量、Kendallb統(tǒng)計量、Stuartc統(tǒng)計量,它們的數(shù)值越大就表明行變量和列變量之間的關(guān)聯(lián)越強(qiáng)6.2 Stata 的列聯(lián)表分析table和tabulate 命令 其中table命令可以很方便地生成列聯(lián)表,而tabul

29、ate可以進(jìn)行獨(dú)立性檢驗(yàn)1.table 命令格式:table rowvar colvar supercolvar if in weight ,optionsrowvar代表行變量,colvar代表列變量,supercolvar代表更高階的列變量,weight表示權(quán)重2tabulate命令進(jìn)行列聯(lián)表分析(1)一維tabulate命令,主要用于生成含有頻數(shù)的一維表格tabulate varname if in weight ,tabulate1_options(2)二維tabulate命令二維tabulate命令在生成二維表格的同時,可以計算多種獨(dú)立性檢驗(yàn)統(tǒng)計量和相關(guān)測量統(tǒng)計量命令格式:tabul

30、ate varname1 varname2 if in weight ,options6.3 利用Stata生成包含描述性統(tǒng)計量的列表1.tabstat可以在一個表格中顯示多個變量的多種描述性統(tǒng)計量Tabstat varlist if in weight ,options3. tabulate ,summarize()用于生成一維或者二維的包含均值和標(biāo)準(zhǔn)差的表格,事實(shí)上,table比tabulate,summarize()更加靈活,而tabulate,summarize()的特點(diǎn)在于運(yùn)行更快tabulate,summarize()命令格式:tabulate varname1 varname2

31、if in weight ,options第7章 方差分析7.1 t檢驗(yàn)(樣本小于30)1.t檢驗(yàn)的Stata基本命令(1)單樣本t檢驗(yàn)的Stata操作命令1:ttest varname =#if in,level(#)(通過樣本進(jìn)行t檢驗(yàn))命令2:ttesti #obs #mean #sd #val ,level(#)(通過樣本的統(tǒng)計指標(biāo)進(jìn)行t檢驗(yàn))其中,#obs為樣本容量,#mean為樣本均值,#sd為標(biāo)準(zhǔn)差,#val為待檢驗(yàn)數(shù)值,level為置信度水平2.兩樣本的t檢驗(yàn)的Stata操作命令格式1(通過樣本進(jìn)行雙變量t檢驗(yàn)):ttest varname1=varname2 if in,op

32、tion命令格式2(通過樣本進(jìn)行分組t檢驗(yàn)):ttest varname if in,by(groupvar) options命令格式3(通過樣本的統(tǒng)計指標(biāo)進(jìn)行t檢驗(yàn)):ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 ,options7.2 單因素方差分析1.單因素方差分析Stata實(shí)現(xiàn) oneway命令:oneway response_var factor_var if in weight ,optionslongway命令:longway response_var group_var if in weight ,options7.3雙因素和多因素方差分

33、析基本命令:anova response_var if in weight ,options7.4 協(xié)方差分析命令:anova response_var if in weight ,options第8章 經(jīng)典假設(shè)下的橫截面數(shù)據(jù)單方程線性回歸模型的Stata實(shí)現(xiàn)8.1 Stata的回歸分析1.Stata的回歸分析-regress、predict、test命令regress、predict、test是一組命令,它們完成各種簡單和多元的普通最小二乘法回歸。regress命令用于完成因變量對自變量的回歸,其后續(xù)命令predict可以計算預(yù)測值、殘差,另一后續(xù)命令test檢驗(yàn)用戶指定的假設(shè)。regres

34、s 命令的格式:regress depvar indepvars 【if】 【in】【weight】【options】常用選項:noconstant(不加常數(shù)項做線性回歸) hascons(由用戶指定常數(shù)項的值) level(#)設(shè)定置信水平(默認(rèn)值為95%) beta(報告標(biāo)準(zhǔn)化的beta系數(shù)) noheader(不報告輸出表名)2使用predict命令-計算擬合值和殘差predict命令:predict type newvar if in , single_optionspredict 命令是reg命令的后續(xù)命令,它可以用來保存最近一次回歸的預(yù)測值、殘差值。Type用來指定你要用來存放擬合

35、值或殘差的格式,newvar為用戶為擬合值 或殘差2取的變量名,if、in選項與第2章介紹的相同,, single_options用來指定你是要擬合值還是殘差值, single_options可以是resid 表示我們需要計算殘差(默認(rèn)報告是擬合值)3使用test命令-進(jìn)行讀者指定的檢驗(yàn)test命令的格式:test var1 var2 var3k test var=C test var1=var2 test var1=(var2+var3)/C在這里,要完成的任務(wù)是:(1) 檢驗(yàn)單個變量的顯著性(2) 檢驗(yàn)多個變量的聯(lián)合顯著性(3) 檢驗(yàn)不同變量系數(shù)的關(guān)系如test educ 0.5/來檢驗(yàn)教

36、育的系數(shù)是否為0.5 Test educ exper /這一命令是檢驗(yàn)教育、經(jīng)驗(yàn)回報是否同時為零的聯(lián)合顯著性檢驗(yàn)4. sw regress基本命令及其選項-逐步回歸sw regress 命令語法:sw regress depvar indepvars ,optionsoptions常用選項:Lockterm(保證某些變量不被剔除) ()(用于將括號內(nèi)的變量看成一個整體 hier(讓Stata從最后一個變量開始剔除,而不是從最不顯著的變量開始剔除)第9章 非經(jīng)典假設(shè)、線性方程組、面板數(shù)據(jù)估計的Stata實(shí)現(xiàn)9.1 非經(jīng)典假設(shè)下的回歸分析的Stata實(shí)現(xiàn)1.多重共線性的檢驗(yàn)和處理(1)多重共線性的

37、檢驗(yàn):用命令 vif/該命令用來得到自變量的方差膨脹因子。 一般而言,判斷多重共線性的標(biāo)準(zhǔn)是:a. 最大的vif大于10b. 平均的vif大于1(2)多重多線性的處理方法一:不加處理(往往是因?yàn)榧佣雾椧鸬模@是有原因的)方法二:減少自變量,將一些解釋變量并入誤差項方法三:先采用在后面的將介紹的主成分分析和聚類分析,先將變量分類,然后再做回歸分析2.內(nèi)生性的檢驗(yàn)和處理(外生性即:E(u|x)=0)外生性的假設(shè)是所有假設(shè)中最重要的假設(shè),違反它將合得估計值不一致。內(nèi)生性檢驗(yàn)的命令是ovtest,它必須在regress命令之后。結(jié)果上,我們需要拒絕原假設(shè)(p<0.05),即認(rèn)為數(shù)據(jù)確實(shí)有內(nèi)

38、生性問題 Stata中是用ivreg命令實(shí)現(xiàn)工具變量回歸的,ivreg命令的語法是 ivregress estimator depvar varlist1 (varlist2=varlist_iv)如:reg wage educ age kidslt6 kidsge6 exper expersq/沒使用工具變量 reg wage age kidslt6 kidsge6 exper expersq(educ=motheduc)/使用工具變量3、異方差的檢驗(yàn)與處理(1)異方差的檢驗(yàn):用hettest/檢驗(yàn)異方差,看p值,小于0.05,不能排除異方差可能(2)異方差的處理:只要在reg命令的opti

39、ons選項中選擇robust選項即可。然后再用test命令做檢驗(yàn)如:reg wage educ age kidslt6 kidsge6 exper expersq ,robust9.2 線性方程組的回歸分析-Stata實(shí)現(xiàn)線性方程組包括兩類:似不相關(guān)模型以及聯(lián)立方程組模型1. 似不相關(guān)模型的Stata實(shí)現(xiàn)sureg (depvar1 varlist1) (depvar2 varlist2)(depvarN varlistN)ifinweight2. 聯(lián)立方程組模型的Stata實(shí)現(xiàn)reg3 (depvar1 varlist1) (depvar2 varlist2)(depvarN varlist

40、N)ifinweight9.3 面板數(shù)據(jù)的Stata處理 Stata并不會自動識別面板數(shù)據(jù),必須告訴它哪個變量是時間維度,哪個變量是橫截面維度。在Stata中,要設(shè)置面板數(shù)據(jù)維度,可以使用xtset命令。其語法是:xtset panelvar timervar ,tsoptions (panelvar 是用來表示橫截面維度的變量,timevar是用來表示時間維度的變量 )1. 固定效應(yīng)的面板數(shù)據(jù)Stata實(shí)現(xiàn)Xtreg用來做固定效應(yīng)的語法是:Fixed-effects (FE) model Xtreg depvar indepvars ifinweight,fe FE_options(depv

41、ar表示因變量,varslist表示自變量,fe表示fixed effect固定效應(yīng))Xtreg 常用選項(1)fe使用固定效應(yīng)回歸 (2)robust 穩(wěn)健回歸 (3)level(#)設(shè)置置信水平,默認(rèn)為95%2.隨機(jī)效應(yīng)的面板數(shù)據(jù)Stata實(shí)現(xiàn)隨機(jī)效應(yīng)的方式處理面板數(shù)據(jù)的思想是將個人特質(zhì)看做與自變量不相關(guān),然后用傳統(tǒng)方法處理。也是使用xtreg命令,只不過選項由fe變?yōu)閞e,其語法為:xtreg depvar indepvarsifin,re RE_options(選項僅多一個theta:報告)第10章 非線性回歸分析及回歸診斷基礎(chǔ)101 非線性回歸分析第7章的有部分非線性模型可以轉(zhuǎn)為線性模型,這里介紹的是沒有辦法轉(zhuǎn)化為線性回歸的回歸模型。1.非線性回歸的Stata實(shí)現(xiàn)-nl命令 nl命令是用來實(shí)現(xiàn)單個自變量的非線性回歸模型的Stata命令。語法:Inter

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論