版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一章:Stata概述:help和search都是查找文件的命令但help用于查找精確的命令,search是模糊查找。還可使用help|contents 來分類查找第二章:數(shù)據(jù)管理:2.1變量和變量的取值:1.變量的命名:不能以數(shù)字開頭,區(qū)分大小寫,不能命名為系統(tǒng)變量名2.變量的取值類型:(1)字符型:字符變量存儲(chǔ)格式是str,str表示格式表示該變量的存儲(chǔ)最多可容納的字符數(shù)(2)數(shù)值型數(shù)據(jù):存儲(chǔ)格式:.long.float.double.Stata默認(rèn)將數(shù)字存儲(chǔ)為浮點(diǎn)數(shù)據(jù),而將計(jì)算結(jié)果存為雙浮點(diǎn)數(shù)據(jù)。(3)缺失數(shù)據(jù):一般僅用“.”表示3變量的顯示:(1)數(shù)值變量的顯示格式:a
2、.普通格式有%w.dg, %w.dgc(g表示普通,w表示整個(gè)顯示所占的字符數(shù),d表示顯示的數(shù)字中小數(shù)點(diǎn)后的位數(shù),c是要求Stata給出帶逗號(hào)“,”數(shù)字顯示格式如12345顯示為12,345)b固定格式有%w.df, %w.dfc(f表示固定)c.科學(xué)指數(shù)法格式:%w.de, (e表示科學(xué)計(jì)數(shù))(2)字符變量的顯示格式:僅有一種%s,%是提示符,#表示顯示字符數(shù),s表示字符變量顯示格式,默認(rèn)右對(duì)齊,后加“-”可改為左對(duì)齊。(3)使用format命令變量顯示格式:format varlist %fmt 或者 format %fmt varlist 4.變量的標(biāo)簽(1)添加數(shù)據(jù)集的標(biāo)簽使用: la
3、bel data “l(fā)able”(2)添加變量的標(biāo)簽使用:label variable varname “l(fā)able”(3)label為變量數(shù)值添加標(biāo)簽的語法有兩部分,先定義數(shù)值標(biāo)簽:label define lblname#“l(fā)able” #“l(fā)able”(lblname是標(biāo)簽名稱)然后將定義好的數(shù)值標(biāo)簽添加到變量上:label values varlist lblnamel.2.2創(chuàng)建一個(gè)新的數(shù)據(jù)集1.關(guān)于數(shù)據(jù)集操作的基本命令(1)browse 和edit 命令:browse 用于打開數(shù)據(jù)瀏覽器,edit命令用于打開數(shù)據(jù)編輯器Edit varlist if inbrowse varlist
4、 if in(if和in 用于選擇需要的子集)(2)rename:rename old_varname new_varname(3)save命令:save filename ,save_options(,save_options可以指nolabel(不保存設(shè)定標(biāo)簽),replace(允許新文件覆蓋原文件),all主要用于編程(4)describe:用于產(chǎn)生一個(gè)對(duì)數(shù)據(jù)集的簡(jiǎn)明總結(jié)格式:describe varlist ,memory_options(命令選項(xiàng):simple,short,detail,fullnames)(5)list:用于顯示變量的數(shù)值,其后可以跟需要顯示的變量名稱語法:list
5、 varlist if in ,options(命令選項(xiàng)包括:noobs(不顯示觀測(cè)值的數(shù)值),clean,separator,sepby,nolabel)(6)codebook:用于詳盡地描述變量的內(nèi)容,包括變量名稱、標(biāo)簽、賦值。語法:codebook varlist if in ,options(命令選項(xiàng)有header,notes,mv,problems,compact)2.舉例應(yīng)用:輸入原始數(shù)據(jù)定義變量名添加標(biāo)簽使用describe和codebook命令查看數(shù)據(jù)全貌保存數(shù)據(jù)到硬盤的工作目錄2.3導(dǎo)入已創(chuàng)建的數(shù)據(jù)集1.一般原則:(1)打開數(shù)據(jù)集前要用clear命令清除內(nèi)存中的數(shù)據(jù)集 (2)
6、可用 set memory 50m,permanently來設(shè)定空間 (3)讀入數(shù)據(jù)方法:可用use, edit, insheet,infile,infix,等 (4)在數(shù)據(jù)文件不是太大的情形下,使用Excel文件粘貼復(fù)制就可以完成數(shù)據(jù)讀入2.讀取格式為.dta的數(shù)據(jù)一般:use filename ,clear nolabel( clear nolabel是兩個(gè)選項(xiàng))此時(shí)filename為當(dāng)前工作目錄下的文件3.利用Excel復(fù)制數(shù)據(jù)進(jìn)入Stata系統(tǒng)中2.4 Stata中的表達(dá)式1.算術(shù)符號(hào):+ 、-、*、/、(乘方)、-(負(fù)號(hào))2.關(guān)系符號(hào)(六種):=(等于),!=(不等于),=,=12l
7、ist educ college in 1/10(2) 使用generate newvar=(varname#)生成虛擬變量generate newvar=(varname#)是一個(gè)生成虛擬變量的快捷方式,在這個(gè)命令中,第一個(gè)等號(hào)表示定義:滿足其后小括號(hào)中的觀測(cè)案例將會(huì)在新的變量中定義為1,其余的情況則定義為0上(1)有程序generate college=(educ=12)2.生成分類變量(1)generate加replace命令生成分類變量 如將edu6教育水平劃分為6個(gè)等級(jí),和虛擬變量不同之處在于這是6組(3) recode命令recode類似replace也可對(duì)已有變量重新賦值,語法如
8、下:recode varlist (rule)(rule),generate(newvar)(varlist 是需要進(jìn)行轉(zhuǎn)換賦值的變量名,rule是事先確定的轉(zhuǎn)換規(guī)則,選項(xiàng),generate(newvar)用于將轉(zhuǎn)換后的變量保存為一個(gè)新的變量recode的常見賦值規(guī)則有#=#,#=#,#/#=#,nonmissing=#,minssing=#如:recode x1(1=2)(2=1),gen(nx1)3.使用autocode()、recode()和group()3個(gè)函數(shù)生成分類變量語法:gen varlist =autocode(x,n,xmin,xmax) gen varlist =grou
9、p(x)gen varlist =autocode(x,x1,x2,xn)2.10數(shù)據(jù)的整理(將存放在不同的數(shù)據(jù)文件里的數(shù)據(jù)文件合并)1.數(shù)據(jù)的橫向合并:指將兩個(gè)數(shù)據(jù)文件的變量加總在一起。合并后數(shù)據(jù)的樣本不變,但變量的數(shù)目增加了,也就是使得數(shù)據(jù)文件變寬了。用merge命令語法:merge varlist using filename filename ,optionsvarlist指的是合并序號(hào)變量,filename用于合并兩個(gè)以上的數(shù)據(jù),易出錯(cuò)。Options選項(xiàng)可以有:merge(newvar),update,replace,nokeep,nosummary2.數(shù)據(jù)的縱向合并:指的是把兩個(gè)
10、數(shù)據(jù)的樣本加總在一起,合并后的數(shù)據(jù)變量數(shù)目不變,但樣本數(shù)目增加了,也就是使得數(shù)據(jù)變長(zhǎng)了。用append命令語法:append using filename ,options (選項(xiàng)有keep,nolabel,nonotes)3.數(shù)據(jù)的交叉合并:指的是把一個(gè)數(shù)據(jù)的個(gè)案和另外一個(gè)數(shù)據(jù)的個(gè)案交叉搭配生成新的數(shù)據(jù)。(1)用jobby進(jìn)行組內(nèi)交叉 語法:joinby varlist using filename ,options(2)用cross進(jìn)行一一交叉 語法:cross using filename4.數(shù)據(jù)的抽取:對(duì)于大型數(shù)據(jù),需抽取再分析sample 命令:sample # if in ,cou
11、nt by(groupvars)#是樣本容量(或樣本百分比),如果指定count,那么#就是樣本內(nèi)觀測(cè)值個(gè)數(shù);如果沒有指定count,那么#就是抽取樣本的百分比。by(groupvars)可進(jìn)行組內(nèi)抽取,還可以用set seed 5來保證每次抽取的樣本相同第三章 圖形繪制基礎(chǔ)3.1 Stata繪圖簡(jiǎn)介用戶可用Graphics菜單制圖,但不推薦。1. 主要的圖形類型:直方圖、扇形圖、條形圖、散點(diǎn)圖、直線圖以及數(shù)據(jù)擬合圖(一維或二維圖),還可繪如盒形圖,長(zhǎng)釘圖,圓點(diǎn)圖、面積圖以及其他常見圖。2. 圖形的組成部分與制圖命令的結(jié)構(gòu)3. 尋求幫助:help graph3.2 繪制散點(diǎn)圖1. 繪制散點(diǎn)圖的
12、命令和最基本的使用:語法如下twoway scatter varlist if in weight ,options 以下三種也可識(shí)別scatter語句graph twoway scatter twoway scatter scatter 如果命令后緊跟兩個(gè)變量名,則Stata會(huì)默認(rèn)第一個(gè)為y軸變量,第二個(gè)為x軸變量;如果命令后有兩個(gè)以上的變量,那么Stata會(huì)將除最后一個(gè)以外的變量作為y軸變量,而將最后一個(gè)變量當(dāng)成x軸變量。scatter 命令是graph twoway(二維繪圖命令)中最基本的一個(gè),其它的都是在散點(diǎn)圖的基礎(chǔ)上進(jìn)行的。Scatter 繪圖還可以與其他類型二維制圖命令放在一起,
13、繪制重疊的復(fù)合圖形比如:twoway (scatter)(line)(lfit)scatter |line|lfit.|2. 散點(diǎn)顯示選項(xiàng)的設(shè)定:包括形狀、顏色、大小3. 散點(diǎn)標(biāo)簽選項(xiàng):散點(diǎn)標(biāo)簽一般是指位于每個(gè)散點(diǎn)旁的用于說明散點(diǎn)所代表個(gè)體的文字。4. 連線選項(xiàng)的設(shè)定:用來設(shè)定如何用線將散點(diǎn)圖上各點(diǎn)連接起來,這樣可以更加清楚地看變動(dòng)的趨勢(shì)5. 振蕩選項(xiàng)的設(shè)定:有時(shí)候,由于數(shù)據(jù)點(diǎn)太密集,甚至產(chǎn)生了重疊,使得在觀察數(shù)據(jù)中的趨勢(shì)受到影響,需要將這些數(shù)據(jù)點(diǎn)輕微的挪動(dòng)位置,使得重合的數(shù)據(jù)點(diǎn)相互分開。使用jitter(#)選項(xiàng)3.3 二維繪圖選項(xiàng)3.2 主要講解了散點(diǎn)圖所特有的選項(xiàng),這節(jié)講所有二維繪圖所共
14、有的選項(xiàng):標(biāo)題選項(xiàng)、坐標(biāo)選項(xiàng)、圖例選項(xiàng)、增加線選項(xiàng),by選項(xiàng)、scheme選項(xiàng)、軸線選擇選項(xiàng)、圖形保存選項(xiàng)以及圖形輸出選項(xiàng)。1.坐標(biāo)軸尺度選項(xiàng)組的設(shè)定坐標(biāo)軸尺度選項(xiàng):yscale(axis_suboptions),設(shè)定y軸的外觀 xscale(axis_suboptions),設(shè)定x軸的外觀tscale(axis_suboptions),設(shè)定t軸的外觀還有子選項(xiàng)的設(shè)定,即設(shè)定坐標(biāo)軸尺度選項(xiàng)中可以填充的內(nèi)容2.坐標(biāo)軸刻度選項(xiàng)組的設(shè)定:用于控制坐標(biāo)軸的刻度和刻度的標(biāo)識(shí)3.坐標(biāo)軸選項(xiàng)組的設(shè)定:用于設(shè)定坐標(biāo)軸的標(biāo)題4.標(biāo)題選項(xiàng)組的設(shè)定:用于設(shè)定繪圖的標(biāo)題以解釋圖像的內(nèi)容5.圖例選項(xiàng)的設(shè)定:當(dāng)圖形中包含
15、多個(gè)組別的相似內(nèi)容時(shí),Stata將生成圖例。圖例表示圖形當(dāng)中不同符號(hào)對(duì)應(yīng)著的內(nèi)容,它使得讀者能夠輕松讀懂圖中不同符號(hào)的含義。6.by選項(xiàng)的設(shè)定:一旦設(shè)定選項(xiàng)by(),Stata會(huì)根據(jù)括號(hào)中變量的不同取值重復(fù)作圖,因此by的依據(jù)往往是分類變量,比如性別、民族、國(guó)內(nèi)國(guó)外等。語法:by(varlist,byopts7.scheme選項(xiàng)的設(shè)定:控制圖形顯示格式8.軸線選擇選項(xiàng)的設(shè)定9.增加線選項(xiàng)的設(shè)定:用于在二維圖形上添加增加線10scale選項(xiàng)的設(shè)定:調(diào)整整個(gè)圖像包括文本、標(biāo)記和線段的大小11.圖形保存選項(xiàng):Stata將本身生成的圖形存儲(chǔ)分為兩種形式:一種是內(nèi)存的激活狀態(tài),另一種是存入硬盤的狀態(tài)gr
16、aph save my file ,replace,可將文件存儲(chǔ)到硬盤中,保存成myfile文件,replace表示覆蓋相同的名稱的文件12.圖形的輸出選項(xiàng):(1)圖形打?。?)存儲(chǔ)為其他格式第4章 其他圖形繪制4.1繪制曲線標(biāo)繪圖和連線標(biāo)繪圖1.繪制曲線標(biāo)繪圖:所謂曲線標(biāo)繪畫,就是其中點(diǎn)用線段連接起來的散點(diǎn)圖,不過新的選項(xiàng)可以控制曲線本身的特征曲線標(biāo)繪圖的命令語法:twoway line varlist if in ,options2.繪制連線標(biāo)繪圖:連線標(biāo)繪圖是將每個(gè)散點(diǎn)連接起來,但不隱藏點(diǎn)。命令:twoway connected varlist if in weight ,scatter
17、_options4.2繪制擬合圖形1.繪制一次擬合圖形:實(shí)際分兩步,首先使用Stata使用yvar為因變量,xvar為自變量進(jìn)行一元線性回歸,然后得到y(tǒng)var的擬合值比如說是hat,然后用hat對(duì)xva做曲線標(biāo)繪圖,同是復(fù)合原始數(shù)據(jù)的散點(diǎn)圖。命令:twoway lfit yvar xvwr if in weight ,options如:sysuse auto Scatter mpg weight | lfit mpg weight 2.繪制二次擬合圖形:命令 twoway qfit yvar xvar if in weight ,options如sysuse auto scatter mpg
18、weight | qfit mpg weight 4. 繪制lowess擬合圖形:由于具有對(duì)擬合過程進(jìn)行控制的選項(xiàng),lowess命令總的來說更為專業(yè)也更為強(qiáng)大。命令:twoway lowess yvar xvwr if in weight ,options如:sysuse auto twoway scatter mpg weight | lfit mpg weight|lowess mpg weight4.3繪制條形圖命令:graph bar yvars if in weight ,options(繪制縱向條形圖) graph bar hyvars if in weight ,options
19、(繪制橫向條形圖)1. 關(guān)于分類變量的講解2. 關(guān)于外形圖外觀的講解第5章 描述性統(tǒng)計(jì)分析描述性統(tǒng)計(jì)的統(tǒng)計(jì)量大致可分為三類:一是描述中心位置的度量;二是描述波動(dòng)情況的度量;三是描述數(shù)據(jù)集中一個(gè)觀測(cè)值相對(duì)位置的度量。另一個(gè)重要功能是分析異常值5.1描述性統(tǒng)計(jì)的原理1. 定性變量:頻率和頻數(shù)2. 定量變量:(1)集中趨勢(shì)的度量:算術(shù)平均、中位數(shù)和眾數(shù) (2)變異程度的度量:極差(最大和最小觀測(cè)值之差)、方差、和標(biāo)準(zhǔn)差(注意切比雪夫法則) (3)相對(duì)位置的度量:百分?jǐn)?shù)和z得分(100p百分位數(shù)是數(shù)據(jù)集的相對(duì)頻率分布中有100p%的面積位于它的左邊,有100(1-p)%的面積位于它的右邊,z=xi-x
20、s (4)偏度和峰度:偏度系數(shù)SK=n(xi-x)4-3xi-x22(n-1)(n-1)(n-2)(n-3)S45.2 描述性統(tǒng)計(jì)量的Stata實(shí)現(xiàn)1使用summarize命令計(jì)算和導(dǎo)出描述性統(tǒng)計(jì)量語法:summarize varlist if in weight ,options2.使用tabstat命令計(jì)算描述性統(tǒng)計(jì)量語法:tabstat varlist if in weight ,optionsTabstat與summarize的不一樣之處在于其by()選項(xiàng)允許對(duì)by()中變量不同的取值分別做描述性統(tǒng)計(jì)5.3探測(cè)異常值1.計(jì)算z得分命令:quietly summarize wage ge
21、n z=(wage-r(mean)/r(sd) list wage z if z33. 箱線圖(不太理解)命令:graph box yvars if in weight ,options graph hbox yvars if in weight ,options5.4 數(shù)據(jù)的正態(tài)性檢驗(yàn)和數(shù)據(jù)轉(zhuǎn)換正態(tài)性的檢驗(yàn)包括:圖形檢驗(yàn)、卡方檢驗(yàn)和其他統(tǒng)計(jì)檢驗(yàn)1. 分位正態(tài)圖的繪制的命令格式:qnorm varname if in,options2. 偏度-峰度檢驗(yàn):sktest varlist if in weight ,noadjust3. Shapiro-Wilk W檢驗(yàn) swilk varlist
22、if in ,options4. Shapiro-Francia W檢驗(yàn) sfrancia varlist if in5. DAgostino檢驗(yàn) sktestdc varlist=esp if exp in range ,noadjust5.5 相關(guān)系數(shù) 常用的相關(guān)系數(shù)共有如下4類:pearson相關(guān)系數(shù)、Kendall相關(guān)系數(shù)、Spearman秩相關(guān)系數(shù)以及偏相關(guān)系數(shù)1. pearson相關(guān)系數(shù):correlatevarlist if in weight , correlate_options pwcorrvarlist if in weight , pwcorr_options2. sp
23、earman 和Kendall相關(guān)系數(shù):ktau wage educ exper tenure,star(.05)3. 偏相關(guān)系數(shù):pcorr varnamel varlist if in weight第6章 列聯(lián)表分析6.1列聯(lián)表分析列聯(lián)表是分析兩個(gè)分類變量(名義變量或者定序變量)之間關(guān)系的基本統(tǒng)計(jì)方法1. 獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量:常用到皮爾遜卡方統(tǒng)計(jì)量和似然比統(tǒng)計(jì)量2. 列聯(lián)表中的相關(guān)測(cè)量統(tǒng)計(jì)量:度量?jī)勺兞康年P(guān)聯(lián)強(qiáng)度,可以考察各種相關(guān)測(cè)量統(tǒng)計(jì)量,對(duì)于名義變量而言,這些統(tǒng)計(jì)量有Phi系數(shù)、列聯(lián)系數(shù)、CramersV系數(shù);對(duì)于定序變量而言,可以使用統(tǒng)計(jì)量、Kendallb統(tǒng)計(jì)量、Stuartc統(tǒng)計(jì)量
24、,它們的數(shù)值越大就表明行變量和列變量之間的關(guān)聯(lián)越強(qiáng)6.2 Stata 的列聯(lián)表分析table和tabulate 命令 其中table命令可以很方便地生成列聯(lián)表,而tabulate可以進(jìn)行獨(dú)立性檢驗(yàn)1.table 命令格式:table rowvar colvar supercolvar if in weight ,optionsrowvar代表行變量,colvar代表列變量,supercolvar代表更高階的列變量,weight表示權(quán)重2tabulate命令進(jìn)行列聯(lián)表分析(1)一維tabulate命令,主要用于生成含有頻數(shù)的一維表格tabulate varname if in weight ,t
25、abulate1_options(2)二維tabulate命令二維tabulate命令在生成二維表格的同時(shí),可以計(jì)算多種獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量和相關(guān)測(cè)量統(tǒng)計(jì)量命令格式:tabulate varname1 varname2 if in weight ,options6.3 利用Stata生成包含描述性統(tǒng)計(jì)量的列表1.tabstat可以在一個(gè)表格中顯示多個(gè)變量的多種描述性統(tǒng)計(jì)量Tabstat varlist if in weight ,options3. tabulate ,summarize()用于生成一維或者二維的包含均值和標(biāo)準(zhǔn)差的表格,事實(shí)上,table比tabulate,summarize()更
26、加靈活,而tabulate,summarize()的特點(diǎn)在于運(yùn)行更快tabulate,summarize()命令格式:tabulate varname1 varname2 if in weight ,options第7章 方差分析7.1 t檢驗(yàn)(樣本小于30)1.t檢驗(yàn)的Stata基本命令(1)單樣本t檢驗(yàn)的Stata操作命令1:ttest varname =#if in,level(#)(通過樣本進(jìn)行t檢驗(yàn))命令2:ttesti #obs #mean #sd #val ,level(#)(通過樣本的統(tǒng)計(jì)指標(biāo)進(jìn)行t檢驗(yàn))其中,#obs為樣本容量,#mean為樣本均值,#sd為標(biāo)準(zhǔn)差,#val為
27、待檢驗(yàn)數(shù)值,level為置信度水平2.兩樣本的t檢驗(yàn)的Stata操作命令格式1(通過樣本進(jìn)行雙變量t檢驗(yàn)):ttest varname1=varname2 if in,option命令格式2(通過樣本進(jìn)行分組t檢驗(yàn)):ttest varname if in,by(groupvar) options命令格式3(通過樣本的統(tǒng)計(jì)指標(biāo)進(jìn)行t檢驗(yàn)):ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 ,options7.2 單因素方差分析1.單因素方差分析Stata實(shí)現(xiàn) oneway命令:oneway response_var factor_var if in weig
28、ht ,optionslongway命令:longway response_var group_var if in weight ,options7.3雙因素和多因素方差分析基本命令:anova response_var if in weight ,options7.4 協(xié)方差分析命令:anova response_var if in weight ,options第8章 經(jīng)典假設(shè)下的橫截面數(shù)據(jù)單方程線性回歸模型的Stata實(shí)現(xiàn)8.1 Stata的回歸分析1.Stata的回歸分析-regress、predict、test命令regress、predict、test是一組命令,它們完成各種簡(jiǎn)單和
29、多元的普通最小二乘法回歸。regress命令用于完成因變量對(duì)自變量的回歸,其后續(xù)命令predict可以計(jì)算預(yù)測(cè)值、殘差,另一后續(xù)命令test檢驗(yàn)用戶指定的假設(shè)。regress 命令的格式:regress depvar indepvars 【if】 【in】【weight】【options】常用選項(xiàng):noconstant(不加常數(shù)項(xiàng)做線性回歸) hascons(由用戶指定常數(shù)項(xiàng)的值) level(#)設(shè)定置信水平(默認(rèn)值為95%) beta(報(bào)告標(biāo)準(zhǔn)化的beta系數(shù)) noheader(不報(bào)告輸出表名)2使用predict命令-計(jì)算擬合值和殘差predict命令:predict type new
30、var if in , single_optionspredict 命令是reg命令的后續(xù)命令,它可以用來保存最近一次回歸的預(yù)測(cè)值、殘差值。Type用來指定你要用來存放擬合值或殘差的格式,newvar為用戶為擬合值 或殘差2取的變量名,if、in選項(xiàng)與第2章介紹的相同,, single_options用來指定你是要擬合值還是殘差值, single_options可以是resid 表示我們需要計(jì)算殘差(默認(rèn)報(bào)告是擬合值)3使用test命令-進(jìn)行讀者指定的檢驗(yàn)test命令的格式:test var1 var2 var3k test var=C test var1=var2 test var1=(va
31、r2+var3)/C在這里,要完成的任務(wù)是:(1) 檢驗(yàn)單個(gè)變量的顯著性(2) 檢驗(yàn)多個(gè)變量的聯(lián)合顯著性(3) 檢驗(yàn)不同變量系數(shù)的關(guān)系如test educ 0.5/來檢驗(yàn)教育的系數(shù)是否為0.5 Test educ exper /這一命令是檢驗(yàn)教育、經(jīng)驗(yàn)回報(bào)是否同時(shí)為零的聯(lián)合顯著性檢驗(yàn)4. sw regress基本命令及其選項(xiàng)-逐步回歸sw regress 命令語法:sw regress depvar indepvars ,optionsoptions常用選項(xiàng):Lockterm(保證某些變量不被剔除) ()(用于將括號(hào)內(nèi)的變量看成一個(gè)整體 hier(讓Stata從最后一個(gè)變量開始剔除,而不是從最
32、不顯著的變量開始剔除)第9章 非經(jīng)典假設(shè)、線性方程組、面板數(shù)據(jù)估計(jì)的Stata實(shí)現(xiàn)9.1 非經(jīng)典假設(shè)下的回歸分析的Stata實(shí)現(xiàn)1.多重共線性的檢驗(yàn)和處理(1)多重共線性的檢驗(yàn):用命令 vif/該命令用來得到自變量的方差膨脹因子。 一般而言,判斷多重共線性的標(biāo)準(zhǔn)是:a. 最大的vif大于10b. 平均的vif大于1(2)多重多線性的處理方法一:不加處理(往往是因?yàn)榧佣雾?xiàng)引起的,而這是有原因的)方法二:減少自變量,將一些解釋變量并入誤差項(xiàng)方法三:先采用在后面的將介紹的主成分分析和聚類分析,先將變量分類,然后再做回歸分析2.內(nèi)生性的檢驗(yàn)和處理(外生性即:E(u|x)=0)外生性的假設(shè)是所有假設(shè)中
33、最重要的假設(shè),違反它將合得估計(jì)值不一致。內(nèi)生性檢驗(yàn)的命令是ovtest,它必須在regress命令之后。結(jié)果上,我們需要拒絕原假設(shè)(p0.05),即認(rèn)為數(shù)據(jù)確實(shí)有內(nèi)生性問題 Stata中是用ivreg命令實(shí)現(xiàn)工具變量回歸的,ivreg命令的語法是 ivregress estimator depvar varlist1 (varlist2=varlist_iv)如:reg wage educ age kidslt6 kidsge6 exper expersq/沒使用工具變量 reg wage age kidslt6 kidsge6 exper expersq(educ=motheduc)/使用工
34、具變量3、異方差的檢驗(yàn)與處理(1)異方差的檢驗(yàn):用hettest/檢驗(yàn)異方差,看p值,小于0.05,不能排除異方差可能(2)異方差的處理:只要在reg命令的options選項(xiàng)中選擇robust選項(xiàng)即可。然后再用test命令做檢驗(yàn)如:reg wage educ age kidslt6 kidsge6 exper expersq ,robust9.2 線性方程組的回歸分析-Stata實(shí)現(xiàn)線性方程組包括兩類:似不相關(guān)模型以及聯(lián)立方程組模型1. 似不相關(guān)模型的Stata實(shí)現(xiàn)sureg (depvar1 varlist1) (depvar2 varlist2)(depvarN varlistN)ifin
35、weight2. 聯(lián)立方程組模型的Stata實(shí)現(xiàn)reg3 (depvar1 varlist1) (depvar2 varlist2)(depvarN varlistN)ifinweight9.3 面板數(shù)據(jù)的Stata處理 Stata并不會(huì)自動(dòng)識(shí)別面板數(shù)據(jù),必須告訴它哪個(gè)變量是時(shí)間維度,哪個(gè)變量是橫截面維度。在Stata中,要設(shè)置面板數(shù)據(jù)維度,可以使用xtset命令。其語法是:xtset panelvar timervar ,tsoptions (panelvar 是用來表示橫截面維度的變量,timevar是用來表示時(shí)間維度的變量 )1. 固定效應(yīng)的面板數(shù)據(jù)Stata實(shí)現(xiàn)Xtreg用來做固定效應(yīng)
36、的語法是:Fixed-effects (FE) model Xtreg depvar indepvars ifinweight,fe FE_options(depvar表示因變量,varslist表示自變量,fe表示fixed effect固定效應(yīng))Xtreg 常用選項(xiàng)(1)fe使用固定效應(yīng)回歸 (2)robust 穩(wěn)健回歸 (3)level(#)設(shè)置置信水平,默認(rèn)為95%2.隨機(jī)效應(yīng)的面板數(shù)據(jù)Stata實(shí)現(xiàn)隨機(jī)效應(yīng)的方式處理面板數(shù)據(jù)的思想是將個(gè)人特質(zhì)看做與自變量不相關(guān),然后用傳統(tǒng)方法處理。也是使用xtreg命令,只不過選項(xiàng)由fe變?yōu)閞e,其語法為:xtreg depvar indepvarsifin,re RE_options(選項(xiàng)僅多一個(gè)theta:報(bào)告)第10章 非線性回歸分析及回歸診斷基礎(chǔ)101 非線性回歸分析第7章的有部分非線性模型可以轉(zhuǎn)為線性模型,這里介紹的是沒有辦法轉(zhuǎn)化為線性回歸的回歸模型。1.非線性回歸的Stata實(shí)現(xiàn)-nl命令 nl命令是用來實(shí)現(xiàn)單個(gè)自變量的非線性回歸模型的Stata命令。語法:Interactive version nl (depvar=) ifinweight,optionsdepvar表示因變量,sexp用以表達(dá)非線性的形式如:nl exp2 wage educ/非線性回歸估計(jì)方法,用于估計(jì)12x形式的非線性模型參數(shù)10.2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年環(huán)保型交通工具銷售及售后服務(wù)協(xié)議3篇
- 2024年飛行員培養(yǎng)合同:飛行員委托培養(yǎng)協(xié)議2篇
- 《何謂自我概念》課件
- 生鮮豬肉知識(shí)培訓(xùn)課件
- 2024年特種壓力容器定制安裝協(xié)議版B版
- 上海建筑工人勞動(dòng)服務(wù)協(xié)議(2024年度)版
- 2024年度專屬碳排放交易合同(復(fù)雜版)
- ICU院感知識(shí)培訓(xùn)課件
- 昭通學(xué)院《大學(xué)計(jì)算機(jī)程序設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024校企合作高校學(xué)生就業(yè)服務(wù)與職業(yè)發(fā)展規(guī)劃協(xié)議3篇
- 就這樣當(dāng)班主任讀書分享
- 某kv送電線路鐵塔組立監(jiān)理細(xì)則
- 武艷艷數(shù)學(xué)思政課教學(xué)設(shè)計(jì)《式與方程的整理復(fù)習(xí)》
- 氣柜安裝工程施工方案
- GB/T 31989-2015高壓電力用戶用電安全
- GB/T 28750-2012節(jié)能量測(cè)量和驗(yàn)證技術(shù)通則
- 分子生物學(xué)本基因組及基因組學(xué)概論
- 殘液(殘氣)處理記錄表
- 《人工智能》全冊(cè)配套課件
- 大佛頂首楞嚴(yán)經(jīng)淺釋
- 高職大?!扼w育與健康》課程標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論