中國(guó)工業(yè)企業(yè)數(shù)據(jù)庫(kù)與Stata簡(jiǎn)介_(kāi)第1頁(yè)
中國(guó)工業(yè)企業(yè)數(shù)據(jù)庫(kù)與Stata簡(jiǎn)介_(kāi)第2頁(yè)
中國(guó)工業(yè)企業(yè)數(shù)據(jù)庫(kù)與Stata簡(jiǎn)介_(kāi)第3頁(yè)
中國(guó)工業(yè)企業(yè)數(shù)據(jù)庫(kù)與Stata簡(jiǎn)介_(kāi)第4頁(yè)
中國(guó)工業(yè)企業(yè)數(shù)據(jù)庫(kù)與Stata簡(jiǎn)介_(kāi)第5頁(yè)
已閱讀5頁(yè),還剩45頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

中國(guó)工業(yè)企業(yè)數(shù)據(jù)庫(kù)與Stata簡(jiǎn)介第一頁(yè),共50頁(yè)。1、中國(guó)工業(yè)企業(yè)數(shù)據(jù)庫(kù)介紹2、數(shù)據(jù)格式轉(zhuǎn)換——Stat-Transfer軟件介紹3、Stata12介紹4、Stata操作實(shí)例主要內(nèi)容第二頁(yè),共50頁(yè)。1.數(shù)據(jù)庫(kù)介紹中國(guó)工業(yè)企業(yè)數(shù)據(jù)庫(kù)來(lái)源于國(guó)家統(tǒng)計(jì)局。數(shù)據(jù)庫(kù)的統(tǒng)計(jì)對(duì)象為規(guī)模以上工業(yè)企業(yè),包括全部國(guó)有工業(yè)企業(yè)和年主營(yíng)業(yè)務(wù)收入500萬(wàn)元及以上的非國(guó)有工業(yè)企業(yè),與《中國(guó)統(tǒng)計(jì)年鑒》的工業(yè)部分和《中國(guó)工業(yè)統(tǒng)計(jì)年鑒》的覆蓋范圍一致。區(qū)別是工業(yè)企業(yè)數(shù)據(jù)庫(kù)是企業(yè)層面的原始數(shù)據(jù),而“年鑒”是按不同維度得到的加總數(shù)據(jù)。

第三頁(yè),共50頁(yè)。截止2011年,數(shù)據(jù)庫(kù)共收錄了58萬(wàn)多家工業(yè)企業(yè),占中國(guó)工業(yè)總產(chǎn)值的95%左右,覆蓋了中國(guó)工業(yè)40多個(gè)大類、90多個(gè)中類、600多個(gè)小類,每個(gè)企業(yè)提供超過(guò)上百個(gè)變量,是目前國(guó)內(nèi)最為全面和權(quán)威的企業(yè)層面數(shù)據(jù)。該數(shù)據(jù)庫(kù)是我國(guó)經(jīng)濟(jì)學(xué)和管理學(xué)研究領(lǐng)域的重要資料,利用該數(shù)據(jù)庫(kù)已有很多學(xué)者做出了非常有價(jià)值的研究成果。受數(shù)據(jù)取得難度的限制,擁有該數(shù)據(jù)庫(kù)的研究機(jī)構(gòu)在國(guó)內(nèi)還并不多,因此該數(shù)據(jù)庫(kù)在研究領(lǐng)域有廣闊的應(yīng)用前景。1.數(shù)據(jù)庫(kù)介紹第四頁(yè),共50頁(yè)。1.數(shù)據(jù)庫(kù)介紹數(shù)據(jù)庫(kù)里的企業(yè)用“法人代碼”(FRDM)作為標(biāo)志。數(shù)據(jù)庫(kù)覆蓋的企業(yè)不會(huì)一成不變,每年都有新增企業(yè)和減少企業(yè),絕大部分企業(yè)的資料是連續(xù)的。盡管原則上每個(gè)企業(yè)的法人代碼不會(huì)改變,在極少數(shù)情況下,企業(yè)會(huì)改換企業(yè)名稱或法人代碼。數(shù)據(jù)庫(kù)從1995年開(kāi)始,最近更新到2011年。第五頁(yè),共50頁(yè)。1.數(shù)據(jù)庫(kù)介紹數(shù)據(jù)庫(kù)對(duì)每個(gè)企業(yè)給出兩類信息,一是企業(yè)經(jīng)營(yíng)成果有關(guān)的信息,包括資金流量表、資產(chǎn)負(fù)債表和損益表的主要信息,以及雇用員工和生產(chǎn)活動(dòng)信息;二是對(duì)企業(yè)身份、生產(chǎn)經(jīng)營(yíng)活動(dòng)內(nèi)容和狀態(tài)進(jìn)行定性描述的信息,以代碼的形式出現(xiàn),在使用時(shí)需要使用參照代碼表。

第六頁(yè),共50頁(yè)。2.Stat-Transfer介紹Transfer軟件專用于轉(zhuǎn)換不同格式的數(shù)據(jù)文件,Access數(shù)據(jù)通過(guò)Transfer軟件可轉(zhuǎn)換為Stata格式的數(shù)據(jù)。(1)數(shù)據(jù)轉(zhuǎn)換(Transfer)選項(xiàng)卡(2)變量選擇(Variables)選項(xiàng)卡(3)記錄選擇(Observations)選項(xiàng)卡(4)其他選項(xiàng)(Option)選項(xiàng)卡

第七頁(yè),共50頁(yè)。在Transfer這個(gè)界面上,通過(guò)幾個(gè)下拉式菜單,選擇需要轉(zhuǎn)換數(shù)據(jù)庫(kù)的源文件和目標(biāo)文件的類型、名稱,點(diǎn)擊轉(zhuǎn)換(Transfer)就可實(shí)現(xiàn)數(shù)據(jù)間的簡(jiǎn)單轉(zhuǎn)換。軟件支持的數(shù)據(jù)類型包括我們常用的SAS、SPSS、STATA、S-Plus、Excel、EpiInfo等等。如果在轉(zhuǎn)換數(shù)據(jù)時(shí),只對(duì)其中的一部分觀察值感興趣,可以利用“變量選擇”或者“記錄選擇”,進(jìn)行部分?jǐn)?shù)據(jù)轉(zhuǎn)換。2.Stat-Transfer介紹第八頁(yè),共50頁(yè)。在變量選擇上,可選擇全部變量,亦可選擇部分變量,同時(shí)還可在轉(zhuǎn)換中重新設(shè)置變量輸出的數(shù)據(jù)類型,如浮點(diǎn)型(float),日期型(date),時(shí)間型(time),字符型(string)等。軟件還支持優(yōu)化(Optimize)功能;UseDoubles選項(xiàng)在轉(zhuǎn)換時(shí)可將有小數(shù)位的變量設(shè)置成雙精度型(double),保證數(shù)據(jù)的精度;DropConstants選項(xiàng),則自動(dòng)將變量值恒為常數(shù)或缺失值的變量略去,這在數(shù)據(jù)繁多時(shí)特別能體現(xiàn)出其優(yōu)越性。2.Stat-Transfer介紹第九頁(yè),共50頁(yè)。在記錄選擇上,可選擇全部記錄,亦可選擇部分記錄。這一部分的記錄選取,用戶可以通過(guò)條件限定來(lái)實(shí)現(xiàn)。如:要求Variable1的值大于300或者Variable2的值為偶數(shù),在選項(xiàng)卡的文本框中輸入相應(yīng)的約束條件:whereVariable1>300,或者whereVariable2%2=0。還可以利用軟件自帶的函數(shù)來(lái)實(shí)現(xiàn)一些較復(fù)雜的數(shù)據(jù)選取,例如,按20%比例進(jìn)行簡(jiǎn)單隨機(jī)抽樣(wheresamp_rand(0.2)),按10%比例進(jìn)行系統(tǒng)抽樣(間隔抽樣)(wheresamp_syst(10))。

2.Stat-Transfer介紹第十頁(yè),共50頁(yè)。Transfer軟件還提供了一些其它的功能,如在轉(zhuǎn)換過(guò)程中更換變量名,自動(dòng)運(yùn)行變量輸出類型的優(yōu)化功能,設(shè)置日期時(shí)間型數(shù)據(jù)的讀寫(xiě)格式,對(duì)缺失值的各種處理方式的設(shè)定,隨機(jī)種子的產(chǎn)生或設(shè)定,設(shè)置文本格式文件的讀取格式,Excel工作簿中工作表的選取,覆蓋文件前確認(rèn)提示等其它功能。2.Stat-Transfer介紹第十一頁(yè),共50頁(yè)。3.Stata12介紹Stata軟件是現(xiàn)今較為流行的統(tǒng)計(jì)計(jì)量分析軟件,具有強(qiáng)大的數(shù)據(jù)處理和分析功能,且操作簡(jiǎn)單、使用靈活、易學(xué)易用、運(yùn)行速度極快。Stata的另一個(gè)特點(diǎn)是它的許多高級(jí)統(tǒng)計(jì)模塊均是編程人員用宏語(yǔ)言寫(xiě)成的程序文件(ADO文件),這些文件可以自行修改、添加和下載。安裝好Stata后,點(diǎn)擊電腦桌面上的Stata圖標(biāo),即可打開(kāi)Stata。此時(shí)可以看到,在最上方有一排菜單,即“DataGraphicsStatisticsUserWindowHelp”。在此之下,有五個(gè)窗口,分別為:第十二頁(yè),共50頁(yè)。左上“Review”(歷史窗口):記錄著自啟動(dòng)Stata以來(lái)的命令。右上“Variables”(變量窗口):記錄著Stata內(nèi)存中的所有變量。右下“Properties”(性質(zhì)窗口):顯示當(dāng)前數(shù)據(jù)文件與變量的性質(zhì)中上“Results”(結(jié)果窗口):顯示執(zhí)行Stata命令后的輸出結(jié)果。中下“Command”(命令窗口):在此窗口輸入Stata命令。第十三頁(yè),共50頁(yè)。3.尋求幫助與網(wǎng)絡(luò)資源通過(guò)多種途徑可以獲得Stata的幫助,主要的途徑有三個(gè):手冊(cè)、Stata自帶幫助和網(wǎng)絡(luò)幫助。Stata手冊(cè)是一本學(xué)習(xí)Stata使用的權(quán)威書(shū)籍,它按字母順序排列出了Stata所有相關(guān)的命令。Stata的自帶幫助系統(tǒng)是使用最方便,也是最常用的方法,我們可以在記住極少量基本命令的基礎(chǔ)上,方便地運(yùn)用Stata命令。第十四頁(yè),共50頁(yè)。3.help和search

Stata自帶幫助系統(tǒng):help顯示出Stata所有幫助內(nèi)容的目錄結(jié)構(gòu)。比如想了解regress的用法,可在StataCommand中輸入如下語(yǔ)句:

helpregressStata會(huì)提供關(guān)于regress用法的詳細(xì)說(shuō)明,并配以例子。第十五頁(yè),共50頁(yè)。3.help和search

網(wǎng)絡(luò)幫助可以采用如下命令獲得

finditscat3searchscat3

這兩條命令等價(jià),均為尋找繪三維立體圖的命令scat3。由于scat3不是Stata內(nèi)置命令,所以需要通過(guò)這兩個(gè)命令搜索并下載安裝后才能使用。區(qū)別:help用于查找精確的命令名,search是模糊查找,findit與search命令類似,但其可以進(jìn)一步搜索網(wǎng)絡(luò)上的信息。第十六頁(yè),共50頁(yè)。3.幾個(gè)主要的網(wǎng)站(1)STATA公司官方網(wǎng)站

(2)STATA資源鏈接

(3)STATA出版社

(4)STATA電子雜志

(5)STATA技術(shù)公告版第十七頁(yè),共50頁(yè)。4、Stata操作與實(shí)例4.1Stata的日志4.2do文件4.3數(shù)據(jù)導(dǎo)入4.4變量的生成與處理4.5數(shù)據(jù)的合并4.6數(shù)據(jù)類型轉(zhuǎn)換4.7描述統(tǒng)計(jì)4.8畫(huà)圖4.9回歸分析第十八頁(yè),共50頁(yè)。4.1Stata的日志

log文件以后綴“.log”表示,用于記錄Stata的運(yùn)行結(jié)果。可點(diǎn)擊菜單“File”→“Log”→“Begin”,然后輸入日志(log)的文件名,并存儲(chǔ)在指定的位置。此后,在Stata中的所有操作及其輸出結(jié)果,都將被記錄在此日志中,直至選擇退出。如果要暫時(shí)關(guān)閉日志(不再記錄輸出結(jié)果),輸入命令“l(fā)ogoff”。如果要恢復(fù)使用日志,輸入命令“l(fā)ogon”。如果要徹底退出日志,輸入命令“l(fā)ogclose”。如果要查看日志文件中的內(nèi)容,點(diǎn)擊存儲(chǔ)位置上的日志文件圖標(biāo)即可。第十九頁(yè),共50頁(yè)。4.1Stata的日志

例:(開(kāi)始運(yùn)行)logusingD:\Econometrics\logfiles\20150510.log….(Stata命令)…..logclose(結(jié)束運(yùn)行)從而20150510.log就記錄了從“l(fā)ogusing”命令到“l(fā)ogclose”命令之間Stata運(yùn)行的所有結(jié)果。第二十頁(yè),共50頁(yè)。4.2do文件用Stata的do文件編輯器記下做過(guò)的工作:在Stata窗口上部的工具欄中有一個(gè)小按鈕,把鼠標(biāo)放上去會(huì)出現(xiàn)“NewDo-”,點(diǎn)擊它就會(huì)出現(xiàn)do文件編輯器。在do-file文件中,用*表示注釋內(nèi)容,Stata在運(yùn)行do-file文件時(shí)會(huì)跳過(guò)這些注釋語(yǔ)句。第二十一頁(yè),共50頁(yè)。4.3將數(shù)據(jù)導(dǎo)入Stata打開(kāi)Stata軟件后,點(diǎn)擊Data→DataEditor圖標(biāo),即可打開(kāi)一個(gè)類似Excel的空白表格。然后,用Excel打開(kāi)文件,復(fù)制文件中的相關(guān)數(shù)據(jù),并粘貼到DataEditor中。導(dǎo)入數(shù)據(jù)的另一方法是,點(diǎn)擊菜單“File”→“Import”,然后導(dǎo)入各種格式的數(shù)據(jù)。Stata默認(rèn)的數(shù)據(jù)文件擴(kuò)展名為.dta,打開(kāi)stata內(nèi)置的auto.dta數(shù)據(jù)庫(kù),命令:useauto注意:Stata中字母的大小寫(xiě)是嚴(yán)格區(qū)分的,因此Stata建議對(duì)于變量名一律使用小寫(xiě)字母。第二十二頁(yè),共50頁(yè)。4.3將數(shù)據(jù)導(dǎo)入Statause命令的基本語(yǔ)句,具體格式如下:

use[varlist][if][in]using[,clearnolabel]含義說(shuō)明:use是打開(kāi)數(shù)據(jù)的命令語(yǔ)句,varlist代表變量名

稱,if是條件語(yǔ)句,in是范圍語(yǔ)句,using代表數(shù)據(jù)

文件路徑。(1)打開(kāi)數(shù)據(jù)文件中的全部數(shù)據(jù)如果想要打開(kāi)auto數(shù)據(jù)文件中的全部數(shù)據(jù),輸入命令:

useautoauto.dta美國(guó)汽車產(chǎn)業(yè)的橫截面數(shù)據(jù)(1978年),變量主要包括:price=汽車的價(jià)格,mpg=每加侖油所行駛的英里數(shù),weight=汽車的重量,foreign表示是否是進(jìn)口車,如果foreign=0代表是國(guó)產(chǎn)車,如果foreign=1代表是進(jìn)口車。第二十三頁(yè),共50頁(yè)。4.3將數(shù)據(jù)導(dǎo)入Stata(2)打開(kāi)數(shù)據(jù)文件中的部分變量有時(shí),并不需要將數(shù)據(jù)文件中的所有變量全部打開(kāi),因?yàn)樵紨?shù)據(jù)內(nèi)容豐富,含有很多變量,而研究可能只涉及其中的幾個(gè)變量。所以若只打開(kāi)auto文件中的make和price這兩個(gè)變量,應(yīng)該使用如下命令:usemakepriceusingautousemakeprice部分表示需要打開(kāi)make和price兩個(gè)變量,usingauto部分表示打開(kāi)的數(shù)據(jù)文件路徑及名稱。第二十四頁(yè),共50頁(yè)。4.4變量生成與處理(1)生成新變量命令格式:generatenewvar=exp[ifexp][inrange]

含義說(shuō)明:newvar是生成的新變量,exp是由現(xiàn)有變量生成新變量的算術(shù)或邏輯表達(dá)式,[ifexp]和[inrange]指定對(duì)哪些觀測(cè)計(jì)算新變量值。比如:gena=f314*f314(新變量a等于f314的平方)

genF=f314/v210

變量含義:f314固定資產(chǎn)凈值年平均余額

v210從業(yè)人員平均人數(shù)第二十五頁(yè),共50頁(yè)。4.4變量生成與處理(2)對(duì)現(xiàn)有變量重新賦值命令格式:replaceoldvar=exp[ifexp][inrange]含義說(shuō)明:oldvar為現(xiàn)有的變量。對(duì)滿足[ifexp]和[inrange]的樣本,oldvar將根據(jù)表達(dá)式exp重新賦值。比如:replacev211=.ifv211<=0(若工業(yè)增加值非正,令其取缺失值)

replacev211=25in10(令第10個(gè)觀測(cè)中v211為25)gen和replace…if常常在一起使用第二十六頁(yè),共50頁(yè)。4.4變量生成與處理(3)改變變量名命令格式:renameoldvarnewvar

含義說(shuō)明:oldvar是原變量名,

newvar是新變量名。(4)刪除變量或觀測(cè)

dropvarlist(去掉varlist指定的變量)

drop_all(去掉全部變量)

dropifexp(去掉符合表達(dá)式exp的觀測(cè))dropinrange(去掉處在range指定范圍內(nèi)的觀測(cè))第二十七頁(yè),共50頁(yè)。4.4變量生成與處理(5)保留變量或觀測(cè)

keepvarlist(保留varlist指定的變量,其余變量去掉)

keepifexp(保留符合表達(dá)式exp的觀測(cè),其余觀測(cè)去掉)keepinrange(保留處在range指定范圍內(nèi)的觀測(cè))(6)觀測(cè)排序命令格式:sortvarlist[in][,stable]含義說(shuō)明:將全部觀測(cè)按指定的變量按升序排列。varlist中可以有不止一個(gè)變量。比如:sortB07v209

(先將變量B07進(jìn)行排序,再在同一個(gè)B07的范圍內(nèi)對(duì)v209從小到大進(jìn)行排序)第二十八頁(yè),共50頁(yè)。4.4變量生成與處理(7)生成虛擬變量方法1:genvarname=1if(取值為一的限制條件)

replacevarname=0if(取值為零的限制條件)方法2:基于類別變量生成虛擬變量命令:

taboldvar,gen(newvar)比如:tabb05,gen(b05dum)b05省地縣碼虛擬變量的數(shù)目因已知變量的分類而異。若現(xiàn)存變量有兩個(gè)取值,則生成兩個(gè)虛擬變量。第二十九頁(yè),共50頁(yè)。方法3:Stata提供的xi命令能很方便地實(shí)現(xiàn)對(duì)類別變量生成虛擬變量。xi命令最基本的用法:

xi[,prefix(string)]i.varnamevarname是某一分類變量,設(shè)其共有K個(gè)可能的取值;string是prefix()指定的前綴。上述指令生成了K-1個(gè)虛擬變量:stringvarname_2,stringvarname_3,…,stringvarname_K。其中stringvarname表示字符串string和varname的聯(lián)合。如果不使用[,prefix(string)]選項(xiàng),則默認(rèn)的前綴是_I。比如:xi,prefix(_T)i.b054.4變量生成與處理第三十頁(yè),共50頁(yè)。4.5數(shù)據(jù)的合并數(shù)據(jù)文件的合并涉及兩個(gè)數(shù)據(jù)文件:在memory中的和不在memory中的。稱前者為原數(shù)據(jù)文件(themasterdata),后者為新數(shù)據(jù)文件(theusingdata)。數(shù)據(jù)文件的合并有兩種情形。若新數(shù)據(jù)文件與原數(shù)據(jù)文件的變量完全一樣,此時(shí)新數(shù)據(jù)文件相當(dāng)于新的觀測(cè),使用append命令:

appendusing

其中是新數(shù)據(jù)文件的文件名。第三十一頁(yè),共50頁(yè)。4.5數(shù)據(jù)的合并若新數(shù)據(jù)文件與原數(shù)據(jù)文件對(duì)應(yīng)著同樣的觀測(cè),但變量不全一樣,則使用merge命令:

merge1:1[varlist]using

其中是新數(shù)據(jù)文件的文件名,varlist是合并的依據(jù),varlist(可以不止一個(gè)變量)取值一樣的觀測(cè)視為同一個(gè)觀測(cè)。在合并之前,原數(shù)據(jù)文件和新數(shù)據(jù)文件都要先按照varlist排序。如果除了varlist外,原數(shù)據(jù)文件和新數(shù)據(jù)文件還有一部分變量是相同的。對(duì)這部分變量,merge命令有兩個(gè)常用的選項(xiàng)。第三十二頁(yè),共50頁(yè)。4.5數(shù)據(jù)的合并merge1:1[varlist]using,update將原數(shù)據(jù)文件中的缺失值替換成新數(shù)據(jù)文件中的相應(yīng)值(前提是后者不缺失)。merge1:1[varlist]using,updatereplace將原數(shù)據(jù)文件中的變量值替換成新數(shù)據(jù)文件中的相應(yīng)值(前提是兩者不一樣)。在這兩種情形下,merge自動(dòng)生成一個(gè)指示變量_merge。該變量的不同取值,代表了合并的不同情形。但一般會(huì)連續(xù)進(jìn)行幾次merge操作,所以在完成一次merge后應(yīng)馬上使用drop_merge指令將其去掉。第三十三頁(yè),共50頁(yè)。4.6變量類型轉(zhuǎn)換Stata通常把變量劃分為三類:數(shù)值型,字符型和日期型字符型變量之間不能進(jìn)行數(shù)值計(jì)算,所以如果對(duì)字符型變量進(jìn)行數(shù)值計(jì)算,Stata則會(huì)提醒出現(xiàn)系統(tǒng)錯(cuò)誤,這時(shí)必須將字符型變量轉(zhuǎn)化成數(shù)值型變量,才能進(jìn)行正確的計(jì)算。字符型變量轉(zhuǎn)化成數(shù)值型變量命令:

destring[varlist],{generate(newvarlist)|replace}[options]這個(gè)命令語(yǔ)句中,varlist是進(jìn)行數(shù)據(jù)轉(zhuǎn)化的變量名稱,generate(newvarlist)|replace表示生成新的變量或者替換原來(lái)的變量,options的具體內(nèi)容如表2.3所示。第三十四頁(yè),共50頁(yè)。4.6變量類型轉(zhuǎn)換比如:destringb10,gen(B10)ignore(“$”)destringb10,gen(B10)force數(shù)值型變量轉(zhuǎn)化為字符型變量:

tostring[varlist],[generate(newvarlist)|replace][options]第三十五頁(yè),共50頁(yè)。4.7描述統(tǒng)計(jì)describe命令可以描述數(shù)據(jù)文件的整體,包括觀測(cè)總數(shù),變量總數(shù),生成日期,每個(gè)變量的存儲(chǔ)類型,標(biāo)簽(label)等。如果數(shù)據(jù)文件不是很大,可以直接在StataResults中顯示數(shù)據(jù),使用如下命令:list[varlist][if][in][,options]其中,varlist是變量列表(即多個(gè)變量,如變量1、變量2直至變量n),此處命令置于方括號(hào)中,說(shuō)明變量列表可有可無(wú)。如果varlist省略,則默認(rèn)命令作用的對(duì)象為數(shù)據(jù)庫(kù)中所有變量。if和in均為可選條件。最后的options為可選項(xiàng),在寫(xiě)命令時(shí)要置于逗號(hào)后。第三十六頁(yè),共50頁(yè)。4.7描述統(tǒng)計(jì)summarize命令:

summarize[varlist][weight][if][in][,detail]summarize可以提供varlist指定變量(可以不止一個(gè))的如下統(tǒng)計(jì)量:Percentiles(分位數(shù)),

Largest(四個(gè)最大的數(shù)),Smallest(四個(gè)最小的數(shù)),Mean(均值),Variance(方差),Std.Dev.(標(biāo)準(zhǔn)差),Skewness(偏度),Kurtosis(峰度).比如:sumpgweightifforeign==1第三十七頁(yè),共50頁(yè)。4.7描述統(tǒng)計(jì)tabstat命令

tabstatvarlist[weight][if][in][,stats(statname[...])]tabstat提供[,stats(statname[...])]指定的統(tǒng)計(jì)量,可供選擇的有mean,count(非缺失觀測(cè)值個(gè)數(shù)),sum,max,min,range(最大值-最小值),sd,var,cv(變易系數(shù)),skewness(偏度),kurtosis(峰度),median(中位數(shù)),p1(1%分位數(shù),類似地有p5,p25,p50,p75,p95。比如,想知道變量price在整個(gè)樣本的均值和方差,可使用如下命令:

tabstatprice

,stats(meanvar)第三十八頁(yè),共50頁(yè)。4.8畫(huà)圖(1)Stata提供了非常強(qiáng)大的畫(huà)圖功能。畫(huà)圖與描述統(tǒng)計(jì)一樣,都是要揭示單個(gè)變量的分布或多個(gè)變量之間的關(guān)系,只是以圖形的形式更為直觀。在具體畫(huà)圖時(shí),可以參看Stata的GraphicsReferenceManual或使用helpgraph指令。(2)對(duì)單個(gè)變量,Stata能畫(huà)如下圖案:直方圖histogramy(y是變量名,下同)箱線圖graphboxy

圓形圖(餅圖)graphpiey

核密度函數(shù)kdensityyQQ圖qnormy第三十九頁(yè),共50頁(yè)。(3)兩個(gè)變量的散點(diǎn)圖graphtwowayscatteryx(y對(duì)x的散點(diǎn)圖)graphtwowaylineyx(以x為橫座標(biāo),y為縱座標(biāo)的點(diǎn)連成的折線)graphtwowayconnectedyx(以x為橫座標(biāo),y為縱座標(biāo)的點(diǎn)連成折線,但轉(zhuǎn)角處特別標(biāo)出)graphtwowaylfityx(y對(duì)x回歸的回歸直線)4.8畫(huà)圖第四十頁(yè),共50頁(yè)。(4)一個(gè)變量的總體統(tǒng)計(jì)量對(duì)另一個(gè)變量(一般為分類變量)的條形圖graphbar(mean)y,over(x)(y的平均值與x的關(guān)系)graphbar(median)y,over(x)(y的中位數(shù)與x的關(guān)系)(5)多個(gè)變量的散點(diǎn)圖graphmatrixx1x2x3x4y(x1,x2,x3,x4,y兩兩之間的散點(diǎn)圖)4.8畫(huà)圖第四十一頁(yè),共50頁(yè)。4.8畫(huà)圖有一些通用的選項(xiàng)可以給圖形“潤(rùn)色”:標(biāo)題title(“string”)(string可為任意的字符串,下同)腳注note(“string”)

橫座標(biāo)標(biāo)題xtitle(“string”)

縱座標(biāo)標(biāo)題ytitle(“string”)

橫座標(biāo)范圍xaxis(a,b)(a<b為兩個(gè)數(shù)字,下同)縱座標(biāo)范圍yaxis(a,b)

插入文字text(該命令既要指定插入文字的內(nèi)容,也要指定插入的位置)插入圖例legend(該命令既要指定圖例的內(nèi)容,也要指定其位置)第四十二頁(yè),共50頁(yè)。kdensity:繪制核密度圖命令格式:

kdensityvarname[in][if][,options]含義說(shuō)明:此命令用于繪制某一變量的核密度圖,即觀察數(shù)據(jù)分布情況。此圖橫坐標(biāo)為變量,縱坐標(biāo)為頻率,面積為累計(jì)頻率。比如:

kdensityprice,ytitle(“核密度”)xtitle(“價(jià)格”)twokdensitypriceifforeign==1||kdensitypriceifforeign==0第四十三頁(yè),共50頁(yè)。4.9回歸分析命令格式:

regress

depvar[indepvars][if][in][weight][,options]含義說(shuō)明:

(1)regress是最小線性二乘回歸(OLS,Ordinary

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論