版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、STATA基本入門、八、刖言STATA是 一個十分好用而且簡單的統(tǒng)計軟件包,透過輕松的數(shù)據(jù)輸入方式,而且簡單的指令,即可執(zhí)行一般在計量經(jīng)濟學(xué)上常用的計量模型。除了計量模型 外,STATA勺軟件包中也可執(zhí)行統(tǒng)計學(xué)中的估計和檢定,甚至是多變量分析中的 各項分析工具。因此,STATA可以說是一個相當強而有力的統(tǒng)計軟件。一、安裝STATA所須的內(nèi)存容量不大,只有。此外,安裝也相當簡單,只要在SETUP上點兩下,安裝完成后再分別輸入”Sn”、”Code和”Key”即可開始使用。 但是安裝過程中有一點必須注意的是,如下圖所示,有”Intercooled” 和”Small”兩個選項。一般而言,為了方便日后要
2、設(shè)定較大的內(nèi)存容量來處理 大筆的資料,通常選擇以”In tercooled”進行安裝。、窗口介紹以此項進行安裝安裝完成后,點選桌面上STATA勺圖標,窗口畫面如下圖所示。為了使畫面美觀,我們可以將畫面拉到自己喜歡的地方,如下圖所示。為了保存這個窗口 畫面,我們必須點選工具列上的”Prefs”下的”Save Windowing Preferences”。如此一來,以后開啟STATA寸都會以此窗口畫面呈現(xiàn)。(1)確認數(shù)據(jù)輸入無誤;(2)只要在某變量上點選兩下,該變量即會出現(xiàn)在窗口”Stata Comma nd上。右上一Stata Results:此一窗口用于呈現(xiàn)并記錄指令執(zhí)行后的結(jié)果。右下一Sta
3、ta Comma nd:此一窗口用于輸入所欲執(zhí)行的指令。Note:以上四個窗口都可以從”Fo nts”去更改字體大小。三、輸入數(shù)據(jù)(Entering data)在本小節(jié)中,我們將介紹如何把數(shù)據(jù)讀進STAT A但是在正式介紹之前,我 們必須先對幾個一般性的指令(gen eral comma nd)有所了解,說明如下:cd:即change directory,簡言之,告知STATA數(shù)據(jù)儲存的地方。例如當 數(shù)據(jù)儲存在e槽的sample數(shù)據(jù)夾時,則必須先輸入cd e:sample。dir /ls:用來顯示目錄的內(nèi)容。set memory #m設(shè)定內(nèi)存的容量。例如:當有一筆龐大的數(shù)據(jù)要處理時,則可設(shè)定1
4、00mb的容量,此時可輸入set memory100n。(輸入指令memory可以知道內(nèi)存容量的大小以及使用 情況。)set matsize #:設(shè)定所需的變量個數(shù)。一般而言,不須對此部分進行設(shè)定, 除非所欲處理的資料龐大或是當執(zhí)行后出現(xiàn)matsize too small的訊息時再進行修改即可。內(nèi)建為40。set more off / on:若欲執(zhí)行結(jié)果以分頁的型式呈現(xiàn)時,則輸入set more on; 若欲執(zhí)行結(jié)果同時呈現(xiàn)時,則輸入set more off。保留於此接下來,我們依序介紹四個窗口的功用:左上一Review:此一窗口用于記錄在開啟STATA后所執(zhí)行過的所有指令。因此, 若欲使用重
5、復(fù)的指令時,只要在該指令上點選兩下即可執(zhí)行相 同的指令;若欲使用類似的指令時,在該指令上點一下,該指 令即會出現(xiàn)在窗口”Stata Command上,再進行修改即可。此 夕卜,STATA還可以將執(zhí)行過的指令儲存下來,存在一個do-file內(nèi),下次即可再執(zhí)行相同的指令。下一Variables:此一窗口用于呈現(xiàn)某筆數(shù)據(jù)中的所有變量。換言之,當數(shù)據(jù) 中的變量都有其名稱時,變量名稱將會出現(xiàn)在此一窗口中。只要數(shù)據(jù)有讀進STATA中,變量名稱就會出現(xiàn)。它的優(yōu)點是在此輸入指令執(zhí)行過的指令都會資料中的變數(shù)在這裡指令的執(zhí)行結(jié)果看這裡help:求助鍵。后面必須接的是指令。說明如何使用該指令,例如:help reg
6、ress。search:求助鍵。后面可接任何文字。說明在何處可以找到該文字。例如:searchnormal distribution。clear:清除鍵。用來刪除所有數(shù)據(jù)。接下來,根據(jù)數(shù)據(jù)類型或指令的不同,數(shù)據(jù)輸入的方法可分成以下四種:1、輸入EXCELS 據(jù)將EXCEL勺數(shù)據(jù)輸入STATA勺方式還可細分成以下兩種:將EXCEL勺數(shù)據(jù)輸入STAT/之前,必須先將數(shù)據(jù)存成csv文件,再利用指令in sheet來讀數(shù)據(jù)。Example:當csv檔的第一列有變量名稱時:cd e:sample dir memoryset memory 10m in sheet using當csv檔的第一列沒有變量名稱
7、時:in sheet gen der id race ses schtyp prgtype read write mathscie nee socst using直接復(fù)制EXCELt 的數(shù)據(jù),再到STATA選取”Win dow下的”Data Editor”, 點選后會出現(xiàn)”Stata Editor”工作表,再到”Edit”下選取”Paste”即可 貼上數(shù)據(jù)。2、輸入ASCII的數(shù)據(jù)型態(tài)依ASCII的數(shù)據(jù)型態(tài)區(qū)分,將ASCII的數(shù)據(jù)輸入STATA勺方式也有以下兩 種:數(shù)據(jù)型態(tài)一:見in file gen der id race ses schtyp str10 prgtype read writ
8、e math scie nee socst usingNote:記住文字的設(shè)定方式(str # variable name)。數(shù)據(jù)型態(tài)二:見第二種的數(shù)據(jù)型態(tài)通常須要codebook。如下表所示variable n ameColumn nu mberid1-2|eng3-4path5-6sex7Hero8-9hacro10-11infix id 1-2 eng 3-4 math 5-6 gender 7 micro 8-9 macro 10-11 using3、利用Do-file editor輸入數(shù)據(jù)將數(shù)據(jù)或是指令寫入Do-file editor,再執(zhí)行即可。例如:將下面 數(shù)據(jù)復(fù)制并貼在Do-f
9、ile editor(選取”Window下的”Do-file editor”)上,再選擇”do currnet file”執(zhí)行即可。cd e:samplein put id female race ses str3 schtype prog read write math scie nee socst147 1 1 3 pub 1 47 62 53 53 61108 0 1 2 pub 2 34 33 41 36 3618 0 3 2 pub 3 50 33 49 44 36153 0 1 2 pub 3 39 31 40 39 5150 0 2 2 pub 2 50 59 42 53 615
10、1 1 2 1 pub 2 42 36 42 31 39102 0 1 1 pub 1 52 41 51 53 5657 1 1 2 pub 1 71 65 72 66 56160 1 1 2 pub 1 55 65 55 50 61136 0 1 2 pub 1 65 59 70 63 51end4、利用STATA勺數(shù)據(jù)型態(tài)輸入除了以上三種方法之外,還可以開啟之前以STATA儲存的資料。useNote:此一指令亦可用在讀取網(wǎng)絡(luò)上的數(shù)據(jù)(use網(wǎng)址) 最后,將數(shù)據(jù)輸入的相關(guān)指令整理成下表。in sheetread ASCII (text) data created by a spreadshe
11、etin fileread un formatted ASCII (text) datainfixread ASCII (text) data in fixed formatin puten ter data from keyboarduseload a Stata-format dataset四、探索資料(Exploring data)為了更詳細地呈現(xiàn)出在數(shù)據(jù)探索時所需使用的 相關(guān)指 令,我們利 用sample4-1來說明指令的用法。首先,利用前節(jié)所提及的數(shù)據(jù)輸入方法將sample4-1讀進STATA在正式分析數(shù)據(jù)之前,我們可以利用一個log檔來儲存之后所要執(zhí)行的指令以及所得到的結(jié)果。指令的
12、表示方法如下:log using result4-1, text(log檔的名稱為result4-1)接下來,我們可以先利用下面的指令來檢視sample4-1的數(shù)據(jù):count:可得樣本數(shù)。describe:描述數(shù)據(jù)來源以及數(shù)據(jù)大小。list:依序列出觀察值的各個變量值。codebook:描述資料的詳細內(nèi)容。此外,我們就可以利用summarize、tabulate和tabstat等指令得到數(shù)據(jù) 的敘述統(tǒng)計與基本特性。表示如下:summarize:列出資料的敘述統(tǒng)計。Example:summarize write, detailsum write if read=60(sum是summarize
13、的簡寫)sum write ifprgtype=academic(接在if之后的句子中 的”=”要放兩個)sum write in 1/40(只列出第1筆到第40筆資料)tabulate:列出變數(shù)的次數(shù)表。Example:tabulate prgtypetabulate prgtype race tabulate prgtype, summarize(read)tabulate prgtype race, summarize(write)tabstat:列出變量的敘述統(tǒng)計。Example:tabstat read write math, by(prgtype) stat(n mean sd)t
14、abstat write, stat (n mean sd p25 p50 p75) by(prgtype)接下來,我們介紹一些用來劃圖的指令:莖葉圖:stem writestem write, li nes(2)直方圖:graph write, bin(10)graph write, hist no rmal bin( 10)箱形圖:graph write, boxsort prgtype(要先有這個指令才能執(zhí)行下一個指令)graph write, box by(prgtype)此外, 利用correlate或是pwcorr可以得到相關(guān)矩陣; 亦可利用graph劃 出散布圖。correlat
15、e write read scie neepwcorr write read scie nee, obsgraph write read, twowaygraph write read, two jitter(2)(two是twoway的簡稱,jitter是用來區(qū)分重疊的觀察點)graph write read, two jitter(2) boxgraph read scie nee write, matrix half現(xiàn)在我們可以將log文件結(jié)束了,指令輸入如下:log close若欲檢視log檔中的結(jié)果,可以輸入指令:type或是到所儲存的目錄下點選。最后,將數(shù)據(jù)探索的相關(guān)指令整理成下表
16、。cou ntShow the nu mber of observati onsdescribeDescribe contents of data in memory or on disklistList values of variablescodebookDetailed contents of a datasetlogCreate a log filesummarizeDescriptive statisticstabulateOne- & two-way freque ncy tablestabstatTable of descriptive statisticsstemSte
17、m-a nd-leaf plotgraphHigh resolutio n graphssortSort observatio ns in a datasethistHistogram of a categorical variablecorrelateCorrelati onspwcorrPairwise correlati onstypeDisplay an ASCII file五、修飾資料(Modifying data)在本小節(jié)中,我們亦利用sample4-1的數(shù)據(jù)進行說明。首先,讀進數(shù)據(jù) 讀完數(shù)據(jù)后,可以為此數(shù)據(jù)取個名稱,指令如下:label data High School a nd
18、 Beyo nd, 200 cases現(xiàn)在我們可以將變量的順序作一排列。例如:原先的變量順序為gen der、id和race,但是我們想把順序改成id、gender和race,則可以下面的指 令來執(zhí)行:order id gender在執(zhí)行codebook時,我們會發(fā)現(xiàn)有些變量尚未加上卷標(label),為了 更清楚地表達變量所代表的意義,我們可以執(zhí)行以下的指令:label variable schtyp The type of school the student attended.現(xiàn)在,我們想要產(chǎn)生一個新變量total,此變量代表read、write和math的總和。指令如下:gen era
19、te total = read + write + math此外,若是我們想加總的分數(shù)是read、write和socst,而非read、write和math,此時的指令輸入如下:replace total = read + write + socst另一方面,我們還可以將變量total表示成以等級(A、B、C、D and F) 的形式。指令如下:gen erate grade = totalrecode grade 0/80=0 80/110=1 110/140=2 140/170=3 170/300=4label define abcdf 0 F 1 D 2 C 3 B 4 Alabel v
20、alues grade abcdf為了記憶變量的意義為何,我們還可以利用note的方式來記錄變量。指令如下:no tes race: values of race coded as 5 were recoded to be miss ing notes(叫出note的指令)另外,介紹一些利用公式來產(chǎn)生變量的指令。ege n zread = std(read)summarize zreadlist read zread in 1/10ege n rmea n = mean( read), by(ses)list read ses rmea n in 1/10ege n mread = media
21、 n( read), by(prog)list read prog mread in 1/10最后,我們可以將以上的執(zhí)行結(jié)果儲存下來。指令如下:save sample5-1(存成另一個檔)save sample4-1(取代原來的sample4-1)現(xiàn)在亦將數(shù)據(jù)修飾的相關(guān)指令整理成下表。label dataApply a label to a data setorderOrder the variables in a data setlabelApply a label to a variablevariablegen erateCreates a new variablereplaceRepl
22、aces one value with ano ther valuerecodeRecode the values of a variableLabel valuesApply value labels to a variablelabel defi neDefine a set of a labels for the levels of a categorical variableno tesApply no tes to the data fileege nExte nded gen erate - has special functions that can be usee when c
23、reati nga new variablesaveStore the dataset currently in memoryon disk in Stata data format六、管理數(shù)據(jù)(Managing data)在本節(jié)中,我們將進一步介紹如何將數(shù)據(jù)作一些特殊的處理,例如:保留 所欲分析的數(shù)據(jù)、刪除多余的數(shù)據(jù)或是將兩份數(shù)據(jù)結(jié)合等等。假設(shè)我們只想針對部分的數(shù)據(jù)進行處理,而又想保留原始資料時,則有以F 兩種方法可進行:1、 另存新檔: 亦即將所欲分析的部分數(shù)據(jù)儲存在另一個檔案中。 例如: 我們只 針對read成績大于或是等于60分的學(xué)生進行分析, 則可利用下 面的指令來篩選。keep i
24、f read = 60 summarizesave sample6-1Note:當只要保留某些變量時,則利用指令keep。例如:keep read write2、直接處理:亦即在原始數(shù)據(jù)上進行分析。承上例,指令輸入如下:preservedrop if read 60summarizerestoreNote:若要刪除某些變量時,則利用指令drop。例如:drop read write接下來,我們介紹如何將兩筆數(shù)據(jù)結(jié)合在一起。數(shù)據(jù)的結(jié)合主要可以分為 兩種,水平合并和垂直合并。前者是指變量的增加;后者則是指樣本數(shù)的增加。 說明如下:1、水平合并use samplehlappe nd using sa
25、mpleh22、垂直合并:use samplevlsort idsave samplevl, replace use samplev2, clear sort idsave , replaceuse samplevlmerge id using samplev2Note:在垂直合并前要記得先sort。最后,我們將數(shù)據(jù)修飾的相關(guān)指令整理成下表。keep ifKeep observations if condition is metdrop ifDrop observations if condition is metkeepKeep variables (dropp ing others)dro
26、pDrop variables (keep ing others)appe nd usingAppend a data file to current filesortSort observati onsmergeMerge a data file with curre nt file七、資料分析透過前面幾節(jié)的介紹,應(yīng)該對于STATA勺指令和使用方法有了基本的認識 現(xiàn)在,我們開始說明如何利用STATA來處現(xiàn)統(tǒng)計上的問題以及計量方面的模型。1、檢定:我們利用下面的例子來示范如何進行統(tǒng)計上的檢定工作。sample4-1:ttest write =60ttest write, by (ge nder)ttest write, by (ge nder) un equalsample7-1:ttest before= after2、回歸在執(zhí)行回歸分析時所使用的指令為regress。cd e:sampleuse sampl
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年考古發(fā)掘項目土方清理與保護合同3篇
- 2025版信息安全保密協(xié)議合同5篇
- 二零二五年房地產(chǎn)項目配套基礎(chǔ)設(shè)施建設(shè)合同3篇
- 二零二五年度智能交通管理系統(tǒng)免責(zé)協(xié)議范本4篇
- 2025版鋁材回收利用項目合作協(xié)議4篇
- 2025年度殘疾人勞動合同簽訂中的殘疾人權(quán)益保障與就業(yè)促進2篇
- 2025餐飲企業(yè)員工勞動合同15篇
- 2025年度商業(yè)廣場墻面LED廣告屏租賃合同標的協(xié)議4篇
- 2024食用油倉儲物流服務(wù)合作合同3篇
- 標識標牌施工質(zhì)量保障合同(2025年度)3篇
- 2025年浙江省湖州市湖州職業(yè)技術(shù)學(xué)院招聘5人歷年高頻重點提升(共500題)附帶答案詳解
- ZK24600型平旋盤使用說明書(環(huán)球)
- 城市基礎(chǔ)設(shè)施維修計劃
- 2024山西廣播電視臺招聘專業(yè)技術(shù)崗位編制人員20人歷年高頻500題難、易錯點模擬試題附帶答案詳解
- 新材料行業(yè)系列深度報告一:新材料行業(yè)研究框架
- 人教版小學(xué)英語各冊單詞表(帶英標)
- 廣東省潮州市潮安區(qū)2023-2024學(xué)年六年級上學(xué)期期末考試數(shù)學(xué)試題
- 鄉(xiāng)村治理中正式制度與非正式制度的關(guān)系解析
- 智能護理:人工智能助力的醫(yī)療創(chuàng)新
- 國家中小學(xué)智慧教育平臺培訓(xùn)專題講座
- 5G+教育5G技術(shù)在智慧校園教育專網(wǎng)系統(tǒng)的應(yīng)用
評論
0/150
提交評論