




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一章 Stata 概貌§1.1 Stata的功能、特點(diǎn)和背景Stata是一個(gè)用于分析和管理數(shù)據(jù)的功能強(qiáng)大又小巧玲瓏的實(shí)用統(tǒng)計(jì)分析軟件,由美國(guó)計(jì)算機(jī)資源中心(Computer Resource Center)研制。從1985至1998的十四年時(shí)間里,已連續(xù)推出1.1,1.2,1.3,1.4,1.5,及2.0,2.1,3.0,3.1,4.0,5.0,6.0等多個(gè)版本,通過(guò)不斷更新和擴(kuò)充,內(nèi)容日趨完善。它同時(shí)具有數(shù)據(jù)管理軟件、統(tǒng)計(jì)分析軟件、繪圖軟件、矩陣計(jì)算軟件和程序語(yǔ)言的特點(diǎn),又在許多方面別具一格。Stata融匯了上述程序的優(yōu)點(diǎn),克服了各自的缺點(diǎn),使其功能更加強(qiáng)大,操作更加靈活、簡(jiǎn)單,
2、易學(xué)易用,越來(lái)越受到人們的重視和歡迎。Stata的突出特點(diǎn)是只占用很少的磁盤(pán)空間,輸出結(jié)果簡(jiǎn)潔,所選方法先進(jìn),內(nèi)容較齊全,制作的圖形十分精美,可直接被圖形處理軟件或字處理軟件如WORD等直接調(diào)用。一、 Stata的數(shù)據(jù)管理能力1. Stata的數(shù)據(jù)管理空間受計(jì)算機(jī)的操作系統(tǒng)和計(jì)算機(jī)擴(kuò)展內(nèi)存的影響。對(duì)640k內(nèi)存的微機(jī),3.1版本的Stata可以管理2400個(gè)記錄×99個(gè)變量,并隨計(jì)算機(jī)擴(kuò)展內(nèi)存的增加而增加;對(duì)4.0的WINDOWS版本,Stata可以管理4800個(gè)記錄×99個(gè)變量;對(duì)WINDOWS 95下的5.0版本,可根據(jù)計(jì)算機(jī)的配置情況設(shè)置變量數(shù)和記錄數(shù),如32M擴(kuò)展內(nèi)
3、存的計(jì)算機(jī),可處理2千萬(wàn)個(gè)數(shù)據(jù)。變量數(shù)和記錄數(shù)可以互相交易(trade),即減少記錄數(shù)可以增加變量數(shù),減少變量數(shù)可以增加記錄數(shù)。2. 可以將分組變量轉(zhuǎn)換成指示變量(啞變量),將字符串變量映射成數(shù)字代碼。3. 可以對(duì)數(shù)據(jù)文件進(jìn)行橫向和縱向鏈接,可以將行數(shù)據(jù)轉(zhuǎn)為列數(shù)據(jù),或反之。4. 可以恢復(fù)、修改執(zhí)行過(guò)的命令。5. 可以利用數(shù)值函數(shù)或字符串函數(shù)產(chǎn)生新變量。6. 可以從鍵盤(pán)或磁盤(pán)讀入數(shù)據(jù)。二、 Stata的統(tǒng)計(jì)功能Stata的統(tǒng)計(jì)功能很強(qiáng),除了傳統(tǒng)的統(tǒng)計(jì)分析方法外,還收集了近20年發(fā)展起來(lái)的新方法,如Cox比例風(fēng)險(xiǎn)回歸,指數(shù)與Weibull回歸,多類(lèi)結(jié)果與有序結(jié)果的logistic回歸,Poisso
4、n回歸、負(fù)二項(xiàng)回歸及廣義負(fù)二項(xiàng)回歸,隨機(jī)效應(yīng)模型等。具體說(shuō),Stata具有如下統(tǒng)計(jì)分析能力:1. 數(shù)值變量資料的一般分析:參數(shù)估計(jì),檢驗(yàn),單因素和多因素的方差分析,協(xié)方差分析,交互效應(yīng)模型,平衡和非平衡設(shè)計(jì),嵌套設(shè)計(jì),隨機(jī)效應(yīng),多個(gè)均數(shù)的兩兩比較,缺項(xiàng)數(shù)據(jù)的處理,方差齊性檢驗(yàn),正態(tài)性檢驗(yàn),變量變換等。2. 分類(lèi)資料的一般分析:參數(shù)估計(jì),列聯(lián)表分析(? 2檢驗(yàn),列聯(lián)系數(shù),確切概率),流行病學(xué)表格分析等。3. 等級(jí)資料的一般分析:秩變換,秩和檢驗(yàn),秩相關(guān)等。4. 相關(guān)與回歸分析:簡(jiǎn)單相關(guān),偏相關(guān),典型相關(guān),以及多達(dá)數(shù)十種的回歸分析方法,如多元線(xiàn)性回歸,逐步回歸,加權(quán)回歸,穩(wěn)鍵回歸,二階段回歸,百分
5、位數(shù)(中位數(shù))回歸,殘差分析、強(qiáng)影響點(diǎn)分析,曲線(xiàn)擬合,隨機(jī)效應(yīng)的線(xiàn)性回歸模型,等。5. 危險(xiǎn)度分析:條件和非條件的logistic回歸,多類(lèi)結(jié)果與有序結(jié)果的logistic回歸,Probit回歸,及其他廣義線(xiàn)性模型,隨機(jī)效應(yīng)的logistic回歸,隨機(jī)效應(yīng)的Poisson回歸,等。6. 生存分析:基線(xiàn)生存曲線(xiàn)的估計(jì)、相對(duì)危險(xiǎn)度的估計(jì),Kaplan-Meier生存曲線(xiàn)、壽命表分析,對(duì)數(shù)秩檢驗(yàn),Mantel-Haenszel檢驗(yàn),Wilcoxon-Gehan檢驗(yàn),Cox比例風(fēng)險(xiǎn)模型,正態(tài)截尾及Tobit回歸,指數(shù)回歸和Weibull回歸,等。7. 其它方法:質(zhì)量控制,整群抽樣的設(shè)計(jì)效率,診斷試驗(yàn)評(píng)
6、價(jià),kappa,等。三、 Stata的作圖功能Stata的作圖模塊,主要提供如下八種基本圖形的制作: 直方圖(histogram),條形圖(bar), 百分條圖(oneway),百分圓圖(pie),散點(diǎn)圖(twoway),散點(diǎn)圖矩陣(matrix),星形圖(star),分位數(shù)圖。這些圖形的巧妙應(yīng)用,可以滿(mǎn)足絕大多數(shù)用戶(hù)的統(tǒng)計(jì)作圖要求。在有些非繪圖命令中,也提供了專(zhuān)門(mén)繪制某種圖形的功能,如在生存分析中,提供了繪制生存曲線(xiàn)圖,回歸分析中提供了殘差圖等。詳見(jiàn)第五章。四、 Stata的矩陣運(yùn)算功能矩陣代數(shù)是多元統(tǒng)計(jì)分析的重要工具,Stata提供了多元統(tǒng)計(jì)分析中所需的矩陣基本運(yùn)算,如矩陣的加、積、逆、C
7、holesky 分解、Kronecker內(nèi)積等;還提供了一些高級(jí)運(yùn)算,如特征根、特征向量、奇異值分解等;在執(zhí)行完某些統(tǒng)計(jì)分析命令后,還提供了一些系統(tǒng)矩陣,如估計(jì)系數(shù)向量、估計(jì)系數(shù)的協(xié)方差矩陣等。盡管Stata的容量最大只容許400? 400的矩陣(默認(rèn)為40? 40),用它來(lái)完成日常工作中的統(tǒng)計(jì)分析顯然不現(xiàn)實(shí),但用它來(lái)做一些練習(xí),提高多元統(tǒng)計(jì)分析的教學(xué)效率,無(wú)疑是很有幫助。詳見(jiàn)第十八章。五、 Stata的程序設(shè)計(jì)功能Stata是一個(gè)統(tǒng)計(jì)分析軟件,但它也具有很強(qiáng)的程序語(yǔ)言功能,這給用戶(hù)提供了一個(gè)廣闊的開(kāi)發(fā)應(yīng)用的天地,用戶(hù)可以充分發(fā)揮自己的聰明才智,熟練應(yīng)用各種技巧,真正做到隨心所欲。事實(shí)上,St
8、ata的ado文件(高級(jí)統(tǒng)計(jì)部分)都是用Stata自己的語(yǔ)言編寫(xiě)的。下面這段程序是筆者自行編寫(xiě)的,用于產(chǎn)生n個(gè)參數(shù)為? 的Poisson分布的隨機(jī)數(shù)。prog define rp/* 定義程序名set obs 2/* 定義數(shù)據(jù)庫(kù)的最大記錄數(shù)set seed 3/* 設(shè)置隨機(jī)數(shù)種子,gen rp=./* 定義變量rp,用于存放Poisson分布隨機(jī)數(shù)local lamda0=exp(1)/* 計(jì)算lamda0=exp(? )local j=1/* j=1while j<2+1 /* 對(duì) j<n循環(huán),j表示產(chǎn)生的第j個(gè)Poisson分布隨機(jī)數(shù)local i=1/* i=1local r
9、0=1/* r0=1while i>0 /* i循環(huán)local r1=uniform()/* r1=均勻分布的隨機(jī)數(shù)local r0=r1*r0/* r0=r1*t0if r0< lamda0/* 如果 r0<lamda0local n0= i-1/* n0= i-1local i=-1/* i=-1local i= i+1/* i循環(huán)quiet replace rp=n0if _n=j/* 第j個(gè)rpn0local j= j+1/* j循環(huán)end§1.2 Stata的界面Windows版本的Stata的界面上有一級(jí)菜單行,二級(jí)菜單窗口,命令窗口,結(jié)果窗口,圖形窗口
10、,變量名窗口,已執(zhí)行過(guò)的命令窗口,幫助窗口等。窗口的大小、位置可根據(jù)用戶(hù)需要進(jìn)行調(diào)整。§1.3 進(jìn)入和退出Stata一、 DOS版本的Stata的進(jìn)入和退出前已述及,要將Stata程序所在的路徑放入autoexec.bat中,我們可在DOS下任何目錄位置進(jìn)入Stata,但我們假定d:盤(pán)上進(jìn)行。D:>Stata進(jìn)入Stata后,屏幕顯示Stata的版本號(hào),公司所在地等信息,Dos版本下的Stata即出現(xiàn)圓點(diǎn)提示符。這時(shí)即可鍵入Stata的各種命令。若已在Stata狀態(tài)讀入了數(shù)據(jù),并且已將數(shù)據(jù)按Stata指令存盤(pán),或讀入的數(shù)據(jù)雖經(jīng)分析,但對(duì)數(shù)據(jù)及數(shù)據(jù)結(jié)構(gòu)等未作任何修改,則只須鍵入:
11、. exit即可退出Stata。如未將數(shù)據(jù)按Stata指令存盤(pán),或讀入的數(shù)據(jù)或數(shù)據(jù)結(jié)構(gòu)已被修改(Stata的有些命令會(huì)自動(dòng)修改數(shù)據(jù)結(jié)構(gòu),如按某變量排序等),這時(shí),Stata將拒絕退出Stata狀態(tài)。若確實(shí)不需要存盤(pán)而退出Stata,可鍵入:. e,clear(e為exit的簡(jiǎn)寫(xiě))即可強(qiáng)行退出Stata?;蚍謨刹?,即先放棄所有數(shù)據(jù),drop _all再退出Stata,. exit二、 WINDOWS版本的Stata的進(jìn)入和退出在桌面上雙擊Wstata的圖標(biāo):即可進(jìn)入 Stata,并出現(xiàn)命令窗口。在Stata的菜單中選 File ,再選 exit ,如數(shù)據(jù)已經(jīng)存盤(pán),則可退出Stata。如數(shù)據(jù)未存盤(pán)
12、,則Stata給出如下提示:“Data has changed without being saved. Do you really want to exit?”(數(shù)據(jù)已改變,但未存盤(pán),是否真的要退出?)如要退出,則按 確定 ,否則按 取消 。將數(shù)據(jù)存盤(pán)后再退出。在WINDOWS下,亦可用DOS的命令退出Stata。§1.4 Stata的數(shù)據(jù)輸入與儲(chǔ)存Stata可以從鍵盤(pán)輸入數(shù)據(jù),也可以從文件讀入數(shù)據(jù)。WINDOWS下的Stata還可以用Stata的數(shù)據(jù)編輯器輸入、修改和管理數(shù)據(jù)。這里簡(jiǎn)單介紹如何從鍵盤(pán)輸入數(shù)據(jù),有關(guān)更詳細(xì)的數(shù)據(jù)讀入方式將在第三章中講述。一、 從鍵盤(pán)輸入數(shù)據(jù)例1.1
13、某實(shí)驗(yàn)得到如下數(shù)據(jù)x12345y45.56.27.78.5進(jìn)入Stata后,操作過(guò)程如下,其中劃線(xiàn)部分為操作者輸入部分。. input x yx y1. 1 42. 2 5.53. 3 6.24. 4 7.75. 5 8.56. end用list命令可以看到輸入的數(shù)據(jù)。. listx y1.1 42.2 5.53.3 6.24.4 7.75.5 8.5二、 保存數(shù)據(jù)為了方便以后應(yīng)用,輸入Stata的數(shù)據(jù)應(yīng)存盤(pán)。如欲將上述數(shù)據(jù)存入d:mydata子目錄中,文件名為ex1.dta,命令為:. save d:mydataex1file d:tempex1replace.dta saved該指令在d:
14、盤(pán)的mydata子目錄中建立了一個(gè)名為“ex1.dta”的Stata格式的數(shù)據(jù)文件。后綴dta是Stata內(nèi)定的數(shù)據(jù)格式文件。該格式文件只能在Stata中用use命令打開(kāi):. use d:mydataex1如目標(biāo)盤(pán)及子目錄中已有相同文件名的文件存在,則該命令將給出如下信息:file d: mydataex1.dta already exists,告訴用戶(hù)在該目標(biāo)盤(pán)及子目錄中已有相同的文件名存在。如欲覆蓋已有文件,則加選擇項(xiàng)replace。命令及結(jié)果如下:. save d:mydataex1 , replacefile d:tempex1.dta saved這樣,Stata在d:盤(pán)的mydata
15、子目錄中建立了一個(gè)名為“ex1.dta”的Stata格式數(shù)據(jù)文件,并替換了原有文件。§1.5 Stata的結(jié)果文件Stata在屏幕上顯示的運(yùn)行結(jié)果有兩種,一種是純字符型的(如方差分析結(jié)果,回歸分析結(jié)果等),一種是圖形。若要將操作過(guò)程和純字符型結(jié)果記錄下來(lái),需事先打開(kāi)一個(gè)log文件:log using 文件名設(shè)結(jié)果文件名為result1,則Stata自動(dòng)加上后綴“.log”,亦可由用戶(hù)自己加上其他后綴。執(zhí)行該指令后的所有操作指令和文字結(jié)果(除help下顯示的結(jié)果)將記錄在結(jié)果文件“result1.log”中。若執(zhí)行某一指令后的結(jié)果沒(méi)有必要記錄下來(lái),則可事先用指令“l(fā)og off”暫停記
16、錄,需要記錄時(shí)再用“l(fā)og on”繼續(xù)記錄,最后用“l(fā)og close”關(guān)閉文件。如果結(jié)果文件“result1.log”已經(jīng)存在,用“l(fā)og using result1”不能打開(kāi)已有文件result1. log。如要覆蓋文件result1.log,則加選擇項(xiàng)replace。即鍵入:. log using result1, replace如要在其后進(jìn)行添加,則鍵入:. log using result1, append文件“result1.log”可在EDIT、PE2、WPS或WORD等字處理軟件下編輯、打印,也可在DOS下用type或print命令通過(guò)顯示器瀏覽或打印機(jī)輸出硬拷貝。若要將圖形結(jié)
17、果打印下來(lái),需要在繪圖指令中加上“saving”選擇項(xiàng)。例如,畫(huà)例1.1中x與y的散點(diǎn)圖并存入文件“ex1.gph”,可用下述指令:graph y x ,c(l) saving(d:mydataex1)這時(shí)屏幕上顯示y與x的散點(diǎn)圖,并將被存入d:mydata子目錄中,文件名為“ex1.gph”(gph是Stata內(nèi)定的圖形文件后綴,用戶(hù)亦可自己定義后綴名)。該圖形可在Stata狀態(tài)用“ graph using d:mydataex1”重新顯示在屏幕上,可在 File 的 Print Graph 打印,也可用打印命令“gphdot”打印。DOS版本的Stata可在DOS提示符下用“gphdot”
18、 命令打?。篋:MYDATA>gphdot ex1.gph更詳細(xì)的內(nèi)容見(jiàn)第五章。§1.6Stata的操作方式Stata的操作有交互式操作和非交互式操作兩種形式。一、 交互式操作在Stata狀態(tài)直接鍵入指令,每輸入一個(gè)指令,Stata執(zhí)行一個(gè),這種方式稱(chēng)為交互式操作。例1.2用例1.1數(shù)據(jù)建立回歸方程。use ex1reg y x二、 非交互式操作若分析內(nèi)容很多,有時(shí)甚至涉及到多個(gè)數(shù)據(jù)庫(kù),有幾十個(gè)甚至成百個(gè)分析內(nèi)容,若仍采取交互式操作,不僅要將許多時(shí)間花在等待運(yùn)算結(jié)果上,而且容易漏掉一些主要的分析內(nèi)容或做一些無(wú)益的重復(fù)勞動(dòng)。這時(shí)最好在EDIT,PE2,WORD等文字處理下將這些指
19、令寫(xiě)入一個(gè)以“do”為擴(kuò)展名的命令文件(文本格式,即ASCII碼),并仔細(xì)核對(duì)分析內(nèi)容、命令格式,直至組織數(shù)據(jù)文件的合理性等,修改好后再在Stata狀態(tài)執(zhí)行該命令文件。例1.3用非交互式操作對(duì)例1.1數(shù)據(jù)進(jìn)行相關(guān)和回歸分析。第一步,在字處理軟件下寫(xiě)入如下指令,并以文件名“ex1.do”存入磁盤(pán)d:mydata子目錄中。set more 1/* 指定結(jié)果窗口中,當(dāng)輸出結(jié)果滿(mǎn)一屏后,不再顯示-more-,直接顯示下一屏log using d:mydataex1.log/* 打開(kāi)結(jié)果文件ex1.loguse d:mydataex1.dta/* 調(diào)用數(shù)據(jù)文件d:mydataex1.dtagra y x
20、,saving(d:mydtataex1)/* 作y與x的散點(diǎn)圖,并存入d:mydtataex1.gphcor y x/* 作y與x的相關(guān)reg y x/* 作y與x的回歸log close/* 關(guān)閉結(jié)果文件ex1.logset more 0/* 指定結(jié)果窗口中,當(dāng)輸出結(jié)果滿(mǎn)一屏后,顯示- more-,直到按任意鍵后,再顯示下一屏第二步,在Stata狀態(tài)鍵入:do d:mydtataex1.doStata將首先打開(kāi)一個(gè)名為“ex1.log”的結(jié)果文件,然后打開(kāi)數(shù)據(jù)文件“ex1.dta”,畫(huà)散點(diǎn)圖并將圖形存入文件“ex1.gph”,進(jìn)行相關(guān)分析、回歸分析,最后關(guān)閉結(jié)果文件。此時(shí),Stata執(zhí)行這
21、些命令是自動(dòng)的,不間斷的。§1.7Stata的幫助功能Stata具有很強(qiáng)的幫助功能。幫助功能的使用有兩種方式。一是在Stata狀態(tài),需要了解某個(gè)指令的格式和功能,這時(shí)只需鍵入help(或按功能鍵F1),然后空一格鍵入該指令即可。例如,若需了解回歸分析的指令格式,則:.help regress則可得到幫助。二是利用菜單,在Stata的菜單上按 Help ,出現(xiàn)幫助窗口。此時(shí)輸入需要幫助的命令關(guān)鍵詞,如regress,按 OK 即可得到幫助。如需了解Stata的全部命令,可鍵入help contents,可得到Stata的全部命令及其簡(jiǎn)單解釋?zhuān)换蛟趲椭翱诎?Contents ,則出現(xiàn)如
22、下的幫助內(nèi)容窗口。在知道所要幫助的命令時(shí),在命令窗口鍵入help加命令,即可獲得幫助;在不知道所要幫助的命令時(shí),用菜單操作更好。Stata的常用命令見(jiàn)附錄。下面以多元線(xiàn)性回歸命令為例,介紹Stata的命令的格式。多元線(xiàn)性回歸命令為regress,欲得到命令格式,鍵入help regress即可得到:by varlist: regress depvar varlist1 (varlist2)weight if exp in range , level(#)beta hascons noconstant noheader eform(string)depname(varname) mse1 命令中
23、, 內(nèi)為選擇項(xiàng),括號(hào)外為必選項(xiàng)。這里介紹命令的公共選擇部分,該命令的專(zhuān)用選擇項(xiàng)將在相應(yīng)章節(jié)作介紹。1. by varlist,是指定按變量varlist的取值逐一作多元線(xiàn)性回歸。如變量名為group,且取值為1,2,3,4,則“by group:”是指定Stata分別按group=1, group=2, group=3和group=4的觀(guān)察值分別作4個(gè)回歸方程。在選用該選擇項(xiàng)前,要對(duì)變量排序,即先執(zhí)行sort,如:. sort group2. weight,是指本命令允許使用加權(quán)或頻數(shù),有fw=頻數(shù)變量和aw=加權(quán)變量?jī)煞N形式。3. if exp, 用條件語(yǔ)句指定條件。如,下列條件是合法的:i
24、f group=1 /* 對(duì)滿(mǎn)足group=1條件的觀(guān)察值進(jìn)行分析if group>2/* 對(duì)滿(mǎn)足group>2條件的觀(guān)察值進(jìn)行分析if group=1 | group=2 /* 對(duì)滿(mǎn)足group=1或group=2條件的觀(guān)察值進(jìn)行分析if group=3 /* 對(duì)滿(mǎn)足group不等于3條件的觀(guān)察值進(jìn)行分析if group=1 & sex=0 /* 對(duì)滿(mǎn)足group=1,同時(shí)sex=0條件的觀(guān)察值進(jìn)行分析4. in range,指定觀(guān)察值的范圍,對(duì)在范圍內(nèi)的觀(guān)察值作分析。下列語(yǔ)句是合法的:in 1/25/* 對(duì)觀(guān)察值范圍為125號(hào)的觀(guān)察值作分析in 26/44 /* 對(duì)觀(guān)察
25、值范圍為2644號(hào)的觀(guān)察值作分析in 26/l/* 對(duì)觀(guān)察值范圍為26最后(last)的觀(guān)察值作分析in 5/l /* 對(duì)最后5個(gè)觀(guān)察值進(jìn)行分析這些公共選擇項(xiàng)在很多命令中都可選用,本書(shū)在介紹各命令時(shí)將省去這些公共選擇項(xiàng)。另外一個(gè)選擇項(xiàng),也可用于很多命令,它就是for。例如,在作回歸分析時(shí),自變量為x1,x2,x22共22變量,而因變量有y1,y2,y10,z1,z5共15個(gè)變量。欲分別建立每個(gè)因變量yi和zi與x1,x2,x22的回歸,則需要寫(xiě)15個(gè)命令。而用for選擇項(xiàng)只需一個(gè)命令即可:for y1-y10 z1-z5 : regress x1-x22命令中,for 后面的變量是選定的,re
26、gress是作回歸分析,是替換符,Stata自動(dòng)用for語(yǔ)句指定的變量逐一替換作為因變量,而自變量為x1-x22。又如,for y* : summ ,detail表示,對(duì)以y字母開(kāi)始的變量作詳細(xì)的統(tǒng)計(jì)描述。第一章 數(shù)據(jù)輸入,存盤(pán)和調(diào)用文件命令以及數(shù)據(jù)管理命令本 節(jié) STATA 命 令 摘 要 1 輸 入 數(shù) 據(jù) 命 令:1) input 變量名1 變量名2 變量名m( 各 變 量 數(shù) 據(jù) 之 間 用 空 格 隔 開(kāi), 每 行 一 個(gè) 記 錄, 最 后 以 end 表 示 結(jié) 束)2)infile 變 量 名1&
27、#160; 變 量 名2 變 量 名m using 文 件 名(該 文 件 為 文 本 文 件,各 變 量 數(shù) 據(jù) 之 間 用 空 格 隔 開(kāi), 每 行 一 個(gè) 記 錄)存 盤(pán) 命 令:save 路徑 文 件 名,replace(以STATA格式存盤(pán),缺省擴(kuò)展名為dta,replace表示覆蓋同名同路徑的 文件;也可以在菜單File中選SAVEas或SAVE進(jìn)行操作)outfile using 路徑文 件 名,replace(以文本格式存
28、盤(pán),缺省擴(kuò)展名為raw,replace表示覆蓋同名同路徑的文 件)調(diào) 用 已 存 的 STATA 格 式 文 件use 路徑 文 件 名,clear(也可以在菜單 File 中選 open 進(jìn)行操作 )產(chǎn) 生 新 變 量gen 新 變 量 名= 表 達(dá) 式修 改 變 量 值replace 變 量 名= 表 達(dá) 式 in 范 圍if 邏 輯 表 達(dá) 式( 變 量 的 缺 省 值 (mining data) 表 達(dá) 式 為 . )在
29、STATA 軟 件 中 數(shù) 據(jù) 輸 入 通 常 有 三 種 方 式: 鍵 盤(pán) 直 接 輸 入, 從 外 部 的 文 本 文 件(ASC 碼 文 件) 讀 入 數(shù) 據(jù) 和 在DOS 環(huán) 境 下 應(yīng) 用Transfer 軟 件 直 接 把 Fox 或 其 他 格 式 存 盤(pán) 的 文 件 轉(zhuǎn) 換 成 Stata 軟 件 格 式 的 文 件。1、 鍵 盤(pán) 輸 入 方 式:命 令 格 式:input 變量1 變量2 變量m輸 入 數(shù) 據(jù), 變 量 之 間 用 空 格, 每 個(gè) 記 錄 一 行當(dāng)
30、數(shù) 據(jù) 輸 完 后, 輸 入 end例: 應(yīng) 用 克 矽 平 治 療 矽 肺 患 者 10 名, 治 療 前 后 血 紅 蛋 白 的 含 量 如 下( 數(shù) 據(jù) 摘 自 金 丕 煥 主 編 <醫(yī) 用 統(tǒng) 計(jì) 方 法>,pp 37):血 紅 蛋 白 含 量治療前113150150135128治療后140138140135135治療前100110120130123治療后120147114138120在 下 列STATA 操 作 中 用 變 量 x1 和 x2 分 別 代 表 治 療 前 和 治 療 后。STATA 數(shù) 據(jù) 輸 入 操 作 命 令:1. &
31、#160; 鍵 盤(pán) 直 接 輸 入input x1 x2113 140150 138150 140135 135128 135100 120110 147120 114130 138123 120end2. 調(diào) 用 外 部 文 本 數(shù) 據(jù) 文 件如果數(shù)據(jù)已經(jīng)用其它軟件(如:Foxbase)輸入,并已以文本格式生成一個(gè)文本數(shù)據(jù)文件,并且滿(mǎn)足上述每個(gè)記錄一行和兩個(gè)變量之間用空格分割的格式。則用STATA命令:infile
32、 變量1 變量2 變 量m using 路徑文本數(shù)據(jù)文件名如:上例數(shù)據(jù)已以文本方式存在C:user子目錄中的文件ex1.txt,并滿(mǎn)足每個(gè)記錄一行和兩個(gè)變量之間用空格分割的格式,則:STATA命令:infile x1 x2 using c:userex1.txt· 以 STATA 格 式 存 盤(pán)save ex1以ex1.dta為文件名在當(dāng)前目錄中存盤(pán)。(因?yàn)镾TATA格式的數(shù)據(jù)文件的缺省擴(kuò)展名為.dta)
33、如果ex1.dta在當(dāng)前目錄中已存在,并且打算把當(dāng)前數(shù)據(jù)所存的文件覆蓋當(dāng)前目錄中已存在的文件ex1.dta,則:save ex1,replace如 果 打 算 把 ex1.dta 文 件 存 入 c:user 子 目 錄 中, 則save c:userex1.dta或 save c:userex1.dta, replace· 以 文 本 方 式 存 數(shù) 據(jù) 文 件:STATA 命 令:outfile 變量1 變量2
34、變 量m using 路徑文本數(shù)據(jù)文件名,replace其 中 子 命 令,replace 表 示 覆 蓋 現(xiàn) 有 同 目 錄 中 與 該 文 本 數(shù) 據(jù) 文 件 相 同 的 文 件設(shè) 上 述 資 料 已 在STATA 狀 態(tài) 下 輸 入 到 計(jì) 算 機(jī) 中, 準(zhǔn) 備 生 成 一 個(gè) 文 本 數(shù) 據(jù) 文 件 ex1.txt 并 存 入 c:user , 則:STATA 命 令:outfile x1 x2 using c:userex1.txt若 在 c:user 中 已 經(jīng) 有 ex1.txt, 并 打 算 用 當(dāng) 前ST
35、ATA 環(huán) 境 中 的 數(shù) 據(jù) 覆 蓋 它。 則outfile x1 x2 using c:userex1.txt,replace調(diào) 用 現(xiàn) 有 數(shù) 據(jù) 文 件( 以STATA 格 式 存 盤(pán) 的 文 件, 又 稱(chēng) STATA 系 統(tǒng) 數(shù) 據(jù) 文 件)use 路 徑 文 件 名,clear若當(dāng)前STATA狀態(tài)已調(diào)入數(shù)據(jù),則要調(diào)入新的數(shù)據(jù)時(shí),需要用clear子命令,表示清除原先已在計(jì)算機(jī)中的數(shù)據(jù)。如:調(diào)用在c:user子目錄下的ex1.dtaSTATA系統(tǒng)數(shù)據(jù)文件,則:use c:userex1若 當(dāng) 前 狀 態(tài) 已 有 數(shù) 據(jù) 在 計(jì)
36、 算 機(jī) 內(nèi), 則:use c:userex1,clear注意:use 與 save是一對(duì)調(diào)用STATA系統(tǒng)數(shù)據(jù)文件和以STATA系統(tǒng)格式 存盤(pán)的命令;infile 和 outfile也是一對(duì)調(diào)用外部文本數(shù)據(jù)文件和以 文本文件格式存盤(pán)的命令。· 數(shù)據(jù)管理命令產(chǎn) 生 新 的 變 量:STATA 命 令:gen 新變量名=表達(dá)式例如:當(dāng)前計(jì)算機(jī)中正處于STATA狀態(tài)下,并有二個(gè)配對(duì)變量x1和x2的數(shù)據(jù),因此需要計(jì)算兩個(gè)變量的差:x1-x2,則:gen x=x1-x2修 改 數(shù) 據(jù):STATA 命 令:replace 變量名 =
37、表 達(dá) 式 if 邏輯表達(dá)式 in 范圍如:變量x中所有值為999的數(shù)據(jù)是缺省資料,現(xiàn)改為STATA缺省值的記號(hào),所有大于100的數(shù)據(jù)將改為2;x小于或等于100且大于5的所有數(shù)據(jù)改為1;x小于或等于5的所有數(shù)據(jù)為0。則:replace x=. if x=999replace x =0 if x<=5replace x=1 if x>5 & x<=100 2replace
38、0; x=2 if x>1001、方括號(hào)中的子命令表示可以省略,但方括號(hào)中的子命令是處理一些特殊情況的。2在邏輯表達(dá)式中:“等于”用=表示;“不等于”用=表示;“或”用|表示;“并且”用&表示。第二章 描述性統(tǒng)計(jì)命令與輸出結(jié)果說(shuō)明本 節(jié)STATA 命 令 摘 要by 分組變量:summarize 變 量 名1 變 量 名2 變 量 名m,detailci 變 量 名1 變 量 名2 變 量 名m ,
39、 level(#) binomialpoisson exposure(varname) by(分組變 量) cii 樣 本 量 均 數(shù) 標(biāo) 準(zhǔn) 差 , level(#) tab1 變量名 ,generate(變量名)· 資 料 特 征 描 述( 均 數(shù), 中 位 數(shù), 離 散 程 度)例:某地測(cè)定克山病患者與克山病健康人的血磷測(cè)定值如下表(數(shù)據(jù)摘自四川醫(yī)學(xué)院主編的衛(wèi)生統(tǒng)計(jì)學(xué),1978出版,p21
40、):患 者2.63.243.733.734.324.735.185.585.786.406.53健康人1.671.981.982.332.342.503.603.734.144.174.574.825.78并假定這些數(shù)據(jù)已以STATA格式存入ex2.dta文件中,其中變量x1為患者的血磷測(cè)定值數(shù)據(jù),變量x2為健康人的血磷測(cè)定值數(shù)據(jù)。上述數(shù)據(jù)也可以用變量x表示血磷測(cè)定值,分組變量group=0表示患者組和group=1表示健康組(如:患者組中第一個(gè)數(shù)據(jù)為2.6,則x=2.6,group=0;又如:健康組中第三個(gè)數(shù)據(jù)為1.98,則x為1.98以及group為1),并假定這些數(shù)據(jù)已以STATA格式存
41、入ex2a.dta文件中。計(jì) 算 資 料 均 數(shù), 標(biāo) 準(zhǔn) 差 命 令 summarize, 以 述 資 料 為 例:use ex2,clearsummarize x1 x2結(jié) 果:變量 樣本數(shù) 均 數(shù) 標(biāo)準(zhǔn)差 最小值
42、; 最大值Variable | Obs Mean Std. Dev. Min Max-+-x1 | 11
43、160; 4.710909 1.302977 2.6 6.53x2 | 13 3.354615 1.304368
44、0; 1.67 5.78即:本例中急性克山病患者組的樣本數(shù)為11,血磷測(cè)定值均數(shù)為4.711(mg%),相應(yīng)的標(biāo)準(zhǔn)差為1.303,最小值為2.6以及最大值為6.53;健康組的樣本量為13,血磷測(cè)定值均數(shù)為3.3546,相應(yīng)的標(biāo)準(zhǔn)差為1.3044,最小值為1.67以及最大值為5.78。計(jì)算資料均數(shù),標(biāo)準(zhǔn)差,中位數(shù),低四分位數(shù)和高四分位數(shù)的命令summarize以及子命令detail,仍以述資料為例:use ex2,clearsummarize x1 x2,detail結(jié) 果:x
45、1-Percentiles Smallest( 最 小 值)1% 2.6 2.65%
46、 2.6 3.2410% 3.24 &
47、#160; 3.73 Obs 11(樣本數(shù))25% 3.73 (低四分位) 3.73
48、 Sum of Wgt. 1150% 4.73 (中位數(shù)) (最大值) Mean 4.710909(均數(shù))Largest
49、 Std. Dev. 1.302977(標(biāo)準(zhǔn)差)75% 5.78(高四分位) 5.5890% 6.4
50、0; 5.78 Variance 1.697749 (方差)95% 6.53
51、0; 6.4 Skewness -.0813446(偏度)99% 6.53
52、; 6.53 Kurtosis 1.809951 (峰度)x2-Percentiles Smallest1% 1.67 &
53、#160; 1.675% 1.67 1.9810% 1.98 1.98 &
54、#160; Obs 1325% 2.33 2.33
55、0; Sum of Wgt. 1350% 3.6 Mean
56、 3.354615 Largest Std. Dev. 1.30436875% 4.17
57、60; 4.1790% 4.82 4.57 Variance 1.70137795% 5.78&
58、#160; 4. 82 Skewness .296394399% 5.78 5.78 Kurto
59、sis 1.875392由上述結(jié)果可知:summarize命令并使用子命令detail,不僅可以得到各變量資料的均數(shù)和標(biāo)準(zhǔn)差,而且可以得到主要的非參數(shù)描述指標(biāo):低四分位(lowerquartile),中位數(shù)(Median)以及高四分位(upperquartile)。對(duì)于非正態(tài)資料,一般不應(yīng)用均數(shù)±標(biāo)準(zhǔn)差進(jìn)行描述,而應(yīng)使用中位數(shù)以及(低四分位-高四分位,稱(chēng)interquartilerange,IQR)進(jìn)行描述。如:若本資料不正態(tài)1,則x1的Median以及IQR為:4.73(3.73-5.78)以及x2的Media
60、n以及IQR為:3.6(2.33-4.17)。為樣本方差;為偏度,偏度的絕對(duì)值越小,表明該數(shù)據(jù)的正態(tài)對(duì)稱(chēng)性越好;峰度,峰度值越大表明該數(shù)據(jù)的正態(tài)峰越明顯;在該數(shù)據(jù)中最小的四個(gè)數(shù)據(jù);在該數(shù)據(jù)中最大的四個(gè)數(shù)據(jù)。若調(diào)用ex2a.dta文件,進(jìn)行描述性統(tǒng)計(jì),可用下列命令:use ex2a,clearsort group ( 將 資 料 以 group 變 量 為 例 從 小 到 大 排 序)by group:summarize x結(jié) 果:-> group= 0x-P
61、ercentiles Smallest1% 2.6 2.65% 2.6 &
62、#160; 3.2410% 3.24 3.73 Obs 1125%
63、60; 3.73 3.73 Sum of Wgt. 1150% 4.73
64、 Mean 4.710909Largest Std. Dev.
65、; 1.30297775% 5.78 5.5890% 6.4 5.78 &
66、#160; Variance 1.69774995% 6.53 6.4 Skewness -.081344699%
67、60; 6.53 6.53 Kurtosis 1.809951-> group= 1x-Percentiles Smalles
68、t1% 1.67 1.675% 1.67 1.9810%
69、160; 1.98 1.98 Obs 1325% 2.33 &
70、#160; 2.33 Sum of Wgt. 1350% 3.6
71、0; Mean 3.354615Largest Std. Dev. 1.30436875%
72、60; 4.17 4.1790% 4.82 4.57 Variance &
73、#160; 1.70137795% 5.78 4.82 Skewness .296394399% 5.78 &
74、#160; 5.78 Kurtosis 1.875392上 述 結(jié) 果 與 前 面 的 結(jié) 果 對(duì) 應(yīng) 相 同。· 根 據(jù) 樣 本 數(shù) 據(jù) 計(jì) 算 可 信 限 295% 可 信 限 計(jì) 算:正 態(tài)數(shù) 據(jù):ci 變量名0-1 數(shù) 據(jù)
75、:ci 變量名, binomialpoisson 分 布 數(shù) 據(jù): ci 變 量 名,poisson90% 可 信 限 計(jì) 算( 其 它 可 信 限 類(lèi) 推)正 態(tài)數(shù) 據(jù):ci 變量名, level(90)0-1 數(shù) 據(jù):ci 變量名, level(90) binomialpoisson 分 布 數(shù) 據(jù): ci 變 量 名,level(90) poisson以 ex2.dta 為 例 計(jì) 算 x1,x2 的 95 可 信 限。use ex2.dta,c
76、lear Variable |&
77、#160; Obs Mean Std. Err. 95% Conf. Interval-+-x1 | 11 4.710909 .3928624 &
78、#160; 3.835557 5.586261x2 | 13 3.354615 .3617667 2.566393 4.142837以 上 結(jié) 果 中: 為 樣 本 數(shù); 為 均 數(shù); 為 標(biāo) 準(zhǔn) 誤;
79、為 95% 的 可 信 限, 因 此 x1 的95 可 信 限 為3.8356,5.5863,x2 的 95 可 信 限 為2.5664,4.1428。· 根 據(jù) 樣 本 數(shù), 樣 本 均 數(shù) 和 標(biāo) 準(zhǔn) 差 計(jì) 算 可 信 限 3 。若 數(shù) 據(jù) 服 從 正 態(tài) 分 布, 并 已 知 樣 本 均 數(shù) 和 標(biāo) 準(zhǔn) 差 以 及 樣 本 數(shù), 則95 可 信 限 計(jì) 算 為:cii 樣 本 數(shù) 樣 本 均 數(shù) 標(biāo)
80、 準(zhǔn) 差,level(#)例: 已 知 樣 本 數(shù) 為 90 樣 本 均 數(shù) 為 40 以 及 樣 本 標(biāo) 準(zhǔn) 差 為 12, 則: 計(jì) 算 該 樣 本 均 數(shù) 的 95% 可 信 限 為cii 90 40 12Variable | Obs Mean Std. Err. 95
81、% Conf. Interval-+-| 90 40 1.264911 37.48665 42.51335該 樣 本 均 數(shù) 的90% 可 信 限 為 37.48665, 42.51335cii 90 40 12,level(90)Variable | Obs Mean Std. Err. 90% Conf. Interval-+-| 90
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司清算合同范本
- 二年級(jí)口算題練習(xí)冊(cè)100道
- 工傷授權(quán)委托書(shū) 標(biāo)準(zhǔn)版模板
- 賣(mài)服裝合同范本
- 企業(yè)宣傳畫(huà)冊(cè)印刷合同范本
- 希沃白板構(gòu)建小學(xué)數(shù)學(xué)智慧課堂
- 衛(wèi)浴經(jīng)營(yíng)承包協(xié)議合同范本
- 別墅大門(mén)代理銷(xiāo)售合同范例
- G1946新聞攝影教程第一章視知覺(jué)理論和視覺(jué)教養(yǎng)
- 2025年江西省建筑安全員《C證》考試題庫(kù)及答案
- 筋膜刀的臨床應(yīng)用
- DB32-T 4790-2024建筑施工特種作業(yè)人員安全操作技能考核標(biāo)準(zhǔn)
- 2022年安徽阜陽(yáng)太和縣人民醫(yī)院本科及以上學(xué)歷招聘筆試歷年典型考題及考點(diǎn)剖析附帶答案詳解
- 2024-2030年中國(guó)反芻動(dòng)物飼料行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略分析報(bào)告
- 護(hù)理團(tuán)體標(biāo)準(zhǔn)解讀-成人氧氣吸入療法護(hù)理
- 幼兒園大班《識(shí)字卡》課件
- 2024-2030全球與中國(guó)寵物醫(yī)院市場(chǎng)現(xiàn)狀及未來(lái)發(fā)展趨勢(shì)
- 《研學(xué)旅行課程設(shè)計(jì)》課件-2認(rèn)識(shí)研學(xué)旅行的參與方
- 安全警示教育的會(huì)議記錄內(nèi)容
- 夫妻異地辭職信
- 2024年度-銀行不良清收技巧培訓(xùn)課件(學(xué)員版)
評(píng)論
0/150
提交評(píng)論