版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、Stata 軟件基本操作和數(shù)據(jù)分析入門第一講 Stata 操作入門文彤 耐青第一節(jié) 概況Stata 最初由美國計算機(jī)資源中心( Computer Resource Center ) 研制,現(xiàn)在為 Stata 公司的產(chǎn)品,其最新版本為 7.0版。它操作靈活、 簡單、易學(xué)易用, 是一個非常有特色的統(tǒng)計分析軟件, 現(xiàn)在已越來越 受到人們的重視和歡迎,并且和 SAS、SPSS 起,被稱為新的三大 權(quán)威統(tǒng)計軟件。Stata最為突出的特點(diǎn)是短小精悍、功能強(qiáng)大,其最新的7.0版整個系統(tǒng)只有 10M 左右,但已經(jīng)包含了全部的統(tǒng)計分析、數(shù)據(jù)管理和 繪圖等功能,尤其是他的統(tǒng)計分析功能極為全面,比起 1G 以上大小
2、 的 SAS 系統(tǒng)也毫不遜色。 另外,由于 Stata 在分析時是將數(shù)據(jù)全部讀 入存,在計算全部完成后才和磁盤交換數(shù)據(jù),因此運(yùn)算速度極快。由于 Stata 的用戶群始終定位于專業(yè)統(tǒng)計分析人員,因此他的操 作方式也別具一格,在 Windows 席卷天下的時代,他一直堅持使用 命令行程序操作方式,拒不推出菜單操作系統(tǒng)。但是, Stata 的命 令語句極為簡潔明快,而且在統(tǒng)計分析命令的設(shè)置上又非常有條理, 它將相同類型的統(tǒng)計模型均歸在同一個命令族下, 而不同命令族又可 以使用相同功能的選項, 這使得用戶學(xué)習(xí)時極易上手。 更為令人嘆服 的是, Stata 語句在簡潔的同時又擁有著極高的靈活性,用戶可以
3、充 分發(fā)揮自己的聰明才智,熟練應(yīng)用各種技巧,真正做到隨心所欲。除了操作方式簡潔外, Stata 的用戶接口在其他方面也做得非常簡 潔,數(shù)據(jù)格式簡單,分析結(jié)果輸出簡潔明快,易于閱讀,這一切都使 得 Stata 成為非常適合于進(jìn)行統(tǒng)計教學(xué)的統(tǒng)計軟件。Stata 的另一個特點(diǎn)是他的許多高級統(tǒng)計模塊均是編程人員用其 宏語言寫成的程序文件 ( ADO 文件),這些文件可以自行修改、 添加 和下載。用戶可隨時到 Stata 尋找并下載最新的升級文件。事實上, Stata 的這一特點(diǎn)使得他始終處于統(tǒng)計分析方法發(fā)展的最前沿,用戶 幾乎總是能很快找到最新統(tǒng)計算法的 Stata 程序版本,而這也使得 Stata
4、自身成了幾大統(tǒng)計軟件中升級最多、最頻繁的一個。由于以上特點(diǎn), Stata 已經(jīng)在科研、教育領(lǐng)域得到了廣泛應(yīng)用, WHO 的研究人員現(xiàn)在也把 Stata 作為主要的統(tǒng)計分析工作軟件。第二節(jié) Stata 操作入門一、 Stata 的界面圖 1 即為 Stata 7.0 啟動后的界面,除了 Windows 版本的軟件都 有的菜單欄、工具欄,狀態(tài)欄等外, Stata 的界面主要是由四個窗口 構(gòu)成,分述如下:1結(jié)果窗口:位于界面右上部 ,軟件運(yùn)行中的所有信息,如所執(zhí) 行的命令、 執(zhí)行結(jié)果和出錯信息等均在這里列出。 窗口中會使用不同 的顏色區(qū)分不同的文本,如白色表示命令,紅色表示錯誤信息。2命令窗口:位于
5、結(jié)果窗口下方 ,相當(dāng)于 DOS 軟件中的命令行, 此處用于鍵入需要執(zhí)行的命令, 回車后即開始執(zhí)行, 相應(yīng)的結(jié)果則會 在結(jié)果窗口中顯示出來。3.命令回顧窗口:即review窗口,位于界面左上方,所有執(zhí)行過的命令會依次在該窗口中列出,單擊后命令即被自動拷貝到命令窗 口中;如果需要重復(fù)執(zhí)行,用鼠標(biāo)雙擊相應(yīng)的命令即可4.變量名窗口:位于界面左下方,列出當(dāng)前數(shù)據(jù)及中的所有變量 名稱,。除以上四個默認(rèn)打開的窗口外,在Stata中還有數(shù)據(jù)編輯窗口、程序文件編輯窗口、幫助窗口、繪圖窗口、Log窗口等,如果需要使Stata為用戶提供了簡捷,但是非常完善的數(shù)據(jù)接口,熟悉它的用 法是使用Stata的第一步,在Sta
6、ta中讀入數(shù)據(jù)可以有三種方式:直 接從鍵盤輸入、打開已有數(shù)據(jù)文件和拷貝、粘貼方式交互數(shù)據(jù)。1)從鍵盤輸入數(shù)據(jù)在Stata中可以使用命令行方式直接建立數(shù)據(jù)集,首先使用in put命令制定相應(yīng)的變量名稱,然后一次錄入數(shù)據(jù),最后使用end語句表明數(shù)據(jù)錄入結(jié)束。例1在某實驗中得到如下數(shù)據(jù),請在 Stata中建立數(shù)據(jù)集。觀測數(shù)據(jù)X13579Y246810解:此處需要建立兩個變量 X、Y,分別錄入相應(yīng)數(shù)值,Stata中的操作如下,其中劃線部分為操作者輸入部分.dropall.in put x yxy1.1_丄2. 343. 564. 785. 9106. end2)用stata的數(shù)據(jù)編輯工具進(jìn)入數(shù)據(jù)編輯器
7、進(jìn)入stata界面,在命令欄鍵入 edit或在stata的window下 拉菜單中單擊data editor|或點(diǎn)擊編輯圖標(biāo)(注意:是瀏覽圖標(biāo),點(diǎn)擊后只能瀏覽,不能編輯)即可進(jìn)入-stata數(shù)據(jù)編輯器。(stata界 面如下圖2)” '圖2數(shù)據(jù)編輯stata數(shù)據(jù)編輯器界面:此時進(jìn)入了數(shù)據(jù)全屏幕編輯狀態(tài)FlL*Tiivfi |ur>hF 勒I*|B|口ll <y Oal g|Q|圖3在第一列輸入數(shù)據(jù)后,Stata第一列自動命名為varl ;在第二列輸入數(shù)據(jù)后,第二列自動命名為var2依次類推。在輸入數(shù)據(jù)后,雙擊縱格頂端的變量名欄(如:Vari或Var2處),可以更改變量名,并
8、可以在label欄中注釋變量名的含義,點(diǎn)擊OK確認(rèn)(如圖4所示) 仍沿用上例,雙擊觀察值所在列頂端的變量名欄,更改變量名為 x, 并在label欄中注明 “7歲男童身高(cm)”。川-呵 I 口 I 冊/(硝隨干麗 仝I 曰專r*11 !*<*Hl "01血 ill圖4數(shù)據(jù)輸入完畢后,單擊preserve |鍵確認(rèn)所輸數(shù)據(jù),按關(guān)閉鍵即可退出編輯器。圖5數(shù)據(jù)輸入完畢后,單擊preserve鍵確認(rèn)所輸數(shù)據(jù),按關(guān)閉鍵即可退出編輯器。3)拷貝、粘貼方式交互數(shù)據(jù)Stata的數(shù)據(jù)編輯窗口是一個簡單的電子表格, 可以使用拷貝、粘 貼方式直接和EXCEL等軟件交互數(shù)據(jù),在數(shù)據(jù)量不大時,這種方式
9、 操作極為方便。例2 現(xiàn)在EXCEL中已錄入了三個變量,共五條記錄,格式見 下圖,請將數(shù)據(jù)讀入Stata。解:首先將EXCEL中的A1C6全部18個單元格選中,選擇菜 單編輯 復(fù)制,將數(shù)據(jù)拷貝到剪貼板上;然后切換到 Stata,選擇菜 單 Window Data Editor ,打開數(shù)據(jù)編輯窗口; 再選擇Edit Paste,相應(yīng)的數(shù)據(jù)就會被直接粘貼如數(shù)據(jù)編輯窗口中, 并且變量名、記錄數(shù)、變量格式等均會被自動正確設(shè)置,見圖 6和圖 7圖 6 在 EXCEL 中的數(shù)據(jù)格式 圖 7 粘貼入 Stata 后的數(shù)據(jù)格式4)、打開已有的數(shù)據(jù)文件Stata 能夠直接打開的數(shù)據(jù)文件只能是自身專用格式或者以符
10、號 分隔的純文本格式,后者第一行可以是變量名,分述如下:1點(diǎn)擊圖標(biāo),然后選擇路徑和文件名,可以打開Stata 專用格式的數(shù)據(jù)文件,并且擴(kuò)展名為 .dta。2.打開 Dta 數(shù)據(jù)文件:該格式文件是 Stata 的專用格式數(shù)據(jù)文件, 也使用use命令即可打開,例如要打開數(shù)據(jù)文件“ C:data1.dta ”則 命令為:. use c:data1即擴(kuò)展名可以省略,如果 Stata 中已經(jīng)修改或者建立了數(shù)據(jù)集, 則需要使用 clear 選項清除原有數(shù)據(jù),命令為:. use c:data1 , clear3讀入文本格式數(shù)據(jù):需要使用insheet 命令實現(xiàn),例如需要讀入已建立好的文本格式數(shù)據(jù)文件“ C:
11、data1.txt ”,則命令為:. insheet using c:data1.txt該命令會自動識別第一行是否為變量名,以及變量列間的分隔符 是tab、逗號還是其他字符。如果Stata中已經(jīng)修改或者建立了數(shù)據(jù)集,則需要使用 clear 選項清除原有數(shù)據(jù),命令為:. insheet using c:data1.txt , clear5)數(shù)據(jù)文件的保存為了方便以后重復(fù)使用,輸入 Stata的數(shù)據(jù)應(yīng)存盤。Stata實際上 只能將數(shù)據(jù)存為自身專用的數(shù)據(jù)格式或者純文本格式,分述如下:1點(diǎn)擊圖標(biāo),然后選擇路徑和文件名,點(diǎn)擊保存二2存為dta格式:可以直接使用文件菜單,也可以使用save命令操作,如欲將
12、上面建立的數(shù)據(jù)文件存入“”中,文件名為Datal.dta,則命令為:.save c:data1file c:data1.dta saved該指令將在C盤根目錄建立一個名為“ datal.dta”的Stata數(shù)據(jù) 文件,后綴dta可以在命令中省略,會被自動添加。該文件只能在 Stata中用use命令打開。如所指定的文件已經(jīng)存在,則該命令將給 出如下信息:file c:data1.dta already exists,告訴用戶在該目標(biāo)盤及 子目錄中已有相同的文件名存在。如欲覆蓋已有文件,則加選擇項 replace。命令及結(jié)果如下:.save c:data1.dta , replacefile c:data1.dta saved2.存為文本格式:需要使用outsheet命令實現(xiàn),該命令的基本格 式如下。outsheet 變量名列表using 文件名 ,nonames repl
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度特色采摘園長期租賃合作協(xié)議書3篇
- 2025年度出租車車輛購置及融資租賃合同4篇
- 二零二五年度棉花病蟲害防治與防治藥物供應(yīng)合同3篇
- 二零二五年度苗木知識產(chǎn)權(quán)保護(hù)與合作合同4篇
- 2025版米面品牌授權(quán)及聯(lián)合營銷合同4篇
- 二零二五版夾板產(chǎn)品品牌授權(quán)合作協(xié)議4篇
- 2025年度糧油產(chǎn)品市場調(diào)研與采購合作協(xié)議4篇
- 二零二五年度旅游度假村運(yùn)營管理合同模板3篇
- 二零二五年度陜西省融資租賃合同
- 2024門窗行業(yè)市場調(diào)研與推廣合作協(xié)議2篇
- GB/T 3953-2024電工圓銅線
- 糧油儲藏技術(shù)規(guī)范課件
- 人教版小學(xué)數(shù)學(xué)一年級上冊20以內(nèi)口算天天練試題全套
- 技術(shù)服務(wù)補(bǔ)充協(xié)議范本
- 促進(jìn)自然分娩資料課件
- 人際風(fēng)格的類型
- 醫(yī)院科室宣傳方案
- 藥物外滲和滲出的預(yù)防和處理
- 高壓變頻器培訓(xùn)教材
- 立式氣液分離器計算
- 發(fā)電機(jī)停電故障應(yīng)急預(yù)案
評論
0/150
提交評論