STATA統(tǒng)計(jì)軟件操作_第1頁
STATA統(tǒng)計(jì)軟件操作_第2頁
STATA統(tǒng)計(jì)軟件操作_第3頁
STATA統(tǒng)計(jì)軟件操作_第4頁
STATA統(tǒng)計(jì)軟件操作_第5頁
已閱讀5頁,還剩25頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、STATA統(tǒng)計(jì)軟件操作,Stata入門 Stata的數(shù)據(jù)讀入 數(shù)據(jù)庫的描述 變量的生成與處理 數(shù)據(jù)的合并 數(shù)據(jù)的轉(zhuǎn)換 單變量描述 雙變量描述,描述數(shù)據(jù)的統(tǒng)計(jì)量 參數(shù)估計(jì):區(qū)間估計(jì) 假設(shè)檢驗(yàn) 線性回歸分析,Stata入門,五大功能: 數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖形制作、矩陣運(yùn)算和程序設(shè)計(jì)。 界面: Command(命令)、Results(結(jié)果)、Review(回顧)、Variables(變量)。 菜單基本功能: 文件(File)、編輯(Edit)、偏好(Prefs,用戶界面設(shè)置菜單)、數(shù)據(jù)(Data,數(shù)據(jù)的基本處理、描述、排序、改變變量、生成新變量、整合數(shù)據(jù)、拆分?jǐn)?shù)據(jù)等)、圖表(Graphics)、統(tǒng)

2、計(jì)(Statistics數(shù)據(jù)分析)、使用者(User)、窗口(Window)、幫助(help) 快捷根據(jù)圖表的基本功能: Log(記錄文件窗口)、Viewer(幫助窗口)、Results(分析結(jié)果窗口)、Do-file Editor(編程窗口)、Data Editor(數(shù)據(jù)編輯窗口)、Data Browse(數(shù)據(jù)瀏覽窗口)、Clear-more-Condition(顯示更多結(jié)果)、Break(不要顯示更多結(jié)果)。,Stata數(shù)據(jù)的讀入,log文件。 創(chuàng)建文件:log using “文件路徑和名稱”,其后帶append表示在原有文件的基礎(chǔ)上增加新內(nèi)容,其后帶replace表示取代原記錄文件; 暫

3、停:log off; 再次開始:log on; 關(guān)閉:log close。 數(shù)據(jù)的存儲(chǔ)空間: 增加存儲(chǔ)空間(set mem 40m) 清空存儲(chǔ)空間(clear,相當(dāng)于drop all)。,Stata數(shù)據(jù)的讀入,數(shù)據(jù)的讀入: 可直接讀入下列尾綴形式的數(shù)據(jù).dta/.txt/.raw/.xls; 讀入文件中的部分變量:use a b c using“文件路徑和名稱”; 讀入文件中的部分樣本:use “文件路徑和名稱” in X/Y(X、Y表示個(gè)案序號(hào)); 讀入文件中某些特征的樣本:use“文件路徑和名稱”if 條件句;,數(shù)據(jù)庫的描述,描述數(shù)據(jù)的基本情況:describe, d describe,

4、simple:只展示變量名; describe,short:報(bào)告變量總體情況; describe,detail:輸出全部變量的全部信息; describe a b c:描述部分變量的情況。 變量編碼本: codebook。 codebook+變量名:描述變量特征。,Stata數(shù)據(jù)類型及特點(diǎn),與數(shù)據(jù)類型對(duì)應(yīng)的是數(shù)據(jù)庫中變量的存儲(chǔ)類型(storage type):。 字符型:保存格式為str,省略表示的是字符位數(shù) 數(shù)值型:保存格式有byte, int, long, float, double。默認(rèn)格式是float,前三種只保留整數(shù),占空間最大到最小的順序是double, float, long,

5、int, byte 壓縮變量的命令為compress Compress為壓縮所有變量; Compress yr*為壓縮共同前綴的變量; Compress a-c為壓縮從a到c之間的所有變量。,數(shù)據(jù)庫的描述,描述變量取值的基本命令參數(shù): inspect。 顯示數(shù)據(jù): browse直接進(jìn)入數(shù)據(jù)的瀏覽窗口; list最好指定變量,否則會(huì)輸出數(shù)據(jù)中所有變量的分布。 數(shù)據(jù)排序: sort。 例:比較城鄉(xiāng)孩子的性別bysort urban: inspect girl或者sort urban然后by urban: inspect girl.,變量的生成與處理,注意事項(xiàng): 不要使用新變量取代舊變量; 充分了解

6、原始變量的分布以及每個(gè)數(shù)值代表的含義; 遵循不重不漏; 將原始變量和新變量的取值進(jìn)行對(duì)比,檢查是否有誤;注意原始變量的缺失值。 使用genreplace命令生成新變量; genreplace if共同使用形成分組變量 recode v , gen(nv) recode v v的取值nv的取值 *=其他取值(*表示所有其他沒有列出的數(shù)值),gen(新變量名) recode yrsch 0=0 11=1 12=2 13=3 14=4 15=5 16=6 21=7 *=.,gen (edu),變量的生成與處理,生成分類變量: egen 新變量命c(diǎn)ut(舊變量名),at(取值的下限) eg:egen

7、agegrp1=cut(age),at(0,7,13,16,20) 按照變量b的分類生成均值變量: egen a_mean=mean(a),by (b) 生成一個(gè)變量b和c的行均值變量(avg),忽略缺失值: egen avgrmean(b c) 生成標(biāo)準(zhǔn)數(shù)值: egen zweight=std(weight) 計(jì)算每一年觀察的樣本,從而了解在每年的調(diào)查中,有多少相同的樣本(或相同的個(gè)體): gen numobs=count(personid), by(personid year),數(shù)據(jù)的合并(縱向),縱向合并: 作用:增加樣本量 命令:append 菜單:Data-Combine datas

8、ets-Append datasets; 程序:append using“文件路徑和名稱”;append using“文件路徑和名稱”,keep 變量名。,數(shù)據(jù)的合并(橫向),橫向合并 作用:增加變量(merge)。 菜單:Data-Combine datasets-Merge two datasets或Data-Combine datasets-Merge multiple datasets 程序:先看使用數(shù)據(jù):use “文件路徑和名稱”,sort 關(guān)鍵變量名,save“文件路徑和名稱”,replace; 再看主要數(shù)據(jù),use“文件路徑和名稱”,sort關(guān)鍵變量名; 最后,合并數(shù)據(jù):merg

9、e 關(guān)鍵變量名 using “文件路徑和名稱”,keep(變量)。,數(shù)據(jù)的合并(系統(tǒng)變量),關(guān)于系統(tǒng)變量:_merge,它的取值限于 1觀察值僅來自主要數(shù)據(jù),使用數(shù)據(jù)沒有匹配的樣本, 2觀察值僅來自使用數(shù)據(jù),主要數(shù)據(jù)沒有匹配的樣本, 3觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù)。 若使用update選項(xiàng),還會(huì)有: 4觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù),且主要數(shù)據(jù)的缺失值得到更新, 5觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù),且兩個(gè)數(shù)據(jù)的數(shù)值不匹配。,數(shù)據(jù)的轉(zhuǎn)換(reshape),數(shù)據(jù)的結(jié)構(gòu): 寬數(shù)據(jù)(wide format) 長數(shù)據(jù)(long format) 菜單: Data-Create or change vari

10、ables-Other variable transformation commands-Convert data between wide 按變量x的分類,生成一張其取值圖histogram x,discrete; 箱線圖。 按變量x的分類,生成變量y的箱線圖: graph box y, over(x); 按變量x的分類,生成變量y1和y2的箱線圖graph box y1 y2, over(x); 按變量x的分類,生成變量y的橫向箱線圖:graph hbox y, over(x); 矩陣圖。 生成x1、x2、x3的矩陣圖,只顯示一半:graph matrix x1 x2 x3, half 將

11、圖形x1和x2合并:graph combine x1 x2,區(qū)間估計(jì),單個(gè)總體均值的區(qū)間估計(jì): 求多個(gè)變量的置信區(qū)間,對(duì)變量的數(shù)目沒限制:ci x1 x2 x3。 eg:bysort urban: ci x1 x2 x3 if age14. mean x1 x2 x3,輸出均值、標(biāo)準(zhǔn)誤和95%的置信區(qū)間。 按變量e分類來求取a、b、c三個(gè)變量的區(qū)間估計(jì):mean a b c,over(e),區(qū)間估計(jì),單個(gè)總體比例的區(qū)間估計(jì) 計(jì)算a這個(gè)二分變量的比例、標(biāo)準(zhǔn)誤和95%的置信區(qū)間:proportion a。 按b分類來計(jì)算a這個(gè)二分變量的區(qū)間估計(jì):proportion a,over(b)。,區(qū)間估計(jì)

12、,單個(gè)總體比率的區(qū)間估計(jì) 按城鄉(xiāng)分類,估計(jì)體重身高之比的區(qū)間估計(jì):ratio(weight/height),over(urban) 注意:stata默認(rèn)輸出的是95%的置信區(qū)間,若想要99%或90%的置信區(qū)間,則須在命令最后寫“,level(99)”或“,level(90)”,假設(shè)檢驗(yàn),一個(gè)總體均值的檢驗(yàn):ttest 變量=數(shù)值。 例如:ttest height=160 if age14或者ttest height=160 if age14,level(99) 兩個(gè)獨(dú)立樣本均值比較的t檢驗(yàn): ttest a,by(b)。 eg:分城鄉(xiāng)孩子的體重差異檢驗(yàn):ttest weight,by(urba

13、n),假設(shè)檢驗(yàn),配對(duì)樣本均值比較的t檢驗(yàn): ttest a1=a2。 多個(gè)總體均值差異的檢驗(yàn),即方差分析: oneway y x(y為因變量,x為類別自變量) 例如:oneway weight sibs if age13,tab scheffe。(tab輸出各組描述性統(tǒng)計(jì)結(jié)果,scheffe采用scheffe方法提供多重組間比較結(jié)果),方差分析,雙(多)因素方差分析: anova y a b(a、b為因素) anova y a b a*b(加入a、b的交互作用) 協(xié)方差分析: anova y a b c,cont(c); 指定c為連續(xù)變量,相應(yīng)地a、b、c為類別變量。 anova y a b c,category(a b), 指明a、b為分類變量,從而暗示其他變量c為連續(xù)變量。,相關(guān)分析,corr a b c。 輸出a、b、c的相關(guān)系數(shù)矩陣。 pwcorr

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論