STATA統(tǒng)計軟件操作

上傳人：飛*** IP屬地：河北上傳時間：2020-07-31 格式：PPT 頁數(shù)：30 大小：64KB 積分：12 舉報 版權(quán)申訴

已閱讀5頁，還剩25頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、STATA統(tǒng)計軟件操作,Stata入門 Stata的數(shù)據(jù)讀入數(shù)據(jù)庫的描述變量的生成與處理數(shù)據(jù)的合并數(shù)據(jù)的轉(zhuǎn)換單變量描述雙變量描述,描述數(shù)據(jù)的統(tǒng)計量參數(shù)估計：區(qū)間估計假設(shè)檢驗線性回歸分析,Stata入門,五大功能：數(shù)據(jù)管理、統(tǒng)計分析、圖形制作、矩陣運(yùn)算和程序設(shè)計。界面： Command(命令)、Results(結(jié)果)、Review(回顧)、Variables(變量)。菜單基本功能：文件（File）、編輯（Edit）、偏好（Prefs，用戶界面設(shè)置菜單）、數(shù)據(jù)（Data，數(shù)據(jù)的基本處理、描述、排序、改變變量、生成新變量、整合數(shù)據(jù)、拆分?jǐn)?shù)據(jù)等）、圖表（Graphics）、統(tǒng)

2、計（Statistics數(shù)據(jù)分析）、使用者（User）、窗口（Window）、幫助（help）快捷根據(jù)圖表的基本功能： Log(記錄文件窗口)、Viewer(幫助窗口)、Results(分析結(jié)果窗口)、Do-file Editor(編程窗口)、Data Editor(數(shù)據(jù)編輯窗口)、Data Browse(數(shù)據(jù)瀏覽窗口)、Clear-more-Condition(顯示更多結(jié)果)、Break(不要顯示更多結(jié)果)。,Stata數(shù)據(jù)的讀入,log文件。創(chuàng)建文件：log using “文件路徑和名稱”，其后帶append表示在原有文件的基礎(chǔ)上增加新內(nèi)容，其后帶replace表示取代原記錄文件；暫

3、停：log off；再次開始：log on；關(guān)閉：log close。數(shù)據(jù)的存儲空間：增加存儲空間（set mem 40m）清空存儲空間（clear，相當(dāng)于drop all）。,Stata數(shù)據(jù)的讀入,數(shù)據(jù)的讀入：可直接讀入下列尾綴形式的數(shù)據(jù).dta/.txt/.raw/.xls；讀入文件中的部分變量：use a b c using“文件路徑和名稱”；讀入文件中的部分樣本：use “文件路徑和名稱” in X/Y(X、Y表示個案序號)；讀入文件中某些特征的樣本：use“文件路徑和名稱”if 條件句；,數(shù)據(jù)庫的描述,描述數(shù)據(jù)的基本情況：describe, d describe,

4、simple:只展示變量名； describe，short：報告變量總體情況； describe，detail：輸出全部變量的全部信息； describe a b c：描述部分變量的情況。變量編碼本： codebook。 codebook+變量名：描述變量特征。,Stata數(shù)據(jù)類型及特點,與數(shù)據(jù)類型對應(yīng)的是數(shù)據(jù)庫中變量的存儲類型（storage type）：。字符型:保存格式為str，省略表示的是字符位數(shù) 數(shù)值型：保存格式有byte, int, long, float, double。默認(rèn)格式是float，前三種只保留整數(shù)，占空間最大到最小的順序是double, float, long,

5、int, byte 壓縮變量的命令為compress Compress為壓縮所有變量； Compress yr*為壓縮共同前綴的變量； Compress a-c為壓縮從a到c之間的所有變量。,數(shù)據(jù)庫的描述,描述變量取值的基本命令參數(shù)： inspect。顯示數(shù)據(jù)： browse直接進(jìn)入數(shù)據(jù)的瀏覽窗口； list最好指定變量，否則會輸出數(shù)據(jù)中所有變量的分布。數(shù)據(jù)排序： sort。例：比較城鄉(xiāng)孩子的性別bysort urban: inspect girl或者sort urban然后by urban: inspect girl.,變量的生成與處理,注意事項：不要使用新變量取代舊變量；充分了解

6、原始變量的分布以及每個數(shù)值代表的含義；遵循不重不漏；將原始變量和新變量的取值進(jìn)行對比，檢查是否有誤；注意原始變量的缺失值。使用genreplace命令生成新變量； genreplace if共同使用形成分組變量 recode v , gen(nv) recode v v的取值nv的取值 *=其他取值(*表示所有其他沒有列出的數(shù)值)，gen（新變量名） recode yrsch 0=0 11=1 12=2 13=3 14=4 15=5 16=6 21=7 *=.,gen (edu),變量的生成與處理,生成分類變量： egen 新變量命cut（舊變量名），at（取值的下限） eg：egen

7、agegrp1=cut(age),at(0,7,13,16,20) 按照變量b的分類生成均值變量： egen a_mean=mean(a),by (b) 生成一個變量b和c的行均值變量（avg），忽略缺失值： egen avgrmean(b c) 生成標(biāo)準(zhǔn)數(shù)值： egen zweight=std(weight) 計算每一年觀察的樣本，從而了解在每年的調(diào)查中，有多少相同的樣本（或相同的個體）： gen numobs=count(personid), by(personid year),數(shù)據(jù)的合并（縱向）,縱向合并：作用：增加樣本量命令：append 菜單：Data-Combine datas

8、ets-Append datasets；程序：append using“文件路徑和名稱”；append using“文件路徑和名稱”，keep 變量名。,數(shù)據(jù)的合并（橫向）,橫向合并作用：增加變量（merge）。菜單：Data-Combine datasets-Merge two datasets或Data-Combine datasets-Merge multiple datasets 程序：先看使用數(shù)據(jù)：use “文件路徑和名稱”，sort 關(guān)鍵變量名，save“文件路徑和名稱”，replace；再看主要數(shù)據(jù)，use“文件路徑和名稱”，sort關(guān)鍵變量名；最后，合并數(shù)據(jù)：merg

9、e 關(guān)鍵變量名 using “文件路徑和名稱”，keep（變量）。,數(shù)據(jù)的合并（系統(tǒng)變量）,關(guān)于系統(tǒng)變量：_merge，它的取值限于 1觀察值僅來自主要數(shù)據(jù)，使用數(shù)據(jù)沒有匹配的樣本， 2觀察值僅來自使用數(shù)據(jù)，主要數(shù)據(jù)沒有匹配的樣本， 3觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù)。若使用update選項，還會有： 4觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù)，且主要數(shù)據(jù)的缺失值得到更新， 5觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù)，且兩個數(shù)據(jù)的數(shù)值不匹配。,數(shù)據(jù)的轉(zhuǎn)換（reshape）,數(shù)據(jù)的結(jié)構(gòu)：寬數(shù)據(jù)（wide format）長數(shù)據(jù)（long format）菜單： Data-Create or change vari

10、ables-Other variable transformation commands-Convert data between wide 按變量x的分類，生成一張其取值圖histogram x，discrete; 箱線圖。按變量x的分類，生成變量y的箱線圖： graph box y, over(x)；按變量x的分類，生成變量y1和y2的箱線圖graph box y1 y2, over(x)；按變量x的分類，生成變量y的橫向箱線圖：graph hbox y, over(x)；矩陣圖。生成x1、x2、x3的矩陣圖，只顯示一半：graph matrix x1 x2 x3, half 將

11、圖形x1和x2合并：graph combine x1 x2,區(qū)間估計,單個總體均值的區(qū)間估計：求多個變量的置信區(qū)間，對變量的數(shù)目沒限制：ci x1 x2 x3。 eg：bysort urban: ci x1 x2 x3 if age14. mean x1 x2 x3，輸出均值、標(biāo)準(zhǔn)誤和95%的置信區(qū)間。按變量e分類來求取a、b、c三個變量的區(qū)間估計：mean a b c，over（e）,區(qū)間估計,單個總體比例的區(qū)間估計計算a這個二分變量的比例、標(biāo)準(zhǔn)誤和95%的置信區(qū)間：proportion a。按b分類來計算a這個二分變量的區(qū)間估計：proportion a，over（b）。,區(qū)間估計

12、,單個總體比率的區(qū)間估計按城鄉(xiāng)分類，估計體重身高之比的區(qū)間估計：ratio(weight/height),over(urban) 注意：stata默認(rèn)輸出的是95%的置信區(qū)間，若想要99%或90%的置信區(qū)間，則須在命令最后寫“，level（99）”或“，level（90）”,假設(shè)檢驗,一個總體均值的檢驗：ttest 變量=數(shù)值。例如：ttest height=160 if age14或者ttest height=160 if age14,level(99) 兩個獨立樣本均值比較的t檢驗： ttest a，by（b）。 eg：分城鄉(xiāng)孩子的體重差異檢驗：ttest weight，by（urba

13、n）,假設(shè)檢驗,配對樣本均值比較的t檢驗： ttest a1=a2。多個總體均值差異的檢驗，即方差分析： oneway y x（y為因變量，x為類別自變量）例如：oneway weight sibs if age13,tab scheffe。（tab輸出各組描述性統(tǒng)計結(jié)果，scheffe采用scheffe方法提供多重組間比較結(jié)果）,方差分析,雙（多）因素方差分析： anova y a b（a、b為因素） anova y a b a*b（加入a、b的交互作用）協(xié)方差分析： anova y a b c，cont（c）；指定c為連續(xù)變量，相應(yīng)地a、b、c為類別變量。 anova y a b c，category（a b），指明a、b為分類變量，從而暗示其他變量c為連續(xù)變量。,相關(guān)分析,corr a b c。輸出a、b、c的相關(guān)系數(shù)矩陣。 pwcorr

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

STATA統(tǒng)計軟件操作

文檔簡介

溫馨提示

最新文檔

評論

STATA統(tǒng)計軟件操作

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔