版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、STATA統(tǒng)計(jì)軟件操作,Stata入門 Stata的數(shù)據(jù)讀入 數(shù)據(jù)庫的描述 變量的生成與處理 數(shù)據(jù)的合并 數(shù)據(jù)的轉(zhuǎn)換 單變量描述 雙變量描述,描述數(shù)據(jù)的統(tǒng)計(jì)量 參數(shù)估計(jì):區(qū)間估計(jì) 假設(shè)檢驗(yàn) 線性回歸分析,Stata入門,五大功能: 數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖形制作、矩陣運(yùn)算和程序設(shè)計(jì)。 界面: Command(命令)、Results(結(jié)果)、Review(回顧)、Variables(變量)。 菜單基本功能: 文件(File)、編輯(Edit)、偏好(Prefs,用戶界面設(shè)置菜單)、數(shù)據(jù)(Data,數(shù)據(jù)的基本處理、描述、排序、改變變量、生成新變量、整合數(shù)據(jù)、拆分?jǐn)?shù)據(jù)等)、圖表(Graphics)、統(tǒng)
2、計(jì)(Statistics數(shù)據(jù)分析)、使用者(User)、窗口(Window)、幫助(help) 快捷根據(jù)圖表的基本功能: Log(記錄文件窗口)、Viewer(幫助窗口)、Results(分析結(jié)果窗口)、Do-file Editor(編程窗口)、Data Editor(數(shù)據(jù)編輯窗口)、Data Browse(數(shù)據(jù)瀏覽窗口)、Clear-more-Condition(顯示更多結(jié)果)、Break(不要顯示更多結(jié)果)。,Stata數(shù)據(jù)的讀入,log文件。 創(chuàng)建文件:log using “文件路徑和名稱”,其后帶append表示在原有文件的基礎(chǔ)上增加新內(nèi)容,其后帶replace表示取代原記錄文件; 暫
3、停:log off; 再次開始:log on; 關(guān)閉:log close。 數(shù)據(jù)的存儲(chǔ)空間: 增加存儲(chǔ)空間(set mem 40m) 清空存儲(chǔ)空間(clear,相當(dāng)于drop all)。,Stata數(shù)據(jù)的讀入,數(shù)據(jù)的讀入: 可直接讀入下列尾綴形式的數(shù)據(jù).dta/.txt/.raw/.xls; 讀入文件中的部分變量:use a b c using“文件路徑和名稱”; 讀入文件中的部分樣本:use “文件路徑和名稱” in X/Y(X、Y表示個(gè)案序號(hào)); 讀入文件中某些特征的樣本:use“文件路徑和名稱”if 條件句;,數(shù)據(jù)庫的描述,描述數(shù)據(jù)的基本情況:describe, d describe,
4、simple:只展示變量名; describe,short:報(bào)告變量總體情況; describe,detail:輸出全部變量的全部信息; describe a b c:描述部分變量的情況。 變量編碼本: codebook。 codebook+變量名:描述變量特征。,Stata數(shù)據(jù)類型及特點(diǎn),與數(shù)據(jù)類型對(duì)應(yīng)的是數(shù)據(jù)庫中變量的存儲(chǔ)類型(storage type):。 字符型:保存格式為str,省略表示的是字符位數(shù) 數(shù)值型:保存格式有byte, int, long, float, double。默認(rèn)格式是float,前三種只保留整數(shù),占空間最大到最小的順序是double, float, long,
5、int, byte 壓縮變量的命令為compress Compress為壓縮所有變量; Compress yr*為壓縮共同前綴的變量; Compress a-c為壓縮從a到c之間的所有變量。,數(shù)據(jù)庫的描述,描述變量取值的基本命令參數(shù): inspect。 顯示數(shù)據(jù): browse直接進(jìn)入數(shù)據(jù)的瀏覽窗口; list最好指定變量,否則會(huì)輸出數(shù)據(jù)中所有變量的分布。 數(shù)據(jù)排序: sort。 例:比較城鄉(xiāng)孩子的性別bysort urban: inspect girl或者sort urban然后by urban: inspect girl.,變量的生成與處理,注意事項(xiàng): 不要使用新變量取代舊變量; 充分了解
6、原始變量的分布以及每個(gè)數(shù)值代表的含義; 遵循不重不漏; 將原始變量和新變量的取值進(jìn)行對(duì)比,檢查是否有誤;注意原始變量的缺失值。 使用genreplace命令生成新變量; genreplace if共同使用形成分組變量 recode v , gen(nv) recode v v的取值nv的取值 *=其他取值(*表示所有其他沒有列出的數(shù)值),gen(新變量名) recode yrsch 0=0 11=1 12=2 13=3 14=4 15=5 16=6 21=7 *=.,gen (edu),變量的生成與處理,生成分類變量: egen 新變量命c(diǎn)ut(舊變量名),at(取值的下限) eg:egen
7、agegrp1=cut(age),at(0,7,13,16,20) 按照變量b的分類生成均值變量: egen a_mean=mean(a),by (b) 生成一個(gè)變量b和c的行均值變量(avg),忽略缺失值: egen avgrmean(b c) 生成標(biāo)準(zhǔn)數(shù)值: egen zweight=std(weight) 計(jì)算每一年觀察的樣本,從而了解在每年的調(diào)查中,有多少相同的樣本(或相同的個(gè)體): gen numobs=count(personid), by(personid year),數(shù)據(jù)的合并(縱向),縱向合并: 作用:增加樣本量 命令:append 菜單:Data-Combine datas
8、ets-Append datasets; 程序:append using“文件路徑和名稱”;append using“文件路徑和名稱”,keep 變量名。,數(shù)據(jù)的合并(橫向),橫向合并 作用:增加變量(merge)。 菜單:Data-Combine datasets-Merge two datasets或Data-Combine datasets-Merge multiple datasets 程序:先看使用數(shù)據(jù):use “文件路徑和名稱”,sort 關(guān)鍵變量名,save“文件路徑和名稱”,replace; 再看主要數(shù)據(jù),use“文件路徑和名稱”,sort關(guān)鍵變量名; 最后,合并數(shù)據(jù):merg
9、e 關(guān)鍵變量名 using “文件路徑和名稱”,keep(變量)。,數(shù)據(jù)的合并(系統(tǒng)變量),關(guān)于系統(tǒng)變量:_merge,它的取值限于 1觀察值僅來自主要數(shù)據(jù),使用數(shù)據(jù)沒有匹配的樣本, 2觀察值僅來自使用數(shù)據(jù),主要數(shù)據(jù)沒有匹配的樣本, 3觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù)。 若使用update選項(xiàng),還會(huì)有: 4觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù),且主要數(shù)據(jù)的缺失值得到更新, 5觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù),且兩個(gè)數(shù)據(jù)的數(shù)值不匹配。,數(shù)據(jù)的轉(zhuǎn)換(reshape),數(shù)據(jù)的結(jié)構(gòu): 寬數(shù)據(jù)(wide format) 長數(shù)據(jù)(long format) 菜單: Data-Create or change vari
10、ables-Other variable transformation commands-Convert data between wide 按變量x的分類,生成一張其取值圖histogram x,discrete; 箱線圖。 按變量x的分類,生成變量y的箱線圖: graph box y, over(x); 按變量x的分類,生成變量y1和y2的箱線圖graph box y1 y2, over(x); 按變量x的分類,生成變量y的橫向箱線圖:graph hbox y, over(x); 矩陣圖。 生成x1、x2、x3的矩陣圖,只顯示一半:graph matrix x1 x2 x3, half 將
11、圖形x1和x2合并:graph combine x1 x2,區(qū)間估計(jì),單個(gè)總體均值的區(qū)間估計(jì): 求多個(gè)變量的置信區(qū)間,對(duì)變量的數(shù)目沒限制:ci x1 x2 x3。 eg:bysort urban: ci x1 x2 x3 if age14. mean x1 x2 x3,輸出均值、標(biāo)準(zhǔn)誤和95%的置信區(qū)間。 按變量e分類來求取a、b、c三個(gè)變量的區(qū)間估計(jì):mean a b c,over(e),區(qū)間估計(jì),單個(gè)總體比例的區(qū)間估計(jì) 計(jì)算a這個(gè)二分變量的比例、標(biāo)準(zhǔn)誤和95%的置信區(qū)間:proportion a。 按b分類來計(jì)算a這個(gè)二分變量的區(qū)間估計(jì):proportion a,over(b)。,區(qū)間估計(jì)
12、,單個(gè)總體比率的區(qū)間估計(jì) 按城鄉(xiāng)分類,估計(jì)體重身高之比的區(qū)間估計(jì):ratio(weight/height),over(urban) 注意:stata默認(rèn)輸出的是95%的置信區(qū)間,若想要99%或90%的置信區(qū)間,則須在命令最后寫“,level(99)”或“,level(90)”,假設(shè)檢驗(yàn),一個(gè)總體均值的檢驗(yàn):ttest 變量=數(shù)值。 例如:ttest height=160 if age14或者ttest height=160 if age14,level(99) 兩個(gè)獨(dú)立樣本均值比較的t檢驗(yàn): ttest a,by(b)。 eg:分城鄉(xiāng)孩子的體重差異檢驗(yàn):ttest weight,by(urba
13、n),假設(shè)檢驗(yàn),配對(duì)樣本均值比較的t檢驗(yàn): ttest a1=a2。 多個(gè)總體均值差異的檢驗(yàn),即方差分析: oneway y x(y為因變量,x為類別自變量) 例如:oneway weight sibs if age13,tab scheffe。(tab輸出各組描述性統(tǒng)計(jì)結(jié)果,scheffe采用scheffe方法提供多重組間比較結(jié)果),方差分析,雙(多)因素方差分析: anova y a b(a、b為因素) anova y a b a*b(加入a、b的交互作用) 協(xié)方差分析: anova y a b c,cont(c); 指定c為連續(xù)變量,相應(yīng)地a、b、c為類別變量。 anova y a b c,category(a b), 指明a、b為分類變量,從而暗示其他變量c為連續(xù)變量。,相關(guān)分析,corr a b c。 輸出a、b、c的相關(guān)系數(shù)矩陣。 pwcorr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度房地產(chǎn)項(xiàng)目補(bǔ)充協(xié)議合同范本3篇
- 二零二五年度出口代理服務(wù)合同模板(含知識(shí)產(chǎn)權(quán)保護(hù)條款)2篇
- 二零二五年臨時(shí)動(dòng)物保護(hù)員服務(wù)合同協(xié)議3篇
- 2025年外賣配送員勞動(dòng)權(quán)益保障與職業(yè)培訓(xùn)合同3篇
- 2025年度智能社區(qū)物業(yè)管理平臺(tái)開發(fā)與后續(xù)服務(wù)合同3篇
- 二零二五年度二手挖掘機(jī)買賣合同智能設(shè)備配套3篇
- 二零二五年度國際品牌國內(nèi)加盟合作協(xié)議2篇
- 二零二五年度旅游安全責(zé)任保障合同
- 二零二五年度房屋拆除項(xiàng)目拆除物處置與環(huán)保達(dá)標(biāo)協(xié)議3篇
- 二零二五年度新型建筑機(jī)械租賃服務(wù)合同范本3篇
- 江蘇省蘇州市2023-2024學(xué)年高一上學(xué)期期末學(xué)業(yè)質(zhì)量陽光指標(biāo)調(diào)研語文試卷
- 大學(xué)軍事理論課教程第三章軍事思想第四節(jié)當(dāng)代中國軍事思想
- 開展學(xué)科周活動(dòng)方案
- 園林景觀給排水設(shè)計(jì)匯總計(jì)算書
- 《電線電纜常用計(jì)算公式》
- 關(guān)于心理健康教育情況的調(diào)研報(bào)告
- 內(nèi)側(cè)蒂直線短瘢痕法治療乳房肥大癥的臨床研究
- 天一大聯(lián)考2024屆物理高一上期末學(xué)業(yè)水平測(cè)試試題含解析
- 整改回復(fù)書樣板后邊附帶圖片
- 空氣能施工方案
- 常見藻類圖譜(史上最全版本)
評(píng)論
0/150
提交評(píng)論