Stata講義0706_第1頁
Stata講義0706_第2頁
Stata講義0706_第3頁
Stata講義0706_第4頁
Stata講義0706_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、Stata 統(tǒng)計軟件入門統(tǒng)計軟件入門北京大學社會科學研究方法暑期學校北京大學社會科學研究方法暑期學校2015/07/062022-3-271進入和退出Stata2022-3-272進入和退出Stata2022-3-273Stata界面2022-3-274菜單欄與工具欄導入外部文件數(shù)據(jù)管理作圖數(shù)據(jù)分析搜索幫助結果保存大綱 1.File:數(shù)據(jù)導入 2.Data:數(shù)據(jù)處理 3.Graphics:作圖 4.Statistics:數(shù)據(jù)分析 5.Edit:結果保存 6.Help:命令搜索 7.小結2022-3-2761.1 File:數(shù)據(jù)導入 數(shù)據(jù)類型:Stata格式,文件后綴為.dta 方法1:在命令窗

2、口輸入”use+數(shù)據(jù)路徑.dta”(第二次課) 方法2:在菜單欄中選擇”FileOpen”,并選擇數(shù)據(jù)所在路徑 方法3:點擊圖標欄 ,并選擇數(shù)據(jù)所在路徑2022-3-2771.1 File:數(shù)據(jù)導入 數(shù)據(jù)類型:Stata格式,文件后綴為.dta 方法2:在菜單欄中選擇”FileOpen”,并選擇數(shù)據(jù)所在路徑2022-3-2781.1 File:數(shù)據(jù)導入 數(shù)據(jù)類型:Stata格式,文件后綴為.dta 方法3:點擊圖標欄 ,并選擇數(shù)據(jù)所在路徑2022-3-2791.1 File:數(shù)據(jù)導入 數(shù)據(jù)類型:raw,txt或者csv, 方法1:在命令窗口輸入”insheet using+數(shù)據(jù)路徑.csv”

3、(第二次課) 方法2:在菜單欄中選擇”FileImport Excel spreadsheet (*.xls;*xlsx)” 練習:用方法2導入數(shù)據(jù)文件“auto_導入數(shù)據(jù).xls” 提示提示:對于非dta格式的數(shù)據(jù),在導入Stata之后最好另存為dta,方便以后使用2022-3-27101.2 File:數(shù)據(jù)保存 Save & save as :保存數(shù)據(jù)&將數(shù)據(jù)另存為 方法:File save File save as 2022-3-27111.3 File:打開運行日志 Log:記錄Stata本次運行的命令和結果 方法:File Log Begin2022-3-27121.

4、4 File:路徑設定 cd:在Stata中全局指定數(shù)據(jù)文件的唯一路徑,之后調(diào)用該數(shù)據(jù)可以不再需要輸入冗長的文件路徑 方法:File Change working directory,選擇文件路徑,2022-3-27132.1 Data:數(shù)據(jù)描述 進入數(shù)據(jù)界面 方法: 瀏覽并修改數(shù)據(jù)Data Data Editor Data Editor (Edit) 瀏覽數(shù)據(jù)Data Data Editor Data Editor (Browse) 紅色代表字符型數(shù)據(jù),黑色代表數(shù)值型數(shù)據(jù),藍色代表分類變量2022-3-27142.1 Data:數(shù)據(jù)描述 Describe 描述數(shù)據(jù)的性質(zhì) 方法:Data De

5、scribe data Describe data in memory2022-3-27152.2 Data:標簽管理 Label 給變量加標簽 Data Data utilities Label utilities Label variable 例:將變量make的標簽Make and Model變?yōu)閙ake and model2022-3-27162.2 Data:標簽管理 標簽過濾器 快速尋找某個變量 方法:進入數(shù)據(jù)界面,在標簽過濾器欄輸入關鍵字 例:搜索標簽名或變量名中含有字母p的變量2022-3-27172.3 Data:數(shù)據(jù)排序 sort 按照某個變量的觀察值大小排序 例:按照we

6、ight由小到大排序 Data Sort, 選擇Advanced sort (mixed ascending/descending)并在Variables中選擇weight 注:如果希望由大到小排序,選擇Standard sort(ascending) 2022-3-27182.4 Data:生成變量 用戶可以生成原數(shù)據(jù)中沒有的變量 generate: 生成的新變量可以是現(xiàn)有變量的函數(shù),也可以是需要賦的值 方法:Data Create or Change Data Create new variable2022-3-27192.5 Data:修改變量 Replace 修改變量賦值 修改變量的觀

7、察值 方法:Data Create or change new data Change contents of variables2022-3-27202.6 Data:刪除/保留變量 刪除/保留變量 方法:Data Variable managers,在需要刪除或保留的變量上方單擊右鍵 刪除/保留觀察值 方法:Data Create or change data Keep or drop observations 2022-3-27212.7 數(shù)據(jù)合并 append 將兩個具有相同變量的數(shù)據(jù)合并2022-3-2722idregiona12262129322243215124Idregion

8、a63257128idregion a 1226212932224321512463257128+=2.7 數(shù)據(jù)合并 append 將兩個具有相同變量的數(shù)據(jù)合并 變量不變,觀察值增加 方法:Data Combine datasets Append datasets 練習:打開數(shù)據(jù)append1.dta,將其與append2.dta合并2022-3-2723idregionincome1226212932224321512465272.7.2 數(shù)據(jù)合并regionfee115213312411idregionincomefee_merge12261332129153322213343211235

9、124153.4.1126527.1masterusing+merged result=注:當master和using數(shù)據(jù)都包含該region值,_merge=3,如region=1的樣本 當using包含但master不包含該region值,_merge=2,如region=4的樣本 當master包含但using不包含該region值,_merge=1,如region=5的樣本2.7.2 數(shù)據(jù)合并 merge 將兩個具有不同觀察值的數(shù)據(jù)合并 觀察值可能變化,變量增加 方法: combine datasets merge two datasets many to one on key var

10、iables 練習:打開merge_master.dta,將其與merge_using.dta合并2022-3-2725 “長數(shù)據(jù)”與”短數(shù)據(jù)”的轉換【例例】 long wide ijx1122808180815000550020002200ix80 x811250002000550022002.8 Data:數(shù)據(jù)形態(tài)轉換 reshape【注注】(1)i是個人編號 (2)j是年份,80代表1980年,81代表1981年 (3)x是i在j年的個人收入 (4) x80表示i在1980年的收入,x81表示i在1981年的收入l 練習:把long數(shù)據(jù)變成wide數(shù)據(jù)【例例】統(tǒng)計各家戶的總收入(data

11、:eg_long&wide)。(1) (1) 轉換表格 Data Create or change data Other variable transformation command Convert data between wide and long Wide format from long (2) (2) 生成新變量 Create new variable Specify a value or an expression2.8 Data:數(shù)據(jù)形態(tài)轉換2.9 小結 2.1 數(shù)據(jù)描述 describe 2.2 標簽管理 label 2.3 數(shù)據(jù)排序 sort 2.4 生成變量 ge

12、n 2.5 修改變量 replace 2.6 刪除/保留變量 drop/keep 2.7 數(shù)據(jù)合并 append/merge 2.8 數(shù)據(jù)形態(tài)轉換 reshape 2022-3-27282.9 小結 數(shù)據(jù)管理是數(shù)據(jù)分析的基礎和前提 本節(jié)介紹了常用的數(shù)據(jù)管理操作方法,在研究中學習其他的使用方法2022-3-27293 Graphics:繪圖 單變量 graph box Histogram 雙變量畫圖 graph twoway (scatter/line)2022-3-27303. Graphics:繪圖2022-3-2731圖形名稱圖形名稱命令關鍵詞命令關鍵詞函數(shù)圖函數(shù)圖twoway funct

13、ion散點圖散點圖twoway scatter直方圖直方圖twoway histogram條形圖條形圖graph bar點統(tǒng)計圖點統(tǒng)計圖graph dot箱線圖箱線圖graph box餅圖餅圖graph pie矩陣圖矩陣圖graph matrix3.1 Graphics:單變量 graph box price 方法:graphics box plots 2022-3-273205,00010,00015,000Price3.1 Graphics:單變量 graph box price 方法:graphics box plots 2022-3-2733 異常值異常值 上邊緣上邊緣 中位數(shù)中位數(shù)

14、上四分位數(shù)上四分位數(shù) 下四分位數(shù)下四分位數(shù) 下邊緣下邊緣3.1 Graphics:單變量 histogram price 方法:Graphics Histogram,選擇變量 2022-3-27343.1 Graphics:單變量 histogram price 方法:Graphics Histogram,選擇變量 2022-3-2735010203040Frequency05,00010,00015,000Price3.2 Graphics:雙變量 graph twoway scatter length weight 方法:Graphics Twoway graph(scatter line

15、 etc.), 點擊Create并選擇變量2022-3-27363.2 Graphics:雙變量 graph twoway scatter length weight 方法:Graphics Twoway graph(scatter line etc.), 點擊Create并選擇變量2022-3-2737140160180200220240Length (in.)2,0003,0004,0005,000Weight (lbs.)3.2 Graphics:雙變量 graph twoway lfit length weight 方法:Graphics Twoway graph(scatter li

16、ne etc.), 點擊Create,選擇fit plots并選擇變量2022-3-2738160180200220240Fitted values2000300040005000Weight (lbs.)3.2 Graphics:雙變量 graph twoway scatter length weight 方法:Graphics Twoway graph(scatter line etc.), 點擊Create并選擇變量2022-3-27393.2 Graphics:雙變量 graph twoway scatter length weight|lfit length weight 方法:第一

17、步,Graphics Twoway graph(scatter line etc.), 點擊Create并選擇變量 第二步,Graphics Twoway graph(scatter line etc.), 點擊Create,點擊Fit Plots并選擇變量2022-3-27403.2 Graphics:雙變量 graph twoway scatter length weight|lfit length weight 方法:第一步,Graphics Twoway graph(scatter line etc.), 點擊Create并選擇變量 第二步,Graphics Twoway graph(

18、scatter line etc.), 點擊Create,點擊Fit Plots并選擇變量2022-3-27411401601802002202402,0003,0004,0005,000Weight (lbs.)Length (in.)Fitted values3.2 Graphics:雙變量 注意:plot definitions中的plot1、plot2將會同時出現(xiàn)在圖中,如果想要去除其中的線性擬合圖或散點圖,可以點擊disable按鈕2022-3-27423.3 小結 3.1 單變量繪圖 箱線圖 直方圖 3.2 雙變量繪圖 散點圖 線性擬合圖 散點擬合圖2022-3-27434.1 S

19、tatistics:統(tǒng)計分析 Tabulate:報告某個變量不同值的頻率 方法:Statistics Summaries, tables, and tests Frequency tables One-way table2022-3-27444.1 Statistics:統(tǒng)計分析 Summarize:基本統(tǒng)計分析,觀察值數(shù)量、平均值、最大值、最小值、標準差 方法:Data Describe data Summary statistics2022-3-27454.2 Statistics:回歸分析 Regress price weight 以price作為因變量,weight作為自變量進行單因素分析 方法:Statistics Linear models and related Linear regression,選擇因變量和自變量2022-3-27464.2 Statistics:回歸分析 Regress price weight 以price作為因變量,weight作為自變量進行單因素分析 方法:Statistics Linear models and related Linear regression,選擇因變量和自變量2022-3-27475. Edit

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論