Stata講義0706_第1頁(yè)
Stata講義0706_第2頁(yè)
Stata講義0706_第3頁(yè)
Stata講義0706_第4頁(yè)
Stata講義0706_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Stata 統(tǒng)計(jì)軟件入門(mén)統(tǒng)計(jì)軟件入門(mén)北京大學(xué)社會(huì)科學(xué)研究方法暑期學(xué)校北京大學(xué)社會(huì)科學(xué)研究方法暑期學(xué)校2015/07/062022-3-271進(jìn)入和退出Stata2022-3-272進(jìn)入和退出Stata2022-3-273Stata界面2022-3-274菜單欄與工具欄導(dǎo)入外部文件數(shù)據(jù)管理作圖數(shù)據(jù)分析搜索幫助結(jié)果保存大綱 1.File:數(shù)據(jù)導(dǎo)入 2.Data:數(shù)據(jù)處理 3.Graphics:作圖 4.Statistics:數(shù)據(jù)分析 5.Edit:結(jié)果保存 6.Help:命令搜索 7.小結(jié)2022-3-2761.1 File:數(shù)據(jù)導(dǎo)入 數(shù)據(jù)類(lèi)型:Stata格式,文件后綴為.dta 方法1:在命令窗

2、口輸入”use+數(shù)據(jù)路徑.dta”(第二次課) 方法2:在菜單欄中選擇”FileOpen”,并選擇數(shù)據(jù)所在路徑 方法3:點(diǎn)擊圖標(biāo)欄 ,并選擇數(shù)據(jù)所在路徑2022-3-2771.1 File:數(shù)據(jù)導(dǎo)入 數(shù)據(jù)類(lèi)型:Stata格式,文件后綴為.dta 方法2:在菜單欄中選擇”FileOpen”,并選擇數(shù)據(jù)所在路徑2022-3-2781.1 File:數(shù)據(jù)導(dǎo)入 數(shù)據(jù)類(lèi)型:Stata格式,文件后綴為.dta 方法3:點(diǎn)擊圖標(biāo)欄 ,并選擇數(shù)據(jù)所在路徑2022-3-2791.1 File:數(shù)據(jù)導(dǎo)入 數(shù)據(jù)類(lèi)型:raw,txt或者csv, 方法1:在命令窗口輸入”insheet using+數(shù)據(jù)路徑.csv”

3、(第二次課) 方法2:在菜單欄中選擇”FileImport Excel spreadsheet (*.xls;*xlsx)” 練習(xí):用方法2導(dǎo)入數(shù)據(jù)文件“auto_導(dǎo)入數(shù)據(jù).xls” 提示提示:對(duì)于非dta格式的數(shù)據(jù),在導(dǎo)入Stata之后最好另存為dta,方便以后使用2022-3-27101.2 File:數(shù)據(jù)保存 Save & save as :保存數(shù)據(jù)&將數(shù)據(jù)另存為 方法:File save File save as 2022-3-27111.3 File:打開(kāi)運(yùn)行日志 Log:記錄Stata本次運(yùn)行的命令和結(jié)果 方法:File Log Begin2022-3-27121.

4、4 File:路徑設(shè)定 cd:在Stata中全局指定數(shù)據(jù)文件的唯一路徑,之后調(diào)用該數(shù)據(jù)可以不再需要輸入冗長(zhǎng)的文件路徑 方法:File Change working directory,選擇文件路徑,2022-3-27132.1 Data:數(shù)據(jù)描述 進(jìn)入數(shù)據(jù)界面 方法: 瀏覽并修改數(shù)據(jù)Data Data Editor Data Editor (Edit) 瀏覽數(shù)據(jù)Data Data Editor Data Editor (Browse) 紅色代表字符型數(shù)據(jù),黑色代表數(shù)值型數(shù)據(jù),藍(lán)色代表分類(lèi)變量2022-3-27142.1 Data:數(shù)據(jù)描述 Describe 描述數(shù)據(jù)的性質(zhì) 方法:Data De

5、scribe data Describe data in memory2022-3-27152.2 Data:標(biāo)簽管理 Label 給變量加標(biāo)簽 Data Data utilities Label utilities Label variable 例:將變量make的標(biāo)簽Make and Model變?yōu)閙ake and model2022-3-27162.2 Data:標(biāo)簽管理 標(biāo)簽過(guò)濾器 快速尋找某個(gè)變量 方法:進(jìn)入數(shù)據(jù)界面,在標(biāo)簽過(guò)濾器欄輸入關(guān)鍵字 例:搜索標(biāo)簽名或變量名中含有字母p的變量2022-3-27172.3 Data:數(shù)據(jù)排序 sort 按照某個(gè)變量的觀察值大小排序 例:按照we

6、ight由小到大排序 Data Sort, 選擇Advanced sort (mixed ascending/descending)并在Variables中選擇weight 注:如果希望由大到小排序,選擇Standard sort(ascending) 2022-3-27182.4 Data:生成變量 用戶(hù)可以生成原數(shù)據(jù)中沒(méi)有的變量 generate: 生成的新變量可以是現(xiàn)有變量的函數(shù),也可以是需要賦的值 方法:Data Create or Change Data Create new variable2022-3-27192.5 Data:修改變量 Replace 修改變量賦值 修改變量的觀

7、察值 方法:Data Create or change new data Change contents of variables2022-3-27202.6 Data:刪除/保留變量 刪除/保留變量 方法:Data Variable managers,在需要?jiǎng)h除或保留的變量上方單擊右鍵 刪除/保留觀察值 方法:Data Create or change data Keep or drop observations 2022-3-27212.7 數(shù)據(jù)合并 append 將兩個(gè)具有相同變量的數(shù)據(jù)合并2022-3-2722idregiona12262129322243215124Idregion

8、a63257128idregion a 1226212932224321512463257128+=2.7 數(shù)據(jù)合并 append 將兩個(gè)具有相同變量的數(shù)據(jù)合并 變量不變,觀察值增加 方法:Data Combine datasets Append datasets 練習(xí):打開(kāi)數(shù)據(jù)append1.dta,將其與append2.dta合并2022-3-2723idregionincome1226212932224321512465272.7.2 數(shù)據(jù)合并regionfee115213312411idregionincomefee_merge12261332129153322213343211235

9、124153.4.1126527.1masterusing+merged result=注:當(dāng)master和using數(shù)據(jù)都包含該region值,_merge=3,如region=1的樣本 當(dāng)using包含但master不包含該region值,_merge=2,如region=4的樣本 當(dāng)master包含但using不包含該region值,_merge=1,如region=5的樣本2.7.2 數(shù)據(jù)合并 merge 將兩個(gè)具有不同觀察值的數(shù)據(jù)合并 觀察值可能變化,變量增加 方法: combine datasets merge two datasets many to one on key var

10、iables 練習(xí):打開(kāi)merge_master.dta,將其與merge_using.dta合并2022-3-2725 “長(zhǎng)數(shù)據(jù)”與”短數(shù)據(jù)”的轉(zhuǎn)換【例例】 long wide ijx1122808180815000550020002200ix80 x811250002000550022002.8 Data:數(shù)據(jù)形態(tài)轉(zhuǎn)換 reshape【注注】(1)i是個(gè)人編號(hào) (2)j是年份,80代表1980年,81代表1981年 (3)x是i在j年的個(gè)人收入 (4) x80表示i在1980年的收入,x81表示i在1981年的收入l 練習(xí):把long數(shù)據(jù)變成wide數(shù)據(jù)【例例】統(tǒng)計(jì)各家戶(hù)的總收入(data

11、:eg_long&wide)。(1) (1) 轉(zhuǎn)換表格 Data Create or change data Other variable transformation command Convert data between wide and long Wide format from long (2) (2) 生成新變量 Create new variable Specify a value or an expression2.8 Data:數(shù)據(jù)形態(tài)轉(zhuǎn)換2.9 小結(jié) 2.1 數(shù)據(jù)描述 describe 2.2 標(biāo)簽管理 label 2.3 數(shù)據(jù)排序 sort 2.4 生成變量 ge

12、n 2.5 修改變量 replace 2.6 刪除/保留變量 drop/keep 2.7 數(shù)據(jù)合并 append/merge 2.8 數(shù)據(jù)形態(tài)轉(zhuǎn)換 reshape 2022-3-27282.9 小結(jié) 數(shù)據(jù)管理是數(shù)據(jù)分析的基礎(chǔ)和前提 本節(jié)介紹了常用的數(shù)據(jù)管理操作方法,在研究中學(xué)習(xí)其他的使用方法2022-3-27293 Graphics:繪圖 單變量 graph box Histogram 雙變量畫(huà)圖 graph twoway (scatter/line)2022-3-27303. Graphics:繪圖2022-3-2731圖形名稱(chēng)圖形名稱(chēng)命令關(guān)鍵詞命令關(guān)鍵詞函數(shù)圖函數(shù)圖twoway funct

13、ion散點(diǎn)圖散點(diǎn)圖twoway scatter直方圖直方圖twoway histogram條形圖條形圖graph bar點(diǎn)統(tǒng)計(jì)圖點(diǎn)統(tǒng)計(jì)圖graph dot箱線(xiàn)圖箱線(xiàn)圖graph box餅圖餅圖graph pie矩陣圖矩陣圖graph matrix3.1 Graphics:單變量 graph box price 方法:graphics box plots 2022-3-273205,00010,00015,000Price3.1 Graphics:單變量 graph box price 方法:graphics box plots 2022-3-2733 異常值異常值 上邊緣上邊緣 中位數(shù)中位數(shù)

14、上四分位數(shù)上四分位數(shù) 下四分位數(shù)下四分位數(shù) 下邊緣下邊緣3.1 Graphics:單變量 histogram price 方法:Graphics Histogram,選擇變量 2022-3-27343.1 Graphics:單變量 histogram price 方法:Graphics Histogram,選擇變量 2022-3-2735010203040Frequency05,00010,00015,000Price3.2 Graphics:雙變量 graph twoway scatter length weight 方法:Graphics Twoway graph(scatter line

15、 etc.), 點(diǎn)擊Create并選擇變量2022-3-27363.2 Graphics:雙變量 graph twoway scatter length weight 方法:Graphics Twoway graph(scatter line etc.), 點(diǎn)擊Create并選擇變量2022-3-2737140160180200220240Length (in.)2,0003,0004,0005,000Weight (lbs.)3.2 Graphics:雙變量 graph twoway lfit length weight 方法:Graphics Twoway graph(scatter li

16、ne etc.), 點(diǎn)擊Create,選擇fit plots并選擇變量2022-3-2738160180200220240Fitted values2000300040005000Weight (lbs.)3.2 Graphics:雙變量 graph twoway scatter length weight 方法:Graphics Twoway graph(scatter line etc.), 點(diǎn)擊Create并選擇變量2022-3-27393.2 Graphics:雙變量 graph twoway scatter length weight|lfit length weight 方法:第一

17、步,Graphics Twoway graph(scatter line etc.), 點(diǎn)擊Create并選擇變量 第二步,Graphics Twoway graph(scatter line etc.), 點(diǎn)擊Create,點(diǎn)擊Fit Plots并選擇變量2022-3-27403.2 Graphics:雙變量 graph twoway scatter length weight|lfit length weight 方法:第一步,Graphics Twoway graph(scatter line etc.), 點(diǎn)擊Create并選擇變量 第二步,Graphics Twoway graph(

18、scatter line etc.), 點(diǎn)擊Create,點(diǎn)擊Fit Plots并選擇變量2022-3-27411401601802002202402,0003,0004,0005,000Weight (lbs.)Length (in.)Fitted values3.2 Graphics:雙變量 注意:plot definitions中的plot1、plot2將會(huì)同時(shí)出現(xiàn)在圖中,如果想要去除其中的線(xiàn)性擬合圖或散點(diǎn)圖,可以點(diǎn)擊disable按鈕2022-3-27423.3 小結(jié) 3.1 單變量繪圖 箱線(xiàn)圖 直方圖 3.2 雙變量繪圖 散點(diǎn)圖 線(xiàn)性擬合圖 散點(diǎn)擬合圖2022-3-27434.1 S

19、tatistics:統(tǒng)計(jì)分析 Tabulate:報(bào)告某個(gè)變量不同值的頻率 方法:Statistics Summaries, tables, and tests Frequency tables One-way table2022-3-27444.1 Statistics:統(tǒng)計(jì)分析 Summarize:基本統(tǒng)計(jì)分析,觀察值數(shù)量、平均值、最大值、最小值、標(biāo)準(zhǔn)差 方法:Data Describe data Summary statistics2022-3-27454.2 Statistics:回歸分析 Regress price weight 以price作為因變量,weight作為自變量進(jìn)行單因素分析 方法:Statistics Linear models and related Linear regression,選擇因變量和自變量2022-3-27464.2 Statistics:回歸分析 Regress price weight 以price作為因變量,weight作為自變量進(jìn)行單因素分析 方法:Statistics Linear models and related Linear regression,選擇因變量和自變量2022-3-27475. Edit

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論