為什麼我們要學(xué)SAS_第1頁
為什麼我們要學(xué)SAS_第2頁
為什麼我們要學(xué)SAS_第3頁
為什麼我們要學(xué)SAS_第4頁
為什麼我們要學(xué)SAS_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、SAS Introduction11/01/20071Outline為什麼我們要學(xué)SAS為什麼大家都用電腦軟體算統(tǒng)計為什麼我們要用SAS這個軟體我們要學(xué)什麼SAS基本介紹資料輸入介紹(Data Steps)資料操弄介紹(Procedure)2為什麼要用電腦軟體這是標(biāo)準(zhǔn)差的公式10個同學(xué)的成績,算標(biāo)準(zhǔn)差 (可以用計算機(jī))vs.1000個同學(xué)的成績,算標(biāo)準(zhǔn)差(一樣可以用計算機(jī),可是很累)3所以請想像一下這是一個ANOVA Table。計算一個ANOVA需要至少兩個值,這兩個值都各自需要計算一個Sum of squares。每個Sum of squares都需要計算一個平均值,以及每單個值和他的離差

2、。好不容易算出來再把得到兩個值相除,得到F值,再去查表。如果中途計算機(jī)不小心按錯了,可能得整個重來。統(tǒng)計軟體就是在這個時候變得很重要4為什麼要用SAS為什麼不用ExcelExcel不能作進(jìn)階的統(tǒng)計運算Excel不好操弄資料(但可參考Excel資料分析工具箱、VBA)其他可做統(tǒng)計的軟體SPSS, Stata, Statistica, MatlabR-Language (free software)5操弄資料S TreatA 3 3 3S TreatB 5 5 5S TreatA 1 3S TreatA 2 3S TreatA 3 3S TreatB 1 5S TreatB 2 5S TreatB

3、 3 5這種情形下,如果有一個程式語言能讓我們操弄資料,事情會簡單得多但這種事情又還不值得讓我們真的去寫C+。所以,SAS這種軟體就出線了6我們要學(xué)什麼以描述統(tǒng)計為例SAS基本介紹視窗介紹資料輸入介紹(data)資料操弄介紹(procedure)以指令為主,不會進(jìn)入到程式語言的部分7等一下會看到的統(tǒng)計名詞平均數(shù)、標(biāo)準(zhǔn)差、變異數(shù)中數(shù)、眾數(shù)、四分位數(shù)、四分位差偏態(tài)、峰度次數(shù)分配表8SAS 基本介紹你很可能會需要的SAS套件SAS Base基本的SAS指令,程序SAS/STAT一些進(jìn)階統(tǒng)計會用到的指令如變異數(shù)分析、線性模式、相關(guān)、迴歸etc.SAS/Graph畫圖,畫漂漂亮亮的圖9視窗介紹編輯區(qū)F5

4、記錄檔F6輸出結(jié)果F7Ctrl+E清除內(nèi)容10第一個SAS程式DATA First_SAS;INPUT Name $ age Message $;DATALINES;Peter 20 Hello;proc print;run;輸出結(jié)果Log檔案first_sas.sas11SAS 程式放大鏡SAS一定是對一筆資料做特定的動作,所以一定會有DATA部分,跟Proc的部分。SAS不是一個Case Sensitive的語言所以age和AGE是一樣的;PROC和proc是一樣的。SAS每一句結(jié)尾都要打分號SAS每一句結(jié)尾都要打分號12練習(xí)一請模仿上述的第一個SAS程式,自己試著操作一次。DATA Fi

5、rst_SAS; 宣告Data的名字INPUT Name $ age Message $; 描述變項的結(jié)構(gòu)、型態(tài)DATALINES; 資料列啟始的位置Peter 20 Hello 資料列(不用分號); 用分號結(jié)束資料proc print; 列印程序run; 執(zhí)行SAS指令,只是一種和SAS溝通的方式13資料輸入部分Data Steps14資料輸入DATA First_SAS;INPUT name $ age edu $;DATALINES;Peter 20 college;proc print;run;15資料輸入DATA First_SAS;INPUT name $ age edu $;DA

6、TALINES;Peter 23 graduateMary 21 collegeJohn 20 collegeGary 23 graduateLisa 21 collegeMaria 20 collegeJanet 22 college;proc print;run;DATA First_SAS;INPUT name $ age edu ;DATALINES;Peter 23 1Mary 21 2John 20 2Gary 23 1Lisa 21 2Maria 20 2Janet 22 2;proc print;run;16有教育程度的Data17格式化數(shù)值proc FORMAT;value

7、f_edu 1=Graduate 2=College;DATA First_SAS;INPUT name $ age edu ;FORMAT edu f_edu.;DATALINES;Peter 23 1Mary 21 2John 20 2Gary 23 1Lisa 21 2Maria 20 2Janet 22 2;proc print;run;18格式化變項proc FORMAT;value f_edu 1=Graduate 2=College;DATA First_SAS;INPUT name $ age edu ;FORMAT edu f_edu.;LABEL edu=Education

8、;DATALINES;Peter 23 1Mary 21 2John 20 2Gary 23 1Lisa 21 2Maria 20 2Janet 22 2;proc print label;run;first_format.sas19SAS 程式放大鏡Proc format事實上不是針對data做操弄,而是先建立一個樣版(informat.)。這個樣版會在稍後在Data部分中,用FORMAT指令,將特定變數(shù)連結(jié)到該樣版。所以proc format要寫在data部分之前由於FORMAT指令是連結(jié)變數(shù)和樣版,樣版最後要加一個 . ,以示區(qū)別LABEL指令不是用了就有效果,要在支援的proc下才會有

9、作用(如proc print label)20練習(xí)二請修改前一個程式,讓他多一個教育程度的變項(edu)請用數(shù)字coding教育程度,但是在輸出的報表中,要以文字顯示該變項數(shù)值。請在輸出的報表中,讓edu變項的名稱顯示成Education請為資料再多加一欄 身高(height) 資料21新增身高資料DATA First_SAS;INPUT name $ age edu height;FORMAT edu f_edu.;LABEL edu=Education;DATALINES;Peter 23 1 150Mary 21 2 156John 20 2 172Gary 23 1 175Lisa 2

10、1 2 159Maria 20 2 162Janet 22 2 166;22資料操弄部分Procedure23資料操弄介紹計算排序資料(proc rank)排列資料(proc sort)畫表格(proc tabular)次數(shù)分配表(proc freq)單一變項描述統(tǒng)計(proc univariate)畫圖 長條圖(橫、直)、圓餅圖24資料操弄介紹計算排序資料(proc rank)排列資料(proc sort)畫表格(proc tabular)次數(shù)分配表(proc freq)單一變項描述統(tǒng)計(proc univariate)畫圖 長條圖(橫、直)、圓餅圖25新增身高資料DATA First_SA

11、S;INPUT name $ age edu height;FORMAT edu f_edu.;LABEL edu=Education;DATALINES;Peter 23 1 150Mary 21 2 156John 20 2 172Gary 23 1 175Lisa 21 2 159Maria 20 2 162Janet 22 2 166;26計算排序資料(rank)proc FORMAT;value f_edu 1=Graduate 2=College;DATA First_SAS;INPUT name $ age edu height;FORMAT edu f_edu.;LABEL e

12、du=Education;DATALINES;(data goes here);proc rank;var height;ranks r_height;run;proc print label;run;27排列資料(sort)proc FORMAT;value f_edu 1=Graduate 2=College;DATA First_SAS;INPUT name $ age edu height;FORMAT edu f_edu.;LABEL edu=Education;DATALINES;(data goes here);proc rank;var height;ranks r_heigh

13、t;run;proc sort;by height;proc print label;run;first_sort.sas28SAS 程式放大鏡在proc裡面,有些指令是很常用的,比如說:proc sort的BY,在很多proc裡面如果要用到排序資料,也同樣是使用BY指令Proc rank的VAR,也是一個很通用的指令。在很多proc中,如果要指定處理的變項,幾乎都是用VAR指令。29練習(xí)三請將上一個練習(xí)的資料,加上身高(height)變項,然後請完成兩個動作:用proc rank計算出每個身高的等級用proc sort將每個人的身高排序完成後,將這筆資料新增一個性別的變項,變項名稱是sex,

14、用0當(dāng)女生、1當(dāng)男生30資料操弄介紹計算排序資料(proc rank)排列資料(proc sort)畫表格(proc tabular)次數(shù)分配表(proc freq)單一變項描述統(tǒng)計(proc univariate)畫圖 長條圖(橫、直)、圓餅圖31新增性別變項DATA First_SAS;INPUT name $ age edu height sex;FORMAT edu f_edu.;LABEL edu=Education;DATALINES;Peter 23 1 150 1Mary 21 2 156 0John 20 2 172 1Gary 23 1 175 1Lisa 21 2 159

15、 0Maria 20 2 162 0Janet 22 2 166 0;32畫次數(shù)分配表proc FORMAT;value f_edu 1=Graduate 2=College;DATA First_SAS;INPUT name $ age edu height;FORMAT edu f_edu.;LABEL edu=Education;DATALINES;(data goes here);proc freq;tables sex*edu;run;33畫表格proc FORMAT;value f_edu 1=Graduate 2=College;DATA First_SAS;INPUT name

16、 $ age edu height;FORMAT edu f_edu.;LABEL edu=Education;DATALINES;(data goes here);proc freq;tables sex*edu;run;proc tabulate;CLASS age sex;VAR height;TABLE age ,Sex*height*mean;run;First_tab.sas34SAS 程式放大鏡要用proc freq畫表格用的指令是TABLES,但proc tabulate是用TABLEProc freq至多也只能畫2X2的表格,但proc tabulate有相當(dāng)大的彈性在pro

17、c tabulate出現(xiàn)的兩個指令CLASS和VAR,都是非常常用的指令。就SAS的語彙而言,CLASS是定義類別變項,VAR是定義分析變項。35練習(xí)四請用剛剛的資料做出學(xué)歷的次數(shù)分配表請用proc freq做出學(xué)歷(Edu) x 性別(sex)的次數(shù)分配表36資料操弄介紹計算排序資料(proc rank)排列資料(proc sort)畫表格(proc tabular)次數(shù)分配表(proc freq)單一變項描述統(tǒng)計(proc univariate)畫圖 長條圖(橫、直)、圓餅圖37顯示描述性統(tǒng)計資料proc FORMAT;value f_edu 1=Graduate 2=College;DA

18、TA First_SAS;INPUT name $ age edu height;FORMAT edu f_edu.;LABEL edu=Education;DATALINES;(data goes here);proc univariate freq;VAR height;run;first_uni.sas38畫圖proc FORMAT;value f_edu 1=Graduate 2=College;DATA First_SAS;INPUT name $ age edu height;FORMAT edu f_edu.;LABEL edu=Education;DATALINES;(data goes here);proc gchart;vbar3d age /discrete ;hbar3d age /discrete ;pie3d age /discrete;run;quit;First_graph.sas39SAS 程式放大鏡Proc univariate是一個很強(qiáng)的程序,但他的主要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論