




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1SAS9.3使用入門陶育純2㈠SAS歷史
SAS(StatisticalAnalysisSystem)是當(dāng)今世界上最權(quán)威的統(tǒng)計(jì)分析系統(tǒng)之一。SAS系統(tǒng)于上世紀(jì)六十年代末由美國的NorthCarolina大學(xué)的一
個(gè)研究小組開發(fā)。1976年成立SAS研究所專門負(fù)責(zé)產(chǎn)品的研制、生產(chǎn)、銷售和培訓(xùn)。1985年首次推出PC版本,以后相繼推出升級版本,功能不
斷加強(qiáng),目前最新版本為SAS
V9.4。
一、SAS簡介3㈡SAS特點(diǎn)
SAS是一個(gè)模塊化、集成化的應(yīng)用軟件系統(tǒng),它可以實(shí)現(xiàn)對數(shù)據(jù)的完全控制和充分利用。主要完成以數(shù)據(jù)中心的四大任務(wù):
?數(shù)據(jù)訪問?數(shù)據(jù)管理?數(shù)據(jù)呈現(xiàn)?數(shù)據(jù)分析
SAS可由許多不同的模塊組成來完成不同的任務(wù)。對于最基本的、最常用的統(tǒng)計(jì)方法放在基本系統(tǒng)模塊(BASE)里,不管低版本還是高版本,此模塊都包含。常用的模塊有:SAS/BASE(基礎(chǔ))、SAS4
/STAT(統(tǒng)計(jì))、SAS/GRAPH(圖形)、SAS/ETS(預(yù)測)、SAS/IML(矩陣)、SAS/QC(質(zhì)量控制)等。
SAS的特點(diǎn):
①可靠性高
②
易用性好
③
通用性強(qiáng)
④
應(yīng)用范圍廣5SASads7㈢SAS的啟動(dòng)和操作界面OUTPUTLOGPROGAMEDITORCommand===>Command===>Command===>00001000020000300004Licensedtoxxxxxx早期DOS下的SAS6.04的操作界面8早期Windows98下的SAS6.12的操作界面10㈣SAS的基本使用方法
SAS主要通過編程完成統(tǒng)計(jì)分析任務(wù)。SASProgram數(shù)據(jù)步(DATAStep)過程步(PROCStep)
SAS程序通過數(shù)據(jù)步完成SAS數(shù)據(jù)集(DataSet)的建立工作,此步還可對數(shù)據(jù)進(jìn)行加工、整理和變換。通過過程步調(diào)用一個(gè)或多個(gè)SAS過程(procedure),其作用是對已建立的SAS數(shù)據(jù)集進(jìn)行分析和管理。11datatest2;inputxy@@;d=x-y;cards;3550 2450 2000 2400 3000 1800 3950320038003250 3750 2700 3450 2500 3050 1750;procmeansmeanstdstderrtprt;vard;run;
以下是一個(gè)SAS程序的樣例。EducatingthenewgenerationofdecisionmakersinChinaTheSchoolofEconomicsandManagement(SEM)isthelargestschooloftheTsinghuaUniversityofBeijing.With4,300studentsin2004,thebusinessschooleducates15percentofthetotalnumberofstudentsatTsinghuaacrossthemajordisciplinesinbusiness,includingmanagementscienceandengineering,financeandinternationaltrade,accounting,andmarketing.Themajorityoftheschool'snon-MBAundergraduatescontinuetheiracademiceducationandeventuallyobtaintheirPh.D.sormaster'sdegrees.SEMalsohasvariousresearchcentersthatcontributetotheDevelopmentofmanagementknowledgeforbusiness:theChinaCenterforFinancialResearch,theNationalCenterforEconomicResearchandtheWal-MartRetailResearchCenter,tonameafew.
customersuccessstories12
SAS主要通過三個(gè)基本窗口,即程序編輯窗口(PROGAMEDITOR,簡記PGM)、日志窗口(LOG)和輸出窗口(OUTPUT)進(jìn)行程序的輸入、編輯、運(yùn)行以及運(yùn)行過程信息和運(yùn)行結(jié)果的查看、存儲(chǔ)。
以下是前述SAS程序樣例的運(yùn)行過程信息和運(yùn)行結(jié)果。142.
WindowsSAS6.12&8.0實(shí)用統(tǒng)計(jì)分析教程
胡良平編軍事醫(yī)學(xué)科學(xué)院
20013.
分類數(shù)據(jù)的統(tǒng)計(jì)分析及SAS編程
劉勤編復(fù)旦大學(xué)出版社
20024.
醫(yī)用統(tǒng)計(jì)學(xué)中的SAS統(tǒng)計(jì)分析
賀佳編第二軍醫(yī)大學(xué)出版社
20025.
醫(yī)用統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)(第三版)
方積乾編上??茖W(xué)技術(shù)出版社
20066.
SAS8.2統(tǒng)計(jì)應(yīng)用教程薛富波編北京希望電子出版社
兵器工業(yè)出版社200415
二、SAS9.3使用入門㈠SAS編程基礎(chǔ)1.
觀測值(observation)
等同于數(shù)據(jù)庫中的記錄(record)。
觀測值的集合稱為數(shù)據(jù)集(dataset)。2.
變量(variable)
等同于數(shù)據(jù)庫中的字段(field)。
①命名:變量名可由1~32個(gè)字符組成,首字符必須為字母,其后可以是字母、數(shù)字、下劃線。★
②變量特性:
數(shù)值型和字符型
?字符型變量在變量名后用一“$”號來表示。例如name$17⑤
統(tǒng)計(jì)函數(shù):MEAN(x1,x2...)
、
STD(x1,x2...)
等。
⑥
概率函數(shù):POISSON(,n)
等。5.
操作符(operator)①算術(shù)操作符:
**
表示乘方。
②比較操作符:^=
或
NE
表示不等于。
③邏輯操作符:
&AND,|
OR,^
NOT。6.
SAS表達(dá)式(expression)㈡SAS建立數(shù)據(jù)集1.數(shù)據(jù)步基本語句①
DATA語句
格式:DATA[數(shù)據(jù)集名];;(分號)是SAS每個(gè)語句的結(jié)束符。[]表示此部分為可選項(xiàng)。18
作用:指明數(shù)據(jù)步的開始,給出所建數(shù)據(jù)集的名稱。
數(shù)據(jù)集名:[libref.]sas-filename
[庫標(biāo)記.]文件名
(一級名)(二級名)
每次SAS啟動(dòng)時(shí)都自動(dòng)指定兩個(gè)庫標(biāo)記(庫邏輯名):
SASUSER
永久庫
WORK
臨時(shí)庫
僅使用二級名的數(shù)據(jù)集,系統(tǒng)自動(dòng)以WORK作為一級名。②
INPUT語句
格式:DATA[數(shù)據(jù)集名];作用:描述輸入的數(shù)據(jù),給輸入值定義變量。19⑴列表方式★
格式:INPUTvariable[$]variable[$]…;
例:
inputname$ageheightweight;⑵格式方式
格式:INPUTvariableinformat…;informat(輸入格式):[$]informat-name[w].[d]其中
$
代表字符型變量
informat-name
輸入格式名
w
輸入數(shù)據(jù)域的寬度
?
必須的分隔符
d
小數(shù)部分的長度例:inputname$10.address$20.weight4.1;20
行保持符@@
適用于列表方式,作用為從一行讀入多個(gè)觀測值。
例:datat;inputxy@@;cards;3.162.94.85.78.246.58;procprint;run;
Q:如果沒有@@,數(shù)據(jù)集將會(huì)怎樣?212.
SAS內(nèi)建數(shù)據(jù)集格式
★格式:DATA[數(shù)據(jù)集名];
INPUT變量
…;
其它語句
;
CARDS;
數(shù)據(jù)行
;
3.
從外部數(shù)據(jù)文件中讀入數(shù)據(jù)★
外部數(shù)據(jù)文件指ASCII碼型(文本)文件。22格式:DATA[數(shù)據(jù)集名];
INFILE‘filename‘;
filename應(yīng)包含完整的路徑。
INPUT變量
…;
其它語句
;RUN;
例:
datat;infile‘d:\99yf\fit.dat‘;inputnum$name$sex$heightweight;procprint;run;
INFILE語句必須在INPUT語句之前執(zhí)行。245.
從外部數(shù)據(jù)庫文件中導(dǎo)入數(shù)據(jù)★
外部數(shù)據(jù)庫文件指由數(shù)據(jù)庫軟件(如Excel、Access、dBASE、SPSS等)生成的數(shù)據(jù)文件。方法:點(diǎn)擊“文件File”→“導(dǎo)入數(shù)據(jù)ImportData…”25選擇正確的數(shù)據(jù)源,Next
。27選擇SAS的庫,給數(shù)據(jù)集起名
。把此導(dǎo)入過程存成SAS程序
。PROCIMPORTOUT=WORK.TestMarkDATAFILE="D:\TYC\2007yf\sxt\testmark.xls"DBMS=EXCELREPLACE;RANGE="TYC";GETNAMES=YES;MIXED=NO;SCANTEXT=YES;USEDATE=YES;SCANTIME=YES;RUN;28㈢SAS分析過程1.過程步基本語句①
PROC語句
格式:PROC[數(shù)據(jù)集名];作用:指定調(diào)用的過程及該過程的若干選擇項(xiàng)。例:
procprintlabeldata=a;
(run;)
②
BY語句
格式:BY
[descending]variables[notsorted];作用:以指定的變量值來分組處理某數(shù)據(jù)集。
BY語句總是與SORT過程一起使用。29③
CLASS語句
格式:CLASS
variables
;作用:定義分類變量。
CLASS語句不要求數(shù)據(jù)集事先排序。
④
VAR語句
格式:VARvariables;作用:用于定義分析變量。⑤
WEIGHT語句
格式:WEIGHT
variables
;作用:規(guī)定一個(gè)數(shù)值變量,以其值作為觀測值的權(quán)重。30⑥
FREQ語句
格式:FREQ
variables
;作用:規(guī)定一個(gè)數(shù)值變量,其值表示觀測值出現(xiàn)的頻數(shù)。⑦
ID語句
格式:IDvariables;作用:用于規(guī)定一個(gè)或幾個(gè)變量,以便在輸出或由該過程生成的數(shù)據(jù)集中,不再使用OBS,而用這些變量值來識(shí)別觀測值。⑧
OUTPUT語句
格式:OUTPUT
OUT=數(shù)據(jù)集名[統(tǒng)計(jì)關(guān)鍵字=variable]
;作用:將過程結(jié)果輸出到一個(gè)新的SAS數(shù)據(jù)集中,以便作為下步處理的輸入。31
例:
libnameyf‘c:\99yf\‘;
procmeansdata=yf.studentsnmeansum;varhw;outputout=yyymean=mhmwstd=sh;procprintdata=yyy;
(run;)
輸出結(jié)果見下圖:
OUTPUTN
ObsVariableNSUMMean
10H1016.65000001.6650000W10596.200000059.6200000MEANS過程的輸出
OBS_TYPE__FREQ_MHMWSH
10101.66559.620.096753YYY數(shù)據(jù)集的內(nèi)容OUTPUT322.SAS服務(wù)過程語句PRINT過程格式:PROCPRINT[options];VARvariables;IDvariables;BYvariables;SUMvariables;
其中options可有如下選項(xiàng):DATA=數(shù)據(jù)集名指出過程待處理的數(shù)據(jù)集LABEL用變量標(biāo)記代替變量名輸出SUM語句指出將要被求總和的變量33
FORMAT過程格式:PROCFORMAT[options];VALUE[$]format-namerange1=‘label’...
;其中options有如下選項(xiàng):LIBRARY=libref為永久的格式指定庫,libref為庫邏輯名。VALUE語句定義一種輸出格式。range可用LOW、HIGH、OTHER關(guān)鍵字。Example!34例:
procformat;valuehfmtlow-<1.69=‘L‘1.69-<1.75=‘M‘other=‘H‘;libnameap‘d:\tyc\sas‘;datalmh;setap.students;ifsex=‘M‘;formathhfmt.;
procprintdata=ap.studentslabel;run;procprintdata=lmhlabel;run;引用由FORMAT過程定義的格式時(shí),一定要在格式名后加句點(diǎn)(?)。35輸出結(jié)果見下圖:363.SAS描述性統(tǒng)計(jì)過程語句
UNIVARIATE過程★格式:PROCUNIVARIATE
[options];
VAR
variables;
BY
variables;
FREQ
variable
;
WEIGHT
variable
;
ID
variables;
OUTPUTOUT=數(shù)據(jù)集名statistic=variable;
其中options可有如下選項(xiàng):37PLOT
給出莖葉圖、盒狀圖及正態(tài)概率圖
NORMAL
給出正態(tài)性檢驗(yàn)結(jié)果其中OUTPUT語句中常用統(tǒng)計(jì)量的SAS標(biāo)準(zhǔn)關(guān)鍵字有:
MEDIAN
中位數(shù)
P1(P5,
P10,P90,P95,P99)
第1(n)百分位數(shù)
NORMAL
正態(tài)性檢驗(yàn)統(tǒng)計(jì)量
PCTLPTS=百分位數(shù)值
指定所需求的百分位數(shù)值
PCTLNAME=百分位數(shù)名
指定所需求的百分位數(shù)名
PCTLPRE=
變量前綴
為包含新百分位數(shù)的輸出變量名指定前綴,建立新
百分位數(shù)時(shí)此選擇項(xiàng)必須
指定。Parameterstoomany!38例:已知患者血液中磷和葡萄糖的含量,數(shù)據(jù)存放在
blood中,試對血磷觀測值進(jìn)行統(tǒng)計(jì)描述。libnametyc'd:\tyc';datat4;settyc.blood;procunivariatedata=tyc.bloodnormalplot;varphosphrs;run;輸出結(jié)果見下頁。3940有中文就是好!41
MEANS過程
FREQ過程4.SAS假設(shè)檢驗(yàn)過程語句
TTEST過程★格式:PROCTTEST[options];
CLASS
variable;
VAR
variables;
BY
variables;
其中CLASS是必選語句,用來指定分組變量,分組變量必須只取兩個(gè)水平的值。42例:某克山病區(qū)測得11例急性克山病患者和13例健康人的血磷值(mg%)如下表。問該地例急性克山病患者和健康人的血磷值是否不同?datat5;doa=1to2;inputn;dob=1ton;inputx@@;output;end;end;dropb;cards;112.603.243.733.734.324.7
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年金川集團(tuán)廣西金川有色金屬有限公司技能操作人員社會(huì)招聘筆試參考題庫附帶答案詳解
- 2024年甘肅定西臨洮中國人民保險(xiǎn)外包項(xiàng)目人員招聘筆試參考題庫附帶答案詳解
- 第二單元 探索1 物聯(lián)網(wǎng)的傳感技術(shù) 教學(xué)設(shè)計(jì) 2024-2025學(xué)年 蘇科版(2023)初中信息科技 八年級上冊
- 第四章 第四節(jié) 繁榮地方特色文化(新教學(xué)設(shè)計(jì))2023-2024學(xué)年八年級上冊地理(商務(wù)星球版)
- 第四單元第13課五、建立超鏈接 教學(xué)設(shè)計(jì) 2024-2025學(xué)年人教版初中信息技術(shù)七年級上冊
- 河北省保定市高陽縣2023-2024學(xué)年七年級下學(xué)期期末語文試題(解析版)
- 2024年度云南省大數(shù)據(jù)有限公司第二批公開招聘筆試參考題庫附帶答案詳解
- 2024年山東省環(huán)保發(fā)展集團(tuán)投資有限公司總經(jīng)理副總經(jīng)理招聘2人筆試參考題庫附帶答案詳解
- 第 2 單元 第 3 章第 1 節(jié) 細(xì)胞的基本結(jié)構(gòu)和功能2023-2024學(xué)年七年級上冊生物同步教學(xué)設(shè)計(jì)(北師大版)
- 第一章 勾股定理 1.1.1 探索勾股定理教學(xué)設(shè)計(jì)2024-2025學(xué)年北師大版數(shù)學(xué)八年級上學(xué)期
- 【開題報(bào)告】中小學(xué)校鑄牢中華民族共同體意識(shí)教育研究
- 2022+ADA/EASD共識(shí)報(bào)告:2型糖尿病高血糖的管理
- 2024-2025學(xué)年云南省大理州七年級(上)期末英語試卷(含答案)
- 中國遠(yuǎn)洋海運(yùn)集團(tuán)招聘筆試沖刺題2025
- 2025年部編版道德與法治五年級下冊全冊教案(含教學(xué)計(jì)劃)
- 2024建筑施工安全生產(chǎn)隱患識(shí)別圖合集
- 2025中國水利水電第十二工程局限公司招聘400人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年吉安職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫附答案
- 2024阿里巴巴云計(jì)算云主機(jī)租賃及運(yùn)維服務(wù)合同2篇
- 高技能人才培訓(xùn)基地 建設(shè)項(xiàng)目實(shí)施方案
- 消毒供應(yīng)中心禮儀培訓(xùn)
評論
0/150
提交評論