統(tǒng)計(jì)分析軟件教程(第版)(概述)_第1頁
統(tǒng)計(jì)分析軟件教程(第版)(概述)_第2頁
統(tǒng)計(jì)分析軟件教程(第版)(概述)_第3頁
統(tǒng)計(jì)分析軟件教程(第版)(概述)_第4頁
統(tǒng)計(jì)分析軟件教程(第版)(概述)_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

管理統(tǒng)計(jì)軟件應(yīng)用

<SAS篇>鄭州航院經(jīng)貿(mào)學(xué)院賀書平

zdhsp@163.com一、課程名稱:管理統(tǒng)計(jì)軟件應(yīng)用二、學(xué)時(shí)學(xué)分:40學(xué)時(shí)+20上機(jī),學(xué)分2.5三、先修課程:統(tǒng)計(jì)學(xué)四、使用教材:自編五、教學(xué)參考書 1.《SASforWindows實(shí)用基礎(chǔ)教程》洪楠、侯軍,北京:清華大學(xué)出版社,2003年。2.《統(tǒng)計(jì)分析系統(tǒng)SAS》何寧、吳黎兵,武漢:武漢大學(xué)出版社,2005年8月第一版。3.《SAS統(tǒng)計(jì)分析》沈其君,北京:高等教育出版社,2005年8月第一版。4.《統(tǒng)計(jì)分析方法——SAS實(shí)例精選》曲慶云等,北京:清華大學(xué)出版社,2004年第一版。IfyouhaveaSAScertification,Youwillneverloseyourjob.”美國(guó)SAS專業(yè)認(rèn)證和SPSS數(shù)據(jù)分析師認(rèn)證都擁有較高國(guó)際聲譽(yù)。關(guān)于sas的論壇/forum/http:///index.phphttp:///第一章42/5/2023教學(xué)目的與要求

1掌握SAS軟件的基本操作

2掌握SAS軟件的簡(jiǎn)單編程

3掌握基本統(tǒng)計(jì)分析過程

4熟練掌握SAS分析結(jié)果教學(xué)內(nèi)容第一章52/5/2023一系統(tǒng)概述四統(tǒng)計(jì)圖表制作六假設(shè)檢驗(yàn)七方差分析三描述統(tǒng)計(jì)分析二數(shù)據(jù)管理五相關(guān)回歸分析八多元統(tǒng)計(jì)分析第一章系統(tǒng)概述內(nèi)容與要求熟悉SAS系統(tǒng)的操作環(huán)境掌握SAS系統(tǒng)的功能特點(diǎn)掌握SAS系統(tǒng)的相關(guān)概念第一章72/5/2023第一章82/5/2023一SAS系統(tǒng)產(chǎn)生與發(fā)展二SAS系統(tǒng)的基本特點(diǎn)三SAS系統(tǒng)的基本結(jié)構(gòu)四SAS系統(tǒng)的基本概念五SAS系統(tǒng)基本程序語句目錄一

SAS系統(tǒng)產(chǎn)生與發(fā)展

SAS系統(tǒng):統(tǒng)計(jì)分析系統(tǒng)(StatisticalAnalysisSystem)1966年由美國(guó)NorthCarolina州立大學(xué)研發(fā),1976成立美國(guó)SAS軟件研究所,正式推出SAS系統(tǒng),較常用的版本為SAS8.2,最新版本SAS9X系列。是目前數(shù)據(jù)處理和統(tǒng)計(jì)分析領(lǐng)域的國(guó)際標(biāo)準(zhǔn)軟件,廣泛應(yīng)用于政府、科研、教育、生產(chǎn)和商業(yè)等領(lǐng)域。具有完備的數(shù)據(jù)訪問、管理、分析、呈現(xiàn)及應(yīng)用開發(fā)等功能。已經(jīng)成功應(yīng)用于120多個(gè)國(guó)家和地區(qū)的3萬多個(gè)機(jī)構(gòu)中。第一章92/5/2023二

SAS系統(tǒng)的特點(diǎn)

SAS系統(tǒng)提供了四十多個(gè)模塊,各個(gè)模塊之間既相互獨(dú)立又相互交融補(bǔ)充,SAS系統(tǒng)的功能覆蓋了信息處理和信息系統(tǒng)開發(fā)的各個(gè)環(huán)節(jié),用戶根據(jù)自身需要從其模塊結(jié)構(gòu)中靈活選擇、適當(dāng)組合相應(yīng)的功能模塊用于:數(shù)據(jù)輸入、數(shù)據(jù)檢索、數(shù)據(jù)管理、數(shù)據(jù)分析、圖形顯示、圖形分析、報(bào)表生成、統(tǒng)計(jì)計(jì)算、工程計(jì)算、質(zhì)量控制、市場(chǎng)研究、調(diào)查分析、建立預(yù)測(cè)模型、管理信息系統(tǒng)、行政信息系統(tǒng)等方面工作。第一章102/5/2023特點(diǎn)1使用靈活方便、功能齊全

SAS是為所有需要進(jìn)行數(shù)據(jù)處理、數(shù)據(jù)分析的非計(jì)算機(jī)專業(yè)人員提供的一種完整可靠的專業(yè)數(shù)據(jù)分析軟件。例如:回歸分析使用的SAS程序:

procregdata=A;

modely=x1-x10/selection=stepwise;

ploty*x1=‘$’/*繪制回歸線*/;

run;第一章112/5/20232編程能力強(qiáng)且簡(jiǎn)潔易學(xué)的非過程語言

SAS語言類似C語言,且綜合了各種高級(jí)語言的功能和靈活的格式,SAS語言的特點(diǎn)是用戶不需要告訴SAS“怎樣作”,而只需告訴SAS“作什么”。3數(shù)據(jù)處理與分析結(jié)合在一起

SAS程序的結(jié)構(gòu)由兩個(gè)基本步驟任意組合而成其中:DATA步用于數(shù)據(jù)的加工;

PROC

步用于分析數(shù)據(jù)和編寫報(bào)告2/5/2023第一章124適用性強(qiáng)、應(yīng)用面廣

SAS系統(tǒng)能提供多種界面以滿足從生產(chǎn)第一線到管理部門各方面人員對(duì)數(shù)據(jù)信息的需求,可以訪問各種數(shù)據(jù)資源,包括各種數(shù)據(jù)庫文件。5擴(kuò)展性能強(qiáng)

SAS系統(tǒng)的模塊式結(jié)構(gòu),可以讓用戶靈活的按自己的需要去選擇相應(yīng)的功能模塊,還可以利用SAS系統(tǒng)的功能擴(kuò)充工具擴(kuò)充系統(tǒng)功能或利用編程語言編寫特殊的應(yīng)用程序。第一章13三SAS系統(tǒng)的基本結(jié)構(gòu)SAS系統(tǒng)由四部分構(gòu)成:(1)SAS基礎(chǔ)(BaseSAS)

完成SAS系統(tǒng)的數(shù)據(jù)管理功能,BaseSAS是SAS系統(tǒng)的基礎(chǔ)應(yīng)用平臺(tái),既可以單獨(dú)使用,也可以與其它模塊組成一個(gè)用戶個(gè)性化的SAS系統(tǒng),其它模塊必須與之結(jié)合起來使用。第一章142/5/2023(2)SAS應(yīng)用分析模塊這部分是SAS系統(tǒng)的靈魂,也是SAS與其它軟件的本質(zhì)區(qū)別。屬于這一部分的主要模塊有:

SAS/ETS:用于經(jīng)濟(jì)預(yù)測(cè)和時(shí)間序列分析。

SAS/IML:用于進(jìn)行矩陣運(yùn)算,解決系統(tǒng)沒有現(xiàn)成方法的工具。

SAS/INSIGHT:可視化的數(shù)據(jù)探索工具,是進(jìn)行數(shù)據(jù)挖掘的有力工具。

SAS/OR:用于運(yùn)籌學(xué)和線性規(guī)劃。

SAS/QC:提供了根據(jù)產(chǎn)品觀測(cè)數(shù)據(jù)進(jìn)行產(chǎn)品質(zhì)量管理的各種分析工具。

SAS/STAT:各種主要統(tǒng)計(jì)分析方法。2/5/2023第一章15

(3)SAS開發(fā)及呈現(xiàn)工具

主要由SAS/AF、SAS/EIS與SAS/GRAPH模塊提供便捷的面向?qū)ο蟮拈_發(fā)工具,該工具支持客戶/服務(wù)器的應(yīng)用開發(fā)。2/5/2023第一章16

(4)數(shù)據(jù)倉庫設(shè)計(jì)屬于這一部分的主要模塊有:

SAS/ACCESSSAS/SHARESAS/CONNECTSAS/WA

這些開發(fā)工具使得用戶可以在SAS系統(tǒng)眾多產(chǎn)品的基礎(chǔ)上快速開發(fā)出功能強(qiáng)大的應(yīng)用系統(tǒng)。2/5/2023第一章17四SAS基本概念(一)SAS常量:

指一個(gè)數(shù)值、一個(gè)括在引號(hào)中的字符串或是表示某一固定值的特殊標(biāo)記。

SAS系統(tǒng)有5種類型的常量。包括:數(shù)值型常量字符型常量日期、時(shí)間、日期時(shí)間常量第一章182/5/20231、數(shù)值型常量:

指出現(xiàn)在SAS系統(tǒng)中的數(shù)字,其書寫方式有3種。①日常書寫方式;②科學(xué)計(jì)數(shù)法;③特殊標(biāo)記;

特殊的數(shù)值常量,用“●”表示缺失值。第一章192/5/20232、字符型常量

SAS的字符型常量是由1—32k個(gè)字符組成的字符串。一般情況下用單引號(hào)括起。

如果在一個(gè)表示字符型常量的字符串中含有單引號(hào)或特殊字符時(shí)要用雙引號(hào)括起來。

例如:“TheSASSYSTEM”SAS系統(tǒng)用空格表示字符型的缺失值。2/5/2023第一章203、日期、時(shí)間、日期時(shí)間常量

SAS系統(tǒng)中表示時(shí)間的字符串。

①將一個(gè)日期表示為一個(gè)常量:將日期加上單引號(hào),后面加上D或(d),如’01JAN96’d。

②將一個(gè)時(shí)間表示為一個(gè)常數(shù):將時(shí)間加上單引號(hào),后面加上T或(t)。如’20:35:30’t

③將一個(gè)日期時(shí)間表示為一個(gè)常數(shù):將日期時(shí)間加上單引號(hào),后面加上DT。如2010年3月23日17點(diǎn)45分可以表示為:’23MAR2010:17:45’DT

第一章212/5/2023

SAS系統(tǒng)通過輸入格式和輸出格式將日期值與其他較易閱讀的日期形式聯(lián)系起來。例如2007年2月14日可表示為:格式①

MMDDYYw.

021407(MMDDYY6.)02/14/07(MMDDYY8.)

格式②

DDMMYYw.

140207(DDMMYY6.)14/02/07(DDMMYY8.)

格式③DATEw.

14FEB07(DATE7.DDMMMYY)14FEB2007(DATE9.DDMMMYYYY)2/5/2023第一章22例1-1:DATAMYDATA;INPUTTIME@@;INFORMATTIMEMMDDYY6.;FORMATTIMEDATE9.;CARDS;010108021408030108050806091401061090;PROCPRINT;RUN;ObsTIME101JAN2007214FEB2007301MAR2007408MAY2006514SEP2001610JUN1990第一章232/5/2023(二)SAS變量:

1、變量命名:

SAS變量由1—8個(gè)字符成,以英文字母開頭,后面7個(gè)字符可以是英文字母、數(shù)字和下劃線但不能有空格和特殊字符。

例:NAMEAGEDA_123

2、變量類型:

SAS變量有3種類型:

字符型變量;數(shù)值型變量;日期、時(shí)間、日期時(shí)間型變量2/5/2023第一章243、變量的長(zhǎng)度:

指變量的每個(gè)值所占的字節(jié)數(shù),系統(tǒng)默認(rèn)的變量長(zhǎng)度為:

數(shù)值型變量-8個(gè)字節(jié)字符型變量-由第一次賦值的長(zhǎng)度決定4、特殊標(biāo)記:

數(shù)據(jù)錄入時(shí)在字符型變量后面加‘$’符號(hào)。5、變量標(biāo)記:

是由1—40個(gè)字符組成的字符串,該字符串是對(duì)變量的描述,在輸出結(jié)果時(shí)代替變量名,系統(tǒng)提供LABEL語句指定變量標(biāo)記,默認(rèn)值是空格。2/5/2023第一章25

6、輸入(Informat)與輸出(Format)格式

一般形式如下:

<$>informat-name<w.><d><$>format-name<w.><d>

其中:

$代表變量是字符型的

informat-name輸入格式名

format-name輸出格式名

w輸入或輸出的寬度

必須的分隔符

d小數(shù)部分的長(zhǎng)度2/5/2023第一章26

SAS系統(tǒng)提供的幾種常用輸入輸出格式:

w.d

標(biāo)準(zhǔn)的數(shù)字型格式

$w.標(biāo)準(zhǔn)的字符型格式

commaw.d

數(shù)字中加入逗號(hào)(如123,456.78)

datew.日期格式

bestw.SAS選擇最佳表示法第一章272/5/2023(三)觀測(cè):

同一對(duì)象的一組變量值構(gòu)成一個(gè)觀測(cè)。

例:某數(shù)據(jù)集中的數(shù)據(jù)

OBSX1X2X3Y1Y2Y3112333322464443369555

本數(shù)據(jù)集有六個(gè)變量,三個(gè)觀測(cè),觀測(cè)的數(shù)量決定樣本的大小。2/5/2023第一章28觀測(cè)編號(hào)變量名一個(gè)觀測(cè)(四)表達(dá)式與操作符

①SAS表達(dá)式:

指用各種操作符把SAS常量、變量、SAS函數(shù)連接起來的算式,是SAS的一組指令,提交運(yùn)行后產(chǎn)生運(yùn)算結(jié)果。

例:Y=a+b*x;z=SIN(X)+COS(Y);

②SAS操作符

(1)算術(shù)操作符:+-*/**(乘方)

如果算術(shù)運(yùn)算符連接的表達(dá)式中有一個(gè)運(yùn)算對(duì)象是缺失值,其運(yùn)算結(jié)果也是缺失值2/5/2023第一章29

(2)比較操作符:=(EQ)等于;^=(NE)不等于;

>(GT)大于;>=(GE)大于等于;<(LT)小于;

<=(LE)不大于如果算式中如果有一個(gè)運(yùn)算對(duì)象是缺失值,它比任何數(shù)都小。

(3)邏輯操作符:&(AND)與∣(OR)或^(NOT)非

(4)其他操作符:><(MIN)<>(MAX)‖(連接)

例1:如果A=3B=5

則A><B=3A<>B=52/5/2023第一章30

例2:如果A=‘1’B=‘AND’C=‘2’

D=A‖B‖C;則D=‘1AND2’

注意:連接運(yùn)算符不清理開頭或結(jié)尾的空格

(5)運(yùn)算次序

準(zhǔn)則1:括號(hào)里的先算

準(zhǔn)則2:同優(yōu)先級(jí)的左邊的先算

準(zhǔn)則3:較高優(yōu)先級(jí)的先算2/5/2023第一章31優(yōu)先級(jí)列表:第一級(jí):**(乘方)+(正號(hào))-(負(fù)號(hào))^(非)><(MIN)<>(MAX)第二級(jí):*(乘)/(除)第三級(jí):+(加)-(減)第四級(jí):‖(連接)第五級(jí):比較操作符第六級(jí):&(與)第七級(jí):∣(或)2/5/2023第一章32(五)SAS函數(shù)

SAS函數(shù)是一個(gè)子函數(shù),每個(gè)SAS函數(shù)都有一個(gè)關(guān)鍵詞,在應(yīng)用中只要調(diào)用其關(guān)鍵詞即可。

SAS函數(shù)分為十七種類型,178個(gè)。

包括:算術(shù)函數(shù)、數(shù)組函數(shù)、數(shù)學(xué)函數(shù)、三角和雙曲函數(shù)、概率函數(shù)、分位數(shù)函數(shù)、非中心函數(shù)樣本統(tǒng)計(jì)函數(shù)、隨機(jī)數(shù)函數(shù)、財(cái)政金融函數(shù)、數(shù)字函數(shù)逐位邏輯、操作函數(shù)、字符函數(shù)、日期和時(shí)間函數(shù)、特殊函數(shù)、(美國(guó))州和ZIP換算函數(shù)。2/5/2023第一章33

SAS函數(shù)的表達(dá)方式:

(1)函數(shù)關(guān)鍵詞(OF變量1-變量n)

例:SUM(OFXYZ);

(2)函數(shù)關(guān)鍵詞(變量1,…,變量n)

例:SUM(X,Y,Z);2/5/2023第一章34例1-2DATADA1;INPUTXYZ@@;A=(X+Y+Z)/3;B=SUM(X,Y,Z)/3;C=MEAN(X,Y,Z);CARDS;12345.789;PROCPRINT;RUN;TheSASSystem

ObsXYZABC1123222.0245..34.53789888.0第一章352/5/2023五SAS系統(tǒng)基本程序語句(一)SAS程序

SAS程序用來管理數(shù)據(jù)、選擇確定統(tǒng)計(jì)分析方法和過程,由SAS語句組成。

SAS語句

SAS語句是由SAS關(guān)鍵詞,SAS名字,特殊字符和運(yùn)算符組成的字符串,以分號(hào)(;)結(jié)尾,要求SAS系統(tǒng)執(zhí)行一種操作或給SAS系統(tǒng)提供信息。第一章362/5/2023②SAS程序

由一序列SAS語句組合成為SAS程序,完成指定的數(shù)據(jù)處理過程。

SAS程序的結(jié)構(gòu)包括:DATA步和PROC步

DATA步(數(shù)據(jù)步):要求創(chuàng)建新的SAS數(shù)據(jù)集,或?qū)σ延械臄?shù)據(jù)集進(jìn)行運(yùn)算操作。

PROC步(過程步):要求系統(tǒng)從過程庫中調(diào)出一個(gè)過程并執(zhí)行,以數(shù)據(jù)集作為工作對(duì)象。2/5/2023第一章37(二)數(shù)據(jù)步(DATA步)

①DATA步:是指用DATA語句開始的一組SAS語句。2/5/2023第一章38

以上語句組成DATA步,提交后系統(tǒng)創(chuàng)建一個(gè)名為da1的SAS數(shù)據(jù)集,包含4個(gè)變量,3個(gè)觀測(cè)。例1-3例1-3datada1;inputx1x2x3;y=x1+x2+x3;cards;21.30.552.40.982.64.5;run;第一章392/5/2023DATA步的作用檢索:把輸入數(shù)據(jù)轉(zhuǎn)化為SAS數(shù)據(jù)集。編輯:檢查數(shù)據(jù)中的錯(cuò)誤并修改,計(jì)算新變量。數(shù)據(jù)輸出:按照設(shè)計(jì)規(guī)格輸出報(bào)告。數(shù)據(jù)管理:對(duì)已存在的SAS數(shù)據(jù)集進(jìn)行復(fù)制、合并、更新、轉(zhuǎn)置、創(chuàng)建子集。2/5/2023第一章40DATA步語句及其類型:

用于DATA步的SAS語句有四類56個(gè)。①文件操作語句:進(jìn)行文件操作,用于輸入輸

出數(shù)據(jù)集。②運(yùn)行語句:在創(chuàng)建SAS數(shù)據(jù)集時(shí),用以創(chuàng)建

和修改變量,或創(chuàng)建子集。③控制語句:實(shí)現(xiàn)程序之間控制功能。④信息語句:給出數(shù)據(jù)集的各種信息,是非執(zhí)

行語句,可以出現(xiàn)在DATA步的任何位置,并具有同樣的功能。第一章412/5/2023

DATA步的一般形式:

DATASAS數(shù)據(jù)集名;

inputSAS變量名列表;

cards;

輸入數(shù)據(jù)

RUN;2/5/2023第一章42(三)PROC步(過程步)

PROC步是用PROC語句開始的一組或幾組SAS語句完成一個(gè)SAS過程,以另一個(gè)“PROC”、“DATA”或“

RUN”語句結(jié)束。

1.PROC語句的一般形式語句格式:PROC過程名<選擇項(xiàng)>;語句功能:指定PROC步調(diào)用的SAS程序,選擇項(xiàng)指明分析的數(shù)據(jù)集,分析結(jié)果的輸出要求,以及分析過程中需要用到的一些參數(shù)。2/5/2023第一章432.PROC步的常用選擇項(xiàng):

(1)“DATA=”指定該過程分析處理的SAS數(shù)據(jù)集,也稱為輸入數(shù)據(jù)集。

例:PROCMEANSDATA=DA1;RUN;(2)“OUT=”命名一個(gè)輸出數(shù)據(jù)集,存放分析處理的結(jié)果數(shù)據(jù)。例:PROC

SORT

DATA=DA1OUT=DA2;RUN;2/5/2023第一章443.

通用PROC語句

(1)VAR語句

語句格式:VAR變量表;

語句功能:定義分析變量。例:VARABC;

VARX1-X5;

(2)BY語句

語句格式:

BY變量表;

語句功能:定義分組變量,以指定變量的取值分組處理分析數(shù)據(jù)。2/5/2023第一章45

(3)CLASS語句

語句格式:CLASS分類變量表;

語句功能:定義分類變量,對(duì)分類變量的不同值分別進(jìn)行處理。兩者區(qū)別:

BY語句:分組變量一般是區(qū)間變量

CLASS語句:分類變量可以是名義變量2/5/2023第一章46

(4)FREQ與WEIGHT語句

FREQ語句(權(quán)數(shù)語句):

語句格式:FREQ變量名;

語句功能:指定數(shù)據(jù)集中重復(fù)數(shù)變量,每一觀測(cè)中此變量的值說明這個(gè)觀測(cè)實(shí)際代表多少個(gè)完全

相同的重復(fù)觀測(cè)。

WEIGHT語句(權(quán)重語句)

語句格式:WEIGHT變量名;

語句功能:指定數(shù)據(jù)集中代表觀測(cè)權(quán)重的變量。2/5/2023第一章47

“FREQ”與“WEIGHT”的區(qū)別:

WEIGHT語句代表觀測(cè)的比重,F(xiàn)REQ語句代表觀測(cè)的次數(shù)。

(5)LABEL語句

語句格式:LABEL變量名=‘變量標(biāo)記’;

語句功能:在輸出結(jié)果中用變量標(biāo)記代替變量名。第一章482/5/2023例1-2例1-4datada1;

inputAgeWeightHeightSex$@@;cards;1126140f1230145f1351153m1334152m;procprintlabel

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論