SAS培訓班講義Word版與版內(nèi)容相同方便打印使用_第1頁
SAS培訓班講義Word版與版內(nèi)容相同方便打印使用_第2頁
SAS培訓班講義Word版與版內(nèi)容相同方便打印使用_第3頁
SAS培訓班講義Word版與版內(nèi)容相同方便打印使用_第4頁
SAS培訓班講義Word版與版內(nèi)容相同方便打印使用_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 Made by Daibingchuan and lihui 課程名稱: 數(shù)據(jù)處理數(shù)據(jù)類型a. 橫截面數(shù)據(jù)集(cross-sectional data set):即給定時點對個人、家庭、企業(yè)、國家或一系列其他單位采集的樣本所構成的數(shù)據(jù)集(應該忽略細小的時間差別)名詞術語1、數(shù)據(jù)集:數(shù)據(jù)的集合,由樣本(行)和變量(列)組成b.時間序列數(shù)據(jù)集(time series data set):是由一個或幾個變量在不同時間的觀測值所構成的。c.混合橫截面數(shù)據(jù)集(pooled cross section data set):有些數(shù)據(jù)既有橫截面數(shù)據(jù)的特點又有時間序列的特點,但每一時點的樣本不同。d.綜列數(shù)據(jù)

2、集(panel data set):由橫截面數(shù)據(jù)集中每個樣本的一個時間序列組成。(定點長期調(diào)查)其他專門數(shù)據(jù)類型: 1、離散數(shù)據(jù)(discrete data):通常在考察個人、家庭或企業(yè)的決策行為時,通過問卷調(diào)查獲得,由此發(fā)展出“離散選擇模型”2、持續(xù)數(shù)據(jù)(survival data):用于考察變量從開始到結束或調(diào)查終止前所經(jīng)過的時間長度,如失業(yè)持續(xù)時間、罷工持續(xù)時間、甚至懷孕間隔3、cohort(一代人) data - 為持續(xù)收集特定社會群體在一段時間內(nèi)的變化的數(shù)據(jù)。如:調(diào)查七十年代出生的樣本在10年間的汽車持有率數(shù)據(jù)或就業(yè)率數(shù)據(jù)等。SAS運行環(huán)境的界面菜單欄: 文件 編輯 工具解決方案:

3、各功能模塊窗口幫助SAS資源管理器我的電腦邏輯庫:類似我的電腦,不同的是,在sas系統(tǒng)里才存在的,關閉sas系統(tǒng)后,在本地機中不容易找到包括4個目錄:work(臨時文件夾)map, sasuser, sashelpSAS工作空間n可以通過“查看”調(diào)?。撼绦虼翱冢≒ROGRAM EDITOR)n運行記錄窗口(LOG)n輸出窗口(OUTPUT)SAS程序第一例nSAS/HelloWorld.sasnn注:以后程序文件省略后綴,直接簡記為文件名稱,如此例簡記為HelloWorld,需要說明文件類型時才標明后綴。Ctrl+e 清空除特殊字符外,大小寫不區(qū)分數(shù)據(jù)步Data a; 生成以a命名的數(shù)據(jù)集,這

4、里a是空的數(shù)據(jù)集File print; 將原本在日志窗口中輸出的內(nèi)容轉移至輸出窗口中輸出Put hello world; 將put后的內(nèi)容在日志窗口中呈現(xiàn)Run;Proc print; 將前面運行的結果在輸出窗口顯示Run;運行后,日志窗口中顯示執(zhí)行情況深藍 固有關鍵詞淺藍 普通關鍵詞Insight模塊在邏輯庫中新建一個文件夾“培訓”,放入培訓中需要的文件在“命令行”中輸入“insight”,啟動insight邏輯庫及其所含的數(shù)據(jù)界面:菜單 文件 編輯:可以設置 分析:圖形、分析 灰色不可操作的菜單左上角的小三角 移動查找新建觀測(樣本)新建變量抽取樣本左邊的小方框,作圖時用于表示這樣的樣本填

5、充數(shù)據(jù):選定需要填充的范圍,鼠標右鍵,“填充值”對話框:值:1增加值:1表示從1開始,增量為1默認變量名和變量類型,類型可以改變抽取樣本選定2個變量,右鍵“抽取”,對這兩個樣本進行更加詳細的分析編輯-窗口-工具,出現(xiàn)調(diào)色板,標記色彩對事先選定的樣本標記,方便對數(shù)據(jù)作直觀的研究事先未選定樣本,創(chuàng)建標記色彩的規(guī)則:每個樣本的每一個變量,符合某種條件時將該樣本標記為某種顏色。查看一個數(shù)據(jù)集的概況:右鍵、屬性“標簽”對數(shù)據(jù)集添加密碼等打開“分析”中的分布、擬合、多元等的窗口后,原先灰色不可選的菜單菜可操作(TablesGraphsCurves等)“分析”菜單中也可作圖分布:輸出大多數(shù)常用的統(tǒng)計量擬合:

6、回歸分析多元:方差分析不同的分析方法,TablesGraphsCurves菜單里顯示的功能也是不同的SAS程序的書寫格式n1、SAS程序由語句組成,語句用分號結束。n2、SAS語句可以從某一行的任意位置開始; n3、幾個SAS語句可以寫在同一行上,但每句要使用分號n4、一個語句也可以寫成幾行,只要語句中的單詞不被斷開就可以。在一個語句中各個單詞之間至少要有一個空格。n5、SAS程序中一般不區(qū)分大小寫(字符串中要區(qū)分大小寫)n6、用/*注釋的內(nèi)容*/來對程序進行注釋,綠色顯示SAS程序的結構nSAS數(shù)據(jù)集樣本(觀測、記錄)、變量(字段、域)、表(數(shù)據(jù)集)、 數(shù)據(jù)庫(一個或多個表,有著某種特定的聯(lián)

7、系,來實現(xiàn)某種功能)n許多SAS語句都是以關鍵詞開始并用它識別語句的類型(如data、input、proc)n絕大部分的SAS語句都可分為兩步:DATA步(打開、編輯、整理數(shù)據(jù))和PROC步(分析、處理、顯示數(shù)據(jù))SAS的變量及格式變量屬性(名稱、類型、長度、輸入格式、輸出格式、標簽)類型:數(shù)字型、字符串型輸入格式:數(shù)據(jù)被SAS讀取的格式輸出格式:數(shù)據(jù)呈現(xiàn)給人們的格式SAS程序第二例nSAS/orange.sasdata oranges; input variety美元符,表示它前面的變量是字符型,否則就是數(shù)值型 $ flavor texture looks; total=flavor+tex

8、ture+looks用賦值的方式生成新的變量; label total="總數(shù)給變量加標簽" cardsCards后面是數(shù)據(jù)本身;navel 9 8 6不需要每行結束后都分號temple 7 7 7valencia 8 9 9mandarin 5 7 8;proc sort操作的名稱及對象數(shù)據(jù)集的名稱 data=oranges; by descending對某個變量降序排列 total; run;proc print data=oranges; var輸出的變量,沒有該語句默認輸出所有變量 _numeric_; /* var _character所有字符型變量,系統(tǒng)內(nèi)置變量

9、,有固定含義_;*/ title '對ORANGES數(shù)據(jù)集的品嘗結果加標題'run;輸入數(shù)據(jù)-形成數(shù)據(jù)集-排序-打印顯示SAS文件及命名n1、SAS數(shù)據(jù)集文件(后綴為sas7bdat)n2、SAS程序文件(后綴為sas)n3、SAS日志文件(后綴為log)n4、SAS輸出文件(后綴為list)n臨時數(shù)據(jù)集(放在work中,關閉系統(tǒng)會自動刪除)和永久數(shù)據(jù)集data sastrain.oranges;SAS文件的2級命名方式:目錄.文件名work目錄和其他目錄使用Libname語句創(chuàng)建永久數(shù)據(jù)集,libname 自建目錄名 目錄地址;libname例libname zhao 

10、9;d:sas新建目錄zhao,物理位置是d:sas''data zhao.aa永久數(shù)據(jù)集,二級命名方式; input a變量 ;cards; 1;run;建立SAS數(shù)據(jù)集的5種方法1.data己輸入數(shù)據(jù)建立。Orange例利用cards手工輸入數(shù)據(jù)2、data步利用set 語句建立。Set例data abc; set相當于復制命令 sasuser.business;run;proc print沒有“data=”默認為打印最近的數(shù)據(jù)集,即abc;run可以在work目錄中看到數(shù)據(jù)集abc,和sasuser中的數(shù)據(jù)集business是一致的;3、從外部調(diào)入。Infile例data

11、 abcd; infile 'D:SASdataxxxx.dat從外部導入(不是sas的邏輯庫)文件' input a b c;run;proc print;run;D:SASdataxxxx.dat用記事本打開,就是數(shù)據(jù)文本,沒有變量名和樣本序號4、利用“導入數(shù)據(jù)”功能建立。Id.xls例和其他格式文件的交互(1)有1個Excel文件,第一行為變量名。Sas系統(tǒng)在打開一個文件時對該文件獨占,所以導入操作前將這個excel文件關閉“文件”-“導入數(shù)據(jù)”-對話框,默認“標準數(shù)據(jù)源”,選擇合適的數(shù)據(jù)格式-“瀏覽”找到要導入的工作簿-選擇該工作簿的工作表-“option”的參數(shù)選擇-

12、是否“變量名在第一行”-選擇導入的excel數(shù)據(jù)保存在邏輯庫的哪個位置:選擇庫并給數(shù)據(jù)集命名-是否“存儲剛才的導入過程”,不需要就直接finish(2)文本文件,無變量名的純數(shù)據(jù)。選擇“用分隔符分割的文本文件”“瀏覽”后作一些設置:分隔符的類型(空格鍵、Tab或一些特定字符)、變量名是否在第一行5、利用EFI(external file interface外部文件接口)功能導入。Column.dat例tests.dat例comma.dat例(1)用記事本打開column.dat后,是這樣未經(jīng)分割的日期數(shù)據(jù):01MAR200502MAR200503MAR2005利用sas將日、月、年分開還是“文

13、件”-“導入數(shù)據(jù)”-不再選擇“標準數(shù)據(jù)源”,選擇“用戶定義的格式”即EFI-“瀏覽”-保存-finish-新的界面,對數(shù)據(jù)作自由導入-“options”選項-設置外部數(shù)據(jù)的形式:每一個樣本在一行或者每一條記錄為多個sas數(shù)據(jù)行導入數(shù)據(jù)的風格:列表型(list)選擇分隔符 自定義列(column)從第幾列到第幾列定義為一個變量變量生成方式:手工生成或自動生成變量默認類型:字符型或數(shù)值型從第幾個記錄開始缺失值是什么鼠標拖拽某幾列,下面begin、end、length已經(jīng)開始發(fā)生改變;命名“date”并add,于是新生成變量“date”,如法炮制產(chǎn)生變量“month”和“year”關閉菜單,提示是否

14、保存,保存為新的數(shù)據(jù)集(2)tests.dat如下:2458 Murray, W 72 185 128 12 38 D 2462 Almers, C 68 171 133 10 5 I 2501 Bonaventure, T 78 177 139 11 13 I 2523 Johnson, R 69 162 114 9 42 S 2539 LaMance, K 75 168 141 11 46 D 2544 Jones, M 79 187 136 12 26 N 2552 Reberson, P 69 158 139 15 41 D 2555 King, E 70 167 122 13 13

15、I 2563 Pitts, D 71 159 116 10 22 S 2568 Eberhardt, S 72 182 122 16 49 N 2571 Nunnelly, A 65 181 141 15 2 I 2572 Oberon, M 74 177 138 12 11 D 2574 Peterson, V 80 164 137 14 9 D 2575 Quigley, M 74 152 Q13 11 26 I 2578 Cameron, L 75 158 108 14 27 I 2579 Underwood, K 72 165 127 13 19 S 2584 Takahashi, Y

16、 76 163 135 16 7 D 2586 Derber, B 68 176 119 17 35 N 2588 Ivan, H 70 182 126 15 41 N 2589 Wilcox, E 78 189 138 14 57 I 2595 Warren, C 77 170 136 12 10 S 導入,進入EFI的界面,options:Column,manual,character確定先拖拽1-4列,命名為a選第二個變量的時候拖拽長一點,全部選進來,命名為b若list,可指定空格鍵為分隔符(3)comma.dat如下: 1,2,3,42.5,3.6,3,5 單純由逗號分割,共4列Lis

17、t:分隔符選擇逗號,去掉blank(按住ctrl點擊原來選擇的Blank)Automatic,不用拖拽導出數(shù)據(jù):“文件”-“導出數(shù)據(jù)”-選擇要到處的sas文件和要導出為何種格式,保存在地址,給導出的文件命名,是否保存導出過程Analyst模塊界面 文件:按sas名稱打開:在邏輯庫里打開一些sas文件 打開新查詢; 打開sas一些程序文件 打開現(xiàn)有的查詢 編輯:模式:瀏覽 編輯 查看 工具:樣本數(shù)據(jù)和其他的功能選項 數(shù)據(jù):對數(shù)據(jù)作操作,過濾、排序、隨機抽樣、變換 報表:生成一些報表 圖形:生成一些圖形 統(tǒng)計:較多功能數(shù)據(jù)視圖:正在分析的數(shù)據(jù)及其具體內(nèi)容 “文件”-“打開”-“fly”數(shù)據(jù)集,呈現(xiàn)

18、修改其中數(shù)據(jù),發(fā)現(xiàn)不能通過鍵盤改動(Browse瀏覽狀態(tài),保護作用),在“編輯”-“模式”中修改狀態(tài),顯示Edit編輯狀態(tài)“工具”-“樣本數(shù)據(jù)”,創(chuàng)建在“sasuser”,“全選”下面的數(shù)據(jù)集,即生成下面這些樣本數(shù)據(jù),供我們在學習sas時作為練習?!按蜷_”table(一個真實的問卷調(diào)查數(shù)據(jù),300個樣本,想實現(xiàn)抽樣) - “數(shù)據(jù)”“過濾”“取數(shù)據(jù)子集”-“age”,“operators”中的“GT”,拉到最下面“l(fā)ook distinct values”-在出現(xiàn)的所有age變量取值中選擇-ok,實現(xiàn)了過濾“數(shù)據(jù)”“隨機抽樣”-如:100個樣本 “數(shù)據(jù)”中的其它命令 對程序提取他的代碼:“圖形”

19、“散點圖” - 做完這個操作后,出現(xiàn)“code”,即菜單式的操作,如果用程序是如何實現(xiàn)的??梢赃M行代碼的學習,以后可以在這個程序上稍作修改得到相應的代碼。 假設檢驗“統(tǒng)計”“假設檢驗” 非常強大的統(tǒng)計功能 SAS運算符(operator例)n算術運算符:* / */*乘方*/n比較算符:=(EQ) =(NE) >(GT) <(LT) >=(GE) <=(LE) in/*變量的值在某一個范圍*/n邏輯算符:(AND) (!)(OR)()(Not)n其它:><(最小值) < >(最大值) |(?。?連接)例:if variety in ('n

20、avel','valencia') then total=total*10; if (flavor<texture & variety='mandarin') then total=total*100; a=flavor<>texture*2; b=variety|'.var加后綴' 字符的比較(operator_char例)n1、按機器使用的字符排列次序(ASC)從左到右被比較。在OFFICE-WORD中“插入”“符號”可以看到常用字符的ASC碼。n2、兩個不等長的字符串被比較時,系統(tǒng)在較短的字符串后自動添上空

21、格n3、在比較符后加冒號,則只比較首字母data; input (a b cA、b、c使用同一種變量類型,都是字符串型) ($); if a>b then result1='true ' else result1='false' result2='Fox'<>'Fox '/*result2變量的長度 由最長的字符串決定*/ result3='Fox'<>' Foxs' if a只比較a的首字符和S的大小>:'S' then result4=&quo

22、t;Great than S" cards; GRAY ADAMS G TOM TOMA T Sam Robe S sa SA g s | a b c ; run; proc print; run; 運算次序一n在括弧里的表達式先計算n第一級:* ()前綴,即表示正負>< < >n第二級:* /n第三級:n第四級:|n第五級:其余比較算符n第六級:第七級:運算次序二n對于相同優(yōu)先級的算符,左邊的運算先做。但有兩個例外:n1.對最高優(yōu)先級,右邊的運算先做,即乘方右邊先算n2.當兩個比較算符圍著一個量時,這個表達式看成是有一個and 出現(xiàn)一樣被計算。如:12age

23、< 20,等價于:12age & age<20 SAS函數(shù)一(部分)n數(shù)學函數(shù):abs()、max ()、min ()、mod (x, y)取余sign (x)、sqrt (x)、 sum ()、 mean ()、exp (x) 、log (x)、log10 (x)、log2(x) 、sin (x)、arsin (x)n截取函數(shù):ceil (x)比x較大的整數(shù)值floor (x)、int (x)round (x,n)對x保留n位四舍五入n字符函數(shù):index (S, S1)在s中查找s1substr (s , p, n)在s中從第p位開始截取n位字符scan(s2,n)在s

24、2中查找第n個字符upcase(s)將字符串s轉換為大寫compress(s,s1)在s中將s1壓縮掉nSAS系統(tǒng)存貯日期值為1960年1月1日到指定日期之間的天數(shù)nSAS存貯時間值為從午夜開始到指定時間的秒數(shù)n日期時間值存貯為1960年1月1日午夜到指定日期時間之間的秒數(shù)n日期時間函數(shù):weekday ( )返回周幾 day()返回幾號month()返回月份qtr()返回季度year()返回年份nYearcutoff 選項規(guī)定兩位數(shù)的年份含義n概率統(tǒng)計函數(shù):probnorm (x)、n (of X1-Xn)、nmiss ()、var (of x1-xn)、std (of x1-xn)n隨機數(shù)

25、函數(shù):rannor (seed)ranuni (seed)nFunctions例data bbb; input x1-x5 x6 $ date yymmdd15年月日共占15位的日期形式輸入date變量.; /*format date yymmdd10.;*/ format date weekdate12.; x7='o' x8='I am a student' /*以下是數(shù)學函數(shù)*/ a1=max(x1,x2); a2=sum(x1,x2); a3=sign(x3); a4=sqrt(x5); a5=mean(x1,x2); /*以下是截取函數(shù) */ b1=f

26、loor(a5); /*以下是字符函數(shù)*/ c1=index(x6,x7); c2=substr(x6,3,3); c3=scan(x8,2); c4=upcase(x8); c5=compress(x6,x7); /*以下是時間函數(shù)*/ d1=weekday(date星期幾的返回?); d2=year(date); d3=qtr(date); /*以下是概率函數(shù)*/ e1=probnorm(0); e2=n(of x1-x5); e3=nmiss(of x1-x5); e4=var(x1,x2); e5=std(x1,x2); /*以下是隨機函數(shù)*/ f1=ranuni(1); cards;

27、1 2 3 5 -6 amazon 2004/9/223 5 0 8 0 box 1960/1/29 10 -7 9 4 check 1960/1/17 6 . 1 8 delete 1959/12/31-2.5 -2.3 3 1 2 desk 2005/9/29 ;run;proc print;run;SAS/Insight模塊 1、界面介紹2、Fill values 功能3、Extract 功能4、Edit/windows/tool菜單使數(shù)據(jù)探索色彩繽紛(注意選項設置)5、打開分布的窗口之后主菜單Tables、Graphs、Curves菜單才被開放。Business, Air數(shù)據(jù)集示例n其

28、他功能:1、分布(輸出大多數(shù)常用的統(tǒng)計量)2、擬合(回歸分析)3、多元(方差分析)DATA步n文件操作語句n運行語句n控制語句n信息語句DATA步流程nDATA語句標志了數(shù)據(jù)步開始,并指定了數(shù)據(jù)步結束時要生成的數(shù)據(jù)集名字。n每次讀入一行數(shù)據(jù),讀入后執(zhí)行數(shù)據(jù)步中的其它語句,循環(huán)數(shù)據(jù)步讀取整個數(shù)據(jù)。n_N_變量表示DATA步已經(jīng)執(zhí)行的次數(shù)n_error_變量值為1時表示程序出錯nFlow例data flow; /*put x= y= z= _n_;*/ input x y; z=x+y; put x= y= z=; put _n_= _error_=; cards;10 20100 2001000

29、 2000;run;DATA步流程(Flow1例)n讀外部數(shù)據(jù)時,數(shù)據(jù)步迭代(即每一次)的開始把變量的值置為缺失值,有幾種情況例外:1、retain語句提到的變量2、sum語句中創(chuàng)建的變量3、數(shù)組_temporary_中的數(shù)據(jù)元4、file和infile語句選項中創(chuàng)建的變量5、自動變量n讀sas數(shù)據(jù)集時,只在第一次迭代時把變量值置為缺失,以后變量保留其值直至新值寫入nDATA語句的選項DROP選項(不列出某些變量)KEEP選項(列出某些變量)LABEL選項(給數(shù)據(jù)集加標簽)RENAME選項(重命名變量)nData例data new1(drop=z); set flow;run;data new

30、2(keep=x); set flow;run;data new3(label='the new3 dataset'); set flow;run;data new4(rename=(x=xx y=yy); set flow;run;proc print data=new1;run;proc print data=new2;run;DATA語句n數(shù)據(jù)集名字:(data2例)data _data_; set flow;run;data _null_; set flow; u=x+y+z; put u;run;/*data _last_; set flow;t=x+y;run;*/

31、proc print;run;1、data語句后無數(shù)據(jù)集名字,則自動生成 data1, data2等為數(shù)據(jù)集名字,相當于data _data_;2、data _null_;不產(chǎn)生實際的數(shù)據(jù)集,只是把內(nèi)容暫存于內(nèi)存,以供put語句等讀取結果,可以節(jié)約計算機資源3、data _last_;以最近產(chǎn)生的數(shù)據(jù)集命名并取代其內(nèi)容。Input語句n分組格式:input (g1-g5) (3*7.2 , 2*5.2); input (a b) ( $5.)input (a b) ($ , 5.)n無需分行而按變量連貫讀數(shù)據(jù)n固定該數(shù)據(jù)行;用于需要多個input語句同時讀取一行數(shù)據(jù)。input例data; i

32、nput x ; cards; 1 2 3 4 ; run; proc print; run;Input例data ; input type $ ; if type='c' then input course $ prof $; else if type='s' then input name $ id 3.2; cards; c math zxs s zhao 58888 ; proc print; run;n利用n +n #n 進行指針控制input1例data; input 1 x 5.2 6 y 2.1 +2 z #2 xx; cards;1234567

33、8912345234;proc print;run;n幾個特殊符號的用法(: & ): 讀值時第一次遇到分隔符、或是數(shù)據(jù)行末尾、或是讀滿列數(shù)而結束 字符型輸入值可以嵌有一個或幾個空格 字符型輸入值保留引號(與infile 語句中選項dsd一起使用才有效)nInput2例data topics9; infile datalines dsd; input speaker :$15. title $40. location & $10.; datalines; Whitfield,'Looking at Lift',Blue Room Puentes,"Li

34、fe After the Revolution",Red Room Townsend,"Peace in Our Times",Green Room ; proc print ; run;Cards語句nCards語句與datalines語句可以通用n如果輸入數(shù)據(jù)中含有分號,可用cards4語句或datalines4語句,同時,數(shù)據(jù)結尾用4個分號表示數(shù)據(jù)輸入結束nCards4例data; input number citation $50.; cards4;1 Berry2 LIN ET AL., 1995; BRADY, 19933 BERG, 1990; RO

35、A, 1994; WILLIAMS, 1992;run;proc print;run;Put 語句nPut語句負責在log窗口輸出一些結果,file print選項可把輸出轉移到output窗口nPut _infile_ (輸出最新的數(shù)據(jù)行到SAS log 窗口)nPut _all_ (輸出所有變量的值)nPut _page_ (輸出新頁)nPut例data; /*file print;*/ /* change the output window*/ put 1230*'SAS學習 ' run; proc print ; run;put1例data put; input x y

36、; z=x+y; put _infile_; /*put _all_;*/ put _n_=; cards;10 20100 2001000 2000;run;File 語句nFile print 把put語句產(chǎn)生的輸出結果轉移到output窗口nPut例data; /*file print;*/ /* change the output window*/ put 1230*'SAS學習' run; proc print ; run;By 語句n在DATA步中,SAS系統(tǒng)對每個BY組創(chuàng)建兩個臨時變量:First .variableLast .variable它們用來區(qū)別每個BY

37、組的第一個和最后一個觀測nBy例data by; input state $ city $ month x;cards;nc a 1 3.02nc a 2 2.1nc a 3 4.03nc b 1 5.03nc b 2 6.3nc b 3 7.3va c 1 8.1va c 2 8.2va c 3 9.3va d 1 10.8va d 2 11.1va d 3 31.2;run;data by1; set by;by state;file print;if x=8.1 then put _all_;run;/*data by2; set by; by state city month; fil

38、e print; if x=8.1 then put _all_;run;SAS的模塊Analyst模塊n具有其他菜單操作軟件的大部分數(shù)據(jù)處理功能n表的編輯模式(Browse | Edit)n瀏覽和存貯程序代碼功能(work.by數(shù)據(jù)的按組匯總)Set語句n使用set語句復制數(shù)據(jù)集nPoint選項指明要讀入的記錄序號set 數(shù)據(jù)集 point=指針變量;可用于抽樣,一般與output語句連用nNobs選項創(chuàng)建一個臨時變量用來存儲數(shù)據(jù)集的觀測總數(shù)n見set例data abc; set sasuser.business;run;proc print;run;point例data zxs; do n

39、=2 to total; set sasuser.flow point=n nobs=total; /*if _error_=1 then abort;*/ output; end; stop; run;PROC PRINT data=zxs;RUN;nSet語句可以串接多個數(shù)據(jù)集,形式如下nData 數(shù)據(jù)集; set 數(shù)據(jù)集A 數(shù)據(jù)集B ; <by 變量;>Run;nRename選項負責改名;in選項產(chǎn)生變量負責記錄觀測來自該數(shù)據(jù)集;n見set2例data a; input id ming $ sex $ ; cards; 1 MARY F 3 ANN F 4 TOM M ;da

40、ta b; input id name $ sex $ ; cards; 2 JOSE F 5 ERIE M 6 MAY F 1 MARY M; data result; set a(rename=(ming=name) b(in=inb); *by id; if inb=1 then bonus=100;run;proc print; title'串接數(shù)據(jù)集'run;串接數(shù)據(jù)的三種形式:1、相同變量的數(shù)據(jù)集連接2、不同變量的數(shù)據(jù)集連接3、按順序連接數(shù)據(jù)集,即連接數(shù)據(jù)集后,再按某變量的值進行排序,這種情況不允許排序變量有重復的值。Merge語句n使用Merge語句并接多個數(shù)據(jù)集,形式如下nData 數(shù)據(jù)集;merge 數(shù)據(jù)集1 數(shù)據(jù)集2 ;by 變量;run;n見merge例data person; input nam

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論