




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第第3章章 數(shù)據(jù)步創(chuàng)建數(shù)據(jù)步創(chuàng)建SAS數(shù)據(jù)集數(shù)據(jù)集 清華大學(xué)經(jīng)濟(jì)管理學(xué)院清華大學(xué)經(jīng)濟(jì)管理學(xué)院 朱世武朱世武本章內(nèi)容本章內(nèi)容 n SAS語言;n 數(shù)據(jù)步與過程步;n 數(shù)據(jù)集與變量;n SAS程序;n 程序執(zhí)行與輸出;n SAS表達(dá)式;n 數(shù)值與字符之間的轉(zhuǎn)換;n 錯(cuò)誤類型與處理;n SAS文件系統(tǒng);n 數(shù)據(jù)步創(chuàng)建SAS數(shù)據(jù)集 SAS語句語句 SAS語句由關(guān)鍵詞開始,分號結(jié)束。語句中間的SAS名,過程名和運(yùn)算符等為SAS系統(tǒng)提供信息或執(zhí)行操作。例3.1 有效的SAS語句。data data1;data _null_;put name $ 8.;format date yymmdd10.;proc
2、means data=fdata.class;infile d:fdataclass.txt;do I=1 to 100;X=Y+1;SUMX+X; run; SAS名與關(guān)鍵詞名與關(guān)鍵詞 關(guān)鍵詞 SAS語句一般以關(guān)鍵詞開始。賦值語句、累加語句和注釋和空語句沒有關(guān)鍵詞。 SAS名的類型 邏輯庫名; 數(shù)據(jù)集名; 變量名; 格式名; 過程名; 數(shù)組名; 語句標(biāo)號名; 特殊文件名; 其它名有關(guān)SAS名的規(guī)定 第一個(gè)字符必須是字母或下劃線_; 邏輯庫名的最大長度是8個(gè)字符,其它的SAS名的最大長度可達(dá)32個(gè)字符; SAS名中不能有空格和一些特殊字符($,# ); 系統(tǒng)保留了一些特殊的變量名,如_N_,_
3、ERROR_等。 SAS語句格式語句格式 KEYWORD parameteroptions;關(guān)鍵詞關(guān)鍵詞 參數(shù) 選項(xiàng);其中:n 粗體-必須按顯示形式書寫的關(guān)鍵詞;n 白正體-用戶提供的信息;n -括號內(nèi)的信息可選;n |-任選。 參數(shù)PARAMETER不是任選項(xiàng),不用括號,OPTIONS是選項(xiàng)關(guān)鍵詞。 數(shù)據(jù)步與過程步數(shù)據(jù)步與過程步 一組SAS語句組成一個(gè)SAS程序。SAS程序中的語句可分為兩類步驟:v 數(shù)據(jù)步;v 過程步。所有SAS程序均有數(shù)據(jù)步和過程步兩大模塊構(gòu)成。 數(shù)據(jù)步數(shù)據(jù)步 數(shù)據(jù)步編譯、創(chuàng)建和修改SAS數(shù)據(jù)集或文本文件、讀入源數(shù)據(jù)文件和SAS數(shù)據(jù)集。數(shù)據(jù)步以DATA語句開始。例3.2
4、數(shù)據(jù)步創(chuàng)建SAS數(shù)據(jù)集。data A;set fdata.a1a0001;keep date clpr;run;例中,由數(shù)據(jù)步產(chǎn)生數(shù)據(jù)集A, 數(shù)據(jù)來源于SAS數(shù)據(jù)集FDATA.A1A0001(上證指數(shù))的日期DATE和收盤價(jià)CLPR。 過程步過程步 過程步面向SAS數(shù)據(jù)集,完成對數(shù)據(jù)集的加工整理、分析和呈現(xiàn)等功能。過程步以PROC語句開始。例3.3 應(yīng)用統(tǒng)計(jì)量均值過程。proc means data=fdata.a1a0001;var clpr;output out=M mean=CLPR_M;run; 例中,過程步調(diào)用SAS的MEANS過程,對數(shù)據(jù)集FDATA.A1A0001(上證指數(shù))中的
5、收盤價(jià)CLPR求得均值CLPR_M,并將產(chǎn)生的結(jié)果存貯在數(shù)據(jù)集M中。 SAS數(shù)據(jù)集數(shù)據(jù)集 一個(gè)SAS數(shù)據(jù)集是一批數(shù)據(jù)值,如表3.1所顯示一批觀測值。DateOpprHiprloprclprVolsumsnamehstoce2001-1-108.688.78.458.499816983862277邯鄲鋼鐵6000012001-1-118.528.68.48.477574863988645邯鄲鋼鐵6000012001-1-158.478.478.088.123840231636545邯鄲鋼鐵6000012001-1-168.088.48.058.354557137683964邯鄲鋼鐵6000012
6、001-1-178.398.58.288.292634522076348邯鄲鋼鐵6000012001-1-188.328.48.218.261785414844434邯鄲鋼鐵600001第一行是變量,第二到最后一行都是變量的觀測數(shù)據(jù)。 SAS變量變量 變量類型 數(shù)值變量; 字符變量。數(shù)值變量的值只能是數(shù)值。SAS可以接受的數(shù)值范圍為正負(fù)10E-307至正負(fù)10E308 。字符變量的值可以是字符,字母,特殊字符和數(shù)值。字符變量名后跟一個(gè)美元號($)。字符值可以取l200個(gè)字符長。SAS變量的屬性變量的屬性SAS變量的屬性包括長度、輸人輸出格式和標(biāo)簽。v變量的長度是指存貯變量值的字節(jié)數(shù)。缺省長度為
7、8個(gè)字節(jié)。v 變量的輸人格式是指SAS系統(tǒng)讀人變量值的方式。v 變量的輸出格式是指SAS系統(tǒng)呈現(xiàn)變量值的方式。v 變量的標(biāo)簽是指變量名的描述性標(biāo)識,它至多可用40個(gè)字符。未設(shè)定屬性的變量在它們第一次出現(xiàn)時(shí)由系統(tǒng)給出。 自動(dòng)變量自動(dòng)變量 自動(dòng)變量說明自動(dòng)變量說明_N_觀測序號_Model_Error_錯(cuò)誤信息變量_Name_Numeric_所有數(shù)值變量_Prior_Character_所有字符變量_Rba_All_所有變量_Row_Cmd_Rrn_Col_Sigma_Fdbk_Titles_Iorc_Type_Label_Weigth_Lndet_First.Variable_Msg_Last.
8、VariableSAS程序舉例程序舉例 例3.4 一個(gè)DATA步構(gòu)成的SAS程序。 data A600001(label=邯鄲鋼鐵);input date yymmdd10. oppr hipr lopr clpr vol sums name $ hstocd $; format date yymmdd10. ; /*設(shè)定變量的輸出格式 */label Date=日期|Date; /*給變量加標(biāo)簽*/label Oppr=開盤價(jià)|Open Price;cards; /*以下是數(shù)據(jù)表*/2001-1-16 8.08 8.4 8.05 8.35 45571 37683964 邯鄲鋼鐵 600001
9、2001-1-17 8.39 8.5 8.28 8.29 26345 22076348 邯鄲鋼鐵 6000012001-1-18 8.32 8.4 8.21 8.26 17854 14844434 邯鄲鋼鐵 600001;例3.5 一個(gè)DATA步和三個(gè)PROC步構(gòu)成的SAS程序。data a; set fdata.a600001 (keep=date clpr); proc sort data= fdata.a600001 out=b;by descending clpr; proc print data=b (obs=10);proc gplot data= fdata.a600001;pl
10、ot clpr*date=1;symbol1 v=star i=none r=1 c=blue;run;例中,用過程步將數(shù)據(jù)集A600001按變量CLPR值接降序排序,然后顯示排序后的前10個(gè)觀測值,最后作出收盤價(jià)時(shí)序圖。 書寫規(guī)則書寫規(guī)則 SAS語句的書寫規(guī)則靈活自由: 語句可在行的任一列開始; 一個(gè)語句可以分寫為多行; 多個(gè)語句可以寫在同一行; 語句中各項(xiàng)之間至少用一個(gè)空格或特殊字符隔開;應(yīng)遵守的書寫規(guī)則:不同程序步間留空行; 每條語句都要另起行。注釋語句的兩種格式:v /* 注釋內(nèi)容 */ v * 注釋內(nèi)容;變量列表及其縮寫方法變量列表及其縮寫方法 許多SAS語句都需要規(guī)定變量,即按順序
11、列出變量名。變量列表不同形式的縮寫方法如右表所示。 變量列表縮寫說明X1 X2XnX1-Xn從X1到Xn的所有變量X-A從X到A的所有變量X Y Z AX_numeric_A從X到A的所有數(shù)值變量X_character_A從X到A的所有字符變量_numeric_所有數(shù)值變量_character_所有字符變量_all_所有變量例3.6 打印輸出所有數(shù)值變量的數(shù)據(jù)。proc print data=fdata.a1a0001 (obs=6);var _numeric_ ;例中,打印FDATA.A1A0001數(shù)據(jù)集中所有數(shù)值變量的前6個(gè)觀測數(shù)據(jù)。程序執(zhí)行程序執(zhí)行 按F3提交給SAS系統(tǒng)執(zhí)行PGM窗口編
12、輯好的SAS程序。程序執(zhí)行的過程中,LOG窗口顯示以下信息: 執(zhí)行的語句; 生成數(shù)據(jù)集中變量和觀測的個(gè)數(shù); 執(zhí)行程序花費(fèi)的時(shí)間; 出錯(cuò)信息。程序輸出程序輸出 例3.7 打印輸出數(shù)據(jù)集的觀測值。proc print data=fdata.a600001 (obs=10) noobs; /*輸出前10個(gè)觀測,不輸出觀測號*/var oppr hipr lopr clpr;title “股票行情”;run;例中,按F3提交程序后,在OUTPUT窗口打印輸出數(shù)據(jù)集FDATA.A600001中變量OPPR, HIPR, LOPR和 CLPR的前10個(gè)觀測值,不輸出觀測號。 例3.8 計(jì)算并輸出變量的均值
13、。proc means data=fdata.a600001 ; var oppr hipr lopr clpr; /*輸出變量oppr hipr lopr clpr的均值*/run;例3.9 計(jì)算并輸出變量間的相關(guān)系數(shù)。proc corr data=fdata.a600001; /*輸出變量oppr hipr lopr clpr之間的相關(guān)系數(shù)*/var oppr hipr lopr clpr ;run;SAS表達(dá)式表達(dá)式 表達(dá)式由一系列操作符和操作對象構(gòu)成,產(chǎn)生一個(gè)目標(biāo)值。例3.10 表達(dá)式里允許有空格。Y=X+10; Y= X + 10; 操作符包括: 算術(shù)算符; 比較算符; 邏輯算符;
14、SAS函數(shù); 括號。操作對象有: 變量; 常數(shù)。SAS常數(shù)常數(shù) SAS常數(shù)是SAS系統(tǒng)可以識別的一些固定值。SAS常數(shù)值可以是: 數(shù)字; 引號引起來的字符串; 其它特殊記號。SAS常數(shù)的五種類型: 數(shù)值常數(shù); 字符常數(shù); 日期時(shí)間數(shù)值常數(shù); 十六進(jìn)制數(shù)值常數(shù); 十六進(jìn)制字符常數(shù)。數(shù)值常數(shù)數(shù)值常數(shù) 一個(gè)數(shù)值常數(shù)就是出現(xiàn)在SAS語句里的數(shù)字。1, 5, 1.23, 1.2E23, 0.5E-10 , 2E4 , 2104 , 20000 字符常數(shù)字符常數(shù) 字符常數(shù)通常由單引號括起來的l到20個(gè)字符組成。如果字符常數(shù)內(nèi)含有引號,引用時(shí),要么它的引號用兩個(gè)連續(xù)的單引號,要么用一個(gè)雙引號引用。引用帶引號
15、的字符常數(shù): name=TOM”S; name=”TOMS”; 例中,兩語句等價(jià)。 日期時(shí)間常數(shù)日期時(shí)間常數(shù) 將日期時(shí)間值表示為常數(shù)時(shí),要使用相應(yīng)的格式值。格式值帶單引號,后面跟一個(gè) D(日期),T(時(shí)間)或DT(日期時(shí)間)。1jan2000d;01jan00d;9:25t;18jan00:9:27:25dtif begin=01JAN2000d then end=31DEC2000d;SAS算符算符 算術(shù)算符 算術(shù)算符表示執(zhí)行一種算術(shù)運(yùn)算。表達(dá)式中有一個(gè)運(yùn)算對象是缺失值時(shí),結(jié)果也是缺失值。 例3.14 算術(shù)算符應(yīng)用。 data; X=3.5*2.5; put X=; Y=9+1/3; put
16、 Y=; X=.; Y=1+X; put Y=; /*Y也是缺失值*/ 算符含義舉例*乘方A*2.5=A2.5*乘A*B*3/除X/A+加5+C-減C-A輸出結(jié)果:X=22.917651494Y=9.3333333333Y=.比較算符比較算符建立兩個(gè)量之間的一種關(guān)系。比較準(zhǔn)則:v 數(shù)值和字符都可以比;v 結(jié)果為真賦值1,假賦值0;v 字符值從左到右逐個(gè)按ASCII碼排列序列進(jìn)行比較;v 缺失值參加比較時(shí),它比任何有效值都小。算符等價(jià)形式含義舉例=Eq等于X=Y=Ne不等于X=YGt大于XYLt小于X=Ge大于等于X=Y=Le小于等于X=YIn等于列表中的一個(gè)NAME IN (WANG LI)例
17、3.15 比較算符應(yīng)用。 if xB取最大AB|連接Stock|Code例例3.16 連接多個(gè)變量和常數(shù)。data;set fdata.sh_m;result=Shanghai|date|_|clpr; put result;run;例例3.17 連接帶空格的字符值。data;X=GOOD ;Y=MORNING;Z=X|Y;put Z=;run;結(jié)果顯示為 Z=GOOD MORNING, 連接算符不清理開頭或結(jié)尾的空格。 運(yùn)算次序運(yùn)算次序 表達(dá)式運(yùn)算次序準(zhǔn)則: 先計(jì)算括弧里的表達(dá)式; 先執(zhí)行較高優(yōu)先級的運(yùn)算; 相同優(yōu)先級的算符,先執(zhí)行左邊的運(yùn)算。但對最高優(yōu)先級1,先執(zhí)行右邊的運(yùn)算。優(yōu)先級算符含
18、義優(yōu)先級算符含義*乘方4|連接+正小于-負(fù)最小=不等于最大=大于等于*乘不大于除不小于+加6與-減7或1235數(shù)值與字符之間的轉(zhuǎn)換數(shù)值與字符之間的轉(zhuǎn)換 數(shù)值與字符之間相互轉(zhuǎn)換的方式有: SAS系統(tǒng)自動(dòng)完成數(shù)值與字符之間的轉(zhuǎn)換; 函數(shù)INPUT將字符轉(zhuǎn)換為數(shù)值; 函數(shù)PUT將數(shù)值轉(zhuǎn)換為字符。字符字符自動(dòng)轉(zhuǎn)換自動(dòng)轉(zhuǎn)換轉(zhuǎn)換為數(shù)值轉(zhuǎn)換為數(shù)值 能自動(dòng)地將字符轉(zhuǎn)換為數(shù)值情況有: 將字符變量賦值給一個(gè)數(shù)值變量; 算術(shù)表達(dá)式中有字符變量; 比較運(yùn)算中與數(shù)值變量進(jìn)行比較; 需要數(shù)值變量的函數(shù)中引用字符變量。data;X=1; /*X為數(shù)值變量 */Y=10; /*Y為字符變量 */X=Y; /*自動(dòng)將字符變量Y轉(zhuǎn)換為數(shù)值變量 */ data;X=1; /*X為數(shù)值變量 */Y=10; /*Y為字符變量 */Z=X+Y; /*自動(dòng)將字符變量Y轉(zhuǎn)換為數(shù)值變量 */data;X=1; /*X為數(shù)值變量 */Y=10; /*Y為字符變量 */if X1999; run;例3.39 創(chuàng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度共有產(chǎn)權(quán)住房租賃合同
- 二零二五年度配音演員聘用合同
- 二零二五年度珠寶店安全保衛(wèi)人員聘用合同
- 二零二五年度影視聲音后期制作合同(封面設(shè)計(jì)新穎)
- 二零二五年度美發(fā)行業(yè)國際交流與合作協(xié)議
- 二零二五年度國際貿(mào)易知識產(chǎn)權(quán)傭金協(xié)議
- 二零二五年度分手補(bǔ)償協(xié)議書及子女教育費(fèi)用承擔(dān)
- 2025年度股份代持股份占比調(diào)整合同協(xié)議書模板
- 2025年度酒店餐飲服務(wù)兼職員工合同
- 二零二五年度隱名股東股權(quán)轉(zhuǎn)讓及管理權(quán)移交協(xié)議
- 2024年玩具陀螺項(xiàng)目可行性研究報(bào)告
- 城區(qū)綠地養(yǎng)護(hù)服務(wù)費(fèi)項(xiàng)目成本預(yù)算績效分析報(bào)告
- v建筑主墩雙壁鋼圍堰施工工藝資料
- 新部編人教版六年級道德與法治下冊全冊全套課件
- 我國互聯(lián)網(wǎng)公司資本結(jié)構(gòu)分析-以新浪公司為例
- 【藍(lán)天幼兒園小一班早期閱讀現(xiàn)狀的調(diào)查報(bào)告(含問卷)7800字(論文)】
- 糧油機(jī)械設(shè)備更新項(xiàng)目資金申請報(bào)告-超長期特別國債投資專項(xiàng)
- 個(gè)體戶的食品安全管理制度文本
- 部編版道德與法治七年級下冊每課教學(xué)反思
- 自考14237《手機(jī)媒體概論》備考試題庫(含答案)
- 第二次全國土地調(diào)查技術(shù)規(guī)程完整版
評論
0/150
提交評論