版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
SAS時(shí)序分析應(yīng)用一、SAS簡(jiǎn)介SAS系統(tǒng)(StatisticalAnalysisSystem)由美國(guó)北卡羅來(lái)納州立大學(xué)(NorthCarolinaStateUniversity)1966年開(kāi)發(fā)(1972年第1版,最新版本9.x),該軟件經(jīng)過(guò)不斷地完善和發(fā)展,已在各個(gè)領(lǐng)域得到了廣泛的應(yīng)用(如:金融、醫(yī)藥、生產(chǎn)、運(yùn)輸、通信等領(lǐng)域),現(xiàn)在已成為國(guó)際上標(biāo)準(zhǔn)的統(tǒng)計(jì)軟件之一。SAS系統(tǒng)是一個(gè)集大型數(shù)據(jù)管庫(kù)理、統(tǒng)計(jì)分析、報(bào)表圖形、信息系統(tǒng)開(kāi)發(fā)等多種強(qiáng)大功能為一體的大型軟件系統(tǒng)。其中,專門針對(duì)計(jì)量經(jīng)濟(jì)和時(shí)間序列分析的模塊是SAS/ETS(Econometrics&TimeSeries),SAS/ETS模塊提供了時(shí)間序列分析、時(shí)間序列預(yù)報(bào)等功能。
SAS(系統(tǒng)數(shù)據(jù)驅(qū)動(dòng)的系統(tǒng)——數(shù)據(jù)獲取、數(shù)據(jù)管理、數(shù)據(jù)分析、
數(shù)據(jù)展示)BaseSAS–系統(tǒng)核心–數(shù)據(jù)管理任務(wù)–用戶使用環(huán)境SAS/STAT–統(tǒng)計(jì)分析模塊SAS/ETS–時(shí)間序列分析模塊SAS/IML–交互式矩陣程序設(shè)計(jì)模塊SAS/Graph–繪圖模塊菜單欄工具欄程序窗口資源管理窗菜單欄File——文件選項(xiàng)。用于處理文件的打開(kāi)、關(guān)閉、保存、輸入及輸出等。Edit——編輯選項(xiàng)。用于文件的復(fù)制、剪切、清除、選擇、查找及替代等。View——視圖選項(xiàng)。用于切換不同的視窗。Tools——工具選項(xiàng)。主要是提供各種編輯工具,并可以進(jìn)行系統(tǒng)信息的更改與管理。Run——程序運(yùn)行選項(xiàng)。該選項(xiàng)只有在當(dāng)前窗口為編輯窗口時(shí)出現(xiàn)。Solutions——分析方案選項(xiàng)。它提供各種分析方法。Window——窗口選項(xiàng)。提供窗口控制的大小、排列方式及窗口間的切換。Help——幫助選項(xiàng)。工具欄(從左至右)命令輸入及提交窗口、創(chuàng)建新文件、打開(kāi)舊文件、保存、打印、預(yù)覽、剪切、復(fù)制、粘貼、復(fù)原、目錄庫(kù)、資源管理器、提交程序給SAS執(zhí)行、刪除、中斷運(yùn)行及幫助等。窗口(從左至右)結(jié)果輸出窗口、運(yùn)行記錄窗口及程序編輯窗口程序執(zhí)行選中需要執(zhí)行的語(yǔ)句單擊工具條按鈕SASLog窗口:有關(guān)程序執(zhí)行的信息,包括警告、錯(cuò)誤消息SASOutput窗口:結(jié)果輸出
SAS程序的組成SAS程序的組成
SAS數(shù)據(jù)集:SAS存取數(shù)據(jù)的基本單位,邏輯上是一個(gè)二維數(shù)據(jù)表數(shù)據(jù)步(Datastep)–創(chuàng)建、修改、加工整理SAS數(shù)據(jù)集過(guò)程步(Procstep)–加工整理、分析、顯示
程序語(yǔ)句的界定
數(shù)據(jù)步–起始:DATA–中止:Run;下一個(gè)data、proc過(guò)程步–起始:Proc語(yǔ)句–中止:Run;Quit;下一個(gè)data、proc程序語(yǔ)法
開(kāi)始于一個(gè)SAS關(guān)鍵詞;結(jié)束于一個(gè)“;”自由格式–一個(gè)或幾個(gè)空格作為分隔–一句語(yǔ)句可以分為幾行–幾個(gè)語(yǔ)句可以放在一行–注意:不要把過(guò)多語(yǔ)句放到一行,不利于調(diào)試(不利于應(yīng)用log窗口中行數(shù)的指引)注釋–/*……;–/*………………..*/二、時(shí)間序列數(shù)據(jù)集的創(chuàng)建1、使用DATA步創(chuàng)建SAS數(shù)據(jù)集(臨時(shí)數(shù)據(jù)集)datajr09;inputtimemonyy7.price;formattimemonyy5.;cards;Jan2005101Feb200582Mar200566Apr200535May200531Jun20057;Run;proc
printdata=jr09;Run;①SAS系統(tǒng)命令語(yǔ)句不分大小寫,單詞之間至少空一格,每條命令以“;”結(jié)束。②“dataexample1_1”命令SAS建立一個(gè)臨時(shí)數(shù)據(jù)集。③“inputtimemonyy7.price;”
第一個(gè)變量名為“time”,“monyy7.”說(shuō)明變量是時(shí)間變量,且指定了數(shù)據(jù)的輸入格式為字符長(zhǎng)度為7的月份年度數(shù)據(jù)。
第二個(gè)變量名為“price”,對(duì)它沒(méi)有指定變量類型和數(shù)據(jù)輸入格式,系統(tǒng)會(huì)自動(dòng)將它視為數(shù)字型變量,并自動(dòng)讀取。④“formattimemonyy5.;”該句告訴系統(tǒng),“time”這個(gè)變量的的輸出格式是字符長(zhǎng)度為5的月份年度數(shù)據(jù),輸出格式為月份的三位縮寫字母+2位年份數(shù)據(jù)。⑤“cards”告訴SAS系統(tǒng),下面開(kāi)始錄入數(shù)據(jù)行。第一列數(shù)據(jù)會(huì)自動(dòng)賦給“time”,第一列數(shù)據(jù)會(huì)自動(dòng)賦給“price”。如果命令為:“inputtimemonyy7.price@@;”,數(shù)據(jù)將以如下方式讀?。旱谝粋€(gè)數(shù)據(jù)賦值給變量“time”,第二個(gè)數(shù)據(jù)賦值給變量“price”,第三個(gè)數(shù)據(jù)賦值給變量“time”,第四個(gè)數(shù)據(jù)賦值給變量“price”,……數(shù)據(jù)輸入完后,另起一行輸入命令結(jié)束符號(hào)“;”注意:Cards=datalines⑥“Run;”表示程序?qū)懞每梢赃\(yùn)行。
查看數(shù)據(jù)“proc
printdata=jr09;”創(chuàng)建永久數(shù)據(jù)集所謂永久數(shù)據(jù)集就是指在sas中建立的數(shù)據(jù)集不會(huì)因?yàn)橥顺鰏as而丟失,它會(huì)永久地保存在該數(shù)據(jù)中,以后進(jìn)入sas系統(tǒng)還可以從庫(kù)中調(diào)用該數(shù)據(jù)集。①用“datasasuser.jr09;”生成一個(gè)名字為sasuser.jr09的永久數(shù)據(jù)集。datasasuser.tj10;inputtimemonyy7.price;formattimemonyy5.;cards;Jan2005101Feb200582Mar200566Apr200535May200531Jun20057;proc
printdata=sasuser.tj10;run;②用libname命令建立永久數(shù)據(jù)集Libnametansas'D:\教學(xué)\時(shí)間序列';Datatansas.tan;即:創(chuàng)立一個(gè)名為tan的永久該數(shù)據(jù)集,并將其保存在目錄“D:\教學(xué)\時(shí)間序列”下。Libnametansas'D:\教學(xué)\時(shí)間序列';Datatansas.tan;inputtimemonyy7.price;formattimemonyy5.;cards;Jan2005101Feb200582Mar200566Apr200535May200531Jun20057;run;運(yùn)行以上程序后,單擊邏輯庫(kù)tansas會(huì)發(fā)現(xiàn)里面有tan;同時(shí)在在目錄“D:\教學(xué)\時(shí)間序列”下也會(huì)發(fā)現(xiàn)這個(gè)文件——tan.sas7bdat(SAS數(shù)據(jù)集在Windows系統(tǒng)中的擴(kuò)展名是sas7bdat)顯示數(shù)據(jù)集中的某一段數(shù)據(jù)①datasj;settansas.tan(firstobs=2obs=5);run;②dataairline1;setairline;if('31dec1950'd<=tandt<='31dec1960'd);run;procprintdata=airline1;run;③dataairline1;setairline;Ift>='31dec1950'd;run;procprintdata=airline1;run;比一比dataairline1;setairline;where>='31dec1950'd;run;procprintdata=airline1;run;2、直接導(dǎo)入外部數(shù)據(jù)①導(dǎo)入EXCEL數(shù)據(jù)file-----import-----microsoftexcel97or2000(*.xls)-----browse(指明要輸入文件的路徑)-----next-----finishproc
importout=work.jr09datafile="d:\jr.xls"dbms=excelreplace;sheet="sheet";getnames=yes;run;②導(dǎo)入csv格式數(shù)據(jù)直接讀取以逗號(hào)分隔的文件(.csv)Data數(shù)據(jù)集名;infile‘文件路徑'delimiter=','MISSOVERDSDfirstobs=2;informat變量名格式;input變量名;run;delimiter=‘,‘指定分隔號(hào)firstobs=2,從第二行開(kāi)始讀取Informat,指定輸入變量的格式Missover假設(shè)輸入變量為v1,v2,v3,v4,v5文件有一行數(shù)據(jù)12,12,34,23,如果沒(méi)有這個(gè)參數(shù),系統(tǒng)將跳到下一行用第一個(gè)數(shù)來(lái)填入變量v5如果有這個(gè)參數(shù),v5在這一行的數(shù)值為空dsd假設(shè)輸入變量為v1,v2,v3,v4,v5文件有一行數(shù)據(jù)12,,34,23,3如果沒(méi)有這個(gè)參數(shù),系統(tǒng)忽略兩個(gè)連續(xù)分隔號(hào)如果有這個(gè)參數(shù),系統(tǒng)將兩個(gè)連續(xù)分隔符號(hào)視為空值;libnametansas"D:\教學(xué)\時(shí)間序列";proc
importout=tansas.tan1 datafile="D:\教學(xué)\時(shí)間序列\(zhòng)rate.csv" dbms=csvreplace; getnames=yes; datarow=2;run;proc
printdata=tansas.tan1;run;導(dǎo)入txt格式數(shù)據(jù)dataab_b;Infile'E:\ab_b.txt'delimiter=','MISSOVERDSDfirstobs=2;Informattime$6.;Informatgdp8.;Inputtimegdp;run;dataenter;Infile'D:\教學(xué)\時(shí)間序列\(zhòng)tan1.sas7bdat'firstobs=2obs=708;Inputtimerate;run;proc
printdata=enter;run;對(duì)數(shù)據(jù)進(jìn)行描述procunivariatedata=tansas.tan1noprint;varrate;outputout=a1nmiss=nmissmean=meanstd=stdmin=minq1=q1median=medianq3=q3max=max;run;dataa1;retainnmissmeanstdminq1medianq3max;seta1;labelnmiss="缺失觀測(cè)"mean="均值"std="標(biāo)準(zhǔn)偏差"min="最小值"q1="下分位數(shù)"median="中位數(shù)"q3="上分位數(shù)"max="最大值";run;proc
univariatedata=tansas.tan1noprint;varrate;histogramrate/cbarline=bluecfill=lired;insetnnmissmeanstdminq1medianq3max/header='DescriptiveStatistics'position=nenoframe;run;proc
contentsdata=tansas.tan1out=a0noprint;run;二、時(shí)間序列數(shù)據(jù)集的處理1、間隔數(shù)據(jù)的處理對(duì)于等時(shí)間間隔數(shù)據(jù),SAS提供一種時(shí)間間隔函數(shù)INTNX,它可以根據(jù)需要自動(dòng)產(chǎn)生等時(shí)間間隔的時(shí)間數(shù)據(jù)。datajr091_1;inputprice;time=intnx('month','01jan2005'd,_n_-1);formattimemonyy.;cards;3.413.453.423.533.45;proc
printdata=jr091_1;run;“time=intnx('month','01jan2005'd,_n_-1);”該命令是指定用intnx函數(shù)給時(shí)間time賦值。intnx函數(shù)包括三個(gè)參數(shù):第一個(gè)參數(shù)指定等時(shí)間間隔,該參數(shù)可以為—day,week,quarter,year等,第二個(gè)參數(shù)指定參照時(shí)間,第三個(gè)參數(shù)(_n_k)是調(diào)整開(kāi)始觀測(cè)的指針。K為整數(shù),k取正值,指針由參照時(shí)間向未來(lái)(不包含參照時(shí)間)撥k期,k取負(fù)值,指針由參照時(shí)間向過(guò)去(包含參照時(shí)間)撥k期。2、序列變換datajr091_2;inputprice;lotprice=log(price);time=intnx('month','01jan2005'd,_n_-1);formattimemonyy.;cards;3.413.453.423.533.45;proc
printdata=jr091_2;run;反對(duì)數(shù)運(yùn)算datajr091_3;setjr091_2;y=exp(lotprice);run;3、子集data
jr091_4;setjr091_3;keeptimelogprice;wheretime>='01mar2005'd;proc
printdata=jr091_4;run;①建立“datajr091_4;”的臨時(shí)數(shù)據(jù)集,②“setjr091_3;”該句表明“jr091_4”是“09jr1_3”的子集,③“keeptimelogprice;”該命令說(shuō)明要保留的變量,④“wheretime>=‘01mar2005’d;”指“jr091_4”要從“jr091_3”獲取數(shù)據(jù)集的范圍。4、缺失值的插補(bǔ)datajr091_5;inputprice;time=intnx('month','01jan2005'd,_n_-1);formattimedate.;cards;3.413.45.3.533.45;proc
expanddata=jr091_5out=jr091_6;idtime;proc
printdata=jr091_5;proc
printdata=jr091_6;run;
5、連接數(shù)據(jù)集Datanewhires;?Setna1na2;?Run;Datanewfa;Setfa1fa2;Run;Datafa3;Setfa2;Renamejcode=jobcode;Run;Datanewfa;Setfa1fa3;Run;6、合并數(shù)據(jù)集將兩個(gè)數(shù)據(jù)集按照關(guān)鍵變量合并Merge/By語(yǔ)句–Merge/by要求數(shù)據(jù)集已經(jīng)排序Datadata=dataset3;Mergedataset1dataset2Byvariables;run;按照一個(gè)或多個(gè)變量排序缺?。荷騪rocsortdata=dataset1<out=dataset2>;by<descending>variables;run;排序Procsortdata=allgoals;Bymonth;run;Procsortdata=allsales;Bymonth;run;合并Dataallcompare;mergeia.allsalesia.allgoals;bymonth;run;Dataallcomparein;mergeia.allsales(in=a)ia.allgoals(in=b);bymonth;ifa=1andb=1;run;?提示:在merge之前必須將數(shù)據(jù)集按照關(guān)鍵變量排序;IN=variable–namesthenewvariablewhosevalueindicateswhetherthatinputdatasetcontributeddatatothecurrentobservation.WithintheDATAstep,thevalueofthevariableis1ifthedatasetcontributedtothecurrentobservation,and0otherwise.7、繪制時(shí)序圖在SAS系統(tǒng)中可以使用plot過(guò)程、gplot過(guò)程及timeplot過(guò)程繪制時(shí)序圖。procgplotdata=xf1;plotcon*t=1/haxis='01jan1952'dto'1jan94'dbyyear;symbol1c=blackv=stari=joinw=3;run;說(shuō)明:procgplotdata=xf1表示對(duì)數(shù)據(jù)集xf1繪圖;plotcon*t=1表示橫軸為t,縱軸為con,haxis(orvaxis)=‘01jan1952’dto‘1jan94’dbyyear表示兩個(gè)相鄰時(shí)間點(diǎn)間隔為year,01jan1952為坐標(biāo)起始值、1jan94為坐標(biāo)終值。幾個(gè)圖形畫在同一個(gè)坐標(biāo)圖中可在“/”加入overlay語(yǔ)句。Symbol1中的1應(yīng)和con
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 冀少版八年級(jí)生物上冊(cè)第四章微生物在生物圈中的作用課件
- 變量與函數(shù)教案
- 《輪軸的秘密》教學(xué)設(shè)計(jì)
- 《莫高窟》教案中涉及的網(wǎng)絡(luò)資源
- 港口碼頭施工合同樣本
- 醫(yī)療設(shè)備采購(gòu)招投標(biāo)管理臺(tái)賬
- 個(gè)性化軟件售后服務(wù)承諾書
- 水上娛樂(lè)設(shè)施防水維護(hù)合同
- 區(qū)塊鏈會(huì)所租賃合同模板
- 旅游景區(qū)設(shè)施增補(bǔ)協(xié)議
- 測(cè)風(fēng)方法步驟
- 主要建筑材料構(gòu)配件及設(shè)備試驗(yàn)檢驗(yàn)和功能性檢測(cè)計(jì)劃
- 2023年云南黃金礦業(yè)集團(tuán)股份有限公司招聘筆試題庫(kù)及答案解析
- 原發(fā)免疫性血小板減少癥課件
- 經(jīng)銷商文件-phadia250項(xiàng)目建議書-ver
- 2022版義務(wù)教育(數(shù)學(xué))課程標(biāo)準(zhǔn)(含2022年新增和修訂部分)
- 2022版義務(wù)教育(勞動(dòng))課程標(biāo)準(zhǔn)(含2022年修訂部分)
- 電動(dòng)葫蘆出廠檢驗(yàn)報(bào)告
- 找次品-華應(yīng)龍老師課件
- 全國(guó)英語(yǔ)教師素養(yǎng)大賽大賽一等獎(jiǎng)烏鴉喝水Unit-5-Story-Time課件
- 風(fēng)電工程項(xiàng)目質(zhì)量控制管理
評(píng)論
0/150
提交評(píng)論