




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第八講:sas數(shù)據(jù)處理夏敏2016.10生成一個(gè)數(shù)據(jù)集,記錄發(fā)送失敗的和發(fā)送延遲的;包括ID、目標(biāo)郵箱、發(fā)送狀態(tài);結(jié)果按照id排序作業(yè)分析郵件的日志文件,要求:1、生成一個(gè)數(shù)據(jù)集,該數(shù)據(jù)集包括ID、目標(biāo)郵箱2、生成一個(gè)數(shù)據(jù)集,包括ID、發(fā)送狀態(tài)、反饋信息;3、生成一個(gè)數(shù)據(jù)集,包括ID、發(fā)送狀態(tài)、反饋信息(去掉顯示發(fā)送信息的行,并把狀態(tài)是success的,如果有ip地址則顯示ip地址,如果沒有IP地址則清空反饋信息)4、生成一個(gè)數(shù)據(jù)集,記錄發(fā)送失敗的,并且只提取最后一次記錄;包括ID、目標(biāo)郵箱、發(fā)送狀態(tài)、反饋信息5、生成一個(gè)數(shù)據(jù)集,記錄發(fā)送延遲的,并且只提取最后一次記錄;包括ID、目標(biāo)郵箱、發(fā)送狀態(tài)、反饋信息作業(yè)1、2input@'startingdelivery'id4.@'toremote'email:$50.;input@'delivery'id4.@':'status:$msg&$400.;MsgSuccess:Deferral:Failure:ifindex(status,":")>0thenstatus=substr(status,1,length(status)-1);//另一種思路:指針回跳一列,讀取字符,判斷是否是:作業(yè)3ifstatuseq“msg”thendelete;//結(jié)果中不會出現(xiàn)msg的行對于deferral和failure的行輸出完整的反饋信息對于success行ifstatuseq“success”andindex(msg,".")>0thenMsg=substr(msg,1,16);elsemsg="";//ip最大15位,最小9位;并且后面的字符是_accepted,所以先去16Msg=subsstr(msg,1,index(msg,”_")-1)或者使用find()函數(shù)直接匹配accepted這個(gè)字符串或者:ifindex(message,"did_1+0+0/")>0thenmsg="";作業(yè)4、5第一個(gè)和第三個(gè)數(shù)據(jù)集合并procsortdata=aa;byid;procsortdata=cc;byid;Datax_merge;mergeaacc;byemailid;作業(yè)4、5ifemail=“”thendelete;//把目標(biāo)郵箱地址為空的行刪除ifstatus=”success“thendelete;//把狀態(tài)為success的行刪除procsortdata=x_merge;//新數(shù)據(jù)集先按照郵箱地址進(jìn)行排序,當(dāng)郵箱地址相同時(shí)再按照id排序byemailid;作業(yè)4、5Datafailure;Setx_merge;//導(dǎo)入合并的數(shù)據(jù)集byemail;//按email進(jìn)行分組,然后取每組中的最后一條記錄,
iflast.emailandstatus”failure”thenoutput;//如果遇到email組最后一條記錄就輸出到last_email數(shù)據(jù)集run;
procprint;
optionslinesize=256;
run;數(shù)據(jù)分析-建模數(shù)據(jù)建模描述性統(tǒng)計(jì)量均值最大值、最小值計(jì)數(shù)求和方差、標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤變異系數(shù)極差校正平方和、非校正平方和偏斜度、峰度分位數(shù)函數(shù)卡方分布正太分布分位數(shù)F分布分位數(shù)T分布分位數(shù)。。。隨機(jī)數(shù)函數(shù)正太分布均勻分布二項(xiàng)分布柏松分布貝塔分布幾何分布極值分布指數(shù)分布Means過程Means過程是對觀測值進(jìn)行列的操作Sas統(tǒng)計(jì)描述中的函數(shù)是對行的操作Means過程Libnameaa“d:\temp”;Procmeansdata=aa.scoremaxdec=3;//缺省是2Vart1-t3;/要處理的變量Classclas;//按照clas進(jìn)行分組Byclas;Procmeansmaxdec=3;Byclas;vart1-t3;Run;//輸出結(jié)果:是缺省狀態(tài),包括計(jì)數(shù)、均值、標(biāo)準(zhǔn)差、最小值、最大值Means過程Libnameaa“d:\temp”;Procmeansdata=aa.score把統(tǒng)計(jì)量寫在此處
maxdec=3;//缺省是2Vart1-t3;/要處理的變量Classclas;//按照clas進(jìn)行分組Procsortdata=aa.score;Byclas;Procmeansmaxdec=3;Byclas;vart1-t3;Run;//Classclas;與byclas的區(qū)別是后者必須先用sort排序Weight語句指定觀測值的權(quán)重如果變量為缺失值或是0,則該觀測被剔除Freq語句頻率指定觀測值出現(xiàn)的頻率,如果指定的值不是整數(shù),將自動(dòng)取整。如果指定的值小于1,則觀測值不會被計(jì)算SexagenumberF2010f1820M2023m2019Procmens;Varage;Bysex;Run;SexagenumberF2010f1820M2023m2019Procmens;Freqnumber;Varage;Bysex;Run;Freq語句Freq過程產(chǎn)生一維至n維的頻數(shù)表和列聯(lián)表以總計(jì)百分比和數(shù)據(jù)計(jì)數(shù)的形式表示變量值的分布Output語句與data數(shù)據(jù)步中的output不同Varac;Outputout=aaMEAN=mamcSTD=sasc;MEAN=mamc//表示求得變量ac的平均值的列名用mamc表示STD=sasc//表示求得變量ac的標(biāo)準(zhǔn)差的列名用sasc表示制作制表與畫圖Table語句制表,不僅僅是制表,還包含了統(tǒng)計(jì)量的計(jì)算Tabulate過程Datatest;Inputxy@@;Datalines;123343876308630958;Proctabulate;Classxy;Tablex*y;Run;生成的表格中x為控制維度,y為子維度Tablexy;//按照xy兩個(gè)變量生成相對獨(dú)立的Tablex*yz;Tablex*(yz);如果行很寬,通過optionslinesize=’1000’;Tabulate過程*表示控制空格表示相互獨(dú)立上面都是列維度上,表示分為行維度和列維度Tablex,y*z;//x表示的是行維度Univ
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)保設(shè)施運(yùn)維合同樣本
- 專項(xiàng)信托外匯固定資產(chǎn)貸款合作合同
- 玫瑰貸記卡動(dòng)產(chǎn)質(zhì)押合同協(xié)議
- 員工合同解除合同書
- 贍養(yǎng)義務(wù)履行合同范文
- 聯(lián)合購房按揭貸款合同
- 精簡版商業(yè)租賃合同范本
- 租賃合同季度范本:機(jī)械設(shè)備篇
- 南湖區(qū):合同科技創(chuàng)新與合作新機(jī)遇
- 出租車股份合作合同條款
- 暑假假期安全教育(課件)-小學(xué)生主題班會
- 《脂肪肝de健康教育》課件
- 2025年外研版小學(xué)英語單詞表全集(一年級起1-12全冊)
- Python爬蟲技術(shù)基礎(chǔ)介紹
- 中華民族共同體概論教案第四講-天下秩序與華夏共同體演進(jìn)
- 《傳媒法律法規(guī)》課件
- 數(shù)據(jù)中心供配電系統(tǒng)概述演示
- TSG11-2020鍋爐安全技術(shù)規(guī)程(現(xiàn)行)
- 人力資源行業(yè)人力資源管理信息系統(tǒng)實(shí)施方案
- 歌曲《wake》中英文歌詞對照
- 義務(wù)教育(音樂)課程標(biāo)準(zhǔn)(2022年版)解讀
評論
0/150
提交評論