2014年sas大賽第三題_第1頁
2014年sas大賽第三題_第2頁
2014年sas大賽第三題_第3頁
2014年sas大賽第三題_第4頁
2014年sas大賽第三題_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

題目:數(shù)據(jù)集timeser_com中存放著某地區(qū)每個電信基站的通話時長和短信包信息。date代表時間變量,Cell代表基站編碼,tcherl和sms分別代表通話和短信量。問題如下:(1)根據(jù)date創(chuàng)建時間變量date_new;(2)清理數(shù)據(jù),根據(jù)CELL和date_new變量剔除重復記錄,對tcherl和sms使用三次樣條曲線進行插值;(3)ARIMA過程步識ARIMA(p,d,q)滯后階數(shù)并簡要說明確定該模型的原因(提示:通過單位根檢驗檢驗差分階數(shù)的合理性);(4)估計得到的模型系數(shù),對每個基站的tcherl和sms兩個變量進行向前30步的預測數(shù)據(jù)。解答:(1) 程序:data timese; set voice; date_new= input(put(date,8.),yynndd8.) ; format date date9.; run;原數(shù)據(jù)集 新建的date_new變量(2) 刪除重復記錄:程序:proc sort data = timese out = timese; by date cell; run; data times_new; set timese; by date cell; if first.cell then delete; run; 三次插值(考慮站點cell=D37C072)頻數(shù)分布情況:程序:proc freq data=times_new; table cell; run; D37C0631330.0498673.15D37C0712140.07100813.22D37C0722140.07102953.29D37C0732140.07105093.36D37C0811330.04106423.40D37C0821330.04107753.44D37C0831330.04109083.48三次插值:程序:proc iml; a = shape(1,226,1); create dates from acolname=date_new; append from a; run; quit; data dates; set dates; date_new= intnx(day,04may09d,_n_-1) ; format date_new date9.; run; proc sql ; create table date_new as select date_new from dates where date_new not in (select date_new from date); run; data date_new; set date_new date; run; proc sort data=date_new; by date_new; run; proc expand data = date_new out=date_new2 method=spline; id date_new; run; 未插值前數(shù)據(jù): 插值之后:(3) 程序:proc gplot data=data_f; plot tcherl*time; symbol color=red L=1 i=spline; run; Tcherl*time;程序:proc arima data=data_f; identify var=tcherl; run; data data_f; set data_f; z=dif(tcherl); run; 可以看出自相關(guān)函數(shù)出現(xiàn)緩慢衰減,而且后面的值并沒有在兩倍標準誤差的范圍內(nèi)所以不認為它是平穩(wěn)的序列從偏自相關(guān)函數(shù)可以看出7階截斷,P0.05,拒絕原假設(shè),所以認為它是非白噪聲序列,即對序列建模是有意義的??梢园l(fā)現(xiàn)AR6,MA6的值3.687501最小,ARMA(6,6)的BIC信息量最小,所以選擇ARMA(5,6)模型擬合原序列由于是非平穩(wěn)的 所以做一階差分程序:data data_f; set data_f; z=dif(tcherl); run; proc gplot data=data_f; plot tcherl*time=1 z*time=2/overlay; symbol1 c=red l=1 i=spline; symbol2 c=green l=1 i=spline; run; 程序:proc arima data=data_f; identify var=tcherl(1); run;、檢驗其自相關(guān)函數(shù),偏自相關(guān)函數(shù)、發(fā)現(xiàn)自相關(guān)函數(shù)下降的很快,很快接近于零,而且lag=3后面的值基本落在2倍標準誤差里面,所以可以認為是平穩(wěn)的。而且是非白噪聲序列Proc arima data_f;Identify var=tcherl stationarity=(adf=1);run;ADF檢驗中,三個模型只要有一個拒絕原假設(shè),就可以認為序列式平穩(wěn)的;顯然后面兩個模型,P值0.05,所以殘差序列是白噪聲序列,說明模型提取信息是充分的。即ARIMA(6,1,0)是適應(yīng)的。最后寫出這個模型:程序: proc arima data=data_f; identify var=tcherl(1) minic p=(0:6) q=(0:6); estimate p=6 method=cls; forecast lead=30 id=time out=result; run; 程序:proc gplot data=result1; plot for

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論