




已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
題目:數(shù)據(jù)集timeser_com中存放著某地區(qū)每個電信基站的通話時長和短信包信息。date代表時間變量,Cell代表基站編碼,tcherl和sms分別代表通話和短信量。問題如下:(1)根據(jù)date創(chuàng)建時間變量date_new;(2)清理數(shù)據(jù),根據(jù)CELL和date_new變量剔除重復記錄,對tcherl和sms使用三次樣條曲線進行插值;(3)ARIMA過程步識ARIMA(p,d,q)滯后階數(shù)并簡要說明確定該模型的原因(提示:通過單位根檢驗檢驗差分階數(shù)的合理性);(4)估計得到的模型系數(shù),對每個基站的tcherl和sms兩個變量進行向前30步的預測數(shù)據(jù)。解答:(1) 程序:data timese; set voice; date_new= input(put(date,8.),yynndd8.) ; format date date9.; run;原數(shù)據(jù)集 新建的date_new變量(2) 刪除重復記錄:程序:proc sort data = timese out = timese; by date cell; run; data times_new; set timese; by date cell; if first.cell then delete; run; 三次插值(考慮站點cell=D37C072)頻數(shù)分布情況:程序:proc freq data=times_new; table cell; run; D37C0631330.0498673.15D37C0712140.07100813.22D37C0722140.07102953.29D37C0732140.07105093.36D37C0811330.04106423.40D37C0821330.04107753.44D37C0831330.04109083.48三次插值:程序:proc iml; a = shape(1,226,1); create dates from acolname=date_new; append from a; run; quit; data dates; set dates; date_new= intnx(day,04may09d,_n_-1) ; format date_new date9.; run; proc sql ; create table date_new as select date_new from dates where date_new not in (select date_new from date); run; data date_new; set date_new date; run; proc sort data=date_new; by date_new; run; proc expand data = date_new out=date_new2 method=spline; id date_new; run; 未插值前數(shù)據(jù): 插值之后:(3) 程序:proc gplot data=data_f; plot tcherl*time; symbol color=red L=1 i=spline; run; Tcherl*time;程序:proc arima data=data_f; identify var=tcherl; run; data data_f; set data_f; z=dif(tcherl); run; 可以看出自相關(guān)函數(shù)出現(xiàn)緩慢衰減,而且后面的值并沒有在兩倍標準誤差的范圍內(nèi)所以不認為它是平穩(wěn)的序列從偏自相關(guān)函數(shù)可以看出7階截斷,P0.05,拒絕原假設(shè),所以認為它是非白噪聲序列,即對序列建模是有意義的??梢园l(fā)現(xiàn)AR6,MA6的值3.687501最小,ARMA(6,6)的BIC信息量最小,所以選擇ARMA(5,6)模型擬合原序列由于是非平穩(wěn)的 所以做一階差分程序:data data_f; set data_f; z=dif(tcherl); run; proc gplot data=data_f; plot tcherl*time=1 z*time=2/overlay; symbol1 c=red l=1 i=spline; symbol2 c=green l=1 i=spline; run; 程序:proc arima data=data_f; identify var=tcherl(1); run;、檢驗其自相關(guān)函數(shù),偏自相關(guān)函數(shù)、發(fā)現(xiàn)自相關(guān)函數(shù)下降的很快,很快接近于零,而且lag=3后面的值基本落在2倍標準誤差里面,所以可以認為是平穩(wěn)的。而且是非白噪聲序列Proc arima data_f;Identify var=tcherl stationarity=(adf=1);run;ADF檢驗中,三個模型只要有一個拒絕原假設(shè),就可以認為序列式平穩(wěn)的;顯然后面兩個模型,P值0.05,所以殘差序列是白噪聲序列,說明模型提取信息是充分的。即ARIMA(6,1,0)是適應(yīng)的。最后寫出這個模型:程序: proc arima data=data_f; identify var=tcherl(1) minic p=(0:6) q=(0:6); estimate p=6 method=cls; forecast lead=30 id=time out=result; run; 程序:proc gplot data=result1; plot for
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 零售企業(yè)數(shù)字化供應(yīng)鏈協(xié)同中的供應(yīng)鏈可視化技術(shù)應(yīng)用報告
- 2025年元宇宙社交平臺虛擬社交平臺社交焦慮緩解與用戶體驗研究
- 鄉(xiāng)村振興中的職業(yè)技能培訓:鄉(xiāng)村旅游人才培養(yǎng)報告
- 2025年醫(yī)院信息化建設(shè)與醫(yī)患溝通平臺初步設(shè)計評估報告
- 2025年餐飲業(yè)食品安全監(jiān)管信息化技術(shù)應(yīng)用與餐飲企業(yè)食品安全風險預警體系建設(shè)報告
- 2025年醫(yī)藥企業(yè)研發(fā)外包(CRO)在臨床試驗數(shù)據(jù)隱私保護中的法律法規(guī)報告001
- 周籃嫂的課件
- 2025年CCS項目在能源領(lǐng)域應(yīng)用的經(jīng)濟效益與投資決策支持研究報告
- 5G+AI融合的2025年科技互聯(lián)網(wǎng)產(chǎn)業(yè)創(chuàng)新生態(tài)構(gòu)建報告
- 環(huán)保產(chǎn)業(yè)園2025年循環(huán)經(jīng)濟發(fā)展模式中的綠色供應(yīng)鏈管理與創(chuàng)新研究報告
- 2025春新版三年級下冊科學?必背知識點考點
- 小學信息化培訓:AI賦能教學與教師能力提升
- 項目工程管理鐵三角
- 腫瘤病人的心理特點與心理護理
- 艾滋病梅毒乙肝防治培訓
- 2025年高考英語復習知識清單(全國)專題17 部分倒裝和完全倒裝十五種典型用法(講案)解析版
- 《夕陽紅的守護:老年人權(quán)益保障法主題課件》
- 改裝各類防彈車行業(yè)深度研究報告
- SCR脫硝催化劑體積及反應(yīng)器尺寸計算表
- 現(xiàn)代藝術(shù)教育理念探析-洞察分析
- 2025年山東省濟南市槐蔭區(qū)所屬事業(yè)單位考試筆試高頻重點提升(共500題)附帶答案詳解
評論
0/150
提交評論