基于arima-svm組合模型的移動通信業(yè)務(wù)預(yù)測研究_第1頁
基于arima-svm組合模型的移動通信業(yè)務(wù)預(yù)測研究_第2頁
基于arima-svm組合模型的移動通信業(yè)務(wù)預(yù)測研究_第3頁
基于arima-svm組合模型的移動通信業(yè)務(wù)預(yù)測研究_第4頁
基于arima-svm組合模型的移動通信業(yè)務(wù)預(yù)測研究_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

基于arima-svm組合模型的移動通信業(yè)務(wù)預(yù)測研究

0基于arra-svm的移動通信多用戶預(yù)測方法在過去的20年里,隨著移動通信技術(shù)的發(fā)展,通信行業(yè)已經(jīng)從用戶的通信需求轉(zhuǎn)變?yōu)橛脩舻墓ぷ?、生活、娛樂、結(jié)交和消費等需求。進入3G時代后,用戶不再關(guān)注技術(shù)和網(wǎng)絡(luò),而是更多地聚焦于內(nèi)容、應(yīng)用和體驗方面。移動通信技術(shù)的發(fā)展趨勢及普及率主要通過通信業(yè)務(wù)量體現(xiàn)。通信業(yè)務(wù)預(yù)測是通信網(wǎng)絡(luò)規(guī)劃的基礎(chǔ)和依據(jù),關(guān)系到工程建設(shè)的投資和規(guī)模,以及網(wǎng)絡(luò)建成投產(chǎn)后的經(jīng)濟效益。因此,對某個移動運營商來說,合理的業(yè)務(wù)預(yù)測顯得尤為重要。本文探討移動通信業(yè)務(wù)預(yù)測中的移動用戶數(shù)預(yù)測。移動通信用戶數(shù)時間序列具有高度不穩(wěn)定、復(fù)雜且難以預(yù)測的特性,其數(shù)據(jù)具有線性和非線性規(guī)律,并隱含大量的動態(tài)特征,同時又受自變量的影響。目前,用于移動通信用戶數(shù)的預(yù)測方法主要有:時間序列方法、回歸分析法、神經(jīng)網(wǎng)絡(luò)預(yù)測法和支持向量機(SupportVectorMachine,SVM)等?;诰€性數(shù)據(jù)的差分自回歸移動平均(AutoRegressiveIntegratingMovingAverageARIMA)模型融合了時間序列分析和回歸分析的優(yōu)點,在移動通信業(yè)務(wù)預(yù)測中得到了廣泛的應(yīng)用。但是,ARIMA模型無法捕捉非線性數(shù)據(jù)的信息,而現(xiàn)實中的時間序列數(shù)據(jù)往往表現(xiàn)出更多的非線性特性且含有復(fù)雜的噪聲,因此,基于線性模型定階獲得模型階數(shù)和基于線性篩選方法保留變量的ARIMA模型,往往并非最優(yōu),從而導(dǎo)致預(yù)測精度不高。在非線性時間序列預(yù)測中,神經(jīng)網(wǎng)絡(luò)模型的產(chǎn)生為移動用戶數(shù)的深入研究開拓了新的空間。然而在實際應(yīng)用中,神經(jīng)網(wǎng)絡(luò)存在隱含層數(shù)的選擇、過擬合、泛化性能不強以及局部極小值等問題?;诮Y(jié)構(gòu)風(fēng)險最小化的支持向量機SVM,是一種新的機器學(xué)習(xí)方法,其在非線性時間序列領(lǐng)域取得了良好的預(yù)測結(jié)果,較好地解決了小樣本、非線性、過擬合、維數(shù)災(zāi)和局部小等問題,且泛化推廣能力優(yōu)異。一些學(xué)者為了有效地利用各種模型的優(yōu)點,提出了基于著名的M-競爭理論的組合預(yù)測方法來進行時間序列的預(yù)測研究,實證結(jié)果表明,相對于單獨的模型,組合預(yù)測模型考慮問題更系統(tǒng)、更全面,因而能夠有效地減少一些環(huán)境因素對單個預(yù)測模型預(yù)測過程的影響,提高預(yù)測精度。針對移動通信用戶數(shù)據(jù)復(fù)雜、難預(yù)測且具有線性和非線性規(guī)律的特點,本文提出一種基于ARIMA和SVM組合模型的移動通信用戶數(shù)預(yù)測方法——ARIMA-SVM,ARIMA以一步預(yù)測的方式描述歷史的線性關(guān)系,SVM以相同方式對ARIMA模型的殘差進行非線性建模。利用ARIMA-SVM組合模型對移動通信用戶數(shù)進行預(yù)測,驗證組合模型的有效性和可行性。1arma-svm模型1.1svm模型估計ARIMA模型是差分運算和ARMA模型的結(jié)合,即擬合的差分平穩(wěn)序列。對于含有非季節(jié)性的時間序列進行建模,可使用ARIMA(p,d,q)模型。它可以通過適當(dāng)?shù)膁階(d為整數(shù))差分運算使序列平穩(wěn)。ARIMA模型的一般形式為:其中,{yt}為平穩(wěn)時間序列;{?t}為白噪聲序列;φi、θj(i=1,2,…,p;j=1,2,…,q)分別是{yt}、{?t}的參數(shù);p為自回歸階數(shù),q為移動平均階數(shù)。⑵SVM模型假設(shè)有訓(xùn)練集{xi,yi},其中xi∈RD(xi包含D個特征),i=1,2,…,n是n個D維向量,yi∈R,F={f|RD→R}。SVM線性回歸問題僅與訓(xùn)練樣本之間的內(nèi)積運算有關(guān),因此求解過程的復(fù)雜度不會隨樣本維數(shù)增加而明顯增加,解決了維數(shù)災(zāi)難的問題。對于非線性回歸問題,可以通過非線性函數(shù)將原輸入訓(xùn)練樣本映射到高維特征空間F,并進行線性回歸。訓(xùn)練樣本xi滿足如下條件:ζi稱為松弛變量,ζi≥0,i=1,2,…,n。在結(jié)構(gòu)風(fēng)險原則下,可將回歸問題轉(zhuǎn)化為如下最優(yōu)化問題:其中,c為懲罰參數(shù),用于平衡松弛變量和分類邊界的大小,上式解為最優(yōu)最終判別函數(shù):K(xi,yj)為核函數(shù),不同的核函數(shù)可構(gòu)造不同的支持向量機。本文采用徑向基核函數(shù):其中,σ為核密度。⑶ARIMA-SVM組合預(yù)測模型ARIMA與SVM模型分別對線性和非線性模型的處理具有優(yōu)勢,所以存在優(yōu)勢互補,二者結(jié)合起來進行移動通信用戶數(shù)預(yù)測,可能收獲較好的結(jié)果。首先,建立ARIMA模型來分析時間序列的線性部分;然后對ARIMA模型的殘差構(gòu)建SVM模型,ARIMA和SVM模型的預(yù)測值之和即為組合模型的預(yù)測值。其原理如圖1所示。1.2svm模型預(yù)測過程把一組時間序列的數(shù)據(jù)yt看成由線性自相關(guān)結(jié)構(gòu)Lt和非線性結(jié)構(gòu)Nt兩部分組成,即:具體建模步驟如下:⑴用ARIMA模型對yt進行預(yù)測。設(shè)預(yù)測結(jié)果為,序列的殘差為Nt,即:序列{Nt}中包含了序列yt的非線性關(guān)系:其中,?為隨機誤度。⑵根據(jù)步驟⑴得到的殘差序列Nt進行樣本重構(gòu)得到SVM樣本集,利用SVM對殘差進行預(yù)測,得預(yù)測結(jié)果為?Nt。預(yù)測過程如下:(1)SVM模型的定階。時間序列通常具有時滯和后效性,當(dāng)月的殘差不僅與當(dāng)月的影響因子相關(guān),且與歷史殘差相關(guān),具體與前幾個月殘差相關(guān),需要通過確定最佳時滯階數(shù)解決。本文采用模型階數(shù)與SVM模型參數(shù)一起尋優(yōu)的方法對變量定階,確定殘差序列的時滯階數(shù)。定階過程是:由低階到高階遞增地以SVM進行留一法測試,并以RMSE是否變小標(biāo)準(zhǔn)決定拓展階數(shù)與否。對待比較相鄰兩個模型SVM(n)和SVM(n+1),記RMSESVM(n)和RMSESVM(n+1)分別為SVM(n)、SVM(n+1)的均方根誤差。若RMSESVM(n)>RMSESVM(n+1),繼續(xù)拓階;若RMSESVM(n)≤RMSESVM(n+1),拓階終止,取SVM(n)為定階后模型,n為時滯階數(shù)。(2)模型數(shù)據(jù)的重構(gòu)和預(yù)測。將前n個月的殘差作為SVM的輸入來預(yù)測當(dāng)月的殘差。SVM通過調(diào)用LBSVM進行建模,采用10折交叉驗證,經(jīng)gridregression.py自動搜索確定模型最優(yōu)參數(shù)并進行預(yù)測,得殘差預(yù)測結(jié)果。⑶將兩種模型預(yù)測的結(jié)果相加,可得最后的預(yù)測結(jié)果,即:1.3svm模型預(yù)測算法本文采用ARIMA模型、SVM模型以及ARIMV-SVM組合模型進行預(yù)測。為了對比各模型的優(yōu)劣,所有模型均采用一步預(yù)測法,即利用多時間尺度一步外推的短時間數(shù)據(jù)作為預(yù)測結(jié)果。ARIMA模型預(yù)測由SPSS19.0給出,SVM模型預(yù)測采用libsvm軟件,數(shù)據(jù)重構(gòu)方式同殘差樣本重構(gòu)。為了評價模型預(yù)測性能的優(yōu)劣,使用均方根誤差(RootMeanSquareErrorRMSE)和平均絕對誤差百分比(MeanAbsolutePercentageErrorMAPE)作為模型的評價指標(biāo)。RMSE和MAPE分別定義如下:其中,代表預(yù)測值,yi代表真實值,n為預(yù)測樣本。RMSE僅適用于同一數(shù)據(jù)集不同模型間的比較,MAPE可用于不同數(shù)據(jù)集間的比較。但對同一數(shù)據(jù)集,如A模型與B模型相比雖然MAPE較大而RMSE較小,則A模型更穩(wěn)健,因此,RMSE為主要評價指標(biāo)。2arim-svm是移動通信普及中的應(yīng)用程序2.1動個數(shù)整理自《中國統(tǒng)計年份》報表本文中2012年1月~2014年2月忙時的移動用戶總數(shù)和3G移動用戶數(shù)整理自《中國統(tǒng)計年鑒》郵電通信月報表如表1所示。以2012年7月至2013年8月的數(shù)據(jù)作為訓(xùn)練集,2013年9月至2014年2月的六個觀測值作為測試集,來驗證組合模型的有效性。2.2移動用戶總數(shù)預(yù)測過程2.2.1arra模型擬合及預(yù)測⑴歷史數(shù)據(jù)的平穩(wěn)化在SPSS19.0統(tǒng)計分析中繪制移動用戶總數(shù)時間序列如圖2所示。分析該時序圖,并結(jié)合單位根校驗可知為典型的非平穩(wěn)時間序列,因此不能直接對其建模,需要對原序列進行差分變換。一階差分變換后仍存在明顯的上升趨勢,二階差分后數(shù)據(jù)圍繞均值線上下波動(如圖3所示),趨勢變化被消除。所以設(shè)定ARIMA模型參數(shù)d=2。⑵ARIMA模型p、q的確定及預(yù)測借助SPSS19.0構(gòu)建ARIMA模型,通過對二階差分序列的自相關(guān)圖和偏相關(guān)圖分析,并結(jié)合不同p,q值下訓(xùn)練集的RMSE,MAPE,BIC結(jié)果,經(jīng)過比較分析發(fā)現(xiàn),模型ARIMA(0,2,3)擬合效果較好。利用此模型對移動用戶總數(shù)進行預(yù)測,結(jié)果如表2所示。2.2.2移動熱用戶殘差估計通過SVM模型定階可知,移動用戶數(shù)殘差的時滯階數(shù)為1,即當(dāng)月移動用戶數(shù)的殘差受到前1個月移動用戶數(shù)殘差的影響。因此,前1個月移動用戶數(shù)的殘差作為SVM的輸入來預(yù)測當(dāng)月移動用戶數(shù)的殘差。使用最優(yōu)參數(shù)訓(xùn)練下的模型對2013年9月至2014年2月移動用戶總數(shù)的殘差進行預(yù)測,結(jié)果如表2所示。2.2.3模型預(yù)測結(jié)果比較根據(jù)ARIMA模型得到的預(yù)測結(jié)果和SVM模型的非線性預(yù)測結(jié)果,進行簡單相加得到ARIMA-SVM組合模型的預(yù)測結(jié)果。各模型的預(yù)測結(jié)果與真實值的比較如表2所示。其驗證樣本(2013年9月-2014年2月)的預(yù)測誤差結(jié)果如表2。2.33q值下訓(xùn)練集的預(yù)測結(jié)果同移動用戶總數(shù)模型創(chuàng)建與分析過程。3G移動用戶數(shù)二階差分后趨勢變化被消除,所以d=2。通過對二階差分序列的自相關(guān)圖和偏相關(guān)圖分析,并結(jié)合不同p,q值下訓(xùn)練集的RMSE,MAPE,BIC結(jié)果比較,得到移動用戶數(shù)序列模型ARIMA(0,2,1)模型。分別利用該模型和SVM模型對2013年9月至2014年2月的3G移動用戶數(shù)進行預(yù)測,其中SVM模型序列重構(gòu)階數(shù)為3,預(yù)測結(jié)果如表2。利用ARIMA-SVM組合模型進行預(yù)測,殘差序列樣本重構(gòu)階數(shù)為2,得到預(yù)測結(jié)果如表2。三種模型預(yù)測的均方根誤差(RMSE)和平均絕對誤差百分比(MAPE)的結(jié)果如表2。2.4svm組合模型預(yù)測精度的提高從表2中可以看出,無論是RMSE還是MAPE,ARIMA模型和SVM模型的結(jié)果都比組合模型ARIMV-SVM的要差,主要原因可歸結(jié)于它們都不能同時捕捉到移動通信用戶數(shù)的線性和非線性特征;而ARIMA-SVM組合模型同單一模型相比,預(yù)測精度有了一定的提高,說明組合模型能夠充分利用原始數(shù)據(jù)中的信息,避免了單一模型的局限性,因此其預(yù)測結(jié)果是可靠、有效的。本文中,ARIMA-SVM組合模型預(yù)測精度雖有提高,但是差別較小。進一步討論,我們認(rèn)為主要原因有三:一是移動通信用戶數(shù)更多地表現(xiàn)為線性,因此線性的ARIMA模型擬合效果較好,加入SVM方法可以改善小部分非線性預(yù)測結(jié)果,提高絕對誤差值,但對預(yù)測結(jié)果影響不大;二是SVM訓(xùn)練樣本數(shù)量較小,加入SVM模型的組合預(yù)測模型對ARIMA預(yù)測的改善程度有限;三是移動通信用戶數(shù)受到人口數(shù)、普及率、市場經(jīng)濟等多因素影響,諸多因素的影響使得擬合效果出現(xiàn)一定誤差。因此單純通過改善預(yù)測殘差修正預(yù)測結(jié)果存在一定的局限性。3基于arramm模型的時間序列預(yù)測移動通信用戶數(shù)同時具有線性和非線性特征,由于ARIMA模型和SVM模型對線性和非線性處理各有優(yōu)勢,但對于復(fù)雜的、不穩(wěn)定的時間序列,單一的模型都不是最優(yōu)的。因此,采用ARIMA模型對業(yè)務(wù)量時間序列數(shù)據(jù)進行線性建模,SVM模型對ARIMA模型殘差進行非線性建模,將ARIMA模型與SVM模型組合對移動業(yè)務(wù)數(shù)據(jù)進行預(yù)測。通過移動通信用戶數(shù)的實證研究表明,組合預(yù)測模型在長期預(yù)測上的有效性,能夠總體上把握移動通信用戶數(shù)的趨勢,達到更準(zhǔn)確預(yù)測的目的,同時驗證了組合預(yù)測模型相比于單一模型更合理、更可靠。ARIMA-SVM模型是一種有效的移動通信用戶數(shù)的時間序列預(yù)測模型。近些年來,移動通信用戶數(shù)分析和預(yù)測逐漸成為一個非?;钴S的研究領(lǐng)域。通過對移動用戶

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論