版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
時(shí)間序列預(yù)測(cè)常用方法分析摘要對(duì)于不同的時(shí)間序列,預(yù)測(cè)方法的選擇問(wèn)題對(duì)提高預(yù)測(cè)精度非常重要。本文基于回歸模型、自回歸滑動(dòng)平均模型、求和自回歸滑動(dòng)平均模型租、神經(jīng)網(wǎng)絡(luò)和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的基本原理和算法描述。本章在環(huán)境下實(shí)現(xiàn)了這五種時(shí)間序列預(yù)測(cè)方法,并利用這五種方法對(duì)同一個(gè)信號(hào)進(jìn)行建模和預(yù)測(cè),分別比較這幾種方法在不同情況下的預(yù)測(cè)性能,另外,筆者利用計(jì)算機(jī)生成了兩個(gè)隨機(jī)數(shù)據(jù)序列,分別是服從區(qū)間,上的均勻分布數(shù)據(jù)和服從均值為,方差為的高斯分布數(shù)據(jù)用五種預(yù)測(cè)方法對(duì)這兩類數(shù)據(jù)進(jìn)行預(yù)測(cè),比較它們的預(yù)測(cè)效果。關(guān)鍵詞:時(shí)間序列;短期預(yù)測(cè);神經(jīng)網(wǎng)絡(luò)目錄引言 3一時(shí)間序列預(yù)測(cè)的意義和生活中的運(yùn)用 4二五種時(shí)間序列預(yù)測(cè)方法的實(shí)現(xiàn)和比較 52.1五種時(shí)間序列預(yù)測(cè)方法 52.2模型預(yù)側(cè)法 52.3模型的可解釋性問(wèn)題 7三時(shí)間序列都具有非線性的特點(diǎn)和常用的誤差指標(biāo) 113.1時(shí)間序列非線性特點(diǎn) 113.2常用的誤差指標(biāo) 12四總結(jié) 18參考文獻(xiàn) 19引言時(shí)間序列是指按照時(shí)間順序取得的一系列觀測(cè)值,很多數(shù)據(jù)是以時(shí)間序列的形式出現(xiàn)的,從經(jīng)濟(jì)、金融到工程技術(shù),從天文、地理到氣象,從醫(yī)學(xué)到生物等各個(gè)領(lǐng)域都涉及到時(shí)間序列,例如船舶運(yùn)動(dòng),每天的氣溫,公路事故數(shù)量的周度序列等等。在自然科學(xué)和社會(huì)科學(xué)各研究領(lǐng)域中,大量決策題都離不開(kāi)預(yù)測(cè),時(shí)間序列預(yù)測(cè)是指利用時(shí)間序列的若干歷史觀測(cè)值來(lái)預(yù)測(cè)未來(lái)某時(shí)刻的取值。時(shí)間序列預(yù)測(cè)的應(yīng)用非常廣泛,如天氣預(yù)報(bào),股價(jià)指數(shù)的預(yù)測(cè),船舶運(yùn)動(dòng)的極短期預(yù)報(bào)等等。一時(shí)間序列預(yù)測(cè)的意義和生活中的運(yùn)用時(shí)間序列是指將某種現(xiàn)象某一個(gè)統(tǒng)計(jì)指標(biāo)在不同時(shí)間上的各個(gè)數(shù)值,按時(shí)間先后順序排列而形成的序列。時(shí)間序列法是一種定量預(yù)測(cè)方法,亦稱簡(jiǎn)單外延方法,在統(tǒng)計(jì)學(xué)中作為一種常用的預(yù)測(cè)手段被廣泛應(yīng)用。時(shí)間序列分析在第二次世界大戰(zhàn)前應(yīng)用于經(jīng)濟(jì)預(yù)測(cè)。二次大戰(zhàn)中和戰(zhàn)后,在軍事科學(xué)、空間科學(xué)、氣象預(yù)報(bào)和工業(yè)自動(dòng)化等部門(mén)的應(yīng)用更加廣泛。時(shí)間序列分析(Timeseriesanalysis)是一種動(dòng)態(tài)數(shù)據(jù)處理的統(tǒng)計(jì)方法。該方法基于隨機(jī)過(guò)程理論和數(shù)理統(tǒng)計(jì)學(xué)方法,研究隨機(jī)數(shù)據(jù)序列所遵從的統(tǒng)計(jì)規(guī)律,以用于解決實(shí)際問(wèn)題。時(shí)間序列構(gòu)成要素是:現(xiàn)象所屬的時(shí)間,反映現(xiàn)象發(fā)展水平的指標(biāo)數(shù)值?,F(xiàn)實(shí)生活中的很多數(shù)據(jù)都是以時(shí)間序列的形式出現(xiàn)的,時(shí)間序列是一種重要的復(fù)雜數(shù)據(jù)對(duì)象,無(wú)論是某股票價(jià)格的變化,某商品每個(gè)月的銷售量還是自然領(lǐng)域的太陽(yáng)黑子數(shù),月降水量等等,都形成一個(gè)時(shí)間序列。在社會(huì),經(jīng)濟(jì),技術(shù)等領(lǐng)域中存在著大量的時(shí)間序列數(shù)據(jù)有待進(jìn)一步的分析和處理,人們希望通過(guò)分析這些時(shí)間序列數(shù)據(jù)從中發(fā)現(xiàn)某一現(xiàn)象的發(fā)展變化規(guī)律,從而盡可能多的從中提取出所需要的準(zhǔn)確信息,利用這些數(shù)據(jù)預(yù)測(cè)未來(lái),從而達(dá)到更好的控制將來(lái)事件的目的。預(yù)測(cè)的科學(xué)性在于,它有科學(xué)基礎(chǔ),包括理論,資料,方法,計(jì)算等因素,依賴于對(duì)客觀規(guī)律的認(rèn)識(shí)和掌握。預(yù)測(cè)的目的在于為制定計(jì)劃和進(jìn)行決策提供客觀依據(jù),社會(huì)經(jīng)濟(jì),工程等諸多領(lǐng)域都離不開(kāi)預(yù)測(cè),日常天氣的預(yù)測(cè),網(wǎng)絡(luò)流量的預(yù)測(cè),股票走勢(shì)的預(yù)測(cè)都和我們的日常生活息息相關(guān)。我們現(xiàn)在的預(yù)測(cè)方法還不夠成熟,對(duì)一些重大的自然災(zāi)害,比如地震,海嘯等,沒(méi)有形成有效的預(yù)測(cè)方法。解決預(yù)測(cè)問(wèn)題關(guān)鍵是通過(guò)研究歷史數(shù)據(jù)弄清楚序列的內(nèi)在發(fā)展規(guī)律及相依關(guān)系,從而利用時(shí)序的自身變化規(guī)律對(duì)未來(lái)做出預(yù)測(cè)。而現(xiàn)實(shí)中的數(shù)據(jù)的結(jié)構(gòu)千變?nèi)f化,要探索歷史數(shù)據(jù)的本質(zhì)形式,建立一個(gè)真正可以預(yù)測(cè)的時(shí)序模型具有很大的挑戰(zhàn)性。二五種時(shí)間序列預(yù)測(cè)方法的實(shí)現(xiàn)和比較2.1五種時(shí)間序列預(yù)測(cè)方法基于回歸模型、自回歸滑動(dòng)平均模型、求和自回歸滑動(dòng)平均模型租、神經(jīng)網(wǎng)絡(luò)和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的基本原理和算法描述。對(duì)于不同的時(shí)間序列,預(yù)測(cè)方法的選擇問(wèn)題對(duì)提高預(yù)測(cè)精度非常重要。本章在環(huán)境下實(shí)現(xiàn)了這五種時(shí)間序列預(yù)測(cè)方法,并利用這五種方法對(duì)同一個(gè)海浪信號(hào)進(jìn)行建模和預(yù)測(cè),分別比較這幾種方法在不同情況下的預(yù)測(cè)性能,實(shí)驗(yàn)中用到的海浪信號(hào),單位被規(guī)范化。另外,筆者利用計(jì)算機(jī)生成了兩個(gè)隨機(jī)數(shù)據(jù)序列,分別是服從區(qū)間,上的均勻分布數(shù)據(jù)和服從均值為,方差為的高斯分布數(shù)據(jù)用五種預(yù)測(cè)方法對(duì)這兩類數(shù)據(jù)進(jìn)行預(yù)測(cè),比較它們的預(yù)測(cè)效果。2.2模型預(yù)側(cè)法杜會(huì)經(jīng)濟(jì)系統(tǒng)中的許多變t除了含有隨機(jī)性擾動(dòng)和趨勢(shì)性變化以外,還兼有季節(jié)性(或稱作周期性)波動(dòng)。這種季節(jié)性的波動(dòng)是由于系統(tǒng)內(nèi)部的周期性運(yùn)動(dòng)與變化規(guī)律和系統(tǒng)的外部環(huán)境的季節(jié)性作用特點(diǎn)等因素所造成的。由于這種因果關(guān)系的錯(cuò)綜復(fù)雜和不明確,人們通常撇開(kāi)這些復(fù)雜的關(guān)系而轉(zhuǎn)向直接對(duì)被測(cè)量的時(shí)間序列進(jìn)行分析和研究,從而同時(shí)預(yù)測(cè)出其趨勢(shì)性變動(dòng)和季節(jié)性波動(dòng).可見(jiàn),季節(jié)性波動(dòng)預(yù)測(cè)較一般預(yù)測(cè)有特殊的困難。為此,人們提出了各式各樣的預(yù)測(cè)方法來(lái)解決這一問(wèn)題??偨Y(jié)這些方法我幻不難發(fā)現(xiàn),它們?cè)诒举|(zhì)上都是設(shè)法將季節(jié)性的波動(dòng)從原時(shí)間序列中“剔除”出去,然后用一般的預(yù)側(cè)方法對(duì)無(wú)季節(jié)性的新時(shí)間序列進(jìn)行預(yù)測(cè),最后再通過(guò)某種手段將季節(jié)性反映出來(lái).而達(dá)到這一目的的途徑是多種多祥的,但總體來(lái)說(shuō),可以分為四類:季節(jié)性因子分解預(yù)測(cè)法、oBx一eJnkins季節(jié)模型預(yù)側(cè)法、按季節(jié)分解預(yù)側(cè)法以及分解—組合預(yù)測(cè)法.下面,通過(guò)對(duì)各類方法的分析和比較,可以看到它們各自的特點(diǎn)和缺陷.申此,我們又會(huì)很自然地發(fā)現(xiàn)一些需要改進(jìn)的問(wèn)題。我們知道,評(píng)價(jià)一種預(yù)測(cè)方法的優(yōu)劣,一方面要看它的預(yù)測(cè)精度,另一方面還要考慮它的簡(jiǎn)便性和預(yù)測(cè)費(fèi)用等問(wèn)題。本文正是根據(jù)這一原則,對(duì)常用的季節(jié)性波動(dòng)預(yù)測(cè)方法進(jìn)行了較全面的歸納總結(jié),指出了它們各自的特點(diǎn)和缺陷.從而為這些方法的選擇使用和改進(jìn)提供了依據(jù)。最后,文章就各方法存在的問(wèn)題提出了進(jìn)一步改進(jìn)的設(shè)想.作者將就這些問(wèn)題另文作具體探討.時(shí)間序列預(yù)測(cè)在很多領(lǐng)域有著極其廣泛的應(yīng)用,它一般是利用歷史樣本建立起統(tǒng)計(jì)模型,并由這一模型來(lái)闡釋數(shù)據(jù)規(guī)律,從而進(jìn)行控制和預(yù)報(bào)。平穩(wěn)時(shí)間序列如何進(jìn)行建模和預(yù)測(cè),尤其是線性模型,關(guān)于送方面的研究由來(lái)己久。常見(jiàn)的方法有AR模型、MA模型、ARMA模型、最小二乘估計(jì)、嶺回巧、Lasso回歸等等,它們由其各自的優(yōu)越性在時(shí)間序列預(yù)測(cè)中取得了不錯(cuò)的效果。但現(xiàn)實(shí)中,有很多的時(shí)間序列,數(shù)據(jù)是海量的高維的,并且具有非平穩(wěn)、非線性特點(diǎn),上述方法己不再完全適用。于是,統(tǒng)汁學(xué)家們提出了人工神經(jīng)網(wǎng)絡(luò)W及支持向量機(jī)方法,和最小二乘、嶺回歸、Lasso回歸比起來(lái),它們的非線性預(yù)測(cè)性和實(shí)用性的特點(diǎn)較為突出,也就越來(lái)越受青睞。2.3模型的可解釋性問(wèn)題在進(jìn)行時(shí)間序列的預(yù)測(cè)時(shí),我們總希望非零參數(shù)少些,且每個(gè)分量對(duì)因變量的影響盡可能大些,沒(méi)樣也許偏差會(huì)有所增加,但預(yù)測(cè)誤差卻減小了,同時(shí)使得模型簡(jiǎn)單化,但遺憾的是,OLS并不能滿足這些要求。特別是在實(shí)際的問(wèn)題研究中,變量之間不可避免地會(huì)有復(fù)共線性現(xiàn)象(變量么間有近似的線性關(guān)系),一旦變量之間有復(fù)共線性,OLS就不再是一個(gè)良好的估計(jì)了,會(huì)出現(xiàn)一系列不好的現(xiàn)象,比如估計(jì)值不穩(wěn)定,化及估計(jì)值與實(shí)際值不相符合,有時(shí)甚至出現(xiàn)自變量和因變量之間的相關(guān)性正負(fù)顛倒。嶺回歸的基本思想、重要性質(zhì)及峰參數(shù)的選取。嶺回歸方法同普通最小二乘法相比,一個(gè)最本質(zhì)的區(qū)別就是;嶺回歸估計(jì)已經(jīng)不再是無(wú)偏估計(jì)了。景小二乘估計(jì)是無(wú)偏的,但OLS在設(shè)計(jì)矩陣X呈病態(tài)時(shí)變得很不合理了。而嶺回歸估計(jì)改良了最小二乘估計(jì),它通過(guò)讓系數(shù)有偏來(lái)解決復(fù)共線性問(wèn)題。假設(shè)一個(gè)估升量有很小的偏差,但其精度卻遠(yuǎn)遠(yuǎn)比無(wú)偏估計(jì)量要高,也即更加向真實(shí)參數(shù)值靠巧,人們當(dāng)然更巧意選取該估計(jì)量。雖然嶺回歸估計(jì)比普通最小二乘估計(jì)更加的穩(wěn)健,在一定范圍內(nèi)有著優(yōu)良的特性,但是嶺參數(shù)fc值的確定依賴于未知參數(shù),特別是用嶺跡法來(lái)選?。林担饔^性較強(qiáng)。嶺回歸估計(jì)壓縮了回歸系數(shù),能使得模型比較穩(wěn)定,但由于沒(méi)有剔除掉一些變量,有些不重要的回歸系數(shù)并未直接壓縮成0,模型中的變量個(gè)數(shù)過(guò)多,導(dǎo)致模型的可解釋性差。若協(xié)調(diào)參數(shù)4越大,它的約束效力就會(huì)越小,當(dāng)f的值大到超出某一界限時(shí),約束畫(huà)數(shù)的約束作用就會(huì)完全消失,這時(shí)的回歸系數(shù)估計(jì)值即是OLS估汁量;又若協(xié)調(diào)參數(shù)Ub較小,約束效力就會(huì)很明顯,這時(shí)回歸系數(shù)估計(jì)值就是OLS的收縮估計(jì)量,顯然t的大小直接決定了最終能夠入選模型的自變量個(gè)數(shù)。因此,協(xié)調(diào)參數(shù)*的確定,在Lasso方法中尤為關(guān)鍵。在自變量分布未知的情況下,這里簡(jiǎn)單介紹兩種參數(shù)f的估計(jì)方法一-交叉驗(yàn)證方法和廣義交叉驗(yàn)證方法。2.3.1Lasso回歸嶺回歸的比較如上文所述,嶺回歸估計(jì)雖然是對(duì)最小二乘估計(jì)的改進(jìn),但它僅僅是對(duì)回歸系數(shù)進(jìn)行一定程度的壓縮且并不能壓縮至0,因此模型的可解棒性不好,而Lasso回歸不僅僅對(duì)系數(shù)進(jìn)行壓縮,甚至使一些系數(shù)直接變成化從而達(dá)到了降維和變量選擇的目的。在維數(shù)為2時(shí),圖2.2直觀地展示了為何Lasso能產(chǎn)生值為0的系數(shù)。該函數(shù)的桐圓邊界在圖2.2中用閉合曲線表示,它的中屯、是最小二乘估計(jì)所得的系數(shù)解。圖2.2(a)表示Lasso回歸,其約束條件是一個(gè)旋轉(zhuǎn)的正方形,Lasso解就是楠圓邊界首次跟正方形相交時(shí)刻,此情況發(fā)生于正方形的角上,這樣就造成了系數(shù)為化圖2.2(b)表示嶺回歸,因?yàn)閳A形沒(méi)有角,相遇時(shí)刻較難在坐標(biāo)軸上發(fā)生,所W有零解的可能性很小。Lasso方法在壓縮系數(shù),特別是在變量選擇方面的優(yōu)勢(shì)顯而易見(jiàn),但若處理的數(shù)據(jù)是高維海量的或者是小樣本時(shí),計(jì)算開(kāi)銷大或過(guò)學(xué)習(xí)現(xiàn)象又會(huì)隨之發(fā)生,從而Lasso回歸的優(yōu)越性又會(huì)喪失。2.3.2支持向量機(jī)1W5年,Vapnik等人提出了支持向量化學(xué)習(xí)方法,近年來(lái)備受學(xué)術(shù)界關(guān)注,該方法的很多優(yōu)點(diǎn)都能體現(xiàn)在處理非線性問(wèn)題和高維模式識(shí)別中。支持向量機(jī)(SupportVectorMachine,SVM),WVC維理論[10]和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理[51為基礎(chǔ),而不是傳統(tǒng)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化[15]原則,因此泛化能力比較好。此外,在處理非線性問(wèn)題的時(shí)候,將其轉(zhuǎn)換成高維空間中的線性問(wèn)題,其中的巧積運(yùn)算用核函數(shù)來(lái)代替,進(jìn)而復(fù)雜計(jì)算問(wèn)題得W化解,維數(shù)災(zāi)難W及局部極小難題也得到解決。2.3.4支持向量機(jī)與前H種方法的比較不管是上文所述的最小二乘估計(jì),吟回歸,還是Lasso回歸,都是通過(guò)構(gòu)造線性模型,然后進(jìn)行參數(shù)估計(jì)和變量選擇,在此基礎(chǔ)上建立回歸模型,且—些假設(shè)條件為前提,比如正態(tài)分布假設(shè),假定預(yù)測(cè)對(duì)象的變化趨勢(shì)會(huì)持續(xù)等等。然而,現(xiàn)實(shí)中的時(shí)間序列有著高維、海量、非線性、非平穩(wěn)等特點(diǎn),傳統(tǒng)的線性模型顯然無(wú)法滿足這些要求,達(dá)不到人們的期望。流行的神經(jīng)巧絡(luò)方法擁有較好的非線性逼近能力,但確定模型結(jié)構(gòu)比較難,易出現(xiàn)局部極小值現(xiàn)象。另外,神經(jīng)網(wǎng)絡(luò)是通過(guò)構(gòu)建含加權(quán)值的網(wǎng)絡(luò)模型來(lái)學(xué)習(xí)的,具有隱性的知識(shí)結(jié)構(gòu),因而缺乏解釋能力,運(yùn)些不足使得神經(jīng)網(wǎng)絡(luò)的實(shí)際運(yùn)用有很大的局限。支持向量機(jī)方法能很好地克服這整不足,其基礎(chǔ)么一是結(jié)構(gòu)風(fēng)險(xiǎn)最小化,充分考慮了樣本的復(fù)雜性和擬合性,有很多的優(yōu)點(diǎn),比如對(duì)樣本依賴程度低、泛化能為強(qiáng)W及擬合效果巧等。通過(guò)選定核函數(shù)、回歸類型和參數(shù)進(jìn)行學(xué)習(xí),過(guò)程簡(jiǎn)單,不管是擬合度還是預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性都比最小二乘、嶺回歸和Lasso回歸,M及神經(jīng)網(wǎng)絡(luò)要好,在實(shí)際應(yīng)用中表現(xiàn)出很好的性能。但是對(duì)于支持向量機(jī),有關(guān)核函數(shù)及其參數(shù)的選取對(duì)回歸效果會(huì)有很大影響,而目前,并沒(méi)有通用的選擇方法,這仍然是需要進(jìn)一步研究的工作內(nèi)容。最小二乘估計(jì)、嶺回歸、Lasso回歸和支持向量機(jī)這四種方法的相關(guān)理論,包括基擊原理、性質(zhì)、參讚強(qiáng)擇、模型實(shí)現(xiàn)等,井將它們進(jìn)行比較,最后采用matM)軟件進(jìn)行實(shí)例驗(yàn)證。最小二乘估計(jì)在很多領(lǐng)域有著寬泛的應(yīng)用,但在處理共線性問(wèn)題上有巧顯的劣勢(shì);吟回歸是對(duì)最小二乘的改進(jìn),能很好地處理復(fù)共線性問(wèn)題,并且對(duì)各個(gè)系數(shù)進(jìn)行一定程度的壓縮,但參數(shù)fc的確定比較主觀,而且并不能使個(gè)別不重要的變量系數(shù)壓縮至零,模型的可解釋性不巧;Lasso回歸不但能對(duì)自變量系數(shù)進(jìn)行壓縮,而且能使個(gè)別系數(shù)直接為零,從而進(jìn)行變量選擇,較嶺回歸有很大的改進(jìn);支持向量化通過(guò)選取適當(dāng)?shù)暮撕瘮?shù)、回歸類型和參數(shù)進(jìn)行機(jī)器學(xué)習(xí),能處理非線性、高維數(shù)據(jù),預(yù)測(cè)效果明顯比前H種方法好,越來(lái)越廣泛地應(yīng)用到實(shí)際生活中。但由于時(shí)間、水平有限和方法的限制性,本文的研究?jī)?nèi)容比較粗糖,四種方法的預(yù)測(cè)效果有區(qū)別但效果沒(méi)有想象中的明顯,特別是由于種種原因,獲得的樣本數(shù)據(jù)并不夠多,也未能實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)與這四種方法的比較,這些都有待進(jìn)一步提高和改進(jìn),期望在后的學(xué)習(xí)中能獲得更深入更全面的理解。三時(shí)間序列都具有非線性的特點(diǎn)和常用的誤差指標(biāo)3.1時(shí)間序列非線性特點(diǎn)時(shí)期序列的主要特點(diǎn)有:1)序列中的指標(biāo)數(shù)值具有可加性。2)序列中每個(gè)指標(biāo)數(shù)值的大小與其所反映的時(shí)期長(zhǎng)短有直接聯(lián)系。3)序列中每個(gè)指標(biāo)數(shù)值通常是通過(guò)連續(xù)不斷登記匯總?cè)〉玫摹?.時(shí)點(diǎn)序列:由時(shí)點(diǎn)總量指標(biāo)排列而成的時(shí)間序列時(shí)點(diǎn)序列的主要特點(diǎn)有:1)序列中的指標(biāo)數(shù)值不具可加性。2)序列中每個(gè)指標(biāo)數(shù)值的大小與其間隔時(shí)間的長(zhǎng)短沒(méi)有直接聯(lián)系。3)序列中每個(gè)指標(biāo)數(shù)值通常是通過(guò)定期的一次登記取得的。(二)相對(duì)數(shù)時(shí)間序列把一系列同種相對(duì)數(shù)指標(biāo)按時(shí)間先后順序排列而成的時(shí)間序列叫做相對(duì)數(shù)時(shí)間序列。(三)平均數(shù)時(shí)間序列平均數(shù)時(shí)間序列是指由一系列同類平均指標(biāo)按時(shí)間先后順序排列的時(shí)間序列。5編制原則\o"編輯本段"編輯:保證序列中各期指標(biāo)數(shù)值的可比性(一)時(shí)期長(zhǎng)短最好一致(二)總體范圍應(yīng)該一致(三)指標(biāo)的經(jīng)濟(jì)內(nèi)容應(yīng)該統(tǒng)一(四)計(jì)算方法應(yīng)該統(tǒng)一(五)計(jì)算價(jià)格和計(jì)量單位可比6變量特征\o"編輯本段"編輯:非平穩(wěn)性(nonstationarity,也譯作不平穩(wěn)性,非穩(wěn)定性):即時(shí)間序列變量無(wú)法呈現(xiàn)出一個(gè)長(zhǎng)期趨勢(shì)并最終趨于一個(gè)常數(shù)或是一個(gè)線性函數(shù)。波動(dòng)幅度隨時(shí)間變化(Time-varyingVolatility):即一個(gè)時(shí)間序列變量的方差隨時(shí)間的變化而變化這兩個(gè)特征使得有效分析時(shí)間序列變量十分困難。平穩(wěn)型時(shí)間數(shù)列(StationaryTimeSeries)系指一個(gè)時(shí)間數(shù)列其統(tǒng)計(jì)特性將不隨時(shí)間之變化而改變者。[4]7分析方法\o"編輯本段"編輯(一)指標(biāo)分析法通過(guò)時(shí)間序列的分析指標(biāo)來(lái)揭示現(xiàn)象的發(fā)展變化狀況和發(fā)展變化程度。(二)構(gòu)成因素分析法通過(guò)對(duì)影響時(shí)間序列的構(gòu)成因素進(jìn)行分解分析,揭示現(xiàn)象隨時(shí)間變化而演變的規(guī)律。8分析模型\o"編輯本段"編輯時(shí)間數(shù)列的組合模型1加法模型:Y=T+S+C+I(Y,T
計(jì)量單位相同的總量指標(biāo))(S,C,I對(duì)長(zhǎng)期趨勢(shì)產(chǎn)生的或正或負(fù)的偏差)2
乘法模型:Y=T·S·C·I(常用模型)(Y,T計(jì)量單位相同的總量指標(biāo))(S,C,I對(duì)原數(shù)列指標(biāo)增加或減少的百分比)9序列預(yù)測(cè)\o"編輯本段"編輯時(shí)間序列預(yù)測(cè)主要是以連續(xù)性原理作為依據(jù)的。連續(xù)性原理是指客觀事物的發(fā)展具有合乎規(guī)律的連續(xù)性,事物發(fā)展是按照它本身固有的規(guī)律進(jìn)行的。在一定條件下,只要規(guī)律賴以發(fā)生作用的條件不產(chǎn)生質(zhì)的變化,則事物的基本發(fā)展趨勢(shì)在未來(lái)就還會(huì)延續(xù)下去。時(shí)間序列預(yù)測(cè)就是利用統(tǒng)計(jì)技術(shù)與方法,從預(yù)測(cè)指標(biāo)的時(shí)間序列中找出演變模式,建立數(shù)學(xué)模型,對(duì)預(yù)測(cè)指標(biāo)的未來(lái)發(fā)展趨勢(shì)做出定量估計(jì)。時(shí)間序列是指依照時(shí)間次序紀(jì)錄隨機(jī)事件的變動(dòng)過(guò)程。時(shí)間序列分析就是對(duì)時(shí)間序列的變更規(guī)律進(jìn)行觀察和研究,對(duì)其未來(lái)趨向進(jìn)行估計(jì)。我們通進(jìn)諸多的歷史數(shù)據(jù)建立統(tǒng)計(jì)模型,用它來(lái)估計(jì)未來(lái)值。建立模型肯定會(huì)涉及到很多的參數(shù),那么首先就需要估計(jì)出模型的參數(shù)。最小二乘估計(jì)在線性模型參數(shù)化計(jì)中的地位舉足捏重,歸根結(jié)底是它具有線性無(wú)偏的特征。然而在如今的大數(shù)據(jù)時(shí)代,人們往往需要處理大型回歸問(wèn)題,隨著自變量個(gè)數(shù)的増多,復(fù)共線性問(wèn)題隨之而來(lái),這往往致使最小二乘估計(jì)的性質(zhì)很不好。如果從線性無(wú)偏估計(jì)擴(kuò)充到非線性估計(jì)或者有偏估計(jì),將無(wú)法體現(xiàn)出最小二乘估計(jì)的優(yōu)勢(shì)。于是,許多新的估計(jì)方法如主成分估計(jì)、嶺估汁、Lasso估計(jì)等被提出來(lái)。當(dāng)設(shè)計(jì)矩陣病態(tài)(即存在復(fù)共線性問(wèn)題)時(shí),嶺估計(jì)確實(shí)改進(jìn)了最小二乘估計(jì)。嶺估計(jì)引進(jìn)了一個(gè)有偏參數(shù),并且對(duì)該參數(shù)取適當(dāng)?shù)闹?,這樣就可W將由復(fù)共線性引發(fā)的估計(jì)誤差去除。嶺回歸估計(jì)使得模型的精確程度有了較大的提高,但與此同時(shí),偏差卻有了小規(guī)模的增大,且它使系數(shù)趨近于0但卻不完全為0,常常將模型中的所有變量都予W保留,當(dāng)自變量過(guò)多時(shí),它并不能給出一個(gè)簡(jiǎn)單且解釋性很強(qiáng)的模型。Lasso回舊本質(zhì)上是最小化殘差平方和,但必須W各系數(shù)的絕對(duì)值之和小于某個(gè)常數(shù)為前提條件。該回巧方法不僅能使系數(shù)趨近于0,甚至可W直接壓縮至0,能起到很好的變量選擇作用,模型的可解釋性較強(qiáng),送點(diǎn)明顯優(yōu)于嶺回歸。但是當(dāng)樣本數(shù)遠(yuǎn)少于自變量個(gè)數(shù)時(shí),模型又會(huì)出現(xiàn)過(guò)稀疏現(xiàn)象,從而得不到最優(yōu)的模型?,F(xiàn)在很多的時(shí)間序列都具有非線性的特點(diǎn),上幾種方法顯然無(wú)法滿足日益復(fù)雜的數(shù)據(jù)要求。支持向量機(jī)能夠很好地處理非線性和離維模式識(shí)別問(wèn)題,此方法的基礎(chǔ)是統(tǒng)計(jì)學(xué)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理和VC維理論,在處理非線性問(wèn)題的時(shí)候,將其轉(zhuǎn)換成高維空間中的線性問(wèn)題,其中的內(nèi)積運(yùn)算用核函數(shù)來(lái)代替,進(jìn)而復(fù)雜計(jì)算問(wèn)題得到化解,維數(shù)災(zāi)難封及局部極小難題也得到解決。3.2常用的誤差指標(biāo)先從簡(jiǎn)單的方法說(shuō)起。給定一個(gè)時(shí)間序列,要預(yù)測(cè)下一個(gè)的值是多少,最簡(jiǎn)單的思路是什么呢?(1)mean(平均值):未來(lái)值是歷史值的平均。(2)exponentialsmoothing(指數(shù)衰減):當(dāng)去平均值得時(shí)候,每個(gè)歷史點(diǎn)的權(quán)值可以不一樣。最自然的就是越近的點(diǎn)賦予越大的權(quán)重?;蛘撸奖愕膶?xiě)法,用變量頭上加個(gè)尖角表示估計(jì)值(3)snaive:假設(shè)已知數(shù)據(jù)的周期,那么就用前一個(gè)周期對(duì)應(yīng)的時(shí)刻作為下一個(gè)周期對(duì)應(yīng)時(shí)刻的預(yù)測(cè)值(4)drift:飄移,即用最后一個(gè)點(diǎn)的值加上數(shù)據(jù)的平均趨勢(shì)介紹完最簡(jiǎn)單的算法,下面開(kāi)始介紹兩個(gè)timeseries里面最火的兩個(gè)強(qiáng)大的算法:Holt-Winters和ARIMA。上面簡(jiǎn)答的算法都是這兩個(gè)算法的某種特例。(5)Holt-Winters:
三階指數(shù)平滑:
Holt-Winters的思想是把數(shù)據(jù)分解成三個(gè)成分:平均水平(level),趨勢(shì)(trend),周期性(seasonality)。R里面一個(gè)簡(jiǎn)單的函數(shù)stl就可以把原始數(shù)據(jù)進(jìn)行分解:一階Holt—Winters假設(shè)數(shù)據(jù)是stationary的(靜態(tài)分布),即是普通的指數(shù)平滑。二階算法假設(shè)數(shù)據(jù)有一個(gè)趨勢(shì),這個(gè)趨勢(shì)可以是加性的(additive,線性趨勢(shì)),也可以是乘性的(multiplicative,非線性趨勢(shì)),只是公式里面一個(gè)小小的不同而已。
三階算法在二階的假設(shè)基礎(chǔ)上,多了一個(gè)周期性的成分。同樣這個(gè)周期性成分可以是additive和multiplicative的。舉個(gè)例子,如果每個(gè)二月的人數(shù)都比往年增加1000人,這就是additive;如果每個(gè)二月的人數(shù)都比往年增加120%,那么就是multiplicative。對(duì)預(yù)測(cè)結(jié)果的精度和可靠性進(jìn)行評(píng)價(jià)是預(yù)測(cè)分析的重要組成部分,常用多項(xiàng)誤差形式來(lái)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),以此來(lái)判定各種預(yù)測(cè)方法的優(yōu)點(diǎn)和可行性,而只用某一項(xiàng)誤差指標(biāo)來(lái)評(píng)價(jià)預(yù)測(cè)結(jié)果是不可靠也不夠科學(xué)的,這里使用文獻(xiàn)中用到的常用的誤差指標(biāo)如下,其中否是序列在時(shí)刻的實(shí)際觀測(cè)值,又是序列在時(shí)刻的預(yù)測(cè)值:偏差:歸一化偏差:均方根誤差:標(biāo)準(zhǔn)偏差:當(dāng)然很多時(shí)候并不符合這個(gè)要求,例如這里的airlinepassenger數(shù)據(jù)。有很多方式對(duì)原始數(shù)據(jù)進(jìn)行變換可以使之stationary:(1)差分,即Integrated。例如一階差分是把原數(shù)列每一項(xiàng)減去前一項(xiàng)的值。二階差分是一階差分基礎(chǔ)上再來(lái)一次差分。這是最推薦的做法(2)先用某種函數(shù)大致擬合原始數(shù)據(jù),再用ARIMA處理剩余量。例如,先用一條直線擬合airlinepassenger的趨勢(shì),于是原始數(shù)據(jù)就變成了每個(gè)數(shù)據(jù)點(diǎn)離這條直線的偏移。再用ARIMA去擬合這些偏移量。(3)對(duì)原始數(shù)據(jù)取log或者開(kāi)根號(hào)。這對(duì)variance不是常數(shù)的很有效。如何看數(shù)據(jù)是不是stationary呢?這里就要用到兩個(gè)很常用的量了:ACF(autocorrelationfunction)和PACF(patialautocorrelationfunction)。對(duì)于non-stationary的數(shù)據(jù),ACF圖不會(huì)趨向于0,或者趨向0的速度很慢。下面是三張ACF圖,分別對(duì)應(yīng)原始數(shù)據(jù),一階差分原始數(shù)據(jù),去除周期性的一階差分?jǐn)?shù)據(jù):對(duì)海浪信號(hào)取不同時(shí)間段做預(yù)測(cè)的實(shí)驗(yàn)結(jié)果比較了預(yù)測(cè)步長(zhǎng)的增加對(duì)預(yù)測(cè)效果的影響外,還需要通過(guò)選取不同時(shí)間段進(jìn)行預(yù)測(cè)來(lái)比較這幾種預(yù)測(cè)方法的性能。經(jīng)過(guò)多次實(shí)驗(yàn),筆者發(fā)現(xiàn)對(duì)于不同的時(shí)間段,神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果都能保持比較高的精度,而,模型的預(yù)測(cè)精度要差很多。選取海浪信號(hào)的第到個(gè)數(shù)據(jù)做步預(yù)測(cè),其中第到的數(shù)據(jù)時(shí)序圖如下圖所示:由上面兩張表可以明顯的看出,在利用原始海浪數(shù)據(jù)的第1400-1449個(gè)數(shù)據(jù)進(jìn)行20步預(yù)測(cè),預(yù)測(cè)第1450-1469個(gè)數(shù)據(jù)時(shí),神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度遠(yuǎn)遠(yuǎn)高于線性模型。其中BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度最高,四種誤差值都最小,從圖3.35和圖3.36可以看出,BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值與觀測(cè)值非常接近,尤其是最后的5個(gè)點(diǎn),無(wú)論從取值還是趨勢(shì)上都非常接近。RBF其次,而線性模型AR,ARMA和ARIMA的預(yù)測(cè)誤差則增加很多,而且三者都有一個(gè)共同點(diǎn),就是最后五個(gè)值(從第1465-1469數(shù)據(jù))的預(yù)測(cè)值和趨勢(shì)偏離了海浪數(shù)據(jù)的原始觀測(cè)值,這幾個(gè)預(yù)測(cè)值幾乎無(wú)效。從運(yùn)行時(shí)一間上比較,此次預(yù)測(cè)中RBF的時(shí)間最短,BP其次,這兩個(gè)神經(jīng)網(wǎng)絡(luò)所用時(shí)間都小于三種線性模型。因此,在選取的樣本數(shù)據(jù)少的情況下,神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果要好于線性模型,而且所花時(shí)間也最短。從以上的實(shí)驗(yàn)結(jié)果中可以看出,這五種預(yù)測(cè)方法用于該均勻分布隨機(jī)數(shù)據(jù)的預(yù)測(cè)效果都不算理想。其中AR模型的預(yù)測(cè)效果要優(yōu)于另外兩種線性模型;ARIMA模型的預(yù)測(cè)精度比ARMA更高;BP網(wǎng)絡(luò)除了歸一化偏差外,其它誤差值都小于RBF網(wǎng)絡(luò);另外,在預(yù)測(cè)的20個(gè)數(shù)據(jù)中,神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的后面兩個(gè)數(shù)據(jù)比線性模型要更接近于實(shí)際值;盡管BP網(wǎng)絡(luò)的歸一化偏差,均方根誤差和標(biāo)準(zhǔn)偏差比AR和ARIMA模型更大,但從圖3.46中可以看出,BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值的上升和下降趨勢(shì)與實(shí)際值的上升、下降趨勢(shì)最接近。從運(yùn)行時(shí)間上比較,RBF神經(jīng)網(wǎng)絡(luò)依然保持最短,其次是BP網(wǎng)絡(luò);它們的運(yùn)行時(shí)間都小于三種線性模型,線性模型中AR模型運(yùn)行時(shí)間最短,ARIMA其次。從以上的實(shí)驗(yàn)結(jié)果中可以看出,這五種預(yù)測(cè)方法用于該均值為0,方差為1的高斯分布隨機(jī)數(shù)據(jù)的預(yù)測(cè)精度都不高,但對(duì)于前14個(gè)預(yù)測(cè)值,五種預(yù)測(cè)方法都能較好的預(yù)測(cè)出數(shù)據(jù)的變化趨勢(shì)。從運(yùn)行時(shí)間上比較,RBF最短,其次是BP網(wǎng)絡(luò),線性模型中AR模型的運(yùn)行時(shí)間最短。2丄3最小二乘估計(jì)的不足由上節(jié)可知最小二乘估計(jì)是線性無(wú)偏的,它有著很好的性質(zhì),但是也不能忽略它的不足之處:預(yù)測(cè)精度問(wèn)題。OLS的偏差很小,但其方差有可能很大;上面幾節(jié)分別用這五種時(shí)間序列預(yù)測(cè)方法對(duì)同一個(gè)海浪信號(hào)進(jìn)行了三種不同情況下的預(yù)測(cè)實(shí)驗(yàn),分別是:利用前2944個(gè)數(shù)據(jù)做20步預(yù)測(cè),預(yù)測(cè)第2945-2964個(gè)數(shù)據(jù)(神經(jīng)網(wǎng)絡(luò)選取第2401-2944個(gè)數(shù)據(jù)作為樣本數(shù)據(jù));利用前2944個(gè)數(shù)據(jù)做30步預(yù)測(cè),預(yù)測(cè)第2945-2974個(gè)數(shù)據(jù)(神經(jīng)網(wǎng)絡(luò)選取第2401-2944個(gè)數(shù)據(jù)作為樣本數(shù)據(jù));利用第1400-1449個(gè)數(shù)據(jù)進(jìn)行20步預(yù)測(cè),預(yù)測(cè)第1450-1469個(gè)數(shù)據(jù)。得到的偏差、歸一化偏差、均方根誤差和標(biāo)準(zhǔn)偏差分別如表3.4、表3.6和表3.8所示,比較誤差值和預(yù)測(cè)值與觀測(cè)值的擬合曲線可以得出:(1)當(dāng)利用前2944個(gè)數(shù)據(jù)做20步預(yù)測(cè)時(shí),ARIMA模型的預(yù)測(cè)結(jié)果最好,其次是BP神經(jīng)網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)。但預(yù)測(cè)步長(zhǎng)由20增加到30時(shí),神經(jīng)網(wǎng)絡(luò)就能體現(xiàn)出比另外三種線性模型更高的預(yù)測(cè)精度,預(yù)測(cè)誤差隨著預(yù)測(cè)步長(zhǎng)增加而增加的幅度要遠(yuǎn)小于AR,ARMA和ARIMA模型。另外在這三種線性模型中,ARIMA一直保持比另外兩種更好的預(yù)測(cè)效果,預(yù)測(cè)的步長(zhǎng)能到達(dá)更長(zhǎng)。(2)當(dāng)取出2974個(gè)歷史數(shù)據(jù)中的任意時(shí)間段進(jìn)行預(yù)測(cè)時(shí),發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)一直能保持比較滿意的預(yù)測(cè)效果。論文以第1400-1449個(gè)數(shù)據(jù)預(yù)測(cè)第1450-1469個(gè)數(shù)據(jù)為例做了比較,AR,ARMA和ARIMA在預(yù)測(cè)的前15個(gè)點(diǎn)中的效果還可以,但是后面的5個(gè)數(shù)據(jù)偏離原始觀測(cè)值很多,趨勢(shì)也不對(duì)。而B(niǎo)P神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)都能得到很好的預(yù)測(cè)精度,四種誤差的取值都遠(yuǎn)小于另外只個(gè)線性模型,且無(wú)論從取值還是上升或下降的趨勢(shì)上都能與原始觀測(cè)值非常的接近,運(yùn)行時(shí)間也比三種線性模型短。同時(shí),本章利用計(jì)算機(jī)生成了兩個(gè)隨機(jī)數(shù)據(jù)序列,一個(gè)是服從區(qū)間【0,1]上的均勻分布數(shù)據(jù);另一個(gè)是服從均值為0,方差為I的高斯分布數(shù)據(jù)。分別利用五種預(yù)測(cè)方法對(duì)它們進(jìn)行預(yù)測(cè),取前80個(gè)數(shù)據(jù)做20步預(yù)測(cè),預(yù)測(cè)第81-100個(gè)數(shù)據(jù)。從預(yù)測(cè)的結(jié)果中看出,這兩類數(shù)據(jù)的預(yù)測(cè)精度都不理想,誤差較大,而且神經(jīng)網(wǎng)絡(luò)相對(duì)于線性模型,除了運(yùn)行時(shí)問(wèn)最短之外并沒(méi)有體現(xiàn)明顯的優(yōu)勢(shì)。但是對(duì)于這兩類數(shù)據(jù),在短期預(yù)測(cè)內(nèi),線性模型和神經(jīng)網(wǎng)絡(luò)都能較好的預(yù)測(cè)出數(shù)據(jù)的變化趨勢(shì)。因此當(dāng)給定的樣本數(shù)據(jù)足夠大,進(jìn)行短期預(yù)測(cè)時(shí),AR,ARMA和ARIMA的效果都不錯(cuò),可以用來(lái)對(duì)線性時(shí)間序列進(jìn)行預(yù)測(cè),但是預(yù)測(cè)的步長(zhǎng)有一定的限制。從上面的實(shí)驗(yàn)可以看出AR模型有時(shí)候能得到比ARMA模型更好的預(yù)測(cè)效果,這是因?yàn)閷?duì)于不同的時(shí)間序列有它所適合的模型,在進(jìn)行預(yù)測(cè)之前,需要通過(guò)時(shí)間序列的自相關(guān)函數(shù)的統(tǒng)計(jì)特性進(jìn)行判別,確定最適合的模型進(jìn)行預(yù)測(cè)。本次論文用的海浪數(shù)據(jù)本身就沒(méi)有明顯的增長(zhǎng)或衰減趨勢(shì),因此這里使用ARIMA模型預(yù)測(cè)的效果并沒(méi)有體現(xiàn)出很大的優(yōu)勢(shì)。神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)步長(zhǎng)可以達(dá)到比AR,ARMA和ARIMA更長(zhǎng);雖然在選取同樣長(zhǎng)的樣本數(shù)據(jù)做預(yù)測(cè)時(shí),神經(jīng)網(wǎng)絡(luò)花費(fèi)的時(shí)間長(zhǎng),但可以在保持較高預(yù)測(cè)精度時(shí)相應(yīng)的減少樣本數(shù)據(jù),這樣可以使得預(yù)測(cè)的時(shí)間短很多,提高了實(shí)時(shí)性。時(shí)間序列短期預(yù)測(cè)系統(tǒng)是利用MATLAB中的GUI界面開(kāi)發(fā)的,主要通過(guò)MATLAB中的GUIDE向?qū)?lái)建立和設(shè)計(jì)系統(tǒng)。在建立該系統(tǒng)的過(guò)程中,主要有兩個(gè)部分:第一是在GUI的對(duì)象設(shè)計(jì)編輯器(LayoutEditor)界面上布局控件位置以及完成控件屬性的設(shè)置。第二是GUI編程,在對(duì)應(yīng)的M文件中編寫(xiě)代碼,控制界面中的控件響應(yīng)用戶的行為,實(shí)現(xiàn)系統(tǒng)的整個(gè)功能。此系統(tǒng)主要功能有:輸入界面方便用戶自主的輸入待預(yù)測(cè)的時(shí)間序列名、預(yù)測(cè)步長(zhǎng)、選擇用來(lái)預(yù)測(cè)的樣本數(shù)據(jù)段以及預(yù)測(cè)方法;對(duì)于不同的預(yù)測(cè)方法所需要的參數(shù),會(huì)自動(dòng)跳出對(duì)話框供用戶輸入變量;輸出界面中直觀地顯示四種誤差指標(biāo)的值,預(yù)測(cè)值與觀測(cè)值的比較和預(yù)測(cè)的誤差值,并且將預(yù)測(cè)值存入一個(gè)“.dat"文件。這些功能方便用戶在系統(tǒng)上對(duì)五種預(yù)測(cè)方法進(jìn)行實(shí)驗(yàn)比較分析,并且可以自由設(shè)置預(yù)測(cè)方法的參數(shù)。在本次論文的實(shí)驗(yàn)中,線性模型AR,ARMA和ARIMA的預(yù)測(cè)步長(zhǎng)不能達(dá)到很長(zhǎng),但對(duì)海浪信號(hào)的短期預(yù)測(cè)還是非常有效的,而神經(jīng)網(wǎng)絡(luò)則碰到以下問(wèn)題:(1)BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果不穩(wěn)定,這源于神經(jīng)網(wǎng)絡(luò)算法易陷入局部最小點(diǎn)的缺陷。在BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)中,筆者利用init()函數(shù)對(duì)創(chuàng)建好的網(wǎng)絡(luò)進(jìn)行初始化,而這個(gè)初始化是隨機(jī)的,因此造成了每次運(yùn)行的結(jié)果不一樣,不能每次都得到很高的預(yù)測(cè)精度。為了避免因?yàn)槌跏贾档牟缓枚绊戭A(yù)測(cè)效果,筆者在程序中定義了一個(gè)目標(biāo)誤差,只有當(dāng)小于這個(gè)誤差值時(shí),才利用此時(shí)的網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),這在一定程度上避免了BP網(wǎng)絡(luò)的不穩(wěn)定性,但運(yùn)行時(shí)間又得不到保證,有的時(shí)候會(huì)耗上很長(zhǎng)時(shí)間才能達(dá)到較好的預(yù)測(cè)精度,這樣就不利于網(wǎng)絡(luò)的在線適應(yīng)性,實(shí)時(shí)性能差。(2)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)時(shí),隱層的神經(jīng)元數(shù)目選擇對(duì)預(yù)測(cè)精度有很大影響,而目前隱層的神經(jīng)元數(shù)目還沒(méi)有通用的理論方法,根據(jù)設(shè)計(jì)者的經(jīng)驗(yàn)和多次實(shí)驗(yàn)來(lái)確定,一般都采用試湊法的方式進(jìn)行選擇,這也就影響了最終的預(yù)測(cè)精度。本文雖然在時(shí)間序列預(yù)測(cè)上對(duì)幾種方法進(jìn)行了總結(jié)和實(shí)驗(yàn)比較,但是還有一些問(wèn)題需要繼續(xù)深入的研究,比如線性模型的識(shí)別及這幾種預(yù)測(cè)方法的改進(jìn)。四總結(jié)作用可以反映社會(huì)經(jīng)濟(jì)現(xiàn)象的發(fā)展變化過(guò)程,描述現(xiàn)象的發(fā)展?fàn)顟B(tài)和結(jié)果??梢匝芯可鐣?huì)經(jīng)濟(jì)現(xiàn)象的發(fā)展趨勢(shì)和發(fā)展速度??梢蕴剿鳜F(xiàn)象發(fā)展變化的規(guī)律,對(duì)某些社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行預(yù)測(cè)。利用時(shí)間序列可以在不同地區(qū)或國(guó)家之間進(jìn)行對(duì)比分析,這也是統(tǒng)計(jì)分析的重要方法之一。線性模型有很多時(shí)候用于非線性時(shí)間序列分析中,但結(jié)果并不理想,因此有很多基于這些方法的改進(jìn),比如:可以將希爾伯特一黃變換(HHT)31中的經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)與AR模型結(jié)合使用,對(duì)時(shí)間序列進(jìn)行預(yù)測(cè)。經(jīng)驗(yàn)?zāi)B(tài)分解的特點(diǎn)是能夠?qū)Ψ蔷€性,非平穩(wěn)過(guò)程的數(shù)據(jù)進(jìn)行線性化和平穩(wěn)化處理,并在分解的過(guò)程中保留數(shù)據(jù)本身的特性,能夠在不改變?cè)瓟?shù)據(jù)物理特性的前提下代替原數(shù)據(jù)。它可以把一個(gè)非線性,非平穩(wěn)的信號(hào)系統(tǒng)分解為幾個(gè)線性的、平穩(wěn)的分量和一個(gè)單調(diào)的余項(xiàng)。此時(shí),可以利用EMD將信號(hào)分解為幾個(gè)IMF,然后建立每個(gè)IMF的自回歸模型,分別預(yù)測(cè),再把預(yù)測(cè)的結(jié)果加和。目前有很多文獻(xiàn)已經(jīng)將這種方法應(yīng)用到時(shí)間序列預(yù)測(cè)中。介紹了基于EMD和AR模型用于船舶運(yùn)動(dòng)極短期預(yù)報(bào),證明了方法是可行的。另外,本文中建立的線性模型參數(shù)都由歷史樣本數(shù)據(jù)確定,當(dāng)預(yù)測(cè)步長(zhǎng)增加時(shí),固定的模型參數(shù)可能導(dǎo)致誤差增加的更快,因此,可以在每進(jìn)行一步預(yù)測(cè)之后,將預(yù)測(cè)值加入到原始樣本數(shù)據(jù)中重新估計(jì)模型參數(shù)。本文在建立BP神經(jīng)網(wǎng)絡(luò)模型時(shí),對(duì)神經(jīng)元節(jié)點(diǎn)的傳遞函數(shù)沒(méi)有進(jìn)行深入研究,隱含層的神經(jīng)元個(gè)數(shù)也是用試湊法確定,沒(méi)有理論依據(jù),缺乏科學(xué)性,而為了達(dá)到比較好的預(yù)測(cè)精度,筆者采用的方法運(yùn)行時(shí)間相對(duì)較長(zhǎng),這些都需要進(jìn)一步的改進(jìn)。神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)過(guò)程中有個(gè)缺陷就是容易陷入局部最優(yōu),預(yù)測(cè)結(jié)果不穩(wěn)定,可以利用遺傳算法來(lái)優(yōu)化神經(jīng)網(wǎng)絡(luò),避免陷入局部最優(yōu),提高預(yù)測(cè)效果和預(yù)測(cè)的穩(wěn)定性。參考文獻(xiàn)[1】E.P.Box,G.M.Jerkins,G.C.Reinsel,時(shí)間序列分析:預(yù)測(cè)與控制,中國(guó)統(tǒng)計(jì)出版社,1999.[2】安鴻志,陳兆國(guó),杜金觀,潘一民.時(shí)間序列的分析與應(yīng)用[M).北京:科學(xué)出版社,198
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版墓地使用權(quán)轉(zhuǎn)售與墓園維護(hù)服務(wù)合同4篇
- 2025版園藝樹(shù)苗種植合作合同范本范文3篇
- 安徽省蕪湖市無(wú)為市2024-2025學(xué)年七年級(jí)上學(xué)期期末地理試題(含答案)
- 儀器儀表在智能娛樂(lè)與虛擬現(xiàn)實(shí)體驗(yàn)中的應(yīng)用考核試卷
- 小麥種植農(nóng)業(yè)土地流轉(zhuǎn)研究考核試卷
- 二零二五年度木雕工藝研發(fā)與創(chuàng)新合作合同4篇
- 2025年受歡迎廣告協(xié)議指南大揭秘攻略
- 2025年化工品批發(fā)合同
- 2025年孕婦健身指導(dǎo)服務(wù)協(xié)議
- 2025年高端紙質(zhì)信封印刷定制委托協(xié)議6篇
- 2025年上半年江蘇連云港灌云縣招聘“鄉(xiāng)村振興專干”16人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- DB3301T 0382-2022 公共資源交易開(kāi)評(píng)標(biāo)數(shù)字見(jiàn)證服務(wù)規(guī)范
- 人教版2024-2025學(xué)年八年級(jí)上學(xué)期數(shù)學(xué)期末壓軸題練習(xí)
- 江蘇省無(wú)錫市2023-2024學(xué)年八年級(jí)上學(xué)期期末數(shù)學(xué)試題(原卷版)
- 俄語(yǔ)版:中國(guó)文化概論之中國(guó)的傳統(tǒng)節(jié)日
- 2022年湖南省公務(wù)員錄用考試《申論》真題(縣鄉(xiāng)卷)及答案解析
- 婦科一病一品護(hù)理匯報(bào)
- 2024年全國(guó)統(tǒng)一高考數(shù)學(xué)試卷(新高考Ⅱ)含答案
- 移動(dòng)商務(wù)內(nèi)容運(yùn)營(yíng)(吳洪貴)任務(wù)四 引起受眾傳播內(nèi)容要素的掌控
- 繪本《汪汪的生日派對(duì)》
- 助產(chǎn)護(hù)理畢業(yè)論文
評(píng)論
0/150
提交評(píng)論