




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、摘要: 所有移動平均法都存在很多問題。它們都太難計算了。每個點的計算都讓你絞盡腦汁。而且也不能通過之前的計算結(jié)果推算出加權(quán)移動平均值。移動平均值永遠不可能應用于現(xiàn)有的數(shù)據(jù)集邊緣的數(shù)據(jù),因為它們的窗口寬度是有限 .所有移動平均法都存在很多問題。它們都太難計算了。每個點的計算都讓你絞盡腦汁。而且也不能通過之前的計算結(jié)果推算出加權(quán)移動平均值。移動平均值永遠不可能應用于現(xiàn)有的數(shù)據(jù)集邊緣的數(shù)據(jù),因為它們的窗口寬度是有限的。這是一個大問題,因為數(shù)據(jù)集邊緣的變動形態(tài)一般都是我們最感興趣的部分。類似地,移動平均法也不能應用于現(xiàn)有數(shù)據(jù)集的范圍之外。其結(jié)果是,它們對預測毫無用處。幸運的是,有一種很簡單的計算方案能
2、夠避免所有這些問題。它叫指數(shù)平滑法(exponential smoothing)或Holt-Winters法。指數(shù)平滑法有幾種不同形式:一次指數(shù)平滑法針對沒有趨勢和季節(jié)性的序列,二次指數(shù)平滑法針對有趨勢但 沒有季節(jié)性的序列。術(shù)語“Holt-Winters法”有時特指三次指數(shù)平滑法。所有的指數(shù)平滑法都要更新上一時間步長的計算結(jié)果,并使用當前時間步長的數(shù)據(jù)中包含的新信息。它們通過“混合”新信息和舊信息來實現(xiàn),而相關(guān)的新舊信息的權(quán)重由一個可調(diào)整的拌和參數(shù)來控制。各種方法的不同之處在于它們跟蹤的量的個數(shù)和對應的拌和參數(shù)的個數(shù)。一次指數(shù)平滑法的遞推關(guān)系特別簡單: 其中, 是時間步長i上經(jīng)過平滑
3、后的值, 是這個時間步長上的實際(未平滑的)數(shù)據(jù)。你可以看到 是怎么由原始數(shù)據(jù)和上一時間步長的平滑值 混合而成的。拌和參數(shù) 可以是0和1之間的任意值,它控制著新舊信息之間的平衡:當 接近1時,我們就只保留當前數(shù)據(jù)點(即完全沒有對序列進行平滑);當 接近0時,我們就只保留前面的平滑值(也就是說整個曲線都是平的)。為何這個方法被稱為“指數(shù)”平滑法?要找出答案,展開它的遞推關(guān)系式即可知道: 從這里可以看出,在指數(shù)平滑法中,所有先前的觀測值都對當前平滑值產(chǎn)生了影響,但它們所起的作用隨著參數(shù) 的冪的增大而逐漸減小。那些相對較早的觀測值所起的作用相對較小,這也就是指數(shù)變動形態(tài)所表現(xiàn)出來的特性。
4、從某種程度上來說,指數(shù)平滑法就像是擁有無限記 憶且權(quán)值呈指數(shù)級遞減的移動平均法。(同時也要注意到所有權(quán)值的和,等于1,因為當q<1 時,幾何序列 。參見附錄B的幾何序列方面的信息。)一次指數(shù)平滑所得的計算結(jié)果可以在數(shù)據(jù)集范圍之外進行擴展,因此也就可以用來進行預測。預測也非常簡單: 其中, 是最后一個已經(jīng)算出來的值。也就是說,一次指數(shù)平滑法得出的預測在任何時候都是一條直線。剛剛描述的一次指數(shù)平滑法適用于沒有總體趨勢的時間序列。如果用來處理有總體趨勢的序列,平滑值將往往滯后于原始數(shù)據(jù),除非 的值接近1,但這樣一來就會造成不夠平滑。二次指數(shù)平滑法保留了趨勢的詳細信息,從而改
5、正了這個缺點。換句話說,我們保留并更新兩個量的狀態(tài):平滑后的信號和平滑后的趨勢。它有兩個等式和兩個拌合參數(shù): 我們先看看第二個等式。這個等式描述了平滑后的趨勢。當前趨勢的未平滑“值”是當前平滑值和上一個平滑值的差;也就是說,當前趨勢告訴我們在上一個 時間步長里平滑信號改變了多少。要想使趨勢平滑,我們用一次指數(shù)平滑法對趨勢進行處理,并使用拌合參數(shù) 。為獲得平滑信號,我們像上次那樣進行一次混合,但要同時考慮到上一個平滑信號及趨勢。第一個等式的最后那個項可以對當前平滑信號進行估計假設在單個 時間步長里我們保持著上一個趨勢。若要利用該計算結(jié)果進行預測,我們就取最后那個平滑值,然后每增加一個時
6、間步長,就在該平滑值上增加一次最后那個平滑趨勢: 最后,我們給三次指數(shù)平滑法添加第三個量,用來描述季節(jié)性。我們有必要區(qū)分一下累加式和累乘式季節(jié)性,累加式對應的等式: 累乘式的等式: 其中,pi 是指“周期性”部分, 是這個周期的長度。前面的等式中也包含預測的等式。所有的指數(shù)平滑方法都是基于遞推關(guān)系的,這表明我們要先設定初始值才能使用它們。選擇什么樣的初始值并不特別重要:指數(shù)式衰減規(guī)律說明所有的指數(shù)平滑方法的“記憶”能力都是很短的,只需經(jīng)過幾個時間步長,初始值的影響就會變得微乎其微。一些合理的初始值: 且 對三次指數(shù)平滑法而言,我們必須初始化一個
7、完整的“季節(jié)”的值,不過我們可以簡單地設置為全1(針對累乘式)或全0(針對累加式)。只有當序列的長度較短時,我們才需要慎重考慮初始值的選取。最后一個問題是如何選擇拌合參數(shù)。 我的建議是反復試驗。先試試0.2和0.4之間的幾個值(非常粗略地),然后看看會得到什么結(jié)果?;蛘咭部梢詾?實際數(shù)據(jù)和平滑算法的結(jié)果之間的)誤差定 義一個標準,再使用一個數(shù)值優(yōu)化過程來將誤差最小化。就我的經(jīng)驗而言,一般沒有必要弄得這么麻煩,原因至少有兩個:數(shù)值優(yōu)化是一個不能保證收斂的迭代過 程,最終你可能還需要花非常多時間將算法設計成收斂的。此外,任何這樣的數(shù)值優(yōu)化都受限于你選對誤差進行最小化的表達式。問題是使誤差最小化的參
8、數(shù)值可能 并不能滿足在解決方案中你想要看到的其他特性(也就是近似值的精確性和結(jié)果曲線的平滑程度之間的平衡),那么,到最后你才會發(fā)現(xiàn),手動的計算方法往往更 好。不過,如果你要預測很多序列,花些精力構(gòu)建一個能自動決定最優(yōu)參數(shù)值的系統(tǒng)也是值得的,但要實現(xiàn)這個系統(tǒng)恐怕也并不容易。最后,我想用一個例子來展示我們想從指數(shù)平滑法得到的結(jié)果。下圖是一個經(jīng)典的數(shù)據(jù)集,它顯示的是每個月國際航班的旅客數(shù)量(單位:千人) 。該圖顯示了實際數(shù)據(jù)和三次指數(shù)近似值。19491957年用來“訓練”生成它的算法,而19581960年都是預測數(shù)值。注意,這里的預測值與實際 數(shù)據(jù)相當接近特別是它強烈的季節(jié)形態(tài)持續(xù)了一段如此長的預測
9、時段(整整三年!)。對于像這樣簡單的方法來說,是很不錯的。時間序列挖掘-預測算法-三次指數(shù)平滑法(Holt-Winters)在時間序列中,我們需要基于該時間序列當前已有的數(shù)據(jù)來預測其在之后的走勢,三次指數(shù)平滑(Triple/Three Order Exponential Smoothing,Holt-Winters)算法可以很好的進行時間序列的預測。 時間序列數(shù)據(jù)一般有以下幾種特點:1.趨勢(Trend) 2. 季節(jié)性(Seasonality)。 趨勢描述的是時間序列的整體走勢,比如總體上升或者總體下降。下圖所示的時間序列是總體上升的:
10、0; 季節(jié)性描述的是數(shù)據(jù)的周期性波動,比如以年或者周為周期,如下圖: 三次指數(shù)平滑算法可以對同時含有趨勢和季節(jié)性的時間序列進行預測,該算法是基于一次指數(shù)平滑和二次指數(shù)平滑算法的。 一次指數(shù)平滑算法基于以下的遞推關(guān)系: si=xi+(1-)si-1 其中是平滑參數(shù),si是之前i個數(shù)據(jù)的平滑值,取值
11、為0,1,越接近1,平滑后的值越接近當前時間的數(shù)據(jù)值,數(shù)據(jù)越不平滑,越接近0,平滑后的值越接近前i個數(shù)據(jù)的平滑值,數(shù)據(jù)越平滑,的值通??梢远鄧L試幾次以達到最佳效果。 一次指數(shù)平滑算法進行預測的公式為:xi+h=si,其中i為當前最后的一個數(shù)據(jù)記錄的坐標,亦即預測的時間序列為一條直線,不能反映時間序列的趨勢和季節(jié)性。 二次指數(shù)平滑保留了趨勢的信息,使得預測的時間序列可以包含之前數(shù)據(jù)的趨勢。二次指數(shù)平滑通過添加一個新的變量t來表示平滑后的趨勢: si=xi+(1-)(si-1+ti-1) ti=ß(si-si-1)+(1-
12、3;)ti-1 二次指數(shù)平滑的預測公式為 xi+h=si+hti 二次指數(shù)平滑的預測結(jié)果是一條斜的直線。 三次指數(shù)平滑在二次指數(shù)平滑的基礎(chǔ)上保留了季節(jié)性的信息,使得其可以預測帶有季節(jié)性的時間序列。三次指數(shù)平滑添加了一個新的參數(shù)p來表示平滑后的趨勢。 三次指數(shù)平滑有累加和累乘兩種方法,下面是累加的三次指數(shù)平滑 si=(xi-pi-k)+(1-)(si-1+ti-1) ti=ß(si-si-1)+(1-ß)ti-1 pi=(xi-si)+(1-)pi-k
13、0;其中k為周期 累加三次指數(shù)平滑的預測公式為: xi+h=si+hti+pi-k+(h mod k) 注意:數(shù)據(jù)之魅P88此處有錯誤,根據(jù)Wikipedia修正。下式為累乘的三次指數(shù)平滑: si=xi/pi-k+(1-)(si-1+ti-1) ti=ß(si-si-1)+(1-ß)ti-1 pi=xi/si+(1-)pi-k 其中k為周期 累乘三次指數(shù)平滑的預測公式為: xi+h=(si+hti)pi-k+(h mod k) 注意:數(shù)據(jù)之魅P88此處有錯誤,
14、根據(jù)Wikipedia修正。 ,ß,的值都位于0,1之間,可以多試驗幾次以達到最佳效果。 s,t,p初始值的選取對于算法整體的影響不是特別大,通常的取值為s0=x0,t0=x1-x0,累加時p=0,累乘時p=1. 我們使用DataMarket的International Airline Passengers數(shù)據(jù)來測試累加和累乘三次指數(shù)平滑算法的性能,該數(shù)據(jù)記錄的是每月的國際航線乘客數(shù): 下圖為使用累加三次指數(shù)平滑進行預測的效果:其中紅色為源時間序列,藍色為預測的時間序列,ß,的取值為0.45,0.2,0.95: 下圖為累乘三次指數(shù)平滑進行預測的效果,ß,的取值為0.4,0.05,0.9:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 某集團人力資源數(shù)據(jù)統(tǒng)計標準
- 模型自動化分析與優(yōu)化
- 內(nèi)鏡室醫(yī)院感染管理制度
- 免疫熒光檢測
- 重慶市司法局選任人民監(jiān)督員考試真題2025含答案
- 臨沂市保安員考試試題
- 老年高血壓健康指導課件
- 海洋油氣輸送管道建設
- 老年護理課件下載
- 老年護理職業(yè)培訓課件
- 工程預算審核報告回復函
- 醫(yī)藥行業(yè)銷售流程與培訓手冊
- 深信服aES產(chǎn)品技術(shù)白皮書-V1.5
- 農(nóng)商銀行貸款合同電子版
- 低壓電氣基礎(chǔ)知識培訓電工-電氣工程師
- 翼狀胬肉術(shù)后護理
- 《目視化管理》課件
- 營銷策劃 -阿那亞品牌手冊
- 醫(yī)院中層干部培訓課件
- ERP車間管理模塊操作培訓手冊
- 企業(yè)消防安全培訓課件
評論
0/150
提交評論