時間序列分析-吳喜之_第1頁
時間序列分析-吳喜之_第2頁
時間序列分析-吳喜之_第3頁
時間序列分析-吳喜之_第4頁
時間序列分析-吳喜之_第5頁
已閱讀5頁,還剩136頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1時間序列分析時間序列分析考慮考慮 何為科學? 何為統(tǒng)計? 統(tǒng)計是科學嗎? 什么是數(shù)學? 統(tǒng)計是數(shù)學嗎? 能夠證明某些模型或理論是正確的嗎?2Stat 153, Xizhi Wu自然現(xiàn)象引入模型-擬合模型或理論到數(shù)據(jù)解釋和預測統(tǒng)計 歸納歸納: 從部分到總體,從特殊到一般的推理從部分到總體,從特殊到一般的推理. 演繹演繹: 基于假定,公理的嚴格的證明鏈基于假定,公理的嚴格的證明鏈. 3Stat 153, Xizhi Wu時間序列的例子。從圖形你會時間序列的例子。從圖形你會想到想到: 數(shù)據(jù)會是什么樣子的, 可能的模式及它們的意義, 可能的預測,如何點圖, 4Stat 153, Xizhi WuEx

2、amples: Economic and financial time series Beverage wheat price annual index series from 1500-1864 T01.RBeveridge wheat price annual index series from 1500 to 1864Timewheat price index150016001700180001002003005Stat 153, Xizhi WuExamples: Economic and financial time series Beverage wheat price annua

3、l index series from 1810-1864 T01.RBeveridge wheat price annual index series from 1810 to 1864Timewheat price index18101820183018401850186018701502002503003506Stat 153, Xizhi WuExamples: Physical time seriesAverage air temperature (deg C) at Recife, Brazil, in successive months from 1953-1962T01.R A

4、verage air temperature (deg C) at Recife, Brazil, in successive months from 1953-1962YearTemperature (deg C)1954195619581960196224252627287Stat 153, Xizhi WuExamples: Marketing time series Sales of an industrial beater in successive months from January 1965 to November 1971.T01.R Sales of an industr

5、ial beater in successive months from January 1965 to November 1971YearNumber of sales196519661967196819691970197119722004006008008Stat 153, Xizhi WuExamples: Finance The Percentage of Beijing Residents Long-term Deposit Over the Total BalanceT01.RThe Percentage of Beijing Residents Long-term Deposit

6、 Over the Total BalanceyearLong-Term Debosit Ratio195019601970198019906570758085909Stat 153, Xizhi WuExamples: Process control dataT01.R050100150200-4-2024Normal ProcessTimeProcess Variable050100150200-4-2024Abnormal ProcessTimeProcess Variable10Stat 153, Xizhi WuExamples: Binary processT01.R0510152

7、0-0.20.00.20.40.60.81.01.211Stat 153, Xizhi WuExamples: Point processT01.R05101520Time12Stat 153, Xizhi Wu你有時間序列的例子嗎?13Stat 153, Xizhi Wu術語術語 連續(xù)連續(xù)時間序列 離散離散時間序列 通常是等間距等間距的: 抽樣抽樣的序列 即時即時的或整合整合的 通常不是不是獨立的 確定確定的或隨機的隨機的 (精確預測是不可能的)14Stat 153, Xizhi Wu看看這個時間序列Passengers in Chinas AirportsNumber of Passeng

8、ers in Airports of China, Jan 1995-Mar 2003TimeNumber of Passengers19961998200020020500000100000015000002000000250000015Stat 153, Xizhi Wu看看這個時間序列Passengers in Chinas AirportsNumber of Passengers in Airports of China, Jan 1995-Dec 2003TimeNumber of Passengers19961998200020022004050000010000001500000

9、2000000250000016Stat 153, Xizhi Wu17橫截面數(shù)據(jù)時間序列數(shù)據(jù)橫截面數(shù)據(jù)時間序列數(shù)據(jù) 人們對統(tǒng)計數(shù)據(jù)往往可以根據(jù)其特點從兩人們對統(tǒng)計數(shù)據(jù)往往可以根據(jù)其特點從兩個方面來切入,以簡化分析過程。一個是個方面來切入,以簡化分析過程。一個是研究所謂橫截面研究所謂橫截面(cross section)數(shù)據(jù),也就數(shù)據(jù),也就是對大體上同時,或者和時間無關的不同是對大體上同時,或者和時間無關的不同對象的觀測值組成的數(shù)據(jù)。對象的觀測值組成的數(shù)據(jù)。 另一個稱為時間序列另一個稱為時間序列(time series),也就是,也就是由對象在不同時間的觀測值形成的數(shù)據(jù)。由對象在不同時間的觀測值

10、形成的數(shù)據(jù)。 前面討論的模型多是和橫截面數(shù)據(jù)有關。前面討論的模型多是和橫截面數(shù)據(jù)有關。這里將討論時間序列的分析。我們將不討這里將討論時間序列的分析。我們將不討論更加復雜的包含這兩方面的數(shù)據(jù)。論更加復雜的包含這兩方面的數(shù)據(jù)。 18時間序列和回歸時間序列和回歸 時間序列分析也是一種回歸。時間序列分析也是一種回歸。 回歸分析的目的是建立因變量和自變量之間關系回歸分析的目的是建立因變量和自變量之間關系的模型;并且可以用自變量來對因變量進行預測。的模型;并且可以用自變量來對因變量進行預測。通常線性回歸分析因變量的觀測值假定是互相獨通常線性回歸分析因變量的觀測值假定是互相獨立并且有同樣分布。立并且有同樣分

11、布。 而時間序列的最大特點是觀測值并不獨立。時間而時間序列的最大特點是觀測值并不獨立。時間序列的一個目的是用變量過去的觀測值來預測同序列的一個目的是用變量過去的觀測值來預測同一變量的未來值。也就是說,時間序列的因變量一變量的未來值。也就是說,時間序列的因變量為變量未來的可能值,而用來預測的自變量中就為變量未來的可能值,而用來預測的自變量中就包含該變量的一系列歷史觀測值。包含該變量的一系列歷史觀測值。 當然時間序列的自變量也可能包含隨著時間度量當然時間序列的自變量也可能包含隨著時間度量的獨立變量。的獨立變量。19例例15.1 (數(shù)據(jù):數(shù)據(jù):Tax.txt,Tax.sav)某地從某地從1995年年

12、1月到月到2005年年7月的稅收(單位:萬元)。該數(shù)據(jù)有月的稅收(單位:萬元)。該數(shù)據(jù)有按照時間順序的按月記錄,共按照時間順序的按月記錄,共127個觀測值。個觀測值。圖圖15.1就是由該數(shù)據(jù)就是由該數(shù)據(jù)得到的一個時間序列圖。得到的一個時間序列圖。 TimeTax199619982000200220042 e+054 e+056 e+058 e+051 e+0620例例15.1 (數(shù)據(jù):數(shù)據(jù):Tax.txt,Tax.sav)從這個點圖可以看出??偟内厔菔窃鲩L的,但增長并不是單調上升的;有漲有落。大體上看,這種升降不是雜亂無章的,和季節(jié)或月份的周期有關系。當然,除了增長的趨勢和季節(jié)影響之外,還有些

13、無規(guī)律的隨機因素的作用。這個只有一種隨著時間變化的變量(稅收)的序列一般稱為純粹時間序列純粹時間序列(pure time series)。下面將通過該例子對純粹時間序列進行介紹。21時間序列的組成部分時間序列的組成部分 從該例可以看出,該時間序列可以有三部從該例可以看出,該時間序列可以有三部分組成:趨勢分組成:趨勢(trend)、季節(jié)、季節(jié)(seasonal)成分成分和無法用趨勢和季節(jié)模式解釋的隨機干擾和無法用趨勢和季節(jié)模式解釋的隨機干擾(disturbance)。)。 例中數(shù)據(jù)的稅收就就可以用這三個成分疊例中數(shù)據(jù)的稅收就就可以用這三個成分疊加而成的模型來描述。加而成的模型來描述。 一般的時間

14、序列還可能有循環(huán)或波動一般的時間序列還可能有循環(huán)或波動(Cyclic, or fluctuations)成分;循環(huán)模式和成分;循環(huán)模式和有規(guī)律的季節(jié)模式不同,周期長短不一定有規(guī)律的季節(jié)模式不同,周期長短不一定固定。比如經(jīng)濟危機周期,金融危機周期固定。比如經(jīng)濟危機周期,金融危機周期等等。等等。22時間序列的組成部分時間序列的組成部分 一個時間序列可能有趨勢、季節(jié)、循環(huán)這一個時間序列可能有趨勢、季節(jié)、循環(huán)這三個成分中的某些或全部再加上隨機成分。三個成分中的某些或全部再加上隨機成分。因此,因此, 如果要想對一個時間序列本身進行較深入如果要想對一個時間序列本身進行較深入的研究,把序列的這些成分分解出來

15、、或的研究,把序列的這些成分分解出來、或者把它們過慮掉則會有很大的幫助。者把它們過慮掉則會有很大的幫助。 如果要進行預測,則最好把模型中的與這如果要進行預測,則最好把模型中的與這些成分有關的參數(shù)估計出來。些成分有關的參數(shù)估計出來。 就例就例中中的時間序列的分解,通過的時間序列的分解,通過SPSS軟件,軟件,可以很輕而易舉地得到該序列的趨勢、季可以很輕而易舉地得到該序列的趨勢、季節(jié)和誤差成分。節(jié)和誤差成分。23去掉季節(jié)成分,只有趨勢和誤差成分的例15.1的時間序列。 TimeTime Series Without Seasonal199619982000200220040 e+004 e+058

16、 e+0524例15.1的時間序列分解出來的純趨勢成分和純季節(jié)成分兩條曲線 TimeTrend and Seasonal199619982000200220040 e+002 e+054 e+056 e+0525例15.1的時間序列分解出來的純趨勢成分和純誤差成分兩條曲線 TimeTrend and Remainder199619982000200220040 e+002 e+054 e+056 e+0526指數(shù)平滑指數(shù)平滑 如果我們不僅僅滿足于分解現(xiàn)有的時間序列,而如果我們不僅僅滿足于分解現(xiàn)有的時間序列,而且想要對未來進行預測,就需要建立模型。首先,且想要對未來進行預測,就需要建立模型。首先

17、,這里介紹比較簡單的這里介紹比較簡單的指數(shù)平滑指數(shù)平滑(exponential smoothing)。 指數(shù)平滑指數(shù)平滑只能用于純粹時間序列只能用于純粹時間序列的情況,而不能的情況,而不能用于含有獨立變量時間序列的因果關系的研究。用于含有獨立變量時間序列的因果關系的研究。 指數(shù)平滑的原理為:當利用過去觀測值的加權平指數(shù)平滑的原理為:當利用過去觀測值的加權平均來預測未來的觀測值時(這個過程稱為平滑),均來預測未來的觀測值時(這個過程稱為平滑),離得越近的觀測值要給以更多的權。離得越近的觀測值要給以更多的權。 而而“指數(shù)指數(shù)”意味著:按照已有觀測值意味著:按照已有觀測值“老老”的程的程度,其上的權

18、數(shù)按指數(shù)速度遞減。度,其上的權數(shù)按指數(shù)速度遞減。27指數(shù)平滑指數(shù)平滑 以簡單的沒有趨勢和沒有季節(jié)成分的純粹以簡單的沒有趨勢和沒有季節(jié)成分的純粹時間序列為例,指數(shù)平滑在數(shù)學上這實際時間序列為例,指數(shù)平滑在數(shù)學上這實際上是一個幾何級數(shù)。這時,如果用上是一個幾何級數(shù)。這時,如果用Yt表示表示在在t時間的平滑后的數(shù)據(jù)(或預測值),而時間的平滑后的數(shù)據(jù)(或預測值),而用用X1, X2, , Xt表示原始的時間序列。那么表示原始的時間序列。那么指數(shù)平滑模型為指數(shù)平滑模型為 1(1), (01)tttYXY或者,等價地,或者,等價地,0(1)ktt kkYX這里的系數(shù)為幾何級數(shù)。因此稱之為這里的系數(shù)為幾何級

19、數(shù)。因此稱之為“幾何幾何平滑平滑”比使人不解的比使人不解的“指數(shù)平滑指數(shù)平滑”似乎更有似乎更有道理。道理。 28指數(shù)平滑指數(shù)平滑 自然,這種在簡單情況下導出的公式(如上面的自然,這種在簡單情況下導出的公式(如上面的公式)無法應對具有各種成分的復雜情況。公式)無法應對具有各種成分的復雜情況。 后面將給出各種實用的指數(shù)平滑模型的公式。后面將給出各種實用的指數(shù)平滑模型的公式。 根據(jù)數(shù)據(jù),可以得到這些模型參數(shù)的估計以及對根據(jù)數(shù)據(jù),可以得到這些模型參數(shù)的估計以及對未來的預測。在和我們例子有關的指數(shù)平滑模型未來的預測。在和我們例子有關的指數(shù)平滑模型中,需要估計中,需要估計1212個季節(jié)指標和三個參數(shù)(包含

20、前個季節(jié)指標和三個參數(shù)(包含前面公式權重中的面公式權重中的 ,和趨勢有關的,和趨勢有關的g g,以及和季節(jié),以及和季節(jié)指標有關的指標有關的d d)。)。 在簡單的選項之后,在簡單的選項之后,SPSSSPSS通過指數(shù)平滑產(chǎn)生了對通過指數(shù)平滑產(chǎn)生了對20052005年年6 6月后一年的預測。下圖為原始的時間序月后一年的預測。下圖為原始的時間序列和預測的時間序列列和預測的時間序列( (光滑后的光滑后的) )。下面為誤差。下面為誤差。 2930例15.1時間序列數(shù)據(jù)的指數(shù)平滑和對未來的預測 TimeTax1996199820002002200420060200000600000100000031x=s

21、can(d:/booktj1/data/tax.txt)tax=ts(x, frequency = 12, start = c(1995, 1)ts.plot(tax,ylab=Tax) #plot(x1,ylab=Sales) a=stl(tax, period) #分解a$time.series #分解結果(三列) ts.plot(a$time.series,1:3)b=HoltWinters(tax,beta=0) #Holt-Winters濾波指數(shù)平滑predict(b,n.ahead=12) #對未來12個月預測pacf(tax); acf(tax)w=arima(tax, c(0,

22、 1, 1),seasonal = list(order=c(1,2 ,1), period=12)predict(w, n.ahead = 12) w$residuals#殘差acf(w$resi)pacf(w$resi)w$coef#估計的模型系數(shù)w$aic #aic值32Box-Jenkins 方法:方法:ARIMA模型模型 如果要對比較復雜的純粹時間序列進行細如果要對比較復雜的純粹時間序列進行細致的分析致的分析,指數(shù)平滑往往是無法滿足要求的指數(shù)平滑往往是無法滿足要求的. 而若想對有獨立變量的時間序列進行預測,而若想對有獨立變量的時間序列進行預測,指數(shù)平滑更是無能為力。指數(shù)平滑更是無能為

23、力。 于是需要更加強有力的模型。這就是下面于是需要更加強有力的模型。這就是下面要介紹的要介紹的Box-Jenkins ARIMA模型。模型。 數(shù)學上數(shù)學上,指數(shù)平滑僅僅是指數(shù)平滑僅僅是ARIMA模型的特例模型的特例. 33ARIMA模型模型 :AR模型模型 比指數(shù)平滑要有用和精細得多的模型是比指數(shù)平滑要有用和精細得多的模型是Box-Jenkins引引入的入的ARIMA模型?;蚍Q為整合自回歸移動平均模型模型?;蚍Q為整合自回歸移動平均模型(ARIMA 為為Autoregressive Integrated Moving Average一些關鍵字母的縮寫一些關鍵字母的縮寫)。該模型的基礎是自回歸和移

24、動。該模型的基礎是自回歸和移動平均模型或平均模型或ARMA(Autoregressive and Moving Average) 模型。模型。 它由兩個特殊模型發(fā)展而成,一個特例是自回歸模型或它由兩個特殊模型發(fā)展而成,一個特例是自回歸模型或AR (Autoregressive) 模型。假定時間序列用模型。假定時間序列用X1, X2, , Xt表示,則一個純粹的表示,則一個純粹的AR (p)模型意味著變量的一個觀模型意味著變量的一個觀測值由其以前的測值由其以前的p個觀測值的線性組合加上隨機誤差項個觀測值的線性組合加上隨機誤差項at(該誤差為獨立無關的)而得:(該誤差為獨立無關的)而得: 11tt

25、ptptXXXa這看上去象自己對自己回歸一樣,所以稱為自回歸模型;這看上去象自己對自己回歸一樣,所以稱為自回歸模型;它牽涉到過去它牽涉到過去p個觀測值(相關的觀測值間隔最多為個觀測值(相關的觀測值間隔最多為p個個. .34ARIMA模型模型 :MA模型模型 ARMA模型的另一個特例為移動平均模型或模型的另一個特例為移動平均模型或MA (Moving Average) 模型,一個純粹的模型,一個純粹的MA (q)模型意味著模型意味著變量的一個觀測值由目前的和先前的變量的一個觀測值由目前的和先前的q個隨機誤差的線個隨機誤差的線性的組合:性的組合: 由于右邊系數(shù)的和不為由于右邊系數(shù)的和不為1(q q

26、 甚至不一定是正數(shù)),因此甚至不一定是正數(shù)),因此叫做叫做“移動平均移動平均”不如叫做不如叫做“移動線性組合移動線性組合”更確切;雖更確切;雖然行家已經(jīng)習慣于叫然行家已經(jīng)習慣于叫“平均平均”了,但初學者還是因此可能了,但初學者還是因此可能和初等平滑方法中的什么和初等平滑方法中的什么“三點平均三點平均”之類的術語混淆。之類的術語混淆。 11tttqt qXaaaqq35ARIMA模型模型 :ARMA模型模型 顯然顯然ARMA(p,q)模型應該為模型應該為AR (p)模型和模型和MA(q)模型的模型的組合了:組合了:顯然顯然ARMA(p,0)模型就是模型就是AR (p)模型,而模型,而ARMA(0

27、,q)模型模型就是就是MA(q)模型。這個一般模型有模型。這個一般模型有p+q個參數(shù)要估計,看個參數(shù)要估計,看起來很繁瑣,但利用計算機軟件則是常規(guī)運算;并不復雜。起來很繁瑣,但利用計算機軟件則是常規(guī)運算;并不復雜。 1111ttptpttqt qXXXaaaqq36ARIMA模型:平穩(wěn)性和可逆性模型:平穩(wěn)性和可逆性 但是要想但是要想ARMA(p,q)模型有意義則要求時間序列滿足平模型有意義則要求時間序列滿足平穩(wěn)性穩(wěn)性(stationarity)和可逆性和可逆性(invertibility)的條件,的條件, 這意味著序列均值不隨著時間增加或減少,序列的方差這意味著序列均值不隨著時間增加或減少,序

28、列的方差不隨時間變化,另外序列本身相關的模式不改變等。不隨時間變化,另外序列本身相關的模式不改變等。 一個實際的時間序列是否滿足這些條件是無法在數(shù)學上一個實際的時間序列是否滿足這些條件是無法在數(shù)學上驗證的,驗證的, 這沒有關系,但可以從下面要介紹的時間序列的自相關這沒有關系,但可以從下面要介紹的時間序列的自相關函數(shù)和偏相關函數(shù)圖中可以識別出來。函數(shù)和偏相關函數(shù)圖中可以識別出來。 一般人們所關注的的有趨勢和季節(jié)一般人們所關注的的有趨勢和季節(jié)/循環(huán)成分的時間序循環(huán)成分的時間序列都不是平穩(wěn)的。這時就需要對時間序列進行差分列都不是平穩(wěn)的。這時就需要對時間序列進行差分(difference)來消除這些使

29、序列不平穩(wěn)的成分,而使其變來消除這些使序列不平穩(wěn)的成分,而使其變成平穩(wěn)的時間序列,并估計成平穩(wěn)的時間序列,并估計ARMA模型,估計之后再轉模型,估計之后再轉變該模型,使之適應于差分之前的序列(這個過程和差變該模型,使之適應于差分之前的序列(這個過程和差分相反,所以稱為整合的分相反,所以稱為整合的(integrated)ARMA模型),模型),得到的模型于是稱為得到的模型于是稱為ARIMA模型。模型。37ARIMA模型:差分模型:差分 差分是什么意思呢?差分可以是每一個觀差分是什么意思呢?差分可以是每一個觀測值減去其前面的一個觀測值,即測值減去其前面的一個觀測值,即Xt-Xt-1。這樣,如果時間

30、序列有一個斜率不變的趨這樣,如果時間序列有一個斜率不變的趨勢,經(jīng)過這樣的差分之后,該趨勢就會被勢,經(jīng)過這樣的差分之后,該趨勢就會被消除了。消除了。 當然差分也可以是每一個觀測值減去其前當然差分也可以是每一個觀測值減去其前面任意間隔的一個觀測值;比如存在周期面任意間隔的一個觀測值;比如存在周期固定為固定為s的季節(jié)成分,的季節(jié)成分, 那么相隔那么相隔s的差分的差分 為為Xt-Xt-s就可以把這種以就可以把這種以s為周期的季節(jié)成分消除。為周期的季節(jié)成分消除。 對于復雜情況,可能要進行多次差分,才對于復雜情況,可能要進行多次差分,才能夠使得變換后的時間序列平穩(wěn)。能夠使得變換后的時間序列平穩(wěn)。 38AR

31、MA模型的識別和估計模型的識別和估計 上面引進了一些必要的術語和概念。上面引進了一些必要的術語和概念。下面就如何識別模型進行說明。下面就如何識別模型進行說明。要想擬合要想擬合ARIMA模型,必須先把它利模型,必須先把它利用差分變成用差分變成ARMA(p,q)模型,并確定模型,并確定是否平穩(wěn),然后確定參數(shù)是否平穩(wěn),然后確定參數(shù)p,q。現(xiàn)在利用一個例子來說明如何識別一現(xiàn)在利用一個例子來說明如何識別一個個AR(p)模型和參數(shù)模型和參數(shù)p。由此由此MA(q)及及ARMA(p,q)模型模型可用模型模型可用類似的方法來識別。類似的方法來識別。39ARMA模型的識別和估計模型的識別和估計 根據(jù)根據(jù)ARMA(

32、p,q)模型的定義模型的定義,它的參數(shù)它的參數(shù)p,q和和自相關函數(shù)自相關函數(shù)(acf,autocorrelations function)及偏自相關函數(shù)及偏自相關函數(shù)(pacf,partial autocorrelations function)有關。有關。 自相關函數(shù)描述觀測值和前面的觀測值的自相關函數(shù)描述觀測值和前面的觀測值的相關系數(shù);相關系數(shù); 而偏自相關函數(shù)為在給定中間觀測值的條而偏自相關函數(shù)為在給定中間觀測值的條件下觀測值和前面某間隔的觀測值的相關件下觀測值和前面某間隔的觀測值的相關系數(shù)。系數(shù)。 這里當然不打算討論這兩個概念的細節(jié)。這里當然不打算討論這兩個概念的細節(jié)。引進這兩個概念主

33、要是為了能夠引進這兩個概念主要是為了能夠了解如何了解如何通過研究關于這兩個函數(shù)的通過研究關于這兩個函數(shù)的acf和和pacf圖來圖來識別模型。識別模型。 40例:數(shù)據(jù)例:數(shù)據(jù)AR2.sav 為了直觀地理解上面的概念,下面利用一個數(shù)據(jù)例子來描述。為了直觀地理解上面的概念,下面利用一個數(shù)據(jù)例子來描述。Timex0100200300400500-4-202441例:數(shù)據(jù)例:數(shù)據(jù)AR2.sav;拖尾和截尾;拖尾和截尾先來看該時間序列的先來看該時間序列的acf(左左)和和pacf圖圖( (右右) ) 左邊的左邊的acf條形圖是衰減的指數(shù)型的波動;這種圖形稱為條形圖是衰減的指數(shù)型的波動;這種圖形稱為拖尾拖尾

34、。而右邊的。而右邊的pacf條形圖是在第二個條條形圖是在第二個條(p=2)之后就很小,之后就很小,而且沒有什么模式;這種圖形稱為在在而且沒有什么模式;這種圖形稱為在在p=2后后截尾截尾。這說。這說明該數(shù)據(jù)滿足是平穩(wěn)的明該數(shù)據(jù)滿足是平穩(wěn)的AR(2)模型。模型。05101520250.00.20.40.60.81.0LagACFSeries x05101520250.00.20.40.60.8LagPartial ACFSeries x42拖尾和截尾拖尾和截尾 所謂拖尾圖形模式也可能不是以指數(shù)形式,而是所謂拖尾圖形模式也可能不是以指數(shù)形式,而是以正負相間的正弦形式衰減。類似地,如果以正負相間的正弦

35、形式衰減。類似地,如果acf圖形是在第圖形是在第q=k個條后截尾,而個條后截尾,而pacf圖形為拖尾圖形為拖尾,則數(shù)據(jù)滿足,則數(shù)據(jù)滿足MA(q)模型。如果兩個圖形都拖尾模型。如果兩個圖形都拖尾則可能滿足則可能滿足ARMA(p,q)模型。具體判別法總結在模型。具體判別法總結在下面表中下面表中(并不一定嚴格!)(并不一定嚴格?。?3acf和和pacf圖圖 如如acf和和pacf圖中至少一個不是以指數(shù)形式圖中至少一個不是以指數(shù)形式或正弦形式衰減,那么說明該序列不是平或正弦形式衰減,那么說明該序列不是平穩(wěn)序列,必須進行差分變換來得到一個可穩(wěn)序列,必須進行差分變換來得到一個可以估計參數(shù)的滿足以估計參數(shù)

36、的滿足ARMA(p,q)模型的序列模型的序列 如一個時間序列的如一個時間序列的acf和和pacf圖沒有任何模圖沒有任何模式,而且數(shù)值很小,那么這個序列可能就式,而且數(shù)值很小,那么這個序列可能就是一些互相獨立的無關的隨機變量。一個是一些互相獨立的無關的隨機變量。一個很好擬合的時間序列模型的殘差就應該有很好擬合的時間序列模型的殘差就應該有這樣的這樣的acf和和pacf圖。圖。44AR(2)、MA(2)和和ARMA(2,2)模型所對應的模型所對應的acf和和pacf圖。圖。注意,圖中有些條是從注意,圖中有些條是從0開始的(不算在開始的(不算在p或或q內)。內)。 0510152025300.00.4

37、0.8LagACFACF of AR(2) process0510152025300.00.20.40.6LagPartial ACFACF of AR(2) process051015202530-0.20.20.61.0LagACFPACF of MA(2) process051015202530-0.3-0.10.1LagPartial ACFPACF of MA(2) process051015-0.20.20.61.0LagACFACF of ARMA(2,2) process51015-0.20.20.6LagPartial ACFPACF of ARMA(2,2) process

38、45例:數(shù)據(jù)例:數(shù)據(jù)AR2.sav 根據(jù)根據(jù)acf和和pacf圖圖的形態(tài),不用進行任何差分就可的形態(tài),不用進行任何差分就可以直接用以直接用AR(2)模型擬合。利用模型擬合。利用SPSS軟件,選擇軟件,選擇AR(2)模型模型( (等價地等價地ARIMA(2,0,0)(0,0,0)模型模型),),得得到參數(shù)估計為到參數(shù)估計為120.4783,0.4062也就是說該也就是說該AR(2)模型為模型為 120.47830.4062ttttXXXa46例:數(shù)據(jù)例:數(shù)據(jù)AR2.sav 例例15.2的原始序列和由模型的原始序列和由模型AR(2)得到的擬合值得到的擬合值及對未來及對未來10個觀測的預測圖(虛線)

39、個觀測的預測圖(虛線) Timex0100200300400500-4-202447例:數(shù)據(jù)例:數(shù)據(jù)AR2.sav 下面再看剩下的殘差序列是否還有什么模式。這還可以由殘差的下面再看剩下的殘差序列是否還有什么模式。這還可以由殘差的pacf(左左)和和acf(右右)圖來判斷??梢钥闯?,它們沒有什么模式;這圖來判斷??梢钥闯觯鼈儧]有什么模式;這說明擬合比較成功。說明擬合比較成功。 05101520250.00.20.40.60.81.0LagACFSeries d$res0510152025-0.050.000.05LagPartial ACFSeries d$res48例:數(shù)據(jù)例:數(shù)據(jù)AR2.s

40、av 下圖為殘差對擬合值的散點圖。看不出任何模式。說明殘差的確下圖為殘差對擬合值的散點圖??床怀鋈魏文J?。說明殘差的確是獨立的和隨機的。是獨立的和隨機的。-4-3-2-10123-2-1012Fitted ValueResiduals49ARIMA (p,d,q)(P,D,Q)s模型模型 在對含有季節(jié)和趨勢在對含有季節(jié)和趨勢/循環(huán)等成分的時間序列進行循環(huán)等成分的時間序列進行ARIMA模型的擬合研究和預測時,就不象對純粹的滿模型的擬合研究和預測時,就不象對純粹的滿足可解條件的足可解條件的ARMA模型那么簡單了。模型那么簡單了。 一般的一般的ARIMA模型有多個參數(shù),沒有季節(jié)成分的可以模型有多個參

41、數(shù),沒有季節(jié)成分的可以記為記為ARIMA(p,d,q),如果沒有必要利用差分來消除趨,如果沒有必要利用差分來消除趨勢或循環(huán)成分時,差分階數(shù)勢或循環(huán)成分時,差分階數(shù)d=0,模型為,模型為ARIMA(p,0,q),即,即ARMA(p, q)。 在有已知的固定周期在有已知的固定周期s時,模型多了時,模型多了4個參數(shù),可記為個參數(shù),可記為ARIMA(p,d,q)(P,D,Q)s。這里增加的除了周期。這里增加的除了周期s已知之外已知之外,還有描述季節(jié)本身的,還有描述季節(jié)本身的ARIMA(P,D,Q)的模型識別問題的模型識別問題。因此,實際建模要復雜得多。需要經(jīng)過反復比較。因此,實際建模要復雜得多。需要經(jīng)

42、過反復比較。50用用ARIMA模型擬合模型擬合tax.savtax.sav 先前對例先前對例15.1(數(shù)據(jù)數(shù)據(jù)tax.txt或或tax.sav)進行了分解,并且用進行了分解,并且用指數(shù)平滑做了預測。知道其中有季節(jié)和趨勢成分。指數(shù)平滑做了預測。知道其中有季節(jié)和趨勢成分。 下面試圖對其進行下面試圖對其進行ARIMA模型擬合。先試圖對該序列做模型擬合。先試圖對該序列做acf和和pacf條形圖。其中條形圖。其中acf圖顯然不是拖尾(不是以指數(shù)速率遞減),圖顯然不是拖尾(不是以指數(shù)速率遞減),因此說明需要進行差分。因此說明需要進行差分。0.00.51.01.5-0.20.00.20.40.60.81.0

43、LagACFSeries tax0.51.01.5-0.40.00.20.40.60.8LagPartial ACFSeries tax51用用ARIMA模型擬合例模型擬合例tax.savtax.sav 關于于參數(shù),不要選得過大;每次擬合之后要檢關于于參數(shù),不要選得過大;每次擬合之后要檢查殘差的查殘差的acf和和pacf圖,看是否為無關隨機序列。圖,看是否為無關隨機序列。 在在SPSS軟件中還有類似于回歸系數(shù)的檢驗以及軟件中還有類似于回歸系數(shù)的檢驗以及其他一些判別標準的計算機輸出可做參考(這里其他一些判別標準的計算機輸出可做參考(這里不細說)。不細說)。 經(jīng)過幾次對比之后,對于例經(jīng)過幾次對比之

44、后,對于例16.1數(shù)據(jù)我們最后選數(shù)據(jù)我們最后選中了中了ARIMA(0,1,1)(1,2,1)12模型來擬合。模型來擬合。擬合的擬合的結果和對結果和對2005年年6月之后月之后12個月的預測在個月的預測在下圖中下圖中52例例tax.sav的原始序列和由模型得到的擬合值及對未來的原始序列和由模型得到的擬合值及對未來12個個月的預測圖。月的預測圖。 Timetax1996199820002002200420062e+054e+056e+058e+051e+0653例:數(shù)據(jù)例:數(shù)據(jù)tax.sav 為了核對,當然要畫出殘差的為了核對,當然要畫出殘差的acf和和pacf的條形圖來看是否還有什的條形圖來看是

45、否還有什么非隨機的因素存在。下圖為這兩個點圖,看來我們的模型選擇么非隨機的因素存在。下圖為這兩個點圖,看來我們的模型選擇還是適當?shù)?。還是適當?shù)摹?0.00.51.01.5-0.20.00.20.40.60.81.0LagACF0.51.01.5-0.15-0.050.050.15LagPartial ACF5455例:數(shù)據(jù)例:數(shù)據(jù)tax.sav 例例15.1數(shù)據(jù)擬合數(shù)據(jù)擬合ARIMA(0,1,1)(1,2,1)12模型后殘模型后殘差序列的差序列的Ljung-Box檢驗的檢驗的p值值 51015200.00.20.40.60.81.0lagp value for Ljung-Box test56

46、新SPSSModel DescriptionModel DescriptionARIMA(0,1,1)(1,2,1)Model_1稅收收入_稅種合計Model IDModel TypeARIMA Model ParametersARIMA Model Parameters1.820.06113.447.000-.504.149-3.384.0012.563.1753.214.002DifferenceLag 1MALag 1AR, SeasonalSeasonal DifferenceLag 1MA, SeasonalNo Transformation稅收收入_稅種合計稅收收入_稅種合計-Mo

47、del_1EstimateSEtSig.575859用用ARIMA模型擬合帶有獨立變量的時間序列模型擬合帶有獨立變量的時間序列 DAY, period 746135724613572461SALES7060504030 例例:數(shù)據(jù):數(shù)據(jù)tsadds2.sav是一個銷售時間序列,以每周七天是一個銷售時間序列,以每周七天為一個季節(jié)周期,除了銷售額序列為一個季節(jié)周期,除了銷售額序列sales之外,還有一個之外,還有一個廣告花費的獨立變量廣告花費的獨立變量adds。先不理睬這個獨立變量,把。先不理睬這個獨立變量,把該序列當成純粹時間序列來用該序列當成純粹時間序列來用ARIMAARIMA模型擬合。右圖為

48、模型擬合。右圖為該序列的點圖。該序列的點圖。60數(shù)據(jù)數(shù)據(jù)tsadds2.sav再首先點出其再首先點出其acfacf和和pacfpacf條形圖條形圖 SALESLag Number16151413121110987654321ACF1.0.50.0-.5-1.0Confidence LimitsCoefficientSALESLag Number16151413121110987654321Partial ACF1.0.50.0-.5-1.0Confidence LimitsCoefficientacf圖顯然不是拖尾模式,因此,必須進行差分以圖顯然不是拖尾模式,因此,必須進行差分以消除季節(jié)影響。

49、試驗多次之后,看上去消除季節(jié)影響。試驗多次之后,看上去ARIMA(2,1,2)( 0,1,1)7的結果還可以接受。殘差的的結果還可以接受。殘差的pacfpacf和和acfacf條形圖在下一頁圖中條形圖在下一頁圖中 61用用ARIMA模型擬合帶有獨立變量的時間序列模型擬合帶有獨立變量的時間序列 繼續(xù)改進我們的模型,再把獨立變量廣告支出加入模型,最后得繼續(xù)改進我們的模型,再把獨立變量廣告支出加入模型,最后得到的帶有獨立變量到的帶有獨立變量addsadds的的ARIMA(2,1,2)( 0,1,1)ARIMA(2,1,2)( 0,1,1)7 7模型。擬合后模型。擬合后的殘差圖在下圖中。的殘差圖在下圖

50、中。 Error for SALES from ARIMALag Number16151413121110987654321ACF1.0.50.0-.5-1.0Confidence LimitsCoefficientError for SALES from ARIMALag Number16151413121110987654321Partial ACF1.0.50.0-.5-1.0Confidence LimitsCoefficient62用用ARIMA模型擬合帶有獨立變量的時間序列模型擬合帶有獨立變量的時間序列 從各種角度來看擬合帶獨立變量平方從各種角度來看擬合帶獨立變量平方的的ARIMA

51、(2,1,2)( 0,1,1)ARIMA(2,1,2)( 0,1,1)7 7模型給出更模型給出更好的結果。好的結果。雖然從上面的雖然從上面的acfacf和和pacfpacf圖看不出(一圖看不出(一般也不應該看出)獨立變量對序列的般也不應該看出)獨立變量對序列的自相關性的影響,但是根據(jù)另外的一自相關性的影響,但是根據(jù)另外的一些判別準則,獨立變量的影響是顯著些判別準則,獨立變量的影響是顯著的,而且加入獨立變量使得模型更加的,而且加入獨立變量使得模型更加有效。有效。 63用用ARIMA模型擬合帶有獨立變量的時間序列模型擬合帶有獨立變量的時間序列 要注意,一些獨立變量的效果也可能是滿要注意,一些獨立變

52、量的效果也可能是滿足某些時間序列模型的,也可能會和季節(jié)、足某些時間序列模型的,也可能會和季節(jié)、趨勢等效應混雜起來不易分辯。這時,模趨勢等效應混雜起來不易分辯。這時,模型選擇可能就比較困難。也可能不同模型型選擇可能就比較困難。也可能不同模型會有類似的效果。會有類似的效果。 一個時間序列在各種相關的因素影響下的一個時間序列在各種相關的因素影響下的模型選擇并不是一件簡單明了的事情。實模型選擇并不是一件簡單明了的事情。實際上沒有任何統(tǒng)計模型是絕對正確的,它際上沒有任何統(tǒng)計模型是絕對正確的,它們的區(qū)別在于,在某種意義上,一些模型們的區(qū)別在于,在某種意義上,一些模型的某些性質可能要優(yōu)于另外一些。的某些性質

53、可能要優(yōu)于另外一些。64新新SPSS的時間序列實現(xiàn)的時間序列實現(xiàn) 特點: 在ARIMA中自動選擇用什么參數(shù) 在指數(shù)平滑和ARIMA中自動選擇模型(包括參數(shù)) 下面是兩個例子 TAX AIRPORT65tsadds2.sav66Model DescriptionModel DescriptionWinters AdditiveModel_1salesModel IDModel TypeExponential Smoothing Model ParametersExponential Smoothing Model Parameters.171.0622.778.007.252.1252.018.

54、047.001.098.010.992Alpha (Level)Gamma (Trend)Delta (Season)NoTransformationModelsales-Model_1EstimateSEtSig.676869Airport.sav70GET FILE=C:XZWUHEPbookdataAirport.sav.DATASET NAME DataSet1 WINDOW=FRONT.PREDICT THRU END.* Time Series Modeler.TSMODEL /MODELSUMMARY PRINT= MODELFIT /MODELSTATISTICS DISPLA

55、Y=YES MODELFIT= SRSQUARE /SERIESPLOT OBSERVED FORECAST /OUTPUTFILTER DISPLAY=ALLMODELS /AUXILIARY CILEVEL=95 MAXACFLAGS=24 /MISSING USERMISSING=EXCLUDE /MODEL DEPENDENT=北京 成都 福州 桂林 杭州 濟南 老河口 南京 上海 武漢 鹽城 銀川 PREFIX=Model /EXPERTMODELER TYPE=ARIMA EXSMOOTH TRYSEASONAL=YES /AUTOOUTLIER DETECT=OFF .71PRE

56、DICT THRU YEAR 2004 .* Time Series Modeler.TSMODEL /MODELSUMMARY PRINT= MODELFIT /MODELSTATISTICS DISPLAY=YES MODELFIT= SRSQUARE /SERIESPLOT OBSERVED FORECAST FIT /OUTPUTFILTER DISPLAY=ALLMODELS /SAVE PREDICTED(Predicted) LCL(LCL) UCL(UCL) /AUXILIARY CILEVEL=95 MAXACFLAGS=24 /MISSING USERMISSING=EXC

57、LUDE /MODEL DEPENDENT=北京 成都 福州 桂林 杭州 濟南 老河口 南京 上海 武漢 鹽城 銀川 PREFIX=Model /EXPERTMODELER TYPE=ARIMA EXSMOOTH TRYSEASONAL=YES /AUTOOUTLIER DETECT=OFF .727374Model DescriptionModel DescriptionARIMA(1,0,1)(0,1,1)Simple SeasonalSimple SeasonalSimple SeasonalSimple SeasonalWinters AdditiveSimple SeasonalSi

58、mple SeasonalARIMA(0,0,2)(0,1,0)Simple SeasonalSimple SeasonalARIMA(0,0,2)(1,1,0)Model_1北京Model_2成都Model_3福州Model_4桂林Model_5杭州Model_6濟南Model_7老河口Model_8南京Model_9上海Model_10武漢Model_11鹽城Model_12銀川ModelIDModel Type75Model StatisticsModel Statistics0.5858.85915.88500.22927.83716.03300.34930.96516.01400.2

59、4224.17216.08600.09230.92416.01400.19630.19015.01100.28848.64316.00000.18121.73916.15200.61715.37016.49800.44026.02716.05400.43924.24816.08400.36019.94115.1740Model北京-Model_1成都-Model_2福州-Model_3桂林-Model_4杭州-Model_5濟南-Model_6老河口-Model_7南京-Model_8上海-Model_9武漢-Model_10鹽城-Model_11銀川-Model_12Number ofPre

60、dictorsStationaryR-squaredModel FitstatisticsStatisticsDFSig.Ljung-Box Q(18)Number ofOutliers76Exponential Smoothing Model ParametersExponential Smoothing Model Parameters.999.09910.142.000.00028.3141.65E-0051.000.900.0979.241.000.000.341.001.999.999.1039.674.000.00051.0487.65E-0061.000.999.09810.17

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論