用R語言實現(xiàn)奶牛月產(chǎn)奶量的時間序列分析_第1頁
用R語言實現(xiàn)奶牛月產(chǎn)奶量的時間序列分析_第2頁
用R語言實現(xiàn)奶牛月產(chǎn)奶量的時間序列分析_第3頁
用R語言實現(xiàn)奶牛月產(chǎn)奶量的時間序列分析_第4頁
用R語言實現(xiàn)奶牛月產(chǎn)奶量的時間序列分析_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、奶牛月產(chǎn)奶量的時間序列分析本文應(yīng)用R軟件對奶牛月產(chǎn)奶量建立時間序列模型并進(jìn)行預(yù)測。文章主要從 以下幾個方面進(jìn)行:.描述性統(tǒng)計.模型識別.參數(shù)估計.模型診斷.預(yù)測.其他建模方法及效果對比.結(jié)論最終通過多方面對比,我們選擇了 ARIMA(0,1,1) 0,1,1)12模型用于以后數(shù) 據(jù)的預(yù)測。描述性統(tǒng)計數(shù)據(jù)的選取本文引用的是 Data Market中的時間序列數(shù)據(jù) “Monthly milk production: pounds per cow. Jan 62 - Dec 75 ,包括從 1962 年 1 月至U 1975 年 12 月共 168 個 月度數(shù)據(jù),單位為pounds/month。數(shù)據(jù)

2、如下:Jan62636455566768697071727374了5600628S04826821Feb 561 566 Jan62636455566768697071727374了5600628S04826821Feb 561 566 61E 622 635 667 696 690 707 756 799 F 775 782Mar 640 65370g 736 762 775 7B5 607 sea 890 6BJ 859 692254654806232 5 g g O 2 7 0 g o O 77778889699May 727 74 2 770 F?811 837 858 871 6S6

3、 94 2 961 957 969 966Jun657716736756 7g8817 26&4 585991393592494 793710 0 8口 4671J 6 6 618 68 0 93 9 8Aug 5gg 517 6Mg 雙 647r 722 740 764 785 834 855 837 的7 S58Sep 568 583 604 615 甌 681 701 72 5 740 790 809 764815 817oct 577 5B7 611際 687 706 723747 800810 791 812 8Z7NOV 553 565 594 5。2 64 5 660 677 6

4、90 711 763 766 760 773 797C2845S8141O5 233689 33891350 0 014D556666777 8 8 8B8從中我們將62-74年,共156條數(shù)據(jù)作為訓(xùn)練集75年的12個月數(shù)據(jù)作為測試集,用于最后評價模型預(yù)測效果的參考。數(shù)據(jù)的描述性統(tǒng)計變量統(tǒng)計表1-1數(shù)據(jù)類型最小值卜四分?jǐn)?shù)中位數(shù)均值上四分?jǐn)?shù)最大值數(shù)值型數(shù)據(jù)553.0677.8761.0754.7824.5969.0時間序列的分布圖和時間序列的分解如下:62646870727476time時間序列分解圖1-1由圖可以看出,時間序列含有明顯的季節(jié)性和上升趨勢,且沒有波動集群現(xiàn)象,可以考慮季節(jié)模型,最

5、常用的是 ARIMA真型。乘法季節(jié)模型乘法季節(jié)模型是隨機(jī)季節(jié)模型與 ARIMA模型的結(jié)合。統(tǒng)計學(xué)上純RIMA (p, d, q )模型記作:O 。其中t代表時間,Xt表示響應(yīng)序列,B是后移算子,R=1-B, p、d、q分別表示自回歸階數(shù)、差分階數(shù)和移動 平均階數(shù);(B)表示自回歸算子;(B)表示滑動平均算子。一個階數(shù)為(P, d, q ) X (P, D, Q ) s的乘積季節(jié)模型可表為:oat代表獨立干擾項或隨機(jī)誤差項,s的值是一個季節(jié)循環(huán)中觀測的個數(shù), 表示同一周期內(nèi)不同周期點的相關(guān)關(guān)系,則描述了不同周期中對應(yīng)時點上的相關(guān)關(guān)系,二者結(jié)合起來便同時刻畫了 2個因數(shù)的作用。模型識別模型識別序列

6、平穩(wěn)化我們首先畫出奶牛月產(chǎn)奶量的時序圖Time奶牛月產(chǎn)奶量時序圖 2-1由上面奶牛月產(chǎn)奶量的時序圖可見, 序列呈現(xiàn)明顯的趨勢。為消除趨勢,我 們首先對數(shù)據(jù)做一階差分,一階差分后的時序圖和自相關(guān)分析圖如下:PP出Time階差分時序圖2-2階差分時序圖2-2LL一階差分ACF圖2-3如圖所示,序列的趨勢基本消除,但當(dāng) k=12、24時,序列的樣本自相 關(guān)系數(shù)顯著不為0,表明季節(jié)性存在,且季節(jié)周期為12。因此我們再對一階 差分后的序列做12步季節(jié)差分,得到序列的折線圖。ppI Time一階12步差分折線圖2-4此時可以發(fā)現(xiàn)序列已經(jīng)消除了趨勢和周期性,基本處于平穩(wěn)狀態(tài),我們 可以進(jìn)一步通過ADF單位根

7、檢驗序列的平穩(wěn)性,得到:Augmented Dickey-Ful1 er restdata: tra1n_d_sDickey-FulHer - -5.901, Lag order - 5, p-value - 0.01 alternative hypothesis: stationary由于p值小于0.05,所以拒絕原假設(shè),選擇備擇假設(shè),即此時序列是平穩(wěn)的。模型識別一個序列如果是純隨機(jī)的,就意味著它每一次新的變化都無跡可尋,我們可以從中挖掘不出對預(yù)測有益的信息。一旦我們發(fā)現(xiàn)某個序列是純隨機(jī)序列,說明 這個序列已經(jīng)沒有什么可以挖掘的有用信息,因而可以停止對它分析。通常我們 可以用Ljung-Bo

8、x檢驗,簡稱LB檢驗,LB檢驗的原假設(shè)是所檢驗的序列是純 隨機(jī)序列。我們在這對平穩(wěn)后的序列做 BL檢驗,檢查序列是否為白噪聲序列。Box-Ljung testdata: as.vector(train_d_s)X-squared = 71.139, df = 40, p-value = 0_00176由對一次差分和季節(jié)差分后的序列做 LB檢驗,發(fā)現(xiàn)p值小于0.05,說明該 序列不是白噪聲序列,可以進(jìn)一步提取序列中的信息。此時畫出序列的自相關(guān)與偏自相關(guān)分析圖,如下:(XI o dsrecrAO det ect10(mi 1k_ARiMA13aind 109.0000001ambdal 4.8B4

9、691結(jié)果表明時間序列沒有存在的可加異常值,但109個數(shù)是一個較為明顯的新息異常值。此時我們考慮異常值的影響重新修正模型,在進(jìn)行異常點檢測所得結(jié)果如下:Call;ar imafx = train, order = c. (0 n 1T 工),= list (or ccr = c (0, 1,1)period = 12) T method - ml, fo .工109)coefficients;皿 10naimcg0,240b7.587731.9GC3e.0.07230.D65O6.9111ta5 47.2: loo 1 ikeHhooc = -461.07 . sic = 06S. 15修正牛

10、奶產(chǎn)量模型的參數(shù)估計MA(1)-0.24860.0723MA(12)-0.58770.0650IO-10932.30116.7619=47.2:對數(shù)似然函數(shù)=-481.07,AIC=968.15我們發(fā)現(xiàn),考慮異常值后,模型各項的系數(shù)并沒有太大的改變, 但標(biāo)準(zhǔn)誤差 都有所減小,并且對數(shù)似然函數(shù)值變大, AIC值也變小了,并且IO效應(yīng)是非常 顯著的,總之,模型的效果得到了改善。此時預(yù)測模型的表達(dá)式為:Yt二Yt-i+Yt-i2-Yt-i3+et+O,24860-i+0.58770_i2+O,2486 0.58770-134.2系數(shù)顯著性檢驗我們對改進(jìn)后的模型ARIMA(0,1,1) X(0,1,1)12的系數(shù)顯著性進(jìn)行檢驗,首先 運用coint()函數(shù)計算模型中系數(shù)的置信區(qū)間。3 5 %97.5%mal-0.3902517-0.1069572smal-0.715186S-0.460215910-109IB.42084864 5, 5118083通過檢驗,每一項的系數(shù)都不包含 0,因此在5%的置信水平下,每一項的 系數(shù)都是顯著的。4.3白噪聲檢驗如果殘差序列為白噪聲序列,則說明我們的模型已經(jīng)充分提取了序列的 信息,我們無法再通過調(diào)整模型從模型中獲取更多的信息,因而模型的建

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論