版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、實(shí)驗(yàn)一-基于AR模型的股票價(jià)格 預(yù)測基于AR模型的股票價(jià)格預(yù)測1問題描述AR模型是一種線性預(yù)測,即已知N個數(shù)據(jù),可由模型推出第N點(diǎn)前面或后面的數(shù)據(jù)(設(shè) 推出P點(diǎn)),所以其本質(zhì)類似于插值,其目的都是為了增加有效數(shù)據(jù)。本次實(shí)驗(yàn)使用從雅虎上 下載的美國某股票七年共2000個收盤價(jià)格數(shù)據(jù)來進(jìn)行數(shù)據(jù)分析建模, 取其前1000個價(jià)格數(shù)據(jù) 構(gòu)建預(yù)測方程,預(yù)測剩下的股票收盤價(jià)格。2. 原理簡述2.1基本原理自回歸模型(Autoregressive Model,AR Model )是用自身做回歸變量的過程,即利用前 期若干時(shí)刻的隨機(jī)變量的線性組合來描述以后某時(shí)刻隨機(jī)變量的線性回歸模型,它是時(shí)間序列中的一種常見形
2、式??紤]一組隨機(jī)自變量觀測值與因變量觀測值之間的關(guān)系,設(shè)自變量觀測值為x(n),因變量觀測值為丫=y(n),y(n-1),y(n-N),則依據(jù)AR Model,滿足如下關(guān)系式:a0y n ay n 1aNy nN x n(2.1)第7頁共15頁其中,a=ao,a1,aN為各項(xiàng)因變量觀測值系數(shù)。通常情況下,我們令ao=1??紤]到式(2.1)的迭代性,我們可以將其轉(zhuǎn)化為一組自變量觀測值和一個因變量觀測值的形式如下:yn xn /n12xn2(2.2)其中,A= 1, 2,是各項(xiàng)自變量觀測值的系數(shù)。另外,我們假定自變量觀測值的自相關(guān)函數(shù)為:(2.3)k是狄拉克函數(shù)其中,2是自變量觀測值的方差,將所得
3、的y(n)代入可得:E y n x nE x nM n 12(2.4)同樣,將任意的一個y(n-K)代入可得:E y n k x n 2 k接下來,我們將所得各式寫成向量的形式如下:(2.5)a1yn,yn 1,.,y n N M XnaN1aiEynxn Eyn yn,yn1 ,., y nN 抽(2.6)Eyn k x n6 r1 ,,rNa1MaN,y n,ya1MaN(2.7)a11,rk N0MaNr°1LN 1ar1r1roLrN 2a2DMMMMMMN 1N 2LroaNrN該矩陣由Yule-Walker方程描述為:Rar。將因變量觀測值的自相關(guān)函數(shù)寫成矩陣形式可得如下
4、:對于該系統(tǒng)預(yù)測的關(guān)鍵在于對系統(tǒng)系數(shù)向量(2.8)a的求解。將ARModel方程寫成如下形式:Ny naky n k x nk 1(2.9)將因變量觀測值y(n)的L個觀測值寫成矩陣形式如下:y Ny N 1 y N 2y N 1y N y N 1MMMy L 1y L 2 L將上式寫成Yule-Walker方程形式為:yLy 0ax NLy 1a2x N 1(2.10)MMMMLy L N 1aNx L 1Ya x。其中,x是自變量觀測值矩陣,a是系數(shù)矩陣,丫是Toeplitz矩陣,y是因變量觀測值矩陣。.2h使用最小二乘法(Least Square,LS)尋找一個最優(yōu)解為:|x y Ya
5、y Ya。對該1式進(jìn)行求解可得:aYhY YHy。將所求系數(shù)代入即可得到擬合方程,根據(jù)擬合方程可以得到問題的估計(jì)值2.2實(shí)現(xiàn)步驟具體實(shí)現(xiàn)步驟如下:(1) 利用自變量觀測值x,因變量觀測值y和系數(shù)矩陣a構(gòu)建系統(tǒng)模型y Ya x ;1(2) 依據(jù)LS求解系統(tǒng)系數(shù)矩陣aYhY YHy ;(3)將a代入構(gòu)造預(yù)測方程;(4)將已知值代入到預(yù)測方程中對未知值進(jìn)行預(yù)測。2.3實(shí)現(xiàn)框圖構(gòu)建系統(tǒng)模型1r依據(jù)LS求解系統(tǒng)系數(shù)矩陣構(gòu)造預(yù)1則方程1r利用已知值對未知值進(jìn)行預(yù)測圖1預(yù)測實(shí)現(xiàn)框圖3. 仿真結(jié)果及分析仿真分為三組進(jìn)行,分別是固定系數(shù)矩陣 a的股價(jià)預(yù)測圖樣;迭代更新系數(shù)矩陣 a的股價(jià) 預(yù)測圖樣;加窗更新系數(shù)矩
6、陣 a的股價(jià)預(yù)測圖樣。3.1固定系數(shù)矩陣a的股價(jià)預(yù)測仿真采用1000個股票收盤價(jià)格構(gòu)建預(yù)測方程,來預(yù)測接下來300個股票收盤價(jià)格,具體仿真如下圖所示:(a)實(shí)際值預(yù)測值格價(jià)盤收票股280026002400實(shí)際值預(yù)測值格價(jià)盤收票股40'120200601008002OO8t)2O602180160o O o O4 2格價(jià)盤收票股u A'i,/(b)實(shí)際值 預(yù)測值I9280026002400實(shí)際值預(yù)測值格價(jià)盤收票股第18頁共15頁圖2固定系數(shù)矩陣時(shí)不同階數(shù)下股票價(jià)格預(yù)測圖圖2所示為利用前1000個數(shù)據(jù)求得系數(shù)矩陣a之后對接下來300個股票價(jià)格的預(yù)測圖,藍(lán)色為股票價(jià)格實(shí)際值,紅色為股
7、票價(jià)格預(yù)測值。圖中(a)、(b)、( c)、( d)分別代表階數(shù)為10、50、100、200時(shí)的不同情況。從圖中可以看出,在階數(shù)為 10時(shí),股票價(jià)格預(yù)測效 果較差;當(dāng)階數(shù)為50和100時(shí),預(yù)測效果有較大提升;而在階數(shù)為 200時(shí),出現(xiàn)過度擬合的 情況,預(yù)測效果開始下降。四種不同階數(shù)的預(yù)測均方誤差如表I所示:表I不同階數(shù)下股票價(jià)格預(yù)測均方誤差10501005.73281.65523.8745階數(shù)均方誤差(104)6.0020從表I中可以看出,階數(shù)位于10100之間時(shí),具有最優(yōu)預(yù)測。3.2迭代更新系數(shù)矩陣a的股價(jià)預(yù)測本節(jié)中,我們利用原始數(shù)據(jù)求解系統(tǒng)系數(shù)矩陣 a,利用該系數(shù)矩陣a構(gòu)建預(yù)測方程,通過
8、預(yù)測方程求解接下來的一個值,再將該值代入,更新系數(shù)矩陣 a,實(shí)現(xiàn)一種交叉迭代的預(yù)測求 解。仿真采用1000個股票收盤價(jià)格構(gòu)建預(yù)測方程,來預(yù)測接下來 1000個股票收盤價(jià)格,具體 仿真如下圖所示:300028003000280000620024格價(jià)盤收票股002200實(shí)際值預(yù)測值602 O642O864 O40'20022o O o OO 82 1o O o O6 4格價(jià)盤收票股實(shí)際值 預(yù)測值002O40006008008642O0062002400230002800004o o o O o o o O 2 0 8 62 2 11格價(jià)盤收票股$I S4.(a)b)實(shí)際值預(yù)測值3000一,
9、實(shí)際值預(yù)測值1000 IIIIIIIIII0200400600800100012001400160018002000數(shù)據(jù)量28001000 IIIIIIIIII0200400600800100012001400160018002000數(shù)據(jù)量(C)(d)圖3迭代更新系數(shù)矩陣時(shí)不同階數(shù)下股票價(jià)格預(yù)測圖圖3中(a)、( b)、( c)、( d)分別為階數(shù)取10、50、100和200時(shí)的股票價(jià)格預(yù)測 圖,從圖中可以看出,由于對系數(shù)矩陣 a進(jìn)行不斷的迭代更新,因此求得的預(yù)測值近似為線性 預(yù)測,即只能預(yù)測股票的升降趨勢。觀察之前1000個數(shù)據(jù)可知,股票價(jià)格以下降趨勢為主,因此在這里的預(yù)測函數(shù)為一近似單調(diào)遞
10、減的線性函數(shù)。3.3加窗更新系數(shù)矩陣a的股價(jià)預(yù)測考慮到3.2中系數(shù)矩陣a是在每次得到新的預(yù)測值就進(jìn)行更新,在本節(jié)中,我們利用前1000 個股價(jià)預(yù)測接下來長度為 m的股價(jià),m即為我們加窗的長度。在這里我們?nèi)為一系列的值,分別為50、100、200、300和400。通過預(yù)測的估計(jì),更新系統(tǒng)矩陣 a,進(jìn)而預(yù)測接下來的股 價(jià)。仿真時(shí)階數(shù)分別取為100和300,顯示如下圖所示:28002600實(shí)際值預(yù)測值2800|實(shí)際*值2600 .預(yù)測值10000200400600 800數(shù)據(jù)量100012001400200400600800數(shù)據(jù)量100012001400(a)( b)圖4加窗長度為50時(shí)不同階數(shù)下
11、的股價(jià)預(yù)測圖格價(jià)盤收票股-0.50200400600 800數(shù)據(jù)量x 1028實(shí)際值預(yù)測值1000 120076543210-114000200400600800100012001400數(shù)據(jù)量a實(shí)際值預(yù)測值(b)圖5加窗長度為100時(shí)不同階數(shù)下的股價(jià)預(yù)測圖格價(jià)盤收票股10數(shù)據(jù)量I 00U實(shí)際值 預(yù)測值(b)圖6加窗長度為200時(shí)不同階數(shù)下的股價(jià)預(yù)測圖00實(shí)際值預(yù)測值格價(jià)盤收票股008200400210000200400600 800數(shù)據(jù)量1000120014000Q62006格價(jià)盤收票股1000a)(b)圖7加窗長度為300時(shí)不同階數(shù)下的股價(jià)預(yù)測圖0082100001000o O602 2O4
12、0210001000數(shù)據(jù)量;實(shí)際值預(yù)測值o o o O o o o O 2 0 8 62 2 11格價(jià)盤收票股數(shù)據(jù)量(a)(b)圖8加窗長度為400時(shí)不同階數(shù)下的股價(jià)預(yù)測圖觀察以上各圖可知,加窗長度為 100、200和300時(shí),預(yù)測值和實(shí)際值具有較大偏差。而 當(dāng)加窗長度為50和400時(shí),效果較之前三種有較大提高。其中當(dāng)階數(shù)為100時(shí),預(yù)測結(jié)果近似于線性,當(dāng)階數(shù)為300時(shí),兩者均具有較好的預(yù)測。其中,加窗長度為50時(shí),具有最佳預(yù)測效果。從以上仿真結(jié)果可以看出,預(yù)測準(zhǔn)確性和加窗長度和階數(shù)有關(guān)。所以,為了獲得較好的預(yù) 測效果,需要選擇合適的加窗長度和階數(shù)。4. 結(jié)束語本次實(shí)驗(yàn)是基于AR模型的股票價(jià)格
13、預(yù)測,在實(shí)驗(yàn)中我們使用Yule-Walker方程對系統(tǒng)系 數(shù)矩陣a進(jìn)行求解,通過求解得到的系數(shù)矩陣 a構(gòu)造預(yù)測方程。同時(shí),在仿真中我們討論了使 用不同的方法對系數(shù)矩陣a進(jìn)行優(yōu)化,分別為固定系數(shù)矩陣a的股價(jià)預(yù)測;迭代更新系數(shù)矩陣 a的股價(jià)預(yù)測;加窗更新系數(shù)矩陣a的股價(jià)預(yù)測。實(shí)驗(yàn)結(jié)果表明,在固定系數(shù)矩陣a的情況下, 預(yù)測的準(zhǔn)確性和階數(shù)的選取有關(guān); 而在更新系數(shù)矩陣a的情況下,預(yù)測的準(zhǔn)確性和加窗長度及 階數(shù)均有關(guān)。5. 附錄股票價(jià)格數(shù)據(jù)命名為 XX ' o%不更新A值clcclearload ('xx.mat'); data = xx(:,1)' p = 200;L
14、= 1000; MSE = 0;datal = data(1:L);y = data(p+1:L): for i = 1:pY(:,p-i+1) = data(i:L-p+i-1): enda = -i nv(Y'*Y)*Y '*y;for i = L+1:le ngth(data)data1(i) = data1(i-p:i-1)*(-a);endfor i = 1000:1300MSE = MSE+(data(i)-data1 (i) )A2;endMSE = MSE/300;figure(1) plot(data(1:1500),'b');hold on
15、plot(data1(1:1500),'r'); xlabel('數(shù)據(jù)量');ylabel('股票收盤價(jià)格'); legend('實(shí)際值預(yù)測值');axis(0 1300 1000 2800);%每次預(yù)測一個點(diǎn),代入更新a值 clcclear all load ('xx.mat'); data = xx(:,1)' p = 200;L = 1000;data1 = data(1:L);for i = L+1:le ngth(data)y = data1(p+1:L)'for j = 1:pfor k
16、 = 1:(L-p)Y (k,j) = data1(p-j+1+k-1);endendY1 = Y:K = in v( Y1*Y);a = -inv(Y 1* Y)*Y 1*y; data1(i) = data1(i-1:-1:i-p)*(-a);endfigure(2)plot(data(1:2000),'b');hold onplot(data1(1:2000),'r');xlabel('數(shù)據(jù)量');ylabel('股票收盤價(jià)格');lege nd('實(shí)際值預(yù)測值');%加窗的預(yù)測,窗的長度分別為100、200
17、、300、400、500clcclearload ('xx.mat');data = xx(:,1)'p = 300;L = 1000;L_list = 50 100 200 300 400;select_ nu mber = 5;data1 = data(1:L);for i = 0:30ydata1(L_list(select_ number)*i+(p+1):L_list(select_ numb er)*i+L)'for j = 1:pfor k = 1:(L-p)Y (k,j) = data1(L_list(1)*i+p-j+1+k-1);endend%a(:,i+1) = -in v( Y'* Y)*Y '*y;a = -i nv(Y'*Y )* Y'*y;for m = 1:L_list(select_ number)data1(L+L_list(select_
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 昆蟲涂色課程設(shè)計(jì)
- 拒絕浪費(fèi)糧食的宣傳橫幅標(biāo)語(125句)
- 護(hù)士一周工作總結(jié)模板
- 文化基礎(chǔ)課程設(shè)計(jì)
- 心痛感言30句范文
- 拒絕浪費(fèi)糧食倡議書范文(7篇)
- 化工課程設(shè)計(jì)精餾塔序言
- 奧創(chuàng)中心小班課程設(shè)計(jì)
- 2024年標(biāo)準(zhǔn)化合作社運(yùn)營合同模板版B版
- 2025年山東淄博沂源縣教體系統(tǒng)事業(yè)單位緊缺教師招聘30人歷年管理單位筆試遴選500模擬題附帶答案詳解
- 剛曉觀所緣緣論略講
- 雙橋靜力觸探分層統(tǒng)計(jì)及承載力表0421
- 形勢任務(wù)教育宣講材料第一講——講上情
- 八卦五行-PPT課件
- ISO8573-2測定懸浮狀油含量的試驗(yàn)方法學(xué)習(xí)資料
- 中國地質(zhì)大學(xué)(武漢)教育發(fā)展基金會籌備成立情況報(bào)告
- 薪酬管理試卷及答案
- 大學(xué)無機(jī)及分析化學(xué)----氣體練習(xí)題及答案
- 保險(xiǎn)行業(yè)新會計(jì)準(zhǔn)則實(shí)施指南征求意見稿
- 形式發(fā)票模板 PI模板 英文版
- 初一的最美的風(fēng)景高分的作文600字
評論
0/150
提交評論