![基于Clementine軟件的時間序列分析以浦發(fā)銀行股票為例_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/2/ffac5c01-83d7-4183-8ed1-1e754ce8c69d/ffac5c01-83d7-4183-8ed1-1e754ce8c69d1.gif)
![基于Clementine軟件的時間序列分析以浦發(fā)銀行股票為例_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/2/ffac5c01-83d7-4183-8ed1-1e754ce8c69d/ffac5c01-83d7-4183-8ed1-1e754ce8c69d2.gif)
![基于Clementine軟件的時間序列分析以浦發(fā)銀行股票為例_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/2/ffac5c01-83d7-4183-8ed1-1e754ce8c69d/ffac5c01-83d7-4183-8ed1-1e754ce8c69d3.gif)
![基于Clementine軟件的時間序列分析以浦發(fā)銀行股票為例_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/2/ffac5c01-83d7-4183-8ed1-1e754ce8c69d/ffac5c01-83d7-4183-8ed1-1e754ce8c69d4.gif)
![基于Clementine軟件的時間序列分析以浦發(fā)銀行股票為例_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/2/ffac5c01-83d7-4183-8ed1-1e754ce8c69d/ffac5c01-83d7-4183-8ed1-1e754ce8c69d5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、基于Clementine軟件的時間序列分析以A股浦發(fā)銀行(600000)股票為例摘 要本文的主要內(nèi)容是借助SPSS Clementine 軟件研究A股浦發(fā)銀行(600000)股票價格隨時間的變化規(guī)律,并用時間序列分析的有關(guān)知識對其進行建模預(yù)測。本文首先對Clementine軟件作簡要介紹,說明其在數(shù)據(jù)挖掘領(lǐng)域的廣泛應(yīng)用;然后介紹了3種時間序列分析預(yù)測的模型,分別為專家模型、Holt指數(shù)平滑模型和ARIMA模型;最后借助Clementine 軟件對浦發(fā)銀行股價分別進行專家建模、指數(shù)平滑建模和ARIMA建模,并對股價進行短期預(yù)測,通過模型參數(shù)比較及預(yù)測值誤差對比,找出最佳模型。在建模的同時,也給出
2、了使用Clementine軟件建立數(shù)據(jù)流的具體過程。關(guān)鍵詞:Clementine軟件 時間序列 浦發(fā)銀行股票一、 引言數(shù)據(jù)挖掘是一個利用各種方法,從海量數(shù)據(jù)中提取隱含和潛在的對決策有用的信息和模式的過程。通過數(shù)據(jù)挖掘提取的信息可應(yīng)用于很多領(lǐng)域,如決策支持、預(yù)測、預(yù)報和估計等。當(dāng)今我們正面臨這樣一個問題,一邊是對知識的饑渴,另一邊卻是大量數(shù)據(jù)的閑置未被利用,“我們被淹沒在信息里,但卻感受到知識的饑餓”。因此,我們迫切需要借助數(shù)據(jù)挖掘技術(shù)對這些數(shù)據(jù)進行及時有效的處理,從這些海量的、有噪音的、隨機的數(shù)據(jù)中提取有效的、潛在有用的而又新穎事先未知的信息 1。數(shù)據(jù)挖掘的工具有很多,本文選用SPSS Cle
3、mentine軟件。二、 Clementine軟件簡介Clementine是由SPSS公司開發(fā)的一款著名且非常實用的數(shù)據(jù)挖掘軟件,也是目前眾多軟件中最成熟和最受歡迎的一款數(shù)據(jù)挖掘產(chǎn)品。Clementine擁有豐富的數(shù)據(jù)挖掘算法,操作簡單易用,分析結(jié)果直觀易懂,圖形功能強大,支持與數(shù)據(jù)庫之間的數(shù)據(jù)和模型交換,可以使用戶方便快捷地實現(xiàn)數(shù)據(jù)挖掘。Clementine形象地將數(shù)據(jù)分析的各個環(huán)節(jié)表示成若干個節(jié)點,將數(shù)據(jù)分析過程看作數(shù)據(jù)在各個節(jié)點之間的流動,并通過圖形化的數(shù)據(jù)流方式直觀表示整個數(shù)據(jù)挖掘的各個環(huán)節(jié)。Clementine在數(shù)據(jù)挖掘分析中被應(yīng)用于分類預(yù)測問題方面非常多,但是它的其他功能也十分強大
4、,如可以把Clementine軟件運用在探索內(nèi)部結(jié)構(gòu)、多元統(tǒng)計分析、時間序列預(yù)測等領(lǐng)域。由于利用Clementine做分類預(yù)測(決策樹)問題比較常見,因此本文強調(diào)它的另一功能,即利用Clementine做時間序列分析。三、 數(shù)據(jù)來源及研究方法1. 數(shù)據(jù)來源 本文所用數(shù)據(jù)為A股浦發(fā)銀行 (600000) 股票2012年2月13日到2012年11月23日股價數(shù)據(jù),來自大智慧軟件。數(shù)據(jù)見附件1(Excel文件)。2. 研究方法本文利用時間序列分析知識并結(jié)合Clementine軟件對A股浦發(fā)銀行 (600000) 股票每日行情數(shù)據(jù)進行建模分析,與原始數(shù)據(jù)比較擬合并根據(jù)參數(shù)選擇最佳模型。本文所用到的模型
5、有:專家建模模型、Holt指數(shù)平滑模型和ARIMA(求和自回歸移動平均)模型。(1)專家模型Clementine軟件里一種可以自動預(yù)測的建模方法,自動進行最優(yōu)模型的選擇、參數(shù)估計和預(yù)測。(2) Holt指數(shù)平滑模型Holt指數(shù)平滑法是一種線性指數(shù)平滑方法,它是一種較高級形式的指數(shù)平滑方法。這種方法最突出的優(yōu)點是對具有趨勢變動的時間數(shù)列,不用二次指數(shù)平滑,而是對趨勢數(shù)據(jù)直接進行平滑并對原時間序列進行預(yù)測。這種方法因具有很大的靈活性而被廣泛地使用著。Holt指數(shù)平滑適用于對含有線性趨勢的序列進行修勻。它的基本思想是假定序列有一個比較固定的線性趨勢:。其平滑公式為:式中,為兩個平滑系數(shù),滿足條件。假
6、定最后一期的修勻值為,那么使用Holt指數(shù)平滑法向前期的預(yù)測值為:.(3) ARIMA模型ARIMA模型全稱為求和自回歸移動平均模型(Autoregressive Integrated Moving Average Model,簡記ARIMA),是由Box和Jenkins于70年代初提出的一種著名時間序列預(yù)測方法。其中在ARIMA()中,AR是自回歸,為自回歸項數(shù);MA是移動平均,為移動平均項數(shù);為時間序列成為平穩(wěn)時所做的差分次數(shù)。 ARIMA模型是將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,然后將因變量僅對它的滯后值以及隨機誤差項的現(xiàn)值和滯后值進行回歸所建立的模型。其公式為:式中,;,為平穩(wěn)可逆AR
7、MA()模型的自回歸系數(shù)多項式;,為平穩(wěn)可逆ARMA()模型的移動平滑系數(shù)多項式。四、 實證分析以浦發(fā)銀行股票為例以浦發(fā)銀行2012年2月13日至2012年11月23日每日收盤價作為數(shù)據(jù)源,利用Clementine軟件對這些數(shù)據(jù)進行分析。建立的數(shù)據(jù)流如圖1所示。圖1 浦發(fā)銀行股票股價數(shù)據(jù)流簡要步驟如下:1. 數(shù)據(jù)過濾:建模過程中考慮到數(shù)據(jù)源中除了“日期”、“收盤價”字段外,還包含了“開盤價”、“最高”、“最低”、“成交量”、“成交額”等無關(guān)字段,所以需要先對字段進行過濾,利用Filter節(jié)點可得到我們想要的結(jié)果。2. 在Type節(jié)點中,將“日期”的類型改為Typeless,將“收盤價”的方向改
8、為Out。3. 通過Derive節(jié)點計算出浦發(fā)銀行每日收盤價的對數(shù),并連接Time Plot節(jié)點,得到收盤價和log(收盤價)的時間序列散點圖,如圖2所示。圖2 收盤價及l(fā)og(收盤價)的時序圖在圖2所示的時間序列圖中,浦發(fā)銀行每日收盤價是均值非平穩(wěn)且方差非平穩(wěn)的,且log(收盤價)有不變方差的向下趨勢,故可以選擇對數(shù)變換。4. 由于股票市場雙休日及節(jié)假日不開市的特殊性,收集到的數(shù)據(jù)在時間段上是分段的,也就是說,在不開市的時間點,數(shù)據(jù)缺失。為了方便利用模型來分析,我們通過填充的辦法使得數(shù)據(jù)(收盤價)在以天為時間單位上能夠連續(xù)。具體操作為添加Time Interval節(jié)點,連接到數(shù)據(jù)流合適的位置
9、,在Build選項卡中選擇Specify fields and functions,選中“收盤價”并在Padding Function(填充函數(shù))選項卡選擇Mean of recent points(最近點的平均值),如圖3所示。圖3 Time Interval節(jié)點選項的設(shè)置對股票研究的意義在于能夠在一定時間段內(nèi)對股價進行較為準確地預(yù)測,而預(yù)測時間越長誤差越大,尤其是對股票這類數(shù)據(jù)的預(yù)測,無法長時間較準確地預(yù)測,故我們只進行短期預(yù)測。因此在Forecast選項卡中,選擇預(yù)測天數(shù)為14天。5. 模型的建立(1)專家模型 在節(jié)點工具箱窗口中選擇Modeling選項,找到Time Series節(jié)點,
10、添加到數(shù)據(jù)流合適的位置。Model選項卡中Method(方法)選擇Expert Modeler(專家模型),Criteria選項卡中選擇All models,確定執(zhí)行即可得到專家模型,如圖4所示。圖4 專家模型參數(shù)設(shè)置(2) Holt指數(shù)平滑模型同上添加Time Series節(jié)點,Model選項卡中Method(方法)選擇Exponential Smoothing(指數(shù)平滑模型),Criteria選項卡中選擇Holts linear trend,確定執(zhí)行即可得到Holt指數(shù)平滑模型,如圖5所示。圖5 Holt指數(shù)平滑模型參數(shù)設(shè)置(3)ARIMA()模型 同上添加Time Series節(jié)點,Mo
11、del選項卡中Method(方法)選擇ARIMA(求和自回歸移動平均),Criteria選項卡中對自回歸(),差(),移動平均()進行賦值,確定執(zhí)行即可得到ARIMA模型。在此,我們通過對模型的觀察及其他各方面考慮,對()賦值為(2,1,2),如圖6所示。圖6 ARIMA模型參數(shù)設(shè)置最終得到的三個模型的數(shù)據(jù)流如圖7(a)、圖7(b)、圖7(c)所示。圖7(a) 專家模型數(shù)據(jù)流圖7(b) Holt指數(shù)平滑模型數(shù)據(jù)流圖7(c) ARIMA(2,1,2)模型數(shù)據(jù)流6. 模型分析及比較 在數(shù)據(jù)流上雙擊模型,打開模型參數(shù)界面,可以看到關(guān)于模型的一系列參數(shù)?,F(xiàn)將三個模型的部分參數(shù)匯總?cè)绫?所示。表1 浦發(fā)
12、銀行股票股價收盤價模型比較固定QDfSigRMSEMAPEMAEHolt指數(shù)平滑0.5840.98619.46816.00.2450.0890.6770.055專家模型0.030.98620.09617.00.2690.0790.6720.054ARIMA(2, 1, 2)0.0560.98615.28414.00.3590.0780.6750.055其中,固定R2用于比較模型的平穩(wěn)部分及簡單均值模型的度量值。當(dāng)存在趨勢或季節(jié)模式時,該度量值對普通 R 平方更具優(yōu)勢。R2為判定系數(shù),是序列中由模型解釋的總變異所占比例的估計值,該值越高表示模型的擬合越好。Q、Df分別代表模型的檢驗統(tǒng)計量和自由度
13、。Sig表示殘差自相關(guān)檢驗結(jié)果的值,若<005,則認為殘差存在自相關(guān)性,模型擬合不足,需改進;若>005,則認為殘差為白噪聲序列,即表明所建模型已包含了原序列的所有趨勢。RMSE指均方根誤差,是一種測量序列實際值與模型預(yù)測值之間差異的度量方法,該誤差越低越好。MAPE表示均值絕對百分比誤差,用于度量目標序列與其模型預(yù)測水平的差異度,用百分比表示。通過審查所有模型中的均值和最大值,可以大概知道預(yù)測的不確定性程度。MAE表示絕對平均誤差,用于顯示預(yù)測誤差絕對值的均值。接下來再考慮殘差的自相關(guān)性和偏自相關(guān)性,可通過殘差自相關(guān)圖(ACF)及偏自相關(guān)圖(PACF)得出結(jié)果。殘差是指觀測值與預(yù)
14、測值(擬合值)之間的差,即是實際觀察值與回歸估計值的差。三個模型建模所得的殘差自相關(guān)圖(ACF)及偏自相關(guān)圖(PACF)分別如圖8(a)、8(b)、8(c)所示,可以看出三個模型殘差的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)幾乎都在兩倍(2)標準差范圍內(nèi),說明對殘差序列的信息提取充分,不存在欠擬合的問題。圖8(a) 專家模型的殘差A(yù)CF和PACF圖8(b) Holt指數(shù)平滑模型的殘差A(yù)CF和PACF圖8(c) ARIMA模型的殘差A(yù)CF和PACF最后考察分別用3個模型做預(yù)測所得的結(jié)果和真實值的擬合效果圖,所得結(jié)果如圖9(a)、9(b)、9(c)所示。圖9(a) 專家模型擬合預(yù)測圖圖9(b) Holt指數(shù)平滑模
15、型擬合預(yù)測圖圖9(c) ARIMA模型擬合預(yù)測圖其中,藍線為真實值,紅線為預(yù)測值。由圖9可知,三個模型的擬合效果都是很好的。將用3個模型建模所得的浦發(fā)銀行股票收盤價的預(yù)測值分別與真實值進行比較,結(jié)果如表2所示。表2 3個模型預(yù)測值與真實值的比較日期指數(shù)平滑模型差值專家模型差值A(chǔ)RIMA模型差值真實值2012-11-267.4744 0.0044 7.4959 0.0259 7.4891 0.0191 7.472012-11-277.4680 0.0080 7.4959 0.0359 7.4859 0.0259 7.462012-11-287.4616 0.0216 7.4959 0.0559
16、7.4778 0.0378 7.442012-11-297.4553 0.0453 7.4959 0.0859 7.4707 0.0607 7.412012-11-307.4489 -0.0111 7.4959 0.0359 7.4665 0.0065 7.462012-12-37.4298 0.0798 7.4959 0.1459 7.4518 0.1018 7.352012-12-47.4234 -0.0066 7.4959 0.0659 7.4464 0.0164 7.432012-12-57.4171 -0.4629 7.4959 -0.3841 7.4416 -0.4384 7.88
17、2012-12-67.4107 -0.4793 7.4959 -0.3941 7.4367 -0.4533 7.892012-12-77.4044 -0.8556 7.4959 -0.7641 7.4315 -0.8285 8.26五、 結(jié)論通過對以上結(jié)果的分析,我們可以得到下述結(jié)論:首先,從對數(shù)散點圖得知浦發(fā)銀行股票股價有不變方差變化的趨勢,則固定R2更有參考價值。固定R2用于比較模型的平穩(wěn)部分及簡單均值模型的度量值,當(dāng)存在趨勢或季節(jié)模式時,該度量值比普通R2更具優(yōu)勢。其中專家模型擬合程度(固定R2值)為0.03,Holt指數(shù)平滑模型擬合程度為0.584,ARIMA(2,1,2)模型擬合程度
18、為0.056,所以Holts指數(shù)平滑模型擬合程度更好。其次,對R2,RMSE,MAPE,MAE這幾個指標進行對比,三個模型的R2都是相等的,均為0.986,其余三個指標相差不大(如表1所示)。再次,三個模型的Sig值(即值)均大于0.05,均為顯著可行,即三個模型的殘差均為白噪聲序列,表明所建模型已包含了原序列的所有趨勢,也即模型診斷得以通過。最后,對比A股浦發(fā)銀行股票股價的真實值與預(yù)測值之間的差異發(fā)現(xiàn),專家模型在本例中的預(yù)測值沒有變化,沒能體現(xiàn)出浦發(fā)銀行股價的趨勢。而Holt指數(shù)平滑模型比ARIMA(2,1,2)模型的預(yù)測精度要高,特別體現(xiàn)在短期預(yù)測方面,Holt指數(shù)平滑模型的預(yù)測值和真實值之差要比其他兩個模型小得多。故綜合以上幾個方面,我們可以得出結(jié)論,對于本例預(yù)測A股浦發(fā)銀行 (600000)股票股價來說,Holt指數(shù)平滑模型是三個模型中最可行的。Clementine軟件在數(shù)據(jù)挖掘方面有很大的使用空間,并在很大程度上簡化了時間序列建模的過程。Clementine軟件在金
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 貨物陸運合同范文范本模板
- 物業(yè)管理的噪音與污染管理
- 我國自動駕駛車路協(xié)同發(fā)展現(xiàn)狀分析
- 人臍帶間充質(zhì)干細胞通過抑制NLRP3介導(dǎo)的滑膜細胞焦亡減輕膝骨關(guān)節(jié)炎
- 擴張法與Nagata法治療小耳畸形的療效對比分析
- 2025年岳麓版選擇性必修2歷史上冊階段測試試卷含答案
- 智能家居產(chǎn)品銷售代理合同(2篇)
- 2025年外研銜接版九年級歷史下冊月考試卷含答案
- 服裝購買合同協(xié)議書范本(2篇)
- 2025年外研版三年級起點選擇性必修1歷史上冊階段測試試卷
- 中小商業(yè)銀行數(shù)字化轉(zhuǎn)型現(xiàn)狀及對策研究
- 親子非暴力溝通培訓(xùn)講座
- 保險投訴處理流程培訓(xùn)
- JJG 707-2014扭矩扳子行業(yè)標準
- 2025財年美國國防預(yù)算概覽-美國國防部(英)
- 2024年江西省南昌市中考一模數(shù)學(xué)試題(含答案)
- 《采暖空調(diào)節(jié)能技術(shù)》課件
- CONSORT2010流程圖(FlowDiagram)【模板】文檔
- 游戲綜合YY頻道設(shè)計模板
- 中興ZCTP 5GC高級工程師認證考試題庫匯總(含答案)
- 大學(xué)生創(chuàng)新創(chuàng)業(yè)教程PPT全套完整教學(xué)課件
評論
0/150
提交評論