金融數(shù)據(jù)分析 課件 第1、2章 導(dǎo)論、金融時間序列線性模型_第1頁
金融數(shù)據(jù)分析 課件 第1、2章 導(dǎo)論、金融時間序列線性模型_第2頁
金融數(shù)據(jù)分析 課件 第1、2章 導(dǎo)論、金融時間序列線性模型_第3頁
金融數(shù)據(jù)分析 課件 第1、2章 導(dǎo)論、金融時間序列線性模型_第4頁
金融數(shù)據(jù)分析 課件 第1、2章 導(dǎo)論、金融時間序列線性模型_第5頁
已閱讀5頁,還剩168頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

金融數(shù)據(jù)分析參考教材RueySTsay.AnIntroductiontoAnalysisofFinancialDatawithR,3Ed,AJohnWiley&Sons,INC.2013RueySTsay著,李洪城等譯,金融數(shù)據(jù)分析導(dǎo)論:基于R語言,機(jī)械工業(yè)出版社,2013.戴維·羅伯特,金融統(tǒng)計與數(shù)據(jù)風(fēng)險,機(jī)械工業(yè)出版社,2020陳夢根,金融統(tǒng)計學(xué),中國統(tǒng)計出版社,2021.軟件學(xué)習(xí)網(wǎng)頁/forum-5-1.html;人大經(jīng)濟(jì)論壇-計量經(jīng)濟(jì)學(xué)與統(tǒng)計軟件/;統(tǒng)計之都論壇第一章導(dǎo)論

學(xué)習(xí)目標(biāo)

了解金融計量學(xué)的建模步驟、金融數(shù)據(jù)的主要類型和來源。熟悉R和Python語言的基本操作。掌握各類收益率的計算、分布特征和金融數(shù)據(jù)的可視化。通過疫情期間中美股指收益率對比,體現(xiàn)我國金融風(fēng)險的可控性以及我國制度優(yōu)越性。1.1

金融數(shù)據(jù)分析概述

1.2

常見的統(tǒng)計分布

1.3

收益率及其分布特征

1.4R軟件和Python軟件介紹

1.5專題:金融數(shù)據(jù)的可視化

目錄CONTENTS金融數(shù)據(jù)分析概述1.11.1.1金融數(shù)據(jù)分析的含義

數(shù)據(jù)分析定義為,使用適當(dāng)?shù)慕y(tǒng)計方法,對收集來的大量數(shù)據(jù)進(jìn)行分析,并加以匯總、理解和消化,最大化開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。它包含“數(shù)據(jù)”和“分析”兩個方面,其中數(shù)據(jù)用以量化現(xiàn)狀,消除模糊,分析可以得到變量之間的相互關(guān)系,解釋相關(guān)現(xiàn)象。

金融數(shù)據(jù)分析關(guān)注金融領(lǐng)域的數(shù)據(jù)獲取、分析、展示及其在數(shù)據(jù)可視化、風(fēng)險管理、投資組合優(yōu)化、金融建模等方面的應(yīng)用,旨在幫助金融機(jī)構(gòu)和投資者做出理性和有效的決策。它通過經(jīng)濟(jì)學(xué)、統(tǒng)計學(xué)、數(shù)學(xué)和計算機(jī)科學(xué)等方法,系統(tǒng)地解讀和分析金融市場數(shù)據(jù)(如股票價格、收益率、匯率等)和財務(wù)數(shù)據(jù)(財務(wù)指標(biāo)、財務(wù)報表等)。1.1.2金融數(shù)據(jù)的主要類型和來源

金融數(shù)據(jù)的主要類型時間序列數(shù)據(jù)截面數(shù)據(jù)面板數(shù)據(jù)

金融數(shù)據(jù)的來源專業(yè)性網(wǎng)站專業(yè)數(shù)據(jù)公司和信息公司抽樣調(diào)查金融文本挖掘1.1.3金融數(shù)據(jù)分析步驟第一步,確定研究問題。第二步,數(shù)據(jù)收集和整理。第三步,探索性數(shù)據(jù)分析。第四步,數(shù)據(jù)分析與可視化。第五步,解釋和改進(jìn)。常見的統(tǒng)計分布1.2

1.2.1正態(tài)分布

在金融計量分析時,常常假設(shè)資產(chǎn)收益率服從正態(tài)分布,其原因還是源于正態(tài)分布具有良好的統(tǒng)計特征。但事實上,假設(shè)資產(chǎn)收益率服從正態(tài)分布是不合理的,原因有三個方面。一:簡單收益率一定大于等于-100%,但正態(tài)分布卻沒有這樣的限制。二:多期毛收益率是單期毛收益率的乘積,不再服從正態(tài)分布。三:收益率分布大多是厚尾的,不符合正態(tài)分布的尾部特征。

1.2.2對數(shù)正態(tài)分布

R代碼>x=seq(0,1,by=0.01)>curve(dlnorm(x,meanlog=0,sdlog=1),from=0,to=10)

1.2.3學(xué)生t分布

1.2.4廣義誤差分布在時間序列分析中,廣義誤差分布有時也會被用到,其概率密度函數(shù)為:

1.2.5穩(wěn)態(tài)分布

穩(wěn)態(tài)分布是正態(tài)分布的自然推廣,其在加法運(yùn)算下是穩(wěn)定的,這一點(diǎn)滿足對數(shù)收益率的要求。

穩(wěn)態(tài)分布能刻畫股票的歷史收益率所顯現(xiàn)的超額峰度。非正態(tài)的穩(wěn)態(tài)分布沒有有限方差,這一點(diǎn)與大部分金融理論相矛盾。

用非正態(tài)的穩(wěn)態(tài)分布進(jìn)行統(tǒng)計建模是很困難的。非正態(tài)穩(wěn)態(tài)分布的例子是柯西分布,其關(guān)于中位數(shù)對稱,方差是無限的。

1.2.6極值分布

極值分布是指在概率論中極大值(或者極小值)的概率分布,是從很多個彼此獨(dú)立的極大值中挑出來的各個極大值應(yīng)當(dāng)服從的概率密度分布。

極值分布包括廣義極值分布、廣義Pareto分布等,極值分布在金融風(fēng)險計量分析中是一個常用的分布。在第六章我們將詳細(xì)論述。收益率及其分布特征1.31.3.1常見的收益率類型

大多數(shù)金融研究都是從資產(chǎn)價格的時間序列開始的,如滬深300指數(shù)每天的收盤價、國際原油的每日價格等。但在金融計量上,使用更多的卻是資產(chǎn)收益率。其原因是收益率序列統(tǒng)計特性良好,而且具備無量綱等優(yōu)點(diǎn)。常用的收益率包括:單期簡單收益率和多期簡單收益率連續(xù)復(fù)利收益率對數(shù)收益率資產(chǎn)組合收益率當(dāng)期收益率與到期收益率1.單期簡單收益率和多期簡單收益率

設(shè)Pt是t時刻的資產(chǎn)價格。從t-1至t日,持有該資產(chǎn)的投資者,其單期簡單毛收益率(1+Rt)為:

與之相對應(yīng)的單期簡單凈收益率(simplenetreturn)或簡單收益率(simplereturn)Rt為:1.單期簡單收益率和多期簡單收益率2.連續(xù)復(fù)利收益率

3.對數(shù)收益率

R代碼library(xts)###加載包library(psych)>data<-read.csv("E://jrjl/Chapter1/GZMTp.csv",header=T)###讀入數(shù)據(jù)>DATE<-data[,1]>date<-as.Date(DATE)>dat<-xts(data[,2],date)>logR<-log(dat)###對數(shù)收益率計算>logr<-diff(logR)>logreturn<-logr[-1,]>date1<-date[-1]>par(mfrow=c(2,2))###可視化>plot(date,dat,main="",lwd=1,xlab="貴州茅臺收盤價",ylab="",type="l")>plot(date1,logreturn,main="",lwd=1,xlab="貴州茅臺收益率",ylab="",type="l")

4.資產(chǎn)組合收益率

5.當(dāng)期收益率與到期收益率1.3.2收益率的分布特質(zhì)

1.隨機(jī)變量的矩及分布特征1.隨機(jī)變量的矩及分布特征1.隨機(jī)變量的矩及分布特征

1.隨機(jī)變量的矩及分布特征

2.樣本矩及分布特征

2.樣本矩及分布特征

2.樣本矩及分布特征

2.樣本矩及分布特征R軟件和Python軟件介紹1.41.4.1R軟件介紹1.4.1R軟件介紹

1.4.1R軟件介紹

設(shè)置工作路徑是啟動Rstudio要做的第一件事。工作路徑的設(shè)置常用有兩種方法。第一種方法是使用setwd函數(shù),這種方法只能是臨時修改路徑,即每打開一次R軟件就需要修改一次路徑;第二種方法是在Tools主菜單下,點(diǎn)擊Globaloptions,進(jìn)一步在defaultworkingdirectory中修改默認(rèn)工作路徑,保存后重新打開軟件即可永久改變工作路徑,具體可見圖1-5。1.4.1R軟件介紹

1.4.1R軟件介紹

(二)Rstudio基本命令

R軟件是專為統(tǒng)計計算和繪圖而產(chǎn)生的語言和環(huán)境,也是一款面向?qū)ο蟮能浖?,可以處理多種類型數(shù)據(jù)。本書選擇在RStudio平臺進(jìn)行,其命令行提示符為“”,在打開軟件后,在其后面進(jìn)行相關(guān)操作。R函數(shù)是R語言的一個基礎(chǔ),而函數(shù)封裝于相對應(yīng)的包中,在實踐中很多包需自行安裝后才可以使用,如下載包“fGarch”,所用到的命令為install.Packages(“fGarch”),其中引號不可省略,否則無法識別,引號中為所需安裝的包,同樣可以在RStudio的Tools目錄下點(diǎn)擊installPackages,如圖1-6所示,在“Packages(separatemultiplewithspaceorcomma)”中輸入需要的包,點(diǎn)擊“Install”進(jìn)行安裝,注意在安裝過程中要聯(lián)網(wǎng),安裝后的包需要加載,命令為library()。1.4.1R軟件介紹

1.4.1R軟件介紹

(三)Rstudio讀寫命令

Rstudio幾乎可以讀取所有主流的文件。常用的文件包括以下三種。第一是純文本文件,其文件擴(kuò)展名為“.txt”,所用的命令為read.table函數(shù);第二是逗號分割文件,其擴(kuò)展名為“.csv”,所用命令為read.table函數(shù)或者read.csv函數(shù),如果使用read.table函數(shù)需要設(shè)置sep參數(shù)為逗號;第三是excel文件,其擴(kuò)展名為“.xls”和“.xlsx”,在讀取之前要先加載openxlsx包,然后使用read.xlsx讀取這兩類文件。

在讀取之前,若文件在當(dāng)前目錄下,直接輸入文件名,若不在當(dāng)前目錄下,需要使用文件的全路徑。若讀取的數(shù)據(jù)為網(wǎng)絡(luò)文件,只需要將read.table的第一個參數(shù)改為網(wǎng)絡(luò)文件具體的地址。

1.4.2Python軟件介紹

(一)軟件安裝

本書在windows系統(tǒng)下載Ananconda并啟動AnacondaNavigator,如圖1-8所示,可以看到多種Python的多種IDE,若有需要,點(diǎn)擊“Install”即可下載。

1.4.2Python軟件介紹

Spyder:與RStudio很相似,其界面分為主窗口、歷史窗口和輸出窗口,分別用于編譯、數(shù)據(jù)存儲和輸出,大小和位置可以自行調(diào)整。JupyterNotebook:可以看作是一種交互式筆記本,便于分步執(zhí)行和顯示結(jié)果,具體見圖1-9,支持運(yùn)行多種編程語言,其本質(zhì)是一個Web應(yīng)用程序,便于創(chuàng)建和共享程序文檔,支持代碼實現(xiàn)和可視化。

1.4.2Python軟件介紹

(二)基本語法介紹Python和R軟件一樣,加載os模塊,使用os.chdir()可以自行修改工作路徑,方便結(jié)果的尋找。Python下載模塊可以直接在conda中選擇,也可以在資源管理器中打開conda,使用命令pipinstallPandas進(jìn)行下載,在程序運(yùn)行前下使用命令importpandasaspd加載該模塊。

Pythons的變量類型包含數(shù)值、字符串、列表、元組和字典,變量賦值所用符號為:“=”,且變量的對象下標(biāo)是由0開始,在編寫程序時要多加注意。Python中的基礎(chǔ)模塊有NumPy、Pandas和Matplotlib,其中NumPy模塊為開源數(shù)值計算擴(kuò)展,可以存儲和處理大型矩陣;Pandas模塊是基于NumPy的一種工具,納入了大量庫和標(biāo)準(zhǔn)數(shù)據(jù)模型,主要解決數(shù)據(jù)分析問題;Matplotlib為Python的2D繪圖庫,通過各種拷貝格式和跨平臺的交互環(huán)境生成圖形。

1.4.2Python軟件介紹

(三)Tensorflow模塊

近年來,人工智能在金融領(lǐng)域廣泛應(yīng)用,其中就包含機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中的一個新方向,在數(shù)據(jù)挖掘、自然語言處理以及其他領(lǐng)域都取得了很多成果。而Python語言作為實現(xiàn)這一分析的工具,需要使用tensorflow模塊。2015年Google以開源形式發(fā)布Tensorflow,該模塊作為生產(chǎn)級深度學(xué)習(xí)庫,擁有巨大用戶群,并且不斷地部署和提供模型以及第三方工具和平臺。關(guān)于該模塊的下載,可以通過Anaconda下載并于Python的IDE進(jìn)行搭載,安裝時要注意Python和tensorflow版本相匹配。專題1.5金融數(shù)據(jù)的可視化

—基于新冠疫情間中美股市波動的對比分析

1.5金融數(shù)據(jù)的可視化本專題將通過分析比較此次疫情對于中美兩國股票市場的影響,說明金融數(shù)據(jù)的可視化。為此,選擇中國滬深300指數(shù)和美國標(biāo)普500指數(shù)分別作為中美兩國金融市場代表性指標(biāo),時間區(qū)間為2020年1月1日至2020年12月31日,頻率為日度,研究新冠肺炎疫情對中美股票市場的影響。

1.5金融數(shù)據(jù)的可視化首先,繪制這兩種指數(shù)的開盤價、最高價、最低價和收盤價的時序圖。圖1-10左半部分為中國滬深300指數(shù)相關(guān)指標(biāo),很明顯這幾個數(shù)據(jù)有很強(qiáng)的相關(guān)性,2020年前后,受新冠疫情的影響,我國股市受到了比較大的沖擊。

1.5金融數(shù)據(jù)的可視化1.5金融數(shù)據(jù)的可視化

接下來對數(shù)據(jù)進(jìn)行一個統(tǒng)計性描述(表1.3),通過樣本均值和分位數(shù)發(fā)現(xiàn):滬深300指數(shù)多數(shù)時間在3500點(diǎn)至5200點(diǎn)之間浮動,在高位和低位持續(xù)的時間較短,這與現(xiàn)實情況相符。標(biāo)普500指數(shù)則從疫情后的2200點(diǎn)低位經(jīng)過一年的拉升才達(dá)到了3800點(diǎn)左右。1.5金融數(shù)據(jù)的可視化

接下來計算滬深300指數(shù)和標(biāo)普500指數(shù)簡單收益率和對數(shù)收益率,結(jié)果如圖1-11所示。從圖中可發(fā)現(xiàn)中美兩國代表性股指簡單收益率和對數(shù)收益率均大致平穩(wěn),它們圍繞一條軸上下波動,相對而言簡單收益率的波動要大于對數(shù)收益率的波動。1.5金融數(shù)據(jù)的可視化

圖1-12展示了中美兩個指數(shù)波動率的時序圖??梢郧宄乜吹?,在2020年年初和2020年年中,我國波動率出現(xiàn)了一個顯著的上升。而美國在2020年初出現(xiàn)了巨大的波動。特別注意的是,在疫情期間,我國經(jīng)濟(jì)整體保持穩(wěn)定狀態(tài),呈現(xiàn)為較小的波動,而美國則出現(xiàn)了較大的波動。1.5金融數(shù)據(jù)的可視化

圖1-13展現(xiàn)的是對數(shù)收益分布的直方圖,從形態(tài)上來看,對數(shù)收益率是近似于正態(tài)分布的。直方圖是分布密度的一個比較粗糙的估計量,從圖1-13中也可以看出,美國標(biāo)普500指數(shù)峰度更大,風(fēng)險更高。1.5金融數(shù)據(jù)的可視化

圖1-14分別演示了由使用三個帶寬的滬深300指數(shù)日和標(biāo)普500指數(shù)的對數(shù)收益率的核密度估計。圖1-14的實曲線來自于Rstudio中的density()函數(shù),具有缺省帶寬。虛線和點(diǎn)線曲線分別具有1/2和1的缺省帶寬。調(diào)諧參數(shù)adjust是缺省帶寬的乘數(shù),所以在三條曲線中,adjust分別為1/2,1和2。1.5金融數(shù)據(jù)的可視化

接下來對數(shù)據(jù)進(jìn)行正態(tài)分布檢驗。Q-Q圖是正態(tài)分布檢驗最常用最直觀的方法,分別進(jìn)行舉例說明:通過Q-Q圖(圖1-15)可以看到,樣本分位數(shù)和理論分位數(shù)并不能很好的擬合,由此我們初步認(rèn)定滬深300股指和標(biāo)普500指數(shù)的對數(shù)收益率都不符合正態(tài)分布。同時可看出,美國標(biāo)普500指數(shù)尾部極端風(fēng)險更大。1.5金融數(shù)據(jù)的可視化新冠疫情不可避免地會對經(jīng)濟(jì)社會造成負(fù)面影響,但不會改變我國經(jīng)濟(jì)長期向好的基本面。從上面的分析我們看出,此次疫情初期,我國股票市場雖然有短期的異常波動性,但并沒有對我國金融市場產(chǎn)生較大影響,我國股票市場完全有能力通過自我調(diào)節(jié)應(yīng)對此次疫情的沖擊。習(xí)題Theending第二章

金融時間序列線性模型

學(xué)習(xí)目標(biāo)

熟悉時間序列的平穩(wěn)性和單位根檢驗;掌握構(gòu)建AR、MA、ARMA模型的基本思想和建模過程;了解季節(jié)模型和長記憶模型的基本步驟和建模過程;了解中國居民消費(fèi)價格指數(shù)的波動規(guī)律,了解中國黨和政府重視民生工程,保持物價穩(wěn)定的決心和能力。

本章導(dǎo)讀

時間序列是指將某一個統(tǒng)計指標(biāo)在不同時間上的各個數(shù)值,按時間先后順序排列而成的序列。時間序列的發(fā)展可以追溯到1927年Yule提出的AR模型和1937年Walker提出的MA模型及將兩個模型合并得到的ARMA模型;隨后標(biāo)志性的事件包括1970年Box和Jenkins中提出的ARIMA模型,1982年Engle提出的ARCH模型,1985年Bollerslov針對多變量的情況提出的GARCH模型。時間序列分析的目的一般有兩個方面:一是認(rèn)識產(chǎn)生觀測序列的隨機(jī)機(jī)制,即建立數(shù)據(jù)生成模型;二是基于序列的已知數(shù)據(jù),對未來的可能取值給出預(yù)測。目前,時間序列在金融數(shù)據(jù)分析中得到了廣泛應(yīng)用。本章將講述時間序列數(shù)據(jù)模型的性質(zhì)、識別、估計與預(yù)測,包括簡單自回歸模型(AR)、簡單移動平均模型(MA)、自回歸移動平均模型(ARMA)、自回歸整合移動平均模型(ARIMA)、季節(jié)模型以及時間序列平穩(wěn)性與單位根檢驗等。2.1相關(guān)性和平穩(wěn)性2.2簡單自回歸模型2.3簡單移動平均模型2.4簡單ARMA模型2.5單位根非平穩(wěn)時間序列2.6季節(jié)模型組合風(fēng)險測度2.7長記憶時間序列模型專題2:基于ARIMA模型的中國居民消費(fèi)價格指數(shù)預(yù)測

目錄CONTENTS相關(guān)性和平穩(wěn)性2.12.1.1相關(guān)性

2.1.1相關(guān)性

2.1.1相關(guān)性

2.1.1相關(guān)性例2.1股票相關(guān)性計算。圖2-1是浦發(fā)銀行股票和工商銀行股票從2007年1月到2021年12月的月收益率的散點(diǎn)圖。從其散點(diǎn)圖中可看出,這兩只股票收益率趨于正相關(guān)。之后分別計算這兩只股票前面所述的三種相關(guān)系數(shù),結(jié)果如下表2-1。相關(guān)系數(shù)種類Pearson相關(guān)系數(shù)Spearman相關(guān)系數(shù)Kendall相關(guān)系數(shù)指標(biāo)數(shù)值0.66740.71930.5536圖2-1浦發(fā)銀行股票月收益率對工商銀行股票月收益率散點(diǎn)圖表2-1浦發(fā)銀行和工商銀行股票收益率相關(guān)性分析2.1.1相關(guān)性R代碼>da=read.table("E://jrjl/Chapter2/pfyh.txt",header=T)>x<-da$gs>y<-da$pf>plot(x,y,xlab="工商銀行月收益率",ylab="浦發(fā)銀行月收益率")>cor(x,y,method="pearson")#計算皮爾遜相關(guān)系數(shù)>cor(x,y,method="spearman")#計算斯皮爾曼相關(guān)系數(shù)>cor(x,y,method="kendall")#計算肯德爾相關(guān)系數(shù)2.1.2平穩(wěn)性

2.1.2平穩(wěn)性

2.1.2平穩(wěn)性

2.1.2平穩(wěn)性

2.1.2平穩(wěn)性

2.1.2平穩(wěn)性

2.1.2平穩(wěn)性

圖2-2收益率序列時序圖和序列的ACF圖2.1.2平穩(wěn)性R代碼>d=read.table("E://jrjl/Chapter2/szzz.txt",header=T)>sse<-ts(d$IdxMonRet,start=c(1991,1),frequency=12)>plot(sse,xlab="年份",ylab="月收益率",main="上證綜指月收益率")>acf(d$IdxMonRet,lag=24,main="上證綜指月收益率")2.1.2平穩(wěn)性

圖2-3工商銀行的月簡單收益率和對數(shù)收益率的自相關(guān)函數(shù)圖2.1.2平穩(wěn)性R代碼>d=read.table("E://jrjl/Chapter2/gsyh.txt",header=T)#讀取文件>da=d$gs>gs<-ts(da,start=c(2007,1),frequency=12)>lngs=log(gs+1)#收益率取對數(shù)>acf(da,main="工商銀行月收益率")#簡單收益率自相關(guān)圖>acf(log(gs+1),main="工商銀行對數(shù)月收益率")#對數(shù)收益率自相關(guān)圖>Box.test(gs,lag=5,type="Ljung")#簡單收益率的自相關(guān)檢驗>Box.test(gs,lag=10,type="Ljung")>Box.test(lngs,lag=5,type="Ljung")#對數(shù)收益率的自相關(guān)檢驗>Box.test(lngs,lag=10,type="Ljung")2.1.2平穩(wěn)性

2.1.2平穩(wěn)性例2.3續(xù)從例2.3的分析可以看出,工商銀行股票序列可以認(rèn)為是一個白噪聲序列。圖2-4給出了隨機(jī)產(chǎn)生的1000個服從標(biāo)準(zhǔn)正態(tài)分布的白噪聲序列的時序圖。圖2-4標(biāo)準(zhǔn)正態(tài)白噪聲序列時序圖2.1.2平穩(wěn)性R代碼>set.seed(111)>x<-rnorm(1000)>ts.plot(x)簡單自回歸模型2.22.2

簡單自回歸模型

2.2.1AR模型性質(zhì)

2.2.1AR模型性質(zhì)

2.2.1AR模型性質(zhì)R代碼>par(mfcol=c(2,2))>x1<-arima.sim(n=1000,list(ar=-0.2))>acf(x1,lag.max=30,main="φ=-0.2")>x2<-arima.sim(n=1000,list(ar=0.2))>acf(x2,lag.max=30,main="φ=0.2")>x3<-arima.sim(n=1000,list(ar=-0.8))>acf(x3,lag.max=30,main="φ=-0.8")>x4<-arima.sim(n=1000,list(ar=0.8))>acf(x4,lag.max=30,main="φ=0.8")2.2.1AR模型性質(zhì)

2.2.1AR模型性質(zhì)

2.2.1AR模型性質(zhì)圖2-6AR(2)模型的自相關(guān)函數(shù)

2.2.1AR模型性質(zhì)

2.2.2AR模型的識別AR模型的識別:在實際應(yīng)用中,AR時間序列的階數(shù)p是未知的,必須根據(jù)實際數(shù)據(jù)來決定。因此需要對AR模型定階。一般有兩個確定階數(shù)p的方法:一是利用AIC、BIC等信息準(zhǔn)則,二是利用偏自相關(guān)函數(shù)。2.2.2AR模型的識別

2.2.2AR模型的識別

2.2.2AR模型的識別

2.2.2AR模型的識別例2.4中國GDP的季度數(shù)據(jù)建模。本例使用中國GDP的季度數(shù)據(jù),時間從1992年第一季度至2021年第四季度,共116個數(shù)據(jù)。圖2-7給出了GDP序列的對數(shù)序列和增長率的時序圖(對數(shù)GDP增長率為對數(shù)GDP之間的一階差分)。之后對增長率的ACF和PACF進(jìn)行估計,得到圖2-8,從圖2-8中可看出,可嘗試AR(7)建模。R軟件stats包中的ar()函數(shù)可以對時間序列進(jìn)行AR建模,默認(rèn)采用AIC準(zhǔn)則定階。用選項aic=FALSE,order.max=p可以選定p階模型。如本例產(chǎn)生了一個8階的模型,圖2-9為其AIC的圖形,當(dāng)p=8時達(dá)到最小值。雖然ar()函數(shù)沒有提供BIC的值,但因為BIC(k)?AIC(k)=k(lnT?2)/T,因此可以計算BIC值。事實上,BIC也建議p=8。表2.2為PACF、AIC和BIC各階對應(yīng)的值,找出最小的AIC和BIC時對應(yīng)的階數(shù)即可。當(dāng)然,從AIC圖形可看出,如果取較低的階,4階也是可以的。這個例子說明不同的準(zhǔn)則可能會得出p的不同選擇。在實際應(yīng)用中,還沒有證據(jù)表明哪種方法更好。對給定的時間序列選擇一個AR模型時,還有兩種因素起著重要作用,就是所研究問題的具體信息和模型的簡單性。2.2.2AR模型的識別2.2.2AR模型的識別2.2.2AR模型的識別R代碼>d=read.table("E://jrjl/Chapter2/gdp,txt",header=T)>gdp<-ts(d[["GDP"]],start=c(1992,1),frequency=4)>plot(log(gdp),xlab="年份",ylab="log(GDP)",main="對數(shù)GDP")>rate<-diff(log(gdp))>plot(rate,xlab="年份",ylab="增長率",main="GDP增長率")>b1<-pacf(rate,xlab="年份",main="")>b1>a1<-ar(rate,method="mle")>a1$order>a1$aic>plot(as.numeric(names(a1$aic)),a1$aic,type="h",xlab="k",ylab="AIC")>tmp.T<-length(rate)>tmp.bic<-a1$aic+as.number(names(a1$aic))*(log(tmp.T)-2)/tmp.T>tmp.bic>plot(as.numeric(names(a1$aic)),tmp.bic,type="h",xlab="k",ylab="BIC")2.2.3AR模型的估計

2.2.3AR模型的估計模型檢驗:檢查擬合的模型好壞的一個標(biāo)準(zhǔn)是考察模型是否充分。如果模型是充分的,則其殘差序列應(yīng)為白噪聲。殘差的樣本自相關(guān)函數(shù)和Ljung-Box統(tǒng)計量可用來檢驗與白噪聲的接近程度。對AR(p)模型,Ljung-Box統(tǒng)計量Q(m)漸近服從自由度為的分布,其中g(shù)是所用模型中AR系數(shù)的個數(shù)。如果發(fā)現(xiàn)擬合的模型是不充分的,那么就需要對它進(jìn)行改進(jìn)。如果估計的AR系數(shù)中有一些與0沒有顯著差別,則我們應(yīng)該去掉這些不顯著的參數(shù)對模型進(jìn)行簡化。2.2.3AR模型的估計

2.2.3AR模型的估計

2.2.3AR模型的估計R代碼>d=read.table("E://jrjl/Chapter2/szzz.txt",header=T)>IMR<-ts(d[["IdxMonRet"]],start=c(1991,1),frequency=12)>a1<-ar(IMR,method="mle")>a1$order>a2<-arima(IMR,order=c(11,0,0))>Box.test(a2$residuals,lag=12,type="Ljung",fitdf=11)>a3<-arima(IMR,order=c(11,0,0),fixed=c(0,0,0,0,0,0,NA,0,NA,0,NA,0))>a3>Box.test(a3$residuals,lag=12,type="Ljung",fitdf=3)>abs(polyroot(c(1,-coef(a3)[1:11])))

2.2.3AR模型的估計

2.2.4AR模型的預(yù)測

2.2.4AR模型的預(yù)測

2.2.4AR模型的預(yù)測

2.2.4AR模型的預(yù)測

2.2.4AR模型的預(yù)測R代碼>d=read.table("E://jrjl/Chapter2/szzz.txt",header=T)>da=d$IdxMonRet>IMR<-ts(da[1:360],start=c(1991,1),frequency=12)>a1<-ar(IMR,method="mle")>a1$order>a2<-arima(IMR,order=c(11,0,0))>Box.test(a2$residuals,lag=12,type="Ljung",fitdf=11)>a2>a3<-arima(IMR,order=c(11,0,0),fixed=c(0,0,0,0,0,0,NA,0,NA,0,NA,0))>a3>pred1<-predict(a3,12)>pred1>x1=(c(1:24))/12+2020>y1=da[349:372]>plot(x1,y1,xlab='年份',ylab='上證綜指月簡單收益率',type='b',ylim=c(-0.06,0.12))>points(x1[13:24],pred1$pred,col="red",lwd=1,lty=2,type="b",pch=2)簡單移動平均模型2.32.3簡單移動平均模型

2.3.1MA模型的性質(zhì)

2.3.1MA模型的性質(zhì)

2.3.1MA模型的性質(zhì)

2.3.1MA模型的性質(zhì)R代碼>x1<-arima.sim(n=1000,list(ma=-2))>acf(x1,lag.max=20)>x2<-arima.sim(n=1000,list(ma=-0.5))>acf(x1,lag.max=20)>x3<-arima.sim(n=1000,list(ma=c(-2,4)))>acf(x3,lag.max=20)>x4<-arima.sim(n=1000,list(ma=c(-0.5,0.25)))>acf(x4,lag.max=20)2.3.1MA模型的性質(zhì)

2.3.2MA模型的識別

圖2-12民生銀行月簡單收益率時序圖和ACF圖2.3.3MA模型的估計MA模型的估計:估計MA模型通常用最大似然法,它又細(xì)分為條件似然法(conditionallikelihoodmethod)和精確似然法(exactlikelihoodmethod)兩種估計方法。精確似然估計優(yōu)于條件似然估計,尤其是當(dāng)MA模型接近于不可逆時。然而,精確似然估計的計算會更復(fù)雜一些。如果樣本量較大,這兩種似然估計是接近的。2.3.3MA模型的估計

2.3.3MA模型的估計R代碼>d=read.table("E://jrjl/Chapter2/zsyh.txt",header=T)>da=d$Monret>mr<-ts(da,frequency=12,start=c(2001,1))>plot(mr,xlab="年份",ylab="民生銀行月簡單收益率")>acf(da)>a1<-arima(mr,order=c(0,0,14))>a1>Box.test(a1$residuals,type="Ljung",lag=24,fitdf=13)>a2<-arima(mr,order=c(0,0,14),fixed=c(0,0,0,0,0,0,0,0,NA,0,0,0,0,NA,NA))>a22.3.4MA模型的預(yù)測

2.3.4MA模型的預(yù)測

2.3.4MA模型的預(yù)測

2.3.4MA模型的預(yù)測R代碼>d=read.table("E://jrjl/Chapter2/zsyh.txt",header=T)>da=d$Monret>mr<-ts(da[1:242],frequency=12,start=c(2001,1))>plot(mr,xlab="年份",ylab="民生銀行月簡單收益率")>acf(da)>a1<-arima(mr,order=c(0,0,14))>a1>a2<-arima(mr,order=c(0,0,14),fixed=c(0,0,0,0,0,0,0,0,NA,0,0,0,0,NA,NA))>a2>pred2<-predict(a2,10)>pred2簡單ARMA模型2.42.4.1ARMA(1,1)模型ARMA(1,1)理論推導(dǎo)2.4.1ARMA(1,1)模型2.4.1ARMA(1,1)模型2.4.1ARMA(1,1)模型通過推導(dǎo),發(fā)現(xiàn)ARMA(1,1)模型的ACF與AR(1)模型的ACF很相似,不同之處僅在于它的指數(shù)衰減是從滯后2階開始的。因此,ARMA(1,1)模型的ACF不能在任意有限滯后階截尾。現(xiàn)在來看偏自相關(guān)函數(shù)(PACF)。可以證明ARMA(1,1)模型的PACF也不能在有限滯后階后截尾。它與MA(1)模型的PACF表現(xiàn)很相似,只是指數(shù)衰減從滯后2階開始,而不是從滯后1階開始。綜上所述,ARMA(1,1)模型的平穩(wěn)性條件與AR(1)模型相同,ARMA(1,1)模型的ACF與AR(1)模型的ACF有相似的模式,只是是從滯后2階開始的。ARMA(1,1)與AR(1)性質(zhì)比較2.4.2ARMA模型簡介ARMA模型一般形式2.4.3ARMA模型的識別

每一隨機(jī)過程都有它的典型的ACF和PACF式樣(表2.5)。對于AR(p)過程,ACF按幾何或指數(shù)規(guī)律下降(常描述為拖尾),而PACF則是在一定時期忽然截斷(常描述為截尾)。可見,AR(p)過程的ACF和PACF與MA(q)過程的ACF和PACF相比,剛好相反。ARMA模型的識別2.4.3ARMA模型的識別

在給ARMA模型定階時,ACF和PACF都不能提供足夠的信息。通常采用推廣的自相關(guān)函數(shù)(EACF)來確定ARMA過程的階。課本例題2.11講述自相關(guān)函數(shù)(EACF)來確定ARMA過程的階。選擇ARMA模型階數(shù)的另外一種方法是信息準(zhǔn)則。具體地說,對于事先指定的正整數(shù)P和Q,計算ARMA(p,q)模型的AIC(或BIC),其中0≤p≤P、0≤q≤Q,選取使AIC(或BIC)取最小值的模型。ARMA(p,q)模型的階確定后就可用條件似然法或者精確似然法來估計模型的參數(shù),并對殘差進(jìn)行Ljung-Box檢驗判斷所擬合模型的合理性。在R中可以用arima()函數(shù)建立ARMA模型。利用自相關(guān)函數(shù)(EACF)定階單位根非平穩(wěn)時間序列2.52.5.1隨機(jī)游走和帶漂移項的隨機(jī)游走

隨機(jī)游動帶漂移項的隨機(jī)游走2.5.2趨勢平穩(wěn)的時間序列

趨勢平穩(wěn)的時間序列2.5.3ARIMA模型如果允許其特征多項式存在特征根,則ARMA模型就變成了自回歸整合移動平均模型ARIMA。ARIMA模型表達(dá)式中經(jīng)過d階差分得到一個平穩(wěn)序列,同時假定其自回歸算子的滯后期為p,移動平均算子的滯后期為q,則ARIMA模型結(jié)構(gòu)為ARIMA(p,d,q)。應(yīng)用ARIMA模型進(jìn)行建??煞譃槿缦碌乃膫€步驟。(1)對原序列進(jìn)行平穩(wěn)性檢驗,如果序列不滿足平穩(wěn)性條件,可以通過差分變換使得序列滿足平穩(wěn)性條件。(2)通過計算能夠描述序列特征的一些統(tǒng)計量(如自相關(guān)系數(shù)和偏自相關(guān)系數(shù)以及推廣的自相關(guān)函數(shù)EACF),來確定ARIMA模型階數(shù)p和q,并在初始估計中選擇盡可能少的參數(shù)。(3)估計模型的參數(shù),并檢驗參數(shù)的顯著性,以及模型本身的合理性。(4)對結(jié)果進(jìn)行分析,以證實所得模型是否與所觀察的數(shù)據(jù)特征相符。ARIMA模型2.5.4非平穩(wěn)時間序列的單位根檢驗非平穩(wěn)時間序列的單位根檢驗2.5.4非平穩(wěn)時間序列的單位根檢驗DF檢驗2.5.4非平穩(wěn)時間序列的單位根檢驗ADF檢驗2.5.4非平穩(wěn)時間序列的單位根檢驗例2.12考慮中國從1992年第1季度到2021年第4季度的季度GDP對數(shù)序列。該序列表現(xiàn)出上升趨勢,這表明中國經(jīng)濟(jì)的增長,同時它呈現(xiàn)高度的樣本序列相關(guān)性,參見圖2-7a。該序列的1階差分序列代表了中國GDP的增長率,圖2-7b給出了GDP增長率序列的時序圖,該差分序列看起來在一個固定的均值水平附近波動。為證實這一現(xiàn)象,對該對數(shù)序列進(jìn)行ADF單位根檢驗?;趫D2-8給出的差分序列的樣本PACF,選擇p=7較為合適,而基于圖2-9給的AIC圖,選擇p=8較為合適。在這里通過更加精確的fUnitRoots包函數(shù)進(jìn)行定階,選擇p=8更為合適。當(dāng)p=8時,ADF檢驗統(tǒng)計量是-0.8423,p值是0.7435,這表明單位根假設(shè)不能被拒絕。2.5.4非平穩(wěn)時間序列的單位根檢驗R代碼>d=read.table("E://jrjl/Chapter2/gdp.txt",header=T)>library(fUnitRoots)>gdp=log(d[,2])>m1=ar(diff(gdp),method='mle')>m1$order>adfTest(gdp,lags=8,type=c("c"))季節(jié)模型2.62.6季節(jié)模型有些金融時間序列,呈現(xiàn)出一定的循環(huán)或周期性,這樣的時間序列叫做季節(jié)時間序列。在季節(jié)時間序列中,常常需先處理這些季節(jié)趨勢,把它從數(shù)據(jù)中移除,得到經(jīng)季節(jié)調(diào)整后的時間序列,然后再用來做推斷。這種從時間序列中移除季節(jié)性的過程叫做季節(jié)調(diào)整。圖2-14所示的是中國GDP對數(shù)的時序圖。對其對數(shù)變換主要是因為GDP是指數(shù)增長的,同時通過對數(shù)變換可降低序列的波動性。事實上,對數(shù)變換在金融、經(jīng)濟(jì)時間序列分析中是常用的處理數(shù)據(jù)的方法。季節(jié)模型2.6季節(jié)模型圖2-14中國GDP從1992年1季度到2021年4季度對數(shù)時序圖2.6季節(jié)模型

2.6季節(jié)模型

2.6季節(jié)模型圖2-15中國GDP從1992年第1季度到2021年第4季度的對數(shù)序列的樣本自相關(guān)函數(shù)圖2.6季節(jié)模型

2.6季節(jié)模型圖2-16

中國GDP從1992年第1季度到2021年第4季度的對數(shù)序列的時序圖2.6季節(jié)模型

多重季節(jié)模型2.6季節(jié)模型R代碼>d=read.table("E://jrjl/Chapter2/gdp.txt",header=T)>da=d>eps=log(da$GDP)>koeps=ts(eps,frequency=4,start=c(1992,1))>plot(gdp,type='l',xlab='year',ylab='ln(GDP)')>par(mfcol=c(2,2))>koeps=log(da$GDP)>deps=diff(koeps)>sdeps=diff(koeps,4)>ddeps=diff(sdeps)>acf(koeps,lag=20,main="a.對數(shù)序列")>acf(sdeps,lag=20,main="c.季節(jié)差分序列")>acf(deps,lag=20,main="b.一階差分序列")>acf(ddeps,lag=20,main="d.常規(guī)差分和季節(jié)差分后序列")2.6季節(jié)模型>c1=c("2","3","4","1")>c2=c("1","2","3","4")>par(mfcol=c(3,1))>deps=ts(deps,frequency=4,start=c(1992))>plot(deps,xlab='year',ylab='一階差分',type='l',main="a.一階差分序列")>points(deps,pch=c1,cex=0.7)>sdeps=ts(sdeps,frequency=4,start=c(1992))>plot(sdeps,xlab='year',ylab='季節(jié)差分',type='l',main="b.季節(jié)差分序列")>points(sdeps,pch=c2,cex=0.7)>ddeps=ts(ddeps,frequency=4,start=c(1992))>plot(ddeps,xlab='year',ylab='常規(guī)和季節(jié)差分',type='l',main="c.常規(guī)和季節(jié)差分序列")>points(ddeps,pch=c1,cex=0.7)長記憶時間序列模型2.72.7

長記憶時間序列模型時間序列可分為平穩(wěn)序列和非平穩(wěn)序列兩類,一般來說長記憶的時間序列是非平穩(wěn)的。我們知道,平穩(wěn)時間序列的ACF呈指數(shù)衰減。但是對單位根非平穩(wěn)時間序列,可證明對任意固定的滯后階數(shù),當(dāng)樣本容量增加時,樣本ACF收斂于1。另外也存在一些時間序列,隨著滯后階數(shù)的增加它們的ACF以多項式的速度緩慢衰減到0。這些時間序列稱為長記憶時間序列(long-memorytimeseries)。長記憶時間序列模型2.7

長記憶時間序列模型

ARFIMA模型2.7

長記憶時間序列模型例2.13為說明長記憶時間序列的建模,考慮上海銀行間隔夜拆借利率中國工商銀行隔夜拆借利率的報價利率對數(shù)收益率的絕對收益率,時間跨度為2014年1月3日至2020年12月31日。圖2-17給出了序列絕對值序列的ACF圖。從圖中可見ACF的數(shù)值相對較小,且衰減緩慢,甚至在滯后300階后還在5%的水平下顯著。圖2-17上海銀行間隔夜拆借利率中國工商銀行日隔夜拆借利率的報價利率對數(shù)收益率的絕對值序列的樣本ACF值2.7

長記憶時間序列模型

2.7

長記憶時間序列模型R代碼>d=read.csv("E://jrjl/Chapter2/gsyhh.csv",header=T)>install.packages("fracdiff")>library(fracdiff)>ew=abs(d$dlnr)>m2=fracdiff(ew,nar=1,nma=1)>summary(m2)基于ARIMA模型的中國居民消費(fèi)價格指數(shù)預(yù)測2.8基于ARIMA模型的中國居民消費(fèi)價格指數(shù)預(yù)測通過研究國家或者一個區(qū)域的CPI指數(shù)的變動,可以從一個側(cè)面反映國家或者地區(qū)的民生情況。CPI的統(tǒng)計數(shù)據(jù)是一個典型的時間序列,一般可以按照月份、季度和年度來統(tǒng)計數(shù)據(jù),按照一籃子固定商品價格

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論