《時間序列分析-基于Python》 課件 第6、7章 有季節(jié)效應(yīng)的非平穩(wěn)序列分析、多元時間序列分析_第1頁
《時間序列分析-基于Python》 課件 第6、7章 有季節(jié)效應(yīng)的非平穩(wěn)序列分析、多元時間序列分析_第2頁
《時間序列分析-基于Python》 課件 第6、7章 有季節(jié)效應(yīng)的非平穩(wěn)序列分析、多元時間序列分析_第3頁
《時間序列分析-基于Python》 課件 第6、7章 有季節(jié)效應(yīng)的非平穩(wěn)序列分析、多元時間序列分析_第4頁
《時間序列分析-基于Python》 課件 第6、7章 有季節(jié)效應(yīng)的非平穩(wěn)序列分析、多元時間序列分析_第5頁
已閱讀5頁,還剩117頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

有季節(jié)效應(yīng)的非平穩(wěn)序列分析06本章內(nèi)容因素分解理論0102因素分解模型指數(shù)平滑預(yù)測模型ARIMA季節(jié)加法模型050403ARIMA季節(jié)乘法模型確定性因素分解因素分解方法(TimeSeriesDecomposition)由英國統(tǒng)計學(xué)家W.M.Persons于1919年在他的論文“商業(yè)環(huán)境的指標(biāo)(IndicesofBusinessConditions)”一文中首次使用。因素分解方法認(rèn)為所有的序列波動都可以歸納為受到如下四大類因素的綜合影響:長期趨勢(Trend):序列呈現(xiàn)出明顯的長期遞增或遞減的變化趨勢。循環(huán)波動(Circle):序列呈現(xiàn)出從低到高再由高到低的反復(fù)循環(huán)波動。循環(huán)周期可長可短,不一定是固定的。季節(jié)性變化(Season):序列呈現(xiàn)出和季節(jié)變化相關(guān)的穩(wěn)定周期性波動,后來季節(jié)性變化的周期拓展到任意穩(wěn)定周期。隨機(jī)波動(Immediate):除了長期趨勢、循環(huán)波動和季節(jié)性變化之外,其他不能用確定性因素解釋的序列波動,都屬于隨機(jī)波動。因素分解模型統(tǒng)計學(xué)家在進(jìn)行確定性時間序列分析時,假定序列會受到這四個因素中的全部或部分的影響,導(dǎo)致序列呈現(xiàn)出不同的波動特征。換言之,任何一個時間序列都可以用這四個因素的某個函數(shù)進(jìn)行擬合常用模型加法模型:乘法模型:因素分解模型遇到的問題(1)如果觀察時期不是足夠長,那么循環(huán)因素和趨勢因素的影響很難準(zhǔn)確區(qū)分。很多經(jīng)濟(jì)或社會現(xiàn)象有“上行——峰頂——下行——谷底”周而復(fù)始的循環(huán)周期。但是這個周期通常很長而且周期長度不是固定的在經(jīng)濟(jì)學(xué)領(lǐng)域更是如此,經(jīng)濟(jì)學(xué)家一再證明經(jīng)濟(jì)周期的存在和周期的不確定韋斯利.米歇爾周期(經(jīng)濟(jì)周期的持續(xù)時間從1年到10年或12年不等)基欽周期(平均周期長度為40個月左右)朱格拉周期(平均周期長度為10年左右)庫茲涅茨周期(平均長度為20年左右)康德拉季耶夫周期(平均周期長度為53.3年)如果觀察值序列不是足夠長,沒有包含幾個周期的話,那么周期的一部分會和趨勢重合,無法準(zhǔn)確完整地提取周期影響。因素分解模型遇到的問題(2)有些社會現(xiàn)象和經(jīng)濟(jì)現(xiàn)象顯示出某些特殊日期是一個很顯著的影響因素,但是在傳統(tǒng)因素分解模型中,它卻沒有被納入研究。比如研究股票交易序列,成交量、開盤價、收盤價會明顯受到交易日的影響,同一只股票每周一和每周五的波動情況可能有顯著的不同。超市銷售情況更是明顯受到特殊日期的影響,工作日、周末、重大假日的銷售特征相差很大。春節(jié)、端午節(jié)、中秋節(jié)、兒童節(jié)、圣誕節(jié)等不同的節(jié)日對零售業(yè)、旅游業(yè)、運輸業(yè)等很多行業(yè)都有顯著影響。因素分解改進(jìn)模型如果觀察時期不是足夠長,人們將循環(huán)因素(Circle)改為特殊交易日因素(Day)。新的四大因素為:趨勢(T),季節(jié)(S),交易日(D)和隨機(jī)波動(I)。加法模型:乘法模型:偽加法模型:對數(shù)加法模型:確定性時序分析的目的我們基于因素分解的思想進(jìn)行確定性時序分析的目的主要包括以下兩個方面:一是克服其他因素的干擾,單純測度出某個確定性因素(諸如季節(jié)、趨勢、交易日)對序列的影響。二是根據(jù)序列呈現(xiàn)的確定性特征選擇適當(dāng)?shù)姆椒▽π蛄羞M(jìn)行綜合預(yù)測。本章內(nèi)容因素分解理論0102因素分解模型指數(shù)平滑預(yù)測模型ARIMA季節(jié)加法模型050403ARIMA季節(jié)乘法模型因素分解模型的選擇:加法模型例6-1:考察1981—1990年澳大利亞政府季度消費支出序列的確定性影響因素,并選擇因素分解模型。從右圖中可以看到,該序列具有明顯的線性遞增趨勢,以及以年為周期的季節(jié)效應(yīng),沒有看到大的經(jīng)濟(jì)周期循環(huán)特征,也沒有交易日的信息,所以可以確定這個序列受到三個因素的影響:長期趨勢、季節(jié)效應(yīng)和隨機(jī)波動。時序圖顯示,隨著趨勢的遞增,每個季節(jié)的振幅維持相對穩(wěn)定(如右圖中的虛線所示,周期波動范圍近似平行),這說明季節(jié)效應(yīng)沒有受到趨勢的影響,這時通常選擇加法模型因素分解模型的選擇:乘法模型例6-2:考察1993-2000年中國社會消費品零售總額序列的確定性影響因素,并選擇因素分解模型。從右圖中可以看到,該序列具有明顯的線性遞增趨勢,以及以年為周期的季節(jié)效應(yīng),沒有看到大的經(jīng)濟(jì)周期循環(huán)特征,也沒有交易日的信息,所以可以確定這個序列也受到三個因素的影響:長期趨勢、季節(jié)效應(yīng)和隨機(jī)波動。時序圖顯示出隨著趨勢的遞增,每個季節(jié)的振幅也在增大(如右圖中的虛線所示,周期波動范圍隨著趨勢遞增而擴(kuò)大,呈現(xiàn)喇叭形),這說明季節(jié)效應(yīng)受到趨勢的影響,這時通常選擇乘法模型趨勢效應(yīng)的提取趨勢效應(yīng)的提取方法有很多,比如構(gòu)建序列與時間t的線性回歸方程或曲線回歸方程,或者構(gòu)建序列與歷史信息的自回歸方程,但在因素分解場合,最常用的趨勢效應(yīng)提取方法是簡單中心移動平均方法。移動平均方法最早于1870年由法國數(shù)學(xué)家DeForest提出。移動平均的計算公式如下中心移動平均簡單中心移動平均:對移動平均函數(shù)增加三個約束條件——時期對稱,系數(shù)相等,系數(shù)和為1,此時的移動平均稱為簡單中心移動平均。例如5期中心移動平均復(fù)合移動平均:如果移動平均的期數(shù)為偶數(shù),那么通常需要進(jìn)行兩次偶數(shù)期移動平均才能實現(xiàn)時期對稱。兩次移動平均稱為復(fù)合移動平均,記作例如中心移動平均的良好屬性簡單中心移動平均方法盡管很簡單,但是卻具有很多良好的屬性:1.簡單中心移動平均能夠有效提取低階趨勢(一元一次線性趨勢或一元二次拋物線趨勢)。2.簡單中心移動平均能夠?qū)崿F(xiàn)擬合方差最小。3.簡單中心移動平均能有效消除季節(jié)效應(yīng)。對于有穩(wěn)定季節(jié)周期的序列進(jìn)行周期長度的簡單移動平均可以消除季節(jié)效應(yīng)。因為簡單中心移動平均具有這些良好的屬性,所以,只要選擇適當(dāng)?shù)囊苿悠骄跀?shù)就能有效消除季節(jié)效應(yīng)和隨機(jī)波動的影響,有效提取序列的趨勢信息。例6-1加法模型的因素分解使用簡單中心移動平均方法提取1981-1990年澳大利亞政府季度消費支出序列的趨勢效應(yīng)。原序列為季度數(shù)據(jù),有顯著的季節(jié)特征,每年為一個周期,即周期長度為4期。對原序列先進(jìn)行4期簡單移動平均,再對序列進(jìn)行兩期移動平均,得到復(fù)合移動平均值例6-1:趨勢效應(yīng)的提取周期步長的移動平均能有效消除季節(jié)效應(yīng)和隨機(jī)波動的影響,本例使用提取該序列的趨勢信息例6-1:剔除趨勢效應(yīng)對于加法模型,原序列減去趨勢效應(yīng),就從原序列中剔除了趨勢效應(yīng),剩下的就是季節(jié)效應(yīng)和隨機(jī)波動加法季節(jié)效應(yīng)的提取加法模型季節(jié)效應(yīng)的提取步驟第一步:從原序列中消除趨勢效應(yīng)第二步:計算序列總均值第三步:計算季度均值第四步:季度均值減總均值,得到季節(jié)指數(shù)例6-1:提取澳大利亞政府季度消費支出序列的季節(jié)效應(yīng)年Q1Q2Q3Q41981..38.13160.001982-709.13631.00-384.25194.881983-174.38291.25-300.88285.631984-476.38416.00-82.00104.501985-522.00582.63-246.88319.631986-685.75585.25-45.00194.131987-653.13514.50-259.13280.381988-429.88440.75-128.63166.881989-714.25665.25-160.75144.001990-490.75410.25..-539.51504.10-174.38205.56-1.06-538.45505.16-173.32206.61例6-1:季節(jié)效應(yīng)的提取澳大利亞政府季度消費支出每年都是2季度最高,1季度最低。消費支出從低到高排序是:1季度<3季度<4季度<2季度不同季節(jié)之間平均季節(jié)指數(shù)的差值就是季節(jié)效應(yīng)造成的差異大小。例6-1:隨機(jī)效應(yīng)的提取從原序列中剔除趨勢效應(yīng)和季節(jié)效應(yīng),就殘留隨機(jī)效應(yīng)例6-2

乘法模型的因素分解使用簡單中心移動平均方法提取1993-2000年中國社會消費品零售總額序列的趨勢效應(yīng)。該序列為月度數(shù)據(jù),即周期長度等于12。對原序列進(jìn)行復(fù)合移動平均。右圖顯示能有效提取該序列的趨勢效應(yīng)。例6-2對于乘法模型,原序列除以趨勢效應(yīng),就從原序列中剔除了趨勢效應(yīng),剩下的就是季節(jié)效應(yīng)和隨機(jī)波動乘法季節(jié)效應(yīng)的提取乘法模型季節(jié)效應(yīng)的提取步驟第一步:從原序列中消除趨勢效應(yīng)第二步:計算序列總均值第三步:計算季度均值第四步:季度均值減總均值,得到季節(jié)指數(shù)例6-2:季節(jié)效應(yīng)提取中國社會消費品零售總額序列具有上半年為淡季,下半年為旺季,而且越到年底銷售越旺的特征。不同季節(jié)之間季節(jié)指數(shù)的比值就是季節(jié)效應(yīng)造成的差異。比如1月份的季節(jié)指數(shù)為1.04,2月份的季節(jié)指數(shù)為0.99,這說明由于季節(jié)的原因,2月份的平均銷售額通常只有1月份的95%左右(0.99/1.04=0.95)。例6-2:隨機(jī)效應(yīng)的提取從原序列中剔除趨勢效應(yīng)和季節(jié)效應(yīng),就殘留隨機(jī)效應(yīng)X11季節(jié)調(diào)節(jié)模型X11模型也稱為X11季節(jié)調(diào)節(jié)模型。它是第二次世界大戰(zhàn)之后,美國人口普查局委托統(tǒng)計學(xué)家進(jìn)行的基于計算機(jī)自動進(jìn)行的時間序列因素分解方法。構(gòu)造它的目的是因為很多序列通常具有明顯的季節(jié)效應(yīng),季節(jié)性會掩蓋序列發(fā)展的真正趨勢,妨礙人們做出正確判斷。因此在進(jìn)行國情監(jiān)控研究時,首先需要對序列進(jìn)行因素分解,分別監(jiān)控季節(jié)性波動和趨勢效應(yīng)。1954年,第一個基于計算機(jī)自動完成的因素分解程序測試版本面世,隨后經(jīng)過10多年的發(fā)展,計算方法不斷完善,陸續(xù)推出了新的測試版本X-1,X-2,┄┄,X10。1965年,由統(tǒng)計學(xué)家Shiskin,Young和Musgrave共同研發(fā)推出了新的測試版本X11。X11在傳統(tǒng)的簡單移動平均方法的基礎(chǔ)上,又創(chuàng)造性地引入兩種移動平均方法以補(bǔ)足簡單移動平均方法的不足。它通過三種移動平均方法,進(jìn)行三階段的因素分解。大量的實踐應(yīng)用證明,對各種特征的序列,X11模型都能進(jìn)行精度很高的、計算機(jī)程序化操作的因素分解。自此,X11模型成為全球統(tǒng)計機(jī)構(gòu)和商業(yè)機(jī)構(gòu)進(jìn)行因素分解時最常使用模型。X12和X13模型1975年,加拿大統(tǒng)計局將ARIMA模型引入X11模型。借助ARIMA模型可以對序列進(jìn)行向后預(yù)測擴(kuò)充數(shù)據(jù),以保證擬合數(shù)據(jù)的完整性,彌補(bǔ)了中心移動平均方法的缺陷。1998年,美國人口普查局開發(fā)了X12-ARIMA模型。這次是將干預(yù)分析(我們將在第八章介紹干預(yù)分析)引入X11模型。它是在進(jìn)行X11分析之前,將一些特殊因素作為干預(yù)變量引入研究。這些干預(yù)變量包括:特殊節(jié)假日、固定季節(jié)因素、工作日因素、交易日因素、閏年因素,以及研究人員自行定義的任意自變量。2006年美國人口普查局再次推出更新版本X13-ARIMA-Seats,它是在X12的基礎(chǔ)上,增加了seats季節(jié)調(diào)整方法。由這個改進(jìn)過程我們可以看到,盡管現(xiàn)在有很多因素分解模型的最新版本,但最重要的理論基礎(chǔ)依然是X11模型。所以我們主要介紹X11模型的理論基礎(chǔ)和操作流程。X11模型的三種移動平均方法X11模型的核心技術(shù)是三次移動平均:第一次:簡單移動平均方法第二次:Henderson加權(quán)移動平均第三次:Musgrave非對稱移動平均Henderson加權(quán)移動平均簡單移動平均具有很多優(yōu)良的屬性,這使得它成為實務(wù)中應(yīng)用最廣的一種移動平均方法,但它也有不足之處。在提取趨勢信息的時候,它能很好地提取一次函數(shù)(線性趨勢)和二次函數(shù)(拋物線趨勢)的信息,但是對于二次以上曲線,它對趨勢信息的提取就不夠充分了。這說明簡單移動平均對高階多項式函數(shù)的擬合是不夠精確的。為了解決這個問題,X11模型引入了Henderson加權(quán)移動平均。在的約束下,使得下式達(dá)到最小的系數(shù)即為Henderson加權(quán)移動平均系數(shù)其中S等于移動平均系數(shù)的三階差分的平方和,這等價于把某個三次多項式作為光滑度的一個指標(biāo),要求達(dá)到最小,就是力求修勻值接近一條三次曲線。理論上也可以要求逼近更高次數(shù)的多項式曲線,比如四次或五次,這時只需要調(diào)整函數(shù)中的差分階數(shù)。但階數(shù)越高,計算越復(fù)雜,所以使用最多的還是3階差分光滑度要求。Musgrave非對稱移動平均前面兩種移動平均方法可以很好地消除趨勢,提取線性或非線性趨勢信息,但是它們都有一個明顯的缺點:因為是中心移動平均,假如移動平均期數(shù)為2k+1,那么序列最前面的k期和最后面的k期經(jīng)過移動平均擬合后,信息就缺失了。這是嚴(yán)重的信息損失,尤其是最后幾期的信息可能正是我們最關(guān)心的信息。1964年,統(tǒng)計學(xué)家Musgrave針對這個問題構(gòu)造了Musgrave非對稱移動平均方法,專門對最后k期數(shù)據(jù)進(jìn)行補(bǔ)充平滑擬合。Musgrave非對稱移動平均Musgrave非對稱移動平均的構(gòu)造思想是:已知一組中心移動平均系數(shù),滿足系數(shù)和為1、方差最小、光滑度最優(yōu)等前提約束?,F(xiàn)在需要另外尋找一組非中心移動平均系數(shù),也滿足系數(shù)和為1且它的擬合值能無限接近中心移動平均的擬合值,即對中心移動平均現(xiàn)有估計值做出的修正最小式中,d為補(bǔ)充平滑的項數(shù)。X11模型分析步驟:第一階段迭代第1步:進(jìn)行

復(fù)合移動平均,剔除周期效應(yīng),得到趨勢效應(yīng)的初始估計值第2步:從原序列中剔除趨勢效應(yīng),得到季節(jié)和隨機(jī)成分,不妨記作第3步:計算季節(jié)指數(shù)第4步:從原序列中剔除趨勢和季節(jié)效應(yīng),得到隨機(jī)成分,不妨記作

,對

做標(biāo)準(zhǔn)化運算,產(chǎn)生異常值權(quán)重函數(shù)

,原序列除以權(quán)重函數(shù),初步消除異常值的影響,得到調(diào)整后序列

X11模型分析步驟:第二階段迭代第5步:基于

序列,用13期Henderson加權(quán)移動平均,得出非線性趨勢效應(yīng)估計值第6步:從

中剔除趨勢效應(yīng),得到季節(jié)和隨機(jī)成分,不妨記作第7步:計算

序列的季節(jié)指數(shù)第8步:從序列

中剔除趨勢和季節(jié)效應(yīng),得到隨機(jī)成分,不妨記作

,對

做標(biāo)準(zhǔn)化運算,產(chǎn)生第二次迭代的異常值權(quán)重函數(shù)

,

序列除以權(quán)重函數(shù),進(jìn)一步消除異常值的影響,得到調(diào)整后序列

X11模型分析步驟:第三階段迭代第9步:基于

序列,使用Musgrave非對稱移動平均填補(bǔ)Henderson加權(quán)移動平均不能獲得的估計值,計算最終趨勢效應(yīng)第10步:從

中剔除趨勢效應(yīng),得到隨機(jī)波動例6-2:X11季節(jié)模型因素分解觀察值序列趨勢效應(yīng)季節(jié)效應(yīng)隨機(jī)波動本章內(nèi)容因素分解理論0102因素分解模型指數(shù)平滑預(yù)測模型ARIMA季節(jié)加法模型050403ARIMA季節(jié)乘法模型指數(shù)平滑預(yù)測模型確定性因素分解的第二個目的是根據(jù)序列呈現(xiàn)的確定性特征,選擇適當(dāng)?shù)哪P?,預(yù)測序列未來的發(fā)展。根據(jù)序列是否具有長期趨勢與季節(jié)效應(yīng),可以把序列分為如下三大類:第一類:既無長期趨勢,也無季節(jié)效應(yīng)第二類:有長期趨勢,無季節(jié)效應(yīng)第三類:長期趨勢可有可無,但一定有季節(jié)效應(yīng)在確定性因素分解領(lǐng)域,針對這三類序列,可以采用三種不同的指數(shù)平滑模型進(jìn)行序列預(yù)測簡單指數(shù)平滑對于既無長期趨勢又無季節(jié)效應(yīng)的序列,可以認(rèn)為序列圍繞在均值附近做隨機(jī)波動,即假定序列的波動服從如下模型:對該序列進(jìn)行預(yù)測的主要目的是消除隨機(jī)波動的影響,得到序列穩(wěn)定的均值。使用簡單移動平均得到的預(yù)測值是序列真實值的無偏估計,而且移動平均期數(shù)越大,預(yù)測的誤差越小簡單指數(shù)平滑預(yù)測模型簡單移動平均有很多良好的屬性,但是在實務(wù)中,人們也發(fā)現(xiàn)了它的缺點。簡單移動平均法實際上就是用一個簡單的加權(quán)平均數(shù)作為某一期序列值的估計值。實際上也就是假定無論時間的遠(yuǎn)近,這n期的觀察值對預(yù)測值的影響力都是一樣的。但在實際生活中,我們會發(fā)現(xiàn)對大多數(shù)隨機(jī)事件而言,一般都是近期的結(jié)果對現(xiàn)在的影響會大些,遠(yuǎn)期的結(jié)果對現(xiàn)在的影響會小些。這就是1961年Brown和Meyers提出指數(shù)平滑法的構(gòu)造思想。簡單指數(shù)平滑模型因為所以這說明簡單指數(shù)平滑方法的設(shè)計既考慮到了時間間隔的影響,又不影響預(yù)測值的無偏性。所以它是一種簡單好用的無趨勢、無季節(jié)效應(yīng)序列的預(yù)測方法。簡單指數(shù)平滑預(yù)測公式在實際應(yīng)用中,通常使用簡單指數(shù)平滑的遞推公式進(jìn)行逐期預(yù)測式中:α為平滑系數(shù)。平滑系數(shù)α的值可以由研究人員根據(jù)經(jīng)驗和需要自行給定。對于變化緩慢的序列,常取較小的α值;相反,對于變化迅速的序列,常取較大的α值。從理論上我們可以證明使用簡單指數(shù)平滑法預(yù)測任意期的預(yù)測值都為常數(shù)例6-3例6-4根據(jù)1949-1998年北京市每年最高氣溫序列,采用指數(shù)平滑法預(yù)測1999-2018年北京市每年的最高氣溫例6-4模型擬合該序列沒有長期趨勢,沒有季節(jié)效應(yīng),所以采用簡單指數(shù)平滑法進(jìn)行序列擬合與預(yù)測。擬合模型的參數(shù)信息和誤差平方和信息如下fit1基于最小二乘估計法計算α的估計值,fit2給定α=0.12(SAS軟件默認(rèn)fit2操作)實務(wù)中當(dāng)研究人員有經(jīng)驗時,通常自定義平滑系數(shù);當(dāng)研究人員沒有經(jīng)驗時,通常采用系統(tǒng)擬合效果最優(yōu)的平滑系數(shù)。例6-4

預(yù)測值和預(yù)測效果圖Holt兩參數(shù)指數(shù)平滑Holt兩參數(shù)指數(shù)平滑適用于對含有線性趨勢的序列進(jìn)行預(yù)測。它的基本思想是具有線性趨勢的序列通??梢员磉_(dá)為如下模型結(jié)構(gòu)等價表達(dá)a(t-1)代表序列在t-1時刻截距的無偏估計值,b(t)代表序列在t時刻斜率的無偏估計值Holt兩參數(shù)指數(shù)平滑公式Holt兩參數(shù)指數(shù)平滑就是分別使用簡單指數(shù)平滑的方法,結(jié)合序列的最新觀察值,不斷修勻截距a(t)和斜率項b(t),遞推公式如下使用Holt兩參數(shù)指數(shù)平滑法,向前k期的預(yù)測值為例6-5對1898-1968年紐約市人均日用水量序列進(jìn)行Holt兩參數(shù)指數(shù)平滑,預(yù)測1969-1980年紐約市人均日用水量例6-5模型擬合該序列有長期遞增趨勢,但沒有季節(jié)效應(yīng),所以采用Holt兩參數(shù)指數(shù)平滑法進(jìn)行序列擬合與預(yù)測?;谧钚《斯烙嫷玫降膮?shù)估計值和擬合精度信息如下:例6-5預(yù)測值和預(yù)測效果圖Holt-Winters三參數(shù)指數(shù)平滑(加法模型)季節(jié)加法模型的一般表達(dá)等價表達(dá)其中:a(t-1)代表序列在t-1時刻消除季節(jié)效應(yīng)后序列截距的無偏估計值,b(t)是斜率的無偏估計值,c(t)是季節(jié)指數(shù)的無偏估計。Holt-Winters三參數(shù)指數(shù)平滑公式(加法模型)Holt-Winters三參數(shù)指數(shù)平滑就是分別使用指數(shù)平滑的方法,迭代遞推參數(shù)a(t),b(t)和c(t)的值使用Holt-Winters三參數(shù)指數(shù)平滑加法公式,向前k期的預(yù)測值為例6-1續(xù)對1981—1990年澳大利亞政府季度消費支出序列,使用Holt-Winters三參數(shù)指數(shù)平滑法進(jìn)行預(yù)測。Holt-Winters三參數(shù)指數(shù)平滑(乘法模型)季節(jié)乘法模型的一般表達(dá)等價表達(dá)其中:a(t-1)代表序列在t-1時刻消除季節(jié)效應(yīng)后序列截距的無偏估計值,b(t)是斜率的無偏估計值,c(t)是季節(jié)指數(shù)的無偏估計。Holt-Winters三參數(shù)指數(shù)平滑公式(乘法模型)Holt-Winters三參數(shù)指數(shù)平滑就是分別使用指數(shù)平滑的方法,迭代遞推參數(shù)a(t),b(t)和c(t)的值使用Holt-Winters三參數(shù)指數(shù)平滑乘法公式,向前k期的預(yù)測值為例6-2續(xù)為1993-2000年中國社會消費品零售總額序列,使用Holt-Winters三參數(shù)指數(shù)平滑法進(jìn)行12期預(yù)測。本章內(nèi)容因素分解理論0102因素分解模型指數(shù)平滑預(yù)測模型ARIMA季節(jié)加法模型050403ARIMA季節(jié)乘法模型ARIMA季節(jié)加法模型季節(jié)加法模型是指序列中的季節(jié)效應(yīng)和其它效應(yīng)之間是加法關(guān)系簡單季節(jié)模型通過簡單的趨勢差分、季節(jié)差分之后序列即可轉(zhuǎn)化為平穩(wěn),它的模型結(jié)構(gòu)通常如下例6-6使用ARIMA模型擬合1962-1991年德國工人季度失業(yè)率序列。德國工人季度失業(yè)率序列時序圖1階,4步差分后序列時序圖例6-6差分后序列自相關(guān)圖和偏自相關(guān)圖自相關(guān)圖顯示出明顯的下滑軌跡,典型的拖尾屬性偏自相關(guān)圖除了1階和4階偏自相關(guān)系數(shù)顯著大于2倍標(biāo)準(zhǔn)差,其他階數(shù)的偏自相關(guān)系數(shù)基本都在2倍標(biāo)準(zhǔn)差范圍內(nèi)波動。所以嘗試擬合疏系數(shù)模型AR(1,4)。考慮到前面進(jìn)行的差分,實際上就是擬合疏系數(shù)的季節(jié)加法模型例6-6參數(shù)估計與模型檢驗參數(shù)估計結(jié)果模型結(jié)構(gòu)例6-6擬合模型殘差診斷例6-6模型擬合效果圖本章內(nèi)容因素分解理論0102因素分解模型指數(shù)平滑預(yù)測模型ARIMA季節(jié)加法模型050403ARIMA季節(jié)乘法模型季節(jié)乘積模型使用場合序列的季節(jié)效應(yīng)、長期趨勢效應(yīng)和隨機(jī)波動之間有著復(fù)雜地相互關(guān)聯(lián)性,簡單的季節(jié)加法模型不能充分地提取其中的相關(guān)關(guān)系構(gòu)造原理短期相關(guān)性用低階ARMA(p,q)模型提取季節(jié)相關(guān)性用以周期步長S為單位的ARMA(P,Q)模型提取假設(shè)短期相關(guān)和季節(jié)效應(yīng)之間具有乘積關(guān)系,模型結(jié)構(gòu)如下

例6-7使用ARIMA模型擬合1948-1981年美國女性(20歲以上)月度失業(yè)率序列。美國女性月度失業(yè)率時序圖1階,12步差分后序列時序圖例6-7差分后序列自相關(guān)圖和偏自相關(guān)圖自相關(guān)圖和偏自相關(guān)圖都顯示延遲12階自相關(guān)系數(shù)/偏自相關(guān)系數(shù)顯著大于2倍標(biāo)準(zhǔn)差,這說明差分后序列中仍蘊涵非常顯著的季節(jié)效應(yīng)。延遲1階、2階的自相關(guān)系數(shù)/偏自相關(guān)系數(shù)也大于2倍標(biāo)準(zhǔn)差,這說明差分后序列還具有短期相關(guān)性。乘法模型定階首先考慮1階12步差分之后序列12階以內(nèi)的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的特征,以確定短期相關(guān)模型。自相關(guān)圖和偏自相關(guān)圖顯示12階以內(nèi)的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)均不截尾,所以嘗試使用ARMA(1,1)模型提取差分后序列的短期自相關(guān)信息。其次考慮季節(jié)自相關(guān)特征:主要考察延遲12階、24階等以周期長度為單位的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的特征。自相關(guān)圖顯示延遲12階自相關(guān)系數(shù)顯著非零,但是延遲24階自相關(guān)系數(shù)落入2倍標(biāo)準(zhǔn)差范圍。而偏自相關(guān)圖顯示延遲12階和延遲24階的偏自相關(guān)系數(shù)都顯著非零。所以可以認(rèn)為季節(jié)自相關(guān)特征是自相關(guān)系數(shù)截尾,偏自相關(guān)系數(shù)拖尾,這時用以12步為周期的模型提取差分后序列的季節(jié)自相關(guān)信息。綜合前面的差分信息,我們要擬合的乘法模型為

例6-7參數(shù)估計與模型檢驗參數(shù)估計結(jié)果擬合模型結(jié)構(gòu)為例6-7擬合模型殘差診斷例6-7模型擬合效果圖THANKS06多元時間序列分析07本章內(nèi)容偽回歸0102協(xié)整模型干預(yù)模型Granger因果檢驗0403多元時序回歸分析計量經(jīng)濟(jì)學(xué)家很早就開始構(gòu)建多元時序的回歸模型20世紀(jì)60-70年代,Granger等統(tǒng)計學(xué)家,對多元時序回歸模型提出了偽回歸的概念。他們提醒計量經(jīng)濟(jì)學(xué)家,在使用時間序列進(jìn)行線性回歸分析時,回歸模型很容易通過方程顯著性檢驗。很多時候不是因為這些序列之間真的具有因果關(guān)系,而是時間的相關(guān)性,造成非平穩(wěn)序列之間的“偽”回歸。

偽回歸定義對回歸模型進(jìn)行方程顯著性檢驗假設(shè)條件檢驗統(tǒng)計量偽回歸:真實拒絕原假設(shè)的概率大于理論上的拒真概率偽回歸隨機(jī)模擬試驗1974年,Granger和Newbold進(jìn)行了非平穩(wěn)序列偽回歸的隨機(jī)模擬試驗。檢驗結(jié)果說明在非平穩(wěn)的場合,參數(shù)顯著性檢驗犯第一類錯誤的概率遠(yuǎn)遠(yuǎn)大于顯著性水平,偽回歸顯著成立。這導(dǎo)致多元非平穩(wěn)序列的分析埋有隱患。試驗設(shè)計思想:分別擬合兩個隨機(jī)游走序列:其中:

構(gòu)建回歸模型:,并進(jìn)行參數(shù)顯著性檢驗。試驗結(jié)果由于這是兩個獨立的隨機(jī)游走模型,所以理論上它們應(yīng)該沒有任何相關(guān)性,即模型檢驗應(yīng)該顯著支持的假設(shè)。如果模擬結(jié)果顯示拒絕原假設(shè)的概率遠(yuǎn)遠(yuǎn)大于拒真概率,即認(rèn)為偽回歸顯著成立。大量隨機(jī)擬合的結(jié)果顯示,每100次回歸擬合中,平均有75次拒絕的假設(shè),拒真概率高達(dá)75%。這說明在非平穩(wěn)的場合,參數(shù)顯著性檢驗犯拒真錯誤的概率遠(yuǎn)遠(yuǎn)大于,偽回歸顯著成立。偽回歸產(chǎn)生原因產(chǎn)生偽回歸的原因是在非平穩(wěn)場合,參數(shù)的檢驗統(tǒng)計量不再服從正態(tài)分布(綠色)。統(tǒng)計量真實的抽樣分布(紅色)尾部肥,方差大,比正態(tài)分布要扁平很多。如果繼續(xù)使用正態(tài)分布的臨界值做方程顯著性判斷,則會導(dǎo)致很大的犯第一類錯誤的概率。本章內(nèi)容偽回歸0102協(xié)整模型干預(yù)模型Granger因果檢驗0403單整單整的概念如果序列平穩(wěn),說明序列不存在單位根,這時稱序列為零階單整序列,簡記為假如原序列一階差分后平穩(wěn),說明序列存在一個單位根,這時稱序列為一階單整序列,簡記為假如原序列至少需要進(jìn)行d階差分才能實現(xiàn)平穩(wěn),說明原序列存在d個單位根,這時稱原序列為d階單整序列,簡記為單整的性質(zhì)若,對任意非零實數(shù)a,b,有若,對任意非零實數(shù)a,b,有若,對任意非零實數(shù)a,b,有若,對任意非零實數(shù)a,b,有協(xié)整的概念假定自變量序列為,響應(yīng)變量序列為,構(gòu)造回歸模型假如回歸殘差序列平穩(wěn),我們稱響應(yīng)序列與自變量序列之間具有協(xié)整關(guān)系(Cointegration)。變量之間如果具有協(xié)整關(guān)系,意味著它們具有長期穩(wěn)定的均衡變化關(guān)系。協(xié)整檢驗假設(shè)條件原假設(shè):多元非平穩(wěn)序列之間不存在協(xié)整關(guān)系備擇假設(shè):多元非平穩(wěn)序列之間存在協(xié)整關(guān)系檢驗方法(EG兩步法)第一步:建立響應(yīng)序列與輸入序列之間的回歸模型第二步:對回歸殘差序列進(jìn)行平穩(wěn)性檢驗ARIMAX模型進(jìn)一步提取協(xié)整模型殘差序列

中蘊含的相關(guān)信息,構(gòu)建ARMA模型最終得到的模型稱為帶輸入變量的ARIMA模型,簡寫為ARIMAX模型例7-2生物學(xué)家進(jìn)行生態(tài)動力學(xué)研究,每隔12小時觀察一次草履蟲(paramecium,捕食者)和櫛毛蟲(didinium,被捕食者)的數(shù)量變化。根據(jù)這批實驗數(shù)據(jù)情分析:(1)實驗室環(huán)境下,捕食者與被捕食者之間具有協(xié)整關(guān)系嗎?(2)草履蟲的數(shù)量可以基于哪個模型進(jìn)行擬合(3)假如人為控制櫛毛蟲的數(shù)量,預(yù)測草履蟲的數(shù)量會發(fā)生怎樣的變化?例7-2繪制多元時序圖時序圖顯示出捕食者與被捕食者之間存在顯著的食物增加-捕食者增加-食物減少-捕食者減少的生態(tài)循環(huán)。捕食者與被捕食者之間存在長期均衡關(guān)系,但存在滯后期。下面基于互相和系數(shù)估計滯后期數(shù)?;ハ嚓P(guān)系數(shù)延遲k階互相關(guān)系數(shù)(Cross-correlationcoefficient)計算的是響應(yīng)序列滯后于輸入序列k期的相關(guān)系數(shù),即

之間的相關(guān)系數(shù)。根據(jù)Bartlett定量,互相關(guān)系數(shù)近似服從零均值正態(tài)分布互相關(guān)系數(shù)最大的那一期通常就是輸入變量和響應(yīng)變量之間反應(yīng)的滯后期。如果多階互相關(guān)系數(shù)都顯著非零(大于2倍標(biāo)準(zhǔn)差),就意味著輸入序列對響應(yīng)序列的影響是長期的。例7-2互相關(guān)系數(shù)圖捕食者與被捕食者序列的互相關(guān)系數(shù)在延遲2階后達(dá)到最大。這意味被捕食者數(shù)量的變化對2期后的捕食者數(shù)量的影響最大,而且它們之間周而復(fù)始的種群變化規(guī)律大概10期為一個周期。例7-2協(xié)整檢驗協(xié)整檢驗結(jié)果協(xié)整檢驗結(jié)論捕食者與延遲2階的被捕食者之間存在顯著的協(xié)整關(guān)系最大延遲階數(shù)協(xié)整統(tǒng)計量P值5%臨界值2-6.461.54e-07-3.42例7-2擬合協(xié)整模型擬合協(xié)整模型協(xié)整模型口徑協(xié)整模型解釋草履蟲種群的數(shù)量大概等于兩期之前櫛毛蟲種群數(shù)量的30%(0.2972)例7-2協(xié)整模型殘差檢驗殘差序列為非白噪聲序列擬合ARIMA((1,3),0,1)例7-2擬合ARIMAX模型擬合ARIMAX模型ARIMAX模型信息提取充分例7-2序列預(yù)測情景預(yù)測1(Low):假設(shè)櫛毛蟲種群的數(shù)量比上一個周期普遍減少50情景預(yù)測2(High):假設(shè)櫛毛蟲種群的數(shù)量比上一個周期普遍增加50誤差修正模型誤差修正模型(ErrorCorrectionModel)簡稱為ECM,最初由Hendry和Anderson于1977年提出,它常常作為協(xié)整回歸模型的補(bǔ)充模型出現(xiàn)。協(xié)整模型度量序列之間的長期均衡關(guān)系,而ECM模型則解釋序列的短期波動關(guān)系。誤差修正模型構(gòu)造思想:對協(xié)整模型進(jìn)行等價差分運算,就得到短期波動關(guān)系代表的是上一期的誤差,特別記作,則上式可以表達(dá)為短期影響因素分析響應(yīng)序列的當(dāng)期波動主要會受到三方面短期波動的影響輸入序列的當(dāng)期波動上一期的誤差純隨機(jī)波動為了定量地測定這三方面影響的大小,尤其是上期誤差對當(dāng)期波動的影響,可以構(gòu)建ECM模型,模型結(jié)構(gòu)如下:誤差修正模型的負(fù)反饋機(jī)制模型結(jié)構(gòu)負(fù)反饋機(jī)制以例7-3的應(yīng)用背景對誤差修正模型的負(fù)反饋機(jī)制進(jìn)行直觀解釋當(dāng)時,即上期真實支出比估計支出大,這種誤差反饋回來,會導(dǎo)致下期支出適當(dāng)壓縮當(dāng)時,即上期真實支出比估計支出小,這種誤差反饋回來,會導(dǎo)致下期支出適當(dāng)增加例7-2續(xù)

誤差修正模型根據(jù)草履蟲和櫛毛蟲的差分序列與協(xié)整誤差序列,得到誤差修正模型為對誤差修正模型的解讀:系數(shù)0.2074意味著如果櫛毛蟲的數(shù)量短期增加或減少1個單位,會導(dǎo)致草履蟲數(shù)量相應(yīng)地增加或減少0.2個單位如果因為各種隨機(jī)因素的作用,使得某個時刻草履蟲的真實數(shù)量比協(xié)整均值多或少1個單位,那么下一期草履蟲的數(shù)量會平均減少或增加0.5個單位,這意味著這個生態(tài)系統(tǒng)糾錯的回彈速度超過了1/2(0.5205)。這是很大的修正彈性。所以捕食者(草履蟲)與被捕食者(櫛毛蟲)形成的生態(tài)平衡是比較穩(wěn)定的。本章內(nèi)容偽回歸0102協(xié)整模型干預(yù)模型Granger因果檢驗0403干預(yù)分析干預(yù)分析的定義時間序列常常受到某些外部事件的影響,諸如:假期,罷工,促銷,或者政策的改變等。我們稱這些外部事件為“干預(yù)”。評估外部事件對序列產(chǎn)生的影響的分析,稱為干預(yù)分析(interventionanalysis)。干預(yù)分析的產(chǎn)生背景最早的干預(yù)分析是1975年Box和刁錦寰(Tiao)對加州63號法令是否有效抑制了加州空氣污染問題的研究。他們首次將干預(yù)事件以虛擬變量的方式進(jìn)行標(biāo)注,然后把虛擬變量作為輸入變量引入序列分析,構(gòu)建ARIMAX模型。干預(yù)分析的實質(zhì)所謂干預(yù)模型實際上是帶虛擬變量回歸的ARIMAX模型,所以干預(yù)模型實質(zhì)上就是ARIMAX模型的一種特例。例7-3二戰(zhàn)之后加利福尼亞州經(jīng)濟(jì)高速發(fā)展,蓬勃發(fā)展的經(jīng)濟(jì)也帶來了嚴(yán)重的空氣污染。由于工廠排放的廢氣、汽車排放的尾氣、家庭使用的燃?xì)馀欧盼镏卸己写罅康牡趸锖突钚蕴細(xì)浠?。廢氣在陽光的作用下產(chǎn)生化學(xué)反應(yīng),這些化學(xué)反應(yīng)物形成了嚴(yán)重的霧霾,造成大量人群流眼淚,咳嗽、肺部受損等身體傷害。經(jīng)測量光化學(xué)污染程度的標(biāo)志是臭氧的含量。為了解決污染問題,加州政府在1959年頒布了63號法令。該法令要求從1960年1月起,在當(dāng)?shù)劁N售的汽油中減少碳?xì)浠锏娜菰S比。Box和Tiao在1975年,根據(jù)他們收集的1955年1月—1972年12月的月度臭氧濃度序列,分析63號法令的頒布執(zhí)行,對控制加州的光學(xué)污染有沒有起到作用?如果起了作用,起了多大的作用。步驟一:繪制時序圖考察序列的時序圖,研究干預(yù)變量對序列的干預(yù)機(jī)制。臭氧序列時序圖步驟二:干預(yù)變量和干預(yù)機(jī)制設(shè)定在這個研究中,干預(yù)變量是63號法令的頒布和執(zhí)行。這是一個定性變量,它沒有數(shù)值,只有兩個屬性:(1)1960年之前沒有執(zhí)行,(2)1960年之后執(zhí)行了。基于這種情況,Box和Tiao把干預(yù)變量以虛擬變量的方式進(jìn)行處理在研究中,Box和Tiao發(fā)現(xiàn),除了政策法規(guī)這個干預(yù)變量之外,影響臭氧濃度的還有一個定性變量,那就是季節(jié)。因為冬季有供暖需求,廢氣排放比夏天多。其次冬季的溫度低,污染物的擴(kuò)散慢,所以冬季和夏季對臭氧濃度可能有不同的干預(yù)力度。所以他們又構(gòu)造了兩個虛擬變量,用以描述季節(jié)對臭氧序列的影響(這兩個變量選其一即可)干預(yù)機(jī)制時序圖顯示,序列有明顯的季節(jié)效應(yīng)。63號法令執(zhí)行之后(參照線前后),序列的周期波動特征沒有明顯改變,但是序列的波動水平比以前明顯降低。所以季節(jié)效應(yīng)和63號法令作為兩個干預(yù)變量引入臭氧序列擬合。步驟三

干預(yù)模型殘差白噪聲檢驗步驟四

殘差序列定階考察殘差序列的自相關(guān)圖和偏自相關(guān)圖,為殘差序列指定模型結(jié)構(gòu)為步驟五:擬合帶干預(yù)變量的ARIMAX模型模型擬合結(jié)果模型口徑干預(yù)模型顯著性檢驗步驟六:干預(yù)效果分析干預(yù)效果解讀根據(jù)β1=一1.4215,且該系數(shù)z檢驗顯著非零的特征,可以認(rèn)為63號法令的頒布和實施降低了加州臭氧濃度。這說明63號法令的頒布和實施對治理加州的空氣污染是顯著有效的。又因為在1960年之前,加州臭氧序列的平均濃度等于4.177,因為63號法令的執(zhí)行,臭氧濃度平均降低了1.4215,所以63號法令的執(zhí)行使得加州臭氧濃度比法令執(zhí)行之前下降了34%左右。由于β2=1.3689,且該系數(shù)z檢驗顯著非零的特征,說明盡管夏季和冬季各有不利的條件,都有可能引起臭氧濃度升高,但夏季強(qiáng)烈的光照比冬季更容易產(chǎn)生臭氧光污染。干預(yù)機(jī)制的選擇干預(yù)模型是進(jìn)行政策效果評估或分析特殊事件影響的有用模型。而干預(yù)模型的關(guān)鍵是將干預(yù)事件以虛擬變量的形式引入響應(yīng)序列分析。干預(yù)事件根據(jù)作用機(jī)制可以分為三種類型:階梯干預(yù)脈沖干預(yù)其他干預(yù)用階梯干預(yù)和脈沖干預(yù)的轉(zhuǎn)換函數(shù)或組合來生成本章內(nèi)容偽回歸0102協(xié)整模型干預(yù)模型Granger因果檢驗0403因果關(guān)系的識別對于多元時間序列而言,如果能找到對響應(yīng)變量有顯著影響的輸入序列,并且能驗證它們之間具有協(xié)整關(guān)系,這對準(zhǔn)確預(yù)測響應(yīng)變量的波動,或者通過控制輸入序列的取值,間接控制響應(yīng)變量的發(fā)展都是非常有用的。但前提是輸入序列和響應(yīng)序列之間具有真正的因果關(guān)系,而且一定是輸入序列為因,響應(yīng)序列為果。這種因果關(guān)系的認(rèn)定,在某些情況下是清晰明確的。比如例7-3,對于中國農(nóng)村家庭而言,一定是量入為出,收入的多少影響了支出的多少,所以一定是收入為因,支出為果。這個例子中輸入變量和因變量很好識別。但是在有些領(lǐng)域,變量之間的關(guān)系可能比較復(fù)雜,因果關(guān)系的識別并不是一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論