營(yíng)銷數(shù)據(jù)分析-案例 第4章基于 ARIMA 模型的產(chǎn)品生命周期預(yù)測(cè)案例_第1頁(yè)
營(yíng)銷數(shù)據(jù)分析-案例 第4章基于 ARIMA 模型的產(chǎn)品生命周期預(yù)測(cè)案例_第2頁(yè)
營(yíng)銷數(shù)據(jù)分析-案例 第4章基于 ARIMA 模型的產(chǎn)品生命周期預(yù)測(cè)案例_第3頁(yè)
營(yíng)銷數(shù)據(jù)分析-案例 第4章基于 ARIMA 模型的產(chǎn)品生命周期預(yù)測(cè)案例_第4頁(yè)
營(yíng)銷數(shù)據(jù)分析-案例 第4章基于 ARIMA 模型的產(chǎn)品生命周期預(yù)測(cè)案例_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第4章基于ARIMA模型的產(chǎn)品生命周期預(yù)測(cè)案例基于ARIMA模型的空氣質(zhì)量AQI時(shí)間序列分析背景:隨著全球氣候的變暖,空氣質(zhì)量每天發(fā)生變化,而人們的生活質(zhì)量和空氣質(zhì)量息息相關(guān)。如下表1所示,空氣質(zhì)量和空氣的成分有很大的關(guān)系,為此文中選擇某城市一年內(nèi)的空氣指數(shù)數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)基本描述對(duì)數(shù)據(jù)進(jìn)行基本統(tǒng)計(jì),得到時(shí)序數(shù)值共365個(gè),AQI的基本數(shù)值情況如下表1所示,通過查詢空氣質(zhì)量指數(shù)得到AQI空氣質(zhì)量指數(shù)取值范圍及其相應(yīng)內(nèi)別,如下表2所示:由表1中最大AQI數(shù)值為299,得知空氣質(zhì)量最大為重度污染。中位數(shù)值為97,屬于空氣質(zhì)量良好,平均空氣質(zhì)量為107,屬于輕度污染,故初步看該城市空氣質(zhì)量效果較好。而不同時(shí)間段下的空氣質(zhì)量也可能不同,為此根據(jù)中國(guó)的季度時(shí)間劃分:春季,為3,4,5月;夏季,為6,7,8月;秋季,為9,10,11月;冬季,為12,1,2月。對(duì)時(shí)間數(shù)據(jù)進(jìn)行劃分,得到不同季節(jié)的空氣質(zhì)量變化如下圖所示:從箱線圖可以看出,AQI指數(shù)在200以上的主要集中在冬季和春季,整體空氣質(zhì)量指數(shù)值集中在200以下,極個(gè)別異常AQI數(shù)值超出200以上,初步可說明該城市的空氣質(zhì)量整體情況較好。為進(jìn)一步探究對(duì)空氣質(zhì)量指數(shù)和時(shí)間的變化,故建立時(shí)間序列ARMA模型。ARMA模型2.1ARMA模型概述ARMA模全稱為自回歸移動(dòng)平均模型(Auto-regressiveMovingAverageModel,簡(jiǎn)稱ARMA)是研究時(shí)間序列的重要方法。其在時(shí)序數(shù)據(jù)分析過程中既考慮了數(shù)據(jù)在時(shí)間序列上的依存性,又考慮了隨機(jī)波動(dòng)的干擾性,對(duì)對(duì)應(yīng)時(shí)序的發(fā)生變量運(yùn)行短期趨勢(shì)的預(yù)測(cè)準(zhǔn)確率較高,是近年應(yīng)用比較廣泛的方法之一。ARMA模型是由美國(guó)統(tǒng)計(jì)學(xué)家G.E.P.Box和G.M.Jenkins在20世紀(jì)70年代提出的著名時(shí)序分析模型,即自回歸移動(dòng)平均模型。ARMA模型有自回歸模型AR(q)、移動(dòng)平均模型MR(q)、自回歸移動(dòng)平均模型ARMA(p,q)3種基本類型。其中ARMA(p,q)自回歸移動(dòng)平均模型,模型可表示為:其中,為自回歸模型的階數(shù),為移動(dòng)平均模型的介數(shù);表示時(shí)間序列在時(shí)刻的值;為自回歸系數(shù);表示移動(dòng)平均系數(shù);表示時(shí)間序列在時(shí)期的誤差或偏差。2.2ARMA模型建模流程首先用ARMA模型預(yù)測(cè)要求序列必須是平穩(wěn)的,也就是說,在研究的時(shí)間范圍內(nèi)研究對(duì)象受到的影響因素必須基本相同。若所給的序列并非穩(wěn)定序列,則必須對(duì)所給的序列做預(yù)處理,使其平穩(wěn)化,然后用ARMA模型建模。建模的基本步驟如下:(1)求出該觀察值序列的樣本自相關(guān)系數(shù)(ACF)和樣本偏相關(guān)(PACF)的值。(2)根據(jù)樣本自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì)選擇適當(dāng)?shù)哪P瓦M(jìn)行擬合。(3)估計(jì)模型中未知參數(shù)的值。(4)檢驗(yàn)?zāi)P偷挠行?。如果擬合模型通不過檢驗(yàn),轉(zhuǎn)向步驟(2),重新選擇模型再擬合。(5)模型優(yōu)化。如果擬合模型通過檢驗(yàn),仍然轉(zhuǎn)向步驟(2),充分考慮各種可能,建立多個(gè)擬合模型,從所有通過檢驗(yàn)的擬合模型中選擇最優(yōu)模型。(6)利用擬合模型,預(yù)測(cè)序列的將來走勢(shì)。3.AQI時(shí)間序列模型的建立3.1數(shù)據(jù)的預(yù)處理本文選取了1年AQI數(shù)據(jù)作為時(shí)間序列觀察值。對(duì)此時(shí)間序列做時(shí)序圖如圖1所示:在發(fā)現(xiàn)經(jīng)AQI數(shù)據(jù)的序列具有波動(dòng)性,而我們的目的主要是利用ARMA模型對(duì)其周期成分進(jìn)行分析,因此需要對(duì)此類的數(shù)據(jù)先進(jìn)行消除趨勢(shì)性的處理,然后從圖(1)可以觀察得出,序列大致趨于平穩(wěn)。為了進(jìn)一步檢驗(yàn)序列是否真正平穩(wěn),在此使用R語(yǔ)言統(tǒng)計(jì)軟件對(duì)已轉(zhuǎn)換進(jìn)行平穩(wěn)性檢驗(yàn)。對(duì)時(shí)間序列的平穩(wěn)性有兩種檢驗(yàn)方法,一種是根據(jù)時(shí)序圖和自相關(guān)圖顯示的特征作出判斷的圖檢驗(yàn)方法;一種是構(gòu)造檢驗(yàn)統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn)的方法。目前最常用的平穩(wěn)性統(tǒng)計(jì)檢驗(yàn)方法是單位根檢驗(yàn)(unitroottest)。使用單位根檢驗(yàn)法對(duì)變換數(shù)據(jù)進(jìn)行檢驗(yàn)得出檢驗(yàn)結(jié)果如表1所示:由時(shí)間序列的時(shí)序圖可以發(fā)現(xiàn)AQI隨時(shí)間的增長(zhǎng)是呈上下波動(dòng)趨勢(shì)。因此,對(duì)原始序列不需作對(duì)數(shù)變換和差分,直接對(duì)數(shù)據(jù)進(jìn)行檢驗(yàn)即可。并作出單位根檢驗(yàn)如下表1所示:表1AQI數(shù)據(jù)單位根檢驗(yàn)3.2模型的識(shí)別與選擇計(jì)算出樣本自相關(guān)系數(shù)和偏相關(guān)系數(shù)的值之后,我們主要是根據(jù)它們表現(xiàn)出來的性質(zhì),選擇適當(dāng)?shù)腁RMA模型擬合觀察值序列。這個(gè)過程實(shí)際上就是要根據(jù)樣本自相關(guān)系數(shù)和偏相關(guān)系數(shù)的性質(zhì)估計(jì)自相關(guān)階數(shù)和移動(dòng)平均階數(shù),因此模型的識(shí)別過程也成為定階過程。一般ARMA模型定階的基本原則如表2示:表2ARMA(p,q)模型選擇原則ACFPACF模型定階拖尾p階截尾AR§模型q階截尾拖尾MA(q)模型拖尾拖尾ARMA(p,q)模型對(duì)AQI數(shù)據(jù)進(jìn)行分析,可得樣本自相關(guān)系數(shù)和偏相關(guān)系數(shù)圖如圖2所示:圖2序列自相關(guān)系數(shù)與偏相關(guān)系數(shù)圖

由上圖可以看出AQI序列拖尾不明顯,為此分別對(duì)時(shí)序值數(shù)據(jù)進(jìn)行一階差分和取對(duì)數(shù)觀察數(shù)據(jù)的正態(tài)性檢驗(yàn)如下圖所示:通過對(duì)AQI序列進(jìn)行處理后,發(fā)現(xiàn)對(duì)AQI數(shù)值進(jìn)行取對(duì)數(shù)后,數(shù)據(jù)趨勢(shì)刻畫成一條直線較為明顯。故AR模型的數(shù)據(jù)可選擇對(duì)AQI數(shù)據(jù)取對(duì)數(shù)后建立自回歸模型。模型序號(hào)對(duì)應(yīng)模型no-zeromean1ARIMA(2,0,2)226.05052ARIMA(0,0,0)291.45643ARIMA(1,0,0)282.75974ARIMA(0,0,1)270.9726ARIMA(1,0,2)225.5003自相關(guān)系數(shù)和偏相關(guān)系數(shù)圖的分析觀察,可以知道模型大致可選取兩種模型。第一種,自相關(guān)系數(shù)為拖尾,而偏相關(guān)系數(shù)為一階截尾。此時(shí)選取模型可以為ARIMA(1,0,0)模型。第二種,自相關(guān)二階截尾,而偏相關(guān)系數(shù)為一階截尾。此時(shí)選取模型可以為ARIMA(1,0,2)模型。3.3參數(shù)估計(jì)選擇擬合好后的模型之后,下一步就是要利用序列的觀察值確定該模型的口徑,即估計(jì)模型中未知參數(shù)的值。對(duì)于一個(gè)非中心化ARMA(p,q)模型,有式中,~該模型共含個(gè)未知參數(shù):。對(duì)于未知參數(shù)的估計(jì)方法有三種:矩估計(jì)﹑極大似然估計(jì)和最小二乘估計(jì)。其中使用最小二乘估計(jì)法對(duì)序列進(jìn)行參數(shù)估計(jì)。在ARMA(p,q)模型場(chǎng)合,記殘差項(xiàng)為:~殘差平方和為:~是殘差平方和達(dá)到最小的那組參數(shù)值即為的最小估計(jì)值。使用程序操作可得序列參數(shù)估計(jì)最佳值如下:AIC=214.87AICc=214.98BIC=230.463.4參數(shù)的顯著性檢驗(yàn)參數(shù)的顯著性檢驗(yàn)就是要檢驗(yàn)每一個(gè)未知參數(shù)是否顯著非零。這個(gè)檢驗(yàn)的目的是為了是使模型最精簡(jiǎn)。如果某個(gè)參數(shù)不顯著,即表示該參數(shù)所對(duì)應(yīng)的那個(gè)自變量對(duì)因變量的影響不明顯,該自變量就可以從擬合模型中刪除。最終模型將由一系列參數(shù)顯著非零的自變量表示。由模型參數(shù)估計(jì)與檢驗(yàn)結(jié)果,可以觀察到t統(tǒng)計(jì)量值的值均小于0.05。表明模型參數(shù)顯著。4.結(jié)論時(shí)間序列分析的ARMA模型預(yù)測(cè)問題,實(shí)質(zhì)上是通過對(duì)時(shí)間變化過程的分析研究,找出其發(fā)展變化的量變規(guī)律性,用以預(yù)測(cè)未來的空氣質(zhì)量。預(yù)測(cè)時(shí)不必考慮其他因素的影響,僅從序列自身出發(fā),建立相應(yīng)的模型進(jìn)行預(yù)測(cè),這就從根本上避免了尋找主要因素及識(shí)別主要因素和次要因素的困難;和回歸分析相比,可以避免了尋找因果模型中對(duì)隨機(jī)擾動(dòng)項(xiàng)的限定條件在經(jīng)濟(jì)實(shí)踐中難以滿足的矛盾。實(shí)際上這也是ARMA模型預(yù)測(cè)與其他預(yù)測(cè)方法相比的優(yōu)越性所在。但由于空氣質(zhì)量受到人為、工業(yè)等不確定性因素影響,僅只能通過部分?jǐn)?shù)據(jù)進(jìn)行分析,分析具有一定的局限性。本文運(yùn)用時(shí)間序列的分析方法,對(duì)空氣質(zhì)量進(jìn)行分析。將ARIMA(1,0,0)模型對(duì)該序列進(jìn)行擬合,最終得出空氣質(zhì)量的變化規(guī)律,總體而言空氣質(zhì)量較好。數(shù)據(jù)加載與準(zhǔn)備install.packages("tseries")install.packages("forecast")install.packages("decompose")library(tseries)library(forecast)data<-read.csv("time.csv")str(data)描述統(tǒng)計(jì)分析summary(data$AQI)#查看數(shù)據(jù)趨勢(shì)boxplot(AQI~season,data,col=c(1,2,3,4),border=c("darkgray","purple"),ylab="AQI指數(shù)")tsdisplay(data$AQI)#得到acf和pacfr<-diff(log(data$AQI))#取對(duì)數(shù)后差分tsdisplay(r)正態(tài)性檢驗(yàn)par(mfrow=c(2,2))qqnorm(data$AQI,ylab="原始AQI數(shù)值")qqnorm(r,ylab="取對(duì)數(shù)后的AQI數(shù)值")qqnorm(data_d1,ylab="一階差分AQI數(shù)值")acf/pacf檢驗(yàn)和單位根檢驗(yàn)Box.test(data$AQI,lag=52,type="Ljung-Box")#數(shù)據(jù)白噪聲檢驗(yàn),通過Box-Ljung檢驗(yàn),則說明時(shí)間序列模型可以用來對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)par(mfrow=c(2,1))acf(data$AQI)acf(r)pacf(data$

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論