常用統(tǒng)計預測方法_第1頁
常用統(tǒng)計預測方法_第2頁
常用統(tǒng)計預測方法_第3頁
常用統(tǒng)計預測方法_第4頁
常用統(tǒng)計預測方法_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、常用統(tǒng)計預測方法第1頁,共51頁,2022年,5月20日,5點56分,星期三第一節(jié) 概 述第2頁,共51頁,2022年,5月20日,5點56分,星期三 一、基本任務和意義 統(tǒng)計預測(forecasting)應用最廣泛的預測方法,對大量的數(shù)據(jù)資料進行統(tǒng)計分析,以求得比較準確的預測結果的理論和方法。 第3頁,共51頁,2022年,5月20日,5點56分,星期三 統(tǒng)計預測的作用為管理決策提高科學依據(jù);為制定政策、編制計劃和檢查政策、計劃的執(zhí)行情況提供科學依據(jù);為統(tǒng)計工作的本身發(fā)展開拓了一個新的領域。局限性:不能過多外延,影響預測的主觀、客觀因素較多。第4頁,共51頁,2022年,5月20日,5點56

2、分,星期三 二、統(tǒng)計預測的分類按預測方法分:定性預測與定量預測按預測時間分:短期預測:月、季、1年 中期預測:35年 長期預測:510年或以上第5頁,共51頁,2022年,5月20日,5點56分,星期三1、定性預測依據(jù)預測者的直觀判斷能力對預測事件的未來狀況進行直觀判斷的方法。主要是對未來狀況作性質上的預測,而不著重考慮其量的變化。主要有:頭腦風暴法、特爾菲法Delphi(專家調查法)、主觀概率法、交叉概率法等。第6頁,共51頁,2022年,5月20日,5點56分,星期三德爾菲法Delphi這是由美國蘭德公司和道格拉斯公司協(xié)作發(fā)展的一種專家預測方法。它通過寄發(fā)調查表的形式征求專家的意見:專家在

3、提出意見后以不記名的方式反饋回來;組織者將得到的初步結果進行綜合整理,然后反饋給各位專家,請他們重新考慮后再次提出意見;經過幾輪的匿名反饋過程,專家意見基本趨向一致;組織者依此得出預測結果。第7頁,共51頁,2022年,5月20日,5點56分,星期三 2、定量預測方法 根據(jù)歷史數(shù)據(jù)可統(tǒng)計資料,運用數(shù)學或其它分析的方法所建立的模型計算預測對象在未來可能表現(xiàn)的數(shù)量。第8頁,共51頁,2022年,5月20日,5點56分,星期三(1)時間序列法: 確定性時間序列預測,如移動平均法(一、二次),指數(shù)平滑法(一 、二、三次),季節(jié)周期法 隨機性時間序列預測,如平穩(wěn)時間序列預測(ARMA,ARIMA等),

4、回歸預測(線性、非線性、自回歸預測等) 馬爾柯夫(Markov)預測 系統(tǒng)動力學(SD)預測(2)模糊預測(3)灰色系統(tǒng)預測第9頁,共51頁,2022年,5月20日,5點56分,星期三 三、預測步驟確定預測目標數(shù)據(jù)收集與預處理預測方法選擇與評價建立預測模型利用預測模型作預測計算結果分析與檢驗評價滿意否結束NY第10頁,共51頁,2022年,5月20日,5點56分,星期三 預測結果的檢驗評價相互檢驗:使用不同預測方法對同一對象進行預測,比較各自的預測誤差。對比檢驗:用預測結果與別人的預測結果進行比較。專家檢驗:通過專家對結果的咨詢,來評價其準確度。第11頁,共51頁,2022年,5月20日,5點

5、56分,星期三第二節(jié) 指數(shù)平滑方法時間序列定義:一組按時間先后順序排列的數(shù)據(jù)序列稱為時間序列,用符號y1,y2,yT表示,此中T稱為時間序列的長度。第12頁,共51頁,2022年,5月20日,5點56分,星期三分析要求:序列的平穩(wěn) 即:1.均數(shù)不隨時間變化(差分) 2.方差不隨時間變化(對數(shù)和平方根轉換) 3.無周期性變化;(季節(jié)差分) 4.自相關系數(shù)只與時間間隔有關,于所處的時間無關。 第13頁,共51頁,2022年,5月20日,5點56分,星期三 指數(shù)平滑方法 利用本期實際數(shù)與本期預測數(shù)。以平滑系數(shù)加權計算指數(shù)平滑平均數(shù),作為下期預測數(shù)。一般適用于短期和近期預測。第14頁,共51頁,202

6、2年,5月20日,5點56分,星期三1、一次指數(shù)平滑 第t時刻的實際值 第t時刻的預測值 平滑系數(shù),0 1反復遞推得,第15頁,共51頁,2022年,5月20日,5點56分,星期三 值的選擇 值實際上是t期實際值和預測值的比例分配。其確定,是指數(shù)平滑法預測的關鍵。數(shù)據(jù)呈水平波動發(fā)展,于其無關;長期趨勢比較穩(wěn)定,取較小值0.050.20;呈迅速明顯變動趨勢,取較大值0.30.7或者選取不同值,分別預測,根據(jù)結果選取符合實際的 值。第16頁,共51頁,2022年,5月20日,5點56分,星期三 初始值的估計當數(shù)據(jù)較多的時候,初始值的影響被逐步平滑而降低到最小,此時可以用第一個數(shù)據(jù)代替。當數(shù)據(jù)較少時

7、,初始值的影響較大,可以取最初幾個實際值的平均值作為初始值的估計值。第17頁,共51頁,2022年,5月20日,5點56分,星期三2、多次指數(shù)平滑預測二次指數(shù)平滑預測:對于有明顯線性趨勢的時間序列,對一次平滑值再作一次指數(shù)平滑。三次指數(shù)平滑預測:出現(xiàn)曲線趨勢。各自的預測模型如下: 線性趨勢 曲線趨勢第18頁,共51頁,2022年,5月20日,5點56分,星期三例某公司1992年1季度到2000年4季度的銷售資料,請用指數(shù)平滑法分析預測將來4個季度的銷售額第19頁,共51頁,2022年,5月20日,5點56分,星期三預測結果第20頁,共51頁,2022年,5月20日,5點56分,星期三優(yōu)缺點只要

8、知道本期的實際值和預測值就可以預測下一個時間的數(shù)值了只適用于隨時間的消逝呈指數(shù)下降的數(shù)據(jù)平滑參數(shù)的確定沒有很好的判斷原則。初始值的確定,如果數(shù)據(jù)點少,初始值對預測值的影響較大,違背了指數(shù)衰減的假設了。一般數(shù)據(jù)點大于40,初始值就影響不大。適用于呈水平發(fā)展的序列,如有上升、下降和季節(jié)變化的,可以通過差分使得數(shù)據(jù)平穩(wěn)化。時間序列的預測一般不能太超前。第21頁,共51頁,2022年,5月20日,5點56分,星期三 第三節(jié) ARIMA預測方法 (autoregressive integrated moving average) 一、預測模型 自回歸模型(AR) 滑動平均模型(MA) 自回歸滑動平均模型

9、(ARIMA) 該方法包含三個過程:自回歸、滑動平均和差分求和。第22頁,共51頁,2022年,5月20日,5點56分,星期三1、自回歸模型(AR)Yt與自己過去值的線性回歸。Yt=1Yt-1+2Yt-2+ pYt-p+et 式中: 1, 2, p 是自回歸系數(shù);et 是隨機項或稱誤差項又稱白噪聲;p 是自回歸階數(shù)。若p1,則模型為 Yt= 1Yt-1+et第23頁,共51頁,2022年,5月20日,5點56分,星期三 2、滑動平均模型(MA)t期觀測值Yt被描述為過去誤差e(et:t時期的誤差)的線性回歸。其模型形式為:Yt=et-1et-1-2et-2-qet-q 式中: 是移動平均系數(shù),

10、q 是滑動平均的階數(shù)。 若q=1,模型為 Yt=et-1et-1第24頁,共51頁,2022年,5月20日,5點56分,星期三3、自回歸滑動平均模型(ARIMA)其模型為自回歸模型與滑動平均模型的組合:Yt=1Yt-1+2Yt-2+ pYt-p+et 1et-1-2et-2- -qet-q 若p=1,q=1,則模型為:Yt= 1Yt-1+et-1et-1第25頁,共51頁,2022年,5月20日,5點56分,星期三 運用的前提條件待分析的時間序列已經是由一個零均值的平穩(wěn)隨機過程產生,平穩(wěn)表明其折線圖無明顯的上升或下降趨勢。非零均值、不平穩(wěn)序列處理方法: 1、零均值化處理: 2、對零均值非平穩(wěn)序

11、列進行差分: 滯后1項一階差分: 滯后1項二階差分: 滯后k項一階差分: . 3、對數(shù)或平方根轉換第26頁,共51頁,2022年,5月20日,5點56分,星期三Y1,Y2,Y3, ,Yt一階差分(t1):Y2 (Y2-Y1) ,Y3 (Y3-Y2),Y4 (Y4-Y3),Yt (Yt-Yt-1), 二階差分(t2): 2Y3 ( Y3 - Y2 ),2Y4 ( Y4 Y3 ), 2Yt ( Yt - Yt-1 ) . 第27頁,共51頁,2022年,5月20日,5點56分,星期三 預測的三個階段1、模型的識別 identification:主要通過自相關函數(shù)ACF、偏自相關函數(shù)PACF和CCF

12、分析系列的隨機性、平穩(wěn)性、季節(jié)性,把握模型的大致方向,為模型定階,提供粗的模型。2、參數(shù)估計和模型診斷estimation and diagno-stic:對提供的粗模型進行參數(shù)估計和假設檢驗,作模型的診斷。3、預測 forecasting:模型應用價值的體現(xiàn)。ARIMA: 自回歸的階為p,差分次數(shù)為d,滑動平均的階為q第28頁,共51頁,2022年,5月20日,5點56分,星期三 二、 ARIMA自相關分析n 是時間序列的觀測值數(shù)目; 是n 個樣本數(shù)據(jù)的平均值;Yt 是時間序列在t 時刻的值;Yt+k 是時間序列與t 時刻相隔k 期的值。rk 的取值范圍是1,1,它代表相差k個時期兩項數(shù)據(jù)系

13、列之間的相關程度。1. 自相關分析自相關系數(shù)第29頁,共51頁,2022年,5月20日,5點56分,星期三Yt :Y1,Y2,Y3, , Yn-k, , Yn-2, Yn-1, YnYt+1 (k=1) :Y2, Y3,Y4, ,YnYt+2 (k=2) :Y3, Y4,Y5, ,Yn .Yt+k :Y1+k, Y2+k,Y3+k, ,Yn第30頁,共51頁,2022年,5月20日,5點56分,星期三 由隨機數(shù)字構成的序列,其各階自相關系數(shù)應該是0。當序列諸項之間沒有相關時,樣本自相關系數(shù)的抽樣分布近似于以0為均值的正態(tài)分布。這樣,可以建立序列自相關系數(shù)的隨機區(qū)間。將時間系列的自相關系數(shù)與偏自

14、相關系數(shù)繪制成圖,并在圖上標出隨機區(qū)間就是自相關分析圖,它可以用來分析時間序列的隨機性、平穩(wěn)性、季節(jié)性特性。第31頁,共51頁,2022年,5月20日,5點56分,星期三2. 偏自相關系數(shù)時間序列Yt 與Yt-k 之間的相關是與中間各項Yt-1,Yt-2,Yt-k+1 的相關結合在一起的,為了排除中間諸項因素的影響,只觀察Yt 與Yt-k之間的相關,需要計算偏自相關系數(shù)。在時間序列中,偏自相關是在給定了Yt-1, Yt-2 ,Yt-k+1 的條件下,Yt 與Yt-k 之間的條件相 關。偏自相關和自相關系數(shù)被用來共同識別合適的ARIMR模型。第32頁,共51頁,2022年,5月20日,5點56分

15、,星期三 三、ARIMA的計算步驟1. 識別 通過序列圖、自相關分析對平穩(wěn)性、季節(jié)性進行識別。短時滯ACF為正且大,隨lag增加而緩慢下降,有上升或下降趨勢;L12時lag=12,24, ACF最大,無趨勢有季節(jié)性; ACF擺動在時滯12,24,有峰值,有趨勢的季節(jié)性。 proc arima; identify var=x(k); /*對滯后k項作一階差分*/proc arima; identify var=x(1,1); /*對滯后1項作二階差分*/第33頁,共51頁,2022年,5月20日,5點56分,星期三2、模型診斷殘差序列的分析: 其自相關和偏自相關不應與0有顯著的差異。殘差是隨機的

16、,是白噪聲。擬合優(yōu)度的檢驗: AIC 和 SBC 其值越低,模型越好。根據(jù)選中的模型,進行參數(shù)的粗略估計,然后用SAS軟件進行分析比較,選擇最佳的模型。第34頁,共51頁,2022年,5月20日,5點56分,星期三例223:某醫(yī)院90.101.12逐月門診量數(shù)據(jù):112 118 132 129 121 135 148 148 136 119 104 118115 126 141 135 125 149 170 170 158 133 114 140145 150 178 163 172 178 199 199 184 162 146 166171 180 193 181 183 218 230

17、 242 109 191 172 194196 196 236 235 229 243 264 272 237 211 180 201204 188 235 227 234 264 302 293 259 229 203 229242 233 267 269 270 315 364 347 312 274 237 278284 277 317 313 318 374 413 405 355 306 271 306315 301 356 348 355 422 465 467 404 347 305 336340 318 362 348 363 435 491 505 404 359 310 3

18、37360 342 406 396 420 472 458 559 463 407 362 405417 391 419 461 472 535 622 606 508 461 390 432第35頁,共51頁,2022年,5月20日,5點56分,星期三data ar;date=intnx(month,31dec1989d,_n_);input x;cards;112 118 132 129 121 135 148 148 136 119 104 118115 126 141 135 125 149 170 170 158 133 114 140145 150 178 163 172 178

19、199 199 184 162 146 166171 180 193 181 183 218 230 242 109 191 172 194196 196 236 235 229 243 264 272 237 211 180 201204 188 235 227 234 264 302 293 259 229 203 229242 233 267 269 270 315 364 347 312 274 237 278284 277 317 313 318 374 413 405 355 306 271 306315 301 356 348 355 422 465 467 404 347 30

20、5 336340 318 362 348 363 435 491 505 404 359 310 337360 342 406 396 420 472 458 559 463 407 362 405417 391 419 461 472 535 622 606 508 461 390 432;proc print data=ar;proc gplot data=ar;第一步:對平穩(wěn)性、季節(jié)性的識別第36頁,共51頁,2022年,5月20日,5點56分,星期三plot x*date /*date為橫軸,x為縱軸*/vaxis=axis1 /*變量軸記為axis1*/haxis=axis2 /*時

21、間軸記為axis2*/href=31dec1989d to 1jan02d by year;symbol i=join v=c h=0.5 l=1 font=swissb;axis1 order=(100 to 650 by 50);axis2 order=(31dec1989d to 1jan02d by year);run;第37頁,共51頁,2022年,5月20日,5點56分,星期三季節(jié)性,7、8月高,1、2月低;上升趨勢。取對數(shù)消除振幅變大趨勢;對滯后1項、12項取兩次差分,消除季節(jié)增長趨勢。第38頁,共51頁,2022年,5月20日,5點56分,星期三data ar1;date=in

22、tnx(month,31dec1989d,_n_);input x;cards;112 118 132 129 121 135 148 148 136 119 104 118417 391 419 461 472 535 622 606 508 461 390 432;run;data ar2;set ar1;xlog=log(x);run; /*取對數(shù),消除振幅變大趨勢*/proc arima data=ar2; /*調用arima過程*/identify var=xlog(1,12) /*對變量xlog進行滯后1項、12項共2次差 分,使系列平穩(wěn)*/ nlag=15; /*計算自相關的滯后

23、數(shù)為15,大于p+d+q,小于n,默認 值為24*/*/ run;第39頁,共51頁,2022年,5月20日,5點56分,星期三 AutocorrelationsLag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error 0 0.017435 1.00000 | |*| 0 1 -0.0083475 -.47877 | *| . | 0.087370 2 0.00049442 0.02836 | . |* . | 0.105514 3 -0.0018747 -.10752 | . *| . |

24、0.105572 4 0.0012192 0.06993 | . |* . | 0.106405 5 0.00056013 0.03213 | . |* . | 0.106755 6 0.00097085 0.05568 | . |* . | 0.106829 7 -0.0023892 -.13703 | .*| . | 0.107050 8 0.00016580 0.00951 | . | . | 0.108381 9 0.0012098 0.06939 | . |* . | 0.10838710 -0.0001744 -.01001 | . | . | 0.10872611 0.00340

25、00 0.19501 | . |* | 0.10873312 -0.0081267 -.46611 | *| . | 0.11137113 0.0039737 0.22791 | . |* | 0.12538114 -0.0000820 -.00470 | . | . | 0.12850415 0.0017610 0.10101 | . |* . | 0.128506 . marks two standard errorsACF在 lag=1、12時其值大,選MA階數(shù)為1、12第40頁,共51頁,2022年,5月20日,5點56分,星期三 Inverse Autocorrelations La

26、g Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 1 0.72768 | . |* | 2 0.51555 | . |* | 3 0.36419 | . |* | 4 0.25820 | . |* | 5 0.21269 | . |* | 6 0.17373 | . |* | 7 0.18386 | . |* | 8 0.16782 | . |* | 9 0.18360 | . |* | 10 0.21946 | . |* | 11 0.26616 | . |* | 12 0.32391 | . |* | 13 0.18256 |

27、 . |* | 14 0.08070 | . |*. | 15 0.01955 | . | . |IACF在 lag=1、12時其值大,選AR階數(shù)為1、12第41頁,共51頁,2022年,5月20日,5點56分,星期三 Partial Autocorrelations Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 1 -0.47877 | *| . | 2 -0.26060 | *| . | 3 -0.29951 | *| . | 4 -0.20526 | *| . | 5 -0.09406 | .*| . | 6 0.0

28、4898 | . |* . | 7 -0.07396 | . *| . | 8 -0.11844 | .*| . | 9 -0.02010 | . | . | 10 -0.02542 | . *| . | 11 0.30690 | . |* | 12 -0.26980 | *| . | 13 -0.19225 | *| . | 14 -0.13264 | *| . | 15 -0.05070 | . *| . |PACF在 lag=1、12時其值大,選AR階數(shù)為1、12第42頁,共51頁,2022年,5月20日,5點56分,星期三 Autocorrelation Check for White

29、 Noise To Chi- Pr Lag Square DF ChiSq -Autocorrelations-6 33.65 6 .0001 -0.479 0.028 -0.108 0.070 0.032 0.05612 74.33 12 .0001 -0.137 0.010 0.069 -0.010 0.195 -0.466P |t| LagMU 0.0004856 0.0005636 0.86 0.3905 0MA1,1 0.75055 0.08158 9.20 .0001 1MA2,1 0.83332 0.07743 10.76 0.05,系數(shù)為0,丟棄這兩項第45頁,共51頁,202

30、2年,5月20日,5點56分,星期三data ar1;input x;cards;112 118 132 129 121 135 148 148 136 119 104 118;run;data ar2;set ar1;xlog=log(x);run; proc arima data=ar2;identify var=xlog(1,12) nlag=15;estimate q=(1)(12) ;第三步:確定模型進行預測第46頁,共51頁,2022年,5月20日,5點56分,星期三forecast lean=12 /*向前預測的次數(shù)為12*/interval=month /*按月對總體均數(shù)作區(qū)間

31、估計*/out=foxxlog;run;/*將運行結果存入數(shù)據(jù)集foxxlog*/proc print data=foxxlog; /*輸出數(shù)據(jù)集foxxlog*/run;第47頁,共51頁,2022年,5月20日,5點56分,星期三Conditional Least Squares Estimation Standard ApproxParameter Estimate Error t Value Pr |t| LagMU 0.0004486 0.0005787 0.78 0.4397 0MA1,1 0.72660 0.06081 11.95 .0001 1MA2,1 0.81285 0.0

32、6010 13.52 Lag Square DF ChiSq -Autocorrelations-6 1.28 4 0.8641 0.023 0.022 -0.054 -0.017 0.062 -0.03512 4.88 10 0.8988 -0.127 -0.057 0.029 0.048 0.051 0.01618 11.53 16 0.7753 0.073 0.081 0.074 -0.073 0.124 -0.07824 15.60 22 0.8354 -0.040 -0.081 -0.018 0.056 0.116 0.016第48頁,共51頁,2022年,5月20日,5點56分,星期三 Forecasts for va

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論