


版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、.數(shù)學建模論文院、系、專業(yè)聯(lián)系方式隊伍成員交通與物流工程交通與物流工程交通與物流工程高速公路道路交通事故分析預測摘要我國目前的道路交通安全狀況相對于世界水平要差得多,高速公路道路交通事故所造成的損失非常高。因此,改善交通安全狀況、預防和減少高速公路交通事故具有重大的現(xiàn)實意義。針對這樣的現(xiàn)狀,我們必須進行高速公路交通事故的預測,從而及早采取措施進行預防工作,從而減少事故發(fā)生次數(shù)及損失程度。針對此次建模的要求,在對此問題的深入研究下,我們提出了合理的假設,將本問題歸結(jié)為一個預測分析的問題,其基本思想是通過聚類分析、SPSS軟件求解、GM(1,1)灰色預測模型、多元線性回歸分析,組合模型等方法的運用
2、得到最優(yōu)的預測結(jié)果。針對問題一,我們首先運用了聚類分析的思想,建立了基于聚類分析的模型,通過聚類分析方法對給定的信息的篩選、加工、延伸和擴展,從而將評價對象確定在某一范圍內(nèi),通過了該方法,最終得到了各類評價等級方法,為科學預測交通事故提供了依據(jù)。針對問題二,本文選取受傷人數(shù)這一單項指標作為預測的對象,首先運用了GM(1,1)灰色預測模型,建立模型,通過對給定的事故原始數(shù)據(jù),通過MATLAB軟件預測了五年內(nèi)的交通事故受傷人數(shù);運用多元線性回歸方法建立模型,在模型和模型的基礎之上,通過基于組合模型思想的模型,求解得出了交通事故受傷人數(shù)在五年內(nèi)的預測。關鍵詞:SPSS聚類分析 GM(1,1)灰色預測
3、模型組合預測模型 MATLAB目錄一問題重述3二問題的分析4三模型假設與符號系統(tǒng)53.1模型假設53.2符號系統(tǒng)6四模型的建立及求解74.1 問題一74.1.1建立模型74.1.2模型的求解及結(jié)果84.1.3實驗結(jié)果的分析說明94.2 問題二124.2.1建立GM(1,1)模型124.2.2 用MATLAB求解模型164.2.3 建立模型194.2.4 建立優(yōu)化模型204.2.5最優(yōu)組合模型的求解21五模型的評價22參考文獻23附錄24一問題重述隨著道路交通事業(yè)的發(fā)展,高速公路交通事故也在不斷增加,對人類的生命和財產(chǎn)安全構(gòu)成了極大的威脅。我國目前的道路交通安全狀況相對于世界水平要差得多,高速公
4、路道路交通事故所造成的損失非常高。因此,改善交通安全狀況、預防和減少高速公路交通事故具有重大的現(xiàn)實意義。高速公路交通事故往往造成人員傷亡,車輛損毀、道路堵塞等嚴重后果,為探索高速公路道路交通事故發(fā)生的規(guī)律,分析現(xiàn)有道路交通條件下未來高速公路交通事故的發(fā)展趨勢,以便及早采取措施進行預防,減少事故發(fā)生次數(shù)及損失程度,必須進行高速公路交通事故預測。另外,高速公路道路交通事故分析預測是道路交通安全規(guī)劃,決策及高速公路交通工程項目效益評價中的一個關鍵性問題,分析預測正確與否直接關系到高速公路交通設施的建設,高速公路交通管理政策的制定和高速公路交通建設資金的投資分配,具有重要的現(xiàn)實意義。為了解決此問題,現(xiàn)
5、利用已收集到的A省高速公路交通事故數(shù)據(jù)(見)、建立針對該省具體情況的數(shù)學模型,預測該省未來的交通事故情況,解決下面幾個問題:1、目前國內(nèi)外用于統(tǒng)計道路交通事故狀況的四項絕對指標為交通事故次數(shù)、死亡人數(shù)、受傷人數(shù)以及直接經(jīng)濟損失,這四項統(tǒng)計指標既是認識交通事故的起點,又是構(gòu)造其它交通事故統(tǒng)計指標的基礎,基本涵蓋了道路交通事故所造成各種損害的主要方面,因此選用這四項指標,試探討以聚類分析作為理論基礎的高速公路公路交通事故統(tǒng)計分析方法,然后從中所給A省高速公路交通事故四項指標的歷史統(tǒng)計數(shù)據(jù)出發(fā),對該省公路交通事故進行聚類分析研究,以期該省獲得該省高速公路交通事故基于四項指標的時間、空間分布規(guī)律。 2
6、、高速公路交通事故預測是高速公路安全評價、規(guī)劃及決策的基礎,國內(nèi)外關于道路交通事故的預測有多種方法,鑒于高速公路交通事故具有復雜性、隨機性和灰色性的基本特征,對高速公路公路交通事故預測時選用時間序列分析,灰色分析、神經(jīng)網(wǎng)絡等分析方法。根據(jù)高速公路交通事故的分布規(guī)律,構(gòu)建高速公路交通事故發(fā)生次數(shù)、死亡人數(shù)、受傷人數(shù)、直接經(jīng)濟損失的預測模型。以A省公路交通事故的歷史統(tǒng)計數(shù)據(jù)為基礎,就模型精度等級的劃分和預測的準確性作進一步的分析,探討建立組合模型或提高預測準確性的其它解決方案,最后對A省公路交通事故未來五年的發(fā)展趨勢做出科學預測,為高速公路交通安全管理部門提前預防和控制交通事故提供決策依據(jù)。二問題
7、的分析2.1(問題一) 本小問主要解決對該省公路交通事故四項指標進行的聚類分析。此小問屬于統(tǒng)計問題,因此由的相關數(shù)據(jù)信息,我們首先將中高速公路事故24時分布、月統(tǒng)計、轄區(qū)統(tǒng)計進行整理,得出四項指標在六年中小時段、月份、轄區(qū)分布總量。本問題主要解決該省高速公路交通事故基于四項指標的時間、空間分布規(guī)律。本問題為聚類分析的思想,由題目可以知道對于A省高速公路交通事故分布規(guī)律需要分別對四項指標進行聚類分析,找出各個指標內(nèi)的能夠度量不同小時段、不同月份、不同轄區(qū)之間的相似度的統(tǒng)計量。并將其聚合到不同類中。因此,用SPSS的K-means Cluster過程即逐步聚類法,按照預定的分類數(shù)量,按照既定的原則
8、選擇凝聚點,得到一個初始分類方案,并計算出各個初始分類的中心位置(均值);最后,使用計算出的中心位置重新進行聚類,因此在該方法中,各指標的分類情況會在運算中不斷改變,分類完畢后再次計算各類的中心位置。如此反復循環(huán),直到凝聚點位置改變很小為止。2.2 (問題二) 由對題目的第二問分析,可知第二問分為兩小問。 第一小問:選用灰色分析、多元線性回歸分析等分析方法構(gòu)建高速公路交通事故受傷人數(shù)預測模型。交通事故作為一個隨機事件,其本身具有相當大的偶然性和模糊性;具有明顯的不確定性特征。因此可以認為一個地區(qū)的道路交通安全系統(tǒng)是一個灰色系統(tǒng),可以應用灰色系統(tǒng)的理論進行研究。用G(1,1)灰色建立受傷人數(shù)指標
9、的預測模型,在GM(1,1)模型及相關模型灰色預測過程中要大量進行數(shù)列和矩陣運算將MATLAB軟件和GM(1,1)結(jié)合,實現(xiàn)灰色預測算法;建立多元線性回歸模型。 第二小問:本小問為優(yōu)化問題,就模型精度等級的劃分和預測的準確性作進一步的分析,探討建立組合模型或提高預測準確性的其它解決方案,最后對A省公路交通事故未來五年的發(fā)展趨勢做出科學預測。對四項指標分別用灰色分析和多元線性回歸模型結(jié)果進行精確度比較,并且構(gòu)建最優(yōu)組合預測模型。利用以上兩種不同的單項預測法對受傷人數(shù)指標進行預測,然后對各個單獨的預測結(jié)果做適當?shù)募訖嗥骄?,最后取其加權平均值作為最終的預測結(jié)果。本文采用簡單實用的求方差極小值法,獲得
10、組合預測模型。三模型假設與符號系統(tǒng)3.1模型假設(1)假設在受傷人數(shù)統(tǒng)計時,以傷殘等級三級以上歸為受傷。(2)假設在財產(chǎn)損失統(tǒng)計時,所損失的物資、費用等均按現(xiàn)社會流通價值或社會人力服務成本的平均值進行統(tǒng)計。(3)根據(jù)其同一指標中的個體有較大的相似性,不同類中的個體差異較大,用聚類方法聚合時,將其聚合在3類中。(4)假設高速路上行駛的車輛狀況、駕駛員心理狀態(tài)良好。3.2符號系統(tǒng)Xij表示第i個指標在第j年的給定值;實際給定的第k年的死亡人數(shù):其中k=1,2,6;的一次累加生成序列;為的緊鄰均值生成序列待定參數(shù)列;B為數(shù)據(jù)矩陣,為待估參數(shù);Y為數(shù)據(jù)向量;為待定參數(shù)列;為生成殘差;為殘值均值;為原始
11、數(shù)據(jù)的方差;為殘值的方差;為后驗差比值;為小誤差概率;為組合模型使用;為多元線性回歸預測值;為灰色理論預測值;為多元線性回歸預測的預測誤差;為灰色理論預測的預測誤差;多元線性回歸的相應權系數(shù);灰色理論模型的相應權系數(shù); MSPE為均方百分比誤差;四模型的建立及求解4.1 問題一4.1.1建立模型聚類分析法是根據(jù)實物本身的特性來定量研究分析問題的一種統(tǒng)計分析方法。其基本思想是同一類中的個體有較大的相似性,不同類中的個體差異較大,于是更具一批樣品的多個觀測指標,找出能夠度量樣品(或變量)之間相似度的統(tǒng)計量,并以此為依據(jù),采用聚類發(fā)將所有的樣品(或變量)分別聚合到不同的類中。將分析評價中的n個待評樣
12、本作為聚類對象(Xi)(i=1,2,n);m個;評價指標作為聚類指標(Uj)(j=1,2,m),s個評價標準作為評價等級(Zk)(k=1,2,s).則根據(jù)第i個聚類獨享對于第j個聚類指標的樣本值Xij,確定聚類樣本矩陣為X :以一年十二個月的數(shù)據(jù)分析為例:在對給定的原始收據(jù)通過Excel整理的基礎上我們建立了針對交通事故每月的聚類分析模型。將分析評價中的12個待評樣本作為聚類對象(Xi)(i=1,2,12);4個;評價指標作為聚類指標(Uj)(j=1,2,3,4),我們設定為三類分類標準,則聚類樣本矩陣為:4.1.2模型的求解及結(jié)果在建立了聚類分析的模型的基礎上,我們采用了SPSS軟件來對模型
13、進行求解,SPSS的優(yōu)點是計算量較小,從而可以有效的處理多變量、大樣本數(shù)據(jù)而不會占用過多的內(nèi)存空間和計算時間;同時在分析時用戶可以人為地制定初始中心位置,或者將曾做過的聚類分析結(jié)果作為初始位置引入分析。通過計算得得出下面的實驗數(shù)據(jù)結(jié)果:表4.1初始聚類中心聚類123次數(shù)45.0045.0036.00死亡人數(shù)26.0035.0027.00受傷人數(shù)41.0050.0036.00經(jīng)濟損失1012394.001263204.00738204.00表4.2最終聚類結(jié)果案例號月份聚類距離1一月12867.6002二月1114864.4293三月3180.0684四月23051.5075五月137387.5
14、726六月171712.4297七月23051.5078八月169137.5729九月137496.43010十月1114680.57211十一月314556.00112十二月314736.001表4.4每個聚類中的案例數(shù)聚類17.00022.00033.000有效12.000缺失.0004.1.3實驗結(jié)果的分析說明(1)表2.2顯示的是將樣品分為三類的聚類結(jié)果,這三類分別是:一月、四月、十一月。(2)表2.3表示的是最終的聚類分析結(jié)果。(3)表2.4反映了聚類分析中的有效樣品數(shù)為12個,沒有樣品數(shù)的缺失。綜上得出聚類分析的結(jié)論(三月、十一月、十二月)為交通事故最輕的,(一月、二月、五月、八月
15、、九月、十月)為交通事故一般的,(四月、七月)為交通事故最為嚴重的。同理我們得出了一天中二十四小時以及每個轄區(qū)的數(shù)據(jù)分析結(jié)果如下表所示:表4.5以轄區(qū)為單位的數(shù)據(jù)結(jié)果分析案例號轄區(qū)聚類距離1轄區(qū)3128890.4692轄區(qū)2344284.5053轄區(qū)396888.4624轄區(qū)3214476.5405轄區(qū)339959.5396轄區(qū)3201362.5397轄區(qū)3234361.5408轄區(qū)2150913.5029轄區(qū)3258343.46610轄區(qū)3233859.54011轄區(qū)3112157.46212轄區(qū)2100373.50813轄區(qū)3149838.46214轄區(qū)3286803.46215轄區(qū)366
16、440.46216轄區(qū)3175342.54017轄區(qū)292997.50418轄區(qū)1.000表4.6最終聚類中心聚類123次數(shù)137.0048.2516.31死亡人數(shù)110.0027.2511.62受傷人數(shù)176.0046.5018.38經(jīng)濟損失4721128.001015373.50238676.54得出分析結(jié)果:(1)表2.6顯示將分類對象區(qū)域分為三個等級。(2)表2.5(一區(qū)、三區(qū)、四區(qū)、五區(qū)、六區(qū)、七區(qū)、九區(qū)、十區(qū)、十一區(qū)、十三區(qū)、十四區(qū)、十五區(qū)、十六區(qū))為所轄區(qū)范圍內(nèi)交通事故最輕的、(二區(qū)、八區(qū)、十二區(qū)、十七去)為轄區(qū)范圍內(nèi)交通事故一般的區(qū)域、(十八區(qū))是轄區(qū)范圍內(nèi)交通事故最為嚴重的。
17、(3)表2.5顯示有效數(shù)據(jù)位十八個,沒有數(shù)據(jù)缺失。表4.7以小時為單位的最終聚類結(jié)果案例號小時聚類距離10-1時141531.12521-2時152677.12632-3時155879.87643-4時181456.12554-5時247286.00065-6時247286.00076-7時162299.87587-8時157623.12598-9時374947.072109-10時1102944.8761110-11時3101939.0731211-12時322358.9291312-13時34205.0741413-14時389233.9291514-15時312656.0731615-1
18、6時398614.0721716-17時325122.9291817-18時371976.9291918-19時377094.9292019-20時3103017.9292120-21時354255.9292221-22時3114598.0722322-23時336102.0722423-24時112162.875表4.8 以小時為聚類對象的最終聚類中心聚類123事故次數(shù)26.5033.0018.93死亡人數(shù)20.6323.5011.29受傷人數(shù)28.5031.0022.14經(jīng)濟損失661234.88892427.00343619.93分析可得,在對以小時為聚類對象的分析中:表2.8顯示以小時
19、為分類對象劃分為三個等級。表2.7顯示在(08:00-09:00、10:00-23:00、)為交通事故發(fā)生最輕的小時段(04:00-06:00)為交通事故發(fā)生程度最為嚴重的小時段;(00:00-04:00、06:00-08:00、09:00-10:00、23:00-24:00)為交通事故發(fā)生程度一般的小時段。4.2 問題二4.2.1建立GM(1,1)模型 交通事故作為一個隨機事件,其本身具有相當大的偶然性和模糊性;如果把某地區(qū)的道路交通作為一個系統(tǒng)來看,則此系統(tǒng)中存在著一些確定因素(灰色系統(tǒng)稱為白色信息),如道路狀況、信號標志等;同時也存在一些不確定因素(灰色系統(tǒng)稱為灰色信息),如車輛狀況、氣
20、候因素、駕駛員心理狀態(tài)等等,具有明顯的不確定性特征。因此可以認為一個地區(qū)的道路交通安全系統(tǒng)是一個灰色系統(tǒng),可以應用灰色系統(tǒng)的理論進行研究。高速公路交通事故灰色預測的特點分析 高速公路交通事故灰色預測的原理、方法及所具有的特點表現(xiàn)在:(1)灰色預測方法認為,某一地區(qū)在某一時間區(qū)間內(nèi)的交通事故指標值,是在一定范圍內(nèi)變化的且與時間坐標有關的灰色量。該方法將原始數(shù)據(jù)整理成較有規(guī)律的生成數(shù)列后再進行研究、處理,避免了概率統(tǒng)計方法的大樣本、大工作量而其結(jié)果不理想的狀況。(2)數(shù)學模型GM(1,1)是一階單變量微分方程;這與以往的概率統(tǒng)計方法利用高散數(shù)據(jù)所建立的按時間作逐段分析、遞推、高散的模型有本質(zhì)的區(qū)別
21、。 (3)GM(1,1)灰色預測模型不是交通事故原始數(shù)學模型,而是生成數(shù)據(jù)序列模型;通過對生成數(shù)列的處理,使雜亂無章的原始數(shù)據(jù)呈現(xiàn)出一定的規(guī)律性。 MATLAB的基本數(shù)據(jù)單位是矩陣,其核心也是矩陣,它可直接進行矩陣的乘積、矩陣的乘方、矩陣的除法、稀疏矩陣等運掣”。在MATLAB語言系統(tǒng)中,幾乎所有的操作都是以矩陣操作為基礎,用戶可以用類似于數(shù)學公式的方法編寫程序?qū)崿F(xiàn)算法,大大降低了編程所需的難度并節(jié)省了時間。而在GM(1,1)模型及相關模型的灰色預測過程中,要大量進行數(shù)列和矩陣運算嘲,這晗好使MATLAB派上了用場。將MATLAB和GM(1,1)模型結(jié)合,實現(xiàn)灰色預測算法,恰到好處。灰色預測模
22、型GM(1,1)的建立過程GM(1,1)的一般形式設有變量X(0)X(0)(i),i=1,2,.,n (1)為某一預測對象的非負單調(diào)原始數(shù)據(jù)列,為建立灰色預測模型:首先對X(0)進行一次累加(1AGO, Acumulated Generating Operator)生成一次累加序列: X(1)X(1)(k),k1,2,n (2)其中 X(1)(k)X(0)(i) (k=1,2,3n)%作1AGO生成序列 For i=1:nX1(i)=sum(x0(1:i);End對X(1)可建立下述白化形式的微分方程:十u ,式中a,u是待定系數(shù)。 (3)灰微分方程動態(tài)模型為: (4)式中為的緊鄰均生成,即%
23、緊鄰均生成For k=2:n %緊鄰均生成zz(k)=0.5*x1(k)+0.5*x1(k-1);end(2)構(gòu)造矩陣B和數(shù)據(jù)向量和滿足關系,其中:B=Yn(X(0)(2), X(0)(3), X(0)()T(3)計算系數(shù)a和u (5)可用(5)式表示,由此計算出系數(shù)a和u for i=1:n-1 b(i,1)=-z(i+1); y(i)=x0(i+1);end b(:,2)=1; y=y; %轉(zhuǎn)置為列向量 au=by; %作矩陣除法,計算a u(4) 累加模型預測結(jié)果(1)(k)(X(0)(1) (6)%計算GM(1,1)模型(1)(k)值Yc1(1)=x0(1);For k=1:nC=x0
24、(1)-au(2)/au(1);Yc1(k+1)=c*exp(-au(1)*k)+au(2)/au(1);End(5)還原后的預測結(jié)果(作IAGO) (7)%計算值,顯示預測結(jié)果Yc0(1)=x0(1);For k=1:nYc0(k+1)=yc1(k+1)-yc1(k);EndDisp(uint16(yc0(2:1:n+1);2、檢驗和判斷GM(1,1)模型的精度為確保所建灰色模型有較高的精度能應用于預測實際,按灰色理論一般采用三種方法檢驗判斷GM(1,1)模型的精度,它們是,殘差大小檢驗;關聯(lián)度檢驗和后驗差檢驗。通常關聯(lián)度要大于0.6,殘差P、方差c越小,模型精度P越好。(1) 殘差檢驗殘差
25、檢驗:e(k)=相對誤差:(2)關聯(lián)度檢驗因分辨系數(shù)毛是在(0,1)中取定的實數(shù),一般取=0.5。關聯(lián)度是各關聯(lián)系數(shù)(k)累加后在n維空間的平均值。當分辨系數(shù)§=0.5,認為關聯(lián)度大于0.6時可以接受,即通過關聯(lián)度檢驗,否則關聯(lián)程度差些。計算關聯(lián)度Max1=max(abs(e0);r=1;for k=2:nr=r+0.5*max1/(abs(e0(k)+0.5*max1);endr=r/n; % r表示關聯(lián)度(2) 方差比和小誤差概率檢驗 方差和小誤差概率檢驗屬后驗差檢驗,計算公式分別如下:預測誤差均值 原始數(shù)據(jù)均值 原始數(shù)據(jù)標準差:預測數(shù)據(jù)標準差 方差比:小誤差概率: 表4.9 P
26、、C預測精度表精度等級一二三四P>0.95>0.8>0.70.7C<0.35<0.45<0.650.65由P和C的值檢驗GM(1,1)模型的預測精度,以提供決策依據(jù)。精度等級越小越好,精度一致,表示預測具有較高的精度,四級為不通過。模型精度等級由表1所示。%方差和小誤差概率檢驗If p>0.95&c<0.35Disp( 預測精度好);Else if p>0.8&<0.5Disp( 預測合格);Else if p>0.7&<0.65Disp( 預測勉強合格); elseDisp( 預測不合格);End
27、EndEnd4.2.2 用MATLAB求解模型根據(jù)題目給定四項指標要求,我們選擇采用灰色預測模型來預測交通事故受傷人數(shù),其中交通事故死亡人數(shù)在2006年到2011年的數(shù)據(jù)如下表2所示:4.10 為2006年到2011年交事故受傷人數(shù)年份200620072008200920102011死亡人數(shù)7386956605635044312006-2011年的A省高速道路事故受傷人數(shù)的原始序列為:由此可得生成數(shù)列為:其數(shù)據(jù)矩陣B為:在MATLAB中計算可得:數(shù)據(jù)向量為:可得待定參數(shù)列為: 則預測模型為:最后需要進行還原處理,作“生成數(shù)列”的逆運算,即進行還原處理得到交通事故受傷人數(shù)的預測模型。因為 所以
28、利用MATLAB軟件得出和的取值:表4.11 GM(1,1)預測模型計算一覽表年份200620072008200920102011k123457381450.72083.82642.63145.83589.6即預測序列712.12633.11562.4499.58443.78原始值738695660563504431預測值年份20122013201420152016k6789103983.8433446254921.45166.8即預測序列394.21350.18311.07276.32245.46原始值預測值436.701387.319433.523304.675270.244MATLAB軟
29、件的出預測分析圖,如下表所示:圖4.1 MATLAB 預測分析圖殘差檢驗和后驗差檢驗,其結(jié)果為: 方差比 C=0.435<0.45 合格 小誤差概率 P=1>0.95 好 上述結(jié)果說明建立的灰色預測模型通過檢驗,且模型的精度為I 級,精度好。(參照表1)4.2.3 建立模型多元線性回歸模型可以用于預測對象Y受多個因素影響的情況。P元線性回歸模型: 用最小二乘估計法求未知參數(shù)的最小二乘估計。記 令 整理的正規(guī)方程組(3):(3)其解記為,即為的最小二乘估計。從而P元線性回歸方程(4):4.2.4 建立優(yōu)化模型基于以上兩種預測模型建立優(yōu)化組合模型組合預測就是利用以上兩種不同的單項預測法
30、對同一預測對象進行預測,然后對各個單獨的預測結(jié)果做適當?shù)募訖嗥骄?,最后取其加權平均值作為最終的預測結(jié)果。目前關于權系數(shù)的計算方法很多,主要分為主觀賦值法、客觀賦值法、試算比較法,客觀賦值法就是根據(jù)一定的理論或標準通過代數(shù)計算等確定權值,例如誤差絕對值之加權和最小法、誤差平方和最小法、方差極小值法等,本文采用求方差極小值法,該方法簡單實用,掌握起來也不難。設是灰色GM(1,1)的預測值,是多元回歸預測值,是最優(yōu)組合預測值,預測誤差分別為,取 和是相應權系數(shù),且,有則誤差及方差D分別為關于對求極小值,可得顯然可取,記 , ,則組合模型的權系數(shù)分別為:,由此我們可得最優(yōu)組合預測模型。4.2.5最優(yōu)組
31、合模型的求解二元回歸模型的自變量取, 分別為序號和交通事故次數(shù),通過計算,它的預測模型為GM(1.1)模型中的辨識算式,。預測結(jié)果如表4.12表4.12兩種預測模型的受傷人數(shù)預測結(jié)果兩種預測模型的受傷人數(shù)預測結(jié)果 單位:人年份實際受傷人數(shù)GM(1,1)灰色預測誤差(%)二元回歸模型預測誤差(%)20067387380729.28-1.220%2007695712.722.463%686.33-1.247%2008660633.11-4.074%673.252.007%2009563562.400.106%583.293.603%2010504499.58-0.877%511.421.389%2
32、011431443.782.965%416.92-3.267%根據(jù)最優(yōu)組合方法計算:灰色模型的權重系數(shù): 二元線性回歸模型權重系數(shù):所以組合預測模型為式:得組合模型的預測結(jié)果,與其他兩種預測模型結(jié)果做比較三種預測模型的預測結(jié)果 單位:人年份實際受傷人數(shù)GM(1,1)灰色預測誤差(%)二元回歸模型預測誤差(%)組合模型預測誤差(%)20067387380729.28-1.220%735.32-0.363%2007695712.722.463%686.33-1.247%704.641.387%2008660633.11-4.074%673.252.007%645.402.212%200956356
33、2.400.106%583.293.603%568.801.030%2010504499.58-0.877%511.421.389%503.210.157%2011431443.782.965%416.92-3.267%435.561.058%我們采用如下的均方百分比誤差來檢驗組合模型:其中:MSPE是均方百分比誤差,是實際值,是預測值。通過計算可得:二元回歸模型預測的均方百分比誤差為1.14290%,GM(1,1)灰色模型的均方百分比誤差為1.13552%,組合預測的均方百分比誤差為0. 60509%。根據(jù)組合模型可預測出2012-2016年某高速公路因交通事故的受傷人數(shù)。如下表:2012-
34、2016年某高速公路因交通事故的受傷人數(shù)年份20122013201420152016組合預測值391351310276244五模型的評價優(yōu)點:(1) 聚類分析K-means模型對給定的信息的篩選、加工、延伸和擴展,從而將評價對象確定在某一范圍內(nèi),通過了該方法,最終得到了各類評價等級方法,為科學預測交通事故提供了依據(jù)。(2) 聚類分析K-means模型與SPSS統(tǒng)計軟件結(jié)合簡單方便且實用。(3)從前面對組合模型的百分比誤差分析中可以看出:二元線性回歸模型預測的預測精度相對比較低,模型預測精度相對較好,組合預測模型的預測精度大于任一單項預測模型,它避免了單項預測模型的片面性,綜合利用各種預測提供的
35、信息,具有更好的預測效果。 (4)建立了二元回歸預測與灰色預測組合的預測模型,研究了其在交通事故四項指標中受傷人數(shù)預測的應用,并得出了好的結(jié)論,為交通事故四項指標的預測提供了一種新的,可靠的方法。(5)對于灰信息處理技術與多元線性回歸模型融合得到有機組合體。實現(xiàn)功能互補,能夠使預測數(shù)據(jù)精度大大提高。用灰色系統(tǒng)理論的思想、方法對原始數(shù)據(jù)進行處理,很大程度上改善了統(tǒng)計模型性能。與多元線性規(guī)劃模型進行組合,深化對系統(tǒng)演化規(guī)律的認識。缺點:(1)聚類分析K-means模型的算法中 K 是事先給定的,這個 K 值的選定是非常難以估計的。(2)從 K-means 算法框架可以看出,該算法需要不斷地進行樣本
36、分類調(diào)整,不斷地計算調(diào)整后的新的聚類中心,因此當數(shù)據(jù)量非常大時,需要與SPSS等統(tǒng)計軟件作輔助工作。(3)組合模型計算量相對于單項預測模型較大。參考文獻1鄧聚龍.灰色系統(tǒng)基本方法M.:華中理工大學出版社,19962李云貴等.灰色GM(1,1)預測模型的改進J.系統(tǒng)工程,1992(6):42433何能,鮑一丹.灰色馬爾可夫預測模型及其應用J系統(tǒng)工程理論及實踐,1992(4):22244肖新平等灰色系統(tǒng)分析理論及其應用M:大連海事大學出版社,19975吳維揚.經(jīng)濟預測及案例分析M:中國經(jīng)濟出版社,19956莊楚強,吳亞森.應用數(shù)理統(tǒng)計基礎(第二版)M.: 華南理工大學出版社, 2003, 12.7
37、馬驥, 張衛(wèi)峰.組合預測方法在磷肥需求預測中的應用J.統(tǒng)計與決策, 2005, (6):8 周愛民.基于偏最小二乘法的情報組合預測法J.統(tǒng)計與決策,2004, 176(8):9 江西省統(tǒng)計局編.江西統(tǒng)計年鑒2005M.: 中國統(tǒng)計出版社,2005.10 楊明媚,李華林.主成分分析在證券組合投資中的應用J.統(tǒng)計與信息論壇, 2004,11姚祖康.道路與交通工程系統(tǒng)分析.:人民交通出版社,199612鄧聚龍.灰色控制系統(tǒng).:華中工學院出版社,198513Bates,J.M.and Granger,C.W.J.combination of Forecast, Operations Research
38、Quarterly,20(4),1969,451-46814國家統(tǒng)計局編.中國統(tǒng)計年鑒.:中國統(tǒng)計出版社,200415牛東曉,陳志業(yè),謝宏.組合灰色神經(jīng)網(wǎng)絡模型及其季節(jié)性負荷預測.華北電力大學學報,2000,27(4):1-616王應明,傅國偉.基于不同誤差準則和范數(shù)的組合預測方法研究J.控制決策, 1994附錄附表一:原始數(shù)據(jù)的處理月份的原始數(shù)據(jù):月份次數(shù)死亡人數(shù)受傷人數(shù)經(jīng)濟損失一月4526411012394二月4127511130126三月402243752580四月4535501263204五月463057977874六月4932601086974七月5536581257101八月533
39、761946124九月5140551052758十月412643900581十一月362736738204十二月413146767496年份的原始數(shù)據(jù)處理:轄區(qū)次數(shù)死亡人數(shù)受傷人數(shù)經(jīng)濟損失轄區(qū)一352158367567轄區(qū)二7655901359658轄區(qū)三171321335565轄區(qū)四11124200轄區(qū)區(qū)六810837314轄區(qū)七0004315轄區(qū)八272839864460轄區(qū)九443054497020轄區(qū)十2214817轄區(qū)十一91111350834轄區(qū)十二66518915000轄區(qū)十三252327388515轄區(qū)十四371823525480轄區(qū)十五1311153
40、05117轄區(qū)十六43563334轄區(qū)十七242139922376轄區(qū)十八1371101764721128小時的原始數(shù)據(jù)處理:小時次數(shù)死亡人數(shù)受傷人數(shù)經(jīng)濟損失0-1時25 22 307027661-2時 31 27 307139122-3時2418216053553-4時3125347426914-5時3426328451415-6時3221309397136-7時2618265989357-8時2720317188588-9時2313264185679-10時21123055829010-11時26183544555911-12時1782432126112-13時1792634782513-
41、14時1481625438614-15時21122735627615-16時24133044223416-17時22112431849717-18時19112927164318-19時1691626652519-20時16111424060220-21時1591628936421-22時16111245821822-23時19151537972223-24時272326649072每一年的數(shù)據(jù)處理:項目次數(shù)死亡人數(shù)受傷人數(shù)財產(chǎn)損失數(shù)量數(shù)量數(shù)量數(shù)量200680038973815359332200766538069515005740200861141566013023448200941738356
42、387318452010382333504984236120113773074319349774附表二:利用SPSS進行數(shù)據(jù)的處理:利用SPSS對月份的數(shù)據(jù)處理:月份處理數(shù)據(jù)導出:QUICK CLUSTER 次數(shù)死亡人數(shù)受傷人數(shù)經(jīng)濟損失 /MISSING=LISTWISE /CRITERIA=CLUSTER(3) MXITER(10) CONVERGE(0) /METHOD=KMEANS(NOUPDATE) /PRINT ID(月份) INITIAL ANOVA CLUSTER DISTAN.快速聚類附注創(chuàng)建的輸出07-5月-2012 10時03分18秒注釋輸入活動的數(shù)據(jù)集數(shù)據(jù)集0過濾器<
43、;none>權重<none>拆分文件<none>工作數(shù)據(jù)文件中的 N 行12缺失值處理對缺失的定義用戶定義的缺失值將作為缺失處理。使用的案例統(tǒng)計量將基于案例進行計算,在這些案例中,所有用到的聚類變量都沒有缺失值。語法QUICK CLUSTER 次數(shù)死亡人數(shù)受傷人數(shù)經(jīng)濟損失 /MISSING=LISTWISE /CRITERIA=CLUSTER(3) MXITER(10) CONVERGE(0) /METHOD=KMEANS(NOUPDATE) /PRINT ID(月份) INITIAL ANOVA CLUSTER DISTAN.資源處理器時間00 00:00:00
44、.249已用時間00 00:00:00.858所需的工作空間928 字節(jié) 數(shù)據(jù)集0 初始聚類中心聚類123次數(shù)45.0045.0036.00死亡人數(shù)26.0035.0027.00受傷人數(shù)41.0050.0036.00經(jīng)濟損失1012394.001263204.00738204.00迭代歷史記錄a迭代聚類中心內(nèi)的更改12312867.6003051.50714556.0012.000.000.000a. 由于聚類中心內(nèi)沒有改動或改動較小而達到收斂。任何中心的最大絕對坐標更改為 .000。當前迭代為 2。初始中心間的最小距離為 250810.000。聚類成員案例號月份聚類距離1一" 12
45、867.6002二" 1114864.4293三" 3180.0684四" 23051.5075五" 137387.5726六" 171712.4297七" 23051.5078八" 169137.5729九" 137496.43010十" 1114680.57211十一314556.00112十二314736.001最終聚類中心聚類123次數(shù)46.5750.0039.00死亡人數(shù)31.1435.5026.67受傷人數(shù)52.5754.0041.67經(jīng)濟損失1015261.571260152.5075276
46、0.00最終聚類中心間的距離聚類1231244890.929262501.5722244890.929507392.5003262501.572507392.500ANOVA聚類誤差FSig.均方df均方df次數(shù)87.268221.74694.013.057死亡人數(shù)48.113225.11491.916.203受傷人數(shù)143.268251.59892.777.115經(jīng)濟損失1.596E1124.392E9936.348.000F 檢驗應僅用于描述性目的,因為選中的聚類將被用來最大化不同聚類中的案例間的差別。觀測到的顯著性水平并未據(jù)此進行更正,因此無法將其解釋為是對聚類均值相等這一假設的檢驗。每
47、個聚類中的案例數(shù)聚類17.00022.00033.000有效12.000缺失.000利用SPAA對轄區(qū)進行數(shù)據(jù)處理:轄區(qū)分析數(shù)據(jù)導出:QUICK CLUSTER 次數(shù)死亡人數(shù)受傷人數(shù)經(jīng)濟損失 /MISSING=LISTWISE /CRITERIA=CLUSTER(3) MXITER(10) CONVERGE(0) /METHOD=KMEANS(NOUPDATE) /PRINT ID(轄區(qū)) INITIAL ANOVA CLUSTER DISTAN.快速聚類附注創(chuàng)建的輸出07-5月-2012 10時17分58秒注釋輸入活動的數(shù)據(jù)集數(shù)據(jù)集0過濾器<none>權重<none>
48、拆分文件<none>工作數(shù)據(jù)文件中的 N 行18缺失值處理對缺失的定義用戶定義的缺失值將作為缺失處理。使用的案例統(tǒng)計量將基于案例進行計算,在這些案例中,所有用到的聚類變量都沒有缺失值。語法QUICK CLUSTER 次數(shù)死亡人數(shù)受傷人數(shù)經(jīng)濟損失 /MISSING=LISTWISE /CRITERIA=CLUSTER(3) MXITER(10) CONVERGE(0) /METHOD=KMEANS(NOUPDATE) /PRINT ID(轄區(qū)) INITIAL ANOVA CLUSTER DISTAN.資源處理器時間00 00:00:00.312已用時間00 00:00:00.312所需的工作空間928
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 財務會計學財務報表分析知識考點
- 酒店與旅游服務合作協(xié)議
- ××超市經(jīng)理崗位辦法
- 表達對家鄉(xiāng)的思念之情的抒情作文10篇
- 我的家鄉(xiāng)美景寫真實感人作文4篇
- 農(nóng)村畜牧養(yǎng)殖防疫保障協(xié)議
- 2025年石英纖維及制品項目提案報告
- 社團組織參與及職務證明(8篇)
- 2025年小學教師資格考試《綜合素質(zhì)》教育資源整合與教育研究試題試卷
- 分析當前酒店業(yè)面臨的環(huán)保挑戰(zhàn)
- 2024年度小紅書商業(yè)MCN機構(gòu)經(jīng)營洞察報告
- 寵物醫(yī)院服務行業(yè)可行性分析報告
- 輸液港的輸液與維護
- 中國嬰幼兒 科學配餐與食品制作指導手冊
- 口腔科護理人文關懷
- 高等教育信息化建設方案
- 人工神經(jīng)網(wǎng)絡理論及應用課件第6章-反饋神經(jīng)網(wǎng)絡
- DB13-T 5927-2024 地熱資源開發(fā)監(jiān)測技術規(guī)范
- 《化工單元操作》教案
- 消毒規(guī)范課件教學課件
- 生態(tài)養(yǎng)殖羊圈施工合同
評論
0/150
提交評論