交通事故大數(shù)據(jù)挖掘_第1頁(yè)
交通事故大數(shù)據(jù)挖掘_第2頁(yè)
交通事故大數(shù)據(jù)挖掘_第3頁(yè)
交通事故大數(shù)據(jù)挖掘_第4頁(yè)
交通事故大數(shù)據(jù)挖掘_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 國(guó)外交通事故大數(shù)據(jù)挖掘分析摘要:近年來(lái),隨著車(chē)速的提高及交通量的增長(zhǎng),道路交通事故每年呈上升趨勢(shì)。通過(guò)對(duì)交通事故大數(shù)據(jù)挖掘分析,k-means聚類(lèi)分析和Apriori關(guān)聯(lián)規(guī)則分析交通事故的趨勢(shì)和模式,找出事故頻發(fā)的路段和引發(fā)事故的原因以及事故頻發(fā)的高峰期,以數(shù)據(jù)分析結(jié)果為依據(jù),改善交通狀況,減少交通事故,提高交通系統(tǒng)的效率。關(guān)鍵詞:交通系統(tǒng)、k-means聚類(lèi)、Apriori算法Abstract:recent years,as the improvement of speed of vehicle and growth of traffic volume,road traffic accid

2、ents is on the rise every year.based on data mining and analysis of traffic accidents big data,K-means cluster analysis and Apriori association rules analysis traffic accident tendency and pattern.find out frequent accident sections and the cause of accident and peak hours,base on data analysis resu

3、lt,improve the traffic situation,reduce tarffic accident,improve the efficiency of traffic system.Key words:transportation system、k-means cluster、Apriori algorithm一、引言1 隨著我國(guó)經(jīng)濟(jì)的發(fā)展,交通安全問(wèn)題日益突出,已經(jīng)引起了人們的廣泛關(guān)注。如何對(duì)大量的交通事故信息進(jìn)行數(shù)據(jù)挖掘,尋找出其中隱藏的知識(shí)與規(guī)律,用以改善交通安全狀況已成為數(shù)據(jù)挖掘的一個(gè)重要的研究領(lǐng)域。2 國(guó)內(nèi)外現(xiàn)狀 智能交通系統(tǒng)國(guó)內(nèi)外研究現(xiàn)狀隨著智能交通的發(fā)展,美國(guó)正在研

4、究和部署車(chē)輛避碰、司機(jī)與車(chē)輛監(jiān)控、與乘坐者安全性能改善等工作。歐洲正在開(kāi)展為優(yōu)化人機(jī)界面和道路安全的遠(yuǎn)程信理“智能道路”的研究和示范。澳大利亞也正在用智能交通系統(tǒng)新技術(shù)改善道路安全。日本投入了大量的人力和資金,成功地組織了一個(gè)“動(dòng)態(tài)路徑誘導(dǎo)系統(tǒng)”的實(shí)驗(yàn),日本相繼完成了路車(chē)間通信系統(tǒng)、交通信息通信系統(tǒng)、寬區(qū)域旅行信息系統(tǒng)、超智能車(chē)輛系統(tǒng)、安全車(chē)輛系統(tǒng)及新交通管理系統(tǒng)等方面的研究。日本“車(chē)輛、道路與交通智能協(xié)會(huì)”成立,ITS 由導(dǎo)航系統(tǒng)、 自動(dòng)收費(fèi)系統(tǒng)、安全駕駛6 援助系統(tǒng)等9 個(gè)開(kāi)發(fā)領(lǐng)域和20 個(gè)用戶服務(wù)功能構(gòu)成。歐洲的ITS的開(kāi)發(fā)與應(yīng)用是與歐盟的交通運(yùn)輸一體化建設(shè)進(jìn)程緊密聯(lián)系在一起的。智能交通

5、系統(tǒng)的交通管理、車(chē)輛行駛和電子收費(fèi)等都圍繞全歐無(wú)線數(shù)據(jù)通信網(wǎng)來(lái)展開(kāi)。韓國(guó)政府于2001 月制訂了全新的RRS計(jì)劃投入75億美元,建成包括汽車(chē)及高速公路系統(tǒng),先進(jìn)交通管理系統(tǒng),電子收費(fèi)系統(tǒng)個(gè)先進(jìn)的RRS 子系統(tǒng)。新加坡的ITS研發(fā)也具有了較高的水平,其城市高速路監(jiān)控系統(tǒng)(EMAS),優(yōu)化交通信號(hào)系統(tǒng)(GLIDE),出行者信息服務(wù)系統(tǒng)。二、交通事故大數(shù)據(jù)分析流程1 數(shù)據(jù)采集交通事故大數(shù)據(jù)來(lái)源于公共安全部門(mén)和交通部門(mén)下的事故數(shù)據(jù)倉(cāng)庫(kù)CTCDR,CTCDR的目標(biāo)是給負(fù)責(zé)交通安全人員提供及時(shí)、精確、完整、標(biāo)準(zhǔn)的交通事故數(shù)據(jù)。CTCDR允許對(duì)數(shù)據(jù)進(jìn)行復(fù)雜的查詢,屬性包括日期、道路位置、道路類(lèi)型、碰撞類(lèi)型、

6、傷害程度等。通過(guò)用戶自定義交通事故數(shù)據(jù)維度,進(jìn)行更高級(jí)的數(shù)據(jù)分析識(shí)別趨勢(shì)和模式。2 數(shù)據(jù)分析k-means聚類(lèi)分析,Apriori關(guān)聯(lián)規(guī)則分析,關(guān)聯(lián)規(guī)則反映一個(gè)事物與其他事物之間的相互依賴性或相互關(guān)聯(lián)性。事故數(shù)據(jù)的維度包括:日期、事故傷害程度、事故地點(diǎn)和區(qū)域、事故影響因素、事故碰撞類(lèi)型、天氣條件、路面情況、建設(shè)或維護(hù)相關(guān)、光照條件、路攔等;交通個(gè)體數(shù)據(jù)的維度包括:車(chē)輛是否是有資格的發(fā)動(dòng)機(jī)型號(hào)、車(chē)輛類(lèi)型、車(chē)輛制動(dòng)、車(chē)輛機(jī)動(dòng)前綴、車(chē)輛機(jī)動(dòng)后綴、駕駛員或行人的年齡、駕駛員或行人是否喝酒和吸毒、車(chē)輛出毛病的個(gè)數(shù)、首先撞上物體、然后撞上物體。涉及人員數(shù)據(jù)維度包括ID號(hào)、傷害分類(lèi)、座位、年齡、保護(hù)系統(tǒng)的使

7、用、安全氣袋的狀態(tài)、噴射狀態(tài)。道路特性數(shù)據(jù)的維度包括平均日流量、農(nóng)村或城市、通道數(shù)。3 數(shù)據(jù)可視化Tableau進(jìn)行數(shù)據(jù)可視化,生成相應(yīng)的圖表圖形,直觀表示交通事故大數(shù)據(jù)分析結(jié)果。三、關(guān)于研究領(lǐng)域的原理及應(yīng)用介紹(算法原理)(1)K-means算法是一種經(jīng)典的聚類(lèi)算法,其基本思想是:以隨機(jī)選取的K個(gè)樣本作為起始中心點(diǎn),將其余樣本歸入相似度最高中心點(diǎn)所在的簇,再確立當(dāng)前簇中樣本坐標(biāo)的均值為新的中心點(diǎn),依次循環(huán)下去,直到所有樣本類(lèi)別不再變動(dòng),得到K個(gè)交通事故類(lèi),并得到聚類(lèi)算法模型,能夠?qū)⑺薪煌ㄊ鹿蕯?shù)據(jù)劃分到所屬的類(lèi)中,同時(shí)得到m個(gè)交通事故信息的特征對(duì)聚類(lèi)效果的重要性程度。 圖1 K-means聚

8、類(lèi)算法流程(2)Apriori算法是一種挖掘關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集算法,設(shè)置最小支持度和最小置信度,產(chǎn)生頻繁項(xiàng)集,關(guān)聯(lián)分析數(shù)據(jù)源,某個(gè)項(xiàng)目集的支持度大于或等于最小支持度,則該項(xiàng)目集被標(biāo)記為頻繁項(xiàng)集。找出頻繁項(xiàng)集,根據(jù)這些頻繁項(xiàng)集可以得到候選關(guān)聯(lián)規(guī)則,計(jì)算每條候選關(guān)聯(lián)規(guī)則的置信度,篩選出大于最小置信度的關(guān)聯(lián)規(guī)則,這些關(guān)聯(lián)規(guī)則能夠發(fā)現(xiàn)道路交通事故數(shù)據(jù)中各種屬性的關(guān)聯(lián),以及駕駛員、車(chē)輛、道路、天氣、時(shí)間等屬性引起道路交通事故的原因因素與事故結(jié)果之間的規(guī)則,從中得到規(guī)律。 圖2 Apriori算法流程圖本文采用k-means聚類(lèi)算法對(duì)交通事故數(shù)據(jù)進(jìn)行基于屬性聚類(lèi)分析,在屬性聚類(lèi)中,使得在一個(gè)類(lèi)中的事故特性

9、具有很高的相似性,將每個(gè)類(lèi)的事故原因當(dāng)作一個(gè)整體來(lái)看。采用Apriori關(guān)聯(lián)規(guī)則算法找到引起事故的多因素和各自的占比,運(yùn)用多維關(guān)聯(lián)規(guī)則挖掘方法建立Apriori關(guān)聯(lián)規(guī)則挖掘模型,通過(guò)找出可能導(dǎo)致交通事故發(fā)生的頻繁因素組合來(lái)發(fā)現(xiàn)某些事故發(fā)生的規(guī)律,并將這些規(guī)律作為現(xiàn)實(shí)中作出預(yù)防舉措的依據(jù)。四、研究的點(diǎn) 采用數(shù)據(jù)挖掘方法研究交通事故數(shù)據(jù),建立多維關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘模型,旨在通過(guò)數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則算法,將事故因素集和事故結(jié)果集組成事故模式,交通管理部門(mén)就可以通過(guò)對(duì)駕駛員、車(chē)輛、道路、天氣、時(shí)間等因素來(lái)判斷道路交通事故發(fā)生的可能性。k-means算法對(duì)屬性做聚類(lèi)分析,通過(guò)指定時(shí)間范圍,選擇某個(gè)區(qū)域或某條

10、道路來(lái)確定要分析的數(shù)據(jù)對(duì)象,選定需要分析的項(xiàng)目屬性進(jìn)行聚類(lèi)分析,在屬性聚類(lèi)中,利用聚類(lèi)分析對(duì)事故原因進(jìn)行聚類(lèi)和分組,使得在一個(gè)類(lèi)中的事故特性具有很高的相似性,可以將每個(gè)類(lèi)的事故原因當(dāng)作一個(gè)整體。根據(jù)實(shí)際需要,在事故原因聚類(lèi)分析時(shí),要考慮事故原因中各個(gè)屬性的重要程度,進(jìn)行屬性重要度分析。五、結(jié)果分析表明引起交通事故絕大部分都是在沒(méi)有不利天氣條件下發(fā)生的,下雨或下雪對(duì)事故發(fā)生有較大影響。上圖說(shuō)明事故多發(fā)生Daylight和Darklight,事故發(fā)生和光照條件并無(wú)太大關(guān)系。交通事故多發(fā)生路面情況正常即干燥路面,其他情況如路面是濕的、有融雪等等容易引起交通事故。上圖表明引起交通事故的影響因素依次從大

11、到小,分別是跟車(chē)距離太近、未能給出優(yōu)先權(quán)、司機(jī)失控、變換車(chē)道不當(dāng)、違反交通管理、速度過(guò)快、彎道超車(chē)、不安全倒退等等。按路面情況進(jìn)行聚類(lèi),路面情況可分為冰雪、潮濕、平坦等狀況,根據(jù)聚類(lèi)算法得出結(jié)論:平坦路面狀況最多,事故數(shù)也最多,冰雪只在冬季的部分時(shí)間和部分路面才出現(xiàn),發(fā)生事故的比例相對(duì)很大,說(shuō)明冰雪路面易發(fā)生事故。路面積水導(dǎo)致摩擦系數(shù)降低,車(chē)輛容易發(fā)生側(cè)滑而沖出公路,導(dǎo)致交通事故的發(fā)生。六、未來(lái)展望隨著經(jīng)濟(jì)與社會(huì)的發(fā)展,公路交通量與日俱增,其交通堵塞、交通擁擠與交通肇事等現(xiàn)象日益增多。且公路占地多、環(huán)境污染和財(cái)力不足等諸多原因,己不再主要用修建更多公路的辦法來(lái)解決交通問(wèn)題,而是致力于用高科技改

12、造現(xiàn)有公路網(wǎng)的技術(shù)狀況和完善交通管理體系,以提高現(xiàn)有路網(wǎng)的通過(guò)能力,適應(yīng)當(dāng)前和未來(lái)交通量大幅度增長(zhǎng)的社會(huì)需求。智能交通系統(tǒng)應(yīng)用計(jì)算機(jī)系統(tǒng)監(jiān)控交通狀況和系統(tǒng)自身性能,道路上埋設(shè)的感應(yīng)線圈可檢測(cè)車(chē)輛的車(chē)速,車(chē)流量及道路占用情況,并可在一秒鐘內(nèi)實(shí)時(shí)修改數(shù)據(jù),交通信號(hào)可由計(jì)算機(jī)根據(jù)實(shí)際情況進(jìn)行自適應(yīng)調(diào)整或人為干涉,關(guān)鍵路段和重點(diǎn)地區(qū)配有攝像機(jī)實(shí)時(shí)監(jiān)控交通情況。智能交通系統(tǒng)正在研究將城市地區(qū)開(kāi)發(fā)的交通管理技術(shù)和系統(tǒng)功能推廣應(yīng)用,通過(guò)先進(jìn)的電子通信技術(shù)提高行車(chē)的安全性。系統(tǒng)包括為駕駛員和事故受害者提供援助的無(wú)線緊急呼救系統(tǒng),惡劣道路和交通環(huán)境的實(shí)時(shí)警告系統(tǒng)。參考文獻(xiàn): 1 交通事故的深入數(shù)據(jù)分析及其應(yīng)用,李一兵,袁泉,張雷,清華大學(xué)汽車(chē)安全與節(jié)能?chē)?guó)家重點(diǎn)實(shí)驗(yàn)室; 2 智能交通發(fā)展中的大數(shù)據(jù)分析,岳建

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論