




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 D題:用出租車GPS數(shù)據(jù)分析深圳道路交通情況各大城市出租車越來越多的安裝了GPS終端,這些終端能夠每隔1分鐘向出租車管理中心發(fā)送本車的位置、速度和方向等信息,是車輛GPS實(shí)時數(shù)據(jù)。原始數(shù)據(jù)主要保存出租車上裝配的GPS終端所采集的數(shù)據(jù),這些數(shù)據(jù)包括序號,車牌號碼,GPS時間,經(jīng)度,緯度,車輛狀態(tài)(空車、重車),車輛速度,車輛方向(8個方向)等信息。附注網(wǎng)站提供了深圳市出租車GPS數(shù)據(jù),從這些數(shù)據(jù)你是否能夠:1. 根據(jù)出租車載客的起訖點(diǎn),結(jié)合深圳市的交通地圖,恰當(dāng)?shù)膭澐纸煌ㄐ^(qū),并選擇小區(qū)中的某一點(diǎn),用其經(jīng)緯數(shù)值作為該小區(qū)的坐標(biāo)。2. 根據(jù)小區(qū)劃分和出租車GPS數(shù)據(jù),給出載客出租車的OD時空分布
2、。如:某時刻從坐標(biāo)到、的出租車有多少輛。3. 由此,在合理的假設(shè)條件下,能否對人們出行的OD時空分布進(jìn)行推斷?4. 根據(jù)出租車載客后的行駛數(shù)據(jù),篩選出擁堵的路段時段以及擁堵的路口時段。擁堵的標(biāo)準(zhǔn)自己設(shè)定,如某路段在某個時段平均行駛速度小于多少公里/小時(比如,10公里/小時),可認(rèn)為是擁堵。附注:部分有關(guān)資料請上網(wǎng)站,在數(shù)學(xué)建?;A(chǔ)數(shù)據(jù)頁之交通問題基礎(chǔ)數(shù)據(jù)下載:深圳出租車GPS數(shù)據(jù),數(shù)據(jù)文件較大,我們分解成若干個小文件提供。摘要 一個完整的城市交通系統(tǒng)非常龐大、復(fù)雜,這種情況使得數(shù)學(xué)建模交通問題分析求解的困難、復(fù)雜度提高,將完整的城市交通系統(tǒng)按照交通流向、路網(wǎng)布局等特性劃分為若干交通小區(qū),然后
3、對不同的交通小區(qū)進(jìn)行數(shù)學(xué)建模,可以有效地降低這種復(fù)雜性。各大城市出租車越來越多的安裝了GPS終端,這些終端能夠每隔1分鐘向出租車管理中心發(fā)送本車的位置、速度和方向等信息,是車輛GPS實(shí)時數(shù)據(jù)。原始數(shù)據(jù)主要保存出租車上裝配的GPS終端所采集的數(shù)據(jù)目前對于交通小區(qū)的研究主要集中在應(yīng)用層次,本文針對交通出行數(shù)據(jù)的空間分布特征,利用 K-Means 空間聚類算法進(jìn)行交通小區(qū)的自動劃分,為城市交通系統(tǒng)的管理、控制及規(guī)劃提供技術(shù)支持,對交通出行數(shù)據(jù)進(jìn)行優(yōu)化,抽取出租車載客過程中乘客上下車的 GPS 位置坐標(biāo)。基于聚類與交通小區(qū)劃分的相似性,采用 K- Means 聚類法進(jìn)行交通小區(qū)的劃分。首先,通過聚類得
4、到交通出行 OD 矩陣,然后據(jù)此劃分出交通小區(qū)?;?Google Maps API,搭建了軟件平臺。通過試驗(yàn)可以看出,這種動態(tài)劃分方法得到的區(qū)域能夠與現(xiàn)有的交通小區(qū)相吻合。這種高實(shí)時的交通小區(qū)劃分方法將對動態(tài)的 OD 估計有著極大的參考價值。關(guān)鍵詞:GPS;交通小區(qū);K-Means ;空間聚類算法;動態(tài)分析;k 均值聚類;邊界計算一、問題重述各大城市出租車越來越多的安裝了GPS終端,這些終端能夠每隔1分鐘向出租車管理中心發(fā)送本車的位置、速度和方向等信息,是車輛GPS實(shí)時數(shù)據(jù)。原始數(shù)據(jù)主要保存出租車上裝配的GPS終端所采集的數(shù)據(jù)。 問題一,根據(jù)出租車載客的起訖點(diǎn),結(jié)合深圳市的交通地圖,恰當(dāng)?shù)膭?/p>
5、分交通小區(qū),并選擇小區(qū)中的某一點(diǎn),用其經(jīng)緯數(shù)值作為該小區(qū)的坐標(biāo)。問題二, 根據(jù)小區(qū)劃分和出租車GPS數(shù)據(jù),給出載客出租車的OD時空分布。如:某時刻從坐標(biāo)到、的出租車有多少輛。問題三, 由此,在合理的假設(shè)條件下,能否對人們出行的OD時空分布進(jìn)行推斷?問題四, 根據(jù)出租車載客后的行駛數(shù)據(jù),篩選出擁堵的路段時段以及擁堵的路口時段。擁堵的標(biāo)準(zhǔn)自己設(shè)定,如某路段在某個時段平均行駛速度小于多少公里/小時(比如,10公里/小時),可認(rèn)為是擁堵。2、 模型假設(shè) 一般來說,交通小區(qū)的劃分應(yīng)該遵循以下原則:(1) 同質(zhì)性,分區(qū)內(nèi)的經(jīng)濟(jì) 社會等特性盡量一致;(2) 小區(qū)劃分盡量不打破行政區(qū)的劃分,以便可以利用行政區(qū)
6、的統(tǒng)計資料; (3) 分區(qū)數(shù)量適當(dāng),中等城市不超過 50 個,大城市最多不超過100-150 個 數(shù)量太多將加重規(guī)劃的工作量,數(shù)量太少又會降低調(diào)查和分析的精度;(4) 對于已做過 OD調(diào)查的城市,最好維持原已劃分的小區(qū)。三、符號說明1.name車牌號2.time采集時間點(diǎn)(格式:YYYY/MM/DD hh:mm:ss)3.jd 經(jīng)度4.wd 緯度5.status車輛狀態(tài)(0非打表,即:空載;1已打表,即:重載)6.v 車速(單位為:km/h)7.angle行車方向(0東;1東南;2南;3西南;4西;5西北;6北;7東北)四、 問題分析與模型建立4.1對問題的分析和模型建立 4.1.1 交通小區(qū)
7、概念 交通小區(qū)是具有一定交通關(guān)聯(lián)度和相似度的節(jié)點(diǎn)或連線的集合,反映了城市路網(wǎng)交通特征的時空變化特性、交通小區(qū)具有同質(zhì)性、關(guān)聯(lián)性、動態(tài)性、穩(wěn)定性、自組織性等特性。交通小區(qū)的劃分是分析城市交通網(wǎng)絡(luò)的一個很好的方式,因?yàn)榻煌ㄐ^(qū)內(nèi)具有相似的交通特征和較強(qiáng)的交通關(guān)聯(lián)性交通小區(qū)的劃分與該城市的人口 面積 經(jīng)濟(jì)特征 產(chǎn)業(yè)結(jié)構(gòu)等密切相關(guān),并在一定程度上反應(yīng)了一個城市的吸引力 4.1.2 交通小區(qū)劃分概況 國內(nèi)部分城市在不同時期的交通小區(qū)的平均面積可以看出,單個小區(qū)的平均面積有逐年變小的趨勢,劃分小區(qū)的數(shù)量在逐漸增加,傳統(tǒng)的進(jìn)行交通小區(qū)劃分的方法主要基于大規(guī)模的人工抽樣調(diào)查,這種劃分方法成本高、周期長,調(diào)查的
8、數(shù)據(jù)存在抽樣率低、抽樣統(tǒng)計的精度不高、數(shù)據(jù)更新周期長等問題。由于我國大部分城市正處于快速發(fā)展期,土地利用不斷變化,人口高速增長,通過這種方式進(jìn)行交通小區(qū)的劃分時效性較差。本文通過交通出行數(shù)據(jù)的聚類運(yùn)算,提供實(shí)時的交通小區(qū)的分布狀態(tài),這種快速、動態(tài)的劃分方法彌補(bǔ)了傳統(tǒng)劃分方式的不足。 原始出租車數(shù)據(jù) 設(shè)定精度E 數(shù)據(jù)預(yù)處理 隨機(jī)選擇數(shù)據(jù)中心 M尋找距離最近的聚類中心井入組 M+ 更新數(shù)據(jù)中心計算方差E(M) E(M)E 否 是E(M-1)E 否 包含中心點(diǎn)的數(shù)據(jù)聚類 是 交通小區(qū) 邊界計算 圖1 交通小區(qū)分過程 五、 模型求解5 .1基于 K均值聚類算法的交通小區(qū)劃分方法 5.1.1 劃分方法
9、本劃分方法首先對坐標(biāo)數(shù)據(jù)進(jìn)行空間聚類運(yùn)算,得到出行起訖點(diǎn)的 OD矩陣,最后以此為依據(jù)進(jìn)行交通小區(qū)的劃分劃分過程如圖 1所示。 5.1.2 出租車 GPS 數(shù)據(jù)預(yù)處理 試驗(yàn)中所用到的數(shù)據(jù)來源于北京奇華通訊有限公司,主要包括車輛 GPS實(shí)時數(shù)據(jù)和車輛類型等相關(guān)數(shù)據(jù)信息,原始數(shù)據(jù)表主要保存了出租車上裝配的 GPS終端所采集的數(shù)據(jù),這些數(shù)據(jù)包括車牌號時間經(jīng)緯度速度以及該車的空重車狀態(tài)等。由于每天的數(shù)據(jù)量龐大(2.5 千萬條 / 天),基于縮短數(shù)據(jù)查詢時間以及提高整體運(yùn)算性能等方面的考慮,需要對原始數(shù)據(jù)進(jìn)行優(yōu)化。原始數(shù)據(jù)內(nèi)容見表4。表4 原始表據(jù)nametimeJdwdstatusVangle粵B00D
10、102011/04/18 00:00:05113.58599923.1332740620粵B4906B2011/04/18 00:00:10113.88836722.780216004粵B00D162011/04/18 00:00:04114.05538222.625116052粵B5223B2011/04/18 00:00:49114.01363422.665283101粵B5357B2011/04/18 00:00:30114.04508222.7112670406粵B5996D2011/04/18 00:00:28113.92620822.5657670333粵B6618E2011/04
11、/18 00:00:28114.06033322.526083006 其中status字段代表的是出租車的空重車狀態(tài),當(dāng)值為 0 時表示車的狀態(tài)為空車,值為 1 時表示車的狀態(tài)為重車當(dāng)status值由 0 變?yōu)?1 時,status值為 1 的車的位置即為乘客上車時的位置;相反地,乘客下車時的位置也可以得到 根據(jù)這一特性剔除原始表中的無用數(shù)據(jù),優(yōu)化后的數(shù)據(jù)見表 5。表5 優(yōu)化后的數(shù)據(jù)nametimeJdwdstatusVangle粵B00D162011/04/18 00:00:04114.05538222.625116052粵B5223B2011/04/18 00:00:49114.01363
12、422.665283101粵B5357B2011/04/18 00:00:30114.04508222.7112670406 5.1.3 聚類計算 經(jīng)過上一步的數(shù)據(jù)優(yōu)化,即可得到由起訖點(diǎn)數(shù)據(jù)組成的數(shù)據(jù)集,現(xiàn)在需要對這些數(shù)據(jù)進(jìn)行聚類運(yùn)算:一段時間內(nèi)的起點(diǎn)或者訖點(diǎn)被劃分為若干個區(qū)域,每個區(qū)域中的點(diǎn)分布緊湊,區(qū)域與區(qū)域之間自然分開。本文采用了K-Means聚類算法,K-Means 聚類算法是一種分割式聚類方法,它是數(shù)據(jù)挖掘技術(shù)中一種經(jīng)典的基于劃分的聚類算法,其目的在于從大量數(shù)據(jù)點(diǎn)中找出具有代表性的數(shù)據(jù)點(diǎn),即中心點(diǎn),然后再根據(jù)這些中心點(diǎn)進(jìn)行后續(xù)的處理K-Means 算法采用了迭代更新的運(yùn)算思想,聚類過
13、程如下: 首先從 n 個數(shù)據(jù)點(diǎn)隨機(jī)選擇 k 個點(diǎn)作為初始聚類中心;通過運(yùn)算其它點(diǎn)與這些聚類中心點(diǎn)的相似度(距離),將其分別分配給與其相似度最高(距離最近)的中心點(diǎn)所在的聚類;然后對劃分好后的聚類重新運(yùn)算聚類中心。這一過程不斷重復(fù)直到標(biāo)準(zhǔn)測度函數(shù)開始收斂。 5.1.4 對區(qū)域數(shù)據(jù)進(jìn)行邊界運(yùn)算 聚類運(yùn)算結(jié)束之后,得到若干組包含中心點(diǎn)在內(nèi)的一些坐標(biāo)點(diǎn),如圖 2 所示(點(diǎn) X表示出租車的坐標(biāo)點(diǎn),實(shí)心圓點(diǎn)表示交通小區(qū)中心) 將所有聚類后的坐標(biāo)通過 GIS平臺輸出,通過這種方式很難看出不同區(qū)域之間的界線 這時需要將區(qū)域的邊界繪制出來。本文采用的邊界運(yùn)算過程如下:首先建立平面直角坐標(biāo)系,將坐標(biāo)系以(0,0)
14、為中心點(diǎn)均分為 n等份區(qū)域(n 的值將決定邊界運(yùn)算結(jié)果的精度),每個區(qū)域的角度為360/n,如圖 3所示圖 3 360度分為n份 圖4 距離中心點(diǎn)的距離 然后,將某個聚類的點(diǎn)集放入該坐標(biāo)系,使得區(qū)域中心點(diǎn)與坐標(biāo)原點(diǎn)重合,通過計算其它點(diǎn)與中心所形成的角的正余弦,即可得到每個點(diǎn)與中心點(diǎn)所形成的夾角,進(jìn)而將這些點(diǎn)歸入上一步所劃分的區(qū)域。 依次計算第i個區(qū)域里每個點(diǎn)距離中心點(diǎn)的距離,記錄距離中心點(diǎn)最遠(yuǎn)的點(diǎn)為ci,如圖4中P點(diǎn)等最后,將這所有的 ci 點(diǎn)相連接,即可得到點(diǎn)集的相應(yīng)邊界,如圖5 所示5.2 試驗(yàn)平臺搭建與實(shí)例分析 5.2.1 試驗(yàn)平臺搭建 為了檢驗(yàn)劃分結(jié)果的準(zhǔn)確度,本文搭建了具有 GIS功
15、能的試驗(yàn)平臺平臺,使用 Java 語言進(jìn)行開發(fā),GIS功能采用GoogleMapsAPI解決方案。平臺通信過程如圖6 所示 5.2.2 實(shí)例分析 通過上述方法,利用2008年8月3號北京市出租車 GPS數(shù)據(jù)進(jìn)行交通小區(qū)的劃分,并將劃分結(jié)果輸出到 GIS平臺上,如圖7 所示 可以看出這種動態(tài)劃分方法產(chǎn)生的結(jié)果能夠與現(xiàn)有的部分交通小區(qū)相吻合(標(biāo)注 A為CBD小區(qū),標(biāo)注 B為西郊小區(qū)),詳細(xì)的 OD矩陣數(shù)據(jù)見表 6 表6中 O 代表起點(diǎn),D 代表訖點(diǎn),比如坐標(biāo)位置(2, 5)的值為 2,代表某一段時間內(nèi),共有 2 輛出租車從 5 號區(qū)域前往 2 號區(qū)域,并且乘客是在5 號區(qū)域上車,在 2號區(qū)域下車六
16、、模型評價與推廣6.1 模型評價:本文通過對出租車GPS數(shù)據(jù)進(jìn)行聚類運(yùn)算,快速計算出不同時間段內(nèi)出租車載客 OD矩陣,進(jìn)而將劃分好的區(qū)域在GIS平臺中顯示出來。從實(shí)驗(yàn)結(jié)果可以看出:這種劃分方法能夠反映出不同時間段內(nèi)交通小區(qū)的絕對動態(tài)性以及相對穩(wěn)定性的特征,對城市交通小區(qū)的劃分具有很高的參考價值。但本文所使用的交通小區(qū)劃分方法也存在一定的不足:首先,劃分算法使用了純粹的 K-Means 空間聚類法,沒有與現(xiàn)有的位置屬性相結(jié)合,比如住宅區(qū)、商業(yè)區(qū)等屬性;其次,算法沒有對出租車的特殊數(shù)據(jù)和異常數(shù)據(jù)進(jìn)行處理,比如紅綠燈停車 GPS信號機(jī)發(fā)生故障等情況,這些都將影響最終結(jié)果的準(zhǔn)確性;再次,針對特定時間段進(jìn)行交通小區(qū)的劃分更有代表性,比如早晚高峰等,本文沒有對此展開討論,這些都是今后的改進(jìn)方向。 6.2 模型推廣:本文中的模型都是在綜合考慮了各種不同情況下得出的滿足實(shí)際需求的優(yōu)化模型,因此它的適用性很強(qiáng),可以推廣到很多類似的現(xiàn)實(shí)問題。七、參考文獻(xiàn)1李曉丹,楊曉光,陳華杰.城市道路網(wǎng)絡(luò)交通小區(qū)劃分方法研究.計算機(jī)工程與應(yīng)用, 2009,45(5):19-22.2楊波,劉海洲.基于聚類分析的交通小區(qū)劃分方法的改進(jìn).交通與運(yùn)輸, 2007,(7):23-26.3徐吉謙.交通工程總論.北京:人民交通出版社,2003.4馬超群,王
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安徽外國語學(xué)院《教育數(shù)字化》2023-2024學(xué)年第二學(xué)期期末試卷
- 浙江樹人學(xué)院《GNSS原理與應(yīng)用A》2023-2024學(xué)年第二學(xué)期期末試卷
- 貴州建設(shè)職業(yè)技術(shù)學(xué)院《國際知識產(chǎn)權(quán)法(B)》2023-2024學(xué)年第二學(xué)期期末試卷
- 吉林師范大學(xué)博達(dá)學(xué)院《不動產(chǎn)測繪與建庫》2023-2024學(xué)年第二學(xué)期期末試卷
- 四川航天職業(yè)技術(shù)學(xué)院《計算機(jī)圖形設(shè)計(二)》2023-2024學(xué)年第二學(xué)期期末試卷
- 包頭輕工職業(yè)技術(shù)學(xué)院《勞動實(shí)踐》2023-2024學(xué)年第二學(xué)期期末試卷
- 運(yùn)城學(xué)院《發(fā)酵食品與工藝》2023-2024學(xué)年第二學(xué)期期末試卷
- 吉林農(nóng)業(yè)科技學(xué)院《電視播音與主持》2023-2024學(xué)年第二學(xué)期期末試卷
- 山東第一醫(yī)科大學(xué)《大學(xué)英語(英語演講入門技巧與實(shí)踐)》2023-2024學(xué)年第二學(xué)期期末試卷
- 商廚廚房設(shè)計方案
- 網(wǎng)絡(luò)群體市場章
- 城鎮(zhèn)排水管道檢測記錄表、缺陷圖圖例、檢測成果表、等級劃分及樣圖
- 食用農(nóng)產(chǎn)品集中交易市場分級標(biāo)準(zhǔn)
- 成人高流量濕化氧療臨床應(yīng)用規(guī)范專家共識2019
- 管道開挖回填計算(模板)1
- 紀(jì)檢監(jiān)察機(jī)關(guān)查辦案件工作的技巧及談話策略
- 電大公共政策概論形考任務(wù)1-4答案
- 發(fā)現(xiàn)中紋之美-壯錦
- T-GDSS 008-2022 不銹鋼管道安裝技術(shù)規(guī)范
- 小學(xué)生日常行為規(guī)范記錄本
- 國有企業(yè)招標(biāo)采購相關(guān)法律法規(guī)與國有企業(yè)采購操作規(guī)范
評論
0/150
提交評論