《Python數(shù)據(jù)分析基礎(chǔ)與案例實戰(zhàn)》第9章 鐵路站點客流量預(yù)測_第1頁
《Python數(shù)據(jù)分析基礎(chǔ)與案例實戰(zhàn)》第9章 鐵路站點客流量預(yù)測_第2頁
《Python數(shù)據(jù)分析基礎(chǔ)與案例實戰(zhàn)》第9章 鐵路站點客流量預(yù)測_第3頁
《Python數(shù)據(jù)分析基礎(chǔ)與案例實戰(zhàn)》第9章 鐵路站點客流量預(yù)測_第4頁
《Python數(shù)據(jù)分析基礎(chǔ)與案例實戰(zhàn)》第9章 鐵路站點客流量預(yù)測_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

鐵路站點客流量預(yù)測1預(yù)處理客流量數(shù)據(jù)目錄分析背景與目標(biāo)2探索客流量數(shù)據(jù)3構(gòu)建模型并預(yù)測客流量4鐵路是我國居民出行重要的交通方式隨著社會經(jīng)濟的發(fā)展,鐵路車站客流量增長速度較快,日均接發(fā)列車數(shù)量也有較大增加,車流、客流密度明顯增加。尤其是在春運、寒暑假、黃金周及節(jié)假日期間,客流量相比平常有大幅度的增加,鐵路客運組織難度較大。因此有必要對鐵路站點客流量規(guī)律進行分析,預(yù)測站點出行客流量,為鐵路部門進行站點規(guī)劃、服務(wù)改進等工作提供必要的理論依據(jù)。本案例通過對列車運行數(shù)據(jù)進行分析,對ST111-01站點的客流量規(guī)律進行探索分析,并構(gòu)建模型預(yù)測ST111-01站點的出行客流量,進而給鐵路部門的站點規(guī)劃、服務(wù)改進與列車調(diào)度提供合理參考。從每年的春運期間以及旅游淡季期間的鐵路客流量數(shù)據(jù)中可以發(fā)現(xiàn)客流量符合一定的變化規(guī)律。為分析客流量中隱藏的規(guī)律,首先需要了解相關(guān)行業(yè)背景以及列車運行數(shù)據(jù)。分析背景與目標(biāo)隨著時代經(jīng)濟的發(fā)展,交通越來越發(fā)達的同時,人們的出行意愿也越發(fā)強烈。鐵路兼具方便、快捷與價格低廉的特點,是我國居民長途旅行主要的交通方式之一。在這樣的背景下,鐵路部門面臨幾個難題。如何正確規(guī)劃列車調(diào)度,改變“一票難求”的購票局面?如何合理地制定票價?如何提高旅客出行的體驗?針對這些問題,鐵路部門需要對現(xiàn)有的制度與方法進行優(yōu)化。鐵路客運運輸?shù)陌l(fā)展依賴于合理、科學(xué)的決策,而科學(xué)的決策顯然離不開科學(xué)的預(yù)測。背景科學(xué)的預(yù)測能使鐵路部門對未來做出規(guī)劃,可以為以下方面等提供幫助。制定合理的價格。改善客運站組織方式。優(yōu)化鐵路車輛資源配置。提高客運設(shè)備的服務(wù)能力等。鐵路部門科學(xué)的預(yù)測對提高鐵路客運運輸效率具有重要的意義。背景本案例選取2015年1月到2016年3月的列車運行數(shù)據(jù),重點對ST111-01站點的出行客流量進行分析。列車運行的部分梯形密度表數(shù)據(jù)如下表所示。數(shù)據(jù)說明GT06ST013-ST190-01開行1天日均定員:1015客座率:89.6%上車站ST013ST241ST021ST111-03ST111-01ST326ST250下車人數(shù)合計下車站開/到點07:2508:0308:3009:2009:3910:2210:59ST111-0309:162

9

11ST111-0109:372111012

44ST32610:2128312333

322ST25010:58334

220134

490ST190-0112:1230513213185138647上車人數(shù)合計976112419663191381553結(jié)合列車運行數(shù)據(jù),可以實現(xiàn)以下目標(biāo)。利用列車運行數(shù)據(jù),探索ST111-01站點旅客出行規(guī)律。構(gòu)建模型,對ST111-01站點的出行客流量情況做出預(yù)測。本案例的總流程如圖所示,主要包括以下5個步驟。從業(yè)務(wù)系統(tǒng)中獲取數(shù)據(jù)。對數(shù)據(jù)進行結(jié)構(gòu)化處理、缺失值處理和日期格式化。探索不同站點、不同時段的客流量,以及非節(jié)假日和節(jié)假日的客流量。對處理后的數(shù)據(jù)進行檢驗,并對非節(jié)假日和節(jié)假日分別構(gòu)建時間序列模型。用構(gòu)建的模型對客流量進行預(yù)測并評價。分析目標(biāo)鐵路站客流量預(yù)測總流程。分析目標(biāo)1預(yù)處理客流量數(shù)據(jù)目錄分析背景與目標(biāo)2探索客流量數(shù)據(jù)3構(gòu)建模型并預(yù)測客流量4本案例所使用的原始數(shù)據(jù)為梯形密度表,是一種非結(jié)構(gòu)化數(shù)據(jù),需要將其處理成結(jié)構(gòu)化數(shù)據(jù),否則會影響后續(xù)分析。利用Python對原始數(shù)據(jù)進行結(jié)構(gòu)化處理,提取車次、站點、上下車人數(shù)等關(guān)鍵信息,并將結(jié)構(gòu)化后的數(shù)據(jù)進行保存。列車運行梯形密度表經(jīng)過處理以后,得到的部分結(jié)構(gòu)化列車運行數(shù)據(jù)如下表所示。預(yù)處理客流量數(shù)據(jù)站點上車人數(shù)離站時間下車人數(shù)到站時間開行日期車次ST07489113:00013:0020150101—20150101PK11ST2196913:4116113:3920150101—20150101PK11ST05415014:374014:3420150101—20150101PK11ST0367215:222515:1920150101—20150101PK11ST31343216:3035616:1920150101—20150101PK11ST0642117:1013317:0820150101—20150101PK11ST2224417:5117417:4920150101—20150101PK11ST0235818:262118:2420150101—20150101PK11ST1397418:481018:4620150101—20150101PK11ST2446319:125719:1020150101—20150101PK11由表中的開行日期屬性可以看出,日期是“20150101—20150101”格式,需要將其處理成標(biāo)準(zhǔn)的“2015-01-01”格式。除此以外,合并后的數(shù)據(jù)存在部分缺失(部分為空格,將其視為缺失值),如部分站點的離站時間缺失表示該站是終點站,離站時間與上車人數(shù)缺失表示該站是終點站且無人上車。將缺失值用0補全,便于后續(xù)處理。對缺失值和日期格式進行處理。預(yù)處理客流量數(shù)據(jù)1預(yù)處理客流量數(shù)據(jù)目錄分析背景與目標(biāo)2探索客流量數(shù)據(jù)3構(gòu)建模型并預(yù)測客流量4由于鐵路客運的穩(wěn)定性與航空客運不同,受天氣(除極端天氣外)的影響不大。因此本案例針對客流量的分析只考慮時間段、節(jié)假日兩個因素。探索客流量數(shù)據(jù)從合并后的數(shù)據(jù)中統(tǒng)計所有站點的日均上下車客流量,并隨機抽取20個站點的數(shù)據(jù)進行圖形化展現(xiàn)。得到的各站點上下車客流量分布如下圖所示,其中左側(cè)柱體為日均上車客流量,右側(cè)柱體為日均下車客流量。不同站點客流量上下車分析根據(jù)上圖可以看出,ST068、ZST145、ST095這3個站點的日均下車客流量較高,T314、T161、ZST224這3個站點的日均上車客流量較高,ST111-01、ZST172這2個站點的日均上下車客流量都比較高。造成這種現(xiàn)象的原因可能與站點的大小、經(jīng)過的車次多少、承擔(dān)鐵路交通功能相關(guān)。由于每個站點的情況是各不相同的,因此需要結(jié)合各個站點的客流量特征分別進行客流量的預(yù)測。本案例選取ST111-01站點進行客流量預(yù)測,因為該站點屬于上下車客流量較高的較具代表性的站點。對ST111-01站點的客流量特征進行探索,并構(gòu)建模型預(yù)測站點將來的客流量。不同站點客流量上下車分析假設(shè)以離站時間作為列車的開始運行的時間,構(gòu)造列車運行的時間段,取列車離站的時間點所在的小時作為列車運行的時間段,如13:04離站則截取13,表示13:00~14:00的時間段。對ST111-01站點每個時段的上下車客流量進行統(tǒng)計,得到的結(jié)果如圖所示。不同時段客流量上下車分析根據(jù)上圖可以看出,ST111-01站點在07:00~20:00的上車客流量較高,其余時間的上車客流量較低,這符合人們的作息規(guī)律。然而在0:00~05:00的上車客流量也有著不低的水平,這可能是由于這個時段開出的長途列車正好能在第二天的白天到達目的地。如乘客外出旅行時選擇在0:00~05:00乘坐列車出發(fā),可以在第二天的上午到達目的地,能夠留出足夠的時間尋找旅店或直接開始游玩。每個時段的下車客流量均保持在一定的范圍內(nèi)波動,沒有明顯的規(guī)律,分布較為均衡。因此可以認(rèn)為ST111-01站點的上車客流量與離站的時間有關(guān),下車客流量與到站時間無關(guān)。不同時段客流量上下車分析通過收集國家公布的法定節(jié)假日信息,對2015年1月1日至2016年3月20日中每個日期的節(jié)假日屬性進行標(biāo)記。其中節(jié)假日標(biāo)記為“小長假”,非節(jié)假日標(biāo)記為“工作日”。將標(biāo)記后的數(shù)據(jù)保存在“2015-2016年節(jié)假日.csv”文件中。統(tǒng)計ST111-01站點每天的平均客流量,添加每個日期的節(jié)假日屬性,并將每天的平均客流量圖形化展現(xiàn),得到的結(jié)果如圖所示。分析客流量節(jié)假日變化根據(jù)上圖可以看出,每當(dāng)節(jié)假日到來時都會迎來客流量的低谷,假期前后會有明顯的局部客流量高峰。因為旅客通常會選擇在節(jié)假日前一兩天回家或出游,在節(jié)假日當(dāng)天基本已到達目的地,假期最后一天又需要返回工作地點,體現(xiàn)出節(jié)假日的客流量往返效應(yīng)。鐵路部門可以考慮增加節(jié)假日前1~2天出發(fā)、假期最后一天返程的車次或座位,而假期當(dāng)天的車次及座位可以適當(dāng)減少以節(jié)約人力、物力資源。上圖中最低兩個點是2015年和2016年的春節(jié),由于春節(jié)前的客運周期較長,因此春節(jié)當(dāng)天沒有明顯的客流量高峰,客流量反而不斷減少直至在除夕當(dāng)天到達最低點。分析客流量節(jié)假日變化大年初一過后乘客開始返程,客流量逐步回升直至春節(jié)假期結(jié)束。春節(jié)的客流量變化規(guī)律與平常的假期不同,春節(jié)假期內(nèi)的客流量始終保持在較高水平,直至假期結(jié)束后才恢復(fù)至平時的水平。通過以上分析可以說明,節(jié)假日對客流量的影響程度較大。分析客流量節(jié)假日變化1預(yù)處理客流量數(shù)據(jù)目錄分析背景與目標(biāo)2探索客流量數(shù)據(jù)3構(gòu)建模型并預(yù)測客流量4對于鐵路部門而言,相比于不同站點的客流量,非節(jié)假日和節(jié)假日客流量的數(shù)據(jù)更具有實際的參考價值。因此本節(jié)構(gòu)建時間序列模型分別對非節(jié)假日和節(jié)假日客流量進行預(yù)測。構(gòu)建模型并預(yù)測客流量本案例利用ARIMA模型預(yù)測站點客流量,建立模型之前需要對數(shù)據(jù)進行檢驗,確認(rèn)數(shù)據(jù)屬于哪一種時間序列,得到的結(jié)果如圖所示。根據(jù)上圖可以看出,時序圖顯示出明顯的非平穩(wěn)性,自相關(guān)系數(shù)下降緩慢,說明序列具有周期性,單位根檢驗和白噪聲檢驗p值明顯小于0.05,因此原始數(shù)據(jù)為非平穩(wěn)的非白噪聲序列。構(gòu)建時間序列模型利用原始數(shù)據(jù)建立ARIMA模型,得到的預(yù)測結(jié)果和實際結(jié)果的折線圖如圖所示。根據(jù)下圖可以看出,預(yù)測結(jié)果是較為理想的,預(yù)測值與真實值有類似的變化趨勢。但是預(yù)測值在3月11日時以及3月18日時與真實值之間有很大的差異。而這兩天都是周五,可見周末對客流量的影響與節(jié)假日對客流量的影響具有相似效果。構(gòu)建時間序列模型節(jié)假日強烈影響了客流量的波動,影響了客流量的時間序列的特性。為了體現(xiàn)客流量的客觀規(guī)律,繪制剔除節(jié)假日之后的客流量數(shù)據(jù)的時序圖,得到的結(jié)果如圖所示。預(yù)測非節(jié)假日客流量剔除節(jié)假日之后的時序圖還存在部分客流量極高的隨機波動,查看對應(yīng)的日期數(shù)據(jù)后發(fā)現(xiàn),這些客流量較高的點大都是節(jié)假日前一天。將節(jié)假日前一天也剔除后再繪制時序圖,得到的結(jié)果如圖所示。據(jù)圖可以看出,將節(jié)假日及前一天剔除后客流量的時序圖比較平穩(wěn)。圖中客流量還是存在一個流量高峰,但是從日期與流量的關(guān)系上看,不能很好地辨別該流量高峰對應(yīng)的具體日期及假期,故暫不對其進行處理。預(yù)測非節(jié)假日客流量對整理的節(jié)假日日期進行修正,將節(jié)假日的前一天統(tǒng)一納入節(jié)假日的范圍,標(biāo)記為“小長假”,剔除小長假后對非節(jié)假日的客流量進行預(yù)測。剔除節(jié)假日后客流量數(shù)據(jù)具有明顯周期趨勢,周期為7天,選用SARIMA模型對非節(jié)假日客流量數(shù)據(jù)進行擬合與預(yù)測,得到的結(jié)果如所示。輸出結(jié)果:模型最終定階為((1,1,3),(0,1,3,7)),預(yù)測平均相對誤差為0.06007629455863023。預(yù)測非節(jié)假日客流量結(jié)合輸出結(jié)果可以看出,模型擬合效果較好。此時,預(yù)測結(jié)果的殘差服從正態(tài)分布,殘差的均值為0,且取值圍繞0上下波動,表明模型擬合效果較好。在經(jīng)過一次差分后,非節(jié)假日數(shù)據(jù)相關(guān)性降低,自相關(guān)系數(shù)長期低于0.05,表明數(shù)據(jù)是平穩(wěn)的且可以進行模型定階。預(yù)測非節(jié)假日客流量節(jié)假日的客流量預(yù)測需要考慮兩個因素:一是各個節(jié)假日的客流量不同。二是各個節(jié)假日的周期不同。如春節(jié)的周期比其他節(jié)假日的周期長,因此春節(jié)的客流量不會在一個時間點爆發(fā)式增長。所以找到一個可以衡量節(jié)假日客流量波動的量化指標(biāo)是需要重點解決的問題。預(yù)測節(jié)假日客流量通過可視化的方式展示2015年主要節(jié)假日的客流量情況,得到的結(jié)果分別如下圖所示。如2015年春節(jié)客流量折線圖如下。預(yù)測節(jié)假日客流量據(jù)圖可以看出,春節(jié)的周期較長,從2月開始回鄉(xiāng)客流量開始慢慢減少,在除夕(2015-02-18)當(dāng)天ST111-01站點迎來客流量的最低點。初一(2015-02-19)過后,ST111-01站點的客流量開始緩慢升高,在初七(2015-02-25)左右恢復(fù)至平日的較高客流量水平,這個周期大概為30天。結(jié)合2016年的春節(jié)進一步分析,發(fā)現(xiàn)每年的客流量最低谷均在春節(jié)時出現(xiàn),因為春節(jié)是中國的傳統(tǒng)節(jié)日,在外乘車的旅客人數(shù)較少。預(yù)測節(jié)假日客流量勞動節(jié)、中秋節(jié)和國慶節(jié)客流量變化圖如下。預(yù)測節(jié)假日客流量根據(jù)勞動節(jié)、中秋節(jié)和國慶節(jié)客流量變化圖可以看出,在勞動節(jié)、中秋節(jié)和國慶節(jié)假期的前一天站點的客流量會升高,在節(jié)假日期間站點的客流量會保持在高位。假期過后又恢復(fù)非假期時的較低水平,假期的客流量呈現(xiàn)出明顯的“雙峰單谷”特性。原因是旅客假期出行往往選擇在假期之前出發(fā),導(dǎo)致節(jié)假日前1~2天的客流量增長。假日期間客流量的持續(xù)轉(zhuǎn)移也會造成站點客流量保持在高位,而由于假期即將結(jié)束,返程的客流量又將造成一個客流量的高峰。預(yù)測節(jié)假日客流量對一個城市來說,每年的鐵路客流量是有一定規(guī)律的,需要確認(rèn)不同年份相同的節(jié)日客流量是否會發(fā)生很大變化。繪制2015年和2016年春節(jié)客流量時序圖進行對比,得到的結(jié)果如所示。假期的相似性根據(jù)上圖可以看出,2015年春節(jié)和2016年春節(jié)的客流量的變化規(guī)律是相似的,春節(jié)前客流量處在低位,在除夕當(dāng)天達到低谷,春節(jié)后開始緩慢升高。這也反映了一個城市人口變動不明顯的特征,它們每年相同假期的鐵路出行客流量規(guī)律變化相似。因此,可以通過構(gòu)造與假期相似性有關(guān)的指標(biāo)量化節(jié)假日客流量波動,即節(jié)假日客流量的波動系數(shù)。假期的相似性節(jié)假日的客流量相對于非節(jié)假日的客流量存在一個巨幅波動,為了衡量節(jié)假日對客流量的影響,定義節(jié)假日客流量波動系數(shù)用于節(jié)假日客流量的預(yù)測??土髁坎▌酉禂?shù)定義為節(jié)假日當(dāng)天的客流量與所有非節(jié)假日客流量均值之比,用

表示,如下式所示。上式中,

表示節(jié)假日當(dāng)天站點的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論