算法賽top5思路代碼大熊座epsilon團(tuán)隊(duì)航空_第1頁
算法賽top5思路代碼大熊座epsilon團(tuán)隊(duì)航空_第2頁
算法賽top5思路代碼大熊座epsilon團(tuán)隊(duì)航空_第3頁
算法賽top5思路代碼大熊座epsilon團(tuán)隊(duì)航空_第4頁
算法賽top5思路代碼大熊座epsilon團(tuán)隊(duì)航空_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、一,利用的數(shù)據(jù)本場賽題共有六張表的數(shù)據(jù):表 GOXVUXZEMEOLOEGV,H 安檢旅客過關(guān)人數(shù)表 GOXVUXZEMEYKIXOZ_EINKIQ,I旅客進(jìn)入離開機(jī)場的行程表 GOXVUXZEMEJKVGXZXK,J 航班排班表 GOXVUXZEMELROMNZY。K 機(jī)場登機(jī)口區(qū)域表 GOXVUXZEMEMGZKY L 機(jī)場 =/,/ 接入點(diǎn)坐標(biāo)表 GOXVUXZEMEOLOEIUUX 考慮到要未來兩天的=/,/ 6 連接數(shù)量,連接=/,/ 6 (IY 6U)的人數(shù)表無疑是最有利用價(jià)值的一張表,而安檢旅客過關(guān)人數(shù)表和旅客進(jìn)入離開機(jī)場的行程表對于未來幾個(gè)小時(shí)內(nèi)的很有價(jià)值,但是對于未來兩天這樣

2、長的時(shí)間段應(yīng)該作用不大。 航班排班表與 =/,/ 6 連接情況尤其是登機(jī)口附近的=/,/ 6 相關(guān)性很大,配合機(jī)場登機(jī)口區(qū)域表和機(jī)場=/,/ 接入點(diǎn)坐標(biāo)表應(yīng)該能較好地從時(shí)間和空間上=/,/ 6 的連接情況。所以,選用 G J K L 這四張表來進(jìn)行建模。二,數(shù)據(jù)預(yù)處理本賽題的數(shù)據(jù)預(yù)處理主要包含: ,連接 =/,/ 6 (IY 6U)的人數(shù)表存在缺失數(shù)據(jù)情況,對于個(gè)別時(shí)間段的數(shù)據(jù)缺失,可以利用填充 或者前后幾天均值來進(jìn)行填充,對于大段時(shí)間段的數(shù)據(jù)缺失,考慮以天為刪除數(shù)據(jù),不予利用。 ,航班排班表中的計(jì)劃起飛時(shí)間和實(shí)際起飛時(shí)間與其他表的時(shí)間有八小時(shí)誤差,進(jìn)行了處理。 ,機(jī)場=/,/ 接入點(diǎn)坐標(biāo)表中

3、=/,/ 6 坐標(biāo)沒有辦法直接和登機(jī)口聯(lián)系起來,先將這些點(diǎn)的坐標(biāo)回歸擬坐標(biāo),然后可以和登機(jī)口坐標(biāo)聯(lián)系起來,如圖一。G連接 =/,/ 6 ( IY 6U )的人數(shù) 圖一:WIFI AP 和登機(jī)口位置信息三,方案1, 整體,每個(gè) WIFI AP 的在某一時(shí)間段的連接數(shù)具有很強(qiáng)的時(shí)間周期性,所以用歷史數(shù)據(jù)來進(jìn)行回歸對于絕大多數(shù) AP 來說就已經(jīng)能很好地?cái)M合,而且過擬合的情況不嚴(yán)重。2, 通過第一步的整體,大部分的 WIFI AP 已經(jīng)的到了一個(gè)相對較優(yōu)的值,但是對于一些AP,尤其是在登機(jī)口附近的 WIFI AP 由于受到飛機(jī)航班起降的影響非常嚴(yán)重,地不是很好,需要進(jìn)一步進(jìn)行修正學(xué)習(xí)。第一步的值和實(shí)際

4、值作為一個(gè)殘差,學(xué)習(xí)并這個(gè)殘差,就可以進(jìn)一步提高的精度,而每一個(gè) WIFI AP 附近的登機(jī)口是不同的,而且由于其他空間的影響,不同WIFI AP之間的數(shù)據(jù)幾乎無法互相利用,所以需要對于每個(gè) WIFI AP 單獨(dú)建模,回歸出殘差。對于 E1,E2,E3,W1,W1,W3 這六個(gè)區(qū)域的WIFI AP,是直接的候機(jī)休息區(qū),會直接收到距離其很近的登機(jī)口的航班起落影響,于是根據(jù)WIFI AP 和登機(jī)口的坐標(biāo),計(jì)算距離,求出每個(gè) WIFI AP 可能會受到那幾個(gè)登機(jī)口的影響,進(jìn)一步提取特征,訓(xùn)練模型。對于 EC 和WC 區(qū)域,是候機(jī)區(qū)的通道,會受到某一個(gè)區(qū)域所有航班的影響,其細(xì)分成了六個(gè)區(qū)域(如圖一),

5、分別提取特征,每個(gè) WIFI AP 單獨(dú)訓(xùn)練,各自殘差。圖二:EC 和 WC 區(qū)域細(xì)分 , 登機(jī)口附近 6 的線性回歸方案。在登機(jī)口附近的 6 的 OLO 連接人數(shù),可以近似認(rèn)為和等待登機(jī)的人數(shù)成正比。當(dāng)然某個(gè) 6 可能受到不止一個(gè)登機(jī)口的影響。即其中其中 _ Z 為 Z 時(shí)刻某 6 的 OLO 連接人數(shù),O Z 是登機(jī)口等待登機(jī)人數(shù),GO 是相關(guān)系數(shù),O 代表某 6 附近的O 個(gè)登機(jī)口。顯然這是一個(gè)容易求解的線性回歸問題。那么是否可以通過航班的起飛時(shí)間和登機(jī)人數(shù),大致估算出每一時(shí)刻,等待登機(jī)的人數(shù)呢?既求取函數(shù) L:其中 O 是登機(jī)口對應(yīng)的航班信息,包括航班起飛時(shí)間和登機(jī)人數(shù)。注意到一層的登

6、機(jī)口非常密集,而等待區(qū)是一個(gè)獨(dú)立而封閉的區(qū)域??梢詫⒁粋€(gè)區(qū)域看成是一個(gè)整體,那么有其中 P 代表一個(gè)區(qū)域內(nèi)的 6 數(shù)量,Q 代表一個(gè)區(qū)域內(nèi)登機(jī)口的數(shù)量。根據(jù) ,我們可以通過最優(yōu)化問題求解 L :其中 IU 是 相關(guān)系數(shù)。具體求解使用了粒子群優(yōu)化算法 695 。求解結(jié)果max (cov( yj(t) , f(xk, t) yj(t) a1 zk(t) = a1 f(xk, t)( )zi(t) = f(xi, t)( )y(t) = aizi(t)( )四,特征提取史連接情況,最大值,最小值,平均值,中位數(shù)等等;可能影響該 =/,/ 6 的幾個(gè)登機(jī)口的過去一段時(shí)間(過去三小時(shí),過去一小時(shí),過去,過去十分鐘) 最近一段時(shí)間(最近三小時(shí),最近一小時(shí),最近,最近十分鐘),未來一段時(shí)間(未來三小時(shí),未來一小時(shí),未來,未來十分鐘),各有多少個(gè)航班起降;距離該 =/,/ 6 的最近的登機(jī)口在過去,最近,未來的飛機(jī)起飛情況;距離該 =/,/ 6 的第二近的登機(jī)口在過去,最近,未來的飛機(jī)起飛情況等等。五,模型選擇由于每個(gè) =/,/ 6 需要單獨(dú)建模,其實(shí)每個(gè)模型的數(shù)據(jù)實(shí)際上非常有限,數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論