MapReduce求解物流配送單源最短路徑研究_第1頁
MapReduce求解物流配送單源最短路徑研究_第2頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、MapReduce求解物流配送單源最短路徑研究摘要:針對物流配送路線優(yōu)化,提出了將配送路線問題分解成若干可并行操作的子問題的云計算模式。詳細(xì)論述了基于標(biāo)色法的MapReduce廣度優(yōu)先算法并行化模型、節(jié)點數(shù)據(jù)結(jié)構(gòu)、算法流程和偽代碼程序,并通過將該算法應(yīng)用于快遞公司的實際配送,驗證了該算法的可行性。關(guān)鍵詞:物流配送;MapReduce;并行計算;最短路徑隨著電子商務(wù)的普及,人們網(wǎng)上購物的習(xí)慣逐漸形成。截止2012年11月30日,阿里巴巴集團(tuán)旗下淘寶和天貓2012年總交易額已經(jīng)突破一萬億。綜合淘寶和天貓的交易數(shù)據(jù)來看,以快遞員為主體的中國物流配送業(yè)對電子商務(wù)發(fā)展的促進(jìn)起到了巨大作用。同時傳統(tǒng)郵政擔(dān)

2、負(fù)的包裹配送業(yè)務(wù)比重也逐漸地傾斜于第三方物流配送公司。目前我國物流配送運(yùn)輸成本占整個物流成本的35%50%左右1。由于網(wǎng)購物品用戶分布在城市的不同地方,為了控制配送運(yùn)輸成本,改善配送秩序,需要優(yōu)化配送路線。優(yōu)化配送路線的求解有串行算法和并行算法。串行算法主要表現(xiàn)在基于算法本身以及其優(yōu)化組合的方法,例如CLARKG和WRIGHTJ的節(jié)約算法、GILLETTBE和MILLERLR的掃描算法、Christofides等人的k度中心樹和相關(guān)算法、Gendrean的禁忌搜索方法、LAWRENCEJ的遺傳算法、Dijkstra算法、Nordbeck提出的橢圓限制搜索區(qū)域改進(jìn)算法2。隨著計算數(shù)據(jù)的海量化以及

3、摩爾定律的失效(晶體管電路已經(jīng)接近了其物理改進(jìn)的極限),串行算法本身的改進(jìn)和組合已不能適應(yīng)需求。計算機(jī)科學(xué)領(lǐng)域出現(xiàn)了另一類并行最短路徑分析算法設(shè)計,目前關(guān)于并行最短路徑分析算法設(shè)計有基于MPI的主從Dijkstra并行算法3、MPI+open-MP混合算法4、社區(qū)分析的最短路徑LC-2q并行算法5等。本文針對物流及時配送和成本控制需求,提出基于標(biāo)色法的MapReduce廣度優(yōu)先算法并行化模型,并應(yīng)用于配送線路優(yōu)化問題。由于MapReduce本身封裝了數(shù)據(jù)分割、負(fù)載均衡、容錯處理等細(xì)節(jié),用戶只需要將實際應(yīng)用問題分解成若干可并行操作的子問題,有效降低了求解難度,為解決物流配送運(yùn)輸路徑優(yōu)化問題提供了

4、技術(shù)支持。1MapReduce算法描述信息技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展為云計算的產(chǎn)生提供了條件。MapReduce并行編程模型是云計算的核心技術(shù)之一。MapReduce是Google實驗室提出的一個分布式并行編程模型或框架,主要用來處理和產(chǎn)生海量數(shù)據(jù)的并行編程模式,2004年DEANJ和GHEMAWATS第一次發(fā)表了這一新型分布式并行編程模型6。用戶不必關(guān)注MapReduce如何進(jìn)行數(shù)據(jù)分割、負(fù)載均衡、容錯處理等細(xì)節(jié),只需要將實際應(yīng)用問題分解成若干可并行操作的子問題,這種分解思路遵守主從架構(gòu)模型。Mapreduce框架的主要程序分為Master、Map和Reduce。在Hadoop中,MapReduc

5、e由一個主節(jié)點(Jobtracker,屬于Master)和從節(jié)點(Tasktracker,屬于Map和Reduce)組成7。1.1基于標(biāo)色法的MapReduce廣度優(yōu)先算法模型給定一個帶權(quán)有向圖,用G=(N,E,W)模型來表示,其中N=ni|i=l,2,.,m為完全圖的點的集合;E=e(ni,nj)|i≠j,ni,nj∈N為弧段集;W=w(ni,nj)|i≠j,ni,nj∈N為權(quán)值集。一般向圖的權(quán)值表示節(jié)點與節(jié)點之間的幾何長度,記為w(ni,nj)=dij,dij表示節(jié)點ni到節(jié)點nj的距離。最短路徑計算就是計算從起始點ni到終止點nj的最短幾何長度之和為最小。

6、在有向圖起始點和終止點的最短路徑計算中,MapReduce采用的是廣度優(yōu)先算法。MapReduce計算最短路徑用鄰接表來表示圖,在鄰接表中每一行數(shù)據(jù)構(gòu)成Map和Reduce的一個數(shù)據(jù)內(nèi)容。Map和Reduce的(key,value)中key為N,value值為與這個節(jié)點鄰接的所有節(jié)點的AdjacentList。在用標(biāo)色法求解最短路徑時,AdjacentList節(jié)點的信息包括源點到頂點的距離distance(除到本身的距離為0外,其余初始值皆為無窮大);節(jié)點的顏色color(其值可分別取0、1、2,0表示未處理的頂點,1表示等待處理的頂點,2表示已處理的頂點,源點的初始值為1,其余頂點皆為0);

7、被訪問頂點和邊的權(quán)值記為N和W。頂點的數(shù)據(jù)結(jié)構(gòu)如表1所示。1.2 MapReduce求解步驟(l)Master對輸入文件按行(每行代表圖中的一個頂點)進(jìn)行自動切分,并將數(shù)據(jù)作為輸入分發(fā)到每個Map任務(wù)(keyin,valuein),即輸入(ID,<Distance;color;pnodesandweight>);(2)接收(keyin,valuein)對,當(dāng)valuein中的color的值為1時,則處理當(dāng)前頂點,產(chǎn)生臨時的(keyout,valueout)|out=l.k集;(3)MapReduce對Map執(zhí)行過程輸出的臨時中間結(jié)果進(jìn)行分組(Shuffle/sort),將相同的ke

8、y值即ID號合并成同一組(key,list(valuei)|i=l.m),并將其分發(fā)給空閑的Reduce;(4)Reduce接收(key,list(valuei),對相同ID的value進(jìn)行合并,找到當(dāng)前的最短路徑;(5)如果每次Reduce后,結(jié)果收斂,則停止計算;如果未收斂,則繼續(xù)發(fā)給下一輪的Map過程,多次迭代計算直到color值全部為2,得到最終的最短路徑,算法結(jié)束。MapReduce算法流程。1.3 MapReduce算法偽代碼(1)MapReduce的第一次迭代偽代碼,Map部分為:Map:<kl,vl>→list(<k2,v2>)其中k1為節(jié)點的

9、ID;vl為該節(jié)點的距離、邊、邊的權(quán)值、顏色;每一個輸入的<k1,v1>會輸出一批<k2,v2>,它們是計算的中間結(jié)果。BeginIf(color(k1)=1)/如果k1的還需處理,即k1的顏色為灰色forki(<k1,ki>ink1.edges)/對所有k1指向的節(jié)點,只處理所有標(biāo)記為1的節(jié)點If(distance(k1)+weight(k1,ki)<distance(ki)Setdistance(distance(ki)=distance(k1)+weight(k1,ki);Setcolor(ki)=1;emit(ki,v1)/將/該記錄加入到鍵值

10、對中,將標(biāo)記為1的節(jié)點所關(guān)聯(lián)的節(jié)點加入中間結(jié)果。Setcolor(k1)=2;/標(biāo)記為1的節(jié)點被變更為2,表示處理完畢emit(k1,v1)End(2)Mapreduce的第一次迭代偽代碼,Reduce部分Reduce<k2,list(v2)>→<k3,v3>/<k2,list(v2)>輸入的中間結(jié)果,其中l(wèi)ist(v2)表示一批屬于同一個K2的value。<k3,v3>為輸出結(jié)果BeginSetcolor(k2)=0;Setdistance(k2)=∞vi∈list(v2);If(vi.color>k2.c

11、olor)/按照節(jié)點對計算中間結(jié)果進(jìn)行合并Setcolor(k2)=vi.color;Ifvi.distance<distance(k2)/如果中間結(jié)果比原有結(jié)果小,將節(jié)點標(biāo)記為1Setdistance(k2)=vi.distance;If(vi.color=1),Setcolor(k2)=1;Ifvi.edges!=null,SetEdges(k2)=vi.edges;emit(k2,vi.)End2案例分析2.1基本情況韻達(dá)快遞浙江杭州西湖區(qū)文一路公司是民營韻達(dá)快運(yùn)的子公司,為客戶提供快遞、物流及電子商務(wù)等一系列門到門服務(wù)。企業(yè)的配送范圍為文一路、文二路、教工路及學(xué)院路構(gòu)成的矩形區(qū)域

12、,該區(qū)域面積大約20km2的范圍。隨著第三方物流公司的增多,物流配送競爭越來越激烈。為了壓縮成本,按照配送點情況優(yōu)化線路是節(jié)約成本的途徑之一,優(yōu)化后的單源配送線路線可以將途經(jīng)的配送點一并發(fā)送,形成一車多配的節(jié)約模式。2.2問題提出及求解公司某次接到為4個區(qū)域(西湖科技大廈、節(jié)能工業(yè)園、高新大廈及華門公寓)配送貨物的任務(wù),配送員決定分頭配送,而如何組織好路線使得路程最短就可以歸結(jié)為單源最短路徑問題。為了計算方便,設(shè)置配送中心點為n1,被配送的4個地方分別設(shè)置西湖科技大廈為n2,節(jié)能工業(yè)園為n3,高新大廈為n4,華門公寓為n5。4個區(qū)域之間及其與配送中心的幾何路線長度取整數(shù)(km)。有向圖見圖2(

13、a),其中幾何路線長度d1(n1,n2)=10,d2(n1,n4)=5,d3(n2,n3)=1,d4(n2,n4)=2,d5(n3,n5)=4,d6(n4,n2)=3,d7(n4,n3)=9,d8(n5,n1)=7,d9(n5,n3)=6。從配送中心n1出發(fā)選取怎樣的路線可以滿足到達(dá)n2、n3、n4、n5的長度是最短的。采用標(biāo)色法的MapReduce廣度優(yōu)先算法計算,依照偽代碼的計算邏輯計算出源點到其他各點的最短路徑。通過4次迭代頂點到各點的最短路徑見圖2(f),其中加粗的圓圈表示被訪問過的頂點,color值為2,圈內(nèi)的數(shù)值為其與n1的最短路徑長度;color值為0,虛線圈為未訪問的頂點,圈內(nèi)

14、值為∞color值為1,虛線圈為待訪問的頂點,圈內(nèi)值為標(biāo)注值。MapReduce第一次迭代驗算數(shù)據(jù)如表2所示,其余幾次迭代過程格式與此類似。如果從配送點n1到節(jié)能工業(yè)園n3進(jìn)行配送,配送的最優(yōu)路線就是配送點nl→高新大廈n4→西湖科技大廈n2→節(jié)能工業(yè)園n3。優(yōu)化后的長度為nl→n4→n2→n3=9。相比其他配送路線選擇,如n1→n2→n3=11,n1→n2→n4→n3=21,n1→n2→n4→n5→n3=20,n1→n2→n4→n5→n3=20,nl→n4→n3=14,nl→n4→n5→n3=1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論