一種多agen系統(tǒng)協(xié)調(diào)協(xié)調(diào)的步進式全局規(guī)劃模型_第1頁
一種多agen系統(tǒng)協(xié)調(diào)協(xié)調(diào)的步進式全局規(guī)劃模型_第2頁
一種多agen系統(tǒng)協(xié)調(diào)協(xié)調(diào)的步進式全局規(guī)劃模型_第3頁
一種多agen系統(tǒng)協(xié)調(diào)協(xié)調(diào)的步進式全局規(guī)劃模型_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

一種多agen系統(tǒng)協(xié)調(diào)協(xié)調(diào)的步進式全局規(guī)劃模型

1局部規(guī)劃+增量式策略許多秋季合作和磋商是組織能夠順利完成任務(wù)的關(guān)鍵。一般總結(jié)計劃(pgp)是解決流量差異的協(xié)調(diào)機制,但假設(shè)流量代理是未經(jīng)授權(quán)的。換言之,在調(diào)整操作時,資源只有考慮整體利益,而我們通??吹降馁Y源都是私人的,所以我們必須考慮自己的利益。針對于此,本文對PGP進行了改進,提出了一種步進式部分全局規(guī)劃(PPGP),并主要針對基于時間或資源限制的任務(wù)類型,其改進如下:1)在PGP中任務(wù)管理Agent通過廣播的形式將局部規(guī)劃分配給其它Agents,然后該Agent接收到來自其它Agents的disagreement信息,而每個disagreement信息都代表該Agent自身的局部規(guī)劃與任務(wù)管理Agent的局部規(guī)劃的沖突;而在PPGP中,Agents彼此間相互通訊來發(fā)現(xiàn)沖突,各Agent是平等的,不存在一個集中管理Agent。2)在PGP中,當探測到?jīng)_突后,在解決沖突時,各Agen必須重新開始執(zhí)行各自的局部規(guī)劃來協(xié)調(diào)沖突;而我們在PPGP中,通過丟棄產(chǎn)生沖突的最不重要Agent的非強制性局部規(guī)劃來加快Agents間達成協(xié)商的速度。3)在解決沖突的過程中,我們在PPGP中采用了增量式策略來協(xié)調(diào)沖突。通過以上的改進,PPGP允許新加入的Agent同原系統(tǒng)中的Agents進行協(xié)商,而且當插入一個新的Agent后,原系統(tǒng)中的Agents不必重新開始協(xié)商。新的Agent通過探測沖突,并在不給已達成的協(xié)商帶來新的沖突的情況下解決沖突,以便盡快達成協(xié)商。2通過各全球規(guī)劃協(xié)調(diào)機制的完善2.1局部規(guī)劃的生成Agent是多Agent系統(tǒng)的基本組成成分,每個Agent的結(jié)構(gòu)主要包括三個通信子模塊:通信接口、規(guī)劃器和協(xié)調(diào)器。Agen的邏輯結(jié)構(gòu)如圖1所示,下面介紹各通信子模塊:通信接口:通信接口用來同其它Agents進行交互信息,Agent通過消息傳遞模式以點對點或多播的形式進行交互;規(guī)劃器:規(guī)劃器接收來自通信接口傳來的消息。而該消息可分為兩類:一類是該Agent分配的任務(wù),即它所要實現(xiàn)的目標;另一類是其它Agents關(guān)于該Agent局部規(guī)劃的disagreemen信息。因此,處理過程中有兩個映射函數(shù):一個是規(guī)劃構(gòu)造函數(shù),該函數(shù)用來構(gòu)造規(guī)劃以達到給定目標,在構(gòu)造中采用步進方式以使規(guī)劃細節(jié)滿足時間約束,其映射關(guān)系可表示為:另一個是沖突探測函數(shù),該函數(shù)通過分析Agents間的disagreement消息來確定已構(gòu)建的局部規(guī)劃與新的Agents局部規(guī)劃之間的沖突,其映射關(guān)系可表示為:然后,規(guī)劃器將沖突消息傳遞給協(xié)調(diào)器。協(xié)調(diào)器:通過接收規(guī)劃器傳來的沖突消息后,對所有沖突提出解決方案,其映射關(guān)系可表示為:Agents之間通過通信了解彼此的規(guī)劃并預(yù)測可能產(chǎn)生的沖突,本文中Agents間是基于消息傳遞模式來進行通信的。Agent通信的目的主要有以下幾種:接收任務(wù)、廣播局部規(guī)劃、接收沖突信息和發(fā)出沖突解決方案。新加入的Agent通過信息交互來探測原來系統(tǒng)中Agents的協(xié)商沖突,同時,它還要解決其自身規(guī)劃與已達成的協(xié)商之間的沖突。本文中,通過放寬原系統(tǒng)中Agents以及該新加入Agent的最不重要的部分局部規(guī)劃的約束來協(xié)調(diào)沖突。下面我們建立單個Agent的形式化模型,它可表示為一個三元組:<O,A,C>。其中,O表示該Agent的操作集,A表示該Agent的屬性集,C表示該Agent所要達到目標的約束集,即Agent的子任務(wù)集,每個子任務(wù)就是一個約束,并且子任務(wù)都是不可再分的。Agents在協(xié)商中采用優(yōu)先權(quán)原則,Agent對其每個部分局部規(guī)劃分配不同的優(yōu)先權(quán)。我們假設(shè)對于強制性約束的優(yōu)先權(quán)p=0,對于非強制性約束的優(yōu)先權(quán)設(shè)為p=1,2,…;優(yōu)先權(quán)的值越大,則該約束的重要性就越小。下面給出幾個概念:強制性部分局部規(guī)劃αP0={oαj∈Oα|oαj滿足約束cα,j,p(cα,j)=0};非強制性部分局部規(guī)劃Pαi={oαj∈Oα|oαj滿足約束cα,j,p(cα,j)=i};局部規(guī)劃αP=ki=∪0Pαi,即它是強制性部分局部規(guī)劃與非強制性部分局部規(guī)劃的并集。2.2基于局部沖突的開發(fā)當一個部分局部規(guī)劃協(xié)商失敗,Agent將根據(jù)策略分析部分局部規(guī)劃的整體效用,來決定是否移出該部分局部規(guī)劃,Agent的策略是優(yōu)先執(zhí)行Agent的強制性部分局部規(guī)劃,然后是非強制性部分局部規(guī)劃。該策略的意圖是:確保Agent協(xié)商的最低質(zhì)量而不是去重新尋找一個新的解決方案。假設(shè)有一Agents集Ag={a1,a2,…},這些Agents已經(jīng)就它們的規(guī)劃達成了協(xié)商,這時有一個新的Agent加入,這可能將破壞已達成的協(xié)商。因此,該新加入的Agent將收集所有的沖突信息,以便解決這些沖突。下面我們首先對沖突及其類型進行定義:定義1設(shè)有Agenta和Agentb,當Pa與Pb不一致時,我們稱Agenta與Agentb產(chǎn)生了沖突。定義2當新加入的Agent的強制性部分局部規(guī)劃與原多Agents系統(tǒng)中的某個Agent的局部規(guī)劃沖突,稱發(fā)生了硬沖突。定義3當新加入的Agent的非強制性部分局部規(guī)劃與原多Agents系統(tǒng)中的某個Agent的局部規(guī)劃沖突,稱產(chǎn)生了軟沖突。定義4當新加入的Agent的局部規(guī)劃與原多Agents系統(tǒng)中的某個Agent的強制性局部規(guī)劃沖突,稱產(chǎn)生了緊急沖突。定義5當新加入的Agent的局部規(guī)劃與原多Agents系統(tǒng)中的某個Agent的非強制性局部規(guī)劃沖突,稱產(chǎn)生了非緊急沖突。根據(jù)以上定義,我們可以將新加入的Agent(設(shè)為AgentN)的沖突分為以下四種類型:1)硬緊急沖突:當AgentN的強制性局部規(guī)劃與原多Agents系統(tǒng)中的某個Agent的強制性局部規(guī)劃沖突;2)硬非緊急沖突:當AgentN的強制性局部規(guī)劃與原多Agents系統(tǒng)中的某個Agent的非強制性局部規(guī)劃沖突;3)軟緊急沖突:當AgentN的非強制性局部規(guī)劃與原多Agents系統(tǒng)中的某個Agent的強制性局部規(guī)劃沖突;4)軟非緊急沖突:當AgentN的非強制性局部規(guī)劃與原多Agents系統(tǒng)中的某個Agent的非強制性局部規(guī)劃沖突;Agents間通過協(xié)商來解決沖突,并用規(guī)劃的效用函數(shù)進行衡量,通過比較效用函數(shù)的值來選擇效用函數(shù)值大的規(guī)劃。每個部分局部規(guī)劃都有其效用,這里考慮兩個方面的特性,即規(guī)劃的質(zhì)量和執(zhí)行規(guī)劃的代價,而規(guī)劃的質(zhì)量可以通過其完成規(guī)劃所獲得的獎賞來衡量。它們分別可用公式(1)~(3)表示:其中,Pai表示某個Agent的部分局部規(guī)劃,獎賞函數(shù)Reward(c)表示約束滿足時獲得的獎賞值,代價函數(shù)cost(o)表示執(zhí)行的時間。步進式策略按如下步驟執(zhí)行:step1對沖突集進行排序,Conflicts={硬緊急沖突,硬非緊急沖突,軟緊急沖突,軟非緊急沖突};step2if時限未到且Conflicts非空then{con=Head(Conflicts);//從沖突集中取出沖突Conflicts=Tail(Conflicts)//將新的沖突加入到?jīng)_突集中resolution(con);}//解決沖突;step3if時限已到而Conflicts非空,then拋棄Conflicts中的所有沖突;下面我們將介紹如何解決沖突:5)對硬緊急沖突:如果AgentN的強制性部分局部規(guī)劃的效用值大于原多Agents系統(tǒng)中的強制性部分局部規(guī)劃的整體效用值,AgentN將保持現(xiàn)有規(guī)劃并發(fā)出消息,這樣原多Agents系統(tǒng)中的Agents將放松對各自的部分局部規(guī)劃的約束,如果時間允許的話,它們將提出新的局部規(guī)劃,同時它們還將接收到有關(guān)AgentN的部分局部規(guī)劃時限的消息。相反,如果AgentN的強制性部分局部規(guī)劃的效用值小于原多Agents系統(tǒng)中的Agents的強制性部分局部規(guī)劃的整體效用值,則AgentN將接受這些部分局部規(guī)劃并返回接收消息,然后等待Agents的確認消息,但必須在AgentN的強制性部分局部規(guī)劃最后時限之前。6)對硬非緊急沖突:AgentN將維持它的強制性部分局部規(guī)劃而拒絕所有的非強制性部分局部規(guī)劃。7)對軟緊急沖突:AgentN將放松對它非強制性部分局部規(guī)劃約束或違反相應(yīng)的約束。8)對軟非緊急沖突:該沖突的解決方法與硬緊急沖突的解決方法大致相同,只是它是相對于非強制性部分局部規(guī)劃而言,這里不再累述了。我們可以看出,該沖突解決的方法是首先解決高優(yōu)先級別的沖突,以確保最重要的部分局部規(guī)劃能在最后時限之前執(zhí)行,同時,也確保了Agents的協(xié)商效率。3各局部規(guī)劃之間的協(xié)商我們通過實驗對PGP與PPGP進行了比較:在一個多機器人環(huán)境中,每個機器人都擁有一個基于時限的局部規(guī)劃P={p1,p2,p3,…},由于資源的不可共享性,各機器人要想在最后時限之前開始執(zhí)行其規(guī)劃,它們必須進行協(xié)商,以避免沖突。根據(jù)PPGP,首先對各部分局部規(guī)劃賦予不同的優(yōu)先級,設(shè)p(p1)=0,p(p2)=1,p(p3)=2,……,如此類推。這里p(p1)=0表示p1對于各機器人是強

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論