特征選擇法與蟻群算法簡介_第1頁
特征選擇法與蟻群算法簡介_第2頁
特征選擇法與蟻群算法簡介_第3頁
特征選擇法與蟻群算法簡介_第4頁
特征選擇法與蟻群算法簡介_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、特征選擇法與蟻群算法簡介簡介什么叫特征選擇? 經(jīng)典的特征選擇方法是從多個(gè)特征中選取一些特征,這個(gè)方法可以說包括特征選擇和特征提取兩個(gè)方面。特征提取廣義上指的是一種變換,將處于高維空間的樣本通過映射或變換的方式轉(zhuǎn)換到低維空間,達(dá)到降維的目的;特征選擇指從一組特征中去除冗余或不相關(guān)的特征來降維。這兩者常聯(lián)合使用,一般先通過變換將高維特征空間映射成低維特征空間,然后再去除冗余和不相關(guān)的特征來進(jìn)一步達(dá)到降維的目的。簡介為什么要用特征選擇算法為什么要用特征選擇算法? ? 獲取最優(yōu)特獲取最優(yōu)特征組合征組合提高測試數(shù)據(jù)提高測試數(shù)據(jù)的效率的效率減少系統(tǒng)計(jì)減少系統(tǒng)計(jì)算時(shí)間算時(shí)間更高的檢測率更高的檢測率更低的虛警

2、率更低的虛警率簡介特征選擇的步驟特征選擇的步驟原始特征集原始特征集產(chǎn)生特征集產(chǎn)生特征集評估子集評估子集停止準(zhǔn)則停止準(zhǔn)則結(jié)果驗(yàn)證結(jié)果驗(yàn)證不滿意特征組合滿意特征組合通過特征算法子集優(yōu)劣特征選擇分類根據(jù)特征子集形成方式分類:根據(jù)特征子集形成方式分類:特征選擇分類根據(jù)特征集合的評價(jià)策略方式分類:根據(jù)特征集合的評價(jià)策略方式分類:基于濾波(Filter)評價(jià)策略的特征選擇算法?;谇度胧?Wrapper)評價(jià)策略的特征選擇算法。常見的特征選擇算法1.1.遺傳算法遺傳算法 3 3. .螞蟻算法螞蟻算法2 2. .粒子群算法粒子群算法遺傳算法 遺傳算法(Genetic Algorithm): 是模擬達(dá)爾文生物

3、進(jìn)化論的自然選擇和遺傳學(xué)機(jī)理的生物進(jìn)化過程的計(jì)算模型,是一種通過模擬自然進(jìn)化過程搜索最優(yōu)解的方法。遺傳算法是從代表問題可能潛在的解集的一個(gè)種群開始的,而一個(gè)種群則由經(jīng)過基因編碼的一定數(shù)目的個(gè)體組成。每個(gè)個(gè)體實(shí)際上是染色體是染色體帶有特征的實(shí)體。染色體作為遺傳物質(zhì)的主要載體,即多個(gè)基因的集合,其內(nèi)部表現(xiàn)是某種基因組合,它決定了個(gè)體的形狀的外部表現(xiàn)。遺傳算法 遺傳算法的基本運(yùn)算過程如下: (1)初始化:設(shè)置進(jìn)化代數(shù)計(jì)數(shù)器t=0,設(shè)置最大進(jìn)化代數(shù)T,隨機(jī)生成M個(gè)個(gè)體作為初始群體P(0)。 (2)個(gè)體評價(jià):計(jì)算群體P(t)中各個(gè)個(gè)體的適應(yīng)度。 (3)選擇運(yùn)算:將選擇算子作用于群體。選擇的目的是把優(yōu)化的

4、個(gè)體直接遺傳到下一代或通過配對交叉產(chǎn)生新的個(gè)體再遺傳到下一代。選擇操作是建立在群體中個(gè)體的適應(yīng)度評估基礎(chǔ)上的。 (4)交叉運(yùn)算:將交叉算子作用于群體。遺傳算法中起核心作用的就是交叉算子。 (5)變異運(yùn)算:將變異算子作用于群體。即是對群體中的個(gè)體串的某些基因座上的基因值作變動(dòng)。 群體P(t)經(jīng)過選擇、交叉、變異運(yùn)算之后得到下一代群體P(t+1)。 (6)終止條件判斷:若t=T,則以進(jìn)化過程中所得到的具有最大適應(yīng)度個(gè)體作為最優(yōu)解輸出,終止計(jì)算。粒子群算法粒子群算法:也稱粒子群優(yōu)化算法(Particle Swarm Optimization,PSO),是由Eberhart 博士和kennedy 博士

5、提出,源于對鳥群捕食的行為研究 。該算法最初是受到飛鳥集群活動(dòng)的規(guī)律性啟發(fā),進(jìn)而利用群體智能建立的一個(gè)簡化模型。這個(gè)算法基于迭代的優(yōu)化算法。粒子群的每個(gè)個(gè)體都代表優(yōu)化問題的候選解,每個(gè)粒子具有位置x和速度v兩個(gè)特征,位置代表候選解的值,速度用于決定粒子在搜素空間迭代的位移。粒子對應(yīng)的目標(biāo)函數(shù)值作為粒子的適應(yīng)度f,候選解的優(yōu)劣程度由該適應(yīng)度決定。粒子群算法 基于粒子群優(yōu)化算法的特征選擇的算法步驟如下: (1)粒子群初始化。 (2)對粒子群每個(gè)粒子計(jì)算適應(yīng)值,適應(yīng)值與最優(yōu)解的距離直接有關(guān)。 (3)種群根據(jù)適應(yīng)值進(jìn)行復(fù)制。 (4)如果終止條件滿足的話,就停止,否則轉(zhuǎn)步驟(2)。蟻群算法蟻群算法-蟻群

6、算法起源蟻群算法起源 螞蟻屬于群居昆蟲單個(gè)螞蟻的行為極其簡單,但由這樣的單個(gè)簡單的個(gè)體所組成的蟻群群體卻表現(xiàn)出極其復(fù)雜的行為,能夠完成復(fù)雜的任務(wù)。蟻群算法起源蟻群算法起源 螞蟻覓食螞蟻沒有發(fā)育完全的視覺感知系統(tǒng),甚至很多種類完全沒有視覺,他們在尋找食物的過程中是如何選擇路徑的呢?蟻群是如何完成這些復(fù)雜的任務(wù)的呢? 人們經(jīng)過大量研究發(fā)現(xiàn),螞蟻個(gè)體之間是通過一種稱之為外激素(pheromone) 的物質(zhì)進(jìn)行信息傳遞. 從而能相互協(xié)作,完成復(fù)雜的任務(wù). 蟻群之所以表現(xiàn)出復(fù)雜有序的行為,個(gè)體之間的信息交流與相互協(xié)作起著重要的作用.蟻群算法起源蟻群算法起源螞蟻在運(yùn)動(dòng)過程中, 能夠在它所經(jīng)過的路徑上留下外

7、激素,而且螞蟻在運(yùn)動(dòng)過程中能夠感知外激素的存在及其強(qiáng)度,并以此指導(dǎo)自己的運(yùn)動(dòng)方向, 螞蟻傾向于朝著外激素強(qiáng)度高的方向移動(dòng).由大量螞蟻組成的蟻群的集體行為便表現(xiàn)出一種信息正反饋現(xiàn)象: 某一路徑上走過的螞蟻越多,則后來者選擇該路徑的概率就越大. 螞蟻個(gè)體之間就是通過這種信息的交流達(dá)到搜索食物的目的。蟻群算法起源蟻群算法起源 20世紀(jì)50年代中期創(chuàng)立了仿生學(xué),人們從生物進(jìn)化的機(jī)理中受到啟發(fā)。提出了許多用以解決復(fù)雜優(yōu)化問題的新方法,如進(jìn)化規(guī)劃、進(jìn)化策略、遺傳算法等,這些算法成功地解決了一些 實(shí)際問題。1991年意大利米蘭理學(xué)院M. Dorigo提出Ant System, 用于求解TSP等組合優(yōu)化問題。

8、1995年Gramdardella和Dorigo提出Ant-Q算法,建立了AS和Q-learning的聯(lián)系。1996年二人又提出Ant Colony System1997年有人提出Max-Min Ant System1999年Dorigo等人把先前各種算法歸結(jié)為Ant Colony Optimization meta-heuristic的統(tǒng)一框架下,給出抽象而規(guī)范的算法描述.目前,被較廣泛的應(yīng)用DorigoDorigo蟻群算法-雙橋?qū)嶒?yàn)最終最終有有80%-100%的螞蟻選擇較短的橋。的螞蟻選擇較短的橋。簡化的螞蟻尋食過程螞蟻從A A點(diǎn)出發(fā),速度相同,食物在D D點(diǎn),可能隨機(jī)選擇路線ABDABD

9、或ACDACD。假設(shè)初始時(shí)每條分配路線一只螞蟻,每個(gè)時(shí)間單位行走一步, 本圖為經(jīng)過9 9個(gè)時(shí)間單位時(shí)的情形:走ABDABD的螞蟻到達(dá)終點(diǎn),而走ACDACD的螞蟻剛好走到C C點(diǎn),為一半路程。簡化的螞蟻尋食過程本圖為從開始算起,經(jīng)過1818個(gè)時(shí)間單位時(shí)的情形:走ABDABD的螞蟻到達(dá)終點(diǎn)后得到食物又返回了起點(diǎn)A A,而走ACDACD的螞蟻剛好走到D D點(diǎn)。 假設(shè)螞蟻每經(jīng)過一處所留下的信息素為一個(gè)單位,則經(jīng)過3636個(gè)時(shí)間單位后,所有開始一起出發(fā)的螞蟻都經(jīng)過不同路徑從D D點(diǎn)取得了食物,此時(shí)ABDABD的路線往返了2 2趟,每一處的信息素為4 4個(gè)單位,而ACDACD的路線往返了一趟,每一處的信息

10、素為2 2個(gè)單位,其比值為2 2:1 1。 尋找食物的過程繼續(xù)進(jìn)行,則按信息素的指導(dǎo),蟻群在ABDABD路線上增派一只螞蟻(共2 2只),而ACDACD路線上仍然為一只螞蟻。再經(jīng)過3636個(gè)時(shí)間單位后,兩條線路上的信息素單位積累為1212(4+44+4* *2 2)和4 4(2 2* *2 2),比值為3 3:1 1。 若按以上規(guī)則繼續(xù),蟻群在ABDABD路線上再增派一只螞蟻(共3 3只), 而ACDACD路線上仍然為一只螞蟻。再經(jīng)過3636個(gè)時(shí)間單位后,兩條線路上的信息素單位積累為2424(4+44+4* *2+42+4* *3 3)和6 6(2 2* *3 3),比值為4 4:1 1。 若

11、繼續(xù)進(jìn)行,則按信息素的指導(dǎo),最終所有的螞蟻會放棄ACDACD路線而選擇ABDABD路線。簡化的螞蟻尋食過程簡化的螞蟻尋食過程 基于以上蟻群尋找食物時(shí)的最優(yōu)路徑選擇問題,可以構(gòu)造人工蟻群,來解決最優(yōu)化問題,如TSP問題。 人工蟻群中把具有簡單功能的工作單元看作螞蟻。二者的相似之處在于都是優(yōu)先選擇信息素濃度大的路徑。較短路徑的信息素濃度高,所以能夠最終被所有螞蟻選擇,也就是最終的優(yōu)化結(jié)果。 人工蟻群和自然蟻群的區(qū)別:人工蟻群有一定的記憶能力,能夠記憶已經(jīng)訪問過的節(jié)點(diǎn); 人工蟻群選擇下一條路徑的時(shí)候是按一定算法規(guī)律有意識地尋找最短路徑,而不是盲目的。例如在TSP問題中,可以預(yù)先知道當(dāng)前城市到下一個(gè)目

12、的地的距離。自然界螞蟻覓食行為自然界螞蟻覓食行為蟻群優(yōu)化算法蟻群優(yōu)化算法覓食空間覓食空間問題的搜索空間問題的搜索空間搜索空間的一組搜索空間的一組有效解有效解一個(gè)有效解一個(gè)有效解問題的最優(yōu)解問題的最優(yōu)解蟻群蟻群蟻巢到食物的一條路徑蟻巢到食物的一條路徑找到的最短路徑找到的最短路徑對對應(yīng)應(yīng)關(guān)關(guān)系系信息素信息素信息素濃度變量信息素濃度變量蟻群優(yōu)化算法基本流程 TSPTSP問題的人工蟻群算法中,假設(shè)m m只螞蟻在圖的相鄰節(jié)點(diǎn)間移動(dòng),從而協(xié)作異步地得到問題的解。每只螞蟻的一步轉(zhuǎn)移概率由圖中的每條邊上的兩類參數(shù)決定:1 1 信息素值也稱信息素痕跡。2 2 可見度,即先驗(yàn)值。 信息素的更新方式有2 2種,一是

13、揮發(fā),也就是所有路徑上的信息素以一定的比率進(jìn)行減少,模擬自然蟻群的信息素隨時(shí)間揮發(fā)的過程;二是增強(qiáng),給評價(jià)值“好”( (有螞蟻?zhàn)哌^) )的邊增加信息素。 螞蟻向下一個(gè)目標(biāo)的運(yùn)動(dòng)是通過一個(gè)隨機(jī)原則來實(shí)現(xiàn)的,也就是運(yùn)用當(dāng)前所在節(jié)點(diǎn)存儲的信息,計(jì)算出下一步可達(dá)節(jié)點(diǎn)的概率,并按此概率實(shí)現(xiàn)一步移動(dòng),逐此往復(fù),越來越接近最優(yōu)解。 螞蟻在尋找過程中,或者找到一個(gè)解后,會評估該解或解的一部分的優(yōu)化程度,并把評價(jià)信息保存在相關(guān)連接的信息素中。蟻群優(yōu)化算法基本流程 對于每只螞蟻k,路徑記憶向量Rk按照訪問順序記錄了所有k已經(jīng)經(jīng)過的城市序號。設(shè)螞蟻k當(dāng)前所在城市為i,則其選擇城市j作為下一個(gè)訪問對象的概率如上式。J

14、k(i)表示從城市i可以直接到達(dá)的、且又不在螞蟻訪問過的城市序列Rk中的城市集合。h(i, j)是一個(gè)啟發(fā)式信息(信息素濃度變量),通常由 h (i, j)=1/dij直接計(jì)算。t(i, j)表示邊(i, j)上的信息素量。 ( )( , )( , ), if ( )( , )( , )( , ) 0, otherwisekkku Jii ji jjJipi ji ui uthth蟻群優(yōu)化算法基本流程 ( )( , )( , ), if ( )( , )( , )( , ) 0, otherwisekkku Jii ji jjJipi ji ui uthth為了模擬螞蟻在較短路徑上留下更多的信

15、息素,當(dāng)所有螞蟻到達(dá)終點(diǎn)時(shí),必須把各路徑為了模擬螞蟻在較短路徑上留下更多的信息素,當(dāng)所有螞蟻到達(dá)終點(diǎn)時(shí),必須把各路徑的信息素的信息素濃度濃度重新更新一次,信息素的更新也分為重新更新一次,信息素的更新也分為兩個(gè)步驟:兩個(gè)步驟: (1) (1)每每一輪過后,問題空間中的所有路徑上的信息素都會發(fā)生一輪過后,問題空間中的所有路徑上的信息素都會發(fā)生蒸發(fā)蒸發(fā) (2) (2)所有所有的螞蟻根據(jù)自己構(gòu)建的路徑長度在它們本輪經(jīng)過的邊上釋放信息素的螞蟻根據(jù)自己構(gòu)建的路徑長度在它們本輪經(jīng)過的邊上釋放信息素11( , )(1)( , )( , ),(), if ( , ) ( , ) 0, otherwisemkkk

16、kki ji ji jCi jRi jtttt信息素更新的作用信息素?fù)]發(fā)(evaporation)信息素痕跡的揮發(fā)過程是每個(gè)連接上的信息素痕跡的濃度自動(dòng)逐漸減弱的過程,這個(gè)揮發(fā)過程主要用于避 免算法過快地向局部最優(yōu)區(qū)域集中,有助于搜索區(qū)域的擴(kuò)展。信息素增強(qiáng)(reinforcement)增強(qiáng)過程是蟻群優(yōu)化算法中可選的部分,稱為離線更新方式(還有在線更新方式)。這種方式可以實(shí)現(xiàn) 由單個(gè)螞蟻無法實(shí)現(xiàn)的集中行動(dòng)?;鞠伻核惴ǖ碾x線更新方式是 在蟻群中的m只螞蟻全部完成n城市的訪問后,統(tǒng)一對殘留信息進(jìn)行更新處理。TSPTSP問題的蟻群優(yōu)化算法偽代碼for for each edgeset t0 = m/

17、Cnn (initial pheromone value )while while not stopfor for each ant krandomly choose an initial cityfor for i = 1 to nchoose next city j with probabilitycompute the length Ck of the tour constructed by the kth antfor for each edge update the pheromone valueprint resultTSP舉例四個(gè)城市的TSPTSP問題,距離矩陣和城市圖示如下:假

18、設(shè)共m m=3=3只螞蟻,參數(shù)=1=1,=2=2,=0.5=0.5312354152242ijWdABDC241523步驟1首先使用貪婪算法得到路徑的(ACDBA), 則Cnn =1+2+4+3=10,求得0 =m/Cnn =0.3。初始化所有邊上的信息素含量。步驟2 .1為每個(gè)螞蟻隨機(jī)選擇出發(fā)城市,假設(shè)螞蟻1選擇城市A,螞蟻2選擇城市B,螞蟻3選擇城市D。為每個(gè)螞蟻選擇下一訪問城市,僅以螞蟻1為例,當(dāng)前城市i=A,可訪問城市集合j1 (i)=B,C,D,計(jì)算螞蟻1訪問各個(gè)城市的概率。312354152242ijWdABDC241523121212:0.3(1/3)0.033:0.3(1/1)0.3:0.3(1/2)0.075ABABACACADADBACDththth3123

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論