版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一、綜述題以蟻群算法及其應(yīng)用為題,撰寫一個讀書報告。要求通過廣泛查閱國內(nèi)外文獻(xiàn),撰寫讀書報告。蟻群算法及其應(yīng)用 1 引言蟻群優(yōu)化算法,簡稱為蟻群算法,由Marco Dorigo和他的同事首先提出來,作為一種多Agent的方法,很好地解決了一些復(fù)雜的組合優(yōu)化問題,如旅行商問題(Traveling Salesman Problem)和指派問題(quadratic assignment problem),目前已經(jīng)有很多種基于蟻群算法或其改進(jìn)算法應(yīng)用于各種不同的離散優(yōu)化問題,這些研究已經(jīng)涵蓋了車輛路徑規(guī)劃(vehicle routing),順序訂貨(sequential ordering),地圖著色(
2、graph coloring)以及網(wǎng)絡(luò)中的路由通信問題。2 蟻群算法的基本原理蟻群系統(tǒng)本來是生物學(xué)家為更好揭示昆蟲的交互作用而提出的一種昆蟲自組織模式。盡管建立這種模式的初衷是為了幫助人們?nèi)ダ斫膺@類昆蟲的復(fù)雜行為,螞蟻也不可能從這些解釋中獲益,但是數(shù)學(xué)及計算機方面的專家和工程師卻把這種超越生物本身的模型轉(zhuǎn)化成了一項有用的優(yōu)化和控制算法。蟻群優(yōu)化,是該系統(tǒng)的核心內(nèi)容,其原理可大致描述如下:螞蟻屬于群居昆蟲,個體行為極其簡單,而群體行為卻相當(dāng)復(fù)雜。相互協(xié)作的一群螞蟻很容易找到從蟻巢到食物源的最短路徑,而單個螞蟻則不能。此外,螞蟻還能夠適應(yīng)環(huán)境的變化,例如在蟻群的運動路線上突然出現(xiàn)障礙物時,它們能夠
3、很快地重新找到最優(yōu)路徑。人們通過大量的研究發(fā)現(xiàn),螞蟻個體之間是通過在其所經(jīng)過的路上留下一種可稱之為“ 信息素”(pheromone)的物質(zhì)來進(jìn)行信息傳遞的,隨后的螞蟻遇到信息素時,不僅能檢測出該物質(zhì)的存在以及量的多少,而且可根據(jù)信息素的濃度來指導(dǎo)自己對前進(jìn)方向的選擇。同時,該物質(zhì)隨著時間的推移會逐漸揮發(fā)掉,于是路徑的長短及該路徑上通過的螞蟻的多少就對殘余信息素的強度產(chǎn)生影響,反過來信息素的強弱又指導(dǎo)著其它螞蟻的行動方向。因此,某一路徑上走過的螞蟻越多,則后來者選擇該路徑的概率就越大。這就構(gòu)成了螞蟻群體行為表現(xiàn)出的一種信息正反饋現(xiàn)象。螞蟻個體之間就是通過這種信息交流達(dá)到最快捷搜索到食物源的目的。
4、圖1能更具體地說明蟻群系統(tǒng)的原理。圖1 蟻群優(yōu)化系統(tǒng)示意圖圖A中設(shè)是蟻巢,E是食物源,H、C為障礙物,距離為d。由于障礙物的存在由A外出覓食或由E返回巢穴的螞蟻只能經(jīng)由H或C到達(dá)目的地。假設(shè)螞蟻以“1單位長度/單位時間”的速度往返于A和E,每經(jīng)過一個單位時間各有30只螞蟻離開A和E到達(dá)B和D圖(圖1a)。初始時,各有30只螞蟻在B和D點遇到障礙物,開始選擇路徑。由于此時路徑上無信息素,螞蟻便以相同的概率隨機地走兩條路中的任意一條,因而15只選往C,15只選往H圖(1b)。經(jīng)過一個單位時間以后,路徑BCD被30只螞蟻爬過,而路徑BHD上則只被15只螞蟻爬過(因BCD距離為1而BHD距離為2),B
5、CD上的信息量是BHD上信息量的兩倍。此時,又有30只螞蟻離開B和D,于是各20只選擇往C方向,而另外各10只則選往H方向圖(1c)。這樣,更多的信息素量被留在更短的路徑BCD上。隨著時間的推移和上述過程的重復(fù),短路徑上的信息量便以更快的速度增長,于是會有越來越多的螞蟻選擇這條短路徑,以致最終完全選擇這條短路徑。圖2為通用蟻群算法的框架圖2 通用蟻群算法框架3 應(yīng)用3.1 旅行商(TSP)問題3.1.1 問題描述旅行商問題最常見的通俗解釋為,一位推銷員從自己所在城市出發(fā),必須遍訪所有城市之后又回到原來的城市,求使其旅費最少的路徑。3.1.2 問題解決通常在介紹蟻群算法時都是以TSP問題為例來介
6、紹的,這里不再贅述。在多數(shù)的算法中都存在一個啟發(fā)信息函數(shù)ij,稱之為能見度函數(shù)。一個簡明的處理方法就是令ij=1/d ij。3.2 作業(yè)調(diào)度問題3.2.1 問題描述作業(yè)調(diào)度問題(Job-shop Scheduling Problem,JSP)是一種資源分配問題。這里的資源主要是指設(shè)備資源,問題的求解目標(biāo)是要找到一個將一組工件安排到設(shè)備上去,以使作業(yè)可為“最優(yōu)”完成的方案。每個作業(yè)可由一些任務(wù)完成,而每個任務(wù)必須由特定的設(shè)備處理。一個調(diào)度是指按先后順序條件將所有任務(wù)安排到設(shè)備上的一種方案。通常,約束的數(shù)目很大,其基本約束條件為:每道工序必須在它指定的機器上加工;同一時刻同一臺機器只能加工一個零件
7、;每道工序必須在它前面的工序加工完畢后才能加工;每道工序一旦開始加工,在完成之前不允許中斷。下面給出的是一個作業(yè)調(diào)度問題的描述:n個作業(yè)J l,J 2,J n在m臺機器M1 ,M2,M m上加工,每個作業(yè)的加工路線不同。設(shè)N為工序的集合,工序的加工時間為d i,工序的開始時間為t t,在機器k上相鄰工序?qū)?表示相鄰工序在機器k上加工的前后順序)的集合為E k,具有工藝約束偏序關(guān)系的工序(作業(yè)內(nèi)部工序之間的工藝要求)的集合為A。要確定滿足上述約束條件的n個作業(yè)的加工順序,使得最后完工作業(yè)的完工時間 (makespan) C max最小,C max的計算如下:3.2.2 問題解決利用析取圖模型生成
8、析取圖,其基本單位是“作業(yè)”,令每一只螞蟻一次走完所有工序。螞蟻尋找最優(yōu)路徑的過程是螞蟻遍歷圖的過程。下面以一個3個作業(yè)2臺機器的JSP問題為例來說明。結(jié)點0和結(jié)點7是虛結(jié)點,表示開始工序和結(jié)束工序。兩臺機器的作業(yè)結(jié)點集合分別是N1=l,4,6,N2=2,3,5。圖3中的合取弧(表示為單箭頭),表示了具有工藝約束偏序關(guān)系的工序?qū)?。在機器N1上加工工序?qū)Φ募螮l為(l,4),(6,4),(l,6),在機器N2上加工工序?qū)Φ募螮Z為(2,3),(2,5),(3,5)。當(dāng)各臺機器上的工序的加工順序確定后,最終的析取圖(圖4)也就確定下來了。在解的構(gòu)造過程中,相對于求解TSP的過程來說,除了禁忌表
9、外,這里增添了一個“下一步允許訪問的結(jié)點的集合”,這是由有工藝約束偏序關(guān)系的工序?qū)Q定的。所有的螞蟻都從開始工序出發(fā),終止于結(jié)束工序;相對于TSP過程來說,初始的螞蟻則可以隨機地分布在任意的結(jié)點上,并終止于該結(jié)點。其余過程均類似于TSP問題。 圖3 3個作業(yè)2臺機器的析取圖 圖4 確定機器加工工序的析取圖3.3 二次分配問題二次分配問題(Quadratic Assignment Problem, QAP)是繼TSP后,蟻群算法在組合優(yōu)化問題領(lǐng)域的又一個重要應(yīng)用。目前針對QAP的算法多是利用QAP和TSP的相似性而對求解TSP的螞蟻算法的推廣,并針對QAP問題的自身特點對算法做了相應(yīng)的調(diào)整。QA
10、P是將n個設(shè)備指派到n個地點,地點i和j ( i , j = 1,2,n;ij)之間的距離為d ij,設(shè)備r和s( r, s=1,2,n; rs)之間的流量為a ij。記為n個非重復(fù)的自然數(shù)1,2,n的一個排列,排列中的第i個數(shù)值(i)表示設(shè)備i被指派到位置(i),記全部排列的集合為S( n),則QAP問題就是尋找*S(n),使得f(*)極??;在應(yīng)用蟻群算法求解QAP時,首先將n個設(shè)備進(jìn)行排列,然后根據(jù)排列順序依次為每個設(shè)備選擇一個地點。在蟻群算法模型中,圖G中結(jié)點集合C由n個地點組成,邊的集合L為所有節(jié)點的全連接,信息素濃度ij對應(yīng)設(shè)備i被指派到位置j,人工螞蟻隨機地選擇圖G中的某個節(jié)點出發(fā)
11、,走訪每個節(jié)點一次后完成一個解的構(gòu)造過程。對于設(shè)備i,其選擇位置j的概率計算方法如下:式中:ij的值為目標(biāo)函數(shù)值下的倒數(shù)。信息素濃度ij的更新方法同蟻周算法類似,局部搜索算法采用禁忌搜索算法。3.4 車輛路徑問題3.4.1 問題描述 車輛路徑問題(Vehicle Routing Problem ,VRP)是一類交通運輸優(yōu)化問題,具體而言則存在著各種各樣的VRP問題。Bullnheimer,Hartl和Strauss等人用螞蟻算法解決了一個VRP問題,其表示如下:通過車輛的調(diào)度,使車輛的總行程最短。 G=( V, A, d)是一個完全有向權(quán)圖(complete weighted directed
12、 graph),其中V=v0,v1,v2,vn是頂點的集合,A=(vi,vj);ij是連接頂點的弧的集合。頂點v0表示庫房,而V中其余的頂點則表示為城市或客戶,與弧(vi,vj)相關(guān)聯(lián)的非負(fù)權(quán)值dij表示為頂點vi和vj之間的距離(或者為旅行時間,或者為旅行費用)。對每一個客戶vi而言,都有一個確定的非負(fù)的需求qi和一個非負(fù)的服務(wù)時間i(q0=0,i=0)最終的目標(biāo)是尋找一條最小費用的路徑,同時滿足:每個客戶被一輛車輛訪問的次數(shù)為一次僅且一次;所有的車輛都從庫房出發(fā),最后返回至庫房;對每一條車輛路徑,其總需求量都不能超過車輛的載重量Q;對每一條車輛路徑,其路徑長度(或服務(wù)時間等)不超過一個給定
13、的上界L。3.4.2 解決方法在蟻群算法中,螞蟻在節(jié)點間的轉(zhuǎn)移概率被定義為:對應(yīng)的能見度啟發(fā)函數(shù)則定義為:其中g(shù)和f是兩個新引入的參數(shù)。信息素路徑修改的方法如下:其中是路徑信息素的揮發(fā)系數(shù),其機理類似于ASrank:如果排名第µ位的螞蟻經(jīng)過弧(Vi,Vj),則相應(yīng)的信息素軌跡的增量uij等于(-)/L,否則為零。另外,如果弧屬于已知的最優(yōu)路徑L*,則相應(yīng)的還要增加信息素*ij,其中*ij等于1/L*。3.5 多選擇背包問題3.5.1 問題描述多選擇背包問題(Multiple Knapsack Problem, MKP)定義為有附加約束的背包問題,該問題帶有互不相關(guān)的多選擇約束。該問題
14、的一般性描述如下:有一個承重有限的背包,將要放入背包的物品被分為相互排斥的若干類。每類中有若干不同的項目。問題就是從每類中選擇一個項目使得項目總重量在滿足背包承重約束的前提下最小化費用,問題如圖5所示。圖5 背包問題示例3.5.2 解決方法 類似TSP問題的解決方法,首先進(jìn)行圖的構(gòu)造。Gc= (C, L),圖中的結(jié)點C代表的是集合中的項目,邊L則是集合中所有項目的全連接。每個項目的費用則賦給相應(yīng)的結(jié)點。在螞蟻行進(jìn)的過程中,其釋放的信息素i也是針對即將納入解中的結(jié)點i。蟻群算法在節(jié)點間的概率轉(zhuǎn)移公式為:啟發(fā)函數(shù)j的選擇有多種,信息素軌跡的修改方法和普通的蟻群算法相同。解的構(gòu)造過程中,每只螞蟻在根
15、據(jù)由信息素所決定的概率來選擇下一個節(jié)點,每次循環(huán)添加一個節(jié)點,直到在滿足約束條件的情況下不能再添加節(jié)點時才結(jié)束。這將導(dǎo)致螞蟻所經(jīng)過的路徑長度是不等的,不同的螞蟻所產(chǎn)生的解的長度也可能是不等的。3.6 網(wǎng)絡(luò)路由問題蟻群算法在動態(tài)組合優(yōu)化問題中的應(yīng)用主要集中在網(wǎng)絡(luò)通信方面,特別是網(wǎng)絡(luò)路由選擇問題(Network Routing Problem ,NRP)上。網(wǎng)絡(luò)路由選擇問題可以簡單描述為在一個代表通信網(wǎng)絡(luò)的全連接圖中求解任何兩個節(jié)點的最短路徑問題。雖然在靜態(tài)環(huán)境下該問題可以通過多項式算法求解,但在節(jié)點間流量(邊的權(quán)重)隨時間變化情況下,該問題的求解變得非常困難。針對網(wǎng)絡(luò)路由問題設(shè)計了算法AntNe
16、t。與一般蟻群算法不同,在AntNet中,對于任一有向弧(i , j),有N-1個信息素濃度值ijd0,1,d=1,2,N且di與之對應(yīng),ijd代表從節(jié)點i到達(dá)目的節(jié)點d時有向弧(i,j)上的信息素濃度。與弧(i,j)相對應(yīng)的還有啟發(fā)優(yōu)先權(quán)系數(shù)ij ,其值可以根據(jù)當(dāng)前時刻由節(jié)點i向節(jié)點j待發(fā)送的數(shù)據(jù)隊列長度計算,等待隊列越短,ij值越大。算法中每個螞蟻有一個源節(jié)點s和目的節(jié)點d,在轉(zhuǎn)移過程中,處于節(jié)點i的螞蟻k根據(jù)由ijd和ij計算的概率值選擇下一節(jié)點j。在構(gòu)造由s到d的路徑過程中,螞蟻經(jīng)歷與數(shù)據(jù)轉(zhuǎn)移同樣的延遲時間。因此,螞蟻由s到達(dá)d所經(jīng)歷的時間Tsd可以用作對該路徑質(zhì)量的評價。當(dāng)螞蟻k完成
17、一次路徑構(gòu)造過程后,根據(jù)該路徑的質(zhì)量對其所經(jīng)過弧上的信息素濃度進(jìn)行更新,而對于在路徑構(gòu)造過程中未經(jīng)過弧的信息素濃度進(jìn)行揮發(fā)計算。前面所述的主要是針對蟻群算法本身進(jìn)行的研究,下面介紹的是將成熟的方法應(yīng)用于各自不同特定的領(lǐng)域。電力系統(tǒng)優(yōu)化是一個復(fù)雜的系統(tǒng)工程,它包括無功優(yōu)化、經(jīng)濟負(fù)荷分配、電網(wǎng)優(yōu)化及機組最優(yōu)投入等一系列問題,其中很多是高維、非凸、非線性的優(yōu)化問題。Hou等人將蟻群算法成功地用于解決經(jīng)濟負(fù)荷分配問題;王志剛等則解決了該算法在配電網(wǎng)優(yōu)化規(guī)劃中的初步設(shè)計問題?;炝餮b配線是JIT (Just In Time )生產(chǎn)方式的具體應(yīng)用之一,它可以在不增加產(chǎn)品庫存條件下滿足用戶多樣化的需求?;炝餮b
18、配線有時也特指混合車型組裝線,即在一定時間內(nèi),在一條生產(chǎn)線上根據(jù)顧客需求的變化生產(chǎn)出各種不同型號的產(chǎn)品這一類問題同屬生產(chǎn)調(diào)度問題。孫新宇等人用蟻群算法解決了混流裝配線調(diào)度問題。機器人路徑規(guī)劃就是在障礙有界空間內(nèi)找到一條從出發(fā)點到目標(biāo)位置的無碰撞且能滿足一些特定要求的滿意路徑。近幾年許多學(xué)者開始用蟻群算法在這方面進(jìn)行了一系列出色的研究工作。為有效地解決機器人避障問題,并擴展其對具體問題的適應(yīng)性,在蟻群算法中通過調(diào)整避障系數(shù),可以得到不同的優(yōu)化軌跡。樊曉平等對復(fù)雜環(huán)境下的機器人路徑規(guī)劃進(jìn)行了初步嘗試,但更多的工作有待進(jìn)一步展開。電纜管線敷設(shè)問題與TSP問題類似。要求每一根電纜在從電纜連接起點設(shè)備開
19、始,通過不同的通道、豎井至電纜連接終端,連接起來的電纜所經(jīng)路徑最合理且總長度最短。鑒于整個電廠電纜路徑所形成的網(wǎng)絡(luò)相互交叉,敷設(shè)系統(tǒng)紛繁復(fù)雜,為此將互相獨立又相關(guān)的樹分解一個個小的蟻群系統(tǒng),用于解決發(fā)電廠計算機電纜敷設(shè)系統(tǒng)的復(fù)雜性等問題,獲得了比較理想的結(jié)果。在動態(tài)組合優(yōu)化問題中,網(wǎng)絡(luò)路由是一個典型的應(yīng)用示例。國際上Schoonder-werd等人首先將蟻群算法應(yīng)用于路由問題,國內(nèi)張素兵、劉澤民等人提出了基于螞蟻算法的QoS ( Quality of Service)路由調(diào)度方法及分段QoS路由調(diào)度方法。在分析路由問題時,顧軍華等人用螞蟻算法研究解決包含帶寬、延時、延時抖動、包丟失率和最小花費
20、等約束條件在內(nèi)的QoS組播路由問題,效果優(yōu)于模擬退火算法及遺傳算法。此外,蟻群算法還在數(shù)據(jù)挖掘、圖像處理、分析化學(xué)、巖石力學(xué)等領(lǐng)域的應(yīng)用取得了很大進(jìn)展。4 結(jié)語蟻群算法是一種原理相對簡單的新興仿生進(jìn)化算法,在許多領(lǐng)域已展現(xiàn)出它的優(yōu)勢和魅力。首先,它易于控制陷入局部最優(yōu)的情況,能以最大的概率找到全局最優(yōu)解;其次,具有貪婪啟發(fā)算法的特征使系統(tǒng)在搜索過程的早期就可以找到接收的解答;再次,由于其本質(zhì)上的并行性,一群算法并行實現(xiàn)成為一個研究方向,這將非常適用于巨量并行機。一群算法把每個個體看作一個Agent,體現(xiàn)的是“群體智能”的模式,每個個體具有相同的特性和能力,并通過信息素彼此通訊,有些研究已在考慮
21、給個體賦予一定的智能,例如賦予學(xué)習(xí)能力,或者對螞蟻進(jìn)行分工,這是蟻群算法的一個發(fā)展方向。另外,由于蟻群算法是以分布式的同優(yōu)化計算方式為特征的,所以,對算法的并行機實現(xiàn)和協(xié)同計算也已應(yīng)該是一個研究的方向??傊伻核惴ㄗ鳛橐环N新興研究領(lǐng)域,處于人工生命與運籌學(xué)的交叉位置,將會得到不斷深入的研究,其模型將會更豐富,也將會得到更加廣泛的應(yīng)用。二、編程題編程實現(xiàn)寬度優(yōu)先搜索、深度優(yōu)先搜索、等代價搜索、啟發(fā)式搜索中的一種搜索方法,并實現(xiàn)八數(shù)碼難題的求解。要求提交偽代碼形式的算法說明及實驗步驟和結(jié)果說明。深度優(yōu)先搜索與八數(shù)碼求解主函數(shù) Chess * Begin,Target,* T; 設(shè)定目標(biāo)棋盤Tar
22、get:1 2 3,8 0 4,7 6 5 獲取初始棋盤Begin:Begin=RandomChess(&Target);判斷Begin 和Target有幾處不同:Appraisal(Begin,&Target); Begin->Parent=NULL; Begin->BelockDirec=None; Target.Value=0; 打印目標(biāo)棋盤;打印初始棋盤;調(diào)用圖深度搜索T=Search(Begin,&Target); If搜索成功 把搜索路徑倒序 打印搜索結(jié)果Else搜索不成功打印“搜索不到結(jié)果.深度為Max_Step”深度搜索函數(shù)Struct Ch
23、ess * Search(struct Chess* Begin,struct Chess * Target) ;Chess * p1,*p2,*p;深度Step=0; p=NULL;queue<struct Chess *> Queue1; 存儲初始棋盤節(jié)點到待處理隊列Queue1.push(Begin);搜索: do p1=(struct Chess *)Queue1.front(); Queue1.pop(); 分別從四個方向推導(dǎo)出新子節(jié)點 跳過屏蔽方向:if(Direct=p1->BelockDirec) ;繼續(xù); 調(diào)用移動數(shù)碼函數(shù): p2=MoveChess(p1,
24、Direct,true) if(p2!=p1) 調(diào)用估價函數(shù)對新節(jié)點估價Appraisal(p2,Target) if p2是為優(yōu)越節(jié)點 p2->Parent=p1; 設(shè)置屏蔽方向,防止往回推switch(Direct) case Up:p2->BelockDirec=Down;break; case Down:p2->BelockDirec=Up;break; case Left:p2->BelockDirec=Right;break; case case Right:p2->BelockDirec=Left;break; 存儲節(jié)點到待處理隊列Queue1.pu
25、sh(p2) If p2為0,則搜索完成 else p2不為0,則將p2作為劣質(zhì)節(jié)點拋棄 深度step加1 If Step>Max_Step,則返回NULL; while(p=NULL | Queue1.size()<=0); 返回 p;估價函數(shù)int Appraisal(struct Chess * TheChess,struct Chess * Target) 初始化Value為0; 逐行逐列逐元素比較TheChess與目標(biāo)棋盤的不同 if一個不同;Value+; TheChess->Value=Value; 返回Value值移動棋盤數(shù)碼 struct Chess * M
26、oveChess(struct Chess * TheChess,Direction Direct,bool CreateNewChess) struct Chess * NewChess; 獲取空閑格位置,得到空格位置的行列號i,j移動數(shù)字初始化t_i=i,t_j=j; switch(Direct) case 往上: t_i加1; if(t_i>=3) 則AbleMove=false; break; case 往下: t_i減1; if(t_i<0) 則 AbleMove=false; break; case 往左: t_j加1; if(t_j>=3) 則AbleMove=
27、false; break; case 往右: t_j減1; if(t_j<0) 則 AbleMove=false; break; if(!AbleMove) 不可以移動則返回原節(jié)點TheChess; if(CreateNewChess)建立移動后的新棋盤NewChess 返回NewChess;初始化一個初始棋盤struct Chess * RandomChess(const struct Chess * TheChess) M=40隨機移動棋盤步數(shù) struct Chess * NewChess ; NewChess=new Chess();復(fù)制TheChess 到NewChess,fo
28、r(int i=0;i<M;i+) 隨機移動棋盤 返回 NewChess;結(jié)果如圖所示:(由于篇幅所限,只提供兩次程序運行的結(jié)果) (1)(2)圖1 最上方打印出的是目標(biāo)棋盤,0代表棋盤中的空格 然后初始化一個棋盤,并調(diào)用估價函數(shù)顯示與目標(biāo)棋盤的差距 深度搜索成功 則倒序顯示路徑(每步都調(diào)用估價函數(shù)顯示與目標(biāo)棋盤的差距)圖2 同 初使棋盤的不同,則搜索路徑不同。 三、軟件題任選一種數(shù)據(jù)挖掘軟件進(jìn)行操作使用,并進(jìn)行分析和總結(jié)。關(guān)于數(shù)據(jù)挖掘軟件WEKA的分析和總結(jié)WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),同時W
29、EKA也是新西蘭的一種鳥名,而WEKA的主要開發(fā)者來自新西蘭。WEKA作為一個公開的數(shù)據(jù)挖掘工作平臺,集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機器學(xué)習(xí)算法,包括對數(shù)據(jù)進(jìn)行預(yù)處理,分類,回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化。1 安裝 我安裝的是WEKA3-5-5。安裝方法很簡單,并且繼承了java 運行環(huán)境,不用擔(dān)心任何配置。版本提供了function接口,并且支持反編譯。用戶可用性以及擴展性很強。2 操作環(huán)境 安裝完成,運行WEKA圖標(biāo),出現(xiàn)一個小型的圖形用戶接口(Graphical User Interface,GUI)(見圖1),它的MDI(多文檔界面)外觀,讓所有打開的窗
30、口更加明了。這個菜單包括五個部分(Program、Application、Tools、 Visualization、Help)提供了四種操作環(huán)境(見圖2)圖1 圖形用戶接口圖2 四種操作環(huán)境這四種操作的基本原理都大同小異,只是提供的環(huán)境不一樣。主要是看用戶平時熟悉使用什么,比如喜歡直接用代碼的一定熱衷于SimpleCLI(見圖3);喜歡圖標(biāo)的更熱衷于Knowledgeflow(見圖4)。一般用戶通常使用Explorer;Experiment和Explorer類似,只是支持格式不一樣。Experimenter運行算法試驗、管理算法方案之間的統(tǒng)計檢驗的環(huán)境。 圖3 SimpleCLI環(huán)境 圖4 K
31、nowledgeFlow環(huán)境3 一般用戶重點適用Explorer圖5 Explorer3.1 標(biāo)簽頁 在窗口的頂部,標(biāo)題欄下是一排標(biāo)簽。當(dāng) Explorer 首次啟動時,只有第一個標(biāo)簽頁是活動的;其他均是灰色的。這是因為在探索數(shù)據(jù)之前,必須先打開一個數(shù)據(jù)集(可能還要對它進(jìn)行預(yù)處理)。 所有的標(biāo)簽頁如下所示: Preprocess 選擇和修改要處理的數(shù)據(jù); Classify 訓(xùn)練和測試關(guān)于分類或回歸的學(xué)習(xí)方案; Cluster 從數(shù)據(jù)中學(xué)習(xí)聚類; Associate 從數(shù)據(jù)中學(xué)習(xí)關(guān)聯(lián)規(guī)則; Select attributes 選擇數(shù)據(jù)中最相關(guān)的屬性; Visualize. 查看數(shù)據(jù)的交互式二維圖
32、像。 這些標(biāo)簽被激活后,點擊它們可以在不同的標(biāo)簽頁面上進(jìn)行切換,而每一個頁面上可以執(zhí)行對應(yīng)的操作。不管位于哪個頁面,窗口的底部區(qū)域(包括狀態(tài)欄、log按鈕和WEKA鳥) 仍然可見。3.2 狀態(tài)欄 狀態(tài)(Status)欄出現(xiàn)在窗口的最底部。它顯示一些信息讓你知道正在做什么。3.3 Log 按鈕 點擊這個按鈕,會出現(xiàn)一個單獨的窗口,包含一個可拖動的文本區(qū)域。文本的加了一個時間戳,顯示了它進(jìn)入日志(log)的時間,一旦在WEKA 中執(zhí)行某種操作時,該日志就會記錄發(fā)生了什么。3.4 WEKA 狀態(tài)圖標(biāo) 狀態(tài)欄的右邊是 WEKA 狀態(tài)圖標(biāo)。當(dāng)不運行任何進(jìn)程時,WEKA鳥會坐下并打一個小盹。×符
33、號旁的數(shù)字顯示了正運行的并發(fā)進(jìn)程的數(shù)量。當(dāng)系統(tǒng)空閑時,它是零,而當(dāng)進(jìn)程的數(shù)量增長時,它也會增長。在標(biāo)簽頁preprocess里面有個open控件,是用來打開source file的,WEKA支持的文檔格式為*.arff,其實是一個文本數(shù)據(jù)集。也支持URL或者DB打開方式,并且支持?jǐn)?shù)據(jù)轉(zhuǎn)換。 打開數(shù)據(jù)文件后,可以使用Filter進(jìn)行一下過濾,此操作相當(dāng)于“預(yù)處理的預(yù)處理”。Filter提供了許多算法來過濾數(shù)據(jù),比如 filters/unsupervised/instance/normalize應(yīng)該是一個標(biāo)準(zhǔn)化的算法(用戶也可以編寫自己的算法)。 這時窗體上已經(jīng)給出這個數(shù)據(jù)集的一些基本特
34、征了,比如有多少屬性,各屬性的一些簡單統(tǒng)計量,右下方還給出一些可視化效果比如柱狀圖。通過這些可以初步了解這個數(shù)據(jù)集了。接下來的兩個標(biāo)簽頁是classify(分類)和cluster(聚類),接觸數(shù)據(jù)挖掘的人對它們一定不會陌生。同樣WEKA有許多分類和聚類算法可供選擇(見圖6),在這里面稱為clasifier和clusterer。對cluster更加準(zhǔn)確的翻譯應(yīng)該是“簇”。聚類的任務(wù)是把所有的實例分配到若干的簇,使得同一個簇的實例聚集在一個簇中心的周圍,它們之間距離的比較近;而不同簇實例之間的距離比較遠(yuǎn)。對于由數(shù)值型屬性刻畫的實例來說,這個距離通常指歐氏距離。不過WEKA提供的classify功能似乎還不夠靈活,只能定長度和定頻率地分類。但這個關(guān)系不大,現(xiàn)在很多數(shù)據(jù)處理軟件都可以做到這個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 孤殘兒童關(guān)愛政策宣傳與普及考核試卷
- 企業(yè)安全生產(chǎn)培訓(xùn)的技術(shù)創(chuàng)新與成果轉(zhuǎn)化考核試卷
- 家用紡織品消費趨勢考核試卷
- 蘇州科技大學(xué)天平學(xué)院《化工環(huán)保與安全》2023-2024學(xué)年第一學(xué)期期末試卷
- 鼻部美容手術(shù)-鼻部手術(shù)應(yīng)用解剖及麻醉方法(美容外科學(xué)課件)
- 體育館設(shè)施的數(shù)字化展示與交互考核試卷
- 淘寶客服的工作總結(jié)(30篇)
- 幼兒園小班日工作總結(jié)5篇
- Secologanin-Standard-生命科學(xué)試劑-MCE
- 大數(shù)據(jù)專業(yè)職業(yè)規(guī)劃
- 吸入麻醉聯(lián)合神阻滯在骨科手術(shù)中應(yīng)用
- 人教版九年級上學(xué)期期中考試數(shù)學(xué)試卷及答案解析(共5套)
- 逆境中的積極心態(tài)與成就
- 山東省2023年高考物理模擬(一模、二模)試題知識點訓(xùn)練:電磁學(xué)解答題
- 門診健康宣教 課件
- 學(xué)生戲劇表演
- 人工智能基礎(chǔ)及應(yīng)用(微課版) 課件 第6章 人工神經(jīng)網(wǎng)絡(luò)
- 計量器具管理課件
- 2022年《系統(tǒng)集成項目管理工程師》案例分析真題
- 機械工程師的生涯發(fā)展展示
評論
0/150
提交評論