版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大數(shù)據(jù)分析方法與應(yīng)用第七章啟發(fā)式算法7.1
啟發(fā)式算法的基本原理目錄CONTENTS7.2
啟發(fā)式算法的類型7.3
遺傳算法及其實(shí)現(xiàn)7.4
粒子群算法及其實(shí)現(xiàn)7.5物流配送中心選址案例分析第七章學(xué)習(xí)結(jié)構(gòu)框架啟發(fā)式算法
什么是啟發(fā)式算法?啟發(fā)式算法是一種通過(guò)模擬自然現(xiàn)象或人類的經(jīng)驗(yàn)、知識(shí)和智慧,來(lái)尋求解決方案較優(yōu)或近似最優(yōu)的問(wèn)題求解方法。它能夠在有限時(shí)間內(nèi)找到接近最優(yōu)解的可行解,具有計(jì)算效率高、適應(yīng)性強(qiáng)、魯棒性強(qiáng)、可并行化等特點(diǎn),并被廣泛應(yīng)用于組合優(yōu)化、機(jī)器學(xué)習(xí)、圖論等實(shí)際問(wèn)題中。7.1
啟發(fā)式算法的基本原理
組合優(yōu)化問(wèn)題人工智能領(lǐng)域數(shù)學(xué)優(yōu)化領(lǐng)域數(shù)據(jù)挖掘和模式識(shí)別領(lǐng)域最小生成樹(shù)調(diào)度和資源分配問(wèn)題多目標(biāo)優(yōu)化問(wèn)題通過(guò)引入啟發(fā)式準(zhǔn)則和尋找合適的搜索策略,可以在多個(gè)領(lǐng)域獲得較好的解決方法。在實(shí)際問(wèn)題中有著廣泛的應(yīng)用前景。啟發(fā)式算法的原理主要分為兩個(gè)方面:?jiǎn)l(fā)式函數(shù)和搜索策略。7.1
啟發(fā)式算法基本原理
7.1.1
啟發(fā)式函數(shù)啟發(fā)式函數(shù)是一種評(píng)估函數(shù),它根據(jù)特定問(wèn)題的信息來(lái)評(píng)估解的質(zhì)量,并指導(dǎo)算法搜索解空間。在搜索空間中,每個(gè)狀態(tài)都有一個(gè)相應(yīng)的評(píng)估值,而啟發(fā)式函數(shù)本身可以根據(jù)搜索問(wèn)題的特點(diǎn)來(lái)設(shè)計(jì)和選擇。實(shí)踐中,設(shè)計(jì)好的啟發(fā)式函數(shù)可以在找到最優(yōu)解或接近最優(yōu)值的同時(shí),有效降低搜索空間的大小,從而使算法具有更快的搜索速度。一個(gè)好的啟發(fā)式函數(shù)應(yīng)該滿足以下條件:1)啟發(fā)式函數(shù)應(yīng)該準(zhǔn)確地評(píng)估每個(gè)狀態(tài),以便在搜索空間中找到最優(yōu)解或接近最優(yōu)值;2)啟發(fā)式函數(shù)應(yīng)該能夠快速計(jì)算,以便算法具有較快的搜索速度;3)啟發(fā)式函數(shù)應(yīng)該合理有效地指導(dǎo)算法搜索,以便算法能夠充分利用先前找到的最優(yōu)解。常用的啟發(fā)式函數(shù)包括曼哈頓距離(ManhattanDistance)、歐幾里得距離(EuclideanDistance)、切比雪夫距離(ChebyshevDistance)等。這些啟發(fā)式函數(shù)可以用于許多優(yōu)化問(wèn)題,如旅行商問(wèn)題、路徑規(guī)劃等。7.1啟發(fā)式算法基本原理
7.1.2
搜索策略一、定義搜索策略作為一種指導(dǎo)搜索過(guò)程的規(guī)則集合,也扮演著啟發(fā)式算法的重要組成部分。搜索策略是指在解空間中進(jìn)行搜索,并從中選擇有可能是最佳解的解。二、分類實(shí)現(xiàn)方式搜索順序隨機(jī)搜索深度優(yōu)先搜索局部搜索廣度優(yōu)先搜索全局搜索遺傳算法7.2
啟發(fā)式算法的類型
啟發(fā)式算法仿植物類算法:模擬植物的生長(zhǎng)、繁殖和適應(yīng)環(huán)境的過(guò)程仿動(dòng)物類算法:模擬動(dòng)物的行為、交流和適應(yīng)環(huán)境的過(guò)程。0102蟻群算法鳥(niǎo)群算法粒子群算法蜂群算法魚群算法蝙蝠算法向光性算法雜草優(yōu)化算法模擬植物生長(zhǎng)算法特點(diǎn):具有較強(qiáng)的自適應(yīng)性和魯棒性。(魯棒性:系統(tǒng)或算法在面對(duì)異常情況或輸入變化時(shí)能夠保持良好性能的能力)7.2
啟發(fā)式算法的類型
7.2.1
仿動(dòng)物類啟發(fā)式算法——蟻群算法(AntColonyOptimization,ACO)仿動(dòng)物類啟發(fā)式算法利用生物進(jìn)化、個(gè)體行為、群體行為等動(dòng)物的特征來(lái)進(jìn)行優(yōu)化求解,其最主要的特點(diǎn)是能夠考慮群體的可行性,解決發(fā)現(xiàn)局部最優(yōu)的問(wèn)題,提高搜索算法的效率。蟻群算法是基于螞蟻的運(yùn)動(dòng)規(guī)律,通過(guò)模擬螞蟻在搜索過(guò)程中沿路徑釋放信息素、揮發(fā)信息素等行為模式,來(lái)搜索全局最優(yōu)或局部最優(yōu)解。螞蟻在移動(dòng)過(guò)程中會(huì)釋放信息素,信息素越高表示該路徑被螞蟻選擇的概率越大,所以螞蟻更傾向于選擇信息素濃度高且長(zhǎng)度短的路徑。應(yīng)用:組合優(yōu)化問(wèn)題、路徑規(guī)劃問(wèn)題、調(diào)度問(wèn)題,易陷入局部最優(yōu)7.2
啟發(fā)式算法的類型
7.2.1
仿動(dòng)物類啟發(fā)式算法——粒子群算法(ParticleSwarmOptimization,PSO)粒子群算法是基于鳥(niǎo)類在尋找食物等過(guò)程中的覓食行為而設(shè)計(jì)的,這種算法通過(guò)模擬鳥(niǎo)類協(xié)作尋找最優(yōu)優(yōu)化結(jié)果;粒子群算法的基本思想是將待優(yōu)化問(wèn)題轉(zhuǎn)化為一個(gè)多維搜索空間中的優(yōu)化問(wèn)題,每個(gè)粒子代表一個(gè)可能的解,并根據(jù)自身的經(jīng)驗(yàn)和群體的經(jīng)驗(yàn)來(lái)更新自己的位置和速度。粒子的位置表示解的值,速度表示解的搜索方向和步長(zhǎng)。更新速度過(guò)程包括粒子向自己歷史最優(yōu)位置靠近和向群體歷史最優(yōu)位置靠近。應(yīng)用:函數(shù)優(yōu)化、組合優(yōu)化、參數(shù)優(yōu)化、非線性優(yōu)化問(wèn)題7.2啟發(fā)式算法的類型
7.2.1
仿動(dòng)物類啟發(fā)式算法——蜂群算法(BeeAlgorithm)蜂群算法是由國(guó)外學(xué)者于2005年首次提出,是一種基于蜜蜂覓食行為的啟發(fā)式優(yōu)化算法。蜜蜂覓食行為中包含了一系列的搜索、選擇和通信過(guò)程,這些行為被模擬為算法的操作?;舅枷耄和ㄟ^(guò)模擬蜜蜂在搜索食物源時(shí)的行為尋找問(wèn)題的最優(yōu)解。蜂群算法的搜索過(guò)程是一個(gè)迭代的過(guò)程,每一次迭代中,蜜蜂們根據(jù)一定的規(guī)則進(jìn)行搜索,并根據(jù)搜索結(jié)果更新自己的位置和狀態(tài)。具有較好的全局搜索能力和收斂性能。它可以應(yīng)用于多種優(yōu)化問(wèn)題,如函數(shù)優(yōu)化、組合優(yōu)化、路徑規(guī)劃等。(引領(lǐng)蜂)7.2
啟發(fā)式算法的類型
7.2.1仿動(dòng)物類啟發(fā)式算法——魚群算法(FishSchoolSearch,FSS)魚群算法是由李曉磊博士于2003年提出的,是一種基于模擬自然界魚群食物搜索行為的啟發(fā)式優(yōu)化算法。該算法受到魚群行為的啟發(fā),模擬了魚群中魚的個(gè)體行為和群體行為,用于解決優(yōu)化問(wèn)題?;舅枷耄和ㄟ^(guò)個(gè)體之間的相互作用和信息交流,以及對(duì)環(huán)境的感知和適應(yīng),實(shí)現(xiàn)問(wèn)題的求解。具有較強(qiáng)的全局搜索能力和較快的收斂速度。(一片水域,如果某個(gè)地方的魚類數(shù)目最多,那么這個(gè)地方一般來(lái)說(shuō)就是水域內(nèi)富含營(yíng)養(yǎng)物質(zhì)最多的地方,依據(jù)這一特點(diǎn)來(lái)模仿魚群的覓食、聚群、追尾、隨機(jī)行為,以實(shí)現(xiàn)全局尋優(yōu)的目的。)應(yīng)用:各種需要尋找最優(yōu)解的問(wèn)題,尤其是那些復(fù)雜、高維、非線性的優(yōu)化問(wèn)題。優(yōu)點(diǎn):并行性強(qiáng)、全局搜索能力強(qiáng)、適應(yīng)性強(qiáng)、算法簡(jiǎn)單易實(shí)現(xiàn)。7.2
啟發(fā)式算法的類型
7.2.1
仿動(dòng)物類啟發(fā)式算法——蝙蝠算法(BatAlgorithm)蝙蝠算法是由英國(guó)科學(xué)家Yang教授于2010年提出的一種模擬蝙蝠群體行為的啟發(fā)式優(yōu)化算法?;舅枷耄耗M蝙蝠在尋找食物和繁殖過(guò)程中的行為。蝙蝠在夜間通過(guò)發(fā)出超聲波信號(hào)來(lái)探測(cè)周圍環(huán)境,并根據(jù)接收到的回聲來(lái)判斷目標(biāo)的位置。發(fā)現(xiàn)目標(biāo)后,它會(huì)朝著目標(biāo)飛去,并通過(guò)調(diào)整頻率和聲音的強(qiáng)度來(lái)調(diào)整自己的飛行方向和速度。應(yīng)用:各種優(yōu)化問(wèn)題,特別是連續(xù)優(yōu)化問(wèn)題優(yōu)點(diǎn):算法基本思想簡(jiǎn)單,易于理解和實(shí)現(xiàn)缺點(diǎn):存在多個(gè)參數(shù)需要去設(shè)置,如蝙蝠個(gè)體的速度、頻率等,對(duì)初始解敏感,不同的初始解可能導(dǎo)致不同的搜索結(jié)果7.2
啟發(fā)式算法的類型
7.2.1
仿植物類啟發(fā)式算法算法名稱概念基本思想應(yīng)用向光性算法(PhototaxisAlgorithm)用于解決優(yōu)化問(wèn)題的算法,也稱為光子算法。該算法模擬了光在環(huán)境中的傳播和反射過(guò)程,通過(guò)光的傳播路徑來(lái)搜索最優(yōu)解通過(guò)模擬生物體對(duì)光的感知和移動(dòng)來(lái)解決優(yōu)化問(wèn)題連續(xù)優(yōu)化問(wèn)題和多模態(tài)優(yōu)化問(wèn)題雜草優(yōu)化算法(WeedOptimizationAlgorithm,WOA)一種基于仿生學(xué)的優(yōu)化算法通過(guò)模擬雜草的生長(zhǎng)過(guò)程來(lái)求解優(yōu)化問(wèn)題機(jī)器學(xué)習(xí)、圖像處理、電力系統(tǒng)優(yōu)化模擬植物生長(zhǎng)算法(PlantGrowthSimulationAlgorithm,PGSA)一種以植物向光性機(jī)理(形態(tài)素濃度理論)為啟發(fā)準(zhǔn)則的智能優(yōu)化算法。通過(guò)模擬植物的生理機(jī)制和生長(zhǎng)規(guī)律來(lái)解決問(wèn)題,可以應(yīng)用于多種問(wèn)題的求解函數(shù)優(yōu)化、組合優(yōu)化、圖像處理(全局搜索)7.3
遺傳算法及其實(shí)現(xiàn)
7.3.1
遺傳算法的原理一、概念遺傳算法(GeneticAlgorithm,GA)起源于對(duì)生物系統(tǒng)所進(jìn)行的計(jì)算機(jī)模擬研究,是一種隨機(jī)全局搜索優(yōu)化方法。二、原理遺傳算法通過(guò)模擬自然選擇和遺傳中發(fā)生的復(fù)制、交叉和變異等現(xiàn)象,從任一初始種群出發(fā),通過(guò)隨機(jī)選擇、交叉和變異操作,產(chǎn)生一群更適合環(huán)境的個(gè)體,使群體進(jìn)化到搜索空間中越來(lái)越好的區(qū)域,這樣一代一代不斷繁衍進(jìn)化,最后收斂到一群最適應(yīng)環(huán)境的個(gè)體,從而求得問(wèn)題的優(yōu)質(zhì)解。三、優(yōu)勢(shì)在求解較為復(fù)雜的組合優(yōu)化問(wèn)題時(shí),相對(duì)一些常規(guī)的優(yōu)化算法,遺傳算法通常能夠較快地獲得較好的優(yōu)化結(jié)果。四、應(yīng)用車間調(diào)度、機(jī)器仿真、信號(hào)處理
7.3
遺傳算法及其實(shí)現(xiàn)
7.3.1
遺傳算法的原理四、常用術(shù)語(yǔ)算法名稱概念染色體(Chromosome)染色體又可稱為基因型個(gè)體(Individuals),一定數(shù)量的個(gè)體組成了群體(Population),群體中個(gè)體的數(shù)量叫作群體大?。≒opulationsize)。位串(BitString)個(gè)體的表示形式,對(duì)應(yīng)于遺傳學(xué)中的染色體。基因(Gene)基因是染色體中的元素,用于表示個(gè)體的特征。例如有一個(gè)位串(即染色體)S=1011,則其中的1,0,1,1這4個(gè)元素分別稱為基因。特征值(Feature)在用位串表示整數(shù)時(shí),基因的特征值與二進(jìn)制數(shù)的權(quán)一致,例如在串S=1011中,基因位置3中的1,它的基因特征值為2;基因位置1中的1,它的基因特征值為8適應(yīng)度(Fitness)各個(gè)體對(duì)環(huán)境的適應(yīng)程度叫作適應(yīng)度。為了體現(xiàn)染色體的適應(yīng)能力,引入了對(duì)問(wèn)題中的每一個(gè)染色體都能進(jìn)行度量的函數(shù),叫適應(yīng)度函數(shù)。這個(gè)函數(shù)通常會(huì)被用來(lái)計(jì)算個(gè)體在群體中被使用的概率?;蛐停℅enotype)或稱遺傳型,是指基因組定義遺傳特征和表現(xiàn),對(duì)應(yīng)于GA中的位串表現(xiàn)型(Phenotype)指的是生物體的基因型在特定環(huán)境下的表現(xiàn)特征,對(duì)應(yīng)于GA中的位串解碼后的參數(shù)。7.3
遺傳算法及其實(shí)現(xiàn)
7.3.2
遺傳算法的步驟初始化種群:隨機(jī)生成一組初始個(gè)體,形成初始種群。評(píng)估適應(yīng)度:適應(yīng)度函數(shù)表明個(gè)體或解的優(yōu)劣性。根據(jù)具體問(wèn)題計(jì)算群體P(t)中各個(gè)個(gè)體的適應(yīng)度。遺傳算子:選擇操作、交叉操作、變異操作、終止判斷條件7.3
遺傳算法及其實(shí)現(xiàn)
7.3.3
遺傳算法的計(jì)算機(jī)實(shí)現(xiàn)常用軟件MATLAB是一種高級(jí)的數(shù)學(xué)計(jì)算軟件,它提供了豐富的工具箱和函數(shù),可以方便地實(shí)現(xiàn)遺傳算法。Python是一種通用的編程語(yǔ)言,擁有豐富的科學(xué)計(jì)算庫(kù),如NumPy、SciPy和DEAP等,可以用于實(shí)現(xiàn)遺傳算法。Java是一種廣泛使用的編程語(yǔ)言,它提供了強(qiáng)大的面向?qū)ο蟮木幊棠芰Γ梢杂糜趯?shí)現(xiàn)遺傳算法。7.3
遺傳算法及其實(shí)現(xiàn)
7.3.3
遺傳算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證Python軟件的實(shí)現(xiàn)初始化種群優(yōu)勝劣汰7.3
遺傳算法及其實(shí)現(xiàn)
7.3.3
遺傳算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證Python軟件的實(shí)現(xiàn)交配生殖、變異7.3
遺傳算法及其實(shí)現(xiàn)
7.3.3
遺傳算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證Python軟件的實(shí)現(xiàn)生物遺傳進(jìn)化7.4
粒子群算法及其實(shí)現(xiàn)
7.4.1粒子群算法的原理一、粒子群算法的靈感來(lái)源
粒子群算法被提出的靈感來(lái)源于鳥(niǎo)群覓食,鳥(niǎo)群覓食過(guò)程中,每只鳥(niǎo)沿著各個(gè)方向飛行去尋找食物,每只鳥(niǎo)兒都能記住到目前為止自己在飛行過(guò)程中最接近食物的位置,同時(shí)每只鳥(niǎo)兒之間也有信息共享,它們會(huì)比較到目前為止各自與食物之間的最近距離,從各自的最近距離中,選擇并記憶整體的一個(gè)最近距離位置。二、數(shù)學(xué)模型
每只鳥(niǎo)兒就是一個(gè)粒子,食物的位置也就是問(wèn)題的最優(yōu)解,鳥(niǎo)兒與食物的距離也即當(dāng)前粒子的目標(biāo)函數(shù)值。7.4
粒子群算法及其實(shí)現(xiàn)
7.4.2
粒子群算法的步驟對(duì)于每個(gè)粒子,它包含的元素:當(dāng)前時(shí)刻位置:(x1,x2,...,xn)當(dāng)前時(shí)刻的目標(biāo)函數(shù)值(也稱為適應(yīng)度):f(x1,x2,...,xn)該粒子的歷史最優(yōu)位置:(x1_pbest,x2_pbest,...,xn_pbest)該粒子的歷史最優(yōu)目標(biāo)函數(shù)值:f_pbest=f(x1_pbest,x2_pbest,...,xn_pbest)對(duì)于全部粒子,它們共有的元素:粒子總數(shù):num迭代總次數(shù):cnt。粒子群算法也是一個(gè)迭代的過(guò)程,需要多次迭代才能獲取到理想的最優(yōu)解。全局最優(yōu)位置:(x1_gbest,x2_gbest,...,xn_gbest)全局最優(yōu)目標(biāo)函數(shù)值:f_gbest=f(x1_gbest,x2_gbest,...,xn_gbest)位置隨機(jī)化的上下限:xmin,xmax。迭代開(kāi)始的時(shí)候以及迭代的過(guò)程中,均需要對(duì)粒子的位置進(jìn)行隨機(jī)分布,需要設(shè)置隨機(jī)分布的上下限,不然隨機(jī)分布偏離得太遠(yuǎn),會(huì)嚴(yán)重影響優(yōu)化結(jié)果。速度的上下限:Vmin,Vmax。迭代過(guò)程中,速度也具有一定的隨機(jī)性,需要限制速度的大小在一定范圍內(nèi),不然如果速度值太大也會(huì)嚴(yán)重影響優(yōu)化結(jié)果。速度計(jì)算參數(shù):c1、c2。通常取1.0~1.8的值。速度更新:Vi=w*Vi+c1*rand()*(pbesti+Xi)+c2*rand()*(gbest-Xi)位置更新:Xi=Xi+Vi7.4粒子群算法及其實(shí)現(xiàn)
7.4.3粒子群算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證設(shè)定PSO初始參數(shù)本節(jié)用Python軟件對(duì)粒子群算法進(jìn)行實(shí)現(xiàn),問(wèn)題描述:求y=x2-4x+3最小值。7.4粒子群算法及其實(shí)現(xiàn)
7.4.3粒子群算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證設(shè)定目標(biāo)函數(shù)及初始化種群7.4粒子群算法及其實(shí)現(xiàn)
7.4.3粒子群算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證更新粒子速度和位置7.4粒子群算法及其實(shí)現(xiàn)
7.4.3粒子群算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證圖形可視化7.5
物流配送中心案例分析
一、問(wèn)題:
一共有五個(gè)配送中心候選節(jié)點(diǎn),其建設(shè)成本和坐標(biāo)如表7-1所示。供應(yīng)點(diǎn)有13個(gè),其坐標(biāo)和運(yùn)輸量如表7-2所示,通過(guò)遺傳算法分析配送中心可覆蓋的供應(yīng)點(diǎn)。配送中心候選節(jié)點(diǎn)建設(shè)成本(萬(wàn)元)坐標(biāo)15495.7(58.9,45.2)23458.8(54.9,117)34226.7(114,135)47294.2(67.7,195)58560.2(176,149)供應(yīng)點(diǎn)坐標(biāo)運(yùn)輸量1(106,74.1)67.572(105,117)107.153(74.9,91.5)221.564(81.8,147)293.935(136,161)105.536(192,43.4)191.167(39.9,63.0)285.48續(xù)表:8(37.7,85.3)197.079(41.7,152)304.2410(12.4,100)217.8211(31.7,9.80)100.9612(32.9,189)61.4713(159,218)258.37.5
物流配送中心案例分析
二、解題思路——提出假設(shè)
1)在一定備選范圍內(nèi)進(jìn)行配送中心的選取。2)供應(yīng)點(diǎn)數(shù)目多于配送中心數(shù)目。3)一個(gè)供應(yīng)點(diǎn)僅由一個(gè)配送中心提供配送服務(wù),但一個(gè)配送中心可覆蓋多個(gè)供應(yīng)點(diǎn)。4)配送中心容量可滿足各供應(yīng)網(wǎng)點(diǎn)的總需求量。5)各供應(yīng)點(diǎn)配送需求一次性運(yùn)輸完成,且假設(shè)勻速行駛。6)只考慮配送中心建設(shè)成本、運(yùn)輸成本。符號(hào)及定義:
I:表示供應(yīng)點(diǎn)集合;
J:表示配送中心集合;
Cij:從供應(yīng)點(diǎn)i到配送中心j的運(yùn)輸成本;
qij:供應(yīng)點(diǎn)i到配送中心j的運(yùn)輸量;
fj:配送中心j的建設(shè)成本;
Dj:配送中心j的需求量;
P:配送中心的最大建設(shè)數(shù)量;
Mj:配送中心j的最大容量。7.5物流配送中心案例分析
二、解題思路——確定目標(biāo)函數(shù)及約束條件
目標(biāo)函數(shù):
,表示總費(fèi)用最小約束條件1:
,配送中心的數(shù)量為2個(gè);約束條件2:
從供應(yīng)點(diǎn)到配送中心的數(shù)量大于等于配送中心的需求量;約束條件3:
,配送中心容納能力限制;約束條件4:
,
,
,變量取值。7.5
物流配送中心案例分析
二、解題思路——Python
運(yùn)行
由備選中心2配送的需求點(diǎn)有:3,7,8,9,10,11,12;由備選中心3配送的需求點(diǎn)有:1,2,4,5,6,13。課后習(xí)題1.使用模擬退火算法求解函數(shù)f(x)=-x2+2x+3在[0,2]區(qū)間內(nèi)的最大值,初始溫度為T=100,降溫系數(shù)為0.95。2.使用禁忌搜索算法求解函數(shù)f(x)=-x2+2x+3在[0,2]區(qū)間內(nèi)的最大值,初始解為x=1.5,禁忌列表長(zhǎng)度為5,最大迭代次數(shù)為10000。3.使用遺傳算法求解函數(shù)f(x,y)=-x2-y2+10在[-10,10]區(qū)間內(nèi)的最大值,種群大小為10,交叉概率為0.8,變異概率為0.2,最大迭代次數(shù)為100。4.使用蟻群算法求解TSP問(wèn)題,有4個(gè)城市分別為A、B、C、D,求出最優(yōu)路徑和路徑長(zhǎng)度。5.使用免疫算法求解函數(shù)f(x)=-x?+2x3-3x2在[-2,3]區(qū)間內(nèi)的最大值,種群大小為20,突變概率為0.1,克隆選擇參數(shù)為b=5。6.使用粒子群算法求解函數(shù)f(x,y)=x2+y2在[-5,5]區(qū)間內(nèi)的最小值,種群大小為10,慣性權(quán)重w=0.7,個(gè)體學(xué)習(xí)因子c1=1.5,社會(huì)學(xué)習(xí)因子c2=2,最大迭代次數(shù)為100。7.使用遺傳算法求解背包問(wèn)題,有5個(gè)物品,重量分別為2、3、4、5、6,價(jià)值分別為3、4、5、6、7,背包的最大承重為10。求出背包能裝下的最大總價(jià)值以及裝入的物品。8.使用人工免疫算法求解函數(shù)f(x)=-x2+3x+4在[-2,3]區(qū)間內(nèi)的最大值,種群大小為10,克隆選擇參數(shù)為m=4,突變概率為0.1。Thank
you!大數(shù)據(jù)分析方法與應(yīng)用第8章支持向量機(jī)8.1支持向量機(jī)的原理目錄CONTENTS8.2支持向量機(jī)算法8.3支持向量機(jī)算法參數(shù)優(yōu)化8.4算法應(yīng)用及案例分析8.5課后習(xí)題第8章支持向量機(jī)8.1.1支持向量機(jī)的由來(lái)8.1.2支持向量機(jī)的發(fā)展8.1支持向量機(jī)的原理8.1支持向量機(jī)原理
支持向量機(jī)是什么?支持向量機(jī)(SupportVectorMachine,SVM)是一種以統(tǒng)計(jì)學(xué)習(xí)為基礎(chǔ)的強(qiáng)大的監(jiān)督學(xué)習(xí)算法,通常用于分類和回歸問(wèn)題。SVM在機(jī)器學(xué)習(xí)領(lǐng)域非常流行,并被廣泛應(yīng)用于各種領(lǐng)域,如文本分類、圖像識(shí)別、生物信息學(xué)和金融預(yù)測(cè)等。SVM的核心思想是在特征空間中找到一個(gè)最優(yōu)的超平面,將不同類別的數(shù)據(jù)點(diǎn)分開(kāi),并且使得超平面與最近的數(shù)據(jù)點(diǎn)之間的間隔盡可能大。這些最近的數(shù)據(jù)點(diǎn)被稱為“支持向量”,因?yàn)樗鼈儗?duì)于定義分類邊界非常重要。8.1支持向量機(jī)原理
8.1.1支持向量機(jī)的由來(lái)SVM的早期發(fā)展始于統(tǒng)計(jì)學(xué)習(xí)理論,該理論是一種使用統(tǒng)計(jì)的方法專門研究小樣本情況下機(jī)器學(xué)習(xí)規(guī)律的理論并且針對(duì)小樣本問(wèn)題建立了一套全新的理論體系,其統(tǒng)計(jì)推理規(guī)則不僅考慮了對(duì)漸進(jìn)性能的要求,而且追求在現(xiàn)有有限信息的條件下得到最后結(jié)果Vapnik在該理論中提出了結(jié)構(gòu)風(fēng)險(xiǎn)最小化(StructuralRiskMinimization,SRM)的概念,該概念強(qiáng)調(diào)在進(jìn)行模型選擇時(shí)需要平衡模型的經(jīng)驗(yàn)誤差和模型的復(fù)雜性,以實(shí)現(xiàn)更好的泛化性能。具體來(lái)說(shuō)結(jié)構(gòu)化風(fēng)險(xiǎn)可以分為結(jié)構(gòu)風(fēng)險(xiǎn)和置信風(fēng)險(xiǎn)。結(jié)構(gòu)風(fēng)險(xiǎn)指的是給定樣本上的分類誤差,而置信風(fēng)險(xiǎn)是指在未知樣本的分類誤差。我們?cè)谟?xùn)練模型時(shí)會(huì)讓結(jié)構(gòu)風(fēng)險(xiǎn)變得很小,但是這個(gè)模型能否預(yù)測(cè)未知樣本則需關(guān)注置信風(fēng)險(xiǎn)。訓(xùn)練樣本數(shù)越多置信風(fēng)險(xiǎn)也越小。而分類函數(shù)越復(fù)雜,則會(huì)導(dǎo)致其普適性變差,增加置信風(fēng)險(xiǎn)。SVM的研究意義就是讓結(jié)構(gòu)風(fēng)險(xiǎn)和置信風(fēng)險(xiǎn)的和最小。8.1支持向量機(jī)原理
8.1.2支持向量機(jī)的發(fā)展最早的SVM是用于線性可分?jǐn)?shù)據(jù)的,研究主要集中在找到最大間隔超平面和支持向量的數(shù)學(xué)推導(dǎo)與算法優(yōu)化上。Vapnik和Cortes首次提出了現(xiàn)代形式的線性SVM,其基本思想是通過(guò)拉格朗日乘數(shù)法將線性可分問(wèn)題轉(zhuǎn)化為凸優(yōu)化問(wèn)題,并利用對(duì)偶問(wèn)題求解得到支持向量為了應(yīng)對(duì)現(xiàn)實(shí)世界中存在的線性不可分?jǐn)?shù)據(jù),研究者又提出了軟間隔SVM,引入松弛變量來(lái)容忍一定的誤分類1995年為了應(yīng)對(duì)現(xiàn)實(shí)世界中存在的線性不可分?jǐn)?shù)據(jù)8.1支持向量機(jī)原理
8.1.2支持向量機(jī)的發(fā)展提出了一對(duì)多(One-vs-Rest)和一對(duì)一(One-vs-One)等策略來(lái)處理多類別分類問(wèn)題。開(kāi)始的SVM是針對(duì)二分類問(wèn)題的,但實(shí)際中存在多類別分類的需求研究者提出了核函數(shù)的概念,將數(shù)據(jù)映射到高維特征空間,并在高維空間中尋找線性可分的超平面由于實(shí)際數(shù)據(jù)往往是復(fù)雜的、非線性可分的8.1支持向量機(jī)原理
8.1.1支持向量機(jī)的由來(lái)8.1支持向量機(jī)原理
8.1.1支持向量機(jī)的由來(lái)支持向量機(jī)原理這些豆子叫做data,把線叫做classifier,最大間隙trick叫做optimization,拍桌子叫做kernelling核函數(shù),那張紙叫做hyperplane超平面8.2.1支持向量機(jī)的模型算法8.2.2支持向量機(jī)模型優(yōu)化算法8.2支持向量機(jī)算法8.2.3核函數(shù)8.2.4支持向量機(jī)算法的計(jì)算機(jī)實(shí)現(xiàn)8.2支持向量機(jī)算法
8.2.1支持向量機(jī)的模型算法給定訓(xùn)練樣本集:
D={(x1,y1),…,(xm,ym)}其中xi∈Rn,yi∈{-1,+1},i=1,...,m,Rn表示n維歐式空間。劃分超平面的線性方程描述:分類學(xué)習(xí)最基本的思想就是基于訓(xùn)練樣本集D在樣本空間中找到一個(gè)超平面,將不同的樣本分開(kāi)。找到最大間隔則可以找到最優(yōu)超平面。如圖8?1所示,由此SVM優(yōu)化模型表述如下:
圖8?1
支持向量機(jī)示意圖對(duì)于一個(gè)線性可分的訓(xùn)練集,SVM認(rèn)為存在(ω·b)使得yi[ωTxi+b]≥0。同時(shí)根據(jù)點(diǎn)到平面之間距離的公式,可以得出樣本空間中任意一點(diǎn)到超平面的距離為:距離超平面最近的幾個(gè)點(diǎn)被稱為支持向量,兩類異類向量的距離則為樣本中的間隔D,可以用如下公式描述:8.2支持向量機(jī)算法
8.2.1支持向量機(jī)的模型算法對(duì)于非線性問(wèn)題來(lái)說(shuō),往往無(wú)法在原始樣本空間中尋找到一個(gè)超平面把訓(xùn)練樣本正確分類。SVM的做法是在將原始樣本空間映射到一個(gè)更高的特征空間,以期可以找到一個(gè)超平面,使得樣本集在這個(gè)空間內(nèi)可分。具體做法是令φ(x)表示x映射在特征空間的向量。
特征空間的超平面可以表示為:
則有SVM優(yōu)化模型:
而高維映射φ(x)的線性表達(dá)式不易求出,往往使用如下核函數(shù):
同時(shí)訓(xùn)練集中可能存在一些特異點(diǎn),在特征空間中也找不到線性可分的超平面的情況下,去掉這些特異點(diǎn)后,剩下的大部分訓(xùn)練數(shù)集是線性可分的。8.2支持向量機(jī)算法
8.2.1支持向量機(jī)的模型算法線性不可分意味著某些樣本點(diǎn)(xi,yi)不能滿足間隔大于等于1的條件,樣本點(diǎn)落在超平面與邊界之間。為解決這一問(wèn)題,可以對(duì)每個(gè)樣本點(diǎn)引入一個(gè)松弛變量ξi≥0,使得間隔加上松弛變量大于等于1
這樣約束條件變?yōu)椋?/p>
SVM的優(yōu)化模型則變成:
其中C>0為懲罰參數(shù),C值大時(shí)對(duì)誤分類的懲罰增大,C值小時(shí)對(duì)誤分類的懲罰減小。C主要作用在于使得間隔足夠大,同時(shí)使誤分類點(diǎn)的個(gè)數(shù)盡量少,用于調(diào)和兩者的系數(shù)。8.2支持向量機(jī)算法
8.2.2支持向量機(jī)的模型優(yōu)化算法VM的優(yōu)化模型本身是一個(gè)凸的二次型問(wèn)題,使用原問(wèn)題的對(duì)偶問(wèn)題可以使得優(yōu)化模型可解。原問(wèn)題的模型描述如下所示。
原問(wèn)題的對(duì)偶問(wèn)題定義如下所示。
對(duì)偶問(wèn)題的優(yōu)化模型如下所示。
8.2支持向量機(jī)算法
8.2.2支持向量機(jī)的模型優(yōu)化算法根據(jù)對(duì)偶問(wèn)題的原問(wèn)題,SVM的優(yōu)化模型如下所示。其對(duì)應(yīng)的對(duì)偶問(wèn)題優(yōu)化模型如下所示。而后根據(jù)強(qiáng)對(duì)偶關(guān)系定理,若f(w)為凸函數(shù),且g(w)=Aw+b,g(w)=Cw+d,則此優(yōu)化問(wèn)題的原問(wèn)題與對(duì)偶問(wèn)題的間距為0,即:SVM的最終優(yōu)化模型為:
8.2支持向量機(jī)算法
8.2.3核函數(shù)核函數(shù)是什么?
核函數(shù)是SVM中的重要概念,它允許我們?cè)诘途S空間中進(jìn)行計(jì)算,這樣做的好處是避免了直接在高維空間中進(jìn)行復(fù)雜計(jì)算,從而節(jié)省了計(jì)算資源和時(shí)間。
數(shù)學(xué)上,核函數(shù)是一個(gè)將原始特征空間映射到高維特征空間的函數(shù)。在高維特征空間中,數(shù)據(jù)更有可能是線性可分的。核函數(shù)可以將原始特征空間中的點(diǎn)對(duì)應(yīng)到高維空間中,然后在高維空間中計(jì)算數(shù)據(jù)之間的內(nèi)積,從而實(shí)現(xiàn)在原始特征空間中的非線性分類。核函數(shù)有什么種類?在SVM的最終優(yōu)化模型中,K(xi,yi)被稱為核函數(shù),它滿足Mercer條件的任何對(duì)稱的核函數(shù)對(duì)應(yīng)于樣本空間的點(diǎn)積。核函數(shù)的種類較多,常用的有:1)線性核(LinearKernel):K(xi,yi)=xTy,這是最簡(jiǎn)單的核函數(shù),適用于線性可分問(wèn)題。2)多項(xiàng)核(PolynomialKernel):K(xi,yi)=(xTy+c)α,其中c是一個(gè)常數(shù)項(xiàng),α是多項(xiàng)式的階數(shù)。多項(xiàng)式核函數(shù)可以用于處理一些簡(jiǎn)單的非線性問(wèn)題。3)徑向基核(RadialBasiaFunctionKernel)Rbf(高斯徑向基函數(shù)核):RBF核函數(shù)是非常常用的核函數(shù),適用于各種非線性問(wèn)題。4)Sigmoid核(SigmoidKernel):K(xi,yi)=tanh(βxTy+θ),這個(gè)核函數(shù)的形式基于Sigmoid函數(shù),其中β和θ是參數(shù)。Sigmoid核函數(shù)可以用于神經(jīng)網(wǎng)絡(luò)的模擬,在SVM中被用來(lái)解決二分類問(wèn)題8.2支持向量機(jī)算法
8.2.4支持向量機(jī)算法的計(jì)算機(jī)實(shí)現(xiàn)支持向量機(jī)(SVM)進(jìn)行分類的Python代碼如下所示。1)首先需要在pycharm中添加相應(yīng)的第三方庫(kù),即在文件>設(shè)置>Python解釋器中單擊“+”,如圖8-2所示。圖8?2pycharm中添加第三方庫(kù)8.2支持向量機(jī)算法
8.2.4支持向量機(jī)算法的計(jì)算機(jī)實(shí)現(xiàn)2)在新建的python文件中,書寫相應(yīng)的代碼,如圖8-3所示。圖8?3代碼示例8.2支持向量機(jī)算法
8.2.4支持向量機(jī)算法的計(jì)算機(jī)實(shí)現(xiàn)3)最后單擊運(yùn)行得到分類結(jié)果,如圖8-4所示。圖8?4運(yùn)行代碼8.3.1模糊支持向量機(jī)8.3.2最小二乘支持向量機(jī)8.3支持向量機(jī)算法參數(shù)優(yōu)化8.3.3粒子群算法優(yōu)化支持向量機(jī)8.3支持向量機(jī)算法參數(shù)優(yōu)化
8.3.1模糊支持向量機(jī)(FuzzySupportVectorMachine,FSVM)是什么?
由于支持向量機(jī)對(duì)于離群點(diǎn)和噪點(diǎn)的敏感性,Lin和Wang提出了FSVM,用于有噪聲或離群點(diǎn)的分類。
其中FSVM的關(guān)鍵問(wèn)題在于如何確定隸屬度函數(shù),目前沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)去選擇一個(gè)相對(duì)較為合適的隸屬度,往往需要依據(jù)經(jīng)驗(yàn)來(lái)選擇較為合適的隸屬度函數(shù)。通過(guò)對(duì)每個(gè)輸入的樣本點(diǎn)賦予模糊隸屬度值,使不同的樣本點(diǎn)對(duì)最優(yōu)分類超平面的構(gòu)建具有不同的貢獻(xiàn),降低了噪聲或離群點(diǎn)對(duì)最優(yōu)決策面的影響。8.3支持向量機(jī)算法參數(shù)優(yōu)化
8.3.1模糊支持向量機(jī)(FuzzySupportVectorMachine,FSVM)對(duì)于給定的一組訓(xùn)練樣本集S={(x1,y1,S1),(x2,y2,S2),…,(xm,ym,Sm)},其中xm是樣本空間的樣本點(diǎn),ym是樣本對(duì)應(yīng)的標(biāo)簽,Sm是模糊隸屬度值,代表著樣本點(diǎn)xm歸屬于某一類ym的權(quán)重。與標(biāo)準(zhǔn)的SVM算法一樣,模糊支持向量機(jī)也是尋找一個(gè)能最大化分類間隔的超平面ωTφ(x)+b=0,使得高維的求解最優(yōu)解分類問(wèn)題轉(zhuǎn)化成如下所示的最優(yōu)化問(wèn)題。其中ξi是松弛變量,C是正則化參數(shù)用于平衡分類最大間隔和分類誤差之間的平衡。ξiSm為重要性不同變量的錯(cuò)分程度。當(dāng)Sm越小,ξi的影響越小,則對(duì)應(yīng)的φ(x)對(duì)于分類的作用就越小。SmC則是衡量樣本xi在訓(xùn)練FSVM算法時(shí)的重要程度,SmC的值越大,代表樣本xi被正確分類的可能性越大,反之表示樣本xi被正確分類的可能性越小。要解決上述優(yōu)化問(wèn)題,如同SVM的標(biāo)準(zhǔn)型一樣,構(gòu)造出原問(wèn)題的對(duì)偶問(wèn)題,如下所示。8.3支持向量機(jī)算法參數(shù)優(yōu)化
8.3.1模糊支持向量機(jī)(FuzzySupportVectorMachine,FSVM)根據(jù)強(qiáng)對(duì)偶關(guān)系定理,最后得出:8.3支持向量機(jī)算法參數(shù)優(yōu)化
8.3.1模糊支持向量機(jī)(FuzzySupportVectorMachine,FSVM)那么我們?nèi)绾未_定隸屬度?1)基于距離確定隸屬度函數(shù)該方法是將樣本分為正類和負(fù)類,分別在兩個(gè)類找到中心,通過(guò)各個(gè)樣本到類中心的距離來(lái)確定隸屬度。樣本點(diǎn)到類中心的距離越小,表示該樣本點(diǎn)的隸屬度越大,反之,則表示該樣本點(diǎn)的隸屬度越小。找到兩個(gè)類的中心后,基于類中心的超平面到各個(gè)樣本點(diǎn)的距離來(lái)度量隸屬度函數(shù)的大小。2)基于K近鄰法(KNN)確定隸屬度函數(shù)該方法是在樣本數(shù)據(jù)中找到一個(gè)集合包含其附近的K個(gè)點(diǎn),計(jì)算樣本點(diǎn)到這個(gè)集合中所有點(diǎn)的距離的平均值di,找到其中的最遠(yuǎn)距離dmax和最近距離dmin,帶入如下函數(shù),即為隸屬度函數(shù)。8.3支持向量機(jī)算法參數(shù)優(yōu)化
8.3.2最小二乘支持向量機(jī)LSSVM(LeastSquareSupportVectorMachine,LSSVM)
由于支持向量機(jī)在大規(guī)模訓(xùn)練樣本時(shí),存在訓(xùn)練速度慢、穩(wěn)定性差等缺點(diǎn),且學(xué)習(xí)過(guò)程中需要求解二次規(guī)劃問(wèn)題,從而制約了使用范圍。1999年,Suykens和Vandewalle等人在SVM的基礎(chǔ)上提出LSSVM,該算法的計(jì)算復(fù)雜度大大降低,使得訓(xùn)練速度得到提高。LSSVM方法是在標(biāo)準(zhǔn)支持向量機(jī)的基礎(chǔ)上的一種擴(kuò)展,該算法將支持向量機(jī)的求解從二次規(guī)劃問(wèn)題轉(zhuǎn)化為線性方程組。它與支持向量機(jī)的不同之處在于它把不等式約束改成等式約束,并把經(jīng)驗(yàn)風(fēng)險(xiǎn)由偏差的一次方改為二次方。
給定訓(xùn)練樣本集D={(x1,y1),(x2,y2),…,(xm,ym)},yi∈{-1,+1},首先用非線性φ(x)把樣本空間映射到高維特征空間之中,在這個(gè)高維空間中,劃分樣本空間的超平面用ωTφ(x)+b=0表示。根據(jù)最小二乘支持向量機(jī),利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,將傳統(tǒng)的支持向量機(jī)中的不等式約束問(wèn)題轉(zhuǎn)化為等式約束問(wèn)題,將二次規(guī)劃問(wèn)題轉(zhuǎn)化為線性方程組來(lái)求解,具體如下所示。
最小二乘支持向量機(jī)是一個(gè)帶有等式約束的二次規(guī)劃問(wèn)題,根據(jù)強(qiáng)對(duì)偶關(guān)系定理變形化簡(jiǎn),最后得出最小二乘法支持向量機(jī)的非線性預(yù)測(cè)模型如下所示。8.3支持向量機(jī)算法參數(shù)優(yōu)化
8.3.3粒子群算法優(yōu)化支持向量機(jī)8.3.3.1粒子群算法粒子群優(yōu)化算法的數(shù)學(xué)描述為,在假定的D維空間中,有M個(gè)粒子,每個(gè)粒子代表一個(gè)解。設(shè)第i個(gè)粒子的坐標(biāo)為Xid=(xi1,xi2,xi3,…,xid);第i個(gè)粒子的速度(粒子移動(dòng)的距離和方向)為Vid=(vi1,vi2,vi3,…,vid);第i個(gè)粒子搜索到的最優(yōu)位置為:Pid=(pi1,pi2,pi3,…,pid);群體搜索到的最優(yōu)位置為Pgd=(pg1,pg2,pg3,…,pgd),則,粒子下一步迭代的速度和粒子坐標(biāo)結(jié)果表示為:其中:ω為慣性因子;c1,c2表示學(xué)習(xí)因子,一般取c1=c2;r1,r2表示隨機(jī)參數(shù)數(shù)據(jù)處理給定初始數(shù)據(jù)集及相關(guān)參數(shù)計(jì)算適應(yīng)度更新粒子的位置和速度計(jì)算粒子平均最優(yōu)位置迭代次數(shù)是否達(dá)到上限獲得最優(yōu)SVM參數(shù)8.3支持向量機(jī)算法參數(shù)優(yōu)化
8.3.3粒子群算法優(yōu)化支持向量機(jī)8.3.3.2粒子群優(yōu)化SVM由于SVM的分類效果對(duì)核函數(shù)因子б和懲罰因子C這兩個(gè)參數(shù)的選取有著極高的依賴性,且支持向量機(jī)無(wú)法對(duì)這兩個(gè)參數(shù)閾值進(jìn)行定義,而g趨于∞或g趨于0均不會(huì)產(chǎn)生優(yōu)質(zhì)的學(xué)習(xí)效果,且當(dāng)C的取值不恰當(dāng)時(shí),會(huì)引起模型訓(xùn)練失敗。為了取得更好的效果,通過(guò)PSO算法優(yōu)化SVM模型中的懲罰因子C和核函數(shù)因子б。最后將最優(yōu)參數(shù)代入到SVM模型中進(jìn)行分類預(yù)測(cè)。PSO優(yōu)化SVM參數(shù)過(guò)程如圖8-5所示,具體步驟如下:是否當(dāng)數(shù)據(jù)集的數(shù)量級(jí)相差較大,需進(jìn)行標(biāo)準(zhǔn)化處理8.4算法應(yīng)用和案例分析8.4.1
案例背景8.4.2數(shù)據(jù)集的收集8.4.3劃分訓(xùn)練集和測(cè)試集8.4.4基于SVM的模型預(yù)測(cè)與建立8.4.5結(jié)果分析8.4算法應(yīng)用和案例分析8.4.1
案例背景A公司是國(guó)內(nèi)一家大型電器制造商,專注于空調(diào)產(chǎn)品。他們面臨市場(chǎng)份額下降和智能化趨勢(shì)的挑戰(zhàn)。為了完成企業(yè)轉(zhuǎn)型,公司首先將產(chǎn)品和服務(wù)進(jìn)行升級(jí),以滿足智能化需求。但在這個(gè)過(guò)程中,他們面臨幾個(gè)問(wèn)題:1)智能化推薦方法不成熟,仍然使用傳統(tǒng)的人工推薦方法。2)服務(wù)模塊中的售后維修和保養(yǎng)等基本服務(wù)與競(jìng)爭(zhēng)對(duì)手相比沒(méi)有明顯優(yōu)勢(shì)。3)缺乏系統(tǒng)性的產(chǎn)品和服務(wù)設(shè)計(jì),整合經(jīng)驗(yàn)有限。4)傳統(tǒng)機(jī)器學(xué)習(xí)算法推薦精度低,模型性能差,缺乏研發(fā)和優(yōu)化。
為了實(shí)現(xiàn)智能化服務(wù)化,A公司需要解決這些問(wèn)題。在產(chǎn)品配置方面,他們不僅要提供滿意的產(chǎn)品,還要優(yōu)化相關(guān)服務(wù)。此外,公司還需加強(qiáng)技術(shù)人員培訓(xùn)和招聘,提高推薦精度,研發(fā)新的配置模型,增強(qiáng)客戶滿意度,加強(qiáng)與客戶的聯(lián)系。
為了進(jìn)一步推進(jìn)智能化服務(wù)化轉(zhuǎn)型,他們需要優(yōu)化空調(diào)產(chǎn)品配置方案,使其更加靈活和可持續(xù)。同時(shí),與人工推薦方案進(jìn)行對(duì)比,驗(yàn)證機(jī)器學(xué)習(xí)算法的推薦準(zhǔn)確性,為未來(lái)將機(jī)器學(xué)習(xí)算法作為輔助推薦工具做準(zhǔn)備。8.4算法應(yīng)用和案例分析8.4.2數(shù)據(jù)集的收集根據(jù)公司相關(guān)手冊(cè)、產(chǎn)品目錄以及以往客戶的需求條件,共收集了8種關(guān)于空調(diào)的客戶需求。包括環(huán)保性、穩(wěn)定性、智能性、簡(jiǎn)便性、適應(yīng)性、可靠性、舒適性、能耗性。每種需求的具體描述如表8-1所示。8.4算法應(yīng)用和案例分析8.4.2數(shù)據(jù)集的收集其中每種需求有五個(gè)等級(jí){L,ML,M,MH,H},具體意義為{低,較低,中,較高,高},為了便于計(jì)算機(jī)解讀,用{-2,-1,0,1,2}進(jìn)行代替。具體的需求特征描述如表8-2所示。8.4算法應(yīng)用和案例分析8.4.2數(shù)據(jù)集的收集為了編碼產(chǎn)品,首先要確定產(chǎn)品模塊和服務(wù)模塊。通過(guò)查找相關(guān)的資料,我們了解到中央空調(diào)包括了9個(gè)產(chǎn)品組件,每個(gè)組件都有一個(gè)或多個(gè)實(shí)例,如表8-3所示。8.4算法應(yīng)用和案例分析8.4.2數(shù)據(jù)集的收集在服務(wù)模塊中,一共有5個(gè)模塊,每個(gè)模塊都有多個(gè)實(shí)例如表8-4所示。不同的產(chǎn)品模塊和服務(wù)模塊組成不同的產(chǎn)品配置方案。由于客戶的需求各異,最終確定了6種產(chǎn)品配置方案以滿足不同客戶的需求。例如,產(chǎn)品配置方案“1”可表示為:{A3,B2,C2,D2,E,F1,G,H2,I1,J2,K1,L1,M1,N1}。8.4算法應(yīng)用和案例分析8.4.3劃分訓(xùn)練集和測(cè)試集首先,從公司設(shè)計(jì)和銷售數(shù)據(jù)庫(kù)中提取52個(gè)數(shù)據(jù)樣本,具體數(shù)據(jù)如表8-5所示將52個(gè)樣本劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集的樣本數(shù)量為40個(gè),測(cè)試集的數(shù)量為12。利用粒子群優(yōu)化算法找出SVM模型的最優(yōu)核函數(shù)參數(shù)和懲罰因子參數(shù),最后將最優(yōu)參數(shù)代入SVM模型中進(jìn)行預(yù)測(cè)。SVM模型的輸入為需求特征,輸出為產(chǎn)品服務(wù)系統(tǒng)配置方案。8.4算法應(yīng)用和案例分析8.4.4基于SVM的模型預(yù)測(cè)與建立通過(guò)OVO(OneVsOne,一對(duì)一)方法構(gòu)造多類SVM模型。對(duì)于由OVO方法創(chuàng)建的每個(gè)可能的二進(jìn)制SVM模型,將高斯RBF函數(shù)選擇為內(nèi)核函數(shù)。然后,利用粒子群優(yōu)化(PSO)算法并進(jìn)行5-foldCV的參數(shù)尋優(yōu),找出最優(yōu)參數(shù)對(duì)(C,б)帶入多分類SVM模型對(duì)產(chǎn)品配置進(jìn)行預(yù)測(cè)。在PSO
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024離婚財(cái)產(chǎn)評(píng)估及分配程序合同
- 2025年度消防水源與供水設(shè)施建設(shè)施工協(xié)議4篇
- 2025年度智慧交通設(shè)施安裝與維護(hù)服務(wù)合同3篇
- 2024版正規(guī)的居間服務(wù)合同范本
- 2024跨區(qū)域教育資源共享與合作合同
- 2024年裝修工程專項(xiàng)分包協(xié)議3篇
- 2025年度特色餐飲品牌店面租賃合同3篇
- 2025年度甘肅桉樹(shù)種植與干旱地區(qū)林業(yè)發(fā)展合同3篇
- 2025年度生態(tài)環(huán)保工程承包人工合同模板4篇
- 2025年度倉(cāng)儲(chǔ)物流場(chǎng)地租賃合同12篇
- 髖關(guān)節(jié)脫位-骨傷科
- 鐵路征地拆遷總結(jié)匯報(bào)
- 手術(shù)室護(hù)士的職業(yè)暴露及防護(hù)措施護(hù)理課件
- 水果店選址分析報(bào)告
- 人員測(cè)評(píng)與選拔的主要方法課件
- 智慧審計(jì)方案
- 企業(yè)信息化建設(shè)現(xiàn)狀與未來(lái)規(guī)劃匯報(bào)
- 工程開(kāi)工報(bào)審表及工程開(kāi)工報(bào)審表、開(kāi)工報(bào)告
- 音樂(lè)協(xié)會(huì)管理制度
- 2024年水發(fā)集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 阿米巴落地實(shí)操方案
評(píng)論
0/150
提交評(píng)論