大數(shù)據(jù)分析方法與應(yīng)用課件第7、8章啟發(fā)式算法、支持向量機(jī)

上傳人：h*** IP屬地：山東上傳時(shí)間：2024-10-31 格式：PPTX 頁(yè)數(shù)：74 大?。?.30MB 積分：20 舉報(bào) 版權(quán)申訴

大數(shù)據(jù)分析方法與應(yīng)用課件第7、8章啟發(fā)式算法、支持向量機(jī)_第2頁(yè)

大數(shù)據(jù)分析方法與應(yīng)用課件第7、8章啟發(fā)式算法、支持向量機(jī)_第3頁(yè)

大數(shù)據(jù)分析方法與應(yīng)用課件第7、8章啟發(fā)式算法、支持向量機(jī)_第4頁(yè)

大數(shù)據(jù)分析方法與應(yīng)用課件第7、8章啟發(fā)式算法、支持向量機(jī)_第5頁(yè)

已閱讀5頁(yè)，還剩69頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)分析方法與應(yīng)用第七章啟發(fā)式算法7.1

啟發(fā)式算法的基本原理目錄CONTENTS7.2

啟發(fā)式算法的類型7.3

遺傳算法及其實(shí)現(xiàn)7.4

粒子群算法及其實(shí)現(xiàn)7.5物流配送中心選址案例分析第七章學(xué)習(xí)結(jié)構(gòu)框架啟發(fā)式算法

什么是啟發(fā)式算法？啟發(fā)式算法是一種通過(guò)模擬自然現(xiàn)象或人類的經(jīng)驗(yàn)、知識(shí)和智慧，來(lái)尋求解決方案較優(yōu)或近似最優(yōu)的問(wèn)題求解方法。它能夠在有限時(shí)間內(nèi)找到接近最優(yōu)解的可行解，具有計(jì)算效率高、適應(yīng)性強(qiáng)、魯棒性強(qiáng)、可并行化等特點(diǎn)，并被廣泛應(yīng)用于組合優(yōu)化、機(jī)器學(xué)習(xí)、圖論等實(shí)際問(wèn)題中。7.1

啟發(fā)式算法的基本原理

組合優(yōu)化問(wèn)題人工智能領(lǐng)域數(shù)學(xué)優(yōu)化領(lǐng)域數(shù)據(jù)挖掘和模式識(shí)別領(lǐng)域最小生成樹(shù)調(diào)度和資源分配問(wèn)題多目標(biāo)優(yōu)化問(wèn)題通過(guò)引入啟發(fā)式準(zhǔn)則和尋找合適的搜索策略，可以在多個(gè)領(lǐng)域獲得較好的解決方法。在實(shí)際問(wèn)題中有著廣泛的應(yīng)用前景。啟發(fā)式算法的原理主要分為兩個(gè)方面：?jiǎn)l(fā)式函數(shù)和搜索策略。7.1

啟發(fā)式算法基本原理

7.1.1

啟發(fā)式函數(shù)啟發(fā)式函數(shù)是一種評(píng)估函數(shù)，它根據(jù)特定問(wèn)題的信息來(lái)評(píng)估解的質(zhì)量，并指導(dǎo)算法搜索解空間。在搜索空間中，每個(gè)狀態(tài)都有一個(gè)相應(yīng)的評(píng)估值，而啟發(fā)式函數(shù)本身可以根據(jù)搜索問(wèn)題的特點(diǎn)來(lái)設(shè)計(jì)和選擇。實(shí)踐中，設(shè)計(jì)好的啟發(fā)式函數(shù)可以在找到最優(yōu)解或接近最優(yōu)值的同時(shí)，有效降低搜索空間的大小，從而使算法具有更快的搜索速度。一個(gè)好的啟發(fā)式函數(shù)應(yīng)該滿足以下條件：1）啟發(fā)式函數(shù)應(yīng)該準(zhǔn)確地評(píng)估每個(gè)狀態(tài)，以便在搜索空間中找到最優(yōu)解或接近最優(yōu)值；2）啟發(fā)式函數(shù)應(yīng)該能夠快速計(jì)算，以便算法具有較快的搜索速度；3）啟發(fā)式函數(shù)應(yīng)該合理有效地指導(dǎo)算法搜索，以便算法能夠充分利用先前找到的最優(yōu)解。常用的啟發(fā)式函數(shù)包括曼哈頓距離（ManhattanDistance）、歐幾里得距離（EuclideanDistance）、切比雪夫距離（ChebyshevDistance）等。這些啟發(fā)式函數(shù)可以用于許多優(yōu)化問(wèn)題，如旅行商問(wèn)題、路徑規(guī)劃等。7.1啟發(fā)式算法基本原理

7.1.2

搜索策略一、定義搜索策略作為一種指導(dǎo)搜索過(guò)程的規(guī)則集合，也扮演著啟發(fā)式算法的重要組成部分。搜索策略是指在解空間中進(jìn)行搜索，并從中選擇有可能是最佳解的解。二、分類實(shí)現(xiàn)方式搜索順序隨機(jī)搜索深度優(yōu)先搜索局部搜索廣度優(yōu)先搜索全局搜索遺傳算法7.2

啟發(fā)式算法的類型

啟發(fā)式算法仿植物類算法：模擬植物的生長(zhǎng)、繁殖和適應(yīng)環(huán)境的過(guò)程仿動(dòng)物類算法：模擬動(dòng)物的行為、交流和適應(yīng)環(huán)境的過(guò)程。0102蟻群算法鳥(niǎo)群算法粒子群算法蜂群算法魚群算法蝙蝠算法向光性算法雜草優(yōu)化算法模擬植物生長(zhǎng)算法特點(diǎn)：具有較強(qiáng)的自適應(yīng)性和魯棒性。（魯棒性：系統(tǒng)或算法在面對(duì)異常情況或輸入變化時(shí)能夠保持良好性能的能力）7.2

啟發(fā)式算法的類型

7.2.1

仿動(dòng)物類啟發(fā)式算法——蟻群算法（AntColonyOptimization,ACO）仿動(dòng)物類啟發(fā)式算法利用生物進(jìn)化、個(gè)體行為、群體行為等動(dòng)物的特征來(lái)進(jìn)行優(yōu)化求解，其最主要的特點(diǎn)是能夠考慮群體的可行性，解決發(fā)現(xiàn)局部最優(yōu)的問(wèn)題，提高搜索算法的效率。蟻群算法是基于螞蟻的運(yùn)動(dòng)規(guī)律，通過(guò)模擬螞蟻在搜索過(guò)程中沿路徑釋放信息素、揮發(fā)信息素等行為模式，來(lái)搜索全局最優(yōu)或局部最優(yōu)解。螞蟻在移動(dòng)過(guò)程中會(huì)釋放信息素，信息素越高表示該路徑被螞蟻選擇的概率越大，所以螞蟻更傾向于選擇信息素濃度高且長(zhǎng)度短的路徑。應(yīng)用：組合優(yōu)化問(wèn)題、路徑規(guī)劃問(wèn)題、調(diào)度問(wèn)題，易陷入局部最優(yōu)7.2

啟發(fā)式算法的類型

7.2.1

仿動(dòng)物類啟發(fā)式算法——粒子群算法（ParticleSwarmOptimization,PSO）粒子群算法是基于鳥(niǎo)類在尋找食物等過(guò)程中的覓食行為而設(shè)計(jì)的，這種算法通過(guò)模擬鳥(niǎo)類協(xié)作尋找最優(yōu)優(yōu)化結(jié)果；粒子群算法的基本思想是將待優(yōu)化問(wèn)題轉(zhuǎn)化為一個(gè)多維搜索空間中的優(yōu)化問(wèn)題，每個(gè)粒子代表一個(gè)可能的解，并根據(jù)自身的經(jīng)驗(yàn)和群體的經(jīng)驗(yàn)來(lái)更新自己的位置和速度。粒子的位置表示解的值，速度表示解的搜索方向和步長(zhǎng)。更新速度過(guò)程包括粒子向自己歷史最優(yōu)位置靠近和向群體歷史最優(yōu)位置靠近。應(yīng)用：函數(shù)優(yōu)化、組合優(yōu)化、參數(shù)優(yōu)化、非線性優(yōu)化問(wèn)題7.2啟發(fā)式算法的類型

7.2.1

仿動(dòng)物類啟發(fā)式算法——蜂群算法（BeeAlgorithm）蜂群算法是由國(guó)外學(xué)者于2005年首次提出，是一種基于蜜蜂覓食行為的啟發(fā)式優(yōu)化算法。蜜蜂覓食行為中包含了一系列的搜索、選擇和通信過(guò)程，這些行為被模擬為算法的操作?；舅枷耄和ㄟ^(guò)模擬蜜蜂在搜索食物源時(shí)的行為尋找問(wèn)題的最優(yōu)解。蜂群算法的搜索過(guò)程是一個(gè)迭代的過(guò)程，每一次迭代中，蜜蜂們根據(jù)一定的規(guī)則進(jìn)行搜索，并根據(jù)搜索結(jié)果更新自己的位置和狀態(tài)。具有較好的全局搜索能力和收斂性能。它可以應(yīng)用于多種優(yōu)化問(wèn)題，如函數(shù)優(yōu)化、組合優(yōu)化、路徑規(guī)劃等。（引領(lǐng)蜂）7.2

啟發(fā)式算法的類型

7.2.1仿動(dòng)物類啟發(fā)式算法——魚群算法（FishSchoolSearch,FSS）魚群算法是由李曉磊博士于2003年提出的，是一種基于模擬自然界魚群食物搜索行為的啟發(fā)式優(yōu)化算法。該算法受到魚群行為的啟發(fā)，模擬了魚群中魚的個(gè)體行為和群體行為，用于解決優(yōu)化問(wèn)題?；舅枷耄和ㄟ^(guò)個(gè)體之間的相互作用和信息交流，以及對(duì)環(huán)境的感知和適應(yīng)，實(shí)現(xiàn)問(wèn)題的求解。具有較強(qiáng)的全局搜索能力和較快的收斂速度。（一片水域，如果某個(gè)地方的魚類數(shù)目最多，那么這個(gè)地方一般來(lái)說(shuō)就是水域內(nèi)富含營(yíng)養(yǎng)物質(zhì)最多的地方，依據(jù)這一特點(diǎn)來(lái)模仿魚群的覓食、聚群、追尾、隨機(jī)行為，以實(shí)現(xiàn)全局尋優(yōu)的目的。）應(yīng)用：各種需要尋找最優(yōu)解的問(wèn)題，尤其是那些復(fù)雜、高維、非線性的優(yōu)化問(wèn)題。優(yōu)點(diǎn)：并行性強(qiáng)、全局搜索能力強(qiáng)、適應(yīng)性強(qiáng)、算法簡(jiǎn)單易實(shí)現(xiàn)。7.2

啟發(fā)式算法的類型

7.2.1

仿動(dòng)物類啟發(fā)式算法——蝙蝠算法（BatAlgorithm）蝙蝠算法是由英國(guó)科學(xué)家Yang教授于2010年提出的一種模擬蝙蝠群體行為的啟發(fā)式優(yōu)化算法?；舅枷耄耗M蝙蝠在尋找食物和繁殖過(guò)程中的行為。蝙蝠在夜間通過(guò)發(fā)出超聲波信號(hào)來(lái)探測(cè)周圍環(huán)境，并根據(jù)接收到的回聲來(lái)判斷目標(biāo)的位置。發(fā)現(xiàn)目標(biāo)后，它會(huì)朝著目標(biāo)飛去，并通過(guò)調(diào)整頻率和聲音的強(qiáng)度來(lái)調(diào)整自己的飛行方向和速度。應(yīng)用：各種優(yōu)化問(wèn)題，特別是連續(xù)優(yōu)化問(wèn)題優(yōu)點(diǎn)：算法基本思想簡(jiǎn)單，易于理解和實(shí)現(xiàn)缺點(diǎn)：存在多個(gè)參數(shù)需要去設(shè)置，如蝙蝠個(gè)體的速度、頻率等，對(duì)初始解敏感，不同的初始解可能導(dǎo)致不同的搜索結(jié)果7.2

啟發(fā)式算法的類型

7.2.1

仿植物類啟發(fā)式算法算法名稱概念基本思想應(yīng)用向光性算法（PhototaxisAlgorithm）用于解決優(yōu)化問(wèn)題的算法，也稱為光子算法。該算法模擬了光在環(huán)境中的傳播和反射過(guò)程，通過(guò)光的傳播路徑來(lái)搜索最優(yōu)解通過(guò)模擬生物體對(duì)光的感知和移動(dòng)來(lái)解決優(yōu)化問(wèn)題連續(xù)優(yōu)化問(wèn)題和多模態(tài)優(yōu)化問(wèn)題雜草優(yōu)化算法（WeedOptimizationAlgorithm,WOA）一種基于仿生學(xué)的優(yōu)化算法通過(guò)模擬雜草的生長(zhǎng)過(guò)程來(lái)求解優(yōu)化問(wèn)題機(jī)器學(xué)習(xí)、圖像處理、電力系統(tǒng)優(yōu)化模擬植物生長(zhǎng)算法(PlantGrowthSimulationAlgorithm,PGSA)一種以植物向光性機(jī)理（形態(tài)素濃度理論）為啟發(fā)準(zhǔn)則的智能優(yōu)化算法。通過(guò)模擬植物的生理機(jī)制和生長(zhǎng)規(guī)律來(lái)解決問(wèn)題，可以應(yīng)用于多種問(wèn)題的求解函數(shù)優(yōu)化、組合優(yōu)化、圖像處理（全局搜索）7.3

遺傳算法及其實(shí)現(xiàn)

7.3.1

遺傳算法的原理一、概念遺傳算法（GeneticAlgorithm,GA）起源于對(duì)生物系統(tǒng)所進(jìn)行的計(jì)算機(jī)模擬研究，是一種隨機(jī)全局搜索優(yōu)化方法。二、原理遺傳算法通過(guò)模擬自然選擇和遺傳中發(fā)生的復(fù)制、交叉和變異等現(xiàn)象，從任一初始種群出發(fā)，通過(guò)隨機(jī)選擇、交叉和變異操作，產(chǎn)生一群更適合環(huán)境的個(gè)體，使群體進(jìn)化到搜索空間中越來(lái)越好的區(qū)域，這樣一代一代不斷繁衍進(jìn)化，最后收斂到一群最適應(yīng)環(huán)境的個(gè)體，從而求得問(wèn)題的優(yōu)質(zhì)解。三、優(yōu)勢(shì)在求解較為復(fù)雜的組合優(yōu)化問(wèn)題時(shí)，相對(duì)一些常規(guī)的優(yōu)化算法，遺傳算法通常能夠較快地獲得較好的優(yōu)化結(jié)果。四、應(yīng)用車間調(diào)度、機(jī)器仿真、信號(hào)處理

7.3

遺傳算法及其實(shí)現(xiàn)

7.3.1

遺傳算法的原理四、常用術(shù)語(yǔ)算法名稱概念染色體（Chromosome）染色體又可稱為基因型個(gè)體（Individuals），一定數(shù)量的個(gè)體組成了群體（Population），群體中個(gè)體的數(shù)量叫作群體大?。≒opulationsize）。位串（BitString）個(gè)體的表示形式，對(duì)應(yīng)于遺傳學(xué)中的染色體。基因（Gene）基因是染色體中的元素，用于表示個(gè)體的特征。例如有一個(gè)位串（即染色體）S=1011，則其中的1，0，1，1這4個(gè)元素分別稱為基因。特征值（Feature）在用位串表示整數(shù)時(shí)，基因的特征值與二進(jìn)制數(shù)的權(quán)一致，例如在串S=1011中，基因位置3中的1，它的基因特征值為2；基因位置1中的1，它的基因特征值為8適應(yīng)度（Fitness）各個(gè)體對(duì)環(huán)境的適應(yīng)程度叫作適應(yīng)度。為了體現(xiàn)染色體的適應(yīng)能力，引入了對(duì)問(wèn)題中的每一個(gè)染色體都能進(jìn)行度量的函數(shù)，叫適應(yīng)度函數(shù)。這個(gè)函數(shù)通常會(huì)被用來(lái)計(jì)算個(gè)體在群體中被使用的概率?；蛐停℅enotype）或稱遺傳型，是指基因組定義遺傳特征和表現(xiàn)，對(duì)應(yīng)于GA中的位串表現(xiàn)型（Phenotype）指的是生物體的基因型在特定環(huán)境下的表現(xiàn)特征，對(duì)應(yīng)于GA中的位串解碼后的參數(shù)。7.3

遺傳算法及其實(shí)現(xiàn)

7.3.2

遺傳算法的步驟初始化種群：隨機(jī)生成一組初始個(gè)體，形成初始種群。評(píng)估適應(yīng)度：適應(yīng)度函數(shù)表明個(gè)體或解的優(yōu)劣性。根據(jù)具體問(wèn)題計(jì)算群體P(t)中各個(gè)個(gè)體的適應(yīng)度。遺傳算子：選擇操作、交叉操作、變異操作、終止判斷條件7.3

遺傳算法及其實(shí)現(xiàn)

7.3.3

遺傳算法的計(jì)算機(jī)實(shí)現(xiàn)常用軟件MATLAB是一種高級(jí)的數(shù)學(xué)計(jì)算軟件，它提供了豐富的工具箱和函數(shù)，可以方便地實(shí)現(xiàn)遺傳算法。Python是一種通用的編程語(yǔ)言，擁有豐富的科學(xué)計(jì)算庫(kù)，如NumPy、SciPy和DEAP等，可以用于實(shí)現(xiàn)遺傳算法。Java是一種廣泛使用的編程語(yǔ)言，它提供了強(qiáng)大的面向?qū)ο蟮木幊棠芰Γ梢杂糜趯?shí)現(xiàn)遺傳算法。7.3

遺傳算法及其實(shí)現(xiàn)

7.3.3

遺傳算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證Python軟件的實(shí)現(xiàn)初始化種群優(yōu)勝劣汰7.3

遺傳算法及其實(shí)現(xiàn)

7.3.3

遺傳算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證Python軟件的實(shí)現(xiàn)交配生殖、變異7.3

遺傳算法及其實(shí)現(xiàn)

7.3.3

遺傳算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證Python軟件的實(shí)現(xiàn)生物遺傳進(jìn)化7.4

粒子群算法及其實(shí)現(xiàn)

7.4.1粒子群算法的原理一、粒子群算法的靈感來(lái)源

粒子群算法被提出的靈感來(lái)源于鳥(niǎo)群覓食，鳥(niǎo)群覓食過(guò)程中，每只鳥(niǎo)沿著各個(gè)方向飛行去尋找食物，每只鳥(niǎo)兒都能記住到目前為止自己在飛行過(guò)程中最接近食物的位置，同時(shí)每只鳥(niǎo)兒之間也有信息共享，它們會(huì)比較到目前為止各自與食物之間的最近距離，從各自的最近距離中，選擇并記憶整體的一個(gè)最近距離位置。二、數(shù)學(xué)模型

每只鳥(niǎo)兒就是一個(gè)粒子，食物的位置也就是問(wèn)題的最優(yōu)解，鳥(niǎo)兒與食物的距離也即當(dāng)前粒子的目標(biāo)函數(shù)值。7.4

粒子群算法及其實(shí)現(xiàn)

7.4.2

粒子群算法的步驟對(duì)于每個(gè)粒子，它包含的元素：當(dāng)前時(shí)刻位置：(x1,x2,...,xn)當(dāng)前時(shí)刻的目標(biāo)函數(shù)值（也稱為適應(yīng)度）：f(x1,x2,...,xn)該粒子的歷史最優(yōu)位置：(x1_pbest，x2_pbest，...，xn_pbest)該粒子的歷史最優(yōu)目標(biāo)函數(shù)值：f_pbest=f(x1_pbest，x2_pbest，...，xn_pbest)對(duì)于全部粒子，它們共有的元素：粒子總數(shù)：num迭代總次數(shù)：cnt。粒子群算法也是一個(gè)迭代的過(guò)程，需要多次迭代才能獲取到理想的最優(yōu)解。全局最優(yōu)位置：(x1_gbest，x2_gbest，...，xn_gbest)全局最優(yōu)目標(biāo)函數(shù)值：f_gbest=f(x1_gbest，x2_gbest，...，xn_gbest)位置隨機(jī)化的上下限：xmin，xmax。迭代開(kāi)始的時(shí)候以及迭代的過(guò)程中，均需要對(duì)粒子的位置進(jìn)行隨機(jī)分布，需要設(shè)置隨機(jī)分布的上下限，不然隨機(jī)分布偏離得太遠(yuǎn)，會(huì)嚴(yán)重影響優(yōu)化結(jié)果。速度的上下限：Vmin，Vmax。迭代過(guò)程中，速度也具有一定的隨機(jī)性，需要限制速度的大小在一定范圍內(nèi)，不然如果速度值太大也會(huì)嚴(yán)重影響優(yōu)化結(jié)果。速度計(jì)算參數(shù)：c1、c2。通常取1.0~1.8的值。速度更新：Vi=w*Vi+c1*rand()*(pbesti+Xi)+c2*rand()*(gbest-Xi)位置更新：Xi=Xi+Vi7.4粒子群算法及其實(shí)現(xiàn)

7.4.3粒子群算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證設(shè)定PSO初始參數(shù)本節(jié)用Python軟件對(duì)粒子群算法進(jìn)行實(shí)現(xiàn)，問(wèn)題描述：求y=x2-4x+3最小值。7.4粒子群算法及其實(shí)現(xiàn)

7.4.3粒子群算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證設(shè)定目標(biāo)函數(shù)及初始化種群7.4粒子群算法及其實(shí)現(xiàn)

7.4.3粒子群算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證更新粒子速度和位置7.4粒子群算法及其實(shí)現(xiàn)

7.4.3粒子群算法的計(jì)算機(jī)實(shí)現(xiàn)——驗(yàn)證圖形可視化7.5

物流配送中心案例分析

一、問(wèn)題：

一共有五個(gè)配送中心候選節(jié)點(diǎn)，其建設(shè)成本和坐標(biāo)如表7-1所示。供應(yīng)點(diǎn)有13個(gè)，其坐標(biāo)和運(yùn)輸量如表7-2所示，通過(guò)遺傳算法分析配送中心可覆蓋的供應(yīng)點(diǎn)。配送中心候選節(jié)點(diǎn)建設(shè)成本（萬(wàn)元）坐標(biāo)15495.7（58.9,45.2）23458.8（54.9,117）34226.7（114,135）47294.2（67.7,195）58560.2（176,149）供應(yīng)點(diǎn)坐標(biāo)運(yùn)輸量1(106,74.1)67.572(105,117)107.153(74.9,91.5)221.564(81.8,147)293.935(136,161)105.536(192,43.4)191.167(39.9,63.0)285.48續(xù)表：8(37.7,85.3)197.079(41.7,152)304.2410(12.4,100)217.8211(31.7,9.80)100.9612(32.9,189)61.4713(159,218)258.37.5

物流配送中心案例分析

二、解題思路——提出假設(shè)

1）在一定備選范圍內(nèi)進(jìn)行配送中心的選取。2）供應(yīng)點(diǎn)數(shù)目多于配送中心數(shù)目。3）一個(gè)供應(yīng)點(diǎn)僅由一個(gè)配送中心提供配送服務(wù)，但一個(gè)配送中心可覆蓋多個(gè)供應(yīng)點(diǎn)。4）配送中心容量可滿足各供應(yīng)網(wǎng)點(diǎn)的總需求量。5）各供應(yīng)點(diǎn)配送需求一次性運(yùn)輸完成，且假設(shè)勻速行駛。6）只考慮配送中心建設(shè)成本、運(yùn)輸成本。符號(hào)及定義：

I：表示供應(yīng)點(diǎn)集合；

J：表示配送中心集合；

Cij：從供應(yīng)點(diǎn)i到配送中心j的運(yùn)輸成本；

qij：供應(yīng)點(diǎn)i到配送中心j的運(yùn)輸量；

fj：配送中心j的建設(shè)成本；

Dj：配送中心j的需求量；

P：配送中心的最大建設(shè)數(shù)量；

Mj：配送中心j的最大容量。7.5物流配送中心案例分析

二、解題思路——確定目標(biāo)函數(shù)及約束條件

目標(biāo)函數(shù)：

，表示總費(fèi)用最小約束條件1：

，配送中心的數(shù)量為2個(gè)；約束條件2：

從供應(yīng)點(diǎn)到配送中心的數(shù)量大于等于配送中心的需求量；約束條件3：

，配送中心容納能力限制；約束條件4：

，

，變量取值。7.5

物流配送中心案例分析

二、解題思路——Python

運(yùn)行

由備選中心2配送的需求點(diǎn)有：3，7，8，9，10，11，12；由備選中心3配送的需求點(diǎn)有：1，2，4，5，6，13。課后習(xí)題1.使用模擬退火算法求解函數(shù)f(x)=-x2+2x+3在[0,2]區(qū)間內(nèi)的最大值，初始溫度為T=100，降溫系數(shù)為0.95。2.使用禁忌搜索算法求解函數(shù)f(x)=-x2+2x+3在[0,2]區(qū)間內(nèi)的最大值，初始解為x=1.5，禁忌列表長(zhǎng)度為5，最大迭代次數(shù)為10000。3.使用遺傳算法求解函數(shù)f(x,y)=-x2-y2+10在[-10,10]區(qū)間內(nèi)的最大值，種群大小為10，交叉概率為0.8，變異概率為0.2，最大迭代次數(shù)為100。4.使用蟻群算法求解TSP問(wèn)題，有4個(gè)城市分別為A、B、C、D，求出最優(yōu)路徑和路徑長(zhǎng)度。5.使用免疫算法求解函數(shù)f(x)=-x?+2x3-3x2在[-2,3]區(qū)間內(nèi)的最大值，種群大小為20，突變概率為0.1，克隆選擇參數(shù)為b=5。6.使用粒子群算法求解函數(shù)f(x,y)=x2+y2在[-5,5]區(qū)間內(nèi)的最小值，種群大小為10，慣性權(quán)重w=0.7，個(gè)體學(xué)習(xí)因子c1=1.5，社會(huì)學(xué)習(xí)因子c2=2，最大迭代次數(shù)為100。7.使用遺傳算法求解背包問(wèn)題，有5個(gè)物品，重量分別為2、3、4、5、6，價(jià)值分別為3、4、5、6、7，背包的最大承重為10。求出背包能裝下的最大總價(jià)值以及裝入的物品。8.使用人工免疫算法求解函數(shù)f(x)=-x2+3x+4在[-2,3]區(qū)間內(nèi)的最大值，種群大小為10，克隆選擇參數(shù)為m=4，突變概率為0.1。Thank

you!大數(shù)據(jù)分析方法與應(yīng)用第8章支持向量機(jī)8.1支持向量機(jī)的原理目錄CONTENTS8.2支持向量機(jī)算法8.3支持向量機(jī)算法參數(shù)優(yōu)化8.4算法應(yīng)用及案例分析8.5課后習(xí)題第8章支持向量機(jī)8.1.1支持向量機(jī)的由來(lái)8.1.2支持向量機(jī)的發(fā)展8.1支持向量機(jī)的原理8.1支持向量機(jī)原理

支持向量機(jī)是什么？支持向量機(jī)（SupportVectorMachine，SVM）是一種以統(tǒng)計(jì)學(xué)習(xí)為基礎(chǔ)的強(qiáng)大的監(jiān)督學(xué)習(xí)算法，通常用于分類和回歸問(wèn)題。SVM在機(jī)器學(xué)習(xí)領(lǐng)域非常流行，并被廣泛應(yīng)用于各種領(lǐng)域，如文本分類、圖像識(shí)別、生物信息學(xué)和金融預(yù)測(cè)等。SVM的核心思想是在特征空間中找到一個(gè)最優(yōu)的超平面，將不同類別的數(shù)據(jù)點(diǎn)分開(kāi)，并且使得超平面與最近的數(shù)據(jù)點(diǎn)之間的間隔盡可能大。這些最近的數(shù)據(jù)點(diǎn)被稱為“支持向量”，因?yàn)樗鼈儗?duì)于定義分類邊界非常重要。8.1支持向量機(jī)原理

8.1.1支持向量機(jī)的由來(lái)SVM的早期發(fā)展始于統(tǒng)計(jì)學(xué)習(xí)理論，該理論是一種使用統(tǒng)計(jì)的方法專門研究小樣本情況下機(jī)器學(xué)習(xí)規(guī)律的理論并且針對(duì)小樣本問(wèn)題建立了一套全新的理論體系，其統(tǒng)計(jì)推理規(guī)則不僅考慮了對(duì)漸進(jìn)性能的要求，而且追求在現(xiàn)有有限信息的條件下得到最后結(jié)果Vapnik在該理論中提出了結(jié)構(gòu)風(fēng)險(xiǎn)最小化（StructuralRiskMinimization,SRM）的概念，該概念強(qiáng)調(diào)在進(jìn)行模型選擇時(shí)需要平衡模型的經(jīng)驗(yàn)誤差和模型的復(fù)雜性，以實(shí)現(xiàn)更好的泛化性能。具體來(lái)說(shuō)結(jié)構(gòu)化風(fēng)險(xiǎn)可以分為結(jié)構(gòu)風(fēng)險(xiǎn)和置信風(fēng)險(xiǎn)。結(jié)構(gòu)風(fēng)險(xiǎn)指的是給定樣本上的分類誤差，而置信風(fēng)險(xiǎn)是指在未知樣本的分類誤差。我們?cè)谟?xùn)練模型時(shí)會(huì)讓結(jié)構(gòu)風(fēng)險(xiǎn)變得很小，但是這個(gè)模型能否預(yù)測(cè)未知樣本則需關(guān)注置信風(fēng)險(xiǎn)。訓(xùn)練樣本數(shù)越多置信風(fēng)險(xiǎn)也越小。而分類函數(shù)越復(fù)雜，則會(huì)導(dǎo)致其普適性變差，增加置信風(fēng)險(xiǎn)。SVM的研究意義就是讓結(jié)構(gòu)風(fēng)險(xiǎn)和置信風(fēng)險(xiǎn)的和最小。8.1支持向量機(jī)原理

8.1.2支持向量機(jī)的發(fā)展最早的SVM是用于線性可分?jǐn)?shù)據(jù)的，研究主要集中在找到最大間隔超平面和支持向量的數(shù)學(xué)推導(dǎo)與算法優(yōu)化上。Vapnik和Cortes首次提出了現(xiàn)代形式的線性SVM，其基本思想是通過(guò)拉格朗日乘數(shù)法將線性可分問(wèn)題轉(zhuǎn)化為凸優(yōu)化問(wèn)題，并利用對(duì)偶問(wèn)題求解得到支持向量為了應(yīng)對(duì)現(xiàn)實(shí)世界中存在的線性不可分?jǐn)?shù)據(jù)，研究者又提出了軟間隔SVM，引入松弛變量來(lái)容忍一定的誤分類1995年為了應(yīng)對(duì)現(xiàn)實(shí)世界中存在的線性不可分?jǐn)?shù)據(jù)8.1支持向量機(jī)原理

8.1.2支持向量機(jī)的發(fā)展提出了一對(duì)多（One-vs-Rest）和一對(duì)一（One-vs-One）等策略來(lái)處理多類別分類問(wèn)題。開(kāi)始的SVM是針對(duì)二分類問(wèn)題的，但實(shí)際中存在多類別分類的需求研究者提出了核函數(shù)的概念，將數(shù)據(jù)映射到高維特征空間，并在高維空間中尋找線性可分的超平面由于實(shí)際數(shù)據(jù)往往是復(fù)雜的、非線性可分的8.1支持向量機(jī)原理

8.1.1支持向量機(jī)的由來(lái)8.1支持向量機(jī)原理

8.1.1支持向量機(jī)的由來(lái)支持向量機(jī)原理這些豆子叫做data，把線叫做classifier,最大間隙trick叫做optimization，拍桌子叫做kernelling核函數(shù),那張紙叫做hyperplane超平面8.2.1支持向量機(jī)的模型算法8.2.2支持向量機(jī)模型優(yōu)化算法8.2支持向量機(jī)算法8.2.3核函數(shù)8.2.4支持向量機(jī)算法的計(jì)算機(jī)實(shí)現(xiàn)8.2支持向量機(jī)算法

8.2.1支持向量機(jī)的模型算法給定訓(xùn)練樣本集:

D={(x1,y1),…,(xm,ym)}其中xi∈Rn,yi∈{-1,+1},i=1,...,m，Rn表示n維歐式空間。劃分超平面的線性方程描述：分類學(xué)習(xí)最基本的思想就是基于訓(xùn)練樣本集D在樣本空間中找到一個(gè)超平面，將不同的樣本分開(kāi)。找到最大間隔則可以找到最優(yōu)超平面。如圖8?1所示，由此SVM優(yōu)化模型表述如下：

圖8?1

支持向量機(jī)示意圖對(duì)于一個(gè)線性可分的訓(xùn)練集，SVM認(rèn)為存在(ω·b)使得yi[ωTxi+b]≥0。同時(shí)根據(jù)點(diǎn)到平面之間距離的公式，可以得出樣本空間中任意一點(diǎn)到超平面的距離為：距離超平面最近的幾個(gè)點(diǎn)被稱為支持向量，兩類異類向量的距離則為樣本中的間隔D，可以用如下公式描述：8.2支持向量機(jī)算法

8.2.1支持向量機(jī)的模型算法對(duì)于非線性問(wèn)題來(lái)說(shuō)，往往無(wú)法在原始樣本空間中尋找到一個(gè)超平面把訓(xùn)練樣本正確分類。SVM的做法是在將原始樣本空間映射到一個(gè)更高的特征空間，以期可以找到一個(gè)超平面，使得樣本集在這個(gè)空間內(nèi)可分。具體做法是令φ(x)表示x映射在特征空間的向量。

特征空間的超平面可以表示為：

則有SVM優(yōu)化模型：

而高維映射φ(x)的線性表達(dá)式不易求出，往往使用如下核函數(shù)：

同時(shí)訓(xùn)練集中可能存在一些特異點(diǎn)，在特征空間中也找不到線性可分的超平面的情況下，去掉這些特異點(diǎn)后，剩下的大部分訓(xùn)練數(shù)集是線性可分的。8.2支持向量機(jī)算法

8.2.1支持向量機(jī)的模型算法線性不可分意味著某些樣本點(diǎn)(xi,yi)不能滿足間隔大于等于1的條件，樣本點(diǎn)落在超平面與邊界之間。為解決這一問(wèn)題，可以對(duì)每個(gè)樣本點(diǎn)引入一個(gè)松弛變量ξi≥0，使得間隔加上松弛變量大于等于1

這樣約束條件變?yōu)椋?/p>

SVM的優(yōu)化模型則變成：

其中C>0為懲罰參數(shù)，C值大時(shí)對(duì)誤分類的懲罰增大，C值小時(shí)對(duì)誤分類的懲罰減小。C主要作用在于使得間隔足夠大，同時(shí)使誤分類點(diǎn)的個(gè)數(shù)盡量少，用于調(diào)和兩者的系數(shù)。8.2支持向量機(jī)算法

8.2.2支持向量機(jī)的模型優(yōu)化算法VM的優(yōu)化模型本身是一個(gè)凸的二次型問(wèn)題，使用原問(wèn)題的對(duì)偶問(wèn)題可以使得優(yōu)化模型可解。原問(wèn)題的模型描述如下所示。

原問(wèn)題的對(duì)偶問(wèn)題定義如下所示。

對(duì)偶問(wèn)題的優(yōu)化模型如下所示。

8.2支持向量機(jī)算法

8.2.2支持向量機(jī)的模型優(yōu)化算法根據(jù)對(duì)偶問(wèn)題的原問(wèn)題，SVM的優(yōu)化模型如下所示。其對(duì)應(yīng)的對(duì)偶問(wèn)題優(yōu)化模型如下所示。而后根據(jù)強(qiáng)對(duì)偶關(guān)系定理，若f(w)為凸函數(shù)，且g(w)=Aw+b，g(w)=Cw+d，則此優(yōu)化問(wèn)題的原問(wèn)題與對(duì)偶問(wèn)題的間距為0，即：SVM的最終優(yōu)化模型為：

8.2支持向量機(jī)算法

8.2.3核函數(shù)核函數(shù)是什么？

核函數(shù)是SVM中的重要概念，它允許我們?cè)诘途S空間中進(jìn)行計(jì)算，這樣做的好處是避免了直接在高維空間中進(jìn)行復(fù)雜計(jì)算，從而節(jié)省了計(jì)算資源和時(shí)間。

數(shù)學(xué)上，核函數(shù)是一個(gè)將原始特征空間映射到高維特征空間的函數(shù)。在高維特征空間中，數(shù)據(jù)更有可能是線性可分的。核函數(shù)可以將原始特征空間中的點(diǎn)對(duì)應(yīng)到高維空間中，然后在高維空間中計(jì)算數(shù)據(jù)之間的內(nèi)積，從而實(shí)現(xiàn)在原始特征空間中的非線性分類。核函數(shù)有什么種類？在SVM的最終優(yōu)化模型中，K(xi,yi)被稱為核函數(shù)，它滿足Mercer條件的任何對(duì)稱的核函數(shù)對(duì)應(yīng)于樣本空間的點(diǎn)積。核函數(shù)的種類較多，常用的有：1）線性核（LinearKernel）：K(xi,yi)=xTy，這是最簡(jiǎn)單的核函數(shù)，適用于線性可分問(wèn)題。2）多項(xiàng)核（PolynomialKernel）：K(xi,yi)=(xTy+c)α，其中c是一個(gè)常數(shù)項(xiàng)，α是多項(xiàng)式的階數(shù)。多項(xiàng)式核函數(shù)可以用于處理一些簡(jiǎn)單的非線性問(wèn)題。3）徑向基核（RadialBasiaFunctionKernel）Rbf（高斯徑向基函數(shù)核）：RBF核函數(shù)是非常常用的核函數(shù)，適用于各種非線性問(wèn)題。4）Sigmoid核（SigmoidKernel）：K(xi,yi)=tanh(βxTy+θ)，這個(gè)核函數(shù)的形式基于Sigmoid函數(shù)，其中β和θ是參數(shù)。Sigmoid核函數(shù)可以用于神經(jīng)網(wǎng)絡(luò)的模擬，在SVM中被用來(lái)解決二分類問(wèn)題8.2支持向量機(jī)算法

8.2.4支持向量機(jī)算法的計(jì)算機(jī)實(shí)現(xiàn)支持向量機(jī)（SVM）進(jìn)行分類的Python代碼如下所示。1）首先需要在pycharm中添加相應(yīng)的第三方庫(kù)，即在文件＞設(shè)置＞Python解釋器中單擊“+”，如圖8-2所示。圖8?2pycharm中添加第三方庫(kù)8.2支持向量機(jī)算法

8.2.4支持向量機(jī)算法的計(jì)算機(jī)實(shí)現(xiàn)2）在新建的python文件中，書寫相應(yīng)的代碼，如圖8-3所示。圖8?3代碼示例8.2支持向量機(jī)算法

8.2.4支持向量機(jī)算法的計(jì)算機(jī)實(shí)現(xiàn)3）最后單擊運(yùn)行得到分類結(jié)果，如圖8-4所示。圖8?4運(yùn)行代碼8.3.1模糊支持向量機(jī)8.3.2最小二乘支持向量機(jī)8.3支持向量機(jī)算法參數(shù)優(yōu)化8.3.3粒子群算法優(yōu)化支持向量機(jī)8.3支持向量機(jī)算法參數(shù)優(yōu)化

8.3.1模糊支持向量機(jī)（FuzzySupportVectorMachine,FSVM）是什么？

由于支持向量機(jī)對(duì)于離群點(diǎn)和噪點(diǎn)的敏感性，Lin和Wang提出了FSVM，用于有噪聲或離群點(diǎn)的分類。

其中FSVM的關(guān)鍵問(wèn)題在于如何確定隸屬度函數(shù)，目前沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)去選擇一個(gè)相對(duì)較為合適的隸屬度，往往需要依據(jù)經(jīng)驗(yàn)來(lái)選擇較為合適的隸屬度函數(shù)。通過(guò)對(duì)每個(gè)輸入的樣本點(diǎn)賦予模糊隸屬度值，使不同的樣本點(diǎn)對(duì)最優(yōu)分類超平面的構(gòu)建具有不同的貢獻(xiàn)，降低了噪聲或離群點(diǎn)對(duì)最優(yōu)決策面的影響。8.3支持向量機(jī)算法參數(shù)優(yōu)化

8.3.1模糊支持向量機(jī)（FuzzySupportVectorMachine,FSVM）對(duì)于給定的一組訓(xùn)練樣本集S={(x1,y1,S1),(x2,y2,S2),…,(xm,ym,Sm)}，其中xm是樣本空間的樣本點(diǎn)，ym是樣本對(duì)應(yīng)的標(biāo)簽，Sm是模糊隸屬度值，代表著樣本點(diǎn)xm歸屬于某一類ym的權(quán)重。與標(biāo)準(zhǔn)的SVM算法一樣，模糊支持向量機(jī)也是尋找一個(gè)能最大化分類間隔的超平面ωTφ(x)+b=0，使得高維的求解最優(yōu)解分類問(wèn)題轉(zhuǎn)化成如下所示的最優(yōu)化問(wèn)題。其中ξi是松弛變量，C是正則化參數(shù)用于平衡分類最大間隔和分類誤差之間的平衡。ξiSm為重要性不同變量的錯(cuò)分程度。當(dāng)Sm越小，ξi的影響越小，則對(duì)應(yīng)的φ(x)對(duì)于分類的作用就越小。SmC則是衡量樣本xi在訓(xùn)練FSVM算法時(shí)的重要程度，SmC的值越大，代表樣本xi被正確分類的可能性越大，反之表示樣本xi被正確分類的可能性越小。要解決上述優(yōu)化問(wèn)題，如同SVM的標(biāo)準(zhǔn)型一樣，構(gòu)造出原問(wèn)題的對(duì)偶問(wèn)題，如下所示。8.3支持向量機(jī)算法參數(shù)優(yōu)化

8.3.1模糊支持向量機(jī)（FuzzySupportVectorMachine,FSVM）根據(jù)強(qiáng)對(duì)偶關(guān)系定理，最后得出：8.3支持向量機(jī)算法參數(shù)優(yōu)化

8.3.1模糊支持向量機(jī)（FuzzySupportVectorMachine,FSVM）那么我們?nèi)绾未_定隸屬度？1）基于距離確定隸屬度函數(shù)該方法是將樣本分為正類和負(fù)類，分別在兩個(gè)類找到中心，通過(guò)各個(gè)樣本到類中心的距離來(lái)確定隸屬度。樣本點(diǎn)到類中心的距離越小，表示該樣本點(diǎn)的隸屬度越大，反之，則表示該樣本點(diǎn)的隸屬度越小。找到兩個(gè)類的中心后，基于類中心的超平面到各個(gè)樣本點(diǎn)的距離來(lái)度量隸屬度函數(shù)的大小。2）基于K近鄰法（KNN）確定隸屬度函數(shù)該方法是在樣本數(shù)據(jù)中找到一個(gè)集合包含其附近的K個(gè)點(diǎn)，計(jì)算樣本點(diǎn)到這個(gè)集合中所有點(diǎn)的距離的平均值di，找到其中的最遠(yuǎn)距離dmax和最近距離dmin，帶入如下函數(shù)，即為隸屬度函數(shù)。8.3支持向量機(jī)算法參數(shù)優(yōu)化

8.3.2最小二乘支持向量機(jī)LSSVM（LeastSquareSupportVectorMachine,LSSVM）

由于支持向量機(jī)在大規(guī)模訓(xùn)練樣本時(shí)，存在訓(xùn)練速度慢、穩(wěn)定性差等缺點(diǎn)，且學(xué)習(xí)過(guò)程中需要求解二次規(guī)劃問(wèn)題，從而制約了使用范圍。1999年，Suykens和Vandewalle等人在SVM的基礎(chǔ)上提出LSSVM，該算法的計(jì)算復(fù)雜度大大降低，使得訓(xùn)練速度得到提高。LSSVM方法是在標(biāo)準(zhǔn)支持向量機(jī)的基礎(chǔ)上的一種擴(kuò)展，該算法將支持向量機(jī)的求解從二次規(guī)劃問(wèn)題轉(zhuǎn)化為線性方程組。它與支持向量機(jī)的不同之處在于它把不等式約束改成等式約束，并把經(jīng)驗(yàn)風(fēng)險(xiǎn)由偏差的一次方改為二次方。

給定訓(xùn)練樣本集D={(x1,y1),(x2,y2),…,(xm,ym)},yi∈{-1,+1}，首先用非線性φ(x)把樣本空間映射到高維特征空間之中，在這個(gè)高維空間中，劃分樣本空間的超平面用ωTφ(x)+b=0表示。根據(jù)最小二乘支持向量機(jī)，利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則，將傳統(tǒng)的支持向量機(jī)中的不等式約束問(wèn)題轉(zhuǎn)化為等式約束問(wèn)題，將二次規(guī)劃問(wèn)題轉(zhuǎn)化為線性方程組來(lái)求解，具體如下所示。

最小二乘支持向量機(jī)是一個(gè)帶有等式約束的二次規(guī)劃問(wèn)題，根據(jù)強(qiáng)對(duì)偶關(guān)系定理變形化簡(jiǎn)，最后得出最小二乘法支持向量機(jī)的非線性預(yù)測(cè)模型如下所示。8.3支持向量機(jī)算法參數(shù)優(yōu)化

8.3.3粒子群算法優(yōu)化支持向量機(jī)8.3.3.1粒子群算法粒子群優(yōu)化算法的數(shù)學(xué)描述為，在假定的D維空間中，有M個(gè)粒子，每個(gè)粒子代表一個(gè)解。設(shè)第i個(gè)粒子的坐標(biāo)為Xid=(xi1,xi2,xi3,…,xid)；第i個(gè)粒子的速度（粒子移動(dòng)的距離和方向）為Vid=(vi1,vi2,vi3,…,vid)；第i個(gè)粒子搜索到的最優(yōu)位置為：Pid=(pi1,pi2,pi3,…,pid)；群體搜索到的最優(yōu)位置為Pgd=(pg1,pg2,pg3,…,pgd)，則，粒子下一步迭代的速度和粒子坐標(biāo)結(jié)果表示為：其中：ω為慣性因子；c1，c2表示學(xué)習(xí)因子，一般取c1=c2；r1，r2表示隨機(jī)參數(shù)數(shù)據(jù)處理給定初始數(shù)據(jù)集及相關(guān)參數(shù)計(jì)算適應(yīng)度更新粒子的位置和速度計(jì)算粒子平均最優(yōu)位置迭代次數(shù)是否達(dá)到上限獲得最優(yōu)SVM參數(shù)8.3支持向量機(jī)算法參數(shù)優(yōu)化

8.3.3粒子群算法優(yōu)化支持向量機(jī)8.3.3.2粒子群優(yōu)化SVM由于SVM的分類效果對(duì)核函數(shù)因子б和懲罰因子C這兩個(gè)參數(shù)的選取有著極高的依賴性，且支持向量機(jī)無(wú)法對(duì)這兩個(gè)參數(shù)閾值進(jìn)行定義，而ｇ趨于∞或ｇ趨于0均不會(huì)產(chǎn)生優(yōu)質(zhì)的學(xué)習(xí)效果，且當(dāng)C的取值不恰當(dāng)時(shí)，會(huì)引起模型訓(xùn)練失敗。為了取得更好的效果，通過(guò)PSO算法優(yōu)化SVM模型中的懲罰因子C和核函數(shù)因子б。最后將最優(yōu)參數(shù)代入到SVM模型中進(jìn)行分類預(yù)測(cè)。PSO優(yōu)化SVM參數(shù)過(guò)程如圖8-5所示，具體步驟如下：是否當(dāng)數(shù)據(jù)集的數(shù)量級(jí)相差較大，需進(jìn)行標(biāo)準(zhǔn)化處理8.4算法應(yīng)用和案例分析8.4.1

案例背景8.4.2數(shù)據(jù)集的收集8.4.3劃分訓(xùn)練集和測(cè)試集8.4.4基于SVM的模型預(yù)測(cè)與建立8.4.5結(jié)果分析8.4算法應(yīng)用和案例分析8.4.1

案例背景A公司是國(guó)內(nèi)一家大型電器制造商，專注于空調(diào)產(chǎn)品。他們面臨市場(chǎng)份額下降和智能化趨勢(shì)的挑戰(zhàn)。為了完成企業(yè)轉(zhuǎn)型，公司首先將產(chǎn)品和服務(wù)進(jìn)行升級(jí)，以滿足智能化需求。但在這個(gè)過(guò)程中，他們面臨幾個(gè)問(wèn)題：1）智能化推薦方法不成熟，仍然使用傳統(tǒng)的人工推薦方法。2）服務(wù)模塊中的售后維修和保養(yǎng)等基本服務(wù)與競(jìng)爭(zhēng)對(duì)手相比沒(méi)有明顯優(yōu)勢(shì)。3）缺乏系統(tǒng)性的產(chǎn)品和服務(wù)設(shè)計(jì)，整合經(jīng)驗(yàn)有限。4）傳統(tǒng)機(jī)器學(xué)習(xí)算法推薦精度低，模型性能差，缺乏研發(fā)和優(yōu)化。

為了實(shí)現(xiàn)智能化服務(wù)化，A公司需要解決這些問(wèn)題。在產(chǎn)品配置方面，他們不僅要提供滿意的產(chǎn)品，還要優(yōu)化相關(guān)服務(wù)。此外，公司還需加強(qiáng)技術(shù)人員培訓(xùn)和招聘，提高推薦精度，研發(fā)新的配置模型，增強(qiáng)客戶滿意度，加強(qiáng)與客戶的聯(lián)系。

為了進(jìn)一步推進(jìn)智能化服務(wù)化轉(zhuǎn)型，他們需要優(yōu)化空調(diào)產(chǎn)品配置方案，使其更加靈活和可持續(xù)。同時(shí)，與人工推薦方案進(jìn)行對(duì)比，驗(yàn)證機(jī)器學(xué)習(xí)算法的推薦準(zhǔn)確性，為未來(lái)將機(jī)器學(xué)習(xí)算法作為輔助推薦工具做準(zhǔn)備。8.4算法應(yīng)用和案例分析8.4.2數(shù)據(jù)集的收集根據(jù)公司相關(guān)手冊(cè)、產(chǎn)品目錄以及以往客戶的需求條件，共收集了8種關(guān)于空調(diào)的客戶需求。包括環(huán)保性、穩(wěn)定性、智能性、簡(jiǎn)便性、適應(yīng)性、可靠性、舒適性、能耗性。每種需求的具體描述如表8-1所示。8.4算法應(yīng)用和案例分析8.4.2數(shù)據(jù)集的收集其中每種需求有五個(gè)等級(jí){L,ML,M,MH,H}，具體意義為{低，較低，中，較高，高}，為了便于計(jì)算機(jī)解讀，用{-2,-1,0,1,2}進(jìn)行代替。具體的需求特征描述如表8-2所示。8.4算法應(yīng)用和案例分析8.4.2數(shù)據(jù)集的收集為了編碼產(chǎn)品，首先要確定產(chǎn)品模塊和服務(wù)模塊。通過(guò)查找相關(guān)的資料，我們了解到中央空調(diào)包括了9個(gè)產(chǎn)品組件，每個(gè)組件都有一個(gè)或多個(gè)實(shí)例，如表8-3所示。8.4算法應(yīng)用和案例分析8.4.2數(shù)據(jù)集的收集在服務(wù)模塊中，一共有5個(gè)模塊，每個(gè)模塊都有多個(gè)實(shí)例如表8-4所示。不同的產(chǎn)品模塊和服務(wù)模塊組成不同的產(chǎn)品配置方案。由于客戶的需求各異，最終確定了6種產(chǎn)品配置方案以滿足不同客戶的需求。例如，產(chǎn)品配置方案“1”可表示為：{A3,B2,C2,D2,E,F1,G,H2,I1,J2,K1,L1,M1,N1}。8.4算法應(yīng)用和案例分析8.4.3劃分訓(xùn)練集和測(cè)試集首先，從公司設(shè)計(jì)和銷售數(shù)據(jù)庫(kù)中提取52個(gè)數(shù)據(jù)樣本，具體數(shù)據(jù)如表8-5所示將52個(gè)樣本劃分為訓(xùn)練集和測(cè)試集，訓(xùn)練集的樣本數(shù)量為40個(gè)，測(cè)試集的數(shù)量為12。利用粒子群優(yōu)化算法找出SVM模型的最優(yōu)核函數(shù)參數(shù)和懲罰因子參數(shù)，最后將最優(yōu)參數(shù)代入SVM模型中進(jìn)行預(yù)測(cè)。SVM模型的輸入為需求特征，輸出為產(chǎn)品服務(wù)系統(tǒng)配置方案。8.4算法應(yīng)用和案例分析8.4.4基于SVM的模型預(yù)測(cè)與建立通過(guò)OVO（OneVsOne,一對(duì)一）方法構(gòu)造多類SVM模型。對(duì)于由OVO方法創(chuàng)建的每個(gè)可能的二進(jìn)制SVM模型，將高斯RBF函數(shù)選擇為內(nèi)核函數(shù)。然后，利用粒子群優(yōu)化（PSO）算法并進(jìn)行5-foldCV的參數(shù)尋優(yōu)，找出最優(yōu)參數(shù)對(duì)（C,б）帶入多分類SVM模型對(duì)產(chǎn)品配置進(jìn)行預(yù)測(cè)。在PSO

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)分析方法與應(yīng)用課件第7、8章啟發(fā)式算法、支持向量機(jī)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

大數(shù)據(jù)分析方法與應(yīng)用 課件 第7、8章 啟發(fā)式算法、支持向量機(jī)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

大數(shù)據(jù)分析方法與應(yīng)用課件第7、8章啟發(fā)式算法、支持向量機(jī)