基于pso-svm的木材近紅外光譜分析模型_第1頁
基于pso-svm的木材近紅外光譜分析模型_第2頁
基于pso-svm的木材近紅外光譜分析模型_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于pso-svm的木材近紅外光譜分析模型

隨著我國經(jīng)濟(jì)和社會(huì)的快速發(fā)展,木材的需求也在增加。因此,我們需要一種快速、準(zhǔn)確的木材性質(zhì)檢驗(yàn)方法,這對(duì)提高我國的樹木生長(zhǎng)質(zhì)量、木材遺傳改善和木材效率具有重要意義。近紅外光譜分析技術(shù)是一種新型的分析技術(shù),它能夠快速、準(zhǔn)確地對(duì)固體、液體、粉末狀等有機(jī)物樣品的物理、力學(xué)和化學(xué)性質(zhì)進(jìn)行無損檢測(cè)。國外將偏最小二乘回歸、近紅外光譜等技術(shù)應(yīng)用到木材的化學(xué)性質(zhì)、物理性質(zhì)、力學(xué)性質(zhì)等方面的研究,中國林科院也出現(xiàn)了預(yù)測(cè)木材密度、水分、腐朽類型以及杉木木質(zhì)素含量等的研究報(bào)道,他們主要采用的偏最小二乘或者傳統(tǒng)的SVM結(jié)合近紅外光譜的方法。木質(zhì)素是植物體中含量較高的天然高分子聚合物??焖?、準(zhǔn)確、低成本的評(píng)價(jià)木材中木質(zhì)素的含量成為充分合理利用木材資源的一個(gè)重要研究?jī)?nèi)容。粒子群算法(Parti-cleSwarmOptimization,PSO)作為近年來發(fā)展起來優(yōu)化計(jì)算方法,由于其容易實(shí)現(xiàn)且具有深刻的智能背景,已經(jīng)被廣泛的應(yīng)用于函數(shù)優(yōu)化、模式識(shí)別等領(lǐng)域。支持向量機(jī)(SupportVectorMachine,SVM)是Vapink等于1995年首先提出的,它在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),并能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中[13,14,15,16,17,18]。本文在掌握了近紅外光譜分析技術(shù)的相關(guān)理論和方法的基礎(chǔ)上,研究并建立了基于支持向量機(jī)的桉木中木質(zhì)素含量的預(yù)測(cè)模型,利用粒子群算法快速全局優(yōu)化的特點(diǎn)優(yōu)化了其模型參數(shù),并與傳統(tǒng)的支持向量回歸模型[20,21,22,23,24,25,26]和偏最小二乘回歸模型做了比較,結(jié)果證明該方法具有較高的準(zhǔn)確度,可以用于桉木中木質(zhì)素含量的測(cè)定。1原則和方法1.1最優(yōu)分類面的線性映射支持向量機(jī)(SVM)是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則基礎(chǔ)上的學(xué)習(xí)方法,它以訓(xùn)練誤差作為優(yōu)化問題的約束條件,以置信范圍值最小化作為優(yōu)化目標(biāo),根據(jù)有限樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以期獲得最好的泛化能力。最早用于二分類,其基本思想是根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,構(gòu)造一個(gè)凸二次規(guī)劃問題,來尋找滿足分類要求的最優(yōu)分割超平面。在引入Vapnik提出的不敏感損失函數(shù)后,支持向量機(jī)也可用來解決非線性的回歸和函數(shù)逼近問題。使用一非線性映射把數(shù)據(jù)映射到一個(gè)高維特征空間,再在高維特征空間進(jìn)行線性回歸,從而取得在原空間非線性回歸的效果。在最優(yōu)分類面中采用適當(dāng)?shù)膬?nèi)積函數(shù)K(xi,xj)就可以實(shí)現(xiàn)某一非線性變換后的線性分類。本實(shí)驗(yàn)采用K(xi,x)=exp{-‖x-xi‖/2δ2}作為支持向量機(jī)的核函數(shù)。1.2懲罰參數(shù)c和核函數(shù)c的選取確定了核函數(shù)后,要對(duì)核函數(shù)的參量進(jìn)行優(yōu)化,核函數(shù)參量對(duì)模型會(huì)產(chǎn)生很大的影響,徑向基核函數(shù)所要確定的參量有懲罰系數(shù)C和核函數(shù)的寬度參量γ,因此,怎樣選擇懲罰參數(shù)C和核參數(shù)γ對(duì)所建模型的預(yù)測(cè)精度尤為關(guān)鍵,以往用戶一般是依靠經(jīng)驗(yàn)選取,使得結(jié)果的好壞往往依賴于計(jì)算者的水平,并且大多數(shù)情況下得出的預(yù)測(cè)精度很低。本文嘗試?yán)弥С窒蛄繖C(jī)風(fēng)險(xiǎn)最小化和粒子群算法快速全局優(yōu)化的特點(diǎn),采用粒子群算法快速優(yōu)化支持向量機(jī)的模型參數(shù)。1.3利用pso算法進(jìn)行參數(shù)選擇粒子群優(yōu)化算法(PSO)最早是由Kennedy和Eberhart于1995年提出的一種啟發(fā)式全局優(yōu)化技術(shù)。它是一種基于群體智能的演化計(jì)算方法,源于對(duì)鳥群群體運(yùn)動(dòng)行為的研究。同遺傳算法類似,每個(gè)粒子被隨機(jī)的初始化以表示一個(gè)可能的解,并在解空間通過更新迭代搜索最優(yōu)解,但它沒有遺傳算法用的交叉以及變異操作,粒子群在一個(gè)n維空間中搜索,問題的解對(duì)應(yīng)每個(gè)粒子所處的位置,各個(gè)粒子記憶追隨當(dāng)前最優(yōu)粒子不斷調(diào)整自己的位置來搜素新解。PSO的優(yōu)勢(shì)在于算法簡(jiǎn)單,對(duì)目標(biāo)函數(shù)要求少,受問題維數(shù)變化影響小,收斂速度快,魯棒性高,易于實(shí)現(xiàn)而又功能強(qiáng)大。因此,為了使支持向量機(jī)獲得更好的預(yù)測(cè)效果,我們?cè)噲D利用粒子群算法(PSO)的全局搜索能力對(duì)SVM中的參數(shù)進(jìn)行搜索,通過PSO算法的設(shè)置來控制參數(shù)的選擇方向,實(shí)現(xiàn)預(yù)測(cè)目標(biāo)。利用PSO完成支持向量機(jī)參數(shù)選擇的算法如下。步驟1:初始化PSO的各種參數(shù)(群體規(guī)模、學(xué)習(xí)因子、迭代的最大次數(shù)、粒子的初始位置和速度等)。步驟2:分別對(duì)每個(gè)粒子向量利用SVM對(duì)學(xué)習(xí)樣本進(jìn)行預(yù)測(cè),得到各粒子當(dāng)前位置值的預(yù)測(cè)誤差,并將其作為各粒子的適應(yīng)度值,再將各粒子的當(dāng)前適應(yīng)度值與該粒子自身的最優(yōu)適應(yīng)度值進(jìn)行比較,如果更優(yōu),則將粒子當(dāng)前的位置作為該粒子的最優(yōu)位置。步驟3:將各粒子的自身最優(yōu)位置適應(yīng)度值與群體最優(yōu)位置的適應(yīng)度值比較,如果更優(yōu),則將該粒子的最優(yōu)位置作為群體的最優(yōu)位置。步驟4:根據(jù)步驟2及步驟3更新粒子的速度和位置。步驟5:檢查是否達(dá)到預(yù)先設(shè)定的最大迭代次數(shù)或預(yù)設(shè)精度,即是否滿足尋優(yōu)結(jié)束條件,若滿足則結(jié)束尋優(yōu),求出最優(yōu)解;否則轉(zhuǎn)至步驟2,繼續(xù)新一輪搜索。利用PSO算法對(duì)于SVM的參數(shù)進(jìn)行自動(dòng)選擇,一方面可以克服人為選擇的隨機(jī)性,另一方面可以通過粒子適應(yīng)度函數(shù)的設(shè)置,實(shí)現(xiàn)控制參數(shù)選擇方向的目的。在進(jìn)行參數(shù)選擇時(shí)我們將再一次用到交叉驗(yàn)證法,在交叉驗(yàn)證中,我們首先將訓(xùn)練集合劃分成相同大小的v個(gè)子集。然后將其中一個(gè)子集作為測(cè)試集,其他(v-1)個(gè)子集作為訓(xùn)練集訓(xùn)練回歸器。如此,整個(gè)訓(xùn)練集中的每個(gè)實(shí)例都會(huì)被預(yù)測(cè)一次,交叉驗(yàn)證的準(zhǔn)確率等于能夠被正確預(yù)測(cè)的數(shù)量百分比。2結(jié)果與分析2.1光譜數(shù)據(jù)預(yù)處理樣品采集于安徽省黃山市人工林桉木生長(zhǎng)錐共48個(gè)。光譜儀器為美國ADS公司生產(chǎn)的Fieldspec近紅外光譜儀,采用光纖探頭采集樣品表面的近紅外光譜,測(cè)定波長(zhǎng)范圍350~2500nm。如圖1所示。在近紅外光譜采集過程中,由于木材樣品不經(jīng)過預(yù)處理,樣品光譜易受樣品狀態(tài)、測(cè)量條件等因素影響,造成基線漂移、儀器隨機(jī)誤差和環(huán)境背景噪聲等因素的干擾。因此,在進(jìn)行光譜分析之前,需要對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,以增強(qiáng)光譜有效信息,消除各種干擾因素的影響。目前,木材光譜分析常用的光譜預(yù)處理方法是對(duì)光譜數(shù)據(jù)進(jìn)行平滑處理或光譜數(shù)據(jù)進(jìn)導(dǎo)數(shù)處理。光譜數(shù)據(jù)平滑是將平滑窗口內(nèi)的數(shù)據(jù)進(jìn)行平均或擬合,可以有效去除高頻噪聲。由圖2,波長(zhǎng)在350和2500nm附近,光譜檢測(cè)器達(dá)到了邊緣狀態(tài),產(chǎn)生了樣品光譜噪聲,因此選取全光譜的400~2450nm部分進(jìn)行分析。以48個(gè)桉木近紅外光譜作為實(shí)驗(yàn)對(duì)象,其中40個(gè)樣本用作訓(xùn)練集,8個(gè)樣本用作測(cè)試集,采用移動(dòng)平均平滑法對(duì)光譜數(shù)據(jù)進(jìn)行去噪,最后對(duì)其作標(biāo)準(zhǔn)歸一化(0,1)處理,得到最終的支持向量機(jī)輸入數(shù)據(jù)。2.2回歸預(yù)測(cè)模型的測(cè)試與分析PSO-SVM模型是在MATLAB環(huán)境下編制和運(yùn)行的。設(shè)置粒子群搜索參數(shù):群體規(guī)模為20,粒的向量維數(shù)為2,c1=1.5,c2=1.7,迭代次數(shù)為200。最優(yōu)粒子的適應(yīng)度變化如圖3所示。獲得的最優(yōu)參數(shù)為c=1.0057,g=0.01,將訓(xùn)練后的模型用于測(cè)試樣本的判別,得到回歸預(yù)測(cè)模型的均方根誤差為0.0021545,相關(guān)系數(shù)為97.0956%。為了考察PSO-SVM模型的預(yù)測(cè)效果,同傳統(tǒng)的SVM模型(采用網(wǎng)格算法進(jìn)行參數(shù)尋優(yōu))和偏最小二乘回歸模型進(jìn)行了比較,由表1和表2可以看出,用粒子群優(yōu)化算法改進(jìn)的支持向量機(jī)模型對(duì)木材近紅外光譜進(jìn)行預(yù)測(cè),最大相對(duì)誤差小于3%,均方根誤差=0.0021545,相關(guān)系數(shù)=0.970956,優(yōu)于傳統(tǒng)支持向量機(jī)模型和偏最小二回歸模型,所建模型具有很好的預(yù)測(cè)效果和實(shí)際意義。3木材近紅外光譜定量分析的應(yīng)用效果分析提出了基于粒子群算法的支持向量機(jī)回歸模型,并應(yīng)用到木材近紅外光譜的定量分析研究中,可以看到,該算法在桉木木質(zhì)素含量的預(yù)測(cè)中獲得了良好的效果,且預(yù)測(cè)精度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論