版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、.光譜變換技術結合連續(xù)投影算法在模型簡化中的應用 專業(yè):測控技術與儀器 學號:20070310110104 摘要小波變換(Wavelet Transformer,WT)技術結合連續(xù)投影算法(Successive Projection Algorithm,SPA)用于近紅外光譜(Near Infrared Spectroscopy,Vis/NIR)和拉曼光譜(Raman Spectroscopy,RS)有效建模波長的選擇,并采用選擇后的變量建立偏最小二乘回歸(Partial least squares Regression,PLSR)模型。分別采用近紅外透射光譜和RS技術對葡萄酒酒精度和藥片活性
2、成分含量進行定量分析。將107個葡萄酒樣品的近紅外光譜按照近似2:1的比例進行校正集和預測集樣本的選擇,因此,71個樣本作為校正集,36個樣本作為預測集,將WT-SPA-PLSR方法用于葡萄酒酒精度分析,結果表明,采用WT-SPA-PLSR方法后,酒精度模型的預測均方根誤差(root mean square error of prediction,RMSEP)由12.594減小為12.548,預測相關系數(Correlation coefficient,R)沒有變化仍為0.951,AIC值由5040.199減小為152.694,建模變量由69個變?yōu)?7個;將120個藥片的RS按照2:1的比例進
3、行樣品集劃分,80個樣本作為校正集,40個樣本作為預測集,將WT-SPA-PLSR方法用于藥片活性成分含量分析,結果表明,采用WT-SPA-PLSR方法后,藥片活性成分含量的RMSEP由7.561變?yōu)?.689,R沒有變化仍為0.929,AIC值由7406.874減小為201.484,建模變量都是78個。因此,采用WT-SPA-PLSR方法不僅可以提高Vis/NIR分析模型的精度,而且可以有效簡化模型;采用WT-SPA-PLSR方法雖然沒有提高RS分析模型的精度,但是誤差相差不大,更為重要的是,采用WT-SPA-PLSR方法可以有效簡化RS分析模型。關鍵詞:小波變換;連續(xù)投影算法;近紅外光譜;
4、拉曼光譜;偏最小二乘法By using Spectrum change technology combined with Successive Projection Algorithm to simplified model Abstract Wavelet Transformer(WT) combined with Successive Projection Algorithm (SPA) were used to select effective wavelengths from Near Infrared Spectroscopy (Vis/NIR) and Raman Spectros
5、copy(RS).The selected effective wavelengths were as inputs of Partial least squares Regression (PLSR) model. Using Vis/NIR technique to analyze the alcohol content in wine, and using RM technique to analyze the active substance contents of pharmaceutical tables. Separate Vis/NIR of wine samples into
6、 71 samples for calibration and 36 samples for prediction according to the proportion of approximate two for one. Using the method of WT-SPA-PLSR to analyze the alcohol content in wine. Results show that after adopting the method of WT-SPA-PLSR, root mean square error of prediction (RMSEP) of the mo
7、del of wine is from 12.594 reduced to 12.548, Correlation coefficient(R) remain unchanged, is still 0.951,value of AIC is from 5040.199 reduced to 152.694,variables for building model are from 69 reduced to 67.Separate RM of pharmaceutical tables into 80 samples for calibration and 40 samples for pr
8、ediction according to the proportion of two for one. Using the method of WT-SPA-PLSR to analyze the active substance contents of pharmaceutical tables. Results show that after adopting the method of WT-SPA-PLSR, RMSEP of the active substance contents of pharmaceutical tables is by 7.561 into 7.689,R
9、 is still 0.929,value of AIC is from 7406.874 reduced to 201.484, variables for building model remain unchanged, are still 78. So, adopt the method of WT-SPA-PLSR can not only improve the precision of the analysis model of Vis/NIR, and can effectively simplified model. However, there is no improveme
10、nt in prediction accuracy of the analysis model of RS, there is not much difference between analysis model with and without adopting the method of WT-SPA-PLSR. Most important is the method of WT-SPA-PLSR can effectively simplified model. Keyword:Wavelet Transformer; Successive Projection Algorithm;
11、Near Infrared Spectroscopy;Raman Spectroscopy;Partial least squares Regression目錄摘要- 1 -Abstract- 2 -第一章 緒論- 4 -1.1 近紅外光譜介紹- 4 -1.2 拉曼光譜介紹- 4 -1.3 常用波長選擇方法- 5 -1.4 常用預處理方法- 5 -第二章 材料和方法- 7 -2.1樣本采集- 7 -2.1.1葡萄酒近紅外光譜的采集- 7 -2.1.2藥片拉曼光譜采集- 7 -2.2小波變換原理- 7 -2.3連續(xù)投影算法的實現- 8 -2.4偏最小二乘回歸模型的建立- 9 -2.5 AIC信息
12、標準值- 13 -第三章 實驗結果和分析- 13 -3.1近紅外光譜實驗數據分析- 13 -3.2近紅外光譜實驗結果和分析- 13 -3.2.1原始光譜建模- 13 -3.2.2應用SPA選取有效波長建模- 15 -3.2.3應用WT-SPA選取有效波長建模- 15 -3.3拉曼光譜實驗數據分析- 16 -3.4藥片拉曼光譜的實驗結果和分析- 17 -3.4.1原始光譜建模- 17 -3.4.2應用SPA選取有效波長建模- 18 -3.4.3應用WT-SPA選取有效波長建模- 18 -第四章 結論- 20 -參考文獻- 21 -第一章 緒論1.1 近紅外光譜介紹 酒精度是葡萄酒的一個重要理化指
13、標,如何對其進行快速、簡便、準確地測定,對葡萄酒產品的品質及其質量監(jiān)控都具有重要的意義1 王豪,鄔蓓蕾,林振興,岑倩.傅里葉變換近紅外光譜法快速測定葡萄酒中的酒精度J.China Brewing,2008,184:72-73.1。測定葡萄酒中酒精度的國家標準(GB/T 5009.48)需將酒樣先蒸餾、定容,再用比重瓶或酒精計法測定,方法費時、費力,且測定結果只能保留一位小數,儀器分析方法(如氣相色普法)分析酒中酒精度操作復雜,且儀器昂貴1。本文將采用近紅外光譜(Near Infrared Spectroscopy,Vis/NIR)分析技術進行葡萄酒酒精含量測定的研究。近年來,隨著計算技術的進步
14、和測試技術的提升,現代Vis/NIR分析技術以其分析速度快、效率高、成本低和易于實現在線分析等特點,在農業(yè),醫(yī)藥、石化、煙草和食品等行業(yè)得到廣泛應用2 高洪智,盧啟鵬,丁海泉,彭忠琦.連續(xù)投影算法的土壤總氮近紅外特征波長的選取J.光譜學與光譜分析,2009,29(11):2951-2954。Vis/NIR的信息來源于有機物分子的C-H、N-H、O-H等含羥基團發(fā)生的倍頻以及合頻對光能量的吸收,不同基團產生的光譜在吸收峰位和強度上有所不同,并隨樣品組成的變化其光譜在特征也發(fā)生變化,這就為Vis/NIR的定性和定量分析奠定了理論基礎1。Vis/NIR譜峰較寬、信號較弱、吸收波段歸屬不明確且嚴重重疊
15、,其數據通常呈多變量、強相關性、與樣品組成含量成線性關系,利用全波段進行建模分析時,光譜中的大量冗余信息及噪聲等使模型的性能受到影響。針對于近紅外的這些特點,在利用光譜建模前,通常需要對其預處理或波長選擇,在紛繁復雜的光譜信息中提取有用的信息,提高模型校正的速度和建模的效率是本文研究的重點。1.2 拉曼光譜介紹拉曼光譜(Raman Spectroscopy,RS)又稱為拉曼效應,是由其發(fā)現者印度人C.V.Raman命名的,RS是研究分子振動、轉動的一種光譜方法。RS產生的原理和機制都與紅外光譜不同,但它提供的結構信息卻是類似的,都是關于分子內部各種簡正振動頻率及有關振動能級的情況,從而可以用來
16、鑒定分子中的官能團。分子偶極矩變化是紅外光譜產生的原因,而RS是分子極化率變化誘導產生的,它的譜線強度取決于相應的簡正振動過程中極化率的變化的大小,在分子結構分析中,RS與紅外光譜是相互補充的。因此,一些在紅外光譜儀無法檢測的信息在RS能很好地表現出來。拉曼效應普遍存在于一切分子中,無論是氣態(tài),液態(tài)和固態(tài),拉曼散射光譜對于樣品制備沒有特殊要求;對于樣品數量要求比較少,可以使毫克甚至微克的數量級。拉曼散射最突出的優(yōu)點是采用光子探針,對于樣品是無損傷探測,尤其適合對那些稀有或珍貴的樣品進行分析,甚至可以用RS檢測活體中的生物物質。RS的缺點之一是會產生熒光干擾,樣品一旦產生熒光,RS會被熒光所堙滅
17、檢測不到樣品的拉曼信號。為使檢測靈敏度低3 田國輝,陳亞杰,馮清茂.拉曼光譜的發(fā)展及應用J.化學工程師,2008,148(1):34-36.。本文將利用葡萄酒Vis/NIR和藥片RS作為研究對象建模,因此,在利用光譜建立校正模型前,通常需要對其預處理或波長選擇,即針對特定的樣品體系,通過對光譜的適當選擇、處理和變換,削弱以至于消除各種非目標因素對光譜的影響,提高物系性質參數對光譜的分辨率和靈敏度4 成忠,張立慶,劉赫揚,諸愛士.連續(xù)投影算法及其在小麥近紅外光譜波長選擇中的應用J.光譜學與光譜分析,2010,30(4):949-9524。1.3 常用波長選擇方法常用的波長選擇方法,如相關系數法5
18、 Min M,Lee W S.Determination of significant wavelengths and prediction of nitrogen content for citrusJ.Trans.ASAE,2005,48(2):455-461.5、載荷值法6 Wu D,He Y,Feng S.Short-wave near-infrared spectroscopy analysis of major compounds in milk powder and wavelength assignmentJ.Anal.Chim.Acta,2008,610(2):232-242
19、.6、回歸系數法6等大多根據主觀經驗進行閾值選擇,而退火算法7 Kalivas J H,Roberts N,Sutter J M.Global optimization by simulated annealing with wavelength selection for ultravioletvisible spectrophotometryJ.Anal.Chem.,1989,61(18):2024-2030.7和遺傳算法8JouanRimbaud D,Massart D L,Leardi R,et al.Genetic algorithms as a tool for wavelengt
20、h selection in multivariate calibrationJ.Anal.Chem.,1995,67(23):4295-4301.8的搜尋過程非常耗時,且不穩(wěn)定。而連續(xù)投影算法(successive projections algorithm,SPA)是一種新的變量提取方法,利用向量的投影分析,選取含有最低冗余度和最小共線性的有效波長,對信號波長進行優(yōu)選,大大減少建模所需變量的個數,提高建模的速度和效率9 吳迪,吳洪喜,蔡景波,黃振華,何勇.基于無信息變量消除法和連續(xù)投影算法的可見-近紅外光譜技術白蝦種分類方法研究J.紅外與毫米波學報,2009,28(6);423-427.9
21、。1.4 常用預處理方法常用的波長預處理方法有Savitzky-Golay平滑(SG)、變量標準化(SNV)、多元散射校正(MSC)、一階及二階導數處理(1-Der and 2-Der)、去趨勢處理(De-trending)、直接正交信號校正(DOSC)處理及小波變換(Wavelet Transform, WT)等。上述預處理方法中,WT是近十幾年才發(fā)展并迅速應用到圖像和語言分析等眾多領域的數學工具,是繼110多年前建立傅里葉(Joseph Fourier)分析之后的一個重大突破10 王培茂.離散余弦變換與小波變換的比較N.河北理工學院學報,2005,27(3):53-56.10。利用WT將原
22、始的光譜信號分成不同的頻率組分,并對不同的頻率組分進行重構,即保持了傅里葉變換的優(yōu)點又滿足了局部性要求,具有多分辨、方向選擇性和自動調焦的特點11 高榮強,范世福,嚴衍祿,趙麗麗.近紅外光譜的數據預處理研究J.光譜學與光譜分析,2004,24(12).1。通過WT預處理方法,可以很好的實現光譜數據平滑、降噪以及消除基線漂移。 本文將利用WT-SPA提取的有效波長作為偏最小二乘回歸(Partial least squares Regression,PLSR)模型的輸入,建立WT-SPA-PLSR變量分析模型,應用于葡萄酒樣品的酒精度分析和藥片活性成分的研究,預測其均方根誤差(root mean
23、square error of prediction,RMSEP)和相關系數(Correlation coefficient,R),并求得AIC信息標準值12 R.A.Viscarra Rossel,T.Behrens.Using data mining to model and interpret soil diffuse reflectance spectraJ.Geoderma,2010,158:46-54.2。并將此結果與分別采用原始光譜及僅應用SPA得到的有效波長作為PLSR模型輸入的結果進行比較。AIC信息標準值用于比較模型的復雜程度,AIC值越小,模型的復雜程度越低。第二章 材料
24、和方法2.1樣本采集2.1.1葡萄酒近紅外光譜的采集(1)儀器MPA傅立葉變化近紅外光譜儀(帶有RT-Pbs檢測器、He、Ne激光器和石英樣品杯等配件及OPUS QUANT-2定量分析軟件):德國Bruker公司。(2)樣品與基礎數據來源收集來源于意大利、法國、澳大利亞、羅馬利亞、羅馬尼亞等國的107個葡萄酒樣品,包括紅葡萄酒、白葡萄酒、起泡葡萄酒等,根據GB/T 5009.48-2003標準對樣品的基礎酒精度數據進行測定,樣品的酒精度為5.6%(v/v)14.5%(v/v)。(3)實驗方法與光譜數據以蒸餾水為參比,將葡萄酒液體樣品注入直徑為2mm圓柱形品管中,在12000/cm4000/cm
25、譜區(qū)內,用動鏡正反向移動雙邊干涉采樣去掃描64次,分辨率為8/cm,采集樣品的透射光譜。每個樣品分別測試2次,取其平均光譜進行Vis/NIR分析。2.1.2藥片拉曼光譜采集2.2小波變換原理小波變換的概念是由法國從事石油信號處理的工程師J.Morlet在1974年首先提出的,它的重要方面是圖象和信號處理。小波分析方法是一種窗口大?。创翱诿娣e)固定但其形狀可改變,時間窗和頻率窗都可改變的時域局部化分析方法,即在低頻部分具有較高的頻率分辨率和較低的時間分辨率,在高頻部分具有較高的時間分辨率和較低的頻率分辨率,正是這種特性,使小波變換具有對信號的自適應性。其優(yōu)于傅里葉變換的地方是,它在時域和頻域同
26、時具有良好的局部化性質。小波變換基本原理如下:設(表示平方可積的實數空間,即能量有限的信號空間),其傅里葉變換為。當滿足允許條件(Admissible Condition): (1) (1)時,其中為一個基本小波或母小波(Mother Wavelet)。將母函數經伸縮和平移后,就可以得到一個小波序列。對于連續(xù)的情況,小波序列為 (2) (2)其中,為伸縮因子,為平移因子。 對于離散的情況,小波序列為 (3)對于任意的函數的連續(xù)小波變換為 (4) (4)其逆變換為 (5) 小波變換就是將任意信號表示為小波的疊加,信號的小波疊加表示將信號分解為不同的尺度級。在每一尺度級,該信號又在這一尺度級對應的
27、分辨率下被分解。尺度級對應著頻率,頻率越高,對應的分辨率越高,換句話說,我們將信號分解成了不同的頻率通道成份,并將每一頻率成份又按相位進行了分解 頻率越高者,相位劃分越細;反之則越疏。2.3連續(xù)投影算法的實現SPA是一種新興的波長選取方法,能夠有效剔除眾多波長變量之間的共線性影響,并使向量之間的共線性達到最小,降低模型的復雜度,提高建模的速度和效率,以其簡便、快速的特點得到越來越多的應用,在多種樣品波長選取中得到了很好的效果。其算法原理如下2:定標集的樣品數M和波長數K組成一個Vis/NIR的吸收矩陣,分別記和為初始的迭代向量和需要提取的波長個數。SPA是一種前向循環(huán)選擇方法,它從一個波長開始
28、,每次循環(huán),計算它在未選入的波長上的投影,將投影向量最大的波長引入到波長組合,直到循環(huán)N次。每一次新選入的波長,都與前一個線性關系最小。SPA的步驟如下:(1) 初始化:(第一次迭代),在光譜矩陣中任選一列向量,記為(即);(2) 集合定義為:,即還沒有被選擇進波長鏈的列向量,分別計算對中向量的投影向量 (6) (6) (3) 記錄最大投影的序號 (7) (4)將最大的投影作為下輪的投影向量 (8) (5),如果,回到(2)繼續(xù)投影。 這樣得到對波長組合,對每一對和所決定的組合分別建立定標模型,使用預測RMSEP來判斷所建模型的優(yōu)劣。選出最小的RMSEP,它所對應的和即為最佳的波長組合。2.4
29、偏最小二乘回歸模型的建立在實際問題中,經常遇到需要研究兩組多重相關變量間的相互依賴關系,并研究用一組變量(常稱為自變量或預測變量)去預測另一組變量(常稱為因變量或響應變量),PLSR方法是今年來發(fā)展起來的一種解決這一問題的方法。PLSR提供一種多對多線性回歸建模的方法,特別當兩組變量的個數很多,且都存在多重相關性,而觀測數據的數量(樣本量)又較少時,用PLSR建立的模型具有傳統(tǒng)的經典回歸分析等方法所沒有的優(yōu)點。PLSR分析在建模過程中集中了主成分分析,典型相關分析和線性回歸分析方法的特點,因此在分析結果中,除了可以提供一個更為合理的回歸模型外,還可以同時完成一些類似于主成分分析和典型相關分析的
30、研究內容,提供更豐富、深入的一些信息。以下介紹PLSR分析的建模方法??紤]個因變量與個自變量的建模問題。PLSR的基本做法是首先在自變量集中提出第一成分(是的線性組合,且盡可能多地提取原自變量中的變異信息);同時在因變量集中也提取第一成分,并要求與相關程度達到最大。然后建立因變量與的回歸,如果回歸方程已達到滿意的精度,則算法中止。否則繼續(xù)對第二成分的提取,直到達到滿意的精度為止。若最終對自變量集提取個成分,PLSR將通過建立與的回歸式,然后再表示為與原自變量的回歸方程式。即PLSR方程式。為了方便起見,不妨假定個因變量與個自變量均為標準化變量。因變量組合自變量組的次標準化觀測數據陣分別記為 (
31、9)PLSR分析建模的具體步驟如下:(1) 分別提取兩變量組的第一對成分,并使之相關性達到最大。設從兩組變量分別提出第一對成分為和,是自變量集的線性組合:,是因變量的線性組合:。為了回歸分析的需要,要求:和各自盡可能多地提取所在變量組的變異信息;和的相關程度達到最大。由兩組變量集的標準化觀測數據陣和,可以計算第一對成分的得分向量,記為和: (10)(11)第一對成分和的協(xié)方差Cov(,)可用第一對成分的得分向量和的內積來計算。故而以上兩個要求可化為數學上的條件極值問題: (12)采用Lagrange乘法,問題化為求單位向量和,使最大。問題的求解只須通過計算矩陣的特征值和特征向量,且的最大特征在
32、為,相應的單位特征向量就是所求的解,而可由計算得到 (13)(2) 建立對的回歸及對的回歸。假定回歸模型為 (14) 其中分別是多對一的回歸模型中的參數向量,和是殘差陣?;貧w系數向量,的最小二乘估計為 (15) 稱,為模型效應負荷量。(3) 用殘差陣和代替和重復以上步驟。記,則殘差陣,。如果殘差陣中元素的絕對值近似為0,則認為用第一個成分建立的回歸式精度已滿足需要了,可以停止抽取成分。否則用殘差陣和代替和重復以上步驟即得: ,分別為第二隊成分的權數。而,為第二對成分的得分向量。 ,分別為,的第二對成分的負荷量。這時有 (16) (4)設數據陣的秩為,則存在個成分,使得 (17) 把,代入,即得
33、個因變量的PLSR方程式 (18) (5)交叉有效性檢驗。 一般情況下,PLS并不需要選用存在的個成分來建立回歸式,而像主成分分析一樣,只選用前個成分,即可得到預測能力較好的回歸模型。對于建模所需提取的主成分個數,可以通過交叉有效性檢驗來確定。 每次舍去第個觀測,用余下的個觀測值按PLSR方法建模,并考慮抽取個成分后擬合的回歸式,然后把舍去的第個觀測點代入所擬合的回歸方程式,得到在第個觀測點上的預測值。對重復以上的驗證,即得抽取個成分時第個因變量的預測誤差平方和為(19)的預測誤差平方和為 (20) 另外,再采用所有的樣本點,擬合含個成分的回歸方程。這時,記第個樣本點的預測值為,則可以定義的誤
34、差平方和為(21) 定義的誤差平方和為(22) 當達到最小值時,對應的即為所求的成分個數。通常,總有大于,而則小于。因此,在提取成分時,總希望比值越小越好;一般可設定限制值為0.05,即當(23)時,增加成分有利于模型精度的提高?;蛘叻催^來說,當(24) 時,就認為增加新的成分對減少方程的預測誤差無明顯的改善作用。 為此,定義交叉有效性為,這樣,在建模的每一步計算結束前,均進行交叉有效性檢驗,如果在第步有,則模型達到精度要求,可停止提取成分;若,表示第步提取的成分的邊際貢獻顯著,應繼續(xù)第步計算。2.5 AIC信息標準值 (25)為了比較得到最好的模型,采用AIC信息準則在模型的準確度和模型的簡
35、單程度兩者之間折中分析,來確定最好的數據處理方法。AIC信息準則算法如下:其中n是樣本個數,p是預測集樣本個數。AIC的值越小,模型越精簡。 本文將光譜數據作為PLSR模型的輸入標量,模型的因子數采用交叉驗證結合F檢驗進行選取。采用預測均方根誤差和相關系數以及AIC信息標準值對模型進行評價。*;第三章 實驗結果和分析3.1近紅外光譜實驗數據分析實驗采集了葡萄酒近紅外樣品107個,將107個樣品按照近似2:1的比例進行矯正集和預測集樣本的選擇,71個作為校正集,36個作為預測集。兩份樣本的信息如表1所示,從表中可以看出,校正集樣本的范圍包含了預測集樣本的范圍,這說明了所選擇的校正集樣本在參與建模
36、中具有代表性。成分 單位/% 樣本數 范圍 平均值 標準偏差校正集 g/g 71 5.60014.500 12.568 1.693 預測集 g/g 36 11.50013.900 12.839 0.629表1 近紅外樣品統(tǒng)計信息表3.2近紅外光譜實驗結果和分析3.2.1原始光譜建模將原始光譜進行預處理,然后作為PLSR模型的輸入建立模型。經過預處理后選擇的不同波長數的RMSE分布如圖1所示,由圖1可以看出,當選取9個波長時,RMSE有一個下降過程,當選取12個波長時又有一個下降過程,之后RMSE一直下降直至到選取69個波長時,RMSE趨近于零,因此確定從71個樣本中選用69個波長作為PLSR模
37、型的輸入變量。選擇的波長如圖2,其中的曲線代表原始光譜圖,方框代表選擇的69個波長,將69個波長帶入模型中,結果如表2所示,利用原始光譜作為PLSR模型的輸入變量,RMSEP為12.594,R為0.951,AIC信息標準值為5040.199。圖1 原始可見Vis/NIR模型的預測均方誤差隨選擇變量數的變化關系圖2 原始光譜及選擇的變量分布圖表2 基于不同預處理和變量選擇方法的PLSR模型的三種Vis/NIR分析結果 參數 RMSEP R AIC 變量個數 None 12.594 0.951 5040.199 69 SPA / / 157.578 / WT-SPA 12.548 0.951 15
38、2.694 673.2.2應用SPA選取有效波長建模 鑒于采用原始光譜作為模型的輸入變量所得的AIC信息標準值很大,模型復雜度高,采用SPA對波長進行篩選,選取含有最低冗余度和最小共線性的有效波長。將由SPA篩選得到的波長作為PLSR模型的輸入變量,由此得到的結果如表2所示,AIC信息標準值為157.578。和原始光譜相比,模型的復雜度得到很大的降低。3.2.3應用WT-SPA選取有效波長建模做進一步研究,采用小波變換結合連續(xù)投影算法對光譜進行處理選擇波長。對經過預處理后的光譜進行小波變換,將光譜劃分不同的尺度級,再經過SPA進一步選取有效波長,所得到的不同波長數的RMSE分布如圖3所示。由圖
39、3可以看出,當選取4個波長時,RMSE有一個下降過程,之后RMSE一直下降直至到選取67個波長時,RMSE趨近于零,因此確定選擇67個波長作為PLSR模型的輸入變量,由WT-SPA得到的波長如圖4,其中的曲線代表原始光譜圖,方框代表選擇的67個波長,將圖4和圖2作比較,可以看出由WT-SPA選擇的波長分布更為密集。將67個波長帶入模型中,結果如表2所示,利用WT-SPA得到的波長作為PLSR模型的輸入變量,RMSEP為12.5477,R為0.951,AIC信息標準值為152.694。從表2中可以看出,通過WT-SPA得帶的67個波長建立的模型PLSR模型的校正集分析正確率高于采用原始光譜建模以
40、及僅僅利用SPA進行有效波長的選取建立的模型,且AIC信息標準值是三種方法中最小的,說明由WT-SPA選取的波長所建模型更準確、更簡單。結果表明WT-SPA對Vis/NIR進行波長有效選擇后建立的WT-SPA-PLSR模型進行葡萄酒酒精度分析是可行的,并且有滿意的精簡度。圖4 WT-SPA選擇的67個波長圖3 WT-SPA選擇的不同變量數的RMSE分布圖 3.3拉曼光譜實驗數據分析實驗采集了葡萄酒近紅外樣品120個,將120個樣品按照2:1的比例進行矯正集和預測集樣本的選擇,80個作為校正集,40個作為預測集。兩份樣本的信息如表3所示,從表中可以看出,校正集樣本的范圍包含了預測集樣本的范圍,這說明了所選擇的校正集樣本在參與建模中具有代表性。成分 單位/% 樣本數 范圍 平均值 標準偏差校正集 g/g 80 5.1238.464 7.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年湘教新版九年級生物上冊月考試卷含答案
- 2025年北師大新版九年級地理下冊月考試卷含答案
- 2025年華東師大版九年級生物上冊階段測試試卷含答案
- 2025年冀教版九年級歷史下冊階段測試試卷含答案
- 2025年冀教版選擇性必修1歷史下冊階段測試試卷
- 2025年上教版七年級生物下冊階段測試試卷
- 2025年外研版九年級歷史上冊月考試卷
- 二零二五版離婚協(xié)議書起草與子女撫養(yǎng)權維護服務合同4篇
- 二零二五版借貸房屋買賣合同糾紛調解服務合同4篇
- 二零二五版木結構建筑能耗數據采集與分析合同4篇
- 電力系統(tǒng)動態(tài)仿真與建模
- 蝦皮shopee新手賣家考試題庫及答案
- 四川省宜賓市2023-2024學年八年級上學期期末義務教育階段教學質量監(jiān)測英語試題
- 價值醫(yī)療的概念 實踐及其實現路徑
- 2024年中國華能集團燃料有限公司招聘筆試參考題庫含答案解析
- 《紅樓夢》中的男性形象解讀
- 安全生產技術規(guī)范 第49部分:加油站 DB50-T 867.49-2023
- 《三國演義》中的語言藝術:詩詞歌賦的應用
- 腸外營養(yǎng)液的合理配制
- 消防安全教育培訓記錄表
- 2023年河南省新鄉(xiāng)市鳳泉區(qū)事業(yè)單位招聘53人高頻考點題庫(共500題含答案解析)模擬練習試卷
評論
0/150
提交評論