近紅外光譜在玉米品種鑒別中的應用_第1頁
近紅外光譜在玉米品種鑒別中的應用_第2頁
近紅外光譜在玉米品種鑒別中的應用_第3頁
近紅外光譜在玉米品種鑒別中的應用_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

近紅外光譜在玉米品種鑒別中的應用

仿生識別玉米種子品種的優(yōu)勢玉米是中國的重要作物之一。20世紀30年代以來,農作物的雜交優(yōu)勢逐漸得到人們的重視,玉米的雜交一代(F1)品種也得到普遍推廣。與此同時,假玉米種子造成的坑農害農事件時有發(fā)生,給國家和農業(yè)生產造成了很大的損失。因此,玉米種子品種鑒別是目前農業(yè)生產、作物育種和種子檢驗的重要問題之一。國內外種子品種鑒別的常用方法主要有形態(tài)學方法、熒光掃描鑒定法、化學鑒定法和電泳鑒定法。形態(tài)學方法鑒別所需時間長,而且精度不高。熒光掃描鑒定法、化學鑒定法和電泳鑒定法等鑒別精度高,但所需的時間也很長,而且鑒別過程煩瑣,非專業(yè)人員難以勝任,不適宜對樣品進行批量快速分析和無損在線監(jiān)測。近紅外光譜區(qū)介于可見光譜區(qū)與中紅外光譜區(qū)之間,波長范圍為780~2500nm。通過近紅外光譜,可以得到樣品中所有有機分子含氫基團的特征信息。近紅外光譜對物質的穿透能力較強,不需要對樣品做任何預處理。近紅外光譜還具有不會對人體造成傷害、不會對環(huán)境造成任何污染以及快速、高效的特點。目前近紅外光譜在農產品中的應用已經相當成熟,所以將其用于玉米品種鑒別具有重要的理論和現(xiàn)實意義。近紅外光譜含有巨量信息、但是有噪聲干擾、波譜重疊比較嚴重,所以不能直接運用原始光譜數(shù)據(jù)進行玉米種子品種鑒別。本文提出了一種基于仿生模式識別(biomimeticpatternrecognition,BPR)的玉米種子品種快速鑒別方法,首先將原始光譜進行歸一化處理,進而尋找可區(qū)分波段,使用主成分分析(PCA)方法提取特定波段光譜特征信息,再利用仿生模式識別原理建立種子鑒別模型。本文應用該方法對7個玉米品種建立了種子鑒別模型,各鑒別模型對本品種種子的正確識別率較高且能有效拒識非本品種種子,在平均正確拒識率為99.1%的情況下,平均正確識別率可達94.3%。1材料和方法1.1近紅外光譜法采樣實驗使用德國BRUKER公司的VECTOR22/N傅里葉變換近紅外光譜儀,采樣間隔3.9cm-1。測定譜區(qū)范圍為4000~12000cm-1,掃描次數(shù)64次,分辨率8cm-1。1.2玉米籽粒的貯藏所有玉米籽粒樣品均來自北京種植的玉米品種(見表1),成熟后收獲,風干脫水保存。所有樣品掃描前40°烘干72h。樣品盛放在統(tǒng)一尺寸的玻璃杯中。放置時,最底層玉米籽粒一半胚乳向上,一半胚乳向下。對每一樣品重復掃描20次。1.3光譜數(shù)據(jù)預處理由于近紅外光譜數(shù)據(jù)中含有較多噪聲且譜帶嚴重重疊,儀器分析得到的原始近紅外光譜數(shù)據(jù)無法直接用于樣品的定性計算,因此,有必要對原始光譜數(shù)據(jù)進行預處理。這里選用基于矢量歸一化的光譜預處理方法,它具有如下特點:(1)保持光譜差的形式,利于光譜解析;(2)能夠降低同一樣品若干次測量之間的差別,非常適用于具有不同厚度的樣品。矢量歸一化方法的基本思想是:針對每條光譜,首先計算出平均吸光度值,再從光譜中減去這個值,然后計算出吸光度值的平方和,用其平方根除光譜。1.4基于fix-尺寸dmotchity的識別特征區(qū)域計算在近紅外光譜定性分析模型建立過程中,全譜計算的計算量很大。實際上,在某些光譜區(qū)域,樣品光譜中有用信息很少。如果直接利用全光譜數(shù)據(jù)進行計算,會把對樣品性質無關的信息也計算在內,甚至會引入干擾信息,影響預測模型的精度。因此,需要選擇適當?shù)墓庾V區(qū)域進行建模。本文采用固定尺寸移動窗口漸進因子法(fix-sizedmovingwindowevolvingfactoranalysis),通過在不同光譜區(qū)域內,計算樣品各自類內的相關系數(shù)以及兩類樣品之間的相關系數(shù),尋找特征光譜區(qū)域。下面以兩類樣品為例,說明其計算過程。設第一類樣品光譜數(shù)據(jù)矩陣為A,其維數(shù)為p×s1(p為量測波數(shù)的個數(shù),s1為樣品數(shù))。第二類樣品光譜數(shù)據(jù)矩陣為B,其維數(shù)為p×s2(p為量測波數(shù)的個數(shù),s2為樣品數(shù))。計算時,以固定窗口寬度,如100個波數(shù)為單位,以固定步長,如5個波數(shù)為步長,首先分別從A、B矩陣中取出前100行作為子矩陣,計算各自子矩陣中各列向量間的相關系數(shù),取平均值,再計算兩子矩陣列向量間的相關系數(shù),取平均值,這樣就得到了3個相關系數(shù)值。然后將該窗口從數(shù)據(jù)矩陣的起點向終點移動1個步長,再進行相關系數(shù)的計算,得到3個相關系數(shù)值。依次滑動窗口,直到計算完整個矩陣。如果在某個光譜區(qū)域,兩類樣品各自類內的相關系數(shù)較高,而類間的相關系數(shù)較低,那么該區(qū)域即為兩類樣品的特征光譜區(qū)域。1.5bpr和svmBPR是王守覺等提出的一種模式識別理論,完全不同于傳統(tǒng)的模式識別理論。傳統(tǒng)模式識別把不同類樣本在特征空間中的最佳劃分作為目標,最具代表性的就是支持向量機(SVM)理論;而BPR則以同一類樣本在特征空間中分布的最佳覆蓋作為目標,強調一類一類樣本的“認識”過程。BPR理論通過分析某類樣本點在高維空間中的分布情況,利用高維空間復雜幾何形體對其進行覆蓋。從高維空間幾何分析的角度來看,一個神經元可以構造出一個復雜的封閉幾何形體,多個神經元組合起來的人工神經網(wǎng)絡可以實現(xiàn)高維空間復雜幾何形體的近似覆蓋。本文采用一個兩權值神經元作為基本覆蓋單元,用多個兩權值神經元組合起來實現(xiàn)不同品種玉米樣本的神經網(wǎng)絡覆蓋區(qū)。2結果與討論2.1玉米品種對玉米特征的譜線分析圖1是經過矢量歸一化預處理后的7個玉米品種的近紅外光譜圖??梢钥闯?對原始近紅外光譜進行矢量歸一化預處理,能在一定程度上減少同品種玉米籽粒樣本之間的差異,但從全譜范圍來看,依然無法將不同品種的樣本區(qū)分開。實際上,不同品種樣本之間只存在細微差別,從如此相似的光譜數(shù)據(jù)中提取信息,需要選擇合適的特征光譜區(qū)域。在該區(qū)域內,同類樣本的光譜盡可能相似,而不同類樣本之間的光譜區(qū)別較大,這樣更有利于建立多品種的鑒別模型。本文采用固定尺寸移動窗口漸進因子法,以100個波數(shù)為固定窗口寬度,1個波數(shù)為步長,分別對7個品種的玉米樣本兩兩進行分析,以尋找不同品種樣本的特征光譜區(qū)域。圖2是對CE03005和P138兩個玉米品種的分析結果。橫坐標值是計算各相關系數(shù)時對應的終止波數(shù)。從圖中可以看出,終止波數(shù)在5843~5893cm-1(起始波數(shù)為5457~5503cm-1)和10866~10961cm-1(起始波數(shù)為10480~10575cm-1)這兩個光譜區(qū)域,兩類樣本各自類內的相關系數(shù)不低于0.8,而兩類樣本之間的相關系數(shù)最高只能達到0.78。采用相同的參數(shù),對其他品種的玉米樣本進行分析時發(fā)現(xiàn),在上述兩個波段范圍內,不同品種玉米樣本各自類內的相關系數(shù)都比較高,而類間的相關系數(shù)較低。因此,選擇5457~5893和10480~10961cm-1這兩個波段作為特征光譜區(qū)域。2.2玉米粒體的主成分分析盡管經過特征波段選擇后原始信息已經減少,但是光譜數(shù)據(jù)的維數(shù)仍然很高。如果在樣本量不多的情況下,直接根據(jù)高維數(shù)據(jù)建立分類模型,無論從模型性能還是計算復雜度來看都是不合適的。PCA是最常用的一種特征提取方法。它根據(jù)方差最大原則對原始數(shù)據(jù)集的多個自變量進行線性組合,從而用數(shù)量較少的新的綜合變量替代原始高維變量集,達到降維目的。圖3是對7個玉米品種進行主成分分析得到的二維空間中樣本的分布圖。從圖中可以看出,7個品種的玉米籽粒樣本在主成分空間中呈帶狀分布,各品種間具有比較明顯的分界線,因而能夠達到分類的目的。同時,從圖中各品種樣本分布的疏密度來看,P25、P138和815這3個品種的樣本在該空間呈鄰近分布,其余4個品種中,各品種內樣本分布相對集中,而品種間距離較遠。這正好與品種的基因來源相一致。P25和P138是近緣自交系,因此從遺傳的角度看,這兩個品種親緣關系狠近。815是一個雜交品種,其親本與P25和P138這兩個品種近緣,因而815與P25和P138的親緣關系也較近。其它玉米品種間無明顯的親緣關系。該實驗結果說明,根據(jù)主成分空間中各玉米品種的分布情況,不僅能區(qū)分不同品種的玉米,而且其分布疏密度還能反映出不同玉米品種在遺傳上的親緣關系。2.3玉米粒粒主成分的仿生模式擴增對于每個品種的玉米籽粒樣本,從中隨機挑選10個作為訓練集,其余10個作為第一測試集,其他品種的樣本(6類共120個樣本)作為第二測試集。第一測試集用于檢測該品種的超香腸形神經元(HSN)網(wǎng)絡對于同品種樣本的正確識別率,第二測試集用于檢測該品種的HSN網(wǎng)絡對于其它品種樣本的正確拒識率。由于光譜數(shù)據(jù)經主成分提取后得到的前5個主成分的累積貢獻率已經達到99.96%,因此,提取前5個主成分作為特征矢量。本文應用仿生模式識別方法對7個不同品種的玉米籽粒樣本進行了計算機自動分類,實驗結果見表2。其中,用來識別CE03005,1127,P25,P138,815,HeiNuo和MiniCT的HSN網(wǎng)絡對于本品種樣本的正確識別率分別為100%,100%,80%,100%,80%,100%和100%,平均正確識別率為94.3%,對于其它品種樣本的正確拒識率分別為100%,100%,99.2%,99.2%,99.2%,100%和96.7%,平均正確拒識率為99.1%。由以上實驗結果說明:(1)仿生模式識別能夠有效地拒識未經訓練的樣本,這正是人們認識功能的特點,也克服了傳統(tǒng)模式識別的致命弱點;(2)仿生模式識別是一類一類分別訓練“認識”的,因而對新增加樣本的訓練不會影響原有識別知識;(3)對于小樣本集的多分類問題,仿生模式識別具有絕對優(yōu)越性。3玉米光譜預處理的必要性本文提出了一種基于近紅外光譜和仿生模式識別的玉米種子品種鑒別方法。該方法借助多種化學計量學方法包括矢量歸一化、固定尺寸移動窗口漸進因子法和主成分分析,建立了7個玉米種子品種的鑒別模型。玉米的光譜信息是高維空間的大量數(shù)據(jù),不同品種的玉米光譜數(shù)據(jù)差別很小,因此,很難直接對其建立模式識別模型。矢量歸一化預處理能夠降低同品種樣本間的差異,同時減輕了近紅外光譜中的噪聲干擾。采用固定尺寸移動窗口漸進

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論