化學(xué)計量學(xué)操作_第1頁
化學(xué)計量學(xué)操作_第2頁
化學(xué)計量學(xué)操作_第3頁
化學(xué)計量學(xué)操作_第4頁
化學(xué)計量學(xué)操作_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、CAMO化學(xué)計量學(xué)程序CAMO化學(xué)計量學(xué)程序 在桌面上找到“The UNSCRAMBLER”軟件圖標(biāo),雙擊打開這個程序,在主窗口中的“File”按鈕的下拉菜單中指向“Import”條目,然后在下拉菜單中選擇需要輸入的數(shù)據(jù)類型“U5 Data”。 擊“U5 DATA”條目,然后在彈出的新窗口中選擇需要導(dǎo)入的UNS格式的光譜數(shù)據(jù)文件,單擊“IMPORT(導(dǎo)入)”按鈕或雙擊該文件,就會彈出導(dǎo)入提示窗口,選擇需要導(dǎo)入的行和列,單擊“OK”按鈕,就可以導(dǎo)入光譜數(shù)據(jù)。CAMO化學(xué)計量學(xué)程序 選擇菜單Task PCA 在主成分分析的設(shè)置菜單直接點(diǎn)擊OK。CAMO化學(xué)計量學(xué)程序 運(yùn)行結(jié)束后,點(diǎn)擊View出現(xiàn)P

2、CA計算后的視圖。CAMO化學(xué)計量學(xué)程序選擇菜單File Export Model ASCII-MOD出現(xiàn)模型導(dǎo)出的窗口,選擇好保存路徑及名稱,注意“Type”需要選擇“Full”類型。然后,關(guān)掉PCA窗口,回到CAMO數(shù)據(jù)表窗口。CAMO化學(xué)計量學(xué)程序 下面開始導(dǎo)入一級數(shù)據(jù)化驗值數(shù)據(jù)的操作CAMO化學(xué)計量學(xué)程序 樣品一級數(shù)據(jù)的化驗要求盡量準(zhǔn)確,化驗數(shù)據(jù)所采用的儀器和化驗條件所有樣品要一致。CAMO化學(xué)計量學(xué)程序 打開準(zhǔn)備好的一級數(shù)據(jù),將光譜數(shù)據(jù)的編號順序調(diào)整為與一級數(shù)據(jù)一致,選擇一級數(shù)據(jù)的數(shù)據(jù)部分(不包括指標(biāo)名稱與編號),直接粘貼插入到CAMO數(shù)據(jù)表中與光譜數(shù)據(jù)一一對應(yīng)好。CAMO化學(xué)計量學(xué)

3、程序 選擇菜單TaskRegression 出現(xiàn)回歸計算的設(shè)置菜單,數(shù)學(xué)方法選擇PLS1。 Samples選項按默認(rèn)設(shè)置; X-variables選項選擇“X 601”,即601列光譜數(shù)據(jù); Y-variables選項選擇“hl 1”,即插入的含量數(shù)據(jù)。CAMO化學(xué)計量學(xué)程序驗證方法選項Validation Method,選擇“Cross Validation”交互驗證,點(diǎn)擊后面的”Setup”按鈕打開交互驗證窗口,開始對交互驗證方法進(jìn)行設(shè)置,選擇“Full Cross Validation”完全交互驗證,點(diǎn)擊“OK”確認(rèn)。CAMO化學(xué)計量學(xué)程序 Model選項選擇“Full”,Num Pcs

4、選項選擇“25”,其他選項按默認(rèn)。點(diǎn)擊“OK”按鈕開始計算PLS1回歸模型。如圖所示。CAMO化學(xué)計量學(xué)程序 點(diǎn)擊“View”查看模型的視圖。CAMO化學(xué)計量學(xué)程序?qū)⒁晥D1轉(zhuǎn)換為三維視圖。選中視圖1,選擇菜單Plot Residuals打開視圖參數(shù)窗口,如右圖所示。 在General常規(guī)選項界面中: “Plot”項選擇“Influence Plot”, “Variables”項選擇“X and Y”,其他選項按默認(rèn),點(diǎn)擊“OK”。CAMO化學(xué)計量學(xué)程序 將視圖2轉(zhuǎn)換為杠桿值視圖。選中視圖2,選擇菜單Plot Leverage 打開視圖參數(shù)窗口,如右圖所示,不必設(shè)置直接點(diǎn)擊“OK”即可完成轉(zhuǎn)換。

5、CAMO化學(xué)計量學(xué)程序 視圖3和視圖4不必轉(zhuǎn)換,最終的4個模型視圖如下圖所示。CAMO化學(xué)計量學(xué)程序模型優(yōu)化操作中異常值(outlier)剔除分別采用三維空間分布值Influence和線性相關(guān)性correlation這兩個統(tǒng)計量來對照檢驗剔除,同時參考光譜杠桿值Leverage 。經(jīng)過異常值的剔除對模型進(jìn)行逐步優(yōu)化。三維空間分布值Influence就是指視圖1中的樣品三維空間分布圖,由于做定量分析的樣品集為同類樣品,他們在主成分空間的分布會因光譜信息的相似性而分布在一個相對集中的空間中,所以在視圖1中大部分的樣品會聚集在一起,少數(shù)幾個點(diǎn)離散在比較遠(yuǎn)的區(qū)域。這少數(shù)的幾個離散點(diǎn)就是異常值,模型優(yōu)化

6、時要將這些點(diǎn)標(biāo)記出排除掉。CAMO化學(xué)計量學(xué)程序光譜杠桿值Leverage 即指視圖2的樣品杠桿值。將線狀圖轉(zhuǎn)換為點(diǎn)陣圖后可以發(fā)現(xiàn),每一個樣品點(diǎn)對應(yīng)一個杠桿值。杠桿值表示樣品對模型影響的重要程度。通常,位于被測組分濃度或性質(zhì)范圍兩端的樣品具有較大的杠桿值,位于被測組分濃度或性質(zhì)的均值處的樣品杠桿值較小。如果某個樣品的杠桿值遠(yuǎn)大于其他值,它有可能不代表被測樣品的實際情況,這樣的樣品可能是異常值,需要給予認(rèn)真研究。這個指標(biāo)在模型優(yōu)化操作中的作用又不是太重要,只要杠桿值不是特別的高,一般不會考慮剔除,該指標(biāo)模型優(yōu)化時作為輔助參考指標(biāo)。CAMO化學(xué)計量學(xué)程序視圖3是PRESS值-主成分?jǐn)?shù)目的關(guān)系圖。在

7、計算的多個主成分中,第一主成分最重要,隨著主成分?jǐn)?shù)的增加,重要程度依次降低,以至到后來的許多主成分反映的是噪音信息。 如果建立模型時使用的主成分?jǐn)?shù)過少,就不能反應(yīng)未知樣品被測組分產(chǎn)生的光譜數(shù)據(jù)變化,其模型的預(yù)測準(zhǔn)確度就會降低,這種情況稱之為不充分?jǐn)M和(Underfit)。 如果使用過多的主成分建立模型,就會將一些代表噪音的主成分加到模型中,使模型的預(yù)測能力下降,這種情況稱為過度擬和(Overfit)。 因此,合理確定參加建立模型的主成分?jǐn)?shù)是充分利用光譜信息和濾除噪音的有效方法之一。CAMO化學(xué)計量學(xué)程序 視圖3的縱坐標(biāo)是PRESS值,即預(yù)測殘差平方和,PRESS是這樣計算的:使用一定數(shù)目的主成

8、分建立模型,用這個模型對參加建模的每個樣品進(jìn)行預(yù)測,每個樣品的預(yù)測值和已知值的差的平方和即為該主成分下的PRESS值。PRESS值越小,說明模型的預(yù)測能力越好。在這里CAMO軟件會根據(jù)PLS1的參數(shù)設(shè)置以交互驗證法(Cross-validation)自動選擇最佳主成分來構(gòu)建模型。所以,主成分?jǐn)?shù)一般不需要人為調(diào)整。CAMO化學(xué)計量學(xué)程序線性相關(guān)性correlation即指視圖4的線性回歸視圖。視圖中的橫坐標(biāo)是一級數(shù)據(jù)的化驗值,縱坐標(biāo)是PLS1回歸計算過程中交互驗證得出的預(yù)測值。圖中紅點(diǎn)是不包括該點(diǎn)的模型對該點(diǎn)預(yù)測得出的驗證值;藍(lán)點(diǎn)是所有校正集樣品建立的模型對校正集中每一個樣品預(yù)測得出的校正值。兩

9、者都是交互驗證過程對模型實際預(yù)測能力的模擬,但紅色的驗證值更接近外部預(yù)測,所以我們一般以紅點(diǎn)的相關(guān)性為依據(jù)進(jìn)行異常點(diǎn)的排除。視圖4中的標(biāo)簽顯示了當(dāng)前nic模型的相關(guān)性為0.9757(驗證值的相關(guān)性)。當(dāng)所有樣品的驗證值與化驗值完全相同時,視圖4中的樣品點(diǎn)應(yīng)該都分布在通過原點(diǎn)的斜率為1的直線上,此時的線性相關(guān)性為1,這是最理想的狀態(tài)。我們優(yōu)化模型的目的就是要剔除線性不好的樣品點(diǎn),使驗證值的相關(guān)性盡量的接近理想狀態(tài)的1。視圖4中的大部分的樣品點(diǎn)都分布在離回歸線比較近的兩側(cè),有些點(diǎn)直接在回歸線上。因此,那些離回歸線比較遠(yuǎn)的離散點(diǎn)就是異常值,模型優(yōu)化時要將他們標(biāo)記出來剔除掉。CAMO化學(xué)計量學(xué)程序下面

10、我們開始對模型進(jìn)行優(yōu)化操作。首先,在視圖1中有3個樣品的三維分布遠(yuǎn)離了正常分布區(qū)域,將這三個樣品點(diǎn)標(biāo)記出來;同時對照視圖4發(fā)現(xiàn),這三個樣品同樣也是線性關(guān)系不好的點(diǎn),進(jìn)一步確認(rèn)這三個樣品確實是異常值,應(yīng)該剔除掉。如下圖所示。CAMO化學(xué)計量學(xué)程序接下來,選擇菜單Task Recalculate Without Marked,即排除被標(biāo)記的樣品后重新計算模型。出現(xiàn)計算模型的參數(shù)設(shè)置窗口,發(fā)現(xiàn)在Keep Out of單元格中已經(jīng)將三個異常樣品的編號自動填寫好,不必做任何改動,直接點(diǎn)擊“OK”即開始模型的重新構(gòu)建。CAMO化學(xué)計量學(xué)程序模型重新計算完畢,點(diǎn)擊按鈕“View”查看優(yōu)化之后的模型視圖。優(yōu)化

11、之后的驗證值的線性相關(guān)性為0.9858,相比優(yōu)化之前的0.9757有所提高,說明這次優(yōu)化對模型有所改進(jìn)。如果模型還沒有達(dá)到要求或者條件允許,下面可以對模型進(jìn)行進(jìn)一步的優(yōu)化,根據(jù)視圖1的三維分布情況和視圖4的線性關(guān)系好壞繼續(xù)剔除異常點(diǎn),直至模型滿足要求。CAMO化學(xué)計量學(xué)程序模型建好之后,點(diǎn)擊保存按鈕保存模型,或者選擇菜單File Save保存模型。保存模型時,一定要以化驗指標(biāo)的名稱來命名。CAMO化學(xué)計量學(xué)程序 對驗證樣品光譜文件按照前面相同的處理方式,最后處理成uns文件,導(dǎo)入化學(xué)計量學(xué)軟件。 yanzheng.dat yanzheng.dx1 yanzheng.unsCAMO化學(xué)計量學(xué)程序

12、調(diào)用模型預(yù)測:選擇菜單Task Predict就會出現(xiàn)模型調(diào)用窗口,Sample項目按默認(rèn)即可,X-variables項目選擇Xdata 601,Y-reference項目Include Y-referen前打“”號,Variable選擇nic 1(沒有的話需要自己點(diǎn)擊Define按鈕進(jìn)行定義)。點(diǎn)擊Model Name后的Find按鈕選擇要調(diào)用的模型,點(diǎn)擊“OK”開始預(yù)測。CAMO化學(xué)計量學(xué)程序 預(yù)測結(jié)束點(diǎn)擊按鈕“View”查看預(yù)測結(jié)果。如下圖所示。CAMO化學(xué)計量學(xué)程序 將預(yù)測結(jié)果復(fù)制到Excel中:在預(yù)測結(jié)果窗口的數(shù)據(jù)表中點(diǎn)擊右鍵,選擇菜單Edit Copy,執(zhí)行復(fù)制命令。然后打開一個空白的Excel表格,選中第一行的第一個格,點(diǎn)擊右鍵執(zhí)行“粘貼”命令。CAMO

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論