




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、龍源期刊網(wǎng) 顏色與物質(zhì)濃度辨識的回歸的分析作者:王金生來源:科學與財富2017年第31期摘要 本文是討論關于濃度與顏色讀數(shù)之間的關系的問題,我們闡述了顏色讀數(shù)的各個分量間的相互關系,建立了多元線性回歸模型和二次回歸模型,并對模型進行了誤差分析和優(yōu)化,從而驗證了模型的有效性和精確性。模型的在化學元素檢測實驗中有一定的參考價值。關鍵字 濃度 顏色讀數(shù) 線性回歸模型 誤差分析問題的重述比色法是目前常用的一種檢測物質(zhì)濃度的方法,即把待測物質(zhì)制備成溶液后滴在特定的白色試紙表面,等其充分反應以后獲得一張有顏色的試紙,再把該顏色試紙與一個標準比色卡進行對比,就可以確定待測物質(zhì)的濃度檔位了。由于每個人對顏色的
2、敏感差異和觀測誤差,使得這一方法在精度上受到很大影響。隨著照相技術和顏色分辨率的提高,希望建立顏色讀數(shù)和物質(zhì)濃度的數(shù)量關系,即只要輸入照片中的顏色讀數(shù)就能夠獲得待測物質(zhì)的濃度。試根據(jù)附件所提供的有關顏色讀數(shù)和物質(zhì)濃度數(shù)據(jù)(參考2017年全國大學生數(shù)學建模競賽C題附件1),下表為其中一小部分數(shù)據(jù):完成下列問題:(1)附件Data1.xls中分別給出了5種物質(zhì)在不同濃度下的顏色讀數(shù),討論從這5組數(shù)據(jù)中能否確定顏色讀數(shù)和物質(zhì)濃度之間的關系,并給出一些準則來評價這5組數(shù)據(jù)的優(yōu)劣。(2)對附件Data2.xls中的數(shù)據(jù),建立顏色讀數(shù)和物質(zhì)濃度的數(shù)學模型,并給出模型的誤差分析。模型假設(1)數(shù)據(jù)真實可靠。
3、(2)數(shù)據(jù)的采集符合統(tǒng)計學原理。(3)H和S的數(shù)據(jù)作了適當?shù)木€性變換,并沒有進行隨意采取。3、問題的分析與準備3.1 RGB顏色空間RGB顏色空間是采用R、G、B相加混色的原理,通過發(fā)射紅、綠、藍三種不同強度的電子束,疊加而產(chǎn)生色彩的。這種色彩的表示方法稱為RGB色彩空間表示。根據(jù)三基色原理,用基色光單位來表示光的量,則在RGB色彩空間,任意色光F都可以用R、G、B三色不同分量混合而成:F=rR+gG+bB特別地,當三基色分量都為最弱時混合為黑色光;當三基色分量都為最強時混合為白色光。RGB色彩空間采用 物理三基色表示,因而物理意義很清楚,適合彩色顯象管工作。然而RGB色彩空間并不適應人的視覺
4、特點,因而產(chǎn)生了其它不同的色彩空間。3.2 HSV顏色空間HSV(hue,saturation,value)顏色空間的模型對應于圓柱坐標系中的一個圓錐形子集(如圖),可以用一個圓錐空間模型來描述。HSB(HSV) 通過色相/飽和度/亮度三要素來表達顏色.H(Hue):表示顏色的類型(例如紅色,綠色或者黃色).取值范圍為0-360.其中每一個值代表一種顏色.S(Saturation):顏色的飽和度.從0到1.有時候也稱為純度.B(Brightness or Value):顏色的明亮程度.從0到1.HSV色彩空間和RGB色彩空間只是同一物理量的不同表示法,因而它們之間存在著相互轉換關系。3.3 從
5、 RGB 到HSV的轉換在所給的數(shù)據(jù)中顏色讀數(shù)(R G B H S)和(R G B)其實確定同一種顏色,因此顏色讀數(shù)與濃度的關系其實就是(R G B)與濃度的關系,這也將顏色讀數(shù)的維數(shù)從5維降到了3維,這可以大大提高模型的質(zhì)量。關于數(shù)據(jù)的處理與說明由于R,G,B與H,S,V可以相互轉化,該問題中濃度與顏色讀數(shù)的關系模型如下:L=F(R,G,B,H,S)=W(R,G,B)+H+S-H(R,G,B)-S(R,G,B)因此該問題簡化成求L與R,G,B之間的關系模型W(R,G,B)。但是數(shù)據(jù)Data2.xls中關于H與S的部分根據(jù)函數(shù)H(R,G,B)和S(R,G,B)算得的H和S并不與真實數(shù)據(jù)一致,根
6、據(jù)數(shù)據(jù)其中的線性關系,更像是人為的對數(shù)據(jù)進行了線性變換,我們可以對數(shù)據(jù)進行簡單的線性擬合,從而找回與數(shù)據(jù)中相匹配的可靠數(shù)據(jù),因此,實際上以上模型應改為:L=F(R,G,B,H,S)=W(R,G,B)+H+S-H(R,G,B)-S(R,G,B)+其中,可以用線性擬合求得。數(shù)據(jù)表Data1中用R,G,B求相匹配的H,S的結果可以用多項式擬合簡單得到。接下來的論述都是以建立L與R,G,B的關系為主要任務。4、模型的建立與求解4.1 模型一 線性回歸模型4.1.1模型建立在分析數(shù)據(jù)Data1.xls時,畫出(B,L)(G,L)(R,L)的散點圖,我們發(fā)現(xiàn)其中數(shù)據(jù)基本呈現(xiàn)線性關系。因此針對數(shù)據(jù)data1
7、.xls建立如下線性回歸模型:其中L為物質(zhì)的濃度,R,G,B為回歸自變量, 為回歸系數(shù)。4.1.2模型求解利用MATLAB統(tǒng)計工具箱中的命令regress求解,data為自變量與應變量的數(shù)據(jù),應變量數(shù)據(jù)放第一列,這里數(shù)據(jù)太多就不全部列出了,其命令參照以下代碼:x1=data(:,2);x2=data(:,3);x3=data(:,4);y=data(:,1);x4=ones(10,1);x=x4,x1,x2,x3;b,bint,r,rint,stats=regress(y,x)for i=1:10L(i)=b(1)+b(2)*data(i,2)+b(3)*data(i,3)+b(4)*data
8、(i,4);endL得到模型一回歸系數(shù)的估計值、置信區(qū)間、 、F、p等結果見表1。表1問題一中的濃度與顏色讀數(shù)的關系為下列5個模型:組胺:L=182.3872-0.1718R-2.2888G+0.6512B溴酸鉀:L=152.2913-1.3663R+7.4619G-7.187B工業(yè)堿:L=15.5381+0.06R-0.0404G-0.1013B硫酸鋁鉀:L=7.7733+0.0366R-0.1022G+0.0049B奶中尿素:L=13891.00649-112.303876R-0.20865303G-2.20340476B4.1.3比較數(shù)據(jù)的優(yōu)劣數(shù)據(jù)Data1.xls中5組數(shù)據(jù)分別用模型一
9、進行線性回歸,求得每個樣本的L的回歸值,并相應求出絕對誤差,最后求出相對平均誤差和誤差方差。每組數(shù)據(jù)的相對平均誤差定義為:表2對于數(shù)據(jù)的優(yōu)劣我們主要依據(jù)估計量回歸的誤差分析,一般誤差的均值水平越低說明數(shù)據(jù)回歸的精確度比較高,誤差的方差越小說明數(shù)據(jù)抗干擾能力越強,但由于選取樣本點濃度的大小水平不一,因此為了更公平衡量數(shù)據(jù)質(zhì)量,引進了相對與平均濃度的相對平均誤差 w ?,可見5組數(shù)據(jù)中組胺這組最優(yōu),而奶中尿素這組最劣,其他組相對中等,具體要看實驗的敏感度的要求而定,我們討論的結果只是其中的相對比較。4.2模型二 二次回歸模型在分析數(shù)據(jù)Data2.xls時,畫出(B,L)、(G,L)、(R,L)的散
10、點圖,我們發(fā)現(xiàn)其中數(shù)據(jù)基本呈現(xiàn)曲線的形狀,也可能近似于二次函數(shù)。本文采用3維二次函數(shù)窮舉優(yōu)化的方法4,最終確定以結果的可行性、誤差、方差所作的綜合評價為依據(jù)的最優(yōu)模型。4.2.1建立模型s.t 模型可行性、平均誤差最小、誤差方差最小.4.2.2模型求解該模型中各個分模型都可以利用MATLAB統(tǒng)計工具箱中的命令regress求解, data為自變量與應變量的數(shù)據(jù),應變量數(shù)據(jù)放第一列,這里數(shù)據(jù)太多就不列出了,以下命令為線性回歸完全二次方程的命令,其他幾個只要修改一下x即可。x1=data(:,2);x2=data(:,3);x3=data(:,4);x4=x1.2;x5=x2.2;x6=x3.2;
11、x7=x1.*x2;x8=x1.*x3;x9=x2.*x3;y=data(:,1);x10=ones(25,1);x=x10,x1,x2,x3,x4,x5,x6,x7,x8,x9;b,bint,r,rint,stats=regress(y,x)for i=1:25 L(i)=b(1)+b(2)*data(i,2)+b(3)*data(i,3)+b(4)*data(i,4)+b(5)*(data(i,2)2+b(6)*(data(i,3)2+b(7)*(data(i,4)2+b(8)*data(i,2)*data(i,3)+b(9)*data(i,2)*data(i,4)+b(10)*data(
12、i,3)*data(i,4);endL其主要數(shù)據(jù)列在下表:從R2、F、p可以看到8個模型都是可用,并且完全二次模型R2=0.99057,說明該模型回歸質(zhì)量更好,其次看它們的平均誤差與誤差的方差完全二次模型明顯更小,根據(jù)以上比較,確定二次模型中,完全二次模型最好,并求得L與R,G,B之間的關系滿足以下完全二次模型:L=146640.8869-2288.20429R+460.1482G-83.0718B+10.63497R2+0.973G2+0.3904B2-5.6242RG-0.9313RB+0.7849GB4.2.3誤差分析根據(jù)上式,用MATLAB求得樣本的回歸值、絕對誤差、平均誤差、誤差方差3如下表:從絕對誤差可以看到誤差與估計量的大小無單調(diào)相關性,但大誤差在中間部分20、30、50時明顯分布較多,兩頭的誤差較小,最大誤差為8.4444,最小誤差為0.0431,可以看到并非基數(shù)越大誤差越大,基數(shù)越小誤差越小,與基數(shù)無關,平均誤差為3.873604,誤差的方差為3.150453。5、模型推廣與評價模型僅針對該問題作了線性回歸和二次回歸,并沒有去考慮其它非線性回歸的方法,在其它模型類型方面可能還會有更好的模型,但是作為本文中的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 代理記賬合同范本做賬
- 傳媒公司度合同范本
- 價格合同范本
- 2025甘肅省安全員A證考試題庫附答案
- 2025年福建省安全員考試題庫附答案
- 2025年貴州省安全員B證考試題庫
- 勞務派遣工廠合作合同范本
- 公司底評估合同范本
- 代銷抽成合同范本
- 內(nèi)蒙公路施工合同范本
- 2025年服裝制版師(中級)職業(yè)技能鑒定考試題(附答案)
- 一年級下冊綜合實踐活動教案2
- 九年級主題班會課件:遇見最好的自己(開學第一課)
- 2025版股權投資基金股份收購與退出機制協(xié)議3篇
- 【營銷方案】2025小紅書平臺營銷通案
- 2025年棗莊科技職業(yè)學院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 護苗行動安全教育課件
- 生物-山東省濰坊市、臨沂市2024-2025學年度2025屆高三上學期期末質(zhì)量檢測試題和答案
- 油品庫房管理規(guī)定(2篇)
- 2025年小學督導工作計劃
- 2024-2025學年部編版歷史九年級上冊期末復習練習題(含答案)
評論
0/150
提交評論