所有年份國賽c題3篇_第1頁
所有年份國賽c題3篇_第2頁
所有年份國賽c題3篇_第3頁
所有年份國賽c題3篇_第4頁
所有年份國賽c題3篇_第5頁
已閱讀5頁,還剩26頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理顏色與物質(zhì)濃度的辨識(shí)問題摘要本文是對(duì)顏色與物質(zhì)濃度的辨識(shí)問題的研究,通過對(duì)溶液色度值與待測(cè)物濃度的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行多元回歸分析,建立了線性和非線性回歸方程模型,給出了數(shù)據(jù)的評(píng)價(jià)準(zhǔn)則和模型的誤差分析。問題一:首先依據(jù)對(duì)數(shù)據(jù)初步分析,發(fā)現(xiàn)物質(zhì)濃度與顏色讀數(shù)著一定的。利用統(tǒng)計(jì)工具箱中的 Regress 函數(shù)求出回歸系數(shù)和置信區(qū)間,并進(jìn)行殘差分析,最終建立關(guān)于顏色讀數(shù)和物質(zhì)濃度的多元線性回歸模型。基于對(duì)模型的檢驗(yàn)分析的基礎(chǔ)上,給出了判別數(shù)據(jù)優(yōu)劣的五大準(zhǔn)則,分別是評(píng)估模型是否的四個(gè)要素, F 檢驗(yàn)、相數(shù)R 2 、P 值、估計(jì)誤差方差 S 2 ;再加上數(shù)據(jù)完整性要

2、素,即模型擬合過程中是否異常數(shù)據(jù)剔除。根據(jù)判別準(zhǔn)則,數(shù)據(jù)優(yōu)劣的排序?yàn)椋航M胺>溴酸鉀>奶中尿素>硫酸鋁鉀>工業(yè)堿。問題二:首先建立二氧化硫濃度與顏色讀數(shù)之間的線性回歸模型,模型的殘差較大,擬合效果不佳??紤]建立非線性二次回歸模型,利用統(tǒng)計(jì)工具箱中的 rstool 函數(shù)建模,通過剩余標(biāo)準(zhǔn)差和殘差評(píng)估模型優(yōu)劣。最終建立的非線性二次回歸模型中,剩余標(biāo)準(zhǔn)差很小,模型非常好,模型的殘差相比五元線性回歸模型降低了一個(gè)數(shù)量級(jí),因此線性二次回歸模型比線性回歸模型更優(yōu)。問題三:首先降低多元線性回歸模型中顏色的維度來分析顏色維度對(duì)模型的影響;然后再通過減少數(shù)據(jù)量來分析數(shù)據(jù)量對(duì)模型的影響。通過

3、分析發(fā)現(xiàn):數(shù)據(jù)量不能低于 6,在 10-15 之間;顏色緯度可以降低,二緯和三緯都可以,一緯模型就不太優(yōu)甚至不成立了,而且顏色維度的大小比數(shù)據(jù)量的多少對(duì)模型的影響更大;于是最后使用層次分析法對(duì)數(shù)據(jù)量的多少和顏色維度的大小對(duì)模型的影響因子進(jìn)行分析求解,得出了影響因子分別為 0.414 和 0.586。:多元線性回歸,多元非線性二次回歸,誤差,層次分析法1精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理問題重述(一)問題的背景:比色法是目前常用的一種檢測(cè)物質(zhì)濃度的,即把待測(cè)物質(zhì)成溶液后滴在特定的白色試紙表面,等其充分反應(yīng)以后獲得一張有顏色的試紙,再把該顏色試紙與一個(gè)標(biāo)準(zhǔn)比色卡進(jìn)行對(duì)比,就可以確定待測(cè)

4、物質(zhì)的濃度檔位了。由于每個(gè)人對(duì)顏色的敏感差異和觀測(cè)誤差,使得這一在精度上受到很大影響。隨著照相技術(shù)和顏色分辨率的提高,希望建立顏色讀數(shù)和物質(zhì)濃度的數(shù)量,即只要輸入中的顏色讀數(shù)就能夠獲得待測(cè)物質(zhì)的濃度。試根據(jù)附件所提供的有關(guān)顏色讀數(shù)和物質(zhì)濃度數(shù)據(jù)完成下列問題:(二)問題的提出:1.附件 Data1.xls 中分別給出了 5 種物質(zhì)在不同濃度下的顏色讀數(shù),討論從這 5 組數(shù)據(jù)中能否確定顏色讀數(shù)和物質(zhì)濃度之間的這 5 組數(shù)據(jù)的優(yōu)劣。,并給出一些準(zhǔn)則來評(píng)價(jià)2. 對(duì)附件 Data2.xls 中的數(shù)據(jù),建立顏色讀數(shù)和物質(zhì)濃度的數(shù)學(xué)模型,并給出模型的誤差分析。3. 探討數(shù)據(jù)量和顏色維度對(duì)模型的影響。二、模型

5、假設(shè)與符號(hào)說明1. 模型假設(shè)1) 反應(yīng)應(yīng)具有較高的靈敏度和選擇性;2) 反應(yīng)生成的有色化合物的組成恒定且較;3)選擇適當(dāng)?shù)娘@色反應(yīng)和好適宜的反應(yīng)條件。2符號(hào)說明:見表 12符號(hào)含義Yi各待測(cè)物理論濃度(i=1,2,3,4,5,6)ppm(mg / L)ÙYi各待測(cè)物實(shí)際濃度(i=1,2,3,4,5,6)ppm(mg / L)C回歸方程回歸系數(shù)r殘差R 2相數(shù)FF 值P與 F 對(duì)應(yīng)的概率S 2估計(jì)誤差方差精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理表 1 符號(hào)說明三、問題的分析首先對(duì) Data1.xls 和 Data2.xls 提供的數(shù)據(jù)利用進(jìn)行相關(guān)性分析發(fā)現(xiàn):顏色讀數(shù)(五個(gè)維度:B

6、,G,R,H,S)對(duì)物質(zhì)濃度呈現(xiàn)一定線性相關(guān)性,而這一結(jié)論與文獻(xiàn)1使用-。吸收定律得到的結(jié)論一致。即物質(zhì)濃度和顏色讀數(shù)之間一定的其次利用統(tǒng)計(jì)學(xué)中的多元回歸2對(duì)給出的六組數(shù)據(jù)進(jìn)行回歸分析,從而得出物質(zhì)濃度與顏色讀數(shù)(五維)之間的相互(或數(shù)學(xué)模型)即經(jīng)驗(yàn)公式或回歸方程。,確定它們之間合適的數(shù)學(xué)表達(dá)式問題一基于對(duì) Data1.xls 的數(shù)據(jù)分析,我們可以利用統(tǒng)計(jì)工具箱中的Regress 函數(shù)求出回歸系數(shù)和置信區(qū)間,繪出殘差圖并進(jìn)行殘差分析,剔除置信區(qū)間不包含零點(diǎn)的異常點(diǎn)數(shù)據(jù),重新進(jìn)行多元線性回歸,能夠更好地建立關(guān)于顏色讀數(shù)和物質(zhì)濃度的多元線性回歸模型?;趯?duì)模型的檢驗(yàn)分析的基礎(chǔ)上,可以考慮評(píng)估模型是

7、否的四個(gè)要素,F(xiàn) 檢驗(yàn)、相數(shù)R 2 、P 值、估計(jì)誤差方差S 2 ,相數(shù)R 2 越接近 1,說明回歸F > F (k,n - k - 1)H方顯著;時(shí)拒絕0 ,F(xiàn)越大,說明回歸方顯著;1-a與F 對(duì)應(yīng)的概率P < a 時(shí)拒絕H 0 ,回歸模型成立。估計(jì)誤差方差越小,回歸方顯著。還可以再考慮數(shù)據(jù)完整性要素,即模型擬合過程中是否異常數(shù)據(jù)剔除。給出對(duì)應(yīng)評(píng)價(jià) Data1.xls 中 5 組數(shù)據(jù)優(yōu)劣的五大準(zhǔn)則,并根據(jù) 5 組數(shù)據(jù)是否同時(shí)滿足五大準(zhǔn)則對(duì)其優(yōu)劣進(jìn)行判別。問題二問題二是在問題一的基礎(chǔ)上,進(jìn)一步確定顏色讀數(shù)和物質(zhì)濃度的數(shù)學(xué)模型- 線性回歸方程。首先建立二氧化硫濃度與顏色讀數(shù)之間的線性

8、回歸模型,模型的殘差較大,擬合效果不佳。考慮建立非線性二次回歸模型,利用統(tǒng)計(jì)工具箱中的 rstool 函數(shù)建3B藍(lán)色顏色值G綠色顏色值R紅色顏色值H色調(diào)S飽和度m數(shù)據(jù)量精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理模,通過剩余標(biāo)準(zhǔn)差和殘差評(píng)估模型優(yōu)劣。最終建立的非線性二次回歸模型中,剩余標(biāo)準(zhǔn)差很小,模型非常好,模型的殘差相比多元線性回歸模型降低了一個(gè)數(shù)量級(jí),因此線性二次回歸模型比線性回歸模型更優(yōu)。通過兩種模型的誤差的對(duì)比發(fā)現(xiàn):非線性回歸二次方程的精度更高。問題三問題三是討論數(shù)據(jù)量和顏色維度對(duì)模型的影響。根據(jù)問題一和問題二的求解結(jié)果發(fā)現(xiàn):數(shù)據(jù)量的大小會(huì)影響模型的優(yōu)劣;以及通過枚舉法調(diào)整線性回歸中

9、變量的數(shù)量即顏色維度發(fā)現(xiàn):顏色維度的多少也會(huì)影響模型的優(yōu)劣。而且數(shù)據(jù)量對(duì)模型優(yōu)劣的影響度大于顏色維度對(duì)模型優(yōu)劣的影響度。因此本文提出采用層次分析法對(duì)兩者的影響因子進(jìn)行分析,最終得出了數(shù)據(jù)量和顏色維度對(duì)模型優(yōu)劣的影響因子。四、模型的建立與求解問題一:基于對(duì)數(shù)據(jù)的分析,本文認(rèn)為有 Data1.xls 提供的 5 組數(shù)據(jù)能確定顏色讀數(shù)與物質(zhì)濃度之間的,并建立了多元線性回歸模型:Y = e + C1R + C2G + C3 B + C4 H + C5 S()()式中C1 , C2 , C3 , C4 , C5 表示方程的回歸系數(shù)。利用統(tǒng)計(jì)工具箱建立多元線性回歸方程:b, bint,r,rint,sta

10、ts=regress(Y,X,alpha)()式()中 b 為回歸系數(shù),bint 為回歸系數(shù)的置信區(qū)間,r 為殘差,rint 為殘差的置信區(qū)間,alpha 為顯著性水平。stats 包含四個(gè)統(tǒng)計(jì)量,相數(shù)R 2 、F值、與 F 對(duì)應(yīng)的概率 p,估計(jì)誤差方差。相數(shù)R 2 越接近 1,說明回歸方顯著; F > F (k,n - k - 1)時(shí)拒絕H ,F(xiàn) 越大,說明回歸方顯著;與 F1-a0對(duì)應(yīng)的概率 p < a 時(shí)拒絕H ,回歸模型成立。估計(jì)誤差方差越小,回歸方0顯著。1.組胺濃度與顏色讀數(shù)之間的函數(shù):根據(jù)組胺的實(shí)驗(yàn)數(shù)據(jù)(見表 2),其中 0 表示待測(cè)物質(zhì)濃度為零的情形,即水溶液,使用

11、對(duì)數(shù)據(jù)進(jìn)行多元線性回歸(代碼見附錄中程序 1),畫出殘差圖(圖 1)并給出具體的殘差值(表 3)和其置信區(qū)間(表 4)。4濃度(ppm)BGRHS0681101212311110037661101216950468711716155精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理表 2組胺的實(shí)驗(yàn)數(shù)據(jù)圖 1組胺濃度與顏色讀數(shù)線性回歸殘差圖表 3組胺濃度與顏色讀數(shù)線性回歸殘差值表 4由表 4:相數(shù)R 2 =0.999580110101,說明回歸方程非常顯著。F 對(duì)應(yīng)的< a ,拒絕H ,根據(jù) F 檢驗(yàn),回歸模型()成立。0概率 p5相數(shù)R 2F 值與 F 對(duì)應(yīng)的概率P估計(jì)誤差方差0.99958

12、01101011904.4613583004010.0000007710221.312155935514濃度(ppm)殘差值 r0-0.993129343227508100-0.08324056256402950-0.18405428289298725-0.08707061928591012.50.92019881590177000.7333666358335621000.14179954361408450-0.222352920091282251.05650655285630512.5-1.2820238201439202562991201912212.5661021182011206511

13、0120241151003564109111725046871181201912612.56410111820115精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理y = -212.765020090+2.3213368359433R2.溴酸鉀濃度與顏色讀數(shù)之間的()函數(shù):根據(jù)溴酸鉀的實(shí)驗(yàn)數(shù)據(jù)(見表 5),首先利用統(tǒng)計(jì)工具箱建立多元線性回歸方程(代碼見附錄中程序 1),畫出殘差圖(圖 2)。從殘差圖可以看出,除第十個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說明回歸模型能較符合原始數(shù)據(jù),而這個(gè)數(shù)據(jù)可視為異常點(diǎn)(剔除)。去掉異常點(diǎn)之后再次進(jìn)行多元線性回歸,繪出殘差圖(圖 3

14、),并給出具體的殘差值(表 6)和其置信區(qū)間(表 7)。表 5 溴酸鉀的實(shí)驗(yàn)數(shù)據(jù)由表 7:相數(shù)R 2 =09985210281929,說明回歸方程非常顯著。F 對(duì)應(yīng)圖 2 溴酸鉀濃度與顏色讀數(shù)線性回歸殘差圖6濃度(ppm)BGRHS01291415060256912.58501281415057257012.587精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理圖 3 剔除異常點(diǎn)后溴酸鉀濃度與顏色讀數(shù)線性回歸殘差圖表 6表 7< a ,拒絕H ,根據(jù) F 檢驗(yàn),回歸模型()成立。0的概率 py = 1309.83242521415-4.722511350698R - 93工業(yè)堿濃度與顏色讀

15、數(shù)之間的函數(shù)根據(jù)工業(yè)堿的實(shí)驗(yàn)數(shù)據(jù)(見表 8),使用():對(duì)數(shù)據(jù)進(jìn)行多元線性回歸(代碼見附錄中程序 1),畫出殘差圖(圖 4)并給出具體的殘差值(表 9)和其置信區(qū)間(表 10)。7濃度(ppm)BGRHS7.341538.104298.7415812612712052相數(shù)R 2F 值與F 對(duì)應(yīng)的概率P估計(jì)誤差方差0998521028192940508724646115530.00019285921005.8200279444505濃度(ppm)殘差值 r0-0.311054621479073100-1.739298695133584501.19895035374111125-2.0463581

16、6577541612.5-0.63395640178481500.5638876024934941001.83270560107860150-0.844912938120160251.980037264978989精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理表 8 工業(yè)堿的實(shí)驗(yàn)數(shù)據(jù)圖 4 工業(yè)堿濃度與顏色讀數(shù)線性回歸殘差圖表 9表 10數(shù)R 2 =0.631383991895078,說明回歸方程不顯著。根據(jù) F由表 10:相> a ,接受H ,回歸模型()不成立。0檢驗(yàn),F(xiàn) 對(duì)應(yīng)的概率 py = 261.06486974071-0.3136416077960R4硫酸鋁鉀濃度與顏色讀數(shù)之

17、間的函數(shù)根據(jù)硫酸鋁鉀的實(shí)驗(yàn)數(shù)據(jù)(見表 11),():使用對(duì)數(shù)據(jù)進(jìn)行多元線性回歸(代碼見附錄中程序 1),畫出殘差圖(圖 5)。8濃度(ppm)BGRHS0116126104764401141261047445相數(shù)R 2F 值與 F 對(duì)應(yīng)的概率 P估計(jì)誤差方差0.6313839918950780.3425700338632040.85176432087755831.538101080870671濃度(ppm)殘差值 r7.343.1931873856500778.141.6300460340291258.74-0.8456846595988619.190.36212661370288610.18

18、-0.20689786464613011.80.0848382678189990-4.2176157769559109.1912010.181272111914721111.8946911482370152精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理表 11硫酸鋁鉀的實(shí)驗(yàn)數(shù)據(jù)9011812510578400113124103734201141241047539011312610472450.51740.51780.513811871981230.513611870981220.513611764981340.513611864971350.51381115099161114911648991

19、72117111471195599159114511401135499156113711151991601.51801.51841.51711.51761.51671.5171219921962190219421982198519851985174516851995197精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理圖 5 硫酸鋁鉀濃度與顏色讀數(shù)線性回歸殘差圖從殘差圖可以看出,除第 34、35 個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近, 且殘差的置信區(qū)間均包含零點(diǎn),這兩個(gè)數(shù)據(jù)可視為異常點(diǎn)(剔除),剔除后重新進(jìn)行多元線性回歸。其殘差圖見圖 6,其置信區(qū)間見表 10,具體的殘差值見表 12。圖 6 剔

20、除異常點(diǎn)后硫酸鋁鉀濃度與顏色讀數(shù)線性回歸殘差圖表 12由表 12:相數(shù)R 2 =0.618028668332955,說明回歸方程不夠顯著。根據(jù)F 檢驗(yàn),F(xiàn) 對(duì)應(yīng)的概率 p < a ,拒絕H ,回歸模型()成立。0y = 33.301599085809258 + 0.064396228061359B - 0.074826220081641G ()-0.197724103131009R - 0.099368368917937H - 0.078317444150693S10濃度(ppm)殘差值 r相數(shù)R 2F 值與 F 對(duì)應(yīng)的概率 P估計(jì)誤差方差0.6180286683329559.38438

21、56309502290.0000210759167020.953423023427052精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理表 13 5.奶中尿素濃度與顏色讀數(shù)之間的函數(shù):根據(jù)奶中尿素的實(shí)驗(yàn)數(shù)據(jù)(見表 14),使用歸(代碼見附錄中程序 1),畫出殘差圖(圖 7)。對(duì)數(shù)據(jù)進(jìn)行多元線性回11濃度(ppm)BGRHS01181361392537500117137139274100.21781249537847500.22618565781601200.0973848835382300-0.3911153587869320-0.29400307833349000.09184514804150

22、10.5-1.0945991685749800.5-1.5781203775695940.50.5507725181514720.50.4035234269924950.50.0821619179331120.50.1359372132475070.5-1.0497859415269491-0.4179696703980881-0.33841709064283210.30124339392761210.9548920167922171-0.1296167657158011-0.3659830544852731.5-0.3656533643710721.5-0.5472001629482581.

23、50.2654866972220341.5-0.0354667603354651.50.3875192061063511.50.0432204452547292-0.9724668126556202-0.8264296150832482-0.5136554512060292-0.6498001169063562-1.0965329091047272-0.95731046096172551.98906982241874551.99949981443903051.88377532025444951.993796182092362精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理表 14奶中尿素的實(shí)驗(yàn)數(shù)

24、據(jù)圖 7 殘差圖從殘差圖可以看出,除第 5 個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說明回歸模型能較符合原始數(shù)據(jù),而這個(gè)數(shù)據(jù)可視為異常點(diǎn)(剔除),剔除后重新進(jìn)行多元線性回歸。其殘差圖見圖 8,其置信區(qū)間見表 15,具體的殘差值見表 14。表 1512相數(shù)R 2F 值與 F 對(duì)應(yīng)的概率P估計(jì)誤差方差0.9579177488436.420779687570.0000268823437904.2069058708710001081361101361081201191401422640500111139107136105125135140202750011413411213

25、21051341071351382657精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理圖 8 剔除異常點(diǎn)后奶中尿素濃度與顏色讀數(shù)線性回歸殘差圖表 16由表 16:相數(shù)R 2 =0.95791774884,說明回歸方程顯著。根據(jù) F 檢驗(yàn),F(xiàn)對(duì)應(yīng)的概率 p < a ,拒絕H ,回歸模型()成立。0y = 18784.81577777840 + 285.91798514465B + 454.96769353348G-823.02411983538R - 369.46611698178H + 249.38672115051S6評(píng)價(jià) 5 組數(shù)據(jù)的優(yōu)劣()基于問題一的分析,我們首先給出評(píng)價(jià) 5 組

26、數(shù)據(jù)優(yōu)劣的五大準(zhǔn)則: 準(zhǔn)則一:能通過 F 檢驗(yàn);準(zhǔn)則二:相數(shù) R2 越接近于 1 越好;13濃度(ppm)殘差010.2553693863650083.8819466656211000-84.6762330836681500426.6173457518310-16.94534846971550.421074517217500-133.8101813348691500-211.0463689393872000-46.8467231183310-65.449023536308500-4.7128654954651000-76.9073227021581500-51.3084167408122000

27、169.256579546811精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理P <0.05且越接近于 0 越好;準(zhǔn)則三:準(zhǔn)則四:誤差方差越小越好; 準(zhǔn)則五:是否剔除異常數(shù)據(jù)。表 17 五種物質(zhì)線性回歸方程的顯著性檢驗(yàn)指標(biāo)由表 17,五組數(shù)據(jù)中,只有工業(yè)堿的多元線性回歸模型不成立,因此工業(yè)堿的數(shù)據(jù)是最差的。組胺的數(shù)據(jù)完整,多元線性回歸模型的相數(shù) R2 、F 值最。硫酸鋁鉀的相數(shù) R2 比較小,模型不是很顯著,大,P 值最小,數(shù)據(jù)是最而且剔除了兩個(gè)數(shù)據(jù),因此數(shù)據(jù)不夠好。溴酸鉀和奶中尿素都是剔除一個(gè)數(shù)據(jù)之后建立的模型,相數(shù) R2 很高,但溴酸鉀的相更優(yōu)。數(shù) R2 更大一些,數(shù)據(jù)相對(duì)因此數(shù)據(jù)優(yōu)

28、劣的排序?yàn)椋航M胺>溴酸鉀>奶中尿素>硫酸鋁鉀>工業(yè)堿。問題二:根據(jù)前面對(duì)問題二的分析,首先我們?nèi)匀唤⑴c問題一一致的線性回歸模型,利用 Data2.xls 提供的 25 組數(shù)據(jù)(即表 18),采用進(jìn)行線性回歸(代碼見附錄中程序 2),得到了二氧化硫的濃度與顏色讀數(shù)之間的線性回歸方程。2.1 多元線性回歸模型利用多元線性回歸,繪出殘差圖(見圖 9).從殘差圖可以看出,除第 15 個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說明回歸模型能較符合原始數(shù)據(jù),而這個(gè)數(shù)據(jù)可視為異常點(diǎn)(剔除),剔除后重新進(jìn)行多元線性回歸,得到殘差圖(見圖 10),回歸方程的顯

29、著性檢驗(yàn)指標(biāo)(見表 19)和具體殘差值(見表 20)。由表 19:相數(shù)R 2 =0.9250310882931,說明回歸方程較為顯著。根據(jù) F 檢驗(yàn),< a ,拒絕H ,回歸模型()成立。但是估計(jì)誤差方差偏大。0F 對(duì)應(yīng)的概率 py = 2910.630153554265+3.587352490846x1 - 21.155917919245x2 ()+4.796418968805514物質(zhì)種類R2FPS 2模型檢驗(yàn)數(shù)據(jù)完整性組胺0.9995801904.4613580.00000071.312155模型成立完整溴酸鉀0.998521405.0872460.0001925.820027模型

30、成立剔除 1 個(gè)工業(yè)堿0.6313830.3425700.85176431.538101模型不成立完整硫酸鋁鉀0.6180289.3843850.0000210.953423模型成立剔除 2 個(gè)奶中尿素0.95791736.4207790.00002637904.206905模型成立剔除 1 個(gè)精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理表 18 二氧化硫的實(shí)驗(yàn)數(shù)據(jù)圖 9 線性回歸殘差圖15濃度(ppm)BGRHS015301530153015301542014411517013582201441151691368120145115172135833014511417413587301451

31、141761358930145114175135893014611417513588501105010950110801198011980120100115100114100116136177137129137178137131精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理圖 10 剔除異常點(diǎn)后二氧化硫濃度與顏色讀數(shù)線性回歸殘差圖表 19二氧化硫線性回歸方程的顯著性檢驗(yàn)指標(biāo)表 2016濃度(ppm)殘差值0-2.3842564815444410-2.47614219485197406.94868294647585606.94868294647585603.47342493221236720-1

32、4.67243413909204720-13.65712889075803120-17.320608464579323304.0587000904415623015.5298943587694113020.326313327574439306.20694473375931550-31.57625506122144550-33.72449970453931280-8.94882997921672580-13.745248948021299800.37411964579428110011.6272267859280871005.89162965176410610017.36282392009206

33、91504.19104833456367515015.8302553991745751508.79370607374426115010.941950717061900相數(shù)R 2F 值與F 對(duì)應(yīng)的概率P估計(jì)誤差方差0.925031088293144.41990475834120.0000000016617270.6516543935724精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理通過殘差值可以看出,模型還有待優(yōu)化??梢酝ㄟ^剔除新的殘差圖中的異常點(diǎn)來繼續(xù)優(yōu)化多元線性回歸模型,但續(xù)優(yōu)化作用有限,而且數(shù)據(jù)完整性越來越差。該線性回歸模型的結(jié)果需要進(jìn)一步進(jìn)行優(yōu)化改進(jìn),于是嘗試多元非線性二次回歸。2.2

34、 多元二次回歸模型2.2.1 多元二次回歸模型的建立與求解利用 rstool(x,y,m, alpha)建立多元二次回歸方程。其中m這一選項(xiàng)是指從下列 4 個(gè)模型中選擇 1 個(gè)(用字符串輸入,缺省時(shí)為線性模型):linear(線性): y = b + b x + b x01 1m mpurequadratic(純二次):y = b+ b x + bm01 1= b + b x +interaction(交叉): y+01 1quadratic(完全二次): y= b + b x +01 1rstool 函數(shù)輸出回歸參數(shù),剩余標(biāo)準(zhǔn)差以及殘差,可以通過修改m的值比較多個(gè)模型的標(biāo)準(zhǔn)差來確定哪個(gè)最好。

35、本題最終采用完全二次的進(jìn)行多元非線性二次回歸,即采用模型()y = b+ b x + b x01 12b7+b x x8 1+()1 2+b x3 4415模型()中 y 代表濃度,3, x4 ,x5 分別代表B,G,R,H,S 。代入數(shù)據(jù)進(jìn)行多元二次回歸擬合(代碼見附錄中程序 3), 19 和模型()。具體結(jié)果見圖 11、表圖 1117精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理y = -229171.315611749 -5684.26671497298B - 304.823653309202G+4983.90599969629R + 4477.91841203602H - 1706.6

36、3700374936S-2.89310790233349BG - 0.437552876691341BR+15.7179303724566BH+2.17845769137645BS - 5.35551688411491GR +2.95991056538886GH+4.38735845493663GS - 26.5095405408683RH - 2.69440081387518RS+8.05373713434564HS +12.9717944022357B 2 +3.83546582450501G2()-1.40181633583134R2- 11.9129488163979H2 +1.543

37、03389696168S2表 212.2.2 多元二次回歸模型的檢驗(yàn)= Yi -Yi 有本文采用剩余標(biāo)準(zhǔn)差對(duì)該二次回歸模型的進(jìn)行檢驗(yàn)。回歸殘差ei助于衡量回歸模型擬合樣本數(shù)據(jù)的程度。應(yīng)用線性回歸分析,需要計(jì)算回歸剩余標(biāo)準(zhǔn)差,而回歸剩余標(biāo)準(zhǔn)差是表示回歸方程用來的精度標(biāo)志,可用來檢驗(yàn)?zāi)?#229;(Y - Y2i )QS =i=Yn - 2n - 2 ; S型的可靠程度,回歸剩余標(biāo)準(zhǔn)差(記作S ):越接YY18濃度(ppm)殘差值 r0-0.18302330664448600.2956989886854440-0.05730580519798420-0.05730580519798420-0.01

38、12789762431476200.483971591391310200.054436771166365420-0.617107404175840300.438573762845408300.22355867359874530-0.471712868260511300.0136040522083931500.55166228432790450-0.775350805535709500.0956137145112734800.0435429326025769800.24311950019910080-0.357436173322640100-1.738164184669591000.023154

39、50457172121001.606883631699021500.02540719824173721500.8755436942992671500.637870694485173150-1.34395668067009精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理近于 0,說明模型對(duì)樣本數(shù)據(jù)的偏差越小,的可靠程度(精度)越高;SY 數(shù)值越大,模型偏離樣本數(shù)據(jù)越大,用于的可靠程度就越差在實(shí)際問題中,SY 往往較大,為評(píng)價(jià)模型的優(yōu)劣,通常采用指標(biāo)SY。當(dāng)SY小于15% 時(shí),可YY以認(rèn)為模型較好。根據(jù)結(jié)果可以計(jì)算出回歸剩余標(biāo)準(zhǔn)差 RMSE= 1.65062261369908 ,SYY=0.0282

40、1577117,模型非常好。而且從殘差值可以看出,二次模型擬合的效果非常好,并且沒有剔除原始數(shù)據(jù), 方程較為復(fù)雜。數(shù)據(jù)的完整性,不足之處應(yīng)該是問題三:首先分析數(shù)據(jù)量對(duì)模型的優(yōu)劣有無影響。根據(jù)問題一和問題二的求解結(jié)果發(fā)現(xiàn):不管是多元線性回歸,還是非線性二次回歸,對(duì)同一物質(zhì)而言,數(shù)據(jù)量的大小會(huì)影響模型的優(yōu)劣;下面先對(duì)兩個(gè)代表性物質(zhì)的數(shù)據(jù)進(jìn)行分析。硫酸鋁鉀:硫酸鋁鉀的實(shí)驗(yàn)數(shù)據(jù)是最多的一組,按照各種濃度依次去掉最后一個(gè)數(shù)據(jù)點(diǎn),逐步降低數(shù)據(jù)量,每次減少 6 個(gè)數(shù)據(jù)點(diǎn),直接多元線性回歸擬合,未剔除數(shù)據(jù)。具體結(jié)果見表 22表 22由表 22 可知:隨著數(shù)據(jù)量減少,P 值一直在增大,當(dāng)數(shù)據(jù)量減小到 25 個(gè)數(shù)

41、據(jù)點(diǎn)時(shí),P>0.05,回歸模型不再成立。組胺:組胺的實(shí)驗(yàn)數(shù)據(jù)是多元線性回歸擬合最優(yōu)的一組,由于數(shù)據(jù)量較少, 10 組數(shù)據(jù),依次去掉最后兩個(gè)數(shù)據(jù)點(diǎn),逐步降低數(shù)據(jù)量,直接多元線性回歸擬合,未剔除數(shù)據(jù)。具體結(jié)果見表 23表 2319數(shù)據(jù)量模型的評(píng)價(jià)R2FPS 2模型檢驗(yàn)100.9995801101011904.4613583004010.0000007710221.312155935514成立80.9999286305735604.2407679800950.0001784140170.411907532627成立61NaNNaNNaN不成立數(shù)據(jù)量模型的評(píng)價(jià)R2FPS 2模型檢驗(yàn)370.468

42、6668339264505.4687615151465210.0010130365435861.650977684294797成立310.4477114095514804.0532379021979040.0078548546222011.778012946024591成立250.3934341813726592.4647776767233640.0698594663593252.063600764003753不成立190.4769013921124802.3703821818601960.0975182022463531.963208135675026不成立精品數(shù)模資料淘寶:閔大荒工科男的雜

43、貨鋪認(rèn)真整理由表 23:隨著數(shù)據(jù)量減少,P 值在增大,當(dāng)數(shù)據(jù)量減小到 6 個(gè)數(shù)據(jù)點(diǎn)時(shí),回歸模型不成立。結(jié)合比色法的原理:待測(cè)物質(zhì)溶液的濃度越低,測(cè)出來的效果越好,我們對(duì)Data1.xls 和 Data2.xls 提供的六種物質(zhì)六組數(shù)據(jù)在各自組內(nèi)刪除一些濃度較大的數(shù)據(jù),即減少了組內(nèi)的數(shù)據(jù)量,再使用對(duì)組胺、奶中尿素和二氧化硫(因?yàn)殇逅徕洷旧頂?shù)據(jù)量為7 就少,根據(jù)問題1 的五大準(zhǔn)則,工業(yè)堿這組數(shù)據(jù)不是太好,硫酸鋁鉀的濃度都比較低)重新進(jìn)行五元的線性回歸分析,結(jié)果見表 24(代碼見附件程序 4)。在進(jìn)行多元線性回歸的過程中發(fā)現(xiàn),數(shù)據(jù)量不能,基本上 10-15組之間,低于 6 組,回歸方程效果就不好了甚

44、至不成立了。表 24其次分析顏色維度對(duì)模型的優(yōu)劣有無影響。我們通過改變顏色維度來找其對(duì)模型的影響。從顯示技術(shù)上看,目前通行的 RGB 標(biāo)準(zhǔn)(紅綠藍(lán))和 HSL 標(biāo)準(zhǔn)(色調(diào)、飽和度、亮度)是等價(jià)的,結(jié)合題目給出的數(shù)據(jù),我們考慮是否將維度降為3 維、2 維和 1 維,再重新進(jìn)行回歸分析,具體代碼見程序 5,具體數(shù)據(jù)見表 25-表 28。20物質(zhì)數(shù)據(jù)量R2FPS 2組胺100.99961904.46130.000000771.312280.9982220.28040.00452.4781奶中尿素150.957936.42080.0000268837904.2069120.926515.13480.0

45、023945914.3490.94119.58970.0459729441.39二氧化硫250.92503144.419900.00000000166270.651654210.891924.74340.00000095183.52180.972183.68800.000000006631.24150.970459.06610.00000131216.56120.9882100.13260.000010754.1447精品數(shù)模資料淘寶:閔大荒工科男的雜貨鋪認(rèn)真整理表 25 六種不同物質(zhì)在不同顏色維度下的 R2 表表 26 六種不同物質(zhì)在不同顏色維度下的 F 表21顏色維度物質(zhì)五維RGBHS三維

46、RGB二維HS一維R一維G一維B一維H一維S組胺0.000000770.00000020.0000040.000090.00000000030.0000020.0000010.00000808溴酸鉀0.000118610.0123380.0000320.65270.0011340.000020.025380.0000209工業(yè)堿0.85180.1060560.23160.13420.1038490.263570.07480.1079顏色維度物質(zhì)五維RGBHS三維RGB二維HS一維R一維G一維B一維H一維S組胺1904.4613415.75191.188452.28221335.1724138.971174.222101.3408溴酸鉀152.44631.771563.57180.218424.4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論