




已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
玉米營養(yǎng)品質(zhì)的快速鑒定摘要:光譜檢測法作為玉米營養(yǎng)品質(zhì)含量的快速分析方法,首先需要根據(jù)常規(guī)生化檢測數(shù)據(jù)結(jié)合光譜響應數(shù)據(jù)完成合理的定標與矯正,建立合適的數(shù)據(jù)分析模型。在進行光譜檢測時,由于光譜波長區(qū)間大、波長取值點較多,對快速分析帶來了不便。首先,本文采用R型聚類的方法,將區(qū)間內(nèi)所有波長分成5類,采用相關性分析,從中篩選出5個代表波長作為研究對象。其次利用多元線性回歸的方法,對代表波長的響應數(shù)據(jù)和蛋白質(zhì)含量進行回歸分析,得出蛋白質(zhì)含量與光譜響應數(shù)據(jù)之間的關系,建立了蛋白質(zhì)含量的光譜分析模型。結(jié)合F檢驗、殘差數(shù)據(jù)分析等方法得出所建立的模型可信的結(jié)論。然后,給出以殘差平方和為指標的模型評價體系,并討論了模型的適用范圍。其次,對剩余26個樣本的蛋白質(zhì)含量進行了預測。最后,針對多輸入多輸出的問題,本文采用BP神經(jīng)網(wǎng)絡模型,對樣本數(shù)據(jù)進行學習與訓練,在對第81-100個樣本進行檢驗并符合要求之后,建立了三種營養(yǎng)成分的快速檢測模型。然后分別對26個樣本的蛋白質(zhì)含量、纖維素含量和脂肪含量進行了預測。關鍵詞:聚類分析;多元回歸;BP神經(jīng)網(wǎng)絡1 問題重述玉米是生態(tài)農(nóng)業(yè)的關鍵農(nóng)作物之一,玉米中富含蛋白質(zhì)、纖維素、脂肪、水溶性多糖和糖醇類等多種生理活性物質(zhì)。玉米的營養(yǎng)品質(zhì)是指玉米中所含的各種營養(yǎng)成分(蛋白、纖維素、脂肪等)。為了實行優(yōu)質(zhì)玉米的培養(yǎng),需要實現(xiàn)玉米營養(yǎng)品質(zhì)的快速鑒定。玉米營養(yǎng)品質(zhì)的鑒定需要對主要營養(yǎng)成分的含量進行檢測。光譜檢測法是能夠檢測物質(zhì)成分含量的快速分析方法,它可以根據(jù)物質(zhì)的光譜響應特征來鑒別物質(zhì)并確定化學組成和相對含量,具有測定時間短、非破壞性、多指標同時測定等優(yōu)點,能夠?qū)崿F(xiàn)在線、實時、原位的定量分析與監(jiān)測。光譜檢測分析首先需要根據(jù)常規(guī)生化檢測數(shù)據(jù)結(jié)合光譜響應數(shù)據(jù)完成合理的定標與矯正過程,建立合適的數(shù)據(jù)分析模型,進而實現(xiàn)對物質(zhì)成分的快速檢測。準備126個玉米樣品,經(jīng)過物理方法加工為粉末狀。采用Fourier近紅外光譜分析儀采集光譜數(shù)據(jù),同一樣品對不同頻率的光產(chǎn)生不同的響應,光波長變化范圍為100004000(其中為光波長單位),得到所有樣品的光譜響應數(shù)據(jù)。為完成光譜建模實現(xiàn)快速檢測,采用常規(guī)生化方法檢測前100個玉米樣品的蛋白、纖維素和脂肪的成分含量值?,F(xiàn)需要結(jié)合測定的數(shù)據(jù)建立數(shù)學模型解決下列問題:1、根據(jù)前100個樣品的光譜響應數(shù)據(jù)和蛋白含量的生化檢測值,建立單一成分的光譜分析模型;擬定模型評價指標,并討論模型的適用范圍。2、根據(jù)所建立的數(shù)學模型,估算其余26個玉米樣品(編號101126)的蛋白含量。3、結(jié)合玉米的光譜響應數(shù)據(jù)和蛋白質(zhì)、纖維素、脂肪三種營養(yǎng)成分的生化檢測值,設計合理的玉米營養(yǎng)品質(zhì)快速檢測方案建立數(shù)學模型;進一步利用模型估算其余26個玉米樣品中蛋白質(zhì)、纖維素、脂肪三種營養(yǎng)成分含量。2 問題分析問題一的分析:光譜檢測可以根據(jù)物質(zhì)的光譜響應特征來鑒別物質(zhì)并確定化學組成和相對含量?,F(xiàn)已知100個樣品的光譜響應數(shù)據(jù)和蛋白質(zhì)的生化檢測含量,建立光譜分析模型,就是根據(jù)常規(guī)生化檢測數(shù)據(jù)結(jié)合光譜響應數(shù)據(jù)完成合理的定標與矯正。由于不同樣品的蛋白質(zhì)、纖維素、脂肪等營養(yǎng)成分含量的不同,導致不同樣品對于不同頻率光譜的響應數(shù)據(jù)也不同。對于一種樣品,其蛋白質(zhì)元素含量與光譜響應數(shù)據(jù)存在一定的關系,本問就是要通過已知的100個樣品的數(shù)據(jù),確定兩者之間的關系。通過對已知數(shù)據(jù)的分析知,樣品對不同波長的響應特征與蛋白質(zhì)含量是多對一的關系,本文采用多元線性回歸分析建立光譜分析模型,明確了兩者的關系函數(shù)。同一樣品對不同波長的響應有390組數(shù)據(jù),這組數(shù)據(jù)維數(shù)過大,為了方便模型的建立與求解,在實際操作過程中,可選取有代表意義,可以更多的體現(xiàn)蛋白質(zhì)含量和光譜響應數(shù)據(jù)關系的波長來進行建模。本文采用聚類分析的方法篩選出具有代表意義的波長數(shù)據(jù),然后建立多元回歸分析模型,求解出蛋白質(zhì)含量和光譜響應數(shù)據(jù)之間的關系,即光譜分析模型。最后以誤差平方和為評價指標,并對線性回歸模型的適用范圍進行了分析。問題二的分析:本問要根據(jù)上一問所建立的光譜分析模型,估算剩余樣品的蛋白質(zhì)含量。將剩余樣品的光譜響應數(shù)據(jù)帶入上一問求解得到的線性回歸方程,可得到剩余樣品的蛋白質(zhì)含量。問題三的分析:本問要設計合理的玉米營養(yǎng)品質(zhì)快速檢測方案建立數(shù)學模型,就是根據(jù)前100個樣品的光譜響應數(shù)據(jù)和蛋白質(zhì)、纖維素、脂肪三種營養(yǎng)成分含量,建立兩者之間的關系。這是一個多輸入多輸出的模型,本文采用BP神經(jīng)網(wǎng)絡,通過網(wǎng)絡不斷地學習,使實際輸出與期望盡可能地相近,即使網(wǎng)絡輸出層的誤差平方和達到最小,從而建立玉米營養(yǎng)品質(zhì)快速檢測方案模型。最后本文利用上述檢測模型,對其余26種樣品的蛋白質(zhì)、纖維素、脂肪三種營養(yǎng)成分含量進行了預測。3 模型假設與符號說明3.1模型假設(1)在整個光譜檢測過程中,不存在人為和外部環(huán)境因素的干擾;(2)假設10000-4000 為測定玉米中蛋白質(zhì)、脂肪、纖維素含量的有效波段;(3)假設蛋白質(zhì)、脂肪、纖維素含量的檢測之間沒有相互影響 。3.2 符號說明 第個玉米樣品的第個波長指標變量的響應數(shù)據(jù); 中心化變換后的響應數(shù)據(jù); 兩變量與的樣本相關系數(shù); 變量的回歸系數(shù); 第個樣品的蛋白質(zhì)含量實測數(shù)據(jù); 第個樣品的蛋白質(zhì)含量估計數(shù)據(jù); 誤差平方和; 回歸平方和; 稱為復相關系數(shù); 表示隱含層第個節(jié)點到輸入層第個節(jié)點之間的權(quán)值; 表示隱含層第個節(jié)點的閾值; 表示隱含層的激勵函數(shù); 表示輸出層第個節(jié)點到隱含層第個節(jié)點之間的權(quán)值; 表示輸出層第個節(jié)點的閾值; 表示輸出層的激勵函數(shù); 表示輸出層第個節(jié)點的輸出; 每一個樣本的二次型誤差準則函數(shù)為。4基于聚類分析和多元回歸的光譜分析模型4.1 聚類分析模型聚類分析,亦稱群分析或點群分析,它是研究多要素事物分類問題的數(shù)量方法。其基本原理是,根據(jù)樣本自身的屬性,用數(shù)學方法按照某些相似性或差異性指標,定量地確定樣本之間的親疏關系,并按這種親疏關系程度對樣本進行聚類。常見的聚類分析方法有系統(tǒng)聚類法、動態(tài)聚類法和模糊聚類法等。對樣本進行分類稱為Q型聚類分析,對指標進行分類稱為R型聚類分析。本文采用R型聚類分析對波長變量進行聚類1。通過對樣品的光譜響應數(shù)據(jù)進行分析,發(fā)現(xiàn)樣品對于不同波長的相應數(shù)據(jù)有390個,波長變量維數(shù)太多,且波長變量間的相關度較高,給系統(tǒng)分析與建模帶來了很大的不便。若要對樣品的光譜響應數(shù)據(jù)與蛋白質(zhì)含量進行多元線性回歸,就要求樣品數(shù)量應大于變量個數(shù),而已知蛋白質(zhì)含量的樣品只有100個,遠小于波長變量的維數(shù),因此需要對波長變量進行篩選,選出具有代表意義的波長來進行回歸分析。本文采用R型聚類分析,通過研究變量的相似系數(shù),按照變量的相似關系把它們聚合成若干類,進而找出影響系統(tǒng)的主要因素,選取每一類中具有代表意義的波長。4.1.1數(shù)據(jù)的標準化處理已知共有100個玉米樣品,每個樣品測得了390個波長變量的響應數(shù)據(jù),原始數(shù)據(jù)矩陣為: (1)其中,(,)為第個玉米樣品的第個波長指標變量的響應數(shù)據(jù)。由于樣本數(shù)據(jù)矩陣由多個指標組成,樣品對于不同指標的響應數(shù)據(jù)可能存在量綱和數(shù)量級不同的問題,為了消除兩者的影響,需要先進行數(shù)據(jù)變換處理。本文采用標準化變換對數(shù)據(jù)進行處理,其處理方法如下。首先對每個變量進行中心化變換,然后用該變量的標準差進行標準化,即有:, (2)其中,。4.1.2 指標變量相似程度的測量計算研究變量的親疏程度或相似程度的數(shù)量指標通常有兩種:一種是相似系數(shù),性質(zhì)越接近的變量或樣品,其取值越接近于1或-1,而彼此無關的變量或樣品的相似系數(shù)則越接近于0,相似的歸為一類,不相似的歸為不同類。另一種是距離,它將每個樣品看成維空間的一個點,100個樣品組成維空間的100個點。用各點之間的距離來衡量各指標變量之間的相似程度(或靠近程度)。距離近的點歸為一類,距離遠的點屬于不同的類。對于變量之間的聚類(型)常用相似系數(shù)來測度變量之間的親疏程度,而對于樣品之間的聚類分析(型),則常用距離來測度樣品之間的親疏程度。本文對指標變量進行R型聚類分析,采用相關系數(shù)研究變量的相似程度。對于變量和,可以用兩變量與的樣本相關系數(shù)作為它們的相似性度量。, (3)表示第個玉米樣品對第個近紅外光波長的響應數(shù)據(jù),的值是矩陣的一個列向量,表示向量的均值。越接近1,表示與越相關或相似。越接近0,表示與的相似性越弱。4.1.3系統(tǒng)聚類法正如樣品之間的距離可以有不同的定義方法一樣,類與類之間的距離也有各種定義。例如可以定義類與類之間的距離為兩類之間最近樣品的距離,或者定義為兩類之間最遠樣品的距離,也可以定義為兩類重心之間的距離等。類與類之間用不同的方法定義距離,就產(chǎn)生了不同的系統(tǒng)聚類方法。常用的系統(tǒng)聚類方法有,最短距離法、最長聚類法、中間距離法、重心法、類平均法、可變類平均法、可變法和離差平方和法。本問選擇了類平均法聚類,該方法度量類和的距離為:, (4)它等于,中兩樣本點距離的平均,分別為,中的樣本點個數(shù)。其中。系統(tǒng)聚類法是聚類分析方法中使用最多的方法。其基本思想是:相似系數(shù)大的變量先聚為一類,相似系數(shù)小的后聚成類,此過程一直進行下去,每個樣品總能聚到合適的類中。它包括如下步驟:(1)將每個變量獨自聚成一類,構(gòu)造390個類;(2)根據(jù)所確定的變量的相似系數(shù)公式,計算390個變量兩兩間的相似系數(shù),構(gòu)造相似系數(shù)矩陣,記為。(3)把相似系數(shù)最大的兩類歸為一新類,其它變量仍各自聚為一類,共聚成(390-1)類。(4)計算新類與當前各類的相似系數(shù),將相似系數(shù)最大的兩個類進一步聚成一類,共聚成(390-2)類。以上步驟一直進行下去,最后將所有的樣品(或變量)聚成一類。(5)畫聚類譜系圖。(6)決定類的個數(shù)及各類包含的變量,并對得到的分類做出解釋。4.1.4聚類分析模型的求解根據(jù)上述模型,利用MATLAB軟件編程對波長變量進行聚類分析。首先,對附件1中玉米樣品對于不同波長的光譜響應數(shù)據(jù)進行標準化處理,然后求出各波長變量的相似系數(shù)矩陣,由于矩陣維數(shù)過于龐大,本文就不在正文中給出。通過觀察各變量的相似系數(shù)矩陣發(fā)現(xiàn),某些矩陣元素非常接近1,說明某些指標變量之間確實存在很強的相關性,因此本文從這些指標變量中選取幾個有代表性的變量進行聚類分析。對指標變量進行R型聚類分析,變量間相似性度量采用相關系數(shù),類間相似性度量的計算采用類平均法。依據(jù)系統(tǒng)聚類法的方法,對390個波長變量進行聚類,其部分變量聚類圖如圖1所示。圖1 部分變量聚類圖通過對聚類圖的分析,以及為了方便下文的多元回歸,本文將波長變量分為5類。其結(jié)果如表1所示。表1 聚類結(jié)果類別變量第一類1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184第二類185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362第三類363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379第四類380 381 382 383第五類384 385 386 387 388 389 390上表中的元素表示的是變量在附件1表中的行標。為了在每一類中選出具有代表性的變量,本文采用的是選取每一類中和其余變量相似系數(shù)之和的均值最大的那個變量。這樣可使被選取的變量與所在類的其余變量之間的相似性最大,從而可以最大程度的代表該類中的其余變量。每一類中相似系數(shù)最大變量結(jié)果如表2所示。表2 聚類代表變量行標88306370382386變量波長()86605290430041204060相似系數(shù)均值0.99560.99280.99000.98370.9861通過上表發(fā)現(xiàn),本文選出的代表變量與所在類的其余變量之間的相似系數(shù)較高,可以較好的代表其余變量,本文所選出的變量是合理的。4.2多元線性回歸模型4.2.1模型的建立上文采用聚類分析的方法,對波長進行了聚類,將整個波段分為5類,然后選取出了每類中最具代表性,能較多的反映光譜響應數(shù)據(jù)與蛋白質(zhì)含量之間關系的一個波長。本文要建立的是玉米樣品的蛋白質(zhì)含量和選取的5個波長的響應數(shù)據(jù)的回歸模型,這屬于多元線性回歸模型2,3?,F(xiàn)有5個變量,對它們分別進行了100次觀測,即由100個玉米樣品,玉米樣品的蛋白質(zhì)含量為。多元線性回歸分析的模型為: (5)式中,都是與無關的未知參數(shù),其中稱為回歸系數(shù)?,F(xiàn)得到100個獨立觀測數(shù)據(jù),由上式得: (6)記, (7),則式(4.4)可表示為: (8)式中,為100階單位矩陣。4.2.2參數(shù)估計模型(4.4)中的參數(shù)采用最小二乘法估計,即應選取估計值,使當,時,誤差平方和, (9)達到最小。為此,令, (10)得到:, (11)經(jīng)整理化為以下正規(guī)方程組: (12)正規(guī)方程的矩陣形式為: (13)當列滿秩時,為可逆矩陣,上式的解為: (14)將帶回原模型得到的估計值: (15)這組數(shù)據(jù)的擬合值為,擬合誤差稱為殘差,可作為隨機誤差的估計,而 (16)為殘差平方和(或剩余平方和)。4.2.3回歸模型的假設檢驗因變量與自變量之間是否存在如模型(20)所示的線性關系是需要檢驗的,顯然,如果所有的()都很小,與的線性關系就不明顯,所以可令原假設為:, (17)當成立時,滿足: (18)式中,,稱為回歸平方和,反映自變量對的影響。在顯著性水平下,若 (19)則接受,否則拒絕。且越大,說明回歸方程越顯著。還有一些衡量與的相關程度的指標,如用回歸平方和中的比重定義的復判定系數(shù): (20)式中,,稱為總平方和,稱為復相關系數(shù),越大,與的相關程度越高,通常認為相關關系成立。且越接近1,說明回歸模型越顯著。當被拒絕時,不全為0,但是不排除其中若干個等于0。所以應進一步作如下6個檢驗: (21)當成立時,有, (22)其中:是中的第個元素,對給定的,若,則接受,否則拒絕。4.2.5回歸模型的求解已知玉米樣品的蛋白質(zhì)含量和選取的5個波長的響應數(shù)據(jù)分別為:,根據(jù)式(14)求解正規(guī)方程組的的估計值: (23)利用MATLAB編程求得樣品的估計值,本文畫出了估計值在置信度=0.05時的殘差圖,如圖2所示。圖2 估計值的殘差圖 上圖中,中間的橫線表示100個樣品的實測值,綠色的線表示估計值的置信區(qū)間,綠色直線中間的點代表估計值。通過上圖發(fā)現(xiàn),有7個樣品的值存在異常,其樣品編號分別為:32、43、71、73、79、88、89。本文將上述7個樣品點去除后再進行回歸分析。本文求解得到的回歸方程系數(shù)為: (24)因變量與自變量之間是否存在線性關系是需要檢驗的,顯然,如果所有的()都很小,則因變量與自變量之間的線性關系就不明顯。本文取顯著性水平=0.05。利用MATLAB程序求得統(tǒng)計量,查表得上分位數(shù),因為,所以拒絕,模型整體上通過了檢驗,即不全為0。且較大,說明回歸方程越顯著。復相關系數(shù)=0.9640,非常接近于1,說明因變量與自變量之間相關關系密切。當被拒絕時,不全為0,但是不排除其中若干個等于0。所以應進一步作檢驗。利用MATLAB編程求得統(tǒng)計量:, (25)查表得上分位數(shù)。對于檢驗,在顯著性水平=0.05時,拒絕,即與存在明顯線性關系。綜上所述,本文建立的蛋白質(zhì)光譜分析模型為: (26)式中,分別表示由聚類分析得出的5個波長變量。4.3光譜分析模型的評價指標及適用范圍4.3.1光譜分析模型的評價指標本文建立了光譜響應數(shù)據(jù)和蛋白質(zhì)含量的回歸模型,為了對模型的精度進行評價,本文擬定模型的評價指標,并對模型進行評價。為了體現(xiàn)回歸估計值和實測的蛋白質(zhì)含量的差別,本文采用誤差平方和為評價指標,對模型精度進行評價。 (27)利用上文所建立的回歸方程,求出估計值和實測值的誤差平方和為31.9594,則每個樣品的估計誤差平均值為0.32。由附表2知,每個樣品的蛋白質(zhì)含量約為10(),每個樣品的估計誤差約占實測值的。為了更直觀的比較估計值和實測值的差別,本文給出了估計值和實測值的對比圖,如圖3所示。圖3 前100個樣品的估計值和實測值的對比圖上圖中,紅色的點表示實測蛋白質(zhì)含量,空心點表示由回歸方程估計的蛋白質(zhì)含量值。通過觀察上圖和對誤差平方和的分析,可以發(fā)現(xiàn)本文所建立的多元線性回歸模型可以較好的擬合出樣品的光譜相應數(shù)據(jù)和蛋白質(zhì)含量之間的關系,比較合理。4.3.2模型的適用范圍多元線性回歸模型的適用范圍:一種現(xiàn)象常常是與多個因素相聯(lián)系的,它可以運用兩個或兩個以上的解釋變量來來解釋某個因變量的形成原因,由多個自變量的最優(yōu)組合得出因變量與自變量的多元線性關系,共同來預測或估計因變量,比只用一個自變量進行預測或估計更有效,更符合實際。該方法已經(jīng)被廣大經(jīng)濟學家及機構(gòu)認可,其主要研究三個方面,即分析市場供求、分析經(jīng)濟現(xiàn)象及制定相關政策、分析投入產(chǎn)出。本文建立的的是樣品的蛋白質(zhì)含量和光譜響應數(shù)據(jù)的多元線性回歸模型,因變量蛋白質(zhì)含量和自變量光譜響應數(shù)據(jù)是一對多的關系,本模型只能應用于單一成分的回歸分析。且由于線性回歸模型的限制,要求自變量個數(shù)應小于樣品的個數(shù),否則無法確定回歸方程的參數(shù)。5 基于回歸模型的蛋白質(zhì)預測5.1多元線性回歸模型在第一問中,本文建立了關于蛋白質(zhì)含量和光譜響應數(shù)據(jù)的多元線性回歸模型,其結(jié)果如下: (28)5.2對玉米樣品的蛋白質(zhì)含量預測將其余26個玉米樣品(編號101126)的光譜響應數(shù)據(jù)帶入上述光譜分析模型,可以求得其余樣品的蛋白質(zhì)含量,其結(jié)果如表3所示。表3 其余26個玉米樣品的蛋白質(zhì)含量預測值玉米編號蛋白質(zhì)含量玉米編號蛋白質(zhì)含量玉米編號蛋白質(zhì)含量10110.84451109.987911911.096210210.518511110.32441206.785810310.868911210.20731219.372210410.793511310.834812211.448010510.161911410.91041239.13561069.96341159.88281248.788410710.452011610.791112510.313910810.640911710.824112610.796310910.98701188.7416為了更直觀的觀察剩余樣品的蛋白質(zhì)含量值,本文給出了蛋白質(zhì)含量分布圖,結(jié)果如圖4所示。圖4 蛋白質(zhì)含量分布圖上圖中,紅色的點表示實測蛋白質(zhì)含量,空心點表示由回歸方程估計的蛋白質(zhì)含量值。6 問題三的解答6.1 BP神經(jīng)網(wǎng)絡模型的建立6.1.1 BP神經(jīng)網(wǎng)絡原理BP神經(jīng)網(wǎng)絡是一種具有三種或三種以上的多層神經(jīng)網(wǎng)絡,每一層都由若干個神經(jīng)元組成,其結(jié)構(gòu)圖如圖6.1所示。它的左右各層之間各個神經(jīng)元實現(xiàn)全連接,即左層的每一個神經(jīng)元與右層的每個神經(jīng)元都有連接。BP神經(jīng)網(wǎng)絡按有導師學習方式進行訓練,當一對學習模式提供給網(wǎng)絡后,其神經(jīng)元的激活值將從輸入層經(jīng)各隱含層向輸出層傳播,在輸出層的各神經(jīng)元輸出對應于輸入模式的網(wǎng)絡響應。然后,按減少希望輸出與實際輸出誤差的原則,從輸出層經(jīng)各隱含層,最后回到輸入層逐層修改各連接權(quán)。由于這種修正過程是從輸出到輸入逐層進行的,所以稱它為誤差逆?zhèn)鞑シ?。隨著這種誤差逆?zhèn)鞑ビ柧毜牟粩嘈拚?,網(wǎng)絡對輸入模式響應的正確率也將不斷提高4。輸出變量輸入變量輸入層隱含層輸出層圖6.1 神經(jīng)網(wǎng)絡結(jié)構(gòu)圖圖6.1中表示輸入層第個節(jié)點的輸入,;表示隱含層第個節(jié)點到輸入層第個節(jié)點之間的權(quán)值;表示隱含層第個節(jié)點的閾值;表示隱含層的激勵函數(shù);表示輸出層第個節(jié)點到隱含層第個節(jié)點之間的權(quán)值,;表示輸出層第個節(jié)點的閾值,;表示輸出層的激勵函數(shù);表示輸出層第個節(jié)點的輸出。BP神經(jīng)網(wǎng)絡算法是一種監(jiān)督式的學習算法,其主要思想是:對于個輸入學習樣本,已知與其對應的輸出樣本。學習的目的是用網(wǎng)絡的實際輸出與目標矢量之間的誤差來修改其權(quán)值,使實際與期望盡可能地相近,即使網(wǎng)絡輸出層的誤差平方和達到最小,是通過連續(xù)不斷地在相對于誤差函數(shù)斜率下降的方向上計算網(wǎng)絡權(quán)值和偏差的變化而逐漸逼近的目標。每一次權(quán)值和偏差的變化都與網(wǎng)絡誤差的影響成正比。并以反向傳播的方式傳遞到每一層。(1)信號的前向傳播過程隱含層第個節(jié)點的輸入: (6.1)隱含層第個節(jié)點的輸出: (6.2)輸出層第個節(jié)點的輸入: (6.3)輸出層第個節(jié)點的輸出: (6.4)(2)誤差的反向傳播過程誤差的反向傳播,即首先由輸出層開始逐層計算各層神經(jīng)元的輸出誤差,然后根據(jù)誤差梯度下降法來調(diào)節(jié)各層的權(quán)值和閾值,使修改后的網(wǎng)絡的最終輸出能接近期望值。 對于每一個樣本的二次型誤差準則函數(shù)為: (6.5)系統(tǒng)對個訓練樣本的總誤差準則函數(shù)為: (6.6)根據(jù)誤差梯度下降法依次修正輸出層權(quán)值的修正量,輸出層閾值的修正量,隱含層權(quán)值的修正量,隱含層閾值的修正量。; (6.7)輸出層權(quán)值調(diào)整公式: (6.8)輸出層閾值調(diào)整公式: (6.9)隱含層權(quán)值調(diào)整公式: (6.10)隱含層閾值調(diào)整公式: (6.11)最后得到以下公式: (6.12) (6.13) (6.14) (6.15)6.1.2 BP神經(jīng)網(wǎng)絡算法具體步驟該算法由兩部分組成,信息的正向傳遞與誤差的反向傳播。在正向傳遞過程中輸入信息從輸入層經(jīng)隱含層逐層計算傳向輸出層,每一層神經(jīng)元的輸出作用于下一層神經(jīng)元的輸入,如果輸出層沒有達到期望的輸出,則計算輸出層的誤差的變化值后轉(zhuǎn)向反向傳播,通過網(wǎng)絡誤差信號沿原來的連接通路反轉(zhuǎn)回來修改各層的權(quán)值直至達到期望目標。BP神經(jīng)網(wǎng)絡的學習算法步驟如下:(1)初始化網(wǎng)絡及學習參數(shù),如設置網(wǎng)絡初始權(quán)矩陣、學習因子等。(2)提供訓練模式,訓練網(wǎng)絡,直到滿足學習要求。(3)前向傳播過程:對給定的訓練模式輸入,計算網(wǎng)絡的輸出模式,并與期望模式比較,若有誤差,則執(zhí)行步驟(4),否則返回步驟(2)。(4)反向傳播過程:計算同一單元層的誤差,修正權(quán)值和閾值,然后返回步驟(2)。該算法具體過程流程圖如下:圖6.2 BP神經(jīng)網(wǎng)絡算法流程圖網(wǎng)絡的學習是通過用給定的訓練集訓練而實現(xiàn)的。通常用網(wǎng)絡的均方差誤差來定量的反應學習的性能。一般的,當網(wǎng)絡的均方差誤差低于給定值時,則表明對給定的訓練集學習滿足要求了。6.2 BP神經(jīng)網(wǎng)絡模型的求解首先本文以前80個樣本數(shù)據(jù)的光譜相應數(shù)據(jù)為輸入,以樣品的蛋白質(zhì)、纖維素、脂肪三種營養(yǎng)成分含量為輸出,初始化網(wǎng)絡并設定學習參數(shù)。在前100個樣本中把前80個樣本作為學習集中的對象,當網(wǎng)絡的均方差誤差低于給定值時,學習結(jié)束。將剩余的20個樣本作為檢測所用的樣本數(shù)據(jù)。本文給出了前100個樣品中剩余20個樣品的估算值和誤差值,如圖6.3和圖6.4所示。圖6.3 第80-100個樣品的檢驗圖圖6.4 第80-100個樣品的估計誤差圖然后利用上述BP神經(jīng)網(wǎng)絡模型,以其余26個樣品的光譜響應數(shù)據(jù)為輸入,預測出其余26個玉米樣品中蛋白質(zhì)、纖維素、脂肪三種營養(yǎng)成分含量。其結(jié)果分別如表6.1-6.3所示。表6.1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 藝術(shù)品租賃合同
- 會議場地租賃合同協(xié)議書
- 保密協(xié)議商業(yè)合同
- 無錫工藝職業(yè)技術(shù)學院《工程安全健康與環(huán)境管理》2023-2024學年第二學期期末試卷
- 寧夏民族職業(yè)技術(shù)學院《賓館酒店管理》2023-2024學年第二學期期末試卷
- 菏澤家政職業(yè)學院《輕工行業(yè)清潔生產(chǎn)及污染控制技術(shù)》2023-2024學年第二學期期末試卷
- Unit 5 Revealing Nature Developing ideas The Secret Language of Plants教學設計 2024-2025學年高中英語人教版選擇性必修第二冊
- 沈陽醫(yī)學院《機器人工程專業(yè)導論》2023-2024學年第二學期期末試卷
- 寧夏財經(jīng)職業(yè)技術(shù)學院《主題閱讀(1)》2023-2024學年第二學期期末試卷
- 山東勝利職業(yè)學院《化工原理一》2023-2024學年第二學期期末試卷
- 期末測試卷(一)(試題)2023-2024學年二年級上冊數(shù)學蘇教版
- 攜程在線能力測評真題
- 人教版(2024)六年級全一冊 第17課 設計我的種植園
- 承包商入廠安全培訓試題附參考答案【完整版】
- 四川省公務員考試行測真題
- 2024年廣東省初中學業(yè)水平考試中考英語試卷(真題+答案解析)
- DL-T-255-2012燃煤電廠能耗狀況評價技術(shù)規(guī)范
- 家庭教育家長會教案及反思(3篇模板)
- 職業(yè)培訓師三級操作技能鑒定卷庫及答案
- 【視頻號運營】視頻號運營108招
- 新能源客車安全應急處理指南
評論
0/150
提交評論