數(shù)據(jù)挖掘 神經(jīng)網(wǎng)絡(luò)_第1頁
數(shù)據(jù)挖掘 神經(jīng)網(wǎng)絡(luò)_第2頁
數(shù)據(jù)挖掘 神經(jīng)網(wǎng)絡(luò)_第3頁
數(shù)據(jù)挖掘 神經(jīng)網(wǎng)絡(luò)_第4頁
數(shù)據(jù)挖掘 神經(jīng)網(wǎng)絡(luò)_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第9章神經(jīng)網(wǎng)絡(luò)2/5/20231第9章神經(jīng)網(wǎng)絡(luò)9.1引例9.2人工神經(jīng)網(wǎng)絡(luò)9.2.2神經(jīng)元模型9.3BP算法9.4工具包應(yīng)用2/5/202329.1引例對于由第1式給出的系統(tǒng),可以產(chǎn)生一系列的數(shù)據(jù)假設(shè)第1式我們并不知道,但是我們可以用第2式給出的多元線性回歸找到近似規(guī)律,但這種方式并沒有很好的精度人工神經(jīng)網(wǎng)絡(luò)可以逼近任意非線性規(guī)律2/5/202339.2人工神經(jīng)網(wǎng)絡(luò)9.2.1人工神經(jīng)網(wǎng)絡(luò)概述9.2.2神經(jīng)元模型9.2.3網(wǎng)絡(luò)結(jié)構(gòu)2/5/202349.2.1人工神經(jīng)網(wǎng)絡(luò)概述第一個階段可稱之為啟蒙階段,這是神經(jīng)網(wǎng)絡(luò)理論研究的奠基階段第二階段是低潮期?!禤ercep2trons》一書,指出簡單的線性感知器的功能是有限的,它無法解決線性不可分的兩類樣本的分類問題第三個階段為神經(jīng)網(wǎng)絡(luò)的復(fù)興時期,這是神經(jīng)網(wǎng)絡(luò)理論研究的主要發(fā)展時期2/5/20235大腦可視作為1000多億神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò)圖3神經(jīng)元的解剖圖神經(jīng)元與神經(jīng)網(wǎng)絡(luò)2/5/20236神經(jīng)元的信息傳遞和處理是一種電化學(xué)活動.樹突由于電化學(xué)作用接受外界的刺激;通過胞體內(nèi)的活動體現(xiàn)為軸突電位,當軸突電位達到一定的值則形成神經(jīng)脈沖或動作電位;再通過軸突末梢傳遞給其它的神經(jīng)元.從控制論的觀點來看;這一過程可以看作一個多輸入單輸出非線性系統(tǒng)的動態(tài)過程神經(jīng)網(wǎng)絡(luò)研究的兩個方面從生理上、解剖學(xué)上進行研究從工程技術(shù)上、算法上進行研究2/5/20237神經(jīng)元的數(shù)學(xué)模型

神經(jīng)元的數(shù)學(xué)模型9.2.2神經(jīng)元模型2/5/202382/5/202392/5/202310其中x=(x1,…xm)T

輸入向量,y為輸出,wi是權(quán)系數(shù);輸入與輸出具有如下關(guān)系:θ為閾值,f(X)是激發(fā)函數(shù);它可以是線性函數(shù),也可以是非線性函數(shù).2/5/202311例如,若記

取激發(fā)函數(shù)為符號函數(shù)

S型激發(fā)函數(shù):

2/5/2023129.2.3網(wǎng)絡(luò)結(jié)構(gòu)根據(jù)節(jié)點層數(shù),可分為單層網(wǎng)絡(luò)和多層網(wǎng)絡(luò)根據(jù)有無反饋,可分為前饋網(wǎng)絡(luò)和反饋網(wǎng)絡(luò)...輸入層隱層輸出層x1x2...xmh1hky1yn...2/5/202313單層網(wǎng)絡(luò)2/5/202314人工神經(jīng)網(wǎng)絡(luò)模型(a)簡單的前向神經(jīng)網(wǎng)絡(luò)(b)具有反饋的前向神經(jīng)網(wǎng)絡(luò)(c)具有層內(nèi)互聯(lián)的神經(jīng)網(wǎng)絡(luò)2/5/202315一般而言,ANN與經(jīng)典計算方法相比并非優(yōu)越,只有當常規(guī)方法解決不了或效果不佳時ANN方法才能顯示出其優(yōu)越性。尤其對問題的機理不甚了解或不能用數(shù)學(xué)模型表示的系統(tǒng),如故障診斷、特征提取和預(yù)測等問題,ANN往往是最有利的工具.ANN對處理大量原始數(shù)據(jù)而不能用規(guī)則或公式描述的問題,表現(xiàn)出極大的靈活性和自適應(yīng)性。2/5/2023169.3BP算法9.3.1引例9.3.2反向傳播算法(BP算法)9.3.3算法舉例9.3.4BP算法描述2/5/202317一般而言,ANN與經(jīng)典計算方法相比并非優(yōu)越,只有當常規(guī)方法解決不了或效果不佳時ANN方法才能顯示出其優(yōu)越性。尤其對問題的機理不甚了解或不能用數(shù)學(xué)模型表示的系統(tǒng),如故障診斷、特征提取和預(yù)測等問題,ANN往往是最有利的工具。另一方面,ANN對處理大量原始數(shù)據(jù)而不能用規(guī)則或公式描述的問題,表現(xiàn)出極大的靈活性和自適應(yīng)性。2/5/2023189.3.1引例

1981年生物學(xué)家格若根(W.Grogan)和維什(W.Wirth)發(fā)現(xiàn)了兩類蚊子(或飛蠓midges).他們測量了這兩類蚊子每個個體的翼長和觸角長,數(shù)據(jù)如下:翼長觸角長類別

1.641.38Af1.821.38Af1.901.38Af1.701.40Af1.821.48Af1.821.54Af2.081.56Af翼長觸角長類別1.781.14Apf1.961.18Apf1.861.20Apf1.721.24Af2.001.26Apf2.001.28Apf1.961.30Apf1.741.36Af2/5/202319問:如果抓到三只新的蚊子,它們的觸角長和翼長分別為(l.24,1.80);

(l.28,1.84);(1.40,2.04).問它們應(yīng)分別屬于哪一個種類?

解法一:把翼長作縱坐標,觸角長作橫坐標;那么每個蚊子的翼長和觸角決定了坐標平面的一個點.其中6個蚊子屬于APf類;用黑點“·”表示;9個蚊子屬Af類;用小圓圈“?!北硎荆玫降慕Y(jié)果見下圖1圖1飛蠓的觸角長和翼長2/5/2023202/5/202321思路:作一直線將兩類飛蠓分開

例如;取A=(1.44,2.10)和B=(1.10,1.16),過AB兩點作一條直線:

y=1.47x-0.017其中X表示觸角長;y表示翼長.

分類規(guī)則:設(shè)一個蚊子的數(shù)據(jù)為(x,y)

如果y≥1.47x-0.017,則判斷蚊子屬Apf類;

如果y<1.47x-0.017;則判斷蚊子屬Af類.

2/5/202322分類結(jié)果:(1.24,1.80),(1.28,1.84)屬于Af類;(1.40,2.04)屬于Apf類.分類直線圖

2/5/202323?缺陷:根據(jù)什么原則確定分類直線?

若取A=(1.46,2.10),B=(1.1,1.6)不變,則分類直線變?yōu)閥=1.39x+0.071分類結(jié)果變?yōu)椋?/p>

(1.24,1.80),

(1.40,2.04)屬于Apf類;

(1.28,1.84)屬于Af類

哪一分類直線才是正確的呢?

因此如何來確定這個判別直線是一個值得研究的問題.一般地講,應(yīng)該充分利用已知的數(shù)據(jù)信息來確定判別直線.2/5/202324再如,如下的情形已經(jīng)不能用分類直線的辦法:

新思路:將問題看作一個系統(tǒng),飛蠓的數(shù)據(jù)作為輸入,飛蠓的類型作為輸出,研究輸入與輸出的關(guān)系。2/5/202325基本BP網(wǎng)絡(luò)的拓撲結(jié)構(gòu)b1bia1c1cqcjahbpan………………Wp1WiqWpjW1qW1jWijV11W11WpqWi1Vh1VhiV1iVn1VniV1pVhpVnp輸出層LC隱含層LB輸入層LAWV2/5/2023269.3.2反向傳播算法(B-P算法)

Backpropagationalgorithm1.簡單網(wǎng)絡(luò)的B-P算法

算法的目的:根據(jù)實際的輸入與輸出數(shù)據(jù),計算模型的參數(shù)(權(quán)系數(shù))2/5/202327假設(shè)有P個訓(xùn)練樣本,即有P個輸入輸出對(Ip,Tp),p=1,…,P,其中

輸入向量為

:目標輸出向量為(實際上的):

網(wǎng)絡(luò)輸出向量為

(理論上的)

2/5/202328(p=1,…,P)

(2)

記wij為從輸入向量的第j(j=1,…,m)個分量到輸出向量的第i(i=1,…,n)個分量的權(quán)重。通常理論值與實際值有一誤差,網(wǎng)絡(luò)學(xué)習(xí)則是指不斷地把與比較,并根據(jù)極小原則修改參數(shù)wij,使誤差平方和達最?。河汥elta學(xué)習(xí)規(guī)則:

(4)

(3)

表示遞推一次的修改量,則有稱為學(xué)習(xí)的速率

2/5/202329ipm=-1,wim=(第i個神經(jīng)元的閾值)(5)注:由(1)式,第i個神經(jīng)元的輸出可表示為特別當f是線性函數(shù)時

(6)2/5/2023302/5/202331圖7多層前饋網(wǎng)絡(luò)

2.多層前饋網(wǎng)絡(luò)

(l)輸入層不計在層數(shù)之內(nèi),它有N0個神經(jīng)元.設(shè)網(wǎng)絡(luò)共有L層;輸出層為第L層;第k層有Nk個神經(jīng)元.假設(shè):(2)設(shè)表示第k層第i神經(jīng)元所接收的信息wk(i,j)表示從第k-1層第j個元到第k層第i個元的權(quán)重,表第k層第i個元的輸出2/5/202332(3)設(shè)層與層間的神經(jīng)元都有信息交換(否則,可設(shè)它們之間的權(quán)重為零);但同一層的神經(jīng)元之間無信息傳輸.

(4)設(shè)信息傳輸?shù)姆较蚴菑妮斎雽拥捷敵鰧臃较?;因此稱為前向網(wǎng)絡(luò).沒有反向傳播信息.(5)表示輸入的第j個分量.假設(shè):2/5/202333在上述假定下網(wǎng)絡(luò)的輸入輸出關(guān)系可以表示為:(7)

其中表示第k層第i個元的閾值.2/5/202334定理2

對于具有多個隱層的前饋神經(jīng)網(wǎng)絡(luò);設(shè)激發(fā)函數(shù)為S函數(shù);且指標函數(shù)取

(8)(9)則每個訓(xùn)練循環(huán)中按梯度下降時;其權(quán)重迭代公式為(10)表示第-1層第個元對第層第個元輸入的第次迭代時的權(quán)重

其中

(11)(12)2/5/202335BP算法

Step1

選定學(xué)習(xí)的數(shù)據(jù),p=1,…,P,隨機確定初始權(quán)矩陣W(0)Step2

用(10)式反向修正,直到用完所有學(xué)習(xí)數(shù)據(jù).用學(xué)習(xí)數(shù)據(jù)計算網(wǎng)絡(luò)輸出Step3

2/5/2023369.3.3應(yīng)用之例:蚊子的分類已知的兩類蚊子的數(shù)據(jù)如表1:

翼長觸角長類別1.781.14Apf1.961.18Apf1.861.20Apf1.721.24Af2.001.26Apf2.001.28Apf1.961.30Apf1.741.36Af目標值0.90.90.90.10.90.90.90.1

翼長觸角長類別

1.641.38Af1.821.38Af1.901.38Af1.701.40Af1.821.48Af1.821.54Af2.081.56Af目標t0.10.10.10.10.10.10.1

2/5/202337輸入數(shù)據(jù)有15個,即,p=1,…,15;j=1,2;對應(yīng)15個輸出。建模:(輸入層,中間層,輸出層,每層的元素應(yīng)取多少個?)建立神經(jīng)網(wǎng)絡(luò)2/5/202338規(guī)定目標為:當t(1)=0.9時表示屬于Apf類,t(2)=0.1表示屬于Af類。設(shè)兩個權(quán)重系數(shù)矩陣為:為閾值

其中2/5/202339分析如下:

為第一層的輸出,同時作為第二層的輸入。其中,為閾值,為激勵函數(shù)若令

(作為一固定輸入)(閾值作為固定輸入神經(jīng)元相應(yīng)的權(quán)系數(shù))

2/5/202340則有:取激勵函數(shù)為=則同樣,取

2/5/202341(1)隨機給出兩個權(quán)矩陣的初值;例如用MATLAB軟件時可以用以下語句:

令p=0具體算法如下:=rand(2,3);=rand(1,3);

(2)根據(jù)輸入數(shù)據(jù)利用公式算出網(wǎng)絡(luò)的輸出

=2/5/202342?。?)計算因為所以

(4)取

(或其他正數(shù),可調(diào)整大?。?/p>

2/5/202343(5)計算

j=1,2,3,i=1,2,3,計算

j=1,2,3j=1,2,32/5/202344(6)p=p+1,轉(zhuǎn)(2)

注:僅計算一圈(p=1,2,…,15)是不夠的,直到當各權(quán)重變化很小時停止,本例中,共計算了147圈,迭代了2205次。最后結(jié)果是:2/5/202345即網(wǎng)絡(luò)模型的解為:

=2/5/2023469.3.4BP算法描述輸入:給定訓(xùn)練集Xtrain,其中每一個訓(xùn)練樣本都是由一組輸入和一組輸出構(gòu)成,所有的輸入和輸出都是[0,1]之間的浮點數(shù)據(jù)(如果不是,要首先通過數(shù)據(jù)變換把它們映射到[0,1]區(qū)間);神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):隱含層節(jié)點數(shù)目;神經(jīng)網(wǎng)絡(luò)每個節(jié)點的、參數(shù)化了的特征函數(shù)。輸出:神經(jīng)網(wǎng)絡(luò)每個節(jié)點特征函數(shù)的參數(shù)。(1)按照有序?qū)?shù)計算公式計算總體誤差對于每個參數(shù)的有序?qū)?shù)公式(函數(shù));(2)任意選擇一組數(shù)據(jù)作為初始參數(shù),一般選?。?,0,…,0),把這組初始參數(shù)作為當前參數(shù);(3)根據(jù)當前參數(shù)和總體誤差計算公式計算總體誤差,如果誤差足夠小,就把當前參數(shù)作為輸出,退出;否則,繼續(xù)下面的步驟;(4)根據(jù)參數(shù)調(diào)整公式和當前參數(shù)數(shù)值,計算總體誤差對于各參數(shù)的有序?qū)?shù)數(shù)值;

(5)計算各個參數(shù)的調(diào)整大小,并計算調(diào)整后的參數(shù)大小。把調(diào)整后的參數(shù)作為當前參數(shù),回到第(3)步。

2/5/2023479.4工具包應(yīng)用第1步,新建數(shù)據(jù)庫第2步,新建數(shù)據(jù)表第3步,安裝補丁第4步,建立數(shù)據(jù)連接第5步,選擇挖掘結(jié)構(gòu)第6步,進行預(yù)測2/5/202348神經(jīng)網(wǎng)絡(luò)的應(yīng)用人工神經(jīng)網(wǎng)絡(luò)以其具有自學(xué)習(xí)、自組織、較好的容錯性和優(yōu)良的非線性逼近能力,受到眾多領(lǐng)域?qū)W者的關(guān)注。在實際應(yīng)用中,80%~90%的人工神經(jīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論