數(shù)據(jù)挖掘的一種新穎算法_第1頁
數(shù)據(jù)挖掘的一種新穎算法_第2頁
數(shù)據(jù)挖掘的一種新穎算法_第3頁
數(shù)據(jù)挖掘的一種新穎算法_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 數(shù)據(jù)挖掘的一種新穎算法 文章對神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法進(jìn)行了詳細(xì)的研究, 包括數(shù) 據(jù)挖掘的工作流程、 神經(jīng)網(wǎng)絡(luò)的基本概念和結(jié)構(gòu)、 實現(xiàn)的關(guān)鍵技 術(shù)以及神經(jīng)網(wǎng)絡(luò)的應(yīng)用,驗證了算法的有效性和高效率性。 數(shù)據(jù)挖掘技術(shù)是一個年輕且充滿希望的研究領(lǐng)域, 商業(yè)利益 的強(qiáng)大驅(qū)動力將會不停地促進(jìn)它的發(fā)展 每年都有新的數(shù)據(jù)挖掘 方法和模型問世,人們對它的研究正日益廣泛和深入。 神經(jīng)網(wǎng)絡(luò)技術(shù)近來在各領(lǐng)域得到廣泛應(yīng)用 , 它通過對訓(xùn)練集 的反復(fù)學(xué)習(xí)獲取知識 , 具有直觀性、并行性和抗噪性。數(shù)據(jù)挖掘 就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的知識, 這些知識是 隱含的,提取知識表示為概念、規(guī)則、規(guī)律、模式等形式。在數(shù)

2、據(jù)挖掘過程中, 人們并不知道要發(fā)現(xiàn)的知識, 而由計算機(jī)對原始 材料進(jìn)行分析, 將那些人們不曾擁有的知識發(fā)掘出來, 這是一個 知識發(fā)現(xiàn)的過程。即將 KDD中進(jìn)行知識學(xué)習(xí)的階段成為數(shù)據(jù)挖 掘。 1. 神經(jīng)網(wǎng)絡(luò)的概念和結(jié)構(gòu) 人工神經(jīng)網(wǎng)絡(luò)由大量的處理單元 (人工神經(jīng)單元、 處理元件、 電子元件、光電元件 ) 經(jīng)廣泛互連而成的人工網(wǎng)絡(luò),用來模擬神 經(jīng)系統(tǒng)的結(jié)構(gòu)功能。 在構(gòu)造人工神經(jīng)網(wǎng)絡(luò)時, 首先應(yīng)該考慮的問 題是如何構(gòu)造神經(jīng)元。 在對生物神經(jīng)元的結(jié)構(gòu)、 特性進(jìn)行深入研 究的基礎(chǔ)上,心理學(xué)家麥克洛奇和數(shù)理邏輯學(xué)家皮滋于 1943 年 首先提出了一個簡化的神經(jīng)元模型, 稱為M-P模型,如圖2所示: 在圖 1

3、 中,圓表示神經(jīng)元的細(xì)胞體; 表示外部輸入,對應(yīng) 于生物神經(jīng)元的樹突, 為興奮性突觸連接, 為抑制性突觸連接; 表示神經(jīng)元興奮的閥值; 表示輸出,它對應(yīng)于生物神經(jīng)元的軸 突。M-P模型確實在結(jié)構(gòu)及其功能上反映了生物神經(jīng)元的特征。 但是,M-P模型對抑制性輸入賦予了 否決權(quán),只有當(dāng)不存在抑 制性輸入,且興奮性輸入的總和超過閥值時,神經(jīng)元才會興奮。 在M-P模型的基礎(chǔ)上,根據(jù)需要又發(fā)展了其他一些模型,目前常 用的模型如圖 3 所示。在圖 2 中 為該神經(jīng)元的輸入, 為該神經(jīng) 元分別與各輸入之間的連接強(qiáng)度,稱為連接權(quán)重; 為該神經(jīng)元 的閥值; 為外部輸入的控制信號,它可以用來調(diào)整神經(jīng)元的連 接權(quán)值,

4、使神經(jīng)元保持在某一狀態(tài); 為神經(jīng)元的輸出。由此結(jié) 構(gòu)可以看出, 神經(jīng)元一般是一個具有多個輸入但只有一個輸出的 非線性器件。 2. 神經(jīng)網(wǎng)絡(luò)的模型 網(wǎng)絡(luò)模型是人工神經(jīng)網(wǎng)絡(luò)研究的一個重要方面, 目前已經(jīng)成 為開發(fā)出了多種不同的模型。BP模型是一種用于前向多層神經(jīng) 網(wǎng)絡(luò)的反傳學(xué)習(xí)算法。 2.1 BP 網(wǎng)絡(luò)結(jié)構(gòu) BP算法用于多層網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)中不僅有輸入結(jié)點、輸出 結(jié)點,而且有一層或多層隱節(jié)點,如圖 3: 2.2 BP 網(wǎng)絡(luò)結(jié)構(gòu)算法 BP算法的學(xué)習(xí)過程是由正向傳播與反向傳播組成的。正向 傳播用于網(wǎng)絡(luò)計算, 對某一輸入求出它的輸出; 反向傳播用于逐 層傳遞誤差,修改連接權(quán)值,使網(wǎng)絡(luò)能進(jìn)行正確計算。一旦網(wǎng)

5、絡(luò) 經(jīng)過訓(xùn)練用于求解現(xiàn)實問題, 則就只需正向傳播, 不需要再進(jìn)行 反向傳播。具體算法: 從訓(xùn)練樣例集中取一樣例,把輸入信息輸入到網(wǎng)絡(luò)中。 由網(wǎng)絡(luò)分別計算各層節(jié)點的輸出。 計算網(wǎng)絡(luò)的實際輸出與期望輸出的誤差。 從輸出層反向計算到第一個隱層,按一定原則向減小誤 差方向調(diào)整網(wǎng)絡(luò)的各個連接權(quán)值。 對訓(xùn)練樣例集中的每一個樣例重復(fù)以上步驟,直到對整 個訓(xùn)練樣例集誤差達(dá)到要求時為止。 3. 神經(jīng)網(wǎng)絡(luò)的應(yīng)用 圖 4 是一個預(yù)測貸款拖欠情況的神經(jīng)元網(wǎng)絡(luò)圖。 圓圈表示節(jié) 點,圓圈之間的連線表示連接。 神經(jīng)元網(wǎng)絡(luò)從左邊的節(jié)點獲得預(yù) 測屬性值,對于這些值進(jìn)行計算后,在最右邊的節(jié)點產(chǎn)生新值, 最右節(jié)點的值表示神經(jīng)元網(wǎng)絡(luò)

6、模型做出的預(yù)測。 在這里, 神經(jīng)網(wǎng) 絡(luò)把年齡和收入作為輸入的預(yù)測屬性, 預(yù)測一個人是否會拖欠銀 行貸款。進(jìn)行預(yù)測中,神經(jīng)元網(wǎng)絡(luò)從輸入節(jié)點獲得預(yù)測屬性的值, 這些值稱為節(jié)點的值。 節(jié)點與連接中存儲的值相乘, 得到的值在 最右節(jié)點相加, 再進(jìn)行指定的閾值運算, 得到的數(shù)值就是預(yù)測值。 如果得的值是零, 則認(rèn)為這條記錄的信用風(fēng)險較低 (無拖欠情況 發(fā)生);如果得到的值為 1,就認(rèn)為這條記錄的信用風(fēng)險較高 (很 可能拖欠貸款)。 對圖 4 的計算進(jìn)行標(biāo)準(zhǔn)化,得到如圖 5 的結(jié)果。年齡 47被 標(biāo)準(zhǔn)化到 0.0 和 1.0 之間,變成 0.47 ,而收入值被標(biāo)準(zhǔn)化為 0.65 , 這時,神經(jīng)網(wǎng)絡(luò)做出的預(yù)測是,收入為 6500 元,年齡為 47 歲的 顧客是否會拖欠貸款,連接權(quán)值分別為 0.7 和 0.1 ,節(jié)點值與連 接權(quán)值相乘后得到的結(jié)果為 0.39 。經(jīng)過訓(xùn)練后的網(wǎng)絡(luò)用輸出 1.0 表示拖欠,輸出 0.0 表示不拖欠。這里得到的輸出值 0.39 更接 近于 0.0 ,因此對這條記錄做出的預(yù)測是不拖欠的。 4. 結(jié)束語 數(shù)據(jù)挖掘只是一個工具 , 不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論