下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 數(shù)據(jù)挖掘的一種新穎算法 文章對神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法進(jìn)行了詳細(xì)的研究, 包括數(shù) 據(jù)挖掘的工作流程、 神經(jīng)網(wǎng)絡(luò)的基本概念和結(jié)構(gòu)、 實現(xiàn)的關(guān)鍵技 術(shù)以及神經(jīng)網(wǎng)絡(luò)的應(yīng)用,驗證了算法的有效性和高效率性。 數(shù)據(jù)挖掘技術(shù)是一個年輕且充滿希望的研究領(lǐng)域, 商業(yè)利益 的強(qiáng)大驅(qū)動力將會不停地促進(jìn)它的發(fā)展 每年都有新的數(shù)據(jù)挖掘 方法和模型問世,人們對它的研究正日益廣泛和深入。 神經(jīng)網(wǎng)絡(luò)技術(shù)近來在各領(lǐng)域得到廣泛應(yīng)用 , 它通過對訓(xùn)練集 的反復(fù)學(xué)習(xí)獲取知識 , 具有直觀性、并行性和抗噪性。數(shù)據(jù)挖掘 就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的知識, 這些知識是 隱含的,提取知識表示為概念、規(guī)則、規(guī)律、模式等形式。在數(shù)
2、據(jù)挖掘過程中, 人們并不知道要發(fā)現(xiàn)的知識, 而由計算機(jī)對原始 材料進(jìn)行分析, 將那些人們不曾擁有的知識發(fā)掘出來, 這是一個 知識發(fā)現(xiàn)的過程。即將 KDD中進(jìn)行知識學(xué)習(xí)的階段成為數(shù)據(jù)挖 掘。 1. 神經(jīng)網(wǎng)絡(luò)的概念和結(jié)構(gòu) 人工神經(jīng)網(wǎng)絡(luò)由大量的處理單元 (人工神經(jīng)單元、 處理元件、 電子元件、光電元件 ) 經(jīng)廣泛互連而成的人工網(wǎng)絡(luò),用來模擬神 經(jīng)系統(tǒng)的結(jié)構(gòu)功能。 在構(gòu)造人工神經(jīng)網(wǎng)絡(luò)時, 首先應(yīng)該考慮的問 題是如何構(gòu)造神經(jīng)元。 在對生物神經(jīng)元的結(jié)構(gòu)、 特性進(jìn)行深入研 究的基礎(chǔ)上,心理學(xué)家麥克洛奇和數(shù)理邏輯學(xué)家皮滋于 1943 年 首先提出了一個簡化的神經(jīng)元模型, 稱為M-P模型,如圖2所示: 在圖 1
3、 中,圓表示神經(jīng)元的細(xì)胞體; 表示外部輸入,對應(yīng) 于生物神經(jīng)元的樹突, 為興奮性突觸連接, 為抑制性突觸連接; 表示神經(jīng)元興奮的閥值; 表示輸出,它對應(yīng)于生物神經(jīng)元的軸 突。M-P模型確實在結(jié)構(gòu)及其功能上反映了生物神經(jīng)元的特征。 但是,M-P模型對抑制性輸入賦予了 否決權(quán),只有當(dāng)不存在抑 制性輸入,且興奮性輸入的總和超過閥值時,神經(jīng)元才會興奮。 在M-P模型的基礎(chǔ)上,根據(jù)需要又發(fā)展了其他一些模型,目前常 用的模型如圖 3 所示。在圖 2 中 為該神經(jīng)元的輸入, 為該神經(jīng) 元分別與各輸入之間的連接強(qiáng)度,稱為連接權(quán)重; 為該神經(jīng)元 的閥值; 為外部輸入的控制信號,它可以用來調(diào)整神經(jīng)元的連 接權(quán)值,
4、使神經(jīng)元保持在某一狀態(tài); 為神經(jīng)元的輸出。由此結(jié) 構(gòu)可以看出, 神經(jīng)元一般是一個具有多個輸入但只有一個輸出的 非線性器件。 2. 神經(jīng)網(wǎng)絡(luò)的模型 網(wǎng)絡(luò)模型是人工神經(jīng)網(wǎng)絡(luò)研究的一個重要方面, 目前已經(jīng)成 為開發(fā)出了多種不同的模型。BP模型是一種用于前向多層神經(jīng) 網(wǎng)絡(luò)的反傳學(xué)習(xí)算法。 2.1 BP 網(wǎng)絡(luò)結(jié)構(gòu) BP算法用于多層網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)中不僅有輸入結(jié)點、輸出 結(jié)點,而且有一層或多層隱節(jié)點,如圖 3: 2.2 BP 網(wǎng)絡(luò)結(jié)構(gòu)算法 BP算法的學(xué)習(xí)過程是由正向傳播與反向傳播組成的。正向 傳播用于網(wǎng)絡(luò)計算, 對某一輸入求出它的輸出; 反向傳播用于逐 層傳遞誤差,修改連接權(quán)值,使網(wǎng)絡(luò)能進(jìn)行正確計算。一旦網(wǎng)
5、絡(luò) 經(jīng)過訓(xùn)練用于求解現(xiàn)實問題, 則就只需正向傳播, 不需要再進(jìn)行 反向傳播。具體算法: 從訓(xùn)練樣例集中取一樣例,把輸入信息輸入到網(wǎng)絡(luò)中。 由網(wǎng)絡(luò)分別計算各層節(jié)點的輸出。 計算網(wǎng)絡(luò)的實際輸出與期望輸出的誤差。 從輸出層反向計算到第一個隱層,按一定原則向減小誤 差方向調(diào)整網(wǎng)絡(luò)的各個連接權(quán)值。 對訓(xùn)練樣例集中的每一個樣例重復(fù)以上步驟,直到對整 個訓(xùn)練樣例集誤差達(dá)到要求時為止。 3. 神經(jīng)網(wǎng)絡(luò)的應(yīng)用 圖 4 是一個預(yù)測貸款拖欠情況的神經(jīng)元網(wǎng)絡(luò)圖。 圓圈表示節(jié) 點,圓圈之間的連線表示連接。 神經(jīng)元網(wǎng)絡(luò)從左邊的節(jié)點獲得預(yù) 測屬性值,對于這些值進(jìn)行計算后,在最右邊的節(jié)點產(chǎn)生新值, 最右節(jié)點的值表示神經(jīng)元網(wǎng)絡(luò)
6、模型做出的預(yù)測。 在這里, 神經(jīng)網(wǎng) 絡(luò)把年齡和收入作為輸入的預(yù)測屬性, 預(yù)測一個人是否會拖欠銀 行貸款。進(jìn)行預(yù)測中,神經(jīng)元網(wǎng)絡(luò)從輸入節(jié)點獲得預(yù)測屬性的值, 這些值稱為節(jié)點的值。 節(jié)點與連接中存儲的值相乘, 得到的值在 最右節(jié)點相加, 再進(jìn)行指定的閾值運算, 得到的數(shù)值就是預(yù)測值。 如果得的值是零, 則認(rèn)為這條記錄的信用風(fēng)險較低 (無拖欠情況 發(fā)生);如果得到的值為 1,就認(rèn)為這條記錄的信用風(fēng)險較高 (很 可能拖欠貸款)。 對圖 4 的計算進(jìn)行標(biāo)準(zhǔn)化,得到如圖 5 的結(jié)果。年齡 47被 標(biāo)準(zhǔn)化到 0.0 和 1.0 之間,變成 0.47 ,而收入值被標(biāo)準(zhǔn)化為 0.65 , 這時,神經(jīng)網(wǎng)絡(luò)做出的預(yù)測是,收入為 6500 元,年齡為 47 歲的 顧客是否會拖欠貸款,連接權(quán)值分別為 0.7 和 0.1 ,節(jié)點值與連 接權(quán)值相乘后得到的結(jié)果為 0.39 。經(jīng)過訓(xùn)練后的網(wǎng)絡(luò)用輸出 1.0 表示拖欠,輸出 0.0 表示不拖欠。這里得到的輸出值 0.39 更接 近于 0.0 ,因此對這條記錄做出的預(yù)測是不拖欠的。 4. 結(jié)束語 數(shù)據(jù)挖掘只是一個工具 , 不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 16課 一張奇特的臉 教學(xué)設(shè)計 人美版(2012)美術(shù)三年級上冊
- 一微小世界(8份打包) 訓(xùn)練提升教學(xué)設(shè)計 -2023-2024學(xué)年教科版科學(xué)六年級上冊
- Unit1 Topic3 同步聽力測試 教學(xué)設(shè)計2024-2025學(xué)年九年級仁愛版英語上冊
- 小學(xué)數(shù)學(xué)六年級上冊期末卷(真題匯編)
- 13 精衛(wèi)填海 教學(xué)設(shè)計-2023-2024學(xué)年語文四年級上冊統(tǒng)編版
- 初中數(shù)學(xué)人教版九年級上冊 21.3 實際問題與一元二次方程(3)面積問題教學(xué)設(shè)計
- 信息技術(shù)多媒體技術(shù)應(yīng)用教案:2.1 多媒體作品中的圖形、圖像信息技術(shù)(信息科技)
- 2024年度河北省安全員之C證(專職安全員)全真模擬考試試卷B卷含答案
- 2024年度貴州省安全員之C證(專職安全員)綜合練習(xí)試卷B卷附答案
- 河北省滄州市普通高中2025屆高三上學(xué)期10月復(fù)習(xí)質(zhì)量監(jiān)測數(shù)學(xué)試卷(無答案)
- JJF 1874-2020(自動)核酸提取儀校準(zhǔn)規(guī)范-(2020發(fā)布)
- 1、建筑消防設(shè)施巡查記錄表
- 模塊6 化工生產(chǎn)技術(shù)技能大賽專項訓(xùn)練-1- 精餾操作專項訓(xùn)練.電子教案教學(xué)課件
- 內(nèi)保工作制度
- 三年級試卷命題說明
- BI-RADS分類更新解讀(乳腺鉬靶)PPT幻燈片課件
- 冠梁、腰梁施工工藝
- 省一級檔案綜合管理單位復(fù)評報告 (2)
- 最新整理隧道防排水施工安全技術(shù)交底
- 粵教滬科版初中物理《電動機(jī)與發(fā)電機(jī)》教學(xué)設(shè)計
- PSA制氫裝置開車試運行方案
評論
0/150
提交評論