數(shù)據(jù)挖掘 主題:第六章作業(yè)_第1頁
數(shù)據(jù)挖掘 主題:第六章作業(yè)_第2頁
數(shù)據(jù)挖掘 主題:第六章作業(yè)_第3頁
數(shù)據(jù)挖掘 主題:第六章作業(yè)_第4頁
數(shù)據(jù)挖掘 主題:第六章作業(yè)_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、本科生實驗報告實驗課程 數(shù)據(jù)挖掘 學院名稱 信息科學與技術學院 專業(yè)名稱 計算機科學與技術 學生姓名 代星 學生學號 201413030317 指導教師 實驗地點 實驗成績 二一六 年 11 月 二一六 年 11 月第1章 實驗內(nèi)容 使用心臟病患者數(shù)據(jù)集(CardiologyNumerical.arff)的前兩百個實例進行反向傳播學習訓練,剩余的103個實例作為檢驗集實例進行模型檢驗。改變網(wǎng)絡結構和參數(shù),使之達到更為理想的檢驗及效果。第2章 實驗目的 對心臟病患者數(shù)據(jù)集中的數(shù)據(jù)用反向傳播學習訓練方法進行分類,查看分類的效果。并通過改變網(wǎng)絡的結構和參數(shù),使分類效果更加理想。第3章 算法思想 BP

2、算法是一種有監(jiān)督式的學習算法,其主要思想是:輸入學習樣本,使用反向傳播算法對網(wǎng)絡的權值和偏差進行反復的調(diào)整訓練,使輸出的向量與期望向量盡可能地接近,當網(wǎng)絡輸出層的誤差平方和小于指定的誤差時訓練完成,保存網(wǎng)絡的權值和偏差。具體步驟如下:(1)初始化,隨機給定各連接權w,v及閥值i,rt。(2)由給定的輸入輸出模式對計算隱層、輸出層各單元輸出。(3)選取下一個輸入模式對返回第2步反復訓練直到網(wǎng)絡設輸出誤差達到要求結束訓練。第4章 實驗過程4.1數(shù)據(jù)準備 從網(wǎng)上下載數(shù)據(jù)集,生成.csv文件,加載到Weka。4.2 建立神經(jīng)網(wǎng)絡結構1、在Weka Explorer中切換到Classify選項卡,單擊C

3、lassify窗口的Choose按鈕,選擇分類器MultilayerPerceptron,即基于BP學習算法的多層前饋神經(jīng)網(wǎng)絡。2、在Choose按鈕右邊的文本框點擊,打開分類器的屬性設置對話框,將GUi設置為true,使得在訓練前,可查看包含神經(jīng)網(wǎng)絡體系結構的GUI界面,并可交互式地修改結構和設置其他參數(shù),且可以在網(wǎng)絡訓練過程中暫停,進行結構和參數(shù)的反復修改。在屬性設置對話框中,設置hiddenLayers為“5,3”,表示有兩個隱層,分別有5個和3個隱層節(jié)點;設置learning-Rate為0.5,trainingTime為5000.3、單擊OK按鈕,回到Weka Explorer的Cla

4、ssifier窗口,在測試集的選擇上題目要求前兩百個數(shù)據(jù)作為實例,最后103個作為檢驗集,設置Test Options為Percentage split(取實例個數(shù)的百分比作為檢驗集),并設置為34%滿足題目要求。單擊More options按鈕,打開Classifier evaluation options對話框,選中Output復選框,以確保在輸出中能夠看到檢驗集的分類情況。4、單擊start按鈕,開始神經(jīng)網(wǎng)絡的訓練過程。彈出神經(jīng)網(wǎng)絡的GUI界面,單擊start按鈕,執(zhí)行訓練,并選擇accept訓練結果。5、修改參數(shù),重復上述步驟,重新實驗,并對比實驗結果。 第5章 實驗結果實驗一:全部作

5、為實例此實驗實例個數(shù)為303,分類正確率只有61.3362%,較低。實驗二:前200作為實例,剩余103作為檢驗集此實驗實例個數(shù)為200個,分類正確率為98.5273%,比之前經(jīng)所有數(shù)據(jù)全部作為實例的正確率大大提高,并且按照題意,將此實驗作為之后實驗的對照。實驗三:只改變隱層為(7,3),其他不變 此實驗實例個數(shù)為200個,正確率為98.5593%,與上圖的隱層的節(jié)點數(shù)為(5,3)的分類正確率98.5273%相比分類正確率稍稍升高,由此可知節(jié)點數(shù)要根據(jù)需要適當選擇。實驗四:只改變learningRate為0.5,其他不變 實例個數(shù)為200個,分類正確率為98.5273%,與實驗二的學習率為0.3分類正確率相比正確率相同,所以猜想學習率對實驗結果影響較小。3、 只改變trainingTime為500,其他不變: 實例個數(shù)為200個,分類正確率為98.5273%,與實驗二的周期數(shù)為5000分類正確率相同。第6章 結果分析 通過改變參數(shù)進行對比試驗結果表明,將所有數(shù)據(jù)的部分作為實例,其他作為檢驗數(shù)據(jù)集的實驗結果較為準確。在此實驗中改變其它條件對于準確率的影響都不是很大,但是可能是由于輸入數(shù)據(jù)的特殊性造成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論