數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-決策樹實(shí)驗(yàn)_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-決策樹實(shí)驗(yàn)_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-決策樹實(shí)驗(yàn)_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-決策樹實(shí)驗(yàn)_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-決策樹實(shí)驗(yàn)_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、。實(shí)驗(yàn) 3 決策樹一、實(shí)驗(yàn)?zāi)康牧私鉀Q策樹的基本概念。掌握決策樹挖掘分析的操作步驟。二、實(shí)驗(yàn)內(nèi)容對(duì) 三國志 4 武將數(shù)據(jù) .xls 中的數(shù)據(jù)進(jìn)行決策樹分析。三、實(shí)驗(yàn)儀、設(shè)備計(jì)算機(jī)、 visual studio 2008、分析用數(shù)據(jù)、數(shù)據(jù)庫服務(wù)四、實(shí)驗(yàn)步驟準(zhǔn)備工作:三國志4 武將數(shù)據(jù) .xls數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫中。(1)打開 visual studio 2008,新建項(xiàng)目,選擇商業(yè)智能項(xiàng)目, analysis services項(xiàng)目圖 1新建項(xiàng)目(2)在解決方案資源管理器中,右鍵單擊數(shù)據(jù)源 ,選擇 新建數(shù)據(jù)源圖 2 數(shù)據(jù)源向?qū)Ьx資料,歡迎下載。(3)在該界面中選擇新建 ,進(jìn)行數(shù)據(jù)源具體設(shè)置圖 3 新建

2、數(shù)據(jù)源4) 在服務(wù)器名 中填寫要連接的數(shù)據(jù)庫服務(wù)器名稱,或者單擊服務(wù)器名右方下拉按鈕進(jìn)行選擇; 勾選使用 windows 身份驗(yàn)證 ;選擇或輸入一個(gè)數(shù)據(jù)庫名 中填寫將要分析數(shù)據(jù)所在的數(shù)據(jù)庫或者單擊右方下拉按鈕進(jìn)行選擇圖 4 數(shù)據(jù)源具體設(shè)置精選資料,歡迎下載。(5)確定后配置完的數(shù)據(jù)源已顯示在窗口上,繼續(xù)下一步圖 5 完成數(shù)據(jù)源具體設(shè)置(6)勾選 使用服務(wù)賬戶,繼續(xù)下一步圖 6 模擬信息設(shè)置(7)數(shù)據(jù)源名稱 保持默認(rèn), 完成精選資料,歡迎下載。圖 7 完成數(shù)據(jù)源設(shè)置向?qū)В?)在解決方案資源管理器中,右鍵單擊數(shù)據(jù)源視圖 ,選擇 新建數(shù)據(jù)源視圖圖 8 數(shù)據(jù)源視圖向?qū)В?)下一步圖 9 選擇數(shù)據(jù)源(1

3、0) 在可用對(duì)象 中,將要分析數(shù)據(jù)所在表添加到包含的對(duì)象 中,繼續(xù) 下一步精選資料,歡迎下載。圖 11 選擇包含對(duì)象(11) 默認(rèn) 名稱 ,完成圖 12 完成數(shù)據(jù)源視圖向?qū)В?2) 在解決方案資源管理器中,右鍵單擊挖掘結(jié)構(gòu) ,選擇 新建挖掘結(jié)構(gòu)圖 13 數(shù)據(jù)挖掘向?qū)В?3) 勾選 從現(xiàn)有關(guān)系數(shù)據(jù)庫或數(shù)據(jù)倉庫,繼續(xù) 下一步精選資料,歡迎下載。圖 14 選擇定義方法(14) 選擇 microsoft決策樹 ,繼續(xù) 下一步圖 15 創(chuàng)建數(shù)據(jù)挖掘模型結(jié)構(gòu)(15) 下一步圖 16 選擇數(shù)據(jù)源視圖(16) 勾選 事例 ,繼續(xù) 下一步精選資料,歡迎下載。圖 17 指定表類型17) 在鍵列勾選 序號(hào)碼 ,在

4、輸入 列勾選 出身、國別、魅力、統(tǒng)御、武力、政治、智慧、忠誠 ,在 可預(yù)測(cè) 列勾選 身份 ,繼續(xù) 下一步圖 18 指定定型數(shù)據(jù)(18) 下一步精選資料,歡迎下載。圖 19 指定內(nèi)容和數(shù)據(jù)類型(19) 勾選 允許鉆取 ,完成圖 21 完成數(shù)據(jù)挖掘向?qū)В?0) 單擊 挖掘模型查看器精選資料,歡迎下載。圖 22 完成設(shè)置(21) 詢問是否部署項(xiàng)目,是圖 23 部署項(xiàng)目(22) 詢問是否繼續(xù),是圖 24 處理模型(23) 單擊 運(yùn)行精選資料,歡迎下載。圖 25 運(yùn)行挖掘項(xiàng)目(24) 待處理完成后,關(guān)閉圖 26 處理結(jié)果25) 關(guān)閉處理窗口后,就可在 挖掘模型查看器 的決策樹 中看到系統(tǒng)經(jīng)過分析得出的結(jié)

5、果圖 27 分類關(guān)系圖精選資料,歡迎下載。依賴關(guān)系網(wǎng)絡(luò):圖 27 分類剖面圖26) 在挖掘模型 中,右鍵單擊挖掘模型可以 設(shè)置算法參數(shù)圖 28 算法參數(shù)(27) 算法參數(shù)的意義COMPLEXITY_PENALTY:禁止決策樹生長。減少此值會(huì)增加拆解的可能性,而增加此值則會(huì)減少拆解的可能性。FORCE_REGRESSOR:強(qiáng)制算法使用的數(shù)據(jù)行作為回歸公式的回歸輸入變量,而不考慮其在算法計(jì)算中的重要性為何。MAXIMUM_INPUT_ATTRIBUTES:指定在叫用功能選項(xiàng)之前,算法可以處理輸入屬性的最大數(shù)目。MAXIMUM_OUTPUT_ATTRIBUTES:指定在叫用功能選項(xiàng)之前,算法可以處理

6、輸出屬性的最大數(shù)目。MINIMUM_SUPPORT:指定分葉節(jié)點(diǎn)必須包含的最小個(gè)例數(shù)目SCORE_METHOD:指定用來計(jì)算分割準(zhǔn)則的方法。精選資料,歡迎下載。SPLIT_METHOD:指定用來節(jié)點(diǎn)分杈的模式。圖 29 設(shè)置算法參數(shù)28) 設(shè)定完算法后,再次點(diǎn)擊 挖掘模型查看器 進(jìn)行數(shù)據(jù)處理,處理完成后所得出的結(jié)果就是設(shè)置算法后的結(jié)果。五、實(shí)驗(yàn)心得體會(huì)通過這次關(guān)于決策樹的實(shí)驗(yàn), 讓我對(duì)決策樹的應(yīng)用有了相對(duì)具體的理解, 并且為決策樹的學(xué)習(xí)提供了一個(gè)好的鋪墊, 在學(xué)習(xí)過程中, 決策樹中的算法由于利用系統(tǒng)本身, 所以精選資料,歡迎下載。并沒有具體理解 ID3 這個(gè)算法的具體運(yùn)轉(zhuǎn)環(huán)節(jié), 但是有了這次實(shí)

7、驗(yàn)的鋪墊, 使自己能夠更加容易之后的 ID3 算法的學(xué)習(xí)。六、思考題決策樹對(duì)數(shù)據(jù)分類的正確率是否可以達(dá)到100%?答:不可以達(dá)到100%決策樹一般都是自上而下來生成的。決策樹由一個(gè)決策圖和可能的結(jié)果( 包括資源成本和風(fēng)險(xiǎn) ) 組成,用來創(chuàng)建到達(dá)目標(biāo)的規(guī)劃。每個(gè)決策或事件都可能引出兩個(gè)或多個(gè)事件,導(dǎo)致不同的結(jié)果,把這種決策分支畫成圖形很像一棵樹的枝干,所以稱作決策樹。對(duì)于那些各類別樣本數(shù)量不一致的數(shù)據(jù),在決策樹當(dāng)中信息增益的結(jié)果偏向于那些具有更多數(shù)值的特征。決策樹的這種明確性可能帶來誤導(dǎo)。決策樹分類準(zhǔn)確率極限理論:定理 1:有經(jīng)驗(yàn)風(fēng)險(xiǎn)和結(jié)構(gòu)風(fēng)險(xiǎn)時(shí),決策樹分類準(zhǔn)確率的極限不存在。定理 2:無經(jīng)驗(yàn)風(fēng)險(xiǎn)、有結(jié)構(gòu)風(fēng)險(xiǎn)時(shí),決策樹分類準(zhǔn)確率的極限不存在。定理 3:有經(jīng)驗(yàn)風(fēng)險(xiǎn)、無結(jié)構(gòu)風(fēng)險(xiǎn)時(shí),決策樹分類準(zhǔn)確率的極限存在。定理 4:無經(jīng)驗(yàn)風(fēng)險(xiǎn)和結(jié)構(gòu)風(fēng)險(xiǎn)時(shí),決策樹分類準(zhǔn)確率的極限存在。以上定理都認(rèn)可 100%是決策樹分類準(zhǔn)確率的上邊界, 0%是其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論