數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘決策樹試驗(yàn)_第1頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘決策樹試驗(yàn)_第2頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘決策樹試驗(yàn)_第3頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘決策樹試驗(yàn)_第4頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘決策樹試驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、word完美格式實(shí)驗(yàn)3決策樹一、實(shí)驗(yàn)?zāi)康?. 了解決策樹的基本概念。2. 掌握決策樹挖掘分析的操作步驟。二、實(shí)驗(yàn)內(nèi)容對(duì)三國(guó)志4武將數(shù)據(jù).xls中的數(shù)據(jù)進(jìn)行決策樹分析。三、實(shí)驗(yàn)儀、設(shè)備計(jì)算機(jī)、visual studio 2008、分析用數(shù)據(jù)、數(shù)據(jù)庫(kù)服務(wù)四、實(shí)驗(yàn)步驟準(zhǔn)備工作:三國(guó)志 4武將數(shù)據(jù).xls 數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù)中。(1) 打開visual studio 2008,新建項(xiàng)目,選擇 商業(yè)智能項(xiàng)目,analysis services項(xiàng)目圖1新建項(xiàng)目(2)在解決方案資源管理器中,右鍵單擊數(shù)據(jù)源,選擇新建數(shù)據(jù)源歡迎使用數(shù)據(jù)源向?qū)D用此向耳創(chuàng)崖新數(shù)據(jù)源°數(shù)據(jù)澹表養(yǎng)到數(shù)謹(jǐn)?shù)寞幗?#176;數(shù)據(jù)涯

2、不提供緩存無數(shù)據(jù)、涼加關(guān)系、瀝加計(jì)建和添加批注等功能.若要?jiǎng)?shù)據(jù) 送應(yīng)用這墜功能請(qǐng)使用此向?qū)韯?chuàng)建遜據(jù)腮,芒后使用魏據(jù)齊祝門向?qū)硪菜?包含相應(yīng)功能的視圍口圖2數(shù)據(jù)源向?qū)?3)在該界面中選擇 新建,進(jìn)行數(shù)據(jù)源具體設(shè)置圖3新建數(shù)據(jù)源(4)在服務(wù)器名中填寫要連接的數(shù)據(jù)庫(kù)服務(wù)器名稱,或者單擊服務(wù)器名右方下拉按鈕進(jìn)行選擇;勾選使用windows身份驗(yàn)證;選擇或輸入一個(gè)數(shù)據(jù)庫(kù)名中填寫將要分析數(shù)據(jù)所在的數(shù)據(jù)庫(kù)或者單擊右方下拉按鈕進(jìn)行選擇圖4數(shù)據(jù)源具體設(shè)置(5)確定后配置完的數(shù)據(jù)源已顯示在窗口上,繼續(xù)下一步圖5完成數(shù)據(jù)源具體設(shè)置(6) 勾選使用服務(wù)賬戶,繼續(xù)下一步圖6模擬信息設(shè)置(7) 數(shù)據(jù)源名稱 保持默認(rèn)

3、,完成精心整理學(xué)習(xí)幫手圖7完成數(shù)據(jù)源設(shè)置向?qū)?8) 在解決方案資源管理器中,右鍵單擊數(shù)據(jù)源視圖,選擇新建數(shù)據(jù)源視圖歡迎使用數(shù)據(jù)源視圖向?qū)П阌么讼蚨鷦?chuàng)建新的數(shù)據(jù)源視團(tuán)° 從關(guān)系數(shù)據(jù)庫(kù)的表和視窗中創(chuàng)逹數(shù)據(jù)訴視圖.數(shù)據(jù)淅握供與黃裁據(jù)庫(kù)的簡(jiǎn)單葩.可以僥用數(shù)據(jù)遞視團(tuán)執(zhí)行更事高翅功噩I 址鶴存元埶據(jù)、添加壬殺.創(chuàng)律計(jì)算和設(shè)置謹(jǐn)輯犍.圖8數(shù)據(jù)源視圖向?qū)-X選擇數(shù)據(jù)源選擇規(guī)有的關(guān)累數(shù)據(jù)頭,就新連亠個(gè)關(guān)系數(shù)據(jù)源口關(guān)系.數(shù)據(jù)縛®:數(shù)據(jù)源屬性(£):值Data SourceIniti&l C».hxhIntegra td .SSPIProvi tierSQLOLED

4、E. 1圖9選擇數(shù)據(jù)源(10)在可用對(duì)象 中,將要分析數(shù)據(jù)所在表添加到 包含的對(duì)象 中,繼續(xù)下一步選擇表和視圖從姜包含在數(shù)據(jù)澹視團(tuán)中的關(guān)系數(shù)據(jù)庫(kù)中選揮對(duì)象°可用對(duì)象包含的對(duì)象;名稱名帝1 dbo.三國(guó)吉4$類型類型1 dbo.三國(guó)吉4$奘型奘型圖11選擇包含對(duì)象(11 )默認(rèn)名稱,完成圖12完成數(shù)據(jù)源視圖向?qū)?12)在解決方案資源管理器中,右鍵單擊挖掘結(jié)構(gòu),選擇新建挖掘結(jié)構(gòu)圖13數(shù)據(jù)挖掘向?qū)?13)勾選從現(xiàn)有關(guān)系數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù),繼續(xù)下一步圖14選擇定義方法圖15創(chuàng)建數(shù)據(jù)挖掘模型結(jié)構(gòu)(14) 選擇microsoft 決策樹,繼續(xù) 下一步(15)下一步擔(dān)據(jù)向?qū)?dān)據(jù)向?qū)нx擇為挖西結(jié)構(gòu)提供

5、數(shù)皓的數(shù)據(jù)縛視圖選擇數(shù)摒源視圖選擇數(shù)據(jù)源視圖選擇為挖掘結(jié)構(gòu)提供數(shù)據(jù)的數(shù)據(jù)縛視圖可用數(shù)據(jù)憑視團(tuán)®:可用數(shù)據(jù)憑視團(tuán)®:表:表:dbo.三園志4Hdbo. X國(guó)志圖16選擇數(shù)據(jù)源視圖(16)勾選事例,繼續(xù)下一步指定表類型指是勞析吋姜使用的裏類型.0>輯入表(X):表爭(zhēng)例嵌喜禪1三國(guó)志屯$X ill anil naahm:iim miiiiii Hma «tutn 圖17指定表類型(17)在鍵列勾選序號(hào)碼,在輸入列勾選出身、國(guó)別、魅力、統(tǒng)御、武力、政治、智慧、 忠誠(chéng),在可預(yù)測(cè)列勾選身份,繼續(xù)下一步圖18指定定型數(shù)據(jù)(18)下一步圖19指定內(nèi)容和數(shù)據(jù)類型(19)勾選允

6、許鉆取,完成煤敎據(jù)挖握向?qū)?完成向?qū)А耙豢贤诰蚪Y(jié)構(gòu)提供名稱,從而完成數(shù)據(jù)挖掘向?qū)? 卜身削力愣瀏力爭(zhēng)洽苗 出國(guó)魅畠統(tǒng)武序政智挖掘結(jié)構(gòu)名稱追)允許鉆取(T)預(yù)覽通圖21完成數(shù)據(jù)挖掘向?qū)?20) 單擊挖掘模型查看器圖22完成設(shè)置(21) 詢問是否部署項(xiàng)目,是圖23部署項(xiàng)目(22) 詢問是否繼續(xù),是圖24處理模型(23)單擊運(yùn)行圖25運(yùn)行挖掘項(xiàng)目(24)待處理完成后,關(guān)閉外理講度匸姮區(qū)-對(duì)摳憲結(jié)枸a5®£4''的處理已成功完成-爲(wèi)幵始時(shí)間;知勺知;56:錯(cuò)束時(shí)間;SOI2-ie-4 G;3T:W;0;00:03 對(duì)挖掘模型“三固志巒的處邂已戰(zhàn)功完成°葉匕

7、劉迤S 吒國(guó)超 2序號(hào)即 的處理己戍功芫成.-j對(duì)霧誰數(shù)花毎“三圍志! -tic"的坯理已成功爲(wèi)成念”開拍時(shí)間.201121 9.3T.S7 :結(jié)束時(shí)問:2012-12-4 9:3T 5T ;持續(xù)時(shí)問.0:00.00 ”卜也時(shí)度繪值爼11 丫嚇汕吐則1解"理巳捷功芫成*94 4. li£i+J血h血甘1設(shè)計(jì)起彌T* X號(hào)掘結(jié)枸1%氏掘1S型J.甩掘很過程疳辭運(yùn)|蜃庖圖蘭田更1辛報(bào)畫環(huán)型文測(cè)三右4僭mttism以說飯己煜萍片怔克辱犁片內(nèi)客.T曲甘f代館JS碉多悶咼|百禺: 島2跌認(rèn)擴(kuò)展3于姣別朋缺可楽取価苗立才因談型:6 ;青晟-全卸爭(zhēng)例r |是示壘剔ILux i

8、LuajiN«h. daq建皓激樹曲毎3 Hah” dir丄FE18獵構(gòu)A,三國(guó)茗4號(hào)亍J雜頊回格奉 回軍師圖26處理結(jié)果(25)關(guān)閉處理窗口后,就可在 挖掘模型查看器 的決策樹中看到系統(tǒng)經(jīng)過分析得出的結(jié)果圖27分類關(guān)系圖依賴關(guān)系網(wǎng)絡(luò):圖27分類剖面圖(26)在挖掘模型 中,右鍵單擊挖掘模型可以設(shè)置算法參數(shù)三歸【畫計(jì)| Jbdl.dSF 誰計(jì)1 穌頁(yè)*挖掘皓構(gòu)| %挖須屆挖瘟血査署器 g 挖戛準(zhǔn)確性閔蓋I。挖搦根週a 己我疹X緒構(gòu)7出扁國(guó)別魅力三噪AB武力序昱応智著處理挖基結(jié)構(gòu)他) 處理蟆型O .XInput曬性嘔|圖28算法參數(shù)(27)算法參數(shù)的意義COMPLEXITYPENALT

9、禁止決策樹生長(zhǎng)。減少此值會(huì)增加拆解的可能性,而增加此值則會(huì)減 少拆解的可能性。FORCE_REGRESSOt制算法使用的數(shù)據(jù)行作為回歸公式的回歸輸入變量,而不考慮其在算法計(jì)算中的重要性為何。MAXIMU MN PUT_ATTRIBUT ES定在叫用功能選項(xiàng)之前, 算法可以處理輸入屬性的最大數(shù)目。 maximum_output_attribuT指定在叫用功能選項(xiàng)之前,算法可以處理輸出屬性的最大數(shù) 目。MINIMUM_SUPPOR指定分葉節(jié)點(diǎn)必須包含的最小個(gè)例數(shù)目SCORE METHOD定用來計(jì)算分割準(zhǔn)則的方法。SPLIT_METHOD旨定用來節(jié)點(diǎn)分杈的模式。圖29設(shè)置算法參數(shù)(28)設(shè)定完算法后

10、,再次點(diǎn)擊 挖掘模型查看器 進(jìn)行數(shù)據(jù)處理,處理完成后所得出的結(jié)果 就是設(shè)置算法后的結(jié)果。奉數(shù)疋);CWmiTif PENALTir值戢認(rèn)值范圍10. 0Q. 0H .)1.3 J1.3MIJnMUN_SUPPOET SCORE METHO:i SrmjlETHDB五、實(shí)驗(yàn)心得體會(huì)通過這次關(guān)于決策樹的實(shí)驗(yàn), 的學(xué)習(xí)提供了一個(gè)好的鋪墊,讓我對(duì)決策樹的應(yīng)用有了相對(duì)具體的理解, 并且為決策樹 在學(xué)習(xí)過程中,決策樹中的算法由于利用系統(tǒng)本身, 所以并沒有具體理解ID3這個(gè)算法的具體運(yùn)轉(zhuǎn)環(huán)節(jié), 但是有了這次實(shí)驗(yàn)的鋪墊,使自己能夠更加容易之后的ID3算法的學(xué)習(xí)。六、思考題決策樹對(duì)數(shù)據(jù)分類的正確率是否可以達(dá)到100%?答:不可以達(dá)到100%決策樹一般都是自上而下來生成的。決策樹由一個(gè)決策圖和可能的結(jié)果(包括資源成本和風(fēng)險(xiǎn))組成,用來創(chuàng)建到達(dá)目標(biāo)的規(guī)劃。每個(gè)決策或事件都可能引出兩個(gè)或多個(gè)事件,導(dǎo) 致不同的結(jié)果,把這種決策分支畫成圖形很像一棵樹的枝干,所以稱作決策樹。對(duì)于那些各類別樣本數(shù)量不一致的數(shù)據(jù),在決策樹當(dāng)中信息增益的結(jié)果偏向于那些具有更多數(shù)值的特征。決策樹的這種明確性可能帶來誤導(dǎo)。決策樹分類準(zhǔn)確率極限理論:定理1:有經(jīng)驗(yàn)風(fēng)險(xiǎn)和結(jié)構(gòu)風(fēng)險(xiǎn)時(shí),決策樹分類準(zhǔn)確率的極限不存在。定理2:無經(jīng)驗(yàn)風(fēng)險(xiǎn)、有結(jié)構(gòu)風(fēng)險(xiǎn)時(shí),決策樹分類準(zhǔn)確

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論