版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
TT£蠡護(hù)kITtc丁 K-blTa VTT£蠡護(hù)kITtc丁 K-blTa V數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告學(xué)號(hào)實(shí)驗(yàn)名稱課程數(shù)據(jù)挖掘?qū)嶒?yàn)一:數(shù)據(jù)準(zhǔn)備實(shí)驗(yàn)類型實(shí)驗(yàn)名稱課程數(shù)據(jù)挖掘?qū)嶒?yàn)一:數(shù)據(jù)準(zhǔn)備實(shí)驗(yàn)類型實(shí)驗(yàn)?zāi)康模海?) 掌握利用文本編輯軟件生成ARFF文件的方法;(2) 掌握將EXCEL表格文件轉(zhuǎn)換為ARFF文件的方法;(3) 掌握數(shù)據(jù)的預(yù)處理方法。實(shí)驗(yàn)要求:(1)將下列表格中的數(shù)據(jù)利用文本編輯軟件生成 ARFF文件:姓名出生日期性別婚否工資職業(yè)信用等級(jí)黃大偉1970.05.08男3580教師優(yōu)秀李明1964.11.03男是4850公務(wù)員優(yōu)秀張明明1975.03.12女是職員優(yōu)秀覃明勇1981.07.11男是2980職員良好黃燕玲1986.05.08女否2560工人一般表中沒有填上的數(shù)據(jù)為缺失數(shù)據(jù)。請(qǐng)列出你編輯 ARFF文件并在WEKA中打開該文件。(2) 將EXCEL表格文件“bankdata.xiS專換為ARFF文件的方法,并將它另存為ARFF文件“bankdata.arff在WEKA中打開該文件,寫出操作過程。(3)數(shù)值屬性的離散化:在WEKA中打開ARFF文件“bankdata.arf對(duì)屬性“age”和“income”分別按等寬分箱和等深分箱進(jìn)行離散化為三個(gè)箱。給出分箱的結(jié)果。實(shí)驗(yàn)結(jié)果:(1)@relationbooki@attribute姓名{黃大偉,'李 明',張明明,覃明勇潢燕玲}@attribute出生日期{1970.05.08,1964.11.03,1975.03.12,1981.07.11,1986.05.08}@attribute性別{男,女}
@attribute婚否{是,否}?attribute工資numeric@data黃大偉,1970.05.08,男,?,3580李’,1964.11.03,男,是,4850張明明,1975.03.12,女,是,?覃明勇,1981.07.11,男,是,2980黃燕玲,1986.05.08,女,否,2560(2)先把bankdata.xls轉(zhuǎn)化為CSV文件格式得到bankdata.csv,再在WEKA中打開,再另存為ARFF格式,就可以得到bankdata.arff。即3.寸tankdata二出]3.寸tankdata二出]陽讓F磚oEtEkcJ.[IZLKE轉(zhuǎn)換為I「二 KFbankdata芋aMicrosoftOffice...ICXj30KBliaiikdat^AifFDatafile30KB,再轉(zhuǎn)換得在WEKA中打開如下:Cirvnnir亠]「LOtK?L4tiCT-:bu:Jzd.b.t-d.IxstcLCtz:&4JD=-Cirvnnir亠]「LOtK?L4tiCT-:bu:Jzd.b.t-d.IxstcLCtz:&4JD=-il5-HU*t■?!.寸tz:SouAllJ-r.Ttz-tL■i■=ex31—trfiuti4LjfiPHl牙5&■arrq匚電如Lircn*=aral9iav-#_a<LZTltranl4ctLD匚?CT匕尊口11:'1—11jtr骷.IlliALww l& jHuhwui $TiHcui ,丄巳335 1引也撫' 'll.-tisClu3pcFWg) VJ[Vin^^E-BALLIkMbH吐:50T璋a:l-nncj-LzKn^T±:D4tana:伍欝IIlzziti^:C〔京)(3)對(duì)age按等寬進(jìn)行離散化分箱如下:hhni曲iDUuElUK眶Th血Ighhni曲iDUuElUK眶Th血Ig沖il1EH-trSClazEQxtD2iJf^TnL=E~azinni}{■口nBi“z-=Me.LiliclIp 333lUuLLlL15512PC431333丹...2142UUdl'C50c&ccen-i...LSIaoHiTtinrt糸Sif]^Ct.#4猷F.riVit卓V-ltf1>C.HiisireQiifntily|.e:NntiaJLtllIYiqVPnCfllt'lV”:VisiiaIirt丄11對(duì)income進(jìn)行等深離散化分箱如下:No.LabelCount1£0320c.02'(SO取g一4-311...£0020c.03'C31tE1.35-in£)^eoc.oBistinct:3Type:NominalUnique:0CfTR)Selectedattributeflame:LiLccmerflisEing:0(0旳200pepCKori)7[Ifi5ualijeAIL200pepCKori)200實(shí)驗(yàn)名稱實(shí)驗(yàn)二:關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)類型綜合性實(shí)驗(yàn)實(shí)驗(yàn)名稱實(shí)驗(yàn)二:關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)類型綜合性實(shí)驗(yàn)實(shí)驗(yàn)?zāi)康模海?) 掌握WEKA關(guān)聯(lián)規(guī)則挖掘中的數(shù)據(jù)準(zhǔn)備方法。(2) 掌握WEKA關(guān)聯(lián)規(guī)則挖掘中的參數(shù)設(shè)置方法。(3) 掌握關(guān)聯(lián)規(guī)則挖掘結(jié)果的分析。實(shí)驗(yàn)要求:(1)將下列事務(wù)數(shù)據(jù)庫轉(zhuǎn)換為二元表格形式(以項(xiàng)目作為屬性,在某個(gè)事務(wù)中,該項(xiàng)目出現(xiàn)則取值為yes,不出現(xiàn)則取值為n0。)并生成ARFF文件格式。CustomerCommoditiesC1milk,egg,bread,chipsC2egg,popcom,chips,beerC3egg,bread,chipsC4milk,egg,bread,popcorn,chips,beeiC5milk,bread,beerC6egg,bread,beerC7milk,bread,chipsC8milk,egg,bread,butter,chipsC9milk,egg,butter,chips(2) 選擇關(guān)聯(lián)規(guī)則算法并設(shè)置相關(guān)參數(shù)。(3) 運(yùn)行算法,輸出頻繁項(xiàng)集及強(qiáng)關(guān)聯(lián)規(guī)則。(4) 從挖掘結(jié)果來看,你發(fā)現(xiàn)了什么有興趣的規(guī)則?
實(shí)驗(yàn)結(jié)果:Customermilkeggbreadchipspopcornbeerbutterc1yesyesyesyesnononoc2noyesnoyesyesyesnoc3noyesyesyesnononoc4yesyesyesyesyesyesnoc5yesnoyesnonoyesnoc6noyesyesnonoyesnoc7yesnoyesyesnononoc8yesyesyesyesnonoyesc9yesyesnoyesnonoyes將文件保存為“yes-no.csv”,在WEKA中打開yes.csv文件,然后save為yes-no.a市即生成ARFF文件格式。⑵打開數(shù)據(jù)文件:用 “Explorer打開yes-no.arff后,切換到“Associate選項(xiàng)卡。選擇算法:默認(rèn)關(guān)聯(lián)規(guī)則分析是用 Apriori算法。點(diǎn)“Choose按鈕在彈出的窗口中可以選擇關(guān)聯(lián)規(guī)則算法。參數(shù)設(shè)置:單擊 “Choose按鈕右邊的文本框會(huì)彈出參數(shù)設(shè)置對(duì)話框,可以修改默認(rèn)的參數(shù),彈出的窗口中點(diǎn)“More可以看到各參數(shù)的說明。設(shè)置如下圖:outpiitltemSetsFdsesigfiificiaceLeveloutpiitltemSetsFdsesigfiificiaceLevelVhFdEsVh-1.0(3)運(yùn)行算法單擊“Start按鈕開始關(guān)聯(lián)分析,輸出頻繁項(xiàng)集及強(qiáng)關(guān)聯(lián)規(guī)則。■■■bct<llc4fkciLctjCFCtodfl-■-■■■bct<llc4fkciLctjCFCtodfl-■-AprioEisuKpocV:C.2(4uetric<continences;LL日WMinierotcyclespecfomed:IfI.3.4.6.7.?.9.10.be^E=no5I.3.4.6.7.?.9.10.be^E=no5==>chLpa=Y±35be己匸=nt5==>popcotm=n。Epa(puoEi=inDl)uttei=no5==>btead^yesSS55popcoEii-nDbeec-no5-■>chips-yeschips-^esbeer-no5pcpMra-nochip3=¥e3popcorn^no5*■>b?er=to5 chipa=y^3f)cp?i;ii=nobeer^yes4==>butteE=no4<cor:f:[I)>lift:(2.B6)leT:D*16i[31conv:{3.25J<ccnf;U)>lift:(3,S6)lev:(0,15)[3]canv;(3,25)<ccn£:[i)>lt£t:(2.36)Lev:(0.15)[3]conv:(3.2;)<confI(1)><confI(L.)><conf:(ij><confi(i3>li£c;life:life:llC':£廚引lev:(0.16)[3]conv!(X25)lev:(0.16)[3]conv:(3*25)4)lev;(0.19)[3]conv:(3.75)4) (0.19)[3]conv:(3.75Jmilk=763EHg=Yies4==>chip3=Ye34iiiilk=yesbutter=np4==>tteadpez4<ccnf:(1)>lift:(2.36)lev:(0.13)[2]coiiv:(2.6)<conf:(!)>lift:(2.BSJlev:(O.l3)[2]conv:[2.&J<conf:(LJ>lifv:2?e5ilev:(0.13)[2]cqztv:[3-6)SizeofsetoElargeiteia^etsL(i):£SizeoEseto£largeiteioBe^L(E):$LZEotsetoflacgeits20^ST:sL⑶;SizeatsetoflargeitemaetjL[4):3(jtneratedsetsofIfiigeItensets:BestExilesfound:(4)我發(fā)現(xiàn)本來在我們看來毫無聯(lián)系的事物,經(jīng)過分析發(fā)現(xiàn)它們有著密切聯(lián)系。實(shí)驗(yàn)名稱實(shí)驗(yàn)三:分類知識(shí)挖掘?qū)嶒?yàn)類型綜合性實(shí)驗(yàn)實(shí)驗(yàn)名稱實(shí)驗(yàn)三:分類知識(shí)挖掘?qū)嶒?yàn)類型綜合性實(shí)驗(yàn)實(shí)驗(yàn)?zāi)康模海?) 掌握利用決策樹(C4.5算法)進(jìn)行分類的方法。(2) 掌握利用樸素貝葉斯分類的方法。實(shí)驗(yàn)要求:(1)對(duì)數(shù)據(jù)集bankdata.arff利用決策樹(C4.5算法)進(jìn)行分類,給出得出的決策樹及分類器的性能評(píng)價(jià)指標(biāo),并利用建立的分類模型對(duì)下列表中給出的實(shí)例進(jìn)行分類。agesexregionincomemarriedchildrencarsave_actcurrent_actmortgagepep21MALETOWN5014.21NO0YESYESYESYES42MALEINNERCITY17390.1YES0NOYESYESNO59FEMALERURAL35610.5NO2YESNONONO45FEMALETOWN26948NO0NOYESYESYES58FEMALETOWN34524.9YES2YESYESNONO30MALEINNERCITY27808.1NO3NONOYESNO(2)對(duì)數(shù)據(jù)集bankdata.arff利用樸素貝葉斯分類方法進(jìn)行分類,給出分類模型的參數(shù)及分類器的性能評(píng)價(jià)指標(biāo),并利用建立的分類模型對(duì)上表中給出的實(shí)例進(jìn)行分類。實(shí)驗(yàn)結(jié)果:(1)Eehueip*】和伽Eehueip*】和伽riDftUICCh:鼻匸tILbUECS;?oalinh&ielaDsiCisED^tcccD<J4a-COiKZ,加臥Ec^oninrcHa氈匸ledchiiaEttcar9EXVCactCUTEOltbctHOC匕觀《P卑TtfltudcI10-£oldcCCAj-v&l1datLonTtfltudcIciutici?£utei(EUJlriAiiiLLjgAec|■■■J49prunedchlldtSR<?LI cmidEn<■0I I kutiel?nI I Iuors#I I IudgigeIlli-lU;?Tt5act-Maiiled=iciIaivt4tt?MoIlUdDBeY£5VO:■VO¥EStI2.0)
■tfO(^3.0)<?i-isne.iI I I ege<-41:HOI I I AU*>41j7E£IIJJjCLibc?£1506,£;(11,0/1.C)(S.O/l-fl)HO(ZQ.O)I ?愜弊ras|25hO/3.O|iCt-TK;H?(Il^TO/UrOlI I I I II4#Auj rh和h I ri I 4ajKw>2訂嚇Jijo2Q4TI b I I Mtwe-nsI'OS(ZJ.DltI.OiIpIHn_U[-TEtinJ(llf^Lria.AII <U.lllAtL> flI I Lkcuc R" iSM4_iIII 414JiinI I I屮耳g曲I I Xcu >ISaSQ.VJefe&l*4n>II UU4H<-■窮 P4P iwroK>iau4.]I Imil4T?<<■心 B WWMIlI p diuh出">丄I I IiJKVKP竝白*■山itt電IIIuuw> Ita<0.ili2.at.TZ&411I.D/3.DbRkLce4£lum<I***f?4Ullt4<[M?-V?lldtU4a-1■■■di1..FTf7?ci*fi17EI-Hnri4-riTrue—■litfdZxteiJ.rC14d*itudLii±utte?dn*4nhtM?JuE*timKflHaJE^Kxrd.■IxA±BU丄此1艸 *Tldf陽"tTCHUirJ<ll4TrttTEnW4P 14T?ihShe.±11.KjqlujIjm理』111*3^11皿ElQtErHdl?.iHi■,LMA.SKH.aw*rp.s1?f.4L??*C?CJt-A?7A-9:>*?Ii-->IHE;eIB?T帥TH'£Q009七SL'&5t"曲甜4ibLSE\沱曲'M9<?'O
S??'O
詁STD0賓MCIf1..!■—V£Q009七SL'&5t"曲甜4ibLSE\沱曲'M9<?'O
S??'O
詁STD0賓MCIf1..!■—Vi亡非-ChC'DT--T?l*卜T麗2bti[HHC>Xig閆謂[f.?J>IHI'lX'll(hl£>t=iszEarnX如UDTBnjCQJ???
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度蔬菜大棚建設(shè)與農(nóng)業(yè)人才培訓(xùn)合作合同3篇
- 2025年度航空航天復(fù)合材料試驗(yàn)委托合同3篇
- 2024智慧城市項(xiàng)目設(shè)計(jì)與實(shí)施合同
- 2024年融資租賃合同租賃物描述及租金計(jì)算方式
- 2024港口碼頭建設(shè)渣土砂石運(yùn)輸及堆放合同
- 數(shù)字藝術(shù)批評(píng)與網(wǎng)絡(luò)文化-洞察分析
- 網(wǎng)格服務(wù)間通信優(yōu)化-洞察分析
- 2024正規(guī)公司借款合同范本
- 2025年度甲方公司銷售主管乙方薪酬合同3篇
- 輿情監(jiān)控與風(fēng)險(xiǎn)預(yù)警-洞察分析
- 人教版七年級(jí)下冊數(shù)學(xué)全冊完整版課件
- 初中生物人教七年級(jí)上冊(2023年更新) 生物圈中的綠色植物18 開花和結(jié)果
- 水電解質(zhì)及酸堿平衡的業(yè)務(wù)學(xué)習(xí)
- 統(tǒng)編版一年級(jí)語文上冊 第5單元教材解讀 PPT
- CSCEC8XN-SP-安全總監(jiān)項(xiàng)目實(shí)操手冊
- 口腔衛(wèi)生保健知識(shí)講座班會(huì)全文PPT
- 成都市產(chǎn)業(yè)園區(qū)物業(yè)服務(wù)等級(jí)劃分二級(jí)標(biāo)準(zhǔn)整理版
- 最新監(jiān)督學(xué)模擬試卷及答案解析
- ASCO7000系列GROUP5控制盤使用手冊
- 污水處理廠關(guān)鍵部位施工監(jiān)理控制要點(diǎn)
- 財(cái)政投資評(píng)審中心工作流程
評(píng)論
0/150
提交評(píng)論