![關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)_第1頁](http://file4.renrendoc.com/view/9e209f0be5176db5fd567a60f7031d3b/9e209f0be5176db5fd567a60f7031d3b1.gif)
![關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)_第2頁](http://file4.renrendoc.com/view/9e209f0be5176db5fd567a60f7031d3b/9e209f0be5176db5fd567a60f7031d3b2.gif)
![關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)_第3頁](http://file4.renrendoc.com/view/9e209f0be5176db5fd567a60f7031d3b/9e209f0be5176db5fd567a60f7031d3b3.gif)
![關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)_第4頁](http://file4.renrendoc.com/view/9e209f0be5176db5fd567a60f7031d3b/9e209f0be5176db5fd567a60f7031d3b4.gif)
![關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)_第5頁](http://file4.renrendoc.com/view/9e209f0be5176db5fd567a60f7031d3b/9e209f0be5176db5fd567a60f7031d3b5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)【實(shí)驗(yàn)原理】關(guān)聯(lián)規(guī)則挖掘的目的是尋找數(shù)據(jù)之間有趣的關(guān)聯(lián)或聯(lián)系?;仡櫼幌玛P(guān)聯(lián)規(guī)則挖掘中最經(jīng)典的例子一一啤酒與尿布的關(guān)聯(lián)。沃爾瑪通過對(duì)原始交易數(shù)據(jù)的分析,發(fā)現(xiàn)跟尿布一起購買最多的商品竟是啤酒!調(diào)查顯示,美國的太太們常叮囑她們的丈夫下班后為小孩買尿布,而丈夫們?cè)谫I尿布后又隨手帶回了他們喜歡的啤酒。對(duì)于隱藏在啤酒和尿布這類表面上風(fēng)馬牛不相及的商品背后的關(guān)聯(lián),如果不通過數(shù)據(jù)挖掘的技術(shù), 是沒有辦法靠拍腦袋的辦法想出來的。RapidMiner是世界領(lǐng)先的數(shù)據(jù)挖掘解決方案,它以工作流的方式支持各種類型的數(shù)據(jù)挖掘任務(wù)。耶魯大學(xué)已將RapidMiner成功地應(yīng)用在許多不同的應(yīng)用領(lǐng)域,包括文本挖
2、掘,多媒體挖掘,功能設(shè)計(jì),數(shù)據(jù)流挖掘,集成開發(fā)的方法和分布式數(shù)據(jù)挖掘。本實(shí)驗(yàn)將根據(jù)一組人的經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù),試圖發(fā)現(xiàn)不同特征間的關(guān)聯(lián)。原始數(shù)據(jù)如下表所 示,列出了三個(gè)人的特征:是否有車、是否住宿舍公寓、是否住別墅、是否是窮人、是否是 中產(chǎn)階級(jí)、是否是富人。本實(shí)驗(yàn)希望從這些原始數(shù)據(jù)中發(fā)現(xiàn)這些不同特征間的關(guān)聯(lián)規(guī)則,例如“窮人是否一定不住別墅”、“富人是否一定有車”等。圖3.2-1實(shí)驗(yàn)使用的原始數(shù)據(jù)【實(shí)驗(yàn)內(nèi)容】使用RapidMiner工具對(duì)給定的數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)。通過實(shí)驗(yàn),掌握關(guān)聯(lián)規(guī)則 挖掘的原理及RapidMiner工具的用法?!緦?shí)驗(yàn)指導(dǎo)】進(jìn)入Windows實(shí)驗(yàn)臺(tái),打開 RapidMiner工
3、具一.創(chuàng)建新工程點(diǎn)擊New進(jìn)入RapidMiner 5主界面,準(zhǔn)備創(chuàng)建新工程,界面如下圖:ThxFill dh Pr4Et$ To$l$ 舉ur Hilp尸 3ErMew,-r Process匡 XML闿 FarameiarB 3wff Cnew- Rap i ill i n)t rMPC?0 H fl t ? 9 OSshi回lQ RMi陽印蛉Q Imports?)J Ejvai(19j Dau Tirttr&rmilian( 114)口 Modeling 11BJ Eluabon 怛的jS: Proresa 冃 Processi ProblemsSynopsisTh t cpraigr w
4、tiich 比 IhB aufer m&sl w 日 3laT everyDescription圖3.2-2準(zhǔn)備創(chuàng)建新工程導(dǎo)入待處理數(shù)據(jù)在左側(cè)的Repository Access 下面找到 Retrieve組件,將其拖到 Process區(qū),如下 圖所示:j : m$ ReposHiwles& Operators Q 11p OW0M0JiP+. Q Prg曬&心onlrQl (3帥 I 口 Utility 艸町滬 Pracws& Process rwiEEra- ParamMrsrepddioory eivktd Slre Move ReiposlteR Entry M Cvp(r Repos
5、rtory Entry DeliElB Repa&ftJHi- EntryI / fienarw RepasMoo EnlTy I 口1何口獻(xiàn)27 I I曰沖fill曲I- Cj DalaTransJormarbon 1i 14| 1* Moiling (11B) i Cj EafusUon 信即 Help圍COlTllTiet6 PiflbHmsQ L 呻焉 0n pq加n帕I pnotHim莊 RerneeSynopsis圖3.2-3新建數(shù)據(jù)訪問結(jié)點(diǎn)選中 Retrieve結(jié)點(diǎn),在右側(cè)的repository entry處,單擊打開文件圖標(biāo),選擇 Transactions數(shù)據(jù)表后點(diǎn)擊OK,如下
6、圖所示:P OverflewK-BpOBJllui Y UECIT2f061 aSele a repoErtorjlcalic*!. SaEgil的- = -* 嶼 dfla - = -* F 9 GO* :| GC*Tft5lse1 :j| I齡 |n叭-w jjnnrwiHnnmfl戸0帕軸1岡7 jl Rip*ey-St -.-e :jl Sonar IS $ WeigntingS % processes mane; l DB|“休| )(的可vJraTiUnQ Th* mHdilQry 貳棉口葉曲葉和by緲 * SvtEn科悼仆時(shí)tr RlritvtHeads an oti-srt f
7、rom iha dsla rapoErtani-.CommentLacsflion ivSarnple&dlai/rransgdigqsI * 口ep&fiiljQr 呂 &p$r?4oi:口 Prooe&s CflrtTfll捕 If Q| Vlilrtr (41)iRBposrtarF Access (Fw.store1 Move Rgf3O5j|irh if Copy ReiposWiiR |受Delete R直怦加 | 費(fèi) Rename RefHisl .J Import (27) :J IEjpcMt(1BJ DataTransroriiiallQi :_J klodelingfns
8、) :iJ E-N-aluaUan E刃 & Ni&wLucalRepg&flnR圖3.2-4選擇導(dǎo)入的數(shù)據(jù)點(diǎn)擊菜單中的保存按鈕,保存當(dāng)前工程,會(huì)彈出如下圖所示的提示框來選擇保存位置,例如選擇“ NewLocalRepository ,保存為test,然后點(diǎn)擊 OK完成保存。3 *b孕礙”星SIM a曲0啊腳旳EliM規(guī) Ketnovejp OverMew9 SarnilE -K DBiNewLciGalRmpgnpryI jl RepcE-itorB Dprr Prectsj Gonrtrfll (卿 casii瞅4勺二 RaposrCan- acwbs (|Retneve|EEE- Sto
9、rff幵 l.iovB ReposMor?I 箏 Copy ReposMorj- 輩 Delete! ReiHsrlDI Renarns ReiKisi 匚)Import (Z7)Export (15_j Data Transformartlcir J Modeling (1 IB) J Eluahon 2BJNlfTitg CommentWBliCwl ffl-JtwLiCalRe:p0Si1Oni*1LUL-dli.- IReaarTzitJfid: from tha d?la- raposrCori.OscrithDni圖3.2-5保存當(dāng)前工程對(duì)原始數(shù)據(jù)進(jìn)行二值化在左側(cè)的 Data Tr
10、ansformation 下面的 Type Conversion 下找到 Nominal to Binominal組件,將其拖到 Process區(qū),并用鼠標(biāo)從 Retrieve結(jié)點(diǎn)右側(cè)的out處畫線到 Nominal to Binominal左側(cè)的exa處(畫線方法:在起點(diǎn)按下鼠標(biāo)不放,移動(dòng)到終點(diǎn)后松開鼠標(biāo)),看到提示后點(diǎn)Ok,選中Nominal to Binominal ,然后在右側(cè)勾選“ transformbinominal ”,女口下圖:p CheiMewf ME34j| RepDSilDrieA巴 OporMrs16匿XML7? Parameters:刁啡労tft弘Eb+3 RBran
11、be* 扈 Recall Ijl Multiply $oin Plh if Hande 曰憂pUon:IReposHw Access 6)CS Export (18)$ O-ats Trim si orm ail on(i 14JE N|nH and ROM M&difiCSliori (7)3 Tyflt C&frrtfSifiin (30 圏 口 Dimbetz盛百n (5)Nofninal Binominal暫 Numerical Binorninal 謝 Numsncal to Fol)nominal 魁 NumBncaita Real 謝 NumBricai to Dale 電心 R
12、t-l ICs MltgrAk Nominal l&T&d3. Problems愚1 Nornlrmi to BlrKoinalBiibubt fiH*r hpt0 transform binominalCommBnlNoprQble attnbules. PB詬陽用 Include spedaii HntiirlESQ HelpNominal to Binominal圖3.2-6增加二值化數(shù)據(jù)轉(zhuǎn)換結(jié)點(diǎn)按屬性過濾在左側(cè)的 Data Tran sformatio n 下面的 Attribute Set Reduct ion and Tran sformati on 下的Select下找到Sele
13、ct Attributes組件,將其拖到 Process區(qū),并保證 Nominal to Bi no mi nal右側(cè)的exa連接到Select Attributes 左側(cè)的exa處,然后在右側(cè)選擇過濾類 型為“ regular_expression ” regular expression 處填寫“ .*true.* ” 女口下圖:尸Ovarw棹PmmelRrs* 44 * * 密:Pr-ncBS -Q *朝:圖| 遵Prnces-t? XMLEft 居卑審I j Repo&Dsrles巳 OpefalarsG iii y ill可 C3 EiP(h1 (IS) Qah Trarr&fmal
14、iM) (114B:Name and Role Modification (7):Tpe Converalon (20JAUrlbube SelRdudloniand Transit;_| Oemeratiofi (19)LJ Tranis伽latiQfi (7) b Sol 辭 qh(1 電i 畫 Qgiiin詢ionSeleciAllfibulsjn潮 Reorder .Wl tube 9劇 3l&a my Random 曲 Remove AHnbule曲 Remcw Usetass AHnbulBS Rsrnpffl 5冋1 蒯 d Attrikik jj 歐irfc 斗n SubtH:
15、_J Valiri MMiHBli閉(16):.J Data :J Fltterlng dmmnd丄.Prnbl&msRjgliiwye|4reqar eMireglon /lne. Inweft SElEdjQfl.?, 1 hidden expert parameterO Htelp 園OotniTiefitSeiMt Attributes滸 Ho problems inundMBss-ageFIksbLiicaUctfiSynopsisThis opeeatoc allors bo s-eledTrtilch mHnbul 萌 shLiM be pait dflie r5uHir*g E
16、xamvleSBl Smcbom can be pflrigrmdi usig s 鎖申閉1圖3.2-7增加屬性過濾結(jié)點(diǎn)生成頻繁子項(xiàng),為關(guān)聯(lián)規(guī)則生成做準(zhǔn)備在左側(cè)的 Modeling 下面的 Association and Item Set Mining 下的 FP-Growth 組件, 將其拖到Process區(qū),并用鼠標(biāo)從Select Attributes結(jié)點(diǎn)右側(cè)的exa處畫線到FP-Growth 左側(cè)的exa處,看到提示后點(diǎn) Ok,如下圖:Ijf RacallIjjl Multiply 才 J(Hri Parth 豺 Han de ExttpliM UWiH 141)Q R-epositat
17、yAc-cess (6)J lmiwr127)X| wt(l3i1J Oaig TrwsrfmrnarliQfi (114& Moving 4119)E ; J ClasAe3tii anl Rtgression 密 i j.wibuteWeaighUnl)B QkjalEflnp and Segmefitallon 13 日 AsE-ociahcin and Mem 5 Mining (E-THProcec-9匡 XMLPrtbltiru6 5詡 Crflisl AssQoafiQn Rules 壽也|;昭袖RulK 詡 Ge#ierli2d SeuenliaJ Paltei * Hem S
18、eis bo Data 帝 Unily Hem Seo角 NQiprQlfrnlqundWs陰盟向嘶Lccahon2; Faramelers超報(bào)I尊聲囁 *薛 rp.Growm| find mm nivnbr 酣 ihs:rri関帕min niMnbr or Me. 104mm SLidporl:O.K丄 4 hitfidexpert pararnebera Htlp0 Cofnmtni回口 FP-GrcwttiSynopsisThis leame* effiaantiy calojialErE all frigiaiivnC rprn FrgrnViv givn darlA圖3.2-8增加頻
19、繁子項(xiàng)生成結(jié)點(diǎn)生成關(guān)聯(lián)規(guī)則在左側(cè)的 Modeling 下面的 Association and Item Set Mining 下的 Create Association Rules 組件,將其拖到Process區(qū),并用鼠標(biāo)從 FP-Growth結(jié)點(diǎn)右側(cè)的fre 處畫線到Create Association Rules 左側(cè)的ite處,看到提示后點(diǎn) Ok,如下圖:戸 OVBMW3 t :匸:*wm Procesa 卜3 仃 $7 三團(tuán)涉.國XML:r; Proces-GHominal to Ein.Hominal to Ein.“ LHJ U3t m e三扌 Parameters巴 OpBrslorI * Rpsibories 已 OBFSlDrSdlecl AttribiiF idSdlecl Attribiia*ne1diiC4nridenemini 亡 aitfideintt.Remembw if Hecafli Multiply 魯olnPaSis 住 Handle Exception 口 U1|ftK(41)E- j R
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年工藝刷行業(yè)深度研究分析報(bào)告
- 2025年中國人工麝香行業(yè)市場(chǎng)運(yùn)行現(xiàn)狀及投資戰(zhàn)略研究報(bào)告
- 結(jié)業(yè)證申請(qǐng)書
- 院學(xué)生會(huì)申請(qǐng)書
- 轉(zhuǎn)正申請(qǐng)書 大四
- 2025年家庭網(wǎng)絡(luò)通信設(shè)備市場(chǎng)現(xiàn)狀調(diào)研及前景趨勢(shì)預(yù)測(cè)報(bào)告
- 醫(yī)師處方權(quán)申請(qǐng)書
- 電動(dòng)車技術(shù)教育構(gòu)建高效人才培養(yǎng)體系
- 現(xiàn)代辦公室中結(jié)構(gòu)化項(xiàng)目管理的策略與實(shí)踐
- 2025年國內(nèi)水路貨物運(yùn)輸合同模板
- 尿毒癥替代治療
- 家族族譜模板
- 2022年公務(wù)員多省聯(lián)考《申論》真題(黑龍江省市卷)及答案解析
- 【課件】2025屆高考英語一輪復(fù)習(xí)小作文講解課件
- “國家示范性高等職業(yè)院校建設(shè)計(jì)劃”骨干高職院校項(xiàng)目建設(shè)方案
- GB/T 44744-2024糧食儲(chǔ)藏低溫儲(chǔ)糧技術(shù)規(guī)程
- 糧食貯藏課件
- 園林花卉 課件 第8、9章 草坪與地被植物、技能訓(xùn)練
- 危急值的考試題及答案
- 2024年知識(shí)競(jìng)賽-競(jìng)彩知識(shí)考試近5年真題集錦(頻考類試題)帶答案
- 《算法設(shè)計(jì)與分析基礎(chǔ)》(Python語言描述) 課件 第1章 緒論
評(píng)論
0/150
提交評(píng)論