關(guān)聯(lián)規(guī)則挖掘?qū)嶒瀇第1頁
關(guān)聯(lián)規(guī)則挖掘?qū)嶒瀇第2頁
關(guān)聯(lián)規(guī)則挖掘?qū)嶒瀇第3頁
關(guān)聯(lián)規(guī)則挖掘?qū)嶒瀇第4頁
關(guān)聯(lián)規(guī)則挖掘?qū)嶒瀇第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、關(guān)聯(lián)規(guī)則挖掘?qū)嶒灐緦嶒炘怼筷P(guān)聯(lián)規(guī)則挖掘的目的是尋找數(shù)據(jù)之間有趣的關(guān)聯(lián)或聯(lián)系。回顧一下關(guān)聯(lián)規(guī)則挖掘中最經(jīng)典的例子啤酒與尿布的關(guān)聯(lián)。沃爾瑪通過對原始交易數(shù)據(jù)的分析,發(fā)現(xiàn)跟尿布一起購買最多的商品竟是啤酒!調(diào)查顯示,美國的太太們常叮囑她們的丈夫下班后為小孩買尿布,而丈夫們在買尿布后又隨手帶回了他們喜歡的啤酒。對于隱藏在啤酒和尿布這類表面上風(fēng)馬牛不相及的商品背后的關(guān)聯(lián),如果不通過數(shù)據(jù)挖掘的技術(shù),是沒有辦法靠拍腦袋的辦法想出來的。RapidMiner是世界領(lǐng)先的數(shù)據(jù)挖掘解決方案,它以工作流的方式支持各種類型的數(shù)據(jù)挖掘任務(wù)。耶魯大學(xué)已將RapidMiner成功地應(yīng)用在許多不同的應(yīng)用領(lǐng)域,包括文本挖掘,多媒

2、體挖掘,功能設(shè)計,數(shù)據(jù)流挖掘,集成開發(fā)的方法和分布式數(shù)據(jù)挖掘。本實驗將根據(jù)一組人的經(jīng)濟統(tǒng)計數(shù)據(jù),試圖發(fā)現(xiàn)不同特征間的關(guān)聯(lián)。原始數(shù)據(jù)如下表所示,列出了三個人的特征:是否有車、是否住宿舍公寓、是否住別墅、是否是窮人、是否是中產(chǎn)階級、是否是富人。本實驗希望從這些原始數(shù)據(jù)中發(fā)現(xiàn)這些不同特征間的關(guān)聯(lián)規(guī)則,例如“窮人是否一定不住別墅”、“富人是否一定有車”等。圖3.2-1 實驗使用的原始數(shù)據(jù)【實驗內(nèi)容】使用RapidMiner工具對給定的數(shù)據(jù)進行關(guān)聯(lián)規(guī)則挖掘?qū)嶒?。通過實驗,掌握關(guān)聯(lián)規(guī)則挖掘的原理及RapidMiner工具的用法?!緦嶒炛笇?dǎo)】進入Windows實驗臺,打開RapidMiner工具一 創(chuàng)建新工

3、程點擊New進入RapidMiner 5主界面,準備創(chuàng)建新工程,界面如下圖:圖3.2-2 準備創(chuàng)建新工程二 導(dǎo)入待處理數(shù)據(jù)在左側(cè)的Repository Access下面找到Retrieve組件,將其拖到Process區(qū),如下圖所示:圖3.2-3 新建數(shù)據(jù)訪問結(jié)點選中Retrieve結(jié)點,在右側(cè)的repository entry處,單擊打開文件圖標,選擇Transactions數(shù)據(jù)表后點擊OK,如下圖所示:圖3.2-4 選擇導(dǎo)入的數(shù)據(jù)點擊菜單中的保存按鈕,保存當(dāng)前工程,會彈出如下圖所示的提示框來選擇保存位置,例如選擇“NewLocalRepository”,保存為test,然后點擊OK完成保存。

4、圖3.2-5 保存當(dāng)前工程三 對原始數(shù)據(jù)進行二值化在左側(cè)的Data Transformation下面的Type Conversion下找到Nominal to Binominal組件,將其拖到Process區(qū),并用鼠標從Retrieve結(jié)點右側(cè)的out處畫線到Nominal to Binominal左側(cè)的exa處(畫線方法:在起點按下鼠標不放,移動到終點后松開鼠標),看到提示后點Ok,選中Nominal to Binominal,然后在右側(cè)勾選“transform binominal”,如下圖:圖3.2-6 增加二值化數(shù)據(jù)轉(zhuǎn)換結(jié)點四 按屬性過濾在左側(cè)的Data Transformation下面

5、的Attribute Set Reduction and Transformation下的Select下找到Select Attributes組件,將其拖到Process區(qū),并保證Nominal to Binominal右側(cè)的exa連接到Select Attributes左側(cè)的exa處,然后在右側(cè)選擇過濾類型為“regular_expression”,regular expression處填寫“.*true.*”,如下圖:圖3.2-7增加屬性過濾結(jié)點五 生成頻繁子項,為關(guān)聯(lián)規(guī)則生成做準備在左側(cè)的Modeling下面的Association and Item Set Mining下的FP-Gro

6、wth組件,將其拖到Process區(qū),并用鼠標從Select Attributes結(jié)點右側(cè)的exa處畫線到FP-Growth左側(cè)的exa處,看到提示后點Ok,如下圖:圖3.2-8 增加頻繁子項生成結(jié)點六 生成關(guān)聯(lián)規(guī)則在左側(cè)的Modeling下面的Association and Item Set Mining下的Create Association Rules組件,將其拖到Process區(qū),并用鼠標從FP-Growth結(jié)點右側(cè)的fre處畫線到Create Association Rules左側(cè)的ite處,看到提示后點Ok,如下圖:圖3.2-9 增加關(guān)聯(lián)規(guī)則生成結(jié)點七 運行工程點擊菜單中的運行按鈕,看到提示框后一路點Yes,可看到下圖的運行結(jié)果頁面。圖3.2-10 運行結(jié)果界面切換到“AssociationRules(Create Association Rules)”頁面,可以看到從原始數(shù)據(jù)中挖掘出的各條關(guān)聯(lián)規(guī)則。例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論