數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則實(shí)驗(yàn)報(bào)告_第1頁(yè)
數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則實(shí)驗(yàn)報(bào)告_第2頁(yè)
數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則實(shí)驗(yàn)報(bào)告_第3頁(yè)
數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則實(shí)驗(yàn)報(bào)告_第4頁(yè)
數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則實(shí)驗(yàn)報(bào)告_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上實(shí)驗(yàn)七 關(guān)聯(lián)規(guī)則1. 實(shí)驗(yàn)?zāi)繕?biāo)使用SSAS進(jìn)行關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)2. 實(shí)驗(yàn)要求(1)按“實(shí)驗(yàn)內(nèi)容”完成操作,并記錄實(shí)驗(yàn)步驟;(2)回答“問(wèn)題討論”中的思考題,并寫(xiě)出本次實(shí)驗(yàn)的心得體會(huì);(3)完成實(shí)驗(yàn)報(bào)告。3. 實(shí)驗(yàn)內(nèi)容生成市場(chǎng)籃方案。Adventure Works 的市場(chǎng)部希望改進(jìn)公司的網(wǎng)站以促進(jìn)越區(qū)銷(xiāo)售。在更新網(wǎng)站之前,需要根據(jù)客戶(hù)的在線購(gòu)物籃中已有的其他產(chǎn)品創(chuàng)建一個(gè)可預(yù)測(cè)客戶(hù)購(gòu)買(mǎi)需求的數(shù)據(jù)挖掘模型。這些預(yù)測(cè)還有助于市場(chǎng)部將可能被集中購(gòu)買(mǎi)的項(xiàng)統(tǒng)一放置在網(wǎng)站的一個(gè)位置上。通過(guò)實(shí)驗(yàn),創(chuàng)建關(guān)聯(lián)規(guī)則模型,可預(yù)測(cè)可能出現(xiàn)在購(gòu)物籃中的其他項(xiàng)或客戶(hù)想要放入購(gòu)物籃的項(xiàng)。4. 實(shí)驗(yàn)步驟

2、(1) 創(chuàng)建市場(chǎng)籃挖掘模型結(jié)構(gòu) 1. 在 Business Intelligence Development Studio 的解決方案資源管理器中,右鍵單擊“挖掘結(jié)構(gòu)”,再選擇“新建挖掘結(jié)構(gòu)”。此時(shí),系統(tǒng)將打開(kāi)數(shù)據(jù)挖掘向?qū)А?. 在“歡迎使用數(shù)據(jù)挖掘向?qū)А表?yè)上,單擊“下一步”。3. 在“選擇定義方法”頁(yè)上,確保已選中“從現(xiàn)有關(guān)系數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)”,再單擊“下一步”。4. 在“選擇數(shù)據(jù)挖掘技術(shù)”頁(yè)的“您要使用何種數(shù)據(jù)挖掘技術(shù)?”下,選中“Microsoft 關(guān)聯(lián)規(guī)則”,再單擊“下一步”?!斑x擇數(shù)據(jù)源視圖”頁(yè)隨即顯示。 默認(rèn)情況下,“可用數(shù)據(jù)源視圖”下的 Adventure Works DW 為選

3、中狀態(tài)。 5. 單擊“下一步”。6. 在“指定表類(lèi)型”頁(yè)上,選中 vAssocSeqOrders 表旁的“事例”復(fù)選框,選中 vAssocSeqLineItems 表旁邊的“嵌套”復(fù)選框,再單擊“下一步”(注意先在視圖中建立兩個(gè)表之間的關(guān)聯(lián))。7. 在“指定定型數(shù)據(jù)”頁(yè)上,依次清除 CustomerKey 旁邊的“鍵”復(fù)選框和 LineNumber 旁邊的“鍵”和“輸入”復(fù)選框。8. 選中 Model 列旁邊的“鍵”和“可預(yù)測(cè)”復(fù)選框。 然后,系統(tǒng)也將自動(dòng)選中“輸入”復(fù)選框。9. 單擊“下一步”。10. 在“指定列的內(nèi)容和數(shù)據(jù)類(lèi)型”頁(yè)上,單擊“下一步”。11. 在“完成向?qū)А表?yè)的“挖掘結(jié)構(gòu)名稱(chēng)

4、”中,鍵入 Association。12. 在“挖掘模型名稱(chēng)”中,鍵入 Association,再單擊“完成”。(2) 調(diào)整關(guān)聯(lián)模型的參數(shù)和處理關(guān)聯(lián)模型在處理上一個(gè)任務(wù)中與“關(guān)聯(lián)”挖掘結(jié)構(gòu)一起創(chuàng)建的初始挖掘模型之前,必須更改以下兩個(gè)參數(shù)的默認(rèn)值:Support 和 Probability。Support 定義規(guī)則被視為有效前必須存在的事例百分比。Probability 定義關(guān)聯(lián)被視為有效前必須存在的可能性。調(diào)整關(guān)聯(lián)模型的參數(shù)步驟如下:1. 打開(kāi)數(shù)據(jù)挖掘設(shè)計(jì)器的“挖掘模型”選項(xiàng)卡。2. 右鍵單擊設(shè)計(jì)器網(wǎng)格中的“關(guān)聯(lián)”列,然后選擇“設(shè)置算法參數(shù)”。 系統(tǒng)將打開(kāi)“算法參數(shù)”對(duì)話框。3. 在“算法參數(shù)

5、”對(duì)話框的“值”列中,設(shè)置以下參數(shù):MINIMUM_PROBABILITY = 0.1MINIMUM_SUPPORT = 0.014. 單擊“確定”。處理關(guān)聯(lián)模型步驟如下:1. 在 Business Intelligence Development Studio 的“挖掘模型”菜單上,選擇“處理挖掘結(jié)構(gòu)和所有模型”。系統(tǒng)將打開(kāi)“處理挖掘結(jié)構(gòu) - 關(guān)聯(lián)”對(duì)話框。 2. 單擊“運(yùn)行”。系統(tǒng)將打開(kāi)“處理進(jìn)度”對(duì)話框,以顯示有關(guān)模型處理的信息。模型處理可能需要一些時(shí)間,具體時(shí)間取決于您的計(jì)算機(jī)。3. 處理完成之后,在“處理進(jìn)度”和“處理挖掘結(jié)構(gòu) - 關(guān)聯(lián)”對(duì)話框中,單擊“關(guān)閉”。(3) 瀏覽市場(chǎng)籃模型

6、 使用數(shù)據(jù)挖掘設(shè)計(jì)器的“挖掘模型查看器”選項(xiàng)卡中的 Microsoft 關(guān)聯(lián)查看器瀏覽該模型。 瀏覽模型時(shí),可以輕松地查看可能同時(shí)出現(xiàn)的產(chǎn)品,并可瀏覽項(xiàng)之間的關(guān)系。 還可以篩選出較弱的關(guān)聯(lián),并對(duì)新浮現(xiàn)的模式有一個(gè)總體的概念。Microsoft 關(guān)聯(lián)查看器包含三個(gè)選項(xiàng)卡:“項(xiàng)集”、“規(guī)則”和“依賴(lài)關(guān)系網(wǎng)絡(luò)”。 “項(xiàng)集”選項(xiàng)卡 “項(xiàng)集”選項(xiàng)卡顯示與 Microsoft 關(guān)聯(lián)算法發(fā)現(xiàn)的項(xiàng)集相關(guān)的三種重要信息:支持度(發(fā)生項(xiàng)集的事務(wù)的數(shù)量)、大?。?xiàng)集中項(xiàng)的數(shù)量)以及項(xiàng)集的實(shí)際構(gòu)成。 根據(jù)算法參數(shù)的設(shè)置方式,算法可以生成大量的項(xiàng)集。 使用“項(xiàng)集”選項(xiàng)卡頂部的控件,可以篩選查看器,使其僅顯示包含指定的最

7、小支持度和項(xiàng)集大小的項(xiàng)集。 也可以使用“篩選項(xiàng)集”框來(lái)篩選查看器中顯示的項(xiàng)集。 例如,若要僅查看包含有關(guān) Mountain-200 自行車(chē)信息的項(xiàng)集,可在“篩選項(xiàng)集”中輸入 Mountain-200。 您將在查看器中看到,只有包含“Mountain-200”字樣的項(xiàng)集被顯示。 查看器中返回的每個(gè)項(xiàng)集都包含有關(guān)銷(xiāo)售 Mountain-200 自行車(chē)事務(wù)的信息。 例如,在“支持度”列中包含值 710 的項(xiàng)集表示:在所有事務(wù)中,710 個(gè)購(gòu)買(mǎi) Mountain-200 自行車(chē)的人也購(gòu)買(mǎi)了 Sport-100 自行車(chē)?!耙?guī)則”選項(xiàng)卡 “規(guī)則”選項(xiàng)卡顯示與算法發(fā)現(xiàn)的規(guī)則相關(guān)的以下信息。· 概率

8、 規(guī)則發(fā)生的可能性。· 重要性 用于度量規(guī)則的有用性,值越高則意味著規(guī)則越有用。 只看概率可能會(huì)產(chǎn)生誤解。 例如,如果每個(gè)事務(wù)都包含一個(gè) x 項(xiàng),規(guī)則 y 預(yù)測(cè) x 發(fā)生的概率為 1,即 x 一定會(huì)發(fā)生。 即使規(guī)則的準(zhǔn)確性很高,但這并未傳達(dá)很多信息,因?yàn)椴还?y 如何,每個(gè)事務(wù)都會(huì)包含 x。· 規(guī)則 規(guī)則的定義。像使用“項(xiàng)集”選項(xiàng)卡一樣,可以篩選規(guī)則,以便僅顯示最關(guān)心的規(guī)則。 例如,如果只想查看包含 Mountain-200 自行車(chē)的規(guī)則,可在“篩選規(guī)則”框中輸入 Mountain-200。 查看器將僅顯示包含“Mountain-200”字樣的規(guī)則。 每條規(guī)則都可以根據(jù)事務(wù)

9、中其他項(xiàng)的發(fā)生情況來(lái)預(yù)測(cè)某個(gè)項(xiàng)的發(fā)生情況。 例如,由第一個(gè)規(guī)則可知:如果一個(gè)人購(gòu)買(mǎi)了 Mountain-200 自行車(chē)和水壺,則此人還會(huì)購(gòu)買(mǎi) Mountain 水壺套的概率為 1?!跋嚓P(guān)性網(wǎng)絡(luò)”選項(xiàng)卡 使用“相關(guān)性網(wǎng)絡(luò)”選項(xiàng)卡,可以研究模型中不同項(xiàng)的交互。 查看器中的每個(gè)節(jié)點(diǎn)表示一個(gè)項(xiàng);例如,Mountain-200 = Existing 節(jié)點(diǎn)表示事務(wù)中存在 Mountain-200。 通過(guò)選擇節(jié)點(diǎn),可以使用選項(xiàng)卡底部的彩色圖例來(lái)確定模型中的項(xiàng)與其他的項(xiàng)的相互確定關(guān)系。滑塊與規(guī)則的概率關(guān)聯(lián)。 上下移動(dòng)滑塊可以篩選出弱關(guān)聯(lián)。 例如,在“顯示”框中,選擇“僅顯示屬性名稱(chēng)”,再單擊 Mountain

10、 Bottle Cage 節(jié)點(diǎn)。 查看器顯示,Mountain 水壺套預(yù)測(cè)了水壺和 Mountain-200 自行車(chē),而水壺和 Mountain-200 自行車(chē)也預(yù)測(cè)了 Mountain 水壺套。 這意味著,這些項(xiàng)有可能同時(shí)在事務(wù)中出現(xiàn)。 也就是說(shuō),如果某個(gè)客戶(hù)購(gòu)買(mǎi)了自行車(chē),則他也可能會(huì)購(gòu)買(mǎi)水壺套和水壺。5. 實(shí)驗(yàn)結(jié)果及問(wèn)題討論(1)根據(jù)實(shí)驗(yàn)結(jié)果給出市場(chǎng)部統(tǒng)一放置在網(wǎng)站的一個(gè)位置上的可能被集中購(gòu)買(mǎi)的項(xiàng)的建議。通過(guò)項(xiàng)集與規(guī)則圖,我們可以看出各商品之間的關(guān)聯(lián)程度,及這種關(guān)聯(lián)程度的可信度,通過(guò)綜合來(lái)達(dá)到相關(guān)聯(lián)商品的相互促銷(xiāo)通過(guò)點(diǎn)擊依賴(lài)關(guān)系網(wǎng)絡(luò)圖中的各項(xiàng),觀察其周?chē)c之相關(guān)的其他項(xiàng)的數(shù)量,數(shù)量越多。說(shuō)明此

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論