關(guān)聯(lián)規(guī)則簡介與Apriori算法課件_第1頁
關(guān)聯(lián)規(guī)則簡介與Apriori算法課件_第2頁
關(guān)聯(lián)規(guī)則簡介與Apriori算法課件_第3頁
關(guān)聯(lián)規(guī)則簡介與Apriori算法課件_第4頁
關(guān)聯(lián)規(guī)則簡介與Apriori算法課件_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)聯(lián)規(guī)則簡介關(guān)聯(lián)規(guī)則簡介與Apriori算法關(guān)聯(lián)規(guī)則簡介關(guān)聯(lián)規(guī)則丶關(guān)聯(lián)規(guī)則(Associationrules)反映一個事物與其他事物之間的相互依存性和關(guān)聯(lián)性。如果兩個或者多個事物之間存在一定的關(guān)聯(lián)關(guān)系,那么,其中個事物就能夠通過其他事物預(yù)測到。首先被Agrawal,mielinskiandswan在1993年的SIGMOD會議上提出關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中最活躍的硏究方法之·典型的關(guān)聯(lián)規(guī)則發(fā)現(xiàn)問題是對超市中的購物籃數(shù)據(jù)(MarketBasket)進(jìn)行分析。通過發(fā)現(xiàn)顧客放入購物籃中的不同商品之間的關(guān)系來分析顧客的購買習(xí)慣。案例“尿布與啤酒”的故事丶美國的沃爾瑪超市對一年多的原始交易數(shù)據(jù)進(jìn)行了詳細(xì)的分析,得到一個意外發(fā)現(xiàn):與尿布一起被購買最多的商品竟然是啤酒。借助于數(shù)據(jù)倉庫和關(guān)聯(lián)規(guī)則,商家發(fā)現(xiàn)了這個隱藏在背后的事實(shí):美國的婦女們經(jīng)常會囑咐她們的丈夫下班以后要為孩子買尿布,而30%40%的丈夫在買完尿布之后又要順便購買自己愛喝的啤酒。有了這個發(fā)現(xiàn)后超市調(diào)整了貨架的設(shè)置,把尿布和啤酒擺放在一起銷售,從而大大增加了銷售額。關(guān)聯(lián)規(guī)則丶關(guān)聯(lián)規(guī)則(Associationrules)反映一個事物與其他事物之間的相互依存性和關(guān)聯(lián)性。如果兩個或者多個事物之間存在一定的關(guān)聯(lián)關(guān)系,那么,其中個事物就能夠通過其他事物預(yù)測到。首先被Agrawal,mielinskiandswan在1993年的SIGMOD會議上提出關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中最活躍的硏究方法之·典型的關(guān)聯(lián)規(guī)則發(fā)現(xiàn)問題是對超市中的購物籃數(shù)據(jù)(MarketBasket)進(jìn)行分析。通過發(fā)現(xiàn)顧客放入購物籃中的不同商品之間的關(guān)系來分析顧客的購買習(xí)慣。案例“尿布與啤酒”的故事丶美國的沃爾瑪超市對一年多的原始交易數(shù)據(jù)進(jìn)行了詳細(xì)的分析,得到一個意外發(fā)現(xiàn):與尿布一起被購買最多的商品竟然是啤酒。借助于數(shù)據(jù)倉庫和關(guān)聯(lián)規(guī)則,商家發(fā)現(xiàn)了這個隱藏在背后的事實(shí):美國的婦女們經(jīng)常會囑咐她們的丈夫下班以后要為孩子買尿布,而30%40%的丈夫在買完尿布之后又要順便購買自己愛喝的啤酒。有了這個發(fā)現(xiàn)后超市調(diào)整了貨架的設(shè)置,把尿布和啤酒擺放在一起銷售,從而大大增加了銷售額。案例70%購買了牛奶的顧客將傾向于同時購買面包某網(wǎng)上書店向用戶推薦相關(guān)書籍互聯(lián)網(wǎng):碎片化生喧嘩一一網(wǎng)絡(luò)時代的字化生存淺:互網(wǎng)如長理論2.0(超經(jīng)世導(dǎo)是平的南的常識李開案例在買了一臺PC之后下一步會購買?!□■《出RFH>TH無所案例在保險業(yè)務(wù)方面,如果出現(xiàn)了不常見的索賠要求組合,則可能為欺詐,需要作進(jìn)一步的調(diào)查在醫(yī)療方面,可找出可能的治療組合;在銀行方面,對顧客進(jìn)行分析,可以推薦感興趣的服務(wù)等等關(guān)聯(lián)規(guī)則基本模型什么是規(guī)則?規(guī)則形如"如果..那么..(Gf6hen)",前者為條件,后者為結(jié)果。例如一個顧客,如果買了可樂,那么他也會購買果汁。如何來度量一個規(guī)則是否夠好?有兩個量,置信度(Confidence)和支持度(Support。假設(shè)有如下表的購買記錄關(guān)聯(lián)規(guī)則基本模型置信度顧客項(xiàng)日橙汁,可樂2牛奶,橙汁,空氣清潔器橙汁,洗潔精橙汁,洗潔精,可樂空氣清潔器置信度表示了這條規(guī)則有多大程度上值得可信。設(shè)條件的項(xiàng)的集合為A,結(jié)果的集合為B。置信度計算在A中,同時也含有B的概率(即:A,thenb的概。即Confidence(A→B=PBA。例如計算“如果Orange則Coke"的置信度。由于在含有“橙汁”的4條交易中,僅有2條交易含有“可樂”。其置信度為0.5。關(guān)聯(lián)規(guī)則基本模型支持度顧客項(xiàng)日橙汁,可樂2牛奶,橙汁,空氣清潔器345橙汁,洗潔精橙汁,洗潔精,可樂空氣清潔器支持度計算在所有的交易集中,既有A又有B的概率。例如在5條記錄中,既有橙汁又有可樂的記錄有2條。則此條規(guī)則的支持度為25=04,即Support(A→B=P(AB現(xiàn)在這條規(guī)則可表述為,如果一個顧客購買了橙汁,則有50%(置信度)的可能購買可樂。而這樣的情況(即買了橙汁會再買可樂)會有40%(支持度)的可能發(fā)生。關(guān)聯(lián)規(guī)則的相關(guān)概念定義1項(xiàng)目與項(xiàng)集設(shè)|={i1,i2,,im}是m個不同項(xiàng)目的集

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論