數(shù)據(jù)挖掘教程:關(guān)聯(lián)規(guī)則_第1頁
數(shù)據(jù)挖掘教程:關(guān)聯(lián)規(guī)則_第2頁
數(shù)據(jù)挖掘教程:關(guān)聯(lián)規(guī)則_第3頁
數(shù)據(jù)挖掘教程:關(guān)聯(lián)規(guī)則_第4頁
數(shù)據(jù)挖掘教程:關(guān)聯(lián)規(guī)則_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)聯(lián)

報(bào)告人:熊赟

內(nèi)容概要

基本概念

其他

Apriori算法

關(guān)聯(lián)規(guī)則分類FP-Growth算法第3章關(guān)聯(lián)

3.1基本概念3.2原理3.3核心算法3.4其他

自然界中某種事物發(fā)生時(shí)其他事物也會(huì)發(fā)生的這樣一種聯(lián)系稱之為關(guān)聯(lián)。反映事件之間依賴或關(guān)聯(lián)的知識(shí)稱為關(guān)聯(lián)型知識(shí)(又稱依賴關(guān)系)。(?)定義3.1:關(guān)聯(lián)是兩個(gè)或多個(gè)變量取值之間存在的一類重要的可被發(fā)現(xiàn)的某種規(guī)律性。關(guān)聯(lián)可分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。

基本概念

關(guān)聯(lián)分析目的是尋找給定數(shù)據(jù)記錄集中數(shù)據(jù)項(xiàng)之間隱藏的關(guān)聯(lián)關(guān)系,描述數(shù)據(jù)之間的密切度。關(guān)聯(lián)分析的結(jié)果常有兩種:

關(guān)聯(lián)規(guī)則和序列模式。關(guān)聯(lián)規(guī)則用于尋找在同一個(gè)事件中出現(xiàn)的不同項(xiàng)的相關(guān)性;序列模式與此類似,但它尋找的是事件之間時(shí)間上的相關(guān)性。

關(guān)聯(lián)分析

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的主要對(duì)象是交易型數(shù)據(jù)庫,一個(gè)交易一般由交易處理時(shí)間,一組顧客購(gòu)買的物品,有時(shí)也有顧客標(biāo)識(shí)號(hào)(如信用卡號(hào))組成。定義3.2:關(guān)聯(lián)規(guī)則是描述在一個(gè)交易中物品之間同時(shí)出現(xiàn)的規(guī)律的知識(shí)模式,更確切的說,關(guān)聯(lián)規(guī)則是通過量化的數(shù)字描述物品X的出現(xiàn)對(duì)物品Y的出現(xiàn)有多大的影響。

關(guān)聯(lián)規(guī)則

以零售業(yè)為例,體育用品商場(chǎng)通過對(duì)銷售數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析通??梢园l(fā)現(xiàn)這些數(shù)據(jù)中常常隱含形式如下的規(guī)律——“購(gòu)買籃球的顧客中有70%的人同時(shí)購(gòu)買籃球運(yùn)動(dòng)服,所有交易中有40%的人同時(shí)購(gòu)買籃球和籃球運(yùn)動(dòng)服”等等。這些規(guī)律即關(guān)聯(lián)規(guī)則。

關(guān)聯(lián)規(guī)則定義3.3:關(guān)聯(lián)規(guī)則挖掘的交易數(shù)據(jù)集記為D(一般為交易數(shù)據(jù)庫),D={T1,T2,…,Tk,…,Tn},Tk(k=1,2,…,n)稱為交易,對(duì)應(yīng)每一個(gè)交易有唯一的標(biāo)識(shí),記作TID。元素im(m=1,2,…,p)稱為項(xiàng)。設(shè)I={i1,i2,…,im}是D中全體項(xiàng)組成的集合,且Tk

I。交易號(hào)(TID)

項(xiàng)集合(Itemsets)

T100I1,I2,I5T200I2,I4T300I2,I3T400I1,I2,I4T500I1,I3設(shè)X是一個(gè)I中項(xiàng)的集合,如果X

Tk,那么稱交易Tk包含項(xiàng)集X。若X,Y為項(xiàng)集,X

I,Y

I,并且X

Y=

,則形如X==>Y的表達(dá)式稱為關(guān)聯(lián)規(guī)則。

關(guān)聯(lián)規(guī)則形式化定義置信度支持度

關(guān)聯(lián)規(guī)則度量規(guī)則X

Y在交易數(shù)據(jù)集D中的置信度是對(duì)關(guān)聯(lián)規(guī)則準(zhǔn)確度的衡量。度量關(guān)聯(lián)規(guī)則的強(qiáng)度。即在所有出現(xiàn)了X的活動(dòng)中出現(xiàn)Y的頻率,即規(guī)則X

Y的必然性有多大。記為confidence(X

Y)。計(jì)算方法:包含X和Y的交易數(shù)與包含X的交易數(shù)之比:confidence(X

Y)=P(Y∣X)=|{T:X

Y

T,T

D}|/|{T:X

T,T

D}|×100%規(guī)則X

Y在交易數(shù)據(jù)集D中的支持度是對(duì)關(guān)聯(lián)規(guī)則重要性的衡量,反映關(guān)聯(lián)是否是普遍存在的規(guī)律,說明這條規(guī)則在所有交易中有多大的代表性。即在所有交易中X與Y同時(shí)出現(xiàn)的頻率記為:support(X

Y)。計(jì)算方法:交易數(shù)據(jù)集中同時(shí)包含X和Y的交易數(shù)與所有交易數(shù)之比:support(X

Y)=P(X∪Y)=|{T:X

Y

T,T

D}|/|D|×100%(其中|D|是交易數(shù)據(jù)集D中的所有交易數(shù))最小置信度閾值最小支持度閾值同時(shí)滿足最小置信度閾值和最小支持度閾值的關(guān)聯(lián)規(guī)則為強(qiáng)關(guān)聯(lián)規(guī)則,是有意義有價(jià)值。

關(guān)聯(lián)規(guī)則度量

在給定一個(gè)交易數(shù)據(jù)集D,挖掘關(guān)聯(lián)規(guī)則問題就是產(chǎn)生支持度和置信度分別大于用戶給定的最小支持度閾值和最小置信度閾值的關(guān)聯(lián)規(guī)則。

關(guān)聯(lián)規(guī)則度量經(jīng)常使用的“支持度-可信度”的框架。這樣的結(jié)構(gòu)有時(shí)會(huì)產(chǎn)生一些錯(cuò)誤的結(jié)果。例:假設(shè)體育類用品零售商調(diào)查了10000名顧客在購(gòu)買什么商品,得到的結(jié)果是6000名顧客購(gòu)買籃球,7500名顧客購(gòu)買足球,4000名顧客購(gòu)買籃球、足球。設(shè)最小支持度為30%,最小置信度為60%,可得到如下的關(guān)聯(lián)規(guī)則:籃球足球(支持度=40%,置信度為66%)

這條規(guī)則其實(shí)是錯(cuò)誤的,因?yàn)橘?gòu)買足球的比例是75%,甚至大于66%。

關(guān)聯(lián)規(guī)則度量描述了對(duì)于關(guān)聯(lián)規(guī)則(X==>Y)在沒有任何條件影響時(shí),Y在所有交易中出現(xiàn)的頻率有多大。即沒有X的作用下,Y本身的支持度。

期望可信度改善度描述X的出現(xiàn)對(duì)Y的出現(xiàn)影響多大,是置信度與期望可信度的比值。

P(Y|X)/P(Y)

關(guān)聯(lián)規(guī)則度量興趣度?(置信度-支持度)/Max{置信度,支持度}一條規(guī)則的興趣度大于0,實(shí)際利用價(jià)值越大;小于0則實(shí)際利用價(jià)值越小。名稱描述公式置信度X出現(xiàn)的前提下,Y出現(xiàn)的頻率P(Y|X)支持度X、Y同時(shí)出現(xiàn)的頻率

P(X∩Y)期望可信度

Y出現(xiàn)的頻率

P(Y)改善度

置信度對(duì)期望可信度的比值

P(Y|X)/P(Y)

關(guān)聯(lián)規(guī)則度量找出所有具有最小支持度的項(xiàng)集(頻繁項(xiàng)集)。用Apriori、FP-Growth等算法來找出頻繁項(xiàng)集。使用頻繁項(xiàng)集生成期望的關(guān)聯(lián)規(guī)則對(duì)于每一個(gè)頻繁項(xiàng)集l,找出其中所有的非空子集;然后,對(duì)于每一個(gè)這樣的子集a,如果support(l)與support(a)的比值大于最小可信度,則存在規(guī)則a==>(l-a)。挖掘交易數(shù)據(jù)庫D中所有關(guān)聯(lián)規(guī)則的問題可以被劃分為兩個(gè)子問題:找出頻繁項(xiàng)集--Apriori算法

Apriori性質(zhì)

Apriori算法基本思想交易號(hào)項(xiàng)集合T100I1,I2,I5T200I2,I4T300I2,I3T400I1,I2,I4T500I1,I3T600I2,I3T700I1,I3T800I1,I2,I3,I5T900I1,I2,I3表1交易數(shù)據(jù)庫D

例:找出頻繁項(xiàng)集--Apriori算法項(xiàng)集支持度計(jì)數(shù){I1}6{I2}7{I3}6{I4}2{I5}2項(xiàng)集支持度計(jì)數(shù){I1}6{I2}7{I3}6{I4}2{I5}2C1L1掃描D,對(duì)每個(gè)候選計(jì)數(shù)比較候選支持度計(jì)數(shù)與最小支持度計(jì)數(shù)找出頻繁1-項(xiàng)集的集合L1找出頻繁項(xiàng)集--Apriori算法例:最小支持度閾值為2項(xiàng)集支持度計(jì)數(shù){I1}6{I2}7{I3}6{I4}2{I5}2項(xiàng)集{I1,I2}{I1,I3}{I1,I4}{I1,I5}{I2,I3}{I2,I4}{I2,I5}{I3,I4}{I3,I5}{I4,I5}L1C2由L1產(chǎn)生候選C2Lk-1用于產(chǎn)生候選Ck

找出頻繁項(xiàng)集--Apriori算法連接&剪枝項(xiàng)集支持度計(jì)數(shù){I1,I2}4{I1,I3}4{I1,I4}1{I1,I5}2{I2,I3}4{I2,I4}2{I2,I5}2{I3,I4}0{I3,I5}1{I4,I5}0項(xiàng)集支持度計(jì)數(shù){I1,I2}4{I1,I3}4{I1,I5}2{I2,I3}4{I2,I4}2{I2,I5}2C2L2比較候選支持度計(jì)數(shù)與最小支持度計(jì)數(shù)掃描D,對(duì)每個(gè)候選計(jì)數(shù)項(xiàng)集支持度計(jì)數(shù){I1,I2}4{I1,I3}4{I1,I5}2{I2,I3}4{I2,I4}2{I2,I5}2L2項(xiàng)集{I1,I2,I3}{I1,I2,I5}由L2產(chǎn)生候選C3C3連接&剪枝連接:C3=L2∞L2={{I1,I2},{I1,I3},{I1,I5},{I2,I3},{I2,I4},{I2,I5}}∞{{I1,I2},{I1,I3},{I1,I5},{I2,I3},{I2,I4},{I2,I5}}={{I1,I2,I3},{I1,I2,I5},{I1,I3,I5},{I2,I3,I4},{I2,I3,I4},{I2,I3,I5},{I2,I4,I5}}剪枝:{I1,I2,I3}的2-項(xiàng)子集是{I1,I2},{I1,I3}和{I2,I3}。{I1,I2,I3}的所有2-項(xiàng)子集都是L2的元素。因此,保留{I1,I2,I3}在C3中。{I2,I3,I5}的2-項(xiàng)子集是{I2,I3},{I2,I5}和{I3,I5}。{I3,I5}不是L2的元素,因而不是頻繁的。因此,由C3中刪除{I2,I3,I5}。剪枝后C3={{I1,I2,I3},{I1,I2,I5}}。

項(xiàng)集支持度計(jì)數(shù){I1,I2,I3}2{I1,I2,I5}2C3掃描D,對(duì)每個(gè)候選計(jì)數(shù)比較候選支持度計(jì)數(shù)與最小支持度計(jì)數(shù)項(xiàng)集支持度計(jì)數(shù){I1,I2,I3}2{I1,I2,I5}2L3對(duì)每個(gè)交易,使用subset函數(shù)找出交易中是候選的所有子集,并對(duì)每個(gè)這樣的候選累加計(jì)數(shù),所有滿足最小支持度的候選形成頻繁項(xiàng)集L。

輸入:交易數(shù)據(jù)庫D;最小支持度閾值min_sup。輸出:D中的頻繁項(xiàng)集L。方法:(1)找頻繁項(xiàng)集1-項(xiàng)集;(2)apriori_gen(Lk-1,min_sup)函數(shù)做兩個(gè)動(dòng)作:連接和剪枝。用于在第k-1次遍歷中生成的Lk-1生成Ck(3)由Ck生成Lk

Apriori算法詳述

子集函數(shù)Subset

?子集函數(shù)Subset用于確定在一個(gè)給定的交易t中包含了哪些Ck中的項(xiàng)。候選集Ck被存放在一棵hash樹中,hash樹中的結(jié)點(diǎn)分為兩類:一類包含一個(gè)項(xiàng)集列表(葉結(jié)點(diǎn)),另一類包含一張hash表(內(nèi)部結(jié)點(diǎn))。在內(nèi)部結(jié)點(diǎn)上,hash表中的每一個(gè)桶都指向另一個(gè)結(jié)點(diǎn)。假定hash樹的根結(jié)點(diǎn)的深度等于1,則一個(gè)深度為d的內(nèi)部結(jié)點(diǎn)指向深度為d+1的結(jié)點(diǎn)。項(xiàng)集都存放在葉子結(jié)點(diǎn),當(dāng)需要添加一個(gè)項(xiàng)集c的時(shí)候,就從根結(jié)點(diǎn)出發(fā)直到葉子結(jié)點(diǎn)。在一個(gè)深度為d的內(nèi)部結(jié)點(diǎn),對(duì)該項(xiàng)集的第d項(xiàng)應(yīng)用hash函數(shù)來確定下一步遍歷的分支。所有的結(jié)點(diǎn)最初都被創(chuàng)建為葉子結(jié)點(diǎn)。當(dāng)一個(gè)葉子結(jié)點(diǎn)的項(xiàng)集數(shù)目超出某一個(gè)閾值時(shí),該結(jié)點(diǎn)將會(huì)轉(zhuǎn)化為一個(gè)內(nèi)部結(jié)點(diǎn)。從根結(jié)點(diǎn)開始,子集函數(shù)按照如下的方式找出包含在交易t中的所有的候選集。如果在葉子結(jié)點(diǎn),找出該葉子結(jié)點(diǎn)中所有包含在交易t中的項(xiàng)集,并且為它們添加一個(gè)指向結(jié)果集的索引;如果通過散列第i項(xiàng)到達(dá)某個(gè)內(nèi)部結(jié)點(diǎn),則散列交易t中第i項(xiàng)后的每一項(xiàng),并且將這個(gè)過程遞歸地應(yīng)用于相應(yīng)的桶。對(duì)于根結(jié)點(diǎn),則散列交易t中的每一項(xiàng)。子集函數(shù)能夠返回所需要的候選集的索引,對(duì)于任何交易t中包含的項(xiàng)集c,c的第一個(gè)項(xiàng)一定出現(xiàn)在t中。在根結(jié)點(diǎn),通過散列交易t中的每一項(xiàng),我們能夠確定只忽略那些不是從t中的某一項(xiàng)開始的項(xiàng)集。同樣的結(jié)論也適用于hash樹中位于其他層次的結(jié)點(diǎn)。由于在每一個(gè)項(xiàng)集中的項(xiàng)都經(jīng)過排序,如果我們通過散列項(xiàng)i到達(dá)當(dāng)前的結(jié)點(diǎn),則以后只需要考慮交易t中出現(xiàn)在項(xiàng)i后的項(xiàng)。

Apriori算法詳述(續(xù))1.基于劃分的方法2.基于散列的方法3.基于采樣的方法4.交易壓縮方法

(不包含任何k項(xiàng)集的交易不可能包含k+1項(xiàng)集)

Apriori算法優(yōu)化D中交易將D劃分成n部分找出局部每一部分頻繁項(xiàng)集(1次掃描)結(jié)合局部頻繁項(xiàng)集形成候選項(xiàng)集第1遍在候選項(xiàng)集中找出全局頻繁項(xiàng)集(1次掃描)D中頻繁項(xiàng)集第2遍基于劃分的方法桶地址0123456桶記數(shù)2242244桶內(nèi)容{I1,I4}{I3,I5}{I1,I5}{I1,I5}{I2,I3}{I2,I3}{I2,I3}{I2,I3}{I2,I4}{I2,I4}{I2,I5}{I2,I5}{I1,I2}{I1,I2}{I1,I2}{I1,I2}{I1,I3}{I1,I3}{I1,I3}{I1,I3}基于散列技術(shù)壓縮候選k-項(xiàng)集Ck使用散列函數(shù)h(x,y)=(orderofx)*10+(orderofy))mod7創(chuàng)建散列表候選2項(xiàng)集的散列表步驟:a.

對(duì)于每個(gè)頻繁項(xiàng)集l,找出l的所有非空子集;b.對(duì)于l的每個(gè)非空子集a,如果

support_count(l)/support_count(a)≥min_conf,則輸出規(guī)則“a=>(l-a)”。頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則例:假定數(shù)據(jù)包含頻繁集l={I1,I2,I5},L的非空子集有{I1,I2},{I1,I5},{I2,I5},{I1},{I2},和{I5}。可以由l產(chǎn)生的關(guān)聯(lián)規(guī)則:

I1

I2

I5,confidence=2/4=50%;

I1

I5

I2,confidence=2/2=100%;

I2

I5

I1,confidence=2/2=100%;

I1

I2

I5,confidence=2/6=33%;

I2

I1

I5,confidence=2/7=29%;

I5

I1

I2,confidence=2/2=100%;若最小置信度閾值為70%,則只有I1

I5

I2,I2

I5

I1,I5

I1

I2可輸出,是強(qiáng)關(guān)聯(lián)規(guī)則不需要生成大量候選項(xiàng)集的頻繁項(xiàng)集挖掘。算法采用分而治之的策略。頻繁模式增長(zhǎng)(FP-Growth)算法例:最小支持度閾值為3交易編號(hào)所有購(gòu)物項(xiàng)(排序后的)頻繁項(xiàng)100f,a,c,d,g,i,m,pf,c,a,m,p200a,b,c,f,l,m,of,c,a,b,m300b,f,h,j,of,b400b,c,k,s,pc,b,p500a,f,c,e,l,p,m,nf,c,a,m,pFP-Growth算法例null{}b:1f:3c:1b:1p:1f:1c:1m:1p:1a:1a:2b:1m:1f:2c:2a:3f:4c:3m:2p:21.f,c,a,m,p2.f,c,a,b,m3.f,b4.c,b,p5.f,c,a,m,pFP-Growth算法例生成的FP樹

FP-Growth算法例節(jié)點(diǎn)鏈性質(zhì)對(duì)任意頻繁項(xiàng)ai,順著ai的節(jié)點(diǎn)鏈,從ai的頭開始,可以找到包含ai的所有頻繁模式。項(xiàng)條件模式庫條件FP樹p{(f:2,c:2,a:2,m:2),(c:1,b:1)}{(c:3)}|pm{(f:4,c:3,a:3,m:2),(f:4,c:3,a:3,b:1,m:1)}{(f:3,c:3,a:3)}|mb{(f:4,c:3,a:3,b:1),(f:4,b:1),(c:1,b:1)}φa{(f:3,c:3)}{(f:3,c:3)}|ac{(f:3)}{(f:3)}|cfφφ包含m的所有頻繁模式的集合有:{(m:3),(am:3),(cm:3),(fm:3),(cam:3),(fam:3),(fcam:3),(fcm:3)}。這表明對(duì)一個(gè)單獨(dú)路徑的FP樹進(jìn)行挖掘時(shí),可以通過輸出該路徑上所有項(xiàng)的組合來實(shí)現(xiàn)。FP-Growth算法例前綴路徑性質(zhì)為計(jì)算路徑p上的一個(gè)節(jié)點(diǎn)ai的頻繁模式,只需要計(jì)算p中ai的前綴子樹,并且前綴子樹中的每個(gè)節(jié)點(diǎn)的頻繁數(shù)和節(jié)點(diǎn)ai相同。

FP-Growth算法詳述引理:片段增長(zhǎng)假設(shè)α是DB中的一個(gè)項(xiàng)集,B是α的一個(gè)條件模式庫,β是B中的一個(gè)項(xiàng)集,那么,α∪β在DB中的支持度和β在B中的支持度是相同的。推論:模式增長(zhǎng)假設(shè)α是DB中的一個(gè)頻繁項(xiàng)集,B是α的條件模式庫,β是B中的一個(gè)項(xiàng)集。當(dāng)且僅當(dāng)β在B中是頻繁時(shí),α∪β在DB中才是頻繁的。

FP-Growth算法詳述引理單路徑FP樹的模式生成假設(shè)一個(gè)FP樹T,只有一條路徑P,通過列舉P的子路徑的所有組合,可以得到T的頻繁模式全集,它們的支持度等價(jià)于子路徑中的所有項(xiàng)的最小支持度。

FP-Growth算法詳述算法2:在FP樹中挖掘頻繁模式輸入:用DB根據(jù)算法1構(gòu)造的FP樹和最小支持度閾值ξ;輸出:所有的頻繁模式的集合;方法:調(diào)用FP-Growth(FP-Tree,null);

ProcedureFP-Growth(Tree,α){(1)if(Tree只包含單路徑P)then(2) 對(duì)路徑P中節(jié)點(diǎn)的每個(gè)組合(記為β)(3) 生成模式β∪α,支持?jǐn)?shù)=β中所有節(jié)點(diǎn)的最小支持度(4)else對(duì)Tree頭上的每個(gè)ai,do{(5) 生成模式β=ai∪α,支持度=ai.support;(6) 構(gòu)造β的條件模式庫和β的條件FP樹Treeβ;(7) ifTreeβ≠φ(8)

thencallFP-Growth(Treeβ,β)}}FP-Growth算法詳述1.簡(jiǎn)單關(guān)聯(lián)規(guī)則單維、單層、布爾型關(guān)聯(lián)規(guī)則2.量化關(guān)聯(lián)規(guī)則3.多維關(guān)聯(lián)規(guī)則4.跨層關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則分類籃球=>籃球服,只涉及到用戶購(gòu)買的物品性別=“女”=>平均收入=2300,涉及的收入是數(shù)值類型性別=“男”=>購(gòu)買=“籃球”,涉及兩個(gè)維

Adidas籃球=>Nike籃球服同層關(guān)聯(lián)規(guī)則層間關(guān)聯(lián)規(guī)則籃球=>Nike籃球服挖掘量化關(guān)聯(lián)規(guī)則數(shù)值字段根據(jù)數(shù)據(jù)的分布分成布爾字段每個(gè)布爾字段都表示一個(gè)數(shù)值字段的區(qū)間,落在其中則為1,反之為0。這種分法是動(dòng)態(tài)的。得出的規(guī)則稱布爾量化關(guān)聯(lián)規(guī)則。使用預(yù)定義的概念分層對(duì)量化屬性離散化如年齡的概念分層可以分為區(qū)間,“20..24”,“25..29”,“35..39”等替換原來的數(shù)值。得出的規(guī)則也叫做靜態(tài)量化關(guān)聯(lián)規(guī)則。數(shù)值字段被分成一些能體現(xiàn)含義的區(qū)間,緊扣區(qū)間數(shù)據(jù)的語義??紤]數(shù)據(jù)點(diǎn)之間的距離因素。得出的規(guī)則稱基于距離的關(guān)聯(lián)規(guī)則。直接用數(shù)值字段中的原始數(shù)據(jù)進(jìn)行分析根據(jù)數(shù)據(jù)的分布對(duì)數(shù)值字段的值進(jìn)行分析,數(shù)值屬性動(dòng)態(tài)離散化,以滿足某種挖掘標(biāo)準(zhǔn),如最大化所挖掘的規(guī)則的置信度。該策略將數(shù)值屬性的值處理成量,而不是預(yù)定義的區(qū)間或分類。得出的規(guī)則稱量化關(guān)聯(lián)規(guī)則。

挖掘量化關(guān)聯(lián)規(guī)則挖掘量化關(guān)聯(lián)規(guī)則體育類商品球類運(yùn)動(dòng)服類輔助用品類籃球足球Adidas………Nike………籃球服足球服……

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論