數(shù)據(jù)挖掘?qū)д摰诹轮形拇鸢竉第1頁(yè)
數(shù)據(jù)挖掘?qū)д摰诹轮形拇鸢竉第2頁(yè)
數(shù)據(jù)挖掘?qū)д摰诹轮形拇鸢竉第3頁(yè)
數(shù)據(jù)挖掘?qū)д摰诹轮形拇鸢竉第4頁(yè)
數(shù)據(jù)挖掘?qū)д摰诹轮形拇鸢竉第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第六章數(shù)據(jù)挖掘?qū)д?。對(duì)于每個(gè)下列問題,提供一個(gè)關(guān)聯(lián)規(guī)則的一個(gè)例子 從市場(chǎng)購(gòu)物籃域,滿足下列條件。同樣, 這些規(guī)則是主觀地描述是否有趣。(一)一個(gè)規(guī)則,具有較高的支持和高的信心。也包含金槍魚。這種低規(guī)則往往是無(wú)趣的(c) 一個(gè)規(guī)則,低的支持和信心不足。答:食用油-T洗衣粉。如此低的信心規(guī)則往往是無(wú)趣的。(d) 規(guī)則,低支持和高的信心。答:伏特加-T魚子醬。這樣的規(guī)則往往是有趣的2??紤]到數(shù)據(jù)集顯示于表格6.1。(一)計(jì)算支持項(xiàng)集 e , b、d , b、d、e 通過治療每個(gè)事務(wù)ID作為一個(gè)市場(chǎng)購(gòu)物籃。答:鞏卩衛(wèi))趴e)10= 0.8Table 6.11. Example of market b

2、asket transactionsCiisttJincT IDTraiMattion IDtemB Bought10001a, d,e10024at20012同20031口心曲:即3001530022仏吐40029訶40040口:以50033a,50038碼札電(b) Use the results in part (a) to compute the con fide nee for the associati on rules b,d -e and e -b,d. Is con fide nee a symmetricmeasure?(1如果C、重復(fù)部分(一)通過將每個(gè)客戶ID作為一個(gè)市

3、場(chǎng)購(gòu)物籃。每個(gè)項(xiàng)目應(yīng)被視為一個(gè)二進(jìn)制變量一個(gè)項(xiàng)目出現(xiàn)在至少有一個(gè)交易購(gòu)買的顧客,和0否則。)5(&“) = 7 = 1ff(fr,-dTe j = = 0.80.8Te沒有明顯關(guān)系s1,s2,c1和c23.(a) Wliat 諒 the confidcnT! for The* nilcs 0 *and A * 0?Answer:* A)=* A).氓片 一 0 = 100%,(Ij) Jxt ci, , and 即 hr the confidf-nrc vrihiE cf th*1 rules? p q: p -y, r, and r : rctjpcctivvly Lf wc assume

4、thatct and eg have different values, wbit are the possible relationships thnt rviy( xist ainong 口.血:and cj? Vhih ruk has tho Iowcst coiifilciirei1 Answer;_嚇沖_ 4p)_ 盯puqur)d _-叮pugur) MpUh)Considering s(p) s(j? U q1) 就卩U U r)Thus; ul X c2 屁 cU 上 c2.Th強(qiáng)refhiT c2 ha the lowest coiifidencc.(f) Reprat th

5、e aruilysis in part (b) fvsNiimiiig that the rules h-avf1 idrinical tupperl. Which rule has the liighcst cDtifidciice?Answer:C-tmsidrnng 鼠 pU sp U U rbut s(p) ff(p U r JThus; c3 (cl = c2)所以c2有最低的置信度(d) railsltiAit y;呂口卩pose the cxjnhdence ot tire rides 2? anil JJ Cjuq larger than some t.hrrshold. mi

6、ncQv f. Ts it poFsible that A C has A cotiftdcnoe kss than mi neon J ?Answer:YeSt It iids on the supjK)rt of items .4T J3* and C fFur example:s(A?B) = 60% s(A) = 90%s(AtC) = 20% s(B) = 70%= 50% s(C) = 60VCLet miTicoii f = 50V(- Vheretoreic(A 一 E)三 66% vmnecm fc(2J C) = 7196 minconfBut c(A -* G) = 22

7、$t maXSSB)一個(gè) 因此 Z ( A 、B ) Z ( A,B,C )(b)is tioti-monotone. We can show this by comparing 丹(4 _B) against 玳A,臥Cmin (U U) jC(B玳的0】=(GQmhi (訊5C)max(睜,s(B) I= min (c(4/? * C)tc(AC 8)( fJC 4)_.廣(/LEO) KA、BQ 就乩母(&民G)max兇.4. ?)h i 扎(7),亂”,CJ)Sine j(j4.Z?_(7) (.4. !?).觀A, C). $(/?,(?) max(s(j4)j j(B),thtre

8、fbn?叩攵(7卜)cii be gTcatrr than or less thj】A, ?y).Tkncp. the nicasuTP is non-monotone.Let Mr) = max( Au,-血)*c(fc 占*缶川n)(必屮1= max 3Z?)T ct B A)=T 幣LFF)_棗B)裁7)/!?. C= max (亡(良BC).c(D 一 AC),cC AB)(.?)(m、c)i(i. b, cn.= max (L.:L)s(A)孔用)x(C) J=gg營(yíng)和Since 以 C) l)4 4(5), tf(C) Ai),*- c(Ai + 朋、 - Ajt_i 4*)如/)

9、maxA)和4* 131成ZG)nifLx c(AZ? * (7). cBC * A)s(A,i. C s(4. Z?. C) s(4, C)s (A4 B, G)uun(0(4siZ?, C1)因?yàn)?s(A,B,C)w s(A,B)和最小(s(A,B),s(A,C),s(B,C)F min(s(個(gè)),s(B),s(C) min(s(個(gè)),s(B)n A,B,C )可以大于或小于 n ( A、B )。因此,這些措施是單調(diào)。丘苦慮衣&23申顯示的腳物籃事務(wù).購(gòu)儒BS 務(wù)東符ID燉衣項(xiàng)1I中附,am.2彳冊(cè)蝕.前邀.辛想!伴集尿布”桝于斗irSk.黃站+ tW-Fl5誘千.際布|壓牛粒尿布.面鋰.

10、莒湘d7(rWG-直柚,罠有I8(V,廉布9ITW揮析.齒阿,膚曲10|W.常干從遠(yuǎn)些散鉗中,能夠提収出的洪載規(guī)則的嚴(yán)丸數(shù)常是苓弘瓷包括寧支訴度的甥則)?(b) 能騙餐耿的碩諾項(xiàng)輿的最大KJ度是第少(假徒最小支持度0) ?寫用城謹(jǐn)數(shù)據(jù)集中能第提戦的弘項(xiàng)集的最大數(shù)盤的表達(dá)武Cd)找岀一嚇貝有最人支持廢的攻集(怏度為2取定人人(e)栽出對(duì)項(xiàng)口和乩 桂得規(guī)則時(shí)世和(OfR具冇相同的習(xí)儲(chǔ)度*(一)的最大數(shù)量,可以提取關(guān)聯(lián)規(guī)則 從這個(gè)數(shù)據(jù)(包括規(guī)則,零支持)? 答:有六項(xiàng)數(shù)據(jù)集。因此總 規(guī)則的數(shù)量是602。(b) 什么是頻繁項(xiàng)集的最大大小,可以提取 (假設(shè)用來 0)?答:因?yàn)樽铋L(zhǎng)的事務(wù)包含4項(xiàng),最大 頻

11、繁項(xiàng)集的大小是4。(c) 編寫一個(gè)表達(dá)式最大數(shù)量的大小3項(xiàng)集可以源自這個(gè)數(shù)據(jù)集。(d) 找到itemset(大小為2或更大),擁有最大的支持。答:面包、黃油。(e) 找到一雙項(xiàng)目,a和b,這樣的規(guī)則 一 - p b 和 b -t一有同樣的信心。答:(啤酒餅干)或(面包、黃油)。7.FUn的頻繁王項(xiàng)集前集合上仏2Qh【h2,4hh2h 仏兒4人1,3.5, (2. 3t 4(t 2.3T 5)t 3.4,5假宦數(shù)掘噪中只有S個(gè)項(xiàng)*W 列出采用耳昭】合井策略,由候選產(chǎn)性過程得到的所有條選4填集(h)列出由閱如 育法的候選嚴(yán)生過程驚到的所有候選弘項(xiàng)集.(c) 列HM加I體袪候逸剪枝歩后剩下的所冇帳選

12、4怖如(h) Li對(duì) all randi1冋 br4, r?23a,42 g和5lh嶺町*6佝7k, gM上,】9gs0佝叫(1) a(fl*6-24J9i示數(shù)戦集的廈集格=用卜商的學(xué)毋標(biāo)記格中毎個(gè)鰭雖. Z如果諫頂集裱祖翳洙認(rèn)為不是攸選項(xiàng)集n 牛垣樂不是候選項(xiàng)集仔兩種 訶能的滋因:它沒打在恢選型集產(chǎn)丄步姿產(chǎn)生或它在幌選項(xiàng)集產(chǎn)牛步驟產(chǎn)生. 但是由于它的-個(gè)子媒足非頻懐的而在候選頊棄明枝加驟被丟毎* F;如果14帳選壩集敬勿總加算法認(rèn)為星預(yù)第的。 t:如果絵過支持度訓(xùn)馥肩該候選頊康被發(fā)現(xiàn)是非頻瀟的.m #繁項(xiàng)集的白分比是事少F 考慮蒂中所有的項(xiàng)慄)比例的頻繁項(xiàng)集=16/32 = 50.0%(包括null 設(shè)置)(C)對(duì)F常數(shù)握負(fù)月嚴(yán)ii?r池笛剪枝卓是導(dǎo)少?剪軸率足文為宙于如卜原兇認(rèn) 是候述向項(xiàng)集所占的門份比:在候施項(xiàng)蟲產(chǎn)生時(shí)竜被聲主嘆在倏選割峨毎殊雄忑掉JX6.9L5.E457Figure2 A

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論