apriori關(guān)聯(lián)分析matlab實(shí)現(xiàn)_第1頁(yè)
apriori關(guān)聯(lián)分析matlab實(shí)現(xiàn)_第2頁(yè)
apriori關(guān)聯(lián)分析matlab實(shí)現(xiàn)_第3頁(yè)
apriori關(guān)聯(lián)分析matlab實(shí)現(xiàn)_第4頁(yè)
apriori關(guān)聯(lián)分析matlab實(shí)現(xiàn)_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、apriori關(guān)聯(lián)分析matlab實(shí)現(xiàn)一、實(shí)驗(yàn)?zāi)康耐ㄟ^(guò)實(shí)驗(yàn),加深數(shù)據(jù)挖掘中一個(gè)重要方法關(guān)聯(lián)分析的認(rèn)識(shí),其經(jīng)典算法為apriori算法,了解影響apriori算法性能的因素,掌握基于apriori算法理論的關(guān)聯(lián)分析的原理和方法。二、實(shí)驗(yàn)內(nèi)容對(duì)一數(shù)據(jù)集用apriori算法做關(guān)聯(lián)分析,用matlab實(shí)現(xiàn)。三、方法手段關(guān)聯(lián)規(guī)則挖掘的一個(gè)典型例子是購(gòu)物籃分析。市場(chǎng)分析員要從大量的數(shù)據(jù)中發(fā)現(xiàn)顧客放入其購(gòu)物籃中的不同商品之間的關(guān)系。如果顧客買牛奶,他也購(gòu)買面包的可能性有多大?什么商品組或集合顧客多半會(huì)在一次購(gòu)物時(shí)同時(shí)購(gòu)買?例如,買牛奶的顧客有80%也同時(shí)買面包,或買鐵錘的顧客中有70%的人同時(shí)也買鐵釘,這就

2、是從購(gòu)物籃數(shù)據(jù)中提取的關(guān)聯(lián)規(guī)則。分析結(jié)果可以幫助經(jīng)理設(shè)計(jì)不同的商店布局。一種策略是:經(jīng)常一塊購(gòu)買的商品可以放近一些,以便進(jìn)一步刺激這些商品一起銷售,例如,如果顧客購(gòu)買計(jì)算機(jī)又傾向于同時(shí)購(gòu)買財(cái)務(wù)軟件,那么將硬件擺放離軟件陳列近一點(diǎn),可能有助于增加兩者的銷售。另一種策略是:將硬件和軟件放在商店的兩端,可能誘發(fā)購(gòu)買這些商品的顧客一路挑選其他商品。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫(kù)中數(shù)據(jù)項(xiàng)之間存在的潛在關(guān)系的規(guī)則,形式為AA.AnBB.B,其中A(i,1,2.,m),A(j,1,2.,n)是數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng).12m12nij數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)規(guī)則即根據(jù)一個(gè)事務(wù)中某些項(xiàng)的出現(xiàn),可推導(dǎo)出另一些項(xiàng)在同一事務(wù)中也出現(xiàn)。四、A

3、priori算法算法描述Apriori算法的第一步是簡(jiǎn)單統(tǒng)計(jì)所有含一個(gè)元素的項(xiàng)集出現(xiàn)的頻率,來(lái)決定最大的一維項(xiàng)目集。在第k步,分兩個(gè)階段,首先用一函數(shù)sc_candidate(候選),通過(guò)第(kT)步中生成的最大項(xiàng)目集來(lái)生成侯選項(xiàng)目集Ck。然后搜索數(shù)據(jù)庫(kù)計(jì)算侯選項(xiàng)目集Ck的支持度.為k-1kk了更快速地計(jì)算C中項(xiàng)目的支持度,文中使用函數(shù)count_support計(jì)算支持度。kApriori算法描述如下:C=candidate1-itemsets;L二cWC|c.count三minsupport;for(k=2,L工,k+)/直到不能再生成最大項(xiàng)目集為止k-1C=sc_candidate(L);

4、/生成含k個(gè)元素的侯選項(xiàng)目集kk-1foralltransactionstD/辦理處理Ct=count_support(C,t);/包含在事務(wù)t中的侯選項(xiàng)目集kforallcandidatescCtc.count=c.count+1;nextL二cWC|c.count三minsupport;kknextresultset二resultsetULk其中,D表示數(shù)據(jù)庫(kù);minsupport表示給定的最小支持度;resultset表示所有最大項(xiàng)目集。Sc_candidate函數(shù)該函數(shù)的參數(shù)為L(zhǎng),即:所有最大k-1維項(xiàng)目集,結(jié)果返回含有k個(gè)項(xiàng)目的侯選項(xiàng)目集k-1C。事實(shí)上,C是k維最大項(xiàng)目集的超集,通

5、過(guò)函數(shù)count_support計(jì)算項(xiàng)目的支持度,然后kk生成Lko該函數(shù)是如何完成這些功能的,詳細(xì)說(shuō)明如下:首先,通過(guò)對(duì)Lk自連接操作生成C,,稱join(連接)步,該步可表述為:TOC o 1-5 h zk-1kinsertintoCkselectP.item,P.item,.,P.item,Q.itemfromLP,LQ12k-1k-1k-1k-1whereP.item=Q.item,.,P.item=Q.item,P.item:SIIIRT-:由L掃描R甘毎十咲赴計(jì)砍加.祐更持度中數(shù)小”121ill,13211-151M2tJ.1)2f氐聞g1邸2-gJ冋丿141-*克持坨:汗瞰121

6、2|3:13)3比盤兗:逢選工站應(yīng)卄抵比棟倏迭文持汝計(jì)蛛龍持度訂魏I2j13.152空持度訂數(shù)“+13412.134壯;15213.152A工好空葉救minsup*M)%小于支持度的項(xiàng)為不頻繁數(shù),將刪除,大于的保留Cp=Li;p=p+1;endendy=C;functiony=gen_rule(C)%apriori算法規(guī)則判斷是否產(chǎn)生k-候選項(xiàng)集if(isempty(Cl)%判斷C是否為空M,N=size(C);m,n=size(C1);temp1=C;L=cell(1);fori=1:Mtemp2i=temp1in;temp1in=;endp=1;fori=1:Mforj=i+1:Mif(i

7、sequal(temp1i,temp1j)%判斷前k-1項(xiàng)候選集是否相等Lp=cell_union(Ci,temp2j);%若相等,則增加至k-項(xiàng)集p=p+1;endendendy=L;elsey=cell(1);%否則y返回空end%functiony=Sc_candidate(C)%產(chǎn)生2-項(xiàng)候選集函數(shù)C=C;%轉(zhuǎn)置m,n=size(C);bcount=zeros(m*(m-1)/2,1);L=cell(m*(m-1)/2,1);p=1;fori=1:m-1%注意forj=i+1:mLp=cell_union(Ci,Cj);%產(chǎn)生2-項(xiàng)候選集p=p+1;endendy=L;functiony=count_support(L,X,minsup)%找出符合大于支持度sup的候選集,L為候選集,X為總數(shù)據(jù)集endy=C;endy=C;%統(tǒng)計(jì)頻繁項(xiàng)m,n=size(L);M,N=size(X);count=zeros(m,1);fori=1:mforj=1:Mif(ismember(Li,Xj)cou

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論