版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、apriori關(guān)聯(lián)分析matlab實(shí)現(xiàn)一、實(shí)驗(yàn)?zāi)康耐ㄟ^(guò)實(shí)驗(yàn),加深數(shù)據(jù)挖掘中一個(gè)重要方法關(guān)聯(lián)分析的認(rèn)識(shí),其經(jīng)典算法為apriori算法,了解影響apriori算法性能的因素,掌握基于apriori算法理論的關(guān)聯(lián)分析的原理和方法。二、實(shí)驗(yàn)內(nèi)容對(duì)一數(shù)據(jù)集用apriori算法做關(guān)聯(lián)分析,用matlab實(shí)現(xiàn)。三、方法手段關(guān)聯(lián)規(guī)則挖掘的一個(gè)典型例子是購(gòu)物籃分析。市場(chǎng)分析員要從大量的數(shù)據(jù)中發(fā)現(xiàn)顧客放入其購(gòu)物籃中的不同商品之間的關(guān)系。如果顧客買牛奶,他也購(gòu)買面包的可能性有多大?什么商品組或集合顧客多半會(huì)在一次購(gòu)物時(shí)同時(shí)購(gòu)買?例如,買牛奶的顧客有80%也同時(shí)買面包,或買鐵錘的顧客中有70%的人同時(shí)也買鐵釘,這就
2、是從購(gòu)物籃數(shù)據(jù)中提取的關(guān)聯(lián)規(guī)則。分析結(jié)果可以幫助經(jīng)理設(shè)計(jì)不同的商店布局。一種策略是:經(jīng)常一塊購(gòu)買的商品可以放近一些,以便進(jìn)一步刺激這些商品一起銷售,例如,如果顧客購(gòu)買計(jì)算機(jī)又傾向于同時(shí)購(gòu)買財(cái)務(wù)軟件,那么將硬件擺放離軟件陳列近一點(diǎn),可能有助于增加兩者的銷售。另一種策略是:將硬件和軟件放在商店的兩端,可能誘發(fā)購(gòu)買這些商品的顧客一路挑選其他商品。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫(kù)中數(shù)據(jù)項(xiàng)之間存在的潛在關(guān)系的規(guī)則,形式為AA.AnBB.B,其中A(i,1,2.,m),A(j,1,2.,n)是數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng).12m12nij數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)規(guī)則即根據(jù)一個(gè)事務(wù)中某些項(xiàng)的出現(xiàn),可推導(dǎo)出另一些項(xiàng)在同一事務(wù)中也出現(xiàn)。四、A
3、priori算法算法描述Apriori算法的第一步是簡(jiǎn)單統(tǒng)計(jì)所有含一個(gè)元素的項(xiàng)集出現(xiàn)的頻率,來(lái)決定最大的一維項(xiàng)目集。在第k步,分兩個(gè)階段,首先用一函數(shù)sc_candidate(候選),通過(guò)第(kT)步中生成的最大項(xiàng)目集來(lái)生成侯選項(xiàng)目集Ck。然后搜索數(shù)據(jù)庫(kù)計(jì)算侯選項(xiàng)目集Ck的支持度.為k-1kk了更快速地計(jì)算C中項(xiàng)目的支持度,文中使用函數(shù)count_support計(jì)算支持度。kApriori算法描述如下:C=candidate1-itemsets;L二cWC|c.count三minsupport;for(k=2,L工,k+)/直到不能再生成最大項(xiàng)目集為止k-1C=sc_candidate(L);
4、/生成含k個(gè)元素的侯選項(xiàng)目集kk-1foralltransactionstD/辦理處理Ct=count_support(C,t);/包含在事務(wù)t中的侯選項(xiàng)目集kforallcandidatescCtc.count=c.count+1;nextL二cWC|c.count三minsupport;kknextresultset二resultsetULk其中,D表示數(shù)據(jù)庫(kù);minsupport表示給定的最小支持度;resultset表示所有最大項(xiàng)目集。Sc_candidate函數(shù)該函數(shù)的參數(shù)為L(zhǎng),即:所有最大k-1維項(xiàng)目集,結(jié)果返回含有k個(gè)項(xiàng)目的侯選項(xiàng)目集k-1C。事實(shí)上,C是k維最大項(xiàng)目集的超集,通
5、過(guò)函數(shù)count_support計(jì)算項(xiàng)目的支持度,然后kk生成Lko該函數(shù)是如何完成這些功能的,詳細(xì)說(shuō)明如下:首先,通過(guò)對(duì)Lk自連接操作生成C,,稱join(連接)步,該步可表述為:TOC o 1-5 h zk-1kinsertintoCkselectP.item,P.item,.,P.item,Q.itemfromLP,LQ12k-1k-1k-1k-1whereP.item=Q.item,.,P.item=Q.item,P.item:SIIIRT-:由L掃描R甘毎十咲赴計(jì)砍加.祐更持度中數(shù)小”121ill,13211-151M2tJ.1)2f氐聞g1邸2-gJ冋丿141-*克持坨:汗瞰121
6、2|3:13)3比盤兗:逢選工站應(yīng)卄抵比棟倏迭文持汝計(jì)蛛龍持度訂魏I2j13.152空持度訂數(shù)“+13412.134壯;15213.152A工好空葉救minsup*M)%小于支持度的項(xiàng)為不頻繁數(shù),將刪除,大于的保留Cp=Li;p=p+1;endendy=C;functiony=gen_rule(C)%apriori算法規(guī)則判斷是否產(chǎn)生k-候選項(xiàng)集if(isempty(Cl)%判斷C是否為空M,N=size(C);m,n=size(C1);temp1=C;L=cell(1);fori=1:Mtemp2i=temp1in;temp1in=;endp=1;fori=1:Mforj=i+1:Mif(i
7、sequal(temp1i,temp1j)%判斷前k-1項(xiàng)候選集是否相等Lp=cell_union(Ci,temp2j);%若相等,則增加至k-項(xiàng)集p=p+1;endendendy=L;elsey=cell(1);%否則y返回空end%functiony=Sc_candidate(C)%產(chǎn)生2-項(xiàng)候選集函數(shù)C=C;%轉(zhuǎn)置m,n=size(C);bcount=zeros(m*(m-1)/2,1);L=cell(m*(m-1)/2,1);p=1;fori=1:m-1%注意forj=i+1:mLp=cell_union(Ci,Cj);%產(chǎn)生2-項(xiàng)候選集p=p+1;endendy=L;functiony=count_support(L,X,minsup)%找出符合大于支持度sup的候選集,L為候選集,X為總數(shù)據(jù)集endy=C;endy=C;%統(tǒng)計(jì)頻繁項(xiàng)m,n=size(L);M,N=size(X);count=zeros(m,1);fori=1:mforj=1:Mif(ismember(Li,Xj)cou
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 變更合同模板轉(zhuǎn)讓協(xié)議2024年
- 山西餐飲業(yè)勞動(dòng)合同格式
- 正規(guī)采購(gòu)合同協(xié)議書
- 2024年租田協(xié)議書文本示例
- 建筑項(xiàng)目勘察合同樣本:文本修訂建議
- 無(wú)錫市房地產(chǎn)抵押(按揭)合同格式
- 娛樂(lè)場(chǎng)所室內(nèi)裝飾設(shè)計(jì)合同范本
- 農(nóng)業(yè)旅游項(xiàng)目投資合同參考格式
- 產(chǎn)品營(yíng)銷合同案例
- 二手機(jī)械設(shè)備買賣協(xié)議
- 2024年四川省德陽(yáng)市旌陽(yáng)區(qū)小升初語(yǔ)文試卷
- 辦公大樓消防演練方案
- 江蘇省徐州市銅山區(qū)2023-2024學(xué)年八年級(jí)上學(xué)期期中質(zhì)量自測(cè)英語(yǔ)試題
- 甲狀腺術(shù)后淋巴漏護(hù)理
- 食品安全事故處置規(guī)章制度
- 解讀退役軍人安置條例制定微課
- DL 5190.2-2019 電力建設(shè)施工技術(shù)規(guī)范 第2部分:鍋爐機(jī)組
- 年產(chǎn)500萬(wàn)只塑料包裝袋(厚度不低于0.025毫米)生產(chǎn)線建設(shè)項(xiàng)目環(huán)評(píng)報(bào)告書
- 《SYB創(chuàng)業(yè)培訓(xùn)》實(shí)操沙盤Ⅰ
- 洗碗外包合同
- 研學(xué)車輛安全責(zé)任協(xié)議書
評(píng)論
0/150
提交評(píng)論