大型超市購(gòu)物籃問(wèn)題_第1頁(yè)
大型超市購(gòu)物籃問(wèn)題_第2頁(yè)
大型超市購(gòu)物籃問(wèn)題_第3頁(yè)
大型超市購(gòu)物籃問(wèn)題_第4頁(yè)
大型超市購(gòu)物籃問(wèn)題_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、大型超市“購(gòu)物籃”分析摘要本文通過(guò)對(duì)大型超市“購(gòu)物籃”的分析,運(yùn)用Apriori算法的思想,做出相應(yīng)的改進(jìn),利用支持度和置信度的大小進(jìn)行一定程度的篩選,結(jié)合商品的利潤(rùn)大小,引入促銷系數(shù),通過(guò)促銷系數(shù)的比較,得到科學(xué)的商品組合情況,設(shè)計(jì)一定的商品促銷手段,實(shí)現(xiàn)超市效益的進(jìn)一步增大。 對(duì)于問(wèn)題一,我們參考了一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法Apriori算法。用matlab編程,得到每?jī)蓚€(gè)商品同時(shí)出現(xiàn)的個(gè)數(shù),并求得它們的支持度和相互的置信度,設(shè)定最低支持度為5%,得到符合的兩種商品組合數(shù)為17組。設(shè)定最低置信度為20%,對(duì)17組數(shù)據(jù)進(jìn)行篩選,得到12組商品組合。最后通過(guò)關(guān)聯(lián)密切系數(shù)的大小

2、,得到了12組商品組合彼此關(guān)聯(lián)關(guān)系的密切程度。對(duì)于問(wèn)題二,僅考慮商品支持度的大小,求得在一定最小支持度下被頻繁地同時(shí)購(gòu)買(mǎi)的商品組合。用matlab編程,設(shè)置最小支持度為2.12%,篩選兩個(gè)商品組合時(shí),我們得到了1391種組合方式,在此基礎(chǔ)上篩選三個(gè)商品組合時(shí),我們得到了40種組合方式;再繼續(xù)篩選四個(gè)商品組合得到35種,最后篩選五個(gè)商品得到一種組合,六個(gè)商品組合時(shí)則沒(méi)有出現(xiàn)大于最小支持度的組合方式。因此,我們得到了盡可能多的商品被頻繁同時(shí)購(gòu)買(mǎi)的信息。對(duì)于問(wèn)題三,在結(jié)合商品利潤(rùn)的條件下,引入促銷系數(shù)H,考慮1391個(gè)兩種商品組合中各商品的利潤(rùn)、支持度和置信度,分別計(jì)算出三者的乘積之和進(jìn)行比較。選取

3、促銷系數(shù)H較高的組合商品采取就近擺放、打折促銷、消費(fèi)送禮等捆綁銷售方式得到一種促銷方案,使得超市的效益進(jìn)一步增大。關(guān)鍵詞:購(gòu)物籃分析、Apriori算法、促銷系數(shù)一、問(wèn)題重述作為超市的經(jīng)理,經(jīng)常關(guān)心的問(wèn)題是顧客的購(gòu)物習(xí)慣。他們想知道:“什么商品組或集合顧客多半會(huì)在一次購(gòu)物時(shí)同時(shí)購(gòu)買(mǎi)?”?,F(xiàn)在假設(shè)你們是某超市的市場(chǎng)分析員,已經(jīng)掌握了該超市近一個(gè)星期的所有顧客購(gòu)買(mǎi)物品的清單和相應(yīng)商品的價(jià)格,需要你們給超市經(jīng)理一個(gè)合理的“購(gòu)物籃”分析報(bào)告,并提供一個(gè)促銷計(jì)劃的初步方案。問(wèn)題一: 附件1中的表格數(shù)據(jù)顯示了該超市在一個(gè)星期內(nèi)的4717個(gè)顧客對(duì)999種商品的購(gòu)買(mǎi)記錄,對(duì)數(shù)據(jù)進(jìn)行分析,試建立一種數(shù)學(xué)模型,使

4、該模型能定量表達(dá)超市中多種商品間的關(guān)聯(lián)關(guān)系的密切程度。問(wèn)題二:根據(jù)問(wèn)題1建立的模型,通過(guò)一種快速有效的方法從附件1中的購(gòu)買(mǎi)記錄中分析出哪些商品是最頻繁被同時(shí)購(gòu)買(mǎi)的,找到的最頻繁被同時(shí)購(gòu)買(mǎi)的商品數(shù)量越多越好。問(wèn)題三:附件2給出了這999中商品的對(duì)應(yīng)的利潤(rùn),根據(jù)在問(wèn)題1、問(wèn)題2中建立的模型,設(shè)定一種初步的促銷方案,使超市的效益進(jìn)一步增大。二、模型的假設(shè)1、假設(shè)各個(gè)商品的利潤(rùn)保持不變。2、假設(shè)表格中的數(shù)據(jù)能真實(shí)地反映當(dāng)?shù)叵M(fèi)者的購(gòu)物情況。3、假設(shè)短時(shí)間內(nèi)商品的銷售情況維持穩(wěn)定,不會(huì)出現(xiàn)大幅波動(dòng)。三、符號(hào)說(shuō)明符號(hào)解釋說(shuō)明si組合i的支持度c(A=>B)規(guī)則A=>B的置信度c(B=>A

5、)規(guī)則B=>A的置信度ci 組合i的平均置信度smin最小支持度cmin最小置信度關(guān)聯(lián)密切系數(shù)H促銷系數(shù)四、問(wèn)題分析本題是關(guān)于大型超市“購(gòu)物籃”的分析問(wèn)題,涉及到數(shù)據(jù)挖掘、關(guān)聯(lián)規(guī)則等相關(guān)問(wèn)題。本題的三個(gè)問(wèn)題是層層遞進(jìn)的關(guān)系,要求通過(guò)對(duì)商品購(gòu)買(mǎi)數(shù)據(jù)的分析,找到關(guān)聯(lián)程度較高且購(gòu)買(mǎi)次數(shù)較高的商品,最后設(shè)計(jì)出合理的超市促銷方案。問(wèn)題一,由于購(gòu)物籃分析是關(guān)聯(lián)規(guī)則挖掘的一個(gè)典型案例,因此我們采用一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法Apriori算法。利用其基本思想,進(jìn)行了商品兩種之間的支持度和置信度計(jì)算,在定義最小支持度和最小置信度后,進(jìn)行篩選得到關(guān)聯(lián)規(guī)則集。為定量地表達(dá)超市中多種商品間的關(guān)

6、聯(lián)關(guān)系的密切程度,本文引入一個(gè)關(guān)聯(lián)密切系數(shù)進(jìn)行衡量分別對(duì)12個(gè)組合求解平均置信度,進(jìn)而得到該組的關(guān)聯(lián)密切系數(shù)。由此認(rèn)為,關(guān)聯(lián)密切系數(shù)越大的商品組合,其關(guān)聯(lián)關(guān)系密切程度較高。問(wèn)題二,在得到商品兩種關(guān)聯(lián)數(shù)據(jù)的基礎(chǔ)上,僅考慮商品支持度的大小,求得在一定最小支持度下被頻繁地同時(shí)購(gòu)買(mǎi)的商品組合。同時(shí)為使商品數(shù)量盡量多,我們?cè)趦煞N組合的情況下延伸至三種組合,四種組合以此得到盡可能多的商品被頻繁同時(shí)購(gòu)買(mǎi)的信息,盡量靠近最頻繁被同時(shí)購(gòu)買(mǎi)且商品數(shù)量越多的雙重目標(biāo)。問(wèn)題三,在結(jié)合商品利潤(rùn)的條件下,考慮兩種組合中各商品的利潤(rùn)、支持度和置信度,分別計(jì)算出三者的乘積再求和,記為促銷系數(shù)H,并以此作為衡量此組合商品是否進(jìn)

7、行促銷的標(biāo)準(zhǔn)。當(dāng)結(jié)果較高時(shí),我們就采取就近擺放、打折促銷、消費(fèi)送禮等捆綁銷售方式式得到一種促銷方案,在方便顧客的購(gòu)買(mǎi)的同時(shí),增加消費(fèi)者對(duì)該超市的有好感和信任度,最終使得超市的效益進(jìn)一步增大。五、模型的建立和求解模型一:基于Apriori算法的關(guān)聯(lián)規(guī)則挖掘模型1. 模型的準(zhǔn)備 設(shè): I= i1,i2.,im 是所有項(xiàng)目的集合. D是所有事務(wù)的集合(即數(shù)據(jù)庫(kù)), 每個(gè)事務(wù)T是一些項(xiàng)目的集合, T包含在D中, 每個(gè)事務(wù)可以用唯一的標(biāo)識(shí)符TID來(lái)標(biāo)識(shí).設(shè)X為某些項(xiàng)目的集合,如果X包含在T中,則稱事務(wù)T包含X,關(guān)聯(lián)規(guī)則則表示為如下形式(X包含在T)=>(Y包含在T)的蘊(yùn)涵式,這里X包含在I中, Y

8、包含在I中,并且XY=.其意義在于一個(gè)事務(wù)中某些項(xiàng)的出現(xiàn),可推導(dǎo)出另一些項(xiàng)在同一事務(wù)中也出現(xiàn)(為簡(jiǎn)單化,將(X包含在T)=>(Y包含在T)表示為X=>Y,這里,=> 稱為關(guān)聯(lián)操作,X稱為關(guān)聯(lián)規(guī)則的先決條件,Y稱為關(guān)聯(lián)規(guī)則的結(jié)果). 事務(wù)數(shù)據(jù)庫(kù)D中的規(guī)則X=>Y是由支持度s(support)和置信度c(confidence)約束,置信度表示規(guī)則的強(qiáng)度, 支持度表示在規(guī)則中出現(xiàn)的頻度。數(shù)據(jù)項(xiàng)集X的支持度s(X)是D中包含X的事務(wù)數(shù)量與D的總事務(wù)數(shù)量之比, 但為下文便于敘述, 數(shù)據(jù)項(xiàng)集X的支持度是用數(shù)據(jù)庫(kù)D中包含X的數(shù)量來(lái)表示; 規(guī)則X=>Y的支持度s定義為: 在D中包

9、含XY的事務(wù)所占比例為s%, 表示同時(shí)包含X和Y的事務(wù)數(shù)量與D的總事務(wù)量之比。用該項(xiàng)集出現(xiàn)的次數(shù)除以TID總數(shù)即可得到,用如下公式表示:Support(X)=Count(X)/Count(TID) 規(guī)則X=>Y的置信度c定義為: 在D中,c%的事務(wù)包含X的同時(shí)也包含Y, 表示D中包含X的事務(wù)中有多大可能性包含Y. 依據(jù)所求的頻繁項(xiàng)集,及所求得的支持度,運(yùn)用如下公式求解:Confidence(X=>Y)=Support(XY)/Support(X) 最小支持度閾值minsupport表示數(shù)據(jù)項(xiàng)集在統(tǒng)計(jì)意義上的最低主要性. 最小置信度閾值mincontinence表示規(guī)則的最低可靠性.

10、 如果數(shù)據(jù)項(xiàng)集X滿足X.support>=minsupport, 則X是大數(shù)據(jù)項(xiàng)集. 一般由用戶給定最小置信度閾值和最小支持度閾值.置信度和支持度大于相應(yīng)閾值的規(guī)則稱為強(qiáng)關(guān)聯(lián)規(guī)則, 反之稱為弱關(guān)聯(lián)規(guī)則. 發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的任務(wù)就是從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)那些置信度、支持度大小等于給定值的強(qiáng)壯規(guī)則. 基于上述概念,我們可以很容易得到一些基本結(jié)論: (1) K維數(shù)據(jù)項(xiàng)集XK是頻繁項(xiàng)集的必要條件是它所有K-1維子項(xiàng)集也為頻繁項(xiàng)集,記為XK-1(2) 如果K維數(shù)據(jù)項(xiàng)集XK的任意一個(gè)K-1維子集XK-1,不是頻繁項(xiàng)集,則K維數(shù)據(jù)項(xiàng)集XK本身也不是最大數(shù)據(jù)項(xiàng)集。 (3) XK是K維頻繁項(xiàng)集,如果所有K-1維頻繁項(xiàng)

11、集集合XK-1中包含XK的K-1維子項(xiàng)集的個(gè)數(shù)小于K,則XK不可能是K維最大頻繁數(shù)據(jù)項(xiàng)集。 證明: 很明顯,數(shù)據(jù)項(xiàng)集XK-1:的K-1維子項(xiàng)集的個(gè)數(shù)為K-1。如果高頻繁數(shù)據(jù)項(xiàng)集XK-1,中包含XK的K-1.維子項(xiàng)集的個(gè)數(shù)小于K,則存在XK的K-1維子項(xiàng)集不是頻繁數(shù)據(jù)項(xiàng)集,由結(jié)論(2)知K維數(shù)據(jù)項(xiàng)集本身也不是高頻繁數(shù)據(jù)項(xiàng)集。 2、 模型的建立(1)求關(guān)聯(lián)規(guī)則集第一步:從事務(wù)數(shù)據(jù)庫(kù)D中找出所有支持度不小于指定的最小支持度閾值的頻繁項(xiàng)集。第二步:使用頻繁項(xiàng)集產(chǎn)生所期望的關(guān)聯(lián)規(guī)則,產(chǎn)生關(guān)聯(lián)規(guī)則的基本原則是其置信度不小于指定的最小置信度閾值。第一步的任務(wù)是迅速高效地找出D中全部的頻繁項(xiàng)集,這是關(guān)聯(lián)規(guī)則挖

12、掘的核心問(wèn)題,是衡量關(guān)聯(lián)規(guī)則挖掘算法的標(biāo)準(zhǔn)。對(duì)此,我們運(yùn)用Matlab進(jìn)行編程得出計(jì)算結(jié)果。第二步的求解比較容易和直接,先分別計(jì)算出不小于最小支持度的商品組合對(duì)應(yīng)的置信度,降序后進(jìn)行篩選。最后只留下支持度和置信度都較高的商品組合。此建模過(guò)程可以表示為:圖1 關(guān)聯(lián)規(guī)則挖掘模型示意圖(2) 關(guān)聯(lián)關(guān)系的密切程度表示 對(duì)商品組合數(shù)據(jù)的挖掘結(jié)果進(jìn)行整理,得到關(guān)聯(lián)規(guī)則表格,再利用表格中各商品組合對(duì)應(yīng)的支持度和平均置信度表示組合的關(guān)聯(lián)關(guān)系。例如:在組合i中,有兩個(gè)編號(hào)分別為、的兩個(gè)商品,其支持度為,平均置信度為,則該組合的關(guān)聯(lián)關(guān)系可以表示為().為定量表達(dá)超市中多種商品間的關(guān)聯(lián)關(guān)系的密切程度,我們引入一個(gè)關(guān)

13、聯(lián)密切系數(shù)來(lái)衡量,我們認(rèn)為當(dāng)支持度和置信度分別大于距離最低支持度和最低置信度時(shí),其距離越遠(yuǎn),關(guān)聯(lián)程度越高,于是得到其公式為:其中,為組合i的支持度,為該組合的平均置信度,和分別為該類組合的最小支持度和最小置信度。用圖表示為:圖2 關(guān)聯(lián)密切系數(shù)示意圖將12組商品組合的支持度和平均置信度帶入關(guān)聯(lián)密切系數(shù)的公式中進(jìn)行計(jì)算,將所得數(shù)據(jù)列表降序排列,關(guān)聯(lián)系數(shù)越大的商品組合的關(guān)聯(lián)關(guān)系的密切程度越大。3、 模型的求解對(duì)于問(wèn)題1:(1) 將最小支持度設(shè)定為5%,從4717個(gè)原始數(shù)據(jù)項(xiàng)中得到個(gè)數(shù)為17的頻繁項(xiàng)集。按支持度降序排列后,依次編號(hào),整理得到表1:表1 兩種組合頻繁項(xiàng)集表組合i編號(hào)A編號(hào)B支持度1368

14、5290.07079270923688290.0663416732173680.06167867743684890.06167867753686820.06125476963684190.05701568573689370.05553200583686920.05532005193685100.055108097103689140.054896142115296920.054472234125298290.054048326133687200.0527766144385290.051716829152175290.051292921166928290.051080967174198290.05

15、023315對(duì)由上表得到的數(shù)據(jù),分別計(jì)算各個(gè)組合相互的置信度,并將最小置信度設(shè)定為20%,剔除部分?jǐn)?shù)據(jù)后得到關(guān)聯(lián)規(guī)則集。再對(duì)數(shù)據(jù)列表的s(A=>B)進(jìn)行降序處理,重新編號(hào)后得到表2: 表2 關(guān)聯(lián)規(guī)則表組合i編號(hào)A編號(hào)B支持度s置信度c(A=>B)置信度c(B=>A)12173680.0616786770.3112299470.21748878926928290.0510809670.2960687960.21849501434385290.0517168290.2867215040.2240587742175290.0512929210.2588235290.22222222

16、254198290.050233150.2513255570.2148685463685290.0707927090.2496263080.30670339875296920.0544722340.2359963270.31572481685298290.0540483260.234159780.2311876793688290.066341670.2339312410.283771532103684890.0616786770.2174887890.328442438113686820.0612547690.2159940210.352869353123684190.0570156850.2

17、010463380.285259809 最后留下的12個(gè)支持度和置信度都較高的商品組合即為關(guān)聯(lián)規(guī)則集。(3) 為定量地表達(dá)超市中多種商品間的關(guān)聯(lián)關(guān)系的密切程度,分別對(duì)12個(gè)組合求解平均置信度,進(jìn)而得到該組的關(guān)聯(lián)密切系數(shù)。如表3所示:表3 關(guān)聯(lián)密切評(píng)定表組合i編號(hào)A編號(hào)B支持度平均置信度關(guān)聯(lián)密切系數(shù)12173680.0616786770.2643593680.06541039526928290.0510809670.2572819050.05729210334385290.0517168290.2553901370.05541673742175290.0512929210.2405228760.

18、04054349754198290.050233150.2330970490.0330978763685290.0707927090.2781648530.08088313175296920.0544722340.2758605710.07599228485298290.0540483260.2326737250.03292356793688290.066341670.2588513860.061078113103684890.0616786770.2729656140.073894332113686820.0612547690.2844316870.085178516123684190.05

19、70156850.2431530730.043719648對(duì)于問(wèn)題2:本題要求最頻繁被同時(shí)購(gòu)買(mǎi)、商品數(shù)量越多越好的商品組合。由支持度的定義可知,某商品組合的支持度越高,表示該組合越頻繁被同時(shí)購(gòu)買(mǎi)。我們采用問(wèn)題一中的數(shù)據(jù),將所篩選出的商品種類選出,與上述兩種商品的組合進(jìn)行匹配,去掉重復(fù)項(xiàng),得到三種商品組合,挑選出滿足支持度support的組合。同樣進(jìn)行滿足支持度的四種商品、五種商品、六種商品的選擇依次循環(huán)直到?jīng)]有符合最低支持度的組合程序結(jié)束。以此進(jìn)行matlab編程,見(jiàn)附錄。(1) 我們?cè)O(shè)定support為2.12%,得到1391種組合,在問(wèn)題一中我們列出了其中一些組合。(2) 對(duì)于三種商品組合

20、符合support為2.12%的組合數(shù)為40個(gè),由于版面限制,以下列出頻繁項(xiàng)集為最高的15種組合:表4 三種組合頻繁項(xiàng)集表組合i編號(hào)A編號(hào)B編號(hào)C次數(shù)支持度13684896821240.02628789524135389561220.02586389734245727971160.02459190244135387971150.02437990254135729561140.02416790364137979561140.02416790375387979561140.02416790384134249561130.02395590494138269561120.023743905104245

21、729561120.023743905115387978261110.023531906125388269561110.023531906135727979561110.023531906147978269561110.023531906154135727971100.023319907(3) 四種商品組合有35種,以下頻繁項(xiàng)集為前15種:表5 四種組合頻繁項(xiàng)集表組合i編號(hào)A編號(hào)B編號(hào)C編號(hào)D次數(shù)支持度14134245729561070.02268390924135727979561070.02268390934245727979561070.0226839094413424797956106

22、0.02247191054135387978261060.02247191064135387979561060.02247191074137978269561060.02247191084134245387971050.02225991194134245727971050.022259911104134247978261050.022259911114135385729561050.022259911124135388269561050.022259911134135728269561050.022259911144245385727971050.02225991115538797826956

23、1050.022259911(5) 由編程得出的結(jié)果中,五種商品組合的結(jié)果只有一個(gè)。編號(hào)分別為413、424、538、572、797,重復(fù)次數(shù)為102,支持度為2.12%。六種商品組合沒(méi)有符合的結(jié)果。從五種組合的數(shù)據(jù)來(lái)看,我們有理由認(rèn)為表5中所列出的四種商品組合和編號(hào)分別為413、424、538、572、797的五種組合即為所求的最頻繁被同時(shí)購(gòu)買(mǎi)、商品數(shù)量多的商品組合。在實(shí)際應(yīng)用中,對(duì)于不同的超市,其要求的支持度support不同,可自行設(shè)置。模型二:效益最大化模型1、 模型的建立 為使超市的效益盡可能增大,必須同時(shí)考慮兩個(gè)因素:(1)頻繁被同時(shí)購(gòu)買(mǎi)的商品組合;(2)對(duì)應(yīng)商品組合的利潤(rùn)是否最高

24、。 由第一個(gè)基于Apriori算法的關(guān)聯(lián)規(guī)則挖掘模型可以得到,頻繁被同時(shí)購(gòu)買(mǎi)的兩種商品組合數(shù)據(jù)。為衡量這些組合的效益,本文引入了促銷系數(shù): 其中,為組合i中商品的利潤(rùn)之和。對(duì)于問(wèn)題3:第一步:利益最大化模型只考慮兩種組合的情形,分別計(jì)算表1中17個(gè)組合的促銷系數(shù),并將得到的結(jié)果進(jìn)行降序排列,得到表6:表6 兩種組合促銷系數(shù)表組合編號(hào)A編號(hào)B支持度置信度A=>B置信度B=>A利潤(rùn)和促銷系數(shù)H13685290.0707927090.2496263080.306703398575.9522.683264925296920.0544722340.2359963270.31572481655

25、7.5616.756620133688290.066341670.2339312410.283771532479.6416.4733636443684190.0570156850.2010463380.285259809587.9316.3015810254385290.0517168290.2867215040.22405877559.8214.7881693466928290.0510809670.2960687960.218495014461.2512.1236873475298290.0540483260.234159780.23118767473.7711.9159080484198

26、290.050233150.2513255570.21486854485.7511.3754868393686820.0612547690.2159940210.352869353315.25910.9853873103684890.0616786770.2174887890.328442438296.11889.971005752112173680.0616786770.3112299470.217488789296.11889.656633102122175290.0512929210.2588235290.222222222290.24887.161669045 由上表可以得出,編號(hào)為5

27、29的商品可以和368,692,428,829,217擺放在一起,368可以和529,892,419,682,489,217擺放在一起。為了更好的說(shuō)明商品的擺放順序,作圖2,其中方框中的數(shù)字表示商品編碼,直線上的數(shù)字表示該直線兩端商品組合的促銷系數(shù)。圖2 促銷關(guān)系網(wǎng)絡(luò)示意圖 由圖2可直觀看出,編號(hào)為368的商品應(yīng)優(yōu)先考慮和529擺放一起,再考慮和829一起。編號(hào)為529的商品再和692一起在實(shí)際情況中,即可操作為,將829,368,529,692放在同一貨架上,其他的放在臨近貨架,并根據(jù)實(shí)際情況進(jìn)行調(diào)整。第二步:打折促銷由第一步可以獲得利潤(rùn)高又頻繁被同時(shí)購(gòu)買(mǎi)的商品組合,為方便顧客選購(gòu)?fù)瑫r(shí)提高超

28、市的利潤(rùn)值,我們決定將這些商品組合擺放在相同或相近貨架上,采取“捆綁”銷售的理念,進(jìn)行打折促銷。首先找出符合以下要求的組合:若一個(gè)商品組合中有一個(gè)利潤(rùn)較大,我們可以對(duì)此商品進(jìn)行打折,其他商品價(jià)格不變。經(jīng)過(guò)多次進(jìn)行市場(chǎng)實(shí)踐調(diào)查,得到當(dāng)打折為f(i)的時(shí)候可以得到最大的利潤(rùn),那么f(i)就是我們需要的打折數(shù)據(jù)。以表格X中組合(X,Y)為例,在促銷過(guò)程中,我們可以對(duì)利潤(rùn)較高的編號(hào)為X商品打折f(i),保持Y商品價(jià)格不變。第三步:提高最低消費(fèi)為降低部分顧客只購(gòu)買(mǎi)打折商品的發(fā)生幾率,超市可以先統(tǒng)計(jì)出該購(gòu)物群體絕大多數(shù)的消費(fèi)水平,將其上調(diào)部分后,配合同時(shí)期的打折活動(dòng)推出購(gòu)滿上調(diào)后金額贈(zèng)送小禮品的活動(dòng)。例如

29、該購(gòu)物群體每次消費(fèi)在6080元之間占絕大多數(shù),基于此信息采取購(gòu)滿88元返券、滿88元加1元贈(zèng)送抽紙一包的促銷措施來(lái)提高銷售量;基于大多數(shù)人貪小便宜的消費(fèi)心理,很多消費(fèi)者會(huì)選擇購(gòu)滿88元。這些措施不僅使得顧客的交叉消費(fèi)大為提高,還能提升顧客對(duì)超市的滿意度,增加再次光臨選購(gòu)的幾率。七、模型評(píng)價(jià) 對(duì)于問(wèn)題一的數(shù)據(jù)挖掘問(wèn)題,通過(guò)分析每個(gè)數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),我們采用Apriori算法的思想,經(jīng)過(guò)一定程度的改進(jìn),進(jìn)行了運(yùn)用。 優(yōu)點(diǎn): (1)作為一個(gè)迭代算法,使用Apriori性質(zhì)來(lái)生成候選項(xiàng)集的方法,得到所有大于等于最小支持度的頻繁項(xiàng)目集,大大壓縮了頻繁集的大小,取得了很好的性能。最終得到

30、的程序解決所給問(wèn)題只需40s,而且可以表示出滿足條件的商品個(gè)數(shù)及其種類。有助于超市經(jīng)理進(jìn)行“購(gòu)物籃”分析并做出相應(yīng)的促銷方案。 (2)Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法,改進(jìn)后的Apriori算法更適用于適合事務(wù)數(shù)據(jù)庫(kù)的關(guān)聯(lián)規(guī)則挖掘。 (3)該算法結(jié)構(gòu)簡(jiǎn)單,易于理解,沒(méi)有復(fù)雜的推導(dǎo)。 缺點(diǎn): (1)對(duì)數(shù)據(jù)庫(kù)的掃描次數(shù)過(guò)多。 該算法需要在每進(jìn)行一次迭代的時(shí)候掃描一次數(shù)據(jù)庫(kù),一般挖掘出的最大頻繁項(xiàng)集的長(zhǎng)度為N時(shí),需要掃描N次數(shù)據(jù)庫(kù),而在實(shí)際應(yīng)用中經(jīng)常需要挖掘很長(zhǎng)的模式,多次掃描數(shù)據(jù)庫(kù)帶來(lái)巨大開(kāi)銷,且效率較低。 (2)Apriori 算法可能產(chǎn)生大量的侯選項(xiàng)集。Apri

31、ori算法在迭代過(guò)程中要在內(nèi)存中產(chǎn)生,處理和保存候選頻繁項(xiàng)集,這個(gè)數(shù)量有時(shí)候是非常巨大的,導(dǎo)致算法在廣度和深度上的適應(yīng)性很差。 (3)程序不利于非編程人員的直接調(diào)用和使用。改進(jìn):可以將程序進(jìn)行打包,增加其可視化的方面,利于非編程人員的直接使用對(duì)于問(wèn)題一中關(guān)聯(lián)密切程度系數(shù)公式的引入,我們認(rèn)為它的優(yōu)點(diǎn)是能夠反映支持度越高、置信度越高,則關(guān)聯(lián)密切程度越高。缺點(diǎn)是該公式缺乏一些實(shí)踐檢驗(yàn)。對(duì)于問(wèn)題三的促銷方案,我們引入的促銷系數(shù)綜合權(quán)衡了置信度、支持度和利潤(rùn)對(duì)促銷方案的確定的影響。在一個(gè)商品存在和多種商品同時(shí)關(guān)聯(lián)程度較高時(shí),我們要對(duì)這多種方案進(jìn)行比較。單獨(dú)考慮其商品組合的利潤(rùn)大小是不合理的,可能消費(fèi)者的

32、購(gòu)買(mǎi)程度不頻繁。同樣的,單獨(dú)考慮其商品組合的支持度也是不合理的,可能兩件商品的購(gòu)買(mǎi)次數(shù)都較頻繁,但是其置信度又不夠高,即購(gòu)買(mǎi)其中一件商品后再購(gòu)買(mǎi)另一件商品的人數(shù)不夠多。若置信度、支持度和利潤(rùn)這三個(gè)因素中某一因素趨近于0,則方案不合適。只有三者乘積較高的方案可以考慮擺在一起進(jìn)行促銷。利用商品的合理擺放和某種利潤(rùn)較高商品適當(dāng)降價(jià)等促銷手段可以使商場(chǎng)的利潤(rùn)更大,效益更好。故引入促銷系數(shù)使促銷方案更合理更完善。八、參考文獻(xiàn)1周濤,陸惠玲.關(guān)聯(lián)規(guī)則挖掘算法研究N.齊齊哈爾大學(xué)學(xué)報(bào),20049(3).2Agrawal R,Srikant R.Fast algorithms for mining assoc

33、iation rulesCIn Proceeding of the 20th International Conference on Very Large Databases1994, 487-499.3李新征.一種新的高效Apriori算法.D:湖南:長(zhǎng)沙理工大學(xué)通信與計(jì)算機(jī)學(xué)院,2007:14.4丁侃.Apriori算法改進(jìn)及實(shí)現(xiàn)D.陜西 漢中:陜西理工學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)系,2005.5劉錫鈴.關(guān)聯(lián)規(guī)則挖掘算法及其在購(gòu)物籃分析中的應(yīng)用研究.D蘇州:蘇州大學(xué)計(jì)算機(jī)應(yīng)用技術(shù)系,2009:3639.9、 附錄附錄一:Matlab程序滿足支持度的單商品、兩種商品組合、三種商品組合、四種商品組合t

34、icdata1=textread('附件1.txt');Value_supt=100; %兩商品支持度闕值data=zeros(4718,999); %0-1矩陣for i=1:4718 for j=1:72 if data1(i,j)=0 continue; end data(i,data1(i,j)=1; endend %C1滿足置信度的組合B1=zeros(999,2);for i=1:999 B1(i,1)=i;endfor i=1:4718 for j=1:999 if data(i,j)=1 B1(j,2)=B1(j,2)+1; end endendt=1;for

35、i=1:999 if B1(i,2)>Value_supt C1(t,:)=B1(i,:); t=t+1; endend %B2滿足置信度的單價(jià)商品所構(gòu)成的兩件商品組合n=size(C1,1);n2=0;t=1;n3=n*(n-1)/2;B2=zeros(n3,3);for j1=1:n-1 for j2=j1+1:n for i=1:4718 if data(i,C1(j1,1)=1&data(i,C1(j2,1)=1 n2=n2+1; end end B2(t,1)=C1(j1,1); B2(t,2)=C1(j2,1); B2(t,3)=n2; n2=0;t=t+1; end

36、end %C2滿足置信度的2件商品組合a=find(B2(:,3)>Value_supt);n4=size(a,1);C2=zeros(n4,3);t=1;for i=1:n3 if B2(i,3)>Value_supt C2(t,1)=B2(i,1); C2(t,2)=B2(i,2); C2(t,3)=B2(i,3); t=t+1; endend %B3滿足置信度的2件商品組合成的3件商品b=unique(C2(:,1,2);n=size(b,1);n1=size(C2,1);n2=0;t=1;n3=n1*n;B3=zeros(n3,4); for j1=1:n1 for j2=

37、1:n for i=1:4718 if data(i,C2(j1,1)=1&&data(i,C2(j1,2)=1&&data(i,b(j2)=1&&b(j2)=C2(j1,1)&&b(j2)=C2(j1,2) n2=n2+1; B3(t,1)=C2(j1,1); B3(t,2)=C2(j1,2); B3(t,3)=b(j2); end end B3(t,4)=n2; n2=0;t=t+1; endend %C3滿足置信度的3件商品a=find(B3(:,4)>Value_supt);n4=size(a,1);C3=zeros

38、(n4,4);t=1;for i=1:n3 if B3(i,4)>Value_supt C3(t,1)=B3(i,1); C3(t,2)=B3(i,2); C3(t,3)=B3(i,3); C3(t,4)=B3(i,4); t=t+1; endend %B4滿足置信度的3件商品組合成的4件商品b4=unique(C3(:,1,2,3);n=size(b4,1);n1=size(C3,1);n2=0;t=1;n3=n1*n;B4=zeros(n3,5); for j1=1:n1 for j2=1:n for i=1:4718 if data(i,C3(j1,1)=1&&da

39、ta(i,C3(j1,2)=1&&data(i,C3(j1,3)&&data(i,b4(j2)=1&&b4(j2)=C3(j1,1)&&b4(j2)=C3(j1,2)&&b4(j2)=C3(j1,3) n2=n2+1; B4(t,1)=C3(j1,1); B4(t,2)=C3(j1,2); B4(t,3)=C3(j1,3); B4(t,4)=b4(j2); end end B4(t,5)=n2; n2=0;t=t+1; endend %C4滿足置信度的4件商品a=find(B4(:,5)>Value_supt

40、);n4=size(a,1);C4=zeros(n4,5);t=1;for i=1:n3 if B4(i,5)>Value_supt C4(t,1)=B4(i,1); C4(t,2)=B4(i,2); C4(t,3)=B4(i,3); C4(t,4)=B4(i,4); C4(t,5)=B4(i,5); t=t+1; endend toc附錄二:將三種物品組合中重復(fù)情況篩選掉tic%將所需篩選的矩陣賦值給A A=Cn%3物品 1次數(shù)A=C3;k1=0;k2=0;k3=0;n3=120; %增添kn,修改n3值 %n3為矩陣的行數(shù)for i1=1:n3-1 for j=i1+1:n3 k1=

41、ismember(A(i1,1),A(j,1:3);% 擴(kuò)展kn 1:n if k1=1 k2=ismember(A(i1,2),A(j,1:3); if k1=1&&k2=1 k3=ismember(A(i1,3),A(j,1:3); if k1=1&&k2=1&&k3=1 A(j,4)=0; %擴(kuò)展時(shí)該項(xiàng)需修改 end end end k1=0;k2=0;k3=0;%增加kn endend toc %CCn篩選后的矩陣a=find(A(:,4)=0);n4=size(a,1); %A(:,n)C3=zeros(n4,4);t=1; %Cn 定

42、義矩陣大小for i=1:n3 if A(i,4)=0 C3(t,1)=A(i,1);%Cn 增添項(xiàng) C3(t,2)=A(i,2); C3(t,3)=A(i,3); C3(t,4)=A(i,4); t=t+1; endend附錄三:將四種物品組合中重復(fù)情況篩選掉tic%將所需篩選的矩陣賦值給A%4物品 1次數(shù)%n3為矩陣的行數(shù) A=C4;%賦值C4k1=0;k2=0;k3=0;k4=0;n3=420; %增添kn,for i1=1:n3-1 for j=i1+1:n3 k1=ismember(A(i1,1),A(j,1:4);%1:n if k1=1 k2=ismember(A(i1,2),A

43、(j,1:4); if k1=1&&k2=1 k3=ismember(A(i1,3),A(j,1:4); if k1=1&&k2=1&&k3=1 k4=ismember(A(i1,4),A(j,1:4); if k1=1&&k2=1&&k3=1&&k4=1 A(j,5)=0; %擴(kuò)展時(shí)該項(xiàng)需修改 end end end end k1=0;k2=0;k3=0;k4=0; endend toc %CCn篩選后的矩陣a=find(A(:,5)=0);n4=size(a,1);C4=zeros(n4,5);

44、t=1; for i=1:n3 if A(i,5)>Value_supt C4(t,1)=A(i,1); C4(t,2)=A(i,2); C4(t,3)=A(i,3); C4(t,4)=A(i,4); C4(t,5)=A(i,5); t=t+1; endend附錄四:計(jì)算滿足置信度的五種商品組合%B5滿足置信度的4件商品組合成的5件商品ticb5=unique(C4(:,1,2,3,4);n=size(b5,1);n1=size(C4,1);n2=0;t=1;n3=n1*n;B5=zeros(n3,6); for j1=1:n1 for j2=1:n for i=1:4718 if da

45、ta(i,C4(j1,1)=1&&data(i,C4(j1,2)=1&&data(i,C4(j1,3)&&data(i,C4(j1,4)=1&&data(i,b5(j2)=1&&. b5(j2)=C4(j1,1)&&b5(j2)=C4(j1,2)&&b5(j2)=C4(j1,3)&&b5(j2)=C4(j1,4) n2=n2+1; B5(t,1)=C4(j1,1); B5(t,2)=C4(j1,2); B5(t,3)=C4(j1,3); B5(t,4)=C4(j1,4); B5(t,5)=b5(j2); end end B5(t,6)=n2; n2=0;t=t+1; endend %C5滿足置信度的5件商品a=find(B5(:,6)>Value_supt);n4=size(a,1);C5=zeros(n4,6);t=1;for i=1:n3 if

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論