數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1_第1頁
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1_第2頁
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1_第3頁
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1_第4頁
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第1頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第1頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告--超市商品銷售分析及數(shù)據(jù)挖掘

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第2頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第2頁。

通信與信息工程學(xué)院

課程設(shè)計(jì)說明書

課程名稱:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程設(shè)計(jì)題目:超市商品銷售分析及數(shù)據(jù)挖掘?qū)I(yè)/班級(jí):電子商務(wù)(理)

組長:

學(xué)號(hào):

組員/學(xué)號(hào):

開始時(shí)間:2011年12月29日完成時(shí)間:2012年01月3日

目錄Notableofcontentsentriesfound.

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告

1.緒論

1.1項(xiàng)目背景

在商業(yè)領(lǐng)域中使用計(jì)算機(jī)科學(xué)與技術(shù)是當(dāng)今商業(yè)的發(fā)展方向,而數(shù)據(jù)挖掘是商業(yè)領(lǐng)域與計(jì)算機(jī)領(lǐng)域的喬梁。在超市的經(jīng)營中,應(yīng)用數(shù)據(jù)挖掘技術(shù)分析顧客的購買習(xí)慣和不同商品之間的關(guān)聯(lián),并借由陳列的手法,和合適的促銷手段將商品有魅數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第3頁。力的展現(xiàn)在顧客的眼前,可以起到方便購買、節(jié)約空間、美化購物環(huán)境、激發(fā)顧客的購買欲等各種重要作用。

1.2提出問題

那么超市應(yīng)該對(duì)哪些銷售信息進(jìn)行挖掘?怎樣挖掘?具體說,超市如何運(yùn)用OLAP操作和關(guān)聯(lián)規(guī)則了解顧客購買習(xí)慣和商品之間的關(guān)聯(lián),正確的擺放商品位置以及如何運(yùn)用促銷手段對(duì)商品進(jìn)行銷售呢?如何判斷一個(gè)顧客的銷售水平并進(jìn)行推薦呢?本次實(shí)驗(yàn)為解決這一問題提出了解決方案。

2.數(shù)據(jù)倉庫與數(shù)據(jù)集市的概念介紹

2.1數(shù)據(jù)倉庫介紹

數(shù)據(jù)倉庫,英文名稱為DataWarehouse,可簡(jiǎn)寫為DW或DWH,是在數(shù)據(jù)庫已經(jīng)大量存在的情況下,為了進(jìn)一步挖掘數(shù)據(jù)資源、為了決策需要而產(chǎn)生的,它并不是所謂的“大型數(shù)據(jù)庫”。

2.2數(shù)據(jù)集市介紹

數(shù)據(jù)集市,也叫數(shù)據(jù)市場(chǎng),是一個(gè)從操作的數(shù)據(jù)和其他的為某個(gè)特殊的專業(yè)人員團(tuán)體服務(wù)的數(shù)據(jù)源中收集數(shù)據(jù)的倉庫。

3.數(shù)據(jù)倉庫

3.1數(shù)據(jù)倉庫的設(shè)計(jì)

3.1.1數(shù)據(jù)庫的概念模型

3.1.2數(shù)據(jù)倉庫的模型

數(shù)據(jù)倉庫的模型主要包括數(shù)據(jù)倉庫的星型模型圖,我們創(chuàng)建了四個(gè)

維表和一個(gè)事實(shí)表。四個(gè)維表為:item維表,time維表,branch維表,location維表。事實(shí)表為:sales事實(shí)表。其中,

3.2數(shù)據(jù)倉庫的建立

3.2.1數(shù)據(jù)倉庫數(shù)據(jù)集成

我們小組粗略的統(tǒng)計(jì)了超市一年的銷售記錄,并建立了數(shù)據(jù)庫。其

當(dāng)然,這只是最初的表,后面還要進(jìn)行數(shù)據(jù)清理與轉(zhuǎn)換,對(duì)其進(jìn)一步改進(jìn),以便于數(shù)據(jù)挖掘。

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第4頁。3.2.2建立維表

item維表

branch維表

location維表

sales事實(shí)表

4.OLAP操作

按時(shí)間上卷:

切塊:

按片查詢:

整個(gè)數(shù)據(jù)立方體:

5.數(shù)據(jù)預(yù)處理

5.1描述性數(shù)據(jù)匯總

【saleID】S*:銷售號(hào)(筆數(shù))

【customerID】C*:顧客編號(hào)

【productID】P*:購買的商品號(hào)

【timeID】T*:時(shí)間號(hào)(月)

5.2數(shù)據(jù)清理與變換

數(shù)據(jù)清理:(1)初始表格在前面已經(jīng)給出,每筆交易中購買的商品不止一

數(shù)據(jù)變換:對(duì)不同的數(shù)據(jù)類型做不同的變換。比如男女分別用1,0表示;高中檔商品用1,0表示;收入統(tǒng)一除以10000。

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第5頁。6.?dāng)?shù)據(jù)挖掘操作

6.1關(guān)聯(lián)規(guī)則挖掘

6.1.1頻繁一項(xiàng)集篩選

I1支持度的代碼及結(jié)果為:

輸出結(jié)果為:24

其他一項(xiàng)候選集同理

6.1.2、頻繁二項(xiàng)集篩選

頻繁二項(xiàng)集候選集為(I1,I18),(I1,I2),(I1,,I3),(I1,I4),(I1,I5),(I1,I7),

(I18,I2),(I18,I3),(I18,I4),(I18,I5),(I18,I7),

(I2,I3),(I2,I4),(I2,I5),(I2,I7),

(I3,I4),(I3,I4),(I3,I5),(I3,I7),

(I4,I5),(I4,I7),

(I5,I7)

(I1,I18)的支持度代碼和結(jié)果為:

輸出結(jié)果為:15

I3和I18支持度的代碼和結(jié)果為:

輸出結(jié)果為:14

I1和I3支持度的代碼和結(jié)果為:

輸出結(jié)果為:18

同理可得:

6.1.3、頻繁三項(xiàng)集篩選

頻繁三項(xiàng)集候選集為:(I1,I3,I18)

(I1,I3,I18)的支持度代碼和結(jié)果為:

輸出結(jié)果為:13

綜上可得I1、I3和I18的支持度和置信度為:

[]cs

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第6頁。(

)1

,

)2

(

,

(

?

,?

)3

,

X

buys

item

buys

X

item

item

X

transcatio

x,

buys

n

[]%

buys

I

X

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第7頁。buys

buys

I

X

?

X

x?

transcatio

n

%,

18

,

)

12

93

(

)3

,

(

)1

(

,

,I

[]%

I

X

buys

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第8頁。X

buys

I

buys

n

X

x?

transcatio

?

%,

,

(

)3

12

87

)

18

,

(

)1

(

,

,I

[]%

buys

I

X

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第9頁。I

X

buys

X

buys

x?

transcatio

n

?

,I

)1

,

12

%,

72

(

)

)3

,

(

,

18

(

由上可知:1.顧客習(xí)慣一起購買商品I1,I3,I18,即牛奶面包和電視機(jī)

2.所以超市可以將牛奶面包電視機(jī)擺放在一起

6.2分類和預(yù)測(cè)

預(yù)測(cè)的結(jié)果可以用關(guān)聯(lián)規(guī)則的結(jié)果和OLAP的結(jié)果來說明。預(yù)測(cè)結(jié)果如下:1.根數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第10頁。據(jù)OLAP從日到月上卷操作,1月為銷售旺季,商店可以在此期間加大供應(yīng)量,以獲得更大利潤。

2.顧客對(duì)牛奶的需求很大,且為蒙牛牛奶

3.顧客對(duì)面包的需求也很大,且為安琪面包

4.對(duì)步步高電視機(jī)的需求也很大。

6.3決策樹的建立:

通過研究顧客的屬性,分析這些屬性對(duì)顧客購買商品檔次的影響,建立決策樹,預(yù)測(cè)顧客購買商品的檔次。

6.3.1.選擇最佳分裂點(diǎn):

1)源數(shù)據(jù):(部分展示)

數(shù)據(jù)轉(zhuǎn)換后數(shù)據(jù):(部分展示)

2)選取過程具體操作:

3)經(jīng)比較gain()的值得出,選取sex。

6.3.2.繼續(xù)尋找下一個(gè)分裂點(diǎn):

1)源數(shù)據(jù):(部分展示)(按sex分類)

F:(49條記錄)

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第11頁。M:(51條記錄)

2)選取過程具體操作:

F:

M:

M中找到的分裂點(diǎn)為income

6.3.3.分裂的數(shù)據(jù)結(jié)果部分如圖:

F:

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第3頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第4頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第5頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第6頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論