版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第1頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第1頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告--超市商品銷售分析及數(shù)據(jù)挖掘
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第2頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第2頁。
通信與信息工程學(xué)院
課程設(shè)計(jì)說明書
課程名稱:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程設(shè)計(jì)題目:超市商品銷售分析及數(shù)據(jù)挖掘?qū)I(yè)/班級(jí):電子商務(wù)(理)
組長:
學(xué)號(hào):
組員/學(xué)號(hào):
開始時(shí)間:2011年12月29日完成時(shí)間:2012年01月3日
目錄Notableofcontentsentriesfound.
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告
1.緒論
1.1項(xiàng)目背景
在商業(yè)領(lǐng)域中使用計(jì)算機(jī)科學(xué)與技術(shù)是當(dāng)今商業(yè)的發(fā)展方向,而數(shù)據(jù)挖掘是商業(yè)領(lǐng)域與計(jì)算機(jī)領(lǐng)域的喬梁。在超市的經(jīng)營中,應(yīng)用數(shù)據(jù)挖掘技術(shù)分析顧客的購買習(xí)慣和不同商品之間的關(guān)聯(lián),并借由陳列的手法,和合適的促銷手段將商品有魅數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第3頁。力的展現(xiàn)在顧客的眼前,可以起到方便購買、節(jié)約空間、美化購物環(huán)境、激發(fā)顧客的購買欲等各種重要作用。
1.2提出問題
那么超市應(yīng)該對(duì)哪些銷售信息進(jìn)行挖掘?怎樣挖掘?具體說,超市如何運(yùn)用OLAP操作和關(guān)聯(lián)規(guī)則了解顧客購買習(xí)慣和商品之間的關(guān)聯(lián),正確的擺放商品位置以及如何運(yùn)用促銷手段對(duì)商品進(jìn)行銷售呢?如何判斷一個(gè)顧客的銷售水平并進(jìn)行推薦呢?本次實(shí)驗(yàn)為解決這一問題提出了解決方案。
2.數(shù)據(jù)倉庫與數(shù)據(jù)集市的概念介紹
2.1數(shù)據(jù)倉庫介紹
數(shù)據(jù)倉庫,英文名稱為DataWarehouse,可簡(jiǎn)寫為DW或DWH,是在數(shù)據(jù)庫已經(jīng)大量存在的情況下,為了進(jìn)一步挖掘數(shù)據(jù)資源、為了決策需要而產(chǎn)生的,它并不是所謂的“大型數(shù)據(jù)庫”。
2.2數(shù)據(jù)集市介紹
數(shù)據(jù)集市,也叫數(shù)據(jù)市場(chǎng),是一個(gè)從操作的數(shù)據(jù)和其他的為某個(gè)特殊的專業(yè)人員團(tuán)體服務(wù)的數(shù)據(jù)源中收集數(shù)據(jù)的倉庫。
3.數(shù)據(jù)倉庫
3.1數(shù)據(jù)倉庫的設(shè)計(jì)
3.1.1數(shù)據(jù)庫的概念模型
3.1.2數(shù)據(jù)倉庫的模型
數(shù)據(jù)倉庫的模型主要包括數(shù)據(jù)倉庫的星型模型圖,我們創(chuàng)建了四個(gè)
維表和一個(gè)事實(shí)表。四個(gè)維表為:item維表,time維表,branch維表,location維表。事實(shí)表為:sales事實(shí)表。其中,
3.2數(shù)據(jù)倉庫的建立
3.2.1數(shù)據(jù)倉庫數(shù)據(jù)集成
我們小組粗略的統(tǒng)計(jì)了超市一年的銷售記錄,并建立了數(shù)據(jù)庫。其
當(dāng)然,這只是最初的表,后面還要進(jìn)行數(shù)據(jù)清理與轉(zhuǎn)換,對(duì)其進(jìn)一步改進(jìn),以便于數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第4頁。3.2.2建立維表
item維表
branch維表
location維表
sales事實(shí)表
4.OLAP操作
按時(shí)間上卷:
切塊:
按片查詢:
整個(gè)數(shù)據(jù)立方體:
5.數(shù)據(jù)預(yù)處理
5.1描述性數(shù)據(jù)匯總
【saleID】S*:銷售號(hào)(筆數(shù))
【customerID】C*:顧客編號(hào)
【productID】P*:購買的商品號(hào)
【timeID】T*:時(shí)間號(hào)(月)
5.2數(shù)據(jù)清理與變換
數(shù)據(jù)清理:(1)初始表格在前面已經(jīng)給出,每筆交易中購買的商品不止一
數(shù)據(jù)變換:對(duì)不同的數(shù)據(jù)類型做不同的變換。比如男女分別用1,0表示;高中檔商品用1,0表示;收入統(tǒng)一除以10000。
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第5頁。6.?dāng)?shù)據(jù)挖掘操作
6.1關(guān)聯(lián)規(guī)則挖掘
6.1.1頻繁一項(xiàng)集篩選
I1支持度的代碼及結(jié)果為:
輸出結(jié)果為:24
其他一項(xiàng)候選集同理
6.1.2、頻繁二項(xiàng)集篩選
頻繁二項(xiàng)集候選集為(I1,I18),(I1,I2),(I1,,I3),(I1,I4),(I1,I5),(I1,I7),
(I18,I2),(I18,I3),(I18,I4),(I18,I5),(I18,I7),
(I2,I3),(I2,I4),(I2,I5),(I2,I7),
(I3,I4),(I3,I4),(I3,I5),(I3,I7),
(I4,I5),(I4,I7),
(I5,I7)
(I1,I18)的支持度代碼和結(jié)果為:
輸出結(jié)果為:15
I3和I18支持度的代碼和結(jié)果為:
輸出結(jié)果為:14
I1和I3支持度的代碼和結(jié)果為:
輸出結(jié)果為:18
同理可得:
6.1.3、頻繁三項(xiàng)集篩選
頻繁三項(xiàng)集候選集為:(I1,I3,I18)
(I1,I3,I18)的支持度代碼和結(jié)果為:
輸出結(jié)果為:13
綜上可得I1、I3和I18的支持度和置信度為:
[]cs
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第6頁。(
)1
,
)2
(
,
(
?
∈
∧
,?
)3
,
X
buys
item
buys
X
item
item
X
transcatio
x,
buys
n
[]%
buys
I
X
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第7頁。buys
buys
I
X
∧
?
X
∈
x?
transcatio
n
%,
18
,
)
12
93
(
)3
,
(
)1
(
,
,I
[]%
I
X
buys
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第8頁。X
buys
I
buys
n
∈
X
∧
x?
transcatio
?
%,
,
(
)3
12
87
)
18
,
(
)1
(
,
,I
[]%
buys
I
X
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第9頁。I
X
buys
X
buys
∧
∈
x?
transcatio
n
?
,I
)1
,
12
%,
72
(
)
)3
,
(
,
18
(
由上可知:1.顧客習(xí)慣一起購買商品I1,I3,I18,即牛奶面包和電視機(jī)
2.所以超市可以將牛奶面包電視機(jī)擺放在一起
6.2分類和預(yù)測(cè)
預(yù)測(cè)的結(jié)果可以用關(guān)聯(lián)規(guī)則的結(jié)果和OLAP的結(jié)果來說明。預(yù)測(cè)結(jié)果如下:1.根數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第10頁。據(jù)OLAP從日到月上卷操作,1月為銷售旺季,商店可以在此期間加大供應(yīng)量,以獲得更大利潤。
2.顧客對(duì)牛奶的需求很大,且為蒙牛牛奶
3.顧客對(duì)面包的需求也很大,且為安琪面包
4.對(duì)步步高電視機(jī)的需求也很大。
6.3決策樹的建立:
通過研究顧客的屬性,分析這些屬性對(duì)顧客購買商品檔次的影響,建立決策樹,預(yù)測(cè)顧客購買商品的檔次。
6.3.1.選擇最佳分裂點(diǎn):
1)源數(shù)據(jù):(部分展示)
數(shù)據(jù)轉(zhuǎn)換后數(shù)據(jù):(部分展示)
2)選取過程具體操作:
3)經(jīng)比較gain()的值得出,選取sex。
6.3.2.繼續(xù)尋找下一個(gè)分裂點(diǎn):
1)源數(shù)據(jù):(部分展示)(按sex分類)
F:(49條記錄)
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第11頁。M:(51條記錄)
2)選取過程具體操作:
F:
M:
M中找到的分裂點(diǎn)為income
6.3.3.分裂的數(shù)據(jù)結(jié)果部分如圖:
F:
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第3頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第4頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第5頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)挖掘1全文共11頁,當(dāng)前為第6頁。數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告-超市商品銷售分析及數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 三年級(jí)英語上冊(cè)二單元單詞
- 鋁型材購銷合同協(xié)議格式
- 個(gè)人借款合同簡(jiǎn)單格式模板
- 招標(biāo)文件承諾書的內(nèi)容要素
- 加急物流配送合同
- 文化版權(quán)轉(zhuǎn)讓合同
- 承諾執(zhí)行招標(biāo)文件與合同規(guī)定
- 工程質(zhì)量保證書范本保證書
- 全面工業(yè)水處理服務(wù)協(xié)議
- 橋梁工程下部勞務(wù)分包協(xié)議案例
- GB/T 19635-2024棉花長絨棉
- 2024年江蘇省政工師理論知識(shí)考試參考題庫(含答案)
- 《礦山測(cè)量學(xué)課件》課件
- (高清版)TDT 1031.6-2011 土地復(fù)墾方案編制規(guī)程 第6部分:建設(shè)項(xiàng)目
- 劍南春人才測(cè)評(píng)試題
- 生涯發(fā)展報(bào)告 (修改)
- 網(wǎng)易公司戰(zhàn)略分析報(bào)告
- 玻璃鏡片加工工藝
- 新生兒黃疸情景劇課件
- 在教學(xué)活動(dòng)中如何發(fā)揮幼兒的主體性
- 2022版義務(wù)教育(勞動(dòng))課程標(biāo)準(zhǔn)(附課標(biāo)解讀)
評(píng)論
0/150
提交評(píng)論