超市商品擺放位置數(shù)據(jù)挖掘_第1頁
超市商品擺放位置數(shù)據(jù)挖掘_第2頁
超市商品擺放位置數(shù)據(jù)挖掘_第3頁
超市商品擺放位置數(shù)據(jù)挖掘_第4頁
超市商品擺放位置數(shù)據(jù)挖掘_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、濱江學(xué)院數(shù)據(jù)挖掘?qū)嶒瀳蟾骖} 目: 超市商品擺放位置挖掘報告 院 系: 計算機(jī)系 專 業(yè): 軟件工程 班 級: 軟件1班 小組成員: 劉鵬 黃杰飛 吳思維 王悅 陸青鳳 學(xué) 號: 指導(dǎo)教師: 周北平 日期:2013 年 6月 16日一、引言隨著計算機(jī)技術(shù)的應(yīng)用和普及,各行業(yè)中數(shù)據(jù)的采集、存儲能力大大增強(qiáng),而對數(shù)據(jù)的處理和分析能力相對不足。傳統(tǒng)的數(shù)據(jù)庫方法雖然可以高效地實現(xiàn)數(shù)據(jù)的錄入、修改、統(tǒng)計和查詢功能,但卻無法發(fā)現(xiàn)數(shù)據(jù)中隱藏的信息,人們今天所能獲取和存儲的數(shù)據(jù)已遠(yuǎn)遠(yuǎn)超過了對其處理和分析能力,這就造成了所謂的“數(shù)據(jù)墳?zāi)埂保罅康臄?shù)據(jù)被采集和存儲后,閑置下來,無人問津。數(shù)據(jù)總量的不斷增加,迫切需要

2、有效的分析工具,它能自動、智能和快速地發(fā)現(xiàn)大量數(shù)據(jù)間隱藏的依賴關(guān)系并從大量數(shù)據(jù)中抽取有用的信息或知識。以人工智能、統(tǒng)計學(xué)等為基礎(chǔ)的數(shù)據(jù)挖掘技術(shù)就是為了迎合這種需要而出現(xiàn)的,為現(xiàn)代信息處理提供了一種新的方法和研究領(lǐng)域。在展開本文立論前,有必要對本文研究范圍內(nèi)的核心方面(數(shù)據(jù)挖掘的研究動態(tài)與發(fā)展趨勢)作出說明,以便綜合與分析。數(shù)據(jù)挖掘(DataMining),就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)庫中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。當(dāng)前,數(shù)據(jù)挖掘知識發(fā)現(xiàn)的研究方興未艾,數(shù)據(jù)挖掘研究人員、系統(tǒng)合應(yīng)用開發(fā)人員所面臨的主要問題是高效而有效的數(shù)據(jù)挖掘方

3、法和系統(tǒng)的開發(fā),交互和集成的數(shù)據(jù)挖掘環(huán)境的建立,以及如何應(yīng)用挖掘技術(shù)解決大型應(yīng)用問題。研究的焦點可能會聚集在以下幾方面:(1)數(shù)據(jù)挖掘語言的形式化描述:研究專門用于知識發(fā)現(xiàn)的數(shù)據(jù)挖掘語言,以期形式化和標(biāo)準(zhǔn)化;(2)可視化數(shù)據(jù)挖掘:是從大量數(shù)據(jù)中發(fā)現(xiàn)知識的有效途徑,使得數(shù)據(jù)挖掘過程可以被用戶理解,方便進(jìn)行人機(jī)交互;(3)多媒體數(shù)據(jù)挖掘:是指從大量的文本數(shù)據(jù)、圖形數(shù)據(jù)、視頻圖像數(shù)據(jù)、音頻數(shù)據(jù)乃至綜合多媒體數(shù)據(jù)的開采中,通過分析語義和視聽特征,發(fā)現(xiàn)其中隱含的、有價值的模式,處理的對象是非結(jié)構(gòu)化的數(shù)據(jù),有別于傳統(tǒng)的數(shù)據(jù)挖掘?qū)ο?;?)Web數(shù)據(jù)挖掘:主要是利用數(shù)據(jù)挖掘技術(shù)從Intranet/Inter

4、net中自動發(fā)現(xiàn)并提取有用信息的過程,其數(shù)據(jù)最大特點在于半結(jié)構(gòu)化。因此Web數(shù)據(jù)挖掘重點集中在開發(fā)新的Web挖掘技術(shù)以及對Web文檔進(jìn)行預(yù)測處理以得到關(guān)于文檔的特征表示;(5)數(shù)據(jù)挖掘中的隱私與信息安全:是指需要進(jìn)一步開發(fā)有關(guān)方法,以便在適當(dāng)?shù)男畔⒃L問和數(shù)據(jù)挖掘中確保隱私保護(hù)與安全。二、設(shè)計正文 1.本文工作內(nèi)容本文的目標(biāo)是運(yùn)用數(shù)據(jù)挖掘的理論和方法,通過研究分析數(shù)據(jù)倉庫,建立一個與ERP集成的以銷售為核心的超市決策支持系統(tǒng),以提高企業(yè)商業(yè)決策能力。本文的研究重點有以下幾個方面:(1)對數(shù)據(jù)挖掘的研究現(xiàn)狀進(jìn)行了分析,探討了數(shù)據(jù)挖掘的基本原理與體系結(jié)構(gòu),并對數(shù)據(jù)倉庫進(jìn)行了研究,使得建立超市決策支持

5、系統(tǒng)成為可能;(2)以超市數(shù)據(jù)倉庫中的數(shù)據(jù)為原始數(shù)據(jù),運(yùn)用維度建模的方法建立了系統(tǒng)的信息模型,并且對數(shù)據(jù)進(jìn)行分析;(3)建立超市決策支持原型系統(tǒng),并在此系統(tǒng)的基礎(chǔ)上,對原型系統(tǒng)進(jìn)行了實例數(shù)據(jù)挖掘應(yīng)用,并把結(jié)果進(jìn)行了可視化轉(zhuǎn)化,最后向企業(yè)決策人員提交了挖掘結(jié)果。2.數(shù)據(jù)挖掘的概況 2.1數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘主要是從大量的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取人們感興趣的知識。這些知識是隱含的、事先未知的、潛在有用的信息,提取的知識表現(xiàn)為概念、規(guī)則、規(guī)律、模式等形式。數(shù)據(jù)挖掘是知識發(fā)現(xiàn)的重要技術(shù),它并不是用規(guī)范的數(shù)據(jù)庫查詢語言(如:SQL語言)進(jìn)行查詢,而是對查詢的內(nèi)容進(jìn)行模式的總結(jié)和內(nèi)在規(guī)律的搜

6、索。傳統(tǒng)的查詢和報表處理只是得到事件發(fā)生的結(jié)果,并沒有深入研究發(fā)生的原因,而數(shù)據(jù)挖掘則主要了解發(fā)生的原因,并且以一定的置信度對未來進(jìn)行預(yù)測,用來為決策行為提供有利的支持。 2.2 數(shù)據(jù)挖掘的任務(wù)數(shù)據(jù)挖掘的任務(wù)是對數(shù)據(jù)庫中的大量數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,并從中提取輔助決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘的任務(wù)主要有以下幾方面:(1)自動預(yù)測趨勢和行為:自動尋找預(yù)測性信息,直接由數(shù)據(jù)本身得出結(jié)論。(2)聚類分析。按相似性歸納分類,同類數(shù)據(jù)彼此相似,不同類數(shù)據(jù)相異。(3)關(guān)聯(lián)分析。目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián),以支持度和可信度來度量。(4)分類。用于規(guī)則描述和預(yù)測。(5)時序模式。通過時間序列

7、搜索出的重復(fù)發(fā)生概率較高的模式。(6)偏差分析。尋找觀察結(jié)果與參照之間的差別。2.3 數(shù)據(jù)挖掘的基本原理在利用數(shù)據(jù)挖掘技術(shù)進(jìn)行決策分析時,一般遵循的步驟包含以下幾個方面:在進(jìn)行數(shù)據(jù)挖掘工作前,要清楚地知道數(shù)據(jù)挖掘的目標(biāo)。事先明確挖掘的業(yè)務(wù)目標(biāo),確定達(dá)到目標(biāo)的評價方法,這將大大減少挖掘工作的難度和工作量。選擇數(shù)據(jù),這些數(shù)據(jù)可能是數(shù)據(jù)倉庫或數(shù)據(jù)集市,也可能是各個聯(lián)機(jī)事務(wù)處理系統(tǒng)中的數(shù)據(jù)。數(shù)據(jù)預(yù)處理,一般包括消除噪聲、推導(dǎo)計算缺值數(shù)據(jù)、消除重復(fù)記錄、完成數(shù)據(jù)類型轉(zhuǎn)換、對數(shù)據(jù)降維等。數(shù)據(jù)變換,從初始特征中找出真正有用的特征,以減少數(shù)據(jù)挖掘需考慮的特征或變量個數(shù)。數(shù)據(jù)挖掘,首先需要確定數(shù)據(jù)挖掘的目標(biāo)和挖

8、掘的知識類型;在確定挖掘任務(wù)后,根據(jù)挖掘的知識類型選擇合適的挖掘算法;最后實施數(shù)據(jù)挖掘操作,運(yùn)用選定的挖掘算法從數(shù)據(jù)庫中抽取所需的知識。整個數(shù)據(jù)挖掘過程是不斷地循環(huán)和反復(fù)的,因而可以對所挖掘出來的知識不斷求精和深化,最終達(dá)到用戶所滿意的結(jié)果。3.系統(tǒng)的分析與建模 3.1 現(xiàn)狀調(diào)研與分析隨著我國超級市場的不斷普及,我國的超市企業(yè)面臨競爭的嚴(yán)峻考驗。沃爾瑪、家樂福等一些國際著名的零售企業(yè)搶灘中國,使中國超市面臨著國際化的競爭,中國的商業(yè)零售市場競爭日益激烈。國內(nèi)零售公司迫切需要通過各種手段提高競爭力。在這種情況下,超市從上到下迫切需要更科學(xué)、更全面細(xì)致、更快速準(zhǔn)確的經(jīng)營管理要求。因此,能否對數(shù)據(jù)進(jìn)

9、行靈敏、快速的分析,有針對性地制定政策,適時根據(jù)市場需求排放貨物,顯得越來越重要。把握市場動向,提包銷售利潤是商場、超市的最終目標(biāo)。在企業(yè)管理日趨科學(xué)化的今天,如何準(zhǔn)確及時的進(jìn)行生產(chǎn)經(jīng)營決策是商場、超市面臨的嚴(yán)峻問題。這要求決策者準(zhǔn)確及時的捕捉到銷售信息,分析銷售情況,隨時根究歷史的銷售情況,對下一步的生產(chǎn)經(jīng)營進(jìn)行科學(xué)決策。銷售分析需要的基礎(chǔ)數(shù)據(jù)涉及到的模塊有銷售、庫存、財務(wù)和人事,能夠圍繞銷售趨勢、產(chǎn)品需求趨勢等輔助決策信息。 3.2 數(shù)據(jù)理解3.2.1數(shù)據(jù)的特點超市的數(shù)據(jù)挖掘因其數(shù)據(jù)來源與類型的不同,其做法也稍有不同。一些超市,其顧客多數(shù)持有會員卡或優(yōu)惠卡,比如沃爾瑪在北京的連鎖店。這種情

10、況下,超市的數(shù)據(jù)倉庫記載了最為豐富的信息,它不僅可以提供顧客分層層面上的購物偏好等信息,甚至可以了解到每位顧客的購物習(xí)慣;而有些超市,其顧客多數(shù)為匿名消費(fèi),他們沒有會員卡之類可跟個人記錄相聯(lián)的工具,而且多數(shù)是現(xiàn)金消費(fèi),超市很難把握每位顧客的消費(fèi)習(xí)慣。但這一類數(shù)據(jù)在累計層面上,依然可以為商場提供很多有用信息。在銷售歷史數(shù)據(jù)中,我們常常會發(fā)現(xiàn)代表同一概念的屬性在不同的數(shù)據(jù)庫含有不同的名字,這將會導(dǎo)致不一致和冗余,而含有大量不一致和冗余數(shù)據(jù)會降低數(shù)據(jù)挖掘過程的性能或使之陷入混亂。并且數(shù)據(jù)源中常不可避免地存在著不完整、不一致、不精確和重復(fù)的數(shù)據(jù),這些數(shù)據(jù)統(tǒng)稱為“臟數(shù)據(jù)”。臟數(shù)據(jù)能使挖掘過程陷入混亂,導(dǎo)

11、致不可靠的輸出。將數(shù)據(jù)集成與變換、清洗將減少或避免這種情況,提高數(shù)據(jù)挖掘的精度與速度。3.2.2 數(shù)據(jù)的描述數(shù)據(jù)描述是對收集的數(shù)據(jù)進(jìn)行描述。一般數(shù)據(jù)描述由資料數(shù)據(jù)和行為數(shù)據(jù)組成,用來描述各個事務(wù)的基本特征,并為超市決策系統(tǒng)模型的分析和建立提供數(shù)據(jù)源。現(xiàn)描述的數(shù)據(jù)為商品的信息、會員信息、退貨信息、銷售的狀態(tài)信息。Merchandise(商品)表說明字段類型長度備注序號SequenceNumberint4標(biāo)識列商品編碼MerchandiseNumbervarchar20例:食品類別:SP條型碼TreatyCodevarchar20例:tx321SP類別編號SortNumberchar10外鍵商品名

12、稱MerchandiseNamevarchar50零售價(元)RetailPricemoney8計量單位Unitsvarchar20供應(yīng)商號ProductManufacturerVarchar20進(jìn)貨價PurchasePricemoney8保質(zhì)期(天)CheckTermnumeric9允許空備注Remarkvarchar50允許空MerchandiseType(商品類別)表說明字段:類型:長度:備注:序號SortIDint4標(biāo)識列類別編號SortNumberchar10例:食品類:SP0001類別名SortNamevarchar20Customer(用戶)表說明:字段:類型:長度:備注:用戶號

13、CustomerIDvarchar20主鍵用戶名稱CustomerNamevarchar20用戶等級UserGradevarchar20家庭地址AddressVarchar50性別SixVarchar10文化程度WenhuaVarchar20用戶積分GradeVarchar10BackSale(退貨)表說明:字段:類型:長度:備注退貨單編號BackSale_IDvarchar10主鍵退貨日期BackDatevarchar50商品條形碼Product_IDvarchar50主鍵,外鍵(參照PRODUCT表)數(shù)量Numbernumeric9進(jìn)貨價格Pricevarchar8商品名稱ProductN

14、amevarchar20貨品生產(chǎn)廠家ProductManufacturervarchar50(退貨人)普通客戶CommonClientvarchar10(退貨人)會員VIP_IDvarchar10(退貨人)超市SuperMarketvarchar50退貨原因Reasonvarcha250(銷售)表銷售編號Sale_IDvarchar10主鍵,外鍵(參照SALE表)商品編號(條形碼)Product_IDvarchar10主鍵,外鍵(參照PRODUCT表銷售日期SaleDatevarchar50商品數(shù)量Numbernumeric9商品單價Priceint4折扣Discountint4會員卡號VIP

15、_IDvarchar10收銀員編號Shroffvarchar10普通客戶CommonClientvarchar10商品名稱ProductNamevarchar50商品類別ProductSortvarchar503.2.3 超市決策系統(tǒng)應(yīng)解決的問題超市銷售是超市決策系統(tǒng)的的重中之重,銷售的情況直接影響到超市能否正常的運(yùn)營。采用正確的銷售策略是企業(yè)不容忽視的問題,通過良好的超市決策可以將超市的商品管理、庫存管理、人員管理以及顧客管理良好的結(jié)合在一起,以便為良好的銷售服務(wù)。在超市銷售過程中,決策部門借助于決策系統(tǒng)應(yīng)該解決以下問題:(1)顧客聚類分析:根據(jù)顧客的性別、地理分布、文化程度、種族等對顧客做

16、聚類分析,使超市能夠有針對性的營銷。(2)顧客忠誠度分析:根據(jù)持續(xù)時間、交易數(shù)量、地理分布等因素考慮分析。(3)商品擺放情況分析:根據(jù)顧客購買商品的關(guān)聯(lián)規(guī)則,分析商品的最佳擺放位置。(4)銷售員績效分析:通過對銷售情況匯總,及時了解銷售員的工作負(fù)荷、服務(wù)質(zhì)量,合理安排銷售任務(wù),保證銷售工作的順利進(jìn)行。(5)商品退貨情況分析:查詢商品的退貨情況,按照時段、顧客、商品供應(yīng)商情況,分析產(chǎn)生原因。(6)銷售趨勢預(yù)測分析:按地區(qū)、組織、顧客類型、供應(yīng)商類型、銷售員、銷售方式、時段和商品進(jìn)行分析,查詢以往商品的銷售數(shù)據(jù),得出未來的銷售趨勢,從而采取正確的銷售方式。4. 決策支持系統(tǒng)的設(shè)計與實現(xiàn)4.1 超市

17、決策支持系統(tǒng)的設(shè)計基于數(shù)據(jù)挖掘的超市決策支持系統(tǒng)的主要功能功能設(shè)計包括商品管理方面、顧客管理方面、銷售管理方面的設(shè)計。4.1.1商品管理通過對數(shù)據(jù)倉庫中多次購買記錄的分析,應(yīng)用商品的關(guān)聯(lián)分析模型,發(fā)現(xiàn)不同商品被一起 購買的關(guān)系,當(dāng)若干中商品被同時購買超過一定頻數(shù)時,可以確定這些商品之間具有一定的相關(guān)性,以此為依據(jù)可以對商品的捆綁銷售、位置擺放提供信息支持。對同一品類的不同商品的銷售額、利潤率、顧客感興趣程度進(jìn)行分析,依據(jù)商品品類管理目標(biāo)模型和品類淘汰模型,可以得出不同商品對于實現(xiàn)利潤最大化的重要程度,對一個品類內(nèi)的商品進(jìn)行末位淘汰,優(yōu)化商品的品類結(jié)構(gòu)。利用數(shù)據(jù)倉庫中關(guān)于商品的庫存信息以及商品的

18、銷售額、銷售利潤、庫存成本、定貨成本、定貨提前期等數(shù)據(jù),結(jié)合商品進(jìn)貨和庫存管理模型,可以確定商品的最佳定貨批量,節(jié)約商品的進(jìn)貨、庫存管理成本。4.1.2顧客管理結(jié)合超級市場的會員制度,數(shù)據(jù)倉庫收集了大量的顧客信息和顧客購買記錄,依據(jù)超市自身需求,首先確定顧客細(xì)分變量,結(jié)合顧客細(xì)分模型,對顧客進(jìn)行聚類分析。在聚類分析的基礎(chǔ)上,可以歸納出每類顧客的主要特征,可以將這些特征作為分類標(biāo)準(zhǔn)對新客戶進(jìn)行分類。通過對顧客的聚類、分類分析,我們能夠?qū)︻櫩瓦M(jìn)行精細(xì)管理,從而使我們更好的為顧客提供相適應(yīng)的服務(wù)。4.1.3銷售管理能夠?qū)Τ壥袌龃黉N活動的時間、業(yè)績、商品搭配等進(jìn)行分析,得出促銷活動的重要影響因素,對

19、促銷活動的效果進(jìn)行評價,指導(dǎo)超市企業(yè)促銷活動的開展。結(jié)合數(shù)據(jù)倉庫中老客戶的商品購買記錄,分析各個顧客的潛在消費(fèi)需求,協(xié)助超市進(jìn)行針對性的商品推薦。對超市數(shù)據(jù)倉庫中各種商品的銷售數(shù)據(jù)進(jìn)行系統(tǒng)的統(tǒng)計分析,協(xié)助超市進(jìn)行銷售數(shù)據(jù)的整理、分析、儲存。4.2模塊設(shè)計超市決策支持系統(tǒng)的主要功能模塊包括信息查詢、預(yù)警提示、聯(lián)機(jī)分析處理、決策支持和系統(tǒng)管理五大模塊。該模塊流程圖:庫存缺料查詢信息查詢基本數(shù)據(jù)查詢業(yè)務(wù)數(shù)據(jù)查詢庫存主題分析處理銷售主題分析處理顧客主題分析處理商品主題分析處理應(yīng)付款到期查詢采購訂單查詢聯(lián)機(jī)分析處理超市決策系統(tǒng)預(yù)警提示顧客消費(fèi)評估商品銷售預(yù)測庫存預(yù)測決策支持系統(tǒng)管理系統(tǒng)權(quán)限管理數(shù)據(jù)倉庫管

20、理 超市決策系統(tǒng)功能模塊圖5建立顧客細(xì)分模型5.1顧客細(xì)分概述 顧客細(xì)分,即根據(jù)客戶不同的特征對市場進(jìn)行簇的劃分,使得屬于同一簇的客戶具有某種相似的特征。在超級市場中,不同的顧客之間具有很大的差異,對超市來說也具有不同的價值。對超級市場來說,對不同的顧客按照相應(yīng)的標(biāo)準(zhǔn)進(jìn)行劃分,對于優(yōu)化超級市場的相關(guān)策略、增強(qiáng)超市的競爭能力、使超市更好的管理客戶等等都是非常有益的。針對不同的顧客群體制定不同的差異化策略,增加顧客的忠誠度、刺激顧客購買、增加超市盈利,從而使超級市場更好的管理客戶。5.2顧客細(xì)分方法及依據(jù)顧客細(xì)分是按照一定的規(guī)則把一定的顧客劃分為不同的顧客群。通過顧客細(xì)分,企業(yè)可以更好地識別不同的

21、顧客群體,采取差異化的營銷策略,從而有效地降低成本,同時獲得更強(qiáng)、更有利可圖的市場滲透?,F(xiàn)有的研究依據(jù)傳統(tǒng)的市場細(xì)分理論進(jìn)行了有益的探討,例如采用人口統(tǒng)計學(xué)變量(如年齡、性別、收入、教育背景和職業(yè)等),或者顧客購買行為特征變量(如顧客購買量、購買頻率和忠誠度等),亦或是顧客價值變量。但是,由于這些細(xì)分方法的提出是基于不同的研究目的和視角,尚不能滿足顧客關(guān)系管理對于顧客細(xì)分更全面、細(xì)致的要求。顧客細(xì)分的方法有很多,顧客細(xì)分沒有唯一的方法,一個超市要想盡量好的描述、把握客戶,應(yīng)該嘗試不同的細(xì)分變量,獨(dú)立變量和聯(lián)合變量都要考慮。顧客細(xì)分依據(jù)顧客細(xì)分依據(jù)舉例人口統(tǒng)計特點年齡、性別、收入、職業(yè)、社會、地

22、位地理因素特點國內(nèi)國際市場、地區(qū)經(jīng)濟(jì)發(fā)展水平、居住小區(qū)級別家庭生命周期特點個人所處家庭生命周期的階段購買者的個人特點資產(chǎn)狀況、個性、風(fēng)險偏好、生活方式5.3 顧客細(xì)分模型的應(yīng)用及研究顧客細(xì)分模型以數(shù)據(jù)倉庫為基礎(chǔ),能夠進(jìn)行充分的應(yīng)用,從而為超市的經(jīng)營決策提供支持。而K-平均算法是一種廣泛的聚類分析算法,此算法已經(jīng)在第二章講過,所以我們在這里直接用K-平均算法對顧客進(jìn)行細(xì)分。根據(jù)上述所講的顧客細(xì)分方法及模型,我們通過聚類分析中的K-平均算法對一家超市的顧客進(jìn)行了聚類分析我們可以從下面的分析表中發(fā)現(xiàn)該超市顧客的一些特點。聚類分析結(jié)果類型客戶數(shù)人數(shù)金額計算價值黃金客戶1760.00030.5111.6

23、0價值客戶776150.132662.0960.20一般客戶0.834037.2023.89低值客戶193680.03310.204.31文章也對分出的每一類客戶特點做了關(guān)聯(lián)分析,發(fā)現(xiàn)如下特點:黃金客戶都是大集團(tuán)客戶,如機(jī)場、政府、大學(xué)等,不但訂了很多份報紙還有許多其它商品的配送業(yè)務(wù),與公司能保持比較長時間的業(yè)務(wù)關(guān)系。價值客戶多是一些較小的公費(fèi)用戶,或是綜合市場等多個單客戶組成的聯(lián)合體,還有一些收入高,生活優(yōu)越的中產(chǎn)階級。普通用戶大多是一些私費(fèi)訂戶,長期穩(wěn)定地訂購公司的產(chǎn)品與服務(wù)。低值客戶多是一些訂購時間短,續(xù)訂積極性不高的用戶,多是一些年輕人,為了生活方便臨時訂購。這個挖掘結(jié)果不但發(fā)現(xiàn)了有意

24、義的知識,得到了決策者和業(yè)務(wù)人員的認(rèn)可,而且也體現(xiàn)了經(jīng)濟(jì)學(xué)中的20%-80%規(guī)律,即少數(shù)客戶創(chuàng)造大部分的客戶生涯價值。5.4商品關(guān)聯(lián)分析5.4.1原始數(shù)據(jù)采集從超市中選取具有潛在銷售關(guān)系的一系列產(chǎn)品,設(shè)產(chǎn)品銷售集合為 D。 D=洗發(fā)水A 、浴衣B 、香皂C 、潤膚霜 D、洗衣粉E (1)選取超市一段時間內(nèi)在商品集合 D 中購買商品的記錄進(jìn)行分析,首先我們對其進(jìn)行預(yù)處理,將購買數(shù)量簡化為 1 或 0,其中 1 代表購買,0 代表沒有購買。預(yù)處理后的銷售記錄如表。銷售數(shù)據(jù)處理后顧客洗發(fā)水A浴衣B香皂C潤膚霜D洗衣粉E00111100002111100031110000411100005111010

25、061110000711100 00811100 009111000101110001111100012011000130110001401111015011000160000001700110018010100190001002000001銷售記錄模塊的文件(.arff):relation supermarketattribute customer numericattribute xfs numericattribute yuyi numericattribute xz numericattribute rfs numericattribute xif numericdata001,1,1

26、,1,0,0002,1,1,1,1,0003,1,1,1,0,0004,1,1,1,0,0005,1,1,1,0,1006,1,1,1,0,0007,1,1,1,0,0008,1,1,1,0,0009,1,1,1,0,0010,1,1,1,0,0011,1,1,1,0,0012,0,1,1,0,0013,0,1,1,0,0014,0,1,1,1,1015,0,1,1,0,0016,0,0,0,0,0017,0,0,1,1,0018,0,1,0,1,0019,0,0,0,1,0020,0,0,0,0,1(2)我們對商品進(jìn)行銷售關(guān)聯(lián)分析首先計算各個項目集的支持度:商品的支持度=包含商品的事務(wù)數(shù)量/

27、全部事務(wù)數(shù)量;項集 X 的支持度 support(X)描述了項集 X 的重要性;經(jīng)過計算,結(jié)果如表所示。項目集的支持度項目集支持度項目集支持度項目集支持度A55%BC75%ACD5%B80%BD15%ACE5%C80%BE10%BCD10%D25%CD15%BCE10%E15%CE10%BDE5%AB55%DE5%CDE5%AC55%ABC55%ABCD5%AD5%ABD5%ABCE5%AE5%ABE5%(3)設(shè)定最小支持度為50%,進(jìn)一步計算置信度:( Lk 為k-頻繁項目集, X m-1為Lk 的非空子集)。經(jīng)過計算,結(jié)果如表所示。 項目集的支持度L kX m-1置信度LkXm-1置信度ABA100%ABCA100%ABB68.75%AB

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論