基于淘寶商務(wù)平臺(tái)的客戶購(gòu)物關(guān)聯(lián)分析研究_第1頁(yè)
基于淘寶商務(wù)平臺(tái)的客戶購(gòu)物關(guān)聯(lián)分析研究_第2頁(yè)
基于淘寶商務(wù)平臺(tái)的客戶購(gòu)物關(guān)聯(lián)分析研究_第3頁(yè)
基于淘寶商務(wù)平臺(tái)的客戶購(gòu)物關(guān)聯(lián)分析研究_第4頁(yè)
基于淘寶商務(wù)平臺(tái)的客戶購(gòu)物關(guān)聯(lián)分析研究_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))本本科科畢畢業(yè)業(yè)論論文文(設(shè)設(shè)計(jì)計(jì)) 中文題目: 基于淘寶商務(wù)平臺(tái)的客戶購(gòu)物關(guān)聯(lián)分析研究基于淘寶商務(wù)平臺(tái)的客戶購(gòu)物關(guān)聯(lián)分析研究 英文題目: Association Analysis of the Customer Shopping Based on Taobao Platform 目錄中英文摘要與關(guān)鍵詞中英文摘要與關(guān)鍵詞.1一、引言.2二、客戶購(gòu)物關(guān)聯(lián)分析.2(一)關(guān)聯(lián)分析技術(shù).2(二)客戶購(gòu)物關(guān)聯(lián)挖掘過(guò)程.3三、淘寶商務(wù)平臺(tái)數(shù)據(jù)分析.5(一)分析對(duì)象.5(二)數(shù)據(jù)準(zhǔn)備.7(三)數(shù)據(jù)處理.8(四)關(guān)聯(lián)挖掘.11(五)關(guān)聯(lián)結(jié)果分析.15南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)

2、計(jì))1四、淘寶商務(wù)平臺(tái)中的關(guān)聯(lián)規(guī)則應(yīng)用 .17(一)客戶分析.17(二)商品營(yíng)銷.18五、結(jié)論.19參考文獻(xiàn)參考文獻(xiàn).21附錄附錄.23附錄:原始數(shù)據(jù).23基于淘寶商務(wù)平臺(tái)的客戶購(gòu)物關(guān)聯(lián)分析研究摘要:摘要:淘寶網(wǎng)站作為國(guó)內(nèi)最大的電子商務(wù)平臺(tái),擁有龐大的消費(fèi)群體和海量的交易數(shù)據(jù)。如何對(duì)淘寶商務(wù)平臺(tái)上大量的數(shù)據(jù)進(jìn)行有效的收集、組織、挖掘和利用,找出其中真正有價(jià)值的信息和知識(shí),以指導(dǎo)企業(yè)的商業(yè)決策行為,成為電子商務(wù)經(jīng)營(yíng)者關(guān)注的問(wèn)題。關(guān)聯(lián)規(guī)則作為數(shù)據(jù)挖掘技術(shù)(Data Mining)中最為典型的一種,為解決這一問(wèn)題提供了有效途徑。通過(guò)關(guān)聯(lián)規(guī)則挖掘,找出商品之間、商品與客戶之間存在的內(nèi)在聯(lián)系,對(duì)于電子商

3、務(wù)中客戶關(guān)系管理、企業(yè)市場(chǎng)定位和商品營(yíng)銷有著非常重要的指導(dǎo)意義。針對(duì)目前淘寶平臺(tái)中客戶購(gòu)物數(shù)據(jù)的利用問(wèn)題,闡述了關(guān)聯(lián)規(guī)則挖掘的一般過(guò)程,并對(duì)采集的相關(guān)記錄數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,依據(jù)分析結(jié)果制定相應(yīng)的營(yíng)銷策略。關(guān)鍵詞:關(guān)鍵詞: 電子商務(wù);數(shù)據(jù)挖掘;關(guān)聯(lián)分析南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))2Association Analysis of the Customer Shopping Based on Taobao PlatformAbstract: Taobao platform has huge consumer groups and generates massive transaction dat

4、a every day. How to effectively collect, organize and mine these data based on taobao platform to detect the valuable information and guide the behavior of business decision-making, has become a key problem for e-commerce operators. As one of the most typical data mining techniques, association rule

5、s provide an effective way to solve this problem. It is important to find the internal relation between sales of goods and customers, which could be applied to customer relationship management, market position and sales strategy in e-commerce. To make effective use of data on Taobao platform, this t

6、hesis analyzes the process of association rule mining, and then perform the association analysis based the collected relevant data. Finally, the corresponding marketing strategies are given.Keywords: E-commerce; Data mining; Association analysis一、引言近些年來(lái)電子商務(wù)迅猛發(fā)展,給人們生活帶來(lái)了很多便利,同時(shí)也帶來(lái)了不少難題和挑戰(zhàn)。對(duì)于企業(yè)來(lái)說(shuō),進(jìn)行電子

7、商務(wù)轉(zhuǎn)型和發(fā)展,需要有互聯(lián)網(wǎng)思維,即能夠從海量的交易信息中找出有用的、有潛在價(jià)值的信息,以制定更好的經(jīng)營(yíng)策略;對(duì)于消費(fèi)者來(lái)說(shuō),需要花費(fèi)大量的時(shí)間和精力來(lái)瀏覽網(wǎng)上大量的商品信息,并從中比較和選購(gòu)商品。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘技術(shù)中的一種,它可以反映大量數(shù)據(jù)間特有的聯(lián)系,并將這種聯(lián)系轉(zhuǎn)化為數(shù)據(jù)使用者感興趣的信息,為企業(yè)或消費(fèi)者提供決策支持。用戶網(wǎng)上交易的原始數(shù)據(jù)是海量的,我們可以從電子商務(wù)交易中提取,也可以從百度指數(shù)和阿里指數(shù)等獲得。淘寶數(shù)據(jù)魔方、量子恒道和SAS等數(shù)據(jù)挖掘分析工具能夠幫助企業(yè)對(duì)這些數(shù)據(jù)進(jìn)行處理。目前電子商務(wù)平臺(tái)中關(guān)聯(lián)規(guī)則挖掘的普及度和專業(yè)度不高,無(wú)法深入提取數(shù)據(jù)中更優(yōu)質(zhì)的信息,并借助這

8、些信息去分析和發(fā)現(xiàn)客戶的消費(fèi)南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))3習(xí)慣和行為模式,從而改進(jìn)營(yíng)銷決策和客戶服務(wù)。論文針對(duì)關(guān)聯(lián)規(guī)則技術(shù)在淘寶交易數(shù)據(jù)中的應(yīng)用,實(shí)現(xiàn)指定支持度和置信度下,交易數(shù)據(jù)中關(guān)聯(lián)規(guī)則的挖掘,并對(duì)提取到的規(guī)則進(jìn)行分析,與淘寶商務(wù)平臺(tái)現(xiàn)狀結(jié)合,制定相應(yīng)的營(yíng)銷策略。二、客戶購(gòu)物關(guān)聯(lián)分析(一)(一)關(guān)聯(lián)分析技術(shù)關(guān)聯(lián)分析技術(shù)使用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則技術(shù)來(lái)對(duì)客戶購(gòu)物關(guān)聯(lián)進(jìn)行分析,能夠把隱沒(méi)在一大批看似雜亂無(wú)章的數(shù)據(jù)中的信息,集中、萃取和提煉出來(lái),以找出所研究對(duì)象的內(nèi)在規(guī)律。在互聯(lián)網(wǎng)時(shí)代發(fā)展到大數(shù)據(jù)時(shí)代,數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。然而,百分之八十的數(shù)據(jù)是非結(jié)構(gòu)化的,因此需要通過(guò)關(guān)聯(lián)挖掘從數(shù)據(jù)庫(kù)中存儲(chǔ)的

9、數(shù)據(jù)項(xiàng)中,找出數(shù)據(jù)中結(jié)構(gòu)化的、隱藏的聯(lián)系。這些數(shù)據(jù)聯(lián)系中的交叉性信息反應(yīng)隱含了客戶的潛在購(gòu)買行為,對(duì)電子商務(wù)企業(yè)的營(yíng)銷決策有著非常重要的價(jià)值。 購(gòu)物分析是關(guān)聯(lián)規(guī)則的一個(gè)典型案例。指的是當(dāng)顧客購(gòu)買一些商品A,B,C,D.它們一起購(gòu)買是偶然,還是顧客的購(gòu)買行為習(xí)慣?商品A和B同時(shí)購(gòu)買的概率有多大?如果兩者捆綁銷售是否會(huì)刺激顧客消費(fèi)?了解了顧客的購(gòu)買行為,能夠幫助企業(yè)制定市場(chǎng)營(yíng)銷策略。例如,什么樣的商品應(yīng)該放在一起,企業(yè)的顧客群體特征,顧客為什么購(gòu)買這些商品。在制定商品策略和優(yōu)化客戶服務(wù)時(shí),根據(jù)顧客需求,實(shí)施精準(zhǔn)營(yíng)銷。關(guān)聯(lián)規(guī)則挖掘的基本模型如圖 1 所示:輸入事務(wù)數(shù)據(jù)庫(kù)D輸出關(guān)聯(lián)規(guī)則集1.找出所有頻

10、繁項(xiàng)目集2.產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則用戶最最小小支支持持度度最最小小置置信信度度 圖圖 1 1 關(guān)聯(lián)規(guī)則挖掘的基本模型關(guān)聯(lián)規(guī)則挖掘的基本模型(1)輸入事務(wù)數(shù)據(jù)庫(kù) D,根據(jù)最小支持度找出其中所有的頻繁項(xiàng)目集。南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))4(2)由(1)中的頻繁項(xiàng)目集和最小置信度產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,在一定情況下,也可以通過(guò)附加興趣度來(lái)對(duì)規(guī)則進(jìn)行度量。第一個(gè)子問(wèn)題的核心是如何確定有效的支持度,以找出 D 中所有頻繁項(xiàng)目集。支持度是事務(wù)數(shù)據(jù)庫(kù) D 中包含項(xiàng)集 X 的事務(wù)數(shù)與事務(wù)數(shù)據(jù)庫(kù) D 的總事務(wù)數(shù)的比值,一般支持度越高越好,但是在實(shí)際關(guān)聯(lián)挖掘時(shí),需要根據(jù)業(yè)務(wù)需求不斷調(diào)整、嘗試,才能找到最合適的支持度;第二個(gè)子

11、問(wèn)題可以直接得到結(jié)果,但也需要根據(jù)不同的求解指標(biāo)如興趣度的度量標(biāo)準(zhǔn)來(lái)進(jìn)一步度量關(guān)聯(lián)規(guī)則集的合理性。(二)客戶購(gòu)物關(guān)聯(lián)挖掘過(guò)程(二)客戶購(gòu)物關(guān)聯(lián)挖掘過(guò)程1.確定業(yè)務(wù)問(wèn)題客戶購(gòu)物關(guān)聯(lián)挖掘的主要價(jià)值應(yīng)該是決策或者輔佐決策,因此評(píng)價(jià)關(guān)聯(lián)分析的原點(diǎn)是能否滿足業(yè)務(wù)需求,解決存在的業(yè)務(wù)問(wèn)題。深入理解業(yè)務(wù)本身,是避免迷失在大量數(shù)據(jù)中的前提。針對(duì)電子商務(wù)平臺(tái),這里所說(shuō)的業(yè)務(wù)問(wèn)題可以是流量轉(zhuǎn)化、活動(dòng)營(yíng)銷、關(guān)聯(lián)銷售、會(huì)員提升等。不同業(yè)務(wù)的關(guān)鍵需求決定了關(guān)聯(lián)分析的目標(biāo)用戶和目標(biāo)價(jià)值。2.數(shù)據(jù)探測(cè)在確定業(yè)務(wù)問(wèn)題后就要選擇相關(guān)的數(shù)據(jù),有效挖掘的關(guān)鍵問(wèn)題有:數(shù)據(jù)來(lái)源、數(shù)據(jù)量、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)平衡和數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)來(lái)源通常是淘寶

12、商務(wù)平臺(tái)的消費(fèi)者交易數(shù)據(jù)和流量數(shù)據(jù)。數(shù)據(jù)量并不是越大越好,要以效用為導(dǎo)向,以實(shí)用價(jià)值為指標(biāo),結(jié)合不同的階段性目標(biāo),進(jìn)行數(shù)據(jù)采集分析。具有一定規(guī)模的企業(yè)或公司會(huì)有自己的數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)海量數(shù)據(jù),對(duì)于規(guī)模很小的店鋪或個(gè)人創(chuàng)業(yè)等,可以借助電商平臺(tái)如淘寶指數(shù),或利用數(shù)據(jù)庫(kù)軟件如 Oracle,SQL Server,IBM DB2,MySQL 等,來(lái)存儲(chǔ)和有組織的管理各種網(wǎng)站流量數(shù)據(jù)和客戶購(gòu)物交易數(shù)據(jù)。數(shù)據(jù)平衡是結(jié)合每個(gè)企業(yè)自身實(shí)際,規(guī)劃設(shè)計(jì)數(shù)據(jù)表的特點(diǎn)和結(jié)構(gòu)。很多情況下數(shù)據(jù)的質(zhì)量難以保證,充分的數(shù)據(jù)探測(cè)是為了了解數(shù)據(jù)的分布、變化趨勢(shì)和數(shù)據(jù)關(guān)系。將非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化可理解的、可用的結(jié)構(gòu)化數(shù)據(jù),即對(duì)應(yīng)的分布與

13、統(tǒng)計(jì)信息,有助于全面了解數(shù)據(jù)特征,并建立客戶購(gòu)南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))5物關(guān)聯(lián)挖掘模型。3.數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理有助于為客戶購(gòu)物關(guān)聯(lián)分析提供高質(zhì)量的數(shù)據(jù)?,F(xiàn)實(shí)中數(shù)據(jù)大體上是不完整的、不一致的臟數(shù)據(jù),無(wú)法直接進(jìn)行關(guān)聯(lián)分析,需要進(jìn)行清理、集成、變換和歸約,來(lái)糾正各種數(shù)據(jù)質(zhì)量問(wèn)題,否則可能會(huì)影響客戶購(gòu)物關(guān)聯(lián)分析得到的結(jié)果。4.數(shù)據(jù)建模(挖掘)對(duì)于電商平臺(tái)的客戶購(gòu)物關(guān)聯(lián)分析需要選擇關(guān)聯(lián)規(guī)則方法,結(jié)合商務(wù)智能分析軟件如 WEKA、SQL Server、IBM cognis 等對(duì)相應(yīng)的數(shù)據(jù)進(jìn)行挖掘分析。5.結(jié)果評(píng)估關(guān)聯(lián)分析后會(huì)輸出許多模式,對(duì)相關(guān)模式的合理性進(jìn)行測(cè)試和評(píng)估是必要的。企業(yè)認(rèn)可的與消費(fèi)

14、者認(rèn)可的結(jié)果不一定相同,甚至可能是相悖的。這個(gè)階段與業(yè)務(wù)人員的充分溝通、比對(duì)網(wǎng)站的交易數(shù)據(jù)是保證其效用最大化的有效途徑。6.應(yīng)用部署將分析的關(guān)聯(lián)結(jié)果應(yīng)用到商務(wù)決策中,在客戶關(guān)系管理、個(gè)性化推薦、商品營(yíng)銷、提高轉(zhuǎn)化率等方面,制定具體的、可執(zhí)行的、可管控的戰(zhàn)略實(shí)施計(jì)劃,以產(chǎn)生經(jīng)濟(jì)效益。三、淘寶商務(wù)平臺(tái)數(shù)據(jù)分析淘寶商務(wù)平臺(tái)中的數(shù)據(jù),信息量巨大,結(jié)構(gòu)復(fù)雜,類型眾多。對(duì)購(gòu)物數(shù)據(jù)的分析,不再局限于商品名稱、商品類型、商品價(jià)格和交易時(shí)間,也包括購(gòu)買商品的客戶信息。很多商家只是把這些交易信息當(dāng)作一個(gè)展示頁(yè)面,但基于交易數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘還是不夠深入,缺乏專業(yè)的挖掘工具和分析工具以及專業(yè)的分析人員對(duì)這些信息的潛

15、在性進(jìn)行挖掘和分析。(一)分析對(duì)象(一)分析對(duì)象淘寶商務(wù)平臺(tái)中的商品品種繁多,價(jià)格相對(duì)便宜,支付方便,易于消費(fèi)者選購(gòu),深受廣大網(wǎng)絡(luò)消費(fèi)者的歡迎,淘寶中的客戶購(gòu)物數(shù)據(jù)龐大,關(guān)聯(lián)性高,蘊(yùn)含的信息多。南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))6所以本文選取淘寶商務(wù)平臺(tái)中 305 個(gè)用戶在淘寶天貓超市中交易記錄,來(lái)挖掘潛在的、有價(jià)值的信息。首先可以利用圖表看一下這些記錄展示出來(lái)的數(shù)據(jù)信息。圖圖 2 2 性別分布餅圖性別分布餅圖圖圖 3 3 職業(yè)分布柱狀圖職業(yè)分布柱狀圖由圖 2、圖 3 可以得出,天貓的消費(fèi)人群與淘寶網(wǎng)相比,更偏女性化,即女性消費(fèi)者占比更高;學(xué)生群體消費(fèi)比重大,可以看出目前網(wǎng)絡(luò)消費(fèi)者總體較為年輕;

16、消費(fèi)人群學(xué)歷水平整體較高。南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))7圖圖 4 4 購(gòu)買類目柱狀圖購(gòu)買類目柱狀圖從購(gòu)買類目上看,購(gòu)買進(jìn)口食品的可能性值是 30.3%,購(gòu)買食品飲料的可能性值是83.33%,購(gòu)買油糧副食的可能性值是 15.15%,購(gòu)買美容洗護(hù)的可能性值是 42.42%,購(gòu)買家具家電的可能性值是 9.09%,購(gòu)買家庭清潔的可能性值是 42.42%,購(gòu)買母嬰用品的可能性值是 3.03%,購(gòu)買生鮮水果的可能性值是 10.61%,食品飲料、美容洗護(hù)、家庭清潔排在前三位,這與調(diào)查人群中女性占比例大,學(xué)生、家庭主婦、白領(lǐng)職業(yè)分布比重高有很大的關(guān)系。圖圖 5 5 購(gòu)買原因柱狀圖購(gòu)買原因柱狀圖在購(gòu)買原因中

17、,價(jià)格優(yōu)惠的認(rèn)可度是 5.38,物流速度快的認(rèn)可度是 4.8,質(zhì)量保障的認(rèn)可度是 4.44,品種豐富的認(rèn)可度是 4.26,配送范圍廣的認(rèn)可度是 2.2,優(yōu)惠促銷活動(dòng)豐富的認(rèn)可度是 2.14,支付方式完善的認(rèn)可度是 1.2,包裝規(guī)范的認(rèn)可度是 1,南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))8其他的認(rèn)可度是 0.83,運(yùn)費(fèi)便宜的認(rèn)可度是 0.76。由此說(shuō)明價(jià)格、物流、商品質(zhì)量、品種數(shù)量等因素對(duì)客戶購(gòu)買決策的影響很大。圖圖 6 6 受吸引的優(yōu)惠活動(dòng)柱狀圖受吸引的優(yōu)惠活動(dòng)柱狀圖對(duì)消費(fèi)者而已,最受吸引的優(yōu)惠活動(dòng)中,直接打折降價(jià)吸引度為 66.67%,限時(shí)搶購(gòu)、低價(jià)秒殺吸引度為 45.45%,團(tuán)購(gòu)吸引度為 28.7

18、9%,積分兌換券、抵用券吸引度為25.76%,滿指定金額包郵、禮品卡和購(gòu)買得贈(zèng)品吸引度為 24.24%,名品特賣吸引度為19.7%,抽獎(jiǎng)和其他吸引度為 6.06%。直接打折降價(jià)雖然是比較傳統(tǒng)的優(yōu)惠活動(dòng),消費(fèi)者尤其是女性消費(fèi)者會(huì)對(duì)這類活動(dòng)樂(lè)此不疲,所以淘寶商務(wù)平臺(tái)經(jīng)常會(huì)在各種節(jié)假日開(kāi)展優(yōu)惠活動(dòng)。以上是部分展示出來(lái)的數(shù)據(jù)信息,這些數(shù)據(jù)信息比較單一,為商家的決策提供的價(jià)值有限,無(wú)法提供更深層次的、隱藏的信息,所以需要通過(guò)關(guān)聯(lián)分析將企業(yè)面臨的業(yè)務(wù)問(wèn)題和研究的分析框架相結(jié)合,推導(dǎo)出具有實(shí)用價(jià)值的結(jié)論。(二)數(shù)據(jù)準(zhǔn)備(二)數(shù)據(jù)準(zhǔn)備代寫各專業(yè)碩博學(xué)位論文,代寫代發(fā) CSSCI、北大核心論文,合作加 QQ:9

19、7079517、 97079518 ; 微 電同號(hào):1580 1280 825。淘寶交易,安全無(wú)憂。CSSCI 來(lái)源期刊:電子政務(wù) 、 漢語(yǔ)學(xué)習(xí) 、 會(huì)計(jì)與經(jīng)濟(jì)研究 、 現(xiàn)代中文學(xué)刊 、 甘肅行政學(xué)院南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))9學(xué)報(bào) 、 天津體育學(xué)院學(xué)報(bào) 民族學(xué)刊 、 大學(xué)教育科學(xué) 、 金融論壇 、 南方經(jīng)濟(jì)、 東北亞論壇 、 寧夏社會(huì)科學(xué) 、 法商研究 、 云南社會(huì)科學(xué) 、 人文雜志 、 甘肅社會(huì)科學(xué) 、 東北大學(xué)學(xué)報(bào) 、 自然資源與環(huán)境 。審稿周期:35-90 天辦結(jié)查稿。北大核心期刊:西安理工大學(xué)學(xué)報(bào) 、 心理與行為研究 、 統(tǒng)計(jì)與信息論壇 、 人口與發(fā)展 、廣西民族大學(xué)學(xué)報(bào).哲學(xué)

20、社會(huì)科學(xué)版 、 南昌大學(xué)學(xué)報(bào)理科版 、 現(xiàn)代法學(xué) 、 江西財(cái)經(jīng)大學(xué)學(xué)報(bào) 、 武漢金融 、 學(xué)校黨建與思想教育 、 成人教育 、 中國(guó)科技翻譯審稿周期:35-90 天辦結(jié)查稿。普刊:中國(guó)新通信 、 蘭臺(tái)內(nèi)外 、 中國(guó)多媒體與網(wǎng)絡(luò)教學(xué)學(xué)報(bào) 、 農(nóng)村科學(xué)實(shí)驗(yàn) 、 今日財(cái)富 、 心血管外科 中國(guó)結(jié)合醫(yī)學(xué) 、 經(jīng)貿(mào)實(shí)踐 、 語(yǔ)文課內(nèi)外 、記者觀察 、 新課程 、 現(xiàn)代職業(yè)教育 、 建筑與裝飾 、 畜牧獸醫(yī)科學(xué) 、 化工管理 、 魅力中國(guó) 、 人力資源管理 、 新教育時(shí)代 、 心理月刊等 300 多家國(guó)家級(jí)、省級(jí)普刊。審稿周期:1-7 天辦結(jié)查稿。將原始數(shù)據(jù)中與客戶特征、使用情況等信息保存為用戶信息表(t

21、b_user) ,與購(gòu)買商品有關(guān)的保存為商品購(gòu)買表(tb_good) ,以 Oracle 數(shù)據(jù)庫(kù)為載體記錄相關(guān)表格。兩表的部分信息如下:表表 1 1 用戶信息表用戶信息表編號(hào)字段字段解釋1id序號(hào)2ip用戶 IP3sex性別4age年齡南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))105education受教育程度6vocation職業(yè)7icome月收入或生活費(fèi)8frequency最近三個(gè)月購(gòu)物的總次數(shù)9cost平均每次購(gòu)物的總花費(fèi)表表 2 2 商品購(gòu)買表商品購(gòu)買表編號(hào)字段字段解釋1id序號(hào)2ip用戶 IP3import_milk進(jìn)口牛奶4import_cookie進(jìn)口餅干/糕點(diǎn)(三)數(shù)據(jù)處理(三)數(shù)據(jù)處理

22、原始的數(shù)據(jù)通常由于主、客觀原因,會(huì)包含異常數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)或重復(fù)數(shù)據(jù),是不能直接進(jìn)行關(guān)聯(lián)分析的,因此必須進(jìn)行數(shù)據(jù)預(yù)處理。1.數(shù)據(jù)選擇首先是篩選用戶信息表,用戶的性別、年齡、受教育程度、月收入或生活費(fèi)、最近三個(gè)月購(gòu)物的總次數(shù)、平均每次購(gòu)物的總花費(fèi)等屬性,這些屬性能夠預(yù)測(cè)顧客的購(gòu)買行為,對(duì)推薦產(chǎn)生作用;而次要屬性比如序號(hào),用戶IP 等屬性對(duì)于統(tǒng)計(jì)分析是必要的,但是關(guān)聯(lián)分析可以刪除。對(duì)于商品購(gòu)買表,客戶購(gòu)買的產(chǎn)品涉及50種,要從中選取出購(gòu)買頻率高的前 10 位產(chǎn)品,所以先做一個(gè)簡(jiǎn)單的統(tǒng)計(jì),然后篩選下能夠進(jìn)行關(guān)聯(lián)分析的購(gòu)買相對(duì)較多的產(chǎn)品。選擇后兩表的字段如下:表表 3 3 數(shù)據(jù)選擇后用戶信息表數(shù)據(jù)選擇后

23、用戶信息表編號(hào)字段字段解釋1sex性別2age年齡南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))113education受教育程度4icome月收入或生活費(fèi)5frequency最近三個(gè)月購(gòu)物的總次數(shù)6cost平均每次購(gòu)物的總花費(fèi)7reason選擇在這購(gòu)物的理由8campaign最喜歡的優(yōu)惠活動(dòng)9way下單方式10satisfaction滿意度表表 4 4 數(shù)據(jù)選擇后商品購(gòu)買表數(shù)據(jù)選擇后商品購(gòu)買表編號(hào)字段字段解釋1import進(jìn)口零食2sweet糖果/巧克力3drink飲料/水4protein肉類/豆干制品5cookie餅干糕點(diǎn)6milk牛奶乳品7nut堅(jiān)果炒貨8washing個(gè)人洗護(hù)9tissue紙制品/衛(wèi)

24、生紙10fruit水果2.數(shù)據(jù)清理數(shù)據(jù)清理以提高數(shù)據(jù)質(zhì)量為目標(biāo),將數(shù)據(jù)質(zhì)量提高到挖掘技術(shù)所要求的水平。去掉不完整的數(shù)據(jù)和噪聲數(shù)據(jù),提高數(shù)據(jù)挖掘結(jié)果的質(zhì)量。例如將一行記錄中全是空值的記錄,殘缺的記錄去除,以方便進(jìn)行數(shù)據(jù)挖掘。清理后最終留下300 條記錄。3.數(shù)據(jù)轉(zhuǎn)換主要是對(duì)數(shù)據(jù)進(jìn)行規(guī)格化操作,來(lái)適應(yīng)關(guān)聯(lián)分析工具和相應(yīng)的算法。常用的開(kāi)源挖掘工具如 WEKA、RapidMiner、NLTK、Orange 等,需要將字符集轉(zhuǎn)換為英文,南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))12否則可能出現(xiàn)亂碼的情況。常見(jiàn)的關(guān)聯(lián)規(guī)則算法,如Apriori 算法是布爾類型的算法,原始數(shù)據(jù)表格中所使用的字段,數(shù)據(jù)類型不一的,需要進(jìn)

25、行轉(zhuǎn)化成相應(yīng)的布爾類型:(1)量化屬性離散化:對(duì)于數(shù)值類型的屬性,需要進(jìn)行離散化處理,先進(jìn)行最大最小值統(tǒng)計(jì),對(duì)于如果最大值是離群點(diǎn),可以選擇相對(duì)正常的較高值作為最大值,再劃分為幾個(gè)區(qū)間。例如用戶信息表中的 “月收入或生活費(fèi)、最近三個(gè)月購(gòu)物的總次數(shù)、平均每次購(gòu)物的總花費(fèi) ”字段就是數(shù)值屬性。根據(jù)取值的分布規(guī)律,我們將月收入或生活費(fèi)其劃分為五個(gè)組,分別是0-1500(1) 、1501-3000(2) 、3001-5000(3) 、5001-10000(4)和 10001-20000(5) 。將最近三個(gè)月購(gòu)物的總次數(shù)分成三個(gè)組,分別是 0-2 次(1) ,3-5 次(2) ,5 次以上(3) ,將平

26、均每次購(gòu)物的總花費(fèi)分成 6 個(gè)組,分別是 50 元及以下( 1) ,51-100 元(2) ,101-300 元(3) ,301-500 元(4) ,501-1000 元(5) ,1000 元以上(6) 。(2)類別屬性轉(zhuǎn)化:用戶戶信息表中的 “性別”字段,需要轉(zhuǎn)化為 M(男)和 F(女)這樣的布爾型; “受教育程度 ”可分為 college(大專及以下) 、undergraduate(本科) ;“選擇在這購(gòu)物的理由 ”可分為 price(價(jià)格優(yōu)惠) 、pay(支付方式完善) 、logistics(物流速度快) 、quality(質(zhì)量保障) 、variety(品種豐富) 、promotion(

27、優(yōu)惠促銷活動(dòng)豐富)。 “最喜歡的優(yōu)惠活動(dòng)、下單方式、滿意度 ”三個(gè)字段按照以上方式依次進(jìn)行類別布爾轉(zhuǎn)換。對(duì)于商品購(gòu)買表,需要處理為布爾矩陣格式,即每行表示一條交易記錄,列中的 yes/no 值表示這條記錄中顧客是否購(gòu)買了該商品,并不考慮各個(gè)商品自身的價(jià)格、購(gòu)買單位等。最終完成轉(zhuǎn)化的表部分?jǐn)?shù)據(jù)如下:南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))13圖圖 7 7 數(shù)據(jù)轉(zhuǎn)化后用戶信息表數(shù)據(jù)轉(zhuǎn)化后用戶信息表圖圖 8 8 數(shù)據(jù)轉(zhuǎn)化后商品購(gòu)買表數(shù)據(jù)轉(zhuǎn)化后商品購(gòu)買表(四)關(guān)聯(lián)挖掘(四)關(guān)聯(lián)挖掘本文將使用挖掘工具 WEKA 來(lái)進(jìn)行關(guān)聯(lián)挖掘。 WEKA 的全名是懷卡托智能分析環(huán)境,是一款開(kāi)源數(shù)據(jù)挖掘軟件,集合了大量數(shù)據(jù)挖掘算

28、法和數(shù)據(jù)處理功能,關(guān)聯(lián)規(guī)則是其中典型的一種。點(diǎn)擊啟動(dòng)運(yùn)行 WEKA 軟件后,發(fā)現(xiàn) WEKA 存儲(chǔ)數(shù)據(jù)的格式是 ARFF 文件。除了ARFF 格式,WEKA 還支持另外一種常見(jiàn)格式, CSV 格式。而對(duì)于保存在數(shù)據(jù)庫(kù)中的南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))14數(shù)據(jù),WEKA 支持 JDBC 訪問(wèn)數(shù)據(jù)庫(kù)。具體的挖掘過(guò)程如下:1.導(dǎo)入數(shù)據(jù)環(huán)境:(1)主機(jī):Weka 3.8,PL/SQL,ojdbc14.jar(2)VMware Workstation:Oracle11g連接步驟:(1)安裝 weka 軟件,完成后將 oracle 的架包 ojdbc14.jar 放到 weka 安裝目錄(D:/Progr

29、am Files/Weka-3-8/)下;(2)打開(kāi) D:/Program Files/Weka-3-8/weka.jar 這個(gè)文件,修改文件weka.jar-weka-experiment-DatabaseUps.oracle ,指定虛擬機(jī)中的oracle 數(shù)據(jù)庫(kù)為連接的 jdbc,設(shè)置相應(yīng)的數(shù)據(jù)庫(kù)的 URL、端口號(hào)和數(shù)據(jù)庫(kù)名:“jdbcURL=jdbc:oracle:thin::1521:XE” ,然后將文件另存為DatabaseUps,刪除安裝目錄下的原文件。(3)打開(kāi) D:/Program Files/Weka-3-8/目錄下的

30、 runweka.ini 文件,找到最后一行,設(shè)置環(huán)境變量:cp=%CLASSPATH%;D:/Program Files/Weka-3-8/lib/ojdbc14.jar。(4)重新啟動(dòng) weka,選擇進(jìn)入 Explorer 應(yīng)用,以 Open DB 方式載入 SQL-Viewer 界面,此時(shí) Connection-URL 文本框中已經(jīng)自動(dòng)設(shè)置為DatabaseUps 中的值“jdbc:oracle:thin::1521:XE” ,點(diǎn)擊 User 按鈕,設(shè)置數(shù)據(jù)庫(kù)連接的 Username 和 Password,分別為 HR 和123456。如圖 9

31、所示南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))15圖圖 9 9 數(shù)據(jù)庫(kù)連接配置數(shù)據(jù)庫(kù)連接配置點(diǎn)擊 OK 后連接,如果連接成功, Info 下會(huì)顯示提醒信息。(5)在 Query 窗口中根據(jù)查詢需要輸入 SQL 語(yǔ)句“select * from tb_user”和“select * from tb_good”,點(diǎn)擊“Execute”按鈕執(zhí)行,可在“Result”框下看到對(duì)應(yīng)的表格數(shù)據(jù)。如圖 10 所示圖圖 1010 查詢的結(jié)果集查詢的結(jié)果集(6)點(diǎn)擊“OK”按鈕即可導(dǎo)入。如圖 11 所示圖圖 1111 數(shù)據(jù)導(dǎo)入完成數(shù)據(jù)導(dǎo)入完成南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))162.關(guān)聯(lián)規(guī)則分析作關(guān)聯(lián)規(guī)則的分析,將 WEK

32、A 切換到“Associate”選項(xiàng)卡??蛇x擇的算法有Apriori、FilteredAssociator、FPGrowth,默認(rèn)使用 Apriori 算法。如果發(fā)現(xiàn)該算法呈現(xiàn)灰色不能點(diǎn)擊,可能是數(shù)據(jù)不符合類型,需要重新調(diào)整數(shù)據(jù)。 關(guān)聯(lián)規(guī)則是形如 L-R 的規(guī)則,它的重要指標(biāo)支持度( Support)和置信度(Confidence) ,描述了其有用性和確定性。對(duì)于客戶購(gòu)物關(guān)聯(lián)分析來(lái)說(shuō),支持度s(L-R)就是購(gòu)買了一些商品中同時(shí)觀察到商品L 和 R 的概率,而置信度就是所有購(gòu)買了 L 商品的記錄中時(shí) L 和 R 的同時(shí)存在的概率。支持度和置信度都較高的規(guī)則實(shí)用價(jià)值比較高。Apriori 算法的基

33、本思想是先設(shè)置最小支持度和最小置信度,通過(guò)對(duì)n 條記錄產(chǎn)生候選頻繁項(xiàng)集進(jìn)行支持度和置信度進(jìn)行計(jì)算,將滿足最小支持度和最小置信度的項(xiàng)集保留下來(lái),作為新的記錄,再次產(chǎn)生候選頻繁項(xiàng)集。通過(guò)迭代,最后記錄中所有滿足要求的頻繁項(xiàng)集就是關(guān)聯(lián)規(guī)則。點(diǎn)擊“Choose”右邊的文本框修改默認(rèn)的參數(shù),計(jì)劃挖掘出最小支持度(lowerBoundMinSupport)為 20%,并且最小置信度( minMetric)為 90%的關(guān)聯(lián)規(guī)則。將“metricType”設(shè)為 confidence,其他參數(shù)不變。如圖 12 所示圖圖 1212 支持度、置信度設(shè)置支持度、置信度設(shè)置點(diǎn)擊“start”得到結(jié)果如下:南京財(cái)經(jīng)大學(xué)本

34、科畢業(yè)論文(設(shè)計(jì))17圖圖 1313 用戶信息關(guān)聯(lián)結(jié)果用戶信息關(guān)聯(lián)結(jié)果圖圖 1414 商品購(gòu)買關(guān)聯(lián)結(jié)果商品購(gòu)買關(guān)聯(lián)結(jié)果(五)關(guān)聯(lián)結(jié)果分析(五)關(guān)聯(lián)結(jié)果分析Apriori 算法的參數(shù),設(shè)置最小支持度為 20%,最小項(xiàng)集大小為 0,這兩項(xiàng)值可根據(jù)實(shí)際情況進(jìn)行設(shè)置。通過(guò)關(guān)聯(lián)規(guī)則算法找到了那些頻繁項(xiàng)目集,每一條對(duì)應(yīng)的可得到的結(jié)論為:1.用戶信息表(1)性別為女,購(gòu)買頻率在 0-2 次的人,下單方式為手機(jī)的概率為100%;(2)性別為女,喜愛(ài)的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為 100%;(3)喜愛(ài)的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為98%;(4)購(gòu)買頻率在 0-2 次,

35、喜愛(ài)的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))18手機(jī)的概率為 97%;(5)受教育程度為本科,喜愛(ài)的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為 97%;(6)平均每次在天貓超市購(gòu)物的總花費(fèi) 為 51-100 元的人,下單方式為手機(jī)的概率為 97%;(7)購(gòu)買頻率在 0-2 次的人,下單方式為手機(jī)的概率為96%;(8)滿意度為“基本能滿足 ”的人,下單方式為手機(jī)的概率為 95%;(9)受教育程度為本科,購(gòu)買頻率在0-2 次的人,下單方式為手機(jī)的概率為95%;(10)性別為女,下單方式為手機(jī)的概率為92%;2.商品購(gòu)買表(1)購(gòu)買了肉類 /豆干制品并且購(gòu)買了

36、水果的人,會(huì)購(gòu)買紙制品 /衛(wèi)生紙的概率為 99%;(2)購(gòu)買了肉類 /豆干制品、餅干糕點(diǎn)和水果的人,會(huì)購(gòu)買紙制品 /衛(wèi)生紙的概率為 98%;(3)購(gòu)買了進(jìn)口零食并且購(gòu)買了個(gè)人洗護(hù)的人,會(huì)購(gòu)買肉類/豆干制品的概率為 95%;(4)購(gòu)買了糖果 /巧克力、肉類 /豆干制品和堅(jiān)果炒貨的人,會(huì)購(gòu)買餅干糕點(diǎn)的概率為 93%;(5)不購(gòu)買飲料 /水但購(gòu)買肉類 /豆干制品和紙制品 /衛(wèi)生紙的人,會(huì)購(gòu)買餅干糕點(diǎn)的概率為 91%;(6)購(gòu)買了肉類 /豆干制品、牛奶乳品但沒(méi)有購(gòu)買水果的人,會(huì)購(gòu)買堅(jiān)果炒貨的概率為 91%;(7)購(gòu)買了糖果 /巧克力和肉類 /豆干制品的人,會(huì)購(gòu)買餅干糕點(diǎn)的概率為91%;南京財(cái)經(jīng)大學(xué)本科

37、畢業(yè)論文(設(shè)計(jì))19(8)購(gòu)買了糖果 /巧克力但沒(méi)有飲料 /水的人,會(huì)購(gòu)買餅干糕點(diǎn)的概率為91%。這些結(jié)論和目前已經(jīng)得到日??蛻糍?gòu)買的情況是一致的,可以作為重要參考,這證明了關(guān)聯(lián)規(guī)則算法在淘寶商務(wù)平臺(tái)客戶購(gòu)物中的有效性。四、淘寶商務(wù)平臺(tái)中的關(guān)聯(lián)規(guī)則應(yīng)用(一)客戶分析(一)客戶分析根據(jù)關(guān)聯(lián)結(jié)果,找出顧客群體的特征,依據(jù)特征,進(jìn)行客戶細(xì)分,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷。表表 5 5 客戶特征組合表客戶特征組合表編號(hào)客戶特征1女、0-2 次、手機(jī)下單2女、直接打折降價(jià)、手機(jī)下單3直接打折降價(jià)、手機(jī)下單40-2 次、直接打折降價(jià)、手機(jī)下單5本科、直接打折降價(jià)、手機(jī)下單651-100 元、手機(jī)下單70-2 次、手機(jī)下單

38、8“基本能滿足” 、手機(jī)下單9本科、0-2 次、手機(jī)下單10女、手機(jī)下單根據(jù)以上特征可以對(duì)營(yíng)銷策略做出幾點(diǎn)改進(jìn):(1)提高顧客的購(gòu)買興趣。 由關(guān)聯(lián)結(jié)果可知購(gòu)買頻率在 0-2 次,每次花費(fèi)在51-100 元的女性顧客通過(guò)手機(jī)下單的概率高,為了提高購(gòu)買頻率和刺激顧客的購(gòu)買興趣,可以對(duì)這些購(gòu)買頻率低的顧客推送一些快速瀏覽、即興需求的并且有優(yōu)惠活動(dòng)的商品,以適應(yīng)移動(dòng)端購(gòu)物的特點(diǎn)?!爸苯哟蛘劢祪r(jià) ”能直接的利用顧客對(duì)價(jià)格的敏感心理,促使顧客做出購(gòu)買的決定。像 特價(jià)只剩 24 小時(shí)!這樣的限期供應(yīng),能夠幫助激發(fā)消費(fèi)者的購(gòu)買欲。但是要真實(shí),否則最終失去消費(fèi)者信任。(2)讓顧客能較長(zhǎng)時(shí)間的停留瀏覽商品。客戶群

39、體中女性占比大,學(xué)生、家庭南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))20主婦較多,這就不僅僅是標(biāo)題的是否吸引人的問(wèn)題。在這里針對(duì)她們的購(gòu)買習(xí)慣,對(duì)商品詳情的描述非常關(guān)鍵,要盡量采用實(shí)地拍攝的商品圖片,少用官方圖片,以提高顧客對(duì)商家的信任度;還要有詳細(xì)的文字說(shuō)明,不能幾個(gè)字草草了事;對(duì)于商品屬性和規(guī)格的描述要盡可能的詳細(xì);使用相關(guān)模板并利用Photoshop 對(duì)圖片進(jìn)行編輯等,以提高其美觀度來(lái)吸引顧客的眼球。(3)讓新顧客變成老顧客。事實(shí)證明,網(wǎng)店留住老顧客比開(kāi)發(fā)新顧客要重要的多,前者的成本也要遠(yuǎn)低于后者。這里要充分利用顧客的情感,讓顧客感覺(jué)到一絲溫馨。比如在發(fā)貨時(shí),根據(jù)商品搭配一個(gè)小禮品,給顧客一個(gè)驚喜

40、;在節(jié)假日,通過(guò)短信、郵件等工具送去溫馨的祝福,同時(shí)可以根據(jù)顧客的消費(fèi)頻率和每次消費(fèi)金額分組, “VIP 客戶、黃金客戶、普通客戶 ”等,給予不同的優(yōu)惠待遇,以此來(lái)加深與顧客的關(guān)系,增加顧客對(duì)網(wǎng)店的認(rèn)可度和忠誠(chéng)度。(二)商品(二)商品營(yíng)銷營(yíng)銷由以上對(duì)商品購(gòu)買的關(guān)聯(lián)規(guī)則分析結(jié)果,對(duì)商品營(yíng)銷做出改進(jìn),可以從以下幾個(gè)方面入手:1.商品目錄商品目錄包括全面的導(dǎo)航條和相關(guān)產(chǎn)品展示。對(duì)于淘寶商務(wù)平臺(tái)中的天貓超市,它將進(jìn)口食品和食品飲料放在導(dǎo)航區(qū)的上端、訪問(wèn)頻率高的位置是合理的。收集的數(shù)據(jù)中購(gòu)買前 10 名的多為食品類,并且進(jìn)口食品和食品飲料一起購(gòu)買的概率在90%以上。對(duì)于相關(guān)產(chǎn)品展示區(qū),一般的食品類店鋪可

41、以將牛奶、餅干、肉類/豆干制品等顧客愿意購(gòu)買的組合放在典型商品展示區(qū)。2.商品廣告有效的廣告投入可以增加網(wǎng)站的瀏覽量,從而幫助提高銷售額。在淘寶網(wǎng)首頁(yè)鉆展展示區(qū)可以投放店鋪活動(dòng)、品牌宣傳,例如強(qiáng)調(diào)主打的肉類/豆干制品、餅干糕點(diǎn)、糖果/巧克力等熱賣商品正在搞活動(dòng);而類似小圖、旺旺彈窗小圖等站位,可以做單品、新品宣傳,建議是熱賣種類里面的具體商品,例如糖果/巧克力種類南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))21里面具體的熱賣的費(fèi)列羅巧克力在打折,可以單獨(dú)為其投放廣告,帶來(lái)可靠回報(bào)的概率大。3.交叉銷售商品的低位定價(jià)策略在電子商務(wù)低成本的環(huán)境下并不一定一直有效,需要配合其他的銷售策略一起實(shí)施。交叉銷售就是在

42、客戶購(gòu)買了一種商品,向其推薦他具有潛在購(gòu)買欲望的商品。關(guān)聯(lián)規(guī)則發(fā)現(xiàn)了客戶隱藏的購(gòu)買需求,這些交叉銷售的組合有:表表 6 6 商品銷售組合表商品銷售組合表編號(hào)銷售組合1肉類/豆干制品、水果、紙制品/衛(wèi)生紙2肉類/豆干制品、餅干糕點(diǎn)、水果、紙制品/衛(wèi)生紙3進(jìn)口零食、個(gè)人洗護(hù)、肉類/豆干制品4糖果/巧克力、肉類/豆干制品、堅(jiān)果炒貨、餅干糕點(diǎn)5肉類/豆干制品、紙制品/衛(wèi)生紙、餅干糕點(diǎn)6肉類/豆干制品、牛奶乳品、堅(jiān)果炒貨7糖果/巧克力、肉類/豆干制品、餅干糕點(diǎn)8糖果/巧克力、餅干糕點(diǎn)在促銷時(shí)將類似 “肉類/豆干制品+餅干糕點(diǎn)”的組合放在一起,一起打折,或者買一贈(zèng)一。即使本來(lái)客戶打算只買肉類 /豆干制品這

43、一種商品,但看見(jiàn)餅干糕點(diǎn)同時(shí)在促銷時(shí),也會(huì)超出預(yù)想清單,實(shí)施購(gòu)買。在這些關(guān)聯(lián)規(guī)則中,也會(huì)發(fā)現(xiàn)一些有趣的組合,如 “肉類/豆干制品、水果、紙制品 /衛(wèi)生紙” ,分析可知,紙制品與食品同時(shí)購(gòu)買,一方面是消費(fèi)者享用食物時(shí)會(huì)需要紙巾清理垃圾,另一方面為了湊滿 88 元包郵,消費(fèi)者會(huì)選擇使用期限較長(zhǎng),不會(huì)變質(zhì)的商品來(lái)湊單,所以在零食類商品打折促銷時(shí),將紙制品類商品以一個(gè)小于零食類商品打折幅度的折扣進(jìn)行優(yōu)惠,就會(huì)滿足消費(fèi)者湊單的需求。這些生動(dòng)化的商品組合,不僅減輕了顧客的選擇顧慮,同時(shí)提升了客單量,增強(qiáng)了用戶粘性。五、結(jié)論本文基于關(guān)聯(lián)規(guī)則,根據(jù)客戶購(gòu)物關(guān)聯(lián)分析的一般過(guò)程對(duì)采集的數(shù)據(jù)進(jìn)行有針南京財(cái)經(jīng)大學(xué)本科

44、畢業(yè)論文(設(shè)計(jì))22對(duì)性的分析,并將提取到的規(guī)則運(yùn)用到電子商務(wù)的應(yīng)用中。由此可知,有效的電子商務(wù)數(shù)據(jù)關(guān)聯(lián)分析,能夠發(fā)現(xiàn)交易數(shù)據(jù)庫(kù)中不同商品之間的聯(lián)系強(qiáng)度,挖掘用戶潛在的購(gòu)買模式,并將這些模式所對(duì)應(yīng)的服務(wù)或產(chǎn)品展示給用戶,為其提供參考,從而提高用戶的購(gòu)買率和滿意度,增加了企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì)。本文的研究成果存在不足之處,還可以進(jìn)一步完善,具體的體現(xiàn)在以下幾個(gè)方面:(1)由于電商數(shù)據(jù)的封裝性和自身?xiàng)l件的限制,本文的購(gòu)物記錄為問(wèn)卷調(diào)查所得,缺乏普遍性和時(shí)效性。在后期進(jìn)一步研究中,將搜集更多實(shí)體數(shù)據(jù),并擴(kuò)大數(shù)據(jù)量。(2)電子商務(wù)平臺(tái)可以收集到大量用戶相關(guān)的數(shù)據(jù),包括交易數(shù)據(jù)、注冊(cè)數(shù)據(jù)、評(píng)分?jǐn)?shù)據(jù)、咨詢數(shù)據(jù)等。

45、企業(yè)的決策目標(biāo)和約束往往是多因素的,如市場(chǎng)占有率、利潤(rùn)、品牌、平臺(tái)等。本次實(shí)驗(yàn)的算法只側(cè)重于交易數(shù)據(jù)和以增加銷售量為目標(biāo),比較片面??梢赃M(jìn)一步的進(jìn)行多維度、多粒度的整合關(guān)聯(lián)分析,得到的結(jié)果會(huì)比較全面,對(duì)企業(yè)和客戶的實(shí)用價(jià)值更高。(3)目前,WEKA 的關(guān)聯(lián)分析功能僅能用來(lái)作為示范,不適合用來(lái)挖掘大型數(shù)據(jù)集,進(jìn)一步的研究可以是通過(guò)云平臺(tái)等大型專業(yè)分析工具,對(duì)數(shù)據(jù)實(shí)施更深度、 更廣度的挖掘操作。 南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))23參考文獻(xiàn)參考文獻(xiàn)1 王茁,顧潔.三位一體的商務(wù)智能M.北京:電子工業(yè)出版社,2002. 2 箭牌中國(guó):精準(zhǔn)預(yù)測(cè)嘗“甜”頭EB/OL.http:/ bcs/ soluti

46、ons/bao/case.html.3 Dien D Phan, Douglas R Vogel. A model of customer relationship management and business intelligence systems for catalogue and online retailersJ. Information & Management, 2010,47:69-77.4 陳暢偉.基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘可視化系統(tǒng)的實(shí)現(xiàn)D.武漢:武漢理工大學(xué),2004.5 李國(guó)輝,張軍,湯義.挖掘技術(shù)直面多媒體-信息爆炸帶來(lái)新挑戰(zhàn)R.計(jì)算機(jī)世界報(bào),2012(27):B1-B

47、3.6 黃曉濤.電子商務(wù)導(dǎo)論M.北京:清華大學(xué)出版社,2005. 7 趙艷霞,梁昌勇.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)在電子商務(wù)中的應(yīng)用J.價(jià)值工程.2006,(5):6-7. 8 錢雪忠,孔芳.關(guān)聯(lián)規(guī)則挖掘中對(duì) Apriori 算法的研究J.計(jì)算機(jī)工程與應(yīng)用.2008, (44):56-78.9 毛國(guó)君,段立娟. 數(shù)據(jù)挖掘原理與算法M.北京:清華大學(xué)出版社,2005.10 Michael J.A.Berry,Gordon S.Linoff數(shù)據(jù)挖掘M北京:中國(guó)財(cái)政經(jīng)濟(jì)出版社,2004. 11高宏賓,潘谷,黃義明.基于頻繁項(xiàng)集特性的 Apriori 算法的改進(jìn)J.計(jì)算機(jī)工程與設(shè)計(jì),2007,28(l0):

48、2273-2275. 12 劉德喜,何炎祥,邢顯黎.一種新的頻繁項(xiàng)集挖掘算法J.計(jì)算機(jī)應(yīng)用研究,2007,(2):17-19. 13王安,仇德成,安云峰,王繼偉.一種雙進(jìn)的基于關(guān)系矩陣的關(guān)聯(lián)規(guī)則快速挖掘算法J.現(xiàn)代電子技術(shù),2007,(3):114-116. 14劉景春,王永利.適合在線式增量更新的關(guān)聯(lián)規(guī)則挖掘算法J.計(jì)算機(jī)工程與應(yīng)用,2004,(12):188-192. 15王瑋,陳思紅.關(guān)聯(lián)規(guī)則的相關(guān)性研究J.計(jì)算機(jī)工程,2012,26(7):33-36. 南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))2416王旭,劉明剛.關(guān)聯(lián)規(guī)則研究J.經(jīng)濟(jì)研究導(dǎo)刊,2010,(8):04-15. 17CHAU M,

49、 CHENG R, KAO B. Uncertain data mining: a new research directionC. Proceedings of Workshop on the Sciences of the Artificial. Washington DC: IEEE Computer Society, 2005.199-204. 18趙衛(wèi)東.客戶智能M.北京:清華大學(xué)出版社,2013. 19Ben J S, Joseph A K, John R. E-commerce recommendation applicationR. GroupLens Research Pro

50、ject, 2002.南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文(設(shè)計(jì))25附錄附錄附錄:原始數(shù)據(jù)附錄:原始數(shù)據(jù)注:表格數(shù)據(jù)量過(guò)多,無(wú)法將所有字段和記錄都列舉出來(lái),這里的原始數(shù)據(jù)僅展示部分?jǐn)?shù)據(jù)。表頭字段依次為:序號(hào)、提交問(wèn)卷時(shí)間、所用時(shí)間、來(lái)自IP、來(lái)源、您的性別、您的年齡、您的受教育程度、您的職業(yè)、您的收入或生活費(fèi)、您最近三個(gè)月在天貓超市購(gòu)物的總次數(shù)、您平均每次在天貓超市購(gòu)物的總花費(fèi)、進(jìn)口食品、食品飲料、糧油副食、美容洗護(hù)、家具家電、家庭清潔、母嬰用品、生鮮水果、價(jià)格優(yōu)惠、品種豐富、質(zhì)量保障、配送范圍廣。表格記錄中的數(shù)字為問(wèn)卷題目的選項(xiàng)序號(hào),如您的性別這列中的1和2,分別表示男和女兩個(gè)選項(xiàng),其他列以此類推。12017/5/6 0:36:32345秒

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論