電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究_第1頁
電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究_第2頁
電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究_第3頁
電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究_第4頁
電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)庫與信息管理本欄目責(zé)任編輯:聞翔軍Computer Knowledge and Technology 電腦知識(shí)與技術(shù)第6卷第9期(2010年3月電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究孫亦博(洛陽師范學(xué)院信息技術(shù)學(xué)院,河南洛陽471022摘要:隨著電子商務(wù)的普及和數(shù)據(jù)挖掘技術(shù)的發(fā)展,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到電子商務(wù)中可以解決電子商務(wù)中數(shù)據(jù)量龐大的問題,從而獲得真正有價(jià)值的信息。文章簡(jiǎn)要的介紹了電子商務(wù)以及數(shù)據(jù)挖掘的概念,并針對(duì)電子商務(wù)中所使用到的分類、聚類分析、關(guān)聯(lián)規(guī)則挖掘、序列模式分析等主要數(shù)據(jù)挖掘技術(shù)進(jìn)行了詳細(xì)的分析,這些數(shù)據(jù)挖掘技術(shù)的使用可以幫助企業(yè)節(jié)省開支,細(xì)分市場(chǎng),規(guī)劃網(wǎng)站以及制定合理的營(yíng)銷

2、策略,從而促使電子商務(wù)能更好、更快的進(jìn)行。關(guān)鍵詞:電子商務(wù);數(shù)據(jù)挖掘;聚類分析;關(guān)聯(lián)規(guī)則挖掘中圖分類號(hào):TP274文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(201009-2059-02Application of Data Mining Technique in E-commerceSUN Yi-bo(Institute of Information Technology,Luoyang Normal University,Luoyang 471022,ChinaAbstract:With the wide use of E-commerce and the development of

3、data mining technique,the application of data mining technique in E-commerce can solve the problem of large number of data in it,and dealer can also get the truly worthy information.The issue discusses the concept of E-commerce and data mining and it also makes particular description of data mining

4、technique,for example,classification,clustering,mining of association rules and mining of sequence mode.This technique can help the enterprise save expenditure,segment market,plan website,establish reasonable marketing strategy,and then the E-commerce develops faster and better.Key words:E-commerce;

5、data mining;clustering;mining of association rules隨著Internet 的普及,電子商務(wù)得到了前所未有的發(fā)展,經(jīng)銷商和客戶之間通過互聯(lián)網(wǎng)進(jìn)行交易,節(jié)省了大量的費(fèi)用和時(shí)間。但是在電子商務(wù)中充斥著大量的數(shù)據(jù),如何從這些大量的數(shù)據(jù)中挖掘出真正有價(jià)值的信息,幫助企業(yè)經(jīng)銷商制定更好的營(yíng)銷策略是電子商務(wù)急需解決的問題。數(shù)據(jù)挖掘,又稱數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database ,KDD,也就是從大量的數(shù)據(jù)中挖掘出有用信息的一種技術(shù)。利用數(shù)據(jù)挖掘技術(shù)可以使經(jīng)銷商從大量的數(shù)據(jù)中挖掘出有用的信息幫助決策,從而在市場(chǎng)競(jìng)爭(zhēng)中獲得

6、優(yōu)勢(shì)地位。1電子商務(wù)概述電子商務(wù)指交易當(dāng)事人或參與人利用現(xiàn)代信息技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)(主要是因特網(wǎng)所進(jìn)行的各類商業(yè)活動(dòng),包括貨物貿(mào)易、服務(wù)貿(mào)易和知識(shí)產(chǎn)權(quán)貿(mào)易?!半娮由虅?wù)”中所包括的“現(xiàn)代信息技術(shù)”應(yīng)涵蓋各種使用電子技術(shù)為基礎(chǔ)的通信方式;“商務(wù)”指不論是契約型還是非契約型的一切商務(wù)性質(zhì)的關(guān)系所引起的種種事項(xiàng)。如果將“現(xiàn)代信息技術(shù)”看作一個(gè)子集,“商務(wù)”看作另一個(gè)子集,電子商務(wù)所涵蓋的范圍應(yīng)當(dāng)是這兩個(gè)子集所形成的交集,即“電子商務(wù)”標(biāo)題之下可能廣泛涉及的因特網(wǎng)、內(nèi)部網(wǎng)和電子數(shù)據(jù)交換在貿(mào)易方面的各種用途。電子商務(wù)與傳統(tǒng)商務(wù)相比有以下優(yōu)點(diǎn):1電子商務(wù)將傳統(tǒng)的商務(wù)流程數(shù)字化、電子化,讓傳統(tǒng)的商務(wù)流程轉(zhuǎn)化為電

7、子流、信息流,突破了時(shí)間空間的局限,大大提高了商業(yè)運(yùn)作的效率。2電子商務(wù)簡(jiǎn)化了企業(yè)與企業(yè),企業(yè)與個(gè)人之間的流通環(huán)節(jié),最大限度地降低了流通成本,能有效地提高企業(yè)在現(xiàn)代商業(yè)活動(dòng)中的競(jìng)爭(zhēng)力。3電子商務(wù)是基于互聯(lián)網(wǎng)的一種商務(wù)活動(dòng),互聯(lián)網(wǎng)本身具有開放性全球性特點(diǎn),電子商務(wù)可為企業(yè)及個(gè)人提供豐富的信息資源,為企業(yè)創(chuàng)造更多商業(yè)機(jī)會(huì)。4電子商務(wù)對(duì)大型企業(yè)和中小企業(yè)都有利,因?yàn)榇笾行推髽I(yè)需要買賣交易活動(dòng)多,實(shí)現(xiàn)電子商務(wù)能有效地進(jìn)行管理和提高效率,對(duì)小企業(yè)同樣有利,因?yàn)殡娮由虅?wù)可以使企業(yè)以相近的成本進(jìn)行網(wǎng)上交易,這樣使中小企業(yè)可能擁有和大企業(yè)一樣的流通渠道和信息資源,極大提高了中小企業(yè)的競(jìng)爭(zhēng)力。5電子商務(wù)將大部分

8、商務(wù)活動(dòng)搬到網(wǎng)上進(jìn)行,企業(yè)可以實(shí)行無紙化辦公節(jié)省了開支。2數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘(Data Mining ,DM技術(shù)是隨著計(jì)算機(jī)的廣泛應(yīng)用和數(shù)據(jù)的大量積累而發(fā)展起來的。數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中提取或“挖掘”知識(shí),即發(fā)現(xiàn)其中隱含的,未知的,有意義的信息的過程,它又被稱為“數(shù)據(jù)庫中知識(shí)發(fā)現(xiàn)”(KDD,也有人把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識(shí)發(fā)現(xiàn)的一個(gè)基本步驟,知識(shí)發(fā)現(xiàn)過程由以下步驟組成:1數(shù)據(jù)清理;2數(shù)據(jù)集成;3數(shù)據(jù)選擇;4數(shù)據(jù)變換;5數(shù)據(jù)挖掘;6模式評(píng)估;7知識(shí)表示。從商業(yè)的角度定義,數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取

9、輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。利用功能強(qiáng)大的數(shù)據(jù)挖掘技術(shù),可以使企業(yè)把數(shù)據(jù)轉(zhuǎn)化為有用的信息幫助決策,從而在市場(chǎng)競(jìng)爭(zhēng)中獲得優(yōu)勢(shì)地位。數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析的不同是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)。數(shù)據(jù)挖掘所得到的信息應(yīng)具有先前未知、有效和實(shí)用3個(gè)特征。3數(shù)據(jù)挖掘在電子商務(wù)中的作用數(shù)據(jù)挖掘技術(shù)之所以可以服務(wù)于電子商務(wù),是因?yàn)樗軌蛲诰虺龌顒?dòng)過程中的潛在信息以指導(dǎo)電子商務(wù)活動(dòng)。在電子商務(wù)中收稿日期:2010-02-26作者簡(jiǎn)介:孫亦博(1981-,女,河南洛陽人,洛陽師范學(xué)院信息技術(shù)學(xué)院,助教,計(jì)算機(jī)應(yīng)用碩士,主要研究方向?yàn)閳D形圖像。ISSN 1009-3044Computer Knowle

10、dge and TechnologyComputer Knowledge and Technology電腦知識(shí)與技術(shù)第6卷第9期(2010年3月的作用有7個(gè)方面:1挖掘客戶活動(dòng)顧慮,針對(duì)性的在電子商務(wù)平臺(tái)下提供“個(gè)性化”的服務(wù)。2可以在瀏覽電子商務(wù)網(wǎng)站的訪問者中挖掘出潛在的客戶。3通過電子商務(wù)訪問者的活動(dòng)信息的挖掘,可以更加深入的了解客戶需求。4通過挖掘網(wǎng)上顧客的購(gòu)買行為,可以幫助制定合理的產(chǎn)品策略和定價(jià)策略。5通過對(duì)商品訪問情況和銷售情況進(jìn)行挖掘,可以幫助制定產(chǎn)品營(yíng)銷策略,優(yōu)化促銷活動(dòng)。6優(yōu)化電子商務(wù)網(wǎng)站的信息導(dǎo)航,方便客戶瀏覽。7通過客戶在網(wǎng)絡(luò)上瀏覽時(shí)的擁塞記錄發(fā)現(xiàn)網(wǎng)站的性能瓶頸,從而提高

11、網(wǎng)站的穩(wěn)定性,保證電子商務(wù)購(gòu)物快速進(jìn)行。4電子商務(wù)中數(shù)據(jù)挖掘的技術(shù)與方法電子商務(wù)中的數(shù)據(jù)挖掘過程一般包括3個(gè)主要的階段:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果解釋和評(píng)價(jià)。1數(shù)據(jù)準(zhǔn)備又可分為數(shù)據(jù)選取和數(shù)據(jù)預(yù)處理兩個(gè)步驟。數(shù)據(jù)選取的目的是確定發(fā)現(xiàn)任務(wù)的操作對(duì)象。即目標(biāo)數(shù)據(jù),是根據(jù)用戶的需要從原始數(shù)據(jù)庫中抽取的一組數(shù)據(jù)。數(shù)據(jù)預(yù)處理一般包括消除噪聲、推導(dǎo)計(jì)算缺值數(shù)據(jù)、消除重復(fù)記錄、完成數(shù)據(jù)類型轉(zhuǎn)換以及對(duì)數(shù)據(jù)降維。2數(shù)據(jù)挖掘階段首先要確定數(shù)據(jù)挖掘的目標(biāo)和挖掘的知識(shí)類型。確定挖掘任務(wù)后,根據(jù)挖掘的知識(shí)類型選擇合適的挖掘算法,最后實(shí)施數(shù)據(jù)挖掘操作,運(yùn)用選定的挖掘算法從數(shù)據(jù)庫中抽取所需的知識(shí)。3結(jié)果的解釋和評(píng)價(jià)。數(shù)據(jù)挖掘階

12、段發(fā)現(xiàn)的知識(shí),經(jīng)過評(píng)估,可能存在冗余或無關(guān)的知識(shí),這時(shí)需要將其剔除,也有可能知識(shí)不滿足用戶的需求,需要重復(fù)上述挖掘過程重新進(jìn)行挖掘。另外,由于數(shù)據(jù)挖掘最終要面臨用戶,因此,還需要對(duì)所挖掘的知識(shí)進(jìn)行解釋,以一種用戶易于理解的方式供用戶所使用。數(shù)據(jù)挖掘按照其挖掘任務(wù)主要包括分類和預(yù)測(cè)、聚類分析、關(guān)聯(lián)規(guī)則挖掘,回歸發(fā)現(xiàn)和序列模式發(fā)現(xiàn)等技術(shù)。在選擇某種數(shù)據(jù)挖掘技術(shù)之前,首先要將需要解決的問題轉(zhuǎn)化成正確的數(shù)據(jù)挖掘任務(wù),然后根據(jù)挖掘的任務(wù)來選擇使用哪些數(shù)據(jù)挖掘技術(shù)。在電子商務(wù)活動(dòng)中,主要使用下面的一些數(shù)據(jù)挖掘技術(shù)。4.1分類分類是找出數(shù)據(jù)庫中一組數(shù)據(jù)對(duì)象的共同特點(diǎn)并按照分類模式將其劃分為不同的類,其目的是

13、通過分類模型或分類函數(shù),將數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到某個(gè)給定的類別。分類的主要方法有基于決策樹模型的數(shù)據(jù)分類,貝葉斯分類算法,ID3算法和基于BP神經(jīng)網(wǎng)絡(luò)算法等。假定現(xiàn)在我們有一個(gè)描述顧客屬性的數(shù)據(jù)庫,包括他們的姓名、年齡、收入、職業(yè)等,我們可以按照他們是否購(gòu)買某種商品(例如,計(jì)算機(jī)來進(jìn)行分類。如果現(xiàn)在有新的顧客添加到數(shù)據(jù)庫中,我想將新計(jì)算機(jī)的銷售信息通知顧客,若將促銷材料分發(fā)給數(shù)據(jù)庫中的每個(gè)新顧客,如此可能會(huì)導(dǎo)致耗費(fèi)較多的精力和物力。而若我們只給那些可能購(gòu)買新計(jì)算機(jī)的顧客分發(fā)材料,可以在較大的程度上節(jié)省成本。為此,可以構(gòu)造和使用分類模型。分類方法的特點(diǎn)是通過對(duì)示例數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析,已經(jīng)建立

14、了一個(gè)分類模型,然后利用分類模型對(duì)數(shù)據(jù)庫中的其它記錄進(jìn)行分類。4.2聚類分析聚類分析是把一組數(shù)據(jù)按照相似性和差異性分為幾個(gè)類別,其目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。聚類分析的方法是數(shù)據(jù)挖掘領(lǐng)域最為常見的技術(shù)之一。常用的聚類分析方法有:分割聚類方法,層次聚類方法,基于密度的聚類方法和高維稀疏聚類算法等。聚類分析方法與分類方法的不同之處是聚類事先對(duì)數(shù)據(jù)集的分布沒有任何的了解。因此在聚集之后要有一個(gè)對(duì)業(yè)務(wù)很熟悉的人來解釋這樣聚集的意義。很多情況下一次聚集你得到的分類對(duì)你的業(yè)務(wù)來說可能并不好,這時(shí)你需要?jiǎng)h除或增加變量以影響分類的方式,經(jīng)過幾次反復(fù)之后才

15、能最終得到一個(gè)理想的結(jié)果。聚類分析方法在電子商務(wù)中的使用也極其廣泛。其中一個(gè)典型的應(yīng)用是幫助市場(chǎng)分析人員從客戶基本庫中發(fā)現(xiàn)不同的客戶群,并且用購(gòu)買模式來刻畫不同客戶群的特征。通過對(duì)聚類的客戶特征的提取,把客戶群分成更細(xì)的市場(chǎng),提供針對(duì)性的服務(wù)。4.3關(guān)聯(lián)規(guī)則挖掘關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項(xiàng)之間所存在關(guān)系的規(guī)則,即根據(jù)一個(gè)事物中的某些項(xiàng)的出現(xiàn)可導(dǎo)出另一些項(xiàng)在同一事物中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系,比如在一次購(gòu)買活動(dòng)中所買不同商品的相關(guān)性。在電子商務(wù)中,從大量商務(wù)事物記錄中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,可以幫助許多商務(wù)決策的制定。關(guān)聯(lián)規(guī)則挖掘最初也是最典型的形式是購(gòu)物籃分析。它通過發(fā)現(xiàn)顧客放入其購(gòu)

16、物籃中不同商品之間聯(lián)系,分析顧客的購(gòu)買習(xí)慣。例如,在同一次去超級(jí)市場(chǎng),如果顧客購(gòu)買牛奶,他也購(gòu)買面包(包括購(gòu)買什么類型的面包的可能性有多大?這些信息可以幫助零售商有選擇地經(jīng)銷和安排貨架,引導(dǎo)銷售。例如,將牛奶和面包盡可能放近一些,可以進(jìn)一步刺激一次去商店同時(shí)購(gòu)買這些商品。在電子商務(wù)中,由于Web服務(wù)器的日志文件記錄了用戶的訪問記錄,通過這些記錄利用關(guān)聯(lián)規(guī)則挖掘網(wǎng)上顧客購(gòu)買產(chǎn)品的相關(guān)度,對(duì)某些品牌的喜好和忠誠(chéng),價(jià)格接受范圍,以及包裝要求等,挖掘的結(jié)果可以用來幫助管理者進(jìn)行網(wǎng)站規(guī)劃、確定商品的種類、價(jià)格和新產(chǎn)品的投入。4.4序列模式分析序列模式分析和關(guān)聯(lián)規(guī)則挖掘相似,但側(cè)重點(diǎn)在分析數(shù)據(jù)間的前后序列關(guān)系。它能發(fā)現(xiàn)數(shù)據(jù)庫中形如在某一段時(shí)間內(nèi),顧客購(gòu)買商品A,接著購(gòu)買商品B,而后購(gòu)買商品C,即序列A-B-C出現(xiàn)的頻度較高的信息。序列模式分析的一個(gè)例子是“九個(gè)月以前購(gòu)買奔騰PC的客戶很可能在一個(gè)月內(nèi)訂購(gòu)新的CPU芯片”。5結(jié)束語電子商務(wù)過程中的各種信息

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論