




已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究摘要當(dāng)今互聯(lián)網(wǎng)擁有海量的數(shù)據(jù),如何對(duì)這些Web上的數(shù)據(jù)進(jìn)行挖掘提取有用的模式,輔助企業(yè)獲得成功,是一個(gè)刻不容緩的問題。本文對(duì)Web數(shù)據(jù)挖掘的基本內(nèi)容和相應(yīng)的技術(shù)作了介紹,并對(duì)Web數(shù)據(jù)挖掘在電子商務(wù)中可應(yīng)用的范圍作了說明。關(guān)鍵字Web數(shù)據(jù)挖掘、電子商務(wù) 引言 在電子商務(wù)領(lǐng)域,通過Web數(shù)據(jù)挖掘,不僅可以從大量多種多樣信息的Web頁面中提取出我們需要的有用的知識(shí),還可以得到關(guān)于群體用戶訪問行為和方式的普遍知識(shí),用以改進(jìn)Web服務(wù)設(shè)計(jì)。更重要的是,通過對(duì)用戶特征的理解和分析,如對(duì)用戶訪問行為、頻度、內(nèi)容等的分折,提取出用戶的特征,從而為用戶定制個(gè)性化的界面,有助于開展有針對(duì)性的電子商務(wù)活動(dòng)。12 1Web數(shù)據(jù)挖掘簡(jiǎn)介 當(dāng)今Web上存在著大量的數(shù)據(jù),獲取有用信息成為人們關(guān)注的焦點(diǎn)。但Web 是無結(jié)構(gòu)的、動(dòng)態(tài)的,Web 頁面極其復(fù)雜。這樣就使得人們從成千上萬的 Web 站點(diǎn)中找到有用的數(shù)據(jù)變得比較困難。于是,人們就越來越關(guān)注如何開發(fā)和利用 Web 上的數(shù)據(jù)資源。 Web 數(shù)據(jù)挖掘就是解決上述問題的一個(gè)途徑。當(dāng)數(shù)據(jù)挖掘技術(shù)應(yīng)用于網(wǎng)絡(luò)環(huán)境下的 Web 中就成為 Web數(shù)據(jù)挖掘。 Web數(shù)據(jù)挖掘就是從 Web 文檔和 Web活動(dòng)中抽取感興趣的潛在的有用模式和隱藏的信息。 Web挖掘可以分為三類:Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘和Web使用挖掘 3。Web內(nèi)容挖掘是用來提取文字、圖片或其他組成網(wǎng)頁內(nèi)容成分的信息;Web結(jié)構(gòu)挖掘是用來提取網(wǎng)絡(luò)的拓?fù)湫畔?,即網(wǎng)頁之間的銜接的信息;Web使用挖掘是用來提取關(guān)于客戶如何運(yùn)用瀏覽器瀏覽和使用這些銜接的信息。 2Web數(shù)據(jù)挖掘的技術(shù)介紹 從電子商務(wù)的角度出發(fā),進(jìn)行Web上的數(shù)據(jù)挖掘,主要就是進(jìn)行客戶訪問信息的挖掘,得到客戶端瀏覽行為和訪問模式,從而找到有用的市場(chǎng)信息。在Web數(shù)據(jù)挖掘的模式發(fā)現(xiàn)中,常有以下幾種數(shù)據(jù)挖掘技術(shù)的使用: 21路徑分析:使用路徑分析技術(shù)進(jìn)行Web使用模式挖掘,最常用的就是網(wǎng)站結(jié)構(gòu)圖。它可以被用于判定在一個(gè) web 站點(diǎn)中最頻繁訪問的路徑,還有一些其他的有關(guān)路徑的信息通過路徑分析可以得出,比如:70%的用戶端在訪問/class/book2 時(shí),是從/class 開始,經(jīng)過/class/new, /class/book,/class/book1,最后才到的/class/book2。這條規(guī)則說明在/class/book2 頁面上有有用的信息,但因?yàn)榭蛻魧?duì)站點(diǎn)進(jìn)行的是迂回繞行的訪問,所以這個(gè)有用信息并不明顯。如果這個(gè)頁面對(duì)網(wǎng)站來說比較重要,可以通過此路徑分析改進(jìn)頁面及網(wǎng)站結(jié)構(gòu)的設(shè)計(jì),從使客戶更容易的訪問/class/book2。 22關(guān)聯(lián)規(guī)則:關(guān)聯(lián)規(guī)則主要關(guān)注事物內(nèi)的關(guān)系。在Web使用挖掘中,關(guān)聯(lián)規(guī)則挖掘就是挖掘出用戶在一個(gè)訪問期間從服務(wù)器上訪問的頁面文件之間的關(guān)系,找出在某一次服務(wù)器會(huì)話中最經(jīng)常一起出現(xiàn)的相關(guān)畫面。例如,40%的客戶再購買了CD之后又購買了CD清潔劑。利用挖掘出來的這些相關(guān)性,我們可以更好的組織站點(diǎn),實(shí)施有效的市場(chǎng)策略。 23序列模式:序列模式挖掘就是挖掘出交易集之間有時(shí)間序列關(guān)系的模式,在Web日志中發(fā)現(xiàn)所有滿足用戶規(guī)定的最小支持度的大序列模式。序列模式的發(fā)現(xiàn)就是在時(shí)間戳有序的事務(wù)集中,找到那些“一些項(xiàng)跟隨另一個(gè)項(xiàng)”的內(nèi)部事務(wù)模式。例如:在/class/book1上進(jìn)行過在線定購的顧客,有60%的人在過去15天內(nèi)也在/class/bag1處下過訂單。發(fā)現(xiàn)序列模式能夠便于進(jìn)行電子商務(wù)的組織預(yù)測(cè)客戶的訪問模式,對(duì)客戶開展有針對(duì)性的廣告服務(wù)。通過系列模式的發(fā)現(xiàn),能夠在服務(wù)器方選取有針對(duì)性的頁面,以滿足訪問者的特定要求。 24分類規(guī)則:分類技術(shù)主要是根據(jù)用戶群的特征挖掘用戶群的訪問特征。在Web數(shù)據(jù)挖掘中,分類規(guī)則的發(fā)現(xiàn)就是給出識(shí)別一個(gè)特殊群體的公共屬性的描述,這個(gè)描述可以用來分類新的項(xiàng),例如:在/class/book2 進(jìn)行過在線定購的顧客中有 55是20-30歲生活在南方的年輕人。得到這一分類后,就可以進(jìn)行適合這一類客戶的商務(wù)活動(dòng)。 25聚類:聚類技術(shù)是對(duì)符合某一訪問規(guī)律特征的用戶進(jìn)行用戶特征挖掘。聚類分析可以從 Web 訪問信息數(shù)據(jù)中聚集出具有相似特性的那些客戶。在 Web 事務(wù)日志中,聚類顧客信息或數(shù)據(jù)項(xiàng)能夠便于開發(fā)和執(zhí)行未來的市場(chǎng)戰(zhàn)略。這種市場(chǎng)戰(zhàn)略包括:自動(dòng)給一個(gè)特定的顧客聚類發(fā)送銷售郵件,為一個(gè)顧客聚類動(dòng)態(tài)地改變一個(gè)特殊的站點(diǎn)等。3在電子商務(wù)中的應(yīng)用介紹盡管Web挖掘的形式和研究方向?qū)映霾桓F,但隨著電子商務(wù)的興起和迅猛發(fā)展,未來Web挖掘的一個(gè)重要應(yīng)用方向?qū)⑹请娮由虅?wù)系統(tǒng)。而與電子商務(wù)關(guān)系最為密切的是Web訪問信息挖掘。下面是Web訪問信息挖掘在電子商務(wù)中的幾點(diǎn)具體的應(yīng)用。 31發(fā)現(xiàn)潛在客戶:在對(duì)Web的客戶訪問信息的挖掘中,利用分類技術(shù)可以在Internet上找到未來的潛在客戶。通常的策略是先對(duì)己經(jīng)存在的訪問者進(jìn)行分類,對(duì)于一個(gè)新的訪問者,通過在Web上的分類發(fā)現(xiàn),識(shí)別出這個(gè)客戶與己經(jīng)分類的老客戶的一些公共的描述,從而對(duì)這個(gè)新客戶進(jìn)行正確的分類。然后從它的分類判斷這個(gè)新客戶是屬于有利可圖的客戶群,還是屬于無利可圖的客戶群,決定是否要把這個(gè)新客戶作為潛在的客戶來對(duì)待??蛻舻念愋痛_定后,就可以對(duì)客戶動(dòng)態(tài)地展示W(wǎng)eb頁面,頁面的內(nèi)容取決于客戶與銷售商提供的產(chǎn)品和服務(wù)之間的關(guān)聯(lián)。 32提供優(yōu)質(zhì)個(gè)性化服務(wù):對(duì)客戶來說,傳統(tǒng)客戶與銷售商之問的空間距離在電子商務(wù)中己經(jīng)不存在了。在網(wǎng)上,每一個(gè)銷售商對(duì)于客戶來說都是一樣的,那么如何使客戶在自己的銷售站點(diǎn)上駐留更長(zhǎng)的時(shí)間,對(duì)銷售商來說將是一個(gè)挑戰(zhàn)。為了達(dá)到這一目的,就應(yīng)該了解客戶的瀏覽行為,知道客戶的興趣及需求所在,動(dòng)態(tài)地調(diào)整Web頁面,以滿足客戶的需要。通過對(duì)客戶訪問信息的挖掘,就能知道客戶的瀏覽行為,從而了解客戶的興趣及需求。 33 改進(jìn)站點(diǎn)設(shè)計(jì):對(duì)Web站點(diǎn)的鏈接結(jié)構(gòu)的優(yōu)化可從三方面來考慮:(1)通過對(duì)Web Log的挖掘,發(fā)現(xiàn)用戶訪問頁面的相關(guān)性,從而對(duì)密切聯(lián)系的網(wǎng)頁之間增加鏈接,方便用戶使用。(2)利用路徑分析技術(shù)判定在一個(gè)Web站點(diǎn)中最頻繁的訪問路徑,可以考慮把重要的商品信息放在這些頁面中,改進(jìn)頁面和網(wǎng)站結(jié)構(gòu)的設(shè)計(jì),增強(qiáng)對(duì)客戶的吸引力,提高銷售量。(3)通過對(duì)Web Log的挖掘,發(fā)現(xiàn)用戶的期望位置。如果在期望位置的訪問頻率高于對(duì)實(shí)際位置的訪問頻率,可考慮在期望位置和實(shí)際位置之間建立導(dǎo)航鏈接,從而實(shí)現(xiàn)對(duì)Web站點(diǎn)結(jié)構(gòu)的優(yōu)化。 34聚類客戶:通過把具有相似瀏覽行為的客戶分為一組,并分析組中客戶的共同特征,可以幫助電子商務(wù)的組織者更好地了解自己的客戶,向客戶提供更適合、更面向客戶的服務(wù)。如有一些客戶都花了一段時(shí)間瀏覽“房屋裝修”,“家具”頁面,經(jīng)過分析這些客戶被聚類成為一組。銷售商根據(jù)分析出來的聚類信息,就可以知道這是一組“新購房族”客戶,對(duì)他們所進(jìn)行的業(yè)務(wù)活動(dòng)當(dāng)然也就不可能等同于其他被聚類了的客戶如“大學(xué)生”,“購車族”,應(yīng)及時(shí)調(diào)整頁面及頁面內(nèi)容使商務(wù)活動(dòng)能夠在一定程度上滿足客戶的要求,使商務(wù)活動(dòng)對(duì)客戶和銷售商來說更具意義。 35 搜索引擎的應(yīng)用:通過對(duì)網(wǎng)頁內(nèi)容的挖掘,可以實(shí)現(xiàn)對(duì)網(wǎng)頁的聚類和分類,實(shí)現(xiàn)網(wǎng)絡(luò)信息的分類瀏覽與檢索;通過用戶使用的提問式歷史記錄分析,可以有效地進(jìn)行提問擴(kuò)展,提高用戶的檢索效果(查全率、查準(zhǔn)率);通過運(yùn)用 Web 挖掘技術(shù)改進(jìn)關(guān)鍵詞加權(quán)算法,可以提高網(wǎng)絡(luò)信息的標(biāo)引準(zhǔn)確度,改善檢索效果。 36 網(wǎng)絡(luò)安全:分析網(wǎng)上銀行、網(wǎng)上商店交易用戶日志,可以防范黑客攻擊、惡意詐騙。參考文獻(xiàn):1.韓家煒,孟小峰,王靜等.Web挖掘研究J.計(jì)算機(jī)研究與友展.200 1,3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 研發(fā)中心廠房租賃及研發(fā)設(shè)備采購協(xié)議
- 車貸合同糾紛解決合同范本
- 公司線下活動(dòng)策劃方案
- 跨界融合參股經(jīng)營(yíng)合作協(xié)議
- 公司泡溫泉活動(dòng)策劃方案
- 提升領(lǐng)導(dǎo)力的演講與表達(dá)力訓(xùn)練課程
- 抖音短視頻營(yíng)銷策略解析
- 公司舞會(huì)活動(dòng)策劃方案
- 公司維護(hù)客戶活動(dòng)方案
- 公司聚餐集體活動(dòng)方案
- 國(guó)家開放大學(xué)《Python語言基礎(chǔ)》實(shí)驗(yàn)5:循環(huán)結(jié)構(gòu)基本應(yīng)用參考答案
- 2024版國(guó)開電大法學(xué)本科《合同法》歷年期末考試總題庫
- 2023-2024學(xué)年人教版小學(xué)英語四年級(jí)下冊(cè)期末測(cè)試卷含答案
- 信息技術(shù)對(duì)商業(yè)運(yùn)營(yíng)的變革影響
- 2024年福州首邑文化旅游投資有限公司招聘筆試參考題庫含答案解析
- 排水系統(tǒng)聯(lián)合排水實(shí)驗(yàn)報(bào)告
- 《競(jìng)爭(zhēng)情報(bào)分析》課件
- 急診科外科急癥的處理與救治
- 安全編碼和開發(fā)培訓(xùn)
- 電氣工程及其自動(dòng)化-10KV某中學(xué)教學(xué)樓配電系統(tǒng)設(shè)計(jì)
- 基于零知識(shí)證明和同態(tài)加密的隱私保護(hù)算法研究
評(píng)論
0/150
提交評(píng)論