數(shù)據(jù)挖掘建模過程及python處理實例研究_第1頁
數(shù)據(jù)挖掘建模過程及python處理實例研究_第2頁
數(shù)據(jù)挖掘建模過程及python處理實例研究_第3頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

【計算機論文】數(shù)據(jù)挖掘建模過程及python處理實例研究

摘要:目前,在我國電信行業(yè)存在大量業(yè)務(wù)數(shù)據(jù),利用這些數(shù)據(jù)進一步拓寬通信業(yè)務(wù),已經(jīng)成為各個通信單位的當務(wù)之急。近幾年迅速崛起的數(shù)據(jù)挖掘技術(shù)可以深入分析客戶信息、客戶價值和行為,從而使營銷具有洞察力、精確化,并通過從數(shù)據(jù)中挖掘價值來減少營銷成本、提高營銷效益。本文以通信行業(yè)為例,利用python編程對其數(shù)據(jù)進行挖掘,并詳細介紹了數(shù)據(jù)挖掘過程,從而促進通信業(yè)務(wù)發(fā)展,為通信業(yè)提供決策支持服務(wù)。關(guān)鍵詞:數(shù)據(jù)挖掘;通信業(yè)務(wù)數(shù)據(jù);python處理隨著中國通信市場的競爭日趨激烈,通信運營商的經(jīng)營理念已逐步從“技術(shù)質(zhì)量第一”轉(zhuǎn)變?yōu)椤胺?wù)客戶至上”。以前的營銷模式無法滿足客戶的多樣化,層次化和個性化需求。長期以來,通信單元的大量詳細業(yè)務(wù)數(shù)據(jù)已經(jīng)簡單地應(yīng)用于各種業(yè)務(wù)系統(tǒng),并且還沒有得到更有效的開發(fā)和利用。1數(shù)據(jù)挖掘模型本文的數(shù)據(jù)挖掘示例使用呼叫行為,數(shù)據(jù)服務(wù)使用等作為客戶分類變量,并將具有相似通信行為的人員分組到一個組中。數(shù)據(jù)挖掘方法論選用CRISP-DM(Cross-IndustryProcessforDataMining)過程模型,即交叉行業(yè)數(shù)據(jù)挖掘過程標準。它從數(shù)據(jù)挖掘技術(shù)應(yīng)用的角度劃分挖掘任務(wù),并將數(shù)據(jù)挖掘技術(shù)與實際應(yīng)用緊密結(jié)合。這里,為了簡化說明,我們不考慮循環(huán)的探索和調(diào)整過程,并直接按順序檢查每個鏈接,通過問卷調(diào)查和訪談實現(xiàn)客戶的消費行為和需求。1.1數(shù)據(jù)準備數(shù)據(jù)準備過程如下:(1)確定項目目標,制定挖掘計劃。(2)分析變量的獲取。(3)數(shù)據(jù)收集和獲取。(4)數(shù)據(jù)集成。根據(jù)CRISP-DM流程,首先是確定項目目標。本文定義的客戶細分的業(yè)務(wù)目標是“從客戶行為的角度對某個地方的數(shù)十萬普通客戶進行分類,了解不同客戶群體的消費者行為特征,為新業(yè)務(wù)的發(fā)展,現(xiàn)有客戶的保留,以及其他通信公司之間的競爭制定有針對性的策略提供依據(jù)。并實現(xiàn)公司戰(zhàn)略目標,穩(wěn)定現(xiàn)有客戶,增加客戶增長?!敝螅瑧?yīng)充分獲取分析變量,并在確保數(shù)據(jù)的一致性,完整性,有效性和層次結(jié)構(gòu)的基礎(chǔ)上,數(shù)據(jù)指標完整,應(yīng)涵蓋所有業(yè)務(wù)分析和數(shù)據(jù)挖掘的需求。本文選擇的數(shù)據(jù)源主要包括客戶文件記錄,客戶營銷記錄,銷售訂單主表。1.2建立模型生成最終數(shù)據(jù)集后,就可以構(gòu)建模型以執(zhí)行集群分析。建模階段主要是選擇和應(yīng)用各種建模技術(shù),同時校準其參數(shù)以獲得最佳值。在建模過程中,本文采用多種技術(shù)手段并對建模效果進行了比較,需要挑選合適的變量參與建模。該模型的建立是一個螺旋式,連續(xù)的優(yōu)化過程。如果結(jié)果不理想,則需要調(diào)整聚類模型以優(yōu)化模型,這稱為聚類優(yōu)化??梢酝ㄟ^調(diào)整聚類數(shù)量和調(diào)整聚類變量的輸入,或者通過多次運行來選擇滿意的結(jié)果來實現(xiàn)聚類優(yōu)化。通常可以根據(jù)以下原則判斷聚類結(jié)果是否理想:類間特征差異是否明顯;群內(nèi)特征是否相似;集群結(jié)果是否易于管理并具有業(yè)務(wù)指導(dǎo)意義。2數(shù)據(jù)挖掘結(jié)果分析根據(jù)客戶分類的結(jié)果,重新定位客戶,加深對客戶的了解,并在此基礎(chǔ)上制定響應(yīng)策略。客戶分類模型最終產(chǎn)生一些客戶分類,根據(jù)這些組的特征可以分為三組。各組的頻繁與不頻繁通信行為比較見表1。表1各組的頻繁與不頻繁通信行為比較分組號頻繁通信行為不頻繁通信行為組1:手機低使用率組與小靈通通話撥打10086次數(shù)本地、省內(nèi)長途漫游、省際長途、IP、與聯(lián)通用戶通話組2:固話通話頻繁組與固定電話通話本地、省內(nèi)長途漫游、省際長途、IP、與聯(lián)通用戶通話組3:手機低使用率組與固定電話通話省際長途、IP電話與聯(lián)通通話次數(shù)①這些人對關(guān)稅非常敏感,可能對經(jīng)濟儲蓄產(chǎn)品感興趣。②這些人很少被呼叫,他們可以通過單向充電產(chǎn)品增加他們的呼叫需求。③由于交流范圍相對狹窄,并且主要為市內(nèi)通話,容易成為小靈通或大靈通的搶奪對象,因此可以設(shè)計一些市話優(yōu)惠類的產(chǎn)品來保住客戶,防止客戶流失。為了響應(yīng)這些行為特征,可以開發(fā)相應(yīng)的促銷計劃和銷售渠道:由于這些人可能包括低工資的人,家庭婦女,老人,學(xué)生和社會需求較少的技術(shù)人員。因此可以選擇超市,商場,學(xué)校等地進行海報推廣或安排人們發(fā)送傳單,在人群聚集場所進行一定的促銷活動,實物獎勵對這群人來說非常有吸引力。除了基本的銷售點,還可以選擇這個客戶群的住宅樓附近的超市,小商店等作為銷售點,效果會更好。結(jié)論在數(shù)據(jù)挖掘過程中,不同技術(shù)方案產(chǎn)生的模型結(jié)果差異很大,模型結(jié)果的可理解性也大不相同。此外,對結(jié)果的分析和描述也很關(guān)鍵,不恰當?shù)拿枋隹赡軙a(chǎn)生誤導(dǎo)。需要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論