數(shù)據(jù)挖掘技術在電信行業(yè)CRM中應用研究_第1頁
數(shù)據(jù)挖掘技術在電信行業(yè)CRM中應用研究_第2頁
數(shù)據(jù)挖掘技術在電信行業(yè)CRM中應用研究_第3頁
數(shù)據(jù)挖掘技術在電信行業(yè)CRM中應用研究_第4頁
數(shù)據(jù)挖掘技術在電信行業(yè)CRM中應用研究_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)據(jù)挖掘技術在電信行業(yè)CRM中應用研究內容摘要:本文在介紹數(shù)據(jù)挖掘技術和客戶關系管理概念的基礎上,以電信行業(yè)為背景,介紹了將數(shù)據(jù)挖掘技術應用到客戶關系管理中的流程和方法。關鍵詞:數(shù)據(jù)挖掘;客戶關系管理;電信行業(yè)1、數(shù)據(jù)挖掘方法和技術在客戶關系管理中的應用數(shù)據(jù)挖掘的任務主要是關聯(lián)分析、聚類分析、分類、預測、時序模式和偏差分析等,根據(jù)數(shù)據(jù)挖掘所能夠完成的任務,數(shù)據(jù)挖掘的技術可以應用到以客戶為中心的企業(yè)決策分析和管理的各個不同領域和階段。在客戶關系管理中,它可以應用到以下幾個方面:客戶群體分類分析、客戶盈利能力分析、客戶背景分析、客戶滿意度分析、交叉銷售、客戶信用分析、客戶流失分析、客戶的獲得與保持

2、等。1.1、客戶群體分類分析客戶細分是指將一個大的消費群體劃分成一個個細分群的動作,同屬一個細分群的消費者彼此相似,而隸屬于不同細分群的消費者是不同的。細分可以讓一個用戶從比較高的層次上來查看整個數(shù)據(jù)庫中的數(shù)據(jù),細分也使得人們可以用不同的方法對待處于不同細分中的客戶。有多種方式可以在細分上運用數(shù)據(jù)挖掘,通常用來建立細分群的數(shù)據(jù)挖掘方法是決策樹方法和聚類方法。首先,數(shù)據(jù)挖掘可以用來根據(jù)客戶的預測行為來定義客戶細分群。如決策樹的葉節(jié)點可視為一個獨立的客戶細分群,每個葉節(jié)點由某些特定的客戶特征定義,對所有符合這些特征的客戶存在一些預測行為。數(shù)據(jù)挖掘可以把大量的客戶分成不同的類,在每一個類里的客戶具有

3、相似的屬性,而不同類里的客戶的屬性也不同。大多數(shù)公司一般將客戶分為VIP客戶、主要客戶、普通客戶和小客戶4類。電信客戶分類一般是按照業(yè)務類型進行分類,主要分為大客戶和普通客戶。大客戶又主要包括兩類:其一指客戶范圍大,不僅包括普通的消費者,還包括企業(yè)的分銷商、經(jīng)銷商、批發(fā)商和代理商;其二指客戶的價值大,不同的客戶對企業(yè)的利潤貢獻差異很大,20%的大客戶貢獻了企業(yè)80%的利潤,因此,企業(yè)必須要高度重視高價值客戶以及具有高價值潛力的客戶。在大客戶營銷戰(zhàn)略中的大客戶是指后者,是指公司所轄地域內使用產(chǎn)品量大或單位性質特殊的客戶,主要包括經(jīng)濟大客戶、重要客戶、集團客戶與戰(zhàn)略客戶等。1.2、客戶盈利能力分析

4、客戶盈利能力分析是數(shù)據(jù)挖掘的基礎。數(shù)據(jù)挖掘技術是通過幫助你理解和提高客戶盈利能力來發(fā)揮作用的,它可以用來預測在不同的市場活動情況下客戶盈利能力的變化,通過分析已經(jīng)發(fā)生的事實來發(fā)現(xiàn)信息和預測未來。數(shù)據(jù)挖掘技術可以從客戶的交易記錄中發(fā)現(xiàn)一些行為模式,并用這些行為模式來預測客戶盈利能力的高低,但首先必須要設定一種計算客戶盈利能力的方法。數(shù)據(jù)挖掘技術還可以用來揭示客戶的行為習慣和預測發(fā)現(xiàn)一些在不同情況下有相似行為的新客戶。通過數(shù)據(jù)挖掘技術可以優(yōu)化一個市場活動以確定哪些顧客對提供的產(chǎn)品和服務感興趣。1.3、交叉銷售現(xiàn)代企業(yè)和客戶之間的關系是經(jīng)常變動的,一旦一個人或一個團體成為企業(yè)的客戶,就要竭力使這種客

5、戶關系趨于完善,需要對現(xiàn)有的客戶進行交叉銷售。交叉銷售是建立在雙贏原則上的,對客戶來講,要得到更多更好滿足需求的服務且從中受益,對企業(yè)來講,也會因銷售額的增長而獲益。數(shù)據(jù)挖掘可以幫助企業(yè)分析出最優(yōu)的合理的銷售匹配。交叉銷售就是指向現(xiàn)有的客戶提供新的產(chǎn)品和服務的營銷過程,那些購買了某種產(chǎn)品和服務的客戶很有可能同時購買你能提供的某些他感興趣的相關產(chǎn)品和服務,數(shù)據(jù)挖掘技術可以幫助企業(yè)發(fā)現(xiàn)這種行為模式并從中獲利。交叉銷售還有一種形式就是“升級銷售”,即向客戶提供與他們已購買的服務相關的增值服務。例如,電信公司向已經(jīng)使用標準長途電話服務的客戶推銷優(yōu)質長途電話服務。使用數(shù)據(jù)挖掘技術進行交叉營銷分析一般是從

6、分析現(xiàn)有客戶的購買行為數(shù)據(jù)開始,將每個單項產(chǎn)品銷售分析進行疊加,形成多項產(chǎn)品的交叉營銷分析。首先收集關于現(xiàn)有客戶消費習慣的數(shù)據(jù),然后對這些數(shù)據(jù)進行挖掘,對所有的客戶提供最合適的產(chǎn)品和服務。對交叉營銷做分析時,具體的數(shù)據(jù)挖掘過程包括:對個體行為進行建模;用預測模型對數(shù)據(jù)進行評分; 對得分矩陣進行最優(yōu)化處理。建模過程時用數(shù)據(jù)挖掘的一些算法對數(shù)據(jù)進行分析,然后產(chǎn)生一些數(shù)學模型,這些模型用來對客戶將來的行為進行預測分析。在交叉營銷分析中,需要對每一種交叉營銷的情況都要建立一個模型。在這些交叉營銷分析模型建好以后,每一個模型都可以用來分析新的客戶數(shù)據(jù)以預測這些客戶將來的行為。評分過程就是計算這些數(shù)學模型

7、的結果,評分過程的結果就是產(chǎn)生一個得分矩陣,矩陣的每一行代表一位顧客,每一列代表一種交叉銷售的情況。最后一步就是對這個得分矩陣進行最優(yōu)化處理,即對每一位顧客選出最適合的幾種服務方案。使用數(shù)據(jù)挖掘技術建立預測模型可以幫助找出客戶最適合的服務種類,來進行針對性的營銷活動。在交叉銷售中通常采用的數(shù)據(jù)挖掘算法是關聯(lián)規(guī)則。1.4、客戶的保持隨著行業(yè)的競爭越來越激烈和獲得一個新客戶的開支越來越大,保持原有客戶的工作也越來越有價值。保留一個客戶的時間越長,收回你在這個客戶身上所花的初期投資和獲取費用的時間越長,你從客戶身上獲得的利潤就越多。隨著獲得新客戶的費用與保留客戶的費用比在逐年升高,這樣的效果也逐年明

8、顯,尤其電信業(yè)在獲取新客戶的時候的費用是非常高的。但是由于各種因素的不確定性和市場的不斷增長以及一些競爭對手為新客戶提供比你更多的額外優(yōu)惠條件,很多客戶為了求得更低的費用,不斷的從你這里轉向另一個服務商??蛻魪囊粋€服務商轉向到另一個服務商的行為稱為客戶轉移。為了分析出是哪些主要因素導致客戶轉移并可以有針對性的挽留那些有離開傾向的客戶,企業(yè)可以通過使用數(shù)據(jù)挖掘技術,建立客戶轉移傾向的預測模型,挖掘出具有高風險轉移可能性并具有較高商業(yè)價值的客戶,在這些客戶轉移到同行業(yè)其它服務商那里之前,采取相應的商業(yè)活動措施來保持住這些有價值的客戶,這個過程就叫做客戶的保持。由于客戶保持預測模型是全局市場策略的一

9、部分,如何使用預測工具將對實施預測模型帶來的效益產(chǎn)生重要的影響。因此選擇的數(shù)據(jù)挖掘技術要使企業(yè)能夠對客戶進行細分并且能夠對客戶流失的原因有比較清晰的了解。在這樣的要求下,分類回歸決策樹CART和數(shù)據(jù)挖掘技術中的一些其它決策樹如CHAID和C4.5都可以很好的運用在這類現(xiàn)實環(huán)境中。從兩個方面分析電信企業(yè)客戶保持的重要性,從電信企業(yè)所處的外部環(huán)境來看,客戶保持是進行市場競爭的需要。在社會經(jīng)濟發(fā)展,科技進步的影響之下,我國的電信市場逐漸擴大,電信業(yè)務的需求量不斷增長。大量新運營商不斷進入電信市場,更激發(fā)了市場競爭的激烈程度。隨著電信市場壟斷局面的打破,市場上的廠商獲利由壟斷時期的高額利潤降至市場平均

10、利潤水平。在這種情況下,客戶保持的重要性就在競爭中凸現(xiàn)出來。從電信運營商的角度來看,客戶保持是企業(yè)生存發(fā)展的需要。通過一組數(shù)據(jù)表明:發(fā)展一位新客戶的成本是挽留一個老客戶的4倍;客戶忠誠度下降5%,則企業(yè)利潤下降25%;向新客戶推銷產(chǎn)品的成功率是15%,而向現(xiàn)有客戶推銷產(chǎn)品的成功率是50%;如果將每年的客戶關系保持率增加5個百分點,可能使利潤增長85%;向新客戶進行推銷的花費是向現(xiàn)有客戶推銷花費的6倍;如果公司對服務過失給予快速關注,70%對服務不滿的客戶還會繼續(xù)與其進行商業(yè)合作; 60%的新客戶來自現(xiàn)有客戶的推薦;一個對服務不滿的客戶會將他的不滿經(jīng)歷告訴其他810 個人,而一位滿意的客戶則會將

11、他的滿意經(jīng)歷告訴23人。以上數(shù)據(jù)充分說明,客戶是目前商業(yè)活動的中心,衡量一個企業(yè)是否成功的標準將不再僅僅是企業(yè)的投資收益率和市場份額, 而是該企業(yè)的客戶保持率,客戶份額及客戶資產(chǎn)收益率等指標??梢姡蛻舯3值膬r值體現(xiàn)在增加企業(yè)的盈利、降低企業(yè)的成本以及提高企業(yè)的信譽度、美譽度等方面。近年來電信體制的激烈變革和競爭的加劇使電信企業(yè)忙于開拓市場、發(fā)展客戶,對客戶保持重視不夠。從而導致企業(yè)一方面投入大量時間、人力、財力去發(fā)展新客戶,另一方面因客戶保持工作的不完善導致現(xiàn)有客戶不滿意而發(fā)生流失,這種情況對企業(yè)危害極大。面對當前的市場狀況。電信企業(yè)必須摒棄那種“狗熊掰棒子”式的市場開拓方式,在發(fā)展新客戶的

12、同時,著手進行客戶保持的研究,以有效的客戶關系管理來提高客戶的保持力,支持企業(yè)經(jīng)濟效益的不斷增長。1.5、客戶的獲取數(shù)據(jù)挖掘技術可以幫助企業(yè)完成對潛在客戶的篩選工作,市場人員把由數(shù)據(jù)挖掘技術得出的潛在客戶名單和這些客戶感興趣的優(yōu)惠措施系統(tǒng)地結合起來。數(shù)據(jù)挖掘技術在發(fā)展新客戶策略中的應用是圍繞數(shù)據(jù)開展的,用獲得的客戶數(shù)據(jù)建立一個預測模型,然后根據(jù)模型預測獲得最優(yōu)價值的潛在客戶信息??蛻舻墨@取包括發(fā)現(xiàn)那些對你的產(chǎn)品不了解的顧客,它們可能是你的產(chǎn)品的潛在消費者,也可能是以前接受你的競爭對手服務的顧客,其中有些客戶可能以前是你的客戶。通過數(shù)據(jù)挖掘技術來獲取新客戶首先必須收集一份潛在客戶名單。在潛在客戶

13、名單上列出哪些可能對你的產(chǎn)品或服務感興趣的消費者的信息。這些信息應不僅包括客戶的基本信息還應包括消費者消費行為的大量信息如個體的興趣、消費習慣、消費傾向和消費需求等。通過各種數(shù)據(jù)源來收集這些信息,如果沒能收集到足夠的數(shù)據(jù),那么就需要通過一次小規(guī)模的實驗活動來收集分析用的數(shù)據(jù)。在挑選實驗活動的對象時,不僅要從潛在客戶名單中選取一些客戶,還要隨機選取一些與潛在客戶名單上顧客屬性特征不同的客戶作為實驗對象。這樣可以為將來的數(shù)據(jù)挖掘提供足夠有價值的信息。2、客戶數(shù)據(jù)挖掘主題對照數(shù)據(jù)挖掘研究的4類問題:關聯(lián)、分類、預測、聚類,客戶數(shù)據(jù)挖掘主題也可按此4類來劃分。2.1、關聯(lián)問題橫向關聯(lián):是挖掘表面看似獨

14、立的事件間的相互關系,例如“90%的顧客在一次購買活動中購買商品A的同時購買商品B”之類的知識。比如經(jīng)典的“尿布和啤酒”的故事,就是利用這種方法,發(fā)現(xiàn)二者之間有很高的相關系數(shù),引起重視,然后深入分析后才找出內在原因的。次序關聯(lián):這種分析的側重點在于分析事件的前后序列關系,發(fā)現(xiàn)諸如“在購買A商品后,一段時間里顧客會接著購買商品B,而后購買商品C”的知識,形成一個客戶行為的 “ABC”模式。比如一個顧客在買了電腦之后,就很有可能購買打印機、掃描儀等配件。關聯(lián)問題研究客戶各項屬性特征的相互關系以及交叉銷售等問題,同時也研究客戶實體和其它實體的關系。電信業(yè)比較典型的關聯(lián)問題有交叉銷售、套餐選擇問題、業(yè)

15、務相互影響等問題。2.2、預測問題客戶預測問題是預測客戶的行為變化或消費等屬性變化。客戶典型的行為變化有流失、 增加、通話行為變化、消費行為變化、客戶信息變化、和其它行為變化。比較典型的預測問題有客戶流失/大客戶離網(wǎng)、潛在大客戶預測、客戶級別變動、客戶發(fā)展、市場效果預測等。2.3、分類問題分類分析就是通過分析樣本客戶數(shù)據(jù)庫中的數(shù)據(jù),為每個類別做出準確的描述或建立分析模型或挖掘出分類規(guī)則,然后用這個分類規(guī)則對其它客戶的記錄進行分類。比如電信公司根據(jù)客戶的消費記錄,把客戶分成大客戶和普通客戶,并標記數(shù)據(jù)庫中的每個記錄。有了這樣的挖掘結果,客戶服務部門就知道一個新的客戶的潛在價值,在客戶服務投入上就

16、心中有底。2.4、聚類問題聚類是分類的逆向方法。聚類把沒有分類的記錄,在不知道應分成幾類的情況下,按照數(shù)據(jù)內在的差異性大小,合理地劃分成幾類,并確定每個記錄所屬類別。它采用的分類規(guī)則是按統(tǒng)計學的聚類分析方法決定的??蛻艟垲悊栴}是對客戶特征的研究,典型的聚類問題有客戶特征分析、消費模型和異??蛻舴治龅?。3、數(shù)據(jù)挖掘技術對客戶管理管理的影響和作用在CRM中應用數(shù)據(jù)挖掘,第一步是要理解數(shù)據(jù)挖掘所要解決的具體業(yè)務問題;第二步根據(jù)問題準備相應的數(shù)據(jù),并對數(shù)據(jù)進行預處理;第三步是選擇挖掘的模型,比如是用關聯(lián)規(guī)則還是聚類等等;第四步是用訓練集數(shù)據(jù)訓練和評估挖掘模型的效果。一旦評估可以達到一定滿意程度,該模型

17、就得到確定,演變?yōu)橐粋€固定的業(yè)務應用模型。這個業(yè)務應用模型就可以套用于實際的業(yè)務處理,從而完成一個閉環(huán)的挖掘過程。當業(yè)務發(fā)生了變化或者有新的需求產(chǎn)生時,數(shù)據(jù)挖掘就在另外一個層次上重復這個循環(huán)過程。循環(huán)過程如圖3.1所示。圖3.1 數(shù)據(jù)挖掘應用循環(huán)過程在CRM中應用數(shù)據(jù)挖掘,可以在以下方面對CRM提供支持:3.1、為決策提供依據(jù)企業(yè)運營過程中的各種信息都是通過數(shù)據(jù)反映出來的,通過對這些數(shù)據(jù)的分析,可以發(fā)現(xiàn)企業(yè)運營過程中的規(guī)律,從而對企業(yè)的生產(chǎn)活動、市場活動等提供科學指導意義。CRM目前解決了企業(yè)與外部市場進行信息接入的問題,產(chǎn)生大量數(shù)據(jù)通過報表等統(tǒng)計方法,只能得到一般意義上的信息反映。而通過數(shù)據(jù)

18、挖掘技術,可以發(fā)現(xiàn)許多深層的、手工無法發(fā)現(xiàn)的規(guī)律,幫助企業(yè)在激烈的競爭環(huán)境中獲勝。3.2、為用戶提供針對性服務通過數(shù)據(jù)挖掘技術,可以根據(jù)客戶的消費行為進行分類,找出該類客戶的消費特征,然后提供更具個性化的服務,從而改進企業(yè)的服務水平,提高企業(yè)的社會效益和經(jīng)濟效益。3.3、提高企業(yè)決策的科學性目前,企業(yè)的決策具有很大的盲目性,如果采用數(shù)據(jù)挖掘技術,就可以在自己的生產(chǎn)過程中產(chǎn)生的數(shù)據(jù)基礎上,進行科學分析,得出比較科學的預測結果,減少決策失誤。通過數(shù)據(jù)挖掘技術,可以讓企業(yè)的決策回歸到自己的業(yè)務中,得到更實際的判斷。3.4、增值作用數(shù)據(jù)挖掘在CRM中會有很多種應用,而且有些應用可以幫助簡化管理運營,有

19、的則可以提供一些業(yè)務關聯(lián)性的數(shù)據(jù),幫助企業(yè)更好地開展業(yè)務,實現(xiàn)增值。3.5、簡化管理企業(yè)運營管理被人們提到前所未有的高度,一個企業(yè)即使建的很好,技術也很先進,但是如果管理不好,優(yōu)勢仍然發(fā)揮不出來。數(shù)據(jù)挖掘能幫助簡化管理:(1)預測業(yè)務量,安排人工在企業(yè)中,業(yè)務量是個重要的指標,企業(yè)要根據(jù)業(yè)務量的大小,安排人員的數(shù)量,但是業(yè)務量是個變化的指標,以往比較難以預測。通過數(shù)據(jù)挖掘中的時間序列分析,可以對業(yè)務量的情況進行一定程度的預測,就可以更合理的安排人員的數(shù)量,在不降低效率的基礎上,降低企業(yè)的運營成本。(2)進行關聯(lián)分析,降低運營成本通過數(shù)據(jù)挖掘中關聯(lián)分析,可以進行業(yè)務的相關性分析,分析出哪幾種業(yè)務

20、具有比較強的關聯(lián)性。這樣,在安排人員時,就可以將兩種或更多的業(yè)務人員進行一定程度的合并,減少人員數(shù)量,降低經(jīng)營成本。4、數(shù)據(jù)挖掘技術在電信客戶關系管理中的應用4.1、數(shù)據(jù)挖掘技術在電信CRM中主要應用領域電信運營商擁有許多成熟的數(shù)據(jù)庫應用系統(tǒng),產(chǎn)生了大量的業(yè)務處理數(shù)據(jù)。如果針對客戶關系管理相關決策分析的需求,對這些數(shù)據(jù)進行重組整合,就能充分利用這些寶貴的數(shù)據(jù),體現(xiàn)信息的真正價值。目前電信CRM的數(shù)據(jù)挖掘應用主要涉及以下幾個方面:(1)客戶消費模式分析客戶消費模式分析是對客戶歷年來長話、市話、信息臺的大量詳單、數(shù)據(jù)以及客戶檔案資料等相關數(shù)據(jù)進行關聯(lián)分析,結合客戶的分類,可以從消費能力、消費習慣、

21、消費周期等諸方面對客戶的話費行為進行分析和預測,從而為運營商的相關經(jīng)營決策提供依據(jù)。(2)業(yè)務預測分析通過對歷史數(shù)據(jù)的分析,找出影響業(yè)務發(fā)展的因素,然后對這些因素的未來發(fā)展作出預計,從而大致地確定未來業(yè)務量,作為制訂發(fā)展計劃的重要依據(jù)。(3)客戶欠費分析和動態(tài)防欺詐通過數(shù)據(jù)挖掘,總結各種騙費、欠費行為的內在規(guī)律,并建立一套欺詐和欠費行為的規(guī)則庫。當客戶的話費行為與該庫中規(guī)則吻合時,系統(tǒng)可以提示運營商相關部門采取措施,從而降低運營商的損失風險。(4)客戶流失分析根據(jù)已有的客戶流失數(shù)據(jù),建立客戶屬性、服務屬性、客戶消費情況等數(shù)據(jù)與客戶流失概率相關聯(lián)的數(shù)學模型,找出這些數(shù)據(jù)之間的關系,并給出明確的數(shù)

22、學模型。然后根據(jù)此模型來監(jiān)控客戶流失的可能性,如果客戶流失的可能性過高,則通過促銷等手段來提高客戶忠誠度,防止客戶流失的發(fā)生。這就徹底改變了以往電信運營商在成功獲得客戶以后無法監(jiān)控客戶流失的狀況。(5)大客戶特征識別大客戶群體是電信企業(yè)利潤的主要來源,也是電信企業(yè)之間相互爭奪的焦點。識別出大客戶,制訂針對性的措施,提高大客戶的忠誠度,是電信企業(yè)保持競爭優(yōu)勢的關鍵所在。不僅能夠根據(jù)現(xiàn)有消費量的多少來判斷用戶是否為大客戶,還應該根據(jù)現(xiàn)有大客戶的資料提取出大客戶的特征,并發(fā)現(xiàn)潛在的大客戶。(6)網(wǎng)絡資源的管理通信網(wǎng)在運行過程中產(chǎn)生了大量的運行數(shù)據(jù)。對這些數(shù)據(jù)進行挖掘,有利于盡早發(fā)現(xiàn)潛在的網(wǎng)絡故障,提

23、高網(wǎng)絡的利用率。4.2、數(shù)據(jù)挖掘的應用實例客戶流失分析一個完整的數(shù)據(jù)挖掘過程可進一步細分為業(yè)務問題定義、數(shù)據(jù)選擇、數(shù)據(jù)清洗和預處理、模型選擇與預建立、模型建立與調整、模型的評估與檢驗、模型解釋與應用。(1)業(yè)務問題定義針對客戶流失的不同種類分別定義業(yè)務問題,進而區(qū)別處理。在客戶流失分析中有兩個核心變量:財務原因/非財務原因、主動流失/被動流失??蛻袅魇Э梢韵鄳譃樗姆N類型,其中非財務原因主動流失的客戶往往是高價值的客戶,他們會正常支付服務費用,并容易對市場活動有所響應,這種客戶是企業(yè)真正需要保住的客戶。此外在分析客戶流失時必須區(qū)分集團/個人客戶,以及不同消費水平的客戶,并有針對性地制定不同的流

24、失標準。例如,平均月消費額1500元的客戶連續(xù)幾個月消費額降低到300元以下,就可以認為客戶流失發(fā)生了,而這個流失標準不適用于原來平均月消費額400元的客戶。國外成熟的應用中通常根據(jù)相對指標來判別客戶流失,例如大眾的個人通信費用約占總收入的1%3%,當客戶的個人通信費用遠低于此比例時,就認為發(fā)生了客戶流失。(2)數(shù)據(jù)選擇數(shù)據(jù)選擇包括目標變量的選擇、輸入變量的選擇和建模數(shù)據(jù)的選擇。a)目標變量的選擇客戶流失分析的目標變量通常為客戶流失狀態(tài)。根據(jù)業(yè)務問題的定義,可以選擇一個已知量或多個已知量的組合作為目標變量。實際的客戶流失形式有因賬戶取消發(fā)生的流失和因賬戶休眠發(fā)生的流失兩種。對于因賬戶取消發(fā)生的

25、流失,目標變量可以直接選取客戶的賬戶狀態(tài)(取消或正常);對于因賬戶休眠發(fā)生的流失,可以認為持續(xù)休眠超過一定時間長度的客戶發(fā)生了流失。這時需要對相關的具體問題加以考慮:持續(xù)休眠的時間長度定義為多少?每月通話金額低于多少即認為處于休眠狀態(tài),或者是綜合考慮通話金額、通話時長和通話次數(shù)來劃定休眠標準?選擇目標變量時面臨的這些問題需要業(yè)務人員給予明確的回答。b)輸入變量的選擇輸入變量是模型中的自變量,在建模過程中需要尋找自變量與目標變量的關聯(lián)。輸入變量分為靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)。靜態(tài)數(shù)據(jù)指不常變化的數(shù)據(jù),包括服務合同屬性(如服務類型、 服務時間、交費類型)和客戶的基本資料;動態(tài)數(shù)據(jù)指頻繁或定期改變的數(shù)據(jù),如

26、月消費金額、交費記錄、消費特征。業(yè)務人員在實際業(yè)務活動中可能會感覺到輸入變量與目標變量的內在聯(lián)系,只是無法量化表示出來,這就給數(shù)據(jù)挖掘留下了發(fā)揮的空間。如果一時無法確定某種數(shù)據(jù)是否與客戶流失概率有關聯(lián),應該暫時將其選入模型,并在后續(xù)步驟考察各變量分布情況和相關性時再行取舍。c)建模數(shù)據(jù)的選擇客戶流失的方式有兩種。第一種是客戶的自然消亡,例如身故、破產(chǎn)、遷徙、移民而導致客戶不再存在,或者由于客戶服務的升級造成特定服務的目標客戶消失。第二種是客戶的轉移流失,通常指客戶轉移到競爭對手,并使用其服務。第二種流失的客戶才是運營商真正關心的、具有挽留價值的客戶。因此在選擇建模數(shù)據(jù)時必須選擇第二種流失客戶數(shù)

27、據(jù)參與建模,才能建立有效的模型。(3)數(shù)據(jù)清洗和預處理數(shù)據(jù)清洗和預處理是建模前的數(shù)據(jù)準備工作,一方面保證建模數(shù)據(jù)的正確性和有效性, 另一方面通過對數(shù)據(jù)格式和內容的調整,使數(shù)據(jù)更符合建模的需要。數(shù)據(jù)整理的主要工作包括對數(shù)據(jù)的轉換和整合、抽樣、隨機化、缺失值處理等。例如按比例抽取未流失客戶和已流失客戶,將這兩類數(shù)據(jù)合并,構成建模的數(shù)據(jù)源。此外,模型在建立之后需要大量的數(shù)據(jù)來進行檢驗,因此通常把樣本數(shù)據(jù)分為兩部分,2/3的數(shù)據(jù)用于建模,1/3的數(shù)據(jù)用于模型的檢驗和修正。(4)模型選擇與預建立在模型建立之前,可以利用數(shù)據(jù)挖掘工具的相關性比較功能,找出每一個輸入變量和客戶流失概率的相關性,刪除相關性較小的變量,從而可以縮短建模時間,降低模型復雜度,有時還能使模型更精確。現(xiàn)有的數(shù)據(jù)挖掘工具提供了決策樹、神經(jīng)網(wǎng)絡、近鄰學習、回歸、關聯(lián)、聚類、貝葉斯判別等多種建模方法??梢苑謩e使用其中的多種方法預先建立多個模型, 然后對這些模型進行優(yōu)劣比較,從而挑選出最適合客戶流失分析的建模方法。(5)模型

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論