版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、某運營商數(shù)據(jù)挖掘項目匯報_新增用戶維系2010年3月新增用戶維系基本流程1、采用生存分析法,對有流失傾向的用戶進行提前預警,并可根據(jù)用戶流失概率的高低劃定預警級別流失高危用戶群在網(wǎng)異動用戶群正常用戶群異動預警監(jiān)控1、維系策略方案生成渠道養(yǎng)卡監(jiān)管措施重入網(wǎng)與反復用戶管控措施正常低網(wǎng)齡用戶維系措施2、維系方案實施營銷案實施流程維系渠道維系方式維系策略及方案1、維系情況反饋2、目標達成情況3、維系效果評估:渠道養(yǎng)卡識別及監(jiān)管重入網(wǎng)與反復重入網(wǎng)正常低網(wǎng)齡用戶維系維系效果評估1、新增用戶分群:渠道養(yǎng)卡重入網(wǎng)與反復重入網(wǎng)用戶正常低網(wǎng)齡用戶細分根據(jù)正常低網(wǎng)齡用戶偏好進行細分新增用戶分群建立新增用戶維系閉環(huán)管
2、理體系,準確分群,分級預警,制定針對性的維系策略和方案并實施,實現(xiàn)新增用戶保有。 渠道養(yǎng)卡識別與監(jiān)控 重入網(wǎng)與反復重入網(wǎng)管理 正常低網(wǎng)齡用戶維系新增用戶維系 柳州渠道養(yǎng)卡行為特征及監(jiān)控思路建議產(chǎn)品:渠道養(yǎng)卡一般選擇無月租或最低月租的產(chǎn)品,以降低養(yǎng)卡的成本,研究發(fā)現(xiàn)柳州2種類型產(chǎn)品均被渠道選擇使用ARPU:渠道養(yǎng)卡號碼消費額一般較低,研究發(fā)現(xiàn)柳州養(yǎng)卡號碼月均消費一般低于15元主叫時長:渠道養(yǎng)卡號碼主叫時長非常低,研究發(fā)現(xiàn)柳州有70%以上無通話行為,有通話行為用戶主叫時長主要集中在3分鐘以內(nèi)用戶狀態(tài):研究發(fā)現(xiàn)柳州渠道養(yǎng)卡新增號碼停機流失高峰出現(xiàn)在入網(wǎng)后的第1-3個月消費情況:同一個渠道發(fā)展的養(yǎng)卡號
3、碼中,出現(xiàn)多個號碼消費行為一致的情況,如多個號碼入網(wǎng)當月和次月消費完全一致激活I(lǐng)MEI:養(yǎng)卡號碼在激活時,一般用同一個手機激活,因此養(yǎng)卡號碼中大量號碼的激活I(lǐng)MEI一致柳州渠道養(yǎng)卡行為特征制定疑似養(yǎng)卡渠道的判斷規(guī)則:從渠道發(fā)展用戶的產(chǎn)品、ARPU、用戶狀態(tài)進行判斷,當用戶數(shù)占比符合一定標準后,即判斷為疑似養(yǎng)卡渠道;制定疑似養(yǎng)卡號碼的判斷規(guī)則:從用戶消費情況、激活I(lǐng)MEI等進行判斷,符合一定標準的號碼為疑似養(yǎng)卡號碼;分析疑似養(yǎng)卡渠道的養(yǎng)卡號碼量,計算養(yǎng)卡號碼占其當月新發(fā)展的比,并按各渠道此比例排序養(yǎng)卡行為監(jiān)控思路建議通過研究發(fā)現(xiàn)柳州渠道養(yǎng)卡行為特征及監(jiān)控思路建議如下: 以上判斷標準,都以同一渠道
4、發(fā)展的用戶作為判斷基礎(chǔ)數(shù)據(jù); 判斷步驟是首先判斷疑似養(yǎng)卡渠道,在判斷其為疑似養(yǎng)卡渠道后,統(tǒng)計其疑似養(yǎng)卡號碼數(shù)量 對養(yǎng)卡號碼的判斷模型是對渠道養(yǎng)卡違規(guī)行為進行分析的基礎(chǔ),需要在執(zhí)行中進一步分析、調(diào)研完善優(yōu)化判斷規(guī)則,提升判斷準確率。疑似養(yǎng)卡渠道和養(yǎng)卡號碼判斷規(guī)則疑似養(yǎng)卡渠道產(chǎn)品:渠道新增用戶中,30%以上的用戶都為兩廣情零聽計劃或都市“零聽”計劃二,該渠道為疑似養(yǎng)卡渠道主叫時長:渠道新增用戶中,50%以上或100人以上的用戶入網(wǎng)當月和次月主叫時長在3分鐘內(nèi),該渠道為疑似養(yǎng)卡渠道用戶狀態(tài):渠道新增用戶中,入網(wǎng)后在第3個月,30%以上的用戶狀態(tài)為停機流失,該渠道為疑似養(yǎng)卡渠道疑似養(yǎng)卡號碼消費情況:a
5、.出現(xiàn)5個或以上號碼號碼入網(wǎng)當月和次月主叫時長都在3分鐘內(nèi);b.或出現(xiàn)5個或以上號碼號碼入網(wǎng)當月和次月消費在5元以內(nèi);c.或出現(xiàn)2個以上號碼入網(wǎng)當月或次月應收費完全一致,這些號碼為疑似養(yǎng)卡號碼激活情況:a.出現(xiàn)5個或以上號碼號碼激活I(lǐng)MEI一致;b.或2個或以上號碼登記身份證號一致這些號碼為疑似養(yǎng)卡號碼ARPU:渠道新增用戶中,30%以上或100人以上的用戶入網(wǎng)當月和次月ARPU低于5元,該渠道為疑似養(yǎng)卡渠道 渠道養(yǎng)卡識別與監(jiān)控 重入網(wǎng)與反復重入網(wǎng)管理 正常低網(wǎng)齡用戶維系新增用戶維系 重入網(wǎng)與反復重入網(wǎng)(跳蚤)用戶識別規(guī)則NN+1N-6N-4N-5N-2N-3N-1新入網(wǎng)激活月新入網(wǎng)激活后第1
6、月新入網(wǎng)激活月前半年的存量用戶歷史IMEI庫或身份證庫N月在網(wǎng)用戶,區(qū)分新增和存量用戶判斷重入網(wǎng)用戶判斷新入網(wǎng)用戶的有效IMEI或身份證號碼N月新入網(wǎng)用戶中的重入網(wǎng)和反復重入網(wǎng)用戶名單剔除無效IMEI或身份證號碼生成、維護歷史有效IMEI庫或身份證號庫重入網(wǎng):新用戶IMEI或身份證號與歷史IMEI或身份證號碼能夠匹配(6個月以內(nèi))。如,9月新入網(wǎng)用戶IMEI或身份證號與3月到8月用戶IMEI或身份證號碼庫匹配后,得到9月新入網(wǎng)用戶中重入網(wǎng)用戶。反復重入網(wǎng)(跳蚤用戶):重入網(wǎng)用戶在6個月以內(nèi)重入網(wǎng)2次及2次以上的用戶。識別規(guī)則:通過對新入網(wǎng)用戶使用手機的IMEI號(或身份證號碼)與存量用戶的IM
7、EI號歷史庫(或身份證號碼歷史庫)進行分析識別出重入網(wǎng)和反復重入網(wǎng)用戶。為了提高分析結(jié)果的準確率,每月定期對上月新入網(wǎng)的用戶(上月入網(wǎng)并激活的用戶)進行分析。分析示意如下:用戶在N月入網(wǎng)并激活(有話單產(chǎn)生),則在N+1月(計算月)對N月入網(wǎng)并激活的所有用戶進行重入網(wǎng)分析。用戶重入網(wǎng)主要原因分析產(chǎn)品價格促銷/宣傳渠道產(chǎn)品線過長,產(chǎn)品重疊較多,目標用戶群存在較多交叉,不同品牌及資費存在內(nèi)部競爭產(chǎn)品價格調(diào)整比較頻繁,而且在價格調(diào)整過程中沒有考慮產(chǎn)品體系間的平衡問題預存費用低,用戶入網(wǎng)門檻不高,使其可以輕易棄卡新入網(wǎng)促銷活動優(yōu)惠力度過大品牌及資費資費套餐互轉(zhuǎn)門檻過高,停機保號、套餐互轉(zhuǎn)等宣傳不足部分社
8、會渠道迫于指標壓力或利益驅(qū)動,誘導用戶換卡社會渠道虛假激活,通過養(yǎng)卡惡意套取酬金追求經(jīng)濟收益,受入網(wǎng)優(yōu)惠的吸引換取吉祥號碼欠費競爭對手以低資費、大力度的優(yōu)惠活動吸引用戶,但整體質(zhì)量未能讓用戶滿意,從而使用戶在短暫離(移動)網(wǎng)后重新入網(wǎng)公司內(nèi)部競爭對手用戶服務補卡成本高,手續(xù)復雜,補卡不如買新卡欠費提醒不及時,欠費后被停機,選擇重入網(wǎng)從產(chǎn)品、促銷、渠道、傳播、服務等多方面入手加強重入網(wǎng)與反復重入網(wǎng)管理,降低重入網(wǎng)比率重入網(wǎng)與反復重入網(wǎng)管理措施加強入網(wǎng)促銷活動管理,減少促銷活動對在網(wǎng)用戶的干擾;提高入網(wǎng)首次預存費用,增加在網(wǎng)時長;用戶忠誠度管理:網(wǎng)齡營銷。產(chǎn)品/促銷傳播渠道服務加強(社會)渠道掌控
9、,規(guī)范渠道行為,減少系統(tǒng)性離網(wǎng)行為。采用戶外廣告、報紙等大眾媒體及營業(yè)廳、10086短信、網(wǎng)站、WAP等自有媒體體開展網(wǎng)齡營銷、優(yōu)惠補卡及帶號轉(zhuǎn)品牌、套餐、停機保號等的傳播。加強欠費管理,減少無效欠費;主卡付費+親情網(wǎng);賬戶低余額時充值提示;優(yōu)惠或免費補卡;推薦帶號轉(zhuǎn)品牌或帶號轉(zhuǎn)套餐。 渠道養(yǎng)卡識別與監(jiān)控 重入網(wǎng)與反復重入網(wǎng)管理 正常低網(wǎng)齡用戶維系新增用戶維系 正常低網(wǎng)齡用戶維系基本策略剔除了渠道養(yǎng)卡用戶和反復重入網(wǎng)用戶后所獲得的正常低網(wǎng)齡用戶是新增用戶流失控制的重點。運用數(shù)據(jù)挖掘方法,識別出不同流失預警級別的用戶,針對高危用戶和異動用戶分別采取針對性的營銷捆綁手段進行維系,同時結(jié)合網(wǎng)齡營銷,
10、延長用戶生命周期。正常低網(wǎng)齡用戶分群用戶重綁:針對高危用戶在網(wǎng)黏性已很弱的特點,采取較大力度的營銷捆綁策略,以返還周期短的財務捆綁和力度較大的業(yè)務捆綁為主,以服務捆綁為輔。力保:針對異動用戶尚處于流失猶豫期、還具有一定黏性的特點,維系策略將以強化用戶的業(yè)務黏性為重點,以業(yè)務捆綁和較長返還周期的財務捆綁為主,以服務捆綁為輔。全用戶常規(guī)保有(不研究)。 細分用戶群基本策略流失高危用戶在網(wǎng)異動用戶相對穩(wěn)定用戶多級預警,多級維系 在模型挖掘的基礎(chǔ)上,準確判別正常低網(wǎng)齡用戶的流失傾向,根據(jù)用戶流失概率的高低分別實施針對性的維系策略和措施,對可能流失的用戶提前預防,多級維系,有效地防止用戶流失。流失異動用
11、戶營銷捆綁日常維系及異動監(jiān)控辦理未辦理模型匹配低網(wǎng)齡用戶流失高危用戶是否流失流失未流失112一級匹配和維系;二級匹配和維系。12正常低網(wǎng)齡用戶細分、預警及維系框架精準營銷模型新增用戶細分模型用戶價值在網(wǎng)時長渠道偏好促銷偏好用戶號碼消費特征用戶清單話費余額新增網(wǎng)用戶流失模型商務高端用戶群長途話務突出群本地話務突出群本地低端用戶群數(shù)據(jù)業(yè)務發(fā)燒群漫游突出用戶群數(shù)據(jù)業(yè)務興趣群本地話務偏好群在網(wǎng)異動用戶流失高危用戶長途話務突出群本地話務突出群本地低端用戶群漫游突出用戶群數(shù)據(jù)業(yè)務突出群本地話務偏好群當月新增用戶其他新增用戶營銷案用戶流失預警和細分建模過程 流失現(xiàn)狀分析 流失原因分析 流失用戶特征分析 流失
12、預警建模目標溝通確定 流失細分模型目標溝通確定 根據(jù)建模要求和現(xiàn)有數(shù)據(jù)情況,構(gòu)思、溝通和確定建模數(shù)據(jù)提取需求 提取09年1-10月新增用戶在1-10月的自然屬性和消費行為數(shù)據(jù) 提取09年10月新增用戶在10月的日消費行為數(shù)據(jù) 數(shù)據(jù)質(zhì)量審核 數(shù)據(jù)探索 非正常用戶的剔除。根據(jù)渠道養(yǎng)卡和跳蚤用戶識別模型提取異常用戶 數(shù)據(jù)抽樣。確定建模用戶集合 建模衍生變量計算。根據(jù)提取的基礎(chǔ)數(shù)據(jù)寬表計算衍生變量 建模變量篩選 特征建模分析 卡方分析 方差分析 雙變量分析 Pearson相關(guān)分析 wald顯著性檢驗 量重要性分析 建模變量數(shù)據(jù)轉(zhuǎn)換 對數(shù)變換 標準化變換 確定建模用戶集 確定建模用戶數(shù)據(jù)集 采用Two
13、Step聚類算法,建立用戶細分模型 月數(shù)據(jù)用戶細分模型(高價值 用戶和在網(wǎng)2月及2月以上的新增用戶細分 日數(shù)據(jù)用戶細分模型(在網(wǎng)1月新增用戶細分) 業(yè)務解釋聚類結(jié)果,調(diào)整模型參數(shù)和建模變量,直到得到滿意結(jié)果 確定建模用戶集 確定建模用戶數(shù)據(jù)集 采用邏輯回歸和決策樹算法建立流失預警模型 在網(wǎng)2月新增用戶流失預警模型 在網(wǎng)2月以上新增用戶流失預警模型 在網(wǎng)1月新增用戶流失預警模型采用生存分析算法建立高價值用戶流失預警模型 模型的評估 提升圖、收益圖 混淆矩陣。準確率和查全率 模型的優(yōu)化 建模訓練集比例 異常值處理 建模變量 建模方法 模型參數(shù) 顯著性檢驗方法 顯著性檢驗變量剔除閾值 樹的深度和頁節(jié)
14、點記錄個數(shù) 業(yè)務與數(shù)據(jù) 分析數(shù)據(jù)準備建模準備細分模型預警模型模型評估和優(yōu)化數(shù)據(jù)提取數(shù)據(jù)清洗數(shù)據(jù)審核數(shù)據(jù)集成 數(shù)據(jù)挖掘?qū)挶順?gòu)建 缺失數(shù)據(jù)處理 極值數(shù)據(jù)處理 錯誤數(shù)據(jù)處理 冗余數(shù)據(jù)處理 數(shù)據(jù)統(tǒng)計錯誤審核 數(shù)據(jù)源錯誤審核 數(shù)據(jù)統(tǒng)計口徑審核數(shù)據(jù)準備確保建模數(shù)據(jù)的完整性、可用性和完整性 提取建模所需數(shù)據(jù)數(shù)據(jù)準備篩選建模變量、根據(jù)模型要求進行數(shù)據(jù)變換建模準備字段過濾變異系數(shù)標準差最大類別數(shù)最小類別數(shù)數(shù)據(jù)探索數(shù)據(jù)分布雙變量分析正態(tài)性檢驗相關(guān)性分析卡方分析 方差分析 相關(guān)分析 自相關(guān)分析建模篩選通過建模分析字段的重要性決策樹模型,信息增益旁別邏輯回歸模型,回歸系數(shù)顯著性檢驗數(shù)據(jù)變換標準化變換對數(shù)變換正態(tài)變換經(jīng)
15、分數(shù)據(jù)挖掘?qū)挶碜兞哭D(zhuǎn)換變量篩選健康度建模指標庫變量清洗用戶細分采用凝聚層次聚類算法選擇初始化更新結(jié)束計算包含每對樣本間距離(如歐氏距離)的相似矩陣,把每個樣本作為一個簇使用相似矩陣查找最相似的兩個簇將兩個簇合并為一個簇,簇的個數(shù)通過合并被更新;同時更新相似矩陣,將兩個簇的兩行(兩列)距離用1行(1列)距離替換反映合并操作。當所有樣本都合并成一個簇或滿足指定的簇的數(shù)目時,整個過程結(jié)束。層次聚類可以分為兩種:凝聚的方式和分割的方式,凝聚是一種至底向上的方法,將每一條記錄看作一個類,然后根據(jù)一些規(guī)則將他們聚合成越來越大的類,直到滿足一些預先設(shè)定的條件。 1 234執(zhí)行n-1次步驟2和步驟3網(wǎng)齡2月及
16、以上新增用戶細分模型采用SPSS及CLEMENTINE作為數(shù)據(jù)分析與聚類建模工具算法為Two Step 聚類算法使用細分矩陣,按照語音消費行為和數(shù)據(jù)業(yè)務消費行為兩次聚類的方法分別聚類,多維聚類的方法較傳統(tǒng)單維聚類方法,聚類后的用戶細分特征更明顯聚類數(shù)據(jù)集為2009年1-9月新增用戶入網(wǎng)后第二個月,且第二月狀態(tài)正常的用戶的基礎(chǔ)數(shù)據(jù)和消費行為數(shù)據(jù)數(shù)據(jù)在聚類前需進行標準化變換和極值處理本地通話次數(shù)長途通話次數(shù)計費通話時長漫游通話次數(shù)ARPU低端中低端長途突出本地突出漫游突出商務GPRS流量新業(yè)務費新業(yè)務使用種類數(shù) 彩信條數(shù) 短信條數(shù)新業(yè)務費占比使用少占比高興趣短信突出上網(wǎng)突出發(fā)燒友細分群主要消費行為
17、特征(網(wǎng)齡=2個月)-1序號細分群名稱細分群特征規(guī)模占比1商務高端用戶群語音消費行為相對數(shù)據(jù)業(yè)務消費行為更為突出,為用戶主要行為屬性;ARPU最高為240元/戶以上,交往圈最大,本長漫語音話務均高,且每次通話時長較長2.4%2漫游突出用戶群語音消費行為相對數(shù)據(jù)業(yè)務消費行為更為突出,為用戶主要行為屬性;ARPU為85元/戶左右,經(jīng)常去外地,漫游話務突出,本地及長途話務較少,且漫游通話頻次最高3.9%3長途話務突出群語音消費行為相對數(shù)據(jù)業(yè)務消費行為更為突出,為用戶主要行為屬性;ARPU為120元/戶左右,交往圈中有大量外地號碼,長途話務突出,漫游很少,且長途通話頻次最高7.6%4本地話務突出群語音
18、消費行為相對數(shù)據(jù)業(yè)務消費行為更為突出,為用戶主要行為屬性;ARPU為120元/戶左右,交往圈主要集中在本地,本地話務突出,長途漫游較少,且本地通話頻次最高4.7%5本地話務偏好群語音消費行為相對數(shù)據(jù)業(yè)務消費行為更為突出,為用戶主要行為屬性;ARPU為67元/戶左右,交往圈主要集中在本地,通話時長相對較低,但本地話務相對突出,長途漫游很少14.8%6本地低端用戶群語音和數(shù)據(jù)業(yè)務消費行為均較低,用消費戶行為相對均衡;ARPU較低為30元/戶左右,很少去外地,漫游和長途時長比例最低,平均每次通話時長最短33.5%序號細分群名稱細分群特征規(guī)模占比7短信突出用戶群數(shù)據(jù)業(yè)務消費行為相對語音消費行為更為突出
19、,為用戶主要行為屬性;ARPU為40元/戶左右,數(shù)據(jù)業(yè)務消費占比高于50%,主要使用短信業(yè)務,且短信上行條數(shù)最高8.0%8GPRS突出用戶群數(shù)據(jù)業(yè)務消費行為相對語音消費行為更為突出,為用戶主要行為屬性;ARPU為30元/戶左右,數(shù)據(jù)業(yè)務消費占比高于50%,GPRS流量高,其他數(shù)據(jù)業(yè)務使用較少8.1%9數(shù)據(jù)業(yè)務興趣群數(shù)據(jù)業(yè)務消費行為相對語音消費行為更為突出,為用戶主要行為屬性;ARPU為20元/戶左右,訂購數(shù)據(jù)業(yè)務種類最多,但消費不高,數(shù)據(jù)業(yè)務費用占比高于50%13.3%10數(shù)據(jù)業(yè)務發(fā)燒群數(shù)據(jù)業(yè)務消費行為相對語音消費行為更為突出,為用戶主要行為屬性;ARPU為65元/戶左右,訂購數(shù)據(jù)業(yè)務種類最多
20、,且數(shù)據(jù)業(yè)務消費最高, 占比高達67%3.9%細分群主要消費行為特征(網(wǎng)齡=2個月)-2網(wǎng)齡1月新增用戶細分模型采用SPSS及CLEMENTINE作為數(shù)據(jù)分析與聚類建模工具算法為Two Step 聚類算法使用細分矩陣,按照語音消費行為和數(shù)據(jù)業(yè)務消費行為兩次聚類的方法分別聚類,多維聚類的方法較傳統(tǒng)單維聚類方法,聚類后的用戶細分特征更明顯聚類數(shù)據(jù)集為2009年10月125日入網(wǎng),11月1日之前未流失的用戶從入網(wǎng)當日至月底的日均消費行為數(shù)據(jù)數(shù)據(jù)在聚類前需進行標準化變換和極值處理低端中低端長途突出本地突出商務占比占比高使用少興趣上網(wǎng)突出發(fā)燒友日均本地通話次數(shù)日均長途通話次數(shù)日均漫游通話次數(shù)日均計費通話
21、時長日均GPRS流量 日均彩信條數(shù) 日均短信條數(shù)新業(yè)務使用 種類數(shù)新業(yè)務費占比序號細分群名稱細分群特征規(guī)模占比1漫游突出用戶群語音消費行為相對數(shù)據(jù)業(yè)務消費行為更為突出,為用戶主要行為屬性;入網(wǎng)當月ARPU為100元/戶左右,經(jīng)常去外地,漫游話務突出,本地及長途話務很少,且漫游通話頻次最高3.0%2長途話務突出群語音消費行為相對數(shù)據(jù)業(yè)務消費行為更為突出,為用戶主要行為屬性;入網(wǎng)當月ARPU為100元/戶左右,交往圈中有大量外地號碼,長途話務突出,基本無漫游,且長途通話頻次最高4.5%3本地話務突出群語音消費行為相對數(shù)據(jù)業(yè)務消費行為更為突出,為用戶主要行為屬性;入網(wǎng)當月ARPU為75元/戶左右,交
22、往圈主要集中在本地,本地話務突出,基本無漫游,長途很少,且本地通話頻次最高7.7%4本地話務偏好群語音消費行為相對數(shù)據(jù)業(yè)務消費行為更為突出,為用戶主要行為屬性;入網(wǎng)當月ARPU為55元/戶左右,交往圈主要集中在本地,通話時長相對較低,但本地話務相對突出,基本無漫游,長途很少12.6%5本地低端用戶群語音和數(shù)據(jù)業(yè)務消費均較低,且二者消費相對均衡;入網(wǎng)當月ARPU為25元/戶左右,主要在本地活動,本、長、漫通話時長均為最低,基本無數(shù)據(jù)業(yè)務使用量36.7%細分群主要消費行為特征(網(wǎng)齡1個月)-1序號細分群名稱細分群特征規(guī)模占比6數(shù)據(jù)業(yè)務突出群數(shù)據(jù)業(yè)務消費行為相對語音消費行為更為突出,為用戶主要行為屬
23、性;入網(wǎng)當月ARPU為30元/戶左右,訂購數(shù)據(jù)業(yè)務種類最多,且數(shù)據(jù)業(yè)務消費占比高, 高達79%21.3%7GPRS偏好用戶群數(shù)據(jù)業(yè)務消費行為相對語音消費行為更為突出,為用戶主要行為屬性;入網(wǎng)當月ARPU為54元/戶左右,GPRS消費最高,遠高于其他群,且數(shù)據(jù)業(yè)務消費占比高, 高達77%9.2%8短信突出用戶群數(shù)據(jù)業(yè)務消費行為相對語音消費行為更為突出,為用戶主要行為屬性;入當月ARPU為80元/戶左右,數(shù)據(jù)業(yè)務消費占比為65%左右,日平均發(fā)送短信10條左右,主要使用短彩信業(yè)務,且短信和彩信上行條數(shù)均為最高4.9%細分群主要消費行為特征(網(wǎng)齡1個月)-2 新增用戶中的流失用戶超過四分之三的用戶生命
24、周期不超過四個月,不具有完整的生命周期特征 COX生存分析模型,隱含了一條假設(shè),即在時間越長,其離網(wǎng)的可能性就越大,這樣一來,是否離網(wǎng)和在網(wǎng)時間應該是正相關(guān)的,COX模型在擬合的時候,會在這個約束之下,所以其對數(shù)據(jù)的擬合沒有LOGIT效果好 因此對新增用戶離網(wǎng)預警,采用LOGIT回歸模型或決策模型新增用戶中的流失用戶有76%在入網(wǎng)后的四個月內(nèi)流失 流失用戶的76% 是在入網(wǎng)后的四個月內(nèi)流失 分別有22%和23%的流失用戶在入網(wǎng)后的第一個月和第二月內(nèi)流失數(shù)據(jù)來源:09年1月-10月新增用戶流失用戶定義:當月停機,且連續(xù)停機60天以上用戶,到2009年11月仍未開機用戶網(wǎng)齡舉例:3月入網(wǎng),3月流失
25、的用戶,網(wǎng)齡為0個月流失用戶的在網(wǎng)時長分布決策樹決策樹預測模型:決策樹是以實例為基礎(chǔ)的歸納學習算法,它著眼于從一組無次序、無規(guī)則的實例中推理出以決策樹表示的分類規(guī)則。它采用自頂向下的遞歸方式,在決策樹的內(nèi)部節(jié)點進行屬性的比較,并根據(jù)不同屬性值判斷從該節(jié)點向下的分支,在決策樹的葉節(jié)點得到結(jié)論。邏輯回歸邏輯回歸預測模型:也稱定性變量回歸,類似于線性回歸,但是目標字段使用字符型字段而不是數(shù)值型字段。Logistic回歸建立一組方程,把輸入屬性值與輸出字段每一類的概率聯(lián)系起來。一旦生成模型,便可用于估計新記錄屬于某類的概率。概率最大的目標類被指定為該記錄的預測輸出值。 邏輯回歸算法具有訓練集和測試集預
26、測準確率的差異是最小的優(yōu)點能給出用戶屬于某類型概率,可精確控制用戶群大小對有缺失值的記錄不能給出預測概率模型自變量之間可能存在多重共線性干擾業(yè)務可解釋性較決策樹差優(yōu)點缺點選擇分類算法 邏輯回歸算法具有訓練集和測試集預測準確率的差異是最小可以精確控制篩選用戶群大小的 優(yōu)點,同時我們采用缺失值處理、相關(guān)性分析可以規(guī)避算法的缺點,優(yōu)先選用邏輯回歸算法。比較模型預測效果,選擇預測效果較佳分類算法模型比較結(jié)論正常低網(wǎng)齡用戶流失采用預警分類算法在網(wǎng)2月新增用戶流失預警模型 采用SPSS和CLEMENTINE作為數(shù)據(jù)分析和建模工具 分別采用邏輯回歸算法和決策樹算法建模,比較模型預測效果,確定使用邏輯回歸算法
27、 基本情況語音通話情況數(shù)據(jù)業(yè)務使用情況品牌ARPU余額套餐名稱本地通話次數(shù)長途通話次數(shù)漫游通話次數(shù)數(shù)據(jù)業(yè)務費用數(shù)據(jù)業(yè)務消費占比數(shù)據(jù)業(yè)務使用種類數(shù)3月4月5月6月7月8月9月10月11月3月4月5月6月7月8月9月10月11月3月4月5月6月7月8月9月10月11月3月4月5月6月7月8月9月10月11月建模時間窗口測試時間窗口入網(wǎng)月份取數(shù)月份流失月份流失觀察月份建模變量建模結(jié)果余額通話次數(shù)套餐名稱本地被叫次數(shù)欠費金額本地主叫次數(shù)網(wǎng)內(nèi)通話對端數(shù)網(wǎng)外通話對端數(shù)彩鈴訂購標志通話時長大于5分鐘標志多次充值標志欠費標志ARPU大于0標志長途通話次數(shù)漫游通話次數(shù)新業(yè)務費通話標志包打套餐標志手機報費用本地主
28、叫通話標志撥打10086次數(shù)重入網(wǎng)標志 所有的數(shù)據(jù)經(jīng)過對數(shù)變換和標準化變換,消除不同變量和不同月份對模型的影響 邏輯回歸算法使用的方法是進入法,模型調(diào)整變量的依據(jù)是回歸參數(shù)的Wald檢驗,模型擬合優(yōu)度的評判標準時是-2對數(shù)似然值,值越小,擬合效果越好 模型的結(jié)果為對數(shù)流失風險比的線性擬合表達式,應用模型時輸入為用戶當前在建模變量上的值,輸出為用戶的流失概率 下圖展示了建模變量的重要性(調(diào)整后的實際建模變量)變量重要性用戶集:09年07月入網(wǎng)、08月仍然正常的用戶;模型篩選用戶:通過模型篩選出的用戶集中20%的用戶,其中, 包含了用戶集中52.2%的9月流失用戶;模型篩選用戶9月、10月和11月
29、的流失率(模型準確率)分別為16%、34%和48%,比用戶集中用戶的流失率(不使用模型篩選的準確率)提升度分別為2.4、2.5和3.2倍。52.2%* 提升度=模型篩選用戶流失率/用戶集中用戶流失率考察模型篩選用戶三個月流失情況,模型準確率為48%在網(wǎng)2月以上新增用戶流失預警模型分別采用邏輯回歸算法和決策樹算法建模,比較模型預測效果,確定使用邏輯回歸算法3月4月5月6月7月8月9月10月11月3月4月5月6月7月8月9月10月11月3月4月5月6月7月8月9月10月11月3月4月5月6月7月8月9月10月11月建模時間窗口測試時間窗口建模變量 基本情況語音通話情況數(shù)據(jù)業(yè)務使用情況品牌ARPU余
30、額套餐名稱月數(shù)據(jù)時間段變化趨勢數(shù)據(jù)月數(shù)據(jù)時間段變化趨勢數(shù)據(jù)本地通話次數(shù)長途通話次數(shù)漫游通話次數(shù)本地通話次數(shù)波動率長途通話次數(shù)波動率漫游通話次數(shù)波動率數(shù)據(jù)業(yè)務費用數(shù)據(jù)業(yè)務消費占比數(shù)據(jù)業(yè)務使用種類數(shù)數(shù)據(jù)業(yè)務費用波動率3月4月5月6月7月8月9月10月11月3月4月5月6月7月8月9月10月11月3月4月5月6月7月8月9月10月11月建模結(jié)果余額本地被叫通話次數(shù)欠費金額本地被叫次數(shù)波動率通話標志通話時長大于5分鐘標志多次充值標志其他費用本地主叫次數(shù)波動率新業(yè)務費通話次數(shù)月租費ARPU彩鈴訂購標志長途通話次數(shù)漫游通話次數(shù)本地主叫次數(shù) 所有的數(shù)據(jù)經(jīng)過對數(shù)變換和標準化變換,消除不同變量和不同月份對模型的
31、影響 回歸分析方法和參數(shù)設(shè)置同在在網(wǎng)2月新增用戶流失預警模型 模型的結(jié)果為對數(shù)流失風險比的線性擬合表達式 用戶余額、本地被叫通話次數(shù)、欠費金額、本地被叫次數(shù)波動率、通話標志、通話時長大于5分鐘標志變量重要變量重要性模型預警20%的正常用戶,包含61%的下月流失用戶用戶集:09年06月(包括06月)以前入網(wǎng)、08月仍然正常的用戶;模型篩選用戶:通過模型篩選出的用戶集中20%的用戶,其中, 包含了用戶集中61.4%的9月流失用戶; 模型篩選用戶9月、10月和11月的流失率(模型準確率)分別為26.7%、36%和43%,比用戶集中用戶的流失率(不使用模型篩選的準確率)提升度分別為3.4、2.7和2.3倍。61.4%* 提升度=模型篩選用戶流失率/用戶集中用戶流失率在網(wǎng)1月新增用戶流失預警模型在網(wǎng)1月新增用戶沒有月數(shù)據(jù),只有日數(shù)據(jù),由于系統(tǒng)只保留最近3月的日數(shù)據(jù),9月的日數(shù)據(jù)不完整,11月的新增用戶不能判定用戶流失,只能取10月新增用戶的日數(shù)據(jù)為建模數(shù)據(jù)集 用戶的樣本量小,考慮到?jīng)Q策樹算法如使用交叉驗證,能一定程度上彌補樣本量小的不足,采用決策樹算法作為預警建模算法建模時間窗口建模變量 基本情況語音通話情況數(shù)據(jù)業(yè)務使用情況品牌ARPU余額套餐名稱日均數(shù)據(jù)時間段日數(shù)據(jù)/變化趨勢數(shù)據(jù)日均數(shù)據(jù)時間段變化趨勢數(shù)據(jù)本地通話次數(shù)長途通話次數(shù)漫游通話次數(shù)本地通話次數(shù)波動率長途通話次數(shù)波動率漫游
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專題03 軸對稱(6大基礎(chǔ)題+4大提升題)(原卷版)-2024-2025學年八年級數(shù)學上學期期中真題分類匯編
- 影視公司工程攪拌車租賃協(xié)議
- 體育運動員公租房申請承諾書
- 服裝采購招投標評分
- 酒店行李車司機薪酬政策
- 增強現(xiàn)實水暖施工合同
- 醫(yī)院專用電梯施工合同
- 上市公司高管聘用合同樣本
- 環(huán)境監(jiān)測套筒連接施工合同
- 農(nóng)村集體土地使用權(quán)收回合同
- 2011年中招英語質(zhì)量分析會
- 合規(guī)與監(jiān)管部門魚骨圖KPI設(shè)計
- (細節(jié)版)道路維修工程計劃
- 《網(wǎng)絡(luò)組建與維護》課件
- 游戲開發(fā)職業(yè)生涯規(guī)劃
- YY 0128-2023 醫(yī)用診斷X射線輻射防護器具裝置及用具
- 江蘇省蘇州市2023-2024學年九年級上學期1月期末道德與法治試題
- 安全信息與事件管理(SIEM)
- 數(shù)據(jù)結(jié)構(gòu)課程思政課程設(shè)計
- 健身房轉(zhuǎn)讓合同
- 2022年天津市專技人員繼續(xù)教育公需課答案
評論
0/150
提交評論