四川經(jīng)分應用模型準沉默客戶識別模型設計說明書_第1頁
四川經(jīng)分應用模型準沉默客戶識別模型設計說明書_第2頁
四川經(jīng)分應用模型準沉默客戶識別模型設計說明書_第3頁
四川經(jīng)分應用模型準沉默客戶識別模型設計說明書_第4頁
四川經(jīng)分應用模型準沉默客戶識別模型設計說明書_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、四川移動準沉默客戶識別模型分析設計說明書版本號 1.0項目名稱四川移動準沉默客戶模型建設文檔名稱四川移動準沉默客戶模型分析設計說明書版本號1.0發(fā)布日期2010.6文檔變更記錄版本修改章節(jié)修改類型日期修改人備注目 錄1.模型概述12.業(yè)務理解與目標定義12.1 模型定義12.2 目標定義13.數(shù)據(jù)準備與數(shù)據(jù)探索23.1 數(shù)據(jù)準備23.2 數(shù)據(jù)探索74.模型構(gòu)建84.1 建模工具84.2 建模流程85.模型評估95.1 模型評估95.2結(jié)果解釋106.模型部署12附錄121. 模型概述沉默客戶的存在,不僅造成了資源的大量浪費,也為市場運營及營銷工作帶來了困難,同時,也造成了離網(wǎng)用戶的大量增加和挽

2、留難度的大幅提升。準沉默客戶識別模型的目標在于為營銷工作提供決策參考,協(xié)助需求部門有效的進行營銷前移,通過沉默客戶預判工作,在客戶接觸點尚未消失前進行針對性的營銷及挽留相關工作,保證其資源利用和效率提升,進一步深入進行市場精細化運營。由于最后一次通話狀態(tài)和用戶在網(wǎng)時長在用戶沉默原因上的差異性較明顯,如最后一次通話為漫游狀態(tài)的用戶一般認為是自然流失客戶,如網(wǎng)3個月以內(nèi)的號碼穩(wěn)定性一般較差,受渠道、sp廠商的影響也較大。因此,在進行模型建設的具體工作的之前,結(jié)合業(yè)務經(jīng)驗及具體數(shù)據(jù)分析,為使模型結(jié)果更能夠符合實際使用需要,將準沉默客戶細分成三類:最后一次通話為漫游的客戶、最后一次通話非漫游且在網(wǎng)時長

3、3個月以內(nèi)的客戶和最后一次通話非漫游且在網(wǎng)時長3個月以上的客戶,針對每一類客戶均建立了預測模型。2. 業(yè)務理解與目標定義2.1 模型定義沉默客戶定義:指上月上網(wǎng)本月未上網(wǎng)的客戶上網(wǎng)客戶定義:當月產(chǎn)生語音、短信、gprs等話單的客戶凈增客戶定義:當月上網(wǎng)客戶數(shù)減去上月上網(wǎng)客戶數(shù)2.2 目標定義建立準沉默客戶識別預測模型并且產(chǎn)生最可能的目標客戶的名單,結(jié)合每個客戶的價值評分,用0到1之間的值來量化目標客戶的可能性大小。3. 數(shù)據(jù)準備與數(shù)據(jù)探索3.1 數(shù)據(jù)準備基礎變量表:數(shù)據(jù)類型解釋id_no_1bigint用戶編碼phone_no_1varchar(20)手機號碼run_namevarchar(3

4、2)截止提數(shù)日用戶狀態(tài)run_codeoldcharacter(10)截止提數(shù)日用戶狀態(tài)編碼group_idvarchar(32)入網(wǎng)渠道編碼group_namevarchar(300)入網(wǎng)渠道名稱area_namevarchar(32)歸屬地市county_namevarchar(64)歸屬區(qū)縣open_timevarchar(20)入網(wǎng)時間sm_codecharacter(10)資費代碼brand_namevarchar(100)品牌名稱mode_namecharacter(100)資費名稱vipflagintegervip客戶標記vip_classvarchar(10)vip客戶等級gr

5、pflaginteger歸屬集團編碼grp_namevarchar(300)歸屬集團名稱highflaginteger中高端客戶標記allduration05integer總通話時長allcalltimes05integer總通話次數(shù)allduration04integer上月通話時長allcalltimes04integer上月總通話次數(shù)allduration03integer上上月通話時長allcalltimes03integer上上月總通話次數(shù)bdduration05integer本地通話時長bdcalltimes05integer本地通話次數(shù)bdduration04integer上月本

6、地通話時長bdcalltimes04integer上月本地通話次數(shù)bdduration03integer上上月本地通話時長bdcalltimes03integer上上月本地通話次數(shù)ctduration05integer長途通話時長ctcalltimes05integer長途通話次數(shù)ctduration04integer上月長途通話時長ctcalltimes04integer上月長途通話次數(shù)ctduration03integer上上月長途通話時長ctcalltimes03integer上上月長途通話次數(shù)myduration05integer漫游通話時長mycalltimes05integer漫游

7、通話次數(shù)myduration04integer上月漫游通話時長mycalltimes04integer上月漫游通話次數(shù)myduration03integer上上月漫游通話時長mycalltimes03integer上上月漫游通話次數(shù)zjduration05integer主叫通話時長zjcalltimes05integer主叫通話次數(shù)zjduration04integer上月主叫通話時長zjcalltimes04integer上月主叫通話次數(shù)zjduration03integer上上月主叫通話時長zjcalltimes03integer上上月主叫通話次數(shù)bjduration05integer被叫

8、通話時長bjcalltimes05integer被叫通話次數(shù)bjduration04integer上月被叫通話時長bjcalltimes04integer上月被叫通話次數(shù)bjduration03integer上上月被叫通話時長bjcalltimes03integer上上月被叫通話次數(shù)ltduration05integer與聯(lián)通通話時長ltcalltimes05integer與聯(lián)通通話次數(shù)ltduration04integer上月與聯(lián)通通話時長ltcalltimes04integer上月與聯(lián)通通話次數(shù)ltduration03integer上上月與聯(lián)通通話時長ltcalltimes03intege

9、r上上月與聯(lián)通通話次數(shù)dxduration05integer與電信通話時長dxcalltimes05integer與電信話次數(shù)dxduration04integer上月與電信通話時長dxcalltimes04integer上月與電信通話次數(shù)dxduration03integer上上月與電信通話時長dxcalltimes03integer上上月與電信通話次數(shù)ddusrs05integer通話對端用戶數(shù)ddusrs04integer上月通話對端用戶數(shù)ddusrs03integer上上月通話對端用戶數(shù)ydddusrs05integer移動通話對端用戶數(shù)ydddusrs04integer上月移動通話對

10、端用戶數(shù)ydddusrs03integer上上月移動通話對端用戶數(shù)ltddusrs05integer聯(lián)通通話對端用戶數(shù)ltddusrs04integer上月聯(lián)通通話對端用戶數(shù)ltddusrs03integer上上月聯(lián)通通話對端用戶數(shù)dxddusrs05integer電信通話對端用戶數(shù)dxddusrs04integer上月電信通話對端用戶數(shù)dxddusrs03integer上上月電信通話對端用戶數(shù)bd1008605integer撥打10086次數(shù)bd1008604integer上月?lián)艽?0086次數(shù)bd1008603integer上上月?lián)艽?0086次數(shù)bd1000005integer撥打100

11、00次數(shù)bd1000004integer上月?lián)艽?0000次數(shù)bd1000003integer上上月?lián)艽?0000次數(shù)bd1001005integer撥打10010次數(shù)bd1001004integer上月?lián)艽?0010次數(shù)bd1001003integer上上月?lián)艽?0010次數(shù)hzcalltimes05integer呼轉(zhuǎn)次數(shù)hzcalltimes04integer上月呼轉(zhuǎn)次數(shù)hzcalltimes03integer上上月呼轉(zhuǎn)次數(shù)ydhzcalltimes05integer呼轉(zhuǎn)移動次數(shù)ydhzcalltimes04integer上月呼轉(zhuǎn)移動次數(shù)ydhzcalltimes03integer上上月呼

12、轉(zhuǎn)移動次數(shù)lthzcalltimes05integer呼轉(zhuǎn)聯(lián)通次數(shù)lthzcalltimes04integer上月呼轉(zhuǎn)聯(lián)通次數(shù)lthzcalltimes03integer上上月呼轉(zhuǎn)聯(lián)通次數(shù)dxhzcalltimes05integer呼轉(zhuǎn)電信次數(shù)dxhzcalltimes04integer上月呼轉(zhuǎn)電信次數(shù)dxhzcalltimes03integer上上月呼轉(zhuǎn)電信次數(shù)smsfs05integer點對點短信發(fā)送量smsfs04integer上月點對點短信發(fā)送量smsfs03integer上上月點對點短信發(fā)送量lastromainteger最后通話為漫游標記gprsflow05decimal(16,4

13、)gprs流量gprsflow04decimal(16,4)上月gprs流量gprsflow03decimal(16,4)上上月gprs流量id_nobigint用戶編碼prepay_feedecimal(16,4)截止取數(shù)日話費余額arpudecimal(16,4)arpumonth_feedecimal(16,4)月租費pay_countbigint充值次數(shù)pay_montydecimal(16,4)充值金額lprepay_feedecimal(16,4)上月月底話費余額larpudecimal(16,4)上月arpulmonth_feedecimal(16,4)上月月租費lpay_cou

14、ntbigint上月充值次數(shù)lpay_montydecimal(16,4)上月充值金額llprepay_feedecimal(16,4)上上月月底話費余額llarpudecimal(16,4)上上月arpullmonth_feedecimal(16,4)上上月月租費llpay_countbigint上上月充值次數(shù)llpay_montydecimal(16,4)上上月充值金額cunfei_flagvarchar(2)是否參與存送捆綁標記innet_timevarchar(20)存送捆綁到期時間family_flagvarchar(2)合家歡客戶標記changtu_flagvarchar(2)長途

15、風暴客戶標記yang_flagvarchar(2)疑似渠道養(yǎng)卡標記shoujibao_flagvarchar(2)手機報客戶標記feixin_flagvarchar(2)飛信客戶標記toushu_flagvarchar(2)投訴客戶標記toushu_numsbigint投訴次數(shù)shuxin_feedecimal(16,4)數(shù)信業(yè)務費用chengshi_flagvarchar(10)城市農(nóng)村客戶標記zhongduan_flagdecimal(16,4)是否參與終端捆綁標記zd_begin_timevarchar(10)參與終端捆綁時間zd_end_timevarchar(10)終端捆綁到期時間t

16、erm_bind_namevarchar(200)參與終端捆綁活動名稱save_bind_namevarchar(200)存送捆綁活動名稱account_typevarchar(32)賬戶類型innet_feedecimal(16,4)開戶繳費金額生成衍生變量表:字段名數(shù)據(jù)類型解釋id_nobigint用戶編碼phone_no_1varchar(20)手機號碼channel_namevarchar(300)入網(wǎng)渠道brand_namevarchar(100)品牌mode_namecharacter(100)資費open_timevarchar(20)開戶時間net_ageinteger網(wǎng)齡ru

17、n_namevarchar(32)截止取數(shù)日期用戶狀態(tài)family_flagvarchar(2)合家歡客戶標記changtu_flagvarchar(2)長途風暴客戶標記lastcall_roaminteger最后一次通話為漫游標記chengshi_flagvarchar(10)城市農(nóng)村客戶標記toushu_numsbigint投訴次數(shù)shoujibao_flagvarchar(2)手機報用戶標記fetion_flagvarchar(2)飛信用戶標記vipflagintegervip客戶標記highflaginteger中高端客戶標記grpflaginteger集團客戶標記grp_nameva

18、rchar(300)歸屬集團名稱cunfeiinteger是否參與存送捆綁活動標記zhongduaninteger是否參與終端捆綁活動標記kunbang_lefttimeinteger捆綁剩余周期shuxin_ratio_08decimal(31,14)數(shù)信業(yè)務費用占比=數(shù)信業(yè)務費用/arpumonthfee_ratio_08decimal(31,14)月租費用占比=月租/arpuleft_feedecimal(19,4)話費余額pay_countbigint充值次數(shù)pay_moneydecimal(16,4)充值金額arpu_avgdecimal(31,18)近三月arpu平均值mou_av

19、ginteger近三月mou平均值bd_dura_avginteger近三月本地通話時長平均值ct_dura_avginteger近三月長途通話時長平均值my_dura_avginteger近三月漫游通話時長平均值lt_dura_avginteger近三月與聯(lián)通通話時長平均值dx_dura_avginteger近三月與電信通話時長平均值dd_nmb_avginteger近三月通話對端數(shù)量平均值lt_nmb_avginteger近三月聯(lián)通通話對端數(shù)量平均值dx_nmb_avginteger近三月電信通話對端數(shù)量平均值bd1008605integer撥打10086次數(shù)bd1000005intege

20、r撥打10000次數(shù)bd1001005integer撥打10010次數(shù)hzcalltimes05integer呼轉(zhuǎn)次數(shù)ydhzcalltimes05integer呼轉(zhuǎn)移動次數(shù)lthzcalltimes05integer呼轉(zhuǎn)聯(lián)通次數(shù)dxhzcalltimes05integer呼轉(zhuǎn)電信次數(shù)sms_fasong_avginteger點對點短信發(fā)送量gprs_mount_avgdecimal(31,18)gprs流量bd_dura_ratiodecimal(31,19)近三月本地通話時長占比ct_dura_ratiodecimal(31,19)近三月長途通話時長占比my_dura_ratiodecim

21、al(31,19)近三月漫游通話時長占比dd_yddecimal(31,19)近三月移動通話對端占比dd_ltdecimal(31,19)近三月聯(lián)通通話對端占比dd_dxdecimal(31,19)近三月電信通話對端占比arpu_stddouble近三月arpu波動值mou_stddouble近三月mou波動值bd_dura_stddouble近三月本地通話時長波動值ct_dura_stddouble近三月長途通話時長波動值my_dura_stddouble近三月漫游通話時長波動值lt_dura_stddouble近三月聯(lián)通通話時長波動值dx_dura_stddouble近三月電信通話時長波動

22、值huzhuan_stddouble近三月呼轉(zhuǎn)通話次數(shù)波動值ydhuzhuan_stddouble近三月呼轉(zhuǎn)移動通話次數(shù)波動值lthuzhuan_stddouble近三月呼轉(zhuǎn)聯(lián)通通話次數(shù)波動值dxhuzhuan_stddouble近三月呼轉(zhuǎn)電信通話次數(shù)波動值sms_fasong_stddouble近三月點對點短信發(fā)送量波動值gprs_mount_stddouble近三月gprs流量波動值3.2 數(shù)據(jù)探索利用spss的clementine軟件對建模字段進行數(shù)據(jù)審核和探索。toushu_nums(投訴次數(shù))、vipflag(vip標識)等字段經(jīng)審核無法用于建立模型,需剔除4. 模型構(gòu)建4.1 建模

23、工具經(jīng)過數(shù)據(jù)預處理、探索型數(shù)據(jù)分析, 最終確定了準沉默客戶預測分析模型的變量,采用spss公司的clementine軟件的決策樹結(jié)點作為數(shù)據(jù)挖掘工具及數(shù)據(jù)挖掘技術(shù)來建立準沉默客戶識別模型。4.2 建模流程為使模型盡量精確,針對每一個地市均單獨進行識別模型的建設工作。以宜賓分公司為例,建模流程如下:5. 模型評估5.1 模型評估用模型增益和測試集查全查準率進行模型評估工作。以最后一次通話非漫游且在網(wǎng)時長3個月以上的客戶識別模型為例。1、增益評估增益圖是不同閥值下命中率(pv+,正確預測到的正例數(shù)占預測正例總數(shù)的比例)與預測成正例的比例(depth)的軌跡。隨著閾值的減小,更多的客戶就會被歸為正例,也就是depth變大,這樣pv+就相應減小。一個好的模型,在閾值變大時,相應的pv+就要變大,曲線足夠陡峭。如下圖所示,在閥值設定為20%的時候,曲線足夠陡峭,模型效果較好,使用模型之后效果提升了約4.2倍。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論