四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識別模型設(shè)計說明書_第1頁
四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識別模型設(shè)計說明書_第2頁
四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識別模型設(shè)計說明書_第3頁
四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識別模型設(shè)計說明書_第4頁
四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識別模型設(shè)計說明書_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

四川 移動 準(zhǔn) 沉默客戶識別 模型 分析設(shè)計說明書 版本號 1.0 2 項目名稱 四川移動 準(zhǔn) 沉默客戶 模型建設(shè) 文檔名稱 四川移動 準(zhǔn) 沉默客戶 模型分析設(shè)計說明書 版本號 1.0 發(fā)布日期 2010.6 文檔變更記錄 版本 修改章節(jié) 修改類型 日期 修改人 備注 目 錄 1. 模型概述 . 1 2. 業(yè)務(wù)理解與目標(biāo)定義 . 1 2.1 模型定義 . 1 2.2 目標(biāo)定義 . 1 3. 數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)探索 . 2 3.1 數(shù)據(jù)準(zhǔn)備 . 2 3.2 數(shù)據(jù)探索 . 7 4. 模型構(gòu)建 . 8 4.1 建模工具 . 8 4.2 建模流程 . 8 5. 模型評估 . 9 5.1 模型評估 . 9 5.2 結(jié)果解釋 . 10 6. 模型部署 . 14 附錄 . 14 本文件屬保密資料 1 1. 模型 概述 沉默客戶的存在,不僅造成了資源的大量浪費(fèi),也為市場運(yùn)營及營銷工作帶來了困難,同時,也造成了離網(wǎng)用戶的大量增加和挽留難度的大幅提升。 準(zhǔn) 沉默客戶識別 模型的目標(biāo) 在于為 營銷 工作 提供決策參考 , 協(xié)助需求部門 有效的進(jìn)行營銷前移,通過沉默客戶預(yù)判工作,在客戶接觸點(diǎn)尚未消失前進(jìn)行 針對性的 營銷及挽留 相關(guān)工作 , 保證其資源利用和效率提升,進(jìn)一步深入進(jìn)行市場精細(xì)化 運(yùn)營 。 由于最后一次通話狀態(tài)和用戶在網(wǎng)時長在用戶沉默原因上的差異 性較明顯,如最后一次通話為漫游狀態(tài)的用戶一般認(rèn)為是自然流失客戶,如網(wǎng) 3 個月以內(nèi)的號碼穩(wěn)定性一般較差,受渠道、 SP 廠商的影響也較大。因此, 在進(jìn)行模型建設(shè)的具體工作的之前,結(jié)合業(yè)務(wù)經(jīng)驗及具體數(shù)據(jù)分析,為使模型結(jié)果更能夠符合實際使用需要,將 準(zhǔn) 沉默客戶細(xì)分成三類:最后一次通話為漫游的客戶、最后一次通話非漫游且在網(wǎng)時長 3個月以內(nèi)的客戶和最后一次通話非漫游且在網(wǎng)時長 3 個月以上的客戶,針對每一類客戶均建立了預(yù)測模型。 2. 業(yè)務(wù) 理解與 目標(biāo) 定義 2.1 模型定義 沉默客戶 定義: 指上月上網(wǎng)本月未上網(wǎng) 的客戶 上網(wǎng)客戶定義:當(dāng)月產(chǎn)生語 音、短信、 GPRS 等話單的客戶 凈增客戶定義:當(dāng)月上網(wǎng)客戶數(shù)減去上月上網(wǎng)客戶數(shù) 2.2 目標(biāo)定義 建立 準(zhǔn) 沉默客戶 識別 預(yù)測模型并且產(chǎn)生最可能的 目標(biāo)客戶 的名單,結(jié)合每個客戶的價值評分 ,用 0 到 1 之間的值來量化 目標(biāo) 客戶的可能性大小。 本文件屬保密資料 2 3. 數(shù)據(jù) 準(zhǔn)備 與數(shù)據(jù)探索 3.1 數(shù)據(jù)準(zhǔn)備 基礎(chǔ)變量表: 字段名 數(shù)據(jù)類型 解釋 ID_NO_1 BIGINT 用戶編碼 PHONE_NO_1 VARCHAR(20) 手機(jī)號碼 RUN_NAME VARCHAR(32) 截止提數(shù)日用戶狀態(tài) RUN_CODEOLD CHARACTER(10) 截止提數(shù)日用戶狀態(tài)編碼 GROUP_ID VARCHAR(32) 入網(wǎng)渠道編碼 GROUP_NAME VARCHAR(300) 入網(wǎng)渠道名稱 AREA_NAME VARCHAR(32) 歸屬地市 COUNTY_NAME VARCHAR(64) 歸屬區(qū)縣 OPEN_TIME VARCHAR(20) 入網(wǎng)時間 SM_CODE CHARACTER(10) 資費(fèi)代碼 BRAND_NAME VARCHAR(100) 品牌名稱 MODE_NAME CHARACTER(100) 資費(fèi)名稱 VIPFLAG INTEGER vip 客戶標(biāo)記 VIP_CLASS VARCHAR(10) vip 客戶等級 GRPFLAG INTEGER 歸屬集團(tuán)編碼 GRP_NAME VARCHAR(300) 歸屬集團(tuán)名稱 HIGHFLAG INTEGER 中高端客戶標(biāo)記 ALLDURATION05 INTEGER 總通話時長 ALLCALLTIMES05 INTEGER 總通話次數(shù) ALLDURATION04 INTEGER 上月通話時長 ALLCALLTIMES04 INTEGER 上月總通話次數(shù) ALLDURATION03 INTEGER 上上月通話時長 ALLCALLTIMES03 INTEGER 上上月總通話次數(shù) BDDURATION05 INTEGER 本地通話時長 BDCALLTIMES05 INTEGER 本地通話次數(shù) BDDURATION04 INTEGER 上月本地通話時長 BDCALLTIMES04 INTEGER 上月本地通話次數(shù) BDDURATION03 INTEGER 上上月本地通話時長 BDCALLTIMES03 INTEGER 上上月本地通話次數(shù) CTDURATION05 INTEGER 長途通話時長 CTCALLTIMES05 INTEGER 長途通話次數(shù) 本文件屬保密資料 3 CTDURATION04 INTEGER 上月長途通話時長 CTCALLTIMES04 INTEGER 上月長途通話次數(shù) CTDURATION03 INTEGER 上上月長途通話時長 CTCALLTIMES03 INTEGER 上上月長途通話次數(shù) MYDURATION05 INTEGER 漫游通話時長 MYCALLTIMES05 INTEGER 漫游通話次數(shù) MYDURATION04 INTEGER 上月漫游通話時長 MYCALLTIMES04 INTEGER 上月漫游通話次數(shù) MYDURATION03 INTEGER 上上月漫游通話時長 MYCALLTIMES03 INTEGER 上上月漫游通話次數(shù) ZJDURATION05 INTEGER 主叫通話時長 ZJCALLTIMES05 INTEGER 主叫通話次數(shù) ZJDURATION04 INTEGER 上月主叫通話時長 ZJCALLTIMES04 INTEGER 上月主叫通話次數(shù) ZJDURATION03 INTEGER 上上 月主叫通話時長 ZJCALLTIMES03 INTEGER 上上月主叫通話次數(shù) BJDURATION05 INTEGER 被叫通話時長 BJCALLTIMES05 INTEGER 被叫通話次數(shù) BJDURATION04 INTEGER 上月被叫通話時長 BJCALLTIMES04 INTEGER 上月被叫通話次數(shù) BJDURATION03 INTEGER 上上月被叫通話時長 BJCALLTIMES03 INTEGER 上上月被叫通話次數(shù) LTDURATION05 INTEGER 與聯(lián)通通話時 長 LTCALLTIMES05 INTEGER 與聯(lián)通通話次數(shù) LTDURATION04 INTEGER 上月與聯(lián)通通話時長 LTCALLTIMES04 INTEGER 上月與聯(lián)通通話次數(shù) LTDURATION03 INTEGER 上上月與聯(lián)通通話時長 LTCALLTIMES03 INTEGER 上上月與聯(lián)通通話次數(shù) DXDURATION05 INTEGER 與電信通話時長 DXCALLTIMES05 INTEGER 與電信話次數(shù) DXDURATION04 INTEGER 上月與電信通話時長 DXCALLTIMES04 INTEGER 上月與電信通話次數(shù) DXDURATION03 INTEGER 上上月與電信通話時長 DXCALLTIMES03 INTEGER 上上月與電信通話次數(shù) DDUSRS05 INTEGER 通話對端用戶數(shù) DDUSRS04 INTEGER 上月通話對端用戶數(shù) DDUSRS03 INTEGER 上上月通話對端用戶數(shù) YDDDUSRS05 INTEGER 移動通話對端用戶數(shù) 本文件屬保密資料 4 YDDDUSRS04 INTEGER 上月移動通話對端用戶數(shù) YDDDUSRS03 INTEGER 上上月移動通話對端用戶數(shù) LTDDUSRS05 INTEGER 聯(lián)通通話對端用戶數(shù) LTDDUSRS04 INTEGER 上月聯(lián)通通話對端用戶數(shù) LTDDUSRS03 INTEGER 上上月聯(lián)通通話對端用戶數(shù) DXDDUSRS05 INTEGER 電信通話對端用戶數(shù) DXDDUSRS04 INTEGER 上月電信通話對端用戶數(shù) DXDDUSRS03 INTEGER 上上月電信通話對端用戶數(shù) BD1008605 INTEGER 撥打 10086 次數(shù) BD1008604 INTEGER 上月?lián)艽?10086 次數(shù) BD1008603 INTEGER 上上月?lián)艽?10086 次數(shù) BD1000005 INTEGER 撥打 10000 次數(shù) BD1000004 INTEGER 上月?lián)艽?10000 次數(shù) BD1000003 INTEGER 上上月?lián)艽?10000 次數(shù) BD1001005 INTEGER 撥打 10010 次數(shù) BD1001004 INTEGER 上月?lián)艽?10010 次數(shù) BD1001003 INTEGER 上上月?lián)艽?10010 次數(shù) HZCALLTIMES05 INTEGER 呼轉(zhuǎn)次數(shù) HZCALLTIMES04 INTEGER 上月呼轉(zhuǎn)次數(shù) HZCALLTIMES03 INTEGER 上上月呼轉(zhuǎn)次數(shù) YDHZCALLTIMES05 INTEGER 呼轉(zhuǎn)移動次數(shù) YDHZCALLTIMES04 INTEGER 上月呼轉(zhuǎn)移動次數(shù) YDHZCALLTIMES03 INTEGER 上上月呼轉(zhuǎn)移動次數(shù) LTHZCALLTIMES05 INTEGER 呼轉(zhuǎn)聯(lián)通次數(shù) LTHZCALLTIMES04 INTEGER 上月呼轉(zhuǎn)聯(lián)通次數(shù) LTHZCALLTIMES03 INTEGER 上上月呼轉(zhuǎn)聯(lián)通次數(shù) DXHZCALLTIMES05 INTEGER 呼轉(zhuǎn)電信次數(shù) DXHZCALLTIMES04 INTEGER 上月呼轉(zhuǎn)電信次數(shù) DXHZCALLTIMES03 INTEGER 上上月呼轉(zhuǎn)電信次數(shù) SMSFS05 INTEGER 點(diǎn)對點(diǎn)短信發(fā)送量 SMSFS04 INTEGER 上月點(diǎn)對點(diǎn)短信發(fā)送量 SMSFS03 INTEGER 上上月點(diǎn)對點(diǎn)短信發(fā)送量 LASTROMA INTEGER 最后通話為漫游標(biāo)記 GPRSFLOW05 DECIMAL(16,4) GPRS 流量 GPRSFLOW04 DECIMAL(16,4) 上月 GPRS 流量 GPRSFLOW03 DECIMAL(16,4) 上上月 GPRS 流量 ID_NO BIGINT 用戶編碼 PREPAY_FEE DECIMAL(16,4) 截止取數(shù)日話費(fèi)余額 本文件屬保密資料 5 ARPU DECIMAL(16,4) ARPU MONTH_FEE DECIMAL(16,4) 月租費(fèi) PAY_COUNT BIGINT 充值次數(shù) PAY_MONTY DECIMAL(16,4) 充值金額 LPREPAY_FEE DECIMAL(16,4) 上月月底話費(fèi)余額 LARPU DECIMAL(16,4) 上月 ARPU LMONTH_FEE DECIMAL(16,4) 上月月租費(fèi) LPAY_COUNT BIGINT 上月充值次數(shù) LPAY_MONTY DECIMAL(16,4) 上月充值金額 LLPREPAY_FEE DECIMAL(16,4) 上上月月底話費(fèi)余額 LLARPU DECIMAL(16,4) 上上月 ARPU LLMONTH_FEE DECIMAL(16,4) 上上月月租費(fèi) LLPAY_COUNT BIGINT 上 上月充值次數(shù) LLPAY_MONTY DECIMAL(16,4) 上上月充值金額 CUNFEI_FLAG VARCHAR(2) 是否參與存送捆綁標(biāo)記 INNET_TIME VARCHAR(20) 存送捆綁到期時間 FAMILY_FLAG VARCHAR(2) 合家歡客戶標(biāo)記 CHANGTU_FLAG VARCHAR(2) 長途風(fēng)暴客戶標(biāo)記 YANG_FLAG VARCHAR(2) 疑似渠道養(yǎng)卡標(biāo)記 SHOUJIBAO_FLAG VARCHAR(2) 手機(jī)報客戶標(biāo)記 FEIXIN_FLAG VARCHAR(2) 飛信客戶標(biāo)記 TOUSHU_FLAG VARCHAR(2) 投訴客戶標(biāo)記 TOUSHU_NUMS BIGINT 投訴次數(shù) SHUXIN_FEE DECIMAL(16,4) 數(shù)信業(yè)務(wù)費(fèi)用 CHENGSHI_FLAG VARCHAR(10) 城市農(nóng)村客戶標(biāo)記 ZHONGDUAN_FLAG DECIMAL(16,4) 是否參與終端捆綁標(biāo)記 ZD_BEGIN_TIME VARCHAR(10) 參與終端捆綁時間 ZD_END_TIME VARCHAR(10) 終端捆綁到期時間 TERM_BIND_NAME VARCHAR(200) 參與終端捆綁活動名稱 SAVE_BIND_NAME VARCHAR(200) 存送捆綁活動名稱 ACCOUNT_TYPE VARCHAR(32) 賬戶類型 INNET_FEE DECIMAL(16,4) 開戶繳費(fèi)金額 生成衍生變量表: 字段名 數(shù)據(jù)類型 解釋 ID_NO BIGINT 用戶編碼 PHONE_NO_1 VARCHAR(20) 手機(jī)號碼 CHANNEL_NAME VARCHAR(300) 入網(wǎng)渠道 BRAND_NAME VARCHAR(100) 品牌 本文件屬保密資料 6 MODE_NAME CHARACTER(100) 資費(fèi) OPEN_TIME VARCHAR(20) 開戶時間 NET_AGE INTEGER 網(wǎng)齡 RUN_NAME VARCHAR(32) 截止取數(shù)日期用戶狀態(tài) FAMILY_FLAG VARCHAR(2) 合家歡客戶標(biāo)記 CHANGTU_FLAG VARCHAR(2) 長途風(fēng)暴客戶標(biāo)記 LASTCALL_ROAM INTEGER 最后一次通話為漫游標(biāo)記 CHENGSHI_FLAG VARCHAR(10) 城市農(nóng)村客戶 標(biāo)記 TOUSHU_NUMS BIGINT 投訴次數(shù) SHOUJIBAO_FLAG VARCHAR(2) 手機(jī)報用戶標(biāo)記 FETION_FLAG VARCHAR(2) 飛信用戶標(biāo)記 VIPFLAG INTEGER VIP 客戶標(biāo)記 HIGHFLAG INTEGER 中高端客戶標(biāo)記 GRPFLAG INTEGER 集團(tuán)客戶標(biāo)記 GRP_NAME VARCHAR(300) 歸屬集團(tuán)名稱 CUNFEI INTEGER 是否參與存送捆綁活動標(biāo)記 ZHONGDUAN INTEGER 是否參與終端捆綁活 動標(biāo)記 KUNBANG_LEFTTIME INTEGER 捆綁剩余周期 SHUXIN_RATIO_08 DECIMAL(31,14) 數(shù)信業(yè)務(wù)費(fèi)用占比 =數(shù)信業(yè)務(wù)費(fèi)用 /ARPU MONTHFEE_RATIO_08 DECIMAL(31,14) 月租費(fèi)用占比 =月租 /ARPU LEFT_FEE DECIMAL(19,4) 話費(fèi)余額 PAY_COUNT BIGINT 充值次數(shù) PAY_MONEY DECIMAL(16,4) 充值金額 ARPU_AVG DECIMAL(31,18) 近三月 ARPU 平均值 MOU_AVG INTEGER 近三月 MOU 平均值 BD_DURA_AVG INTEGER 近三月本地通話時長平均值 CT_DURA_AVG INTEGER 近三月長途通話時長平均值 MY_DURA_AVG INTEGER 近三月漫游通話時長平均值 LT_DURA_AVG INTEGER 近三月與聯(lián)通通話時長平均值 DX_DURA_AVG INTEGER 近三月與電信通話時長平均值 DD_NMB_AVG INTEGER 近三月通話對端數(shù)量平均值 LT_NMB_AVG INTEGER 近三月 聯(lián)通通話對端數(shù)量平均值 DX_NMB_AVG INTEGER 近三月電信通話對端數(shù)量平均值 BD1008605 INTEGER 撥打 10086 次數(shù) BD1000005 INTEGER 撥打 10000 次數(shù) BD1001005 INTEGER 撥打 10010 次數(shù) HZCALLTIMES05 INTEGER 呼轉(zhuǎn)次數(shù) YDHZCALLTIMES05 INTEGER 呼轉(zhuǎn)移動次數(shù) 本文件屬保密資料 7 LTHZCALLTIMES05 INTEGER 呼轉(zhuǎn)聯(lián)通次數(shù) DXHZCALLTIMES05 INTEGER 呼轉(zhuǎn)電信次 數(shù) SMS_FASONG_AVG INTEGER 點(diǎn)對點(diǎn)短信發(fā)送量 GPRS_MOUNT_AVG DECIMAL(31,18) GPRS 流量 BD_DURA_RATIO DECIMAL(31,19) 近三月本地通話時長占比 CT_DURA_RATIO DECIMAL(31,19) 近三月長途通話時長占比 MY_DURA_RATIO DECIMAL(31,19) 近三月漫游通話時長占比 DD_YD DECIMAL(31,19) 近三月移動通話對端占比 DD_LT DECIMAL(31,19) 近 三月聯(lián)通通話對端占比 DD_DX DECIMAL(31,19) 近三月電信通話對端占比 ARPU_STD DOUBLE 近三月 ARPU 波動值 MOU_STD DOUBLE 近三月 MOU 波動值 BD_DURA_STD DOUBLE 近三月本地通話時長波動值 CT_DURA_STD DOUBLE 近三月長途通話時長波動值 MY_DURA_STD DOUBLE 近三月漫游通話時長波動值 LT_DURA_STD DOUBLE 近三月聯(lián)通通話時長波動值 DX_DURA_STD DOUBLE 近三月電信 通話時長波動值 HUZHUAN_STD DOUBLE 近三月呼轉(zhuǎn)通話次數(shù)波動值 YDHUZHUAN_STD DOUBLE 近三月呼轉(zhuǎn)移動通話次數(shù)波動值 LTHUZHUAN_STD DOUBLE 近三月呼轉(zhuǎn)聯(lián)通通話次數(shù)波動值 DXHUZHUAN_STD DOUBLE 近三月呼轉(zhuǎn)電信通話次數(shù)波動值 SMS_FASONG_STD DOUBLE 近三月點(diǎn)對點(diǎn)短信發(fā)送量波動值 GPRS_MOUNT_STD DOUBLE 近三月 GPRS 流量波動值 3.2 數(shù)據(jù)探索 利用 SPSS 的 Clementine 軟件 對建模字段進(jìn)行數(shù)據(jù)審核和探索。 本文件屬保密資料 8 4. 模型 構(gòu)建 4.1 建模工具 經(jīng)過數(shù)據(jù)預(yù)處理、探索型數(shù)據(jù)分析, 最終確定了 準(zhǔn)沉默 客戶預(yù)測分析模型的變量, 采用 SPSS 公司的 Clementine 軟件 的 決策樹 結(jié)點(diǎn)作為數(shù)據(jù)挖掘工具及數(shù)據(jù)挖掘技術(shù)來建立 準(zhǔn) 沉默客戶 識別 模型。 4.2 建模流程 為使模型盡量精確,針對每一個地市均單獨(dú)進(jìn)行識別模型的建設(shè)工作。以宜賓分公司為例,建模流程如下: TOUSHU_NUMS( 投訴次數(shù) ) 、VIPFLAG( VIP 標(biāo)識)等 字段經(jīng)審核無法用于建立模型,需剔除 本文件屬保密資料 9 選 擇 建 設(shè) 模 型 需 要的 目 標(biāo) 客 戶數(shù) 量 : 約 1 2 1 萬已 知 沉 默 用 戶數(shù) 量 : 約 1 1 萬已 知 非 沉 默 用 戶數(shù) 量 : 約 1 1 0 萬數(shù) 據(jù) 準(zhǔn) 備擬 定 數(shù) 據(jù) 需 求 字 段并 進(jìn) 行 統(tǒng) 計數(shù) 據(jù) 審 核 清 洗通 過 數(shù) 據(jù) 審 核 選 擇 輸 入 字 段字 段 數(shù) 量 : 6 0數(shù) 據(jù) 分 區(qū)將 數(shù) 據(jù) 分 為 用 于 生 成 模 型 的 訓(xùn) 練 區(qū)和 用 于 評 估 模 型 效 果 的 測 試 區(qū)訓(xùn) 練 區(qū)隨 機(jī) 抽 取8 0 %測 試 區(qū)隨 機(jī) 抽 取2 0 %模 型 構(gòu) 建通 過 軟 件 自 帶 的 二 元 分 類 器 對 不 同 算 法 進(jìn) 行 初 步評 估 并 生 成 模 型數(shù) 據(jù) 平 衡使 沉 默 用 戶 與 非 沉 默 用 戶 在 數(shù) 量 上成 1 : 4 左 右 的 比 例模 型 生 成利 用 測 試 區(qū)數(shù) 據(jù) 對 模 型進(jìn) 行 評 估形 成 查 全 查 準(zhǔn) 評 估結(jié) 果數(shù) 據(jù) 輸 入將 準(zhǔn) 備 的 數(shù) 據(jù) 輸 入 建 模 軟 件字 段 數(shù) 量 : 6 6用 戶 編 碼 、 號 碼 、 品 牌 、 入 網(wǎng) 渠 道 、 主 資 費(fèi) 、入 網(wǎng) 時 間 、 在 網(wǎng) 時 長 、 家 庭 用 戶 標(biāo) 識 、 長 途 產(chǎn)品 包 標(biāo) 識 、 最 后 一 次 通 話 漫 游 標(biāo) 識 、 投 訴 次數(shù) 、 月 均 A R P U 及 變 動 值 、 月 均 本 長 漫 費(fèi) 用 及 變動 值 、 月 均 數(shù) 據(jù) 業(yè) 務(wù) 費(fèi) 占 比 、 飛 信 標(biāo) 識 、 交 往圈 人 數(shù) 、 月 均 M O U 、 手 機(jī) 報 標(biāo) 識 等 品 牌 、 在 網(wǎng) 時 長 、 月 均 A R P U 及 變 動 值 、 月 均 本長 漫 費(fèi) 用 及 變 動 值 和 占 比 、 月 均 數(shù) 據(jù) 業(yè) 務(wù) 費(fèi) 及占 比 、 飛 信 標(biāo) 識 、 手 機(jī) 報 標(biāo) 識 、 捆 綁 剩 余 時間 、 呼 轉(zhuǎn) 次 數(shù) 、 呼 轉(zhuǎn) 競 爭 對 手 次 數(shù) 、 月 均 M O U及 變 動 值 等 賬 戶 余 額 較 少 、 月 均 A R P U 低 且 波 動 性 大 、在 網(wǎng) 時 間 短 、 交 往 圈 人 數(shù) 少 、 繳 費(fèi) 次 數(shù) 和金 額 均 較 少 等 特 征 的 用 戶 成 為 沉 默 用 戶 的可 能 性 較 大5. 模型 評 估 5.1 模型評估 用模型增益 和 測試集查全查準(zhǔn)率進(jìn)行模型評估工作。 以最 后一次通話非漫游且在網(wǎng)時長 3 個月以上的客戶識別模型為例。 1、 增益評估 增益圖是不同閥值下命中率( PV+,正確預(yù)測到的正例數(shù)占預(yù)測正例總數(shù)的比例)與預(yù)測成正例的比例( Depth)的軌跡。隨著閾值的減小,更多的客戶就會被歸為正例,也就是 Depth 變大,這樣 PV+就相應(yīng)減小。一個好的模型,在閾值變大時,相應(yīng)的 PV+就要變大,曲線足夠陡峭。 如下圖所示,在閥值設(shè)定為 20%的時候,曲線足夠陡峭,模型效果較好 ,使用模 本文件屬保密資料 10 型之后效果提升了約 4.2 倍。 2、 查全查準(zhǔn)評估 查全率 =模型準(zhǔn)確識別出的 準(zhǔn) 沉默客戶數(shù) /實際總的沉 默用戶數(shù) 查準(zhǔn)率 =模型準(zhǔn)確識別出的 準(zhǔn) 沉默用戶數(shù) /模型識別出的總用戶數(shù) 5.2 結(jié)果解釋 準(zhǔn) 沉默用戶識別 模型的規(guī)則 非常復(fù)雜,適用于 準(zhǔn) 沉默用戶的規(guī)則就達(dá) 658 個,無法在文檔中進(jìn)行詳細(xì)展示,如圖所示(以最后一次通話非漫游且在網(wǎng)時長在 3個月以上的沉默用戶識別模型為例): 因此,僅將決策樹的前四層節(jié)點(diǎn)展示如下: 本文件屬保密資料 11 模型規(guī)則概率如下表所示: 本文件屬保密資料 12 篩選規(guī)則 概率余額/ A R P U 0 .1 1 1 A ND 月均本地通話時長 0 .1 1 1 A ND 月均本地通話時長 0 .1 0 08 7 . 5 %余額/ A R P U 4 4 分鐘 A ND 網(wǎng)齡 = 2 個月A ND 捆綁剩余時間 = 1 個月5 5 . 7 %其規(guī)則 大致可總結(jié)為: 1、賬戶余額很低、且與月均 ARPU 的比例在 0.01 以下的客戶容易產(chǎn)生沉默,有約70%以上的客戶具有此特征 2、 準(zhǔn) 沉默客戶一般為網(wǎng)齡較短的客戶,有約 60%的沉默客戶網(wǎng)齡小于 5 個月 3、 準(zhǔn) 沉默客戶的 MOU 波動性及月均本地通話時長較短的特征也很明顯,一般 MOU波動較大且呈減少趨勢、本地通話時長小于 20 分鐘的客戶有 90%左右的可能性會沉默 4、捆綁剩余時間低于 12 個月的客戶有 60%左右的可能性會沉默,低于 1個月的客戶有超過 80%的可能性會沉默 5、月繳費(fèi)次數(shù)在 2次以上、平均繳費(fèi)金額低于 2元或平均繳費(fèi)金額與 ARPU 的比值在 0.21 以下的客戶有約 60%的可能性會沉默 本文件屬保密資料 13 同時, 在 準(zhǔn) 沉默客戶識別的基礎(chǔ)上進(jìn)行聚類: 分析 并總結(jié) 客戶沉默原因及規(guī)則: 準(zhǔn) 沉默客戶 模型 主要 輸出 三 個字段: 沉默 標(biāo)識( $C-SILENCE_FLAG)和 沉默概率( $CC-SILENCE_FLAG) 、沉默原因( reason) 。 沉默 標(biāo)識可以用來識別用戶是否 疑似沉默客戶 ( 0:否 1:是); 沉默概率 可以用來作為用戶是否 疑似沉默客戶 的概率(介于 0 到 1之間),如一個 客戶 的目標(biāo)標(biāo)識為 1,目標(biāo)可能性為 0.9 的要比 0.7 的更可能成為 沉默客戶 。 如下圖所示: 本文件屬保密資料 14 6. 模型部署 準(zhǔn) 沉默客戶識別 模型的主要成果為提供 各地市分公司當(dāng)月疑似沉默客戶 清單, 營銷策劃 人員可以依據(jù)這份清單進(jìn)行針對性的 疑似沉默客戶挽留及激活 工作。 附錄 模型分析 報告 四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識別模型分析報告.pptx感謝您的使用 “小萍

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論