BI數(shù)據(jù)挖掘交流方案_第1頁
BI數(shù)據(jù)挖掘交流方案_第2頁
BI數(shù)據(jù)挖掘交流方案_第3頁
BI數(shù)據(jù)挖掘交流方案_第4頁
BI數(shù)據(jù)挖掘交流方案_第5頁
已閱讀5頁,還剩97頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

內(nèi)容綱要??BI的相關(guān)背景??數(shù)據(jù)挖掘的基礎(chǔ)知識??數(shù)據(jù)挖掘過程??常用數(shù)據(jù)挖掘方法??常用數(shù)據(jù)挖掘工具1內(nèi)容綱要??BI的相關(guān)背景1BI的相關(guān)背景BI(BusinessIntelligence,商業(yè)智能)是目前全球IT市場中非常熱門的一個話題;其關(guān)鍵推進因素是ERP等系統(tǒng)的相對完善后,形成了海量數(shù)據(jù),如何發(fā)揮這些數(shù)據(jù)的價值其實就是BI所需要解決的問題;BI是數(shù)據(jù)->信息->知識的一個逐步轉(zhuǎn)化過程;BI系統(tǒng)主要由數(shù)據(jù)倉庫-DW(DataWarehouse),聯(lián)機分析處理-OLAP(OnlineAnalyticalProcessing),數(shù)據(jù)挖掘-DM(DataMining)三大部分組成;2BI的相關(guān)背景BI(BusinessIntelligencBI的相關(guān)背景BI系統(tǒng)結(jié)構(gòu)3BI的相關(guān)背景BI系統(tǒng)結(jié)構(gòu)3內(nèi)容綱要??BI的相關(guān)背景??數(shù)據(jù)挖掘的基礎(chǔ)知識??數(shù)據(jù)挖掘過程??常用數(shù)據(jù)挖掘方法??常用數(shù)據(jù)挖掘工具4內(nèi)容綱要??BI的相關(guān)背景4

典型的業(yè)務(wù)問題如何優(yōu)化下一階段的營銷活動?高價值客戶中,誰可能流失?誰貢獻的利潤最多?誰花費的成本最高?客戶都有什么樣的消費特點?5

典型的業(yè)務(wù)問題如何優(yōu)化下一階段的營銷活動?高價值客戶中,誰

數(shù)據(jù)挖掘都可以應(yīng)用到何處?6

數(shù)據(jù)挖掘都可以應(yīng)用到何處?6

何謂數(shù)據(jù)挖掘?數(shù)據(jù)信息決策數(shù)據(jù)挖掘是一個從海量數(shù)據(jù)中抽取前所未知的,可理解的,可操作信息的過程。7

何謂數(shù)據(jù)挖掘?數(shù)據(jù)信息決策數(shù)據(jù)挖掘是一個從海量數(shù)據(jù)中抽取前

數(shù)據(jù)庫與數(shù)據(jù)挖掘發(fā)展歷程8

數(shù)據(jù)庫與數(shù)據(jù)挖掘發(fā)展歷程8

數(shù)據(jù)挖掘是一門交叉學(xué)科數(shù)據(jù)挖掘數(shù)據(jù)庫技術(shù)統(tǒng)計學(xué)其他學(xué)科信息科學(xué)機器學(xué)習(xí)可視化技術(shù)9

數(shù)據(jù)挖掘是一門交叉學(xué)科數(shù)據(jù)挖掘數(shù)據(jù)庫技術(shù)統(tǒng)計學(xué)其他學(xué)科信息內(nèi)容綱要??BI的相關(guān)背景??數(shù)據(jù)挖掘的基礎(chǔ)知識??數(shù)據(jù)挖掘過程??常用數(shù)據(jù)挖掘方法??常用數(shù)據(jù)挖掘工具10內(nèi)容綱要??BI的相關(guān)背景10

數(shù)據(jù)挖掘的過程商業(yè)理解數(shù)據(jù)理解數(shù)據(jù)準備

數(shù)據(jù)挖掘建立模型模型評估模型發(fā)布11

數(shù)據(jù)挖掘的過程商業(yè)理解數(shù)據(jù)理解數(shù)據(jù)準備數(shù)據(jù)建立模型模型評

商業(yè)理解定義商業(yè)目標定義數(shù)據(jù)挖掘目標12

商業(yè)理解定義商業(yè)目標12

數(shù)據(jù)理解需要的數(shù)據(jù)可以獲得的數(shù)據(jù)對可獲得的數(shù)據(jù)進行觀察、分析用直方圖顯示輸入數(shù)據(jù)分布聚類以發(fā)現(xiàn)孤立點在保持數(shù)據(jù)特征的基礎(chǔ)上抽樣過濾不想要的數(shù)據(jù)值映射13

數(shù)據(jù)理解需要的數(shù)據(jù)13

數(shù)據(jù)準備一定要保證數(shù)據(jù)質(zhì)量!14

數(shù)據(jù)準備一定要保證數(shù)據(jù)質(zhì)量!14

建立模型確定抽樣規(guī)則選擇合適的算法調(diào)整算法的參數(shù)15

建立模型確定抽樣規(guī)則15

模型評估使用一組新數(shù)據(jù)評估構(gòu)建好的模型16

模型評估使用一組新數(shù)據(jù)評估構(gòu)建好的模型16

模型發(fā)布制作成自動化處理軟件包,上線使用。17

模型發(fā)布制作成自動化處理軟件包,上線使用。17

數(shù)據(jù)挖掘過程中工作量比例18

數(shù)據(jù)挖掘過程中工作量比例18

數(shù)據(jù)挖掘的過程數(shù)據(jù)倉庫選擇的數(shù)據(jù)選擇轉(zhuǎn)換挖掘理解轉(zhuǎn)換后的數(shù)據(jù)可理解的信息抽取的信息19

數(shù)據(jù)挖掘的過程數(shù)據(jù)倉庫選擇的選擇轉(zhuǎn)換挖掘理解轉(zhuǎn)換后的數(shù)據(jù)可內(nèi)容綱要??BI的相關(guān)背景??數(shù)據(jù)挖掘的基礎(chǔ)知識??數(shù)據(jù)挖掘過程??常用數(shù)據(jù)挖掘方法??常用數(shù)據(jù)挖掘工具20內(nèi)容綱要??BI的相關(guān)背景20

業(yè)務(wù)問題與數(shù)據(jù)挖掘算法間關(guān)系Debt<10%ofIncomeDebt=0%GoodCreditRisksBadCreditRisksGoodCreditRisksYesYesYesNONONOIncome>$40KQQQQII123456factor1factor2factorn神經(jīng)網(wǎng)絡(luò)NeuralNetworks聚類分析ClusteringOpenAccn’tAddNewProductDecreaseUsage???Time序列分析SequenceAnalysis決策樹DecisionTrees

傾向性分析信用特性分析

客戶保留客戶生命周期管理目標市場價格彈性分析

客戶細分市場細分

傾向性分析客戶保留目標市場欺詐檢測關(guān)聯(lián)分析Association

市場組合分析套裝產(chǎn)品分析目錄設(shè)計交叉銷售21

業(yè)務(wù)問題與數(shù)據(jù)挖掘算法間關(guān)系Debt<10%ofInc

數(shù)據(jù)挖掘的類型預(yù)測型數(shù)據(jù)挖掘:使用已知知識構(gòu)建模型,用以預(yù)測未來。描述型數(shù)據(jù)挖掘:尋找數(shù)據(jù)中的模式,使用找到的模式指導(dǎo)決策。22

數(shù)據(jù)挖掘的類型預(yù)測型數(shù)據(jù)挖掘:22

數(shù)據(jù)挖掘技術(shù)(預(yù)測型/描述型)分類結(jié)果將落入哪個類別中?影響預(yù)測結(jié)果的主要因素是什么?值預(yù)測這一事件發(fā)生的可能性是多大?23

數(shù)據(jù)挖掘技術(shù)(預(yù)測型/描述型)23

數(shù)據(jù)挖掘技術(shù)聚類存在哪些邏輯上的群集?關(guān)聯(lián)規(guī)則事件之間存在怎樣的聯(lián)系?序列模式這個事件之后會發(fā)生那些事件?相似時間序列這個結(jié)果是否與以前的一個模式相同?24

數(shù)據(jù)挖掘技術(shù)聚類24

三種主要的數(shù)據(jù)挖掘技術(shù)分類(客戶流失)聚類(客戶細分)關(guān)聯(lián)規(guī)則(購物籃分析)25

三種主要的數(shù)據(jù)挖掘技術(shù)分類聚類關(guān)聯(lián)規(guī)則25

分類分類算法采取行動!26

分類分類算法采取行動!26

決策樹分類訓(xùn)練:基于歷史數(shù)據(jù),創(chuàng)建決策樹27

決策樹分類訓(xùn)練:基于歷史數(shù)據(jù),創(chuàng)建決策樹27

決策樹分類應(yīng)用:基于歷史數(shù)據(jù),創(chuàng)建決策樹28

決策樹分類應(yīng)用:基于歷史數(shù)據(jù),創(chuàng)建決策樹28

決策樹分類的參數(shù)一般數(shù)據(jù)挖掘工具在應(yīng)用決策樹分類算法時,可調(diào)整的參數(shù):輸入變量誤差矩陣(代價矩陣)最大樹深度節(jié)點最大純度節(jié)點最少記錄數(shù)29

決策樹分類的參數(shù)一般數(shù)據(jù)挖掘工具在應(yīng)用決策樹分類算法時,可

神經(jīng)網(wǎng)絡(luò)分類

輸入層(i)隱藏層(j)輸出層(k)

x1x2xiWijWjkOjOk

前饋是指信號先前傳播,輸入->隱層->輸出結(jié)點(神經(jīng)元)30

神經(jīng)網(wǎng)絡(luò)分類結(jié)點(神經(jīng)元)30

BP算法原理網(wǎng)絡(luò)結(jié)構(gòu)的確定輸入層結(jié)構(gòu)由輸入變量(屬性)來定。每個屬性為一個輸入結(jié)點;輸出層結(jié)構(gòu)由輸出結(jié)果來定。有幾個輸出值,就有幾個輸出結(jié)點;隱藏層層數(shù)和結(jié)點數(shù)點的確定:主要靠經(jīng)驗。初始權(quán)值的確定:取決于對問題的了解和先驗知識,那部分作用強,權(quán)值就設(shè)得大些;靠經(jīng)驗。訓(xùn)練過程:一個神經(jīng)元連接權(quán)重調(diào)整的過程。前向傳播階段

輸入層->隱層->輸出層反向傳播階段

計算輸出的結(jié)果和目標結(jié)果的差距

經(jīng)輸出層->隱層->輸入層反推神經(jīng)元連接的權(quán)重調(diào)整對每個輸入樣本重復(fù)上述步驟,直到網(wǎng)絡(luò)收斂為止31

BP算法原理網(wǎng)絡(luò)結(jié)構(gòu)的確定31

聚類低高高高12845376因素二因素三因素一示例32

聚類低高高高12845376因素二因素三因素一示例32

聚類算法演示圖分群神經(jīng)網(wǎng)絡(luò)(Kohonen)33

聚類算法演示圖分群33

關(guān)聯(lián)規(guī)則34

關(guān)聯(lián)規(guī)則34

關(guān)聯(lián)規(guī)則對于規(guī)則A=>B,A=>B的支持度=同時包含A、B的事務(wù)數(shù)÷總事務(wù)數(shù)

A=>B的置信度=(A交B)的支持度÷A的支持度LIFT=(A=>B的置信度)÷B的支持度35

關(guān)聯(lián)規(guī)則對于規(guī)則A=>B,35

序列模式100%購買C產(chǎn)品的顧客在未來的時間里都購買了X產(chǎn)品。36

序列模式100%購買C產(chǎn)品的顧客在未來的時間里都購買了X產(chǎn)

相似序列37

相似序列37

相似序列38

相似序列38

RBF預(yù)測RBF(RadialBasisFunction)神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果是個連續(xù)型變量39

RBF預(yù)測RBF(RadialBasisFuncti

RBF預(yù)測根據(jù)輸出空間,將輸入空間劃分為區(qū)域計算每個區(qū)域的區(qū)域中心40

RBF預(yù)測根據(jù)輸出空間,將輸入空間劃分為區(qū)域計算每個區(qū)域的

RBF預(yù)測計算每個中心的權(quán)重Y=f(x1,x2,x3…)41

RBF預(yù)測計算每個中心的權(quán)重Y=f(x1,x2,x3…)4

RBF預(yù)測第一步:訓(xùn)練第二步:應(yīng)用42

RBF預(yù)測第一步:42內(nèi)容綱要??BI的相關(guān)背景??數(shù)據(jù)挖掘的基礎(chǔ)知識??數(shù)據(jù)挖掘過程??常用數(shù)據(jù)挖掘方法??常用數(shù)據(jù)挖掘工具43內(nèi)容綱要??BI的相關(guān)背景43常用數(shù)據(jù)挖掘工具IntelligentMiner(IBM);Clementine(SPSS);SASEnterpriseMiner(SAS);44常用數(shù)據(jù)挖掘工具IntelligentMiner(IBM新業(yè)務(wù)營銷留住老客戶(提升老客戶活躍度)識別與培養(yǎng)影響力高端根據(jù)客戶本業(yè)務(wù)行為特征及偏好開展針對性營銷,改進客戶體驗①客戶流失預(yù)警及客戶挽留①靠影響力高端帶動②數(shù)據(jù)數(shù)據(jù)數(shù)據(jù)發(fā)展新客戶發(fā)現(xiàn)潛在客戶,進行交叉銷售①靠影響力高端帶動②數(shù)據(jù)數(shù)據(jù)識別影響力高端①根據(jù)影響力高端的需求特點設(shè)計產(chǎn)品①制定能激發(fā)影響力高端積極進行橫向傳播的營銷策略①數(shù)據(jù)數(shù)據(jù)數(shù)據(jù)營銷方式①營銷方式②注釋:電信新業(yè)務(wù)營銷思路新業(yè)務(wù)營銷留住老客戶識別與培養(yǎng)影響力高端根據(jù)客戶本業(yè)務(wù)行為特項目整體操作框架項目整體操作框架基于用戶彩鈴生命周期細分的算法描述數(shù)據(jù)源整合需求用戶細分模型及行為屬性標簽彩鈴營銷管理子平臺建設(shè)需求基于用戶彩鈴生命周期細分的算法描述數(shù)據(jù)源整合需求用戶細分模型彩鈴潛在用戶決策樹模型彩鈴目標用戶(N=20228;L=13.2%)IVR用戶N1:IVR用戶(N=1238;L=35.1%)N6:ARPU<58元(N=10060;L=5%)N5:ARPU>=58元(N=8880;L=19.3%)N2:非IVR用戶(N=18940;L=11.74%)ARPU>=66.5元N3:ARPU>=66.5(N=862;L=44.8%)N4:ARPU<66.5(N=426;L=15.5%)ARPU>=58N8:短信發(fā)送<10條(N=3804;L=14.5%)N7:短信發(fā)送>=10條(N=5076;L=22.9%)短信發(fā)送量>=10N12:ARPU增量<15元(N=2596;L=16.2%)N11:ARPU增量>=15元(N=2479;L=30%)ARPU增量>=15N18:有漫游(N=808;L=11.5%)N17:沒有漫游(N=1788;L=18.3%)漫游業(yè)務(wù)漫游業(yè)務(wù)N16:有漫游(N=821;L=20%)N15:沒有漫游(N=1658;L=34.9%)夢網(wǎng)短信用戶N22:非夢網(wǎng)短信用戶(N=1029;L=31.2%)N21:夢網(wǎng)短信用戶(N=629;L=41%)N23:彩信用戶(N=194;L=26.8%)N24:非彩信用戶(N=627;L=17.9%)彩信用戶新業(yè)務(wù)個數(shù)>=1N25:是(N=1069;L=20.6%)N26:否(N=719;L=14.9%)N13:彩信用戶(N=282;L=24.5%)N14:非彩信用戶(N=3522;L=13.7%)彩信用戶ARPU增量>=15N19:是(N=1555;L=20.6%)N20:否(N=1967;L=8.3%)漫游業(yè)務(wù)N28:有漫游(N=401;L=13.7%)N27:沒有漫游(N=1154;L=23%)動感地帶學(xué)生套餐andARPU>30N10:非學(xué)生套餐(N=9626;L=4.7%)N9:學(xué)生套餐(N=434;L=13%)數(shù)據(jù)源整合需求用戶細分模型及行為屬性標簽彩鈴營銷管理子平臺建設(shè)需求彩鈴潛在用戶決策樹模型彩鈴目標用戶IVR用戶N1:IVR用戶改造平臺,從用戶出發(fā)重新規(guī)劃彩鈴鈴音內(nèi)容屬性分析個人鈴音庫中鈴音內(nèi)容屬性特點抽提出用戶鈴音內(nèi)容偏好依據(jù)用戶鈴音內(nèi)容偏好進行針對性營銷對應(yīng)歸類打標數(shù)據(jù)匯總營銷效果回饋貼鈴音內(nèi)容偏好標簽鈴音內(nèi)容偏好屬性標簽構(gòu)建思路框架數(shù)據(jù)源整合需求用戶細分模型及行為屬性標簽彩鈴營銷管理子平臺建設(shè)需求改造平臺,從用戶出發(fā)重新規(guī)劃彩鈴鈴音內(nèi)容屬性分析個人鈴音庫中49彩鈴鈴音內(nèi)容屬性標簽應(yīng)用示例歌手地域表達情緒鈴音類型音樂來源榜單音樂時尚觀DIY彩鈴鈴音標簽秋天不回來黃金甲Girlofyourdreams(開篇版)數(shù)據(jù)源整合需求用戶細分模型及行為屬性標簽彩鈴營銷管理子平臺建設(shè)需求彩鈴鈴音內(nèi)容屬性標簽應(yīng)用示例歌手地域表達情緒鈴音類型音樂來源50用戶鈴音內(nèi)容偏好抽提示例用戶A:鈴音庫中鈴音:用戶B:鈴音庫中鈴音:用戶A的鈴音內(nèi)容屬性偏好特征:無跟隨傾向;時尚族;喜歡主流男歌手,但無明顯的歌手傾向;偏好國語,大眾流行POP;影視插曲;情感屬性:傷感;休閑圈;不具標新立異特質(zhì);用戶B的鈴音內(nèi)容屬性偏好特征:無跟隨傾向;時尚族;喜歡新歌;無明顯的歌手傾向,喜歡女歌手;偏好英文歌曲,大眾流行POP;專輯CD;情感屬性:歡樂激情;休閑圈;不具標新立異特質(zhì);提取用戶彩鈴內(nèi)容屬性偏好特征數(shù)據(jù)源整合需求用戶細分模型及行為屬性標簽彩鈴營銷管理子平臺建設(shè)需求用戶鈴音內(nèi)容偏好抽提示例用戶A:用戶B:用戶A的鈴音內(nèi)容屬性51內(nèi)容綱要??BI的相關(guān)背景??數(shù)據(jù)挖掘的基礎(chǔ)知識??數(shù)據(jù)挖掘過程??常用數(shù)據(jù)挖掘方法??常用數(shù)據(jù)挖掘工具52內(nèi)容綱要??BI的相關(guān)背景1BI的相關(guān)背景BI(BusinessIntelligence,商業(yè)智能)是目前全球IT市場中非常熱門的一個話題;其關(guān)鍵推進因素是ERP等系統(tǒng)的相對完善后,形成了海量數(shù)據(jù),如何發(fā)揮這些數(shù)據(jù)的價值其實就是BI所需要解決的問題;BI是數(shù)據(jù)->信息->知識的一個逐步轉(zhuǎn)化過程;BI系統(tǒng)主要由數(shù)據(jù)倉庫-DW(DataWarehouse),聯(lián)機分析處理-OLAP(OnlineAnalyticalProcessing),數(shù)據(jù)挖掘-DM(DataMining)三大部分組成;53BI的相關(guān)背景BI(BusinessIntelligencBI的相關(guān)背景BI系統(tǒng)結(jié)構(gòu)54BI的相關(guān)背景BI系統(tǒng)結(jié)構(gòu)3內(nèi)容綱要??BI的相關(guān)背景??數(shù)據(jù)挖掘的基礎(chǔ)知識??數(shù)據(jù)挖掘過程??常用數(shù)據(jù)挖掘方法??常用數(shù)據(jù)挖掘工具55內(nèi)容綱要??BI的相關(guān)背景4

典型的業(yè)務(wù)問題如何優(yōu)化下一階段的營銷活動?高價值客戶中,誰可能流失?誰貢獻的利潤最多?誰花費的成本最高?客戶都有什么樣的消費特點?56

典型的業(yè)務(wù)問題如何優(yōu)化下一階段的營銷活動?高價值客戶中,誰

數(shù)據(jù)挖掘都可以應(yīng)用到何處?57

數(shù)據(jù)挖掘都可以應(yīng)用到何處?6

何謂數(shù)據(jù)挖掘?數(shù)據(jù)信息決策數(shù)據(jù)挖掘是一個從海量數(shù)據(jù)中抽取前所未知的,可理解的,可操作信息的過程。58

何謂數(shù)據(jù)挖掘?數(shù)據(jù)信息決策數(shù)據(jù)挖掘是一個從海量數(shù)據(jù)中抽取前

數(shù)據(jù)庫與數(shù)據(jù)挖掘發(fā)展歷程59

數(shù)據(jù)庫與數(shù)據(jù)挖掘發(fā)展歷程8

數(shù)據(jù)挖掘是一門交叉學(xué)科數(shù)據(jù)挖掘數(shù)據(jù)庫技術(shù)統(tǒng)計學(xué)其他學(xué)科信息科學(xué)機器學(xué)習(xí)可視化技術(shù)60

數(shù)據(jù)挖掘是一門交叉學(xué)科數(shù)據(jù)挖掘數(shù)據(jù)庫技術(shù)統(tǒng)計學(xué)其他學(xué)科信息內(nèi)容綱要??BI的相關(guān)背景??數(shù)據(jù)挖掘的基礎(chǔ)知識??數(shù)據(jù)挖掘過程??常用數(shù)據(jù)挖掘方法??常用數(shù)據(jù)挖掘工具61內(nèi)容綱要??BI的相關(guān)背景10

數(shù)據(jù)挖掘的過程商業(yè)理解數(shù)據(jù)理解數(shù)據(jù)準備

數(shù)據(jù)挖掘建立模型模型評估模型發(fā)布62

數(shù)據(jù)挖掘的過程商業(yè)理解數(shù)據(jù)理解數(shù)據(jù)準備數(shù)據(jù)建立模型模型評

商業(yè)理解定義商業(yè)目標定義數(shù)據(jù)挖掘目標63

商業(yè)理解定義商業(yè)目標12

數(shù)據(jù)理解需要的數(shù)據(jù)可以獲得的數(shù)據(jù)對可獲得的數(shù)據(jù)進行觀察、分析用直方圖顯示輸入數(shù)據(jù)分布聚類以發(fā)現(xiàn)孤立點在保持數(shù)據(jù)特征的基礎(chǔ)上抽樣過濾不想要的數(shù)據(jù)值映射64

數(shù)據(jù)理解需要的數(shù)據(jù)13

數(shù)據(jù)準備一定要保證數(shù)據(jù)質(zhì)量!65

數(shù)據(jù)準備一定要保證數(shù)據(jù)質(zhì)量!14

建立模型確定抽樣規(guī)則選擇合適的算法調(diào)整算法的參數(shù)66

建立模型確定抽樣規(guī)則15

模型評估使用一組新數(shù)據(jù)評估構(gòu)建好的模型67

模型評估使用一組新數(shù)據(jù)評估構(gòu)建好的模型16

模型發(fā)布制作成自動化處理軟件包,上線使用。68

模型發(fā)布制作成自動化處理軟件包,上線使用。17

數(shù)據(jù)挖掘過程中工作量比例69

數(shù)據(jù)挖掘過程中工作量比例18

數(shù)據(jù)挖掘的過程數(shù)據(jù)倉庫選擇的數(shù)據(jù)選擇轉(zhuǎn)換挖掘理解轉(zhuǎn)換后的數(shù)據(jù)可理解的信息抽取的信息70

數(shù)據(jù)挖掘的過程數(shù)據(jù)倉庫選擇的選擇轉(zhuǎn)換挖掘理解轉(zhuǎn)換后的數(shù)據(jù)可內(nèi)容綱要??BI的相關(guān)背景??數(shù)據(jù)挖掘的基礎(chǔ)知識??數(shù)據(jù)挖掘過程??常用數(shù)據(jù)挖掘方法??常用數(shù)據(jù)挖掘工具71內(nèi)容綱要??BI的相關(guān)背景20

業(yè)務(wù)問題與數(shù)據(jù)挖掘算法間關(guān)系Debt<10%ofIncomeDebt=0%GoodCreditRisksBadCreditRisksGoodCreditRisksYesYesYesNONONOIncome>$40KQQQQII123456factor1factor2factorn神經(jīng)網(wǎng)絡(luò)NeuralNetworks聚類分析ClusteringOpenAccn’tAddNewProductDecreaseUsage???Time序列分析SequenceAnalysis決策樹DecisionTrees

傾向性分析信用特性分析

客戶保留客戶生命周期管理目標市場價格彈性分析

客戶細分市場細分

傾向性分析客戶保留目標市場欺詐檢測關(guān)聯(lián)分析Association

市場組合分析套裝產(chǎn)品分析目錄設(shè)計交叉銷售72

業(yè)務(wù)問題與數(shù)據(jù)挖掘算法間關(guān)系Debt<10%ofInc

數(shù)據(jù)挖掘的類型預(yù)測型數(shù)據(jù)挖掘:使用已知知識構(gòu)建模型,用以預(yù)測未來。描述型數(shù)據(jù)挖掘:尋找數(shù)據(jù)中的模式,使用找到的模式指導(dǎo)決策。73

數(shù)據(jù)挖掘的類型預(yù)測型數(shù)據(jù)挖掘:22

數(shù)據(jù)挖掘技術(shù)(預(yù)測型/描述型)分類結(jié)果將落入哪個類別中?影響預(yù)測結(jié)果的主要因素是什么?值預(yù)測這一事件發(fā)生的可能性是多大?74

數(shù)據(jù)挖掘技術(shù)(預(yù)測型/描述型)23

數(shù)據(jù)挖掘技術(shù)聚類存在哪些邏輯上的群集?關(guān)聯(lián)規(guī)則事件之間存在怎樣的聯(lián)系?序列模式這個事件之后會發(fā)生那些事件?相似時間序列這個結(jié)果是否與以前的一個模式相同?75

數(shù)據(jù)挖掘技術(shù)聚類24

三種主要的數(shù)據(jù)挖掘技術(shù)分類(客戶流失)聚類(客戶細分)關(guān)聯(lián)規(guī)則(購物籃分析)76

三種主要的數(shù)據(jù)挖掘技術(shù)分類聚類關(guān)聯(lián)規(guī)則25

分類分類算法采取行動!77

分類分類算法采取行動!26

決策樹分類訓(xùn)練:基于歷史數(shù)據(jù),創(chuàng)建決策樹78

決策樹分類訓(xùn)練:基于歷史數(shù)據(jù),創(chuàng)建決策樹27

決策樹分類應(yīng)用:基于歷史數(shù)據(jù),創(chuàng)建決策樹79

決策樹分類應(yīng)用:基于歷史數(shù)據(jù),創(chuàng)建決策樹28

決策樹分類的參數(shù)一般數(shù)據(jù)挖掘工具在應(yīng)用決策樹分類算法時,可調(diào)整的參數(shù):輸入變量誤差矩陣(代價矩陣)最大樹深度節(jié)點最大純度節(jié)點最少記錄數(shù)80

決策樹分類的參數(shù)一般數(shù)據(jù)挖掘工具在應(yīng)用決策樹分類算法時,可

神經(jīng)網(wǎng)絡(luò)分類

輸入層(i)隱藏層(j)輸出層(k)

x1x2xiWijWjkOjOk

前饋是指信號先前傳播,輸入->隱層->輸出結(jié)點(神經(jīng)元)81

神經(jīng)網(wǎng)絡(luò)分類結(jié)點(神經(jīng)元)30

BP算法原理網(wǎng)絡(luò)結(jié)構(gòu)的確定輸入層結(jié)構(gòu)由輸入變量(屬性)來定。每個屬性為一個輸入結(jié)點;輸出層結(jié)構(gòu)由輸出結(jié)果來定。有幾個輸出值,就有幾個輸出結(jié)點;隱藏層層數(shù)和結(jié)點數(shù)點的確定:主要靠經(jīng)驗。初始權(quán)值的確定:取決于對問題的了解和先驗知識,那部分作用強,權(quán)值就設(shè)得大些;靠經(jīng)驗。訓(xùn)練過程:一個神經(jīng)元連接權(quán)重調(diào)整的過程。前向傳播階段

輸入層->隱層->輸出層反向傳播階段

計算輸出的結(jié)果和目標結(jié)果的差距

經(jīng)輸出層->隱層->輸入層反推神經(jīng)元連接的權(quán)重調(diào)整對每個輸入樣本重復(fù)上述步驟,直到網(wǎng)絡(luò)收斂為止82

BP算法原理網(wǎng)絡(luò)結(jié)構(gòu)的確定31

聚類低高高高12845376因素二因素三因素一示例83

聚類低高高高12845376因素二因素三因素一示例32

聚類算法演示圖分群神經(jīng)網(wǎng)絡(luò)(Kohonen)84

聚類算法演示圖分群33

關(guān)聯(lián)規(guī)則85

關(guān)聯(lián)規(guī)則34

關(guān)聯(lián)規(guī)則對于規(guī)則A=>B,A=>B的支持度=同時包含A、B的事務(wù)數(shù)÷總事務(wù)數(shù)

A=>B的置信度=(A交B)的支持度÷A的支持度LIFT=(A=>B的置信度)÷B的支持度86

關(guān)聯(lián)規(guī)則對于規(guī)則A=>B,35

序列模式100%購買C產(chǎn)品的顧客在未來的時間里都購買了X產(chǎn)品。87

序列模式100%購買C產(chǎn)品的顧客在未來的時間里都購買了X產(chǎn)

相似序列88

相似序列37

相似序列89

相似序列38

RBF預(yù)測RBF(RadialBasisFunction)神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果是個連續(xù)型變量90

RBF預(yù)測RBF(RadialBasisFuncti

RBF預(yù)測根據(jù)輸出空間,將輸入空間劃分為區(qū)域計算每個區(qū)域的區(qū)域中心91

RBF預(yù)測根據(jù)輸出空間,將輸入空間劃分為區(qū)域計算每個區(qū)域的

RBF預(yù)測計算每個中心的權(quán)重Y=f(x1,x2,x3…)92

RBF預(yù)測計算每個中心的權(quán)重Y=f(x1,x2,x3…)4

RBF預(yù)測第一步:訓(xùn)練第二步:應(yīng)用93

RBF預(yù)測第一步:42內(nèi)容綱要??BI的相關(guān)背景??數(shù)據(jù)挖掘的基礎(chǔ)知識??數(shù)據(jù)挖掘過程??常用數(shù)據(jù)挖掘方法??常用數(shù)據(jù)挖掘工具94內(nèi)容綱要??BI的相關(guān)背景43常用數(shù)據(jù)挖掘工具IntelligentMiner(IBM);Clementine(SPSS);SASEnterpriseMiner(SAS);95常用數(shù)據(jù)挖掘工具IntelligentMiner(IBM新業(yè)務(wù)營銷留住老客戶(提升老客戶活躍度)識別與培養(yǎng)影響力高端根據(jù)客戶本業(yè)務(wù)行為特征及偏好開展針對性營銷,改進客戶體驗①客戶流失預(yù)警及客戶挽留①靠影響力高端帶動②數(shù)據(jù)數(shù)據(jù)數(shù)據(jù)發(fā)展新客戶發(fā)現(xiàn)潛在客戶,進行交叉銷售①靠影響力高端帶動②數(shù)據(jù)數(shù)據(jù)識別影響力高端①根據(jù)影響力高端的需求特點設(shè)計產(chǎn)品①制定能激發(fā)影響力高端積極進行橫向傳播的營銷策略①數(shù)據(jù)數(shù)據(jù)數(shù)據(jù)營銷方式①營銷方式②注釋:電信新業(yè)務(wù)營銷思路新業(yè)務(wù)營銷留住老客戶識別與培養(yǎng)影響力高端根據(jù)客戶本業(yè)務(wù)行為特項目整體操作框架項目整體操作框架基于用戶彩鈴生命周期細分的算法描述數(shù)據(jù)源整合需求用戶細分模型及行為屬性標簽彩鈴營銷管理子平臺建設(shè)需求基于用戶彩鈴生命周期細分的算法描述數(shù)據(jù)源整合需求用戶細分模型彩鈴潛在用戶決策樹模型彩鈴目標用戶(N=20228;L=13.2%)IVR用戶N1:IVR用戶(N=1238;L=35.1%)N6:ARPU<58元(N=10060;L=5%)N5:ARPU>=58元(N=8880;L=19.3%)N2:非IVR用戶(N=18940;L=11.74%)ARPU>=66.5元N3:ARPU>=66.5(N=862;L=44.8%)N4:ARPU<66.5(N=426;L=15.5%)ARPU>=58N8:短信發(fā)送<10條(N=3804;L=14.5%)N7:短信發(fā)送>=10條(N=5076;L=22.9%)短信發(fā)送量>=10N12:ARPU增量<15元(N=2596;L=16.2%)N11:ARPU增量>=15元(N=2479;L=30%)ARPU增量>=15N18:有漫游(N=808;L=11.5%)N17:沒有漫游(N=1788;L=18.3%)漫游業(yè)務(wù)漫游業(yè)務(wù)N

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論