銀行客戶數(shù)據(jù)分析課件(PPT 24頁)_第1頁
銀行客戶數(shù)據(jù)分析課件(PPT 24頁)_第2頁
銀行客戶數(shù)據(jù)分析課件(PPT 24頁)_第3頁
銀行客戶數(shù)據(jù)分析課件(PPT 24頁)_第4頁
銀行客戶數(shù)據(jù)分析課件(PPT 24頁)_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1銀行客戶數(shù)據(jù)分析2007-09-01第1頁,共24頁。2背景 數(shù)據(jù)客戶群服務(wù)盈利商業(yè)銀行擁有大量的個(gè)人客戶交易數(shù)據(jù)、個(gè)人客戶服務(wù)數(shù)據(jù)和個(gè)人客戶基本資料數(shù)據(jù)。在這些海量數(shù)據(jù)中,隱藏著大量的有價(jià)值的客戶信息。運(yùn)用數(shù)據(jù)挖掘中的聚類分析技術(shù)可以從這些數(shù)據(jù)集中提取客戶的分類知識(shí)。聚類分析技術(shù)可以將性質(zhì)、特征近似的數(shù)據(jù)對(duì)象歸屬在相同的群集中。商業(yè)銀行可以利用此技術(shù)分辨出能有效為之服務(wù)的最有價(jià)值的客戶,為他們提供更為個(gè)性化的服務(wù),從而影響相關(guān)的客戶行為并最終達(dá)到提高盈利的目的。第2頁,共24頁。3數(shù)據(jù)集客戶數(shù)據(jù)集包含10,000條客戶數(shù)據(jù)包含有31個(gè)特征(屬性), 分別為:Bank No(銀行代碼,其值有

2、:004,024,077等)Account num(賬戶代碼)Short Name(客戶名字)First Contact Date(第一次接觸日期)account open date(賬戶開戶日期)account balance(賬戶當(dāng)前余額)account low balance(賬戶曾經(jīng)最低余額)account high balance(賬戶曾經(jīng)最高余額)balance category(余額類型)Statement Low Balance(最低交易賬目,有正有負(fù))第3頁,共24頁。4數(shù)據(jù)集(屬性)Statement High Balance(最高交易賬目)Statement Aggreg

3、ate Debit Balance(聚集透支賬目)Statement Aggregate Debit Day(透支賬目的天數(shù))Statement Aggregate Credit Balance(聚集存款賬目)Statement Aggregate Credit Day(存款賬目的開數(shù))Return Check Count(退回支票的次數(shù))Status(客戶狀態(tài))Audit Granding(授權(quán)級(jí)別,越高則風(fēng)險(xiǎn)越低)Salary Before Last Month(上一個(gè)月之前自動(dòng)付款的賬目)Salary last Month(上一個(gè)月自動(dòng)付款的賬目)Salary this Month(這一

4、個(gè)月自動(dòng)付款的賬目)Count of Credit this Month(這個(gè)月存款的次數(shù))第4頁,共24頁。5數(shù)據(jù)集(屬性)Count of Debit this Month(這個(gè)月取款的次數(shù))Count of OD(透支的次數(shù))Amount of Deposit this Month(本月存款的賬目)Amount of Withdraw this Month(本月取款的賬目)Last Transaction Date(上一次交易的日期)Country Code(客戶所屬的國家)Birthday(生日)Sex(性別) 第5頁,共24頁。6數(shù)據(jù)預(yù)處理我們選用Weka數(shù)據(jù)挖掘工具來對(duì)客戶的賬戶數(shù)

5、據(jù)進(jìn)行分析,因此所有的原始數(shù)據(jù)都必須轉(zhuǎn)換成能被Weka處理的數(shù)據(jù)集格式。 原始數(shù)據(jù)集的特征主要有四種類型的,分別是:數(shù)值型(numeric)、標(biāo)稱型(nominal)、日期型(date)和字符串型(string)。 對(duì)于缺失的屬性值,因?yàn)閃eka中的算法能自動(dòng)處理屬性值缺失的情況,所以按Weka數(shù)據(jù)集的格式要求用“?”表示。 第6頁,共24頁。7數(shù)據(jù)預(yù)處理(規(guī)格化)數(shù)值型特征: 采用如下公式規(guī)格化到0, 1區(qū)間 標(biāo)稱型特征、日期型特征和字符串型特征保持不變 第7頁,共24頁。8聚類分析目標(biāo)我們的目的是對(duì)客戶進(jìn)行分群,從而使銀行可以對(duì)不同群體的客戶提供不同的服務(wù)。因此聚類分析是對(duì)客戶進(jìn)行自動(dòng)分群

6、的有效方法。方法k-means算法 選取的特征從31個(gè)原始屬性值中選取23個(gè)屬性用作聚類(都是數(shù)值型或標(biāo)稱型的)聚類參數(shù)在經(jīng)過規(guī)格化處理后的數(shù)據(jù)集中,用k-means算法在選定的23個(gè)屬性上進(jìn)行聚類,設(shè)定聚類數(shù)為10. 第8頁,共24頁。9各聚類大小各聚類所包含的客戶數(shù)量如下表聚類客戶數(shù)量聚類1145聚類269聚類3133聚類46183聚類51985聚類6213聚類746聚類8446聚類9413聚類10368表1第9頁,共24頁。10對(duì)聚類大小的分析由表1可知,各聚類有大有小,且大小懸殊,但也合乎客戶關(guān)系處理的目的??蛻絷P(guān)系管理的往往是找出一小部分的特殊客戶(占20%左右)來進(jìn)行特別地對(duì)待。在

7、上表所示的10個(gè)聚類中,除去最大的聚類4后其余9個(gè)聚類的客戶數(shù)達(dá)3818人,占總客戶量的38.18%;除去最大的兩個(gè)聚類(聚類4和聚類5)后其余8個(gè)聚類的客戶數(shù)達(dá)1833人,占總客戶量的18.33%. 大聚類可以再繼續(xù)細(xì)分 (作為一個(gè)數(shù)據(jù)集再繼續(xù)進(jìn)行聚類操作, 或直接提高聚類個(gè)數(shù))第10頁,共24頁。11對(duì)各聚類結(jié)果的處理聚類后的各聚類結(jié)果的數(shù)據(jù)是規(guī)格化處理后的數(shù)據(jù)的結(jié)果,我們要直觀地分析各聚類的特點(diǎn),必須把規(guī)格化的數(shù)據(jù)還原為原始數(shù)據(jù)。例如,最小值為-10,000,最大值為1,000,000的當(dāng)前賬戶余額規(guī)格化為0,1后就難以理解各賬戶間存在的巨大差距,只有把它還原為原始的-10000, 10

8、00000才能使人直觀地理解其存在的差距。把各聚類的數(shù)據(jù)集還原為原始數(shù)據(jù)后,再計(jì)算各特征的均值和標(biāo)準(zhǔn)差(數(shù)值型的特征);或者各標(biāo)稱量的數(shù)量(標(biāo)稱型的特征)。 第11頁,共24頁。12聚類結(jié)果分析(賬戶當(dāng)前余額 )下表所示為10個(gè)聚類中各聚類的賬戶當(dāng)前余額的正負(fù)及賬戶當(dāng)前余額的均值和標(biāo)準(zhǔn)差 聚類當(dāng)前余額正負(fù)當(dāng)前余額值+均值標(biāo)準(zhǔn)差聚類1145024445.5073408.73聚類269029164.4178077.97聚類31330152882.48604633.58聚類4618215571.1723957.76聚類51985022102.6164825.42聚類6119948432.821868

9、0.66聚類74602093.915798.48聚類8380667729.6733233.11聚類90413-24728.6861844.23聚類10368036264.2493389.14第12頁,共24頁。13聚類結(jié)果分析(賬戶當(dāng)前余額 )最明顯的特殊客戶群有兩個(gè) :一個(gè)是聚類3的客戶群,該聚類的當(dāng)前余額均值達(dá)十五萬左右,比其他聚類的當(dāng)前余額均值高出一個(gè)數(shù)量級(jí)。所以可以初步判斷該聚類的客戶是存款額高或者說是高收入的客戶群。另外,該聚類當(dāng)前余額的標(biāo)準(zhǔn)差也很大,這說明在富有的客戶群中各客戶的收入差距也是很大的,有的達(dá)百萬、千萬、甚至上億.另一個(gè)明顯的特殊客戶群是聚類9所示的客戶群。該客戶群中的

10、413個(gè)客戶當(dāng)前賬戶余額都為負(fù)值,且其均值達(dá)負(fù)兩萬多元。因此可以認(rèn)定該客戶群是高透支的客戶群。后面還會(huì)分析的透支額、透支次數(shù)、透支時(shí)間等屬性的分析同樣可以印證我們這個(gè)結(jié)論.第13頁,共24頁。14聚類結(jié)果分析(賬戶當(dāng)前余額 )分析其他的八個(gè)聚類聚類4是占61.81%的最大的普通客戶群,該客戶群中幾乎所有的客戶的當(dāng)前余額都為正值,其均值為五千多,標(biāo)準(zhǔn)差為兩萬多不會(huì)太小,說明該龐大的客戶群還是可以再繼續(xù)細(xì)分的。聚類5是占19.85%的第二大的客戶群,該客戶群比最大的客戶群聚類4來說它的當(dāng)前余額均值高很多,達(dá)兩萬多元。因此可以說聚類5是大量普通客戶中的中等存款額度的賬戶(不包括低存款額度的賬戶)。聚

11、類7是賬戶當(dāng)前余額為正值但存款額度較低的客戶群。聚類1,2,6,8,10這五個(gè)聚類在當(dāng)前賬戶余額這一屬性上不能發(fā)現(xiàn)其明顯的特征,我們將在后續(xù)的其他屬性上的分析發(fā)現(xiàn)其聚類特征。 第14頁,共24頁。15聚類結(jié)果分析(最低及最高交易賬目 )下表所示為各聚類的最低交易賬目和最高交易賬目的均值與標(biāo)準(zhǔn)差 聚類最低交易賬目最高交易賬目均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差聚類121710.5767398.2930649.7787211.66聚類225422.8071501.1843955.38100110.53聚類3137112.35560335.78180985.33617496.38聚類44664.6621531.07

12、8869.5331149.29聚類515040.5349724.5943980.40109262.32聚類6-9205.01915566.6615999.4228870.03聚類71703.675667.1385432.0912143.86聚類8-9331.1732766.5026126.10143537.61聚類9-27823.9464684.33-12265.0633615.10聚類1016948.3454751.5374335.21148054.73第15頁,共24頁。16聚類結(jié)果分析(最低及最高交易賬目 )明顯聚類特征:聚類3的最低交易賬目和最高交易賬目的均值都最高,這說明該類賬戶一般

13、是有大數(shù)額的資金流入。聚類9的最低交易賬目和最高交易賬目的均值都最小,屬于透支最多的一類,這說明該類賬戶是屬于透支型的賬戶,透支額維持在一個(gè)比較高的水平,且其最高交易額平均也達(dá)負(fù)一萬兩千多,說明這類型賬戶平均很少正向資金存入。 第16頁,共24頁。17聚類結(jié)果分析(最低及最高交易賬目 )聚類4這個(gè)最大的客戶群的最低和最高交易賬目的平均值保持在一個(gè)中等的水平,最低四千多,最高八千多;第二大客戶群聚類5的最低和最高交易賬目的均值都較聚類4高很多,這也同樣能夠說明聚類5是大量的中等偏高的存儲(chǔ)客戶。聚類7的最低和最高交易賬目都較低(正值),屬于小額儲(chǔ)蓄客戶。聚類6和聚類8的最低交易賬目平均為負(fù)值(屬于

14、透支),最高交易賬目平均為正值(屬于儲(chǔ)蓄),因此該類型客戶屬于有儲(chǔ)蓄有透支的信用消費(fèi)型客戶。聚類1,2,10在這一屬性上還不能分析出很明顯的聚類特征 第17頁,共24頁。18聚類結(jié)果分析(透支賬目/存款賬目 )下表所示為聚集透支賬目及透支賬目天數(shù)、聚集存款賬目及存款賬目天數(shù)的均值和標(biāo)準(zhǔn)差。 聚類聚集透支賬目透支賬目天數(shù)聚集存款賬目存款賬目天數(shù)均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差聚類10000621553.941893055.17260聚類20000862332.672188134.51260聚類300003987771.6315631280.74260聚類4000.000.03145729

15、.02582818.6026.000.03聚類50000599440.681531141.41260聚類699402.83202963.8015.644.3966568.08130475.9210.364.39聚類7000075543.65239671.98260聚類817345.0451581.643.632.61170027.62856644.6322.372.61聚類9596935.001384363.1225.391.312744.6715650.270.611.31聚類100000907077.212107278.80260第18頁,共24頁。19聚類結(jié)果分析(透支賬目/存款賬目 )

16、聚類3的聚集存款賬目很高,均值達(dá)三百多萬,該類型客戶幾乎不透支,但該類型客戶的聚集存款賬目的標(biāo)準(zhǔn)差也奇高,達(dá)一千五百多萬,這也印證了前面所說的高收入群體中的各個(gè)體收入差距還是很大的。聚類9是高額度透支賬戶,聚集透支賬目均值接近六十萬,但聚集存款賬目均值僅有兩千多,并且其透支時(shí)間長(zhǎng),平均達(dá)二十五天多。所以,該類型賬戶應(yīng)該是長(zhǎng)期處于透支狀態(tài)。第19頁,共24頁。20聚類結(jié)果分析(透支賬目/存款賬目 )前面提到,聚類6和聚類8是有透支有儲(chǔ)蓄的信用型消費(fèi)客戶,在此也可以說明問題。這兩個(gè)聚類的聚集透支賬目和聚集存款賬目都有不小的數(shù)額, 但其不同點(diǎn)是:聚類6的聚集透支賬目比聚集存款賬目要高,且其透支時(shí)間長(zhǎng)

17、,說明該賬戶是以透支消費(fèi)為目的,以存款維持信用消費(fèi)。聚類8的聚集存款賬目要遠(yuǎn)高于聚集透支賬目,說明該客戶群以儲(chǔ)蓄為主,透支消費(fèi)為次。聚類7是聚集存賬目不高的客戶群,且其不進(jìn)行透支消費(fèi)。聚類1,2,5,10在這一屬性上不能分析出明顯的聚類特征。第20頁,共24頁。21聚類結(jié)果分析(本月存取款賬目 )下表所示為本月存款次數(shù)、本月存款賬目、本月取款次數(shù)、本月取款賬目 的均值與標(biāo)準(zhǔn)差聚類這個(gè)月存款次數(shù)本月存款賬目這個(gè)月取款次數(shù)本月取款賬目均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差聚類10.160.443102.7922512.430.682.146525.8838214.38聚類21.521.95142

18、04.9651897.495.646.6720524.6758284.22聚類30.941.1836389.15121866.583.795.0444100.75118407.29聚類40.430.656345.4451757.411.041.406871.6351832.93聚類52.371.4048165.60434339.248.564.6353513.42435119.06聚類62.823.1230468.1953245.3510.889.1331899.8950629.19聚類70.961.865205.3512258.952.615.766791.2613240.96聚類83.322.9847629.30186798.969.108.0349078.89201585.59聚類91.993.2015185.6541397.608.3310.0423149.9866096.16聚類107.184.0799006.39174714.0519.5810.0499224.65169294.68第21頁,共24頁。22聚類結(jié)果分析(本月存取款賬目 )聚類1,4,7都屬于存取款賬目比較小的賬戶類型。聚類1的取款賬目是存款賬目的2倍;聚類4的存取款賬目相當(dāng);聚類7的取款賬目略高于存款賬目。另外,從本月的存取次數(shù)看,聚類1,4,7的存取次數(shù)都很

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論