版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、2021/3/91銀行客戶數(shù)據(jù)分析2007-09-012021/3/92背景 數(shù)數(shù)據(jù)客戶戶群服務(wù)務(wù)盈利 商業(yè)銀行擁有大量的個(gè)人客戶交易數(shù)據(jù)、個(gè)人客戶服務(wù)數(shù)據(jù)和個(gè)人客戶基本資料數(shù)據(jù)。在這些海量數(shù)據(jù)中,隱藏著大量的有價(jià)值的客戶信息。運(yùn)用數(shù)據(jù)挖掘中的聚類分析技術(shù)可以從這些數(shù)據(jù)集中提取客戶的分類知識。聚類分析技術(shù)可以將性質(zhì)、特征近似的數(shù)據(jù)對象歸屬在相同的群集中。商業(yè)銀行可以利用此技術(shù)分辨出能有效為之服務(wù)的最有價(jià)值的客戶,為他們提供更為個(gè)性化的服務(wù),從而影響相關(guān)的客戶行為并最終達(dá)到提高盈利的目的。2021/3/93數(shù)據(jù)集數(shù)據(jù)集 客戶數(shù)據(jù)集包含10,000條客戶數(shù)據(jù) 包含有31個(gè)特征(屬性), 分別為:
2、Bank No(銀行代碼,其值有:004,024,077等) Account num(賬戶代碼) Short Name(客戶名字) First Contact Date(第一次接觸日期) account open date(賬戶開戶日期) account balance(賬戶當(dāng)前余額) account low balance(賬戶曾經(jīng)最低余額) account high balance(賬戶曾經(jīng)最高余額) balance category(余額類型) Statement Low Balance(最低交易賬目,有正有負(fù))2021/3/94數(shù)據(jù)集數(shù)據(jù)集(屬性屬性)Statement High Ba
3、lance(最高交易賬目)Statement Aggregate Debit Balance(聚集透支賬目)Statement Aggregate Debit Day(透支賬目的天數(shù))Statement Aggregate Credit Balance(聚集存款賬目)Statement Aggregate Credit Day(存款賬目的開數(shù))Return Check Count(退回支票的次數(shù))Status(客戶狀態(tài))Audit Granding(授權(quán)級別,越高則風(fēng)險(xiǎn)越低)Salary Before Last Month(上一個(gè)月之前自動付款的賬目)Salary last Month(上一個(gè)
4、月自動付款的賬目)Salary this Month(這一個(gè)月自動付款的賬目)Count of Credit this Month(這個(gè)月存款的次數(shù))2021/3/95數(shù)據(jù)集數(shù)據(jù)集(屬性屬性)Count of Debit this Month(這個(gè)月取款的次數(shù))Count of OD(透支的次數(shù))Amount of Deposit this Month(本月存款的賬目)Amount of Withdraw this Month(本月取款的賬目)Last Transaction Date(上一次交易的日期)Country Code(客戶所屬的國家)Birthday(生日)Sex(性別) 2021
5、/3/96數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理 我們選用Weka數(shù)據(jù)挖掘工具來對客戶的賬戶數(shù)據(jù)進(jìn)行分析,因此所有的原始數(shù)據(jù)都必須轉(zhuǎn)換成能被Weka處理的數(shù)據(jù)集格式。 原始數(shù)據(jù)集的特征主要有四種類型的,分別是:數(shù)值型(numeric)、標(biāo)稱型(nominal)、日期型(date)和字符串型(string)。 對于缺失的屬性值,因?yàn)閃eka中的算法能自動處理屬性值缺失的情況,所以按Weka數(shù)據(jù)集的格式要求用“?”表示。 2021/3/97數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理(規(guī)格化) 數(shù)值型特征: 采用如下公式規(guī)格化到0, 1區(qū)間 標(biāo)稱型特征、日期型特征和字符串型特征保持不變 minmaxminxxxxx2021/3/98聚類分
6、析聚類分析目標(biāo)我們的目的是對客戶進(jìn)行分群,從而使銀行可以對不同群體的客戶提供不同的服務(wù)。因此聚類分析是對客戶進(jìn)行自動分群的有效方法。方法k-means算法 選取的特征從31個(gè)原始屬性值中選取23個(gè)屬性用作聚類(都是數(shù)值型或標(biāo)稱型的)聚類參數(shù)在經(jīng)過規(guī)格化處理后的數(shù)據(jù)集中,用k-means算法在選定的23個(gè)屬性上進(jìn)行聚類,設(shè)定聚類數(shù)為10. 2021/3/99各聚類大小各聚類所包含的客戶數(shù)量如下表聚類客戶數(shù)量聚類1145聚類269聚類3133聚類46183聚類51985聚類6213聚類746聚類8446聚類9413聚類10368表12021/3/910對聚類大小的分析由表1可知,各聚類有大有小,且
7、大小懸殊,但也合乎客戶關(guān)系處理的目的。客戶關(guān)系管理的往往是找出一小部分的特殊客戶(占20%左右)來進(jìn)行特別地對待。在上表所示的10個(gè)聚類中,除去最大的聚類4后其余9個(gè)聚類的客戶數(shù)達(dá)3818人,占總客戶量的38.18%;除去最大的兩個(gè)聚類(聚類4和聚類5)后其余8個(gè)聚類的客戶數(shù)達(dá)1833人,占總客戶量的18.33%. 大聚類可以再繼續(xù)細(xì)分 (作為一個(gè)數(shù)據(jù)集再繼續(xù)進(jìn)行聚類操作, 或直接提高聚類個(gè)數(shù))2021/3/911對各聚類結(jié)果的處理聚類后的各聚類結(jié)果的數(shù)據(jù)是規(guī)格化處理后的數(shù)據(jù)的結(jié)果,我們要直觀地分析各聚類的特點(diǎn),必須把規(guī)格化的數(shù)據(jù)還原為原始數(shù)據(jù)。例如,最小值為-10,000,最大值為1,000
8、,000的當(dāng)前賬戶余額規(guī)格化為0,1后就難以理解各賬戶間存在的巨大差距,只有把它還原為原始的-10000, 1000000才能使人直觀地理解其存在的差距。把各聚類的數(shù)據(jù)集還原為原始數(shù)據(jù)后,再計(jì)算各特征的均值和標(biāo)準(zhǔn)差(數(shù)值型的特征);或者各標(biāo)稱量的數(shù)量(標(biāo)稱型的特征)。 2021/3/912聚類結(jié)果分析(賬戶當(dāng)前余額 )下表所示為10個(gè)聚類中各聚類的賬戶當(dāng)前余額的正負(fù)及賬戶當(dāng)前余額的均值和標(biāo)準(zhǔn)差 聚類當(dāng)前余額正負(fù)當(dāng)前余額值+均值標(biāo)準(zhǔn)差聚類1145024445.5073408.73聚類269029164.4178077.97聚類31330152882.48604633.58聚類4618215571
9、.1723957.76聚類51985022102.6164825.42聚類6119948432.8218680.66聚類74602093.915798.48聚類8380667729.6733233.11聚類90413-24728.6861844.23聚類10368036264.2493389.142021/3/913聚類結(jié)果分析(賬戶當(dāng)前余額 ) 最明顯的特殊客戶群有兩個(gè) : 一個(gè)是聚類聚類3的客戶群,該聚類的當(dāng)前余額均值達(dá)十五萬左右,比其他聚類的當(dāng)前余額均值高出一個(gè)數(shù)量級。所以可以初步判斷該聚類的客戶是存款額高或者說是高收入的客高收入的客戶群戶群。另外,該聚類當(dāng)前余額的標(biāo)準(zhǔn)差也很大,這說明在
10、富有的客戶群中各客戶的收入差距也是很大的,有的達(dá)百萬、千萬、甚至上億. 另一個(gè)明顯的特殊客戶群是聚類聚類9所示的客戶群。該客戶群中的413個(gè)客戶當(dāng)前賬戶余額都為負(fù)值,且其均值達(dá)負(fù)兩萬多元。因此可以認(rèn)定該客戶群是高透支的客戶群高透支的客戶群。后面還會分析的透支額、透支次數(shù)、透支時(shí)間等屬性的分析同樣可以印證我們這個(gè)結(jié)論.2021/3/914聚類結(jié)果分析(賬戶當(dāng)前余額 )2021/3/915聚類結(jié)果分析(最低及最高交易賬目 )下表所示為各聚類的最低交易賬目和最高交易賬目的均值與標(biāo)準(zhǔn)差 聚類最低交易賬目最高交易賬目均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差聚類121710.5767398.2930649.7787211.6
11、6聚類225422.8071501.1843955.38100110.53聚類3137112.35560335.78180985.33617496.38聚類44664.6621531.078869.5331149.29聚類515040.5349724.5943980.40109262.32聚類6-9205.01915566.6615999.4228870.03聚類71703.675667.1385432.0912143.86聚類8-9331.1732766.5026126.10143537.61聚類9- -27823.9464684.33- -12265.0633615.10聚類1016948
12、.3454751.5374335.21148054.732021/3/916聚類結(jié)果分析(最低及最高交易賬目 ) 明顯聚類特征: 聚類聚類3的最低交易賬目和最高交易賬目的均值都最高,這說明該類賬戶一般是有大數(shù)額的資金流入大數(shù)額的資金流入。 聚類聚類9的最低交易賬目和最高交易賬目的均值都最小,屬于透支最多的一類透支最多的一類,這說明該類賬戶是屬于透支型的透支型的賬戶賬戶,透支額維持在一個(gè)比較高的水平,且其最高交易額平均也達(dá)負(fù)一萬兩千多,說明這類型賬戶平均很少正向資金存入。 2021/3/917聚類結(jié)果分析(最低及最高交易賬目 )聚類聚類4這個(gè)最大的客戶群的最低和最高交易賬目的平均值保持在一個(gè)中等
13、中等的水平,最低四千多,最高八千多;第二大客戶群聚類群聚類5的最低和最高交易賬目的均值都較聚類4高很多,這也同樣能夠說明聚類5是大量的中等偏高的存儲客戶中等偏高的存儲客戶。聚類聚類7的最低和最高交易賬目都較低(正值),屬于小額儲蓄客戶。聚類6和聚類8的最低交易賬目平均為負(fù)值(屬于透支),最高交易賬目平均為正值(屬于儲蓄),因此該類型客戶屬于有儲有儲蓄有透支的信用消費(fèi)型客戶蓄有透支的信用消費(fèi)型客戶。聚類1,2,10在這一屬性上還不能分析出很明顯的聚類特征 2021/3/918聚類結(jié)果分析(透支賬目/存款賬目 )下表所示為聚集透支賬目及透支賬目天數(shù)、聚集存款賬目及存款賬目天數(shù)的均值和標(biāo)準(zhǔn)差。 聚類
14、聚集透支賬目透支賬目天數(shù)聚集存款賬目存款賬目天數(shù)均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差聚類10000621553.941893055.17260聚類20000862332.672188134.51260聚類300003987771.6315631280.74260聚類4000.000.03145729.02582818.6026.000.03聚類50000599440.681531141.41260聚類699402.83202963.8015.644.3966568.08130475.9210.364.39聚類7000075543.65239671.98260聚類817345.0451581
15、.643.632.61170027.62856644.6322.372.61聚類9596935.001384363.1225.391.312744.6715650.270.611.31聚類100000907077.212107278.802602021/3/919聚類結(jié)果分析(透支賬目/存款賬目 )聚類3的聚集存款賬目很高,均值達(dá)三百多萬,該類型客戶幾乎不透支,但該類型客戶的聚集存款賬目的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差也奇高也奇高,達(dá)一千五百多萬,這也印證了前面所說的高收入群體中的各個(gè)體收入差距還是很大的。聚類聚類9是高額度透支賬戶高額度透支賬戶,聚集透支賬目均值接近六十萬,但聚集存款賬目均值僅有兩千多,并且其
16、透支時(shí)間長,平均達(dá)二十五天多。所以,該類型賬戶應(yīng)該是長期長期處于透支狀態(tài)處于透支狀態(tài)。2021/3/920聚類結(jié)果分析(透支賬目/存款賬目 ) 前面提到,聚類6和聚類8是有透支有儲蓄的信用型信用型消費(fèi)客戶消費(fèi)客戶,在此也可以說明問題。這兩個(gè)聚類的聚集透支賬目和聚集存款賬目都有不小的數(shù)額, 但其不同點(diǎn)是: 聚類聚類6的聚集透支賬目比聚集存款賬目要高,且其透支時(shí)間長,說明該賬戶是以透支消費(fèi)為目的,以存款維持信用消費(fèi)以透支消費(fèi)為目的,以存款維持信用消費(fèi)。 聚類聚類8的聚集存款賬目要遠(yuǎn)高于聚集透支賬目,說明該客戶群以儲蓄為主,透支消費(fèi)為次以儲蓄為主,透支消費(fèi)為次。 聚類聚類7是聚集存賬目不高的客戶群,
17、且其不進(jìn)行透支消費(fèi)。 聚類1,2,5,10在這一屬性上不能分析出明顯的聚類特征。2021/3/921聚類結(jié)果分析(本月存取款賬目 )下表所示為本月存款次數(shù)、本月存款賬目、本月取款次數(shù)、本月取款賬目 的均值與標(biāo)準(zhǔn)差聚類這個(gè)月存款次數(shù)本月存款賬目這個(gè)月取款次數(shù)本月取款賬目均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差聚類10.160.443102.7922512.430.682.146525.8838214.38聚類21.521.9514204.9651897.495.646.6720524.6758284.22聚類30.941.1836389.15121866.583.795.0444100.7511
18、8407.29聚類40.430.656345.4451757.411.041.406871.6351832.93聚類52.371.4048165.60434339.248.564.6353513.42435119.06聚類62.823.1230468.1953245.3510.889.1331899.8950629.19聚類70.961.865205.3512258.952.615.766791.2613240.96聚類83.322.9847629.30186798.969.108.0349078.89201585.59聚類91.993.2015185.6541397.608.3310.0423149.9866096.16聚類107.184.0799006.39174714.0519.5810.0499224.65169294.682021/3/922聚類結(jié)果分析(本月存取款賬目 ) 聚類1,4,7都屬于存取款賬目比較小的賬戶類型。 聚類1的取款賬目是存款賬目的2倍; 聚類4的存取款賬目相當(dāng); 聚類7的取款賬目略高于存款賬目。 另外,從本月的存取次數(shù)看,聚類1,4,7的存取次數(shù)都很低,因?yàn)樗麄兊拇嫒≠~目也低,可以認(rèn)為這些類型的賬戶主要是資金流動很小的賬戶類型資金流動很小的賬戶類型(或者說包含一部分的睡眠賬戶睡眠賬戶)。 2021/3/923聚類結(jié)果分析(本月
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 影響農(nóng)村信用社發(fā)展的政策性障礙分析
- 輪椅車 第31部分 電動輪椅車的鋰離子電池系統(tǒng)和充電器 要求和試驗(yàn)方法 征求意見稿
- 直播招商課件教學(xué)課件
- 金融培訓(xùn)課件教學(xué)課件
- 三年級數(shù)學(xué)計(jì)算題專項(xiàng)練習(xí)及答案集錦
- 維修水泵機(jī)組合同(2篇)
- 學(xué)習(xí)領(lǐng)會《新就業(yè)形態(tài)勞動者權(quán)益協(xié)商指引》心得體會
- 南京航空航天大學(xué)《編譯原理》2022-2023學(xué)年第一學(xué)期期末試卷
- 發(fā)現(xiàn)問題說課稿
- 陽春市河朗鎮(zhèn)飲用水供水工程施工組織設(shè)計(jì)
- 軟土地基處理預(yù)應(yīng)力管樁施工要點(diǎn)
- 外國古代建筑史-古羅馬
- 世界銀行招標(biāo)采購指南
- 720--消防自動噴水滅火系統(tǒng)(干式)講解
- AQL抽樣檢驗(yàn)表(標(biāo)準(zhǔn)版本2(1).0)
- 安陽師范學(xué)院校級教學(xué)團(tuán)隊(duì)推薦表
- 企業(yè)中層管理人員素質(zhì)測評(附答案)
- 國民經(jīng)濟(jì)動員中心申報(bào)材料
- 流式細(xì)胞術(shù)報(bào)告單解讀
- 社區(qū)衛(wèi)生服務(wù)中心公共衛(wèi)生績效考核及獎(jiǎng)金分配制度
- 外貿(mào)_詢盤的分析與回復(fù)(精)
評論
0/150
提交評論