CART算法在銀行CRM中的應(yīng)用研究_第1頁(yè)
CART算法在銀行CRM中的應(yīng)用研究_第2頁(yè)
CART算法在銀行CRM中的應(yīng)用研究_第3頁(yè)
CART算法在銀行CRM中的應(yīng)用研究_第4頁(yè)
CART算法在銀行CRM中的應(yīng)用研究_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、cart算法在銀行crm中的應(yīng)用研究馮潔(景德鎮(zhèn)陶瓷學(xué)院信息工程學(xué)院,江西景德鎮(zhèn)333403)application of cart algorithm in banking crmjie feng(school of information engineering, jingdezhen ceramic institute, jingdezhen jiangxi, 333403)摘要:客戶(hù)關(guān)系管理已從以而的以“產(chǎn)品為中心”的營(yíng)銷(xiāo)模式轉(zhuǎn)變?yōu)橐浴翱蛻?hù)為中心”的營(yíng) 銷(xiāo)模式。自從我國(guó)加入wt0以來(lái),各行各業(yè)都遭到了嚴(yán)峻的挑戰(zhàn)。尤具是在銀行業(yè)方面, 隨著外國(guó)銀行的步步緊逼,我國(guó)銀行業(yè)的客戶(hù)將不斷減少,

2、收益將日益緊縮。因此引進(jìn)國(guó)外 銀行先進(jìn)的管理經(jīng)驗(yàn)和技術(shù)就叢得口益緊迫。論文論述了數(shù)據(jù)挖掘技術(shù)在銀行業(yè)中的應(yīng)用現(xiàn) 狀,并介紹了用丁決策分類(lèi)的cart算法,最后使用該算法對(duì)銀行個(gè)人信貸數(shù)據(jù)進(jìn)行分析, 得出一些重要的決策規(guī)則。關(guān)鍵字:數(shù)據(jù)挖掘客戶(hù)關(guān)系管理 cart算法abstract: customer relationship management from the previous "products as the center? of the marketing model into a “cusiomecenlic'farkeling model.since china&#

3、39;s accession to wto,all walks of life have been a serious challenge.especially in the banking sector,pressing harder and harder as the foreign banks,china's banking customers will continuc to decrease in ,income will become increasingly tight.therefore,the introduction of foreign advanced mana

4、gement experience and banking technology becomes increasingly urgent. paper discussed the data mining technology in banking application status,and describes the cart algorithm for classification decision-making,finally,using the algorithm to analyze of bank credit data,draw some important decision-m

5、aking rules.keywords: data mining customerelationship management cart algorithm0 引言隨著市場(chǎng)的開(kāi)放,銀行而臨著越來(lái)越激烈的競(jìng)爭(zhēng),與國(guó)外銀行相比,國(guó)內(nèi)銀行最大的差 距在于服務(wù)。在客戶(hù)關(guān)系竹理方面,國(guó)外銀行已冇近20年的歷史,積累了豐富的經(jīng)驗(yàn);國(guó)內(nèi) 銀行業(yè)長(zhǎng)期對(duì)客戶(hù)實(shí)行無(wú)差別服務(wù)策略,不能夠抓住真正的贏利客戶(hù),為客戶(hù)提供一對(duì)一的 服務(wù)。國(guó)內(nèi)銀行的數(shù)據(jù)庫(kù)中積累了大量的客戶(hù)信息,但是如果缺乏行z冇效的數(shù)據(jù)挖掘系統(tǒng)和 客戶(hù)關(guān)系管理系統(tǒng)進(jìn)行分析管理,銀行就很難將各種各樣的客戶(hù)信息統(tǒng)一起來(lái),不能有效地 為業(yè)務(wù)部門(mén)和領(lǐng)導(dǎo)決策層捉

6、供快速準(zhǔn)確的幫助。建立并發(fā)展客八關(guān)系管理是捉升國(guó)內(nèi)銀行業(yè) 核心競(jìng)爭(zhēng)力和銀行發(fā)展的必然趨勢(shì)。1 數(shù)據(jù)挖掘技術(shù)在銀行業(yè)中的應(yīng)用現(xiàn)狀 了解整合客戶(hù)信息隨著銀行提供的服務(wù)項(xiàng)目日趨多樣化,如柜面服務(wù)、信用卡、網(wǎng)上銀行、個(gè)人住房貸款。 銀行而對(duì)的客戶(hù)群體也將i趨龐人,通過(guò)分析客戶(hù)的各種屬性(家庭背景、受教冇程度、月 收入、銀行存款、客戶(hù)信用等)來(lái)劃分客戶(hù)群,并對(duì)不同的客戶(hù)群提供個(gè)性化的服務(wù)。 區(qū)分有價(jià)值的客戶(hù)并非所有的客八都會(huì)給銀行帶來(lái)利潤(rùn),銀行的目標(biāo)是留住有價(jià)值的客戶(hù)。銀行按貢獻(xiàn)度 將客戶(hù)分成一般客戶(hù)、重點(diǎn)客戶(hù)、潛在客戶(hù)。數(shù)據(jù)挖掘的目標(biāo)就是通過(guò)分析以往的數(shù)據(jù)將客 戶(hù)分類(lèi),為重點(diǎn)客戶(hù)提供更好、更全曲的服務(wù)

7、,向潛在客戶(hù)提供他們感興趣的服務(wù),挖掘他 們的價(jià)值。 利用孤立點(diǎn)分析規(guī)避風(fēng)險(xiǎn)銀行貸款業(yè)務(wù)是一項(xiàng)高收入的業(yè)務(wù),同時(shí)也是一項(xiàng)高風(fēng)險(xiǎn)的業(yè)務(wù),處理不好冋給銀行帶 來(lái)巨大的損失。因此如何獲得高利潤(rùn)的同時(shí)有效的避免貸款風(fēng)險(xiǎn)是銀行業(yè)務(wù)員主要的工作困 難。數(shù)據(jù)挖掘技術(shù)通過(guò)孤立點(diǎn)分析,建立風(fēng)險(xiǎn)規(guī)避模型,能及時(shí)、有效的對(duì)高風(fēng)險(xiǎn)業(yè)務(wù)提出 預(yù)警,并給出相應(yīng)的規(guī)避策略,從而減少銀行的損失。 提供交叉銷(xiāo)售銀行在分析客戶(hù)消費(fèi)模式時(shí),往往會(huì)發(fā)現(xiàn)某一類(lèi)客戶(hù)在參加一項(xiàng)業(yè)務(wù)的同時(shí)也參加了另 外一項(xiàng)業(yè)務(wù)。數(shù)據(jù)挖掘當(dāng)屮的關(guān)聯(lián)規(guī)則模型可以有效的在大量的數(shù)據(jù)當(dāng)中分析出顧客的消費(fèi) 規(guī)律,為那些具有相似特征的但還未參加某類(lèi)項(xiàng)冃的顧客,提供交叉

8、服務(wù)。2. cart算法介紹cart(ciassi f ication and regression tree)算法采用一種二分遞歸分割的技術(shù), 將當(dāng)前的樣本集分為兩個(gè)了樣本集,使得生成的決策樹(shù)的每個(gè)非葉子節(jié)點(diǎn)都冇兩個(gè)分 支。因此,cart算法生成的決策樹(shù)是結(jié)構(gòu)簡(jiǎn)潔的二叉樹(shù)。以下是算法描述:其中t 代表當(dāng)前樣本集,當(dāng)前候選屬性集用t_attributel ist表示。(1) 創(chuàng)建根節(jié)點(diǎn)n(2) 為n分配類(lèi)別(3) if t都屬于同一類(lèi)別or t中只剩下一個(gè)樣本則返回n為葉節(jié)點(diǎn),為其 分配屬性(4) for each t attributelist中屬性執(zhí)行該屬性上的一個(gè)劃分,計(jì)算此劃 分的gi

9、ni系數(shù)(5) n的測(cè)試屬性test_attribute=t_attributelist中最小gini系數(shù)的屬性(6) 劃分t得到t1 t2 了集(7) 對(duì)于t1重復(fù)(1) - (6)(8) 對(duì)于t2重復(fù)(1) - (6)cart算法考慮到每個(gè)節(jié)點(diǎn)都有成為葉子節(jié)點(diǎn)的可能,對(duì)每個(gè)節(jié)點(diǎn)都分配類(lèi)別。分 配類(lèi)別的方法町以用當(dāng)前節(jié)點(diǎn)中ih現(xiàn)最多的類(lèi)別,也可以參考當(dāng)前節(jié)點(diǎn)的分類(lèi)錯(cuò)誤或 者其他更復(fù)雜的方法。cart算法仍然使用后剪枝。在樹(shù)的生成過(guò)程中,多展開(kāi)一層就 會(huì)有多一些的信息被發(fā)現(xiàn),cart算法運(yùn)行到不能再長(zhǎng)出分支位置,從而得到一棵最大 的決策樹(shù)。然后對(duì)這棵大樹(shù)進(jìn)行剪枝。3. cart算法對(duì)銀行信貸客

10、戶(hù)分類(lèi)導(dǎo)入數(shù)據(jù)銀行信貸數(shù)據(jù)一共有256條數(shù)據(jù),每條數(shù)據(jù)包括5個(gè)屬性,分別是月收入、存款總額、 客戶(hù)信用、客戶(hù)貢獻(xiàn)度、是否貸款。其中客戶(hù)信用和客戶(hù)貢獻(xiàn)度字段冇兩種取值:“一般” 和“高”;是否貸款字段也有兩種取值,分別用“y”表示同意貸款,“n”表示不同意貸款。 數(shù)據(jù)導(dǎo)入后如圖1所示。圃表(5個(gè)字段,256條記錄)£回岡(3文件®編輯生成©客座暫憩獨(dú)毀史劭否貸款月收入存款總額nnnnnnnnnnnnnnnn投沒(méi)畏沒(méi)沒(méi)畏沒(méi)畏投沒(méi)畏畏長(zhǎng)畏投 克 fl fl fl fl fl fl fl fl fl fl fl fl fl fl 一 一一一 一一一 一一一 一一一 一一高

11、高高高高 投沒(méi)投艮沒(méi)沒(méi)沒(méi)長(zhǎng)投投投投沒(méi)投我氏投投長(zhǎng)投 fl 9 9 s fl fl fl s fl s 9 fl s fl fl s fl s 一一二一一一 一一一 一一一 一一二一一一14500.96543.23440.65987.35600.86520.42560.49087.53480.76548.61600.18974.73280.98760.85430.43219.92876.9876.0.104678.45320.115320.34098.123480.85900.135500.86500.144500.56000.153500.40000.163800.11300.174590.1

12、3200.185670.14320.194200.16783.203570.18689.表注解確定(0)圖1數(shù)據(jù)導(dǎo)入圖建立數(shù)據(jù)挖掘模型數(shù)據(jù)導(dǎo)入后,根據(jù)對(duì)數(shù)據(jù)的分析,我們得知下面的工作就是通過(guò)建立cart算法模型 對(duì)以上數(shù)據(jù)進(jìn)行分類(lèi),將“是否貸款”字段定義為輸出屬性,其它字段為輸入加性,所得數(shù) 據(jù)流圖如圖2所示。新建 microsoft excel 工.是否貸款圖2數(shù)據(jù)流圖我們通過(guò)“是否貸款”節(jié)點(diǎn)可以查看“是否貸款”字段中值的分布比例,如圖43所示。圖3值分布圖 執(zhí)行數(shù)據(jù)流圖屮的cart算法節(jié)點(diǎn),得到一些決策規(guī)則,如圖4所示。圖4決策規(guī)則通過(guò)対上圖的分析,我們可以將這些規(guī)則解釋為:(1) 對(duì)月收

13、入低于6000元的客戶(hù),不提供貸款。(2) 對(duì)月收入高于600()元,但客戶(hù)信用一般的,并且存款總額低于1()()()()()元的客戶(hù)不 提供貸款。(3) 對(duì)月收入高于6000元,但客戶(hù)信用一般的,并且存款總額低于100000元的客戶(hù)不 提供貸款。(4) 對(duì)刀收入高于6000元,客戶(hù)信用一般的,存款總額高于100()00元的但客戶(hù)貢獻(xiàn)度 一般的客戶(hù)不提供貸款。(5) 對(duì)月收入高于6000元,客戶(hù)信用一般的,存款總額高于100000元的但客戶(hù)貢獻(xiàn)度 高的客戶(hù)提供貸款。(6) 對(duì)月收入高于6000元,并且客戶(hù)信用高的客戶(hù)提供貸款。對(duì)這些規(guī)則進(jìn)行分析,我們發(fā)現(xiàn)銀行給客戶(hù)貸款的重要審查的目標(biāo)是客戶(hù)月收

14、入和客戶(hù)信用度以及客戶(hù)貢獻(xiàn)度。銀行管理人員通過(guò)以上規(guī)則對(duì)以將信貸客戶(hù)分類(lèi),以后審批貸款時(shí)可以將客戶(hù)數(shù)據(jù)和已分類(lèi)的數(shù)據(jù)進(jìn)行比較,就可以更好、更快的進(jìn)行決策判斷。4 結(jié)束語(yǔ)論文通過(guò)對(duì)比國(guó)內(nèi)外銀行crm系統(tǒng)應(yīng)用現(xiàn)狀,得出數(shù)據(jù)挖掘技術(shù)在處理銀行業(yè)務(wù)當(dāng)屮 起到了至關(guān)重耍的作用,并分析了當(dāng)今銀行crm屮數(shù)據(jù)挖掘技術(shù)的四人主要應(yīng)川,然后提 出決策樹(shù)算法當(dāng)中的cart算法,戢后應(yīng)用該算法對(duì)銀行個(gè)人信貸數(shù)據(jù)進(jìn)行分析,得出一 些有意義的決策規(guī)則,能夠更好的指導(dǎo)銀行管理人員進(jìn)行決策。參考文獻(xiàn):【1】胡致杰,數(shù)據(jù)挖掘技術(shù)在銀行crm中的應(yīng)用j.金融信息化論壇,2008 (7) :4-6.2聶品,孫捷.基于數(shù)據(jù)挖掘的商業(yè)銀行客戶(hù)關(guān)系管理系統(tǒng)構(gòu)建研究j.科技創(chuàng)業(yè)月 刊,2005(10):95-96.【3】張穎.數(shù)據(jù)挖掘技術(shù)在銀行crm+的應(yīng)用.廣西金融研究.2004. 2【4】魏紅寧.決策樹(shù)剪枝方法的比較j.西南交通大學(xué)學(xué)報(bào),2005,40(1) :44-48.5 郭俊鵬,劉西林.基于id3算法的進(jìn)一步客戶(hù)細(xì)分方法j.工業(yè)工程,2006, 9 (2): 82-85.6 黃潤(rùn)龍.數(shù)據(jù)統(tǒng)計(jì)與分析技術(shù)-spss軟件實(shí)用教程m北京:高等教育出版社,2004. 【7】謝邦昌.數(shù)據(jù)挖掘clementine應(yīng)用實(shí)務(wù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論