畢業(yè)論文數(shù)據(jù)挖掘算法在銀行客戶(hù)細(xì)分中的應(yīng)用_第1頁(yè)
畢業(yè)論文數(shù)據(jù)挖掘算法在銀行客戶(hù)細(xì)分中的應(yīng)用_第2頁(yè)
畢業(yè)論文數(shù)據(jù)挖掘算法在銀行客戶(hù)細(xì)分中的應(yīng)用_第3頁(yè)
畢業(yè)論文數(shù)據(jù)挖掘算法在銀行客戶(hù)細(xì)分中的應(yīng)用_第4頁(yè)
畢業(yè)論文數(shù)據(jù)挖掘算法在銀行客戶(hù)細(xì)分中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

畢業(yè)論文

數(shù)據(jù)挖掘算法在銀行客戶(hù)細(xì)分中的應(yīng)用目錄1前言 11.1問(wèn)題的由來(lái) 11.2國(guó)內(nèi)外研究現(xiàn)狀 11.3主要內(nèi)容和創(chuàng)新點(diǎn) 22數(shù)據(jù)挖掘與商業(yè)銀行客戶(hù)細(xì)分 32.1客戶(hù)細(xì)分 3客戶(hù)細(xì)分的概述 3銀行客戶(hù)細(xì)分在客戶(hù)關(guān)系管理中的意義 42.2數(shù)據(jù)挖掘 4數(shù)據(jù)挖掘的概述 4數(shù)據(jù)挖掘在客戶(hù)關(guān)系管理中的應(yīng)用途徑 63數(shù)據(jù)挖掘方法在銀行客戶(hù)細(xì)分中的應(yīng)用 63.1數(shù)據(jù)挖掘的一般過(guò)程 63.2客戶(hù)分類(lèi)指標(biāo)的建立 73.3客戶(hù)數(shù)據(jù)的選擇和準(zhǔn)備 8數(shù)據(jù)選擇 8數(shù)據(jù)預(yù)處理 8數(shù)據(jù)轉(zhuǎn)換 93.4數(shù)據(jù)挖掘 10數(shù)據(jù)挖掘使用的算法 103.4.2K-mean算法的挖掘過(guò)程 11K-mean算法的數(shù)據(jù)挖掘的結(jié)果 13層次聚類(lèi)算法的挖掘過(guò)程 14層次聚類(lèi)算法的數(shù)據(jù)挖掘結(jié)果 163.5解釋與評(píng)估,結(jié)果轉(zhuǎn)換 18對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋和評(píng)價(jià) 18挖掘結(jié)果轉(zhuǎn)換 183.6知識(shí)運(yùn)用 194結(jié)束語(yǔ) 20參考文獻(xiàn) 21致謝 22附錄一:K-mean算法聚類(lèi)結(jié)果 23附錄二:層次聚類(lèi)法個(gè)案聚類(lèi)結(jié)果 25附錄三:層次聚類(lèi)法變量聚類(lèi)結(jié)果 27

數(shù)據(jù)挖掘算法在銀行客戶(hù)細(xì)分中的應(yīng)用專(zhuān)業(yè):信息管理與信息系統(tǒng)摘要:隨著改革開(kāi)放的到來(lái)經(jīng)濟(jì)的迅速開(kāi)展和騰飛,信息技術(shù)快速興起的和金融行業(yè)的蓬勃開(kāi)展,企業(yè)從客戶(hù)關(guān)系管理中獲得大量的客戶(hù)信息,但是如何利用好這些珍貴的戰(zhàn)略資源,并通過(guò)這些資源對(duì)客戶(hù)進(jìn)行分類(lèi)、保持和開(kāi)展,已成為決定商業(yè)銀行在競(jìng)爭(zhēng)劇烈的行業(yè)中獲得成功的關(guān)鍵。面對(duì)這些亟待解決的問(wèn)題,利用數(shù)據(jù)挖掘算法在客戶(hù)關(guān)系管理中對(duì)客戶(hù)進(jìn)行細(xì)分無(wú)疑是很好的選擇。通過(guò)聚類(lèi)分析能快速的為銀行進(jìn)行客戶(hù)分類(lèi),并針對(duì)每一客戶(hù)群體實(shí)施具體的客戶(hù)關(guān)系管理策略和市場(chǎng)營(yíng)銷(xiāo)策略,用最少的本錢(qián),為客戶(hù)帶來(lái)最適宜的效勞,并為企業(yè)創(chuàng)造最高的價(jià)值。本文通過(guò)對(duì)銀行客戶(hù)細(xì)分的問(wèn)題由來(lái)進(jìn)行闡述,并對(duì)研究文獻(xiàn)進(jìn)行綜述,結(jié)合數(shù)據(jù)挖掘算法進(jìn)行銀行客戶(hù)細(xì)分。文章說(shuō)明客戶(hù)細(xì)分的重要意義和作用,介紹了數(shù)據(jù)挖掘的算法和客戶(hù)細(xì)分的方法,選取人口特征和行為特征的相關(guān)變量分別采用K-mean算法和層次聚類(lèi)法對(duì)銀行客戶(hù)進(jìn)行數(shù)據(jù)挖掘,得出個(gè)案的聚類(lèi)結(jié)果和變量的聚類(lèi)結(jié)果,并將數(shù)據(jù)挖掘結(jié)果轉(zhuǎn)換成具有實(shí)用價(jià)值知識(shí),最后將結(jié)果轉(zhuǎn)換成客戶(hù)細(xì)分方式和營(yíng)銷(xiāo)策略,為銀行決策提供支持。關(guān)鍵詞:客戶(hù)細(xì)分;數(shù)據(jù)挖掘;聚類(lèi)分析TheUseofDateMiningAlgorithmintheCustomerSegmentationofBankMajor:InformationManagement&InformationSystemAbstract:Withthedevelopmentofourcountry’seconomicandthereformingandopening-uppolicy,theinformationtechnologyandthefinancialsectordevelopfasterthanbefore,compan-iescangetalargescaleofcustomerinformationfromcustomerrelationshipmanagement.Whilehowtomakefulluseofthesepreciousresources,dividecustomerintodifferentclusters,keepanddevelopcustomersthroughtheseresources,theproblemhasbeenthekeyfactorofwinningsucc-essoftheintensecompetitionofcommercialbanks.Facetothesetobesolvedproblems,dateminingisagoodchoiceformanagerstomakecust-omersegmentation.Itcandocustomersegmentationforbanksquicklyandgiveideastoeverycl-usterwithlowercost,higherbenefitandmoreappropriateservice.Thisarticleelaboratedtheoriginofbankcustomersegmentationproblems,reviewedtheli-terature,andusedthedateminingalgorithmstomakecustomersegmentation.Itelaboratedtheuseandimportanceofcustomersegmentation,introducedthedateminingalgorithmsandwaysofcustomersegmentation,selectedpopulationcharacteristicsandbehaviorcharacteristics,usingk-meanalgorithmandhierarchicalclusteringmethodsfordateminingtodocustomersegmen-tation,changedtheresultsofcustomerclusteringandvariableclusteringintousefultacticsaboutcustomersegmentationandmarketing,andgivedecisionsupportforbanksatlast.Keywords:CustomerSegmentation;DateMining;ClusterAnalysi1前言1.1問(wèn)題的由來(lái)隨著改革開(kāi)放以來(lái)中國(guó)經(jīng)濟(jì)的迅速開(kāi)展和騰飛,信息技術(shù)快速興起的和金融行業(yè)的蓬勃開(kāi)展,我國(guó)的金融行業(yè)特別是銀行業(yè)面臨著巨大的機(jī)遇和挑戰(zhàn)。改革開(kāi)放的到來(lái),在市場(chǎng)經(jīng)濟(jì)的刺激下,商業(yè)銀行之間的競(jìng)爭(zhēng)變得日益劇烈,這使得商業(yè)銀行在開(kāi)展的過(guò)程中,也需不斷的跟進(jìn)市場(chǎng)的需求和腳步,經(jīng)營(yíng)理念也發(fā)生了從“以市場(chǎng)為導(dǎo)向〞到“以客戶(hù)為導(dǎo)向〞的巨大轉(zhuǎn)變。客戶(hù)關(guān)系管理便成為商業(yè)銀行提高盈利的重要途徑和手段。作為客戶(hù)關(guān)系管理的重要功能之一的客戶(hù)細(xì)分便提高商業(yè)銀行競(jìng)爭(zhēng)方面凸顯其重要的戰(zhàn)略意義和作用。隨著信息經(jīng)濟(jì)時(shí)代的到來(lái),銀行從客戶(hù)關(guān)系管理中獲得大量的客戶(hù)信息,但是如何利用好這些珍貴的戰(zhàn)略資源,并通過(guò)這些資源對(duì)客戶(hù)進(jìn)行分類(lèi)、保持和開(kāi)展,已成為決定商業(yè)銀行在競(jìng)爭(zhēng)劇烈的行業(yè)中獲得成功的關(guān)鍵。同時(shí),隨著信息技術(shù)的開(kāi)展和銀行業(yè)電子化程度的不斷提高,面對(duì)大量的數(shù)據(jù),許多銀行還是停留在處理客戶(hù)投訴的客戶(hù)管理關(guān)系階段,這無(wú)疑是對(duì)資源的浪費(fèi),更是對(duì)企業(yè)開(kāi)展的嚴(yán)重阻礙。所以,更加科學(xué)有效的客戶(hù)關(guān)系管理和客戶(hù)細(xì)分,不僅能為企業(yè)帶來(lái)便捷,針對(duì)目標(biāo)客戶(hù)有的放矢,減少不必要的損失,更能提高企業(yè)的競(jìng)爭(zhēng)力,為企業(yè)帶來(lái)更大的效益。利用數(shù)據(jù)挖掘算法在客戶(hù)關(guān)系管理中對(duì)客戶(hù)進(jìn)行細(xì)分無(wú)疑是很好的選擇。通過(guò)聚類(lèi)分析和決策樹(shù)分析能快速的為銀行進(jìn)行客戶(hù)分類(lèi),并針對(duì)每一客戶(hù)群體實(shí)施具體的客戶(hù)關(guān)系管理策略和市場(chǎng)營(yíng)銷(xiāo)策略。1.2國(guó)內(nèi)外研究現(xiàn)狀目前在我國(guó),“數(shù)據(jù)海量,信息缺乏〞是商業(yè)銀行在數(shù)據(jù)大集中之后普遍所面對(duì)的為難。目前金融業(yè)實(shí)施的大多數(shù)數(shù)據(jù)庫(kù)只能實(shí)現(xiàn)數(shù)據(jù)的錄入、查詢(xún)、統(tǒng)計(jì)等較低層次的功能,卻無(wú)法發(fā)現(xiàn)數(shù)據(jù)中存在的各種有用的信息,譬如對(duì)這些數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,然后可能發(fā)現(xiàn)某個(gè)客戶(hù)、消費(fèi)群體或組織的金融和商業(yè)興趣,并可觀察金融市場(chǎng)的變化趨勢(shì)。數(shù)據(jù)挖掘的技術(shù)在我國(guó)的研究與應(yīng)用并不是很廣泛深入。國(guó)內(nèi)商業(yè)銀行在過(guò)去的十幾年中,一直堅(jiān)持以產(chǎn)品為中心的經(jīng)營(yíng)理念,并以此來(lái)進(jìn)行部門(mén)人員的設(shè)置及信息化系統(tǒng)的開(kāi)發(fā),其結(jié)果是導(dǎo)致各個(gè)產(chǎn)品系統(tǒng)之間大多相對(duì)獨(dú)立,毫無(wú)關(guān)系,客戶(hù)的各項(xiàng)信息分布于多個(gè)系統(tǒng)中,各系統(tǒng)自己的數(shù)據(jù)標(biāo)準(zhǔn)也各不一致,客戶(hù)信息無(wú)法全面展現(xiàn)。在對(duì)客戶(hù)進(jìn)行細(xì)分時(shí),一般也采取傳統(tǒng)的方法,如:基于經(jīng)驗(yàn)的分類(lèi)方法或基于統(tǒng)計(jì)的簡(jiǎn)單劃分方法,這些方法一般根據(jù)決策者的經(jīng)驗(yàn)或是根據(jù)客戶(hù)簡(jiǎn)單的屬性特征,對(duì)客戶(hù)進(jìn)行劃分,例如根據(jù)客戶(hù)所購(gòu)置的金融產(chǎn)品類(lèi)別(如:貸款、申請(qǐng)信用卡、理財(cái)產(chǎn)品等),或根據(jù)客戶(hù)的居住地域、年齡等對(duì)客戶(hù)劃分類(lèi)別。雖然這些劃分對(duì)商業(yè)銀行的客戶(hù)管理也是很有意義的,但卻無(wú)法滿(mǎn)足諸如對(duì)哪些客戶(hù)的潛在價(jià)值更高、哪些客戶(hù)的資信程度更高、客戶(hù)群有哪些特征等復(fù)雜分析需求。隨著信息技術(shù)的不斷開(kāi)展和金融電子化程度的不斷提高,國(guó)內(nèi)商業(yè)銀行已積累了越來(lái)越多的客戶(hù)數(shù)據(jù),面對(duì)海量的客戶(hù)數(shù)據(jù),傳統(tǒng)的客戶(hù)細(xì)分方法那么更顯得力不從心(陳宏凱,2006)。我國(guó)商業(yè)銀行對(duì)客戶(hù)資源沒(méi)有細(xì)分,沒(méi)有相應(yīng)的客戶(hù)定位,對(duì)所有客戶(hù)都一視同仁。有時(shí)為了追求數(shù)量而不重質(zhì)量和效益,往往導(dǎo)致柜臺(tái)資源主要被80%的低端客戶(hù)占用,而給其帶來(lái)巨大經(jīng)濟(jì)利益的20%的高端客戶(hù)沒(méi)有得到較好的金融效勞。而目前西方商業(yè)銀行對(duì)客戶(hù)資源有一個(gè)很好的細(xì)分,業(yè)務(wù)針對(duì)性較強(qiáng),對(duì)一般客戶(hù)的金融效勞主要是通過(guò)ATM等自助終端來(lái)實(shí)現(xiàn),而將目標(biāo)客戶(hù)鎖定在中高收入階層〔鄒江、張維然,2004〕。數(shù)據(jù)挖掘技術(shù)已經(jīng)被廣泛應(yīng)用在西方金融行業(yè)企業(yè)中,它可以成功預(yù)測(cè)銀行客戶(hù)需求。一旦獲得了這些信息,銀行就可以改善自身營(yíng)銷(xiāo)。國(guó)外商業(yè)銀行在管理和技術(shù)上都有著豐富的經(jīng)驗(yàn),包括花旗銀行、美洲銀行、匯豐銀行等在內(nèi)的眾多國(guó)際大銀行都已確立了以客戶(hù)為中心的經(jīng)營(yíng)理念,并充分利用商業(yè)智能技術(shù),建立獨(dú)立統(tǒng)一的客戶(hù)數(shù)據(jù)庫(kù)和客戶(hù)信息分析系統(tǒng),以便能更好地了解客戶(hù),為客戶(hù)提供其所需要的產(chǎn)品設(shè)計(jì)和效勞。他們加強(qiáng)同客戶(hù)的忠誠(chéng)關(guān)系,把客戶(hù)當(dāng)作一項(xiàng)資產(chǎn)來(lái)管理和開(kāi)發(fā)?;ㄆ煦y行能準(zhǔn)確說(shuō)出誰(shuí)是他們盈利來(lái)源最多的客戶(hù),能在10分鐘之內(nèi)講清楚重要的銀行客戶(hù)使用了多少種銀行產(chǎn)品。在商業(yè)智能的幫助下,花旗銀行可以按照客戶(hù)為銀行創(chuàng)造盈利的多少和盈利潛在可能性的大小將自己的客戶(hù)進(jìn)行分類(lèi),進(jìn)而根據(jù)不同客戶(hù)以往的消費(fèi)習(xí)慣,預(yù)測(cè)其未來(lái)的消費(fèi)傾向,并結(jié)合外部經(jīng)濟(jì)、人口統(tǒng)計(jì)等相關(guān)數(shù)據(jù)預(yù)測(cè)未來(lái)的市場(chǎng)開(kāi)展趨勢(shì)。通過(guò)這種分析,一方面可以使銀行把握市場(chǎng)動(dòng)態(tài),開(kāi)發(fā)出新產(chǎn)品占領(lǐng)市場(chǎng),另一方面可以使銀行針對(duì)不同奉獻(xiàn)度的客戶(hù)采取不同的產(chǎn)品和效勞,從而獲得盡可能大的“深度效益〞。此外,花旗還向已有客戶(hù)交叉銷(xiāo)售新產(chǎn)品,并且取得了巨大的成功。他們利用商業(yè)智能的卓越性能,了解每個(gè)客戶(hù)的行為特征、消費(fèi)習(xí)慣、財(cái)務(wù)狀況及未來(lái)的需要,從而為客戶(hù)做出恰當(dāng)和切合其需要的財(cái)務(wù)建議和安排,同時(shí)更有針對(duì)性和更有效地進(jìn)行推廣工作〔陳宏凱,2006〕。1.3主要內(nèi)容和創(chuàng)新點(diǎn)利用數(shù)據(jù)挖掘算法在商業(yè)銀行客戶(hù)細(xì)分中進(jìn)行實(shí)際應(yīng)用,并為商業(yè)銀行在客戶(hù)細(xì)分方面提供決策支持。為以后企業(yè)在決策方面提供了科學(xué)的算法和方法,并能運(yùn)用到實(shí)際中去。本文利用文獻(xiàn)研究法,定量分析法,定性分析法等方法對(duì)相關(guān)理論和方法進(jìn)行闡述并進(jìn)行具體實(shí)踐。主要研究?jī)?nèi)容:第一,客戶(hù)細(xì)分的概念,原理和方法,客戶(hù)細(xì)分在客戶(hù)關(guān)系管理中的重要地位和意義;第二,數(shù)據(jù)挖掘的理論和方法,以及數(shù)據(jù)挖掘?qū)蛻?hù)細(xì)分的重要意義;第三,銀行客戶(hù)細(xì)分的數(shù)據(jù)挖掘和結(jié)果討論;第四,數(shù)據(jù)挖掘算法在銀行客戶(hù)細(xì)分方面的展望和開(kāi)展。本文創(chuàng)新點(diǎn):利用K-mean算法和層次聚類(lèi)分析方法,分別對(duì)客戶(hù)進(jìn)行細(xì)分和客戶(hù)屬性進(jìn)行聚類(lèi),不僅能得到客戶(hù)的聚類(lèi)結(jié)果,并且能得到客戶(hù)屬性特征的聚類(lèi)結(jié)果,提出典型客戶(hù)特征,為客戶(hù)細(xì)分提供了更加有效的方法和結(jié)果,為客戶(hù)細(xì)分的客戶(hù)特征的選取提供了參考。2數(shù)據(jù)挖掘與商業(yè)銀行客戶(hù)細(xì)分2.1客戶(hù)細(xì)分2.1.1客戶(hù)細(xì)分的概述客戶(hù)細(xì)分(CustomerSegmentation),作為客戶(hù)關(guān)系管理的核心概念之一,是指企業(yè)在明確的戰(zhàn)略、業(yè)務(wù)模式和特定的市場(chǎng)中,根據(jù)客戶(hù)的屬性、行為、需求、偏好以及價(jià)值等區(qū)因素對(duì)于客戶(hù)進(jìn)行分類(lèi),并提供針對(duì)的產(chǎn)品、效勞和營(yíng)銷(xiāo)模式的過(guò)程。〔陳宏凱,2006〕簡(jiǎn)單說(shuō)是指將客戶(hù)劃分成互不相交的不同類(lèi)別,在同一類(lèi)別里,客戶(hù)具有類(lèi)似的特性??蛻?hù)細(xì)分是進(jìn)行客戶(hù)關(guān)系管理的重要前提和關(guān)鍵步驟。進(jìn)行客戶(hù)細(xì)分是為了使企業(yè)更精確地答復(fù)誰(shuí)是企業(yè)的客戶(hù),哪些客戶(hù)有哪些實(shí)際需求,哪些客戶(hù)對(duì)企業(yè)的利潤(rùn)奉獻(xiàn)最大,哪些是企業(yè)應(yīng)該重點(diǎn)保持的客戶(hù),企業(yè)應(yīng)該如何針對(duì)不同用戶(hù)提出自己的營(yíng)銷(xiāo)政策,從而實(shí)現(xiàn)企業(yè)利潤(rùn)最大化等問(wèn)題。從理論角度看,客戶(hù)關(guān)系管理包括三大根本功能:即客戶(hù)發(fā)現(xiàn)、客戶(hù)分析、客戶(hù)交往。通過(guò)客戶(hù)關(guān)系管理為營(yíng)銷(xiāo)人員提供客戶(hù)價(jià)值信息,發(fā)現(xiàn)哪些客戶(hù)能為企業(yè)帶來(lái)價(jià)值和怎樣使這種價(jià)值最大化,促使客戶(hù)經(jīng)理和客戶(hù)之間建立緊密的聯(lián)系,保證客戶(hù)能夠得到專(zhuān)業(yè)化的效勞,從而提高客戶(hù)的忠誠(chéng)度和企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力。通過(guò)對(duì)前面客戶(hù)關(guān)系管理的構(gòu)成的了解,我們可以把客戶(hù)關(guān)系管理分為下面幾個(gè)方面:〔1〕對(duì)現(xiàn)有客戶(hù)的效勞與支持。通過(guò)與客戶(hù)的多種渠道的交互,可以高效、快速、準(zhǔn)確地完成對(duì)客戶(hù)的反響,同時(shí)可降低效勞的本錢(qián);〔2〕對(duì)潛在客戶(hù)的挖掘。通過(guò)對(duì)現(xiàn)有客戶(hù)的了解、分析,找出其特點(diǎn),然后基于數(shù)據(jù)挖掘的證券業(yè)客戶(hù)關(guān)系管理中的客戶(hù)細(xì)分研究后可對(duì)一些可能的潛在客戶(hù)進(jìn)行接觸,擴(kuò)大客戶(hù)群體;〔3〕對(duì)客戶(hù)的維系。通過(guò)對(duì)客戶(hù)進(jìn)行細(xì)分,為客戶(hù)提供更多的個(gè)性化的效勞,弄清客戶(hù)流失原因,提前進(jìn)行預(yù)防;〔4〕進(jìn)行風(fēng)險(xiǎn)防范。在一些高風(fēng)險(xiǎn)行業(yè),通過(guò)對(duì)客戶(hù)的類(lèi)別及其消費(fèi)特點(diǎn),可以對(duì)客戶(hù)異常進(jìn)行預(yù)警??蛻?hù)細(xì)分的第一步就是要了解所要研究的對(duì)象特征。以客戶(hù)為視角的各種細(xì)分方法其根本的維度內(nèi)涵離不開(kāi)客戶(hù)的三個(gè)根本特征:人口特征、行為和心理特征,從不同的角度捕捉客戶(hù)特征。具體來(lái)說(shuō),人口特征包含了客戶(hù)展現(xiàn)出來(lái)的外部特征,行為因素那么表現(xiàn)為客戶(hù)的具體購(gòu)置行為,而心理特征不僅反映客戶(hù)的行為,還包含興趣和態(tài)度?;诳蛻?hù)細(xì)分研究Wilkie和Cohen最早按照不同的層次將細(xì)分變量分為五種:個(gè)人總體特征描述變量(如性別、年齡、職業(yè)、收入等)、心理圖示、需要的價(jià)值、品牌感知和購(gòu)置行為。Schiffman按照地理、人口、心理、社會(huì)文化、使用情境、利益以及混合細(xì)分變量進(jìn)行歸納。Haley那么認(rèn)為在傳統(tǒng)市場(chǎng)細(xì)分中,地理區(qū)域、人口統(tǒng)計(jì)和銷(xiāo)量細(xì)分變量占據(jù)了統(tǒng)治地位。從以上學(xué)者對(duì)傳統(tǒng)市場(chǎng)細(xì)分變量的總結(jié)不難看出,它們實(shí)際上可以歸屬于三類(lèi)——環(huán)境細(xì)分、心理細(xì)分和行為細(xì)分??蛻?hù)細(xì)分沒(méi)有統(tǒng)一的模式,總的來(lái)說(shuō),客戶(hù)細(xì)分的方法主要包括基于客戶(hù)統(tǒng)計(jì)學(xué)特征的客戶(hù)細(xì)分、基于客戶(hù)行為的客戶(hù)細(xì)分、基于客戶(hù)生命周期的客戶(hù)細(xì)分和基于客戶(hù)價(jià)值相關(guān)指標(biāo)的客戶(hù)細(xì)分??蛻?hù)細(xì)分的實(shí)現(xiàn)技術(shù)很多,諸如人工神經(jīng)網(wǎng)絡(luò)、因素分析、擬和分析和聚類(lèi)分析等都在實(shí)踐中有著廣泛的應(yīng)用??蛻?hù)細(xì)分方法的選擇要以進(jìn)行細(xì)分的目的、企業(yè)以及市場(chǎng)的實(shí)際情況為根底。2.1.2銀行客戶(hù)細(xì)分在客戶(hù)關(guān)系管理中的意義客戶(hù)關(guān)系管理起源于西方的市場(chǎng)營(yíng)銷(xiāo)理論,產(chǎn)生和開(kāi)展于美國(guó)。客戶(hù)關(guān)系管理的概念最早是由專(zhuān)注于IT技術(shù)的咨詢(xún)參謀公司GartnerGroup提出的,目的在于建立一個(gè)系統(tǒng),使企業(yè)在客戶(hù)效勞、市場(chǎng)競(jìng)爭(zhēng)、銷(xiāo)售及支持方面形成彼此協(xié)調(diào)的全新的關(guān)系實(shí)體,為企業(yè)帶來(lái)長(zhǎng)久的競(jìng)爭(zhēng)優(yōu)勢(shì)??蛻?hù)關(guān)系管理是一種旨在改善企業(yè)與客戶(hù)之間關(guān)系的新型運(yùn)作機(jī)制,它實(shí)施于企業(yè)的市場(chǎng)營(yíng)銷(xiāo)、銷(xiāo)售、效勞與技術(shù)支持等與客戶(hù)有關(guān)的領(lǐng)域??蛻?hù)關(guān)系管理解決方案著力于以產(chǎn)品和資源為根底、以客戶(hù)為中心、以贏得市場(chǎng)并取得最大回報(bào)為目標(biāo),通過(guò)信息的有效集成為根底進(jìn)行的客戶(hù)快速反響,給予客戶(hù)一對(duì)一、交互式的個(gè)性化效勞,到達(dá)商業(yè)過(guò)程自動(dòng)化并改良業(yè)務(wù)流程??蛻?hù)關(guān)系管理的目標(biāo)就在于協(xié)助企業(yè)不斷地獲取和積累客戶(hù)知識(shí),并將這些知識(shí)運(yùn)用在企業(yè)的生產(chǎn)、市場(chǎng)營(yíng)銷(xiāo)和客戶(hù)效勞等各個(gè)領(lǐng)域,以提升客戶(hù)滿(mǎn)意度和忠誠(chéng)度,提高企業(yè)的核心競(jìng)爭(zhēng)力,從而降低生產(chǎn)、銷(xiāo)售和效勞本錢(qián),增加企業(yè)效益。對(duì)商業(yè)銀行來(lái)說(shuō),單純的滿(mǎn)足客戶(hù)需求,強(qiáng)調(diào)為所有客戶(hù)提供同樣優(yōu)質(zhì)的效勞,很可能是事倍功半,得不償失。從競(jìng)爭(zhēng)的角度看,一個(gè)真正有效的客戶(hù)關(guān)系管理策略應(yīng)該可以對(duì)客戶(hù)進(jìn)行細(xì)分,使銀行能夠?yàn)椴煌瑢哟蔚目蛻?hù)提供不同水平的效勞,并因此獲得最大的投入產(chǎn)出比。(李桂琴,2005)我們所熟悉的2/8法那么,在客戶(hù)關(guān)系管理中同樣適用,“20%的客戶(hù)為企業(yè)帶來(lái)80%的利潤(rùn)〞。不同客戶(hù)對(duì)銀行的奉獻(xiàn)程度不同,銀行需要區(qū)分不同客戶(hù)的價(jià)值,發(fā)現(xiàn)哪些客戶(hù)可以源源不斷地為企業(yè)創(chuàng)造價(jià)值和利益。因此,需要確定客戶(hù)的價(jià)值區(qū)間(例如大客戶(hù)、重要客戶(hù)、普通客戶(hù)、小客戶(hù)或特殊客戶(hù)等)對(duì)銀行來(lái)說(shuō)是非常有用的。2.2數(shù)據(jù)挖掘數(shù)據(jù)挖掘的概述所謂數(shù)據(jù)挖掘,是從海量的數(shù)據(jù)中,抽取出潛在的、有價(jià)值的知識(shí)(模型或規(guī)那么)的過(guò)程。也就是根據(jù)預(yù)定義的商業(yè)目標(biāo),對(duì)大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示其中隱含的商業(yè)規(guī)律,并進(jìn)一步將其模型化的先進(jìn)有效技術(shù)過(guò)程。數(shù)據(jù)挖掘是一門(mén)交叉學(xué)科.它集成了許多學(xué)科中成熟的工具和技術(shù),包括數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、模型識(shí)別、人工智能、神經(jīng)網(wǎng)絡(luò)等等。數(shù)據(jù)挖掘其實(shí)是一類(lèi)深層次的數(shù)據(jù)分析方法。由于各行業(yè)業(yè)務(wù)自動(dòng)化的實(shí)現(xiàn),商業(yè)領(lǐng)域產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)不再是為了分析的目的而收集的,而是由于純時(shí)機(jī)的商業(yè)運(yùn)作面產(chǎn)生。分析這些數(shù)據(jù)也不再是單純?yōu)榱搜芯康男枰?,更主要是為商業(yè)決策提供真正有價(jià)值的信息,進(jìn)而獲得利潤(rùn)。但所有企業(yè)面臨的一個(gè)共同問(wèn)題是:企業(yè)數(shù)據(jù)量非常大,而其中真正有價(jià)值的信息卻很少,因此從大量的數(shù)據(jù)中經(jīng)過(guò)深層分析,獲得有利于商業(yè)運(yùn)作、提高競(jìng)爭(zhēng)力的信息,就像從礦石中淘金一樣,數(shù)據(jù)挖掘也因此而得名?!睸.M.S.,2021)因此,數(shù)據(jù)挖掘可以描述為:按企業(yè)既定業(yè)務(wù)目標(biāo),對(duì)大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗(yàn)證的規(guī)律性,并進(jìn)一步將其模型化的先進(jìn)有效的方法??梢赃@樣概括:(1)指從數(shù)據(jù)〔大型數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)〕中提取隱含的、未知的、非平凡的及有潛在應(yīng)用價(jià)值的信息或模式的高級(jí)處理過(guò)程;(2)模式:即知識(shí),它給出了數(shù)據(jù)特性或數(shù)據(jù)之間的關(guān)系,是對(duì)數(shù)據(jù)所包含的信息更抽象的描述;(3)是一個(gè)過(guò)程,它利用一種或多種計(jì)算機(jī)學(xué)習(xí)技術(shù),從數(shù)據(jù)庫(kù)中的數(shù)據(jù)自動(dòng)分析并提取知識(shí),目的是確定數(shù)據(jù)確實(shí)趨勢(shì)和模式。數(shù)據(jù)挖掘涉及的學(xué)科領(lǐng)域和方法很多,有人工智能、數(shù)據(jù)統(tǒng)計(jì)、可視化、并行計(jì)算等,數(shù)據(jù)挖掘有多種分類(lèi)方法:A.根據(jù)挖掘任務(wù)的種類(lèi),可分為分類(lèi)模型發(fā)現(xiàn)、聚類(lèi)、關(guān)聯(lián)規(guī)那么發(fā)現(xiàn)、序列分析、偏差分析、數(shù)據(jù)可視化等。a.分類(lèi)(Classification)旨在生成一個(gè)分類(lèi)函數(shù)或分類(lèi)模型,該模型能把數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到給定類(lèi)別中的某一個(gè)。既可以用此模型分析已有的數(shù)據(jù),也可以用它來(lái)預(yù)測(cè)未來(lái)的數(shù)據(jù)。b.聚集(Clustering)聚集是對(duì)記錄分組,把相似的記錄放在一個(gè)聚集里。聚集和分類(lèi)的區(qū)別是聚集不依賴(lài)于預(yù)先定義好的類(lèi),不需要訓(xùn)練集。c.數(shù)據(jù)可視化(DescriptionandVisualization)數(shù)據(jù)可視化嚴(yán)格地講不是一個(gè)單獨(dú)的數(shù)據(jù)挖掘任務(wù),它被用來(lái)支持其他挖掘任務(wù)??梢暬遣捎脠D形、圖表等易于理解的方式表達(dá)數(shù)據(jù)挖掘結(jié)果。d.關(guān)聯(lián)規(guī)那么(AffinitygroupingorAssociationRules)關(guān)聯(lián)規(guī)那么是尋找數(shù)據(jù)庫(kù)中值的相關(guān)性,主要是尋找在同一個(gè)事件中出現(xiàn)的不同項(xiàng)的相關(guān)性,比方在一次購(gòu)置活動(dòng)中所買(mǎi)不同商品的相關(guān)性。e.序列分析(SequenceAnalysis)序列模式分析同樣也是試圖找出數(shù)據(jù)之間的聯(lián)系。但它的側(cè)重點(diǎn)在于分析數(shù)據(jù)之間前后(因果)關(guān)系,因此對(duì)數(shù)據(jù)往往要求引入時(shí)間屬性。序列模式分析非常適于尋找事物的發(fā)生趨勢(shì)或重復(fù)性模式。f.偏差分析(DeviationAnalysis)偏差分析是用來(lái)發(fā)現(xiàn)與正常情況不同的異常和變化,并進(jìn)一步分析這種變化是否是有意的詐騙行為,還是正常的變化。如果是異常行為,那么提示預(yù)防措施:如果是正常的變化,那么就需要更新數(shù)據(jù)庫(kù)記錄。B.根據(jù)挖掘方法的種類(lèi),可粗略地分為:機(jī)器學(xué)習(xí)方法、統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)方法、決策樹(shù)、可視化、最近鄰技術(shù)等。a.在機(jī)器學(xué)習(xí)中,可細(xì)分為歸納學(xué)習(xí)方法(決策樹(shù)、規(guī)那么歸納等自、基于范例學(xué)習(xí)、遺傳算法、進(jìn)化策略等;b.在統(tǒng)計(jì)方法中,可細(xì)分為:回歸分析(多元回歸、自回歸等)、判別分析(貝葉斯判別、費(fèi)歇爾判別、非參數(shù)判別等)、聚類(lèi)分析(系統(tǒng)聚類(lèi)、動(dòng)態(tài)聚類(lèi)等)、探索性分析(主元分析法、相關(guān)分析法等)等。2.2.2數(shù)據(jù)挖掘在客戶(hù)關(guān)系管理中的應(yīng)用途徑〔1〕客戶(hù)的獲取。分類(lèi)和聚類(lèi)等挖掘方法可以把大量的客戶(hù)分成不同的類(lèi)〔群體〕,適合于用來(lái)進(jìn)行客戶(hù)細(xì)分。通過(guò)群體細(xì)分,CRM用戶(hù)可以更好地理解客戶(hù),發(fā)現(xiàn)群體客戶(hù)的行為規(guī)律。在行為分組完成后,還要進(jìn)行客戶(hù)理解、客戶(hù)行為規(guī)律發(fā)現(xiàn)和客戶(hù)組之間的交叉分析?!?〕重點(diǎn)客戶(hù)發(fā)現(xiàn)。就是找出對(duì)企業(yè)具有重要意義的客戶(hù),重點(diǎn)客戶(hù)發(fā)現(xiàn)主要包括:發(fā)現(xiàn)有價(jià)值的潛在客戶(hù);發(fā)現(xiàn)有更多的消費(fèi)需求的同一客戶(hù);發(fā)現(xiàn)更多使用的同一種產(chǎn)品或效勞;保持客戶(hù)的忠誠(chéng)度。根據(jù)80/20〔即20%的客戶(hù)奉獻(xiàn)80%的銷(xiāo)售額〕以及開(kāi)發(fā)新客戶(hù)的費(fèi)用是保存老客戶(hù)費(fèi)用的5倍等營(yíng)銷(xiāo)原那么,重點(diǎn)客戶(hù)發(fā)現(xiàn)在客戶(hù)關(guān)系管理中具有舉足輕重的作用?!?〕交叉營(yíng)銷(xiāo)。商家與其客戶(hù)之間的商業(yè)關(guān)系是一種持續(xù)的不斷開(kāi)展的關(guān)系,通過(guò)不斷地相互接觸和交流,客戶(hù)得到了更好更貼切的效勞質(zhì)量,商家那么因?yàn)樵黾恿虽N(xiāo)售量而獲利。交叉營(yíng)銷(xiāo)指向已購(gòu)置商品的客戶(hù)推薦其它產(chǎn)品和效勞。有幾種挖掘方法都可以應(yīng)用于此問(wèn)題,關(guān)聯(lián)規(guī)那么分析能夠發(fā)現(xiàn)顧客傾向于關(guān)聯(lián)購(gòu)置哪些商品。聚類(lèi)分析能夠發(fā)現(xiàn)對(duì)特定產(chǎn)品感興趣的用戶(hù)群,神經(jīng)網(wǎng)絡(luò)、回歸等方法能夠預(yù)測(cè)顧客購(gòu)置該新產(chǎn)品的可能性?!?〕客戶(hù)流失分析。分類(lèi)等技術(shù)能夠判斷具備哪些特性的客戶(hù)群體最容易流失,建立客戶(hù)流失預(yù)測(cè)模型。從而幫助企業(yè)對(duì)有流失風(fēng)險(xiǎn)的顧客提前采取相應(yīng)營(yíng)銷(xiāo)措施。利用數(shù)據(jù)挖掘技術(shù),可以通過(guò)挖掘大量的客戶(hù)信息來(lái)構(gòu)建預(yù)測(cè)模型,較準(zhǔn)確地找出易流失客戶(hù)群,并制定相應(yīng)的方案,最大程度地保持住老客戶(hù)?!?〕性能評(píng)估。以客戶(hù)所提供的市場(chǎng)反響為根底,通過(guò)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)清潔與集中過(guò)程,將客戶(hù)對(duì)市場(chǎng)的反響自動(dòng)地輸入到數(shù)據(jù)倉(cāng)庫(kù)中,從而進(jìn)行客戶(hù)行為跟蹤。性能分析與客戶(hù)行為分析和重點(diǎn)客戶(hù)發(fā)現(xiàn)是相互交迭的過(guò)程,這樣才能保證企業(yè)的客戶(hù)關(guān)系管理能夠到達(dá)既定的目標(biāo),建立良好的客戶(hù)關(guān)系。分類(lèi)和聚類(lèi)等挖掘方法可以把大量的客戶(hù)分成不同的類(lèi)〔群體〕,適合于用來(lái)進(jìn)行客戶(hù)細(xì)分。通過(guò)群體細(xì)分,企業(yè)可以更好地理解客戶(hù),發(fā)現(xiàn)群體客戶(hù)的行為規(guī)律。在行為分組完成后,還要進(jìn)行客戶(hù)理解、客戶(hù)行為規(guī)律發(fā)現(xiàn)和客戶(hù)組之間的交叉分析;同時(shí)對(duì)客戶(hù)進(jìn)行細(xì)分,為客戶(hù)提供更多的個(gè)性化的效勞,弄清客戶(hù)流失原因,提前進(jìn)行預(yù)防,減少企業(yè)損失,為企業(yè)創(chuàng)造更多的利潤(rùn)。3數(shù)據(jù)挖掘方法在銀行客戶(hù)細(xì)分中的應(yīng)用3.1數(shù)據(jù)挖掘的一般過(guò)程〔1〕數(shù)據(jù)選擇:從現(xiàn)有數(shù)據(jù)中,選擇相關(guān)的數(shù)據(jù)確定哪些數(shù)據(jù)與本次數(shù)據(jù)分析相關(guān)的?!?〕數(shù)據(jù)預(yù)處理:對(duì)于選擇出的數(shù)據(jù),進(jìn)行“清洗〞工作,將數(shù)據(jù)轉(zhuǎn)變?yōu)椤案蓛舁晹?shù)據(jù)。〔3〕數(shù)據(jù)轉(zhuǎn)換:將“干凈〞數(shù)據(jù)轉(zhuǎn)換成數(shù)據(jù)挖掘算法所需要的格式?!?〕數(shù)據(jù)挖掘:使用適宜的數(shù)據(jù)挖掘算法完成數(shù)據(jù)分析?!?〕解釋與評(píng)估:使用適當(dāng)?shù)目梢暬夹g(shù)和知識(shí)表示技術(shù)將模式以適宜的形式提供應(yīng)用戶(hù),讓用戶(hù)對(duì)模型結(jié)果作出解釋?zhuān)瑫r(shí)能夠評(píng)估模型的有效性。3.2客戶(hù)分類(lèi)指標(biāo)的建立商業(yè)銀行個(gè)人客戶(hù)常用的細(xì)分方法有:〔1〕按數(shù)據(jù)屬性分類(lèi)用于商業(yè)銀行個(gè)人客戶(hù)細(xì)分的數(shù)據(jù)包括客戶(hù)的根本屬性數(shù)據(jù)、銀行業(yè)務(wù)屬性數(shù)據(jù)、資信屬性數(shù)據(jù)等:客戶(hù)的根本屬性數(shù)據(jù)。個(gè)人客戶(hù)根本屬性數(shù)據(jù)用于描述個(gè)人客戶(hù)的身份、職業(yè)、家庭成員、經(jīng)濟(jì)狀況等方面的情況,將其劃分為客戶(hù)身份信息、職業(yè)信息、家庭成員信息、家庭根本經(jīng)濟(jì)信息等四局部。個(gè)人客戶(hù)身份信息包括:地區(qū)、姓名、性別、證件類(lèi)型、證件號(hào)碼、民族、出生日期、國(guó)籍、戶(hù)口所在地、婚姻狀況、文化程度、號(hào)、家庭、電予信箱、家庭地址、、宅電等。職業(yè)信息包括:職業(yè)、工作單位、單位類(lèi)型、單位性質(zhì)、行政級(jí)別(職務(wù))、單位、單位地址、技術(shù)職稱(chēng)等。家庭成員信息包括:是否有配偶、配偶姓名、配偶證件名稱(chēng)、配偶證件號(hào)碼、配偶聯(lián)系、配偶工作單位、配偶月均收入、配偶地區(qū)號(hào)、子女姓名、子女證件名稱(chēng)、子女證件號(hào)碼、子女聯(lián)系、子女工作單位等。根本經(jīng)濟(jì)信息包括:健康狀況、供養(yǎng)人口、月收入、月供額、住宅狀況、住宅入住時(shí)間、現(xiàn)住房建筑面積、現(xiàn)住房性質(zhì)、納稅號(hào)、社會(huì)保險(xiǎn)號(hào)、深市股東代碼、滬市股東代碼、證券保證金帳號(hào)、持卡數(shù)量、擔(dān)保數(shù)量等。B.銀行業(yè)務(wù)屬性數(shù)據(jù)。銀行業(yè)務(wù)屬性數(shù)據(jù)主要是描述個(gè)人客戶(hù)在商業(yè)銀行進(jìn)行業(yè)務(wù)的相關(guān)數(shù)據(jù),分為資產(chǎn)數(shù)據(jù)、負(fù)債數(shù)據(jù)、銀行卡數(shù)據(jù)、中間業(yè)務(wù)數(shù)據(jù)四類(lèi)。資產(chǎn)數(shù)據(jù)用于描述客戶(hù)在銀行的各項(xiàng)存款(活期存款、通知存款、定期存單、定期一本通、存本取息、零存整取、定活二便等)、投資(記名國(guó)庫(kù)券)等數(shù)據(jù)。負(fù)債數(shù)據(jù)用于描述客戶(hù)在銀行辦理的各類(lèi)貸款負(fù)債信息及為他人擔(dān)保負(fù)債(或有負(fù)債)信息,包括住房貸款、個(gè)人消費(fèi)貸款等的余額、發(fā)生額等數(shù)據(jù)。銀行卡數(shù)據(jù)用于描述客戶(hù)所擁有的銀行借記卡、貸記卡的數(shù)目、卡號(hào)、卡內(nèi)余額、卡消費(fèi)余額、卡的各類(lèi)標(biāo)志等數(shù)據(jù)。中間業(yè)務(wù)數(shù)據(jù)用于描述客戶(hù)在銀行進(jìn)行相關(guān)中間業(yè)務(wù)效勞時(shí)產(chǎn)生的數(shù)據(jù),包括基金的購(gòu)置、本外幣理財(cái)產(chǎn)品的購(gòu)置、保險(xiǎn)產(chǎn)品的購(gòu)置等業(yè)務(wù)數(shù)據(jù)。C.資信屬性數(shù)據(jù)。資信屬性數(shù)據(jù),主要是描述個(gè)人客戶(hù)的信用情況,不僅包括在本銀行的數(shù)據(jù),還包括在其他銀行以及社會(huì)其他地方的信用信息,如:本銀行的黑名單信息、中國(guó)人民銀行的黑名單信息、上海聯(lián)合征信系統(tǒng)的信息等。〔2〕按客戶(hù)各類(lèi)特征分類(lèi),如表1所示:A.社會(huì)階層的細(xì)分〔環(huán)境細(xì)分,人口統(tǒng)計(jì)細(xì)分〕:收入,工作年限,住房面積等;行為因素的細(xì)分:購(gòu)置行為與反響行為;心理細(xì)分:生活方式細(xì)分〔活動(dòng)、興趣、評(píng)價(jià)〕,利益細(xì)分〔尋求的利益〕;表1.細(xì)分方法與各種因素的對(duì)應(yīng)關(guān)系Tab1.SubdivisionCorrespondencewithavarietyofFactors人口統(tǒng)計(jì)細(xì)分行為細(xì)分心理細(xì)分生活方式細(xì)分利益細(xì)分維度特征人口特征行為特征心理特征心理特征緯度內(nèi)涵各種外部特征購(gòu)置行為,反響行為活動(dòng)-興趣-評(píng)價(jià)尋求的利益細(xì)分依據(jù)人口-需求行為-行為行為-態(tài)度-心理-行為利益-心理-行為方法論事前細(xì)分事前細(xì)分事后細(xì)分細(xì)分目標(biāo)了解市場(chǎng)結(jié)構(gòu)其他方法的補(bǔ)充產(chǎn)品定位、定價(jià)決策、客戶(hù)關(guān)系管理新產(chǎn)品引入策略,廣告策略及其他各種營(yíng)銷(xiāo)策略〔數(shù)據(jù)來(lái)源:劉英姿等,客戶(hù)細(xì)分方法研究綜述〕3.3客戶(hù)數(shù)據(jù)的選擇和準(zhǔn)備數(shù)據(jù)選擇從現(xiàn)有數(shù)據(jù)中,選擇相關(guān)的數(shù)據(jù)確定哪些數(shù)據(jù)與本次數(shù)據(jù)分析相關(guān)的。本文采用第二種分類(lèi)方式,結(jié)合表1的人口特征、行為特征和心理特征的維度,從客戶(hù)各種特征的相對(duì)重要程度考慮,本文選取“人口特征〞和“行為特征〞中的“性別〞,“年齡〞,“年收入〞,“信用信息是否列入黑名單〞和“主要購(gòu)置方式〞這五個(gè)重要程度較高的特征作為數(shù)據(jù)挖掘的五個(gè)參數(shù)變量,并選取客戶(hù)這五個(gè)方面的數(shù)據(jù)。數(shù)據(jù)預(yù)處理對(duì)于選擇出的數(shù)據(jù),進(jìn)行“清洗〞工作,將數(shù)據(jù)轉(zhuǎn)變?yōu)椤案蓛舁晹?shù)據(jù)。去除數(shù)據(jù)中的無(wú)關(guān)數(shù)據(jù)項(xiàng)、缺省數(shù)據(jù)項(xiàng)和重復(fù)數(shù)據(jù)項(xiàng)。本文選取預(yù)處理后客戶(hù)數(shù)據(jù)如表2所示:表2.客戶(hù)數(shù)據(jù)Tab2.CustomersDate特征分類(lèi)人口特征行為特征心理特征客戶(hù)編號(hào)性別年齡年收入〔K〕信用信息是否列入黑名單主要購(gòu)置方式興趣愛(ài)好1F3540否借記卡羽毛球2F5589否現(xiàn)金網(wǎng)球3M2539否網(wǎng)銀游泳4M3559否網(wǎng)銀上網(wǎng)5M4061是借記卡乒乓球6M4545否現(xiàn)金羽毛球7F4032否現(xiàn)金網(wǎng)球8M4244否借記卡網(wǎng)球9M4340否網(wǎng)銀羽毛球10F3860否借記卡乒乓球11F5525否現(xiàn)金網(wǎng)球12M3539否借記卡網(wǎng)球13M2739否網(wǎng)銀網(wǎng)球14F4340是借記卡羽毛球15F4152否借記卡網(wǎng)球16M4358是現(xiàn)金游泳17F2970否網(wǎng)銀羽毛球18F3961是借記卡網(wǎng)球19M5552否現(xiàn)金游泳20F1930是借記卡網(wǎng)球數(shù)據(jù)轉(zhuǎn)換 將“干凈〞數(shù)據(jù)轉(zhuǎn)換成數(shù)據(jù)挖掘算法所需要的格式。對(duì)客戶(hù)數(shù)據(jù)進(jìn)行處理準(zhǔn)換數(shù)據(jù)挖掘所需格式,選取其中“人口特征〞和“行為特征〞中的“性別〞,“年齡〞,“年收入〞,“信用信息是否列入黑名單〞和“主要購(gòu)置方式〞這五項(xiàng)作為變量,并將非數(shù)值類(lèi)的變量進(jìn)行編碼,性別特征中“F〞編碼為1,“M〞編碼為0;信用信息是否列入黑名單特征中“是〞編碼為1,“否〞編碼為0;主要購(gòu)置方式中“借記卡〞編碼為1,“現(xiàn)金〞編碼為2,“網(wǎng)銀〞編碼為3。得出以下可直接用于數(shù)據(jù)挖掘的數(shù)據(jù)格式,如表3所示:表3.用于數(shù)據(jù)挖掘的數(shù)據(jù)Tab3.DateofDateMining特征分類(lèi)人口特征行為特征客戶(hù)編號(hào)性別年齡年收入〔K〕信用信息是否列入黑名單主要購(gòu)置方式1135400121558902302539034035590350406111604545027140320280424401904340031013860011115525021203539011302739031414340111514152011604358121712970031813961111905552022011930113.4數(shù)據(jù)挖掘數(shù)據(jù)挖掘使用的算法對(duì)客戶(hù)數(shù)據(jù)進(jìn)行挖掘,需要是使用適宜的數(shù)據(jù)挖掘算法完成數(shù)據(jù)分析。為到達(dá)客戶(hù)細(xì)分的目的,依據(jù)客戶(hù)細(xì)分的要求和特點(diǎn),本文采用聚類(lèi)分析的方法進(jìn)行數(shù)據(jù)挖掘。聚集(Clustering),是對(duì)記錄分組,把相似的記錄放在一個(gè)聚集里。聚集和分類(lèi)的區(qū)別是聚集不依賴(lài)于預(yù)先定義好的類(lèi),不需要訓(xùn)練集,在同一個(gè)類(lèi)內(nèi)對(duì)象之間具有較高的相似度,不同類(lèi)之間的對(duì)象差異較大。符合客戶(hù)細(xì)分的要求和特點(diǎn)。〔毛國(guó)君,2005〕聚類(lèi)是無(wú)指導(dǎo)的學(xué)習(xí)方法,它區(qū)別于分類(lèi)。分類(lèi)是按照一定的標(biāo)準(zhǔn)或規(guī)那么,將事物歸屬到某個(gè)事先的類(lèi)別之中。而聚類(lèi)是分析事物的內(nèi)在特點(diǎn)或規(guī)律,根據(jù)最大化類(lèi)內(nèi)的相似性和最小化類(lèi)間的相似性的原那么,對(duì)事物進(jìn)行分組。聚類(lèi)分析〔ClusterAnalysis〕是研究“物以類(lèi)聚〞問(wèn)題的一種統(tǒng)計(jì)分析方法。對(duì)于已經(jīng)給出的數(shù)據(jù),沒(méi)有先驗(yàn)知識(shí)的前提下自動(dòng)進(jìn)行分類(lèi)。其中包括快速聚類(lèi)分析法(K-meanClusterAnalysis)和層次聚類(lèi)分析法〔HierarchicalClusterAnalysis〕。(1)K-mean算法的根本原理和挖掘步驟A.根本原理:給定一個(gè)包含n個(gè)數(shù)據(jù)對(duì)象的數(shù)據(jù)庫(kù),以及要生成的簇的數(shù)目k,一個(gè)劃分類(lèi)的算法將數(shù)據(jù)對(duì)象組織為k個(gè)劃分(k<n),其中每個(gè)劃分代表一個(gè)簇,同時(shí)滿(mǎn)足:a.每個(gè)簇至少包含一個(gè)樣本;b.每個(gè)樣本必須屬于且僅屬于一個(gè)簇〔通常會(huì)采用一個(gè)劃分準(zhǔn)那么(稱(chēng)為相似度函數(shù)),例如距離。〕。B.挖掘步驟:a.隨機(jī)地選擇k個(gè)對(duì)象,每個(gè)對(duì)象初始地代表了一個(gè)簇的平均值或中心(質(zhì)心);b.對(duì)剩余的每個(gè)對(duì)象,根據(jù)其與各個(gè)質(zhì)心的距離(一般用歐氏距離),將它賦給最近的簇;c.重新計(jì)算每個(gè)簇的質(zhì)心。這個(gè)過(guò)程不斷重復(fù),直到準(zhǔn)那么函數(shù)收斂。通常采用平方誤差準(zhǔn)那么:其中,E是數(shù)據(jù)庫(kù)中所有對(duì)象的平方誤差總和,p是空間中的點(diǎn),表示給定的數(shù)據(jù)對(duì)象,mj是簇Cj的平均值。(2)層次聚類(lèi)分析法的根本原理和挖掘步驟A.根本原理:層次聚類(lèi)分析法分為自底向上和自頂向下兩種挖掘策略:自底向上的策略首先將每個(gè)對(duì)象作為一個(gè)簇,然后合并這些原子簇為越來(lái)越大的簇,直到所有的對(duì)象都在一個(gè)簇中,或者某個(gè)終結(jié)條件被滿(mǎn)足。絕大多數(shù)層次聚類(lèi)方法屬于這一類(lèi)。自頂向下的策略與凝聚的層次聚類(lèi)相反,它首先將所有對(duì)象置于一個(gè)簇中,然后逐漸細(xì)分為越來(lái)越小的簇,直到每個(gè)對(duì)象自成一簇,或都到達(dá)了某個(gè)終結(jié)條件,例如到達(dá)了某個(gè)希望的簇?cái)?shù)目,或者兩個(gè)最近的簇之間的距離超過(guò)了某個(gè)閾值。B.挖掘步驟,以自底向上聚類(lèi)分析方法為例:a.初始化:計(jì)算包含每對(duì)樣本間距離(如歐氏距離)的相似矩陣,把每個(gè)樣本作為一個(gè)簇;b.選擇:使用相似矩陣查找最相似的兩個(gè)簇;c.更新:將兩個(gè)簇合并為一個(gè)簇,簇的個(gè)數(shù)通過(guò)合并被更新;同時(shí)更新相似矩陣,將兩個(gè)簇的兩行(兩列)距離用1行(1列)距離替換反映合并操作;d.重復(fù):執(zhí)行n-1次步驟2和步驟3;e.結(jié)束:當(dāng)所有樣本都合并成一個(gè)簇或滿(mǎn)足指定的簇的數(shù)目時(shí),整個(gè)過(guò)程結(jié)束。3.4.2K-mean算法的挖掘過(guò)程本文的數(shù)據(jù)挖掘過(guò)程借助SPSSStatistics軟件進(jìn)行,對(duì)20名客戶(hù)進(jìn)行分類(lèi),取K值為3,即將客戶(hù)分為三類(lèi)?!?〕數(shù)據(jù)輸入,變量設(shè)置。將選取的20名客戶(hù)5個(gè)指標(biāo)的數(shù)據(jù)輸入SPSS統(tǒng)計(jì)軟件,將客戶(hù)編號(hào)項(xiàng)設(shè)置為名義量,“性別〞,“年齡〞,“年收入〞,“信用〞,“主要購(gòu)置方式〞這5項(xiàng)指標(biāo)依次設(shè)置為x1,x2,x3,x4,x5這5個(gè)數(shù)值型變量?!?〕選擇工具欄中“分析〞項(xiàng),再選“分類(lèi)〞中的“K均值聚類(lèi)〞,如圖1所示?!?〕在K均值分析的選項(xiàng)框中,將x1,x2,x3,x4,x5拖入變量區(qū)域,在“保存〞中,選擇保存“聚類(lèi)成員〞與“聚類(lèi)中心的距離〞;選擇聚類(lèi)數(shù)為3,方法為“迭代與分類(lèi)〞,如圖2所示?!?〕軟件輸出聚類(lèi)結(jié)果的文檔。(上圖)圖1.數(shù)據(jù)輸入和變量設(shè)置Fig1.DateInputandVariableSetUp〔上圖〕圖2.K均值聚類(lèi)分析選項(xiàng)框Fig2.TableofK-meanClusterK-mean算法的數(shù)據(jù)挖掘的結(jié)果K-mean算法數(shù)據(jù)挖掘結(jié)果如下表4所示,其中包括初始聚類(lèi)中心,迭代歷史記錄,每個(gè)聚類(lèi)中的案例說(shuō)和K=3時(shí)的聚類(lèi)成員。將20名客戶(hù)數(shù)據(jù)聚類(lèi)為3簇時(shí)的結(jié)果:表4.K-mean聚類(lèi)結(jié)果Tab.4ResultsofK-meanCluster聚類(lèi)成員案例號(hào)聚類(lèi)距離117.3512228.023313.800428.169524.585633.8267310.777834.543933.1051025.83311318.8321217.0461312.3751433.06415311.6891628.10817211.8511824.64719314.35820111.876層次聚類(lèi)算法的挖掘過(guò)程利用層次聚類(lèi)算法不僅可以對(duì)客戶(hù)進(jìn)行聚類(lèi),同時(shí)也可以對(duì)變量進(jìn)行聚類(lèi),這是層次聚類(lèi)算法區(qū)別于K-mean算法的一點(diǎn),即對(duì)個(gè)案分群和對(duì)變量分群。A.對(duì)個(gè)案分群,即客戶(hù)分群:層次聚類(lèi)法對(duì)20名客戶(hù)的聚類(lèi)過(guò)程與K-mean算法類(lèi)似:〔1〕數(shù)據(jù)輸入,變量設(shè)置。將選取的20名客戶(hù)5個(gè)指標(biāo)的數(shù)據(jù)輸入SPSS統(tǒng)計(jì)軟件,將客戶(hù)編號(hào)項(xiàng)設(shè)置為名義量,“性別〞,“年齡〞,“年收入〞,“信用〞,“主要購(gòu)置方式〞這5項(xiàng)指標(biāo)依次設(shè)置為x1,x2,x3,x4,x5這5個(gè)數(shù)值型變量?!?〕選擇工具欄中“分析〞項(xiàng),再選“分類(lèi)〞中的“系統(tǒng)聚類(lèi)〞?!?〕在系統(tǒng)聚類(lèi)分析的選項(xiàng)框中,將x1,x2,x3,x4,x5拖入變量區(qū)域,〞并將字符串型客戶(hù)編號(hào)拖入“標(biāo)注個(gè)案〞,分群選擇“個(gè)案〞,輸出統(tǒng)計(jì)量和圖,如圖3所示,同時(shí)在方法選項(xiàng)中選擇聚類(lèi)方法為組間聯(lián)接,度量標(biāo)準(zhǔn)選擇“區(qū)間〞中的Pearson相關(guān)性,如圖4所示?!?〕軟件輸出個(gè)案聚類(lèi)結(jié)果的文檔。B.對(duì)變量分群過(guò)程與對(duì)個(gè)案分群一樣,只是在分群選擇為“變量〞這一個(gè)選項(xiàng)上不同。(上圖)圖3.系統(tǒng)聚類(lèi)分析框Fig3.SystemClusterAnalysisBox〔上圖〕圖4.系統(tǒng)聚類(lèi)分析方法Fig4.MethodsofSystemClusterAnalysis層次聚類(lèi)算法的數(shù)據(jù)挖掘結(jié)果A.對(duì)個(gè)案的聚類(lèi)結(jié)果如以下圖5所示:〔上圖〕圖5.個(gè)案聚類(lèi)圖Fig5.CaseClusterDiagramB.對(duì)變量聚類(lèi)的結(jié)果,如圖6所示〔上圖〕圖6.變量聚類(lèi)圖Fig6.VariableClusterDiagram在得出5個(gè)變量的相似矩陣后,對(duì)近似矩陣做均值分析,可以確定這5個(gè)變量中的最典型變量,即均差值最大的變量。過(guò)程簡(jiǎn)述為:在界面中輸入近似矩陣數(shù)據(jù),選擇工具欄中“分析〞,選取“比擬均值〞功能中的單樣本T檢驗(yàn)方法如以下圖7,得結(jié)果如表5所示。〔上圖〕圖7.近似矩陣單樣本T檢驗(yàn)Fig7.RelativeMatrixT-test表5.近似矩陣單樣本T檢驗(yàn)結(jié)果Tab5.ResultsofRelativeMatrixT-test單個(gè)樣本檢驗(yàn)檢驗(yàn)值=0差分的95%置信區(qū)間tdfSig.(雙側(cè))均值差值下限上限x1.7504.495.168800-.45614.79374x2.9604.391.202400-.38289.78769x31.5744.191.286400-.21872.79152x4.4914.649.117800-.54783.78343x5.1254.907.032200-.68311.747513.5解釋與評(píng)估,結(jié)果轉(zhuǎn)換對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋和評(píng)價(jià)A.本文利用K-mean算法得出的數(shù)據(jù)挖掘結(jié)果即,將20名客戶(hù)聚為三類(lèi),其中第一類(lèi)包含5個(gè)客戶(hù),相應(yīng)客戶(hù)編號(hào)分別為:1,3,12,13,20;第二類(lèi)包含7個(gè)客戶(hù),相應(yīng)客戶(hù)編號(hào)分別為:2,4,5,10,16,17,18;第三類(lèi)包含8個(gè)客戶(hù),相應(yīng)客戶(hù)編號(hào)分別為:6,7,8,9,11,14,15,19。對(duì)聚類(lèi)結(jié)果的類(lèi)別間距離進(jìn)行方差分析結(jié)果說(shuō)明,類(lèi)別間距離差異的概率值均<0.001,聚類(lèi)效果較好。B.利用層次聚類(lèi)法對(duì)個(gè)案聚類(lèi),即對(duì)客戶(hù)聚類(lèi)得出的數(shù)據(jù)挖掘結(jié)果即:對(duì)個(gè)案的結(jié)果解釋和評(píng)價(jià)與K-mean算法中聚類(lèi)結(jié)果類(lèi)似,即聚類(lèi)后客戶(hù)被分為指定個(gè)數(shù)的群體,每個(gè)群體中包含的客戶(hù)數(shù)和客戶(hù)相應(yīng)的編號(hào);對(duì)變量聚類(lèi)得出的結(jié)果即:變量聚為一類(lèi)其近似矩陣中行相似度系數(shù)最大為0.245,然后聚為一類(lèi),其近似矩陣中行相似度系數(shù)第二大為0.115,然后x2與x3的類(lèi)與x1和x4的類(lèi)合并,形成一個(gè)二階類(lèi),這個(gè)類(lèi)最后與x5聚類(lèi)為一個(gè)類(lèi)。3.5.2挖掘結(jié)果轉(zhuǎn)換A.根據(jù)K-mean算法最終聚類(lèi)中心〔表6〕和每個(gè)聚類(lèi)中的案例數(shù)〔表4〕的結(jié)果顯示,假設(shè)把這20個(gè)客戶(hù)分成3類(lèi)。第一類(lèi)客戶(hù)數(shù)量最少,第二類(lèi)客戶(hù)較多,第三類(lèi)客戶(hù)數(shù)最多。5個(gè)變量平行比擬,x1,x5變量的聚類(lèi)中心差異相對(duì)較小,x2,x3,x4,特別是x3變量的聚類(lèi)中心差異較大,區(qū)別最為明顯。根據(jù)1,2,3類(lèi)中心的x2,x3,x4大小,可以把這三類(lèi)分別年輕收入較低群信用一般群,中年高收入信用較差群體和年齡較大的中等收入信用較好群。x1,x5代表的性別和購(gòu)置方式對(duì)群體之間的區(qū)分度不大,所以在定義群的時(shí)候可以作為次要考慮條件。表6.最終聚類(lèi)中心Tab6.FanalClusterCenter聚類(lèi)123x10.40.570.5x228.239.8645.5x337.465.4341.25x40.20.430.13x51.81.861.75B.根據(jù)層次聚類(lèi)分析方法,對(duì)個(gè)案聚類(lèi)和對(duì)變量的聚類(lèi)結(jié)果如下:對(duì)個(gè)案的解釋與K-mean算法中聚類(lèi)結(jié)果類(lèi)似,即聚類(lèi)后將客戶(hù)分為指定群,并確定該群的主要群體特性,此處不再贅述。對(duì)變量聚類(lèi)結(jié)果的轉(zhuǎn)換:在近似矩陣中〔表7〕中可以看到,x2與x3對(duì)應(yīng)的特征為年齡和年收入,這兩個(gè)特征相關(guān)度最大;其次是x1與x4對(duì)應(yīng)的特征性別和和信用特征,相關(guān)度其次;最后前面兩對(duì)特征聚合為一個(gè)類(lèi)與x5對(duì)應(yīng)的特征即購(gòu)置方式進(jìn)行結(jié)合,形成一個(gè)類(lèi)。(見(jiàn)圖6)表7.近似矩陣Tab7.RelativeMatrix案例矩陣文件輸入x1x2x3x4x5x11.000.021.077.115-.369x2.0211.000.245-.148-.106x3.077.2451.000.048.062x4.115-.148.0481.000-.426x5-.369-.106.062-.4261.000同時(shí),對(duì)變量近似矩陣的均值差值檢驗(yàn),即單樣本T檢驗(yàn)的結(jié)果(表8)中,可以看出,x3變量的均值差值最大,為0.2864,其次是x2,x1,x4,x5;這、同時(shí),根據(jù)差分的95%置信區(qū)間的下限和上限,可以得出5個(gè)變量的均值差值都可信,并且可以把x3即年收入作為最典型的聚類(lèi)指標(biāo)。確定年收入為最典型的聚類(lèi)變量,另外四個(gè)按典型程度遞減分別為:年齡,性別,信用,購(gòu)置方式。表8.單個(gè)樣本檢驗(yàn)Tab8.T-test檢驗(yàn)值=0差分的95%置信區(qū)間tdfSig.(雙側(cè))均值差值下限上限x10.7540.4950.1688-0.456140.79374x20.9640.3910.2024-0.382890.78769x31.57440.1910.2864-0.218720.79152x40.49140.6490.1178-0.547830.78343x50.12540.9070.0322-0.683110.747513.6知識(shí)運(yùn)用A.利用K-mean算法進(jìn)行的數(shù)據(jù)挖掘:根據(jù)結(jié)果解釋?zhuān)梢苑謩e對(duì)聚類(lèi)后的三個(gè)群體實(shí)施不同的客戶(hù)營(yíng)銷(xiāo)策略,例如:對(duì)收入較低年輕群信用一般群體,這一類(lèi)是銀行有待開(kāi)掘其客戶(hù)價(jià)值和潛質(zhì)的人群,可以向這類(lèi)群體可以提供最新的同時(shí)帶有優(yōu)惠的營(yíng)銷(xiāo)產(chǎn)品,既可以用新鮮的產(chǎn)品吸引年輕人的眼球,也能用優(yōu)惠之便為收入較低的人群省去一筆費(fèi)用;對(duì)高收入中年群體信用較差群體,這一類(lèi)是銀行需要重點(diǎn)保持的優(yōu)質(zhì)客戶(hù)群,可以向這類(lèi)人群提供高端的營(yíng)銷(xiāo)產(chǎn)品和專(zhuān)門(mén)的VIP效勞,即能滿(mǎn)足高收入者的高端產(chǎn)品需求,也能讓其享受VIP待遇,滿(mǎn)足中年人社會(huì)尊重的需求;對(duì)中等收入年齡較大的群信用較好群體,這類(lèi)人群數(shù)量最多,是銀行需要保持提升其客戶(hù)價(jià)值的群體,可以先用優(yōu)惠的營(yíng)銷(xiāo)策略吸引客戶(hù)并讓其體驗(yàn)高端客戶(hù)的待遇,將其向高端客戶(hù)引導(dǎo);B.利用層次聚類(lèi)算法進(jìn)行的數(shù)據(jù)挖掘結(jié)果的策略:根據(jù)變量的典型程度,確定“年收入〞為最典型的聚類(lèi)變量,這與我們實(shí)際中的情況是相符的。然后依次是“年齡〞,“性別〞,“信用〞,“購(gòu)置方式〞。通過(guò)變量的聚類(lèi)可以選取大量客戶(hù)數(shù)據(jù)變量中的最典型的幾個(gè)變量作為細(xì)分的變量。同時(shí),以本文為例根據(jù)5個(gè)變量均值差值,可以設(shè)計(jì)出這5個(gè)變量的權(quán)重,對(duì)已挖掘數(shù)據(jù)進(jìn)行加權(quán),并在已有的聚類(lèi)結(jié)果中,獲得劃分類(lèi)的臨界值,可以對(duì)新參加的客戶(hù)數(shù)據(jù)進(jìn)行加權(quán)值的判別,假設(shè)有三類(lèi),加權(quán)值越高的就屬于優(yōu)質(zhì)客戶(hù),然后是普通客戶(hù),最后是有待開(kāi)掘價(jià)值的客戶(hù)。4結(jié)束語(yǔ)隨著改革開(kāi)放的不斷深入,市場(chǎng)間的競(jìng)爭(zhēng)不斷的劇烈,銀行或者說(shuō)一般企業(yè)為了不斷的提高自身競(jìng)爭(zhēng)能力,獲得更大的效益面對(duì)如何更深刻地理解客戶(hù),如何實(shí)現(xiàn)存量客戶(hù)的流失保有,如何挖掘增量潛在客戶(hù),如何進(jìn)行交叉銷(xiāo)售提升客戶(hù)價(jià)值,如何進(jìn)行欺詐識(shí)別防范經(jīng)營(yíng)風(fēng)險(xiǎn),如何推出適合客戶(hù)消費(fèi)特點(diǎn)的產(chǎn)品及套餐等這一系列的問(wèn)題時(shí),數(shù)據(jù)挖掘技術(shù)在解決這些問(wèn)題方面就凸顯出其它方法無(wú)與倫比的優(yōu)勢(shì)。大量事實(shí)說(shuō)明在客戶(hù)關(guān)系管理的客戶(hù)細(xì)分中,聚類(lèi)分析是一種非常有效而實(shí)用的技術(shù)。聚類(lèi)分析等技術(shù)的成功運(yùn)用必將有力地推動(dòng)客戶(hù)關(guān)系管理的開(kāi)展。然而,我們也應(yīng)當(dāng)認(rèn)識(shí)到聚類(lèi)分析可以為客戶(hù)細(xì)分提供支持,但這種細(xì)分并不等同于商業(yè)領(lǐng)域的細(xì)分,因?yàn)榧兇獾氖褂梅椒赡苓€起不到很好推動(dòng)企業(yè)的作用,還需要結(jié)合對(duì)特定行業(yè)深刻的商業(yè)理解。本文在選取客戶(hù)的特征項(xiàng)和客戶(hù)數(shù)據(jù)時(shí),樣本較少,客戶(hù)數(shù)據(jù)不能真實(shí)或者全面的反響客戶(hù)的實(shí)際情況,在選取客戶(hù)的特征項(xiàng)時(shí)也并不能代表客戶(hù)所有的重要特征。所以面對(duì)具體的銀行客戶(hù)細(xì)分問(wèn)題,還必須結(jié)合實(shí)際情況進(jìn)行討論。例如:銀行的開(kāi)展戰(zhàn)略和客戶(hù)關(guān)系管理策略,客戶(hù)的分布是否均勻,客戶(hù)數(shù)據(jù)是否能滿(mǎn)足模型所需的全部信息等。本文利用數(shù)據(jù)挖掘的算法對(duì)銀行客戶(hù)進(jìn)行細(xì)分,目的是建立這種模式和方法,為銀行客戶(hù)關(guān)系管理提供決策支持,但不是唯一的要素,只能作為借鑒供銀行參考。另外,單純的聚類(lèi)分析不能全面反映客戶(hù)在整個(gè)生命周期對(duì)于企業(yè)的價(jià)值,最好與時(shí)間序列分析等技術(shù)結(jié)合使用。最后,企業(yè)要想使聚類(lèi)分析技術(shù)能夠真正地發(fā)揮作用還必須結(jié)合企業(yè)和市場(chǎng)的實(shí)際情況,通過(guò)對(duì)不同聚類(lèi)方法所產(chǎn)生結(jié)果的比擬以及可視化聚類(lèi)結(jié)果,使管理層可以充分理解并且善加利用,從而從真正意義上推動(dòng)企業(yè)客戶(hù)關(guān)系管理的成功實(shí)施。參考文獻(xiàn)1.李莉.論CRM在現(xiàn)階段商業(yè)銀行的應(yīng)用.[碩士學(xué)位論文].武漢:華中農(nóng)業(yè)大學(xué)圖書(shū)館,20062.陳宏凱.基于BI的商業(yè)銀行個(gè)人客戶(hù)分類(lèi)研究及系統(tǒng)設(shè)計(jì).[碩士學(xué)位].武漢:華中農(nóng)業(yè)大學(xué)圖書(shū)館,20063.鄒江、張維然:?中外商業(yè)銀行收入結(jié)構(gòu)比擬研究?,載?國(guó)際金融研究?,2004年第12期4.JoePeppardCustomerRelationshipManagement(CRM)inFinancialServices2000(03)5.李桂琴我國(guó)銀行業(yè)競(jìng)爭(zhēng)格局分析和國(guó)有商業(yè)銀行應(yīng)對(duì)策略研究[期刊論文]-金融論壇2005(4)6.毛國(guó)君.段立娟.王實(shí)數(shù)據(jù)挖掘原理與算法20057.田宏鐘.基于數(shù)據(jù)挖掘的證券業(yè)客戶(hù)關(guān)系管理中的客戶(hù)細(xì)分研究.[碩士學(xué)位論文].武漢:華中農(nóng)業(yè)大學(xué)圖書(shū)館,20058.費(fèi)賢舉,王文琴,莊燕濱.基于關(guān)聯(lián)規(guī)那么的數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用研究.常州工學(xué)院學(xué)報(bào).2005.18(4).2-39.Lazer,William,Lifestyleconceptandmarketing,TowardScientificmarketing[M].StephenGreyser,ed,Chicago:AmericanMarketingAssn.,1963:130.10.劉英姿,吳昊.客戶(hù)細(xì)分方法研究綜述.管理工程學(xué)報(bào),2006,1:53-5411.S.M.S.Hosseinietal.ClusteranalysisusingdataminingapproachtodevelopCRMmethodologytoassessthecustomerloyalty.ExpertSystemswithApplications37(2021)5259–526412.管進(jìn)勇.數(shù)據(jù)挖掘在銀行個(gè)人優(yōu)質(zhì)客戶(hù)管理中的應(yīng)用研究.[碩士學(xué)位論文].武漢:華中農(nóng)業(yè)大學(xué)圖書(shū)館,202113.李欣.商業(yè)銀行客戶(hù)細(xì)分模型的建立與應(yīng)用.統(tǒng)計(jì)與決策.2021(9):144-14514.趙保國(guó).顧客細(xì)分模型及實(shí)證研究.財(cái)經(jīng)問(wèn)題研究.2006(7):85-8715.萬(wàn)定生,劉聰,劉遠(yuǎn)生.數(shù)據(jù)挖掘技術(shù)在銀行客戶(hù)細(xì)分中的應(yīng)用.開(kāi)發(fā)應(yīng)用.2021〔25〕:31-3316.葉紅云.面向金融客戶(hù)關(guān)系管理的數(shù)據(jù)挖掘方法研究.[碩士學(xué)位論文].武漢:華中農(nóng)業(yè)大學(xué)圖書(shū)館,200317.Anton,1996J.Anton,Customerrelationshipmanagement,Prentice-Hall,NewYork,NY(1996).18.AntonandHoeck,2002J.AntonandM.Hoeck,E-businesscustomerservice,TheAntonPress,SantaMonica,CA(2002).19.Baieretal.,2002M.Baier,K.M.RufandG.Chakraborty,Contemporarydatabasemarketing:Conceptsandapplications,RacomCommunications,Evanston(2002).20.Brown,2000H.L.Brown,“ThethreeWsoftechnology〞,customerrelation-shipmanagement:Astrategicimperativeintheworldofe-business(pp.219–225),Wiley,Toronto(2000).致謝在此論文寫(xiě)作完成之時(shí),謹(jǐn)以真誠(chéng)之心,真摯之情感謝華中農(nóng)業(yè)大學(xué),感謝母校四年來(lái)的諄諄教誨。感謝我的論文指導(dǎo)老師***老師,在論文的寫(xiě)作過(guò)程中,從論文的選題、開(kāi)題、撰寫(xiě)以及論文的修改斟酌方面始終給予我精心的指導(dǎo),論文的研究工作才得以順利完成。感謝我的同學(xué)在平時(shí)生活、學(xué)習(xí)和論文寫(xiě)作中對(duì)我的幫助。感謝一直以來(lái)關(guān)心我學(xué)習(xí)、研究和開(kāi)展的所有老師、同學(xué)、朋友。感謝家鄉(xiāng)的父母,感謝他們給我精神上和生活上的關(guān)心和鼓勵(lì),正是因?yàn)楦改傅年P(guān)愛(ài)和支持,使我更加努力一步一步走下去并不斷奮斗。深深感謝每一位關(guān)心和支持我的人。最后,對(duì)在百忙之中評(píng)審此論文的各位專(zhuān)家教授表示誠(chéng)摯的謝意!唐貝2021年4月附錄一:K-mean算法聚類(lèi)結(jié)果初始聚類(lèi)中心聚類(lèi)123x11.001.001.00x219.0055.0055.00x330.0089.0025.00x41.00.00.00x51.002.002.00迭代歷史記錄a迭代聚類(lèi)中心內(nèi)的更改123115.16326.68618.83223.7801.362.0003.000.000.000a.由于聚類(lèi)中心內(nèi)沒(méi)有改動(dòng)或改動(dòng)較小而到達(dá)收斂。任何中心的最大絕對(duì)坐標(biāo)更改為.000。當(dāng)前迭代為3。初始中心間的最小距離為36.373。聚類(lèi)成員案例號(hào)聚類(lèi)距離117.3512228.023313.800428.169524.585633.8267310.777834.543933.1051025.83311318.8321217.0461312.3751433.06415311.6891628.10817211.8511824.64719314.35820111.876最終聚類(lèi)中心聚類(lèi)123x1.40.57.50x228.2039.8645.50x337.4065.4341.2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論