




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
基于聚類分析的客戶關(guān)系管理——銀行重慶分行案例分析——研究生:盧闖:指導(dǎo)教師:李勇副教授:. 重慶工商管理碩士學(xué)院二八年十一月.摘要經(jīng)濟(jì)全球化,金融市場開放與競爭,信息技術(shù)突飛猛進(jìn),銀行業(yè)務(wù)的發(fā)展,促進(jìn)了在金融服務(wù)行業(yè)廣泛運(yùn)用。金融機(jī)構(gòu)正在應(yīng)用把客戶關(guān)系管理,整合客戶信息資源,發(fā)掘客戶價值,為客戶提供更加快捷、周到的產(chǎn)品和服務(wù),提高客戶滿意度和忠誠度,吸引更多的客戶,最終實(shí)現(xiàn)自身收益的最大化。在這種形勢下,如何細(xì)分客戶,通過從客戶的交易中了解客戶喜好,進(jìn)而進(jìn)行差異化管理,成為銀行面臨的重大挑戰(zhàn)。我們通過先進(jìn)的數(shù)據(jù)挖掘技術(shù)分析現(xiàn)有客戶的需求、愛好等,針對性的提供個性化服務(wù),以改善銀行客戶經(jīng)理的營銷手段,提高銀行的經(jīng)濟(jì)效益。銀行重慶分行自成立以來,一直致力于客戶的差異化服務(wù),提升客戶的滿意度,取得良好的市場業(yè)績。隨著金融業(yè)的激烈競爭,外資銀行進(jìn)入中國市場,銀行重慶分行的戰(zhàn)略發(fā)展需要提升客戶的服務(wù)質(zhì)量,以適應(yīng)激烈的市場競爭,保持行業(yè)的領(lǐng)先地位。本文根據(jù)銀行重慶分行現(xiàn)狀和實(shí)際抽樣數(shù)據(jù)情況,明確了在數(shù)據(jù)分析和處理方面存在的問題和不足,分析了銀行重慶分行的客戶現(xiàn)狀。在聚類分析上,從信息技術(shù)和客戶關(guān)系管理相結(jié)合的角度出發(fā),對銀行客戶進(jìn)行分類,找出不同類型客戶的行為特征,以此對不同類別的客戶制定相關(guān)的客戶關(guān)系管理策略,提供有針對性的差異化個性服務(wù),以使銀行重慶分行在激烈的金融市場競爭中獲得大的收益,立于不敗之地。關(guān)鍵詞:數(shù)據(jù)挖掘,聚類分析,客戶分類,客戶關(guān)系管理,,,.,..,’.’,,,..,.,.,;’.,...:,,,目錄\""\\\摘要 緒論 研究的目的和意義 論文研究的主要內(nèi)容及框架 客戶關(guān)系管理與數(shù)據(jù)挖掘的相關(guān)理論概述 客戶關(guān)系管理相關(guān)理論 的定義與內(nèi)涵 的核心管理思想 所需要的技術(shù) 數(shù)據(jù)挖掘理論 數(shù)據(jù)挖掘概述 數(shù)據(jù)挖掘的模式 數(shù)據(jù)挖掘在銀行客戶關(guān)系管理中的應(yīng)用 數(shù)據(jù)挖掘的聚類分析理論 聚類的概念 聚類算法的一般特征 算法簡介 簡介 銀行重慶分行客戶關(guān)系管理現(xiàn)狀分析 銀行重慶分行簡介 銀行重慶分行客戶數(shù)據(jù)分析與利用的現(xiàn)狀與問題 銀行重慶分行客戶關(guān)系管理現(xiàn)狀 基于數(shù)據(jù)挖掘的客戶價值研究總體思路 面向的聚類分析 問題描述 數(shù)據(jù)采集與預(yù)處理 數(shù)據(jù)模型 數(shù)據(jù)預(yù)處理 聚類分析 基于銀行收益數(shù)據(jù)的聚類分析 基于客戶活動強(qiáng)度數(shù)據(jù)的聚類分析 聚類結(jié)果評估與解釋 基于聚類的客戶關(guān)系管理 基于聚類的客戶分類 基于銀行收益的客戶分類 基于活動強(qiáng)度的客戶分類 基于客戶價值和活躍強(qiáng)度的客戶二維分類 基于聚類的客戶分類與銀行現(xiàn)有分類情況對比分析 基于客戶細(xì)分的客戶關(guān)系管理策略 針對高價值不同活動強(qiáng)度客戶策略 針對中價值不同活動強(qiáng)度客戶策略 針對低價值不同活動強(qiáng)度客戶策略 預(yù)期應(yīng)用效果 結(jié)論 致謝 參考文獻(xiàn) 緒論研究的目的和意義隨著金融體制改革的深化和銀行業(yè)的改制,以及外資銀行進(jìn)入中國,銀行業(yè)的危機(jī)意識不斷增強(qiáng),國內(nèi)銀行業(yè)面臨更加激烈的競爭,特別是從年月份美國次貸危機(jī)引發(fā)的全球金融危機(jī),直至發(fā)展成為全球的金融海嘯,導(dǎo)致國內(nèi)外銀行受到嚴(yán)重的沖擊。今年月份美國第四大投資銀行雷曼兄弟的破產(chǎn),引起了全球銀行和企業(yè)的破產(chǎn)風(fēng)潮,致使全球經(jīng)濟(jì)進(jìn)入冬天。在這種劇烈競爭和嚴(yán)重沖擊下,哪家銀行能夠準(zhǔn)確把握客戶的需求并提供差異化的產(chǎn)品和服務(wù),哪家銀行就可能取勝,達(dá)到提高客戶滿意度和銀行收益增加的客戶和銀行雙贏局面??蛻羰倾y行最重要的資源,是銀行收益的主要來源??蛻絷P(guān)系管理()就是一個通過詳細(xì)管理企業(yè)與客戶之間的關(guān)系,使客戶價值最大化與企業(yè)收益最大化之間達(dá)到平衡的有效途徑。銀行重慶分行于年月在重慶成立,堅持秉承自上而下的“因勢而變”、“因您而變”服務(wù)理念,充分發(fā)揮自身優(yōu)勢,不斷將銀行重慶分行“一卡通”、“一網(wǎng)通”、“金葵花理財”、“點(diǎn)金理財”、國際標(biāo)準(zhǔn)雙幣信用卡、“財富帳戶”等金融服務(wù)品牌推向深入。隨著銀行重慶分行規(guī)模不斷擴(kuò)大,客戶交易數(shù)據(jù)庫越來越龐大,為對龐大的客戶信息資源進(jìn)行有效管理,需要建立適合于銀行發(fā)展的體系,在客戶基礎(chǔ)信息數(shù)據(jù)庫建立的基礎(chǔ)上,再對數(shù)據(jù)進(jìn)行挖掘和全面深入的分析處理。數(shù)據(jù)挖掘聚類技術(shù)對銀行龐大數(shù)據(jù)進(jìn)行分析的優(yōu)點(diǎn)是顯而易見的:第一,對大量的數(shù)據(jù)進(jìn)行科學(xué)準(zhǔn)確的分析,劃分出數(shù)據(jù)的規(guī)律;第二,根據(jù)劃分的數(shù)據(jù)規(guī)律,對客戶進(jìn)行分類,并找出各類客戶的特征;第三,對各類客戶有針對性的制定出客戶關(guān)系管理策略方案,提供個性化服務(wù)。本文針對銀行重慶分行的發(fā)展需要,以及在大量數(shù)據(jù)處理方面存在的不足,結(jié)合實(shí)際情況,提出一系列可執(zhí)行方案,具有很強(qiáng)的針對性以及實(shí)際應(yīng)用意義。論文研究的主要內(nèi)容及框架本文對銀行重慶分行在數(shù)據(jù)處理方面存在的不足采用數(shù)據(jù)挖掘聚類技術(shù)進(jìn)行了分析,對客戶進(jìn)行分類,針對不同類別的客戶制定相關(guān)的客戶關(guān)系管理策略。論文的研究框架如圖所示:論文研究的目的和意義論文研究的目的和意義數(shù)據(jù)挖掘和客戶關(guān)系管理的相關(guān)理論銀行重慶分行的客戶關(guān)系管理現(xiàn)狀分析基于聚類的客戶分類客戶關(guān)系管理策略的實(shí)施與應(yīng)用客戶聚類分析圖論文研究框架客戶關(guān)系管理與數(shù)據(jù)挖掘的相關(guān)理論概述客戶關(guān)系管理相關(guān)理論的定義與內(nèi)涵客戶關(guān)系管理()是依靠信息技術(shù)實(shí)現(xiàn)的全新的管理模式,它強(qiáng)調(diào)客戶價值和便利,充分利用以客戶為中心的資源,拓展全新的銷售方式和銷售渠道。企業(yè)任何產(chǎn)品的銷售,都是建立在良好的客戶關(guān)系基礎(chǔ)之上的,客戶關(guān)系成為企業(yè)發(fā)展的本質(zhì)要素。因此,客戶應(yīng)該被作為一種寶貴的資源納入到企業(yè)的經(jīng)營發(fā)展中來[1][1]廖俊松,張金隆,蔡淑琴.論電子商務(wù)時代的客戶關(guān)系管理.軟科學(xué),2001,一五(1):93-94.定義作為新興的管理概念,大量研究人員及機(jī)構(gòu)都提出了各自的定義。下面給出幾個有代表性的定義。認(rèn)為,就是“吸引并保持有經(jīng)濟(jì)價值的客戶,驅(qū)逐并消除缺乏經(jīng)濟(jì)價值的客戶”。認(rèn)為,“是指通過圍繞客戶細(xì)分來組織企業(yè),鼓勵滿足客戶需要的行為,并實(shí)現(xiàn)客戶與供應(yīng)商之間聯(lián)系等手段,來提高盈利、收入和客戶滿意度的、遍及整個企業(yè)的商業(yè)策略?!焙驼J(rèn)為,“是一個圍繞客戶需要和需求、重新設(shè)計企業(yè)及其業(yè)務(wù)流程的信息技術(shù)()驅(qū)動的概念,它將一系列方法、軟件以及互聯(lián)網(wǎng)接入能力同企業(yè)的以客戶為核心的商業(yè)戰(zhàn)略相結(jié)合,致力于利潤、收益和客戶滿意度的提高”。認(rèn)為,是指“通過協(xié)調(diào)、整合、集成企業(yè)同客戶的所有接觸點(diǎn),既整合銷售、營銷和服務(wù)流程,增強(qiáng)企業(yè)的獲利能力,增加企業(yè)的收益,致力于建立、關(guān)懷及開發(fā)利用與重要客戶之間的良好個人關(guān)系”。等人將定義為“一種客戶導(dǎo)向的管理方法,它是基于整合了前臺營銷、銷售、服務(wù)所有信息的信息系統(tǒng)”。認(rèn)為,是指“企業(yè)通過富有意義的溝通,理解并影響客戶行為,最終實(shí)現(xiàn)提高客戶獲得、客戶保留、客戶忠誠和客戶創(chuàng)利的目的”。是一個將客戶信息轉(zhuǎn)化成積極的客戶關(guān)系的反復(fù)循環(huán)過程。上述這些關(guān)于的界定,各有其側(cè)重之處。是從客戶關(guān)系本質(zhì)出發(fā),強(qiáng)調(diào)了“關(guān)系”的經(jīng)濟(jì)價值,這也是如今學(xué)術(shù)界較為普遍接受的一種定義;的定義強(qiáng)調(diào)了商業(yè)策略;和則是強(qiáng)調(diào)整合客戶接觸點(diǎn)和前臺各流程;等人認(rèn)為是一種管理方法,強(qiáng)調(diào)以信息系統(tǒng)為基礎(chǔ),前后臺信息共享;強(qiáng)調(diào)的是管理與客戶的關(guān)系。的內(nèi)涵由于是一種新興的營銷管理理論,企業(yè)界和理論界對其有不同的詮釋,可從下述三個層面來表述。首先被認(rèn)為是一種營銷管理理念。的核心思想是將企業(yè)的客戶(包括最終客戶、分銷商和合作伙伴)作為最重要的企業(yè)資源,通過完善的客戶服務(wù)和深入的客戶分析來滿足客戶的需求,保證實(shí)現(xiàn)客戶的終生價值;其次,也是一種旨在改善企業(yè)和客戶之間關(guān)系的新型管理機(jī)制。它實(shí)施于企業(yè)的市場營銷、銷售、服務(wù)與技術(shù)支持等與客戶相關(guān)的領(lǐng)域,通過向企業(yè)的銷售、市場和客戶服務(wù)的專業(yè)人員提供全面、個性化的客戶資料,并強(qiáng)化跟蹤服務(wù)、信息分析的能力,使他們能夠協(xié)同建立和維護(hù)一系列與客戶和生意伙伴之間卓有成效的“一對一關(guān)系”。一方面使企業(yè)得以提供更快捷和周到的優(yōu)質(zhì)服務(wù)、提高客戶滿意度、吸引和保持更多的客戶,從而增加營業(yè)額;另一方面則通過信息共享和優(yōu)化商業(yè)流程來有效地降低企業(yè)經(jīng)營成本;最后,也是一套管理軟件和技術(shù)。它是企業(yè)借助電子商務(wù)、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘、專家系統(tǒng)和人工智能各種技術(shù)手段,建立一個能搜集、追蹤和分析客戶信息的系統(tǒng),為企業(yè)的銷售、客戶服務(wù)和決策支持等領(lǐng)域提供一個業(yè)務(wù)自動化的解決方案,實(shí)現(xiàn)了企業(yè)由傳統(tǒng)模式向以電子商務(wù)為基礎(chǔ)的現(xiàn)代企業(yè)的轉(zhuǎn)化[1]王廣宇.客戶關(guān)系關(guān)系方法論.清華大學(xué)出版社,2004(9):87-106.[1]王廣宇.客戶關(guān)系關(guān)系方法論.清華大學(xué)出版社,2004(9):87-106.體現(xiàn)了兩個管理趨勢的轉(zhuǎn)變[2][2]魯江,熊燕.提升中國現(xiàn)代企業(yè)的核心競爭力——建立客戶關(guān)系管理.科技進(jìn)步與對策,2002(5):98-99.的核心管理思想的核心管理思想主要包括以下幾個方面:①客戶是企業(yè)發(fā)展最重要的資源之一企業(yè)發(fā)展需要對自己的資源進(jìn)行有效的組織與計劃。隨著人類社會的發(fā)展,企業(yè)資源的內(nèi)涵也在不斷擴(kuò)展,早期的企業(yè)資源主要是指有形的資產(chǎn),包括土地、設(shè)備、廠房、原材料、資金等。其后企業(yè)資源概念擴(kuò)展到無形資產(chǎn),包括品牌、商標(biāo)、專利、知識產(chǎn)權(quán)等。再后來,人們認(rèn)識到人力資源才是企業(yè)發(fā)展最重要的資源。時至工業(yè)經(jīng)濟(jì)時代后期,信息又成為企業(yè)發(fā)展的一項重要資源。乃至人們將工業(yè)經(jīng)濟(jì)時代后期稱為“信息時代”。在人類社會從“產(chǎn)品”導(dǎo)向時代發(fā)展為“客戶”導(dǎo)向時代的今天,客戶的選擇決定著一個企業(yè)的命運(yùn)。因此,客戶已經(jīng)成為當(dāng)今企業(yè)最重要的資源之一。在很多行業(yè)中,完整的客戶檔案或數(shù)據(jù)庫就是一個企業(yè)頗具價值的資產(chǎn)。通過對客戶資料的深入分析并應(yīng)用銷售理論中的法則將會顯著改善企業(yè)營銷業(yè)績。②對企業(yè)與客戶發(fā)生的各種關(guān)系進(jìn)行全面管理企業(yè)與客戶之間發(fā)生的關(guān)系,不僅包括單純的銷售過程所發(fā)生的業(yè)務(wù)關(guān)系,如合同簽訂、定單處理、發(fā)貨、收款等,而且包括在企業(yè)營銷及售后服務(wù)過程中發(fā)生的各種關(guān)系。如在企業(yè)市場活動、市場推廣過程中與潛在客戶發(fā)生的關(guān)系;在與目標(biāo)客戶接觸過程中,內(nèi)部銷售人員的行為、各項活動及其與客戶接觸全過程所發(fā)生的關(guān)系;還包括售后服務(wù)過程中,企業(yè)服務(wù)人員對客戶提供關(guān)懷活動、各種服務(wù)活動、服務(wù)內(nèi)容、服務(wù)效果的記錄等,這也是企業(yè)與客戶的售后服務(wù)關(guān)系。對企業(yè)與客戶間可能發(fā)生的各種關(guān)系進(jìn)行全面管理,將會顯著提升企業(yè)營銷能力,降低營銷成本,控制營銷過程中可能導(dǎo)致客戶抱怨的各種行為,這是的另一個重要管理思想。③進(jìn)一步延伸企業(yè)供應(yīng)鏈管理世紀(jì)年代提出的,原來是為了滿足企業(yè)的供應(yīng)鏈管理需要,但的實(shí)際應(yīng)用并沒有達(dá)到企業(yè)供應(yīng)鏈管理的目標(biāo),這既有本身功能方面的局限性,也有技術(shù)發(fā)展階段的局限性,最終系統(tǒng)又退回到幫助企業(yè)實(shí)現(xiàn)內(nèi)部資金流、物流與信息流一體化管理的系統(tǒng)。系統(tǒng)作為系統(tǒng)中銷售管理的延伸,借助技術(shù),突破了供應(yīng)鏈上企業(yè)間的地域邊界和不同企業(yè)之間信息交流的組織邊界,建立起企業(yè)自己的和網(wǎng)絡(luò)營銷模式。系統(tǒng)與系統(tǒng)的集成運(yùn)行才真正解決了企業(yè)供應(yīng)鏈中的下游鏈管理問題,將客戶、經(jīng)銷商、企業(yè)銷售部整合到一起,實(shí)現(xiàn)企業(yè)對客戶個性化需求的快速響應(yīng)。同時也幫助企業(yè)清除了營銷體系中的中間環(huán)節(jié),通過新的扁平化營銷體系,縮短響應(yīng)時間,降低銷售成本。④定律定律是世紀(jì)意大利經(jīng)濟(jì)學(xué)家佩爾圖()率先發(fā)表的一項研究成果,后來被稱為定律(也稱佩爾圖定律)。此定律具體到企業(yè)業(yè)務(wù),可理解為:對于已經(jīng)與企業(yè)有業(yè)務(wù)往來的客戶,其中的業(yè)務(wù)來自于的客戶;同樣,對于暫時與企業(yè)還沒有業(yè)務(wù)往來但也是企業(yè)希望爭取到的潛在客戶而言,其中的潛在業(yè)務(wù)來自于的潛在客戶(潛在客戶可被認(rèn)為是那些曾一次或多次與企業(yè)接觸過或企業(yè)與之接觸過的潛在客戶)。定律不僅給我們的市場、銷售帶來收益,使企業(yè)準(zhǔn)確的把握市場,研發(fā)出具有市場占有力的產(chǎn)品,同時也作用于客戶服務(wù)這一層面,因現(xiàn)代的客戶服務(wù)已遠(yuǎn)遠(yuǎn)不局限于僅為客戶提供售后服務(wù),而是在服務(wù)的基礎(chǔ)上分析并挖掘客戶的購買潛力,即購買資格。⑤客戶知識管理世界經(jīng)濟(jì)正進(jìn)入知識經(jīng)濟(jì)時代,知識經(jīng)濟(jì)是以知識為基礎(chǔ)的經(jīng)濟(jì),是建立在知識和信息的生產(chǎn)、分配和使用之上的經(jīng)濟(jì)。知識管理的重點(diǎn)是知識的識別、獲取、開發(fā)、分解、存儲和共享,并為其構(gòu)建有效的途徑和機(jī)制,以運(yùn)用集體的智慧提高企業(yè)的應(yīng)變和創(chuàng)新能力。知識管理以信息管理為基礎(chǔ),是信息管理的延伸和發(fā)展,是利用技術(shù)去分享知識(或信息)并把它們作為創(chuàng)新(發(fā)明)的手段或杠桿。知識管理是適應(yīng)知識經(jīng)濟(jì)時代要求的新型管理模式,是迎接新時代挑戰(zhàn)的重要戰(zhàn)略。客戶知識管理是通過一組解決方案的集合尋找和識別與問題有關(guān)的關(guān)鍵性信息,并將這些信息進(jìn)行提取,形成對某一問題的專門知識,并作為決策的依據(jù)??蛻艄芾淼哪康脑谟趨f(xié)助企業(yè)不斷的獲取、積累客戶知識并將這些知識運(yùn)用在企業(yè)的市場、銷售、客戶服務(wù)等各個領(lǐng)域,并讓這些知識發(fā)揮出杠桿作用,以提升企業(yè)客戶的滿意度和忠誠度,從而降低生產(chǎn)和銷售成本,縮短銷售周期,擴(kuò)大市場份額,提高企業(yè)的效率和效益。因此,客戶知識管理是客戶關(guān)系管理的本質(zhì)。企業(yè)必須將知識有效地運(yùn)用到制定策略上,并讓這些知識發(fā)揮出杠桿作用,才能有效地進(jìn)行客戶關(guān)系管理。所需要的技術(shù)詳細(xì)的客戶信息,而并非僅僅是有關(guān)交易和財務(wù)支付的原始數(shù)據(jù),是成功企業(yè)贏得和留住贏利性客戶的根本。將原始數(shù)據(jù)轉(zhuǎn)化為可操作的有效信息,對于營造一種有突破性的共同業(yè)務(wù)決策環(huán)境是十分必要的。凡是經(jīng)過分析處理且能夠“被理解”的知識,都有助于我們在營銷、銷售、服務(wù)、行政管理、資源管理以及各層次的決策和計劃上做出明智的選擇。具體所需的技術(shù)有:①數(shù)據(jù)庫技術(shù)數(shù)據(jù)庫是按一定的數(shù)據(jù)模型組織、描述和存儲的,有組織、可共享的數(shù)據(jù)集合,是構(gòu)成數(shù)據(jù)庫系統(tǒng)的重要部分。數(shù)據(jù)庫技術(shù)是在文件系統(tǒng)基礎(chǔ)上發(fā)展起來的計算機(jī)數(shù)據(jù)管理技術(shù),它有效的解決了數(shù)據(jù)的獨(dú)立性問題,實(shí)現(xiàn)了數(shù)據(jù)的統(tǒng)一管理,達(dá)到數(shù)據(jù)共享的目的。數(shù)據(jù)庫系統(tǒng)則指引進(jìn)數(shù)據(jù)庫技術(shù)后的計算機(jī)系統(tǒng),它實(shí)際上是由有組織的、動態(tài)存儲的有密切聯(lián)系的數(shù)據(jù)集合及對其進(jìn)行統(tǒng)一管理的計算機(jī)軟件和配件資源所組成的系統(tǒng)。它將有關(guān)部門中反映客觀事物的大量信息進(jìn)行記錄、分類整理等定量、規(guī)范化處理,并以記錄為單位存貯于數(shù)據(jù)庫中。在數(shù)據(jù)庫系統(tǒng)的統(tǒng)一作用下,用戶通過應(yīng)用程序發(fā)出不同命令以得到滿足不同層次需要的各種信息[1]鄧.皮泊斯,馬沙.容格斯.客戶關(guān)系管理.中國金融出版社,2006(1):163-一八2.[1]鄧.皮泊斯,馬沙.容格斯.客戶關(guān)系管理.中國金融出版社,2006(1):163-一八2.②數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)作為信息科學(xué)的一個重要研究領(lǐng)域,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)庫技術(shù)發(fā)展到一定程度的產(chǎn)物。按的定義,“數(shù)據(jù)倉庫是一個面向主題的、集成的、時變的、非易失的數(shù)據(jù)集合,支持管理部門的決策過程”。而在數(shù)據(jù)倉庫基礎(chǔ)上的所謂數(shù)據(jù)挖掘,亦稱數(shù)據(jù)庫中的知識發(fā)現(xiàn),就是在海量數(shù)據(jù)中探索數(shù)據(jù)間的關(guān)系、并從中提取有效的、新穎的、有潛在價值的知識和規(guī)律的過程。它的作用是將數(shù)據(jù)轉(zhuǎn)換成信息和知識,以便做出正確的決策;提供將知識應(yīng)用到操作系統(tǒng)中的機(jī)制,以便采取正確的行動。數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)的結(jié)合,不僅能提高數(shù)據(jù)倉庫對決策的支持能力,也能大大提高數(shù)據(jù)挖掘的工作效率[2]管正,魏冠明.中國企業(yè)CRM實(shí)施.人民郵電出版社,2003(3):70-79.[2]管正,魏冠明.中國企業(yè)CRM實(shí)施.人民郵電出版社,2003(3):70-79.系統(tǒng)的建立和實(shí)現(xiàn)還涉及到其他許多技術(shù),如通信技術(shù)、計算機(jī)網(wǎng)絡(luò)技術(shù)、信息技術(shù)、人工智能技術(shù)等。本文著重討論數(shù)據(jù)庫技術(shù),因?yàn)閿?shù)據(jù)庫技術(shù)是進(jìn)行數(shù)據(jù)分析的基礎(chǔ),沒有數(shù)據(jù)庫技術(shù),也就沒有數(shù)據(jù)挖掘、數(shù)據(jù)倉庫等高級數(shù)據(jù)分析工具的應(yīng)用。利用數(shù)據(jù)庫技術(shù)設(shè)計了一個系統(tǒng),待運(yùn)行穩(wěn)定后逐步引入數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù),以便更好地分析客戶特征、了解客戶需求,更有效地進(jìn)行客戶關(guān)系管理。數(shù)據(jù)挖掘理論數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘,就是從數(shù)據(jù)集中提取隱含的、未知的、對決策有潛在價值的知識的過程。又稱作數(shù)據(jù)庫中的知識發(fā)現(xiàn)(,簡記為),是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。還有很多和這一術(shù)語相近似的術(shù)語,如從數(shù)據(jù)庫中發(fā)現(xiàn)知識()、數(shù)據(jù)分析、數(shù)據(jù)融合()以及決策支持等。人們把原始數(shù)據(jù)看作是形成知識的源泉,就像從礦石中采礦一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)了的知識可以被用于信息管理、查詢優(yōu)化、決策支持、過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化、并行計算等方面的學(xué)者和工程技術(shù)人員[1]潘華,項同德.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理,工具及應(yīng)用.中國電力出版社.2007(12):83-84.[1]潘華,項同德.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理,工具及應(yīng)用.中國電力出版社.2007(12):83-84.①確定挖掘主題:在金融數(shù)據(jù)挖掘中,首先要清楚的明確數(shù)據(jù)挖掘的目的,這是至關(guān)重要的一步。因?yàn)橥诰虻淖詈蠼Y(jié)果是不可預(yù)測的,但要探索的問題應(yīng)是有預(yù)見性的,所以不能進(jìn)行盲目的數(shù)據(jù)挖掘。②數(shù)據(jù)選擇:查找所有和業(yè)務(wù)相關(guān)的內(nèi)部和外部數(shù)據(jù)信息,從中選擇適用于數(shù)據(jù)挖掘的相關(guān)數(shù)據(jù)。③數(shù)據(jù)預(yù)處理:對選擇后的數(shù)據(jù)進(jìn)一步處理,檢查數(shù)據(jù)完整性以及數(shù)據(jù)的一致性,并通過一些操作減少數(shù)據(jù)量,將數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式。④建立模型:讀入經(jīng)過預(yù)處理的數(shù)據(jù),建立模型,進(jìn)行數(shù)據(jù)挖掘。⑤評價和解釋:對模型得出的結(jié)果進(jìn)行解釋,根據(jù)某種興趣度量,識別表示知識的真正有用的模式,并通過一致性檢查,以確信發(fā)現(xiàn)的知識不與以前發(fā)現(xiàn)的知識相抵觸,并用可視化技術(shù)展現(xiàn)給用戶。⑥預(yù)測:應(yīng)用模型對未知數(shù)據(jù)進(jìn)行預(yù)測。數(shù)據(jù)挖掘技術(shù)是人們長期對數(shù)據(jù)庫技術(shù)進(jìn)行研究和開發(fā)的結(jié)果。起初各種商業(yè)數(shù)據(jù)是存儲在計算機(jī)的數(shù)據(jù)庫中的,然后發(fā)展到可對數(shù)據(jù)庫進(jìn)行查詢和訪問,進(jìn)而發(fā)展到對數(shù)據(jù)庫的即時遍歷。數(shù)據(jù)挖掘使數(shù)據(jù)庫技術(shù)進(jìn)入了一個更高級的階段,他不但能對過去的數(shù)據(jù)進(jìn)行查詢和遍歷,并且能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促進(jìn)信息的傳遞。商業(yè)數(shù)據(jù)庫正在以空前的速度增長,并且數(shù)據(jù)倉庫正在廣泛地應(yīng)用于各種行業(yè),數(shù)據(jù)挖掘經(jīng)過了十多年的發(fā)展已經(jīng)成為一種成熟、穩(wěn)定、易于理解和操作的技術(shù)。數(shù)據(jù)挖掘的模式數(shù)據(jù)挖掘功能用于指定數(shù)據(jù)挖掘任務(wù)中要找的模式類型。數(shù)據(jù)挖掘任務(wù)一般可以分兩類描述和預(yù)測。描述性挖掘任務(wù)刻畫數(shù)據(jù)庫中數(shù)據(jù)的一般特性。預(yù)測性挖掘任務(wù)在當(dāng)前數(shù)據(jù)上進(jìn)行推斷,以進(jìn)行預(yù)測[2]袁玉波,楊傳勝,黃延祝,徐成賢.數(shù)據(jù)挖掘與最優(yōu)化技術(shù)及應(yīng)用,2007(7):77-78.[2]袁玉波,楊傳勝,黃延祝,徐成賢.數(shù)據(jù)挖掘與最優(yōu)化技術(shù)及應(yīng)用,2007(7):77-78.在某些情況下,用戶不知道他們的數(shù)據(jù)中有什么類型的模式是有趣的,因此可能想并行地搜索多種不同的模式。這樣,重要的是,數(shù)據(jù)挖掘系統(tǒng)要能夠挖掘多種類型的模式,以適應(yīng)不同的用戶需求或不同的應(yīng)用。此外,數(shù)據(jù)挖掘系統(tǒng)應(yīng)當(dāng)能夠發(fā)現(xiàn)各種粒度即(不同的抽象層)的模式。數(shù)據(jù)挖掘系統(tǒng)應(yīng)當(dāng)允許用戶給出提示,指導(dǎo)或聚焦有趣模式的搜索。由于有些模式并非對數(shù)據(jù)庫中的所有數(shù)據(jù)都成立,通常每個發(fā)現(xiàn)的模式帶上一個確定性或“可信性”度量。數(shù)據(jù)挖掘功能以及它們可以發(fā)現(xiàn)的模式類型介紹如下[3]張喆.數(shù)據(jù)挖掘及其在客戶關(guān)系管理中的應(yīng)用.復(fù)旦大學(xué)出版社,2007:73-75[3]張喆.數(shù)據(jù)挖掘及其在客戶關(guān)系管理中的應(yīng)用.復(fù)旦大學(xué)出版社,2007:73-75.①概念類描述特征化和區(qū)分?jǐn)?shù)據(jù)可以與類或概念相關(guān)聯(lián)。類和概念的描述稱為類概念()描述。這種描述可以通過下述方法得到:)數(shù)據(jù)特征化,一般地匯總所研究類(通常稱為目標(biāo)類)的數(shù)據(jù);)數(shù)據(jù)區(qū)分,將目標(biāo)類與一個或多個比較類(通常稱為對比類)進(jìn)行比較數(shù)據(jù)特征化和比較;)數(shù)據(jù)特征化和比較。數(shù)據(jù)特征化()是目標(biāo)類數(shù)據(jù)的一般特征或特性的匯總。通常,用戶在指定類的數(shù)據(jù)通過數(shù)據(jù)庫查詢收集。例如,為研究上一年銷售增加的軟件產(chǎn)品的特征,可以通過執(zhí)行一個查詢收集關(guān)于這些產(chǎn)品的數(shù)據(jù)。有許多有效的方法,將數(shù)據(jù)特征化匯總。例如,基于數(shù)據(jù)立方體的上卷操作可以用來執(zhí)行用戶控制的、沿著指定維的數(shù)據(jù)匯總。一種面向?qū)傩缘臍w納技術(shù)可以用來進(jìn)行數(shù)據(jù)的概化和特征化,而不必一步步地與用戶交互。數(shù)據(jù)特征的輸出可以用多種形式提供。包括餅圖、條圖、曲線、多維數(shù)據(jù)立方體和包括交叉表在內(nèi)的多維表。結(jié)果描述也可以用概化關(guān)系()或規(guī)則形式提供。數(shù)據(jù)區(qū)分()是將目標(biāo)類對象的一般特征與一個或多個對比類對象的一般特征相比較。目標(biāo)類和對比類由用戶指定,而對應(yīng)的數(shù)據(jù)通過數(shù)據(jù)庫檢索。例如,可能希望將上一年銷售增加的軟件產(chǎn)品與同一時期銷售至少下降的那些產(chǎn)品進(jìn)行比較。用于數(shù)據(jù)區(qū)分的方法與用于數(shù)據(jù)特征化的類似。②關(guān)聯(lián)分析關(guān)聯(lián)分析,即利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。有時并不知道數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。③分類和預(yù)測分類()是這樣一個過程,它找出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型(或函數(shù)),以便能夠使用模型預(yù)測類標(biāo)記未知的對象類。導(dǎo)出模型是基于對訓(xùn)練數(shù)據(jù)集(即其類標(biāo)記已知的數(shù)據(jù)對象)的分析?!叭绾翁峁?dǎo)出模型?”導(dǎo)出模式可以用多種形式表示,如分類()規(guī)則、判定樹、數(shù)學(xué)公式或神經(jīng)網(wǎng)絡(luò)。判定樹是一個類似于流程圖的樹結(jié)構(gòu),每個節(jié)點(diǎn)代表一個屬性值上的測試,每個分支代表測試的一個輸出,樹葉代表類或類分布。判定樹容易轉(zhuǎn)換成分類規(guī)則。當(dāng)用于分類時,神經(jīng)網(wǎng)絡(luò)是一組類似于神經(jīng)元的處理單元,單元之間加權(quán)連接。分類可以用于預(yù)測數(shù)據(jù)對象的類標(biāo)記。然而,在某些應(yīng)用中,人們可能希望預(yù)測某些空缺的或不知道的數(shù)據(jù)值,而不是類標(biāo)記。當(dāng)被預(yù)測的值是數(shù)值數(shù)據(jù)時,通常稱之為預(yù)測()。盡管預(yù)測可以涉及數(shù)據(jù)值預(yù)測和類標(biāo)識預(yù)測,通常預(yù)測限于值預(yù)測,并因此不同于分類。預(yù)測也包含基于可用數(shù)據(jù)的分類趨勢識別。相關(guān)分析()可能需要在分類和預(yù)測之前進(jìn)行,它試圖識別對于分類和預(yù)測無用的屬性。這些屬性應(yīng)該排除。④聚類分析與分類和預(yù)測不同,聚類()分析數(shù)據(jù)對象,而不考慮已知的類標(biāo)記。一般情況下,訓(xùn)練數(shù)據(jù)中不提供類標(biāo)記,因?yàn)椴恢缽暮伍_始。聚類,可以用于產(chǎn)生這種標(biāo)記。對象根據(jù)最大化類內(nèi)的相似性、最小化類間的相似性的原則進(jìn)行聚類或分組。即對象的簇(聚類)這樣形成,使得在一個簇中的一個對象具有很高的相似性,而與其它簇中的對象很不相似。所形成的每個簇可以看作一個對象類,由它可以導(dǎo)出規(guī)則。聚類也便于分類編制,將觀察的內(nèi)容組織成類分層結(jié)構(gòu),把類似的對象組織在一起[1]羅洪群,王情華,田義江.統(tǒng)計學(xué)基礎(chǔ).清華大學(xué)出版社,2008(3):98-99.[1]羅洪群,王情華,田義江.統(tǒng)計學(xué)基礎(chǔ).清華大學(xué)出版社,2008(3):98-99.⑤孤立點(diǎn)分析數(shù)據(jù)庫中可能包含一些數(shù)據(jù)對象,它們與數(shù)據(jù)的一般行為或模型不一致。這些數(shù)據(jù)對象是孤立點(diǎn)()。大部分?jǐn)?shù)據(jù)挖掘方法將孤立點(diǎn)視為噪聲或異常而丟棄。然而,在一些應(yīng)用中(如欺騙檢測),罕見的事件可能比正常出現(xiàn)的那些更有趣。孤立點(diǎn)數(shù)據(jù)分析稱作為孤立點(diǎn)挖掘()。孤立點(diǎn)可以使用統(tǒng)計試驗(yàn)檢測。它假定一個數(shù)據(jù)分布概率模型,并使用距離度量,到其他聚類的距離很大的對象被視為孤立點(diǎn)?;谄畹姆椒ㄍㄟ^考察一群對象主要特征的差別識別孤立點(diǎn),而不是使用統(tǒng)計或距離度量。⑥演變分析數(shù)據(jù)演變分析()描述行為隨時間變化的對象的規(guī)律或趨勢,并對其建模。盡管這可能包括時間相關(guān)數(shù)據(jù)的特征化、區(qū)分、關(guān)聯(lián)、分類或聚類,這類分析的不同特點(diǎn)包括時間序列數(shù)據(jù)分析、序列或周期模式匹配和基于類似性的數(shù)據(jù)分析。數(shù)據(jù)挖掘在銀行客戶關(guān)系管理中的應(yīng)用本論文是以銀行客戶為基礎(chǔ)進(jìn)行分析研究,銀行系統(tǒng)的核心是構(gòu)建全行的大型數(shù)據(jù)庫系統(tǒng),然而,成功構(gòu)建數(shù)據(jù)庫系統(tǒng)還只是基礎(chǔ),為了實(shí)現(xiàn)其輔助決策的目的,必須能夠有效利用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析和預(yù)測。對于銀行而言,數(shù)據(jù)挖掘在其客戶關(guān)系管理系統(tǒng)中可以起到的主要作用如下:①客戶分類近年來,特別是在市場細(xì)分環(huán)境下一對一個性化服務(wù)正在受到銀行業(yè)的青睞。這意味著銀行要了解每一個客戶,并同其建立起持久的關(guān)系。利用數(shù)據(jù)挖掘技術(shù)可對大量的客戶分類,提供針對性的產(chǎn)品和服務(wù)。②交叉服務(wù)現(xiàn)代銀行企業(yè)和客戶之間的關(guān)系是經(jīng)常變動的,一旦擁有了新的客戶,就要竭力完善這種關(guān)系。需要對其進(jìn)行交叉銷售,為原有客戶提供新的銀行產(chǎn)品或服務(wù)。數(shù)據(jù)挖掘可以幫助銀行分析出最優(yōu)的合理的服務(wù)匹配。③客戶保持客戶保持是留住老客戶、防止客戶流失的過程。由于銀行對老客戶的信息掌握的比較詳細(xì),而對潛在客戶的信息掌握得很少,所以對于銀行來說獲取一個新客戶遠(yuǎn)比保留一個老客戶的成本高得多。而且在目前開放的商業(yè)環(huán)境下,商業(yè)銀行之間的競爭越來越激烈,客戶保持也就成為銀行面臨的一個重要難題。在客戶保持過程中,首先要對已經(jīng)流失的客戶數(shù)據(jù)進(jìn)行分析,找到流失客戶的行為模式,同時分析流失客戶流失的原因。根據(jù)已經(jīng)流失的客戶的特點(diǎn)還可以預(yù)測現(xiàn)在客戶中有流失傾向的客戶。對于這些客戶,銀行應(yīng)該及時調(diào)整服務(wù)策略,針對用戶分類時得到的用戶特點(diǎn)采取相應(yīng)的措施挽留客戶。挽留一個老客戶,競爭對手就減少了一個新客戶,同時流失一個客戶就為競爭對手帶來一個新客戶。因此,客戶保持是客戶關(guān)系管理中最為重要的一個部分。數(shù)據(jù)挖掘可以幫助銀行識別出潛在的客戶群,提高市場活動的響應(yīng)率,使銀行決策人員做到心中有數(shù),有的放矢。④客戶信用分析分析客戶信用對銀行信用管理很有意義,對不同信用級別的客戶,采取不同的信貸方案等。數(shù)據(jù)挖掘可從大量歷史數(shù)據(jù)中分析出具體客戶的信用等級。⑤客戶盈利能力分析和預(yù)測很顯然,不同客戶對于銀行來講,其價值是不同的。數(shù)據(jù)挖掘技術(shù)可以用來分析和預(yù)測不同市場活動情況下客戶盈利能力的變化,幫助銀行制定適合的市場策略。根據(jù)本文緒論部分對客戶價值管理和之間關(guān)系的分析,可以看出客戶保持是銀行和客戶價值管理的核心。本文僅就將商業(yè)銀行的客戶流失預(yù)測模型作為研究的重點(diǎn)是符合銀行客戶關(guān)系管理規(guī)律的。數(shù)據(jù)挖掘的聚類分析理論聚類分析是研究物以類聚的一種統(tǒng)計分析方法。用于對事物類別尚不清楚,甚至事物總共可能有幾類都不能確定的情況下進(jìn)行事物分類的場合。聚類的概念聚類()是指把一組個體按照相似性歸成若干類別。即“物以類聚”它的目的是使得屬于同一類別的個體之間的距離盡可能的小,二不用類別的個體之間的距離盡可能的大。組內(nèi)的對象相互之間是相似的,而不同組的對象是不同的。同一類別的個體之間的相似性盡可能大,而不同類別的個體之間的相似性盡可能小。組內(nèi)的相似性越大,組間差別越大,聚類就越好。相似性是根據(jù)描述對象的屬性來測算的,距離是經(jīng)常采用的度量方式。聚類分析能夠幫助我們發(fā)現(xiàn)特征迥異的不同客戶群,和對客戶分群起關(guān)鍵作用的指標(biāo)變量,并輔助運(yùn)營商對各客戶群的特征進(jìn)行深刻洞察。聚類分析提供由個別數(shù)據(jù)對象所指派到簇的抽象。此外,一些聚類技術(shù)使用簇原理來刻畫簇特征。這些簇原型可以用作大量數(shù)據(jù)分析和數(shù)據(jù)處理技術(shù)的基礎(chǔ)。因此,聚類分析就是研究發(fā)現(xiàn)最有代表性的簇原型的技術(shù)。聚類算法的一般特征次序依賴性:對于某些算法,所產(chǎn)生的簇的質(zhì)量和個數(shù)可能因數(shù)據(jù)處理的次數(shù)不同而顯著的變化。非確定性:像均值這樣的聚類算法不是次序依賴的,但是它們每次運(yùn)行都產(chǎn)生不同的結(jié)果,它們依賴于需要隨機(jī)選擇的初始化步驟。簇的質(zhì)量可能隨運(yùn)行而變化,因此需要多此運(yùn)行??缮炜s性:包含數(shù)以萬計的數(shù)據(jù)集并不罕見,用于這種數(shù)據(jù)集的聚類算法應(yīng)當(dāng)具有線性或接近線性的時間空間復(fù)雜度。參數(shù)選擇:大部分聚類算法都需要用戶設(shè)置一個或多個參數(shù)。選擇合適的參數(shù)值可能是困難的,因此通常的態(tài)度是“參數(shù)越少越好”。如果參數(shù)值的很小改變就會顯著就會顯著的改變結(jié)果,則選擇參數(shù)值就變得更加有挑戰(zhàn)性。最后,除非提供一個過程來確定參數(shù)值,否則算法的用戶就不得不通過試探法找到合適的參數(shù)值。變換聚類問題到其他領(lǐng)域:一種被某些聚類技術(shù)使用的方法是將聚類問題映射到不同的領(lǐng)域。將聚類作為最優(yōu)化問題處理:聚類常常被看做優(yōu)化問題:將點(diǎn)劃分成簇,更具用戶指定的目標(biāo)函數(shù)度量,最大化結(jié)果簇集合的優(yōu)良度。例如:均值聚類算法試圖發(fā)現(xiàn)簇的集合,使每個點(diǎn)到最近的簇質(zhì)心距離的平方和最小。算法簡介文中進(jìn)行聚類分析時采用的是算法。算法屬于聚類分析方法中一種基本的且應(yīng)用最廣泛的劃分算法,它是一種已知聚類類別數(shù)的聚類算法。指定類別數(shù)為,對樣本集進(jìn)行聚類,聚類的結(jié)果由個聚類中心來表達(dá)。基于給定的聚類目標(biāo)函數(shù)(或者說是聚類效果判別準(zhǔn)則),算法采用迭代更新的方法,每一次迭代過程都是向目標(biāo)函數(shù)值減小的方向進(jìn)行,最終的聚類結(jié)果使目標(biāo)函數(shù)值取得極小值,達(dá)到較優(yōu)的聚類效果。算法根據(jù)它們之間的相似程度,分為若干組;其中相似的對象構(gòu)成一組,這一過程就稱為聚類過程。一個聚類就是由彼此相似的一組對象所構(gòu)成的集合;不同聚類中對象是不相似的。從給定的數(shù)據(jù)集中搜索數(shù)據(jù)項之間所存在的有價值聯(lián)系。算法的工作過程說明如下:首先從個數(shù)據(jù)對象任意選擇個對象作為初始聚類中心;而對于所剩下其它對象,則根據(jù)它們與這些聚類中心的相似度(距離),分別將它們分配給與其最相似的(聚類中心所代表的)聚類;然后再計算每個所獲新聚類的聚類中心(該聚類中所有對象的均值);不斷重復(fù)這一過程直到標(biāo)準(zhǔn)測度函數(shù)開始收斂為止。一般都采用均方差作為標(biāo)準(zhǔn)測度函數(shù):式中,為數(shù)據(jù)庫中所有對象的平方誤差的總和;為空間的點(diǎn),表示給定的數(shù)據(jù)對象;為簇的平均值(和都是多維的)。上式所示聚類標(biāo)準(zhǔn)旨在使所獲得的個聚類具有以下特點(diǎn):各聚類本身盡可能緊湊,而各聚類之間盡可能分開。算法的計算復(fù)雜度為(),因而它在處理大數(shù)據(jù)庫時也是相對有效的(具有可擴(kuò)展性);這里為對象個數(shù);為聚類個數(shù);而為循環(huán)次數(shù)。通常有《和《。算法常常終止于局部最優(yōu)。簡介系統(tǒng)是世界公認(rèn)的權(quán)威統(tǒng)計分析軟件之一,是一個大型集成信息分析管理系統(tǒng)。系統(tǒng)集數(shù)據(jù)訪問、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)挖掘功能于一體。是一個功能強(qiáng)大且被國際公認(rèn)的標(biāo)準(zhǔn)統(tǒng)計分析軟件。隨著信息技術(shù)的發(fā)展,數(shù)據(jù)管理與數(shù)據(jù)分析已成為各領(lǐng)域發(fā)展的重要支柱,系統(tǒng)也成為數(shù)據(jù)處理的首選工具。越來越多的企業(yè)感受到系統(tǒng)強(qiáng)大功能帶來的益處。要對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行科學(xué)的分析,系統(tǒng)軟件可以進(jìn)行處理,從而得到科學(xué)的研究結(jié)論[1]范金城.SAS數(shù)據(jù)分析范例.西安交通大學(xué)出版社,2008(5):83-84.[1]范金城.SAS數(shù)據(jù)分析范例.西安交通大學(xué)出版社,2008(5):83-84.()系統(tǒng)于年開始研制,年由美國公司實(shí)現(xiàn)商業(yè)化,年推出版本,年推出版,目前已經(jīng)推出系統(tǒng)支持的版和版,是目前國際上公認(rèn)的著名的數(shù)據(jù)統(tǒng)計分析軟件系統(tǒng)之一。系統(tǒng)的最大特點(diǎn)就是將數(shù)據(jù)管理和統(tǒng)計分析融為一體。系統(tǒng)軟件它提供一種交互式運(yùn)行程序。系統(tǒng)的基礎(chǔ)是語言,語言是一種近似自然語言的非過程語言。目前可以在不同的操作系統(tǒng)和不同的機(jī)器類型下運(yùn)行。該系統(tǒng)應(yīng)用的范圍廣。為“”的縮寫,意為統(tǒng)計分析系統(tǒng),是美國軟件研究所(.)研制的一套大型集成應(yīng)用軟件系統(tǒng),具有完備的數(shù)據(jù)存取、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)功能。利用它可以完成包括從簡單的描述性系統(tǒng)到復(fù)雜的多變數(shù)分析的各種運(yùn)算,從而使人們從繁重的計算任務(wù)中解脫出來,有更多的時間和精力用于分析和解釋計算的結(jié)果,而不必為如何獲得這些結(jié)果花費(fèi)過多的時間和精力?;诘纳a(chǎn)過程分析系統(tǒng)充分地利用先進(jìn)的統(tǒng)計分析性能,將大大提高分析系統(tǒng)的效率和精度。特別是功能強(qiáng)大,統(tǒng)計方法齊、全、新,提供了從基本統(tǒng)計數(shù)的計算到各種試驗(yàn)設(shè)計的方差分析,相關(guān)回歸分析以及多變數(shù)分析的多種統(tǒng)計分析過程,幾乎囊括了所有最新分析方法,其分析技術(shù)先進(jìn)可靠。更為重要的是使用簡便、操作靈活,其編程語句簡潔、短小,通常只需很小的幾條語句即可完成一些復(fù)雜的運(yùn)算,得到滿意的結(jié)果,這將大大地提高開發(fā)效率,增強(qiáng)系統(tǒng)的可維護(hù)性[2]汪遠(yuǎn)征,徐雅靜.SAS軟件與統(tǒng)計應(yīng)用教程.機(jī)械工業(yè)出版社[2]汪遠(yuǎn)征,徐雅靜.SAS軟件與統(tǒng)計應(yīng)用教程.機(jī)械工業(yè)出版社,2007(1):一三8-一三9.是公司針對使用其數(shù)據(jù)挖掘工具而提出的數(shù)據(jù)挖掘方法論。它將數(shù)據(jù)挖掘過程劃分為以下幾個主要步驟:數(shù)據(jù)抽樣(),數(shù)據(jù)特征探索和分析(),數(shù)據(jù)調(diào)整與預(yù)處理(),算法的選擇、模型的建立或知識的發(fā)現(xiàn)(),模型或知識的綜合解釋與評價()。①數(shù)據(jù)抽樣()當(dāng)進(jìn)行數(shù)據(jù)挖掘時,首先要從數(shù)據(jù)庫中取出一個與所探索的問題相關(guān)的樣本數(shù)據(jù)集,再根據(jù)所要達(dá)到的目標(biāo)采取不同的方法,如隨機(jī)抽樣、典型抽樣等。另外要注意數(shù)據(jù)的質(zhì)量。②數(shù)據(jù)特征探索、分析和預(yù)處理()得到一個樣本數(shù)據(jù)集后,要進(jìn)行數(shù)據(jù)特征的探索和分析??雌渲杏袥]有什么明顯的規(guī)律和趨勢,有沒有出現(xiàn)你從未設(shè)想過的數(shù)據(jù)狀態(tài),因素之間有什么相關(guān)性等等。還可用聚類、因子分析等方法對數(shù)據(jù)進(jìn)行分類和篩選。這是一個反復(fù)試探和觀察的過程,需要豐富的知識和敏銳的觀察力。③問題明確化、數(shù)據(jù)調(diào)整和技術(shù)選擇()通過上述兩個步驟的操作,分析人員就可以按照問題的具體要求對數(shù)據(jù)進(jìn)行修改,如增刪、組合或者生成一些新的變量等。④模型的研發(fā)、知識的發(fā)現(xiàn)()這一步是數(shù)據(jù)挖掘工作的中心環(huán)節(jié)。根據(jù)要實(shí)現(xiàn)的目標(biāo)和數(shù)據(jù)集的特征,選擇一種或幾種數(shù)據(jù)挖掘方法,如數(shù)理統(tǒng)計方法,人工神經(jīng)元網(wǎng)絡(luò),決策樹等,從而將隱含在數(shù)據(jù)中的內(nèi)在關(guān)系定量化、模型化。這一步也需要不斷的試驗(yàn),以得到擬合效果最好的模型。⑤模型和知識的綜合解釋和評價()從上述過程中將會得出一系列的分析結(jié)果、模式或模型,它們是對目標(biāo)問題的多側(cè)面的描述。但要形成最終的決策支持信息,還需要結(jié)合研究的問題,對這些結(jié)果進(jìn)行綜合的解釋。此外,要根據(jù)一定的方法,對決策支持信息的適用性做出評價。如發(fā)現(xiàn)不完善,就需要重新進(jìn)行數(shù)據(jù)挖掘的過程。因此,數(shù)據(jù)挖掘是一個反復(fù)進(jìn)行的過程,在反復(fù)過程中,獲得有價值的信息。系統(tǒng)的最大特點(diǎn)是把數(shù)據(jù)管理和數(shù)據(jù)分析融為一體。具體地說具有如下幾方面特點(diǎn):)使用靈活方便,功能齊全。用戶把要解決的問題用節(jié)點(diǎn)連接起來表達(dá)出來組成關(guān)聯(lián)圖,提交給系統(tǒng),就可以解決你的問題,用戶操作是在很友好的界面下進(jìn)行的。)系統(tǒng)把數(shù)據(jù)處理與統(tǒng)計分析融為一體程序的結(jié)構(gòu)是由兩個基本步驟任意組合而成,步用于對數(shù)據(jù)的加工處理,應(yīng)用于分析數(shù)據(jù)和編寫報告。)適用性強(qiáng),應(yīng)用面廣:系統(tǒng)適用于任何經(jīng)驗(yàn)的人員(初學(xué)者或有經(jīng)驗(yàn)的用戶),適用于任何類型的數(shù)據(jù),系統(tǒng)可以訪問各種數(shù)據(jù)資源,如*文件、*文件及其他軟件()生成的數(shù)據(jù)文件、高級語言生成的數(shù)據(jù)文件等。系統(tǒng)可以用來解決自然科學(xué)和社會科學(xué)各個領(lǐng)域中的各類問題如統(tǒng)計學(xué)、經(jīng)濟(jì)學(xué)、生物工程學(xué)衛(wèi)生醫(yī)療、金融證券、社會調(diào)查等。系統(tǒng)具有多硬件廠商結(jié)構(gòu),可支持多種硬件平臺,它可以在大型計算機(jī),小型計算機(jī)及微機(jī)上運(yùn)行,對于“軟件環(huán)境”,系統(tǒng)可以在十幾種不同的操作系統(tǒng)下運(yùn)行(如,,,,,,,,,等)[1]黃燕,吳平.SAS統(tǒng)計分析及應(yīng)用.機(jī)械工業(yè)出版社,2007(11):1-2.[1]黃燕,吳平.SAS統(tǒng)計分析及應(yīng)用.機(jī)械工業(yè)出版社,2007(11):1-2.)擴(kuò)展性能強(qiáng)、沒有上限的軟件系統(tǒng)系統(tǒng)模塊或結(jié)構(gòu)可以讓用戶靈活地按自己的需要去選擇相關(guān)的模塊與軟件一起完成各種應(yīng)用的需要。)系統(tǒng)可以作為用戶唯一需要的最經(jīng)濟(jì)的軟件系統(tǒng)。銀行重慶分行客戶關(guān)系管理現(xiàn)狀分析銀行重慶分行簡介銀行成立于年月日,是我國第一家完全由企業(yè)法人持股的股份制商業(yè)銀行,總行設(shè)在深圳。自成立以來,銀行先后進(jìn)行了四次增資擴(kuò)股,并于年月成功發(fā)行了億普通股,月日在上交所掛牌(股票代碼:),是國內(nèi)第一家采用國際會計標(biāo)準(zhǔn)上市的公司。年月日,銀行()在香港聯(lián)合交易所正式掛牌上市。年月,被《亞洲貨幣》雜志評為“年度中國最佳本土銀行”,年月入圍世界強(qiáng)企業(yè);年月銀行家雜志社組織的“中國商業(yè)銀行競爭力排名”中榮獲“年全國性商業(yè)銀行核心競爭力排名第二名”;年月,在美國紐約設(shè)立的分行正式開業(yè)。銀行重慶分行成立于年月,自成立以來,銀行重慶分行堅持秉承招行系統(tǒng)自上而下的“因勢而變”、“因您而變”服務(wù)理念,充分發(fā)揮自身優(yōu)勢,不斷將銀行重慶分行“一卡通”、“一網(wǎng)通”、“金葵花理財”、“點(diǎn)金理財”、國際標(biāo)準(zhǔn)雙幣信用卡、“財富賬戶”等金融服務(wù)品牌推向深入。銀行重慶分行在重慶地區(qū),零售業(yè)務(wù)方面具有明顯優(yōu)勢,年底,儲蓄存款達(dá)到億,在重慶地區(qū)排名第六,排在工、農(nóng)、中、建、交之后,高于重慶銀行,是其它一些銀行儲蓄存款的數(shù)倍。銀行重慶分行在零售客戶分類上分為普通客戶、金卡客戶、金葵花客戶(客戶),金卡客戶是指總資產(chǎn)在萬元以上的客戶,客戶是指總資產(chǎn)在萬以上的客戶,分行根據(jù)客戶不同類型提供相應(yīng)的理財服務(wù)。在客戶關(guān)系管理方面,零售業(yè)務(wù)數(shù)據(jù)量太大,僅分行客戶數(shù)就在萬以上,同時由于客戶每筆交易均要產(chǎn)生一條記錄,數(shù)據(jù)庫龐大。分行技術(shù)人員較少,主要任務(wù)是實(shí)現(xiàn)對各支行的數(shù)據(jù)統(tǒng)計和考核分析,在客戶層面主要是對客戶的總資產(chǎn)進(jìn)行統(tǒng)計分析,缺少進(jìn)一步的數(shù)據(jù)挖掘。各支行客戶經(jīng)理根據(jù)統(tǒng)計的客戶總資產(chǎn)情況以及總行的營銷策略分類對客戶進(jìn)行銀行產(chǎn)品營銷。銀行重慶分行客戶數(shù)據(jù)分析與利用的現(xiàn)狀與問題銀行重慶分行建立了專門的客戶數(shù)據(jù)管理倉庫,包含了客戶近幾年交易的全部數(shù)據(jù),由于零售業(yè)務(wù)本身交易量大,僅分行客戶數(shù)就在萬以上,客戶每筆交易均要產(chǎn)生一條記錄,每天交易數(shù)據(jù)庫全部記錄在數(shù)據(jù)庫中,數(shù)據(jù)庫龐大;分行近有兩名電腦人員負(fù)責(zé)完成各網(wǎng)點(diǎn)對數(shù)據(jù)統(tǒng)計分析的需要,電腦人員重點(diǎn)是開發(fā)對網(wǎng)點(diǎn)的各項業(yè)務(wù)完成情況的考核,同時負(fù)責(zé)為各業(yè)務(wù)部門提供所需要的各種統(tǒng)計數(shù)據(jù),因而在客戶的資產(chǎn)統(tǒng)計方面做的工作較多,而對客戶數(shù)據(jù)的進(jìn)一步挖掘較少,分行也缺少對客戶數(shù)據(jù)進(jìn)行挖掘的工具。在競爭如此激烈的金融市場上分行在有些方面存在有待完善的地方。①數(shù)據(jù)處理不完善:客戶量大、交易次數(shù)生成的數(shù)據(jù)量更加龐大,銀行重慶分行對巨大的交易數(shù)據(jù)進(jìn)行了簡單統(tǒng)計處理,但較少進(jìn)行深入分析,對有效區(qū)分客戶的重要程度進(jìn)行客戶價值細(xì)分提供差異化的服務(wù)方面存在不足。②缺少差異化客戶關(guān)系管理策略:以前對大量數(shù)據(jù)進(jìn)行簡單統(tǒng)計處理,在根據(jù)客戶價值差異進(jìn)行客戶價值細(xì)分,設(shè)定個性化服務(wù)模式方面有所欠缺。以往分行針對不同客戶提供的差異化服務(wù)不強(qiáng)。\*③只針對客戶的資產(chǎn)進(jìn)行客戶價值劃分,未對客戶的活動強(qiáng)度進(jìn)行分析,客戶的活動強(qiáng)度反應(yīng)了客戶的行為特征,對銀行具有重要意義。由于客戶對銀行的服務(wù)要求越來越高,銀行金融市場競爭加劇,銀行危機(jī)意識增強(qiáng),需要利用現(xiàn)代的處理方法使自己在金融市場立于不敗之地。銀行重慶分行客戶關(guān)系管理現(xiàn)狀銀行重慶分行在客戶關(guān)系管理的客戶細(xì)分中將零售客戶分類為普通客戶、金卡客戶、金葵花客戶(客戶),金卡客戶是指總資產(chǎn)在萬元以上的客戶,客戶是指總資產(chǎn)在萬以上的客戶或者是客戶總資產(chǎn)曾經(jīng)達(dá)到萬以上的客戶,分行根據(jù)客戶不同類型提供差異化的服務(wù)。在客戶關(guān)系管理方面,分行給萬以上存款的客戶發(fā)金卡,客戶發(fā)給金葵花卡。分行各營業(yè)網(wǎng)點(diǎn)分別設(shè)立普通大廳、金卡區(qū)和區(qū),金卡客戶可以在普通大廳以及金卡區(qū)接受服務(wù),客戶可以在三個區(qū)接受服務(wù)。分行在各網(wǎng)點(diǎn)設(shè)有理財專柜,服務(wù)于對理財有需求的客戶,在各網(wǎng)點(diǎn)設(shè)有零售客戶經(jīng)理,客戶經(jīng)理主要對客戶提供一對一的服務(wù)。由于零售客戶數(shù)量大,銀行只能根據(jù)客戶的要求提供較完善的服務(wù),不定期組織一部分客戶參加理財講座,或組織其參加一些聚會等活動;對于金卡和普通卡客戶只能在存取業(yè)務(wù)款等業(yè)務(wù)上提供不同的等候服務(wù),無法進(jìn)一步差異服務(wù)。分行技術(shù)人員主要向網(wǎng)點(diǎn)客戶經(jīng)理提供客戶的總資產(chǎn)等資料,客戶經(jīng)理在為客戶服務(wù)時,無法區(qū)別客戶的要求,只能依靠日常與客戶的交往收集到客戶部分的需要,根據(jù)客戶的要求提供相關(guān)的服務(wù),或者根據(jù)分行的要求向客戶提供相關(guān)的服務(wù)和理財信息。在針對不同客戶的差異化服務(wù)上考慮不夠全面,客戶細(xì)分不夠透徹,未考慮客戶的活動強(qiáng)度。從這點(diǎn)我們可以看出銀行重慶分行需要采用現(xiàn)代的處理方式對龐大的交易數(shù)據(jù)進(jìn)行分析,找出適當(dāng)?shù)目蛻艄芾聿呗苑椒?。從商業(yè)角度理解數(shù)據(jù)的目標(biāo)和要求,然后把理解轉(zhuǎn)化為數(shù)據(jù)挖掘問題。我們必須明確項目的商業(yè)目標(biāo),這個目標(biāo)適于用基于聚類分析的方法去達(dá)到,比如不同客戶的服務(wù)是“了解不同客戶群的行為特征”。隨著業(yè)務(wù)的飛速發(fā)展,銀行重慶分行雖然已經(jīng)在零售業(yè)客戶方面獲得良好市場表現(xiàn),但在親近客戶方面,提供個性化服務(wù)方面還存在不足,銀行重慶分行需要保持自身優(yōu)勢的同時,加強(qiáng)客戶價值細(xì)分的管理,使針對不同價值的客戶做不同的方案,這方面也要在同行業(yè)中保持領(lǐng)先水平。基于數(shù)據(jù)挖掘的客戶價值研究總體思路基于以上分析,針對該公司的具體現(xiàn)狀情況,本文在數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)上采用聚類分析,從信息技術(shù)和客戶關(guān)系管理的角度出發(fā),對該銀行隨機(jī)抽樣提取出來的客戶數(shù)據(jù)進(jìn)行全面分析管理,對客戶進(jìn)行價值細(xì)分,建立差異化的服務(wù)模式,從而提出一套有針對性的客戶管理策略?;跀?shù)據(jù)挖掘方法的銀行重慶分行策略制定的流程圖如下圖所示:問題確定問題確定數(shù)據(jù)預(yù)處理基于聚類結(jié)果進(jìn)行客戶分類方案的制定銀行收益的聚類分析客戶活動強(qiáng)度的聚類分析圖基于聚類的策略流程圖面向的聚類分析本章首先對銀行重慶分行數(shù)據(jù)處理方面存在的問題和不足進(jìn)行描述;然后對銀行重慶分行數(shù)據(jù)庫中抽樣出來的條原始交易數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;預(yù)處理過的數(shù)據(jù)再從兩方面進(jìn)行數(shù)據(jù)挖掘聚類分析,一方面是基于客戶活動強(qiáng)度(客戶在銀行的交易次數(shù))進(jìn)行聚類,另一方面是基于客戶給銀行帶來的收益進(jìn)行聚類;最后對聚類結(jié)果進(jìn)行評估。問題描述在競爭日益激烈的市場中,銀行承受著巨大的壓力。如果銀行不積極的采取相應(yīng)措施加大力度為現(xiàn)有客戶提供高質(zhì)量的差異化服務(wù),保持現(xiàn)有客戶并爭取新客戶的加入,就會讓競爭對手日漸強(qiáng)大,自己日益落后。根據(jù)銀行客戶數(shù)據(jù)信息進(jìn)行客戶價值分析,設(shè)定差異化的服務(wù)模式就變得更加重要。當(dāng)今,客戶關(guān)系管理是各大銀行越來越重視的一部分。哪些顧客是對銀行有價值的,哪些是能在將來為銀行創(chuàng)增收入的,這些特征要素關(guān)系到銀行的成本、收益、推出各種服務(wù)的收益率、市場策略、服務(wù)手段等。銀行面臨著海量的客戶數(shù)據(jù),憑肉眼很難看出怎樣更有效地進(jìn)行客戶分類和提供個性化服務(wù)。銀行傳統(tǒng)意義上基于簡單的客戶身份(客戶的年薪)或者客戶存款數(shù)額來確定是否為大客戶這種方式顯得不那么準(zhǔn)確了,如果不能很好的提供高價值客戶服務(wù)會嚴(yán)重影響銀行的收益甚至流失客源,使在激烈的競爭中處于劣勢。對銀行而言,目前尚處在數(shù)據(jù)挖掘的初步實(shí)施和使用階段——即:通過先進(jìn)的設(shè)備和大量的投入可以將客戶數(shù)據(jù)進(jìn)行完整的集中,并能妥善及時的存儲和備份,由部門精心的管理和維護(hù)。雖然企業(yè)花費(fèi)了大量的人、財、物等資源在上面,但存儲下來的數(shù)據(jù)本身卻很少為企業(yè)創(chuàng)造價值。而數(shù)據(jù)挖掘技術(shù)與身俱來就與海量數(shù)據(jù)密不可分,其強(qiáng)大的數(shù)學(xué)算法使得它能勝任對海量數(shù)據(jù)的準(zhǔn)確分析處理,可以在當(dāng)前巨大銷售數(shù)據(jù)中發(fā)揮作用,讓這些看似普通的銷售數(shù)據(jù)釋放出珍貴信息,幫助我們進(jìn)行科學(xué)的市場細(xì)分并做出實(shí)時性強(qiáng)的促銷策略。此外,銀行在海量客戶數(shù)據(jù)分析上做得不夠,往往沒有完全的建立在對客戶價值、客戶特征進(jìn)行科學(xué)客觀的分析上。鑒于目前的現(xiàn)狀,我們通過數(shù)據(jù)挖掘聚類技術(shù)對銀行重慶分行的海量數(shù)據(jù)進(jìn)行分析,對客戶在銀行的行為特征和客戶價值進(jìn)行聚類,基于聚類的結(jié)果制定客戶關(guān)系管理策略。數(shù)據(jù)采集與預(yù)處理數(shù)據(jù)模型數(shù)據(jù)模型是建立客戶分類數(shù)據(jù)挖掘聚類模型的前提和條件。數(shù)據(jù)的屬性及類型見下表和所示:表銀行收益數(shù)據(jù)的屬性及類型序號屬性名屬性含義屬性類型客戶代碼代表客戶名稱的代碼第一季度收益某個客戶在第一季度為銀行帶來的收益額,主要包括存款收益、消費(fèi)收益、網(wǎng)上消費(fèi)收益、繳費(fèi)收益等第二季度收益某個客戶在第二季度為銀行帶來的收益額,主要包括存款收益、消費(fèi)收益、網(wǎng)上消費(fèi)收益、繳費(fèi)收益等第三季度收益某個客戶在第三季度為銀行帶來的收益額,主要包括存款收益、消費(fèi)收益、網(wǎng)上消費(fèi)收益、繳費(fèi)收益等第四季度收益某個客戶在第四季度為銀行帶來的收益額,主要包括存款收益、消費(fèi)收益、網(wǎng)上消費(fèi)收益、繳費(fèi)收益等本數(shù)據(jù)模型用于表示某客戶在每個季度的不同交易行為為銀行帶來的總收益,其中客戶代碼代表銀行在這段時間里隨機(jī)抽樣出來的客戶;“第一季度收益”表示銀行抽樣出來的某客戶在第一季度為銀行帶來的收益金額,包括存款收益、繳費(fèi)收益、扣費(fèi)收益、網(wǎng)上消費(fèi)收益、消費(fèi)收益等;“第二季度收益”表示抽樣出來的某個客戶在第二季度為銀行帶來的收益額;其他類型類似。表客戶活動強(qiáng)度的屬性及類型序號屬性名屬性含義屬性類型客戶代碼代表客戶名稱的代碼第一季度交易強(qiáng)度某客戶第一季度在銀行交易的次數(shù)合計,主要包括存款次數(shù)、網(wǎng)上消費(fèi)次數(shù)、消費(fèi)次數(shù)、取款次數(shù)、繳費(fèi)次數(shù)等第二季度交易強(qiáng)度某客戶第二季度在銀行交易的次數(shù)合計,主要包括存款次數(shù)、網(wǎng)上消費(fèi)次數(shù)、消費(fèi)次數(shù)、取款次數(shù)、繳費(fèi)次數(shù)等第三季度交易強(qiáng)度某客戶第三季度在銀行交易的次數(shù)合計,主要包括存款次數(shù)、網(wǎng)上消費(fèi)次數(shù)、消費(fèi)次數(shù)、取款次數(shù)、繳費(fèi)次數(shù)等第四季度交易強(qiáng)度某客戶第四季度在銀行交易的次數(shù)合計,主要包括存款次數(shù)、網(wǎng)上消費(fèi)次數(shù)、消費(fèi)次數(shù)、取款次數(shù)、繳費(fèi)次數(shù)等本數(shù)據(jù)模型用于表示某客戶每季度在銀行的交易次數(shù)行為特征,反映該客戶在銀行的活動強(qiáng)度。其中客戶代碼代表銀行在制定時間里隨機(jī)抽樣出來的客戶;“第一季度交易強(qiáng)度”表示抽樣出來的某客戶第一季度在銀行所有交易次數(shù)的合計,其中包括存款次數(shù)、網(wǎng)上消費(fèi)次數(shù)、消費(fèi)次數(shù)、取款次數(shù)、繳費(fèi)次數(shù)等所有交易活動的次數(shù);“第二季度交易強(qiáng)度”表示抽樣出來的某一客戶在第二季度中在銀行所有交易次數(shù)的合計,其他類型類似。數(shù)據(jù)預(yù)處理①數(shù)據(jù)采集本論文使用的是從銀行重慶分行數(shù)據(jù)庫中隨機(jī)抽樣的重慶地區(qū)部分客戶年在該銀行的所有交易記錄,由數(shù)據(jù)庫的真實(shí)數(shù)據(jù)來構(gòu)建聚類模型。以客戶為銀行所帶來的收益為具體研究對象,從其中心數(shù)據(jù)庫隨機(jī)抽取年月至月重慶地區(qū)部分客戶的數(shù)據(jù)。為了研究主題的需要,聚類分析中以客戶名和客戶每季度為銀行帶來的收益為屬性,一共個屬性。原始數(shù)據(jù)包含了個客戶約條交易記錄;基于上述數(shù)據(jù),對原始數(shù)據(jù)進(jìn)行了預(yù)處理,得到了數(shù)據(jù)模型的初步目標(biāo)數(shù)據(jù)集。數(shù)據(jù)模型包含觀測值個客戶,種屬性。②數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理是對選擇后的數(shù)據(jù)進(jìn)一步整理,檢查數(shù)據(jù)完整性以及數(shù)據(jù)的一致性,并通過一些操作減少數(shù)據(jù)量,減少數(shù)據(jù)噪聲,將數(shù)據(jù)轉(zhuǎn)換成適合挖掘聚類的形式。本研究中建立了個數(shù)據(jù)模型,第一個是銀行收益客戶數(shù)據(jù)模型,第二個是客戶交易強(qiáng)度數(shù)據(jù)模型。兩個數(shù)據(jù)模型的預(yù)處理流程圖如下:)基于銀行收益的數(shù)據(jù)預(yù)處理流程圖如下圖所示:屬性選擇客戶資料數(shù)據(jù)庫中的原始記錄包括消費(fèi)、保險金額、貸款金額、工資金額、柜臺存款、柜臺取款、國債金額、基金金額、繳費(fèi)金額、理財金額、網(wǎng)上消費(fèi)、銀行扣費(fèi)、證券交易、自助存款、自助取款等。但很多屬性對聚類貢獻(xiàn)小,因此在屬性選擇上將國債、基金等其他屬性刪除,只留下對銀行收益貢獻(xiàn)大的屬性。同時考慮到所有客戶存款、扣費(fèi)等種類較多,在進(jìn)行數(shù)據(jù)轉(zhuǎn)換時會影響聚類效果,因此在屬性選擇上將同種類型的活動進(jìn)行合并(如:自動存款和柜臺存款合并為存款),以利于聚類分析。數(shù)據(jù)挖掘聚類分析在數(shù)據(jù)導(dǎo)入時不需要目標(biāo)變量,所以沒有目標(biāo)屬性。整理后形成聚類分析所需的數(shù)據(jù)類型。數(shù)據(jù)分析與調(diào)整在進(jìn)行數(shù)據(jù)分析時,原始數(shù)據(jù)可能有缺陷,建立數(shù)據(jù)挖掘模型之前需要根據(jù)具體問題對數(shù)據(jù)進(jìn)行進(jìn)一步的調(diào)整,用對數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)采集的時間原始數(shù)據(jù)中,記錄了客戶在年個月中的每次交易記錄,我們不需要具體的單次交易記錄,為了研究需要以季度為時間段。利用對數(shù)據(jù)進(jìn)行處理,一個季度中的多次交易記錄金額按照不同的消費(fèi)類型相加,得出每季度每項消費(fèi)的總交易金額量。數(shù)據(jù)匯總由于每次的交易記錄都記載在原始數(shù)據(jù)中,出現(xiàn)了多少次交易客戶名就會重復(fù)多少次。不便于進(jìn)行數(shù)據(jù)分析,必須進(jìn)行屬性約簡。用中的自動篩選將同一客戶的交易記錄匯總,最后每個客戶在銀行的不同活動(如:消費(fèi)、網(wǎng)上消費(fèi))的交易記錄在一個季度中只出現(xiàn)一次。制出季度交易總額表如下客戶一季度扣費(fèi)額一季度繳費(fèi)金額……元元…………續(xù)上圖:計算收益按照季度交易總額表計算出收益表。如果數(shù)據(jù)直接進(jìn)行聚類分析,分類太細(xì)旁支太多,很難看出效果,所以按照銀行收益率,把不同類型的交易金額乘以該項的收益率計算出該項的銀行收益額。如:客戶在季度中消費(fèi)共元,銀行對消費(fèi)的收益率為,該項銀行的收益為:*元。各項的收益金額再相加,最后形成每季度的總收益表節(jié)選如下:客戶一季度收益金額二季度收益金額……元元…………屬性名稱修改中用簡單的英文名稱好識別,在收益金額表中季度名稱用代替,個季度分別由表示,客戶名稱用表示。如:屬性表示銀行重慶分行某個客戶第一季度給銀行帶來的收益額。屬性表示不同客戶的代碼。觀測值名稱修改中數(shù)字和英文便于識別,個客戶分別用表示。修改后的收益表節(jié)選模型:…………數(shù)據(jù)歸一處理在聚類分析中,收益屬性重要性視為相同,因此將所有主要成份等價轉(zhuǎn)換到之間的數(shù)值。對每個數(shù)據(jù)進(jìn)行歸一處理,數(shù)據(jù)歸一化公式為:歸一化后收益表數(shù)據(jù)模型節(jié)選見下表所示…………圖收益數(shù)據(jù)預(yù)處理流程預(yù)。)基于銀行客戶活動強(qiáng)度的數(shù)據(jù)預(yù)處理流程圖如下圖所示:數(shù)據(jù)采集的時間原始數(shù)據(jù)中,記錄了客戶在年個月中的每次交易記錄,我們不需要具體的每次交易記錄,為了研究需要以季度為時間段。利用對數(shù)據(jù)進(jìn)行處理,把個月中的多次交易次數(shù)按季度匯總(如:客戶一季度在銀行繳費(fèi)次、網(wǎng)上消費(fèi)次,無其他交易,則交易次數(shù)就為次),得出每季度交易次數(shù)的合計。屬性名稱修改中用簡單的英文名稱好識別,在交易活動強(qiáng)度表中季度名稱用代替,個季度分別由表示,客戶名稱用表示。如:屬性表示銀行重慶分行某個客戶第一季度在銀行的所有交易次數(shù)。屬性表示不同客戶的代碼觀測值名稱修改中數(shù)字和英文便于識別,個客戶分別用表示。季度由表示,修改后的收益表節(jié)選模型:………………數(shù)據(jù)歸一處理在聚類分析中,產(chǎn)品屬性重要性視為相同,因此將所有主要成份等價轉(zhuǎn)換到之間的數(shù)值。對每個數(shù)據(jù)進(jìn)行歸一處理,數(shù)據(jù)歸一化公式為:歸一化后客戶活動強(qiáng)度表數(shù)據(jù)模型節(jié)選如下:………………圖交易活動強(qiáng)度預(yù)處理流程交。聚類分析使用工具,先將處理好的數(shù)據(jù)導(dǎo)入進(jìn)里的數(shù)據(jù)庫。從中用、和建立聚類模型。在模型中使用個屬性,對個客戶進(jìn)行聚類,得到性能較優(yōu)的模型,輸出模型運(yùn)行結(jié)果并進(jìn)行分析和解釋?;阢y行收益數(shù)據(jù)的聚類分析①數(shù)據(jù)導(dǎo)入數(shù)據(jù)分析調(diào)整以后就可以直接導(dǎo)入進(jìn)行數(shù)據(jù)挖掘。首先把“輸入數(shù)據(jù)集”以表格形式存儲在盤中,以英文命名。由軟件的文件項進(jìn)入導(dǎo)入項,將數(shù)據(jù)地址導(dǎo)入的數(shù)據(jù)庫中,以英文的方式再給導(dǎo)入的數(shù)據(jù)命名,此論文的導(dǎo)入數(shù)據(jù)命名為。在中導(dǎo)入數(shù)據(jù)集的截圖所示:圖中導(dǎo)入數(shù)據(jù)集的截圖②分析流程圖在中,建立“”分析流程圖,如圖所示:圖“”總流程圖③數(shù)據(jù)標(biāo)準(zhǔn)化打開節(jié)點(diǎn),選擇數(shù)據(jù)標(biāo)準(zhǔn)化后進(jìn)行一次聚類分析。如圖所示圖標(biāo)準(zhǔn)化選擇圖④點(diǎn)擊中的,進(jìn)行數(shù)據(jù)運(yùn)行,得到輸出結(jié)果,見表所示:表一次聚類結(jié)果表表示該數(shù)據(jù)一共聚成類,從第一類到第六類分別用、、、、、表示。代表每個類中一共有幾個對象。該數(shù)據(jù)的總客戶為位客戶。從聚類結(jié)果可以看出第一類、第三類、第六類分別只含有位、位、位客戶,而第四類含位客戶。因?yàn)榇罅繑?shù)據(jù)中存在少部分?jǐn)?shù)據(jù)分散,孤立點(diǎn)之間的距離大,按照聚類,孤立點(diǎn)被劃分為幾類,除開孤立點(diǎn)因而其他客戶就被劃分到第四類,第四類中包含有客戶位占到總客戶的,大量客戶沒有被劃分開。聚類結(jié)果中的均方差表示聚類結(jié)果的好壞,從此次聚類的均方差看值也比較大,聚類結(jié)果不理想。為了把大量數(shù)據(jù)分開,特此把客戶量最大的第四類拿出來進(jìn)行二次聚類,二次聚類的結(jié)果為下表所示:表二次聚類結(jié)果表二次聚類把第四類聚成了類,從第一類到第六類分別用、、、、、表示。第一類客戶量為,第二類客戶量為,第三類客戶量為,第四類客戶量為,第五類客戶量為,第六類客戶量為。第二次聚類的結(jié)果整合第一次聚類結(jié)果來看符合銀行對客戶的劃分需求(的高價值看客戶、的中價值客戶、的低價值客戶)。兩聚類結(jié)果和銀行的現(xiàn)行需求幾乎吻合,均方差的值明顯變小,此次聚類結(jié)果可以接受。不用進(jìn)行第三次聚類。兩次聚類客戶分類見下表和所示:表一次聚類客戶分類類別編號客戶數(shù)量客戶………………表第二次聚類客戶分類類別編號客戶數(shù)量客戶,……,……,……,……,……,……基于兩次聚類可以把所有的樣本客戶分為類,分別為類一共個類別。基于客戶活動強(qiáng)度數(shù)據(jù)的聚類分析①數(shù)據(jù)導(dǎo)入客戶強(qiáng)度是反映客戶在銀行的交易次數(shù)頻繁度。在對客戶每季交易次數(shù)的數(shù)據(jù)分析調(diào)整以后直接導(dǎo)入進(jìn)行聚類。軟件的文件項進(jìn)入導(dǎo)入項,將數(shù)據(jù)地址導(dǎo)入的數(shù)據(jù)庫中,以英文的方式再給導(dǎo)入的數(shù)據(jù)命名,此論文的導(dǎo)入數(shù)據(jù)命名為。在中導(dǎo)入數(shù)據(jù)集的截圖所示:圖中導(dǎo)入數(shù)據(jù)集的截圖②分析流程圖在中,建立“”分析流程圖,如圖所示:圖“”總流程圖③點(diǎn)擊中的,運(yùn)行,得到輸出結(jié)果,見表所示:表聚類結(jié)果表表示該數(shù)據(jù)一共聚成類,是每個類中一共有幾個對象,即每類中包含的客戶數(shù)量。這次聚類結(jié)果一共分為類,從每類客戶數(shù)量上看孤立點(diǎn)少只有第二類和第八類,分別含有客戶位和位。其他類比較均衡,按銀行現(xiàn)行需求,此次分類可以把客戶按特征整合成銀行所需的強(qiáng)活躍客戶,中度活躍客戶,低活躍客戶。聚類結(jié)果的好壞根據(jù)均方差來看值較少,可以接受。不用再進(jìn)行次聚類。按客戶活動強(qiáng)度聚類后,每類包含的客戶見下表所示:表聚類客戶分類類別編號客戶數(shù)量客戶,……,……,……,……,……,……,……,……,……,,,……,……,……,……,聚類結(jié)果評估與解釋進(jìn)行聚類后,生成的統(tǒng)計量說明了有關(guān)此次聚類的信息。對聚類結(jié)果的評估一般是用(均方差)指標(biāo)和類的半徑進(jìn)行評估。聚類后,通過計算每個類的偏差來說明聚類效果的好壞。均方差值大說明類之間的成員共性小、差異大,聚類效果不理想;均方差值小說明類間的成員共性大、差異化小,聚類效果好。半徑是某類中的個對象,每個對象為一個點(diǎn),這類中所有的點(diǎn)形成的一個圓的半徑。半徑越小說明該類中的對象越集中,聚類效果越好;半徑越大說明該類中的對象分散,聚類效果不好。\*①銀行收益數(shù)據(jù)第一次聚類分析,聚為六類。見下面餅圖所示:圖基于銀行收益的客戶數(shù)據(jù)一次聚類餅圖此圖中每類的高度表示這一類含有的客戶數(shù)量,客戶數(shù)量越多類的高度就越高;類的顏色表示這一類質(zhì)心的半徑,半徑越大類的顏色越深,半徑越小顏色越淺。半徑越小說明該類中的對象越集中,聚類效果越好;半徑越大說明該類中的對象分散,聚類效果不好。此次聚類一共聚成了類,第一類客戶數(shù)量為,第二類客戶數(shù)量為,第三類客戶數(shù)量為,第四類客戶數(shù)量為,第五類客戶數(shù)量為,第六類客戶數(shù)量為。第一類顏色最深,此類中的客戶共性小,第四類顏色最淺,聚類效果最好。值見下表所示:表聚類結(jié)果表從欄可以看出本次聚類的均方差偏大,聚類結(jié)果不理想。因?yàn)榇罅康目蛻魯?shù)據(jù)中存在少量分散的數(shù)據(jù),孤立點(diǎn)多影響了聚類結(jié)果。因此把第一次聚類中客戶量最大的第四類拿出來進(jìn)行再次聚類。第二次聚類后的結(jié)果見下圖所示:圖基于銀行收益的客戶數(shù)據(jù)二次聚類餅圖此圖中每類的高度表示這一類含有的客戶數(shù)量,客戶數(shù)量越多,類的高度越高;類的顏色表示這一類質(zhì)心的半徑,半徑越大類的顏色越深,半徑越小顏色越淺。半徑小說明對象越集中,聚類效果好;半徑大說明對象分散,聚類效果不好。此次聚類一共聚成了類,第一類客戶數(shù)量為,第二類客戶數(shù)量為,第三類客戶數(shù)量為,第四類客戶數(shù)量為,第五類客戶數(shù)量為,第六類客戶數(shù)量為。第一類顏色最深,此類中的客戶共性小,第二類顏色最淺,聚類效果最好。值見下表所示:表聚類結(jié)果表銀行收益數(shù)據(jù)第二次聚類值較小,聚類結(jié)果比較理想?;趦纱尉垲悾y行收益數(shù)據(jù)的聚類結(jié)果可以接受,能夠很好的對客戶進(jìn)行分類。\*②基于客戶活動強(qiáng)度的聚類分析,一共聚為類。見餅圖所示:圖基于銀行客戶活動強(qiáng)度的聚類餅圖此圖中每類的高度表示這一類含有的客戶數(shù)量,客戶數(shù)量越多,類的高度越高;類的顏色表示這一類質(zhì)心的半徑,半徑越大該類的顏色就越深,半徑越小顏色越淺。半徑小說明對象越集中,聚類效果好;半徑大說明對象分散,聚類效果不好。此次聚類一共聚成了類,第一類客戶數(shù)量為,第二類客戶數(shù)量為,第三類客戶數(shù)量為,第四類客戶數(shù)量為,第五類客戶數(shù)量為,第六類客戶數(shù)量為,第七類客戶數(shù)量為,第八類客戶數(shù)量為,第九類客戶數(shù)量為,第十類客戶數(shù)量為,第十一類客戶數(shù)量為,第十二類客戶數(shù)量為,第十三類客戶數(shù)量為,第十四類客戶數(shù)量為,第十五類客戶數(shù)量為。第二類、四類、一類餅圖顏色較深,此類中的客戶共性小,第五類、七類、九類、類餅圖顏色最淺,聚類效果最好。值見下表所示:表聚類結(jié)果表客戶活動強(qiáng)度數(shù)據(jù)聚類后的值除第二類外幾乎都很小,但第二類的客戶數(shù)量極小,只有個客戶,不影響聚類效果。因此聚類結(jié)果可以接受。能夠有效的對客戶按照活動強(qiáng)度進(jìn)行劃分?;诰垲惖目蛻絷P(guān)系管理銀行為了取得好的收益,僅靠銀行內(nèi)部重建是不夠的,更主要的是爭取客戶的認(rèn)可,只有客戶才是銀行能否獲得最大盈利的最終決定者。研究表明:一個滿意的客戶會帶來筆生意,一個不滿意的客戶可能影響個的交易意愿。而不同的客戶對企業(yè)的貢獻(xiàn)是不一樣的,的客戶創(chuàng)造了的收益。因此對不同價值客戶的投入和管理是客戶關(guān)系管理的一個重點(diǎn)。要對客戶加以區(qū)別對待。最佳的客戶提供的價值比其他客戶高倍甚至倍。在大量的數(shù)據(jù)海洋中要挖掘出這些重要客戶的信息找出這部分高價值客戶,有針對性的個性化的為這部分客戶提供優(yōu)質(zhì)的服務(wù),盡最大努力長時間留住這類客戶?,F(xiàn)在最重要的就是劃分出不同價值的客戶,有針對性的滿足不同類型客戶的需求,最終給銀行帶來高收益。本章主要是進(jìn)行客戶價值分類,根據(jù)客戶的分類情況差異化的制定客戶關(guān)系管理策略。首先,根據(jù)第四章的聚類結(jié)果進(jìn)行客戶分類,一方面是基于銀行收益聚類結(jié)果進(jìn)行的客戶分類,另一方面是基于客戶在銀行的活躍程度聚類結(jié)果的客戶分類,按照兩種分類繪制客戶二維分類表最后將所有客戶劃為九類。其次,聚類后的客戶分類結(jié)果與銀行現(xiàn)行對客戶分類的結(jié)果進(jìn)行對比。然后,根據(jù)劃分出來的九類客戶分別對他們制定客戶關(guān)系管理策略,個性化的為他們提供服務(wù)以此增加他們的滿意度。最后,對制定出來的方案在銀行試應(yīng)用效果進(jìn)行預(yù)期估計?;诰垲惖目蛻舴诸惏凑浙y行的現(xiàn)行需求最終將銀行收益聚類結(jié)果和客戶活動強(qiáng)度聚類結(jié)果綜合為三大類。按照銀行收益聚類結(jié)果分為:高價值客戶(\*類),為銀行帶來較大價值的一類客戶;中價值客戶(\*類),為銀行帶來中等價值的客戶;低價值客戶(\*類),為銀行帶來很少的價值或沒有價值的客戶。按照客戶活動強(qiáng)度聚類結(jié)果分為三大類:強(qiáng)活躍客戶(\*類),在銀行的交易次數(shù)最多的一類客戶;中度活躍客戶(\*類),在銀行的交易次數(shù)相對一般的一類客戶;弱活躍客戶(\*類);在銀行的交易次數(shù)較少或在研究的時間段內(nèi)交易次數(shù)為零的客戶?;阢y行收益的客戶分類參考中的標(biāo)準(zhǔn)化均值對比圖進(jìn)行類類組合,最后把客戶劃分為高價值客戶(\*類),中價值客戶(\*類),低價值客戶(\*類)三大類。銀行收益數(shù)據(jù)進(jìn)行第一次聚類,聚成類,一次聚類中的第四類進(jìn)行第二次聚類聚成類,兩次聚類后樣本客戶一共聚成了類。每個類都有自己的特征,按照銀行客觀需要對類結(jié)果進(jìn)行組合。以聚類分析結(jié)果為基礎(chǔ),觀察類與類之間的特征進(jìn)行類類組合。以類的標(biāo)準(zhǔn)均值對比圖來說明類的特征,以此進(jìn)行類類組合。①高價值客戶分析首先以類為例進(jìn)行類的特征分析,類的標(biāo)準(zhǔn)化均值對比圖如下圖所示:圖標(biāo)準(zhǔn)化均值對比圖圖中,紅色表示類客戶給銀行帶來收益的平均金額;藍(lán)色表示所有客戶給銀行帶來收益的平均金額。二者相比較,可以看出類客戶特征:從節(jié)中的聚類結(jié)果中知道該類中客戶量位,總客戶量,占有客戶量。從圖中可以看出該類客戶給銀行帶來的平均收益遠(yuǎn)大于每個客戶為銀行帶來的平均收益。采用相似的方法對標(biāo)準(zhǔn)化均值對比圖進(jìn)行分析,其中類、、、、、、、與類有相似的特征。給銀行帶來的平均收益都遠(yuǎn)大于總客戶給銀行帶來的平均收益,歸為高價值客戶類——為銀行帶來收益最大的一類客戶。②中價值客戶分析以類為例進(jìn)行類的特征分析。類的標(biāo)準(zhǔn)化均值對比圖如下圖所示:圖標(biāo)準(zhǔn)化均值對比圖圖中,紅色表示類客戶給銀行帶來收益的平均金額;藍(lán)色表示所有客戶給銀行帶來收益的平均金額。二者相比較,得出類客戶的特征:從節(jié)中知道該類客戶量位,總客戶量,占總客戶的。從圖中可以看出該客戶給銀行帶來的平均收益稍大于總客戶為銀行帶來的平均收益。因此類客戶歸為中價值客戶——為銀行帶來收益相對約稍大的一類客戶。③低價值客戶分析以類為例進(jìn)行類的特征分析,類的標(biāo)準(zhǔn)化均值對比圖如下圖所示:圖標(biāo)準(zhǔn)化均值對比圖圖中,紅色表示類客戶給銀行帶來收益的平均金額;藍(lán)色表示所有客戶給銀行帶來收益的平均金額。二者相比較,得出類客戶的特征:從節(jié)中知道該類客戶量位,總客戶量,占總客戶的。從圖中可以看出該客戶給銀行帶來的平均收益遠(yuǎn)小于總客戶的平均收益。因此類客戶歸為\*低價值客戶——為銀行帶來收益很小或幾乎收益為零的一類客戶。根據(jù)兩次聚類結(jié)果一共聚了類,以標(biāo)準(zhǔn)化均值對比圖為劃分依據(jù),根據(jù)以上詳細(xì)的對每個類進(jìn)行分析和比較,找到不同類之間的共性和區(qū)別,把類進(jìn)行類類組合,劃分為高價值客戶、中價值客戶和低價值客戶。類劃分結(jié)果匯總?cè)缦卤硭荆罕砘阢y行收益的客戶分類客戶類型客戶(人數(shù))分組描述高價值客戶(\*類)()、()、()、()、()、()、()、()、(),合計人數(shù)()本組是強(qiáng)勢組,突出的特點(diǎn)是:此類的客戶量不大,約占客戶數(shù)量的,但給銀行帶來的平均收益遠(yuǎn)遠(yuǎn)大于其他客戶給銀行帶來的的平均收益額。中價值客戶(\*類)(),合計人數(shù)()該類客戶約占總客戶量的,對銀行的收益貢獻(xiàn)相對一般,中等。低價值客戶(\*類)(),合計人數(shù)()該類客戶數(shù)量大,約占總客戶數(shù)量的,但是本類客戶對銀行的貢獻(xiàn)很小,給銀行帶來的收益很少或幾乎沒有?;诨顒訌?qiáng)度的客戶分類參考中的標(biāo)準(zhǔn)化均值對比圖進(jìn)行類組合,對客戶分類??蛻艋顒訌?qiáng)度表示客戶在規(guī)定時間段內(nèi)在銀行的交易次數(shù)多少,交易次數(shù)越多客戶活動強(qiáng)度越大。按照客戶活動強(qiáng)度聚類結(jié)果分為三大類:強(qiáng)活躍客戶(\*類);中度活躍客戶(\*類);弱活躍客戶(\*類)??蛻艚灰状螖?shù)數(shù)據(jù)一共聚成了類,每個類都有自己的特征。觀察類與類之間的特征進(jìn)行類類組合,最后合并為三大類。以類的標(biāo)準(zhǔn)均值對比圖來說明類的特征,以此進(jìn)行類類組合。①強(qiáng)活躍客戶分析以類為例進(jìn)行類的特征分析,類的標(biāo)準(zhǔn)化均值對比圖如下圖所示:圖標(biāo)準(zhǔn)化均值對比圖圖中,紅色表示類客戶在銀行的平均交易次數(shù);藍(lán)色表示所有客戶在銀行的平均交易次數(shù)。二者相比較,可以看出類客戶特征:從節(jié)中的聚類結(jié)果中知道類中客戶量位,總客戶量,占有客戶量。從圖中可以看出該類客戶在給銀行的交易平均強(qiáng)度遠(yuǎn)大于每個客戶在銀行的平均交易強(qiáng)度。采用相似的分析方法,其中類、、、、、、、、、、與類有相似的特征。在銀行的平均交易次數(shù)都遠(yuǎn)大于總客戶在銀行的平均交易次數(shù),因此把這些類歸為——\*強(qiáng)活躍客戶類。②中度活躍客戶分析以類為例進(jìn)行類的特征分析,類的標(biāo)準(zhǔn)化均值對比圖如下圖所示:圖標(biāo)準(zhǔn)化均值對比圖圖中,紅色表示類客戶在銀行的平均交易次數(shù);藍(lán)色表示所有客戶在銀行的平均交易次數(shù)。二者相比較,可以看出類客戶的特征:從節(jié)中的聚類結(jié)果中知道類中客戶量位,總客戶量,占有客戶量。從圖中可以看出該類客戶在給銀行的平均交易約強(qiáng)于每個客戶在銀行的平均交易強(qiáng)度。采用相似的比較方法,類與類有相似的特征。在銀行的平均交易次數(shù)都約大于總客戶在銀行的平均交易次數(shù),因此把這些類歸為——\*中度活躍客戶類。③弱活躍客戶分析以類為例進(jìn)行類的特征分析,類的標(biāo)準(zhǔn)化均值對比圖如下圖所示:圖標(biāo)準(zhǔn)化均值對比圖圖中,紅色表示類客戶在銀行的平均交易次數(shù);藍(lán)色表示所有客戶在銀行的平均交易次數(shù)。二者相比較,可以看出類客戶的特征:從節(jié)中的聚類結(jié)果中知道類中客戶量位,總客戶量,占有客戶量。從圖中可以看出該類客戶在給銀行的平均交易強(qiáng)度遠(yuǎn)小于每個客戶在銀行的平均交易強(qiáng)度。采用相似的方法,其中類、、與類有相似的特征。在銀行的平均交易次數(shù)都遠(yuǎn)小于總客戶在銀行的平均交易次數(shù),因此把這些類歸為——\*弱活躍客戶類。根據(jù)聚類結(jié)果一共聚了類,以上詳細(xì)分析的標(biāo)準(zhǔn)化均值對比圖為劃分依據(jù),對每個類分別進(jìn)行分析和比較,找到不同類之間的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度茶山租賃與茶葉種植與農(nóng)業(yè)循環(huán)經(jīng)濟(jì)合作合同
- 二零二五年度數(shù)據(jù)中心工程聯(lián)營合作協(xié)議書
- 二零二五年度專業(yè)籃球俱樂部球員轉(zhuǎn)會合同
- 勞動合同復(fù)印件在2025年度的歸檔與法律效力審查協(xié)議
- 2025年度車隊掛靠及汽車租賃、維修保養(yǎng)、保險、配送及物流服務(wù)合同
- 二零二五年度共享辦公空間租賃終止協(xié)議
- 二零二五年度車輛贈與及駕駛安全培訓(xùn)及保險服務(wù)協(xié)議書范文
- 二零二五年度農(nóng)村土地置換與農(nóng)業(yè)人才培養(yǎng)合作協(xié)議
- 企業(yè)服務(wù)企業(yè)級IT服務(wù)支持與解決方案提供
- 2024年全球及中國書桌抽屜鎖行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 中小學(xué)生預(yù)防校園欺凌主題班會課件
- 煙草專賣法知識考試題庫及答案
- 人工智能對輿情分析的影響
- 2025年北海康養(yǎng)職業(yè)學(xué)院單招職業(yè)技能考試題庫參考答案
- 2025屆山東省菏澤市高三下學(xué)期一??荚嚉v史試題(含答案)
- 2025屆浙江省湖州、衢州、麗水高三11月三地市一??荚嚮瘜W(xué)試卷
- 2025年湖南藝術(shù)職業(yè)學(xué)院單招職業(yè)技能測試題庫參考答案
- 2025年湖南鐵道職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫學(xué)生專用
- 《臨床常見心理問題》課件
- 2025年廣州開發(fā)區(qū)水質(zhì)監(jiān)測中心第四次招考聘用編外人員2人高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 教學(xué)課件:《民事訴訟法》(本科)
評論
0/150
提交評論