銀行客戶(hù)分類(lèi)_第1頁(yè)
銀行客戶(hù)分類(lèi)_第2頁(yè)
銀行客戶(hù)分類(lèi)_第3頁(yè)
銀行客戶(hù)分類(lèi)_第4頁(yè)
銀行客戶(hù)分類(lèi)_第5頁(yè)
已閱讀5頁(yè),還剩114頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、PAGE 基于聚類(lèi)分析的客戶(hù)關(guān)系管理XX銀行重慶分行案例分析A Case Study研 究 生:盧闖Post Graduate: Lu Chuang指導(dǎo)教師:Supervisor: 重慶工商管理碩士學(xué)院ChongqingCollege of Master ofBusiness Administration二OO八年十一月Nov. 2008重慶工商管理碩士學(xué)院畢業(yè)論文 摘 要PAGE 109摘 要經(jīng)濟(jì)全球化,金融市場(chǎng)開(kāi)放與競(jìng)爭(zhēng),信息技術(shù)突飛猛進(jìn),銀行業(yè)務(wù)的發(fā)展,促進(jìn)了CRM在金融服務(wù)行業(yè)廣泛運(yùn)用。金融機(jī)構(gòu)正在應(yīng)用把客戶(hù)關(guān)系管理,整合客戶(hù)信息資源,發(fā)掘客戶(hù)價(jià)值,為客戶(hù)提供更加快捷、周到的產(chǎn)品和服務(wù)

2、,提高客戶(hù)滿意度和忠誠(chéng)度,吸引更多的客戶(hù),最終實(shí)現(xiàn)自身收益的最大化。在這種形勢(shì)下,如何細(xì)分客戶(hù),通過(guò)從客戶(hù)的交易中了解客戶(hù)喜好,進(jìn)而進(jìn)行差異化管理,成為銀行面臨的重大挑戰(zhàn)。我們通過(guò)先進(jìn)的數(shù)據(jù)挖掘技術(shù)分析現(xiàn)有客戶(hù)的需求、愛(ài)好等,針對(duì)性的提供個(gè)性化服務(wù),以改善銀行客戶(hù)經(jīng)理的營(yíng)銷(xiāo)手段,提高銀行的經(jīng)濟(jì)效益。XX銀行重慶分行自成立以來(lái),一直致力于客戶(hù)的差異化服務(wù),提升客戶(hù)的滿意度,取得良好的市場(chǎng)業(yè)績(jī)。隨著金融業(yè)的激烈競(jìng)爭(zhēng),外資銀行進(jìn)入中國(guó)市場(chǎng),XX銀行重慶分行的戰(zhàn)略發(fā)展需要提升客戶(hù)的服務(wù)質(zhì)量,以適應(yīng)激烈的市場(chǎng)競(jìng)爭(zhēng),保持行業(yè)的領(lǐng)先地位。本文根據(jù)XX銀行重慶分行現(xiàn)狀和實(shí)際抽樣數(shù)據(jù)情況,明確了在數(shù)據(jù)分析和處理

3、方面存在的問(wèn)題和不足,分析了XX銀行重慶分行的客戶(hù)現(xiàn)狀。在SAS聚類(lèi)分析上,從信息技術(shù)和客戶(hù)關(guān)系管理相結(jié)合的角度出發(fā),對(duì)銀行客戶(hù)進(jìn)行分類(lèi),找出不同類(lèi)型客戶(hù)的行為特征,以此對(duì)不同類(lèi)別的客戶(hù)制定相關(guān)的客戶(hù)關(guān)系管理策略,提供有針對(duì)性的差異化個(gè)性服務(wù),以使XX銀行重慶分行在激烈的金融市場(chǎng)競(jìng)爭(zhēng)中獲得大的收益,立于不敗之地。關(guān)鍵詞:數(shù)據(jù)挖掘,聚類(lèi)分析,客戶(hù)分類(lèi),客戶(hù)關(guān)系管理重慶工商管理碩士學(xué)院畢業(yè)論文 AbstractAbstractThe globalization of the economy, liberalization and competition of financial market, a

4、dvances in information technology, development of banking and business which promoteCRM wider application in the financial services industry. Financial institutions are regarding customer relationship management as a strategy, through the integration of information resources. Bank will improve custo

5、mer satisfaction and loyalty and maintain and attract more customers maximize their own profits at last.Under such circumstances, how to cluster customers and how to understand customerscharacteristics achieve the differentiated customer management strategy all which will be the major challenges. We

6、 could raise banks economic efficiency, through advanced data mining analysis of existing customer needs, preferences, etc.Chongqing branch of the XX bank commitment to personalized customer service since its establishment and made good market performance. With the fierce competition in the financia

7、l sector, foreign banks enter the Chinese market. Chongqing branch of theXX bank need to apply high-tech softwarein order to meet the fierce market competition, and maintain industry leadership.In this paper, it is in this context; understand the question and the inadequate and analysesCustomers sta

8、tus. Base on SAS clustering analyses from the information technology and customer relationship management, the banking clients were classified and identify different types of customer behavior characteristics. Base on customers behavior characteristic provide personalized service. In order CHONGQING

9、branch of XX Bank to be the largest winnerin the fierce competition of financial markets.Keywords: Data mining, Clusteringanalyses, Customer classify,CRM 重慶工商管理碩士學(xué)院畢業(yè)論文 目 錄目 錄TOC o 1-3 h z u HYPERLINK l _Toc214071993 摘要 PAGEREF _Toc214071993 h I HYPERLINK l _Toc214071994 Abstract PAGEREF _Toc2140719

10、94 h II HYPERLINK l _Toc214071996 1 緒論 PAGEREF _Toc214071996 h 1 HYPERLINK l _Toc214071997 1.1 研究的目的和意義 PAGEREF _Toc214071997 h 1 HYPERLINK l _Toc214071998 1.2 論文研究的主要內(nèi)容及框架 PAGEREF _Toc214071998 h 1 HYPERLINK l _Toc214071999 2 客戶(hù)關(guān)系管理與數(shù)據(jù)挖掘的相關(guān)理論概述 PAGEREF _Toc214071999 h 3 HYPERLINK l _Toc214072000 2.

11、1 客戶(hù)關(guān)系管理相關(guān)理論 PAGEREF _Toc214072000 h 3 HYPERLINK l _Toc214072001 2.1.1 CRM的定義與內(nèi)涵 PAGEREF _Toc214072001 h 3 HYPERLINK l _Toc214072002 2.1.2 CRM的核心管理思想 PAGEREF _Toc214072002 h 4 HYPERLINK l _Toc214072003 2.1.3 CRM所需要的技術(shù) PAGEREF _Toc214072003 h 6 HYPERLINK l _Toc214072004 2.2 數(shù)據(jù)挖掘理論 PAGEREF _Toc2140720

12、04 h 7 HYPERLINK l _Toc214072005 2.2.1 數(shù)據(jù)挖掘概述 PAGEREF _Toc214072005 h 7 HYPERLINK l _Toc214072006 2.2.2 數(shù)據(jù)挖掘的模式 PAGEREF _Toc214072006 h 8 HYPERLINK l _Toc214072007 2.2.3 數(shù)據(jù)挖掘在銀行客戶(hù)關(guān)系管理中的應(yīng)用 PAGEREF _Toc214072007 h 10 HYPERLINK l _Toc214072008 2.3 數(shù)據(jù)挖掘的聚類(lèi)分析理論 PAGEREF _Toc214072008 h 12 HYPERLINK l _Toc

13、214072009 2.3.1 聚類(lèi)的概念 PAGEREF _Toc214072009 h 12 HYPERLINK l _Toc214072010 2.3.2 聚類(lèi)算法的一般特征 PAGEREF _Toc214072010 h 12 HYPERLINK l _Toc214072011 2.3.3 K-mean算法簡(jiǎn)介 PAGEREF _Toc214072011 h 13 HYPERLINK l _Toc214072012 2.4 SAS Enterprise Miner簡(jiǎn)介 PAGEREF _Toc214072012 h 13 HYPERLINK l _Toc214072013 3 XX銀行

14、重慶分行客戶(hù)關(guān)系管理現(xiàn)狀分析 PAGEREF _Toc214072013 h 17 HYPERLINK l _Toc214072014 3.1 XX銀行重慶分行簡(jiǎn)介 PAGEREF _Toc214072014 h 17 HYPERLINK l _Toc214072015 3.2 XX銀行重慶分行客戶(hù)數(shù)據(jù)分析與利用的現(xiàn)狀與問(wèn)題 PAGEREF _Toc214072015 h 17 HYPERLINK l _Toc214072016 3.3 XX銀行重慶分行客戶(hù)關(guān)系管理現(xiàn)狀 PAGEREF _Toc214072016 h 18 HYPERLINK l _Toc214072017 3.4 基于數(shù)據(jù)挖

15、掘的客戶(hù)價(jià)值研究總體思路 PAGEREF _Toc214072017 h 19 HYPERLINK l _Toc214072018 4 面向CRM的聚類(lèi)分析 PAGEREF _Toc214072018 h 20 HYPERLINK l _Toc214072019 4.1 問(wèn)題描述 PAGEREF _Toc214072019 h 20 HYPERLINK l _Toc214072020 4.2 數(shù)據(jù)采集與預(yù)處理 PAGEREF _Toc214072020 h 21 HYPERLINK l _Toc214072021 4.2.1 數(shù)據(jù)模型 PAGEREF _Toc214072021 h 21 HY

16、PERLINK l _Toc214072022 4.2.2 數(shù)據(jù)預(yù)處理 PAGEREF _Toc214072022 h 22 HYPERLINK l _Toc214072023 4.3 聚類(lèi)分析 PAGEREF _Toc214072023 h 26 HYPERLINK l _Toc214072024 4.3.1 基于銀行收益數(shù)據(jù)的聚類(lèi)分析 PAGEREF _Toc214072024 h 26 HYPERLINK l _Toc214072025 4.3.2 基于客戶(hù)活動(dòng)強(qiáng)度數(shù)據(jù)的聚類(lèi)分析 PAGEREF _Toc214072025 h 28 HYPERLINK l _Toc214072026 4

17、.4 聚類(lèi)結(jié)果評(píng)估與解釋 PAGEREF _Toc214072026 h 30 HYPERLINK l _Toc214072027 5 基于聚類(lèi)的客戶(hù)關(guān)系管理 PAGEREF _Toc214072027 h 35 HYPERLINK l _Toc214072028 5.1 基于聚類(lèi)的客戶(hù)分類(lèi) PAGEREF _Toc214072028 h 35 HYPERLINK l _Toc214072029 5.1.1 基于銀行收益的客戶(hù)分類(lèi) PAGEREF _Toc214072029 h 35 HYPERLINK l _Toc214072030 5.1.2 基于活動(dòng)強(qiáng)度的客戶(hù)分類(lèi) PAGEREF _To

18、c214072030 h 39 HYPERLINK l _Toc214072031 5.1.3 基于客戶(hù)價(jià)值和活躍強(qiáng)度的客戶(hù)二維分類(lèi) PAGEREF _Toc214072031 h 43 HYPERLINK l _Toc214072032 5.2 基于聚類(lèi)的客戶(hù)分類(lèi)與銀行現(xiàn)有分類(lèi)情況對(duì)比分析 PAGEREF _Toc214072032 h 45 HYPERLINK l _Toc214072033 5.3 基于客戶(hù)細(xì)分的客戶(hù)關(guān)系管理策略 PAGEREF _Toc214072033 h 47 HYPERLINK l _Toc214072034 5.3.1 針對(duì)高價(jià)值不同活動(dòng)強(qiáng)度客戶(hù)策略 PAGER

19、EF _Toc214072034 h 47 HYPERLINK l _Toc214072035 5.3.2 針對(duì)中價(jià)值不同活動(dòng)強(qiáng)度客戶(hù)策略 PAGEREF _Toc214072035 h 49 HYPERLINK l _Toc214072036 5.3.3 針對(duì)低價(jià)值不同活動(dòng)強(qiáng)度客戶(hù)策略 PAGEREF _Toc214072036 h 52 HYPERLINK l _Toc214072037 5.4 預(yù)期應(yīng)用效果 PAGEREF _Toc214072037 h 53 HYPERLINK l _Toc214072038 6 結(jié)論 PAGEREF _Toc214072038 h 54 HYPERL

20、INK l _Toc214072039 致謝 PAGEREF _Toc214072039 h 55 HYPERLINK l _Toc214072040 參考文獻(xiàn) PAGEREF _Toc214072040 h 56重慶工商管理碩士學(xué)院畢業(yè)論文 1 緒 論1 緒 論1.1研究的目的和意義隨著金融體制改革的深化和銀行業(yè)的改制,以及外資銀行進(jìn)入中國(guó),銀行業(yè)的危機(jī)意識(shí)不斷增強(qiáng),國(guó)內(nèi)銀行業(yè)面臨更加激烈的競(jìng)爭(zhēng),特別是從2007年10月份美國(guó)次貸危機(jī)引發(fā)的全球金融危機(jī),直至發(fā)展成為全球的金融海嘯,導(dǎo)致國(guó)內(nèi)外銀行受到嚴(yán)重的沖擊。今年9月份美國(guó)第四大投資銀行雷曼兄弟的破產(chǎn),引起了全球銀行和企業(yè)的破產(chǎn)風(fēng)潮,致使全

21、球經(jīng)濟(jì)進(jìn)入冬天。在這種劇烈競(jìng)爭(zhēng)和嚴(yán)重沖擊下,哪家銀行能夠準(zhǔn)確把握客戶(hù)的需求并提供差異化的產(chǎn)品和服務(wù),哪家銀行就可能取勝,達(dá)到提高客戶(hù)滿意度和銀行收益增加的客戶(hù)和銀行雙贏局面??蛻?hù)是銀行最重要的資源,是銀行收益的主要來(lái)源??蛻?hù)關(guān)系管理(CRM)就是一個(gè)通過(guò)詳細(xì)管理企業(yè)與客戶(hù)之間的關(guān)系,使客戶(hù)價(jià)值最大化與企業(yè)收益最大化之間達(dá)到平衡的有效途徑。XX銀行重慶分行于1996年12月在重慶成立,堅(jiān)持秉承自上而下的“因勢(shì)而變”、“因您而變”服務(wù)理念,充分發(fā)揮自身優(yōu)勢(shì),不斷將XX銀行重慶分行“一卡通”、“一網(wǎng)通”、“金葵花理財(cái)”、“點(diǎn)金理財(cái)”、國(guó)際標(biāo)準(zhǔn)雙幣信用卡、“財(cái)富帳戶(hù)”等金融服務(wù)品牌推向深入。隨著XX銀

22、行重慶分行規(guī)模不斷擴(kuò)大,客戶(hù)交易數(shù)據(jù)庫(kù)越來(lái)越龐大,為對(duì)龐大的客戶(hù)信息資源進(jìn)行有效管理,需要建立適合于銀行發(fā)展的體系,在客戶(hù)基礎(chǔ)信息數(shù)據(jù)庫(kù)建立的基礎(chǔ)上,再對(duì)數(shù)據(jù)進(jìn)行挖掘和全面深入的分析處理。數(shù)據(jù)挖掘聚類(lèi)技術(shù)對(duì)銀行龐大數(shù)據(jù)進(jìn)行分析的優(yōu)點(diǎn)是顯而易見(jiàn)的:第一,對(duì)大量的數(shù)據(jù)進(jìn)行科學(xué)準(zhǔn)確的分析,劃分出數(shù)據(jù)的規(guī)律;第二,根據(jù)劃分的數(shù)據(jù)規(guī)律,對(duì)客戶(hù)進(jìn)行分類(lèi),并找出各類(lèi)客戶(hù)的特征;第三,對(duì)各類(lèi)客戶(hù)有針對(duì)性的制定出客戶(hù)關(guān)系管理策略方案,提供個(gè)性化服務(wù)。本文針對(duì)XX銀行重慶分行的發(fā)展需要,以及在大量數(shù)據(jù)處理方面存在的不足,結(jié)合實(shí)際情況,提出一系列可執(zhí)行方案,具有很強(qiáng)的針對(duì)性以及實(shí)際應(yīng)用意義。1.2論文研究的主要內(nèi)容

23、及框架本文對(duì)XX銀行重慶分行在數(shù)據(jù)處理方面存在的不足采用數(shù)據(jù)挖掘聚類(lèi)技術(shù)進(jìn)行了分析,對(duì)客戶(hù)進(jìn)行分類(lèi),針對(duì)不同類(lèi)別的客戶(hù)制定相關(guān)的客戶(hù)關(guān)系管理策略。論文的研究框架如圖1.1所示:論文研究的目的和意義論文研究的目的和意義數(shù)據(jù)挖掘和客戶(hù)關(guān)系管理的相關(guān)理論XX銀行重慶分行的客戶(hù)關(guān)系管理現(xiàn)狀分析基于聚類(lèi)的客戶(hù)分類(lèi)客戶(hù)關(guān)系管理策略的實(shí)施與應(yīng)用客戶(hù)聚類(lèi)分析圖1.1 論文研究框架重慶工商管理碩士學(xué)院畢業(yè)論文 2 客戶(hù)關(guān)系管理與數(shù)據(jù)挖掘的相關(guān)理論概述2客戶(hù)關(guān)系管理與數(shù)據(jù)挖掘的相關(guān)理論概述2.1客戶(hù)關(guān)系管理相關(guān)理論2.1.1CRM的定義與內(nèi)涵客戶(hù)關(guān)系管理(CRM) 是依靠信息技術(shù)實(shí)現(xiàn)的全新的管理模式,它強(qiáng)調(diào)客戶(hù)價(jià)

24、值和便利,充分利用以客戶(hù)為中心的資源,拓展全新的銷(xiāo)售方式和銷(xiāo)售渠道。企業(yè)任何產(chǎn)品的銷(xiāo)售,都是建立在良好的客戶(hù)關(guān)系基礎(chǔ)之上的,客戶(hù)關(guān)系成為企業(yè)發(fā)展的本質(zhì)要素。因此,客戶(hù)應(yīng)該被作為一種寶貴的資源納入到企業(yè)的經(jīng)營(yíng)發(fā)展中來(lái)1 1 廖俊松, 張金隆, 蔡淑琴. 論電子商務(wù)時(shí)代的客戶(hù)關(guān)系管理. 軟科學(xué), 2001,15(1):93-94.CRM定義CRM作為新興的管理概念,大量研究人員及機(jī)構(gòu)都提出了各自的CRM定義。下面給出幾個(gè)有代表性的CRM定義。Romano認(rèn)為,CRM就是“吸引并保持有經(jīng)濟(jì)價(jià)值的客戶(hù),驅(qū)逐并消除缺乏經(jīng)濟(jì)價(jià)值的客戶(hù)”。Group認(rèn)為,“CRM是指通過(guò)圍繞客戶(hù)細(xì)分來(lái)組織企業(yè),鼓勵(lì)滿足客戶(hù)

25、需要的行為,并實(shí)現(xiàn)客戶(hù)與供應(yīng)商之間聯(lián)系等手段,來(lái)提高盈利、收入和客戶(hù)滿意度的、遍及整個(gè)企業(yè)的商業(yè)策略?!盉urghard和Galimi認(rèn)為,“CRM是一個(gè)圍繞客戶(hù)需要和需求、重新設(shè)計(jì)企業(yè)及其業(yè)務(wù)流程的信息技術(shù)(IT)驅(qū)動(dòng)的概念,它將一系列方法、軟件以及互聯(lián)網(wǎng)接入能力同企業(yè)的以客戶(hù)為核心的商業(yè)戰(zhàn)略相結(jié)合,致力于利潤(rùn)、收益和客戶(hù)滿意度的提高”。Muther認(rèn)為,CRM是指“通過(guò)協(xié)調(diào)、整合、集成企業(yè)同客戶(hù)的所有接觸點(diǎn),既整合銷(xiāo)售、營(yíng)銷(xiāo)和服務(wù)流程,增強(qiáng)企業(yè)的獲利能力,增加企業(yè)的收益,CRM致力于建立、關(guān)懷及開(kāi)發(fā)利用與重要客戶(hù)之間的良好個(gè)人關(guān)系”。Schulze等人將CRM定義為“一種客戶(hù)導(dǎo)向的管理方法

26、,它是基于整合了前臺(tái)營(yíng)銷(xiāo)、銷(xiāo)售、服務(wù)所有信息的信息系統(tǒng)”。Swift認(rèn)為,CRM是指“企業(yè)通過(guò)富有意義的溝通,理解并影響客戶(hù)行為,最終實(shí)現(xiàn)提高客戶(hù)獲得、客戶(hù)保留、客戶(hù)忠誠(chéng)和客戶(hù)創(chuàng)利的目的”。CRM是一個(gè)將客戶(hù)信息轉(zhuǎn)化成積極的客戶(hù)關(guān)系的反復(fù)循環(huán)過(guò)程。上述這些關(guān)于CRM的界定,各有其側(cè)重之處。Romano是從客戶(hù)關(guān)系本質(zhì)出發(fā),強(qiáng)調(diào)了“關(guān)系”的經(jīng)濟(jì)價(jià)值,這也是如今學(xué)術(shù)界較為普遍接受的一種定義;Group的定義強(qiáng)調(diào)了商業(yè)策略;Osterle和Muther則是強(qiáng)調(diào)整合客戶(hù)接觸點(diǎn)和前臺(tái)各流程;Schulze等人認(rèn)為CRM是一種管理方法,強(qiáng)調(diào)以信息系統(tǒng)為基礎(chǔ),前后臺(tái)信息共享;Swift強(qiáng)調(diào)的是管理與客戶(hù)的關(guān)

27、系。CRM的內(nèi)涵由于CRM是一種新興的營(yíng)銷(xiāo)管理理論,企業(yè)界和理論界對(duì)其有不同的詮釋?zhuān)蓮南率鋈齻€(gè)層面來(lái)表述。首先CRM被認(rèn)為是一種營(yíng)銷(xiāo)管理理念。CRM的核心思想是將企業(yè)的客戶(hù)(包括最終客戶(hù)、分銷(xiāo)商和合作伙伴)作為最重要的企業(yè)資源,通過(guò)完善的客戶(hù)服務(wù)和深入的客戶(hù)分析來(lái)滿足客戶(hù)的需求,保證實(shí)現(xiàn)客戶(hù)的終生價(jià)值;其次,CRM也是一種旨在改善企業(yè)和客戶(hù)之間關(guān)系的新型管理機(jī)制。它實(shí)施于企業(yè)的市場(chǎng)營(yíng)銷(xiāo)、銷(xiāo)售、服務(wù)與技術(shù)支持等與客戶(hù)相關(guān)的領(lǐng)域,通過(guò)向企業(yè)的銷(xiāo)售、市場(chǎng)和客戶(hù)服務(wù)的專(zhuān)業(yè)人員提供全面、個(gè)性化的客戶(hù)資料,并強(qiáng)化跟蹤服務(wù)、信息分析的能力,使他們能夠協(xié)同建立和維護(hù)一系列與客戶(hù)和生意伙伴之間卓有成效的“一對(duì)

28、一關(guān)系”。一方面使企業(yè)得以提供更快捷和周到的優(yōu)質(zhì)服務(wù)、提高客戶(hù)滿意度、吸引和保持更多的客戶(hù),從而增加營(yíng)業(yè)額;另一方面則通過(guò)信息共享和優(yōu)化商業(yè)流程來(lái)有效地降低企業(yè)經(jīng)營(yíng)成本;最后,CRM也是一套管理軟件和技術(shù)。它是企業(yè)借助電子商務(wù)、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘、專(zhuān)家系統(tǒng)和人工智能各種技術(shù)手段,建立一個(gè)能搜集、追蹤和分析客戶(hù)信息的系統(tǒng),為企業(yè)的銷(xiāo)售、客戶(hù)服務(wù)和決策支持等領(lǐng)域提供一個(gè)業(yè)務(wù)自動(dòng)化的解決方案,實(shí)現(xiàn)了企業(yè)由傳統(tǒng)模式向以電子商務(wù)為基礎(chǔ)的現(xiàn)代企業(yè)的轉(zhuǎn)化1 1 王廣宇. 客戶(hù)關(guān)系關(guān)系方法論. 清華大學(xué)出版社, 2004(9): 87-106.CRM體現(xiàn)了兩個(gè)管理趨勢(shì)的轉(zhuǎn)變2 魯江, 熊燕. 提升中國(guó)現(xiàn)代企業(yè)

29、的核心競(jìng)爭(zhēng)力建立客戶(hù)關(guān)系管理. 科技進(jìn)步與對(duì)策, 2002(5):98-99.。一是企業(yè)從以產(chǎn)品為中心的模式逐漸向以客戶(hù)為中心的模式轉(zhuǎn)化。其次,CRM也表明了企業(yè)管理視角從“內(nèi)視型”向“外視型”的轉(zhuǎn)移。長(zhǎng)期以來(lái),傳統(tǒng)企業(yè)管理更關(guān)注的重心是企業(yè)內(nèi)部的生產(chǎn)部門(mén),對(duì)帶來(lái)更多效益的外部市場(chǎng)和客戶(hù)一直缺乏科學(xué)的管理,企業(yè)依靠“內(nèi)視型”的管理模式已難以適應(yīng)激烈的競(jìng)爭(zhēng),因此必須轉(zhuǎn)換自己的視角,整合企2 魯江, 熊燕. 提升中國(guó)現(xiàn)代企業(yè)的核心競(jìng)爭(zhēng)力建立客戶(hù)關(guān)系管理. 科技進(jìn)步與對(duì)策, 2002(5):98-99.2.1.2CRM的核心管理思想CRM的核心管理思想主要包括以下幾個(gè)方面:客戶(hù)是企業(yè)發(fā)展最重要的資源

30、之一企業(yè)發(fā)展需要對(duì)自己的資源進(jìn)行有效的組織與計(jì)劃。隨著人類(lèi)社會(huì)的發(fā)展,企業(yè)資源的內(nèi)涵也在不斷擴(kuò)展,早期的企業(yè)資源主要是指有形的資產(chǎn),包括土地、設(shè)備、廠房、原材料、資金等。其后企業(yè)資源概念擴(kuò)展到無(wú)形資產(chǎn),包括品牌、商標(biāo)、專(zhuān)利、知識(shí)產(chǎn)權(quán)等。再后來(lái),人們認(rèn)識(shí)到人力資源才是企業(yè)發(fā)展最重要的資源。時(shí)至工業(yè)經(jīng)濟(jì)時(shí)代后期,信息又成為企業(yè)發(fā)展的一項(xiàng)重要資源。乃至人們將工業(yè)經(jīng)濟(jì)時(shí)代后期稱(chēng)為“信息時(shí)代”。在人類(lèi)社會(huì)從“產(chǎn)品”導(dǎo)向時(shí)代發(fā)展為“客戶(hù)”導(dǎo)向時(shí)代的今天,客戶(hù)的選擇決定著一個(gè)企業(yè)的命運(yùn)。因此,客戶(hù)已經(jīng)成為當(dāng)今企業(yè)最重要的資源之一。在很多行業(yè)中,完整的客戶(hù)檔案或數(shù)據(jù)庫(kù)就是一個(gè)企業(yè)頗具價(jià)值的資產(chǎn)。通過(guò)對(duì)客戶(hù)資料

31、的深入分析并應(yīng)用銷(xiāo)售理論中的2/8法則將會(huì)顯著改善企業(yè)營(yíng)銷(xiāo)業(yè)績(jī)。對(duì)企業(yè)與客戶(hù)發(fā)生的各種關(guān)系進(jìn)行全面管理企業(yè)與客戶(hù)之間發(fā)生的關(guān)系,不僅包括單純的銷(xiāo)售過(guò)程所發(fā)生的業(yè)務(wù)關(guān)系,如合同簽訂、定單處理、發(fā)貨、收款等,而且包括在企業(yè)營(yíng)銷(xiāo)及售后服務(wù)過(guò)程中發(fā)生的各種關(guān)系。如在企業(yè)市場(chǎng)活動(dòng)、市場(chǎng)推廣過(guò)程中與潛在客戶(hù)發(fā)生的關(guān)系;在與目標(biāo)客戶(hù)接觸過(guò)程中,內(nèi)部銷(xiāo)售人員的行為、各項(xiàng)活動(dòng)及其與客戶(hù)接觸全過(guò)程所發(fā)生的關(guān)系;還包括售后服務(wù)過(guò)程中,企業(yè)服務(wù)人員對(duì)客戶(hù)提供關(guān)懷活動(dòng)、各種服務(wù)活動(dòng)、服務(wù)內(nèi)容、服務(wù)效果的記錄等,這也是企業(yè)與客戶(hù)的售后服務(wù)關(guān)系。對(duì)企業(yè)與客戶(hù)間可能發(fā)生的各種關(guān)系進(jìn)行全面管理,將會(huì)顯著提升企業(yè)營(yíng)銷(xiāo)能力,降低營(yíng)

32、銷(xiāo)成本,控制營(yíng)銷(xiāo)過(guò)程中可能導(dǎo)致客戶(hù)抱怨的各種行為,這是CRM的另一個(gè)重要管理思想。進(jìn)一步延伸企業(yè)供應(yīng)鏈管理20世紀(jì)90年代提出的ERP,原來(lái)是為了滿足企業(yè)的供應(yīng)鏈管理需要,但ERP 的實(shí)際應(yīng)用并沒(méi)有達(dá)到企業(yè)供應(yīng)鏈管理的目標(biāo),這既有ERP 本身功能方面的局限性,也有IT技術(shù)發(fā)展階段的局限性,最終ERP 系統(tǒng)又退回到幫助企業(yè)實(shí)現(xiàn)內(nèi)部資金流、物流與信息流一體化管理的系統(tǒng)。CRM系統(tǒng)作為ERP 系統(tǒng)中銷(xiāo)售管理的延伸,借助Internet 技術(shù),突破了供應(yīng)鏈上企業(yè)間的地域邊界和不同企業(yè)之間信息交流的組織邊界,建立起企業(yè)自己的B to B 和B to C 網(wǎng)絡(luò)營(yíng)銷(xiāo)模式。CRM系統(tǒng)與ERP系統(tǒng)的集成運(yùn)行才真

33、正解決了企業(yè)供應(yīng)鏈中的下游鏈管理問(wèn)題,將客戶(hù)、經(jīng)銷(xiāo)商、企業(yè)銷(xiāo)售部整合到一起,實(shí)現(xiàn)企業(yè)對(duì)客戶(hù)個(gè)性化需求的快速響應(yīng)。同時(shí)也幫助企業(yè)清除了營(yíng)銷(xiāo)體系中的中間環(huán)節(jié),通過(guò)新的扁平化營(yíng)銷(xiāo)體系,縮短響應(yīng)時(shí)間,降低銷(xiāo)售成本。80/20定律80/20定律是19 世紀(jì)意大利經(jīng)濟(jì)學(xué)家佩爾圖(Bilfredo.Pareto)率先發(fā)表的一項(xiàng)研究成果,后來(lái)被稱(chēng)為80/20 定律(也稱(chēng)佩爾圖定律)。此定律具體到企業(yè)業(yè)務(wù),可理解為:對(duì)于已經(jīng)與企業(yè)有業(yè)務(wù)往來(lái)的客戶(hù),其中80%的業(yè)務(wù)來(lái)自于20%的客戶(hù);同樣,對(duì)于暫時(shí)與企業(yè)還沒(méi)有業(yè)務(wù)往來(lái)但也是企業(yè)希望爭(zhēng)取到的潛在客戶(hù)而言,其中80%的潛在業(yè)務(wù)來(lái)自于20%的潛在客戶(hù)(潛在客戶(hù)可被認(rèn)為

34、是那些曾一次或多次與企業(yè)接觸過(guò)或企業(yè)與之接觸過(guò)的潛在客戶(hù)) 。80/20定律不僅給我們的市場(chǎng)、銷(xiāo)售帶來(lái)收益,使企業(yè)準(zhǔn)確的把握市場(chǎng),研發(fā)出具有市場(chǎng)占有力的產(chǎn)品,同時(shí)也作用于客戶(hù)服務(wù)這一層面,因現(xiàn)代的客戶(hù)服務(wù)已遠(yuǎn)遠(yuǎn)不局限于僅為客戶(hù)提供售后服務(wù),而是在服務(wù)的基礎(chǔ)上分析并挖掘客戶(hù)的購(gòu)買(mǎi)潛力,即購(gòu)買(mǎi)資格??蛻?hù)知識(shí)管理世界經(jīng)濟(jì)正進(jìn)入知識(shí)經(jīng)濟(jì)時(shí)代,知識(shí)經(jīng)濟(jì)是以知識(shí)為基礎(chǔ)的經(jīng)濟(jì),是建立在知識(shí)和信息的生產(chǎn)、分配和使用之上的經(jīng)濟(jì)。知識(shí)管理的重點(diǎn)是知識(shí)的識(shí)別、獲取、開(kāi)發(fā)、分解、存儲(chǔ)和共享,并為其構(gòu)建有效的途徑和機(jī)制,以運(yùn)用集體的智慧提高企業(yè)的應(yīng)變和創(chuàng)新能力。知識(shí)管理以信息管理為基礎(chǔ),是信息管理的延伸和發(fā)展,是利用技

35、術(shù)去分享知識(shí)(或信息) 并把它們作為創(chuàng)新(發(fā)明)的手段或杠桿。知識(shí)管理是適應(yīng)知識(shí)經(jīng)濟(jì)時(shí)代要求的新型管理模式,是迎接新時(shí)代挑戰(zhàn)的重要戰(zhàn)略??蛻?hù)知識(shí)管理是通過(guò)一組解決方案的集合尋找和識(shí)別與問(wèn)題有關(guān)的關(guān)鍵性信息,并將這些信息進(jìn)行提取,形成對(duì)某一問(wèn)題的專(zhuān)門(mén)知識(shí),并作為決策的依據(jù)。客戶(hù)管理的目的在于協(xié)助企業(yè)不斷的獲取、積累客戶(hù)知識(shí)并將這些知識(shí)運(yùn)用在企業(yè)的市場(chǎng)、銷(xiāo)售、客戶(hù)服務(wù)等各個(gè)領(lǐng)域,并讓這些知識(shí)發(fā)揮出杠桿作用,以提升企業(yè)客戶(hù)的滿意度和忠誠(chéng)度,從而降低生產(chǎn)和銷(xiāo)售成本,縮短銷(xiāo)售周期,擴(kuò)大市場(chǎng)份額,提高企業(yè)的效率和效益。因此,客戶(hù)知識(shí)管理是客戶(hù)關(guān)系管理的本質(zhì)。企業(yè)必須將知識(shí)有效地運(yùn)用到制定策略上,并讓這些知

36、識(shí)發(fā)揮出杠桿作用,才能有效地進(jìn)行客戶(hù)關(guān)系管理。2.1.3CRM所需要的技術(shù)詳細(xì)的客戶(hù)信息,而并非僅僅是有關(guān)交易和財(cái)務(wù)支付的原始數(shù)據(jù),是成功企業(yè)贏得和留住贏利性客戶(hù)的根本。將原始數(shù)據(jù)轉(zhuǎn)化為可操作的有效信息,對(duì)于營(yíng)造一種有突破性的共同業(yè)務(wù)決策環(huán)境是十分必要的。凡是經(jīng)過(guò)分析處理且能夠“被理解”的知識(shí),都有助于我們?cè)跔I(yíng)銷(xiāo)、銷(xiāo)售、服務(wù)、行政管理、資源管理以及各層次的決策和計(jì)劃上做出明智的選擇。具體所需的技術(shù)有:數(shù)據(jù)庫(kù)技術(shù)數(shù)據(jù)庫(kù)是按一定的數(shù)據(jù)模型組織、描述和存儲(chǔ)的,有組織、可共享的數(shù)據(jù)集合,是構(gòu)成數(shù)據(jù)庫(kù)系統(tǒng)的重要部分。數(shù)據(jù)庫(kù)技術(shù)是在文件系統(tǒng)基礎(chǔ)上發(fā)展起來(lái)的計(jì)算機(jī)數(shù)據(jù)管理技術(shù),它有效的解決了數(shù)據(jù)的獨(dú)立性問(wèn)題

37、,實(shí)現(xiàn)了數(shù)據(jù)的統(tǒng)一管理,達(dá)到數(shù)據(jù)共享的目的。數(shù)據(jù)庫(kù)系統(tǒng)則指引進(jìn)數(shù)據(jù)庫(kù)技術(shù)后的計(jì)算機(jī)系統(tǒng),它實(shí)際上是由有組織的、動(dòng)態(tài)存儲(chǔ)的有密切聯(lián)系的數(shù)據(jù)集合及對(duì)其進(jìn)行統(tǒng)一管理的計(jì)算機(jī)軟件和配件資源所組成的系統(tǒng)。它將有關(guān)部門(mén)中反映客觀事物的大量信息進(jìn)行記錄、分類(lèi)整理等定量、規(guī)范化處理,并以記錄為單位存貯于數(shù)據(jù)庫(kù)中。在數(shù)據(jù)庫(kù)系統(tǒng)的統(tǒng)一作用下,用戶(hù)通過(guò)應(yīng)用程序發(fā)出不同命令以得到滿足不同層次需要的各種信息1 1 鄧.皮泊斯, 馬沙.容格斯. 客戶(hù)關(guān)系管理. 中國(guó)金融出版社, 2006(1): 163-182.數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)作為信息科學(xué)的一個(gè)重要研究領(lǐng)域,數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)庫(kù)技術(shù)發(fā)展到一定程度的產(chǎn)物。

38、按Inmon的定義,“數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、時(shí)變的、非易失的數(shù)據(jù)集合,支持管理部門(mén)的決策過(guò)程”。而在數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)上的所謂數(shù)據(jù)挖掘,亦稱(chēng)數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),就是在海量數(shù)據(jù)中探索數(shù)據(jù)間的關(guān)系、并從中提取有效的、新穎的、有潛在價(jià)值的知識(shí)和規(guī)律的過(guò)程。它的作用是將數(shù)據(jù)轉(zhuǎn)換成信息和知識(shí),以便做出正確的決策;提供將知識(shí)應(yīng)用到操作系統(tǒng)中的機(jī)制,以便采取正確的行動(dòng)。數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)的結(jié)合,不僅能提高數(shù)據(jù)倉(cāng)庫(kù)對(duì)決策的支持能力,也能大大提高數(shù)據(jù)挖掘的工作效率2 2 管正, 魏冠明. 中國(guó)企業(yè)CRM實(shí)施. 人民郵電出版社, 2003(3): 70-79.CRM系統(tǒng)的建立和實(shí)現(xiàn)還涉及到其他許多技術(shù),

39、如通信技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、信息技術(shù)、人工智能技術(shù)等。本文著重討論數(shù)據(jù)庫(kù)技術(shù),因?yàn)閿?shù)據(jù)庫(kù)技術(shù)是進(jìn)行數(shù)據(jù)分析的基礎(chǔ),沒(méi)有數(shù)據(jù)庫(kù)技術(shù),也就沒(méi)有數(shù)據(jù)挖掘、數(shù)據(jù)倉(cāng)庫(kù)等高級(jí)數(shù)據(jù)分析工具的應(yīng)用。利用數(shù)據(jù)庫(kù)技術(shù)設(shè)計(jì)了一個(gè)CRM系統(tǒng),待運(yùn)行穩(wěn)定后逐步引入數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù),以便更好地分析客戶(hù)特征、了解客戶(hù)需求,更有效地進(jìn)行客戶(hù)關(guān)系管理。2.2數(shù)據(jù)挖掘理論2.2.1數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘,就是從數(shù)據(jù)集中提取隱含的、未知的、對(duì)決策有潛在價(jià)值的知識(shí)的過(guò)程。又稱(chēng)作數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,簡(jiǎn)記為 KDD),是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中

40、,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。還有很多和這一術(shù)語(yǔ)相近似的術(shù)語(yǔ),如從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí)(KDD)、數(shù)據(jù)分析、數(shù)據(jù)融合(Data Fusion)以及決策支持等。人們把原始數(shù)據(jù)看作是形成知識(shí)的源泉,就像從礦石中采礦一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)了的知識(shí)可以被用于信息管理、查詢(xún)優(yōu)化、決策支持、過(guò)程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門(mén)廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域的研

41、究者,尤其是數(shù)據(jù)庫(kù)、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等方面的學(xué)者和工程技術(shù)人員1 1 潘華, 項(xiàng)同德. 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘原理,工具及應(yīng)用. 中國(guó)電力出版社. 2007(12): 83-84.確定挖掘主題:在金融數(shù)據(jù)挖掘中,首先要清楚的明確數(shù)據(jù)挖掘的目的,這是至關(guān)重要的一步。因?yàn)橥诰虻淖詈蠼Y(jié)果是不可預(yù)測(cè)的,但要探索的問(wèn)題應(yīng)是有預(yù)見(jiàn)性的,所以不能進(jìn)行盲目的數(shù)據(jù)挖掘。數(shù)據(jù)選擇:查找所有和業(yè)務(wù)相關(guān)的內(nèi)部和外部數(shù)據(jù)信息,從中選擇適用于數(shù)據(jù)挖掘的相關(guān)數(shù)據(jù)。數(shù)據(jù)預(yù)處理:對(duì)選擇后的數(shù)據(jù)進(jìn)一步處理,檢查數(shù)據(jù)完整性以及數(shù)據(jù)的一致性,并通過(guò)一些操作減少數(shù)據(jù)量,將數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式。建立模型:讀入經(jīng)

42、過(guò)預(yù)處理的數(shù)據(jù),建立模型,進(jìn)行數(shù)據(jù)挖掘。評(píng)價(jià)和解釋?zhuān)簩?duì)模型得出的結(jié)果進(jìn)行解釋?zhuān)鶕?jù)某種興趣度量,識(shí)別表示知識(shí)的真正有用的模式,并通過(guò)一致性檢查,以確信發(fā)現(xiàn)的知識(shí)不與以前發(fā)現(xiàn)的知識(shí)相抵觸,并用可視化技術(shù)展現(xiàn)給用戶(hù)。預(yù)測(cè):應(yīng)用模型對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)。數(shù)據(jù)挖掘技術(shù)是人們長(zhǎng)期對(duì)數(shù)據(jù)庫(kù)技術(shù)進(jìn)行研究和開(kāi)發(fā)的結(jié)果。起初各種商業(yè)數(shù)據(jù)是存儲(chǔ)在計(jì)算機(jī)的數(shù)據(jù)庫(kù)中的,然后發(fā)展到可對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢(xún)和訪問(wèn),進(jìn)而發(fā)展到對(duì)數(shù)據(jù)庫(kù)的即時(shí)遍歷。數(shù)據(jù)挖掘使數(shù)據(jù)庫(kù)技術(shù)進(jìn)入了一個(gè)更高級(jí)的階段,他不但能對(duì)過(guò)去的數(shù)據(jù)進(jìn)行查詢(xún)和遍歷,并且能夠找出過(guò)去數(shù)據(jù)之間的潛在聯(lián)系,從而促進(jìn)信息的傳遞。商業(yè)數(shù)據(jù)庫(kù)正在以空前的速度增長(zhǎng),并且數(shù)據(jù)倉(cāng)庫(kù)正在廣泛

43、地應(yīng)用于各種行業(yè),數(shù)據(jù)挖掘經(jīng)過(guò)了十多年的發(fā)展已經(jīng)成為一種成熟、穩(wěn)定、易于理解和操作的技術(shù)。2.2.2數(shù)據(jù)挖掘的模式數(shù)據(jù)挖掘功能用于指定數(shù)據(jù)挖掘任務(wù)中要找的模式類(lèi)型。數(shù)據(jù)挖掘任務(wù)一般可以分兩類(lèi)描述和預(yù)測(cè)。描述性挖掘任務(wù)刻畫(huà)數(shù)據(jù)庫(kù)中數(shù)據(jù)的一般特性。預(yù)測(cè)性挖掘任務(wù)在當(dāng)前數(shù)據(jù)上進(jìn)行推斷,以進(jìn)行預(yù)測(cè)2 2 袁玉波, 楊傳勝, 黃延祝, 徐成賢. 數(shù)據(jù)挖掘與最優(yōu)化技術(shù)及應(yīng)用, 2007(7):77-78.在某些情況下,用戶(hù)不知道他們的數(shù)據(jù)中有什么類(lèi)型的模式是有趣的,因此可能想并行地搜索多種不同的模式。這樣,重要的是,數(shù)據(jù)挖掘系統(tǒng)要能夠挖掘多種類(lèi)型的模式,以適應(yīng)不同的用戶(hù)需求或不同的應(yīng)用。此外,數(shù)據(jù)挖掘系統(tǒng)

44、應(yīng)當(dāng)能夠發(fā)現(xiàn)各種粒度即(不同的抽象層)的模式。數(shù)據(jù)挖掘系統(tǒng)應(yīng)當(dāng)允許用戶(hù)給出提示,指導(dǎo)或聚焦有趣模式的搜索。由于有些模式并非對(duì)數(shù)據(jù)庫(kù)中的所有數(shù)據(jù)都成立,通常每個(gè)發(fā)現(xiàn)的模式帶上一個(gè)確定性或“可信性”度量。數(shù)據(jù)挖掘功能以及它們可以發(fā)現(xiàn)的模式類(lèi)型介紹如下3 3 張喆. 數(shù)據(jù)挖掘及其在客戶(hù)關(guān)系管理中的應(yīng)用. 復(fù)旦大學(xué)出版社, 2007: 73-75.概念類(lèi)描述特征化和區(qū)分?jǐn)?shù)據(jù)可以與類(lèi)或概念相關(guān)聯(lián)。類(lèi)和概念的描述稱(chēng)為類(lèi)/概念(Class/concept description)描述。這種描述可以通過(guò)下述方法得到:1)數(shù)據(jù)特征化,一般地匯總所研究類(lèi)(通常稱(chēng)為目標(biāo)類(lèi))的數(shù)據(jù);2)數(shù)據(jù)區(qū)分,將目標(biāo)類(lèi)與一個(gè)或多個(gè)

45、比較類(lèi)(通常稱(chēng)為對(duì)比類(lèi))進(jìn)行比較數(shù)據(jù)特征化和比較;3)數(shù)據(jù)特征化和比較。數(shù)據(jù)特征化(Data Characterization)是目標(biāo)類(lèi)數(shù)據(jù)的一般特征或特性的匯總。通常,用戶(hù)在指定類(lèi)的數(shù)據(jù)通過(guò)數(shù)據(jù)庫(kù)查詢(xún)收集。例如,為研究上一年銷(xiāo)售增加10%的軟件產(chǎn)品的特征,可以通過(guò)執(zhí)行一個(gè)SQL查詢(xún)收集關(guān)于這些產(chǎn)品的數(shù)據(jù)。有許多有效的方法,將數(shù)據(jù)特征化匯總。例如,基于數(shù)據(jù)立方體的OLAP上卷操作可以用來(lái)執(zhí)行用戶(hù)控制的、沿著指定維的數(shù)據(jù)匯總。一種面向?qū)傩缘臍w納技術(shù)可以用來(lái)進(jìn)行數(shù)據(jù)的概化和特征化,而不必一步步地與用戶(hù)交互。數(shù)據(jù)特征的輸出可以用多種形式提供。包括餅圖、條圖、曲線、多維數(shù)據(jù)立方體和包括交叉表在內(nèi)的多維

46、表。結(jié)果描述也可以用概化關(guān)系(generalized relation)或規(guī)則形式提供。數(shù)據(jù)區(qū)分(data discrimination)是將目標(biāo)類(lèi)對(duì)象的一般特征與一個(gè)或多個(gè)對(duì)比類(lèi)對(duì)象的一般特征相比較。目標(biāo)類(lèi)和對(duì)比類(lèi)由用戶(hù)指定,而對(duì)應(yīng)的數(shù)據(jù)通過(guò)數(shù)據(jù)庫(kù)檢索。例如,可能希望將上一年銷(xiāo)售增加10%的軟件產(chǎn)品與同一時(shí)期銷(xiāo)售至少下降30%的那些產(chǎn)品進(jìn)行比較。用于數(shù)據(jù)區(qū)分的方法與用于數(shù)據(jù)特征化的類(lèi)似。關(guān)聯(lián)分析關(guān)聯(lián)分析,即利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類(lèi)重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱(chēng)為關(guān)聯(lián)。關(guān)聯(lián)可分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找

47、出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)。有時(shí)并不知道數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。分類(lèi)和預(yù)測(cè)分類(lèi)(classification)是這樣一個(gè)過(guò)程,它找出描述并區(qū)分?jǐn)?shù)據(jù)類(lèi)或概念的模型(或函數(shù)),以便能夠使用模型預(yù)測(cè)類(lèi)標(biāo)記未知的對(duì)象類(lèi)。導(dǎo)出模型是基于對(duì)訓(xùn)練數(shù)據(jù)集(即其類(lèi)標(biāo)記已知的數(shù)據(jù)對(duì)象)的分析?!叭绾翁峁?dǎo)出模型?”導(dǎo)出模式可以用多種形式表示,如分類(lèi)(IF-THEN)規(guī)則、判定樹(shù)、數(shù)學(xué)公式或神經(jīng)網(wǎng)絡(luò)。判定樹(shù)是一個(gè)類(lèi)似于流程圖的樹(shù)結(jié)構(gòu),每個(gè)節(jié)點(diǎn)代表一個(gè)屬性值上的測(cè)試,每個(gè)分支代表測(cè)試的一個(gè)輸出,樹(shù)葉代表類(lèi)或類(lèi)分布。判定樹(shù)容易轉(zhuǎn)換成分類(lèi)規(guī)則。當(dāng)用于分類(lèi)時(shí),神經(jīng)網(wǎng)絡(luò)是一

48、組類(lèi)似于神經(jīng)元的處理單元,單元之間加權(quán)連接。分類(lèi)可以用于預(yù)測(cè)數(shù)據(jù)對(duì)象的類(lèi)標(biāo)記。然而,在某些應(yīng)用中,人們可能希望預(yù)測(cè)某些空缺的或不知道的數(shù)據(jù)值,而不是類(lèi)標(biāo)記。當(dāng)被預(yù)測(cè)的值是數(shù)值數(shù)據(jù)時(shí),通常稱(chēng)之為預(yù)測(cè)(prediction)。盡管預(yù)測(cè)可以涉及數(shù)據(jù)值預(yù)測(cè)和類(lèi)標(biāo)識(shí)預(yù)測(cè),通常預(yù)測(cè)限于值預(yù)測(cè),并因此不同于分類(lèi)。預(yù)測(cè)也包含基于可用數(shù)據(jù)的分類(lèi)趨勢(shì)識(shí)別。相關(guān)分析(Relevance Analysis)可能需要在分類(lèi)和預(yù)測(cè)之前進(jìn)行,它試圖識(shí)別對(duì)于分類(lèi)和預(yù)測(cè)無(wú)用的屬性。這些屬性應(yīng)該排除。聚類(lèi)分析與分類(lèi)和預(yù)測(cè)不同,聚類(lèi)(clustering)分析數(shù)據(jù)對(duì)象,而不考慮已知的類(lèi)標(biāo)記。一般情況下,訓(xùn)練數(shù)據(jù)中不提供類(lèi)標(biāo)記,因?yàn)?/p>

49、不知道從何開(kāi)始。聚類(lèi),可以用于產(chǎn)生這種標(biāo)記。對(duì)象根據(jù)最大化類(lèi)內(nèi)的相似性、最小化類(lèi)間的相似性的原則進(jìn)行聚類(lèi)或分組。即對(duì)象的簇(聚類(lèi))這樣形成,使得在一個(gè)簇中的一個(gè)對(duì)象具有很高的相似性,而與其它簇中的對(duì)象很不相似。所形成的每個(gè)簇可以看作一個(gè)對(duì)象類(lèi),由它可以導(dǎo)出規(guī)則。聚類(lèi)也便于分類(lèi)編制,將觀察的內(nèi)容組織成類(lèi)分層結(jié)構(gòu),把類(lèi)似的對(duì)象組織在一起1 1 羅洪群, 王情華, 田義江. 統(tǒng)計(jì)學(xué)基礎(chǔ). 清華大學(xué)出版社, 2008(3): 98-99.孤立點(diǎn)分析數(shù)據(jù)庫(kù)中可能包含一些數(shù)據(jù)對(duì)象,它們與數(shù)據(jù)的一般行為或模型不一致。這些數(shù)據(jù)對(duì)象是孤立點(diǎn)(outlier)。大部分?jǐn)?shù)據(jù)挖掘方法將孤立點(diǎn)視為噪聲或異常而丟棄。然而

50、,在一些應(yīng)用中(如欺騙檢測(cè)),罕見(jiàn)的事件可能比正常出現(xiàn)的那些更有趣。孤立點(diǎn)數(shù)據(jù)分析稱(chēng)作為孤立點(diǎn)挖掘(Outlier Mining)。孤立點(diǎn)可以使用統(tǒng)計(jì)試驗(yàn)檢測(cè)。它假定一個(gè)數(shù)據(jù)分布概率模型,并使用距離度量,到其他聚類(lèi)的距離很大的對(duì)象被視為孤立點(diǎn)?;谄畹姆椒ㄍㄟ^(guò)考察一群對(duì)象主要特征的差別識(shí)別孤立點(diǎn),而不是使用統(tǒng)計(jì)或距離度量。演變分析數(shù)據(jù)演變分析(Evolution Analysis)描述行為隨時(shí)間變化的對(duì)象的規(guī)律或趨勢(shì),并對(duì)其建模。盡管這可能包括時(shí)間相關(guān)數(shù)據(jù)的特征化、區(qū)分、關(guān)聯(lián)、分類(lèi)或聚類(lèi),這類(lèi)分析的不同特點(diǎn)包括時(shí)間序列數(shù)據(jù)分析、序列或周期模式匹配和基于類(lèi)似性的數(shù)據(jù)分析。2.2.3數(shù)據(jù)挖掘在銀

51、行客戶(hù)關(guān)系管理中的應(yīng)用本論文是以銀行客戶(hù)為基礎(chǔ)進(jìn)行分析研究,銀行系統(tǒng)的核心是構(gòu)建全行的大型數(shù)據(jù)庫(kù)系統(tǒng),然而,成功構(gòu)建數(shù)據(jù)庫(kù)系統(tǒng)還只是基礎(chǔ),為了實(shí)現(xiàn)其輔助決策的目的,必須能夠有效利用數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分析和預(yù)測(cè)。對(duì)于銀行而言,數(shù)據(jù)挖掘在其客戶(hù)關(guān)系管理系統(tǒng)中可以起到的主要作用如下:客戶(hù)分類(lèi)近年來(lái),特別是在市場(chǎng)細(xì)分環(huán)境下一對(duì)一個(gè)性化服務(wù)正在受到銀行業(yè)的青睞。這意味著銀行要了解每一個(gè)客戶(hù),并同其建立起持久的關(guān)系。利用數(shù)據(jù)挖掘技術(shù)可對(duì)大量的客戶(hù)分類(lèi),提供針對(duì)性的產(chǎn)品和服務(wù)。交叉服務(wù)現(xiàn)代銀行企業(yè)和客戶(hù)之間的關(guān)系是經(jīng)常變動(dòng)的,一旦擁有了新的客戶(hù),就要竭力完善這種關(guān)系。需要對(duì)其進(jìn)行交叉銷(xiāo)售,為原

52、有客戶(hù)提供新的銀行產(chǎn)品或服務(wù)。數(shù)據(jù)挖掘可以幫助銀行分析出最優(yōu)的合理的服務(wù)匹配??蛻?hù)保持客戶(hù)保持是留住老客戶(hù)、防止客戶(hù)流失的過(guò)程。由于銀行對(duì)老客戶(hù)的信息掌握的比較詳細(xì),而對(duì)潛在客戶(hù)的信息掌握得很少,所以對(duì)于銀行來(lái)說(shuō)獲取一個(gè)新客戶(hù)遠(yuǎn)比保留一個(gè)老客戶(hù)的成本高得多。而且在目前開(kāi)放的商業(yè)環(huán)境下,商業(yè)銀行之間的競(jìng)爭(zhēng)越來(lái)越激烈,客戶(hù)保持也就成為銀行面臨的一個(gè)重要難題。在客戶(hù)保持過(guò)程中,首先要對(duì)已經(jīng)流失的客戶(hù)數(shù)據(jù)進(jìn)行分析,找到流失客戶(hù)的行為模式,同時(shí)分析流失客戶(hù)流失的原因。根據(jù)已經(jīng)流失的客戶(hù)的特點(diǎn)還可以預(yù)測(cè)現(xiàn)在客戶(hù)中有流失傾向的客戶(hù)。對(duì)于這些客戶(hù),銀行應(yīng)該及時(shí)調(diào)整服務(wù)策略,針對(duì)用戶(hù)分類(lèi)時(shí)得到的用戶(hù)特點(diǎn)采取相應(yīng)

53、的措施挽留客戶(hù)。挽留一個(gè)老客戶(hù),競(jìng)爭(zhēng)對(duì)手就減少了一個(gè)新客戶(hù),同時(shí)流失一個(gè)客戶(hù)就為競(jìng)爭(zhēng)對(duì)手帶來(lái)一個(gè)新客戶(hù)。因此,客戶(hù)保持是客戶(hù)關(guān)系管理中最為重要的一個(gè)部分。數(shù)據(jù)挖掘可以幫助銀行識(shí)別出潛在的客戶(hù)群,提高市場(chǎng)活動(dòng)的響應(yīng)率,使銀行決策人員做到心中有數(shù),有的放矢??蛻?hù)信用分析分析客戶(hù)信用對(duì)銀行信用管理很有意義,對(duì)不同信用級(jí)別的客戶(hù),采取不同的信貸方案等。數(shù)據(jù)挖掘可從大量歷史數(shù)據(jù)中分析出具體客戶(hù)的信用等級(jí)??蛻?hù)盈利能力分析和預(yù)測(cè)很顯然,不同客戶(hù)對(duì)于銀行來(lái)講,其價(jià)值是不同的。數(shù)據(jù)挖掘技術(shù)可以用來(lái)分析和預(yù)測(cè)不同市場(chǎng)活動(dòng)情況下客戶(hù)盈利能力的變化,幫助銀行制定適合的市場(chǎng)策略。根據(jù)本文緒論部分對(duì)客戶(hù)價(jià)值管理和CRM

54、之間關(guān)系的分析,可以看出客戶(hù)保持是銀行CRM和客戶(hù)價(jià)值管理的核心。本文僅就將商業(yè)銀行的客戶(hù)流失預(yù)測(cè)模型作為研究的重點(diǎn)是符合銀行客戶(hù)關(guān)系管理規(guī)律的。2.3數(shù)據(jù)挖掘的聚類(lèi)分析理論聚類(lèi)分析是研究物以類(lèi)聚的一種統(tǒng)計(jì)分析方法。用于對(duì)事物類(lèi)別尚不清楚,甚至事物總共可能有幾類(lèi)都不能確定的情況下進(jìn)行事物分類(lèi)的場(chǎng)合。2.3.1 聚類(lèi)的概念聚類(lèi)(clustering)是指把一組個(gè)體按照相似性歸成若干類(lèi)別。即“物以類(lèi)聚”它的目的是使得屬于同一類(lèi)別的個(gè)體之間的距離盡可能的小,二不用類(lèi)別的個(gè)體之間的距離盡可能的大。組內(nèi)的對(duì)象相互之間是相似的,而不同組的對(duì)象是不同的。同一類(lèi)別的個(gè)體之間的相似性盡可能大,而不同類(lèi)別的個(gè)體之

55、間的相似性盡可能小。組內(nèi)的相似性越大,組間差別越大,聚類(lèi)就越好。相似性是根據(jù)描述對(duì)象的屬性來(lái)測(cè)算的,距離是經(jīng)常采用的度量方式。聚類(lèi)分析能夠幫助我們發(fā)現(xiàn)特征迥異的不同客戶(hù)群,和對(duì)客戶(hù)分群起關(guān)鍵作用的指標(biāo)變量,并輔助運(yùn)營(yíng)商對(duì)各客戶(hù)群的特征進(jìn)行深刻洞察。聚類(lèi)分析提供由個(gè)別數(shù)據(jù)對(duì)象所指派到簇的抽象。此外,一些聚類(lèi)技術(shù)使用簇原理來(lái)刻畫(huà)簇特征。這些簇原型可以用作大量數(shù)據(jù)分析和數(shù)據(jù)處理技術(shù)的基礎(chǔ)。因此,聚類(lèi)分析就是研究發(fā)現(xiàn)最有代表性的簇原型的技術(shù)。2.3.2 聚類(lèi)算法的一般特征次序依賴(lài)性:對(duì)于某些算法,所產(chǎn)生的簇的質(zhì)量和個(gè)數(shù)可能因數(shù)據(jù)處理的次數(shù)不同而顯著的變化。非確定性:像K均值這樣的聚類(lèi)算法不是次序依賴(lài)的

56、,但是它們每次運(yùn)行都產(chǎn)生不同的結(jié)果,它們依賴(lài)于需要隨機(jī)選擇的初始化步驟。簇的質(zhì)量可能隨運(yùn)行而變化,因此需要多此運(yùn)行??缮炜s性:包含數(shù)以萬(wàn)計(jì)的數(shù)據(jù)集并不罕見(jiàn),用于這種數(shù)據(jù)集的聚類(lèi)算法應(yīng)當(dāng)具有線性或接近線性的時(shí)間空間復(fù)雜度。參數(shù)選擇:大部分聚類(lèi)算法都需要用戶(hù)設(shè)置一個(gè)或多個(gè)參數(shù)。選擇合適的參數(shù)值可能是困難的,因此通常的態(tài)度是“參數(shù)越少越好”。如果參數(shù)值的很小改變就會(huì)顯著就會(huì)顯著的改變結(jié)果,則選擇參數(shù)值就變得更加有挑戰(zhàn)性。最后,除非提供一個(gè)過(guò)程來(lái)確定參數(shù)值,否則算法的用戶(hù)就不得不通過(guò)試探法找到合適的參數(shù)值。變換聚類(lèi)問(wèn)題到其他領(lǐng)域:一種被某些聚類(lèi)技術(shù)使用的方法是將聚類(lèi)問(wèn)題映射到不同的領(lǐng)域。將聚類(lèi)作為最優(yōu)

57、化問(wèn)題處理:聚類(lèi)常常被看做優(yōu)化問(wèn)題:將點(diǎn)劃分成簇,更具用戶(hù)指定的目標(biāo)函數(shù)度量,最大化結(jié)果簇集合的優(yōu)良度。例如:K均值聚類(lèi)算法試圖發(fā)現(xiàn)簇的集合,使每個(gè)點(diǎn)到最近的簇質(zhì)心距離的平方和最小。2.3.3K-mean算法簡(jiǎn)介文中進(jìn)行聚類(lèi)分析時(shí)采用的是K-means 算法。K-means算法屬于聚類(lèi)分析方法中一種基本的且應(yīng)用最廣泛的劃分算法,它是一種已知聚類(lèi)類(lèi)別數(shù)的聚類(lèi)算法。指定類(lèi)別數(shù)為k,對(duì)樣本集進(jìn)行聚類(lèi),聚類(lèi)的結(jié)果由k個(gè)聚類(lèi)中心來(lái)表達(dá)?;诮o定的聚類(lèi)目標(biāo)函數(shù)(或者說(shuō)是聚類(lèi)效果判別準(zhǔn)則),算法采用迭代更新的方法,每一次迭代過(guò)程都是向目標(biāo)函數(shù)值減小的方向進(jìn)行,最終的聚類(lèi)結(jié)果使目標(biāo)函數(shù)值取得極小值,達(dá)到較優(yōu)的

58、聚類(lèi)效果。K-means 算法根據(jù)它們之間的相似程度,分為若干組;其中相似的對(duì)象構(gòu)成一組,這一過(guò)程就稱(chēng)為聚類(lèi)過(guò)程。一個(gè)聚類(lèi)就是由彼此相似的一組對(duì)象所構(gòu)成的集合;不同聚類(lèi)中對(duì)象是不相似的。從給定的數(shù)據(jù)集中搜索數(shù)據(jù)項(xiàng)之間所存在的有價(jià)值聯(lián)系。K-means 算法的工作過(guò)程說(shuō)明如下:首先從n 個(gè)數(shù)據(jù)對(duì)象任意選擇k 個(gè)對(duì)象作為初始聚類(lèi)中心;而對(duì)于所剩下其它對(duì)象, 則根據(jù)它們與這些聚類(lèi)中心的相似度(距離) ,分別將它們分配給與其最相似的(聚類(lèi)中心所代表的) 聚類(lèi); 然后再計(jì)算每個(gè)所獲新聚類(lèi)的聚類(lèi)中心(該聚類(lèi)中所有對(duì)象的均值) ; 不斷重復(fù)這一過(guò)程直到標(biāo)準(zhǔn)測(cè)度函數(shù)開(kāi)始收斂為止。一般都采用均方差作為標(biāo)準(zhǔn)測(cè)度函

59、數(shù):式中, E 為數(shù)據(jù)庫(kù)中所有對(duì)象的平方誤差的總和; p 為空間的點(diǎn),表示給定的數(shù)據(jù)對(duì)象; mi 為簇Ci 的平均值( p 和mi都是多維的) 。上式所示聚類(lèi)標(biāo)準(zhǔn)旨在使所獲得的k 個(gè)聚類(lèi)具有以下特點(diǎn):各聚類(lèi)本身盡可能緊湊, 而各聚類(lèi)之間盡可能分開(kāi)。K2means 算法的計(jì)算復(fù)雜度為O ( nkt ) ,因而它在處理大數(shù)據(jù)庫(kù)時(shí)也是相對(duì)有效的(具有可擴(kuò)展性) ;這里n 為對(duì)象個(gè)數(shù); k為聚類(lèi)個(gè)數(shù);而t 為循環(huán)次數(shù)。通常有k n 和 t n 。 K-means 算法常常終止于局部最優(yōu)。2.4 SAS Enterprise Miner簡(jiǎn)介SAS系統(tǒng)是世界公認(rèn)的權(quán)威統(tǒng)計(jì)分析軟件之一,是一個(gè)大型集成信息分

60、析管理系統(tǒng)。SAS系統(tǒng)集數(shù)據(jù)訪問(wèn)、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)挖掘功能于一體。是一個(gè)功能強(qiáng)大且被國(guó)際公認(rèn)的標(biāo)準(zhǔn)統(tǒng)計(jì)分析軟件。隨著信息技術(shù)的發(fā)展,數(shù)據(jù)管理與數(shù)據(jù)分析已成為各領(lǐng)域發(fā)展的重要支柱,SAS系統(tǒng)也成為數(shù)據(jù)處理的首選工具。越來(lái)越多的企業(yè)感受到SAS系統(tǒng)強(qiáng)大功能帶來(lái)的益處。要對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行科學(xué)的分析,SAS系統(tǒng)軟件可以進(jìn)行處理,從而得到科學(xué)的研究結(jié)論1 1 范金城. SAS數(shù)據(jù)分析范例. 西安交通大學(xué)出版社, 2008(5):83-84.SAS(Statistical Analysis System)系統(tǒng)于1966年開(kāi)始研制,1976年由美國(guó)SAS公司實(shí)現(xiàn)商業(yè)化,1985年推出SAS/PC版本,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論