數(shù)據(jù)挖掘技術在金融行業(yè)中的應用薦_第1頁
數(shù)據(jù)挖掘技術在金融行業(yè)中的應用薦_第2頁
數(shù)據(jù)挖掘技術在金融行業(yè)中的應用薦_第3頁
數(shù)據(jù)挖掘技術在金融行業(yè)中的應用薦_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)據(jù)挖掘技術在金融行業(yè)中的應用高玲玲1周騰2(1山東科技大學泰安校區(qū)信息系山東泰安271000; 2山東人壽泰安分公司山東泰安271000)摘 要隨著計算機信息技術的發(fā)展,信息共享使得人們能得到越來越多的 數(shù)據(jù)。與此同時出現(xiàn)了分析這些海量數(shù)據(jù)的一門技術一一數(shù)據(jù)挖掘技術。首先介紹了數(shù)據(jù)挖掘技術的定義以及常用挖掘方法,然后介紹了數(shù)據(jù)挖掘技術在金融行 業(yè)的典型應用。關鍵詞數(shù)據(jù)挖掘金融 數(shù)據(jù)金融部門每天的業(yè)務都會產生大量數(shù)據(jù),利用目前的數(shù)據(jù)庫系統(tǒng)可以有效地 實現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預測未來的發(fā)展趨勢。缺乏挖掘數(shù)據(jù)背后隱藏的知識的手段, 導致

2、了數(shù)據(jù)爆炸但知識貧乏“的現(xiàn)象。與此同時,金融機構的運作必然存在金融 風險,風險管理是每一個金融機構的重要工作。利用數(shù)據(jù)挖掘技術不但可以從這 海量的數(shù)據(jù)中發(fā)現(xiàn)隱藏在其后的規(guī)律,而且可以很好地降低金融機構存在的風 險。學習和應用數(shù)據(jù)挖掘技術對我國的金融機構有重要意義。一、數(shù)據(jù)挖掘概述(一)數(shù)據(jù)挖掘的定義對丁數(shù)據(jù)挖掘,一種比較公認的定義是W.J.Frawley, G.Piatetsk Shapir。等 人提出的。數(shù)據(jù)挖掘就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的知識、這些知識是隱含的、 事先未知的、 潛在有用的信息, 提取的知識表示為概念(Concepts ) ,規(guī)則(Rules卜規(guī)律(Regular

3、ities )、模式(Patterns痔形式。這個定義把數(shù)據(jù)挖掘的 對象定義為數(shù)據(jù)庫。從技術角度看,數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨 機的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但乂是潛在的和 有用的信息和知識的過程。它是一門廣義的交義學科,涉及數(shù)據(jù)庫技術、人工智 能、機器學習、神經網絡、統(tǒng)計學、模式識別、知識庫系統(tǒng)、知識獲取、信息檢 索、高性能計算和數(shù)據(jù)可視化等多學科領域且本身還在不斷發(fā)展。目前有許多富有挑戰(zhàn)的領域如文本數(shù)據(jù)挖掘、Web信息挖掘、空間數(shù)據(jù)挖掘等。從商業(yè)角度看,數(shù)據(jù)挖掘是一種深層次的商業(yè)信息分析技術。它按照企業(yè)既 定業(yè)務目標,對大量的企業(yè)數(shù)據(jù)進行

4、探索和分析, 揭示隱藏的、未知的或驗證已 知的規(guī)律性并進一步將其模型化,從而自動地提取出用以輔助商業(yè)決策的相關商 業(yè)模式。(二)數(shù)據(jù)挖掘方法數(shù)據(jù)挖掘技術是數(shù)據(jù)庫技術、統(tǒng)計技術和人工智能技術發(fā)展的產物。從使用 的技術角度,主要的數(shù)據(jù)挖掘方法包括:1.決策樹方法:利用樹形結構來表示決策集合,這些決策集合通過對數(shù)據(jù) 集的分類產生規(guī)則。國際上最有影響和最早的決策樹方法是ID3方法,后來乂發(fā) 展了其它的決策樹方法。2.規(guī)則歸納方法:通過統(tǒng)計方法歸納,提取有價值的if- then規(guī)則。規(guī)則歸 納技術在數(shù)據(jù)挖掘中被廣泛使用,其中以關聯(lián)規(guī)則挖掘的研究開展得較為積極和 深入。3.神經網絡方法:從結構上模擬生物神

5、經網絡,以模型和學習規(guī)則為基礎, 建立3種神經網絡模型:前饋式網絡、反饋式網絡和自組織網絡。這種方法通過 訓練來學習的非線性預測模型,可以完成分類、聚類和特征挖掘等多種數(shù)據(jù)挖掘 任務。4.遺傳算法:模擬生物進化過程的算法,由繁殖(選擇)、交義(重組)、變異(突變)三個基本算子組成。為了應用遺傳算法,需要將數(shù)據(jù)挖掘任務表達為一種 搜索問題,從而發(fā)揮遺傳算法的優(yōu)化搜索能力。5.粗糙集(Rough Set府法:Rough集理論是由波蘭數(shù)學家Pawlak在八十年 代初提出的一種處理模糊和不精確性問題的新型數(shù)學工具。它特別適合丁數(shù)據(jù)簡化,數(shù)據(jù)相關性的發(fā)現(xiàn),發(fā)現(xiàn)數(shù)據(jù)意義,發(fā)現(xiàn)數(shù)據(jù)的相似或差別,發(fā)現(xiàn)數(shù)據(jù)模式

6、 和數(shù)據(jù)的近似分類等,近年來已被成功地應用在數(shù)據(jù)挖掘和知識發(fā)現(xiàn)研究領域 中。6. K2最鄰近技術:這種技術通過K個最相近的歷史記錄的組合來辨別新 的記錄。這種技術可以作為聚類和偏差分析等挖掘任務。二、數(shù)據(jù)挖掘在金融行業(yè)中的應用數(shù)據(jù)挖掘已經被廣泛應用丁銀行和商業(yè)中,有以下的典型應用:(一) 對目標市場(targeted marketing店戶的分類與聚類。例如,可以將具 有相同儲蓄和貨款償還行為的客戶分為一組。有效的聚類和協(xié)同過濾(collaborative filtering)方法有助丁識別客戶組,以及推動目標市場。(二) 客戶價值分析。在客戶價值分析之前一般先使用客戶分類, 在實施分 類之后

7、根據(jù)“二八原則”,找出重點客戶,即對給銀行創(chuàng)造了80%價值的20%客戶實施最優(yōu)質的服務。重點客戶的發(fā)現(xiàn)通常采用一系列數(shù)據(jù)處理、轉換過程、AI人工智能等數(shù)據(jù)挖掘技術來實現(xiàn)。通過分析客戶對金融產品的應用頻率、持 續(xù)性等指標來判別客戶的忠誠度;通過對交易數(shù)據(jù)的詳細分析來鑒別哪些是銀行 希望保持的客戶;通過挖掘找到流失的客戶的共同特征,就可以在那些具有相似 特征的客戶還未流失之前進行針對性的彌補。(三) 客戶行為分析。找到重點客戶之后,可對其進行客戶行為分析,發(fā)現(xiàn)客戶的行為偏好,為客戶貼身定制特色服務。客戶行為分析乂分為整體行為分析 和群體行為分析。整體行為分析用來發(fā)現(xiàn)企業(yè)現(xiàn)有客戶的行為規(guī)律。同時,通

8、過對不同客戶群組之間的交義挖掘分析, 可以發(fā)現(xiàn)客戶群體問的變化規(guī)律, 并可通 過數(shù)據(jù)倉庫的數(shù)據(jù)活潔與集中過程,將客戶對市場的反饋自動輸入到數(shù)據(jù)倉庫中。通過對客戶的理解和客戶行為規(guī)律的發(fā)現(xiàn),企業(yè)可以制定相應的市場策略。(四) 為多維數(shù)據(jù)分析和數(shù)據(jù)挖掘設計和構造數(shù)據(jù)倉庫。 例如,人們可能希 望按月、按地區(qū)、按部門、以及按其他因素查看負債和收入的變化情況, 同時希 望能提供諸如最大、最小、總和、平均和其他等統(tǒng)計信息。數(shù)據(jù)倉庫、數(shù)據(jù)立方體、多特征和發(fā)現(xiàn)驅動數(shù)據(jù)立方體,特征和比較分析,以及孤立點分析等,都會 在金融數(shù)據(jù)分析和挖掘中發(fā)揮重要作用。(五) 貨款償還預測和客戶信用政策分析。 有很多因素會對貨款

9、償還效能和客戶信用等級計算產生不同程度的影響。數(shù)據(jù)挖掘的方法, 如特征選擇和屆性相 關性計算,有助丁識別重要的因素,別除非相關因素。例如,與貨款償還風險相 關的因素包括貨款率、資款期限、負債率、償還與收入(paymen to- income)比率、客戶收入水平、受教育程度、居住地區(qū)、信用歷史,等等。而其中償還與收入比率是主導因素,受教育水平和負債率則不是。銀行可以據(jù)此調整貨款發(fā)放 政策,以便將貨款發(fā)放給那些以前曾被拒絕, 但根據(jù)關鍵因素分析,其基本信息 顯示是相對低風險的申請。(六)業(yè)務關聯(lián)分析。通過關聯(lián)分析可找出數(shù)據(jù)庫中隱藏的關聯(lián)網,銀行存儲了大量的客戶交易信息,可對客戶的收入水平、消費習慣、購買物種等指標進 行挖掘分析,找出客戶的潛在需求;通過挖掘對公客戶信息,銀行可以作為廠商 和消費者之間的中介,與廠冏聯(lián)手,在掌握消費者需求的基礎上,發(fā)展中間業(yè)務, 更好地為客戶服務。數(shù)據(jù)挖掘技術可以用來發(fā)現(xiàn)數(shù)據(jù)庫中對象演變特征或對象變化趨勢,這些信息對丁決策或規(guī)劃是有用的,金融行業(yè)數(shù)據(jù)的挖掘有助丁根據(jù)顧客的流量安排工 作人員???/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論