數據挖掘技術在金融反洗錢中的應用_第1頁
數據挖掘技術在金融反洗錢中的應用_第2頁
數據挖掘技術在金融反洗錢中的應用_第3頁
數據挖掘技術在金融反洗錢中的應用_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優(yōu)質文檔-傾情為你奉上精選優(yōu)質文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質文檔-傾情為你奉上專心-專注-專業(yè)一、洗錢的概念及我國反洗錢工作中的不足目前關于洗錢的定義有很多種,國際上并沒有一個統(tǒng)一的定義。中華人民共和國反洗錢法中第二條中關于的洗錢定義是:通過各種方式掩飾、隱瞞毒品犯罪、黑社會性質的組織犯罪、恐怖活動犯罪、走私犯罪、貪污賄賂犯罪、破壞金融管理秩序犯罪、金融詐騙犯罪等犯罪所得及其收益的來源和性質的洗錢活動,依照本法規(guī)定采取相關措施的行為。我國反洗錢工作主要是通過可疑交易報告制度完成的,而金融機構的的情報收集和分析工作中目前存在主要問題為:(1)工作量大,誤報率高;(

2、2)預設標準易于為洗錢分子所規(guī)避;(3)無法自動適應洗錢形式的變化等。這就使得洗錢可疑交易行為的識別存在巨大的困難。二、數據挖掘技術在反洗錢中的應用數據挖掘是指從大量數據中提取或挖掘有趣的知識。目前,發(fā)達國家的反洗錢系統(tǒng)都充分利用了數據挖掘工具。在領域中,人工智能、聚類分析、歸納算法、神經網絡等都具有較強的適應性,具有廣闊的應用前景。1.人工智能在反洗錢調查中得到了快速發(fā)展。美國的FAIS系統(tǒng)綜合使用了人工智能技術和基于案例的推理、黑板(blackboard)等人工智能技術,其獨特的分析能力主要得益于其數據視角的轉變:從交易導向轉為對象(如人或者組織)導向。每一筆交易、對象、賬戶都要用336條

3、規(guī)則去測試,每條規(guī)則都給出是否為非法或合法的判定證據,最后用貝葉思推理對每一個項目的可疑性進行評定。2.聚類分析是一種非監(jiān)督的數據挖掘技術。在反洗錢領域,聚類分析技術特別適用于從大量的交易數據中產生及時、準確的線索。由于洗錢方式多種多樣,數據對象表現出來的分布也就各式各樣,并不是所有的可疑賬戶都可以聚成一類。因此,在洗錢行為識別中,簇的數量是未知的,因洗錢方式的不同而不同。聚類分析中簇的數量未知這個特點剛好滿足洗錢行為識別的這個要求。而且,由于其聚類分析的自動處理、非監(jiān)督學習等特性使得其可以動態(tài)地適應洗錢手段的變化,也可以在一定程度上規(guī)避洗錢犯罪活動的自適應問題。1、反洗錢基本程序 1.1定義

4、 目前關于洗錢的定義有很多種,國際上并沒有一個統(tǒng)一的定義。但洗錢的本質就是利用資產、資金轉換(轉移)過程中所造成的信息缺失、信息隱蔽、信息不完整、信息不真實、信息復雜而使犯罪所得收益的原始來源和性質無法識別或追溯,從而掩蓋和隱瞞其真實信息。 1.2基本程序 我國的反洗錢基本程序分為采集、監(jiān)測分析和移交三個步驟:第一步,大額和可疑交易報告的收集。第二步,大額和可疑交易報告的分析和甄別。第三步,可疑交易線索移送。 2、數據挖掘技術 2.1數據挖掘的任務 數據總結、分類、關聯(lián)分析、聚類。 2.2數據挖掘流程 將數據挖掘應用于反洗錢技術中,在建立攻擊檢測系統(tǒng)過程中消除人為因素和特定因素,為其開發(fā)一個更

5、加系統(tǒng)化的方法,即開發(fā)一套能從各種審計數據中產生攻擊檢測模型的自動工具。中國人民銀行南昌中心支行蘇輝貴應用關聯(lián)分析和序列模式分析等算法,發(fā)現特征之間的關聯(lián)和與時序有關的聯(lián)系,從而完成對用戶數據的收集與特征選擇過程。反洗錢中的數據挖掘過程如圖1所示。 2.3 數據挖掘中常用的數據挖掘算法 1)關聯(lián)分析算法。 關聯(lián)規(guī)則是表示數據庫中一組對象之間某種關聯(lián)關系的規(guī)則。在數據庫的知識發(fā)現中,關聯(lián)規(guī)則就是描述這種在一個事務中物品之間同時出現的規(guī)律的知識模式。更確切地說,關聯(lián)規(guī)則是通過量化的數字描述物品A的出現對物品B的出現有多大的影響。 2)序列分析算法。 關聯(lián)分析是發(fā)掘數據記錄中不同數據項之間的橫向關聯(lián)

6、性,而序列分析則是發(fā)現不同數據記錄之間的縱向相關性。序列分析的目標是在事務數據庫中發(fā)掘出序列模式(large sequences),即滿足用戶指定的最小支持度(minimum support)要求的大序列,并且該序列模式必須是最高序列(maximal sequence)。 3)分類算法。 數據分類實際上就是從數據庫對象中發(fā)現共性,并將數據對象分成不同幾類的一個過程。分類的目標是對訓練數據進行分析,使用數據的某些特征屬性,給出每個類的準確描述(即分類規(guī)則),據此對數據庫中的其它數據進行分類。 4)聚類算法。 將物理或抽象對象的集合分組成為由類似的對象組成的多個類的過程稱為聚類。對象根據最大化類內

7、的相似性和最小化類間的相似性的原則進行聚類或分組。所形成的每個簇可以作為一個對象類,由它可以導出規(guī)則,在許多應用中,可以將一個簇中的數據對象作為一個整體來對待。聚類與分類不同,聚類分析的輸入數據集是一組未標記的對象,也就是說此時輸入的對象還沒有進行任何分類,聚類的目的是根據一定的規(guī)則,合理地進行分組或聚類,并用顯式或隱式的方法描述不同的類別。由于分析可以采用不同的算法,所以對相同的數據集合可能有不同的劃分。 3、數據挖掘技術在反洗錢中的應用 3.1 系統(tǒng)的整體設計 反洗錢系統(tǒng)本身應用的特殊性,要求它具有準確性、全局性、可擴展性、可伸縮性以及環(huán)境適應性。到目前為止,研究人員已經提出實現了許多方法

8、,但沒有一種模型能夠滿足完全檢測的要求。由于系統(tǒng)的設計和實現都取決于設計人員自身的知識儲備和其對已知反洗錢形式的了解程度,因而系統(tǒng)的效率和環(huán)境性都受到了限制。 基于數據挖掘技術的智能反洗錢系統(tǒng)的核心就是從事件序列數據(訓練數據)中挖掘正常和異常行為規(guī)則,構建規(guī)則庫,在此基礎上,再根據發(fā)現的證據進行反洗錢識別。 采用數據挖掘方法實現整個過程,并將它劃分為三個過程。 1)特征提取。在系統(tǒng)中,數據的來源主要有:系統(tǒng)審計日志、已知的洗錢行為、國家和政府的相關的法律法規(guī)。不同性質的數據要求采用不同的數據挖掘算法,因此,采用不同的方法來自動抽取不同數據源數據中的關鍵特征,為規(guī)則發(fā)現奠定基礎。 2)規(guī)則發(fā)現

9、,對不同類型的數據,采用不同的數據挖掘算法發(fā)現其中的規(guī)則。對己知反洗錢方法的數據,由于決策樹方法具有較高的精度和效率,采用該算法進行處理,以發(fā)現其中的分類規(guī)則;對于審計數據采用分類和關聯(lián)分析相結合的方法,以發(fā)現關鍵屬性間的協(xié)同作用;對系統(tǒng)調用序列數據,則采用序列模式挖掘算法。 3)建立好規(guī)則庫后,對每一次發(fā)現的證據,就可以根據規(guī)則來判斷是否屬于反洗錢行為。 3.2 基于數據挖掘的智能反洗錢模型的設計 系統(tǒng)結構包括如下組件:數據處理、審計數據庫、數據挖掘引擎、特征提取器、數據挖掘引擎、規(guī)則庫、數據檢測引擎和決策響應中心,如圖2所示。 來自多個地方的數據,主要通過如下方式進行處理和轉換。 1)數據處理??蛻艚灰讛祿袔资踔辽习賯€屬性,而機構代碼,銀行柜員編號等屬性對反洗錢沒有意義,因此要重新進行格式化。一些組織的公告,一般都是一些非機構化的文本文件,需要對此進行結構化處理,使之能分辨數據庫的存取訪問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論