數(shù)據(jù)挖掘技術(shù)在金融反洗錢中的應(yīng)用_第1頁
數(shù)據(jù)挖掘技術(shù)在金融反洗錢中的應(yīng)用_第2頁
數(shù)據(jù)挖掘技術(shù)在金融反洗錢中的應(yīng)用_第3頁
數(shù)據(jù)挖掘技術(shù)在金融反洗錢中的應(yīng)用_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)一、洗錢的概念及我國反洗錢工作中的不足目前關(guān)于洗錢的定義有很多種,國際上并沒有一個統(tǒng)一的定義。中華人民共和國反洗錢法中第二條中關(guān)于的洗錢定義是:通過各種方式掩飾、隱瞞毒品犯罪、黑社會性質(zhì)的組織犯罪、恐怖活動犯罪、走私犯罪、貪污賄賂犯罪、破壞金融管理秩序犯罪、金融詐騙犯罪等犯罪所得及其收益的來源和性質(zhì)的洗錢活動,依照本法規(guī)定采取相關(guān)措施的行為。我國反洗錢工作主要是通過可疑交易報告制度完成的,而金融機構(gòu)的的情報收集和分析工作中目前存在主要問題為:(1)工作量大,誤報率高;(

2、2)預(yù)設(shè)標(biāo)準(zhǔn)易于為洗錢分子所規(guī)避;(3)無法自動適應(yīng)洗錢形式的變化等。這就使得洗錢可疑交易行為的識別存在巨大的困難。二、數(shù)據(jù)挖掘技術(shù)在反洗錢中的應(yīng)用數(shù)據(jù)挖掘是指從大量數(shù)據(jù)中提取或挖掘有趣的知識。目前,發(fā)達(dá)國家的反洗錢系統(tǒng)都充分利用了數(shù)據(jù)挖掘工具。在領(lǐng)域中,人工智能、聚類分析、歸納算法、神經(jīng)網(wǎng)絡(luò)等都具有較強的適應(yīng)性,具有廣闊的應(yīng)用前景。1.人工智能在反洗錢調(diào)查中得到了快速發(fā)展。美國的FAIS系統(tǒng)綜合使用了人工智能技術(shù)和基于案例的推理、黑板(blackboard)等人工智能技術(shù),其獨特的分析能力主要得益于其數(shù)據(jù)視角的轉(zhuǎn)變:從交易導(dǎo)向轉(zhuǎn)為對象(如人或者組織)導(dǎo)向。每一筆交易、對象、賬戶都要用336條

3、規(guī)則去測試,每條規(guī)則都給出是否為非法或合法的判定證據(jù),最后用貝葉思推理對每一個項目的可疑性進(jìn)行評定。2.聚類分析是一種非監(jiān)督的數(shù)據(jù)挖掘技術(shù)。在反洗錢領(lǐng)域,聚類分析技術(shù)特別適用于從大量的交易數(shù)據(jù)中產(chǎn)生及時、準(zhǔn)確的線索。由于洗錢方式多種多樣,數(shù)據(jù)對象表現(xiàn)出來的分布也就各式各樣,并不是所有的可疑賬戶都可以聚成一類。因此,在洗錢行為識別中,簇的數(shù)量是未知的,因洗錢方式的不同而不同。聚類分析中簇的數(shù)量未知這個特點剛好滿足洗錢行為識別的這個要求。而且,由于其聚類分析的自動處理、非監(jiān)督學(xué)習(xí)等特性使得其可以動態(tài)地適應(yīng)洗錢手段的變化,也可以在一定程度上規(guī)避洗錢犯罪活動的自適應(yīng)問題。1、反洗錢基本程序 1.1定義

4、 目前關(guān)于洗錢的定義有很多種,國際上并沒有一個統(tǒng)一的定義。但洗錢的本質(zhì)就是利用資產(chǎn)、資金轉(zhuǎn)換(轉(zhuǎn)移)過程中所造成的信息缺失、信息隱蔽、信息不完整、信息不真實、信息復(fù)雜而使犯罪所得收益的原始來源和性質(zhì)無法識別或追溯,從而掩蓋和隱瞞其真實信息。 1.2基本程序 我國的反洗錢基本程序分為采集、監(jiān)測分析和移交三個步驟:第一步,大額和可疑交易報告的收集。第二步,大額和可疑交易報告的分析和甄別。第三步,可疑交易線索移送。 2、數(shù)據(jù)挖掘技術(shù) 2.1數(shù)據(jù)挖掘的任務(wù) 數(shù)據(jù)總結(jié)、分類、關(guān)聯(lián)分析、聚類。 2.2數(shù)據(jù)挖掘流程 將數(shù)據(jù)挖掘應(yīng)用于反洗錢技術(shù)中,在建立攻擊檢測系統(tǒng)過程中消除人為因素和特定因素,為其開發(fā)一個更

5、加系統(tǒng)化的方法,即開發(fā)一套能從各種審計數(shù)據(jù)中產(chǎn)生攻擊檢測模型的自動工具。中國人民銀行南昌中心支行蘇輝貴應(yīng)用關(guān)聯(lián)分析和序列模式分析等算法,發(fā)現(xiàn)特征之間的關(guān)聯(lián)和與時序有關(guān)的聯(lián)系,從而完成對用戶數(shù)據(jù)的收集與特征選擇過程。反洗錢中的數(shù)據(jù)挖掘過程如圖1所示。 2.3 數(shù)據(jù)挖掘中常用的數(shù)據(jù)挖掘算法 1)關(guān)聯(lián)分析算法。 關(guān)聯(lián)規(guī)則是表示數(shù)據(jù)庫中一組對象之間某種關(guān)聯(lián)關(guān)系的規(guī)則。在數(shù)據(jù)庫的知識發(fā)現(xiàn)中,關(guān)聯(lián)規(guī)則就是描述這種在一個事務(wù)中物品之間同時出現(xiàn)的規(guī)律的知識模式。更確切地說,關(guān)聯(lián)規(guī)則是通過量化的數(shù)字描述物品A的出現(xiàn)對物品B的出現(xiàn)有多大的影響。 2)序列分析算法。 關(guān)聯(lián)分析是發(fā)掘數(shù)據(jù)記錄中不同數(shù)據(jù)項之間的橫向關(guān)聯(lián)

6、性,而序列分析則是發(fā)現(xiàn)不同數(shù)據(jù)記錄之間的縱向相關(guān)性。序列分析的目標(biāo)是在事務(wù)數(shù)據(jù)庫中發(fā)掘出序列模式(large sequences),即滿足用戶指定的最小支持度(minimum support)要求的大序列,并且該序列模式必須是最高序列(maximal sequence)。 3)分類算法。 數(shù)據(jù)分類實際上就是從數(shù)據(jù)庫對象中發(fā)現(xiàn)共性,并將數(shù)據(jù)對象分成不同幾類的一個過程。分類的目標(biāo)是對訓(xùn)練數(shù)據(jù)進(jìn)行分析,使用數(shù)據(jù)的某些特征屬性,給出每個類的準(zhǔn)確描述(即分類規(guī)則),據(jù)此對數(shù)據(jù)庫中的其它數(shù)據(jù)進(jìn)行分類。 4)聚類算法。 將物理或抽象對象的集合分組成為由類似的對象組成的多個類的過程稱為聚類。對象根據(jù)最大化類內(nèi)

7、的相似性和最小化類間的相似性的原則進(jìn)行聚類或分組。所形成的每個簇可以作為一個對象類,由它可以導(dǎo)出規(guī)則,在許多應(yīng)用中,可以將一個簇中的數(shù)據(jù)對象作為一個整體來對待。聚類與分類不同,聚類分析的輸入數(shù)據(jù)集是一組未標(biāo)記的對象,也就是說此時輸入的對象還沒有進(jìn)行任何分類,聚類的目的是根據(jù)一定的規(guī)則,合理地進(jìn)行分組或聚類,并用顯式或隱式的方法描述不同的類別。由于分析可以采用不同的算法,所以對相同的數(shù)據(jù)集合可能有不同的劃分。 3、數(shù)據(jù)挖掘技術(shù)在反洗錢中的應(yīng)用 3.1 系統(tǒng)的整體設(shè)計 反洗錢系統(tǒng)本身應(yīng)用的特殊性,要求它具有準(zhǔn)確性、全局性、可擴展性、可伸縮性以及環(huán)境適應(yīng)性。到目前為止,研究人員已經(jīng)提出實現(xiàn)了許多方法

8、,但沒有一種模型能夠滿足完全檢測的要求。由于系統(tǒng)的設(shè)計和實現(xiàn)都取決于設(shè)計人員自身的知識儲備和其對已知反洗錢形式的了解程度,因而系統(tǒng)的效率和環(huán)境性都受到了限制。 基于數(shù)據(jù)挖掘技術(shù)的智能反洗錢系統(tǒng)的核心就是從事件序列數(shù)據(jù)(訓(xùn)練數(shù)據(jù))中挖掘正常和異常行為規(guī)則,構(gòu)建規(guī)則庫,在此基礎(chǔ)上,再根據(jù)發(fā)現(xiàn)的證據(jù)進(jìn)行反洗錢識別。 采用數(shù)據(jù)挖掘方法實現(xiàn)整個過程,并將它劃分為三個過程。 1)特征提取。在系統(tǒng)中,數(shù)據(jù)的來源主要有:系統(tǒng)審計日志、已知的洗錢行為、國家和政府的相關(guān)的法律法規(guī)。不同性質(zhì)的數(shù)據(jù)要求采用不同的數(shù)據(jù)挖掘算法,因此,采用不同的方法來自動抽取不同數(shù)據(jù)源數(shù)據(jù)中的關(guān)鍵特征,為規(guī)則發(fā)現(xiàn)奠定基礎(chǔ)。 2)規(guī)則發(fā)現(xiàn)

9、,對不同類型的數(shù)據(jù),采用不同的數(shù)據(jù)挖掘算法發(fā)現(xiàn)其中的規(guī)則。對己知反洗錢方法的數(shù)據(jù),由于決策樹方法具有較高的精度和效率,采用該算法進(jìn)行處理,以發(fā)現(xiàn)其中的分類規(guī)則;對于審計數(shù)據(jù)采用分類和關(guān)聯(lián)分析相結(jié)合的方法,以發(fā)現(xiàn)關(guān)鍵屬性間的協(xié)同作用;對系統(tǒng)調(diào)用序列數(shù)據(jù),則采用序列模式挖掘算法。 3)建立好規(guī)則庫后,對每一次發(fā)現(xiàn)的證據(jù),就可以根據(jù)規(guī)則來判斷是否屬于反洗錢行為。 3.2 基于數(shù)據(jù)挖掘的智能反洗錢模型的設(shè)計 系統(tǒng)結(jié)構(gòu)包括如下組件:數(shù)據(jù)處理、審計數(shù)據(jù)庫、數(shù)據(jù)挖掘引擎、特征提取器、數(shù)據(jù)挖掘引擎、規(guī)則庫、數(shù)據(jù)檢測引擎和決策響應(yīng)中心,如圖2所示。 來自多個地方的數(shù)據(jù),主要通過如下方式進(jìn)行處理和轉(zhuǎn)換。 1)數(shù)據(jù)處理??蛻艚灰讛?shù)據(jù)往往有幾十甚至上百個屬性,而機構(gòu)代碼,銀行柜員編號等屬性對反洗錢沒有意義,因此要重新進(jìn)行格式化。一些組織的公告,一般都是一些非機構(gòu)化的文本文件,需要對此進(jìn)行結(jié)構(gòu)化處理,使之能分辨數(shù)據(jù)庫的存取訪問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論