互聯(lián)網(wǎng)金融風控中的數(shù)據(jù)科學_第1頁
互聯(lián)網(wǎng)金融風控中的數(shù)據(jù)科學_第2頁
互聯(lián)網(wǎng)金融風控中的數(shù)據(jù)科學_第3頁
互聯(lián)網(wǎng)金融風控中的數(shù)據(jù)科學_第4頁
互聯(lián)網(wǎng)金融風控中的數(shù)據(jù)科學_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、互聯(lián)網(wǎng)金融風控中的數(shù)據(jù)科學技術創(chuàng)新 變革未來摘要互聯(lián)網(wǎng)金融行業(yè)在解決什么問題?面臨怎樣的風險?用什么樣的技術手段來應對? 傳統(tǒng)的風控手段主要依賴于用戶本人的資料和信息進行人工審核,而身份信息、銀行流水等材料的偽造成本非常低,人工審核的成本日益增高,所以在這種形式下數(shù)據(jù)科學技術成為了互聯(lián)網(wǎng)金融平臺風險控制的新武器。數(shù)據(jù)科學技術,就是通過對數(shù)據(jù)的采集和分析,來挖掘數(shù)據(jù)中的異常來識別風險。不僅僅從用戶本人的信息的“點”出發(fā),而且包含用戶關聯(lián)到的所有信息的“面”出發(fā)來交叉驗證用戶提供的信息的準確性和真實性,通過第三方信息驗證,變相增加用戶的偽造和欺詐成本,從而達到風險控制的目的。 而知識圖譜技術,所做

2、的事情就是從海量臟亂的數(shù)據(jù)中提取有用的信息,并將分散的信息碎片聚合起來,以圖譜的形式組織在一起,變成相對有參考信息和洞察力的知識,以輔助決策。所以,在豐富的數(shù)據(jù)的基礎上搭建金融知識圖譜,實現(xiàn)數(shù)據(jù)上從點到面的升級,輔以圖挖掘技術和實時知識圖譜風險監(jiān)控平臺,已然成為線上風控系統(tǒng)中的關鍵一環(huán)?;ヂ?lián)網(wǎng)金融風控中的數(shù)據(jù)科學互聯(lián)網(wǎng)金融公司是怎樣用大數(shù)據(jù)和機器學習來控制風險,降低個人或者渠道的欺詐風險,這里面所應用的數(shù)據(jù)科學有哪些?本次演講將帶你探索在大規(guī)模金融服務中的數(shù)據(jù)科學架構,深入探討如何利用多維度數(shù)據(jù)、知識圖譜、機器學習等技術來應對日益增多的風險,以及一些實踐案例。 互聯(lián)網(wǎng)金融服務面臨的風險知識圖譜

3、在金融風控中的應用場景大規(guī)模金融服務中的實時架構互聯(lián)網(wǎng)金融-個人對個人的信用貸款宜人貸:極速信任自動化信用評估互聯(lián)網(wǎng)金融行業(yè)中的風險信用風險:a)遇到的問題:還款能力b)業(yè)界通常解決方法:收集收入水平、消費水平、負債情況對用戶進行風險評分c)業(yè)界的辦法為什么無效:無權威數(shù)據(jù)、數(shù)據(jù)收集難度大欺詐風險:a)遇到的問題:偽冒申請 和 欺詐交易b)業(yè)界通常解決方法:人工審查、信用黑名單、基于規(guī)則c)業(yè)界的辦法為什么無效:人工效率低、無權威黑名單、無法自動發(fā)現(xiàn)異常、欺詐手段更新快人群團體化地區(qū)集中化方式多樣化工具智能化互聯(lián)網(wǎng)金融中的風控工作是一種機器學習過程Y目標: Benchmark選取好、壞用戶定義

4、訓練、測試和跨時間驗證樣本X變量:特征工程人工特征工程圖譜特征挖掘技術知識圖譜技術圖挖掘技術知識圖譜在金融風控中的優(yōu)勢構建金融知識圖譜:FinGraph10種實體電話、身份證、銀行卡、信用卡、IP、設備號、地理位置等約1.3億節(jié)點約10億邊關系預計到2017年增長20倍知識圖譜體系應用場景層面智能搜索、反欺詐、貸后管理、營銷分析、運營支撐 等數(shù)據(jù)整合層面信用數(shù)據(jù)、金融消費數(shù)據(jù)、行為數(shù)據(jù)、社交數(shù)據(jù)、網(wǎng)絡安全、第三方數(shù)據(jù) 等圖數(shù)據(jù)庫neo4j系統(tǒng)支持層面特征工程、模型開發(fā)、異常監(jiān)控、推薦系統(tǒng) 等Spark+GraphX+Mllib+Streaming+TensorFlowFinGraph 平臺系統(tǒng)

5、風險分析實踐:人以群分(1)借款用戶通信社交網(wǎng)絡與欺詐風險結論:與壞用戶有大量關聯(lián)的借款用戶的壞賬率是未關聯(lián)用戶的2.9倍2.9倍風險分析實踐:人以群分(2)從整體借款群體的角度,用PageRank算法探索哪些用戶與大量借款用戶有關聯(lián)關系風險分析實踐:人以群分(2)借款用戶通信社交網(wǎng)絡與欺詐風險結論:PageRank高分段用戶的壞賬率是低分段用戶的3.3倍3.3倍風險分析實踐:識別組團欺詐風險通過社區(qū)發(fā)現(xiàn)算法來實時評估每個用戶的組團欺詐風險欺詐案例調(diào)查的挑戰(zhàn):失聯(lián)用戶找尋通過社區(qū)發(fā)現(xiàn)算法挖掘失聯(lián)用戶的通信社交網(wǎng)絡欺詐案例調(diào)查的挑戰(zhàn):失聯(lián)用戶找尋在社區(qū)內(nèi)使用最短路徑算法來發(fā)現(xiàn)失聯(lián)用戶與一個正常還款用戶的關系鏈風控建模中的數(shù)據(jù)科學案例ROI分析結合了上億節(jié)點和十億關聯(lián)關系提供全面風控能力用戶社交網(wǎng)絡關系特征可以分辨出3倍欺詐風險的人群用戶的組團欺詐風險可以通過社區(qū)發(fā)現(xiàn)算法實時評估失聯(lián)用戶也可以通過圖挖掘算法來找尋FinGraph是實時風險監(jiān)控的重要支撐基于實時數(shù)據(jù)采集平臺和圖數(shù)據(jù)庫,可實時捕捉風險特征,控制風險。實時數(shù)據(jù)流日志-Flume集群-Kafka集群HBase集群圖數(shù)據(jù)庫讀集群圖數(shù)據(jù)庫寫集群SYNC數(shù)據(jù)服務平臺風控規(guī)則實時欺詐監(jiān)控預警系統(tǒng)反欺詐服務平臺實時數(shù)據(jù)采集平臺層數(shù)據(jù)存

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論