打造金融級智能中臺的數(shù)據(jù)底座_第1頁
打造金融級智能中臺的數(shù)據(jù)底座_第2頁
打造金融級智能中臺的數(shù)據(jù)底座_第3頁
打造金融級智能中臺的數(shù)據(jù)底座_第4頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、打造金融級智能中臺的數(shù)據(jù)底座目錄金融智能的應(yīng)用場景數(shù)據(jù)底座的背景分析高效:用AI解決AI的問題高質(zhì):流程與工具并用安全:金融的底線總結(jié)AI在螞蟻的應(yīng)用場景02030504智能理財基于金融大數(shù)據(jù)提供智能 理財策略分析和決策建議智能營銷個性化智能營銷決策 提升業(yè)務(wù)運營效率智能保險智能保險定價、定損、理 賠,線上自動化流程管理智能客服與助理一站式金融場景機器人 智能業(yè)務(wù)決策和執(zhí)行助理金融大腦06智能信貸 基于數(shù)據(jù)隱私加密共享 學習的聯(lián)合放貸智能風控基于深度學習的風險識別與防控01螞蟻AI能力大圖智能風控智能客服助理智能營銷智能信貸智能保險機器人平臺金融信息服務(wù)生物識別金融知識圖譜&NLP金融視覺平臺

2、金融算法(AutoML ,圖推理,隱私保護共享學習,運籌優(yōu)化,無監(jiān)督學習,在線學習,強化學習,模型可解釋)金 融 大 腦行 業(yè) &場 景智能理財計算數(shù)據(jù)螞蟻保險-讓更多人享受有保障的生活多收多保2500萬 小商戶日均 1萬筆 理賠相互寶半年超過 5000萬 用戶1000萬 老年用戶理賠寶背后的智能實體抽取實體匹配系統(tǒng)智能核賠圖像識別用戶上傳 理賠信息感知圖像分類:區(qū)別病歷、發(fā)票、證明等OCR:支持文字、圖章識別反欺詐:識別PS圖片等數(shù)十個圖像模型多鏈路融合決策金融視覺平臺 Computer visionNLP&知識圖譜健康知識圖譜:醫(yī)院、疾病、科室、手 術(shù)、保險產(chǎn)品等實體關(guān)聯(lián)億級節(jié)點和邊在線實

3、時融合推理金融知識圖譜平臺 Financial knowledge graph決策算法策略Algorithmic decision 對比傳統(tǒng)流程核賠效率提升5倍以上目錄金融智能的應(yīng)用場景數(shù)據(jù)底座的背景分析高效:用AI解決AI的問題高質(zhì):流程與工具并用安全:金融的底線總結(jié)智能中臺的簡略框架智能標注平臺知識圖譜&NLP平臺金融視覺平臺OLAPExplorer、ES搜索Ha3、ES訓練&算法 ALPS存儲ODPS、OSS、Hbase、RDS、CEPH計算ASDI、ODPS、Kepler調(diào)度ASWF、DataOS研 發(fā) 平 臺底 層 技 術(shù)數(shù)據(jù)底座(存儲、標注、分析等)工程底座(訓練、評測、發(fā)布等)算

4、法研發(fā)工程研發(fā)模 型數(shù)據(jù)清洗數(shù)據(jù)標注模型部署數(shù)據(jù)研發(fā)模型訓練模型服務(wù)為什么數(shù)據(jù)底座很重要來源:Stanford機器學習公開課,36氪研究院數(shù)據(jù)處理貫穿模型迭代的始終數(shù)據(jù)和特征決定了機器學習的上限數(shù)據(jù)安全是金融行業(yè)生命線金融智能的數(shù)據(jù)底座挑戰(zhàn)效率質(zhì)量安全存儲分散,多次拷貝濫用批處理標注效率低標注質(zhì)量數(shù)據(jù)快速refine標注安全訓練安全目錄金融智能的應(yīng)用場景數(shù)據(jù)底座的背景分析高效:用AI解決AI的問題 數(shù)據(jù)流轉(zhuǎn)智能標注高質(zhì):流程與工具并用安全:金融的底線總結(jié)數(shù)據(jù)流轉(zhuǎn):打通數(shù)據(jù)閉環(huán),提升流轉(zhuǎn)效率清洗過濾數(shù)據(jù)選擇數(shù)據(jù)采集標注檢查驗收模型 規(guī)則校驗業(yè)務(wù)數(shù)據(jù) 映射業(yè)務(wù)校驗?zāi)P桶l(fā)布訓練/評估數(shù)據(jù)切分數(shù)據(jù)預(yù)處

5、理模型預(yù)標數(shù)據(jù)標注數(shù)據(jù)轉(zhuǎn)換模型訓練業(yè)務(wù)場景統(tǒng)一存儲統(tǒng)一格式統(tǒng)一分析統(tǒng)一編碼數(shù)據(jù)流轉(zhuǎn):基于one ID的數(shù)據(jù)復用uuid1:v1uuid1:v2uuid2:v1op1:uuid1:v2op1:uuid2:v1op2:uuid1:v2op2:uuid2:v1snapshot1snapshot3model1:v1model2:v1model1:v2ReporterPredict resultMark result1op1:uuid1:v1Mark result2op2:uuid1:v1conditionsnapshot2原始數(shù)據(jù)標注數(shù)據(jù)樣本數(shù)據(jù)模型數(shù)據(jù)復用為預(yù) 標注結(jié)果快照數(shù)據(jù)沉淀成資產(chǎn), 提供快速

6、查找 能力DataSet1DataSet2n:n應(yīng)用效果數(shù)據(jù)智能標注:模型市場賦能標注LK光流法物體檢測透視矩陣變換視頻類Polyrnn+maskrnnOCR圖像類分詞實體推薦。文本類數(shù)據(jù)增強預(yù)標注智能輔標工具移動標注PC標注標注 工具模型發(fā)布統(tǒng)一網(wǎng)關(guān)服務(wù)監(jiān)控模型管理圖像平臺NLP平臺算法 平臺樣本自 訓 練 模 型主動學習機器人通 用 模 型數(shù)據(jù)選擇:通過主動學習節(jié)省90%的標注量主動學習(Active Learning )是一個迭代過 程,不斷選擇對當前模型效果提升最有效的樣 本,優(yōu)先進行標注分類寶case:約10%的樣本達到所有數(shù)據(jù)的 訓練效果能力集成到數(shù)據(jù)底座,包括基于信息熵的通用 選

7、擇和算法自定義選擇。橙色:主動學習 藍色:隨機綠色:所有數(shù)據(jù)增強:解決樣本少或者不均衡的問題復制、翻轉(zhuǎn)、剪切、縮放高斯噪聲、高斯模糊SMOTE、GAN例如Image Smote在具體業(yè)務(wù) 場景上帶來3-5%效果提升1.couting2.enlarge3.Extract k and gen noise總樣本數(shù)A:xB:yC:zA:x*NB:y*NC:z*N分別抽取K條計 算其均值和方 差,生成噪聲并 疊加到采樣數(shù)據(jù)Image SmoteAntLable 支持視頻、圖像、語音、文字、地圖等內(nèi)容標注;很多業(yè)務(wù)場景帶來數(shù)倍的效率提升;大部分實現(xiàn)基于前端算法,計劃開源智能輔標工具智能輔標:傾斜校正、自動

8、貼合+OCR智能輔標:圖像自動分割智能輔標:視頻人物跟蹤智能輔標:視頻圖像對齊目錄金融智能的應(yīng)用場景數(shù)據(jù)底座的背景分析高效:用AI解決AI的問題高質(zhì):流程與工具并用安全:金融的底線總結(jié)標注質(zhì)量:基于數(shù)據(jù)指標的流程管控體系工 作 流模型數(shù)據(jù)指標數(shù)據(jù)樣本數(shù)據(jù)數(shù) 據(jù)標注檢查驗收訓練駁回駁回refine多維分析UDF投票雷題工 具規(guī)則校驗機器人監(jiān)控預(yù)警分析引擎流程引擎引 擎標注質(zhì)量報表樣本分析模型效果報表目錄金融智能的應(yīng)用場景數(shù)據(jù)底座的背景分析高效:用AI解決AI的問題精準:流程與工具并用安全:金融的底線總結(jié)安全要求和解決思路安全存儲拒絕人員查看不落庫分割脫敏加密鑒權(quán)時效水印頻次訪問控制文件管控。安全

9、標注:不落數(shù)據(jù)標后即焚標注前端業(yè)務(wù)系統(tǒng)安全標注SDK標注頁標注員 密鑰解析結(jié)果展示標注后端標注員標注開始訪問控制數(shù)據(jù)加密讀取內(nèi)容Token、 請求信息安全標注:分割標注語音、文本、圖片最小化分割數(shù)據(jù)脫敏sdk原始數(shù)據(jù)數(shù)據(jù)分割片段1.1片段1.2片段2.1片段2.2片段n.m標注任務(wù)包1標注任務(wù)包2標注任務(wù)包3標注任務(wù)包n標注結(jié)果合并敏感信息識別脫敏處理安全訓練標注數(shù)據(jù)原始數(shù)據(jù)數(shù)據(jù)分割原數(shù)據(jù)1原數(shù)據(jù)2原數(shù)據(jù)3加密數(shù)據(jù)1加密數(shù)據(jù)2加密數(shù)據(jù)3加密標注數(shù)據(jù)磁盤統(tǒng)一存儲加載到內(nèi)存解碼&合成模型訓練目錄金融智能的應(yīng)用場景數(shù)據(jù)底座的背景分析高效:用AI解決AI的問題精準:流程與工具并用安全:金融的底線總結(jié)數(shù)據(jù)底座總體功能框架標注任務(wù)信息原數(shù)據(jù)、meta數(shù)據(jù)原始數(shù)據(jù)反饋數(shù)據(jù)原數(shù)據(jù)維度標注label維度模型迭代維度標注任務(wù)維度管控&治理數(shù)據(jù)資產(chǎn)數(shù)據(jù)多維透視質(zhì)量多維評估報表監(jiān)控&預(yù)警加工數(shù)據(jù)XXX預(yù)標 注結(jié)果標 注 數(shù) 據(jù)標注&預(yù)測結(jié)果人工標注算法預(yù)測 結(jié)果結(jié)果統(tǒng)一存儲 統(tǒng)一格式 統(tǒng)一分析采集&接入標準數(shù)據(jù)集數(shù)據(jù)集維度Dump寬 表產(chǎn)品 封裝平 臺標注平臺圖像平臺NLP平臺.主動學習能力組件 模型市場知識圖譜.歸一抽取Label數(shù)據(jù)標注質(zhì)量指標 樣本質(zhì)量指標 統(tǒng)計信息.數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論