個人金融借貸場景下大數(shù)據(jù)風控的行業(yè)分析及應用分析_第1頁
個人金融借貸場景下大數(shù)據(jù)風控的行業(yè)分析及應用分析_第2頁
個人金融借貸場景下大數(shù)據(jù)風控的行業(yè)分析及應用分析_第3頁
個人金融借貸場景下大數(shù)據(jù)風控的行業(yè)分析及應用分析_第4頁
個人金融借貸場景下大數(shù)據(jù)風控的行業(yè)分析及應用分析_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

個人金融借貸場景下,大數(shù)據(jù)風控的行業(yè)分析及應用分析一、大數(shù)據(jù)風控是什么?大數(shù)據(jù)風控按照通俗的概念解析:通過運用大數(shù)據(jù)構(gòu)建模型的方法對借款人進行風險控制和風險提示。這句話涵蓋大數(shù)據(jù)風控必要的4個要素:1.原材料:大數(shù)據(jù)2.實現(xiàn)方式:技術(shù)模型3.目標人群:場景中的群體。由于本文主要指個人借貸場景,則目標人群是借款人。還有其他場景,例如信用卡場景對于信用卡申請人、購物場景針對分期用戶、租房場景針對租金分期用戶、投保場景針對投保人、投資理財針對投資人等。4.目的:風險控制和風險提示。一般機構(gòu)主要有2個目的:目的1:針對降低損失,需要對好壞用戶進行識別目的2:針對獲取最大化利潤,需要對用戶資質(zhì)分層。潛在的特點是可以大批量實時實現(xiàn)風險控制和風險提示。二、傳統(tǒng)風控與大數(shù)據(jù)風控的區(qū)別大數(shù)據(jù)風控的叫法其實就是為了與傳統(tǒng)風控做區(qū)分。傳統(tǒng)風控在2016年之前相對比較普遍,其特點是線下風控場景為主,需要用戶填寫一大堆個人信息及提供工作證明、流水證明、住址證明等,審核時間一般為1-3天,銀行體系會更長3-7天左右。正常情況,一份用戶資料表需要填寫包括以下這些信息:姓名、性別、年齡、身份證號、家庭地址、學歷、家庭人數(shù)、婚姻狀態(tài)、單位名稱、單位電話、工作職務、單位性質(zhì)、收入來源、收入水平、配偶詳情、經(jīng)營企業(yè)詳情、其他資質(zhì)等信息。除了這些信息,還需要提供紙質(zhì)的身份證復印件、工作收入證明(蓋章)、半年銀行流水、水電費或房屋租賃合同等。另外,銀行等持牌機構(gòu)還會查詢用戶在央行的征信報告,用于輔助風控。這些數(shù)據(jù)潛在的意義可以這樣解讀:除了年齡代表準入門檻,一般的借貸產(chǎn)品要求借款人需要有22歲以上才可以申請,現(xiàn)金貸產(chǎn)品會把年齡門檻放到18-20歲及以上。部分產(chǎn)品要求學歷是高中及以上,或者要求非在校生。其他的分組后分別代表借款用戶的還款能力,負債情況及信用情況(這里不細分還款意愿)。直接體現(xiàn)或者間接體現(xiàn)還款能力的:家庭人數(shù)。家里人多,你還不起,催收后有人可以幫你還;2.婚姻狀態(tài),大部分家庭,結(jié)婚的比未婚的家庭收入或經(jīng)濟穩(wěn)定更好;3.單位名稱、單位電話、工作職務、單位性質(zhì)、收入來源、收入水平,直接體現(xiàn)收入水平及收入穩(wěn)定性情況;4.經(jīng)營企業(yè)詳情、其他資質(zhì)等信息。體現(xiàn)負債情況和信用情況的:央行征信報告拿到這些信息及材料后,由風控專員憑借經(jīng)驗及按照標準化流程審核材料真實性。例如工作收入證明通過撥打公司電話核查有無本人及職位情況、其他資質(zhì)材料看印章判斷真實性,流水會打銀行電話抽查真實性等。傳統(tǒng)風控的模式及節(jié)奏是不符合互聯(lián)網(wǎng)金融高速發(fā)展的節(jié)奏的,互聯(lián)網(wǎng)金融時代都是按秒級幾百上千用戶群同時發(fā)起貸款申請,如果按照人工審核,從進件到批核整個流程可能要1個月時間都沒法完成。傳統(tǒng)風控向大數(shù)據(jù)風控的升級,即是行業(yè)發(fā)展的需要,也受益于各類用戶數(shù)據(jù)被標準化對外,也就是API的形式對外輸出,金融機構(gòu)可以直接接入各種必須的數(shù)據(jù)接口,用于獲取用戶的數(shù)據(jù)。整個流程從用戶填寫將近所有的信息,變成只要提供姓名、身份證、銀行卡號、手機號這個4個要素就可以獲得全部或大部分風控必需的用戶信息。大數(shù)據(jù)風控的快捷得益于各種標準化的數(shù)據(jù)接口,但由于代表用戶的各種數(shù)據(jù)是分別存在與不同的機構(gòu)中,這些數(shù)據(jù)原則上需要用戶授權(quán)才能對外,而且數(shù)據(jù)輸出需要進行合規(guī)脫敏的處理。所以,大數(shù)據(jù)風控需要獲取到與傳統(tǒng)風控要求用戶填寫的所有信息、或者直接或間接證明用戶還款能力、還款意愿、負債情況及信用情況必須的數(shù)據(jù),每個類型需要接入幾個數(shù)據(jù)來源,缺失的類型還需要找到能夠替代的數(shù)據(jù)接口。大數(shù)據(jù)風控需要的數(shù)據(jù)類型,在后面章節(jié)再詳解。三、哪些行業(yè)及場景需要大數(shù)據(jù)風控除了借貸場景,還有哪些場景需要用到大數(shù)據(jù)風控?這里,獵人簡單舉幾個例子:金融行業(yè)最常見就是投融資板塊,投資板塊,需要對非法集資、洗錢、資金盜刷等風險進行防控。借貸板塊,需要進行貸前進行反欺詐及用戶風險識別、授信風險評估、貸中風險評估及貸后風險預警。電商行業(yè)需要在用戶注冊環(huán)節(jié)進行防薅羊毛、對已注冊充值用戶需要防止其資金被盜刷、賬戶被盜及發(fā)生交易后對經(jīng)常拒付的情況需要識別。保險行業(yè)特別是壽險產(chǎn)品,需要對投保人身份進行核實,防止有不良行為投保用戶過審發(fā)生騙保。除了這些常見的行業(yè)場景,其實各行各業(yè)只要涉及到個人信息及資金交易的,都會用到大數(shù)據(jù)風控,唯一的區(qū)別就是針對不同場景的需要的數(shù)據(jù)及策略是不一樣的。四、大數(shù)據(jù)風控行業(yè)有哪些機構(gòu)參與傳統(tǒng)風控基本都是由金融機構(gòu)內(nèi)部的風險部門及門店經(jīng)理組成,大數(shù)據(jù)風控更多是由第三方機構(gòu)提供。大數(shù)據(jù)風控行業(yè)主要有以下7大類型機構(gòu)參與:監(jiān)管部門旗下或牽頭的機構(gòu):百行征信、互金協(xié)會及小貸協(xié)會等;非銀放貸機構(gòu)旗下金融科技公司:持牌小貸公司、P2P機構(gòu)等,例如玖富及宜信;電商旗下金融科技公司:京東金融、螞蟻金服等;互聯(lián)網(wǎng)巨頭旗下金融科技公司:度小滿金融、騰訊云等;銀行系金融科技公司:銀聯(lián)智策、建行金科等;企業(yè)服務類:系統(tǒng)服務商、技術(shù)提供商、數(shù)據(jù)中介商等,例如同盾及百融;支付機構(gòu)旗下金融科技公司:天翼征信:新顏征信等。這些機構(gòu)擁有場景、資金、放貸業(yè)務三者全部或者其中一塊要素,這些要素決定了其在大數(shù)據(jù)風控的競爭壁壘。場景代表有源源不斷的數(shù)據(jù),及精準的客群畫像,可以無成本或低成本用于風控業(yè)務;資金代表了可以隨意切進任一借貸場景,獲取數(shù)據(jù)及影響產(chǎn)品形態(tài);放貸業(yè)務表示在特定場景有一定的用戶借貸表現(xiàn)的數(shù)據(jù)及基礎(chǔ)的風控能力,部分機構(gòu)的成熟風控能力還可以直接對外輸出變現(xiàn),切入到體系外的場景獲取更多的數(shù)據(jù)。因此,數(shù)據(jù)量級、數(shù)據(jù)成本、風控經(jīng)驗、資金風險承受能力綜合決定了一家機構(gòu)在大數(shù)據(jù)風控是否有足夠的競爭力。五、大數(shù)據(jù)風控機構(gòu)存在的意義個人借貸金融板塊的大數(shù)據(jù)風控行業(yè)的前景,主要可以看2方面:一個是不含房貸的國內(nèi)消費金融市場規(guī)模及滲透情況。只要消費金融市場的存量客戶,有復貸需求,且增量客群還有轉(zhuǎn)化空間,代表著借貸業(yè)務是持續(xù)發(fā)生的,則這里對風控的需求是持續(xù)不斷的。我國個人消費金融的市場規(guī)模從2013年的12億到2018年的將近38億,翻了3倍有多;而不含房貸的規(guī)模到2018年則到了8億,滲透率為22.36%。如果到2020年滲透率可以提升2.5%,則市場規(guī)模有個3.5萬億的提升。這個空間足夠眾多公司在此競爭。大數(shù)據(jù)風控機構(gòu)其中的一個收入來源就是數(shù)據(jù)接口的調(diào)用次數(shù)計費,這個調(diào)用次數(shù)息息相關(guān)的是借貸用戶數(shù)量。而央行內(nèi)收錄的大部分信貸記錄用戶都是屬于銀行等相對高質(zhì)量用戶群體,這些群體都有可能下沉到非銀系的互聯(lián)網(wǎng)金融中發(fā)生貸款行為,同時不在央行體系的信貸用戶,都是互聯(lián)網(wǎng)消費金融機構(gòu)的潛在客戶。通過央行查詢量,可以側(cè)面知道在銀行體系信貸需求的用戶數(shù)量,這部分用戶80%以上是無法獲取銀行體系的貸款的,因此理論上是可以成為消費金融機構(gòu)的潛在客群。2015年的6.3億次查詢到2018的17.6億次查詢,說明需要信貸的用戶非常多,但這么大的查詢量,有信貸記錄人數(shù)才增加了1億,說明大部分用戶都無法獲得貸款或者非常需要貸款,會同時在多個機構(gòu)申請貸款,才會每人產(chǎn)生近10次的查詢次數(shù)。六、處于消費金融產(chǎn)業(yè)鏈什么位置已知大數(shù)據(jù)風控機構(gòu)在消費金融場景中是非常有前景的,我們了解下其在消費金融產(chǎn)業(yè)鏈中的角色及功能,消費金融產(chǎn)業(yè)鏈的角色包括:監(jiān)管機構(gòu):銀保監(jiān)會、中國人民銀行等;消費金融服務提供商:商業(yè)銀行、電商平臺、持牌公司、分期平臺、非持牌機構(gòu);資金提供方:自有資金、信托、ABS、銀行借貸、同業(yè)拆及P2P;第三方支付機構(gòu):負責提供支付通道,給予消金機構(gòu)放款或者代扣還款;催收或不良資產(chǎn)機構(gòu):負責貸后逾期不還及失聯(lián)客戶;消費者:不同場景的消費需要的資金需求是不一樣的;風控及征信機構(gòu):負責提供大數(shù)據(jù)風控服務,包括數(shù)據(jù)、技術(shù)服務、模型策略等。除了消費者外,產(chǎn)業(yè)鏈中的各個角色都有附加風控及征信機構(gòu)角色的可能,對外輸出大數(shù)據(jù)風控能力。七、個貸風控場景及解決方案獵人將消費金融大數(shù)據(jù)風控場景分為5個環(huán)節(jié)6個應用場景:5個環(huán)節(jié)包括反欺詐、身份核驗、貸前審核、貸中監(jiān)控及貸后催收;6個應用場景分別對應不同的環(huán)節(jié)。反欺詐環(huán)節(jié):對申請借貸的用戶群體進行反欺詐識別,識別能力主要依賴于風險名單,高危名單(在逃、黃賭毒、涉案)、法院失信被執(zhí)行人等名單,另外還有虛擬手機號、風險IP、風險地區(qū)等名單,通過名單進行反欺詐識別。再深入點,可以在用戶使用的設備端進行反欺詐識別,查看是否是風險設備;還可以通過群體關(guān)聯(lián),找出是否團伙欺詐行為。例如申請集中在一個IP地址,一個戶籍地,通訊錄都有同一個人聯(lián)系方式等。身份核驗環(huán)節(jié):進行借貸同行業(yè)身份核驗。在反欺詐識別過程中,無風險用戶來到身份核驗環(huán)節(jié),這里可以通過身份證2要素接口,核驗用戶的姓名身份證號是否正真實;通過活體識別判斷是否用戶本人在操作;通過運營商核驗接口,核驗用戶的姓名身份證手機號是否一致,手機號是否本人實名使用;通過銀行卡核驗,核驗用戶的提供的銀行卡是否本人,防止貸款成功后,貸款資金到他人賬戶被冒用。貸前審核環(huán)節(jié):授權(quán)信息獲取,針對身份核驗通過的用戶,進行有感知或無感知的必要信息獲取,為后續(xù)模型評分準備好數(shù)據(jù)。無感知獲取的包括多頭借貸數(shù)據(jù)、消費金融畫像數(shù)據(jù)、手機號狀態(tài)和時長數(shù)據(jù)等;有感知(需要用戶提供相關(guān)賬戶密碼)獲取的數(shù)據(jù)有:運營商報告、社保公積金、職業(yè)信息、學歷信息、央行征信等。借貸用戶的分層及授信,針對以獲取的用戶相關(guān)數(shù)據(jù),根據(jù)不同的算法模型輸出針對用戶申請環(huán)節(jié)的評分卡、借貸過程的行為評分卡、授信額度模型、資質(zhì)分層等模型。不同機構(gòu)對于不同環(huán)節(jié)的模型評分叫法不一樣,目的都是圍繞風險識別及用戶資質(zhì)評估。貸中監(jiān)控:之前環(huán)節(jié)獲取的數(shù)據(jù)大部分還可以用于貸后監(jiān)控,監(jiān)控各項正常指標是否往不良轉(zhuǎn)變,例如本來無多頭借貸情況的,申請成功貸款后發(fā)現(xiàn)該用戶在別的地方有多筆借貸情況,這時可以將該用戶列為重點關(guān)注對象,防止逾期。貸后催收:此時需要催收的主要針對失聯(lián)部分客戶,這部分客戶在貸款時填寫的號碼已經(jīng)不可用,需要通過大數(shù)據(jù)風控公司通過某些手段獲得該客戶實名或非實名在用的其他號碼,提高催收人員的觸達幾率。八、大數(shù)據(jù)風控常用的數(shù)據(jù)類型大數(shù)據(jù)風控離不開數(shù)據(jù),這些數(shù)據(jù)獵人將主要的7大類型,這7大類型的存在主要有2大原因:一是這些數(shù)據(jù)維度基本可以直接或間接體現(xiàn)用戶的還款能力、負債情況、信用情況及其他潛在風險,大部分數(shù)據(jù)維度都已在金融信貸風控環(huán)節(jié)得到有效的驗證,除了個別場景對于少部分類型數(shù)據(jù)不太合適外。二是這些數(shù)據(jù)都經(jīng)過標準化的處理,且在其體系內(nèi)與合作的借貸機構(gòu)客群最低的交叉比例超過40%以上,也就是借貸機構(gòu)的100個用戶中可以在這個數(shù)據(jù)接口中查到其中40人及以上的數(shù)據(jù)。還有一些原因是這些數(shù)據(jù)來源的更新頻率足夠滿足風控公司的要求,特別是高風險名單這些要求是實時的,而身份證要素這些則無需更新實時問題也不大。數(shù)據(jù)類型主要有:身份信息:身份證、銀行卡、手機卡、學歷、職業(yè)、社保、公積金;借貸信息:注冊信息、申請信息、共債信息、逾期信息;消費信息:POS消費、保險消費、淘寶消費、京東消費;興趣信息:APP偏好、瀏覽偏好、消費類型偏好;出行信息:常出沒區(qū)域、航旅出行、鐵路出行;公檢法畫像:失信被執(zhí)行、涉訴、在逃、黃賭毒;其他風險畫像:航空鐵路黑名單、支付欺詐、惡意騙貸。九、大數(shù)據(jù)風控的數(shù)據(jù)源頭大數(shù)據(jù)風控需要的數(shù)據(jù)類型這么多,那來源是哪里,或者說這些數(shù)據(jù)掌握在哪些機構(gòu)中?身份證數(shù)據(jù)源頭:公安一所、公安三所、身份證信息查詢中心;銀行卡數(shù)據(jù)源頭:各類銀行、各地銀聯(lián);手機號數(shù)據(jù)源頭:移動、聯(lián)通、電信;學歷數(shù)據(jù)源頭:學信網(wǎng);社保公積金數(shù)據(jù)源頭:社保局、公積金管理中心;借貸數(shù)據(jù)數(shù)據(jù)源頭:央行征信中心、有信貸業(yè)務的銀行、消費金融機構(gòu)、小貸公司、P2P及有放貸業(yè)務的金融機構(gòu)(保理機構(gòu));出行數(shù)據(jù)數(shù)據(jù)源頭:中航信、鐵路總局、出行APP、運營商、有定位的APP;消費數(shù)據(jù):銀行、電商平臺、第三方支付、場景平臺;興趣愛好數(shù)據(jù)源頭:運營商、各類PC平臺網(wǎng)站、各類APP、搜索引擎、手機系統(tǒng)商。其實以上源頭直接從事數(shù)據(jù)輸出業(yè)務的只是一小部分,原因是大部分源頭公司對數(shù)據(jù)合規(guī)輸出及場景管理無專門部分負責,而且數(shù)據(jù)業(yè)務盈利不是其主要的業(yè)務。因此活躍在大數(shù)據(jù)風控行業(yè),提供數(shù)據(jù)業(yè)務的是一些通過相關(guān)關(guān)系獲得代理權(quán)的數(shù)據(jù)代理商,及為這些源頭公司提供系統(tǒng)服務的系統(tǒng)商。十、人工規(guī)則及機器模型大數(shù)據(jù)風控的實現(xiàn)方式是傳統(tǒng)風控的專家經(jīng)驗模型、及現(xiàn)今依賴算法模型兩種方式結(jié)合較多。原因是算法模型在大多數(shù)常規(guī)情況是可以準確識別風險情況,但少部分特殊情況需要人工參與干涉修正及調(diào)優(yōu)的。專家經(jīng)驗模型的流程是將遇到的新問題(新申請用戶的資料)作為入?yún)?,風控專家根據(jù)歷史出現(xiàn)的情況(不同客群的好壞表現(xiàn))歸納起來,從中找出相關(guān)規(guī)律(A客群對應好的,B客群對應壞的,C客群沒遇到過,但可能是好的等),從而判斷新問題可能發(fā)展的路徑情況(新客戶貸后是好的或者壞的)。算法模型,主要依賴統(tǒng)計學公式,流程是將新數(shù)據(jù)(新申請用戶的資料)作為入?yún)?,算法模型(隨機森林、決策樹、邏輯回歸等)在大量的歷史客戶樣本喂養(yǎng)后,已經(jīng)可以區(qū)分出不同客群的好壞表現(xiàn),從中而判斷新用戶在模型結(jié)果中對應的是好還是壞客戶分類。這其中會引入第三方的數(shù)據(jù)源(KS、IV、AUC等都是判斷第三方數(shù)據(jù)有效性的指標),看哪些數(shù)據(jù)能夠提升算法模型的識別準確率。其實從流程看出,算法模型無非把人工經(jīng)驗環(huán)節(jié)換成了算法模型替代,以此實現(xiàn)批量找出能夠判斷好壞客戶的規(guī)律,并將其標準化。但遇到一些不在歷史數(shù)據(jù)中的情況時,算法模型就可能無效,需要人工參與調(diào)優(yōu),為了解決新問題算法模型表現(xiàn)不太好的情況,現(xiàn)在有機構(gòu)嘗試用新的算法或邏輯去模仿人工調(diào)優(yōu)這個工作。十一、大數(shù)據(jù)風控的產(chǎn)品形態(tài)大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論