金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告2023_第1頁
金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告2023_第2頁
金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告2023_第3頁
金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告2023_第4頁
金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告2023_第5頁
已閱讀5頁,還剩179頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告由于統(tǒng)計方法本身的局限性,報告數(shù)據(jù)與市場真實情況可能存在統(tǒng)計誤差?!督鹑陔娮踊冯s志社對其獨立研究或與其他機構(gòu)共同合作的所有研究數(shù)據(jù)、研究技術(shù)方法、研究模型、研究結(jié)隨著數(shù)字經(jīng)濟的高速發(fā)展,以圖數(shù)據(jù)庫、圖計算、圖學(xué)習(xí)為代表的圖技術(shù)迎來了蓬勃發(fā)作為算力和數(shù)據(jù)存儲的載體,圖數(shù)據(jù)庫技術(shù)能夠?qū)崿F(xiàn)底層數(shù)據(jù)的互聯(lián)互通,充分挖掘數(shù)據(jù)內(nèi)在關(guān)聯(lián),最大化釋放數(shù)據(jù)資產(chǎn)價值,已成為金融業(yè)數(shù)字化轉(zhuǎn)型的重要基礎(chǔ)設(shè)施。國家相關(guān)部門高度重視,先后出臺多項政策,推動圖技術(shù)在金融行業(yè)的應(yīng)用。中國人民銀行《金融科技發(fā)展規(guī)劃(2022—2025年)》明確指出:運用聯(lián)合建模、圖計算、數(shù)據(jù)可視化、數(shù)字孿生等技術(shù)手段,對海量多樣化多維度數(shù)據(jù)資源進行價值挖掘和關(guān)聯(lián)分析,建立面向用戶、面向場景因此,金融機構(gòu)對激活數(shù)據(jù)要素和數(shù)智轉(zhuǎn)型越發(fā)關(guān)注,圖數(shù)據(jù)庫憑借深挖數(shù)據(jù)價值、創(chuàng)新數(shù)據(jù)應(yīng)用、釋放數(shù)據(jù)潛能的關(guān)鍵能力,成為金融機構(gòu)高效治理、利用數(shù)據(jù)資產(chǎn)實現(xiàn)業(yè)務(wù)升級為更好地了解我國金融業(yè)圖數(shù)據(jù)庫技術(shù)的應(yīng)用現(xiàn)狀及需求,發(fā)現(xiàn)行業(yè)共性問題,宣傳成趨勢與展望等維度,對近百家金融機構(gòu)進行了深入細(xì)致地調(diào)研,也獲得了各方面的大力支持和希望可以為金融行業(yè)的相關(guān)從業(yè)者和研究者提供有價值的參考和借鑒,有效推動金融業(yè)務(wù)創(chuàng)新 1第一章調(diào)研背景與方法 4 4 4三、調(diào)研對象及方法 4第二章圖數(shù)據(jù)庫建設(shè)洞察 6一、圖數(shù)據(jù)庫知識介紹 6 6 6 84.圖數(shù)據(jù)庫的分類 8二、加快圖數(shù)據(jù)庫建設(shè)的驅(qū)動因素 三、圖數(shù)據(jù)庫市場現(xiàn)狀與生態(tài) 第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀 一、被調(diào)研機構(gòu)樣本統(tǒng)計 二、金融業(yè)圖數(shù)據(jù)庫整體表現(xiàn) 三、金融業(yè)圖數(shù)據(jù)庫選型關(guān)注重點 四、金融業(yè)圖數(shù)據(jù)庫建設(shè)難點 第四章金融業(yè)圖數(shù)據(jù)庫建設(shè)與應(yīng)用趨勢 一、金融業(yè)圖數(shù)據(jù)庫建設(shè)整體路徑 二、金融業(yè)圖數(shù)據(jù)庫建設(shè)方向 三、金融業(yè)期待與展望 1.大規(guī)模圖數(shù)據(jù)實時分析需求增加,推動圖技術(shù)向Graph3.0時代升級 第五章圖數(shù)據(jù)庫未來發(fā)展建議………一、底層技術(shù)自主可控成為關(guān)鍵競爭力………………二、人才是打通圖數(shù)據(jù)庫金融行業(yè)應(yīng)用的關(guān)鍵………三、存儲、計算、分析一體化的圖平臺或成主流………第六章金融業(yè)圖數(shù)據(jù)庫實踐案例……………………案例1農(nóng)業(yè)銀行圖數(shù)據(jù)庫建設(shè)歷程…………………案例2交通銀行全棧式知識圖譜平臺及應(yīng)用建設(shè)…………………案例3民生銀行知識圖譜建設(shè)與應(yīng)用………………案例4圖數(shù)據(jù)庫建設(shè)發(fā)展思考與實踐………………案例5基于圖數(shù)據(jù)庫的金融知識圖譜典型應(yīng)用……案例6圖數(shù)據(jù)應(yīng)用建設(shè)探索與實踐…………………案例7基于知識圖譜的智能風(fēng)控平臺實施案例……案例8圖計算在中原銀行反欺詐領(lǐng)域的探索應(yīng)用…………………案例9陽光財險非車新一代產(chǎn)品工廠………………參考文獻…………………金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告1隨著通信技術(shù)和大數(shù)據(jù)的快速發(fā)展,金融行業(yè)所具有的數(shù)據(jù)資產(chǎn)體量劇增,數(shù)據(jù)之間的關(guān)聯(lián)軟件補短板”專欄中,明確指出“突破全內(nèi)存高速數(shù)據(jù)引擎、高可靠數(shù)據(jù)存儲引擎、分布式數(shù)據(jù)處理與任務(wù)調(diào)度架構(gòu)、大規(guī)模并行圖數(shù)據(jù)處理等關(guān)鍵技術(shù),推動高性能數(shù)據(jù)庫在金融、電信、能源等重點行業(yè)關(guān)鍵業(yè)務(wù)系統(tǒng)應(yīng)用?!弊鳛閯?chuàng)新技術(shù),雖然圖數(shù)據(jù)庫技術(shù)尚在技術(shù)采用周期的早期階段,但在我國數(shù)字化程度領(lǐng)先圖數(shù)據(jù)庫的使用受到機構(gòu)規(guī)模和區(qū)域環(huán)境的國有大型商業(yè)銀行發(fā)揮領(lǐng)跑優(yōu)勢,對圖數(shù)據(jù)庫的認(rèn)知、投入、建設(shè)規(guī)模均處于行業(yè)領(lǐng)先階段,被數(shù)據(jù)庫。長三角、珠三角地區(qū)的圖數(shù)據(jù)庫使用程度最高,超過半數(shù)的機構(gòu)已使用一種及以上圖數(shù) 2金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告圖數(shù)據(jù)庫能夠?qū)崿F(xiàn)底層數(shù)據(jù)的互聯(lián)互通,充分挖掘數(shù)據(jù)要素的業(yè)務(wù)價值,已成為金融機構(gòu)在統(tǒng)計截至2022年末金融機構(gòu)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀發(fā)現(xiàn),已使用圖數(shù)據(jù)庫的41家機構(gòu)技術(shù)應(yīng)過10TB;圖規(guī)模從百萬點邊到超過百億點邊,主流在1億-10億點邊規(guī)模(36.6%1統(tǒng)計被調(diào)研機構(gòu)的2023年圖數(shù)據(jù)庫建設(shè)規(guī)劃發(fā)現(xiàn),圖數(shù)據(jù)庫市場增速快:規(guī)劃中,31.7%量的迅速增長導(dǎo)致數(shù)據(jù)量激增,對大數(shù)據(jù)的關(guān)聯(lián)存儲查詢性能提出了更高需求;另一方面,金融機構(gòu)的數(shù)字化轉(zhuǎn)型壓力在不斷增加,發(fā)揮數(shù)據(jù)資產(chǎn)價值的需求更加強烈,促進了以圖技術(shù)為驅(qū)動大數(shù)據(jù)查詢性能與自主可控是金融機構(gòu)選型的首要關(guān)注點隨著數(shù)據(jù)規(guī)模急劇增長,存儲處理的數(shù)據(jù)類型、數(shù)據(jù)維度多樣化、復(fù)雜化,圖數(shù)據(jù)庫技術(shù)有助于在即時查詢,并發(fā)操作,關(guān)聯(lián)關(guān)系等方面大幅賦能業(yè)務(wù)數(shù)據(jù)潛在價值的釋放。金融業(yè)對于圖數(shù)據(jù)庫產(chǎn)品的技術(shù)價值關(guān)注度主要聚焦于存儲、查詢、分析能力上,87.8%的被調(diào)研機構(gòu)將圖數(shù)調(diào)研機構(gòu)將產(chǎn)品閉源、代碼安全性保障、能夠規(guī)避知識產(chǎn)權(quán)風(fēng)險或是否“100%自主可控”列為金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告3金融機構(gòu)圖場景建設(shè)方向明確,企業(yè)級圖平臺為首要建設(shè)目標(biāo)金融機構(gòu)在規(guī)劃未來建設(shè)方向時,對于整合全行數(shù)據(jù)資源,打通各部門“數(shù)據(jù)孤島”,實現(xiàn)構(gòu)有零售營銷圖譜及數(shù)據(jù)血緣場景的建設(shè)計劃。雖然當(dāng)前圖技術(shù)主要由創(chuàng)新應(yīng)用場景引入,但金融機構(gòu)也明確表示希望形成跨單一場景的平臺能力。調(diào)研結(jié)果顯示,在有計劃部署圖數(shù)據(jù)庫的49圖數(shù)據(jù)庫及其應(yīng)用市場正處于快速發(fā)展迭代的過程中,市場內(nèi)相關(guān)相對于從0到1進行圖數(shù)據(jù)庫自研,或是基于開源圖數(shù)據(jù)庫自行搭建系統(tǒng),金融機構(gòu)更傾向于底表示會選擇與商業(yè)圖數(shù)據(jù)庫廠商合作,其中73.0%表示會選擇單一商業(yè)圖數(shù)據(jù)庫供應(yīng)商,以打通應(yīng)用“最后一公里”,成為圖數(shù)據(jù)庫技術(shù)發(fā)展的關(guān)鍵點在計劃部署圖數(shù)據(jù)庫的49家被調(diào)研機構(gòu)中,圖數(shù)據(jù)庫廠商的實際落地案例成為金融機構(gòu)的首要考量因素,95.9%的被調(diào)研機構(gòu)均表示更傾向于與已有金融機構(gòu)合作案例的圖數(shù)據(jù)庫廠商開展合作,股份制銀行則尤其看重大型銀行的合作案例。此外,83.6%的被調(diào)研機構(gòu)表示會關(guān)注廠圖技術(shù)專業(yè)人才的稀缺已經(jīng)成為制約金融行業(yè)圖數(shù)據(jù)庫應(yīng)用表示缺乏相關(guān)的技術(shù)專業(yè)人才。國有大型商業(yè)銀行作為圖數(shù)據(jù)庫的深度用戶,對業(yè)務(wù)、技術(shù),以及技術(shù)業(yè)務(wù)結(jié)合的復(fù)合型人才均表現(xiàn)出了極高的需求。因此,被調(diào)研機構(gòu)均表示期待有更多機會參與圖數(shù)據(jù)庫相關(guān)活動以獲得技術(shù)指導(dǎo),尤其對業(yè)務(wù)場景的具體解決方案的支持交流有著強烈需 4金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告當(dāng)前,金融業(yè)積累的數(shù)據(jù)呈指數(shù)級增長,新的數(shù)據(jù)源層出不窮,且數(shù)據(jù)豐富程度增加,數(shù)據(jù)間的關(guān)聯(lián)性增多,傳統(tǒng)的對小量、單維度、靜態(tài)化數(shù)據(jù)的分析已無法滿足金融業(yè)數(shù)字化轉(zhuǎn)型發(fā)展的需求。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫無法滿足高效、可擴展、復(fù)雜數(shù)據(jù)管理和分析的需求,存在數(shù)據(jù)處圖技術(shù)以“點”“邊”為數(shù)據(jù)結(jié)構(gòu)直觀簡潔地描述業(yè)務(wù)實體之間的復(fù)雜關(guān)聯(lián)關(guān)系,以復(fù)雜關(guān)聯(lián)關(guān)系的存儲、查詢、計算性能優(yōu)化為第一設(shè)計原則,能夠高效地挖掘多源異構(gòu)數(shù)據(jù)間潛在的內(nèi)在關(guān)聯(lián)、最大化釋放數(shù)據(jù)資產(chǎn)價值,提升金融機構(gòu)對客戶的全局洞察力,激發(fā)金融機構(gòu)的業(yè)務(wù)創(chuàng)面對挑戰(zhàn)和新的發(fā)展機遇,金融機構(gòu)逐步落地圖數(shù)據(jù)庫應(yīng)用,打造數(shù)據(jù)互聯(lián)網(wǎng)絡(luò)效應(yīng),實現(xiàn)金融科技創(chuàng)新,賦能業(yè)務(wù)發(fā)展。為深入了解我國金融機構(gòu)圖數(shù)據(jù)庫技術(shù)應(yīng)用現(xiàn)狀及發(fā)展趨勢,開本次調(diào)研工作主要圍繞金融機構(gòu)在圖數(shù)據(jù)庫領(lǐng)域的布局、應(yīng)用規(guī)模、典型業(yè)務(wù)場景,以及在實際運用遇到的問題和未來發(fā)展規(guī)劃等信息進行采集分析,力求客觀反映當(dāng)前國內(nèi)金融機構(gòu)圖數(shù)三、調(diào)研對象及方法稱股份制銀行)、城市商業(yè)銀行(簡稱城商行)、農(nóng)信社(農(nóng)商行)及其他金融機構(gòu)(銀聯(lián)、證第一章調(diào)研背景與方法5 6金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告述現(xiàn)實世界中個體和個體之間復(fù)雜關(guān)系的數(shù)據(jù)結(jié)構(gòu),對現(xiàn)實世界的內(nèi)在關(guān)系具有簡潔、直觀的表用于從圖結(jié)構(gòu)數(shù)據(jù)中挖掘出有價值的知識或規(guī)律來指導(dǎo)業(yè)務(wù)決策,如風(fēng)險評估、事件溯源、因果推理和影響分析等。圖技術(shù)可大致分為三大類:一是處理圖數(shù)據(jù)存儲查詢的圖數(shù)據(jù)庫技術(shù);二是對圖數(shù)據(jù)進行分析和計算的圖計算技術(shù);三是對圖數(shù)據(jù)進行可視化展示的圖可視化技術(shù)。實際應(yīng)圖的概念對于圖數(shù)據(jù)庫的理解至關(guān)重要。圖(Graph)源于數(shù)學(xué)中的圖論,是一組頂點和邊和它們的“屬性”來表示并存儲數(shù)據(jù)。不同于傳統(tǒng)數(shù)據(jù)庫,數(shù)據(jù)間的關(guān)系以表與表之間的外鍵的形式隱形、間接存在,針對關(guān)系的查詢必須在運行時進行具體化操作,在圖數(shù)據(jù)庫中,數(shù)據(jù)間的關(guān)系和數(shù)據(jù)本身同樣重要,它們被作為數(shù)據(jù)的一部分顯性存儲,關(guān)系上可添加方向以及屬性對其第二章圖數(shù)據(jù)庫建設(shè)洞察7的誕生。原生圖數(shù)據(jù)庫采用“免索引鄰接”的設(shè)計,讓圖遍歷的性能僅與被查詢的頂點關(guān)聯(lián)到的局部數(shù)據(jù)量相關(guān),而不會像傳統(tǒng)數(shù)據(jù)庫那樣隨全局?jǐn)?shù)據(jù)體量的增加而降低,實現(xiàn)了關(guān)聯(lián)查詢效率的極大提升。這個階段的圖數(shù)據(jù)庫擴展性差,受限于單機的存儲計算資源瓶頸,應(yīng)用主要集中在據(jù)庫應(yīng)用開始從靜態(tài)參考數(shù)據(jù)擴展到基于行為的核心交易數(shù)據(jù),如資金流向、信貸申請、消費及生產(chǎn)關(guān)系上。此時,系統(tǒng)的橫向擴展性成為行業(yè)剛需,是否支持大規(guī)模數(shù)據(jù)的分布式存儲成為人層基于分布式的開源NoSQL存儲,實現(xiàn)了圖數(shù)據(jù)的分布式存儲和加工,一定程度上解決了單機代的圖數(shù)據(jù)庫產(chǎn)品的橫向擴展性有長足提升。但由于底層的鍵值數(shù)據(jù)庫、列式數(shù)據(jù)庫等在內(nèi)核設(shè)計上并不以“關(guān)系”的表達和處理作為優(yōu)化重點,圖遍歷的查詢性能較Graph1.0時代的原生圖數(shù)據(jù)庫有較大差距,無法滿足大數(shù)據(jù)實時更新、查詢、計算的需求,這個時代的圖數(shù)據(jù)庫技術(shù)多2016年開始,隨著市場認(rèn)知度的加強,圖數(shù)據(jù)庫技術(shù)的技術(shù)成熟度不斷發(fā)展,應(yīng)用場景也 8金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告不斷被拓寬、升級到了基于行為、事件、物聯(lián)網(wǎng)大數(shù)據(jù)的實時處理、分析場景。為滿足大數(shù)據(jù)量級下的查詢返回效率,在快速變化的商業(yè)環(huán)境下提供實時的商業(yè)智能,誕生了以Galaxybase、接控制了底層的數(shù)據(jù)存儲與分布式數(shù)據(jù)通訊機制,實現(xiàn)了分布式的原生圖存儲,因而大幅提升了大圖數(shù)據(jù)的查詢、處理性能。此外,由于圖遍歷的隨機游走特性,大圖數(shù)據(jù)的復(fù)雜查詢?nèi)蝿?wù)往往圖數(shù)據(jù)模型直接還原業(yè)務(wù)場景,相比傳統(tǒng)數(shù)據(jù)模型更直觀、靈活,能夠很好應(yīng)對數(shù)據(jù)關(guān)系動圖數(shù)據(jù)庫的查詢語言在關(guān)聯(lián)查詢中更簡潔,以通用的Cypher圖查詢語言為例圖數(shù)據(jù)庫在處理關(guān)聯(lián)性強的數(shù)據(jù)及天然的圖問題場景時具有強大的關(guān)聯(lián)查詢性能優(yōu)勢。傳統(tǒng)關(guān)系型數(shù)據(jù)庫在進行關(guān)聯(lián)查詢時需要做昂貴的表連接(TableJOIN)操作,涉及大量的I/O及內(nèi)存消耗,性能存在很大瓶頸。而圖數(shù)據(jù)庫專門針對關(guān)聯(lián)查詢進行優(yōu)化,通過數(shù)據(jù)存儲模式的圖結(jié)構(gòu)數(shù)據(jù)由具備多種屬性的“點”“邊”構(gòu)成,且“點”“邊”間存在關(guān)聯(lián)復(fù)雜,圖結(jié)構(gòu)數(shù)據(jù)往往呈現(xiàn)出復(fù)雜性、多樣性和動態(tài)性的特征。圖數(shù)據(jù)庫的核心操作單元是圖遍歷,即通過不鄰的邊被存儲在一起,無需依賴其他索引類的數(shù)據(jù)結(jié)構(gòu)即可通過圖中的任意給定點直接訪問它所第二章圖數(shù)據(jù)庫建設(shè)洞察9有的相鄰邊,讓找到相鄰點的時間成為一個不依賴整體數(shù)據(jù)量的常量開銷??梢哉f圖數(shù)據(jù)庫的技根據(jù)實現(xiàn)免索引鄰接的程度及方式不同,相應(yīng)的圖數(shù)據(jù)庫的查詢速度和數(shù)據(jù)的讀寫性能也會出現(xiàn)巨大的差距。因此,依據(jù)不同圖數(shù)據(jù)庫在內(nèi)核設(shè)計上是否實現(xiàn)了免索引鄰接,以及在什么層完全非原生。這種結(jié)構(gòu)未實現(xiàn)免索引鄰接,它在數(shù)據(jù)層使用關(guān)系型數(shù)據(jù)庫、鍵值數(shù)據(jù)庫、文檔或者其他多模數(shù)據(jù)庫作為存儲,在處理層通過多表鏈接及字段索引實現(xiàn)關(guān)聯(lián)關(guān)系的查詢,僅在業(yè)務(wù)層以圖的方式進行呈現(xiàn)。該存儲架構(gòu)面對數(shù)據(jù)量小、關(guān)聯(lián)跳數(shù)少、表關(guān)系簡單、靜態(tài)的場景也能良好支撐,但在數(shù)據(jù)量大、關(guān)系復(fù)雜的場景下查詢效率會急速下降,還會帶來大量表的大量實現(xiàn)免索引鄰接。由于存儲層并沒有完整的圖語義支持,這種架構(gòu)會導(dǎo)致圖查詢和計算時,存在關(guān)聯(lián)關(guān)系鏈路不深的場景中,非原生數(shù)據(jù)庫性能尚可,但是當(dāng)點邊數(shù)量大,查詢鏈路深,則需要 10金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告原生圖存儲。原生圖存儲不依賴第三方關(guān)系型或NoSQL的存儲系統(tǒng),直接在存儲層實現(xiàn)免索引鄰接,實現(xiàn)復(fù)雜圖數(shù)據(jù)遍歷的極致性能。在原生圖數(shù)據(jù)庫上實現(xiàn)的圖處理層,保持了存儲與處理層的數(shù)據(jù)模型的一致性,降低了不同數(shù)據(jù)模型之間轉(zhuǎn)換的處理成本,能夠更好地實現(xiàn)存儲與運算系統(tǒng)的無縫聯(lián)動,降低非原生架構(gòu)下不同系統(tǒng)間的黑盒溝通成本,最優(yōu)化圖處理性能。(見圖2)當(dāng)前,高性能圖計算技術(shù)已經(jīng)上升到國家戰(zhàn)略高度。國家陸續(xù)出臺多重政策,從技術(shù)前沿性近年來,國家大力支持信息技術(shù)應(yīng)用創(chuàng)新產(chǎn)業(yè),鼓勵圖數(shù)據(jù)庫處理技術(shù)研發(fā)和產(chǎn)品應(yīng)用。2021年11月,工信部發(fā)布的《“十四五”軟件和信息技術(shù)服務(wù)業(yè)發(fā)展規(guī)劃》,在“關(guān)鍵基礎(chǔ)軟據(jù)處理與任務(wù)調(diào)度架構(gòu)、大規(guī)模并行圖數(shù)據(jù)處理等關(guān)鍵技術(shù)。推動高性能數(shù)據(jù)庫在金融、電信、能源等重點行業(yè)關(guān)鍵業(yè)務(wù)系統(tǒng)應(yīng)用。”相關(guān)政策強有力地激發(fā)國內(nèi)企業(yè)對于圖數(shù)據(jù)庫這項新興技數(shù)據(jù)作為新型生產(chǎn)要素,是數(shù)字經(jīng)濟時代區(qū)別農(nóng)業(yè)、工業(yè)時代的關(guān)鍵特征。自黨的十九屆四中全會首次將數(shù)據(jù)列為生產(chǎn)要素以來,政府陸續(xù)出臺《“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃》《關(guān)于加快建設(shè)全國統(tǒng)一大市場的意見》《要素市場化配置綜合改革試點總體方案》、“數(shù)據(jù)二十條”等要深刻認(rèn)識數(shù)據(jù)要素重要價值,制定企業(yè)級數(shù)據(jù)規(guī)劃和發(fā)展戰(zhàn)略,深化數(shù)據(jù)綜合應(yīng)用。并且明確提出“運用聯(lián)合建模、圖計算、數(shù)據(jù)可視化、數(shù)字孿生等技術(shù)手段,對海量多樣化多維度數(shù)據(jù)資源進行價值挖掘和關(guān)聯(lián)分析,建立面向用戶、面向場景的大數(shù)據(jù)知識圖譜和綜合分析能力,發(fā)揮第二章圖數(shù)據(jù)庫建設(shè)洞察隨著信息時代的快速發(fā)展,金融機構(gòu)內(nèi)部完成了海量數(shù)據(jù)的沉淀,大規(guī)模數(shù)字化的客戶互動和業(yè)務(wù)進程的背后會產(chǎn)生海量數(shù)據(jù),要求企業(yè)對于海量數(shù)據(jù)的管理、關(guān)聯(lián)、挖掘進行更加深入的探索,實現(xiàn)經(jīng)營策略從“經(jīng)驗判斷”向“數(shù)據(jù)說話”,組織發(fā)展從“產(chǎn)能驅(qū)動”向“數(shù)據(jù)驅(qū)動”圖數(shù)據(jù)庫作為數(shù)據(jù)時代的重要基礎(chǔ)軟件之一,能夠通過數(shù)據(jù)關(guān)聯(lián)關(guān)系挖掘,全面連接數(shù)據(jù)要素,激活數(shù)據(jù)資產(chǎn)價值,賦能金融機構(gòu)數(shù)據(jù)應(yīng)用從“能用、會用”向“好用、愛用”轉(zhuǎn)變,打造隨著新一代互聯(lián)網(wǎng)技術(shù)的發(fā)展,金融機構(gòu)朝著更全面、深入、便捷的智能化方向發(fā)展,內(nèi)部業(yè)務(wù)模式日趨線上化、平臺化、實時化、場景化。而數(shù)字化運營背后,風(fēng)險防控、智能營銷的全金融風(fēng)控領(lǐng)域,一方面,金融機構(gòu)內(nèi)部傳統(tǒng)風(fēng)控手段出現(xiàn)效率低、精度差、成本高等問題,難以應(yīng)對互聯(lián)網(wǎng)技術(shù)下風(fēng)險加速傳播和交叉感染的難題;另一方面,犯罪分子在信息技術(shù)的加持而在營銷場景,金融行業(yè)隨互聯(lián)網(wǎng)經(jīng)濟獲得的流量紅利逐漸見頂,競爭加劇,正逐步轉(zhuǎn)向?qū)σ延锌蛻羯疃冗\營階段。傳統(tǒng)客戶管理系統(tǒng)中客戶渠道多、維度少,產(chǎn)品同質(zhì)化嚴(yán)重,很難做到因此,金融機構(gòu)亟需抓住數(shù)字化、網(wǎng)絡(luò)化、智能化融合發(fā)展的機遇,全面推進數(shù)字化轉(zhuǎn)型,推動數(shù)字技術(shù)從“支撐使能”向“價值賦能”變革,為數(shù)字經(jīng)濟發(fā)展提供強勁的金融支持。中國建集成數(shù)據(jù)整合、提純加工、建模分析、質(zhì)量管控、可視化交互等功能的綜合型數(shù)據(jù)中臺,打造圖數(shù)據(jù)庫,一種基于圖論的新型數(shù)據(jù)管理及分析計算系統(tǒng),擅長對海量、復(fù)雜、多變的數(shù)據(jù)進行深度、實時分析和計算,已成為金融機構(gòu)在互聯(lián)網(wǎng)時代的業(yè)務(wù)創(chuàng)新發(fā)展的核心引擎。基于圖數(shù)據(jù)庫,金融機構(gòu)能夠高效整合交易、客戶、風(fēng)險、運營等數(shù)據(jù)以及第三方數(shù)據(jù),打造立體化的多維KYC完整視圖,構(gòu)建全行一張圖,實現(xiàn)全客戶、全渠道增強客戶跨業(yè)務(wù)、跨產(chǎn)品、跨時間的風(fēng)險識別及動機識別能力,并針對不同場景的不同客戶定制化營銷策略,助力客戶全生命周期的精準(zhǔn)營銷,真正做到打通業(yè)務(wù)條線壁壘、解構(gòu)業(yè)務(wù)邏輯、沉 12金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告三、圖數(shù)據(jù)庫市場現(xiàn)狀與生態(tài)當(dāng)數(shù)字經(jīng)濟、產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型進入深化發(fā)展階段時,數(shù)據(jù)作為產(chǎn)業(yè)發(fā)展的核心資產(chǎn),被賦予新的角色和使命。企業(yè)更為關(guān)注數(shù)據(jù)資產(chǎn)的利用,圖技術(shù)在處理復(fù)雜關(guān)聯(lián)數(shù)據(jù)上的性能優(yōu)勢決定在數(shù)據(jù)體量日益膨脹和數(shù)據(jù)間關(guān)聯(lián)關(guān)系日益復(fù)雜的今天,越來越多的企業(yè)和研究機構(gòu)都開始庫市場已形成初步規(guī)模。中國的圖數(shù)據(jù)庫市場在政策和市場需求的共同推動下,正處于快速發(fā)展第二章圖數(shù)據(jù)庫建設(shè)洞察132019年末,國內(nèi)圖數(shù)據(jù)庫市場加速發(fā)展,各類圖數(shù)據(jù)庫廠商在市場中亮相,圖數(shù)據(jù)庫迅速現(xiàn)階段商業(yè)圖數(shù)據(jù)庫廠商大致可分為三類:一是公有云廠商基于自身業(yè)務(wù)需求及技術(shù)架構(gòu)開百度等,它們占據(jù)了圖數(shù)據(jù)庫公有云的主流市場;二是新興的商業(yè)圖數(shù)據(jù)庫創(chuàng)業(yè)公司,其圖數(shù)據(jù)庫產(chǎn)品最大特點是高性能與更貼近客戶需求的服務(wù)能力,典型代表廠商為創(chuàng)鄰科技、TigerGraph等;三是傳統(tǒng)數(shù)據(jù)庫廠商、應(yīng)用開發(fā)商關(guān)注到圖數(shù)據(jù)庫的發(fā)展趨勢,為了彌補自身產(chǎn)品矩陣在圖數(shù)據(jù)庫方面的短板而打造的產(chǎn)品。這類廠商分布在圖技術(shù)產(chǎn)業(yè)鏈的不同上下游位置,共同推動圖 14金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告6家其他金融機構(gòu)。從分布地域來看,57家城商行、農(nóng)信社(農(nóng)商行)按地域劃分,1家銀行來2家來自黔中城市群、9家來自長江中游城市群、6家來自長三角、9家來自中原城市群、8家來調(diào)研數(shù)據(jù)顯示,圖數(shù)據(jù)庫技術(shù)在金融行業(yè)已經(jīng)開始進入大眾市場的視野。被調(diào)研的金融機構(gòu)第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀15當(dāng)前,金融機構(gòu)對于圖數(shù)據(jù)庫的認(rèn)知存在兩極分化現(xiàn)象。對圖數(shù)據(jù)庫技術(shù)本身的不了解及其對圖數(shù)據(jù)庫的使用進程主要集中在聽說過但未使用過(20.3%),和已使用過一種以上的 16金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告階段外,其他被調(diào)研機構(gòu)均表已使用過一種及以上的圖數(shù)據(jù)庫,其中66.7%的國有大行、在對30家尚未使用圖數(shù)據(jù)庫且無采購計劃的金融機構(gòu)的調(diào)研發(fā)現(xiàn),近1/2的被調(diào)研機構(gòu)表▲圖9金融機構(gòu)未應(yīng)用圖數(shù)據(jù)庫技術(shù)在已經(jīng)使用圖數(shù)據(jù)庫的41家金融機構(gòu)中,圖數(shù)據(jù)庫建設(shè)進程在不同規(guī)模的金融機構(gòu)間也存在較大差距。國有大行、股份制銀行等對圖數(shù)據(jù)庫技術(shù)的整體投入及應(yīng)用規(guī)模更大,充分體現(xiàn)了第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀171億-100億點邊圖規(guī)模上,部署節(jié)點數(shù)也多在4-10節(jié)點的中型集多集中在2-3節(jié)點,千萬到億級別的圖規(guī) 18金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀19被調(diào)研的41家已部署圖數(shù)據(jù)庫的機構(gòu)中,分別有85.4%、73.2%、70.7%的機構(gòu)在對公、▲圖12不同類型金融機構(gòu)三大類場景 20金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告總體上,國有大型商業(yè)銀行在圖技術(shù)應(yīng)用上全面領(lǐng)跑其他金融機構(gòu),銀行機構(gòu)更多將圖數(shù)據(jù)在對公業(yè)務(wù)中,企業(yè)關(guān)系圖譜是主要的應(yīng)用場景,其中,股權(quán)穿透、擔(dān)?;ケHν诰驗榇碓诹闶蹣I(yè)務(wù)中,申請反欺詐和交易反欺詐是主要應(yīng)用場景,但整體圖數(shù)據(jù)庫應(yīng)用普及率不及在內(nèi)部監(jiān)管業(yè)務(wù)中,近半數(shù)被調(diào)研機構(gòu)已將圖數(shù)據(jù)庫應(yīng)用于反洗錢場景,合規(guī)與審計是僅次),此外,對公業(yè)務(wù)中圖數(shù)據(jù)庫在營銷場景的應(yīng)用率整體遠低于風(fēng)險場景。在國家政策大力推廣的?。?,第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀21 22金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告場景下的應(yīng)用率達到100%,遠超其他類型機構(gòu)的場景應(yīng)用率。相較之下,股份制銀行更多投入在信用卡相關(guān)場景(申請反欺詐、精準(zhǔn)營銷、反套現(xiàn))。農(nóng)信社(農(nóng)商行)則在反詐騙、反賭博場景方面投入高于國有大行、股份制銀行及城商行。值得一提的是,被調(diào)研的股份制銀行及農(nóng)信第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀23社(農(nóng)商行)都未應(yīng)用圖數(shù)據(jù)庫技術(shù)刻畫零售客戶360圖譜,此場景或為零售業(yè)務(wù)圖數(shù)據(jù)庫應(yīng)用對公及零售業(yè)務(wù)中,國有大行、股份制銀行的圖數(shù)據(jù)庫應(yīng)用率更廣。內(nèi)部監(jiān)管業(yè)務(wù)中(見圖14-3農(nóng)信社(農(nóng)商行)的圖數(shù)據(jù)庫應(yīng)用率更高。審計及反洗錢場景中,農(nóng)信社(農(nóng)商行)應(yīng)對保險和證券機構(gòu)而言,圖數(shù)據(jù)庫則主要應(yīng)用于內(nèi)部監(jiān)管相關(guān)場景。反洗錢、智能問答、合三、金融業(yè)圖數(shù)據(jù)庫選型關(guān)注重點選擇圖數(shù)據(jù)庫產(chǎn)品時需要從性能、安全可控性、業(yè)務(wù)支撐度、簡單易用性等多個維度分析圖代碼安全性、是否自主可控、是否具有解決方案能力、能夠支撐業(yè)務(wù)邏輯的定制化開發(fā)、技術(shù)運維工具是否完備完善等多個方面。我們將這些技術(shù)要素按照性能、業(yè)務(wù)支撐度、安全可控、簡單 24金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告素被選擇的數(shù)量占比、被選擇的順序在首位的占比、被選擇的順序在前三位的占比,得出四大維隨著數(shù)據(jù)規(guī)模急劇增長,存儲處理的數(shù)據(jù)類型、數(shù)據(jù)維度多樣化、復(fù)雜化,金融機構(gòu)首要關(guān)注的是圖數(shù)據(jù)庫的大數(shù)據(jù)處理性能。87.8%的被調(diào)研機構(gòu)認(rèn)為性能表現(xiàn)是重要的產(chǎn)品技術(shù)價值,第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀25原生分布式架構(gòu)能夠保證圖數(shù)據(jù)庫的橫向擴展力與分布式的查詢性能。75.6%的被其中35.7%的機構(gòu)將大數(shù)據(jù)量下的查詢性能或是否支持原生分布式架構(gòu)的性能相關(guān)指排在首位。80.0%的被調(diào)研機構(gòu)將大數(shù)據(jù)下的查詢性能或是否支持原生分布式架構(gòu)的性能相關(guān)指隨著金融機構(gòu)存儲、處理的數(shù)據(jù)量(點數(shù))增大,數(shù)據(jù)間的復(fù)雜關(guān)聯(lián)關(guān)系(邊數(shù))將呈指數(shù)級增長,這對圖數(shù)據(jù)庫存儲、處理大數(shù)據(jù)的能力提出了很高的要求。91.8%的機構(gòu)認(rèn)為圖數(shù)據(jù)庫國有大行、股份制銀行、保險及證券機構(gòu)對于性能的關(guān)注度更高,100%的被調(diào)研機構(gòu)認(rèn)為 26金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告與大數(shù)據(jù)的查詢性能相似,在被調(diào)研的國有大行、股份制銀行、保險及證券機構(gòu)中,100%▲圖17不同類型金融機構(gòu)對原生分布第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀27開源產(chǎn)品相比閉源產(chǎn)品有更高的知識產(chǎn)權(quán)風(fēng)險、易受攻擊的安全隱患,存在卡脖子的風(fēng)險。開源社區(qū)項目的數(shù)據(jù)統(tǒng)計顯示,沒有大廠持續(xù)投入的開源項目商業(yè)服務(wù)持續(xù)性與穩(wěn)定性不佳,造成產(chǎn)品的總體使用成本更高。統(tǒng)計發(fā)現(xiàn),近40%的被調(diào)研機構(gòu)認(rèn)為閉源為重要因素(見圖70.0%的股份制銀行將自主可控作為重要考慮因素。在認(rèn)為自主可控重要的機構(gòu)中,40.0%的國 28金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀29對于圖數(shù)據(jù)庫廠商對業(yè)務(wù)的支撐能力,金融機構(gòu)同樣表現(xiàn)出了較高的關(guān)注度。68.4%的被調(diào)研機構(gòu)認(rèn)為業(yè)務(wù)支撐能力十分重要,20.6%的被調(diào)研機構(gòu)將其列在所有技術(shù)因素的前三位,▲圖22不同類型金融機構(gòu)對業(yè)務(wù)支撐能圖數(shù)據(jù)庫的業(yè)務(wù)支撐能力主要體現(xiàn)在以下四方面:圖數(shù)據(jù)庫的供應(yīng)商是否有解決方案供應(yīng)能力;圖數(shù)據(jù)庫是否具備豐富的圖分析功能;對業(yè)務(wù)人員是否簡單易用;應(yīng)用生態(tài)是否完善。關(guān)注圖數(shù)據(jù)庫廠商業(yè)務(wù)支持能力的機構(gòu)中,83.7%的金融機構(gòu)關(guān)注圖數(shù)據(jù)庫是否具備豐富的圖分析能力,43.9%將其排在了所有考慮因素的前三位。值得關(guān)注的是,67.3%的金融機構(gòu)期望圖數(shù)據(jù)庫圖數(shù)據(jù)庫作為一種新興技術(shù),學(xué)習(xí)門檻高、市場人才少,因此,各類金融機構(gòu)普遍對圖數(shù)據(jù)庫的便捷運維性提出了要求。64.8%的被調(diào)研機構(gòu)認(rèn)為簡單易運維的相關(guān)特點是選擇圖數(shù)據(jù)庫的 30金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告75.0%的國有大行、71.9%的農(nóng)信社(農(nóng)商行)、67.5%的城商行和57.5%的股份制銀行圖數(shù)據(jù)庫的易運維程度取決于產(chǎn)品開發(fā)接口的豐富程度、培訓(xùn)體系與售后服務(wù)體系的完備程度等。這其中,是否具備豐富的開發(fā)接口成為最重要的考慮因素。因為金融機構(gòu)業(yè)務(wù)復(fù)雜多樣,▲圖24不同類型金融機構(gòu)對簡單第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀31豐富的開發(fā)接口能夠幫助金融機構(gòu)簡易地實現(xiàn)業(yè)務(wù)的深度定制化開發(fā)。51.4%的金融機構(gòu)將其排▲圖26不同類型金融機構(gòu)對豐富開發(fā)接 32金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告圖數(shù)據(jù)庫技術(shù)正處在從小眾市場逐步進入大眾市場。不同于早期用戶看重產(chǎn)品的技術(shù)性能,因此,除了產(chǎn)品的技術(shù)能力,圖數(shù)據(jù)庫廠商的商業(yè)化案例也成為影響金融機構(gòu)決策的關(guān)鍵因▲圖27金融機構(gòu)對圖數(shù)據(jù)庫企業(yè)在國有大行具有豐富的業(yè)務(wù)場景、復(fù)雜的技術(shù)架構(gòu)、數(shù)據(jù)及業(yè)務(wù)處理要求高,能很好地促進圖數(shù)據(jù)庫廠商產(chǎn)品迭代。除保險、證券機構(gòu)外,各銀行機構(gòu)普遍看重和有國有大行案例。100%被由于圖數(shù)據(jù)庫屬于新興領(lǐng)域,學(xué)習(xí)門檻高,應(yīng)用難度大,亟需專業(yè)的圖技術(shù)復(fù)合型人技術(shù)專業(yè)人才的稀缺已經(jīng)成為制約圖數(shù)據(jù)庫金融行業(yè)應(yīng)用的重要因素,78.5%的被調(diào)研機構(gòu)表示缺乏相關(guān)的專業(yè)技術(shù)人才。已經(jīng)使用了圖數(shù)據(jù)庫的金融機構(gòu)更明顯,高達87.8%的機構(gòu)認(rèn)為專業(yè)第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀33▲圖28不同類型金融機構(gòu)對企業(yè)在行業(yè)人才的缺乏間接導(dǎo)致了圖數(shù)據(jù)庫業(yè)務(wù)價值難以發(fā)揮,缺乏相關(guān)專業(yè)人才意味著圖技術(shù)在實際應(yīng)用過程中,金融機構(gòu)缺乏系統(tǒng)的知識體系,不知道哪里用、怎么用。即使是已使用圖數(shù)據(jù)庫的 34金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀35國有大行作為圖數(shù)據(jù)庫技術(shù)的深度用戶,對業(yè)務(wù)、技術(shù),以及復(fù)合型人才均需求較高,農(nóng)信▲圖32不同類型金融機構(gòu)對各類圖數(shù)不同類型的金融機構(gòu)在圖數(shù)據(jù)庫人才梯隊建設(shè)上也 36金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告行、80%的農(nóng)信社(農(nóng)商行)無人才招聘計劃,原因是該群體對圖數(shù)據(jù)庫技術(shù)理解、應(yīng)用程度不行、80%的農(nóng)信社(農(nóng)商行)無人才招聘計劃,原因是該群體對圖數(shù)據(jù)庫技術(shù)理解、應(yīng)用程度不當(dāng)前,圖數(shù)據(jù)庫技術(shù)正在快速發(fā)展,但仍處于早期發(fā)展階段,缺乏行業(yè)標(biāo)準(zhǔn)和業(yè)內(nèi)共識。缺調(diào)研結(jié)果顯示,金融機構(gòu)迫切需要相關(guān)部門制訂圖數(shù)據(jù)庫行業(yè)標(biāo)準(zhǔn),60.8%的被調(diào)研機構(gòu)建議制由于金融機構(gòu)對于信通院測試、LDBC測試等國內(nèi)、國際圖數(shù)據(jù)庫測評標(biāo)準(zhǔn)了解不足,只有LDBC測試作為當(dāng)前業(yè)界權(quán)威的衡量圖數(shù)據(jù)庫管理系統(tǒng)性能的測評標(biāo)準(zhǔn),為圖數(shù)據(jù)庫產(chǎn)品測其中企業(yè)成員包括Intel、Oracle、Neo4j、創(chuàng)鄰科技等國內(nèi)外知名圖數(shù)據(jù)庫廠商,致力于推進行業(yè)的規(guī)范標(biāo)準(zhǔn)化。SNB是LDBC主導(dǎo)的基準(zhǔn)測評之一,雖然采實業(yè)務(wù)場景下讀寫混合的任務(wù)形態(tài),全面測試了簡單交互式查詢,復(fù)雜交互式查詢,實時更新等第三章我國金融業(yè)圖數(shù)據(jù)庫建設(shè)現(xiàn)狀37圖數(shù)據(jù)庫操作的性能,其中復(fù)雜交互式查詢考驗了圖數(shù)據(jù)庫對多個不同查詢難點(特定通用子圖此外,信通院依據(jù)《大數(shù)據(jù)圖計算平臺技術(shù)要求與測試方法》,開展圖計算平臺產(chǎn)品基礎(chǔ)能 38金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告圖數(shù)據(jù)庫及其應(yīng)用市場正處于快速發(fā)展和迭代過程,與開閉源在性能表現(xiàn)、代碼安全、綜合運維管理成本以及成熟的服務(wù)團隊等方面都具有顯著優(yōu)勢。相對于其中,1家表示希望以“聯(lián)合研發(fā)”的方式;32家(80%)被調(diào)研機構(gòu)第四章金融業(yè)圖數(shù)據(jù)庫建設(shè)與應(yīng)用趨勢39不同于底層圖數(shù)據(jù)庫,69%的被調(diào)研機構(gòu)表達了上層圖應(yīng)用自研的傾向。圖應(yīng)用非自研的相比傳統(tǒng)關(guān)系型數(shù)據(jù)庫,圖數(shù)據(jù)庫更貼近業(yè)務(wù)應(yīng)用與業(yè)務(wù)邏輯,因為它的應(yīng)用意在高效挖掘多源異構(gòu)數(shù)據(jù)間潛藏的內(nèi)在關(guān)聯(lián)、提升以客戶為中心的洞察與運營能力,能夠降成本、控風(fēng)險、優(yōu)體驗、增效益。因而,業(yè)務(wù)發(fā)展成為圖數(shù)據(jù)庫技術(shù)應(yīng)用的主要驅(qū)動(見圖37)。41家已部署圖數(shù)據(jù)庫的金融機構(gòu)中,85.4%的機構(gòu)表示采購決策的依據(jù)是希望落地圖的創(chuàng)新應(yīng)用,58.5%的此外,隨著金融機構(gòu)數(shù)據(jù)量的急速增長以及關(guān)聯(lián)關(guān)系挖掘需求增長,傳統(tǒng)數(shù)據(jù)庫逐漸表現(xiàn)出在關(guān)聯(lián)關(guān)系處理上的性能劣勢,61.0%的被調(diào)研機構(gòu)表示采購圖數(shù)據(jù)庫是由于現(xiàn)有場景中傳統(tǒng)方 40金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告年的建設(shè)規(guī)劃進行調(diào)研,數(shù)據(jù)顯示,企業(yè)級圖數(shù)據(jù)庫平臺、企業(yè)關(guān)聯(lián)關(guān)系圖譜、實時交易反欺詐呈現(xiàn)出數(shù)據(jù)跨域融通、集中管理,更關(guān)注動態(tài)實時數(shù)據(jù)分析利用的特征,可見圖數(shù)據(jù)庫技術(shù)應(yīng)用金融機構(gòu)內(nèi)部業(yè)務(wù)系統(tǒng)多元,且業(yè)務(wù)間相對獨立,數(shù)據(jù)存在多、散、雜的特點,得不到很好的收集應(yīng)用。業(yè)務(wù)人員需要在大量不同業(yè)務(wù)系統(tǒng)中尋找、清洗、整合、分析數(shù)據(jù),技術(shù)人員需要耗費大量的人力和時間對接、運維、管理、監(jiān)控不同業(yè)務(wù)系統(tǒng)及其后臺數(shù)據(jù)庫系統(tǒng),數(shù)據(jù)應(yīng)用及79.6%的被調(diào)研機構(gòu)優(yōu)先規(guī)劃建設(shè)企業(yè)級圖數(shù)據(jù)庫平臺劃建設(shè)行級圖平臺,以圖數(shù)據(jù)庫技術(shù)作為技術(shù)底座,打通各部門核心數(shù)據(jù),實現(xiàn)統(tǒng)一管理,賦能從業(yè)務(wù)側(cè)數(shù)據(jù)應(yīng)用出發(fā),統(tǒng)一的行級圖平臺能對行內(nèi)外跨部門、跨產(chǎn)品、跨業(yè)務(wù)線中的數(shù)據(jù)從數(shù)據(jù)資產(chǎn)管理的角度,行級圖平臺既能夠避免各業(yè)務(wù)部門重復(fù)技術(shù)選型與投入、解決跨產(chǎn)從信息管理成本出發(fā),行級圖平臺能夠解決IT部門運維管理不同圖數(shù)據(jù)庫產(chǎn)品難度高、成本大,基于不同產(chǎn)品間存在的不同圖查詢語言、差異化的圖模型、不同的圖查詢計算接口做應(yīng)用第四章金融業(yè)圖數(shù)據(jù)庫建設(shè)與應(yīng)用趨勢41行級圖平臺的建設(shè)能夠高效滿足金融機構(gòu)對數(shù)據(jù)資產(chǎn)的統(tǒng)一管理,實現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系的深度挖掘和可視化呈現(xiàn),解決傳統(tǒng)金融機構(gòu)中數(shù)據(jù)利用低效、數(shù)據(jù)轉(zhuǎn)換中間過程長、實時決策 42金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告2023年金融機構(gòu)圖技術(shù)的場景應(yīng)用規(guī)劃調(diào)研結(jié)果顯示,金融機構(gòu)高度關(guān)注對公業(yè)務(wù)、零售用Graph3.0,占比65.9%。分析2023年的建設(shè)規(guī)劃,將有49家機構(gòu)應(yīng)用圖數(shù)據(jù)庫,其中,第四章金融業(yè)圖數(shù)據(jù)庫建設(shè)與應(yīng)用趨勢43 分析各類圖應(yīng)用在不同類型的金融機構(gòu)中普及率的變化(見圖42)發(fā)現(xiàn),在圖技術(shù)應(yīng)用相 44金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告對成熟的國有大行及股份制銀行中,各類圖應(yīng)用普及率略有提升。在圖應(yīng)用相對遲緩的城商行、農(nóng)信社(農(nóng)商行)、保險與證券機構(gòu)中,各類圖應(yīng)用普及率同比增長巨大,尤其是Graph3.0類在圖應(yīng)用數(shù)據(jù)規(guī)模方面,78.0%的金融機構(gòu)規(guī)劃建成TB量級圖數(shù)據(jù)庫,相較2022年的整4352986數(shù)84796357737573513358642427第四章金融業(yè)圖數(shù)據(jù)庫建設(shè)與應(yīng)用趨勢45體建設(shè)規(guī)模(58.5%機構(gòu)達到TB量級同比增長33.3%,建成TB量級圖數(shù)據(jù)庫的機構(gòu)中,在圖點邊規(guī)模方面,41.5%機構(gòu)規(guī)劃建成10億規(guī)模以上大圖,同比增長70.0%,其中,建設(shè)規(guī)模小于4節(jié)點,同比降低45.0%。34.1%的機構(gòu)計劃建設(shè)超10節(jié)點的圖數(shù)據(jù)庫集群,同在使用的服務(wù)器核數(shù)上面,48.8%的機構(gòu)預(yù)計采購128核以上大算力服務(wù)器,同比增長53.8%??梢娫诮鹑跈C構(gòu)圖應(yīng)用數(shù)據(jù)量激增的同時,對大數(shù)據(jù)的關(guān)聯(lián)查詢、分析性能也提出了更分析不同類別的金融機構(gòu)計劃投入的圖數(shù)據(jù)庫集群規(guī)模(見圖44)可見,除股份制銀行的集群規(guī)模變化不大外,其他各類已使用圖數(shù)據(jù)庫的金融機構(gòu)普遍計劃擴容。城商行普遍從2-3節(jié) 46金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告點擴容至4-10節(jié)點,60%的國有大行達到30節(jié)點以上超大集群規(guī)模,同比增長50%。保險與圖技術(shù)作為理解世界的新方式,正憑借其對復(fù)雜關(guān)聯(lián)關(guān)系的強大刻畫能力贏得更多金融機構(gòu)隨著數(shù)字經(jīng)濟的高速發(fā)展,數(shù)字金融的大規(guī)模普及,金融機構(gòu)的數(shù)字化轉(zhuǎn)型加速,圖數(shù)據(jù)庫的應(yīng)用逐漸從靜態(tài)的關(guān)系數(shù)據(jù)擴展到動態(tài)交易、申請、行為、事件數(shù)據(jù),同時存儲、分析和計算一方面,金融機構(gòu)內(nèi)部積累的數(shù)據(jù)量呈井噴式增長,圖規(guī)模亦快速增長。對已經(jīng)使用圖數(shù)據(jù)庫的41家金融機構(gòu)調(diào)研,結(jié)果顯示,2023年80%以上的被調(diào)研機構(gòu)圖規(guī)模將超1億點邊,近另一方面,金融機構(gòu)的業(yè)務(wù)日趨爭分奪秒,無論是反洗錢、反欺詐,還是交叉營銷和消費升第四章金融業(yè)圖數(shù)據(jù)庫建設(shè)與應(yīng)用趨勢47級,都期待突破T+1的桎梏,實現(xiàn)實時響應(yīng)。以Graph3.0的需要對IT基礎(chǔ)設(shè)施和應(yīng)用程序的自動化監(jiān)控和實時管理,以務(wù)系統(tǒng)和應(yīng)用程序的高可用性、可靠性和安全性,從而保障客戶的服務(wù)體驗。調(diào)研結(jié)果顯示(見 48金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告絡(luò)安全、實時交易反欺詐、信用卡申請反欺詐、智能運維等高實時性場景。其中,以實時交易反然推動商用圖數(shù)據(jù)庫向著承載數(shù)據(jù)更多、查詢計算速度更快、算法支持更豐富等維度演進,可預(yù)隨著金融業(yè)務(wù)日益復(fù)雜,金融機構(gòu)面臨著提高業(yè)務(wù)決策的準(zhǔn)確性和可解釋性挑戰(zhàn),傳統(tǒng)機器學(xué)習(xí)模型缺乏決策依據(jù)的透明度和解釋力。大量實際應(yīng)用場景中的數(shù)據(jù)從非歐式空間生成,傳統(tǒng)為解決以上問題,圖數(shù)據(jù)庫與人工智能相結(jié)合成為具有潛力的解決方案。圖數(shù)據(jù)庫能夠提供高效和靈活的方法存儲和管理圖數(shù)據(jù),并提供豐富的查詢和分析功能,以便于人工智能應(yīng)用程序從中獲取有用的信息和知識用于訓(xùn)練模型、推斷過程和預(yù)測結(jié)果,提升系統(tǒng)的實時性和準(zhǔn)確性,▲圖47金融機構(gòu)對圖數(shù)據(jù)庫與人工第四章金融業(yè)圖數(shù)據(jù)庫建設(shè)與應(yīng)用趨勢49圖數(shù)據(jù)庫和知識圖譜是兩個相關(guān)但不同的概念:圖數(shù)據(jù)庫是一種存儲圖數(shù)據(jù)的技術(shù),知識圖譜則是用實體、關(guān)系、屬性表示和組織信息的方法。知識圖譜能夠從應(yīng)用層將客戶行為、關(guān)系等建立關(guān)聯(lián)分析,結(jié)合豐富的可視化能直觀地呈現(xiàn)出數(shù)據(jù)背后所隱含的推理邏輯、提供決策依據(jù)。利用知識圖譜增強的搜索引擎等。兩者的結(jié)合,讓金融機構(gòu)能夠從技術(shù)層到應(yīng)用層形成完整的解圖神經(jīng)網(wǎng)絡(luò)是指使用神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)圖結(jié)構(gòu)數(shù)據(jù),提取和發(fā)掘圖結(jié)構(gòu)數(shù)據(jù)中的特征和模式,滿足聚類、分類、預(yù)測、分割等圖學(xué)習(xí)任務(wù)需求的算法總稱。它將人類已有的認(rèn)知以圖的形式建模并與計算機建立的神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,有助于解決傳統(tǒng)機器學(xué)習(xí)算法存在的可解釋性低下、隨著圖數(shù)據(jù)應(yīng)用越來越普遍,其蘊含的信息越來越豐富,圖神經(jīng)網(wǎng)絡(luò)的應(yīng)用場景也會越來越廣泛。圖神經(jīng)網(wǎng)絡(luò)和圖數(shù)據(jù)庫的結(jié)合,能夠?qū)⑸疃葘W(xué)習(xí)的預(yù)測能力應(yīng)用于豐富的圖數(shù)據(jù)結(jié)構(gòu)上,幫助金融機構(gòu)對數(shù)據(jù)進行全量推理,訓(xùn)練預(yù)測模型,從圖中挖掘出全新的可解釋的邏輯,獲取正向業(yè)務(wù)知識反饋。以金融風(fēng)控場景為例,基于圖神經(jīng)網(wǎng)絡(luò)和圖數(shù)據(jù)庫技術(shù)的結(jié)合,金融機構(gòu)能夠目前,部分圖平臺產(chǎn)品已經(jīng)實現(xiàn)了對機器學(xué)習(xí)相關(guān)功能的支持與擴展,除常規(guī)也開始支持與第三方機器學(xué)習(xí)平臺的對接,通過將圖挖掘與機器學(xué)習(xí)算法相結(jié)合,提高模型的準(zhǔn)確率與可解釋性。但圖機器學(xué)習(xí)領(lǐng)域尚在發(fā)展早期,仍存在內(nèi)存、硬件等多方面瓶頸,未來在大隨分析”,從響應(yīng)式風(fēng)險管控變成干預(yù)式風(fēng)險防控,從標(biāo)準(zhǔn)金融產(chǎn)品的推送變成以客戶為中心的時序數(shù)據(jù)是指一段時間內(nèi)采集的,按時間順序排列的數(shù)據(jù),最大特點 50金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告金融場景中,存在大量的時序數(shù)據(jù),交易轉(zhuǎn)賬、產(chǎn)品購買、客戶訪問、價格波動等,都具備很強的時間特性。對這些數(shù)據(jù)的高效監(jiān)控、分析能夠支撐金融機構(gòu)更實時、準(zhǔn)確的業(yè)務(wù)決策、提升風(fēng)利用時序數(shù)據(jù)構(gòu)建金融時序信息圖譜(交易圖譜、申請圖譜、運維圖譜等直觀發(fā)現(xiàn)風(fēng)控、營銷、智能運維等業(yè)務(wù)實踐及IT管理過程中的動態(tài)關(guān)系及屬性特征變化,對未知能支持。這也進一步體現(xiàn)了圖應(yīng)用正逐步邁向基于行為、事件的實時分析的Graph3.0時代(見不同類型機構(gòu)對時序分析的態(tài)度也體現(xiàn)出一定的不同。國有大行對于時序分析的需求最為強第四章金融業(yè)圖數(shù)據(jù)庫建設(shè)與應(yīng)用趨勢51▲圖49不同類型金融機構(gòu)對圖數(shù)據(jù)庫時序分析 52金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告我國的金融業(yè)務(wù)體量和服務(wù)場景的復(fù)雜度,均處于世界前列。隨著新興技術(shù)更深度地參與到金融交易、風(fēng)險決策等活動中,金融風(fēng)險的復(fù)雜性、傳染性、交叉性進一步加劇。在當(dāng)前多重因?qū)τ诮鹑谛袠I(yè)而言,基礎(chǔ)設(shè)施決定了業(yè)務(wù)場景的安全可控、高效智能。因此,金融機構(gòu)積極響應(yīng)國家自主創(chuàng)新的號召,加速提升各類軟硬件的自主可控能力,打造底層架構(gòu),提升底層設(shè)施未來,金融機構(gòu)在進行圖數(shù)據(jù)庫選型時會更加關(guān)注圖數(shù)據(jù)庫的自主可控能力,并且關(guān)注其和當(dāng)前,國有大型商業(yè)銀行開始應(yīng)用圖技術(shù)賦能行內(nèi)業(yè)圖數(shù)據(jù)庫的安全性與技術(shù)自主性(見圖5075.0%的機構(gòu)要求必須為自主可控的圖數(shù)據(jù)庫,圖技術(shù)應(yīng)用市場的繁榮發(fā)展離不開人才儲備。圖數(shù)據(jù)庫領(lǐng)域人才的稀缺已經(jīng)成為金融機構(gòu)面臨的共性問題。78.5%的被調(diào)研機構(gòu)表示缺乏相關(guān)專業(yè)人才更好地使用圖數(shù)據(jù)庫,業(yè)務(wù)部門對相對業(yè)務(wù)部門而言,擁有成熟專業(yè)的咨詢團隊,能夠提供包括方案評估、設(shè)計、交付、測試工作過程等在內(nèi)的規(guī)劃服務(wù),是圖數(shù)據(jù)庫廠商產(chǎn)品高效落地的關(guān)鍵競爭力。圖數(shù)據(jù)庫廠商在不斷優(yōu)化產(chǎn)品能力,提升產(chǎn)品性能外,需要重視圖技術(shù)應(yīng)用綜合人才的招聘與培養(yǎng),加強與下游圖解決方案商的生態(tài)合作,降低金融機構(gòu)應(yīng)用、發(fā)掘圖數(shù)據(jù)庫價值的門檻和成本,打通圖數(shù)據(jù)庫第五章圖數(shù)據(jù)庫未來發(fā)展建議53被調(diào)研機構(gòu)表示期待有更多機會獲得圖數(shù)據(jù)庫廠商的技術(shù)指導(dǎo),其中,獲得圖數(shù)據(jù)庫場景應(yīng)因此,圖數(shù)據(jù)庫行業(yè)中的各廠商,可以通過開設(shè)圖數(shù)據(jù)庫基礎(chǔ)理論知識和實踐案例分析的培訓(xùn)課程、打造圖數(shù)據(jù)庫實戰(zhàn)項目實踐平臺以及定期舉辦圖數(shù)據(jù)庫技術(shù)交流活動等宣傳動作,加強圖數(shù)據(jù)庫業(yè)務(wù)應(yīng)用和技術(shù)開發(fā)人才的培養(yǎng)力度;并且面向金融機構(gòu)打造系統(tǒng)化的圖數(shù)據(jù)庫知識培訓(xùn)體系,利用系列培訓(xùn)課程和測評考試等方法,培養(yǎng)更多懂得金融業(yè)務(wù)的實戰(zhàn)型、咨詢型人才,隨著金融機構(gòu)圖應(yīng)用規(guī)模的逐步增大、圖應(yīng)用場景逐步邁向Graph3.0階段,需求從離線/準(zhǔn)實時計算到實時計算,金融機構(gòu)對圖數(shù)據(jù)庫廠商的動態(tài)大規(guī)模圖數(shù)據(jù)處理能力提出了更高的要系統(tǒng)內(nèi)部通訊機制是黑盒,無法做執(zhí)行過程優(yōu)化,不僅查詢、計算效率低,更重要的是數(shù)據(jù)從存儲系統(tǒng)傳輸?shù)接嬎阆到y(tǒng)、計算結(jié)果持久化回存儲系統(tǒng)的時間較長,無法完成對實時寫入的大數(shù)據(jù) 54金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告能夠根據(jù)圖數(shù)據(jù)特征或動態(tài)或靜態(tài)地進行分片管理,優(yōu)化數(shù)據(jù)跨節(jié)點分布情況;并且依據(jù)底層數(shù)據(jù)存儲的情況,高效實現(xiàn)各種分布式計算任務(wù)的調(diào)度和分發(fā)策略,降低跨節(jié)點數(shù)據(jù)網(wǎng)絡(luò)傳輸與通信成本,實現(xiàn)存儲計算協(xié)同,提升整體圖查詢、計算的性能。它在滿足水平擴展的前提下,提升了查詢與分析效率,能更好地支持金融機構(gòu)海量行為、事件數(shù)據(jù)構(gòu)成的超大規(guī)模業(yè)務(wù)圖譜的高效第六章金融業(yè)圖數(shù)據(jù)庫實踐案例55 現(xiàn)如今,數(shù)據(jù)分析越來越復(fù)雜、模式更改越來越頻繁,銀行業(yè)內(nèi)多重關(guān)聯(lián)分析、知識圖譜建設(shè)、數(shù)據(jù)價值深度挖掘等需求越來越旺盛。傳統(tǒng)關(guān)系型數(shù)據(jù)庫已無法完全滿足關(guān)聯(lián)數(shù)據(jù)分析處理的挑戰(zhàn)。圖數(shù)據(jù)庫通過圖結(jié)構(gòu)組織數(shù)據(jù),克服了其他數(shù)據(jù)庫難以支撐的深度關(guān)聯(lián)數(shù)據(jù)分析痛點,為構(gòu)建銀行知識圖譜,實現(xiàn)深度業(yè)務(wù)知識和價值挖掘提供重要科技保障和技術(shù)指引。為此,農(nóng)業(yè)銀行圖數(shù)據(jù)庫技術(shù)引入工作于2018年正式啟動,經(jīng)過幾年來的研發(fā)實踐,圖數(shù)據(jù)庫技術(shù)在農(nóng)行信貸監(jiān)測、反洗錢、風(fēng)險控制、系統(tǒng)運維等領(lǐng)域均落地了較為成熟的應(yīng)用場景,充分利用圖數(shù)據(jù)如圖所示,作為行內(nèi)圖數(shù)據(jù)庫技術(shù)應(yīng)用的前沿,農(nóng)行圖計算平臺最初設(shè)計并建立了圖查詢、提供實時和批量圖計算服務(wù)、可視化及其他輔助工具,支撐各類圖計算應(yīng)用。建設(shè)伊始,同業(yè)之中尚無先例可循,對于如何建設(shè)一個能夠為全行提供圖計算服務(wù)的綜合服務(wù)平臺,圖計算平臺總從發(fā)展策略上,圖計算平臺底層圖數(shù)據(jù)庫使用堅持商業(yè)開源雙線并舉。自2019年開始,農(nóng)行基于開源圖數(shù)據(jù)庫,探索搭建圖計算平臺,支撐全行應(yīng)用系統(tǒng)深度關(guān)聯(lián)數(shù)據(jù)分析處理,為農(nóng)行 56金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告從能力建設(shè)上,圖計算平臺采用前后端分離架構(gòu),對外提供聯(lián)機接口、輔助開發(fā)建模工具,支持各系統(tǒng)實時查詢、更新圖數(shù)據(jù),實現(xiàn)對外服務(wù)能力;采用“關(guān)系型數(shù)據(jù)庫+圖數(shù)據(jù)庫”混合存儲架構(gòu),管理型數(shù)據(jù)使用關(guān)系型數(shù)據(jù)庫進行存儲,應(yīng)用分析類數(shù)據(jù)使用圖數(shù)據(jù)庫進行存儲,同時發(fā)揮兩個數(shù)據(jù)庫在不同功能上的優(yōu)勢,自行設(shè)計主備機高可用架構(gòu),保障系統(tǒng)高可用能力;利用圖數(shù)據(jù)標(biāo)簽建立了基于子圖的用戶權(quán)限體系,實現(xiàn)對各上層應(yīng)用數(shù)據(jù)權(quán)限管控和數(shù)據(jù)隔離,實現(xiàn)一定安全管控能力;采用分層設(shè)計,制定了圖應(yīng)用數(shù)據(jù)交互接口標(biāo)準(zhǔn),屏蔽底層圖數(shù)據(jù)庫語言為更加深入應(yīng)用圖數(shù)據(jù)庫技術(shù),使之能夠在行內(nèi)大規(guī)模推廣在圖計算平臺不斷完善的過程中,農(nóng)行聯(lián)合廠商制訂了圖數(shù)據(jù)庫在行內(nèi)的技術(shù)規(guī)范,只有這樣,圖數(shù)據(jù)庫才能夠具備在行內(nèi)大規(guī)模推廣使用的條件。例如,在安裝部署規(guī)范中,不同等級系第六章金融業(yè)圖數(shù)據(jù)庫實踐案例57否則系統(tǒng)無法知道應(yīng)該使用什么樣的架構(gòu);又例如,安裝部署規(guī)范還需要明確圖數(shù)據(jù)庫的容量模型,以便應(yīng)用可以根據(jù)自身情況申請圖數(shù)據(jù)庫資源。此外,還有健康檢查、系統(tǒng)監(jiān)控、應(yīng)急處理圖數(shù)據(jù)庫在大型企業(yè)的應(yīng)用標(biāo)準(zhǔn)仍然是較為空白的一個領(lǐng)域,農(nóng)行根據(jù)自身實踐經(jīng)驗,正在牽頭隨著應(yīng)用圖數(shù)據(jù)庫技術(shù)的系統(tǒng)越來越多,圖數(shù)據(jù)庫的運行保障不再是對簡單的單一實例的維護。圖計算平臺為了應(yīng)對多集群、多用戶、多場景的運維挑戰(zhàn),新增了圖項目管理、集群管理、集群監(jiān)控、資源管理等一系列運維保障功能,提出基于圖項目的租戶模式,調(diào)整圖計算平臺服務(wù)場景支撐方面,通過對底層圖數(shù)據(jù)庫的不斷升級優(yōu)化,采用原生分布式并行圖存儲,支持千萬級鄰居秒級查詢;利用分布式架構(gòu),支持動態(tài)在線擴容,高效支持大規(guī)模數(shù)據(jù)量存儲,圖計算平臺提供服務(wù)以來,數(shù)據(jù)規(guī)模已從開始試點時的百萬級點邊數(shù)據(jù)擴展到十億級點、百億級邊的在圖計算平臺的支持下,農(nóng)行圖數(shù)據(jù)庫應(yīng)用穩(wěn)步前行、逐漸深入。信貸風(fēng)控、智能營銷、內(nèi)間關(guān)聯(lián)關(guān)系進行深入分析,并在單一企業(yè)風(fēng)險分析維度的基礎(chǔ)上從集團整體的角度進一步分析集團整體的風(fēng)險。圖數(shù)據(jù)庫技術(shù)優(yōu)異的關(guān)聯(lián)數(shù)據(jù)深度分析能力能夠幫助業(yè)務(wù)人員在這一傳統(tǒng)業(yè)務(wù)中獲得新的技術(shù)支撐?!凹瘓F客戶風(fēng)險監(jiān)測”作為行內(nèi)精準(zhǔn)識別十大應(yīng)用之一,基于圖數(shù)據(jù)庫技術(shù)建立了集團客戶關(guān)聯(lián)關(guān)系分析和風(fēng)險分析兩類模型,實現(xiàn)對股東關(guān)系的10層股權(quán)穿透,挖掘隱性集團、擔(dān)保圈、資金圈等隱性關(guān)系,兩模型總體準(zhǔn)確率分別達到82.94%、81.99%,精準(zhǔn)定位2.智能客戶精準(zhǔn)營銷?;趥鹘y(tǒng)關(guān)系型數(shù)據(jù)庫的客戶、產(chǎn)品的深度關(guān)系難以挖掘上制約了對客戶的精準(zhǔn)營銷。農(nóng)行利用圖數(shù)據(jù)庫技術(shù),將存量客戶、目標(biāo)客戶以及資金鏈、關(guān)鍵人等關(guān)聯(lián)關(guān)系的分析變?yōu)楝F(xiàn)實。根據(jù)分析結(jié)果,構(gòu)建客戶畫像,從中挖掘行內(nèi)外高價值客戶,為 58金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告業(yè)務(wù)人員提供潛在目標(biāo)客戶名單,助力營銷能力提升,進一步解決了客戶在哪、存款在哪、業(yè)務(wù)在哪的問題。提升優(yōu)質(zhì)重點客戶的信息獲取能力,有利于及時、有效地開展精準(zhǔn)營銷,提高行外3.內(nèi)部審計交易圖譜檢索。在銀行業(yè),內(nèi)部審計監(jiān)督工作是保障和促進資產(chǎn)保值一環(huán),審計人員約一半以上的審計查證模型是基于交易流水?dāng)?shù)據(jù)展開的,然而通過開發(fā)效率低下等痛點。農(nóng)行利用圖數(shù)據(jù)庫技術(shù),在內(nèi)部審計管理監(jiān)測系統(tǒng)搭建了基于圖的交易圖4.應(yīng)用系統(tǒng)關(guān)聯(lián)關(guān)系分析。對于農(nóng)行這樣一個巨大規(guī)模的企業(yè),擁有成百上千套IT系統(tǒng)需要運維管理,這些系統(tǒng)之間往往不是孤立存在的,而是有著錯綜復(fù)雜的依賴關(guān)系。如果一個模塊出現(xiàn)故障,則可能影響一個或多個下游系統(tǒng)的運行。圖計算平臺利用圖數(shù)據(jù)庫,清晰地描述這些關(guān)系,當(dāng)一個系統(tǒng)模塊發(fā)生故障時,能夠快速地分析出可能受到影響的下游系統(tǒng),應(yīng)用系統(tǒng)關(guān)聯(lián)5.知識圖譜?;趫D數(shù)據(jù)庫,農(nóng)行構(gòu)建了知識圖譜引擎,旨在持續(xù)積累全行領(lǐng)域級圖譜資產(chǎn),覆蓋自然、信貸、金融資產(chǎn)等多個維度,累計建設(shè)全行個人、法人、產(chǎn)品、文章知識等數(shù)十類關(guān)系圖譜。通過知識圖譜構(gòu)建、挖掘和積累,結(jié)合領(lǐng)域?qū)<抑R,提升已有模型準(zhǔn)確性和發(fā)掘新的業(yè)務(wù)規(guī)則。例如,依托知識圖譜引擎進行反洗錢可疑客戶識別,應(yīng)用系統(tǒng)基于3個月交易流第六章金融業(yè)圖數(shù)據(jù)庫實踐案例59根據(jù)行業(yè)發(fā)展趨勢,當(dāng)前金融企業(yè)在對客戶、產(chǎn)品及行業(yè)進行分析時,往往不能僅靠單一的規(guī)則及因素,需結(jié)合多方面、多層級、多維度的關(guān)聯(lián)關(guān)系,進行綜合分析和深度挖掘。近年來,知識圖譜技術(shù)發(fā)展迅速,其主要特點為:將客戶等各種信息建立立體的關(guān)系圖(包括集團關(guān)系、股權(quán)關(guān)系、投資人關(guān)系、交易關(guān)系、擔(dān)保關(guān)系、訴訟關(guān)系、事件關(guān)系等),再以圖分析和圖計算一是數(shù)據(jù)復(fù)用難。過去,一般采用從特定需求出發(fā)構(gòu)建圖譜及其應(yīng)用的建設(shè)模式,這種“煙二是應(yīng)用門檻高。圖譜分析需要掌握圖查詢語言、圖計算框架以及各類圖算法,對非技術(shù)人三是開發(fā)環(huán)節(jié)多。圖譜建設(shè)涉及到數(shù)據(jù)收集、數(shù)據(jù)清洗、數(shù)據(jù)處理、圖譜構(gòu)建、圖譜應(yīng)用等為解決這些痛點問題,交通銀行基于微服務(wù)架構(gòu)和自研的微服務(wù)治理平臺建設(shè)全棧式知識圖在圖譜構(gòu)建層,交通銀行自主研發(fā)圖譜生產(chǎn)工作流引擎,提供基于可視化界面的圖譜生產(chǎn)工在圖譜管理層,通過本體庫、實體集市、關(guān)系集市、資產(chǎn)目錄、圖譜發(fā)布等管理功能,為圖 60金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告圖交通銀行全棧式知識圖譜平臺邏輯架構(gòu)圖基于全棧式知識圖譜平臺形成“圖譜構(gòu)建-圖譜管理-圖譜應(yīng)用”的完整生態(tài)閉環(huán),實現(xiàn)知識圖譜從簡單使用到生態(tài)打造的躍遷,有效縮短圖譜構(gòu)建周期,對于及時響應(yīng)市場需求,提升金交通銀行借助知識圖譜技術(shù),深度挖掘關(guān)聯(lián)關(guān)系,并與機器學(xué)習(xí)結(jié)合,在風(fēng)控、營銷等領(lǐng)域先后為風(fēng)險監(jiān)測、反洗錢、反欺詐、貸后資金監(jiān)管、聯(lián)動拓客、產(chǎn)業(yè)鏈拓客等場景建設(shè)一批智慧在風(fēng)控領(lǐng)域,交通銀行致力于建立“全集團、全覆蓋、全流程”的智能化風(fēng)險監(jiān)測體系,充分考慮企業(yè)風(fēng)險事件的關(guān)聯(lián)性、傳播性等特點,構(gòu)建出以關(guān)聯(lián)關(guān)系為基礎(chǔ)的風(fēng)險預(yù)警模型,將風(fēng)有效防范系統(tǒng)性風(fēng)險、區(qū)域性風(fēng)險和重大個案風(fēng)險。一是識別集團客戶管理漏出,掌握集團客戶在交通銀行的全口徑融資情況。目前集團管理漏出預(yù)警已經(jīng)嵌入交通銀行授信發(fā)起流程,并在風(fēng)第六章金融業(yè)圖數(shù)據(jù)庫實踐案例61險監(jiān)測中實時提示,有效改善分行集團授信管理中應(yīng)建未建和應(yīng)納未納問題。二是探查企業(yè)隱性關(guān)聯(lián)關(guān)系,提高客戶洞察能力。針對交通銀行全集團授信業(yè)務(wù)有貸戶組合進行預(yù)測,挖掘出確實集團授信管理、貸后風(fēng)險預(yù)警、不良處置等決策提供有力參考。三是完善擔(dān)保網(wǎng)絡(luò)風(fēng)險監(jiān)測,識別和防范擔(dān)保鏈圈造成的區(qū)域性風(fēng)險。完成對全行授信客戶擔(dān)保聯(lián)通體的風(fēng)險排查,將之前未納輔助業(yè)務(wù)人員從宏觀產(chǎn)業(yè)發(fā)展及微觀企業(yè)多個視角全面評價企業(yè)。二是利用圖分析能力支持聯(lián)動三是通過建立產(chǎn)品匹配模型,為不同市場地位、不同經(jīng)營狀態(tài)的企業(yè)匹配特定的金融產(chǎn)品,支撐 62金融業(yè)圖數(shù)據(jù)庫建設(shè)發(fā)展調(diào)研報告知識圖譜作為前沿創(chuàng)新技術(shù),可以融合銀行內(nèi)部和外部數(shù)據(jù),從原始數(shù)據(jù)中深度挖掘各類實體之間的關(guān)聯(lián)關(guān)系,進而識別企業(yè)風(fēng)險、異常擔(dān)保、疑似實控人等情況,為銀行的風(fēng)險防控、營模式的“萬象”知識圖譜體系。以分布式圖數(shù)據(jù)庫與圖計算框架為核心,構(gòu)建了支持知識工程全流程處理的一站式知識圖譜平臺;實現(xiàn)了面向分析和面向交易兩類圖譜能力,分別用于關(guān)聯(lián)挖掘圖算法以及知識構(gòu)建工作流等相關(guān)組件,構(gòu)建了“萬象”知識圖譜平臺,提供了知識圖譜建模、圖數(shù)據(jù)庫進行存儲,并實現(xiàn)了生產(chǎn)多模態(tài)集群,分別服務(wù)于分析場景和交易場景;用于查詢加速的索引數(shù)據(jù)以及關(guān)系詳情等數(shù)據(jù),使用ES或H數(shù)據(jù)庫以及SparkGraphX等計算框架的支持,提供對常規(guī)的圖遍歷、中心性、社區(qū)算法,以及2.圖譜工程層。為降低研發(fā)門檻,平臺提供了界面化的工程能力。針對圖譜研發(fā)的供了各類組件,能夠支持各類大數(shù)據(jù)平臺的數(shù)據(jù)整合和知識抽取,實現(xiàn)可見即所得的本體設(shè)計,并能夠通過“拖拉拽”的挖掘流程構(gòu)建復(fù)雜圖譜,以及基于模型算子進行關(guān)系挖掘,形成的數(shù)據(jù)第六章金融業(yè)圖數(shù)據(jù)庫實踐案例633.圖譜服務(wù)層。為同時滿足面向分析和面模塊和圖譜服務(wù)引擎模塊。其中圖譜分析模塊主要面向數(shù)據(jù)分析師和業(yè)務(wù)分析人員,提供交互式并可以對分析結(jié)果進行快照導(dǎo)出或者文件下發(fā)進行進一步使用。而圖譜服務(wù)引擎模塊則將圖譜數(shù)據(jù)或者圖計算能力封裝形成API,對接業(yè)務(wù)系統(tǒng)形成實時在線服務(wù)。針對已建設(shè)好的實體、關(guān)系或者圖數(shù)據(jù),以服務(wù)對接或者嵌入式圖譜等方式供業(yè)務(wù)系統(tǒng)使用。而針對交易決策場景,可以提供實時組網(wǎng)類或網(wǎng)絡(luò)特征計算類服務(wù),接受交易請求數(shù)據(jù)進行同步網(wǎng)絡(luò)構(gòu)建,根據(jù)策略計算各類4.業(yè)務(wù)產(chǎn)品層。將圖譜的各項數(shù)據(jù)、服務(wù)和能力封裝后,可以形成獨對標(biāo)互聯(lián)網(wǎng)企業(yè)圖譜產(chǎn)品的行內(nèi)金融圖譜,覆蓋了全國工商企業(yè)的檔案和各類關(guān)系,并與行內(nèi)客民生銀行持續(xù)夯實圖譜內(nèi)容與落地業(yè)務(wù)場景,以廣泛支持各業(yè)務(wù)的數(shù)字化轉(zhuǎn)型工作。在數(shù)據(jù)擔(dān)保、申請、設(shè)備等數(shù)據(jù)進行拉通聚合,形成了企業(yè)圖譜、信貸風(fēng)險圖譜、集團圖譜、資金交易使得客戶風(fēng)險表現(xiàn)形式更加多元化,信息不對稱進一步加劇,風(fēng)險管理難度持續(xù)加大。為了應(yīng)對復(fù)雜的經(jīng)濟形勢,加強數(shù)字化風(fēng)控能力,民生銀行擴大觀察視角,從客戶整體關(guān)系網(wǎng)絡(luò)角度評判風(fēng)險。同時在營銷場景中,傳統(tǒng)的營銷方式已無法滿足快速變化的市場要求,民生銀行順應(yīng)科技民生銀行首先實現(xiàn)行內(nèi)客戶信息、風(fēng)險相關(guān)數(shù)據(jù)和行然人、集團三類實體,和擔(dān)保、抵質(zhì)押、股權(quán)、法定代表人、額度使用等幾十種基礎(chǔ)關(guān)系,并通過圖算法深度挖掘擔(dān)保圈、擔(dān)保鏈、互保、集中性擔(dān)保、間接持股等隱形關(guān)聯(lián)關(guān)系,進而構(gòu)建企業(yè)全息圖譜,共計近百億數(shù)據(jù);并對復(fù)雜的關(guān)系圖譜網(wǎng)絡(luò)進行可視化建設(shè),根據(jù)不同關(guān)系類型提供不同可視化方案,做到企業(yè)客戶“一眼清”,為風(fēng)險管理全流程中各類業(yè)務(wù)人員、管理人員以同時企業(yè)圖譜也應(yīng)用于營銷獲客場景中,實現(xiàn)基于客戶關(guān)系網(wǎng)絡(luò)的營銷線 64

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論