![大模型金融應(yīng)用實踐及發(fā)展建議 2023_第1頁](http://file4.renrendoc.com/view12/M0A/14/0E/wKhkGWda0O2AeSqKAAKjfXkH_tg295.jpg)
![大模型金融應(yīng)用實踐及發(fā)展建議 2023_第2頁](http://file4.renrendoc.com/view12/M0A/14/0E/wKhkGWda0O2AeSqKAAKjfXkH_tg2952.jpg)
![大模型金融應(yīng)用實踐及發(fā)展建議 2023_第3頁](http://file4.renrendoc.com/view12/M0A/14/0E/wKhkGWda0O2AeSqKAAKjfXkH_tg2953.jpg)
![大模型金融應(yīng)用實踐及發(fā)展建議 2023_第4頁](http://file4.renrendoc.com/view12/M0A/14/0E/wKhkGWda0O2AeSqKAAKjfXkH_tg2954.jpg)
![大模型金融應(yīng)用實踐及發(fā)展建議 2023_第5頁](http://file4.renrendoc.com/view12/M0A/14/0E/wKhkGWda0O2AeSqKAAKjfXkH_tg2955.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
目錄
一、概述.............................................................1
二、大模型技術(shù)與產(chǎn)品發(fā)展現(xiàn)狀........................................2
(一)工程化應(yīng)用主要環(huán)節(jié)與技術(shù)..................................2
(二)國內(nèi)外主要產(chǎn)品情況.........................................9
三、大模型在金融業(yè)應(yīng)用與探索實踐...................................10
(一)技術(shù)路線..................................................10
(二)使用方式..................................................14
(三)應(yīng)用場景..................................................17
(四)應(yīng)用趨勢..................................................29
四、大模型在金融業(yè)應(yīng)用面臨的風(fēng)險與挑戰(zhàn)............................30
(一)金融應(yīng)用規(guī)范與指南亟需完善...............................30
(二)金融應(yīng)用場景缺少范式......................................31
(三)高質(zhì)量金融訓(xùn)練數(shù)據(jù)欠缺...................................32
(四)訓(xùn)練算力支撐普遍不足......................................32
(五)算法可信度和安全性有待提升...............................33
五、多措并舉提升大模型金融業(yè)應(yīng)用水平...............................34
(一)加強金融應(yīng)用的指導(dǎo)與管理.................................34
(二)有序推動金融應(yīng)用場景落地.................................34
(三)積極構(gòu)建高質(zhì)量金融數(shù)據(jù)集.................................35
(四)產(chǎn)用協(xié)同共筑AI算力基礎(chǔ)設(shè)施...............................35
(五)完善算法優(yōu)化與風(fēng)險管控體系...............................36
附錄................................................................38
案例一:郵儲銀行基于大模型的智能知識問答........................38
案例二:某股份制銀行基于騰訊云TI-OCR大模型單據(jù)處理............41
案例三:某股份制銀行基于騰訊云金融大模型的智能客服.............45
案例四:某股份制銀行基于中科可控的金融大模型服務(wù)平臺...........48
案例五:北京銀行AIB金融智能應(yīng)用平臺............................52
案例六:上海銀行基于開源大模型的智能辦公助手...................55
案例七:國信證券輔助運營人員服務(wù)客戶場景.......................57
案例八:螞蟻金融大模型應(yīng)用-支小寶2.().....................................................59
一、概述
近年來,以人工智能為代表的新一代信息技術(shù)加速應(yīng)用,特
別是基于大模型、大數(shù)據(jù)、大算力的ChatGPT的發(fā)布,標(biāo)志著人
工智能技術(shù)取得里程碑式突破,推動科技創(chuàng)新進入新階段。隨著
大模型技術(shù)的迅猛發(fā)展和場景價值的不斷涌現(xiàn),該技術(shù)或?qū)⒅厮?/p>
多個行業(yè)的工作方式和格局。
為穩(wěn)步推動生成式人工智能在各行各業(yè)的有序應(yīng)用,我國陸
續(xù)出臺一系列政策法規(guī)和管理辦法,《國務(wù)院2023年度立法工
作計劃》將人工智能法納入了國家立法計劃,《生成式人工智能
服務(wù)管理暫行辦法》提出了促進生成式人工智能技術(shù)發(fā)展的具體
措施,《網(wǎng)絡(luò)安全標(biāo)準(zhǔn)實踐指南——生成式人工智能服務(wù)內(nèi)容標(biāo)
識方法》指導(dǎo)生成式人工智能服務(wù)提供者等有關(guān)單位做好內(nèi)容標(biāo)
識工作,《生成式人工智能服務(wù)安全基本要求》(征求意見稿)
給出了生成式人工智能服務(wù)在語料安全、模型安全、安全措施、
安全評估等方面的基本要求,《全球人工智能治理倡議》主張建
立人工智能風(fēng)險等級測試評估體系,不斷提升人工智能技術(shù)的安
全性、可靠性、可控性、公平性。
金融業(yè)是數(shù)字化、智能化的先行者,有望成為大模型技術(shù)落
地的最佳領(lǐng)域之一?!督鹑诳萍及l(fā)展規(guī)劃(2022-2025年)》明
確提出要抓住全球人工智能發(fā)展新機遇,以人為本全面推進智能
技術(shù)在金融領(lǐng)域深化應(yīng)用,強化科技倫理治理,著力打造場景感
1
知、人機協(xié)同、跨界融合的智慧金融新業(yè)態(tài)。金融機構(gòu)正在積極
探索大模型在智能客服、智能辦公、智能研發(fā)等業(yè)務(wù)場景的應(yīng)用,
提升智能技術(shù)的可獲得性,助力金融服務(wù)降本增效。
二、大模劈支術(shù)與產(chǎn)品發(fā)展現(xiàn)狀
(-)工程化應(yīng)用主要環(huán)節(jié)與技術(shù)
大模型相較于中小模型,具有更好的表示能力、泛化能力、
學(xué)習(xí)能力和語義表達能力,但其參數(shù)量巨大、訓(xùn)練所需數(shù)據(jù)量和
算力資源多、部署運營更為復(fù)雜,工程化落地涉及數(shù)據(jù)構(gòu)建、模
型算法、模型訓(xùn)練、模型壓縮與加速、模型評測、模型運營和安
全可信等多個復(fù)雜環(huán)節(jié)。
1.數(shù)據(jù)構(gòu)建
訓(xùn)練大模型需要海量數(shù)據(jù)做支撐,高質(zhì)量數(shù)據(jù)集的構(gòu)建和處
理對于大模型的性能表現(xiàn)至關(guān)重要。訓(xùn)練數(shù)據(jù)集一般需要涵蓋多
種類型、多種領(lǐng)域的數(shù)據(jù)來源,并配以相應(yīng)的數(shù)據(jù)預(yù)處理過程。
根據(jù)數(shù)據(jù)來源不同,大模型的訓(xùn)練數(shù)據(jù)主要可分為公開數(shù)據(jù)、商
業(yè)數(shù)據(jù)和私有數(shù)據(jù)。大模型參數(shù)量需耍跟訓(xùn)練數(shù)據(jù)集大小相匹配,
簡單堆砌參數(shù)量并不能無限度地提升其性能。通過提升訓(xùn)練數(shù)據(jù)
集質(zhì)量和內(nèi)容豐富度、加入一些特定數(shù)據(jù)集、合理利用外掛知識
庫資源、合理配置各種類型數(shù)據(jù)配比等方式,可以有效提升大模
型的整體性能,減少模型幻覺,并加快模型的收斂速度。
高質(zhì)量的數(shù)據(jù)預(yù)處理是提升模型表現(xiàn)和安全可靠性的重要
2
編碼到解碼三大類,其主要特點和代表性模型如表1所示。
表1大模型結(jié)構(gòu)主要分類及特點
架構(gòu)編碼器解碼器編碼器-解碼器
模型具備“雙向”注意力,模型只具備“單向”注意力,模型同時使用編碼器和解
可使用上下文信息來進行預(yù)即基于前面的單詞來預(yù)測后碼器兩個部分,適用于圖
測,最適合理解類任務(wù),如續(xù)單詞,最適合生成類任務(wù),繞給定愉入產(chǎn)生對應(yīng)輸出
特點文本分類、命名實體識別、如文本創(chuàng)作、對話問答等;的任務(wù),如翻譯、摘要,
閱讀理解等;模型參數(shù)一般模型參數(shù)量相對較大,實用以及一些有很強序列特征
偏小,預(yù)訓(xùn)練后需基于具體性高,計算高效、內(nèi)存占用的任務(wù),如語音識別、圖
任務(wù)進行Fine-tuning?少、泛化能力強.像描述生成等.
微衣量BERT、RoBERTavDeBERTa等。GPT系列、PaLM.OPT.T5、ChatGLMxBART、
LLaMA等。ERNIE3.OxM6等.
當(dāng)前,基于Transformer解碼器結(jié)構(gòu)訓(xùn)練的大模型成為了自然
語言處理領(lǐng)域的主流方案。在此影響下,語音、視覺以及跨模態(tài)
等領(lǐng)域的大模型也嘗試應(yīng)用類似模型架構(gòu),并取得了較好效果,
比如語音領(lǐng)域的OpenAlwhisper和DaLL-E等,圖像生成領(lǐng)域的
StableDiffusion開源模型等。
3.模型訓(xùn)練
大模型訓(xùn)練涉及預(yù)訓(xùn)練和微調(diào)等重要環(huán)節(jié)。預(yù)訓(xùn)練的主要目
的是利用大量無標(biāo)簽的數(shù)據(jù),訓(xùn)練出一個有能力捕捉到數(shù)據(jù)中隱
藏的底層結(jié)構(gòu)和模式的模型,這一階段的模型通常被稱為“基座
模型由于大模型的參數(shù)量和訓(xùn)練數(shù)據(jù)量的急劇增長,單個計
算設(shè)備的算力已經(jīng)不足以支撐模型訓(xùn)練。當(dāng)前,一般通過分布式
訓(xùn)練來解決預(yù)訓(xùn)練過程中的海量計算任務(wù)和高內(nèi)存資源等問題,
但也面臨著計算墻、內(nèi)存墻和通信墻等挑戰(zhàn)。目前解決分布式訓(xùn)
練的關(guān)鍵技術(shù)是并行化,將任務(wù)分割并分配到多個處理器或設(shè)備
4
上,以便同時完成計算,更有效地利用計算資源,減少訓(xùn)練所需
時間。微調(diào)的主要目的是在預(yù)訓(xùn)練模型的基礎(chǔ)上,通過有監(jiān)督微
調(diào)、強化學(xué)習(xí)等方式,進一步提升模型在下游任務(wù)中的表現(xiàn),使
得模型輸出更符合人類期望。有監(jiān)督微調(diào),又稱為指令微調(diào),通
過使用有標(biāo)注的特定任務(wù)數(shù)據(jù)對預(yù)訓(xùn)練模型進行微調(diào),從而使得
模型具備遵循指令的能力。早期的微調(diào)算法會涉及到預(yù)訓(xùn)練模型
的全量參數(shù)更新,計算成本較高,目前已提出了多種參數(shù)高效微
調(diào)任務(wù)的方法以節(jié)約計算成本,如LoRA、Adapter>P-tuning等。
強化學(xué)習(xí)技術(shù)是基于人類反饋,進一步調(diào)整模型的行為。其數(shù)據(jù)
集一般由經(jīng)過人工評估的反饋數(shù)據(jù)構(gòu)建,這些數(shù)據(jù)反映了模型的
輸出與期望輸出之間的差異,基于Q-learning、深度Q網(wǎng)絡(luò)或
近端策略優(yōu)化等強化學(xué)習(xí)算法進行訓(xùn)練。
大模型訓(xùn)練場景對中高端AI芯片需求旺盛,需要統(tǒng)籌規(guī)劃
CPU芯片、GPU芯片、服務(wù)器、網(wǎng)絡(luò)、存儲、冷卻、算力運營
服務(wù)、AI應(yīng)用服務(wù)平臺等多個方面。在金融機構(gòu)通用服務(wù)器
集群基礎(chǔ)上,構(gòu)建基于異構(gòu)芯片體系的AI算力資源池,實現(xiàn)對
金融
機構(gòu)現(xiàn)有AI算力資源的統(tǒng)一調(diào)度,保障大模型訓(xùn)練的算力支撐。
4.模型壓縮與加速
模型壓縮是指通過各種技術(shù)手段來減小機器學(xué)習(xí)模型的大
小、復(fù)雜度和計算量,加速推理過程并減少內(nèi)存使用,以便在資
源受限的設(shè)備上部署和運行,如移動設(shè)備、邊緣設(shè)備等。目前,
模型壓縮技術(shù)主要包括知識蒸儲、剪枝和量化等解決方案。知識
5
蒸像是一種訓(xùn)練小型模型以模仿大型模型行為的方法,保留了大
型模型主要功能的同時降低了計算和存儲需求,但通常需要一個
預(yù)先訓(xùn)練好的大型模型,且性能上會有一定損失。剪枝是一種去
除模型中不重要或冗余參數(shù)的方法,一般可以在不顯著影響模型
性能的情況下減小模型的大小和計算需求,但需要確定哪些參數(shù)
是不重要或冗余的,以選擇合適的剪枝策略。量化是一種減少模
型參數(shù)和運算中數(shù)字精度以降低模型的存儲需求和計算復(fù)雜度
的技術(shù),可適用于多種模型和任務(wù),并顯著減少存儲和計算需求,
但可能會造成一定程度的精度損失,且有時需要特定的硬件支持。
模型加速主要研究加速模型的訓(xùn)練和推理過程,伴隨模型參
數(shù)增長,正逐漸成為研究熱點。訓(xùn)練環(huán)節(jié),針對計算量、通信、
內(nèi)存可以進行一系列優(yōu)化,例如使用梯度累積或梯度壓縮可以優(yōu)
化通信策略、使用半精度浮點數(shù)可以節(jié)省內(nèi)存等。推理環(huán)節(jié),優(yōu)
化手段包括使用GPU、TPU和ASIC等芯片的專用硬件加速器加
速計算過程、使用并行化和分布式推理提高推理吞吐量并減少
推理時間、使用緩存和預(yù)取策略降低內(nèi)存訪問延遲、在邊緣設(shè)
備上進行推理減少與服務(wù)器端的通信延遲、結(jié)合模型壓縮技術(shù)
加速推理過程等。現(xiàn)階段AI應(yīng)用中,大量的算法、模型、開發(fā)
框架、軟件等開發(fā)都基于通用加速卡架構(gòu),在考慮硬件算力的
基礎(chǔ)上,要
結(jié)合加速芯片軟件棧及開發(fā)工具鏈等配套的軟件生態(tài)能力。
5.模型評測
模型評測在機器學(xué)習(xí)和自然語言處理領(lǐng)域扮演著至關(guān)重要
6
的角色。大模型具有更強大的泛化能力,可以處理多種任務(wù),但
大模型的輸出可能存在不真實、不準(zhǔn)確、不專業(yè)等問題,因此在
大模型上線或升級時,有必要對其進行較為全面、充分的評測,
幫助模型迭代優(yōu)化。
大模型評測已成為行業(yè)發(fā)展熱點問題,目前國內(nèi)外相關(guān)評測
層出不窮。據(jù)初步統(tǒng)計,目前行業(yè)內(nèi)關(guān)于大模型基準(zhǔn)測試或特定
任務(wù)的測試數(shù)據(jù)集已多達200余項,主要推出機構(gòu)可以大體分為
學(xué)術(shù)界、產(chǎn)業(yè)界、媒體、社區(qū)以及智庫等。其中一些代表性的評
估基準(zhǔn)包括HELM、MMLU、C-EVAL、BigBench、HumanEval>
AGIEVal、SuperCLUE、OpenLLM等??傮w來看,大模型評測
仍處于早期階段,如何構(gòu)建出全面、充分且能伴隨大模型能力
增長不斷迭代的
大模型評測基準(zhǔn),仍面臨較大挑戰(zhàn)。
6.模型運營
大模型運營包括工程化、部署、管理、調(diào)試、維護和監(jiān)控等
多個方面,旨在確保大模型在生產(chǎn)環(huán)境中穩(wěn)定運行,持續(xù)適應(yīng)變
化,滿足用戶需求,保障數(shù)據(jù)安全。工程化方面,模塊化和面向
對象的編程可以都助組織代碼,使其更具可讀性和可重用性,如
將數(shù)據(jù)預(yù)處理、模型結(jié)構(gòu)、訓(xùn)練循環(huán)和評估功能分為不同的模塊
或類,同時版本控制系統(tǒng)和自動化測試技術(shù)有助于及時跟蹤代碼
的修改歷史,確保每個功能模塊和整個系統(tǒng)穩(wěn)定運行。部署方面,
要將模型轉(zhuǎn)化為適用于實際環(huán)境的格式,包括序列化、壓縮、硬
件優(yōu)化以及容器化工具的使用,以確保模型在不同環(huán)境中的一致
性。管理方面,使用身份和訪問管理工具可以控制資源的訪問權(quán)
限,運用數(shù)據(jù)管理工具跟蹤數(shù)據(jù)集的變化。調(diào)試方面,使用可視
化工具和日志記錄有助于監(jiān)測模型運行時的詳細(xì)信息,這對于診
斷問題和優(yōu)化性能至關(guān)重要。維護方面,要制定明確的更新策略
以適應(yīng)新數(shù)據(jù)和業(yè)務(wù)需求,同時要建立回退機制,確保出現(xiàn)問題
時能夠快速回退到穩(wěn)定版本。監(jiān)控方面,通常包括性能監(jiān)控和異
常檢測,基于實時跟蹤和警報設(shè)置,確保模型的可靠運行。
7.安全可信
一般而言,大模型的安全可信會從多個維度進行考量和評估,
包括但不限于:可靠性,即大模型的輸出內(nèi)容是真實的、一致的
等;內(nèi)容安全性,即大模型的輸出應(yīng)避免涉黃、涉暴等非法內(nèi)容,
并能遵循當(dāng)?shù)氐牡赖聹?zhǔn)則和法律規(guī)定等;公平無偏性,即大模型
輸出應(yīng)避免偏見、刻板印象、不公平等情況;魯棒性,即大模型
在面對投毒攻擊、提示詞攻擊等惡意行為或者意外情況時,依然
能夠產(chǎn)生穩(wěn)定和可靠的輸出結(jié)果;可解釋性,即大模型能夠解釋
其推理過程并能透明展示其內(nèi)容生成方式等;數(shù)據(jù)安全和隱私保
護,即對訓(xùn)練和推理大模型的數(shù)據(jù)中可能包含的敏感信息進行相
應(yīng)的脫敏和保護處理等。
為有效提升大模型的安全可信水平,需要在大模型開發(fā)和運
營的全流程采取相應(yīng)的安全措施,包括但不限于:數(shù)據(jù)處理環(huán)節(jié),
建立高質(zhì)量的訓(xùn)練數(shù)據(jù)集,有效去除有毒或錯誤信息、注重訓(xùn)練
數(shù)據(jù)的分布比例以避免產(chǎn)生偏見、對訓(xùn)練數(shù)據(jù)中的敏感數(shù)據(jù)進行
8
脫敏等;模型開發(fā)階段,引入對齊技術(shù)等讓大模型的輸出更符合
人類價值觀;模型上線前,需對大模型的安全可靠水平進行充分
評測,如紅隊對抗測試等;大模型對客提供服務(wù)時,可以引入安
全圍欄技術(shù),既能幫助大模型攔截外界的惡意提問,又能對生成
內(nèi)容進行風(fēng)險過濾和攔截;此外,模型運營過程中,還需要建立
持續(xù)的監(jiān)控和定期審核機制,以及時發(fā)現(xiàn)異常情況并持續(xù)迭代優(yōu)
化模型。
(二)國內(nèi)外主要產(chǎn)品情況
自ChatGPT引起業(yè)界高度關(guān)注后,國內(nèi)外科技巨頭紛紛加大
了對大模型的研發(fā)和投入,以模型為核心,圍繞模型全生命周期
設(shè)計、生產(chǎn)并提供產(chǎn)品、技術(shù)和服務(wù),推動“數(shù)據(jù)、模型、服務(wù)、
場景”的AI生產(chǎn)力閉環(huán)連接和迭代優(yōu)化,為大規(guī)模、標(biāo)準(zhǔn)化的人
工智能創(chuàng)新提供技術(shù)支撐。在此背景下,大模型相關(guān)產(chǎn)品和服務(wù)
迎來了爆發(fā)式增長。此外,許多大模型相關(guān)的開源項目涌現(xiàn),為
研究和創(chuàng)新提供了便利。這些開源項目主要朝著兩個方向發(fā)展:
一是相對ChatGPT更經(jīng)濟的、平民化的替代品,二是圍繞著大模
型建立的外圍應(yīng)用工具。
9
I
新化,服聯(lián)三留
更能力融研用停
所能
究智金學(xué)采都
研和理動產(chǎn)般大
化推推、一,
G您型
息和步用構(gòu)品
信轉(zhuǎn)
化成一應(yīng)機產(chǎn)
融線用
金字生進型融
間、商
:時數(shù)將模金
源踐習(xí),大購
展構(gòu)型
來發(fā)實學(xué)力源大采
據(jù)品索機、未
數(shù)產(chǎn)能開。
探融解化括購尚
型金
模與理泛包采遍0
大用是的務(wù)線型普。1
型應(yīng)直備任路模構(gòu)段
典一
外業(yè)具多型大機階
用y
內(nèi)型的選用融試e
融vr
國應(yīng)u
1模越術(shù)商金測S
金的CM
圖大卓線技和小L
在O/x
術(shù),和。路的制中Po
BI
型A
技域量級術(shù)型見研,和C
GooggU
模能領(lǐng)容升技選常型式報R/
m
大)術(shù)o
智心識化型模模匯c.
b
-u
、工核知能技模大的、h
(.ti
1g
三人的的智大新行研/
:s
級p
觀的創(chuàng)并調(diào)t
升可務(wù)合路在h
一是開源大模型應(yīng)用。開源大模型是指通過開源方式發(fā)布和
共享的大模型,其源代碼和相關(guān)資料對公眾開放,適用于具備一
定技術(shù)能力的開發(fā)者、研究機構(gòu)以及對模型定制和二次開發(fā)有需
求的機構(gòu)。國內(nèi)外的大模型有近一半選擇了開源的方式,Bloom.
GLM、Llama是目前國內(nèi)外流行度較高的開源大模型。金融機構(gòu)
選擇開源大模型的前提是能夠依靠自身或者第三方公司進行大
模型應(yīng)用研發(fā),且具備后期維護、迭代更新的能力。盡管開源大
模型已具備較好的實踐效果,但仍面臨數(shù)據(jù)安全合規(guī)風(fēng)險、開源
協(xié)議風(fēng)險等挑戰(zhàn)。總體而言,金融機構(gòu)對于開源模型的采用普遍
持謹(jǐn)慎態(tài)度,但在前期探索階段通常會采用開源大模型進行測試、
研究,同時將其與商用大模型的應(yīng)用效果進行比對。
二是產(chǎn)學(xué)研聯(lián)合創(chuàng)新大模型研制。金融機構(gòu)、科技企業(yè)、科
研院所、高等院校等通過合作,共享知識、技術(shù)或資源,發(fā)揮各
自優(yōu)勢,推動技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展。產(chǎn)學(xué)研聯(lián)合創(chuàng)新有助于金融
機構(gòu)在大模型創(chuàng)新應(yīng)用初期推動特定試點場景快速落地。一方面,
可以在一定程度上助力金融機構(gòu)加速科技創(chuàng)新及數(shù)字化轉(zhuǎn)型,打
造更好的產(chǎn)品和服務(wù),增強行業(yè)競爭力。另一方面,可以減少金
融業(yè)對國外技術(shù)和產(chǎn)品的依賴,加快國產(chǎn)化步伐,提升行業(yè)安仝
可控能力。
專欄一產(chǎn)學(xué)研聯(lián)合創(chuàng)新大模型研制
工商銀行與清華、鵬城實驗室、華為等高等院校、科研院所、
科技企業(yè)開展大模型聯(lián)合創(chuàng)新。
11
交通銀行與華為、科大訊飛共建了聯(lián)合創(chuàng)新實驗室,推進大模
型及算力集群技術(shù)、人工智能等先進技術(shù)在金融領(lǐng)域的落地應(yīng)用。
北京銀行與火山引擎、華為、中科院自動化所、中科聞歌共建
聯(lián)合創(chuàng)新實驗室,圍繞金融大模型體系構(gòu)建、前沿金融科技應(yīng)用等
領(lǐng)域開展合作創(chuàng)新,共同探索銀行智能化技術(shù)的最佳實踐。
三是商用大模型采購。眾多國內(nèi)外商用大模型正在逐步推廣
應(yīng)用。相較于開源大模型,商用大模型可以為金融機構(gòu)提供更加
工程化、易用性強、服務(wù)有保障的解決方案。
金融機構(gòu)在大模型技術(shù)選型時需要綜合考慮大模型對業(yè)務(wù)
質(zhì)量和人員效率的提升效果、大模型持續(xù)創(chuàng)新能力、大模型運行
時的穩(wěn)定性和安全性等多個方面。同時,金融機構(gòu)還需結(jié)合自身
業(yè)務(wù)特點和實力情況,對資金、人員、配套工具產(chǎn)品完備性等因
素進行全面考量,以選擇合適的大模型解決方案。此外,要建設(shè)
并維護內(nèi)部統(tǒng)一的大模型資源庫,并在此基礎(chǔ)上建立大模型應(yīng)用
開發(fā)平臺,更好地充分利用業(yè)界多種領(lǐng)先的通用大模型。
2.部署方式
為制定合適的部署方案,金融機構(gòu)首先需要確定需求和目標(biāo),
其次要根據(jù)業(yè)務(wù)場景和技術(shù)要求,選擇合適的硬件和軟件環(huán)境,
確保能夠支持大模型的運行和優(yōu)化。針對不同應(yīng)用場景,金融機
構(gòu)探索采用不同部署方式以更合理地應(yīng)用大模型。根據(jù)部署環(huán)境
的不同,可以將大模型部署方式分為私有化部署、行業(yè)云部署和
公有云部署等。
12
一是私有化部署。金融機構(gòu)將大模型部署于自有服務(wù)器,由
金融機構(gòu)負(fù)責(zé)維護和管理。私有化部署可以提供更好的數(shù)據(jù)安全
保障,大大減少信息安全隱患,且一般具有較好的應(yīng)用效果,尤
其是對于需要運用內(nèi)部語料訓(xùn)練的金融業(yè)務(wù)場景,可以根據(jù)金融
機構(gòu)的需求進行定制和優(yōu)化模型,并隨時增減資源。但是,這種
部署方式往往會產(chǎn)生高昂的成本,需要金融機構(gòu)投入大量的資金、
人力來建設(shè)和維護。
二是行業(yè)云部署。由行業(yè)內(nèi)起主導(dǎo)作用或掌握關(guān)鍵資源的組
織建立和維護,以公開或半公開的方式,在確保數(shù)據(jù)安全的前提
下,向行業(yè)內(nèi)部或相關(guān)組織提供云平臺服務(wù)。將大模型部署在金
融云,既能在一定程度上滿足數(shù)據(jù)安全可控的要求,又兼?zhèn)涑杀?/p>
低、擴展性強等優(yōu)勢。中小型金融機構(gòu)對行業(yè)云部署的需求更為
迫切。
三是公有云部署。金融機構(gòu)通過標(biāo)準(zhǔn)接口調(diào)用部署在公有云
上的大模型,由云服務(wù)提供商負(fù)責(zé)維護和管理,具備更低的成本、
更高的靈活性和可擴展性。然而,由于金融機構(gòu)無法完全掌控其
數(shù)據(jù)的存儲和管理,使用這種部署方式可能面臨數(shù)據(jù)安全風(fēng)險,
因此該部署方式可能更適用于互聯(lián)網(wǎng)類的金融企業(yè)或非敏感類
業(yè)務(wù)場景。
鑒于個人隱私保護和數(shù)據(jù)不出域等相關(guān)要求,私有化部署仍
是金融機構(gòu)部署大模型的主要選擇方式。私有化部署使得金融機
構(gòu)得以保留對數(shù)據(jù)和系統(tǒng)的完全控制權(quán),但由于大模型訓(xùn)練和推
13
理對算力及配套基礎(chǔ)設(shè)施有較高要求,該部署方式更適用于大中
型金融機構(gòu),對于中小型金融機構(gòu)實現(xiàn)難度較大。對于不涉及數(shù)
據(jù)保密性的場景,比如證券公司基于公開數(shù)據(jù)生成投資策略及研
報撰寫,行業(yè)云或公有云部署具有一定優(yōu)勢。目前,國外已有
API市場化采購服務(wù),且價格低廉。隨著私有化部署成本不斷提
高,中小銀行、證券公司、基金等中小金融機構(gòu),迫切需要通過
行業(yè)云或公有云來降低大模型金融應(yīng)用的門檻。
(二)使用方式
大模型具備出色的自然語言理解能力,但因其在金融垂直領(lǐng)
域的知識儲備不足,回答的專業(yè)性難以滿足要求。金融機構(gòu)需要
將金融領(lǐng)域已有的數(shù)據(jù)庫、知識圖譜等專業(yè)知識系統(tǒng),與大模型
的意圖理解能力、語言生成能力和場景掌控能力進行對接,實現(xiàn)
大模型的行業(yè)個性化和機構(gòu)定制化。然而,大模型技術(shù)復(fù)雜度高、
參數(shù)規(guī)模大、研發(fā)投入高,特別是需要大量的數(shù)據(jù)標(biāo)注和人工反
饋等工程化投入,從頭自研大模型的難度非常大。因此,金融機
構(gòu)目前主要采用API調(diào)用、提示工程、模型微調(diào)和二次訓(xùn)練等應(yīng)
用方式,以降低大模型的應(yīng)用研發(fā)門檻,解決場景數(shù)據(jù)少、模型
精度低等問題,推動大模型快速落地測試。比如,農(nóng)業(yè)銀行利用
有監(jiān)督的模型微調(diào)和強化學(xué)習(xí)等技術(shù),融入行內(nèi)知識庫數(shù)據(jù),訓(xùn)
練、收斂出能理解行內(nèi)知識的基礎(chǔ)模型,目前已具備行業(yè)知識問
答能力。中信證券將特定問題及與其相關(guān)內(nèi)部文檔材料作為問答
輸入,既可獲得較好的應(yīng)用效果,又避免了二次訓(xùn)練的高昂成本。
14
1.API調(diào)用
API調(diào)用是指通過API接口調(diào)用大模型,實現(xiàn)圖像生成、文
本生成、語音合成等功能。公有云大模型大多采用以API接口的
方式提供服務(wù)。該方式使得金融機構(gòu)在大模型探索應(yīng)用初期能夠
快速將大模型在項目中進行測試驗證,且成本低廉。然而,API
調(diào)用的方式不僅需要完成一系列的技術(shù)整合和接口開發(fā),也面臨
如何在不降低模型準(zhǔn)確性的前提下保障數(shù)據(jù)安全和隱私性、如何
高效處理海量數(shù)據(jù)、生成內(nèi)容可控性和魯棒性較差等問題,適合
直接落地的金融業(yè)務(wù)場景很少。一般來說,金融機構(gòu)應(yīng)用API調(diào)
用方式對大模型產(chǎn)品進行測試后,會根據(jù)測試結(jié)果結(jié)合該模型在
其他領(lǐng)域的表現(xiàn)進行綜合評價,判斷是否進一步選擇微調(diào)或二次
訓(xùn)練的方式進行優(yōu)化。
2.提示工程
基礎(chǔ)預(yù)訓(xùn)練大模型內(nèi)含知識豐富,但很多潛能尚未被激發(fā),
如何有效引導(dǎo)大模型來完成特定任務(wù)存在挑戰(zhàn)。提示工程通過優(yōu)
化提示語句激發(fā)大模型所具備的潛在能力,提示語通常是一段文
本,用于構(gòu)建問題或?qū)θ蝿?wù)進行恰當(dāng)表述,以便大模型基于內(nèi)在
知識生成合適答案,可通過少樣本、思維鏈路等方式實現(xiàn)。提示
工程并不改變模型參數(shù),對于可指令微調(diào)的大模型來說,構(gòu)造提
示語的成本相對較低,大部分成本轉(zhuǎn)嫁為標(biāo)注成本,通過設(shè)計好
的提示語來調(diào)優(yōu)任務(wù)效果。
15
3.模型微調(diào)
基礎(chǔ)預(yù)訓(xùn)練大模型具備較好的通用性知識,但實際應(yīng)用中,
每個具體場景都有其獨特的需求和流程,仍需優(yōu)化模型以提升應(yīng)
用效果和價值。模型微調(diào)是優(yōu)化模型效果和性能并提高準(zhǔn)確性的
重要手段,也是當(dāng)前金融機構(gòu)試用大模型的最常用手段。當(dāng)大模
型缺乏垂直領(lǐng)域知識時,通過模型微調(diào)技術(shù),以較低的成本即可
明顯提升針對特定任務(wù)的應(yīng)用效果。一般來說,當(dāng)測試結(jié)果良好
時,會優(yōu)先選擇模型微調(diào)技術(shù)提升應(yīng)用效果。
4.二次訓(xùn)練
二次訓(xùn)練指在已有模型的基礎(chǔ)上,使用新的數(shù)據(jù)集對模型進
行重新訓(xùn)練,從而提高模型的性能和應(yīng)用效果。二次訓(xùn)練通常需
要對模型參數(shù)進行修改,以適應(yīng)新數(shù)據(jù)集的特點。相較于微調(diào),
二次訓(xùn)練會產(chǎn)生高昂的數(shù)據(jù)、算力、人力以及時間成本,但也可
以實現(xiàn)更好的效果和更廣泛的場景化應(yīng)用。一般來說,大型金融
機構(gòu)因具備海量垂直領(lǐng)域數(shù)據(jù)基礎(chǔ),在微調(diào)技術(shù)難以實現(xiàn)期望達
到的應(yīng)用效果時,可以選擇該方式高度定制化模型以提升模型的
泛化能力和場景化應(yīng)用能力。
此外,金融機構(gòu)還采用大模型融合知識庫、知識圖譜等組件
的方式,通過引入領(lǐng)域向量庫檢索、數(shù)據(jù)增強等技術(shù),結(jié)合大模
型關(guān)鍵超參優(yōu)化,形成不同模型針對不同行業(yè)和領(lǐng)域的參數(shù)體系,
精準(zhǔn)匹配業(yè)務(wù)需求,使得大模型回答結(jié)果較為可信。
16
(三)應(yīng)用場景
大模型在金融領(lǐng)域的應(yīng)用前景廣闊,趨動AI從勞動密集向
腦力密集應(yīng)用,金融機構(gòu)已經(jīng)將大模型試點應(yīng)用于智能客服、智
能辦公、智能研發(fā)、智能投研等多個金融業(yè)務(wù)場景,但從能用到
好用、易用,再到規(guī)模化應(yīng)用還任重道遠(yuǎn)?;诋?dāng)前金融機構(gòu)主
要場景探索實踐來構(gòu)建金融行業(yè)大模型應(yīng)用場景全景圖。
代科夕或
智與“全按口設(shè)計
能代5?謾
與注何
研
發(fā)
智
智
能
能
投
營
顧
銷
生成
數(shù)據(jù)來源:金融信息化研究所
圖2金融行業(yè)大模型應(yīng)用場景全景圖
1.智能客服
傳統(tǒng)的智能客服的服務(wù)方式主要是先識別用戶意圖,再匹配
到特定的對話模板,是一個非常龐雜的配置過程,特別是要確保
所有渠道對于相似問題的回答保持一致。這種方式不僅維護成本
高,維護難度大,而且難以應(yīng)對復(fù)雜多變的自然語言對話,用戶
體驗較差。金融機構(gòu)普遍認(rèn)為大模型雖然仍不具備直接面客的能
力,但可以在通用大模型的基礎(chǔ)上,疊加金融客服領(lǐng)域的數(shù)據(jù)和
專業(yè)經(jīng)驗,經(jīng)過垂直領(lǐng)域定向訓(xùn)練后,客服機器人可以綜合考慮
用戶提示語和用戶習(xí)慣,準(zhǔn)確識別用戶意圖,作為客服助手協(xié)助
客服人員開展客戶的陪伴和關(guān)懷,升級真誠話術(shù),提供24小時
的多語言支持,有效提升用戶對話體驗,提高服務(wù)質(zhì)量。
專欄二智能客服場景
工商銀行利用大模型的語義理解、生成能力,結(jié)合基于知識庫
的檢索提取能力,精準(zhǔn)理解客戶意圖,生成符合其業(yè)務(wù)特性的結(jié)果,
為客戶提供更準(zhǔn)確、更個性化的服務(wù),提升應(yīng)答效率和質(zhì)量,從而
提升客戶滿意度。2023年3月,工商銀行進行了大模型智能客服試
點測試,一定程度上提升了客戶情緒識別效果,縮減了約50%的人力
維護成本。
農(nóng)業(yè)銀行大模型ChatABC面向行內(nèi)客服員工提供遠(yuǎn)程銀行AI輔
助客服問答助手服務(wù)。此助手基于遠(yuǎn)程銀行問答數(shù)據(jù)完成訓(xùn)練微調(diào),
支持模型在多輪問答中識別客戶的主要意圖,結(jié)合遠(yuǎn)程銀行知識庫
和知識圖譜,生成擬人問答,輔助坐席人員在問答中獲取知識,有
效提升坐席人員的答復(fù)效率。
中國銀行正探索將大語言模型運用于客服場景,幫助業(yè)務(wù)人員
實現(xiàn)更自然靈活的智能問答功能,有效地應(yīng)用到坐席問答輔助、員
工培訓(xùn)、行內(nèi)員工辦公等多個場景。
交通銀行正探索使用大模型來準(zhǔn)確識別客戶意圖和坐席人員的
知識檢索需求,進行相應(yīng)客服知識的提煉和推薦,并在坐席通話結(jié)
束后,對服務(wù)內(nèi)容進行自動的標(biāo)準(zhǔn)化分類,生成通話小結(jié),以提升
坐席人員整體工作效率。
光大銀行探索大模型技術(shù)與現(xiàn)有智能客服相融合,基于大模型
18
意圖理解能力對客戶問題進一步理解,以提升客戶問答滿意度;基
于大模型技術(shù)探索坐席工單自動生成可能性,對客戶與坐席對話內(nèi)
容快速生成摘要工單,提升客戶服務(wù)效率。
民生銀行探索運用大模型技術(shù)輔助坐席完成問題回復(fù)和工單生
成等工作,實現(xiàn)工單流程自動化,提供內(nèi)容以支持顧問與客戶互動,
支持高度擬人化的客服機器人,優(yōu)化客戶體驗,提升客服質(zhì)量。
興業(yè)銀行基于大模型技術(shù)實現(xiàn)客服語料智能泛化,對當(dāng)前語料
標(biāo)注過程中存在的標(biāo)注工作繁瑣、工作量大等痛點,通過大模型生
成符合業(yè)務(wù)需求的語料,以幫助客服運營人員提升標(biāo)注效率,進而
提升智能客服回答準(zhǔn)確率,減少客戶投訴。
上海銀行正探索在客戶服務(wù)領(lǐng)域運用大模型優(yōu)秀的語言理解能
力并結(jié)合行內(nèi)知識庫,在充分洞察客戶訴求的前提下,對復(fù)雜場景
進行分解,能夠從知識庫中自動完成有效知識的提取與采編,解決
知識庫運維完全依賴人力、多語義理解、語義纏繞等問題,為客戶
提供優(yōu)質(zhì)解答。
國信證券探索運用大模型技術(shù)自動化生成服務(wù)話術(shù)和客戶指標(biāo)
數(shù)據(jù),包括:知識問答、行業(yè)分析、行情快報、客戶資產(chǎn)配置建議、
資訊推送摘要、投訴建議反饋等,提升運營人員的服務(wù)質(zhì)量和效率。
平安保險運用大模型技術(shù)解決傳統(tǒng)知識庫梳理成本高、培譏成
本高、推薦話術(shù)僵化等問題,在客服人員與客戶通話過程中,實時
根據(jù)客戶需求,生成個性化話術(shù),從而提升客戶滿意度,大大降低
坐席人員學(xué)習(xí)成本。
19
2.智能辦公
大模型可以作為辦公助手,發(fā)揮其出色的文本生成能力,輔
助完成報告和運營文案生成、郵件起草、公文潤色、紀(jì)要撰寫、
內(nèi)容審核、輔助糾錯等工作,為員工提供更加便利、快捷的智能
辦公工具及個性化的智能辦公解決方案,大幅提升工作效率。此
外,大模型還可以實現(xiàn)不同語種的實時翻譯,提升金融機構(gòu)跨境
業(yè)務(wù)交流和管理水平。
專欄三智能辦公場景
工商銀行通過搜索技術(shù)與大模型結(jié)合,將知識庫檢索到的信息
作為大模型的生成依據(jù),實現(xiàn)自然語言的向量搜索,輔助業(yè)務(wù)人員
在業(yè)務(wù)辦理過程中快速查詢到客戶問題的準(zhǔn)確應(yīng)答,提升應(yīng)答效率
和質(zhì)量,從而提升客戶滿意度。
農(nóng)業(yè)銀行大模型ChatABC面向行內(nèi)員工辦公場景推出智能問答
應(yīng)用。此應(yīng)用著眼于大模型在金融領(lǐng)域的知識理解能力、內(nèi)容生成
能力,并融合知識庫,具備研發(fā)服務(wù)領(lǐng)域級知識理解和問答能力,
可完成自由閑聊、行內(nèi)知識問答、內(nèi)容摘要等多類型任務(wù),并以行
內(nèi)研發(fā)服務(wù)平臺的問答助手、工單自動化回復(fù)助手、行內(nèi)即時聊天
工具等多渠道形式進行試點。
交通銀行正探索在辦公軟件中嵌入基于大模型的智能問答助
手,為員工提供人資規(guī)章、授信、對公、零售業(yè)務(wù)場景的會話式咨
詢。同時,交通銀行利用大模型搭建會議紀(jì)要助手,從口語化的會
議記錄中提取關(guān)鍵信息,包括討論主題、觀點、結(jié)論等,組織成連
20
貫自然的語言,生成書面化的會議紀(jì)要和待辦事項。
郵儲銀行運用大模型技術(shù)搭建智能知識問答系統(tǒng)“靈犀”,系統(tǒng)
采用Langchain和向量數(shù)據(jù)庫技術(shù),結(jié)合大模型對自然語言的理解
與生成能力,發(fā)揮了垂直領(lǐng)域內(nèi)知識理解能力,賦能業(yè)務(wù)實現(xiàn)專
業(yè)知識智能解答,提升業(yè)務(wù)辦理效率。同時,郵儲銀行運用大模型
技術(shù)搭建“小郵助手”智能機器人,提供在線業(yè)務(wù)知識問答、熱點問
題分類展示,實現(xiàn)業(yè)務(wù)難點、要點即時回復(fù)和精準(zhǔn)提示,提升柜
員操作體驗及業(yè)務(wù)處理效率,釋放業(yè)務(wù)指導(dǎo)員工作。
光大銀行基于大模型技術(shù)構(gòu)建員工助手,應(yīng)用于行內(nèi)通信軟件,
快速解答內(nèi)部員工日常辦公問題,構(gòu)建多項智能應(yīng)用,可幫助行內(nèi)
員工實現(xiàn)消息智能摘要、日程會議智能提醒、郵件自動編寫、代碼
自動生成、系統(tǒng)助手等多項能力,提升辦公效率。同時,光大銀行
探索將現(xiàn)有知識庫與大模型相結(jié)合,打造企業(yè)內(nèi)搜場景應(yīng)用,將現(xiàn)
有零散知識召回交給大模型,基于大模型理解及生成能力輔助業(yè)務(wù)
辦公人員快速定位核心問題并作出合理判斷,以提升業(yè)務(wù)效率。
民生銀行通過大模型的理解能力建立多場景文檔助手,對文檔
的主要內(nèi)容進行摘要匯總整理,全面提升員工工作效率,實現(xiàn)針對
文檔不同場景的個性化需求。
興業(yè)銀行探索通過大模型嵌入行內(nèi)WPS辦公套件,實現(xiàn)包括PPT
大綱生成,文章內(nèi)容生成,內(nèi)容擴寫與改寫,文章風(fēng)格轉(zhuǎn)變等功能,
以減輕總分行一線員工的文字材料撰寫潤色的負(fù)擔(dān)。
北京銀行搭建“京智助手”大模型對話機器人,提供行內(nèi)知識
21
問答、數(shù)據(jù)分析、任務(wù)執(zhí)行等功能,應(yīng)用于協(xié)同辦公、智能客服、
合規(guī)管理等場景。目前""京智助手''已向全行HXXX)多名員工開放,
并同步建設(shè)移動端和PAD端,已在合規(guī)管理、數(shù)據(jù)分析和流程
自動化場景,取得了一定的應(yīng)用成效。
上海銀行利用大模型的理解和生成能力,搭建智能辦公助手,
一方面接入行內(nèi)知識庫,提升知識檢索能力,并由大模型對于長文
檔自動檢索生成知識條目等,另一方面接入行內(nèi)各類辦公系統(tǒng),提
供公文檢查、寫作、總結(jié)潤色等功能,在大幅提升辦公效率的基礎(chǔ)
上,極大地提升員工交互體驗。
中信證券正在積極探索利用大模型建立跨境實時通訊系統(tǒng),旨
在實現(xiàn)境內(nèi)外員工用母語進行無障礙交流,提高員工工作效率,加
強團隊協(xié)作力度,以及提升對國際化客戶的服務(wù)質(zhì)量,加強全球化
布局和業(yè)務(wù)發(fā)展。
國泰君安將大模型技術(shù)與OCR、語音識別等技術(shù)相結(jié)合,圍繞
智慧辦公場景開發(fā)智能辦公助手和基于大模型的知識庫問答應(yīng)用,
提供會議紀(jì)要生成、郵件撰寫等常見辦公任務(wù)小工具,通過自然
語言問答的形式實現(xiàn)文檔問答,為員工提供一個智能、高效、便
捷的工
作伙伴,提升辦公效率和工作質(zhì)量。
3.智能研發(fā)
大模型在智能研發(fā)場景展示出很大的潛力。大模型具有處理
自然語言和生成多種編程語言高質(zhì)量代碼的能力,在系統(tǒng)設(shè)計、
代碼生成與補全、代碼翻譯與注釋、輔助測試等方面為科技人員
22
提供幫助和支持,提升開發(fā)效率和交付質(zhì)量。同時,大模型的閱
讀理解和SQL生成能力,可以實現(xiàn)指令文字到SQL代碼的直接相
互轉(zhuǎn)化,業(yè)務(wù)人員無需了解數(shù)據(jù)庫技術(shù)與編程知識也可輕松完成
數(shù)據(jù)查詢等工作。此外,通過大模型與BI等應(yīng)用系統(tǒng)結(jié)合,可
以實現(xiàn)報表自動生成,可視化地展示數(shù)據(jù)查詢分析結(jié)果,使得非
技術(shù)人員更直觀且深入地理解、利用數(shù)據(jù),降低技術(shù)門檻。
專欄四智能研發(fā)場景
農(nóng)業(yè)銀行大模型ChatABC推出AI輔助編程應(yīng)用,面向行內(nèi)研發(fā)
員工提供輔助編程服務(wù)。通過行內(nèi)多個系統(tǒng)的代碼和代碼規(guī)范進行
微調(diào),實現(xiàn)Java、Python>JavaScript^SQL等語言的代碼生成、代
碼補全、代碼解釋等能力,可在前端、后端、單元測試等多類研
發(fā)編碼場景提供輔助,提升研發(fā)人員的開發(fā)效率。
平安銀行在ChatBI項目中應(yīng)用了BankGPT的金融理解能力,旨
在為業(yè)務(wù)人員和管理層提供即時的數(shù)據(jù)分析服務(wù),當(dāng)'業(yè)務(wù)人員面臨
數(shù)據(jù)相關(guān)的問題時,系統(tǒng)可以迅速給出精確答案,實現(xiàn)提問與回答
的無縫對接。
民生銀行探索運用大模型技術(shù)輔助用戶完成高質(zhì)量代碼編寫,
按需完成代碼生成、代碼補全等功能,促進分析平民化,提升代碼
效率,實現(xiàn)質(zhì)量和效率的雙提升。
興業(yè)銀行通過大模型嵌入行內(nèi)開發(fā)IDE的方式,探索基于大模
型技術(shù)實現(xiàn)代碼輔助生成,以提升科技研發(fā)單位的開發(fā)效率和代碼
質(zhì)量。
23
上海銀行通過在軟件開發(fā)過程中引入大模型進行代碼補全、注
釋生成、代碼糾錯等自動化輔助功能,極大地提升了開發(fā)人員的開
發(fā)效率和代碼質(zhì)量;在代碼測試方面,應(yīng)用大模型生成能力,輔助自
動生成測試案例,有效提升測試效率及案例覆蓋度;在數(shù)據(jù)分析方
面,上海銀行正在探索大模型與行內(nèi)經(jīng)營管理工具-“掌上行”的有
效結(jié)合,通過自然語言交互方式,允許用戶就經(jīng)營指標(biāo)自由提問,
進一步降低數(shù)據(jù)分析的門檻,提升數(shù)據(jù)驅(qū)動經(jīng)營管理的有效性。
中信證券探索運用大模型實現(xiàn)股價預(yù)測等模型構(gòu)建,根據(jù)用戶
輸入的自然語言,生成相應(yīng)SQL語句,準(zhǔn)確地完成用戶數(shù)據(jù)查詢需
求,以期適配不同數(shù)據(jù)庫、完成多表數(shù)據(jù)查詢。
國信證券通過大模型的輔助代碼生成能力,協(xié)助IT人員、業(yè)務(wù)
產(chǎn)品經(jīng)理、運營人員進行代碼編寫、數(shù)據(jù)分析、輔助代碼生成檢查
等工作,提升系統(tǒng)開發(fā)、數(shù)據(jù)分析等內(nèi)部工作效率。
4.智能投研
大模型技術(shù)可以幫助投研人員從海量、分散、龐雜的報告中
挖掘關(guān)鍵信息,自動抓取財經(jīng)、債市、信用等多個市場板塊的資
訊報告內(nèi)容,快速獲取報告的核心觀點、關(guān)鍵數(shù)據(jù)和市場趨勢,
分析預(yù)測市場交易情況,智能生成資訊報告和投研簡報,為投研
人員提供投資、風(fēng)控等決策輔助。
專欄五智能投研場景
工商銀行綜合應(yīng)用大模型的核心信息提取、智能文本生成等能
力,實現(xiàn)金融報告的自動生成,有效將投研簡報生成效率從1小時
24
縮短至5分鐘,提升了投研人員對海量文本數(shù)據(jù)的整合歸納提煉效
率。
興業(yè)銀行通過大模型技術(shù)實現(xiàn)研報摘要的智能生成,構(gòu)建了一
套包括研報文檔結(jié)構(gòu)化、信息抽取和大語言模型語義理解摘要生成
的一體化解決方案,實現(xiàn)研報核心內(nèi)容智能提煉,提高了興銀理財
子公司投研團隊查洵、閱讀內(nèi)外部研報的效率,加快了投資決策效
率,一定程度節(jié)省人力成本,同時提升了客戶體驗。
國泰君安證券利用大模型的自然語言到結(jié)構(gòu)化查詢(NL2SQL)
等能力,改進傳統(tǒng)問答系統(tǒng)的精準(zhǔn)性和靈活性,實現(xiàn)對投研領(lǐng)域
內(nèi)包
括行情、公司、基金等數(shù)據(jù)的精確、高效問答。
華泰證券正探索運用大模型對文本的學(xué)習(xí)理解能力,學(xué)習(xí)歷史
研報的撰寫模式、分析邏輯和行文風(fēng)格等內(nèi)容,從而實現(xiàn)研究報告
初稿的自動撰寫。目前已初步搭建內(nèi)容召回、內(nèi)容生成的線上撰寫
服務(wù)框架,打通從財務(wù)報告的非結(jié)構(gòu)化文檔解析,利用embedding
技術(shù)構(gòu)建財報知識庫,根據(jù)歷史研報進行高相關(guān)內(nèi)容召回,結(jié)合內(nèi)
容召回與大模型服務(wù),通過建設(shè)Prompt工程,打通大模型撰寫能力
鏈路。
5.智能營銷
結(jié)合金融業(yè)語料進行適應(yīng)性訓(xùn)練后,大模型可輔助生成營銷
話術(shù)和營銷文案,幫助客戶更快地獲取最新資訊和產(chǎn)品的信息。
同時,通過對話式營銷,大模型可優(yōu)化客戶參與度,提升服務(wù)的
效率與質(zhì)量,引導(dǎo)其做出決策。此外,隨著投資者數(shù)據(jù)、產(chǎn)品知
25
識和營銷文案的不斷積累,大模型技術(shù)可以從海量信息中檢索詞
條,并提煉整合,可針對特定客戶實現(xiàn)貼心、高質(zhì)量、有創(chuàng)意的
精準(zhǔn)營銷,快速生成個性化建議和推薦,并構(gòu)造相應(yīng)的圖文推廣,
進一步提升客戶轉(zhuǎn)化率和營銷效率,為客戶提供更加全渠道、個
性化、有溫度的金融服務(wù)。
專欄六智能營銷場景
平安銀行借助BankGPT優(yōu)秀的文案生成能力,針對不同客戶,批
量生成個性化營銷文案,從而更有針對性地提升客戶粘性和業(yè)務(wù)轉(zhuǎn)
化率,為營銷運營團隊提供支持。同時,平安銀行利用BankGPT的
自然語言理解能力,助力多媒體運營團隊實現(xiàn)自動化FAQ抽取功能。
民生銀行探索運用大模型技術(shù)賦能客戶意圖理解營銷場景,通
過搜索知識庫、產(chǎn)品庫、聊天記錄等,洞察客戶真實意圖,自動提
供廣告等營銷文案、自動生成個性化營銷內(nèi)容、自動提供各類分析
報告,提升營銷成功率。
平安保險通過大模型的自然語言交互、內(nèi)容生成等能力,智能
化分析并提取客戶需求,輔助生成保險產(chǎn)品營銷素材,并根據(jù)客戶
標(biāo)簽屬性提供針對該客群的產(chǎn)品推薦以及推薦理由相關(guān)話術(shù),基于
個人醫(yī)療歷史和分線因素,提供個性化保險建議和方案,有助于產(chǎn)
品精算人員制定針對性保險方案。
6.智能運維
金融機構(gòu)可以利用大模型生成技術(shù),實現(xiàn)智能運維分析、運
維知識獲取、網(wǎng)絡(luò)安全分析等,進一步提升運維效率。大模型具
26
備良好的語義搜索能力,在復(fù)雜的數(shù)據(jù)中準(zhǔn)確找到所需結(jié)果,助
力運維人員快速對接各類型的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),實現(xiàn)流程
自動化、智能檢索和內(nèi)部資料的輔助審核。止匕外,對于大模型還
可以輔助運維人員完成代碼攻防測試、明文檢測等安全檢測工作。
專欄七智能運維場景
上海銀行探索將大模型應(yīng)用于故障分析及解決等場景,結(jié)合歷
史生產(chǎn)事件解決工單、運維文檔或問答對等知識庫,當(dāng)故障發(fā)生時,
大模型能夠自動根據(jù)歷史解決經(jīng)驗及知識庫給出故障分析及解決方
案,從而為運維人員提供輔助支持,以提升事件解決效率。
7.智能風(fēng)控
風(fēng)險控制是金融業(yè)的核心要務(wù)。大語言模型的閱讀理解能力
可以輔助提示存在的法律風(fēng)險,降低人為疏漏概率并提升法官人
員工作效率。在大模型的通用能力基礎(chǔ)上融合金融行業(yè)的知識和
數(shù)據(jù)用于真?zhèn)魏蓑?、輿情分析等環(huán)節(jié),結(jié)合風(fēng)控數(shù)據(jù)模型,進行
風(fēng)險模擬與壓力測試,對可能發(fā)生的風(fēng)險事件作出預(yù)警,實現(xiàn)貸
前智能推薦、貸中全面風(fēng)控、貸后監(jiān)測預(yù)警全流程風(fēng)控管理。此
外,基于大模型的合規(guī)知識問答助手在金融合規(guī)場景中也發(fā)揮了
一定作用。
專欄八智能風(fēng)控場景
光大銀行基于大模型理解能力,探索大模型解讀法律法規(guī)政策
的可行性,基于業(yè)務(wù)問題快速定位政策文件并給出法律法規(guī)依據(jù)、
打造法律法規(guī)領(lǐng)域智能專家,輔助各業(yè)務(wù)場景快速把控政策、法規(guī)
27
風(fēng)險。
華夏銀行探索利用大語言模型技術(shù)疊加合規(guī)圖譜,以高質(zhì)量內(nèi)
外規(guī)數(shù)據(jù)為基礎(chǔ),以結(jié)構(gòu)化合規(guī)知識標(biāo)簽為輔助,利用大語言模型
語義理解、信息匯總和自然語句生成能力實現(xiàn)智能化合規(guī)知識問答
功能,降低合規(guī)知識查詢門檻。
平安保險運用大模型技術(shù),基于歷史數(shù)據(jù)和模擬數(shù)據(jù)進行風(fēng)險
模擬和壓力測試,評估產(chǎn)品設(shè)計的可靠程度和穩(wěn)定性,以便產(chǎn)品精
算人員更好地了解產(chǎn)品可能面臨的風(fēng)險和挑戰(zhàn),助力產(chǎn)品精算人員
制定相應(yīng)保險策略。
8.智能投顧
圍繞財富管理專業(yè)知識對大模型進行增量訓(xùn)練,構(gòu)建基于大
模型的投資顧問助手,提供圍繞個體的全生命周期智能投顧服務(wù),
實時監(jiān)測市場動態(tài),調(diào)整投資策略,并根據(jù)客戶的風(fēng)險偏好、收
益目標(biāo)和資產(chǎn)狀況,為客戶提供個性化的投資建議和組合優(yōu)化,
大幅提升服務(wù)效率和服務(wù)體驗。
專欄九智能投顧場景
國泰君安證券運用大模型的理解分析能力,進行金融資訊熱點
話題提取和!tl納,對相關(guān)信息做正面/負(fù)面消息的評分和整理,生成
每天/周/月的熱點話題榜單,既能實時跟蹤行業(yè)網(wǎng)站熱點,又能回
顧過去一段時間的熱點話題,基于榜單排名走勢預(yù)測股市熱點信息。
大模型在提升金融服務(wù)效率和體驗、降低金融風(fēng)險和成本、
創(chuàng)新金融產(chǎn)品和模式等方面有著顯著作用。大模型在金融領(lǐng)域的
28
應(yīng)用場景具有較大空間,隨著大模型與各個金融場景的深度融合,
將進一步提升我國金融業(yè)的智能化水平,進一步深入推動金融機
構(gòu)數(shù)字化轉(zhuǎn)型。
(四)應(yīng)用趨勢
一是金融機構(gòu)將采用先內(nèi)后外、從易到難、場景遷移的方式
落地大模型金融應(yīng)用。由于目前大模型直接對客難度較大、可控
性不強,金融機構(gòu)主要對內(nèi)應(yīng)用大模型能力,待技術(shù)逐漸成熟,
可以考慮對外輸出。此外,金融機構(gòu)也將優(yōu)先選擇風(fēng)險等級低、
適配應(yīng)用難度小、業(yè)務(wù)提升效果明顯的場景進行大模型試點落地,
逐步將試點應(yīng)用場景遷移到真實、復(fù)雜的業(yè)務(wù)場景,實現(xiàn)大模型
對金融產(chǎn)品和服務(wù)的全面升級。
二是大小模型協(xié)同進化是大模型發(fā)展的一個必然趨勢。大模
型對應(yīng)場景多為開放式和主觀型問題,測重推理和創(chuàng)造,也可被
用于作為連接多個具體任務(wù)模型的通用接口,而小模型對應(yīng)場景
多為封閉式問題,不涉及過多主觀推斷,答案的正確性可以被清
晰驗證,因此在某些特定場景仍具有更好的表現(xiàn)。大模型對于中
小模型并非是替代或?qū)α⒌年P(guān)系,兩者應(yīng)相互協(xié)作、互相搭配,
由大模型向邊、端的小模型輸出模型能力,而小模型負(fù)責(zé)實際的
推理與執(zhí)行,同時向大模型反饋算法與執(zhí)行成效,使得大模型的
能力持續(xù)強化。金融機構(gòu)將加強研究和推進大小模型協(xié)同、生成
式技術(shù)與傳統(tǒng)人工智能技術(shù)協(xié)同,將大模型連接到傳統(tǒng)軟件,提
升行業(yè)整體智能化水平。
29
三是多模態(tài)金融大模型的發(fā)展與應(yīng)用仍有較大潛力。大模型
生成效果的提升依賴于垂直場景系統(tǒng)化程度和高質(zhì)量數(shù)據(jù)。金融
業(yè)具備專業(yè)領(lǐng)域知識庫,多年來沉淀了大量格式多樣的優(yōu)質(zhì)業(yè)務(wù)
數(shù)據(jù)。運用多模態(tài)技術(shù)實現(xiàn)知識的遷移、表示、對齊和推理,使
得大模型能更好地構(gòu)建金融領(lǐng)域內(nèi)外部生態(tài)系統(tǒng),助力金融科技
創(chuàng)新和金融業(yè)務(wù)賦能,為金融機構(gòu)提供更多智能化、個性化的服
務(wù)和決策支持,同時也為客戶和市場參與者帶來更好的體驗和更
穩(wěn)健的金融環(huán)境。
四是AIAgent未來可能推動人工智能成為金融業(yè)信息基礎(chǔ)
設(shè)施。AIAgent是有能力主動思考和行動的智能體,以大模型
為大腦驅(qū)動,能夠自主感知環(huán)境、形成記憶、規(guī)劃決策、使用工
具并執(zhí)行復(fù)雜任務(wù),甚至與其他Agent合作實現(xiàn)任務(wù)。盡管多智
能體的發(fā)展仍面臨較大困境,但隨著算力支撐和技術(shù)研究的不斷
演進,AIAgent將在各行業(yè)發(fā)揮強勁動力,尤其在與各行業(yè)緊
密相連的金融業(yè),更全面地實現(xiàn)人機融合,為金融機構(gòu)提質(zhì)增效,
創(chuàng)造更深度的價值。
四、大模型在金融業(yè)應(yīng)用面臨的風(fēng)險與挑戰(zhàn)
(一)金融應(yīng)用規(guī)范與指南亟需完善
金融業(yè)作為強監(jiān)管行業(yè),在政策方面一直遵循著高標(biāo)準(zhǔn)和嚴(yán)
要求。我國已相繼發(fā)布《生成式人工智能服務(wù)管理暫行辦法》《網(wǎng)
絡(luò)安全標(biāo)準(zhǔn)實踐指南——生成式人工智能服務(wù)內(nèi)容標(biāo)識方法》
30
《生成式人工智能服務(wù)安全基本要求》(征求意見稿)等文件,
對大模型在通用領(lǐng)域的應(yīng)用進行了合理的約束和引導(dǎo),但是針對
大模型在金融領(lǐng)域的應(yīng)用尚且缺少可實施落地的標(biāo)準(zhǔn)規(guī)范和指
南,對應(yīng)用過程中的權(quán)責(zé)界定尚不明晰,缺少對生成內(nèi)容的問罰
機制及大模型廣泛應(yīng)用后可能存在的無序商業(yè)行為的監(jiān)管機制。
此外,針對大模型訓(xùn)練和推理的AI算力基礎(chǔ)設(shè)施、行業(yè)語料庫
標(biāo)準(zhǔn)化建設(shè)也較為欠缺。
(二)金融應(yīng)用場景缺少范式
大模型選型、架構(gòu)調(diào)整設(shè)計、技術(shù)驗證等環(huán)節(jié)過程復(fù)雜,金
融機構(gòu)缺乏大模型技術(shù)融合場景落地的方法論,對大模型的能力
邊界認(rèn)知不足,尚未明確大模型適合哪些業(yè)務(wù)場景、是否有必要
替換傳統(tǒng)的AI設(shè)備、何時適合落地,尚未健全大模型應(yīng)用創(chuàng)新
風(fēng)控管理機制,尚未有典型的落地案例可以向行業(yè)規(guī)?;茝V。
大模型支撐多個場景或服務(wù)的行業(yè)應(yīng)用,其測評指標(biāo)非常復(fù)雜,
測試數(shù)據(jù)集設(shè)計構(gòu)建與更新維護難度大、成本高,尚且缺少一個
覆蓋面廣、公允度高、滿足不同場景和任務(wù)特征的大模型金融應(yīng)
用及其風(fēng)險治理的評估方法或指標(biāo)體系,致使金融機構(gòu)進行大模
型選型及評估存在較大困難,阻礙了大模型金融場景應(yīng)用進程。
大模型需要提示工程相關(guān)的內(nèi)置模板,與原有的機器學(xué)習(xí)、深度
學(xué)習(xí)等模型工作方式有很大差別,也增加了相關(guān)人員的工作范度。
此外,大模型金融應(yīng)用需要與現(xiàn)有系統(tǒng)和業(yè)務(wù)流程進行集成,需
要跨組織、跨部門、跨團隊協(xié)作,組織能力面臨挑戰(zhàn)。
31
(三)高質(zhì)量金融訓(xùn)練數(shù)據(jù)欠缺
數(shù)據(jù)是大模型訓(xùn)練的基礎(chǔ),為了切實解決金融業(yè)務(wù)問題,需
要大量高質(zhì)量、多領(lǐng)域的金融數(shù)據(jù)基于業(yè)務(wù)屬性對大模型進行增
量訓(xùn)練。金融領(lǐng)域知識存儲形式繁多,包括影像件、PDF、
Excel等多種格式,需要通過分類、清洗、問答數(shù)據(jù)集梳理等大
量前期處理及后期更新維護工作,針對各種業(yè)務(wù)難點、要點問
題的解答還需要嗖集大量專家經(jīng)驗,以保持大模型的準(zhǔn)確性和
有效性,而這會耗費大量人力物力。同時,大模型訓(xùn)練迭代需
要一定時間,致使大模型對時事的了解有限。金融數(shù)據(jù)流通仍
在探索階段,而單一金融機構(gòu)掌握的數(shù)據(jù)資源較為有限,一定
程度上影響了大模型金融應(yīng)用效果。金融數(shù)據(jù)敏感性高,在數(shù)
據(jù)分級分類管理、數(shù)
據(jù)脫敏清洗、防止數(shù)據(jù)偏見和濫用等環(huán)節(jié)也存在難題。
(四)訓(xùn)練算力支撐普遍不足
大模型訓(xùn)練和推理需要足夠的算力支撐,在高端GPU芯片斷
供的背景下,金融機構(gòu)對中高端AI算力的需求存在較大缺口。
由于金融數(shù)據(jù)敏感度高,金融機構(gòu)普遍選擇私有化部署大模型,
而構(gòu)建、訓(xùn)練、優(yōu)化大模型需要高性能的計算資源和大量的存儲
資源,硬件設(shè)備的采購和維護需要高昂的資金投入,給金融機構(gòu)
帶來較大的成本壓力。大模型的訓(xùn)練與推理對AI芯片的要求有
所不同,當(dāng)前我國AI芯片能較好地支撐推理,而在訓(xùn)練上仍與
國際領(lǐng)先水平有明顯差距,存在計算能力不足、芯片制程工藝有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電子商務(wù)平臺賣家與買家交易責(zé)任豁免合同
- 生態(tài)農(nóng)業(yè)開發(fā)合同
- 2024年智能制造項目研發(fā)合作合同
- 電離子手術(shù)治療機行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報告
- 水果購銷合同
- 2025年醫(yī)療儀器項目可行性研究報告-20250103-025105
- 2025年數(shù)棒行業(yè)深度研究分析報告
- 2025年中國罐蒸布行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 2025年中國裝飾旗行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 機械全鋼保險柜行業(yè)市場發(fā)展及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 人教版《道德與法治》四年級下冊教材簡要分析課件
- 2023年MRI技術(shù)操作規(guī)范
- 辦公用品、易耗品供貨服務(wù)方案
- 自行聯(lián)系單位實習(xí)申請表
- 醫(yī)療廢物集中處置技術(shù)規(guī)范
- 媒介社會學(xué)備課
- 2023年檢驗檢測機構(gòu)質(zhì)量手冊(依據(jù)2023年版評審準(zhǔn)則編制)
- 三相分離器原理及操作
- 新教科版五年級下冊科學(xué)全冊每節(jié)課后練習(xí)+答案(共28份)
- 葫蘆島尚楚環(huán)??萍加邢薰踞t(yī)療廢物集中處置項目環(huán)評報告
- 全國物業(yè)管理項目經(jīng)理考試試題
評論
0/150
提交評論