




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
目錄
一、概述.............................................................1
二、大模型技術與產品發(fā)展現狀........................................2
(一)工程化應用主要環(huán)節(jié)與技術..................................2
(二)國內外主要產品情況.........................................9
三、大模型在金融業(yè)應用與探索實踐...................................10
(一)技術路線..................................................10
(二)使用方式..................................................14
(三)應用場景..................................................17
(四)應用趨勢..................................................29
四、大模型在金融業(yè)應用面臨的風險與挑戰(zhàn)............................30
(一)金融應用規(guī)范與指南亟需完善...............................30
(二)金融應用場景缺少范式......................................31
(三)高質量金融訓練數據欠缺...................................32
(四)訓練算力支撐普遍不足......................................32
(五)算法可信度和安全性有待提升...............................33
五、多措并舉提升大模型金融業(yè)應用水平...............................34
(一)加強金融應用的指導與管理.................................34
(二)有序推動金融應用場景落地.................................34
(三)積極構建高質量金融數據集.................................35
(四)產用協(xié)同共筑AI算力基礎設施...............................35
(五)完善算法優(yōu)化與風險管控體系...............................36
附錄................................................................38
案例一:郵儲銀行基于大模型的智能知識問答........................38
案例二:某股份制銀行基于騰訊云TI-OCR大模型單據處理............41
案例三:某股份制銀行基于騰訊云金融大模型的智能客服.............45
案例四:某股份制銀行基于中科可控的金融大模型服務平臺...........48
案例五:北京銀行AIB金融智能應用平臺............................52
案例六:上海銀行基于開源大模型的智能辦公助手...................55
案例七:國信證券輔助運營人員服務客戶場景.......................57
案例八:螞蟻金融大模型應用-支小寶2.().....................................................59
一、概述
近年來,以人工智能為代表的新一代信息技術加速應用,特
別是基于大模型、大數據、大算力的ChatGPT的發(fā)布,標志著人
工智能技術取得里程碑式突破,推動科技創(chuàng)新進入新階段。隨著
大模型技術的迅猛發(fā)展和場景價值的不斷涌現,該技術或將重塑
多個行業(yè)的工作方式和格局。
為穩(wěn)步推動生成式人工智能在各行各業(yè)的有序應用,我國陸
續(xù)出臺一系列政策法規(guī)和管理辦法,《國務院2023年度立法工
作計劃》將人工智能法納入了國家立法計劃,《生成式人工智能
服務管理暫行辦法》提出了促進生成式人工智能技術發(fā)展的具體
措施,《網絡安全標準實踐指南——生成式人工智能服務內容標
識方法》指導生成式人工智能服務提供者等有關單位做好內容標
識工作,《生成式人工智能服務安全基本要求》(征求意見稿)
給出了生成式人工智能服務在語料安全、模型安全、安全措施、
安全評估等方面的基本要求,《全球人工智能治理倡議》主張建
立人工智能風險等級測試評估體系,不斷提升人工智能技術的安
全性、可靠性、可控性、公平性。
金融業(yè)是數字化、智能化的先行者,有望成為大模型技術落
地的最佳領域之一?!督鹑诳萍及l(fā)展規(guī)劃(2022-2025年)》明
確提出要抓住全球人工智能發(fā)展新機遇,以人為本全面推進智能
技術在金融領域深化應用,強化科技倫理治理,著力打造場景感
1
知、人機協(xié)同、跨界融合的智慧金融新業(yè)態(tài)。金融機構正在積極
探索大模型在智能客服、智能辦公、智能研發(fā)等業(yè)務場景的應用,
提升智能技術的可獲得性,助力金融服務降本增效。
二、大模劈支術與產品發(fā)展現狀
(-)工程化應用主要環(huán)節(jié)與技術
大模型相較于中小模型,具有更好的表示能力、泛化能力、
學習能力和語義表達能力,但其參數量巨大、訓練所需數據量和
算力資源多、部署運營更為復雜,工程化落地涉及數據構建、模
型算法、模型訓練、模型壓縮與加速、模型評測、模型運營和安
全可信等多個復雜環(huán)節(jié)。
1.數據構建
訓練大模型需要海量數據做支撐,高質量數據集的構建和處
理對于大模型的性能表現至關重要。訓練數據集一般需要涵蓋多
種類型、多種領域的數據來源,并配以相應的數據預處理過程。
根據數據來源不同,大模型的訓練數據主要可分為公開數據、商
業(yè)數據和私有數據。大模型參數量需耍跟訓練數據集大小相匹配,
簡單堆砌參數量并不能無限度地提升其性能。通過提升訓練數據
集質量和內容豐富度、加入一些特定數據集、合理利用外掛知識
庫資源、合理配置各種類型數據配比等方式,可以有效提升大模
型的整體性能,減少模型幻覺,并加快模型的收斂速度。
高質量的數據預處理是提升模型表現和安全可靠性的重要
2
編碼到解碼三大類,其主要特點和代表性模型如表1所示。
表1大模型結構主要分類及特點
架構編碼器解碼器編碼器-解碼器
模型具備“雙向”注意力,模型只具備“單向”注意力,模型同時使用編碼器和解
可使用上下文信息來進行預即基于前面的單詞來預測后碼器兩個部分,適用于圖
測,最適合理解類任務,如續(xù)單詞,最適合生成類任務,繞給定愉入產生對應輸出
特點文本分類、命名實體識別、如文本創(chuàng)作、對話問答等;的任務,如翻譯、摘要,
閱讀理解等;模型參數一般模型參數量相對較大,實用以及一些有很強序列特征
偏小,預訓練后需基于具體性高,計算高效、內存占用的任務,如語音識別、圖
任務進行Fine-tuning?少、泛化能力強.像描述生成等.
微衣量BERT、RoBERTavDeBERTa等。GPT系列、PaLM.OPT.T5、ChatGLMxBART、
LLaMA等。ERNIE3.OxM6等.
當前,基于Transformer解碼器結構訓練的大模型成為了自然
語言處理領域的主流方案。在此影響下,語音、視覺以及跨模態(tài)
等領域的大模型也嘗試應用類似模型架構,并取得了較好效果,
比如語音領域的OpenAlwhisper和DaLL-E等,圖像生成領域的
StableDiffusion開源模型等。
3.模型訓練
大模型訓練涉及預訓練和微調等重要環(huán)節(jié)。預訓練的主要目
的是利用大量無標簽的數據,訓練出一個有能力捕捉到數據中隱
藏的底層結構和模式的模型,這一階段的模型通常被稱為“基座
模型由于大模型的參數量和訓練數據量的急劇增長,單個計
算設備的算力已經不足以支撐模型訓練。當前,一般通過分布式
訓練來解決預訓練過程中的海量計算任務和高內存資源等問題,
但也面臨著計算墻、內存墻和通信墻等挑戰(zhàn)。目前解決分布式訓
練的關鍵技術是并行化,將任務分割并分配到多個處理器或設備
4
上,以便同時完成計算,更有效地利用計算資源,減少訓練所需
時間。微調的主要目的是在預訓練模型的基礎上,通過有監(jiān)督微
調、強化學習等方式,進一步提升模型在下游任務中的表現,使
得模型輸出更符合人類期望。有監(jiān)督微調,又稱為指令微調,通
過使用有標注的特定任務數據對預訓練模型進行微調,從而使得
模型具備遵循指令的能力。早期的微調算法會涉及到預訓練模型
的全量參數更新,計算成本較高,目前已提出了多種參數高效微
調任務的方法以節(jié)約計算成本,如LoRA、Adapter>P-tuning等。
強化學習技術是基于人類反饋,進一步調整模型的行為。其數據
集一般由經過人工評估的反饋數據構建,這些數據反映了模型的
輸出與期望輸出之間的差異,基于Q-learning、深度Q網絡或
近端策略優(yōu)化等強化學習算法進行訓練。
大模型訓練場景對中高端AI芯片需求旺盛,需要統(tǒng)籌規(guī)劃
CPU芯片、GPU芯片、服務器、網絡、存儲、冷卻、算力運營
服務、AI應用服務平臺等多個方面。在金融機構通用服務器
集群基礎上,構建基于異構芯片體系的AI算力資源池,實現對
金融
機構現有AI算力資源的統(tǒng)一調度,保障大模型訓練的算力支撐。
4.模型壓縮與加速
模型壓縮是指通過各種技術手段來減小機器學習模型的大
小、復雜度和計算量,加速推理過程并減少內存使用,以便在資
源受限的設備上部署和運行,如移動設備、邊緣設備等。目前,
模型壓縮技術主要包括知識蒸儲、剪枝和量化等解決方案。知識
5
蒸像是一種訓練小型模型以模仿大型模型行為的方法,保留了大
型模型主要功能的同時降低了計算和存儲需求,但通常需要一個
預先訓練好的大型模型,且性能上會有一定損失。剪枝是一種去
除模型中不重要或冗余參數的方法,一般可以在不顯著影響模型
性能的情況下減小模型的大小和計算需求,但需要確定哪些參數
是不重要或冗余的,以選擇合適的剪枝策略。量化是一種減少模
型參數和運算中數字精度以降低模型的存儲需求和計算復雜度
的技術,可適用于多種模型和任務,并顯著減少存儲和計算需求,
但可能會造成一定程度的精度損失,且有時需要特定的硬件支持。
模型加速主要研究加速模型的訓練和推理過程,伴隨模型參
數增長,正逐漸成為研究熱點。訓練環(huán)節(jié),針對計算量、通信、
內存可以進行一系列優(yōu)化,例如使用梯度累積或梯度壓縮可以優(yōu)
化通信策略、使用半精度浮點數可以節(jié)省內存等。推理環(huán)節(jié),優(yōu)
化手段包括使用GPU、TPU和ASIC等芯片的專用硬件加速器加
速計算過程、使用并行化和分布式推理提高推理吞吐量并減少
推理時間、使用緩存和預取策略降低內存訪問延遲、在邊緣設
備上進行推理減少與服務器端的通信延遲、結合模型壓縮技術
加速推理過程等。現階段AI應用中,大量的算法、模型、開發(fā)
框架、軟件等開發(fā)都基于通用加速卡架構,在考慮硬件算力的
基礎上,要
結合加速芯片軟件棧及開發(fā)工具鏈等配套的軟件生態(tài)能力。
5.模型評測
模型評測在機器學習和自然語言處理領域扮演著至關重要
6
的角色。大模型具有更強大的泛化能力,可以處理多種任務,但
大模型的輸出可能存在不真實、不準確、不專業(yè)等問題,因此在
大模型上線或升級時,有必要對其進行較為全面、充分的評測,
幫助模型迭代優(yōu)化。
大模型評測已成為行業(yè)發(fā)展熱點問題,目前國內外相關評測
層出不窮。據初步統(tǒng)計,目前行業(yè)內關于大模型基準測試或特定
任務的測試數據集已多達200余項,主要推出機構可以大體分為
學術界、產業(yè)界、媒體、社區(qū)以及智庫等。其中一些代表性的評
估基準包括HELM、MMLU、C-EVAL、BigBench、HumanEval>
AGIEVal、SuperCLUE、OpenLLM等??傮w來看,大模型評測
仍處于早期階段,如何構建出全面、充分且能伴隨大模型能力
增長不斷迭代的
大模型評測基準,仍面臨較大挑戰(zhàn)。
6.模型運營
大模型運營包括工程化、部署、管理、調試、維護和監(jiān)控等
多個方面,旨在確保大模型在生產環(huán)境中穩(wěn)定運行,持續(xù)適應變
化,滿足用戶需求,保障數據安全。工程化方面,模塊化和面向
對象的編程可以都助組織代碼,使其更具可讀性和可重用性,如
將數據預處理、模型結構、訓練循環(huán)和評估功能分為不同的模塊
或類,同時版本控制系統(tǒng)和自動化測試技術有助于及時跟蹤代碼
的修改歷史,確保每個功能模塊和整個系統(tǒng)穩(wěn)定運行。部署方面,
要將模型轉化為適用于實際環(huán)境的格式,包括序列化、壓縮、硬
件優(yōu)化以及容器化工具的使用,以確保模型在不同環(huán)境中的一致
性。管理方面,使用身份和訪問管理工具可以控制資源的訪問權
限,運用數據管理工具跟蹤數據集的變化。調試方面,使用可視
化工具和日志記錄有助于監(jiān)測模型運行時的詳細信息,這對于診
斷問題和優(yōu)化性能至關重要。維護方面,要制定明確的更新策略
以適應新數據和業(yè)務需求,同時要建立回退機制,確保出現問題
時能夠快速回退到穩(wěn)定版本。監(jiān)控方面,通常包括性能監(jiān)控和異
常檢測,基于實時跟蹤和警報設置,確保模型的可靠運行。
7.安全可信
一般而言,大模型的安全可信會從多個維度進行考量和評估,
包括但不限于:可靠性,即大模型的輸出內容是真實的、一致的
等;內容安全性,即大模型的輸出應避免涉黃、涉暴等非法內容,
并能遵循當地的道德準則和法律規(guī)定等;公平無偏性,即大模型
輸出應避免偏見、刻板印象、不公平等情況;魯棒性,即大模型
在面對投毒攻擊、提示詞攻擊等惡意行為或者意外情況時,依然
能夠產生穩(wěn)定和可靠的輸出結果;可解釋性,即大模型能夠解釋
其推理過程并能透明展示其內容生成方式等;數據安全和隱私保
護,即對訓練和推理大模型的數據中可能包含的敏感信息進行相
應的脫敏和保護處理等。
為有效提升大模型的安全可信水平,需要在大模型開發(fā)和運
營的全流程采取相應的安全措施,包括但不限于:數據處理環(huán)節(jié),
建立高質量的訓練數據集,有效去除有毒或錯誤信息、注重訓練
數據的分布比例以避免產生偏見、對訓練數據中的敏感數據進行
8
脫敏等;模型開發(fā)階段,引入對齊技術等讓大模型的輸出更符合
人類價值觀;模型上線前,需對大模型的安全可靠水平進行充分
評測,如紅隊對抗測試等;大模型對客提供服務時,可以引入安
全圍欄技術,既能幫助大模型攔截外界的惡意提問,又能對生成
內容進行風險過濾和攔截;此外,模型運營過程中,還需要建立
持續(xù)的監(jiān)控和定期審核機制,以及時發(fā)現異常情況并持續(xù)迭代優(yōu)
化模型。
(二)國內外主要產品情況
自ChatGPT引起業(yè)界高度關注后,國內外科技巨頭紛紛加大
了對大模型的研發(fā)和投入,以模型為核心,圍繞模型全生命周期
設計、生產并提供產品、技術和服務,推動“數據、模型、服務、
場景”的AI生產力閉環(huán)連接和迭代優(yōu)化,為大規(guī)模、標準化的人
工智能創(chuàng)新提供技術支撐。在此背景下,大模型相關產品和服務
迎來了爆發(fā)式增長。此外,許多大模型相關的開源項目涌現,為
研究和創(chuàng)新提供了便利。這些開源項目主要朝著兩個方向發(fā)展:
一是相對ChatGPT更經濟的、平民化的替代品,二是圍繞著大模
型建立的外圍應用工具。
9
I
新化,服聯(lián)三留
更能力融研用停
所能
究智金學采都
研和理動產般大
化推推、一,
G您型
息和步用構品
信轉
化成一應機產
融線用
金字生進型融
間、商
:時數將模金
源踐習,大購
展構型
來發(fā)實學力源大采
據品索機、未
數產能開。
探融解化括購尚
型金
模與理泛包采遍0
大用是的務線型普。1
型應直備任路模構段
典一
外業(yè)具多型大機階
用y
內型的選用融試e
融vr
國應u
1模越術商金測S
金的CM
圖大卓線技和小L
在O/x
術,和。路的制中Po
BI
型A
技域量級術型見研,和C
GooggU
模能領容升技選常型式報R/
m
大)術o
智心識化型模模匯c.
b
-u
、工核知能技模大的、h
(.ti
1g
三人的的智大新行研/
:s
級p
觀的創(chuàng)并調t
升可務合路在h
一是開源大模型應用。開源大模型是指通過開源方式發(fā)布和
共享的大模型,其源代碼和相關資料對公眾開放,適用于具備一
定技術能力的開發(fā)者、研究機構以及對模型定制和二次開發(fā)有需
求的機構。國內外的大模型有近一半選擇了開源的方式,Bloom.
GLM、Llama是目前國內外流行度較高的開源大模型。金融機構
選擇開源大模型的前提是能夠依靠自身或者第三方公司進行大
模型應用研發(fā),且具備后期維護、迭代更新的能力。盡管開源大
模型已具備較好的實踐效果,但仍面臨數據安全合規(guī)風險、開源
協(xié)議風險等挑戰(zhàn)??傮w而言,金融機構對于開源模型的采用普遍
持謹慎態(tài)度,但在前期探索階段通常會采用開源大模型進行測試、
研究,同時將其與商用大模型的應用效果進行比對。
二是產學研聯(lián)合創(chuàng)新大模型研制。金融機構、科技企業(yè)、科
研院所、高等院校等通過合作,共享知識、技術或資源,發(fā)揮各
自優(yōu)勢,推動技術創(chuàng)新和產業(yè)發(fā)展。產學研聯(lián)合創(chuàng)新有助于金融
機構在大模型創(chuàng)新應用初期推動特定試點場景快速落地。一方面,
可以在一定程度上助力金融機構加速科技創(chuàng)新及數字化轉型,打
造更好的產品和服務,增強行業(yè)競爭力。另一方面,可以減少金
融業(yè)對國外技術和產品的依賴,加快國產化步伐,提升行業(yè)安仝
可控能力。
專欄一產學研聯(lián)合創(chuàng)新大模型研制
工商銀行與清華、鵬城實驗室、華為等高等院校、科研院所、
科技企業(yè)開展大模型聯(lián)合創(chuàng)新。
11
交通銀行與華為、科大訊飛共建了聯(lián)合創(chuàng)新實驗室,推進大模
型及算力集群技術、人工智能等先進技術在金融領域的落地應用。
北京銀行與火山引擎、華為、中科院自動化所、中科聞歌共建
聯(lián)合創(chuàng)新實驗室,圍繞金融大模型體系構建、前沿金融科技應用等
領域開展合作創(chuàng)新,共同探索銀行智能化技術的最佳實踐。
三是商用大模型采購。眾多國內外商用大模型正在逐步推廣
應用。相較于開源大模型,商用大模型可以為金融機構提供更加
工程化、易用性強、服務有保障的解決方案。
金融機構在大模型技術選型時需要綜合考慮大模型對業(yè)務
質量和人員效率的提升效果、大模型持續(xù)創(chuàng)新能力、大模型運行
時的穩(wěn)定性和安全性等多個方面。同時,金融機構還需結合自身
業(yè)務特點和實力情況,對資金、人員、配套工具產品完備性等因
素進行全面考量,以選擇合適的大模型解決方案。此外,要建設
并維護內部統(tǒng)一的大模型資源庫,并在此基礎上建立大模型應用
開發(fā)平臺,更好地充分利用業(yè)界多種領先的通用大模型。
2.部署方式
為制定合適的部署方案,金融機構首先需要確定需求和目標,
其次要根據業(yè)務場景和技術要求,選擇合適的硬件和軟件環(huán)境,
確保能夠支持大模型的運行和優(yōu)化。針對不同應用場景,金融機
構探索采用不同部署方式以更合理地應用大模型。根據部署環(huán)境
的不同,可以將大模型部署方式分為私有化部署、行業(yè)云部署和
公有云部署等。
12
一是私有化部署。金融機構將大模型部署于自有服務器,由
金融機構負責維護和管理。私有化部署可以提供更好的數據安全
保障,大大減少信息安全隱患,且一般具有較好的應用效果,尤
其是對于需要運用內部語料訓練的金融業(yè)務場景,可以根據金融
機構的需求進行定制和優(yōu)化模型,并隨時增減資源。但是,這種
部署方式往往會產生高昂的成本,需要金融機構投入大量的資金、
人力來建設和維護。
二是行業(yè)云部署。由行業(yè)內起主導作用或掌握關鍵資源的組
織建立和維護,以公開或半公開的方式,在確保數據安全的前提
下,向行業(yè)內部或相關組織提供云平臺服務。將大模型部署在金
融云,既能在一定程度上滿足數據安全可控的要求,又兼?zhèn)涑杀?/p>
低、擴展性強等優(yōu)勢。中小型金融機構對行業(yè)云部署的需求更為
迫切。
三是公有云部署。金融機構通過標準接口調用部署在公有云
上的大模型,由云服務提供商負責維護和管理,具備更低的成本、
更高的靈活性和可擴展性。然而,由于金融機構無法完全掌控其
數據的存儲和管理,使用這種部署方式可能面臨數據安全風險,
因此該部署方式可能更適用于互聯(lián)網類的金融企業(yè)或非敏感類
業(yè)務場景。
鑒于個人隱私保護和數據不出域等相關要求,私有化部署仍
是金融機構部署大模型的主要選擇方式。私有化部署使得金融機
構得以保留對數據和系統(tǒng)的完全控制權,但由于大模型訓練和推
13
理對算力及配套基礎設施有較高要求,該部署方式更適用于大中
型金融機構,對于中小型金融機構實現難度較大。對于不涉及數
據保密性的場景,比如證券公司基于公開數據生成投資策略及研
報撰寫,行業(yè)云或公有云部署具有一定優(yōu)勢。目前,國外已有
API市場化采購服務,且價格低廉。隨著私有化部署成本不斷提
高,中小銀行、證券公司、基金等中小金融機構,迫切需要通過
行業(yè)云或公有云來降低大模型金融應用的門檻。
(二)使用方式
大模型具備出色的自然語言理解能力,但因其在金融垂直領
域的知識儲備不足,回答的專業(yè)性難以滿足要求。金融機構需要
將金融領域已有的數據庫、知識圖譜等專業(yè)知識系統(tǒng),與大模型
的意圖理解能力、語言生成能力和場景掌控能力進行對接,實現
大模型的行業(yè)個性化和機構定制化。然而,大模型技術復雜度高、
參數規(guī)模大、研發(fā)投入高,特別是需要大量的數據標注和人工反
饋等工程化投入,從頭自研大模型的難度非常大。因此,金融機
構目前主要采用API調用、提示工程、模型微調和二次訓練等應
用方式,以降低大模型的應用研發(fā)門檻,解決場景數據少、模型
精度低等問題,推動大模型快速落地測試。比如,農業(yè)銀行利用
有監(jiān)督的模型微調和強化學習等技術,融入行內知識庫數據,訓
練、收斂出能理解行內知識的基礎模型,目前已具備行業(yè)知識問
答能力。中信證券將特定問題及與其相關內部文檔材料作為問答
輸入,既可獲得較好的應用效果,又避免了二次訓練的高昂成本。
14
1.API調用
API調用是指通過API接口調用大模型,實現圖像生成、文
本生成、語音合成等功能。公有云大模型大多采用以API接口的
方式提供服務。該方式使得金融機構在大模型探索應用初期能夠
快速將大模型在項目中進行測試驗證,且成本低廉。然而,API
調用的方式不僅需要完成一系列的技術整合和接口開發(fā),也面臨
如何在不降低模型準確性的前提下保障數據安全和隱私性、如何
高效處理海量數據、生成內容可控性和魯棒性較差等問題,適合
直接落地的金融業(yè)務場景很少。一般來說,金融機構應用API調
用方式對大模型產品進行測試后,會根據測試結果結合該模型在
其他領域的表現進行綜合評價,判斷是否進一步選擇微調或二次
訓練的方式進行優(yōu)化。
2.提示工程
基礎預訓練大模型內含知識豐富,但很多潛能尚未被激發(fā),
如何有效引導大模型來完成特定任務存在挑戰(zhàn)。提示工程通過優(yōu)
化提示語句激發(fā)大模型所具備的潛在能力,提示語通常是一段文
本,用于構建問題或對任務進行恰當表述,以便大模型基于內在
知識生成合適答案,可通過少樣本、思維鏈路等方式實現。提示
工程并不改變模型參數,對于可指令微調的大模型來說,構造提
示語的成本相對較低,大部分成本轉嫁為標注成本,通過設計好
的提示語來調優(yōu)任務效果。
15
3.模型微調
基礎預訓練大模型具備較好的通用性知識,但實際應用中,
每個具體場景都有其獨特的需求和流程,仍需優(yōu)化模型以提升應
用效果和價值。模型微調是優(yōu)化模型效果和性能并提高準確性的
重要手段,也是當前金融機構試用大模型的最常用手段。當大模
型缺乏垂直領域知識時,通過模型微調技術,以較低的成本即可
明顯提升針對特定任務的應用效果。一般來說,當測試結果良好
時,會優(yōu)先選擇模型微調技術提升應用效果。
4.二次訓練
二次訓練指在已有模型的基礎上,使用新的數據集對模型進
行重新訓練,從而提高模型的性能和應用效果。二次訓練通常需
要對模型參數進行修改,以適應新數據集的特點。相較于微調,
二次訓練會產生高昂的數據、算力、人力以及時間成本,但也可
以實現更好的效果和更廣泛的場景化應用。一般來說,大型金融
機構因具備海量垂直領域數據基礎,在微調技術難以實現期望達
到的應用效果時,可以選擇該方式高度定制化模型以提升模型的
泛化能力和場景化應用能力。
此外,金融機構還采用大模型融合知識庫、知識圖譜等組件
的方式,通過引入領域向量庫檢索、數據增強等技術,結合大模
型關鍵超參優(yōu)化,形成不同模型針對不同行業(yè)和領域的參數體系,
精準匹配業(yè)務需求,使得大模型回答結果較為可信。
16
(三)應用場景
大模型在金融領域的應用前景廣闊,趨動AI從勞動密集向
腦力密集應用,金融機構已經將大模型試點應用于智能客服、智
能辦公、智能研發(fā)、智能投研等多個金融業(yè)務場景,但從能用到
好用、易用,再到規(guī)?;瘧眠€任重道遠?;诋斍敖鹑跈C構主
要場景探索實踐來構建金融行業(yè)大模型應用場景全景圖。
代科夕或
智與“全按口設計
能代5?謾
與注何
研
發(fā)
智
智
能
能
投
營
顧
銷
生成
數據來源:金融信息化研究所
圖2金融行業(yè)大模型應用場景全景圖
1.智能客服
傳統(tǒng)的智能客服的服務方式主要是先識別用戶意圖,再匹配
到特定的對話模板,是一個非常龐雜的配置過程,特別是要確保
所有渠道對于相似問題的回答保持一致。這種方式不僅維護成本
高,維護難度大,而且難以應對復雜多變的自然語言對話,用戶
體驗較差。金融機構普遍認為大模型雖然仍不具備直接面客的能
力,但可以在通用大模型的基礎上,疊加金融客服領域的數據和
專業(yè)經驗,經過垂直領域定向訓練后,客服機器人可以綜合考慮
用戶提示語和用戶習慣,準確識別用戶意圖,作為客服助手協(xié)助
客服人員開展客戶的陪伴和關懷,升級真誠話術,提供24小時
的多語言支持,有效提升用戶對話體驗,提高服務質量。
專欄二智能客服場景
工商銀行利用大模型的語義理解、生成能力,結合基于知識庫
的檢索提取能力,精準理解客戶意圖,生成符合其業(yè)務特性的結果,
為客戶提供更準確、更個性化的服務,提升應答效率和質量,從而
提升客戶滿意度。2023年3月,工商銀行進行了大模型智能客服試
點測試,一定程度上提升了客戶情緒識別效果,縮減了約50%的人力
維護成本。
農業(yè)銀行大模型ChatABC面向行內客服員工提供遠程銀行AI輔
助客服問答助手服務。此助手基于遠程銀行問答數據完成訓練微調,
支持模型在多輪問答中識別客戶的主要意圖,結合遠程銀行知識庫
和知識圖譜,生成擬人問答,輔助坐席人員在問答中獲取知識,有
效提升坐席人員的答復效率。
中國銀行正探索將大語言模型運用于客服場景,幫助業(yè)務人員
實現更自然靈活的智能問答功能,有效地應用到坐席問答輔助、員
工培訓、行內員工辦公等多個場景。
交通銀行正探索使用大模型來準確識別客戶意圖和坐席人員的
知識檢索需求,進行相應客服知識的提煉和推薦,并在坐席通話結
束后,對服務內容進行自動的標準化分類,生成通話小結,以提升
坐席人員整體工作效率。
光大銀行探索大模型技術與現有智能客服相融合,基于大模型
18
意圖理解能力對客戶問題進一步理解,以提升客戶問答滿意度;基
于大模型技術探索坐席工單自動生成可能性,對客戶與坐席對話內
容快速生成摘要工單,提升客戶服務效率。
民生銀行探索運用大模型技術輔助坐席完成問題回復和工單生
成等工作,實現工單流程自動化,提供內容以支持顧問與客戶互動,
支持高度擬人化的客服機器人,優(yōu)化客戶體驗,提升客服質量。
興業(yè)銀行基于大模型技術實現客服語料智能泛化,對當前語料
標注過程中存在的標注工作繁瑣、工作量大等痛點,通過大模型生
成符合業(yè)務需求的語料,以幫助客服運營人員提升標注效率,進而
提升智能客服回答準確率,減少客戶投訴。
上海銀行正探索在客戶服務領域運用大模型優(yōu)秀的語言理解能
力并結合行內知識庫,在充分洞察客戶訴求的前提下,對復雜場景
進行分解,能夠從知識庫中自動完成有效知識的提取與采編,解決
知識庫運維完全依賴人力、多語義理解、語義纏繞等問題,為客戶
提供優(yōu)質解答。
國信證券探索運用大模型技術自動化生成服務話術和客戶指標
數據,包括:知識問答、行業(yè)分析、行情快報、客戶資產配置建議、
資訊推送摘要、投訴建議反饋等,提升運營人員的服務質量和效率。
平安保險運用大模型技術解決傳統(tǒng)知識庫梳理成本高、培譏成
本高、推薦話術僵化等問題,在客服人員與客戶通話過程中,實時
根據客戶需求,生成個性化話術,從而提升客戶滿意度,大大降低
坐席人員學習成本。
19
2.智能辦公
大模型可以作為辦公助手,發(fā)揮其出色的文本生成能力,輔
助完成報告和運營文案生成、郵件起草、公文潤色、紀要撰寫、
內容審核、輔助糾錯等工作,為員工提供更加便利、快捷的智能
辦公工具及個性化的智能辦公解決方案,大幅提升工作效率。此
外,大模型還可以實現不同語種的實時翻譯,提升金融機構跨境
業(yè)務交流和管理水平。
專欄三智能辦公場景
工商銀行通過搜索技術與大模型結合,將知識庫檢索到的信息
作為大模型的生成依據,實現自然語言的向量搜索,輔助業(yè)務人員
在業(yè)務辦理過程中快速查詢到客戶問題的準確應答,提升應答效率
和質量,從而提升客戶滿意度。
農業(yè)銀行大模型ChatABC面向行內員工辦公場景推出智能問答
應用。此應用著眼于大模型在金融領域的知識理解能力、內容生成
能力,并融合知識庫,具備研發(fā)服務領域級知識理解和問答能力,
可完成自由閑聊、行內知識問答、內容摘要等多類型任務,并以行
內研發(fā)服務平臺的問答助手、工單自動化回復助手、行內即時聊天
工具等多渠道形式進行試點。
交通銀行正探索在辦公軟件中嵌入基于大模型的智能問答助
手,為員工提供人資規(guī)章、授信、對公、零售業(yè)務場景的會話式咨
詢。同時,交通銀行利用大模型搭建會議紀要助手,從口語化的會
議記錄中提取關鍵信息,包括討論主題、觀點、結論等,組織成連
20
貫自然的語言,生成書面化的會議紀要和待辦事項。
郵儲銀行運用大模型技術搭建智能知識問答系統(tǒng)“靈犀”,系統(tǒng)
采用Langchain和向量數據庫技術,結合大模型對自然語言的理解
與生成能力,發(fā)揮了垂直領域內知識理解能力,賦能業(yè)務實現專
業(yè)知識智能解答,提升業(yè)務辦理效率。同時,郵儲銀行運用大模型
技術搭建“小郵助手”智能機器人,提供在線業(yè)務知識問答、熱點問
題分類展示,實現業(yè)務難點、要點即時回復和精準提示,提升柜
員操作體驗及業(yè)務處理效率,釋放業(yè)務指導員工作。
光大銀行基于大模型技術構建員工助手,應用于行內通信軟件,
快速解答內部員工日常辦公問題,構建多項智能應用,可幫助行內
員工實現消息智能摘要、日程會議智能提醒、郵件自動編寫、代碼
自動生成、系統(tǒng)助手等多項能力,提升辦公效率。同時,光大銀行
探索將現有知識庫與大模型相結合,打造企業(yè)內搜場景應用,將現
有零散知識召回交給大模型,基于大模型理解及生成能力輔助業(yè)務
辦公人員快速定位核心問題并作出合理判斷,以提升業(yè)務效率。
民生銀行通過大模型的理解能力建立多場景文檔助手,對文檔
的主要內容進行摘要匯總整理,全面提升員工工作效率,實現針對
文檔不同場景的個性化需求。
興業(yè)銀行探索通過大模型嵌入行內WPS辦公套件,實現包括PPT
大綱生成,文章內容生成,內容擴寫與改寫,文章風格轉變等功能,
以減輕總分行一線員工的文字材料撰寫潤色的負擔。
北京銀行搭建“京智助手”大模型對話機器人,提供行內知識
21
問答、數據分析、任務執(zhí)行等功能,應用于協(xié)同辦公、智能客服、
合規(guī)管理等場景。目前""京智助手''已向全行HXXX)多名員工開放,
并同步建設移動端和PAD端,已在合規(guī)管理、數據分析和流程
自動化場景,取得了一定的應用成效。
上海銀行利用大模型的理解和生成能力,搭建智能辦公助手,
一方面接入行內知識庫,提升知識檢索能力,并由大模型對于長文
檔自動檢索生成知識條目等,另一方面接入行內各類辦公系統(tǒng),提
供公文檢查、寫作、總結潤色等功能,在大幅提升辦公效率的基礎
上,極大地提升員工交互體驗。
中信證券正在積極探索利用大模型建立跨境實時通訊系統(tǒng),旨
在實現境內外員工用母語進行無障礙交流,提高員工工作效率,加
強團隊協(xié)作力度,以及提升對國際化客戶的服務質量,加強全球化
布局和業(yè)務發(fā)展。
國泰君安將大模型技術與OCR、語音識別等技術相結合,圍繞
智慧辦公場景開發(fā)智能辦公助手和基于大模型的知識庫問答應用,
提供會議紀要生成、郵件撰寫等常見辦公任務小工具,通過自然
語言問答的形式實現文檔問答,為員工提供一個智能、高效、便
捷的工
作伙伴,提升辦公效率和工作質量。
3.智能研發(fā)
大模型在智能研發(fā)場景展示出很大的潛力。大模型具有處理
自然語言和生成多種編程語言高質量代碼的能力,在系統(tǒng)設計、
代碼生成與補全、代碼翻譯與注釋、輔助測試等方面為科技人員
22
提供幫助和支持,提升開發(fā)效率和交付質量。同時,大模型的閱
讀理解和SQL生成能力,可以實現指令文字到SQL代碼的直接相
互轉化,業(yè)務人員無需了解數據庫技術與編程知識也可輕松完成
數據查詢等工作。此外,通過大模型與BI等應用系統(tǒng)結合,可
以實現報表自動生成,可視化地展示數據查詢分析結果,使得非
技術人員更直觀且深入地理解、利用數據,降低技術門檻。
專欄四智能研發(fā)場景
農業(yè)銀行大模型ChatABC推出AI輔助編程應用,面向行內研發(fā)
員工提供輔助編程服務。通過行內多個系統(tǒng)的代碼和代碼規(guī)范進行
微調,實現Java、Python>JavaScript^SQL等語言的代碼生成、代
碼補全、代碼解釋等能力,可在前端、后端、單元測試等多類研
發(fā)編碼場景提供輔助,提升研發(fā)人員的開發(fā)效率。
平安銀行在ChatBI項目中應用了BankGPT的金融理解能力,旨
在為業(yè)務人員和管理層提供即時的數據分析服務,當'業(yè)務人員面臨
數據相關的問題時,系統(tǒng)可以迅速給出精確答案,實現提問與回答
的無縫對接。
民生銀行探索運用大模型技術輔助用戶完成高質量代碼編寫,
按需完成代碼生成、代碼補全等功能,促進分析平民化,提升代碼
效率,實現質量和效率的雙提升。
興業(yè)銀行通過大模型嵌入行內開發(fā)IDE的方式,探索基于大模
型技術實現代碼輔助生成,以提升科技研發(fā)單位的開發(fā)效率和代碼
質量。
23
上海銀行通過在軟件開發(fā)過程中引入大模型進行代碼補全、注
釋生成、代碼糾錯等自動化輔助功能,極大地提升了開發(fā)人員的開
發(fā)效率和代碼質量;在代碼測試方面,應用大模型生成能力,輔助自
動生成測試案例,有效提升測試效率及案例覆蓋度;在數據分析方
面,上海銀行正在探索大模型與行內經營管理工具-“掌上行”的有
效結合,通過自然語言交互方式,允許用戶就經營指標自由提問,
進一步降低數據分析的門檻,提升數據驅動經營管理的有效性。
中信證券探索運用大模型實現股價預測等模型構建,根據用戶
輸入的自然語言,生成相應SQL語句,準確地完成用戶數據查詢需
求,以期適配不同數據庫、完成多表數據查詢。
國信證券通過大模型的輔助代碼生成能力,協(xié)助IT人員、業(yè)務
產品經理、運營人員進行代碼編寫、數據分析、輔助代碼生成檢查
等工作,提升系統(tǒng)開發(fā)、數據分析等內部工作效率。
4.智能投研
大模型技術可以幫助投研人員從海量、分散、龐雜的報告中
挖掘關鍵信息,自動抓取財經、債市、信用等多個市場板塊的資
訊報告內容,快速獲取報告的核心觀點、關鍵數據和市場趨勢,
分析預測市場交易情況,智能生成資訊報告和投研簡報,為投研
人員提供投資、風控等決策輔助。
專欄五智能投研場景
工商銀行綜合應用大模型的核心信息提取、智能文本生成等能
力,實現金融報告的自動生成,有效將投研簡報生成效率從1小時
24
縮短至5分鐘,提升了投研人員對海量文本數據的整合歸納提煉效
率。
興業(yè)銀行通過大模型技術實現研報摘要的智能生成,構建了一
套包括研報文檔結構化、信息抽取和大語言模型語義理解摘要生成
的一體化解決方案,實現研報核心內容智能提煉,提高了興銀理財
子公司投研團隊查洵、閱讀內外部研報的效率,加快了投資決策效
率,一定程度節(jié)省人力成本,同時提升了客戶體驗。
國泰君安證券利用大模型的自然語言到結構化查詢(NL2SQL)
等能力,改進傳統(tǒng)問答系統(tǒng)的精準性和靈活性,實現對投研領域
內包
括行情、公司、基金等數據的精確、高效問答。
華泰證券正探索運用大模型對文本的學習理解能力,學習歷史
研報的撰寫模式、分析邏輯和行文風格等內容,從而實現研究報告
初稿的自動撰寫。目前已初步搭建內容召回、內容生成的線上撰寫
服務框架,打通從財務報告的非結構化文檔解析,利用embedding
技術構建財報知識庫,根據歷史研報進行高相關內容召回,結合內
容召回與大模型服務,通過建設Prompt工程,打通大模型撰寫能力
鏈路。
5.智能營銷
結合金融業(yè)語料進行適應性訓練后,大模型可輔助生成營銷
話術和營銷文案,幫助客戶更快地獲取最新資訊和產品的信息。
同時,通過對話式營銷,大模型可優(yōu)化客戶參與度,提升服務的
效率與質量,引導其做出決策。此外,隨著投資者數據、產品知
25
識和營銷文案的不斷積累,大模型技術可以從海量信息中檢索詞
條,并提煉整合,可針對特定客戶實現貼心、高質量、有創(chuàng)意的
精準營銷,快速生成個性化建議和推薦,并構造相應的圖文推廣,
進一步提升客戶轉化率和營銷效率,為客戶提供更加全渠道、個
性化、有溫度的金融服務。
專欄六智能營銷場景
平安銀行借助BankGPT優(yōu)秀的文案生成能力,針對不同客戶,批
量生成個性化營銷文案,從而更有針對性地提升客戶粘性和業(yè)務轉
化率,為營銷運營團隊提供支持。同時,平安銀行利用BankGPT的
自然語言理解能力,助力多媒體運營團隊實現自動化FAQ抽取功能。
民生銀行探索運用大模型技術賦能客戶意圖理解營銷場景,通
過搜索知識庫、產品庫、聊天記錄等,洞察客戶真實意圖,自動提
供廣告等營銷文案、自動生成個性化營銷內容、自動提供各類分析
報告,提升營銷成功率。
平安保險通過大模型的自然語言交互、內容生成等能力,智能
化分析并提取客戶需求,輔助生成保險產品營銷素材,并根據客戶
標簽屬性提供針對該客群的產品推薦以及推薦理由相關話術,基于
個人醫(yī)療歷史和分線因素,提供個性化保險建議和方案,有助于產
品精算人員制定針對性保險方案。
6.智能運維
金融機構可以利用大模型生成技術,實現智能運維分析、運
維知識獲取、網絡安全分析等,進一步提升運維效率。大模型具
26
備良好的語義搜索能力,在復雜的數據中準確找到所需結果,助
力運維人員快速對接各類型的結構化、非結構化數據,實現流程
自動化、智能檢索和內部資料的輔助審核。止匕外,對于大模型還
可以輔助運維人員完成代碼攻防測試、明文檢測等安全檢測工作。
專欄七智能運維場景
上海銀行探索將大模型應用于故障分析及解決等場景,結合歷
史生產事件解決工單、運維文檔或問答對等知識庫,當故障發(fā)生時,
大模型能夠自動根據歷史解決經驗及知識庫給出故障分析及解決方
案,從而為運維人員提供輔助支持,以提升事件解決效率。
7.智能風控
風險控制是金融業(yè)的核心要務。大語言模型的閱讀理解能力
可以輔助提示存在的法律風險,降低人為疏漏概率并提升法官人
員工作效率。在大模型的通用能力基礎上融合金融行業(yè)的知識和
數據用于真?zhèn)魏蓑灐⑤浨榉治龅拳h(huán)節(jié),結合風控數據模型,進行
風險模擬與壓力測試,對可能發(fā)生的風險事件作出預警,實現貸
前智能推薦、貸中全面風控、貸后監(jiān)測預警全流程風控管理。此
外,基于大模型的合規(guī)知識問答助手在金融合規(guī)場景中也發(fā)揮了
一定作用。
專欄八智能風控場景
光大銀行基于大模型理解能力,探索大模型解讀法律法規(guī)政策
的可行性,基于業(yè)務問題快速定位政策文件并給出法律法規(guī)依據、
打造法律法規(guī)領域智能專家,輔助各業(yè)務場景快速把控政策、法規(guī)
27
風險。
華夏銀行探索利用大語言模型技術疊加合規(guī)圖譜,以高質量內
外規(guī)數據為基礎,以結構化合規(guī)知識標簽為輔助,利用大語言模型
語義理解、信息匯總和自然語句生成能力實現智能化合規(guī)知識問答
功能,降低合規(guī)知識查詢門檻。
平安保險運用大模型技術,基于歷史數據和模擬數據進行風險
模擬和壓力測試,評估產品設計的可靠程度和穩(wěn)定性,以便產品精
算人員更好地了解產品可能面臨的風險和挑戰(zhàn),助力產品精算人員
制定相應保險策略。
8.智能投顧
圍繞財富管理專業(yè)知識對大模型進行增量訓練,構建基于大
模型的投資顧問助手,提供圍繞個體的全生命周期智能投顧服務,
實時監(jiān)測市場動態(tài),調整投資策略,并根據客戶的風險偏好、收
益目標和資產狀況,為客戶提供個性化的投資建議和組合優(yōu)化,
大幅提升服務效率和服務體驗。
專欄九智能投顧場景
國泰君安證券運用大模型的理解分析能力,進行金融資訊熱點
話題提取和!tl納,對相關信息做正面/負面消息的評分和整理,生成
每天/周/月的熱點話題榜單,既能實時跟蹤行業(yè)網站熱點,又能回
顧過去一段時間的熱點話題,基于榜單排名走勢預測股市熱點信息。
大模型在提升金融服務效率和體驗、降低金融風險和成本、
創(chuàng)新金融產品和模式等方面有著顯著作用。大模型在金融領域的
28
應用場景具有較大空間,隨著大模型與各個金融場景的深度融合,
將進一步提升我國金融業(yè)的智能化水平,進一步深入推動金融機
構數字化轉型。
(四)應用趨勢
一是金融機構將采用先內后外、從易到難、場景遷移的方式
落地大模型金融應用。由于目前大模型直接對客難度較大、可控
性不強,金融機構主要對內應用大模型能力,待技術逐漸成熟,
可以考慮對外輸出。此外,金融機構也將優(yōu)先選擇風險等級低、
適配應用難度小、業(yè)務提升效果明顯的場景進行大模型試點落地,
逐步將試點應用場景遷移到真實、復雜的業(yè)務場景,實現大模型
對金融產品和服務的全面升級。
二是大小模型協(xié)同進化是大模型發(fā)展的一個必然趨勢。大模
型對應場景多為開放式和主觀型問題,測重推理和創(chuàng)造,也可被
用于作為連接多個具體任務模型的通用接口,而小模型對應場景
多為封閉式問題,不涉及過多主觀推斷,答案的正確性可以被清
晰驗證,因此在某些特定場景仍具有更好的表現。大模型對于中
小模型并非是替代或對立的關系,兩者應相互協(xié)作、互相搭配,
由大模型向邊、端的小模型輸出模型能力,而小模型負責實際的
推理與執(zhí)行,同時向大模型反饋算法與執(zhí)行成效,使得大模型的
能力持續(xù)強化。金融機構將加強研究和推進大小模型協(xié)同、生成
式技術與傳統(tǒng)人工智能技術協(xié)同,將大模型連接到傳統(tǒng)軟件,提
升行業(yè)整體智能化水平。
29
三是多模態(tài)金融大模型的發(fā)展與應用仍有較大潛力。大模型
生成效果的提升依賴于垂直場景系統(tǒng)化程度和高質量數據。金融
業(yè)具備專業(yè)領域知識庫,多年來沉淀了大量格式多樣的優(yōu)質業(yè)務
數據。運用多模態(tài)技術實現知識的遷移、表示、對齊和推理,使
得大模型能更好地構建金融領域內外部生態(tài)系統(tǒng),助力金融科技
創(chuàng)新和金融業(yè)務賦能,為金融機構提供更多智能化、個性化的服
務和決策支持,同時也為客戶和市場參與者帶來更好的體驗和更
穩(wěn)健的金融環(huán)境。
四是AIAgent未來可能推動人工智能成為金融業(yè)信息基礎
設施。AIAgent是有能力主動思考和行動的智能體,以大模型
為大腦驅動,能夠自主感知環(huán)境、形成記憶、規(guī)劃決策、使用工
具并執(zhí)行復雜任務,甚至與其他Agent合作實現任務。盡管多智
能體的發(fā)展仍面臨較大困境,但隨著算力支撐和技術研究的不斷
演進,AIAgent將在各行業(yè)發(fā)揮強勁動力,尤其在與各行業(yè)緊
密相連的金融業(yè),更全面地實現人機融合,為金融機構提質增效,
創(chuàng)造更深度的價值。
四、大模型在金融業(yè)應用面臨的風險與挑戰(zhàn)
(一)金融應用規(guī)范與指南亟需完善
金融業(yè)作為強監(jiān)管行業(yè),在政策方面一直遵循著高標準和嚴
要求。我國已相繼發(fā)布《生成式人工智能服務管理暫行辦法》《網
絡安全標準實踐指南——生成式人工智能服務內容標識方法》
30
《生成式人工智能服務安全基本要求》(征求意見稿)等文件,
對大模型在通用領域的應用進行了合理的約束和引導,但是針對
大模型在金融領域的應用尚且缺少可實施落地的標準規(guī)范和指
南,對應用過程中的權責界定尚不明晰,缺少對生成內容的問罰
機制及大模型廣泛應用后可能存在的無序商業(yè)行為的監(jiān)管機制。
此外,針對大模型訓練和推理的AI算力基礎設施、行業(yè)語料庫
標準化建設也較為欠缺。
(二)金融應用場景缺少范式
大模型選型、架構調整設計、技術驗證等環(huán)節(jié)過程復雜,金
融機構缺乏大模型技術融合場景落地的方法論,對大模型的能力
邊界認知不足,尚未明確大模型適合哪些業(yè)務場景、是否有必要
替換傳統(tǒng)的AI設備、何時適合落地,尚未健全大模型應用創(chuàng)新
風控管理機制,尚未有典型的落地案例可以向行業(yè)規(guī)?;茝V。
大模型支撐多個場景或服務的行業(yè)應用,其測評指標非常復雜,
測試數據集設計構建與更新維護難度大、成本高,尚且缺少一個
覆蓋面廣、公允度高、滿足不同場景和任務特征的大模型金融應
用及其風險治理的評估方法或指標體系,致使金融機構進行大模
型選型及評估存在較大困難,阻礙了大模型金融場景應用進程。
大模型需要提示工程相關的內置模板,與原有的機器學習、深度
學習等模型工作方式有很大差別,也增加了相關人員的工作范度。
此外,大模型金融應用需要與現有系統(tǒng)和業(yè)務流程進行集成,需
要跨組織、跨部門、跨團隊協(xié)作,組織能力面臨挑戰(zhàn)。
31
(三)高質量金融訓練數據欠缺
數據是大模型訓練的基礎,為了切實解決金融業(yè)務問題,需
要大量高質量、多領域的金融數據基于業(yè)務屬性對大模型進行增
量訓練。金融領域知識存儲形式繁多,包括影像件、PDF、
Excel等多種格式,需要通過分類、清洗、問答數據集梳理等大
量前期處理及后期更新維護工作,針對各種業(yè)務難點、要點問
題的解答還需要嗖集大量專家經驗,以保持大模型的準確性和
有效性,而這會耗費大量人力物力。同時,大模型訓練迭代需
要一定時間,致使大模型對時事的了解有限。金融數據流通仍
在探索階段,而單一金融機構掌握的數據資源較為有限,一定
程度上影響了大模型金融應用效果。金融數據敏感性高,在數
據分級分類管理、數
據脫敏清洗、防止數據偏見和濫用等環(huán)節(jié)也存在難題。
(四)訓練算力支撐普遍不足
大模型訓練和推理需要足夠的算力支撐,在高端GPU芯片斷
供的背景下,金融機構對中高端AI算力的需求存在較大缺口。
由于金融數據敏感度高,金融機構普遍選擇私有化部署大模型,
而構建、訓練、優(yōu)化大模型需要高性能的計算資源和大量的存儲
資源,硬件設備的采購和維護需要高昂的資金投入,給金融機構
帶來較大的成本壓力。大模型的訓練與推理對AI芯片的要求有
所不同,當前我國AI芯片能較好地支撐推理,而在訓練上仍與
國際領先水平有明顯差距,存在計算能力不足、芯片制程工藝有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- (高清版)DB11∕T1034.2-2024交通噪聲污染緩解工程技術規(guī)范 第2部分:聲屏障措施
- 2024高考數學二輪復習分層特訓卷客觀題專練解析幾何13文
- 2025年脂肪烴生產工(高級)理論考試題(附答案)
- 虛擬仿真技術的教學設計原則
- 2025年鈑金加工項目發(fā)展計劃
- 課堂校園安全
- 幼兒交通安全教育活動
- 2025年譯林版九年級英語寒假復習 考點拓展2、狀語從句、寫作指導 ( 青少年問題)
- 2025四川長虹電源股份有限公司招聘電氣系統(tǒng)設計主管等崗位47人筆試參考題庫附帶答案詳解
- Unit 4 School Life 第6課時Culture Understanding Group Work教案-【中職專用】高一英語同步課堂(高教版2023修訂版·基礎模塊1)
- 護士法律法規(guī)知識培訓
- 醫(yī)院安保服務投標方案醫(yī)院保安服務投標方案(技術方案)
- 中醫(yī)理療免責協(xié)議書
- 《職業(yè)流行病學》課件
- 2025年全國幼兒園教師資格證考試教育理論知識押題試題庫及答案(共九套)
- 精神科病人安全與治療管理制度
- 廚房食材收貨流程
- 2024年外貿業(yè)務員個人年度工作總結
- 關愛留守兒童培訓
- 品牌服飾行業(yè)快速消費品庫存管理優(yōu)化方案
- 貝雷橋吊裝專項方案(危大工程吊裝方案)
評論
0/150
提交評論