




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
大模型落地應(yīng)用FoundationModelPracticalApplicationCollections牽頭單位大模型測試驗證與協(xié)同創(chuàng)新中心/主編單位/中國信息通信研究院華東分院中國信息通信研究院人工智能研究中心上海人工智能實驗室開源生態(tài)發(fā)展中心Foundation
ModelPractical
Application
Collections2023大模型落地應(yīng)用案例集牽頭單位大模型測試驗證與協(xié)同創(chuàng)新中心/主編單位/中國信息通信研究院華東分院中國信息通信研究院人工智能研究中心上海人工智能實驗室開源生態(tài)發(fā)展中心主編廖運發(fā)
喬
宇
魏
凱編輯陳俊琰
許劭華
李
論
牛曉芳
常永波阿里云計算有限公司九度數(shù)字科技(蘇州)有限公司昆侖萬維科技股份有限公司上海人工智能實驗室優(yōu)刻得科技股份有限公司北京百度網(wǎng)訊科技有限公司北京九章云極科技有限公司北京泡泡瑪特文化創(chuàng)意有限公司上海商湯智能科技有限公司上海說以科技有限公司云從科技集團股份有限公司云南聯(lián)合視覺科技有限公司云知聲(信陽)數(shù)字科技有限公司支付寶(中國)網(wǎng)絡(luò)技術(shù)有限公司中國金茂控股集團有限公司中國商飛上海飛機設(shè)計研究院中企網(wǎng)絡(luò)通信技術(shù)有限公司竹間智能科技(上海)有限公司螞蟻科技集團股份有限公司螞蟻星河(重慶)信息技術(shù)有限公司上海昇騰人工智能生態(tài)創(chuàng)新中心上海特賽發(fā)信息科技有限公司上海天壤智能科技有限公司上海稀宇科技有限公司上海巖芯數(shù)智人工智能科技有限公司上海智象未來計算機科技有限公司上海眾深科技股份有限公司上海卓繁信息技術(shù)股份有限公司壹沓科技(上海)有限公司目
錄CONTENTS(*
案例排名不分先后)東方財富自研金融大模型........................................................................基于大模型的信息結(jié)構(gòu)化抽取方法...........................................................天津金城銀行金融大模型示范應(yīng)用...........................................................文修大模型助力中文校對提質(zhì)增效...........................................................新型金融風(fēng)險防范可信金融大模型...........................................................第一章
通用大模型基于人工智能大模型技術(shù)的開放平臺可控可信的私域知識問答系統(tǒng)..............................................................................信陽市智慧工業(yè)平臺遙感大模型在農(nóng)業(yè)信貸場景的應(yīng)用...........................................................MiniMax大模型醫(yī)療咨詢解決方案言犀基礎(chǔ)大模型中國金茂人工智能大模型企業(yè)內(nèi)部場景應(yīng)用..............................................中山大學(xué)附屬醫(yī)院智慧醫(yī)院項目..............................................................國內(nèi)首款可私有化部署的企業(yè)級數(shù)據(jù)分析智能體——TableAgent九章云極知識管家打造企業(yè)專屬大模型智能底座“Pixeling
千象”阿斯利康:基于學(xué)術(shù)文獻溯源的藥品不良反應(yīng)報告生成助手.......................基于知識圖譜和大語言模型的制造業(yè)數(shù)字化轉(zhuǎn)型平臺.................................東方翼風(fēng)大模型.....................................................................................書生筑夢視頻生成大模型..........................................智己汽車:用大模型打造智能時代出行變革者書生浦語開源大模型基于山下話童大模型的貸后催收示范應(yīng)用.................................................海淀區(qū)一網(wǎng)統(tǒng)管接訴即辦工程項目...........................................................百川大模型在娛樂領(lǐng)域的應(yīng)用AnimateDi?:一項基于個性化文生圖模型擴展后的視頻生成框架通義千問2.0在企業(yè)場景的應(yīng)用昆侖萬維“天工”大模型風(fēng)烏氣象大模型.....................................................................................基于大模型的智能培訓(xùn).....................................................................................................................面向圍手術(shù)期的醫(yī)專大模型研究及其落地應(yīng)用通過大語言模型與材料領(lǐng)域技術(shù)文件集合對原材料質(zhì)保書進行智能審查..........................................................................智能投顧助手——光子·善策第二章
垂類大模型梧桐·招聘-基于百度智能云千帆大模型平臺的智能招聘系統(tǒng)面向游戲行業(yè)的圖像內(nèi)容生成式大模型中公網(wǎng)校:小鹿老師,為年輕人創(chuàng)造更多就業(yè)與成長機會新華妙筆AI第三章
大模型服務(wù)支小助-大模型金融專家智能助理......................................................................................................................................小布助手AGI云上模型服務(wù)平臺.......................................................ChatDD新一代對話式藥物研發(fā)助手大模型數(shù)據(jù)分析智能助理DeepInsightCopilot單晶爐自動化工藝識別多模態(tài)大模型基于NDAI大模型的政務(wù)元宇宙平臺慧政大模型——面向政務(wù)服務(wù)垂直大模型基于循道政務(wù)大模型的免申即享系統(tǒng)示范應(yīng)用螞蟻集團大模型數(shù)據(jù)高質(zhì)量供給平臺基于大模型的壹沓數(shù)字員工超自動化平臺.................................................云原生大模型知識庫平臺........................................................................眾調(diào)科技:營銷AI培訓(xùn)產(chǎn)品.................................................................................................................................................信息安全大模型平臺.............................................................全自研AI整合平臺“HeyLisa”ChapterOne.1通用大模型落地應(yīng)用案例集FoundationModelPracticalApplicationCollections08垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections案例介紹大語言模型開放平臺旨在為大語言模型技術(shù)的研究和應(yīng)用提供一個開放、可擴展、可協(xié)作的環(huán)境。該平臺不僅為開發(fā)者提供大型語言模型、大規(guī)模數(shù)據(jù)集、模型微調(diào)工具以及大型語言模型應(yīng)用開發(fā)工具等資源,還加速了大型語言模型的訓(xùn)練過程,促進了大型語言模型在不同領(lǐng)域的應(yīng)用落地?;谌斯ぶ悄艽竽P图夹g(shù)的開放平臺核心能力和技術(shù)創(chuàng)新點:上海天壤智能科技有限公司1860億參數(shù)規(guī)模的基礎(chǔ)大模型:該平臺配備了規(guī)模龐大的基礎(chǔ)大型模型,擁有卓越的內(nèi)容生成、智能推理、語義檢索、情景感知和多語言轉(zhuǎn)換等智能交互能力。這使得用戶能夠在各種應(yīng)用場景中更靈活地應(yīng)用大型語言模型。天壤智能是國家高新技術(shù)企業(yè),上海市專精特新企業(yè)。公司聚焦人工智能深度學(xué)習(xí)和大數(shù)據(jù)挖掘技術(shù),開發(fā)大模型、小樣本、多重迭代的人工智能決策優(yōu)化算法,致力于打造復(fù)雜場景下的智能決策輔助體系和通用人工智能平臺?,F(xiàn)已成功落地生物制藥、智慧交通、智慧商業(yè)、數(shù)字金融等多個領(lǐng)域。豐富大模型類型:平臺提供130
億參數(shù)通用大模型、130億參數(shù)代碼專用大模型、130
億參數(shù)SQL
專用大模型以及130
億參數(shù)10K
上下文專用大模型,以滿足不同領(lǐng)域的需求,從通用應(yīng)用到特定任務(wù),都能得到支持。大型語言模型服務(wù)接入:平臺支持大型語言模型服務(wù)的接入,為開發(fā)者提供了廣泛的選擇,使他們能夠根據(jù)具體要求輕松定制模型。概述本項目通過搭建高性能GPU
計算集群、訓(xùn)練通用大語言模型、訓(xùn)練垂類大語言模型、搭建大語言模型微調(diào)平臺、搭建大語言模型應(yīng)用開放平臺等核心模塊,旨在打造大語言模型服務(wù)和應(yīng)用平臺,為大語言模型技術(shù)的研究和應(yīng)用提供一個開放、可擴展、可協(xié)作的環(huán)境。這個平臺除了通用大語言模型外,還提供大量共享的數(shù)據(jù)集、算法庫、模型微調(diào)工具等資源供開發(fā)者使用,同時大語言模型應(yīng)用開放平臺提供一整套完整的大語言模型生態(tài)應(yīng)用工具鏈,從而加速大語言模型的訓(xùn)練以及大語言模型生態(tài)應(yīng)用的開發(fā)和使用過程。微調(diào)與部署能力:平臺提供方便快捷的大型語言模型微調(diào)和部署功能,讓開發(fā)者能夠快速生成多領(lǐng)域的定制模型,以滿足特定應(yīng)用的需求。高效的應(yīng)用開發(fā)能力:平臺支持多項技術(shù)創(chuàng)新,包括提示詞工程、敏感詞檢測、多格式文件輸入增強以及文檔集搜索增強,這些技術(shù)創(chuàng)新使應(yīng)用開發(fā)更加高效。多渠道支持:平臺支持WebAPP
頁面應(yīng)用以及后臺API
調(diào)用管理,提供了多種應(yīng)用渠道,以滿足不同應(yīng)用場景的需求。資源動態(tài)調(diào)配:基于分布式計算集群的資源動態(tài)調(diào)配,確保平臺在不同負載下的高效性能,為用戶提供卓越的體驗。需求分析隨著生成式人工智能技術(shù)步入深化階段,以
chatGPT
為代表的大語言模型潛力凸顯,在各個領(lǐng)域得到了廣泛的認同和應(yīng)用。2022年全球GenAI市場整體收入為400億美元,預(yù)計
2027
年及
2032
年將分別達到
3990
億美元和
1.3
萬億美元,2022~2032
年復(fù)合增長率高達42%。而國內(nèi)眾多行業(yè)企業(yè)受到算力和數(shù)據(jù)等因素的制約,不能快速高效地使用最新的AI
工具和成果。因此,建設(shè)一個高性能、穩(wěn)定可靠的大模型開放平臺,從而降低人工智能應(yīng)用的門檻,提高開發(fā)效率和降低開發(fā)成本,促進人工智能領(lǐng)域的合作與交流,加快人工智能技術(shù)的創(chuàng)新與應(yīng)用,成為了一個非常有意義的工作。高效模型訓(xùn)練:平臺提供適用于不同場景的預(yù)訓(xùn)練模型,基于預(yù)訓(xùn)練模型的專業(yè)模型優(yōu)化,極大地削減了模型開發(fā)周期和資源成本。1011垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections應(yīng)用落地與合作機構(gòu):目前,該開放平臺已進入內(nèi)測階段,吸引了企業(yè)用戶1000+
位,實現(xiàn)了200+個大型模型應(yīng)用的開發(fā)。平臺與多家重要合作機構(gòu)建立了合作關(guān)系,其中包括中國人民解放軍軍事科學(xué)院、國防科技大學(xué)、中科院生命科學(xué)研究院、蘇州超算中心、加拿大Ploytide
生物科技有限公司等等。這些機構(gòu)基于平臺提供的大語言模型應(yīng)用建設(shè)能力,共同推動了大型語言模型技術(shù)的應(yīng)用和研究。效益分析該平臺的建成能提高企業(yè)的大語言模型應(yīng)用開發(fā)速度,降低開發(fā)成本,并提供了良好的商業(yè)模式:平臺可以通過提供專業(yè)領(lǐng)域增值服務(wù)、付費訂閱等方式從用戶中獲取收益,從而推動平臺的可持續(xù)發(fā)展,而平臺本身的開放性和共享性也能夠吸引更多的開發(fā)者加入,進一步擴大平臺的規(guī)模和影響力。此外,本項目可以推動人機交互模式和工作模式的變革,加速
AI
應(yīng)用的落地和普及,從而營造大模型產(chǎn)業(yè)生態(tài)。1213垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections案例介紹基本流程:可控可信的私域知識問答系統(tǒng)上海巖芯數(shù)智人工智能科技有限公司RockAI(巖芯數(shù)智)是以認知智能為基礎(chǔ),專注于自然語言理解、人機交互的科技創(chuàng)新型企業(yè),是A
股上市公司(002195.SZ)上海巖山科技股份有限公司的控股子公司,公司秉承“新科技改變生活”的理念,致力于構(gòu)建自研基礎(chǔ)AI
大模型+
行業(yè)垂直模型的技術(shù)結(jié)構(gòu),實現(xiàn)“1個
MaaS
平臺,多種應(yīng)用場景”策略,打造客戶信賴的認知智能平臺。圖1
基本流程主要能力:知識管理私域的知識問答系統(tǒng)具有強大的知識管理能力,允許用戶創(chuàng)建、編輯和組織知識文檔、常見問題解答(FAQ)、操作手冊和培訓(xùn)材料等;概述私域知識問答系統(tǒng)是一種旨在滿足特定組織或團隊內(nèi)部需求的智能信息獲取工具。其產(chǎn)品形式包括:知識問答、企業(yè)助理、辦公助手、智能客服、數(shù)字員工等。巖芯數(shù)智通過自研構(gòu)建可控可信的通用大模型,緩解了行業(yè)中大模型幻覺問題,提升模型的精準(zhǔn)問答能力,回答準(zhǔn)確率達到
90%,目前已在多家企業(yè)內(nèi)部部署應(yīng)用。多輪點的知識問答系統(tǒng)提供高效的問答功能,用戶可以輕松查找所需的信息,以減少時間浪費和提高生產(chǎn)率;權(quán)限管理系統(tǒng)提供靈活的權(quán)限管理,確保只有授權(quán)人員可以訪問和編輯特定的知識文檔,以維護知識的安全性和可維護性。需求分析信息是解決問題的基礎(chǔ),在企業(yè)和組織內(nèi)部,員工和團隊通常需要訪問特定領(lǐng)域的知識和信息,以解決問題、獲得支持或做出決策。傳統(tǒng)的知識庫和文檔系統(tǒng)可能存在檢索和更新的問題,導(dǎo)致信息不易獲取。在傳統(tǒng)的知識獲取中,用戶將知識庫放入到全文索引庫中,然后用戶利用關(guān)鍵詞獲取全文檢索的結(jié)果,即屬于當(dāng)前傳統(tǒng)搜索引擎的模式,該模式下主要存在以下兩方面的問題:技術(shù)創(chuàng)新:技術(shù)上為緩解大模型的幻覺問題以及提升模型回答問題的準(zhǔn)確性,巖芯數(shù)智專研模型的可控可信能力。模型結(jié)構(gòu)采用巖芯數(shù)智完全獨立自研的可線性計算的自然語言關(guān)聯(lián)特征表示模型,相比基于Attention
機制的
Transformer
架構(gòu)大模型,可大幅度的提升模型訓(xùn)練效率和應(yīng)用效果。全文檢索的方式需要關(guān)鍵詞精準(zhǔn)命中,對用戶的輸入要求更高。全文檢索命中的是相關(guān)性,只是找到答案附近的文本,無法精準(zhǔn)定位答案。本私域知識問答系統(tǒng)的背景是通過結(jié)合巖芯數(shù)智可控可信的通用大模型,提供一種更智能、互動和高效的方式來訪問和共享知識。1415垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections圖2
自然語言關(guān)聯(lián)特征表示的簡單示例過程模型的結(jié)構(gòu)基礎(chǔ)是基于線性計算的自然語言關(guān)聯(lián)特征表示方法,為了增強的應(yīng)用能力,需對線性計算的特征進行不斷地疊加。圖4
標(biāo)準(zhǔn)Transformer架構(gòu)訓(xùn)練某一任務(wù)loss變化趨勢圖5
巖芯數(shù)智自研模型訓(xùn)練某一任務(wù)loss變化趨勢圖3
自然語言關(guān)聯(lián)特征的現(xiàn)象計算單元疊加示例1617垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections圖
4
與圖5
是相近參數(shù)量下,針對同一任務(wù)的訓(xùn)練,標(biāo)準(zhǔn)Transformer
模型與巖芯數(shù)智自研模型的loss
變化趨勢。效益分析經(jīng)濟效益私域的知識問答系統(tǒng)有助于提高生產(chǎn)力和效率,減少支持部門的負擔(dān),降低了組織的運營成本;圖
4為基于
Transformer
架構(gòu)的預(yù)訓(xùn)練模型在訓(xùn)練集和驗證集上的損失值表現(xiàn)情況,圖5為巖芯數(shù)智自研大模型??梢园l(fā)現(xiàn)在訓(xùn)練
100
個
epoch
下,巖芯數(shù)智自研模型已經(jīng)出現(xiàn)過擬合的現(xiàn)象,其中驗證集中的最低損失值在3.5
左右,而基于Transformer
架構(gòu)的大模型,在100
個
epoch
下未完成收斂,且驗證集中損失值依然在
4
以上。商業(yè)模式通過許可付費、訂閱付費以及自定義解決方案三種方式實現(xiàn)用戶付費;應(yīng)用推廣前景上述也表明改進后的模型具備更快的收斂效率,基本上在第10
個
epoch
下就達到了最佳狀態(tài),因此收斂效率遠高于
Transformer
架構(gòu)。企業(yè)內(nèi)部應(yīng)用:私域的知識問答系統(tǒng)在企業(yè)內(nèi)部可以用于知識管理、員工培訓(xùn)、問題咨詢以及改善組織內(nèi)部的工作流程;教育領(lǐng)域:學(xué)校、大學(xué)和教育機構(gòu)可以本系統(tǒng)來改善教育過程,促進學(xué)生之間和教師之間的知識共享,提高教育質(zhì)量;實施效果:提高生產(chǎn)力醫(yī)療健康領(lǐng)域:可以提高醫(yī)療專業(yè)人員之間的知識共享,改善患者護理,提高醫(yī)療服處于私域的人員能夠更快地找到所需的信息,解決問題,減少工作中的困惑,從而提高生產(chǎn)力;務(wù)質(zhì)量;知識共享私域的知識問答系統(tǒng)可以在各種領(lǐng)域都有廣泛的應(yīng)用,為組織帶來經(jīng)濟效益、社會效益,同時提供多樣化的商業(yè)模式選擇。促進了內(nèi)部知識共享和協(xié)作,有助于打破信息孤島,使組織更加協(xié)調(diào)一致;風(fēng)險降低通過更好的知識管理,組織可以減少風(fēng)險,提高合規(guī)性。應(yīng)用落地情況:本私域的知識問答系統(tǒng)已經(jīng)在多家企業(yè)內(nèi)部落地,回答準(zhǔn)確率達到
90%
以上。1819垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollectionsMiniMax
大模型醫(yī)療咨詢解決方案上海稀宇科技有限公司MiniMax
成立于2021
年
11
月,是一家專注于通用人工智能的科技創(chuàng)業(yè)公司。成立至今,MiniMax自主研發(fā)了“MiniMax-abab”文本、語音、視覺三模態(tài)的千億參數(shù)大語言模型,在中、英文服務(wù)領(lǐng)域均已超過GPT-3.5
的水平。2023
年
8
月,“MiniMax-abab”大模型通過了國家首批大模型服務(wù)備案,可以面向社會公眾提供服務(wù)。
立足自研的大語言模型,MiniMax布局2B、2C
業(yè)務(wù),是商業(yè)化落地最快的中國大模型初創(chuàng)企業(yè)之一。在賦能千行百業(yè)方面,公司的MiniMax
開放平臺已服務(wù)數(shù)百家行業(yè)客戶,是公用云上在線調(diào)用量最大的大模型開放平臺,在金山辦公、騰訊、小米、閱文、小紅書等多個行業(yè)頭部客戶取得了實際落地。在服務(wù)終端用戶方面,已在國內(nèi)上線“星野”、“應(yīng)事”等多個
APP。輕松應(yīng)對個性化、多樣化的用戶提問挑戰(zhàn)2:如何回答個性化、多樣化的用戶問題類型并給予針對性回復(fù)MiniMax
的解決方案:憑借大模型長記憶能力,進行多輪對話,提供給個性化用藥咨詢。概述項目背景在我國的醫(yī)療健康產(chǎn)業(yè)領(lǐng)域,醫(yī)療咨詢場景對于專業(yè)度與緊迫性要求極強。MiniMax
發(fā)揮算法優(yōu)勢,突破應(yīng)用落地,協(xié)同藥師和患者雙方進行輔助咨詢,助力實現(xiàn)全體公民的健康福祉。技術(shù)解決路徑面對龐大的患者數(shù)量、極高的專業(yè)性要求與人工成本,MiniMax
為醫(yī)療咨詢行業(yè)提供了解決方案,通過協(xié)助藥師定期回訪并回答患者的專業(yè)問題,極大提高了服務(wù)效率和專業(yè)水平。準(zhǔn)確理解問題意圖與專業(yè)概念挑戰(zhàn)
3:盡管大型語言模型在處理問題意圖和回答問題方面取得了進展,但對醫(yī)學(xué)文獻中概念的理解能力仍有待提高精準(zhǔn)學(xué)習(xí)垂類醫(yī)療領(lǐng)域知識挑戰(zhàn)1:大語言模型在專業(yè)知識方面缺乏有效回應(yīng)MiniMax的解決方案:通過提高大語言模型自身的能力、應(yīng)用少樣本提示和模型微調(diào)等方法,結(jié)合多種手段以提升模型對專業(yè)領(lǐng)域概念的理解。MiniMax
的解決方案:構(gòu)建外掛知識庫,提升通用大模型回答垂類領(lǐng)域問題的準(zhǔn)確性。2021垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections案例介紹"
高濟神農(nóng)
"
是高濟健康與
MiniMax
共同打造的智能患者管理系統(tǒng)。基于
MiniMax-abab
大語言模型,它構(gòu)建了包含數(shù)億條醫(yī)學(xué)專家指南和共識的腫瘤知識庫,同時包括營養(yǎng)、心理、疾病知識、康復(fù)預(yù)后等內(nèi)容。通過知識增強技術(shù)外接到大模型中,以高濟累積的超80萬腫瘤患者真實服務(wù)場景為基礎(chǔ),經(jīng)過200余家藥房藥師的反復(fù)調(diào)試優(yōu)化,對于腫瘤用藥及不良反應(yīng)問題的回答準(zhǔn)確率高達
97.6%。“高濟神農(nóng)”智能患者管理體系三大落地應(yīng)用:專為藥師打造的高濟HealthMate智能助手、智能隨訪系統(tǒng)、數(shù)字人用藥指導(dǎo)解讀。高濟HealthMate可以根據(jù)患者檔案,在用藥、不良反應(yīng)、不良反應(yīng)指導(dǎo)、飲食營養(yǎng)等多個維度輔助藥師做出更準(zhǔn)確、迅速、個性化的判斷和建議,并建設(shè)流式回答來減少患者等待時間。通過智能隨訪系統(tǒng),藥師只需要輸入對患者的基本情況、不良反應(yīng)癥狀等信息,系統(tǒng)會給出相對應(yīng)的處理建議。藥師評估判斷患者的健康情況,它便能生成更人性化、個性化以及易讀性的隨訪小結(jié),提升藥師工作效率和患者體驗度。給患者的用藥指導(dǎo)、隨訪小結(jié)等相關(guān)內(nèi)容都經(jīng)過專業(yè)藥師審核。同時,“高濟神農(nóng)”還利用數(shù)字人技術(shù)為老年患者提供易理解的藥品說明和營養(yǎng)建議視頻,幫助他們享受更便捷的互聯(lián)網(wǎng)醫(yī)療體驗。需求分析醫(yī)療咨詢行業(yè)的困境——以腫瘤治療為例“高濟神農(nóng)”是一次對腫瘤患者安全用藥管理未來方向的探索。在進博會上發(fā)布最新“高濟神農(nóng)
2.0”,增加了智能院外患者管理體系,旨在通過持續(xù)不斷洞察患者需求,提升患者服務(wù)體驗。腫瘤治療的成功是實現(xiàn)全民健康的關(guān)鍵環(huán)節(jié)中國每年新增腫瘤患者超過400
萬,每年去世腫瘤患者大約300
萬。這一數(shù)據(jù)表明,腫瘤治療已成為全民健康實現(xiàn)的關(guān)鍵環(huán)節(jié)。效益分析經(jīng)濟效益院外個性化用藥咨詢對腫瘤患者不可或缺高濟神農(nóng)產(chǎn)品的使用,可以有效提升高濟藥師咨詢服務(wù)的專業(yè)水平,提升服務(wù)質(zhì)量。同時,擴大可服務(wù)病患人群,覆蓋數(shù)倍于之前規(guī)模,助力提升全民健康。在腫瘤患者就醫(yī)的全周期中,院內(nèi)時間僅占
10%
左右,而其余
90%
的時間都在院外度過。在此期間,患者的用藥依存性、轉(zhuǎn)移情況、療效追蹤、不良反應(yīng)、營養(yǎng)情況、心理狀態(tài)等方面都需要藥師或醫(yī)生及時隨訪,并提供相應(yīng)的咨詢服務(wù)。商業(yè)模式針對知識庫構(gòu)建和調(diào)優(yōu)服務(wù)一次性收費,同時,按照問答消耗的token
數(shù)量,依照實際調(diào)用量按量計費。以患者為中心的人工服務(wù)面臨挑戰(zhàn)以患者為中心的人工服務(wù)在專業(yè)度、成本和可擴展性方面存在諸多挑戰(zhàn)。首先,數(shù)十種腫瘤病種和數(shù)百種抗腫瘤藥物的知識體系龐大且復(fù)雜;其次,單病種就有成百上千篇知識文檔,對藥師的持續(xù)學(xué)習(xí)能力要求很高;最后,1名藥師每個月最多能服務(wù)300-350位患者,這意味著需要數(shù)千名藥師來滿足患者的需求。以上如此龐大且急切的需求單憑人工手段無法得到全部滿足。應(yīng)用推廣前景高濟神農(nóng)合作項目的知識庫解決方案,有效提升了藥師的專業(yè)性,可覆蓋更多人群。知識庫方案在醫(yī)療行業(yè)中,針對需要為患者提供專業(yè)咨詢服務(wù)的場景,具備很強的可復(fù)制性,市場潛力很大。2223垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections對企業(yè)實施、運營、維護的一體化覆蓋,同時言犀大模型中的小型化技術(shù)能夠使企業(yè)具備云管邊端協(xié)同運營的能力,增強企業(yè)面對非標(biāo)準(zhǔn)化、算力通訊資源受限場景的應(yīng)對能力,和面對業(yè)務(wù)變化的快速響應(yīng)能力。言犀基礎(chǔ)大模型需求分析目前基礎(chǔ)大模型正處于蓬勃發(fā)展階段,各行業(yè)、各領(lǐng)域以構(gòu)建數(shù)字化、線上化、搭建虛擬仿真場景為主要應(yīng)用。在當(dāng)前階段下,基礎(chǔ)大模型面臨著以下問題:京東云一、
由于基礎(chǔ)技術(shù)的限制以及大部分企業(yè)在大模型應(yīng)用和硬件設(shè)備開發(fā)能力的不足,從而導(dǎo)致無法自主生產(chǎn)原生
AI
模型。京東科技是京東集團旗下專注于以技術(shù)為政企客戶服務(wù)的業(yè)務(wù)子集團,秉承科技引領(lǐng)、助力城市及產(chǎn)業(yè)數(shù)智化升級的使命,我們致力于為政府、企業(yè)、金融機構(gòu)等各類客戶提供全價值鏈的技術(shù)性產(chǎn)品與服務(wù)?;谌斯ぶ悄?、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等前沿科技,依托京東多年耕耘供應(yīng)鏈的積累,京東科技是最懂產(chǎn)業(yè)的數(shù)智化解決方案提供商,面向不同行業(yè)提供以供應(yīng)鏈為基礎(chǔ)的數(shù)智化解決方案。二、
除了用戶單點大模型開發(fā)技術(shù)能力的不足,在各行業(yè)鏈條中的軟硬件互通、數(shù)據(jù)標(biāo)準(zhǔn)化和應(yīng)用功能融合等問題中都存在著無法克服的壁壘。三、
大模型訓(xùn)練硬件的能源消耗問題,在當(dāng)前全球綠色經(jīng)濟的背景下,平穩(wěn)運行離不開大規(guī)模的數(shù)據(jù)中心和云計算中心等基礎(chǔ)設(shè)施的支撐,而大部分企業(yè)則無法滿足以上的要求,從而無法實現(xiàn)大模型的應(yīng)用。2021
年
1
月,京東科技在原京東數(shù)科與京東智聯(lián)云基礎(chǔ)上重組完成,融合了兩大技術(shù)業(yè)務(wù)板塊的綜合實力,京東科技現(xiàn)已成為整個京東集團對外提供技術(shù)服務(wù)的核心平臺,擁有豐富的產(chǎn)業(yè)理解力、深厚的風(fēng)險管理能力、用戶運營能力和企業(yè)服務(wù)能力,能面向不同行業(yè)為客戶提供行業(yè)應(yīng)用、產(chǎn)品開發(fā)與產(chǎn)業(yè)數(shù)字化服務(wù)。針對以上情況,開發(fā)言犀基礎(chǔ)大模型,以實現(xiàn)低門檻構(gòu)建基于人工智能技術(shù)的解決方案,是本項目需要解決的問題。案例介紹京東推出的言犀基礎(chǔ)大模型,將著力圍繞內(nèi)容生成、人機對話、用戶意圖理解、信息抽取、情感分類等幾大類任務(wù),圍繞零售、物流、金融、健康、政務(wù)場景進行落地應(yīng)用。1)優(yōu)質(zhì)的場景和數(shù)據(jù)讓模型產(chǎn)業(yè)屬性更強概述京東作為一家新型實體企業(yè),擁有著深厚的產(chǎn)業(yè)基因和供應(yīng)鏈場景,源于真實的業(yè)務(wù)需求、深度復(fù)雜的場景任務(wù)和廣泛的實體經(jīng)濟發(fā)展要求,促使京東的AI
技術(shù)是面向知識密集型、任務(wù)型場景,解決真實產(chǎn)業(yè)問題的技術(shù)。且京東云旗下的言犀團隊在任務(wù)型智能對話交互關(guān)鍵技術(shù)方向擁有豐富的積累和廣泛的落地,擁有包括文本生成、語音生成、對話生成等系列領(lǐng)先技術(shù),并打造出了智能客服系統(tǒng)、京小智平臺商家服務(wù)系統(tǒng)、智能政務(wù)熱線、言犀數(shù)字人等系列產(chǎn)品和解決方案。京東的言犀大模型,是扎根產(chǎn)業(yè)的原生大模型。憑借著從基礎(chǔ)設(shè)施、模型層、MaaS層、SaaS
層全棧的技術(shù)布局,打造多款端到端的大模型技術(shù)產(chǎn)品。言犀大模型擁有三個差異化的特性:第一,它是產(chǎn)業(yè)原生的,有更強的產(chǎn)業(yè)屬性。第二,它是價值驅(qū)動的,有更高的應(yīng)用價值。第三,它是開放協(xié)同的,有更快的迭代效率。京東科技深耕人工智能領(lǐng)域多年,形成了從算法到應(yīng)用場景的鏈路,并通過自研推出言犀基礎(chǔ)大模型,賦予客戶在各自行業(yè)中快速構(gòu)建、部署,應(yīng)用人工智能的能力。通過言犀基礎(chǔ)大模型,企業(yè)可以建立從業(yè)務(wù)的大量數(shù)據(jù)中自我學(xué)習(xí)、自驅(qū)迭代的能力,并實現(xiàn)2425垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections2)京東言犀大模型技術(shù)架構(gòu)京東言犀大模型是基于京東云的高性能計算集群,采用Megatron+DeepSpeed
的分布式訓(xùn)練框架,訓(xùn)練的
Decoder-Only
架構(gòu)模型。在通用知識獲取方面,言犀大模型添加了約30%
的京東域自身的產(chǎn)業(yè)數(shù)據(jù),并通過構(gòu)建高質(zhì)量的指令數(shù)據(jù),幫助模型具備更強的產(chǎn)業(yè)屬性。除了模型訓(xùn)練本身,京東言犀大模型還在模型的轉(zhuǎn)換層和服務(wù)層進行了自研算法的深耕,提升了大模型本身的推理速度和部署性能,讓大模型的能力能夠充分的下沉到業(yè)務(wù)端,并通過集成平臺能力打造真正的模型及服務(wù)。圖1
京東言犀大模型概覽另一方面,京東連接著產(chǎn)業(yè)互聯(lián)網(wǎng)和消費互聯(lián)網(wǎng),在對內(nèi)實踐和對外產(chǎn)業(yè)數(shù)智化過程中積累了眾多優(yōu)質(zhì)的數(shù)據(jù),區(qū)別于一些通用域數(shù)據(jù)的靜態(tài)數(shù)據(jù),京東的數(shù)據(jù)是“鮮活的”,憑借每年產(chǎn)生數(shù)百億的交互數(shù)據(jù),保證了模型的持續(xù)迭代和優(yōu)化。京東的大模型是在預(yù)訓(xùn)練階段就接了70%
通用域數(shù)據(jù)和接近30%
京東特有的產(chǎn)業(yè)數(shù)據(jù)相結(jié)合去做訓(xùn)練,這就保證了模型擁有大模型的“常識”,并擁有產(chǎn)業(yè)模型的“專業(yè)”。圖3
京東言犀大模型架構(gòu)3)前沿的算法能力保證模型具備高應(yīng)用價值預(yù)訓(xùn)練層面源于業(yè)務(wù)應(yīng)用需求,京東在
2020
年就提出了
K-PLUG
模型,將領(lǐng)域知識注入大模型中,以提高大模型的專業(yè)性和忠實度,并在2021
年對該項工作進行了發(fā)表。K-PLUG方法是基于
Transformer
模型架構(gòu)X
京東的產(chǎn)業(yè)知識進行的預(yù)訓(xùn)練。該算法幫助模型在實體屬性抽取準(zhǔn)確率為
96%;在生成式多輪對話
ROUGE-L(指標(biāo)主要是對比機器生成的內(nèi)容與人類的標(biāo)準(zhǔn)內(nèi)容的匹配度),以27%
領(lǐng)先于斯坦福經(jīng)典的Pointer-Generator;在上下文多輪問答知識檢索率以
74%
準(zhǔn)確率領(lǐng)先于行業(yè)。圖2
京東言犀大模型數(shù)據(jù)概覽2627垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections4)澎湃算力打造開放協(xié)同的大模型生態(tài)為了訓(xùn)練大模型,京東早在2021
年就在重慶建成了大模型集群,也是全國首個基于DGX
SuperPOD架構(gòu)的超大規(guī)模計算集群—天琴
,該集群在保障京東自身大模型訓(xùn)練的同時,還將集群的每秒浮點運算次數(shù)提升
40%,多卡線性加速比提升
90%,為后續(xù)大模型的持續(xù)發(fā)展打下良好的基礎(chǔ)。另一方面,為了更好的應(yīng)對大模型背景下的海量數(shù)據(jù)存儲問題,京東還自研了向量數(shù)據(jù)庫Vearch,支持百億級向量監(jiān)檢索,召回實現(xiàn)毫秒級延遲,智能儲存分層實現(xiàn)成本降低
60%,大幅提升了模型推理泛化能力與推理效率。效益分析該解決方案以京東全產(chǎn)業(yè)鏈為核心優(yōu)勢,從產(chǎn)業(yè)場景、軟件平臺、安全合規(guī)等多個方面為用戶帶來價值。產(chǎn)業(yè)場景方面
:用戶將借助京東積累的歷史行業(yè)知識,低成本快速構(gòu)建該用戶所在細分領(lǐng)域大模型應(yīng)用,使用戶快速取得局部市場的先發(fā)優(yōu)勢(量化標(biāo)準(zhǔn)為縮短開發(fā)周期及成本降低)。圖4
京東言犀大模型K-PLUG算法推理部署層面除了在大模型的預(yù)訓(xùn)練階段,言犀大模型通過上述算法增強了產(chǎn)業(yè)領(lǐng)域知識,在模型的推理層面,京東言犀采用量化矩陣算子融合、自適應(yīng)參數(shù)矩陣量化、自動算子切分與卡間并行、內(nèi)存優(yōu)化與緩存等多種策略,將推理速度提升6.2倍,且在“首字”推理速度的大模型推理難點上,京東言犀大模型采用自研的算法,極大程度的提升了大模型在推理方面的性能。在部署方向,依靠流式推理有效解碼傳輸機制、動態(tài)批處理、異構(gòu)集群部署等方法,將部署成本降低了
90%。軟件應(yīng)用方面
:為了讓模型有更好的能力和應(yīng)用,京東將開發(fā)言犀大模型過程中積累下來的能力解耦整合出來,以大模型開發(fā)平臺的形式開放給京東的合作伙伴。該平臺以京東云的私有云、公有云和混合云等高性能計算集群為底座,內(nèi)置了包括數(shù)據(jù)、模型訓(xùn)練和部署推理等工具能力,不僅支持京東自身的言犀框架,也同時會支持各個主流的開源模型框架,促進大模型生態(tài)的發(fā)展。此外,京東言犀大模型還擁有配套的AI
開發(fā)計算平臺,用于快速的模型迭代,效率提升10
倍以上,讓模型能夠不斷的學(xué)習(xí)新的知識。安全合規(guī)方面:言犀
AI
大模型具備數(shù)據(jù)隱私和內(nèi)容安全可控的價值:5)數(shù)據(jù)隱私安全我司在人機交互研究中進行訓(xùn)練數(shù)據(jù)處理、人工智能模型的訓(xùn)練時,嚴格遵守使用深度合成技術(shù)中的個人隱私保護要求,確保訓(xùn)練數(shù)據(jù)數(shù)據(jù)來源合法性,并使用脫敏數(shù)據(jù)進行模型訓(xùn)練。6)內(nèi)容生成可控性惡意代碼、插件和網(wǎng)絡(luò)釣魚電子郵件有可能被ChatGPT生成。為了杜絕此安全隱患,京東云言犀團隊會在模型訓(xùn)練時引入人工反饋機制降低和杜絕模型生成有害信息的回復(fù)。同時引入審核API
來阻止某些有害內(nèi)容的輸出,例如,當(dāng)收到要求編寫用于從被黑客攻擊的設(shè)備竊取數(shù)據(jù)的代碼或制作網(wǎng)絡(luò)釣魚電子郵件時,模型會拒絕該要求并指出此類內(nèi)容是“非法、不道德且有害的”。圖5
京東言犀大模型推理部署2829垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections需求分析數(shù)字化時代,數(shù)據(jù)分析的重要性猶如空氣般無處不在。商業(yè)數(shù)據(jù)分析是數(shù)字化管理、智能決策的基礎(chǔ),同時數(shù)據(jù)分析又是一個專業(yè)性極強的工作,描述性分析、診斷性分析、預(yù)測性分析,會讓大多數(shù)只會用
Excel
的人望而生畏。國內(nèi)首款可私有化部署的企業(yè)級數(shù)據(jù)分析智能體——TableAgent作為一款企業(yè)級應(yīng)用,業(yè)務(wù)數(shù)據(jù)的安全性、合規(guī)性不可忽略,一款可以私有化部署的方案在企業(yè)利用大模型技術(shù)進行數(shù)據(jù)分析應(yīng)用落地迫在眉睫。九章云極DataCanvas公司自主研發(fā)的TableAgent
數(shù)據(jù)分析智能體,可以實現(xiàn)私有化部署,保障安全、合規(guī)的前提下,讓大模型對個人生產(chǎn)力的賦能,從寫紀要、做總結(jié)上升到新的臺階,只要會提問,就能成為一個高級的數(shù)據(jù)分析師,洞察數(shù)據(jù)奧秘。北京九章云極科技有限公司北京九章云極科技有限公司(簡稱:九章云極
DataCanvas)以“創(chuàng)造智能,探索未知”為使命,以“助力全球企業(yè)智能升級”為愿景,是中國人工智能基礎(chǔ)軟件領(lǐng)軍者。公司致力通過自主研發(fā)的人工智能基礎(chǔ)軟件產(chǎn)品系列和解決方案為用戶提供人工智能基礎(chǔ)服務(wù),助力用戶在數(shù)智化轉(zhuǎn)型中輕松完成模型和數(shù)據(jù)的雙向賦能,低成本高效率地提升企業(yè)決策能力,實現(xiàn)企業(yè)級
AI
規(guī)?;瘧?yīng)用。案例介紹一、主要能力TableAgent
是在
DataCanvas
Alaya
九章元識大模型基礎(chǔ)上開發(fā)的能夠?qū)崿F(xiàn)私有化部署的企業(yè)級數(shù)據(jù)分析的智能體,有非常強大的意圖理解能力、分析建模能力和洞察力。TableAgent
在充分的理解用戶意圖后,自主的利用統(tǒng)計科學(xué)、機器學(xué)習(xí)、因果推斷等高級建模技術(shù)從數(shù)據(jù)中挖掘價值,進而提供分析觀點和指導(dǎo)行動的深刻見解。九章云極DataCanvas
的核心產(chǎn)品系列AIFS
人工智能基礎(chǔ)軟件和DataPilot
數(shù)據(jù)領(lǐng)航員具有高度的靈活性和可擴展性,能夠處理各種類型和規(guī)模的數(shù)據(jù),簡化了數(shù)據(jù)處理和分析的復(fù)雜性。產(chǎn)品集成了一系列先進人工智能技術(shù),包括多模態(tài)向量數(shù)據(jù)庫、因果學(xué)習(xí)、思維件等,為企業(yè)提供AI
軟件開發(fā)新范式。二、技術(shù)創(chuàng)新點TableAgent
是從
0
到
1
的交互式結(jié)構(gòu)化數(shù)據(jù)分析的突破,是企業(yè)數(shù)據(jù)分析的全新方式?;诤诵难邪l(fā)團隊豐富的數(shù)據(jù)分析經(jīng)驗和技術(shù)創(chuàng)新探索,TableAgent
能夠在強大的Alaya
九章元識大模型上微調(diào)出功能穩(wěn)定、高效的數(shù)據(jù)分析能力。1、在
Alaya-ZeroX
模型組開發(fā)的同時,TableAgent
針對企業(yè)用戶領(lǐng)域微調(diào)的需求配套設(shè)計了T+
系統(tǒng),能夠高效的實現(xiàn)定制化的微調(diào)工作,系統(tǒng)性的體系支撐更高效的實現(xiàn)數(shù)據(jù)分析各個環(huán)節(jié)的升級,讓用戶在無感知的情況下即可獲得不斷升級的數(shù)據(jù)分析體驗。概述大模型技術(shù)催生了數(shù)據(jù)分析技術(shù)的進一步跨越,通過將大模型技術(shù)和具體的業(yè)務(wù)深度融合,數(shù)據(jù)分析成為直接為企業(yè)用戶產(chǎn)生更富有商業(yè)價值的應(yīng)用領(lǐng)域?;贒ataCanvasAlaya
九章元識大模型微調(diào)出
Alaya-ZeroX
模型組,開發(fā)的
TableAgent
數(shù)據(jù)分析智能體,是從
0
到
1
的交互式結(jié)構(gòu)化數(shù)據(jù)分析的突破,提供私有化部署方案,保障了業(yè)務(wù)數(shù)據(jù)的安全合規(guī),是企業(yè)數(shù)據(jù)分析的全新方式。作為國內(nèi)首款可以實現(xiàn)私有化部署的企業(yè)級數(shù)據(jù)分析智能體,TableAgent
在充分理解用戶意圖后,可自主的利用統(tǒng)計科學(xué)、機器學(xué)習(xí)、因果推斷等高級建模技術(shù)從數(shù)據(jù)中挖掘價值,進而提供分析觀點和指導(dǎo)行動的深刻見解,賦予企業(yè)用戶具備數(shù)據(jù)分析師的能力。2、TableAgent
融合了公司多個前沿技術(shù)成果,除了在Alaya
大模型的基礎(chǔ),還同時運用了自研開源大模型工具鏈、融合了
DAT
自動機器學(xué)習(xí)和YLearn
因果學(xué)習(xí)算法成果,因此融合了強大的自動化、因果可解釋的
AI
能力。3、TableAgent
提供了效率提升明顯的、確保數(shù)據(jù)分析成果更可用的數(shù)據(jù)分析和能力,為企業(yè)場景的數(shù)據(jù)利用帶來更多可能性。2023
年
11
月
21日,九章云極DataCanvasTableAgent
產(chǎn)品面向社會開放公測(地址:),助力企業(yè)借助大模型技術(shù)發(fā)揮數(shù)據(jù)價值,提高企業(yè)生產(chǎn)經(jīng)營效率。3031垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections三、應(yīng)用落地情況TableAgent
前身為九章云極DataCanvas
公司在6
月
30
日發(fā)布的TableGPT,該產(chǎn)品已經(jīng)在公司內(nèi)部經(jīng)過四個多月的內(nèi)測試用,期間我們不斷升級能力和體驗。在算力準(zhǔn)備充沛之際,于11
月
21
日面向社會開放公測。截至目前,已經(jīng)在金融行業(yè)的客戶流失預(yù)警、產(chǎn)品定價,互聯(lián)網(wǎng)行業(yè)外賣平臺的推薦優(yōu)化、訂單轉(zhuǎn)化,以及油氣、零售、地產(chǎn)等多個業(yè)務(wù)場景得到應(yīng)用,幫助數(shù)據(jù)分析師更加高效賦能業(yè)務(wù),提高企業(yè)經(jīng)營效能。未來,TableAgent將進一步融合非結(jié)構(gòu)化數(shù)據(jù)的分析能力,并與公司自研的DingoDB
多模向量數(shù)據(jù)庫、DataCanvas
Alaya
九章元識大模型聯(lián)合創(chuàng)新,在復(fù)雜分析任務(wù)、自動化、人機交互、智能體協(xié)同等方面進一步升級。效益分析一、經(jīng)濟社會效益1、促進產(chǎn)業(yè)升級:企業(yè)在生產(chǎn)經(jīng)營過程中,每天將產(chǎn)生大量的數(shù)據(jù),尤其是互聯(lián)網(wǎng)行業(yè),數(shù)據(jù)量將達到近百億規(guī)模。在數(shù)智化升級過程中,面向業(yè)務(wù)的人員的需求,技術(shù)人員需要快速響應(yīng)。TableAgent
的應(yīng)用,可以助力企業(yè)高質(zhì)量的完成分析工作,賦予智能化決策測能力,提高企業(yè)經(jīng)營效能,為企業(yè)催生巨大的商業(yè)價值,推動產(chǎn)業(yè)升級發(fā)展。2、加強AI數(shù)據(jù)分析人才培養(yǎng):當(dāng)前業(yè)務(wù)的競爭更是技術(shù)人才的競爭,大模型時代的到來,重塑了
AI
人才的培養(yǎng)。TableAgent
可提高
AI
技術(shù)人才能力,賦予人人都是數(shù)據(jù)分析師的能力。二、商業(yè)模式目前,TableAgent
面向社會免費開放,公眾均可注冊申請試用體驗。三、應(yīng)用推廣前景TableAgent
使用0
門檻,開箱即用,用戶僅需要把企業(yè)屬性數(shù)據(jù)上傳到應(yīng)用后臺即可對業(yè)務(wù)數(shù)據(jù)開展專業(yè)性的分析?;诰耪略茦O自有的Alaya
元識大模型和底層體系,可以適用于各類行業(yè)的數(shù)據(jù)分析,實現(xiàn)對任何特定領(lǐng)域內(nèi)個性化數(shù)據(jù)分析情景下的微調(diào),對行業(yè)沒有限制。目前已經(jīng)在金融、制造、交通、互聯(lián)網(wǎng)、地產(chǎn)、能源等多個行業(yè)進行應(yīng)用驗證,通過近期的公測表現(xiàn),我們相信TableAgent
在未來會有更廣泛的應(yīng)用和更具商業(yè)價值的產(chǎn)出。3233垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections需求分析1、知識碎片化隨著信息的爆炸式增長,知識變得碎片化和分散。企業(yè)需要一個知識管家系統(tǒng)來收集、整理和連接這些碎九章云極知識管家打造企業(yè)專屬大模型智能底座片化的知識。2、信息過載隨著企業(yè)業(yè)務(wù)的快速發(fā)展和創(chuàng)新,大量信息和數(shù)據(jù)不斷涌現(xiàn),缺乏有效的信息篩選處理機制,導(dǎo)致大量信息被堆積和遺忘,無法得到及時有效的利用。3、數(shù)據(jù)及信息安全難北京九章云極科技有限公司隨著企業(yè)知識信息量的不斷增加,信息安全風(fēng)險也不斷增加,企業(yè)的核心知識和敏感信息在知識管理過程中可能泄露。4、知識共享交流難北京九章云極科技有限公司(簡稱:九章云極
DataCanvas)以“創(chuàng)造智能,探索未知”為使命,以“助力全球企業(yè)智能升級”為愿景,是中國人工智能基礎(chǔ)軟件領(lǐng)軍者。公司致力通過自主研發(fā)的人工智能基礎(chǔ)軟件產(chǎn)品系列和解決方案為用戶提供人工智能基礎(chǔ)服務(wù),助力用戶在數(shù)智化轉(zhuǎn)型中輕松完成模型和數(shù)據(jù)的雙向賦能,低成本高效率的提升企業(yè)決策能力,實現(xiàn)企業(yè)級
AI
規(guī)模化應(yīng)用。知識共享機制不足、知識交流渠道不暢、知識共享和交流意愿不足、語言和溝通障礙。5、知識與業(yè)務(wù)融合難知識管理系統(tǒng)和業(yè)務(wù)系統(tǒng)各自獨立,知識和業(yè)務(wù)之間缺乏緊密的關(guān)聯(lián)和互動,企業(yè)的知識與業(yè)務(wù)難融合,會導(dǎo)致業(yè)務(wù)知識的滯后。九章云極DataCanvas
的核心產(chǎn)品系列AIFS
人工智能基礎(chǔ)軟件和DataPilot
數(shù)據(jù)領(lǐng)航員具有高度的靈活性和可擴展性,能夠處理各種類型和規(guī)模的數(shù)據(jù),簡化了數(shù)據(jù)處理和分析的復(fù)雜性。產(chǎn)品集成了一系列先進人工智能技術(shù),包括多模態(tài)向量數(shù)據(jù)庫、因果學(xué)習(xí)、思維件等,為企業(yè)提供AI
軟件開發(fā)新范式。案例介紹一、主要能力九章云極知識管家包括結(jié)合大模型并融合企業(yè)專有知識的
QA問答功能、可自定義角色的定制化對話助手、針對上傳文檔的智能分析ChatDoc
以及后臺相應(yīng)的模型&
微調(diào)管理、知識數(shù)據(jù)管理、智能應(yīng)用Agent
管理等功能。九章云極知識管家作為企業(yè)的專屬大模型智能底座可面向不同場景定義相應(yīng)職位、角色的大模型特色應(yīng)用,比如智能合同審核、營銷文案創(chuàng)作等,幫助企業(yè)逐步打造自己的大模型應(yīng)用體系。概述在大模型技術(shù)浪潮的推動下,企業(yè)知識的處理和應(yīng)用正在發(fā)生全新變化。企業(yè)知識管理面臨著知識碎片化,信息過載,數(shù)據(jù)及信息安全難,知識共享交流難,知識與業(yè)務(wù)融合難等挑戰(zhàn)。九章云極DataCanvas
以
AIFS(AI
Foundation
Software)為根基,發(fā)揮Alaya
九章元識大模型和多模向量數(shù)據(jù)庫的核心能力,打造企業(yè)級知識管家,通過數(shù)據(jù)收集,數(shù)據(jù)處理,寫入向量數(shù)據(jù)庫,集成、微調(diào)大語言模型,知識助手應(yīng)用,以及反饋與迭代優(yōu)化六步過程,為企業(yè)構(gòu)建高度自動化與智能化的企業(yè)知識庫。在六步過程中,企業(yè)知識管家支持全規(guī)模、全類型的企業(yè)知識數(shù)據(jù)收集,并通過數(shù)據(jù)處理將企業(yè)知識轉(zhuǎn)化為高維向量,儲存到DingoDB
多模向量數(shù)據(jù)庫中。根據(jù)企業(yè)需求,企業(yè)知識管家微調(diào)DataCanvasAlaya
九章元識大模型并與向量化企業(yè)知識庫進行交互,通過知識助手將構(gòu)建好的知識庫應(yīng)用于企業(yè)多元業(yè)務(wù)場景。同時為用戶提供便捷的反饋渠道,不斷對企業(yè)知識庫進行迭代優(yōu)化,保證其準(zhǔn)確性和時效性。圖1
產(chǎn)品架構(gòu)圖3435垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections二、技術(shù)創(chuàng)新點作為大模型時代的數(shù)據(jù)處理新范式,基于九章云極元識大模型和向量數(shù)據(jù)庫
DingoDB
前沿技術(shù)能力打造的九章云極知識管家,在金融、制造、通信、能源等眾多行業(yè)擁有豐富的應(yīng)用場景,并已經(jīng)在某頭部汽車制造廠商和城商行進行落地化應(yīng)用,助力用戶企業(yè)構(gòu)建高度自動化與智能化的企業(yè)知識庫。更多豐富行業(yè)應(yīng)用場景,包括:1、自研的多模態(tài)大模型底座支撐——DataCanvasAlaya
九章元識大模型DataCanvas
Alaya
是九章云極DataCanvas
自研的“通識
+
產(chǎn)業(yè)”白盒大模型矩陣,支持多種模態(tài)模式,高效微調(diào)訓(xùn)練,以及Flash
attention
技術(shù)。九章元識提供了一系列不同配置和參數(shù)的,具備業(yè)界前沿能力和技術(shù)的預(yù)訓(xùn)練大模型,可聯(lián)合企業(yè)訓(xùn)練面向金融、通信、制造等行業(yè)的領(lǐng)域垂類多模態(tài)大模型,更好地應(yīng)對行業(yè)復(fù)雜專業(yè)的問題。秉持開放友好的開源理念,九章元識大模型矩陣中的Alaya-7B
已在GitHub
進行開源,開源地址為:/DataCanvasIO/Alaya。金融行業(yè)應(yīng)用場景:金融知識智能問答、智能反欺詐、智能客戶聊天機器人、NL2SQL、代碼生成等、智能
BI
及分析決策、文案創(chuàng)作、文檔生成等;制造行業(yè)應(yīng)用場景:制造工藝問答、售后服務(wù)知識問答、文檔輔助編寫、智能談判、合同審核等;2、大模型時代的數(shù)據(jù)引擎——自研多模向量數(shù)據(jù)庫
DingoDB交通行業(yè)應(yīng)用場景:高速知識問答、司乘人員知識問答、航空專業(yè)知識問答、機電系統(tǒng)維護、道路病害養(yǎng)護、文檔輔助編寫等。DingoDB
是九章云極自研的多模向量數(shù)據(jù)庫,同時提供結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的存儲、分析和科學(xué)計算的能力??芍握?、金融、傳統(tǒng)行業(yè)構(gòu)建企業(yè)級的知識庫,實現(xiàn)語義的精準(zhǔn)搜索與聯(lián)合分析。作為行業(yè)首批,DingoDB
以同批次最好成績完成中國信通院向量數(shù)據(jù)庫技術(shù)標(biāo)準(zhǔn)的測試。DingoDB
多模向量數(shù)據(jù)庫也在
GitHub
進行開源,開源地址:/DingoDB。效益分析一、社會效益3、靈活豐富的大模型智能體
Agent
擴展能力,支持
Agent
擴展和可視化
Agent
編排。4、易用的知識管理及模型微調(diào)功能,可實現(xiàn)企業(yè)知識多模式智能對話問答。1.
私有化部署,實現(xiàn)企業(yè)數(shù)據(jù)隱私保護采取數(shù)據(jù)脫敏、匿名化等技術(shù)手段,確保在訓(xùn)練過程中不泄露個人身份和敏感信息。使用加密算法或差分隱私技術(shù)來保護數(shù)據(jù)的隱私。5、是行業(yè)垂類多模態(tài)大模型基座?;诰耪略茦O
Alaya
元識大模型,可聯(lián)合企業(yè)訓(xùn)練面向金融、通信、制造等行業(yè)的領(lǐng)域垂類多模態(tài)大模型,更好地應(yīng)對行業(yè)復(fù)雜專業(yè)的問題。采用安全多方計算等技術(shù),使得多個參與方能夠在不泄露數(shù)據(jù)的情況下進行計算和模型訓(xùn)練。2.訪問控制和權(quán)限管理6、支持混合多模態(tài)檢索匹配,支持多副本存儲策略和持續(xù)可用的存儲方案,減少數(shù)據(jù)丟失的風(fēng)險。具備良好的可擴展性和海量存儲能力。是高性能知識向量存儲記憶體。7、面向企業(yè)提供定制化的軟硬一體解決方案,全面覆蓋底層算力到上層應(yīng)用的全鏈路,支持一體化部署、產(chǎn)品開箱即用。建立嚴格的訪問控制機制,限制對大模型數(shù)據(jù)的訪問權(quán)限,確保只有經(jīng)過授權(quán)的人員可以訪問和操作數(shù)據(jù)。二、商業(yè)模型三、實施效果可提供軟硬件一體化部署模式,支持永久使用許可和訂閱許可兩種服務(wù)方式。三、應(yīng)用推廣前景隨著大模型技術(shù)的日漸成熟及生成式AI
應(yīng)用的熱度的持續(xù)走高,如何借力新技術(shù)、加速數(shù)智化轉(zhuǎn)型,構(gòu)建差異化競爭力,是企業(yè)當(dāng)下必須深入思考的命題。企業(yè)想要安全可靠的應(yīng)用大模型技術(shù),那么通過知識管家融合企業(yè)內(nèi)部的知識體系便是企業(yè)必須邁出的第一步。九章云極知識管家以此為目標(biāo),基于九章云極在人工智能領(lǐng)域多行業(yè)的長期深耕實踐,打造了包括底層算力框架、垂類微調(diào)大模型、存儲記憶體到智能
QA問答應(yīng)用等全鏈路一體化的大模型應(yīng)用解決方案。通過九章云極構(gòu)建的企業(yè)大模型智能底座可全面支撐企業(yè)“無限創(chuàng)想、觸手可得”的大模型應(yīng)用愿景。目前,大模型產(chǎn)品應(yīng)用市場正在迅速增長。根據(jù)某研究數(shù)據(jù)預(yù)測,預(yù)計2023
年,全球人工智能大模型市場規(guī)模將達到
210
億美元,并在
2028
年使大模型市場規(guī)模達到
1095
億美元。此外,隨著人工智能技術(shù)的不斷發(fā)展,大模型產(chǎn)品的應(yīng)用范圍和功能也在不斷拓展,九章云極知識管家產(chǎn)品可快速完成企業(yè)私有化部署、開箱即用,通過提供軟硬結(jié)合的一體化解決方案,將在大模型時代充分挖掘數(shù)據(jù)價值,助力用戶在數(shù)智化浪潮中輕松完成模型和數(shù)據(jù)的雙向賦能,為用戶帶來靈活高效的數(shù)據(jù)驅(qū)動決策和更加優(yōu)質(zhì)的業(yè)務(wù)發(fā)展,打通企業(yè)應(yīng)用大模型的最后一公里。四、應(yīng)用落地情況3637垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections針對這一背景,“Pixeling
千象”應(yīng)運而生。它集成了圖片生成、視頻生成、圖片編輯等功能,助力用戶零基礎(chǔ)掌握AIGC
一站式能力。平臺基于自研的AIGC
視覺多模態(tài)基礎(chǔ)模型,實現(xiàn)文本、圖片、視頻等多模態(tài)內(nèi)容生成。簡潔易用的界面讓設(shè)計師能更快地完成從構(gòu)思到成品的全過程,提高工作效率?!癙ixeling千象”“Pixeling
千象”還為設(shè)計師打造了活躍的互動社區(qū),便于分享經(jīng)驗、獲取靈感、拓展人脈。用戶在此可以充分發(fā)揮創(chuàng)意,共同成長。此外,平臺還可滿足用戶的個性化需求,讓設(shè)計師在創(chuàng)作過程中實現(xiàn)更多可能性。上海智象未來計算機科技有限公司HiDream.a(i
智象未來),是一家專注于構(gòu)建視覺多模態(tài)基礎(chǔ)模型及應(yīng)用的生成式人工智能初創(chuàng)公司,由加拿大工程院外籍院士、原京東集團副總裁梅濤博士創(chuàng)立。致力于圍繞視覺打造生成式多模態(tài)基礎(chǔ)模型及應(yīng)用,激發(fā)從業(yè)者創(chuàng)造力,提升創(chuàng)作生產(chǎn)力,打造交互式智能內(nèi)容創(chuàng)作新范式。案例介紹“Pixeling
千象”目前包含圖片生成、視頻生成、圖片編輯、3D
生成等功能,是一個面向設(shè)計師的通用設(shè)計工具,同時也是一個服務(wù)于
AIGC
創(chuàng)作的泛設(shè)計內(nèi)容社區(qū)。圖片生成支持核心業(yè)務(wù)是基于自研的生成式視覺多模態(tài)基礎(chǔ)模型,實現(xiàn)文本、圖片、視頻、3D
模型等多模態(tài)內(nèi)容的生成;打造了面向所有設(shè)計師的通用創(chuàng)作工具及泛設(shè)計內(nèi)容社區(qū)“Pixeling(千象)”支持創(chuàng)意生成、藝術(shù)創(chuàng)作、在線編輯等全過程的可視化,幫助用戶實現(xiàn)交互的智能化、作品的個性化,讓用戶的創(chuàng)意得以最大化的釋放;同時面向電商商家推出AI
制圖工具PixMaker,目前支持固定商品
SKU
生成場景圖和人像模特圖生成。文字生成圖片、參考圖生成圖片,支持用戶基于在平臺生成的圖片持續(xù)進行生成創(chuàng)作。概述“Pixeling
千象”是一款全中文、易上手的AIGC
創(chuàng)作平臺和社區(qū),專為設(shè)計師的需求而打造。平臺包含圖片生成、視頻生成、圖片編輯(智能重繪、智能拓圖)等功能,旨在幫助用戶零基礎(chǔ)輕松掌握AIGC
一站式能力,喚醒創(chuàng)造力,解放生產(chǎn)力,全面提升設(shè)計全流程工作效率?!癙ixeling
千象”依托智象未來自研的視覺多模態(tài)生成式基礎(chǔ)模型,實現(xiàn)文本、圖片、視頻等多模態(tài)內(nèi)容生成。模型參數(shù)超過百億,技術(shù)水平行業(yè)領(lǐng)先,為用戶創(chuàng)作提供強大支持()。圖1
千象首頁視頻生成支持需求分析在數(shù)字化時代,AIGC
技術(shù)迅猛發(fā)展,設(shè)計師對易用、高效的中文AIGC
創(chuàng)作平臺需求日益凸顯。市場急需一款全中文界面、一站式服務(wù)、易用且具備互動社區(qū)的
AIGC
創(chuàng)作平臺,以滿足設(shè)計師的多樣化需求。文字生成視頻、圖片生成視頻,用戶可以從本地上傳圖片、或者基于在平臺生成的圖片歷史記錄生成視頻;此外還支持智能運鏡,使畫面更加生動。3839垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections圖2
智能運鏡圖4
智能拓圖圖片編輯支持智能拓圖:“Pixeling
千象”將會自動為用戶進行畫面拓展,并保持細節(jié)的清晰和準(zhǔn)確性。通過智能拓圖,用戶可以將一幅小尺寸的繪畫作品擴展至更大的畫布尺寸,而無需擔(dān)心失真或模糊。通過使用智能拓圖,用戶能夠豐富畫面背景、優(yōu)化圖片格局、增加畫面層次,“Pixeling
千象”在創(chuàng)作思路上為用戶提供了更開闊、更浩瀚的想象空間,讓創(chuàng)作更加自由暢快。圖5
智能拓圖智能重繪:智能重繪允許用戶對生成的圖片作品的特定區(qū)域進行修改和改進。用戶可以通過調(diào)整顏色、線條和細節(jié)等,對選中的部分進行精細調(diào)整。通過智能重繪功能,用戶可以輕松實現(xiàn)對細節(jié)的精益求精,讓作品更加完美。圖3
智能拓圖4041垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections效益分析Pixeling
千象”作為一款全中文AIGC
創(chuàng)作平5
例線臺,憑借卓越的技術(shù)實力和實用的功能體驗,滿足了設(shè)計師在多樣化、個性化方面的需求,為國內(nèi)設(shè)計產(chǎn)業(yè)業(yè)的發(fā)展注入新活力。根據(jù)數(shù)據(jù),“Pixeling
千象”能夠在質(zhì)量、效率、資產(chǎn)等多方面為用戶和客戶持續(xù)提供價值,上手難度降低99%,創(chuàng)意維度增加
75%,節(jié)省
98%的出圖時間,100%
增加內(nèi)容沉淀。經(jīng)濟社會效益方面平臺提供的圖片生成、視頻生成、圖片編輯等功能,能有效幫助設(shè)計師提高工作效率,降低創(chuàng)作成本。依托智象未來自研的視覺多模態(tài)生成式基礎(chǔ)模型,平臺為用戶創(chuàng)作提供強大支持,使設(shè)計師能夠快速完成從構(gòu)思到成品的全過程。商業(yè)模式方面圖6
智能重繪“Pixeling千象”通過提供一站式AIGC服務(wù),吸引設(shè)計師入駐,形成穩(wěn)定的用戶群體。平臺可以進一步挖掘用戶需求,推出更多針對性功能和服務(wù),提高用戶粘性,實現(xiàn)持續(xù)盈利。應(yīng)用推廣方面“Pixeling
千象”充分利用平臺上的豐富資源和活躍社區(qū),助力設(shè)計師拓展人脈、獲取靈感。同時,借助行業(yè)領(lǐng)先的技術(shù)水平和對用戶需求的精準(zhǔn)把握,平臺在設(shè)計師群體中形成良好口碑,實現(xiàn)自發(fā)推廣。通過不斷創(chuàng)新和優(yōu)化服務(wù),“Pixeling
千象”將在設(shè)計領(lǐng)域發(fā)揮更大作用,推動行業(yè)繁榮發(fā)展。圖7
智能重繪圖8
智能重繪4243垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections書生筑夢視頻生成大模型上海人工智能實驗室上海人工智能實驗室是我國人工智能領(lǐng)域的新型科研機構(gòu),開展戰(zhàn)略性、原創(chuàng)性、前瞻性的科學(xué)研究與技術(shù)攻關(guān),突破人工智能的重要基礎(chǔ)理論和關(guān)鍵核心技術(shù),打造“突破型、引領(lǐng)型、平臺型”一體化的大型綜合性研究基地,支撐我國人工智能產(chǎn)業(yè)實現(xiàn)跨越式發(fā)展,目標(biāo)建成國際一流的人工智能實驗室,成為享譽全球的人工智能原創(chuàng)理論和技術(shù)的策源地。多樣化生成方式,夠美夠方便概述書生筑夢視頻生成大模型,通過設(shè)計大規(guī)模視頻生成模型的基礎(chǔ)模型結(jié)構(gòu),機器學(xué)習(xí)方法,建立大規(guī)模數(shù)據(jù)集,構(gòu)建數(shù)據(jù)處理工具,實現(xiàn)了文生視頻大模型系統(tǒng),并在通用場景下實現(xiàn)了
2K
分辨率、支持轉(zhuǎn)場與鏡頭語言的分鐘級長視頻生成。作為一款融合文本、圖像、視頻等多模態(tài)數(shù)據(jù)的視頻生成大模型,書生·筑夢支持由“文生視頻”與“圖生視頻”多樣化任務(wù)。為實現(xiàn)通用文本視頻生成
(Text-to-Video
Generation,T2V),
團隊在與訓(xùn)練文生圖大模型基礎(chǔ)上引入時空建模模塊,并使用圖像視頻聯(lián)合訓(xùn)練的方式,使模型具備了
T2V
能力。在模型中輸入通用文本,書生·筑夢生成了以下視頻。需求分析案例介紹隨著生成式人工智能技術(shù)的發(fā)展,圖像生成模型正在日漸成熟,以
Midjourney
和Stable
Di?usion
為代表的文生圖模型為使用者提供了全新的創(chuàng)作模式。視頻生成,由于其更加廣泛的應(yīng)用場景,以及更加生動的表現(xiàn)方式,受到了越來越多的關(guān)注和需求。因此,設(shè)計能夠生成高畫質(zhì),長視頻的大規(guī)模視頻生成模型,對于廣告設(shè)計、電影制作、以及藝術(shù)創(chuàng)作將產(chǎn)生革命式的變革。作為首個支持故事性、多鏡頭的視頻生成大模型,包含超過30
億參數(shù)的書生·筑夢將全面賦能視頻創(chuàng)作,拓展創(chuàng)意空間。書生·筑夢將AI
生成視頻時長由秒級提升至分鐘級,并使所生成視頻內(nèi)容具備“轉(zhuǎn)場流暢、故事連貫、畫質(zhì)高清”特質(zhì)。憑借強大的語義、圖像理解和生成能力,在多維度評測指標(biāo)中綜合領(lǐng)先。輸入文本(提示詞):海底,魚群,珊瑚礁4445垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections與此同時,團隊基于掩碼的條件視頻擴散模型,將特定圖片作為即將生成視頻的第一幀和對應(yīng)掩碼,實現(xiàn)了由圖片驅(qū)動的視頻生成能力(Image-to-VideoGeneration,I2V)。本項目相關(guān)研究成果已應(yīng)用于央視聽媒體大模型(CMG
Media
GPT)中。該大模型為首個專注于視聽媒體內(nèi)容生產(chǎn)的AI大模型,由上海
AI實驗室與中央廣播電視總臺聯(lián)合推出。于此同時,書生筑夢視頻生成大模型已與商湯科技、想法流、北京電影學(xué)院等單位達成合作意向,正成為推動視聽媒體編創(chuàng)方式變革的
AI
工具。效益分析書生筑夢視頻生成大模型具備生成多樣性和創(chuàng)造性視頻內(nèi)容的非凡能力,為創(chuàng)意和創(chuàng)新開辟了嶄新的可能性。該模型有助于廣告公司、娛樂制作公司等行業(yè)生成獨特的廣告創(chuàng)意、電影特效、虛擬角色等,為觀眾帶來獨具魅力的視覺體驗。傳統(tǒng)的影視制作通常需要投入大量人力、物力和時間。然而,引入該模型作為輔助工具,可以通過自動化和智能化的方式,降低人力成本并加速視頻生成速度。該模型能夠協(xié)助企業(yè)和影視從業(yè)者更快地生成所需的視頻內(nèi)容,從而節(jié)約時間和成本。輸入靜態(tài)圖片,書生·筑夢可讓其生動真實地“流動”起來創(chuàng)新性生成階段,夠清夠流暢連貫的轉(zhuǎn)場鏡頭、生動波折的故事、充滿美感的高清畫質(zhì)缺一不可在影視巨作中缺一不可。在書生·筑夢中,運用AI
直接生成長視頻“巨作”將成為可能。研發(fā)完成轉(zhuǎn)場視頻生成模型,為其輸入多段給定視頻或場景圖片,書生·筑夢可根據(jù)提示詞(prompt)和擴散模型(Di?usion
Model)自動生成轉(zhuǎn)場視頻,從而實現(xiàn)不同場景和視頻之間的“絲滑”連接。在生成多段視頻時,為保證視頻中的主體一致性,研發(fā)團隊提出了保持主體一致性模塊。該模塊的輸入內(nèi)容一張包含主體的圖片和一段文字描述,圖片信息作為文本的一部分,或作為額外的信息加入到網(wǎng)絡(luò)注意力模塊中,即可保證多段視頻中的主體一致。實現(xiàn)生成視頻的“多機位”效果,使長視頻中的故事一致性成為可能。在多個鏡頭的長視頻中,“花朵”主體保持了一致性4647垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections需求分析浪潮之上,大模型的應(yīng)用價值日趨受到關(guān)注。正如歷史上的任何一項新技術(shù),其生命力終究要回歸到是否可以廣泛落地,為世界帶來積極且真實的變化。書生浦語開源大模型相比于國內(nèi)社區(qū)之前陸續(xù)開源的7B
和
13B
規(guī)格的模型,20B量級模型具備更為強大的綜合能力,在復(fù)雜推理和反思能力上尤為突出,因此可為實際應(yīng)用帶來更有力的性能支持;同時,20B
量級模型可在單卡上進行推理,經(jīng)過低比特量化后,可運行在單塊消費級
GPU
上,因而在實際應(yīng)用中更為便捷。上海人工智能實驗室在此背景下,上海人工智能實驗室聯(lián)合多家機構(gòu)推出了中量級參數(shù)的InternLM-20B
大模型,性能先進且應(yīng)用便捷,以不足三分之一的參數(shù)量,達到了當(dāng)前被視為開源模型標(biāo)桿的
Llama2-70B
的能力水平。上海人工智能實驗室是我國人工智能領(lǐng)域的新型科研機構(gòu),開展戰(zhàn)略性、原創(chuàng)性、前瞻性的科學(xué)研究與技術(shù)攻關(guān),突破人工智能的重要基礎(chǔ)理論和關(guān)鍵核心技術(shù),打造“突破型、引領(lǐng)型、平臺型”一體化的大型綜合性研究基地,支撐我國人工智能產(chǎn)業(yè)實現(xiàn)跨越式發(fā)展,目標(biāo)建成國際一流的人工智能實驗室,成為享譽全球的人工智能原創(chuàng)理論和技術(shù)的策源地。案例介紹相比于此前的開源模型,InternLM-20B的能力優(yōu)勢主要體現(xiàn)在:優(yōu)異的綜合性能概述書生浦語開源大模型涵蓋70
億參數(shù)的輕量級版本InternLM-7B,以及
200
億參數(shù)的中量級版本和
InternLM-20B,以及完整的開源工具鏈體系。強大的工具調(diào)用能力更長的語境InternLM-7B
在包含40
個評測集的全維度評測中展現(xiàn)出卓越且平衡的性能,它在兩個被廣泛采用的基準(zhǔn)
MMLU
和
CEval
上分別取得了
50.8
和
52.8
的高分,開源一度刷新了7B
量級模型的紀錄。更安全的價值對齊全線升級的開源工具、數(shù)據(jù)體系InternLM-20B
是基于
2.3T
token
預(yù)訓(xùn)練語料從頭訓(xùn)練的中量級語言大模型。相較于InternLM-7B,訓(xùn)練語料經(jīng)過了更高水平的多層次清洗,補充了高知識密度和用于強化理解及推理能力的訓(xùn)練數(shù)據(jù)。因此,在考驗語言模型技術(shù)水平的理解能力、推理能力、數(shù)學(xué)能力、編程能力等方面,InternLM-20B都有顯著提升,以不足三分之一的參數(shù)量,達到
Llama2-70B
水平。架構(gòu)增強:深結(jié)構(gòu)、長語境相對有限的參數(shù)規(guī)模下,研究人員在架構(gòu)設(shè)計時面臨重要的取舍——提高模型的深度還是寬度?通過廣泛的對照實驗,書生·浦語團隊發(fā)現(xiàn),更深的模型層數(shù)更有利于復(fù)雜推理能力的培養(yǎng)。因此在架構(gòu)設(shè)計時,研究人員把模型層數(shù)設(shè)定為60層,超過7B
與13B
模型通常采用的
32
層或者
40
層設(shè)計;同時內(nèi)部維度保持在
5120,處于適中水平。通過架構(gòu)設(shè)計上的新取舍,InternLM-20B
在較高計算效率的條件下實現(xiàn)了復(fù)雜推理能力的顯著提升。書生浦語開源且可免費商用,基于書生浦語開源代碼、模型、開源工具鏈體系,商業(yè)場景可定制高精度行業(yè)模型。4849垂類大模型大模型服務(wù)大模型落地應(yīng)用案例集通用大模型FoundationModelPracticalApplicationCollections綜合性能增強:多個評測中領(lǐng)先基于
OpenCompass
大模型評測平臺,研究人員在涵蓋語言、知識、理解、推理和學(xué)科能力等五大維度的
50
個主流評測集上,對
InternLM-20B
及相近量級的開源模型進行了全面測試比較。評測結(jié)果顯示,InternLM-20B在全維度上領(lǐng)先于開源13B量級模型,平均成績不僅明顯超越
Llama-33B,甚至優(yōu)于被稱為開源模型的標(biāo)桿
Llama2-70B。調(diào)用工具能力增強:不會也能學(xué)工具調(diào)用是拓展大語言模型能力邊界的重要手段,也是
OpenAI
近期推出大模型的重點特性之一。InternLM-20B對話模型支持了日期、天氣、旅行、體育等數(shù)十個方向的內(nèi)容輸出及上萬個不同的
API。在清華大學(xué)等機構(gòu)聯(lián)合發(fā)布的大模型工具調(diào)用評測集
ToolBench
中,Inter
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化妝鏡、放大鏡、裝飾鏡及各類玻璃制品的生產(chǎn)第二次擴建項目環(huán)評報告表
- 洋浦疏港高速公路工程SG01標(biāo)段拌合站、鋼筋加工場、辦公用房環(huán)評報告(公示稿)環(huán)評報告表
- 2025年化學(xué)氣相沉積硫化鋅(CVDZNS)晶體合作協(xié)議書
- 海南馨島優(yōu)匯生物科技有限公司年產(chǎn)3萬噸微生物菌劑和2萬噸有機水溶肥項目環(huán)境影響報告表公示稿環(huán)評報告表
- 中貝通信被擔(dān)保人最近一期財務(wù)報表
- 內(nèi)蒙古華云新材料有限公司審計報告
- 露天礦山工程邊坡施工方案
- 墩柱滑模施工方案
- 緩釋肥與常規(guī)復(fù)合肥配合施用對水稻產(chǎn)量和品質(zhì)的影響分析
- 醫(yī)療機構(gòu)水污染物排放的治理技術(shù)
- 老年患者出院準(zhǔn)備服務(wù)專家共識
- 2023-2024學(xué)年人教版新教材必修第二冊 第五章第三節(jié) 無機非金屬材料 課件(28張)
- 巖腳煤礦智能化綜采工作面匯報材料2020.11.10.11.10
- 四川省廣安市2021年中考地理真題(含答案)
- 大貨車安全駕駛技巧
- 高考小說閱讀強化訓(xùn)練:孫犁小說專題(附答案解析)
- 互聯(lián)網(wǎng)汽車金融外文文獻翻譯
- 向云端二聲部五線正譜
- DC-DC反激變壓器計算
- 簡約寶貝成長檔案 兒童成長手冊A4版【空白可編輯內(nèi)容】
- 運用PDCA血透室導(dǎo)管感染率
評論
0/150
提交評論