版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
01 02 08 第三章:加快AI轉(zhuǎn)型,構(gòu)建全方位的大模型業(yè)務(wù)落地能力17 25 ·50 55第六章:信賴之選,火山引擎大模型服務(wù)助力省心AI轉(zhuǎn)型58 59 64 6669如同云與機器學(xué)習(xí)、深度學(xué)習(xí)等AI小模型一樣,當(dāng)前大模型技術(shù)也進(jìn)入了與業(yè)務(wù)深度整合的關(guān)鍵時期。64%的中國企業(yè)預(yù)計其對AI的投資將增長10-30%,各企業(yè)正基于具體的業(yè)務(wù)場景,積極探索大模型技術(shù)的實際部署與應(yīng)用潛力,以促大模型能夠大幅提升企業(yè)生產(chǎn)力、驅(qū)動業(yè)務(wù)創(chuàng)新和增長,是具有突破性和顛覆性的技術(shù)。盡管將大模型技術(shù)與業(yè)務(wù)深度結(jié)合是一個復(fù)雜的專業(yè)過程,但在專業(yè)技術(shù)服務(wù)商的持續(xù)支持下,企業(yè)實現(xiàn)大模型部署的周期已縮短至平均6-12個月,企業(yè)正致力于深化業(yè)務(wù)場景探索,以期釋放大模型落企業(yè)正致力于深化業(yè)務(wù)場景探索,以期釋放大模型落為了充分利用大模型帶來的商業(yè)機遇,企業(yè)正不懈探索技術(shù)與業(yè)務(wù)結(jié)合的新模式,逐步打造與自身發(fā)展戰(zhàn)略相契合的大模型應(yīng)用實踐,以期通過大模型技術(shù)的大模型產(chǎn)品和服務(wù)的選擇和技術(shù)伙伴能讓企業(yè)落大模型產(chǎn)品和服務(wù)的選擇和技術(shù)伙伴能讓企業(yè)落超過47%的企業(yè)認(rèn)為,與領(lǐng)先的大模型廠商建立可靠的合作關(guān)系是項目成功的關(guān)鍵。為提升大模型在企業(yè)側(cè)的落地效率,企業(yè)應(yīng)根據(jù)自身業(yè)務(wù)需求和發(fā)展規(guī)劃,重點考慮具備AI大模型全棧開發(fā)能力、模型及插件工具豐富、內(nèi)嵌垂直場景經(jīng)驗?zāi)0宓膹S商,并選擇可以提供事前、事中、事后全周期咨詢和切實可行實踐方案的服務(wù)商通過制定全局周密的策略,并結(jié)合個性化的業(yè)務(wù)實踐經(jīng)驗,企業(yè)將能夠更有效地推動大模型的成功落地,加快AI轉(zhuǎn)031.1業(yè)務(wù)驅(qū)動,大模型助力效率飛躍,實現(xiàn)融合大模型技術(shù)已經(jīng)成為人工智能領(lǐng)域的焦點,驅(qū)動了AI應(yīng)用的升級和創(chuàng)新。基于大規(guī)模數(shù)據(jù)集的預(yù)訓(xùn)練,讓模型具備了高效處理復(fù)雜語言結(jié)構(gòu)、視覺模式以及多模態(tài)信息的能力,促使人工智能在認(rèn)知理解與決策支持方面邁向更高的階段。在產(chǎn)業(yè)應(yīng)用方面,大模型的實施正在改變企業(yè)業(yè)務(wù)開展、產(chǎn)品服務(wù)、運營管理的傳統(tǒng)模式,為各行業(yè)的智能化升級提供了強有力的支撐。企業(yè)端對大模型的應(yīng)用也已從初步的技術(shù)探索與創(chuàng)新嘗試,逐漸步入以實現(xiàn)商業(yè)價值為核心的新時代。眾多企業(yè)正加快步伐,尋找能夠迅速構(gòu)建商業(yè)閉環(huán)、驗證價值的應(yīng)用場景,期望借助1.1.1加碼投資,企業(yè)擴大試點1.1.1加碼投資,企業(yè)擴大試點加大投入力度,AI大模型的關(guān)注度持續(xù)攀升。AI大模型在提升流程效率、增強創(chuàng)新能力方面發(fā)揮著關(guān)鍵作用,并為企業(yè)在市場競爭中贏得優(yōu)勢,例如在個性化營銷內(nèi)容創(chuàng)作、產(chǎn)品設(shè)計創(chuàng)新、用戶體驗優(yōu)化、員工助手打造以及知識專家系統(tǒng)開發(fā)等方面。IDC全球調(diào)研數(shù)據(jù)顯示,37.7%的受訪企業(yè)正在重點投資AI大模型,并預(yù)計在未來三年內(nèi)引入AI軟件及相關(guān)培訓(xùn)和服務(wù)。此外,64%的中國企業(yè)預(yù)計其對AI的投資將增長10-30%。這一顯著的投資增長反映了業(yè)界對AI大模型巨拓展試點范圍,企業(yè)正積極探索AI的應(yīng)用潛力。企業(yè)在AI大模型的應(yīng)用上展現(xiàn)出極高的興趣和參與度,他們通過內(nèi)部研發(fā)、聯(lián)合創(chuàng)新、跨界合作等多種模式,積極探索AI技術(shù)的實際應(yīng)用場景和潛在爆發(fā)力。IDC調(diào)研數(shù)據(jù)顯示,在過去一年里,全球范圍內(nèi)平均對AI大模型項目進(jìn)行了34次概念驗證(POC)測試,這一數(shù)字遠(yuǎn)超其他IT項目,且企業(yè)對AI大模型測試的滿意度高達(dá)70%。這一數(shù)據(jù)表明,AI大模型在解決企業(yè)需求、優(yōu)化運營流程、輔助業(yè)務(wù)拓展方面具有顯著效04果。此外,大多數(shù)CXO級別的高管表示,他們將繼續(xù)增加對AI大模型的各項投1.1.2多維價值,堅定企業(yè)探索大模型潛力的決心1.1.2多維價值,堅定企業(yè)探索大模型潛力的決心IDC研究認(rèn)為,大模型技術(shù)對于企業(yè)價值的貢獻(xiàn)可從對內(nèi)賦能與對外服務(wù)兩大維度進(jìn)行闡釋。具體而言,該價值可細(xì)化為針對企業(yè)員工、用戶群體、營業(yè)收入及市場拓展四個方面,進(jìn)而構(gòu)建出一個全面的“AI大模型價值圖譜”。此圖譜詳細(xì)描繪了大模型技術(shù)在不同維度上對企業(yè)產(chǎn)生的深遠(yuǎn)影響和價值增值,包括工作效率提升、業(yè)務(wù)引導(dǎo)助理、知識數(shù)據(jù)洞察、用戶體驗創(chuàng)新、生產(chǎn)工具賦能、產(chǎn)品服AI大模型來源:IDC大模型價值研究,2024年05面向員工:一是利用AI大模型提供的辦公軟件、流程管理軟件、開發(fā)設(shè)計軟件來提高員工工作效率、縮短重復(fù)和復(fù)雜工作時間;二是利用企業(yè)內(nèi)部知識、經(jīng)驗等無形資產(chǎn)和員工培訓(xùn)、企業(yè)規(guī)范、服務(wù)規(guī)則等文本材料,打造具面向用戶:一是對用戶信息、消費習(xí)慣、興趣愛好等信息進(jìn)行綜合分析,更好地總結(jié)、對比、預(yù)測用戶數(shù)據(jù)變化和趨勢;二是提供全新的使用交互體面向營收:一是為設(shè)計、編程、制造等工作人員的生產(chǎn)工具賦能,自動生成并創(chuàng)新產(chǎn)品內(nèi)容,加快產(chǎn)品的迭代周期和創(chuàng)新速度;二是創(chuàng)新產(chǎn)品形式,從面向市場:一是主動分析外部市場變化和內(nèi)部經(jīng)營數(shù)據(jù),進(jìn)行合規(guī)管理、風(fēng)險預(yù)測、潛在效益分析和建模;二是預(yù)測整體市場表現(xiàn)、各地區(qū)競爭分析、從AI大模型價值圖譜可見,大模型以其強大的能力和廣闊的應(yīng)用前景,有望深入此外,根據(jù)IDC針對企業(yè)用戶的大模型調(diào)研數(shù)據(jù)可以看出,無論是優(yōu)化用戶體驗、加速企業(yè)決策,減少重復(fù)勞動、提升員工生產(chǎn)效率,或是推動產(chǎn)品創(chuàng)新與服務(wù)個性化,大部分的受訪企業(yè)都普遍對大模型帶來的價值抱有高度期待。這一預(yù)期進(jìn)一步提升了企業(yè)將大模型技術(shù)轉(zhuǎn)化為實際應(yīng)用的動力。企業(yè)普遍認(rèn)為大模型在推動業(yè)務(wù)增長、構(gòu)建核心競爭力、提升用戶體驗等方面扮演著關(guān)鍵角色。因此,也有越來越多的用戶更加積極地投入到這場技術(shù)革命中,深挖其背后的商業(yè)0653%46%34%32%29%14%57%0.0%10.0%20.0%30.0%40.0%50.0%60.0%數(shù)據(jù)來源:IDC大模型企業(yè)落地進(jìn)展調(diào)研,N=100,2024年8月1.2百舸爭流,大模型服務(wù)商競逐AI浪潮新時代在企業(yè)用戶持續(xù)增加的投資和日益增長的業(yè)務(wù)需求推動下,大模型服務(wù)商們紛紛加快步伐,競相推動這一技術(shù)從創(chuàng)新突破走向企業(yè)應(yīng)用的實際轉(zhuǎn)化,致力于將大模型從服務(wù)商自身的的探索階段推向企業(yè)落地,以滿足各行各業(yè)對智能化轉(zhuǎn)型的迫切需求。這一趨勢不僅促進(jìn)了大模型技術(shù)的快速成熟,也為企業(yè)用戶帶來了更加豐富和高效的應(yīng)用解決方案,助推了大模型落地需求端和大模型技術(shù)服務(wù)供給一方面,大模型技術(shù)服務(wù)在產(chǎn)品服務(wù)和技術(shù)層面實現(xiàn)了諸多的創(chuàng)新突破。為降低企業(yè)的使用門檻,領(lǐng)先的大模型廠商已經(jīng)成功構(gòu)建了從零到一的端到端解決方案,極大地減少了重復(fù)開發(fā)的必要性。企業(yè)可以借助這些既有模型和服務(wù),避免“重新造輪子”的投入,從而將更多資源和精力集中在業(yè)務(wù)創(chuàng)新上,加速智能化轉(zhuǎn)型的步伐。例如火山引擎持續(xù)豐富豆包大模型家族,基于基礎(chǔ)底座大模型最新發(fā)布視頻生成、文生圖、圖生圖、語音合成、聲音復(fù)刻、音樂、同聲傳譯等更貼合實際場景的模型,將模型能力進(jìn)一步專業(yè)細(xì)化。此外,為加速企業(yè)搭建內(nèi)部智能體的進(jìn)度,火山引擎還打造了HiAgent——一個企業(yè)專屬的AI創(chuàng)新應(yīng)用平臺;它允許業(yè)務(wù)人員利用提示詞、知識庫、插件等工具,以低代碼方式實現(xiàn)AI落地,集成內(nèi)部數(shù)據(jù),降低AI開發(fā)的難度、積累AI中臺的厚度。另一方面,大模型技術(shù)服務(wù)商也在不斷地進(jìn)行能力全面升級,深度服務(wù)業(yè)務(wù)場景。為了幫助企業(yè)更有效地落地大模型技術(shù),技術(shù)服務(wù)商們不遺余力地采用了多種手段來升級自身的服務(wù)能力,深入挖掘各種契合企業(yè)業(yè)務(wù)場景的需求。除了持續(xù)的技術(shù)研發(fā)、優(yōu)化算法、提升數(shù)據(jù)處理能力之外,他們還積極加強對行業(yè)知識的積累,確保為企業(yè)提供能落地、高效率的解決方案。一些大模型技術(shù)服務(wù)商還通過構(gòu)建行業(yè)大模型落地聯(lián)盟、提供專業(yè)咨詢和培訓(xùn)服務(wù)、加強落地場景探索等,全方位地提升自身在幫助企業(yè)應(yīng)用大模型過程中的專業(yè)性和實用性,從而確保AI大模型能夠真正融入企業(yè)的核心業(yè)務(wù),發(fā)揮出最大的價值。如:火山引擎圍繞行業(yè)需求場景,構(gòu)建大模型應(yīng)用生態(tài),連續(xù)成立汽車大模型生態(tài)聯(lián)盟、智能終端大模型聯(lián)盟、零售大模型生態(tài)聯(lián)盟,聯(lián)合業(yè)界頭部企業(yè)、技術(shù)廠商和合作伙伴,幫助企業(yè)能夠以極低的試錯成本將大模型技術(shù)應(yīng)用落地到業(yè)務(wù)場景,共同探索AI驅(qū)動未來發(fā)展,提升運營和開發(fā)效率,全面09在評估大模型的商業(yè)潛力時,企業(yè)和技術(shù)服務(wù)商都普遍持樂觀態(tài)度,并認(rèn)識到這一技術(shù)有望開啟新的商業(yè)機遇。然而,將大模型的潛力轉(zhuǎn)化為實際業(yè)務(wù)效益的過程,無疑充滿了諸多挑戰(zhàn)。在此次革命性的大模型轉(zhuǎn)型旅程中,企業(yè)不僅要擁抱創(chuàng)新帶來的效率和效能提升,還需精心應(yīng)對成本控制、人才短缺、技術(shù)復(fù)雜性以2.1大模型落地面臨多重挑戰(zhàn)IDC調(diào)研顯示,算力成本、隱形的機會成本、投資回報的長周期以及不足的人才算力成本:算力資源的消耗是當(dāng)下阻礙AI大模型落地的最主要因素,這一成本對不少企業(yè)的財務(wù)狀況構(gòu)成了較大的壓力。調(diào)研數(shù)據(jù)顯示,92%的企業(yè)認(rèn)為在大模型工程化落地階段,缺少算力資源是最大的挑戰(zhàn);細(xì)分來看,89%的高管認(rèn)為模型訓(xùn)練成本高,81%的高管認(rèn)為模型推理成本高。對比而言,模型的調(diào)優(yōu)成本已經(jīng)相對低價,僅有35%的企業(yè)認(rèn)為模型調(diào)優(yōu)(Fine-tun-ing/Prompt)成本高。這些成本無疑是企業(yè)財務(wù)投入的重要考量點,使得企業(yè)在做出是否引入大模型的相關(guān)決策時顯得猶豫不決,不得不權(quán)衡預(yù)算和投89.0%89.0%缺少算力資源模型訓(xùn)練成本高數(shù)據(jù)來源:IDC大模型企業(yè)落地進(jìn)展調(diào)研,N=100,2024年8月選擇錯誤下的機會成本:機會成本,雖然并非直接的經(jīng)濟支出,但它同樣是企業(yè)在是否引入大模型決策時不可忽視的成本之一。它代表了企業(yè)為了選擇某一方案而放棄的、可能是更佳替代方案的價值。尤其在瞬息萬變的市場環(huán)境中,企業(yè)抓住機遇的時間窗口極為有限;一旦錯失或在大模型初始的選擇時對其性能、適配度、應(yīng)用能力等方面欠考慮,企業(yè)可能面臨巨大的機會成本,甚至可能要承受數(shù)倍的額外負(fù)擔(dān),如后期不得不進(jìn)行的模型切換、基礎(chǔ)實際與預(yù)期回報仍有差距:根據(jù)IDC的調(diào)研,雖然企業(yè)對AI大模型項目抱有極高的期望,普遍期待能夠?qū)崿F(xiàn)1-3倍的投資回報率(ROI),但現(xiàn)實情況卻與這些美好愿景有所偏差。目前,大多數(shù)企業(yè)觀察到的投資回報實際上低于50%,這一數(shù)據(jù)與其對大模型的高度關(guān)注和前期投資預(yù)期形成了較大的落差。面對這樣的現(xiàn)狀,企業(yè)在投入AI大模型項目時,普遍較為審慎,且在內(nèi)多方面人才積累不足:目前多數(shù)企業(yè)在AI人才方面的儲備尚顯不足。企業(yè)落地大模型不僅亟需專業(yè)的大模型開發(fā)人才,還需要具備算法優(yōu)化、數(shù)據(jù)處理、計算能力、測試驗證等技能的實用型人才。由于AI大模型的全方位開發(fā)人才難以在短期內(nèi)迅速積累,企業(yè)在探索和實施大模型應(yīng)用的過程中,內(nèi)部人才不足,而外部招聘難覓懂自身業(yè)務(wù)又了解大模型落地的專業(yè)人才,使得挑戰(zhàn)2:模型選配難題精準(zhǔn)匹配難,適配挑戰(zhàn)加劇挑戰(zhàn)2:模型選配難題精準(zhǔn)匹配難,適配挑戰(zhàn)加劇部分場景下模型效果接受度低:87%的企業(yè)認(rèn)為模型精度還不能滿足落地要求,無法衡量具體效果;具體表現(xiàn)在涉及用戶信息、面向生產(chǎn)和決策的任務(wù)中,對模型的邏輯推理、任務(wù)執(zhí)行要求更高,而當(dāng)前大模型的泛化性使得企大模型選型困難:在模型的選擇方面,IDC調(diào)研顯示,62%的企業(yè)認(rèn)為市場上模型選擇太多,缺乏選擇的標(biāo)準(zhǔn)和評判依據(jù)。企業(yè)通常參考模型準(zhǔn)確率排行榜、社區(qū)口碑推薦來選擇模型,并自行搭建內(nèi)部業(yè)務(wù)數(shù)據(jù)測試集來簡單評通用模型能力與專業(yè)需求不匹配:IDC調(diào)研顯示,50%的企業(yè)認(rèn)為模型能力模型上線性能難以保證:正式上線后的服務(wù)響應(yīng)時間、穩(wěn)定性、并發(fā)數(shù)、高圖4公司落地大模型面臨的挑戰(zhàn)-模型層62%50%39%87%0.0%10.0%20.0%30.0%40.0%50.0%60.0%70.0%80.0%90.0%數(shù)據(jù)來源:IDC大模型企業(yè)落地進(jìn)展調(diào)研,N=100,2024年8月挑戰(zhàn)3:模型部署落地:細(xì)節(jié)挑戰(zhàn)遍布,每一步都是考驗挑戰(zhàn)3:模型部署落地:細(xì)節(jié)挑戰(zhàn)遍布,每一步都是考驗效果調(diào)優(yōu)路徑多、執(zhí)行難:59%的企業(yè)認(rèn)為模型調(diào)優(yōu)(PromptEngineer-ing/Fine-tuning)是大模型開發(fā)中投入最多且挑戰(zhàn)更大的工作之一。由于模型優(yōu)化方式、路徑、調(diào)整程度選擇多樣且企業(yè)缺少足夠經(jīng)驗和技術(shù)支撐,分裂的開發(fā)環(huán)節(jié)造成事倍功半:企業(yè)在實施大模型的落地過程中,涉及從開效果精細(xì)調(diào)整、Prompt工程、RAG(檢索增強生成)、生態(tài)插件集成、模型性能評估、模型剪枝與蒸餾、模型維護(hù)管理以及算力資源調(diào)度等十余個關(guān)鍵環(huán)節(jié),每個環(huán)節(jié)都涵蓋了眾多細(xì)致的工程化任務(wù),對技術(shù)團(tuán)隊和開發(fā)人員沒有穩(wěn)定的數(shù)據(jù)底座則無法發(fā)揮最大價值:在推進(jìn)大模型應(yīng)用的過程中,數(shù)產(chǎn)進(jìn)行整理,66%的高管期望建立如數(shù)據(jù)湖的支撐性架構(gòu),還有62%的高管挑戰(zhàn)4:潛在安全風(fēng)險與可解釋性的雙重挑戰(zhàn)挑戰(zhàn)4:潛在安全風(fēng)險與可解釋性的雙重挑戰(zhàn)缺少全周期安全可信方案:大模型服務(wù)擁有更長的鏈條,涉及全周期的數(shù)據(jù)和模型管理、模型調(diào)優(yōu)、使用交互、查詢調(diào)用等,因此需要考慮為大模型搭模型生成內(nèi)容準(zhǔn)確性和可解釋性不足:8%的企業(yè)表示希望提高模型和數(shù)據(jù)的可解釋性,這需要大模型學(xué)習(xí)、鏈接關(guān)鍵業(yè)務(wù)信息,并在模型微調(diào)提高精度的同時,確保關(guān)鍵信息不泄露、不被模型學(xué)習(xí)了解,以及數(shù)據(jù)不可隨意被2.2領(lǐng)先企業(yè)已從大模型成功落地中率先獲益在積極探索和落地大模型的過程中,企業(yè)雖然面臨不同程度的挑戰(zhàn),但整體來看,先行擁抱和落地AI大模型的企業(yè)已經(jīng)展現(xiàn)了清晰的收益曲線,不少率先解鎖大模型紅利的先鋒實踐案例為期待大模型為自身業(yè)務(wù)帶來變革的觀望者注入了落2.2.1大模型落地收益曲線2.2.1大模型落地收益曲線IDC以如下收益曲線以描述市場情況,橫縱坐標(biāo)分別表示企業(yè)擁抱AI的程度和企業(yè)獲得的收益。在企業(yè)跨過前期探索和正式投資建設(shè)后,AI大模型的部署和落地可以為企業(yè)帶來明顯可見的收益,包括工作效率的提升、用戶體驗的升級和市場競爭力的增強。但投資回報與前期投入持平的時間點并不是固定的;企業(yè)對大模型擁抱程度越高、資源投入和落地范圍越大、應(yīng)用深度越深,這個時間點也會越S1:小范圍P3:臨界點——大規(guī)模收益與S1+S2投入平衡tP2:應(yīng)用S3:企業(yè)落地P2:應(yīng)用P1:廠商POC驗證S2:規(guī)?;髽I(yè)擁抱AI程度來源:IDC,2024S1:小范圍測試階段——即開始嘗試探索AI大模型應(yīng)用階段。該階段資源投入較少,可明顯為企業(yè)帶來新的體驗和價值增長;但由于僅處在小范圍驗證S2:規(guī)模化開發(fā)階段——即進(jìn)入大模型服務(wù)規(guī)?;度腚A段。由于需要架構(gòu)的開發(fā)和服務(wù)解決方案的落地和時間驗證,企業(yè)所獲得的收益并不明S3:企業(yè)落地與持續(xù)更新階段——即不斷完善更新大模型服務(wù)來增加收益階段。該收益得益于內(nèi)部成本降低、人員效率提高,以及外部產(chǎn)品服務(wù)創(chuàng)新升P1:廠商POC驗證——該點表示為企業(yè)在經(jīng)歷大模型小范圍探索后進(jìn)行大規(guī)模資源投入前的廠商服務(wù)驗證POC時刻。2.2.2搶跑AI2.2.2搶跑AI時代:先鋒企業(yè)率先解鎖大模型紅利實例揭示,AI大模型在企業(yè)應(yīng)用中的成效顯現(xiàn)。大模型具備可以快速落地、不用重復(fù)進(jìn)行基礎(chǔ)工作建設(shè)的優(yōu)勢,因此對企業(yè)而言落地更快、更易見效。IDC調(diào)研顯示,大模型的落地周期多在6-12個月(48.5%)和12-18個月之間(30.3%)。相比于其他IT解決方案,AI大模型應(yīng)用可以更快地上線;尤其是對于互聯(lián)網(wǎng)企業(yè)或是已有AI應(yīng)用基礎(chǔ)的企業(yè),新的AI大模型能力、垂直場景應(yīng)用的上線時間更短,最快可1個月內(nèi)完成落地。因此,率先落地的先鋒企業(yè)已經(jīng)收獲大模型落地的紅利。上汽乘用車?yán)枚拱竽P透祚雎牱答仭坝脩糁暋?。上汽乘用車通過引入豆包大模型,可以快速處理來自公域和私域的“用戶之聲”,并精確理解每條內(nèi)容,在服務(wù)反饋、熱點事件跟蹤和質(zhì)量改進(jìn)等領(lǐng)域取得顯著成效,為用戶帶來更火山引擎助力中國飛鶴落地AI技術(shù)。火山引擎提供HiAgent平臺,針對企業(yè)級市場進(jìn)行深度定制,通過段位劃分策略,幫助企業(yè)員工逐步掌握HiAgent使用,同時通過原廠咨詢、內(nèi)置最佳實踐應(yīng)用效果評測確保達(dá)到生產(chǎn)級標(biāo)準(zhǔn)。平臺將AI技術(shù)融入各個業(yè)務(wù)流程中,從而提升整體運營效率和市場競爭力,為數(shù)字化轉(zhuǎn)型提供了堅實基礎(chǔ);在某智能問答項目中,能夠處理廣泛的消費者咨詢,實現(xiàn)100%的問答響應(yīng)率,同時保持了超過95%的高準(zhǔn)確率?;鹕揭鏀y手中手游為《仙劍世界》打造AINPC。利用火山引擎RAG方案,中手游打造游戲精靈“圓滿”,使其具備更智能的輔助功能,其可以根據(jù)玩家的行為數(shù)據(jù)和游戲內(nèi)的進(jìn)程,提供最適合玩家角色當(dāng)前狀態(tài)的支持,如任務(wù)推薦、玩法說明等,從而減少玩家在游戲中的阻礙感,提升游戲樂趣。火山方舟平臺充分滿足中手游對對游戲的的高RPM/TPM要求,通過按需調(diào)整配額,保障游戲在超企業(yè)CXO普遍預(yù)計,未來一年大模型服務(wù)將會帶來更多的效益改善。面向未增加2%收入、縮短24%流程時間、提高17%員工工作效率、提高7%資產(chǎn)利用數(shù)據(jù)來源:IDC大模型企業(yè)落地進(jìn)展調(diào)研,N=100,2024年8月加快AI轉(zhuǎn)型在當(dāng)前大模型技術(shù)迅猛發(fā)展的背景下,企業(yè)適時、科學(xué)地引入大模型對其長遠(yuǎn)發(fā)展至關(guān)重要。無論企業(yè)目標(biāo)如何,處于哪個發(fā)展階段,把握大模型機遇都是必要的。企業(yè)管理者需從戰(zhàn)略高度規(guī)劃大模型的落地,這不僅是一次技術(shù)革新,也是競爭力聯(lián)合創(chuàng)新降本增效競爭力聯(lián)合創(chuàng)新降本增效業(yè)務(wù)驅(qū)動部署目標(biāo)清晰應(yīng)用場景明確初始意愿業(yè)務(wù)驅(qū)動部署目標(biāo)清晰應(yīng)用場景明確初始意愿戰(zhàn)略驅(qū)動戰(zhàn)略驅(qū)動戰(zhàn)略投入場景尚不明確業(yè)務(wù)分析業(yè)務(wù)場景、流程結(jié)合業(yè)務(wù)場景結(jié)合業(yè)務(wù)分析業(yè)務(wù)場景、流程結(jié)合業(yè)務(wù)場景結(jié)合資源、能力整合場景試點策略數(shù)據(jù)資產(chǎn)盤點資源、能力整合搭建團(tuán)隊業(yè)務(wù)、技術(shù)、流程融合數(shù)據(jù)評估數(shù)據(jù)要素的準(zhǔn)備度資源投入計劃模型選擇效果評估應(yīng)用建設(shè)路徑資源投入計劃模型選擇效果評估應(yīng)用建設(shè)路徑業(yè)務(wù)拓展橫向業(yè)務(wù)場景拓展將大模型的應(yīng)用覆蓋更多的場景縱向業(yè)務(wù)場景拓展將大模型由小范圍、簡單任務(wù)擴展至多節(jié)點、復(fù)雜任務(wù)應(yīng)用智能體應(yīng)用開發(fā)與部署上線應(yīng)用測試、效果評估、項目延展持續(xù)優(yōu)化、應(yīng)用協(xié)作工具鏈、流程、數(shù)據(jù)、場景模型調(diào)優(yōu)戰(zhàn)略規(guī)劃對內(nèi)企業(yè)IT架構(gòu)對外競爭力的改變來源:IDC,20243.1大模型業(yè)務(wù)落地能力建設(shè)三階段提前做好計劃準(zhǔn)備、扎實推進(jìn)模型部署、持續(xù)優(yōu)化迭代三大階段對企業(yè)建設(shè)全方首先明確初始意愿。企業(yè)高管在了解AI大模型解決方案時切忌盲目跟從技術(shù)潮流,而是需要從企業(yè)整體的層面明確落地AI大模型的原始驅(qū)動力,分析與AI結(jié)合戰(zhàn)略驅(qū)動:即企業(yè)可能沒有明確的AI+場景落地計劃,但考慮企業(yè)的發(fā)展環(huán)境、行業(yè)趨勢、競爭態(tài)勢,有必要將大模型落地作為戰(zhàn)略性規(guī)劃的一環(huán)。從戰(zhàn)略布局出發(fā),分析內(nèi)外部發(fā)展環(huán)境,盤點企業(yè)內(nèi)部資源和能力,制定場景業(yè)務(wù)驅(qū)動:企業(yè)已經(jīng)有了非常明確的業(yè)務(wù)場景,迫切地需要引入大模型的能力來進(jìn)行應(yīng)用場景的改造,以實現(xiàn)降本增效、提升效率、優(yōu)化體驗等目標(biāo);執(zhí)行切實可行的業(yè)務(wù)分析策略,了解場景現(xiàn)狀、預(yù)期目標(biāo)、數(shù)據(jù)的就緒度、梳理業(yè)務(wù)流程;深入探索業(yè)務(wù)場景結(jié)合點和需求程度,將大模型解決方案與其次剖析目標(biāo)任務(wù),了解就緒度。在確定需求和目標(biāo)后,從資源盤點、流程梳理、能力自查三個方面來考慮并拆解目標(biāo),充分參考了解大模型落地所需的企業(yè)一是資源盤點,在最短時間內(nèi)梳理內(nèi)部資源,如數(shù)據(jù)資源、算力資源,并分析資源整合的可能性和優(yōu)先級,確定可為AI大模型的落地提供完備的后續(xù)支撐;了解是否數(shù)據(jù)充足、治理水平如何、是否有大量未清洗數(shù)據(jù)、是否需要20二是流程梳理,AI的搭建、應(yīng)用并不是點對點的數(shù)據(jù)傳輸,在模型調(diào)優(yōu)、模型管理、查詢調(diào)用、內(nèi)容生成的過程中,均涉及企業(yè)、部門、團(tuán)隊內(nèi)外的多個組織方和參與方,只有明晰AI執(zhí)行的過程方式,才可以更好地進(jìn)行開發(fā)建三是能力自查,大模型的建設(shè)需要大量專業(yè)人才和業(yè)務(wù)人才共同合作,因此企業(yè)應(yīng)重點考慮評估人才資源基礎(chǔ)和經(jīng)驗知識儲備,制定研發(fā)創(chuàng)新的人才投入形式,是否需要低代碼、輕量化的開發(fā)平臺,以及是否需要外部合作來進(jìn)最后,搭建跨部門團(tuán)隊確保大模型落地的推進(jìn)。大模型是對企業(yè)人員、市場、產(chǎn)品、業(yè)務(wù)場景的賦能,不僅僅是“底座”“中臺”等概念;其需求的提出和最終實現(xiàn)均來源于使用方,而非僅靠數(shù)據(jù)部門、科技部門的采購開發(fā)就可以落地。企業(yè)應(yīng)充分獲得高級管理者的支持,搭建跨部門協(xié)作團(tuán)隊,制定人、財、物資源的管理和監(jiān)管制度,確保資源的即時響應(yīng)和快速供給,實現(xiàn)資源的有效整合和優(yōu)化40%38%31%30%29%28%27%18%14%45%0.0%10.0%20.0%30.0%40.0%50.0%數(shù)據(jù)來源:IDC大模型企業(yè)落地進(jìn)展調(diào)研,N=100,2024年8月模型部署是最核心的落地環(huán)節(jié),將直接影響企業(yè)應(yīng)用AI大模型的實現(xiàn)效果,因此資源投入計劃:明確開發(fā)AI大模型落地過程中所需要的專業(yè)人才、資金投模型選擇:結(jié)合具體的需求從模型精度、效果、參數(shù)規(guī)模、場景匹配度來篩效果預(yù)測:預(yù)測AI大模型上線后的實際效果,包括準(zhǔn)確率、用戶體驗、響應(yīng)時間、TPM、RPM(TPM:TokensPerMinute每分鐘Tokens數(shù)量;RPM:RequestsPerMinute每分鐘請求數(shù));應(yīng)用建設(shè)路徑:規(guī)劃AI大模型的建設(shè)周期、落地具體場景、覆蓋使用廣度、開發(fā)平臺搭建:為AI大模型的應(yīng)用率先搭建好底層開發(fā)平臺,覆蓋LLMOps全流程,接入豐富的Agent工具鏈、API管理服務(wù)和數(shù)據(jù)引擎平臺;可以重模型接入方式:即考慮模型接入和部署應(yīng)用的方式,包括云端接入、API管理、線下部署;面向簡易快速上線以及企業(yè)級、部門級應(yīng)用定制化開發(fā),挑效果調(diào)優(yōu):即提升模型效果使其更滿足自身業(yè)務(wù)需求,主要可通過Prompt工程、RAG增強檢索生成、有監(jiān)督調(diào)優(yōu)、基于人類反饋優(yōu)化等;應(yīng)用上線:即考慮應(yīng)用上線范圍和管理,包括跨平臺、系統(tǒng)部署、跨數(shù)據(jù)源AI大模型在應(yīng)用測試和效果評估后可正式上線,但這并不是整個流程的結(jié)束,企業(yè)還應(yīng)重點考慮模型的可成長性。隨著使用量和使用方向的增多,應(yīng)進(jìn)一步開展調(diào)優(yōu)訓(xùn)練和知識管理,達(dá)到“越用越好”的效果。因此,模型的部署完成并非終點,企業(yè)仍需持續(xù)關(guān)注并致力于大模型在三個關(guān)鍵層面的迭代與優(yōu)化:智能體應(yīng)用效能的提升、跨業(yè)務(wù)領(lǐng)域的拓展應(yīng)用,以及對企業(yè)整體戰(zhàn)略規(guī)劃的對內(nèi)和對外對于開發(fā)上線的AI智能體應(yīng)用,企業(yè)可以持續(xù)提升模型的精度、改善用戶體驗,例如通過AB測試評估調(diào)優(yōu)后的效果,并針對在應(yīng)用服務(wù)過程中遇到的工具缺失、流程混亂、數(shù)據(jù)管理困難、場景需求升級等問題進(jìn)行優(yōu)化完善,以業(yè)務(wù)擴展,即將已成功的基于大模型的應(yīng)用擴展至相關(guān)或更復(fù)雜的業(yè)務(wù)領(lǐng)域橫向業(yè)務(wù)拓展:在實際應(yīng)用AI大模型中,企業(yè)往往會首先選擇1-2個易于落地、急需改善的場景進(jìn)行項目試點,當(dāng)完成項目上線并評后,可結(jié)合積累的技術(shù)、開發(fā)、流程、管理經(jīng)驗,共享同一和資源,進(jìn)一步將模型應(yīng)用到其他場景中,服務(wù)不同的人員縱向場景延伸:知識管理、對話問答、查詢分析是AI大模型最先落地的場景,隨著模型的升級和應(yīng)用需求的加深,企業(yè)應(yīng)考慮將務(wù)擴展至多層次、復(fù)雜任務(wù),打造可以同時滿足多個任務(wù)的智能體,探戰(zhàn)略規(guī)劃,即從企業(yè)整體的視角評估大模型部署落地后對企業(yè)整體競爭力的改變,同時關(guān)注其對IT基礎(chǔ)設(shè)施的影響。持續(xù)關(guān)注企業(yè)對外的差異化競爭優(yōu)勢:當(dāng)AI大模型應(yīng)用上線后,企業(yè)應(yīng)重點考慮競爭環(huán)境,了解其他企業(yè)與AI的結(jié)合深度和布局計劃,評估、判斷自身企業(yè)在當(dāng)前和未來的競爭力和優(yōu)勢對比,從而制定、明確AI大模型下一輪的投資和開發(fā)計劃,以促進(jìn)應(yīng)用和產(chǎn)品的迭代,對內(nèi)關(guān)注企業(yè)整體數(shù)字化基礎(chǔ)設(shè)施的能力:大模型上線后,企業(yè)IT基礎(chǔ)設(shè)施面臨一系列的變化,包括計算資源需求、服務(wù)器負(fù)載、存儲管理、安全性和隱私保護(hù)等。因而企業(yè)需要關(guān)注現(xiàn)有IT系統(tǒng)的升級和優(yōu)3.2破除落地大模型的思維誤區(qū)對大模型落地這一新的企業(yè)課題,在準(zhǔn)備、實施和優(yōu)化三大階段中,企業(yè)容易產(chǎn)生認(rèn)知誤區(qū)。這些誤區(qū)如同迷霧,籠罩在企業(yè)前進(jìn)的道路上。為幫助猶豫觀望的企業(yè)梳理發(fā)展路徑,避免在大模型落地過程中走不必要的彎路,我們歸納了先行VSVS大模型的訓(xùn)練確實需要大量的計算資源和資金,但并不意要承擔(dān)大模型全部的費用和成本投入。目前,大模型技術(shù)服務(wù)預(yù)訓(xùn)練、模型微調(diào)、算法優(yōu)化等技術(shù)降本的方式,使企業(yè)以相本享受大模型的技術(shù)優(yōu)勢。企業(yè)用戶可以直接選擇成熟的預(yù)訓(xùn)VS開發(fā)大模型不是需要用戶獨立建立開發(fā)流程、實現(xiàn)端到端商能提供全周期的開發(fā)平臺和流程推薦,并提供插件、測試、數(shù)據(jù)管理等“開箱即用”和低代碼的工具組件,幫助企業(yè)更加敏捷、快速地應(yīng)用AVS關(guān)注短期內(nèi)大模型帶來的價值產(chǎn)出,而忽略長效投入下的上線不等于AI應(yīng)用落地的結(jié)束,還需要長期的投入。僅關(guān)注短期產(chǎn)出,可VS擔(dān)心引入大模型會伴隨著產(chǎn)生數(shù)據(jù)隱私和數(shù)據(jù)安全的風(fēng)險,型落地對現(xiàn)有數(shù)據(jù)資產(chǎn)和數(shù)據(jù)價值發(fā)揮的推動作用。實際上,大供應(yīng)商圍繞大模型開發(fā)和使用提供了全棧安全可信解決方案,可來源:IDC,2024隨著大模型在眾多企業(yè)中的落地實踐不斷取得成功,其應(yīng)用場景正逐步拓寬。這些企業(yè)在不同業(yè)務(wù)場景中的積極探索和驗證,使得大模型的能力得到了廣泛認(rèn)可。從最初的業(yè)務(wù)試點到如今的深度融入,大模型的應(yīng)用范圍不斷擴展,涵蓋了4.1大模型應(yīng)用場景不斷擴寬,應(yīng)用日漸成熟IDC研究總結(jié)了十大核心能力和十大應(yīng)用領(lǐng)域,每個應(yīng)用領(lǐng)域下梳理十個細(xì)分場景,梳理了AI大模型落地應(yīng)用場景全景圖,并分析其落地成熟度和發(fā)展?jié)摿?,以十大核心能力:包括文本生成、圖像生成、視頻生成、推薦搜索、數(shù)據(jù)分十大應(yīng)用領(lǐng)域:包括金融、互聯(lián)網(wǎng)、零售消費、醫(yī)藥健康、智能終端、游市場營銷研報分析展業(yè)拓客金融風(fēng)控代客交易情感陪伴商品推薦數(shù)字人交互營銷文案生成辦公輔助搜索問答廣告推送智能客服教育培訓(xùn)市場營銷研報分析展業(yè)拓客金融風(fēng)控代客交易情感陪伴商品推薦數(shù)字人交互營銷文案生成辦公輔助搜索問答廣告推送智能客服教育培訓(xùn)設(shè)計研發(fā)智慧門店供應(yīng)鏈管理廣告?zhèn)€性化數(shù)字員工文案視頻設(shè)計銷量預(yù)測用戶行為分析商品搜索推薦售前售后客服商品介紹生成AI藥物研發(fā)專利分析。手術(shù)機器人醫(yī)生助手診后回訪監(jiān)測論文總結(jié)智能導(dǎo)診分診用藥推薦個人健康助手患者問答任務(wù)劇情設(shè)計任務(wù)動作建模用戶數(shù)據(jù)分析角色屬性生成廣告視頻生成任務(wù)規(guī)劃對話陪聊視覺感知交互。工廠機器人終端設(shè)備研發(fā)個人助手語音控制產(chǎn)品排產(chǎn)廣告推薦營銷文案生成智能座艙產(chǎn)品設(shè)計市場營銷供應(yīng)鏈管理銷量預(yù)測論文助手科研結(jié)果創(chuàng)新機器人輔助作業(yè)出題批改行政管理助手新聞撰稿輿情分析圖片生成興趣愛好推薦虛擬人形象企業(yè)知識問答辦公流程輔助商業(yè)智能數(shù)字人客服供應(yīng)鏈管理落地成熟度L1L2L3L4發(fā)展?jié)摿Φ椭懈邅碓矗篒DC,2024互聯(lián)網(wǎng)對AI大模型的接受程度最高,企業(yè)希望實現(xiàn)運營成本的降低和產(chǎn)品設(shè)計創(chuàng)新,如搜索問答、廣告推送、商品推薦、營銷文案生成、教育培訓(xùn)、辦公輔助等已開始規(guī)模化落地應(yīng)用。此外,情感陪伴也表現(xiàn)出了更大圖文生成能力已廣泛應(yīng)用于商品介紹生成、售前售后客服場景,大幅降低人力成本并保證內(nèi)容準(zhǔn)確性。此外,銷量分析和預(yù)測、用戶行為分析等數(shù)據(jù)分析功能,也通過BI升級的形式來服務(wù)更多人員。當(dāng)前AI大模型主要用于輔助場景,如藥物研發(fā)中靶點發(fā)現(xiàn)、分子合成,以及智能問診助手、導(dǎo)診分診等。另外,養(yǎng)老場景中也有較大的應(yīng)用潛力,例如,利用AI實現(xiàn)視頻安全監(jiān)控、文化娛樂、情感陪伴、出行輔助等功以手機、電腦、智能家居為主的終端設(shè)備在積極融合AI能力,開發(fā)智能對話、任務(wù)控制等基礎(chǔ)能力。面向未來,手機有著明顯的優(yōu)勢——可移動,APP功能豐富,應(yīng)用生態(tài)底座全面,SoC芯片持續(xù)升級且具備攝像頭拍攝能力,可作為大模型的個性化開發(fā)底座來進(jìn)行問答、執(zhí)行、控制。筆記本電腦則更多圍繞系統(tǒng)工具的升級來實現(xiàn)輔助辦公、代碼開發(fā)、視覺感知和控制等功能。智能家居在對話理解和語音控制的過程中,可以給人更自然的體驗,而不僅是關(guān)鍵詞識別和觸發(fā)。另外,同時具備多模態(tài)感知和可移動能力的智能眼鏡、AR設(shè)備也是大模型落地的熱點領(lǐng)域。優(yōu)質(zhì)游戲的開發(fā)成本巨大,成功后也會帶來明顯回報。對于優(yōu)質(zhì)內(nèi)容和游戲玩法的設(shè)計、數(shù)值策劃、闖關(guān)類型、人機匹配等,大模型尚不能完全替代;如當(dāng)前大部分設(shè)計策劃仍由人來設(shè)計測試,不需要復(fù)雜的算法介入,人機匹配則大多是機器學(xué)習(xí)領(lǐng)域的強化學(xué)習(xí)和模仿學(xué)習(xí)。目前AI大模型多用于2D圖像生成、語音生成、智能客服、違規(guī)詞監(jiān)測、3D人物和動作生這一賽道的企業(yè)已經(jīng)將“AI+”列為2024年重點目標(biāo),投資動力明顯,更新路徑也從基礎(chǔ)的內(nèi)容生成、數(shù)據(jù)分析、知識問答,延伸至個人助理、跨30新聞生成、圖片素材生成、音樂生成等單模態(tài)能力已在現(xiàn)實生活中廣泛應(yīng)用。隨著GPT-4o的發(fā)布,視頻生成領(lǐng)域、圖片生成視頻、文字生成視頭部教育機構(gòu)擁有足夠的題庫積累,覆蓋幼兒教育、學(xué)前教育、小學(xué)教育、初中教育、高中教育、職業(yè)培訓(xùn)、大學(xué)和考公考研全年齡段,依靠AI生成能力來提供試題生成、批卷打分、口語分析、虛擬教師等功能。大模汽車與AI大模型的結(jié)合主要分成四個模塊,包括智能座艙、企業(yè)服務(wù)、自動駕駛和智能制造。目前多家車企已上線智能座艙和企業(yè)服務(wù),如車內(nèi)控制、導(dǎo)航娛樂、知識管理、市場營銷等,通過語音對話、意圖識別、RAG檢索、指令生成、FunctionCall、API調(diào)用、插件調(diào)用、內(nèi)容整理和生成4.2眾多行業(yè)企業(yè)深入大模型落地實踐隨著大模型應(yīng)用場景的不斷拓展和應(yīng)用的日益成熟,我們看到了越來越多的大模型成功落地案例。這些案例如同路標(biāo),為眾多企業(yè)指明了落地的方向,提供了實實在在的參考。企業(yè)可以從中了解到先進(jìn)的技術(shù)應(yīng)用經(jīng)驗,感受到大模型帶來的賽力斯始創(chuàng)于1986年,是一家以新能源汽車為核心業(yè)務(wù)的技術(shù)科技型汽車企業(yè),旗下主要產(chǎn)品包括AITO問界系列高端智慧新能源汽車、藍(lán)電新能源汽車、瑞馳電動商用車等,秉承著“推動汽車能源變革,創(chuàng)享智慧移動生活”的使命,專注技術(shù)自研,在三電技術(shù)、增程技術(shù)、電子電氣提升用戶反饋閉環(huán)效率:通過優(yōu)化從收集、分析到響應(yīng)用戶反饋的整個流程,加快用戶問題優(yōu)化業(yè)務(wù)部門決策支持:基于對用戶反饋的及時處理與準(zhǔn)確判斷,提升相關(guān)業(yè)務(wù)部門的業(yè)務(wù)厘清用戶反饋處理流程中各項工作環(huán)節(jié),借助豆包大模型建設(shè)用戶之聲管理平臺(VOC:VoiceofCustomers);梳理公私域平臺有關(guān)用戶反饋的數(shù)據(jù)源頭,打通企業(yè)工單系統(tǒng),同時對接內(nèi)部協(xié)同辦公軟件,如飛書、釘釘、企微等,依托火山引擎提供的數(shù)據(jù)采集與分析能力,為業(yè)務(wù)部門提供第火山引擎基于豆包大模型的理解、分類與總結(jié)能力,攜手賽力斯共創(chuàng)用戶之聲管理平臺,實現(xiàn)了用戶反饋分析、處理工作由人工承接轉(zhuǎn)為模型承接情緒正負(fù)向判定:豆包大模型可對反饋內(nèi)容做上下文理解,輸出“正向”、“中立”、“負(fù)內(nèi)容標(biāo)簽提取:在火山引擎600+“開箱即用”的汽車行業(yè)標(biāo)簽支持下,豆包大模型可基于客戶預(yù)設(shè)的標(biāo)簽體系對內(nèi)容打標(biāo),包含品牌、車系、車型、維度、觀點等,輸出結(jié)果定位對內(nèi)容觀點總結(jié):豆包大模型能提取用戶反饋內(nèi)容中的主要觀點,例如其可將一篇3,000字的反饋精簡至200-300字,并結(jié)構(gòu)化地提煉核心觀點,從而幫助運營大幅提升對于內(nèi)容的理實時數(shù)據(jù)采集與分析:火山引擎數(shù)據(jù)產(chǎn)品助力用戶之聲管理平臺,可實時采集公私域數(shù)據(jù),包含資訊、評價、投訴、建議等多個維度的圖文、視頻信息,并支持品牌、車系、車型的下在豆包大模型的幫助下,VOC管理平臺有效提升了賽力斯的用戶反饋閉環(huán)效率,縮短了處基于火山引擎提供的數(shù)據(jù)分析能力,賽力斯的風(fēng)險監(jiān)控水準(zhǔn)得以進(jìn)一步提升,并推動各個業(yè)上海汽車集團(tuán)股份有限公司(簡稱“上汽集團(tuán)”)作為國內(nèi)規(guī)模領(lǐng)先的汽車上市公司,努力把握產(chǎn)業(yè)發(fā)展趨勢,加快創(chuàng)新轉(zhuǎn)型,正在從傳統(tǒng)的制造型企業(yè),轉(zhuǎn)變?yōu)槊嫦蛳M者提供移動出行服務(wù)主要需求:高效處理海量數(shù)據(jù),精準(zhǔn)分析用戶反饋高效處理海量數(shù)據(jù):需要快速處理和分析大量用戶的反饋信息,以確保不會錯失任何重要的精準(zhǔn)分析用戶反饋:需要能夠準(zhǔn)確識別和理解用戶反饋中的關(guān)鍵點和情感傾向,以便更好地快速響應(yīng)市場變化:需要通過高效的數(shù)據(jù)處理和精準(zhǔn)的反饋分析,獲得及時且有價值的洞整合來自各類垂直媒體、論壇、微博、企業(yè)APP等渠道的用戶反饋數(shù)據(jù),為豆包大模型的分場策略調(diào)整。34海爾消費金融成立于2014年,是由海爾集團(tuán)發(fā)起設(shè)立的持牌金融機構(gòu),經(jīng)銀保監(jiān)批準(zhǔn)設(shè)立的全國性持牌消費金融公司,旗下?lián)碛小昂栂M金融”“夠花”兩款A(yù)PP,通過科技金融為用戶提改善服務(wù)體驗:在客戶服務(wù)的全生命周期中,積極引入大模型智能化支持手段。借助音色復(fù)刻、RTC(Real-timeCommunication)等先進(jìn)技術(shù),全力打造智能化服務(wù)體系,顯著提整理貸款知識、客戶信息、員工手冊等內(nèi)容,做好數(shù)據(jù)安全管理后,與豆包大模型連接,提組織員工培訓(xùn),學(xué)習(xí)大模型使用方式和建議,建立生成Prompt模板。通過扣子搭建適合不基于字節(jié)跳動豆包大模型精調(diào)的大模型,能夠滿足海爾消金90%以上的智能化場景需求,包火山引擎提供了火山方舟大模型服務(wù)平臺、扣子AI原生應(yīng)用開發(fā)服務(wù)平臺、算力管理平臺等提供完善的模型應(yīng)用數(shù)據(jù)治理體系,提供豐富多樣的獨享技術(shù)方案,嚴(yán)格遵循安全合規(guī)的要在資產(chǎn)管理過程中,通過與火山引擎的合作,引入豆包大模型能力,在初始應(yīng)用階段,效果提升達(dá)到15-20%;海爾消費金融坐席助手摘錄過程中可達(dá)到超過95%的準(zhǔn)確率。每天節(jié)約坐席專員1-3小時,海爾消金與火山引擎共同成立金融大模型聯(lián)合創(chuàng)新實驗室,致力于構(gòu)建消費金融垂直大模型,并在精準(zhǔn)營銷、智能客服、貸后管理、風(fēng)控等業(yè)務(wù)場景中持續(xù)探索大模型的創(chuàng)新應(yīng)用,未來將聯(lián)合研發(fā)智能客服機器人,利用多模態(tài)智能服務(wù)、自動質(zhì)檢、情感分析等,自動摘“在引入大模型后,現(xiàn)在實際的落地效果非常顯著,最典型的要數(shù)海爾消金的貸后管理工作。此外在客服領(lǐng)域里邊,也對客戶意圖進(jìn)行識別,可以更精準(zhǔn)地理解客戶“在引入大模型后,現(xiàn)在實際的落地效果非常顯著,最典型的要數(shù)海爾消金的貸后管理工作。此外在客服領(lǐng)域里邊,也對客戶意圖進(jìn)行識別,可以更精準(zhǔn)地理解客戶于事后對客戶進(jìn)行管理。”海爾消金CIO梁樹峰中國飛鶴:利用AI實現(xiàn)企業(yè)全面的AI轉(zhuǎn)型升級作為全國乳品行業(yè)龍頭企業(yè),中國飛鶴1962年創(chuàng)立于趙光農(nóng)場,迄今已有60多年歷史,是中國最早的奶粉企業(yè)之一。根據(jù)第三方調(diào)研機構(gòu)全新數(shù)據(jù),2019年-2023年度,飛鶴連續(xù)5年銷量位居全國首位。同時,飛鶴奶粉連續(xù)兩年全球銷量第一,旗下星飛帆系列已連續(xù)3年成為全球第一大單品。截至2023年1月,中國飛鶴在嬰幼兒奶粉中市占率達(dá)21.5%,穩(wěn)居市場第一。重塑基礎(chǔ)設(shè)施能力,攜手火山引擎搭建先進(jìn)的云架構(gòu)、業(yè)務(wù)中臺和數(shù)據(jù)中臺,確保數(shù)據(jù)處理選擇AI能力中臺核心組成部分,面向?qū)嶋H業(yè)務(wù)場景和需求,重點建設(shè)大模型能力、數(shù)字人、數(shù)字孿生、智能推薦、音視頻、VR/AR等;將應(yīng)用場景分成用戶運營觸達(dá)、渠道銷售和企業(yè)管理三大類,每個類別下重點建設(shè)具體應(yīng)用基于飛鶴信息化建設(shè)“3+3+2”的戰(zhàn)略藍(lán)圖,飛鶴聚焦搭建集成基礎(chǔ)設(shè)施層、能力層、接入層、場景層全覆蓋的AI能力中臺。通過明晰業(yè)務(wù)需求、愿景及資源狀況,火山引擎為飛鶴AI圍繞HiAgent平臺,火山引擎針對企業(yè)級市場進(jìn)行深度定制,提供成熟解決方案,通過段位劃分策略,幫助企業(yè)員工逐步掌握HiAgent使用,同時通過原廠輕咨詢、內(nèi)置最佳實踐和應(yīng)HiAgent平臺發(fā)揮了核心作用,將AI技術(shù)融入各個業(yè)務(wù)流程中,從而提升整體運營效率和市某智能問答項目能夠處理廣泛的消費者咨詢,實現(xiàn)100%的問答響應(yīng)率,同時保持了超過95%的高準(zhǔn)確率?!癆I“AI大模型已在消費者服務(wù)、線下活動檢核、企業(yè)辦公、導(dǎo)購培訓(xùn)、數(shù)據(jù)分析和智慧農(nóng)牧等多個業(yè)務(wù)場景中廣泛應(yīng)用,為飛鶴的創(chuàng)新發(fā)展注入新動力?!敝惺钟危簽椤断蓜κ澜纭反蛟熵S富的AINPC生態(tài)中手游是領(lǐng)先的全球化IP游戲運營商,以IP為核心,通過自主研發(fā)和聯(lián)合研發(fā),為全球玩家提供精品IP游戲。圍繞自有IP《仙劍奇?zhèn)b傳》,持續(xù)為粉絲創(chuàng)造精品內(nèi)容和互動體驗,打造世界級IP,并將《仙劍世界》打造成全球首個國風(fēng)仙俠虛擬世界。主要需求:為《仙劍世界》打造AINPC,落地RAG技術(shù),保障游戲服務(wù)穩(wěn)定為《仙劍世界》打造AINPC:基于大模型搭建豐富的AI玩法,打造具有長期記憶和成長能力的AINPC;落地RAG技術(shù):通過RAG技術(shù)進(jìn)一步提升模型的推理效果,優(yōu)化AI游戲內(nèi)容的表現(xiàn);對基座大模型、RAG解決方案中的向量數(shù)據(jù)庫等關(guān)鍵組件,進(jìn)行了大量評估,并搭建開發(fā)提供豆包·角色扮演模型,助力中手游打造行為獨立、可對玩家的行為做出個性化的反應(yīng)游戲氛圍NPC;基于豆包大模型能力幫助中手游打造玩家專屬劍靈“圓滿”,其可為玩家提供問題解答、任務(wù)引導(dǎo)、功能喚起、智能傳送、戰(zhàn)斗BUFF、時辰播報等功能;通過召回能力優(yōu)秀的豆包·向量化模型、P90延時僅18.2ms的向量數(shù)據(jù)庫VikingDB等組件,搭建一站式RAG解決方案,為中手游建設(shè)游戲RAG知識庫提供技術(shù)支撐;40提供依托火山引擎充沛公有云GPU資源池打造,底層算力充足,且支持分鐘級完成千卡擴基于豆包大模型打造的AINPC生態(tài)在《仙劍世界》游戲中被全面應(yīng)用,塑造了一個對于玩火山引擎RAG解決方案,幫助游戲精靈“圓滿”具備了更智能的輔助功能,例如其可以根據(jù)玩家的行為數(shù)據(jù)和游戲內(nèi)的進(jìn)程,提供最適合玩家角色當(dāng)前狀態(tài)的支持,如任務(wù)推薦、玩火山方舟平臺充分滿足了中手游對于游戲的高RPM/TPM要求,通過按需調(diào)整配額,保障游戲在超大流量下的服務(wù)穩(wěn)定性,同時提供全面的算法與工程優(yōu)化能力,支撐豆包大模型在更加細(xì)分場景中的快速落地,并打造極致性價比,助力中手游降低模型使用時的技術(shù)、資金與中手游技術(shù)中心總監(jiān)“目前大模型已經(jīng)在中手游項目開發(fā)流程中的多個環(huán)節(jié)投入應(yīng)用?;鹕揭孢@樣一位高中手游技術(shù)中心總監(jiān)“目前大模型已經(jīng)在中手游項目開發(fā)流程中的多個環(huán)節(jié)投入應(yīng)用?;鹕揭孢@樣一位高效、值得信賴的云服務(wù)商伙伴,在這中間扮演著至關(guān)重要的角色?!闭憬髮W(xué)信息技術(shù)中心:落地全方位大模型應(yīng)用體系,構(gòu)造浙江大學(xué)是一所特色鮮明、在海內(nèi)外有較大影響的綜合型、研究型、創(chuàng)新型大學(xué),設(shè)有7個學(xué)部、40個專業(yè)學(xué)院(系)、1個工程師學(xué)院、2個中外合作辦學(xué)學(xué)院、7家直屬附屬醫(yī)院。截至2023年底,學(xué)校有全日制學(xué)生67656人、國際學(xué)生5514人、教職工9557人。2022年,浙江大融合模型能力:大模型時代技術(shù)背景下,校園教學(xué)、科研、管理、服務(wù)等系統(tǒng),亟待融入大獲得跨越式發(fā)展:浙大西湖之光算力聯(lián)盟已經(jīng)建成了良好的基礎(chǔ)設(shè)施,由火山引擎大模型方案構(gòu)建的AI應(yīng)用,將繼續(xù)推動自身的發(fā)展和基火山引擎HiAgent平臺為建設(shè)“浙大先生”門戶及AI科學(xué)家等系列智能體場景應(yīng)用,提供了四大多模型接入和多維數(shù)據(jù)整合:實施多模型接入策略,根據(jù)不同場景應(yīng)用需求精選最合適的模型,以多維數(shù)據(jù)整合能力有效處理不同數(shù)據(jù)庫的多樣化業(yè)務(wù)數(shù)據(jù),為各場景應(yīng)用提供可靠的集成化工作空間協(xié)同開發(fā):高效構(gòu)建并利用集成化工作空間,實現(xiàn)多供應(yīng)商之間無縫的數(shù)據(jù)流轉(zhuǎn)與深度協(xié)同開發(fā),減少“數(shù)據(jù)孤島”信息摩擦,確保整個開發(fā)鏈路每個環(huán)節(jié)都能基于最靈活的發(fā)布與集成機制:通過靈活地發(fā)布和集成Chatbot、Copilot、Agent多種形式的AI模型應(yīng)用自動化調(diào)測優(yōu)化:提供效果評測、應(yīng)用Tracing、Debugging等能力,支持工作流與智能體的快速調(diào)試,支持通過評測集、評測任務(wù)方式自動化驗證應(yīng)用效果與問題發(fā)現(xiàn),加僅花7天時間,就實現(xiàn)了“浙大先生”大模型應(yīng)用體系的完整、高效構(gòu)建,讓AI應(yīng)用走進(jìn)課堂、校園、實驗室等場景,為超過6萬名在校師生等打造了更智能化的教學(xué)教務(wù)、科研創(chuàng)在大模型能力支持下,“浙大先生”應(yīng)用體系為用戶提供高度定制化的AI服務(wù)與支持,全面AI科學(xué)家:提供全學(xué)科數(shù)據(jù)庫、知識庫、通用AI科研助手等工具,快速鏈接算力平臺、課堂智能問答:深度融合大模型與向量數(shù)據(jù)庫,精準(zhǔn)處理教案、考試要求等課堂資料,教務(wù)咨詢:以智能交互提供專業(yè)教育咨詢,強化政策文件檢索與理解,助力學(xué)生高效掌百事通助手:整合超600項網(wǎng)上服務(wù)事項,覆蓋學(xué)習(xí)、生活、行政等多個場景,為師生本地生活助手:精準(zhǔn)捕捉意圖,為師生篩選、推薦貼合需求的餐飲,并提供頁面地址及慧學(xué)外語:提供豐富多樣、高效使用的課程信息與學(xué)習(xí)對話體43蘇泊爾:構(gòu)建AI驅(qū)動的“居家食養(yǎng)健康”物聯(lián)場景生態(tài)蘇泊爾成立于1994年,2004年在深交所上市,是中國炊具行業(yè)首家上市公司。蘇泊爾擁有6大研發(fā)制造基地,分布在杭州、武漢、紹興、玉環(huán)、柯橋和越南,通過持續(xù)創(chuàng)新和對品質(zhì)的始終堅持,在小家電行業(yè)保持領(lǐng)先地位。產(chǎn)品涵蓋烹飪用具、廚房電器、家居與個人護(hù)理電器等多個領(lǐng)域。云饌平臺是蘇泊爾旗下的智慧生活共創(chuàng)平臺,為消費者居家健康烹飪?nèi)珗鼍疤峁┝祟I(lǐng)先的解主要需求:提供個性化健康食譜,增強蘇泊爾APP使用體驗,建設(shè)智能炒菜機生態(tài)提供個性化見刊食譜:提升廚房烹飪品類電器的內(nèi)容生產(chǎn)效率,同時滿足消費者對于個性化增強APP體驗:提供多場景中食譜智能檢索和推薦體驗;建設(shè)智能炒菜機生態(tài):提升智能炒菜機生態(tài)服務(wù)能力,為炒菜機用戶提供一日三餐“居家食蘇泊爾工作重點:優(yōu)化以往PaaS-SaaS-APP的軟件架構(gòu)模式,借助“AgentasAPI”方式實現(xiàn)智能體與蘇泊爾APP、蘇泊爾IoT產(chǎn)品直連,提升開發(fā)效率和用戶體驗。火山引擎扣子專業(yè)版提供了靈活編排搭建AI智能體的能力,加速蘇泊爾云饌系列智能體的構(gòu)建;扣子平臺靈活的API支持,令蘇泊爾以“AgentasAPI”的方式應(yīng)用智能體成為可能:云撰食譜創(chuàng)作:結(jié)合用戶綁定的廚電產(chǎn)品及家庭飲食情況,智能體可借助豆包大模型和文生44云饌AI尋味:可在扣子專業(yè)版的智能體編排技術(shù)支持下,于蘇泊爾APP尋味欄目中,實現(xiàn)多云饌居家食養(yǎng)健康:借助扣子平臺智能體語音交互OpenAPI、音色克隆、音色合成API等能力,提升蘇泊爾智能炒菜機的服務(wù)水平,為消費者提供每日三餐“配餐式”的健康美食日歷云饌食譜創(chuàng)作智能體針對蘇泊爾旗下電飯煲、電壓力鍋、烤箱、空氣炸鍋等重點品類,月均服務(wù)超15萬蘇泊爾APP會員,好評度逐步提升。云饌AI尋味智能體日均服務(wù)蘇泊爾APP會員一日三餐2萬多次。*數(shù)據(jù)取自蘇泊爾云饌平臺,2024年10月至今。蘇泊爾AIOT中心總監(jiān)張作強“蘇泊爾聯(lián)合豆包大模型與扣子AI蘇泊爾AIOT中心總監(jiān)張作強“蘇泊爾聯(lián)合豆包大模型與扣子AI智能體平臺,深入居家健康烹飪等多領(lǐng)域,以'AgentasAPI'直連產(chǎn)品,優(yōu)化了IoT平臺架構(gòu),提效研發(fā)且用戶體驗得以優(yōu)化。憑技術(shù)創(chuàng)新構(gòu)建'居家食養(yǎng)健康'物聯(lián)生態(tài),賦予烹飪電器人格化體驗,給消費者帶來智能便捷的健康烹飪新生活?!?5海底撈品牌創(chuàng)建于1994年,歷經(jīng)二十多年的發(fā)展,海底撈已經(jīng)成長為國際知名的餐飲企業(yè)。截至2022年12月底,海底撈擁有上千家直營餐廳。海底撈多年來歷經(jīng)市場和顧基于豆包大模型,火山引擎為海底撈搭建了用戶評價分析模型,通過對用戶評價進(jìn)行情緒、觀點豆包大模型具有更強性能,可通過語言處理能力,對顧客評價中有關(guān)環(huán)境、菜品、服務(wù)等不同維度內(nèi)容進(jìn)行抽取,同時判斷顧客評價時正向/負(fù)向情緒:提供進(jìn)一步精細(xì)化分析能力,從服務(wù)、產(chǎn)品、衛(wèi)生提供不同顆粒度總結(jié)報告,以直觀、數(shù)字可視化形式46海底撈信息科技部產(chǎn)品負(fù)責(zé)人楊炫之“AI在餐飲行業(yè)的應(yīng)用,不能一味地考慮邊際效用,也需要結(jié)合服務(wù)體驗,海底撈是以服務(wù)立足的企業(yè),在海底撈信息科技部產(chǎn)品負(fù)責(zé)人楊炫之“AI在餐飲行業(yè)的應(yīng)用,不能一味地考慮邊際效用,也需要結(jié)合服務(wù)體驗,海底撈是以服務(wù)立足的企業(yè),在AI方案的選擇上,也一直在追求“以人為本,體驗第一”的原則。”招商銀行落地智能體,形成更全面AI能力提供更智能化、個性化客戶服務(wù):以自然流暢語言交互方式,滿足金火山引擎為招商銀行的智能化創(chuàng)新提供了擁有低門檻智能體構(gòu)建能力的扣子平臺,以豐富的企業(yè)級插件、靈活的以扣子平臺為依托,招商銀行舉辦了為期三個月、范圍覆蓋全行的“大模型應(yīng)用創(chuàng)新大賽”,加速大模型及智依托扣子平臺打造的“掌上生活優(yōu)惠”及“財富看點”等智能體,為用戶提供生活優(yōu)惠查詢以及市場行情分析打造的智能助手以更自然的交互方式,以及更智能化、個性化的服務(wù),提升用戶滿意度及粘性;招商銀行內(nèi)部大模型及智能體技術(shù)的普及,為后續(xù)更多貼合自身業(yè)務(wù)需求的AI智能體構(gòu)建奠領(lǐng)克汽車將AI領(lǐng)克汽車將AI打造成銷售顧問的得力助手智能化工具助理:智能化建檔,匹配現(xiàn)代消費者購買行為,豐富銷火山引擎與領(lǐng)克汽車構(gòu)建了同SalesCopilot技術(shù)深度融合的豆包大模型銷售助理,以及實時對練和評級系統(tǒng)、用豆包大模型銷售助理:通過豆包大模型,銷售顧問可以獲取關(guān)于本品和競品汽車產(chǎn)品的深度知識,以及市場趨實時對練和評級系統(tǒng):SalesCopilot提供的對練系統(tǒng)能夠模擬各種銷售場景,讓銷售顧問在實際接待和跟進(jìn)客用車知識工具:銷售顧問可以通過這一工具快速訪問到關(guān)于汽車維護(hù)、操作和功能的詳細(xì)信息,并可以通過客戶手冊,查閱以視頻等方式輸出的豐富內(nèi)容,從而更精準(zhǔn)地滿足客戶需求,提供個性化、更高效的服務(wù),助力銷售業(yè)績成功達(dá)成,打造業(yè)務(wù)增長新空間;靈活的底層算力支持,使得領(lǐng)克汽車能夠以極低成本快速落地48提升用戶互動性:打造嚴(yán)格遵循人設(shè)要求,且具備基本常識對話問答能力的AI角色,以主動開啟新話題等方式服務(wù)穩(wěn)定:為保證更好的對話體驗,提升用戶留存率,需要延時穩(wěn)定在40-50ms,并保障RPM&TPM請求。火山引擎為想法流提供了效果更強的豆包大模型,以提供PE提示詞調(diào)優(yōu)方式協(xié)助AI游戲的制作,并將制作指南開放提供給PGC創(chuàng)作者參考;通過MoE架構(gòu)模型和充足資源保障,滿足客戶對延時和RPM/TPM的要求。通過接入豆包大模型,想法流獲得了用戶每日互動次數(shù)1.5-2.5倍、人均互動輪次1.5-3.5倍于其他模型的增長,部分內(nèi)容場景中人均對話高達(dá)150輪以上。同時,在火山引擎千萬級TPM資源保障下,平臺線上請求成功率達(dá)99.95%,token間時延平均控制在40-50ms內(nèi)?;鹕揭鏋樯罹S智信提供了豆包大模型,以模型能力對運營數(shù)據(jù)分析過程進(jìn)行提效,同時以模型能力加持、實現(xiàn)分析銷售會話數(shù)據(jù),提供基于語義的智能質(zhì)檢配置和分析,識別客戶異議、卡點分析、關(guān)鍵矛盾、交易復(fù)盤,語義分析的召回率相對于常規(guī)質(zhì)檢工具提升55%以上,幫助客戶將新人入職培訓(xùn)時間縮短50%,平均成單時長減少22%,平均人效提升31%。49經(jīng)營策略調(diào)整:基于用戶對菜品口味、門店服務(wù)扣子專業(yè)版提供低代碼開發(fā)環(huán)境,使得沒有編程基礎(chǔ)的業(yè)務(wù)人員也能輕松完成智能體的開發(fā)。和府的業(yè)務(wù)人員借助扣子產(chǎn)品的強大編排能力和豐富的插件功能,結(jié)合豆包大模型的技術(shù)支持,實現(xiàn)了更高效、更精準(zhǔn)的用戶點評基于模型的多層次理解,結(jié)合環(huán)境、服務(wù)、菜品等關(guān)鍵詞,對評論進(jìn)行智能分類,并提取相關(guān)標(biāo)簽,綜合準(zhǔn)確率超過95%。分析結(jié)果以JSON格式輸出,便于開發(fā)團(tuán)隊進(jìn)行后續(xù)數(shù)據(jù)的處理和應(yīng)用。和府撈面打造的“顧客點評分析”智能體,能夠替代人工、高效完成顧客點評工作,為門店建立對顧客的高效洞借助扣子專業(yè)版強大的編排能力和豐富的插件能力,中和農(nóng)信在沒有耗費研發(fā)人力資源的情況下,實現(xiàn)了質(zhì)檢智借助扣子單Agent(LLM模式)搭建,并將智能體發(fā)布為API,實現(xiàn)了每天都通過API來自動獲取員工自媒體智能體主要依靠視頻理解插件和豆包大模型的能力進(jìn)行信息獲取和處理等批量、自動化場景,免除了意圖識扣子提供的低代碼搭建環(huán)境、豐富的插件和強大的workflow組件,使得中和農(nóng)信智能體的開發(fā)過程中幾乎沒有耗費研發(fā)資源,2人經(jīng)過3天的開發(fā)和調(diào)試就達(dá)到了滿意效果,成功上線。基于對眾多企業(yè)應(yīng)用實踐的總結(jié)分析和對技術(shù)應(yīng)用的研究,IDC總結(jié)了大模型部署落地的技術(shù)路徑。這套路徑融合了實際操作中的寶貴經(jīng)驗,為企業(yè)引入和應(yīng)用大模型提供了清晰的指南,確保了大模型技術(shù)落地的高效性和穩(wěn)定性,助力企業(yè)5.1大模型落地部署技術(shù)步驟數(shù)據(jù)TPMRPM建設(shè)周期落地場景覆蓋廣度創(chuàng)新深度模型精度模型精度模型效果參數(shù)規(guī)模場景匹配度購買規(guī)模使用方式服務(wù)選擇跨數(shù)據(jù)源API管理LLMOpsAgentAPI管理數(shù)據(jù)平臺PromptPromptRAGSFTRLHF來源:IDC,2024確定團(tuán)隊建設(shè)路徑,整合大模型開發(fā)人才、調(diào)優(yōu)人才、數(shù)據(jù)人才、業(yè)務(wù)人才,重點考慮是否需要引入外部人才或展開外部合作,保證大模型開發(fā)應(yīng)用盤點內(nèi)部數(shù)據(jù),制定數(shù)據(jù)采集、數(shù)據(jù)清洗和數(shù)據(jù)治理計劃,使其更好服務(wù)于了解大模型市場提供產(chǎn)品的功能特性和應(yīng)用效果,面向需求定制,使用內(nèi)部和外部測試集來測試模型效果,并充分體現(xiàn)評估集對業(yè)務(wù)指標(biāo)的考量,選擇從訓(xùn)練和推理效率、延遲以及調(diào)用成本方面挑選最合適規(guī)格的大模型,可參考模型大小、硬件支持水平、服務(wù)SLA水平;重點考慮該模型與企業(yè)目標(biāo)業(yè)務(wù)場景的匹配度,是否需要調(diào)優(yōu)或經(jīng)過簡單調(diào)在選擇模型后,企業(yè)應(yīng)考慮從具體落地的場景和使用效果出發(fā),來預(yù)測模型上線后的業(yè)務(wù)指標(biāo)達(dá)成率、實際體驗效果、各功能平均時延、最大吞吐等工預(yù)估需要調(diào)整優(yōu)化的投入和開發(fā)難度,確保使用者擁有最好的AI應(yīng)用體驗,隨著大模型應(yīng)用廣度和深度的增加,大模型的覆蓋范圍和使用頻率會規(guī)模化提升,推理時算力資源的消耗額度也將同步增加;企業(yè)應(yīng)重點考慮算力購買算力有公有云、私有云等多種方式,應(yīng)根據(jù)自身業(yè)務(wù)體量和實際需求挑選成搭建LLMOps平臺,保證AI大模型的開發(fā)建設(shè)和管理擁有完整的工具鏈條,利用外部AI廠商成熟的Agent工具實現(xiàn)AI大模型的快速開發(fā)和應(yīng)用,直接使54為AI大模型采集、產(chǎn)生和使用的多模態(tài)數(shù)據(jù)搭建可靠的數(shù)據(jù)平臺底座,實現(xiàn)從場景安全需求、數(shù)據(jù)隱私保護(hù)需求、管理便捷程度、成本等方面來選擇模重點考慮后續(xù)調(diào)優(yōu)的成本以及模型更新的代價;目前來看,云端接入是多數(shù)可選擇Prompt工程、RAG知識庫等簡單、低代碼、無代碼方式進(jìn)行效果調(diào)優(yōu),需重點考慮AI廠商是否具備豐富的經(jīng)驗沉淀、算法模型和模板預(yù)置,如RAG過程中提供成熟的嵌入、檢索和重排序模型;選擇SFT、RLHF等復(fù)雜方式進(jìn)行調(diào)優(yōu);這一過程需要更高水平的開發(fā)人員在模型上線前最關(guān)鍵的步驟是進(jìn)行性能安全測試,包括性能、安全、風(fēng)控測試,對內(nèi)容生成效率、數(shù)據(jù)內(nèi)容泄露風(fēng)險、敏感詞等進(jìn)行測試;例如TPM(TokensPerMinute每分鐘Tokens數(shù)量)、RPM(RequestsPerMinute每分鐘請求數(shù)),保證大流量、高并發(fā)場景下運行穩(wěn)定;重點考慮互聯(lián)網(wǎng)場景應(yīng)用更深、服務(wù)人數(shù)更廣的AI廠商,其擁有更多的數(shù)據(jù)根據(jù)業(yè)務(wù)場景重點考慮AI大模型的跨平臺、跨系統(tǒng)上線,統(tǒng)計應(yīng)用上線出口,明確是否需要開發(fā)額外的用戶界面、客戶端,還是與已有服務(wù)界面融合做好底層數(shù)據(jù)的管理,保證模型上線后不同使用群體、不同問題和任務(wù)可以5.2精準(zhǔn)選模、高效落地、持續(xù)挖掘—在大模型落地的眾多技術(shù)步驟與細(xì)節(jié)之中,精準(zhǔn)選模、開發(fā)平臺、伙伴與同行這三個方面顯得尤為關(guān)鍵。精準(zhǔn)選模確保了所選模型與業(yè)務(wù)需求的高度匹配,為后續(xù)應(yīng)用打下堅實基礎(chǔ);開發(fā)平臺則是模型訓(xùn)練與優(yōu)化的關(guān)鍵場所,直接影響到模型的性能發(fā)揮與落地效率;而伙伴與同行則關(guān)乎技術(shù)支持、資源共享與協(xié)同創(chuàng)5.2.1模型的選擇:企業(yè)實現(xiàn)AI5.2.1模型的選擇:企業(yè)實現(xiàn)AI轉(zhuǎn)型的關(guān)鍵充分的業(yè)務(wù)場景論證將保證商業(yè)應(yīng)用的成功。實驗室環(huán)境下的模型水平與實際業(yè)務(wù)落地存在一定認(rèn)知差距,企業(yè)需要重點考慮該模型背后是否有更大的使用量、有充分的業(yè)務(wù)場景論證;更多的模型使用可以保證更快的迭代升級,包括通用基礎(chǔ)模型和多場景的模型家族,能帶來更好的、更貼合業(yè)務(wù)場企業(yè)需要文生文、文生圖、聲音復(fù)刻、語音合成、語音識別、視頻生成等多樣化、多模態(tài)模型,并實現(xiàn)多源數(shù)據(jù)的同時接收、判斷、思考、處理、檢模型應(yīng)具備廣泛塑造、即時可用的靈活性。大模型作為企業(yè)創(chuàng)新提效工具,5.2.2一站式大模型服務(wù)平臺:解決模型部署的復(fù)5.2.2一站式大模型服務(wù)平臺:解決模型部署的復(fù)雜難題選擇提供全?;⒆詣踊?、智能化使用體驗的大模型服務(wù)平臺。AI大模型不同于傳統(tǒng)的計算機視覺、自然語言處理等小模型,大參數(shù)模型所使用的開發(fā)、調(diào)優(yōu)工具更多、更復(fù)雜,對平臺功能的一體化要求也更高,導(dǎo)致企業(yè)很難依賴過去自建的開發(fā)流程和平臺。平臺不僅需要覆蓋從場景分析、模型選型、數(shù)據(jù)集管理、RAG、工具插件、數(shù)據(jù)評估、效果調(diào)優(yōu)、測試評估、部署上線、監(jiān)控優(yōu)化的全開發(fā)鏈路,還需要提供自動化的流程和工具,減少人員重復(fù)、不必要的工作負(fù)擔(dān),讓其專注于模型的效果優(yōu)化。例如,火山方舟在提供多樣化且易于使用的調(diào)優(yōu)框架的基礎(chǔ)上,準(zhǔn)備了豐富的實踐案例和落地指南,并圍繞RLHF開發(fā)了獎勵函數(shù)更易實現(xiàn)的低成本方案。保證從POC到上線運營的全生命周期數(shù)據(jù)和安全。企業(yè)CXO高管需意識到,大模型的安全可信不同于傳統(tǒng)的安全概念,涉及數(shù)據(jù)輸入、知識管理、問答處理、記憶檢索、輸出監(jiān)控的全鏈條周期,這些都會影響大模型本身和生成內(nèi)容的安全和可信。例如,火山引擎的數(shù)據(jù)加密服務(wù)可實現(xiàn)對話過程的考慮AI廠商團(tuán)隊是否能提供專業(yè)的技術(shù)服務(wù)支持和咨詢保障。調(diào)研顯示,有28%的企業(yè)認(rèn)為內(nèi)部缺乏AI大模型相關(guān)技能和人才,26%的企業(yè)擔(dān)心生成結(jié)果不準(zhǔn)確或內(nèi)容幻覺問題。而企業(yè)自身的人才團(tuán)隊和經(jīng)驗無法保證平臺以最優(yōu)路徑搭建,需要外部AI廠商的專業(yè)支持,輔助、引導(dǎo)其搭建適合自身業(yè)務(wù)的、定制化的、滿足實際個性化需求的大模型服務(wù)平臺。因此,可以從團(tuán)隊服務(wù)規(guī)模、案例數(shù)量、目標(biāo)場景經(jīng)驗積累、技術(shù)相應(yīng)程度、客戶評價等方面5.2.3合作伙伴:持續(xù)挖掘大模型應(yīng)用潛力的關(guān)鍵5.2.3合作伙伴:持續(xù)挖掘大模型應(yīng)用潛力的關(guān)鍵選擇好的技術(shù)服務(wù)商可以為企業(yè)帶來更大的直接價值和潛在收益。IDC調(diào)研數(shù)據(jù)顯示,47%的企業(yè)認(rèn)為與AI大模型伙伴建立良好的合作關(guān)系來推動項目落地是能否取得成功的最重要因素。服務(wù)領(lǐng)先的AI廠商可以給項目帶來效率提升、產(chǎn)品創(chuàng)新、收益增加和成本降低等價值,大幅提升企業(yè)生產(chǎn)力、驅(qū)動業(yè)務(wù)創(chuàng)新和增長。同時,選擇好的技術(shù)服務(wù)商也可以享受后續(xù)模型更新、持頭部AI廠商已經(jīng)先行探索并積累大量經(jīng)驗。大模型的落地需要專業(yè)的伙伴和長時間檢驗,頭部AI廠商已經(jīng)在汽車、零售、教育、泛互聯(lián)網(wǎng)等多個行業(yè)服務(wù)并有了豐富的實踐指導(dǎo)和案例參考;計劃采購AI服務(wù)的企業(yè)則可借此對大模型有更充分的了解并知悉如何發(fā)展自身業(yè)務(wù),避免重復(fù)試錯帶來的成本,火山引擎大模型服務(wù)加速企業(yè)AI轉(zhuǎn)型火山引擎作為國內(nèi)大模型領(lǐng)域的重要技術(shù)服務(wù)商之一,憑借其豆包大模型,火山方舟大模型服務(wù)平臺,如扣子、HiAgent等多樣的企業(yè)級智能體開發(fā)平臺,及其在眾多行業(yè)的成功落地經(jīng)驗和高效的服務(wù)響應(yīng),成為企業(yè)AI轉(zhuǎn)型中值得選擇的優(yōu)6.1豆包大模型自火山引擎2024年5月發(fā)布豆包大模型以來,依托企業(yè)內(nèi)部真實業(yè)務(wù)場景數(shù)據(jù)、外部案例合作以及實際場景中的工程化問題,豆包大模型架構(gòu)和參數(shù)不斷優(yōu)化和增加,其模型效果已獲得眾多企業(yè)認(rèn)可。截至9月,豆包大模型的日均tokens使用量已經(jīng)超過1.3萬億,4個月的時間里tokens整體增長超過10倍。豆包持續(xù)強化大語言模型、語音大模型、視覺大模型的能力水平,并在通用模型的基礎(chǔ)上,面向行業(yè)領(lǐng)域不斷豐富模型家族,多樣化的垂直場景細(xì)分模型可適配客戶的專業(yè)需求,更加專業(yè)和深入的案例實踐可以加速垂直場景模型優(yōu)化迭代。豆包通用模型pro為自研大語言模型專業(yè)版本,支持256k長文本,具備更強的理解、生成、邏輯等綜合能力,適配問答、總結(jié)、創(chuàng)作、分類等場景。與pro版本對應(yīng)的是lite輕量化版本,可為企業(yè)提供更低token成本和更低延遲。豆包模型家族的視頻生成、角色扮演、語音合成、語音復(fù)刻、文生圖、圖生圖模型已廣泛在內(nèi)外部場景應(yīng)用,例如電商營銷、動畫教育、城市文旅、音樂MV、微電影、短劇、沉浸式聽書、陪伴式AI交互、視頻配音、電商60適配多種業(yè)務(wù)場景,驅(qū)動業(yè)務(wù)增長豆包通用模型pro字節(jié)跳動自研LLM模型專業(yè)版,支持256K長文本,全系列可精調(diào),具備更強的理解、生成、邏輯等綜合能力,適配問語豆包通用模型lite語型模言語大型模大音字節(jié)跳動自研LLM模型輕量版,對比專業(yè)版提供更低token成本、更低延型模言語大型模大音豆包·角色扮演模型型視覺大模豆包·FunctionCall模型型視覺大模豆包·向量化模型聚焦向量檢索的使用場景,為LLM知豆包·文生圖模型豆包豆包·文生圖模型更精美的文字理解能力,圖文匹配更準(zhǔn)確,畫面效果更優(yōu)美,擅長對中國文化通過精準(zhǔn)語義理解、強大動態(tài)及運鏡能更精美的文字理解能力,圖文匹配更準(zhǔn)確,畫面效果更優(yōu)美,擅長對中國文化豆包·語音識別模型更高的準(zhǔn)確率及靈敏度,更低的語音識別延遲,支持多語種的正確識豆包·語音合成模型提供自然生動的語音合成能力,善豆包·聲音復(fù)刻模型豆包·同聲傳譯模型提供超低延時且自然高質(zhì)量的實時翻譯,支持跨語言同音色翻譯,打豆包·音樂模型豆包·圖生圖模型快速生成精美寫真,支持50余種風(fēng)格變換,并對圖片實現(xiàn)擴圖、重來源:火山引擎,20246.2火山方舟大模型服務(wù)平臺功能全景圖教育娛樂聊天客服代碼...高代碼開發(fā)SDKAssistantAPI運行與托管調(diào)試低代碼搭建多渠道分發(fā)RAG知識庫插件扣子插件專區(qū)計算器網(wǎng)頁解析模型測評模型服務(wù)模型治理和安全豆包通用模型pro豆包通用模型lite豆包·視頻生成模型豆包·文生圖模型豆包·圖生圖模型豆包·同聲傳譯模型豆包·語音識別模型豆包·語音合成模型豆包·聲音復(fù)刻模型豆包·角色扮演模型豆包·FunctionCall模型豆包·向量化模型ChatGLMMoonshotMistral7BMistral8x7BSDXL1.0來源:火山引擎,2024強勁的系統(tǒng)承載力保證大模型應(yīng)用發(fā)揮乘數(shù)效應(yīng)?;鹕揭嫣峁╊I(lǐng)先的算力充沛供給、推理層優(yōu)化策略和高水平系統(tǒng)調(diào)度能力,保證企業(yè)面臨大模型需求涌現(xiàn)時可以擁有瞬時可用、極致彈性的海量資源。在面對科研、汽車、教育等不同場景下的高并發(fā)需求時,豆包通用模型pro可最高支持10kRPM和800kTPM,遠(yuǎn)超同行水平,并且可以根據(jù)實際需求進(jìn)一步擴容,幫助大型全周期安全可信方案幫助企業(yè)構(gòu)建大模型安全“堡壘”?;鹕揭娉掷m(xù)升級安全可信解決方案,面向企業(yè)關(guān)心的身份認(rèn)證、數(shù)據(jù)保密、環(huán)境隔離、信息無痕、操作可審計等問題進(jìn)行能力專項持續(xù)優(yōu)化,如在任務(wù)結(jié)束后,沙箱會自動銷毀數(shù)據(jù),保證用戶會話全程無痕;通過領(lǐng)先的可信容器沙箱技術(shù),杜絕外部風(fēng)險入侵和內(nèi)部數(shù)據(jù)泄露。同時,面向推理、精調(diào)安全審計,火山引擎可全周期、全覆蓋監(jiān)控接入訪問、KMS訪問、沙箱登錄、沙箱連接、沙箱容器逃逸、vArmor攔截日志,保證數(shù)據(jù)可保護(hù)、可審計、可追溯。豐富的插件生態(tài)使得企業(yè)更好對接外部內(nèi)容。火山方舟自研聯(lián)網(wǎng)插件、內(nèi)容插件和RAG知識庫插件,將運營內(nèi)容和技術(shù)積累共享給企業(yè),以增強模型落地效果。例如,聯(lián)網(wǎng)插件提供頭條、抖音同款搜索能力,可實時連接獲取互聯(lián)網(wǎng)海量優(yōu)質(zhì)可信數(shù)據(jù),大幅提升用戶的意圖識別檢索水平;內(nèi)容插件可對接更多新聞、視頻和垂類內(nèi)容信息;RAG知識庫插件基于飛書文檔解析技術(shù),可自動將輸入文檔內(nèi)容切片、歸類、嵌入,并達(dá)到百億數(shù)據(jù)的毫秒級檢“更生動”“更專業(yè)”“更實時”“更生動”“更專業(yè)”“更實時”RAG文本、圖像、語音等多模態(tài)交互來源:火山引擎,2024長期持續(xù)釋放的服務(wù)價值。不同于一次性交付服務(wù),AI大模型作為企業(yè)的動態(tài)資產(chǎn),只有不斷地學(xué)習(xí)新知識和快速迭代,其作用和價值才可持續(xù)發(fā)揮。為此,火山方舟打造客戶全周期服務(wù)鏈條,總結(jié)實踐經(jīng)驗形成方法論,幫助客戶理解大模型應(yīng)用邊界和落地預(yù)期,提供場景咨詢、評測體系建立、目標(biāo)規(guī)劃、ROI計算、模型選擇、應(yīng)用落地、效果達(dá)標(biāo)、業(yè)務(wù)分析、服務(wù)優(yōu)化、新能力測試、增購擴容支持。IDC觀察到,企業(yè)在初步落地大模型應(yīng)用后,在持續(xù)更新模型能力的同時,還會加大對IT和業(yè)務(wù)數(shù)字化轉(zhuǎn)型的投入,包括在某汽車廠商的智能座艙場景,字節(jié)跳動的算法工程師輔助客戶共建大模型的解決方案,包括集、PromptEngineering(提示工程)、精調(diào)數(shù)據(jù)建設(shè)、模型調(diào)優(yōu)、聯(lián)網(wǎng),并在角色扮演、知識庫問來源:火山引擎,2024646.3扣子降低開發(fā)難度,更好地服務(wù)企業(yè)用戶。面向AI應(yīng)用開發(fā)人員不足、服務(wù)穩(wěn)定性要求高的企業(yè),為降低大模型應(yīng)用的開發(fā)門檻,支持用戶快速搭建AI應(yīng)用,進(jìn)一步縮短從構(gòu)思到落地實踐的時間,火山引擎發(fā)布扣子專業(yè)版,以專業(yè)級的穩(wěn)定支撐、火山方舟模型資源快速接入、更好的團(tuán)隊資源配額為核心價值,滿足企業(yè)對高并發(fā)、高穩(wěn)定性的要求,將應(yīng)用開發(fā)周期縮短95%以豐富的插件和流程智能化管理,快速打造企業(yè)級超級應(yīng)用。扣子專業(yè)版定位為企業(yè)級應(yīng)用打造平臺,鏈接插件、工作流、圖像流、知識庫、數(shù)據(jù)庫等一系列工具,無縫銜接擁有更強模型效果的豆包大模型家族,以及企業(yè)精調(diào)模型與開源模型,加強團(tuán)隊緊密合作和開發(fā)流程化管理,實現(xiàn)邏輯串聯(lián)和多技能并行,面向企業(yè)用戶提供自身積累沉淀的、豐富的應(yīng)用模板,以及調(diào)測、發(fā)布、集成、觀測的全周期服務(wù)。例如使用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 貴州城市職業(yè)學(xué)院《女生健美操》2023-2024學(xué)年第一學(xué)期期末試卷
- 貴陽職業(yè)技術(shù)學(xué)院《藥品與生物制品檢測》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025貴州省建筑安全員《B證》考試題庫及答案
- 貴陽人文科技學(xué)院《室內(nèi)空氣污染監(jiān)測與治理實驗》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣州珠江職業(yè)技術(shù)學(xué)院《電路分析實驗》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025天津市安全員-C證考試題庫
- 廣州應(yīng)用科技學(xué)院《女性文學(xué)與女性文化研究》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣州衛(wèi)生職業(yè)技術(shù)學(xué)院《城鄉(xiāng)規(guī)劃設(shè)計基礎(chǔ)II》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣州鐵路職業(yè)技術(shù)學(xué)院《電化學(xué)與腐蝕原理》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025云南省建筑安全員-C證考試(專職安全員)題庫附答案
- 2024年06月上海廣發(fā)銀行上海分行社會招考(622)筆試歷年參考題庫附帶答案詳解
- TSG 51-2023 起重機械安全技術(shù)規(guī)程 含2024年第1號修改單
- 計算機科學(xué)導(dǎo)論
- 《正態(tài)分布理論及其應(yīng)用研究》4200字(論文)
- GB/T 45086.1-2024車載定位系統(tǒng)技術(shù)要求及試驗方法第1部分:衛(wèi)星定位
- 浙江省杭州市錢塘區(qū)2023-2024學(xué)年四年級上學(xué)期英語期末試卷
- 《工程勘察設(shè)計收費標(biāo)準(zhǔn)》(2002年修訂本)
- 1古詩文理解性默寫(教師卷)
- 廣東省廣州市越秀區(qū)2021-2022學(xué)年九年級上學(xué)期期末道德與法治試題(含答案)
- 2024年一級消防工程師《消防安全技術(shù)綜合能力》考試真題及答案解析
- 2024-2025學(xué)年六上科學(xué)期末綜合檢測卷(含答案)
評論
0/150
提交評論