2023中國AIGC商業(yè)潛力研究報(bào)告_第1頁
2023中國AIGC商業(yè)潛力研究報(bào)告_第2頁
2023中國AIGC商業(yè)潛力研究報(bào)告_第3頁
2023中國AIGC商業(yè)潛力研究報(bào)告_第4頁
2023中國AIGC商業(yè)潛力研究報(bào)告_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2023中國AIGC商業(yè)潛力研究報(bào)告前言在人工智能發(fā)展的漫長歷程中,如何讓機(jī)器學(xué)會創(chuàng)作一直被視為難以逾越的天塹,“創(chuàng)造力”也因此被視為人類與機(jī)器最本質(zhì)的區(qū)別之一。然而,人類的創(chuàng)造力也終將賦予機(jī)器創(chuàng)造力,把世界送入智能創(chuàng)作的新時(shí)代。從機(jī)器學(xué)習(xí)到智能創(chuàng)造,從PGC,UGC到,我們即將見證一場深刻的生產(chǎn)力變革,而這份變革也會影響到我們工作與生活的方方面面。本報(bào)告將向所有關(guān)注未來科技的相關(guān)機(jī)構(gòu)、從業(yè)者、創(chuàng)業(yè)者、投資人傳遞億歐對的市場潛力場景的洞察和優(yōu)秀企業(yè)案例??缛肷墒诫A段預(yù)學(xué)習(xí)引發(fā)技術(shù)質(zhì)變,擺脫過去的高門檻、訓(xùn)練成本高、生成內(nèi)容單一的痛點(diǎn)?;诖竽P偷姆夯芰ΓR蒸餾與微調(diào)后進(jìn)入專用領(lǐng)域的應(yīng)用,覆蓋短頭、長尾的場景。多模態(tài)打破多種信息之間的邊界,提升內(nèi)容多樣性與技術(shù)多樣性,拓寬應(yīng)用的場景。原因1原因2原因3中國生成式與國外先進(jìn)水平存在一定差距,但憑借國內(nèi)應(yīng)用場景的多樣性,具備的數(shù)據(jù)積累優(yōu)勢,有望追上先進(jìn)步伐。中外差距大模型生態(tài)圈解析短期內(nèi),擴(kuò)大算力是的剛需。FPGA及ASIC有望在遠(yuǎn)期成為主力芯片。算力成本為大模型成本65%算力為大模型能力的下限為防止中國大模型出現(xiàn)“數(shù)據(jù)馬太效應(yīng)”,大模型亟需高質(zhì)量的標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,提高生成能力。數(shù)據(jù)為大模型能力的上限目前大模型以服務(wù)B端為主,其中平臺服務(wù)模式的占比相對較高高質(zhì)量的算法使大模型能力貼近上限數(shù)據(jù)成本為大模型成本23%算法成本為大模型成本12%2030年中國市場規(guī)模將接近萬億02-導(dǎo)覽01-導(dǎo)覽 03-導(dǎo)覽導(dǎo)覽商業(yè)潛力邊界模型0.510.690.761.17億歐智庫:基礎(chǔ)原子能力潛力指數(shù)1.87代碼視頻音頻圖像文本AIGS 0.18知識圖譜 0.16億歐智庫:多模態(tài)原子能力潛力指數(shù)聊天機(jī)器人 0.25虛擬人 0.22合成數(shù)據(jù) 0.20認(rèn)知謬誤邊界基礎(chǔ)設(shè)施邊界技術(shù)可行性邊界經(jīng)濟(jì)價(jià)值邊界2原子能力商業(yè)潛力評估模型規(guī)模潛力利潤潛力泛化與通用場景專業(yè)場景基礎(chǔ)原子能力多模態(tài)原子能力目錄CO

N

T

E

N

T

S概述人工智能概念梳理生成式人工智能因素分析中外人工智能對比AIGC原子能力變化0102 生態(tài)底座價(jià)值鏈分析生態(tài)底座價(jià)值拆解算力價(jià)值分析數(shù)據(jù)價(jià)值分析算法價(jià)值分析生態(tài)服務(wù)商總結(jié)大模型生態(tài)底座產(chǎn)業(yè)圖譜03 原子能力商業(yè)潛力分析原子能力覆蓋行業(yè)梳理基礎(chǔ)模態(tài)原子能力分析多模態(tài)原子能力分析原子能力商業(yè)潛力評估總結(jié)原子能力產(chǎn)業(yè)圖譜優(yōu)秀企業(yè)案例商業(yè)潛力規(guī)模預(yù)判商業(yè)潛力邊界模型邊界突破趨勢未來商業(yè)潛力規(guī)模預(yù)測04目錄CO

N

T

E

N

T

S概述人工智能概念梳理生成式人工智能因素分析中外人工智能對比AIGC原子能力變化0102 生態(tài)底座價(jià)值鏈分析生態(tài)底座價(jià)值拆解算力價(jià)值分析數(shù)據(jù)價(jià)值分析算法價(jià)值分析生態(tài)服務(wù)商總結(jié)大模型生態(tài)底座產(chǎn)業(yè)圖譜03 原子能力商業(yè)潛力分析原子能力覆蓋行業(yè)梳理基礎(chǔ)模態(tài)原子能力分析多模態(tài)原子能力分析原子能力商業(yè)潛力評估總結(jié)原子能力產(chǎn)業(yè)圖譜優(yōu)秀企業(yè)案例商業(yè)潛力規(guī)模預(yù)判商業(yè)潛力邊界模型邊界突破趨勢未來商業(yè)潛力規(guī)模預(yù)測045跨入3.0

+深度加強(qiáng)學(xué)習(xí)范式,利用獎(jiǎng)懲模型強(qiáng)化生成能力1.0邏輯范式 2.0概率范式資料來源:卡內(nèi)基梅隆大學(xué)、朱松純《淺談人工智能:現(xiàn)狀、任務(wù)、架構(gòu)與統(tǒng)一》、公開資料、億歐智庫整理3.0

深度學(xué)習(xí)范式3.0+

深度強(qiáng)化學(xué)習(xí)范式4.0

??范式范式(

Generated

Content)是基于GAN、預(yù)訓(xùn)練大模型、多模態(tài)技術(shù)融合的產(chǎn)物,通過已有的數(shù)據(jù)尋找規(guī)律,并通過泛化能力形成相關(guān)內(nèi)容。從商業(yè)角度看,是一種賦能技術(shù),通過高質(zhì)量、高自由度、低門檻的生成方式為內(nèi)容相關(guān)場景及生產(chǎn)者進(jìn)行服務(wù)。早期決策式依賴邏輯判斷的純粹性,萬物都能完美觀察、任何測量不存在誤差的前提不符合真實(shí)世界的“不確定性”;概率范式基于經(jīng)驗(yàn)主義與理性主義一定程度上解決了“不確定性”;深度加強(qiáng)學(xué)習(xí)可以利用合理的數(shù)據(jù)豐度與獎(jiǎng)懲達(dá)到類人類智能的水平,實(shí)現(xiàn)高質(zhì)量內(nèi)容與內(nèi)容創(chuàng)作自動(dòng)化;通用型具備泛人類智能,可以像人類一樣執(zhí)行各種任務(wù)。決策式 生成式 通用型綜合能力在早期工作在于關(guān)注邏輯、自動(dòng)定理證明和操縱各種符號,該類理解基礎(chǔ)的物理知識,具備一定的邏輯能力,通過分析數(shù)據(jù)和信息,幫助使用者更好的做出判斷與決概率與統(tǒng)計(jì)可以初步解決“不確定性”,但是概率范式需要經(jīng)驗(yàn)主義先于理性主義填充。以Bayes模型為例,需要經(jīng)驗(yàn)主義者先設(shè)定先驗(yàn)數(shù)據(jù)。以數(shù)據(jù)為中心,深層次的網(wǎng)絡(luò)堆疊為架構(gòu),樣本數(shù)據(jù)及數(shù)據(jù)種類的豐富,訓(xùn)練的模型泛化能力就越強(qiáng),效果越好。同時(shí)深度學(xué)習(xí)訓(xùn)練的已經(jīng)可以很好的執(zhí)行任務(wù)。不過,強(qiáng)化學(xué)習(xí)的效果卻不一定受到豐度的影響。強(qiáng)化學(xué)習(xí)遵循Markov原則,只要獎(jiǎng)懲設(shè)計(jì)合理就能實(shí)現(xiàn)不錯(cuò)的效果。具備泛人類智能的,可以像人類一樣執(zhí)行各種任務(wù)。自迭代能力策。但基于邏輯的缺乏感知能力,對真實(shí)世界普遍存在的“不確定性”較難處理。Markov獎(jiǎng)懲模型:倫理道德智能體獎(jiǎng)勵(lì)行動(dòng)環(huán)境目前位置協(xié)作能力狀態(tài)執(zhí)行能力感知能力學(xué)習(xí)能力決策能力認(rèn)知能力6資料來源:公開資料、億歐智庫整理歷次寒潮沉淀的技術(shù),終在算法、算力、數(shù)據(jù)三者共振的情況下誕生出大模型在1956年的達(dá)特茅斯會議上,“人工智能”的概念被首次提出,六十多年以來,歷經(jīng)邏輯推理、專家系統(tǒng)、深度學(xué)習(xí)等技術(shù)的發(fā)展,人工智能也經(jīng)歷了數(shù)次沉浮,有如日中天的發(fā)展時(shí)期,也有因技術(shù)不足熱度退去后的寒潮。而每一次寒潮后,也會經(jīng)歷技術(shù)的蟄伏發(fā)展,為人工智能帶來里程碑式的進(jìn)步。發(fā)展的2.5次寒潮1970年代第1次寒潮當(dāng)時(shí)主要研究集中在邏輯抽象、邏輯運(yùn)算和邏輯表達(dá)等方面,出現(xiàn)許多邏輯證明相關(guān)的邏輯程序語言,如著名的Prolog。但是當(dāng)時(shí)研發(fā)出來的人工智能系統(tǒng)缺乏實(shí)用性,幾乎無法解決任何實(shí)際問題,無法達(dá)到人們期望,政府逐步減少投資,高潮衰落,進(jìn)入第一次寒冬。1990年代第2次寒潮出現(xiàn)神經(jīng)系統(tǒng)與專家網(wǎng)絡(luò)。神經(jīng)系統(tǒng)在解決復(fù)雜問題上能力不足,且訓(xùn)練時(shí)需要的數(shù)據(jù)量較大。專家系統(tǒng)的實(shí)用性只局限于特定領(lǐng)域,同時(shí)升級難度和維護(hù)成本都居高不下。日本推出第五代計(jì)算機(jī)計(jì)劃——拋棄馮諾依曼架構(gòu),采用新的并行架構(gòu),采用新的存儲器,新的編程語言,以及能處理自然語言、圖像的新操作方式,但局限于理論和計(jì)算機(jī)算力,以及知識完全依靠人工輸入和維護(hù),最終宣告項(xiàng)目失敗。2010年代第2.5次寒潮存在計(jì)算能力不足的瓶頸,以深度學(xué)習(xí)為驅(qū)動(dòng)力的人工智能技術(shù)更多仍停在分類、聚類和預(yù)測階段,能夠完全復(fù)制人類思維方式的強(qiáng)人工智能依舊發(fā)展緩慢?;ヂ?lián)網(wǎng)公司對的開發(fā)便捷程度與先進(jìn)程度超過許多公司,因?yàn)榛ヂ?lián)網(wǎng)可以使用自己的不公開的內(nèi)部數(shù)據(jù)進(jìn)行訓(xùn)練。感知器神經(jīng)網(wǎng)絡(luò)的第一個(gè)里程碑算法可以解決簡單的線性分類問題為后期更復(fù)雜的算法奠定基礎(chǔ)Hopfield神經(jīng)網(wǎng)絡(luò)一種具有循環(huán)、遞歸特性,結(jié)合存儲和二元系統(tǒng)的神經(jīng)網(wǎng)絡(luò)提供了模擬人類記憶的模型在機(jī)器學(xué)習(xí)、聯(lián)想記憶、模式識別、優(yōu)化計(jì)算等方面有著廣泛應(yīng)用多層前向BP網(wǎng)絡(luò)非線性映射能力:適合于求解內(nèi)部機(jī)制復(fù)雜的問題自學(xué)習(xí)和自適應(yīng)能力:訓(xùn)練時(shí)能自適應(yīng)的將學(xué)習(xí)內(nèi)容記憶于網(wǎng)絡(luò)的權(quán)值中容錯(cuò)能力:局部神經(jīng)元受到破壞后對全局的訓(xùn)練結(jié)果不會造成很大的影響深度學(xué)習(xí)彌補(bǔ)了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的缺陷,利于可視化和分類,識別精度上升,訓(xùn)練難度下降無需人工提取規(guī)則特征,機(jī)器通過海量數(shù)據(jù),即可自動(dòng)實(shí)現(xiàn)規(guī)則的特征提取,有機(jī)器本身完成最復(fù)雜的算法歸納芯片&服務(wù)器&計(jì)算機(jī)硬件設(shè)施飛速發(fā)展,GPU、TPU等新一代芯片及FPGA異構(gòu)計(jì)算服務(wù)器,提供強(qiáng)大算力互聯(lián)網(wǎng)、物聯(lián)網(wǎng)發(fā)展迅猛,為人工智能提供了規(guī)??涨暗挠?xùn)練數(shù)據(jù),數(shù)據(jù)可獲得性大幅提升ChatGPT出現(xiàn)技術(shù)發(fā)展里程碑共振:振動(dòng)頻率相同的物體、當(dāng)一個(gè)發(fā)生振動(dòng)時(shí)、引起其他物體振動(dòng)7資料來源:arXiv、億歐智庫整理預(yù)學(xué)習(xí)引發(fā)技術(shù)質(zhì)變預(yù)學(xué)習(xí)的出現(xiàn)解決了過去生成式大模型的痛點(diǎn),但預(yù)學(xué)習(xí)本身存在模型尺寸、小樣本數(shù)量、微調(diào)能力的不可能三角,解決方法也不盡相同:對于極大模型,使用知識蒸餾;對于少樣本學(xué)習(xí)能力,進(jìn)行數(shù)據(jù)增強(qiáng);對于監(jiān)督訓(xùn)練表現(xiàn)欠佳的模型,進(jìn)行提示學(xué)習(xí)。以GPT為例,在目前階段,廠商通常的做法是擴(kuò)大模型尺寸。億歐智庫:預(yù)學(xué)習(xí)大模型引發(fā)技術(shù)質(zhì)變億歐智庫:預(yù)學(xué)習(xí)之不可能三角與對應(yīng)解決方案預(yù)學(xué)習(xí)大模型的出現(xiàn)解決了過去各類生成式模型使用門檻高、訓(xùn)練成本高、內(nèi)容生成簡單和質(zhì)量偏低的痛點(diǎn),滿足真實(shí)內(nèi)容消費(fèi)場景中的靈活多變、高精度、高質(zhì)量等需求。預(yù)學(xué)習(xí)思路:將大量低成本收集的訓(xùn)練數(shù)據(jù)集中,學(xué)習(xí)其中的共性然后將其中的共性移植到特定任務(wù)的模型中,再微調(diào),去學(xué)習(xí)該特定任務(wù)的特性部分合理的模型尺寸(小于10億參數(shù)量)先進(jìn)的小樣本先進(jìn)微調(diào)訓(xùn)練任務(wù)共性學(xué)習(xí)特性學(xué)習(xí)微調(diào)特定任務(wù)知識蒸餾大模型是網(wǎng)絡(luò)的集合,擁有良好的性能和泛化能力,小模型網(wǎng)絡(luò)規(guī)模較小,表達(dá)能力有限降低模型時(shí)延,壓縮網(wǎng)絡(luò)參數(shù):利用大模型學(xué)習(xí)的知識指導(dǎo)小模型訓(xùn)練,使得小模型與大模型性能相當(dāng),而參數(shù)數(shù)量可大幅降低,從而實(shí)現(xiàn)模型壓縮與加速提升模型精度:訓(xùn)練一個(gè)更高精度的大模型,用大模型對原模型知識蒸餾,獲得更高精度數(shù)據(jù)增強(qiáng)缺少足夠的標(biāo)記數(shù)時(shí),可以生成偽標(biāo)簽和偽數(shù)據(jù)實(shí)例,利用這些額外數(shù)據(jù),模型能夠有效的監(jiān)督訓(xùn)練。提示學(xué)習(xí)利用離散提示(離散文本模板)或連續(xù)提示(連續(xù)參數(shù)嵌入)微調(diào),在微調(diào)期間僅更新離散提示或連續(xù)提示中的一種,提高準(zhǔn)確度8資料來源:公開資料、億歐智庫整理大模型底座驅(qū)動(dòng)概念落地在概念實(shí)際落地的過程中,只有基礎(chǔ)大模型與通用技術(shù)是遠(yuǎn)遠(yuǎn)不夠的,還需要能與場景融合匹配,更需要支持應(yīng)用落地的工具平臺和開放包容的創(chuàng)新生態(tài),三者協(xié)同優(yōu)化,加速落地。在全應(yīng)用流程中,主要通過大量的無標(biāo)注文本進(jìn)行共性學(xué)習(xí),獲得預(yù)訓(xùn)練大模型,此后再根據(jù)場景特征微調(diào),更好與項(xiàng)目任務(wù)適配。大模型驅(qū)動(dòng)概念落地工具平臺生態(tài)大模型特性學(xué)習(xí)共性學(xué)習(xí)通過海量無標(biāo)注文本和自監(jiān)督學(xué)習(xí),進(jìn)行共性學(xué)習(xí),得到預(yù)訓(xùn)練大模型通過任務(wù)相關(guān)少量數(shù)據(jù)進(jìn)行精調(diào),進(jìn)行特性學(xué)習(xí)通過工具平臺支撐生態(tài)應(yīng)用落地通過學(xué)習(xí)海量無標(biāo)注文本與數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練和自學(xué)習(xí)監(jiān)督,提高大模型在前期學(xué)習(xí)的范圍與深度,提升水平,賦能大模型在后續(xù)具體任務(wù)中的應(yīng)用共性學(xué)習(xí)在共性學(xué)習(xí)“預(yù)訓(xùn)練”的基礎(chǔ)上,根據(jù)具體應(yīng)用場景的特性,使用少量數(shù)據(jù)進(jìn)行微調(diào),高精度地完成任務(wù)特性學(xué)習(xí)大模型:在發(fā)展和產(chǎn)業(yè)應(yīng)用方面占據(jù)重要地位,主要包含基礎(chǔ)、任務(wù)和行業(yè)大模型,三層大模型相互促進(jìn),共同支撐產(chǎn)業(yè)轉(zhuǎn)化與發(fā)展工具平臺:推出了基于大模型的開發(fā)平臺、工具套件、大模型API等,讓更多開發(fā)者能夠低門檻地將大模型應(yīng)用于自己的業(yè)務(wù)中,從而助力開發(fā)者效率提升生態(tài):釋放大模型的潛力,推動(dòng)的廣泛應(yīng)用和產(chǎn)業(yè)化大模型支撐生態(tài)發(fā)展,而生態(tài)反哺大模型進(jìn)行技術(shù)進(jìn)步+工具平臺+生態(tài)模式需要協(xié)同優(yōu)化,以更好幫助在不同領(lǐng)域快速落地9資料來源:CSDN、中信建投證券、億歐智庫整理多模態(tài)打破多種信息之間的邊界并生成質(zhì)量穩(wěn)定的內(nèi)容,提升內(nèi)容多樣性相比于模態(tài)單一的單模態(tài)模型,多模態(tài)模型可以同時(shí)處理更多模態(tài)的并將它們相互轉(zhuǎn)化?,F(xiàn)今多模態(tài)模型以圖文多模塊為主。Transformer雖受制于單模態(tài)但其權(quán)重共享適用于多模態(tài);ViT處理輸入圖片,使得Transformer可用,從而打破NLP和CV間屏障;BEiT將生成式預(yù)訓(xùn)練從自然語言處理遷移到了計(jì)算機(jī)視覺;擴(kuò)散模型多用于文本圖像生成。億歐智庫:從單模態(tài)轉(zhuǎn)向多模態(tài)億歐智庫:多模態(tài)提升內(nèi)容多樣性文本聲音圖像視頻……信號多模態(tài)多模態(tài)信息單模態(tài)模型:信息來源或形式單一,例如文字、圖片、音頻等信息媒介和紅外、雷達(dá)等傳感器。Transformer權(quán)重共享適用于多模態(tài),但存在單模態(tài)局限因?yàn)檩斎霐?shù)據(jù)的長度有限制,所以基于Transformer的大模型只能基于單一文本模態(tài),不能將其泛化能力遷移到其他如圖片、音頻的模態(tài)上,但其擁有的權(quán)重共享理念適用于多模態(tài)模型,權(quán)重共享指部分模塊共享權(quán)重參數(shù)在圖片和文字的多模態(tài)中,圖片訓(xùn)練得到的權(quán)重參數(shù)可以直接用于訓(xùn)練文本,結(jié)果有效且無需進(jìn)一步微調(diào)擴(kuò)散包括正向擴(kuò)散與反向擴(kuò)散兩個(gè)過程,填補(bǔ)文本圖像生成中的空白圖片分割TransformerEncoderClassViT模型對圖片線性映射處理,變成Transformer可用的輸入,打破自然語言處理和計(jì)算機(jī)視覺之間的壁壘PositionEmbeddingBEiT將生成式預(yù)訓(xùn)練從NLP遷移到CV 利用ViT解除輸入限制,進(jìn)行特征提取圖片分割[M][M][M]BlockwiseMaskingBEiTEncoderPatch&PositionEmbeddingDecoderBEiT將BERT中的掩碼語言學(xué)習(xí)方法應(yīng)用到圖像領(lǐng)域,將生成式預(yù)訓(xùn)練從自然語言處理NLP遷移到了計(jì)算機(jī)視覺CV。擴(kuò)散模型幫助生成文本圖像BEiT解決了計(jì)算機(jī)視覺上生成式預(yù)訓(xùn)練遇到的問題,解決方法:使用ViT結(jié)構(gòu)處理圖像信息10資料來源:CSDN、中信建投證券、億歐智庫整理多模態(tài)信息持續(xù)融合增加技術(shù)多樣性,拓寬場景多模態(tài)在視頻分類、情感分析、語音識別等領(lǐng)域都得到了廣泛,涉及圖像、視頻、語音、文本等融合內(nèi)容,未來還將進(jìn)入交互、感知、內(nèi)容等更多場景。億歐智庫:多模態(tài)融合架構(gòu)用戶發(fā)出模糊指令用戶環(huán)境聲紋聲音中的文字聲音中的情感肢體動(dòng)作人臉面部表情嘴唇的動(dòng)作相對位置環(huán)境服務(wù)1生物識別服務(wù)2用戶意圖感知多模態(tài)自然語言理解多模態(tài)情感服務(wù)3服務(wù)呈現(xiàn)音視頻輸出IoT控制應(yīng)用場景生成內(nèi)容跨模態(tài)搜索圖像、文本圖像標(biāo)注 圖像、文本轉(zhuǎn)移學(xué)習(xí) 圖像、文本跨模態(tài)嵌入 圖像、視頻、文本視頻分類 語音、視頻、文本事件檢測 語音、視頻、文本情緒分析 語音、視頻、文本情感分析 語音、視頻、文本語音識別 語音、視頻視覺問答 圖像、文本圖像標(biāo)注 圖像、文本圖像合成 圖像、文本視頻解碼 視頻、文本11在決策式方面,中國已經(jīng)處在第一梯隊(duì),中國是發(fā)表論文最多的國家,且近10年來占比逐年增加。而在生成式方面,與國外還存在參數(shù)量的差距,背后隱含著算力資源、數(shù)據(jù)質(zhì)量等基礎(chǔ)要素的不足的原因。中國決策式已達(dá)到世界一流水平,而生成式還與國外存在基礎(chǔ)要素的不足億歐智庫:中國的決策式已經(jīng)達(dá)到世界領(lǐng)先水平億歐智庫:中國生成式參數(shù)量與國外有一定差距中國是發(fā)表相關(guān)論文最多的國家,近十年發(fā)表9萬余篇,占近10年全球論文發(fā)表總量的22.7%。在2021年受關(guān)注論文居前十的企業(yè)中,中國企業(yè)占到4家。技術(shù)2023年,中國的“燈塔工廠”增至50座,占比超過總數(shù)的1/3以上,持續(xù)排名全球第一。此項(xiàng)目由達(dá)沃斯世界經(jīng)濟(jì)論壇與管理咨詢公司麥肯錫合作開展遴選,“燈塔工廠”也被譽(yù)為“世界上最先進(jìn)的工廠”,具有榜樣意義的“數(shù)字化制造”和“全球化4.0”示范者,代表當(dāng)今全球制造業(yè)領(lǐng)域智能制造和數(shù)字化最高水平。應(yīng)用2018年1月

2018年6月

2019年1月

2019年6月 2020年1月2020年6月2021年1月

2021年6月

2022年1月

2022年6月GPT

BERTELMo

1.17億1.1億940萬GPT-215億26億RoBERTAERNIE3.55億KEPLER1.02億 1.1億94億Megatron-LMGenerative

BST83億ERNIE100億Meena

DeBERTa15億Megatron-TuringNLG5300億Minerva5400億GPT-31750億Chinchilla700億GLM1300億10億100億1000億10000億參數(shù)量中國開發(fā)者其它開發(fā)者中國的生成式處于發(fā)展的初期,底層技術(shù)和國外還有較大的差距。國外芯片龍頭公司的斷供及次品供應(yīng)使得中國生成式的基礎(chǔ)硬件提供不了足夠算力。技術(shù)雖然國內(nèi)眾多廠商開始布局,但是目前的商業(yè)模式還不成熟。技術(shù)層面的不足也限制了應(yīng)用端的發(fā)展。應(yīng)用0 20 40 60資料來源:中國信通院、Leonis

Capital行研、億歐智庫整理80100120140Alphabet微軟IBMMeta騰訊控股阿里巴巴集團(tuán)華為技術(shù)亞馬遜英偉達(dá)國家電網(wǎng)2021年受關(guān)注論文篇數(shù)居前10的企業(yè)Fastfollower→Firstin

classCopytoChina→CopyfromChina中國開發(fā)者其它開發(fā)者中外大模型參數(shù)量對比12資料來源:公開資料、億歐智庫整理原子能力動(dòng)態(tài)變化曲線的原子隨著時(shí)間的變化,內(nèi)容呈現(xiàn)復(fù)雜化、多維化的特征,基礎(chǔ)模態(tài)原子能力向多模態(tài)轉(zhuǎn)變,表明目前商業(yè)的嘗試正下沉至長尾場景,大模型的泛化能力、實(shí)時(shí)性、強(qiáng)推理與共情正在不斷滲透為虛擬人、聊天機(jī)器人、知識圖譜、合成數(shù)據(jù)、AIGS進(jìn)行多維度的賦能,推動(dòng)通用人工智能時(shí)代到來。原子能力:指支撐各類應(yīng)用、各類場景的要素技術(shù);以生成內(nèi)容為例,目前大部分應(yīng)用和場景都需要的文本、代碼輸出、圖像生成音視頻合成的原子能力原子能力維度(內(nèi)容復(fù)雜度)復(fù)雜度根據(jù)單位內(nèi)容的token大小時(shí)間目錄CO

N

T

E

N

T

S概述人工智能概念梳理生成式人工智能因素分析中外人工智能對比AIGC原子能力變化0102 生態(tài)底座價(jià)值鏈分析生態(tài)底座價(jià)值拆解算力價(jià)值分析數(shù)據(jù)價(jià)值分析算法價(jià)值分析生態(tài)服務(wù)商總結(jié)大模型生態(tài)底座產(chǎn)業(yè)圖譜03 原子能力商業(yè)潛力分析原子能力覆蓋行業(yè)梳理基礎(chǔ)模態(tài)原子能力分析多模態(tài)原子能力分析原子能力商業(yè)潛力評估總結(jié)原子能力產(chǎn)業(yè)圖譜優(yōu)秀企業(yè)案例商業(yè)潛力規(guī)模預(yù)判商業(yè)潛力邊界模型邊界突破趨勢未來商業(yè)潛力規(guī)模預(yù)測0414短期內(nèi)算力成本占據(jù)生態(tài)圈核心,算法與配套的數(shù)據(jù)價(jià)值在遠(yuǎn)期凸顯芯片65%內(nèi)存17%硬盤4%其他14%23%大模型的訓(xùn)練、微調(diào)和運(yùn)營需要大量的計(jì)算資源支撐,目前算力占據(jù)生態(tài)圈65%成本,數(shù)據(jù)及算法占據(jù)剩下35%的成本。從短期看,一頭獨(dú)大的格局不會發(fā)生太大變化,大模型新入局玩家的算法訓(xùn)練和老玩家大模型的微調(diào)、迭代將會持續(xù)刺激算力成本上揚(yáng)。從長期看,有望出現(xiàn)三頭并進(jìn)格局,模型算法的迭代會成為通往AGI的解決方案,隨著應(yīng)用不斷下沉長尾的專用場景,專用算法及場景沉淀的數(shù)據(jù)將會成為體驗(yàn)的核心,另外,合成數(shù)據(jù)及減少算力依賴的框架算法成熟將會加大緩和算力緊張的缺口。生態(tài)底座價(jià)值鏈算力65%算法12%收集35%數(shù)據(jù)標(biāo)注45%清洗/存儲20%人力算力65%算力層為模型訓(xùn)練提供最重要的基礎(chǔ)支持,成本主要由芯片、內(nèi)存、硬盤等構(gòu)成,其中芯片是算力的核心數(shù)據(jù)集快速膨脹和參數(shù)量持續(xù)上漲導(dǎo)致算力需求及算力成本大幅上升23%層主要負(fù)責(zé)數(shù)據(jù)的收集、標(biāo)注、清洗、儲存隨著不斷發(fā)展,專業(yè)領(lǐng)域的復(fù)雜數(shù)據(jù)標(biāo)注需求提升算法12%隨著資產(chǎn)的復(fù)用和自動(dòng)化程度的提升,可以實(shí)現(xiàn)規(guī)模效應(yīng)資料來源:專家訪談、國海證券、公開資料、億歐智庫整理

該成本測算基于2023年數(shù)據(jù)15資料來源:浪潮、OpenAI、Nature、

公開資料、億歐智庫整理擴(kuò)大算力是的剛需隨著數(shù)字經(jīng)濟(jì)蓬勃發(fā)展,數(shù)字化新事物、新業(yè)態(tài)、新模式推動(dòng)應(yīng)用場景向多元化發(fā)展,擴(kuò)大算力是短期內(nèi)最需要解決的問題,在后摩爾時(shí)代,算力供給和需求都會飆升,據(jù)預(yù)測,中國智能算力規(guī)模將會擁有47.5%的年復(fù)合增長率,但與智能算力需求仍存在較大差距。億歐智庫:中國算力需求剪刀差算力構(gòu)成了產(chǎn)業(yè)的核心底座,主要包括芯片、服務(wù)器和數(shù)據(jù)中心芯片:是算力的基礎(chǔ),主要分為CPU、GPU、FPGA、ASIC四類。CPU是人工智能計(jì)算的基礎(chǔ),而GPU、FPGA和ASIC為協(xié)助CPU進(jìn)行大規(guī)模計(jì)算的加速芯片。服務(wù)器:對芯片進(jìn)行系統(tǒng)集成。服務(wù)器的架構(gòu)為“CPU+加速芯片”,在進(jìn)行模型處理推理和訓(xùn)練時(shí),效率更高。數(shù)據(jù)中心:提供計(jì)算服務(wù),承接算力需求。使用算力資源在云端實(shí)現(xiàn)模型訓(xùn)練。3275155268427641923127114001200100080060040020002024E2025E2026E2019 2020 2021 2022 2023E中國智能算力規(guī)模及預(yù)測億歐智庫:中國2019-2026年智能算力供應(yīng)2022-2026ECAGR:47.5%單位:EFLOPS1e+21e+01e-21e-41e-61e-81e-101e+419852015NETtalkRNNfor

speech1995 2005TD-Gammom

v2.11985-2025年智能算力需求單位:petaFLOPdaysGPT-32020 2025Megatron-BERTGPT-2BERTAlexNetAlphaGoZeroAlphaZeroRetsNets2022年之后時(shí)代每年算力需求在短期內(nèi)會有6400%的年需求MLP-based

neuralnetworkbreaksBILSTMfor

speech根據(jù)Open預(yù)測,人工智能算力需求短期類年均將增長64倍*華為輪值董事長胡厚崑也在2022年WAIC上表示,未來10年人工智能算力需求將增長500倍根據(jù)浪潮預(yù)測,未來五年內(nèi),智能算力的CAGR為47.5%,算力存在明顯的短缺狀態(tài)。16資料來源:專家訪談、公開資料、億歐智庫整理短期內(nèi)GPU不可撼動(dòng),但隨著任務(wù)比例變化,F(xiàn)PGA及ASIC有望遠(yuǎn)期成為主力芯片短期看,GPU占據(jù)訓(xùn)練及推理的絕對地位,英偉達(dá)基于CUDA強(qiáng)大的并行計(jì)算能力及自身產(chǎn)品力構(gòu)建了護(hù)城河;遠(yuǎn)期看,F(xiàn)PGA及ASIC芯片時(shí)延低、特需設(shè)計(jì)等特點(diǎn)將成為主力芯片,國內(nèi)廠商憑借兩者的多年積累有望加速芯片的自主化進(jìn)程。短期內(nèi)遠(yuǎn)期變化云端云端邊緣端云端主要部署高算力的訓(xùn)練芯片和推理芯片進(jìn)行訓(xùn)練和推理任務(wù),邊緣端基本只部署推理芯片應(yīng)用芯片種類GPUGPUFPGAFPGAASICASICGPU在構(gòu)建中具有高適配性與高并行性的特點(diǎn),可以更好支持模型訓(xùn)練中大量矩陣和向量的計(jì)算,同時(shí),其強(qiáng)大的通用能力在推理任務(wù)中表現(xiàn)良好(GPU目前在訓(xùn)練和推理中占據(jù)絕對主力,不過推理的市占地位整體不及訓(xùn)練任務(wù))根據(jù)GPU強(qiáng)大的通用能力依舊在芯片占據(jù)一席之地FPGA在訓(xùn)練任務(wù)所需要的浮點(diǎn)運(yùn)算能力中較弱;可通過編程靈活配置芯片架構(gòu)適應(yīng)算法迭代,平均性能較高,擁有可編程性、可重構(gòu)性和定點(diǎn)運(yùn)算功能,在推理端使用較多開發(fā)時(shí)間長,研發(fā)成本高,進(jìn)入門檻高大模型架構(gòu)未統(tǒng)一,導(dǎo)致訓(xùn)練端未普及應(yīng)特定用戶要求和應(yīng)用程序的需要而設(shè)計(jì)、制造的集成電路,有穩(wěn)定的性能和優(yōu)秀的功耗控制在面對推斷環(huán)節(jié)的小批量數(shù)據(jù)處理時(shí),可以憑借流水線并行,達(dá)到高并行+低延遲的效果受延遲、隱私和帶寬限制的驅(qū)動(dòng),逐漸被布署于IoT設(shè)備當(dāng)中,以滿足低功耗+靈活推理+快速響應(yīng)的需求隨著、算法的普及和趨向統(tǒng)一,專業(yè)性更強(qiáng)的ASIC將更具備競爭優(yōu)勢,ASIC在研發(fā)制作方面一次性成本較高,但量產(chǎn)后平均成本低,具有批量生產(chǎn)的成本優(yōu)勢訓(xùn)練 推理云端霧/邊緣端云端 霧/邊緣端遠(yuǎn)期來看,大模型進(jìn)入出清階段,芯片主要負(fù)責(zé)日常運(yùn)行的推理任務(wù),訓(xùn)練任務(wù)則下渡到霧/邊緣側(cè)以滿足具身智能應(yīng)用需求訓(xùn)練推理17資料來源:《近10年國際學(xué)術(shù)論文中的語言選擇和中文使用情況分析研究》、OneFlow、w3techs、億歐智庫整理缺乏優(yōu)質(zhì)數(shù)據(jù),讓中文大模型患上“心臟病”由PGC和UGC進(jìn)行內(nèi)容支撐,缺乏過往內(nèi)容的將會直接性影響,缺乏高質(zhì)量的中文數(shù)據(jù)資料,將會影響到中文大模型在知識領(lǐng)域的能力。此外,國內(nèi)擁有大量高價(jià)值數(shù)據(jù)的互聯(lián)網(wǎng)企業(yè)更傾向于將數(shù)據(jù)封閉在APP和平臺中,不同APP間數(shù)據(jù)不能連通,無法搜索,形成“數(shù)據(jù)孤島”現(xiàn)象。英文占領(lǐng)主導(dǎo)地位億歐智庫:中文數(shù)據(jù)質(zhì)與量皆有差距1英文互聯(lián)網(wǎng)和中文互聯(lián)網(wǎng)普及的時(shí)間差達(dá)到了半個(gè)世紀(jì)2當(dāng)今高質(zhì)量的學(xué)術(shù)論文以英文為主公開已標(biāo)注數(shù)據(jù)集以英文為主,缺乏中文3英文擁有數(shù)量極大的訓(xùn)練用數(shù)據(jù)集GPT訓(xùn)練來源Common

Crawl(網(wǎng)站抓取的大型數(shù)據(jù)集)WebText2(Reddit網(wǎng)頁爬取)Books(故事型書籍?dāng)?shù)據(jù)集)Wikipedia(維基百科)Journals(學(xué)術(shù)寫作數(shù)據(jù)集)CommonCrawl包含約31億個(gè)網(wǎng)頁內(nèi)容和320TB的文字信息包含原始網(wǎng)頁、元和文本提取數(shù)據(jù)集中,英文占46%,俄、德、日、中都占5%左右移動(dòng)互聯(lián)網(wǎng)時(shí)代,國內(nèi)大廠從融資、估值到上升都需要用戶講故事,所以大量封閉在各企業(yè)的APP和平臺中,最終形成了APP內(nèi)部的閉環(huán),產(chǎn)生了“孤島”的現(xiàn)象。5445184684222018.62019.62020.62021.6數(shù)量(萬個(gè))國內(nèi)的網(wǎng)站數(shù)量規(guī)模下降,但是互聯(lián)網(wǎng)的流量有著上升趨勢互聯(lián)網(wǎng)企業(yè)為了實(shí)現(xiàn)自己的流量和盈利目的,屏蔽其他軟件,切斷搜索路徑,進(jìn)行資源與內(nèi)容的分割。導(dǎo)致不同平臺之間流通共享大幅減少,信息可檢索度降低。中國移動(dòng)互聯(lián)網(wǎng)的興起,導(dǎo)致從更開放的網(wǎng)站,遷移至較為封閉的APP/小程序中億歐智庫:中國網(wǎng)站數(shù)量18資料來源:公開資料、億歐智庫整理數(shù)據(jù)馬太效應(yīng)或?qū)е轮袊竽P碗y以獲得商業(yè)循環(huán)的支撐由于英文數(shù)據(jù)和中文數(shù)據(jù)之間的指數(shù)級別的差距,建立在數(shù)據(jù)之上的模型也會出現(xiàn)越來越大的差距,形成數(shù)據(jù)馬太效應(yīng)。馬太效應(yīng)或?qū)е掠⑽拇竽P瞳@得更多的商業(yè)機(jī)會,中文大模型亟需大量高質(zhì)量的標(biāo)注數(shù)據(jù)提升模型能力。億歐智庫:數(shù)據(jù)馬太效應(yīng)中文大模型缺乏優(yōu)質(zhì)中文中國下游開發(fā)者英文大模型海外下游開發(fā)者無法滿足尋求大模型尋求大模型提供大模型提供高質(zhì)量標(biāo)注使用英文訓(xùn)練大模型尋求大模型提供大模型提供高質(zhì)量標(biāo)注數(shù)據(jù)馬太效應(yīng)或?qū)е轮袊竽P桶l(fā)展缺乏商業(yè)支撐數(shù)據(jù)馬太效應(yīng)對于中國大模型服務(wù)商,缺乏高質(zhì)量的標(biāo)注數(shù)據(jù),缺乏愿意買單的下游客戶,無法形成積極正向的商業(yè)循環(huán),形成中外大模型的馬太效應(yīng)。以GPT-4為例,雖然靠遷移回譯能夠滿足大部分中文對話,但是隨著模型的不斷迭代,以及英文數(shù)據(jù)的持續(xù)填充,數(shù)據(jù)馬太效應(yīng)導(dǎo)致英文模型和中文模型的能力差距會逐漸增大。目前來看,中英模型的能力差距在5%-10%左右,長此以往,基于“大模型+微調(diào)”的原則,使用中文大模型的下游應(yīng)用也會出現(xiàn)差距,英語(甚至是日耳曼語系)下游開發(fā)企業(yè)將會獲得相對競爭優(yōu)勢。使用英文數(shù)據(jù)訓(xùn)練的模型整體將比使用中文數(shù)據(jù)的模型強(qiáng),且會越來越強(qiáng)19資料來源:整數(shù)智能、公開資料、億歐智庫整理中文高質(zhì)標(biāo)注數(shù)據(jù)是國內(nèi)大模型能力躋身國際先進(jìn)水平的充要條件數(shù)據(jù)工程是工程的基礎(chǔ)環(huán)節(jié),其核心在于高質(zhì)高效的數(shù)據(jù)標(biāo)注,數(shù)據(jù)工程所得出的數(shù)據(jù)的質(zhì)量,直接影響到整個(gè)模型的質(zhì)量與精度。中國數(shù)據(jù)量呈指數(shù)級增長,其中大占比的非結(jié)構(gòu)化數(shù)據(jù)產(chǎn)生海量數(shù)據(jù)標(biāo)注與清洗的需求,未來市場前景廣闊。億歐智庫:數(shù)據(jù)巨量化,標(biāo)注需求擴(kuò)張采集標(biāo)注影響±10%的準(zhǔn)確率模型訓(xùn)練部署影響±1%的準(zhǔn)確率億歐智庫:中國生產(chǎn)量(2018-2026E)48.67.5 1256.162018 2020 2025E中國生產(chǎn)數(shù)據(jù)量(單位:ZB)2026E數(shù)據(jù)類型 結(jié)構(gòu)化數(shù)據(jù)占20%以文件形式存在的非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)占80%標(biāo)注在大模型早起開發(fā)和專用領(lǐng)域開發(fā)中有著不可替代的作用,模型的監(jiān)督學(xué)習(xí)需要數(shù)據(jù)的標(biāo)注來保證精度,而半監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)往往無法達(dá)到同樣的精度。非結(jié)構(gòu)化非結(jié)構(gòu)化機(jī)器數(shù)據(jù)和文件占非結(jié)構(gòu)化數(shù)據(jù)的90%非結(jié)構(gòu)數(shù)據(jù)需要經(jīng)過標(biāo)注才能被利用,帶來大量數(shù)據(jù)的標(biāo)注需求但國內(nèi)只有22%的企業(yè)有自建的數(shù)據(jù)團(tuán)隊(duì),且目前數(shù)據(jù)標(biāo)注的精度與國外頂尖水平還存在差距理論、算法模型、應(yīng)用場景不斷優(yōu)化創(chuàng)新,人工智能產(chǎn)業(yè)對訓(xùn)練數(shù)據(jù)的質(zhì)量與數(shù)量要求快速提升數(shù)據(jù)標(biāo)注

產(chǎn)業(yè)對數(shù)據(jù)類型的需求多樣化,垂直類需求增長,產(chǎn)業(yè)鏈出現(xiàn)專業(yè)化分工的趨勢,使得不同領(lǐng)域的專業(yè)化數(shù)據(jù)服務(wù)提供商作用凸顯億歐智庫:數(shù)據(jù)工程占80%工程時(shí)長數(shù)據(jù)工程時(shí)長占比80% 模型工程時(shí)長占比10%充要條件:充分必要條件資料來源:公開資料、億歐智庫整理開發(fā)通用大模型成為應(yīng)用的底座算法模型是人工智能的“靈魂”,通過建立算法模型并進(jìn)行下行研發(fā)實(shí)現(xiàn)資產(chǎn)的復(fù)用獲得盈利。盈利方式通過大模型使用授權(quán)、行業(yè)大模型定制、工作流訂閱及基于下游任務(wù)微調(diào)三種途徑訂閱模式、平臺服務(wù)模式、定制化服務(wù)模式、API服務(wù)模式、廣告和推廣模式、數(shù)據(jù)授權(quán)模式的商業(yè)變現(xiàn)。行業(yè)大模型通用大模型原子工作流訂閱及基于下游任務(wù)微調(diào)行業(yè)大模型定制通用大模型使用授權(quán)訂閱模式API服務(wù)模式平臺服務(wù)模式定制化服務(wù)模式廣告和推廣模式數(shù)據(jù)授權(quán)模式大模型商業(yè)應(yīng)用演化大模型各階段盈利模式大模型細(xì)分收費(fèi)方式20目前大模型生成應(yīng)用服務(wù)以B端為主,平臺服務(wù)模式占比相對較高作為服務(wù)提供商,向B端和C端用戶提供生成內(nèi)容的技術(shù)平臺和工具,并通過收取平臺使用費(fèi)、交易手續(xù)費(fèi)、廣告和推廣收益以及數(shù)據(jù)授權(quán)收益等方式獲得收益。在用戶定位方面,主要面向B端用戶,如媒體、廣告主、文化機(jī)構(gòu)等,以及開發(fā)者、科研機(jī)構(gòu)等需要使用生成內(nèi)容技術(shù)的用戶。B端C端訂閱模式平臺服務(wù)模式定制化服務(wù)模式API服務(wù)模式廣告和推廣模式授權(quán)模式5%10%15%20%25%30%2022年Q4-2023年Q1盈利模式占比定義:用戶通過訂閱服務(wù),定期或按需獲取人工智能生成的內(nèi)容。案例:Open:提供了GPT-3訂閱服務(wù)Grammarly:提供英文語法和寫作幫助的訂閱服務(wù)定義:提供生成內(nèi)容技術(shù)平臺和工具,通過收取平臺使用費(fèi)獲得收益。案例:GoogleCloud

:提供各種平臺服務(wù)定義:公司可以根據(jù)客戶的特定需求,提供定制化的人工智能生成內(nèi)容服務(wù)。案例:Hugging

Face:提供NLP領(lǐng)域的開源軟件,同時(shí)也提供定制化的NLP服務(wù)定義:公司提供人工智能生成內(nèi)容的API,供開發(fā)者集成到自己的應(yīng)用程序中。案例:GoogleCloudVision

API:提供基于圖像和視頻的視覺智能API服務(wù)定義:人工智能生成的內(nèi)容可以作為廣告或推廣渠道,通過展示廣告或推廣內(nèi)容來獲得收益。案例:阿里巴巴“文娛大腦”:為企業(yè)生成各種類型的廣告文案定義:人工智能生成的內(nèi)容可以作為數(shù)據(jù)的授權(quán)和授權(quán)來源,被其他公司或個(gè)人購買或授權(quán)使用。案例:Open:將GPT-3的API授權(quán)給了Microsoft和GitHub等公司資料來源:專家訪談、公開資料、億歐智庫整理2122資料來源:公開資料、億歐智庫整理生態(tài)底座服務(wù)商總結(jié)整體來看,數(shù)據(jù)和算力是大模型性能的關(guān)鍵限制因素,而算法的不斷改進(jìn)是讓大模型接近其上限能力的關(guān)鍵,同時(shí)也是商業(yè)變現(xiàn)的“接口”。生態(tài)底座服務(wù)商會形成以互聯(lián)網(wǎng)企業(yè)的通用大模型+行業(yè)大模型+原子基礎(chǔ)能力的泛化派玩家,以大模型服務(wù)商、行業(yè)/垂直領(lǐng)域服務(wù)商為主的專用派服務(wù)商,結(jié)合企業(yè)自身過去的業(yè)務(wù)與技術(shù)強(qiáng)化在長尾場景的能力。底座能力評估模型底座不同類型玩家天花板:數(shù)據(jù)地板:算力數(shù)據(jù)的多樣性和數(shù)量對于大模型的表現(xiàn)至關(guān)重要,因?yàn)榇竽P托枰笠?guī)模的高質(zhì)量數(shù)據(jù)進(jìn)行訓(xùn)練,以提高其理解和生成語言的能力。大模型需要強(qiáng)大的計(jì)算資源來進(jìn)行訓(xùn)練和推理,以處理龐大的參數(shù)量和復(fù)雜的計(jì)算任務(wù)。較低的算力會限制大模型的訓(xùn)練速度和性能。三類玩家模型能力原子能力行業(yè)大模型通用大模型互聯(lián)網(wǎng)企業(yè)大模型服務(wù)商(以過去做NLP和CV模型為主的企業(yè))行業(yè)/垂直領(lǐng)域服務(wù)商(行業(yè)服務(wù)商,例如自動(dòng)駕駛、醫(yī)療等):?????算法:?????算力:?????:????算法:?????算力:????:????算法:????算力:??通過基礎(chǔ)原子能力向各行各業(yè)進(jìn)行“+”式的賦能。利用大模型的生成能力、實(shí)時(shí)能力、推理能力及泛化能力,結(jié)合自身過去NLP和CV相關(guān)能力的積累,強(qiáng)化和創(chuàng)新原子能力,另外通過大模型的上述開發(fā)可以覆蓋行業(yè)場景的長尾環(huán)節(jié)。大模型服務(wù)商以合作形式進(jìn)行開發(fā)行業(yè)大模型。通常將收集、數(shù)據(jù)標(biāo)注等處理業(yè)務(wù)外包給服務(wù)商。與行業(yè)龍頭合作增強(qiáng)行業(yè)的認(rèn)知,將行業(yè)常規(guī)的問題處理邏輯嵌入行業(yè)大模型中?;谧陨韺τ谛袠I(yè)/垂直領(lǐng)域的理解,結(jié)合自身的開發(fā)行業(yè)大模型,具備算法與數(shù)據(jù)的能力,但是通常需要外包算力的支持。大模型的先驅(qū)者,以數(shù)據(jù)、算法、算力三者全而強(qiáng)的互聯(lián)網(wǎng)企業(yè)為主。他們具備web1.0時(shí)代至今積攢的巨額市場利潤以及龐大的高質(zhì)量數(shù)據(jù)與優(yōu)秀人才大模型的開發(fā)。公司通常擁有專門的機(jī)器學(xué)習(xí)工程師和科學(xué)家,能夠創(chuàng)建并優(yōu)化復(fù)雜的模型。-算法是大模型“建筑的主體結(jié)構(gòu)”,任何天花板、地板都不能獨(dú)立于“建筑主體結(jié)構(gòu)”而存在。如果算法存在代差,再高質(zhì)量的數(shù)據(jù)與充沛的算力都無法拔高大模型的能力,所以引入更高效的算法是提高大模型學(xué)習(xí)速度、推理能力和語言生成質(zhì)量的關(guān)鍵因素。主體結(jié)構(gòu):算法23大模型生態(tài)底座產(chǎn)業(yè)圖譜產(chǎn)業(yè)基礎(chǔ)層以提供算法、算力、數(shù)據(jù)處理的企業(yè)為主,產(chǎn)出大模型,再經(jīng)過中間層服務(wù)商微調(diào)及針對訓(xùn)練。算力算法ASIC服務(wù)器芯片GPUFPGAAIDC云計(jì)算數(shù)據(jù)存儲存儲設(shè)備云存儲服務(wù)查詢與處理轉(zhuǎn)換與編排數(shù)據(jù)標(biāo)注與管理治理與合規(guī)機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)增強(qiáng)學(xué)習(xí)深度學(xué)習(xí)CV多模態(tài)NLP資料來源:億歐智庫整理目錄CO

N

T

E

N

T

S概述人工智能概念梳理生成式人工智能因素分析中外人工智能對比AIGC原子能力變化0102 生態(tài)底座價(jià)值鏈分析生態(tài)底座價(jià)值拆解算力價(jià)值分析數(shù)據(jù)價(jià)值分析算法價(jià)值分析生態(tài)服務(wù)商總結(jié)大模型生態(tài)底座產(chǎn)業(yè)圖譜03 原子能力商業(yè)潛力分析原子能力覆蓋行業(yè)梳理基礎(chǔ)模態(tài)原子能力分析多模態(tài)原子能力分析原子能力商業(yè)潛力評估總結(jié)原子能力產(chǎn)業(yè)圖譜優(yōu)秀企業(yè)案例商業(yè)潛力規(guī)模預(yù)判商業(yè)潛力邊界模型邊界突破趨勢未來商業(yè)潛力規(guī)模預(yù)測0425資料來源:國家統(tǒng)計(jì)局、公開資料、億歐智庫整理賦能趨勢明顯,創(chuàng)意設(shè)計(jì)輸出、前端展示相關(guān)的賽道將會率先受益大模型推出對文本、圖像、音頻、視頻了直接性的影響,為各個(gè)行業(yè)賦能的趨勢已經(jīng)顯現(xiàn),服務(wù)類行業(yè)、制造類行業(yè)、文娛類行業(yè)將會受到較大沖擊?;A(chǔ)原子能力文本音頻圖像視頻編碼服務(wù)類行業(yè)居民和家庭健康服務(wù)養(yǎng)老服務(wù)居民零售和互聯(lián)網(wǎng)銷售居民出行住宿餐飲教育培訓(xùn)居民住房金融服務(wù)制造類行業(yè)醫(yī)藥制造航空、航天器及設(shè)備制造電子及通信設(shè)備制造計(jì)算機(jī)及辦公設(shè)備制造醫(yī)療儀器設(shè)備及儀器儀表制造化學(xué)品制造文娛類行業(yè)新聞出版發(fā)行廣播電視電影文化信息傳輸文化創(chuàng)意與設(shè)計(jì)文化休閑娛樂旅游游覽和娛樂體育游戲虛擬人合成數(shù)據(jù)知識圖譜聊天機(jī)器人AIGS多模態(tài)原子能力資料來源:公開資料、億歐智庫整理文字模態(tài)原子能力作為語言能力的核心,已有大量的商業(yè)應(yīng)用早期發(fā)展的重點(diǎn)之一是基于自然語言處理技術(shù)的文字單模態(tài)原子能力,其包含文本回復(fù)、文章生成、內(nèi)容續(xù)寫等細(xì)分功能。文字單模態(tài)原子能力能夠在各職能中落地,主要應(yīng)用有經(jīng)營決策,管理協(xié)作,產(chǎn)品研發(fā),市場營銷,涵蓋會議記錄、需求分析等。文字單模態(tài)原子能力應(yīng)用介紹強(qiáng)調(diào)實(shí)時(shí)性文本回復(fù):用于自動(dòng)回復(fù)和解決用戶的問題,應(yīng)用于智能問答系統(tǒng)、聊天客服機(jī)器人和智能推薦系統(tǒng)文本交互:為用戶提供心理疏導(dǎo)和情感咨詢與支持,如虛擬伴侶/朋友開發(fā)實(shí)時(shí)文字類交互游戲,如AI

dungeon1交互性文本生成強(qiáng)調(diào)內(nèi)容推理性文章生成:結(jié)構(gòu)性寫作,有較強(qiáng)的生成規(guī)律,包括文本風(fēng)格遷移、對話式/結(jié)構(gòu)式文本生成等,為目前落地最廣泛的場景輔助寫作:基于已獲得的素材輔助創(chuàng)作,包括文本素材預(yù)處理、自動(dòng)智能去重、根據(jù)要求提供對應(yīng)文本素材等文本續(xù)寫:根據(jù)已有內(nèi)容續(xù)寫,使內(nèi)容符合邏輯而又有文學(xué)價(jià)值營銷文案:非結(jié)構(gòu)性寫作,需要一定創(chuàng)意和個(gè)性化,包括廣告文案、產(chǎn)品描述、社群營銷、社交媒體發(fā)布等2非交互性文本生成26文字單模態(tài)原子能力在各職能應(yīng)用市場情報(bào)分析:分析市場趨勢和消費(fèi)者需求,幫助決策者制定戰(zhàn)略輿情監(jiān)測:分析新聞等渠道中的文字信息,評估對企業(yè)聲譽(yù)的影響經(jīng)營決策會議記錄與匯總:分析會議紀(jì)要,生成會議摘要或行動(dòng)項(xiàng)清單文檔自動(dòng)生成:根據(jù)輸入信息生成文檔的摘要、概述或推薦內(nèi)容管理協(xié)作用戶需求分析:分析用戶反饋、市場調(diào)研等文本數(shù)據(jù)競爭對手分析:幫助識別和分析競爭對手的產(chǎn)品特點(diǎn)產(chǎn)品研發(fā)智能創(chuàng)意營銷:通過分析用戶評論、等文本信息,幫助優(yōu)化廣告創(chuàng)意智能銷售流程:自動(dòng)分析和處理銷售相關(guān)的文本信息市場營銷27資料來源:公開資料、億歐智庫整理圖片生成技術(shù)難度相對較大,但發(fā)展速度迅猛,具有較高的商業(yè)潛力圖像生成技術(shù)主要包括GAN、Diffusion

Model、NeRF等,圖像的生成難度遠(yuǎn)大于文字生成,現(xiàn)今生成穩(wěn)定高質(zhì)的圖像仍有難度。主要有圖像分析、視覺項(xiàng)目管理、圖像識別廣告等應(yīng)用。億歐智庫:圖片單模態(tài)原子能力的應(yīng)用圖片單模態(tài)原子能力在各職能的應(yīng)用基于原圖像進(jìn)行修改圖像屬性編輯:自動(dòng)或輔助進(jìn)行圖片修改調(diào)整,如提升清晰度或分辨率、設(shè)置濾鏡、去水印圖像局部生成及更改:在原圖片基礎(chǔ)上進(jìn)行微調(diào),更改部分圖像、改動(dòng)圖片人像特征1圖片編輯基于草圖生成完整圖像功能性圖像生成:制作營銷宣傳類海報(bào)/公眾號界面、logo、衣物/妝容效果示意圖創(chuàng)意圖像生成:較為前沿,多出現(xiàn)在數(shù)字藏品、加密數(shù)字資產(chǎn)藝術(shù)品中2圖像生成圖像數(shù)據(jù)分析:對大量圖像數(shù)據(jù)進(jìn)行分析,獲取有關(guān)產(chǎn)品需求視覺競爭對手分析:幫助企業(yè)分析競爭對手的廣告等圖像信息,提供視覺上的競爭優(yōu)勢經(jīng)營決策圖像標(biāo)注和共享:實(shí)現(xiàn)圖像標(biāo)注和注釋,提高協(xié)作效率視覺項(xiàng)目管理:該能力可以幫助管理團(tuán)隊(duì)跟蹤視覺項(xiàng)目,以確保項(xiàng)目按時(shí)交付管理協(xié)作產(chǎn)品可視化和設(shè)計(jì):實(shí)現(xiàn)產(chǎn)品的三維可視化、虛擬樣機(jī)等基于圖像的用戶反饋分析:分析用戶對產(chǎn)品外觀、包裝等圖像方面的反饋,為產(chǎn)品改進(jìn)和創(chuàng)新提供支持產(chǎn)品研發(fā)圖像識別廣告:識別圖像中的產(chǎn)品等,實(shí)現(xiàn)與之相關(guān)的廣告投放圖像社交媒體分析:分析社交媒體平臺上的圖像內(nèi)容,為市場營銷人員提供洞察和反饋市場營銷28資料來源:公開資料、億歐智庫整理音頻單模態(tài)可用于有聲內(nèi)容創(chuàng)作,是文字、圖像之后同樣具備潛力的賽道基于技術(shù)的音樂生成將會是音頻單模態(tài)原子應(yīng)用領(lǐng)域的快速成長賽道,同時(shí)音頻生成將會對短視頻、虛擬偶像、影視劇等文娛領(lǐng)域產(chǎn)生深遠(yuǎn)且意義重大的影響。音頻單模態(tài)原子能力有語音分析、聲音品牌塑造等細(xì)分功能。音頻單模態(tài)原子能力的應(yīng)用音頻單模態(tài)原子能力在各行業(yè)應(yīng)用聲音合成:將已有文本轉(zhuǎn)換為語音,基于深度學(xué)習(xí),根據(jù)文本內(nèi)容推斷感情和情緒,從而在語音中呈現(xiàn)語音克?。褐付繕?biāo)音色,采集語音信號,進(jìn)行預(yù)處理和特征提取,訓(xùn)練出語音模型,進(jìn)行文本轉(zhuǎn)語音1文本轉(zhuǎn)語音場景作曲:通過對音高、音長等低維度樂理提取,在獲得樂曲主旋律的基礎(chǔ)上,進(jìn)行續(xù)寫或改編編曲:根據(jù)給定的情緒或風(fēng)格,基于主旋律生成和弦,完成整體編配虛擬歌曲:將生成的主旋律、人聲和音軌渲染混合,得到完整樂曲2樂曲生成場景語音數(shù)據(jù)分析:對大量語音數(shù)據(jù)進(jìn)行分析,如電話客服錄音,以獲取有關(guān)市場趨勢的洞察聲音品牌塑造:幫助企業(yè)塑造聲音品牌,以提升品牌的識別度經(jīng)營決策語音記錄和共享:實(shí)現(xiàn)語音記錄和共享,例如會議錄音的自動(dòng)轉(zhuǎn)錄和存檔,便于團(tuán)隊(duì)成員回顧和參考音頻編輯與處理:支持團(tuán)隊(duì)對音頻編輯和處理管理協(xié)作語音交互設(shè)計(jì):可以設(shè)計(jì)和開發(fā)語音交互的產(chǎn)品和服務(wù)基于音頻數(shù)據(jù)的用戶洞察:分析用戶在產(chǎn)品使用過程中的語音反饋和需求,為產(chǎn)品改進(jìn)和創(chuàng)新提供支持產(chǎn)品研發(fā)語音廣告和推廣:生成語音廣告和推廣內(nèi)容,例如電話營銷、語音廣播等,以增加品牌曝光和用戶參與度聲音情感分析:分析音頻中的情感色彩,識別用戶情緒和情感反饋市場營銷29資料來源:AMR、開源證券、《2020數(shù)字虛擬人發(fā)展白皮書》、億歐智庫整理虛擬人擁抱解決成本痛點(diǎn),拓寬場景應(yīng)用,產(chǎn)生長期價(jià)值虛擬人已經(jīng)開始廣泛的行業(yè)探索,市場潛力巨大,利用賦能的虛擬人產(chǎn)業(yè)全球規(guī)模將于2031年達(dá)到5910億美元??梢越档吞摂M人的制作壁壘,利用虛擬人技術(shù)的快速鋪開。同時(shí),可以驅(qū)動(dòng)虛擬人運(yùn)作,進(jìn)行實(shí)時(shí)交互,拓寬虛擬人的場景。億歐智庫:全球虛擬人市場規(guī)模預(yù)測(2021-2031E)賦能虛擬人11316445475908202120222023E2024E2025E2026E2027E2028E2029E2030E2031E前全球虛擬人市場規(guī)模預(yù)測曲線(億美元)賦能全球虛擬人市場規(guī)模(億美元)據(jù)國際知名數(shù)據(jù)機(jī)構(gòu)預(yù)測,經(jīng)過全球賦能的虛擬人市場規(guī)模在2031年將達(dá)5910億美元,的增幅約為30%。降低虛擬人成本開始嘗試將虛擬人物引入現(xiàn)實(shí)世界,整體以手繪為主萌芽期動(dòng)捕和CG等計(jì)算機(jī)逐步替代手繪,成本高昂探索期成為必要工具,深度學(xué)習(xí)簡化數(shù)字人的制作,但成本依舊高企智能驅(qū)動(dòng)虛擬人實(shí)時(shí)交互建模虛擬人制作渲染驅(qū)動(dòng)規(guī)劃規(guī)劃運(yùn)營運(yùn)營維護(hù)直播商業(yè)變現(xiàn)帶貨活動(dòng)成本占比60%30%10%智能分析與決策 識別感知終端用戶人物語音錄制動(dòng)捕遷移生成動(dòng)畫音視頻合成顯示文本虛擬人的成本集中于制作及運(yùn)營環(huán)節(jié),利用強(qiáng)大的生成能力輔助建模、渲染等重要環(huán)節(jié),減少虛擬人投入成本利用技術(shù)的實(shí)時(shí)驅(qū)動(dòng)型虛擬人運(yùn)作流程為“用戶-終端-智能分析-合成-終端-用戶”的閉環(huán),減少利用“真人”數(shù)據(jù)的依賴大突破,強(qiáng)大的泛化、交互促進(jìn)虛擬人真正走向智能化、實(shí)時(shí)化發(fā)展期中國虛擬人現(xiàn)今所處階段成熟期賦能可以為占據(jù)虛擬人90%成本的制作、規(guī)劃運(yùn)營環(huán)節(jié)賦能,降本增效利用大模型的生成、推理、共情賦予虛擬人實(shí)時(shí)互動(dòng)能力真人 音視頻監(jiān)控系統(tǒng)賦能XX億歐智庫:中國虛擬人進(jìn)程階段30資料來源:億歐智庫整理虛擬人在服務(wù)類行業(yè)、文化傳媒類行業(yè)擁有較多的應(yīng)用虛擬人主要在服務(wù)類行業(yè)、文化傳媒類行業(yè)進(jìn)行,在的時(shí)代,利用自動(dòng)生成的能力,虛擬人可以實(shí)現(xiàn)實(shí)時(shí)交互、降低建模成本、覆蓋多種場景,且可擴(kuò)展性高、降低真人產(chǎn)生的侵權(quán)風(fēng)險(xiǎn)。虛擬人在各行業(yè)落地應(yīng)用,加速產(chǎn)業(yè)智能化服務(wù)類行業(yè)01文化傳媒類行業(yè)02制造類行業(yè)03電商產(chǎn)品展示:利用虛擬人的類人特性,展現(xiàn)衣物在不同體型的人身上的試穿效果虛擬人主播:形成“真人+虛擬人”的24小時(shí)不間斷直播,且無需上崗培訓(xùn),壓縮人員成本實(shí)時(shí)互動(dòng):利用強(qiáng)大的內(nèi)容生成能力與共情能力,和觀眾實(shí)時(shí)交流互動(dòng)前臺接待/情感陪護(hù):以較低廉成本生成虛擬人,覆蓋接待、陪護(hù)等場景元宇宙分身:利用生成全身化、定制化的虛擬分身,作為元宇宙的入口虛擬人的場景更貼近用戶端,以前端展示類場景、中端的攝制制造類場景、后段的運(yùn)營維護(hù)場景為主。整體來看,虛擬人更偏向于服務(wù)類與文化傳媒類行業(yè),應(yīng)用更聚焦于核心環(huán)節(jié)。利用加持,降低建模、渲染等成本,同時(shí)加強(qiáng)“虛擬人-用戶”的互動(dòng)性。故障排查:利用與數(shù)字孿生生成工業(yè)元宇宙模擬真實(shí)生產(chǎn)環(huán)境,由虛擬人進(jìn)行危險(xiǎn)、故障排摸人員培訓(xùn):利用虛擬人模仿真實(shí)操作設(shè)備的場景,以沉浸式的感官體驗(yàn),教授工人進(jìn)行作業(yè)以前端對接為主以代人攝制為主以維護(hù)、運(yùn)營為主三維數(shù)字人:利用虛擬人進(jìn)行三維電影拍攝,在的加持下,幫助導(dǎo)演實(shí)現(xiàn)現(xiàn)實(shí)拍攝中無法表現(xiàn)的內(nèi)容和效果數(shù)字復(fù)活:利用虛擬人與過世演員的臉部特征進(jìn)行數(shù)字復(fù)活,避免拍攝中斷數(shù)字替身:虛擬人仿真缺席拍攝的演員(包括劣跡藝人)31資料來源:Cognilytica、Grand

View

Research、Gartner、J.P.Morgan、億歐智庫整理利用強(qiáng)大的生成能力及多模態(tài)能力助力合成數(shù)據(jù)多樣化,模擬真實(shí)世界屬性2030用于人工智能的數(shù)據(jù)今天的人工智能未來的人工智能真實(shí)數(shù)據(jù)合成數(shù)據(jù)真實(shí)數(shù)據(jù)Real

Data真實(shí)數(shù)據(jù)度量RealData

Metrics結(jié)果比較MetricsComparator合成DataGenerator合成數(shù)據(jù)SyntheticData合成數(shù)據(jù)度量Synthetic

DataMetrics判斷真實(shí)數(shù)據(jù)存在的痛點(diǎn):難以獲取、質(zhì)量差、標(biāo)準(zhǔn)不統(tǒng)一采集費(fèi)時(shí)費(fèi)力,獲取成本較高缺乏多樣性,難以覆蓋長尾、邊緣案例存在隱私保護(hù)問題賦能合成數(shù)據(jù),解決數(shù)據(jù)獲取難、數(shù)據(jù)采集成本高、數(shù)據(jù)樣本多樣性不足和數(shù)據(jù)隱私保護(hù)需求等痛點(diǎn)問題。實(shí)現(xiàn)數(shù)據(jù)增強(qiáng)和數(shù)據(jù)模擬,解決數(shù)據(jù)匱乏等問題降低采集的成本,擴(kuò)展的應(yīng)用可能性確保數(shù)據(jù)多樣性更多反映真實(shí)世界,并應(yīng)對長尾、邊緣案例,提高

Al

的準(zhǔn)確性、可靠性避免隱私/安全/保密問題,利用合成數(shù)據(jù)訓(xùn)練可以避免直接應(yīng)用隱私數(shù)據(jù)的法律風(fēng)險(xiǎn)合成數(shù)據(jù)(

synthetic

data

):通過,生成合成人工智能發(fā)展所需的海量數(shù)據(jù),可以在數(shù)學(xué)或統(tǒng)計(jì)學(xué)上反映真實(shí)數(shù)據(jù)的屬性與特征,可作為真實(shí)數(shù)據(jù)的輔助與替代品,幫助訓(xùn)練和驗(yàn)證模型。60%到2024

年,用于訓(xùn)練

Al

的數(shù)據(jù)中有

60%

將是合成數(shù)據(jù)利用的生成能力與多模態(tài)能力大量合成反映真實(shí)數(shù)據(jù)屬性和特征的海量數(shù)據(jù),并于新興技術(shù),以自身為例,將在未來成為訓(xùn)練數(shù)據(jù)的主要來源,預(yù)計(jì)到2030年將完全取代真實(shí)數(shù)據(jù)。賦能合成數(shù)據(jù),能夠解決真實(shí)數(shù)據(jù)獲取難、獲取成本高、多樣性不足、缺乏隱私保護(hù)等痛點(diǎn)問題。訓(xùn)練合成數(shù)據(jù)占比預(yù)測 億歐智庫:數(shù)據(jù)合成過程2020 202432資料來源:騰訊研究院、億歐智庫整理加快合成數(shù)據(jù)發(fā)展結(jié)構(gòu)化數(shù)據(jù)是指具有明確格式和規(guī)則的數(shù)據(jù),主要用于服務(wù)類行業(yè)。在金融行業(yè)中可以用來防范金融詐騙。在零售行業(yè)中,超市可以將銷售歷史數(shù)據(jù)、庫存數(shù)據(jù)和供應(yīng)商數(shù)據(jù)合成,以便跟蹤產(chǎn)品銷售趨勢并進(jìn)行采購決策。非結(jié)構(gòu)化數(shù)據(jù)是指沒有明確格式和規(guī)則的數(shù)據(jù),如文本、圖像等,主要用于工業(yè)制造類行業(yè)。在自動(dòng)駕駛業(yè)中可以用來幫助解決系統(tǒng)開發(fā)的數(shù)據(jù)量和多樣性不足的問題。億歐智庫:合成數(shù)據(jù)在服務(wù)類和工業(yè)制造類行業(yè)中的應(yīng)用合成數(shù)據(jù)在服務(wù)類和工業(yè)制造類行業(yè)中都有廣泛應(yīng)用,通過合成多種來源的數(shù)據(jù),能夠更好地了解決業(yè)務(wù)問題。金融服務(wù)業(yè):利用生成對抗網(wǎng)絡(luò)(GAN)和自然語言生成(NLG),訓(xùn)練、優(yōu)化進(jìn)行欺詐檢測的模型,防范金融詐騙和反洗錢等重大問題。零售業(yè):零售公司需要管理大量的庫存數(shù)據(jù)、銷售數(shù)據(jù)和客戶數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù),以便了解市場趨勢、優(yōu)化庫存和提高銷售額等。物流運(yùn)輸業(yè):物流和運(yùn)輸公司需要處理大量的運(yùn)輸和倉儲數(shù)據(jù),以便跟蹤貨物運(yùn)輸狀態(tài)、優(yōu)化運(yùn)輸路線和降低成本等。健康醫(yī)療業(yè):健康醫(yī)療行業(yè):醫(yī)療機(jī)構(gòu)需要處理大量的病歷、藥品和治療數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù),以便為患者提供更好的醫(yī)療服務(wù)。結(jié)構(gòu)化數(shù)據(jù)是指具有明確格式和規(guī)則的數(shù)據(jù),如數(shù)據(jù)庫中的表格、電子表格、CSV文件等。服務(wù)類行業(yè)支撐部門的業(yè)務(wù)優(yōu)化非結(jié)構(gòu)化數(shù)據(jù)是指沒有明確格式和規(guī)則的數(shù)據(jù),如文本、圖像和視頻等。工業(yè)制造類行業(yè)工業(yè)配套軟件優(yōu)化自動(dòng)駕駛業(yè):模擬海量仿真環(huán)境與駕駛場景,訓(xùn)練、開發(fā)自動(dòng)駕駛系統(tǒng),幫助解決系統(tǒng)開發(fā)過程中的數(shù)據(jù)量和多樣性不足的問題。產(chǎn)品仿真:幫助制造商在各種虛擬環(huán)境中模擬產(chǎn)品性能、測試產(chǎn)品強(qiáng)度和耐用性,進(jìn)行各種模擬測試。輔助大模型:通過合成數(shù)據(jù),對大模型進(jìn)行訓(xùn)練和驗(yàn)證,提升速度與質(zhì)量。制造業(yè)流程優(yōu)化結(jié)構(gòu)化數(shù)據(jù) 非結(jié)構(gòu)化數(shù)據(jù)33資料來源:Precedence

Research、Salesforce、麻省理工學(xué)院技術(shù)評論、Accenture

Digital、億歐智庫整理賦能聊天機(jī)器人知識庫能力、對于用戶的問題進(jìn)行擬人回復(fù)全球企業(yè)都在越來越重視聊天機(jī)器人的,聊天機(jī)器人可以提高生產(chǎn)力和便利性,改善客戶服務(wù)體驗(yàn)、提升員工利用率,加快與品牌溝通速度,更快解決客戶問題和投訴,以及帶來更高的投資回報(bào)率??梢詫⒅R庫的能力灌注至聊天機(jī)器人,并通過上下文聯(lián)系、提示詞等手段智能回復(fù),同時(shí)拒絕不恰當(dāng)?shù)恼埱?。聊天機(jī)器人工作流程聊天機(jī)器人是一種可以模擬和處理人類會話(書面/語音)的計(jì)算機(jī)程序,讓人能夠與數(shù)字設(shè)備交互,就像和真人交流一樣。消費(fèi)者使用聊天機(jī)器人加快與品牌溝通速度67%企業(yè)報(bào)告使用機(jī)器人可以更快地解決投訴90%企業(yè)稱聊天機(jī)器人以最少的投資獲得巨大回報(bào)57%客戶交互可以通過聊天機(jī)器人來解決80%可以分析用戶提出的觀點(diǎn)或論斷,并根據(jù)事實(shí)和邏輯反駁或糾正有助于減少惡意的傳播,為用戶提供一個(gè)良好的交流環(huán)境提供較為準(zhǔn)確可靠的信息維護(hù)秩序和良好的交流環(huán)境提供個(gè)性化和定制化的回答,無需用戶重復(fù)輸入問題背景和前提條件,增強(qiáng)用戶滿意度和體驗(yàn)通過承認(rèn)回答中的錯(cuò)誤,逐步提升邏輯與回答水平提升用戶滿意度不斷提升自主學(xué)習(xí)能力語音識別ASR自然語言理解NLU對話管理DM命令執(zhí)行自然語言生成NLU語音合成TTS用戶口頭輸入賦能聊天機(jī)器人進(jìn)行擬人回復(fù)過濾或拒絕不恰當(dāng)請求挑戰(zhàn)或反駁不正確意見承認(rèn)回答中的錯(cuò)誤可以根據(jù)歷史提問記錄回答問題34資料來源:公開資料、億歐智庫整理聊天機(jī)器人成為各個(gè)應(yīng)用的前端場景,成為“可以交互的UI界面”服務(wù)類行業(yè)01文化傳媒類行業(yè)02制造類行業(yè)03聊天機(jī)器人在服務(wù)類行業(yè)、文化傳媒類行業(yè)、制造類行業(yè)都有著廣泛的,可以提供預(yù)約調(diào)度、旅游規(guī)劃、庫存管理等自動(dòng)化服務(wù),進(jìn)一步提升效率和用戶體驗(yàn)。聊天機(jī)器人的場景不斷拓展,將越來越受到各行業(yè)的歡迎和青睞。以前端對話服務(wù)為主以智能化服務(wù)為主以運(yùn)營保障為主預(yù)約調(diào)度:根據(jù)客戶需求和業(yè)務(wù)規(guī)則,自動(dòng)處理日程預(yù)定、會議預(yù)約等,提供定制化服務(wù)醫(yī)療服務(wù):與患者對話,獲取患者信息,推薦與調(diào)度醫(yī)療專家,同時(shí)進(jìn)行藥物提醒和情緒跟蹤客戶服務(wù):聊天機(jī)器人可以幫助企業(yè)為客戶提供快速、高效的服務(wù),如客戶咨詢、投訴處理等語音客服:聊天機(jī)器人可以結(jié)合語音識別和語音合成,為客戶提供智能化的語音客服服務(wù)酒店服務(wù):聊天機(jī)器人可以幫助酒店為客戶提供更加便捷、舒適的服務(wù)聊天機(jī)器人的場景越來越多樣化,能夠提高人們事務(wù)處理的效率,節(jié)省人們的時(shí)間與精力。通過聊天機(jī)器人,企業(yè)能夠提高生產(chǎn)效率,加快反饋速度,優(yōu)化客戶體驗(yàn),從而增強(qiáng)企業(yè)的競爭力。聊天機(jī)器人多場景旅游規(guī)劃:提供旅游咨詢和旅行路線規(guī)劃等服務(wù),省時(shí)省力劇情梗概撰寫:自動(dòng)回復(fù)總結(jié)出影視文學(xué)作品的梗概,并輸出視頻,無需人工處理情感陪護(hù):即時(shí)輸出文字/音頻,對用戶情感陪護(hù)投訴處理等新媒體營銷:聊天機(jī)器人可以作為新媒體營銷的重要工具,提供產(chǎn)品推廣和品牌營銷服務(wù)內(nèi)容推薦:聊天機(jī)器人可以通過自然語言處理,分析用戶的興趣和喜好,為用戶推薦個(gè)性化的內(nèi)容庫存管理:跟蹤庫存水平、物料需求和供應(yīng)鏈狀況,為制造商提供庫存管理建議和調(diào)整策略協(xié)助查詢:協(xié)助員工查詢和理解工藝流程和安全規(guī)范等,提高員工生產(chǎn)力和質(zhì)量質(zhì)量控制:聊天機(jī)器人可以通過圖像識別和自然語言處理,自動(dòng)分析產(chǎn)品的質(zhì)量問題和缺陷設(shè)備維修:聊天機(jī)器人可以通過物聯(lián)網(wǎng)和傳感器監(jiān)測設(shè)備的運(yùn)行狀態(tài)和健康狀況供應(yīng)鏈管理:聊天機(jī)器人可以為制造商提供實(shí)時(shí)的供應(yīng)鏈和建議35資料來源:公開資料、億歐智庫整理賦能知識圖譜多模態(tài)能力完成長尾識別與跨模態(tài)鏈接可以通過文本分析和圖像處理等多模態(tài)技術(shù),從海量的文本和圖像數(shù)據(jù)中自動(dòng)抽取和識別實(shí)體和關(guān)系,并將它們映射到知識圖譜中,自動(dòng)產(chǎn)生新的實(shí)體和關(guān)系,幫助知識圖譜不斷豐富和擴(kuò)展。還可以通過提高知識圖譜的自然語言理解能力,將實(shí)體和關(guān)系作為上下文信息,從而提高檢索和推薦的準(zhǔn)確性和個(gè)性化程度。億歐智庫:知識圖譜進(jìn)行多模態(tài)轉(zhuǎn)化與知識圖譜的多模態(tài)轉(zhuǎn)變視頻音頻圖片知識圖譜模態(tài)能力疊加知識圖譜需要利用進(jìn)行多模態(tài)轉(zhuǎn)化知識圖譜,即是將互相鏈接,其數(shù)據(jù)來源不僅限于文本和結(jié)構(gòu)化數(shù)據(jù),同時(shí)還包括圖片、音頻、視頻等。在經(jīng)過多模態(tài)轉(zhuǎn)化后,知識圖譜將得到極大提升:利用多種模態(tài)的知識,進(jìn)行知識互補(bǔ)同時(shí)關(guān)聯(lián)多種模態(tài),提升實(shí)體消歧效果正確鏈接多模態(tài)數(shù)據(jù)與知識圖譜中的對應(yīng)實(shí)體,實(shí)現(xiàn)跨模態(tài)語義搜索補(bǔ)全知識圖譜幫助知識圖譜進(jìn)行多模態(tài)轉(zhuǎn)變知識圖譜現(xiàn)存痛點(diǎn) 賦能解決KG痛點(diǎn)推理能力弱

通過強(qiáng)大的跨模態(tài)能力增強(qiáng)kg關(guān)聯(lián)推理能力,人工成本高 提升泛化能力架構(gòu)調(diào)整難

大模型合成數(shù)據(jù)不需要人工額外標(biāo)注可通過調(diào)優(yōu)訓(xùn)練,適配新領(lǐng)域賦能實(shí)現(xiàn)知識圖譜長尾識別、跨模態(tài)鏈接長尾識別主要目標(biāo)長尾目標(biāo)跨模態(tài)實(shí)體鏈接穿白裙子、戴白帽子在草地上走路的人穿在戴白裙子白帽子36資料來源:億歐智庫整理多模態(tài)知識圖譜提升內(nèi)容厚度,實(shí)現(xiàn)更個(gè)性化與精細(xì)化的服務(wù)產(chǎn)出服務(wù)類行業(yè)01文化傳媒類行業(yè)02制造類行業(yè)03整體來看,知識圖譜主要通過構(gòu)建提供個(gè)性化服務(wù)的體系、構(gòu)建產(chǎn)品知識庫、可視化交互等方式,為企業(yè)提供語義搜索、知識問答、推薦與決策等功能,幫助企業(yè)實(shí)現(xiàn)個(gè)性化服務(wù)和精準(zhǔn)觸達(dá),并增強(qiáng)平臺的黏性和用戶留存率。通過個(gè)性化屬性的挖掘,提供更針對性的服務(wù)通過圖譜明晰信息的內(nèi)在聯(lián)系,主要用于可視化交互、營銷通過知識數(shù)據(jù)庫對設(shè)備狀態(tài)、產(chǎn)品狀態(tài)進(jìn)行對比性分析,并進(jìn)行優(yōu)化賦予知識圖譜更高的準(zhǔn)確性、智能化程度以及多模態(tài)內(nèi)容厚度,通過大模型的智能化能力和數(shù)據(jù)驅(qū)動(dòng)能力,為企業(yè)和用戶帶來更加豐富、高效、智能的知識體系構(gòu)建的服務(wù)。知識圖譜多場景數(shù)字化文物、藏品管理:通過將文物、藏品數(shù)字化,并利用知識圖譜將其與相關(guān)的文化關(guān)聯(lián),可以實(shí)現(xiàn)對文物的全方位管理和展示。傳媒受眾畫像:利用知識圖譜分析受眾的行為和偏好,從而構(gòu)建畫像,為個(gè)性化運(yùn)營和營銷提供決策支持。狀態(tài)監(jiān)測與預(yù)測性維護(hù):知識圖譜通過收集設(shè)備、工藝、物料等制造關(guān)鍵,實(shí)現(xiàn)工業(yè)制造過程的數(shù)據(jù)集成、分析和優(yōu)化,實(shí)現(xiàn)設(shè)備的狀態(tài)監(jiān)測和預(yù)測性維護(hù)。質(zhì)量管理控制:建立產(chǎn)品質(zhì)量的知識圖譜,在生產(chǎn)之后通過比對分析,以便監(jiān)控和管理產(chǎn)品質(zhì)量,提高客戶滿意度。風(fēng)險(xiǎn)評估:知識圖譜通過將金融產(chǎn)品、市場數(shù)據(jù)、客戶畫像等信息構(gòu)建為知識圖譜,實(shí)現(xiàn)數(shù)據(jù)關(guān)聯(lián)和挖掘,并風(fēng)險(xiǎn)評估、投資建議、智能客戶管理等功能,提高金融機(jī)構(gòu)的競爭力和服務(wù)水平。個(gè)性化推薦:通過將商品屬性、用戶需求、歷史行為等構(gòu)建知識圖譜,提高用戶購物體驗(yàn)和銷售轉(zhuǎn)化率。招聘:知識圖譜可以用于搭建智能招聘系統(tǒng),實(shí)現(xiàn)基于技能和經(jīng)驗(yàn)的自動(dòng)匹配和推薦,提高招聘效率和招聘質(zhì)量。內(nèi)容概念構(gòu)思:構(gòu)建事件、人物、場景等元素的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)藝術(shù)創(chuàng)作的自動(dòng)生成,從而提高創(chuàng)作效率37資料來源:第四范式、公開資料、億歐智庫整理重構(gòu)辦公軟件,提升企業(yè)軟件效率與體驗(yàn)AIGS

Generated

Software)即為生成式軟件,通過AIGS進(jìn)行數(shù)據(jù)一體化、輔助頁面交互、優(yōu)化代碼編寫,企業(yè)軟件得到多方面提升,企業(yè)辦公效率進(jìn)一步提高。AIGS以生成式重構(gòu)企業(yè)軟件AIGS為企業(yè)軟件賦能AIGS

1.0利用對辦公軟件、工業(yè)軟件賦能,進(jìn)行數(shù)據(jù)、應(yīng)用、服務(wù)一體化、頁面UI交互優(yōu)化、自動(dòng)迭代,協(xié)助執(zhí)行任務(wù)與用戶指令,進(jìn)行不同信息的調(diào)度AIGS

2.0參照企業(yè)規(guī)則的知識庫,給出攻略AIGS

3.0大模型調(diào)整完成,形成思維鏈,可完全自動(dòng)完成復(fù)雜任務(wù)與指令A(yù)IGS與思維鏈(chainof

thought):思維鏈在解決多步驟問題時(shí),模仿人類將復(fù)雜任務(wù)拆分的思維過程,進(jìn)行逐步推理,執(zhí)行指令,是實(shí)現(xiàn)AIGS的關(guān)鍵通過深入學(xué)習(xí)多重領(lǐng)域,獲取并學(xué)習(xí)海量數(shù)據(jù),形成不同領(lǐng)域的思維鏈,當(dāng)思維鏈達(dá)到一定復(fù)雜程度后,企業(yè)軟件即能執(zhí)行更多復(fù)雜功能整合以不同的媒體格式(文本、圖像、結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù))存在的數(shù)據(jù)進(jìn)行數(shù)據(jù)的數(shù)字化,整理分布在不同系統(tǒng)中的數(shù)據(jù)將不同性質(zhì)的數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的向量格式對數(shù)據(jù)開展質(zhì)量驗(yàn)證01改變傳統(tǒng)軟件的菜單式開發(fā)頁面,無需重復(fù)進(jìn)行設(shè)計(jì)與開發(fā)省去搜索、聚類、生成等過程的時(shí)間功能和邏輯被編排在數(shù)據(jù)、API和內(nèi)容層面,提升開發(fā)效率降低用戶門檻,適用范圍覆蓋非開發(fā)者推理能力增強(qiáng),代碼質(zhì)量提升幫助企業(yè)自動(dòng)生成代碼,節(jié)省人力與時(shí)間,縮短項(xiàng)目周期03數(shù)據(jù)、應(yīng)用、服務(wù)一體化頁面UI交互優(yōu)化自動(dòng)生成代碼輔助軟件迭代AIGS

2.0AIGS

3.0AIGS

1.0數(shù)據(jù)、應(yīng)用、?服務(wù)一體化02頁面UI交互優(yōu)化代碼生成輔助軟件迭代38資料來源:公開資料、億歐智庫整理AIGS對于需要應(yīng)用多個(gè)工業(yè)軟件的行業(yè)具有較強(qiáng)的商業(yè)潛力未來,AIGS在各行業(yè)都將產(chǎn)生,利用數(shù)據(jù)一體化、頁面UI交互、代碼優(yōu)化的能力為各行業(yè)降低不同軟件的集成難度,提高數(shù)據(jù)質(zhì)量與利用率,降低系統(tǒng)成本,滿足用戶更多樣化的需求。AIGS在各行業(yè)應(yīng)用賦能企業(yè)軟件服務(wù)類行業(yè)&文化傳媒類行業(yè)制造類行業(yè)整合:利用多種類型,整合垂類數(shù)據(jù),增優(yōu)化:幫助制造企業(yè)更好地掌握整個(gè)生產(chǎn)流程,加數(shù)據(jù)多樣性識別生產(chǎn)過程中的問題,及時(shí)解決優(yōu)化數(shù)據(jù)一體化營銷推廣:數(shù)據(jù)一體化幫助企業(yè)更精準(zhǔn)地識別目標(biāo)供應(yīng)鏈管理:通過數(shù)據(jù)分析對能源試用情況供應(yīng)商的交貨客戶,并根據(jù)客戶的需求和偏好更有針對性的、產(chǎn)品質(zhì)量等指標(biāo)監(jiān)控和分析,優(yōu)化供應(yīng)鏈的管定向營銷和推廣活動(dòng),拓展市場份額理和運(yùn)營效率頁面UI交互降低操作難度:在電商相關(guān)軟件和影視游戲制作相關(guān)技術(shù)平臺,使用者可以更快速便捷操作提高生產(chǎn)效率:通過簡化UI界面,員工可以更快速方便地使用辦公軟件操作,從而提高生產(chǎn)效率降低員工培訓(xùn)成本:由于UI界面更加簡單易懂,員工學(xué)習(xí)軟件操作的時(shí)間縮短代碼優(yōu)化滿足多樣化需求:通過編寫代碼的快速迭代能力,覆蓋某些產(chǎn)品的長尾需求數(shù)字化管理:實(shí)現(xiàn)生產(chǎn)軟件開發(fā):通過制造業(yè)的不同領(lǐng)域的歷史生產(chǎn)數(shù)據(jù),進(jìn)行定制化工業(yè)軟件開發(fā)過程的數(shù)字化管理,包括訂單管理、生產(chǎn)計(jì)劃、庫存管理、質(zhì)量管理等,優(yōu)化生產(chǎn)流程,降低成本應(yīng)用特點(diǎn)降低系統(tǒng)集成成本提高數(shù)據(jù)質(zhì)量提高數(shù)據(jù)利用率提高用戶體驗(yàn)提高工作效率提高代碼質(zhì)量降低系統(tǒng)成本滿足需求迭代整體來看,AIGS主要應(yīng)用于電影、游戲創(chuàng)作及制造類的行業(yè),這些行業(yè)大體需要大量的工業(yè)軟件進(jìn)行創(chuàng)作/制造。AIGS可以整合不同軟件的格式,提高數(shù)據(jù)的利用率。資料來源:專家訪談、公開資料、億歐智庫整理原子能力商業(yè)潛力評估總結(jié)的原子能力商業(yè)潛力評估涉及三大維度:應(yīng)用范圍場景維度、規(guī)模維度、利潤維度。應(yīng)用范圍場景:基礎(chǔ)原子具有較強(qiáng)的泛化通用能力,于短頭場景,整體來看可以覆蓋全職能的業(yè)務(wù)流程(經(jīng)營決策、管理協(xié)作、產(chǎn)品研發(fā)、市場營銷)。多模態(tài)原子需要多種技術(shù)融合滿足各個(gè)行業(yè)的長尾“+”需求。規(guī)模潛力與利潤潛力:衡量原子能力市場規(guī)模潛力與利潤率情況。原子能力商業(yè)潛力評估模型基本的生成能力體現(xiàn)廣泛應(yīng)用于通用的場景,通常在商業(yè)應(yīng)用方面具有較大的規(guī)模潛力壁壘相較于多模態(tài)原子能力低,激烈的競爭導(dǎo)致利潤率攤薄0.510.690.761.171.87文本圖像音頻視頻代碼基礎(chǔ)原子能力潛力指數(shù)基礎(chǔ)原子能力基礎(chǔ)原子能力的復(fù)合形態(tài),可以與現(xiàn)在的信息技術(shù)結(jié)合,以“+”的形式進(jìn)行賦能多模態(tài)原子能力多用于長尾的專業(yè)場景,市場規(guī)模不及基礎(chǔ)原子能力復(fù)合技術(shù)的難點(diǎn)構(gòu)成進(jìn)入壁壘,從長遠(yuǎn)看,相對具有較高的凈利潤率0.160.180.200.220.25知識圖譜聊天機(jī)器人虛擬人合成數(shù)據(jù)AIGS億歐智庫:多模態(tài)原子能力潛力指數(shù)多模態(tài)原子能力指數(shù)說明:能力潛力指數(shù)基于學(xué)術(shù)論文、市場研究、創(chuàng)業(yè)大賽及專家訪談綜合得出未來五年內(nèi)的商業(yè)潛力3939規(guī)模潛力利潤潛力泛化與通用場景專業(yè)場景基礎(chǔ)原子能力多模態(tài)原子能力4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論