計(jì)算機(jī)行業(yè)2023年中期策略報(bào)告:跨越奇點(diǎn)人工智能全景投資框架_第1頁
計(jì)算機(jī)行業(yè)2023年中期策略報(bào)告:跨越奇點(diǎn)人工智能全景投資框架_第2頁
計(jì)算機(jī)行業(yè)2023年中期策略報(bào)告:跨越奇點(diǎn)人工智能全景投資框架_第3頁
計(jì)算機(jī)行業(yè)2023年中期策略報(bào)告:跨越奇點(diǎn)人工智能全景投資框架_第4頁
計(jì)算機(jī)行業(yè)2023年中期策略報(bào)告:跨越奇點(diǎn)人工智能全景投資框架_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

創(chuàng)造財(cái)富

擔(dān)當(dāng)責(zé)任股票代碼:601881.SH

06881.HK中國銀河證券股份有限公司CHINAGALAXYSECURITIESCO.,

LTD.【銀河計(jì)算機(jī)】計(jì)算機(jī)行業(yè)2023年中期策略報(bào)告:跨越奇點(diǎn),人工智能全景投資框架2023年7月5日銀河證券計(jì)算機(jī)/科創(chuàng)板團(tuán)隊(duì)吳硯靖

執(zhí)業(yè)證書編號:S0130519070001鄒文倩

執(zhí)業(yè)證書編號:S0130519060003李璐昕

執(zhí)業(yè)證書編碼:S0130521040001研究助理:馮雨淇2核心觀點(diǎn)一、ChatGPT開啟新紀(jì)元,AIGC正在成為引發(fā)生產(chǎn)力變革的引擎,人工智能驅(qū)動(dòng)的第六輪康波已現(xiàn)曙光:自工業(yè)革命爆發(fā)以來,已經(jīng)走過了4輪康波周期(工業(yè)革命-鐵路時(shí)代-電力與重工時(shí)代-石油化工與汽車時(shí)代),目前第五輪康波(信息技術(shù)互聯(lián)網(wǎng)時(shí)代)已走向蕭條,我們認(rèn)為當(dāng)下互聯(lián)網(wǎng)信息技術(shù)趨于衰退的第五輪康波后期,人工智能驅(qū)動(dòng)的第六輪康波已現(xiàn)曙光。二、AI大模型百家爭鳴,應(yīng)用場景百花齊放,人工智能投資機(jī)會(huì)明確。以ChatGPT為代表的AI大模型橫空出世,全球科技巨頭紛紛布局。海外方面,從OpenAI發(fā)布GPT-4,到谷歌的PaLM-E與Bard上線,再到Meta的LLaMA推出;國內(nèi)方面,從百度發(fā)布“文心一言”,到華為“盤古”與阿里“通義”,再到訊飛“星火”及高校大模型問世。AI大模型百家爭鳴,應(yīng)用場景百花齊放,人工智能投資機(jī)會(huì)明確。三、AIGC產(chǎn)業(yè)鏈可大致分為上中下三層架構(gòu),當(dāng)下時(shí)點(diǎn)我們認(rèn)為,算力層估值驅(qū)動(dòng),中間層事件驅(qū)動(dòng),應(yīng)用層業(yè)績驅(qū)動(dòng)。結(jié)合市場流動(dòng)性觀察下半年預(yù)計(jì)人工智能整體預(yù)計(jì)將繼續(xù)走強(qiáng)。1、第一層為基礎(chǔ)層,以預(yù)訓(xùn)練模型為基礎(chǔ)搭建的AIGC技術(shù)基礎(chǔ)設(shè)施層,包括芯片、服務(wù)器等硬件提供商以及大模型技術(shù)提供商;2、第二層為中間層,通過基礎(chǔ)層的模型,進(jìn)行特定訓(xùn)練,形成垂直化、場景化、定制化的應(yīng)用工具;對于中間層來說,技術(shù)積累以及資金實(shí)力都是關(guān)鍵競爭力,因此我們認(rèn)為科技巨頭更具有競爭優(yōu)勢。3、第三層為應(yīng)用層,即面向C端用戶提供圖像、語音、文字生成等各種AIGC的應(yīng)用。應(yīng)用層的投資機(jī)會(huì)來自三個(gè)方面:1、大模型輔以新架構(gòu),推動(dòng)AIGC進(jìn)入殺手級應(yīng)用涌現(xiàn)階段,智能訓(xùn)練的新產(chǎn)品推出,帶來收入提升預(yù)期;2、“降本增效”帶來的利潤提升,從而帶來未來三年業(yè)績提升預(yù)期;3、垂直場景下的高質(zhì)量數(shù)據(jù)要素釋放帶來的價(jià)值重估預(yù)期,結(jié)合下游景氣度判斷以及技術(shù)變革對垂直領(lǐng)域沖擊指數(shù)分析,我們看好AI+金融、AI+醫(yī)療、AI+新能源、AI+政務(wù)(包括媒體類輿情類)、AI+辦公、AI+法律、AI+教育等細(xì)分賽道的優(yōu)質(zhì)公司。四、重點(diǎn)推薦:同花順、嘉和美康、彩訊股份、拓爾思、螢石網(wǎng)絡(luò)、上海鋼聯(lián)、深桑達(dá)A、中科曙光、中科星圖、海康威視、金山辦公、柏楚電子、國能日新、通達(dá)海等公司。五、風(fēng)險(xiǎn)提示:AI技術(shù)落地不及預(yù)期的風(fēng)險(xiǎn);政策推進(jìn)不及預(yù)期的風(fēng)險(xiǎn);行業(yè)競爭加劇的風(fēng)險(xiǎn);供應(yīng)鏈風(fēng)險(xiǎn);法律及隱私保護(hù)等風(fēng)險(xiǎn);產(chǎn)業(yè)發(fā)展進(jìn)度不達(dá)預(yù)期的風(fēng)險(xiǎn)。資料來源:荷蘭經(jīng)濟(jì)學(xué)家雅各布范杜因,中國銀河證券研究院整理創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任一、 跨越奇點(diǎn),人工智能迎來星辰大海1.1第五輪康波走向蕭條,AI帶動(dòng)第六輪康波周期即將開啟資料來源:《濤動(dòng)周期論》,中國銀河證券研究院整理資料來源:荷蘭經(jīng)濟(jì)學(xué)家雅各布范杜因,中國銀河證券研究院整理康波周期(Kondratievwave):作為描述宏觀經(jīng)濟(jì)增長與科技革命間內(nèi)在關(guān)系的重要模型,其在人類歷史上的五次出現(xiàn)均伴隨著標(biāo)志性的技術(shù)奇點(diǎn)及跨越性事件。第五輪康波走向蕭條:過去兩百年歷史進(jìn)步的主要?jiǎng)恿靠萍?生產(chǎn)力突破。自工業(yè)革命爆發(fā)以來,已經(jīng)走過了4輪康波周期(工業(yè)革命-鐵路時(shí)代-電力與重工時(shí)代-石油化工與汽車時(shí)代),目前第五輪康波(信息技術(shù)互聯(lián)網(wǎng)時(shí)代)已走向蕭條。目前普遍認(rèn)為我們正處于第五次康波周期的蕭條階段,該階段的一般特點(diǎn)為經(jīng)濟(jì)缺乏增長動(dòng)力,科技領(lǐng)域等待新的變革性成果出現(xiàn)。得益于加速信息化所帶來的周期縮短,第四輪與第五輪康波出現(xiàn)顯著交叉,我們有理由認(rèn)為當(dāng)下互聯(lián)網(wǎng)信息技術(shù)趨于衰退的第五輪康波后期,以人工智能及新能源技術(shù)為主導(dǎo)的第六輪康波也已然展現(xiàn)曙光。表1:康波周期 圖1:歷史上的五輪康波周期長波與標(biāo)志性技術(shù)繁榮衰退蕭條回升第一波(63年)紡織與蒸汽機(jī)技術(shù)1782-1802(20年)1815-1825(10年)1802-1815(戰(zhàn)爭)1825-1836(11年)1836-1845(9年)第二波(47年)鋼鐵與鐵路技術(shù)1845-1866(21年)1866-1873(7年)1873-1883(10年)1883-1892(9年)第三波(56年)電氣、化工1892-1913(21年)1920-1929(9年)1914-1919(戰(zhàn)爭)1929-1937(8年)1937-1948(11年)第四波(43年)汽車、計(jì)算機(jī)1948-1966(18年)1966-1973(7年)1973-1982(9年)1982-1991(9年)第五波(44年)IT1991-2004(13年)2004-2015(11年)2015至今創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任41.2

全球AI界的“iPhone時(shí)刻",ChatGPT開啟新紀(jì)元奇點(diǎn)臨近,強(qiáng)人工智能時(shí)代即將到來奇點(diǎn)理論的最大擁護(hù)者,前谷歌工程師雷·庫茲韋爾(Ray

Kurzwell)認(rèn)為,人工智能將在2029年通過圖靈測試,表現(xiàn)出與人類相當(dāng)或無法區(qū)分的智能行為,15年后人類將于他們創(chuàng)造的人工智能融合,使人類的智力提高一百萬倍。奇點(diǎn)的到來意味著人類即將進(jìn)入強(qiáng)人工智能時(shí)代,機(jī)器達(dá)到“強(qiáng)人工智能”,智商超過人類,百川智能王小川認(rèn)為這一天會(huì)提早到2033年到來。ChatGPT開啟新紀(jì)元,AIGC正在成為引發(fā)生產(chǎn)力變革的引擎隨著人工智能的技術(shù)發(fā)展帶動(dòng)GPT的更新迭代,ChatGPT在模型、功能調(diào)用能力、文本容量和價(jià)格上都有顯著改善。未來,由ChatGPT開啟的人工智能新紀(jì)元也將持續(xù)向多模態(tài)融合發(fā)展。資料來源:搜狐,YouTube,中國銀河證券研究院資料來源:OpenAI官網(wǎng),中國銀河證券研究院圖2:OpenAI官網(wǎng)-ChatGPT圖3:奇點(diǎn)臨近創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任5創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任61.2

全球AI界的“iPhone時(shí)刻",ChatGPT開啟新紀(jì)元資料來源:CSDN,中國銀河證券研究院ChatGPT底層技術(shù)的提高為產(chǎn)業(yè)發(fā)展儲(chǔ)能,應(yīng)用層面實(shí)現(xiàn)多元進(jìn)展NLP技術(shù)是ChatGPT實(shí)現(xiàn)與人類進(jìn)行智能化交互的關(guān)鍵技術(shù):其原理是使機(jī)器能夠理解和使用自然語言并完成指令?;A(chǔ)階段的NLP只能進(jìn)行簡單的語言處理,但隨著技術(shù)發(fā)展,逐步引入文本分類任務(wù)、深度學(xué)習(xí)算法和實(shí)時(shí)處理算法,使得反饋精度和速度大幅度提升,從而優(yōu)化了用戶的交互體驗(yàn)。RLHF訓(xùn)練提升ChatGPT的“類人性”

:AI訓(xùn)練師在ChatGPT訓(xùn)練模型的過程中進(jìn)行RLHF調(diào)試,并對過程進(jìn)行了多次迭代,使得其優(yōu)于與其類似的大型語言模型。RLHF是通過在預(yù)訓(xùn)練語言模型上建立獎(jiǎng)勵(lì)模型,創(chuàng)建人類偏好的模型并強(qiáng)化。使用RLHF旨在使語言模型近似人類偏好,但為避免模型在違反語法或邏輯一致性的同時(shí)最大化獎(jiǎng)勵(lì),一般會(huì)保留原始模型副本。而根據(jù)OpenAI官方披露的用戶反饋信息:與人類過分對齊可能會(huì)導(dǎo)致模型不敢回答從語料庫中學(xué)到的知識。因此,RLHF技術(shù)在大型語言模型上的應(yīng)用還需后續(xù)改進(jìn)。圖4:RLHF訓(xùn)練模型1.2

全球AI界的“iPhone時(shí)刻",ChatGPT開啟新紀(jì)元產(chǎn)品端,2023年來,以ChatGPT為代表的AI大模型橫空出世,全球科技巨頭紛紛布局。海外方面,從OpenAI發(fā)布GPT-4,到谷歌的PaLM-E與Bard上線,再到Meta的LLaMA推出;國內(nèi)方面,從百度發(fā)布“文心一言”,到華為“盤古”與阿里“通義”,再到訊飛“星火”及高校大模型問世。AI大模型百家爭鳴,AI產(chǎn)業(yè)日新月異,應(yīng)用場景百花齊放,人工智能迎來星辰大海。政策端,各國加強(qiáng)AI規(guī)范與引導(dǎo),探索監(jiān)管與創(chuàng)新平衡。海外方面,美國出臺《負(fù)責(zé)任的人工智能策略》報(bào)告,日本政府發(fā)布《人工智能戰(zhàn)略2022摘要》,歐洲議會(huì)決議通過《歐洲機(jī)器人技術(shù)民事法律規(guī)則》。國內(nèi)方面,中央政治局會(huì)議4月首次提出,重視通用人工智能發(fā)展;5月北上深三地齊發(fā)人工智能相關(guān)支持政策;同時(shí),北京和深圳均強(qiáng)調(diào)人工智能落地應(yīng)用場景、賦能千行百業(yè)。資料來源:中國移動(dòng)研究院,中國銀河證券研究院表2:國內(nèi)主要大模型梳理公司創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任7大模型名稱特色應(yīng)用互聯(lián)網(wǎng)企業(yè)百度文心聊天互動(dòng)、回答問題、文本生成、圖片生成阿里通義聊天互動(dòng)、回答問題、文本生成、翻譯騰訊混元文本生成、文生圖華為盤古文檔搜索、智能ERP財(cái)務(wù)檢測、阿拉伯語京東言犀內(nèi)容生成、人機(jī)對話垂類科技企業(yè)浪潮源1.0回答問題、翻譯和古文商湯日日新文本生成、圖片生成、視頻生成、3D內(nèi)容生成、數(shù)字知乎知海圖AI(CPM-Bee)內(nèi)容聚合、整理,提煉成摘要展現(xiàn)給用戶360360智腦語音交互和文字輸入科大訊飛訊飛星火文本、語義、數(shù)學(xué)、推理、代碼、知識問答科研院校中國科學(xué)院紫東太初以文搜圖、以音生圖清華大學(xué)ChatGLM回答問題、文本生成復(fù)旦大學(xué)MOSS文本生成、文本摘要、翻譯1.3

AIGC多場景應(yīng)用處于爆發(fā)前夜,萬億市場打開資料來源:OpenAI官網(wǎng),中國銀河證券研究院AIGC的語言類應(yīng)用:AIGC技術(shù)已從最初的實(shí)驗(yàn)室產(chǎn)物逐步商業(yè)化,并與其他技術(shù)和領(lǐng)域深度結(jié)合,

從而實(shí)現(xiàn)更加智能化的內(nèi)容生成及創(chuàng)作。對于GPT系列這類語言模型,AIGC可實(shí)現(xiàn)文本生成、文本分類和文本處理等方面。結(jié)合NLP可應(yīng)用于智能客服、售前/售后咨詢、實(shí)時(shí)語言翻譯等領(lǐng)域。圖5:圖:DALL·E2生成的圖片

(Input:Anastronautridingahorseinphotorealistic

style.) 目前,AIGC所覆蓋的領(lǐng)域基本屬于AI軟件與服務(wù)。全球AI軟件的市場規(guī)模預(yù)計(jì)在2025年超過1200億美元,2021年到2025年的CAGR為38.01%。雖然目前AIGC已經(jīng)涉及文字、圖像、代碼、語音、視頻、3D、游戲等多種內(nèi)容生成形式,但每個(gè)領(lǐng)域的技術(shù)成熟度、底層技術(shù)難度均有差距,滲透率有所差別。2021年AI制作比例僅占市場的1%-2%左右,隨著技術(shù)發(fā)展我們預(yù)測:2025年AIGC在網(wǎng)絡(luò)文學(xué)領(lǐng)域、文本分析領(lǐng)域、繪畫及圖片領(lǐng)域、數(shù)字音樂領(lǐng)域技術(shù)將相對成熟,滲透率分別為70%/60%/60%/50%;網(wǎng)絡(luò)視頻領(lǐng)域、游戲領(lǐng)域由于技術(shù)原因滲透率相對較低,分別約為30%/25%。創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任81.4

大模型進(jìn)入戰(zhàn)國時(shí)代,激烈競爭已然到來資料來源:華東政法大學(xué)政治學(xué)研究院,中國銀河證券研究院大模型是用于深度學(xué)習(xí)任務(wù)的模型,其具備較大容量、海量參數(shù)、大算力等特點(diǎn)。大模型由早期的單語言預(yù)訓(xùn)練模型發(fā)展至多語言預(yù)訓(xùn)練模型,再到現(xiàn)階段的多模態(tài)預(yù)訓(xùn)練模型,可實(shí)現(xiàn)處理多任務(wù)的目標(biāo)。目前,類ChatGPT產(chǎn)品和主攻大型語言模型研發(fā)的海外獨(dú)角獸企業(yè)已至少有7家,包括OpenAI、Anthropic、Cohere、Character.AI等,估值從10億到290億美元不等。其中,Anthropic打造的Claude聊天機(jī)器人已成ChatGPT最大的競爭者之一,甚至在一些競賽成績上超過了GPT-4。表3:大模型的發(fā)展歷程單語言預(yù)訓(xùn)練模型多語言預(yù)訓(xùn)練模型多模態(tài)預(yù)訓(xùn)練模型能夠處理自然語言,源于早期的詞嵌入(wordembedding)的工作具備多樣化的基礎(chǔ)語言能力,開始分別處理多種自然語言任務(wù),如機(jī)器翻譯、問答系統(tǒng)、情感分析等以多語言訓(xùn)練模型為核心,進(jìn)行文字、圖片、視頻的同步轉(zhuǎn)化,實(shí)現(xiàn)處理多任務(wù)的目標(biāo)創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任91.4

大模型進(jìn)入戰(zhàn)國時(shí)代,激烈競爭已然到來資料來源:OpenAI官網(wǎng),中國銀河證券研究院ChatGPT的“降本增效”將進(jìn)一步影響市場上現(xiàn)有的生成式AI模型的接入成本2023年6月13日,OpenAI發(fā)布了ChatGPT新推出的功能更新。在Chat

Completions

API中加入了新的功能調(diào)用能力及價(jià)格變動(dòng);以及模型更新,其中GPT-3.5-turbo-16k可提供標(biāo)準(zhǔn)4k版本四倍的文本容量,單個(gè)請求中最長可支持20頁的文本。價(jià)格方面,嵌入模型的價(jià)格降低了75%,最新價(jià)格為每1k

tokens

0.0001美金;GPT-3.5-turbo的tokens輸入成本降低了25%;GPT-3.5-turbo-16k的tokens輸入價(jià)格為每1k

tokens

0.0003美金,輸出價(jià)格為每1k

tokens

0.0004美金。目前,市場上現(xiàn)有的生成式AI模型競爭激烈,OpenAI此舉將大幅提高ChatGPT的競爭力。圖6:ChatGPT功能更新創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任101.5

人工智能產(chǎn)業(yè)鏈全景GPT-220191.5B基于自注意力機(jī)制(Self-Attention

Mechanism)的Transformer模型,引入更大的訓(xùn)練數(shù)據(jù)和模型參數(shù),采用無監(jiān)督的自我學(xué)習(xí)模式,從網(wǎng)絡(luò)上下載40GB的文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,生成了具有極高智能的預(yù)訓(xùn)練語言模型,并能夠完成比較復(fù)雜的文本生成任務(wù),具有顛覆性的影響相比GPT-1具有更高的模型規(guī)模和訓(xùn)練數(shù)據(jù),能夠生成更加準(zhǔn)確、細(xì)致和連貫的語言文本,應(yīng)用于更復(fù)雜的自然語言處理任務(wù),如機(jī)器翻譯和自動(dòng)摘要等GPT-32020175B采用了極深的網(wǎng)絡(luò)結(jié)構(gòu)和更高的模型參數(shù),采用了有監(jiān)督和無監(jiān)督的學(xué)習(xí)方法并結(jié)合自動(dòng)編碼器和Transformer以及其他深度學(xué)習(xí)架構(gòu)來實(shí)現(xiàn)對語言模型的建模和預(yù)測,進(jìn)一步提高了語言生成的質(zhì)量和自然度生成的文本更加自然和流暢,表現(xiàn)出更高的人類水平智能。能夠?qū)崿F(xiàn)更多的自適應(yīng)和控制,支持更多種類的語言任務(wù)ChatGPT2022774B實(shí)現(xiàn)更加智能和實(shí)用的聊天機(jī)器人功能ChatGPT是基于已有的GPT模型基礎(chǔ)之上,通過特定場景的微調(diào)和適用性擴(kuò)展,主要功能是實(shí)現(xiàn)智能問答、文本生成和對話交互等,具有廣泛的應(yīng)用前景GPT-3.5-Turbo2023-GPT-42023約1760BGPT-3.5

Turbo增加或改進(jìn)了訓(xùn)練數(shù)據(jù),遵循GPT-3的預(yù)訓(xùn)練和微調(diào)方法,并

在許多自然語言處理應(yīng)用中實(shí)現(xiàn)更好的優(yōu)化了生成模型的復(fù)雜度和緯度。在相同精度情況下比GPT-3更快地生成結(jié)果,結(jié)果和性能表現(xiàn),擁有更好的自適應(yīng)和交互能力、多模態(tài)處理,以及更強(qiáng)的自然語言理解和推理能力表4:GPT迭代演進(jìn)時(shí)間Tokens核心升級功能GPT-12018117M基于前饋神經(jīng)網(wǎng)絡(luò)(Feed-Forward

Neural

Network)的語言模型,在基于統(tǒng)計(jì)模型的自然語言處理模型的基礎(chǔ)上,采用Transformer

結(jié)構(gòu),增加了位置編碼和殘差連接優(yōu)化,通過預(yù)訓(xùn)練和微調(diào)實(shí)現(xiàn)對語言的理解和生成能夠根據(jù)給定的輸入生成連貫的語言文本,處理語言的上下文和語法結(jié)構(gòu),應(yīng)用于許多自然語言處理任務(wù)創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任11具有更高的精度和性能,支持更復(fù)雜和更真實(shí)的語言任務(wù)和應(yīng)用,擴(kuò)展到多個(gè)領(lǐng)域和多個(gè)模態(tài),更加個(gè)性化和自適應(yīng),可支持更高級別的注意力控制和對話交互因?yàn)樗捎昧朔植际接?xùn)練和推理引擎,并針對不同的場景和用途調(diào)整了模型參數(shù)。GPT-3.5

Turbo改善了GPT-3的固有的缺陷,如一致性、可重復(fù)性和過擬合問題,并通過靈活的架構(gòu)和多任務(wù)學(xué)習(xí)來實(shí)現(xiàn)更好的性能和穩(wěn)定性。GPT-3.5

Turbo能夠處理更多的語義、邏輯和情境推理,同時(shí)可以自適應(yīng)于不同的任務(wù)和領(lǐng)域,并具備更高的靈活性和可擴(kuò)展性采用更大規(guī)模的數(shù)據(jù)和更高效的訓(xùn)練算法來進(jìn)一步優(yōu)化語言生成的性能和質(zhì)量。GPT-4在邏輯推理能力上超越ChatGPT。內(nèi)部評估中,GPT-4對無效內(nèi)容請求做出回應(yīng)的可能性比GPT-3.5低82

,而做出事實(shí)回應(yīng)的可能性比GPT-3.5高40資料來源:OpenAI官網(wǎng),Datayes!,中國銀河證券研究院整理創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任121.5

人工智能產(chǎn)業(yè)鏈全景人工智能產(chǎn)業(yè)鏈全景圖譜資料來源:德勤研究,中國銀河證券研究院整理圖7:產(chǎn)業(yè)鏈圖譜1.6

人工智能未來投資機(jī)會(huì)簡析算力端:數(shù)據(jù)規(guī)模持續(xù)擴(kuò)張,算力供不應(yīng)求。算法模型的復(fù)雜與參數(shù)規(guī)模的增長,推動(dòng)算力需求旺盛。IDC報(bào)告顯示,2020年全球數(shù)據(jù)規(guī)模已超過64ZB;預(yù)計(jì)2025年,全球數(shù)據(jù)總量將增至175ZB,較2010年的全球數(shù)據(jù)總量增加175倍。反觀算力增長,用于AI測試的全球算力需求每3.5個(gè)月就會(huì)翻一倍,遠(yuǎn)超當(dāng)前算力的增長速度。信通院數(shù)據(jù)顯示,2021年全球計(jì)算設(shè)備算力總規(guī)模達(dá)到615EFlops,增速達(dá)44%,預(yù)計(jì)2030年智能算力將達(dá)到52.5ZFlops,平均年增速超80%。IDC數(shù)據(jù)顯示,2021年中國智能算力規(guī)模達(dá)155.2每秒百億億次浮點(diǎn)運(yùn)算(EFLOPS),2022年智能算力規(guī)模將達(dá)到268.0EFLOPS,預(yù)計(jì)到2026年智能算力規(guī)模將進(jìn)入每秒十萬億億次浮點(diǎn)計(jì)算(ZFLOPS)級別,達(dá)到1,271.4EFLOPS。2021-2026年期間,預(yù)計(jì)中國智能算力規(guī)模及增速將超越通用算力,年復(fù)合增長率達(dá)52.3%,同期通用算力規(guī)模年復(fù)合增長率為18.5%。資料來源:IDC,中國銀河證券研究院31.775.0155.2268.0427.0640.7922.81271.402004006008001,0001,2001,4002019 2020 2021 2022202320242025202630.139.647.756.567.980.395.5111.30204060801001202019 2020 2021 20222023202420252026

圖8:2019-2026年中國智能算力規(guī)模及預(yù)測 百億億次浮點(diǎn)運(yùn)算/秒(EFLOPS)創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任13

圖9:2019-2026年中國通用算力規(guī)模及預(yù)測 百億億次浮點(diǎn)運(yùn)算/秒(EFLOPS)資料來源:IDC,中國銀河證券研究院1.6

人工智能未來投資機(jī)會(huì)簡析資料來源:艾瑞咨詢,中國銀河證券研究院算力端:芯片決定算力規(guī)模,市場空間廣闊。人工智能產(chǎn)業(yè)技術(shù)不斷提升,產(chǎn)業(yè)商業(yè)化應(yīng)用加速落地,推動(dòng)全球AI芯片市場高速增長,IDC預(yù)計(jì),到2025年人工智能芯片市場規(guī)模將達(dá)726億美元。搭載率方面,未來18個(gè)月將持續(xù)增高。從GPU主導(dǎo)到ASIC“百家爭鳴”:AI芯片主流架構(gòu)類型包括GPU、FPGA和ASIC。以英偉達(dá)為代表的GPU芯片在我國市占率近90%,多用于圖形圖像處理、復(fù)雜的數(shù)學(xué)計(jì)算等場景,可較好支持高度并行的工作負(fù)載,常用于數(shù)據(jù)中心的模型訓(xùn)練,也可以用于邊緣側(cè)和端側(cè)的推理工作負(fù)載。而ASIC架構(gòu)的AI芯片由于高度定制可通過算法固化實(shí)現(xiàn)極致性能,未來將率先在推理側(cè)展開對GPU的替代,順應(yīng)“先推理后訓(xùn)練”的發(fā)展路徑,逐步實(shí)現(xiàn)國產(chǎn)AI芯片的多點(diǎn)開花。

圖10:AI芯片的產(chǎn)品分類及應(yīng)用場景

圖11:中國AI芯片市場規(guī)模占比 創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任14資料來源:IDC,中國銀河證券研究院1.6

人工智能未來投資機(jī)會(huì)簡析算力端:服務(wù)器廠商率先收益,全球市場規(guī)模高速增長。服務(wù)器是AI算力的主要載體,IDC數(shù)據(jù)顯示,2021年全球人工智能服務(wù)器市場規(guī)模達(dá)156.3億美元,同比增長39.1%。其中,浪潮信息、戴爾、HPE分別以20.9%、13.0%、9.2%的市占率位列前三,三家廠商總市場份額占比達(dá)43.1%。未來五年,人工智能服務(wù)器市場將繼續(xù)高速增長,預(yù)計(jì)2026年全球人工智能服務(wù)器市場規(guī)模將達(dá)到347.1億美元,五年復(fù)合增長率為17.3%。中國市場領(lǐng)跑全球,服務(wù)器利用率逐步提升:國內(nèi)人工智能應(yīng)用的加速落地大幅推動(dòng)了服務(wù)器高速增長。IDC數(shù)據(jù)顯示,2021年中國人工智能服務(wù)器市場規(guī)模達(dá)到59.2億美元,與2020年相比增長68.2%,預(yù)計(jì)超過80%的中國企業(yè)將在未來一年持續(xù)增加人工智能服務(wù)器的投資規(guī)模,至2026年,中國人工智能服務(wù)器市場規(guī)模將達(dá)到123.4億美元。伴隨企業(yè)AI應(yīng)用成熟度的提升,未來將更多地使用人工智能服務(wù)器處理推理工作負(fù)載,據(jù)IDC數(shù)據(jù),2021年中國數(shù)據(jù)中心用于推理的服務(wù)器的市場份額占比達(dá)57.6%,預(yù)計(jì)到2026年,用于推理的工作負(fù)載將達(dá)到62.2%。資料來源:IDC,中國銀河證券研究院

圖12:AI服務(wù)器市場規(guī)模 51.5%57.6%58.5%59.5%60.7%61.8%62.2%0%10%20%30%40%50%60%70%80%90%100%202020212022202320242025202676.8699112.37156.314.7623.335.259.2123.405010015020025030035040020182019202020212026E全球AI服務(wù)器市場規(guī)模(億美元)中國AI服務(wù)器市場規(guī)模(億美元)347.1

圖13:2020-2026年AI服務(wù)器工作負(fù)載預(yù)測 訓(xùn)練 推理創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任15資料來源:IDC,中國銀河證券研究院創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任161.6

人工智能未來投資機(jī)會(huì)簡析算法端:大模型加速落地,助力實(shí)體經(jīng)濟(jì)發(fā)展。大模型的泛化能力強(qiáng)、長尾數(shù)據(jù)低依賴性以及下游模型使用效率的提升,使其被認(rèn)為具備了“通用智能”的雛形,并成為業(yè)內(nèi)探索實(shí)現(xiàn)普惠人工智能的重要途徑之一。大模型的技術(shù)基礎(chǔ)是transformer架構(gòu)、遷移學(xué)習(xí)和自監(jiān)督學(xué)習(xí),transformer架構(gòu)應(yīng)用于NLP領(lǐng)域并取得了突破性進(jìn)展,其在視覺任務(wù)上也同樣證明了有效性。2022年,大模型正在成為AIGC領(lǐng)域發(fā)展的算法引擎。在大模型的能力加持下,包括以文生圖以及虛擬數(shù)字人等AIGC類應(yīng)用將快速進(jìn)入到商業(yè)化階段,并為元宇宙內(nèi)容生產(chǎn)帶來巨大的變革。大模型正在讓人工智能技術(shù)從五年前的“能聽會(huì)看”,走到今天的“能思考、會(huì)創(chuàng)作”,未來有望實(shí)現(xiàn)“會(huì)推理、能決策”的重大進(jìn)步。大模型升級迭代,數(shù)據(jù)市場規(guī)模有望增長:公開數(shù)據(jù)顯示,ChatGPT的模型參數(shù)經(jīng)達(dá)1750億,用于預(yù)訓(xùn)練的數(shù)據(jù)量達(dá)45TB,隨著算法模型的迭代升級,模型參數(shù)和數(shù)據(jù)量也將繼續(xù)增長。同時(shí),數(shù)據(jù)質(zhì)量決定了模型訓(xùn)練的效果,因此數(shù)據(jù)標(biāo)注成為大部分Al算法有效運(yùn)行的關(guān)鍵。自動(dòng)化數(shù)據(jù)標(biāo)注能夠通過DL和CV等技術(shù),減少人工標(biāo)注需求,提高數(shù)據(jù)標(biāo)注的效率和準(zhǔn)確性,進(jìn)一步擴(kuò)大基礎(chǔ)層數(shù)據(jù)市場規(guī)模。艾瑞咨詢數(shù)據(jù)顯示,我國AI基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模預(yù)計(jì)將從2022年的31億元增長至2027年的79億元,CAGR達(dá)20.6%。此外,受數(shù)據(jù)平臺服務(wù)、數(shù)據(jù)治理服務(wù)和AI應(yīng)用建設(shè)的需求推動(dòng)影響,面向人工智能的數(shù)據(jù)治理市場規(guī)模將持續(xù)上升,預(yù)計(jì)規(guī)模將從2022年的45億元增長至2027年的121億元,CAGR達(dá)21.7%。

圖14:2020-2027年中國AI基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模 292731374656677990807060504030201002020 2021 2022 2023E 2024E 2025E 2026E 2027EAI基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模(億元)29354556718610212189106133162198232265302050100150200250300350202020212022 2023E 2024E 2025E 2026E 2027E資料來源:艾瑞咨詢,中國銀河證券研究院圖15:2020-2027年中國數(shù)據(jù)治理與面向AI數(shù)據(jù)治理市場規(guī)模面向人工智能的數(shù)據(jù)治理市場規(guī)模(億元)

數(shù)據(jù)治理市場規(guī)模(億元)創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任171.6

人工智能未來投資機(jī)會(huì)簡析應(yīng)用端:核心產(chǎn)業(yè)不斷擴(kuò)張,應(yīng)用場景縱深發(fā)展。據(jù)工信部數(shù)據(jù)顯示,中國人工智能核心產(chǎn)業(yè)規(guī)模目前超4,000億元,企業(yè)數(shù)量超3,000家,領(lǐng)軍企業(yè)覆蓋無人機(jī)、語音識別、圖像識別、智能機(jī)器人、智能汽車、可穿戴設(shè)備、虛擬現(xiàn)實(shí)等諸多領(lǐng)域,已經(jīng)在智能芯片、開源框架等關(guān)鍵核心技術(shù)取得重要突破。據(jù)美國斯坦福大學(xué)《2021年人工智能(AI)指數(shù)報(bào)告》顯示,2021年中國人工智能專利申請數(shù)占全球一半以上,發(fā)表的人工智能期刊論文占全球三分之一。根據(jù)2022年IDC針對企業(yè)對于人工智能技術(shù)的應(yīng)用現(xiàn)狀調(diào)研的結(jié)果來看,計(jì)算機(jī)視覺目前仍為最主要的應(yīng)用技術(shù)類型,圖像識別、生物識別、語音技術(shù)是目前較為廣泛采用的技術(shù),未來三年,AR與VR、視頻分析、知識圖譜和自然語言處理將成為主要發(fā)力點(diǎn)。資料來源:IDC,中國銀河證券研究院圖16:2022年企業(yè)人工智能技術(shù)應(yīng)用現(xiàn)狀創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任181.6

人工智能未來投資機(jī)會(huì)簡析資料來源:IDC,中國銀河證券研究院應(yīng)用端:人工智能賦能千行百業(yè),多領(lǐng)域融合成為可能。人工智能生成文本、代碼、圖像、視頻等內(nèi)容的能力持續(xù)提升,使其不僅在金融、醫(yī)療、政務(wù)、教育、法律等成熟領(lǐng)域應(yīng)用,而且在物流、制造、能源、公共事業(yè)和農(nóng)業(yè)等方面得到快速發(fā)展,創(chuàng)新應(yīng)用場景逐步增多。未來五年,隨著人機(jī)交互、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、語音識別技術(shù)達(dá)到更為成熟階段,人工智能將從單點(diǎn)技術(shù)應(yīng)用邁向多種人工智能能力融合、從事后分析邁向事前預(yù)判和主動(dòng)執(zhí)行、從計(jì)算智能和感知智能邁向認(rèn)知智能和決策智能。

圖17:2022年中國人工智能應(yīng)用場景 創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任19資料來源:IMARC

Services,華經(jīng)產(chǎn)業(yè)研究院,中國產(chǎn)業(yè)研究院,艾媒咨詢,國音數(shù)協(xié)游戲工委,中國銀河證券研究院整理圖22:網(wǎng)絡(luò)視頻領(lǐng)域的市場規(guī)模(單位:億元)圖23:游戲領(lǐng)域的市場規(guī)模(單位:億元)圖21:數(shù)字音樂領(lǐng)域的市場規(guī)模(單位:億元)AIGC未來市場空間預(yù)測:預(yù)計(jì)2025年中國AIGC市場規(guī)模有望達(dá)到1600億圖18:文本分析領(lǐng)域的市場規(guī)模(單位:億元) 圖19:網(wǎng)絡(luò)文學(xué)領(lǐng)域的市場規(guī)模(單位:億元)圖20:繪畫及圖片領(lǐng)域的市場規(guī)模(單位:億元)1.6

人工智能未來投資機(jī)會(huì)簡析創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任二、人工智能帶動(dòng)從算力到應(yīng)用的全產(chǎn)業(yè)鏈需求釋放AI大模型對算力的需求高于摩爾定律迭代速度,服務(wù)器需求量將提升。根據(jù)OpenAI測算,自2012年來,頭部AI模型訓(xùn)練算力每3-4個(gè)月翻一番,訓(xùn)練算力增長幅度高達(dá)10倍。而摩爾定律放緩成為不爭的事實(shí),但數(shù)據(jù)量卻在持續(xù)增加,算力增速已出現(xiàn)明顯滯后,AI服務(wù)器作為AI算力載體,需求逐步釋放。2.1

算力端:AIGC發(fā)展帶動(dòng)AI服務(wù)器需求釋放圖24:近10年來全球算力的增長明顯滯后于數(shù)據(jù)的增長創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任21資料來源:IDC,EMC,中國銀河證券研究院模型發(fā)布時(shí)間參數(shù)量預(yù)訓(xùn)練數(shù)據(jù)量預(yù)估成本消耗資源GPT-12018年6月1.17億約5GB在8個(gè)GPU上訓(xùn)練一個(gè)月GPT-22019年2月15億40GB在256個(gè)Google

Cloudv3上訓(xùn)練一周GPT-32020年5月1750億45TB訓(xùn)練一次約460萬美元,總成本1200萬美元在355個(gè)GPU上訓(xùn)練一年ChatGPT2022年12月數(shù)十GB訓(xùn)練一次成本高達(dá)一千萬美元根據(jù)參數(shù)量而定表5:GPT模型訓(xùn)練對算力需求不斷增加資料來源:微軟,OpenAI,中國銀河證券研究院根據(jù)IDC與浪潮信息數(shù)據(jù)顯示,2021年中國智能算力規(guī)模達(dá)155.2每秒百億億次浮點(diǎn)運(yùn)算(EFLOPS),2022年智能算力規(guī)模將達(dá)到268.0EFLOPS,預(yù)計(jì)到2026年智能算力規(guī)模將進(jìn)入每秒十萬億億次浮點(diǎn)計(jì)算(ZFLOPS)級別,達(dá)到1,271.4

EFLOPS。2.1

算力端:AIGC發(fā)展帶動(dòng)AI服務(wù)器需求釋放圖25:中國AI智能算力規(guī)模及預(yù)測31.7075.00155.20268.00640.00922.001,271.4013710773427.050950443802040608010012014016002004006008001,0001,2001,400201920202021 2022 2023 2024 2025資料來源:IDC,浪潮信息,中國銀河證券研究院2026中國智能算力規(guī)模及預(yù)測(EFLOPS)YoY(

)創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任22AI服務(wù)器市場將維持高增,中國市場領(lǐng)跑全球。根據(jù)Statistics數(shù)據(jù)顯示,2022年全球服務(wù)器市場規(guī)模為849億美元,同比增長2%,預(yù)計(jì)2023年增長7%至908億美元。根據(jù)中商產(chǎn)業(yè)研究所數(shù)據(jù)顯示,2022年中國服務(wù)器市場規(guī)模為273億美元,同比增長9%,增速有所放緩,預(yù)計(jì)2023年市場規(guī)模將達(dá)到308億美元,增速為13%。2.1

算力端:AIGC發(fā)展帶動(dòng)AI服務(wù)器需求釋放圖26:全球服務(wù)器市場規(guī)模及增速預(yù)測資料來源:Statistics,中國銀河證券研究院圖27:中國服務(wù)器市場規(guī)模及增速預(yù)測資料來源:中商產(chǎn)業(yè)研究所,中國銀河證券研究院779.6777.5831.7848.7072907.87876543210-170075080085090095020192020202120222023E全球服務(wù)器市場規(guī)模(億美元)YoY(

)182216.49273.430819250.9169132018161412108642005010015020025030035020192020202120222023E中國服務(wù)器市場規(guī)模(億美元)YoY(

)創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任23AI服務(wù)器市場將維持高增,中國市場領(lǐng)跑全球。根據(jù)《2022-2023中國人工智能計(jì)算力發(fā)展評估報(bào)告》數(shù)據(jù)顯示,預(yù)計(jì)全球AI服務(wù)器市場將在2026年達(dá)到347.1億美元,5年CAGR達(dá)到17.3%;中國AI服務(wù)器市場2021年達(dá)到59.2億美元,同比增長68.2%,預(yù)計(jì)在2026年將達(dá)到123.4億美元,5年CAGR為15.82%。2.1

算力端:AIGC發(fā)展帶動(dòng)AI服務(wù)器需求釋放圖28:全球AI服務(wù)器市場規(guī)模及增速預(yù)測資料來源:IDC,浪潮信息,中國銀河證券研究院圖29:中國AI服務(wù)器市場規(guī)模及增速預(yù)測76.8699112.37156.3347.129143945403530252015105035030025020015010050040020182019202020212026E全球AI服務(wù)器市場規(guī)模(億美元)YoY(

)14.7623.335.259.258516801020304050600206040801001401202018 2019 2020 2021 2026E中國AI服務(wù)器市場規(guī)模(億美元)YoY(

)80123.470創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任24資料來源:IDC,浪潮信息,中國銀河證券研究院2.1.1算力端:服務(wù)器上游指標(biāo)向好,受益于國內(nèi)各廠商大力發(fā)展AIGC技術(shù),資本開支有望提升資料來源:wind,中國銀河證券研究院23.2 3.48.3676061441335229.3

29.819.32121506.158 42.844114.22040160140120100806040160140120100806040200英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)收入(億美元)YoY(

)150.1創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任25系列型號發(fā)布時(shí)間CUDA核心數(shù)量內(nèi)存線寬工藝(nm)單精度FP32最大功耗(W)TeslaM20902011年5126GB

GDDR5384401332

GFLOPS250TeslaK402013年288012GB

GDDR5384285.046

TFLOPS245TeslaM402015年307212GB

GDDR5384286.832

TFLOPS250TeslaP1002016年358412GB/16GB

HBM24096169.526

TFLOPS250TeslaV1002017年512016GB/32GB

HBM240961214.13

TFLOPS300A100A1002020年691240GB/80GB

HBM2e5120719.49

TFLOPS250A2A22021年128016GB

GDDR612884.531

TFLOPS60L40L402022年

1817648GB

GDDR6384590.52

TFLOPS300H100H1002022年

1459280GB

HBM2e5120451.22

TFLOPS350上游前瞻指標(biāo)優(yōu)化,AI算力芯片性能持續(xù)提升,行業(yè)景氣度持續(xù)上行。AI服務(wù)器主要依靠主流AI芯片GPU提供加速計(jì)算支持,根據(jù)Jon

Peddie

Research等多方數(shù)據(jù)顯示,2022年Q3,英偉達(dá)在全球GPU市場市占率約88

,因此,英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)收入是GPU景氣度的核心指標(biāo)。英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)2023Q1業(yè)績與2023Q2指引超預(yù)期。英偉達(dá)季度營收創(chuàng)歷史新高,數(shù)據(jù)中心業(yè)務(wù)2023年Q1實(shí)現(xiàn)營收42.8億美元,同比上漲14

,高于此前指引與一致預(yù)期。公司展望二季度收入為110億美元,正負(fù)浮動(dòng)2

,主要得益于生成式AI發(fā)展加速,帶動(dòng)全球算力需求高漲。表6:英偉達(dá)GPU盤點(diǎn) 圖30:英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)收入維持高增資料來源:英偉達(dá),中國銀河證券研究院IDC數(shù)據(jù)顯示,2021年,全球AI服務(wù)器市場規(guī)模中,浪潮信息市占率為20.9%,同比提升3.6%,銷售額同比增長68.3%,繼續(xù)保持全球市場第一;此外,聯(lián)想、華為與新華三均位列前七;在中國市場,浪潮服務(wù)器市占率達(dá)到52.4%,連續(xù)5年保持中國AI服務(wù)器市場份額超50%。2.1.2

算力端:國內(nèi)AI服務(wù)器具備領(lǐng)先優(yōu)勢 圖31:全球AI服務(wù)器市場競爭格局資料來源:IDC,中國銀河證券研究院13.809.804.80

6.1020.2032.60IBM浪潮信息

戴爾新華三

思科HPEOracle聯(lián)想富士通華為其他52.407.907.807.70圖32:中國AI服務(wù)器市場競爭格局浪潮信息

寧暢

新華三

華為

安擎

寶德

其他創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任26資料來源:IDC,中國銀河證券研究院創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任27圖33:國內(nèi)外基礎(chǔ)AI算法時(shí)間軸2.2.1

算法端:基礎(chǔ)算法的積累 基礎(chǔ)算法:AI大模型的基石,技術(shù)積累從基礎(chǔ)開始。主流的AI人工智能常用基礎(chǔ)算法中,大多來自于國外團(tuán)隊(duì),國內(nèi)相似算法出現(xiàn)時(shí)間通常要晚數(shù)年左右。算法到模型的積累是一種長期過程,每一次升級迭代都依賴于模型背后強(qiáng)大的的數(shù)學(xué)功底和抽象能力。國內(nèi)在基礎(chǔ)算法方面起步較晚,雖然目前加速追趕進(jìn)程,但與國外仍有一定差距。資料來源:知乎,中國銀河證券研究院整理創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任282.2.2

算法端:

NLP以Transformer為基,各廠百花齊放 Google推出的Transformer成為NLP模型技術(shù)突破關(guān)鍵。當(dāng)前NLP主流預(yù)訓(xùn)練模型有GPT、T5、BERT,這些模型均是由Transformer為基礎(chǔ),在其之上進(jìn)行改進(jìn)延申得到的。GPT-1直至GPT-4都是GPT-style最好的例子,除此之外,Google在2021年發(fā)布的LaMDA和2023年發(fā)布的PaLM也都是基于GPT-style的語言大模型。T5-style的大模型有如Facebook的BART,Google的BigBird等。知名的BERT-style大模型有Facebook的RoBERTa和Google的ELECTRA等。資料來源:OpenAI官網(wǎng),知乎,中國銀河證券研究院整理圖34:NLP模型發(fā)展史創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任292.2.2

算法端:

NLP以Transformer為基,各廠百花齊放 資料來源:CSDN,中國銀河證券研究院整理TransformerT5-styleTransformer

本質(zhì)上是一個(gè)Encoder-Decoder

架構(gòu),分為編碼組件和解碼組件。它的核心之一是Self-Attention,能夠通過關(guān)系的特征進(jìn)行學(xué)習(xí)表達(dá)相關(guān)性。同時(shí),它對序列數(shù)據(jù)的并行處理能力遠(yuǎn)超LSTM。GPT-styleGPT模型通過在大規(guī)模語料庫上進(jìn)行訓(xùn)練,能夠?qū)W習(xí)自然語言的模式和規(guī)律,從而實(shí)現(xiàn)更好的語言理解。GPT-1直至GPT-4都是GPT-style最好的例子,除此之外,Google的LaMDA和PaLM也都是基于GPT-style的語言大模型。BERT-styleBERT適用于語音識別(ASR)、文本到語音(TTS)以及序列到序列的任何任務(wù)。它采用TransformerDecoder進(jìn)行語言理解,并使用與之配套的掩碼訓(xùn)練方法。雖不具有文本生成能力,但BERT的語義信息提取能力更強(qiáng)。T5模型以原始Transformer架構(gòu)為底座,僅修改了一些關(guān)鍵點(diǎn)。它通過為所有輸入添加前綴得到廣泛的NLP統(tǒng)一任務(wù)格式,方便地評估在閱讀理解、摘要生成、文本分類等一系列NLP任務(wù)上,不同的模型結(jié)構(gòu),預(yù)訓(xùn)練目標(biāo)函數(shù),無標(biāo)簽數(shù)據(jù)集等的影響。創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任302.2.3

算法端:生成式AI模型發(fā)展歷程 資料來源:天津市人工智能學(xué)會(huì)、至頂科技、至頂智庫,中國銀河證券研究院整理BERT2023201820192021201720202022TransformerGPT-1GPT-2ERNIE

1.0ERNIE

2.0GPT-3ERNIE

3.0ERNIE3.0Titan封神榜大模型悟道2.0紫東太初1.0ChatGPTERNIE3.0

ZeusERNIE-ViLG

2.0混元AI大模型GLM-130BPaLMGPT-4PaLM-ELLaMA文心一言通義大模型盤古大模型紫東太初2.0創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任312.2.4

算法端:GPT系發(fā)展 2018年以來,OpenAI的研究團(tuán)隊(duì)發(fā)布了包括GPT-1到GPT-4,以及InstructGPT和ChatGPT這些GPT(GenerativePre-Training)類模型。

GPT系均是基于Transformer架構(gòu)的預(yù)訓(xùn)練語言模型,通過在大規(guī)模語料庫上進(jìn)行訓(xùn)練,能夠?qū)W習(xí)自然語言的模式和規(guī)律,從而實(shí)現(xiàn)更好的語言理解。資料來源:OpenAI官網(wǎng),知乎,中國銀河證券研究院整理GPT-1具有多層模型、生成式預(yù)訓(xùn)練技術(shù)和獨(dú)特的解碼技術(shù)等特點(diǎn)。預(yù)訓(xùn)練分為兩個(gè)階段:預(yù)訓(xùn)練和微調(diào)。GPT-2GPT-2模型使用了更大的模型規(guī)模和更多的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,增加了許多新的預(yù)訓(xùn)練任務(wù),聚焦無監(jiān)督,zero-shot。GPT-3GPT-3的模型與架構(gòu)和前一代GPT-2類似,舍棄zero-shot,采用few-shot,在模型規(guī)模、預(yù)訓(xùn)練數(shù)據(jù)量和使用的預(yù)訓(xùn)練任務(wù)上都有所增加。InstructGPT使用RLHF對大語言模型進(jìn)行微調(diào)。GPT-4具有多模態(tài)能力,基于ChatGPT建立了一個(gè)可預(yù)測擴(kuò)展的深度學(xué)習(xí)棧。當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),GPT-4的性能優(yōu)勢才能被大大體現(xiàn)。ChatGPT同樣使用RLHF,主要針對對話任務(wù)進(jìn)行了優(yōu)化。圖35:GPT-1模型構(gòu)造圖圖36:GPT-3構(gòu)造圖圖37:InstructGPT模型構(gòu)造圖創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任32資料來源:LaMDA官網(wǎng),知乎,中國銀河證券研究院整理算法端:大模型時(shí)代,參數(shù)量指數(shù)上升

大模型的充分非必要條件:大參數(shù)。根據(jù)研究表明,當(dāng)參數(shù)量超過某個(gè)閾值時(shí),模型精度暴增。但超過閾值后存在邊際效應(yīng)遞減,即隨著參數(shù)量增加,模型的性能提升增速降低。未來的模型提升還需要從底層模型和架構(gòu)著手。相較于國外大廠,我國國內(nèi)大廠的大模型平均參數(shù)水平經(jīng)過加速追趕已初見成效,成指數(shù)級上升。如華為的盤古大模型,參數(shù)量高達(dá)2600億;阿里公開官宣的通義大模型數(shù)據(jù)顯示,其參數(shù)量可以到達(dá)十萬億的級別;京東、騰訊的言犀大模型和混元大模型也能達(dá)到千億的參數(shù)量級別。圖38:五大模型精度隨參數(shù)量變化圖 表7:國內(nèi)外大模型參數(shù)量比較創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任332.2.6

算法端:

CV任務(wù)已邁向擴(kuò)散模型生成階段 資料來源:CSDN,中國銀河證券研究院整理

近年來,圖像生成技術(shù)也取得了很多關(guān)鍵性突破,從經(jīng)典的GAN技術(shù)到目前主流的擴(kuò)散模型,以及在此基礎(chǔ)上不斷迭代出性能更強(qiáng)、生成效果更好的算法和模型,極大拓展了圖像生成技術(shù)的應(yīng)用領(lǐng)域和發(fā)展前景。圖像生成的技術(shù)發(fā)展大致經(jīng)歷了三個(gè)關(guān)鍵階段:GAN生成階段、自回歸生成階段、擴(kuò)散模型生成階段。擴(kuò)散模型:通過定義一個(gè)擴(kuò)散步驟的馬爾可夫鏈,通過連續(xù)向數(shù)據(jù)添加隨機(jī)噪聲,直到得到一個(gè)純高斯噪聲數(shù)據(jù),然后再學(xué)習(xí)逆擴(kuò)散的過程,經(jīng)過反向降噪推斷來生成圖像。圖像寫實(shí)性優(yōu)異。CLIP:基于對比學(xué)習(xí)的文本-圖像跨模態(tài)預(yù)訓(xùn)練模型。與CV模型結(jié)合使文本描述和圖像風(fēng)格的把握更加準(zhǔn)確,提升多樣性。圖39:生成模型基本架構(gòu)GAN通過對抗訓(xùn)練提升生成能力和鑒別能力穩(wěn)定性較差基于Transformer結(jié)構(gòu):穩(wěn)定性和合理性提升推理速度較慢擴(kuò)散模型主流CV模型穩(wěn)定性、準(zhǔn)確性、多樣性結(jié)合CLIP達(dá)成多模態(tài)CV任務(wù)自回歸創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任34Midjourney Midjourney基于擴(kuò)散模型精調(diào)后的圖像生成模型,部署在Discord,擅長藝術(shù)風(fēng)格的圖像表達(dá)。DALL-E2基于CLIP和擴(kuò)散模型框架的文生圖模型,生成圖像能夠保持較好的語義一致性。DALL-E2文心

ERNIE-VILG2.0基于擴(kuò)散模型框架的多模態(tài)生成模型,提出混合專家模型,自動(dòng)選擇最優(yōu)生成網(wǎng)絡(luò)。Imagen基于擴(kuò)散模型和超分辨率模型搭建,生成圖像的真實(shí)感較強(qiáng)。太乙Taiyi首個(gè)開源的中文Stable

Diffusion模型,擅長中文描述的圖像生成。太乙TaiyiStable

Diffusion基于潛在擴(kuò)散模型框架,能夠降低算力要求和部署門檻,專門用于文生圖任務(wù),目前已成為多數(shù)圖像生成模型的基礎(chǔ)框架。2.2.7

算法端:國內(nèi)外圖像生成代表模型 隨著圖像生成技術(shù)的發(fā)展,國內(nèi)外AI廠商基于擴(kuò)散模型推出多個(gè)代表模型。然而目前圖像生成內(nèi)容仍然存在較大的不確定性。模型的穩(wěn)定可控能力是影響未來發(fā)展的核心要素,對于對圖像本身可控性要求極高的領(lǐng)域來說,生成圖像是否與預(yù)期目標(biāo)相符,以及對圖像精度的精準(zhǔn)控制十分關(guān)鍵。資料來源:各公司官網(wǎng),中國銀河證券研究院整理創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任35資料來源:360官網(wǎng),百度官網(wǎng),阿里巴巴官網(wǎng),中國銀河證券研究院整理算法端:多模態(tài)階段實(shí)現(xiàn)彎道超車隨著參數(shù)等瓶頸的到來,國內(nèi)外多家大廠預(yù)計(jì)多模態(tài)模型將會(huì)成為未來的發(fā)展趨勢。這種模型可以很好的融合NLP和CV,同時(shí)處理文字、圖像、視頻、音頻等,是下一階段各AI廠商競爭的關(guān)鍵。國內(nèi)大模型的迭代速度已經(jīng)基本趕上或接近國際先進(jìn)水平,未來的多模態(tài)能力發(fā)展是我國實(shí)現(xiàn)彎道超車的機(jī)會(huì)。文心大模型是百度的核心技術(shù)之一,該模型具備跨模態(tài)、跨語言的深度語義理解與生成能力。文心一言被外界譽(yù)為“中國版ChatGPT”;阿里巴巴的通義大模型通過技術(shù)優(yōu)勢實(shí)現(xiàn)了參數(shù)規(guī)模的量級提升。其多模態(tài)大模型

M6

參數(shù)規(guī)模已經(jīng)突破

10

萬億,規(guī)模遠(yuǎn)超谷歌、微軟,成為全球最大的

AI

預(yù)訓(xùn)練模型;騰訊的混元

AI

大模型完整覆蓋

NLP、CV、多模態(tài)等基礎(chǔ)模型和眾多行業(yè)/領(lǐng)域模型。在2022年登頂自然語言理解任務(wù)榜單

CLUE。圖40:文心大模型框架圖 圖41:通義大模型框架圖362.3數(shù)據(jù)端:高質(zhì)量數(shù)據(jù)是AI大模型訓(xùn)練的必要要素294052647992105891211541862212562941005001502002503003502020 2021E 2022E 2023E2024E2025E2026E面向AI的數(shù)據(jù)治理規(guī)模(億元)數(shù)據(jù)治理規(guī)模(億元)32141755368684410151215145630332423202005101520

20253035600400200014001200100080016002019 20202021E2022E2023E2024E2025E

2026E大數(shù)據(jù)智能市場規(guī)模(億元) YoY(

)創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

資料來源:艾瑞咨詢,中國銀河證券研究院高質(zhì)量與大規(guī)模的數(shù)據(jù)集是AI大模型的突破的關(guān)鍵點(diǎn)。目前國內(nèi)數(shù)據(jù)資源豐富,從總量來說具備優(yōu)勢,但由于數(shù)據(jù)挖掘不足,數(shù)據(jù)無法自由在市場上流通,數(shù)據(jù)的清洗與標(biāo)注產(chǎn)業(yè)鏈不夠完善等現(xiàn)狀,優(yōu)質(zhì)數(shù)據(jù)集仍然稀缺。高質(zhì)量數(shù)據(jù)集離不開數(shù)據(jù)的治理,AI數(shù)據(jù)治理市場空間廣闊。根據(jù)艾瑞數(shù)據(jù)顯示,2021年,中國面向人工智能的數(shù)據(jù)治理規(guī)模約為40億元,2026年規(guī)模突破百億達(dá)105億元,五年CAGR達(dá)到21.3

;中國的數(shù)據(jù)治理市場規(guī)模約為121億元,預(yù)計(jì)2026年市場規(guī)模達(dá)到294億元,五年CAGR為19.5

。圖42.2019年-2026年我國AI大數(shù)據(jù)市場規(guī)模及增速 圖43.

2020年-2026年我國數(shù)據(jù)治理與AI數(shù)據(jù)治理市場規(guī)模資料來源:艾瑞咨詢,中國銀河證券研究院372.3

數(shù)據(jù)端:高質(zhì)量數(shù)據(jù)是AI大模型訓(xùn)練的必要要素?cái)?shù)據(jù)治理離不開高質(zhì)量的數(shù)據(jù)采集與標(biāo)注。從AI的數(shù)據(jù)治理產(chǎn)業(yè)鏈圖譜來看,上游主要為數(shù)據(jù)的提供方,下游主要為數(shù)據(jù)的最終應(yīng)用方。應(yīng)用于AI模型的訓(xùn)練與推理的數(shù)據(jù)主要由中游基礎(chǔ)數(shù)據(jù)服務(wù)商進(jìn)行采集與標(biāo)注,數(shù)據(jù)治理平臺進(jìn)行數(shù)據(jù)的優(yōu)化治理。圖44.面向AI的數(shù)據(jù)治理產(chǎn)業(yè)圖譜創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

資料來源:艾瑞咨詢,中國銀河證券研究院人工智能數(shù)據(jù)安全問題數(shù)據(jù)投毒數(shù)據(jù)泄露數(shù)據(jù)異常指人工智能訓(xùn)練數(shù)據(jù)被污染所導(dǎo)致的人工智能決策錯(cuò)誤,如在訓(xùn)練數(shù)據(jù)中加入偽裝數(shù)據(jù)、惡意樣本等,則會(huì)破壞數(shù)據(jù)的完整性,導(dǎo)致算法模型決策出現(xiàn)偏差。創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任38人工智能技術(shù)的發(fā)展讓智能設(shè)備對個(gè)人的信息采集更加全面,這些信息具有很強(qiáng)的個(gè)人屬性,若泄露被非法使用,則會(huì)產(chǎn)生嚴(yán)重的后果。運(yùn)行時(shí)如果數(shù)據(jù)異常會(huì)導(dǎo)致智能系統(tǒng)運(yùn)行錯(cuò)誤,從而無法正常輸出決策指令。2.3

數(shù)據(jù)端:高質(zhì)量數(shù)據(jù)是AI大模型訓(xùn)練的必要要素此外,人工智能數(shù)據(jù)的安全也不可忽視,人工智能帶來的數(shù)據(jù)內(nèi)容安全問題主要有三類:數(shù)據(jù)投毒、數(shù)據(jù)泄露和數(shù)據(jù)異常。2.3.1

數(shù)據(jù)端:數(shù)據(jù)要素是新型生產(chǎn)要素?cái)?shù)據(jù)將成為數(shù)字經(jīng)濟(jì)時(shí)代第一生產(chǎn)要素。2019年10月,黨的十九屆四中全會(huì)《決定》明確指出:“健全勞動(dòng)、資本、土地、知識、技術(shù)、管理、數(shù)據(jù)等生產(chǎn)要素由市場評價(jià)貢獻(xiàn)、按貢獻(xiàn)決定報(bào)酬的機(jī)制”,首次將數(shù)據(jù)增列為生產(chǎn)要素之一。作為新型生產(chǎn)要素,數(shù)據(jù)同時(shí)具備生產(chǎn)要素的雙重屬性,既能在生產(chǎn)過程中融合其他行業(yè)提升生產(chǎn)效率,本身也能產(chǎn)生價(jià)值和使用價(jià)值,在經(jīng)濟(jì)的新發(fā)展階段貢獻(xiàn)日益提高。因此,逐步建立數(shù)據(jù)要素相關(guān)市場機(jī)制,使之參與市場化配置的問題亟待解決。圖45.

數(shù)據(jù)在新型生產(chǎn)力與生產(chǎn)關(guān)系中的作用資料來源:CIC國家工信安全中心,中國銀河證券研究院整理創(chuàng)

財(cái)

/

擔(dān)

當(dāng)

責(zé)

任39資料來源:國家工信安全中心,中國銀河證券研究院整理圖47:數(shù)據(jù)要素特點(diǎn)數(shù)據(jù)數(shù)據(jù)資源數(shù)據(jù)要素?cái)?shù)據(jù)資產(chǎn)數(shù)據(jù)要素市場權(quán)屬明晰生產(chǎn)必需有力調(diào)配市場化配置數(shù)據(jù)采集數(shù)據(jù) 數(shù)據(jù) 數(shù)據(jù) 數(shù)據(jù)存儲(chǔ)

加工

流通

分析數(shù)據(jù)應(yīng)用生態(tài)保障圖46:數(shù)據(jù)要素構(gòu)成關(guān)系數(shù)據(jù)要素特點(diǎn):可復(fù)制性強(qiáng)迭代速度快復(fù)用價(jià)值高無限供給數(shù)據(jù)價(jià)值化采集標(biāo)注提煉匯聚確權(quán)定價(jià)交易市場安全保護(hù)分析應(yīng)用2.3.2

數(shù)據(jù)端:數(shù)據(jù)要素投資機(jī)會(huì)大幕將啟數(shù)據(jù)要素市場共包含七大模塊。我國數(shù)據(jù)要素市場歸結(jié)為數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)加工、數(shù)據(jù)流通、數(shù)據(jù)分析、數(shù)據(jù)應(yīng)用、生態(tài)保障七大模塊。其中數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)加工、數(shù)據(jù)流通、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論