2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨繽第1頁
2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨繽第2頁
2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨繽第3頁
2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨繽第4頁
2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨繽第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨?023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第1頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第1頁。目 錄1、ChatGPT:AIGC現(xiàn)象級應(yīng)用,商業(yè)化落地打開成長空間 42、大模型+大數(shù)據(jù)+高算力,ChatGPT不斷突破 6、預(yù)訓(xùn)練大模型:GPT大模型多次迭代,訓(xùn)練結(jié)果持續(xù)優(yōu)化 6、數(shù)據(jù):數(shù)據(jù)量提升顯著優(yōu)化大模型表現(xiàn) 10、算力:微軟是獨家云計算供應(yīng)商,預(yù)計每月成本近千萬美元 123、技術(shù)、產(chǎn)業(yè)、政策共振,AIGC迎加速發(fā)展 134、巨頭積極布局,產(chǎn)業(yè)落地加速 16、微軟:產(chǎn)品全線整合ChatGPT,想象空間廣闊 16、谷歌:推出對標產(chǎn)品Bard,或?qū)⑴c微軟正面競爭 18、百度:AI領(lǐng)域全棧布局,文心一言生態(tài)持續(xù)擴大 21、國內(nèi)其他巨頭也紛紛布局,產(chǎn)業(yè)落地加速 275、投資建議 296、風險提示 30圖表目錄圖1:ChatGPT是OpenAI于2022年月30日發(fā)布的通用型對話系統(tǒng) 4圖2:大型語言模型在多項測試中已經(jīng)超過人類 5圖3:GhatGPT日活用戶超過1000萬人 5圖4:ChatGPT已推出收費的Plus版本 6圖5:ChatGPT是以Transformer為基礎(chǔ)的預(yù)訓(xùn)練模型 6圖6:GPT大模型多次迭代,參數(shù)量大幅提升 7圖7:GPT-3系列已經(jīng)發(fā)展出50多種模型 7圖8:ChatGPT訓(xùn)練包括三個步驟 8圖9:ChatGPT通過RLHF優(yōu)化訓(xùn)練結(jié)果 8圖10:InstructGPT相比GPT-3更符合人類偏好 9圖InstructGPT較GPT-3毒性降低 9圖12:ChatGPT的信息相比InstructGPT更加有效 9圖13:ChatGPT在無害性方面也有所提升 9圖14:CommonCrawl數(shù)據(jù)規(guī)模達PB級 10圖15:CommonCrawl英文數(shù)據(jù)占比約45% 10圖16:GPT-3預(yù)訓(xùn)練數(shù)據(jù)量大幅提升 圖17:ChatGPT預(yù)訓(xùn)練數(shù)據(jù)僅更新至2021年 圖18:ChatGPT每次聊天成本約為幾美分 12圖19:AI技術(shù)持續(xù)突破創(chuàng)新,引領(lǐng)AIGC產(chǎn)業(yè)發(fā)展 13圖20:預(yù)訓(xùn)練模型通過大數(shù)據(jù)和巨量參數(shù)的訓(xùn)練,生成質(zhì)量顯著提升 13圖21:預(yù)訓(xùn)練大模型從單模態(tài)向多模態(tài)的發(fā)展 14圖22:AIGC產(chǎn)業(yè)生態(tài)持續(xù)完善 14圖23:微軟與OpenAI持續(xù)深度合作 16圖24:微軟ChatGPT版Bing,可以自動抓取關(guān)鍵內(nèi)容并生成回答 17圖25:2022年12月Google、Bing在搜索領(lǐng)域的市場份額分別為84.08%、8.95% 17圖26:2018年谷歌推出自然語言預(yù)訓(xùn)練模型18圖27:谷歌已將預(yù)訓(xùn)練模型用于改善搜索 18圖28:2023年2月,谷歌推出對標ChatGPT的對話機器人Bard 19圖29:Bard基于谷歌LaMDA模型,表現(xiàn)已接近人類水平 19圖30:未來谷歌AI技術(shù)將率先應(yīng)用于搜索業(yè)務(wù) 20圖31:昆侖芯2單卡算力達128TFLOPS 21圖32:第三代昆侖芯3將采用4nm制程 21圖33:百度飛槳是國內(nèi)規(guī)模第一的深度學(xué)習框架和賦能平臺 21圖34:百度在大模型領(lǐng)域積累深厚 22圖35:百度已發(fā)布4個基礎(chǔ)通用大模型以及個行業(yè)大模型 22圖36:文心ERNIE大模型已在百度百余個產(chǎn)品中應(yīng)用 23圖37:百度推出AI作畫產(chǎn)品“文心一格” 23圖38:百度推出產(chǎn)業(yè)級搜索系統(tǒng)“文心百中” 23圖39:百度即將推出對標ChatGPT的AI聊天機器人“文心一言” 24圖40:ERNIE具備業(yè)界領(lǐng)先的復(fù)雜知識推理能力 24圖41:百度ERNIE3.0可節(jié)省50%訓(xùn)練時間 25圖42:ERNIE3.0基于“鵬城云腦II”高性能集群訓(xùn)練 25圖43:京東宣布推出產(chǎn)業(yè)版“ChatJD” 27圖44:阿里多模態(tài)大模型M6參數(shù)規(guī)模達10萬億 28圖45:科大訊飛已開源了6大類、超過40個通用領(lǐng)域的中文預(yù)訓(xùn)練語言模型 28表1:ChatGPT數(shù)據(jù)主要來自CommonCrawl、新聞、帖子、書籍及各種網(wǎng)頁 10表2:GPT-3預(yù)訓(xùn)練數(shù)據(jù)量大幅提升 表3:“文心一言”生態(tài)圈持續(xù)擴大 252023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第2頁。表4:受益標的盈利預(yù)測和估值 292023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第2頁。1、ChatGPT:AIGC現(xiàn)象級應(yīng)用,商業(yè)化落地打開成長空間ChatPT是AIC領(lǐng)域現(xiàn)象級應(yīng)用。haPT是國AI公司OeAI于2022年1月30日通型對系,以過擬對的式成程問、文本成任ChaT持火,為AC域象應(yīng),續(xù)商業(yè)化和應(yīng)用落地打開廣闊空間,也為以自然語言處理為核心的認知智能技術(shù)提供廣闊發(fā)展遇英達CO仁勛示CaPT于AI的Phoe世。圖1:ChatGPT是OpenAI于2022年11月30日發(fā)布的通用型對話系統(tǒng)資料來源:OpenAI官網(wǎng)ChatGPT在多項測試中超過人類。2022年,包括ChatGPT在內(nèi)的許多大模型的測試表現(xiàn)已經(jīng)超出人類。目前ChatGPT已經(jīng)通過SAT考試、商學(xué)院考試、美國律2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第3頁。師資格、注冊會計師、醫(yī)師資格等高難度考試,IQ測試達83,已經(jīng)具備取代無意義重復(fù)性工作的能力,在專業(yè)領(lǐng)域也具有輔助決策的潛力。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第3頁。圖2:大型語言模型在多項測試中已經(jīng)超過人類資料來源:LifeArchitect.ai網(wǎng)站ChatPT上線后熱度持提升已超過ok成為活躍用戶增長最快產(chǎn)。ChatGPT發(fā)布一周用戶數(shù)就突破100萬人,月訪問量達2100萬人次。目前ChatGPT尚未披露具體的日活用戶數(shù),根據(jù)ARK數(shù)據(jù),截至2023年1月,預(yù)計ChatGPT全球日活用戶超過1000萬人。圖3:GhatGPT日活用戶超過1000萬人資料來源:ARK網(wǎng)站2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第4頁。ChatGPTB可以開放接口對外輸出服務(wù),如與微軟Bing的結(jié)合;面向C端,2023年2月ChaPT已推出的Pus本度費為0元月,并表示未來或?qū)⑻剿鲀r格更低的訂閱方案、2B的商業(yè)方案以及數(shù)據(jù)包等選項。根據(jù)OpenAI預(yù)測,2023年將實現(xiàn)收入2億美元,2024年將超過10億美元,未來成長空間廣闊2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第4頁。圖4:ChatGPT已推出收費的Plus版本資料來源:ChatGPT官網(wǎng)2、大模型+大數(shù)據(jù)+高算力,ChatGPT不斷突破、預(yù)訓(xùn)練大模型:GPT大模型多次迭代,訓(xùn)練結(jié)果持續(xù)優(yōu)化ChatPT是以rnsoer為基礎(chǔ)的預(yù)訓(xùn)練模。PT全稱為GeeaePeanedanoe即生式訓(xùn)練anoer模型。訓(xùn)模是過挖掘利用大規(guī)模無標注數(shù)據(jù),學(xué)習數(shù)據(jù)中的知識與規(guī)律,然后針對特定任務(wù),通過微調(diào)、手工調(diào)參等階段,進入到可以大規(guī)模、可復(fù)制的大工業(yè)落地階段。nsoer模型自歌017年的論Aenonslouneed是種用注機制的深度學(xué)習模型,模型按照輸入數(shù)據(jù)各部分的重要性的不同而分配不同的權(quán)重。ranforer的優(yōu)勢在于(用行練大提高訓(xùn)效2分析預(yù)測更的本,間較長語具更聯(lián)效。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第5頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第5頁。圖5:ChatGPT是以Transformer為基礎(chǔ)的預(yù)訓(xùn)練模型資料來源:AI大模型公眾號GPT大模型經(jīng)過多次迭代,參數(shù)量大幅提升。谷歌發(fā)表Transformer論文的第二(即2018年OnAI推出于nsoer的第代PT模型,隨后陸續(xù)推出GPT-2、GPT-3、InstructGPT于2020年5月推出第三代GPT-3模型,參數(shù)量達1750億,較上一代GPT-2(參數(shù)量15億)提升了兩個數(shù)量級,是微軟同年2月推出的T-NLG模型(參數(shù)量170億)的10倍,成為當時最大的預(yù)訓(xùn)練語言模型。圖6:GPT大模型多次迭代,參數(shù)量大幅提升資料來源:medium網(wǎng)站GPT-3系列已經(jīng)發(fā)展出50ChatGPT外,GPT-3系中流行還有Cde(生成、AE(圖片生成)等。CoeX經(jīng)過自然語言和幾十億行代碼的訓(xùn)練,可以完成Python、JavaScript等十幾種語言的代碼任務(wù)。DALL-E于2021年5月推出,可以根據(jù)文字描述生成圖像和藝術(shù)作品,收費價格為0.016-0.020美元/圖。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟?023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第6頁。圖7:GPT-3系列已經(jīng)發(fā)展出50多種模型資料來源:LifeArchitect.ai網(wǎng)站ChaPT由T3微調(diào)而來模型更小專聊天場景比看PT3是一種大通用語模,可以處各種語處任務(wù),haPT是個小的專用模專聊應(yīng)序設(shè)CaT訓(xùn)練包括三個步驟訓(xùn)一個語言模型M)(2聚答數(shù)并練個勵型ReadModM)(3)用強化學(xué)習R)方式微調(diào)M。此外,因為引入了代碼作為訓(xùn)練語料,CaPT還額產(chǎn)了動代和理代的力。圖8:ChatGPT訓(xùn)練包括三個步驟資料來源:OpenAI官網(wǎng)ChaPT通過RLF優(yōu)訓(xùn)練結(jié)果haPT于類反強學(xué)(RH通過眾包團隊大規(guī)模開展生成結(jié)果好壞的人工標注,經(jīng)過多次迭代,使得大模型生成結(jié)更無見符人類期實了智涌的果。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第7頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第7頁。圖9:ChatGPT通過RLHF優(yōu)化訓(xùn)練結(jié)果資料來源:Huggingface網(wǎng)站InstructGPT相比GPT-3:(1)更符合人類偏好。InstructGPT是在GPT-3微調(diào)而來,經(jīng)過人類反饋強化學(xué)習后,InstructGPT相比GPT-3,在71%-88%的情況下更符合人類偏好。(2)真實性顯著提升。在TruthfulQA測試中,InstructGPT成實息頻率較PT3提約一0.413s0.2。(3)在生成有毒信息方面略有改善。在RealToxicity測試中,InstructGPT有毒息情(含歧或言信較PT3略有0196s0.2。圖10:InstructGPT相比GPT-3更符合人類偏好圖11:InstructGPT較GPT-3毒性降低資料來源:OpenAI官網(wǎng)資料來源:OpenAI官網(wǎng)ChatGPT相比InstructGPT:在有效性和無害性方面有所提升。比如在“哥倫布如何在2015年到?haPT會“倫在156去所他不能在215到美國比nsucGPT回更合理“何負JohnDoe?”的問題上,InstructGPT會給出建議,ChatGPT則會指出欺負人是不對的。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第8頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第8頁。圖12:ChatGPT的信息相比InstructGPT更加有效圖13:ChatGPT在無害性方面也有所提升資料來源:OpenAI官網(wǎng)資料來源:OpenAI官網(wǎng)、數(shù)據(jù):數(shù)據(jù)量提升顯著優(yōu)化大模型表現(xiàn)ChaPT數(shù)據(jù)主要來自oonCrw新聞帖子書籍及各種網(wǎng)頁oonCrawl、網(wǎng)頁、書籍、維基百科對于訓(xùn)練的貢獻量分別為30億tokens,僅占到訓(xùn)練數(shù)據(jù)量的3%。表1:ChatGPT數(shù)據(jù)主要來自CommonCrawl、新聞、帖子、書籍及各種網(wǎng)頁Dataset#tokensProportionwithintrainingCommonCrawl410billion60%WebText219billion22%Books112billion8%Books255billion8%Wikipedia3billion3%數(shù)據(jù)來源:維基百科、開源證券研究所CoonCrwl是一個網(wǎng)絡(luò)爬取產(chǎn)生的大免語料庫數(shù)據(jù)規(guī)模達PB。Common2008年以來的原始網(wǎng)頁、元數(shù)據(jù)和抓取文本,數(shù)據(jù)規(guī)模達PB級別,其中英文數(shù)據(jù)占比約數(shù)據(jù)庫的應(yīng)用場景包括訓(xùn)練NLP數(shù)據(jù)庫對于AI的意義堪比Google圖14:CommonCrawl數(shù)據(jù)規(guī)模達PB級圖15:CommonCrawl英文數(shù)據(jù)占比約45%資料來源:CommonCrawl官網(wǎng)、開源證券研究所資料來源:CommonCrawl官網(wǎng)ChaPT的優(yōu)秀表現(xiàn)得于預(yù)訓(xùn)練數(shù)據(jù)量大提PT3和PT2采了相同的模上大幅用多據(jù)數(shù)去行PT22023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第9頁。的預(yù)練據(jù)約4B約有00億個oen;PT3的訓(xùn)數(shù)由4TB的原語清而據(jù)規(guī)達7G有400個okenPT2型參數(shù)量為15億PT3參為150億由容和數(shù)量的幅升PT3的準確也到幅升已經(jīng)以成質(zhì)文,讓難確是是寫的。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第9頁。表2:GPT-3預(yù)訓(xùn)練數(shù)據(jù)量大幅提升模型GPT-1GPT-2GPT-3發(fā)布時間2018年6月2019年2月2020年5月層數(shù)124896頭數(shù)12-96詞向量長度768160012888參數(shù)量1.17億15億1,750億預(yù)訓(xùn)練數(shù)據(jù)量約5GB40GB45TB數(shù)據(jù)來源:維基百科、開源證券研究所圖16:GPT-3預(yù)訓(xùn)練數(shù)據(jù)量大幅提升資料來源:LifeArchitect.ai網(wǎng)站ChatPT局限()ChaPT的知識有限。CaPT的訓(xùn)數(shù)庫更新至201無進聯(lián)更此解答201之發(fā)的()真實性無法保障。CaPT的分練基于聯(lián)網(wǎng)搜集數(shù),因它的輸出結(jié)經(jīng)受偏和準確息影,法證真性。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第10頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第10頁。圖17:ChatGPT預(yù)訓(xùn)練數(shù)據(jù)僅更新至2021年資料來源:OpenAI官網(wǎng)、開源證券研究所、算力:微軟是獨家云計算供應(yīng)商,預(yù)計每月成本近千萬美元微軟AzuAI是ChatPT獨家云計算供應(yīng)商據(jù)penAI于2018年的統(tǒng)計,自2012年以來,AI訓(xùn)練任務(wù)所運用的算力每3.43個月就會翻倍,算力需求每年長10CaPT訓(xùn)的件為級算219年微向peAI投資0億美元,雙方將共同開發(fā)AzureAIOpenAI285,000個CPU內(nèi)核、約10,000個GPU,每個GPU服務(wù)器擁有約400GB/s的網(wǎng)路連接速度。預(yù)計ChatGPT每月成本約為900萬美元。根據(jù)OpenAI的CEOSamAltman在上透露,ChatGPT每次聊天成本約為幾美分(single-digitscentsper,其中一分自Azue云務(wù)們設(shè)CaPT活用為0003美分,可測算得ChatGPT每日成本約為30900萬美元。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第11頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第11頁。圖18:ChatGPT每次聊天成本約為幾美分資料來源:Twitter3、技術(shù)、產(chǎn)業(yè)、政策共振,AIGC迎加速發(fā)展AI技術(shù)持續(xù)突破創(chuàng)新,引領(lǐng)AIGC產(chǎn)業(yè)發(fā)展。(1)算法模型方面:24年以來,ANanoe、owbaedode、Dusonodes等深習生算持涌自然言NP算機視V等域續(xù)如歌的BT和aMApeAI的PT3預(yù)訓(xùn)練模型于anoer模型而,續(xù)CaPT等應(yīng)的地定礎(chǔ)。圖19:AI技術(shù)持續(xù)突破創(chuàng)新,引領(lǐng)AIGC產(chǎn)業(yè)發(fā)展資料來源:騰訊研究院()預(yù)訓(xùn)練模型:218年谷推自語預(yù)訓(xùn)模型BTAI進入預(yù)訓(xùn)練大模型時代。相比之前的生成模型,預(yù)訓(xùn)練模型通過大數(shù)據(jù)和巨量參數(shù)的訓(xùn)練生質(zhì)顯提滿下場對精高量要求成了AI技術(shù)發(fā)展范變,發(fā)了AGC業(yè)質(zhì)然語處領(lǐng),模的自然語言解力越人,并體出超的用AI能力。計機覺領(lǐng),預(yù)訓(xùn)練大模型的效果也超越了之前的監(jiān)督學(xué)習方法,在視覺分類、圖像分割等任務(wù)中取了大升且現(xiàn)出強的像解力。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第12頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第12頁。圖20:預(yù)訓(xùn)練模型通過大數(shù)據(jù)和巨量參數(shù)的訓(xùn)練,生成質(zhì)量顯著提升資料來源:AI大模型公眾號(多模態(tài)技術(shù)方面模態(tài)術(shù)指圖音文等類內(nèi)合學(xué)習,比如將“人”這一文本與人的圖片聯(lián)系在一起。從單模態(tài)向多模態(tài)的發(fā)展,豐了AC內(nèi)使AGC應(yīng)更有用,在覺答視推等任務(wù)中取了常的果比如OpnAIAE和度的心ENEG,根據(jù)用戶輸?shù)淖挚沙蓤D片。圖21:預(yù)訓(xùn)練大模型從單模態(tài)向多模態(tài)的發(fā)展資料來源:AI大模型公眾號AIGC產(chǎn)業(yè)生態(tài)持續(xù)完善,已經(jīng)進入產(chǎn)業(yè)落地的關(guān)鍵期。AIGC產(chǎn)業(yè)鏈包括底層的芯片和數(shù)據(jù)服務(wù)支撐、基礎(chǔ)算法平臺以及下游的行業(yè)應(yīng)用。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第13頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第13頁。圖22:AIGC產(chǎn)業(yè)生態(tài)持續(xù)完善資料來源:IDC官網(wǎng)(基礎(chǔ)算法臺方面預(yù)訓(xùn)大要成和技投有高技術(shù)門業(yè)與主頭部技業(yè)科機等及些直景司。(下游的業(yè)應(yīng)方大型落痛在成本昂通大游垂應(yīng)場需的匹配著haPT熱持續(xù)升及廠持投,有望接激游費愿提一速AC用地商變GC產(chǎn)業(yè)迎發(fā)良。政策支持落地AIC有望迎來加速發(fā)展2月13日北市信表支持頭企打標haPT大型著構(gòu)開源架通大型應(yīng)生態(tài)。加強人工智能算力基礎(chǔ)設(shè)施布局。加速人工智能基礎(chǔ)數(shù)據(jù)供給。支持人工智能優(yōu)勢企業(yè)在自動駕駛、智能制造、智慧城市等優(yōu)勢領(lǐng)域開展創(chuàng)新應(yīng)用,全面構(gòu)筑人工智場創(chuàng)高京經(jīng)局確示持部企打標CaPT的大模型持力據(jù)用等關(guān)業(yè)同展GC行從場注至政策支持面。預(yù)計200年IC市場規(guī)模將達00億美元。據(jù)騰研院布的AC發(fā)展勢告AC在AI技創(chuàng)(成法預(yù)訓(xùn)模、模技等)和產(chǎn)業(yè)(層態(tài)雛形支望步發(fā)快計2030年2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第14頁。AIGC市場規(guī)模將達億美元。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第14頁。4、巨頭積極布局,產(chǎn)業(yè)落地加速、微軟:產(chǎn)品全線整合ChatGPT,想象空間廣闊微軟與OpenAI持續(xù)深度合作,是其獨家云服務(wù)供應(yīng)商。2019年7月,微軟對OpenAI投資10億美元,OpenAI將服務(wù)移植在MicrosoftAzure上運行,微軟將成為OpenAI年9OpenAI的將繼續(xù)向公眾提供GPT-3年1AzureOpenAI服務(wù)對外發(fā)布,企業(yè)客戶可以申請訪問OpenAI旗下GPT-3.5、Codex和DALL·E2模型。圖23:微軟與OpenAI持續(xù)深度合作資料來源:微軟官網(wǎng)2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第15頁。微軟計劃將aT整合進所有產(chǎn)品。023年2月2日,軟布下有產(chǎn)品全合CaP一加與haPT合203年2月7微軟推出入ChaPT術(shù)索擎NwBg和器Edge新Bg索級向我提問吧”的對話框,用戶提出問題后,搜索引擎可以自動抓取關(guān)鍵內(nèi)容并生成回答。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第15頁。圖24:微軟ChatGPT版Bing,可以自動抓取關(guān)鍵內(nèi)容并生成回答資料來源:BingChaPT與搜索結(jié)合可善搜索體驗haPT對話式于戶有引力,由于訓(xùn)練數(shù)據(jù)有限,同時真實性也無法得到保障,尚不具備替代搜索引擎的能力。haPT搜索則可結(jié)合索和聊的有點大幅善搜索驗。根據(jù)微的研示71的用對haPT版Bg滿意搜與AI技同作用顯據(jù)Sasa數(shù)截至022年12oogBng搜領(lǐng)的份額分為84.8.95微軟出合ChaPT新Bn備發(fā)勢未來市場份有提。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第16頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第16頁。圖25:2022年12月Google、Bing在搜索領(lǐng)域的市場份額分別為84.08%、8.95%資料來源:Statista、谷歌:推出對標產(chǎn)品Bard,或?qū)⑴c微軟正面競爭2018年,谷歌推出自然語言預(yù)訓(xùn)練模型B。B(BdeconalncoerRepeenaonsomanoes和ChaPT樣以anoes為基模型ET采用向碼表技理上文面好的數(shù)據(jù)方面T數(shù)據(jù)用開料BosCropus以英維百數(shù)據(jù)共約3個詞參數(shù)方面,基版ba參數(shù)為1.1,號本age參達3.4億訓(xùn)練方面,大本T次訓(xùn)要16個PU群約6PU訓(xùn)練5圖26:2018年谷歌推出自然語言預(yù)訓(xùn)練模型BERT資料來源《E:Pr-trinngofDpBidiretionlrnsorersornuaeUndrstnding》谷歌已將T模型用改善搜索。T模以借某單前的來考慮所的整境應(yīng)用搜引后更的理用搜意。29年,谷歌將T模用于于文索隨又拓至0種言220歌表幾所英搜應(yīng)了T模。圖27:谷歌已將預(yù)訓(xùn)練模型用于改善搜索資料來源:谷歌官網(wǎng)2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第17頁。2023年2月谷歌推出標CaT的對話機器人Bad根谷介ad是由aA供持全新驗對歌AI務(wù)求世知的度與谷歌大型語言模型的力量、智慧和創(chuàng)造力相結(jié)合。它利用來自網(wǎng)絡(luò)的信息提供最新、高質(zhì)的復(fù)。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第17頁。圖28:2023年2月,谷歌推出對標ChatGPT的對話機器人Bard資料來源:谷歌官網(wǎng)Bard基于谷歌LaMDA同樣以anoer模型基訓(xùn)數(shù)由1.56億單的和對構(gòu)數(shù)最達1370億是PT3的78已經(jīng)在多個維度接近人類水平。目前谷歌聊天機器人Bard仍處于內(nèi)測階段,尚未對外開放。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第18頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第18頁。圖29:Bard基于谷歌LaMDA模型,表現(xiàn)已接近人類水平資料來源:谷歌官網(wǎng)未來谷歌I技術(shù)將率先用于搜索業(yè)務(wù)在AI領(lǐng)域谷歌已有aAPa、agen、MucM等技術(shù)儲備涵語、像視頻音領(lǐng),來陸整合進司下品谷表示AI技術(shù)率應(yīng)于搜業(yè),動煉索果便于解局目微已經(jīng)出合ChaPT本的索擎NeB未來或?qū)⑴c歌開面爭。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第19頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第19頁。圖30:未來谷歌AI技術(shù)將率先應(yīng)用于搜索業(yè)務(wù)資料來源:谷歌官網(wǎng)、百度:AI領(lǐng)域全棧布局,文心一言生態(tài)持續(xù)擴大百度是國內(nèi)最有實推對標CaT產(chǎn)品的廠商之一百度在I領(lǐng)域深耕數(shù)十年,在包括底層的芯片、深度學(xué)習框架、大模型以及最上層的搜索等應(yīng)用人工智能四層架構(gòu)中已形成全棧布局,擁有產(chǎn)業(yè)級知識增強文心大模型,具備跨模態(tài)、跨語的度義解生成力。(1)芯片:百度自研AI芯片昆侖芯2單卡算力達128TFLOPS。2018年,百度在AI開發(fā)者大會上發(fā)布自主研發(fā)中國首款云端全功能AI芯“侖。2021年8月,百度第二代昆侖芯開始量產(chǎn),昆侖芯2基于7nm制程,單卡算力達到128TFLOPS,較第一代性能提升2-3倍,可應(yīng)用于計算機視覺、自然語言處理、大規(guī)模語音識別、大規(guī)模推薦等場景。第三代昆侖芯3將采用4nm制程,預(yù)計2024年初量產(chǎn)。圖31:昆侖芯2單卡算力達128TFLOPS圖32:第三代昆侖芯3將采用4nm制程資料來源:IT之家資料來源:中國日報(深度學(xué)習框架百飛槳是國內(nèi)規(guī)模第的度學(xué)習框架和賦能臺飛槳(PadPade)是百度自主研發(fā)的開源深度學(xué)習平臺,包括深度學(xué)習核心框架、基礎(chǔ)型開套具組以服平持超規(guī)深學(xué)模訓(xùn)練。截至202年1月飛臺已聚535萬發(fā)基于槳了7個,服了20萬企業(yè)。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第20頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第20頁。圖33:百度飛槳是國內(nèi)規(guī)模第一的深度學(xué)習框架和賦能平臺資料來源:百度飛槳公眾號(大模百在大型領(lǐng)域積累深厚已發(fā)布4類基礎(chǔ)通用大模以及個行業(yè)大模型。文包括NP大型CV模型跨態(tài)模和物計算四個礎(chǔ)模型行業(yè)域度合領(lǐng)域業(yè)部布1個行業(yè)大模型,涵蓋涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領(lǐng)域,產(chǎn)業(yè)生態(tài)初步形成。RNE擁有一系列可以執(zhí)行各種功能的高級M,而語生來自NE30an,文到像成來自NEiG。圖34:百度在大模型領(lǐng)域積累深厚資料來源:Github網(wǎng)站2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第21頁。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第21頁。圖35:百度已發(fā)布4個基礎(chǔ)通用大模型以及11個行業(yè)大模型資料來源:百度飛槳官網(wǎng)(4)產(chǎn)品和應(yīng)用:文心ERNIE大模型已在百度百余個產(chǎn)品中應(yīng)用。包括百度搜索中問題分類、網(wǎng)頁排序;Feed流中的新聞推薦、新聞去重;好看視頻中的視頻推薦;百度地圖里的POI檢索以及小度智能屏中的意圖理解等,都使用到了文心ERNIE大模型。圖36:文心ERNIE大模型已在百度百余個產(chǎn)品中應(yīng)用資料來源:谷歌官網(wǎng)百度已文心一格(I作、文心百中(產(chǎn)業(yè)索產(chǎn)品落地。心是AI藝術(shù)輔創(chuàng)平關(guān)鍵即生畫內(nèi)容產(chǎn)本202年1月,百度出模驅(qū)的業(yè)級索文百由度索文大型聯(lián)合研制,命名寓意搜索結(jié)果精準,相比傳統(tǒng)搜索系統(tǒng)可減少人力成本90%以上。圖37:百度推出AI作畫產(chǎn)品“文心一格”圖38:百度推出產(chǎn)業(yè)級搜索系統(tǒng)“文心百中”資料來源:百度飛槳公眾號資料來源:百度飛槳公眾號百度即將推出對標aPT的AI聊天機器人“心一言。023年2月百度宣即推似CaPT對式AI工“心一ENEBo心一言是百度基于文心大模型技術(shù)推出的生成式對話產(chǎn)品,目前正處于內(nèi)測階段,預(yù)計2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第22頁。2023年3月完成內(nèi)測后向公眾開放。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第22頁。圖39:百度即將推出對標ChatGPT的AI聊天機器人“文心一言”資料來源:百度公眾號文心一言預(yù)計將建立在全球最大中文單體預(yù)訓(xùn)練模型ERNIE3.0Titan之上。2021年12月,百度與鵬城自然語言處理聯(lián)合實驗室發(fā)布全球首個知識增強的千億AI大—NE3.0anENE3.0n有600億參數(shù)參較PT3的1750億多出GPT-3提升83.0Titan已在60多項的NLP任務(wù)上取得了世界領(lǐng)先,在SuperGLUE和GLUE都超過了人類排名第一的水平。圖40:ERNIE具備業(yè)界領(lǐng)先的復(fù)雜知識推理能力資料來源:AI大模型公眾號2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第23頁。3.0基于飛槳4D50算力方面NE3.0鵬城腦高性能訓(xùn)“城腦”包括4096顆Ascend910AI處理器和2048顆鯤鵬920CPU理以供EPS智能力即低秒100億操的AI計算能力。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第23頁。圖41:百度ERNIE3.0可節(jié)省50%訓(xùn)練時間圖42:ERNIE3.0基于“鵬城云腦II”高性能集群訓(xùn)練資料來源:AI大模型公眾號資料來源:鵬城云腦官網(wǎng)“文心一言”生態(tài)持擴大。2月7,度團執(zhí)副裁百智云事業(yè)群總裁沈抖宣布“文心一言”將通過百度智能云對外提供服務(wù),會率先在內(nèi)容和信相的業(yè)場落地前經(jīng)包聯(lián)網(wǎng)汽車、企業(yè)件行近300家企宣加百心一生態(tài)持擴大。上市公司方面,已有多家公司宣布成為文心一言首批生態(tài)合作伙伴,未來將優(yōu)先接入文一的未也將垂領(lǐng)開更合作。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第24頁。表3:“文心一言”生態(tài)圈持續(xù)擴大2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第24頁。上市公司合作內(nèi)容彩訊股份公司是百“文心一言的首批生態(tài)合作伙伴將優(yōu)先接“文心一言的全面能力同時公司與阿里字節(jié)跳動分別在5G消息CP管理平臺數(shù)據(jù)智能企業(yè)直播R及視頻內(nèi)容制作等方面有合作未來也將進一步探討更多合作的可能。遠光軟件公司宣布成為百度文心一言首批生態(tài)合作伙伴將全面體驗并接入文心一言的能力此舉標志著遠光軟件優(yōu)先獲得領(lǐng)先I技術(shù)的加持,未來將把成果應(yīng)用于企業(yè)管理領(lǐng)域數(shù)字化轉(zhuǎn)型的業(yè)務(wù)場景中。銀之杰公司已參與接入百度“文心一言首批體驗銀之杰將利用百度先進的智能對話技術(shù)和產(chǎn)品打造更好的人工智能及IC產(chǎn)品和平臺。國光電器公司是人工智能語音交互硬件的供應(yīng)商,百度是公司的客戶,其中以智能音響為代表的AI+IOT產(chǎn)品是公司重點合作方向之一,公司密切關(guān)注ChatGPT、文心一言等生成式AI技術(shù)在人機交互體驗上帶來的革命性升級視覺中國公司近期與百度旗下的AI作畫平臺文心一格將在創(chuàng)作者賦能和版權(quán)保護等方面展開多項合作,共探AIGC內(nèi)容產(chǎn)業(yè)發(fā)展方向。北信源公司在一些細分領(lǐng)域與百度具有合作關(guān)系。公司打造的跨終端、全方位、安全可信的通信聚合平臺信源密信具有標準的DI(服務(wù)端通訊中臺)開發(fā)接口能與任何智能機器人進行快速對接,目前已實現(xiàn)ChtPT對接,未來文心一言若支持開放對接,信源密信能實現(xiàn)與其進行快速對接。東軟集團公司宣布成為百度文心一言首批生態(tài)合作伙伴后續(xù)東軟將全面體驗并接入文心一言的能力應(yīng)用百度領(lǐng)先的智能對話技術(shù)成果,打造更多I賦能的產(chǎn)品與解決方案。宇信科技公司作為百度在金融科技領(lǐng)域的合作伙伴雙方將繼續(xù)探索在金融行業(yè)的發(fā)展機會最近公司也被邀請作為百度中國版htP“文心一言”的首批生態(tài)合作伙伴,將優(yōu)先內(nèi)測體驗并接入“文心一言”的相關(guān)能力,雙方一起探索在金融領(lǐng)域的解決方案。漢得信息公司加入百度文心一言生態(tài)圈并成為百度文心一言首批先行體驗官通過融合百度領(lǐng)先的智能對話技術(shù)成果雙方將攜手推進B端人工智能深入應(yīng)用,致力于幫助客戶更徹底地實現(xiàn)數(shù)字化轉(zhuǎn)型。致遠互聯(lián)公司宣布成為百度文心一言英文名:ERNIEBot首批生態(tài)合作伙伴。致遠互聯(lián)新一代協(xié)同運營平臺CP將全面體驗并接入文心一言的能力。作為百度文心一言首批生態(tài)合作伙伴,公司可優(yōu)先內(nèi)測試用文心一言集成文心一言的技術(shù)能力。隨著致遠互聯(lián)與百度文心一言在產(chǎn)品研發(fā)等領(lǐng)域展開深化合作將實現(xiàn)致遠互聯(lián)在對話機器人等產(chǎn)品的跨越升上市公司合作內(nèi)容級加速推動“協(xié)同I”快速發(fā)展為企業(yè)提供協(xié)同運營全場景人工智能解決方案及服務(wù)引領(lǐng)協(xié)同管理行業(yè)變革與升級。航天宏圖公司宣布成為百度文心一言首批生態(tài)合作伙伴后續(xù)航天宏圖將全面體驗并接入文心一言的能力公司將把百度領(lǐng)先的智能對話技術(shù)成果應(yīng)用在衛(wèi)星遙感領(lǐng)域此舉標志著航天宏圖優(yōu)先獲得領(lǐng)先I技術(shù)的加持也標志著對話式語言模型技術(shù)在PIE-Enne時空遙感云平臺及各行業(yè)衛(wèi)星應(yīng)用場景中的首次著陸。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第25頁。資料來源:各公司官網(wǎng)、開源證券研究所2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第25頁。、國內(nèi)其他巨頭也紛紛布局,產(chǎn)業(yè)落地加速2023年2月以來國巨紛紛布局IC產(chǎn)業(yè)京宣布出業(yè)“haJD應(yīng)用線包一平兩領(lǐng)零和融五應(yīng)內(nèi)生人機對話用意理解信抽取感類阿類ChaPT品前也內(nèi)測階段,會與釘釘產(chǎn)品結(jié)合。國內(nèi)具有豐富應(yīng)用場景和數(shù)據(jù)積累,破局之路在于產(chǎn)業(yè)鏈的協(xié)同,隨著國內(nèi)頭紛紛投入,有望帶動IC相關(guān)產(chǎn)業(yè)鏈加速發(fā)展。京東宣布推產(chǎn)業(yè)“hatJhaJD5劃為地用線圖,含個臺兩領(lǐng)域五應(yīng)1臺指ChaJD智人對平臺,即自語處中解生成務(wù)對平計參量千級2域包含零售金領(lǐng)5個包含容機戶圖解信取情感分,蓋售金行業(yè)用度高應(yīng)場景。圖43:京東宣布推出產(chǎn)業(yè)版“ChatJD”資料來源:京東云公眾號阿里:阿里類hatPT產(chǎn)品目前也處于內(nèi)階。021年阿巴達院先后發(fā)布多個版本的多模態(tài)及語言大模型,在超大模型、低碳訓(xùn)練技術(shù)、平臺化服務(wù)地用方實突破達院隊用對較算即現(xiàn)0參數(shù)大模型,等數(shù)能耗為前界桿的1,低大型練檻。阿2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第26頁。里巴巴通義大模型系列已在超過200個場景中提供服務(wù),實現(xiàn)了2%~10%的應(yīng)用效果提升,典型使用場景包括電商跨模態(tài)搜索、AI輔助設(shè)計、開放域人機對話、法律文書學(xué)習、醫(yī)療文本理解等。2023年計算機行業(yè)深度報告word:ChatGPT不斷突破-AI駛?cè)肟燔嚨廊墓?9頁,當前為第26頁。圖44:阿里多模態(tài)大模型M6參數(shù)規(guī)模達

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論