版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
請務(wù)必參閱正文后面的信息披露和法律聲明1/31 伐謀-中小盤策略專題2022年底ChatGPT橫空出世,其在理解人類意圖、思等諸多行業(yè)大模型廣泛賦能,人工智能迎來l大模型賦能自動駕駛,算法、數(shù)據(jù)閉環(huán)、仿真全面受益為下一代主流技術(shù)—中小盤周報》《次新股說:本批埃科光電等值得重為下一代主流技術(shù)—中小盤周報》《次新股說:本批??乒怆姷戎档弥卮竽P陀行зx能自動駕駛,數(shù)據(jù)閉環(huán)、仿真、算法全面受益。數(shù)據(jù)閉環(huán)方面,l重點(diǎn)關(guān)注:德賽西威、經(jīng)緯恒潤、華陽集團(tuán)、北京君正、晶晨股份、美格智l風(fēng)險提示:技術(shù)發(fā)展進(jìn)度不及預(yù)期、市場需求不及預(yù)期。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明2/311、OpenAI引領(lǐng),人工智能進(jìn)入大模型時代 51.1、ChatGPT橫空出世,引領(lǐng)人工智能新浪潮 51.2、算法是人工智能的基石,Transformer逐步成為主流 81.2.1、始于NLP,延伸至各領(lǐng)域,Transformer在人工智能行業(yè)展現(xiàn)統(tǒng)治力 81.2.2、大語言模型多基于Transformer構(gòu)建,Decoder-Only系列占優(yōu) 91.3、大模型+預(yù)訓(xùn)練+人類反饋微調(diào),大模型蓄勢待發(fā) 1.3.1、探求ChatGPT的能力來源,尋找構(gòu)建大模型的有效方法 1.3.2、大參數(shù)+海量數(shù)據(jù)預(yù)訓(xùn)練+基于人類反饋的微調(diào)構(gòu)成打造大語言模型的要素 1.4、多模態(tài)成為趨勢,應(yīng)用端千帆競渡,人工智能迎來iPhone時刻 2、大模型賦能自動駕駛,算法、數(shù)據(jù)閉環(huán)、仿真全面受益 2.1、自動駕駛算法、數(shù)據(jù)不斷迭代,長尾問題處理成為關(guān)鍵 2.2、大模型全面賦能,自動駕駛各大環(huán)節(jié)全面受益 2.2.1、大模型助力數(shù)據(jù)挖掘和自動標(biāo)注,數(shù)據(jù)飛輪飛馳推動自動駕駛落地 2.2.2、大模型推動算法迭代,感知規(guī)控全賦能 202.2.3、生成海量數(shù)據(jù),大模型助力仿真平臺及端到端自動駕駛模型構(gòu)建 223、自動駕駛漸行漸近,行業(yè)玩家乘風(fēng)起 233.1、科技巨頭構(gòu)筑自動駕駛行業(yè)“安卓”,技術(shù)鴻溝有望縮小 233.2、行業(yè)分工加速,成本下降可期 253.3、大模型開發(fā)者、自動駕駛產(chǎn)業(yè)鏈玩家全面受益 263.3.1、百度Apollo:自動駕駛元老,文心大模型全面賦能 263.3.2、商湯科技:AI算法領(lǐng)軍,布局大模型探索自動駕駛新機(jī)遇 273.3.3、地平線:智駕芯片新星,對算法的深入理解指引芯片架構(gòu)迭代完美適配需求 273.3.4、產(chǎn)業(yè)鏈玩家:自動駕駛落地加速,產(chǎn)業(yè)鏈各大環(huán)節(jié)全面受益 284、風(fēng)險提示 29圖1:達(dá)特茅斯會議開啟人工智能發(fā)展之路 5圖2:視覺識別領(lǐng)域AI在2015年超越人類 5圖3:ChatGPT引領(lǐng)人工智能新范式 5圖4:ChatGPT可完美實(shí)現(xiàn)用戶的需求甚至可輸出代碼 6圖5:ChatGPT用戶數(shù)2個月過億超越TikTok 6圖6:GPT-4的性能顯著強(qiáng)于上個版本 6圖7:GPT4在推理和邏輯能力上大幅提升 6圖8:GPT-4可理解部分圖片笑話 7圖9:GPT4準(zhǔn)確度相比之前的版本大幅提升 7圖10:對不被允許和敏感的內(nèi)容的錯誤響應(yīng)顯著下降 7圖11:GPT4的多項(xiàng)能力超越人類平均水平 7圖12:循環(huán)神經(jīng)網(wǎng)絡(luò)適合處理序列信息 8圖13:卷積神經(jīng)網(wǎng)絡(luò)可實(shí)現(xiàn)圖像處理等任務(wù) 8圖14:Transformer采用編碼器和解碼器的組合,有優(yōu)異全局信息感知能力 8圖15:Transformer在計算機(jī)視覺領(lǐng)域形成諸多路線 9 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明3/31圖16:Transformer應(yīng)用領(lǐng)域迅速泛化 9圖17:GPT模式采用Decoder-Only的算法 9圖18:Bert模式采用Encoder-Only算法 9圖19:大語言模型擁有三大技術(shù)方向,類GPT模式的技術(shù)路線近年成為主流 圖20:GPT版本和能力演進(jìn)路徑——各類訓(xùn)練、微調(diào)方法下形成最終ChatGPT 圖21:模型規(guī)模到達(dá)一定程度會出現(xiàn)“涌現(xiàn)”現(xiàn)象 圖22:通用化的大模型通常會采用內(nèi)容豐富的海量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練 圖23:ChatGPT通過多個步驟訓(xùn)練而來 圖24:參數(shù)超過100億的大語言模型不斷出現(xiàn) 圖25:大模型的應(yīng)用將不斷延伸 圖26:基礎(chǔ)大模型將能完成諸多任務(wù)有望賦能千行百業(yè) 圖27:廣汽研究院認(rèn)為人工智能將在算法中更多滲透 圖28:端到端自動駕駛算法逐步映入眼簾 圖29:長尾場景稀缺而不常見 圖30:路標(biāo)多種多樣,考驗(yàn)算法的泛化能力 圖31:自動駕駛長尾問題出現(xiàn)概率較低 圖32:毫末智行認(rèn)為自動駕駛能力與數(shù)據(jù)量直接相關(guān) 圖33:軟件升級速率滯后于硬件 圖34:自動駕駛算法、數(shù)據(jù)閉環(huán)、仿真工具仍待完善 圖35:蒸餾、量化、剪枝是三大模型壓縮的方式 圖36:大模型從多個維度全面推動自動駕駛前行 圖37:百度采用大模型實(shí)現(xiàn)長尾數(shù)據(jù)的挖掘 圖38:大模型助力完美實(shí)現(xiàn)兒童、異型車等場景的實(shí)時挖掘 圖39:商湯推動標(biāo)注2.0時代演進(jìn),自動標(biāo)注成為主流 圖40:商湯明眸提供強(qiáng)大的自動標(biāo)注能力 20圖41:毫末智行DriveGPT大幅降低標(biāo)注成本 20圖42:感知大模型依靠半監(jiān)督的方式迭代 21圖43:通過感知大模型的蒸餾,實(shí)現(xiàn)車端遠(yuǎn)距離3D視覺感知性能提升 21圖44:大模型可賦能車端多模態(tài)模型 22圖45:大模型賦能下,車端多模態(tài)模型感知能力提升 22圖46:毫末智行DriveGPT大模型將助力自動駕駛落地 22圖47:云驥智行認(rèn)為端到端的自動駕駛算法優(yōu)勢顯著 23圖48:自動駕駛端到端大模型構(gòu)建需要海量資源 23圖49:商湯自動駕駛多模態(tài)大模型有望實(shí)現(xiàn)傳統(tǒng)自動駕駛算法無法實(shí)現(xiàn)的功能 23圖50:特斯拉自動駕駛解決方案堪稱自動駕駛界“IOS” 24圖51:第三方巨頭憑工具鏈有望構(gòu)筑自駕領(lǐng)域“安卓” 24圖52:微軟云可提供OpenAI接口服務(wù) 24圖53:微軟AirSim是強(qiáng)大的虛擬場景仿真平臺 24圖54:英偉達(dá)DriveSim可完美生成自動駕駛仿真場景 25圖55:英偉達(dá)擁有整套端到端自動駕駛解決方案 25圖56:VideoLDM可合成視頻實(shí)現(xiàn)多模式駕駛場景預(yù)測 25圖57:NeuralField-LDM可實(shí)現(xiàn)高質(zhì)量的3D場景生成 25圖58:英偉達(dá)推出Thor產(chǎn)品面向艙駕融合場景 26圖59:高通推出SnapdragonRideFlex實(shí)現(xiàn)艙駕融合 26圖60:百度致力于利用文心大模型實(shí)現(xiàn)自動駕駛感知模型增強(qiáng)和長尾數(shù)據(jù)挖掘 26 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明4/31圖61:商湯將大模型用來賦能自動駕駛感知閉環(huán)和決策閉環(huán)等環(huán)節(jié) 27圖62:地平線認(rèn)為未來自動駕駛終將走向端到端算法 27圖63:納什架構(gòu)芯片將專為大參數(shù)Transformer而設(shè)計 27表1:大模型均對應(yīng)超大規(guī)模的預(yù)訓(xùn)練數(shù)據(jù) 表2:受益公司盈利預(yù)測與估值 28 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明5/31深藍(lán)計算機(jī)打敗國際象棋大師卡斯帕羅夫成為首臺打敗國際象棋世界冠軍的電腦。2010年,谷歌宣布自動駕駛汽車計劃。2012年卷積神經(jīng)網(wǎng)絡(luò)AlexNet在大規(guī)模視覺識別挑戰(zhàn)賽中以比第二名低10.8個百世石,人類將圍棋冠軍也讓與計算機(jī),掀起人工智能新一輪熱潮。多年以來,像計算器超越人類的計算能力一樣,人工智能在越來越多領(lǐng)域超越人類,并被應(yīng)用到千行百業(yè),未來將繼續(xù)在更多的領(lǐng)域嶄露頭角,為人類賦能。請務(wù)必參閱正文后面的信息披露和法律聲明6/31世,作為一種應(yīng)用在對話場景的大語言模型,它可以通過更貼近人的方式與使用者互動,可以回答問題、承認(rèn)錯誤、挑戰(zhàn)不正確的前提、拒絕不適當(dāng)?shù)恼埱?,同時擁有驚艷的思維鏈推理能力和零樣本下處理問題能力。在理解人類意圖、精準(zhǔn)回答問題、流暢生成結(jié)果方面遠(yuǎn)超人類預(yù)期,幾乎“無所不能”,引發(fā)網(wǎng)絡(luò)熱潮。據(jù)瑞銀數(shù)據(jù),ChatGPT產(chǎn)品推出2個月后用戶數(shù)量即過億,而上一個現(xiàn)象級應(yīng)用TikTok達(dá)到提升至約32000個tokens,對應(yīng)約2.5萬單詞。性能方面1)理解/推理/多語言能全性指標(biāo)相比GPT3.5有顯著提升,對不允許和敏感內(nèi)容的錯誤反應(yīng)顯著下降。請務(wù)必參閱正文后面的信息披露和法律聲明7/31 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明8/31自然語言處理和圖像處理的領(lǐng)域主流算法。早年人工智能領(lǐng)域常見的算法包含循環(huán)卷積神經(jīng)網(wǎng)絡(luò)則以圖像識別為核心,通過卷積核進(jìn)行窗口滑動來進(jìn)行特征提取,進(jìn)而實(shí)現(xiàn)圖像識別等功能。但兩類算法均存在自身的問題,循環(huán)神經(jīng)網(wǎng)絡(luò)并行度低,計算效率受限,同時輸入的數(shù)據(jù)較為龐大時,早期的記憶容易丟失。而卷積神經(jīng)網(wǎng)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)。該算法采用編碼器解碼器(Encoder-Decoder)架構(gòu),編碼器接受輸入并將其編碼為固定長度的向量,解碼器獲取該向量并將其解碼為輸出序列。該算法早期被應(yīng)用于翻譯領(lǐng)域,相比傳統(tǒng)RNN只關(guān)注句子相鄰詞之間的關(guān)系,確定該詞在句子里更準(zhǔn)確的意義。因此Transformer擁有更優(yōu) 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明9/31Transformer算法的結(jié)合體涌現(xiàn),誕生了最初應(yīng)用在圖像識別領(lǐng)域的Vision之內(nèi),其所覆蓋的領(lǐng)域迅速泛化,涵蓋文本、圖像、語音、視頻等。構(gòu)成,而單獨(dú)基于編碼器或者解碼器均可構(gòu)建大語言模型,因此業(yè)內(nèi)形成三類大?!巴晷翁羁铡笔降念A(yù)訓(xùn)練,再根據(jù)所需的應(yīng)用領(lǐng)域用少量標(biāo)注過的數(shù)據(jù)進(jìn)行方式進(jìn)行預(yù)訓(xùn)練,之后通過指令微調(diào)等實(shí)現(xiàn)特定領(lǐng)域功能的激發(fā)。此外也有采用值得注意的是當(dāng)GPT3推出后,大量基于Deco的大模型算法構(gòu)建方式。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明10/31于不同領(lǐng)域的模型。對比這些不同的模型,在初代的G界知識(事實(shí)性知識和常識)等能力,而這些能力幾乎都來自于大規(guī)模的預(yù)訓(xùn)練,域的能力如遵循指令來實(shí)現(xiàn)問答式的聊天機(jī)器人,或泛化到其他新的任務(wù)領(lǐng)域。而讓大模型具備了和人類“對齊”的能力,即給予提問者詳實(shí)、公正的回應(yīng),拒絕不當(dāng)?shù)膯栴},拒絕其知識范圍外的問題等特性。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明11/31而當(dāng)參數(shù)量上升到一定程度,模型的性能會突然躍遷,打破比例定律,實(shí)現(xiàn)質(zhì)的飛ofthought(思維鏈,即可逐步解決問題)方面會出現(xiàn)“涌現(xiàn)”現(xiàn)象。因此模型擁有較大參數(shù)量是其擁有超乎想象性能的前提。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明12/31海量數(shù)據(jù)預(yù)訓(xùn)練不可或缺。參數(shù)量龐大的大語言模型需要大量覆蓋廣泛內(nèi)容的高質(zhì)量數(shù)據(jù)。目前的語料庫包含網(wǎng)頁、書籍、對話、百科、書籍、代碼等。數(shù)據(jù)集的規(guī)模和質(zhì)量對模型的性能表現(xiàn)至關(guān)重要,大模型玩家采用獨(dú)特的數(shù)據(jù)訓(xùn)練模型以請務(wù)必參閱正文后面的信息披露和法律聲明13/31Apr-2022Nov-2022MicrosoftApr-2022--恰當(dāng)?shù)哪P臀⒄{(diào)亦尤為重要。預(yù)訓(xùn)練構(gòu)筑模型強(qiáng)大的基礎(chǔ)能力之后,恰當(dāng)?shù)哪P臀⒄{(diào)將賦予模型在特定領(lǐng)域的能力和與人類“對齊”的能力。在這里,模型調(diào)整分為三步1)采用人工標(biāo)注好的數(shù)據(jù)來訓(xùn)練模型2)通過人類對模型答案的排拒絕有害內(nèi)容??梢钥闯瞿P臀⒄{(diào)對模型最終的效果實(shí)現(xiàn)至關(guān)重要,玩家獨(dú)特的訓(xùn)練和微調(diào)方法會讓自己的模型形成獨(dú)特的性能。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明14/31領(lǐng)域。在模型構(gòu)建方面,ChatGPT等產(chǎn)品提供良好范式,玩家可基于此方式構(gòu)建自己的產(chǎn)品。同時多模態(tài)的大模型已經(jīng)成為玩家們的終極目標(biāo),而隨著圖像、視頻數(shù)據(jù)的介入,大模型的能力亦將實(shí)現(xiàn)進(jìn)一步提升。在應(yīng)用端,也呈現(xiàn)出繁榮發(fā)展的態(tài)勢,諸多玩家與大模型廠商合作以求探索新的業(yè)務(wù)和盈利模式。而隨著后期多模態(tài) 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明15/31點(diǎn)。首先,基于神經(jīng)網(wǎng)絡(luò)的算法逐步替代基于規(guī)則的算法,早年神經(jīng)網(wǎng)絡(luò)主要用于部署,每個模塊擁有獨(dú)立的優(yōu)化目標(biāo),但整體模型的效果未必達(dá)到最優(yōu),因此端到端的自動駕駛解決方案映入人們眼簾,學(xué)界和產(chǎn)業(yè)界均進(jìn)行了諸多探索。最后,我趨同,這無疑將推動包含芯片在內(nèi)的整個產(chǎn)業(yè)鏈加速發(fā)展。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明16/31長尾問題處理是自動駕駛面臨的主要挑戰(zhàn),數(shù)據(jù)驅(qū)動提供解藥算法可以覆蓋主要的行車場景,但駕駛環(huán)境紛繁復(fù)雜,仍有諸多罕見的長尾場景需要算法識別和處理,這類場景雖不常見但無法忽視,成為制約自動駕駛成熟的主要瓶頸。行業(yè)通常采用大量的數(shù)據(jù)去訓(xùn)練自動駕駛算法,以求讓自動駕駛模型成為見數(shù)據(jù)解決長尾問題。馬斯克曾經(jīng)在推特上贊同了實(shí)現(xiàn)超越人類的自動駕駛能力至少需要100億公里駕駛數(shù)據(jù)的說法。國內(nèi)毫末智行將數(shù)據(jù)作為“自動駕駛能力函數(shù)”?;辽僖龅饺祟愃緳C(jī)的安全水平,最好比人類司機(jī)水平高一個數(shù)量級,因此需要至少千億公里的測試,解決百萬長尾問題。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明17/31展迅猛,硬件預(yù)埋軟件持續(xù)迭代的風(fēng)潮下,車載算力急劇增長快速普及,但軟件端功能進(jìn)化滯后于算力。軟件端算法、數(shù)據(jù)閉環(huán)、仿真系統(tǒng)均有待完善。算法領(lǐng)域感知、預(yù)測、決策、規(guī)劃模型都在不斷升級演進(jìn),精度、可靠性均有提升空間。數(shù)據(jù)閉環(huán)系統(tǒng)方面,伴隨有關(guān)車型量產(chǎn),數(shù)據(jù)的挖掘、標(biāo)注和處理工作量龐大,數(shù)據(jù)閉環(huán)系統(tǒng)自動化高效運(yùn)行決定模型能否由數(shù)據(jù)驅(qū)動持續(xù)迭代。仿真環(huán)節(jié),理論上優(yōu)質(zhì)仿真可替代實(shí)車數(shù)據(jù)收集,降低算法搭建成本并提升迭代速率,但逼真的仿真環(huán)境的構(gòu)建、諸多的長尾場景的復(fù)現(xiàn)難度大。蒸餾、剪枝、量化。蒸餾類似于老師教學(xué)生,將一個大模型或多個模型集學(xué)到的知識遷移到另一個輕量級的模型上方便部署。剪枝可理解為將復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)精簡使其變得輕量化。量化則為直接降低模型中的參數(shù)精度,進(jìn)而實(shí)現(xiàn)模型輕量化。基于多種模型壓縮的方式,大模型也擁有了加速垂直行業(yè)的基礎(chǔ)。大模型可在算法、數(shù)據(jù)閉環(huán)、仿真等環(huán)節(jié)全面的認(rèn)知和推理性能,作為人工智能最先落地的應(yīng)用領(lǐng)域之一,自動駕駛有望得到全面助力。首先在數(shù)據(jù)閉環(huán)和仿真環(huán)節(jié),大模型的精準(zhǔn)識別和數(shù)據(jù)挖掘以及數(shù)據(jù)生成能力可對數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注、以及仿真場景構(gòu)建賦能。其次在模塊化的算法部署模式下,感知算法、規(guī)控算法亦可受到大模型的加強(qiáng)而實(shí)現(xiàn)感知精度和規(guī)控效果的提升。最后,端到端的感知決策一體化算法被認(rèn)為是自動駕駛算法終局,但面臨諸多難以解決的問題,比如構(gòu)建適合該算法的仿真換環(huán)境、端到端的數(shù)據(jù)標(biāo)注等,而在大模型時代以上問題或不再成為瓶頸,落地指日可待。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明18/31在自動駕駛的數(shù)據(jù)閉環(huán)體系構(gòu)建過程中存在數(shù)據(jù)挖掘和自動標(biāo)注量產(chǎn)車型數(shù)量增加,產(chǎn)生的數(shù)據(jù)量呈現(xiàn)指數(shù)級增長,一方面,高效的利用數(shù)據(jù)實(shí)現(xiàn)預(yù)期的訓(xùn)練效果要求系統(tǒng)具有數(shù)據(jù)挖掘、處理能力。另一方面,海量數(shù)據(jù)的標(biāo)注帶百度首先利用文字和圖像輸入編碼器預(yù)訓(xùn)練一個原始模型用來實(shí)現(xiàn)向量搜索,再利用算法將街景圖像數(shù)據(jù)進(jìn)行物體識別并定位和分割,經(jīng)過圖像編碼器,形成底庫;簡單來說就是基于街景建立一個擁有圖片和文字信息對應(yīng)的大模型。最后,面請務(wù)必參閱正文后面的信息披露和法律聲明19/31商湯科技在大模型加持下,落地數(shù)據(jù)自動標(biāo)注服務(wù)商湯明眸。公司請務(wù)必參閱正文后面的信息披露和法律聲明20/31毫末智行開發(fā)DriveGPT,并釋放云端駕駛場景識別能力。毫末智行訓(xùn)練了片中所有車道線、交通參與者(行人、自動車等)標(biāo)注出來,單幀圖像整體標(biāo)注成本降低至行業(yè)平均水平的十分之一。性能。百度將文心大模型的能力與自動駕駛感知技術(shù)結(jié)合,提升車載端側(cè)模型的感知能力。百度用半監(jiān)督方法通過用2D和3D數(shù)據(jù)訓(xùn)練出一個感知大模型。其中“半的感知性能實(shí)現(xiàn)快速提升。應(yīng)用這個大模型即可實(shí)現(xiàn)對視覺小模型、多模態(tài)模型感請務(wù)必參閱正文后面的信息披露和法律聲明21/31(1)利用大模型賦能增強(qiáng)小模型遠(yuǎn)距離3D視覺感知:一方面通過大模型對圖全面提升了多模態(tài)模型的感知效果,識別出了 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明22/31即將外部環(huán)境作為預(yù)訓(xùn)練數(shù)據(jù)輸入模型,訓(xùn)練模型預(yù)測未來情景演化的能力。人類并將模型輸出的行為進(jìn)行排序,進(jìn)行強(qiáng)化訓(xùn)練。同時在根據(jù)輸入端的提示語及毫末自動駕駛場景庫的樣本訓(xùn)練模型,讓模型學(xué)習(xí)推理關(guān)系。最終訓(xùn)練好的模型,可將完整的駕駛策略分拆為自動駕駛場景的動態(tài)識別過程,進(jìn)而實(shí)現(xiàn)可理解、可解釋的推理邏輯鏈條。毫末智行的DriveGPT大模練、場景脫困等功能,云端,大模型將開放接口提供包括智駕能力、駕駛場景識別等能力。為自動駕駛的終局會演進(jìn)成為一個超大規(guī)模的端到端自動駕駛神經(jīng)網(wǎng)絡(luò):AD-GP 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明23/31這些在模塊化構(gòu)建算法的時代難以實(shí)現(xiàn),而當(dāng)大模型誕生后,無論在車端一體化模型的構(gòu)建、還是端到端訓(xùn)練仿真數(shù)據(jù)的生成似乎都觸手可及。究其本源,大模型本質(zhì)上是對輸入信息作出反應(yīng),而自動駕駛則是這類行為中的力上限。同時自動駕駛多模態(tài)大模型可做到感知決策一體化集成,在輸出端通過環(huán)徑規(guī)劃;動機(jī)解碼器可用自然語言對推理過程進(jìn)行描述,使得自動駕駛系統(tǒng)變得更加安全可靠可解釋。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明24/31量的車隊(duì)數(shù)據(jù)形成數(shù)據(jù)壁壘,其他玩家難以復(fù)制。而大模型時代,諸多第三方科技巨頭如微軟、英偉達(dá)、百度、商湯等加入自動駕駛行列,可通過提供強(qiáng)大的大模型構(gòu)建能力以及完善的工具鏈幫助整車廠構(gòu)建自己的自動駕駛算法和數(shù)據(jù)閉環(huán)系統(tǒng),同時依靠大模型的數(shù)據(jù)生成能力彌補(bǔ)與頭部玩家在數(shù)據(jù)領(lǐng)域的差距,從而構(gòu)建自動圖50:特斯拉自動駕駛解決方案堪稱自動駕駛界“IOS”圖51:第三方巨頭憑工具鏈有望構(gòu)筑自駕領(lǐng)域“安卓”科技巨頭摩拳擦掌,微軟、英偉達(dá)爭相布局,有望加速行業(yè)發(fā)展。我們已經(jīng)看到,巨頭如微軟、英偉達(dá)在自動駕駛領(lǐng)域以及大模型領(lǐng)域都進(jìn)行了深度布局,有望微軟:自動駕駛方面,微軟通過微軟云可提供力,借助云上的PaaS和SaaS軟件可賦能各類算法和應(yīng)用開發(fā)。2021年發(fā)者將數(shù)據(jù)進(jìn)行導(dǎo)入分析,對模型進(jìn)行訓(xùn)練仿真。微軟基于虛幻引擎開發(fā)的AirSim仿真平臺在無人機(jī)仿真領(lǐng)域扮演重要角色,該平臺也同時可實(shí)現(xiàn)對無人駕駛汽車的仿真。大模型方面,微軟云推出了AzureOpenAI服務(wù),企業(yè)可獲得對大模型(含GPT、Codex、嵌入模型)的訪問權(quán)限并將其應(yīng)用于新的場景如語言、代碼、邏輯、推理、理解等,同時也允許客戶微調(diào)生成定制化的模型。而結(jié)合微軟的認(rèn)知搜索,型能力,未來或許能在自動駕駛算法、仿真領(lǐng)域擦出新的火花。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明25/31能夠提供核心模擬和渲染引擎,生成逼真的數(shù)據(jù)流,創(chuàng)建各種測試環(huán)境,模擬暴雨和暴雪等各種天氣條件,以及不同的路面和地形,還可以模擬白天不同時間的眩目強(qiáng)光以及晚上有限的視野,達(dá)到“照片級逼真且物理精確”的傳感器仿真。DriveSim還擁有完善的工具鏈支持,如神經(jīng)重建引擎(NER)可以將真實(shí)世界的數(shù)據(jù)直接帶入仿真中,開發(fā)者可在仿真環(huán)境中修改場景、添加合成對象,并應(yīng)用隨機(jī)化技術(shù),幫助企業(yè)玩家構(gòu)建自己的大模型產(chǎn)品。在2023年GTC大會上,英偉達(dá)推出AI動駕駛領(lǐng)域的不懈探索,其中一篇推出了生成式視頻模型VideoLDM,可生成最高也可以從同一個起始幀生成多個不同的事件演進(jìn)方向來訓(xùn)練算法。而另一篇文獻(xiàn)則推出了神經(jīng)場擴(kuò)散模型NeuralField-LDM,現(xiàn)有數(shù)據(jù)集中實(shí)現(xiàn)了最強(qiáng)性能,為高效實(shí)現(xiàn)自動駕駛仿真助力。行業(yè)分工加速,自動駕駛算法體系成本或迎下降。隨著大模型逐步介入自動駕駛,行業(yè)分工將進(jìn)一步明確。第三方科技巨頭的加持下,整車廠無需大規(guī)模搭建龐雜的算法、數(shù)據(jù)等整個閉環(huán)體系的團(tuán)隊(duì),即可擁有比肩全球一線水平的自動駕駛算進(jìn)一步提升,反過來推動行業(yè)進(jìn)步。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明26/31將加速芯片和傳感器迭代,傳感器方面,玩家有望能夠以類似特斯拉的形式構(gòu)建自動駕駛系統(tǒng),進(jìn)而降低成本。算力芯片方面,大模型將進(jìn)一步推升對芯片算力的需求。而我們看到在車載高算力芯片領(lǐng)域,無論英偉達(dá)、高通還是本土的地平線、黑芝麻均明確艙駕融合的芯片是未來的發(fā)展方向。這樣的趨勢將顯著推動自動駕駛系統(tǒng)降本,一方面,艙駕融合芯片通常會集成座艙、智駕甚至車身控制等域控制器功的算力可大幅縮減。大模型驅(qū)使下,行業(yè)艙駕融合產(chǎn)品上車趨勢將加速,系統(tǒng)降本投入研發(fā),起步較早,因此對于大模型在自動駕駛領(lǐng)域的應(yīng)用深有心得。最新的ApolloDay及文心一言發(fā)布會上,百度表示將在自動駕駛感知算法、圖文監(jiān)督預(yù)訓(xùn)練下的數(shù)據(jù)挖掘方案兩個方向推動大模型賦能自動駕駛,全面助力自動駕駛能力提升。同時百度亦擁有Apollo開放平臺,對自動駕駛?cè)鞒涕_發(fā)體系并與諸多開發(fā)者形成緊密的互動,未來有望深度受益本輪技術(shù)變革。 中小盤策略專題請務(wù)必參閱正文后面的信息披露和法律聲明27/31商湯利用大模型對小模型進(jìn)行知識蒸餾,同時通過自動化標(biāo)注實(shí)現(xiàn)感知和決策公司作為本土智能駕駛芯片領(lǐng)軍,對算法及大模型理解深入,有望指引公司芯片迭代以完美適應(yīng)客戶需求。地平線認(rèn)為算法終將走向端到端的形式,因此公司也的自動駕駛算法框架,該文章首次在檢測、跟蹤、預(yù)測、建圖、軌跡預(yù)測、端到端完成自動駕駛的算法,這可以讓玩家用海
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二四塔吊設(shè)備購置與銷售專項(xiàng)合同范本3篇
- 二零二四年家電銷售顧問聘用與售后服務(wù)合同3篇
- 二零二五版出租車承包合同綠色出行推廣合作2篇
- 二零二五版豪華度假酒店承包經(jīng)營合同規(guī)范范本3篇
- 二零二五版公益勞動服務(wù)基地共建與社區(qū)公共服務(wù)拓展合同3篇
- 年度營養(yǎng)型輸液競爭策略分析報告
- 年度智能兒童成長儀市場分析及競爭策略分析報告
- 2024年鋼材交易:居間代理全套合同
- 二零二五版水利工程承包居間代理服務(wù)合同2篇
- 2025年變壓器智能化升級采購及技術(shù)支持合同3篇
- 安徽省合肥市包河區(qū)2023-2024學(xué)年九年級上學(xué)期期末化學(xué)試題
- 《酸堿罐區(qū)設(shè)計規(guī)范》編制說明
- PMC主管年終總結(jié)報告
- 售樓部保安管理培訓(xùn)
- 倉儲培訓(xùn)課件模板
- 2025屆高考地理一輪復(fù)習(xí)第七講水循環(huán)與洋流自主練含解析
- GB/T 44914-2024和田玉分級
- 2024年度企業(yè)入駐跨境電商孵化基地合作協(xié)議3篇
- 《形勢與政策》課程標(biāo)準(zhǔn)
- 2023年海南省公務(wù)員錄用考試《行測》真題卷及答案解析
- 橋梁監(jiān)測監(jiān)控實(shí)施方案
評論
0/150
提交評論