人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”_第1頁
人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”_第2頁
人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”_第3頁
人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”_第4頁
人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1/16WAIC2024,國(guó)產(chǎn)AI+應(yīng)用“百花齊放”oWAIC2024舉辦,多家廠商攜大模型及AI應(yīng)用成果亮相展會(huì)2024年7月4-7日,2024世界人工智能大會(huì)(WAIC2024)舉辦。本次大會(huì)重點(diǎn)圍繞AI核心技術(shù)、智能終端、應(yīng)用賦能三大板塊,聚焦大模型、算力、機(jī)器人、自動(dòng)駕駛等領(lǐng)域,集中展示了一批“人工智能+”創(chuàng)新應(yīng)用成果。在大模型及行業(yè)應(yīng)用領(lǐng)域方面,此次包含金山辦公、科大訊飛在內(nèi)的多家上市公司,以及百川智能、智譜AI等廠商均展示了生成式AI領(lǐng)域的最新成果。我們認(rèn)為隨著底層通用模型的持續(xù)迭代,以及各廠商在細(xì)分應(yīng)用場(chǎng)景內(nèi)的持續(xù)探索,AI應(yīng)用生態(tài)有望加速構(gòu)建。o以訊飛星火、華為盤古等大模型為底座,國(guó)產(chǎn)AI+行業(yè)應(yīng)用生態(tài)日臻完善近期訊飛星火、華為盤古、商湯日日新等大模型迎來密集迭代,模型綜合能力保持持續(xù)提升態(tài)勢(shì)的同時(shí)多模態(tài)能力實(shí)現(xiàn)顯著迭代。除大廠外,本次WAIC期間,階躍星辰也發(fā)布了Step-2萬億參數(shù)語言大模型正式版,在數(shù)學(xué)、邏輯、知識(shí)等方面體感全面逼近GPT-4。國(guó)產(chǎn)AI大模型生態(tài)已滲透至醫(yī)療、教育、工業(yè)、智能駕駛等領(lǐng)域,商業(yè)空間有望加速打開。o國(guó)產(chǎn)大模型綜合能力持續(xù)提升,OpenAI禁令有望推動(dòng)國(guó)產(chǎn)AI生態(tài)加速成熟近期OpenAI宣布終止對(duì)中國(guó)提供服務(wù),未來國(guó)內(nèi)企業(yè)及個(gè)人用戶將需要更多依賴國(guó)產(chǎn)AI大模型提供的能力和服務(wù),有望推動(dòng)國(guó)產(chǎn)AI生態(tài)加速成熟。從模型綜合性能看,根據(jù)OpenCompass測(cè)評(píng)榜單,國(guó)產(chǎn)大模型持續(xù)縮小與海外GPT-4o、Claude3.5等大模型的性能差距,模型性能不斷提升的同時(shí)有望加速在各細(xì)分應(yīng)用場(chǎng)景的滲透。o建議關(guān)注標(biāo)的AI基礎(chǔ)設(shè)施:軟通動(dòng)力、海光信息、中科曙光、浪潮信息、寒武紀(jì)-U、云天勵(lì)飛;AI大模型:科大訊飛、云從科技-U、百度-SW、商湯;AI行業(yè)應(yīng)用:金山辦公、漢王科技、星環(huán)科技、拓爾思、虹軟科技、格靈深瞳、第四范式、焦點(diǎn)科技、萬興科技;o風(fēng)險(xiǎn)提示1、AI技術(shù)迭代不及預(yù)期的風(fēng)險(xiǎn);2、AI商業(yè)化產(chǎn)品發(fā)布不及預(yù)期;3、政策不確定性帶來的風(fēng)險(xiǎn);4、下游市場(chǎng)不確定性帶來的風(fēng)險(xiǎn)。2/16請(qǐng)務(wù)必閱讀正 41.1多家國(guó)產(chǎn)廠商攜大模型及行業(yè)應(yīng)用成果亮相展會(huì) 41.2OpenAI禁令加速推動(dòng)國(guó)產(chǎn)AI生態(tài),國(guó)產(chǎn)大模型性能持續(xù)提升 4 62.1訊飛星火V4.0大模型,點(diǎn)亮教育、辦公等行業(yè)生態(tài) 62.1.1科大訊飛發(fā)布星火V4.0大模型,全面對(duì)標(biāo)GPT-4Turbo 62.1.2訊飛星火大模型加速教育、醫(yī)療等領(lǐng)域的應(yīng)用落地 72.2華為發(fā)布盤古大模型5.0系列,持續(xù)賦能千行百業(yè) 2.2.1模型能力持續(xù)提升,并發(fā)布具身智能垂類大模型 2.2.2盤古5.0賦能華為小藝再次升級(jí),豐富行業(yè)應(yīng)用亮相本次WAIC 92.3商湯“日日新5o”模型亮相WAIC,多模態(tài)能力實(shí)現(xiàn)突破 2.3.1通用大模型快速迭代,首發(fā)toC可控人物視頻生成模型Vimi 2.3.2行業(yè)應(yīng)用:商湯絕影率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署 2.4階躍星辰發(fā)布萬億級(jí)MoE模型,加速構(gòu)建C端用戶生態(tài) 3/16圖表目錄圖1:訊飛星火V4.0模型核心能力對(duì)標(biāo)GPT-4Turbo 6圖2:星火V4.0模型多模態(tài)能力顯著提升 6圖3:星火醫(yī)療大模型各項(xiàng)指標(biāo)優(yōu)于GPT-4Turbo 6圖4:星火4.0大模型教育場(chǎng)景能力對(duì)標(biāo)GPT-4o 6圖5:大模型賦能企業(yè)“人工智能+”行動(dòng)的兩種方式 7圖6:星火賦能企業(yè)打造專屬大模型 7圖7:訊飛曉醫(yī)可構(gòu)建個(gè)人數(shù)字健康空間 7圖8:科大訊飛發(fā)布星火智能批閱機(jī) 7圖9:華為發(fā)布盤古5.0大模型 8圖10:盤古大模型5.0三大能力全新升級(jí) 9圖11:華為小藝能力全面升級(jí) 圖12:盤古大模型5.0重塑智能駕駛 圖14:商湯發(fā)布可控人物視頻生成模型Vimi 圖15:商湯絕影在行業(yè)率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署 圖16:商湯絕影車載端側(cè)8B多模態(tài)模型性能行業(yè)領(lǐng)先 圖17:階躍星辰發(fā)布Step-2萬億參數(shù)MoE語言大模型 表1:WAIC2024參展廠商AI大模型及應(yīng)用梳理(不完全) 4表2:OpenCompass大語言大模型評(píng)測(cè)月度榜單(2024年5月) 5表3:OpenCompass多模態(tài)大模型評(píng)測(cè)月度榜單(截止2024年6月26日) 54/16請(qǐng)務(wù)必閱讀正2024年7月4日~7月7日,2024世界人工智能大會(huì)(WAIC2024)舉辦。本次大會(huì)重點(diǎn)圍繞AI核心技術(shù)、智能終端、應(yīng)用賦能三大板塊,聚焦大模型、算力、機(jī)器人、自動(dòng)駕駛等領(lǐng)域,集中展示了一批“人工智能+”創(chuàng)新應(yīng)用成果。在大模型及行業(yè)應(yīng)用領(lǐng)域方面,此次包含金山辦公、科大訊飛在內(nèi)的多家上市公司,以及百川智能、智譜AI等廠商均展示了生成式AI領(lǐng)域的最新成果。我們認(rèn)為隨著底層通用模型的持續(xù)迭代,以及各廠商在細(xì)分應(yīng)用場(chǎng)景內(nèi)的持續(xù)探索,AI應(yīng)用生態(tài)有望加速構(gòu)建。金山辦公WPSAI2.0————————資料來源:中新網(wǎng)、東方財(cái)富、飛象網(wǎng)、金融界、新浪財(cái)經(jīng)近期OpenAI宣布終止對(duì)中國(guó)提供服務(wù),有望加速國(guó)產(chǎn)AI生態(tài)構(gòu)建。6月25日凌晨,多個(gè)用戶收到OpenAI通知,自今年7月9日起,OpenAI將開始阻止來自非支持國(guó)家和地區(qū)的API(應(yīng)用程序接口)服務(wù)。目前OpenAI共支持161個(gè)國(guó)家和地區(qū),不包括中國(guó)內(nèi)地和中國(guó)香港。OpenAI向中國(guó)API用戶表示,將采取措施,以阻止來自不再支持的國(guó)家和地區(qū)名單上的地區(qū)的API流量。國(guó)產(chǎn)大模型性能持續(xù)提升,多模態(tài)能力不斷迭代下有望加速滲透各類應(yīng)用場(chǎng)景。根據(jù)OpenCompass2.0大語言模型月度榜單(2024年5月)數(shù)據(jù),目前國(guó)內(nèi)外大語言模型在綜合能力方面,OpenAI的GPT-4o以及GPT-4-Turbo仍處于領(lǐng)先地位,而國(guó)產(chǎn)大模型中豆包Pro-4k、千問Max、智譜GLM-4等模型均進(jìn)入榜單前十名,在大語言模型能力方面國(guó)內(nèi)廠商正在不斷縮小與海外頭部廠商的差距。5/16在多模態(tài)能力方面,目前OpenAI的GPT-4o以及Anthropic的Claude3.5模型能力優(yōu)勢(shì)明顯,但是根據(jù)OpenCompass的月度測(cè)評(píng)榜單,近期國(guó)產(chǎn)大模型多模態(tài)能力持續(xù)提升,目前國(guó)內(nèi)云從科技、智譜AI、階躍星辰等廠商的多模態(tài)大模型也已進(jìn)入前十序列,國(guó)產(chǎn)多模態(tài)模型保持快速迭代態(tài)勢(shì)。結(jié)合本次WAIC各參展廠商的大模型及商業(yè)化產(chǎn)品,以及國(guó)產(chǎn)底層大模型能力的持續(xù)迭代,我們認(rèn)為未來國(guó)產(chǎn)AI+行業(yè)應(yīng)用有望加速迎來“百花齊放”局面,商業(yè)空間有望加速打開。6/162.1.1科大訊飛發(fā)布星火V4.0大模型,全面對(duì)標(biāo)GPT-4Turbo2024年6月27日,科大訊飛正式發(fā)布基于全國(guó)產(chǎn)算力平臺(tái)訓(xùn)練的星火大模型V4.0。星火V4.0大模型在文本生成、語言理解、知識(shí)問答等領(lǐng)域核心能力實(shí)現(xiàn)全面升級(jí),除代碼和多模態(tài)能力外,其它領(lǐng)域測(cè)評(píng)結(jié)果已全面對(duì)標(biāo)GPT-4Turbo。星火V4.0模型多模態(tài)能力顯著提升。在復(fù)雜版面的全要素解析、融合篇章語義的文字識(shí)別、專業(yè)領(lǐng)域的符號(hào)識(shí)別等能力上,星火大模型V4.0表現(xiàn)持續(xù)升級(jí)并且在測(cè)評(píng)中超過5月份發(fā)布的GPT-4o模型。星火4.0賦能行業(yè)大模型加速迭代,醫(yī)療、教育垂類模型能力再次升級(jí)。隨著訊飛星火4.0大模型的發(fā)布,星火醫(yī)療大模型也再次升級(jí),目前在醫(yī)學(xué)相關(guān)的知識(shí)問答、復(fù)雜的語義理解、專業(yè)文書生成,還是診斷治療以及多輪對(duì)話的各項(xiàng)指標(biāo)上,已實(shí)現(xiàn)對(duì)最新的GPT-4Turbo模型的超越;而在教育領(lǐng)域,星火大模型面向教育復(fù)雜場(chǎng)景的圖文識(shí)別效果進(jìn)一步提升,在語文、數(shù)學(xué)、英語以及OCR識(shí)別方面均實(shí)現(xiàn)與GPT-4o的對(duì)標(biāo),7/16訊飛發(fā)布智能體平臺(tái),賦能企業(yè)構(gòu)建崗位專屬助手??拼笥嶏w發(fā)布的星火企業(yè)智能平臺(tái),并推出了首批32個(gè)企業(yè)從生產(chǎn)、科研、辦公到管理中特別需要的相關(guān)智能體,如商機(jī)、銷售、客服、科技情報(bào)以及編程等。訊飛星火的代碼智能體可在代碼生成、架構(gòu)設(shè)計(jì)、問答、測(cè)試、數(shù)據(jù)庫優(yōu)化以及審核6個(gè)場(chǎng)景上賦能企業(yè)用戶。代碼在科大訊飛內(nèi)部的采納率從去年10月份的30%,增長(zhǎng)至目前的52%,單元測(cè)試行覆蓋率從30%提到50%。2.1.2訊飛星火大模型加速教育、醫(yī)療等領(lǐng)域的應(yīng)用落地AI大模型醫(yī)療、教育領(lǐng)域垂類應(yīng)用加速滲透。在醫(yī)療領(lǐng)域,公司于去年10月推出的個(gè)人健康助手訊飛曉醫(yī)APP現(xiàn)在已經(jīng)累計(jì)下載1200萬次,用戶好評(píng)率達(dá)98.8%。目前訊飛曉醫(yī)APP可以幫助用戶自主診斷1600種常見疾病,可識(shí)別2800種以上的常見藥品,理解26萬個(gè)藥品相互作用,并且能夠理解和分析6000種以上常見的檢驗(yàn)報(bào)告。目前訊飛曉醫(yī)APP可實(shí)現(xiàn)將個(gè)性化的電子病歷檢查報(bào)告以及過去問診情況,在個(gè)人健康空間保存,在看病、用藥、檢查時(shí)給予用戶更深入具體的幫助。在教育領(lǐng)域,星火滲透至教師批改閱卷場(chǎng)景,AI+教育產(chǎn)品應(yīng)用矩陣進(jìn)一步完善。伴隨著星火大模型V4.0的發(fā)布,公司推出了星火智能批閱機(jī)的軟硬件一體化解決方案,可進(jìn)行自動(dòng)批改,并通過批改自動(dòng)分析全班學(xué)習(xí)情況,給出分析。根據(jù)公司給出的數(shù)據(jù),星火智能8/16批閱機(jī)可將原來90分鐘的作業(yè)批改時(shí)間縮短至5分鐘,60分鐘的學(xué)情統(tǒng)計(jì)時(shí)間可以縮短至1分鐘,并且學(xué)生的錯(cuò)題解決率從50%提到73%。2.2.1模型能力持續(xù)提升,并發(fā)布具身智能垂類大模型2024年6月21日,在華為開發(fā)者大會(huì)2024(HDC2024)上,華為正式發(fā)布盤古大模型5.0版本。盤古大模型5.0系列在全系列、多模態(tài)、強(qiáng)思維三個(gè)方面進(jìn)行了全面升級(jí),標(biāo)志著華為云在人工智能領(lǐng)域再次邁出了堅(jiān)實(shí)的步伐。在模型全系列方面,盤古大模型5.0包括十億級(jí)、百億級(jí)、千億級(jí)、萬億級(jí)等不同參數(shù)規(guī)模,提供盤古自然語言大模型、多模態(tài)大模型、視覺大模型、預(yù)測(cè)大模型、科學(xué)計(jì)算大模型等。其中:(1)盤古E系列:10億參數(shù)級(jí)別,可支撐手機(jī)、PC等端側(cè)的智能應(yīng)用;(2)盤古P系列:100億參數(shù)級(jí)別,適用于低時(shí)延、低成本的推理場(chǎng)景;(3)盤古U系列:有1350億參數(shù)和2300億參數(shù)兩種,適用于處理復(fù)雜任務(wù),可以成為企業(yè)通用大模型的底座;(4)盤古S系列:萬億級(jí)參數(shù),可以處理跨領(lǐng)域多任務(wù),夠能幫助企業(yè)更好地在全場(chǎng)景應(yīng)用AI技術(shù)。華為云發(fā)布具身智能大模型,推動(dòng)人形機(jī)器人技術(shù)再升級(jí)。華為云在HDC2024上正式推出了盤古具身智能大模型,會(huì)上搭載盤古能力的人形機(jī)器人也同步亮相。盤古大模型能夠讓機(jī)器人完成10步以上的復(fù)雜任務(wù)規(guī)劃,并且在任務(wù)執(zhí)行中實(shí)現(xiàn)多場(chǎng)景泛化和多任務(wù)處理。同時(shí)盤古大模型還能生成機(jī)器人需要的訓(xùn)練視頻,讓機(jī)器人更快地學(xué)習(xí)各種復(fù)雜場(chǎng)景。大模型的多模態(tài)能力以及思維能力的快速提升,使機(jī)器人能夠模擬人類常識(shí)進(jìn)行邏輯推理,并在現(xiàn)實(shí)環(huán)境中高效精準(zhǔn)地執(zhí)行任務(wù),從而有效解決了復(fù)雜環(huán)境感知與物理空間認(rèn)知的難題。通過集成多場(chǎng)景泛化和多任務(wù)處理能力,盤古大模型有望賦予機(jī)器人適應(yīng)性和靈活性,靈活面對(duì)工業(yè)環(huán)境還是家庭生活場(chǎng)景。9/162.2.2盤古5.0賦能華為小藝再次升級(jí),豐富行業(yè)應(yīng)用亮相本次WAIC在盤古大模型5.0加持下,華為推出了全新的小藝助手并且更加智能化,更加流暢,同時(shí)也變得更加地人性化。華為小藝能夠根據(jù)外面的天氣情況制定用戶的個(gè)人出行方式,而且能通過不斷地學(xué)習(xí),變得更加適合用戶使用習(xí)慣。除此之外,華為云盤古大模型過去一年中,已在30多個(gè)行業(yè)、400多個(gè)場(chǎng)景中落地,覆蓋到政務(wù)、金融、制造、醫(yī)藥研發(fā)、煤礦、鋼鐵等多個(gè)細(xì)分行業(yè)。10/16盤古大模型5.0亮相WAIC2024,持續(xù)重塑千行萬業(yè)。在自動(dòng)駕駛領(lǐng)域,盤古大模型5.0通過創(chuàng)新的可控時(shí)空生成技術(shù),結(jié)合場(chǎng)景視頻生成、4DBEV視頻生成、自動(dòng)駕駛仿真庫及路網(wǎng)信息,能更好地理解物理規(guī)律,大規(guī)模生成和實(shí)際場(chǎng)景相一致的駕駛視頻數(shù)據(jù),還可以靈活增加控制條件,生成不同路況、不同光照、不同天氣的訓(xùn)練視頻數(shù)據(jù),加速自動(dòng)駕駛技術(shù)的快速成熟。在鋼鐵領(lǐng)域,盤古大模型能夠?qū)彳埳a(chǎn)線的最優(yōu)參數(shù)進(jìn)行預(yù)測(cè)。在切換鋼板生產(chǎn)規(guī)格時(shí),操作工人往往需要對(duì)模型參數(shù)進(jìn)行調(diào)整優(yōu)化,盤古大模型可實(shí)現(xiàn)此過程耗時(shí)由一周時(shí)間縮短至僅4小時(shí),提效顯著。在實(shí)際生產(chǎn)中,在上海寶武鋼鐵熱軋生產(chǎn)線中,基于盤古大模型,精軋寬展預(yù)測(cè)精度較傳統(tǒng)模型提高5%以上,鋼板成材率提升0.5%,預(yù)計(jì)每年可以多產(chǎn)鋼板2萬余噸,年收益達(dá)9000余萬元。未來盤古大模型還將應(yīng)用于高爐場(chǎng)景,對(duì)爐溫、鐵水溫度等爐況進(jìn)行仿真,從而輔助高爐精準(zhǔn)控制,降低能源成本。在鐵路領(lǐng)域,高鐵巡檢機(jī)器人搭載盤古大模型后,可精準(zhǔn)識(shí)別動(dòng)車零部件的變形、異物、松動(dòng)、丟失等3.2萬個(gè)故障檢測(cè)項(xiàng)點(diǎn),覆蓋8大類、350多種復(fù)雜故障,不僅提升高鐵運(yùn)營(yíng)效率、降低巡檢成本,而且減少凌晨時(shí)段人工巡檢的作業(yè)負(fù)擔(dān)。在媒體內(nèi)容生產(chǎn)和應(yīng)用領(lǐng)域,盤古大模型能夠?qū)?shí)拍視頻快速轉(zhuǎn)換成特定風(fēng)格的動(dòng)漫,并保持角色樣貌特征前后一致,舞蹈、武打等大運(yùn)動(dòng)軌跡也能確保合理一致的視覺效果,制作周期從月級(jí)縮短到天級(jí),大大提升制作效率,作品一次拍攝多元化制作,實(shí)現(xiàn)價(jià)值最大化。2.3.1通用大模型快速迭代,首發(fā)toC可控人物視頻生成模型Vimi商湯于WAIC2024發(fā)布“日日新5o”模型,交互體驗(yàn)對(duì)標(biāo)GPT-4o,有望實(shí)現(xiàn)全新AI交互模式。商湯通過整合跨模態(tài)信息,基于聲音、文本、圖像和視頻等多種形式,國(guó)內(nèi)首個(gè)所見即所得模型“日日新5o”帶來一種全新的AI交互模式,即實(shí)時(shí)的流式多模態(tài)交互。商湯底層通用基礎(chǔ)大模型迭代至“日日新5.5”,基礎(chǔ)大模型綜合性能較“日日新5.0”平均提升30%,在數(shù)學(xué)推理、英文能力和指令跟隨等能力明顯增強(qiáng),交互效果和多項(xiàng)核心指標(biāo)實(shí)現(xiàn)對(duì)標(biāo)GPT-4o?!叭杖招?.5”采用混合端云協(xié)同專家架構(gòu),最大限度發(fā)揮云邊端協(xié)同,降低推理成本,模型訓(xùn)練基于超過10TBtokens高質(zhì)量訓(xùn)練數(shù)據(jù),包括大量合成的思維鏈數(shù)據(jù),提升推理思維能力。商湯加速推進(jìn)B端用戶生態(tài)構(gòu)建。為了讓更多企業(yè)用戶低門檻接入并使用“日日新”大模型體系的強(qiáng)大能力,商湯于近期推出了“大模型0元Go”計(jì)劃。凡是“日日新”的新注冊(cè)用戶,都可獲得涉及調(diào)用、遷徙、訓(xùn)練等多項(xiàng)免費(fèi)服務(wù)大禮包。同時(shí),商湯還將免費(fèi)贈(zèng)送5000萬Tokens包,并且派出專屬搬家顧問,幫助OpenAI用戶實(shí)現(xiàn)零服務(wù)成本遷移。公司推出首個(gè)面向C端用戶的可控人物視頻生成大模型Vimi。Vimi基于商湯日日新大模型的能力,僅通過一張任意風(fēng)格的照片就能生成和目標(biāo)動(dòng)作一致的人物類視頻,并支持多種驅(qū)動(dòng)方式,可通過已有人物視頻、動(dòng)畫、聲音、文字等多種元素進(jìn)行驅(qū)動(dòng)。據(jù)商湯介紹,與圖片表情控制類技術(shù)只能控制頭部表情動(dòng)作不同,Vimi不但可以實(shí)現(xiàn)精準(zhǔn)的人物表情控制,還可實(shí)現(xiàn)在半身區(qū)域內(nèi)控制照片中人物的自然肢體變化,并自動(dòng)生成與人物相符的頭發(fā)、服飾及背景變化。同時(shí)光影變化也能做到合理生成,讓人物動(dòng)作和視覺效果流暢自然,畫面和諧唯美。更重要的是,Vimi具備極強(qiáng)的穩(wěn)定性,可穩(wěn)定生成長(zhǎng)達(dá)112/16分鐘的單鏡頭人物類視頻,畫面效果不會(huì)隨著時(shí)間的變化而劣化或失真,真正滿足娛樂互動(dòng)等需要長(zhǎng)時(shí)間穩(wěn)定視頻生成需求。2.3.2行業(yè)應(yīng)用:商湯絕影率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署本屆WAIC大會(huì)上,商湯發(fā)布基于全新發(fā)布的商湯“日日新5.5”原生多模態(tài)大模型打造的智能駕駛和智能座艙產(chǎn)品。商湯絕影展示了可解釋、可交互的自動(dòng)駕駛大模型DriveAGI,同時(shí)還發(fā)布了行業(yè)首個(gè)車載生成式交互界面“隨心界面”(FlexInterface)、“隨意操控”(AgentFlow)等車載AIAgent應(yīng)用。在本屆WAIC上,商湯絕影在行業(yè)率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署,并對(duì)外展示了在3個(gè)不同算力平臺(tái)上運(yùn)行2.1B或8B端側(cè)多模態(tài)大模型的適配能力。商湯絕影車載端側(cè)8B多模態(tài)模型可以實(shí)現(xiàn)首包延遲低至300毫秒以內(nèi),推理速度達(dá)到40Tokens/秒。而商湯絕影自研的首個(gè)應(yīng)用于駕駛決策規(guī)劃的智駕大模型——DriveAGI,增強(qiáng)了端到端系統(tǒng)的可解釋性,不僅讓車輛能夠更像人一樣理解復(fù)雜的現(xiàn)實(shí)世界,洞察各類交通參與者的行為動(dòng)機(jī),快速學(xué)習(xí)各種交通規(guī)則,掌握瞬息萬變的道路信息,還能向用戶解釋駕駛決策的推理過程。目前,商湯絕影DriveAGI智駕大模型能在無限寬標(biāo)識(shí)的道路上,安全順利穿過兩個(gè)石墩形成的狹窄通道;它還能準(zhǔn)確辨識(shí)并理解包括公交車道、潮汐車道及施工車道等各類交通標(biāo)識(shí),并自主進(jìn)行變道或規(guī)避,甚至當(dāng)后方有救護(hù)車接近時(shí),DriveAGI會(huì)進(jìn)行思考推理,最終進(jìn)行及時(shí)變道避讓。13/16在本屆WAIC上,商湯絕影正式發(fā)布行業(yè)首個(gè)生成式交互界面產(chǎn)品“隨心界面”徹底改變用戶與車載系統(tǒng)的交互方式。FlexInterface在大模型解析用戶需求的基礎(chǔ)上,結(jié)合設(shè)計(jì)系統(tǒng)的框架和范式,實(shí)現(xiàn)高度動(dòng)態(tài)和個(gè)性化的界面生成。無論是天氣、時(shí)間、節(jié)日、紀(jì)念日,還是周圍環(huán)境變化,F(xiàn)lexInterface均能自動(dòng)變換界面風(fēng)格,提供最佳用戶體驗(yàn)。AgentFlow通過大模型的推理能力,模擬人類點(diǎn)擊操作,實(shí)現(xiàn)對(duì)APP和網(wǎng)站的直接操作。用戶只需使用自然語言,就能讓AI自主選擇多個(gè)工具完成復(fù)雜任務(wù),無需主機(jī)廠進(jìn)行額外的研發(fā)適配。這種能力不僅提升了操作的便捷性,還極大地?cái)U(kuò)展了車載系統(tǒng)的功能范圍。在現(xiàn)場(chǎng)演示中,用戶通過FlexInterface生成了一個(gè)“歐洲杯”風(fēng)格的主題,大模型自動(dòng)生成具備歐洲杯元素的中控屏幕桌面和圖標(biāo),同時(shí),用戶還能通過AgentFlow隨時(shí)播放歐洲杯或足球相關(guān)的音樂,展示了這些創(chuàng)新產(chǎn)品在實(shí)際應(yīng)用中的強(qiáng)大能力和靈活性。本次WAIC2024上,階躍星辰發(fā)布三款Step系列通用大模型產(chǎn)品,分別是Step-2萬億參數(shù)語言大模型正式版、Step-1.5V多模態(tài)大模型、Step-1X圖像生成大模型。公司最新發(fā)布的Step-2萬億參數(shù)語言大模型正式版,采用了創(chuàng)新的MoE混合專家模型架構(gòu)。同時(shí),基于階躍星辰行業(yè)領(lǐng)先的系統(tǒng)能力,Step-2大幅提升了訓(xùn)練效率,在數(shù)學(xué)、邏輯、編程、知識(shí)、創(chuàng)作、多輪對(duì)話等方面體感全面逼近GPT-4,企業(yè)和開發(fā)者可以通過階躍星辰開放平臺(tái)申請(qǐng)?bào)w驗(yàn)。14/16新升級(jí)的Step-1.5V千億參數(shù)多模態(tài)大模型,在圖像感知和理解能力上全面提升,并具備出色的視頻理解能力。模型能準(zhǔn)確地識(shí)別視頻中的物體、人物和環(huán)境,并理解視頻的整體氛圍與人物情緒。在Step-2萬億參數(shù)大模型的加持下,Step-1.5V推理能力大幅增強(qiáng),能根據(jù)圖像內(nèi)容進(jìn)行解答數(shù)學(xué)題、編寫代碼、創(chuàng)作詩歌等高級(jí)推理任務(wù),體現(xiàn)出公司在多模態(tài)大模型領(lǐng)域取得了突破性進(jìn)展。公司新發(fā)布Step-1X圖像生成大模型,則代表了階躍星辰在推動(dòng)多模態(tài)理解和生成統(tǒng)一的技術(shù)路線上取得重要進(jìn)展。Step-1X模型采用全鏈路自研的DiT(DiffusionModelswithtransformer)模型架構(gòu),支持600M、2B、8B三種不同的參數(shù)量,能夠滿足不同場(chǎng)景的需求。Step-1X具備更加強(qiáng)大的語義對(duì)齊和指令跟隨能力,還針對(duì)中國(guó)元素和文化進(jìn)行了深度優(yōu)化使其更具中國(guó)風(fēng)格。公司加快垂類行業(yè)生態(tài)建設(shè),在金融行業(yè)領(lǐng)域與券商形成深度合作。近日階躍星辰智能科技有限公司、上海財(cái)躍星辰智能科技有限公司和國(guó)泰君安證券,簽署三方戰(zhàn)略合作協(xié)議,將在拓展智能化應(yīng)用場(chǎng)景、豐富金融語料數(shù)據(jù)、構(gòu)建國(guó)產(chǎn)信創(chuàng)算力集群、互聯(lián)網(wǎng)業(yè)務(wù)運(yùn)營(yíng)、產(chǎn)業(yè)投融資、財(cái)富管理和產(chǎn)業(yè)研究等十大領(lǐng)域展開深度合作,三方將聯(lián)手在模型、信創(chuàng)算力、金融語料、應(yīng)用場(chǎng)景等方面努力推動(dòng)大模型應(yīng)用加速落地。另外,公司與國(guó)泰君安共同研發(fā)的君弘靈犀大模型已經(jīng)上線,作為業(yè)內(nèi)首家千億級(jí)參數(shù)多模態(tài)證券垂直類大模型,其應(yīng)用場(chǎng)景涵蓋君弘智投、綜合診斷、智能選股、熱點(diǎn)資訊、多模態(tài)處理等十大功能,致力于解決傳統(tǒng)模型在語義理解、多輪對(duì)話和答案豐富性上存在的運(yùn)營(yíng)成本高、投資服務(wù)匹配度低等問題。15/16AI基礎(chǔ)設(shè)施:軟通動(dòng)力、海光信息、中科曙光、浪潮信息、寒武紀(jì)-U、云天勵(lì)飛;AI大模型:科大訊飛、云從科技-U、百度-SW、商湯;AI行業(yè)應(yīng)用:金山辦公、漢王科技、星環(huán)科技、拓爾思、虹軟科技、格靈深瞳、第四范式、焦點(diǎn)科技、萬興科技;1、AI技術(shù)迭代不及預(yù)期的風(fēng)險(xiǎn);2、AI商業(yè)化產(chǎn)品發(fā)布不及預(yù)期;3、政策不確定性帶來的風(fēng)險(xiǎn);4、下游市場(chǎng)不確定性帶來的風(fēng)險(xiǎn)。16/16股票投資評(píng)級(jí)說明以報(bào)告日后的6個(gè)月內(nèi),證券相對(duì)于滬深300指數(shù)的漲跌幅為標(biāo)準(zhǔn),定義如下:1.買入:相對(duì)于滬深300指數(shù)表現(xiàn)+20%以上;2.增持:相對(duì)于滬深300指數(shù)表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論