人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”

上傳人：策*** IP屬地：山西上傳時(shí)間：2024-07-11 格式：DOCX 頁數(shù)：25 大?。?15.88KB 積分：19.9 舉報(bào) 版權(quán)申訴

人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”_第2頁

人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”_第3頁

人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”_第4頁

人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”_第5頁

已閱讀5頁，還剩20頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1/16WAIC2024，國(guó)產(chǎn)AI+應(yīng)用“百花齊放”oWAIC2024舉辦，多家廠商攜大模型及AI應(yīng)用成果亮相展會(huì)2024年7月4-7日，2024世界人工智能大會(huì)（WAIC2024）舉辦。本次大會(huì)重點(diǎn)圍繞AI核心技術(shù)、智能終端、應(yīng)用賦能三大板塊，聚焦大模型、算力、機(jī)器人、自動(dòng)駕駛等領(lǐng)域，集中展示了一批“人工智能+”創(chuàng)新應(yīng)用成果。在大模型及行業(yè)應(yīng)用領(lǐng)域方面，此次包含金山辦公、科大訊飛在內(nèi)的多家上市公司，以及百川智能、智譜AI等廠商均展示了生成式AI領(lǐng)域的最新成果。我們認(rèn)為隨著底層通用模型的持續(xù)迭代，以及各廠商在細(xì)分應(yīng)用場(chǎng)景內(nèi)的持續(xù)探索，AI應(yīng)用生態(tài)有望加速構(gòu)建。o以訊飛星火、華為盤古等大模型為底座，國(guó)產(chǎn)AI+行業(yè)應(yīng)用生態(tài)日臻完善近期訊飛星火、華為盤古、商湯日日新等大模型迎來密集迭代，模型綜合能力保持持續(xù)提升態(tài)勢(shì)的同時(shí)多模態(tài)能力實(shí)現(xiàn)顯著迭代。除大廠外，本次WAIC期間，階躍星辰也發(fā)布了Step-2萬億參數(shù)語言大模型正式版，在數(shù)學(xué)、邏輯、知識(shí)等方面體感全面逼近GPT-4。國(guó)產(chǎn)AI大模型生態(tài)已滲透至醫(yī)療、教育、工業(yè)、智能駕駛等領(lǐng)域，商業(yè)空間有望加速打開。o國(guó)產(chǎn)大模型綜合能力持續(xù)提升，OpenAI禁令有望推動(dòng)國(guó)產(chǎn)AI生態(tài)加速成熟近期OpenAI宣布終止對(duì)中國(guó)提供服務(wù)，未來國(guó)內(nèi)企業(yè)及個(gè)人用戶將需要更多依賴國(guó)產(chǎn)AI大模型提供的能力和服務(wù)，有望推動(dòng)國(guó)產(chǎn)AI生態(tài)加速成熟。從模型綜合性能看，根據(jù)OpenCompass測(cè)評(píng)榜單，國(guó)產(chǎn)大模型持續(xù)縮小與海外GPT-4o、Claude3.5等大模型的性能差距，模型性能不斷提升的同時(shí)有望加速在各細(xì)分應(yīng)用場(chǎng)景的滲透。o建議關(guān)注標(biāo)的AI基礎(chǔ)設(shè)施：軟通動(dòng)力、海光信息、中科曙光、浪潮信息、寒武紀(jì)-U、云天勵(lì)飛；AI大模型：科大訊飛、云從科技-U、百度-SW、商湯；AI行業(yè)應(yīng)用：金山辦公、漢王科技、星環(huán)科技、拓爾思、虹軟科技、格靈深瞳、第四范式、焦點(diǎn)科技、萬興科技；o風(fēng)險(xiǎn)提示1、AI技術(shù)迭代不及預(yù)期的風(fēng)險(xiǎn)；2、AI商業(yè)化產(chǎn)品發(fā)布不及預(yù)期；3、政策不確定性帶來的風(fēng)險(xiǎn)；4、下游市場(chǎng)不確定性帶來的風(fēng)險(xiǎn)。2/16請(qǐng)務(wù)必閱讀正 41.1多家國(guó)產(chǎn)廠商攜大模型及行業(yè)應(yīng)用成果亮相展會(huì) 41.2OpenAI禁令加速推動(dòng)國(guó)產(chǎn)AI生態(tài)，國(guó)產(chǎn)大模型性能持續(xù)提升 4 62.1訊飛星火V4.0大模型，點(diǎn)亮教育、辦公等行業(yè)生態(tài) 62.1.1科大訊飛發(fā)布星火V4.0大模型，全面對(duì)標(biāo)GPT-4Turbo 62.1.2訊飛星火大模型加速教育、醫(yī)療等領(lǐng)域的應(yīng)用落地 72.2華為發(fā)布盤古大模型5.0系列，持續(xù)賦能千行百業(yè) 2.2.1模型能力持續(xù)提升，并發(fā)布具身智能垂類大模型 2.2.2盤古5.0賦能華為小藝再次升級(jí)，豐富行業(yè)應(yīng)用亮相本次WAIC 92.3商湯“日日新5o”模型亮相WAIC，多模態(tài)能力實(shí)現(xiàn)突破 2.3.1通用大模型快速迭代，首發(fā)toC可控人物視頻生成模型Vimi 2.3.2行業(yè)應(yīng)用：商湯絕影率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署 2.4階躍星辰發(fā)布萬億級(jí)MoE模型，加速構(gòu)建C端用戶生態(tài) 3/16圖表目錄圖1：訊飛星火V4.0模型核心能力對(duì)標(biāo)GPT-4Turbo 6圖2：星火V4.0模型多模態(tài)能力顯著提升 6圖3：星火醫(yī)療大模型各項(xiàng)指標(biāo)優(yōu)于GPT-4Turbo 6圖4：星火4.0大模型教育場(chǎng)景能力對(duì)標(biāo)GPT-4o 6圖5：大模型賦能企業(yè)“人工智能+”行動(dòng)的兩種方式 7圖6：星火賦能企業(yè)打造專屬大模型 7圖7：訊飛曉醫(yī)可構(gòu)建個(gè)人數(shù)字健康空間 7圖8：科大訊飛發(fā)布星火智能批閱機(jī) 7圖9：華為發(fā)布盤古5.0大模型 8圖10：盤古大模型5.0三大能力全新升級(jí) 9圖11：華為小藝能力全面升級(jí) 圖12：盤古大模型5.0重塑智能駕駛圖14：商湯發(fā)布可控人物視頻生成模型Vimi 圖15：商湯絕影在行業(yè)率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署圖16：商湯絕影車載端側(cè)8B多模態(tài)模型性能行業(yè)領(lǐng)先圖17：階躍星辰發(fā)布Step-2萬億參數(shù)MoE語言大模型表1：WAIC2024參展廠商AI大模型及應(yīng)用梳理（不完全） 4表2：OpenCompass大語言大模型評(píng)測(cè)月度榜單（2024年5月） 5表3：OpenCompass多模態(tài)大模型評(píng)測(cè)月度榜單（截止2024年6月26日） 54/16請(qǐng)務(wù)必閱讀正2024年7月4日～7月7日，2024世界人工智能大會(huì)（WAIC2024）舉辦。本次大會(huì)重點(diǎn)圍繞AI核心技術(shù)、智能終端、應(yīng)用賦能三大板塊，聚焦大模型、算力、機(jī)器人、自動(dòng)駕駛等領(lǐng)域，集中展示了一批“人工智能+”創(chuàng)新應(yīng)用成果。在大模型及行業(yè)應(yīng)用領(lǐng)域方面，此次包含金山辦公、科大訊飛在內(nèi)的多家上市公司，以及百川智能、智譜AI等廠商均展示了生成式AI領(lǐng)域的最新成果。我們認(rèn)為隨著底層通用模型的持續(xù)迭代，以及各廠商在細(xì)分應(yīng)用場(chǎng)景內(nèi)的持續(xù)探索，AI應(yīng)用生態(tài)有望加速構(gòu)建。金山辦公WPSAI2.0————————資料來源：中新網(wǎng)、東方財(cái)富、飛象網(wǎng)、金融界、新浪財(cái)經(jīng)近期OpenAI宣布終止對(duì)中國(guó)提供服務(wù)，有望加速國(guó)產(chǎn)AI生態(tài)構(gòu)建。6月25日凌晨，多個(gè)用戶收到OpenAI通知，自今年7月9日起，OpenAI將開始阻止來自非支持國(guó)家和地區(qū)的API（應(yīng)用程序接口）服務(wù)。目前OpenAI共支持161個(gè)國(guó)家和地區(qū)，不包括中國(guó)內(nèi)地和中國(guó)香港。OpenAI向中國(guó)API用戶表示，將采取措施，以阻止來自不再支持的國(guó)家和地區(qū)名單上的地區(qū)的API流量。國(guó)產(chǎn)大模型性能持續(xù)提升，多模態(tài)能力不斷迭代下有望加速滲透各類應(yīng)用場(chǎng)景。根據(jù)OpenCompass2.0大語言模型月度榜單（2024年5月）數(shù)據(jù)，目前國(guó)內(nèi)外大語言模型在綜合能力方面，OpenAI的GPT-4o以及GPT-4-Turbo仍處于領(lǐng)先地位，而國(guó)產(chǎn)大模型中豆包Pro-4k、千問Max、智譜GLM-4等模型均進(jìn)入榜單前十名，在大語言模型能力方面國(guó)內(nèi)廠商正在不斷縮小與海外頭部廠商的差距。5/16在多模態(tài)能力方面，目前OpenAI的GPT-4o以及Anthropic的Claude3.5模型能力優(yōu)勢(shì)明顯，但是根據(jù)OpenCompass的月度測(cè)評(píng)榜單，近期國(guó)產(chǎn)大模型多模態(tài)能力持續(xù)提升，目前國(guó)內(nèi)云從科技、智譜AI、階躍星辰等廠商的多模態(tài)大模型也已進(jìn)入前十序列，國(guó)產(chǎn)多模態(tài)模型保持快速迭代態(tài)勢(shì)。結(jié)合本次WAIC各參展廠商的大模型及商業(yè)化產(chǎn)品，以及國(guó)產(chǎn)底層大模型能力的持續(xù)迭代，我們認(rèn)為未來國(guó)產(chǎn)AI+行業(yè)應(yīng)用有望加速迎來“百花齊放”局面，商業(yè)空間有望加速打開。6/162.1.1科大訊飛發(fā)布星火V4.0大模型，全面對(duì)標(biāo)GPT-4Turbo2024年6月27日，科大訊飛正式發(fā)布基于全國(guó)產(chǎn)算力平臺(tái)訓(xùn)練的星火大模型V4.0。星火V4.0大模型在文本生成、語言理解、知識(shí)問答等領(lǐng)域核心能力實(shí)現(xiàn)全面升級(jí)，除代碼和多模態(tài)能力外，其它領(lǐng)域測(cè)評(píng)結(jié)果已全面對(duì)標(biāo)GPT-4Turbo。星火V4.0模型多模態(tài)能力顯著提升。在復(fù)雜版面的全要素解析、融合篇章語義的文字識(shí)別、專業(yè)領(lǐng)域的符號(hào)識(shí)別等能力上，星火大模型V4.0表現(xiàn)持續(xù)升級(jí)并且在測(cè)評(píng)中超過5月份發(fā)布的GPT-4o模型。星火4.0賦能行業(yè)大模型加速迭代，醫(yī)療、教育垂類模型能力再次升級(jí)。隨著訊飛星火4.0大模型的發(fā)布，星火醫(yī)療大模型也再次升級(jí)，目前在醫(yī)學(xué)相關(guān)的知識(shí)問答、復(fù)雜的語義理解、專業(yè)文書生成，還是診斷治療以及多輪對(duì)話的各項(xiàng)指標(biāo)上，已實(shí)現(xiàn)對(duì)最新的GPT-4Turbo模型的超越；而在教育領(lǐng)域，星火大模型面向教育復(fù)雜場(chǎng)景的圖文識(shí)別效果進(jìn)一步提升，在語文、數(shù)學(xué)、英語以及OCR識(shí)別方面均實(shí)現(xiàn)與GPT-4o的對(duì)標(biāo)，7/16訊飛發(fā)布智能體平臺(tái)，賦能企業(yè)構(gòu)建崗位專屬助手?？拼笥嶏w發(fā)布的星火企業(yè)智能平臺(tái)，并推出了首批32個(gè)企業(yè)從生產(chǎn)、科研、辦公到管理中特別需要的相關(guān)智能體，如商機(jī)、銷售、客服、科技情報(bào)以及編程等。訊飛星火的代碼智能體可在代碼生成、架構(gòu)設(shè)計(jì)、問答、測(cè)試、數(shù)據(jù)庫優(yōu)化以及審核6個(gè)場(chǎng)景上賦能企業(yè)用戶。代碼在科大訊飛內(nèi)部的采納率從去年10月份的30%，增長(zhǎng)至目前的52%，單元測(cè)試行覆蓋率從30%提到50%。2.1.2訊飛星火大模型加速教育、醫(yī)療等領(lǐng)域的應(yīng)用落地AI大模型醫(yī)療、教育領(lǐng)域垂類應(yīng)用加速滲透。在醫(yī)療領(lǐng)域，公司于去年10月推出的個(gè)人健康助手訊飛曉醫(yī)APP現(xiàn)在已經(jīng)累計(jì)下載1200萬次，用戶好評(píng)率達(dá)98.8%。目前訊飛曉醫(yī)APP可以幫助用戶自主診斷1600種常見疾病，可識(shí)別2800種以上的常見藥品，理解26萬個(gè)藥品相互作用，并且能夠理解和分析6000種以上常見的檢驗(yàn)報(bào)告。目前訊飛曉醫(yī)APP可實(shí)現(xiàn)將個(gè)性化的電子病歷檢查報(bào)告以及過去問診情況，在個(gè)人健康空間保存，在看病、用藥、檢查時(shí)給予用戶更深入具體的幫助。在教育領(lǐng)域，星火滲透至教師批改閱卷場(chǎng)景，AI+教育產(chǎn)品應(yīng)用矩陣進(jìn)一步完善。伴隨著星火大模型V4.0的發(fā)布，公司推出了星火智能批閱機(jī)的軟硬件一體化解決方案，可進(jìn)行自動(dòng)批改，并通過批改自動(dòng)分析全班學(xué)習(xí)情況，給出分析。根據(jù)公司給出的數(shù)據(jù)，星火智能8/16批閱機(jī)可將原來90分鐘的作業(yè)批改時(shí)間縮短至5分鐘，60分鐘的學(xué)情統(tǒng)計(jì)時(shí)間可以縮短至1分鐘，并且學(xué)生的錯(cuò)題解決率從50%提到73%。2.2.1模型能力持續(xù)提升，并發(fā)布具身智能垂類大模型2024年6月21日，在華為開發(fā)者大會(huì)2024（HDC2024）上，華為正式發(fā)布盤古大模型5.0版本。盤古大模型5.0系列在全系列、多模態(tài)、強(qiáng)思維三個(gè)方面進(jìn)行了全面升級(jí)，標(biāo)志著華為云在人工智能領(lǐng)域再次邁出了堅(jiān)實(shí)的步伐。在模型全系列方面，盤古大模型5.0包括十億級(jí)、百億級(jí)、千億級(jí)、萬億級(jí)等不同參數(shù)規(guī)模，提供盤古自然語言大模型、多模態(tài)大模型、視覺大模型、預(yù)測(cè)大模型、科學(xué)計(jì)算大模型等。其中：（1）盤古E系列：10億參數(shù)級(jí)別，可支撐手機(jī)、PC等端側(cè)的智能應(yīng)用；（2）盤古P系列：100億參數(shù)級(jí)別，適用于低時(shí)延、低成本的推理場(chǎng)景；（3）盤古U系列：有1350億參數(shù)和2300億參數(shù)兩種，適用于處理復(fù)雜任務(wù)，可以成為企業(yè)通用大模型的底座；（4）盤古S系列：萬億級(jí)參數(shù)，可以處理跨領(lǐng)域多任務(wù)，夠能幫助企業(yè)更好地在全場(chǎng)景應(yīng)用AI技術(shù)。華為云發(fā)布具身智能大模型，推動(dòng)人形機(jī)器人技術(shù)再升級(jí)。華為云在HDC2024上正式推出了盤古具身智能大模型，會(huì)上搭載盤古能力的人形機(jī)器人也同步亮相。盤古大模型能夠讓機(jī)器人完成10步以上的復(fù)雜任務(wù)規(guī)劃，并且在任務(wù)執(zhí)行中實(shí)現(xiàn)多場(chǎng)景泛化和多任務(wù)處理。同時(shí)盤古大模型還能生成機(jī)器人需要的訓(xùn)練視頻，讓機(jī)器人更快地學(xué)習(xí)各種復(fù)雜場(chǎng)景。大模型的多模態(tài)能力以及思維能力的快速提升，使機(jī)器人能夠模擬人類常識(shí)進(jìn)行邏輯推理，并在現(xiàn)實(shí)環(huán)境中高效精準(zhǔn)地執(zhí)行任務(wù)，從而有效解決了復(fù)雜環(huán)境感知與物理空間認(rèn)知的難題。通過集成多場(chǎng)景泛化和多任務(wù)處理能力，盤古大模型有望賦予機(jī)器人適應(yīng)性和靈活性，靈活面對(duì)工業(yè)環(huán)境還是家庭生活場(chǎng)景。9/162.2.2盤古5.0賦能華為小藝再次升級(jí)，豐富行業(yè)應(yīng)用亮相本次WAIC在盤古大模型5.0加持下，華為推出了全新的小藝助手并且更加智能化，更加流暢，同時(shí)也變得更加地人性化。華為小藝能夠根據(jù)外面的天氣情況制定用戶的個(gè)人出行方式，而且能通過不斷地學(xué)習(xí)，變得更加適合用戶使用習(xí)慣。除此之外，華為云盤古大模型過去一年中，已在30多個(gè)行業(yè)、400多個(gè)場(chǎng)景中落地，覆蓋到政務(wù)、金融、制造、醫(yī)藥研發(fā)、煤礦、鋼鐵等多個(gè)細(xì)分行業(yè)。10/16盤古大模型5.0亮相WAIC2024，持續(xù)重塑千行萬業(yè)。在自動(dòng)駕駛領(lǐng)域，盤古大模型5.0通過創(chuàng)新的可控時(shí)空生成技術(shù)，結(jié)合場(chǎng)景視頻生成、4DBEV視頻生成、自動(dòng)駕駛仿真庫及路網(wǎng)信息，能更好地理解物理規(guī)律，大規(guī)模生成和實(shí)際場(chǎng)景相一致的駕駛視頻數(shù)據(jù)，還可以靈活增加控制條件，生成不同路況、不同光照、不同天氣的訓(xùn)練視頻數(shù)據(jù)，加速自動(dòng)駕駛技術(shù)的快速成熟。在鋼鐵領(lǐng)域，盤古大模型能夠?qū)彳埳a(chǎn)線的最優(yōu)參數(shù)進(jìn)行預(yù)測(cè)。在切換鋼板生產(chǎn)規(guī)格時(shí)，操作工人往往需要對(duì)模型參數(shù)進(jìn)行調(diào)整優(yōu)化，盤古大模型可實(shí)現(xiàn)此過程耗時(shí)由一周時(shí)間縮短至僅4小時(shí)，提效顯著。在實(shí)際生產(chǎn)中，在上海寶武鋼鐵熱軋生產(chǎn)線中，基于盤古大模型，精軋寬展預(yù)測(cè)精度較傳統(tǒng)模型提高5%以上，鋼板成材率提升0.5%，預(yù)計(jì)每年可以多產(chǎn)鋼板2萬余噸，年收益達(dá)9000余萬元。未來盤古大模型還將應(yīng)用于高爐場(chǎng)景，對(duì)爐溫、鐵水溫度等爐況進(jìn)行仿真，從而輔助高爐精準(zhǔn)控制，降低能源成本。在鐵路領(lǐng)域，高鐵巡檢機(jī)器人搭載盤古大模型后，可精準(zhǔn)識(shí)別動(dòng)車零部件的變形、異物、松動(dòng)、丟失等3.2萬個(gè)故障檢測(cè)項(xiàng)點(diǎn)，覆蓋8大類、350多種復(fù)雜故障，不僅提升高鐵運(yùn)營(yíng)效率、降低巡檢成本，而且減少凌晨時(shí)段人工巡檢的作業(yè)負(fù)擔(dān)。在媒體內(nèi)容生產(chǎn)和應(yīng)用領(lǐng)域，盤古大模型能夠?qū)?shí)拍視頻快速轉(zhuǎn)換成特定風(fēng)格的動(dòng)漫，并保持角色樣貌特征前后一致，舞蹈、武打等大運(yùn)動(dòng)軌跡也能確保合理一致的視覺效果，制作周期從月級(jí)縮短到天級(jí)，大大提升制作效率，作品一次拍攝多元化制作，實(shí)現(xiàn)價(jià)值最大化。2.3.1通用大模型快速迭代，首發(fā)toC可控人物視頻生成模型Vimi商湯于WAIC2024發(fā)布“日日新5o”模型，交互體驗(yàn)對(duì)標(biāo)GPT-4o，有望實(shí)現(xiàn)全新AI交互模式。商湯通過整合跨模態(tài)信息，基于聲音、文本、圖像和視頻等多種形式，國(guó)內(nèi)首個(gè)所見即所得模型“日日新5o”帶來一種全新的AI交互模式，即實(shí)時(shí)的流式多模態(tài)交互。商湯底層通用基礎(chǔ)大模型迭代至“日日新5.5”，基礎(chǔ)大模型綜合性能較“日日新5.0”平均提升30%，在數(shù)學(xué)推理、英文能力和指令跟隨等能力明顯增強(qiáng)，交互效果和多項(xiàng)核心指標(biāo)實(shí)現(xiàn)對(duì)標(biāo)GPT-4o?！叭杖招?.5”采用混合端云協(xié)同專家架構(gòu)，最大限度發(fā)揮云邊端協(xié)同，降低推理成本，模型訓(xùn)練基于超過10TBtokens高質(zhì)量訓(xùn)練數(shù)據(jù)，包括大量合成的思維鏈數(shù)據(jù)，提升推理思維能力。商湯加速推進(jìn)B端用戶生態(tài)構(gòu)建。為了讓更多企業(yè)用戶低門檻接入并使用“日日新”大模型體系的強(qiáng)大能力，商湯于近期推出了“大模型0元Go”計(jì)劃。凡是“日日新”的新注冊(cè)用戶，都可獲得涉及調(diào)用、遷徙、訓(xùn)練等多項(xiàng)免費(fèi)服務(wù)大禮包。同時(shí)，商湯還將免費(fèi)贈(zèng)送5000萬Tokens包，并且派出專屬搬家顧問，幫助OpenAI用戶實(shí)現(xiàn)零服務(wù)成本遷移。公司推出首個(gè)面向C端用戶的可控人物視頻生成大模型Vimi。Vimi基于商湯日日新大模型的能力，僅通過一張任意風(fēng)格的照片就能生成和目標(biāo)動(dòng)作一致的人物類視頻，并支持多種驅(qū)動(dòng)方式，可通過已有人物視頻、動(dòng)畫、聲音、文字等多種元素進(jìn)行驅(qū)動(dòng)。據(jù)商湯介紹，與圖片表情控制類技術(shù)只能控制頭部表情動(dòng)作不同，Vimi不但可以實(shí)現(xiàn)精準(zhǔn)的人物表情控制，還可實(shí)現(xiàn)在半身區(qū)域內(nèi)控制照片中人物的自然肢體變化，并自動(dòng)生成與人物相符的頭發(fā)、服飾及背景變化。同時(shí)光影變化也能做到合理生成，讓人物動(dòng)作和視覺效果流暢自然，畫面和諧唯美。更重要的是，Vimi具備極強(qiáng)的穩(wěn)定性，可穩(wěn)定生成長(zhǎng)達(dá)112/16分鐘的單鏡頭人物類視頻，畫面效果不會(huì)隨著時(shí)間的變化而劣化或失真，真正滿足娛樂互動(dòng)等需要長(zhǎng)時(shí)間穩(wěn)定視頻生成需求。2.3.2行業(yè)應(yīng)用：商湯絕影率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署本屆WAIC大會(huì)上，商湯發(fā)布基于全新發(fā)布的商湯“日日新5.5”原生多模態(tài)大模型打造的智能駕駛和智能座艙產(chǎn)品。商湯絕影展示了可解釋、可交互的自動(dòng)駕駛大模型DriveAGI，同時(shí)還發(fā)布了行業(yè)首個(gè)車載生成式交互界面“隨心界面”（FlexInterface）、“隨意操控”（AgentFlow）等車載AIAgent應(yīng)用。在本屆WAIC上，商湯絕影在行業(yè)率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署，并對(duì)外展示了在3個(gè)不同算力平臺(tái)上運(yùn)行2.1B或8B端側(cè)多模態(tài)大模型的適配能力。商湯絕影車載端側(cè)8B多模態(tài)模型可以實(shí)現(xiàn)首包延遲低至300毫秒以內(nèi)，推理速度達(dá)到40Tokens/秒。而商湯絕影自研的首個(gè)應(yīng)用于駕駛決策規(guī)劃的智駕大模型——DriveAGI，增強(qiáng)了端到端系統(tǒng)的可解釋性，不僅讓車輛能夠更像人一樣理解復(fù)雜的現(xiàn)實(shí)世界，洞察各類交通參與者的行為動(dòng)機(jī)，快速學(xué)習(xí)各種交通規(guī)則，掌握瞬息萬變的道路信息，還能向用戶解釋駕駛決策的推理過程。目前，商湯絕影DriveAGI智駕大模型能在無限寬標(biāo)識(shí)的道路上，安全順利穿過兩個(gè)石墩形成的狹窄通道；它還能準(zhǔn)確辨識(shí)并理解包括公交車道、潮汐車道及施工車道等各類交通標(biāo)識(shí)，并自主進(jìn)行變道或規(guī)避，甚至當(dāng)后方有救護(hù)車接近時(shí)，DriveAGI會(huì)進(jìn)行思考推理，最終進(jìn)行及時(shí)變道避讓。13/16在本屆WAIC上，商湯絕影正式發(fā)布行業(yè)首個(gè)生成式交互界面產(chǎn)品“隨心界面”徹底改變用戶與車載系統(tǒng)的交互方式。FlexInterface在大模型解析用戶需求的基礎(chǔ)上，結(jié)合設(shè)計(jì)系統(tǒng)的框架和范式，實(shí)現(xiàn)高度動(dòng)態(tài)和個(gè)性化的界面生成。無論是天氣、時(shí)間、節(jié)日、紀(jì)念日，還是周圍環(huán)境變化，F(xiàn)lexInterface均能自動(dòng)變換界面風(fēng)格，提供最佳用戶體驗(yàn)。AgentFlow通過大模型的推理能力，模擬人類點(diǎn)擊操作，實(shí)現(xiàn)對(duì)APP和網(wǎng)站的直接操作。用戶只需使用自然語言，就能讓AI自主選擇多個(gè)工具完成復(fù)雜任務(wù)，無需主機(jī)廠進(jìn)行額外的研發(fā)適配。這種能力不僅提升了操作的便捷性，還極大地?cái)U(kuò)展了車載系統(tǒng)的功能范圍。在現(xiàn)場(chǎng)演示中，用戶通過FlexInterface生成了一個(gè)“歐洲杯”風(fēng)格的主題，大模型自動(dòng)生成具備歐洲杯元素的中控屏幕桌面和圖標(biāo)，同時(shí)，用戶還能通過AgentFlow隨時(shí)播放歐洲杯或足球相關(guān)的音樂，展示了這些創(chuàng)新產(chǎn)品在實(shí)際應(yīng)用中的強(qiáng)大能力和靈活性。本次WAIC2024上，階躍星辰發(fā)布三款Step系列通用大模型產(chǎn)品，分別是Step-2萬億參數(shù)語言大模型正式版、Step-1.5V多模態(tài)大模型、Step-1X圖像生成大模型。公司最新發(fā)布的Step-2萬億參數(shù)語言大模型正式版，采用了創(chuàng)新的MoE混合專家模型架構(gòu)。同時(shí)，基于階躍星辰行業(yè)領(lǐng)先的系統(tǒng)能力，Step-2大幅提升了訓(xùn)練效率，在數(shù)學(xué)、邏輯、編程、知識(shí)、創(chuàng)作、多輪對(duì)話等方面體感全面逼近GPT-4，企業(yè)和開發(fā)者可以通過階躍星辰開放平臺(tái)申請(qǐng)?bào)w驗(yàn)。14/16新升級(jí)的Step-1.5V千億參數(shù)多模態(tài)大模型，在圖像感知和理解能力上全面提升，并具備出色的視頻理解能力。模型能準(zhǔn)確地識(shí)別視頻中的物體、人物和環(huán)境，并理解視頻的整體氛圍與人物情緒。在Step-2萬億參數(shù)大模型的加持下，Step-1.5V推理能力大幅增強(qiáng)，能根據(jù)圖像內(nèi)容進(jìn)行解答數(shù)學(xué)題、編寫代碼、創(chuàng)作詩歌等高級(jí)推理任務(wù)，體現(xiàn)出公司在多模態(tài)大模型領(lǐng)域取得了突破性進(jìn)展。公司新發(fā)布Step-1X圖像生成大模型，則代表了階躍星辰在推動(dòng)多模態(tài)理解和生成統(tǒng)一的技術(shù)路線上取得重要進(jìn)展。Step-1X模型采用全鏈路自研的DiT（DiffusionModelswithtransformer）模型架構(gòu)，支持600M、2B、8B三種不同的參數(shù)量，能夠滿足不同場(chǎng)景的需求。Step-1X具備更加強(qiáng)大的語義對(duì)齊和指令跟隨能力，還針對(duì)中國(guó)元素和文化進(jìn)行了深度優(yōu)化使其更具中國(guó)風(fēng)格。公司加快垂類行業(yè)生態(tài)建設(shè)，在金融行業(yè)領(lǐng)域與券商形成深度合作。近日階躍星辰智能科技有限公司、上海財(cái)躍星辰智能科技有限公司和國(guó)泰君安證券，簽署三方戰(zhàn)略合作協(xié)議，將在拓展智能化應(yīng)用場(chǎng)景、豐富金融語料數(shù)據(jù)、構(gòu)建國(guó)產(chǎn)信創(chuàng)算力集群、互聯(lián)網(wǎng)業(yè)務(wù)運(yùn)營(yíng)、產(chǎn)業(yè)投融資、財(cái)富管理和產(chǎn)業(yè)研究等十大領(lǐng)域展開深度合作，三方將聯(lián)手在模型、信創(chuàng)算力、金融語料、應(yīng)用場(chǎng)景等方面努力推動(dòng)大模型應(yīng)用加速落地。另外，公司與國(guó)泰君安共同研發(fā)的君弘靈犀大模型已經(jīng)上線，作為業(yè)內(nèi)首家千億級(jí)參數(shù)多模態(tài)證券垂直類大模型，其應(yīng)用場(chǎng)景涵蓋君弘智投、綜合診斷、智能選股、熱點(diǎn)資訊、多模態(tài)處理等十大功能，致力于解決傳統(tǒng)模型在語義理解、多輪對(duì)話和答案豐富性上存在的運(yùn)營(yíng)成本高、投資服務(wù)匹配度低等問題。15/16AI基礎(chǔ)設(shè)施：軟通動(dòng)力、海光信息、中科曙光、浪潮信息、寒武紀(jì)-U、云天勵(lì)飛；AI大模型：科大訊飛、云從科技-U、百度-SW、商湯；AI行業(yè)應(yīng)用：金山辦公、漢王科技、星環(huán)科技、拓爾思、虹軟科技、格靈深瞳、第四范式、焦點(diǎn)科技、萬興科技；1、AI技術(shù)迭代不及預(yù)期的風(fēng)險(xiǎn)；2、AI商業(yè)化產(chǎn)品發(fā)布不及預(yù)期；3、政策不確定性帶來的風(fēng)險(xiǎn)；4、下游市場(chǎng)不確定性帶來的風(fēng)險(xiǎn)。16/16股票投資評(píng)級(jí)說明以報(bào)告日后的6個(gè)月內(nèi)，證券相對(duì)于滬深300指數(shù)的漲跌幅為標(biāo)準(zhǔn)，定義如下：1.買入：相對(duì)于滬深300指數(shù)表現(xiàn)＋20％以上；2.增持：相對(duì)于滬深300指數(shù)表

人人文庫> 全部分類> 應(yīng)用文書 > 研究報(bào)告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

人工智能-WAIC 2024國(guó)產(chǎn)AI+應(yīng)用“百花齊放”

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔