人工智能-國內大模型8月份回顧:實時交互能力提升應用端持續(xù)更新_第1頁
人工智能-國內大模型8月份回顧:實時交互能力提升應用端持續(xù)更新_第2頁
人工智能-國內大模型8月份回顧:實時交互能力提升應用端持續(xù)更新_第3頁
人工智能-國內大模型8月份回顧:實時交互能力提升應用端持續(xù)更新_第4頁
人工智能-國內大模型8月份回顧:實時交互能力提升應用端持續(xù)更新_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1/10計算機報告日期:2024年09月09日o國產(chǎn)大模型快速更新迭代,過去一個月時間內,國內主流大模型基本上都更新了模型版本或發(fā)布新應用產(chǎn)品,各大模型廠商持續(xù)打磨產(chǎn)品,推出了針對效率辦公、創(chuàng)意創(chuàng)作、智能搜索、實時互動等場景的功能,大模型技術加速融入用戶的生產(chǎn)o通用能力層面:國產(chǎn)大模型與海外水平持續(xù)縮小國內外第一梯隊大模型在中文領域的通用能力差距在持續(xù)縮小,根據(jù)SuperCLUE跟蹤的數(shù)據(jù),國內外TOP1模型的差距比例,從2023年5月的30.12%的差距,縮小至2024年8月的1.29%。在中文語境下,國內大模型文理科能力領先,Hard能力與國外相比仍有差距。國內大模型在理科和文科維度的能力表現(xiàn)整體好于國外大模型。國內前三名模型的理科得分相較于國外前三名平均高1.93分,國內前三名模型的文科得分相較于國外前三名平均高0.42分。o中文語境下,國內模型文生視頻表現(xiàn)優(yōu)于國外根據(jù)SuperCLUE的測評結果,在中文環(huán)境下,國內外多模態(tài)能力總體水平差距不大,海外模型在基礎認知能力方面領先,國內模型應用能力有優(yōu)勢。國內文生視頻模型整體表現(xiàn)好于國外。國內文生視頻能力表現(xiàn)較強的模型主要有智譜清影、快手可靈、字節(jié)跳動Dreamina、美圖WHEE和科大訊飛星火繪鏡。o建議關注標的建議關注:科大訊飛、金山辦公、同花順、恒生電子、彩訊股份、云從科技、萬興科技、昆侖萬維、國投智能、潤達醫(yī)療、拓爾思、海天瑞聲、虹軟科技、焦點科技、宇信科技、通達海、福昕軟件、佳發(fā)教育、格靈深瞳、云天勵飛。o風險提示AI技術迭代不及預期的風險;AI商業(yè)化產(chǎn)品發(fā)布不及預期;政策不確定性帶來的風險;下游市場不確定性帶來的風險。liuwenshu03@stocke.cyeguangliang@taoyunqi@.2/10請務必閱讀正文之后正文目錄 4 62.1通用能力對比:文理科能力領先,Hard能力仍有差距 2.2多模態(tài)能力對比:中文環(huán)境下,文生視頻能力優(yōu)于國外模型 93/10請務必閱讀正文之后圖1:國內外大模型能力差距持續(xù)縮小 圖2:國內外大模型通用能力測評 7圖3:國內外大模型理科能力對比 圖4:國內外大模型文科能力對比 表1:2024年8-9月國內大模型功能更新情況 4表2:SuperCLUE-V多模態(tài)理解測評基準總榜 表3:AIGCBench-TV文生視頻基準測評總榜 94/10請務必閱讀正文之后模型騰訊騰訊混元文生圖開源大模型inpainting(圖像修復與擴充)、lineart資料來源:各公司官方公眾號、各公司官網(wǎng)、CDSN、智東西、搜5/10請務必閱讀正文之后訊飛星火:的大模型產(chǎn)品,面向公眾開放體驗。星火極速超擬人交互技術采用“端到端”技術框架,實現(xiàn)了語音的直接建模,大幅縮短了響應時間,解決了傳統(tǒng)純語音產(chǎn)品中的“機械感”問題,提升了共鳴能力,能夠感知并回應用戶的情緒變化。星火極速超擬人交互技術未來有望在閑聊陪伴、PPT文本生成方面進行了獨立訓練,此次新版本實現(xiàn)商湯科技:系統(tǒng)的智能圖表的能力,由「商湯?小浣熊家族」提供模型能力的支持。智能圖表功能可省重復勞動,聚焦更有創(chuàng)造力的工作。用戶可以直接粘貼數(shù)據(jù),或上傳各類數(shù)據(jù)文件,通義千問:文心一言:別其它搜索產(chǎn)品,文小言推出了富媒體搜索、多模態(tài)輸入、文本與圖片創(chuàng)作、高隨心閱讀。3)讀、搜、問、寫一站式搞定,借助多輪對話記憶能力,精準滿足復雜任務需求,騰訊混元大模型:括tile(高清放大)、inpaint妝、電商等80%案例和場景,面向用戶包括6/10請務必閱讀正文之后豆包大模型:智譜清言:頻通話功能將機器視覺與模型智慧融合,不再局限于傳統(tǒng)的文字和語音交互,MiniMax:月之暗面Kimi:9月2日,中文大模型測評基準SuperCLUE發(fā)布《中文大模型基準測評2024年8月報告》。測評結果顯示,國內大模型加快升級迭代,持續(xù)縮小與國外大模在中文語境下的能過去一年多時間,國內外大模型持續(xù)發(fā)展,以ChatGPT、Claude、Gemini和Llama為代表海外模型已經(jīng)歷多版本的升級,國內模型奮起直追,總體趨勢上,國內外第一梯隊大模型在中文領域的通用能力差距在持續(xù)縮小,從2023年5月的30.12%的差距,縮小至2024年8月的1.29%。23.0923.0921.0115.2325.93%8.8919.34%4.0012.54%7.34%4.94%25205030.12%24.58%18.76%17.56%12.81%5.35%20.4516.3411.6115.774.965.811.29%國內外Top1模型差距分數(shù)國內外Top1模型差距比例35%30%25%20%15%10%5%0%7/10請務必閱讀正文之后中文語境下,國內大模型的通用能力已經(jīng)接近國際領先水平。SuperCLUE選取國內外有代表性的43個大模型在8月份的版本,做了中文語境下的通用能力測試。在測評排行榜中,騰訊混元大模型僅次于ChatGPT-4o-latest,總得分相差1.03。阿里的Qwen2-72B-Instruct和商湯的SenseChat5.5得分排名,超過Anthropic的Claude3.5Sonnet和Google的Gemini-1.5-Pro。在得分榜中,排名靠前的還有字節(jié)跳動、百度、科大訊飛、階躍星辰等國內廠商的身影。從細分的能力來看:1)Hard能力主要指精準指令遵循和高階推理,在該能力維度上,國內外模型表現(xiàn)仍有一定差距,國內第一的混元大模型和全球第一ChatGPT-4olatest得分相差4.54,其他國內模型得分均在70以下,和國際領先水平有差距。Hard能力是具有高難度的、高挑戰(zhàn)的任務具有較高區(qū)分性,是國內大模型后續(xù)重點優(yōu)化方向之一。2)理科能力。國內模型理科能力優(yōu)異,表現(xiàn)超過海外頭部模型。騰訊混元大模型得分超過ChatGPT-4o-latest,位列測評榜第一。商湯SenseChat5.5得分超過Claude3.5Sonnet、GPT-4o-mini、Gemini-1.5-Pro等海外模型。整體來看,國外前三名模型的理科得分相較于國內前三名平均低1.93分。3)文科能力。國內模型文科能力表現(xiàn)整體好于國外模型。在文科得分榜單中,騰訊混元大模型以78.86的高分排名第一。整體來看,國外前三名模型的文科得分相較于國內前三名平均低0.42分。8/10請務必閱讀正文之后多模態(tài)綜合能力。國內外多模態(tài)能力總體水平差距不大,海外模型在基礎認知能力方面領先,國內模型應用能力有優(yōu)勢。排名第一的是OpenAI的GPT-4o,其次是騰訊混元大模型,國內其他表現(xiàn)較好的模型有:上海人工智能實驗室InternVL2-40B、階躍星辰Step-1V-8k、智譜GLM-4v、阿里巴巴Qwen和零一萬物Yi-VL-34B。模型騰訊騰訊AnthropicAnthropicYi-VL-34B分排名第一,國內模型排名靠前的是智譜清影、快手9/10請務必閱讀正文之后模型名稱VegaAlAI技術迭代不及預期的風險;AI商業(yè)化產(chǎn)品發(fā)布不及預期;政策不確定性帶來的風險;下游市場不確定性帶來的風險。10/10股票投資評級說明以報告日后的6個月內,證券相對于滬深300指數(shù)的漲跌幅為標準,定義如下:1.買入:相對于滬深300指數(shù)表現(xiàn)+20%以上;2.增持:相對于滬深300指數(shù)表現(xiàn)+1020%;3.中性:相對于滬深300指數(shù)表現(xiàn)-1010%之間波動;4.減持:相對于滬深300指數(shù)表現(xiàn)-10%以下。行業(yè)的投資評級:以報告日后的6個月內,行業(yè)指數(shù)相對于滬深300指數(shù)的漲跌幅為標準,定義如下:1.看好:行業(yè)指數(shù)相對于滬深300指數(shù)表現(xiàn)+10%以上;2.中性:行業(yè)指數(shù)相對于滬深300指數(shù)表現(xiàn)-10%10%以上;3.看淡:行業(yè)指數(shù)相對于滬深300指數(shù)表現(xiàn)-10%以下。我們在此提醒您,不同證券研究機構采用不同的評級術語及評級標準。我們采用的是相對評級體系,表示投資的相對比建議:投資者買入或者賣出證券的決定取決于個人的實際情況,比如當前的持倉結構以及其他需要考慮的因素。投資者不應僅僅依靠投資評級來推斷結論。法律聲明及風險提示本報告由浙商證券股份有限公司(已具備中國證監(jiān)會批復的證券投資咨詢業(yè)務資格,經(jīng)營許可證編號為:Z39833000)制作。本報告中的信息均來源于我們認為可靠的已公開資料,但浙商證券股份有限公司及其關聯(lián)機構(以下統(tǒng)稱“本公司”)對這些信息的真實性、準確性及完整性不作任何保證,也不保證所包含的信息和建議不發(fā)生任何變更。本公司沒有將變更的信息和建議向報告所有接收者進行更新的義務。本報告僅供本公司的客戶作參考之用。本公司不會因接收人收到本報告

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論