Databricks公司開(kāi)源1320億參數(shù)DBRX模型目前性能最領(lǐng)先的MoE架構(gòu)大模型_第1頁(yè)
Databricks公司開(kāi)源1320億參數(shù)DBRX模型目前性能最領(lǐng)先的MoE架構(gòu)大模型_第2頁(yè)
Databricks公司開(kāi)源1320億參數(shù)DBRX模型目前性能最領(lǐng)先的MoE架構(gòu)大模型_第3頁(yè)
Databricks公司開(kāi)源1320億參數(shù)DBRX模型目前性能最領(lǐng)先的MoE架構(gòu)大模型_第4頁(yè)
Databricks公司開(kāi)源1320億參數(shù)DBRX模型目前性能最領(lǐng)先的MoE架構(gòu)大模型_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

目錄一、行業(yè)變化 1大數(shù)據(jù)人工智能公司Databricks開(kāi)源通用大模型DBRX 1Databricks發(fā)布的DBRX模型與其他公司大模的功能性對(duì)比 1Databricks發(fā)布的DBRX模型的訓(xùn)練與推理效率 5二、持續(xù)關(guān)注標(biāo)的 6三、行情回顧 7四、產(chǎn)業(yè)要聞 10五、重要公告 12六、風(fēng)險(xiǎn)提示 13圖表目錄圖表1:Databricks官的源DBRX模用冊(cè)界面 1圖表2:DBRX型他源AI大型語(yǔ)言解、程數(shù)三方的能對(duì)比 2圖表3:DBRX不準(zhǔn)下其開(kāi)大型能力比 3圖表4:DBRX其源大型性基對(duì)比 4圖表5:DBRX其型的上文準(zhǔn)試較 4圖表6:DBRX兩個(gè)RAG基(NaturalQuestions和HotPotQA)上質(zhì)對(duì)比 5圖表7:Gemini1.5下文口面其模對(duì)比 5圖表8:DBRX理對(duì)比 6圖表10:人智(證)股漲前名(%) 7圖表11:人智(證)股漲后名(%) 7圖表12:重公股漲跌情盈預(yù)為Wind一預(yù)) 8請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款和聲明。一、行業(yè)變化大數(shù)據(jù)人工智能公司Databricks開(kāi)源通用大模型DBRX327日,DatabricksDBRX(1),在綜合所有的大模型評(píng)價(jià)標(biāo)準(zhǔn)后,DBRX無(wú)疑是目前表現(xiàn)質(zhì)量最高的開(kāi)源大模型之一,Databricks公司樹(shù)立了一個(gè)新的開(kāi)源大模型行業(yè)標(biāo)桿。同時(shí),DBRXAPIDBRXDatabricks公司自身公布的測(cè)評(píng)結(jié)果,DBRXOpenAIGPT-3.5Gemini1.0Pro相競(jìng)爭(zhēng)。除此之外,DBRXCodeLLaMA-70B此類的一些專注于編程領(lǐng)域的大模型。圖表1:Databricks官網(wǎng)的開(kāi)源DBRX模型用戶注冊(cè)界面資料來(lái)源:Databricks官網(wǎng),Databricks官網(wǎng),DBRXtransformerDecoder-Only大語(yǔ)言模型。DBRX1320億參360980億參數(shù)則為專家混合層。DBRX模型采用了專家混合模型(MoE)12T文本和代碼數(shù)據(jù)預(yù)訓(xùn)練而成。MoE:MoEMixtralGrok-1,DBRXDBRX164MixtralGrok-18個(gè)65倍可能的專家模型組合,Databricks公司表示這種變化提升了模型的質(zhì)量。此外,DBRX還使用了tiktoken存儲(chǔ)庫(kù)中提供的分詞器。Databricks發(fā)布的DBRX模型與其他公司大模型的功能性對(duì)比在本周三DBRX模型正式開(kāi)源后,Databricks公司官網(wǎng)也可查詢到公司發(fā)布的DBRX模型與其他公司行業(yè)動(dòng)態(tài)報(bào)告(Meta、MixtralAI、xAI等)的大模型性能對(duì)比。2中直觀的呈現(xiàn)了在語(yǔ)言理解,編程,數(shù)學(xué)三個(gè)方面DBRXDBRX與其他開(kāi)源大模型的性能對(duì)比,DBRX與一些閉源大模型的能力對(duì)比。圖表2:DBRX模型與其他開(kāi)源AI大模型在語(yǔ)言理解、編程、數(shù)學(xué)三個(gè)方面的能力對(duì)比資料來(lái)源:Databricks官網(wǎng),圖表3詳細(xì)顯示了DBRX和其他公司的開(kāi)源大模型在不同應(yīng)用領(lǐng)域的比較結(jié)果3可以看出,DBRX的指導(dǎo)分?jǐn)?shù)在綜合基準(zhǔn)、編程與數(shù)學(xué)能力、MMLU三個(gè)方面表現(xiàn)優(yōu)越。綜合基準(zhǔn)方面,DBRX在theHuggingFaceOpenLLMLeaderboard(ARC-ChallengeHellaSwagMMLUTruthfulQAWinoGrandeGSM8k的平均值)DatabricksModelGauntlet(630個(gè)任務(wù)維度)。DBRXHuggingFace74.5%,排名第二的模型MixtralInstruct72.7%;DatabricksGauntlet66.8%MixtralInstruct60.7%HumanEvalGSM8k基準(zhǔn)上的得分結(jié)果也高于其他的開(kāi)源模型。行業(yè)動(dòng)態(tài)報(bào)告圖表3:DBRX在不同基準(zhǔn)下與其他開(kāi)源大模型的能力對(duì)比資料來(lái)源:Databricks官網(wǎng),圖表4顯示了DBRXInstruct和領(lǐng)先的閉源模型比較結(jié)果。DBRXInstruct超越了GPT-3.5(如比較GPT-4參考圖表4中所述),并且與Gemini1.0Pro和MistralMedium相比相當(dāng)具有競(jìng)爭(zhēng)力。具體而言:從每個(gè)abricsBX即使是表現(xiàn)最差的指標(biāo)也與P3.5eii1.0ProMistralMedium比較,DBRXInflectionCorrectedMTBench、MMLU、HellaSwagHumanEval上的得分高于Gemini1.0Pro,在HumanEval、GSM8k和InflectionCorrectedMTBench上的得分高于MistralMediumGemini1.0ProGSM8kDBRXInstructDBRXMistralMedium在WinograndeMMLUGemini1.0ProMistralMedium模型,DBRX有自己獨(dú)特的優(yōu)勢(shì)。行業(yè)動(dòng)態(tài)報(bào)告圖表4:DBRX與其他閉源大模型的性能基準(zhǔn)對(duì)比資料來(lái)源:Databricks官網(wǎng),對(duì)于在長(zhǎng)文本任務(wù)和RAG基準(zhǔn)的測(cè)試。DBRXInstruct32Ktoken5將其性MixtralInstructTurboTurboAPI在一系列長(zhǎng)上下文基準(zhǔn)測(cè)試上進(jìn)行了TurboDBRXInstructTurboDBRXInstruct和MixtralInstruct的整體性能相似。RAG基準(zhǔn)方面的測(cè)試,Databricks32KtokenDBRX的訓(xùn)5MixtralInstructTurboTurboAPI進(jìn)行TurboDBRXInstructTurbo好;和MixtralInstruct的整體性能類似。圖表5:DBRX與其他模型的長(zhǎng)上下文基準(zhǔn)測(cè)試比較資料來(lái)源:Databricks官網(wǎng),RAG基準(zhǔn)是一個(gè)十分流行的模型長(zhǎng)文本任務(wù)性能測(cè)試方法。圖表6顯示了DBRX在兩個(gè)RAG基準(zhǔn)上的行業(yè)動(dòng)態(tài)報(bào)告模型質(zhì)量。DBRXInstruct與MixtralInstruct、LLaMA2-70BChat等開(kāi)源模型、當(dāng)前版本的GPT-3.5Turbo相比也具有競(jìng)爭(zhēng)力。圖表6:DBRX在兩個(gè)RAG基準(zhǔn)(NaturalQuestions和HotPotQA)上的質(zhì)量對(duì)比資料來(lái)源:Databricks官網(wǎng),Databricks發(fā)布的DBRX模型的訓(xùn)練與推理效率DatabricksDBRXDatabricks公司研究發(fā)現(xiàn)訓(xùn)練混合專家模型可以顯著提高訓(xùn)練的計(jì)算效率(7)。圖表7:Gemini1.5Pro上下文窗口方面與其他模型對(duì)比資料來(lái)源:Databricks官網(wǎng),DatabricksDBRX預(yù)訓(xùn)練數(shù)據(jù)在DBRXDense-A7BDatabricksGauntlet39.0%模型雖tokenGauntletScore30.9%Databrickstokentoken數(shù)abrics通過(guò)在500Boen上訓(xùn)練BXne-Aene-A在abricsantletore32.1%的分詞器可能也對(duì)模型的分?jǐn)?shù)作出了重要貢獻(xiàn),因?yàn)樗哂旋嫶蟮脑~匯量同時(shí)被認(rèn)為尤其有效率。8DBRXNVIDIADatabricks優(yōu)化后的基礎(chǔ)設(shè)施的模型的推理效率對(duì)比。一般來(lái)說(shuō),MoE架構(gòu)的模型的推理速度相比其他模型要快。DBRX在這方面也不例外,DBRX推理吞吐量比132B非MoE模型高2-3倍。MoEDBRX的性能LLaMA2-70BLLaMA2-70B2(圖8)。此外,DBRX比Mixtral小,質(zhì)量相應(yīng)較低,但推理量更高。圖表8:DBRX推理效率對(duì)比資料來(lái)源:Databricks官網(wǎng),二、持續(xù)關(guān)注標(biāo)的GPUFPGA:安路科技-U等;SoC:高通、瑞芯微、晶晨股份、全志科技等;自然語(yǔ)言處理:科大訊飛等;計(jì)算機(jī)視覺(jué):格靈深瞳-U等;自動(dòng)駕駛:德賽西威、中科創(chuàng)達(dá)、均勝電子、光庭信息;智慧交通:千方科技、萬(wàn)集科技;AI+工業(yè):中控技術(shù)、華大九天、廣立微、概倫電子等。三、行情回顧上期,人工智能指數(shù)(中證)指數(shù)下跌5.85%,本月份以來(lái)累計(jì)跌幅0.35%。上期上證指數(shù)下跌0.23,,滬深300指數(shù)下跌0.21%。圖表9:中證人工智能指數(shù)、上證指數(shù)、滬深300指數(shù)漲跌幅比較15%

人工智能 上證指數(shù) 滬深30010%10%5%0%-15%資料來(lái)源:,中證人工智能指數(shù)板塊個(gè)股方面,漲幅前五個(gè)股分別為:德賽西威(+11.60%)、四維圖新(+9.51%)、北斗星通(+6.86%)、浪潮信息(+5.38%)、石頭科技(+4.99%);漲幅后五個(gè)股分別為:深信服(-21.32%)、國(guó)投智能(-14.88%)、安恒信息(-14.76%)、太極股份(-13.52%)、廣聯(lián)達(dá)(-12.91%)。圖表10:人工智能(中證)個(gè)股周漲幅前十名(%) 圖表11:人工智能(中證)個(gè)股周漲幅后十名(%)(3)0份威視

0.410.39

6.865.384.99

11.609.51

(11.57)(11.72)(11.75)(11.97)(12.75)(12.91)(13.52)(14.76)(14.88)(21.32)

芯原股份中科曙光金山辦公晶晨股份易華錄廣聯(lián)達(dá)太極股份安恒信息國(guó)投智能深信服資料來(lái)源:, 資料來(lái)源:,圖表12:重點(diǎn)公司股票漲跌詳情(盈利預(yù)測(cè)均為一致預(yù)測(cè))重點(diǎn)公司股票漲跌詳情2021歸母凈利潤(rùn)20222023E2021)PE20222023E!))#DIV/0!#DIV/0!本周區(qū)間行情月初至今年初至今股票代單公司名稱行業(yè)碼位億英偉達(dá)NVDA.OGPU美9.8(NVIDIA)元億-超威半導(dǎo)體AMD.OGPU美10.9(AMD)元-億688041海光信息GPU元11.78.8-億688107安路科技FPGA元22.8-21.8-32.2億688256寒武紀(jì)-UASIC元2.02.8億高通QCOM.OSoC美3.87.3(QUALCOMM)元億-300458全志科技SoC元2.50.6-14.5億-603893瑞芯微SoC元8.5-20.6-億688099晶晨股份SoC元14.4-15.0-24.0汽車攝億002036聯(lián)創(chuàng)電子像頭元1.73.8-22.8-2382.HK舜宇光學(xué)科技汽車攝像頭億元21.5-21.4-43.6億603501韋爾股份CIS元4.62.5毫米波億-300691聯(lián)合光電雷達(dá)元6.1-28.1毫米波億-603197保隆科技雷達(dá)元6.0-19.2激光雷億29.1!139.217.0!-688048長(zhǎng)光華芯達(dá)元8.8-33.4激光雷億300620光庫(kù)科技達(dá)元6.48.9激光雷億603297永新光學(xué)達(dá)元4.03.8-19.3激光雷億31.0002273水晶光電達(dá)元激光雷億002222福晶科技達(dá)元0.62.7激光雷億688127藍(lán)特光學(xué)達(dá)元1.25.0數(shù)據(jù)服億688787海天瑞聲務(wù)元9.10.7語(yǔ)音處億-002230科大訊飛理元7.35.0計(jì)算機(jī)億-002415海康威視視覺(jué)元9.9計(jì)算機(jī)億-688207格靈深瞳視覺(jué)元8.3-2.0-30.6計(jì)算機(jī)億688003天準(zhǔn)科技視覺(jué)元5.76.3億21.0002920德賽西威Tier1元億--1.53.7002906華陽(yáng)集團(tuán)Tier1元-27.4億688326經(jīng)緯恒潤(rùn)-WTier1元-33.1億600699均勝電子Tier1元0285.H億-K比亞迪電子Tier1元6.6-21.2-汽車軟億300496中科創(chuàng)達(dá)件元18.3-15.5-36.0汽車軟億11.2301221光庭信息件元-19.0汽車軟億688088虹軟科技件元0.16.1-20.6汽車軟億14.4002405四維圖新件元汽車軟億-300353東土科技0.10.20.51188.8305.7116.93.6件元3.3智慧交億-002373千方科技7.2(4.8)6.023.0(34.5)27.71.2通元1.1智慧交億(220.850.1300552萬(wàn)集科技0.4(0.3)(0.7)150.3(94.6)55.21.5通元)智慧工億-688777中控技術(shù)5.88.013.563.246.127.21.22.6業(yè)元3.8智慧工億000682東方電子3.54.45.535.227.922.26.28.3業(yè)元智慧工億-301269華大九天1.41.92.4326.2245.0191.4-20.9業(yè)元8.6-智慧工億301095廣立微0.61.21.8172.289.761.115.8-15.5-26.5業(yè)元-智慧工億688206概倫電子0.30.40.4236.6150.8172.512.6-11.6-28.4業(yè)元資料來(lái)源:,四、產(chǎn)業(yè)要聞大模型API】3月28AITaskMatrix.AI。TaskMatrix.AI(Microsoft)AI《科學(xué)》合作期刊IntelligentComputing上發(fā)表的論文TaskMatrix.AI:CompletingTasksbyConnectingFoundationModelswithMillionsofAPIs中正式亮相,作者為微軟亞洲研究院的段楠博士團(tuán)隊(duì)。(IT之家)【小藝大模型版本下放,華為Mate40系列手機(jī)迎來(lái)首次眾測(cè)更新】3月27日,華為Mate40系列手機(jī)現(xiàn)已開(kāi)啟小藝大模型版本眾測(cè),版本號(hào)為12.1.2.400,大小為65.1MB,日期為2024/3/22-2024/4/30。華為Mate60/50P60/P50”之家)【阿里云x聯(lián)發(fā)科,天璣93003月289300AI1870億、140720102.0(IT之家)芯片3月2618室檢測(cè)具有革命性推動(dòng)作用。該成果不僅有利于提高中國(guó)的體外診斷技術(shù)水平,還打破了國(guó)際壟斷。(IT之家)【英偉達(dá)AI芯片H200開(kāi)始供貨,性能相比H100提升60%-90%】3月28(GPU)H200H200為面向AIH100Meta型Llama2H200H100AI453月18AI“B200”,B200和CPU()上?!白顝?qiáng)AI”GB200B200BlackwellGPUArm的GraceCPUH100提升3025(IT之家)【分析稱蘋果M3Ultra3月28MaxTech的VadimYuryev稱,蘋果的M3UltraM1Ultra和M2UltraM3MaxM3UltraN3EiPhone16A18N3EM3Ultra將于2024MacStudio(IT)智能駕駛【小米汽車SU7/Pro/Max正式發(fā)布并上市】3月28SU7正式SU75.28sCLTC續(xù)航700公里、1973.6kWh15350kmPro生免費(fèi)、小米澎湃智能座艙,售價(jià)21.59萬(wàn)元。新車定位于“C級(jí)高性能生態(tài)科技轎車”,售價(jià)21.59萬(wàn)元-29.99萬(wàn)元。(IT之家)傳感器【蘋果VisionPro頭顯新專利獲批:LightSeal內(nèi)嵌觸控傳感器,帶來(lái)更豐富交互方式】3月26日消息,根據(jù)美國(guó)商標(biāo)和專利局(USPTO)近日公示的清單,蘋果公司獲得了一項(xiàng)關(guān)于VisionPro頭顯的技術(shù)專利,暗示蘋果計(jì)劃未來(lái)在LightSeal中嵌入觸控傳感器,從而為佩戴者提供更豐富的交互體驗(yàn)。IT之家報(bào)導(dǎo),蘋果公司此前的專利中,就考慮在LightSeal中嵌入各種傳感器,測(cè)量佩戴者體溫、行業(yè)動(dòng)態(tài)報(bào)告汗液、心率、心臟電信號(hào)(如心電圖、心電圖等)、額葉活動(dòng)等指標(biāo),從而進(jìn)一步分析佩戴者的反應(yīng)或者參與度。(IT之家)五、重要公告本期重點(diǎn)公告包括銷售合同、股權(quán)激勵(lì)、對(duì)外投資、股權(quán)質(zhì)押等。天準(zhǔn)科技發(fā)布銷售合同相關(guān)公告,中控技術(shù)發(fā)布股權(quán)激勵(lì)相關(guān)公告,經(jīng)緯潤(rùn)恒發(fā)布對(duì)外投資相關(guān)公告,廣立微發(fā)布股權(quán)質(zhì)押相關(guān)公告。人工智能行業(yè)一周重要公告公司簡(jiǎn)稱發(fā)布日期公告內(nèi)容四維圖新2024/2/5近日,北京四維圖新科技股份有限公司(以下簡(jiǎn)稱“公司”)子公司北京圖迅豐達(dá)信息技術(shù)有限公司(以下簡(jiǎn)稱“圖迅豐達(dá)”)收到北京市科學(xué)技術(shù)委員會(huì)、北京市財(cái)政局、國(guó)家稅務(wù)總局北京市稅務(wù)局聯(lián)合頒發(fā)的《高新技術(shù)企業(yè)證書(shū)》(證書(shū)編號(hào):GR202311004043),發(fā)證日期為2023年11月30日,有效期三年。聯(lián)創(chuàng)電子2024/2/7聯(lián)創(chuàng)電子科技股份有限公司關(guān)于控股股東股份補(bǔ)充質(zhì)押的公告:聯(lián)創(chuàng)電子科技股份有限公司(以下簡(jiǎn)稱“公司”)近日收到控股股東江西鑫盛投資有限公司(以下簡(jiǎn)稱“江西鑫盛”)的告知函,獲悉江西鑫盛將所持有公司的部分股份進(jìn)行股份補(bǔ)充質(zhì)押。德賽西威2024/2/720231024屆董事會(huì)第二十次會(huì)議,審議通過(guò)了《關(guān)于公司全資子公司擬與專業(yè)投資機(jī)構(gòu)共同投資設(shè)立產(chǎn)業(yè)基金暨關(guān)聯(lián)交易的議案》,同意公司的全資子公司深圳市德賽西威產(chǎn)業(yè)投資有限公司與廣東粵財(cái)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論