計算機(jī)行業(yè)Anthropic進(jìn)展追蹤:超越GPT-4的表現(xiàn)Claude 3有多強(qiáng)_第1頁
計算機(jī)行業(yè)Anthropic進(jìn)展追蹤:超越GPT-4的表現(xiàn)Claude 3有多強(qiáng)_第2頁
計算機(jī)行業(yè)Anthropic進(jìn)展追蹤:超越GPT-4的表現(xiàn)Claude 3有多強(qiáng)_第3頁
計算機(jī)行業(yè)Anthropic進(jìn)展追蹤:超越GPT-4的表現(xiàn)Claude 3有多強(qiáng)_第4頁
計算機(jī)行業(yè)Anthropic進(jìn)展追蹤:超越GPT-4的表現(xiàn)Claude 3有多強(qiáng)_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

計算機(jī)分析師:蘇儀分析師:聞學(xué)臣聯(lián)系人:王雪晴基本狀況基本狀況上市公司數(shù)行業(yè)總市值(十億元)行業(yè)流通市值(十億元)行業(yè)-行業(yè)-市場走勢對比簡稱重點公司基本狀況665435865433投資要點新不及時等 中泰證券 3 5·擁有復(fù)雜視覺能力,可處理多類型視覺信息 提升可用性,減少錯誤拒絕率 大幅提升準(zhǔn)確性,降低幻覺 強(qiáng)大的長文本處理和記憶能力 三版模型收費(fèi)有差異性,性價比較高 應(yīng)用評測:Claude3能夠解決哪些問題? 中泰證券■2024年3月4日,Anthropic發(fā)布了大模型Claude3。該模型系列包括三個不同的版本(按功能升序排列):Claude3Haiku、Claude3性。它在人工智能系統(tǒng)的大多數(shù)常見評估基準(zhǔn)(包括MMLU、GPQA、GSM8K等)上優(yōu)于GPT-4、Gemini1.0Ultra等模型。中泰證券 中泰證券資料來源:TheClaude3ModelFamily:Opus,Sonnet,Haiku,中泰證券研究文(長度約10ktoken)。在發(fā)布后,Anthropic也預(yù)計模型性能將進(jìn)一倍,且智能水平更高。它擅長需要快速響應(yīng)的任務(wù),如知■Claude3模型擁有復(fù)雜視覺能力,在部門版本模型表現(xiàn)中超越了GPT-V和Gemini。Claude3可以處理廣泛的視覺格式,包括照片、圖中泰證券Haiku在回答接近系統(tǒng)防護(hù)措施的提示時,拒絕的可能性大大降低,可些復(fù)雜的、事實性的問題(這些問題針對模型已知的弱點)對模型的準(zhǔn)確性進(jìn)行評估,并將模型的響應(yīng)分類為正確答案、錯誤答案(或幻覺)中泰證券ZHONGTAISECURITIES Iapologize,Ishouldnotproviderecommendatiunethicalsurveillanceactivit資料來源:TheClaude3ModelFamily:Opus,Sonnet,Haiku,中泰證券研究資料來源:Anthropic,中泰證券研究圖表8:Claude3系列模型在更長的上下文中記憶性表達(dá)更好中泰證券ZHONGTAISECURITIES資料來源:TheClaude3ModelFamily:Opus,Sonnet,Haiku,中泰證券研究 句子(“針”)插入到一個文檔集合(“干草堆”)中,并提出問題來憶能力,準(zhǔn)確率超過99%。Claude3Opus—9—請務(wù)必閱讀正文之后的重要聲明部分中泰證券行業(yè)點評報告■在某些情況下,Claude甚至能夠識別出評估本身的局限性。因為它認(rèn)識到“針”的句子似乎是人為插入到原始文本中的。奶酪?!标P(guān)于比薩配料的其他信息。三版模型收費(fèi)有差異性,性價比較高■Claude3系列模型都能夠支持200k的上下文,可供選擇的價格區(qū)間非常廣泛,且具有較高性價比。Opus版本模型相比GPT-4(輸入價格$30/milliontokens,輸出價格$60/milliontokens)和GPT-4-32k(輸入價格$60/milliontokens,輸出價格$120/milliontokens)仍具有較高性價比。圖表11:Claude3系列模型定價輸入費(fèi)用輸出費(fèi)用上下文窗口任務(wù)自動化:計劃和執(zhí)行跨API和務(wù)和市場趨勢,預(yù)測銷售:產(chǎn)品推薦、預(yù)測、目標(biāo)營銷內(nèi)容審核:捕捉風(fēng)險行為或客戶請求比其他任何可用模型都具有更高的比具有相似智能的其他模型更經(jīng)資料來源:Anthropic,中泰證券研究統(tǒng)計時間為2024年3月5日表曲線背后的數(shù)據(jù)。如果將模型給出的數(shù)據(jù)畫圖(右圖藍(lán)色線)與真實的GDP數(shù)據(jù)(右圖紅色線)進(jìn)行比較,可以發(fā)現(xiàn)兩線趨勢非常接近。圖表12:圖表12:Claude3Opus讀圖并給出可能的擬合數(shù)據(jù)‘資料來源:Anthropic官方頻道圖表13:Claude3Opus對GDP數(shù)據(jù)進(jìn)行蒙特卡洛模擬中泰證券行業(yè)點評報告示世界經(jīng)濟(jì)的構(gòu)成在2020年到2030年間可能如何變化。使用子代理來并行化工作”,模型能夠為每個subagent(即獲取并分析每個國家的GDP數(shù)據(jù))撰寫出提示,并行地運(yùn)行這些agent(下圖左),并將結(jié)果匯總出圖表(下圖右),再給出對應(yīng)的文字分析。模型并行運(yùn)行SubAgent的進(jìn)度顯示模型最終給出的數(shù)據(jù)對比及預(yù)測圖資料來源:Anthropic官方頻道,中泰證券研究語言學(xué)習(xí)伙伴:Sonnet在多輪對話中回答風(fēng)格一致并記憶內(nèi)容■Sonnet能夠理解用戶的需求,并在多輪對話中保持回答的風(fēng)格一致。如英語母語者想要學(xué)習(xí)西班牙語,可以要求Sonnet將用戶的西班牙語提示先用英文表達(dá)出來,再給出正確的西班牙語描述,并給出回應(yīng)。在圖表15:Claude3Sonnet扮演語言學(xué)習(xí)伙伴的角色用戶在對話中不會用西班牙語描述“clement”,模型會給出相應(yīng)用法資料來源:Anthropic官方頻道,中泰證券研究■Sonnet能夠?qū)Χ噍唽υ拑?nèi)容進(jìn)行總結(jié)。如繼續(xù)提示模型對之前的對話內(nèi)容撰寫測試題,模型也能夠給出相應(yīng)的正確回應(yīng),這表明Sonnet能夠正確記憶并理解多輪對話中的內(nèi)容。中泰證券行業(yè)點評報告圖表16:Claude3Sonnet能夠記憶之前的對話■Anthropic始終遵循打造安全的人工智能并可靠地進(jìn)行部署的原則,重視人工智能的安全問題。在其官網(wǎng)首頁中他們也強(qiáng)調(diào)了其研究和產(chǎn)品以安全為先。核心原則構(gòu)建:使用Al進(jìn)行反饋,設(shè)立“憲法”約束Al (ConstitutionalAl,CAl)。與OpenA進(jìn)行價值觀對齊的思路不同,Anthropic通過為人工智能制定需要遵循的“憲法”對其進(jìn)行約束。這種方式更符合直覺,隨著模型規(guī)模越來越大和越來越“聰明”,這種約束可能有更好的效果和更高的性價比。Claude3在可用性、無害性上的提升就證明了這種路徑的可行性。這種憲法的應(yīng)用可以產(chǎn)生帕累托效應(yīng),比來自人類反饋的強(qiáng)化學(xué)習(xí)更有幫助,也更無害。中泰證券toRedTeaming”在2023年9月>ASL-1指的是不會造成有意義的災(zāi)難性風(fēng)險的系統(tǒng),例如2018年的■■中仍存在一些難以克服的技術(shù)障礙。例如大模型雖能模型需要大量的數(shù)據(jù)和計算資源,這在實際應(yīng)用中可能不切實際或成本過高。行業(yè)競爭加?。弘S著人工智能技術(shù)的普及,越來投入到這一領(lǐng)域,導(dǎo)致行業(yè)競爭日益激烈。這在隱私保護(hù)、數(shù)據(jù)安全和倫理方面。不同國家和地區(qū)對人政策存在差異,這可能給企業(yè)帶來合規(guī)挑戰(zhàn)。此外,說明買入預(yù)期未來6~12個月內(nèi)相對同期基準(zhǔn)指數(shù)漲幅在5%~15%之間持有預(yù)期未來6~12個月內(nèi)相對同期基準(zhǔn)指數(shù)漲幅在-10%~+5%之間預(yù)期未來6~12個月內(nèi)對同期基準(zhǔn)指數(shù)漲幅在10%以上中性預(yù)期未來6~12個月內(nèi)對同期基準(zhǔn)指數(shù)漲幅在-10%~+10%之間預(yù)期未來6~12個月內(nèi)對同期基準(zhǔn)指數(shù)跌幅在10%以上備注:評級標(biāo)準(zhǔn)為報告發(fā)布日后的6~12個月內(nèi)公司股價(或行業(yè)指數(shù))相對同期基準(zhǔn)指數(shù)的相對市場表現(xiàn)。其中A股市場以滬深300指數(shù)為基準(zhǔn);新三板市場以三板成指(針對協(xié)議轉(zhuǎn)讓標(biāo)的)或三板做市指數(shù)(針對做市轉(zhuǎn)讓標(biāo)的)為基準(zhǔn);香港市場以摩根士丹利中國指數(shù)為基準(zhǔn),美股市場以標(biāo)普500指數(shù)或納斯達(dá)克綜合指數(shù)為中泰證券中泰證券股份有限公司(以下簡稱“本公司”)具有中國證券監(jiān)督管理委員會許可的證券投資咨詢業(yè)務(wù)資格。本報告基于本公司及其研究人員認(rèn)為可信的公開資料或?qū)嵉卣{(diào)研資料,反映了作者的研究觀點,力求獨(dú)立、客觀和公正,結(jié)論不受任何第三方的授意或影響。本公司力求但不保證這些信息的準(zhǔn)確性和完整性,且本報告中的資料、意見、預(yù)測均反映報告初次公開發(fā)布時的判斷,可能會隨時調(diào)整。本公司對本報告所含信息可信息及推測只提供給客戶作參考之用,不構(gòu)成任何投資、法律、會計或稅務(wù)的最終操作建議,本公司不就報告中的內(nèi)容對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論