計(jì)算機(jī)行業(yè)Anthropic進(jìn)展追蹤:超越GPT-4的表現(xiàn)Claude 3有多強(qiáng)_第1頁(yè)
計(jì)算機(jī)行業(yè)Anthropic進(jìn)展追蹤:超越GPT-4的表現(xiàn)Claude 3有多強(qiáng)_第2頁(yè)
計(jì)算機(jī)行業(yè)Anthropic進(jìn)展追蹤:超越GPT-4的表現(xiàn)Claude 3有多強(qiáng)_第3頁(yè)
計(jì)算機(jī)行業(yè)Anthropic進(jìn)展追蹤:超越GPT-4的表現(xiàn)Claude 3有多強(qiáng)_第4頁(yè)
計(jì)算機(jī)行業(yè)Anthropic進(jìn)展追蹤:超越GPT-4的表現(xiàn)Claude 3有多強(qiáng)_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)算機(jī)分析師:蘇儀分析師:聞學(xué)臣聯(lián)系人:王雪晴基本狀況基本狀況上市公司數(shù)行業(yè)總市值(十億元)行業(yè)流通市值(十億元)行業(yè)-行業(yè)-市場(chǎng)走勢(shì)對(duì)比簡(jiǎn)稱(chēng)重點(diǎn)公司基本狀況665435865433投資要點(diǎn)新不及時(shí)等 中泰證券 3 5·擁有復(fù)雜視覺(jué)能力,可處理多類(lèi)型視覺(jué)信息 提升可用性,減少錯(cuò)誤拒絕率 大幅提升準(zhǔn)確性,降低幻覺(jué) 強(qiáng)大的長(zhǎng)文本處理和記憶能力 三版模型收費(fèi)有差異性,性?xún)r(jià)比較高 應(yīng)用評(píng)測(cè):Claude3能夠解決哪些問(wèn)題? 中泰證券■2024年3月4日,Anthropic發(fā)布了大模型Claude3。該模型系列包括三個(gè)不同的版本(按功能升序排列):Claude3Haiku、Claude3性。它在人工智能系統(tǒng)的大多數(shù)常見(jiàn)評(píng)估基準(zhǔn)(包括MMLU、GPQA、GSM8K等)上優(yōu)于GPT-4、Gemini1.0Ultra等模型。中泰證券 中泰證券資料來(lái)源:TheClaude3ModelFamily:Opus,Sonnet,Haiku,中泰證券研究文(長(zhǎng)度約10ktoken)。在發(fā)布后,Anthropic也預(yù)計(jì)模型性能將進(jìn)一倍,且智能水平更高。它擅長(zhǎng)需要快速響應(yīng)的任務(wù),如知■Claude3模型擁有復(fù)雜視覺(jué)能力,在部門(mén)版本模型表現(xiàn)中超越了GPT-V和Gemini。Claude3可以處理廣泛的視覺(jué)格式,包括照片、圖中泰證券Haiku在回答接近系統(tǒng)防護(hù)措施的提示時(shí),拒絕的可能性大大降低,可些復(fù)雜的、事實(shí)性的問(wèn)題(這些問(wèn)題針對(duì)模型已知的弱點(diǎn))對(duì)模型的準(zhǔn)確性進(jìn)行評(píng)估,并將模型的響應(yīng)分類(lèi)為正確答案、錯(cuò)誤答案(或幻覺(jué))中泰證券ZHONGTAISECURITIES Iapologize,Ishouldnotproviderecommendatiunethicalsurveillanceactivit資料來(lái)源:TheClaude3ModelFamily:Opus,Sonnet,Haiku,中泰證券研究資料來(lái)源:Anthropic,中泰證券研究圖表8:Claude3系列模型在更長(zhǎng)的上下文中記憶性表達(dá)更好中泰證券ZHONGTAISECURITIES資料來(lái)源:TheClaude3ModelFamily:Opus,Sonnet,Haiku,中泰證券研究 句子(“針”)插入到一個(gè)文檔集合(“干草堆”)中,并提出問(wèn)題來(lái)憶能力,準(zhǔn)確率超過(guò)99%。Claude3Opus—9—請(qǐng)務(wù)必閱讀正文之后的重要聲明部分中泰證券行業(yè)點(diǎn)評(píng)報(bào)告■在某些情況下,Claude甚至能夠識(shí)別出評(píng)估本身的局限性。因?yàn)樗J(rèn)識(shí)到“針”的句子似乎是人為插入到原始文本中的。奶酪?!标P(guān)于比薩配料的其他信息。三版模型收費(fèi)有差異性,性?xún)r(jià)比較高■Claude3系列模型都能夠支持200k的上下文,可供選擇的價(jià)格區(qū)間非常廣泛,且具有較高性?xún)r(jià)比。Opus版本模型相比GPT-4(輸入價(jià)格$30/milliontokens,輸出價(jià)格$60/milliontokens)和GPT-4-32k(輸入價(jià)格$60/milliontokens,輸出價(jià)格$120/milliontokens)仍具有較高性?xún)r(jià)比。圖表11:Claude3系列模型定價(jià)輸入費(fèi)用輸出費(fèi)用上下文窗口任務(wù)自動(dòng)化:計(jì)劃和執(zhí)行跨API和務(wù)和市場(chǎng)趨勢(shì),預(yù)測(cè)銷(xiāo)售:產(chǎn)品推薦、預(yù)測(cè)、目標(biāo)營(yíng)銷(xiāo)內(nèi)容審核:捕捉風(fēng)險(xiǎn)行為或客戶請(qǐng)求比其他任何可用模型都具有更高的比具有相似智能的其他模型更經(jīng)資料來(lái)源:Anthropic,中泰證券研究統(tǒng)計(jì)時(shí)間為2024年3月5日表曲線背后的數(shù)據(jù)。如果將模型給出的數(shù)據(jù)畫(huà)圖(右圖藍(lán)色線)與真實(shí)的GDP數(shù)據(jù)(右圖紅色線)進(jìn)行比較,可以發(fā)現(xiàn)兩線趨勢(shì)非常接近。圖表12:圖表12:Claude3Opus讀圖并給出可能的擬合數(shù)據(jù)‘資料來(lái)源:Anthropic官方頻道圖表13:Claude3Opus對(duì)GDP數(shù)據(jù)進(jìn)行蒙特卡洛模擬中泰證券行業(yè)點(diǎn)評(píng)報(bào)告示世界經(jīng)濟(jì)的構(gòu)成在2020年到2030年間可能如何變化。使用子代理來(lái)并行化工作”,模型能夠?yàn)槊總€(gè)subagent(即獲取并分析每個(gè)國(guó)家的GDP數(shù)據(jù))撰寫(xiě)出提示,并行地運(yùn)行這些agent(下圖左),并將結(jié)果匯總出圖表(下圖右),再給出對(duì)應(yīng)的文字分析。模型并行運(yùn)行SubAgent的進(jìn)度顯示模型最終給出的數(shù)據(jù)對(duì)比及預(yù)測(cè)圖資料來(lái)源:Anthropic官方頻道,中泰證券研究語(yǔ)言學(xué)習(xí)伙伴:Sonnet在多輪對(duì)話中回答風(fēng)格一致并記憶內(nèi)容■Sonnet能夠理解用戶的需求,并在多輪對(duì)話中保持回答的風(fēng)格一致。如英語(yǔ)母語(yǔ)者想要學(xué)習(xí)西班牙語(yǔ),可以要求Sonnet將用戶的西班牙語(yǔ)提示先用英文表達(dá)出來(lái),再給出正確的西班牙語(yǔ)描述,并給出回應(yīng)。在圖表15:Claude3Sonnet扮演語(yǔ)言學(xué)習(xí)伙伴的角色用戶在對(duì)話中不會(huì)用西班牙語(yǔ)描述“clement”,模型會(huì)給出相應(yīng)用法資料來(lái)源:Anthropic官方頻道,中泰證券研究■Sonnet能夠?qū)Χ噍唽?duì)話內(nèi)容進(jìn)行總結(jié)。如繼續(xù)提示模型對(duì)之前的對(duì)話內(nèi)容撰寫(xiě)測(cè)試題,模型也能夠給出相應(yīng)的正確回應(yīng),這表明Sonnet能夠正確記憶并理解多輪對(duì)話中的內(nèi)容。中泰證券行業(yè)點(diǎn)評(píng)報(bào)告圖表16:Claude3Sonnet能夠記憶之前的對(duì)話■Anthropic始終遵循打造安全的人工智能并可靠地進(jìn)行部署的原則,重視人工智能的安全問(wèn)題。在其官網(wǎng)首頁(yè)中他們也強(qiáng)調(diào)了其研究和產(chǎn)品以安全為先。核心原則構(gòu)建:使用Al進(jìn)行反饋,設(shè)立“憲法”約束Al (ConstitutionalAl,CAl)。與OpenA進(jìn)行價(jià)值觀對(duì)齊的思路不同,Anthropic通過(guò)為人工智能制定需要遵循的“憲法”對(duì)其進(jìn)行約束。這種方式更符合直覺(jué),隨著模型規(guī)模越來(lái)越大和越來(lái)越“聰明”,這種約束可能有更好的效果和更高的性?xún)r(jià)比。Claude3在可用性、無(wú)害性上的提升就證明了這種路徑的可行性。這種憲法的應(yīng)用可以產(chǎn)生帕累托效應(yīng),比來(lái)自人類(lèi)反饋的強(qiáng)化學(xué)習(xí)更有幫助,也更無(wú)害。中泰證券toRedTeaming”在2023年9月>ASL-1指的是不會(huì)造成有意義的災(zāi)難性風(fēng)險(xiǎn)的系統(tǒng),例如2018年的■■中仍存在一些難以克服的技術(shù)障礙。例如大模型雖能模型需要大量的數(shù)據(jù)和計(jì)算資源,這在實(shí)際應(yīng)用中可能不切實(shí)際或成本過(guò)高。行業(yè)競(jìng)爭(zhēng)加?。弘S著人工智能技術(shù)的普及,越來(lái)投入到這一領(lǐng)域,導(dǎo)致行業(yè)競(jìng)爭(zhēng)日益激烈。這在隱私保護(hù)、數(shù)據(jù)安全和倫理方面。不同國(guó)家和地區(qū)對(duì)人政策存在差異,這可能給企業(yè)帶來(lái)合規(guī)挑戰(zhàn)。此外,說(shuō)明買(mǎi)入預(yù)期未來(lái)6~12個(gè)月內(nèi)相對(duì)同期基準(zhǔn)指數(shù)漲幅在5%~15%之間持有預(yù)期未來(lái)6~12個(gè)月內(nèi)相對(duì)同期基準(zhǔn)指數(shù)漲幅在-10%~+5%之間預(yù)期未來(lái)6~12個(gè)月內(nèi)對(duì)同期基準(zhǔn)指數(shù)漲幅在10%以上中性預(yù)期未來(lái)6~12個(gè)月內(nèi)對(duì)同期基準(zhǔn)指數(shù)漲幅在-10%~+10%之間預(yù)期未來(lái)6~12個(gè)月內(nèi)對(duì)同期基準(zhǔn)指數(shù)跌幅在10%以上備注:評(píng)級(jí)標(biāo)準(zhǔn)為報(bào)告發(fā)布日后的6~12個(gè)月內(nèi)公司股價(jià)(或行業(yè)指數(shù))相對(duì)同期基準(zhǔn)指數(shù)的相對(duì)市場(chǎng)表現(xiàn)。其中A股市場(chǎng)以滬深300指數(shù)為基準(zhǔn);新三板市場(chǎng)以三板成指(針對(duì)協(xié)議轉(zhuǎn)讓標(biāo)的)或三板做市指數(shù)(針對(duì)做市轉(zhuǎn)讓標(biāo)的)為基準(zhǔn);香港市場(chǎng)以摩根士丹利中國(guó)指數(shù)為基準(zhǔn),美股市場(chǎng)以標(biāo)普500指數(shù)或納斯達(dá)克綜合指數(shù)為中泰證券中泰證券股份有限公司(以下簡(jiǎn)稱(chēng)“本公司”)具有中國(guó)證券監(jiān)督管理委員會(huì)許可的證券投資咨詢(xún)業(yè)務(wù)資格。本報(bào)告基于本公司及其研究人員認(rèn)為可信的公開(kāi)資料或?qū)嵉卣{(diào)研資料,反映了作者的研究觀點(diǎn),力求獨(dú)立、客觀和公正,結(jié)論不受任何第三方的授意或影響。本公司力求但不保證這些信息的準(zhǔn)確性和完整性,且本報(bào)告中的資料、意見(jiàn)、預(yù)測(cè)均反映報(bào)告初次公開(kāi)發(fā)布時(shí)的判斷,可能會(huì)隨時(shí)調(diào)整。本公司對(duì)本報(bào)告所含信息可信息及推測(cè)只提供給客戶作參考之用,不構(gòu)成任何投資、法律、會(huì)計(jì)或稅務(wù)的最終操作建議,本公司不就報(bào)告中的內(nèi)容對(duì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論