DeepSeek將如何改變AI應用_第1頁
DeepSeek將如何改變AI應用_第2頁
DeepSeek將如何改變AI應用_第3頁
DeepSeek將如何改變AI應用_第4頁
DeepSeek將如何改變AI應用_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2核心觀點從kimi(月之暗面)到智譜,從豆包(字節(jié))到DeepSeek,中國基礎(chǔ)大模型一直處于快速演進之中,演進的主旋律則體現(xiàn)為性能提升和成本降低,與計算機歷史上PC、互聯(lián)網(wǎng)的發(fā)展邏輯類似。我們總結(jié)了以下三個關(guān)鍵詞:關(guān)鍵詞1:低成本。與暴力美學的大模型相對應的就是高成本,動則數(shù)百上千萬元的成本投入在很大程度上制約了下游需求的釋放,在中國當前的宏觀環(huán)境下這種挑戰(zhàn)更為明顯。DeepSeek帶來的成本指數(shù)級下降,將會大大加速AI應用的落地進程。關(guān)鍵詞2:開源。伴隨閉源基礎(chǔ)大模型能力不斷提升之后,是否會向上侵蝕應用市場成為了市場的一種擔憂。而開源體系大大降低這種可能:1)開源體系需要生態(tài)繁榮,基模廠商與應用廠商是合作關(guān)系;2)對于應用廠商而言,開源大模型的可獲得性、可把握性更強,更容易基于此構(gòu)建自己的垂直模型和能力。關(guān)鍵詞3:中國。中國具有廣闊的應用場景,但一方面接入海外OpenAI模型存在一定的障礙,另一方面中國的基礎(chǔ)大模型能力存在差距。DeepSeek縮小了這種能力差距,一定程度上補齊了中國AI應用的底座短板。3目錄CCONTECONTENTS1Big

Picture:從基礎(chǔ)模型的能力上限和應用成本談起4圖表:AI應用分析框架資料來源:應用的分析框架:能力上限與應用成本共同決定應用場景?

AI隨模型能力的提升和應用成本的降低,共同解鎖更多應用場景。技術(shù)-能力上限曲線價格-應用成本曲線模型能力上限模型定價應用場景隨模型能力提升和成本降低而不斷解鎖;DeepSeek的低成本+強能力將解鎖更多應用場景;……對話場景;

AI搜索; 營銷智能客服;

AI代碼; 醫(yī)療…… …… 法律5圖表:R1在各項任務中的表現(xiàn)資料來源:

DeepSeek-R1:

Incentivizing Reasoning Capability

in LLMsviaReinforcement

Learning,圖表:DeepSeek

V3和其他模型的表現(xiàn)對比資料來源:DeepSeek-V3

Technical

Report,能力上限之一:DeepSeek系列模型擁有比肩GPT-4o、Claude3.5和o1的能力?

DeepSeek

V3再次展現(xiàn)出能力上限突破,在MMLU、MATH

500等任務中均表現(xiàn)除了優(yōu)于GPT-4o和Claude-3.5-Sonnet的SOTA能力。其發(fā)布的推理模型DeepSeek-R1在數(shù)學、編程等推理任務中接近或達到了o1的水平。圖表:隨步數(shù)提升R1-Zero的AIME任務準確度資料來源:DeepSeek-R1:

Incentivizing

Reasoning

Capability

in

LLMs

viaReinforcement

Learning,能力上限之二:后訓練階段大規(guī)模應用強化學習,表現(xiàn)推理能力擴展?

DeepSeek模型在Post-Train階段大規(guī)模應用了強化學習方法。R1使用了冷啟動微調(diào)+強化學習方法,R1-Zero版本模型使用純強化學習方法。隨訓練過程推進,模型展現(xiàn)出了推理能力的擴展(高準確率和long-CoT能力涌現(xiàn)等)。圖表:深度思考能力提升資料來源:DeepSeek-R1:

Incentivizing

Reasoning

Capability

in

LLMs

viaReinforcement

Learning,DeepSeek-R1-Zero的能力隨步數(shù)提升DeepSeek-R1-Zero自然涌現(xiàn)long-CoT能力6資料來源:DeepSeek-R1:

Incentivizing

Reasoning

Capability

in

LLMs

via

Reinforcement

Learning,能力上限之二:純強化學習的R1-Zero展現(xiàn)出“Aha

Moment”能力涌現(xiàn)?

RL下模型展現(xiàn)出了自主開發(fā)先進問題解決策略的行為:1)模型表現(xiàn)出了“Aha

moment”,突然學會更有效的推理方式,也增加了推理復雜度;2)模型在訓練過程中出現(xiàn)了Reflection能力,能夠重新評估初始方法來學習為問題分配更多的思考時間。雖然應用純強化學習方法的R1-Zero在穩(wěn)定性、可讀性上仍有差距(存在多語言混雜生成現(xiàn)象),但AhaMoment、Reflection等能力的出現(xiàn)展現(xiàn)出了純強化學習方法的巨大潛力。圖表:訓練過程中R1-Zero表現(xiàn)出的Aha

Moment7圖表:Janus-Pro多模態(tài)理解和視覺生成表現(xiàn)能力上限之三:開源Janus-Pro模型,圖像生成和多模態(tài)理解能力大幅提升Janus-Pro

結(jié)合了優(yōu)化的訓練策略,擴展了訓練數(shù)據(jù)集和模型規(guī)模。通過這些改進,Janus-Pro

在多模態(tài)理解和文本到圖像的指令跟蹤功能方面都取得了重大進步,同時還增強了文本到圖像生成的穩(wěn)定性。作為在GenEval等評測中超越DALL-E

3和Stable

Diffusion

3-Medium的開源模型,Janus-Pro也展現(xiàn)出了更多應用潛力。資料來源:Janus-Pro:

Unified

Multimodal

UnderstandingandGeneration

with

Data

and

Model

Scaling,8應用成本之一:極致優(yōu)化的工程化方法,大幅降低訓推成本?

DeepSeek在訓練階段采用了多種方法降低訓練成本,并保證模型的良好表現(xiàn)。1)冷啟動:構(gòu)建并收集少量

Long-CoT

數(shù)據(jù)來微調(diào)模型,而非單純運用大規(guī)模RLHF或RL,很好地平衡了性能和成本;2)MLA(多頭潛在注意力機制)的優(yōu)化:降低了鍵值量緩存需求,減少算力壓力;后續(xù)的ALFS(無輔助損失負載均衡策略)方法:能讓MoE的專家在偏好值和工作量上達成平衡狀態(tài),當負載比較大的時候能夠轉(zhuǎn)移到其他專家上,加強了模型整體性能的負載均衡與穩(wěn)定性。圖表:DeepSeek-R1訓練過程資料來源:木堯,9圖表:閉源模型與開源模型的差距正在縮小圖表:DeepSeek-R1

api價格與o1對比應用成本之二:低推理成本+開源,api成本僅為o1幾十分之一對V3進行蒸餾的R1在數(shù)學、代碼能力上再次顯著提升。MoE架構(gòu)的R1模型共有671B規(guī)模,激活后的參數(shù)量為37B,部署時能夠大大節(jié)省推理成本。DeepSeek開源了模型,API的調(diào)用價格也大幅低于OpenAI。以O(shè)utput

API價格為例,DeepSeek-R1大約是OpenAI的3.7%。以R1為代表的優(yōu)秀開源模型的能力也離閉源模型越來越近。DeepSeek-R1的Output

API價格約為o1的3.7%資料來源:DeepSeek,資料來源:Epoch

AI,10圖表:各模型微調(diào)示例數(shù)與準確度對比圖表:s1表現(xiàn)出的Test

time

Scaling應用成本之三:蒸餾小型模型展現(xiàn)Test-time

Scaling,有極高應用潛力通過將DeepSeek-R1的推理能力蒸餾到更小的模型中,較小的模型也能具備強大的推理能力。DeepSeek開源了從15

億到700億參數(shù)的R1蒸餾版本。這些模型基于Qwen和Llama等架構(gòu)蒸餾,表明復雜的推理能力可以被封裝在更小、更高效的模型中。從論文結(jié)論看,蒸餾比單獨依賴強化學習訓練更為高效,且蒸餾與強化學習的結(jié)合可以進一步提升模型性能。2025年2月,科學家李飛飛團隊帶領(lǐng)以不到50美元的費用訓練了一個能力比肩DeepSeek-R1的s1模型,也展現(xiàn)了蒸餾模型應用的更多應用潛力。S1僅使用1000個微調(diào)示例就達到了類似r1的準確度資料來源:s1:

Simple

test-time

scaling,資料來源:s1:

Simple

test-time

scaling,11模型展現(xiàn)出隨推理時間增加準確度增加的Test

time

Scaling12目錄CCONTECONTENTS2應用場景:通用+行業(yè)場景不斷解鎖,關(guān)注B端SaaS落地+AI安全13圖表:2022-2027自動化市場規(guī)模預測($B)資料來源:IDC,圖表:Service

as

a

Software面向的市場規(guī)模資料來源:Sequoia

Capital,理解應用層公司的價值創(chuàng)造:取代人力,瞄向萬億級別的服務市場應用層AI公司不僅是基礎(chǔ)模型之上的前端界面,而是擁有復雜的認知架構(gòu)的應用產(chǎn)品。通常包括多個基礎(chǔ)模型,上面有某種路由機制,用于檢索增強生成(RAG)的向量和

/

或圖數(shù)據(jù)庫,合規(guī)性和安全性防護手段,以及模仿人類在工作流程中進行推理思考方式的應用邏輯。借助Agent,應用層軟件公司能夠?qū)⒎辙D(zhuǎn)化為軟件(Service-as-a-Software)。這意味著應用的目標市場不是軟件市場,而是以萬億美元計的服務市場。而隨著基礎(chǔ)模型推理成本快速下降和性能提升,這種應用的價值創(chuàng)造增速將遠超傳統(tǒng)軟件模式。070605040302010202320242022Labor-c2025

2026

2027System-centric

automation圖表:辦公軟件類別占比情況(截至2024年4月)資料來源:頭豹研究院,通用場景之一:生產(chǎn)力工具對應生成能力,AI加速滲透?

生產(chǎn)力工具能夠較好嵌入和應用大模型的生成能力,將最先受益于模型能力上限提升和成本下降。如以O(shè)ffice365Copilot、WPS

AI為代表的AI+辦公軟件和以Midjourney、Sora為代表的多模態(tài)生成模型正在加速滲透。據(jù)智聯(lián)招聘調(diào)研,2025年春招首周約60%職場人已經(jīng)在工作中使用AI工具,明顯高于去年同期的44%。39%21%4%13%AI+文字處理AI+通訊協(xié)作類AI+演示協(xié)作類AI+數(shù)據(jù)處理類AI+項目管理類14圖表:用戶對Github

Copilot的評價資料來源:Github,通用場景之二:AICoding大幅提升編程效率,用戶數(shù)快速上升Cursor是AI驅(qū)動的代碼編輯器,能夠無縫與VS

Code集成。通過先提供新用戶2000次代碼免費生成功能,再轉(zhuǎn)化付費的方式,目前Cursor已經(jīng)擁有超過36萬名個人開發(fā)者。個人用戶每月支付20-40美元,平均合同價值為276美元,ARR從$1M到$100M僅用了不到兩年時間。Github

Copilot發(fā)布以來,幫助開發(fā)人員將Coding速度提高55%。隨用戶數(shù)超過1.5億,GitHub也宣布將開設(shè)免費的GitHubCopilot服務,并將服務集成到了新版的VS

Code中。新用戶也可擁有每月2000

次代碼補全和50條聊天消息的免費額度。圖表:各公司ARR增速與時間的關(guān)系資料來源:SACRA,Spearhead,7.90%0%0%10%50.90%50%40%29.70%30%20%11.50%60%極其有用有用稍微有用完全無用用戶比例15通用場景之三:AI搜索以O(shè)verviews形式落地,Perplexity

AI等SaaS公司崛起AI搜索已經(jīng)能夠為用戶提供精確的信息來源,大幅提升搜索效率。Google等搜索引擎提供了AIOverviews功能,通過綜合來自多個來源的信息以提供更全面的摘要。這種方法讓用戶更廣泛地了解搜索結(jié)果,無需點擊多個鏈接。AI搜索公司Perplexity以對話形式為用戶提供搜索的答案,每月處理約4億次搜索查詢。公司估值實現(xiàn)了24年初的5.2億美元到年底90億美元的快速增長。AI搜索也將賦能私域數(shù)據(jù)搜索。據(jù)Hebbia,Google僅索引了全球4%的數(shù)據(jù)。大部分的私有數(shù)據(jù),如企業(yè)ERP、CRM或者OA系統(tǒng)中的各種數(shù)據(jù)未得到充分利用。圖表:Perplexity

AI的估值增長(單位:$billion) 圖表:Google

Overviews示意1098765432102024年1月 2024年4月 2024年6月 2024資料來源:Google,資料來源:Crunchbase,Bloomberg,Datawrapper,16圖表:營銷人員對GenAI帶來ROI的定義資料來源:Statista,通用場景之四:AI營銷重構(gòu)傳統(tǒng)營銷模式,降本增效潛力初顯AI營銷通過數(shù)據(jù)智能、自動化和個性化技術(shù),正在重構(gòu)傳統(tǒng)營銷模式,成為企業(yè)降本增效、提升客戶體驗的核心工具。IDC預計GenAI在未來五年內(nèi)將營銷生產(chǎn)力提高40%以上的潛力。

Applovin提供了提升ARPDAU、增加廣告庫存、獲取App用戶和增加應用內(nèi)購買。未來GenAI有望直接生成廣告并創(chuàng)造收入。據(jù)Accenture的預測,到2029年30%的社交媒體廣告,將由AI自動生成。51%50%47%46%42%40%30%20%10%0%50%60%效率改善客戶關(guān)系有效的數(shù)據(jù)分析提高財務收益準確的預測圖表:Applovin擴大受眾群體增收的途徑資料來源:Applovin,17圖表:SAP

Joule

Agent平臺通用場景之五:AI

+

ERP

/HR等企業(yè)SaaS場景?

AI能夠賦能B端SaaS軟件,在企業(yè)通用領(lǐng)域提供AI能力。AI+ERP(如SAP、金蝶)產(chǎn)品能夠?qū)崿F(xiàn)對財務和運營數(shù)據(jù)的分析跟蹤;AI+HR(如北森)產(chǎn)品能夠賦能人力資源管理,在AI面試等場景實現(xiàn)降本增效。圖表:北森AI面試降低成本資料來源:SAP,資料來源:北森,1819資料來源:LeewayHertz,行業(yè)場景之一:醫(yī)療行業(yè)診斷/治療跟蹤、行政任務的各類流程自動化?

AI在醫(yī)療領(lǐng)域的應用涉及各部門的優(yōu)化與效率提升。1)診斷輔助和醫(yī)學圖像分析:人工智能代理使用深度學習算法分析醫(yī)學圖像,以協(xié)助放射科醫(yī)生檢測異常并做出準確診斷;2)個性化治療計劃和預測分析:AI代理使用患者數(shù)據(jù)和醫(yī)學文獻制定針對個人患者需求和病史的個性化治療計劃;預測分析模型可預測疾病進展和治療結(jié)果;3)藥物發(fā)現(xiàn)和開發(fā):人工智能代理通過分析大量數(shù)據(jù)集來識別潛在的候選藥物、預測療效并優(yōu)化臨床試驗流程,從而加快藥物發(fā)現(xiàn);4)虛擬健康助手和患者監(jiān)測:人工智能虛擬健康助手為患者提供實時指導、健康建議和提醒。人工智能代理還可以實現(xiàn)遠程患者監(jiān)測,以便盡早發(fā)現(xiàn)健康問題并采取主動干預措施;5)行政任務自動化:

AI代理自動執(zhí)行行政任務,例如預約安排、醫(yī)療轉(zhuǎn)錄和計費流程,以簡化醫(yī)療保健運營并減輕行政負擔。圖表:AI

Agent在醫(yī)療領(lǐng)域的功能資料來源:LeewayHertz,行業(yè)場景之二:法律行業(yè)取證、盡調(diào)、訴訟支持等各類流程自動化?

AI在法律行業(yè)已經(jīng)滲透至各工作流程中??梢詤⑴c的過程包括:1)電子取證與調(diào)查,涉及大量電子數(shù)據(jù)的識別、收集和分析,加速過程;2)合同審查與盡職調(diào)查,自動化和增強勞動密集型的合同審查和盡職調(diào)查流程;3)訴訟支持,自動化大量文檔的處理;圖表:AI法律工作流應用20行業(yè)場景之三:多模態(tài)突破大幅增強人形機器人泛化能力資料來源:甲子光年,多模型大模型為具身智能發(fā)展打開空間。

“具身智能(EmbodiedAI)”指有物理載體的智能體,在與物理世界的交互過程中,通過感知、控制和自主學習來積累知識和技能,形成智能并影響物理世界的能力。人工智能算法的發(fā)展,尤其是多模態(tài)大模型技術(shù)的突破性進展,將顯著加速機器人產(chǎn)業(yè)的發(fā)展,提升機器人的智能水平,使得機器人能夠自主進行判斷和識別,執(zhí)行復雜的多階段語義推理任務,不僅提高了機器人的泛化能力,也快速推動了人形機器人通往量產(chǎn)的進程。圖表:具身智能的不同階段及意義 圖表:大模型與Agent技術(shù)是機器人產(chǎn)業(yè)突破臨界點的關(guān)鍵資料來源:甲子光年,21資料來源:鑒智機器人、?

自動駕駛將是通用機器人的最先落地場景。在CVPR

2023會議上,特斯拉公司介紹了他們研發(fā)的“通用世界模型”。該模型具備強大的功能,能夠?qū)ξ磥硎录M行有效預測,并且可以通過人為干預進行控制。此外,它能夠以多種形式輸出結(jié)果,極大地便利了仿真實驗的開展,為科研和技術(shù)創(chuàng)新提供了新的可能。隨著通用世界模型的成熟和落地,未來智能汽車也將成為一個通用的端側(cè)智能體,自動駕駛或?qū)⒊蔀橥ㄓ脵C器人的最先落地場景。圖表:汽車由專用智能向通用智能發(fā)展行業(yè)場景之三:通用具身智能場景中,智能駕駛將最先落地22資料來源:Microsoft,AI安全:與技術(shù)進步相伴相生,永不過時的話題DeepSeek遭受了大規(guī)模惡意攻擊,引發(fā)了AI安全的關(guān)注。1月28日,DeepSeek官網(wǎng)服務狀態(tài)頁面顯示:近期DeepSeek線上服務受到大規(guī)模惡意攻擊,為持續(xù)提供服務,暫時限制了+86手機號以外的注冊方式。DeepSeek面臨的核心網(wǎng)絡(luò)安全事件可能包括數(shù)據(jù)泄露、越獄攻擊和DDoS等。我們認為,AI的部署和應用必然誕生新的安全問題,但另一方面AI技術(shù)的突破也可促進主動防御技術(shù)創(chuàng)新、數(shù)據(jù)隱私與合規(guī)增強、身份認證和訪問控制升級與安全響應效率提升。圖表:微軟概括的AI安全體系23投資建議我們認為當下時點需要重視AI應用,中國AI應用有望迎來數(shù)年的黃金發(fā)展期。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論