




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
DeepSeekDeepSeek智能時代的全面到來和人機(jī)協(xié)作的新常態(tài)孫凌云教授計算機(jī)科學(xué)與技術(shù)學(xué)院2025年2月維基鏈接CommonCrawl數(shù)據(jù)總計4.64.6ThePilev164.66.4表:主要數(shù)據(jù)集大小匯總,以GB為單位。公開的數(shù)據(jù)集以粗體表示,確定的數(shù)據(jù)以斜體表示。CommonCrawl數(shù)據(jù)集過濾之前為45T來源:OpenAI團(tuán)隊,LanguageModelsareFew-ShotLearners,/abs/2005.14165,2022年7月22日34由AI(DeepSeekR1)搜集并整理,經(jīng)人工檢查4三體人如何學(xué)習(xí)地球知識?三體人如何學(xué)習(xí)地球知識?電磁波探測器拯救派電磁波地球文明信息原始數(shù)據(jù)、無目標(biāo)性探測器探測器搜集數(shù)據(jù)集電磁波地球文明信息原始數(shù)據(jù)、無目標(biāo)性探測器探測器搜集數(shù)據(jù)集精準(zhǔn)觀察、查漏補(bǔ)缺拯救派人類反饋實現(xiàn)對齊動態(tài)反饋、價值博弈三體人如何學(xué)習(xí)地球知識?拯救派人類反饋實現(xiàn)對齊動態(tài)反饋、價值博弈拯救派人類反饋實現(xiàn)對齊動態(tài)反饋、價值博弈電磁波地球文明信息原始數(shù)據(jù)、無目標(biāo)性探測器搜集數(shù)據(jù)集精準(zhǔn)觀察、查漏補(bǔ)缺定向能力強(qiáng)化價值觀校準(zhǔn)原始數(shù)據(jù)基建定向能力強(qiáng)化價值觀校準(zhǔn)三體人如何學(xué)習(xí)地球知識?電磁波探測器拯救派人類反饋強(qiáng)化學(xué)習(xí)人類反饋強(qiáng)化學(xué)習(xí)預(yù)訓(xùn)練三體人如何學(xué)習(xí)地球知識?電磁波基礎(chǔ)模型電磁波基礎(chǔ)模型強(qiáng)化學(xué)習(xí)結(jié)合準(zhǔn)確性獎勵(數(shù)學(xué)、編程等任務(wù)的可驗證結(jié)果)和格式獎勵(強(qiáng)制輸出結(jié)構(gòu)化標(biāo)簽),通過GRPO算法優(yōu)化模型三體人如何學(xué)習(xí)地球知識?電磁波基礎(chǔ)模型電磁波基礎(chǔ)模型強(qiáng)化學(xué)習(xí)數(shù)學(xué)題自動判分/編程題實戰(zhàn)演練/階梯進(jìn)化結(jié)合準(zhǔn)確性獎勵(數(shù)學(xué)、編程等任務(wù)的可驗證結(jié)果)和格式獎勵(強(qiáng)制輸出結(jié)構(gòu)化標(biāo)簽),通過GRPO算法優(yōu)化模型https://huggingface.co/papers/2501.12948TheuserasksaquesThereasoningprocessandanswerareenclosedwithin2025年1月22日Ahamoment頓悟時刻人類長期思考后的靈感閃現(xiàn)強(qiáng)化學(xué)習(xí)中的獎勵信號引導(dǎo)結(jié)合準(zhǔn)確性獎勵(數(shù)學(xué)、編程等任務(wù)的可驗證結(jié)果)和格式獎勵(強(qiáng)制輸出結(jié)構(gòu)化標(biāo)簽),通過GRPO強(qiáng)化學(xué)習(xí)策略后訓(xùn)練V3模型Ahamoment頓悟時刻人類長期思考后的靈感閃現(xiàn)強(qiáng)化學(xué)習(xí)中的獎勵信號引導(dǎo)結(jié)合準(zhǔn)確性獎勵(數(shù)學(xué)、編程等任務(wù)的可驗證結(jié)果)和格式獎勵(強(qiáng)制輸出結(jié)構(gòu)化標(biāo)簽),通過GRPO強(qiáng)化學(xué)習(xí)策略后訓(xùn)練V3模型來源:/think/topics/chain-of-thoughts20表格內(nèi)容由AI生成,使用DeepSeekR1自動整理https://x.ai/blog/grok-3來源:/xai/status/18916997152987304822025年2月18日算力路線xAI發(fā)布會,DeepSeek白皮書訓(xùn)練成本估算2.1億/5億美元,含基礎(chǔ)設(shè)施558萬美元(單次訓(xùn)練成本)Axios成本報告技術(shù)特性2.7萬億參數(shù)動態(tài)架構(gòu)通過ThinkMode分解問題(如火星軌道計算調(diào)用9個子模型協(xié)同)671B參數(shù)僅激活少量參數(shù)完成同類任務(wù)xAI技術(shù)文檔,DeepSeek-V3技術(shù)表數(shù)學(xué)推理xAI基準(zhǔn)測試,DeepSeek-V3數(shù)據(jù)表代碼生成LiveCodeBench57%LiveCodeBench40.5%Radargit性能對比訓(xùn)練能耗相當(dāng)于30萬戶家庭年用電相當(dāng)于于3000戶家庭年用電xAI發(fā)布會實錄推理成本$0.015/次$0.0018/次Radargit成本對比生態(tài)策略封閉生態(tài)X平臺,但提供實時數(shù)據(jù)接口開源策略允許開發(fā)者定制思維鏈展示規(guī)則Radargit行業(yè)分析使用DeepSeekR1自動整理,含第三方估計數(shù)據(jù)25DeepSeek-R1GPT-o1/通義千問QwQ-32B/天工Skyworko1/訊飛星火X1/GeminiUltra/Grok3-語言模式匹配與統(tǒng)計規(guī)律學(xué)習(xí)-上下文連貫性與生成流暢度-大規(guī)模數(shù)據(jù)泛化-復(fù)雜邏輯分析與多步驟推理-符號化規(guī)則與結(jié)構(gòu)化思維鏈構(gòu)建-邏輯驗證準(zhǔn)確性-基于Transformer的并行化生成-端到端模式識別-依賴提示工程提升表現(xiàn)-原子推理模塊組合(如批判性思維、逐步推導(dǎo))-需強(qiáng)化學(xué)習(xí)優(yōu)化推理路徑-開放域?qū)υ挘头C(jī)器人)-文本創(chuàng)作(小說/詩歌生成)-數(shù)學(xué)定理證明(如代數(shù)方程求解)-動態(tài)規(guī)劃算法設(shè)計-實時決策系統(tǒng)(自動駕駛)),-FP8混合精度訓(xùn)練減少內(nèi)存占用與計算量-強(qiáng)化學(xué)習(xí)直接用于基礎(chǔ)模型(無需監(jiān)督微調(diào))-知識蒸餾技術(shù)縮短后訓(xùn)練周期-動態(tài)知識庫與多模態(tài)引擎加速迭代-FP8混合精度框架首次驗證超大規(guī)模模型可行性-負(fù)載均衡策略減少性能損失-知識蒸餾將大模型能力遷移至小模型(如15B參數(shù)模型)-動態(tài)稀疏注意力降低計算復(fù)雜度注:使用秘塔搜索(R1推理模型)總結(jié),內(nèi)容未經(jīng)人工確認(rèn),格式經(jīng)人工調(diào)整。詳情參考:/s/ZYdtday/s/TM0D0rP/pdf/2311.02462.pdf/pdf/2311.02462.pdf/sites/jodiecook/2024/07/16/openais-5-levels-of-super-ai-agi-to-outperform-human-capability/2024年7月16日來源:ARKInvest/big-ideas-20242024年1月31日33能力涌現(xiàn)不可逆社會影響倒計時人機(jī)協(xié)作新常態(tài)來源:/technology/chatgpt-opens-door-to-four-day-week-says-nobel-prize-winner-20230406-p5cyki來源:ARKInvest/big-ideas-20242024年1月31日37來源:Stella,F.,DellaSantina,C.&Hughes,J.HowcanLLMstransformtheroboticdesignprocess.NatureMachineIntelligence.5,561–564(2023)./10.1038/s42256-023-00669-72023年6月7日來源:Stella,F.,DellaSantina,C.&Hughes,J.HowcanLLMstransformtheroboticdesignprocess.NatureMachineIntelligence.5,561–564(2023)./10.1038/s42256-023-00669-72023年6月7日https://twitter.com/gong_cn/status/1726501516https://huggingface.co/blog/lcm_lora2023年11月9日人類完成絕大部分工作人類設(shè)立任務(wù)目標(biāo)其中某(幾)個任務(wù)AI提供信息或建議人類自主結(jié)束工作人類和AI協(xié)作工作人類設(shè)立任務(wù)目標(biāo)其中某(幾)個任務(wù)AI完成初稿人類修改調(diào)整確認(rèn)↓人類自主結(jié)束工作AI全權(quán)代理!任務(wù)拆分工具選擇進(jìn)度控制!AI全權(quán)代理!任務(wù)拆分工具選擇進(jìn)度控制!AI自主結(jié)束工作AI完成絕大部分工作設(shè)立目標(biāo)提供資源監(jiān)督結(jié)果來源:VIONWILLIAMS/s/AluYfD6BQOkLo6XpJMyQnQ2023年9月15日41蒸汽時代(1760-1840)蒸汽時代(1760-1840)水力、紡織、鐵蒸汽、鐵路、鋼電、化學(xué)品、內(nèi)燃機(jī)石油、天然氣、硅電子互聯(lián)網(wǎng)水力、紡織、鐵蒸汽、鐵路、鋼電、化學(xué)品、內(nèi)燃機(jī)石油、天然氣、硅電子互聯(lián)網(wǎng)信息時代(1950-第一波浪潮第二波浪潮第三波浪潮第四波浪潮第五波浪潮 60年 40年 動力運(yùn)力電力通信信息觀點來自:北京大學(xué)黃鐵軍教授,2023年3月31日42蒸汽時代(1760-1840)蒸汽時代(1760-1840)電氣時代(1840-1950)信息時代(1950-以人工智能為代表的新型基礎(chǔ)設(shè)施?以人工智能為代表的新型基礎(chǔ)設(shè)施?動力 60年動力 通信 40年通信信息智力 信息智力運(yùn)力電力觀點來自:北京大學(xué)黃鐵軍教授,2023年3月31日43來源:ArtificialIntelligenceIndexReport2024/report/ModelsTableRankingshttps://lifearchitect.ai/models-table/2025年2月/100-gen-ai-apps-3/應(yīng)用/平臺集成時間核心功能與技術(shù)特性信息來源測DeepSeek降低了基礎(chǔ)提示詞的使用DeepSeek降低了基礎(chǔ)提示詞的使用來源:/technology/chatgpt-opens-door-to-four-day-week-says-nobel-prize-winner-20230406-p5cyki52來源:澎湃新聞/newsDetail_forward_207904
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZMDS 20003-2024 醫(yī)療器械網(wǎng)絡(luò)安全風(fēng)險控制 醫(yī)療器械網(wǎng)絡(luò)安全能力信息
- 二零二五年度建筑施工現(xiàn)場安全教育培訓(xùn)協(xié)議
- 2025年度能源行業(yè)員工用工合同樣本
- 2025年度花卉養(yǎng)護(hù)與花卉市場銷售渠道合作合同
- 2025年度網(wǎng)絡(luò)安全優(yōu)先股入股協(xié)議
- 二零二五年度內(nèi)架承包與施工合同終止及清算協(xié)議
- 二零二五年度車輛交易抵押借款服務(wù)協(xié)議
- 2025年度職業(yè)技能提升家教合同
- 二零二五年度合作社入股農(nóng)業(yè)知識產(chǎn)權(quán)入股協(xié)議
- 2025年度車輛抵押權(quán)法律咨詢合同
- 生物-天一大聯(lián)考2025屆高三四省聯(lián)考(陜晉青寧)試題和解析
- 多重耐藥護(hù)理查房
- 《旅游經(jīng)濟(jì)學(xué)》全書PPT課件
- 中國醫(yī)院質(zhì)量安全管理 第3-5部分:醫(yī)療保障 消毒供應(yīng) T∕CHAS 10-3-5-2019
- 安全評價理論與方法第五章-事故樹分析評價法
- 新高考英語讀后續(xù)寫——人物描寫高級表達(dá)素材
- CoDeSys編程手冊
- 幼兒園一日活動流程表
- 中國民俗知識競賽題(附答案和詳細(xì)解析)
- 散裝水泥罐體標(biāo)準(zhǔn)資料
- 原發(fā)性肝癌臨床路徑最新版
評論
0/150
提交評論