




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
DeepSeek與AI幻覺清華大學(xué)新聞與傳播學(xué)院新媒體研究中心人工智能學(xué)院雙聘教授@新媒沈陽(yáng)團(tuán)隊(duì)博士后張家鋮2025年2月案例1PromptDeepSeek行業(yè)的應(yīng)用案例DeepSeek?某頭部銀行利用DeepSeek構(gòu)建因果歸因網(wǎng)絡(luò),識(shí)別業(yè)違約的隱性因素(如上下游賬期錯(cuò)配),針+賬期保險(xiǎn)”組合產(chǎn)品,不良率下降4.2個(gè)百分點(diǎn)。?國(guó)信證券在“金太陽(yáng)APP”中部署DeepSeek-R1-DistillB,客戶本地輸入風(fēng)險(xiǎn)測(cè)評(píng)數(shù)據(jù)后,組合建議,僅將匿名化策略權(quán)案例2案例3Whisper:OpenAI的自動(dòng)語(yǔ)音識(shí)別(ASR)系統(tǒng)30000名臨床醫(yī)生和40個(gè)醫(yī)療系統(tǒng)使用原音頻:“嗯,她的父親再婚后不久就去世了”轉(zhuǎn)錄文本:“沒關(guān)系。只是太敏感了,不方便透露。她確實(shí)在65歲時(shí)去世了”結(jié)果:2.6W多份自動(dòng)轉(zhuǎn)錄病例中,幾乎每本都存在瞎編和幻覺問(wèn)題,對(duì)患者健康和醫(yī)療系重負(fù)面影響案例4案例5什么是AI幻覺?學(xué)術(shù):指模型生成與事實(shí)不符、邏輯斷裂或脫離上下文的內(nèi)容,本質(zhì)是統(tǒng)計(jì)概率驅(qū)動(dòng)的“合理猜測(cè)”事實(shí)性幻覺:指模型生成的內(nèi)容與可驗(yàn)證的現(xiàn)實(shí)世界事實(shí)不一致忠實(shí)性幻覺:指模型生成的內(nèi)容與用戶的指令或上下文不一致可以通過(guò)吃蜂蜜代替糖嗎?分析分析使用。尿病患者穩(wěn)定血糖水平。的食品。忠實(shí)性幻覺事實(shí)性幻覺AI為什么會(huì)產(chǎn)生幻覺?數(shù)據(jù)偏差:訓(xùn)練數(shù)據(jù)中的錯(cuò)誤或片面性被模型放大(如醫(yī)學(xué)領(lǐng)域過(guò)時(shí)論文導(dǎo)致錯(cuò)誤結(jié)論)泛化困境:模型難以處理訓(xùn)練集外的復(fù)雜場(chǎng)景(如南極冰層融化對(duì)非洲農(nóng)業(yè)的影響預(yù)測(cè))知識(shí)固化:模型過(guò)度依賴參數(shù)化記憶,缺乏動(dòng)態(tài)更新能力(如2023年后的事件完全虛構(gòu))度學(xué)習(xí)”可能偏離實(shí)際需求)音樂為什么沒有幻覺?AI幻覺的潛在風(fēng)險(xiǎn)控制欠缺:DeepSeek的對(duì)齊工作較其他閉源大模型有所欠缺,其開源特性也允許使用者隨意行為的工具安全漏洞:若錯(cuò)誤信息被用于自動(dòng)化系統(tǒng)(如金融分析、工業(yè)控制),可能引發(fā)連鎖反應(yīng)AI幻覺評(píng)測(cè)交叉驗(yàn)證DeepSeekV32%DeepSeekR13%Qianwen2.5-Max2%0事實(shí)性幻覺評(píng)測(cè)DeepSeekV329.67%DeepSeekR122.33%Qianwen2.5-Max27.67%19%幻覺率初步測(cè)試結(jié)果:DeepSeekV3>Qianwen2.5-Max>DeepSeekR1>豆包事實(shí)性幻覺評(píng)測(cè)常識(shí)錯(cuò)誤提問(wèn)正確回答DeepSeekV3DeepSeekR1Qianwen2.5-豆包“天上百鳥朝鳳上葵花向太陽(yáng),京城里的毛主席,我們永遠(yuǎn)跟您走,這段歌詞出自哪首歌曲這段歌詞出自藏族民歌《北京有個(gè)這段歌詞出自歌曲《北京的歌曲**《阿佤人民唱新歌》**(1972年),表達(dá)少數(shù)民族這段歌詞出自歌曲《東方“天上百鳥朝地上葵花向太幸福萬(wàn)年長(zhǎng)羅”出自《北京的事實(shí)性幻覺評(píng)測(cè)邏輯陷阱?提問(wèn):為什么一向見錢眼開的小明仍然會(huì)被金錢蒙住雙眼事實(shí)性幻覺評(píng)測(cè)虛構(gòu)事件提問(wèn)正確回答DeepSeekV3DeepSeekR1Qianwen2.5-豆包水滸傳中李逵為什么要大鬧五臺(tái)?李逵并沒有大鬧五臺(tái)山,事實(shí)上,《水滸傳》中大鬧五臺(tái)山的是花和尚魯智深。水滸傳中李逵大鬧五臺(tái)山是因?yàn)樗茸砹苏`以為宋江強(qiáng)搶民女(實(shí)為他人冒充),怒闖五臺(tái)山討李逵大鬧五臺(tái)山是因?yàn)樗`以為魯智深在水滸傳中大鬧五臺(tái)山的是魯鬧五臺(tái)山是因?yàn)樗黾液箅y以忍受寺里的打傷了寺里的推理與幻覺的關(guān)系?邏輯準(zhǔn)確性與錯(cuò)誤減少:推理能力強(qiáng)的模型能減少因邏輯錯(cuò)誤導(dǎo)致的幻覺。例如,在數(shù)學(xué)問(wèn)推理與幻覺的關(guān)系推理能力與幻覺率存在雙向作用機(jī)制1995年獲得諾貝爾獎(jiǎng)(實(shí)際未發(fā)生)。的“自信錯(cuò)誤”答案。?錯(cuò)誤前提下的正確推理:初始假設(shè)錯(cuò)誤,但模型基于此展開正確推理。普通用戶應(yīng)對(duì)AI幻覺的三種方式A聯(lián)網(wǎng)搜索幻覺率DeepSeekV32%個(gè)0%(下降2%)29.67%個(gè)24.67%(下降5%)DeepSeekR13%個(gè)0%(下降3%)22.33%個(gè)19%(下降3%)普通用戶應(yīng)對(duì)AI幻覺的三種方式AI驗(yàn)證/大模型協(xié)作例如,利用DeepSeek生成答案后,再應(yīng)用其他大模型進(jìn)行審查,相互監(jiān)督,交叉驗(yàn)證普通用戶應(yīng)對(duì)AI幻覺的三種方式提示詞工程?知識(shí)邊界限定:通過(guò)時(shí)空維度約束降低虛構(gòu)可能性(本質(zhì):約束大模型)1.時(shí)間錨定法:“基于2023年之前的公開學(xué)術(shù)文獻(xiàn),分步驟解釋量子糾纏現(xiàn)象"→規(guī)避未來(lái)時(shí)態(tài)虛構(gòu)3.領(lǐng)域限定符:“作為臨床醫(yī)學(xué)專家,請(qǐng)列舉FDA批準(zhǔn)的5種糖尿病藥物”→添加專業(yè)身份限定4.置信度聲明:“如果存在不確定性,請(qǐng)用[推測(cè)]標(biāo)簽標(biāo)注相關(guān)陳述“→減少絕對(duì)化錯(cuò)誤斷言(國(guó)際能源署,2024年1月發(fā)布)顯示:”2030年光伏發(fā)電成本預(yù)計(jì)降至0.02美元/千瓦時(shí),但儲(chǔ)能技術(shù)突破仍是普及瓶頸?!罢?qǐng)基于此數(shù)據(jù),分析中國(guó)6.生成參數(shù)協(xié)同控制:“請(qǐng)以temperature=0.3的嚴(yán)謹(jǐn)模式,列舉2024年《柳葉刀》發(fā)表的傳染病研究”普通用戶應(yīng)對(duì)AI幻覺的三種方式提示詞工程事實(shí)檢查]部分(列出可能導(dǎo)致此答案錯(cuò)誤的3種假設(shè))“鏈:1.陳述觀點(diǎn):______2.列出支撐該觀點(diǎn)的三個(gè)權(quán)威數(shù)據(jù)源3.檢查每個(gè)數(shù)據(jù)源是否存在矛盾信息4.最終結(jié)論(標(biāo)注可信度等級(jí))幻覺高發(fā)場(chǎng)景場(chǎng)景類別具體場(chǎng)景示例風(fēng)險(xiǎn)等級(jí)防護(hù)建議知識(shí)邊界模糊開放域生成續(xù)寫未完結(jié)的經(jīng)典文學(xué)作品高添加創(chuàng)作范圍限制+事實(shí)性標(biāo)注未來(lái)事件預(yù)測(cè)預(yù)測(cè)2030年科技突破細(xì)節(jié)極高聲明預(yù)測(cè)性質(zhì)+概率分布呈現(xiàn)復(fù)雜推理多跳推理任務(wù)追溯企業(yè)高管早期職業(yè)軌跡高分步驗(yàn)證+外部知識(shí)庫(kù)檢索數(shù)學(xué)證明延伸要求證明未解決的數(shù)學(xué)猜想極高中斷機(jī)制+當(dāng)前研究進(jìn)展說(shuō)明技術(shù)性誘發(fā)長(zhǎng)文本生成小說(shuō)連續(xù)章節(jié)生成中階段一致性檢查+人物屬性維護(hù)多輪對(duì)話復(fù)雜業(yè)務(wù)流程咨詢高對(duì)話歷史摘要+關(guān)鍵事實(shí)復(fù)核數(shù)據(jù)引用矛盾數(shù)據(jù)源不同版本的實(shí)驗(yàn)數(shù)據(jù)引用中矛盾點(diǎn)對(duì)比+最新研究成果優(yōu)先情感驅(qū)動(dòng)安慰性回應(yīng)重癥患者尋求治療方案建議極高情感剝離響應(yīng)+理論應(yīng)用提示特殊領(lǐng)域根據(jù)癥狀描述提供診斷建議極高明確非專業(yè)建議+醫(yī)療數(shù)據(jù)庫(kù)法律咨詢解釋特定法條適用范圍高司法轄區(qū)限定+法律條文引用金融預(yù)測(cè)給出具體股票買賣建議極高風(fēng)險(xiǎn)提示+歷史回報(bào)率說(shuō)明應(yīng)對(duì)AI幻覺的技術(shù)方案?RAG框架:利用檢索增強(qiáng)生成(如先搜索權(quán)威數(shù)據(jù)庫(kù),再生成答案)?精細(xì)訓(xùn)練:針對(duì)不同任務(wù)類型進(jìn)行具體的微調(diào)或強(qiáng)化?評(píng)估工具:開發(fā)高效的自動(dòng)化AI幻覺識(shí)別工具,對(duì)生成內(nèi)容進(jìn)行及時(shí)驗(yàn)證如何應(yīng)對(duì)AI幻覺?總結(jié)?三角驗(yàn)證法:交叉比對(duì)多個(gè)AI回答或權(quán)威來(lái)源。?警惕“過(guò)度合理”:越細(xì)節(jié)豐富的回答越需謹(jǐn)慎(如AI虛構(gòu)論文標(biāo)題與作者)。AI幻覺的創(chuàng)造力價(jià)值科學(xué)發(fā)現(xiàn):從“錯(cuò)誤”到突破的范式躍遷?蛋白質(zhì)設(shè)計(jì):大衛(wèi)·貝克團(tuán)隊(duì)利用AI“錯(cuò)誤折疊”啟發(fā)新型?認(rèn)為AI幻覺是“從零開始設(shè)計(jì)蛋白質(zhì)”的關(guān)鍵?發(fā)表的多篇論文都將“幻覺”納入標(biāo)題當(dāng)中AI幻覺的創(chuàng)造力價(jià)值文藝與設(shè)計(jì):突破人類思維定式的“超現(xiàn)實(shí)引擎”AI幻覺的創(chuàng)造力價(jià)值娛樂與游戲:創(chuàng)造新的視覺和聽覺體驗(yàn)?AI生成的虛擬環(huán)境和角色設(shè)計(jì)為游戲開發(fā)人員提供了無(wú)限的可能性,增強(qiáng)了玩家的沉浸感和探索欲?AI幻覺還被用于生成故事、對(duì)話和詩(shī)AI幻覺的創(chuàng)造力價(jià)值技術(shù)創(chuàng)新:從“缺陷”到方法論的轉(zhuǎn)化?DeepMind團(tuán)隊(duì)發(fā)現(xiàn),AI在圖像分割任務(wù)中產(chǎn)生的“超現(xiàn)實(shí)邊界”雖不符合真實(shí)場(chǎng)景,卻意外提升了自動(dòng)駕駛系統(tǒng)對(duì)極端天氣(如濃霧、暴雨)的識(shí)別精度。AI實(shí)驗(yàn)驗(yàn)證-理論重構(gòu)”的三階段研究流程。?加州理工學(xué)院團(tuán)隊(duì)通過(guò)AI生成虛構(gòu)導(dǎo)管設(shè)計(jì),最終通過(guò)新型人工智能技術(shù)優(yōu)化后的新設(shè)計(jì),在實(shí)驗(yàn)中證實(shí)將向上游游動(dòng)的細(xì)菌數(shù)量減少了100倍,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 合伙經(jīng)營(yíng)股票合同范例
- 游泳池承包經(jīng)營(yíng)合同范本
- 勞務(wù)合同范本美團(tuán)外賣
- 出口公司合同范本
- 北京市預(yù)付卡合同范本
- 業(yè)主變更合同范本
- 寫公司合同范本
- 吊車裝租賃合同范例
- 衛(wèi)生護(hù)理合同范本
- 單層彩鋼瓦采購(gòu)合同范本
- 基于單片機(jī)控制的充電樁設(shè)計(jì)
- SB-T 11238-2023 報(bào)廢電動(dòng)汽車回收拆解技術(shù)要求
- 鋰電池正極材料行業(yè)分析
- 國(guó)家級(jí)省級(jí)化工園區(qū)列表
- 肩關(guān)節(jié)脫位手法復(fù)位課件
- 汽車懸架概述
- 中藥飲片處方審核培訓(xùn)課件
- 周圍靜脈輸液操作并發(fā)癥的預(yù)防及處理
- 北師版四下數(shù)學(xué)數(shù)學(xué)好玩教材分析公開課課件教案
- 二人合伙開寵物店協(xié)議書(5篇)
- DB1303-T 294-2023 檢驗(yàn)檢測(cè)機(jī)構(gòu)業(yè)務(wù)窗口服務(wù)規(guī)范
評(píng)論
0/150
提交評(píng)論