版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
8/8如何管理人工智能產(chǎn)品的風險,建立可信賴的AI系統(tǒng)NIST正在開發(fā)一個框架,即,NIST人工智能風險管理框架,以更好地管理與人工智能(AI)相關的個人、組織和社會的風險。
這個框架是自愿使用的,可提高將可信度考慮因素納入人工智能產(chǎn)品、服務和系統(tǒng)的設計、開發(fā)、使用和評估的能力。
目前這個框架還在草案中,可在2022年4月29日之前反饋意見。
「該框架的簡介」
該框架旨在促進創(chuàng)新方法的發(fā)展(提供一個靈活,結構化和可測量的過程),以解決整個人工智能生命周期中的人工智能風險,以充分證明AI產(chǎn)品可信賴性(trustworthiness)的特征,包括準確性、可解釋性(explainabilityandinterpretability)、可靠性、隱私性、穩(wěn)健性、安全性、網(wǎng)絡安全(恢復)以及減輕無意和/或有害的偏差和有害使用;考慮并包含人工智能技術和系統(tǒng)的預設計、設計和開發(fā)、部署、使用、測試和評估期間的透明度、可說明性和公平性等原則。
該框架的里程牌如下:
「為什么NIST開發(fā)這個框架?」
NIST旨在培養(yǎng)對人工智能技術和系統(tǒng)的設計、開發(fā)、使用和評估的信任,以提高經(jīng)濟安全和生活質量。該機構在人工智能RMF方面的工作符合國家安全人工智能委員會的建議和聯(lián)邦參與制定人工智能技術標準和相關工具的計劃(PlanforFederalEngagementinDevelopingAITechnicalStandardsandRelatedTools),國會已指示NIST與私營和公共部門合作,開發(fā)自愿的人工智能RMF。
「這個框架的受用對象」
人工智能風險管理是一個復雜且相對較新的領域,可能受到人工智能技術影響的個人、團體、社區(qū)和組織的名單非常廣泛。識別和管理人工智能的風險和影響——無論是積極的還是消極的——需要廣泛的視角和利益相關者。
如上圖所示,NIST已經(jīng)確定了四個涉眾群體作為這個框架的目標受眾:AI系統(tǒng)利益相關者、操作員和評估者、外部利益相關者以及公眾。理想情況下,所有利益相關者群體的成員都將參與或代表風險管理過程,包括那些可能會受到人工智能技術的影響的個人和社區(qū)代表。
「如何建立可信賴的AI系統(tǒng)」
AIRMF使用一個三類分類法(如下圖所示)對特征進行分類,應在識別和管理與人工智能系統(tǒng)相關的風險的綜合方法中加以考慮:技術特征(technicalcharacteristics)、社會技術特征(socio-technicalcharacteristics)和指導原則(guidingprinciples)。
「技術特征包括哪些?」
人工智能RMF分類法中的技術特征,指的是在人工智能系統(tǒng)設計者和開發(fā)者的直接控制下的因素,這些因素可以使用標準的評估標準來衡量。技術特征包括收斂-判別有效性(數(shù)據(jù)是否反映用戶打算測量的內容而不是其他內容)和統(tǒng)計可靠性(數(shù)據(jù)是否可能受到高水平的統(tǒng)計噪聲和測量偏差的影響)之間的權衡。
以下技術特征非常適合解決人工智能風險:
準確性、可靠性、健壯性和恢復性(或ML安全性)。
準確性:表示ML模型正確捕獲訓練數(shù)據(jù)中存在的關系的程度。類似于統(tǒng)計結論有效性,通過標準ML度量(例如,假陽性和假陰性率、F1分數(shù)、精度和回索)以及模型欠擬合或過擬合的評估(與訓練中的錯誤率無關的高測試錯誤)來檢查準確性。
可靠性:表示模型是否在可接受的統(tǒng)計誤差范圍內持續(xù)產(chǎn)生相同的結果。設計用于減輕過擬合并在面臨偏差/方差權衡時充分進行模型選擇的技術可以增加模型可靠性。
可靠性測量可以洞察與去語境化相關的風險,這是由于重用ML數(shù)據(jù)集或模型的常見做法導致它們與創(chuàng)建它們的社會背景和時間段脫節(jié)。與準確性一樣,可靠性提供了對模型有效性的評估,因此可以作為確定可接受風險閾值的一個因素。
穩(wěn)健性:對模型敏感性的一種度量,表明模型對不可控因素的變化是否具有最小的敏感性。一個健壯的模型將繼續(xù)運行,盡管其組件中存在故障。模型的性能可能會降低或改變,直到錯誤被糾正。
穩(wěn)健性的測量范圍可能從模型輸出的敏感性到其輸入的微小變化,但也可能包括對新數(shù)據(jù)集的誤差測量。穩(wěn)健性有助于人工智能風險管理流程中的敏感性分析。
恢復性:一個模型,可以承受對抗性的攻擊,或者更一般地,在其環(huán)境或使用,可以說是彈性的或安全的。
「社會技術特征包括哪些?」
人工智能RMF分類法中的社會技術特征指的是人工智能系統(tǒng)如何在個人、群體和社會環(huán)境中被使用和感知。這包括模型的心智表示,所提供的輸出是否足以評估遵從性(透明性),模型操作是否容易理解(explainability),它們是否提供可以用于做出有意義的決策(interpretability),以及輸出是否符合社會價值觀。
以下社會技術特征對處理人工智能風險有影響:
可理解性(explainability)、可解釋性(interpretability)、隱私性、安全性和管理偏見(managingbias)。
可理解性(explainability)指的是用戶對模型如何工作的感知——例如,對于給定的輸入,可能期望什么樣的輸出,傾向于為技術受眾總結或可視化模型行為或預測。
然而,由于可解釋性而產(chǎn)生的風險可能有許多原因,包括,例如,解釋方法缺乏保真度或一致性,或者如果人類錯誤地推斷模型的操作,或者模型沒有按預期操作。
缺乏explainability的風險可以通過描述模型如何根據(jù)用戶的技能水平工作來管理。
可解釋性(interpretability)旨在彌補意義上的缺陷。盡管可理解性(explainability)、可解釋性(interpretability)通??梢曰Q使用,但是explainability指的是算法操作的機制的表示,而interpretability指的是其輸出在其設計功能目的背景下的意義。模型可解釋性指的是用戶能夠確定遵守該模型的程度功能以及該輸出對該用戶的其他重要決策的后續(xù)影響。
隱私通常指有助于維護人類自治和尊嚴等價值觀的規(guī)范和做法。這些規(guī)范和實踐通常涉及免受入侵、限制觀察或個人對其身份各方面(如身體、數(shù)據(jù)、聲譽)的控制。像安全和安保一樣,人工智能系統(tǒng)的特定技術特征可能會促進隱私,評估人員可以確定數(shù)據(jù)處理如何會產(chǎn)生與隱私相關的問題。
安全作為一個概念與風險高度相關,通常表示沒有(或最小化)導致系統(tǒng)危險的故障或條件。例如,隨著人工智能系統(tǒng)在工廠和道路上更直接地與人類互動,這些系統(tǒng)的安全性是人工智能風險管理的一個重要考慮因素。人工智能安全的實用方法通常涉及嚴格的模擬和域內測試、實時監(jiān)控,以及快速關閉或修改不正常系統(tǒng)的能力。
管理偏差:NIST已經(jīng)確定了人工智能偏差的三個主要類別:系統(tǒng)、計算和人類。管理人工智能系統(tǒng)中的偏差需要一種考慮所有三個類別的方法。
偏差與社會中的透明性和公平的概念密切相關,更多詳情請見NISTpublication“TowardsaStandardforIdentifyingandManagingBiasinArtificialIntelligence‘’。
「小結」
當管理人工智能系統(tǒng)中的風險時,理解人工智能RM
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版購銷簡單的合同范本
- 2025年度建筑照明材料采購合同范本3篇
- 杭州公司合作合同范本
- 2024酒店勞動合同模板
- 2025年度GRC構件生產(chǎn)與裝配安全責任合同3篇
- 影視作品海外發(fā)行與推廣2025年度合同2篇
- 二零二五年度跨區(qū)域LNG管道運輸及倉儲服務合同3篇
- 2025年度電機維修智能化改造升級合同3篇
- 2025年度電子元器件專用紙箱采購與倉儲管理合同3篇
- 2024珠寶首飾租賃與購買合同
- TD/T 1060-2021 自然資源分等定級通則(正式版)
- 人教版二年級下冊口算題大全1000道可打印帶答案
- 《創(chuàng)傷失血性休克中國急診專家共識(2023)》解讀
- 倉庫智能化建設方案
- 海外市場開拓計劃
- 2024年度國家社會科學基金項目課題指南
- 供應鏈組織架構與職能設置
- 幼兒數(shù)學益智圖形連線題100題(含完整答案)
- 2024年九省聯(lián)考新高考 數(shù)學試卷(含答案解析)
- 紅色歷史研學旅行課程設計
- 如何避免護理患者投訴
評論
0/150
提交評論