面向人工智能的數(shù)據(jù)治理實(shí)踐指南一_第1頁
面向人工智能的數(shù)據(jù)治理實(shí)踐指南一_第2頁
面向人工智能的數(shù)據(jù)治理實(shí)踐指南一_第3頁
面向人工智能的數(shù)據(jù)治理實(shí)踐指南一_第4頁
面向人工智能的數(shù)據(jù)治理實(shí)踐指南一_第5頁
已閱讀5頁,還剩81頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

(DG4AI)實(shí)踐指南1.02版權(quán)聲明本報(bào)告版權(quán)屬于CCSATC601大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(huì),并受法律保護(hù)。轉(zhuǎn)載、摘編或利用其它方式使用本報(bào)告3與專家的支持和幫助,主要參與單位與人員如下(排名不分前后)。限公司、聯(lián)通數(shù)字科技有限公司、中電信人工智能科技(北京)有限學(xué)研究中心、廣州信安數(shù)據(jù)有限公司、星環(huán)信息科技(上海)股份有限公司、交通銀行股份有限公司、北京神州綠盟科技有限公司、央視頻融媒體發(fā)展有限公司、亞信科技(中國)有限公司、廣州小鵬汽車科技有限公司、新華三技術(shù)有限公司、北京楓清科技有限公司、華為云技術(shù)有限公司、騰訊云計(jì)算(北京)有限責(zé)任公司、普元信息技術(shù)股份科大數(shù)據(jù)研究院有限公司、電科云(北京)科技有限公司、上海浦東發(fā)國際信息技術(shù)有限公司、中國移動(dòng)紫金(江蘇)創(chuàng)新研究院有限公司、杭州比智科技有限公司、云賽智聯(lián)股份有限公司、湖北數(shù)據(jù)集團(tuán)、北京卓信智恒數(shù)據(jù)科技股份有限公司、海南數(shù)造科技有限公司、一汽參編人員:尹正,姜春宇,王妙瓊,郭彥美,高倩倩,闞鑫禹,45自1988年由麻省理工學(xué)院的學(xué)者啟動(dòng)了全面數(shù)據(jù)質(zhì)量管理計(jì)劃 升,數(shù)據(jù)治理的內(nèi)涵也在不斷地變化和豐富。2021年,隨著以大模為了應(yīng)對(duì)這些挑戰(zhàn),開發(fā)出更負(fù)責(zé)任、更可控的人面向人工智能的數(shù)據(jù)治理(DG4AI,DataGovernanceforArtificial準(zhǔn)推進(jìn)委員會(huì)(CCSATC601)組織大型銀行、通信運(yùn)營商、頭部互聯(lián)網(wǎng)公司共同編寫《面向人工智能的數(shù)據(jù)治理(DG4AI)實(shí)踐指南(1.0)》,旨在推動(dòng)DG4AI理念的廣泛應(yīng)用。本指南第一章從數(shù)據(jù)等明確人工智能數(shù)據(jù)治理的概念。第二章從治理的方法和技術(shù)對(duì)6DG4AI的重點(diǎn)工作進(jìn)行說明。第三章提出了一種DG4AI的數(shù)據(jù)治理本指南在細(xì)節(jié)和深度上仍有較大提升空間,希望業(yè)界更多的專家聯(lián)系人:尹正7一、人工智能數(shù)據(jù)治理概念界定(一)數(shù)據(jù)治理的發(fā)展眾多,但由于業(yè)界權(quán)威研究機(jī)構(gòu)、研究學(xué)者以及國內(nèi)外標(biāo)準(zhǔn)組梅宏院士在《數(shù)據(jù)治理之論》一書中提出數(shù)據(jù)治理的核心內(nèi)容包國際數(shù)據(jù)管理協(xié)會(huì)(DAMA)提出的數(shù)據(jù)治理概念為“在管理數(shù)據(jù)資產(chǎn)過程中行使權(quán)力和管控活動(dòng),包括計(jì)劃、監(jiān)控和實(shí)施?!監(jiān)/TR14872:2019Healthinformatics—Idfmedicinalproducts—Coreprinciplesformaintenanceofidentifiterms,將其定義為“以管理信息的質(zhì)量、一致性、可用性、安全性和可用性為重點(diǎn)的過程”,并強(qiáng)調(diào)該過程與數(shù)據(jù)所有權(quán)和管理的概念準(zhǔn)從IT治理、數(shù)據(jù)資產(chǎn)管理等視角定義數(shù)據(jù)治8在國家標(biāo)準(zhǔn)中,最早出現(xiàn)的數(shù)據(jù)治理術(shù)語定義源自GB/T35295-2017《信息技術(shù)大數(shù)據(jù)術(shù)語》,將其定義為“對(duì)數(shù)據(jù)進(jìn)行處置、格式化和規(guī)范化的過程?!?從定義內(nèi)容來看主要是從數(shù)據(jù)管結(jié)合通用場景下數(shù)據(jù)治理定義的特征來看,數(shù)據(jù)治理的核心治理2.數(shù)據(jù)治理的三個(gè)階段第一階段,20世紀(jì)80年代,隨著數(shù)據(jù)庫技術(shù)的發(fā)展,企業(yè)開始意識(shí)到數(shù)據(jù)的重要性。但當(dāng)時(shí)數(shù)據(jù)管理主要依靠數(shù)據(jù)庫管理系統(tǒng)(DBMS),直到1988年由麻省理工學(xué)院的兩位教授啟動(dòng)了全面數(shù)第三階段,21世紀(jì)20年代,以大模型為代表的生成式模型成為9 的“靈魂”,塑造了其獨(dú)特的“個(gè)性”。1)數(shù)據(jù)“高量低質(zhì)”多的適配于面向BI時(shí)代的結(jié)構(gòu)化數(shù)據(jù),在人工智能過創(chuàng)新的數(shù)據(jù)管理策略和技術(shù),解決AI發(fā)展中的痛點(diǎn)問題。隨著大模型對(duì)數(shù)據(jù)的依賴性日益增強(qiáng),數(shù)據(jù)安全和隱私保護(hù)已成在科技飛速發(fā)展的背景下,人工智能倫理和道德的關(guān)注程度及應(yīng)這些倫理問題可能源于系統(tǒng)意外產(chǎn)生,也可能是惡意行為者蓄意據(jù)治理在AI研發(fā)全生命周期中的重要性,并指出了實(shí)現(xiàn)高質(zhì)量AI以及技術(shù)的創(chuàng)新,以確保AI技術(shù)的健康發(fā)展,并最大化其對(duì)人類社(二)面向人工智能的數(shù)據(jù)治理的定義科學(xué)/心理學(xué)、哲學(xué)、語言學(xué)和數(shù)學(xué)等學(xué)科進(jìn)行了知識(shí)融合的計(jì)算機(jī)級(jí)功能(包括查看、理解和翻譯口語和書面語言、分析數(shù)據(jù)、提出建議等能力),達(dá)到幫助替代或超越人類的工作的能力。數(shù)據(jù)治理:根據(jù)IBM、標(biāo)準(zhǔn)要求、數(shù)據(jù)治理協(xié)會(huì)等研究(見附錄二)綜合來看,數(shù)據(jù)治理主要是從組織層面對(duì)數(shù)據(jù)進(jìn)行管理。其目的由此,我們可以認(rèn)為面向人工智能的數(shù)據(jù)治理(DG4AI,Data性,數(shù)據(jù)能夠被準(zhǔn)確地用于訓(xùn)練和部署AI模型,同時(shí)保護(hù)數(shù)據(jù)的隱量數(shù)據(jù),包括數(shù)據(jù)的準(zhǔn)確性完整性、一致性和時(shí)效性等。技術(shù)工具和平臺(tái)建設(shè)包括支持人工智能數(shù)據(jù)治理的技術(shù)工具和平臺(tái),例如隱等法規(guī)和行業(yè)標(biāo)準(zhǔn)確保數(shù)成本治理與優(yōu)化指對(duì)人工智能場最下數(shù)據(jù)的存儲(chǔ)、計(jì)算、加工等成本的(三)面向人工智能開展數(shù)據(jù)治理的主要階段與對(duì)象。治理目標(biāo):確保面向Al的數(shù)據(jù)治理得到必要的支持和資基于數(shù)據(jù)治理所需的專項(xiàng)能力和業(yè)務(wù)價(jià)值目標(biāo)構(gòu)建支持理與AI應(yīng)用的良性互動(dòng)。進(jìn)一步,形成數(shù)據(jù)治理與AI應(yīng)環(huán)節(jié)數(shù)據(jù)1)數(shù)據(jù)收集階段:此階段治理對(duì)象包括:結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、空間地理數(shù)據(jù)、時(shí)間序列數(shù)據(jù)等多種模態(tài)數(shù)據(jù)集。數(shù)據(jù)來源的選擇和收集策略直接影響后續(xù)的數(shù)據(jù)質(zhì)量。數(shù)據(jù)的有效性和代表性在此階段就已開始形成。此階段我們需要保2)數(shù)據(jù)預(yù)處理/清洗階段:此階段數(shù)據(jù)治理對(duì)象是數(shù)據(jù)收集階段所采集的多模態(tài)數(shù)據(jù)。此階段對(duì)收集到的數(shù)據(jù)進(jìn)行初步處理,去除無確保數(shù)據(jù)質(zhì)量。數(shù)據(jù)必須具備高度的質(zhì)量和準(zhǔn)確性,保證訓(xùn)練模4)數(shù)據(jù)標(biāo)注階段:此階段治理對(duì)象主要是標(biāo)注數(shù)據(jù)集。對(duì)于監(jiān)督學(xué)習(xí)任務(wù),需要人工或半自動(dòng)方式對(duì)數(shù)據(jù)進(jìn)行標(biāo)注。高質(zhì)量的標(biāo)注數(shù)據(jù)對(duì)于模型的學(xué)習(xí)至關(guān)重要。準(zhǔn)確、一致且全面的標(biāo)注能顯著5)數(shù)據(jù)劃分階段:此階段治理對(duì)象主要是訓(xùn)練集、驗(yàn)證集和測試集三類。本階段將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測試集,訓(xùn)練集用于訓(xùn)練模型。數(shù)據(jù)劃分階段的質(zhì)量治理重點(diǎn)在于保障數(shù)據(jù)分布和數(shù)據(jù)平衡,合理地將數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測試集,確6)數(shù)據(jù)增強(qiáng)階段:此階段治理對(duì)象主要是合成數(shù)據(jù)。為了提高模型的泛化能力和應(yīng)對(duì)不平衡數(shù)據(jù)問題,合成數(shù)據(jù)是通過模擬或生成技術(shù)生成的人工數(shù)據(jù),用于模型訓(xùn)練、隱私保護(hù)等目的。雖然對(duì)合成數(shù)據(jù)的質(zhì)量治理不是直接改善原始數(shù)據(jù)質(zhì)量,但能間接提高模型對(duì)各種情況的適應(yīng)性和泛化能力。合成數(shù)據(jù)質(zhì)量治理包括對(duì)7)模型訓(xùn)練階段:此階段治理對(duì)象主要是訓(xùn)練數(shù)據(jù)。使用高質(zhì)量的數(shù)據(jù)訓(xùn)練模型,會(huì)得到更準(zhǔn)確、穩(wěn)定的結(jié)果。訓(xùn)練過程中,如果數(shù)據(jù)質(zhì)量不佳,模型容易學(xué)得有偏差或者過擬合。訓(xùn)練數(shù)據(jù)的數(shù)據(jù)質(zhì)量治理重點(diǎn)保障數(shù)據(jù)的完整性、準(zhǔn)確性、一致性、多樣性和9)模型推理階段:此階段治理對(duì)象主要是推理數(shù)據(jù)集。在模型推理階段,除了確保模型自身的性能以外,還要關(guān)注用于推理的實(shí)時(shí)數(shù)據(jù)的質(zhì)量,通過一系列的數(shù)據(jù)處理活動(dòng)來保證模型在實(shí)際應(yīng)用中的效果和穩(wěn)定性。推理數(shù)據(jù)集質(zhì)量治理的關(guān)注點(diǎn)主要包括推理數(shù)據(jù)集的數(shù)據(jù)格式兼容性、數(shù)據(jù)質(zhì)量監(jiān)控、數(shù)據(jù)有效性驗(yàn)證、實(shí)(四)面向人工智能的數(shù)據(jù)治理價(jià)值提升人工智能應(yīng)用的規(guī)模提升人工智能應(yīng)用的規(guī)?;涞匦释晟茢?shù)據(jù)治理體系提升人工智能應(yīng)用效果加強(qiáng)人工智能數(shù)據(jù)安全在開展面向人工智能的數(shù)據(jù)治理工作時(shí),建議遵循以下原則,從●透明性原則:人工智能數(shù)據(jù)治理應(yīng)該是透明的,運(yùn)作方式和數(shù)據(jù)●合規(guī)性原則:人工智能數(shù)據(jù)治理應(yīng)該符合相關(guān)法律法規(guī)和行業(yè)標(biāo)●安全性原則:人工智能數(shù)據(jù)治理應(yīng)注重?cái)?shù)據(jù)的安全性,采取適當(dāng)程類似(如PDCA循環(huán)、安全分級(jí)分類等),但鑒于人工智能應(yīng)用場數(shù)溯同推進(jìn)面向人工智能的數(shù)據(jù)質(zhì)量治理是保障人工智能應(yīng)用高質(zhì)量、面向人工智能的數(shù)據(jù)質(zhì)量治理是確保數(shù)據(jù)質(zhì)量對(duì)人工智能模型效同時(shí),還需要建立有效的數(shù)據(jù)質(zhì)量評(píng)估和監(jiān)控機(jī)制,以確保數(shù)據(jù)在面向人工智能的數(shù)據(jù)治理過程中,數(shù)據(jù)質(zhì)量治理始于需求分析3)數(shù)據(jù)源評(píng)估及采集數(shù)據(jù)標(biāo)注與數(shù)據(jù)增強(qiáng)是數(shù)據(jù)質(zhì)量管理活動(dòng)中不可或缺的部分,它b.數(shù)據(jù)標(biāo)注:在某些AI任務(wù)中,尤其是監(jiān)督學(xué)習(xí)場景下,模型5)特征工程對(duì)已預(yù)處理過后的數(shù)據(jù),可能仍然存在不滿足人工智能需求,其在數(shù)據(jù)治理的過程中,深入挖掘并矯正數(shù)據(jù)偏見是構(gòu)建負(fù)責(zé)任且公平的人工智能系統(tǒng)的基石,有助于避免AI應(yīng)用在社會(huì)生活中可能a.數(shù)據(jù)偏見檢測:數(shù)據(jù)偏見檢測主要通過統(tǒng)計(jì)分析、可視化手視因變量預(yù)測值是否受無關(guān)屬性(如性別、種族)的影響過大等。b.偏見矯正:在發(fā)現(xiàn)數(shù)據(jù)存在偏見后,數(shù)據(jù)質(zhì)量管理活動(dòng)會(huì)采微調(diào),以期得到精準(zhǔn)、可靠且具有泛化能力的AI模型。8)持續(xù)改進(jìn)類問題;緊跟AI技術(shù)發(fā)展,優(yōu)化數(shù)據(jù)采集、預(yù)處理、清洗、標(biāo)注等在面向人工智能的數(shù)據(jù)治理過程中,數(shù)據(jù)質(zhì)量治理涵蓋了從數(shù)據(jù)從數(shù)據(jù)獲取到模型應(yīng)用全程的數(shù)據(jù)質(zhì)量問題管理和控制,為AI模型動(dòng)化標(biāo)注使用機(jī)器學(xué)習(xí)算法和計(jì)算機(jī)視覺技術(shù)自動(dòng)識(shí)別和標(biāo)注數(shù)據(jù),允許用戶自主決定是否共享個(gè)人信息,增強(qiáng)隱私控制。遵循數(shù)據(jù)最小化原則,僅收集必要的個(gè)人數(shù)據(jù),并定期審查清理,以降低隱私風(fēng)險(xiǎn),為應(yīng)對(duì)人工智能領(lǐng)域的安全挑戰(zhàn),需構(gòu)建一個(gè)基于應(yīng)用場景、影首先,明確隱私數(shù)據(jù)的定義和范圍,對(duì)數(shù)據(jù)進(jìn)行等級(jí)分類,指導(dǎo)應(yīng)用先進(jìn)的加密算法對(duì)數(shù)據(jù)進(jìn)行加密,確保數(shù)據(jù)在存儲(chǔ)和傳輸過安全與隱私是人工智能應(yīng)用的紅線,為組織內(nèi)部人員提供關(guān)于數(shù)建立有效的監(jiān)管機(jī)制,監(jiān)督人工智能系統(tǒng)的運(yùn)行,以及進(jìn)行定期數(shù)據(jù)增強(qiáng):數(shù)據(jù)增強(qiáng)對(duì)于對(duì)抗攻擊、后門攻擊、投毒攻擊來說都安全對(duì)抗:安全對(duì)抗技術(shù)對(duì)人工智能數(shù)據(jù)安全與隱私治理至關(guān)重加密與脫敏:加密技術(shù)和安全協(xié)議是確保數(shù)據(jù)在傳輸和存儲(chǔ)過程數(shù)據(jù)的可用性,降低隱私風(fēng)險(xiǎn),對(duì)AI數(shù)據(jù)安全治理起著核心作差分隱私:通過對(duì)數(shù)據(jù)加噪,確保訓(xùn)練集中某一數(shù)據(jù)不論存在與在科技高速發(fā)展的背景下,對(duì)人工智能中倫理道德的關(guān)注程度及1)制定數(shù)據(jù)倫理政策為了確保數(shù)據(jù)倫理政策的有效實(shí)施,需要建立相應(yīng)的監(jiān)督機(jī)制和2)提升透明度和可解釋性透明度和可解釋性是人工智能數(shù)據(jù)倫理的重要方面,它們有助于為了實(shí)現(xiàn)透明度,我們可以采取向數(shù)據(jù)持有者提供詳細(xì)的數(shù)據(jù)處3)規(guī)范數(shù)據(jù)收集和標(biāo)注在數(shù)據(jù)收集階段,我們需要確保采集的數(shù)據(jù)具有代表性、多樣性在數(shù)據(jù)標(biāo)注階段,我們需要注意避免歧視性的標(biāo)簽和評(píng)價(jià)。標(biāo)注4)開展風(fēng)險(xiǎn)評(píng)估和緩解措施在人工智能數(shù)據(jù)處理過程中,我們需要對(duì)可能導(dǎo)致不公正或歧視針對(duì)評(píng)估結(jié)果中暴露出的風(fēng)險(xiǎn)點(diǎn),我們可以采取多種緩解措施。5)定期審查和更新我們需要定期審查和更新數(shù)據(jù)倫理準(zhǔn)則和政策以確保其與時(shí)代保持當(dāng)前產(chǎn)業(yè)對(duì)于人工智能的工程建設(shè)工作包括數(shù)據(jù)收集、數(shù)據(jù)理/清洗、特征工程、數(shù)據(jù)標(biāo)注、數(shù)據(jù)劃分通過利用DataOps1所強(qiáng)調(diào)的加強(qiáng)團(tuán)隊(duì)間協(xié)作溝通、要求數(shù)據(jù)流程以下我們將創(chuàng)新性的提出利用DataOps理念來賦能人工智能模型與(一)明確應(yīng)用目標(biāo)與需求確定應(yīng)用目標(biāo)與效果:首先,與相關(guān)方共同明確人工智能應(yīng)用的目標(biāo)和預(yù)期效果。這可能涉及解決的業(yè)務(wù)問題、改善的業(yè)務(wù)流程或?qū)崿F(xiàn)的業(yè)務(wù)目標(biāo)。明確應(yīng)用場景:確定人工智能應(yīng)用的具體場景和應(yīng)用范圍。這包括確定應(yīng)用的環(huán)境、用戶和操作方式。澄清數(shù)據(jù)需求:與算法方、需求方和數(shù)據(jù)方共同澄清所需的數(shù)據(jù)類型、數(shù)據(jù)數(shù)量和數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)。這可能涉及確定需要的數(shù)據(jù)來源、數(shù)據(jù)格式、數(shù)據(jù)標(biāo)簽等。評(píng)估數(shù)據(jù)獲取難度:評(píng)估當(dāng)前已有數(shù)據(jù)與所需數(shù)據(jù)的可獲取性和使用難度。這包括考慮數(shù)據(jù)獲取的法律、道德和技術(shù)限制,以及數(shù)據(jù)采集和標(biāo)注的成本和時(shí)間。(二)設(shè)計(jì)數(shù)據(jù)集治理要求與規(guī)范制定數(shù)據(jù)標(biāo)注流程:制定清晰的數(shù)據(jù)標(biāo)注流程,包括數(shù)據(jù)標(biāo)注的明確數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn):明確數(shù)據(jù)質(zhì)量的衡量標(biāo)準(zhǔn)和評(píng)估方法,包括道德和行業(yè)規(guī)范的要求,特別是涉及個(gè)人隱私和敏感信息的情況下。管理規(guī)范持續(xù)更新:建立一個(gè)持續(xù)更新的數(shù)據(jù)管理規(guī)范,確保規(guī)特征工程和數(shù)據(jù)增強(qiáng):進(jìn)行特征工程和數(shù)據(jù)增強(qiáng),以提取數(shù)據(jù)的溝通與驗(yàn)收:加強(qiáng)算法方與數(shù)據(jù)方的溝通,確保數(shù)據(jù)處理過程中數(shù)據(jù)集持續(xù)維護(hù):對(duì)交付的數(shù)據(jù)集進(jìn)行持續(xù)維護(hù)和更新,確保數(shù)洞察數(shù)據(jù)集構(gòu)成與分布:對(duì)當(dāng)前企業(yè)內(nèi)數(shù)據(jù)集的構(gòu)成、分布、質(zhì)版本管理與權(quán)限管控:建立數(shù)據(jù)集的版本管理系統(tǒng)和權(quán)限管控機(jī)(五)持續(xù)數(shù)據(jù)集運(yùn)營與優(yōu)化構(gòu)建監(jiān)控指標(biāo)體系:構(gòu)建全局的監(jiān)控指標(biāo)體系,綜合考慮數(shù)據(jù)集四、展望未來,供給人工智能數(shù)據(jù)集的產(chǎn)業(yè)在采集、加工、交易、消費(fèi)等然而,隨著市場集中度的提高(馬太效應(yīng)),只有少數(shù)企業(yè)可能在這(三)服務(wù)化準(zhǔn)的數(shù)據(jù)產(chǎn)品(數(shù)據(jù)集、語料庫)。(一)美歐人工智能數(shù)據(jù)治理政策實(shí)踐概述隨著人工智能的快速發(fā)展,從人類的生產(chǎn)力和效率水平完成日益復(fù)雜人工智能在開發(fā)和應(yīng)用過程中面臨的嚴(yán)作為較早開展人工智能數(shù)據(jù)治理工作的1)戰(zhàn)略層面量數(shù)據(jù)集和模型開發(fā)與評(píng)估以及個(gè)人隱早在2016年10月,美國白宮科技政策辦公室(OSTP)發(fā)布《國家人工智能研究與發(fā)展戰(zhàn)略計(jì)劃》,并在2019年和2023年進(jìn)行更新。該計(jì)劃在戰(zhàn)略1“長期投資并共享人工智能培訓(xùn)和測試專用公共數(shù)開發(fā)開源軟件庫和工具箱。2019年2月,inArtificialIntelligence)中明確提出:所有相關(guān)機(jī)構(gòu)的負(fù)責(zé)人都應(yīng)該重新評(píng)估其檔,以實(shí)現(xiàn)發(fā)現(xiàn)和可用性,并應(yīng)根據(jù)AI研究團(tuán)體的用戶反饋,優(yōu)先改進(jìn)AI數(shù)據(jù)2022年10月4日,美國白宮科技政策提出將數(shù)據(jù)保護(hù)隱私作為人工智能技術(shù)目前美國缺乏一個(gè)全面的法律或監(jiān)管框統(tǒng)在特定用途的需求上需要征得用戶同還指出要對(duì)敏感領(lǐng)域相關(guān)數(shù)據(jù)提供有額這些敏感領(lǐng)域相關(guān)的數(shù)據(jù)的自動(dòng)化系統(tǒng)2023年10月30日,美國總統(tǒng)拜登于簽署DevelopmentandUseofArtificial2)立法層面人工智能技術(shù)的迅速迭代以及應(yīng)用的快速普及,使得美國在人工智能立法層面近期人工智能提案的數(shù)據(jù)治理部分進(jìn)行2023年2月11日,美國提出《確保人工由、公民權(quán)利和正當(dāng)程序。2023年7月措施等。2023年9月28日,美國國會(huì)提2023年4月27日,美國國會(huì)提出《人工為聯(lián)邦管理官員和監(jiān)管人員及其他目的制定或以其他方式確保提供人工智能培中沒有使用具有足夠代表性的培訓(xùn)數(shù)據(jù)2023年5月16日,美國國會(huì)提出《兒童Act),該法案限制未成年人使用包含人工智能(AI)功能(如聊天功能)的程序、禁止任何實(shí)體(如社交媒體公司)在未經(jīng)未成年人父母同意的情況下向未成年人選人及其他目的有關(guān)的具有欺騙性的人露2023年5月2日,美國國會(huì)提出《真實(shí)政明顯的方式包括聲明。2023年6月5日,能產(chǎn)生的?!?2)聯(lián)邦貿(mào)易委員會(huì)的執(zhí)法。2023年9月12日,美國國會(huì)《人工2023年10月25日,美國國會(huì)提出《人工統(tǒng)是值得信賴的。2023年11月2日,美(FederalArtificialIntlligenceRi供各機(jī)構(gòu)在需要人工智能供應(yīng)商的采購11月15日,美國國會(huì)提出《人工智能研IntelligenceResearch,Innovation,and1)戰(zhàn)略層面2018年4月25日,歐盟委員會(huì)發(fā)布《歐首次系統(tǒng)地提出了歐盟版的人工智能發(fā)倡議和確定了歐洲人工智能發(fā)展的三大目標(biāo):(1)提升歐盟技術(shù)、產(chǎn)業(yè)能力,推進(jìn)人工智能的廣泛應(yīng)用。(2)為應(yīng)對(duì)人工智能技術(shù)可能帶來的社會(huì)經(jīng)濟(jì)變革做好準(zhǔn)備。(3)在歐盟現(xiàn)有價(jià)值觀與《歐2019年4月8日發(fā)布了由人工智能專家委員會(huì)撰寫的《可信人工智能倫理指南》(EthicsGuidenelinesforTru旨在為人工智能技術(shù)的開發(fā)和應(yīng)用提供保護(hù)列為7個(gè)實(shí)踐原則的關(guān)鍵要求之一。2020年2月19日歐盟發(fā)布了《人工智能Intelligence),主要圍繞“卓越生態(tài)系統(tǒng)” 2021年4月21日歐盟發(fā)布更新版本《人掘數(shù)據(jù)潛能以充分釋放其潛力以及建設(shè)工智能的發(fā)展。其中,數(shù)據(jù)層面的原因是:能夠在符合歐盟法規(guī)(包括保護(hù)個(gè)人數(shù)據(jù)承諾)前提下,實(shí)現(xiàn)歐盟內(nèi)部、與貿(mào)易伙伴之間以及跨部門的“流動(dòng)”,是非常重2022年7月25日,歐洲議會(huì)未來與科學(xué)decision-makingsystems)報(bào)保證對(duì)基于人工智能的系統(tǒng)公平地表示“現(xiàn)實(shí)世界”的知識(shí)。應(yīng)實(shí)施監(jiān)督和問責(zé)機(jī)提出相關(guān)的政策建議,包括:不需要針人工智能決策影響的主體提供數(shù)據(jù)訪問2)立法層面(GDPR),在數(shù)據(jù)安全及隱私安全上制的算法具有一定的可解釋性,例如:第5條規(guī)定個(gè)人數(shù)據(jù)處理必須遵循:合法地公平地并且以公開透明的方式對(duì)數(shù)據(jù)主22條指出數(shù)據(jù)主體有權(quán)不受僅基于自動(dòng)第二:以平臺(tái)為中心。2022年7月5日,ServicesAct,DSA)和《數(shù)字市場法》第三,以人工智能為中心。2023年6月高質(zhì)量數(shù)據(jù)集需要實(shí)施適當(dāng)?shù)臄?shù)據(jù)治理和管理實(shí)踐。法案第10條數(shù)據(jù)和數(shù)據(jù)治高風(fēng)險(xiǎn)人工智能系統(tǒng)應(yīng)基于符合第2至55.在確保高風(fēng)險(xiǎn)人工智能系統(tǒng)進(jìn)行偏見會(huì)條例(EU)2016/679》第9(1)條、《歐盟指令(EU)2016/680》第10條和《歐洲議會(huì)條例(EU)2018/1725》第10(1)顯著影響所追求目的的情況下采用加密工智能系統(tǒng),第2至5條僅適用于測試數(shù)1Informationtechnology一Artificialintelligence—Data2Artificialintelligence一Dataqu3Artificialin

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論