TCECC 027-2024 生成式人工智能數(shù)據(jù)應(yīng)用合規(guī)指南_第1頁(yè)
TCECC 027-2024 生成式人工智能數(shù)據(jù)應(yīng)用合規(guī)指南_第2頁(yè)
TCECC 027-2024 生成式人工智能數(shù)據(jù)應(yīng)用合規(guī)指南_第3頁(yè)
TCECC 027-2024 生成式人工智能數(shù)據(jù)應(yīng)用合規(guī)指南_第4頁(yè)
TCECC 027-2024 生成式人工智能數(shù)據(jù)應(yīng)用合規(guī)指南_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

ICS03.100.01CCSA00T/CECC027-2024生成式人工智能數(shù)據(jù)應(yīng)用合規(guī)指南ComplianceGuidelinesforDataApplicationofGenerativeArtificialIntelligence中國(guó)電子商會(huì)發(fā)布I前言 Ⅲ 1范圍 12規(guī)范性引用文件 13術(shù)語(yǔ)和定義 14合規(guī)原則 35數(shù)據(jù)采集合規(guī)要求 35.1合規(guī)性審查 35.2采集方式 45.3特定數(shù)據(jù) 46數(shù)據(jù)標(biāo)注合規(guī)要求 56.1標(biāo)注規(guī)則的制定 56.2數(shù)據(jù)標(biāo)注質(zhì)量評(píng)估 56.3標(biāo)注人員的資質(zhì)、培訓(xùn)、考核及管理 57訓(xùn)練數(shù)據(jù)的預(yù)處理合規(guī)要求 57.1提高訓(xùn)練數(shù)據(jù)質(zhì)量 57.2通過(guò)合成技術(shù)進(jìn)行數(shù)據(jù)增強(qiáng) 68模型訓(xùn)練與測(cè)試合規(guī)要求 68.1模型訓(xùn)練 68.2模型測(cè)試 79內(nèi)容生成服務(wù)合規(guī)要求 79.1使用者盡責(zé)義務(wù)的告知 79.2生成內(nèi)容的審核 79.3生成內(nèi)容的標(biāo)識(shí) 79.4生成內(nèi)容的異議審查機(jī)制 79.5使用者信息保護(hù) 79.6被侵權(quán)人維權(quán)支持 810其他數(shù)據(jù)應(yīng)用合規(guī)要求 810.1數(shù)據(jù)安全保護(hù) 810.2數(shù)據(jù)分類(lèi)分級(jí) 810.3數(shù)據(jù)刪除 810.4數(shù)據(jù)跨境 810.5算法備案與安全評(píng)估 8參考文獻(xiàn) T/CECC027-2024本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。本文件由國(guó)家工業(yè)信息安全發(fā)展研究中心牽頭,由北京之合網(wǎng)絡(luò)科技有限公司負(fù)責(zé)組織,由中國(guó)電子商會(huì)歸口。本文件起草單位:國(guó)家工業(yè)信息安全發(fā)展研究中心、天翼云科技有限公司、海爾集團(tuán)公司法律事務(wù)部、蔚來(lái)控股有限公司、解放號(hào)網(wǎng)絡(luò)科技有限公司、三七互娛網(wǎng)絡(luò)科技集團(tuán)股份有限公司、北京市盈科律師事務(wù)所、北京市康達(dá)律師事務(wù)所、聯(lián)想(北京)有限公司、廣州華多網(wǎng)絡(luò)科技有限公司、中移數(shù)智科技有限公司、九度數(shù)字科技(蘇州)有限公司、上海邦信陽(yáng)律師事務(wù)所、上海拉扎斯信息科技有限公司、上海秘塔網(wǎng)絡(luò)科技有限公司、上海健交科技服務(wù)有限責(zé)任公司、上海寬娛數(shù)碼科技有限公司、上海得帆信息技術(shù)有限公司、上海商湯科技開(kāi)發(fā)有限公司、上海澄明則正律師事務(wù)所、上海中聯(lián)律師事務(wù)所、上海之合網(wǎng)絡(luò)科技有限公司、上海之愛(ài)智能科技有限公司、上海律行教育科技有限公司、上海愛(ài)奇求思教育科技有限公司、天津東方律師事務(wù)所、天津律云律師事務(wù)所、日日順新能源科技有限公司、中國(guó)汽車(chē)工程研究院股份有限公司、中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心、中電金信軟件有限公司、中電信數(shù)智科技有限公司、中譯語(yǔ)通科技股份有限公司、中國(guó)電子商會(huì)數(shù)據(jù)要素發(fā)展工作委員會(huì)、中國(guó)中小企業(yè)協(xié)會(huì)企業(yè)合規(guī)專(zhuān)業(yè)委員會(huì)、中國(guó)電子商會(huì)人工智能委員會(huì)、中國(guó)科學(xué)技術(shù)法學(xué)會(huì)人工智能法專(zhuān)業(yè)委員會(huì)、中瑞世聯(lián)資產(chǎn)評(píng)估集團(tuán)有限公司、平安科技(深圳)有限公司、北京大學(xué)武漢人工智能研究院、北京世寧律師事務(wù)所、北京市中倫文德律師事務(wù)所、北京市銘基律師事務(wù)所、北京遠(yuǎn)景視點(diǎn)科技有限公司、北京信工博特智能科技有限公司、北京桓潤(rùn)律師事務(wù)所、北京之合網(wǎng)絡(luò)科技有限公司、北京汼頓子敬信息技術(shù)有限公司、絲芙蘭Sephora、西安電子科技大學(xué)、江西火眼智能科技有限公司、江西電信信息產(chǎn)業(yè)有限公司、江蘇品川律師事務(wù)所、江蘇智倫數(shù)字技術(shù)研究有限公司、江蘇數(shù)智碳鏈科技有限公司、阿里巴巴(北京)軟件服務(wù)有限公司、武漢光谷知識(shí)產(chǎn)權(quán)研究院有限公司、青島海爾生物醫(yī)療股份有限公司、英矽智能科技(上海)有限公司、杭州小影創(chuàng)新科技股份有限公司、棗莊市網(wǎng)絡(luò)社會(huì)組織聯(lián)合會(huì)、金杜律師事務(wù)所、鄭州鄭大信息技術(shù)有限公司、陜西豐瑞律師事務(wù)所、螞蟻科技集團(tuán)股份有限公司、香港浸會(huì)大學(xué)深圳研究院、美年大健康產(chǎn)業(yè)控股股份有限公司、浙江天冊(cè)律師事務(wù)所、浙江深服人工智能科技有限公司、清圖數(shù)據(jù)科技(南京)有限公司、深圳市木愚科技有限公司、廈門(mén)立馬耀網(wǎng)絡(luò)科技有限公司、新汽有限公司、睿珀智能科技有限公司。本文件主要起草人:張穹、張平、方懿、邱惠君、李衛(wèi)、劉巍、楊柳、馮立鸚、陳立彤、李丹一、朱倩倩、洪紹泉、洪祖運(yùn)、洪鈞、劉啟銘、蔡江天、常國(guó)珍、陳府申、陳晗、陳華平、陳煥、陳杰、陳良斌、陳夢(mèng)園、陳乾、陳向娟、陳怡、陳宇峰、戴學(xué)良、戴亦斌、鄧超麟、鄧志福、鄧梓珊、刁成路、丁丁、丁亮、董格瑪、董皓、董瀟、杜娟、杜歆、杜雨、馮超、馮斐斐、馮祥宸、傅臨黎、高輝、葛昌金、宮蕾、龔琳、郭嘉琦、郭蛟、郭璐璐、韓劍、韓琳、韓笑、郝成金、何念寒、何源泉、何媛、何昭敏、侯廣、侯小菊、胡峰、胡家昊、胡俊勇、胡若玫、胡校溟、胡巖、黃凱、黃元忠、紀(jì)海良、賈穎、江海、姜婷、姜欣、蔣薇、蔣瀟君、晉銀濤、孔真琦、郎婷、李華、李輝、李健青、李珂、李林育、李謙、李嶸輝、李新華、李陽(yáng)、李音瑤、李永鋒、李?lèi)?、李澤芳、李長(zhǎng)青、李哲、連艷、梁智剛、廖懷學(xué)、林安雯、劉朝、劉誠(chéng)誠(chéng)、劉豐、劉格言、劉驥、劉劍鋒、劉敬霞、劉鵬、劉泊辰、劉瑞、劉欣、劉興、劉艷陽(yáng)、劉永和、龍懷春、盧丁、陸瑾、陸雨辰、羅潔、呂仁平、呂亞妹、馬海曼、馬曉艷、孟戈弋、聶正軍、歐陽(yáng)昆潑、潘永建、潘云龍、彭天基、彭曉燕、齊斌、祁彥諭、喬佳平、譙青青、邱夢(mèng)赟、邱媛春、曲峰、屈文靜、任潔、阮芳洋、沙俊、沙沫、單思楊、時(shí)蕭楠、宋冰心、宋皓、宋俊、宋天一、孫晨荻、孫雪菲、譚潔、湯子歐、唐簡(jiǎn)捷、唐淑萍、陶毓、田莉、田茂君、朱炤沁、汪漢鴻、王斌、王彩琴、王崠、王芳、王菲、王斐、王涵、王皓、王劍鋒、王捷、王菁煜、王君、王立群、王麗娜、王龍海、王淼、王祺、王瑞揆、王溪、王小敏、王軒、王藝蓉、王岳、王悅、王志林、王智瀅、韋征、魏豐、翁振洋、吳剛、吳萬(wàn)凱、吳志強(qiáng)、武婕、夏海波、夏慶仁、夏文華、肖颯、謝國(guó)輝、謝尚誓、謝甜甜、熊錢(qián)富、徐婧、徐嵐、徐強(qiáng)、徐瑞、徐云飛、許力先、許立昕、閆洋、燕雪松、楊博、楊海濱、楊海強(qiáng)、楊瑾煜舟、楊勁、楊軍、楊思敏、楊天歌、楊曉雷、楊曉莉、楊鑫、楊旸、楊宇宙、楊忠勤、姚晶鑫、T/CECC027-2024姚雪飛、葉娟、葉俊希、尹立、于洪方、于謹(jǐn)源、余俊峰、俞霞、袁韶浦、袁新忠、曾玥、張翠美、張杜超、張廣運(yùn)、張豪、張繼煥、張建民、張靜、張雋、張凌、張明強(qiáng)、張汭、張森森、張松艷、張彤、張顯顯、張笑怡、張?chǎng)?、張雪芳、張延?lái)、張逸瑞、張?jiān)?、張?jiān)?、張?jiān)脐?、張孜銘、張祖勤、趙夢(mèng)晗、趙玉剛、趙云虎、鄭珂威、鄭鑫焱、鐘云斌、周力思、周霖、周陽(yáng)、周宇、朱彬、朱莎、朱曉薇、朱岳峰、朱政、朱中輝、鄒丹莉、林戈、張怡、趙琪彥、陳驍萌、翟藝、毛姍姍、吳劍霞、金辰、聶佳彤、陳綺敏、張敏、朱彩云、董宇洲、鄧歡、王怡冉、龍衍孫、王笑晗、張圓捷、陳天宇。T/CECC027-2024為應(yīng)對(duì)生成式人工智能帶來(lái)的安全挑戰(zhàn),促進(jìn)生成式人工智能產(chǎn)業(yè)高質(zhì)量健康發(fā)展,確保數(shù)據(jù)應(yīng)用的各個(gè)環(huán)節(jié)符合合規(guī)性要求,確保數(shù)據(jù)全生命周期的安全運(yùn)行,根據(jù)《中華人民共和國(guó)網(wǎng)絡(luò)安全法》、《中華人民共和國(guó)數(shù)據(jù)安全法》、《中華人民共和國(guó)個(gè)人信息保護(hù)法》、《中華人民共和國(guó)著作權(quán)法》、《中華人民共和國(guó)反不正當(dāng)競(jìng)爭(zhēng)法》等相關(guān)法律,《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》、《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》、《生成式人工智能服務(wù)管理暫行辦法》、《科技倫理審查辦法(試行)》、《具有輿論屬性或社會(huì)動(dòng)員能力的互聯(lián)網(wǎng)信息服務(wù)安全評(píng)估規(guī)定》等相關(guān)部門(mén)規(guī)章,結(jié)合我國(guó)生成式人工智能技術(shù)和產(chǎn)業(yè)發(fā)展的實(shí)際,制定本文件。1T/CECC027-2024生成式人工智能數(shù)據(jù)應(yīng)用合規(guī)指南本文件規(guī)定了生成式人工智能服務(wù)在數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注、訓(xùn)練數(shù)據(jù)預(yù)處理、模型訓(xùn)練與測(cè)試、內(nèi)容生成服務(wù)等各個(gè)數(shù)據(jù)應(yīng)用環(huán)節(jié)中應(yīng)遵循的數(shù)據(jù)應(yīng)用合規(guī)原則與合規(guī)要求,以及可供借鑒參考的具體合規(guī)手段與合規(guī)方法。本文件適用于指導(dǎo)生成式人工智能服務(wù)提供者向中華人民共和國(guó)境內(nèi)公眾提供生成式人工智能內(nèi)容生成服務(wù)過(guò)程中所開(kāi)展的數(shù)據(jù)應(yīng)用合規(guī)工作。2規(guī)范性引用文件下列文件中的內(nèi)容通過(guò)文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T29490-2023企業(yè)知識(shí)產(chǎn)權(quán)合規(guī)管理體系要求GB/T35273-2020信息安全技術(shù)個(gè)人信息安全規(guī)范GB/T35770-2022合規(guī)管理體系要求及使用指南GB/T41867-2022信息技術(shù)人工智能術(shù)語(yǔ)GB/T42574-2023信息安全技術(shù)個(gè)人信息處理中告知和同意的實(shí)施指南GB/T42755-2023人工智能面向機(jī)器學(xué)習(xí)的數(shù)據(jù)標(biāo)注規(guī)程TC260-PG-20233A網(wǎng)絡(luò)安全標(biāo)準(zhǔn)實(shí)踐指南—生成式人工智能服務(wù)內(nèi)容標(biāo)識(shí)方法TC260-003生成式人工智能服務(wù)安全基本要求3術(shù)語(yǔ)和定義下列術(shù)語(yǔ)和定義適用于本文件。人工智能artificialintelligence;AI<學(xué)科>人工智能系統(tǒng)(3.2)相關(guān)機(jī)制和應(yīng)用的研究和開(kāi)發(fā)。人工智能系統(tǒng)artificialintelligencesystem指針對(duì)人類(lèi)定義的給定目標(biāo),產(chǎn)生諸如內(nèi)容、預(yù)測(cè)、推薦或決策等輸出的一類(lèi)工程系統(tǒng)。生成式人工智能generativeartificialintelligence具有文本、圖片、音頻、視頻等內(nèi)容生成能力的人工智能模型及相關(guān)技術(shù)。提供者provider以交互界面、可編程接口等形式面向我國(guó)境內(nèi)公眾提供生成式人工智能服務(wù)的組織或個(gè)人。2數(shù)據(jù)標(biāo)注datalabelling模型優(yōu)化modeloptimization3T/CECC027-24T/CECC027-2024采集方式5.2.1直接獲取數(shù)據(jù)提供者可直接從個(gè)人信息主體處獲取個(gè)人信息,或在自身日常生產(chǎn)經(jīng)營(yíng)中創(chuàng)造生產(chǎn)新數(shù)據(jù)、以原始數(shù)據(jù)為基礎(chǔ)加工生產(chǎn)新數(shù)據(jù)。提供者直接從個(gè)人信息主體處獲取個(gè)人信息的,應(yīng)符合5.3.2的合規(guī)要求。5.2.2間接獲取數(shù)據(jù)在事先評(píng)估合法性基礎(chǔ)的前提下,除直接獲取數(shù)據(jù)外,提供者可從其他主體處間接獲取數(shù)據(jù),即通過(guò)數(shù)據(jù)交易、數(shù)據(jù)共享、公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)等途徑獲取數(shù)據(jù)。提供者應(yīng)同相對(duì)方簽訂相應(yīng)的法律協(xié)議,謹(jǐn)慎審核相對(duì)方的數(shù)據(jù)來(lái)源合法性以及數(shù)據(jù)可交易性,并要求相對(duì)方作出來(lái)源合法性、可交易性和可使用性承諾,或出示相關(guān)證明等。鼓勵(lì)提供者通過(guò)數(shù)據(jù)交易所等公開(kāi)平臺(tái)獲取數(shù)據(jù),以提升數(shù)據(jù)來(lái)源的合法合規(guī)性。特定數(shù)據(jù)5.3.1公開(kāi)數(shù)據(jù)獲取提供者可通過(guò)人工采集或自動(dòng)爬取等手段從公共互聯(lián)網(wǎng)獲取公開(kāi)數(shù)據(jù),但應(yīng)注意獲取手段的合法合規(guī),不得侵犯他人合法權(quán)益。采用自動(dòng)爬取方式的,應(yīng)遵守目標(biāo)網(wǎng)站的網(wǎng)絡(luò)爬蟲(chóng)排除協(xié)議(Robots協(xié)議)等聲明文件要求,避免采用破解密碼、偽造用戶(hù)代理(UserAgent)、設(shè)置代理網(wǎng)際協(xié)議地址(IP地址)等技術(shù)手段進(jìn)行違規(guī)爬取。應(yīng)控制數(shù)據(jù)爬取的流量與頻率,避免因爬取行為影響目標(biāo)網(wǎng)站的正常運(yùn)行。爬取移動(dòng)互聯(lián)網(wǎng)應(yīng)用程序(App)、小程序等所依賴(lài)的網(wǎng)絡(luò)服務(wù)應(yīng)用程序接口(API)中的數(shù)據(jù),應(yīng)當(dāng)遵守API的服務(wù)鑒權(quán)聲明。公開(kāi)數(shù)據(jù)附有數(shù)據(jù)使用許可條件或使用限制的,提供者獲取該公開(kāi)數(shù)據(jù)后,應(yīng)遵守相關(guān)約定。5.3.2個(gè)人信息收集如提供者采集的數(shù)據(jù)類(lèi)型中包含個(gè)人信息,應(yīng)符合相應(yīng)的法律法規(guī)和GB/T35273-2020第5章中有關(guān)個(gè)人信息收集的合規(guī)要求,包括但不限于:a)在直接收集個(gè)人信息前,應(yīng)依法向個(gè)人明確告知個(gè)人信息處理者的名稱(chēng)或者姓名和聯(lián)系方式,個(gè)人信息的處理目的、處理方式,處理的個(gè)人信息種類(lèi)、保存期限,個(gè)人行使法定權(quán)利的方式和程序等;b)如將直接獲取的個(gè)人信息用于模型訓(xùn)練等目的,應(yīng)符合GB/T42574-2023第7-9章的規(guī)定告知并取得個(gè)人同意,或者具備其他合法性基礎(chǔ);c)對(duì)于個(gè)人自行公開(kāi)或者其他已經(jīng)合法公開(kāi)的個(gè)人信息,如個(gè)人未明確拒絕用于模型訓(xùn)練等目的,處理行為未顯著違背個(gè)人公開(kāi)目的且相關(guān)處理不會(huì)對(duì)個(gè)人權(quán)益造成重大影響的,可視為在合理范圍內(nèi)進(jìn)行處理;d)如需采集敏感個(gè)人信息用于模型訓(xùn)練的,應(yīng)事前進(jìn)行個(gè)人信息保護(hù)影響評(píng)估,在采取嚴(yán)格保護(hù)措施并取得個(gè)人單獨(dú)同意的前提下方可使用;e)如處理不滿十四周歲未成年人個(gè)人信息,除上款內(nèi)容外,還需取得未成年人父母或其他監(jiān)護(hù)人的同意,并制定專(zhuān)門(mén)的個(gè)人信息處理規(guī)則;f)間接獲取的數(shù)據(jù)如包含個(gè)人信息的,應(yīng)要求個(gè)人信息提供方說(shuō)明個(gè)人信息來(lái)源,并確保就信息共享已履行法定的告知義務(wù)并取得個(gè)人單獨(dú)同意,或者具備其他的合法性基礎(chǔ);g)根據(jù)模型訓(xùn)練的特定目的,遵循個(gè)人信息處理的必要性原則,在限于實(shí)現(xiàn)處理目的的最小范圍內(nèi)收集和處理個(gè)人信息;h)除非確有必要,否則用于模型訓(xùn)練的個(gè)人信息應(yīng)進(jìn)行去標(biāo)識(shí)化處理后再進(jìn)行使用。5.3.3知識(shí)產(chǎn)權(quán)保護(hù)獲取數(shù)據(jù)用于模型訓(xùn)練的,應(yīng)采取以下手段防止對(duì)他人知識(shí)產(chǎn)權(quán)的侵害:56T/CECC027-2024提供者應(yīng)從數(shù)量和質(zhì)量上判斷所獲取的數(shù)據(jù)是否具有可靠的來(lái)源,是否能夠反映真實(shí)世界的情況,并通過(guò)人工或模型等方式就數(shù)據(jù)內(nèi)容的真實(shí)性進(jìn)行核驗(yàn)。7.1.2訓(xùn)練數(shù)據(jù)的準(zhǔn)確性提供者可采用數(shù)據(jù)去重、去除異常值、糾正錯(cuò)誤等數(shù)據(jù)清洗方法,以提高數(shù)據(jù)集的準(zhǔn)確性和一致性,排除噪聲和偏差。7.1.3訓(xùn)練數(shù)據(jù)的客觀性訓(xùn)練數(shù)據(jù)宜盡可能中立和無(wú)偏見(jiàn),在數(shù)據(jù)采集與后續(xù)處理環(huán)節(jié)中均應(yīng)避免人為干擾、選擇偏見(jiàn)和其他主觀因素的介入。7.1.4訓(xùn)練數(shù)據(jù)的多樣性為提高模型的性能和泛化能力,應(yīng)充分考慮數(shù)據(jù)來(lái)源、數(shù)據(jù)類(lèi)型及樣本特征分布的均衡和多樣化。為防止生成存在偏見(jiàn)或歧視的內(nèi)容,應(yīng)進(jìn)行充分多樣化和具有代表性的數(shù)據(jù)選擇,確保其包含各個(gè)民族、信仰、國(guó)別、地域、性別、年齡、職業(yè)和健康等的充分信息。7.1.5訓(xùn)練數(shù)據(jù)的安全性為確保訓(xùn)練數(shù)據(jù)的安全性,應(yīng)按照TC260-003中5.1列項(xiàng)的第一項(xiàng)規(guī)定對(duì)訓(xùn)練數(shù)據(jù)的來(lái)源進(jìn)行安全評(píng)估和核驗(yàn)。通過(guò)合成技術(shù)進(jìn)行數(shù)據(jù)增強(qiáng)提供者可在合理范圍內(nèi)創(chuàng)建并使用合成數(shù)據(jù),按照以下原則進(jìn)行數(shù)據(jù)增強(qiáng)訓(xùn)練:a)創(chuàng)建合成數(shù)據(jù)應(yīng)當(dāng)有真實(shí)、客觀且達(dá)到一定數(shù)量的數(shù)據(jù)作為樣本;b)合成數(shù)據(jù)原則上應(yīng)保留真實(shí)數(shù)據(jù)的統(tǒng)計(jì)屬性,但為提高數(shù)據(jù)集的多樣性、補(bǔ)充罕見(jiàn)場(chǎng)景等目的而使用合成數(shù)據(jù)的可以不受此限;c)避免樣本數(shù)據(jù)自身存在的偏見(jiàn),該種偏見(jiàn)可能在生成合成數(shù)據(jù)時(shí)進(jìn)一步傳播;d)使用算法創(chuàng)建合成數(shù)據(jù)后,應(yīng)進(jìn)行適當(dāng)?shù)脑u(píng)估和驗(yàn)證,保證合成數(shù)據(jù)的質(zhì)量與效用,避免出現(xiàn)偏差過(guò)大的問(wèn)題;e)觀測(cè)真實(shí)世界數(shù)據(jù)的變化,及時(shí)更新和維護(hù)合成數(shù)據(jù),以保持其相關(guān)性和有效性;f)創(chuàng)建合成數(shù)據(jù)應(yīng)符合相應(yīng)的法律法規(guī)和倫理準(zhǔn)則,不得創(chuàng)建可能造成侵權(quán)或有違倫理的數(shù)據(jù),不得濫用合成數(shù)據(jù);g)明確記錄創(chuàng)建合成數(shù)據(jù)的具體算法與技術(shù)手段,做到可查詢(xún)、可溯源。8模型訓(xùn)練與測(cè)試合規(guī)要求模型訓(xùn)練8.1.1訓(xùn)練步驟模型訓(xùn)練應(yīng)至少包括預(yù)訓(xùn)練與優(yōu)化訓(xùn)練等兩重以上的訓(xùn)練環(huán)節(jié)。8.1.2預(yù)訓(xùn)練預(yù)訓(xùn)練應(yīng)選擇具有合法來(lái)源的基礎(chǔ)模型,基礎(chǔ)模型應(yīng)經(jīng)過(guò)可靠性、安全性、合法性以及價(jià)值觀等方面的測(cè)評(píng),才可在此基礎(chǔ)上進(jìn)行后續(xù)訓(xùn)練。8.1.3優(yōu)化訓(xùn)練經(jīng)過(guò)預(yù)訓(xùn)練后形成的算法模型,還應(yīng)通過(guò)優(yōu)化訓(xùn)練進(jìn)一步使用已標(biāo)注的數(shù)據(jù)進(jìn)行后續(xù)流程,來(lái)優(yōu)化模型訓(xùn)練的最終結(jié)果。8.1.4模型驗(yàn)證7T/CECC027-289T/CECC027-2024如提供的生成式人工智能服務(wù)具有輿論屬性或者社會(huì)動(dòng)員能力,應(yīng)按照國(guó)家有關(guān)規(guī)定以及本文件要求開(kāi)展合規(guī)自評(píng)估工作,履行相應(yīng)的算法備案及安全評(píng)估手續(xù)。提供者應(yīng)在相應(yīng)程序中向主管部門(mén)如實(shí)上報(bào)其數(shù)據(jù)應(yīng)用合規(guī)的制度建設(shè)、落實(shí)情況與自評(píng)估結(jié)果。T/CECC027-2024參考文獻(xiàn)[1]中華人民共和國(guó)網(wǎng)絡(luò)安全法(2016年11月7日第十二屆全國(guó)人民代表大會(huì)常務(wù)委員會(huì)第二十四次會(huì)議通過(guò))[2]中華人民共和國(guó)數(shù)據(jù)安全法(2021年6月10日第十三屆全國(guó)人民代表大會(huì)常務(wù)委員會(huì)第二十九次會(huì)議通過(guò))[3]中華人民共和國(guó)個(gè)人信息保護(hù)法(2021年8月20日第十三屆全國(guó)人民代表大會(huì)常務(wù)委員會(huì)第三十次會(huì)議通過(guò))[4]中華人民共和國(guó)著作權(quán)法(1990年9月7日第七屆全國(guó)人民代表大會(huì)常務(wù)委員會(huì)第十五次會(huì)議通過(guò))[5]中華人民共和國(guó)反不正當(dāng)競(jìng)爭(zhēng)法(1993年9月2日第八屆全國(guó)人民代表大會(huì)常務(wù)委員會(huì)第三次會(huì)議通過(guò))[6]互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定(2021年12月31日國(guó)家互聯(lián)網(wǎng)信息辦公室、工業(yè)和信息化部、公安部、國(guó)家市場(chǎng)監(jiān)督管理總局公布)[7]互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定(2022年11月25日國(guó)家互聯(lián)網(wǎng)信息辦公室、工業(yè)和信息化部、公安部公布)[8]生成式人工智能服務(wù)管理暫行辦法(2023年7月10日國(guó)家互聯(lián)網(wǎng)信息辦公室、國(guó)家發(fā)展和改革委員會(huì)、教育部、科學(xué)技術(shù)部、工業(yè)和信息化部、公安部、國(guó)家廣播電視總局公布)[9]科技倫理審查辦法(試行2023年9月7日科學(xué)技術(shù)部、教育部、工業(yè)和信息化部、農(nóng)業(yè)農(nóng)村部、國(guó)家衛(wèi)生健康委員會(huì)、中國(guó)科學(xué)院、中國(guó)工程院、中國(guó)科學(xué)技術(shù)協(xié)會(huì)、中國(guó)社會(huì)科學(xué)院、中央軍委科學(xué)技術(shù)委員會(huì)印發(fā))[10]具有輿論屬性或社會(huì)動(dòng)員能力

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論