淺析AI克隆藝人聲音的侵權(quán)問題-中美新近立法與司法實(shí)踐對比_第1頁
淺析AI克隆藝人聲音的侵權(quán)問題-中美新近立法與司法實(shí)踐對比_第2頁
淺析AI克隆藝人聲音的侵權(quán)問題-中美新近立法與司法實(shí)踐對比_第3頁
淺析AI克隆藝人聲音的侵權(quán)問題-中美新近立法與司法實(shí)踐對比_第4頁
淺析AI克隆藝人聲音的侵權(quán)問題-中美新近立法與司法實(shí)踐對比_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

隨著人工智能科技的飛速發(fā)展,利用人工智能(ArtificialIntelligence,簡稱AI)生成與某個(gè)特定自然人的聲音極為相似的虛假語音變得越來越容易。這一技術(shù)被稱為“聲音克隆”(VoiceCloning),也稱“深度偽造語音”(DeepfakeAudio)。常見的聲音克隆有兩種形式:文本轉(zhuǎn)語音(TexttoSpeech)及語音轉(zhuǎn)換(VoiceConversion,也稱SpeechtoSpeech)?!拔谋巨D(zhuǎn)語音”指利用AI將用戶輸入的文本轉(zhuǎn)化為與特定自然人聲音高度相似的語音?!罢Z音轉(zhuǎn)換”指在說話內(nèi)容不變的情況下,利用AI學(xué)習(xí)并模仿特定自然人A的聲音(包括音色及韻律),從而將特定自然人B(原本的說話人)的聲音替換為特定自然人A(轉(zhuǎn)換后的說話人)的聲音。[1]藝人是AI聲音克隆的主要對象。2024年5月13日,OpenAI發(fā)布最新多模態(tài)大模型ChatGPT-4o,并且在發(fā)布會(huì)上重點(diǎn)介紹了ChatGPT-4o的語音對話能力。知名演員斯嘉麗·約翰遜(ScarlettJohansson)隨后驚訝地發(fā)現(xiàn)ChatGPT-4o用于對話的語音助手“SKY”的聲音竟然與自己的聲音高度相似,以至于新聞媒體和自己最親密的朋友都無法分辨出二者的區(qū)別。據(jù)斯嘉麗透露,OpenAI曾數(shù)次請求斯嘉麗為ChatGPT的產(chǎn)品配音但均被拒絕。甚至在本次發(fā)布會(huì)前幾日,OpenAI還曾聯(lián)系斯嘉麗,希望能夠獲得聲音授權(quán)。盡管OpenAI聲明SKY的聲音源自另一位配音演員,但斯嘉麗認(rèn)為OpenAI涉嫌未經(jīng)許可克隆自己的聲音,要求OpenAI下架SKY。[2]極具特色和辨識度的聲音是藝人的個(gè)人品牌。如何在鼓勵(lì)科技創(chuàng)新的同時(shí)妥善保護(hù)藝人的聲音權(quán)益,已經(jīng)成為各國法律亟需回應(yīng)的問題。本文將介紹中美兩國立法和司法實(shí)踐中對藝人聲音的保護(hù)規(guī)則,通過對比研究,探討兩國聲音保護(hù)規(guī)則的共識、差異及需要進(jìn)一步關(guān)注的問題。一、美國在美國,藝人的聲音可能落入個(gè)人形象權(quán)的保護(hù)范圍。個(gè)人形象權(quán)指個(gè)人有權(quán)控制“代表其個(gè)體特征且具有商業(yè)價(jià)值的形象要素,并由此獲得報(bào)酬”。[3]這一權(quán)利目前并沒有聯(lián)邦層面的統(tǒng)一立法,而是由各州通過成文法或判例單獨(dú)進(jìn)行保護(hù),且各州在個(gè)人形象權(quán)的保護(hù)范圍、保護(hù)期限、可否繼承與轉(zhuǎn)讓等問題上均存在不同規(guī)定。例如在紐約、加州等地,聲音可以得到個(gè)人形象權(quán)的保護(hù),但在其他州則不盡然。[4]隨著AI聲音克隆技術(shù)的愈發(fā)成熟,利用AI克隆藝人聲音的現(xiàn)象也愈加普遍。這一現(xiàn)象引起了藝人及音樂、影視行業(yè)的擔(dān)憂和抗議,因?yàn)楸普娴腁I克隆聲音正在廣泛且實(shí)質(zhì)地替代藝人的真實(shí)聲音,不僅嚴(yán)重?fù)p害藝人的經(jīng)濟(jì)利益,同時(shí)削減了人類創(chuàng)作的價(jià)值。[5]為了保護(hù)藝人的聲音免受人工智能未經(jīng)授權(quán)的克隆,美國各州及聯(lián)邦紛紛著手修改既有立法,不僅致力于將聲音明確納入個(gè)人形象權(quán)保護(hù)范圍,并且聚焦于對AI聲音克隆行為的規(guī)制。其中以田納西州的立法及美國聯(lián)邦的兩部草案最具有代表性,以下將分別予以介紹。1.AI聲音克隆受個(gè)人形象權(quán)規(guī)范田納西州是美國音樂產(chǎn)業(yè)重要中心,這里坐落著音樂之城納什維爾(Nashville),還有鄉(xiāng)村音樂的發(fā)源地布里斯托(Bristol)。音樂產(chǎn)業(yè)為全州提供了超過61,617個(gè)工作崗位,為美國經(jīng)濟(jì)貢獻(xiàn)了58億美元的GDP。[6]在人工智能科技浪潮下,音樂產(chǎn)業(yè)受到AI聲音克隆技術(shù)的巨大沖擊,但田納西州1984年的《個(gè)人權(quán)利保護(hù)法》(thePersonalRightsProtectionAct,簡稱TPRPA)卻無法為藝人的聲音提供足夠的保護(hù)。依據(jù)1984年的《個(gè)人權(quán)利保護(hù)法》,個(gè)人形象權(quán)只保護(hù)個(gè)人的“姓名、照片和肖像”,藝人聲音未被明確納入個(gè)人形象權(quán)的保護(hù)范圍,AI聲音克隆更不屬于個(gè)人形象權(quán)可以禁止的行為。為了保護(hù)當(dāng)?shù)氐闹匾е魳樊a(chǎn)業(yè),2024年1月24日,田納西州長BillLee提出田納西州需盡快修改1984年的《個(gè)人權(quán)利保護(hù)法》,并且應(yīng)在新法中重點(diǎn)解決AI未經(jīng)授權(quán)以他人聲音制作聲音克隆音頻的問題。2024年3月21日,田納西州修改了1984年《個(gè)人權(quán)利保護(hù)法》的部分條款,并將修正后的法案命名為《確保肖像、聲音和圖像安全法案》(EnsuringLikenessVoiceandImageSecurityAct,簡稱TheELVISAct)。TheELVISAct不僅明確將聲音納入田納西州個(gè)人形象權(quán)的保護(hù)范圍,而且將個(gè)人形象權(quán)的保護(hù)范圍明確擴(kuò)張至AI聲音[7],這在各州立法中尚屬首次。TheELVISAct將“聲音”定義為:一種在媒介中可以被輕易識別并且可歸屬于特定個(gè)人的聲音,不論該聲音是否包含該特定個(gè)人的真實(shí)聲音或模擬聲音(StimulationoftheVoiceoftheIndividual)。[8]生成式AI通過學(xué)習(xí)特定個(gè)人的聲音樣本,能夠輸出令人難辨真?zhèn)蔚哪M聲音,使他人將該模擬聲音與特定個(gè)人關(guān)聯(lián)。TheELVISAct中明確將“模擬聲音”納入“聲音”定義,意在規(guī)制利用AI技術(shù)進(jìn)行聲音克隆的行為。根據(jù)TheELVISAct,藝人對聲音享有個(gè)人形象權(quán),這是一種財(cái)產(chǎn)性權(quán)利,可以轉(zhuǎn)讓和繼承,不因藝人死亡而終止。除藝人本人外,其法定監(jiān)護(hù)人、繼承人、受遺贈(zèng)人、遺產(chǎn)管理人等在藝人的聲音權(quán)益受到侵害時(shí),均有權(quán)提起訴訟。[9]相較于田納西州1984年的《個(gè)人權(quán)利保護(hù)法》,TheELVISAct在上述有權(quán)起訴的主體外,還對獲得排他許可的主體賦予了起訴資格。依據(jù)TheELVISAct第1106條,如果唱片公司等主體與藝人簽訂合同,對聲音權(quán)益的利用獲得排他性許可,則這部分主體可以單獨(dú)就侵權(quán)提起訴訟。2.AI聲音克隆的侵權(quán)責(zé)任(1)未經(jīng)授權(quán)創(chuàng)建及使用AI克隆聲音TheELVISAct§1105.(a)(1)規(guī)定:任何人出于廣告宣傳、勸誘購買產(chǎn)品或服務(wù)、募集資金等目的,在明知當(dāng)事人未經(jīng)同意的情況下,擅自使用他人聲音的行為,都構(gòu)成侵權(quán)。[10]本法規(guī)定的“聲音”含義包括真實(shí)聲音及模擬聲音,而可能發(fā)生的侵權(quán)行為可以分為以下兩類情形:A.使用他人真實(shí)聲音、未經(jīng)授權(quán)自行創(chuàng)建AI克隆聲音:如果AI開發(fā)公司出于商業(yè)目的、未經(jīng)授權(quán)擅自使用藝人的真實(shí)聲音訓(xùn)練AI,并創(chuàng)建AI克隆聲音,構(gòu)成侵權(quán)。B.未自行創(chuàng)建、但明知且使用他人未經(jīng)授權(quán)而創(chuàng)建的AI克隆聲音:如果AIGC使用者“明知(knowingly)”所使用的聲音是AI公司未經(jīng)授權(quán)、利用他人真實(shí)聲音訓(xùn)練合成的AI克隆聲音,但依然決定使用上述AI克隆聲音,也可能構(gòu)成侵權(quán)。(2)發(fā)布、傳輸、提供AI克隆的聲音TheELVISAct在1984年的《個(gè)人權(quán)利保護(hù)法》的基礎(chǔ)上新增了§1105.(a)(2)條款,本條規(guī)定了“發(fā)布、傳輸和提供AI克隆聲音者”的責(zé)任:在明知對他人聲音的使用未經(jīng)授權(quán)的情況下,仍發(fā)布、表演、分發(fā)、傳輸或者以其他方式向公眾提供該聲音,則此類行為的實(shí)施者也需要承擔(dān)責(zé)任。不同于§1105.(a)(1)中未經(jīng)授權(quán)創(chuàng)建、使用AI克隆聲音的行為需要具有“商業(yè)目的”才能構(gòu)成侵權(quán),§1105.(a)(2)對于“傳播、發(fā)布或向公眾提供”AI克隆聲音的行為并沒有前述的“廣告宣傳、勸誘購買產(chǎn)品或服務(wù)、募集資金”等商業(yè)目的表述。這意味著如果個(gè)人或企業(yè)出于“非商業(yè)目的”發(fā)布、傳輸和提供AI克隆聲音的行為也可能構(gòu)成侵權(quán)。由于流媒體、社交平臺是發(fā)布和傳輸?shù)闹饕浇?,因此此類平臺被認(rèn)定為侵權(quán)的風(fēng)險(xiǎn)較大,[11]但承擔(dān)責(zé)任仍然以“明知”為要件。(3)分發(fā)、傳輸、提供用于克隆聲音的算法§1105.(a)(3)是TheELVISAct的立法創(chuàng)新。面對不斷更新迭代的AI技術(shù),TheELVISAct意在從源頭加強(qiáng)對藝人聲音的保護(hù),在§1105.(a)(3)中對存在侵權(quán)風(fēng)險(xiǎn)的算法進(jìn)行規(guī)制。如果某人“分發(fā)、傳輸或向公眾提供某種主要目的或功能是為了制作特定的、可識別個(gè)人的聲音的算法、軟件或技術(shù)”,則需承擔(dān)侵權(quán)責(zé)任。由于相應(yīng)算法來自科技公司及開發(fā)者,因此科技公司及開發(fā)者研發(fā)用于AI克隆聲音的算法時(shí),需要關(guān)注向社會(huì)公眾提供和傳播相應(yīng)技術(shù)的法律風(fēng)險(xiǎn)。值得注意的是,本條同樣沒有“廣告宣傳、勸誘購買產(chǎn)品或服務(wù)、募集資金”目的要對于“分發(fā)、傳輸、提供”用于克隆聲音的算法的行為,雖然TheELVISAct規(guī)定了承擔(dān)侵權(quán)責(zé)任的條件,但相關(guān)條款仍存在諸多模糊之處。首先,法案中多次提及的“分發(fā)、傳輸或以其他方式提供”含義不明,這一規(guī)定可能導(dǎo)致責(zé)任主體的范圍邊界難以界定。例如提供訪問入口的搜索引擎或者聚合相應(yīng)算法服務(wù)鏈接的網(wǎng)頁都會(huì)可能落入這一范疇。不明確的責(zé)任邊界若過度擴(kuò)張,可能阻礙科技創(chuàng)新和音樂影視創(chuàng)作。[12]其次,針對可能用于AI聲音克隆的算法或軟件,如何判斷§1105.(a)(3)中算法的“主要目的和功能”就是為了未經(jīng)授權(quán)生成克隆聲音,法案中并未給出需要考慮的因素。事實(shí)上,開發(fā)者提供聲音算法時(shí),可能難以預(yù)測并控制算法的實(shí)際用途。比如開發(fā)者可能出于善意的正常用途向公眾提供具有多項(xiàng)功能的通用人工智能模型,但部分公眾卻將其用于侵權(quán)。并且,相應(yīng)算法在運(yùn)行過程中也可能難以由開發(fā)者控制或識別是否已經(jīng)獲得授權(quán),以及授權(quán)是否有除以上內(nèi)容外,TheELVISAct還就救濟(jì)措施、賠償責(zé)任、合理使用等內(nèi)容進(jìn)行規(guī)定。囿于篇幅所限,此處不再(二)美國聯(lián)邦:NOFAKESAct及NoAIFRAUDAct除TheELVISAct外,針對涌現(xiàn)的AI技術(shù),美國兩黨議員也期望在聯(lián)邦層面為生成式AI的使用設(shè)置法律界限。以下將簡要介紹美國聯(lián)邦層面與AI聲音克隆相關(guān)的立法進(jìn)展。2023年10月12日,克里斯·庫恩斯(ChrisCoons)等議員提出《培育原創(chuàng)、促進(jìn)藝術(shù)和保障娛樂行業(yè)安全法案(草案)》(NurtureOriginals,FosterArt,andKeepEntertainmentSafeActof2023,簡稱NOFAKESAct)[14],該法案的目標(biāo)是“保護(hù)代表個(gè)人聲音、肖像、姓名等個(gè)人特征的個(gè)人形象權(quán)免受生成式AI的不公平使用”。NOFAKESAct首次在美國聯(lián)邦層面將“聲音”納入“個(gè)人形象權(quán)”保護(hù)范圍,并禁止未經(jīng)授權(quán)創(chuàng)建代表個(gè)人特征的數(shù)字復(fù)制品(DigitalReplica)或發(fā)布、分發(fā)、傳輸或以其他方式公開此類復(fù)制品,實(shí)施前述行為的主體需承擔(dān)侵權(quán)責(zé)任。[15]NOFAKESAct尚未正式通過,仍在討論階段。目前討論的焦點(diǎn)包括:是否應(yīng)當(dāng)采用“通知——?jiǎng)h除”規(guī)則[16];個(gè)人死亡后70年的個(gè)人形象權(quán)保護(hù)期是否應(yīng)當(dāng)延長或縮短;相較于州法,NO2024年1月10日,瑪?shù)铝铡さ隙鳎∕adeleineDean)等議員提出《禁止人工智能偽造復(fù)制品和未經(jīng)授權(quán)復(fù)制法案(草案)》(NoArtificialIntelligenceFakeReplicasAndUnauthorizedDuplicationsAct,簡稱NoAIFRAUDAct)[18],這一法案旨在從美國聯(lián)邦層面建立防止生成式AI未經(jīng)授權(quán)使用個(gè)人聲音和肖像的法律機(jī)制。NoAIFRAUDAct明確個(gè)人對自己的聲音、肖像等可識別特征享有財(cái)產(chǎn)權(quán),該權(quán)利可轉(zhuǎn)讓可繼承,并且在個(gè)人死亡后的10年內(nèi)仍受到保護(hù)。根據(jù)NoAIFRAUDAct,以下三種行為均構(gòu)成侵權(quán),需對權(quán)利人承擔(dān)賠償責(zé)任:(1)分發(fā)、傳輸或以其他方式向公眾提供聲音克隆服務(wù);(2)發(fā)布、表演、分發(fā)、傳輸或以其他方式向公眾提供數(shù)字聲音復(fù)制品(DigitalVoiceReplica),且明知該數(shù)字聲音復(fù)制品未經(jīng)授權(quán);(3)實(shí)質(zhì)上促進(jìn)、指導(dǎo)或以其他方式便利前述第(1)、第(2)兩項(xiàng)行為的主體,如果明知第(1)、第(2)項(xiàng)的行為未經(jīng)授權(quán),也需承擔(dān)賠償責(zé)任。目前該法案尚未正式批準(zhǔn)通過。二、中國(一)聲音保護(hù)的法律規(guī)范我國法律對自然人的聲音提供保護(hù)?!睹穹ǖ洹返?023條規(guī)定:對自然人聲音的保護(hù),參照適用肖像權(quán)保護(hù)的有關(guān)規(guī)定。依據(jù)《民法典》第1018條,肖像是“在一定載體上反映的特定自然人可以被識別的外部形象”??勺R別性是肖像的核心特征,聲音權(quán)益的保護(hù)參照肖像權(quán)的規(guī)定,因此聲音權(quán)益的保護(hù)前提也應(yīng)當(dāng)是具有可識別根據(jù)《民法典》第1018條,肖像權(quán)人對肖像的控制體現(xiàn)為制作、使用、公開或者許可他人使用自己的肖像。未經(jīng)肖像權(quán)人同意,他人不得以發(fā)表、復(fù)制、發(fā)行、出租、展覽等方式使用或者公開肖像權(quán)人的肖像。享有聲音權(quán)益的主體可以參考肖像權(quán)人對肖像權(quán)的控制,禁止他人擅自制作或使用、公開自己的聲音。并且,《民法典》第1019條規(guī)定“任何個(gè)人不得利用信息技術(shù)手段偽造等方式侵害他人的肖像權(quán)”,由于AI聲音克隆技術(shù)屬于“信息技術(shù)手段”,因此這一規(guī)定可以為權(quán)利人禁止他人未經(jīng)授權(quán)利用AI克隆聲音提供解釋路徑。(二)司法案例:AI生成聲音人格權(quán)侵權(quán)案2024年4月23日,北京市互聯(lián)網(wǎng)法院對全國首例“AI聲音侵權(quán)案”宣判。本案基本案情如下:原告殷某是一名配音師,偶然發(fā)現(xiàn)利用自己的聲音配音的視頻在平臺上廣為流傳。經(jīng)溯源,前述視頻中的配音來自被告A運(yùn)營的原告曾為被告B(某傳媒公司)錄制錄音制品,被告B對該錄音制品享有著作權(quán)。后被告B將該錄音制品提供給被告C(某軟件公司),允許其“以商業(yè)或非商業(yè)的用途使用、復(fù)制、修改數(shù)據(jù)用于其產(chǎn)品及服務(wù)”。被告C將錄音制品作為AI訓(xùn)練素材,制作生成涉案的文本轉(zhuǎn)語音產(chǎn)品并在被告D(某云服務(wù)平臺)的平臺上出售。被告A與被告E(某科技發(fā)展公司)簽訂在線服務(wù)買賣合同,由被告E向被告C采購涉案文本轉(zhuǎn)語音產(chǎn)品。被告A采用應(yīng)用程序接口,直接調(diào)取該產(chǎn)品(未經(jīng)技術(shù)處理)在其平臺中使用。[20]本案包括兩個(gè)爭議焦點(diǎn):自然人聲音權(quán)益保護(hù)范圍是否及于AI聲音;被告是否應(yīng)當(dāng)承擔(dān)侵權(quán)責(zé)任。[21]1.聲音權(quán)益及于AI聲音與肖像權(quán)的可識別性要求一致,北京市互聯(lián)網(wǎng)法院以可識別性作為是否應(yīng)當(dāng)將AI聲音納入聲音權(quán)益保護(hù)范圍的判斷標(biāo)準(zhǔn)。北京市互聯(lián)網(wǎng)法院認(rèn)為自然人的聲音有獨(dú)特性、唯一性、穩(wěn)定性特點(diǎn),“能夠令一般人產(chǎn)生與該特定自然人相關(guān)的思想和情感活動(dòng),展示個(gè)人行為與身份”。案涉AI聲音能夠?qū)⒃撀曇籼卣髋c特定自然人進(jìn)行關(guān)聯(lián),實(shí)現(xiàn)聲音的引

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論