2024數(shù)智人行業(yè)發(fā)展概述_第1頁(yè)
2024數(shù)智人行業(yè)發(fā)展概述_第2頁(yè)
2024數(shù)智人行業(yè)發(fā)展概述_第3頁(yè)
2024數(shù)智人行業(yè)發(fā)展概述_第4頁(yè)
2024數(shù)智人行業(yè)發(fā)展概述_第5頁(yè)
已閱讀5頁(yè),還剩42頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1數(shù)智人,業(yè)界也將其稱為虛擬人、數(shù)字人,是具有數(shù)字化外形的虛擬人物,借助計(jì)算機(jī)圖形學(xué)、動(dòng)作捕捉、人工智能等計(jì)算機(jī)手段創(chuàng)造,依賴顯示設(shè)備存在,擁有人的相貌、行為及思維[1]。作為一種多技術(shù)融合的虛實(shí)交互媒介,數(shù)智人與人工智能、虛擬現(xiàn)實(shí)、元宇宙等新型產(chǎn)業(yè)發(fā)展密切相關(guān),并持續(xù)受到各方關(guān)注,而相關(guān)政策的出臺(tái)更《“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》中指出要加強(qiáng)類人智能自然交互與虛擬現(xiàn)實(shí)等技術(shù)研究。2022年8月,北京市經(jīng)信局發(fā)布國(guó)內(nèi)首個(gè)數(shù)字人產(chǎn)業(yè)專項(xiàng)支持政策——《北京市本文通過(guò)闡述數(shù)智人主流產(chǎn)品類別、商業(yè)模式及行業(yè)2發(fā)展進(jìn)程,分析了數(shù)智人技術(shù)發(fā)展的六大最新趨勢(shì),并同業(yè)內(nèi)主流數(shù)智人產(chǎn)品按照功能應(yīng)用維度可劃分為IP型、服務(wù)型、身份型三種,分別對(duì)應(yīng)IP運(yùn)營(yíng)、客戶服務(wù)和流量IP型數(shù)智人產(chǎn)品定位為具有情感導(dǎo)向、價(jià)值內(nèi)涵和圈層影響力的虛擬偶像和品牌形象大使,第一需求方是影視熟,已有較多成功商用案例,如洛天依、AYAYI、柳葉熙、的中國(guó)移動(dòng)數(shù)智人家族,其商業(yè)價(jià)值及社會(huì)影響力已得到由于用戶對(duì)IP型數(shù)智人外觀的精細(xì)度和寫實(shí)度要求較3高,這類產(chǎn)品的形象風(fēng)格從最初的二次元,逐漸發(fā)展為美型偏寫實(shí)、超寫實(shí)風(fēng)格。生產(chǎn)技術(shù)路線早期以手工原畫設(shè)計(jì)為主,之后主要是基于相機(jī)陣列掃描等專業(yè)采集設(shè)備的耗時(shí)長(zhǎng)、產(chǎn)能低。面向影視、營(yíng)銷場(chǎng)景的IP型數(shù)智人對(duì)交互實(shí)時(shí)性要求較低,且通常依賴美術(shù)特效團(tuán)隊(duì)進(jìn)行后期加工,其驅(qū)動(dòng)方式以采用專業(yè)動(dòng)捕場(chǎng)地及設(shè)備的真人驅(qū)動(dòng)為善人設(shè)、提升建模精美程度、持續(xù)產(chǎn)出多元化內(nèi)容等。其主要收入渠道有1)品牌推廣、直播帶貨等營(yíng)銷收入;(2)商演、直播、影視參演、專輯發(fā)售等形象授權(quán)和內(nèi)容創(chuàng)作收入3)游戲、動(dòng)漫、手辦模型等周邊衍生收入。4服務(wù)型數(shù)智人通過(guò)交付給企業(yè)客戶實(shí)現(xiàn)變現(xiàn),幫助企業(yè)對(duì)外提供自動(dòng)化、智能化、標(biāo)準(zhǔn)化且支持7*24小時(shí)的行業(yè)服務(wù),起到對(duì)人工的增強(qiáng)和輔助作用,助力企業(yè)降本增效。相關(guān)技術(shù)已部分成熟,但由于這類產(chǎn)品大多不直接創(chuàng)相比IP型數(shù)智人,服務(wù)型數(shù)智人的外形要求相對(duì)較低,但對(duì)交互的流暢性、行業(yè)知識(shí)的豐富程度要求較高,因此其生產(chǎn)不僅包含外形建模,還涉及行業(yè)知識(shí)庫(kù)及知識(shí)圖譜的構(gòu)建,對(duì)技術(shù)與產(chǎn)業(yè)的整合升級(jí)提出了更高要求。為滿足企業(yè)降低成本的需要,功能服務(wù)型數(shù)智人的建模方式也更傾向于采用輕量化的AI算法進(jìn)行人物2D/3D建模,驅(qū)動(dòng)服務(wù)型數(shù)智人已在金融、文旅行業(yè)積累較多應(yīng)用成果,5如浦發(fā)銀行和百度共同發(fā)布數(shù)字員工“小浦”,中國(guó)文物交流中心與百度智能云打造的虛擬文物解說(shuō)員“文夭夭”等,這類產(chǎn)品后續(xù)將在醫(yī)療、教育等具有流程屬性的行業(yè)有較大應(yīng)用潛力。例如面向醫(yī)療行業(yè),滿足就醫(yī)引導(dǎo)、診療輔助、患者情感陪伴等需求,將衍生出虛擬導(dǎo)診、家庭陪護(hù)、健康顧問(wèn)等專業(yè)化數(shù)智人產(chǎn)品;面向教育行業(yè),未身份型數(shù)智人相關(guān)技術(shù)和產(chǎn)品正在探索中,尚無(wú)規(guī)?;瘧?yīng)用案例,待產(chǎn)業(yè)進(jìn)一步完善,目標(biāo)是實(shí)現(xiàn)用戶利用平臺(tái)工具制作千人千面的虛擬形象并能夠在虛擬場(chǎng)景內(nèi)進(jìn)行社交、會(huì)議、演出觀看等活動(dòng),平臺(tái)廠商通過(guò)對(duì)虛擬空間進(jìn)行規(guī)則設(shè)定來(lái)實(shí)現(xiàn)流量變現(xiàn)。身份型數(shù)智人旨在面向廣6入口與載體,其核心屬性是身份和交互。這要求在技術(shù)上實(shí)現(xiàn)通過(guò)簡(jiǎn)便快捷的數(shù)據(jù)采集,結(jié)合低成本、全自動(dòng)的建模/生成技術(shù)來(lái)高效制作形象,并利用實(shí)時(shí)視覺(jué)動(dòng)捕等技術(shù)使用戶能夠自然地驅(qū)動(dòng)形象在虛擬空間中活動(dòng)并與他人實(shí)時(shí)互動(dòng),這進(jìn)一步提高了對(duì)算法、算力、網(wǎng)絡(luò)傳輸、軟硬件基礎(chǔ)和技術(shù)集成能力的要求。目前,大規(guī)模多人互動(dòng)及虛擬空間相關(guān)技術(shù)和產(chǎn)品還在發(fā)展中,百度希壤等元宇宙應(yīng)用中已經(jīng)出現(xiàn)了個(gè)性化形象生成功能,ZEPETO、SOUL等虛擬社交產(chǎn)品中也有相關(guān)應(yīng)用,市場(chǎng)潛力較大但商業(yè)模式在行業(yè)發(fā)展初期,IP型數(shù)智人在泛娛樂(lè)場(chǎng)景率先落地,7拉動(dòng)技術(shù)進(jìn)步的同時(shí),向社會(huì)各界普及虛擬人的概念,持2007年日本推出了史上第一個(gè)被廣泛認(rèn)可的虛擬歌手初代言上百家品牌,其商業(yè)價(jià)值已超百億日元。國(guó)內(nèi)第一虛擬歌手洛天依從2012年開(kāi)始活躍在動(dòng)漫“二次元”圈層,于2021年登上了央視春晚,標(biāo)志著虛擬偶像逐漸在主流媒體中爭(zhēng)得一席之地。洛天依“出圈”的背后是因其開(kāi)創(chuàng)了一個(gè)基于同人創(chuàng)作圈的運(yùn)營(yíng)模式,其推出的上萬(wàn)首作品,絕大多數(shù)由其粉絲兼音樂(lè)人投稿完成?;凇癡OCALOID”歌聲合成引擎,每個(gè)人都可以通過(guò)為洛天依賦予形象或故事來(lái)實(shí)現(xiàn)自我表達(dá),這使粉絲與洛天依之間建立起一種跟隨娛樂(lè)行業(yè)的步伐,金融、文旅、快消等其他垂直產(chǎn)業(yè)應(yīng)用跟進(jìn),開(kāi)始出現(xiàn)為政府、企業(yè)、品牌對(duì)外提供公共服務(wù)的數(shù)智人解決方案和平臺(tái)工具,且產(chǎn)品核心價(jià)值逐漸8向兩個(gè)方向分化:一是專業(yè)化,體現(xiàn)為細(xì)分領(lǐng)域的專業(yè)虛擬顧問(wèn);二是情感化,強(qiáng)調(diào)與人之間的情感互動(dòng),滿足陪字人為核心打造了文本配音、文章轉(zhuǎn)視頻、模板創(chuàng)作、在線視頻剪輯等功能。平臺(tái)收費(fèi)模式包括付費(fèi)會(huì)員和定制付費(fèi)兩種,會(huì)員可在2D/3D數(shù)字人模板庫(kù)中選擇形象制作播報(bào)內(nèi)容;如果用戶需要生成和特定真人類似的數(shù)字人或數(shù)字分身,可以采購(gòu)其定制服務(wù),上傳照片、視頻、音頻即可實(shí)現(xiàn)定制。百度智能云曦靈面向金融、媒體、互娛等行業(yè),提供服務(wù)型、演藝型數(shù)字人解決方案,可應(yīng)用在手機(jī)APP端、云屏端,扮演智能客服、數(shù)字理財(cái)經(jīng)理、數(shù)字商品導(dǎo)購(gòu)、數(shù)字培訓(xùn)師、數(shù)字講解員等角色,實(shí)現(xiàn)人機(jī)可視化語(yǔ)音交互服務(wù)。此外,搜狗、魔琺科技、相芯科技均有能服務(wù)助手小布4.0。當(dāng)用戶與小布進(jìn)行語(yǔ)音對(duì)話時(shí),小布9能創(chuàng)造真實(shí)自然的聊天環(huán)境,響應(yīng)用戶情感并反饋體現(xiàn)在動(dòng)作、表情、音調(diào)中;當(dāng)用戶點(diǎn)擊它身體不同的部位,例如摸頭、摸手、摸肚子等交互動(dòng)作時(shí),小布也會(huì)做出對(duì)應(yīng)另外,在這一階段,IP型數(shù)智人的應(yīng)用領(lǐng)域不斷拓寬,運(yùn)營(yíng)方式及商業(yè)模式趨向多元化,傳播力和社會(huì)影響力進(jìn)說(shuō)首秀。2022年,尤子希以元宇宙UFC的特派員身份開(kāi)啟3A級(jí)逼真形象和性格愛(ài)好、形式邏輯等完整人物設(shè)定,尤子希作為虛擬IP的可塑性和虛實(shí)互動(dòng)的空間進(jìn)一步提升,在體育、時(shí)尚領(lǐng)域影響力持續(xù)增,入選了清華大學(xué)新聞與傳播學(xué)院新媒體研究中心發(fā)布的“2022年虛擬數(shù)字人綜合伴隨著以ChatGPT為代表的AIGC、大模型技術(shù)的引入,數(shù)智人技術(shù)進(jìn)入了高速發(fā)展期。語(yǔ)音、圖片、視頻等多模態(tài)元素的融合擴(kuò)展了數(shù)智人感知理解的維度,提升了其交互內(nèi)容和交互形式的豐富度,因而數(shù)智人的創(chuàng)造力、自動(dòng)化程度和真人替代能力也進(jìn)一步提升,極大地拓寬了數(shù)智數(shù)字助手微軟小冰從第五代產(chǎn)品開(kāi)始已具備了多模態(tài)生成交互能力,融合了全雙工語(yǔ)音交互、實(shí)時(shí)視覺(jué)與核心對(duì)話引擎,實(shí)現(xiàn)用戶與人工智能同時(shí)邊聽(tīng)邊說(shuō)邊看的交互體驗(yàn)?;诟杪暫铣?、文生圖等藝術(shù)家模型,小冰集詩(shī)人、歌手、主持人、畫家和設(shè)計(jì)師多種功能于一身,通過(guò)不斷另外,在此階段,數(shù)智人生產(chǎn)能力也朝著智能化、便捷化、精細(xì)化、多樣化發(fā)展。2021年,Epic發(fā)布MetahumanCreator,基于云端的混合型變計(jì)算和渲染,支持用戶在網(wǎng)頁(yè)端創(chuàng)建高保真的3D虛擬形象,并結(jié)合蘋果ArKit等實(shí)時(shí)根據(jù)市場(chǎng)分析機(jī)構(gòu)預(yù)測(cè)[7],2025年我國(guó)虛擬人帶動(dòng)產(chǎn)業(yè)市場(chǎng)規(guī)模和核心市場(chǎng)規(guī)模將分別達(dá)到6402.7億元和480.6億元。從當(dāng)前市場(chǎng)構(gòu)成方面,數(shù)智人生產(chǎn)和運(yùn)營(yíng)的B端市場(chǎng)占比最高,達(dá)到了79%,并且規(guī)模不斷擴(kuò)大。其中,2023年企業(yè)用戶購(gòu)買最多的數(shù)智人產(chǎn)品類型是數(shù)字員工,隨著技術(shù)進(jìn)步和市場(chǎng)認(rèn)知提升,數(shù)智人的技術(shù)門檻和軟硬件成本進(jìn)一步下降,數(shù)智人服務(wù)逐漸向工具化和系統(tǒng)化演進(jìn)。面向廣大C端用戶的身份型數(shù)智人的應(yīng)用潛力巨大,與元宇宙概念結(jié)合,將形成更開(kāi)放的創(chuàng)作生態(tài)和全新商業(yè)模式。在可預(yù)見(jiàn)的未來(lái),更多支持制作二次元、三維寫實(shí)生產(chǎn)、管理、運(yùn)營(yíng)形象資產(chǎn)和虛擬身份的需求;借助成熟的視頻、語(yǔ)音等輕量級(jí)多模態(tài)驅(qū)動(dòng)技術(shù),只需手機(jī)等移動(dòng)端的單攝像頭和算力就能實(shí)時(shí)獲得驅(qū)動(dòng)數(shù)智人所需的高精度動(dòng)作和表情數(shù)據(jù);再將虛擬化身與各類虛擬空間平臺(tái)相結(jié)合,實(shí)現(xiàn)高自由度的、深度沉浸的6DoF空間交互通信,第一,產(chǎn)學(xué)界共同推動(dòng)低成本輕量化算法覆蓋數(shù)智人全機(jī)圖形學(xué)技術(shù),如隱式三維重建、實(shí)時(shí)神經(jīng)渲染等,推動(dòng)三維人物建模的實(shí)時(shí)性、自動(dòng)化、精細(xì)度提升。僅需單目/多目便攜式設(shè)備采集的視頻數(shù)據(jù)進(jìn)行訓(xùn)練就能全自動(dòng)創(chuàng)建人物模型,無(wú)需依賴特殊采集環(huán)境及設(shè)備和手工建模,大一種新方法實(shí)現(xiàn)3D輻射場(chǎng)的實(shí)時(shí)渲染,即3DGaussianSplatting(3DGS)[8],該方法相比已有的隱式神經(jīng)輻射場(chǎng)技術(shù),進(jìn)一步突破了三維人物/場(chǎng)景的渲染速度和渲染質(zhì)量的邊界。蘋果團(tuán)隊(duì)2023年12月發(fā)表的最新工作[9]提出引入3DGS來(lái)表示可驅(qū)動(dòng)的人體及場(chǎng)景,只需要2到4秒的視頻(50-100幀),就能生成完整的人體模型,并對(duì)皮膚和衣服、頭發(fā)等細(xì)節(jié)進(jìn)行精細(xì)建模,速度比當(dāng)前其他同類通過(guò)收集大規(guī)模3D數(shù)據(jù)庫(kù)和對(duì)應(yīng)的文本描述訓(xùn)練擴(kuò)散模型,只需輸入文本提示詞,完全避免了用戶側(cè)的數(shù)據(jù)采集步驟ChatAvatar[13]和微軟RODIN[14]就基于text-to-3D技術(shù)只需要簡(jiǎn)單的文本提示詞描述外貌特征,就能在快速生成3D數(shù)字人資產(chǎn),并且模型帶有規(guī)整的拓?fù)洹⒉馁|(zhì)貼圖和綁在驅(qū)動(dòng)方面,視覺(jué)、語(yǔ)音驅(qū)動(dòng)算法的優(yōu)化推動(dòng)專業(yè)動(dòng)捕設(shè)備趨向便捷化,面部捕捉技術(shù)向更簡(jiǎn)單的硬件、更細(xì)膩的表情、更自動(dòng)化的流程方向發(fā)展。已有學(xué)術(shù)及產(chǎn)業(yè)界團(tuán)隊(duì)提出采用AI生成式模型[15],基于語(yǔ)音生成節(jié)奏一致性的人體面部口型和肢體動(dòng)作序列來(lái)驅(qū)動(dòng)人物三維模型。這類技術(shù)將逐步替代需要穿戴動(dòng)捕設(shè)備的真人驅(qū)動(dòng)方式,只需要音頻或視覺(jué)特征點(diǎn)數(shù)據(jù)輸入,對(duì)驅(qū)動(dòng)端的硬件要求很第二,在線可交互式數(shù)智人將替代離線非交互式數(shù)智人。在行業(yè)技術(shù)早期發(fā)展階段,基于離線渲染、后期制作的非交互類型數(shù)智人是主流,互聯(lián)網(wǎng)內(nèi)容分發(fā)平臺(tái)將離線制作的包含虛擬偶像的數(shù)字內(nèi)容融入到現(xiàn)有的業(yè)務(wù)邏輯中,在數(shù)字化營(yíng)銷、文娛等領(lǐng)域廣泛應(yīng)用。隨著數(shù)智人概念的普及和AI驅(qū)動(dòng)技術(shù)快速發(fā)展,用戶很快進(jìn)入體驗(yàn)突破階段,在電商直播、數(shù)字服務(wù)領(lǐng)域已有使用實(shí)時(shí)交互和實(shí)時(shí)渲染的數(shù)智人作為新型交互方式的應(yīng)用案例。未來(lái),以元宇宙發(fā)展為契機(jī),實(shí)時(shí)AI驅(qū)動(dòng)、渲染傳輸?shù)燃夹g(shù)門檻進(jìn)一步降低,社交、電商、娛樂(lè)、VR應(yīng)用等會(huì)出現(xiàn)以在線可交互式數(shù)智人為入口,與數(shù)字場(chǎng)景深度耦合的全新的業(yè)務(wù)邏輯,并結(jié)合更深的行業(yè)理解,帶來(lái)更真實(shí)的沉浸感和更豐富的第三,數(shù)智人在不斷發(fā)展“形似人”的基礎(chǔ)上更加“神似人”。“神似人”是要求數(shù)智人具備類似人的分析思考能力,包括學(xué)習(xí)、記憶、推理、決策,并具備理解反饋和傳達(dá)情感的能力。目前大多數(shù)數(shù)智人具備的初級(jí)溝通功能本質(zhì)是以NLP為核心的文本驅(qū)動(dòng),通過(guò)ASR-NLP-TTS的AI管線實(shí)現(xiàn)數(shù)智人感知、理解、決策、表達(dá)。其中,支撐數(shù)化:向?qū)I(yè)化方向發(fā)展,將多行業(yè)知識(shí)圖譜與數(shù)智人對(duì)話系統(tǒng)對(duì)接,應(yīng)用于特定場(chǎng)景;向情感化方向發(fā)展,將從人物性格、語(yǔ)言風(fēng)格、知識(shí)儲(chǔ)備等方面還原真人級(jí)互動(dòng)體驗(yàn)文本中情感/意圖的理解,并實(shí)現(xiàn)與語(yǔ)義和情感一致的語(yǔ)音情感、微表情和人物姿態(tài)的智能合成。另外,多模態(tài)AIGC技術(shù)的出現(xiàn)將成為數(shù)智人擁有思想和自主創(chuàng)造能力的最大推動(dòng)力,在輸入端使數(shù)智人具備多模態(tài)輸入的感知理解能力,在輸出端使數(shù)智人能夠進(jìn)行多模態(tài)交互和自動(dòng)化內(nèi)容第四,數(shù)智人與空間計(jì)算加速融合。隨著數(shù)智人的交互維度升級(jí),交互信息媒介將從一維的語(yǔ)音數(shù)據(jù)到二維的圖像、視頻數(shù)據(jù),再拓展到虛實(shí)空間的位置關(guān)系、路徑、姿態(tài)等三維數(shù)據(jù)。數(shù)智人作為一種虛擬的三維存在形式,勢(shì)必將與其他三維數(shù)字空間技術(shù)如SLAM(即時(shí)定位與地圖構(gòu)建)、體積視頻、空間音頻等融合,以人為原點(diǎn)構(gòu)建完整的虛實(shí)交互技術(shù)體系,實(shí)現(xiàn)真人在虛擬空間中的多方互動(dòng)漫游,虛擬/真實(shí)空間中真人和數(shù)字人的交互,數(shù)字人對(duì)真了中心化分發(fā)的多人虛擬漫游產(chǎn)品框架。但這類應(yīng)用目前僅支持對(duì)固定虛擬場(chǎng)景的多視角觀看,難以實(shí)現(xiàn)對(duì)空間內(nèi)的虛擬物體進(jìn)行操控或進(jìn)行個(gè)性化空間定制,單人活動(dòng)和部分場(chǎng)景采用貼圖等2.5D技術(shù)構(gòu)建,人物建模也采用低精度的卡通捏臉?lè)绞?,以減輕端側(cè)渲染壓力。立體呈現(xiàn)效果的粗糙和操控方式的受限導(dǎo)致了沉浸感降低。未來(lái)要實(shí)現(xiàn)數(shù)智人在虛擬空間內(nèi)進(jìn)行多點(diǎn)6DoF同步觀看和對(duì)空間內(nèi)物體的任意操控,人/物/空間關(guān)系與行為分析、編碼傳輸、端邊云協(xié)同渲染等關(guān)鍵能力亟待攻關(guān),空間感知、空間交數(shù)智人將形成相互助推,并出現(xiàn)多設(shè)備協(xié)同聯(lián)動(dòng)的數(shù)智人顯示設(shè)備仍是數(shù)智人顯示的主要載體。數(shù)智人和3D數(shù)字內(nèi)容的應(yīng)用發(fā)展,與裸眼3D、VR/AR、全息等3D顯示設(shè)備的普及可形成相互助推。一方面,依托3D顯示更能突顯數(shù)智人沉浸逼真的特點(diǎn),為數(shù)智人在文娛社交等特定領(lǐng)域帶來(lái)新的增長(zhǎng)空間。例如,湖南衛(wèi)視元宇宙產(chǎn)品“芒果幻城”使用戶以數(shù)字形態(tài)空降節(jié)目現(xiàn)場(chǎng),實(shí)現(xiàn)與虛擬明星零距離接觸的沉浸式“追星”體驗(yàn)。蘋果VisionPro頭顯搭載的Persona應(yīng)用,可基于高逼真度虛擬化身進(jìn)行視頻通話,這些探索拓展了數(shù)智人的更多“新玩法”。另一方面,借助已有數(shù)智人IP/產(chǎn)品的流量和用戶粘性,針對(duì)性地提供更多探索多元化業(yè)務(wù)和產(chǎn)業(yè)鏈延申的契機(jī)。2022年,中國(guó)移動(dòng)MeetGu亮相北京西單商圈、王府井步行街和上海靜安寺的戶外裸眼3D大屏,吸引廣大體育愛(ài)好者爭(zhēng)相“打卡”,在超寫實(shí)高精度人物建模與裸眼3D技術(shù)雙重加持下,為大眾帶來(lái)了耳目一新的沉浸互體驗(yàn),促進(jìn)了裸眼3D概念普及和“文化+科技”全新業(yè)務(wù)形態(tài)探索。第六,數(shù)智人可信保護(hù)技術(shù)及行業(yè)合規(guī)體系亟待完善。數(shù)智人行業(yè)總體在快速發(fā)展階段,隨著產(chǎn)業(yè)規(guī)模擴(kuò)大、數(shù)智人資產(chǎn)數(shù)量增多、生產(chǎn)門檻降低,數(shù)智人可信安全及版權(quán)保護(hù)的問(wèn)題日益凸顯。2022年7月,杭州某網(wǎng)絡(luò)公司在網(wǎng)絡(luò)上發(fā)布兩段視頻,居中位置使用了某數(shù)字人廠商于2019年發(fā)布的視頻內(nèi)容,并在片頭片尾替換有關(guān)標(biāo)識(shí),添加了該公司的注冊(cè)商標(biāo)添及虛擬數(shù)字人課程的營(yíng)銷信息。2023年,杭州互聯(lián)網(wǎng)法院就首例涉“虛擬數(shù)字人”侵權(quán)案作出一審判決,認(rèn)定被告杭州某網(wǎng)絡(luò)公司構(gòu)成著作權(quán)侵權(quán)及不正當(dāng)競(jìng)爭(zhēng),判決其承擔(dān)消除影響并賠償損失12萬(wàn)元的數(shù)智人在數(shù)據(jù)表示層面具有多模態(tài)和異構(gòu)化特點(diǎn),其外形存在點(diǎn)云,網(wǎng)格,體素、隱式表達(dá)等表征形式,其聲音包括音色、語(yǔ)調(diào)、口音等信息,其運(yùn)動(dòng)包括骨骼綁定參數(shù)等驅(qū)動(dòng)信息,甚至可能具有面容、指紋等生物特征/身份信息。這導(dǎo)致了針對(duì)數(shù)智人的數(shù)字侵權(quán)形式更加多樣化和復(fù)雜化,已有的傳統(tǒng)鑒權(quán)技術(shù)難以滿足數(shù)智人資產(chǎn)可信保護(hù)的需求。目前,業(yè)界尚未形成公認(rèn)統(tǒng)一技術(shù)和標(biāo)準(zhǔn)體系來(lái)保障數(shù)智人資產(chǎn)的安全流通與共享,亟需進(jìn)一步研究數(shù)智人數(shù)據(jù)安全、版權(quán)的確權(quán)鑒權(quán)技術(shù),涉及自然人肖像、聲音等生物特征/數(shù)字身份的保護(hù)策略,AI驅(qū)動(dòng)數(shù)智人生成虛綜合來(lái)看,數(shù)智人技術(shù)正在向輕量化、智能化、多元化發(fā)展,但數(shù)智人資產(chǎn)的生產(chǎn)效率仍待提高。2D數(shù)智人由于建模數(shù)據(jù)采集便捷,技術(shù)成熟度、穩(wěn)定性高,相關(guān)商用實(shí)例較多,而具備成熟的寫實(shí)3D數(shù)智人技術(shù)的廠商仍然較少,需求,暫時(shí)難以滿足全自動(dòng)化、高機(jī)動(dòng)性、高頻次的規(guī)模應(yīng)用需求。目前,行業(yè)中大多數(shù)公司聚焦于數(shù)智人全流程上的一環(huán)或幾環(huán),如資產(chǎn)制作和策劃運(yùn)營(yíng),面向直播營(yíng)銷內(nèi)容生產(chǎn)等單一領(lǐng)域應(yīng)用,門檻較低、可替代性較高。具備技術(shù)和場(chǎng)景的頭部廠商的優(yōu)勢(shì)在于綜合技術(shù)服務(wù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論