中國(guó)數(shù)字人發(fā)展報(bào)告(2024)電子版_第1頁
中國(guó)數(shù)字人發(fā)展報(bào)告(2024)電子版_第2頁
中國(guó)數(shù)字人發(fā)展報(bào)告(2024)電子版_第3頁
中國(guó)數(shù)字人發(fā)展報(bào)告(2024)電子版_第4頁
中國(guó)數(shù)字人發(fā)展報(bào)告(2024)電子版_第5頁
已閱讀5頁,還剩146頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

中國(guó)數(shù)字人發(fā)展報(bào)告(2024)中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)主編單位中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)主編武鎖寧副主編裴瑋執(zhí)行編輯周妹妍李金穗趙冀昌李景亞參編人員(按姓氏拼音排序)杜冀中高子晗郭晚平郭子淳黃金賈曉博簡(jiǎn)偉華李韓李勝菊裴志剛吳燕吳慶才伍穗穎武亞強(qiáng)熊偉楊丹張力軍張平張順?biāo)膹垥云絽⒕巻挝?排名不分先后)中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)網(wǎng)絡(luò)文化與數(shù)媒工作委員會(huì)中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)人工智能工作委員會(huì)中國(guó)信息通信研究院工業(yè)互聯(lián)網(wǎng)與物聯(lián)網(wǎng)研究所中國(guó)信息通信研究院安全研究所中國(guó)傳媒大學(xué)數(shù)字人研究院北京快手科技有限公司北京百度網(wǎng)訊科技有限公司央視國(guó)際網(wǎng)絡(luò)有限公司北京智譜華章科技有限公司聯(lián)通在線信息科技有限公司中電信人工智能科技有限公司中國(guó)電信股份有限公司四川分公司二六三網(wǎng)絡(luò)通信股份有限公司中關(guān)村互聯(lián)網(wǎng)教育創(chuàng)新中心廣州凡拓?cái)?shù)字創(chuàng)意科技股份有限公司中國(guó)移動(dòng)通信集團(tuán)天津有限公司北京元客視界科技有限公司廣州趣丸網(wǎng)絡(luò)科技有限公司北京中網(wǎng)易企秀科技有限公司南京匯智互娛網(wǎng)絡(luò)科技有限公司前言的發(fā)展前景正成為備受關(guān)注的焦點(diǎn)。技術(shù)和培育新業(yè)態(tài)作為重要的職責(zé)和使命。2宙熱潮興起之初,尚冰理事長(zhǎng)主持召開元宇宙的機(jī)遇與挑戰(zhàn)等研討會(huì),協(xié)會(huì)咨詢委員會(huì)主任、原理事長(zhǎng)鄔賀銓院士多次發(fā)表網(wǎng)絡(luò)趨勢(shì)的洞察分析報(bào)告。在協(xié)會(huì)領(lǐng)導(dǎo)和專家咨詢委員會(huì)的指導(dǎo)及協(xié)會(huì)秘書處的推動(dòng)下,協(xié)會(huì)組織政產(chǎn)學(xué)研用資等各方,展開了廣泛的調(diào)研和二十多次座談研討,對(duì)中國(guó)數(shù)字人的發(fā)展趨勢(shì)形成初步共識(shí):成本低、應(yīng)用廣的數(shù)字人不僅是元宇宙創(chuàng)新的高效切入口,數(shù)字人也是人工智能親和、便捷的理想入口,或?qū)⒊蔀榘l(fā)展已在數(shù)媒、服務(wù)、行業(yè)領(lǐng)域循序漸進(jìn)全面啟動(dòng)。中國(guó)數(shù)字人的創(chuàng)新發(fā)展,在有關(guān)部門的關(guān)心指導(dǎo)下,在業(yè)界權(quán)威機(jī)構(gòu)和領(lǐng)先企業(yè)的深入?yún)⑴c下,協(xié)會(huì)專題組特撰寫發(fā)表 一、數(shù)字人異軍突起引領(lǐng)網(wǎng)絡(luò)創(chuàng)新 3(一)數(shù)字人定義和內(nèi)涵正在更新?lián)Q代 3(二)數(shù)字人在元宇宙起落中脫穎而出 5(三)數(shù)字人切入降低元宇宙成本壓力 7(四)數(shù)字人技術(shù)演進(jìn)帶來功能大提升 9(五)數(shù)字人或成為下一代互聯(lián)網(wǎng)窗口… 二、人工智能技術(shù)是數(shù)字人創(chuàng)新的引擎 (一)四大模因構(gòu)建數(shù)字人的基本板塊 (二)智能工具加快四大板塊制作效率 (三)智能技術(shù)驅(qū)動(dòng)四大模因交互貫通 (四)大模型創(chuàng)造多模態(tài)智慧生成能力 (五)呈現(xiàn)技術(shù)進(jìn)一步釋放數(shù)字人潛能 三、數(shù)字人應(yīng)用已經(jīng)有序展開 (一)應(yīng)用是數(shù)字人創(chuàng)新的"起落架"… (二)數(shù)字人應(yīng)用領(lǐng)域正在迅速拓展 (三)應(yīng)用數(shù)字人逐步形成三類屬性 (四)數(shù)字人應(yīng)用呈現(xiàn)循序漸進(jìn)規(guī)律 (五)數(shù)字人正隨要素變化疊加演進(jìn) 四、中國(guó)數(shù)字人產(chǎn)業(yè)正全面加速 (一)數(shù)字人產(chǎn)業(yè)進(jìn)入規(guī)?;l(fā)展階段 (二)算力算網(wǎng)設(shè)施加速布局和追趕 (三)各類數(shù)字人大模型進(jìn)入迭代進(jìn)程 (四)安全保障相關(guān)建設(shè)引起各方關(guān)注 (五)三類應(yīng)用正全面進(jìn)入疊加發(fā)展期 五、推進(jìn)數(shù)字人發(fā)展的對(duì)策倡議 (一)高度重視數(shù)字人全局價(jià)值 (二)引導(dǎo)數(shù)字人產(chǎn)業(yè)集約發(fā)展 (三)積極推動(dòng)數(shù)字人應(yīng)用演進(jìn) (四)雙管齊下打造數(shù)字人保障體系 (五)營(yíng)造數(shù)字人協(xié)同創(chuàng)新生態(tài) 附錄1:《中國(guó)數(shù)字人應(yīng)用場(chǎng)景薈萃(2024)》 附錄2:《中國(guó)數(shù)字人產(chǎn)業(yè)生態(tài)圖譜(2024)》 附錄3:數(shù)字人典型案例集 引言潮流。數(shù)字人的崛起不僅突破了元宇宙領(lǐng)域的發(fā)展困境,也標(biāo)志著人工智能應(yīng)用的重大突破。數(shù)字人的定義和內(nèi)涵經(jīng)歷了不斷的更新?lián)Q代,從最初的虛擬角色到高度擬人化智能體,其發(fā)展歷程體現(xiàn)了科技進(jìn)步與應(yīng)用需求的雙重推動(dòng)力。數(shù)字人興起之初伴隨著元宇宙的熱潮而引發(fā)廣泛關(guān)注,但元宇宙的宏大構(gòu)想也面臨著巨大的成本壓力和商業(yè)模式的不確定性。在技術(shù)、成本和商業(yè)模式等多方面的挑戰(zhàn)下,數(shù)字人成為應(yīng)對(duì)這些挑戰(zhàn)的創(chuàng)新突破口,展示了其在降低技術(shù)成本、提升用戶體驗(yàn)等方面的獨(dú)特優(yōu)勢(shì)。數(shù)字人不僅能在虛擬世界中模擬人類的行為和情感,還能通過技術(shù)演進(jìn)顯著提升其功能,實(shí)現(xiàn)更加自然和沉浸式的交互人工智能技術(shù)的進(jìn)步是推動(dòng)數(shù)字人創(chuàng)新的關(guān)鍵因素。四大模因(形模因、聲模因、行模因和神模因)構(gòu)建了數(shù)字人的基本板塊,智能工具的應(yīng)用大大加快了這些板塊的制作效率。人工智能技術(shù)的不斷發(fā)展,尤其是生成式人工智能的突破,使得數(shù)字人在交互和表現(xiàn)上都達(dá)到了前所未有的水平。數(shù)字人的潛能。技術(shù)的進(jìn)步不僅提升了數(shù)字人的功能,使其在更多領(lǐng)域中得到有效應(yīng)用,從虛擬助理到數(shù)字營(yíng)人應(yīng)用的廣泛性和多樣性正在逐步形成?,F(xiàn)階段,中國(guó)數(shù)字人產(chǎn)業(yè)發(fā)展已進(jìn)入全面突破時(shí)期。隨著數(shù)字人產(chǎn)業(yè)的規(guī)模成熟,數(shù)字人實(shí)現(xiàn)工廠化制作,AIGC數(shù)字人生成及服務(wù)實(shí)現(xiàn)平臺(tái)化,算力和網(wǎng)絡(luò)設(shè)施在加速布局支持?jǐn)?shù)字人廣泛落地,各類數(shù)字人大模型的迭代進(jìn)程也在不斷推進(jìn)。在各級(jí)政府及社會(huì)各界的支持下,為數(shù)字人產(chǎn)業(yè)的發(fā)展提供了堅(jiān)實(shí)的政策保障。中國(guó)數(shù)字人應(yīng)用已經(jīng)從早期的探索階段進(jìn)入全面疊加的發(fā)展期,數(shù)字人應(yīng)用類型從媒介人到服務(wù)人到行業(yè)人不斷疊加演進(jìn)。根據(jù)艾媒咨詢數(shù)據(jù)顯示,2023年中國(guó)數(shù)字人帶動(dòng)產(chǎn)業(yè)市場(chǎng)規(guī)模和核心市場(chǎng)規(guī)模分別為3334.7億元和205.2億元,預(yù)計(jì)2025年分別達(dá)到6402.7億元和480.6億元,呈現(xiàn)出蓬勃發(fā)展的態(tài)勢(shì)。泛的應(yīng)用前景和巨大的市場(chǎng)潛力,需要高度重視其全局價(jià)值,全和應(yīng)用仍面臨諸多挑戰(zhàn),亟需解決技術(shù)成本高、商業(yè)模式字人安全發(fā)展保障,營(yíng)造協(xié)同創(chuàng)新的生態(tài)環(huán)境,推動(dòng)數(shù)字人產(chǎn)業(yè)的健康可持續(xù)發(fā)展。2、數(shù)字人異軍突起引領(lǐng)網(wǎng)絡(luò)創(chuàng)新數(shù)字人的醞釀和積累已有二十年,目前正隨人工智能兩個(gè)風(fēng)口的興起及人們對(duì)下一代互聯(lián)網(wǎng)的探索而異軍突起。(一)數(shù)字人定義和內(nèi)涵正在更新?lián)Q代所熟知并廣泛關(guān)注的數(shù)字人與早期概念相比發(fā)生了本質(zhì)變化。今天我們所討論的數(shù)字人被賦予了人工智能時(shí)代的形態(tài)和內(nèi)涵,其定義上實(shí)現(xiàn)了新飛躍。1.數(shù)字人的新定義數(shù)字人(DigitalHuman)是通過多種數(shù)字智能技術(shù)創(chuàng)建,具備人類外觀形象、聲音語言、肢體動(dòng)作與思維功能等特征的數(shù)字智能體。技術(shù)層面,數(shù)字人通過數(shù)字建模手段實(shí)現(xiàn),度學(xué)習(xí)等多項(xiàng)技術(shù)的綜合運(yùn)用,呈現(xiàn)于以視頻、程序等為載體的數(shù)字虛擬空間中。2.數(shù)字人形態(tài)不斷發(fā)展豐富近年來,在人工智能技術(shù)的驅(qū)動(dòng)下,數(shù)字人概念和外延不斷拓寬。經(jīng)過技術(shù)迭代,數(shù)字人的主流形態(tài)正在從卡通人還將形成形態(tài)多樣、功能豐富的數(shù)字智能體(AIAgent)??ㄍㄈ?卡通人是數(shù)字化時(shí)代最早的產(chǎn)物之一,它們是通過計(jì)算機(jī)圖形學(xué)創(chuàng)建的數(shù)字形象,用于電子游戲、動(dòng)畫動(dòng)3漫等二次元世界中的角色扮演,形象擬人但形態(tài)相對(duì)簡(jiǎn)化、表現(xiàn)形式相對(duì)夸張。仿真人:仿真人比卡通人在形象、動(dòng)作和聲音上更貼近音語調(diào)使其具備了更強(qiáng)的表現(xiàn)力,廣泛應(yīng)用于各類生活和工虛擬人:虛擬人是基于傳播、代言、娛樂等某種社會(huì)需求,通過技術(shù)手段設(shè)計(jì)、創(chuàng)作、虛構(gòu)出來的機(jī)構(gòu)代表或個(gè)人化身。虛擬人主要由人類創(chuàng)作和設(shè)定,創(chuàng)作者或委托機(jī)構(gòu)對(duì)其擁有知識(shí)產(chǎn)權(quán)。數(shù)字技術(shù)手段等身量制而成的,可以代表本人行使其委托的社會(huì)職責(zé)和社會(huì)職能。數(shù)字智能體(AIAgent)具備自主學(xué)習(xí)、決策和管控能力,可以在千行百業(yè)中執(zhí)行復(fù)雜任務(wù),被視為數(shù)字人的高級(jí)形式。與其他數(shù)字人不同,數(shù)字智能體弱化了對(duì)人類外形的模擬,通常以語音助手或聊天機(jī)器人形式存在,專注于處理互性等高階特征,也被稱為數(shù)字代理,借助于人工智能技術(shù)檢索和任務(wù)管理等高級(jí)智能的服務(wù)。結(jié)合數(shù)字人高度的擬人化特征和AIAgent對(duì)人類思維和行為的高度模仿,數(shù)字人用作咨詢顧問、數(shù)字員工等場(chǎng)景的4實(shí)用價(jià)值更大,提供更具沉浸感的用戶體驗(yàn),共同推動(dòng)了人工智能和虛擬技術(shù)的進(jìn)步,改變了人機(jī)互動(dòng)的方式。二)數(shù)字人在元字宙起落中脫穎而出數(shù)字人的革新得益于元宇宙的興起。元宇宙的概念經(jīng)過三十年發(fā)展,在小說、游戲和電影中不斷嘗試探索,于2021年迎來爆火。但是元宇宙的構(gòu)想過于宏大,受到成本壓力和商業(yè)模式的限制,經(jīng)歷了起起落落,在此過程中數(shù)字人脫穎1.全球元宙的發(fā)展歷程以數(shù)字化身份"阿凡達(dá)"生活、工作和娛樂。2003年,在線游戲《第二人生》讓元宇宙的理念從小說走向現(xiàn)實(shí),玩家能夠創(chuàng)建虛擬角色、建造家園并進(jìn)行交易。2018年電影《頭號(hào)玩虛擬世界,將其變成了現(xiàn)實(shí)的延伸。產(chǎn)業(yè)分析機(jī)構(gòu)sensorTower報(bào)告顯示,自2019年起,美國(guó)的元宇宙游戲下載量領(lǐng)先全球.2019年,沙盒游戲《Thesandbox》引入?yún)^(qū)塊鏈技術(shù),將游戲中的物品和土地轉(zhuǎn)化為獨(dú)特的NFT,引發(fā)廣泛關(guān)注。2021年,元宇宙大型平臺(tái)Roblox上市首日股價(jià)上漲54%,公司估值超過450億美元。緊接著,臉書 (Facebook)宣布轉(zhuǎn)型為元宇宙公司,并改名為Meta。這些5RealityLabs部門在2022年出現(xiàn)巨額虧損,證明了運(yùn)營(yíng)和維護(hù)成本的高昂。虛擬場(chǎng)景制作成本遠(yuǎn)高于傳統(tǒng)視頻拍攝,雖然技術(shù)有提升,但制作一個(gè)虛擬場(chǎng)景的費(fèi)用仍是普通視頻拍攝的10倍以上。商業(yè)模式尚未成熟,盡管游戲和電影領(lǐng)域有一些成功案例,但難以復(fù)制。Roblox通過虛擬貨幣構(gòu)建了一個(gè)完整的商業(yè)體建立,商業(yè)變現(xiàn)模式不明確,某些早期商業(yè)模式已被證偽。例如,NFT交易量的急劇下降以及高達(dá)95%的NFT價(jià)值歸零,顯示出商業(yè)模式的脆弱性。元宇宙的產(chǎn)業(yè)發(fā)展需要長(zhǎng)期的技術(shù)積累、市場(chǎng)培育和商業(yè)實(shí)踐,才能實(shí)現(xiàn)可持續(xù)增長(zhǎng)。數(shù)字人切入降低元宇宙成本壓力字人結(jié)合低成本的視頻、綠幕等背景,制作起來省時(shí)省力。同時(shí),作為萬物之靈的人的化身,數(shù)字人的創(chuàng)新可以說是畫小投入獲得大效果,可以消化解決成本高昂的問題。1.切口小可大幅縮小范圍降低成本空間的面積上"人"是很渺小的,制作一個(gè)數(shù)字的視頻大小僅是元宇宙場(chǎng)景中的一小部分,所占用的資源少;7規(guī)?;瘡?fù)制上,與變幻多樣的元宇宙場(chǎng)景相比,人的特征趨同,都是五官和四肢,因此流程和技術(shù)在成熟后可以快速規(guī)?;?。成本有限的情況下選擇數(shù)字人切入,即使在同等精細(xì)化程度的情況下,數(shù)字人的開發(fā)與創(chuàng)新成本僅是元宇宙中很小的一部分。2.數(shù)字人與場(chǎng)景模板高效結(jié)合目前主流的數(shù)字人制作方式分為2D數(shù)字人和3D數(shù)字人。人工智能技術(shù)尤其是生成式AI的參與,使具有低代碼特征的數(shù)字人編輯、運(yùn)營(yíng)產(chǎn)品層出不窮,提高了數(shù)字人的制3D數(shù)字人的制作更精良,技術(shù)門檻較高,但隨著實(shí)時(shí)渲染、動(dòng)作捕捉等技術(shù)的升級(jí),制作周期也相應(yīng)縮短幾倍,最短在棚錄制技術(shù)、視頻合成等,數(shù)字人背景環(huán)境的替換也十分便捷。在不少旅游景區(qū),通過數(shù)字人和景區(qū)超高清視頻相結(jié)合,展示多個(gè)慢直播點(diǎn)位,有了數(shù)字人交互的加入,能夠全面生讓觀看者有身臨其境之感。3.人是元宙的畫龍點(diǎn)睛之筆8生動(dòng)地演繹出風(fēng)云變幻的歷史畫卷和世態(tài)炎涼的社會(huì)萬象。數(shù)字人本身也是元宇宙的靈魂。元宇宙的瑰麗暢想中,虛擬場(chǎng)景是元宇宙的環(huán)境載體,而擬人化身(Avatar)是元宇90年代初,我國(guó)航天事業(yè)奠基人、人民科學(xué)家錢學(xué)森了解到 "virtualReality"(虛擬現(xiàn)實(shí)技術(shù))時(shí),將其取名為"靈境"。間。人是萬物之靈,人機(jī)和諧離不開"人"的沉浸式參與。四)數(shù)字人技術(shù)演進(jìn)帶來功能大提升互聯(lián)網(wǎng)協(xié)會(huì)基于對(duì)元宇宙和數(shù)字人發(fā)展的跟蹤研究分析,認(rèn)識(shí)到數(shù)字人在元宇宙創(chuàng)新中具有特殊的意義和價(jià)值。在2021年元宇宙興起之初,協(xié)會(huì)發(fā)起了聚焦于數(shù)字人創(chuàng)新的"數(shù)字人精品秀"活動(dòng)。通過對(duì)歷屆作品的對(duì)比研究分析,我們發(fā)現(xiàn)了數(shù)字人的創(chuàng)新速度日新月異,數(shù)字人技術(shù)演進(jìn)帶來功能的大提升。1.數(shù)字人作品的制作水平快速提升參展作品超過兩百個(gè),成為匯聚數(shù)字人創(chuàng)新力量,見證數(shù)字人應(yīng)用發(fā)展的一道靚麗風(fēng)景線。從四屆數(shù)字人作品征集情況9例也逐年增多,需要內(nèi)部擇優(yōu)提交。第一屆富,應(yīng)用場(chǎng)景更為廣泛。數(shù)字人從簡(jiǎn)單的卡通形象到高度仿真的數(shù)字人,并開始向交互數(shù)字人轉(zhuǎn)變。首屆精品秀征集征集的數(shù)字人作品中,從80%為卡通人演進(jìn)成80%為仿真人。仿真人的外觀和行為變得更加接近真實(shí)人類,而且在語音、過90%為仿真人,部分作品因?yàn)榻尤肓舜竽P?詢功能,成為能夠在多個(gè)專業(yè)領(lǐng)域提供智能服務(wù)的數(shù)字助手。2.數(shù)字人的效能得到了顯著拓展數(shù)字人不再局限于簡(jiǎn)單的信息展示和基礎(chǔ)互動(dòng),開始在更加復(fù)雜的應(yīng)用場(chǎng)景中發(fā)揮作用。例如,企業(yè)名人爭(zhēng)相打造事長(zhǎng)楊杰通過"數(shù)實(shí)雙生"的方式以數(shù)字人身份亮相并用英語發(fā)表演講,后又在廣州舉辦的中國(guó)移動(dòng)全球合作伙伴大會(huì)字人帶火了直播經(jīng)濟(jì),大幅降低了商家直播的運(yùn)營(yíng)成本,并且實(shí)現(xiàn)24小時(shí)日不落播出,帶來GMV(商品交易總額)的明顯增長(zhǎng)。數(shù)字人主播的人設(shè)定位豐富多樣,有網(wǎng)紅美妝、字人的效能得到了顯著拓展。相關(guān)的企業(yè)114.4萬家。今年,我國(guó)數(shù)字人相關(guān)企業(yè)數(shù)量大幅增加,僅2024年1~5月,又新增注冊(cè)企業(yè)17.4萬余家。信息技術(shù)服務(wù)業(yè)合計(jì)占比超6成,占據(jù)主流。數(shù)字人企業(yè)如五數(shù)字人或成為下一代互聯(lián)網(wǎng)窗互聯(lián)網(wǎng)的代際革命是基于交互方式的迭代更新而驅(qū)動(dòng)隨著數(shù)字人時(shí)代的到來,數(shù)字人有望成為新一代互聯(lián)網(wǎng)的代表性界面和窗口,并成為拉動(dòng)元宇宙乃至下一代互聯(lián)網(wǎng)的 網(wǎng)頁瀏覽器發(fā)明之前,人們需要通過編寫代碼的方式進(jìn)行訪能邀游互聯(lián)網(wǎng)世界,交互便捷性大幅提升。特別是1995年微軟推出了InternetExplorer瀏覽器,作為windows操作系統(tǒng)的一部分,從而迎來了PC互聯(lián)網(wǎng)的時(shí)代。進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代,智能手機(jī)和移動(dòng)應(yīng)用成為主要的指一點(diǎn),就能上網(wǎng)。2007年,iphone的問世被認(rèn)為是移動(dòng)互聯(lián)網(wǎng)的起點(diǎn)。2010年左右,3G網(wǎng)絡(luò)速率明顯提升以及智能手機(jī)獨(dú)有的操作系統(tǒng)和訪問界面,讓所有的互聯(lián)網(wǎng)信息都需整個(gè)移動(dòng)互聯(lián)網(wǎng)的產(chǎn)業(yè)協(xié)作方式有了翻天覆地的變化。隨時(shí)道。2.親和可感的數(shù)字人是下一代互聯(lián)網(wǎng)的理想入回顧互聯(lián)網(wǎng)發(fā)展歷史,界面演變的進(jìn)程就是人機(jī)交互方式便可感的數(shù)字人將是比較理想的選擇。12字人具有高度的定制化能力,可以根據(jù)用戶的需求和喜好,提供個(gè)性化服務(wù)。此外,數(shù)字人集成了多種先進(jìn)技術(shù),實(shí)(VR)、增強(qiáng)現(xiàn)實(shí)(AR)、具身智能等終端技術(shù)的飛速發(fā)展,數(shù)字人將顛覆傳統(tǒng)的屏幕互動(dòng)模式,引領(lǐng)交互方式的革為連接人類與數(shù)字世界的橋梁,開啟全新的交流和協(xié)作模式。2023年,比爾·蓋茨提出AIAgent將徹底改變計(jì)算機(jī)使用方式,并顛覆軟件行業(yè),它將成為"下一個(gè)平臺(tái)".openAI創(chuàng)始人兼CEOSamAltman在其首屆開發(fā)者大會(huì)上預(yù)測(cè),未來各行各業(yè),每一個(gè)人都可以擁有一個(gè)AIAgent。數(shù)字人創(chuàng)新發(fā)展的前景成為全球行業(yè)共識(shí)。人人都擁有數(shù)字人"分身"來全新的互聯(lián)網(wǎng)運(yùn)行范式。人工智能是數(shù)智時(shí)代網(wǎng)絡(luò)創(chuàng)新的主要?jiǎng)恿ΑD壳叭斯ぶ悄芗岸嗄B(tài)大模型創(chuàng)新是以類腦創(chuàng)新為主攻方向,數(shù)字人創(chuàng)新也是以人類仿真為主攻方向,二者技術(shù)關(guān)聯(lián)度高。數(shù)字人13、人工智能技術(shù)是數(shù)字人創(chuàng)新的引擎技術(shù)創(chuàng)新是數(shù)字人創(chuàng)新的根本驅(qū)動(dòng)力。數(shù)字人技術(shù)發(fā)展至今幾十年,經(jīng)歷了20世紀(jì)80至90年代的技術(shù)基礎(chǔ)奠定期、2010年前后的技術(shù)成熟與應(yīng)用期、以及從2023年開始的人工智能大爆發(fā)及數(shù)字人技術(shù)飛躍期。數(shù)字人是通過形象、聲音、行為及思維這四類數(shù)字技術(shù)制作完成的。在這四類技術(shù)發(fā)展進(jìn)程中,人工智能技術(shù)起到?jīng)Q定性作用,是數(shù)字人創(chuàng)新的引擎。人工智能賦能的制作工具加快了數(shù)字人的生產(chǎn)效率,智能驅(qū)動(dòng)提升了數(shù)字人各板塊此,技術(shù)是數(shù)字人創(chuàng)新的關(guān)鍵、是風(fēng)向標(biāo),決定發(fā)展象限。(一)四大模因構(gòu)建數(shù)字人的基本板塊借助模因論對(duì)數(shù)字人技術(shù)進(jìn)行板塊拆解,數(shù)字人在數(shù)字世界中呈現(xiàn)的形象、聲音、行為及思維可統(tǒng)稱為數(shù)字人技術(shù)的四大模因,構(gòu)成了數(shù)字人制作的基本板塊。1.形模因?yàn)榉譃?D和3D兩類,二維為平面驅(qū)動(dòng)式,制作簡(jiǎn)單;三維技術(shù)相對(duì)復(fù)雜,需要建模完成。早期數(shù)字人形象技術(shù)主要基14和硬件技術(shù)的進(jìn)步,數(shù)字人技術(shù)開始進(jìn)入三維時(shí)代。三維建模技術(shù)的發(fā)展使得數(shù)字人的外觀更加立體和逼真,動(dòng)作捕捉技術(shù)的應(yīng)用也讓數(shù)字人的動(dòng)作更加流暢自然。聲音是數(shù)字人傳達(dá)信息的重要形式之一。聲相關(guān)的子模因。數(shù)字人理解和生成語言的能力決定了數(shù)字人的交互水平,直接關(guān)系數(shù)字人的交互體驗(yàn)。聲模因的核心技術(shù)包含語音合成(TTS)、語音識(shí)別(ASR)和自然語言處理 (NLP)等。語音合成技術(shù)是指將文本轉(zhuǎn)換為語音,目前語音合成技術(shù)已經(jīng)非常成熟。聲音克隆技術(shù)上,最短只需要錄語言選擇上,能夠支持不同國(guó)家的語種,針對(duì)不同語種可提力,可淋漓盡致地表達(dá)出喜怒哀樂等多種情感,帶給用戶極致的聽覺體驗(yàn),提高語音交互的自然度。3.行模因人行為交互能力的重要表現(xiàn)。行模因所涉及的技術(shù)主要包含字人的行為驅(qū)動(dòng)主要有三類方式:動(dòng)畫驅(qū)動(dòng)、真人驅(qū)動(dòng)和智能驅(qū)動(dòng)。數(shù)字人的行為呈現(xiàn)形態(tài)主要是視頻,通過播放視頻15展現(xiàn)豐富的肢體動(dòng)作,如果需要進(jìn)行互動(dòng)則需要借助終端設(shè)備接收信號(hào)。終端設(shè)備主要有兩大類,一是屏幕顯示技術(shù),二是立體顯示技術(shù)。屏幕顯示技術(shù)包含各類大、中立體顯示技術(shù)包含裸眼3D、頭戴設(shè)備等,可提供沉浸式三維觀看體驗(yàn)。4.神模因神模因,即數(shù)字人的思維模因,包含抽象的邏輯思維、感性和理性的具象思維等多種形式。神模因與其他三類模因一樣是數(shù)字人制作的基本技術(shù)模塊,與大模型鏈接使其具備解決任何問題而不需要人為干預(yù),是技術(shù)界追逐的方向,也是神模因的發(fā)展方向。以上四大模因技術(shù)相互協(xié)作,共同構(gòu)成完整體系,使得數(shù)字人能夠更加逼真和智能地模擬真實(shí)人類的行為和交流方式。(二)智能工具加快四大板塊制作效率進(jìn)入人工智能時(shí)代,數(shù)字人的"四大模因"技術(shù)也而上,其制作過程從一個(gè)復(fù)雜的、分階段的任務(wù)演變成集成化、平臺(tái)化及智能化的流水線作業(yè),全面提質(zhì)提效。三維建模作為形模因的核心技術(shù)之一,主要通過建模軟件創(chuàng)建詳細(xì)的臉部和身體模型,包括肌肉、皮膚和骨骼結(jié)構(gòu),使數(shù)字人的外觀更加逼真。以往的三維建模工具如Maya、3dsMax等,需要設(shè)計(jì)師從。到1創(chuàng)建出具有復(fù)雜細(xì)節(jié)的數(shù)時(shí)需要考慮人物的比例、解剖學(xué)特征和美學(xué)元素,以確保數(shù)字人的外觀盡可能接近真實(shí)人類。在智能工具的支持下,借助高精度掃描、面部融合等技術(shù),以照片或視頻來訓(xùn)練模型字人形象。同時(shí)對(duì)數(shù)字人的形象模型進(jìn)行骨骼、表情的綁定以便于實(shí)現(xiàn)后續(xù)的智能驅(qū)動(dòng)。2.參數(shù)合成法大幅優(yōu)化語音合成作為聲模因的核心技術(shù)之一,有了人工智能的加持,合成方法也有了大幅度的質(zhì)效提升。目前語音合成有波形拼接法和參數(shù)合成法兩類。波形拼接法,需要前期準(zhǔn)備大量的語音素材,從中抽取合成所需要的基本單位如音節(jié)、的語音參數(shù)(包括基頻、頻譜、非周期性參數(shù)等),通過聲碼器把這些參數(shù)合成為波形?;谌斯ぶ悄芩惴ǖ穆暣a器將得到的頻譜圖直接映射為波形。得益于人工智能尤其是深度學(xué)的音質(zhì)水平。除了合成方法的升級(jí),智能的語音合成工具還17互中有更好的情感狀態(tài)識(shí)別力和表達(dá)力提供支持。3.智能驅(qū)動(dòng)省時(shí)省力數(shù)字人行模因主要基于驅(qū)動(dòng)技術(shù)實(shí)現(xiàn),目前有三類驅(qū)動(dòng)方式:動(dòng)畫驅(qū)動(dòng)、真人驅(qū)動(dòng)和智能驅(qū)動(dòng)。個(gè)對(duì)象的所有節(jié)點(diǎn)屬性包括位移、大小、旋轉(zhuǎn)等進(jìn)行人工設(shè)置來制作動(dòng)畫。創(chuàng)建動(dòng)畫時(shí),動(dòng)畫師需要制作每個(gè)動(dòng)畫序列的起始幀、結(jié)束幀和關(guān)鍵幀,中間幀由計(jì)算機(jī)根據(jù)人體運(yùn)動(dòng)分析的原理來補(bǔ)充完成。真人驅(qū)動(dòng)通過捕捉真實(shí)人類的動(dòng)作和表情來直接驅(qū)動(dòng)數(shù)字人,借助"中之人"穿戴的全身動(dòng)作捕捉及面部捕捉設(shè)備,實(shí)時(shí)驅(qū)動(dòng)數(shù)字人,能實(shí)現(xiàn)數(shù)字人的即興表演和實(shí)時(shí)互動(dòng)。動(dòng)畫驅(qū)動(dòng)和真人驅(qū)動(dòng)都需要耗費(fèi)大量的人力和時(shí)間。智能驅(qū)動(dòng)工具基于人工智能技術(shù),訓(xùn)練數(shù)字人模型學(xué)習(xí)并模仿人類行為,還原人體運(yùn)動(dòng)各身體部位的參數(shù)映射關(guān)系,并基于用戶反饋調(diào)整數(shù)字人的行為模式。有智能工具接入的數(shù)字人,不需要其他復(fù)雜的人力投入便可實(shí)時(shí)驅(qū)4.大模型為數(shù)字人"鑄魂"早期數(shù)字人的神模因是人類主導(dǎo)設(shè)計(jì)的,例如游戲和電影中的數(shù)字人物,從外觀形象、能力特征和人物性格都由主18之人"驅(qū)動(dòng)完成。隨著人工智能的發(fā)展,尤其是生成式人工隨著垂類大模型的崛起,數(shù)字人在不同領(lǐng)域的思維能力逐步換。三)智能技術(shù)驅(qū)動(dòng)四大模因交互貫通除了四大板塊的制作效率提升,他們之間的交互驅(qū)動(dòng)也在人工智能的加持下全面貫通。人工智能仿佛給數(shù)字人"請(qǐng)的整體。1.大模型充當(dāng)"中樞神經(jīng)系統(tǒng)"在人工智能技術(shù)深度參與之前,數(shù)字人四模因之間的交互較弱,各模因的前期制作相對(duì)獨(dú)立,各板塊設(shè)計(jì)完成后再智能大模型通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、邏輯推理等算法調(diào)優(yōu)體各處也就是數(shù)字人各模因的傳入信息,整合加工后成為協(xié)調(diào)的運(yùn)動(dòng)反應(yīng)傳出。2.各模因交互貫通實(shí)現(xiàn)自然的情感表達(dá)以情感識(shí)別和表達(dá)為例,當(dāng)數(shù)字人的神模因接受外部信號(hào),首先通過語音識(shí)別和自然語言處理進(jìn)行情感分析和語境理解,生成符合情感語氣的回應(yīng),這里神模因和聲模因交互貫通起來,面部表情、肢體動(dòng)作和語言語調(diào)都做出相應(yīng)的反協(xié)調(diào)面部和身體之間的參數(shù)聯(lián)動(dòng),這里聲模因與行模因交互貫通起來。在人工智能的驅(qū)動(dòng)下,情感狀態(tài)和語音語調(diào)的協(xié)之間交互模式,深度模擬了人類思維與身體各部位的協(xié)同機(jī)人工智能技術(shù)在數(shù)字人建模時(shí)就建立了形象、聲音、動(dòng)參數(shù)間的潛在映射關(guān)系,形成自主的驅(qū)動(dòng)模型,展現(xiàn)數(shù)字人的自主性、還原度和智能化,使數(shù)字人在交互時(shí)更協(xié)調(diào)、更流暢且更生動(dòng)。四大模型創(chuàng)造多模態(tài)智慧生成能力2023年,以GPT為代表的生成式人工智能技術(shù)實(shí)現(xiàn)飛躍,AIGC(人工智能自動(dòng)生成內(nèi)容)成為生產(chǎn)力提升的關(guān)鍵。2024年隨著GPT-4的成功,人工智能大模型從文本交互的單一模態(tài)升級(jí)為可以接受文本與圖像組合的多模態(tài)輸入。多20模態(tài)大模型更加符合人類的多渠道感知和認(rèn)知方式,能夠應(yīng)型生成內(nèi)容的速度更快、質(zhì)量更高及形式更多樣,大模型的創(chuàng)造力賦予了數(shù)字人多模態(tài)智慧生成能力。1.理解能力是生成能力的前提生成能力作為數(shù)字人的生產(chǎn)力,也是數(shù)字人輔助人類或者替代人類的核心。在內(nèi)容生成之前,首先需要理解信息。理解世界。視覺大模型讓數(shù)字人有更敏銳的"眼睛",緒的變化。聽覺大模型基于語音識(shí)別技術(shù)和自然語言處理,聽懂言外之意。理解人類的意圖之后,數(shù)字人才能根據(jù)需求生成相應(yīng)的內(nèi)容。2.智慧生成基于多種模型的融合openAI發(fā)布專注于不同模態(tài)信息理解、生成和交互的大模型。chatGPT是能夠根據(jù)上下文語義理解進(jìn)行多輪對(duì)話的聊天程序,支持最長(zhǎng)達(dá)32,000個(gè)字符生成,可以執(zhí)行各種任務(wù),包括代碼編寫、數(shù)學(xué)問題求解、寫作建議等。GPT-4V是圖像識(shí)別領(lǐng)域,上傳X光片,GPT-4V即可準(zhǔn)確地識(shí)別圖像21中的骨折位置、程度等醫(yī)學(xué)問題,并給出相應(yīng)的處理建議。DALL-E是一款專注于圖像生成的模型,嵌入到chatGPT中,根據(jù)用戶的指令完成圖片編輯和生成。以及用于視模型sora,被稱為世界模擬器。只需要一段文本就能生成60s逼真視頻,并且畫面場(chǎng)景精細(xì)、人物表情生動(dòng)以及鏡頭運(yùn)動(dòng)復(fù)雜。2024年5月,openAI發(fā)布全能模型GPT-40,可以實(shí)時(shí)對(duì)音頻、視覺、文本及人類情感進(jìn)行推理。案例展示中,讓GPT-4編曲唱歌、作業(yè)輔導(dǎo)和會(huì)議記錄均應(yīng)大模型已經(jīng)實(shí)現(xiàn)了多模態(tài)的全面打通,也為數(shù)字人接入和交互水平與人類更加靠近。數(shù)字人的智慧水平完全取決于其背后接入的模型水平,模型的未來能走多遠(yuǎn),數(shù)字人的智慧就能走多遠(yuǎn)。五呈現(xiàn)技術(shù)進(jìn)一步釋放數(shù)字人潛能呈現(xiàn)技術(shù)也是數(shù)字人技術(shù)創(chuàng)新的一個(gè)重要領(lǐng)域。數(shù)字人的基本輸出形式是基于虛擬環(huán)境的視頻或者程序,還需要借助終端設(shè)備呈現(xiàn)于用戶面前,完成與物理世界的連接。不同的呈現(xiàn)媒介服務(wù)于不同的應(yīng)用領(lǐng)域,數(shù)字人的呈現(xiàn)技術(shù)決定屏幕類技術(shù)是最早、最廣泛的數(shù)字人呈現(xiàn)方式。屏幕顯22示技術(shù)涵蓋多種設(shè)備如LCD、OLED和投影屏幕,根據(jù)屏幕大小適應(yīng)不同的播放場(chǎng)景。大屏顯示用于戶外廣告或會(huì)議中心,適合遠(yuǎn)距離觀看。中屏顯示如商場(chǎng)顯示屏和家庭電視,適用于商業(yè)展示和家庭娛樂。小屏顯示如智能手機(jī)和平板電準(zhǔn)確度和動(dòng)態(tài)范圍的提升,如4K、8K和HDR技術(shù)增強(qiáng)圖像細(xì)節(jié)和視覺沖擊力。新型顯示技術(shù)如柔性屏和可折疊屏,為數(shù)字人展示提供新的可能性和交互體驗(yàn)。通過多設(shè)備聯(lián)動(dòng),實(shí)現(xiàn)數(shù)字人在不同屏幕上的無縫切換和同步互動(dòng)。例如,用戶可以在手機(jī)上開始與數(shù)字人的對(duì)話,然后在電視上繼續(xù),或者在平板電腦上進(jìn)行更復(fù)雜的互動(dòng)操作。這種多屏幕互動(dòng)將提升用戶體驗(yàn)的連貫性和便利性。頭戴類技術(shù)為用戶提供沉浸式的數(shù)字人觀看體驗(yàn)。頭戴顯示(HMDs)基于虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR)技術(shù),目前在游戲、教育、醫(yī)療等領(lǐng)域應(yīng)用廣泛。VR設(shè)備例如oculusRift、HTcvive等,主要用于游戲和娛樂,提供沉浸式的虛擬環(huán)境。AR設(shè)備類如MicrosoftHoloLens,將虛擬內(nèi)容疊加到現(xiàn)實(shí)環(huán)境中,廣泛應(yīng)用于工業(yè)設(shè)計(jì)、教育和醫(yī)療;混合現(xiàn)實(shí)設(shè)備(MR)如蘋果2024年2月份發(fā)布的MR眼鏡visionpro,結(jié)合VR和AR的優(yōu)勢(shì),實(shí)現(xiàn)虛擬與現(xiàn)實(shí)的融合互動(dòng)。目前,頭戴設(shè)備的技術(shù)進(jìn)步主要體現(xiàn)度上的不斷提升。減少線纜限制,利用云計(jì)算等技術(shù)簡(jiǎn)化頭23升,減少使用疲勞感。未來,頭戴顯示設(shè)備將不僅適用于游3.裸眼類裸眼顯示技術(shù)包括裸眼3D和全息投影,用戶無需佩戴任何設(shè)備即可看到立體的數(shù)字人。裸眼3D主要通過視差技術(shù)讓觀眾在不佩戴設(shè)備的情況下看到立體圖像。例如L型拐角屏幕利用兩個(gè)相互垂直的屏幕產(chǎn)生的視差形成立體效果;3D手機(jī)、3D平板電腦通常是在顯示屏上覆蓋一層柱狀透鏡,通過光的折射和反射實(shí)現(xiàn)立體效果。全息影像通過記錄和再現(xiàn)光波的干涉條紋來實(shí)現(xiàn)三維圖像,屬于投影技術(shù),技術(shù)較型演出活動(dòng)的全息舞臺(tái)及醫(yī)療成像中使用的桌面全息顯示屏等等。隨著技術(shù)的進(jìn)步,裸眼3D和全息步降低,應(yīng)用范圍也在擴(kuò)大。裸眼顯示技術(shù)主要應(yīng)用于廣告的互動(dòng),沉浸感和互動(dòng)性大大增強(qiáng)。24、數(shù)字人應(yīng)用已經(jīng)有序展開最終形成性質(zhì)生產(chǎn)力的關(guān)鍵。過去三年,中國(guó)數(shù)字人應(yīng)用正在循序漸進(jìn)、分類分步啟動(dòng),支撐著數(shù)字人創(chuàng)新正在由玩到(一)應(yīng)用是數(shù)字人創(chuàng)新的"起落架"如果說人工智能技術(shù)是數(shù)字人起飛的引擎,那么人應(yīng)用是數(shù)字人創(chuàng)新發(fā)展的"起落架",它是數(shù)字人技術(shù)創(chuàng)新1.應(yīng)用是數(shù)字人創(chuàng)新的起點(diǎn)。創(chuàng)新不同于發(fā)明,發(fā)明往往是好奇心驅(qū)動(dòng)下的奇思妙想,而發(fā)明則是瞄準(zhǔn)目標(biāo)的系統(tǒng)有目標(biāo)和任務(wù),飛機(jī)就不可能從跑道上昂首起飛。2.應(yīng)用是數(shù)字人創(chuàng)新的支點(diǎn)。一項(xiàng)創(chuàng)新要想持續(xù)必須要有商業(yè)模式,而商業(yè)模式必須建立在應(yīng)用的基礎(chǔ)之上,有了應(yīng)用才會(huì)產(chǎn)生價(jià)值,應(yīng)用是運(yùn)營(yíng)得以持續(xù)的支點(diǎn)。數(shù)字人持續(xù)創(chuàng)新離不開合理回報(bào)和資本投入。從商業(yè)發(fā)展的角度看,數(shù)字人創(chuàng)新持續(xù)投資必須建立在市場(chǎng)收益的基礎(chǔ)上,理性而健康的市場(chǎng)預(yù)期和持續(xù)的產(chǎn)業(yè)投入,是推進(jìn)數(shù)字人持續(xù)創(chuàng)新3.應(yīng)用是數(shù)字人創(chuàng)新的落腳點(diǎn)。"玩"是啟動(dòng)應(yīng)用的跑道,從生活到生產(chǎn),都必須通過應(yīng)用來轉(zhuǎn)化。要把數(shù)字人創(chuàng)新最25終轉(zhuǎn)化成新質(zhì)生產(chǎn)力,應(yīng)用是關(guān)鍵。研究數(shù)字人應(yīng)用的推進(jìn)規(guī)律對(duì)推動(dòng)生產(chǎn)方式變革,推進(jìn)數(shù)字人創(chuàng)新轉(zhuǎn)化為新質(zhì)生產(chǎn)力具有十分重要的意義。二)數(shù)字人應(yīng)用領(lǐng)域正在迅速拓展近年來,中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)已發(fā)起組織了四屆中國(guó)數(shù)字人精品秀活動(dòng),并展開了數(shù)字人應(yīng)用場(chǎng)景和成功案例的征集。從收集到的精品和案例統(tǒng)計(jì)看,目前我國(guó)數(shù)字人的數(shù)量日益加速拓展。統(tǒng)計(jì)分析已有的應(yīng)用探索和案例,數(shù)字人的批量應(yīng)用領(lǐng)域已經(jīng)拓展到方方面面(詳情請(qǐng)見附錄1《中國(guó)數(shù)字人應(yīng)用場(chǎng)景薈萃(2024)》),以下是具有影響力和代表性的20多個(gè)領(lǐng)域:1.數(shù)字主播數(shù)字主播是最早出現(xiàn)的數(shù)字人應(yīng)用形態(tài)。早在2021年國(guó)內(nèi)很多網(wǎng)絡(luò)媒體和大型論壇中就出現(xiàn)了按照預(yù)設(shè)腳本完容的配合基本處于動(dòng)漫配音水平,但因?yàn)樾问叫路f,廣受青睞。隨著數(shù)字人技術(shù)的迅速推進(jìn),數(shù)字主播加速向仿真數(shù)字人演進(jìn),近乎逼真的數(shù)字主持人,已經(jīng)可以根據(jù)編輯人員輸入的文本稿件,實(shí)現(xiàn)形態(tài)自如、語言流暢2.數(shù)字網(wǎng)紅數(shù)字主播在應(yīng)用于文化娛樂、營(yíng)銷推廣等場(chǎng)景中催生了一批有粉絲效應(yīng)的網(wǎng)紅數(shù)字人。數(shù)字網(wǎng)紅在數(shù)字主播基礎(chǔ)上26生,也可以進(jìn)行全新的IP創(chuàng)造。3.數(shù)字名人數(shù)字名人是基于現(xiàn)實(shí)存在的名人,通過模仿其外表形象、言談舉止以及行為習(xí)慣,可使觀眾感受情緒共鳴和感染力。其中數(shù)字歷史名人打破時(shí)間和空間的屏障,讓觀眾能穿越時(shí)科學(xué)家錢學(xué)森,歷史名人蘇小妹。4.數(shù)字手語主播隨著行為技術(shù)進(jìn)步,數(shù)字人肢體動(dòng)作的復(fù)雜度和精準(zhǔn)度升級(jí),出現(xiàn)了面對(duì)特殊群體的數(shù)字手語主播。整合3D數(shù)字人建模、機(jī)器翻譯、語音識(shí)別和自然語言理解等多項(xiàng)技術(shù),通過手語翻譯引擎和自然動(dòng)作引擎,在廣播功能的基礎(chǔ)實(shí)現(xiàn)手語和形體表現(xiàn)功能,通過靈活的手勢(shì)動(dòng)作配合面部表情、溝通"。5.數(shù)字代言人的數(shù)字代言人。數(shù)字分身代言人借助數(shù)字技術(shù),在某些功能27方面甚至出現(xiàn)了超越本人的功能拓展。比如2023年呈現(xiàn)的會(huì)說英語和粵語的楊杰;2024年上線的京東劉強(qiáng)東、格力電器董明珠等。解說員在比賽中充當(dāng)著橋梁的角色,需要敏銳的臨場(chǎng)反應(yīng)和精準(zhǔn)的表達(dá)能力,才能將瞬息萬變的賽況以通俗易懂的方式傳達(dá)給觀眾。數(shù)字解說員利用人工智能賦予的"智商",模擬真實(shí)解說員的形象和聲音,自動(dòng)讀取和播報(bào)比賽數(shù)據(jù),描述比賽場(chǎng)面,實(shí)時(shí)更新重要賽事信息,為觀眾提供精準(zhǔn)、生動(dòng)的賽事解說。7.數(shù)字對(duì)話人數(shù)字對(duì)話人是擁有現(xiàn)場(chǎng)互動(dòng)功能的數(shù)字主播。這類數(shù)字人在具備看稿廣播功能和根據(jù)文案演繹對(duì)話外,還能達(dá)到真與訪談對(duì)象進(jìn)行現(xiàn)場(chǎng)互動(dòng)的功能,在理解和生成能力上有大幅提升。隨著人工智能技術(shù)的發(fā)展,數(shù)字人的交互對(duì)話能力增強(qiáng),應(yīng)用范圍拓展。數(shù)字人逐步應(yīng)用于電商直播場(chǎng)景,為更多觀眾提供"線上導(dǎo)購"服務(wù)。電商數(shù)字人不僅可以按照程序和眾交流對(duì)話,初步"讀"懂直播間深入的營(yíng)銷咨詢業(yè)務(wù)。289.數(shù)字引導(dǎo)人數(shù)字引導(dǎo)人應(yīng)用于線下場(chǎng)景,分為固定式引導(dǎo)人和移動(dòng)式引導(dǎo)人。固定式數(shù)字引導(dǎo)人設(shè)置在相對(duì)固定的位置,通過大屏幕提供數(shù)字人引導(dǎo)服務(wù)。移動(dòng)式數(shù)字引導(dǎo)人運(yùn)用虛擬與現(xiàn)實(shí)的定位融合系統(tǒng),為用戶提供伴隨式虛擬現(xiàn)實(shí)定位導(dǎo)引服務(wù),自帶SLAM(同時(shí)定位與地圖構(gòu)建)運(yùn)動(dòng)跟蹤效果,路線精準(zhǔn)貼合,數(shù)字人精準(zhǔn)落地行走,操作極為簡(jiǎn)便,選擇機(jī)場(chǎng)指路數(shù)字人。10.數(shù)字導(dǎo)覽人數(shù)字導(dǎo)覽人在提供方向?qū)б?wù)的基礎(chǔ)上,提供內(nèi)容介紹功能,可以作為虛擬導(dǎo)覽員為參觀者提供導(dǎo)覽講解服務(wù),指引參觀者前往不同的展覽區(qū)域,講解展區(qū)和展品的詳細(xì)信11.導(dǎo)游數(shù)字人基礎(chǔ)上為游客提供導(dǎo)游講解服務(wù),可與景區(qū)游客實(shí)現(xiàn)面對(duì)面導(dǎo)覽講解等智能服務(wù),打造沉浸式的交互體驗(yàn),做到"吃喝覽成本,高效便利游客。2912.導(dǎo)診數(shù)字人數(shù)字導(dǎo)診人可以7*24小時(shí)不間斷在線或線下的方式與患者互動(dòng),幫助患者了解掌握互聯(lián)網(wǎng)醫(yī)院的使用方法和配套精準(zhǔn)匹配到與病情相適應(yīng)的臨床科室和專家,并輔助掛號(hào)。診后,還可為患者建立健康檔案,方便患者健康管理。13.數(shù)字助理教師數(shù)字助理教師利用人工智能和虛擬現(xiàn)實(shí)技術(shù)創(chuàng)建,針對(duì)學(xué)生提供個(gè)性化、全方位的學(xué)習(xí)支持和指導(dǎo)。通過人工智能技術(shù)的支持,數(shù)字人教師能夠通過學(xué)生的反饋與情感信息實(shí)時(shí)調(diào)整難易程度與教學(xué)策略,幫助學(xué)生更好地理解和掌握知識(shí),可以實(shí)現(xiàn)個(gè)性化教學(xué)。數(shù)字助理教師還能進(jìn)行智能聊天對(duì)話,通過情感陪伴的方式幫助學(xué)生緩解壓力與情緒波動(dòng)。數(shù)字助理教師可以為教師提供教學(xué)輔助和指導(dǎo),幫助其更好地組織教學(xué)內(nèi)容和活動(dòng),提升教學(xué)效果和學(xué)生的學(xué)習(xí)成果。14.數(shù)字咨詢師數(shù)字咨詢師具備一定的專業(yè)知識(shí)儲(chǔ)備和親和力的互動(dòng)30形式,為用戶提供心理、健康、理財(cái)?shù)葘I(yè)領(lǐng)域智能化和精細(xì)化的咨詢服務(wù)。15.數(shù)字助理醫(yī)師根據(jù)患者的回答以及上傳的檢查、檢驗(yàn)報(bào)告,通過人工智能大模型將病情整理成規(guī)范的病史小結(jié),發(fā)送至醫(yī)生,方便醫(yī)生在患者進(jìn)入診室時(shí)提前了解病史,提高工作效率、減輕工作負(fù)擔(dān)。16.數(shù)字助理律師數(shù)字人律師依托法典和條例,疊加互聯(lián)網(wǎng)問答,并結(jié)合律所實(shí)踐經(jīng)驗(yàn),為政法系統(tǒng)工作者及普通民眾提供法律支持、文件,有了數(shù)字人律師,可幫助律師在工作中隨時(shí)檢索需要的法律條款,提高工作效率。17.數(shù)字客服數(shù)字客服,是指通過網(wǎng)絡(luò)界面和手機(jī)終端,回答產(chǎn)品相關(guān)問題,全天候提供服務(wù),提升客服溝通效率和服務(wù)溫度。數(shù)字人客服能以"寫實(shí)"真人的方式提供更具親和力的交互服務(wù)。數(shù)字客服可通過知識(shí)庫提供的內(nèi)容規(guī)范準(zhǔn)確地回答客3118.數(shù)字前臺(tái)數(shù)字前臺(tái),是依托自然語言理解和智能對(duì)話技術(shù)和 題,推薦服務(wù)信息,為客戶提供從咨詢到指引再到辦理的全旅程陪伴式服務(wù)。19.數(shù)字政務(wù)助手?jǐn)?shù)字政務(wù)助手工作內(nèi)容包括多語種的政策解讀、為群眾等多模態(tài)交互方式與數(shù)字政務(wù)助手進(jìn)行擬人化交流,通過技術(shù)手段智能分析用戶需求,通過虛擬人智能推送服務(wù)入口,出件的全流程統(tǒng)一管理,指導(dǎo)用戶辦理相關(guān)手續(xù)。20.企業(yè)數(shù)字秘書企業(yè)數(shù)字秘書是基于桌面終端,融合大模型、AIAgent及AI多模態(tài)交互技術(shù)和個(gè)性化本地知識(shí)庫的綜合智能體。據(jù)與用戶交流過程中捕捉到的用戶的語氣和情感作出不同反映,當(dāng)感受到用戶積極的情緒時(shí),可以營(yíng)造出愉悅的氛圍感;當(dāng)感受到低落的情緒,可以化身為心理按32應(yīng)用于工業(yè)制造業(yè),對(duì)優(yōu)秀工匠的經(jīng)驗(yàn)知識(shí)進(jìn)行規(guī)范化提煉整理,形成專業(yè)技能數(shù)據(jù)庫,同時(shí)結(jié)合人工智能大模型技術(shù),以數(shù)字師傅的形象輔導(dǎo)新員工學(xué)徒學(xué)習(xí)操作技能,輔助員工進(jìn)行實(shí)際操作訓(xùn)練,幫助員工更好掌握專業(yè)技能。通過模擬真實(shí)場(chǎng)景,使員工身臨其境進(jìn)行業(yè)務(wù)演練、快速提升22.數(shù)字稽核員數(shù)字財(cái)務(wù)助手發(fā)揮高效、精準(zhǔn)的工作優(yōu)勢(shì),為公司提供多維度的數(shù)字流程自動(dòng)化處理服務(wù)。數(shù)字財(cái)務(wù)助手憑借先進(jìn)的圖像識(shí)別技術(shù)和數(shù)據(jù)處理能力,可從發(fā)票單據(jù)中準(zhǔn)確識(shí)別據(jù)規(guī)范填寫至對(duì)應(yīng)部門的表格文檔中,并匹配對(duì)應(yīng)的報(bào)銷人對(duì)于缺失或錯(cuò)誤的文件信息,數(shù)字財(cái)務(wù)助手還能生成提醒作用的文檔,提供給工作人員進(jìn)行修正。23.數(shù)字監(jiān)控員數(shù)字監(jiān)控員應(yīng)用于數(shù)字監(jiān)控大屏的操作控制,用戶通過語音對(duì)話下達(dá)指令,在屏幕調(diào)出數(shù)字人監(jiān)控員,數(shù)字人監(jiān)控員響應(yīng)和執(zhí)行語音指令,調(diào)取和展示各類監(jiān)控?cái)?shù)據(jù),以圖形更加直觀、生動(dòng)地了解業(yè)務(wù)現(xiàn)狀和發(fā)展趨勢(shì),從而提升管理33效率和決策策略的科學(xué)性和準(zhǔn)確性。24.數(shù)字操作助理在工業(yè)自動(dòng)化中,數(shù)字人可以被用來控制和優(yōu)化機(jī)器人的操作,提高生產(chǎn)效率,降低事故風(fēng)險(xiǎn)。數(shù)字人可以幫助機(jī)器人進(jìn)行物體識(shí)別、運(yùn)動(dòng)規(guī)劃和路徑規(guī)劃等工作,實(shí)現(xiàn)操作管理。(三)應(yīng)用數(shù)字人逐步形成三類屬性根據(jù)不同的社會(huì)功能,從應(yīng)用的維度,數(shù)字人大致可以分為媒介類數(shù)字人、服務(wù)類數(shù)字人、行業(yè)類數(shù)字人三大類。分類研究是把握事物發(fā)展規(guī)律的基本方法??茖W(xué) (science)原義就是分科之研究。笛卡兒在《方法論》中指出,可以將要研究的復(fù)雜問題,盡量分解為多個(gè)比較簡(jiǎn)單的小問題,一個(gè)一個(gè)地分開解決。分類可以總結(jié)事物的與差異性,研究事物的本質(zhì)和規(guī)律。數(shù)字人應(yīng)用的類型眾多然而又各有不同的發(fā)展特點(diǎn),對(duì)其分類研究有利于掌握數(shù)字人應(yīng)用演進(jìn)的規(guī)律。1.媒介類數(shù)字人隨著數(shù)字人形象和語言功能逐步形成,數(shù)字人在新聞播都屬于媒介型數(shù)字人。媒介數(shù)字人的發(fā)展過程中,初期的廣播類媒介數(shù)字人以數(shù)字人的形象和語音技術(shù)的創(chuàng)新為核心,以信息傳播為主要34與人的信息交流領(lǐng)域。隨著人工智能技術(shù)進(jìn)步和應(yīng)用,互動(dòng)類媒介數(shù)字人憑借人格化、交互性的形象,賦能內(nèi)容生產(chǎn)和傳播升級(jí),提升內(nèi)容的服務(wù)性、互動(dòng)性和體驗(yàn)性。主持人、數(shù)字直播導(dǎo)購等。2.服務(wù)類數(shù)字人隨著媒介數(shù)字人的發(fā)展,交互功能不斷增強(qiáng),數(shù)字人進(jìn)入社會(huì)生活的方方面面,開始在各領(lǐng)域提供信息傳播和交互之外的各類輔助服務(wù),出現(xiàn)了服務(wù)型數(shù)字人。在生成式人工智能技術(shù)的有力支撐下,服務(wù)型數(shù)字人憑真人來提供自動(dòng)化、智能化、標(biāo)準(zhǔn)化的咨詢服務(wù)以及內(nèi)容生務(wù)供給。除了具備媒介類數(shù)字人的一般功能外,服務(wù)型數(shù)字人還具有把控現(xiàn)場(chǎng)的初步能力,并熟練運(yùn)用眾多專業(yè)知識(shí),為個(gè)人提供專業(yè)化服務(wù)。服務(wù)型數(shù)字人能夠通過語言、行為等方式,代替真人完成線下線上特定場(chǎng)所的引導(dǎo)工作,還可以結(jié)合業(yè)務(wù)流程自動(dòng)35用戶體驗(yàn);或者為企業(yè)端和個(gè)人端的用戶提供個(gè)性化的專業(yè)咨詢和擬人化的情感陪伴等服務(wù)。確地回答客戶關(guān)于常見業(yè)務(wù)的咨詢,節(jié)省了人力成本;在醫(yī)療領(lǐng)域,它能為患者提供初步的病情咨詢和引導(dǎo),提高醫(yī)療人可以給予溫馨的情感陪伴,讓他們感受到關(guān)懷。服務(wù)型數(shù)字人可以在不同服務(wù)場(chǎng)景,如企業(yè)內(nèi),公共服數(shù)字導(dǎo)覽人、數(shù)字導(dǎo)游、數(shù)字助理醫(yī)生等,根據(jù)服務(wù)領(lǐng)域,3.行業(yè)類數(shù)字人與各行各業(yè)的生產(chǎn)管理和社會(huì)服務(wù)深度結(jié)合的數(shù)字人稱為行業(yè)型數(shù)字人。雖然安全、管控等條件有待完善,行業(yè)數(shù)字人目前在企業(yè)、行業(yè)、工業(yè)的應(yīng)用還處在起步和初級(jí)階段,不能完全進(jìn)入到生產(chǎn)領(lǐng)域,但在企業(yè)輔助領(lǐng)域已經(jīng)開始出現(xiàn)了應(yīng)用,比如17-24類,應(yīng)用,但隨著媒介、服務(wù)類數(shù)字人的創(chuàng)新成果逐步滲透到工36行業(yè)型數(shù)字人廣泛應(yīng)用的先聲。行業(yè)數(shù)字人指參與行業(yè)管理的某個(gè)環(huán)節(jié),或?qū)π袠I(yè)具備控制力,能替代真人獨(dú)立承擔(dān)某個(gè)工作環(huán)節(jié),或者輔助人類成新的商業(yè)模式和產(chǎn)業(yè)競(jìng)爭(zhēng)力。的智能化水平在工業(yè)制造領(lǐng)域尚有待進(jìn)一步提升,達(dá)到具身智能的階段。具身智能指一種智能系統(tǒng)的設(shè)計(jì)理念,其目標(biāo)是通過將感知、決策和行動(dòng)融合在一起,使機(jī)器能夠像人類一樣具備身體和運(yùn)動(dòng)能力,從而在復(fù)雜環(huán)境中執(zhí)行任務(wù)。工業(yè)生產(chǎn)中,數(shù)字人的應(yīng)用離不開具身智能作為鏈接物理世界的媒介,然而數(shù)字人與具身智能的協(xié)同配合程度有待加強(qiáng)。未來,隨著條件的持續(xù)完善與成熟,行業(yè)型數(shù)字人終將涉足精益生產(chǎn)的制造行業(yè),展現(xiàn)出極為廣闊的應(yīng)用前景。例如,在汽車制造行業(yè),行業(yè)型數(shù)字人能夠精準(zhǔn)監(jiān)控生產(chǎn)線上的每一個(gè)環(huán)節(jié),及時(shí)發(fā)現(xiàn)并解決潛在問題,提升生產(chǎn)質(zhì)量又如在電子設(shè)備制造領(lǐng)域,它們可以對(duì)復(fù)雜的零部件生產(chǎn)過程進(jìn)行精細(xì)管理,確保產(chǎn)品的高精度和高可靠性。四)數(shù)字人應(yīng)用呈現(xiàn)循序漸進(jìn)規(guī)律371.循序漸進(jìn)是互聯(lián)網(wǎng)創(chuàng)新規(guī)律廠廠免費(fèi)媒體信息服務(wù)電子商務(wù)智慧城市行業(yè)應(yīng)用工業(yè)應(yīng)用技術(shù)要素:比特比特+支付比特+支付+物流比特+支付+物流+物聯(lián)感應(yīng)比特+支付+物流+物聯(lián)感應(yīng)+行業(yè)流程比特+支付+物流+物聯(lián)感應(yīng)+行業(yè)流程+中國(guó)創(chuàng)造元素網(wǎng)安要求:盡力而為可信可管萬無一失管控需求:充分開放管放結(jié)合有效閉環(huán)互聯(lián)網(wǎng),依賴于要素條件的逐步豐富和保障條件的逐步完善呈現(xiàn)出循序漸進(jìn)的發(fā)展規(guī)律。任何應(yīng)用都是有條件的,條件的形成需要一個(gè)過程。技術(shù)是支撐互聯(lián)網(wǎng)應(yīng)用的首要條件,技術(shù)水平?jīng)Q定了應(yīng)用瓶頸和門檻。初級(jí)的技術(shù)構(gòu)成初級(jí)由低級(jí)向高級(jí)波浪發(fā)展的一般規(guī)律。網(wǎng)絡(luò)技術(shù)的創(chuàng)新首先從創(chuàng)新元素比較簡(jiǎn)單、創(chuàng)新鏈條相對(duì)較短的領(lǐng)域突破,然后根據(jù)要素的增加由低到高循序漸進(jìn)。比特就可以做信息交換,所以最早出現(xiàn)了互聯(lián)網(wǎng)信息網(wǎng)站。BBS論壇、博客等都是屬于媒介類型應(yīng)用。它消除了信息不正進(jìn)入了"互聯(lián)網(wǎng)+"時(shí)代。38對(duì)安全的要求逐步提高。工業(yè)等行業(yè)需要更高的安全要求。過去幾十年互聯(lián)網(wǎng)的發(fā)展走過的就是一條這樣的道路:從媒循遞增規(guī)律?;ヂ?lián)網(wǎng)發(fā)展呈現(xiàn)出由低級(jí)到高級(jí)的發(fā)展趨勢(shì)。2.數(shù)字人的各類應(yīng)用也將呈現(xiàn)循序漸進(jìn)的規(guī)律數(shù)字人應(yīng)用演進(jìn)也將隨著它的要素成長(zhǎng)由低級(jí)向高級(jí)業(yè)鏈相對(duì)較短的游戲、媒介領(lǐng)域引入,然后逐步進(jìn)入服務(wù)行廠__廠廠媒介數(shù)字人服務(wù)數(shù)字人行業(yè)數(shù)字人技術(shù)要素:形象建模語音合成語料庫垂類小模型A大模型工業(yè)標(biāo)準(zhǔn)網(wǎng)安需求:盡力而為可信可管萬無一失管控需求:充分開放管放結(jié)合有效閉環(huán)五)數(shù)字人正隨要素變化疊加演進(jìn)1.互聯(lián)網(wǎng)應(yīng)用遵循疊加演進(jìn)規(guī)律39互聯(lián)網(wǎng)的技術(shù)演進(jìn)是迭代的,但是業(yè)務(wù)演進(jìn)是疊加的。網(wǎng)絡(luò)演進(jìn)網(wǎng)絡(luò)演進(jìn)數(shù)智互聯(lián)網(wǎng)移動(dòng)互聯(lián)網(wǎng)/PC互聯(lián)網(wǎng)在新的技術(shù)因素和創(chuàng)新條件變化的驅(qū)動(dòng)下,不僅會(huì)出現(xiàn)出各類應(yīng)用長(zhǎng)期并存、疊加演進(jìn)的規(guī)律。數(shù)字人從媒介人到服務(wù)人到行業(yè)人的演進(jìn),不僅僅是遞人一方面隨著技術(shù)條件的變化波浪推進(jìn),同時(shí)各類型應(yīng)用也在不斷提升功能中持續(xù)發(fā)展,三類數(shù)字人將分別疊加演進(jìn)。行業(yè)人/從從廣播類到互動(dòng)類40經(jīng)過中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)組織的三次數(shù)字人精品秀,分析征集到的數(shù)字人作品類型分布,可以發(fā)現(xiàn)近年來數(shù)字人形態(tài)已經(jīng)呈現(xiàn)出從媒介人到服務(wù)人再到產(chǎn)業(yè)人的變化。第一屆基本是媒介人,第二屆服務(wù)人大面積出現(xiàn),占比80%,第三屆行數(shù)字人應(yīng)用的發(fā)展遵循循序漸進(jìn)的規(guī)律,其發(fā)展實(shí)踐豐演進(jìn);服務(wù)領(lǐng)域正處于從引導(dǎo)類向咨詢類突破的階段;數(shù)字人在工業(yè)和行業(yè)的輔助領(lǐng)域已開始大量應(yīng)用,并正在廣泛融入行業(yè)企業(yè)內(nèi)部。隨著人工智能大模型的迅速發(fā)展,數(shù)字人以數(shù)字員工的身份參與到企業(yè)管理環(huán)節(jié),逐漸在工業(yè)生產(chǎn)中發(fā)揮輔助作用,行業(yè)數(shù)字人應(yīng)運(yùn)而生。行業(yè)數(shù)字人輔助人類操控機(jī)器進(jìn)行生模式和產(chǎn)業(yè)競(jìng)爭(zhēng)力。例如在辦公秘書領(lǐng)域,招商銀行的數(shù)字人招小影,被集線等領(lǐng)域得以應(yīng)用。行業(yè)數(shù)字人還會(huì)在輔助工業(yè)安全監(jiān)管、工業(yè)機(jī)器人控制協(xié)作、工業(yè)培訓(xùn)和人員管理等產(chǎn)業(yè)方向發(fā)揮作用,逐步參與行業(yè)的管理管控,達(dá)成個(gè)性化生產(chǎn)和數(shù)字李生的精益制造,在工業(yè)領(lǐng)域具備廣闊的發(fā)展前景。412.數(shù)字人應(yīng)用正隨著要素條件變化由低級(jí)到高級(jí)演進(jìn)網(wǎng)絡(luò)元素和環(huán)境條件是數(shù)字人應(yīng)用演進(jìn)的關(guān)鍵因素。數(shù)字人的應(yīng)用根據(jù)條件變化逐步增長(zhǎng),不僅是數(shù)字人三大類應(yīng)用之間呈現(xiàn)由低級(jí)到高級(jí)發(fā)展,數(shù)字人三大類內(nèi)部也是由低級(jí)到高級(jí)逐步發(fā)展。每一個(gè)階段以及內(nèi)部都依賴于條件的變化。數(shù)字人應(yīng)用起步初期,形象技術(shù)以及文字轉(zhuǎn)語音等技術(shù)出現(xiàn);因此,媒介數(shù)字人首先從卡通類的主播起步;有了語言驅(qū)動(dòng)技術(shù)后,就出現(xiàn)了可以根據(jù)文稿和腳本播音的廣播類媒介數(shù)字人。隨著chatGPT等技術(shù)出現(xiàn),促使數(shù)字主持人向更高階邁進(jìn)。隨著交互技術(shù)進(jìn)步,媒介型數(shù)字人擁有了基礎(chǔ)的交互能力,同時(shí)該能力不斷增強(qiáng)之后,媒介數(shù)透到社會(huì)生活的方方面面,在各領(lǐng)域提供信息傳播和交互之外的各類生活服務(wù),由此衍生出以生活服務(wù)為主的各類服務(wù)型數(shù)字人。與此同時(shí),數(shù)字媒介人也將隨著智能驅(qū)動(dòng)技術(shù)和智能大模型的出現(xiàn)和應(yīng)用,由初級(jí)媒介人向功能更強(qiáng)大的媒介人演進(jìn)升級(jí)。服務(wù)型數(shù)字人的起點(diǎn)高于媒介人。其中導(dǎo)引類數(shù)字人,需要有固定的程序和有限的小語料數(shù)據(jù)庫支撐,通過點(diǎn)擊操作或語音進(jìn)行簡(jiǎn)單交互,從而獲得對(duì)應(yīng)的設(shè)定好的選項(xiàng)式回答,實(shí)現(xiàn)問答型對(duì)話和任務(wù)型對(duì)話,以應(yīng)對(duì)標(biāo)準(zhǔn)化解答數(shù)據(jù)庫內(nèi)事先設(shè)定的高頻引導(dǎo)類問題。導(dǎo)引類服務(wù)人要想成為咨42詢類服務(wù)人,回答專業(yè)問題,需要專業(yè)語料庫和模型的支撐。服務(wù)數(shù)字人的功能實(shí)現(xiàn)從問路導(dǎo)引到提供咨詢的升級(jí),要由小程序、小語料到有專業(yè)數(shù)據(jù)儲(chǔ)備和處理能力的轉(zhuǎn)變,甚至是需要垂直模型的支撐,才能實(shí)現(xiàn)專業(yè)咨詢功能。助理類數(shù)字人,要回答更加復(fù)雜的問題,需要算力模型的支撐以及學(xué)可基于大模型或垂類模型支撐,回答某一領(lǐng)域的專業(yè)類問題,夠保留對(duì)話記錄,編碼并存儲(chǔ)感知和事件記憶,與人類產(chǎn)生有記憶的連續(xù)性互動(dòng),顯著提升交互體驗(yàn)和咨詢質(zhì)量。在特定場(chǎng)景中提供情感關(guān)懷和處理專業(yè)事務(wù),其擬真人程度更高,能更好滿足用戶的情感需要。3.數(shù)字人隨著安全環(huán)境的完善逐步演進(jìn)媒介型、服務(wù)型數(shù)字人向行業(yè)數(shù)字人演進(jìn),需要提升管都要具備管控職責(zé),這需要數(shù)字人本身以及對(duì)數(shù)字人擁有足如果數(shù)字人應(yīng)用到工業(yè)領(lǐng)域,達(dá)到精益制造,更需要毫秒級(jí)的實(shí)時(shí)管控。同時(shí),安全保障對(duì)于數(shù)字人演進(jìn)也十分重要。行業(yè)人需媒介人、服務(wù)人需要事后追溯的安全能力,工業(yè)生產(chǎn)需要強(qiáng)大的實(shí)時(shí)管控能力,需要在工業(yè)生產(chǎn)毫秒級(jí)時(shí)延要求基礎(chǔ)上,43人工智能的持續(xù)革新,為數(shù)字人從"媒介"邁向"服務(wù)" "生產(chǎn)"應(yīng)用創(chuàng)造條件,加快數(shù)字人轉(zhuǎn)化為新質(zhì)生產(chǎn)力的步條件、要素的完善,數(shù)字人有望全面突破應(yīng)用邊界,升級(jí)成人將成為我們?cè)跀?shù)字世界的AI代理人"。通過與Ta們的直提供全天候、全方位的人性化陪伴和智能化服務(wù),成為人們通向虛實(shí)融合世界的超級(jí)入口。數(shù)字人可以隨著安全和控制條件的營(yíng)造,加速從"玩"44四、中國(guó)數(shù)字人產(chǎn)業(yè)正全面加速數(shù)字人產(chǎn)業(yè)進(jìn)入規(guī)?;l(fā)展階段,國(guó)內(nèi)算力基礎(chǔ)設(shè)施加速布局和升級(jí),各類數(shù)字人大模型進(jìn)入迭代進(jìn)程,同時(shí)安全保障相關(guān)建設(shè)引起各方關(guān)注。中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)根據(jù)行業(yè)的發(fā)展現(xiàn)狀研判認(rèn)為,2024年中國(guó)數(shù)字人創(chuàng)新進(jìn)入全面突破時(shí)期。(一)數(shù)字人產(chǎn)業(yè)進(jìn)入規(guī)?;l(fā)展階段AIGC出現(xiàn)后成為促進(jìn)數(shù)字人創(chuàng)新的關(guān)鍵驅(qū)動(dòng)力,打破人產(chǎn)業(yè)進(jìn)入規(guī)?;l(fā)展階段。促進(jìn)經(jīng)濟(jì)發(fā)展的關(guān)鍵因素。分工合作不僅提高了個(gè)體企業(yè)的動(dòng)了產(chǎn)業(yè)生態(tài)的形成和區(qū)域經(jīng)濟(jì)的發(fā)展。中國(guó)已經(jīng)逐步形成完整的數(shù)字人產(chǎn)業(yè)生態(tài)鏈,為數(shù)字人應(yīng)用的蓬勃發(fā)展提供了堅(jiān)實(shí)基礎(chǔ)。上游軟硬件技術(shù)服務(wù)商主要負(fù)責(zé)提供硬件設(shè)備、算力網(wǎng)絡(luò)及核心技術(shù)等底層服務(wù)。中游產(chǎn)品及運(yùn)營(yíng)解決方案提供商則負(fù)責(zé)將這些核心技術(shù)集成到具體的應(yīng)用場(chǎng)景中,開發(fā)出各種數(shù)字人產(chǎn)品和解決方案。下游產(chǎn)業(yè)應(yīng)用方則將這些數(shù)字人產(chǎn)品和解決方案應(yīng)用到實(shí)際的業(yè)務(wù)場(chǎng)景中,實(shí)現(xiàn)商業(yè)價(jià)值,共同打造了一個(gè)健康發(fā)展的數(shù)字人產(chǎn)業(yè)生態(tài)。45中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)于2023(第二十二屆)中國(guó)互聯(lián)網(wǎng)大會(huì)因"能力研發(fā)與創(chuàng)新的智能模型伙伴、關(guān)注數(shù)字人形象設(shè)計(jì)、與數(shù)字人相關(guān)的企業(yè)114.4萬家。今年,我國(guó)數(shù)字人相關(guān)企業(yè)數(shù)量大幅增加,僅2024年1~5月新增注冊(cè)企業(yè)17.4萬余家。(詳情請(qǐng)見附錄2:《中國(guó)數(shù)字人產(chǎn)業(yè)生態(tài)圖譜(2024)》)2.數(shù)字人生產(chǎn)實(shí)現(xiàn)產(chǎn)業(yè)化定制隨著人工智能大模型促進(jìn)了數(shù)字人制作各項(xiàng)技術(shù)的升在中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)組織的第三屆數(shù)字人秀作品征集中出現(xiàn)了多個(gè)產(chǎn)業(yè)化定制能力的演示作品,這類作品展示了低代碼、高集成的數(shù)字人生產(chǎn)過程。數(shù)字人及其應(yīng)用的生產(chǎn)流程演進(jìn)妝容和服裝等形象設(shè)計(jì)方案,為制作團(tuán)隊(duì)提供豐富的視覺參考資料,極大提高了數(shù)字人制作的效率和靈活性。AI語音合46成對(duì)語料庫的需求降到數(shù)十秒內(nèi),在聲音克隆的效率和效果上都大幅提升。其次,AI生成動(dòng)作僅需關(guān)鍵詞輸入,便可自較于傳統(tǒng)真人動(dòng)作捕捉更為便捷的解決方案。相比以往,建得與真人形象、語音近似的數(shù)字人,成本從百萬元降到百元3.數(shù)字人服務(wù)實(shí)現(xiàn)平臺(tái)化運(yùn)營(yíng)不僅生產(chǎn)制作流程化、時(shí)間周期下降,數(shù)字人服務(wù)也逐漸平臺(tái)化運(yùn)營(yíng),大大降低了數(shù)字人的使用門檻。用戶只需上傳基本的圖像或視頻資料,系統(tǒng)就能自動(dòng)生成高仿真度的數(shù)字人形象。平臺(tái)還提供了豐富的模板和素用戶也能輕松上手,實(shí)現(xiàn)快速生成和應(yīng)用。通過無代碼或低代碼開發(fā)環(huán)境,降低了開發(fā)和運(yùn)營(yíng)數(shù)字人的技術(shù)門檻和成本。同時(shí),數(shù)字人服務(wù)的平臺(tái)化運(yùn)營(yíng)有效解決了長(zhǎng)尾市場(chǎng)中多樣、靈活的個(gè)性化需求,借助模塊化的服務(wù)組件,較低成本提供個(gè)性化的運(yùn)營(yíng)服務(wù)。目前數(shù)字人服務(wù)平臺(tái)主要有兩類,saas產(chǎn)品形態(tài)主要面向無獨(dú)立運(yùn)營(yíng)能力的個(gè)人用戶和小微企業(yè)用戶;paas產(chǎn)品形態(tài)主要面向具備獨(dú)立運(yùn)營(yíng)和開發(fā)實(shí)力的企業(yè)用戶。數(shù)字人服務(wù)平臺(tái)開放API接口,方便企47業(yè)將數(shù)字人平臺(tái)與現(xiàn)有業(yè)務(wù)系統(tǒng)進(jìn)行集成,實(shí)現(xiàn)功能擴(kuò)展和數(shù)據(jù)共享。利用云計(jì)算技術(shù),平臺(tái)提供數(shù)字人云端托管和管理服務(wù),減輕企業(yè)的運(yùn)維負(fù)擔(dān)。數(shù)字人服務(wù)平臺(tái)基于其靈活性、低門檻極大地推動(dòng)了數(shù)字人技術(shù)的普及和應(yīng)用,為各行各業(yè)的數(shù)字化轉(zhuǎn)型提供了新的可能。根據(jù)易企秀數(shù)字人平臺(tái)數(shù)據(jù)顯示,在2023年11月數(shù)字人業(yè)務(wù)上線以來,企業(yè)用戶量和使用量節(jié)節(jié)攀升,單月數(shù)字人制作量峰值破十萬,尤其今年5月份以來,單月使用人數(shù)超過過去半年累計(jì)人數(shù),數(shù)字人在中小企業(yè)的營(yíng)銷應(yīng)用中推廣開來。二)算力算網(wǎng)設(shè)施加速布局和追趕數(shù)字人的廣泛應(yīng)用帶來算力需求的爆發(fā)式增長(zhǎng),加快算力基礎(chǔ)設(shè)施的布局和升級(jí)對(duì)于發(fā)展人工智能技術(shù)至關(guān)重要。隨著新一輪科技革命和產(chǎn)業(yè)變革深入發(fā)展,人工智能成為新者共同構(gòu)成新質(zhì)生產(chǎn)力的重要驅(qū)動(dòng)因素。目前我國(guó)算力基礎(chǔ)設(shè)施正在加速布局和追趕,基礎(chǔ)網(wǎng)絡(luò)條件全球領(lǐng)先、算力網(wǎng)絡(luò)體系已有部署、算力芯片研發(fā)正全力追趕。1.算力基礎(chǔ)條件布局領(lǐng)先完備的網(wǎng)絡(luò)基礎(chǔ)設(shè)施是人工智能算力的重要支撐,它不僅影響數(shù)據(jù)傳輸?shù)乃俣群头€(wěn)定性,還決定了計(jì)算資源的整合顯著提升整體計(jì)算性能和應(yīng)用效果。人工智能應(yīng)用需要處理大量的數(shù)據(jù),網(wǎng)絡(luò)基礎(chǔ)設(shè)施的性能直接影響數(shù)據(jù)的傳輸速度48和帶寬。高速、穩(wěn)定的網(wǎng)絡(luò)連接能夠確保數(shù)據(jù)在不同設(shè)備和節(jié)點(diǎn)之間快速傳遞,從而提高人工智能模型的訓(xùn)練和推理效常依賴于云計(jì)算和邊緣計(jì)算,網(wǎng)絡(luò)基礎(chǔ)設(shè)施在其中起到了整合和調(diào)度計(jì)算資源的關(guān)鍵作用。通過高效的網(wǎng)絡(luò)連接,云端和邊緣設(shè)備可以協(xié)同工作,合理分配計(jì)算任務(wù),充分利用分布在不同地點(diǎn)的計(jì)算資源,優(yōu)化資源利用率。2019年國(guó)家提出把5G、人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新型基礎(chǔ)設(shè)施建設(shè)作為經(jīng)濟(jì)建設(shè)的重點(diǎn)任務(wù)之一,經(jīng)過五年"新基建"的發(fā)展,我國(guó)已建成全球規(guī)模最大、技術(shù)領(lǐng)先的網(wǎng)絡(luò)基礎(chǔ)設(shè)施。5G基站超過了380萬個(gè),全球占比達(dá)到大動(dòng)脈不斷拓寬暢通,互聯(lián)網(wǎng)國(guó)家頂級(jí)域名注冊(cè)量全球第一。IPv6地址資源總量算力總規(guī)模均位居世界前列,網(wǎng)絡(luò)服務(wù)質(zhì)量加快邁向世界一流。光纖網(wǎng)絡(luò)接入帶寬實(shí)現(xiàn)從十兆到百兆、再到千兆的指數(shù)級(jí)增長(zhǎng),做到了千兆光纖入村,累計(jì)服務(wù)超36萬個(gè)行政村,數(shù)字基礎(chǔ)設(shè)施實(shí)現(xiàn)"市市通千兆、縣縣通5G、工智能等與制造業(yè)深度融合,推動(dòng)了產(chǎn)業(yè)數(shù)字化、數(shù)字產(chǎn)業(yè)化的不斷加快。2.算力云網(wǎng)體系正加速部署基礎(chǔ)網(wǎng)絡(luò)設(shè)施是必備條件,算力云網(wǎng)體系是支撐人工智能發(fā)展的關(guān)鍵基礎(chǔ)設(shè)施。通過構(gòu)建數(shù)據(jù)中心、云計(jì)算、大數(shù)49據(jù)一體化的新型算力云網(wǎng)體系,實(shí)現(xiàn)資源高效調(diào)合云計(jì)算的強(qiáng)大資源、網(wǎng)絡(luò)的高效連接、邊緣計(jì)算的低延遲處理和終端設(shè)備的本地計(jì)算能力形成云網(wǎng)邊端協(xié)同的分布在分布式算力基礎(chǔ)設(shè)施中,任務(wù)會(huì)被分成很多小部分,并分配給多個(gè)芯片處理器來處理。這就像是讓很多人同時(shí)幫你做不同部分的作業(yè),大幅縮短完成復(fù)雜任務(wù)的時(shí)智能模型的訓(xùn)練,可以在幾小時(shí)內(nèi)完成原本需要幾天甚至幾甘肅、寧夏等地建設(shè)的8個(gè)國(guó)家算力樞紐節(jié)點(diǎn)已全部開工,10個(gè)國(guó)家數(shù)據(jù)中心集群同步布局。西部地區(qū)新開工建設(shè)的數(shù)大運(yùn)營(yíng)商及頭部互聯(lián)網(wǎng)公司發(fā)揮自身優(yōu)勢(shì)和特點(diǎn),聚焦國(guó)家 "東數(shù)西算"樞紐節(jié)點(diǎn),打造多個(gè)千億參數(shù)以上訓(xùn)練能力的公共智算中心,為國(guó)內(nèi)通用人工智能發(fā)展奠定堅(jiān)實(shí)的算力基全網(wǎng)智算規(guī)模超過每秒30百億億次浮點(diǎn)運(yùn)算。從全國(guó)來看,50智能算力在算力總規(guī)模中的比重超過了30%,算力結(jié)構(gòu)不斷推進(jìn)人工智能計(jì)算架構(gòu)和軟件生態(tài)建設(shè),加快打造全國(guó)統(tǒng)一算力服務(wù)大市場(chǎng),不斷提升算力普惠易用水平。2024年4月,中國(guó)移動(dòng)正式對(duì)外發(fā)布全球運(yùn)營(yíng)商最大單體智算中心該智算中心填補(bǔ)了我國(guó)人工智能廣泛應(yīng)用所需算力的巨大3.算力芯片研發(fā)正加速追趕GPU(圖形處理單元)和TPU(張量處理單元)是兩類支持大規(guī)模數(shù)據(jù)處理和深度學(xué)習(xí)模型訓(xùn)練的芯片處理器,為訓(xùn)練和運(yùn)行復(fù)雜的大模型提供了足夠的硬件基礎(chǔ)和計(jì)算速度,使得實(shí)時(shí)數(shù)據(jù)處理和大規(guī)模并行計(jì)算成為可能。數(shù)據(jù)并行是指將訓(xùn)練數(shù)據(jù)劃分為多個(gè)小批次(mini-batch),在多個(gè)計(jì)算節(jié)點(diǎn)上并行訓(xùn)練;模型并行是將大型模型劃分為多個(gè)部分,分配到不同的計(jì)算節(jié)點(diǎn)上并行計(jì)算;這兩類技術(shù)都能提升整體計(jì)算的吞吐量。英偉達(dá)(NVIDIA)、英特爾(Intel)、AMD等企業(yè)在芯片制造工藝上處于全球領(lǐng)先地位,先進(jìn)制程(如5nm、3nm)技術(shù)成熟。英偉達(dá)的GPU如A100、H100和英特爾的神經(jīng)計(jì)算芯片等在性能和能效上均居于全球領(lǐng)先水平。近年來,我國(guó)出臺(tái)多項(xiàng)扶持政策大力支持半導(dǎo)體和人工51智能產(chǎn)業(yè)的發(fā)展,國(guó)內(nèi)企業(yè)加大了在芯片研發(fā)上的投入,推在芯片設(shè)計(jì)和制造工藝上取得了顯著進(jìn)展,逐步縮小與國(guó)際領(lǐng)先水平的差距。今年以來,我國(guó)扎實(shí)推進(jìn)算力基礎(chǔ)設(shè)施的建設(shè),不斷強(qiáng)化產(chǎn)業(yè)創(chuàng)新能力,持續(xù)推動(dòng)算力了解,中國(guó)移動(dòng)智算中心部署了約2萬張AI加速卡,AI芯片國(guó)產(chǎn)化率超85%,智能算力規(guī)模高達(dá)6.7EFLOPS(每秒670億億次浮點(diǎn)運(yùn)算)。三)各類數(shù)字人大模型進(jìn)入迭代進(jìn)程追趕狀態(tài),垂類大模型逐漸崛起,進(jìn)入迭代進(jìn)程。1.通用模型呈現(xiàn)"百模爭(zhēng)先"人工智能領(lǐng)域的核心競(jìng)爭(zhēng)主要在模型層,近幾年國(guó)內(nèi)外大模型技術(shù)迭代飛速,從GPT-4的多模態(tài)能力到paLM2的多語言支持,再到LLaMA的小規(guī)模高性能設(shè)計(jì),人工智能代技術(shù)。從全球已發(fā)布的大模型地域分布看,中國(guó)和美國(guó)大的大模型技術(shù)群。今年,國(guó)產(chǎn)大模型的平均水平已經(jīng)超過GPT3.5,無限逼近GPT4。但GPT4本身還在不斷迭代,最新發(fā)布的GPT4O在整體性能、效果及效率上都有了顯著提升。通用大模型持52續(xù)不斷的更新迭代,以適應(yīng)日益復(fù)雜工智能備案信息,我國(guó)共有117個(gè)生成式人工智能服務(wù)完成2.垂類大模型開始發(fā)力落地通用大模型"卷來卷去"只會(huì)造成資源浪費(fèi),國(guó)家互聯(lián)網(wǎng)信息辦公室登記備案的生成式人工智能服務(wù)數(shù)量已連續(xù)間如何。眾多企業(yè)把創(chuàng)新重點(diǎn)放在垂類領(lǐng)域,根據(jù)生成式人工智能備案信息發(fā)現(xiàn),垂類領(lǐng)域的身影屢見不鮮,例如網(wǎng)易有道"子曰"教育大模型、金山軟件推出的WPSAI辦公類大模型、螞蟻集團(tuán)發(fā)布的工業(yè)級(jí)金融大模型AntFinGLM、滴滴推出的以個(gè)人出行和企業(yè)差旅為場(chǎng)景的出行大模型等。隨著大模型能力開始深入各行各業(yè),垂類大模型引發(fā)關(guān)落地應(yīng)用場(chǎng)景最豐富的賽道之一。人工智能大模型在數(shù)字人場(chǎng)景的應(yīng)用發(fā)展已經(jīng)相對(duì)成熟,大模型即插即用,有垂類大模型加持的行業(yè)數(shù)字人也遍地開花。以今年數(shù)字人精品秀征集的應(yīng)用場(chǎng)景作品為樣本,數(shù)字人功能提升速度飛快,各類數(shù)字人大模型進(jìn)入迭代階段,類別越來越細(xì),周期越來越短,頻次越來越高。533.人工智能探索賦能行業(yè)為代表的人工智能創(chuàng)新發(fā)展機(jī)遇,以人工智能和制造業(yè)深度模型,加快推進(jìn)人工智能賦能新型工業(yè)化。人工智能聚焦數(shù)域加入了大量人工智能技術(shù)研發(fā)為核心的企業(yè),專注于人工智能技術(shù)在數(shù)字人領(lǐng)域的研發(fā)探索,賦予數(shù)字人先進(jìn)的算法數(shù)字人成為人工智能賦能千行百業(yè)的重要載體之一,除了教如何發(fā)揮真正的生產(chǎn)力是數(shù)字人發(fā)展的下一個(gè)重要命題。四)安全保障相關(guān)建設(shè)引起各方關(guān)注技術(shù)發(fā)展提供的創(chuàng)新條件已經(jīng)充分,但數(shù)字人創(chuàng)新發(fā)展的過程中面臨著監(jiān)管政策、法律法規(guī)不完善,部分倫理道德問題的社會(huì)共識(shí)未達(dá)成等難題。安全保障的建設(shè)工作已經(jīng)逐步展開,引起各地政府及社會(huì)各界高度關(guān)注,正努力創(chuàng)造條件為數(shù)字人創(chuàng)新保駕護(hù)航。1.各級(jí)政府高度重視54業(yè)。工業(yè)和信息化部等五部門印發(fā)的《元宇宙產(chǎn)業(yè)創(chuàng)新發(fā)展三年行動(dòng)計(jì)劃(2023-2025年)》中多次提及對(duì)數(shù)字人發(fā)展及醫(yī)療等領(lǐng)域的場(chǎng)景打造。北京市經(jīng)濟(jì)和信息化局編制了《北京市促進(jìn)數(shù)字人產(chǎn)業(yè)創(chuàng)新發(fā)展行動(dòng)計(jì)劃(2022-2025年)》,推臺(tái)關(guān)于虛擬數(shù)字技術(shù)的產(chǎn)業(yè)發(fā)展計(jì)劃等近百項(xiàng)政策措施,聚川區(qū)、海南陵水縣均在已發(fā)布的相關(guān)政策中提到數(shù)字人的產(chǎn)業(yè)發(fā)展規(guī)劃和應(yīng)用方向。2.安全保障工作列為重點(diǎn)國(guó)家《元宇宙產(chǎn)業(yè)創(chuàng)新發(fā)展三年行動(dòng)計(jì)劃(2023-2025年)》中明確提出構(gòu)建安全可信產(chǎn)業(yè)治理體系是五項(xiàng)重要任風(fēng)險(xiǎn)事件處置機(jī)制,建立健全違法信息監(jiān)測(cè)、識(shí)別和處置機(jī)儲(chǔ)、使用等行為,提升數(shù)據(jù)安全治理能力和個(gè)人信息的保護(hù)水平。《北京市促進(jìn)數(shù)字人產(chǎn)業(yè)創(chuàng)新發(fā)展行動(dòng)計(jì)劃(2022-2025年)》中提出探索多層次風(fēng)險(xiǎn)防控機(jī)制,督促數(shù)字人企業(yè)做好數(shù)據(jù)安全和個(gè)人信息保護(hù),加強(qiáng)信息內(nèi)容安全管理,落實(shí)信55息內(nèi)容服務(wù)主體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論