生成式人工智能在檔案數(shù)字場(chǎng)景中的應(yīng)用研究_第1頁(yè)
生成式人工智能在檔案數(shù)字場(chǎng)景中的應(yīng)用研究_第2頁(yè)
生成式人工智能在檔案數(shù)字場(chǎng)景中的應(yīng)用研究_第3頁(yè)
生成式人工智能在檔案數(shù)字場(chǎng)景中的應(yīng)用研究_第4頁(yè)
生成式人工智能在檔案數(shù)字場(chǎng)景中的應(yīng)用研究_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1引言人工智能生成內(nèi)容(ArtificialIntelligenceGenerateContent,下簡(jiǎn)稱AIGC),通過人工智能實(shí)現(xiàn)文本、圖像、音頻、視頻及其跨模態(tài)間的內(nèi)容生成,可用于繪畫創(chuàng)作、文本寫作、音像生成、游戲開發(fā)等多種類型的內(nèi)容創(chuàng)作。AIGC技術(shù)是生成算法、預(yù)訓(xùn)練模型、多模態(tài)等人工智能(AI)技術(shù)的累積融合[1]。傳統(tǒng)AI利用機(jī)器學(xué)習(xí)技術(shù)學(xué)習(xí)數(shù)據(jù)分布,在文本識(shí)別、語(yǔ)音識(shí)別、圖像識(shí)別、運(yùn)營(yíng)決策、風(fēng)險(xiǎn)評(píng)估和醫(yī)療診斷等領(lǐng)域廣泛應(yīng)用。生成式人工智能[2]在歸納數(shù)據(jù)分布的基礎(chǔ)上,學(xué)習(xí)數(shù)據(jù)產(chǎn)生的模式并創(chuàng)造新樣本,實(shí)現(xiàn)在文字創(chuàng)造、圖像語(yǔ)音生成、代碼生成等領(lǐng)域的技術(shù)應(yīng)用。AI領(lǐng)域正在經(jīng)歷從感知、理解到生成、創(chuàng)造的躍遷。截至2023年5月26日,在中國(guó)學(xué)術(shù)期刊網(wǎng)以“AIGC”“ChatGPT”“生成式人工智能”“生成式AI”為主題檢索近三年發(fā)表學(xué)術(shù)期刊675篇,與檔案學(xué)相關(guān)文獻(xiàn)2篇,探討了ChatGPT實(shí)現(xiàn)檔案數(shù)字化、檔案鑒定、檔案分類和檢索、檔案保護(hù)和安全等多種檔案管理任務(wù)[3],提出了ChatGPT火爆背后的冷思考[4]。從文獻(xiàn)學(xué)的角度,AIGC技術(shù)在檔案領(lǐng)域的研究和應(yīng)用還剛剛起步?!丁笆奈濉睓n案事業(yè)發(fā)展規(guī)劃》提出“推動(dòng)檔案工作與新技術(shù)深度融合,為檔案事業(yè)發(fā)展提供持續(xù)動(dòng)力”。AIGC作為一種新型內(nèi)容創(chuàng)作方式,給文化、教育、金融、娛樂和公共服務(wù)等諸多領(lǐng)域帶來(lái)了積極影響,本文擬在檔案視角下探索AIGC技術(shù)的多種應(yīng)用場(chǎng)景,為數(shù)字時(shí)代下的智慧檔案建設(shè)創(chuàng)新尋找新的思路。2基于AIGC技術(shù)的檔案應(yīng)用場(chǎng)景AIGC具有三大前沿能力:智能數(shù)字內(nèi)容孿生能力、智能數(shù)字內(nèi)容編輯能力和智能數(shù)字內(nèi)容創(chuàng)作能力[5]。技術(shù)被廣泛應(yīng)用于文本、音頻和視覺等不同模態(tài)數(shù)據(jù),形成了豐富多樣的技術(shù)應(yīng)用,在檔案的視角下,AIGC技術(shù)可深度賦能檔案文化遺產(chǎn)保護(hù)、服務(wù)利用及資源開發(fā)、公共教育與文創(chuàng)開發(fā)等領(lǐng)域。2.1數(shù)字孿生:賦能檔案文化遺產(chǎn)保護(hù)智能數(shù)字內(nèi)容孿生能力構(gòu)建了現(xiàn)實(shí)世界到數(shù)字世界的映射,是通過對(duì)客觀世界內(nèi)容感知、理解的基礎(chǔ)上,以多模態(tài)數(shù)字化內(nèi)容呈現(xiàn)的形式實(shí)現(xiàn)對(duì)原物理世界的模擬復(fù)刻和場(chǎng)景再現(xiàn)。一是數(shù)字修復(fù)還原新視覺。AIGC視覺模型通過對(duì)作品屬性特征和元素搭配的理解,在海量數(shù)據(jù)中進(jìn)行知識(shí)和分布學(xué)習(xí),實(shí)現(xiàn)高質(zhì)量的數(shù)字修復(fù)。《富春山居圖》被毀于300多年前,百度文心利用“視覺生成大模型+單樣本微調(diào)”的技術(shù)策略,完成了高清晰度、高還原度的殘卷修復(fù)。數(shù)字智能增強(qiáng)能力可應(yīng)用于照片、音頻、視頻等聲像檔案的修復(fù),采用大模型去除破壞干擾因素,實(shí)現(xiàn)多維音、畫質(zhì)增強(qiáng)和提升。在三維視覺領(lǐng)域,智能增強(qiáng)技術(shù)克服了傳統(tǒng)數(shù)字化采集的局限,保留了三維世界的深度、材質(zhì)和光照等重要信息,對(duì)場(chǎng)景及細(xì)節(jié)進(jìn)行快速和精準(zhǔn)的復(fù)刻。全球首個(gè)超時(shí)空參與式博物館“數(shù)字藏經(jīng)洞”真實(shí)再現(xiàn)了敦煌百年前藏經(jīng)洞及室藏6萬(wàn)余卷文物的珍貴歷史場(chǎng)景,項(xiàng)目還開發(fā)了沉浸式遠(yuǎn)程會(huì)診系統(tǒng),實(shí)現(xiàn)無(wú)障礙遠(yuǎn)程文物會(huì)診?;?dòng)紀(jì)錄片《古籍尋游記》在不傷害文物的低噪情況下重建了敦煌石窟中文物的三維結(jié)構(gòu)。二是聲像檔案?jìng)鞒行侣曇簟UZ(yǔ)音智能轉(zhuǎn)譯技術(shù)已用于重大活動(dòng)的實(shí)時(shí)建檔、口述檔案的實(shí)時(shí)轉(zhuǎn)寫、音視頻檔案數(shù)據(jù)化以及實(shí)時(shí)字幕輔助等場(chǎng)景。2019年,浙江省檔案館在全國(guó)率先使用科大訊飛檔案機(jī),實(shí)現(xiàn)口述歷史采集室建設(shè)運(yùn)行、重點(diǎn)檔案保護(hù)與開發(fā)等工作中的成果轉(zhuǎn)化及推廣。AIGC語(yǔ)音合成、圖像合成等多模態(tài)融合技術(shù)的應(yīng)用可實(shí)現(xiàn)“故人重現(xiàn)”“經(jīng)典回溯”“古今同臺(tái)”等場(chǎng)景[6],使深藏在檔案館里的偉人聲音、非遺藝術(shù)等聲像檔案“活”起來(lái)。世界首部人工智能配音紀(jì)錄片《創(chuàng)新中國(guó)》通過AI學(xué)習(xí)已逝著名配音藝術(shù)家李易老師過往紀(jì)錄片的聲音資料合成配音,讓李易的聲音重現(xiàn)。技術(shù)的應(yīng)用還有助于民間聲像檔案的動(dòng)態(tài)傳承,我國(guó)“地方方言檔案資料庫(kù)”由于開發(fā)缺乏方言元數(shù)據(jù)標(biāo)準(zhǔn)和國(guó)標(biāo)音標(biāo)著錄等因素影響,庫(kù)內(nèi)資源大都停留在靜態(tài)保存的階段[7],借助AIGC技術(shù)可生成形式多樣的方言學(xué)習(xí)素材,讓即將消失的鄉(xiāng)音重新發(fā)聲,使豐富的地方文化得到有效的傳承。2.2數(shù)字編輯:賦能服務(wù)利用與資源開發(fā)AIGC智能數(shù)字內(nèi)容編輯能力構(gòu)建了數(shù)字世界與物理世界間的交互通道。新一代知識(shí)增強(qiáng)大語(yǔ)言模型(LLM),以谷歌BERT、OpenAI的GPT和百度文心等為代表,為人機(jī)交流提供了智能的交互方式。自然語(yǔ)言處理技術(shù)的引入,可實(shí)現(xiàn)文本信息的抽取、自動(dòng)摘要分類和數(shù)據(jù)分析等操作,通過對(duì)內(nèi)容的語(yǔ)義理解,從研究問題中衍生出新的發(fā)現(xiàn),實(shí)現(xiàn)對(duì)資源的開發(fā)。一是檔案智能檢索交互新轉(zhuǎn)變。傳統(tǒng)的檔案信息檢索通過輸入檢索詞等方式進(jìn)行模糊檢索,增加了非專業(yè)利用者的搜索和利用難度。大語(yǔ)言模型的運(yùn)用,用戶可通過自然語(yǔ)言交互的方式獲得需要的信息,還可對(duì)后續(xù)問題展開更深層的知識(shí)拓展。搜索引擎正逐步實(shí)現(xiàn)從“模糊搜索”到“精準(zhǔn)推送”的轉(zhuǎn)變。ChatGPT是文本生成式AIGC的典型代表,基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)技術(shù)解決了如何使AI模型產(chǎn)生與人類常識(shí)和認(rèn)知、需求和價(jià)值觀保持一致的難題,它的出現(xiàn)將計(jì)算機(jī)理解人類語(yǔ)言和反饋解決方法水平提高到全新的層次[8]。微軟集成ChatGPT的新版Bing根據(jù)用戶的想法調(diào)整搜索查詢,能通過對(duì)話的方式調(diào)整搜索結(jié)果,優(yōu)化檢索體驗(yàn)。二是檔案社會(huì)關(guān)懷價(jià)值新體現(xiàn)。AIGC技術(shù)在文本、圖像和音視頻間多模態(tài)的相互轉(zhuǎn)化,將檢索結(jié)果按照用戶所能接受的最佳模態(tài)呈現(xiàn),為我國(guó)數(shù)量龐大的視障、聽障、感官逐漸衰退的老年群體以及智能設(shè)備使用無(wú)力的邊緣人群提供多維感官的交互體驗(yàn)[9],可實(shí)現(xiàn)個(gè)性化檔案服務(wù)與社會(huì)化人文關(guān)懷的完美結(jié)合。對(duì)于特殊群體,智能檢索在社會(huì)關(guān)懷價(jià)值上的體現(xiàn)也更趨多元化,百度輸入法搭載文心PLATO對(duì)話大模型推出AI侃侃功能,為用戶提供真實(shí)的情感陪伴式聊天服務(wù),用戶在知識(shí)獲取的同時(shí),體驗(yàn)真實(shí)的情感陪伴,讓冰冷的知識(shí)更有溫度。三是檔案編研開發(fā)挖掘新深度。傳統(tǒng)的信息組織思路是基于學(xué)科、主題、關(guān)鍵詞等所反映的少量特征信息,而生成式AI可依據(jù)的特征維度更豐富,知識(shí)組織之間細(xì)粒度和關(guān)聯(lián)性更突出。通過對(duì)文本的數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),識(shí)別文本信息共性并關(guān)聯(lián)相近內(nèi)容,實(shí)現(xiàn)深入內(nèi)容層面的檔案開發(fā),形成豐富的檔案資源開發(fā)成果,促進(jìn)人文研究領(lǐng)域從文本梳理到知識(shí)鏈接、從信息檢索到知識(shí)發(fā)現(xiàn)的轉(zhuǎn)變。耶魯大學(xué)“讓二戰(zhàn)大屠殺受害者發(fā)聲(LetThemSpeak)”項(xiàng)目,在近3000份大屠殺幸存者留下的視聽材料和文字證詞中,以文本挖掘和可視化技術(shù)幫助研究者探尋檔案記錄背后更深層次的語(yǔ)義關(guān)系和集體記憶[10]。瑞典國(guó)家圖書館使用開源Transformer模型對(duì)26PB的瑞典語(yǔ)數(shù)據(jù)創(chuàng)建數(shù)據(jù)集,幫助語(yǔ)言分析人員回顧瑞典語(yǔ)幾個(gè)世紀(jì)的演變。2.3數(shù)字創(chuàng)作:賦能公共教育與文創(chuàng)開發(fā)AIGC智能數(shù)字內(nèi)容創(chuàng)作能力使計(jì)算機(jī)從對(duì)數(shù)據(jù)的理解上升到對(duì)數(shù)據(jù)的創(chuàng)作。從數(shù)據(jù)中學(xué)習(xí)抽象概念,并基于概念創(chuàng)作出新的內(nèi)容,包括了AI視頻創(chuàng)作、數(shù)字人、劇本創(chuàng)作、游戲開發(fā)等。我國(guó)檔案館公共教育活動(dòng)多以參觀庫(kù)房、觀看展覽、影片、聽講解等傳統(tǒng)形式為主,未充分考慮教育群體的特點(diǎn)和需求[11]。AIGC技術(shù)的應(yīng)用為不同群體策劃知識(shí)服務(wù)活動(dòng),實(shí)現(xiàn)知識(shí)傳授和互動(dòng)實(shí)踐的良性循環(huán)。一是檔案主題動(dòng)漫啟蒙新思路?!皺n案教育從娃娃抓起”,針對(duì)年齡段較小的教育群體,檔案動(dòng)漫等形式更容易被接受。AI短片制作可實(shí)現(xiàn)AI動(dòng)畫表演、場(chǎng)景和角色生成、細(xì)節(jié)動(dòng)態(tài)效果生成、自動(dòng)布光渲染、虛擬拍攝及衍生品開發(fā)等。微軟NUWA-XL人工智能僅用16句描述詞生成了長(zhǎng)達(dá)11分鐘的2D動(dòng)畫。Netflix、微軟小冰日本分部、WITSTUDIO共同創(chuàng)作了首部發(fā)行級(jí)別AIGC動(dòng)畫短片《犬與少年》。首部AIGC中文漫畫《ARES覺醒》已在騰訊動(dòng)漫平臺(tái)上連載,藝術(shù)家王睿將高澤龍小說(shuō)《元宇宙2086》文本轉(zhuǎn)化為可視圖像,實(shí)現(xiàn)了AIGC生成完整情節(jié)的漫畫[12]。以AIGC輔助開展檔案主題動(dòng)漫的創(chuàng)作為幼兒檔案文化和意識(shí)的啟蒙開拓了新的思路。二是檔案數(shù)字人互動(dòng)新體驗(yàn)。針對(duì)青少年群體,兼具知識(shí)性和互動(dòng)性的虛擬數(shù)字人更符合其發(fā)展特點(diǎn)。2021年元宇宙概念盛行,國(guó)內(nèi)外虛擬數(shù)字人扎堆出現(xiàn)。這一階段,虛擬人大多存在“動(dòng)作神態(tài)僵硬、對(duì)話交互性弱、視頻效果粗糙”等缺陷,宣傳意義大于實(shí)踐。隨著AIGC技術(shù)發(fā)展,技術(shù)平臺(tái)依靠短時(shí)間的視頻素材進(jìn)行多模態(tài)預(yù)訓(xùn)練,可實(shí)現(xiàn)小樣本快速定制虛擬人產(chǎn)品,在人像驅(qū)動(dòng)、智能對(duì)話和語(yǔ)音交互等領(lǐng)域也逐漸成熟。通過給予數(shù)字化檔案訓(xùn)練語(yǔ)料,虛擬數(shù)字人可充當(dāng)不同年齡段學(xué)習(xí)群體的檔案數(shù)字助教和孿生學(xué)伴,提供檔案智能問答、沉浸式情境教學(xué)、交流研討等知識(shí)服務(wù),為青少年群體提供更逼真、更人性化的交互體驗(yàn)。三是檔案劇本創(chuàng)作開發(fā)新視角。數(shù)字內(nèi)容創(chuàng)作為歷史文化檔案的開發(fā)創(chuàng)造了新的視角。技術(shù)通過對(duì)多模態(tài)歷史檔案數(shù)據(jù)的分析歸納,按照預(yù)設(shè)風(fēng)格快速生成劇本方案,為檔案開發(fā)人員進(jìn)行篩選和二次加工開拓創(chuàng)作思路,以文案設(shè)計(jì)、劇本創(chuàng)作、游戲開發(fā)等形式實(shí)現(xiàn)歷史的重現(xiàn)?!笆澜缬洃洝ぶ袊?guó)文獻(xiàn)遺產(chǎn)創(chuàng)意競(jìng)賽”獲獎(jiǎng)項(xiàng)目:劇本殺《歷獄1665》,根據(jù)中國(guó)第一歷史檔案館藏的24件清朝內(nèi)閣秘本檔為劇本創(chuàng)作對(duì)象,實(shí)現(xiàn)了歷史事件的創(chuàng)新開發(fā)。除了文案、劇本設(shè)計(jì)等形式,AIGC技術(shù)還可應(yīng)用于游戲中的智能NPC、場(chǎng)景建模、AI劇情、AI繪圖等方面,為檔案故事創(chuàng)作的解密游戲、劇情游戲提供技術(shù)支持。3生成式數(shù)字應(yīng)用場(chǎng)景中的風(fēng)險(xiǎn)挑戰(zhàn)與對(duì)策3.1檔案數(shù)據(jù)信息安全性檔案系統(tǒng)的部署和使用大都在局域網(wǎng)或者政務(wù)網(wǎng),調(diào)用檔案數(shù)據(jù)的敏感性、安全和合規(guī)性最為關(guān)鍵。現(xiàn)行較為流行的直接調(diào)用外部模型接口的方式可能引發(fā)檔案資源的跨境泄露,如檔案信息被惡意使用或?yàn)E用,將引發(fā)深度合成詐騙、誹謗、假冒身份等新型違法犯罪行為。同時(shí),在利用AIGC技術(shù)向用戶提供在線檔案服務(wù)與多場(chǎng)景交流互動(dòng)過程中留下的個(gè)性特征、常用服務(wù)、辦事習(xí)慣等用戶隱私信息會(huì)通過人工智能跟蹤、統(tǒng)計(jì)、分析等途徑留下痕跡,在更好地為用戶提供信息檢索、業(yè)務(wù)問答、文創(chuàng)推薦等智能服務(wù)的同時(shí)也增加了用戶隱私泄露的風(fēng)險(xiǎn)。因此,在確保檔案數(shù)據(jù)信息和用戶隱私安全的前提下,自主研發(fā)部署適合于檔案部門的訓(xùn)練模型,妥善應(yīng)對(duì)數(shù)據(jù)來(lái)源、訓(xùn)練、組織、輸出等各個(gè)環(huán)節(jié)的風(fēng)險(xiǎn)挑戰(zhàn)。3.2檔案開發(fā)價(jià)值導(dǎo)向性AIGC技術(shù)可完成語(yǔ)音轉(zhuǎn)寫、多語(yǔ)言音畫同步、智能視頻剪輯、概念圖優(yōu)化、劇本生成等多項(xiàng)創(chuàng)作初期任務(wù),將部分流程性、重復(fù)性勞動(dòng)的工作自動(dòng)化,提高工作效率和準(zhǔn)確度。但對(duì)于類似紅色檔案精神挖掘、特色檔案記憶傳承、傳統(tǒng)檔案價(jià)值觀體現(xiàn)等具有深層次價(jià)值導(dǎo)向的編研及利用開發(fā)無(wú)法發(fā)揮人類在提升內(nèi)容價(jià)值、精準(zhǔn)分析事物、妥善處理情感元素等方面的優(yōu)勢(shì),無(wú)法替代人類完成決策性的生成任務(wù)。因此,需要?jiǎng)?chuàng)作者在生成技術(shù)的輔助下進(jìn)行篩選和二次加工,采用人機(jī)協(xié)作的工作方式,深度挖掘檔案中蘊(yùn)含的歷史、文化、精神等獨(dú)特價(jià)值。3.3生成專業(yè)數(shù)據(jù)可信性生成式人工智能輸出數(shù)據(jù)的可信性很大部分取決于原始訓(xùn)練語(yǔ)料數(shù)據(jù)集的專業(yè)性。檔案中存在著較多非標(biāo)準(zhǔn)化語(yǔ)言和文檔格式,小部分?jǐn)?shù)據(jù)化后的文本檔案數(shù)據(jù)質(zhì)量欠佳以及檔案中因不同地區(qū)語(yǔ)言及背景文化產(chǎn)生的差異等等,都容易產(chǎn)生非專業(yè)性、非標(biāo)準(zhǔn)化訓(xùn)練語(yǔ)料,導(dǎo)致生成輸出數(shù)據(jù)產(chǎn)生虛假、瑕疵信息和不專業(yè)信息。因此,需要加強(qiáng)檔案數(shù)據(jù)標(biāo)準(zhǔn)化和規(guī)范化建設(shè),構(gòu)建高質(zhì)量、專業(yè)性的訓(xùn)練數(shù)據(jù)集和生成內(nèi)容質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)。3.4基礎(chǔ)設(shè)施建設(shè)可行性生成式AI模型的實(shí)現(xiàn)需要強(qiáng)大的計(jì)算資源和存儲(chǔ)設(shè)備來(lái)支撐訓(xùn)練和推理過程,自建IDC數(shù)據(jù)中心等基礎(chǔ)設(shè)施的成本昂貴,對(duì)于檔案部門來(lái)說(shuō)是難以承受的。同時(shí),為保證模型的精度,參數(shù)訓(xùn)練量一般需達(dá)到百億、千億到萬(wàn)億級(jí)別,對(duì)文本和聲像檔案數(shù)據(jù)化的數(shù)據(jù)量和準(zhǔn)確度要求極高,檔案部門現(xiàn)有的電子檔案數(shù)據(jù)量難以滿足。為此,需進(jìn)一步加強(qiáng)檔案數(shù)據(jù)化建設(shè),合理選擇預(yù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論