文學(xué)大數(shù)據(jù)中心建設(shè)項目需求_第1頁
文學(xué)大數(shù)據(jù)中心建設(shè)項目需求_第2頁
文學(xué)大數(shù)據(jù)中心建設(shè)項目需求_第3頁
文學(xué)大數(shù)據(jù)中心建設(shè)項目需求_第4頁
文學(xué)大數(shù)據(jù)中心建設(shè)項目需求_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

文學(xué)大數(shù)據(jù)中心建設(shè)項目需求一、項目背景2024年文學(xué)大數(shù)據(jù)中心項目,主要聚焦以全國首個文學(xué)智能體的打造為抓手,全面推動新時代文學(xué)高質(zhì)量發(fā)展;落實省委宣傳部要求,率先打造全國紅色經(jīng)典文學(xué)數(shù)據(jù)庫,創(chuàng)新紅色經(jīng)典文學(xué)應(yīng)用和普及教育方式;在我國文學(xué)大數(shù)據(jù)應(yīng)用領(lǐng)域卡位爭先,保持領(lǐng)先優(yōu)勢,以數(shù)字化賦能,全面提升文學(xué)場館智能化水平,提供高質(zhì)量文學(xué)公共服務(wù),為廣大的文學(xué)愛好者提供更加豐富多彩和智能化的文學(xué)應(yīng)用。二、建設(shè)目標(biāo)文學(xué)大數(shù)據(jù)中心項目(一期)的建設(shè)目標(biāo)為以文學(xué)大數(shù)據(jù)和文學(xué)領(lǐng)域垂類大模型雙輪驅(qū)動為核心,從標(biāo)準體系、文學(xué)數(shù)據(jù)庫體系和文學(xué)智能應(yīng)用體系等方面的建設(shè)工作入手,打造全國首個文學(xué)智能體平臺,為新時代我國文學(xué)數(shù)字化建設(shè)確定標(biāo)準和規(guī)范,打造并不斷夯實文學(xué)數(shù)據(jù)庫,為眾多文學(xué)機構(gòu)提供智能化的平臺服務(wù),全面提升文學(xué)智能化水平,同時也為廣大的文學(xué)愛好者提供高質(zhì)量的文學(xué)公共服務(wù)。通過項目的建設(shè),為實踐“中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展”提供文學(xué)領(lǐng)域的樣本和示范。整體的建設(shè)內(nèi)容包括以下9個平臺和應(yīng)用子系統(tǒng):(1)標(biāo)準體系建設(shè):建設(shè)包含數(shù)據(jù)采集標(biāo)準、數(shù)據(jù)存儲標(biāo)準、數(shù)據(jù)分析標(biāo)準、數(shù)據(jù)應(yīng)用標(biāo)準、數(shù)據(jù)接口標(biāo)準在內(nèi)的完整標(biāo)準體系,為文學(xué)大數(shù)據(jù)中心的長遠發(fā)展奠定基礎(chǔ);(2)大數(shù)據(jù)中心基座平臺;(3)文學(xué)數(shù)據(jù)庫建設(shè);(4)文學(xué)大模型平臺;(5)文學(xué)智能體平臺;(6)全國文學(xué)場館綜合管理服務(wù)平臺(“館際通”);(7)文學(xué)公眾服務(wù)平臺;(8)我國文學(xué)地圖應(yīng)用平臺;(9)紅色關(guān)鍵詞數(shù)字化應(yīng)用。三、建設(shè)內(nèi)容文學(xué)大數(shù)據(jù)中心項目(一期)的建設(shè)內(nèi)容包含9大平臺子系統(tǒng)和應(yīng)用系統(tǒng),分別為標(biāo)準體系建設(shè)、大數(shù)據(jù)中心基座平臺、文學(xué)數(shù)據(jù)庫建設(shè)、文學(xué)大模型平臺、文學(xué)智能體平臺、全國文學(xué)場館綜合管理服務(wù)平臺、文學(xué)公眾服務(wù)平臺、我國文學(xué)地圖應(yīng)用平臺、紅色關(guān)鍵詞數(shù)字化應(yīng)用。1.標(biāo)準建設(shè)內(nèi)容包括數(shù)據(jù)采集標(biāo)準、數(shù)據(jù)存儲標(biāo)準、數(shù)據(jù)分析標(biāo)準、數(shù)據(jù)應(yīng)用標(biāo)準、數(shù)據(jù)接口標(biāo)準等五個方面。2.大數(shù)據(jù)中心基座平臺是整個項目的基座平臺,負責(zé)大數(shù)據(jù)中心中數(shù)據(jù)全生命周期和全方位的監(jiān)測管理,確保數(shù)據(jù)的可靠、可用、可觀、可感。該平臺基于政務(wù)云進行私有化部署,提供智能媒資數(shù)據(jù)系統(tǒng)、知識圖譜數(shù)據(jù)系統(tǒng)、數(shù)據(jù)智能采集系統(tǒng)、數(shù)據(jù)治理和開發(fā)系統(tǒng)、數(shù)據(jù)安全監(jiān)測系統(tǒng)、數(shù)據(jù)應(yīng)用服務(wù)接口、多租戶用戶權(quán)限系統(tǒng)、監(jiān)控運維系統(tǒng)、多實例容災(zāi)備份等基礎(chǔ)功能。大數(shù)據(jù)中心基座平臺提供綜合數(shù)據(jù)大屏展示系統(tǒng)中的所有數(shù)據(jù)和應(yīng)用信息。3.文學(xué)數(shù)據(jù)庫建設(shè)的內(nèi)容包括建設(shè)6個數(shù)據(jù)庫:全國基礎(chǔ)文學(xué)數(shù)據(jù)庫、紅色經(jīng)典文學(xué)數(shù)據(jù)庫、文學(xué)金句數(shù)據(jù)庫、“正在發(fā)生的文學(xué)”數(shù)據(jù)庫、館際通業(yè)務(wù)數(shù)據(jù)庫、用戶行為數(shù)據(jù)庫等的建設(shè),以及針對這6個數(shù)據(jù)庫的內(nèi)容進行數(shù)據(jù)體系的編目設(shè)定和標(biāo)簽體系構(gòu)建,并對數(shù)據(jù)進行智能標(biāo)引處理,以及構(gòu)建完整的文學(xué)知識圖譜。構(gòu)建數(shù)據(jù)庫管理系統(tǒng)對這些數(shù)據(jù)進行查詢、檢索和管理,構(gòu)建文學(xué)數(shù)據(jù)挖掘分析系統(tǒng)針對文學(xué)數(shù)據(jù)進行深度分析,含圖片和視頻數(shù)據(jù)的分析、文學(xué)數(shù)據(jù)的知識圖譜分析和基于大模型的深度數(shù)據(jù)分析。文學(xué)數(shù)據(jù)庫內(nèi)容建設(shè)是大數(shù)據(jù)中心項目雙輪驅(qū)動的核心引擎之一,為整個項目的各類上層應(yīng)用提供數(shù)據(jù)能力的支撐,也為文學(xué)領(lǐng)域大模型的訓(xùn)練提供了專業(yè)專屬的文學(xué)數(shù)據(jù),使得文學(xué)大模型具有特定的優(yōu)勢。4.文學(xué)大模型平臺是本項目雙輪驅(qū)動的另外一個核心引擎,提供了平臺所需要的核心AI智能能力。通過定制化訓(xùn)練文學(xué)領(lǐng)域大模型,使得大模型具備更專業(yè)的文學(xué)數(shù)據(jù)和知識,更好理解和處理文學(xué)場景的任務(wù),從而超越通用大模型針對文學(xué)數(shù)據(jù)處理分析和問答對話能力。本項目基于定制化訓(xùn)練的文學(xué)領(lǐng)域垂類大模型和多模態(tài)的AI算法,構(gòu)建了為大數(shù)據(jù)中心的深度智能集群。5.文學(xué)智能體平臺深度融合文學(xué)數(shù)據(jù)庫的內(nèi)容和文學(xué)領(lǐng)域垂類大模型的智能能力,結(jié)合用戶在業(yè)務(wù)和應(yīng)用場景上的創(chuàng)意能力,支持用戶構(gòu)建形態(tài)和功能各異的智能體并進行評測、維護和優(yōu)化,服務(wù)于文學(xué)館各類應(yīng)用場景中的知識問答、任務(wù)處理、和流程自動化?;谖膶W(xué)智能體平臺打造一個專屬智能體——AI文學(xué)官,具有靈巧可愛的形象、豐富的文學(xué)知識、專業(yè)的文學(xué)技能,為文學(xué)館的游客接待、文學(xué)館的管理運營以及文學(xué)館機構(gòu)的內(nèi)容生產(chǎn)提供智能化的服務(wù)。6.全國文學(xué)場館綜合管理服務(wù)平臺是文學(xué)大數(shù)據(jù)中心打造的,以服務(wù)全國文學(xué)類場館為宗旨的綜合性、公益性管理服務(wù)平臺。該平臺使用數(shù)據(jù)集成化、功能模塊化的建設(shè)方案,資源聯(lián)通、權(quán)限分級的建設(shè)理念,通過統(tǒng)一的資源接入、管理和使用標(biāo)準,實現(xiàn)數(shù)據(jù)和數(shù)字化應(yīng)用等資源的所有權(quán)和使用權(quán)分離,建設(shè)文學(xué)數(shù)據(jù)和文學(xué)類數(shù)字化應(yīng)用互通共享的基礎(chǔ)服務(wù)平臺,AIGC工具集、資源共享中心、展項開發(fā)系統(tǒng)、展項應(yīng)用管理、臨展設(shè)計系統(tǒng)等功能模塊,為全國文學(xué)類場館提升數(shù)字化水平、推進公共服務(wù)水平提供平臺支持。7.文學(xué)公眾服務(wù)平臺是文學(xué)大數(shù)據(jù)中心面向社會公眾和文化機構(gòu)提供服務(wù)的綜合窗口,通過構(gòu)建一個集文學(xué)資源匯聚、文化傳播、知識教育及文化創(chuàng)新于一體的公眾服務(wù)平臺,以小程序為載體,面向廣大市民游客及文學(xué)愛好者,打破時空限制,讓文學(xué)之美觸手可及。8.我國文學(xué)地圖應(yīng)用平臺,以文學(xué)數(shù)據(jù)庫中的“全國基礎(chǔ)文學(xué)數(shù)據(jù)”、“紅色文學(xué)數(shù)據(jù)”、“文學(xué)金句”以及“正在發(fā)生的文學(xué)”等數(shù)據(jù)為基礎(chǔ),全方面展示建設(shè)成果。以我國地圖為基礎(chǔ),全面展示全國范圍內(nèi)的重要文學(xué)地標(biāo)、文學(xué)活動、文學(xué)作品、文學(xué)應(yīng)用、多館聯(lián)盟臨展,并通過綜合考慮各種指標(biāo)形成全國各地的文學(xué)熱力值分布,一屏總覽當(dāng)下的文學(xué)態(tài)勢。9.紅色關(guān)鍵詞數(shù)字化應(yīng)用:以“犧牲、母親、選擇、信仰、愛情、故鄉(xiāng)、青春”等7個關(guān)鍵詞為中心,根據(jù)紅色文學(xué)數(shù)據(jù)庫相關(guān)數(shù)據(jù)進行深度分析,對分析結(jié)果進行梳理,串聯(lián)起作家、作品、紅色文學(xué)地標(biāo)和作品背后的故事,構(gòu)建視角獨特、形式新穎、生動活潑的文學(xué)知識圖譜,并通過新穎的可視化應(yīng)用和數(shù)字化互動應(yīng)用,結(jié)合影像、實物展示等,將紅色文學(xué)作品的深刻內(nèi)涵傳遞給觀眾,形成與觀眾的有效互動,激發(fā)觀眾情感的共鳴。9大平臺子系統(tǒng)和應(yīng)用系統(tǒng)的功能模塊如下表所示:序號平臺名稱平臺子系統(tǒng)一標(biāo)準體系建設(shè)數(shù)據(jù)采集標(biāo)準數(shù)據(jù)存儲標(biāo)準數(shù)據(jù)分析標(biāo)準數(shù)據(jù)應(yīng)用標(biāo)準數(shù)據(jù)接口標(biāo)準二大數(shù)據(jù)中心平臺基座智能媒資數(shù)據(jù)系統(tǒng)知識圖譜數(shù)據(jù)系統(tǒng)數(shù)據(jù)智能采集系統(tǒng)數(shù)據(jù)治理和開發(fā)系統(tǒng)數(shù)據(jù)安全監(jiān)測系統(tǒng)數(shù)據(jù)應(yīng)用服務(wù)接口多租戶用戶權(quán)限系統(tǒng)監(jiān)控運維系統(tǒng)多實例容災(zāi)備份數(shù)據(jù)大屏三文學(xué)數(shù)據(jù)庫建設(shè)全國基礎(chǔ)文學(xué)數(shù)據(jù)庫紅色經(jīng)典文學(xué)數(shù)據(jù)庫文學(xué)金句數(shù)據(jù)庫“正在發(fā)生的文學(xué)”數(shù)據(jù)庫館際通業(yè)務(wù)數(shù)據(jù)庫用戶行為數(shù)據(jù)庫文學(xué)數(shù)據(jù)庫管理和分析系統(tǒng)四文學(xué)大模型平臺文學(xué)領(lǐng)域大模型服務(wù)大模型訓(xùn)練調(diào)優(yōu)平臺五文學(xué)智能體平臺文學(xué)智能體生產(chǎn)平臺AI文學(xué)官六全國文學(xué)場館綜合管理服務(wù)平臺(館際通)基礎(chǔ)服務(wù)資源共享中心文學(xué)數(shù)據(jù)管理數(shù)字化展項開發(fā)系統(tǒng)數(shù)字化臨展設(shè)計開發(fā)AIGC工具集展項應(yīng)用管理日志數(shù)據(jù)統(tǒng)計七文學(xué)公眾服務(wù)平臺文學(xué)探索文學(xué)游線文韻解碼文庫檢索資訊公告八我國文學(xué)地圖平臺我國文學(xué)地圖(駕駛艙)文學(xué)熱力值文學(xué)地圖管理后臺AI文學(xué)官集成九紅色關(guān)鍵詞展陳應(yīng)用7個關(guān)鍵詞大數(shù)據(jù)分析及可視化利用新技術(shù)設(shè)計落地的互動體驗應(yīng)用AI文學(xué)官集成(一)標(biāo)準體系建設(shè)2024年先行開展團體標(biāo)準制定和申報。標(biāo)準建設(shè)內(nèi)容包括數(shù)據(jù)采集標(biāo)準、數(shù)據(jù)存儲標(biāo)準、數(shù)據(jù)分析標(biāo)準、數(shù)據(jù)應(yīng)用標(biāo)準、數(shù)據(jù)接口標(biāo)準等五個方面。中標(biāo)單位要結(jié)合項目建設(shè)具體情況,完成標(biāo)準起草、論證、修改等系列工作,并要求將系列標(biāo)準提交我國作協(xié)主管的具有團體標(biāo)準發(fā)布資格的社會團體,完成團體標(biāo)準發(fā)布。(二)大數(shù)據(jù)中心平臺基座大數(shù)據(jù)中心平臺基座是整個項目的基座平臺,負責(zé)大數(shù)據(jù)中心中數(shù)據(jù)全生命周期和全方位的監(jiān)測管理,確保數(shù)據(jù)的可靠、可用、可觀、可感。該平臺基于政務(wù)云進行私有化部署,按需分類存入本次建立的全國基礎(chǔ)文學(xué)數(shù)據(jù)庫、紅色經(jīng)典文學(xué)數(shù)據(jù)庫、“正在發(fā)生的文學(xué)”數(shù)據(jù)庫及文學(xué)金句數(shù)據(jù)庫等對應(yīng)數(shù)據(jù)庫內(nèi)并形成文學(xué)數(shù)據(jù)池,并與多地文學(xué)館及多類型文化體驗終端打通、互動展示,通過快速建立靈活、高效、開放的數(shù)據(jù)分析方案,探索文學(xué)數(shù)據(jù)價值,實現(xiàn)文學(xué)數(shù)據(jù)高效利用、供求雙方智能化匹配、存量資源激活,最終建成標(biāo)準、開放、安全的文學(xué)大數(shù)據(jù)中心平臺。通過構(gòu)建多模態(tài)的文學(xué)大數(shù)據(jù)中心平臺,強化對各類文學(xué)數(shù)據(jù)的采集、分析和利用,為文學(xué)數(shù)字化應(yīng)用提供基礎(chǔ)支撐。1.核心功能文學(xué)大數(shù)據(jù)中心平臺核心功能應(yīng)包含多實例集群管理,數(shù)據(jù)源、數(shù)據(jù)集成、數(shù)據(jù)治理、數(shù)據(jù)應(yīng)用以及底層的大數(shù)據(jù)平臺支撐層,涉及標(biāo)準規(guī)劃定義、數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)計算、數(shù)據(jù)開發(fā)、數(shù)據(jù)挖掘、數(shù)據(jù)服務(wù)、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)質(zhì)量等功能。同時,要建立高標(biāo)準、高等級、規(guī)范化的安全防護體系。2.建設(shè)內(nèi)容功能系統(tǒng)功能模塊模塊說明數(shù)據(jù)智能采集系統(tǒng)數(shù)據(jù)匯聚1、支持批量采集、離線采集、實時采集;2、支持excel數(shù)據(jù)采集導(dǎo)入;3、支持DB數(shù)據(jù)庫采集導(dǎo)入;4、支持SQL語句采集導(dǎo)入;5、支持通過數(shù)據(jù)API導(dǎo)入;6、支持文本、doc、pdf、圖片、視頻和3D模型等非結(jié)構(gòu)化數(shù)據(jù)的導(dǎo)入;7、支持可視化配置方式進行數(shù)據(jù)采集;數(shù)據(jù)采集支持對接主流文學(xué)期刊目錄、文學(xué)圖書出版平臺,實現(xiàn)文學(xué)作品數(shù)據(jù)的采集;支持網(wǎng)絡(luò)抓取采集我國作家網(wǎng)和全國各省作協(xié)主辦的文學(xué)網(wǎng)站的文學(xué)活動、作品期刊發(fā)表、文學(xué)圖書、文學(xué)獎項、改變影視等數(shù)據(jù)內(nèi)容;支持網(wǎng)絡(luò)采集抖音、B站、小紅書、微博、微信、豆瓣等主流社交媒體平臺上文學(xué)活動、作品期刊發(fā)表、文學(xué)圖書、文學(xué)社交、媒體傳播、文學(xué)作品出海、文學(xué)獎項、改編影視等數(shù)據(jù);數(shù)據(jù)治理和開發(fā)系統(tǒng)數(shù)據(jù)建模展示數(shù)據(jù)相關(guān)統(tǒng)計指標(biāo),包括數(shù)據(jù)標(biāo)準、數(shù)據(jù)模型等相關(guān)統(tǒng)計;支持根據(jù)業(yè)務(wù)屬性、行業(yè)數(shù)據(jù)、數(shù)據(jù)屬性進行主題劃分,創(chuàng)建主題域;根據(jù)行業(yè)規(guī)范創(chuàng)建統(tǒng)一數(shù)據(jù)標(biāo)準并用于后續(xù)建表過程表結(jié)構(gòu)的創(chuàng)建、規(guī)范數(shù)據(jù)庫體系;支持原子指標(biāo)、時間周期、派生指標(biāo)、復(fù)合指標(biāo)設(shè)計;基于指標(biāo)進行數(shù)據(jù)的分析統(tǒng)計計算,支持以插件方式擴展用戶自定義指標(biāo);基于分層建模理論,支持STG、ODS、DWD、DWS、ADS層建模;支持可視化建模;支持規(guī)則配置、標(biāo)簽設(shè)置、字段映射、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)清洗等;支持ODS、DWS、DWS、ADS層模型、熱數(shù)據(jù)注冊編排調(diào)度;元數(shù)據(jù)管理元數(shù)據(jù)管理需支持對數(shù)據(jù)倉庫元數(shù)據(jù)的全面管理,功能至少包括元數(shù)據(jù)采集、元數(shù)據(jù)解析、元數(shù)據(jù)存儲、元數(shù)據(jù)管理、元數(shù)據(jù)查詢、元數(shù)據(jù)服務(wù)接口等;支持可視化配置的方式采集元數(shù)據(jù);提供元數(shù)據(jù)存儲模塊,支持定制功能,支持自定義開發(fā)元數(shù)據(jù)功能;支持數(shù)據(jù)字典的管理和查看;支持對采集到的元數(shù)據(jù)進行查看和管理;提供元數(shù)據(jù)查詢模塊,需至少支持對數(shù)據(jù)表的血緣和影響分析;元數(shù)據(jù)管理,需具有良好的擴展性,支持針對數(shù)據(jù)倉庫中數(shù)據(jù)的現(xiàn)狀,不斷進行迭代更新,各數(shù)據(jù)表的元數(shù)據(jù)定義需支持自動化采集;數(shù)據(jù)資產(chǎn)提供數(shù)據(jù)資產(chǎn)的首頁,面向業(yè)務(wù)應(yīng)用人員,支持資產(chǎn)信息的快速查詢;支持對平臺內(nèi)發(fā)布的表資產(chǎn)的查詢、申請、查看和收藏等;支持對平臺內(nèi)指標(biāo)資產(chǎn)的查詢、申請、查看和收藏等;支持根據(jù)數(shù)據(jù)分類查詢搜索平臺內(nèi)可進行注冊發(fā)布為資產(chǎn)的數(shù)據(jù)、指標(biāo)等;支持平臺內(nèi)的數(shù)據(jù)資產(chǎn)狀況進行全景式呈現(xiàn);數(shù)據(jù)開發(fā)1、支持數(shù)據(jù)的離線開發(fā);支持通過SQL語句進行復(fù)雜業(yè)務(wù)的數(shù)據(jù)治理;2、支持對數(shù)據(jù)模型中的數(shù)據(jù)進行查詢,包括表結(jié)構(gòu)、表詳情等;3、支持上傳jar包,用戶可以通過自定義資源進行函數(shù)開發(fā);4、支持對數(shù)據(jù)庫中的視圖進行解析;支持根據(jù)解析結(jié)果進行建模;數(shù)據(jù)安全監(jiān)測系統(tǒng)數(shù)據(jù)權(quán)限支持對數(shù)據(jù)進行權(quán)限管理;支持創(chuàng)建數(shù)據(jù)的管理策略;支持數(shù)據(jù)字段級別權(quán)限控制配置和管理;支持為不同角色和賬號授予不同的數(shù)據(jù)權(quán)限;數(shù)據(jù)分級支持數(shù)據(jù)安全分級分類管理;支持標(biāo)準化數(shù)據(jù)分級分類的自定義;數(shù)據(jù)脫敏支持數(shù)據(jù)脫敏策略配置;支持掩碼、截斷、MD5等多種脫敏加密方式;數(shù)據(jù)傳輸支持安全的數(shù)據(jù)傳輸協(xié)議;支持數(shù)據(jù)訪問的認證鑒權(quán);數(shù)據(jù)審計支持對數(shù)據(jù)訪問的審計日志記錄;支持對數(shù)據(jù)訪問的審計日志監(jiān)控和告警;數(shù)據(jù)監(jiān)測支持對數(shù)據(jù)的可訪問性進行實時檢測;支持對數(shù)據(jù)的存儲完整性進行實時抽樣檢測;支持對數(shù)據(jù)采集的狀態(tài)進行實時檢測;數(shù)據(jù)應(yīng)用服務(wù)接口數(shù)據(jù)訪問接口1、支持針對不同類型的數(shù)據(jù)提供標(biāo)準開放的訪問API;2、支持數(shù)據(jù)API訪問的安全和配額機制;3、支持數(shù)據(jù)API接口配置告警規(guī)則并進行監(jiān)控;4、支持數(shù)據(jù)訪問時對部分字段進行脫敏處理;多租戶權(quán)限系統(tǒng)租戶管理支持租戶的創(chuàng)建和信息編輯、查看;支持租戶的功能權(quán)限和資源的開通和配置;支持租戶下用戶賬號的管理和角色的管理;支持租戶下管理員的創(chuàng)建和設(shè)置;用戶管理支持用戶賬號的創(chuàng)建、編輯、密碼設(shè)置、登錄和登出;支持用戶身份認證體系;支持用戶和角色的關(guān)聯(lián);角色管理支持角色的創(chuàng)建和管理;支持角色的權(quán)限策略配置管理;支持權(quán)限的繼承和維護機制;支持用戶和角色的綁定;支持角色權(quán)限的動態(tài)調(diào)整;訪問權(quán)限體系支持基于角色的訪問權(quán)限控制;支持細粒度權(quán)限點的管理和設(shè)置,權(quán)限和功能的組合配置;支持角色和權(quán)限的綁定和解綁;權(quán)限驗證支持對用戶、角色的訪問權(quán)限進行驗證,是否符合訪問權(quán)限策略的配置;監(jiān)控運維系統(tǒng)數(shù)據(jù)總覽匯總并展示數(shù)據(jù)采集、匯聚和集成的統(tǒng)計;匯總各類數(shù)據(jù)總量和增量情況的統(tǒng)計;任務(wù)監(jiān)控匯總實時、離線的數(shù)據(jù)采集的任務(wù);匯總實時、離線的數(shù)據(jù)開發(fā)的任務(wù);匯總實時、離線的數(shù)據(jù)安全監(jiān)測任務(wù);數(shù)據(jù)訪問監(jiān)控匯總大數(shù)據(jù)中心各類數(shù)據(jù)訪問的統(tǒng)計情況;匯總大數(shù)據(jù)中心各類數(shù)據(jù)訪問性能的統(tǒng)計情況;多實例容災(zāi)備份容災(zāi)備份提供容器化微服務(wù)部署,支持不同微服務(wù)服務(wù)的多實例部署;支持服務(wù)的實時切換,保障服務(wù)的高可靠;數(shù)據(jù)大屏駕駛艙平臺駕駛艙支持將大數(shù)據(jù)中心中的所有資源、數(shù)據(jù)、任務(wù)、應(yīng)用、用戶、日志等內(nèi)容進行綜合的統(tǒng)計分析和展示。以簡易直觀的可視化形式進行呈現(xiàn),真正實現(xiàn)一屏掌控全局;智能媒資系統(tǒng)門戶首頁提供熱門媒資、熱門檢索、精選分類和推薦專題等內(nèi)容;媒資上傳支持多渠道的媒資文件上傳;媒資管理支持媒資的存儲、編輯、AI算法分析、內(nèi)容的詳情;媒資詳情查看媒資數(shù)據(jù)的詳情,媒資的相關(guān)AI算法分析結(jié)果;智能檢索提供多模態(tài)的數(shù)據(jù)檢索,提供AI語義檢索;知識圖譜系統(tǒng)數(shù)據(jù)總覽提供實體關(guān)系和文本資料書籍等數(shù)據(jù)的總覽呈現(xiàn),支持全局的數(shù)據(jù)檢索;數(shù)據(jù)管理提供知識圖譜實體關(guān)系、資料書籍、媒資素材等類型數(shù)據(jù)的存儲和管理;分析挖掘提供基于大模型和AI能力的知識圖譜數(shù)據(jù)挖掘;智能生產(chǎn)提供基于知識圖譜數(shù)據(jù)的數(shù)據(jù)可視化智能生產(chǎn);3.系統(tǒng)能力要求在完成上述內(nèi)容建設(shè)中,要注重中臺的集成性、系統(tǒng)性,注重整合各塊功能,形成系統(tǒng)能力,提供提供智能媒資數(shù)據(jù)系統(tǒng)、知識圖譜數(shù)據(jù)系統(tǒng)、數(shù)據(jù)智能采集系統(tǒng)、數(shù)據(jù)治理和開發(fā)系統(tǒng)、數(shù)據(jù)安全監(jiān)測系統(tǒng)、數(shù)據(jù)應(yīng)用服務(wù)接口、多租戶用戶權(quán)限系統(tǒng)、監(jiān)控運維系統(tǒng)、多實例容災(zāi)備份等功能。(1)數(shù)據(jù)智能采集系統(tǒng)數(shù)據(jù)智能采集系統(tǒng)旨在從多種數(shù)據(jù)源中高效地收集、整合和匯聚文學(xué)相關(guān)數(shù)據(jù),以便為后續(xù)的數(shù)據(jù)處理分析和應(yīng)用提供高質(zhì)量的數(shù)據(jù)支持。(2)數(shù)據(jù)治理和開發(fā)系統(tǒng)通過一系列的過程、技術(shù)和工具來管理組織內(nèi)部的數(shù)據(jù)資產(chǎn),并確保數(shù)據(jù)的質(zhì)量、可用性、安全性以及合規(guī)性,同時支持數(shù)據(jù)的開發(fā)和應(yīng)用。通過系統(tǒng)確保數(shù)據(jù)準確性、完整性,通過實時監(jiān)控與改進提升數(shù)據(jù)質(zhì)量。(3)數(shù)據(jù)應(yīng)用服務(wù)接口數(shù)據(jù)應(yīng)用服務(wù)接口是大數(shù)據(jù)中心平臺對外提供數(shù)據(jù)服務(wù)和功能訪問的橋梁,旨在通過標(biāo)準化的接口,為各類應(yīng)用、系統(tǒng)和用戶提供高效、可靠、安全的數(shù)據(jù)訪問和操作能力。通過相關(guān)的數(shù)據(jù)應(yīng)用服務(wù)接口的建設(shè),確保大數(shù)據(jù)中心平臺能夠高效、可靠、安全地為各類應(yīng)用和用戶提供數(shù)據(jù)服務(wù),滿足各種復(fù)雜數(shù)據(jù)應(yīng)用場景的需求。(4)數(shù)據(jù)安全監(jiān)測系統(tǒng)實時監(jiān)控數(shù)據(jù)采集、訪問、存儲及計算全過程的狀態(tài)與性能,包括數(shù)據(jù)源穩(wěn)定性、訪問完整性、存儲容量及類型、計算任務(wù)效率等,并即時告警潛在異常,確保數(shù)據(jù)全生命周期的安全與合規(guī)。通過數(shù)據(jù)安全監(jiān)測系統(tǒng),確保大數(shù)據(jù)中心基座平臺整體運行的安全性和可靠性,為后續(xù)的擴展打好基礎(chǔ)。(5)智能媒資數(shù)據(jù)系統(tǒng)智能媒資數(shù)據(jù)系統(tǒng)是大數(shù)據(jù)中心平臺基座的重要組成部分,主要負責(zé)多媒體資源(如圖片、音頻、視頻等)的高效管理、處理和應(yīng)用。該系統(tǒng)通過智能化的技術(shù)手段,實現(xiàn)多媒體資源的全生命周期管理,提升多媒體資源的使用價值和應(yīng)用效果。通過智能媒資數(shù)據(jù)系統(tǒng)的建設(shè),實現(xiàn)大數(shù)據(jù)中心平臺中多媒體資源的高效管理、智能處理和深度應(yīng)用,提升媒資數(shù)據(jù)的使用價值,滿足各種復(fù)雜的媒資應(yīng)用需求。(6)知識圖譜數(shù)據(jù)系統(tǒng)知識圖譜數(shù)據(jù)系統(tǒng)是大數(shù)據(jù)中心平臺基座的核心模塊之一,旨在通過結(jié)構(gòu)化的知識表示和智能化的知識推理,實現(xiàn)文學(xué)相關(guān)知識的高效管理和深度應(yīng)用。該系統(tǒng)利用知識圖譜技術(shù),對多源異構(gòu)數(shù)據(jù)進行語義關(guān)聯(lián)和整合,為文學(xué)大數(shù)據(jù)中心提供智能檢索、智能問答、知識推薦等多種應(yīng)用服務(wù)。通過知識圖譜數(shù)據(jù)系統(tǒng)的建設(shè),實現(xiàn)大數(shù)據(jù)中心平臺中多源異構(gòu)數(shù)據(jù)的語義關(guān)聯(lián)和智能化應(yīng)用,提升數(shù)據(jù)的使用價值和應(yīng)用效果,滿足文學(xué)大數(shù)據(jù)中心項目中復(fù)雜的知識管理和應(yīng)用需求。(7)多租戶用戶權(quán)限系統(tǒng)集用戶角色管理、訪問權(quán)限控制、數(shù)據(jù)訪問控制、操作審計及策略管理于一體。系統(tǒng)支持用戶賬號的全生命周期管理、靈活的角色配置與權(quán)限綁定,實現(xiàn)基于角色的細粒度權(quán)限控制。通過多租戶用戶權(quán)限系統(tǒng),滿足不同租戶用戶的安全和運營需求。(8)監(jiān)控運維系統(tǒng)監(jiān)控運維系統(tǒng)旨在確保大數(shù)據(jù)中心平臺的高可用性和穩(wěn)定性,通過實時監(jiān)控、故障預(yù)警、性能優(yōu)化等措施,對平臺的運行狀態(tài)進行全面的管理和維護。通過監(jiān)控運維系統(tǒng)的建設(shè),確保大數(shù)據(jù)中心平臺能夠穩(wěn)定、高效、安全地運行,為平臺的持續(xù)優(yōu)化和改進提供有力支持。(9)多實例容災(zāi)備份支持上述不同系統(tǒng)的多實例容災(zāi)備份,確保系統(tǒng)的可靠性、穩(wěn)定性和可用性。支持多實體的部署和服務(wù)切換,實現(xiàn)數(shù)據(jù)、任務(wù)、服務(wù)等相關(guān)系統(tǒng)的穩(wěn)定性。(10)平臺綜合駕駛艙支持將大數(shù)據(jù)中心中的所有資源、數(shù)據(jù)、任務(wù)、應(yīng)用、用戶、日志等內(nèi)容進行綜合的統(tǒng)計分析和展示。以簡易直觀的可視化形式進行呈現(xiàn),真正實現(xiàn)一屏掌控全局。4.非功能性要求(1)數(shù)據(jù)中心平臺,應(yīng)結(jié)合第三項的數(shù)據(jù)庫建設(shè),建立統(tǒng)一的文學(xué)數(shù)據(jù)輸入(采集)和輸出(多地文學(xué)館打通)標(biāo)準。(2)數(shù)據(jù)中心平臺,應(yīng)具備數(shù)據(jù)接入、發(fā)布、輸出的數(shù)據(jù)審批流機制,可根據(jù)不同文學(xué)館、不同文學(xué)著作類別、不同的平臺入住申請、不同內(nèi)容審核資質(zhì)、建立不同的數(shù)據(jù)審批流程。(3)數(shù)據(jù)中心平臺,應(yīng)提供對于文學(xué)數(shù)據(jù)分級別進行數(shù)據(jù)標(biāo)注的功能和機制,從而更好的為文學(xué)多模態(tài)大語言模型的數(shù)據(jù)訓(xùn)練提供服務(wù)。(4)數(shù)據(jù)中心平臺,應(yīng)監(jiān)測各個應(yīng)用對于數(shù)據(jù)中心數(shù)據(jù)使用情況,包括但部限于數(shù)據(jù)展示情況,數(shù)據(jù)交互情況,數(shù)據(jù)下載和收藏情況等。5.性能要求文學(xué)大數(shù)據(jù)中心整體性能應(yīng)滿足如下要求:(1)整體系統(tǒng)針對非結(jié)構(gòu)化大文本文件(每個文件大于100MB)的并發(fā)導(dǎo)入速率不低于100M/S;(2)整體系統(tǒng)針對非結(jié)構(gòu)化小文本文件(每個文件小于10KB)的并發(fā)上傳速率不低于20M/S,文件平均下載速率不低于50M/S;(3)核心服務(wù)接口支持100并發(fā),且接口平均響應(yīng)時間小于0.2秒;(4)核心服務(wù)接口支持100并發(fā),且失敗用戶為0;(5)各類服務(wù)接口總ops不小于500。6.硬件參數(shù)(1)數(shù)據(jù)大屏的硬件參數(shù):多媒體主機:1)4u工控機箱;2)CPU:I710700同等性能及以上;3)內(nèi)存:≥16GDDR4;4)硬盤:≥128GSSD;5)顯卡:RTXA4000同等性能及以上;6)功能支持:定時開關(guān)機,上電自啟動,遠程喚醒;LED屏體:1)凈顯示尺寸:10.24*2.88m備用10塊模組,約0.5平方;2)像素點間距≤1.536,模組尺寸320mm*160mm;3)單元最大亮度≥700cd/m2;4)刷新率≥3840Hz;5)亮度均勻性≥98%;6)色度均勻性±0.003之內(nèi);7)對比度≥6000:1;8)灰度等級:≥16Bit;9)峰值功耗≤700W/㎡,平均功耗≤300W/㎡。鋼結(jié)構(gòu)及不銹鋼包邊;接受系統(tǒng);視頻處理器;配電柜;合并式功放;吸頂音響(6寸音響);性能參數(shù):額定功率:60W、低頻:1x6.5"、高頻:1x1"、頻率響應(yīng):80Hz~20kHz(-3dB)、覆蓋范圍:90°Hx90°V、額定阻抗8?;(2)AI導(dǎo)覽定位藍牙信標(biāo)硬件參數(shù)供電:1200mAh*2鋰亞電池組;續(xù)航時間:3-5年;發(fā)射時間:100ms~10s可調(diào);尺寸:Φ47mm×27mm或更?。还ぷ鳒囟龋?20~70攝氏度;定時iBeacon廣播,結(jié)合位置坐標(biāo),形成定位環(huán)境;支持廣播間隔、發(fā)包頻率靈活配置;支持密碼保護,防篡改防蹭用;設(shè)備運行狀態(tài)自動上報;ROHS環(huán)保認證;SRRC無線電發(fā)射設(shè)備型號核準證。(3)機房中控的硬件參數(shù)機柜;電源時序器;智能開關(guān)控制模塊;中央控制處理器;運維主機;堡壘機;中控平板(性能參數(shù):內(nèi)存容量:≥128GB;分辨率:≥2000*1200;CPU核心數(shù):八核;屏幕尺寸:≥10英寸;運行內(nèi)存:≥6GB);線材及輔材;移動端控制軟件;桌面端控制軟件;(三)文學(xué)數(shù)據(jù)庫建設(shè)文學(xué)數(shù)據(jù)庫建設(shè)是文學(xué)的數(shù)據(jù)中心項目的基礎(chǔ)和核心,是“數(shù)據(jù)+大模型”雙輪驅(qū)動的其中一個引擎。豐富的文學(xué)數(shù)據(jù)庫內(nèi)容不僅為文學(xué)內(nèi)容生產(chǎn)者和文學(xué)愛好者提供了消費的內(nèi)容,也為文學(xué)大模型的訓(xùn)練提供了堅實的數(shù)據(jù)語料,同時為文學(xué)智能體的智能生產(chǎn)提供了數(shù)據(jù)資源。文學(xué)數(shù)據(jù)庫建設(shè)的內(nèi)容包括以下幾個方面。1.全國基礎(chǔ)文學(xué)數(shù)據(jù)庫建設(shè)完成全國重要文學(xué)地標(biāo)、文學(xué)類場館的數(shù)據(jù)采集,制作動態(tài)化、可視化、可互動的我國文學(xué)地圖。作為基礎(chǔ)性、支撐性數(shù)據(jù),在本年度搭建好框架,并逐年累積和拓展數(shù)據(jù)。數(shù)據(jù)內(nèi)容需要包含重要文學(xué)地標(biāo)、文學(xué)作品數(shù)據(jù)、作家數(shù)據(jù)等。2.紅色經(jīng)典文學(xué)數(shù)據(jù)庫建設(shè)一是掃描文學(xué)館指定的進步期刊,形成數(shù)據(jù)資產(chǎn);二是采集采買經(jīng)典文庫和經(jīng)典長篇小說等紅色主題經(jīng)典文學(xué)書籍。三是采集紅色經(jīng)典文學(xué)相關(guān)的圖片、影像、音頻、藝術(shù)品等。四是逐步采集紅色文學(xué)相關(guān)地標(biāo),與我國文學(xué)地圖聯(lián)通,構(gòu)建紅色經(jīng)典文學(xué)數(shù)據(jù)庫。3.文學(xué)金句數(shù)據(jù)庫以文學(xué)與生活為主題進行數(shù)據(jù)挖掘,將作家作品中相關(guān)的金句提煉出來,形成可視化展項。讓生活與作品中的“個體”形成共情。適用于各種場景包括AI文學(xué)官的應(yīng)用。4.“正在發(fā)生的文學(xué)”數(shù)據(jù)庫基于“全國基礎(chǔ)文學(xué)數(shù)據(jù)庫”,采集主流文學(xué)期刊目錄、文學(xué)圖書出版數(shù)據(jù)、文學(xué)活動數(shù)據(jù)、社交媒體“傳播力”數(shù)據(jù)等,構(gòu)建“正在發(fā)生的文學(xué)”數(shù)據(jù)庫。主要包含以下相關(guān)數(shù)據(jù):主流文學(xué)期刊目錄數(shù)據(jù)、文學(xué)圖書出版數(shù)據(jù)、文學(xué)活動數(shù)據(jù)、社交媒體“傳播力”數(shù)據(jù)等。5.“館際通”業(yè)務(wù)數(shù)據(jù)庫搭建“館際通”業(yè)務(wù)數(shù)據(jù)庫,對文學(xué)機構(gòu)對接平臺接入數(shù)據(jù)的機制進行規(guī)范,對該平臺接入進來的數(shù)據(jù)進行分類存儲和管理,包含文學(xué)機構(gòu)的介紹數(shù)據(jù)、文學(xué)機構(gòu)共享的文學(xué)數(shù)據(jù),平臺上的數(shù)字化應(yīng)用數(shù)據(jù)等。6.用戶行為數(shù)據(jù)庫建文學(xué)館聯(lián)盟的用戶行為數(shù)據(jù)庫,圍繞游客“參展前—參展中—參展后”整個參展路徑來獲取更多的用戶行為數(shù)據(jù),進而了解游客的興趣愛好和參展習(xí)慣,生成用戶畫像,挖掘游客意向需求,并依托于智能推薦算法,為游客提供精準化服務(wù),持續(xù)提高游客的參展體驗,增強游客粘性。7.文學(xué)數(shù)據(jù)庫管理和分析系統(tǒng)(1)數(shù)據(jù)管理文學(xué)數(shù)據(jù)庫管理系統(tǒng)提供全面瀏覽、檢索、編輯和探索分析文學(xué)數(shù)據(jù)庫內(nèi)容的工具系統(tǒng),是各類人員使用和維護文學(xué)數(shù)據(jù)庫內(nèi)容的入口。(2)文學(xué)數(shù)據(jù)編目和智能標(biāo)引構(gòu)建完整的文學(xué)數(shù)據(jù)內(nèi)容的分類編目和智能標(biāo)引體系,并將文學(xué)數(shù)據(jù)庫的內(nèi)容按照分類編目和智能標(biāo)引體系進行標(biāo)簽歸類,以便更好的檢索和管理文學(xué)數(shù)據(jù)庫的相關(guān)內(nèi)容。分類編目應(yīng)考慮文學(xué)的體裁和形式、地域、流派、主題、年代等方面的因素,編目體系中的編目項不少于100個。智能標(biāo)引下的標(biāo)簽體系需要圍繞各類文學(xué)相關(guān)實體的標(biāo)簽內(nèi)容,如作家、作品、事件、年代、文化、習(xí)俗等方面的內(nèi)容,智能標(biāo)引體系中包含的標(biāo)簽項不少于1000項。(3)圖片視頻媒資分析在文學(xué)數(shù)據(jù)庫中,圖片和視頻媒資作為重要組成部分,不僅豐富了文學(xué)內(nèi)容的展現(xiàn)形式,也提供了更直觀的理解途徑。圖片視頻媒資分析模塊旨在通過先進的圖像識別和視頻處理技術(shù),對這些多媒體內(nèi)容進行深入分析。這包括圖片、視頻的主題分類(將圖片或視頻歸類到特定的文學(xué)主題下)、智能化編目和標(biāo)簽處理,以及內(nèi)容摘要生成(自動生成圖片或視頻的內(nèi)容摘要,便于快速瀏覽)。此外,該模塊還支持對媒資素材的元數(shù)據(jù)管理,如時間、地點、作者等信息的錄入與檢索,以及基于這些信息的統(tǒng)計分析,幫助用戶更好地理解和利用這些媒資資源。(4)文本知識圖譜分析針對文學(xué)數(shù)據(jù)庫構(gòu)建的數(shù)據(jù)內(nèi)容進行知識圖譜的處理分析、內(nèi)容構(gòu)建以及校對審核,將文學(xué)數(shù)據(jù)庫中的作品、作家、地域、地標(biāo)、年代、獎項、藝術(shù)品等建立完整的知識圖譜關(guān)系網(wǎng)絡(luò),并針對文學(xué)作品的內(nèi)容構(gòu)建各自的知識圖譜。此項工作構(gòu)建的知識圖譜需要融入文學(xué)大數(shù)據(jù)中心項目的文學(xué)知識圖譜數(shù)據(jù)體系中。文學(xué)知識圖譜的構(gòu)建流程依賴文學(xué)領(lǐng)域大模型提供的各項能力。(5)數(shù)據(jù)分析數(shù)據(jù)分析模塊利用大模型的能力,以及深度學(xué)習(xí)、自然語言處理(NLP)等先進技術(shù),對文學(xué)數(shù)據(jù)庫中的海量數(shù)據(jù)進行深度挖掘和分析。該模塊可以針對文學(xué)作品中的內(nèi)容進行關(guān)鍵信息的抽取,并借此構(gòu)建知識圖譜、人物年表、大事記年表等,通過數(shù)據(jù)分析挖掘作品中人物的關(guān)系,事件的脈絡(luò),方便讀者閱讀,并加深對內(nèi)容的理解。數(shù)據(jù)分析的引入,極大地提升了文學(xué)數(shù)據(jù)處理的智能化水平和決策的科學(xué)性。(6)多模態(tài)AI語義檢索多模態(tài)AI語義檢索模塊實現(xiàn)了對文學(xué)數(shù)據(jù)庫中多模態(tài)數(shù)據(jù)(包括文本、圖片、視頻等)的高效檢索。該模塊通過融合多種模態(tài)的信息表示方法,將不同模態(tài)的數(shù)據(jù)映射到統(tǒng)一的語義空間中,使得用戶能夠使用自然語言查詢來檢索跨模態(tài)的信息。例如,用戶可以通過輸入“魯迅故居”,快速找到素材庫中相關(guān)的圖片和視頻資源。這種檢索方式不僅提高了檢索的準確性和效率,還極大地豐富了用戶的查詢體驗。(7)關(guān)鍵詞檢索分析關(guān)鍵詞檢索分析模塊是文學(xué)數(shù)據(jù)庫管理系統(tǒng)中的基礎(chǔ)且關(guān)鍵的功能之一。它支持用戶根據(jù)關(guān)鍵詞快速定位到相關(guān)的文學(xué)內(nèi)容,包括文本、圖片、視頻等多種數(shù)據(jù)類型。同時,該模塊還提供了關(guān)鍵詞詞頻統(tǒng)計、詞云分析等高級功能,幫助用戶發(fā)現(xiàn)文學(xué)內(nèi)容中的聯(lián)系和規(guī)律。通過這些檢索結(jié)果的可視化呈現(xiàn),用戶可以更深入地理解文學(xué)作品的內(nèi)涵和背景,以及文學(xué)領(lǐng)域的發(fā)展趨勢和熱點話題。(8)文學(xué)數(shù)據(jù)質(zhì)量監(jiān)測文學(xué)數(shù)據(jù)質(zhì)量監(jiān)測模塊是確保文學(xué)數(shù)據(jù)庫內(nèi)容準確性和可靠性的重要保障。該模塊通過自動化的數(shù)據(jù)清洗、校驗和評估流程,對文學(xué)數(shù)據(jù)庫中的數(shù)據(jù)進行全面的質(zhì)量監(jiān)控。它包括對文本內(nèi)容進行語法、重復(fù)性等維度的檢查,確保數(shù)據(jù)的準確性和權(quán)威性;同時,還通過對圖片、視頻等多媒體內(nèi)容的清晰度、版權(quán)合法性等方面的檢查,保障媒資素材的質(zhì)量,確保文學(xué)數(shù)據(jù)庫的持續(xù)穩(wěn)定運行。功能系統(tǒng)功能模塊模塊說明全國基礎(chǔ)文學(xué)數(shù)據(jù)庫建設(shè)全國重要文學(xué)地標(biāo)采集和梳理全國范圍內(nèi)的重要文學(xué)地標(biāo)數(shù)據(jù)并錄入對應(yīng)數(shù)據(jù)庫中,文學(xué)地標(biāo)數(shù)據(jù)應(yīng)體現(xiàn)我國文學(xué)的深厚底蘊和豐富多樣性。按照不同的地標(biāo)類型進行采集整理,包括但不僅限以下數(shù)據(jù):1.文學(xué)人物相關(guān)地標(biāo)(如作家故居、作家紀念館等);2.文學(xué)流派或者社團相關(guān)地標(biāo)(如陳列館、紀念館等);3.文學(xué)歷史地標(biāo)(如書院、學(xué)堂等);4.文學(xué)景觀地標(biāo)(如文學(xué)作品中的地點、文學(xué)主題公園或景區(qū)等);5.以及全國各地的綜合性文學(xué)院館。整體數(shù)量不少于1000個,原則上每個省不少于30個。具體內(nèi)容包括:類型、簡介、地址、位置坐標(biāo),地標(biāo)圖片、相關(guān)文學(xué)人物和文學(xué)作品。文學(xué)作品數(shù)據(jù)采集各類文學(xué)作品數(shù)據(jù),包括小說、詩歌、散文、戲劇、傳記、兒童文學(xué)等多種文學(xué)體裁的作品,這些作品可能覆蓋從古至今、不同國家和地區(qū)的重要文學(xué)作品。包含的字段信息如作品詳細信息:如作者、出版年份、出版社、ISBN號、文學(xué)流派、風(fēng)格特點、作品簡介、內(nèi)容摘要等。公版圖書全文電子版不少于5000冊。作家數(shù)據(jù)采集整理我國文學(xué)歷史長河中相關(guān)作家基本信息,作家數(shù)量不少于500位,需要包含作家生平與傳記、作家作品等。作家的姓名、生卒年月、國籍、代表作品、創(chuàng)作風(fēng)格、作家的生平事跡、成長經(jīng)歷、創(chuàng)作歷程、作品信息等。正在發(fā)生的文學(xué)數(shù)據(jù)庫文學(xué)圖書出版數(shù)據(jù)采集和梳理項目上線時間點以后的全國文學(xué)圖書出版和榜單數(shù)據(jù)并錄入對應(yīng)的數(shù)據(jù)庫,包括圖書的名稱、作者、出版時間、出版機構(gòu)等字段。采集主流的文學(xué)圖書暢銷書排行榜單數(shù)據(jù)并錄入對應(yīng)的數(shù)據(jù)庫,每期榜單中的圖書數(shù)量不少于30個,包括圖書的名稱、作者、出版時間、出版機構(gòu)等字段。主流文學(xué)期刊目錄主流文學(xué)期刊在文學(xué)領(lǐng)域占據(jù)舉足輕重的地位,它們不僅代表了當(dāng)前文學(xué)創(chuàng)作的最高水平,也是推動文學(xué)發(fā)展的重要力量。參照全國文學(xué)報刊聯(lián)盟會員單位名單,采集156家文學(xué)報刊期刊目錄信息數(shù)據(jù),具體包括期刊的名稱、期數(shù)、文章標(biāo)題、作者等信息,期刊數(shù)據(jù)支持及時更新。文學(xué)活動數(shù)據(jù)采集全國范圍內(nèi)重要的文學(xué)活動、文學(xué)出海數(shù)據(jù)并錄入對應(yīng)的數(shù)據(jù)庫,具體內(nèi)容包含:活動的時間、地點、主題、參與人員、主辦單位等,原則上每場活動需網(wǎng)絡(luò)采集圖片不少于1張。完成2024年數(shù)據(jù)采集,同時支持數(shù)據(jù)每天自動更新采集,每年可自動采集更新增加不少于1000場。社交媒體“傳播力”數(shù)據(jù)采集微博、微信公眾號、豆瓣、小紅書、B站和抖音等社交媒體上的相關(guān)文學(xué)傳播數(shù)據(jù)。具體的數(shù)據(jù)包含但不僅限以下:話題熱度榜、熱搜榜。閱讀量、分享情況。瀏覽量、點贊量、評論數(shù)、轉(zhuǎn)發(fā)數(shù)。以上數(shù)據(jù)每日更新。紅色文學(xué)數(shù)據(jù)庫紅色文學(xué)地標(biāo)采集和梳理紅色文化地標(biāo)數(shù)據(jù)并錄入到對應(yīng)的數(shù)據(jù)庫中,根據(jù)紅色文化特色進行分類。具體字段包括但不限于以下內(nèi)容:名稱、類型、簡介、地址、位置坐標(biāo)、相關(guān)文學(xué)人物和文學(xué)作品。紅色經(jīng)典文學(xué)媒資庫采集和整理紅色文化相關(guān)的圖片、影像、音頻、藝術(shù)品等,構(gòu)建紅色經(jīng)典文學(xué)媒資庫;二維數(shù)據(jù)采集制作:紅色經(jīng)典文學(xué)相關(guān)的圖片100張,紅色經(jīng)典文學(xué)等相關(guān)藝術(shù)作品100幅;視頻采集:紅色經(jīng)典文學(xué)相關(guān)影像(15-30分鐘/個)20個;音頻采集:紅色經(jīng)典文學(xué)相關(guān)音頻,(30-60分鐘/個)50個;全景采集:紅色文學(xué)相關(guān)地標(biāo)、場景20個。紅色經(jīng)典文學(xué)作品數(shù)據(jù)庫采買采集館方指定的紅色經(jīng)典文學(xué)作品,建立紅色經(jīng)典文學(xué)作品數(shù)據(jù)庫,數(shù)據(jù)庫主要包括以下內(nèi)容:1、作品的基本信息、內(nèi)容摘要、社會影響、版本流傳、研究價值等多個維度,以及相關(guān)的多媒體資源(如圖片、音頻、視頻等)。2、多媒體資源數(shù)據(jù)包含但不限于以下:作品基本信息(作品名、作者、出版情況、類型等)、作者信息(姓名、出生/逝世日期、主要作品等)、作品信息(簡介、人物角色、作品全文、摘要、作品時代背景、關(guān)聯(lián)事件等)。3、涉及作品的全文電子版。進步期刊數(shù)據(jù)庫數(shù)字化館方指定的進步期刊,并完成整理、校對,導(dǎo)入紅色經(jīng)典文學(xué)數(shù)據(jù)庫。進步期刊數(shù)據(jù)庫需具備對外開放檢索功能。文學(xué)金句數(shù)據(jù)庫文學(xué)金句數(shù)據(jù)庫1.采集和梳理不少于1000部重點文學(xué)作品中的名言名句并錄入對應(yīng)的數(shù)據(jù),名言名句的內(nèi)容包含但不僅限以下字段:金句內(nèi)容、來源作品、作者、主題標(biāo)簽(如:愛情、友情、親情、夢想、勇氣、苦難、孤獨、善與惡、成長、人生感悟、風(fēng)景等),構(gòu)建文學(xué)金句相關(guān)的主題標(biāo)簽體系,涵蓋主要的文學(xué)類主題。2.構(gòu)建“畬族文學(xué)”專題數(shù)據(jù)庫,收錄全國各地“我國民間文學(xué)三套集成”中的畬族文學(xué)內(nèi)容,各地畬族史、畬族志,以及其他畬族主題的文學(xué)作品。畬族文學(xué)專題數(shù)據(jù)庫需具備開放檢索功能。3.金句數(shù)據(jù)庫需具備對外開放檢索功能,用戶可以據(jù)意查句。每個金句下面提供了一鍵復(fù)制、點贊、反饋等選項,幫助大家更方便的使用。不是簡單的根據(jù)輸入的文字來查找含有這個字的句子,而是能一定程度理解輸入內(nèi)容所代表的重點或深層含義,在進行相關(guān)的推薦。4.支持金句共建功能,用戶可上傳文學(xué)金句,經(jīng)審核后可進入數(shù)據(jù)庫,金句需要可關(guān)聯(lián)對應(yīng)的作品。后期可支持AI文學(xué)官的應(yīng)用。館際通業(yè)務(wù)數(shù)據(jù)庫平臺機構(gòu)會員數(shù)據(jù)庫完成3-5家入駐館際通綜合管理服務(wù)平臺的文學(xué)館機構(gòu)相關(guān)信息的采集和數(shù)據(jù)錄入,包括以下字段內(nèi)容:機構(gòu)的基本情況:如名稱、簡介、地址、網(wǎng)站主頁、聯(lián)系方式等。完成該文學(xué)館常設(shè)展項的數(shù)字化,并將手稿、圖片、影像資料等數(shù)據(jù)接入數(shù)據(jù)庫。3、按需部署落地相關(guān)適配數(shù)字化應(yīng)用的硬件。共享文學(xué)數(shù)據(jù)庫構(gòu)建所有入駐館際通綜合服務(wù)平臺上的文學(xué)機構(gòu)的共享文學(xué)數(shù)據(jù)庫,支持各個文學(xué)機構(gòu)錄入相關(guān)的文學(xué)數(shù)據(jù)內(nèi)容,接入文學(xué)館一期已建成的文學(xué)數(shù)據(jù)庫內(nèi)容,包括文學(xué)實體庫、實體間關(guān)系、文學(xué)資料庫和文學(xué)素材等數(shù)據(jù),供館際通的所有機構(gòu)用戶共享使用,后續(xù)入駐平臺的文學(xué)館機構(gòu)共享的文學(xué)數(shù)據(jù)庫。數(shù)字化展項數(shù)據(jù)庫構(gòu)建所有在館際通平臺上開發(fā)的數(shù)字化展項數(shù)據(jù)庫,供服務(wù)平臺上的所有機構(gòu)用戶共享使用。數(shù)字化展項數(shù)據(jù)庫的內(nèi)容包括如下信息:名稱;簡介;版本;發(fā)布時間;發(fā)布機構(gòu);安裝部署次數(shù);點贊次數(shù);評論數(shù)據(jù);AIGC內(nèi)容數(shù)據(jù)庫構(gòu)建所有在館際通平臺上通過AIGC工具生產(chǎn)并發(fā)布至資源共享中心的數(shù)據(jù)庫。文學(xué)數(shù)據(jù)庫管理和分析系統(tǒng)數(shù)據(jù)管理文學(xué)數(shù)據(jù)庫管理系統(tǒng)提供全面瀏覽、檢索、編輯和探索分析文學(xué)數(shù)據(jù)庫內(nèi)容的工具系統(tǒng),是各類人員使用和維護文學(xué)數(shù)據(jù)庫內(nèi)容的入口。文學(xué)數(shù)據(jù)庫管理系統(tǒng)需要包含以下幾個模塊的內(nèi)容:1、數(shù)據(jù)庫內(nèi)容總覽:提供綜合頁面展示文學(xué)數(shù)據(jù)庫的所有內(nèi)容板塊,每個板塊的數(shù)據(jù)量,數(shù)據(jù)內(nèi)容介紹,數(shù)據(jù)使用情況等等。2、數(shù)據(jù)庫內(nèi)容分項板塊:針對每個數(shù)據(jù)板塊提供專屬的頁面進行內(nèi)容的呈現(xiàn)和檢索,如全國文學(xué)地標(biāo)、文學(xué)期刊目錄、文學(xué)圖書出版、文學(xué)活動、紅色文學(xué)內(nèi)容、文學(xué)金句數(shù)據(jù)、文學(xué)知識圖譜、館際通業(yè)務(wù)數(shù)據(jù)庫等。3、數(shù)據(jù)庫內(nèi)容管理:根據(jù)文學(xué)數(shù)據(jù)庫的內(nèi)容形式,提供針對實體庫、文本資料、媒資素材等數(shù)據(jù)形式的管理功能,支持內(nèi)容的編輯修改、內(nèi)容的編目、標(biāo)簽更新。4、數(shù)據(jù)共享管理:根據(jù)文學(xué)數(shù)據(jù)庫的內(nèi)容和業(yè)務(wù)需求進行內(nèi)容的共享設(shè)置,支持將文學(xué)數(shù)據(jù)庫中的內(nèi)容按照項目(project)粒度進行共享設(shè)置,共享的內(nèi)容會出現(xiàn)在館際通綜合服務(wù)平臺的資源共享中心模塊中,供所有入駐平臺的文學(xué)館機構(gòu)查看和使用。5、數(shù)據(jù)權(quán)限管理:文學(xué)數(shù)據(jù)庫的數(shù)據(jù)權(quán)限管理包括數(shù)據(jù)庫內(nèi)容查看和修改的賬號權(quán)限設(shè)置,以及文學(xué)數(shù)據(jù)庫內(nèi)容共享之后各個文學(xué)館會員機構(gòu)的使用權(quán)限設(shè)置。6、訪問日志和數(shù)據(jù)統(tǒng)計:支持將訪問文學(xué)數(shù)據(jù)庫內(nèi)容的各類操作日志進行記錄用于后續(xù)的查詢和審計,支持針對文學(xué)數(shù)據(jù)庫內(nèi)容訪問的日志數(shù)據(jù)統(tǒng)計分析,以獲得對文學(xué)數(shù)據(jù)庫使用情況的總覽。文學(xué)數(shù)據(jù)編目和智能標(biāo)引1、構(gòu)建完整的文學(xué)數(shù)據(jù)內(nèi)容的分類編目和智能標(biāo)引體系,并將文學(xué)數(shù)據(jù)庫的內(nèi)容按照分類編目和智能標(biāo)引體系進行標(biāo)簽歸類,以便更好的檢索和管理文學(xué)數(shù)據(jù)庫的相關(guān)內(nèi)容。2、分類編目應(yīng)考慮文學(xué)的體裁和形式、地域、流派、主題、年代等方面的因素,編目體系中的編目項不少于100個。智能標(biāo)引下的標(biāo)簽體系需要圍繞各類文學(xué)相關(guān)實體的標(biāo)簽內(nèi)容,如作家、作品、事件、年代、文化、習(xí)俗等方面的內(nèi)容,智能標(biāo)引體系中包含的標(biāo)簽項不少于1000項。圖片視頻媒資分析在文學(xué)數(shù)據(jù)庫中,圖片和視頻媒資作為重要組成部分,不僅豐富了文學(xué)內(nèi)容的展現(xiàn)形式,也提供了更直觀的理解途徑。圖片視頻媒資分析模塊旨在通過先進的圖像識別和視頻處理技術(shù),對這些多媒體內(nèi)容進行深入分析。這包括圖片、視頻的主題分類(將圖片或視頻歸類到特定的文學(xué)主題下)、智能化編目和標(biāo)簽處理,以及內(nèi)容摘要生成(自動生成圖片或視頻的內(nèi)容摘要,便于快速瀏覽)。此外,該模塊還支持對媒資素材的元數(shù)據(jù)管理,如時間、地點、作者等信息的錄入與檢索,以及基于這些信息的統(tǒng)計分析,幫助用戶更好地理解和利用這些媒資資源。文本知識圖譜分析針對文學(xué)數(shù)據(jù)庫構(gòu)建的數(shù)據(jù)內(nèi)容進行知識圖譜的處理分析、內(nèi)容構(gòu)建以及校對審核,將文學(xué)數(shù)據(jù)庫中的作品、作家、地域、地標(biāo)、年代、獎項、藝術(shù)品等建立完整的知識圖譜關(guān)系網(wǎng)絡(luò),并針對文學(xué)作品的內(nèi)容構(gòu)建各自的知識圖譜。此項工作構(gòu)建的知識圖譜需要融入文學(xué)大數(shù)據(jù)中心項目的文學(xué)知識圖譜數(shù)據(jù)體系中。文學(xué)知識圖譜的構(gòu)建流程依賴文學(xué)領(lǐng)域大模型提供的各項能力。數(shù)據(jù)分析數(shù)據(jù)分析模塊利用大模型的能力,以及深度學(xué)習(xí)、自然語言處理(NLP)等先進技術(shù),對文學(xué)數(shù)據(jù)庫中的海量數(shù)據(jù)進行深度挖掘和分析。該模塊可以針對文學(xué)作品中的內(nèi)容進行關(guān)鍵信息的抽取,并借此構(gòu)建知識圖譜、人物年表、大事記年表等,通過數(shù)據(jù)分析挖掘作品中人物的關(guān)系,事件的脈絡(luò),方便讀者閱讀,并加深對內(nèi)容的理解。數(shù)據(jù)分析的引入,極大地提升了文學(xué)數(shù)據(jù)處理的智能化水平和決策的科學(xué)性。多模態(tài)AI語義檢索多模態(tài)AI語義檢索模塊實現(xiàn)了對文學(xué)數(shù)據(jù)庫中多模態(tài)數(shù)據(jù)(包括文本、圖片、視頻等)的高效檢索。該模塊通過融合多種模態(tài)的信息表示方法,將不同模態(tài)的數(shù)據(jù)映射到統(tǒng)一的語義空間中,使得用戶能夠使用自然語言查詢來檢索跨模態(tài)的信息。關(guān)鍵詞檢索分析關(guān)鍵詞檢索分析模塊是文學(xué)數(shù)據(jù)庫管理系統(tǒng)中的基礎(chǔ)且關(guān)鍵的功能之一。它支持用戶根據(jù)關(guān)鍵詞快速定位到相關(guān)的文學(xué)內(nèi)容,包括文本、圖片、視頻等多種數(shù)據(jù)類型。同時,該模塊還提供了關(guān)鍵詞詞頻統(tǒng)計、詞云分析等高級功能,幫助用戶發(fā)現(xiàn)文學(xué)內(nèi)容中的聯(lián)系和規(guī)律。通過這些檢索結(jié)果的可視化呈現(xiàn),用戶可以更深入地理解文學(xué)作品的內(nèi)涵和背景,以及文學(xué)領(lǐng)域的發(fā)展趨勢和熱點話題。文學(xué)數(shù)據(jù)質(zhì)量監(jiān)測文學(xué)數(shù)據(jù)質(zhì)量監(jiān)測模塊是確保文學(xué)數(shù)據(jù)庫內(nèi)容準確性和可靠性的重要保障。該模塊通過自動化的數(shù)據(jù)清洗、校驗和評估流程,對文學(xué)數(shù)據(jù)庫中的數(shù)據(jù)進行全面的質(zhì)量監(jiān)控。它包括對文本內(nèi)容進行語法、重復(fù)性等維度的檢查,確保數(shù)據(jù)的準確性和權(quán)威性;同時,還通過對圖片、視頻等多媒體內(nèi)容的清晰度、版權(quán)合法性等方面的檢查,保障媒資素材的質(zhì)量,確保文學(xué)數(shù)據(jù)庫的持續(xù)穩(wěn)定運行。(四)文學(xué)大模型平臺文學(xué)大模型平臺是文學(xué)大數(shù)據(jù)中心雙輪驅(qū)動的另一個核心引擎,為整個項目系統(tǒng)提供核心的智能能力,文學(xué)大模型平臺深度融合文學(xué)數(shù)據(jù)庫的數(shù)據(jù)知識和其他文學(xué)類知識加以訓(xùn)練和調(diào)優(yōu),同時也為文學(xué)數(shù)據(jù)庫的進一步內(nèi)容擴充和建設(shè)提供智能工具能力,從而形成文學(xué)大數(shù)據(jù)和文學(xué)大模型相互促進,雙輪驅(qū)動的發(fā)展模式。文學(xué)大模型平臺具體的建設(shè)內(nèi)容包括:(1)文學(xué)領(lǐng)域大模型;(2)大模型訓(xùn)練調(diào)優(yōu)平臺。1.文學(xué)領(lǐng)域大模型基于相對通用的底座大模型針對文學(xué)領(lǐng)域進行專項的數(shù)據(jù)和任務(wù)訓(xùn)練,使得文學(xué)領(lǐng)域大模型獲得更加專項和深入的文學(xué)知識,同時更好的理解文學(xué)類的問題和執(zhí)行文學(xué)領(lǐng)域類的任務(wù),從而獲得比通用的大模型更好的效果。構(gòu)建文學(xué)領(lǐng)域大模型,對于用于模型訓(xùn)練的數(shù)據(jù)有特定的要求,至少要包含以下文學(xué)數(shù)據(jù),項目實施過程中需要獲取這些數(shù)據(jù)并對這些數(shù)據(jù)進行專門格式的處理形成大模型能夠識別和使用的知識,參與到模型定制化內(nèi)容的文學(xué)類相關(guān)數(shù)據(jù)應(yīng)不少于百億token:(1)項目建設(shè)中的文學(xué)數(shù)據(jù)庫的數(shù)據(jù)內(nèi)容;(2)全國各省市地方志數(shù)據(jù);(3)各類文學(xué)名人傳記、文學(xué)作品、文學(xué)軼事、文學(xué)志和文學(xué)史等相關(guān)書籍不少于5000本;(4)不少于百萬首的我國古詩詞數(shù)據(jù);(5)不少于1000萬字的我國文化古籍?dāng)?shù)據(jù)。在數(shù)據(jù)明確之后,訓(xùn)練文學(xué)領(lǐng)域大模型需要針對文學(xué)領(lǐng)域中的特定任務(wù)進行持續(xù)多輪的調(diào)優(yōu),從而達到更好的效果,文學(xué)領(lǐng)域大模型的特定任務(wù)包括但不限于:(1)重要文學(xué)獎項知識問答;(2)文學(xué)地標(biāo)知識問答;(3)文學(xué)期刊和作品知識問答;(4)紅色文學(xué)知識問答;(5)文學(xué)金句知識問答;(6)我國古詩詞知識問答和詩詞創(chuàng)作。經(jīng)過特定數(shù)據(jù)的訓(xùn)練和針對特定文學(xué)領(lǐng)域任務(wù)的調(diào)優(yōu)構(gòu)建而成的文學(xué)領(lǐng)域大模型在相匹配的評測集上要優(yōu)于通用商用大模型,如百度文心和通義千問。以下是文學(xué)領(lǐng)域大模型訓(xùn)練的流程示意圖:(文學(xué)領(lǐng)域大模型訓(xùn)練流程圖)經(jīng)過訓(xùn)練調(diào)優(yōu)的文學(xué)領(lǐng)域大模型支持在政務(wù)云環(huán)境進行部署并支持國產(chǎn)化GPU品牌,大模型推理服務(wù)要實現(xiàn)如下功能:(1)支持根據(jù)文本提示詞的描述給出符合要求的文字輸出;(2)支持系統(tǒng)提示詞、用戶提示詞、對話上下文等參數(shù)輸入;(3)支持回答內(nèi)容的流式輸出;(4)支持函數(shù)調(diào)用(Functioncalling);(5)提供標(biāo)準的大模型調(diào)用的API和SDK;(6)模型參數(shù)不小于14B;(7)支持敏感詞的配置和更新;(8)大模型算法服務(wù)需要適配國產(chǎn)化GPU進行部署和推理;(9)大模型算法服務(wù)在A800或同等能力國產(chǎn)GPU上的推理速度不少于30tokens/秒,首字延時小于1秒。在大模型部署之后,中標(biāo)單位需要協(xié)助業(yè)主取得大模型服務(wù)備案(互聯(lián)網(wǎng)信息服務(wù)算法備案)。由于大模型技術(shù)在快速迭代發(fā)展,項目打造的文學(xué)領(lǐng)域大模型需要持續(xù)的根據(jù)業(yè)務(wù)中用戶使用的反饋和實際的用戶問答數(shù)據(jù)進行調(diào)優(yōu),并提供質(zhì)保期間內(nèi)每年4次的模型微調(diào)和升級部署的服務(wù),同時還需具備切換到其他基礎(chǔ)大模型的能力,如在今后涉及基礎(chǔ)大模型的切換,中標(biāo)單位協(xié)助做好切換工作。2.大模型調(diào)優(yōu)訓(xùn)練平臺大模型部署到生產(chǎn)環(huán)境進行業(yè)務(wù)服務(wù)之后,會持續(xù)的對用戶的問答數(shù)據(jù)進行回流采集和評測分析,并針對用戶明確反饋不好或者甲方運營人員反饋不好的數(shù)據(jù)進行人工的修正,在積累一段時間之后,這些數(shù)據(jù)形成了一個新的數(shù)據(jù)集,可以用于后續(xù)的訓(xùn)練調(diào)優(yōu)。該項目要求中標(biāo)單位在提供文學(xué)領(lǐng)域大模型的同時,也提供配套的大模型調(diào)優(yōu)訓(xùn)練平臺,以支持定期的模型調(diào)優(yōu)和部署升級。為了實現(xiàn)這一目標(biāo),大模型調(diào)優(yōu)訓(xùn)練平臺至少要包含以下模塊并提供對應(yīng)的功能。(1)模型數(shù)據(jù)管理1)支持指令微調(diào)數(shù)據(jù)集、評測數(shù)據(jù)集的管理;2)提供針對文學(xué)領(lǐng)域的定制化訓(xùn)練集的管理;(2)數(shù)據(jù)處理支持對預(yù)訓(xùn)練原始數(shù)據(jù)的預(yù)處理,內(nèi)容抽取、清洗、去除噪聲、修復(fù)格式錯誤等,獲得用于模型預(yù)訓(xùn)練的高質(zhì)量文本數(shù)據(jù)。(4)模型訓(xùn)練支持通過選擇數(shù)據(jù)集,調(diào)整訓(xùn)練參數(shù),重新訓(xùn)練特定的模型以提高模型效果,模型訓(xùn)練支持設(shè)置和調(diào)整以下參數(shù):模型名稱、循環(huán)次數(shù)、批次大小、學(xué)習(xí)率策略、Prompt損失權(quán)重、驗證步數(shù)、序列長度、權(quán)重衰減、梯度存儲等。(5)模型部署支持通過容器化平臺,將訓(xùn)練完成的模型進行部署和線上推理,配置發(fā)布模型應(yīng)用的基礎(chǔ)信息,即可快速實現(xiàn)模型部署。支持模型服務(wù)的上線、下線、升級、查看、調(diào)試的等管理操作。(6)模型評測支持選擇評測數(shù)據(jù)集,對訓(xùn)練好的模型進行自動化評測,通過評測系統(tǒng)進行打分或標(biāo)注,驗證模型調(diào)優(yōu)的效果,支持以下功能:1)支持模型評測的端到端完整評測鏈路,無需代碼開發(fā),支持主流開源大模型、微調(diào)后大模型的一鍵評測和對比;2)支持多個領(lǐng)域的常用公開數(shù)據(jù)集的評測,完整還原官方評測方法,雷達圖全景展示;3)支持多模型多任務(wù)同時評測,評測結(jié)果圖表式對比展示,輔以單條評測結(jié)果詳情,方便全方位比較分析;4)支持針對文學(xué)垂類模型定制數(shù)據(jù)集的開發(fā)和評測和結(jié)果預(yù)覽;5)支持基準評測、指令跟隨評測以及定制化文學(xué)評測集的評測,對模型能力有更加全面的了解。(7)模型庫管理管理初始模型和訓(xùn)練好的模型,支持查看模型庫的列表,查看每一個模型的詳情,包括模型的參數(shù)大小、訓(xùn)練參數(shù)、訓(xùn)練集、訓(xùn)練時間、評測集、評測結(jié)果等。功能系統(tǒng)功能模塊功能需求說明文學(xué)領(lǐng)域大模型大模型服務(wù)功能1、支持根據(jù)文本提示詞的描述給出符合要求的文字輸出;2、支持系統(tǒng)提示詞、用戶提示詞、對話上下文等參數(shù)輸入;3、支持回答內(nèi)容的流式輸出;4、支持函數(shù)調(diào)用;5、提供標(biāo)準的大模型調(diào)用的API和SDK;6、模型參數(shù)不小于14B;7、支持敏感詞的配置;8、大模型算法服務(wù)需要適配國產(chǎn)化GPU進行部署和推理;9、大模型算法服務(wù)在A800或同等能力國產(chǎn)GPU上的推理速度不少于30tokens/秒,首字延時小于1秒。大模型定制化訓(xùn)練基于特定的文學(xué)數(shù)據(jù)并針對特定文學(xué)場景進行模型的專項訓(xùn)練和調(diào)優(yōu),并在相關(guān)評測集和評測任務(wù)上的性能和正確率高于常見的商用模型(如通義千問和百度文心等)。參與到模型定制化內(nèi)容的文學(xué)類相關(guān)數(shù)據(jù)應(yīng)不少于百億token。特定的文學(xué)數(shù)據(jù)至少包含如下內(nèi)容:1、項目建設(shè)中的文學(xué)數(shù)據(jù)庫的數(shù)據(jù)內(nèi)容;2、不少于百萬首詩詞數(shù)據(jù);3、我國文化古籍?dāng)?shù)據(jù);4、不少于10省的地方志數(shù)據(jù);5、各類文學(xué)名人傳記、文學(xué)作品、文學(xué)軼事、文學(xué)史等相關(guān)書籍不少于1000本;6、茅盾文學(xué)獎、魯迅文學(xué)獎、老舍文學(xué)獎、曹禺戲劇文學(xué)獎、冰心獎、人民文學(xué)獎等文學(xué)獎項的全部獲獎作家和獲獎作品相關(guān)數(shù)據(jù);特定文學(xué)領(lǐng)域包括但不限于:重要文學(xué)獎項知識問答;文學(xué)地標(biāo)知識問答;文學(xué)期刊和作品知識問答;紅色文學(xué)知識問答;文學(xué)金句知識問答;我國古詩詞知識問答和詩詞創(chuàng)作;定制訓(xùn)練的模型參數(shù)量不小于14B;模型量化將大模型轉(zhuǎn)換為低精度版本,減少模型大小,提升推理速度。1、精度保持:確保量化后的模型在預(yù)測精度上與原模型相近,滿足業(yè)務(wù)需求。2、集成與部署:量化后的模型無縫集成至現(xiàn)有系統(tǒng),支持在多種環(huán)境中部署。3、性能優(yōu)化:通過量化,顯著提升模型在資源受限設(shè)備上的運行效率。推理加速1、高效推理引擎:集成高性能推理引擎,加速大模型的推理速度。2、硬件加速:模型推理過程支持使用硬件加速技術(shù)(如GPU)以提高性能。3、批量處理:優(yōu)化批量推理能力,提升大數(shù)據(jù)量下的處理速度。4、動態(tài)調(diào)整:根據(jù)實時負載動態(tài)調(diào)整資源分配,確保推理服務(wù)的穩(wěn)定性和高效性。部署及運維服務(wù)支持在公共云或者政務(wù)云環(huán)境進行文學(xué)領(lǐng)域大模型的私有化部署;中標(biāo)單位需要配合業(yè)主取得文學(xué)領(lǐng)域大模型服務(wù)備案;支持大模型問答數(shù)據(jù)的回流采集,基于回流數(shù)據(jù)的評測進行模型調(diào)優(yōu)和升級服務(wù),每年提供不少于4次的模型調(diào)優(yōu)訓(xùn)練和升級服務(wù);模型訓(xùn)練調(diào)優(yōu)平臺模型數(shù)據(jù)管理1、支持指令微調(diào)數(shù)據(jù)集、評測數(shù)據(jù)集的管理;2、提供針對文學(xué)場景的定制化訓(xùn)練集的管理;數(shù)據(jù)處理支持預(yù)訓(xùn)練數(shù)據(jù)的預(yù)處理,內(nèi)容抽取、清洗、去除噪聲、修復(fù)格式錯誤等。模型訓(xùn)練支持通過選擇數(shù)據(jù)集,調(diào)整訓(xùn)練參數(shù),重新訓(xùn)練特定的模型以提高模型效果,模型訓(xùn)練支持設(shè)置和調(diào)整以下參數(shù):模型名稱、循環(huán)次數(shù)、批次大小、學(xué)習(xí)率策略、Prompt損失權(quán)重、驗證步數(shù)、序列長度、權(quán)重衰減、梯度存儲等。模型部署支持通過容器化平臺,將訓(xùn)練完成的模型進行部署和線上推理,配置發(fā)布模型應(yīng)用的基礎(chǔ)信息,即可快速實現(xiàn)模型部署。支持模型服務(wù)的上線、下線、升級、查看、調(diào)試的等管理操作。模型評測支持選擇評測數(shù)據(jù)集,對訓(xùn)練好的模型進行自動化評測,通過評測系統(tǒng)進行打分或標(biāo)注,驗證模型調(diào)優(yōu)的效果,支持以下功能:1、支持模型評測的端到端完整評測鏈路,無需代碼開發(fā),支持主流開源大模型、微調(diào)后大模型的一鍵評測和對比;2、支持多個領(lǐng)域的常用公開數(shù)據(jù)集的評測,完整還原官方評測方法,雷達圖全景展示;3、支持多模型多任務(wù)同時評測,評測結(jié)果圖表式對比展示,輔以單條評測結(jié)果詳情,方便全方位比較分析;4、支持針對文學(xué)垂類模型定制數(shù)據(jù)集的開發(fā)和評測和結(jié)果預(yù)覽;5、支持基準評測、指令跟隨評測以及定制化文學(xué)評測集的評測,對模型能力有更加全面的了解。模型庫管理管理初始模型和訓(xùn)練好的模型,支持查看模型庫的列表,查看每一個模型的詳情,包括模型的參數(shù)大小、訓(xùn)練參數(shù)、訓(xùn)練集、訓(xùn)練時間、評測集、評測結(jié)果等。(五)文學(xué)智能體平臺文學(xué)智能體平臺是構(gòu)建在文學(xué)數(shù)據(jù)庫和文學(xué)大模型能力之上的智能工具生產(chǎn)配置平臺,通過智能體平臺提供的工具和流程,平臺的用戶可以構(gòu)建功能豐富、形象定制、風(fēng)格各異的個性化智能體,為大數(shù)據(jù)中心接入的文學(xué)機構(gòu)提供智能化的生產(chǎn)服務(wù),為文學(xué)展館的日常運營提供智能化的操作體驗,也為文學(xué)展館內(nèi)的游客用戶提供無處不在的智能體驗。文學(xué)智能體平臺通過對接文學(xué)數(shù)據(jù)庫中的數(shù)據(jù)內(nèi)容,為智能體提供海量且持續(xù)更新的知識,通過對接文學(xué)大模型系統(tǒng)為智能體賦予認知和感知等智能能力,通過數(shù)據(jù)和大模型AI的雙輪驅(qū)動,實現(xiàn)智能體的高效運行和廣泛存在,真正成為文學(xué)大數(shù)據(jù)中心項目的核心亮點。文學(xué)智能體平臺包含兩大模塊:1)文學(xué)智能體生產(chǎn)平臺:支持用戶組裝和配置各類文學(xué)智能體的工具平臺,實現(xiàn)智能體的任務(wù)分解規(guī)劃和執(zhí)行;2)AI文學(xué)官:針對本項目兩類不同場景需求定制的一個超級文學(xué)智能體,實現(xiàn)智能體的無處不在。1.文學(xué)智能體生產(chǎn)平臺文學(xué)智能體平臺是該項目的核心能力,提供用戶構(gòu)建和組裝智能體所需要的系統(tǒng)工具,規(guī)范構(gòu)建智能體的流程和功能模塊,用戶通過文學(xué)智能體生產(chǎn)平臺生產(chǎn)出來的一個個智能體,更好的將文學(xué)數(shù)據(jù)和文學(xué)大模型能力進行融合,更好的服務(wù)文學(xué)館的游客用戶、文學(xué)館的管理運營人員以及文學(xué)館機構(gòu)內(nèi)部的文學(xué)研究和內(nèi)容生產(chǎn)任務(wù)。用戶既可以在文學(xué)智能體生產(chǎn)平臺上與各類智能體進行交互體驗,也可以通過API方式將智能體的能力集成到各個應(yīng)用中。文學(xué)智能體生產(chǎn)平臺具有以下模塊:(1)智能體推理執(zhí)行引擎提供智能體與大語言模型進行推理交互、流程串聯(lián)和任務(wù)執(zhí)行的運行時引擎和環(huán)境系統(tǒng),智能體推理執(zhí)行引擎是智能體生產(chǎn)平臺中的關(guān)鍵底層模塊。(2)生產(chǎn)配置平臺智能體生產(chǎn)平臺中的智能體配置設(shè)定功能模塊是一個重要組件,允許用戶自定義和優(yōu)化智能體的行為、功能和響應(yīng)。智能體配置設(shè)定功能模塊幫助用戶全面自定義和優(yōu)化智能體的行為和性能,使智能體能夠更好地滿足特定應(yīng)用場景的需求,并提供優(yōu)質(zhì)的用戶體驗。(3)智能體廣場智能體廣場是一個集成式展示和管理模塊,旨在提供一個用戶友好、功能豐富的界面,用于展示、瀏覽、評估和部署各種智能體。(4)智能體功能插件智能體功能插件是智能體生產(chǎn)平臺中用于擴展和增強智能體功能的模塊化組件。通過功能插件,用戶可以為智能體添加特定的能力和功能,從而滿足不同的場景需求。(5)向量數(shù)據(jù)庫向量數(shù)據(jù)庫是智能體平臺用于存儲知識數(shù)據(jù)和智能體記憶的關(guān)鍵模塊,用戶和智能體的對話數(shù)據(jù)經(jīng)過總結(jié)處理之后以向量的形式存儲到向量數(shù)據(jù)庫,智能體關(guān)聯(lián)的知識庫本身的數(shù)據(jù)也以向量的形式存儲到向量數(shù)據(jù)庫中用戶后續(xù)的實時語義檢索,向量數(shù)據(jù)庫中的知識數(shù)據(jù)被檢索之后,作為對話上下文傳遞給智能體大模型進行相關(guān)內(nèi)容的生成。(6)知識庫RAG知識庫RAG(Retrieval-AugmentedGeneration)的功能模塊是一種結(jié)合信息檢索與生成模型的先進技術(shù),用于提升智能體的知識回答能力和信息準確性。知識庫RAG模塊通過對用戶的query輸入進行分析和理解并進行必要的改寫,從海量知識庫中檢索出與用戶query最相關(guān)的知識條目和內(nèi)容,并對知識條目進行相關(guān)性排序,將最相關(guān)的內(nèi)容作為用戶query的參考答案提交給大模型進行答案生成,從而保障了回答的準確性和可控性。知識庫RAG要能對接多種類型的數(shù)據(jù)存儲進行檢索,包括大數(shù)據(jù)中心平臺基座中的知識圖譜和智能媒資。(7)數(shù)據(jù)統(tǒng)計分析智能體對話數(shù)據(jù)統(tǒng)計分析模塊是一項關(guān)鍵功能,用于分析和理解智能體與用戶之間的對話數(shù)據(jù)。該模塊通過收集、處理和分析對話日志,提供深入的洞察和數(shù)據(jù)驅(qū)動的決策支持。2.AI文學(xué)官AI文學(xué)官是基于文學(xué)智能體平臺打造的一個(一組)具象的文學(xué)智能體實例。AI文學(xué)官既是大數(shù)據(jù)中心交互實現(xiàn)的出口,也是公眾的需求產(chǎn)生入口,因此AI文學(xué)官不僅是一個虛擬形象,更是以數(shù)字人為基礎(chǔ),語音識別、自然語言處理為抓手的復(fù)合型技術(shù)能力。AI文學(xué)官針對兩類人群和兩大場景提供全面的智能服務(wù)能力。兩類人群包括:(1)各文學(xué)館的線上和線下游客用戶;(2)入駐文學(xué)大數(shù)據(jù)中心各文學(xué)館的展館運營管理人員和文學(xué)內(nèi)容生產(chǎn)人員。兩大場景包括:(1)通過線下數(shù)字化展項和線上小程序服務(wù)游客進行文學(xué)館展廳的參觀游覽和互動;(2)通過館際通平臺面向場館運營管理人員提供的展項應(yīng)用設(shè)計、內(nèi)容策劃、輔助生產(chǎn)和部署管理。為了在兩大場景中為兩類人群提供無所不在的智能服務(wù),AI文學(xué)官需要集成到手機端、PC屏幕端和大屏端等多種形式的設(shè)備和介質(zhì)中,使得用戶在線下的數(shù)字化應(yīng)用和線上的小程序空間都能讓用戶感受到AI文學(xué)官的不同形象和不同服務(wù),實現(xiàn)文學(xué)智能體可視可感。具體而言,AI文學(xué)官需要包含AI導(dǎo)覽講解、多場景多模態(tài)回答、互動游戲、內(nèi)容輔助生產(chǎn)、展館運營等相關(guān)能力,并支持多終端適配。為了適應(yīng)業(yè)務(wù)的變化發(fā)展需要,AI文學(xué)官需要能實現(xiàn)服務(wù)的插拔式替換,如若后續(xù)中標(biāo)單位終止對AI文學(xué)官的人工智能訓(xùn)練和持續(xù)學(xué)習(xí)服務(wù),或招標(biāo)單位不再需要中標(biāo)單位提供該項服務(wù),中標(biāo)單位需配合招標(biāo)單位在保障AI文學(xué)官現(xiàn)有能力的基礎(chǔ)上,完成對已有大模型的切割,并順利接入新需要的大模型。同時,為了確保AI文學(xué)官的算力持續(xù)性運轉(zhuǎn),中標(biāo)單位還需要配合招標(biāo)單位完成AI文學(xué)官在服務(wù)器上的技術(shù)遷移。以下是文學(xué)智能體平臺的功能需求描述和參數(shù)說明。功能系統(tǒng)功能模塊功能需求說明文學(xué)智能體平臺智能體推理執(zhí)行引擎提供智能體與大語言模型進行推理交互、流程串聯(lián)和任務(wù)執(zhí)行的運行時引擎和環(huán)境系統(tǒng),具體包含以下功能:任務(wù)執(zhí)行計劃生成,基于大模型的推理能力對智能體的任務(wù)編排進行執(zhí)行計劃的生成,并根據(jù)每一步的結(jié)果進行計劃的調(diào)整;大模型集成調(diào)用,根據(jù)不同的提示詞進行大模型服務(wù)的調(diào)用和結(jié)果處理;插件的管理和執(zhí)行調(diào)用,支持流程中調(diào)用第三方插件并獲取執(zhí)行的結(jié)果;支持智能體與文學(xué)數(shù)據(jù)庫的數(shù)據(jù)對接,含數(shù)據(jù)讀取和數(shù)據(jù)存儲;異常出錯的處理,保障智能體運行的可靠性;支持智能體任務(wù)輸入輸出的統(tǒng)一管理和引用;支持智能體對話記錄的永久記憶和存儲;支持不少于10個智能體的并發(fā)推理執(zhí)行,支持后續(xù)的擴容;智能體生產(chǎn)配置平臺提供生產(chǎn)和維護智能體的管理配置平臺,提供web操作界面,支持智能體的創(chuàng)建、配置管理、流程編排、插件關(guān)聯(lián)、角色設(shè)置、智能體的功能調(diào)試和試運行、上線發(fā)布等功能;支持多租戶登錄和權(quán)限管理;智能體廣場展示平臺已經(jīng)構(gòu)建配置完成的智能體集群,對平臺上所有租戶可見,支持智能體列表的展示和搜索,支持單個智能體的詳情功能查看,支持與智能體的交互體驗,數(shù)量不少于10個;智能體功能插件提供用于組裝和構(gòu)建智能體所需要的技能插件,如文化數(shù)據(jù)庫對接、AI繪圖、文本分析等等,提供不少于20個智能體插件,覆蓋文學(xué)數(shù)據(jù)集成、文學(xué)數(shù)據(jù)處理、文學(xué)數(shù)據(jù)分析、多模態(tài)AIGC等能力;向量數(shù)據(jù)庫提供高維向量數(shù)據(jù)的存儲和檢索,支持智能體的知識和記憶保存,保障智能體對話回答內(nèi)容的準確性和可控性:支持高維向量的存儲和檢索;支持向量數(shù)據(jù)的寫入、更新和刪除;支持多種索引結(jié)構(gòu),如FLAT,IVF,HNSW等類型;支持與搜索引擎的集成;支持千萬級向量數(shù)據(jù)的存儲和召回;具備分布式架構(gòu),支持水平可擴展;知識庫RAG系統(tǒng)知識庫增強了智能體模型的知識和問題回答的可控性,知識庫RAG模塊支持智能體從知識庫中獲取與用于query相關(guān)的知識并進行針對性的回答,具有以下功能:支持問答對知識庫、語料知識庫和知識圖譜知識庫等多種形式;支持知識庫中知識的新增、更新、刪除;支持多模態(tài)知識內(nèi)容的管理;支持向量檢索和文本檢索等多種檢索模式;支持回復(fù)答案中對于知識庫內(nèi)容引用的標(biāo)記,增加智能體回答的可解釋性和透明性;知識庫RAG要能對接已有系統(tǒng)的數(shù)據(jù)進行檢索,包括大數(shù)據(jù)中心平臺基座中的知識圖譜和智能媒資相關(guān)數(shù)據(jù)。智能體數(shù)據(jù)統(tǒng)計分析提供用戶與文學(xué)智能體應(yīng)用交互的日志數(shù)據(jù)采集和統(tǒng)計分析,提供數(shù)據(jù)分析的可視化呈現(xiàn),包括智能體調(diào)用次數(shù)、智能體類型、總調(diào)用次數(shù)趨勢、延時分布、插件調(diào)用分布、大模型調(diào)用分布、用戶反饋數(shù)據(jù)統(tǒng)計;AI文學(xué)官AI導(dǎo)覽講解基于文學(xué)館提供的展綱和文本大綱,通過小程序和數(shù)字人的形式向游客提供文學(xué)展館內(nèi)展廳內(nèi)容和展項內(nèi)容的講解和智能問答。智能客服提供文學(xué)展館內(nèi)日常運營信息的客戶服務(wù),支持內(nèi)容的定期更新和擴充,支持多模態(tài)內(nèi)容的輸出。文學(xué)知識問答對話支持基于文學(xué)大模型的文學(xué)知識問答對話;支持多模態(tài)內(nèi)容的透出,包括文字、圖片、視頻和可視化組件等;支持將AI文學(xué)官智能體集成到文學(xué)館小程序內(nèi)提供線上的知識問答服務(wù);支持將AI文學(xué)官智能體集成到數(shù)字化大屏中,為展館內(nèi)的游客用戶提供知識問答服務(wù);文本分析針對用戶提供的文學(xué)文本提供內(nèi)容的結(jié)構(gòu)化分析,輸出作品的主題、人物、地點、事件、關(guān)聯(lián)關(guān)系、修辭手法等;支持將AI文學(xué)官集成到館際通綜合服務(wù)平臺上為文學(xué)館機構(gòu)提供服務(wù);AI封面設(shè)計支持根據(jù)用戶輸入的文學(xué)作品名稱和相關(guān)內(nèi)容描述和要求,通過AIGC技術(shù)自動輸出符合描述的作品封面;支持提供參考圖進行封面的生成;AI輔助創(chuàng)作線上AI文學(xué)官支持寫作輔助,文本潤色、續(xù)寫、擴寫等。互動游戲結(jié)合AI文學(xué)官,落地實際的場館運營,設(shè)計提供對應(yīng)的互動游戲。多端適配1、線下對話一體機,可放置8個展廳及一樓中央空間。2、線下可與其他大屏互動展項結(jié)合,在體驗互動展項的同時獲取AI文學(xué)官的同步講解。AI文學(xué)官3D形象為AI文學(xué)官構(gòu)建3D形象,提供不少于4套服飾,以及不少于4套動作表情,為文學(xué)官適應(yīng)不同季節(jié)、節(jié)日提供不同的造型,支持3D嘴型驅(qū)動,支持根據(jù)回答的內(nèi)容搭配相應(yīng)的動作和表情。聲音驅(qū)動為AI文學(xué)官定制特定的聲音,并基于AIGC算法平臺實現(xiàn)根據(jù)文字的內(nèi)容生成帶有情感色彩和語氣聲音的功能效果。支撐硬件1.實體模型。根據(jù)AI文學(xué)官3D形象定制不少于5個實體模型(其中最高尺寸要求高度1米2左右),落地在文學(xué)館內(nèi)供觀眾拍照打卡。2.線下對話一體機。提供不少于8個一體機(65寸觸摸顯示屏,分辨率≥3840*2160;主機顯卡:RTX3060同等性能及以上;同時需要帶有攝像頭、麥克風(fēng)以及主擴聲音箱喇叭模)。(六)館際通綜合服務(wù)平臺全國文學(xué)場館綜合管理服務(wù)平臺(“館際通”):“館際通”是文學(xué)大數(shù)據(jù)中心打造的,以服務(wù)全國文學(xué)類場館為宗旨的綜合性、公益性管理服務(wù)平臺。該平臺使用數(shù)據(jù)集成化、功能模塊化的建設(shè)方案,數(shù)據(jù)聯(lián)通、權(quán)限分級的建設(shè)理念,通過統(tǒng)一數(shù)據(jù)接入、管理和使用標(biāo)準,實現(xiàn)數(shù)據(jù)所有權(quán)和使用權(quán)分離,既可為全國文學(xué)類場館提供本地數(shù)據(jù)資源管理、全國數(shù)據(jù)共建共享、館際信息互聯(lián)互通的基礎(chǔ)服務(wù),也可根據(jù)各地實際需求開發(fā)個性化服務(wù)模塊,實現(xiàn)全國文學(xué)類場館數(shù)據(jù)互通有無、一網(wǎng)集成,文學(xué)類應(yīng)用一地開發(fā)、全國共享,為全國文學(xué)類場館提升數(shù)字化水平、推進公共服務(wù)水平提供平臺支持?!梆^際通”平臺要注重文學(xué)“在場”,注重“數(shù)據(jù)留存”,在做好系統(tǒng)平臺開發(fā)的同時,同步抓好數(shù)據(jù)庫建設(shè),使數(shù)據(jù)“接得進來、留得下來、跑得起來、用得起來”。整體建設(shè)過程在本次項目制定的文學(xué)數(shù)據(jù)標(biāo)準體系下統(tǒng)一規(guī)劃建設(shè),實現(xiàn)各館數(shù)據(jù)的統(tǒng)一接入、管理和使用,設(shè)計方式確保各館數(shù)據(jù)所有權(quán)和使用權(quán)的有效分離,即可為全國文學(xué)類場館提供文學(xué)大數(shù)據(jù)中心的數(shù)據(jù)資源,又能采集到各館特有的數(shù)據(jù)資源,真正做到全國文學(xué)數(shù)據(jù)共建共享、館際信息互聯(lián)互通。館際通平臺的核心元素包含三類:1)會員機構(gòu);2)各類資源;3)生產(chǎn)能力。會員機構(gòu)就是館際通平臺上主體用戶,包括接入館際通平臺的各個文學(xué)館機構(gòu),也包括館際通平臺本身的管理人員。文學(xué)大數(shù)據(jù)中心一期建設(shè)將接入不少于3家會員機構(gòu),進行戰(zhàn)略合作,館際通項目除了建設(shè)此平臺外,還需要對這幾家的館際通入駐進行全程服務(wù),包括協(xié)助采集數(shù)據(jù)、根據(jù)各館需求定制知識圖譜、提供應(yīng)用展示落地硬件設(shè)備(或根據(jù)該館已有硬件設(shè)備進行適應(yīng)性調(diào)試)、館際通平臺使用培訓(xùn)等。資源包括文學(xué)數(shù)據(jù)資源,活動直播類資源,數(shù)字化展項資源,AIGC內(nèi)容資源等。生產(chǎn)能力是指平臺提供各類工具用于生產(chǎn)可以共享的各類資源。館際通平臺的各項功能圍繞這三個核心概念展開,具體包含以下:1.機構(gòu)會員基礎(chǔ)服務(wù)提供館際通平臺會員機構(gòu)開通、設(shè)置和管理的基本功能,支持文學(xué)館機構(gòu)會員接入館際通平臺的完整流程,支持會員機構(gòu)租戶下的賬號開通和管理。館際通會員機構(gòu)下通常會有多人使用館際通平臺進行內(nèi)容的管理和生產(chǎn)。2.資源共享中心資源共享中心是館際通平臺上所有會員機構(gòu)租戶的公共資源池,包括文學(xué)數(shù)據(jù)集、數(shù)字化展項、AIGC生產(chǎn)的內(nèi)容等等。文學(xué)館會員機構(gòu)可以將其自有的文學(xué)數(shù)據(jù)或者生產(chǎn)的內(nèi)容共享到資源共享中心,也可以從資源共享中心中訂閱獲取平臺或者其他機構(gòu)共享的內(nèi)容。我國文學(xué)大數(shù)據(jù)中心項目自身建設(shè)的文學(xué)數(shù)據(jù)庫內(nèi)容默認作為資源共享中心的內(nèi)容,供其他所有文學(xué)館機構(gòu)會員使用。通過資源共享中心這種業(yè)務(wù)模式,在遵循數(shù)據(jù)和資源所有權(quán)的情況,充分擴大數(shù)據(jù)的使用權(quán),從而將各項資源的利用價值發(fā)揮到最大,在館際通上形成一個良好的合作共享的生態(tài)。3.文學(xué)數(shù)據(jù)接入管理系統(tǒng)文學(xué)數(shù)據(jù)接入管理系統(tǒng)為會員機構(gòu)提供了一個管理和查看本地文學(xué)數(shù)據(jù)的功能子系統(tǒng),提供了包括實體關(guān)系庫、文本資料庫、媒資素材庫等數(shù)據(jù)的查詢、檢索和編輯。同時也支持會員機構(gòu)共享自有文化數(shù)據(jù)并發(fā)布到資源共享中心供其他會員機構(gòu)使用的場景,以及訂閱資源共享中心的其他文學(xué)數(shù)據(jù)集并進行使用。4.數(shù)字化展項開發(fā)系統(tǒng)及應(yīng)用管理支持會員機構(gòu)在館際通平臺上生產(chǎn)數(shù)據(jù)可視化的展項,對接文學(xué)數(shù)據(jù)的內(nèi)容,設(shè)置展項的布局、主題、各類屬性配置,以及預(yù)覽和調(diào)試展項生產(chǎn)的效果。會員機構(gòu)生產(chǎn)的數(shù)字化展項可以發(fā)布共享到資源共享中心供其他會員機構(gòu)使用,也可以將展項直接發(fā)布上線部署到文學(xué)館內(nèi)的設(shè)備上。支持文學(xué)館機構(gòu)在館際通平臺進行相關(guān)文學(xué)應(yīng)用的運維監(jiān)控以及下發(fā)安裝。(1)展項實時監(jiān)控運維:支持全館展項的基礎(chǔ)運維、監(jiān)控、告警工作。自動對展項的運行狀態(tài)進行實時監(jiān)控,若有展項發(fā)生運行異常情況,能自動發(fā)送告警到指定的通知渠道,并告知管理員具體的異常問題信息,幫助管理員快速定位,提升管理效率。(2)展項云端聯(lián)控:運營管理員可以在平臺進行相關(guān)文學(xué)應(yīng)用的選擇,一鍵更新下載安裝到對應(yīng)的線下設(shè)備;同時支持聯(lián)網(wǎng)管理數(shù)字化展項的軟件版本與數(shù)字內(nèi)容。5.數(shù)字化臨展設(shè)計開發(fā)提供針對多館同時舉辦主題臨展的內(nèi)容策劃和展項開發(fā)能力。通過集成AI文學(xué)官的數(shù)字化臨展策劃功能和數(shù)字化展項開發(fā)系統(tǒng)的功能模塊,為數(shù)字化臨展設(shè)計開發(fā)提供一站式操作的功能模塊。6.AIGC生產(chǎn)工具集支持文學(xué)館機構(gòu)在館際通平臺利用AIGC工具進行文學(xué)相關(guān)內(nèi)容的生產(chǎn),包括文學(xué)作品封面設(shè)計、文學(xué)元素(文學(xué)地標(biāo)、文學(xué)人物肖像、紅色文學(xué)關(guān)鍵詞)生產(chǎn)、卡通人物造型生產(chǎn)、舊照片上色和超分等,并支持生產(chǎn)內(nèi)容的發(fā)布和共享。7.訪問日志和數(shù)據(jù)統(tǒng)計記錄館際通平臺上各個會員機構(gòu)用戶使用和操作各個功能模塊的訪問日志和審計日志,滿足合規(guī)要求的同時,對于日志進行定期的統(tǒng)計分析從而獲得對于平臺功能使用情況的宏觀了解,為平臺的持續(xù)發(fā)展和功能迭代提供決策支撐。以下是館際通綜合服務(wù)平臺的功能模塊需求和功能參數(shù):功能系統(tǒng)功能模塊功能需求說明機構(gòu)會員基礎(chǔ)服務(wù)文學(xué)館機構(gòu)會員管理(管理端)支持文學(xué)館機構(gòu)入駐到文學(xué)大數(shù)據(jù)中心平臺成為會員機構(gòu)的完整流程,提供機構(gòu)會員管理功能,具體包含以下功能:文學(xué)館機構(gòu)會員的創(chuàng)建和初始信息設(shè)置,包括名稱、簡介、地址、聯(lián)系人、聯(lián)系電話、數(shù)據(jù)權(quán)限、功能列表等;支持針對某個文學(xué)館機構(gòu)會員進行信息的編輯和管理;支持針對某個文學(xué)館機構(gòu)會員設(shè)置其在館際通平臺上的功能列表、能訪問的文學(xué)數(shù)據(jù)權(quán)限;支持所有文學(xué)館機構(gòu)會員的列表信息和檢索查詢;文學(xué)館機構(gòu)內(nèi)賬號管理支持會員機構(gòu)租戶內(nèi)的賬號管理、支持賬號的創(chuàng)建、編輯、列表和查詢,支持賬號的權(quán)限管理、角色管等功能;資源共享中心文學(xué)數(shù)據(jù)共享中心支持會員機構(gòu)查看平臺上所有的共享文學(xué)數(shù)據(jù)集的內(nèi)容目錄;支持會員機構(gòu)申請共享中心中的文學(xué)數(shù)據(jù)集內(nèi)容的使用權(quán)限;支持對共享中心中的文學(xué)數(shù)據(jù)集進行評分和評價;支持針對會員機構(gòu)根據(jù)其使用記錄進行相關(guān)文學(xué)數(shù)據(jù)的推薦;數(shù)字化展項共享中心支持會員機構(gòu)查看所有發(fā)布到數(shù)字化展項共享中心的展項內(nèi)容;支持會員機構(gòu)訂閱數(shù)字化展項并獲取數(shù)字化展項的訪問token信息;支持會員機構(gòu)對數(shù)字化展項進行評分和評價;支持針對會員機構(gòu)根據(jù)其使用記錄進行相關(guān)數(shù)字化展項的推薦;AIGC內(nèi)容共享中心支持會員機構(gòu)查看所有發(fā)布到共享中心的AIGC作品;支持會員機構(gòu)申請共享中心的AIGC作品的使用權(quán)限;支持對共享中心中的AIGC內(nèi)容進行評分和評價;支持針對會員機構(gòu)根據(jù)其使用記錄進行相關(guān)AIGC內(nèi)容的推薦;文學(xué)數(shù)據(jù)管理系統(tǒng)文學(xué)數(shù)據(jù)采集和接入1、支持文學(xué)館機構(gòu)在平臺上上傳自有的文學(xué)數(shù)據(jù)(包括文學(xué)實體和關(guān)系、書籍文本、圖片視頻素材等)到當(dāng)前租戶進行保存和后續(xù)的查看使用;2、支持文學(xué)館機構(gòu)在平臺上查看上傳的文學(xué)數(shù)據(jù)的內(nèi)容;3、支持文學(xué)館機構(gòu)在平臺上對自有上傳的數(shù)據(jù)進行管理編輯;4、支持文學(xué)館機構(gòu)會員查看平臺上已訂閱的數(shù)據(jù)內(nèi)容,包括知識圖譜數(shù)據(jù)、文本資料數(shù)據(jù)、媒資素材數(shù)據(jù)等;文學(xué)數(shù)據(jù)發(fā)布支持文學(xué)館機構(gòu)將自己上傳的數(shù)據(jù)發(fā)布到館際通資源共享中心并進行描述,對數(shù)據(jù)的使用范圍和權(quán)限進行設(shè)置;支持文學(xué)館機構(gòu)將已經(jīng)發(fā)布到資源共享中心的文學(xué)數(shù)據(jù)進行使用范圍和權(quán)限的修改;支持文學(xué)數(shù)據(jù)內(nèi)容的更新并將更新的信息同步到資源共享中心;4、支持將已經(jīng)發(fā)布到資源共享中心的文學(xué)數(shù)據(jù)進行撤銷;數(shù)字化展項開發(fā)系統(tǒng)及應(yīng)用管理展項開發(fā)支持數(shù)字化展項的可視化開發(fā):支持通過可視化操作設(shè)置展項組件的布局、主題、數(shù)據(jù)關(guān)聯(lián)以及其他屬性;支持預(yù)覽數(shù)字化展項的可視化視覺效果和用戶交互功能;支持關(guān)聯(lián)文學(xué)數(shù)據(jù)庫中的數(shù)據(jù)、用戶上傳數(shù)據(jù)來進行展項的開發(fā);支持修改更新數(shù)字化展項的各類屬性并實時預(yù)覽結(jié)果;支持刪除數(shù)字化展項應(yīng)用;展項發(fā)布1、支持將機構(gòu)賬號創(chuàng)建好的數(shù)字化展項發(fā)布到資源共享中心供其他機構(gòu)進行訂閱和使用;2、支持數(shù)字化展項的基本信息和版本信息的發(fā)布更新;展項安裝1、支持為機構(gòu)開發(fā)的數(shù)字化展項和機構(gòu)訂閱的數(shù)字化展項生成訪問token并生成對應(yīng)的訪問url;2、支持使用上述生成的url進行展項的安裝和部署;展項實時監(jiān)控運維1、支持全館展項的基礎(chǔ)運維、監(jiān)控、告警工作。2、自動對展項的運行狀態(tài)進行實時監(jiān)控,若有展項發(fā)生運行異常情況,能自動發(fā)送告警到指定的通知渠道,并告知管理員具體的異常問題信息。3、監(jiān)控展項維度,包含總展項數(shù)、異常展項數(shù)、展項名稱、展項狀態(tài)。展項云端聯(lián)控通過展項管理模塊,完成展項維度的設(shè)備綁定、軟件應(yīng)用更新幾數(shù)字內(nèi)容綁定。1、運營管理員可以在平臺進行相關(guān)文學(xué)應(yīng)用的選擇,一鍵更新下載安裝到對應(yīng)的線下設(shè)備。2、支持聯(lián)網(wǎng)管理數(shù)字化展項的軟件版本與應(yīng)用內(nèi)具體的數(shù)字內(nèi)容。AIGC生產(chǎn)工具集AI封面設(shè)計提供AI封面設(shè)計。文學(xué)元素生產(chǎn)提供文學(xué)元素AIGC生成能力??ㄍㄈ宋锷商峁┛ㄍㄈ宋锷傻墓δ?。舊照片上色提供舊照片上色的功能。照片超分提供照片超分的功能。日志和數(shù)據(jù)統(tǒng)計訪問日志支持會員機構(gòu)租戶內(nèi)的賬號使用各個功能的訪問日志記錄和查看。審計日志支持會員機構(gòu)租戶內(nèi)的賬號修改文學(xué)數(shù)據(jù)、開發(fā)和編輯數(shù)字化展項、進行AIGC生產(chǎn)等操作的日志記錄和查看。數(shù)據(jù)統(tǒng)計支持會員機構(gòu)內(nèi)的管理員查看各功能使用情況的數(shù)據(jù)統(tǒng)計結(jié)果。(七)文學(xué)公眾服務(wù)平臺在全球化與信息化快速發(fā)展的今天,文化傳播與傳承、知識普及與教育、推動文化創(chuàng)新已成為提升國家文化軟實力、促進社會和諧發(fā)展的重要途徑。本項目旨在通過構(gòu)建一個集文學(xué)資源匯聚、文化傳播、知識教育及文化創(chuàng)新于一體的公眾服務(wù)平臺,以小程序為載體,面向廣大市民游客及文學(xué)愛好者,打破時空限制,讓文學(xué)之美觸手可及。具體功能如下:1.文學(xué)探索基于我國文學(xué)地圖數(shù)據(jù),打造移動版文學(xué)地圖,游客可在小程序上探索文學(xué)地標(biāo),了解相關(guān)故事。第一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論