知識資源細顆粒度建設和標簽標引需求_第1頁
知識資源細顆粒度建設和標簽標引需求_第2頁
知識資源細顆粒度建設和標簽標引需求_第3頁
知識資源細顆粒度建設和標簽標引需求_第4頁
知識資源細顆粒度建設和標簽標引需求_第5頁
免費預覽已結(jié)束,剩余2頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

知識資源細顆粒度建設和標簽標引需求(一)項目背景知識資源細顆粒度建設和標簽標引項目是面向公共圖書館系統(tǒng)組織實施的全國智慧圖書館體系建設項目,按照《智慧圖書館知識資源數(shù)據(jù)建設指南》要求,主要利用語義網(wǎng)、知識圖譜、大數(shù)據(jù)、智能計算等技術,開展對基礎數(shù)字資源的細顆粒度內(nèi)容標識、關鍵知識點的標簽和標引建設,實現(xiàn)資源的精細化揭示和知識化、專題化服務。(二)服務清單1.服務內(nèi)容清單1.1對相關知識資源開展細顆粒度內(nèi)容標識、關鍵知識點標簽標引,完成14萬條任務量。加工對象基礎資源主要從以下資源中選取,包括但不限于:地方史志、本地報紙、館藏地方文獻、自建音視頻資源等。根據(jù)項目需要,將部分紙本資源進行數(shù)字化加工。1.2在資源精細化標引的基礎上,對標引數(shù)據(jù)進行專題化聚類、知識組織,構(gòu)建知識圖譜體系。1.3完成專題資源開發(fā)與服務,建成專題資源庫及符合本項目資源特性的個性化服務平臺,實現(xiàn)基于知識網(wǎng)絡的信息服務,包括搜索、瀏覽、發(fā)現(xiàn)、智能推薦等功能。1.4項目成果在圖書館門戶網(wǎng)站、微信、終端設備、數(shù)據(jù)庫系統(tǒng)等應用環(huán)境中本地化部署、遷移及集成。2.時間要求2.1務必于2023年12月底前完成建設任務,包括:完成14萬條細顆粒度內(nèi)容標識、關鍵知識點標簽標引信息,并進行主題化和專題化分類揭示,實現(xiàn)智能化知識發(fā)現(xiàn)。2.22024年3月底前、2024年6月底前分別按通知要求完成組織的項目驗收的準備工作。3.成果交付清單3.1本項目細顆粒度內(nèi)容標識、關鍵知識點的所有數(shù)據(jù)資源及第三方履約驗收報告。3.2本項目相關的細顆粒度數(shù)據(jù)發(fā)布與管理平臺,包括獨立的可本地部署的資源服務平臺、維護平臺或配套工具。3.3圍繞項目建設的所有文件,包括設計方案、實施方案、會議紀要等。(二)技術要求1.總體技術要求1.1本項目要求按照《智慧圖書館知識資源數(shù)據(jù)建設指南》開展細顆粒度內(nèi)容標識、關鍵知識點的標簽標引。1.2通過數(shù)字化加工、文字識別、知識圖譜、語義網(wǎng)絡分析等技術,生成知識資源細顆粒度標簽標引數(shù)據(jù),并將其進行專題化聚類和分類揭示。2.數(shù)字資源精細化標引要求2.1加工原則2.1.1采用自動化抽取的方式開展精細化標引工作,加強自動化抽取規(guī)范和方法的研究應用。2.1.2綜合分析加工對象的文獻形態(tài)、內(nèi)容結(jié)構(gòu)和服務需求,確定知識資源加工粒度和著錄標引對象。2.1.3根據(jù)文獻實際情況,科學合理確定著錄與標引內(nèi)容,參照文獻著錄規(guī)則開展著錄與標引。文獻所包含的各類插圖和表格必須作為圖表進行著錄。2.2標引單位要求2.2.1數(shù)字資源精細化標引一般以文獻組成要素單元為加工單位。對于本項目基礎資源中的圖書、期刊等類型數(shù)字資源,將封面、前言、目錄、正文篇章等每個析出部分作為著錄單元;對于本項目基礎資源中的報紙類數(shù)字資源,將正文篇章、廣告等每個析出部分作為著錄單元;對于本項目基礎資源中的音視頻資源,一般以小節(jié)、責任者作為著錄單元,其知識內(nèi)容抽取以資源中的人物、機構(gòu)、地理名稱、事件、作品、實物或其他具有標目意義的關鍵詞為標引單元。2.2.2知識抽取數(shù)據(jù)是在本批精細化標引的基礎文獻范疇內(nèi),以文獻中的人物、機構(gòu)、地理名稱、事件或其他具有標目意義的關鍵詞為標引單元。每個從文獻中抽取出來的知識條目生成一條知識抽取數(shù)據(jù)。2.3知識內(nèi)容抽取要求對于文獻數(shù)字資源的知識內(nèi)容抽取,應充分利用自動化手段分析文獻內(nèi)容,建立知識抽取模型,確定知識抽取方法,從文獻中抽取人物、機構(gòu)、事件、地理名稱以及其他具有標目意義的專題、實物等內(nèi)容,開展知識標引工作,以形成基于文獻知識內(nèi)容的語料庫。從同一基礎文獻、不同內(nèi)容位置抽取的同一個人物、機構(gòu)、地理名稱、事件、專題等信息,原則上應合并為一條數(shù)據(jù)。2.4成果形式要求2.4.1元數(shù)據(jù):包括基礎文獻元數(shù)據(jù)、細粒度加工元數(shù)據(jù)、知識抽取數(shù)據(jù),一般采用XML格式,遵照XML1.0規(guī)范,使用UTF-8編碼方式、Unicode5.0字符集。2.4.2對象數(shù)據(jù):基礎文獻的全部對象數(shù)據(jù),包括長期保存級、發(fā)布服務級等所有加工級別的數(shù)據(jù),例如:TIF文件、完成數(shù)字化識別的TXT文件、雙層PDF文件等。2.4.3證明文件:項目設計的版權(quán)證明文件等。版權(quán)證明文件包括:說明本項目加工文獻的版權(quán)來源、授權(quán)范圍、授權(quán)使用方式與對象、使用期限等內(nèi)容的整體版權(quán)說明,各權(quán)利人或各資源的具體授權(quán)文件。2.4.4數(shù)據(jù)說明文件:項目提交各類數(shù)據(jù)的總體說明文件??傮w說明文件內(nèi)容包括:項目名稱、提交單位名稱、各類型資源數(shù)量、記錄標識號號段、存儲介質(zhì)情況以及特殊情況說明。數(shù)據(jù)加工過程中引用的詞表、規(guī)范化庫等情況,也應在數(shù)據(jù)說明文件中進行說明。2.4.5文件命名規(guī)則和存儲結(jié)構(gòu):成果文件命名規(guī)則和文件存儲結(jié)構(gòu)參照《智慧圖書館知識資源數(shù)據(jù)建設指南》中的附件。3.知識組織與專題服務、新型數(shù)字資源建設要求3.1綜合考慮本館館藏建設情況、用戶需求、本區(qū)域社會經(jīng)濟發(fā)展需要各方面要素,利用知識圖譜技術、關聯(lián)數(shù)據(jù)技術等,開展可視化服務、智慧服務等知識組織與專題服務,形成較為完整的知識圖譜、能夠支撐知識圖譜應用的知識庫、本地的發(fā)布服務。3.2結(jié)合館藏特色資源,綜合考慮本館館藏建設情況、用戶需求、本區(qū)域社會經(jīng)濟發(fā)展需要各方面要素,利用多種數(shù)字創(chuàng)意技術,開展新型數(shù)字資源建設,為讀者提供交互性、立體化和沉浸式的多維度閱讀體驗。4.軟硬件保障要求4.1須自行提供支撐本項目建設的軟硬件資源。4.2為避免知識產(chǎn)權(quán)糾紛,項目所交付使用的軟件平臺應具備計算機軟件著作權(quán)登記證書。4.3提供專題資源展示、知識圖譜、智能應答等全功能接口,支持圖書館未來將上述資源接入大型第三方平臺。提供基于HTML5實現(xiàn)的跨平臺的移動端資源服務,支持跨端訪問。接入時可通過系統(tǒng)配置刪除或更改頁面標題欄、導航欄,以適應不得出現(xiàn)雙標題、雙導航欄的第三方平臺UI規(guī)范要求。如涉及其他接入要求事項,可通過雙方協(xié)商解決。4.4提供全部軟硬件平臺、相關數(shù)據(jù)、項目成果的至少3年的免費維保服務,基于圖書館資源建設的本地獨立部署的資源服務具有永久使用權(quán)。免費維保服務期內(nèi),資源服務平臺提供2小時內(nèi)響應的維護服務。4.5承建方不得將該項目中涉及的數(shù)據(jù)模型、數(shù)字資源等內(nèi)容用于圖書館知識資源細顆粒度建設和標簽標引項目以外的工作,不得私自轉(zhuǎn)儲、復制、使用模型或者數(shù)據(jù)。該項目成果和相關數(shù)據(jù)資源應按采購人的要求進行遷移。4.6項目軟件平臺應接受圖書館每季度的常態(tài)化信息安全漏掃,及時按照圖書館網(wǎng)絡信息安全要求做出整改。符合圖書館數(shù)據(jù)文件傳輸、保存的專有性、保密性和安全性要求,云端接口應采用加密隧道傳輸,并提供數(shù)據(jù)存貯、遷移、訪問控制的安全解決方案。4.7該項目在交付圖書館相關的數(shù)據(jù)、系統(tǒng)、平臺、技術文檔、培訓文件等文件過程中應遵循嚴格的流程控制和標準化管理,確保項目溝通及時準確,項目推進有序高效,成果交付安全可靠。4.8基于圖書館專題資源構(gòu)建的專項標引數(shù)據(jù)、深度學習模型及知識圖譜呈現(xiàn)系統(tǒng),應本地部署,提供專項服務。4.9須負責提供針對本項目資源平臺及相關定制軟件的第三方安全漏洞檢測報告、第三方功能驗收檢測報告,為保證檢測結(jié)果客觀公正、準確和中立,相關第三方檢測公司須從用戶方提供的備選名單中選取,檢測費用由承擔。5.服務保障要求5.1應根據(jù)要求,并結(jié)合本項目特點,提供具體詳實的服務方案:5.1.1整體實施方案:包括需求分析、顆粒度加工方案、項目實施進度安排等;方案應該契合圖書館整體資源內(nèi)容情況,要有結(jié)構(gòu)性、完整性;5.1.2項目實施進度及保障措施方案:方案應包含合理的項目進度安排表、清晰的工作流程、完善的保障措施。5.2負責項目的承建:確定專人負責與采購人對接協(xié)調(diào)工作。在承建過程中,必須根據(jù)項目要求、實際狀況,及時調(diào)整建設方案,確保按時完成合同內(nèi)容和項目任務。5.3應提供擬投入本項目的人員配備方案,包括承擔項目團隊人員信息(包括項目負責人、項目技術管理人、UI、UE、開發(fā)工程師、測試工程師、審核專家、售后人員等)。服務團隊應配置合理,分工細致,具備相應的專業(yè)能力,經(jīng)驗豐富,包括并不限于以下人員:5.3.1項目負責人員(1人):負責項目建設的整體組織、規(guī)劃、統(tǒng)籌、協(xié)調(diào)和推進實施,并與采購人進行對接。5.3.2項目技術管理人員(1人):在承建過程中,根據(jù)項目要求、實際狀況,及時調(diào)整建設方案。5.3.3數(shù)據(jù)操作人員(根據(jù)項目配備足夠人員):組員應具有豐富的圖書館聯(lián)合編目經(jīng)驗,熟悉中國機讀目錄格式規(guī)范。5.3.4質(zhì)量監(jiān)督組(根據(jù)項目配備足夠人員):負責數(shù)據(jù)成果的初級質(zhì)量監(jiān)測及差錯率控制。5.3.5審校專家團隊(根

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論