




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載ICS
35.080學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載CCS
C
07
學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載T/CI
196—學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載目 次前言
.................................................................................
II1
范圍
...............................................................................
12
規(guī)范性引用文件
.....................................................................
13
術(shù)語和定義
.........................................................................
14
縮略語
.............................................................................
15
整體架構(gòu)
...........................................................................
16
構(gòu)建流程
...........................................................................
27
系統(tǒng)要求
...........................................................................
5參考文獻(xiàn)
..............................................................................
8I學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載T/CI
196—學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載前 言本文件按照
—2020
第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別專利的責(zé)任。本文件由中國科學(xué)院自動化研究所提出。本文件由中國國際科技促進(jìn)會歸口。據(jù)國家研究院、神州醫(yī)療科技股份有限公司、北京大學(xué)第三醫(yī)院。本文件主要起草人:楊雪冰、牛景昊、王靜、李明達(dá)、張文生、張晨陽、王楚童、楊羽、孫孟軒、許娟、賀志陽、劉俊秀。II學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載T/CI
196—學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載醫(yī)療知識圖譜構(gòu)建技術(shù)要求1
范圍本文件規(guī)定了醫(yī)療知識圖譜的整體架構(gòu)、構(gòu)建流程、系統(tǒng)要求。測試等。2
規(guī)范性引用文件文件。GB/T
第17部分:數(shù)據(jù)庫GB/T
22239 信息安全技術(shù) GB/T
35273 信息安全技術(shù) 個人信息安全規(guī)范GB/T
39725 信息安全技術(shù) 健康醫(yī)療數(shù)據(jù)安全指南3
術(shù)語和定義GB/T
知識圖譜
knowledge
graph接近人類認(rèn)知世界的形式,提供了一種更好地組織、管理和理解互聯(lián)網(wǎng)海量信息的能力。[來源:YD/T
4044—,醫(yī)療知識圖譜
knowledge
術(shù)等醫(yī)學(xué)概念和多種醫(yī)學(xué)關(guān)系的知識圖譜。4
縮略語下列縮略語適用于本文件。API:應(yīng)用程序編程接口(Application
Programming
Interface)NLP:自然語言處理(Natural
Language
Processing)5
整體架構(gòu)概述1學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載T/CI
196—學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載醫(yī)療知識圖譜整體架構(gòu)如圖1 NLP圖1 醫(yī)療知識圖譜整體架構(gòu)圖基礎(chǔ)支撐層基礎(chǔ)支撐層為醫(yī)療知識圖譜構(gòu)建提供基礎(chǔ)技術(shù)支撐,主要包括大數(shù)據(jù)平臺、數(shù)據(jù)倉庫、NLP。數(shù)據(jù)源層中的數(shù)據(jù)形態(tài)包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)。知識抽取與加工層形成滿足要求的數(shù)據(jù)。知識管理層存儲和元數(shù)據(jù)配置管理等模塊化處理,實現(xiàn)知識圖譜展現(xiàn)結(jié)果的有效管理和高效訪問。6
構(gòu)建流程概述醫(yī)療知識圖譜的構(gòu)建流程如圖2所示。
圖2 醫(yī)療知識圖譜構(gòu)建流程圖知識抽取加工2學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載T/CI
196—學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載6.2.1 知識抽取6.2.1.1 抽取步驟6.2.1.1.1 選擇結(jié)構(gòu)化程度相對較高、質(zhì)量較優(yōu)的數(shù)據(jù)源,根據(jù)數(shù)據(jù)來源選擇差異化的數(shù)據(jù)抽取及加工方式。6.2.1.1.2 知識抽取包括數(shù)據(jù)甄別、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)融合
4
a)
數(shù)據(jù)甄別:明確知識圖譜的數(shù)據(jù)來源,數(shù)據(jù)來源主要為生物銀行數(shù)據(jù)庫、醫(yī)學(xué)指南;b)
行統(tǒng)一與規(guī)范;c)
數(shù)據(jù)轉(zhuǎn)換:將不同形式、不同格式的數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的表達(dá)形式;d)
6.2.1.2 標(biāo)準(zhǔn)接口對接6.2.1.2.1 標(biāo)準(zhǔn)接口主要用于對接已完成抽取加工的各種數(shù)據(jù),包括實體數(shù)據(jù)和關(guān)系數(shù)據(jù)。通過實體文件和
API。6.2.1.2.2 接口格式采用
JavaScript
對象簡譜(XML)、另一種標(biāo)記語言(YAML)。注1:JSON是一種輕量級的數(shù)據(jù)交換格式。注2:XML是一種簡單的數(shù)據(jù)存儲語言。注3:YAML是一個可讀性高,用來表達(dá)數(shù)據(jù)序列化的格式。6.2.2 知識加工知識加工以知識抽取階段形成的高質(zhì)量基礎(chǔ)數(shù)據(jù)作為輸入,輸出高質(zhì)量的知識圖譜構(gòu)建所依賴的實體、關(guān)系數(shù)據(jù)并形成醫(yī)療知識庫。知識加工主要包括以下步驟:a)
本體設(shè)計:1)
概念層定義:明確醫(yī)療知識圖譜構(gòu)建需要的實體類型與關(guān)系類型;2)
屬性定義:明確醫(yī)療知識圖譜構(gòu)建的各類實體需要的屬性名稱;3)
約束/4)
模式精簡:對同樣范圍的實體、關(guān)系,宜選擇精簡的關(guān)聯(lián)與表達(dá)方式;b)
實體獲?。?)
實體識別:在完成知識抽取后的數(shù)據(jù)中識別
a2)
關(guān)系識別:在完成知識抽取后的數(shù)據(jù)中識別
a3)
實體鏈指:將完成文本解析后的事件關(guān)聯(lián)方鏈接至對應(yīng)實體;4)
文本解析:利用
/關(guān)系屬性的槽填充。注:槽填充即從大規(guī)模的語料庫中抽取給定實體的被明確定義的屬性值的技術(shù)。c)
知識融合:1)
共指消解:將具有相同標(biāo)識的兩個實體合并為同一實體;2)
屬性融合:將同一標(biāo)識實體下,相同名稱的屬性所對應(yīng)的屬性值進(jìn)行融合;3)
規(guī)范化一:將不同實體屬性值與不同關(guān)系屬性值的表達(dá)方式進(jìn)行統(tǒng)一;4)
跨語言實體對齊:將不同語言的實體通過預(yù)訓(xùn)練翻譯模型和字符串相似匹配算法進(jìn)行對齊。3學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載T/CI
196—學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載知識評估到知識圖譜中。知識存儲6.4.1 屬性知識存儲6.4.1.1 屬性數(shù)據(jù)存儲內(nèi)容宜包含實體屬性和關(guān)系屬性。6.4.1.2 屬性數(shù)據(jù)存儲方式宜根據(jù)數(shù)據(jù)規(guī)模決定采用分布式存儲或單機(jī)存儲,主要包括單個和批量屬性數(shù)據(jù)的增加、更新、刪除操作。6.4.1.3 屬性數(shù)據(jù)存儲宜主要考慮下列因素:a)
高可用,主要包括:1)
雙機(jī)熱備;2)
雙機(jī)互備;3)
雙機(jī)雙工;b)
高并發(fā):可提供每秒查詢率大于
10
c)
高性能:數(shù)據(jù)實時寫入和實時讀取性能高,請求延遲小于
100
ms;d)
可擴(kuò)展:可按需增加集群的計算能力。6.4.2 圖數(shù)據(jù)存儲6.4.2.1
圖數(shù)據(jù)存儲內(nèi)容宜包括實體數(shù)據(jù)和關(guān)系數(shù)據(jù),分別以實體表和關(guān)系表的形式體現(xiàn)。6.4.2.2
圖數(shù)據(jù)存儲方式宜根據(jù)數(shù)據(jù)規(guī)模決定采用分布式存儲或單機(jī)存儲。6.4.2.3
圖數(shù)據(jù)存儲宜考慮的因素主要包括:a)
b)
各數(shù)據(jù)分片有多份副本,保證安全、可容災(zāi)、高可用等性能要求;c)
通過提高服務(wù)器硬件配置或服務(wù)器數(shù)量提升集群數(shù)據(jù)處理能力。6.4.3 全文檢索引擎6.4.3.1
全文檢索引擎的主要功能包括:a)
實時全文檢索;b)
實時條件過濾查詢;c)
實時復(fù)合條件查詢;d)
實時聚合查詢。6.4.3.2
檢索引擎宜根據(jù)數(shù)據(jù)規(guī)模決定采用分布式部署或單機(jī)部署。6.4.4 知識可視化知識可視化提供圖形化的操作界面,主要功能包括:a)
屬性展示:查看實體和關(guān)系的屬性詳細(xì)信息;b)
實體及關(guān)系過濾:篩選出關(guān)注的實體及關(guān)系,隱藏其他實體和關(guān)系;c)
前端效果配置:可對實體和關(guān)系展示的前端效果進(jìn)行顏色、形狀、尺寸的配置;d)
自適用頁面的展示:可支持放大、拖拽、調(diào)整結(jié)構(gòu)等操作;e)
爆炸節(jié)點(diǎn)的聚合:可防止因展示實體及關(guān)系過多而引起的前端崩潰、卡頓等問題。6.4.5 動態(tài)構(gòu)圖4學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載T/CI
196—學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載6.4.5.1
動態(tài)構(gòu)圖功能主要包括:a)
新增實體或關(guān)系類型;b)
新增實體或關(guān)系的屬性信息。6.4.5.2
新增實體或關(guān)系信息宜根據(jù)后續(xù)應(yīng)用的時效性決定采用實時或批量方式存儲,實現(xiàn)圖譜動態(tài)更新。6.4.6 權(quán)限管理權(quán)限管理功能主要包括:a)
實現(xiàn)不同應(yīng)用分區(qū)的構(gòu)建,各分區(qū)中實體、關(guān)系和屬性數(shù)據(jù)獨(dú)立管理;b)
7
系統(tǒng)要求功能要求7.1.1 構(gòu)建的醫(yī)療知識圖譜系統(tǒng)基本功能要求如下:a)
應(yīng)支持對知識的管理功能,包括知識抽取、知識加工、知識評估、知識存儲等;b)
理;c)
應(yīng)支持對算法的管理,采用多種方式提高算法魯棒性,增強(qiáng)安全性;注:魯棒性指在異常和危險情況下系統(tǒng)生存的能力。d)
宜支持機(jī)器學(xué)習(xí)主流算法;e)
宜支持機(jī)器學(xué)習(xí)模型訓(xùn)練優(yōu)化,包括支持模型組合和調(diào)參,支持加快模型訓(xùn)練和實驗調(diào)優(yōu);f)
宜支持產(chǎn)品化流程,提升模型訓(xùn)練迭代效率,提高模型性能和泛化能力;g)
服務(wù)接口規(guī)范制定等。7.1.2
知識采集功能要求如下:a)
對于內(nèi)部數(shù)據(jù),應(yīng)對數(shù)據(jù)進(jìn)行脫敏轉(zhuǎn)換后進(jìn)行使用;b)
對于外部數(shù)據(jù),應(yīng)通過接口采集或數(shù)據(jù)文件傳送采集數(shù)據(jù);c)
應(yīng)將采集到的數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫或存儲中,用于后續(xù)分析。7.1.3
知識建模功能要求如下:a)
體:b)
應(yīng)支持針對模式的增加、刪除、改動、查詢等操作;c)
應(yīng)支持自動化建模;d)
應(yīng)支持針對文本、向量、空間等索引查詢召回能力的索引配置能力;e)
宜支持引用其他領(lǐng)域已有的關(guān)系、實體定義等;f)
宜支持自上而下和自下而上的途徑進(jìn)行知識構(gòu)建;g)
宜支持流、批一體的構(gòu)建鏈路,支持醫(yī)療知識變更后秒級通過圖譜構(gòu)建鏈路更新到圖譜中;h)
宜支持多人在線協(xié)同編輯,且實時更新。7.1.4
知識獲取功能要求如下:a)
應(yīng)支持通過
NLP
更新或連接到圖譜中;b)
應(yīng)支持通過圖譜的模式建模能力將知識抽象成圖譜的實體、關(guān)系、屬性、約束等;5學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載T/CI
196—學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載c)
應(yīng)支持使用
規(guī)則結(jié)合模型,結(jié)合觸發(fā)詞等策略獲取事件分類、事件主體、事件客體等;d)
應(yīng)支持從不同信息源中采集特定實體的屬性信息;e)
宜支持通過有限配置構(gòu)建事件獲取服務(wù),并將獲取結(jié)果寫入圖譜。7.1.5 知識融合功能要求如下:a)
碼即可快速發(fā)現(xiàn)、消除重復(fù)冗余實體;b)
則管理能力;c)
公共實體,新增或覆蓋已有屬性;d)
融合知識圖譜間的結(jié)構(gòu)信息與語義信息;e)
宜支持關(guān)系分層繼承能力,方便概念管理;f)
宜支持多語言的知識融合;g)
宜支持新增知識的實時融合。7.1.6 知識評估功能應(yīng)支持智能評估與人工審核結(jié)合,針對知識正確性等進(jìn)行評估。7.1.7 知識存儲功能要求如下:a)
據(jù)模型的存儲;應(yīng)具備可擴(kuò)展性,可實現(xiàn)基于數(shù)據(jù)增長的彈性擴(kuò)展;b)
層應(yīng)用對于存儲組件進(jìn)行增加、刪除、改動、查詢的功能和性能需求;c)
高可用性、備份和還原的功能。性能要求7.2.1 可擴(kuò)展性對醫(yī)療知識圖譜系統(tǒng)的可擴(kuò)展性要求如下:a)
應(yīng)具備可擴(kuò)展性,根據(jù)需求隨時進(jìn)行擴(kuò)展和收縮;b)
宜支持自動伸縮機(jī)制的可信通道管理方案,簡單高效管理可信計算通道;c)
應(yīng)支持橫向擴(kuò)展,用戶可通過
API
直接接入。7.2.2 可靠性對醫(yī)療知識圖譜系統(tǒng)的可靠性要求如下:a)
應(yīng)確保數(shù)據(jù)按約定好的行為進(jìn)行使用,避免數(shù)據(jù)濫用;b)
力;c)
應(yīng)具備出現(xiàn)故障后系統(tǒng)進(jìn)行自動容災(zāi)恢復(fù)的能力,包括數(shù)據(jù)備份和恢復(fù)等。7.2.3 兼容性對醫(yī)療知識圖譜系統(tǒng)的兼容性要求如下:a)
應(yīng)兼容主流圖查詢語言及圖分析工具;b)
應(yīng)能在業(yè)界主流硬件上正常運(yùn)行;c)
宜支持多數(shù)據(jù)源的批量數(shù)據(jù)導(dǎo)入與更新;6學(xué)兔兔www.bzfxw.com標(biāo)準(zhǔn)下載T/CI
196—學(xué)兔兔ww
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 產(chǎn)后修復(fù)中心合同范本
- 勞務(wù)代管合同范本
- 加盟托管經(jīng)營合同范本
- 出租吊車服務(wù)合同范本
- 單位代建房合同范例
- 2013版建設(shè)合同范本
- 單位監(jiān)控安裝合同范本
- 個人雇傭出海作業(yè)合同范本
- 加工貨款合同貨款合同范本
- 個人山林承包合同范本
- 博覽會展位裝修及布展投標(biāo)方案技術(shù)標(biāo)
- 肝膿腫教學(xué)查房課件
- 物流營銷(第四版) 課件 胡延華 第3、4章 物流目標(biāo)客戶選擇、物流服務(wù)項目開發(fā)
- 拇外翻護(hù)理課件
- 六年級英語教學(xué)隨筆5篇
- (完整版)潔凈室工程師培訓(xùn)教材
- 新概念英語第三冊課后習(xí)題答案詳解
- 寧夏回族自治區(qū)地圖矢量動態(tài)PPT模板(圖文)
- 教育測量與評價第三版PPT完整全套教學(xué)課件
- 中小學(xué)教師教育法律法規(guī)培訓(xùn)PPT頁
- 醫(yī)療器械可用性工程文檔
評論
0/150
提交評論