版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
醫(yī)院臨床、運(yùn)營(yíng)和科研大數(shù)據(jù)平臺(tái)的基
礎(chǔ)架構(gòu)方案
應(yīng)用需求決定平臺(tái)架構(gòu),平臺(tái)架構(gòu)決定基礎(chǔ)架構(gòu)。三甲醫(yī)院大數(shù)
據(jù)應(yīng)用場(chǎng)景主要分成臨床、運(yùn)營(yíng)、科研三大類(lèi),分別對(duì)應(yīng)臨床數(shù)
據(jù)中心(CDR),運(yùn)營(yíng)數(shù)據(jù)中心(ODR)和科研數(shù)據(jù)中心(RDR),
臨床數(shù)據(jù)以電子病歷為核心,目前隨著結(jié)構(gòu)化電子病歷的普及,
純文本的數(shù)據(jù)越來(lái)越少,NLP的技術(shù)依然適合,運(yùn)營(yíng)數(shù)據(jù)則大多
數(shù)為結(jié)構(gòu)化數(shù)據(jù),科研數(shù)據(jù)則在臨床數(shù)據(jù)的基礎(chǔ)上有更多的多媒
體數(shù)據(jù)(多數(shù)為影像數(shù)據(jù))、實(shí)驗(yàn)數(shù)據(jù)和隨訪(fǎng)數(shù)據(jù)。大數(shù)據(jù)平臺(tái)
基礎(chǔ)架構(gòu)設(shè)計(jì)需要支撐上述需求的實(shí)現(xiàn),計(jì)算能力、存儲(chǔ)能力和
安全是基礎(chǔ)架構(gòu)建設(shè)的三個(gè)重要方面。計(jì)算能力主要在數(shù)據(jù)采
集、預(yù)處理、實(shí)時(shí)計(jì)算和分析階段進(jìn)行支持。存儲(chǔ)能力則是支持
分析數(shù)據(jù)所需要存儲(chǔ)資源和存儲(chǔ)空間的支持。三甲醫(yī)院大數(shù)據(jù)平
臺(tái)大多數(shù)基于Hadoop等分布式平臺(tái),采用內(nèi)存數(shù)據(jù)庫(kù)或圖數(shù)據(jù)庫(kù)
進(jìn)行數(shù)據(jù)存儲(chǔ)。
為幫助三甲醫(yī)院用戶(hù)更好地建設(shè)大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu),twt社區(qū)
上個(gè)星期組織了“三甲醫(yī)院如何建設(shè)支持臨床、運(yùn)營(yíng)和科研大數(shù)
據(jù)平臺(tái)的基礎(chǔ)架構(gòu)?”線(xiàn)上同行交流活動(dòng),特別邀請(qǐng)到自三甲醫(yī)
院的專(zhuān)家、戴爾科技醫(yī)療行業(yè)專(zhuān)家與醫(yī)院同行一起交流分享,現(xiàn)
將從四個(gè)角度出發(fā)的交流內(nèi)容總結(jié)如下,供更多同行參考,包
括:基于臨床、運(yùn)營(yíng)和科研大數(shù)據(jù)平臺(tái)的內(nèi)容和要求角度、基于
醫(yī)院大數(shù)據(jù)平臺(tái)建設(shè)的技術(shù)架構(gòu)角度、基于大數(shù)據(jù)平臺(tái)建設(shè)標(biāo)準(zhǔn)
和目標(biāo)角度、基于大數(shù)據(jù)的存儲(chǔ)規(guī)劃角度,以及交流達(dá)成的共識(shí)
總結(jié)。
交流達(dá)成的共識(shí)總結(jié)
通過(guò)本場(chǎng)醫(yī)院同行的交流活動(dòng)達(dá)成了一些交流共識(shí)如下,僅供參考:
(1)從大數(shù)據(jù)平臺(tái)建設(shè)內(nèi)容方面來(lái)說(shuō),醫(yī)院大數(shù)據(jù)平臺(tái)圍繞臨床、運(yùn)營(yíng)以及科
研等三個(gè)主要層面進(jìn)行,新技術(shù),新手段也都需要圍繞這三個(gè)方面,因此,
CDR、ODR、RDR的建設(shè)應(yīng)該說(shuō)是囊括了醫(yī)院信息化大數(shù)據(jù)平臺(tái)的主要內(nèi)容。
(2)從技術(shù)架構(gòu)角度來(lái)說(shuō),基于分布式存儲(chǔ)的架構(gòu)平臺(tái)似乎成為主流,但是目
前正在逐步從分布式過(guò)渡到云,主要以醫(yī)院的私有云+公有云的混合模式出現(xiàn)。
(3)從建設(shè)標(biāo)準(zhǔn)和目標(biāo)角度,大數(shù)據(jù)平臺(tái)應(yīng)具有異構(gòu)數(shù)據(jù)的標(biāo)準(zhǔn)化,數(shù)據(jù)處理
流程,分析過(guò)程標(biāo)準(zhǔn)化的功能,同時(shí),數(shù)據(jù)可視化也應(yīng)是目標(biāo)之一。
(4)從數(shù)據(jù)存存儲(chǔ)選型角度,混合SSD和傳統(tǒng)SATA的存儲(chǔ)器搭建SAN網(wǎng)絡(luò)是
一種路線(xiàn),分布式存儲(chǔ)的效果主要體現(xiàn)在不少醫(yī)院早些年建成的基于Hadoop架
構(gòu)。從科研平臺(tái)未來(lái)的發(fā)展看,采用支持Hadoop的分布式存儲(chǔ),實(shí)現(xiàn)計(jì)算與存
儲(chǔ)的分離,是未來(lái)的一個(gè)趨勢(shì)。
一、基于臨床、運(yùn)營(yíng)和科研大數(shù)據(jù)平臺(tái)的內(nèi)容和要求角度
1、三甲醫(yī)院大數(shù)據(jù)平臺(tái)如何建設(shè),才能滿(mǎn)足具有多模態(tài),異構(gòu)化,海量化的
臨床、運(yùn)營(yíng)以及科研數(shù)據(jù)的整合?
【問(wèn)題描述】眾所周知,三級(jí)醫(yī)院經(jīng)過(guò)十幾年、幾十年的信息化建設(shè),已經(jīng)建
設(shè)成為具有臨床數(shù)據(jù)支撐,科研支撐,以及運(yùn)營(yíng)支撐的全方位信息化應(yīng)用的場(chǎng)
景,但是隨著大數(shù)據(jù)分析廣泛應(yīng)用,海量數(shù)據(jù)的整合挖掘及再利用也提上日
程,部分醫(yī)院走在了前列,但是在開(kāi)展的過(guò)程中遇到了不少問(wèn)題,比如,數(shù)據(jù)
的模式的多樣性造成了對(duì)數(shù)據(jù)使用的難點(diǎn)。醫(yī)療數(shù)據(jù)中包含了文本,圖像,視
頻等,還有不同模式的數(shù)據(jù)。如何將這些數(shù)據(jù)整合利用,以便發(fā)揮數(shù)據(jù)的最大
利用價(jià)值成為目前醫(yī)療大數(shù)據(jù)平臺(tái)的研究方向之一?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
數(shù)據(jù)的多模態(tài)、異構(gòu)化、海量化必然導(dǎo)致其支撐架構(gòu)的多樣性。哪些數(shù)據(jù)適合
關(guān)系型數(shù)據(jù)庫(kù),哪些數(shù)據(jù)適合分布式數(shù)據(jù)庫(kù),存儲(chǔ)的選擇亦是如此,也要結(jié)合
數(shù)據(jù)類(lèi)型,數(shù)據(jù)的重要性、時(shí)效性要求以及業(yè)務(wù)的實(shí)際要求等因素綜合考慮。
數(shù)據(jù)的整合利用離不開(kāi)如下幾個(gè)方面的工作:
1,大數(shù)據(jù)平臺(tái)需求與多元化采集數(shù)據(jù)源的梳理;
2、數(shù)據(jù)的標(biāo)準(zhǔn)化規(guī)范化治理;
3、數(shù)據(jù)的主題化的匯聚;
4、數(shù)據(jù)的知識(shí)化社會(huì)化的應(yīng)用。
@spgoall和祐國(guó)際醫(yī)院信息管理部部長(zhǎng):
可以考慮先建立數(shù)據(jù)湖,把數(shù)據(jù)整合后,再按主題做篩選和清洗。
@Hunterl23戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
醫(yī)療數(shù)據(jù)的來(lái)源和類(lèi)型都非常的豐富,一般來(lái)講至少包含了HIS、EMR、LIS、
RIS、人事系統(tǒng)、隨訪(fǎng)系統(tǒng)、手麻、護(hù)理等等各個(gè)業(yè)務(wù)平臺(tái),數(shù)據(jù)類(lèi)型包含結(jié)構(gòu)
化數(shù)據(jù)、非結(jié)構(gòu)化文本、圖片、甚至有的會(huì)包括一些多媒體數(shù)據(jù),而這些數(shù)據(jù)
的復(fù)制、導(dǎo)入都有各自的方式。所以在大數(shù)據(jù)平臺(tái)的建設(shè)中,除了數(shù)據(jù)量的考
量,還需要充分考慮到對(duì)多樣化數(shù)據(jù)的集成問(wèn)題,需要支持豐富的數(shù)據(jù)訪(fǎng)問(wèn)接
口,以減少對(duì)數(shù)據(jù)集成帶來(lái)的困難。同時(shí)在使用這些數(shù)據(jù)時(shí),首先需要遵循國(guó)
內(nèi)、國(guó)際的相關(guān)標(biāo)準(zhǔn),進(jìn)行數(shù)據(jù)治理和標(biāo)準(zhǔn)化,然后將標(biāo)準(zhǔn)化后的數(shù)據(jù)按照不
同場(chǎng)景進(jìn)行計(jì)算整合,提供給業(yè)務(wù)使用。
2、信息部門(mén)該如何規(guī)劃CDR、ODR、RDR的裸金層?
【問(wèn)題描述】當(dāng)前建設(shè)CDR、ODR、RDR數(shù)據(jù)中心是醫(yī)療圈熱門(mén)的話(huà)題,信息部
門(mén)該如何規(guī)劃CDR、ODR、RDR的裸金層,一次把基礎(chǔ)架構(gòu)搭建立起來(lái),避免重
復(fù)建設(shè)?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
目前,CDR、ODR、RDR的定位和作用醫(yī)療圈是有共識(shí)的,但是其建設(shè)方式、模
式及數(shù)據(jù)交互方式尚處于百花齊放的階段。不同的公司有各自的解決方案,不
同的醫(yī)院和機(jī)構(gòu)也根據(jù)自己實(shí)際業(yè)務(wù)的需求和特點(diǎn)進(jìn)行著有針對(duì)性的建設(shè),所
以我理解因?yàn)槠浣ㄔO(shè)的非標(biāo)準(zhǔn)化恃性,希望有一種規(guī)劃、或者一種模式把基礎(chǔ)
架構(gòu)搭建起來(lái),然后后續(xù)不再變動(dòng),不再調(diào)整,從而避免重復(fù)建設(shè),這種本身
是與信息化技術(shù)與發(fā)展的日新月異的特性和特點(diǎn)相違背的。當(dāng)下,數(shù)字中國(guó)日
益提上日程、物聯(lián)網(wǎng)、5G的快速應(yīng)用、區(qū)塊鏈、數(shù)字李生、人工智能等新技術(shù)
與醫(yī)療的融合也將日益緊密,數(shù)據(jù)中臺(tái)的討論也不絕于耳。所以CDR、ODR、
RDR這種適合當(dāng)下的數(shù)據(jù)層架構(gòu)和方法論是否適合未來(lái)3-5年的技術(shù)發(fā)展尚不
可知,所以其基礎(chǔ)架構(gòu)的不確定性也更加不能形成定論。
目前就CDR、ODR、RDR的建設(shè)而言,個(gè)人覺(jué)得,應(yīng)該把握幾個(gè)建設(shè)原則:
(1)分類(lèi)原則。不管技術(shù)如何發(fā)展,架構(gòu)如何調(diào)整,數(shù)據(jù)的分類(lèi)應(yīng)該是不會(huì)有
太大的調(diào)整。結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化,其適宜的存儲(chǔ)架構(gòu)是有明確的規(guī)
范和要求的,數(shù)據(jù)的重要性與否,數(shù)據(jù)的響應(yīng)時(shí)效要求,數(shù)據(jù)容災(zāi)要求,這些
都是數(shù)據(jù)分類(lèi)的具體指標(biāo),也為我們底層架構(gòu)的建設(shè)提供指引,避免低需高配
和高需低配的情況出現(xiàn),保證需求和配置的相適宜;所以針對(duì)不同數(shù)據(jù)類(lèi)型和
數(shù)據(jù)要求,要有與之相適應(yīng)的存儲(chǔ)底層,故數(shù)據(jù)中心的裸金層也是存在多種架
構(gòu)存在的。
(2)可擴(kuò)展原則。CDR、ODR和RDR,在建設(shè)初期,因?yàn)樾枨蟮牟幻鞔_、中心數(shù)
據(jù)的磨合、與各業(yè)務(wù)系統(tǒng)的交互和上層應(yīng)用的梳理等原因,前期數(shù)據(jù)體量不會(huì)
太大,隨著業(yè)務(wù)的推進(jìn),技術(shù)、流程和方法的日趨成熟,需求也會(huì)處于井噴
期,其數(shù)據(jù)增長(zhǎng)也會(huì)指數(shù)型增長(zhǎng),原來(lái)的架構(gòu)應(yīng)該要充分考慮其可擴(kuò)展性,以
及擴(kuò)展后保證數(shù)據(jù)性能、數(shù)據(jù)時(shí)效響應(yīng)等方面不會(huì)下降。
@Hunterl23戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
沒(méi)有一蹴而就的系統(tǒng),也沒(méi)有一招鮮吃遍天的技術(shù);針對(duì)臨床數(shù)據(jù)中心
(CDR),運(yùn)營(yíng)數(shù)據(jù)中心(ODR)和科研數(shù)據(jù)中心(RDR)不同的特點(diǎn)可以用不同
的技術(shù)方法來(lái)滿(mǎn)足要求;CDRODR更多是結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)量相對(duì)較小,可以
采用關(guān)系型數(shù)據(jù)庫(kù)+SAN存儲(chǔ)的模式;如戴爾科技PowerStore企業(yè)級(jí)全閃存存
儲(chǔ);RDR涉及海量數(shù)據(jù)同時(shí)對(duì)算力要求非常高,可通過(guò)醫(yī)療數(shù)據(jù)湖+HPC高性能
計(jì)算集群來(lái)滿(mǎn)足業(yè)務(wù)要求;數(shù)據(jù)湖建設(shè)要考量海量數(shù)據(jù)復(fù)制遷移(多項(xiàng)目使用
是否要拷貝多份)、生命周期管理(性能容量要求和建設(shè)成本的矛盾);戴爾
科技PowerScale+ECS數(shù)據(jù)湖方案可以實(shí)現(xiàn)整合應(yīng)用、消除孤島、提高效率、降
低成本,并且有豐富的三甲醫(yī)院案例,可聯(lián)系我們當(dāng)?shù)丶夹g(shù)支持人員做進(jìn)一步
溝通交流;
3、醫(yī)療大數(shù)據(jù)方面如何解決數(shù)據(jù)孤島和數(shù)據(jù)安全問(wèn)題?
【問(wèn)題描述】在醫(yī)療數(shù)據(jù)收集方面存在很多檢查設(shè)備,例如:纖支鏡等單設(shè)備
無(wú)法提取數(shù)據(jù)的問(wèn)題。大數(shù)據(jù)處理過(guò)程中,如何保障數(shù)據(jù)的安全,以及隱私隱
私問(wèn)題?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
目前,的確存在很多單體設(shè)備的數(shù)據(jù)提取、存儲(chǔ)的問(wèn)題,尤其是對(duì)一些專(zhuān)有設(shè)
備如纖支鏡、腦電圖等,這些數(shù)據(jù)的采集要相應(yīng)的設(shè)備廠(chǎng)家能開(kāi)放相應(yīng)的數(shù)
據(jù)接口,目前很多這些設(shè)備的廠(chǎng)家基本都會(huì)有自己開(kāi)發(fā)的系統(tǒng),也有一些廠(chǎng)家
會(huì)開(kāi)發(fā)相應(yīng)的系統(tǒng),對(duì)市面上的比較高占有率的產(chǎn)品類(lèi)型進(jìn)行數(shù)據(jù)的提取開(kāi)
發(fā)。所以建議在采購(gòu)該類(lèi)設(shè)備的時(shí)候,一定要注意關(guān)注數(shù)據(jù)提取這塊,數(shù)據(jù)接
口是否開(kāi)放?通過(guò)特定數(shù)據(jù)線(xiàn)抑或是網(wǎng)絡(luò)傳輸?是否要專(zhuān)有信息系統(tǒng)抑或是市
面上有可以統(tǒng)一匯集提取的軟件?這些都要考慮并且也要寫(xiě)入采購(gòu)合同中。大
數(shù)據(jù)處理要嚴(yán)格執(zhí)行等保2.0的相關(guān)要求,數(shù)據(jù)的處理可以通過(guò)堡壘機(jī)等安全
措施進(jìn)行操作,另外可以通過(guò)脫敏設(shè)備對(duì)敏感數(shù)據(jù)進(jìn)行脫敏,并且形成相應(yīng)的
規(guī)范流程便于操作。數(shù)據(jù)安全要重視設(shè)備的投入、人員的管理、技術(shù)的提升,
也要關(guān)注架構(gòu)的合理、流程的規(guī)范、舉措的到位。
@spgoall和祐國(guó)際醫(yī)院信息管理部部長(zhǎng):
檢查設(shè)備數(shù)據(jù)傳輸問(wèn)題還是設(shè)備本身是否支持?jǐn)?shù)據(jù)輸出接口,這個(gè)需要聯(lián)合設(shè)
備科在購(gòu)買(mǎi)設(shè)備的時(shí)候就要把數(shù)據(jù)傳輸接口需求寫(xiě)入招標(biāo)文件。大數(shù)據(jù)處理過(guò)
程中的數(shù)據(jù)安全也應(yīng)該基于三級(jí)等保2.0的要求嚴(yán)格執(zhí)行,隱私問(wèn)題還要增加
動(dòng)態(tài)脫敏、數(shù)據(jù)庫(kù)防火墻等設(shè)備
?Hunter123戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
大數(shù)據(jù)最終為具體應(yīng)用服務(wù),數(shù)據(jù)的價(jià)值需要在具體應(yīng)用場(chǎng)景才能最大化;數(shù)
據(jù)采集作為大數(shù)據(jù)應(yīng)用的第一步,是大數(shù)據(jù)平臺(tái)的基礎(chǔ);針對(duì)沒(méi)有應(yīng)用場(chǎng)景需
求的設(shè)備,可暫緩數(shù)據(jù)采集;同時(shí)在未來(lái)的設(shè)備選型中,明確數(shù)據(jù)采集接口的
要求,為后續(xù)大數(shù)據(jù)應(yīng)用打下基礎(chǔ),等保2.0有完善的安全體系要求,就數(shù)據(jù)
安全而言,戴爾科技有完善的數(shù)據(jù)備份,數(shù)據(jù)容災(zāi),數(shù)據(jù)中勒索病毒后快速恢
復(fù),數(shù)據(jù)避風(fēng)港等解決方案。詳情可以咨詢(xún)戴爾當(dāng)?shù)氐匿N(xiāo)售和售前同事。大數(shù)
據(jù)隱私保護(hù),可通過(guò)數(shù)據(jù)脫敏及防泄密等安全手段進(jìn)行防護(hù);
4、關(guān)于科研大數(shù)據(jù)平臺(tái)底層基礎(chǔ)架構(gòu)
【問(wèn)題描述】科研大數(shù)據(jù)平臺(tái)現(xiàn)在發(fā)展方向主要有四個(gè)方向:影像,大樣本分
析,多模態(tài),真實(shí)世界研究,目前以真實(shí)世界研究居多,但是趨勢(shì)是往多模態(tài)
方向發(fā)展,這就要求傳統(tǒng)的文本,結(jié)構(gòu)化數(shù)據(jù)處理外,還需要結(jié)合影像圖片,
甚至是超聲之類(lèi)的視頻,對(duì)于這類(lèi)數(shù)據(jù)處理,底層基礎(chǔ)架構(gòu)如何支撐?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
存儲(chǔ)層面可以考慮分布式存儲(chǔ)、對(duì)象存儲(chǔ)等方式;數(shù)據(jù)層面可以考慮分布式數(shù)
據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)等方式。
@Hunterl23戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
科研數(shù)據(jù)類(lèi)型越來(lái)越多樣化,應(yīng)用軟件對(duì)底層基礎(chǔ)架構(gòu)的接口也越來(lái)越多樣
化,從傳統(tǒng)的NAS(SMB/NFS等)協(xié)議,到對(duì)象存儲(chǔ)S3以及HDFS(Hadoop分布式
文件系統(tǒng));這就需要底層存儲(chǔ)架構(gòu)架構(gòu)滿(mǎn)足豐富的非結(jié)構(gòu)化文件接口要求,
同時(shí)滿(mǎn)足同一份數(shù)據(jù)被不同方式調(diào)用,避免數(shù)據(jù)重復(fù)存儲(chǔ),造成資源浪費(fèi);同
時(shí)科研數(shù)據(jù)體量大,底層存儲(chǔ)要具備高擴(kuò)展性,只有真正意義上的分布式存儲(chǔ)
可滿(mǎn)足要求;同時(shí)科研平臺(tái)對(duì)算力的要求也特別高,需要一套匹配的高性能計(jì)
算集群(HPC)才能真正發(fā)揮數(shù)據(jù)的價(jià)值;計(jì)算存儲(chǔ)分離的架構(gòu),也更方便后續(xù)
靈活擴(kuò)展算力或者存儲(chǔ)資源,靈活響應(yīng)科研需求;
5、三甲醫(yī)院科研大數(shù)據(jù)平臺(tái)應(yīng)該具備哪些主要功能?
【問(wèn)題描述】結(jié)合現(xiàn)今人工智能,數(shù)據(jù)科學(xué)的流行,三甲醫(yī)院對(duì)科研的發(fā)展愈
加的重視,對(duì)于一個(gè)能夠完美支撐三甲醫(yī)院科研的數(shù)據(jù)平臺(tái)是非常必要的,但
是從業(yè)務(wù)和建設(shè)者角度來(lái)看,臨床科研的需求和計(jì)算機(jī)專(zhuān)業(yè)從業(yè)者之間對(duì)于技
術(shù)平臺(tái)的理解還有一定的差異,那么科研平臺(tái)應(yīng)該具有什么樣的功能,才能滿(mǎn)
足或推動(dòng)臨床科研的進(jìn)一步發(fā)展十分重要,這也是具備信息技術(shù)的從業(yè)人員需
要搞清楚的問(wèn)題。
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
科研平臺(tái)作為醫(yī)院科研領(lǐng)域重要的業(yè)務(wù)平臺(tái),要結(jié)合科研業(yè)務(wù)的特點(diǎn)進(jìn)行功能
的設(shè)計(jì)。因?yàn)榭蒲袠I(yè)務(wù)的復(fù)雜性和多樣性,所以也就導(dǎo)致科研平臺(tái)的功能是十
分復(fù)雜、十分多樣的成體系的存在。但是幾個(gè)大的功能科研平臺(tái)還是應(yīng)該具備
的:
1、數(shù)據(jù)的查詢(xún)和提取功能。科研業(yè)務(wù)的重要對(duì)象就是對(duì)數(shù)據(jù)的分析,針對(duì)某一
科研項(xiàng)目需求,能從平臺(tái)中查詢(xún)并提取出研究所需要的數(shù)據(jù),這個(gè)應(yīng)該是平臺(tái)
必備的功能;
2,科研信息圖譜的查詢(xún)??蒲袠I(yè)務(wù)在開(kāi)展前,需要進(jìn)行回顧性分析,對(duì)前人類(lèi)
似的科研業(yè)務(wù)、文獻(xiàn)、網(wǎng)絡(luò)資源等進(jìn)行綜合性查詢(xún)和分析,能讓研究者了解該
研究的整體的信息圖譜,為本次科研項(xiàng)目研究提供有效信息支撐;
3、科研人員圖譜查詢(xún)。要做好科研,要有合適的對(duì)的人參與進(jìn)來(lái)或者進(jìn)行相關(guān)
業(yè)務(wù)的合作,科研平臺(tái)能全方位的展示相關(guān)人員的科研信息,為科研人員提供
選擇參考將有利于科研項(xiàng)目的推進(jìn)。
@Dell_zhangcan戴爾科技醫(yī)療行業(yè)資深解決方案架構(gòu)師:
科研大數(shù)據(jù)平臺(tái)的建設(shè)自然是需要以科研為核心來(lái)進(jìn)行建設(shè),對(duì)于數(shù)據(jù)平臺(tái)來(lái)
講,主要的目標(biāo)還是科研數(shù)據(jù)的管理和提取統(tǒng)計(jì),考慮到醫(yī)療數(shù)據(jù)來(lái)源、類(lèi)型
多樣化,所以在科研大數(shù)據(jù)平臺(tái)需要具備靈活的數(shù)據(jù)處理功能,對(duì)數(shù)據(jù)的來(lái)
源、格式不能有太嚴(yán)格的要求;同時(shí)在提取統(tǒng)計(jì)時(shí)需要做到快速、高效,以幫
助提升科研效率。
另外,科研平臺(tái)還應(yīng)具有數(shù)據(jù)匯聚、數(shù)據(jù)分析、海量數(shù)據(jù)存儲(chǔ),數(shù)據(jù)查詢(xún)、數(shù)
據(jù)生命周期管理等功能。
6、醫(yī)院科研大數(shù)據(jù)平臺(tái),如何對(duì)臨床醫(yī)生真正有所幫助,無(wú)論是數(shù)據(jù)還是圖
像?
@Dellzhangcan戴爾科技醫(yī)療行業(yè)資深解決方案架構(gòu)師:
醫(yī)院科研大數(shù)據(jù)平臺(tái),大部分基于HADOOP技術(shù)框架,針對(duì)業(yè)界公認(rèn)的未來(lái)大
方向是計(jì)算與存儲(chǔ)分離。計(jì)算節(jié)點(diǎn)容易理解就是運(yùn)行集群管理和MapReduce的
計(jì)算資源,存儲(chǔ)推薦基于數(shù)據(jù)湖的HDFS解決方案,數(shù)據(jù)湖的核心定義就是一
個(gè)存儲(chǔ)平臺(tái),就是一種以集中式存儲(chǔ)各種類(lèi)型數(shù)據(jù)(包括PACS圖像、視頻
等),提供彈性的容量和吞吐能力,能夠覆蓋廣泛的數(shù)據(jù)源
(NFS/SMB/FTP/HTTP/S3),支持多種計(jì)算與處理分析引擎,并可以直接對(duì)數(shù)
據(jù)進(jìn)行訪(fǎng)問(wèn)的統(tǒng)一存儲(chǔ)平臺(tái)。
存儲(chǔ)與計(jì)算分離架構(gòu)提供了獨(dú)立的擴(kuò)展性,可以做到數(shù)據(jù)入湖(DataLake)的
同時(shí),計(jì)算引擎按需擴(kuò)容,更關(guān)鍵的是存算分離解耦方式帶來(lái)了更好的性?xún)r(jià)
比。
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
任何技術(shù)手段、架構(gòu)、方法、系統(tǒng)抑或是平臺(tái),包括醫(yī)院科研大數(shù)據(jù)平臺(tái)也是
如此,其目標(biāo)都是結(jié)合業(yè)務(wù)對(duì)數(shù)據(jù)、流程、模式等進(jìn)行再組織,從而實(shí)現(xiàn)用戶(hù)
既定目標(biāo)。系統(tǒng)平臺(tái)的建設(shè),表面看是信息化層面的建設(shè),但是其實(shí)質(zhì)是業(yè)務(wù)
流程的再造、知識(shí)的再重組梳理、數(shù)據(jù)的再組織,結(jié)合技術(shù)的特點(diǎn)和優(yōu)勢(shì),從
而實(shí)現(xiàn)業(yè)務(wù)自動(dòng)化乃至智能化。所以如果系統(tǒng)和平臺(tái)要建的好,相應(yīng)用戶(hù)如臨
床醫(yī)生的深度參與是密不可分,需求目標(biāo)要能明確提出、功能體系要充分驗(yàn)
證,數(shù)據(jù)質(zhì)量要監(jiān)控把關(guān),只有這樣,醫(yī)院科研大數(shù)據(jù)平臺(tái)的建設(shè)才能實(shí)現(xiàn)為
臨床醫(yī)生提供真正意義上,有感的幫助。
二、基于醫(yī)院大數(shù)據(jù)平臺(tái)建設(shè)的技術(shù)架構(gòu)角度
1、互聯(lián)網(wǎng)醫(yī)院的建設(shè)中,如何規(guī)劃大數(shù)據(jù)平臺(tái)的架構(gòu)?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
按照衛(wèi)健委發(fā)布的《互聯(lián)網(wǎng)醫(yī)院管理辦法(試行)》,互聯(lián)網(wǎng)醫(yī)院包括作為實(shí)
體醫(yī)療機(jī)構(gòu)第二名稱(chēng)的互聯(lián)網(wǎng)醫(yī)院,以及依托實(shí)體醫(yī)療機(jī)構(gòu)獨(dú)立設(shè)置的互聯(lián)網(wǎng)
醫(yī)院?;ヂ?lián)網(wǎng)醫(yī)院作為互聯(lián)網(wǎng)+醫(yī)療的組織表現(xiàn)形式,不管是哪種形式的互聯(lián)網(wǎng)
醫(yī)院,其業(yè)態(tài)是目前為止是一定的,如我們熟知的預(yù)約掛號(hào)、在線(xiàn)繳費(fèi)、在線(xiàn)
查詢(xún)檢驗(yàn)檢查報(bào)告、在線(xiàn)入出院等。隨著互聯(lián)網(wǎng)+醫(yī)療的深入結(jié)合,其服務(wù)模式
等也會(huì)有相應(yīng)創(chuàng)新性的發(fā)展。規(guī)劃互聯(lián)網(wǎng)醫(yī)院的大數(shù)據(jù)平臺(tái)架構(gòu)時(shí),要充分考
慮互聯(lián)網(wǎng)醫(yī)院現(xiàn)有業(yè)務(wù)模式下的數(shù)據(jù)概況,也要充分預(yù)留未來(lái)互聯(lián)網(wǎng)+醫(yī)療業(yè)務(wù)
爆炸式、井噴式發(fā)展時(shí),基礎(chǔ)架構(gòu)的可擴(kuò)展性、靈活度要能與之適配。
?Dellzhangcan戴爾科技醫(yī)療行業(yè)資深解決方案架構(gòu)師:
互聯(lián)網(wǎng)醫(yī)院的大數(shù)據(jù)平臺(tái)建設(shè)中常常遇到的典型問(wèn)題是如何應(yīng)對(duì)非結(jié)構(gòu)化數(shù)據(jù)
高速增長(zhǎng)帶來(lái)的存、管、用難題,比如:數(shù)據(jù)中轉(zhuǎn)效率低,性能跟不上,硬件
更新迭代如何數(shù)據(jù)遷移,歸檔怎么做,數(shù)據(jù)安全、合規(guī)怎么做,如何保障數(shù)據(jù)
長(zhǎng)期甚至是永久保留等等。因此規(guī)劃大數(shù)據(jù)平臺(tái)架構(gòu),主要需要支持以下能
力:
(1)采用支持不同應(yīng)用、多協(xié)議訪(fǎng)問(wèn)的數(shù)據(jù)湖解決方案
(2)分布式架構(gòu),支持橫向擴(kuò)展
(3)支持上下代兼容
(4)支持?jǐn)?shù)據(jù)自動(dòng)分層、歸檔功能
(5)支持備份、復(fù)制、防范勒索病毒方案
(6)支持基于網(wǎng)段、IP限制、多租戶(hù)、配額等權(quán)限管理
這里推薦數(shù)據(jù)湖存儲(chǔ)解決方案,數(shù)據(jù)湖的核心定義就是一個(gè)存儲(chǔ)平臺(tái),就是一
種以集中式存儲(chǔ)各種類(lèi)型數(shù)據(jù),提供彈性的容量和吞吐能力,能夠覆蓋廣泛的
數(shù)據(jù)源,支持多種計(jì)算與處理分析引擎,并可以直接對(duì)數(shù)據(jù)進(jìn)行訪(fǎng)問(wèn)的統(tǒng)一存
儲(chǔ)平臺(tái)。DELLEMCISILON數(shù)據(jù)湖存儲(chǔ),其核心基于分布式文件系統(tǒng)OneFS建立
的數(shù)據(jù)存儲(chǔ)方式,橫向擴(kuò)展能力強(qiáng)大,實(shí)現(xiàn)了集中統(tǒng)一管理,對(duì)同一份數(shù)據(jù)支
持多協(xié)議訪(fǎng)問(wèn),支持?jǐn)?shù)據(jù)(HDFS)就地分析(MapReduce),同時(shí)支持云原生應(yīng)用的
持久化存儲(chǔ),在數(shù)據(jù)安全方面支持備份、容災(zāi)、權(quán)限管理、勒索病毒防范和檢
測(cè)功能。
2、基礎(chǔ)架構(gòu)與醫(yī)院信息系統(tǒng)的融合問(wèn)題?
【問(wèn)題描述】如果醫(yī)院已經(jīng)建立集成平臺(tái),但缺乏專(zhuān)業(yè)的臨床科研數(shù)據(jù)平臺(tái),
怎樣將科研,管理,臨床平臺(tái)與現(xiàn)有集成平臺(tái)融合?;A(chǔ)架構(gòu)與新建信息平臺(tái)
的融合!
@Hunterl23戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
數(shù)據(jù)集成平臺(tái)的出現(xiàn)解決了不同信息化系統(tǒng)中的接口問(wèn)題,讓數(shù)據(jù)流動(dòng)起來(lái);
但科研,管理,臨床平臺(tái)最終目的是實(shí)現(xiàn)不同領(lǐng)域的業(yè)務(wù)應(yīng)用;臨床數(shù)據(jù)中心
(CDR),運(yùn)營(yíng)數(shù)據(jù)中心(ODR)更多是以結(jié)構(gòu)化數(shù)據(jù)為主數(shù)據(jù)類(lèi)型,數(shù)據(jù)總量
相對(duì)較小,很多醫(yī)院已經(jīng)基于集成平臺(tái)完成了CDR及ODR的業(yè)務(wù)應(yīng)用,如患者
360視圖等;科研數(shù)據(jù)中心(RDR)更多是非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)量大,數(shù)據(jù)類(lèi)型
多,對(duì)基礎(chǔ)架構(gòu)的要求也更高;在平臺(tái)規(guī)劃期更多要關(guān)注平臺(tái)擴(kuò)展性,和數(shù)據(jù)
處理能力;另外新應(yīng)用的建設(shè),也要考慮接口對(duì)接問(wèn)題,才能更好的與現(xiàn)有基
礎(chǔ)架構(gòu)融合。
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
首先,應(yīng)該要先理清各平臺(tái)的定位和作用,以及我們需要實(shí)現(xiàn)的目標(biāo)。集成平
臺(tái)是為了解決醫(yī)院系統(tǒng)間星狀交互導(dǎo)致的各類(lèi)問(wèn)題而提出來(lái)的系統(tǒng)交互平臺(tái),
其目標(biāo)在于實(shí)現(xiàn)系統(tǒng)間的互聯(lián)互通,系統(tǒng)間的互聯(lián)互通主要是通過(guò)平臺(tái)的標(biāo)準(zhǔn)
化接口實(shí)現(xiàn)??蒲?、管理、臨床作為醫(yī)院不同的業(yè)務(wù)領(lǐng)域,其實(shí)際業(yè)務(wù)目標(biāo)是
不相同的。又因?yàn)檫@三大業(yè)務(wù)領(lǐng)域中的具體業(yè)務(wù)各式各樣,所以業(yè)務(wù)系統(tǒng)數(shù)量
和種類(lèi)也是多而雜。集成平臺(tái)可以解決臨床、科研和管理等業(yè)務(wù)領(lǐng)域各類(lèi)系統(tǒng)
互聯(lián)、數(shù)據(jù)交互共享的問(wèn)題,但是如果是臨床、科研、管理等業(yè)務(wù)系統(tǒng)的數(shù)據(jù)
的融合利用,則需要通過(guò)CDR、ODR,RDR等各類(lèi)數(shù)據(jù)中心去實(shí)現(xiàn),通過(guò)對(duì)邏輯
數(shù)據(jù)的治理、存儲(chǔ)、利用,充分發(fā)揮數(shù)據(jù)資源的價(jià)值。
3、大數(shù)據(jù)平臺(tái)底層架構(gòu)規(guī)劃?
【問(wèn)題描述】大數(shù)據(jù)平臺(tái)架構(gòu)需要數(shù)據(jù)存儲(chǔ)和計(jì)算能力。醫(yī)療數(shù)據(jù)是多源異構(gòu)
的,有結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化,同時(shí)隨著未來(lái)物聯(lián)網(wǎng)、設(shè)備等數(shù)據(jù)的增
長(zhǎng),對(duì)大數(shù)據(jù)平臺(tái)的數(shù)據(jù)存儲(chǔ)要求會(huì)更高;大數(shù)據(jù)平臺(tái)需要滿(mǎn)足各種AI能力,
這部分體現(xiàn)在算力上,算力需要的軟件和硬件兩個(gè)層面的支撐。綜上,在建設(shè)
大數(shù)據(jù)平臺(tái)的時(shí)候,做好應(yīng)用的規(guī)劃的同時(shí),也需要充分規(guī)劃好底層基礎(chǔ)架
構(gòu),底層基礎(chǔ)架構(gòu)需要滿(mǎn)足先進(jìn)性、成熟性、使用性、開(kāi)放性、和擴(kuò)充性。問(wèn)
題:如何做好這部分規(guī)劃?
@Hunterl23戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
大數(shù)據(jù)平臺(tái)建設(shè)涉及數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)清洗、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用等
應(yīng)用流程;每一個(gè)流程都有不同的技術(shù)選型;結(jié)合在醫(yī)療實(shí)踐中總結(jié)的主要挑
戰(zhàn),需要重點(diǎn)關(guān)注平臺(tái)擴(kuò)展性、穩(wěn)定性、性能、及數(shù)據(jù)移動(dòng)等問(wèn)題;戴爾科技
集團(tuán)可提供端到端的醫(yī)療大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)方案,提供從云平臺(tái)、醫(yī)療數(shù)據(jù)
湖、HPC高性能計(jì)算集群等方案,解決大數(shù)據(jù)平臺(tái)建設(shè)中的挑戰(zhàn);并且有豐富
的案例,詳細(xì)方案可聯(lián)系我們當(dāng)?shù)氐募夹g(shù)支持人員;
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
個(gè)人覺(jué)得對(duì)于大數(shù)據(jù)平臺(tái)的底層基礎(chǔ)架構(gòu),也應(yīng)該根據(jù)其上層的應(yīng)用類(lèi)型、數(shù)
據(jù)類(lèi)型、時(shí)效要求、容災(zāi)要求等綜合考慮選取合適的,與之相適應(yīng)的底層架
構(gòu)?;\統(tǒng)的把整個(gè)大數(shù)據(jù)平臺(tái)放在某一種架構(gòu)中,不考慮其實(shí)際情況,將容易
導(dǎo)致資源利用與實(shí)際需求的不相符。大數(shù)據(jù)平臺(tái)的數(shù)據(jù)類(lèi)型及業(yè)務(wù)場(chǎng)景都是多
種多樣的,與之相適應(yīng)的,底層基礎(chǔ)架構(gòu)也應(yīng)該進(jìn)行分類(lèi)討論。就存儲(chǔ)底層而
言,存儲(chǔ)10要求高的,結(jié)構(gòu)化的數(shù)據(jù)則應(yīng)該用ssd全閃乃至NVMe全閃,要求
不高,數(shù)據(jù)量較大,非結(jié)構(gòu)化的數(shù)據(jù),則應(yīng)該考慮其他類(lèi)型的存儲(chǔ)、分布式存
儲(chǔ)乃至對(duì)象存儲(chǔ)架構(gòu)。
@陳建武漢市中心醫(yī)院系統(tǒng)運(yùn)維工程師:
大數(shù)據(jù)平臺(tái)的底層架構(gòu)主要是3個(gè)方面:數(shù)據(jù)的存儲(chǔ)、算力和算法,在這之上
來(lái)支撐數(shù)據(jù)的應(yīng)用,反哺業(yè)務(wù)。
4、三甲醫(yī)院大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)?
【問(wèn)題描述】應(yīng)用需求決定平臺(tái)架構(gòu),平臺(tái)架構(gòu)決定基礎(chǔ)架構(gòu),說(shuō)明醫(yī)院尤其
是大型三甲醫(yī)院大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)是很重要的,我的問(wèn)題是針對(duì)醫(yī)院不同類(lèi)
型的數(shù)據(jù)類(lèi)型,要充分考慮醫(yī)院數(shù)據(jù)的存儲(chǔ)方式和存儲(chǔ)能力,同時(shí)還要考慮系
統(tǒng)的計(jì)算能力,這是建設(shè)基礎(chǔ)架架的前提,希望有這方面建設(shè)的實(shí)例針對(duì)性的
分析,謝謝。
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
目前很多醫(yī)院在建設(shè)基礎(chǔ)架構(gòu)時(shí),正在逐步云化過(guò)渡,有些在建自己的私有
云,有一些會(huì)將一些業(yè)務(wù)放在公有云,都在做相應(yīng)的積極探索,當(dāng)然有利有
弊。在醫(yī)院基礎(chǔ)架構(gòu)云化的大背景下,我們?cè)诮ㄔO(shè)時(shí)應(yīng)該要以池的概念去綜合
考慮計(jì)算、存儲(chǔ)以及業(yè)務(wù)的問(wèn)題?,F(xiàn)在很多醫(yī)院都是區(qū)分內(nèi)外網(wǎng),并且系統(tǒng)都
做了不同程度的容災(zāi),還有很多系統(tǒng)正在上線(xiàn)開(kāi)發(fā),需要大量的測(cè)試環(huán)境,還
有很多對(duì)外交互的業(yè)務(wù)需要在DMZ區(qū),如醫(yī)保、支付寶、銀聯(lián)支付等。所以從
業(yè)務(wù)層面來(lái)劃分,可以分為內(nèi)網(wǎng)云、外網(wǎng)云、對(duì)外交互云、測(cè)試云、容災(zāi)云。
而針對(duì)不同云的特點(diǎn)要求,可以選取不同級(jí)別、不同性能、不同容量的設(shè)備和
技術(shù)體系進(jìn)行支撐,重要的、穩(wěn)定性要求高的、時(shí)延要求小的用高性能高可靠
的架構(gòu)體系,非結(jié)構(gòu)化、數(shù)據(jù)量大,訪(fǎng)問(wèn)頻率低的,可以考慮分布式存儲(chǔ)或?qū)?/p>
象存儲(chǔ),以此類(lèi)推。另外計(jì)算和存儲(chǔ)能力,在云化下,針對(duì)性的進(jìn)行池化分
析,計(jì)算池是否滿(mǎn)足計(jì)算要求,是否有GPU計(jì)算需求等,都要結(jié)合業(yè)務(wù)去具體
分析,容量池亦是如此,在此不再贅述
@Hunterl23戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
非常同意應(yīng)用需求和特點(diǎn)決定基礎(chǔ)架構(gòu)這個(gè)觀點(diǎn)。就戴爾科技落地的案例而
言,有醫(yī)院將PACS業(yè)務(wù)和Hadoop大數(shù)據(jù)分析業(yè)務(wù)都放到同一套8節(jié)點(diǎn)的分布
式集群存儲(chǔ)Isilon上運(yùn)行,也有大型三甲醫(yī)院將基因測(cè)序、影像AI、數(shù)字病
理等多個(gè)生命科學(xué)大數(shù)據(jù)應(yīng)用放到同一個(gè)數(shù)據(jù)湖中運(yùn)行。這兩個(gè)案例的共同點(diǎn)
是計(jì)算和存儲(chǔ)分類(lèi),服務(wù)器提供算力,專(zhuān)業(yè)的存儲(chǔ)設(shè)備保存數(shù)據(jù)和保護(hù)數(shù)據(jù)。
這樣做的好處有:
(1)架構(gòu)擴(kuò)展性好,可以根據(jù)算力和存儲(chǔ)的不同需求,按需擴(kuò)展對(duì)應(yīng)的資源;
(2)數(shù)據(jù)安全性好,專(zhuān)業(yè)的存儲(chǔ)設(shè)備可以提供數(shù)據(jù)分層、備份、容災(zāi)、歸檔等
多種數(shù)據(jù)保護(hù)功能;
(3)消除數(shù)據(jù)孤島,實(shí)現(xiàn)多模態(tài)數(shù)據(jù)高效利用。醫(yī)院有多個(gè)大數(shù)據(jù)應(yīng)用時(shí),如
果每個(gè)應(yīng)用都單獨(dú)建設(shè)一套基礎(chǔ)架構(gòu)平臺(tái),不僅會(huì)形成新的數(shù)據(jù)孤島,造成資
源浪費(fèi),還會(huì)因?yàn)閿?shù)據(jù)在各個(gè)平臺(tái)間進(jìn)行遷移/流動(dòng)造成數(shù)據(jù)利用率降低。
5、醫(yī)療大數(shù)據(jù)平臺(tái)不同的建設(shè)路線(xiàn)底層基礎(chǔ)架構(gòu)設(shè)計(jì)時(shí)有什么要求?
【問(wèn)題描述】目前醫(yī)療大數(shù)據(jù)平臺(tái)大多采用HADOOP+MapReduce、內(nèi)存數(shù)據(jù)庫(kù)
(以SAPHANA為代表的)以及圖數(shù)據(jù)庫(kù)(GP為代表),這幾種模式在底層基礎(chǔ)
架構(gòu)構(gòu)設(shè)計(jì)時(shí)有何區(qū)別?
@Dell_zhangcan戴爾科技醫(yī)療行業(yè)資深解決方案架構(gòu)師:
在大數(shù)據(jù)平臺(tái)建設(shè)中,無(wú)論是hadoop,mapreduce只是大數(shù)據(jù)平臺(tái)中的技術(shù)細(xì)
節(jié),只要是能滿(mǎn)足業(yè)務(wù)需求的采用哪種技術(shù)路線(xiàn)都是可以的。如果是規(guī)劃底層
的基礎(chǔ)構(gòu)架,靈活性是首先要考慮的問(wèn)題。目前大數(shù)據(jù)相關(guān)技術(shù)發(fā)展很快,開(kāi)
源的hadoop,spark等,公有云AWS,alibaba等也有相關(guān)的云服務(wù),IBM,醫(yī)
度云等專(zhuān)業(yè)務(wù)的ISV也可以提供各細(xì)分行業(yè)的大數(shù)據(jù)軟件和服務(wù)。在規(guī)劃大數(shù)
據(jù)平臺(tái)時(shí)要充分考慮技術(shù)的發(fā)展,我們自己的平臺(tái)要能適應(yīng)這些發(fā)展,比如涉
及敏感數(shù)據(jù)的需要自建平臺(tái)或用私有云平臺(tái)來(lái)承載,一些公開(kāi)數(shù)據(jù)可以直接采
用云服務(wù),我們的平臺(tái)從整體上看可以充分利用私有云和公有云的優(yōu)勢(shì),在滿(mǎn)
足數(shù)據(jù)安全的前提下從平臺(tái)層面打通公有云和私有云,整合兩種云的優(yōu)勢(shì),更
好的滿(mǎn)足業(yè)務(wù)需求。
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
底層基礎(chǔ)架構(gòu)設(shè)計(jì)不僅要考慮技術(shù)因素(性能、一致性要求、SQL兼容性要
求),也要考慮包括架構(gòu)產(chǎn)品的生態(tài)成熟度、應(yīng)用架構(gòu)適配度、團(tuán)隊(duì)適應(yīng)度等
非技術(shù)因素。Hadoop+MapReduce是典型的分布式文件系統(tǒng)+分布式計(jì)算的技術(shù)
框架,其組件HDFS就是典型的分布式存儲(chǔ)架構(gòu),分布式存儲(chǔ)架構(gòu)更為適合其技
術(shù)體系。內(nèi)存數(shù)據(jù)庫(kù)其主要的設(shè)計(jì)目標(biāo)是為了解決高并發(fā)低時(shí)延的數(shù)據(jù)管理需
求,依靠?jī)?nèi)存來(lái)存儲(chǔ)數(shù)據(jù)。從存儲(chǔ)速度來(lái)說(shuō),CPU寄存器>CPU緩存〉DDRDRAM>
持久型內(nèi)存〉NANDSSD>磁盤(pán)驅(qū)動(dòng)器(HDD)>磁帶,內(nèi)存數(shù)據(jù)應(yīng)該使用DDRDRAM
或持久型存儲(chǔ),區(qū)別在于DRAM目前為易失性存儲(chǔ),使用時(shí)速度較高,但是應(yīng)該
要充分考慮業(yè)務(wù)類(lèi)型和備份容災(zāi)方案,保證在極端情況下業(yè)務(wù)業(yè)務(wù)連續(xù)性,持
久型內(nèi)存相對(duì)來(lái)說(shuō)速度較慢,但是非易失,容量和價(jià)格也占優(yōu)勢(shì)。圖數(shù)據(jù)庫(kù)根
據(jù)其圖存儲(chǔ)和處理方式分為不同類(lèi)型,其底層的存儲(chǔ)架構(gòu)也要視圖數(shù)據(jù)庫(kù)采用
的技術(shù)類(lèi)型而選擇與之適應(yīng)的存儲(chǔ)類(lèi)別。另外,值得提出的是,不管是何種存
儲(chǔ)架構(gòu),要注意存儲(chǔ)的物理塊要與文件系統(tǒng)或數(shù)據(jù)庫(kù)中的邏輯塊大小上要適
配,減少同一數(shù)據(jù)操作頻次。而且在基礎(chǔ)架構(gòu)設(shè)計(jì)時(shí),也要關(guān)注業(yè)務(wù)類(lèi)型、成
本和投入的影響。
6、醫(yī)療大數(shù)據(jù)平臺(tái)在做存儲(chǔ)容量的規(guī)劃時(shí)應(yīng)考慮哪些因素?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
主要要考慮如下因素:
(1)業(yè)務(wù)的需求及增長(zhǎng)預(yù)期:要考慮現(xiàn)存數(shù)據(jù)的體量以及未來(lái)3-5年業(yè)務(wù)數(shù)據(jù)
的增長(zhǎng)量;
(2)數(shù)據(jù)的保存周期:數(shù)據(jù)保存期限多久,基礎(chǔ)數(shù)據(jù),過(guò)程數(shù)據(jù)、結(jié)果數(shù)據(jù)等
類(lèi)型數(shù)據(jù)的比例如何?保存周期的要求如何?
(3)架構(gòu)及容災(zāi)要求:是集中式架構(gòu)?還是分布式架構(gòu)?選擇的存儲(chǔ)產(chǎn)品的存
儲(chǔ)內(nèi)部組織方式如何?集中式架構(gòu)是否包括RAID抑或是全局打散?RAID的劃
分要求、熱備盤(pán)的要求如何?分布式架構(gòu)高可用要求如何?副本如何配置?容
災(zāi)要求如何,備份方式如何選擇?全備、差異,備份的方式、頻率及備份的保
存周期如何?
@ghost_liu:
(一)推算業(yè)務(wù)系統(tǒng)的容量需求
(1)業(yè)務(wù)的數(shù)據(jù)量預(yù)估,比如每周、每月、每年數(shù)據(jù)增量。
(2)數(shù)據(jù)需要保存多久。
(3)數(shù)據(jù)分析需要多少個(gè)副本,全量的還是差異量的副本。
(4)是否有備份、容災(zāi)的需求,備份頻率、保存周期等。
(二)推算存儲(chǔ)設(shè)備該買(mǎi)多少盤(pán)
(1)硬盤(pán)的進(jìn)制一般是1000進(jìn)制,操作系統(tǒng)是1024,需要折算一下單盤(pán)容
量。
(2)存儲(chǔ)設(shè)備的數(shù)據(jù)冗余方式,多副本還是EC/RAID?根據(jù)校驗(yàn)盤(pán)的比例來(lái)算
裸盤(pán)數(shù)量。
(3)還要查看所選中的存儲(chǔ)系統(tǒng)自己存儲(chǔ)元數(shù)據(jù)會(huì)消耗多少硬盤(pán)空間,把這部
分扣除才是系統(tǒng)可用容量。
(4)算了RAID/EC以后存儲(chǔ)可提供的容量以后,一般還要考慮加一個(gè)經(jīng)驗(yàn)系
數(shù),比如10%或者20%的余量,作為風(fēng)險(xiǎn)余量。主要是小文件一般都有寫(xiě)放大。
@Hunterl23戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
滿(mǎn)足當(dāng)下需求,照顧未來(lái)需求。滿(mǎn)足當(dāng)下需求就是當(dāng)下采購(gòu)或規(guī)劃容量一定要
滿(mǎn)足現(xiàn)有業(yè)務(wù)的要求,但大數(shù)據(jù)項(xiàng)目存儲(chǔ)容量往往有很大的不確定性,在選擇
平臺(tái)里一定要有靈活性,可以很方便的擴(kuò)展容量和性能,滿(mǎn)足未來(lái)不確定的需
求
7、數(shù)據(jù)湖的設(shè)計(jì)架構(gòu)帶來(lái)的疑問(wèn)?
【問(wèn)題描述】針對(duì)結(jié)構(gòu)化與非結(jié)構(gòu)化或半結(jié)構(gòu)化的統(tǒng)一存儲(chǔ)到數(shù)據(jù)湖,因醫(yī)療
行業(yè)信息化發(fā)展多年,業(yè)務(wù)流程、數(shù)據(jù)標(biāo)準(zhǔn)已有相應(yīng)的國(guó)家級(jí)規(guī)范,但是我的
理解數(shù)據(jù)入湖帶來(lái)的最大靈活性,數(shù)據(jù)不需要通常預(yù)先定義schema,那么應(yīng)用
層帶來(lái)的存儲(chǔ)系統(tǒng)訪(fǎng)問(wèn)、權(quán)限管理、業(yè)務(wù)模型的標(biāo)準(zhǔn)化層面,需要單獨(dú)來(lái)處
理,因?yàn)槲业睦斫猓瑪?shù)據(jù)湖架構(gòu)太過(guò)靈活而缺少對(duì)數(shù)據(jù)監(jiān)管、控制和必要的治
理手段,導(dǎo)致運(yùn)維成本不斷增加、數(shù)據(jù)治理效率降低,企業(yè)落入了r數(shù)據(jù)沼
澤」的境地,即數(shù)據(jù)湖中匯聚了太多的數(shù)據(jù),反而很難高效率的提煉真正有價(jià)
值的那部分,最后只能再次遷移到數(shù)據(jù)倉(cāng)庫(kù)設(shè)定數(shù)據(jù)平臺(tái),才能解決運(yùn)維、成
本、數(shù)據(jù)治理等問(wèn)題,我想了解Dell的大數(shù)據(jù)平臺(tái),在提供強(qiáng)大的計(jì)算/存儲(chǔ)
引擎的同時(shí),針對(duì)影像、語(yǔ)音等靈活的非結(jié)構(gòu)化數(shù)據(jù)與標(biāo)準(zhǔn)診療業(yè)務(wù)流程的結(jié)
構(gòu)化數(shù)據(jù)之間怎么有效的融合與一體化管理/治理,而不是說(shuō)讓醫(yī)院搞一個(gè)
Hadoop數(shù)據(jù)湖之后,需要再上一套數(shù)據(jù)倉(cāng)庫(kù)的解決方案,這樣增加醫(yī)院的維護(hù)
成本,或者說(shuō)再PASS平臺(tái)層的解決與推薦方案?
@Dell_zhangcan戴爾科技醫(yī)療行業(yè)資深解決方案架構(gòu)師:
影像、語(yǔ)音等靈活的非結(jié)構(gòu)化數(shù)據(jù)與標(biāo)準(zhǔn)診療業(yè)務(wù)流程的結(jié)構(gòu)化數(shù)據(jù)之間有效
的融合與一體化管理/治理這一需求涉及到業(yè)務(wù)融合的范疇,這一問(wèn)題應(yīng)有大數(shù)
據(jù)應(yīng)用提供廠(chǎng)家解決。戴爾科技的數(shù)據(jù)湖解決方案?jìng)?cè)重于解決數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)
高性能分析支持、數(shù)據(jù)安全保護(hù)、數(shù)據(jù)生命周期管理、數(shù)據(jù)容災(zāi)和歸檔、平臺(tái)
無(wú)縫擴(kuò)展等問(wèn)題。這些問(wèn)題需要硬件平臺(tái)和應(yīng)用提供廠(chǎng)家共同配合,才能給出
最完善的解決方案。
三、基于大數(shù)據(jù)平臺(tái)建設(shè)標(biāo)準(zhǔn)和目標(biāo)角度
1、醫(yī)療大數(shù)據(jù)團(tuán)隊(duì)如何建設(shè)?
【問(wèn)題描述】對(duì)于醫(yī)院建立醫(yī)療大數(shù)據(jù),如何組建團(tuán)隊(duì),需要哪些方面的人,
如何建立標(biāo)準(zhǔn)操作規(guī)范,如何確定目標(biāo)方向?如何考核和推進(jìn)工作?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
團(tuán)隊(duì)的建設(shè)要包含如下類(lèi)型的人才:
(1)管理人才:有較高的管理素養(yǎng),熟悉醫(yī)療大數(shù)據(jù)的業(yè)務(wù)方向和發(fā)展趨勢(shì),
能團(tuán)結(jié)團(tuán)隊(duì)人員朝著目標(biāo)努力和推進(jìn)工作;
(2)技術(shù)人才:包括懂標(biāo)準(zhǔn)規(guī)范方面、大數(shù)據(jù)技術(shù)能力(架構(gòu)的設(shè)計(jì)、搭建、
開(kāi)發(fā)、應(yīng)用等)等多方面大數(shù)據(jù)所需人才。
(3)數(shù)據(jù)治理人才:包括了解業(yè)務(wù),有較強(qiáng)的數(shù)據(jù)治理能力、數(shù)據(jù)處理能力和
分析挖掘能力等的人才;
標(biāo)準(zhǔn)操作規(guī)范的確立要結(jié)合業(yè)務(wù)流,形成本團(tuán)隊(duì)操作SOP,結(jié)合行業(yè)的研究熱
點(diǎn)、技術(shù)趨勢(shì)以及本單位醫(yī)療數(shù)據(jù)、人員等優(yōu)勢(shì),確立目標(biāo)方向,目標(biāo)的確定
可以分為近期目標(biāo)和遠(yuǎn)期目標(biāo),通過(guò)目標(biāo)的逐步實(shí)現(xiàn)慢慢積累經(jīng)驗(yàn),逐步深
入,進(jìn)而確定遠(yuǎn)期及戰(zhàn)略性目標(biāo)。考核工作應(yīng)該以人為主體維度,推進(jìn)工作應(yīng)
以事或項(xiàng)目為主體維度,形成行之有效的績(jī)效考核目標(biāo)、成立項(xiàng)目推進(jìn)工作組
等相關(guān)臨時(shí)組織,制定任務(wù)明晰、目標(biāo)明確的責(zé)任任務(wù)清單,將任務(wù)具體分
解,落實(shí)到人,進(jìn)而形成合理共同推進(jìn)相關(guān)工作。
2、臨床數(shù)據(jù)中心必須符合醫(yī)院的數(shù)據(jù)管理規(guī)范?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
無(wú)規(guī)不成方圓,標(biāo)準(zhǔn)化、規(guī)范化將極大促進(jìn)數(shù)據(jù)交互共享及后期的分析挖掘利
用。所以臨床數(shù)據(jù)中心的建設(shè)必須要符合數(shù)據(jù)管理規(guī)范,不僅要符合醫(yī)院層面
的數(shù)據(jù)管理規(guī)范,還要參考遵循國(guó)家、行業(yè)等層面的相關(guān)標(biāo)準(zhǔn)規(guī)范。
但是值得提出的是,目前很多醫(yī)院重系統(tǒng)建設(shè),輕標(biāo)準(zhǔn)建設(shè)。信息系統(tǒng)的建設(shè)
和運(yùn)維已經(jīng)讓醫(yī)院的信息部門(mén)不堪重負(fù),極少會(huì)開(kāi)展相應(yīng)數(shù)據(jù)標(biāo)準(zhǔn)的研究,也
極少有醫(yī)院會(huì)成立相應(yīng)的數(shù)據(jù)管理部門(mén),專(zhuān)責(zé)于開(kāi)展數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)治理及數(shù)
據(jù)利用。
@spgoal1和祐國(guó)際醫(yī)院信息管理部部長(zhǎng):
答案是肯定的,臨床數(shù)據(jù)中心的數(shù)據(jù)也在醫(yī)院管理范疇內(nèi),必須遵從管理規(guī)
范。
3、臨床大數(shù)據(jù)中心,怎樣將臨床醫(yī)生和護(hù)士的結(jié)構(gòu)化電子病歷數(shù)據(jù)直觀顯示
在臨床科室?
【問(wèn)題描述】臨床數(shù)據(jù)中心的數(shù)據(jù)應(yīng)該是醫(yī)院最核心的數(shù)據(jù),怎樣從結(jié)構(gòu)化電
子病歷中提取醫(yī)生和管理部門(mén)所需要的數(shù)據(jù),保障從數(shù)據(jù)到轉(zhuǎn)化,應(yīng)該是關(guān)鍵
問(wèn)題。
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
目前,臨床數(shù)據(jù)中心的利用有很多方式,包括360患者全息視圖、臨床決策支
持系統(tǒng)等,都可以基于數(shù)據(jù)中心中匯集的各業(yè)務(wù)系統(tǒng)(包括HIS、LIS、PACS
等)的數(shù)據(jù),提供利用轉(zhuǎn)化。臨床數(shù)據(jù)中心的利用,取決于醫(yī)院醫(yī)生和管理部
門(mén)數(shù)據(jù)需求的明晰化,這個(gè)是利用的目標(biāo),前提則是業(yè)務(wù)系統(tǒng)中有相關(guān)的數(shù)據(jù)
源,而重點(diǎn)在于數(shù)據(jù)源提供的數(shù)據(jù)有較高的數(shù)據(jù)質(zhì)量。不然數(shù)據(jù)的轉(zhuǎn)化利用效
果則會(huì)大打折扣。圍繞上面幾點(diǎn),臨床數(shù)據(jù)中心要扎實(shí)持續(xù)做好數(shù)據(jù)需求的分
析,保障數(shù)據(jù)源的穩(wěn)定,形成規(guī)范的數(shù)據(jù)治理體系,為后續(xù)數(shù)據(jù)的利用提供基
礎(chǔ)。
4、醫(yī)院各部門(mén)數(shù)據(jù)歸口不一致,如何解決?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
醫(yī)院部門(mén)間的數(shù)據(jù)歸口不一致是業(yè)務(wù)使然,是正常狀態(tài),如醫(yī)務(wù)部門(mén)的數(shù)據(jù)統(tǒng)
計(jì)口徑和統(tǒng)計(jì)部門(mén)的數(shù)據(jù)統(tǒng)計(jì)口徑往往是不一樣的,如就診人次數(shù)的統(tǒng)計(jì),他
們各自取的有可能是不同業(yè)務(wù)表的數(shù)據(jù),醫(yī)務(wù)部門(mén)可能統(tǒng)計(jì)掛號(hào)人次數(shù)作為就
診人次數(shù),而統(tǒng)計(jì)部門(mén)統(tǒng)計(jì)的是醫(yī)生看診人次數(shù)作為就診人次數(shù)。面對(duì)這樣的
問(wèn)題,個(gè)人理解應(yīng)該從如下方面解決:
(1)統(tǒng)一數(shù)據(jù)口徑。要梳理醫(yī)院現(xiàn)有各部門(mén)數(shù)據(jù)需求,充分分析研究各部門(mén)的
數(shù)據(jù)需求所對(duì)應(yīng)的業(yè)務(wù)目標(biāo),充分溝通協(xié)商,形成有效的、統(tǒng)一規(guī)范的統(tǒng)計(jì)數(shù)
據(jù)集;
(2)統(tǒng)一數(shù)據(jù)來(lái)源。業(yè)務(wù)數(shù)據(jù)統(tǒng)一匯聚在數(shù)據(jù)中心中,所有數(shù)據(jù)需求應(yīng)從數(shù)據(jù)
中心中獲取,從而避免從不同業(yè)務(wù)系統(tǒng)獲取數(shù)據(jù)導(dǎo)致的不一致情況。
@陳建武漢市中心醫(yī)院系統(tǒng)運(yùn)維工程師:
這個(gè)問(wèn)題現(xiàn)在是絕大部分醫(yī)院面臨的問(wèn)題,我個(gè)人建議是劃分業(yè)務(wù)域,建立指
標(biāo)庫(kù)。
舉個(gè)例子:
業(yè)務(wù)域:就診、計(jì)費(fèi),業(yè)務(wù)活動(dòng):門(mén)診就診、門(mén)診結(jié)算,原子指標(biāo):門(mén)診就診
人次、門(mén)診計(jì)算金額,派生指標(biāo):月度門(mén)診就診人次、月度門(mén)診藥品結(jié)算金
額,復(fù)合指標(biāo):月度門(mén)診藥品均次費(fèi)用。針對(duì)這個(gè)例子結(jié)合業(yè)務(wù)域?qū)⒃又笜?biāo)
歸口科室:門(mén)辦和財(cái)務(wù)科,那么通過(guò)原子指標(biāo)衍生的派生指標(biāo)和復(fù)合指標(biāo)口徑
就可以保持一致。需要注意的是:建立指標(biāo)庫(kù)的前提是要建立醫(yī)院的數(shù)據(jù)資
產(chǎn),關(guān)鍵就是元數(shù)據(jù)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)血緣等。
@潘延晟系統(tǒng)工程師:
現(xiàn)在很多行業(yè)做大數(shù)據(jù)都會(huì)面臨這種問(wèn)題,各部門(mén)分屬不同的領(lǐng)域,所以在構(gòu)
建大數(shù)據(jù)之前,首先我覺(jué)得要明確的就是項(xiàng)目的架構(gòu),信息化逐漸的已經(jīng)不再
是企業(yè)的輔助系統(tǒng),而是逐漸成為決策系統(tǒng),要做大數(shù)據(jù),那么首先要做的就
是把信息化做到一定的高度。底層的數(shù)據(jù)如病例,患者信息,醫(yī)院信息還有綜
合的財(cái)務(wù)等信息要打通,這部分需要多個(gè)部門(mén)來(lái)配合,并且由獨(dú)立的信息化部
門(mén)來(lái)牽頭完成的,梳理出數(shù)據(jù)的共性和特點(diǎn),然后建立公共的數(shù)據(jù)倉(cāng)庫(kù),再根
據(jù)業(yè)務(wù)的特點(diǎn)梳理出哪些信息是需要進(jìn)行挖掘的。很多時(shí)候,大數(shù)據(jù)平臺(tái)的邏
輯構(gòu)建要比物理建設(shè)更重要,要綜合現(xiàn)有的數(shù)據(jù)資源,共同分析才能形成更好
的思路。
5、CDR,ODR、RDR三者的邊界怎么劃分?面向臨床醫(yī)療醫(yī)生的數(shù)據(jù)呈現(xiàn)方式是
什么?
【問(wèn)題描述】臨床數(shù)據(jù)中心(CDR),運(yùn)營(yíng)數(shù)據(jù)中心(ODR)和科研數(shù)據(jù)中心
(RDR),三者存在交集,那么他們的邊界怎么劃分?面向臨床醫(yī)療醫(yī)生的數(shù)據(jù)
呈現(xiàn)方式是什么?
@spgoall和祐國(guó)際醫(yī)院信息管理部部長(zhǎng):
三大數(shù)據(jù)中心實(shí)際上就是三個(gè)業(yè)務(wù)主題,邊界取決于業(yè)務(wù)數(shù)據(jù)屬于哪個(gè)主題類(lèi)
別,但由于業(yè)務(wù)數(shù)據(jù)也存在多個(gè)類(lèi)別,所以存在交集,特別是臨床和科研,數(shù)
據(jù)交集比較多。
面向醫(yī)療臨床醫(yī)生的數(shù)據(jù)呈現(xiàn)方式主要還是患者360視圖,也就是基于一個(gè)患
者的全生命周期的診療數(shù)據(jù),如果數(shù)據(jù)能打通院外,那就可以以電子健康檔案
的方式呈現(xiàn)。
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
CDR、0DR和RDR都是基于業(yè)務(wù)領(lǐng)域進(jìn)行的邏輯層面的數(shù)據(jù)劃分和再組織,而實(shí)
際業(yè)務(wù)數(shù)據(jù)的產(chǎn)生也就是數(shù)據(jù)源是相同的,都是基于實(shí)際的業(yè)務(wù)系統(tǒng),如
HIS、LIS、PACS、HRP等。這三類(lèi)數(shù)據(jù)中心的目標(biāo)都是為了其相應(yīng)領(lǐng)域的上層
業(yè)務(wù)應(yīng)用的需求,在對(duì)實(shí)際業(yè)務(wù)數(shù)據(jù)多元化采集加工基礎(chǔ)上,進(jìn)行的主題化匯
聚,進(jìn)而知識(shí)化應(yīng)用。三大數(shù)據(jù)中心基于的業(yè)務(wù)領(lǐng)域分別為臨床、管理和科
研,雖然使用的數(shù)據(jù)源和維度可能有時(shí)相同,但是其基于此服務(wù)的應(yīng)用目標(biāo)是
不一樣的。舉個(gè)例子,急診就診人員信息表,在CDR和0DR都可能有這部分?jǐn)?shù)
據(jù),但是CDR中可能服務(wù)的上層應(yīng)用是為某個(gè)急診醫(yī)生查詢(xún)本人看診人員數(shù)量
或者查詢(xún)剩余就診人數(shù),0DR中該部分?jǐn)?shù)據(jù)主要是為醫(yī)務(wù)管理人員查詢(xún)某天、
某月乃至某年急診人次數(shù)抑或是通過(guò)可視化的方式展現(xiàn)急診就診人數(shù)的趨勢(shì)
圖,或者結(jié)合時(shí)間、職業(yè)等進(jìn)行關(guān)聯(lián)分析得出相關(guān)的趨勢(shì)分析。所以我個(gè)人認(rèn)
為三者的邊界是模糊的,要基于業(yè)務(wù)領(lǐng)域和場(chǎng)景具體情況具體分析。
面向臨床醫(yī)療醫(yī)生的數(shù)據(jù)展現(xiàn)方式有十分多的類(lèi)型和方式,可視化、多維度,
相關(guān)的技術(shù)和工具以及相關(guān)的人員及業(yè)務(wù)都是相對(duì)較為成熟和成體系的。重點(diǎn)
不在于有哪些類(lèi)型和方式,重點(diǎn)在于展現(xiàn)的需求是否明確,展現(xiàn)的數(shù)據(jù)是否有
來(lái)源,展現(xiàn)的數(shù)據(jù)質(zhì)量是否足夠高,這三個(gè)是對(duì)臨床醫(yī)療醫(yī)生的數(shù)據(jù)呈現(xiàn)問(wèn)題
需要解決的三大問(wèn)題。
@Hunterl23戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
數(shù)據(jù)中心建立的最終目的是為上層應(yīng)用服務(wù),每個(gè)醫(yī)院的建設(shè)的大數(shù)據(jù)應(yīng)用側(cè)
重點(diǎn)不同,邊界劃分方法也不同;總的來(lái)說(shuō)CDR及ODR數(shù)據(jù)多是來(lái)自當(dāng)前
HIS、EMR等系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),應(yīng)用也傾向于CDSS臨床輔助決策、病種質(zhì)控
及醫(yī)院管理等應(yīng)用;RDR數(shù)據(jù)多是組學(xué)、病理、影像等非結(jié)構(gòu)化數(shù)據(jù),多用于
臨床科研、AI應(yīng)用等場(chǎng)景;
四、基于大數(shù)據(jù)的存儲(chǔ)規(guī)劃角度
1、如何處理數(shù)據(jù)的存儲(chǔ)問(wèn)題,尤其是影像數(shù)據(jù)?
【問(wèn)題描述】建設(shè)科研大數(shù)據(jù)平臺(tái),一般都是將各個(gè)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)重新收集
整理,結(jié)構(gòu)化的數(shù)據(jù)也還好,并不占用空間,而非結(jié)構(gòu)化的數(shù)據(jù)例如影像數(shù)
據(jù),一個(gè)大型三甲醫(yī)院的增量是非常大的,如果這些數(shù)據(jù)都抽取到科研大數(shù)據(jù)
平臺(tái)醫(yī)院相當(dāng)于又要重新建設(shè)存儲(chǔ),如何平衡這些非結(jié)構(gòu)化的數(shù)據(jù)的存儲(chǔ)?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
對(duì)于這類(lèi)數(shù)據(jù),應(yīng)該要做好統(tǒng)籌規(guī)劃,醫(yī)院的數(shù)據(jù)都是會(huì)做容災(zāi)備份的,所以
一般醫(yī)院存放同類(lèi)數(shù)據(jù)基本都是2份或2份以上,在業(yè)務(wù)系統(tǒng)、科研大數(shù)據(jù)平
臺(tái)或者別的其他應(yīng)用系統(tǒng)對(duì)某個(gè)非結(jié)構(gòu)化數(shù)據(jù)有讀取或使用需求的時(shí)候,應(yīng)該
充分利用容災(zāi)備份環(huán)境中的同類(lèi)數(shù)據(jù)。另外,在軟件設(shè)計(jì)和數(shù)據(jù)庫(kù)存放時(shí),該
類(lèi)增量較大的非結(jié)構(gòu)化數(shù)據(jù)以地址指針的方式存放,如需要調(diào)用時(shí)再通過(guò)地址
調(diào)轉(zhuǎn)到實(shí)際的數(shù)據(jù)存放路徑。這樣將極大的緩解該部分?jǐn)?shù)據(jù)的讀寫(xiě)壓力。
?Dellzhangcan戴爾科技醫(yī)療行業(yè)資深解決方案架構(gòu)師:
建議前期可以將醫(yī)院的PACS類(lèi)非結(jié)構(gòu)化數(shù)據(jù)都直接放入數(shù)據(jù)湖中,后期基于
數(shù)據(jù)湖建設(shè)影像大數(shù)據(jù)平臺(tái),這樣能實(shí)現(xiàn)數(shù)據(jù)的就地存儲(chǔ)和就地分析,避免了
海量數(shù)據(jù)在多個(gè)平臺(tái)間遷來(lái)遷去。戴爾科技的數(shù)據(jù)湖還支持重復(fù)數(shù)據(jù)消除功
能,這樣即使在數(shù)據(jù)湖中復(fù)制幾百TB的影像數(shù)據(jù)用于科研,也不增加過(guò)多的
存儲(chǔ)容量,而且數(shù)據(jù)復(fù)制的速度極快。
2、醫(yī)院大數(shù)據(jù)平臺(tái)、科研平臺(tái)等推薦什么存儲(chǔ)架構(gòu)?
【問(wèn)題描述】醫(yī)院大數(shù)據(jù)平臺(tái)、科研平臺(tái)等平臺(tái),推薦存儲(chǔ)架構(gòu)是?除了分布
式架構(gòu)的分布式存儲(chǔ),能否做個(gè)分析,用哪種類(lèi)型的存儲(chǔ)適合非特大型三甲醫(yī)
院呢?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
醫(yī)院大數(shù)據(jù)平臺(tái)、科研平臺(tái)等平臺(tái),鑒于其數(shù)據(jù)的多模態(tài)、異構(gòu)化、海量化,
建議存儲(chǔ)架構(gòu)也是混合多樣的,要針對(duì)數(shù)據(jù)類(lèi)型、業(yè)務(wù)需求、性能要求等綜合
考慮,結(jié)合分析。即使是非特大型三甲醫(yī)院,其基本業(yè)務(wù)也是和三家醫(yī)院相差
無(wú)幾的,只是同樣的系統(tǒng),體量不同而已。如果體量不大、增量不高,為了方
便維護(hù),可以考慮超融合的架構(gòu)體系也可以考慮一體化存儲(chǔ)的方式,存儲(chǔ)中涵
蓋了閃存等高速盤(pán),也有SAS、SATA等低速盤(pán),支持NFS、ISCSI等協(xié)議方式,
但是值得提出的是這類(lèi)存儲(chǔ)雖然支持容量的擴(kuò)展,但是存儲(chǔ)機(jī)頭的緩存、性能
等可能會(huì)成為后續(xù)擴(kuò)容、擴(kuò)展的瓶頸,所以要對(duì)這方面特別關(guān)注。避免后續(xù)成
為性能瓶頸。
@Hunterl23戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
大數(shù)據(jù)平臺(tái)的存儲(chǔ)架構(gòu)選擇與平臺(tái)的應(yīng)用特點(diǎn)密切相關(guān)。如果是采用傳統(tǒng)數(shù)據(jù)
庫(kù)+Hadoop架構(gòu),而且運(yùn)行在虛擬機(jī)上的大數(shù)據(jù)應(yīng)用,可以采用全閃分布式存
儲(chǔ),也可以采用全閃SAN存儲(chǔ)。如果是要采用HPC架構(gòu),基于物理服務(wù)器做基
因測(cè)序等生命科學(xué)類(lèi)應(yīng)用,則需要根據(jù)是否運(yùn)行Lustre、BeeGFS等并行文件系
統(tǒng)選擇存儲(chǔ)架構(gòu)。如果不使用并行文件系統(tǒng),那么分布式存儲(chǔ)是很好的選擇。
就非特大型醫(yī)院而言,戴爾科技的PowerScale(Isilon)是非常適合的大數(shù)據(jù)
存儲(chǔ)。在生產(chǎn)實(shí)踐中,有醫(yī)院將PACS業(yè)務(wù)和CDR(基于Hadoop)放在同一套
Isilon存儲(chǔ)上運(yùn)行,不僅節(jié)省了硬件投資和機(jī)房空間,平臺(tái)的擴(kuò)展性和數(shù)據(jù)安
全性也得到了大大的提高。
3、關(guān)系型數(shù)據(jù)庫(kù),非關(guān)系型數(shù)據(jù)庫(kù)還是分布式數(shù)據(jù)庫(kù),醫(yī)療大數(shù)據(jù)平臺(tái)基礎(chǔ)
架構(gòu)如何考慮?大型的數(shù)據(jù)整合平臺(tái)如何將異構(gòu)化數(shù)據(jù)統(tǒng)一整合,是使用傳統(tǒng)
數(shù)據(jù)庫(kù)技術(shù)還是采用其他方案?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
要考慮數(shù)據(jù)類(lèi)型、業(yè)務(wù)場(chǎng)景、時(shí)效要求、性能要求等因素。因?yàn)閿?shù)據(jù)的多樣性
必然導(dǎo)致基礎(chǔ)架構(gòu)的復(fù)雜性、差異性和多樣性。多種類(lèi)型的數(shù)據(jù)庫(kù)、存儲(chǔ)架構(gòu)
并存應(yīng)該是醫(yī)療大數(shù)據(jù)平臺(tái)的常態(tài),鑒于底層架構(gòu)對(duì)數(shù)據(jù)及應(yīng)用上層的透明性
特點(diǎn),結(jié)構(gòu)化關(guān)系型數(shù)據(jù)雖然也能存放在分布式或?qū)ο蟠鎯?chǔ)中,但是其性能必
然大打折扣,不同的數(shù)據(jù)庫(kù)設(shè)計(jì)是,其適宜存儲(chǔ)和處理的數(shù)據(jù)對(duì)象是一定的,
所以我們?cè)诳紤]醫(yī)療大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)是,要結(jié)合業(yè)務(wù)場(chǎng)景、數(shù)據(jù)類(lèi)型、以
及各類(lèi)數(shù)據(jù)庫(kù)、存儲(chǔ)架構(gòu)的技術(shù)特點(diǎn)綜合去考慮。
觸elLzhangcan戴爾科技醫(yī)療行業(yè)資深解決方案架構(gòu)師:
目前各種類(lèi)型的數(shù)據(jù)庫(kù)在數(shù)據(jù)平臺(tái)上都有一定的實(shí)踐,數(shù)據(jù)平臺(tái)的選擇一般從
數(shù)據(jù)量和負(fù)載兩個(gè)層面來(lái)考慮:
從醫(yī)療大數(shù)據(jù)的實(shí)際情況看,醫(yī)療領(lǐng)域除影像系統(tǒng)外其實(shí)很難說(shuō)有真正意義上
的''大”數(shù)據(jù),一般來(lái)講都在幾十TB到數(shù)百TB之間,有些規(guī)模比較小的醫(yī)院
可能只有幾TB;這些雖然都被稱(chēng)作數(shù)據(jù)平臺(tái)或大數(shù)據(jù)平臺(tái),但在實(shí)際運(yùn)行中有
很大的不同。而不同醫(yī)院間數(shù)據(jù)平臺(tái)業(yè)務(wù)負(fù)載的區(qū)別就更大。
一般來(lái)講在數(shù)據(jù)量較小的情況下,各種數(shù)據(jù)庫(kù)功能性上都沒(méi)有問(wèn)題,但NoSQL
數(shù)據(jù)庫(kù)或分布式數(shù)據(jù)庫(kù)在運(yùn)維管理上會(huì)相對(duì)復(fù)雜一些;一般的關(guān)系型數(shù)據(jù)庫(kù)
(類(lèi)似oracle)是以行方式進(jìn)行數(shù)據(jù)操作,這種方式在幾十TB的數(shù)據(jù)量上會(huì)
有比較一定的效率問(wèn)題,在這時(shí)候就可以開(kāi)始考慮使用以列為方式操作的
NoSQL數(shù)據(jù)庫(kù),以提升數(shù)據(jù)檢索、計(jì)算的效率;在業(yè)務(wù)負(fù)載較重的情況下,如
果考慮到單機(jī)性能無(wú)法滿(mǎn)足業(yè)務(wù)需求,則可以考慮使用分布式的部署方式,利
用多臺(tái)機(jī)器并發(fā)以達(dá)到提升運(yùn)行效率的目的。
4、如何解決存儲(chǔ)擴(kuò)容時(shí)不同廠(chǎng)商技術(shù)之間差異化問(wèn)題?
@zyp8365廣東省中醫(yī)院高級(jí)工程師:
可以通過(guò)云存儲(chǔ)的方式去解決。其中有兩種比較常見(jiàn)的方式:
(1)網(wǎng)關(guān)的方式。如IBM的SVC,EMC的Vplex,通過(guò)存儲(chǔ)網(wǎng)關(guān)將不同廠(chǎng)家的
存儲(chǔ)匯集起來(lái)再對(duì)外開(kāi)放;
(2)外接存儲(chǔ)的方式。通過(guò)某一高性能的存儲(chǔ)其自帶的虛擬化套件,然后將其
他存儲(chǔ)外接到其上面,相當(dāng)于外置硬盤(pán)一樣,統(tǒng)一由該高端存儲(chǔ)匯集后對(duì)外開(kāi)
放。
5、對(duì)于醫(yī)院各種類(lèi)型的數(shù)據(jù),分別用什么方式、什么設(shè)備存儲(chǔ)最適合?
@Hunterl23戴爾科技醫(yī)療行業(yè)解決方案架構(gòu)師:
從理論上說(shuō)上層應(yīng)用架構(gòu)決定下層基礎(chǔ)設(shè)施架構(gòu),醫(yī)院通常有三大類(lèi)應(yīng)用:
1)HIS、EMR等運(yùn)行在物理環(huán)境的傳統(tǒng)核心應(yīng)用;
2)運(yùn)行在虛擬機(jī)中的非核心應(yīng)用;
3)需要運(yùn)行Hadoop,HPC等的大數(shù)據(jù)類(lèi)應(yīng)用;
表面上看,存儲(chǔ)架構(gòu)選型需要根據(jù)應(yīng)用特點(diǎn)和存儲(chǔ)特點(diǎn)來(lái)確定
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 外墻涂料工程招標(biāo)說(shuō)明
- 財(cái)務(wù)審計(jì)勞務(wù)合同
- 個(gè)人短期借款合同示例
- 中原地產(chǎn)房屋買(mǎi)賣(mài)合同風(fēng)險(xiǎn)提示
- 顯示屏采購(gòu)合約格式
- 酒店制服購(gòu)銷(xiāo)合約
- 廣華客運(yùn)站招標(biāo)要求及流程詳解
- 招標(biāo)文件制作招標(biāo)
- 網(wǎng)絡(luò)服務(wù)合同協(xié)議范本
- 中小企業(yè)借款合同英文
- 吸附計(jì)算完整
- 無(wú)人機(jī)在農(nóng)業(yè)領(lǐng)域的實(shí)踐應(yīng)用與發(fā)展前景
- 《綜合實(shí)踐一-用多媒體介紹湖北名人課件》小學(xué)信息技術(shù)華中科大課標(biāo)版五年級(jí)下冊(cè)課件2919
- 《養(yǎng)成良好的行為習(xí)慣》主題班會(huì)課件
- 焊接設(shè)備的新技術(shù)革新與應(yīng)用規(guī)范
- 公民科學(xué)素質(zhì)調(diào)查問(wèn)卷
- 土壤采樣方案
- 110kV升壓站構(gòu)支架組立施工方案
- 何以中國(guó):公元前的中原圖景
- 【中藥貯藏與養(yǎng)護(hù)問(wèn)題及解決對(duì)策4000字(論文)】
- 自然環(huán)境對(duì)聚落的影響
評(píng)論
0/150
提交評(píng)論