下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、醫(yī)療大數(shù)據(jù)搜索系統(tǒng)的建設(shè)與應(yīng)用摘要:醫(yī)院信息化的建設(shè)過程中,各個(gè)系統(tǒng)圍繞業(yè)務(wù)應(yīng)用分批分期建立,逐步 覆蓋業(yè)務(wù)全流程的同時(shí),積累了大量醫(yī)療數(shù)據(jù),這些數(shù)據(jù)均具有多源異構(gòu)、分布 式、碎片化等特點(diǎn)。為有效整合分散于各獨(dú)立系統(tǒng)中的數(shù)據(jù),并利用這些數(shù)據(jù)更 好地為臨床科研服務(wù),以滿足日益增長(zhǎng)的臨床科研數(shù)據(jù)服務(wù)需求。本文對(duì)醫(yī)療大 數(shù)據(jù)搜索系統(tǒng)的建設(shè)與應(yīng)用進(jìn)行探討。關(guān)鍵詞:醫(yī)療大數(shù)據(jù);搜索系統(tǒng);建設(shè)應(yīng)用1功能實(shí)現(xiàn)1.1科研數(shù)據(jù)中心科研數(shù)據(jù)中心按照人數(shù)和人次維度建立索引以滿足不同科研的查詢需求,并 以ElasticSearch專用格式建立索引文檔。索引文檔設(shè)計(jì)時(shí)需保留數(shù)據(jù)間的業(yè)務(wù)關(guān) 系,這不僅可實(shí)現(xiàn)搜索內(nèi)容的秒級(jí)
2、呈現(xiàn),還支持組合、多級(jí)條件查詢。另外索引 項(xiàng)目的建立也結(jié)合了臨床業(yè)務(wù)常用查詢需求,確保符合用戶科研搜索使用習(xí)慣。 1.2數(shù)據(jù)搜索及導(dǎo)出在對(duì)數(shù)據(jù)庫(kù)存儲(chǔ)結(jié)構(gòu)非常熟悉的情況下,基于傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的復(fù)雜檢索 可能需要耗費(fèi)幾個(gè)甚至十幾個(gè)小時(shí)。本文提出的醫(yī)療大數(shù)據(jù)搜索系統(tǒng)通過大數(shù)據(jù) 搜索引擎技術(shù),可實(shí)現(xiàn)互聯(lián)網(wǎng)的快速交互響應(yīng),支持用戶對(duì)搜索內(nèi)容的秒級(jí)呈現(xiàn), 同時(shí)還結(jié)合了臨床業(yè)務(wù)建立常用查詢、導(dǎo)出項(xiàng)目,方便醫(yī)生的快速學(xué)習(xí)和使用。 1.3數(shù)據(jù)管理及隱私保護(hù)考慮到醫(yī)療數(shù)據(jù)的患者隱私保護(hù)與保留數(shù)據(jù)的研究規(guī)律,在數(shù)據(jù)脫敏設(shè)計(jì)上 去除單一粗暴的隱私數(shù)據(jù)替換功能,采用當(dāng)前主流的脫敏技術(shù),提供多種脫敏方 式,包括全部替換
3、、局部替換、日期偏移、數(shù)據(jù)映射、截?cái)?、遮罩、?shù)值取整和 自動(dòng)編號(hào)等。另外,基于科研機(jī)構(gòu)對(duì)數(shù)據(jù)的審計(jì)需求,系統(tǒng)對(duì)用戶導(dǎo)出的查詢數(shù) 據(jù)進(jìn)行副本留痕,并對(duì)留痕文件進(jìn)行加密處理,降低服務(wù)器被攻擊后數(shù)據(jù)泄露的 風(fēng)險(xiǎn)。1.4醫(yī)學(xué)文本后結(jié)構(gòu)化處理除眾多的結(jié)構(gòu)化數(shù)據(jù)外,醫(yī)學(xué)文本類數(shù)據(jù)(如患者的現(xiàn)病史、既往史、病程 記錄、影像學(xué)報(bào)告等)也含有十分重要的信息。文本后結(jié)構(gòu)化處理結(jié)合了 NLP、 語(yǔ)義語(yǔ)法規(guī)則庫(kù)等人工智能技術(shù),能夠?qū)⑨t(yī)學(xué)文本中的信息進(jìn)行結(jié)構(gòu)化提取,方 便醫(yī)生利用。由于病種特點(diǎn)和個(gè)人書寫習(xí)慣等問題,結(jié)構(gòu)化的算法需要不斷學(xué)習(xí) 以達(dá)到更高的準(zhǔn)確率。為提高用戶科研效率,減少結(jié)構(gòu)化數(shù)據(jù)的迭代周期,系統(tǒng) 提供可視
4、的后結(jié)構(gòu)化配置界面和實(shí)時(shí)結(jié)構(gòu)化應(yīng)用程序編程接口(applicationprogramminginterface,API),保證調(diào)整規(guī)則及算法后可及時(shí)看到效 果。1.5統(tǒng)計(jì)分析功能在臨床醫(yī)生的科研工作中通過統(tǒng)計(jì)分析的方法挖掘臨床數(shù)據(jù)中的規(guī)律是一個(gè) 必不可少的環(huán)節(jié)。目前,臨床醫(yī)生大多將數(shù)據(jù)導(dǎo)出后,使用通用的統(tǒng)計(jì)分析軟件 進(jìn)行數(shù)據(jù)分析。但這種方法存在幾個(gè)問題:(1)導(dǎo)出數(shù)據(jù)的安全性較難保證;(2)通用的統(tǒng)計(jì)分析軟件功能強(qiáng)大但操 作復(fù)雜,對(duì)使用者的統(tǒng)計(jì)學(xué)知識(shí)要求較高;(3)部分功能未針對(duì)醫(yī)療行業(yè)進(jìn)行 細(xì)化。因此,系統(tǒng)在主流的R語(yǔ)言算法基礎(chǔ)上構(gòu)建了專業(yè)的統(tǒng)計(jì)分析工具,通過 瀏覽器端在線分析、增加智能化推
5、薦算法功能等方式解決上述問題。同時(shí),系統(tǒng) 不僅提供了數(shù)據(jù)預(yù)處理功能,還提供了對(duì)研究變量可根據(jù)醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法進(jìn)行缺 失值分析填補(bǔ)、離散化處理等功能,為數(shù)據(jù)分析的全流程提供幫助。2應(yīng)用效果2.1數(shù)據(jù)規(guī)??蒲袛?shù)據(jù)中心包括院內(nèi)自信息化以來的存量數(shù)據(jù),收錄有效就診患者 31748245人次,其中門診就診30849299人次,住院就診898946人次,詳細(xì)數(shù)據(jù) 時(shí)間周期如圖1所示。據(jù)統(tǒng)計(jì),科研數(shù)據(jù)中心已提供了 41017個(gè)科研變量,共計(jì) 9億多條數(shù)據(jù)。同時(shí),數(shù)據(jù)中心支持以增量方式接入院內(nèi)新產(chǎn)生的業(yè)務(wù)數(shù)據(jù),提 供實(shí)時(shí)的數(shù)據(jù)利用服務(wù)能力。圖1科研數(shù)據(jù)中心數(shù)據(jù)時(shí)間周期2.2科研查詢服務(wù)目前,醫(yī)療大數(shù)據(jù)搜索系統(tǒng)已
6、為婦科、腎內(nèi)科、耳鼻喉科、肝病科、血液科、風(fēng)濕免疫 科等十幾個(gè)科室的科研課題提供了數(shù)據(jù)查詢服務(wù)。醫(yī)療大數(shù)據(jù)搜索系統(tǒng)改變了跨系統(tǒng)查詢耗 費(fèi)時(shí)間長(zhǎng)的問題,實(shí)現(xiàn)了醫(yī)生對(duì)于權(quán)限內(nèi)的數(shù)據(jù)自行創(chuàng)建、查詢,秒級(jí)顯示查詢結(jié)果,且與 CDR進(jìn)行集成以輔助醫(yī)生對(duì)患者歷次就診結(jié)果進(jìn)行查看與分析等功能。2.3數(shù)據(jù)安全保障按照醫(yī)院管理流程對(duì)檢索條件進(jìn)行逐級(jí)審批管理,保證了數(shù)據(jù)安全。審批時(shí)可顯示審批 履歷、標(biāo)識(shí)檢索條件和結(jié)果涉及的敏感項(xiàng),并設(shè)置過期時(shí)間。醫(yī)療大數(shù)據(jù)搜索系統(tǒng)參考 HIPAA法案定義的18項(xiàng)身份識(shí)別信息進(jìn)行數(shù)據(jù)脫敏設(shè)置,并根據(jù)醫(yī)院自身情況設(shè)置隱私患者 及隱私病區(qū)。2.4提高運(yùn)行效率醫(yī)療大數(shù)據(jù)搜索系統(tǒng)采用醫(yī)學(xué)N
7、LP和機(jī)器學(xué)習(xí)技術(shù)處理通用后結(jié)構(gòu)化變量30個(gè)、??坪?結(jié)構(gòu)化歸一變量44個(gè),提供了醫(yī)生可設(shè)置的后結(jié)構(gòu)化配置界面,實(shí)現(xiàn)了醫(yī)生修改規(guī)則后可 實(shí)時(shí)通過系統(tǒng)看到后結(jié)構(gòu)化的效果。通過提高后結(jié)構(gòu)化效率,縮短了醫(yī)生數(shù)據(jù)分析時(shí)間,進(jìn) 而提高了科研效率。2.5數(shù)據(jù)統(tǒng)計(jì)分析系統(tǒng)基于主流的R語(yǔ)言統(tǒng)計(jì)分析工具包構(gòu)建統(tǒng)計(jì)分析方法庫(kù),保證了結(jié)果的準(zhǔn)確性;聚 焦于醫(yī)療常用的分析方法(如各類假設(shè)檢驗(yàn)、生存分析等)提高了行業(yè)的專業(yè)度;將數(shù)據(jù)查 詢結(jié)果與統(tǒng)計(jì)分析集成,保證了數(shù)據(jù)的保密性和安全性;納入了智能分析模塊,可以根據(jù)數(shù) 據(jù)的類型(離散型、連續(xù)型)、分布情況(是否正態(tài))等幫助用戶推薦分析方法,提升了系 統(tǒng)的易用性。3討論醫(yī)療
8、大數(shù)據(jù)搜索系統(tǒng)有效整合了分散于各獨(dú)立系統(tǒng)間的數(shù)據(jù),提高了臨床科研數(shù)據(jù)查詢 的質(zhì)量和效率。但其建設(shè)仍處于摸索過程中,需要反思與持續(xù)改進(jìn)。3.1產(chǎn)品選型目前,醫(yī)院尚缺乏自主研發(fā)能力,這就必然涉及產(chǎn)品選型。傳統(tǒng)HIT公司雖熟悉醫(yī)院的 業(yè)務(wù)場(chǎng)景、工作流程和醫(yī)療業(yè)務(wù)系統(tǒng)架構(gòu),在系統(tǒng)的對(duì)接方面具有一定的優(yōu)勢(shì)。但大數(shù)據(jù)往 往僅是傳統(tǒng)HIT公司的方向之一,因此在技術(shù)更新、人才吸納、市場(chǎng)推廣等方面很難有突破。 而大數(shù)據(jù)公司由于其應(yīng)用場(chǎng)景的不斷拓展、技術(shù)研發(fā)的深入,在團(tuán)隊(duì)、人才和市場(chǎng)占有率方 面有顯著優(yōu)勢(shì)。但大數(shù)據(jù)公司對(duì)醫(yī)院業(yè)務(wù)了解較少,切入時(shí)間可能較長(zhǎng)。因此,醫(yī)院在產(chǎn)品 選型時(shí),要結(jié)合實(shí)際,兼顧近期、遠(yuǎn)期目標(biāo),
9、選擇適合的產(chǎn)品。3.2適度原則大數(shù)據(jù)搜索平臺(tái)的建設(shè)勢(shì)必涉及對(duì)前端系統(tǒng)的改造。就電子病歷系統(tǒng)而言:一方面,需 要對(duì)病歷模板進(jìn)行標(biāo)準(zhǔn)化改造,規(guī)范數(shù)據(jù)來源;另一方面,不能限制醫(yī)生的思路,保留其自 由發(fā)揮的空間,病程記錄等自由文本的結(jié)構(gòu)化用后結(jié)構(gòu)化方法來實(shí)現(xiàn)。因此,需要把握好適 度原則。3.3數(shù)據(jù)安全在系統(tǒng)的建設(shè)和實(shí)施過程中,要確保數(shù)據(jù)的安全,不被外界竊取和篡改,不予非授權(quán)方 使用。因此,亟須建立相應(yīng)的管理制度,采用數(shù)據(jù)加密技術(shù)和數(shù)據(jù)訪問授權(quán)機(jī)制等方法,避 免“一鍋端”,保障數(shù)據(jù)的安全性。3.4患者隱私應(yīng)建立規(guī)范的數(shù)據(jù)查詢流程,保證各環(huán)節(jié)正常、有序地運(yùn)轉(zhuǎn),使數(shù)據(jù)利用真正落地。同 時(shí),在數(shù)據(jù)利用過程中,
10、要妥善處理好患者隱私,嚴(yán)格按照倫理委員會(huì)的倫理批件提供相應(yīng) 的數(shù)據(jù),保護(hù)患者的人格和尊嚴(yán)。3.5人才培養(yǎng)由于大數(shù)據(jù)的迅猛發(fā)展,需要一批了解醫(yī)療業(yè)務(wù)和信息技術(shù)的復(fù)合型人才。麥肯錫研究 報(bào)告指出,美國(guó)等信息發(fā)達(dá)的國(guó)家中大數(shù)據(jù)領(lǐng)域相關(guān)人才的缺失于2018年達(dá)到1419萬(wàn)。 而我國(guó)的大數(shù)據(jù)發(fā)展才剛剛起步,培養(yǎng)一批雙料”復(fù)合型人才是當(dāng)前和今后很長(zhǎng)一段時(shí)間內(nèi) 生物醫(yī)學(xué)大數(shù)據(jù)發(fā)展的重要工作。結(jié)束語(yǔ):醫(yī)療大數(shù)據(jù)搜索系統(tǒng)改變了傳統(tǒng)人工翻閱紙質(zhì)病歷的模式,具有省時(shí)、省力、高效的優(yōu) 勢(shì),實(shí)現(xiàn)了從既定思維到創(chuàng)新性思維的轉(zhuǎn)變,可從海量原始數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,為臨床科研提 供了更多思路,對(duì)回顧性研究和前瞻性探索都具有重大意義。但是,利用醫(yī)療大數(shù)據(jù)搜索系 統(tǒng)為臨床科研提供服務(wù)還處于起步階段,缺乏成熟的產(chǎn)品與案例,建設(shè)過程必然是逐步探索 的過程,需要臨床科研人員的積極配合和深度參與,并且在使用過程中不斷積累經(jīng)驗(yàn)完善系 統(tǒng),以吸引更多的臨床科研人員參與,形成良性循環(huán)并
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年快遞行業(yè)包裝回收利用合同范本3篇
- 2025版教育培訓(xùn)外協(xié)合同協(xié)議書3篇
- 二零二五不銹鋼罐體生產(chǎn)質(zhì)量管理體系認(rèn)證合同3篇
- 2024版汽車修理工勞動(dòng)合同模板格式
- 2025年度特色民宿租賃運(yùn)營(yíng)管理合同3篇
- 2025年度個(gè)人收入證明專業(yè)審核與制作合同3篇
- 二零二五年度醫(yī)院門衛(wèi)醫(yī)療服務(wù)合同
- 送法進(jìn)企業(yè):2025年度總工會(huì)合作合同2篇
- 2025年度校企合作人才培養(yǎng)協(xié)議合同
- 臨時(shí)工兼職工作職責(zé)與權(quán)益保障協(xié)議2024版B版
- 2024年蘇州工業(yè)園區(qū)服務(wù)外包職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試歷年參考題庫(kù)含答案解析
- 人教版初中語(yǔ)文2022-2024年三年中考真題匯編-學(xué)生版-專題08 古詩(shī)詞名篇名句默寫
- 2024-2025學(xué)年人教版(2024)七年級(jí)(上)數(shù)學(xué)寒假作業(yè)(十二)
- 山西粵電能源有限公司招聘筆試沖刺題2025
- 醫(yī)療行業(yè)軟件系統(tǒng)應(yīng)急預(yù)案
- 使用錯(cuò)誤評(píng)估報(bào)告(可用性工程)模版
- 《精密板料矯平機(jī) 第2部分:技術(shù)規(guī)范》
- 2024光伏發(fā)電工程交流匯流箱技術(shù)規(guī)范
- 旅游活動(dòng)碳排放管理評(píng)價(jià)指標(biāo)體系構(gòu)建及實(shí)證研究
- 2022年全國(guó)職業(yè)院校技能大賽-電氣安裝與維修賽項(xiàng)規(guī)程
- 2024年黑龍江省政工師理論知識(shí)考試參考題庫(kù)(含答案)
評(píng)論
0/150
提交評(píng)論