下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 基于元數(shù)據(jù)可追溯性的健康醫(yī)療大數(shù)據(jù)分析 吳小穎 李熠慜摘 要:對(duì)于健康醫(yī)療大數(shù)據(jù)而言,其具有來源多樣、數(shù)據(jù)分散、存在大量非結(jié)構(gòu)化信息、融合壁壘高等特點(diǎn),正是基于上述特點(diǎn),導(dǎo)致無法有效的對(duì)健康醫(yī)療大數(shù)據(jù)進(jìn)行追溯與治理。因此為有效的改變上述不良情況,則需要采用一種有效的方式對(duì)健康醫(yī)療大數(shù)據(jù)進(jìn)行追溯與治理,目前多使用基于元數(shù)據(jù)可追溯性的方式進(jìn)行分析。本文將論述基于元數(shù)據(jù)的數(shù)據(jù)融合方式及數(shù)據(jù)可視化呈現(xiàn)等內(nèi)容。關(guān)鍵詞:元數(shù)據(jù);可追溯性;健康醫(yī)療大數(shù)據(jù)隨著健康意識(shí)的不但提升,近年來健康醫(yī)療大數(shù)據(jù)開始受到醫(yī)學(xué)界的重點(diǎn)關(guān)注,為此國家衛(wèi)建委下發(fā)相
2、關(guān)的政策加強(qiáng)對(duì)健康醫(yī)療大數(shù)據(jù)的規(guī)范管理與開發(fā)應(yīng)用。為有效的實(shí)現(xiàn)上述目標(biāo),目前開始使用基于元數(shù)據(jù)可追溯性的方式對(duì)健康醫(yī)療大數(shù)據(jù)進(jìn)行分析1。本文將探討基于元數(shù)據(jù)可追溯性的健康醫(yī)療大數(shù)據(jù)分析方式與效果。1.基于元數(shù)據(jù)的數(shù)據(jù)融合方式1.1需求現(xiàn)狀分析1.1.1目前我國國醫(yī)療健康元數(shù)據(jù)的現(xiàn)狀所謂的元數(shù)據(jù)主要是指“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,若能對(duì)元數(shù)據(jù)進(jìn)行良好的管理,則能夠有效的實(shí)現(xiàn)對(duì)數(shù)據(jù)統(tǒng)一管理,由此可知,需要對(duì)元數(shù)據(jù)進(jìn)行準(zhǔn)確、快捷訪問。通過近年來的研究發(fā)現(xiàn),完整的元數(shù)據(jù)管理模式主要分為如下部分,即完整的字段定義、與數(shù)據(jù)源的對(duì)應(yīng)關(guān)系、不同數(shù)據(jù)來源元數(shù)據(jù)間的映射關(guān)系。但通過觀察實(shí)際情況可知,因無法對(duì)元數(shù)據(jù)定義及錄
3、入時(shí)統(tǒng)計(jì)口徑進(jìn)行統(tǒng)一,從而導(dǎo)致醫(yī)療數(shù)據(jù)存在精準(zhǔn)度欠缺、一致性低、準(zhǔn)確度較低等不良問題2。1.1.2臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(huì)中元數(shù)據(jù)可追溯能力的可視化呈現(xiàn)自進(jìn)入國際協(xié)調(diào)會(huì)議后,我國衛(wèi)生部門對(duì)臨床數(shù)據(jù)提交的規(guī)則與要求進(jìn)行了更加向有效的完善。real world data是臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(huì)的一個(gè)重要項(xiàng)目,其主要的宗旨在于通過電子健康記錄系統(tǒng)對(duì)相關(guān)數(shù)據(jù)進(jìn)行收集,以便能夠?qū)⑵溆行У倪\(yùn)用到臨床研究與安全報(bào)告中。然而通過縱觀實(shí)際情況發(fā)現(xiàn),臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(huì)在元數(shù)據(jù)的可追溯性方面仍然存在較大的缺陷,因此為有效的解決此問題,目前臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(huì)開始使用trace-xml系統(tǒng),主要包括驗(yàn)證端到端的追溯能力、
4、運(yùn)行端到端追溯查詢、可視化端到端的追溯能力等部分,有效的提升元數(shù)據(jù)的分析能力。1.2基于元數(shù)據(jù)的數(shù)據(jù)融合的設(shè)計(jì)思路為有效的提升基于元數(shù)據(jù)的數(shù)據(jù)融合能力,目前多使用半自動(dòng)化的融合方式,該種方式包括如下功能:能夠?qū)崿F(xiàn)對(duì)原始數(shù)據(jù)庫的表、字段、表間關(guān)系的有效抽取;形成原始數(shù)據(jù)庫的數(shù)據(jù)模型元數(shù)據(jù),能夠?qū)γ總€(gè)表與字段標(biāo)注業(yè)務(wù)名稱與備注;具有按照業(yè)務(wù)名稱或表與字段名稱進(jìn)行搜索的功能;具有對(duì)表與字段的增加、修改、刪除管理數(shù)據(jù)模型的功能。1.3基于元數(shù)據(jù)的數(shù)據(jù)融合的結(jié)構(gòu)設(shè)計(jì)(1)邏輯架構(gòu)。對(duì)于數(shù)據(jù)采集而言,需要具有規(guī)范地目錄,包括數(shù)據(jù)源、數(shù)據(jù)目標(biāo)與轉(zhuǎn)換規(guī)則等。目錄的生成的方式如下,即將基于已存在的業(yè)務(wù)術(shù)語關(guān)聯(lián)到
5、對(duì)應(yīng)的元數(shù)據(jù),并通過數(shù)據(jù)源映射到業(yè)務(wù)術(shù)語,并且形成新目錄。在形成目錄的過程中,主要涉及到如下方面:使用自然語言處理算法去重、歸一、梳理、消歧數(shù)據(jù),之后將數(shù)據(jù)模型添加至知識(shí)庫中;依據(jù)對(duì)應(yīng)業(yè)務(wù)數(shù)據(jù)模型將處理后的數(shù)據(jù)模型抽取、清洗到目標(biāo)數(shù)據(jù)庫中。(2)數(shù)據(jù)收集與分析。在數(shù)據(jù)收集方面主要使用具有高性能、高可用、高擴(kuò)展特性的結(jié)構(gòu)化數(shù)據(jù)庫集群系統(tǒng),該種系統(tǒng)不僅能夠提供通用計(jì)算平臺(tái),同時(shí)還能夠廣泛應(yīng)用于支撐各類數(shù)據(jù)倉庫系統(tǒng)、商務(wù)智能系統(tǒng)與決策支持系統(tǒng)中。在數(shù)據(jù)分析方面,篩選不同部門的所需數(shù)據(jù),以便能夠?qū)︶t(yī)療數(shù)據(jù)全景圖進(jìn)行規(guī)劃,從而能夠提取出更具有價(jià)值的數(shù)據(jù)。(3)技術(shù)架構(gòu)。目前多使用基于cwm的醫(yī)療元數(shù)據(jù)管
6、理進(jìn)行技術(shù)架構(gòu)。所謂的cwm主要是指對(duì)象管理組織在數(shù)據(jù)倉庫系統(tǒng)中定義的、具有完整的元模型體系結(jié)構(gòu),主要用于數(shù)據(jù)倉庫構(gòu)建與應(yīng)用的元數(shù)據(jù)建模方面。通過分析可知,cwm模型主要包括如下規(guī)范:cwm元模型。該模型主要用于對(duì)數(shù)據(jù)倉庫系統(tǒng)的描述。cwm xml,主要是指cwm元模型的xm表達(dá)形式。cwm dtd。該種格式主要是dw/bi共享元數(shù)據(jù)的交換格式。cwm idl。該種格式主要是dw/bi共享元數(shù)據(jù)的應(yīng)用程序訪問接口。2.數(shù)據(jù)可視化呈現(xiàn)為更加明確數(shù)據(jù)資產(chǎn)分布情況與產(chǎn)生過程,目前多采用數(shù)據(jù)可視化系統(tǒng),主要包括元數(shù)據(jù)采集、元數(shù)據(jù)展示、元數(shù)據(jù)應(yīng)用、元數(shù)據(jù)搜索、元數(shù)據(jù)瀏覽及管理、數(shù)據(jù)字典管理等內(nèi)容,具體如
7、下:2.1元數(shù)據(jù)可視化的主要內(nèi)容2.1.1元數(shù)據(jù)采集方面的可視化縱觀目前的實(shí)際情況,現(xiàn)有的健康醫(yī)療大數(shù)據(jù)平臺(tái)主要包括事實(shí)表與值域表。事實(shí)表主要分為定義類與管理類元數(shù)據(jù)等方面;值域表主要為表示類元數(shù)據(jù)。為實(shí)現(xiàn)數(shù)據(jù)融合后的格式統(tǒng)一,在采集數(shù)據(jù)的過程中采用可視化操作管理,主要包括結(jié)構(gòu)標(biāo)準(zhǔn)化、數(shù)據(jù)標(biāo)準(zhǔn)化等內(nèi)容。通過對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,在較大程度上實(shí)現(xiàn)了數(shù)據(jù)的高效與融合的規(guī)范性3。2.1.2元數(shù)據(jù)展示方面的可視化所謂的元數(shù)據(jù)展示功能主要是指對(duì)某元數(shù)據(jù)來源的分布情況進(jìn)行展示,從而能夠追溯到影響該指標(biāo)的所有源數(shù)據(jù)庫的元數(shù)據(jù),通過采用血緣關(guān)系分析能力利用圖形對(duì)各業(yè)務(wù)數(shù)據(jù)的圖譜進(jìn)行完整展現(xiàn)。2.1.3元數(shù)據(jù)搜
8、索方面的可視化所謂的元數(shù)據(jù)搜索主要是指用戶可通過不同類型的數(shù)據(jù)源庫對(duì)元數(shù)據(jù)進(jìn)行搜索,以便能夠更快的對(duì)元數(shù)據(jù)進(jìn)行定位,并增強(qiáng)用戶的了解程度。2.1.4元數(shù)據(jù)瀏覽方面的可視化所謂的元數(shù)據(jù)瀏覽主要是指用戶可對(duì)數(shù)據(jù)字段名稱、字段類型、長度、是否必填等項(xiàng)目進(jìn)行查看瀏覽;并且用戶能夠依據(jù)自身的實(shí)際需求對(duì)過濾規(guī)則進(jìn)行編輯,以便能夠使元素局更加標(biāo)準(zhǔn)化、更具有規(guī)范性。2.2治理后的平臺(tái)功能情況通過縱觀健康醫(yī)療大數(shù)據(jù)平臺(tái)治理后的實(shí)際情況,相比于治理前,該平臺(tái)具有更高的完整性、正確性、一致性、合理性與時(shí)效性。收集實(shí)時(shí)與標(biāo)準(zhǔn)的數(shù)據(jù)能夠?qū)?shù)據(jù)進(jìn)行有效的治理;對(duì)元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行統(tǒng)一后獲得的主數(shù)據(jù)具有更加良好的存儲(chǔ)、整合、清
9、洗與監(jiān)管效用。按照目前現(xiàn)有的需求,基于元數(shù)據(jù)的數(shù)據(jù)融合能夠?qū)χT多不同醫(yī)療機(jī)構(gòu)的數(shù)據(jù)進(jìn)行整合;將整合后的數(shù)據(jù)按照慢病管理、公共衛(wèi)生、藥品使用情況予以分類,由集合后的數(shù)據(jù)集市對(duì)所需要數(shù)據(jù)進(jìn)行抽取,之后進(jìn)行計(jì)算,并對(duì)計(jì)算后的數(shù)據(jù)予以可視化呈現(xiàn),便于用戶直截了當(dāng)?shù)倪M(jìn)行觀察分析。同時(shí),用于生成統(tǒng)計(jì)指標(biāo)所調(diào)用到的字段,不僅能夠進(jìn)行詳細(xì)的可視化展現(xiàn),同時(shí)還能夠輔助用戶對(duì)數(shù)據(jù)實(shí)體間的組合與依賴關(guān)系進(jìn)行理解,最終有利于客戶的選擇。通過對(duì)平臺(tái)進(jìn)行治理后,醫(yī)療大數(shù)據(jù)平臺(tái)可依據(jù)追溯數(shù)據(jù)來源及其元數(shù)據(jù),實(shí)現(xiàn)了對(duì)數(shù)據(jù)的有效的控制,并且用戶可依據(jù)患者、病種、科室的具體情況對(duì)該區(qū)域的醫(yī)療信息進(jìn)行詳細(xì)查看并作出相應(yīng)的分析。3.總結(jié)伴隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,將會(huì)出現(xiàn)更多的健康醫(yī)療大數(shù)據(jù),為確保數(shù)據(jù)控制獲得較高的質(zhì)量,對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一、一致的管理,保證大數(shù)據(jù)平臺(tái)的正常運(yùn)行,則需要對(duì)數(shù)據(jù)進(jìn)行良好的整合,而基于元數(shù)據(jù)的數(shù)據(jù)融合方式則是實(shí)現(xiàn)上述目標(biāo)的重要方式,能夠獲得良好效果。參考文獻(xiàn):1王霞,李岳峰,董方杰,胡建平,張學(xué)高.中國健康醫(yī)療大數(shù)據(jù)資源核心元數(shù)據(jù)研究j.中國衛(wèi)生信息管理雜志,2019,16(03):26
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度高新技術(shù)廠房整體轉(zhuǎn)讓合同范本4篇
- 二零二五年度高鐵工程款抵押貸款合同模板3篇
- 二零二五年度企業(yè)稅收籌劃與稅務(wù)籌劃風(fēng)險(xiǎn)評(píng)估合同2篇
- 二零二五年度充電樁智能充電解決方案合同范本3篇
- 2025版木工班組承包施工安全責(zé)任合同范本4篇
- 2025版實(shí)習(xí)員工實(shí)習(xí)期間交通補(bǔ)貼合同3篇
- 合同糾紛強(qiáng)制執(zhí)行申請(qǐng)書范文
- 2025至2030年中國便攜式里氏硬度計(jì)數(shù)據(jù)監(jiān)測研究報(bào)告
- 2025至2030年粒細(xì)胞巨噬細(xì)胞集落刺激因子項(xiàng)目投資價(jià)值分析報(bào)告
- 2025至2030年潛水鉆機(jī)項(xiàng)目投資價(jià)值分析報(bào)告
- 寒假作業(yè)一年級(jí)上冊(cè)《數(shù)學(xué)每日一練》30次打卡
- 2024-2025學(xué)年九年級(jí)化學(xué)上冊(cè) 第二單元 單元測試卷(人教版)
- 2024年公共衛(wèi)生基本知識(shí)考試題庫(附含答案)
- 2024多級(jí)AO工藝污水處理技術(shù)規(guī)程
- 2024年江蘇省鹽城市中考數(shù)學(xué)試卷真題(含答案)
- DZ∕T 0287-2015 礦山地質(zhì)環(huán)境監(jiān)測技術(shù)規(guī)程(正式版)
- 2024年合肥市廬陽區(qū)中考二模英語試題含答案
- 質(zhì)檢中心制度匯編討論版樣本
- 藥娘激素方案
- 提高靜脈留置使用率品管圈課件
- GB/T 10739-2023紙、紙板和紙漿試樣處理和試驗(yàn)的標(biāo)準(zhǔn)大氣條件
評(píng)論
0/150
提交評(píng)論