![江西省醫(yī)療大數(shù)據(jù)平臺技術(shù)規(guī)范 第六部分臨床科研系統(tǒng)功能要求_第1頁](http://file4.renrendoc.com/view5/M01/35/39/wKhkGGY5glKAYkrOAAJCCuC7KIA346.jpg)
![江西省醫(yī)療大數(shù)據(jù)平臺技術(shù)規(guī)范 第六部分臨床科研系統(tǒng)功能要求_第2頁](http://file4.renrendoc.com/view5/M01/35/39/wKhkGGY5glKAYkrOAAJCCuC7KIA3462.jpg)
![江西省醫(yī)療大數(shù)據(jù)平臺技術(shù)規(guī)范 第六部分臨床科研系統(tǒng)功能要求_第3頁](http://file4.renrendoc.com/view5/M01/35/39/wKhkGGY5glKAYkrOAAJCCuC7KIA3463.jpg)
![江西省醫(yī)療大數(shù)據(jù)平臺技術(shù)規(guī)范 第六部分臨床科研系統(tǒng)功能要求_第4頁](http://file4.renrendoc.com/view5/M01/35/39/wKhkGGY5glKAYkrOAAJCCuC7KIA3464.jpg)
![江西省醫(yī)療大數(shù)據(jù)平臺技術(shù)規(guī)范 第六部分臨床科研系統(tǒng)功能要求_第5頁](http://file4.renrendoc.com/view5/M01/35/39/wKhkGGY5glKAYkrOAAJCCuC7KIA3465.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
DBXX/TXXX—XXXX
江西省醫(yī)療大數(shù)據(jù)平臺技術(shù)規(guī)范第六部分:臨床科研系統(tǒng)功能要求
1范圍
本文件規(guī)定了臨床科研系統(tǒng)的總體功能規(guī)范,包括臨床科研數(shù)據(jù)管理要求、科研項目管理要求、臨
床科研數(shù)據(jù)分析要求等方面內(nèi)容。
本文件適用于各醫(yī)療單位、企業(yè)構(gòu)建臨床科研系統(tǒng)解決方案的研發(fā)、選擇和評價,不適用于各醫(yī)療
單位、企業(yè)硬件要求,也不包括醫(yī)院整體臨床數(shù)據(jù)中心的要求。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
GB/T14396-2016疾病分類與代碼
GB/T18391.1—2009信息技術(shù)元數(shù)據(jù)注冊系統(tǒng)(MDR)第1部分:框架
GB/T34960.5—2018信息技術(shù)服務(wù)治理第5部分:數(shù)據(jù)治理規(guī)范
GB/T35295-2017信息技術(shù)大數(shù)據(jù)術(shù)語
GB/T37721-2019信息技術(shù)臨床科研系統(tǒng)功能要求
WS/T303—2009衛(wèi)生信息數(shù)據(jù)元標(biāo)準(zhǔn)化規(guī)則
WS/T304—2009衛(wèi)生信息數(shù)據(jù)模式描述指南
WS363-2011(所有部分)衛(wèi)生信息數(shù)據(jù)元目錄
WS364-2011(所有部分)衛(wèi)生信息數(shù)據(jù)元值域代碼
WS445-2014(所有部分)電子病歷基本數(shù)據(jù)集
《國家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法(試行)》(國衛(wèi)規(guī)劃發(fā)〔2018〕23號)
全國醫(yī)院數(shù)據(jù)上報管理方案-醫(yī)療業(yè)務(wù)(試行)“國衛(wèi)辦規(guī)劃函〔2019)380號”
全國醫(yī)院數(shù)據(jù)上報管理方案-醫(yī)療數(shù)據(jù)字典(試行)“國衛(wèi)辦規(guī)劃函〔2019〕380號”
全國醫(yī)院數(shù)據(jù)上報管理方案-醫(yī)療業(yè)務(wù)(試行)“國衛(wèi)辦規(guī)劃函〔2019)380號”
3術(shù)語和定義
下列術(shù)語和定義適用于本文件。
3.1
數(shù)據(jù)生存周期datalifecycle
數(shù)據(jù)獲取、存儲、整合、分析、應(yīng)用、呈現(xiàn)、歸檔和銷毀等各種生存形態(tài)演變的過程。
[GB/T34960.5—2018,定義3.7]
3.2
1
DBXX/TXXX—XXXX
醫(yī)療大數(shù)據(jù)medicalbigdata
在疾病防治過程中產(chǎn)生的與醫(yī)療相關(guān)的海量數(shù)據(jù)的集合。
3.3
隨機(jī)對照試驗randomizedcontrolledtrial
隨機(jī)對照試驗是一種對醫(yī)療衛(wèi)生服務(wù)中的某種療法或藥物的效果進(jìn)行檢測的手段,特別常用于醫(yī)
學(xué)、藥學(xué)、護(hù)理學(xué)研究中,在司法、教育、社會科學(xué)等其他領(lǐng)域也有所應(yīng)用。
3.4
數(shù)據(jù)治理datagovernance
數(shù)據(jù)資源及其應(yīng)用過程中相關(guān)管控活動、績效和風(fēng)險管理的集合。
[GB/T34960.5—2018,定義3.1]
3.5
數(shù)據(jù)管理datamanagement
數(shù)據(jù)資源獲取、控制、價值提升等活動的集合。
[GB/T34960.5—2018,定義3.2]
3.6
數(shù)據(jù)資產(chǎn)dataasset
組織擁有和控制的、能夠產(chǎn)生效益的數(shù)據(jù)資源。
[GB/T34960.5—2018,定義3.3]
3.7
數(shù)據(jù)戰(zhàn)略datastrategy
組織開展數(shù)據(jù)工作的愿景和高階指引。
[GB/T34960.5—2018,定義3.4]
3.8
數(shù)據(jù)架構(gòu)dataarchitecture
數(shù)據(jù)要素、結(jié)構(gòu)和接口等抽象及其相互關(guān)系的框架。
[GB/T34960.5—2018,定義3.5]
3.9
元數(shù)據(jù)metadata
定義和描述其他數(shù)據(jù)的數(shù)據(jù)。
[GB/T18391.1-2009,定義3.2.16]
3.10
2
DBXX/TXXX—XXXX
數(shù)據(jù)生存周期datalifecycle
數(shù)據(jù)獲取、存儲、整合、分析、應(yīng)用、呈現(xiàn)、歸檔和銷毀等各種生存形態(tài)演變的過程。
[GB/T34960.5—2018,定義3.7]
3.11
數(shù)據(jù)安全datasecurity
數(shù)據(jù)生存周期的安全管控。
3.12
臨床預(yù)測模型clinicalpredictionmodel
臨床預(yù)測模型,又稱臨床預(yù)測規(guī)則或者風(fēng)險評分,是指利用多因素模型估算患者有某種疾病的概率
或者將來發(fā)生某結(jié)局的概率,主要可分為診斷模型(Diagnosticmodel)和預(yù)后模型(Prognosticmodel)。
3.13
數(shù)據(jù)預(yù)處理datapreprocessing
數(shù)據(jù)預(yù)處理,由于真實世界的臨床數(shù)據(jù)大體上都是不完整,不一致的臟數(shù)據(jù),無法直接進(jìn)行數(shù)據(jù)挖
掘,或挖掘結(jié)果差強(qiáng)人意。為了提高數(shù)據(jù)挖掘的質(zhì)量產(chǎn)生了數(shù)據(jù)預(yù)處理技術(shù)。數(shù)據(jù)預(yù)處理有多種方法:
數(shù)據(jù)清理,數(shù)據(jù)集成,數(shù)據(jù)變換,數(shù)據(jù)歸約等。這些數(shù)據(jù)處理技術(shù)在數(shù)據(jù)挖掘之前使用,大大提高了數(shù)
據(jù)挖掘模式的質(zhì)量,降低實際挖掘所需要的時間。
3.14
特征工程featuresengineering
特征工程,是指用一系列工程化的方式從原始數(shù)據(jù)中篩選出更好的數(shù)據(jù)特征,以提升模型的訓(xùn)練效
果。在臨床研究中常見的特征工程包括變量篩選:如逐步回歸、嶺回歸、LASSO回歸、基于機(jī)器學(xué)習(xí)算
法的重要度排序等,除了變量篩選外還常用到的主成分分析與因子分析進(jìn)行特征工程。
3.15
模型評價modelevaluation
確定納入模型的因子和結(jié)局變量后,選擇不同的模型類型,例如傳統(tǒng)的Logistic回歸、線性回歸、
COX比例風(fēng)險模型等,也可以使用機(jī)器學(xué)習(xí)算法(SVM、Xgboost等),通過對測試集上預(yù)測效果進(jìn)行模
型的評價,常用的模型評價指標(biāo)有ROC-AUC、F1-score、召回率、區(qū)分度、校準(zhǔn)度等模型性能評價指標(biāo)。
4縮略語
下列縮略語適用于本文件:
——API:應(yīng)用程序編程接口(ApplicationProgrammingInterface);
——ETL:數(shù)據(jù)倉庫技術(shù),將數(shù)據(jù)從來源端經(jīng)過抽?。╡xtract)、轉(zhuǎn)換(transform)、加載(load)
至目的端的過程(Extract-Transform-Load);
——CRF:病例報告表(CaseReportForm);
——PI:主要研究者(principleinvestigator);
3
DBXX/TXXX—XXXX
——CI:合作研究者(co-investigator);
——SI:助理研究者(sub-investigator);
——CSV:逗號分隔值(Comma-SeparatedValues);
——EMRs:電子病歷系統(tǒng)(ElectronicMedicalRecordSystem);
——JSON:對象簡譜(JavaScriptObjectNotation);
——XML:可擴(kuò)展標(biāo)記語言(eXtensibleMarkupLanguage);
——XSL:可擴(kuò)展樣式語言(eXtensibleStylesheetLanguage);
——ML:機(jī)器學(xué)習(xí)(MachineLearning);
——RCT:隨機(jī)對照試驗(RandomizedControlledTrial);
——GCP:藥物臨床試驗管理規(guī)范(GoodClinicalPractice);
——COX:比例風(fēng)險回歸模型(proportionalhazardsmodel);
——ROC:接受者操作特性曲線(receiveroperatingcharacteristiccurve);
——PSM:傾向性評分匹配(PropensityScoreMatching);
——One-Hot:獨熱編碼(One-HotEncoding)。
5臨床科研系統(tǒng)設(shè)計總則
5.1概述
科研工作是醫(yī)療機(jī)構(gòu)的一項重要工作,科研水平標(biāo)志著醫(yī)療機(jī)構(gòu)的整體技術(shù)水平。隨著醫(yī)療機(jī)構(gòu)信
息化的逐步完善,醫(yī)療機(jī)構(gòu)積累了龐大的醫(yī)療數(shù)據(jù),挖掘數(shù)據(jù)價值、促進(jìn)醫(yī)療機(jī)構(gòu)技術(shù)水平和醫(yī)療質(zhì)量
的提升成為醫(yī)療機(jī)構(gòu)共同的重要發(fā)展方向。建設(shè)基于人工智能的全院級科研一體化平臺,可以對醫(yī)院臨
床病歷數(shù)據(jù)進(jìn)行結(jié)構(gòu)化、標(biāo)準(zhǔn)化的整合治理,面向醫(yī)院重點專科提供臨床科研數(shù)據(jù)采集和分析服務(wù),滿
足不同臨床醫(yī)生不同的科研訴求,從而促進(jìn)醫(yī)療機(jī)構(gòu)的科研產(chǎn)出實現(xiàn)批量提升。
5.2目標(biāo)
構(gòu)建臨床科研系統(tǒng)的目的是利用信息技術(shù)手段,有效地聚合、分析、管理、利用醫(yī)療大數(shù)據(jù)資源,
打造高質(zhì)量的臨床科研數(shù)據(jù)中心,提供科研的統(tǒng)計分析工具,嵌套醫(yī)學(xué)常用統(tǒng)計方法,以滿足臨床科研
對高質(zhì)量研究與管理的要求。實現(xiàn)醫(yī)療大數(shù)據(jù)的利用效率提升,臨床研究中數(shù)據(jù)收集、數(shù)據(jù)整理等步驟
的時間成本降低,從而有效加速醫(yī)療機(jī)構(gòu)的科研產(chǎn)出、推進(jìn)智慧醫(yī)療建設(shè)。
6總體技術(shù)要求
6.1概述
主要從系統(tǒng)架構(gòu)、系統(tǒng)性能、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)與信息安全4個方面規(guī)范了臨床科研系統(tǒng)的基本技
術(shù)要求。
6.2平臺架構(gòu)技術(shù)要求
6.2.1系統(tǒng)需采用B/S架構(gòu),純WEB版產(chǎn)品界面,需提供系統(tǒng)界面截圖.
6.2.2支持基于kubernetes和docker容器編排的部署方案,需提供系統(tǒng)截圖展示容器的運行狀態(tài).
6.2.3具備完善應(yīng)用部署能力,提供應(yīng)用部署管理平臺的界面和部署方案.
6.2.4支持與醫(yī)院信息系統(tǒng)數(shù)據(jù)的實時同步,需提供技術(shù)方案.
6.2.5支持集成多種數(shù)據(jù)庫,如DB2、PostgreSQL、MySQL、ORACLE和SQLServer.
4
DBXX/TXXX—XXXX
6.2.6提供性能監(jiān)視器功能,能對設(shè)定的關(guān)鍵指標(biāo)進(jìn)行監(jiān)控。
6.3系統(tǒng)性能要求
6.3.1系統(tǒng)支持7*24小時不間斷運行。
6.3.2滿足20個以上并發(fā)用戶登錄,最大在線會話數(shù)應(yīng)支撐100個。
6.3.3100萬條數(shù)據(jù)OLAP查詢分析4級維度下應(yīng)在10秒內(nèi)完成。
6.3.410萬條數(shù)據(jù)多維在線基礎(chǔ)統(tǒng)計分析應(yīng)在20秒內(nèi)完成。
6.4數(shù)據(jù)標(biāo)準(zhǔn)化要求
6.4.1支持?jǐn)?shù)據(jù)集成及整合過程的標(biāo)準(zhǔn)化:實現(xiàn)數(shù)據(jù)的集成,通過各種數(shù)據(jù)治理手段,結(jié)合標(biāo)準(zhǔn)的醫(yī)
療術(shù)語的標(biāo)準(zhǔn)規(guī)范管理,實現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化、結(jié)構(gòu)化,并實現(xiàn)數(shù)據(jù)治理過程中的完整性、自洽性、一致
性;支持科室、病區(qū)、診斷編碼、疾病、藥品、檢驗、檢查等關(guān)鍵業(yè)務(wù)編碼的統(tǒng)一。
6.4.2支持不同數(shù)據(jù)來源的數(shù)據(jù):充分考慮數(shù)據(jù)源格式的多樣性,比如各自不同的數(shù)據(jù)庫格式、文本
文件格式、XML格式、JSON格式等,支持結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)。
6.4.3支持不同數(shù)據(jù)生成階段的數(shù)據(jù):由于數(shù)據(jù)生成的時期、部門、設(shè)備、技術(shù)、能力等不同,數(shù)據(jù)
存儲管理極為分散,支持通過采用一種通用的標(biāo)準(zhǔn)和規(guī)范,提供統(tǒng)一的數(shù)據(jù)接口,支持多樣的數(shù)據(jù)源。
6.5數(shù)據(jù)與信息安全
6.5.1系統(tǒng)僅允許院內(nèi)部署,數(shù)據(jù)不可出院,系統(tǒng)僅允許本地維護(hù)。
6.5.2與醫(yī)院信息系統(tǒng)對時應(yīng)接遵循醫(yī)院數(shù)據(jù)管理的要求,對醫(yī)院生產(chǎn)系統(tǒng)進(jìn)行只讀訪問,不對醫(yī)院
生產(chǎn)系統(tǒng)進(jìn)行數(shù)據(jù)寫入。
6.5.3所有用戶的密碼在數(shù)據(jù)庫中,采用摘要算法加密后再保存。
6.5.4支持用戶的權(quán)限的設(shè)置:支持醫(yī)院管理人員方便的管理各種角色、用戶的功能權(quán)限、數(shù)據(jù)訪問
和使用權(quán)限的定義。
6.5.5支持操作日志的記錄:對所有用戶操作記錄日志,記錄訪問IP地址、時間、用戶名、操作涉及
的模塊等信息。
6.5.6支持患者去隱私管理:對于患者隱私,在應(yīng)用或系統(tǒng)設(shè)計時充分考慮相關(guān)數(shù)據(jù)的隱私保護(hù)政策。
7總體功能要求
本標(biāo)準(zhǔn)的功能要求主要從樣本收集、科研項目管理、數(shù)據(jù)選取、數(shù)據(jù)挖掘以及系統(tǒng)管理5個方面對
臨床科研系統(tǒng)的基本功能做出要求,各模塊間的相互關(guān)系,如圖1所示。
5
DBXX/TXXX—XXXX
圖1臨床科研系統(tǒng)框架
8樣本收集模塊功能要求
8.1概述
樣本收集是臨床研究的第一步,對于內(nèi)部樣本即存儲于醫(yī)療大數(shù)據(jù)平臺內(nèi)的樣本,應(yīng)支持多種形式、
復(fù)雜條件的查詢進(jìn)行收集,外部樣本主要針對前瞻性研究,應(yīng)支持手工錄入、電子交換或是數(shù)據(jù)導(dǎo)入的
收集方法。
8.2外部樣本采集
外部樣本采集功能要求如下:
——應(yīng)支持手工錄入樣本信息;
——應(yīng)支持上傳相關(guān)圖片信息;
——應(yīng)支持以接口的方式與外部系統(tǒng)進(jìn)行交互導(dǎo)入數(shù)據(jù)集,數(shù)據(jù)提供方應(yīng)按照接口標(biāo)準(zhǔn)處理需要
導(dǎo)入的數(shù)據(jù),如JSON、WebService等方式;
——應(yīng)支持以ETL(數(shù)據(jù)倉庫技術(shù))的方式從外部系統(tǒng)抽取數(shù)據(jù),數(shù)據(jù)提供方應(yīng)按照ETL技術(shù)標(biāo)準(zhǔn)
對數(shù)據(jù)進(jìn)行抽取、清洗、校對等。
8.3內(nèi)部樣本檢索
內(nèi)部樣本檢索功能要求如下:
——應(yīng)提供可視化的工具進(jìn)行各類數(shù)據(jù)查詢統(tǒng)計,同時支持查詢結(jié)果數(shù)據(jù)的圖形、報表展示
——應(yīng)支持復(fù)雜條件的檢索方式,自由構(gòu)造查詢條件以及組合篩選條件,查詢條件包括但不限于:
大于、小于、等于、大于等于、小于等于、不等于,包含,不包含等;組合條件包括但不限于:
且、或等;
——應(yīng)支持多維度的檢索,包括但不限于:診斷、檢驗、體征、時間、就診信息等;
——應(yīng)支持病例全文的精確以及模糊檢索;
——應(yīng)支持對疾病名進(jìn)行歸一化搜索,如搜索慢性阻塞性肺疾病或慢阻肺或COPD,搜索到的應(yīng)是
同一種疾病的相關(guān)內(nèi)容;
——應(yīng)支持管理人員設(shè)置系統(tǒng)使用人的數(shù)據(jù)可查詢范圍。
6
DBXX/TXXX—XXXX
9科研項目管理模塊功能要求
9.1概述
臨床科研項目主要包括前瞻性研究以及回顧性研究,系統(tǒng)功能應(yīng)滿足兩類研究的使用需求。
9.2前瞻性研究項目
前瞻性研究功能要求如下:
——應(yīng)提供科研項目管理功能,包括但不限于項目管理、團(tuán)隊管理、成員管理、多中心管理等;
——應(yīng)支持受試者(患者)管理功能,包括但不限于篩選、添加、更新、刪除受試者(患者)信
息等;
——應(yīng)提供入組樣本的隨機(jī)分組功能,以滿足隨機(jī)對照試驗的要求;
——應(yīng)提供CRF表單制作功能,應(yīng)允許用戶或管理人員創(chuàng)建編輯CRF表單;
——應(yīng)提供多終端的表單填寫功能,包括但不限于網(wǎng)頁填寫、收集APP填寫、微信小程序填寫等;
——應(yīng)提供可視化的隨訪管理功能,允許項目成員查看隨訪對象的隨訪進(jìn)度;
——應(yīng)提供項目的質(zhì)控。
9.3回顧性研究項目
回顧性研究功能要求如下:
——應(yīng)提供隊列管理功能,包括但不限于刪除隊列、查詢隊列、手工增加隊列樣本等;
——應(yīng)提供隊列的二次篩選功能,包括但不限于隊列的并集、交集、對某一指標(biāo)進(jìn)行篩選。
9.4科研項目權(quán)限管理
科研項目權(quán)限管理功能要求如下:
——應(yīng)支持管理人員設(shè)置對項目的增刪改查權(quán)限;
——系統(tǒng)應(yīng)提供研究項目背景、數(shù)據(jù)來源、入排標(biāo)準(zhǔn)、研究設(shè)計等文檔的錄入界面
——支持系統(tǒng)管理者對全部的研究項目進(jìn)行增刪改查。
——支持團(tuán)隊成員權(quán)限管理,根據(jù)不同權(quán)限配置用戶角色的功能權(quán)限及數(shù)據(jù)權(quán)限,權(quán)限包括但不
限于PI、CI、SI等角色的功能權(quán)限。
10數(shù)據(jù)選取功能要求
10.1概述
科研數(shù)據(jù)選取應(yīng)提供基線選擇、變量選取所需的可視化工具,應(yīng)提供數(shù)據(jù)選取的患者信息展示,并
支持最終選取數(shù)據(jù)的導(dǎo)出。
10.2定義基線
支持可視化定義研究基線,包括但不限于診斷、檢驗、就診信息、用藥、手術(shù)等。
10.3變量選擇
10.3.1支持設(shè)置數(shù)據(jù)選取所需的患者信息相關(guān)變量,包括但不限于診斷、檢驗、就診信息、用藥、手
術(shù)等。
10.3.2支持選取基于自然語言處理的患者信息。
7
DBXX/TXXX—XXXX
10.3.3支持自定義變量的配置、編輯、刪除。
10.3.4支持配置所選變量選取的時間點或時間段。
10.3.5支持保存變量選擇模板應(yīng)用于其他項目。
10.4數(shù)據(jù)導(dǎo)出
10.4.1應(yīng)提供患者視圖,應(yīng)提供展示納入數(shù)據(jù)選取的患者信息,應(yīng)提供單個患者整個數(shù)據(jù)生命周期的
全部數(shù)據(jù)。
10.4.2應(yīng)提供數(shù)據(jù)導(dǎo)出功能,數(shù)據(jù)使用者或管理者可從將選取的數(shù)據(jù)以所需的格式導(dǎo)出,格式包括但
不限于CSV、XLS、SAS、Excel、SPSS等多種格式。
11數(shù)據(jù)挖掘功能要求
11.1概述
數(shù)據(jù)挖掘功能應(yīng)滿足不同臨床研究設(shè)計(如:RCT)或臨床試驗標(biāo)準(zhǔn)(如:GCP)中需要的分析算法,
該模塊功能要求主要包括:提供對原始數(shù)據(jù)以及處理后數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析、數(shù)據(jù)建模以
及數(shù)據(jù)圖表的分析工具庫,同時能夠輸出分析結(jié)果、知識或者決策。
11.2數(shù)據(jù)清洗
數(shù)據(jù)清洗應(yīng)模塊功能要求如下:
——應(yīng)提供數(shù)據(jù)編輯功能,包括但不限于小數(shù)點位數(shù)修改,變量屬性修改(定量數(shù)據(jù)、定類數(shù)據(jù)
等),變量名修改,變量刪除,變量轉(zhuǎn)化等;
——應(yīng)提供數(shù)據(jù)批量清洗功能,包括但不限于缺失值填補(bǔ)、剔除文本、記錄替換等;
——提供重編碼功能,包括但不限于分組重編碼、One-hot編碼等;
——應(yīng)提供數(shù)據(jù)標(biāo)準(zhǔn)化功能,包括但不限于歸一化、正則化等;
——應(yīng)提供數(shù)據(jù)篩選功能,使用目標(biāo)數(shù)據(jù)集自由構(gòu)造查詢條件以及組合篩選條件,查詢條件包括
但不限于:大于、小于、等于、大于等于、小于等于、不等于,包含,不包含等;組合條件包
括但不限于:且、或等。
11.3數(shù)據(jù)分析
11.3.1提供研究樣本的描述功能:包括但不限于最大值、最小值統(tǒng)計、正態(tài)檢驗、交叉表等。
11.3.2提供變量關(guān)聯(lián)分析功能,包括但不限于共線性、相關(guān)性分析等。
11.3.3提供組間\組內(nèi)差異分析功能,包括但不限于非參數(shù)檢驗、T檢驗、單因素方差分析等。
11.3.4提供臨床常用回歸\生存分析功能,包括但不限于Logistic回歸、COX回歸、生存分析、RCS
樣條、主成分分析等。
11.3.5提供綜合統(tǒng)計分析功能,包括但不限于單因素\多因素分析、多模型回歸分析、趨勢分析、分
層分析等;支持分析結(jié)果的可視化與導(dǎo)出。
11.3.6支持統(tǒng)計任務(wù)復(fù)用與修改要求。
11.4數(shù)據(jù)建模
11.4.1應(yīng)提供臨床科研中常用的基于機(jī)器學(xué)習(xí)的分類算法,包括但不限于XGboost分類、RF分類、
KNN分類、SVM分類、logistics分類、樸素貝葉斯分類、ADboost分類、lightGB分類等。
11.4.2應(yīng)提供臨床科研中常用的基于機(jī)器學(xué)習(xí)的回歸算法,包括但不限于XGboost回歸、RF回歸、
KNN回歸、SVM回歸、線性回歸等。
8
DBXX/TXXX—XXXX
11.4.3應(yīng)提供臨床科研中常用的基于機(jī)器學(xué)習(xí)的聚類算法,包括但不限于K-mean聚類、Birch聚類、
高斯混合模型聚類等。
11.4.4應(yīng)提供臨床科研中常用的降維算法,如PCA、LDA等。
11.4.5可支持多種神經(jīng)網(wǎng)絡(luò)算法,包括但不限于MLP、DNN、CNN、LSTM等。
11.4.6可支持按照比例劃分?jǐn)?shù)據(jù)集的訓(xùn)練集、測試集,提供手動設(shè)置劃分比例的界面。
11.4.7可支持對選定模型的手動調(diào)整、自動調(diào)整模型參數(shù),提供手工調(diào)整參數(shù)的界面。
11.4.8可支持多個預(yù)測模型間預(yù)測效能進(jìn)行比較,提供測試集以及訓(xùn)練集中預(yù)測效能的比較。
11.4.9可支持機(jī)器學(xué)習(xí)流程的其它其它組件,包括特征提取、特征選擇、重要度排序、交叉驗證等。
11.4.10可提供基于每個建模分析方法產(chǎn)生分析結(jié)果的說明和解釋。
12系統(tǒng)管理功能要求
12.1概述
系統(tǒng)管理提供用戶管理、角色與權(quán)限、數(shù)據(jù)策略、院外訪問設(shè)置和日志審計功能。
12.2用戶管理
12.2.1應(yīng)支持展示系統(tǒng)用戶信息。
12.2.2應(yīng)支持添加、編輯、刪除用戶信息。
12.3角色與權(quán)限
12.3.1應(yīng)支持不同角色配置不同功能權(quán)限。
12.3.2應(yīng)支持展示不同角色的權(quán)限,并支持新增、刪除、編輯角色的權(quán)限。
12.4數(shù)據(jù)安全管理
12.4.1支持?jǐn)?shù)據(jù)權(quán)限策略與配置,包括根據(jù)用戶職稱、職位(也可以定制化)配置全院、所在科室數(shù)
據(jù)權(quán)限策略。
12.4.2支持對于某一類患者信息(姓名、家庭地址、身份證)進(jìn)行加密,避免患者隱私泄露。
12.5日志管理
支持系統(tǒng)用戶登錄/登出/變更、智能搜索、數(shù)據(jù)導(dǎo)出等操作的日志審計。
9
DBXX/TXXX—XXXX
A
A
附錄A
附錄B(資料性)
附錄C醫(yī)療大數(shù)據(jù)科研平臺的實踐案例
C.1案例背景
隨著醫(yī)療機(jī)構(gòu)信息化的不斷完善,醫(yī)療機(jī)構(gòu)擁有的數(shù)據(jù)量越來越龐大。在大數(shù)據(jù)時代,對于研究型
醫(yī)療機(jī)構(gòu),如何釋放大數(shù)據(jù)的價值成為很多醫(yī)療機(jī)構(gòu)關(guān)注的問題??蒲惺轻t(yī)療機(jī)構(gòu)高質(zhì)量發(fā)展的重要基
石,也是發(fā)揮大數(shù)據(jù)價值的主要領(lǐng)域。一方面,借助大數(shù)據(jù)平臺完成數(shù)據(jù)治理,提升醫(yī)療機(jī)構(gòu)數(shù)據(jù)質(zhì)量,
提高科研產(chǎn)出效率。另一方面,借助大數(shù)據(jù)促進(jìn)醫(yī)療機(jī)構(gòu)智慧管理、臨床智能應(yīng)用,加速智慧醫(yī)療機(jī)構(gòu)
建設(shè)。
C.2痛點和難點
C.2.1痛點
C.2.1.1科研無法直接使用非結(jié)構(gòu)化數(shù)據(jù)
醫(yī)療機(jī)構(gòu)雖然積累了海量數(shù)據(jù),但由于80%左右的數(shù)據(jù)是非結(jié)構(gòu)化的數(shù)據(jù),在科研中是無法有效利
用的。醫(yī)療機(jī)構(gòu)急需非結(jié)構(gòu)化電子記錄的結(jié)構(gòu)化處理能力,采用醫(yī)療人工智能技術(shù)將醫(yī)學(xué)語境下基于自
然語言描述的醫(yī)療記錄自動轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),滿足臨床科研需求。
C.2.1.2缺乏統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)
在沒有統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)的階段,醫(yī)療機(jī)構(gòu)雖然擁有海量的、種類豐富的臨床數(shù)據(jù),在數(shù)據(jù)統(tǒng)計等應(yīng)用
的過程中,發(fā)現(xiàn)了很多統(tǒng)計不準(zhǔn)確、篩選范圍覆蓋不完整等問題。例如,搜索“慢性阻塞性肺疾病”的
相關(guān)病例,有很大比例的病例應(yīng)該被搜索出來,但是卻沒有搜索出來,因為部分患者的臨床描述采用的
是COPD、慢阻肺或者其他的描述方式。
C.2.1.3缺乏工具,病例數(shù)據(jù)采集、統(tǒng)計分析難
C.2.1.3.1傳統(tǒng)的病例數(shù)據(jù)采集是采用的是Excle和人工收集數(shù)據(jù)的模式,收集數(shù)據(jù)這種低價值、重
復(fù)性勞動占用了臨床科研工作大量的寶貴時間。
C.2.1.3.2有了數(shù)據(jù)后,由于缺乏科研工具,在隊列管理、樣本納入、數(shù)據(jù)分析方面均采用人工處理
方式或借助多種第三方工具,一方面是存在速度慢、效率低的問題,另一方面第三方軟件還存在數(shù)據(jù)泄
露的安全隱患。
C.2.1.4信息安全無保障
C.2.1.4.1醫(yī)療機(jī)構(gòu)數(shù)據(jù)服務(wù)缺少數(shù)據(jù)隱私和脫敏配置功能,無法在對應(yīng)的服務(wù)中進(jìn)行脫敏處理。
C.2.1.4.2傳輸過程應(yīng)當(dāng)缺少加密配置功能,無法服務(wù)的傳輸過程中對交互數(shù)據(jù)進(jìn)行加密處理。
C.2.1.4.3數(shù)據(jù)訪問缺少訪問控制與監(jiān)管的功能,無法做到對每個接入數(shù)據(jù)服務(wù)的系統(tǒng)和數(shù)據(jù)使用方
都進(jìn)行登記與注冊,以及記錄每次訪問的情況。
C.2.2難點
C.2.2.1面向未來3~5年的統(tǒng)籌規(guī)劃及落地方案
10
DBXX/TXXX—XXXX
C.2.2.1.1評估醫(yī)療機(jī)構(gòu)內(nèi),業(yè)務(wù)系統(tǒng)和人員能力等現(xiàn)狀,分析醫(yī)療機(jī)構(gòu)科研發(fā)展方向及重點,為醫(yī)
療機(jī)構(gòu)數(shù)據(jù)治理制定可行性方案。
C.2.2.1.2制定醫(yī)療機(jī)構(gòu)、科研平臺服務(wù)商、其他系統(tǒng)服務(wù)商之間的規(guī)劃、治理范圍和任務(wù)的界定,
以及實施策略、流程的設(shè)計。
C.2.2.1.3制作監(jiān)督執(zhí)行過程的策略和方式,保證實施進(jìn)度和質(zhì)量。
C.2.2.2高質(zhì)量、可持續(xù)的數(shù)據(jù)治理體系設(shè)計
C.2.2.2.1醫(yī)療機(jī)構(gòu)數(shù)據(jù)中心要建立一套可評價的體系,從數(shù)據(jù)的及時性、完整性、準(zhǔn)確性、一致性、
關(guān)聯(lián)性、溯源性等6個維度對數(shù)據(jù)治理過程進(jìn)行評價。
C.2.2.2.2及時性:業(yè)務(wù)數(shù)據(jù)產(chǎn)生的時間(以數(shù)據(jù)記錄時間或業(yè)務(wù)時間為準(zhǔn))與數(shù)據(jù)收集的時間間隔,
應(yīng)滿足一定的時間要求。該評價主要是針對數(shù)據(jù)治理中數(shù)據(jù)收集的過程。
C.2.2.2.3完整性:醫(yī)療機(jī)構(gòu)數(shù)據(jù)中心應(yīng)制定數(shù)據(jù)完整性相關(guān)質(zhì)量指標(biāo),通過業(yè)務(wù)標(biāo)準(zhǔn)來識別業(yè)務(wù)關(guān)
鍵數(shù)據(jù)的完整性,并根據(jù)評價情況,對數(shù)據(jù)質(zhì)量過程進(jìn)行持續(xù)優(yōu)化和調(diào)整。
C.2.2.2.4完整性:醫(yī)療機(jī)構(gòu)數(shù)據(jù)中心應(yīng)制定數(shù)據(jù)準(zhǔn)確性相關(guān)質(zhì)量指標(biāo),結(jié)合業(yè)務(wù)規(guī)則和數(shù)據(jù)標(biāo)準(zhǔn)來
識別數(shù)據(jù)的準(zhǔn)確程度,并根據(jù)評價情況,對數(shù)據(jù)治理過程進(jìn)行持續(xù)優(yōu)化和調(diào)整。
C.2.2.2.5一致性:醫(yī)療機(jī)構(gòu)數(shù)據(jù)中心應(yīng)制定數(shù)據(jù)一致性相關(guān)質(zhì)量指標(biāo),結(jié)合業(yè)務(wù)規(guī)則和數(shù)據(jù)標(biāo)準(zhǔn)來
識別數(shù)據(jù)的一致性程度,并根據(jù)評價情況,對數(shù)據(jù)治理過程進(jìn)行持續(xù)優(yōu)化和調(diào)整。
C.2.2.2.6關(guān)聯(lián)性:醫(yī)療機(jī)構(gòu)數(shù)據(jù)中心應(yīng)制定數(shù)據(jù)關(guān)聯(lián)性相關(guān)質(zhì)量指標(biāo),結(jié)合數(shù)據(jù)庫管理范式要求識
別數(shù)據(jù)的關(guān)聯(lián)性水平,并根據(jù)評價情況,對數(shù)據(jù)治理過程進(jìn)行持續(xù)優(yōu)化和調(diào)整。
C.3基本情況
C.3.1南昌大學(xué)第二附屬醫(yī)療機(jī)構(gòu)擁有江西省首個醫(yī)療大數(shù)據(jù)工程技術(shù)研究中心及國家腦卒中篩查與
防治基地,有在職職工2201人,開放床位3985張,年住院13.4萬余人次,年手術(shù)6.4萬次,年門診
200萬余人次,醫(yī)療機(jī)構(gòu)現(xiàn)運行醫(yī)療業(yè)務(wù)子系統(tǒng)100余個,歷史使用系統(tǒng)超過200個。在建立大數(shù)據(jù)平
臺、進(jìn)行數(shù)據(jù)治理之前,醫(yī)療數(shù)據(jù)使用困難,復(fù)雜的科研數(shù)據(jù)需求、統(tǒng)計分析需求費時費力且難以保障
數(shù)據(jù)準(zhǔn)確性。
C.3.2因此,南昌大學(xué)第二附屬醫(yī)療機(jī)構(gòu)于2019年建立基于分布式計算計算的醫(yī)療大數(shù)據(jù)平臺,治理
完成了自2006年到2021年全院包括HIS、EMR、檢驗檢查、護(hù)理數(shù)據(jù)等全量醫(yī)療數(shù)據(jù),實現(xiàn)數(shù)據(jù)匯聚、
標(biāo)準(zhǔn)化結(jié)構(gòu)化治理,全面覆蓋了醫(yī)療機(jī)構(gòu)一百余個業(yè)務(wù)系統(tǒng),從根本上解決了醫(yī)療機(jī)構(gòu)數(shù)據(jù)處理能力不
足的問題,為醫(yī)療機(jī)構(gòu)數(shù)據(jù)需求、科學(xué)研究提供了較好的數(shù)據(jù)基礎(chǔ)與處理能力。
C.4平臺架構(gòu)
平臺架構(gòu)分為四個層級:
——數(shù)據(jù)集成:科研平臺首先采集院內(nèi)的臨床數(shù)據(jù)和院外產(chǎn)生的隨訪、CRF表單等數(shù)據(jù)。
——數(shù)據(jù)治理:集成的數(shù)據(jù)與術(shù)語標(biāo)準(zhǔn)體系進(jìn)行映射或進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)化,支持進(jìn)行數(shù)據(jù)合理性校
驗,實現(xiàn)將多元性、異源性數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一標(biāo)準(zhǔn)的高質(zhì)量科研數(shù)據(jù)。
——數(shù)據(jù)中心:將經(jīng)過治理的數(shù)據(jù)存放在科研數(shù)據(jù)中心。
——科研應(yīng)用:科研人員使用應(yīng)用系統(tǒng)來建立課題、隊列、篩選病歷,做回顧性、前瞻性研究。
11
DBXX/TXXX—XXXX
圖A.1臨床科研系統(tǒng)架構(gòu)
C.5功能介紹
C.5.1構(gòu)建ETL平臺實現(xiàn)歷史與實時數(shù)據(jù)匯聚,保障數(shù)據(jù)完整性與整合性。
——規(guī)劃大數(shù)據(jù)平臺數(shù)據(jù)池,將所有臨床原始數(shù)據(jù)匯聚進(jìn)數(shù)據(jù)池;
——通過Kettle軟件實現(xiàn)構(gòu)建基礎(chǔ)ETL平臺;
——設(shè)置DICOM前置服務(wù)器,接入醫(yī)療影像、心電等原始數(shù)據(jù);
——設(shè)置基因數(shù)據(jù)服務(wù)器,通過與測序儀直連方式接收基因測序數(shù)據(jù)。
C.5.2建立數(shù)據(jù)脫敏規(guī)范,開啟平臺軟硬件結(jié)合安全防護(hù),保障數(shù)據(jù)安全性。
——參照HIPAA定義的18項內(nèi)容進(jìn)行脫敏、加密存儲;
——平臺在院內(nèi)網(wǎng)部署,接口機(jī)納入堡壘機(jī)管理;平臺開啟Kerberos安全認(rèn)證以及嚴(yán)格的權(quán)限控
制。
C.5.3建立數(shù)據(jù)質(zhì)量核查、監(jiān)控流程,提高基礎(chǔ)數(shù)據(jù)質(zhì)量。
——歷史數(shù)據(jù):生成數(shù)據(jù)質(zhì)量核查報告,作為后續(xù)數(shù)據(jù)清洗依據(jù);
——新增數(shù)據(jù):選取不同檢查方法實時監(jiān)控數(shù)據(jù)質(zhì)量及預(yù)警。
C.5.4建立數(shù)據(jù)標(biāo)準(zhǔn)化規(guī)范。
提取非結(jié)構(gòu)化數(shù)據(jù)信息,提高數(shù)據(jù)可用性對電子病歷、MRI\CT報告中文本數(shù)據(jù)進(jìn)行自然語言處理,
產(chǎn)生了結(jié)構(gòu)化數(shù)據(jù),包括門診病歷數(shù)據(jù)和住院病歷數(shù)據(jù)。
C.5.5采用分層、分域模型構(gòu)建醫(yī)療大數(shù)據(jù)模型,采用主題化、層次化方式管理數(shù)據(jù),提高數(shù)據(jù)使用
效率。
——通過構(gòu)建數(shù)據(jù)倉庫,對全量醫(yī)療數(shù)據(jù)進(jìn)行集中治理;
——采用分層、分域架構(gòu)建立數(shù)據(jù)倉庫,形成了接口層、主題層、匯總層、應(yīng)用層;
——在應(yīng)用層基礎(chǔ)上,通過構(gòu)建指標(biāo)集、標(biāo)簽集、應(yīng)用寬表組成數(shù)據(jù)集市,為醫(yī)療機(jī)構(gòu)運營、機(jī)
器學(xué)習(xí)算法、臨床業(yè)務(wù)提供高效數(shù)據(jù)支撐。
C.5.6建設(shè)科研系統(tǒng),加強(qiáng)科研數(shù)據(jù)采集與檢索,提升提高科研數(shù)據(jù)的統(tǒng)計分析能力:
12
DBXX/TXXX—XXXX
——支持多維度科研變量來檢索臨床歷史數(shù)據(jù)進(jìn)行回顧性研究,滿足自定義eCRF系統(tǒng)自動采集臨
床科研數(shù)據(jù),實現(xiàn)前瞻性科研的需要??蒲袛?shù)據(jù)能直接導(dǎo)出支持SAS/SPSS等第三方統(tǒng)計軟件
使用;
——嵌套醫(yī)學(xué)統(tǒng)計中絕大多數(shù)的統(tǒng)計方法,能夠依據(jù)數(shù)據(jù)類型自動選擇最合適的統(tǒng)計方法,并且
自動生成統(tǒng)計報告。其中統(tǒng)計報告包含標(biāo)準(zhǔn)三線表、統(tǒng)計結(jié)果描述、統(tǒng)計圖形等。
C.6應(yīng)用效果
C.6.1利用大數(shù)據(jù)平臺,減少科研時間
C.6.1.1回顧性研究方面,改變了傳統(tǒng)Excle和人工收集數(shù)據(jù)的模式,實現(xiàn)了智能檢索、變量選擇和
智能統(tǒng)計分析。針對前瞻性研究,大數(shù)據(jù)幫助實現(xiàn)了患者入組、方案設(shè)計和隨訪采集等。
C.6.1.2以智能搜索為例,科研人員檢索一位腦出血患者,很快就能發(fā)現(xiàn)系統(tǒng)里腦出血患者的人次、
年齡分布等信息,同時支持二次篩選,剔除腦干出血和創(chuàng)傷性出血的患者。
C.6.1.3數(shù)據(jù)分析方面,由于科研系統(tǒng)中嵌入了相關(guān)的統(tǒng)計工具,例如描述性分析和差異性分析。通
過這些統(tǒng)計模型,可以讓科研人員很快分析出結(jié)果,從而大大節(jié)約工作效率。此外,也讓很多沉睡的數(shù)
據(jù)能夠得到很好的利用。
C.6.1.4從效率上看,過去醫(yī)療機(jī)構(gòu)要做一個回顧性研究,耗時在數(shù)周到數(shù)月都有可能。醫(yī)療機(jī)構(gòu)在
使用了科研大數(shù)據(jù)平臺后,在十分鐘之內(nèi)就可以建立一個科研隊列。前瞻性研究同樣如此,借助CRF
自動回填、智能隨訪等功能,可以減少60%左右的科研耗時。
C.6.2批量提升科研產(chǎn)出
醫(yī)療機(jī)構(gòu)在平臺的助力下,創(chuàng)建科研隊列研究1086個,有600多個科研項目在平臺上運行,涵蓋
全院各個學(xué)科。在數(shù)據(jù)治理方面,醫(yī)療機(jī)構(gòu)完成了57個業(yè)務(wù)系統(tǒng),總計11.4億條數(shù)據(jù)治理,形成清洗
后、結(jié)構(gòu)化、標(biāo)準(zhǔn)化數(shù)據(jù)9.1億條。并且,醫(yī)療機(jī)構(gòu)還借助數(shù)據(jù)治理能力,實現(xiàn)了整體數(shù)據(jù)質(zhì)量的提升。
13
DBXX/TXXX—XXXX
B
B
附錄D
附錄E(資料性)
附錄F極智分析-醫(yī)療大數(shù)據(jù)科研統(tǒng)計分析平臺的實踐案例
B.1案例背景
F.1.1一站式臨床研究建模平臺“極智分析”,是集數(shù)據(jù)治理、醫(yī)學(xué)統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)建模于一體的
全流程臨床研究專業(yè)分析平臺。平臺以科研項目為導(dǎo)向,集多種功能于一身,能實現(xiàn)從數(shù)據(jù)上傳到分析
結(jié)果一鍵式、一站式輸出的智能平臺,在降低使用門檻的同時能夠大大提升數(shù)據(jù)分析及建模效率,為臨
床醫(yī)護(hù)人員提供便捷。
F.1.2平臺的愿景是讓臨床研究變得沒有門檻,提升臨床研究工作者的研究效率,普及機(jī)器學(xué)習(xí)及人
工智能技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用,最終推動國內(nèi)臨床研究水平向世界看齊。
F.2痛點和難點
F.2.1痛點
F.2.1.1傳統(tǒng)的臨床科研數(shù)據(jù)分析系統(tǒng)例如SPSS、SAS、stats、graphpad等需要前期長時間的培訓(xùn)學(xué)
習(xí),耗時長、費用高、效果差;大部分臨醫(yī)生無法完全掌握,分析工具軟件種類繁多,沒有能夠?qū)崿F(xiàn)功
能整合的分析工具。
F.2.1.2基于機(jī)器學(xué)習(xí)的臨床預(yù)測模型的研究目前沒有數(shù)據(jù)分析系統(tǒng)能夠有效支持,而R\PYTHON等數(shù)
據(jù)分析編程語言的學(xué)習(xí)門檻較高且不容易掌握,需要研究人員有一定的編程基礎(chǔ)。
F.2.2難點
整合臨床研究中常用的數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析方法;多種機(jī)器學(xué)習(xí)算法的集成,可以在線進(jìn)行基于
機(jī)器學(xué)習(xí)臨床預(yù)測模型的構(gòu)建;解決海量、多線程的數(shù)據(jù)分析問題。
F.3基本情況
目前平臺已完成包括數(shù)據(jù)治理、基線分析、高級統(tǒng)計分析、智能AI分析、圖表制作、分析日志6
大功能模塊,40個子模塊,100余種分析方法建設(shè),能夠滿足臨床研究的分析及教學(xué)工作。
F.4平臺架構(gòu)
平臺后端算法采用Python和R語言混編實現(xiàn),平臺后臺框架采用Django,同時為滿足高并發(fā)機(jī)器
學(xué)習(xí)的需求,配置多臺服務(wù)器做Nginx負(fù)載均衡,關(guān)系型數(shù)據(jù)采用的Mysql5.6.49,非關(guān)系型數(shù)據(jù)庫
采取的Redis6.0.9存取,前臺JinJa2模板渲染和Vue、js實現(xiàn),如圖B.1所示。
14
DBXX/TXXX—XXXX
圖B.1極智分析平臺系統(tǒng)架構(gòu)
F.5功能介紹
F.5.1項目管理
分析平臺以項目為導(dǎo)向,用戶可根據(jù)研究方向新增研究項目,項目可上傳數(shù)據(jù)、存儲研究標(biāo)題、研
究方案和研究設(shè)計等,如圖B.2所示。
圖B.2項目管理界面
F.5.2數(shù)據(jù)治理
針對臨床研究研究設(shè)計的數(shù)據(jù)清洗模塊,提供缺失數(shù)據(jù)剔除、相關(guān)性\共線性變量剔除、智能數(shù)據(jù)
填補(bǔ)、數(shù)據(jù)標(biāo)準(zhǔn)化、PSM傾向性匹配、樣本均衡等十大功能模塊,如圖B.3所示。
圖B.3數(shù)據(jù)治理界面
F.5.3基線分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版部編歷史七年級上冊《第19課 北魏政治和北方民族大交融》聽課評課記錄
- 湘教版數(shù)學(xué)八年級上冊1.5《分式方程的應(yīng)用》聽評課記錄2
- 八年級數(shù)學(xué)下冊23.3事件的概率1聽評課記錄滬教版五四制
- 人教版地理八年級下冊6.3《世界上最大的黃土堆積區(qū)-黃土高原》聽課評課記錄1
- 蘇科版數(shù)學(xué)八年級上冊聽評課記錄《5-1物體位置的確定》
- 用功合同范本(2篇)
- 環(huán)境友好原材料采購合同(2篇)
- 人教版五年級下冊數(shù)學(xué)《第2單元因數(shù)與倍數(shù) 第1課時 因數(shù)和倍數(shù)(1)》聽評課記錄
- 聽評課記錄2年級
- 統(tǒng)編教材部編人教版道德與法治九年級下冊《3.2 與世界深度互動》聽課評課記錄
- 二零二五年度大型自動化設(shè)備買賣合同模板2篇
- 2024版金礦居間合同協(xié)議書
- 江西省部分學(xué)校2024-2025學(xué)年高三上學(xué)期1月期末英語試題(含解析無聽力音頻有聽力原文)
- GA/T 2145-2024法庭科學(xué)涉火案件物證檢驗實驗室建設(shè)技術(shù)規(guī)范
- 2025內(nèi)蒙古匯能煤化工限公司招聘300人高頻重點提升(共500題)附帶答案詳解
- 2025年中國融通資產(chǎn)管理集團(tuán)限公司春季招聘(511人)高頻重點提升(共500題)附帶答案詳解
- 寵物護(hù)理行業(yè)客戶回訪制度構(gòu)建
- 電廠檢修管理
- 《SPIN銷售法課件》課件
- 機(jī)動車屬性鑒定申請書
- 2024年中考語文試題分類匯編:非連續(xù)性文本閱讀(學(xué)生版)
評論
0/150
提交評論