




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
專病科研一體化大數據平臺需求方案
(一)項目背景醫(yī)院當前已經建立了全院主流業(yè)務場景下的信息化系統(tǒng)體系,但隨著醫(yī)院診療流程的不斷優(yōu)化和數據的積累與沉淀,也暴露出了當前醫(yī)院對于專病大數據的集中應用能力還較為薄弱,無法完全滿足臨床科室的科研實際業(yè)務要求。1.各業(yè)務系統(tǒng)間數據存在復雜異構,缺乏統(tǒng)一數據標準,未進行結構化和歸一化處理,難以進行大規(guī)模隊列比較研究和相關統(tǒng)計分析。2.缺乏一套滿足數據驅動科研的全流程自動化分析系統(tǒng)和工具,導致目前我院科研門檻高且周期長。3.缺乏統(tǒng)一的覆蓋多病種的隨訪體系與智能化隨訪平臺,目前我院隨訪數據質量及樣本量有待提高,難以長期跟蹤患者,導致隨訪數據質量無法保證,難以得到高可用的隨訪數據集。缺乏智能化專病科研隨訪平臺,難以通過信息化手段管理科研隨訪患者,無法實現多渠道的科研隨訪、宣教等應用??蒲须S訪人員不足,醫(yī)院隨訪患者量大,容易形成失訪,導致隨訪數據嚴重缺失。因此,缺乏高質量的大樣本隊列數據進行真實世界研究,難以形成貫穿患者全生命周期的大樣本隊列數據的前瞻性、回顧性研究。(二)項目目標1.建立標準化的專病數據治理體系,提升臨床數據可用性依托數據治理工具(數據建模、數據源管理、NLP標注訓練、數據調度管理、醫(yī)學知識管理、數據標準管理、數據質量管理),通過ETL、NLP、知識圖譜等技術,結合醫(yī)學知識庫,將多源異構數據進行結構化、歸一化、標準化處理,形成統(tǒng)一專病標準數據庫,把沉睡中的數據盤活起來,進行深度分析挖掘,生產出高質量可用科研數據集,奠定科研基礎,為專病科研應用提供數據支撐。2.制定規(guī)范化的隨訪體系,提高隨訪率與隨訪數據質量建立隨訪標準化體系,包括數據采集流程規(guī)范化、專病填報數據內容標準化、隨訪標準操作流程、隨訪流程規(guī)范化、隨訪表單標準化等,建立專業(yè)隨訪團隊,依托隨訪套件(CRF工具、隨訪任務、隨訪日歷、隨訪記錄、隨訪計劃、隨訪模板、隨訪數據質控),開展常態(tài)化隨訪服務工作,包括病程隨訪、門診隨訪、微信/小程序隨訪、電話隨訪、隨訪表單錄入、每月填報經驗總結、每季度數據抽檢等,提高隨訪率與隨訪數據質量。3.打造新型科研工具,滿足醫(yī)院科研需求,提升臨床科研產出效率運用大數據、人工智能等新型技術,基于專病科研一體化大數據平臺,從真實世界研究出發(fā),構建從實驗設計、數據可視化檢索、數據分析建模、隊列研究到隊列發(fā)現的全流程自動化臨床科研一體化應用,打造包括專病數據探索、專病數據檢索、患者專病全息視圖、專病科研統(tǒng)計分析等功能的一體化科研分析應用,為臨床科研人員提供專病研究新環(huán)境。通過真實世界大數據分析,實現發(fā)現真實客觀規(guī)律,挖掘底層醫(yī)療數據關系用以支撐相關??崎_展專病與疾病癥狀、檢驗、檢查、診療方案等的相關性和特異性的研究,賦能臨床科研水平提高,促進大數據臨床經驗模型構建和指導醫(yī)學實踐。4.為滿足后續(xù)多中心科研的需求,建設醫(yī)學聯(lián)邦學習模塊,實現多中心數據安全聯(lián)合建模采用聯(lián)邦學習框架,運用多中心數據訓練疾病預測模型,數據不出醫(yī)院,在保障數據隱私安全的同時又能解決數據孤島問題,通過創(chuàng)建由數據、醫(yī)學知識和機器學習模型組成的科研協(xié)作創(chuàng)新平臺,為醫(yī)院、研究者提供“數據不出院”的下一代數據共享協(xié)作機制。(三)建設內容名稱數量服務期限備注應用軟件科研分析模塊1套合同簽訂后3年內完成整體建設(其中前6個月內完成10個專病數據庫建設以及所有應用軟件的研發(fā)上線)/隨訪套件1套/數據治理工具1套/醫(yī)學聯(lián)邦學習1套/專病數據庫10套炎癥性腸病、結直腸癌(內科)、結直腸癌(外科)、痔瘡、自身免疫性肝病、終末期肝病、再生障礙貧血、糖尿病、血液透析、白血病數據庫軟件國產正版數據庫軟件1套/現場服務隨訪服務5人駐場服務數據治理服務20人駐場服務科研服務2人駐場服務硬件設備數據治理設備1臺/數據庫設備1臺/(四)服務內容1.數據治理服務要求(1)建立專業(yè)隨訪團隊1)提供直至所有專病數據庫搭建完成的駐場服務;2)配備至少20名專業(yè)的數據治理駐場人員;(2)專病數據采集服務 提供10套專病庫的數據自動采集服務,對接院內信息系統(tǒng),利用ETL技術進行自動化采集、清洗、轉換;(3)專病數據標準制定 制定10套精細化專病通用數據集標準,以及多個專病特異性數據集標準,內容涵蓋字段類別、數據來源、字段名稱、定義、值域、規(guī)則等。(4)專病數據模型設計 將抽取上來的數據,根據10套專病模型進行數據重構(不同專病具備不同的模型)。(5)數據脫敏加密 通過脫敏或加密規(guī)則進行數據的變形,實現敏感隱私數據的可靠保護,同時依然保持其它數據的格式和屬性,保證其可識別性和可用性。(6)NLP后結構化處理 1)從非結構化的臨床文本數據中(電子病歷文本、檢查報告等)提取結構化、標準化的數據。2)將文本根據醫(yī)學標注后自動識別實體。3)將文本根據相應醫(yī)學規(guī)則與實體識別后,生成目標主題所需數據。4)數據校驗,執(zhí)行規(guī)則后,分別統(tǒng)計解析節(jié)點的數量與原始病歷數量,對比解析前后病歷數量有無丟失,統(tǒng)計是否存在無解析成功等情況。(7)標準數據歸一 通過標準術語、同義詞和分類規(guī)則,轉換為標準化數據的數據標準化處理,實現已結構化變量的標準化。(8)數據質量校驗 1)添加數據質量評價規(guī)則,在數據采集階段實現數據完整性、一致性、整合性、合理性、及時性、有效性等校驗。(9)數據開發(fā) 1)輸入多種數據類型如EXCLE表、CSV、數據庫等的數據源;2)通過多種轉換組件,實現數據的多維度處理;3)通過多種數據格式輸出,滿足醫(yī)院及臨床科室個性化需求。(10)部署與聯(lián)調 將軟件系統(tǒng)部署在醫(yī)院信息中心,并進行聯(lián)調測試。2.隨訪服務要求(1)建立專業(yè)隨訪團隊 1)自項目初驗通過之日起,提供2年的駐場隨訪服務;2)配備至少5名專業(yè)的隨訪駐場人員;(2)建立隨訪標準化體系,包括但不限于:1)數據采集流程規(guī)范化;2)專病填報數據內容標準化;3)隨訪標準操作流程4)隨訪流程規(guī)范化;5)制定標準化的隨訪表單;(3)開展常態(tài)化隨訪服務工作,包括但不限于:1)病程隨訪;2)門診隨訪;3)微信公眾號或小程序隨訪;4)電話隨訪;5)隨訪表單錄入;6)每月填報經驗總結;7)每季度數據抽檢;3.科研服務要求(1)建立專業(yè)科研服務團隊 1)自項目初驗通過之日起2年內,提供累計12人月的科研駐場服務;2)配備至少2名專業(yè)的科研服務人員3)駐場人員需具備臨床經驗以及執(zhí)業(yè)醫(yī)師資格證(2)提供科研數據分析服務,包括但不限于以下幾方面:1)參與臨床研究設計2)提供前沿論文/文獻檢索和綜述服務3)輔助研究所需統(tǒng)計分析并出具報告4)提供臨床預測模型的設計服務5)根據科研人員的研究思路,提供數據驗證服務(五)技術指標要求(1)專病數據庫要求如下:構建10個專病數據庫:建設專病科研一體化大數據平臺,搭建炎癥性腸病、結直腸癌(內科)、結直腸癌(外科)、痔瘡、自身免疫性肝病、終末期肝病、再生障礙貧血、白血病、糖尿病、血液透析等10個專病數據庫,將醫(yī)院以往累積的相關專病數據以及未來增加的病歷數據,包括臨床文本數據、隨訪數據、影像數據等院內外多模態(tài)數據,進行統(tǒng)一采集、治理、脫敏及加密,整合成安全高質量的多模態(tài)研究數據庫。(2)軟件功能要求如下:序號模塊功能點功能描述1. 科研分析模塊多模態(tài)數據管理1.實現對多模態(tài)數據(文本、影像等)管理,需支持對影像數據進行調閱及管理,支持通過DICOM展示工具進行標注、調節(jié)窗寬窗位、長度測量等操作,圖像標注可保存。2.多模態(tài)探索:多模態(tài)數據(影像、病理、生物信息數據等)通過熱力圖、分布圖、柱狀圖、折線圖等可視化圖表進行數據探索,支持分析圖放大、分析圖下載等功能。3.支持導入外送樣本返回的pdf、圖片等格式的報告(例如測序報告,DSA抗體報告),通過OCR技術識別報告內容,并按姓名等字段導入、規(guī)整到相應的病例中;2. 數據探索1.數據源:(1)數據庫驅動管理:具備連接院內系統(tǒng)多類數據庫的功能,支持添加不同數據庫驅動,可上傳不同數據庫驅動安裝包;支持刪除數據庫驅動;支持對數據庫驅動文件管理;(2)數據源管理:配置接入的數據源信息,包括主機IP地址,端口號、數據庫名稱、數據庫模式(數據庫類型);支持新增、刪除、修改數據源;3. 2.數據集:支持添加數據集,包括數據庫數據集、SQL數據集、關聯(lián)數據集;(1)數據庫數據集:支持直接使用數據庫的表作為數據集;支持數據預覽、字段管理、數據關聯(lián)等功能;(2)SQL數據集:支持通過寫sql語句的方式新增數據集,可設置參數、參數支持類型和默認值設置;支持預覽數據、編輯數據字段、維度指標類型相互轉換、字段數據類型轉換、原始名稱修改、自定義新增字段等功能;(3)關聯(lián)數據集:支持關聯(lián)兩個數據庫數據集創(chuàng)建新集合;支持自定義關聯(lián)字段、可自定義展示字段、預覽數據、編輯數據字段、維度指標類型相互轉換、字段數據類型轉換、原始名稱修改、自定義新增字段等功能;4. 3.儀表板:(1)PC頁面設置:支持視圖(如餅圖、柱狀圖、趨勢圖等)、組件(如時間范圍、文本框、下拉框等)、其它(富文本、流媒體、網頁等)、復用(服用其他已配置的模板)4種方式創(chuàng)建儀表板元素;儀表板支持撤銷、重做、全屏預覽、儀表板樣式、批量操作、保存、元素分布方式設置、輔助設計網格、外部參數設置、清空畫布等功能按鈕。移動頁面:支持選擇視圖到手機;支持視圖長寬的調整;支持重置、確定、保存功能;支持通過分享的方式用手機訪問做好的儀表板;支持角色權限配置查看報表范圍。5. 數據檢索1.全文檢索:提供便捷的快速關鍵詞搜索入口,通過字典分析、切詞等技術處理,檢索符合請求條件的結果,并提供了各種靈活的篩選方式、排序方式和搜索結構的專業(yè)統(tǒng)計;搜索關鍵詞可選擇關鍵詞出處,如:電子病歷、檢查報告、病理報告等;2.一般檢索:支持根據需求設置好檢索條件,如:姓名、住院號、年齡、手術時間等信息,進行精確搜索找到目標患者群;檢索結果下載支持下載審批流程;3.自定義檢索:支持條件樹搜索,相對于高級搜索更加靈活,能夠將并且、或者和排除三種邏輯關系按照需求進行組合;4.事件過濾:支持事件過濾器,包括按頻次過濾、時間過濾等,并配置完成后顯示對應檢索數據結果;5.特征提?。褐С謾z索后進行特征提取,包含行列轉換、最大面積計算等函數;支持最大值、最小值、最早、最晚、存在、合計、平均、技術等函數運算,及支持并且、或者和排除三種邏輯關系組合過濾;6.檢索數據結果,支持生成檢索結果、相關結果、指標統(tǒng)計、數據質量分析:(1)檢索結果,支持查看患者列表,包括確診年齡、性別、民族、全息視圖,支持點擊全息視圖查看患者基本信息、檢查記錄、病理記錄、手術記錄、檢驗結果等多模態(tài)數據信息;(2)相關結果,支持查看患者、影像、病理等統(tǒng)計總數;(3)指標統(tǒng)計,支持通過各類圖表(餅圖、柱狀圖等)可視化查看檢索結果數據集的各指標分布情況;(4)數據質量分析,支持查看檢索出來的數據集的數據質量報告,包括填報率、完整率、有效率等。7.檢索結果須支持數據查看以及數據下載審批流程,經過審批后才能查看以及下載。6. 數據使用1.支持自定義設定數據查看和下載流程;2.支持控制變量權限功能,避免重要數據外泄風險;3.支持多種數據導出格式,包括CSV、SAS、SPSS、R、Stata等。4.支持審批通過后,可查閱患者數據7. 我的數據集1.支持導入獲批的數據集至我的數據集中;2.支持導入科研統(tǒng)計分析模塊進行分析。8. 患者專病全息視圖1.支持“患者專病全息視圖”的方式展示患者的全治療周期,記錄患者在每一個時間節(jié)點的診斷、用藥、體征數據、檢查、檢驗、治療、手術等數據。9. 專病數據管理1.數據質量控制,提供常用的基礎規(guī)則,可自定義配置規(guī)則;通過編輯質量指標函數來監(jiān)測和預警質量問題,同時內置質量報告模板,更加直觀的發(fā)現數據質量問題。2.支持數據質量的評價,包括數據表單填報率、完整性、有效性,以及患者數據填報率、完整性、有效性等多維度進行分析評價;3.支持元數據查詢,查詢各元數據信息等。10. 我的研究1.支持科研全流程管理,包括:(1)實驗設計(2)數據獲取(3)數據處理(4)統(tǒng)計分析(5)結果輸出(6)成員管理;2.提供靈活方便的組合查詢篩選界面,以及多維度的診療數據檢索,可以快速地找到科研病例集,再通過入選和排斥等集合運算實現研究人群的精確篩選,并且可以把多維度查詢條件保存,以便滿足條件的新病人自動入組進行研究;3.通過入組的研究隊列人群,建立隊列人群的可視化,用戶可直接點擊查看隊列人群數據基本情況,包含隊列人群的基本信息,如年齡、性別、診斷、手術等分布情況;4.提供定義實驗方法對隊列人群和特征進行分類管理;5.提供成員管理,通過自定義的用戶權限控制進行團隊合作;6.支持研究患者樣本數估算。11. 科研統(tǒng)計分析模塊1. 數據集管理與報告管理(1)可以導入“我的數據集”中的數據集(2)可以上傳和管理數據集,支持對數據集的編輯、刪除操作。(3)可以對數據集的英文字段修改。(4)支持查看與存儲統(tǒng)計報告、機器學習模型分析報告。(5)支持機器學習模型文件的下載。12. 2.數據清洗(數據特征工程)(1)支持通過平均數、中位數、最頻繁數補充缺失值。(2)支持對數據進行歸一化操作。(3)支持對文本數據進行各類編碼,包括:標簽編碼、目標編碼、onethot編碼。13. 3.數據探索(1)支持對數據集進行描述統(tǒng)計、分組統(tǒng)計、離散直方圖、散點圖、箱型圖、折線圖等數據探索;(2)以彩色相關矩陣圖形式顯示三大相關系數(即:皮爾遜相關、斯皮爾曼相關、肯德爾相關)支持一次性完成多個字段的均值、方差、極值等統(tǒng)計量的計算;(3)支持對數據的樣本情況、均值、異常值、相關性進行初步探索。(4)以彩色相關矩陣圖形式顯示皮爾遜相關系數。14. 4.推斷統(tǒng)計支持參數檢驗、方差及分布檢驗、非參數檢驗、相關性檢驗進行推斷統(tǒng)計;15. 5.機器學習(1)支持線性回歸、非線性回歸、集成回歸算法、二分類算法、多分類算法、樹形分類算法、無監(jiān)督學習、時間相關模型等多種機器學習算法;(2)支持神經網絡、集成算法(隨機森林、Adaboost、GBDT)等高級人工智能算法;(3)根據不同算法提供ROC、矯正曲線、森林圖、混淆矩陣;(4)支持通過大屏駕駛艙展示線性回歸、邏輯回歸的計算結果。(5)數據集提取出來后,支持用一部分數據作為訓練集,另外剩余的數據作為驗證集,同時提供驗證的ROC曲線、C-index、校正曲線和crossvalidation結果等。16. 隨訪套件CRF工具1.提供專病的專業(yè)數據采集模板;自定義建題,題型包括:單選題、多選題、填空題、橫向填空、計算題、復合題、文本說明、分割線等等;2.提供多種邏輯顯示關系,包括表單與字段、字段與字段等;3.支持疾病標準指標集的定義,包含字段中文名、字段說明、數據類型、值域等;4.支持表單模板管理,一鍵添加,可永久復用。5.跨表單智能關聯(lián)分析功能,實現一套模板內跨表單、多條件定義分支邏輯功能。當一套隨訪模板中具備多張表單時,其中一張表單中選項的取值有變化時,其他表單中的一些選項會智能關聯(lián)顯示/隱藏。支持通過拖拉拽的方式配置智能關聯(lián)邏輯。17. 隨訪入組1.根據患者診療基線指標,結合醫(yī)學規(guī)則,系統(tǒng)觸發(fā)自動入組到隨訪計劃以及任務中;2.根據患者在一份隨訪表單內容滿足指定的字段值域,結合醫(yī)學規(guī)則,系統(tǒng)觸發(fā)自動入組到另一份其他病種的隨訪計劃以及任務中;3.系統(tǒng)自動入組后,支持隨訪人員進行人工核驗并自主選擇是否需重新入組,針對無需繼續(xù)隨訪的對象,可添加至過濾名單中,并可添加過濾原因,過濾原因可全員共享查看;4.系統(tǒng)可根據特定標識(如死亡),可自動過濾特殊標識的隨訪對象,不再納入隨訪任務中。5.系統(tǒng)可根據患者唯一標識判斷該患者是否存在多隨訪任務,若存在多隨訪任務,系統(tǒng)自動提醒隨訪人員確認是否進入當前組別。18. 隨訪任務1.支持根據隨訪計劃自動生成相應隨訪任務;2.支持通過隨訪狀態(tài)進行查詢,包括全部、待隨訪、逾期等;3.支持通過輸入患者住院號、姓名等進行查詢;4.隨訪任務列表內容包括住院號、姓名、前次隨訪日期、本次隨訪日期、下次隨訪日期、已完成隨訪次數、失訪次數、逾期次數、當前狀態(tài)等;5.支持對隨訪列表中的患者進行相關操作,包括隨訪錄入、查看患者信息、修改隨訪計劃等;6.當一位患者產生多隨訪任務沖突時,系統(tǒng)將自動提前提醒患者以及隨訪人員。19. 隨訪日歷1.自由選擇以及切換年/月查看隨訪日歷,對隨訪任務一目了然;2.通過月歷的形式查看該月份的隨訪任務;3.通過不同顏色標注不同隨訪狀態(tài),包括已逾期、進行中、已失訪、已完成、未開始等;4.點擊事件,即可彈窗查看日歷事件,事件概覽信息包括患者姓名、住院號、隨訪模板、當次隨訪事件、隨訪時間、備注信息等;20. 隨訪記錄1.提供隨訪記錄過程查詢功能;2.支持通過隨訪狀態(tài)進行查詢,包括全部、未開始、進行中、已完成等;3.支持通過輸入患者住院號、姓名等進行查詢;4.隨訪記錄列表內容包括住院號、姓名、已完成隨訪次數、失訪次數、逾期次數、狀態(tài)等;5.支持對隨訪列表中的患者進行相關操作,包括查看隨訪表單數據、查看患者信息、修改隨訪計劃等;6.支持記錄隨訪計劃的修改操作,形成日志供管理員查閱;21. 隨訪計劃1.在此模塊中,為新入庫的患者設置隨訪起始日期以及選擇隨訪計劃,該日期用于隨訪計劃的起點,一經確認,它將顯示在工作日歷中。2.支持自定義設置患者隨訪計劃、隨訪頻率和隨訪開始時間;3.隨訪計劃制定,包括設定隨訪基線時間、隨訪模板、計劃進度規(guī)劃、隨訪事件選擇等;4.計劃進度基于隨訪基線時間以及隨訪頻率,自動生成隨訪計劃表,如遇周六日,將進行提醒,并支持調整隨訪日期;5.事件工具,支持對每一次的隨訪選擇使用哪個隨訪模板;22. 隨訪模板1.在此模塊中可以設置隨訪時間以便于對患者進行多次隨訪;設置隨訪計劃后,需要指派用于此隨訪計劃的CRF工具,設置完成后,自動生成各次隨訪任務并依次添加到隨訪日歷中。2.支持配置隨訪模板,模板支持自定義配置CRF表;具備隨訪模板版本號;3.根據不同的模板,創(chuàng)建專病數據庫推薦隨訪計劃,包括設置首次及末次隨訪時間、隨訪間隔、相距前次天數、提前隨訪天數、最晚隨訪天數、事件名稱等;4.支持根據隨訪基線、隨訪間隔、隨訪次數設置周期性隨訪計劃;5.隨訪模板支持版本管理,系統(tǒng)支持展示當前在用、禁用的各版本號、操作人,操作時間等信息;23. 隨訪數據質控1.支持質控流程,提供問題質疑功能,如發(fā)現數據有問題時由質控員發(fā)起質疑,隨訪員回復質疑,協(xié)助發(fā)現完整性、準確性等數據質量問題;2.支持記錄質控操作,形成質控記錄;3.支持查看待質控列表,支持通過住院號檢索,內容包括待質控變量、待解決變量、已解決變量、質控開啟時間等;4.數據質控狀態(tài)包括:已質控,直接驗證通過、已質控,經過質疑,回復,修改、正在質控,待回復、正在質控,已回復、未質控狀態(tài),一級質控變量、未質控狀態(tài),二級質控變量;質控狀態(tài)根據質控節(jié)點進行變化或提示,后期可根據院方需求調整質控狀態(tài);5.通過不同顏色氣泡在每個數據項處進行提醒,點擊氣泡進行質控;24. 數據治理工具數據建模支持元數據模型創(chuàng)建及物理模型同步;1.新建模型,支持模型基本信息編輯,包括模型名稱、所屬數據域、所屬主題目錄、數據儲存方式(橫表/縱表);2.數據建模,包括創(chuàng)建指標,配置標簽、數據類型、字段、字典配置、數據分類、數據等級、業(yè)務口徑、歸屬主題等;3.可同步模型信息到數據庫中,保證數據模型的一致性;4.并可查看歷史模型的更新日志,便于模型版本管理及溯源。25. 數據源管理支持數據源的統(tǒng)一管理,保障數據訪問的安全性1.管理配置各系統(tǒng)數據源接入信息;配置接入的數據源信息,包括主機IP地址,端口號、數據庫名稱、數據庫模式(數據庫類型);2.支持新增、刪除、修改數據源;26. NLP標注訓練1.提取病歷系統(tǒng)里的目的描述語句;2.提供可視化界面以清晰、快捷的方式對文本數據進行標注;3.通過自然語言對標注集模型進行統(tǒng)一訓練并生成相對成熟的業(yè)務模型。27. 數據調度管理1.支持任務配置、依賴配置、調度時間自定義配置功能,提供對任務的監(jiān)控、維護功能;28. 數據溯源支持數據生產過程中的血緣分析溯源:1.自動繪制成數據血緣可視化關系圖譜,清晰地了解數據上下游關系;2.結合數據調度,快速定位數據的位置及向下影響范圍。29. 醫(yī)學知識管理1.醫(yī)學知識庫涵蓋醫(yī)學規(guī)則庫、疾病知識庫、藥品知識庫等;2.支持知識庫管理及應用;30. 數據開發(fā)1.通過可視化頁面配置數據生產規(guī)則,通過規(guī)則庫進行統(tǒng)一管理;2.提供豐富的函數庫,至少包含9大類函數,如比較函數、條件函數、數學函數、聚合函數、日期函數、提取函數、匹配函數、字符串函數、定制函數等,通過輸入參數后運行出對應結果數據;3.支持在可視化頁面通過多種條件、多種邏輯組合(與或非等)進行數據生產規(guī)則配置。31. 數據標準管理1.提供對字典的統(tǒng)一管理;2.支持標準術語的發(fā)布、審批流程;32. 數據質量管理1.提供完整性、規(guī)范性、一致性、有效性、唯一性、關聯(lián)性六種維度的數據質量規(guī)則配置;2.支持輸出對應質量分析報告;33. 醫(yī)學聯(lián)邦學習模塊首頁支持對總體資源進行可視化統(tǒng)計分析展示:1.支持資源的統(tǒng)計信息總覽,包括:參與機構數、數據集數、項目數、模型數等;2.支持查看進行中的項目,包括:項目狀態(tài)、項目樣本量、項目參與機構數量等;3.項目訓練次數可視化,支持通過曲線圖查看每天訓練次數,包括本地建模、聯(lián)邦建模的訓練次數。34. 數據中心1.我的數據集:(1)支持本地數據源上傳,包括csv結構化數據及PNG/JPEG影像數據上傳;(2)支持對數據集進行模糊檢索、關鍵字檢索、編輯、刪除等操作;(3)支持結構化數據集的特征信息展示,如特征缺失數量、中位數、平均數、最大值、最小值等統(tǒng)計信息;35. 2.共享數據集(1)展示聯(lián)邦學習模塊中所有節(jié)點機構共享的數據集的數據集目錄列表;(2)可查看每個數據集的特征填充率缺失數量、中位數、平均數、最大值、最小值等統(tǒng)計信息,不可查看具體文件數據集的內容明細信息。36. 項目中心聯(lián)邦建模支持多機構之間進行聯(lián)邦建模,并支持具體算法配置、任務管理、模型操作等功能:1.支持創(chuàng)建項目進行聯(lián)邦建模,支持添加數據集、算法配置、訓練任務管理;2.算法參數配置:支持可用于影像分類alexnet算法、影像分割unet算法等算法建模參數配置;3.任務管理支持建模任務的管理、建模進度與報告查看、建模結果模型導出和發(fā)布;4.支持共享模型,可下載模型。37. 模型中心提供對模型資源的管理:1.我的模型:支持通過模型名稱、關鍵字檢索模型;通過模型列表進行模型的管理,包括查看模型基本信息、共享模型至其他機構、下載模型、編輯模型名稱及標簽、刪除模型等;支持模型的本地評估;2.共享模型:支持通過模型名稱、關鍵字檢索共享模型;通過模型列表進行模型的管理,包括查看模型基本信息、下載模型等;支持模型的異地獨立評估。38. 審批中心1.我的審批提供數據集使用授權審批操作;2.我的申請查看個人申請數據集使用權的申請記錄信息;39. 系統(tǒng)管理1.具備對機構和用戶的管理;2.具備基于區(qū)塊鏈技術的日志存證查詢功能。40. 國產化正版數據庫軟件1.基本功能:支持多種數據類型,包括字符類型、數值類型、二進制類型、大對象類型等;支持非關系數據的操作,包括XML類型、JSON類型、CSV類型、TXT類型、空間類型(地理信息GIS數據類型)。支持行列融合存儲技術,支持變更緩存、高級日志等功能實現列存高頻插入效率的提升和行列自動同步機制。支持虛擬列,支持在虛擬列上建索引;支持自增列的創(chuàng)建、使用、刪除操作,支持手工插入自增列。提供具備測評資質的第三方測評機構出具的測試報告。41. 2.數據庫參數要求2.1兼容性兼容Oracle的DBA_*、ALL_*和USER_*開頭的數據字典視圖、系統(tǒng)包;兼容Oracle、Mysql、SQLServer、DB2、PostgreSQL的常用系統(tǒng)函數。2.2性能要求單機單實例TPC-C性能測試,在3000倉3000并發(fā)下,且持續(xù)運行≥60分鐘,測試數據庫性能指標可達到≥170萬tpmC以上。2.3可靠性(1)單機支持≥10萬個并發(fā)連接數,36小時以上不掉線;(2)支持物理備份及恢復,包括全量、增量和差異備份及恢復功能;支持恢復到指定時間點;支持歸檔備份;支持自動備份;支持備份壓縮;支持邏輯備份及還原,包括數據庫級、模式級、用戶級、表級;(3)支持x86和國產平臺上基于共享存儲的數據庫集群;支持≥8個節(jié)點的集群規(guī)模;負載環(huán)境下7*24小時內無故障運行率達到≥99.99%;2.4安全性支持基于SM4算法的按列存儲加密,支持同一表不同列設置不同密鑰。2.5易用性(1)提供基于B/S架構的集中式運維管理工具,包含數據庫對象管理工具、數據遷移工具、性能監(jiān)視工具等功能,同時提供集群部署功能、監(jiān)控功能和告警功能。(2)支持Web圖形化數據庫遷移評估系統(tǒng),能夠提供在線評估、轉換工具,一鍵操作完成主流數據庫的數據庫對象的遷移評估,自動生成數據庫遷移評估報告、提供可量化指標數據、實現數據庫對象的智能轉換和改寫并自動生成遷移轉換后的SQL腳本。42. 3.信創(chuàng)要求具有國內自主知識產權,支持信創(chuàng)環(huán)境部署,兼容多種硬件體系,至少可運行于龍芯系列,飛報告騰系列,申威系列,以及兆芯、鯤鵬、海光等多種主流的不同CPU架構的服務器設備;至少兼容主流如麒麟、統(tǒng)信、中科方德等多種國產Linux系列操作系統(tǒng)。(3)硬件參數要求如下:1)數據治理設備序號采購需求參數要求數量單位1. 數據治理設備1.設備外型:機架式;1臺2. 2.設備高度≥2U,標配原廠導軌;3. 3.處理器-CPU型號:相當于或優(yōu)于Intel至強可擴展系列處理器≥2.3GHz/16核/22MB高速緩存;4. 4.處理器-CPU實配數量 ≥2顆;5. 5.內存實配規(guī)格 ≥128GB3200MHzDDR4;6. 6.內存可擴展數量:最大支持32根DDR4內存,最高速率3200MT/s,支持RDIMM或LRDIMM,支持16根英特爾?傲騰?持久內存PMem200系列(BarlowPass)最大可支持內存容量高達12TB;7. 7.存儲-實配硬盤及托架:≥5*12TBSAS12GB/S接口3.5英寸硬盤;≥2*480GBSSD硬盤;8. 8.重點性能要求:1)存儲-硬盤槽位:支持SAS/SATAHDD/
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河北地質大學華信學院《機械工程測試技術基礎實驗》2023-2024學年第二學期期末試卷
- 廣東茂名農林科技職業(yè)學院《創(chuàng)新思維與設計》2023-2024學年第二學期期末試卷
- 蘭州城市學院《組織設計》2023-2024學年第二學期期末試卷
- 湖北生態(tài)工程職業(yè)技術學院《土木工程制圖》2023-2024學年第二學期期末試卷
- 西安工商學院《逆向設計與增材制造》2023-2024學年第二學期期末試卷
- 天府新區(qū)航空旅游職業(yè)學院《物流客戶關系管理》2023-2024學年第二學期期末試卷
- 2025四年級數學下學期期中學業(yè)質量監(jiān)測復習
- 2025年三年級語文下學期期中復習同步練習題單
- 個人周工作計劃范文(28篇)
- 關于質量月的活動總結范文
- 2024年汽車裝調工技能競賽理論考試題庫(含答案)
- (新版)區(qū)塊鏈應用操作員職業(yè)技能競賽理論考試題庫-上(單選題)
- 生豬屠宰獸醫(yī)衛(wèi)生檢驗人員理論考試題庫及答案
- 高中英語課程設計目的
- 2024-2025學年北京一零一中學初三期初測試數學試題含解析
- 2024年12月大學英語四級CET-4真題試卷
- 高中生物學選擇性必修一測試卷及答案解析
- 佳能EOS700D使用說明書
- 煤礦應急叫應、回應、響應機制
- 圓圈正義讀書分享課件
- DL∕T 1910-2018 配電網分布式饋線自動化技術規(guī)范
評論
0/150
提交評論