醫(yī)療數(shù)據(jù)相關知識概述_第1頁
醫(yī)療數(shù)據(jù)相關知識概述_第2頁
醫(yī)療數(shù)據(jù)相關知識概述_第3頁
醫(yī)療數(shù)據(jù)相關知識概述_第4頁
醫(yī)療數(shù)據(jù)相關知識概述_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

DaricLiTrainingMaterialsforCardiologySolutionTeam醫(yī)療數(shù)據(jù)相關知識概述第1頁內容:1,云計算相關概念2,HIS相關概念3,PASC/LIS/HL7相關概念4,電子病歷5,大數(shù)據(jù)相關概念醫(yī)療數(shù)據(jù)相關知識概述第2頁什么是云計算云計算cloudcomputing是一個基于因特網(wǎng)超級計算模式,在遠程數(shù)據(jù)中心里,成千上萬臺電腦和服務器連接成一片電腦云。所以,云計算甚至能夠讓你體驗每秒超出10萬億次運算能力,擁有這么強大計算能力能夠模擬核爆炸、預測氣候改變和市場發(fā)展趨勢。用戶經(jīng)過電腦、筆記本、手機等方式接入數(shù)據(jù)中心,按自己需求進行運算。醫(yī)療數(shù)據(jù)相關知識概述第3頁云計算定義云計算,將計算任務分布在大量計算機組成資源池上,使各種應用系統(tǒng)能夠依據(jù)需要獲取計算力、存放空間和各種軟件服務”醫(yī)療數(shù)據(jù)相關知識概述第4頁狹義云計算指是廠商經(jīng)過分布式計算和虛擬化技術搭建數(shù)據(jù)中心或超級計算機,以無償或按需租用方式向技術開發(fā)者或者企業(yè)客戶提供數(shù)據(jù)存放、分析以及科學計算等服務,比如亞馬遜數(shù)據(jù)倉庫出租生意云計算定義醫(yī)療數(shù)據(jù)相關知識概述第5頁通俗了解是,云計算“云“就是存在于互聯(lián)網(wǎng)上服務器集群上資源,它包含硬件資源(服務器、存放器、CPU等)和軟件資源(如應用軟件、集成開發(fā)環(huán)境等),全部處理都在云計算提供商所提供計算機群來完成。云計算定義醫(yī)療數(shù)據(jù)相關知識概述第6頁云計算應用之一:物聯(lián)網(wǎng)IOT

醫(yī)療數(shù)據(jù)相關知識概述第7頁IaaS資源平臺

Infrastructure(網(wǎng)絡能力、計算能力、存放能力)PaaS系統(tǒng)平臺

Platform(應用服務器、應用框架、編程語言)系統(tǒng)平臺

Platform(應用服務器、應用框架、編程語言)軟件Software(應用)SaaS應用Software(應用)軟件Software(應用)硬件平臺

(計算、存放、網(wǎng)絡)HaaS硬件平臺(網(wǎng)絡、計算、存放)云計算應用

醫(yī)療數(shù)據(jù)相關知識概述第8頁內容:1,云計算相關概念2,HIS相關概念3,PASC/LIS/HL7相關概念4,電子病歷5,大數(shù)據(jù)相關概念醫(yī)療數(shù)據(jù)相關知識概述第9頁數(shù)據(jù)庫住院ADT藥品管理財務病房診間基于主題數(shù)據(jù)庫HIS系統(tǒng)醫(yī)療數(shù)據(jù)相關知識概述第10頁定義:信息系統(tǒng)(InformationSystem)是以提供信息服務為主要目標數(shù)據(jù)密集型、人機交互計算機應用系統(tǒng)特點:(1)包括數(shù)據(jù)量大。數(shù)據(jù)普通需存放在輔助存放器中,內存中只暫存當前要處理一小部分數(shù)據(jù);(2)絕大部分數(shù)據(jù)是持久,即不隨程序運行結束而消失,而需長久保留在計算機系統(tǒng)中;(3)這些持久數(shù)據(jù)為多個應用程序所共享,甚至在一個單位或更大范圍內共享;(4)含有數(shù)據(jù)采集、傳輸、存放和管理等基本功效及向用戶提供信息檢索、統(tǒng)計報表、事務處理、規(guī)劃、設計、指揮、控制、決議、報警、提醒、咨詢等信息服務信息系統(tǒng)定義及特點醫(yī)療數(shù)據(jù)相關知識概述第11頁(《醫(yī)院信息系統(tǒng)基本功效規(guī)范》)醫(yī)院信息系統(tǒng)(HIS,hospitalinformationsystem)是指利用計算機軟硬件技術、網(wǎng)絡通訊技術等當代化伎倆,對醫(yī)院及其所屬各部門對人流、物流、財流進行綜合管理,對在醫(yī)療活動各階段中產(chǎn)生數(shù)據(jù)進行采集、存貯、處理、提取、傳輸、匯總、加工生成各種信息,從而為醫(yī)院整體運行提供全方面、自動化管理及各種服務信息系統(tǒng)。醫(yī)院信息系統(tǒng)是當代化醫(yī)院建設中不可缺乏基礎設施與支撐環(huán)境

醫(yī)院信息系統(tǒng)定義醫(yī)療數(shù)據(jù)相關知識概述第12頁醫(yī)院信息系統(tǒng)是實現(xiàn)醫(yī)院各類信息搜集、存放、傳輸、加工和綜合利用人-機系統(tǒng)。醫(yī)院信息系統(tǒng)是對醫(yī)院信息執(zhí)行分散搜集、統(tǒng)一管理、集中使用、全員共享計算機網(wǎng)絡系統(tǒng)。醫(yī)院信息系統(tǒng)是軟件系統(tǒng)或應用軟件系統(tǒng),它一定是在計算機網(wǎng)絡環(huán)境下運行應用軟件系統(tǒng)把醫(yī)院產(chǎn)生各種信息輸入計算機網(wǎng)絡系統(tǒng),由計算機完成信息儲存、處理、傳輸和輸出,在醫(yī)院內形成信息共享,以提升醫(yī)院工作質量及工作效率醫(yī)療數(shù)據(jù)相關知識概述第13頁醫(yī)院信息化整體模型醫(yī)療數(shù)據(jù)相關知識概述第14頁醫(yī)院信息系統(tǒng)組成醫(yī)院信息系統(tǒng)PACSRIS/LISCAD/CAT臨床信息系統(tǒng)EPROE管理信息系統(tǒng)辦公自動化CRMHRDSSBillingHRPE-mailA/VNetworkE-LibWeb醫(yī)療數(shù)據(jù)相關知識概述第15頁基建管理人事管理醫(yī)政管理科研教學圖書情報業(yè)務信息住院醫(yī)生站手術麻醉門診醫(yī)生站醫(yī)學影像住院登記病人信息電子病案供給室制劑室物質管理設備管理固定資產(chǎn)中西藥庫物流信息財務管理住院藥房醫(yī)保管理住院收費門診收費財經(jīng)信息醫(yī)技工作站門診藥房門診掛號護士工作站綜合統(tǒng)計信息系統(tǒng)網(wǎng)絡信息管理系統(tǒng)院長工作站醫(yī)院信息系統(tǒng)主體流程圖醫(yī)療數(shù)據(jù)相關知識概述第16頁自然信息身份登記住院統(tǒng)計住院處醫(yī)囑病程病房手術統(tǒng)計手術室檢驗化驗輔診科病案編目病案室電子病歷門診收費門診藥品支出藥庫藥局治療床位病房儀器折舊器械處輔診收入輔診療低值易耗供應室經(jīng)濟核算手術收入手術室營房水電后勤HIS常見兩條信息線模式醫(yī)療數(shù)據(jù)相關知識概述第17頁PACS-與HIS融合關系圖DICOM設備工作站PACSDICOM預約登記診療匯報查詢統(tǒng)計系統(tǒng)管理數(shù)據(jù)庫劃價收費分診檢驗安排HISRISPACSHL7HISRISPACS醫(yī)療數(shù)據(jù)相關知識概述第18頁網(wǎng)站系統(tǒng)界面醫(yī)療數(shù)據(jù)相關知識概述第19頁內容:1,云計算相關概念2,HIS相關概念3,PASC/LIS/HL7相關概念4,電子病歷5,大數(shù)據(jù)相關概念醫(yī)療數(shù)據(jù)相關知識概述第20頁PACS定義PACSPictureArchivingandCommunicationSystem圖像存檔及通信系統(tǒng)把從不一樣地點各成像裝置(如傳統(tǒng)X射線攝影裝置、核醫(yī)學成像裝置、CT、MRI、B超、數(shù)字放射攝影裝置等)產(chǎn)生圖像經(jīng)數(shù)字化(如原來是膠片等模擬圖像話)后,經(jīng)過計算機網(wǎng)絡送至中央數(shù)據(jù)管理系統(tǒng)(含數(shù)據(jù)庫),再經(jīng)計算機網(wǎng)絡送至不一樣顯示工作站,供放射科醫(yī)生、病房醫(yī)生及其它醫(yī)務人員調用。醫(yī)療數(shù)據(jù)相關知識概述第21頁醫(yī)學圖像存放與傳輸系統(tǒng)PACS:

PictureArchivingandCommunicationsSystem(影像存檔及通信系統(tǒng)):醫(yī)院中醫(yī)學影像管理系統(tǒng),簡稱PACS,是使用計算機和網(wǎng)絡技術對醫(yī)學影像進行數(shù)字化處理系統(tǒng)。它是專門為圖像管理而設計包含圖像存檔、檢索、傳送、顯示、處理和拷貝或打印硬件和軟件系統(tǒng)。其目標是為了有效管理和利用醫(yī)學圖像資源。概括起來,主要處理醫(yī)學影像采集和數(shù)字化,圖像存放和管理,數(shù)字化醫(yī)學圖像高速傳輸,圖像數(shù)字化處理和重現(xiàn),醫(yī)學圖像信息與其它信息集成五個方面問題。醫(yī)療數(shù)據(jù)相關知識概述第22頁PACS系統(tǒng)架構RISWebViewerDICOMGateNon-DICOMModalitiesDICOMModalitiesPACSServerBackupServerWebServerDiskBurnerPACSSystemViewer醫(yī)學圖像存放與傳輸系統(tǒng)醫(yī)療數(shù)據(jù)相關知識概述第23頁PACS/RIS與HIS整合方式PACS/RIS直接讀取HIS數(shù)據(jù)庫數(shù)據(jù)PACS/RIS與HIS間使用過渡數(shù)據(jù)庫(Broker)PACS/RIS與HIS共同遵照HL7標準通訊

病人基本訊息病人檢驗訊息/狀態(tài)病人匯報訊息/狀態(tài)HL7、ODBC中間數(shù)據(jù)庫PACS/RIS數(shù)據(jù)庫HIS數(shù)據(jù)庫HIS與PACS融合醫(yī)療數(shù)據(jù)相關知識概述第24頁HL7醫(yī)學信息交換標準(HealthLevel7)醫(yī)療數(shù)據(jù)相關知識概述第25頁1.HL7–HealthLevel7“七”指是什么呢?在“HL7”里,“7”位于開放系統(tǒng)互連系列通信協(xié)議應用層最頂層并沒有HL1~6其他標準為應用層最底層,如:表述層(如:Windows)傳輸層(如:TCP/IP,DCOM)連接層(如:Ethernet)醫(yī)療數(shù)據(jù)相關知識概述第26頁ISO-OSI網(wǎng)絡體系結構模型1 物理

Physical2 鏈路DataLink3 網(wǎng)絡Network4 傳輸TransportCommunication5 會話Session6 表示Presentation7 應用ApplicationFunctionHL7HL7與網(wǎng)絡體系結構及協(xié)議關系醫(yī)療數(shù)據(jù)相關知識概述第27頁HL7與OSI關系鏈路

DataLink物理

Physical傳輸

Transport網(wǎng)絡

Network表示

Presentation會話

Session應用

ApplicationFTPHTTPPOP3….TCPUDPIPLLC;MACSMTP實體線路HealthLevelSeven(HL7)醫(yī)療數(shù)據(jù)相關知識概述第28頁DICOM(DigitalImagingandCommunicationinMedicine)標準是由ACR(AmericanCollegeofRadiology)及NEMA(NationalElectricalManufacturersAssociation)所形成聯(lián)合委員會,于1983年以后陸續(xù)發(fā)展而成醫(yī)療數(shù)位影像及傳輸標準。簡言之,DICOM是醫(yī)學圖像及其相關信息通訊標準。此標準建立目標為:推進開放式與廠牌無關醫(yī)療數(shù)位影像傳輸與交換。促使影像儲存與傳輸系統(tǒng)PACS(PictureArchivingandCommunicationSystems)發(fā)展與各種醫(yī)院信息系統(tǒng)HIS(HospitalInformationSystems)結合。允許所產(chǎn)生診療資料庫能廣泛地被不一樣地方設備來訪問。DICOMVersion3.0,發(fā)表于1992年,原自ACR-MEMA兩次發(fā)表標準,分別為:CR/NEMAPSNo.300-1985,Version1.0,發(fā)表于1985年,1986年十月頒為標準;CR/NEMAPSNo.300-1988,Version2.0,1988年1月頒為標準,涵蓋Version1.0。DICOM標準介紹醫(yī)療數(shù)據(jù)相關知識概述第29頁DICOM總結:“DICOM是一個醫(yī)學成像標準?!痹敿殐热荩洪喿x這3,000頁。今天:

我們從關鍵概念開始。醫(yī)療數(shù)據(jù)相關知識概述第30頁從底層開始...存放服務服務類用戶服務類提供者MR存放SOP類MR對象模塊模塊模塊+屬性屬性屬性醫(yī)學數(shù)字成像與通信標準醫(yī)療數(shù)據(jù)相關知識概述第31頁DICOM服務打印 –DICOM打印機打印對象存放 –

比如將對象存放到PACS查詢/找回–

比如獲取來自PACS對象

MWM –比如獲取來自RIS預定患者(模態(tài)工作表管理)MPPS –回到RIS(模態(tài)執(zhí)行過程步驟)狀態(tài)(已開始、已完成) ...(見DICOM第4部分:服務類規(guī)范)醫(yī)療數(shù)據(jù)相關知識概述第32頁RIS系統(tǒng)RIS(Radioiogyinformationsystem),即放射信息管理系統(tǒng)RIS是優(yōu)化醫(yī)院放射科工作流程管理軟件系統(tǒng),一個經(jīng)典流程包含登記預約、就診、產(chǎn)生影像、出片、匯報、審核、發(fā)片等步驟。配合醫(yī)學分類和檢索、放射物資管理、影像設備管理和科室信息報表等外圍模塊,實現(xiàn)了患者在整個流程中質量控制和實地跟蹤,差錯統(tǒng)計,為醫(yī)患糾紛舉證倒置提供依據(jù),從而使得放射科室管理進入到清楚數(shù)字化管理階段。醫(yī)療數(shù)據(jù)相關知識概述第33頁HIS,RIS和PACSHIS(hospitalinformationsystem)醫(yī)院信息系統(tǒng)RIS(radiologyinformationsystem,放射科信息系統(tǒng))。是計算機剛進入放射科時建立信息系統(tǒng),因為DICOM3.0允許RIS數(shù)據(jù)庫鑲入其中,它實際上已與PACS融合了HIS/RIS與PACS融合,采取DICOM與HL7(HeahthcareLevel7)網(wǎng)關方式進行集成醫(yī)療數(shù)據(jù)相關知識概述第34頁HIS與PACS/RIS融合自動獲取HIS數(shù)據(jù)實現(xiàn)了從病人登錄、檢驗、匯報、臨床公布整個工作流程自動化病人登記,預約,檢驗安排,候診系統(tǒng),醫(yī)生用戶管理HL7應用,實現(xiàn)PACS/RIS/HIS無縫連接醫(yī)療數(shù)據(jù)相關知識概述第35頁病人信息、檢驗需求patientdataexaminationrequest診療匯報reports病人信息patientdata檢驗內容studydataimagesimagespatientIDpatientnameexaminationmodalityetc.patientIDpatientnameexaminationmodalityetc.HIS

Hospital

InformationSystemEPR

Electronic

PatientRecord病人信息patientdataPACSarchive/workstations/interfacesRISRadiologicalInformationSystemHL7DICOMModalityWorklistDICOM存放web讀片嵌入HL7DICOM存放過程信息HL7過程信息存放確認Modalities與影像相關醫(yī)院信息化流程Hospital-wideWorkflowDICOM醫(yī)療數(shù)據(jù)相關知識概述第36頁內容:1,云計算相關概念2,HIS相關概念3,PASC/LIS/HL7相關概念4,電子病歷5,大數(shù)據(jù)相關概念醫(yī)療數(shù)據(jù)相關知識概述第37頁電子病歷(ElectronicMedicalRecord)醫(yī)療數(shù)據(jù)相關知識概述第38頁電子病歷概念電子病歷是以電子化方式管理相關個人終生健康狀態(tài)和醫(yī)療保健行為信息,包括病人信息采集、存放、傳輸、處理和利用??稍卺t(yī)療中作為主要信息源取代紙張病歷,提供超越紙張病歷服務,滿足全部醫(yī)療、法律和管理需求;含有各種名稱:CPR,EMR,EPR,CBPR,PRMI,EHR,PHR,EHCR,ICRS;

電子病歷管理系統(tǒng),是指對形成之后電子病歷進行相關管理功效電子化病歷名稱: EHR

電子健康統(tǒng)計(ElectronicHealthRecord) EHCR

電子醫(yī)療保健統(tǒng)計(ElectronicHealthCareRecord) EPR

電子病歷(ElectronicPatientRecord) CPR

計算機化病人統(tǒng)計(ComputerizedPatientRecord) EMR

電子醫(yī)療統(tǒng)計(ElectronicMedicalRecord)醫(yī)療數(shù)據(jù)相關知識概述第39頁電子病歷不是電子化紙質病歷。因為當前紙質病歷搜集信息不能滿足電子病歷二次利用。所以,電子病歷設計更強調滿足二次利用需求,如關于財務、政策和計劃、統(tǒng)計分析,醫(yī)療質量認證等方面信息電子病歷二次利用主要包含:(1)醫(yī)治正當性—提供醫(yī)療服務證據(jù);是否符正當律;反應醫(yī)師能力。(2)質量管理—醫(yī)療服務質量跟蹤研究;治療與操作監(jiān)測(3)教育與培訓。(4)研究—提出和評價新疾病診療、預防與治療、流行病學研究以及人群健康分析方法。(5)公共衛(wèi)生—高質量信息可使我們對已經(jīng)有和潛在危害公眾健康原因進行及時有效管理和決議(6)政策制訂—衛(wèi)生統(tǒng)計分析,趨勢分析,病例組合分析。(7)衛(wèi)生服務管理—衛(wèi)生資源分配與管理,成本管理,匯報及出版物,營銷戰(zhàn)略,企業(yè)風險管理(8)結算/財務/費用賠償—保險機構;政府機構;基金組織

醫(yī)療數(shù)據(jù)相關知識概述第40頁電子病歷特征:(1)真正以病人為中心,不但包含病人本身信息,而且要向全部參加醫(yī)療保健活動人提供相關信息,如小區(qū)保健、急診服務、遠程醫(yī)療等這一點不一樣于以醫(yī)療機構為中心歷次就診或治療信息統(tǒng)計(門診或住院病歷)(2)包含信息:觀察結果-已經(jīng)發(fā)生了什么;處置-決定應該做些什么;保健計劃-未來應該做些什么(3)電子病歷概括水平含有廣泛意義,也就是說,一些專門信息,比如圖像,臨床指南或支持決議方法都不是電子病歷本身特定組成部分;應該能夠在標準交互界面為其它專門系統(tǒng)提供接口(4)是診療和其它檢驗數(shù)據(jù)“數(shù)據(jù)池”(5)為決議支持、醫(yī)學研究、衛(wèi)生行政,統(tǒng)計機構及其它實體提供臨床信息。(6)電子病歷是一個長久,關于病人將要發(fā)生什么或將要為病人做什么信息積累醫(yī)療數(shù)據(jù)相關知識概述第41頁電子病歷內容靜態(tài)信息:紙質病歷全部信息動態(tài)信息:疾病發(fā)展過程中產(chǎn)生門急癥電子病歷住院電子病歷個人電子病歷小區(qū)電子病歷遠程醫(yī)療電子病歷醫(yī)療數(shù)據(jù)相關知識概述第42頁信息+服務=電子病歷醫(yī)療數(shù)據(jù)相關知識概述第43頁面向問題病人統(tǒng)計:信息存放采取國際上最先進POMR結構符合國際標準信息編碼樹形結構更適合用于對醫(yī)學信息描繪醫(yī)療數(shù)據(jù)相關知識概述第44頁面向問題病人統(tǒng)計:信息存放問題列表,電子病歷基本要求,其編碼采取ICD9CM/NANDA,中醫(yī)診療標準正在進行。符合臨床醫(yī)生思維,幫助醫(yī)生全方面準確考慮問題方法醫(yī)療數(shù)據(jù)相關知識概述第45頁內容:1,云計算相關概念2,HIS相關概念3,PASC/LIS/HL7相關概念4,電子病歷5,大數(shù)據(jù)相關概念醫(yī)療數(shù)據(jù)相關知識概述第46頁全球每秒鐘發(fā)送2.9百萬封電子郵件,一分鐘讀一篇話,足夠一個人晝夜不息讀5.5年…天天會有

2.88萬個小時視頻上傳到Youtube,足夠一個人晝夜不息觀看3.3年…推特上天天公布5千萬條消息,假設10秒鐘瀏覽一條信息,這些消息足夠一個人晝夜不息瀏覽16年…天天亞馬遜上將產(chǎn)生6.3百萬筆訂單…每個月網(wǎng)民在Facebook上要花費7千億分鐘,被移動互聯(lián)網(wǎng)使用者發(fā)送和接收數(shù)據(jù)高達1.3EB…Google上天天需要處理24PB數(shù)據(jù)…人們從信息被動接收者變成了主動創(chuàng)造者我們來到大數(shù)據(jù)時代醫(yī)療數(shù)據(jù)相關知識概述第47頁大數(shù)據(jù)時代爆炸增加想駕馭這龐大數(shù)據(jù),我們必須了解大數(shù)據(jù)特征。地球上至今總共數(shù)據(jù)量:在

年,個人用戶才剛才前進TB時代,全球一共新產(chǎn)生了約180EB數(shù)據(jù);在

年,這個數(shù)字到達了1.8ZB。而有市場研究機構預測:到

年,整個世界數(shù)據(jù)總量將會增加44倍,到達35.2ZB(1ZB=10億TB)!1PB(拍字節(jié))=2^50字節(jié)1EB(艾字節(jié))=2^60字節(jié)1ZB(澤字節(jié))=2^70字節(jié)醫(yī)療數(shù)據(jù)相關知識概述第48頁

假如自然界中事件完全不可預測地隨機發(fā)生,人們生活將無法忍受;與此相反,假如每一件事情都是確定、完全能夠預測,則生活將是無趣。利用因果關系解釋觀察現(xiàn)象或預測未來存在邏輯和實際上困難。大數(shù)據(jù)理性認知[美]C.R

與傳統(tǒng)比較,大數(shù)據(jù)分析處理關鍵是預測和推斷,根本變革在于不刻意追求因果關系,而更多關注相關關系。也就是說,只要知道和什么相關,而無須強求為何相關。[英]舍恩伯格

大數(shù)據(jù)時代降臨,使人類第一次有機會和條件在非常多和非常深入層次取得和使用全方面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),簡而言之就是樣本=總體。[英]舍恩伯格

大數(shù)據(jù)為政府統(tǒng)計提供了總體性、非結構化、豐富真實原始資料,能夠極大地縮短數(shù)據(jù)采集時間,降低報表填報任務,減輕調查對象負擔,提升統(tǒng)計數(shù)據(jù)質量。國家統(tǒng)計局馬建堂大數(shù)據(jù),也叫全局數(shù)據(jù)、總體數(shù)據(jù),數(shù)據(jù)量越大其預測和推斷準確性越高醫(yī)療數(shù)據(jù)相關知識概述第49頁數(shù)據(jù)本質是生產(chǎn)資料和資產(chǎn)僅供開采162年僅供開采45年僅供開采60年不可再生資源VS數(shù)據(jù)過去3年數(shù)據(jù)總量被以往4萬年還多年,10分鐘信息總量將達1.8ZB年全球數(shù)據(jù)總量1.2ZB,年增加50%數(shù)據(jù)不再是社會生產(chǎn)“副產(chǎn)物”,而是可被二次乃至屢次加工原料,從中能夠探索更大價值,它變成了生產(chǎn)資料。醫(yī)療數(shù)據(jù)相關知識概述第50頁數(shù)據(jù)資產(chǎn)管理挑戰(zhàn)盡管“數(shù)據(jù)是資產(chǎn)”概念已經(jīng)確立,但“怎樣管理數(shù)據(jù)資產(chǎn)”依然缺乏成熟理論及工具醫(yī)療數(shù)據(jù)相關知識概述第51頁數(shù)據(jù)資產(chǎn)管理挑戰(zhàn)傳統(tǒng)數(shù)據(jù)管理方式,已經(jīng)無法滿足數(shù)據(jù)資產(chǎn)管理要求醫(yī)療數(shù)據(jù)相關知識概述第52頁大數(shù)據(jù)=結構化數(shù)據(jù)+非結構化數(shù)據(jù)關系數(shù)據(jù)庫中

結構化信息托管和非托管非結構化信息物聯(lián)網(wǎng)遙測、基于位置信息等非企業(yè)信息數(shù)字世界天天以

7,600PB速度增加醫(yī)療數(shù)據(jù)相關知識概述第53頁需要不一樣“看”數(shù)據(jù)方式可視:結構化資料15%未視:半/非結構化數(shù)據(jù)85%DB/DW醫(yī)療數(shù)據(jù)相關知識概述第54頁10萬

GB10萬

TB需要更高性價比數(shù)據(jù)計算與儲存方式數(shù)據(jù)庫數(shù)據(jù)倉庫計算更加快

存放更省10萬/GB10萬/TB醫(yī)療數(shù)據(jù)相關知識概述第55頁85%半/非結構化Log/Webpage/Email/PDF/Image/Full-text/MS-Officefile

需要不一樣數(shù)據(jù)管理策略當我們想要擴充時,才發(fā)覺:架構只能scale-up,scale-out不易處理時間過長,

time-to-value受限成本過高,

cost-efficiency受限15%結構化DB/DW遺憾殘缺醫(yī)療數(shù)據(jù)相關知識概述第56頁天天幾百GB、幾TB資料,且連續(xù)成長中儲存Storing在收數(shù)據(jù)同時做必要前置處理(pre-processing),并區(qū)分數(shù)據(jù)處理優(yōu)先等級(prioritizing)計算Processing怎樣有效防止因硬件毀壞所造成資料損毀管理Managing怎樣從中挖掘出所關注事件pattern或behavior分析Analyzing超越企業(yè)現(xiàn)有IT

數(shù)據(jù)處理能量醫(yī)療數(shù)據(jù)相關知識概述第57頁SocialMediaMachine/SensorDOC/MediaWebClickstreamAppsCallLogLog什么是數(shù)據(jù)?半結構化/非結構化數(shù)據(jù)醫(yī)療數(shù)據(jù)相關知識概述第58頁何為大?—數(shù)據(jù)度量1Byte

=

8

Bit1KB

=

1,024

Bytes1MB

=

1,024

KB

=

1,048,576

Bytes1GB

=

1,024

MB

=

1,048,576

KB

=

1,073,741,824

Bytes1TB

=

1,024

GB

=

1,048,576

MB

=

1,099,511,627,776

Bytes1PB

=

1,024

TB

=

1,048,576

GB

=1,125,899,906,842,624

Bytes1EB

=

1,024

PB

=

1,048,576

TB

=

1,152,921,504,606,846,976

Bytes1ZB

=

1,024

EB

=

1,180,591,620,717,411,303,424

Bytes1YB

=

1,024

ZB

=

1,208,925,819,614,629,174,706,176

Bytes什么是大數(shù)據(jù)?醫(yī)療數(shù)據(jù)相關知識概述第59頁《紅樓夢》含標點87萬字(不含標點853509字)每個漢字占兩個字節(jié):1漢字=16bit

=

2*8位=2bytes1GB

約等于

671部紅樓夢1TB

約等于

631,903

部1PB

約等于

647,068,911部美國國會圖書館藏書(151,785,778冊)(4月:收錄數(shù)據(jù)235TB

)中國國家圖書館:2631萬冊1EB

=

4000倍

美國國會圖書館存放信息量600美元硬盤就能夠存放全世界全部歌曲MGI預計,全球企業(yè)

年在硬盤上存放了超出

7EB(1EB

等于

10

GB)新數(shù)據(jù),同時,消費者在

PC

和筆記本等設備上存放了超出

6EB

新數(shù)據(jù)數(shù)據(jù)沒有方法在可容忍時間下使用常規(guī)軟件方法完成存放、管理和處理任務什么是大數(shù)據(jù)?醫(yī)療數(shù)據(jù)相關知識概述第60頁大數(shù)據(jù)解釋大數(shù)據(jù)是需要新處理模式才能含有更強決議力、洞察發(fā)覺力和流程優(yōu)化能力海量、高增加率和多樣化信息資產(chǎn)大數(shù)據(jù)就是“未來新石油”醫(yī)療數(shù)據(jù)相關知識概述第61頁大數(shù)據(jù)帶來思維變革更加好不是因果關系而是相關關系更多不是隨機樣本而是全部數(shù)據(jù)更雜不是準確性而是混雜性醫(yī)療數(shù)據(jù)相關知識概述第62頁大數(shù)據(jù)4V特征Volume非結構化數(shù)據(jù)超大規(guī)模和增加總數(shù)據(jù)量80~90%比結構化數(shù)據(jù)增加快10倍到50倍是傳統(tǒng)數(shù)據(jù)倉庫10倍到50倍Value大量不相關信息對未來趨勢與模式可預測分析深度復雜分析(機器學習、人工智能Vs傳統(tǒng)商務智能)Velocity實時分析而非批量式分析數(shù)據(jù)輸入、處理與丟棄立竿見影而非事后見效

Variety大數(shù)據(jù)異構和多樣性很多不一樣形式(文本、圖像、視頻、機器數(shù)據(jù))無模式或者模式不顯著不連貫語法或句義BigData大數(shù)據(jù)TBPBEBStreamsRealtimeNeartimeBatchStructuredUnstructuredSemi-structuredAlltheabove醫(yī)療數(shù)據(jù)相關知識概述第63頁1.Volume2.

Variety3.value4.Velocity結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù)如今數(shù)據(jù)類型早已不是單一文本形式,訂單、日志、音頻,能力提出了更高要求沙里淘金,價值密度低以視頻為例,一部一小時視頻,在連續(xù)不間斷監(jiān)控過程中,可能有用數(shù)據(jù)僅僅只有一兩秒。怎樣經(jīng)過強大機器算法更快速地完成數(shù)據(jù)價值“提純”是當前大數(shù)據(jù)洶涌背景下亟待處理難題實時獲取需要信息大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)最顯著特征。如今已是ZB時代,在如此海量數(shù)據(jù)面前,處理數(shù)據(jù)效率就是企業(yè)生命大數(shù)據(jù)是指無法在一定時間內用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內容進行抓取、管理和處理數(shù)據(jù)集合大數(shù)據(jù):4V特征數(shù)據(jù)量巨大全球在

年正式進入ZB時代,IDC預計到

年,全球將總共擁有35ZB數(shù)據(jù)量醫(yī)療數(shù)據(jù)相關知識概述第64頁大數(shù)據(jù)帶來思維變革(更多)Google利用網(wǎng)絡大數(shù)據(jù)預測流感基于全數(shù)據(jù)進行相撲比賽作弊分析埃齊奧尼Farecast有10萬億條數(shù)據(jù)預測機票價格喬布斯癌癥抗爭,本身全部DNA和腫瘤DNA排序醫(yī)療數(shù)據(jù)相關知識概述第65頁大數(shù)據(jù)4V特征(Volume)1Bity1KB1MB1GB1TB1PB1EB1ZB1YB1PB相當于50%全美學術研究圖書館藏書信息內容5EB相當于至今全世界人類所講過話語1ZB如同全世界海灘上沙子數(shù)量總和1YB相當于7000位人類體內微細胞總和普通情況下,大數(shù)據(jù)是以PB、EB、ZB為單位進行計量醫(yī)療數(shù)據(jù)相關知識概述第66頁大數(shù)據(jù)帶來思維變革(更雜)從皮尺到哈勃望遠鏡,人類一直在追求測量準確性,首先源于對未知世界認知;首先也源于搜集信息有限性;大數(shù)據(jù)簡單算法比小數(shù)據(jù)復雜算法更有效;IBM機器翻譯VSGoogle機器翻譯;紛繁數(shù)據(jù)越多越好;大數(shù)據(jù)時代要求我們重新審閱數(shù)據(jù)準確性優(yōu)略;大數(shù)據(jù)不但讓我們不再期待準確性,也讓我們無法實現(xiàn)準確性;錯誤不是大數(shù)據(jù)固有問題,而是一個需要我們去處理問題,而且會將長久存在;混雜性,不是盡力防止,而是標準路徑;醫(yī)療數(shù)據(jù)相關知識概述第67頁大數(shù)據(jù)4V特征(Variety)行業(yè)/企業(yè)內數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)物聯(lián)網(wǎng)數(shù)據(jù)大數(shù)據(jù)數(shù)據(jù)起源多企業(yè)內部多個應用系統(tǒng)數(shù)據(jù)、互聯(lián)網(wǎng)和物聯(lián)網(wǎng)興起,帶來了微博、社交網(wǎng)站、傳感器等各種起源。數(shù)據(jù)類型多保留在關系數(shù)據(jù)庫中結構化數(shù)據(jù)只占少數(shù),70~80%數(shù)據(jù)是如圖片、音頻、視頻、模型、連接信息、文檔等非結構化和半結構化數(shù)據(jù)。關聯(lián)性強數(shù)據(jù)之間頻繁交互,比如游客在旅行途中上傳圖片和日志,就與游客位置、行程等信息有了很強關聯(lián)性。醫(yī)療數(shù)據(jù)相關知識概述第68頁大數(shù)據(jù)帶來思維變革(更加好)佛教《三世因果經(jīng)》主要講:一是人命是自己造就;二是怎樣為自己造一個好命;三是行善積德與行兇作惡干壞事因果循環(huán)報應規(guī)律。佛教關于因果報應解釋原因和結果是揭示客觀世界中普遍聯(lián)絡著事物含有先后相繼、彼此制約一對范圍。原因是指導起一定現(xiàn)象現(xiàn)象,結果是指因為原因作用而引發(fā)現(xiàn)象。哲學范圍因果關系大數(shù)據(jù)相關關系,而不強調因果關系;(舍恩伯格),其實這個只是一個對無法探究因果妥協(xié),人類應該去探尋因果,因為世界存在客觀運轉規(guī)律;舍恩伯格對大數(shù)據(jù)相關性解釋Kaggle,一個為全部些人提供數(shù)據(jù)挖掘競賽企業(yè),在一次關于二手車數(shù)據(jù)分析比賽中得到,橙色汽車有質量問題可能性是其它顏色汽車二分之一。為何?探尋事物因果關系是人類本性,不過大數(shù)據(jù)時代能夠做某種程度妥協(xié),能夠只需要關注“是什么”,而忽略“為何?”醫(yī)療數(shù)據(jù)相關知識概述第69頁大數(shù)據(jù)4V特征(Value)大數(shù)據(jù)不但僅是技術,關鍵是產(chǎn)生價值;能夠從各層面進行優(yōu)化,更要考慮整體;挖掘大數(shù)據(jù)價值類似沙里淘金,從海量數(shù)據(jù)中挖掘稀疏但寶貴信息;價值密度低,是大數(shù)據(jù)一個經(jīng)典特征;醫(yī)療數(shù)據(jù)相關知識概述第70頁大數(shù)據(jù)4V特征(Velocity)82254132215327現(xiàn)在及未來幾年內美國移動網(wǎng)絡數(shù)據(jù)流量增加(PB/月)源自英國Coda研究咨詢企業(yè)大數(shù)據(jù)增加速度快大數(shù)據(jù)處理速度快實時數(shù)據(jù)流處理要求,是區(qū)分大數(shù)據(jù)引用和傳統(tǒng)數(shù)據(jù)倉庫技術,BI技術關鍵差異之一;1s是臨界點,對于大數(shù)據(jù)應用而言,必須要在1秒鐘內形成答案,不然處理結果就是過時和無效;年復合增加率117%醫(yī)療數(shù)據(jù)相關知識概述第71頁大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫區(qū)分醫(yī)療數(shù)據(jù)相關知識概述第72頁行業(yè)數(shù)據(jù)處理方式價值銀行/金融?貸款、保險、發(fā)卡等多業(yè)務線數(shù)據(jù)集成份析、市場評定?新產(chǎn)品風險評定?股票等投資組合趨勢分析?增加市場份額?提升客戶忠誠度?提升整體收入?降低金融風險醫(yī)療?共享電子病歷及醫(yī)療統(tǒng)計,幫助快速診療?穿戴式設備遠程醫(yī)療?改進診療質量?加緊診療速度制造/高科技?產(chǎn)品故障、失效綜合分析?專利統(tǒng)計檢索?智能設備全球定位,位置服務?優(yōu)化產(chǎn)品設計、制造?降低保修成本?加緊問題處理能源?勘探、鉆井等傳感器陣列數(shù)據(jù)集中分析?降低工程事故風險?優(yōu)化勘探過程互聯(lián)網(wǎng)/Web2.0?在線廣告投放?商品評分、排名?社交網(wǎng)絡自動匹配?搜索結果優(yōu)化?提升網(wǎng)絡用戶忠誠度?改進社交網(wǎng)絡體驗?向目標用戶提供有針對性商品與服務政府/公用事業(yè)?智能城市信息網(wǎng)絡集成?天氣、地理、水電煤等公共數(shù)據(jù)搜集

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論