版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、大數(shù)據(jù) 醫(yī)療&工程建設(shè) 演講人: 徐啟雄 周聰資料收集:宋佳琪 馬宇寰 邢洪達(dá)ppt制作: 向琪工程管理1101班 2014年6月6日 PART 1 大數(shù)據(jù)在 醫(yī)療領(lǐng)域 的應(yīng)用outline一、 醫(yī)療與大數(shù)據(jù)的趨勢二 、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五、 案例分析六、 總結(jié)與展望一、 醫(yī)療與大數(shù)據(jù)的趨勢二 、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五、 案例分析六、 總結(jié)與展望醫(yī)療費(fèi)用在不斷上升GDP的占比非常高10-19%0-9%趨勢分析: 我們正處在醫(yī)療行業(yè)的一個(gè)重要轉(zhuǎn)折點(diǎn)% of population over age 6
2、030+ %25-29%20-24%2050WW Average Age 60+: 21%Source: United Nations “Population Aging 2002”全球老齡化平均年齡60 +: 目前的10%, 到2050年將達(dá)到20%Source: McKinsey Global Institute AnalysisESG Research Report 2011 North American Health Care Provider Market Size and Forecast以美國為例: 醫(yī)療大數(shù)據(jù)的價(jià)值3千億美元/年, 相當(dāng)于每年生成總值增長0.7%01500010
3、00050002010 2011 2012 2013 2014 2015趨勢分析:我們正處在醫(yī)療行業(yè)的一個(gè)重要轉(zhuǎn)折點(diǎn)存儲的增長醫(yī)療服務(wù)產(chǎn)生的數(shù)據(jù)總量(PB)AdminImagingEMREmailFileNon Clin ImgResearch醫(yī)療影像歸檔一個(gè)醫(yī)療系統(tǒng)案例的數(shù)據(jù)到2020年, 醫(yī)療數(shù)據(jù)將急劇增長到35 Zetabytes, 相當(dāng)于2009年數(shù)據(jù)量的44倍增長Source: McKinsey Global Institute AnalysisESG Research Report 2011 North American Health Care Provider Market Si
4、ze and Forecast一、 醫(yī)療與大數(shù)據(jù)的趨勢二 、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五、 案例分析六、 總結(jié)與展望大數(shù)據(jù)對于“大數(shù)據(jù)”(Big data)研究機(jī)構(gòu)Gartner給出了這樣的定義:“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。4V:Volume(大量)Velocity(高速)Variety(多樣)veracity(真實(shí)性)/Value(價(jià)值性)1. 制藥企業(yè)/生命科學(xué)3. 費(fèi)用報(bào)銷, 利用率 和 欺詐監(jiān)管2. 臨床決策支持 & 其他臨床應(yīng)用 (包括診斷相關(guān)的影像信息)4.
5、 患者行為/社交網(wǎng)絡(luò)醫(yī)療大數(shù)據(jù)簡介數(shù)據(jù)來源包括哪些?我們?nèi)绾卫么髷?shù)據(jù)創(chuàng)造價(jià)值? (示例)2. 臨床決策支持4. 由生活方式和行為引發(fā)的疾病分析1. 個(gè)體化醫(yī)療3. 欺詐監(jiān)測得以加強(qiáng)McKinsey Global Institute Analysis醫(yī)療大數(shù)據(jù)相關(guān)解決方案健康信息服務(wù)新興的醫(yī)療服務(wù)應(yīng)用數(shù)據(jù)分析及視覺化處理數(shù)據(jù)處理/管理分布式平臺老齡社會腫瘤基因組學(xué)醫(yī)療影像分析醫(yī)療影像影像數(shù)據(jù)處理加速基礎(chǔ)醫(yī)療服務(wù)臨床決策支持類SQL的檢索醫(yī)療記錄存儲優(yōu)化個(gè)人健康管理個(gè)體化醫(yī)療機(jī)器學(xué)習(xí)基因數(shù)據(jù)安全和隱私一、 醫(yī)療與大數(shù)據(jù)的趨勢二 、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五
6、、 案例分析六、 總結(jié)與展望大數(shù)據(jù)的挑戰(zhàn)不僅來自于數(shù)據(jù)量的增長.需要新技術(shù)的支持檢驗(yàn)結(jié)果, 費(fèi)用數(shù)據(jù), 影像, 設(shè)備產(chǎn)生的感應(yīng)數(shù)據(jù), 基因數(shù)據(jù)等數(shù)據(jù)量結(jié)構(gòu)化數(shù)據(jù), 遵循標(biāo)準(zhǔn)的數(shù)據(jù)標(biāo)準(zhǔn)(如,HL7)非結(jié)構(gòu)化數(shù)據(jù), 如口述、手寫、照片、影像等類型實(shí)時(shí)有效的商業(yè)價(jià)值基于現(xiàn)有數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析,來支持不同種類的業(yè)務(wù):如費(fèi)用及報(bào)銷、患者病史、歸檔影像分析、實(shí)時(shí)臨床決策支持(數(shù)據(jù)分析) 實(shí)時(shí)數(shù)據(jù)分析,而非傳統(tǒng)的批量處理分析 數(shù)據(jù)以流的方式進(jìn)入系統(tǒng),進(jìn)行抽取和分析 對于實(shí)時(shí)運(yùn)行中的每個(gè)時(shí)間節(jié)點(diǎn)產(chǎn)生影響,而不是事后處理在傳統(tǒng)的解決方案之上,引入新的數(shù)據(jù)及分析模型和技術(shù),價(jià)值速度一、 醫(yī)療與大數(shù)據(jù)的趨勢二
7、、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五、 案例分析六、 總結(jié)與展望傳統(tǒng)解決方案環(huán)境ERP, CRM, Batch,OLTP-DBData Center ProvisioningDiscreteVirtualCloud As A ServiceHPC關(guān)注數(shù)據(jù)的價(jià)值大數(shù)據(jù)存儲的考慮傳統(tǒng)存儲方式大規(guī)模分析 Hadoop*海量數(shù)據(jù)庫 Hive*大規(guī)模備份 Lustre*數(shù)據(jù)源文本-語音-視頻-傳感器Requesting Or M2M通訊批量 商業(yè)應(yīng)用豐富的視覺化效果 安全的數(shù)據(jù)分析和緩存邊緣服務(wù)器(Edge)分析同步端到端Machine-to-MachineSource-
8、to-Source可行的解決方案體系(示例)Applications & ServicesVisualization File Structure & AnalyticalToolsData Delivery, Operational & GraphicalAnalyticsData Management & ComputationalAnalyticsCompute Storage & InfrastructurePlatforms高效的大數(shù)據(jù)訪問途徑 (客戶端)“Know Me”“Free Me”“Express Me”智能手機(jī)移動醫(yī)療助理平板電腦筆
9、記本,Ultrabook其他設(shè)備臺式機(jī)數(shù)字標(biāo)牌自助終端MobilityVital sign,I & O entryMedicationadministrationTemplatedata entryFree-format textdata entryLarge diagnosticimagesData inquiryManageability“Link Me”大數(shù)據(jù)在中國醫(yī)療行業(yè)中的應(yīng)用模式1.制藥企業(yè)/生命科學(xué)3.費(fèi)用報(bào)銷, 利用率 和 欺詐監(jiān)管2.臨床決策支持 &其他臨床應(yīng)用 (包括診斷相關(guān)的影像信息)4.患者行為/社交網(wǎng)絡(luò)藥品研發(fā)對藥品實(shí)際 作用進(jìn)行分析;實(shí)施藥品市場預(yù)測
10、基因測序分布式計(jì)算加快基因測序計(jì)算效率公共衛(wèi)生實(shí)時(shí)統(tǒng)計(jì)分析發(fā)現(xiàn)公共衛(wèi)生疫情及公民健康狀況新農(nóng)合基金數(shù)據(jù)分析及時(shí)了解基金狀況,預(yù)測風(fēng)險(xiǎn)輔助制定農(nóng)合基金的起付線,賠付病種等基本藥物臨床應(yīng)用分析分析基本藥物在處方中的比例臨床數(shù)據(jù)比對匹配同類型的病人,用藥臨床決策支持利用規(guī)則和數(shù)據(jù)實(shí)時(shí)分析給出智能提示遠(yuǎn)程監(jiān)控采集并分析病人隨身攜帶儀器數(shù)據(jù),給出智能建議人口統(tǒng)計(jì)學(xué)分析對不同群體人群的就醫(yī),健康數(shù)據(jù)實(shí)施人口統(tǒng)計(jì)分析了解病人就診行為發(fā)現(xiàn)病人的特定就診行為,分配醫(yī)療資源一、 醫(yī)療與大數(shù)據(jù)的趨勢二 、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五、 案例分析六、 總結(jié)與展望案例分享: Reg
11、ional Health Info Network ChinaReal-time Clinical Decision Support 實(shí)時(shí)的醫(yī)療數(shù)據(jù)處理(電子健康檔案,醫(yī)療影像數(shù)據(jù)),支持醫(yī)療協(xié)同、臨床決策支持和公共衛(wèi)生管理 采用 Hadoop* (HBase*/Hive*)來實(shí)現(xiàn)醫(yī)療數(shù)據(jù)分析和處理 未來將擴(kuò)展到不同領(lǐng)域、不同區(qū)域/地區(qū)(包括數(shù)據(jù)交換、處理和分析) 與本地的軟件廠商及OEM廠商進(jìn)行了廣泛合作 技術(shù)挑戰(zhàn) Hadoop (HBase/Hive)與傳統(tǒng)關(guān)系型數(shù)據(jù)庫如何有效結(jié)合大數(shù)據(jù)在區(qū)域衛(wèi)生信息平臺中的切實(shí)可行應(yīng)用場景PublicHealthHospitalPrimary care(
12、Grassroots)HealthInformationDWEHRData &ServicesRegistriesData &ServicesLongitudinal Record ServicesHealth Information Access LayerCare CoordinationClinical decision supportData AnalyticR&DRHINAncillaryData &Services分布式數(shù)據(jù)服務(wù)系統(tǒng)展現(xiàn)層(報(bào)告, 視圖)區(qū)域醫(yī)療及基層醫(yī)療信息系統(tǒng)大數(shù)據(jù)解決方案(Hadoop*)集成的用戶應(yīng)用界面(居民、醫(yī)生、衛(wèi)生行政
13、管理人員)數(shù)據(jù)挖掘(Mahout)分布式批量處理框架(Map/Reduce)區(qū)域衛(wèi)生信息訪問層區(qū)域衛(wèi)生信息訪問層(HIAL)醫(yī)院信息系統(tǒng)醫(yī)院信息系統(tǒng)語言和編譯(Hive)實(shí)時(shí)數(shù)據(jù)庫(Hbase)基層醫(yī)療信息系統(tǒng)醫(yī)療服務(wù)藥品管理新農(nóng)合醫(yī)療保險(xiǎn)服務(wù)器虛擬化基礎(chǔ)設(shè)施虛擬化基礎(chǔ)設(shè)施虛擬化網(wǎng)絡(luò)虛擬化 存儲虛擬化基于云的區(qū)域基層醫(yī)療服務(wù)系統(tǒng)多租戶應(yīng)用多租戶應(yīng)用分布式文件系統(tǒng) 協(xié)作 服務(wù)(HDFS) (Zookeeper)結(jié)構(gòu)化數(shù)據(jù)采集器 日志數(shù)據(jù)采集器(Sqoop) (Flume)健康檔案數(shù)據(jù)存儲公共衛(wèi)生運(yùn)營管理Sequencing3 BillionBase PairsDataProcessingClou
14、d StorageVisualizationMillions ofVariantsInterpretation &AnalyticsMillions of VariantsMillions of PatientsCommercializingTargetedTherapeuticsCompanionDiagnosticsActionable Biomarkers案例分享: NEXTBIO基因數(shù)據(jù)分析Cost to sequence a genome has fallen by800 x in the last 4 yearsEach genome has 4 million varia
15、ntsGrowth in the genomics data in the publicand private domainData available in variety of sourcesStructured, semi-structured, unstructuredNew aggregated data growingexponentially案例分享: NEXTBIO病人相關(guān)性數(shù)據(jù)Novel DiscoveriesBiomarkersDisease MechanismDrug IndicationsClinical Trial ParametersPatient Care Opt
16、ionsLarge content repository of public and private genomic datacombined with proprietary and patented correlation engine案例分享: NEXTBIONextbio & Intel 合作方向技術(shù)挑戰(zhàn):Immutable Data write once,never change, read many timesTraditional Bloom Filters worksHadoop* & HBase* well suited1 genome 10 million
17、rows100 genomes 1billion rows1M genomes 10 trillion rows100M genomes 1 quadrillion1,000,000,000,000,000 rowsApp can dynamically partitions HBaseas data size grows英特爾對于Hadoop提供的優(yōu)化:Optimized Hadoop stack in opensourceStabilize HBase to provide reliablescalable deploymentOptimize and support scale-out
18、asdata size dramatically growsExploring cluster auto tuning,Security & Compliance, etc.案例分享: Kaiser Permanente 大數(shù)據(jù)應(yīng)用數(shù)據(jù)的發(fā)展趨勢結(jié)構(gòu)化數(shù)據(jù)80%非結(jié)構(gòu)化數(shù)據(jù)全世界 80% 的數(shù)據(jù)是非結(jié)構(gòu)化的 (大量的移動終端設(shè)備, 機(jī)器產(chǎn)生的數(shù)據(jù))在未來十年,數(shù)據(jù)將迎來 44 倍的增長 (35zettabytes by 2020)主要的數(shù)據(jù) 增長 來自于 非結(jié)構(gòu)化數(shù)據(jù) (在線的歸檔數(shù)據(jù), 醫(yī)療影像, 在線視頻和存儲, 照片等)全球數(shù)據(jù)的構(gòu)成Kaiser的數(shù)據(jù)中, 90% 是非結(jié)構(gòu)化的
19、(80%的EHR和影像數(shù)據(jù))在未來十年,數(shù)據(jù)將會有 25 倍的增長 (Oneexabyte by 2020)主要的數(shù)據(jù) 增長 來自于 非結(jié)構(gòu)化數(shù)據(jù) (醫(yī)療影像, 視頻, 文本, 音頻等)信息 給 實(shí)時(shí)個(gè)性化醫(yī)療服務(wù)帶來了可能性(Requires Contextual device,environment, spatial, Demographics,Social and Behavioral profiles inaddition to medical information)Kaiser 正在評估大數(shù)據(jù)相關(guān)技術(shù)Kaiser的數(shù)據(jù)構(gòu)成結(jié)構(gòu)化數(shù)據(jù)90%UNSTRUCTURED 構(gòu)化數(shù)據(jù)DATA非
20、結(jié)信息 給各行業(yè)發(fā)展帶來了新一輪的機(jī)遇 (零售, 金融, 保險(xiǎn), 制造, 醫(yī)療,)各行業(yè)已經(jīng)開始采用 大數(shù)據(jù)技術(shù) 用于信息提取Source: KaiserMaster Integrate built/bought Real-time PredictiveAnalytical Solutions or Processing logicDiscontinuous ChangeSAN/NASSMP (5$)SAN/NASIn-Memory(50$)Share-NothingDistributed Storage andCompute ($)Fault-tolerant MasterSlave Arc
21、hitecturecapable of withstanding partial system failuresData is distributed across processing slavenodesResources containing data are not sharedMaster manages the data distribution, jobscheduling across slave nodes and aggregatingresult setsSlave(s)DASSAN/NASMPP (10$)SAN/NASSMP (Disk Caching,High Sp
22、eed Network)(10$)數(shù)據(jù)平臺計(jì)算的趨勢 分布式計(jì)算Kaiser is looking to exploitthis capability Structured, RelationalTabular Data Interactive Query Support Real-time Analytics SQL Transaction Data Unstructured, Non-tabularData Rich Ad Hoc Integration Real-time Analytics UQL ALL Data大數(shù)據(jù)平臺需求分析處理的特性 Intuition(Simulation,
23、Optimization,Stochastic Optimization) Information(Standard & Ad Hocreporting, Query, Alerts,Forecasting, Access) Interrogation(Clustering, Statistical,Quality, Semantics) Integration(Alignment, Semantics,Completeness, Quality) Ingestion(Data Model, MetadataReference Data, Store)Information drive
24、s process optimizations withstrategic impact. Modeling business intuitionfrom data deluge.Ability to model information and transition frommultiple access methods to generating, sharing,collaborating and acting on insights anytime,anywhere on any device.Support current BI tools focused on structuredi
25、nformation. Build/buy packaged unstructureddata processing and analytics tools.A portfolio of tools to manage (profile,cleanse, classify, synchronize, aggregate,integrate, share) ALL types of data.A unified information storage methodologyenabling users to manage data from ALL sources.數(shù)據(jù)的特性數(shù)據(jù)量 (Senso
26、rs, EMR,Claims, Pharmacy,Images)速度 (SLAs, Real-timeDecision Support &ContextualIntelligence)類型(Structured, Text,Unstructured,Documents, Images)大數(shù)據(jù) 界定的標(biāo)準(zhǔn)DATA SIZEDATA TYPEDATA CLASSDATA CATALOGDATA VELOCITYDATA ACCESSDATABASE TYPEGigabytes, Terabytes,PetabytesStructured, Semi-Structured,Unstructu
27、redHuman Generated,Machine GeneratedText, Image, Audio, VideoBatch, StreamingAnalytics, Search, Transaction (ACID, BASE)Relational ,File Based, Columnar, NoSQL, Document, Graph, RDFFRAMEWORKSANALYTICSFinancial, Computer Vision Engine, Geospatial, Machine Learning,Mathematical, Natural Language Processing, Neural Networks,Statistical Modeling, Time-Series Analysis, Voice EngineStandard Reporting, Ad hoc Reporting, Query/Drill downs, AlertsForecasting, Simulations, Optimization, Stochastic OptimizationsSERVERARCHITECTUREDISTRIBUTEDPROCESSINGSTO
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 臨沂職業(yè)學(xué)院《自動化學(xué)科前沿講座》2023-2024學(xué)年第一學(xué)期期末試卷
- 三年級三位數(shù)乘兩位數(shù)乘法口算練習(xí)題
- 江西應(yīng)用工程職業(yè)學(xué)院《園藝療法》2023-2024學(xué)年第一學(xué)期期末試卷
- 華南農(nóng)業(yè)大學(xué)《熱工學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 【物理】力 同步練習(xí)+2024-2025學(xué)年人教版物理八年級下冊
- 湖北開放職業(yè)學(xué)院《物流成本與績效管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 河南應(yīng)用技術(shù)職業(yè)學(xué)院《智能機(jī)床與編程》2023-2024學(xué)年第一學(xué)期期末試卷
- 株洲師范高等專科學(xué)?!扼w育休閑項(xiàng)目的策劃與管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 駐馬店幼兒師范高等??茖W(xué)?!毒W(wǎng)絡(luò)新聞編輯與評論》2023-2024學(xué)年第一學(xué)期期末試卷
- 浙江工貿(mào)職業(yè)技術(shù)學(xué)院《深度學(xué)習(xí)框架》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年工程合作協(xié)議書
- 2025年山東省東營市東營區(qū)融媒體中心招聘全媒體采編播專業(yè)技術(shù)人員10人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年宜賓人才限公司招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- KAT1-2023井下探放水技術(shù)規(guī)范
- 駕駛證學(xué)法減分(學(xué)法免分)題庫及答案200題完整版
- 2024年四川省瀘州市中考英語試題含解析
- 2025屆河南省九師聯(lián)盟商開大聯(lián)考高一數(shù)學(xué)第一學(xué)期期末學(xué)業(yè)質(zhì)量監(jiān)測模擬試題含解析
- 撫養(yǎng)權(quán)起訴狀(31篇)
- 2024年“一崗雙責(zé)”制度(五篇)
- 美容美發(fā)店突發(fā)停電應(yīng)急預(yù)案
- 彈性力學(xué)材料模型:分層材料的熱彈性行為教程
評論
0/150
提交評論