醫(yī)療數(shù)據(jù)相關(guān)知識(shí)_第1頁(yè)
醫(yī)療數(shù)據(jù)相關(guān)知識(shí)_第2頁(yè)
醫(yī)療數(shù)據(jù)相關(guān)知識(shí)_第3頁(yè)
醫(yī)療數(shù)據(jù)相關(guān)知識(shí)_第4頁(yè)
醫(yī)療數(shù)據(jù)相關(guān)知識(shí)_第5頁(yè)
已閱讀5頁(yè),還剩79頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

DaricLiTrainingMaterialsforCardiologySolutionTeam現(xiàn)在是1頁(yè)\一共有84頁(yè)\編輯于星期五內(nèi)容:1,云計(jì)算相關(guān)概念2,HIS相關(guān)概念3,PASC/LIS/HL7相關(guān)概念4,電子病歷5,大數(shù)據(jù)相關(guān)概念現(xiàn)在是2頁(yè)\一共有84頁(yè)\編輯于星期五什么是云計(jì)算云計(jì)算cloudcomputing是一種基于因特網(wǎng)的超級(jí)計(jì)算模式,在遠(yuǎn)程的數(shù)據(jù)中心里,成千上萬(wàn)臺(tái)電腦和服務(wù)器連接成一片電腦云。因此,云計(jì)算甚至可以讓你體驗(yàn)每秒超過(guò)10萬(wàn)億次的運(yùn)算能力,擁有這么強(qiáng)大的計(jì)算能力可以模擬核爆炸、預(yù)測(cè)氣候變化和市場(chǎng)發(fā)展趨勢(shì)。用戶(hù)通過(guò)電腦、筆記本、手機(jī)等方式接入數(shù)據(jù)中心,按自己的需求進(jìn)行運(yùn)算?,F(xiàn)在是3頁(yè)\一共有84頁(yè)\編輯于星期五云計(jì)算的定義云計(jì)算,將計(jì)算任務(wù)分布在大量計(jì)算機(jī)構(gòu)成的資源池上,使各種應(yīng)用系統(tǒng)能夠根據(jù)需要獲取計(jì)算力、存儲(chǔ)空間和各種軟件服務(wù)”現(xiàn)在是4頁(yè)\一共有84頁(yè)\編輯于星期五狹義的云計(jì)算指的是廠商通過(guò)分布式計(jì)算和虛擬化技術(shù)搭建數(shù)據(jù)中心或超級(jí)計(jì)算機(jī),以免費(fèi)或按需租用方式向技術(shù)開(kāi)發(fā)者或者企業(yè)客戶(hù)提供數(shù)據(jù)存儲(chǔ)、分析以及科學(xué)計(jì)算等服務(wù),比如亞馬遜數(shù)據(jù)倉(cāng)庫(kù)出租生意云計(jì)算的定義現(xiàn)在是5頁(yè)\一共有84頁(yè)\編輯于星期五通俗的理解是,云計(jì)算的“云“就是存在于互聯(lián)網(wǎng)上的服務(wù)器集群上的資源,它包括硬件資源(服務(wù)器、存儲(chǔ)器、CPU等)和軟件資源(如應(yīng)用軟件、集成開(kāi)發(fā)環(huán)境等),所有的處理都在云計(jì)算提供商所提供的計(jì)算機(jī)群來(lái)完成。云計(jì)算的定義現(xiàn)在是6頁(yè)\一共有84頁(yè)\編輯于星期五云計(jì)算的應(yīng)用之一:物聯(lián)網(wǎng)IOT

現(xiàn)在是7頁(yè)\一共有84頁(yè)\編輯于星期五IaaS資源平臺(tái)

Infrastructure(網(wǎng)絡(luò)能力、計(jì)算能力、存儲(chǔ)能力)PaaS系統(tǒng)平臺(tái)

Platform(應(yīng)用服務(wù)器、應(yīng)用框架、編程語(yǔ)言)系統(tǒng)平臺(tái)

Platform(應(yīng)用服務(wù)器、應(yīng)用框架、編程語(yǔ)言)軟件Software(應(yīng)用)SaaS應(yīng)用Software(應(yīng)用)軟件Software(應(yīng)用)硬件平臺(tái)

(計(jì)算、存儲(chǔ)、網(wǎng)絡(luò))HaaS硬件平臺(tái)(網(wǎng)絡(luò)、計(jì)算、存儲(chǔ))云計(jì)算的應(yīng)用

現(xiàn)在是8頁(yè)\一共有84頁(yè)\編輯于星期五內(nèi)容:1,云計(jì)算相關(guān)概念2,HIS相關(guān)概念3,PASC/LIS/HL7相關(guān)概念4,電子病歷5,大數(shù)據(jù)相關(guān)概念現(xiàn)在是9頁(yè)\一共有84頁(yè)\編輯于星期五數(shù)據(jù)庫(kù)住院ADT藥品管理財(cái)務(wù)病房診間基于主題數(shù)據(jù)庫(kù)的HIS系統(tǒng)現(xiàn)在是10頁(yè)\一共有84頁(yè)\編輯于星期五定義:信息系統(tǒng)(InformationSystem)是以提供信息服務(wù)為主要目的的數(shù)據(jù)密集型、人機(jī)交互的計(jì)算機(jī)應(yīng)用系統(tǒng)特點(diǎn):(1)涉及的數(shù)據(jù)量大。數(shù)據(jù)一般需存放在輔助存儲(chǔ)器中,內(nèi)存中只暫存當(dāng)前要處理的一小部分?jǐn)?shù)據(jù);(2)絕大部分?jǐn)?shù)據(jù)是持久的,即不隨程序運(yùn)行的結(jié)束而消失,而需長(zhǎng)期保留在計(jì)算機(jī)系統(tǒng)中;(3)這些持久數(shù)據(jù)為多個(gè)應(yīng)用程序所共享,甚至在一個(gè)單位或更大范圍內(nèi)共享;(4)具有數(shù)據(jù)采集、傳輸、存儲(chǔ)和管理等基本功能及向用戶(hù)提供信息檢索、統(tǒng)計(jì)報(bào)表、事務(wù)處理、規(guī)劃、設(shè)計(jì)、指揮、控制、決策、報(bào)警、提示、咨詢(xún)等信息服務(wù)信息系統(tǒng)的定義及特點(diǎn)現(xiàn)在是11頁(yè)\一共有84頁(yè)\編輯于星期五(《醫(yī)院信息系統(tǒng)基本功能規(guī)范》)醫(yī)院信息系統(tǒng)(HIS,hospitalinformationsystem)是指利用計(jì)算機(jī)軟硬件技術(shù)、網(wǎng)絡(luò)通訊技術(shù)等現(xiàn)代化手段,對(duì)醫(yī)院及其所屬各部門(mén)對(duì)人流、物流、財(cái)流進(jìn)行綜合管理,對(duì)在醫(yī)療活動(dòng)各階段中產(chǎn)生的數(shù)據(jù)進(jìn)行采集、存貯、處理、提取、傳輸、匯總、加工生成各種信息,從而為醫(yī)院的整體運(yùn)行提供全面的、自動(dòng)化的管理及各種服務(wù)的信息系統(tǒng)。醫(yī)院信息系統(tǒng)是現(xiàn)代化醫(yī)院建設(shè)中不可缺少的基礎(chǔ)設(shè)施與支撐環(huán)境

醫(yī)院信息系統(tǒng)的定義現(xiàn)在是12頁(yè)\一共有84頁(yè)\編輯于星期五醫(yī)院信息系統(tǒng)是實(shí)現(xiàn)醫(yī)院各類(lèi)信息的收集、存儲(chǔ)、傳輸、加工和綜合利用的人-機(jī)系統(tǒng)。醫(yī)院信息系統(tǒng)是對(duì)醫(yī)院信息執(zhí)行分散收集、統(tǒng)一管理、集中使用、全員共享的計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)。醫(yī)院信息系統(tǒng)是軟件系統(tǒng)或應(yīng)用軟件系統(tǒng),它一定是在計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境下運(yùn)行的應(yīng)用軟件系統(tǒng)把醫(yī)院產(chǎn)生的各種信息輸入計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng),由計(jì)算機(jī)完成信息的儲(chǔ)存、處理、傳輸和輸出,在醫(yī)院內(nèi)形成信息共享,以提高醫(yī)院工作的質(zhì)量及工作效率現(xiàn)在是13頁(yè)\一共有84頁(yè)\編輯于星期五14HIS醫(yī)院信息化的整體模型現(xiàn)在是14頁(yè)\一共有84頁(yè)\編輯于星期五醫(yī)院信息系統(tǒng)的組成醫(yī)院信息系統(tǒng)PACSRIS/LISCAD/CAT臨床信息系統(tǒng)EPROE管理信息系統(tǒng)辦公自動(dòng)化CRMHRDSSBillingHRPE-mailA/VNetworkE-LibWeb現(xiàn)在是15頁(yè)\一共有84頁(yè)\編輯于星期五HIS基建管理人事管理醫(yī)政管理科研教學(xué)圖書(shū)情報(bào)業(yè)務(wù)信息住院醫(yī)生站手術(shù)麻醉門(mén)診醫(yī)生站醫(yī)學(xué)影像住院登記病人信息電子病案供應(yīng)室制劑室物質(zhì)管理設(shè)備管理固定資產(chǎn)中西藥庫(kù)物流信息財(cái)務(wù)管理住院藥房醫(yī)保管理住院收費(fèi)門(mén)診收費(fèi)財(cái)經(jīng)信息醫(yī)技工作站門(mén)診藥房門(mén)診掛號(hào)護(hù)士工作站綜合統(tǒng)計(jì)信息系統(tǒng)網(wǎng)絡(luò)信息管理系統(tǒng)院長(zhǎng)工作站醫(yī)院信息系統(tǒng)主體流程圖現(xiàn)在是16頁(yè)\一共有84頁(yè)\編輯于星期五自然信息身份登記住院記錄住院處醫(yī)囑病程病房手術(shù)記錄手術(shù)室檢查化驗(yàn)輔診科病案編目病案室電子病歷門(mén)診收費(fèi)門(mén)診藥品支出藥庫(kù)藥局治療床位病房?jī)x器折舊器械處輔診收入輔診療低值易耗供應(yīng)室經(jīng)濟(jì)核算手術(shù)收入手術(shù)室營(yíng)房水電后勤HIS常見(jiàn)的兩條信息線(xiàn)模式現(xiàn)在是17頁(yè)\一共有84頁(yè)\編輯于星期五PACS-與HIS的融合關(guān)系圖DICOM設(shè)備工作站PACSDICOM預(yù)約登記診斷報(bào)告查詢(xún)統(tǒng)計(jì)系統(tǒng)管理數(shù)據(jù)庫(kù)劃價(jià)收費(fèi)分診檢查安排HISRISPACSHL7HISRISPACS現(xiàn)在是18頁(yè)\一共有84頁(yè)\編輯于星期五網(wǎng)站系統(tǒng)界面現(xiàn)在是19頁(yè)\一共有84頁(yè)\編輯于星期五內(nèi)容:1,云計(jì)算相關(guān)概念2,HIS相關(guān)概念3,PASC/LIS/HL7相關(guān)概念4,電子病歷5,大數(shù)據(jù)相關(guān)概念現(xiàn)在是20頁(yè)\一共有84頁(yè)\編輯于星期五PACS的定義PACSPictureArchivingandCommunicationSystem圖像存檔及通信系統(tǒng)把從不同地點(diǎn)各成像裝置(如傳統(tǒng)的X射線(xiàn)攝影裝置、核醫(yī)學(xué)成像裝置、CT、MRI、B超、數(shù)字放射攝影裝置等)產(chǎn)生的圖像經(jīng)數(shù)字化(如原來(lái)是膠片等模擬圖像的話(huà))后,通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)送至中央數(shù)據(jù)管理系統(tǒng)(含數(shù)據(jù)庫(kù)),再經(jīng)計(jì)算機(jī)網(wǎng)絡(luò)送至不同的顯示工作站,供放射科醫(yī)生、病房醫(yī)生及其他醫(yī)務(wù)人員調(diào)用?,F(xiàn)在是21頁(yè)\一共有84頁(yè)\編輯于星期五醫(yī)學(xué)圖像存儲(chǔ)與傳輸系統(tǒng)PACS:

PictureArchivingandCommunicationsSystem(影像存檔及通信系統(tǒng)):醫(yī)院中的醫(yī)學(xué)影像管理系統(tǒng),簡(jiǎn)稱(chēng)PACS,是使用計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)對(duì)醫(yī)學(xué)影像進(jìn)行數(shù)字化處理的系統(tǒng)。它是專(zhuān)門(mén)為圖像管理而設(shè)計(jì)的包括圖像存檔、檢索、傳送、顯示、處理和拷貝或打印的硬件和軟件的系統(tǒng)。其目的是為了有效的管理和利用醫(yī)學(xué)圖像資源。概括起來(lái),主要解決醫(yī)學(xué)影像的采集和數(shù)字化,圖像的存儲(chǔ)和管理,數(shù)字化醫(yī)學(xué)圖像高速傳輸,圖像的數(shù)字化處理和重現(xiàn),醫(yī)學(xué)圖像信息與其它信息集成五個(gè)方面的問(wèn)題。現(xiàn)在是22頁(yè)\一共有84頁(yè)\編輯于星期五PACS系統(tǒng)架構(gòu)RISWebViewerDICOMGateNon-DICOMModalitiesDICOMModalitiesPACSServerBackupServerWebServerDiskBurnerPACSSystemViewer醫(yī)學(xué)圖像存儲(chǔ)與傳輸系統(tǒng)現(xiàn)在是23頁(yè)\一共有84頁(yè)\編輯于星期五PACS/RIS與HIS的整合方式PACS/RIS直接讀取HIS數(shù)據(jù)庫(kù)數(shù)據(jù)PACS/RIS與HIS間使用過(guò)渡數(shù)據(jù)庫(kù)(Broker)PACS/RIS與HIS共同遵循HL7標(biāo)準(zhǔn)通訊

病人基本訊息病人檢查訊息/狀態(tài)病人報(bào)告訊息/狀態(tài)HL7、ODBC中間數(shù)據(jù)庫(kù)PACS/RIS數(shù)據(jù)庫(kù)HIS數(shù)據(jù)庫(kù)HIS與PACS融合現(xiàn)在是24頁(yè)\一共有84頁(yè)\編輯于星期五HL7醫(yī)學(xué)信息交換標(biāo)準(zhǔn)(HealthLevel7)現(xiàn)在是25頁(yè)\一共有84頁(yè)\編輯于星期五1.HL7–HealthLevel7“七”指的是什么呢?在“HL7”里,“7”位于開(kāi)放系統(tǒng)互連系列通信協(xié)議的應(yīng)用層的最頂層并沒(méi)有HL1~6其他標(biāo)準(zhǔn)為應(yīng)用層的最底層,如:表述層(如:Windows)傳輸層(如:TCP/IP,DCOM)連接層(如:Ethernet)現(xiàn)在是26頁(yè)\一共有84頁(yè)\編輯于星期五ISO-OSI網(wǎng)絡(luò)體系結(jié)構(gòu)模型1 物理

Physical2 鏈路DataLink3 網(wǎng)絡(luò)Network4 傳輸TransportCommunication5 會(huì)話(huà)Session6 表示Presentation7 應(yīng)用ApplicationFunctionHL7HL7與網(wǎng)絡(luò)體系結(jié)構(gòu)及協(xié)議的關(guān)系現(xiàn)在是27頁(yè)\一共有84頁(yè)\編輯于星期五HL7與OSI的關(guān)系鏈路

DataLink物理

Physical傳輸

Transport網(wǎng)絡(luò)

Network表示

Presentation會(huì)話(huà)

Session應(yīng)用

ApplicationFTPHTTPPOP3….TCPUDPIPLLC;MACSMTP實(shí)體線(xiàn)路HealthLevelSeven(HL7)現(xiàn)在是28頁(yè)\一共有84頁(yè)\編輯于星期五DICOM(DigitalImagingandCommunicationinMedicine)標(biāo)準(zhǔn)是由ACR(AmericanCollegeofRadiology)及NEMA(NationalElectricalManufacturersAssociation)所形成的聯(lián)合委員會(huì),于1983年以后陸續(xù)發(fā)展而成的醫(yī)療數(shù)位影像及傳輸標(biāo)準(zhǔn)。簡(jiǎn)言之,DICOM是醫(yī)學(xué)圖像及其相關(guān)信息的通訊標(biāo)準(zhǔn)。此標(biāo)準(zhǔn)建立的目的為:推動(dòng)開(kāi)放式與廠牌無(wú)關(guān)的醫(yī)療數(shù)位影像的傳輸與交換。促使影像儲(chǔ)存與傳輸系統(tǒng)PACS(PictureArchivingandCommunicationSystems)的發(fā)展與各種醫(yī)院信息系統(tǒng)HIS(HospitalInformationSystems)的結(jié)合。允許所產(chǎn)生的診療資料庫(kù)能廣泛地被不同地方的設(shè)備來(lái)訪問(wèn)。DICOMVersion3.0,發(fā)表于1992年,原自ACR-MEMA兩次發(fā)表的標(biāo)準(zhǔn),分別為:CR/NEMAPSNo.300-1985,Version1.0,發(fā)表于1985年,1986年十月頒為標(biāo)準(zhǔn);CR/NEMAPSNo.300-1988,Version2.0,1988年1月頒為標(biāo)準(zhǔn),涵蓋Version1.0。DICOM標(biāo)準(zhǔn)簡(jiǎn)介現(xiàn)在是29頁(yè)\一共有84頁(yè)\編輯于星期五DICOM總結(jié):“DICOM是一個(gè)醫(yī)學(xué)成像標(biāo)準(zhǔn)?!痹敿?xì)內(nèi)容:閱讀這3,000頁(yè)。今天:

我們從核心概念開(kāi)始?,F(xiàn)在是30頁(yè)\一共有84頁(yè)\編輯于星期五從底層開(kāi)始...存儲(chǔ)服務(wù)服務(wù)類(lèi)用戶(hù)服務(wù)類(lèi)提供者M(jìn)R存儲(chǔ)SOP類(lèi)MR對(duì)象模塊模塊模塊+屬性屬性屬性醫(yī)學(xué)數(shù)字成像與通信標(biāo)準(zhǔn)現(xiàn)在是31頁(yè)\一共有84頁(yè)\編輯于星期五DICOM服務(wù)打印 –DICOM打印機(jī)的打印對(duì)象存儲(chǔ) –

例如將對(duì)象存儲(chǔ)到PACS查詢(xún)/找回–

例如獲取來(lái)自PACS的對(duì)象

MWM –例如獲取來(lái)自RIS的預(yù)定患者(模態(tài)工作表管理)MPPS –回到RIS(模態(tài)執(zhí)行過(guò)程步驟)的狀態(tài)(已開(kāi)始、已完成) ...(見(jiàn)DICOM第4部分:服務(wù)類(lèi)規(guī)范)現(xiàn)在是32頁(yè)\一共有84頁(yè)\編輯于星期五RIS系統(tǒng)RIS(Radioiogyinformationsystem),即放射信息管理系統(tǒng)RIS是優(yōu)化醫(yī)院放射科工作流程管理的軟件系統(tǒng),一個(gè)典型的流程包括登記預(yù)約、就診、產(chǎn)生影像、出片、報(bào)告、審核、發(fā)片等環(huán)節(jié)。配合醫(yī)學(xué)分類(lèi)和檢索、放射物資管理、影像設(shè)備管理和科室信息報(bào)表等外圍模塊,實(shí)現(xiàn)了患者在整個(gè)流程中的質(zhì)量控制和實(shí)地跟蹤,差錯(cuò)統(tǒng)計(jì),為醫(yī)患糾紛的舉證倒置提供依據(jù),從而使得放射科室的管理進(jìn)入到清晰的數(shù)字化管理階段?,F(xiàn)在是33頁(yè)\一共有84頁(yè)\編輯于星期五HIS,RIS和PACSHIS(hospitalinformationsystem)醫(yī)院信息系統(tǒng)RIS(radiologyinformationsystem,放射科信息系統(tǒng))。是計(jì)算機(jī)剛進(jìn)入放射科時(shí)建立的信息系統(tǒng),由于DICOM3.0允許RIS數(shù)據(jù)庫(kù)鑲?cè)肫渲?,它?shí)際上已與PACS融合了HIS/RIS與PACS融合,采用DICOM與HL7(HeahthcareLevel7)網(wǎng)關(guān)的方式進(jìn)行集成現(xiàn)在是34頁(yè)\一共有84頁(yè)\編輯于星期五HIS與PACS/RIS的融合自動(dòng)獲取HIS數(shù)據(jù)實(shí)現(xiàn)了從病人登錄、檢查、報(bào)告、臨床發(fā)布整個(gè)工作流程的自動(dòng)化病人登記,預(yù)約,檢查安排,候診系統(tǒng),醫(yī)生用戶(hù)管理HL7應(yīng)用,實(shí)現(xiàn)PACS/RIS/HIS的無(wú)縫連接現(xiàn)在是35頁(yè)\一共有84頁(yè)\編輯于星期五病人信息、檢查需求patientdataexaminationrequest診斷報(bào)告reports病人信息patientdata檢查內(nèi)容studydataimagesimagespatientIDpatientnameexaminationmodalityetc.patientIDpatientnameexaminationmodalityetc.HIS

Hospital

InformationSystemEPR

Electronic

PatientRecord病人信息patientdataPACSarchive/workstations/interfacesRISRadiologicalInformationSystemHL7DICOMModalityWorklistDICOM存儲(chǔ)web讀片嵌入HL7DICOM存儲(chǔ)過(guò)程信息HL7過(guò)程信息存儲(chǔ)確認(rèn)Modalities與影像相關(guān)的醫(yī)院信息化流程Hospital-wideWorkflowDICOM現(xiàn)在是36頁(yè)\一共有84頁(yè)\編輯于星期五內(nèi)容:1,云計(jì)算相關(guān)概念2,HIS相關(guān)概念3,PASC/LIS/HL7相關(guān)概念4,電子病歷5,大數(shù)據(jù)相關(guān)概念現(xiàn)在是37頁(yè)\一共有84頁(yè)\編輯于星期五電子病歷(ElectronicMedicalRecord)現(xiàn)在是38頁(yè)\一共有84頁(yè)\編輯于星期五電子病歷的概念電子病歷是以電子化方式管理的有關(guān)個(gè)人終生健康狀態(tài)和醫(yī)療保健行為的信息,涉及病人信息的采集、存儲(chǔ)、傳輸、處理和利用??稍卺t(yī)療中作為主要的信息源取代紙張病歷,提供超越紙張病歷的服務(wù),滿(mǎn)足所有的醫(yī)療、法律和管理需求;具有多種名稱(chēng):CPR,EMR,EPR,CBPR,PRMI,EHR,PHR,EHCR,ICRS;

電子病歷管理系統(tǒng),是指對(duì)形成之后的電子病歷進(jìn)行的相關(guān)的管理功能電子化病歷的名稱(chēng): EHR

電子健康記錄(ElectronicHealthRecord) EHCR

電子醫(yī)療保健記錄(ElectronicHealthCareRecord) EPR

電子病歷(ElectronicPatientRecord) CPR

計(jì)算機(jī)化的病人記錄(ComputerizedPatientRecord) EMR

電子醫(yī)療記錄(ElectronicMedicalRecord)現(xiàn)在是39頁(yè)\一共有84頁(yè)\編輯于星期五電子病歷不是電子化的紙質(zhì)病歷。因?yàn)槟壳暗募堎|(zhì)病歷收集的信息不能滿(mǎn)足電子病歷的二次利用。因此,電子病歷的設(shè)計(jì)更強(qiáng)調(diào)滿(mǎn)足二次利用的需求,如關(guān)于財(cái)務(wù)、政策和計(jì)劃、統(tǒng)計(jì)分析,醫(yī)療質(zhì)量認(rèn)證等方面的信息電子病歷的二次利用主要包括:(1)醫(yī)治的合法性—提供醫(yī)療服務(wù)的證據(jù);是否符合法律;反映醫(yī)師的能力。(2)質(zhì)量管理—醫(yī)療服務(wù)質(zhì)量跟蹤研究;治療與操作的監(jiān)測(cè)(3)教育與培訓(xùn)。(4)研究—提出和評(píng)價(jià)新的疾病診斷、預(yù)防與治療、流行病學(xué)研究以及人群健康分析方法。(5)公共衛(wèi)生—高質(zhì)量的信息可使我們對(duì)已有的和潛在的危害公眾健康的因素進(jìn)行及時(shí)有效的管理和決策(6)政策制定—衛(wèi)生統(tǒng)計(jì)分析,趨勢(shì)分析,病例組合分析。(7)衛(wèi)生服務(wù)管理—衛(wèi)生資源的分配與管理,成本管理,報(bào)告及出版物,營(yíng)銷(xiāo)戰(zhàn)略,企業(yè)風(fēng)險(xiǎn)管理(8)結(jié)算/財(cái)務(wù)/費(fèi)用補(bǔ)償—保險(xiǎn)機(jī)構(gòu);政府機(jī)構(gòu);基金組織

現(xiàn)在是40頁(yè)\一共有84頁(yè)\編輯于星期五電子病歷特征:(1)真正以病人為中心,不僅包含病人的自身信息,而且要向所有參與醫(yī)療保健活動(dòng)的人提供相關(guān)信息,如社區(qū)保健、急診服務(wù)、遠(yuǎn)程醫(yī)療等這一點(diǎn)不同于以醫(yī)療機(jī)構(gòu)為中心的歷次就診或治療信息記錄(門(mén)診或住院病歷)(2)包含的信息:觀測(cè)結(jié)果-已經(jīng)發(fā)生了什么;處置-決定應(yīng)該做些什么;保健計(jì)劃-將來(lái)應(yīng)該做些什么(3)電子病歷的概括水平具有廣泛意義,也就是說(shuō),一些專(zhuān)門(mén)的信息,比如圖像,臨床指南或支持決策的方法都不是電子病歷本身特定的組成部分;應(yīng)該能夠在標(biāo)準(zhǔn)的交互界面為其它專(zhuān)門(mén)系統(tǒng)提供接口(4)是診斷和其它檢驗(yàn)數(shù)據(jù)的“數(shù)據(jù)池”(5)為決策支持、醫(yī)學(xué)研究、衛(wèi)生行政,統(tǒng)計(jì)機(jī)構(gòu)及其它實(shí)體提供臨床信息。(6)電子病歷是一個(gè)長(zhǎng)期的,關(guān)于病人將要發(fā)生什么或?qū)⒁獮椴∪俗鍪裁吹男畔⒎e累現(xiàn)在是41頁(yè)\一共有84頁(yè)\編輯于星期五電子病歷內(nèi)容靜態(tài)信息:紙質(zhì)病歷的全部信息動(dòng)態(tài)信息:疾病發(fā)展過(guò)程中產(chǎn)生門(mén)急癥電子病歷住院電子病歷個(gè)人電子病歷社區(qū)電子病歷遠(yuǎn)程醫(yī)療電子病歷現(xiàn)在是42頁(yè)\一共有84頁(yè)\編輯于星期五信息+服務(wù)=電子病歷現(xiàn)在是43頁(yè)\一共有84頁(yè)\編輯于星期五面向問(wèn)題的病人記錄:信息存儲(chǔ)采用國(guó)際上最先進(jìn)的POMR結(jié)構(gòu)符合國(guó)際標(biāo)準(zhǔn)的信息編碼樹(shù)形結(jié)構(gòu)更適用于對(duì)醫(yī)學(xué)信息的描繪現(xiàn)在是44頁(yè)\一共有84頁(yè)\編輯于星期五面向問(wèn)題的病人記錄:信息存儲(chǔ)問(wèn)題列表,電子病歷的基本要求,其編碼采用ICD9CM/NANDA,中醫(yī)診斷標(biāo)準(zhǔn)正在進(jìn)行。符合臨床醫(yī)生思維,幫助醫(yī)生全面準(zhǔn)確考慮問(wèn)題的方法現(xiàn)在是45頁(yè)\一共有84頁(yè)\編輯于星期五內(nèi)容:1,云計(jì)算相關(guān)概念2,HIS相關(guān)概念3,PASC/LIS/HL7相關(guān)概念4,電子病歷5,大數(shù)據(jù)相關(guān)概念現(xiàn)在是46頁(yè)\一共有84頁(yè)\編輯于星期五全球每秒鐘發(fā)送2.9百萬(wàn)封電子郵件,一分鐘讀一篇的話(huà),足夠一個(gè)人晝夜不息的讀5.5年…每天會(huì)有

2.88萬(wàn)個(gè)小時(shí)的視頻上傳到Y(jié)outube,足夠一個(gè)人晝夜不息的觀看3.3年…推特上每天發(fā)布5千萬(wàn)條消息,假設(shè)10秒鐘瀏覽一條信息,這些消息足夠一個(gè)人晝夜不息的瀏覽16年…每天亞馬遜上將產(chǎn)生6.3百萬(wàn)筆訂單…每個(gè)月網(wǎng)民在Facebook上要花費(fèi)7千億分鐘,被移動(dòng)互聯(lián)網(wǎng)使用者發(fā)送和接收的數(shù)據(jù)高達(dá)1.3EB…Google上每天需要處理24PB的數(shù)據(jù)…人們從信息的被動(dòng)接受者變成了主動(dòng)創(chuàng)造者我們來(lái)到大數(shù)據(jù)時(shí)代現(xiàn)在是47頁(yè)\一共有84頁(yè)\編輯于星期五GBTBPBEBZB大數(shù)據(jù)時(shí)代的爆炸增長(zhǎng)想駕馭這龐大的數(shù)據(jù),我們必須了解大數(shù)據(jù)的特征。地球上至今總共的數(shù)據(jù)量:在2006年,個(gè)人用戶(hù)才剛剛邁進(jìn)TB時(shí)代,全球一共新產(chǎn)生了約180EB的數(shù)據(jù);在2011年,這個(gè)數(shù)字達(dá)到了1.8ZB。而有市場(chǎng)研究機(jī)構(gòu)預(yù)測(cè):到2020年,整個(gè)世界的數(shù)據(jù)總量將會(huì)增長(zhǎng)44倍,達(dá)到35.2ZB(1ZB=10億TB)!1PB

(拍字節(jié))

=2^50字節(jié)1EB

(艾字節(jié))

=2^60字節(jié)1ZB(澤字節(jié))=2^70字節(jié)現(xiàn)在是48頁(yè)\一共有84頁(yè)\編輯于星期五

如果自然界中的事件完全不可預(yù)測(cè)地隨機(jī)發(fā)生,人們的生活將無(wú)法忍受;與此相反,如果每一件事情都是確定的、完全可以預(yù)測(cè)的,則生活將是無(wú)趣的。利用因果關(guān)系解釋觀測(cè)的現(xiàn)象或預(yù)測(cè)未來(lái)存在邏輯和實(shí)際上的困難。大數(shù)據(jù)的理性認(rèn)知[美]C.R

與傳統(tǒng)比較,大數(shù)據(jù)的分析處理的核心是預(yù)測(cè)和推斷,根本的變革在于不刻意追求因果關(guān)系,而更多關(guān)注相關(guān)關(guān)系。也就是說(shuō),只要知道和什么有關(guān),而不必強(qiáng)求為什么有關(guān)。[英]舍恩伯格

大數(shù)據(jù)時(shí)代來(lái)臨,使人類(lèi)第一次有機(jī)會(huì)和條件在非常多和非常深入的層次獲得和使用全面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),簡(jiǎn)而言之就是樣本=總體。[英]舍恩伯格

大數(shù)據(jù)為政府統(tǒng)計(jì)提供了總體性、非結(jié)構(gòu)化、豐富真實(shí)的原始資料,可以極大地縮短數(shù)據(jù)采集時(shí)間,減少報(bào)表填報(bào)任務(wù),減輕調(diào)查對(duì)象負(fù)擔(dān),提高統(tǒng)計(jì)數(shù)據(jù)質(zhì)量。國(guó)家統(tǒng)計(jì)局馬建堂大數(shù)據(jù),也叫全局?jǐn)?shù)據(jù)、總體數(shù)據(jù),數(shù)據(jù)量越大其預(yù)測(cè)和推斷的準(zhǔn)確性越高現(xiàn)在是49頁(yè)\一共有84頁(yè)\編輯于星期五數(shù)據(jù)本質(zhì)是生產(chǎn)資料和資產(chǎn)僅供開(kāi)采162年僅供開(kāi)采45年僅供開(kāi)采60年不可再生資源VS數(shù)據(jù)過(guò)去3年數(shù)據(jù)總量被以往4萬(wàn)年還多2013年,10分鐘的信息總量將達(dá)1.8ZB2010年全球數(shù)據(jù)總量1.2ZB,年增長(zhǎng)50%數(shù)據(jù)不再是社會(huì)生產(chǎn)的“副產(chǎn)物”,而是可被二次乃至多次加工的原料,從中可以探索更大價(jià)值,它變成了生產(chǎn)資料?,F(xiàn)在是50頁(yè)\一共有84頁(yè)\編輯于星期五數(shù)據(jù)資產(chǎn)管理的挑戰(zhàn)盡管“數(shù)據(jù)是資產(chǎn)”概念已經(jīng)確立,但“如何管理數(shù)據(jù)資產(chǎn)”仍然缺少成熟的理論及工具現(xiàn)在是51頁(yè)\一共有84頁(yè)\編輯于星期五數(shù)據(jù)資產(chǎn)管理的挑戰(zhàn)傳統(tǒng)數(shù)據(jù)管理方式,已經(jīng)無(wú)法滿(mǎn)足數(shù)據(jù)資產(chǎn)管理的要求現(xiàn)在是52頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)

=

結(jié)構(gòu)化數(shù)據(jù)

+

非結(jié)構(gòu)化數(shù)據(jù)關(guān)系數(shù)據(jù)庫(kù)中

的結(jié)構(gòu)化信息托管和非托管非結(jié)構(gòu)化信息物聯(lián)網(wǎng)遙測(cè)、基于位置的信息等非企業(yè)信息數(shù)字世界每天以

7,600

PB

的速度增長(zhǎng)現(xiàn)在是53頁(yè)\一共有84頁(yè)\編輯于星期五需要不同“看”數(shù)據(jù)的方式可視:結(jié)構(gòu)化資料15%未視:半/非結(jié)構(gòu)化數(shù)據(jù)85%DB/DW現(xiàn)在是54頁(yè)\一共有84頁(yè)\編輯于星期五10萬(wàn)

GB10萬(wàn)

TB需要更高性?xún)r(jià)比的數(shù)據(jù)計(jì)算與儲(chǔ)存方式數(shù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)計(jì)算更快

存儲(chǔ)更省10萬(wàn)/GB10萬(wàn)/TB現(xiàn)在是55頁(yè)\一共有84頁(yè)\編輯于星期五85%半/非結(jié)構(gòu)化的Log/Webpage/Email/PDF/Image/Full-text/MS-Officefile

需要不同的數(shù)據(jù)管理策略當(dāng)我們想要擴(kuò)充時(shí),才發(fā)覺(jué):架構(gòu)只能scale-up,

scale-out不易處理時(shí)間過(guò)長(zhǎng),

time-to-value受限成本過(guò)高,

cost-efficiency受限15%結(jié)構(gòu)化的DB/DW遺憾殘缺現(xiàn)在是56頁(yè)\一共有84頁(yè)\編輯于星期五每天幾百GB、幾TB的資料,且持續(xù)成長(zhǎng)中儲(chǔ)存Storing

在收數(shù)據(jù)的同時(shí)做必要的前置處理(pre-processing),并區(qū)分?jǐn)?shù)據(jù)處理的優(yōu)先等級(jí)(prioritizing)計(jì)算Processing如何有效的避免因硬件毀壞所導(dǎo)致的資料損毀管理Managing如何從中挖掘出所關(guān)注事件的pattern或behavior分析Analyzing超越企業(yè)現(xiàn)有IT

的數(shù)據(jù)解決能量現(xiàn)在是57頁(yè)\一共有84頁(yè)\編輯于星期五SocialMediaMachine/SensorDOC/MediaWebClickstreamAppsCallLogLog什么是數(shù)據(jù)?半結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)現(xiàn)在是58頁(yè)\一共有84頁(yè)\編輯于星期五何為大?—數(shù)據(jù)度量1Byte

=

8

Bit1KB

=

1,024

Bytes1MB

=

1,024

KB

=

1,048,576

Bytes1GB

=

1,024

MB

=

1,048,576

KB

=

1,073,741,824

Bytes1TB

=

1,024

GB

=

1,048,576

MB

=

1,099,511,627,776

Bytes1PB

=

1,024

TB

=

1,048,576

GB

=1,125,899,906,842,624

Bytes1EB

=

1,024

PB

=

1,048,576

TB

=

1,152,921,504,606,846,976

Bytes1ZB

=

1,024

EB

=

1,180,591,620,717,411,303,424

Bytes1YB

=

1,024

ZB

=

1,208,925,819,614,629,174,706,176

Bytes什么是大數(shù)據(jù)?現(xiàn)在是59頁(yè)\一共有84頁(yè)\編輯于星期五《紅樓夢(mèng)》含標(biāo)點(diǎn)87萬(wàn)字(不含標(biāo)點(diǎn)853509字)每個(gè)漢字占兩個(gè)字節(jié):1漢字=16bit

=

2*8位=2bytes1GB

約等于

671部紅樓夢(mèng)1TB

約等于

631,903

部1PB

約等于

647,068,911部美國(guó)國(guó)會(huì)圖書(shū)館藏書(shū)(151,785,778冊(cè))(2011年4月:收錄數(shù)據(jù)235TB

)中國(guó)國(guó)家圖書(shū)館:2631萬(wàn)冊(cè)1EB

=

4000倍

美國(guó)國(guó)會(huì)圖書(shū)館存儲(chǔ)的信息量600美元的硬盤(pán)就可以存儲(chǔ)全世界所有的歌曲MGI估計(jì),全球企業(yè)

2010

年在硬盤(pán)上存儲(chǔ)了超過(guò)

7EB(1EB

等于

10

GB)的新數(shù)據(jù),同時(shí),消費(fèi)者在

PC

和筆記本等設(shè)備上存儲(chǔ)了超過(guò)

6EB

新數(shù)據(jù)數(shù)據(jù)沒(méi)有辦法在可容忍的時(shí)間下使用常規(guī)軟件方法完成存儲(chǔ)、管理和處理任務(wù)什么是大數(shù)據(jù)?現(xiàn)在是60頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)的解釋大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)大數(shù)據(jù)就是“未來(lái)的新石油”現(xiàn)在是61頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)帶來(lái)的思維變革更好不是因果關(guān)系而是相關(guān)關(guān)系更多不是隨機(jī)樣本而是全部數(shù)據(jù)更雜不是精確性而是混雜性現(xiàn)在是62頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)的4V特征Volume非結(jié)構(gòu)化數(shù)據(jù)的超大規(guī)模和增長(zhǎng)總數(shù)據(jù)量的80~90%比結(jié)構(gòu)化數(shù)據(jù)增長(zhǎng)快10倍到50倍是傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的10倍到50倍Value大量的不相關(guān)信息對(duì)未來(lái)趨勢(shì)與模式的可預(yù)測(cè)分析深度復(fù)雜分析(機(jī)器學(xué)習(xí)、人工智能Vs傳統(tǒng)商務(wù)智能)Velocity實(shí)時(shí)分析而非批量式分析數(shù)據(jù)輸入、處理與丟棄立竿見(jiàn)影而非事后見(jiàn)效

Variety大數(shù)據(jù)的異構(gòu)和多樣性很多不同形式(文本、圖像、視頻、機(jī)器數(shù)據(jù))無(wú)模式或者模式不明顯不連貫的語(yǔ)法或句義BigData大數(shù)據(jù)TBPBEBStreamsRealtimeNeartimeBatchStructuredUnstructuredSemi-structuredAlltheabove現(xiàn)在是63頁(yè)\一共有84頁(yè)\編輯于星期五1.Volume2.

Variety3.value4.Velocity結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)如今的數(shù)據(jù)類(lèi)型早已不是單一的文本形式,訂單、日志、音頻,能力提出了更高的要求沙里淘金,價(jià)值密度低以視頻為例,一部一小時(shí)的視頻,在連續(xù)不間斷監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅只有一兩秒。如何通過(guò)強(qiáng)大的機(jī)器算法更迅速地完成數(shù)據(jù)的價(jià)值“提純”是目前大數(shù)據(jù)洶涌背景下亟待解決的難題實(shí)時(shí)獲取需要的信息大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)最顯著的特征。如今已是ZB時(shí)代,在如此海量的數(shù)據(jù)面前,處理數(shù)據(jù)的效率就是企業(yè)的生命大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合大數(shù)據(jù):4V特性數(shù)據(jù)量巨大全球在2010年正式進(jìn)入ZB時(shí)代,IDC預(yù)計(jì)到2020年,全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量現(xiàn)在是64頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)帶來(lái)的思維變革(更多)Google利用網(wǎng)絡(luò)大數(shù)據(jù)預(yù)測(cè)流感基于全數(shù)據(jù)進(jìn)行相撲比賽的作弊分析埃齊奧尼的Farecast有10萬(wàn)億條數(shù)據(jù)預(yù)測(cè)機(jī)票價(jià)格喬布斯的癌癥抗?fàn)帲陨硭蠨NA和腫瘤DNA排序現(xiàn)在是65頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)的4V特征(Volume)1Bity1KB1MB1GB1TB1PB1EB1ZB1YB1PB相當(dāng)于50%的全美學(xué)術(shù)研究圖書(shū)館藏書(shū)信息內(nèi)容5EB相當(dāng)于至今全世界人類(lèi)所講過(guò)的話(huà)語(yǔ)1ZB如同全世界海灘上的沙子數(shù)量總和1YB相當(dāng)于7000位人類(lèi)體內(nèi)的微細(xì)胞總和一般情況下,大數(shù)據(jù)是以PB、EB、ZB為單位進(jìn)行計(jì)量的現(xiàn)在是66頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)帶來(lái)的思維變革(更雜)從皮尺到哈勃望遠(yuǎn)鏡,人類(lèi)一直在追求測(cè)量的精確性,一方面源于對(duì)未知世界的認(rèn)知;一方面也源于收集信息的有限性;大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效;IBM的機(jī)器翻譯VSGoogle的機(jī)器翻譯;紛繁的數(shù)據(jù)越多越好;大數(shù)據(jù)時(shí)代要求我們重新審視數(shù)據(jù)精確性的優(yōu)略;大數(shù)據(jù)不僅讓我們不再期待精確性,也讓我們無(wú)法實(shí)現(xiàn)精確性;錯(cuò)誤不是大數(shù)據(jù)固有的問(wèn)題,而是一個(gè)需要我們?nèi)ソ鉀Q的問(wèn)題,而且會(huì)將長(zhǎng)期存在;混雜性,不是竭力避免,而是標(biāo)準(zhǔn)途徑;現(xiàn)在是67頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)的4V特征(Variety)行業(yè)/企業(yè)內(nèi)數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)物聯(lián)網(wǎng)數(shù)據(jù)大數(shù)據(jù)數(shù)據(jù)來(lái)源多企業(yè)內(nèi)部多個(gè)應(yīng)用系統(tǒng)的數(shù)據(jù)、互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的興起,帶來(lái)了微博、社交網(wǎng)站、傳感器等多種來(lái)源。數(shù)據(jù)類(lèi)型多保存在關(guān)系數(shù)據(jù)庫(kù)中的結(jié)構(gòu)化數(shù)據(jù)只占少數(shù),70~80%的數(shù)據(jù)是如圖片、音頻、視頻、模型、連接信息、文檔等非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。關(guān)聯(lián)性強(qiáng)數(shù)據(jù)之間頻繁交互,比如游客在旅行途中上傳的圖片和日志,就與游客的位置、行程等信息有了很強(qiáng)的關(guān)聯(lián)性?,F(xiàn)在是68頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)帶來(lái)的思維變革(更好)佛教《三世因果經(jīng)》主要講:一是人的命是自己造就的;二是怎樣為自己造一個(gè)好命;三是行善積德與行兇作惡干壞事的因果循環(huán)報(bào)應(yīng)規(guī)律。佛教關(guān)于因果報(bào)應(yīng)的解釋原因和結(jié)果是揭示客觀世界中普遍聯(lián)系著的事物具有先后相繼、彼此制約的一對(duì)范疇。原因是指引起一定現(xiàn)象的現(xiàn)象,結(jié)果是指由于原因的作用而引起的現(xiàn)象。哲學(xué)范疇的因果關(guān)系大數(shù)據(jù)的相關(guān)關(guān)系,而不強(qiáng)調(diào)因果關(guān)系;(舍恩伯格),其實(shí)這個(gè)只是一種對(duì)無(wú)法探究因果的妥協(xié),人類(lèi)應(yīng)該去探尋因果,因?yàn)槭澜绱嬖诳陀^的運(yùn)轉(zhuǎn)規(guī)律;舍恩伯格對(duì)大數(shù)據(jù)的相關(guān)性解釋Kaggle,一個(gè)為所有人提供數(shù)據(jù)挖掘競(jìng)賽的公司,在一次關(guān)于二手車(chē)的數(shù)據(jù)分析比賽中得到,橙色汽車(chē)有質(zhì)量問(wèn)題的可能性是其它顏色汽車(chē)的一半。為什么?探尋事物的因果關(guān)系是人類(lèi)的本性,但是大數(shù)據(jù)時(shí)代可以做某種程度的妥協(xié),可以只需要關(guān)注“是什么”,而忽略“為什么?”現(xiàn)在是69頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)的4V特征(Value)大數(shù)據(jù)不僅僅是技術(shù),關(guān)鍵是產(chǎn)生價(jià)值;可以從各層面進(jìn)行優(yōu)化,更要考慮整體;挖掘大數(shù)據(jù)的價(jià)值類(lèi)似沙里淘金,從海量數(shù)據(jù)中挖掘稀疏但珍貴的信息;價(jià)值密度低,是大數(shù)據(jù)的一個(gè)典型特征;現(xiàn)在是70頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)的4V特征(Velocity)201220132014201582254132215327現(xiàn)在及未來(lái)幾年內(nèi)美國(guó)的移動(dòng)網(wǎng)絡(luò)數(shù)據(jù)流量增長(zhǎng)(PB/月)源自英國(guó)Coda研究咨詢(xún)公司大數(shù)據(jù)的增長(zhǎng)速度快大數(shù)據(jù)的處理速度快實(shí)時(shí)數(shù)據(jù)流處理的要求,是區(qū)別大數(shù)據(jù)引用和傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)技術(shù),BI技術(shù)的關(guān)鍵差別之一;1s是臨界點(diǎn),對(duì)于大數(shù)據(jù)應(yīng)用而言,必須要在1秒鐘內(nèi)形成答案,否則處理結(jié)果就是過(guò)時(shí)和無(wú)效的;年復(fù)合增長(zhǎng)率117%現(xiàn)在是71頁(yè)\一共有84頁(yè)\編輯于星期五大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)的區(qū)別大數(shù)據(jù)是在傳統(tǒng)數(shù)據(jù)庫(kù)學(xué)科的分支——數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的基礎(chǔ)上進(jìn)一步發(fā)展起來(lái)的。但有兩點(diǎn)比較主要的不同:結(jié)構(gòu)化程度:傳統(tǒng)數(shù)據(jù)庫(kù)保存的是結(jié)構(gòu)化或者半結(jié)構(gòu)化的數(shù)據(jù),以二維表或者標(biāo)準(zhǔn)XML文件的方式存儲(chǔ)數(shù)據(jù),由于結(jié)構(gòu)清晰,處理相對(duì)容易;大數(shù)據(jù)面向的是一切計(jì)算機(jī)可以存儲(chǔ)的數(shù)據(jù)格式,包括互聯(lián)網(wǎng)上的各種網(wǎng)頁(yè)、圖片、音頻、視頻,包括辦公文檔、報(bào)表,包括人們?cè)谒阉饕嬷休斎氲年P(guān)鍵詞、在社交網(wǎng)絡(luò)中的留言、喜好,也包括各種傳感器自動(dòng)收集的監(jiān)控結(jié)果等等,顯然不同的格式處理起來(lái)更加困難。噪聲(異常)數(shù)據(jù)的處理:傳統(tǒng)數(shù)據(jù)庫(kù)通常把異常數(shù)據(jù)先剔除,應(yīng)用在需要高精確度的領(lǐng)域,如銀行對(duì)每個(gè)賬戶(hù)的管理;大數(shù)據(jù)則允許異常數(shù)據(jù)存在,更多應(yīng)用在預(yù)測(cè)方面,找出大量數(shù)據(jù)中隱藏的關(guān)聯(lián)關(guān)系,少量異常數(shù)據(jù)不會(huì)對(duì)總體結(jié)果產(chǎn)生影響?,F(xiàn)在是72頁(yè)\一共有84頁(yè)\編輯于星期五行業(yè)數(shù)據(jù)處理方式價(jià)值銀行/金融?貸款、保險(xiǎn)、發(fā)卡等多業(yè)務(wù)線(xiàn)數(shù)據(jù)集成分析、市場(chǎng)評(píng)估?新產(chǎn)品風(fēng)險(xiǎn)評(píng)估?股票等投資組合趨勢(shì)分析?增加市場(chǎng)份額?提升客戶(hù)忠誠(chéng)度?提高整體收入?降低金融風(fēng)險(xiǎn)醫(yī)療?共享電子病歷及醫(yī)療記錄,幫助快速診斷?穿戴式設(shè)備遠(yuǎn)程醫(yī)療?改善診療質(zhì)量?加快診療速度制造/高科技?產(chǎn)品故障、失效綜合分析?專(zhuān)利記錄檢索?智能設(shè)備全球定位,位置服務(wù)?優(yōu)化產(chǎn)品設(shè)計(jì)、制造?降低保修成本?加快問(wèn)題解決能源?勘探、鉆井等傳感器陣列數(shù)據(jù)集中分析?降低工程事故風(fēng)險(xiǎn)?優(yōu)化勘探過(guò)程互聯(lián)網(wǎng)/Web2.0?在線(xiàn)廣告投放?商品評(píng)分、排名?社交網(wǎng)絡(luò)自動(dòng)匹配?搜索結(jié)果優(yōu)化?提升網(wǎng)絡(luò)用戶(hù)忠誠(chéng)度?改善社交網(wǎng)絡(luò)體驗(yàn)?向目標(biāo)用戶(hù)提供有針對(duì)性的商品與服務(wù)政府/公用事業(yè)?智能城市信息網(wǎng)絡(luò)集成?天氣、地理、水電煤等公共數(shù)據(jù)收集、研究?公共安全信息集中處理、智能分析?更好地對(duì)外提供公共服務(wù)?輿情分析?準(zhǔn)確預(yù)判安全威脅媒體/娛樂(lè)?收視率統(tǒng)計(jì)、熱點(diǎn)信息統(tǒng)計(jì)、分析?創(chuàng)造更多聯(lián)合、交叉銷(xiāo)售商機(jī)?準(zhǔn)確評(píng)估廣告效用零售?基于用戶(hù)位置信息的精確促銷(xiāo)?社交網(wǎng)絡(luò)購(gòu)買(mǎi)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論