中國醫(yī)療數(shù)據(jù)創(chuàng)業(yè)的四大方向_第1頁
中國醫(yī)療數(shù)據(jù)創(chuàng)業(yè)的四大方向_第2頁
中國醫(yī)療數(shù)據(jù)創(chuàng)業(yè)的四大方向_第3頁
中國醫(yī)療數(shù)據(jù)創(chuàng)業(yè)的四大方向_第4頁
中國醫(yī)療數(shù)據(jù)創(chuàng)業(yè)的四大方向_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

中國醫(yī)療數(shù)據(jù)創(chuàng)業(yè)的四大方向中國醫(yī)療數(shù)據(jù)創(chuàng)業(yè)的四大方向

醫(yī)療行業(yè)是數(shù)據(jù)密集型產(chǎn)業(yè),數(shù)據(jù)積累亙古存在。然而,在數(shù)據(jù)的應(yīng)用水平上,醫(yī)療行業(yè)遠(yuǎn)遠(yuǎn)落后于互聯(lián)網(wǎng)、金融和電信等信息化程度更好的行業(yè)。下面就是我給大家?guī)碇袊t(yī)療數(shù)據(jù)創(chuàng)業(yè)的四大方向,歡迎大家閱讀!

IBM用3V定義大數(shù)據(jù)

IBM最早提出了大數(shù)據(jù)的3V定義。3V是Volume,Variety,Velocity。

Volume比較好理解,由于大數(shù)據(jù)本身的“大”代表了數(shù)據(jù)數(shù)量的巨大。數(shù)據(jù)量越來越大的緣由許多,其中一個(gè)是現(xiàn)在機(jī)器和網(wǎng)絡(luò)每天都在生成大量的數(shù)據(jù)。據(jù)統(tǒng)計(jì),我們現(xiàn)在每兩天產(chǎn)生的數(shù)據(jù)量約等于自人類文明開頭到2024年的數(shù)據(jù)量的總和。

其次個(gè)特征是Variety,多樣化。多樣化主要指不同的數(shù)據(jù)來源和種類。傳統(tǒng)意義上的數(shù)據(jù)主要來自類似excel的表格和數(shù)據(jù)庫?,F(xiàn)在人類能夠分析各種形式和類型的數(shù)據(jù),比如電子郵件、圖片、視頻、音頻、監(jiān)控儀器,等等。

第三個(gè)特征是Velocity,即數(shù)據(jù)生成的速度。比如,互聯(lián)網(wǎng)上數(shù)據(jù)的生成是以秒甚至毫秒來計(jì)算的。再比如,基因測(cè)序儀、網(wǎng)絡(luò)監(jiān)控的錄像,都在隨時(shí)隨地產(chǎn)生大量數(shù)據(jù)。

以上3個(gè)V是公認(rèn)的大數(shù)據(jù)定義。在2024年波士頓的大數(shù)據(jù)峰會(huì)上,ExpressScripts的首席數(shù)據(jù)科學(xué)家InderpalBhandar提出了Veracity的概念。Veracity主要是指數(shù)據(jù)是否有偏差、數(shù)據(jù)噪聲有多大,以及是否有特別值。當(dāng)業(yè)界大量積累各種來源的數(shù)據(jù)時(shí),數(shù)據(jù)是否精確?????變成一個(gè)特別重大的問題,否則最終就是“Garbagein,Garbageout”。

峰瑞觀點(diǎn)(freesvc)

從以上對(duì)大數(shù)據(jù)的描述可以發(fā)覺,大數(shù)據(jù)對(duì)數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)傳輸和數(shù)據(jù)處理這3方面的力量提出了挑戰(zhàn)。

企業(yè)在數(shù)據(jù)產(chǎn)生和處理端也漸漸消失了一些變化。企業(yè)開頭存儲(chǔ)海量數(shù)據(jù),數(shù)據(jù)傳輸并分布式地存儲(chǔ)到數(shù)據(jù)中心,數(shù)據(jù)在云端進(jìn)行處理和分析,通過網(wǎng)絡(luò)端進(jìn)行數(shù)據(jù)的呈現(xiàn)并指導(dǎo)商業(yè)決策。

大數(shù)據(jù)的產(chǎn)業(yè)鏈分析

得益于計(jì)算力量的快速增長、數(shù)據(jù)傳輸力量的增長和成本的下降,以及數(shù)據(jù)儲(chǔ)存成本的下降,大數(shù)據(jù)獲得了極大的進(jìn)展。

▌上游數(shù)據(jù)的產(chǎn)生

大數(shù)據(jù)產(chǎn)業(yè)的最上游是數(shù)據(jù)的產(chǎn)生,這包括了數(shù)據(jù)的定義和數(shù)據(jù)的搜集。數(shù)據(jù)的定義顧名思義就是定義哪些是數(shù)據(jù)。例如在搜尋廣告消失之前,用戶點(diǎn)擊鏈接本身并不產(chǎn)生任何價(jià)值,也就不被定義為數(shù)據(jù)。數(shù)據(jù)定義產(chǎn)生之后,就開頭快速、精確?????、有效地收集數(shù)據(jù)。

▌中游數(shù)據(jù)的處理

大數(shù)據(jù)產(chǎn)業(yè)的中游是數(shù)據(jù)處理,其中包括了數(shù)據(jù)的預(yù)備,例如數(shù)據(jù)清洗和整合,以及數(shù)據(jù)分析,例如數(shù)據(jù)建模、可視化呈現(xiàn),等等。

▌下游數(shù)據(jù)的消費(fèi)

大數(shù)據(jù)產(chǎn)業(yè)的最下游是數(shù)據(jù)消費(fèi),例如利用數(shù)據(jù)指導(dǎo)商業(yè)決策,指導(dǎo)商業(yè)決策之后產(chǎn)生的結(jié)果本身又成為了新的數(shù)據(jù),因此數(shù)據(jù)的消費(fèi)和數(shù)據(jù)的產(chǎn)生形成了一個(gè)閉環(huán)。

在整個(gè)大數(shù)據(jù)產(chǎn)業(yè)的全部環(huán)節(jié)中都存在數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)管理,這兩個(gè)技術(shù)貫穿了整個(gè)大數(shù)據(jù)的周期。

數(shù)據(jù)驅(qū)動(dòng)型企業(yè)結(jié)構(gòu)的分析

在一個(gè)通過數(shù)據(jù)驅(qū)動(dòng)的商業(yè)環(huán)境中,企業(yè)組織或者技術(shù)組織結(jié)構(gòu)一般分為以下3個(gè)規(guī)律板塊。從底層到上層分別是Dataengineering(數(shù)據(jù)工程),Datasciences(數(shù)據(jù)科學(xué))和Decisionsciences(決策科學(xué))。

▌下層數(shù)據(jù)平臺(tái):通用性平臺(tái)為主,完整解決方案,開源解決方案

最底層是工程性的工作,主要指對(duì)于數(shù)據(jù)底層的工程性技術(shù)解決方案,例如對(duì)原始數(shù)據(jù)進(jìn)行清洗、驗(yàn)證和訂正,數(shù)據(jù)儲(chǔ)存和調(diào)取。在這一層有許多的開源解決方案和系統(tǒng)集成服務(wù)商。

這一步的目的是收集和整理大量數(shù)據(jù),把它變成便于數(shù)據(jù)科學(xué)家使用的方式。大部分企業(yè)或者工程師把80%的時(shí)間花在了這一步。美國財(cái)寶雜志前幾天公布的數(shù)據(jù)顯示,美國企業(yè)每年在大數(shù)據(jù)服務(wù)上的花費(fèi)是40億美金左右,其中40%花在了數(shù)據(jù)整合和清洗上??梢哉f,整個(gè)數(shù)據(jù)工程在時(shí)間和花費(fèi)上都占據(jù)了很重要的位置。

▌中層算法和數(shù)據(jù)呈現(xiàn):通用性算法接口,行業(yè)專業(yè)學(xué)問,開源解決方案

處于中間層的是數(shù)據(jù)科學(xué),這可能是大家最常聽到的一個(gè)領(lǐng)域?,F(xiàn)在很熱的人工智能、深度學(xué)習(xí),都屬于這一層。這一層的作用是通過數(shù)據(jù)建立起對(duì)某個(gè)問題的模型。比如說,通過歷史數(shù)據(jù)建立起天氣預(yù)報(bào)模型,或者通過大量病理數(shù)據(jù)建立起疾病的猜測(cè)或者診斷模型。

開源社區(qū)的進(jìn)展讓許多特別簡單的算法模型變得特別簡單使用,極大地促進(jìn)了數(shù)據(jù)科學(xué)的進(jìn)展。數(shù)據(jù)科學(xué)家可以很快地驗(yàn)證猜測(cè)模型,并使用到實(shí)際的商業(yè)項(xiàng)目中。目前的解決方案主要是開源方案,一些商業(yè)API以及企業(yè)內(nèi)部的私有數(shù)據(jù)計(jì)算框架等等。

▌上層商業(yè)決策:深化的行業(yè)專業(yè)學(xué)問,商業(yè)洞察,內(nèi)部決策和外部詢問

第三層是決策科學(xué),它是數(shù)據(jù)的最頂層,也是實(shí)際產(chǎn)生商業(yè)價(jià)值的。比如我們猜測(cè)明天要下雨,這個(gè)猜測(cè)的價(jià)值在于,得到這個(gè)信息的商家其次天可以把傘放到更明顯的地方,以增加購買量。這樣就產(chǎn)生了商業(yè)價(jià)值。

這只是一個(gè)簡潔的例子,實(shí)際狀況要簡單許多。比如,許多嬉戲中,機(jī)器可以依據(jù)玩家玩嬉戲的時(shí)間、模式,來猜測(cè)用戶是否對(duì)嬉戲感愛好,一旦發(fā)覺玩家對(duì)嬉戲的愛好正在減弱,就會(huì)自動(dòng)進(jìn)行一些嘉獎(jiǎng)措施,比如嘉獎(jiǎng)裝備、嘉獎(jiǎng)點(diǎn)數(shù)來留住玩家,都是商業(yè)決策的范疇。

▲大數(shù)據(jù)的產(chǎn)生和利用,天生就和商業(yè)決策聯(lián)系緊密。

/04/

大數(shù)據(jù)企業(yè)的商業(yè)模式:在詢問和軟件服務(wù)中徘徊

大數(shù)據(jù)的價(jià)值往往通過商業(yè)價(jià)值來體現(xiàn),而不同公司的商業(yè)規(guī)律往往有很大的區(qū)分。因此,大數(shù)據(jù)公司往往在詢問模式和軟件模式之間徘徊。

這兩種商業(yè)模式不難理解,詢問有很強(qiáng)的可定制性,能夠精確?????有效地解決公司的商業(yè)需求,但是需要大量和長期的人力支持,花費(fèi)高,不簡單規(guī)模化。軟件服務(wù)則具有邊際成本低、人力支持少、簡單規(guī)?;奶攸c(diǎn),但是它缺乏可定制性。許多時(shí)候企業(yè)并不能直接解決問題,所以面臨難以銷售的問題。

企業(yè)數(shù)據(jù)化的演化歷程:傳統(tǒng)信息化,在線化,云化,數(shù)據(jù)化。

各個(gè)行業(yè)的數(shù)據(jù)化進(jìn)展程度,因其行業(yè)特點(diǎn)而不同。相較于傳統(tǒng)零售、農(nóng)業(yè)和制造業(yè),醫(yī)療行業(yè)在數(shù)據(jù)積累上有領(lǐng)先優(yōu)勢(shì),但是在數(shù)據(jù)的應(yīng)用水平上,醫(yī)療行業(yè)遠(yuǎn)遠(yuǎn)落后于互聯(lián)網(wǎng)、金融和電信等信息化程度更好的行業(yè)。

峰瑞觀點(diǎn)(freesvc)

通過分析各個(gè)行業(yè)數(shù)據(jù)化的程度看到:

互聯(lián)網(wǎng)化程度越高的企業(yè)數(shù)據(jù)化水平越高

數(shù)據(jù)變現(xiàn)越簡單的企業(yè)數(shù)據(jù)化程度越高

共性化需求越高的企業(yè)數(shù)據(jù)化程度越明顯

數(shù)據(jù)儲(chǔ)備量越大的企業(yè)數(shù)據(jù)化趨勢(shì)越快

行業(yè)的數(shù)據(jù)化

受到商業(yè)變現(xiàn)力量和模式的驅(qū)動(dòng)

依靠于底層基礎(chǔ)設(shè)施的進(jìn)展

依靠于行業(yè)數(shù)據(jù)的積累

醫(yī)療數(shù)據(jù)產(chǎn)業(yè)鏈

接下來我們從數(shù)據(jù)產(chǎn)生、數(shù)據(jù)處理、數(shù)據(jù)消費(fèi)的角度來分析醫(yī)療數(shù)據(jù)產(chǎn)業(yè)鏈。

目前,醫(yī)療數(shù)據(jù)的產(chǎn)生最大的來源是醫(yī)院、診所等專業(yè)醫(yī)療機(jī)構(gòu)以及保險(xiǎn)機(jī)構(gòu)。這些數(shù)據(jù)包含了病理、臨床、診療和理賠數(shù)據(jù)。隨著移動(dòng)醫(yī)療和智能硬件行業(yè)的進(jìn)展,越來越多的數(shù)據(jù)開頭來自手機(jī)App記錄以及可穿戴設(shè)備,這些數(shù)據(jù)主要包含了人體的生命體征和行為數(shù)據(jù),等等。這些數(shù)據(jù)有助于提升數(shù)據(jù)的完整性、連續(xù)性和精確?????性,并開頭得到重視。峰瑞資本投資的Haalthy已經(jīng)在收集肺癌用戶院外數(shù)據(jù)方面取得進(jìn)展。

醫(yī)療數(shù)據(jù)的處理不僅包含清洗、整理和分析等標(biāo)準(zhǔn)環(huán)節(jié),它還有其特別性。例如,臨床數(shù)據(jù)往往來自于電子病歷等以自然語言描述的文本文件,且不同醫(yī)療機(jī)構(gòu)或者醫(yī)生對(duì)臨床癥狀的描述往往存在一些微小差別,這對(duì)數(shù)據(jù)結(jié)構(gòu)化提出了較高的需求。

醫(yī)療數(shù)據(jù)的消費(fèi)端比較明確,在C端主要是病人和醫(yī)生,B端包括了醫(yī)療機(jī)構(gòu)、藥企和保險(xiǎn)公司等。從目前的狀況來看,通過C端來收費(fèi)和變現(xiàn)比較困難,主要的商業(yè)模式還是圍圍著B端開發(fā)。

美國Top醫(yī)療大數(shù)據(jù)公司產(chǎn)品分析

近幾年,醫(yī)療數(shù)據(jù)產(chǎn)業(yè)在美國進(jìn)展快速。這歸功于電子病歷在過去10年的逐步普及,以及包括醫(yī)院、藥廠和保險(xiǎn)等機(jī)構(gòu)對(duì)數(shù)據(jù)分析價(jià)值的高度認(rèn)可。除了傳統(tǒng)的數(shù)據(jù)巨頭IMSHealth,一些新型數(shù)據(jù)公司和數(shù)據(jù)分析公司紛紛涌現(xiàn)。我們挑出4家有代表性的公司(Flatiron、IBMWatsonOncology、IMSHealthOncology、Palantir)來分析。

它們分別代表了當(dāng)前醫(yī)療數(shù)據(jù)領(lǐng)域進(jìn)展的大方向:基于腫瘤臨床數(shù)據(jù)的事實(shí);腫瘤人工智能幫助決策;腫瘤全景數(shù)據(jù);醫(yī)療公眾資源數(shù)據(jù)。

我們把重點(diǎn)放到腫瘤數(shù)據(jù)上。這個(gè)領(lǐng)域的診療過程簡單、不確定性高、治愈率低,市場價(jià)值巨大,因而,數(shù)據(jù)在這個(gè)領(lǐng)域的作用和價(jià)值也得以突顯和被重視。其它疾病領(lǐng)域數(shù)據(jù)的方法論其實(shí)特別相像。

▌以Flatiron為例

創(chuàng)立于2024年的Flatiron是一家基于腫瘤病患的醫(yī)療數(shù)據(jù)分析公司。它接連獲得頂級(jí)投資機(jī)構(gòu)和藥廠的融資,抗癌藥巨頭Roche/Genetech的參加充分說明機(jī)構(gòu)方認(rèn)可癌癥臨床數(shù)據(jù)對(duì)藥品研發(fā)和市場指導(dǎo)的作用。Flatiron平臺(tái)由行業(yè)領(lǐng)先的腫瘤學(xué)家、醫(yī)生和工程師共同打造,在這個(gè)平臺(tái)上醫(yī)生可以記錄、整理、追蹤和分析自己病人的狀況。

▲FLATIRON的網(wǎng)站首頁上寫著:腫瘤治療技術(shù)的新標(biāo)準(zhǔn)。

基于平臺(tái)上收集到的信息,F(xiàn)latiron打造了幾款主要產(chǎn)品。

FLATIRON-ONCOEMR是一個(gè)癌癥病人電子病歷,它的主要使用方是醫(yī)院和醫(yī)生,藥廠也會(huì)購買它后臺(tái)的數(shù)據(jù),然后自己做數(shù)據(jù)分析,或者通過第三方協(xié)議的形式由IMSHealth關(guān)心與其他數(shù)據(jù)進(jìn)行整合。其它醫(yī)療數(shù)據(jù)分析和人工智能公司也是FLATIRON-ONCOEMR后臺(tái)數(shù)據(jù)的使用者。

FLATIRON-ONCOANALYTICS主要基于數(shù)據(jù)做整理,并形成高質(zhì)量的分析和總結(jié)。比如,某種類型的病人的增長、正在治療的病人的增長、存活率的跟進(jìn),這類產(chǎn)品能對(duì)醫(yī)院與醫(yī)生管理診療工作和病人供應(yīng)商業(yè)和運(yùn)營上的見解,受到醫(yī)療機(jī)構(gòu)的歡迎。

FLATIRON-ONCOBILLING在醫(yī)保、商保發(fā)達(dá)的美國用途廣泛。在醫(yī)院和醫(yī)生端,F(xiàn)LATIRON-ONCOBILLING清楚地了解治療的付費(fèi)狀況、病人的保險(xiǎn)組合,對(duì)各項(xiàng)治療、各類病人的成本和收入,采納更合理有效的治療流程和手段,以更好的控費(fèi);保險(xiǎn)公司對(duì)這類產(chǎn)品的關(guān)注度更是毋庸置疑,大量數(shù)據(jù)能為控費(fèi)和更好的理賠設(shè)計(jì)供應(yīng)支持。

和Flatiron一樣,也有一些平臺(tái)基于電子病歷的數(shù)據(jù)積累,建立起過往沒有的診療過程的數(shù)據(jù)挖掘。盡管它們是基于樣本醫(yī)院的病歷,但是已經(jīng)足夠大到供應(yīng)統(tǒng)計(jì)學(xué)上有意義的“怎樣做”和“為什么”的見解。

▌IBMWatsonOncology

最大的私家癌癥中心MSKCC與IBM合作,將臨床專業(yè)學(xué)問、分子和染色體數(shù)據(jù)、以及大量癌癥案例數(shù)據(jù)整合到一項(xiàng)循證解決方案中,分析大量數(shù)據(jù)并從中提取重要信息,以制定出關(guān)鍵決策。

腫瘤學(xué)專家培訓(xùn)Watson,將患者的醫(yī)學(xué)信息與大量的治療方針、已發(fā)表的討論結(jié)果和其他洞察力信息相對(duì)比,為醫(yī)師供應(yīng)共性化的、基于置信度的建議。Watson的自然語言處理力量允許系統(tǒng)利用非結(jié)構(gòu)化數(shù)據(jù),例如雜志文章、醫(yī)師的筆記、以及來自NationalComprehensiveCancerNetwork(NCCN)的指導(dǎo)方針和最佳實(shí)踐信息。

▌IMSHealthOncologyAnalyzer

憑借浩大的用藥和醫(yī)生數(shù)據(jù)基礎(chǔ),結(jié)合豐富的醫(yī)藥詢問閱歷,醫(yī)療數(shù)據(jù)界的巨頭IMSHealth多年來始終在打造醫(yī)藥醫(yī)療全景數(shù)據(jù)圖。沒有任何一個(gè)數(shù)據(jù)源頭能供應(yīng)足夠全面的信息,IMS除了擁有巨大的數(shù)據(jù)量,在數(shù)據(jù)拼接和整合上也有豐富的閱歷,隨著電子病歷數(shù)據(jù)的引入和增長,IMS致力于把藥廠銷量、銷售到醫(yī)療機(jī)構(gòu)的量、醫(yī)療機(jī)構(gòu)用藥治療狀況以及病人保險(xiǎn)付費(fèi)狀況全部串聯(lián)到一起。

并購了Quintile以后,IMS還能整合臨床試驗(yàn)的數(shù)據(jù)。其詢問業(yè)務(wù)基于IMS自身匯攏的數(shù)據(jù)產(chǎn)生的見解,能夠?qū)?shù)據(jù)業(yè)務(wù)帶來良好正反饋。合并后近200億美金的估值體現(xiàn)了市場對(duì)醫(yī)療數(shù)據(jù)價(jià)值的認(rèn)可。

IMS在世界范圍內(nèi)不斷復(fù)制其美國模式,逐步形成自己的壟斷地位。

Palantir的模式在中國比較難于復(fù)制,先不贅述。

峰瑞

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論