中國(guó)AI制藥企業(yè)白皮書_第1頁
中國(guó)AI制藥企業(yè)白皮書_第2頁
中國(guó)AI制藥企業(yè)白皮書_第3頁
中國(guó)AI制藥企業(yè)白皮書_第4頁
中國(guó)AI制藥企業(yè)白皮書_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2023中國(guó)AI制藥企業(yè)白皮書WhitePaperonChineseAIPharmaceuticalEnterprises目錄第一章人工智能(AI)制藥行業(yè)概覽人工智能的基本概念 09AI制藥是AI產(chǎn)業(yè)化中重要的應(yīng)用場(chǎng)景 10AI制藥行業(yè)發(fā)展歷史 AI制藥行業(yè)配套政策分析 13AI制藥行業(yè)投融資現(xiàn)狀分析 14第二章AI+藥物發(fā)現(xiàn)AI助力藥物發(fā)現(xiàn)階段概覽 16AI助力藥物靶點(diǎn)發(fā)現(xiàn)與驗(yàn)證 16AI驅(qū)動(dòng)藥物分子設(shè)計(jì)、優(yōu)化 23AI輔助藥物分子篩選 34第三章AI+臨床前研發(fā)AI助力藥物臨床前研發(fā)概覽 38AI輔助藥物理化特性預(yù)測(cè) 38AI輔助藥物劑型設(shè)計(jì) 39AI助力藥物ADMET性質(zhì)預(yù)測(cè) 40AI+臨床前研發(fā)國(guó)內(nèi)企業(yè)布局 42第四章AI+臨床研發(fā)AI助力新藥臨床試驗(yàn)概覽 46AI助力受試者招募管理 50AI助力預(yù)測(cè)臨床試驗(yàn)效果 53AI助力臨床試驗(yàn)數(shù)據(jù)管理 57AI賦能藥物注冊(cè)申報(bào) 59第五章AI+藥物生產(chǎn)及商業(yè)化AI賦能藥物生產(chǎn)支持 61AI賦能藥物市場(chǎng)開拓與商業(yè)化 65AI逐步應(yīng)用于藥物警戒領(lǐng)域 67第六章AI制藥行業(yè)總結(jié)及未來展望現(xiàn)狀分析及展望 70上市企業(yè)商業(yè)化模式 73全球主要AI制藥上市企業(yè) 74報(bào)告縮略詞中英文對(duì)照表英文縮寫英文全稱中文譯文AIArtificialIntelligence人工智能AIDDArtificialIntelligenceDrugDiscovery&DesignAI制藥CADDComputer-aidedDrugDesign計(jì)算機(jī)輔助藥物設(shè)計(jì)SBDDStructure-basedDrugDesign基于結(jié)構(gòu)的藥物設(shè)計(jì)HTSHigh-throughputSequencing高通量測(cè)序MLMachineLearning機(jī)器學(xué)習(xí)DLDeepLearning深度學(xué)習(xí)RLReinforcementLearning強(qiáng)化學(xué)習(xí)TLTransferLearning遷移學(xué)習(xí)NLPNaturalLanguageProcessing自然語言處理GANGenerativeAdversarialNetworks生成對(duì)抗結(jié)構(gòu)RNNRecurrentNeuralNetwork循環(huán)神經(jīng)網(wǎng)絡(luò)VAEVariationalAutoencoder變分自編碼器SMILESSimplifiedMolecularInputLineEntrySystem分子反應(yīng)的線性符號(hào)DTIDrugTargetsInteractions藥物-靶標(biāo)相互作用GPTGenerativePre-TrainedTransformer生成式預(yù)訓(xùn)練Transformer模型CSPCrystalStructurePrediction晶型預(yù)測(cè)ADMETAbsorption、Distribution、Metabolism、Excretion、Toxicity排泄和毒性QSARQuantitativestructure-ActivityRelationship定量結(jié)構(gòu)活性關(guān)系PKPharmacokinetics藥代動(dòng)力學(xué)PLMProteinLanguageModel蛋白質(zhì)語言模型人工智能(人工智能(AI)制藥行業(yè)概覽801第一章?人工智能的基本概念人工智能(ArtificialIntelligence,AI),是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器。人工智能是一個(gè)廣泛的領(lǐng)域,包括專家系統(tǒng)、多智能體系統(tǒng)、進(jìn)化計(jì)算、模糊邏輯、機(jī)器學(xué)習(xí)、知識(shí)表示、推薦系統(tǒng)、自然語言處理系統(tǒng)和計(jì)算機(jī)視覺等多個(gè)方面。其中,機(jī)器學(xué)習(xí)技術(shù)是應(yīng)用最廣泛的一種技術(shù),具體包括以下幾種方法:監(jiān)督式學(xué)習(xí)、無監(jiān)督式學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、回歸分析、分類聚合、量度學(xué)習(xí)、因果關(guān)系等。各類機(jī)器學(xué)習(xí)技術(shù)在各個(gè)領(lǐng)域都有廣泛的應(yīng)用,推動(dòng)了人工智能的發(fā)展和應(yīng)用。人工智能作為新一輪產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力,將進(jìn)一步釋放歷次科技革命和產(chǎn)業(yè)變革積蓄的巨大能量,并創(chuàng)造新的強(qiáng)大引擎,重構(gòu)生產(chǎn)、分配、交換、消費(fèi)等經(jīng)濟(jì)活動(dòng)各環(huán)節(jié),形成從宏觀到微觀各領(lǐng)域的智能化新需求,催生新技術(shù)、新產(chǎn)品、新產(chǎn)業(yè)、新業(yè)態(tài)、新模式,引發(fā)經(jīng)濟(jì)結(jié)構(gòu)重大變革,深刻改變?nèi)祟惿a(chǎn)生活方式和思維模式,實(shí)現(xiàn)社會(huì)生產(chǎn)力的整體躍升。人工智能圖表1實(shí)現(xiàn)人工智能的主要技術(shù)匯總[1]人工智能機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)專家系統(tǒng)多智能體系統(tǒng)進(jìn)化計(jì)算模糊邏輯知識(shí)表示推薦系統(tǒng)自然語言處理系統(tǒng)計(jì)算機(jī)視覺監(jiān)督式學(xué)習(xí)無監(jiān)督式學(xué)習(xí)半監(jiān)督學(xué)習(xí)集成學(xué)習(xí)深強(qiáng)回分量因度化歸類度果學(xué)學(xué)分聚學(xué)關(guān)習(xí)習(xí)析合習(xí)系[1]整理自藥融咨詢?AI制藥是AI產(chǎn)業(yè)化中重要的應(yīng)用場(chǎng)景AI制藥(AIDD)是指利用AI技術(shù)在藥物研發(fā)、藥物設(shè)計(jì)、藥物篩選、臨床試驗(yàn)和藥物生產(chǎn)等各個(gè)環(huán)節(jié)中應(yīng)用的制藥領(lǐng)域。AI在藥物研發(fā)中可以通過數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù),加速藥物發(fā)現(xiàn)和設(shè)計(jì)過程,提高研發(fā)效率和成功率。AI還可以在藥物篩選中幫助挑選出具有潛在療效的候選藥物,降低研發(fā)成本和時(shí)間。在臨床試驗(yàn)中,AI可以幫助優(yōu)化試驗(yàn)設(shè)計(jì)、招募適合的患者群體,并提供數(shù)據(jù)分析和預(yù)測(cè),加快藥物上市進(jìn)程。此外,AI還可以應(yīng)用于藥物生產(chǎn)中的質(zhì)量控制、流程優(yōu)化和智能化管理等方面,提高藥物的生產(chǎn)效率和質(zhì)量。圖表1AI技術(shù)在藥品全周期中的主要應(yīng)用AIDD主要優(yōu)化環(huán)節(jié)智能智能化管理臨床質(zhì)量保證和控制受試者篩選藥物安全生產(chǎn)工藝智能注冊(cè)臨床試驗(yàn)上市后臨床開發(fā)毒性預(yù)測(cè)劑型開發(fā)生物藥物藥物蛋白相互靶蛋白結(jié)構(gòu)預(yù)測(cè)晶型理化性質(zhì)藥物靶點(diǎn)蛋白發(fā)現(xiàn)臨床前研發(fā)藥物發(fā)現(xiàn)隨著AI技術(shù)的發(fā)展,AI技術(shù)基本實(shí)現(xiàn)了藥物研發(fā)與市場(chǎng)化全流程的覆蓋,特別是在藥物發(fā)現(xiàn)和臨床前階段取得了顯著進(jìn)展。藥物發(fā)現(xiàn)和臨床前研發(fā)階段是AIDD的主要優(yōu)化環(huán)節(jié),也是AI制藥企業(yè)主要的研發(fā)及商業(yè)化方向。利用AI技術(shù),企業(yè)能夠在藥物發(fā)現(xiàn)和臨床前研發(fā)階段,節(jié)約大量濕試驗(yàn)成本與時(shí)間成本,并實(shí)現(xiàn)高通量篩選,助力更多新靶點(diǎn)的發(fā)現(xiàn)與“老藥新用”的適應(yīng)癥拓展。未來AI技術(shù)將持續(xù)發(fā)展,相信能夠在藥品臨床開發(fā)、上市后生產(chǎn)與商業(yè)化等方面更進(jìn)一步。10AI制藥行業(yè)發(fā)展歷史圖表1AIDD行業(yè)發(fā)展歷程[1]7,000

全球制藥相關(guān)論文發(fā)表數(shù)量 中國(guó)制藥相關(guān)論文發(fā)表數(shù)量 1981-2012:CADD輔助藥物研發(fā) 高速發(fā)展 6,5006,0005,5005,0004,500

2022年AlphaFold能夠測(cè)所有已分類蛋白質(zhì)的3D結(jié)構(gòu)人工智能概念首次提出(1956年2022年AlphaFold能夠測(cè)所有已分類蛋白質(zhì)的3D結(jié)構(gòu)2012年第一家AI2012年第一家AI用于藥物研發(fā)商業(yè)化公司成立2000年CADD軟件已成為藥企必不可少工具2021年全球第一種完全由AI設(shè)計(jì)和研制藥物進(jìn)入臨床2023年2023年“AllIn”人據(jù)科學(xué)2006年深度學(xué)習(xí)概念提出,AI2006年深度學(xué)習(xí)概念提出,AI升1981年CADD正式面世1996年第一款基于SBDD物上市2,5002,0001,5001,00050001980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 2016 2018 2020 2022 2024縱觀AIDD行業(yè)的發(fā)展,主要分為3個(gè)時(shí)期:1956年~1981年的技術(shù)積累期,該時(shí)期是相關(guān)概念的早期構(gòu)想階段,但由于技術(shù)限制未能成功實(shí)施;1981年~2012年計(jì)算機(jī)輔助藥物設(shè)計(jì)(CADD)研發(fā)時(shí)期,CADD的虛擬篩選,可用于尋找有希望成藥的苗頭化合物進(jìn)行藥物開發(fā),但CADD是藥物發(fā)現(xiàn)過程的支持部門,而不是核心部門。CADD僅縮短藥物發(fā)現(xiàn)時(shí)間,受限于工藝優(yōu)化、臨床、注冊(cè)等環(huán)節(jié),新藥數(shù)量并未出現(xiàn)激增。圖表2FDACDER批準(zhǔn)新藥數(shù)量統(tǒng)計(jì)NDA BLA 總計(jì)108642019841986198819901992199419961998200020022004200620082010201220142016201820202022[1]數(shù)據(jù)來源自WebofScienceScienceCitationIndexExpanded數(shù)據(jù)庫2012年~至今的AIDD高速發(fā)展期,該時(shí)期迎來的AI技術(shù)的“井噴式”發(fā)展,AIDD相關(guān)論文數(shù)量迎來“指數(shù)級(jí)”增長(zhǎng),相關(guān)技術(shù)棧逐步豐富完善。在藥物發(fā)現(xiàn)及臨床前研究階段,基于從前的CADD技術(shù),結(jié)合人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù),可以處理大量的生物數(shù)據(jù),從而在藥物開發(fā)全過程中減少時(shí)間和成本。圖表1AIDD有效減少藥物發(fā)現(xiàn)及臨床前研究時(shí)間[1][2][3]項(xiàng)目開至專獲批 專利獲至臨階段藥物發(fā)現(xiàn)到臨床實(shí)驗(yàn)制藥行業(yè)平均研發(fā)時(shí)長(zhǎng)藥物發(fā)現(xiàn)到臨床實(shí)驗(yàn)制藥行業(yè)平均研發(fā)時(shí)長(zhǎng)[2]0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5AIDD企業(yè)已進(jìn)入臨床階段的藥物研發(fā)至臨床階段所需時(shí)間(年)同時(shí),區(qū)別于CADD研發(fā)時(shí)期主要聚焦于藥物發(fā)現(xiàn)階段,AI技術(shù)逐步應(yīng)用于藥物開發(fā)全流程。如:臨床前研究中的劑型開發(fā)、工藝優(yōu)化等;臨床研究階段的受試者篩選及結(jié)果預(yù)測(cè);藥物生產(chǎn)過程中的智能化生產(chǎn)管理、生產(chǎn)工藝優(yōu)化。AIDD行業(yè)相對(duì)起步較晚,但管線數(shù)量逐年增加,頭部AI藥企臨床前研究管線中藥物數(shù)量已接近傳統(tǒng)頭部藥企的50%,并已經(jīng)有多款藥物進(jìn)入臨床階段。23JayatungaMKP,XieW,RuderL,SchulzeU,MeierC.AIinsmall-moleculedrugdiscovery:acomingwave?.NatRevDrugDiscov.2022;21(3):175-176.PaulSM,MytelkaDS,DunwiddieCT,etal.HowtoimproveR&Dproductivity:thepharmaceuticalindustry'sgrandchallenge.NatRevDrugDiscov.2010;9(3):203-214根據(jù)公開資料整理AI制藥行業(yè)配套政策AIDD行業(yè),是在近年才開始嶄露頭角的新興領(lǐng)域,相比傳統(tǒng)制藥行業(yè),它起步較晚。這主要是因?yàn)锳I技術(shù)的發(fā)展和應(yīng)用在醫(yī)藥領(lǐng)域的探索相對(duì)較新。然而,隨著人工智能技術(shù)的迅猛發(fā)展和在醫(yī)療領(lǐng)域的廣泛應(yīng)用,AIDD行業(yè)正逐漸嶄露出巨大的潛力。盡管AIDD行業(yè)發(fā)展迅速,但相關(guān)的配套政策相對(duì)較少。由于AI技術(shù)的復(fù)雜性和涉及的倫理、法律等問題,政府和監(jiān)管機(jī)構(gòu)需要時(shí)間來理解和評(píng)估其潛在影響,以制定相應(yīng)的政策和法規(guī)。美國(guó)、歐洲等國(guó)家及地區(qū),行業(yè)起步較早,經(jīng)過多年的發(fā)展及規(guī)劃初版的監(jiān)管政策于近年才推出。圖表1國(guó)外AIDD行業(yè)相關(guān)監(jiān)管政策(含草案)匯總時(shí)間部門政策名稱AIDD相關(guān)政策內(nèi)容2023年5月美國(guó)FDA《UsingArtificialIntelligenceMachineLearningintheDevelopmentofDrugBiologicalProducts》-討論文件涵蓋AI和ML的當(dāng)前和潛在用途,包括藥物發(fā)現(xiàn)、臨床和非臨床研究、上市后安全性監(jiān)測(cè)和高級(jí)藥品上市。2023年7月歐洲EMA《ReflectionpaperontheuseofArtificialIntelligence(AI)inthemedicinalproductlifecycle草案概述在整個(gè)藥品生命周期和基于風(fēng)險(xiǎn)的背景下使用AI/ML開發(fā)與生產(chǎn)藥物的考量,并針對(duì)AI/ML何時(shí)可以安全有效地開發(fā)、監(jiān)管藥物以及藥物上市后使用等方面提供了建議。目前,國(guó)內(nèi)AIDD行業(yè)相關(guān)政策起始于“十四五”時(shí)期,主要以政府宏觀政策為主,相應(yīng)的執(zhí)行發(fā)展政策及監(jiān)管政策,還需要隨著國(guó)內(nèi)行業(yè)逐步深入發(fā)展而進(jìn)行細(xì)化、完善。圖表2國(guó)內(nèi)AIDD行業(yè)相關(guān)宏觀政策(含草案)匯總時(shí)間政策名稱AIDD相關(guān)政策內(nèi)容2022年1月《“十四五”醫(yī)藥工業(yè)發(fā)展規(guī)劃》2022年5月《“十四五”生物經(jīng)濟(jì)發(fā)展規(guī)劃》信息技術(shù)支撐新藥研制。利用云計(jì)算、大數(shù)據(jù)、人工智能等信息技術(shù),對(duì)治療適應(yīng)癥與新靶點(diǎn)驗(yàn)證、臨床前與臨床試驗(yàn)、產(chǎn)品設(shè)計(jì)優(yōu)化與產(chǎn)業(yè)化等新藥研制過程進(jìn)行全程監(jiān)管,實(shí)現(xiàn)藥物產(chǎn)業(yè)的精準(zhǔn)化研制與規(guī)?;l(fā)展。提升制藥裝備的自動(dòng)化、數(shù)字化和智能化水平,發(fā)展基于人工智能的藥物結(jié)晶、超臨界萃取和色譜分離、固體制劑生產(chǎn)在線檢測(cè)、連續(xù)培養(yǎng)生物反應(yīng)器、蛋白質(zhì)大規(guī)模純化、冷鏈儲(chǔ)存運(yùn)輸?shù)刃畔⒒扑幯b備。2022年7月水平見》各省都緊跟國(guó)家政策的方向,因地制宜出臺(tái)了各地的特色政策。以AIDD行業(yè)產(chǎn)業(yè)布局最密集的上海為例:圖表1上海市部分AIDD行業(yè)產(chǎn)業(yè)政策時(shí)間政策名稱AIDD相關(guān)政策內(nèi)容2023年5月《上海市計(jì)算生物學(xué)創(chuàng)新發(fā)展行動(dòng)計(jì)劃(2023—2025年)》設(shè)計(jì)平臺(tái),發(fā)展2023年7月《上海市生物醫(yī)藥產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型實(shí)施方案(2023—2025年)》瞄準(zhǔn)研發(fā)、生產(chǎn)、流通、管理等產(chǎn)業(yè)重點(diǎn)環(huán)節(jié),深化數(shù)字賦能。到2025年,推動(dòng)5個(gè)以上人工智能輔助研發(fā)藥物進(jìn)入臨床,實(shí)現(xiàn)30個(gè)以上高端智能醫(yī)療器械產(chǎn)品獲批上市。深化人工智能技術(shù)賦能醫(yī)藥創(chuàng)新研發(fā);提升生物醫(yī)藥研發(fā)生產(chǎn)自動(dòng)化智能化水平?AI制藥行業(yè)投融資現(xiàn)狀近年來,AIDD行業(yè)曾短暫成為投資的熱點(diǎn),其中2021年行業(yè)融資金額達(dá)歷史高點(diǎn),超過290億美元。2022年以來,受資本環(huán)境影響,行業(yè)投資“熱潮”已經(jīng)有所退卻,回落至相對(duì)穩(wěn)定水平,預(yù)計(jì)融資金額將處于下行水平。AIDD資金回報(bào)周期長(zhǎng),全球投資者偏好選擇成長(zhǎng)期(69.4%)和初創(chuàng)期(19.2%)企業(yè),中國(guó)投資者選擇初創(chuàng)期、成長(zhǎng)期、成熟期比例分別為33.1%,42.6%,23.9%[1]。2全球AI制藥行業(yè)融資額(億美元)220181220181119111132674360637716250200150100500

296

140120100806040200

中國(guó)AI制藥融資事件數(shù)中國(guó)AI制藥行業(yè)融資額(億人民幣)127.2127.2105.290.757.843.049.023.029.049.431.016.29.02018 2019 2020 2021 2022 2023H1圖表3AIDD行業(yè)投資策略分布

2018 2019 2020 2021 2022

2023H1 其他 0.4%0.4%成熟期23.9%初創(chuàng)期33.1%中國(guó)融資42.6%成長(zhǎng)期5.5%5.5%5.9%初創(chuàng)期19.2%全球融資輪次分布69.4%成長(zhǎng)期[1]整理自藥融咨詢,數(shù)據(jù)來源自藥融云投融資數(shù)據(jù)庫AI+藥物發(fā)現(xiàn)AI+藥物發(fā)現(xiàn)1502第二章?AI助力藥物發(fā)現(xiàn)階段概覽藥物靶點(diǎn)發(fā)現(xiàn)與驗(yàn)證AI輔助藥物分子設(shè)計(jì)、優(yōu)化藥物靶點(diǎn)發(fā)現(xiàn)與驗(yàn)證AI輔助藥物分子設(shè)計(jì)、優(yōu)化化合物篩選?AI助力藥物靶點(diǎn)發(fā)現(xiàn)與驗(yàn)證隨著微陣列、RNA-seq和高通量測(cè)序(HTS)技術(shù)的發(fā)展,高校、研究機(jī)構(gòu)及企業(yè)實(shí)驗(yàn)室產(chǎn)生大量的生物醫(yī)學(xué)數(shù)據(jù),當(dāng)代藥物發(fā)現(xiàn)也因此進(jìn)入了生物大數(shù)據(jù)時(shí)代。隨著生物大數(shù)據(jù)分析,藥物發(fā)現(xiàn)研究的重點(diǎn)逐漸轉(zhuǎn)向靶向藥物發(fā)現(xiàn),即以“基因-藥物-疾病”為中心,通過AI技術(shù)分析與疾病高度相關(guān)的靶點(diǎn),發(fā)現(xiàn)酶、蛋白質(zhì)或其他基因產(chǎn)物,以及針對(duì)該靶點(diǎn)的小分子。藥物靶點(diǎn)發(fā)現(xiàn)策略包括實(shí)驗(yàn)方法、多組學(xué)分析方法和AI計(jì)算方法。實(shí)驗(yàn)方法受限于通量和成本,而基于AI技術(shù)的多組學(xué)分析方法和AI計(jì)算方法能夠高效、有效地發(fā)掘具有潛力成為藥物靶點(diǎn)的分子。多組學(xué)分析方法整合生物學(xué)數(shù)據(jù),揭示疾病關(guān)鍵靶點(diǎn),而AI計(jì)算方法利用機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)篩選化合物庫,加速藥物靶點(diǎn)發(fā)現(xiàn)。這些方法在藥物研究和開發(fā)中具有重要作用,并在未來發(fā)展中將變得更加關(guān)鍵。圖表2AI技術(shù)通過三方面助力藥物發(fā)現(xiàn)階段研發(fā)[1]技術(shù)應(yīng)用技術(shù)輔助圖表1AI技術(shù)驅(qū)動(dòng)藥物靶點(diǎn)發(fā)現(xiàn)與驗(yàn)證工作流程[1]最新技術(shù)舉例利用多組學(xué)數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)/深度學(xué)習(xí)模型進(jìn)行靶點(diǎn)發(fā)現(xiàn):近年來,基于機(jī)器學(xué)習(xí)的算法,特別是深度學(xué)習(xí)方法,在制藥領(lǐng)域取得了顯著成果并引起了廣泛關(guān)注。深度學(xué)習(xí),也被稱為深度神經(jīng)網(wǎng)絡(luò),由多個(gè)隱藏層節(jié)點(diǎn)組成,通過級(jí)聯(lián)方式逐步進(jìn)行數(shù)據(jù)處理和特征提取。與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比,近期更加先進(jìn)的基于深度學(xué)習(xí)的架構(gòu),如生成對(duì)抗網(wǎng)絡(luò)(GANs)、循環(huán)神經(jīng)網(wǎng)絡(luò)和遷移學(xué)習(xí)技術(shù),在制藥方面廣泛應(yīng)用,例如新型小分子設(shè)計(jì)、衰老研究以及基于轉(zhuǎn)錄數(shù)據(jù)的藥物藥理預(yù)測(cè)。此外,利用公開可用的多組學(xué)數(shù)據(jù)和文本挖掘,深度學(xué)習(xí)還在未滿足臨床需求的疾病方面發(fā)揮著重要作用。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文相關(guān)工作及發(fā)現(xiàn)2018年AgeXTherapeuticsUseofdeepneuralnetworkensemblestoidentifyembryonic-fetaltransitionmarkers:repressionofCOX7A1inembryonicandcancercells利用>12,000個(gè)胚胎和成年細(xì)胞的轉(zhuǎn)錄組數(shù)據(jù)訓(xùn)練了一個(gè)深度學(xué)習(xí)集成模型;發(fā)現(xiàn)控制胚胎轉(zhuǎn)變的新靶點(diǎn)COX7A1。2020年利物浦大學(xué)/肯特大學(xué)Usingdeeplearningtoassociatehumangeneswithage-relateddiseases2020年云深智藥GCN-MF:Disease-GeneAssociationIdentificationByGraphConvolutionalNetworksandMatrixFactorization提出了一種新的疾病-基因關(guān)聯(lián)任務(wù)的框架,將圖卷積網(wǎng)絡(luò)(GCN)和矩陣分解相結(jié)合,命名為GCN-MF。借助其幫助,研究者可以捕捉非線性交互并利用測(cè)量的相似性。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文相關(guān)工作及發(fā)現(xiàn)2021年時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文相關(guān)工作及發(fā)現(xiàn)2021年冰洲石生物Molecularmodelingwithmachine-learneduniversalpotentialfunctions2021年華盛頓大學(xué)DavidBaker團(tuán)隊(duì)Accuratepredictionofproteinstructuresandinteractionsusingathree-trackneuralnetwork報(bào)道了新蛋白結(jié)構(gòu)預(yù)測(cè)工具RoseTTAFold,其采用了注意力機(jī)制使整個(gè)DL能夠同時(shí)學(xué)習(xí)到蛋白一級(jí)/二級(jí)/三級(jí)結(jié)構(gòu)不同維度的信息,預(yù)測(cè)準(zhǔn)確率與AlphaFold2不相上下。2022年DeepMindAlphaFoldProteinStructureDatabase:Massivelyexpandingthestructuralcoverageofprotein-sequencespacewithhigh-accuracymodels真正解決了蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)的算法困境,大幅度降低了藥物新靶點(diǎn)發(fā)現(xiàn)的難度,對(duì)于生命科學(xué)研究具有革命性的潛在意義。2022年百圖生科Helixfold-Single:Msa-FreeProteinStructurePredictionByUsingProteinLanguageModelAsAnAlternative提出將大規(guī)模蛋白質(zhì)語言模型(PLM與AlphaFold2優(yōu)越的幾何學(xué)習(xí)能力相結(jié)合,并開發(fā)了新的蛋白結(jié)構(gòu)預(yù)測(cè)模型HelixFold-Single)大語言模型通過文獻(xiàn)挖掘發(fā)現(xiàn)治療發(fā)現(xiàn)基于大型語言模型的聊天功能,如微軟的BioGPT和InsilicoMedicineiv的ChatPandaGPT,通過對(duì)從數(shù)百萬論文中提取的大量文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,可以將疾病、基因和生物過程聯(lián)系起來,從而快速識(shí)別疾病發(fā)生和進(jìn)展的生物學(xué)機(jī)制,并發(fā)現(xiàn)潛在的藥物靶點(diǎn)和生物標(biāo)志物。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2023年微軟BioGPT:GenerativePre-trainedTransformerforBiomedicalTextGenerationandMiningBioGPT:針對(duì)特定領(lǐng)域的生成性Transformer語言模型,在大規(guī)模生物醫(yī)學(xué)文獻(xiàn)上進(jìn)行了預(yù)訓(xùn)練。文章在六個(gè)生物醫(yī)學(xué)自然語言處理任務(wù)上評(píng)估了BioGPT,并證明BioGPT在生物醫(yī)學(xué)文獻(xiàn)上的優(yōu)勢(shì)2023年英矽智能ChatPandaGPTInsilicoMedicine將ChatGPT引入其靶點(diǎn)發(fā)現(xiàn)平臺(tái)PandaOmic2023年麻省理工學(xué)院Contrastivelearninginproteinlanguagespacepredictsinteractionsbetweendrugsandproteintargets算法ConPLex使用生成的合成數(shù)據(jù)進(jìn)行靶點(diǎn)識(shí)別“合成數(shù)據(jù)”是指通過人工生成的數(shù)據(jù),它可以模擬真實(shí)世界中的模式和特征。借助人工智能算法,能夠創(chuàng)建合成數(shù)據(jù),以模擬各種生物數(shù)據(jù),從而幫助研究人員探索和分析新藥物的可能。這種方法在實(shí)驗(yàn)數(shù)據(jù)稀缺或難以獲得的治療領(lǐng)域尤其有價(jià)值。舉例來說,在罕見疾病或患者數(shù)據(jù)有限的情況下,人工智能可以基于現(xiàn)有的知識(shí)和模式生成合成數(shù)據(jù)。然后,我們可以利用這些合成數(shù)據(jù)來訓(xùn)練人工智能模型,并識(shí)別可能被忽視的潛在治療靶點(diǎn)。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2020年英矽智能MolecularGenerationforDesiredTranscriptomeChangesWithAdversarialAutoencoders提出的模型可以產(chǎn)生新的分子結(jié)構(gòu),可以誘導(dǎo)給定的基因表達(dá)變化或在給定分子結(jié)構(gòu)孵育后預(yù)測(cè)基因表達(dá)差異2022年劍橋大學(xué)Adversarialgenerationofgeneexpressiondata計(jì)算生物學(xué)大模型用于靶點(diǎn)發(fā)現(xiàn)時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2023年格拉德斯通研究所Transferlearningenablespredictionsinnetworkbiology基于遷移學(xué)習(xí)的Transformer模型開發(fā)了一個(gè)理解基因相互作用的基礎(chǔ)模型?國(guó)內(nèi)企業(yè)布局AI靶點(diǎn)發(fā)現(xiàn)需要大量的生物數(shù)據(jù)來訓(xùn)練模型,并需要專業(yè)人員對(duì)數(shù)據(jù)進(jìn)行清洗、預(yù)處理,去除冗余和錯(cuò)誤數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化和格式化。對(duì)于AIDD初創(chuàng)企業(yè)而言,與大型制藥企業(yè)相比,他們面臨著生物實(shí)驗(yàn)場(chǎng)景數(shù)據(jù)嚴(yán)重不足的挑戰(zhàn)。在短時(shí)間內(nèi)難以積累足夠的數(shù)據(jù)量。因此,AI靶點(diǎn)發(fā)現(xiàn)技術(shù)在初創(chuàng)企業(yè)中具有一定的門檻。國(guó)內(nèi)能夠進(jìn)行靶點(diǎn)發(fā)現(xiàn)的AIDD企業(yè)約32家[1],主要分布在北京、上海、深圳等地區(qū),具體企業(yè)名稱及布局技術(shù)領(lǐng)域如下表所示。值得注意的是,AI靶點(diǎn)發(fā)現(xiàn)技術(shù)具有一定的局限性,靶點(diǎn)發(fā)現(xiàn)的企業(yè)并非完全利用AI技術(shù):例如,水木未來能夠利用冷凍電鏡技術(shù)解析蛋白質(zhì)結(jié)構(gòu)進(jìn)而完成靶點(diǎn)的發(fā)現(xiàn);藥物牧場(chǎng)利用IDInvivo+轉(zhuǎn)座子靶點(diǎn)發(fā)現(xiàn)平臺(tái),結(jié)合Medchem5人工智能藥物化學(xué)平臺(tái)在藥物靶點(diǎn)發(fā)現(xiàn)上進(jìn)行開拓。能夠進(jìn)行靶點(diǎn)發(fā)現(xiàn)的AIDD企業(yè)主要分為3類:AIDDBiotech企業(yè)、具備AI技術(shù)的CRO企業(yè)、AIDD技術(shù)平臺(tái)企業(yè)。圖表1國(guó)內(nèi)主要布局AI藥物靶點(diǎn)發(fā)現(xiàn)與驗(yàn)證初創(chuàng)企業(yè)匯總[1]公司名稱公司位置主要技術(shù)領(lǐng)域企業(yè)類型企業(yè)技術(shù)/投資背景水木未來北京冷凍電鏡CRO高校/研究所背景英飛智藥北京小分子藥物Biotech/CRO高校/研究所背景百奧智匯北京單細(xì)胞測(cè)序CRO高校/研究所背景哲源科技北京生命科學(xué)Biotech/CRO高校/研究所背景星亢原生物北京大分子藥物Biotech/CRO名校博士創(chuàng)業(yè)項(xiàng)目百圖生科北京算法開發(fā)技術(shù)平臺(tái)互聯(lián)網(wǎng)巨頭項(xiàng)目普瑞基準(zhǔn)北京多組學(xué)研發(fā)CRO創(chuàng)投基金孵化角井生物北京大分子藥物Biotech資深醫(yī)藥專家創(chuàng)業(yè)智睿醫(yī)藥廣州小分子藥物CRO資深醫(yī)藥專家創(chuàng)業(yè)西湖歐米杭州蛋白質(zhì)組CRO高校/研究所背景西湖云谷智藥杭州基因編輯Biotech高校/研究所背景高維醫(yī)藥杭州藥物發(fā)現(xiàn)Biotech高校/研究所背景呈元科技杭州合成肽新藥研發(fā)Biotech創(chuàng)投基金孵化紅云生物南京小分子藥物Biotech高校/研究所背景燧坤智能南京小分子藥物Biotech/CRO高校/研究所背景勁風(fēng)生物青島TILs療法Biotech高校/研究所背景冰洲石生物上海小分子藥物Biotech名校博士創(chuàng)業(yè)項(xiàng)目藥物牧場(chǎng)上海小分子藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)愛信智耀上海藥物研發(fā)Biotech資深醫(yī)藥專家創(chuàng)業(yè)湃隆生物上海小分子藥物Biotech/CRO創(chuàng)投基金孵化[1]公開資料整理公司名稱公司位置主要技術(shù)領(lǐng)域企業(yè)類型企業(yè)類型科鎂聯(lián)上海寡核苷酸藥物Biotech創(chuàng)投基金孵化煥一生物上海免疫學(xué)CRO跨界創(chuàng)業(yè)項(xiàng)目新合生物深圳RNA藥物Biotech/CRO名校博士創(chuàng)業(yè)項(xiàng)目未知君深圳腸道微生物藥物Biotech名校博士創(chuàng)業(yè)項(xiàng)目溪礫科技深圳靶向RNA小分子Biotech創(chuàng)投基金孵化華為云EIHealth深圳算法開發(fā)技術(shù)平臺(tái)互聯(lián)網(wǎng)巨頭項(xiàng)目云深智藥深圳算法開發(fā)技術(shù)平臺(tái)互聯(lián)網(wǎng)巨頭項(xiàng)目科輝智藥深圳小分子藥物Biotech創(chuàng)投基金孵化予路乾行蘇州分子模擬CRO資深醫(yī)藥專家創(chuàng)業(yè)科因生物蘇州小分子藥物Biotech創(chuàng)投基金孵化睿健醫(yī)藥武漢誘導(dǎo)多能干細(xì)胞Biotech資深醫(yī)藥專家創(chuàng)業(yè)國(guó)內(nèi)代表企業(yè)英矽智能英矽智能是一家由生成式人工智能驅(qū)動(dòng)的臨床階段藥物研發(fā)公司,通過下一代人工智能系統(tǒng)連接生物學(xué)、化學(xué)和臨床試驗(yàn)分析,利用深度生成模型、強(qiáng)化學(xué)習(xí)、轉(zhuǎn)換模型等現(xiàn)代機(jī)器學(xué)習(xí)技術(shù),構(gòu)建強(qiáng)大且高效的人工智能藥物研發(fā)平臺(tái),識(shí)別全新靶點(diǎn)并生成具有特定屬性分子結(jié)構(gòu)的候選藥物。英矽智能聚焦癌癥、纖維化、免疫、中樞神經(jīng)系統(tǒng)疾病、衰老相關(guān)疾病等未被滿足醫(yī)療需求領(lǐng)域,推進(jìn)并加速創(chuàng)新藥物研發(fā)。英矽智能AI靶點(diǎn)發(fā)現(xiàn)技術(shù)全球領(lǐng)先,具有大量應(yīng)用實(shí)例。自主研發(fā)人工智能生物靶點(diǎn)發(fā)現(xiàn)平臺(tái)PandaOmics?,公司利用該平臺(tái)確定了許多此前從未報(bào)道過的肌萎縮側(cè)索硬化癥(ALS)潛在治療靶點(diǎn)[1]。藥物牧場(chǎng)藥物牧場(chǎng)成立于2015年,主要利用遺傳學(xué)和人工智能技術(shù)開發(fā)針對(duì)乙肝、腫瘤和自身免疫疾病的創(chuàng)新療法。利用IDInvivo+轉(zhuǎn)座子靶點(diǎn)發(fā)現(xiàn)平臺(tái),結(jié)合Medchem5人工智能藥物化學(xué)平臺(tái)在藥物靶點(diǎn)開拓的“卡脖子”領(lǐng)域攻關(guān)突破。前者基于轉(zhuǎn)座子進(jìn)行基因篩選,在具有完整免疫系統(tǒng)的活體動(dòng)物中直接發(fā)現(xiàn)新藥物靶點(diǎn);后者利用深度學(xué)習(xí)技術(shù)進(jìn)行藥物分子的設(shè)計(jì)。藥物牧場(chǎng)已經(jīng)發(fā)現(xiàn)20余個(gè)創(chuàng)新靶點(diǎn);結(jié)合專有的人工智能(AI)藥物發(fā)現(xiàn)平臺(tái),公司原創(chuàng)新藥DF-006已經(jīng)進(jìn)入I期國(guó)際多中心臨床。百圖生科百圖生科是中國(guó)首家生物計(jì)算技術(shù)驅(qū)動(dòng)的生命科學(xué)平臺(tái)公司,致力于用高性能生物計(jì)算和多組學(xué)數(shù)據(jù)技術(shù)加速創(chuàng)新藥物和早篩早診等精準(zhǔn)生命科學(xué)產(chǎn)品的研發(fā)。業(yè)務(wù)將分為兩大階段,第一階段利用前沿AI技術(shù)構(gòu)建完整的生物計(jì)算平臺(tái),并與提供新的數(shù)據(jù)軸和新的數(shù)據(jù)分析、藥物設(shè)計(jì)工具的初創(chuàng)企業(yè)與研究機(jī)構(gòu)攜手,構(gòu)建生物計(jì)算生態(tài),為生命科學(xué)企業(yè)和科研用戶提供豐富的工具能力和完整的解決方案。第二階段,將深度參與或主導(dǎo)發(fā)起新型精準(zhǔn)藥物和精準(zhǔn)診斷產(chǎn)品的研發(fā),攜手合作伙伴,研發(fā)生命科學(xué)產(chǎn)品。百圖生物成果入選美國(guó)癌癥研究協(xié)會(huì)(AACR)2023年會(huì),研究?jī)?nèi)容覆蓋全新抗體設(shè)計(jì)的蛋白結(jié)構(gòu)預(yù)測(cè)模型、靶點(diǎn)發(fā)現(xiàn)[2],以及高通量自動(dòng)化蛋白表達(dá)/表征平臺(tái)的構(gòu)建。予路乾行予路乾行是一家以人工智能、量子力學(xué)及分子模擬算法為核心技術(shù),通過模擬運(yùn)算賦能新藥研發(fā)的交叉學(xué)科技術(shù)驅(qū)動(dòng)型生物醫(yī)藥公司。公司結(jié)合自主創(chuàng)新的AI技術(shù),結(jié)合高精度分子動(dòng)力學(xué)模擬核心算法,建立了國(guó)際領(lǐng)先的新一代人工智能藥物研發(fā)平臺(tái)。該AI研發(fā)平臺(tái)主要針對(duì)未解析靶點(diǎn)與高柔性靶點(diǎn)進(jìn)行高精度結(jié)構(gòu)解析及生理動(dòng)態(tài)過程還原模擬,從而實(shí)現(xiàn)難成藥靶點(diǎn)的新藥研發(fā)。IdentificationofTherapeuticTargetsforAmyotrophicLateralSclerosisUsingPandaOmics–AnAI-EnabledBiologicalTargetDiscoveryPlatformIdentificationofMolecularTargets2/NewNonclinicalModelsforTargetsAI驅(qū)動(dòng)藥物分子設(shè)計(jì)、優(yōu)化藥物設(shè)計(jì)的目標(biāo)是開發(fā)出具有特定性質(zhì)、符合特定標(biāo)準(zhǔn)的藥物,包括療效、安全性、合理的化學(xué)和生物特性以及結(jié)構(gòu)的新穎性。近年來,利用深度生成模型和強(qiáng)化學(xué)習(xí)算法進(jìn)行新藥設(shè)計(jì)被認(rèn)為是一種有效的藥物發(fā)現(xiàn)方法。這種方法能夠繞過傳統(tǒng)基于經(jīng)驗(yàn)的藥物設(shè)計(jì)模式的限制,讓計(jì)算機(jī)通過自主學(xué)習(xí)藥物靶點(diǎn)和分子特征,以更快的速度和更低的成本生成符合特定要求的化合物。這種新方法為藥物設(shè)計(jì)領(lǐng)域帶來了更多的創(chuàng)新和可能性。最新技術(shù)舉例生成模型在藥物設(shè)計(jì)領(lǐng)域應(yīng)用AI生成模型在全新藥物設(shè)計(jì)領(lǐng)域具有巨大的優(yōu)勢(shì),因?yàn)樗鼈冊(cè)谏煞肿訒r(shí)不需要先驗(yàn)的化學(xué)知識(shí)。這些模型可以在更廣闊的未知化學(xué)空間中進(jìn)行搜索,超越現(xiàn)有分子結(jié)構(gòu)的限制,自動(dòng)設(shè)計(jì)新的分子結(jié)構(gòu)。在新藥設(shè)計(jì)中,廣泛使用的深度生成模型包括基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的生成模型、變分自編碼器(VAE)和生成對(duì)抗網(wǎng)絡(luò)(GAN)等。利用生成模型設(shè)計(jì)分子的過程具有高度的隨機(jī)性,生成的分子在結(jié)構(gòu)上呈現(xiàn)千變?nèi)f化,質(zhì)量也參差不齊。強(qiáng)化學(xué)習(xí)可以通過微調(diào)模型參數(shù)進(jìn)行有針對(duì)性的優(yōu)化,使生成的分子具備特定的藥物分子特性。這種結(jié)合生成模型和強(qiáng)化學(xué)習(xí)的方法為全新藥物設(shè)計(jì)提供了新的途徑和可能性。圖表1主要AI生成模型框架示意[1][1]Zeng,Xiangxiang,etal."Deepgenerativemoleculardesignreshapesdrugdiscovery."CellReportsMedicine(2022).簡(jiǎn)單生成模型:基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)基于RNN的生成模型可以生成具有全新結(jié)構(gòu)的化合物,同時(shí)保持與樣本化合物具有相似的生化特性。訓(xùn)練過程首先利用大型化學(xué)數(shù)據(jù)庫對(duì)RNN模型進(jìn)行訓(xùn)練,使其學(xué)習(xí)如何生成正確的化學(xué)結(jié)構(gòu)。然后使用強(qiáng)化學(xué)習(xí)算法對(duì)RNN參數(shù)進(jìn)行微調(diào),使模型能夠?qū)⑸傻幕瘜W(xué)結(jié)構(gòu)映射到指定的化學(xué)空間。強(qiáng)化學(xué)習(xí)使基于RNN的生成模型能夠生成具有良好藥理特性的新分子,并確保生成分子的結(jié)構(gòu)多樣性。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2017年阿斯利康Molecularde-novodesignthroughdeepreinforcementlearning開發(fā)了一種基于序列的新藥設(shè)計(jì)方法REINVENT。研究者從ChEMBL數(shù)據(jù)庫中收集了150萬個(gè)符合特定要求的分子,并使用這些分子的SMILES來訓(xùn)練RNN模型,以學(xué)習(xí)活性分子的特征并生成新分子。(RNN)基于RNN的生成模型藥物在先導(dǎo)化合物的優(yōu)化方面發(fā)揮著作用。研究者提出了一種名為“Scaffold-constrainedmoleculargeneration(SAMOA)”的新分子生成算法,用于解決先導(dǎo)化合物優(yōu)化問題中的支架約束問題:使用RNN生成模型生成新分子的SMILES序列,然后使用精細(xì)采樣程序?qū)崿F(xiàn)支架約束并生成分子。此外,還應(yīng)用了一種基于策略的強(qiáng)化學(xué)習(xí)算法來探索相關(guān)的化學(xué)空間,并生成與預(yù)期相匹配的新分子。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2019年阿斯利康DeepReinforcementLearningforMultiparameterOptimizationindenovoDrugDesign研究者開發(fā)了DeepFMPO框架,能夠從RNN的生成模型在圖表1RNN分子生成模型主要工作流程[1]?進(jìn)階AI生成模型:基于變分自動(dòng)編碼器(VAE)的生成模型VAE已成為復(fù)雜數(shù)據(jù)分布的無監(jiān)督學(xué)習(xí)最流行的方法之一。VAE模型能夠完成小分子的全新設(shè)計(jì)和肽序列的生成。VAE有許多不同的變體,但其核心架構(gòu)始終不變(如下圖所示)。VAE的變體主要可以分為SMILES-VAE、Graph-VAE和3Dgrid-VAE三種類型。SMILES-VAE是應(yīng)用最為廣泛,因?yàn)槠淙菀讓?shí)現(xiàn),例如英矽智能構(gòu)建的GENTRL算法。盡管GENTRL生成的分子順利通過實(shí)驗(yàn)驗(yàn)證,但仍難以保證生成100%驗(yàn)證的SMILES。Graph-VAE和3Dgrid-VAE能夠解決這些問題,由于3D結(jié)構(gòu)訓(xùn)練數(shù)據(jù)有限,目前商業(yè)化應(yīng)用較少。3D技術(shù)將對(duì)未來的AIDD項(xiàng)目具有巨大價(jià)值。圖表1VAE模型的核心架構(gòu)[1-2][1]Zeng,Xiangxiang,etal."Deepgenerativemoleculardesignreshapesdrugdiscovery."CellReportsMedicine(2022).時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2019年英矽智能藥明康德DeepReinforcementLearningforMultiparameterOptimizationindenovoDrugDesign開發(fā)了一種深度生成模型--生成式張量強(qiáng)化學(xué)習(xí)(GENTRL),用于全新小分子設(shè)計(jì)。GENTRL可優(yōu)化合成可行性、新穎性和生物活性。利用該模型在21天內(nèi)發(fā)現(xiàn)了4種DDR1抑制劑。抑制劑在體內(nèi)/體外實(shí)驗(yàn)均得到驗(yàn)證。2020年麻省理工學(xué)院HierarchicalGenerationofMolecularGraphsusingStructuralMotifs報(bào)道了Graph-VAE相關(guān)工作,提出了JT-VAE,100%解決了部分SMILES-VAE算法的局限性。2020年麻省理工學(xué)院Multi-ObjectiveMoleculeGenerationusingInterpretableSubstructuresRationaleRL如GSK3βJNK3)、藥物2021年云深智藥ANovelScalarizedScaffoldHoppingAlgorithmwithGraph-BasedVariationalAutoencoderforDiscoveryofJAK1Inhibitors開發(fā)了一種基于圖的變異自動(dòng)編碼器與高斯混雜隱藏空間(Graph-GMVAE),可以選擇性地從給定的參考化合物中準(zhǔn)確生成分子。利用Graph-GMVAE研究者生成了更強(qiáng)效的JAK1抑制劑,并在生化實(shí)驗(yàn)中得到驗(yàn)證。2023年華為復(fù)旦大學(xué)Q-Drug:aFrameworktobringDrugDesignintoQuantumSpaceusingDeepLearning提出了一種名為Q-Drug(藥物的量子啟發(fā)優(yōu)化算法)的分子優(yōu)化框架,該框架利用量子啟發(fā)算法來優(yōu)化離散二元域變量上的分子?進(jìn)階AI生成模型:基于通用對(duì)抗性網(wǎng)絡(luò)(GAN)的生成模型GAN主要由生成器和鑒別器組成,它們相互博弈,互相對(duì)抗,通過對(duì)抗生成高質(zhì)量的數(shù)據(jù)。GAN能夠生成與真實(shí)數(shù)據(jù)分布相似的新樣本,并能夠使用網(wǎng)絡(luò)來辨別網(wǎng)絡(luò),刪除不需要的內(nèi)容。在AIDD領(lǐng)域,GAN通常與特征學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等技術(shù)相結(jié)合,在蛋白質(zhì)功能預(yù)測(cè)、小分子生成等方面發(fā)揮了重要作用。基于GAN已經(jīng)構(gòu)建多種分子生成模型,如Mol-CycleGAN、ORGANIC、RANC。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2017年哈佛大學(xué)Optimizingdistributionsovermolecularspace.AnObjective-ReinforcedGenerativeAdversarialNetworkforInverse-designChemistry(ORGANIC)ORGANIC是著名的分子生成模型,已成為其他模型的比較基準(zhǔn)模型。它結(jié)合了GAN模型和強(qiáng)化學(xué)習(xí)算法,可以生成新穎有效的分子。2018年英矽智能莫斯科物理技術(shù)學(xué)院ReinforcedAdversarialNeuralComputerfordeNovoMolecularDesign基于生成對(duì)抗網(wǎng)絡(luò)(GAN)范式和強(qiáng)化學(xué)習(xí)(RL),研究者RANC經(jīng)網(wǎng)絡(luò)(DNN)架構(gòu),用于新型小分子有機(jī)結(jié)構(gòu)的從頭設(shè)計(jì)。2020年ArdigenMol-CycleGAN:Agenerativemodelformolecularoptimization研究者開發(fā)了Mol-CycleGAN模型,它能生成與原始化合物結(jié)構(gòu)相似度高的優(yōu)化化合物。在給定一個(gè)分子的情況下,Mol-CycleGAN模型會(huì)能夠生成結(jié)構(gòu)相似的分子,并對(duì)所考慮的屬性值進(jìn)行優(yōu)化。生成模型:基于對(duì)抗性自動(dòng)編碼器(AAE)的生成模型設(shè)計(jì)藥物分子時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2017年英矽智能Mail.RuThecornucopiaofmeaningfulleads:Applyingdeepadversarialautoencodersfornewmoleculedevelopmentinoncology首次將AAE應(yīng)用于根據(jù)確定的參數(shù)生成新的分子指紋。AAE使用二進(jìn)制指紋向NCI-60AAE用于篩選PubChem7200萬2020年英矽智能EntangledConditionalAdversarialAutoencoderfordeNovoDrugDiscoveryAAE模型,即條件生成使用多層的FNN作為判別模型,判斷采,基于強(qiáng)化學(xué)習(xí)(RL)的生成模型設(shè)計(jì)藥物分子強(qiáng)化學(xué)習(xí)(RL)通過智能體在與環(huán)境的交互過程中,不斷優(yōu)化人工智能模型,以最大限度地提高預(yù)期的累積回報(bào)。與有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)不同,RL可以在不受人類先驗(yàn)知識(shí)和訓(xùn)練數(shù)據(jù)束縛的情況下達(dá)到驚人的表現(xiàn),例如最著名的應(yīng)用是AlphaGo。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2017年阿斯利康MolecularDe-NovoDesignthroughDeepReinforcementLearning首次將RL應(yīng)用于藥物發(fā)現(xiàn)領(lǐng)域,使用強(qiáng)化學(xué)習(xí)算法對(duì)生成的分子進(jìn)行評(píng)分,以微調(diào)RNN參數(shù),從而生成對(duì)特定靶點(diǎn)具有活性的新化合物。這種方法已經(jīng)應(yīng)用于幾種不同的分子生成任務(wù)。2019年斯坦福大學(xué)GoogleOptimizationofMoleculesviaDeepReinforcementLearning利用化學(xué)知識(shí)與強(qiáng)化學(xué)習(xí)技術(shù),提出用于分子優(yōu)化的框架)—MolDQN。MolDQN是第一次在分子生成中使用標(biāo)準(zhǔn)的強(qiáng)化學(xué)習(xí)框架。通過直接定義添加/缺失原子或化學(xué)鍵的分子修飾,MolDQN確保100%的化學(xué)有效性。2020年北卡羅來納大學(xué)Deepreinforcementlearningfordenovodrugdesign.(ReLeaSE)使新化學(xué)結(jié)構(gòu)的生成偏向具有所需物理和/或生物學(xué)特性的化學(xué)結(jié)構(gòu)。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2022年星藥科技中山大學(xué)AcceleratedrationalPROTACdesignviadeeplearningandmolecularsimulations提出一種新穎的深度生成模型PROTAC-RL,能夠在低資源的化學(xué)環(huán)境下設(shè)計(jì)出合理的PROTAC,并且結(jié)合深度強(qiáng)化學(xué)習(xí)使得該模型最終能夠設(shè)計(jì)出具有良好藥物代謝動(dòng)力學(xué)性質(zhì)的PROTAC。在短短49天內(nèi)發(fā)現(xiàn)了具有高降解活性及高藥代性能的新型先導(dǎo)化合物并完成濕實(shí)驗(yàn)驗(yàn)證。2023年上海交通大學(xué)Denovodrugdesignbyiterativemultiobjectivedeepreinforcementlearningwithgraph-basedmolecularqualityassessmentQADDQADD生成與生物靶蛋白DRD2結(jié)合的新型分子也證明了該算法的有效性。?綜合多種技術(shù)的AI藥物分子小分子生成平臺(tái)技術(shù)成熟并成功在相關(guān)工作中應(yīng)用時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2017年以色列海法理工學(xué)院Prototype-BasedCompoundDiscoveryUsingDeepGenerativeModels提出了一種分子模板驅(qū)動(dòng)的神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)結(jié)合了VAE、CNN和RNN,可生成與模板分子性質(zhì)相似的化學(xué)結(jié)構(gòu),同時(shí)具有結(jié)構(gòu)多樣性。研究者發(fā)現(xiàn),生成的分子中有效分子的比例顯著提高。2020年英矽智能Chemistry42:AnAI-DrivenPlatformforMolecularDesignandOptimization推出用于從頭設(shè)計(jì)和優(yōu)化小分子的軟件平臺(tái)Chemistry42,將多種最先進(jìn)的生成AI算法與藥物和計(jì)算化學(xué)方法連接起來,來生成具有優(yōu)化特性的新型分子結(jié)構(gòu)。2023年英矽智能DiscoveryofPotent,Selective,andOrallyBioavailableSmall-MoleculeInhibitorsofCDK8fortheTreatmentofCancer通過多模態(tài)生成式強(qiáng)化學(xué)習(xí)平臺(tái)Chemistry42基于結(jié)構(gòu)生成化學(xué)分子的藥物設(shè)計(jì)方法,成功發(fā)現(xiàn)一款有效的、具有選擇性的、口服CDK8抑制劑,有潛力用于癌癥的治療。? 技術(shù)應(yīng)用于大分子藥物分子設(shè)計(jì)目前,國(guó)內(nèi)外的AI藥企主要專注于技術(shù)相對(duì)成熟的小分子藥物研發(fā),并且已經(jīng)有多款由AI設(shè)計(jì)或輔助優(yōu)化的小分子藥物進(jìn)入臨床階段。然而,近年來,隨著新藥物形式的興起,布局抗體藥物、核酸藥物、多肽藥物、基因細(xì)胞治療藥物、合成生物學(xué)等領(lǐng)域的企業(yè)比例也在不斷增加。這些新藥物形式帶來了新的治療理念和手段,為疾病的治療提供了更廣闊的前景。AI技術(shù)在這些領(lǐng)域的應(yīng)用也在逐漸發(fā)展,為新藥物形式的研發(fā)和優(yōu)化提供支持。隨著技術(shù)的進(jìn)一步發(fā)展和應(yīng)用的推廣,未來可以期待AI在大分子藥物領(lǐng)域的應(yīng)用為醫(yī)藥行業(yè)帶來更多的創(chuàng)新和突破。時(shí)間研究機(jī)構(gòu)時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2021年華盛頓大學(xué)DavidBaker團(tuán)隊(duì)Denovoproteindesignbydeepnetworkhallucination2021年晶泰科技IDEA研究院基于AI的高通量高精度抗體結(jié)構(gòu)預(yù)測(cè)模型idealFold(IDEa-xtALpi-Fold)依托晶泰科技自主搭建的XupremAb?下一代抗體發(fā)現(xiàn)平臺(tái)和IDEA研究院的人工智能技術(shù),將先進(jìn)的AI算法與大分子藥物研發(fā)專家經(jīng)驗(yàn)有機(jī)結(jié)合,并運(yùn)用于抗體結(jié)構(gòu)預(yù)測(cè)中。2022年華盛頓大學(xué)DavidBaker團(tuán)隊(duì)Robustdeeplearning-basedproteinsequencedesignusingProteinMPNN開發(fā)了一種新的深度學(xué)習(xí)工具:ProteinMPNN。ProteinMPNN借鑒了圖像識(shí)別使用的神經(jīng)網(wǎng)絡(luò),能夠明確與特定結(jié)構(gòu)相對(duì)應(yīng)的序列,以更加精準(zhǔn)、快速地設(shè)計(jì)蛋白質(zhì)分子,將設(shè)計(jì)蛋白質(zhì)的時(shí)間長(zhǎng)度從“月”縮短至“秒”。2022年華盛頓大學(xué)DavidBaker團(tuán)隊(duì)Designofprotein-bindingproteinsfromthetargetstructurealone2023年華盛頓大學(xué)DavidBaker團(tuán)隊(duì)Top-downdesignofproteinarchitectureswithreinforcementlearning開發(fā)了一種基于強(qiáng)化學(xué)習(xí)的蛋白質(zhì)設(shè)計(jì)軟件,并證明了它有能力創(chuàng)造有功能的蛋白質(zhì)。2023年華盛頓大學(xué)DavidBaker團(tuán)隊(duì)DenovodesignofproteinstructureandfunctionwithRFdiffusion開發(fā)了一種能從頭設(shè)計(jì)全新蛋白質(zhì)的深度學(xué)習(xí)方法——RoseTTAFoldDiffusion該方法能生成各種功能性蛋白質(zhì),包括在天然蛋白質(zhì)中從未見過的拓?fù)浣Y(jié)構(gòu)。2023年百圖生科基于跨模態(tài)大模型“xTrimo”開發(fā)了AIGeneratedProtein平臺(tái)設(shè)置了3FunctionProteinDesign、ProteintoProteinDesign以及CelltoProteinDesign,?國(guó)內(nèi)企業(yè)布局AIDD企業(yè)60余家[1],具體企業(yè)名稱及布局技術(shù)領(lǐng)域如下表所示。國(guó)內(nèi)的藥物分子設(shè)計(jì)、優(yōu)化AI發(fā)展水平參差,具備藥物分子從頭設(shè)計(jì)的/圖表1國(guó)內(nèi)主要布局AI藥物分子發(fā)現(xiàn)、設(shè)計(jì)、優(yōu)化初創(chuàng)企業(yè)匯總[1]公司名稱公司位置主要技術(shù)領(lǐng)域企業(yè)類型企業(yè)技術(shù)/投資背景中大唯信北京小分子藥物CRO/技術(shù)平臺(tái)高校/研究所背景億藥科技北京小分子藥物Biotech高校/研究所背景英飛智藥北京小分子藥物Biotech/CRO高校/研究所背景華深智藥北京大分子藥物CRO高校/研究所背景百奧幾何北京大分子藥物Biotech高校/研究所背景康邁迪森北京小分子藥物CRO高校/研究所背景分子之心北京蛋白質(zhì)設(shè)計(jì)技術(shù)平臺(tái)高校/研究所背景星亢原生物北京大分子藥物CRO/Biotech名校博士創(chuàng)業(yè)項(xiàng)目深勢(shì)科技北京新藥研發(fā)CRO/軟件名校博士創(chuàng)業(yè)項(xiàng)目域新說北京蛋白質(zhì)設(shè)計(jì)技術(shù)平臺(tái)名校博士創(chuàng)業(yè)項(xiàng)目深度智耀北京小分子藥物技術(shù)平臺(tái)資深醫(yī)藥專家創(chuàng)業(yè)角井生物北京大分子藥物Biotech資深醫(yī)藥專家創(chuàng)業(yè)百圖生科北京多組學(xué)/抗體技術(shù)平臺(tái)互聯(lián)網(wǎng)巨頭項(xiàng)目望石智慧北京小分子藥物CRO跨界創(chuàng)業(yè)項(xiàng)目佩德生物成都多肽藥物技術(shù)平臺(tái)高校/研究所背景成都先導(dǎo)成都小分子藥物/核酸藥物CRO資深醫(yī)藥專家創(chuàng)業(yè)智睿醫(yī)藥廣州小分子藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)信華生物廣州大分子藥物Biotech/技術(shù)平臺(tái)資深醫(yī)藥專家創(chuàng)業(yè)費(fèi)米子廣州小分子藥物Biotech/CRO跨界創(chuàng)業(yè)項(xiàng)目西湖歐米杭州蛋白質(zhì)組CRO高校/研究所背景西湖云谷智藥杭州基因編輯Biotech高校/研究所背景賽得康生物杭州蛋白藥物Biotech高校/研究所背景高維醫(yī)藥杭州藥物發(fā)現(xiàn)Biotech高校/研究所背景劑泰醫(yī)藥杭州藥物遞送Biotech名校博士創(chuàng)業(yè)項(xiàng)目德睿智藥杭州小分子藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)呈元科技杭州合成肽新藥研發(fā)Biotech創(chuàng)投基金孵化碳硅智慧杭州藥物研發(fā)CRO/技術(shù)平臺(tái)跨界創(chuàng)業(yè)項(xiàng)目[1]公開資料整理公司名稱公司位置主要技術(shù)領(lǐng)域企業(yè)類型企業(yè)技術(shù)/投資背景索智生物嘉興小分子藥物Biotech資深醫(yī)藥專家創(chuàng)業(yè)紅云生物南京小分子藥物Biotech高校/研究所背景燧坤智能南京小分子藥物CRO/Biotech高校/研究所背景宇道生物上海變構(gòu)藥物Biotech/CRO高校/研究所背景尋百會(huì)生物上海抗體藥物Biotech高校/研究所背景數(shù)因信科上海新藥研發(fā)CRO高校/研究所背景圓壹智慧上海小分子藥物Biotech/CRO高校/研究所背景冰洲石生物上海小分子藥物Biotech名校博士創(chuàng)業(yè)項(xiàng)目宇耀生物上海分子膠藥物Biotech名校博士創(chuàng)業(yè)項(xiàng)目智峪生科上海蛋白質(zhì)預(yù)測(cè)技術(shù)平臺(tái)名校博士創(chuàng)業(yè)項(xiàng)目元星智藥上??顾ダ袭a(chǎn)品Biotech名校博士創(chuàng)業(yè)項(xiàng)目藥物牧場(chǎng)上海小分子藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)勝普澤泰上海多肽藥物CRO/CDMO資深醫(yī)藥專家創(chuàng)業(yè)銳格醫(yī)藥上海癌癥/免疫藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)湃隆生物上海小分子藥物Biotech/CRO創(chuàng)投基金孵化科鎂聯(lián)上海寡核苷酸Biotech創(chuàng)投基金孵化煥一生物上海免疫CRO跨界創(chuàng)業(yè)項(xiàng)目萊芒生物深圳CAR-T療法Biotech高校/研究所背景阿爾法分子深圳新藥研發(fā)Biotech高校/研究所背景新樾生物深圳藥物研發(fā)Biotech/CRO高校/研究所背景晶泰科技深圳小分子藥物CRO名校博士創(chuàng)業(yè)項(xiàng)目新合生物深圳RNA藥物Biotech/CRO名校博士創(chuàng)業(yè)項(xiàng)目未知君深圳腸道微生物態(tài)Biotech名校博士創(chuàng)業(yè)項(xiàng)目智藥科技深圳小分子藥物為主CRO/技術(shù)平臺(tái)名校博士創(chuàng)業(yè)項(xiàng)目星藥科技深圳小分子藥物CRO名校博士創(chuàng)業(yè)項(xiàng)目華為云EIHealth深圳藥物研發(fā)技術(shù)平臺(tái)互聯(lián)網(wǎng)巨頭項(xiàng)目云深智藥深圳藥物研發(fā)技術(shù)平臺(tái)互聯(lián)網(wǎng)巨頭項(xiàng)目科輝智藥深圳小分子藥物Biotech創(chuàng)投基金孵化雙運(yùn)生物蘇州小分子藥物CRO高校/研究所背景醫(yī)圖生科蘇州藥物研發(fā)CRO高校/研究所背景Aureka蘇州大分子藥物Biotech高校/研究所背景阿爾脈生物蘇州小分子藥物CRO/Biotech高校/研究所背景公司名稱公司位置主要技術(shù)領(lǐng)域企業(yè)類型企業(yè)技術(shù)/投資背景朗睿生物蘇州小分子藥物Biotech資深醫(yī)藥專家創(chuàng)業(yè)予路乾行蘇州分子模擬CRO資深醫(yī)藥專家創(chuàng)業(yè)立妙達(dá)蘇州小分子藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)科因生物蘇州小分子藥物Biotech創(chuàng)投基金孵化騰邁醫(yī)藥蘇州新藥研發(fā)CRO創(chuàng)投基金孵化睿健醫(yī)藥武漢多能干細(xì)胞Biotech資深醫(yī)藥專家創(chuàng)業(yè)英矽智能香港小分子藥物Biotech/技術(shù)平臺(tái)資深醫(yī)藥專家創(chuàng)業(yè)國(guó)內(nèi)代表企業(yè)云深智藥云深智藥是由騰訊自主研發(fā)的AI驅(qū)動(dòng)的藥物發(fā)現(xiàn)平臺(tái)。該公司開發(fā)的iDrug平臺(tái)能夠?qū)崿F(xiàn)小分子的從頭合成?,F(xiàn)有的模型通過對(duì)ZINCdrug-like中超過680萬個(gè)小分子數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),來達(dá)到學(xué)習(xí)分子空間的目的。目前支持對(duì)319個(gè)Kinase和52個(gè)GPCR靶點(diǎn)進(jìn)行分子生成。在分子生成這一過程中,騰訊的iDrug平臺(tái)的算法能夠針對(duì)不同靶點(diǎn)在分子空間中的映射進(jìn)行針對(duì)性采樣,從而生成新的可能對(duì)靶點(diǎn)有活性的分子。晶泰科技晶泰科技是一家以智能化、自動(dòng)化驅(qū)動(dòng)的藥物研發(fā)科技公司,為全球生物醫(yī)藥企業(yè)提供藥物發(fā)現(xiàn)一體化解決方案。晶泰科技首創(chuàng)智能計(jì)算、智能實(shí)驗(yàn)和專家經(jīng)驗(yàn)相結(jié)合的藥物研發(fā)新模式,致力于打造三位一體的研發(fā)平臺(tái),助力客戶縮短藥物研發(fā)的周期,提高藥物研發(fā)成功率。晶泰科技具備小分子藥物發(fā)現(xiàn)技術(shù),基于智能計(jì)算、自動(dòng)化實(shí)驗(yàn)和專家經(jīng)驗(yàn)的“三位一體”研究模式,以XtalCryo靶點(diǎn)確證、XcelaHit分子設(shè)計(jì)、XceptionOp成藥性優(yōu)化和XcelDev可開發(fā)性優(yōu)化四大技術(shù)平臺(tái)覆蓋新藥研發(fā)從靶點(diǎn)到獲得PCC的完整流程,提供一體化藥物研發(fā)服務(wù)。此外,晶泰科技具備大分子藥物發(fā)現(xiàn)技術(shù),將AI算法與濕實(shí)驗(yàn)進(jìn)行有機(jī)結(jié)合擁有從靶點(diǎn)識(shí)別到先導(dǎo)抗體藥發(fā)現(xiàn)的全流程一體化能力。星藥科技星藥科技是一家從臨床需求出發(fā)、以AI為核心技術(shù)驅(qū)動(dòng)藥物研發(fā)的生物科技公司。星藥致力于使用人工智能驅(qū)動(dòng)藥物研發(fā),布局未成藥、難成藥靶點(diǎn)的藥物研發(fā)管線,解決未滿足臨床需求。以“AI驅(qū)動(dòng)的研發(fā)管線”和“AI賦能的計(jì)算平臺(tái)”為雙循環(huán),賦能藥物研發(fā)產(chǎn)業(yè)。星藥人工智能藥物發(fā)現(xiàn)平臺(tái)Pyxir?使用AI前沿算法,結(jié)合計(jì)算化學(xué)、藥物化學(xué)和生物學(xué)的工具及經(jīng)驗(yàn),全方位攻克小分子藥物早期研發(fā)流程中的疑難問題,快速發(fā)現(xiàn)活性高、成藥性好且結(jié)構(gòu)新穎的候選分子。星藥的智能計(jì)算平臺(tái)M1結(jié)合了AI與經(jīng)典物理學(xué)原理,可快速準(zhǔn)確地描述分子和蛋白間的相互作用、精確地計(jì)算目標(biāo)藥物分子與特定靶標(biāo)的結(jié)合自由能,突破經(jīng)典計(jì)算模擬方法,達(dá)到世界頂尖水平。AI輔助藥物分子篩選除了傳統(tǒng)的實(shí)驗(yàn)方法,計(jì)算機(jī)輔助藥物設(shè)計(jì)(Computer-AidedDrugDesign,CADD)自問世以來在藥物研發(fā)階段發(fā)揮了巨大的作用。藥物-靶標(biāo)相互作用(DTI)是藥物發(fā)現(xiàn)的重要基礎(chǔ),準(zhǔn)確有效的DTI預(yù)測(cè)能極大地助力藥物研發(fā),加速先導(dǎo)或苗頭化合物發(fā)現(xiàn)。計(jì)算機(jī)模擬DTI并非全新技術(shù),世面已有許多成熟的開源程序或商業(yè)化軟件。將AI技術(shù)引入CADD中,能夠一定程度提高分子篩選的效率與覆蓋度。近年來基于機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的預(yù)測(cè)DTI的方法陸續(xù)被報(bào)道。以已知化合物的活性和結(jié)構(gòu)信息作為訓(xùn)練數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和特征提取,通過選擇合適的機(jī)器學(xué)習(xí)算法進(jìn)行模型構(gòu)建和訓(xùn)練。后續(xù)利用已構(gòu)建的機(jī)器學(xué)習(xí)模型對(duì)新化合物進(jìn)行預(yù)測(cè)和篩選,并結(jié)合化學(xué)規(guī)則和藥物性質(zhì)等要求對(duì)化合物進(jìn)行優(yōu)化和篩選。最新技術(shù)舉例基于機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的藥物-靶標(biāo)相互作用預(yù)測(cè)時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2019年弗洛里達(dá)大學(xué)DeepAtom:aframeworkforprotein-ligandbindingaffiityprediction構(gòu)建了DeepAtom靶標(biāo)親和力。除了具備三維CNN模型的各種優(yōu)勢(shì),DeepAtom模型同時(shí)通過深度可分離卷積解決了三維CNN模型參數(shù)過多的問題,2020年中國(guó)科技大學(xué)Thecornucopiaofmeaningfulleads:Applyingdeepadversarialautoencodersfornewmoleculedevelopmentinoncology首次提出利用GAN模型預(yù)測(cè)蛋白質(zhì)殘基殘GANcon,GANcon2021年四川大學(xué)Layer-wiserelevancepropagationofInteractionNetexplainsprotein–ligandinteractionsattheatomlevel提出了一種多注意力模塊MATT_DTI,首先通過相對(duì)自注意模塊提取藥物的化合物原子間聯(lián)系,用CNN模塊分別學(xué)習(xí)藥物和靶標(biāo)的隱含信息,最后通過多頭注意力模塊和全連接層提取相互作用信息并給出預(yù)測(cè)結(jié)果。2022年西湖大學(xué)廈門大學(xué)德睿智藥Pre-TrainingofEquivariantGraphMatchingNetworkswithConformationFlexibilityforDrugBinding首創(chuàng)研發(fā)了能夠刻畫蛋白質(zhì)構(gòu)象變化與親和力預(yù)測(cè)的AI模型—ProtMD生物醫(yī)藥大模型助力藥物分子篩選時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2022年華為PanGuDrugModel:LearnaMoleculeLikeaHuman開發(fā)了新的深度學(xué)習(xí)架構(gòu),稱為盤古藥物模型PanGuDrugModel。它使用圖到序列的不對(duì)稱條件變異自動(dòng)編碼器,可以從兩種表征中適當(dāng)?shù)孛枋龇肿?,提高下游藥物發(fā)現(xiàn)任務(wù)的性能。2023年百圖生科清華大學(xué)xTrimoPGLM:Unified100B-ScalePre-trainedTransformerforDecipheringtheLanguageofProtein百圖生科與清華大學(xué)合作開發(fā)了一款名為xTrimoPGLM的蛋白質(zhì)語言模型,該模型的參數(shù)量高達(dá)1000億,是目前蛋白質(zhì)領(lǐng)域首個(gè)達(dá)到這一規(guī)模的“通用大模型”。?國(guó)內(nèi)企業(yè)布局國(guó)內(nèi)能夠進(jìn)行藥物分子設(shè)計(jì)、優(yōu)化的AIDD企業(yè)約55家,主要分布在北京、上海、深圳、蘇州、杭州等地區(qū),具體企業(yè)名稱及布局技術(shù)領(lǐng)域如下表所示。中國(guó)AIDD行業(yè)起步較歐美等國(guó)家略有滯后,雖然并不缺乏新藥管線,但大多數(shù)管線僅處于早期研發(fā)階段,具有臨床管線的AIDD企業(yè)數(shù)量較少。由于交叉學(xué)科的特性,早期AIDD公司成立后一般需要經(jīng)歷漫長(zhǎng)的團(tuán)隊(duì)建設(shè)、平臺(tái)完善和技術(shù)驗(yàn)證的時(shí)期,自主設(shè)計(jì)分子并推進(jìn)到后期臨床的公司鳳毛麟角。除“老藥新用”外,目前國(guó)內(nèi)研發(fā)進(jìn)度進(jìn)展臨床試驗(yàn)最快的AI藥物是英矽智能研發(fā)的ISM001-055,該藥物的研發(fā)進(jìn)度同樣位于全球前列?,F(xiàn)階段AI藥企普遍數(shù)據(jù)生產(chǎn)能力和干濕實(shí)驗(yàn)結(jié)合能力不足,這限制了新平臺(tái)的應(yīng)用。AI藥企在新治療方式領(lǐng)域同樣面臨數(shù)據(jù)稀缺性和孤島效應(yīng),而且生物藥的數(shù)據(jù)生產(chǎn)成本更高,兼具不同藥物形式和AI的人才儲(chǔ)備更少,所以未來AI藥企需要持續(xù)加強(qiáng)數(shù)據(jù)資產(chǎn)的挖掘和累積。圖表1國(guó)內(nèi)主要布局AI藥物分子篩選初創(chuàng)企業(yè)匯總[1]公司名稱公司位置主要技術(shù)領(lǐng)域企業(yè)類型企業(yè)技術(shù)/投資背景中大唯信北京小分子藥物CRO/技術(shù)平臺(tái)高校/研究所背景水木未來北京技術(shù)平臺(tái)CRO高校/研究所背景億藥科技北京小分子藥物Biotech高校/研究所背景英飛智藥北京小分子藥物Biotech/CRO高校/研究所背景華深智藥北京大分子藥物CRO高校/研究所背景百奧幾何北京大分子藥物技術(shù)平臺(tái)高校/研究所背景超維知藥北京小分子藥物CRO/Biotech高校/研究所背景康邁迪森北京小分子藥物CRO高校/研究所背景分子之心北京蛋白質(zhì)設(shè)計(jì)技術(shù)平臺(tái)高校/研究所背景星亢原生物北京大分子藥物CRO/Biotech名校博士創(chuàng)業(yè)項(xiàng)目深勢(shì)科技北京新藥研發(fā)CRO/技術(shù)平臺(tái)名校博士創(chuàng)業(yè)項(xiàng)目域新說北京蛋白質(zhì)藥物技術(shù)平臺(tái)名校博士創(chuàng)業(yè)項(xiàng)目深度智耀北京小分子藥物CRO/技術(shù)平臺(tái)資深醫(yī)藥專家創(chuàng)業(yè)角井生物北京大分子藥物Biotech資深醫(yī)藥專家創(chuàng)業(yè)望石智慧北京小分子藥物CRO跨界創(chuàng)業(yè)項(xiàng)目佩德生物成都多肽藥物技術(shù)平臺(tái)高校/研究所背景智睿醫(yī)藥廣州小分子藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)信華生物廣州大分子藥物軟件/Biotech資深醫(yī)藥專家創(chuàng)業(yè)費(fèi)米子廣州小分子藥物Biotech/CRO跨界創(chuàng)業(yè)項(xiàng)目西湖歐米杭州蛋白質(zhì)組技術(shù)平臺(tái)高校/研究所背景高維醫(yī)藥杭州藥物發(fā)現(xiàn)Biotech高校/研究所背景劑泰醫(yī)藥杭州藥物遞送Biotech名校博士創(chuàng)業(yè)項(xiàng)目德睿智藥杭州小分子藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)呈元科技杭州合成肽Biotech創(chuàng)投基金孵化[1]公開資料整理公司名稱公司位置主要技術(shù)領(lǐng)域企業(yè)類型企業(yè)技術(shù)/投資背景碳硅智慧杭州技術(shù)平臺(tái)CRO/技術(shù)平臺(tái)跨界創(chuàng)業(yè)項(xiàng)目索智生物嘉興小分子藥物Biotech資深醫(yī)藥專家創(chuàng)業(yè)紅云生物南京小分子藥物Biotech高校/研究所背景燧坤智能南京小分子藥物CRO/Biotech高校/研究所背景宇道生物上海變構(gòu)藥物Biotech/CRO高校/研究所背景尋百會(huì)生物上??贵w藥物Biotech高校/研究所背景數(shù)因信科上海新藥研發(fā)Biotech高校/研究所背景圓壹智慧上海小分子藥物Biotech/CRO高校/研究所背景冰洲石生物上海小分子藥物Biotech名校博士創(chuàng)業(yè)項(xiàng)目宇耀生物上海分子膠藥物Biotech名校博士創(chuàng)業(yè)項(xiàng)目智峪生科上海蛋白質(zhì)預(yù)測(cè)CRO名校博士創(chuàng)業(yè)項(xiàng)目元星智藥上??顾ダ袭a(chǎn)品Biotech名校博士創(chuàng)業(yè)項(xiàng)目藥物牧場(chǎng)上海小分子藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)銳格醫(yī)藥上海免疫藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)湃隆生物上海小分子藥物Biotech/CRO創(chuàng)投基金孵化阿爾法分子深圳新藥研發(fā)Biotech高校/研究所背景新樾生物深圳DEL賦能藥物研發(fā)Biotech/CRO高校/研究所背景晶泰科技深圳小分子藥物CRO名校博士創(chuàng)業(yè)項(xiàng)目新合生物深圳RNA藥物Biotech/CRO名校博士創(chuàng)業(yè)項(xiàng)目未知君深圳腸道微生物藥物Biotech名校博士創(chuàng)業(yè)項(xiàng)目智藥科技深圳小分子藥物為主CRO/軟件名校博士創(chuàng)業(yè)項(xiàng)目云深智藥深圳新藥研發(fā)技術(shù)平臺(tái)互聯(lián)網(wǎng)巨頭項(xiàng)目科輝智藥深圳小分子藥物Biotech創(chuàng)投基金孵化中以海德深圳乙肝藥物Biotech資深醫(yī)藥專家創(chuàng)業(yè)雙運(yùn)生物蘇州小分子藥物CRO高校/研究所背景醫(yī)圖生科蘇州藥物研發(fā)CRO高校/研究所背景Aureka蘇州大分子藥物Biotech高校/研究所背景阿爾脈生物蘇州小分子藥物CRO/Biotech高校/研究所背景朗睿生物蘇州小分子藥物Biotech資深醫(yī)藥專家創(chuàng)業(yè)予路乾行蘇州技術(shù)平臺(tái)CRO資深醫(yī)藥專家創(chuàng)業(yè)立妙達(dá)蘇州小分子藥物Biotech/CRO資深醫(yī)藥專家創(chuàng)業(yè)科因生物蘇州小分子藥物Biotech創(chuàng)投基金孵化騰邁醫(yī)藥蘇州藥物研發(fā)CRO創(chuàng)投基金孵化睿健醫(yī)藥武漢多能干細(xì)胞Biotech資深醫(yī)藥專家創(chuàng)業(yè)英矽智能香港小分子藥物Biotech資深醫(yī)藥專家創(chuàng)業(yè)AI+臨床前研發(fā)AI+臨床前研發(fā)3703第三章AI助力藥物臨床前研發(fā)概覽AI在藥物臨床前研發(fā)側(cè)重于非臨床藥理學(xué)、藥動(dòng)學(xué)和毒理學(xué)研究。藥物的物理化學(xué)特性及其ADMET特性對(duì)于藥代動(dòng)力學(xué)和毒理學(xué)研究至關(guān)重要。候選藥物的不良特性可能導(dǎo)致昂貴的藥物開發(fā)階段失敗。利用AI技術(shù)通過對(duì)候選藥物的相關(guān)特性進(jìn)行早期評(píng)估,可以降低臨床研究的失敗率和損失。AI輔助藥物理化特性預(yù)測(cè)候選藥物的ADMET特性直接受其物理化學(xué)特性的影響,對(duì)于藥物成功上市至關(guān)重要。例如,藥物分子的溶解度會(huì)嚴(yán)重影響藥物的制劑方法,而藥物分子在不同pH條件下的ADMET特性則深受其電荷狀態(tài)的影響。盡管并非所有具有潛在藥物價(jià)值的苗頭化合物最終都能成功上市,但通過對(duì)苗頭化合物理化特性的研究,能夠提供大量實(shí)驗(yàn)數(shù)據(jù),完善AI預(yù)測(cè)模型,助力藥物晶型的設(shè)計(jì)與改良,制劑的設(shè)計(jì)與優(yōu)化,并為其他藥物的設(shè)計(jì)提供經(jīng)驗(yàn)與靈感。最新技術(shù)舉例技術(shù)輔助藥物晶型預(yù)測(cè)多晶型現(xiàn)象是一種物質(zhì)可以存在多種不同晶體結(jié)構(gòu)中的現(xiàn)象,對(duì)于化學(xué)藥物分子,幾乎所有固體藥物都具有多態(tài)性。由于晶型的變化可以改變固體化學(xué)藥物的許多物理性質(zhì)和化學(xué)性質(zhì)。藥物發(fā)展史上,存在一些藥物由于晶型問題而導(dǎo)致上市失敗的情況。晶型預(yù)測(cè)(CSP)是指給定分子的二維結(jié)構(gòu)式通過計(jì)算模擬獲得它的所有可能的穩(wěn)定晶型。晶型預(yù)測(cè)在制藥工業(yè)中具有重要意義。使用AI有效地動(dòng)態(tài)配置藥物晶型可以完全預(yù)測(cè)小分子藥物的所有可能的晶型,與傳統(tǒng)的藥物晶型研發(fā)相比,制藥公司不必?fù)?dān)心缺少重要的晶型。此外,晶型預(yù)測(cè)技術(shù)大大縮短了晶體的發(fā)展周期,更有效地選擇了合適的藥物晶型,縮短了開發(fā)周期并且降低成本?,F(xiàn)常見的方法或工具有CrystallineSpongeMethod、Dimorphite、ChemML等。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2021年阿斯利康晶泰科技CurrentState-of-the-artIn-houseandCloud-BasedApplicationsofVirtualPolymorphScreeningofPharmaceuticalCompounds:AChallengingCaseofAZD1305AZD1305實(shí)驗(yàn)中,發(fā)現(xiàn)常溫下物理穩(wěn)定性非常接近的兩種晶型,并借助晶泰科技的晶型預(yù)測(cè)和穩(wěn)定性評(píng)估技術(shù)對(duì)該多晶型現(xiàn)象進(jìn)行系統(tǒng)評(píng)估,印證了實(shí)驗(yàn)結(jié)果。對(duì)于晶型預(yù)測(cè)技術(shù)在輔助實(shí)驗(yàn)解決復(fù)雜多晶型篩選問題,幫助研究者快速判斷是否篩選出了在多種條件下最穩(wěn)定的固體形態(tài)等方面提供了積極的建議。2023年默克晶泰科技EffectofPolymerAdditivesontheCrystalHabitofMetforminHCI晶泰科技通過分子動(dòng)力學(xué)模擬考察了溶劑和添加劑與各個(gè)晶面間的相互作用,基于校正吸附能模型定量分析了不同添加劑品種對(duì)晶面生長(zhǎng)的特異性影響,并成功預(yù)測(cè)出不同結(jié)晶環(huán)境中鹽酸二甲雙胍的晶體形態(tài),預(yù)測(cè)結(jié)果與實(shí)驗(yàn)結(jié)果高度匹配。技術(shù)輔助藥物熱力學(xué)溶解度預(yù)測(cè)技術(shù)利用AI技術(shù)能夠識(shí)別并預(yù)測(cè)新分子溶解度等理化性質(zhì),在確定研發(fā)成本或臨床前終止研發(fā)至關(guān)重要。實(shí)驗(yàn)中測(cè)量溶解度存在較大的不確定性,導(dǎo)致測(cè)得的溶解度可能被高估。基于物理模型的第一性原理計(jì)算預(yù)測(cè)溶解度需要高額的計(jì)算成本,可行性較低。利用人工智能技術(shù)建立基于物理模型的熱力學(xué)溶解度預(yù)測(cè)流程,實(shí)現(xiàn)了輕量級(jí)晶型預(yù)測(cè)技術(shù),這對(duì)于預(yù)測(cè)分子的熱力學(xué)溶解度具有重要意義。這些方法可以幫助提高溶解度預(yù)測(cè)的準(zhǔn)確性,加速藥物開發(fā)過程,并為決策提供更可靠的依據(jù)。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2023年AbbVie晶泰科技NovelPhysics-BasedEnsembleModelingApproachThatUtilizes3DMolecularConformationandPackingtoAccessAqueousThermodynamicSolubility:ACaseStudyofOrallyAvailableBromodomainandExtraterminalDomainInhibitorLeadOptimizationSeries晶泰科技通過分子動(dòng)力學(xué)模擬考察了溶劑和添加劑與各個(gè)晶面間的相互作用,基于校正吸附能模型定量分析了不同添加劑品種對(duì)晶面生長(zhǎng)的特異性影響,并成功預(yù)測(cè)出不同結(jié)晶環(huán)境中鹽酸二甲雙胍的晶體形態(tài),預(yù)測(cè)結(jié)果與實(shí)驗(yàn)結(jié)果高度匹配。技術(shù)輔助指導(dǎo)實(shí)驗(yàn)制備新晶型時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2020年南安普敦大學(xué)MinimizingPolymorphicRiskthroughCooperativeComputationalandExperimentalExploration將最先進(jìn)的計(jì)算晶體結(jié)構(gòu)預(yù)測(cè)(CSP)技術(shù)與廣泛的實(shí)驗(yàn)結(jié)晶方法相結(jié)合,以了解和探索藥物的晶體結(jié)構(gòu),并最大限度地降低后期出現(xiàn)意外多晶體的風(fēng)險(xiǎn)。?AI輔助藥物劑型設(shè)計(jì)?最新技術(shù)舉例時(shí)間應(yīng)用相關(guān)論文/成果相關(guān)工作及算法2022年預(yù)測(cè)藥物釋放ImpactA

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論