版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
醫(yī)藥大健康行業(yè)應(yīng)用進(jìn)展報(bào)告CMAC醫(yī)學(xué)事務(wù)生成式AI聯(lián)盟理特咨詢(xún)天士力數(shù)智中藥創(chuàng)新中心南京柯基數(shù)據(jù)科技有限公司2024年4月1前言自2022年底起,OpenAI推出的ChatGPT在全球掀起了熱潮。生成式人工智(GenAI)技術(shù)日新月異,各行各業(yè)正積極探索如何整合最新的GenAI技術(shù)以推動(dòng)數(shù)字化轉(zhuǎn)型。據(jù)統(tǒng)計(jì),全球大型企業(yè)中,已有10%成功將GenAl技術(shù)應(yīng)用于公司層面的平臺(tái)級(jí)項(xiàng)目,50%正在進(jìn)行小規(guī)模嘗試,而另外40%仍在觀望階段。生物醫(yī)藥大健康行業(yè)作為一個(gè)高度專(zhuān)業(yè)化和知識(shí)密集型的領(lǐng)域。從藥物研發(fā)到臨床試驗(yàn),再到上市后的學(xué)術(shù)推廣和患者教育等全流程應(yīng)用場(chǎng)景,涉及到大量非結(jié)構(gòu)化文本、圖片和視頻的處理。隨著集采政策的實(shí)施和監(jiān)管要求的提高,運(yùn)營(yíng)成本和復(fù)雜性不斷上升,因此迫切需要借助人工智能來(lái)提升效率,重塑工作模式。自GenAI推出以來(lái),國(guó)內(nèi)外的藥械、營(yíng)養(yǎng)保健、醫(yī)療機(jī)構(gòu)以及科研機(jī)構(gòu)紛紛嘗試將GenAI技術(shù)應(yīng)用于不同場(chǎng)景,已經(jīng)有一些公司和機(jī)構(gòu)通過(guò)GenAI創(chuàng)造了全新的產(chǎn)品和服務(wù),為業(yè)務(wù)增值。最近的一項(xiàng)調(diào)查顯示,GenAI已成為大多數(shù)制藥公司的首要關(guān)注點(diǎn),40%的高管表示他們正計(jì)劃將GenAI帶來(lái)的成本節(jié)約重新投入到2024年的預(yù)算計(jì)劃中。另外,60%的公司確立了使用GenAI來(lái)幫助企業(yè)降低成本或提高生產(chǎn)效率的目標(biāo),其中75%的公司將其視為高管層和董事會(huì)的優(yōu)先事項(xiàng)。2023年4月,CMAC牽頭與跨國(guó)和國(guó)內(nèi)生物制藥企業(yè)、醫(yī)藥AI領(lǐng)先企業(yè)以及醫(yī)學(xué)專(zhuān)家共同發(fā)布了《ChatGPT背景下的醫(yī)療健康行業(yè)數(shù)字化轉(zhuǎn)型新范式研究報(bào)告》,引起了業(yè)界廣泛關(guān)注。該報(bào)告結(jié)合行業(yè)實(shí)踐和實(shí)際需求,從ChatGPT技術(shù)原理、技術(shù)發(fā)展、醫(yī)療健康行業(yè)國(guó)內(nèi)外應(yīng)用和研究進(jìn)展,以及ChatGPT大模型在醫(yī)藥場(chǎng)景測(cè)試等角度,提出了ChatGPT大模型在醫(yī)療健康行業(yè)落地的挑戰(zhàn)及可能的路徑,為在ChatGPT背景下大模型如何賦能醫(yī)療健康行業(yè)數(shù)字化轉(zhuǎn)型提供參考。在過(guò)去的一年中,CMAC醫(yī)學(xué)事務(wù)生成式AI聯(lián)盟與數(shù)十家跨國(guó)和國(guó)內(nèi)的藥械企業(yè)、營(yíng)養(yǎng)保健企業(yè)、醫(yī)院、醫(yī)療科研機(jī)構(gòu)等展開(kāi)了深入合作。通過(guò)研討會(huì)、咨詢(xún)、概念驗(yàn)證(POC)、項(xiàng)目申報(bào)等形式,我們交流并見(jiàn)證了GenAI在國(guó)內(nèi)生物醫(yī)藥大健康行業(yè)的快速發(fā)展和面臨的挑戰(zhàn),積累了來(lái)自第一線的資料和GenAI應(yīng)用落地的經(jīng)驗(yàn)和方法論。我們相信,2024年將是GenAI在中國(guó)生物醫(yī)藥大健康行業(yè)中實(shí)現(xiàn)規(guī)?;涞氐年P(guān)鍵一年。因此CMAC醫(yī)學(xué)事務(wù)生成式AI聯(lián)盟牽頭,聯(lián)合理特咨詢(xún)、天士力數(shù)智中藥創(chuàng)新中心、柯基數(shù)據(jù)以及生物醫(yī)藥大健康行業(yè)專(zhuān)家和GenAI技術(shù)專(zhuān)家,更新發(fā)布了本報(bào)告。報(bào)告著重介紹了最新GenAl技術(shù)發(fā)展和進(jìn)展,生物醫(yī)藥大健康行業(yè)的應(yīng)用場(chǎng)景和案例,落地挑戰(zhàn)及方法論,以及未來(lái)展望。我們希望該報(bào)告能為GenAI在整個(gè)生物醫(yī)藥大健康行業(yè)的應(yīng)用落地提供有益參考。GenAI應(yīng)用關(guān)鍵技術(shù)8模型訓(xùn)練8微調(diào)9提示詞工程13國(guó)外大模型18國(guó)內(nèi)大模型藥物研發(fā)34靶點(diǎn)發(fā)現(xiàn)與驗(yàn)證34分子生成36中醫(yī)藥研發(fā)41臨床研究44監(jiān)管合規(guī)44藥物選擇、患者入組45學(xué)術(shù)推廣48患者教育50診前50診中51中醫(yī)診療54現(xiàn)狀總結(jié)57監(jiān)管合規(guī)性未來(lái)展望61落地建議62第一章:4C當(dāng)OpenAI在2022年11月30日發(fā)布ChatGPT的時(shí)候,沒(méi)有人會(huì)意識(shí)到,新一代人工智能浪潮將在接下來(lái)短短數(shù)月給人類(lèi)社會(huì)帶來(lái)一場(chǎng)眩暈式的變革。自2010年代初深度學(xué)習(xí)問(wèn)世以來(lái),人工智能進(jìn)入到第三次高潮。而2017年Transformer算法將深度學(xué)習(xí)推向了一經(jīng)面世便風(fēng)靡全球,人們驚訝于其能夠進(jìn)行連貫、有深度對(duì)話的同時(shí),也驚異地發(fā)現(xiàn)了它涌現(xiàn)了推理、思維鏈等體現(xiàn)智能的能力。伴隨AI預(yù)訓(xùn)練大模型持續(xù)發(fā)展,生成式人工智能(GenAI)算法不斷創(chuàng)新以及多模態(tài)AI日益主流化,以ChatGPT為代表的GenAI技術(shù)加速成為AI領(lǐng)域的最新發(fā)展方向,推動(dòng)AI迎來(lái)下一個(gè)大發(fā)展、大繁榮的時(shí)代,將對(duì)經(jīng)濟(jì)社會(huì)發(fā)展產(chǎn)生重大的影響。1.1.1GenAI技術(shù)定義及背景GenAl(GenerativeAI,生成式人工智能)指的是通過(guò)人工智能技術(shù)自動(dòng)生成內(nèi)容的生產(chǎn)方式。通過(guò)訓(xùn)練模型來(lái)生成新的、與訓(xùn)練數(shù)據(jù)相似的內(nèi)容。與傳統(tǒng)類(lèi)型的AI主要關(guān)注識(shí)別和預(yù)測(cè)現(xiàn)有數(shù)據(jù)的模式不同,GenAI著重于創(chuàng)造新的、有創(chuàng)意的數(shù)據(jù),其關(guān)鍵原理在于學(xué)習(xí)和理解數(shù)據(jù)的分布,進(jìn)而生成具有相似特征的新數(shù)據(jù),在文本、圖像、音頻、視頻等多種領(lǐng)域都有廣泛的應(yīng)用。GenAI目前最引人注目的應(yīng)用當(dāng)屬ChatGPT。ChatGPT是基于OpenAl公司的大語(yǔ)言模型GPT-3.5訓(xùn)練、調(diào)試、優(yōu)化的聊天機(jī)器人應(yīng)用,同一個(gè)AI模型可以處理各種各樣的文字和推理任務(wù)。ChatGPT發(fā)布僅兩個(gè)月即獲得1億月活用戶,超越了歷史上所有互聯(lián)網(wǎng)消費(fèi)者應(yīng)用軟件的用戶增長(zhǎng)速度。以大語(yǔ)言模型、圖像生成模型為代表的GenAI技術(shù),成為新一代人工智能的平臺(tái)型技術(shù),助力不同行業(yè)實(shí)現(xiàn)價(jià)值躍升。GenAI大爆發(fā)的背后,普遍認(rèn)為三個(gè)領(lǐng)域的AI技術(shù)的發(fā)展為其提供了肥沃的土壤,分別是生成算法、預(yù)訓(xùn)練模型第一,隨著各種生成算法的不斷創(chuàng)新突破,AI現(xiàn)在已經(jīng)可以生成文字、代碼、圖像、語(yǔ)音、視頻物體等各種類(lèi)型的內(nèi)容和數(shù)據(jù)。GenAl與過(guò)去最顯著的區(qū)別是從分析式AI(AnalyticalAI)發(fā)展為生成式AI(GenerativeAI)。分析式AI模型是根據(jù)已有數(shù)據(jù)進(jìn)行分析、判斷、預(yù)測(cè),最典型的應(yīng)用之一是內(nèi)容智能推薦;生成式AI模型則是學(xué)習(xí)已有數(shù)據(jù)后進(jìn)行演繹、生成創(chuàng)造全新內(nèi)容。第二,預(yù)訓(xùn)練模型,特別是以ChatGPT為代表的大模型,引發(fā)了GenAI技術(shù)能力的質(zhì)變。在過(guò)去,研究人員需要針對(duì)每一個(gè)類(lèi)型的任務(wù)單獨(dú)訓(xùn)練AI模型,訓(xùn)練好的模型只能從事特定任務(wù),不具有通用性。而預(yù)訓(xùn)練的大模型技術(shù)顯著提升了GenAI模型的通用化能力5和工業(yè)化水平,讓GenAI模型成為自動(dòng)化內(nèi)容生產(chǎn)的“工廠”和“流水線”。GenAI模型,包括ChatGPT、GPT-4等大語(yǔ)言模型(LargeLanguageModels,LLM)和Midjourney、StableDiffusion等圖像生成模型,又被稱(chēng)為基礎(chǔ)模型(FoundationModels),其作為基于種類(lèi)豐富的海量數(shù)據(jù)預(yù)訓(xùn)練的深度學(xué)習(xí)算法,展現(xiàn)出強(qiáng)大的、更加泛化的語(yǔ)言理解和內(nèi)容生成能力。以大語(yǔ)言模型(LLM)為例,經(jīng)過(guò)海量的互聯(lián)網(wǎng)內(nèi)容數(shù)據(jù)的訓(xùn)練,大語(yǔ)言模型的參數(shù)可以達(dá)到萬(wàn)億甚至百萬(wàn)億級(jí)別。這大大增強(qiáng)了語(yǔ)言模型的生成能力,同一個(gè)大語(yǔ)言模型可以高質(zhì)量地完成各種各樣的文字和推理任務(wù),例如作詩(shī)、寫(xiě)文章、講故事、寫(xiě)代碼、提供專(zhuān)業(yè)知識(shí)等等。因此,大語(yǔ)言模型已經(jīng)成為了各大企業(yè)競(jìng)相追逐的AI方向。第三,多模態(tài)AI技術(shù)的發(fā)展。多模態(tài)技術(shù)讓GenAI模型可以跨模態(tài)地去生成各種類(lèi)型的內(nèi)容,比如把文字轉(zhuǎn)化為圖片、視頻(Sora)等等,進(jìn)一步增強(qiáng)了GenAI模型的通用能力。A.文本生成領(lǐng)域自然語(yǔ)言生成是一種GenAI技術(shù),可以生成逼真的自然語(yǔ)言文本。生成式AI可以編寫(xiě)文章、故事、詩(shī)歌等,為作家和內(nèi)容創(chuàng)作者提供新的創(chuàng)作方式。同時(shí),它還GenerativePre-trainedTransformer對(duì)話生成式預(yù)訓(xùn)練變換模型)是由OpenAI開(kāi)發(fā)的一個(gè)人工智能聊天機(jī)器人程序,于2022年11月推出。該程序使用基于GPT-3.5架構(gòu)的大語(yǔ)言模型并通過(guò)強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練。ChatGPT目前仍以文字方式互動(dòng),可以解決包括自動(dòng)文本生成、自動(dòng)問(wèn)答、自動(dòng)摘要等在內(nèi)的多種任務(wù)。Jasper已經(jīng)開(kāi)始為谷歌、臉書(shū)等知名公司提供文案GenAI的商業(yè)服務(wù)。B.圖像生成領(lǐng)域圖像生成是GenAI技術(shù)中最為普遍的應(yīng)用之一。StabilityAI發(fā)布了穩(wěn)定擴(kuò)散(StableDiffusion)模型,通過(guò)開(kāi)源快速迭代大幅降低了AI繪畫(huà)的技術(shù)使用門(mén)檻,消費(fèi)者可以通過(guò)訂閱旗下產(chǎn)品DreamStudio來(lái)輸入文本提示詞生成繪畫(huà)作品,產(chǎn)品已經(jīng)吸引全球50多個(gè)國(guó)家超過(guò)100萬(wàn)的用戶注冊(cè)。6C.音視頻創(chuàng)作與生成人工智能技術(shù)的視頻生成工具Sora,再次引發(fā)轟動(dòng)。這是一款輸入文現(xiàn)實(shí)環(huán)境中的重力、碰撞等物理現(xiàn)象,可以通過(guò)直播秀、在線教育、遠(yuǎn)程醫(yī)療等場(chǎng)合。在“現(xiàn)實(shí)已經(jīng)不存在”的驚呼聲中,Sora確為音樂(lè)家提供新的創(chuàng)作靈感。這種技術(shù)還可以D.電影與游戲E.代碼生成領(lǐng)域的代碼。者正在編輯的代碼上下文為開(kāi)發(fā)者提供代碼7GenAI可以直接應(yīng)用于翻譯實(shí)踐之中,與傳統(tǒng)機(jī)器轉(zhuǎn)效率。(4)科研與創(chuàng)新(AIforScience)8生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告在GenAI領(lǐng)域中,有四種關(guān)鍵技術(shù):模型訓(xùn)練(ModelTuning)、檢索增強(qiáng)生成(RAG)和提示詞工程(PromptEngineering)。針對(duì)不同的業(yè)務(wù)目標(biāo)和場(chǎng)景,選擇適當(dāng)?shù)募夹g(shù)模型方法至關(guān)重要。1.模型訓(xùn)練(ModelTraining):需要大量的數(shù)據(jù)和計(jì)算資源來(lái)從頭構(gòu)建一個(gè)人工智能模型。它具有高度的可定制性和可擴(kuò)展性,但耗時(shí)較長(zhǎng),成本最高。適用于全新的突破性應(yīng)用,例如訓(xùn)練一套中醫(yī)診療大模型。2.微調(diào)(Fine-Tuning):專(zhuān)注于將現(xiàn)有模型適應(yīng)特定任務(wù),提供了定制性和效率之間的平衡。3.檢索增強(qiáng)生成(Retrieval-AugmentedGeneration-RAG):通過(guò)整合外部知識(shí)庫(kù)來(lái)增強(qiáng)模型,非常適合需要當(dāng)前或廣泛信息的任務(wù),是現(xiàn)階段企業(yè)級(jí)知識(shí)庫(kù)以及Chatbot建設(shè)較高性?xún)r(jià)比的主要方法。4.提示工程(PromptEngineering):依賴(lài)于設(shè)計(jì)有效的提示來(lái)引導(dǎo)預(yù)訓(xùn)練模型,需要在提示設(shè)計(jì)方面的技能,但計(jì)算資源需求較低。這種方法不僅具有成本效益,而且非常有效,然而其潛力經(jīng)常被低估。每種方法在不同應(yīng)用中都有其優(yōu)勢(shì)和限制,取決于數(shù)據(jù)可及性、計(jì)算資源、特定的任務(wù)、對(duì)最新信息的需求以及所需技能和成本等因素。模型訓(xùn)練類(lèi)似于AI系統(tǒng)開(kāi)發(fā)的基礎(chǔ)階段(例如重新開(kāi)發(fā)一個(gè)ChatGPT)。它涉及從零開(kāi)始構(gòu)建AI模型的過(guò)程,類(lèi)似于將種子培育成長(zhǎng)成一棵大樹(shù)。這個(gè)過(guò)程非常重要,因?yàn)樗於薃I的基本能力和智能。1.新領(lǐng)域:當(dāng)涉足現(xiàn)有模型不適用或不足的領(lǐng)域時(shí)。例如,開(kāi)發(fā)一種尚未被探索2.基于獨(dú)特?cái)?shù)據(jù)集應(yīng)用:在數(shù)據(jù)對(duì)特定需求具有獨(dú)特性的情況下,例如公司使用客戶數(shù)據(jù)來(lái)預(yù)測(cè)購(gòu)買(mǎi)模式。3.創(chuàng)新和研究:非常適合研究和開(kāi)發(fā),用于測(cè)試新理論或模型。模型訓(xùn)練是人工智能發(fā)展的基石,提供了無(wú)與倫比的定制化和創(chuàng)新潛力。然而,它需要大量數(shù)據(jù)和GPU計(jì)算資源和開(kāi)發(fā)資源,成本很高,并帶有固有的風(fēng)險(xiǎn),因此更適用于需要定制解決方案或在人工智能應(yīng)用領(lǐng)域開(kāi)辟新天地的情況。9生成式人工智能(GenA1)在生物醫(yī)藥大健康行業(yè)應(yīng)用進(jìn)展報(bào)告微調(diào)類(lèi)似于磨練技藝嫻熟的藝術(shù)家,使其在特定類(lèi)型中表現(xiàn)出色。它涉及對(duì)經(jīng)過(guò)預(yù)訓(xùn)練的模型進(jìn)行調(diào)整,即對(duì)已經(jīng)從大規(guī)模數(shù)據(jù)集中學(xué)到一般模式的模型進(jìn)行專(zhuān)門(mén)任務(wù)或數(shù)據(jù)集方面的進(jìn)一步提高。這一過(guò)程對(duì)于將通用人工智能模型適應(yīng)特殊需求至關(guān)重要。例如基于醫(yī)學(xué)文獻(xiàn)訓(xùn)練微調(diào)成一套更適合回答健康護(hù)理相關(guān)的問(wèn)題。1.特定任務(wù)應(yīng)用:適用于需要模型的一般理解與特定需求相匹配的任務(wù),例如使語(yǔ)言模型適應(yīng)醫(yī)學(xué)術(shù)語(yǔ)。2.有限資源:適用于無(wú)法負(fù)擔(dān)完整模型訓(xùn)練所需的大量資源的情況。3.提升模型性能:當(dāng)您需要提高預(yù)訓(xùn)練模型在特定領(lǐng)域準(zhǔn)確性時(shí)。在GenAI中,微調(diào)是將通用模型轉(zhuǎn)變?yōu)閷?zhuān)業(yè)模型的藝術(shù)。它在效率和性能增強(qiáng)之間取得平衡,非常適合有針對(duì)性改進(jìn)的場(chǎng)景。這種方法最適用于基礎(chǔ)扎實(shí)但需要特定專(zhuān)業(yè)知識(shí)的情況。RAG,即檢索增強(qiáng)生成(Retrieval-AugmentedGeneration),是一種結(jié)合了信息檢的圖書(shū)館。thutpenlCEO,Stwwcnf"OamtThoerbsedonthefoio2oyitchnpAnswer1.用戶向Chatbot(LLM應(yīng)用)提出問(wèn)題答節(jié)省大量的時(shí)間和人力資源3.數(shù)據(jù)分析與挖掘:RAG能夠在大規(guī)模數(shù)據(jù)集中快速檢索信息,為數(shù)據(jù)分析提供了一個(gè)強(qiáng)大的工具RAG技術(shù)通過(guò)結(jié)合最新的大語(yǔ)言模型和外部知識(shí)庫(kù),為AI中在RAG的技術(shù)發(fā)展中,從技術(shù)角度,呈現(xiàn)出以下幾種范式:00況X至鐘X至鐘NMsNMsCDdD小通小通生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告其中GraphRAG(GraphRetrieval-AugmentedGeneration)是一種結(jié)合知識(shí)圖譜和圖數(shù)據(jù)庫(kù)的檢索增強(qiáng)技術(shù)。它通過(guò)構(gòu)建圖模型的知識(shí)表達(dá),將實(shí)體和關(guān)系之間的聯(lián)系用圖的形式進(jìn)行展示,并利用大語(yǔ)言模型(LargeLanguageModel,LLM)進(jìn)行檢索增強(qiáng)。GraphRAG的核心在于將知識(shí)圖譜等價(jià)于一個(gè)超大規(guī)模的詞匯表,其中實(shí)體和關(guān)系對(duì)應(yīng)于單詞,使得在檢索時(shí)能夠?qū)?shí)體和關(guān)系作為單元進(jìn)行聯(lián)合建模。1.第一階段,Indexintime。該便于后續(xù)的檢索和引用,同時(shí)還會(huì)執(zhí)行傳統(tǒng)RAG流程中的Split&Embedding操作。2.第二階段,QueryTime。Split&Embedding的操作帶來(lái)的最大益處在于能夠迅速鎖定與查詢(xún)最為相關(guān)的知識(shí)點(diǎn)。此外,通過(guò)利用知識(shí)圖譜(KG)中知識(shí)點(diǎn)之間的關(guān)聯(lián)關(guān)系或語(yǔ)義鏈接,系統(tǒng)可以快速地識(shí)別出在語(yǔ)義層面上相關(guān)或接近的知識(shí)。這些知識(shí)點(diǎn)隨后被提供給大語(yǔ)言模型,從而使其能夠生成更為貼切的答案。同時(shí),這一過(guò)程也有助于防止語(yǔ)言模型產(chǎn)生虛假或不合邏輯的回答,提高了結(jié)果的可靠性。1.知識(shí)圖譜集成:GraphRAG利用知識(shí)圖譜來(lái)增強(qiáng)語(yǔ)言模型的理解能力,使得模型能夠更好地理解實(shí)體間的關(guān)系和上下文信息。多樣化的信息來(lái)滿足用戶的需求。3.上下文學(xué)習(xí):GraphRAG支持In-ContextLearning,即在向模型提出問(wèn)題時(shí),提供相關(guān)的上下文信息作為背景知識(shí),從而生成更符合預(yù)期的響應(yīng)。4.處理復(fù)雜查詢(xún):GraphRAG特別適合處理復(fù)雜或多義詞查詢(xún),因?yàn)樗軌蚶弥R(shí)圖譜中的結(jié)構(gòu)化信息來(lái)解決歧義問(wèn)題。5.表達(dá)和推理能力提升:通過(guò)圖技術(shù)構(gòu)建的知識(shí)圖譜,GraphRAG能夠幫助大語(yǔ)言模型更好地理解實(shí)體間的關(guān)系,提升模型的表達(dá)和推理能力。6.適應(yīng)性強(qiáng):GraphRAG技術(shù)可以適配不同的大語(yǔ)言模型框架,如LlamaIndex、LangChain等,使得開(kāi)發(fā)者可以專(zhuān)注于LLM的編排邏輯和pipeline設(shè)計(jì)。GraphRAG作為一種新興的技術(shù),正在逐漸展現(xiàn)出其在信息檢索和處理領(lǐng)域的潛力,尤其是在需要處理大量結(jié)構(gòu)化數(shù)據(jù)和復(fù)雜上下文信息的場(chǎng)景中。隨著技術(shù)的進(jìn)一步提示詞工程(PromptEngineering,縮寫(xiě)為PE)是一種Al技術(shù),它通過(guò)設(shè)計(jì)和改進(jìn)AI的圖3.提示詞工程原理提示詞(prompt)在人工智能場(chǎng)景下指給模型的一個(gè)初始輸入或提示,用于引導(dǎo)模型比如,我們?cè)贑hatGPT中輸入:中國(guó)的首都是什么?這個(gè)問(wèn)題就是提示詞。掌握了提主要優(yōu)點(diǎn)主要挑戰(zhàn)C.輸入數(shù)據(jù),用戶輸入的內(nèi)容或問(wèn)題。D.輸出指示,指定輸出的類(lèi)型或格式。生成式人工智能(GenA1)在生物醫(yī)藥大健康行業(yè)應(yīng)用進(jìn)展報(bào)告(2)提示詞技術(shù)零樣本提示是一種先進(jìn)的自然語(yǔ)言處理技術(shù),旨在領(lǐng)域中表現(xiàn)出色。通過(guò)零樣本提示,模型能夠根據(jù)用成,即使這些提示與訓(xùn)練數(shù)據(jù)中的內(nèi)容沒(méi)有直接圖4.提示詞工程據(jù)投入的過(guò)程。雖然為創(chuàng)建高度定制和強(qiáng)大的人(道路)開(kāi)始,并進(jìn)行特定的調(diào)整,以更好地適應(yīng)您的需求。它比修建新道3.檢索增強(qiáng)生成(RAG):將RAG與這個(gè)類(lèi)比相結(jié)合,就好像給道路配備了動(dòng)整合外部最新信息的能力。與模型訓(xùn)練和微應(yīng)新的信息。但是,其效率取決于外部數(shù)據(jù)源流方法。4.提示工程:這種方法就像找到一個(gè)聰明的捷徑。它涉及使用智能、有提示來(lái)引導(dǎo)預(yù)訓(xùn)練的人工智能模型產(chǎn)生期望圖5.從復(fù)雜度和成本以及質(zhì)量等多維度綜合考慮的實(shí)際應(yīng)用路徑生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告在人工智能領(lǐng)域,大語(yǔ)言模型(LLMs)如GPT-3.5和GPT-4等已經(jīng)成為了自然語(yǔ)言處理(NLP)的強(qiáng)大工具。它們能夠生成連貫的文本、回答問(wèn)題、甚至創(chuàng)作詩(shī)歌和故事。然而,盡管這些模型在處理語(yǔ)言方面表現(xiàn)出色,但它們?cè)趯?shí)際應(yīng)用中的潛力用開(kāi)發(fā)框架開(kāi)源項(xiàng)目,是目前大模型應(yīng)用開(kāi)發(fā)的最主流框架之一。它提供了一套工具和組件,使得開(kāi)發(fā)者能夠?qū)LMs與外部數(shù)據(jù)源和計(jì)算能力結(jié)合起來(lái),更加智能和功能豐富的應(yīng)用。LangChain圍繞將不同組件“鏈接”在一念構(gòu)建,通過(guò)統(tǒng)一的接口簡(jiǎn)化了與GPT-3.5、GPT-4、llama、文心一言、通義千問(wèn)等LLM合作的過(guò)程,使得開(kāi)發(fā)者可以輕松創(chuàng)建定制的高級(jí)用例。uumyuM圖6.LangChain工作機(jī)制AIAgent,即人工智能代理,是一種具備環(huán)境感知、決策制定和行動(dòng)執(zhí)行能力的智能體,也被稱(chēng)為“智能業(yè)務(wù)助理”。其旨在利用大模型技術(shù),通過(guò)自然語(yǔ)言交互方式高度自動(dòng)化地處理專(zhuān)業(yè)或復(fù)雜工作任務(wù),從而顯著減輕人力負(fù)擔(dān)。在本質(zhì)使用,對(duì)應(yīng)需要四個(gè)能力:包含大語(yǔ)言模型能力、具體拆解問(wèn)題的能力、具有長(zhǎng)短基礎(chǔ)架構(gòu)可簡(jiǎn)單劃分為Agent=LLM+規(guī)劃技能+記憶+工具使用。在這一結(jié)構(gòu)④圖7.Agent智能體AutoGPT原理介紹生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告續(xù)對(duì)話的能力,能夠捕捉用戶的意圖,理解上下文,并在多輪對(duì)話中提高準(zhǔn)確率。的廣泛關(guān)注,還強(qiáng)有力地激發(fā)了市場(chǎng)對(duì)同類(lèi)競(jìng)品的研發(fā)熱潮,諸如Gemi供了兩個(gè)迭代版本,分別基于GPT-3.5和更為先進(jìn)的GPT-4架構(gòu)構(gòu)建而成。這兩個(gè)版本均隸屬于OpenAI專(zhuān)有的生成預(yù)訓(xùn)練轉(zhuǎn)換器(GenerativePre-trainedTransformer,GPT)模型系列,該系列的設(shè)計(jì)靈感與核心技術(shù)基礎(chǔ)源自谷歌所研發(fā)的Transformer架構(gòu)。為了滿足不同用戶的需求,ChatGPT允許普通用戶免費(fèi)體驗(yàn)基于GPT-3.5版本的服務(wù);而對(duì)于追求更高級(jí)功能和持續(xù)更新內(nèi)容的用戶,則通過(guò)商業(yè)化品牌“ChatGPTPlus”提供基于GPT-4版本及其后續(xù)優(yōu)化功能的付費(fèi)訂閱服務(wù)。生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告Gemini是由GoogleDeepMind團(tuán)隊(duì)研發(fā)的人工智能模型,是LaMDA和PaLM2的繼任者,于2023年12月6日發(fā)布。這是一個(gè)多模態(tài)模型家族,支持文本、圖像、音頻、視頻和代碼的全方位理解和生成。Gemini模型家族包含三個(gè)針對(duì)不同應(yīng)用場(chǎng)景優(yōu)化的版本:GeminiUltra作為旗艦版,專(zhuān)為數(shù)據(jù)中心級(jí)別的高性能計(jì)算環(huán)境設(shè)計(jì);GeminiPro則定位為通用型解決方案,能在多種工作任務(wù)上展現(xiàn)高效性能,并且特別適用于企業(yè)級(jí)應(yīng)用及云端服務(wù);而小巧靈活的GeminiNano,則通過(guò)高度優(yōu)化實(shí)現(xiàn)了在資源受限的移動(dòng)設(shè)備上的高效運(yùn)行,為智能手機(jī)和平板電腦等移動(dòng)平臺(tái)帶來(lái)了強(qiáng)大且實(shí)時(shí)的AI交互體驗(yàn)。Gemini的設(shè)計(jì)使其能夠原生地支持多模態(tài)能力,即從一開(kāi)始就在不同模態(tài)上進(jìn)行預(yù)訓(xùn)練,并利用額外的多模態(tài)數(shù)據(jù)進(jìn)行微調(diào),以提高其有效性。Claude是由美國(guó)人工智能初創(chuàng)公司Anthropic開(kāi)發(fā)的大語(yǔ)言模型,Anthropic成立于2021年,是一家專(zhuān)注于人工智能安全和研究的公司,旨在建立可靠、可解釋、可操縱的人工智能系統(tǒng)。Claude模型提供了API和Slack機(jī)器人兩種訪問(wèn)方式,其中API訪問(wèn)需要申請(qǐng)并通過(guò)后才能使用,而Slack機(jī)器人目前處于beta版本,不收費(fèi)。Claude是由Anthropic公司于2023年3月首次推出的語(yǔ)言模型系列的初代版本,盡管在編碼、數(shù)學(xué)推理等方面尚存在一定的性能局限性,但依然在執(zhí)行多樣化任務(wù)上展現(xiàn)出了顯著的能力。針對(duì)用戶的不同需求,Claude推出了兩種優(yōu)化版本:常規(guī)版Claude和響應(yīng)速度更快、成本更低廉、運(yùn)行更為輕巧的ClaudeInstant。后者將輸入上下文的處理能力提升至容納10萬(wàn)token,約等同于7.5萬(wàn)個(gè)英文單詞的內(nèi)容量。同年7月11日,Anthropic發(fā)布了Claude系列的重要迭代產(chǎn)品——Claude2,該版本對(duì)公眾開(kāi)放使用,而其前身Claudel則僅限于經(jīng)Anthropic審核批準(zhǔn)的特定用戶群萬(wàn)個(gè)token,并新增了上傳PDF和其他文檔的功能,使得Claude能夠閱讀、總結(jié)文件內(nèi)容并輔助完成相關(guān)任務(wù)。11月份發(fā)布的Claude2.1版本中,聊天機(jī)器人的處理能力再度翻倍,token擴(kuò)大至20萬(wàn)個(gè),相當(dāng)于500頁(yè)的書(shū)面材料。Anthropic在2024度依次排列為Haiku、Sonnet和旗艦款Opus。默認(rèn)配置的Claude3Opustoken為20萬(wàn)個(gè),而在特殊應(yīng)用場(chǎng)景下,該窗口可擴(kuò)展至高達(dá)100萬(wàn)個(gè)token,且在知識(shí)深度、數(shù)學(xué)處理和復(fù)雜任務(wù)解決方面展現(xiàn)出了超越GPT-4和Gemini1.0Ultra的實(shí)力。LLaMA(全稱(chēng)為“大語(yǔ)言模型MetaAI”)是MetaAI于2023年2月推出的自回歸式大語(yǔ)言模型系列,它囊括了多種參數(shù)規(guī)模的版本,其參數(shù)量分別為7的下載權(quán)限。值得關(guān)注的是,在LLaMA發(fā)布后短短一周內(nèi),其模型權(quán)重即通過(guò)LLaMA-2,標(biāo)志著雙方在大語(yǔ)言模型技術(shù)領(lǐng)域的合作邁入了新的階段。當(dāng)40%的數(shù)據(jù)進(jìn)行訓(xùn)練,從而提升了模型對(duì)廣泛語(yǔ)境和任務(wù)的理解能出了經(jīng)過(guò)對(duì)話場(chǎng)景微調(diào)優(yōu)化的變體——LLaMA-2Chat,專(zhuān)為提升人機(jī)交互體驗(yàn)而打造。相比于其前身LLaMA-1,LLaMA-2的一大突破性舉措在于所有模型權(quán)重的全面開(kāi)放,并且對(duì)于廣泛的商業(yè)應(yīng)用場(chǎng)景,提供免費(fèi)使用的權(quán)限,此舉無(wú)疑拓寬了能優(yōu)于同等參數(shù)量級(jí)的其他模型,展現(xiàn)出高效的參數(shù)利用率和優(yōu)秀的泛化能力。生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告Mixtral是由MistralAI開(kāi)發(fā)的一款大語(yǔ)言模型,它采用了專(zhuān)家混合(MoE)架構(gòu),這種架構(gòu)通過(guò)一個(gè)網(wǎng)關(guān)網(wǎng)絡(luò)將輸入數(shù)據(jù)分配給被稱(chēng)為“專(zhuān)家”的特定神經(jīng)網(wǎng)絡(luò)組件。Mixtral8x7B模型由八個(gè)各自擁有70億參數(shù)的專(zhuān)家組成,這種設(shè)計(jì)提高了模型訓(xùn)練和運(yùn)算的效率及可擴(kuò)展性。Mixtral8x7B在多個(gè)領(lǐng)域表現(xiàn)出色,包括綜合性任務(wù)、數(shù)據(jù)分析、問(wèn)題解決和編程支持等。Mistral7B模型,該模型采用了擁有7億個(gè)訓(xùn)練參數(shù),并且嚴(yán)格遵循Apache2.0開(kāi)源許可證,為全球開(kāi)發(fā)者和研究者提供了自由訪問(wèn)和使用的權(quán)限。2023年12月9日,MistralAI發(fā)布了Mixtral8x7B,其構(gòu)建在稀疏專(zhuān)家混合(MoE)的革新框架之上,盡管總體參數(shù)量達(dá)到了467億之多,但得益于MoE技術(shù)的高效性,對(duì)于每個(gè)Token僅激活12.9億相關(guān)參數(shù)進(jìn)行運(yùn)算。此款模型支持包括法語(yǔ)、西班牙語(yǔ)、意大利語(yǔ)、英語(yǔ)及德語(yǔ)在內(nèi)的五大語(yǔ)言環(huán)境,并在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)卓越,聲稱(chēng)已成功超越了Meta公司的LLaMA270B模型的性能水平。2024年2月26日面世的MistralLarge,則是MistralAI的又一旗艦產(chǎn)品,被定位為緊隨OpenAIGPT-4之后的頂級(jí)大模型。它不僅支持多種語(yǔ)言處理任務(wù),還具備編程能力,在多領(lǐng)域應(yīng)用上展示了強(qiáng)大的適應(yīng)性和創(chuàng)造性。用戶現(xiàn)可通過(guò)MicrosoftAzure云端平臺(tái)便捷使用這款高性能模型。MistralMedium型號(hào)則是在廣泛的多語(yǔ)言文本和代碼數(shù)據(jù)集上進(jìn)行深度訓(xùn)練后推出的,其綜合性能評(píng)價(jià)位于Claude模型與GPT-4之間,為尋求平衡資源占用與處理效能需求的用戶提供了一個(gè)理想的選擇。最后,MistralSmall作為輕量化解決方案,旨在提供低延遲響應(yīng)且性能不俗的小型模型。相較于Mixtral8x7B,它在保證快速響應(yīng)的同時(shí),實(shí)現(xiàn)了更優(yōu)的性能指標(biāo),從而在有限計(jì)算資源場(chǎng)景下展現(xiàn)出極高的實(shí)用價(jià)值。生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告StableDiffusion是2022年發(fā)布的深度學(xué)習(xí)文本到圖像生成模型。它主要用于根據(jù)文本的描述產(chǎn)生詳細(xì)圖像,盡管它也可以應(yīng)用于其他任務(wù),如內(nèi)補(bǔ)繪制、外補(bǔ)繪制,以及在提示詞指導(dǎo)下產(chǎn)生圖生圖的轉(zhuǎn)變。它是一種潛在擴(kuò)散模型,由慕尼黑大學(xué)的CompVis研究團(tuán)體開(kāi)發(fā)的各種生成性人工神經(jīng)網(wǎng)絡(luò)之一。它是由初創(chuàng)公司StabilityAI、CompVis與Runway合作開(kāi)發(fā),并得到EleutherAI和LAION的支持。StableDiffusion由3個(gè)部分組成:變分自編碼器(VAE)、U-Net和一個(gè)文本編碼器。Model)和2015年提出的擴(kuò)散模型(DM/DiffusionModel,它是基于Google的Transformer模型)。2022年7月StableDiffusion的問(wèn)世則震驚了全球,相比前輩們,StableDiffusion已經(jīng)成功的解決了細(xì)節(jié)及效率問(wèn)題,通過(guò)算法迭代將AI繪圖的精細(xì)度提升到了藝術(shù)品級(jí)別,并將生產(chǎn)效率提升到了秒級(jí),創(chuàng)作所需的設(shè)備門(mén)檻也被拉到了民用水準(zhǔn)。2022年8月StableDiffusion的開(kāi)源性質(zhì),全球AI繪圖產(chǎn)品迎來(lái)了日新月異的發(fā)展,AI繪圖正在走進(jìn)千家萬(wàn)戶,輿論熱潮也隨之而來(lái)。2023年7其比以前版本大了約3.5倍。并提到在訓(xùn)練結(jié)束后參數(shù)穩(wěn)定后會(huì)開(kāi)源,并改善了需要輸入非常長(zhǎng)的提示詞(prompts),對(duì)于人體結(jié)構(gòu)的處理有瑕疵,經(jīng)常出現(xiàn)動(dòng)作和人體結(jié)構(gòu)異常。2023年11月發(fā)布了Turbo版本的StableDiffusionXL,Turbo版提取自XL1.0而以更少擴(kuò)散步驟運(yùn)行。C名字是2008年動(dòng)畫(huà)電影WALL-E(瓦力)和20世紀(jì)西班牙加泰羅尼亞畫(huà)家薩爾瓦多·達(dá)利(SalvadorDalī)之混成詞。自2000年代以來(lái),已有其他許多神經(jīng)網(wǎng)絡(luò)有生的DALL-E2,聲稱(chēng)它可以從文本描述中生成照片般逼真的圖像,另外還有一個(gè)允生成式人工智能(GenA1)在生物醫(yī)藥大健康行業(yè)應(yīng)用進(jìn)展報(bào)告Sora是一個(gè)能以文本描述生成視頻的人工智能模型,由美國(guó)人工智能研究機(jī)構(gòu)限的創(chuàng)造潛力。其背后的技術(shù)是在OpenAI的文本到圖像生成模型DALL-E基礎(chǔ)上開(kāi)發(fā)而成的。模型的訓(xùn)練數(shù)據(jù)既包含公開(kāi)可用的視頻,也包括了專(zhuān)為訓(xùn)練目的而獲授權(quán)的著作權(quán)視頻,但OpenAI沒(méi)有公開(kāi)訓(xùn)練數(shù)據(jù)的具體數(shù)量與確切來(lái)源。OpenAI于2024年2月15日向公眾展示了由Sora生成的多個(gè)高清視頻,稱(chēng)該模型能夠生成長(zhǎng)達(dá)一分鐘的視頻。同時(shí),OpenAI也承認(rèn)了該技術(shù)的一些缺點(diǎn),包括在模擬復(fù)雜物理現(xiàn)象方面的困難?!堵槭±砉た萍荚u(píng)論》的報(bào)道稱(chēng)演示視頻令人印象深刻,但指出它們可能是經(jīng)精心挑選的,并不一定能代表Sora生成視頻的普遍水準(zhǔn)。由于擔(dān)心Sora可能被濫用,OpenAI表示目前沒(méi)有計(jì)劃向公眾發(fā)布該模型,而是給予小部分研究人員有限的訪問(wèn)權(quán)限,以理解模型的潛在危害。Sora生成的視頻帶有C2PA元數(shù)據(jù)標(biāo)簽,以表示它們是由人工智能模型生成的。OpenAI還與一小群創(chuàng)意專(zhuān)業(yè)人士分享了Sora,以獲取對(duì)其實(shí)用性的反饋?!?zhǔn)確性和多樣性:Sora能夠?qū)⒑?jiǎn)短的文本描述轉(zhuǎn)化成長(zhǎng)達(dá)1分鐘的高清視頻,準(zhǔn)確地解釋用戶提供的文本輸入,并生成具有各種場(chǎng)景和人物的高質(zhì)量視頻剪輯。它涵蓋了廣泛的主題,如人物、動(dòng)物、風(fēng)景、城市場(chǎng)景等,可根據(jù)用戶的要求提供多樣化的內(nèi)容?!?qiáng)大的語(yǔ)言理解能力:Sora利用Dall-E模型的re-c的描述性字幕,提高了文本的準(zhǔn)確性,同時(shí)也提升了視頻的整體質(zhì)量。此外,利用GPT技術(shù)將簡(jiǎn)短的用戶提示轉(zhuǎn)換為更長(zhǎng)的詳細(xì)轉(zhuǎn)譯,確保視頻精確地按照用戶提示生成。·以圖/視頻生成視頻:Sora除了可以將文本轉(zhuǎn)化為視頻,還能接受其他類(lèi)型的輸入,如已存在的圖像或視頻,使其能夠執(zhí)行廣泛的圖像和視頻編輯任務(wù)。·視頻擴(kuò)展功能:Sora能夠沿時(shí)間線向前或向后擴(kuò)展視頻,允許用戶根據(jù)圖像創(chuàng)建視頻或補(bǔ)充現(xiàn)有視頻?!?yōu)異的設(shè)備適配性:Sora具備出色的采樣能力,能夠應(yīng)對(duì)從寬屏到豎屏的各種視頻尺寸,為各種設(shè)備生成與其原始縱橫比完美匹配的內(nèi)容?!?chǎng)景和物體的一致性和連續(xù)性:Sora能夠生成帶有動(dòng)態(tài)視角變化的視頻,人物和場(chǎng)景元素在三維空間中的移動(dòng)顯得更加自然,能夠很好地處理遮擋問(wèn)題。生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告(1)百度-文心一言文心一言(英文名:ERNIEBot)是百度基于文心大模型技術(shù)研發(fā)的知識(shí)增強(qiáng)大語(yǔ)言模型,被外界譽(yù)為“中國(guó)版ChatGPT”。其核心理念在于運(yùn)用深度學(xué)習(xí)算法和大規(guī)模語(yǔ)料庫(kù),模擬人類(lèi)的語(yǔ)言理解和生成能力,從而為用戶提供智能化、個(gè)性化的服務(wù)。能夠?qū)崿F(xiàn)與人對(duì)話互動(dòng),回答問(wèn)題,協(xié)助創(chuàng)作,高效便捷地幫助人們獲取信息、知識(shí)和靈感,并且在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文模式生成方面有很好的應(yīng)用前景。文心一言最早應(yīng)該可以追溯到2010年百度成立的“自然語(yǔ)言處理部”,2019年3月16日,百度正式發(fā)布知識(shí)增強(qiáng)的文心大模型ERNIE1.0,該模型基于飛槳深度學(xué)習(xí)平臺(tái)打造,通過(guò)將數(shù)據(jù)與知識(shí)融合,提升了大模型學(xué)習(xí)中的詞法、語(yǔ)法、語(yǔ)義等知識(shí),在共計(jì)16個(gè)中英文任務(wù)上取得全球最好效日,文心一言率先向全社會(huì)全面開(kāi)放。開(kāi)放首日,文心(2)阿里-通義阿里通義是阿里云推出的一系列人工智能產(chǎn)品和服務(wù)平臺(tái),旨在提供類(lèi)人智慧的通用智能服務(wù)。這些產(chǎn)品和服務(wù)包括通義千問(wèn)、通義智文等,它們支持多種API接口,使得AI應(yīng)用開(kāi)發(fā)變得更加簡(jiǎn)單和高效。通義千問(wèn)(Qwen)是阿里云推出的一款超大規(guī)模語(yǔ)言模型,采用了阿里云自主研發(fā)的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型架構(gòu),通過(guò)先進(jìn)的深度學(xué)習(xí)技術(shù)和海量數(shù)據(jù)訓(xùn)練而成。通義智文是另一個(gè)阿里云的AI產(chǎn)品,它可能包含了文本生成、內(nèi)容理解、自動(dòng)摘要、情感分析等功能,旨在幫助用戶高目前,通義千問(wèn)的綜合性能已經(jīng)超過(guò)GPT-3.5,加速追趕GPT-4。2023年12月1日,阿里云舉辦發(fā)布會(huì),正式發(fā)布并開(kāi)源“業(yè)界最強(qiáng)開(kāi)源大模型”通義千問(wèn)720億參數(shù)模型Qwen-72B。同時(shí),通義千問(wèn)開(kāi)源了18億參數(shù)模型Qwen-1.8B和音頻大模型模型,以及視覺(jué)理解、音頻理解兩款多模態(tài)大模型,實(shí)現(xiàn)了“全尺寸、全模態(tài)”開(kāi)源。自此,阿里云大模型的開(kāi)源邏輯更加清晰,即通過(guò)開(kāi)源的方式提供技術(shù)產(chǎn)品,降低門(mén)檻,推動(dòng)技術(shù)普惠,為企業(yè)客戶到個(gè)人開(kāi)發(fā)者提供多元化、全方位的技術(shù)服(3)訊飛-星火認(rèn)知大模型布了基于首個(gè)全國(guó)產(chǎn)算力平臺(tái)「飛行一號(hào)」訓(xùn)練的歐7能力歐7能力品KK文本1城圖10.訊飛星火大模型華為盤(pán)古大模型是華為云推出的一系列人工智能大模型,旨在通過(guò)強(qiáng)大的計(jì)算能力和先進(jìn)的算法,解決行業(yè)難題并釋放AI的生產(chǎn)氣象、醫(yī)藥、水務(wù)、機(jī)械等領(lǐng)域提供強(qiáng)大的科學(xué)計(jì)算能力。盤(pán)古大模型的研發(fā)不僅體現(xiàn)了華為在AI技術(shù)領(lǐng)域的深厚積累,也展示了華為在推進(jìn)AI技術(shù)產(chǎn)業(yè)化應(yīng)用方日的華為全聯(lián)接大會(huì)2022中國(guó)站上發(fā)布了盤(pán)古氣礦山大模型、盤(pán)古OCR大模型等新服務(wù)。2023年7月舉行的華為開(kāi)發(fā)者大會(huì)為云曾發(fā)布了盤(pán)古大模型3.0,是中國(guó)首個(gè)全棧自主的AI大模型,該模型已具備文生圖、文生文、文生代碼、文生視頻等多模態(tài)能力,提供5+N+X的三層解耦架型,提供使用行業(yè)數(shù)據(jù)訓(xùn)練的行業(yè)大模型;L2層為客戶提供更多細(xì)化場(chǎng)景模型,它更加專(zhuān)注于某個(gè)具體應(yīng)用場(chǎng)景或特定業(yè)務(wù)。華為常務(wù)董事、華為云CEO張平安表示,盤(pán)古大模型聚焦產(chǎn)品研發(fā)、軟件工程、生產(chǎn)供應(yīng)、市場(chǎng)營(yíng)銷(xiāo)、客戶運(yùn)營(yíng)等價(jià)值場(chǎng)景,致力于深耕行業(yè),如政務(wù)、金融、制造、煤礦、鐵路、制藥、氣象等。紛9紛9*0城r山大模型文娛電力鐵路電力制造生成他碼1辯AW圖11.盤(pán)古大模型生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告(5)騰訊-混元大模型騰訊混元大模型(TencentHunyuan)是騰訊自主研發(fā)的通用大語(yǔ)言模型,擁有Angel,提升了訓(xùn)練和推理速度。圖12.混元大模型生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告(6)智譜AI北京智譜華章科技有限公司(簡(jiǎn)稱(chēng)“智譜AI”)專(zhuān)注于新一代認(rèn)知智能大模型的研發(fā),致力于在中國(guó)推動(dòng)大模型領(lǐng)域的創(chuàng)新。公司與合作伙伴共同研發(fā)了中英雙語(yǔ)化級(jí)超大規(guī)模預(yù)訓(xùn)練模型GLM-130B,并在此基礎(chǔ)上推出了對(duì)話模型ChatGLM以及開(kāi)源單卡版模型ChatGLM-6B。同時(shí),團(tuán)隊(duì)還開(kāi)發(fā)了GenAI模型及產(chǎn)品矩陣,包括AI提效助手智譜清言、高效率代碼模型CodeGeeX、多模態(tài)理解模型CogVLM和文生圖模型CogView等。智譜AI秉承ModelasaService(MaaS)的市場(chǎng)理念,推出了大模型MaaS開(kāi)放平臺(tái),旨在構(gòu)建高效率、通用化的“模型即服務(wù)”AI開(kāi)發(fā)新范式。通過(guò)認(rèn)知大模型連接億級(jí)用戶的物理世界,智譜AI憑借完整的模型生態(tài)和全流程技術(shù)支持,為各行各業(yè)帶來(lái)持續(xù)創(chuàng)新與變革,助力加速通用人工智能時(shí)代到來(lái)。性能上有了顯著提升,十余項(xiàng)指標(biāo)接近或達(dá)到了GPT-4水平;支持更長(zhǎng)上下文、更生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告(7)百川智能第二章:GenAI在生物醫(yī)藥大健康行業(yè)d落地應(yīng)用進(jìn)展及典型案例牛+牛+生物醫(yī)藥大健康行業(yè)全流程場(chǎng)景臨床研究藥物研發(fā)臨床研究藥物研發(fā)臨床疾病診療診中臨床試驗(yàn)中心篩選監(jiān)管合規(guī)臨床試驗(yàn)中心篩選監(jiān)管合規(guī)藥物選擇及藥物警藥物選擇及藥物警戒發(fā)的多個(gè)環(huán)節(jié),包括篩選臨床試驗(yàn)中心篩選物警戒(PV)和臨床研究方案設(shè)計(jì)等方面。在上市及商業(yè)化方面,GenAl主要體現(xiàn)2022年,AI制藥公司英矽智能(InsilicoMedicine)在其靶點(diǎn)發(fā)現(xiàn)平臺(tái)PandaOmics上增加了知識(shí)圖譜的功能,可以從期刊文獻(xiàn)中提取相NEwNEwChatPanbushromtheplatfomand生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告°ChatGPT相結(jié)合,得到了具有AI問(wèn)答功能的ChatPandaGPT,支持研究人員在瀏覽和生物標(biāo)志物。2023年底,英矽智能發(fā)布了全球首個(gè)“由AI輔助決策的自動(dòng)化實(shí)驗(yàn)室”,將GenAI應(yīng)umanaritatsariMA2hoyiW(1)大分子生成大分子藥物的作用機(jī)制主要是通過(guò)刺激機(jī)體免疫系統(tǒng)產(chǎn)生免疫物質(zhì)(如抗體),從而發(fā)揮其功效,在人體內(nèi)出現(xiàn)體液免疫、細(xì)胞免疫或細(xì)胞介導(dǎo)免疫。大分子藥物如分子(例如核酸或氨基酸)的下一個(gè)子結(jié)構(gòu),并產(chǎn)生有關(guān)大分子的見(jiàn)解,這些見(jiàn)解可用于新藥物載體的計(jì)算機(jī)設(shè)計(jì)、以及預(yù)測(cè)其在各種藥物研發(fā)人類(lèi)一直以來(lái)都在探索如何更高效、直接、自由地控制細(xì)胞功能、甚至生命活動(dòng),而運(yùn)用GenAI預(yù)測(cè)大分子結(jié)構(gòu)使得這一切的可行性大大提升,并且其預(yù)測(cè)性能在精度、范圍、耗時(shí)等方面正在不斷快速提高。以蛋白質(zhì)為為解碼蛋白質(zhì)的三維奧秘提供了高效手段,從而能夠直接按需制造蛋白質(zhì)、甚至是創(chuàng)造未知或不存在的蛋白,擴(kuò)增出近乎無(wú)限的、廣闊的蛋白質(zhì)序列和結(jié)構(gòu)空間,對(duì)生命科學(xué)和生物醫(yī)藥研究范式的影響將是顛覆性的。構(gòu)建思路。前者的代表是美國(guó)初創(chuàng)生物醫(yī)藥公司Profulu質(zhì)語(yǔ)言模型Progen。該模型基于Transformer架構(gòu)的12億參數(shù)神經(jīng)網(wǎng)絡(luò),提供了一種可根據(jù)所需屬性生成特定蛋白質(zhì)的方法,從引起了生命科學(xué)領(lǐng)域的廣泛關(guān)注。而后者構(gòu)建思路則是采取了圖像生成領(lǐng)域常用的擴(kuò)散性模型的技術(shù)路徑,更加擅長(zhǎng)基于文本生成圖像來(lái)描述蛋白質(zhì)序列和結(jié)構(gòu)之間的關(guān)系,并以此快速生成蛋白質(zhì)的骨架結(jié)構(gòu)。例如2022年10月美國(guó)斯坦福大學(xué)和微軟研究院經(jīng)受體內(nèi)蛋白質(zhì)折疊過(guò)程的啟發(fā),引入了一個(gè)折疊擴(kuò)散模型,通過(guò)鏡像蛋白質(zhì)天然折疊過(guò)程實(shí)現(xiàn)蛋白質(zhì)主鏈結(jié)構(gòu)的設(shè)計(jì),解決了直接生成結(jié)構(gòu)復(fù)掃描跨國(guó)大型藥企與科技公司動(dòng)態(tài),2023年12月,制藥巨頭阿斯利康與AI抗體發(fā)現(xiàn)技術(shù)初創(chuàng)公司Absci簽署了2.47億美元協(xié)議,通過(guò)整合阿斯利康的腫瘤學(xué)研究和開(kāi)發(fā)知識(shí)、以及利用Absci的集成藥物創(chuàng)造平臺(tái),借助GenAI技術(shù)來(lái)開(kāi)發(fā)新的、改AlphaFold模型,從上一代的預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),擴(kuò)展到預(yù)測(cè)蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB)中幾乎任何分子的結(jié)構(gòu),包括配體(小分子)、蛋白質(zhì)、核酸(DNA和RNA)以及含有翻譯后修飾(PTM)的生物分子。如改變氨基酸序列來(lái)改變蛋白質(zhì)的性能,用于設(shè)計(jì)和開(kāi)發(fā)具有特定功能的酶;預(yù)測(cè)核酸結(jié)構(gòu),加速mRNA疫苗等醫(yī)療創(chuàng)新;預(yù)測(cè)配體和蛋白質(zhì)間的相互作用,幫助鑒定和設(shè)計(jì)可能成為藥物的新分子國(guó)內(nèi)頭部藥企與AI制藥企業(yè)也在GenAI生成大分子藥物領(lǐng)域展開(kāi)布局。2023年8月,深圳晶泰科技宣布與石藥集團(tuán)在創(chuàng)新藥研發(fā)AI領(lǐng)域達(dá)成戰(zhàn)略合作協(xié)議,結(jié)合石藥集團(tuán)深厚藥物研發(fā)經(jīng)驗(yàn),利用晶泰科技開(kāi)發(fā)的ProteinGPT大分子藥物生成式AI模型,將“類(lèi)GPT技術(shù)”應(yīng)用于藥物研發(fā),覆蓋抗體發(fā)現(xiàn)、抗體工程、抗原設(shè)計(jì)、蛋白結(jié)合劑設(shè)計(jì)等多個(gè)藥物研發(fā)關(guān)鍵環(huán)節(jié),一鍵生成符合要求的抗體或蛋白藥物。荷蘭-瑞士初創(chuàng)公司Cradle開(kāi)發(fā)的生成人工智能(GenAI)和合成生物學(xué)平臺(tái),旨在設(shè)計(jì)基于蛋白質(zhì)的療法和其他化合物,正在開(kāi)展12個(gè)研發(fā)項(xiàng)目,關(guān)注工程酶、疫苗、肽藥物和抗體,涵蓋廣泛所需蛋白質(zhì)特性,如穩(wěn)定性、表達(dá)、活性、結(jié)合親和力和特異性。Cradle的技術(shù)可以通過(guò)更少、更成功實(shí)驗(yàn)大幅加快蛋白質(zhì)的設(shè)計(jì)和優(yōu)化。與行業(yè)基準(zhǔn)相比,大多數(shù)項(xiàng)目使用Cradle平臺(tái)的進(jìn)度要快兩倍。圖17.Cradle公司合成生物學(xué)平臺(tái)功能示意圖小分子藥物研發(fā)中的一大重要難題是如何識(shí)別并且篩選出最有可能實(shí)現(xiàn)所需療效、值得進(jìn)一步測(cè)試優(yōu)化的化合物,傳統(tǒng)上,藥物化學(xué)家會(huì)在實(shí)驗(yàn)室制造化合物并進(jìn)行測(cè)試,耗時(shí)長(zhǎng)、投資大,但人工智能可以改變這個(gè)過(guò)程。GenAI通過(guò)先進(jìn)的基礎(chǔ)化學(xué)模型加速篩選過(guò)程,如同GPT-4被訓(xùn)練來(lái)預(yù)測(cè)句子中可能的下一個(gè)單詞,這些模型可以預(yù)測(cè)小分子結(jié)構(gòu)中的下一部分原子。通過(guò)多次迭代,該模型學(xué)習(xí)了小分子化學(xué)的基本原理,即使在很大程度上未探索的化學(xué)領(lǐng)域,這些模型也可以提供更精確的預(yù)測(cè),醫(yī)藥公司可以通過(guò)這些預(yù)測(cè)來(lái)規(guī)劃后續(xù)篩選。國(guó)外大型藥企與AI制藥企業(yè)紛紛開(kāi)展合作,各取所長(zhǎng)。2024年1月,默沙東宣布與VariationalAI公司達(dá)成合作,利用其Enki技術(shù)平臺(tái),共同合作開(kāi)發(fā)小分子藥物。默沙東為Enki平臺(tái)提供目標(biāo)產(chǎn)品概況(TPP),平臺(tái)基于GenAI技術(shù),可在幾天時(shí)間內(nèi)生成符合條件的小分子。生成物是具有多樣化、選擇性和可合成的先導(dǎo)化合物結(jié)構(gòu),從而快速進(jìn)入先導(dǎo)化合物優(yōu)化階段。法國(guó)藥物化學(xué)和新藥設(shè)計(jì)AI解決方案提供商Iktos則是利用GenAI技術(shù),降低化合物小分子篩選和生成所需的時(shí)間和成本。其解決方案包括三個(gè)部分,一是通過(guò)Makya基于大量生物數(shù)據(jù),來(lái)創(chuàng)建一種“滿足所有條件”的分子,即在盡可能低的劑量下有效、安全、穩(wěn)定、可申請(qǐng)專(zhuān)利且能夠合成的分子;二是利用Spaya探索合成“配方”和途徑;三是通過(guò)llaka軟件控制機(jī)器人,一次性高效合成多種化合物,不斷重復(fù)上述過(guò)程,以找到更有前途的化合物。目前其擁有50多個(gè)已完成或正在進(jìn)行的項(xiàng)目,合作伙伴包括強(qiáng)生、默克、輝瑞等跨國(guó)大型藥企。回看國(guó)內(nèi),多家AI制藥企業(yè)、大型藥企、科技公司等,也在布局GenAI藥物分子生成。英矽智能推出小分子生成AI平臺(tái)Chemistry42,經(jīng)過(guò)10萬(wàn)種公開(kāi)化合物和100億個(gè)構(gòu)建塊(或虛擬分子片段)的訓(xùn)練,生成數(shù)百個(gè)具有所需特性的化合物,被輸送到管道中評(píng)估適用性,并選擇滿足安全性、效力、合成可用性和代謝穩(wěn)定性等目標(biāo)的分子。生成的分子及其后續(xù)分?jǐn)?shù)將返回到生成引擎,以便模型“學(xué)習(xí)”得分高的分子類(lèi)型和得分低的分子類(lèi)型,重新訓(xùn)練生成模型以生成高分分子,已實(shí)現(xiàn)在一周內(nèi)發(fā)現(xiàn)全新的先導(dǎo)化合物類(lèi)似分子,遠(yuǎn)超人類(lèi)科學(xué)家的速度。自Chemistry42推出以來(lái),已有40多家制藥公司授權(quán)該軟件并將其用于自己的管道程序,以改善自己對(duì)下一個(gè)突破性療法的探索。2022年4月份,華為云計(jì)算技術(shù)的健康智能實(shí)驗(yàn)室推出了華為盤(pán)古藥物分子大模型,該模型訓(xùn)練了17億個(gè)小分子化合物的數(shù)據(jù)集,這一模型結(jié)合了藥物分子的圖形結(jié)構(gòu)和SMILES字符表示法,從兩個(gè)不同的角度理解分子,進(jìn)而構(gòu)建了一個(gè)自監(jiān)督的預(yù)訓(xùn)練大模型。該模型適用于多個(gè)分子相關(guān)的后續(xù)任務(wù),如預(yù)測(cè)分子屬性、生成分子虛擬庫(kù)以及分子的優(yōu)化等。目前盤(pán)古藥物模型的預(yù)訓(xùn)練數(shù)據(jù)集是最大的,涵蓋了多個(gè)公共數(shù)據(jù)源,盤(pán)古模型采用cVAE架構(gòu),將小分子的圖形表示轉(zhuǎn)換成相應(yīng)的化學(xué)式字符串,這樣做避免了在graph2graph模型中遇到的圖形生成的困難,并且相比于seq2seq模型,在訓(xùn)練階段能夠提供更多的信息。此外,通過(guò)設(shè)計(jì)分層的潛在空間,盤(pán)古模型在微調(diào)和化學(xué)指紋表示方面的能力得到了增強(qiáng)。盤(pán)古的創(chuàng)新網(wǎng)絡(luò)結(jié)構(gòu)不僅易于訓(xùn)練,還能夠通過(guò)僅更新一個(gè)核心網(wǎng)絡(luò)來(lái)支持所有藥物發(fā)現(xiàn)任務(wù)的步驟,展現(xiàn)出顯著的優(yōu)勢(shì)。硬PanGumolsouegnerZNCpopetypedckspredcor2023年底,深度勢(shì)能團(tuán)隊(duì)聯(lián)合29家單位的通力型",該模型能夠保持過(guò)去模型的精度和效率。與去年發(fā)布的DPA-1相可以同時(shí)學(xué)習(xí)計(jì)算設(shè)置不同、標(biāo)簽類(lèi)型不同的各類(lèi)數(shù)據(jù)集。由此產(chǎn)生的模型在下游任務(wù)上展現(xiàn)出極強(qiáng)的few-shot甚至zero-shot遷移能力,顯著超越了過(guò)去的解決方案。目前,用于訓(xùn)練DPA-2模型的數(shù)據(jù)集已涵蓋了半導(dǎo)體、鈣鈦礦、合金、表面催bddsE島ErarEnerAMgCuAMgCuE圖19.DPA-2提出的多任務(wù)預(yù)訓(xùn)練、微調(diào)、蒸餾全流程示意圖洛桑聯(lián)邦理工學(xué)院(EPFL)和美國(guó)羅切斯特大學(xué)的研究團(tuán)隊(duì),開(kāi)發(fā)出了一款名為ChemCrow的語(yǔ)言模型代理,這款代理能夠執(zhí)行包括有機(jī)合成、藥物發(fā)現(xiàn)和材料設(shè)設(shè)計(jì)出一種驅(qū)蟲(chóng)劑、三種有機(jī)催化劑以及其他相關(guān)分子。通過(guò)語(yǔ)言模型評(píng)估和專(zhuān)家Autonomousinteracti······中科大MIRALab團(tuán)隊(duì)與微軟研究院AI4Scie模型,名為MiCaM。該模型通過(guò)構(gòu)建一個(gè)含有數(shù)據(jù)驅(qū)動(dòng)的高頻分子片(MinedConnection-awareMotifs)的利用,這些子圖是通過(guò)數(shù)據(jù)驅(qū)動(dòng)算法從分子庫(kù)中自動(dòng)提取的,它們不僅包括常見(jiàn)的分子片段,還細(xì)致記錄了這些片段之間的連接信息。利用這一策略,MiCaM設(shè)計(jì)了一個(gè)能夠同時(shí)選方式的生成器,從而能夠基于這些高頻子圖構(gòu)造出全新的分子結(jié)構(gòu)。在進(jìn)行的兩項(xiàng)基準(zhǔn)測(cè)試中:一項(xiàng)是生成與訓(xùn)練集高度相似的新分子(distributionlearning),另一項(xiàng)是創(chuàng)造具備特定目標(biāo)屬性的新分子(goal-directed),MiCaM二—0c1圖21.高頻分子片段挖掘算法流程圖2024年全國(guó)兩會(huì)期間,政府工作報(bào)告中提出“促進(jìn)中醫(yī)藥傳承創(chuàng)新”,有代表提議,大模型與生物醫(yī)藥大健康行業(yè)的結(jié)合有望革新藥物研發(fā)范式,通過(guò)構(gòu)建中醫(yī)藥AI大模型,將能夠用于挖掘中藥活性成分、推進(jìn)中藥循證工作、加速中藥研發(fā)進(jìn)程。中國(guó)擁有自已龐大的醫(yī)學(xué)寶庫(kù),中醫(yī)藥的“整體觀”對(duì)人體、疾病、藥物的認(rèn)識(shí)積累龐大的實(shí)踐經(jīng)驗(yàn)。隨著人工智能技術(shù)的飛速發(fā)展,中醫(yī)藥領(lǐng)域迎來(lái)一場(chǎng)數(shù)字化、智能化的革命。中醫(yī)藥領(lǐng)域的大語(yǔ)言模型(中醫(yī)藥大模型)作為這場(chǎng)革命的代表,它通過(guò)整合和分析大量的中醫(yī)藥文獻(xiàn)、藥材數(shù)據(jù)庫(kù)、臨床研究和實(shí)踐經(jīng)驗(yàn)來(lái)訓(xùn)練,旨在將人工智能技術(shù)應(yīng)用于傳統(tǒng)醫(yī)學(xué)知識(shí)和實(shí)踐中。目前,中醫(yī)藥大模型主要用于中醫(yī)臨床輔助診療(病證診斷、處方推薦等)、創(chuàng)新研發(fā)以及中醫(yī)藥知識(shí)整合與普及。下面我們將盤(pán)點(diǎn)現(xiàn)有的中醫(yī)大模型在創(chuàng)新研發(fā)以及中醫(yī)藥知識(shí)問(wèn)答的應(yīng)“數(shù)智岐黃”中醫(yī)藥大模型由華東師范大學(xué)、上海中醫(yī)藥大學(xué)、華東理工大學(xué)、海軍軍醫(yī)大學(xué)、臨港實(shí)驗(yàn)室與華潤(rùn)江中現(xiàn)代中藥全國(guó)重點(diǎn)實(shí)驗(yàn)室聯(lián)合開(kāi)發(fā),它以《黃帝內(nèi)經(jīng)》和《傷寒雜病論》等著名中醫(yī)典籍及1000多本古籍和中醫(yī)藥文獻(xiàn)為核心數(shù)據(jù)基礎(chǔ),以高質(zhì)量中醫(yī)藥知識(shí)圖譜為知識(shí)寶庫(kù)。“寶庫(kù)”過(guò)2000種疾病。該大模型采用預(yù)訓(xùn)練和微調(diào)并結(jié)合檢索增強(qiáng)生成和插件調(diào)用等技術(shù),通過(guò)方劑推薦、中藥性質(zhì)解讀(包括性味歸經(jīng)、功效與應(yīng)用、藥物組成、炮制方法等)和證候輔助診斷,實(shí)現(xiàn)中醫(yī)藥領(lǐng)域知識(shí)智能問(wèn)答、健康咨詢(xún)、中醫(yī)藥知識(shí)圖譜動(dòng)態(tài)交互三大核心功能,助力中醫(yī)藥創(chuàng)新研究和人才培養(yǎng)、臨床輔助診療和中醫(yī)養(yǎng)生保健,推動(dòng)中醫(yī)藥文化傳承創(chuàng)新發(fā)展。數(shù)智岐黃數(shù)智岐黃監(jiān)圖22.岐黃問(wèn)道·大模型生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告(2)北京博奧晶方大模型開(kāi)發(fā)北京博奧晶方生物科技有限公司(以下簡(jiǎn)稱(chēng)“博奧晶方”)系博奧生物在中醫(yī)藥領(lǐng)域布局的產(chǎn)業(yè)化平臺(tái)。博奧晶方通過(guò)其核心的“分子本草技術(shù)”,構(gòu)建了“多彈打多靶”的中藥組方篩選大模型(900多種中藥、300多種食物提取物、10億級(jí)真實(shí)基因表達(dá)譜數(shù)據(jù)、藥物作用信號(hào)通路2500多萬(wàn)條)。博奧晶方首創(chuàng)基于生物芯片技術(shù)的中藥組方精準(zhǔn)篩洗大模型,用數(shù)字化技術(shù)賦能精準(zhǔn)診療、中藥創(chuàng)新藥研發(fā)、藥食同源健康食品開(kāi)發(fā)、天然植物化妝品開(kāi)發(fā),致力于為中醫(yī)藥現(xiàn)代化和國(guó)際化開(kāi)創(chuàng)全數(shù)智本草大模型是由天士力與華為云在華為盤(pán)古大語(yǔ)言模型和盤(pán)古藥物分子大模型基礎(chǔ)上推出。目前數(shù)智本草大模型整合了1500+中醫(yī)藥典籍、4000萬(wàn)篇中英文文獻(xiàn)、10TB中藥以及天然產(chǎn)物現(xiàn)代化研究數(shù)據(jù),基于數(shù)智本草大模型的數(shù)智中藥問(wèn)答以及報(bào)告生成平臺(tái),通過(guò)細(xì)分向量庫(kù)和使用場(chǎng)景、優(yōu)化向量庫(kù)、多種檢索方式結(jié)合,提升了中醫(yī)藥知識(shí)問(wèn)答的精準(zhǔn)性,通過(guò)藥典、文獻(xiàn)、指南、醫(yī)案以及中醫(yī)藥現(xiàn)代化數(shù)據(jù)庫(kù)等多種科學(xué)證據(jù)支持,深度挖掘和整合中藥藥理、配伍、臨床應(yīng)用等多維度信息,為中藥研發(fā)、復(fù)方設(shè)計(jì)、藥效預(yù)測(cè)提供科學(xué)、高效的信息整合,從而加數(shù)智本草大模型的天然產(chǎn)物分子大模型,是在300萬(wàn)天然產(chǎn)物及衍生物結(jié)構(gòu)基礎(chǔ)上微調(diào)而成,實(shí)現(xiàn)在天然產(chǎn)物的ADMET性質(zhì)預(yù)測(cè)、分子生成、分子優(yōu)化等關(guān)鍵任務(wù)上的性能優(yōu)化,也為中藥復(fù)方的深入研究和還可以結(jié)合天士力開(kāi)發(fā)的星斗云一站式中藥研發(fā)計(jì)算平臺(tái),覆蓋了從疾病靶點(diǎn)發(fā)現(xiàn)、轉(zhuǎn)錄組學(xué)與蛋白質(zhì)組學(xué)分析,到天然產(chǎn)物分子篩選、方劑推薦及分析等全方位品,其支持中醫(yī)(經(jīng)方)領(lǐng)域問(wèn)題的檢索與回復(fù),型方式實(shí)現(xiàn)中醫(yī)臨床輔助診療(病證診斷、處方推薦等)中醫(yī)藥知識(shí)問(wèn)答等任務(wù),圖23.仲景大模型介紹生成式人工智能(GenA1)在生物醫(yī)藥大健康行業(yè)應(yīng)用進(jìn)展報(bào)告以GenAI為代表的基于機(jī)器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)和多模態(tài)人工智能的應(yīng)用有望從多個(gè)角度優(yōu)化臨床開(kāi)發(fā),包括篩選臨床試驗(yàn)中心、監(jiān)管合規(guī)、藥物選擇和患者入組、臨床研究方案設(shè)計(jì)和試驗(yàn)報(bào)告生成、以及提高藥物警戒等方面。以此,從根本上改變醫(yī)療事務(wù)部和整個(gè)生物制藥或醫(yī)療技術(shù)行業(yè)管理科學(xué)發(fā)現(xiàn)、開(kāi)發(fā)和商業(yè)化的方式。最近在GenAI的動(dòng)向總體呈現(xiàn)兩大規(guī)律,一是提升GenAI技術(shù)服務(wù)能力,通過(guò)技術(shù)優(yōu)勢(shì)獲得大型企業(yè)合作方的青睞;二是利用GenAI賦能自身自研管線,以期轉(zhuǎn)型為創(chuàng)新藥研發(fā)中心或藥企,鞏固行業(yè)領(lǐng)先優(yōu)勢(shì)。在臨床研究中,監(jiān)管合規(guī)是一個(gè)非常重要的課題。研究人員需要遵守各種法規(guī)和規(guī)定,以確保臨床研究的合法性和可靠性。然而,這些法規(guī)和規(guī)定通常非常復(fù)雜,需要花費(fèi)大量的時(shí)間和精力來(lái)理解和遵守。同時(shí),不同地區(qū)的監(jiān)管要求也可能存在差異,這使得跨地域合規(guī)變得更加困難。傳統(tǒng)上,研究人員需要手動(dòng)處理監(jiān)管文本,這非常耗時(shí)且容易出錯(cuò)。如果能夠?qū)崿F(xiàn)自動(dòng)化處理監(jiān)管文本,將大大提高研究人員的效率,并減少錯(cuò)誤的發(fā)生。最后,不合規(guī)可能會(huì)導(dǎo)致嚴(yán)重的財(cái)務(wù)風(fēng)險(xiǎn),這將對(duì)研究機(jī)構(gòu)和企業(yè)造成巨大的損失。利用GenAI結(jié)合自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、知識(shí)圖譜構(gòu)建等先進(jìn)技術(shù),能夠從龐大的法規(guī)文本中快速提取與特定目的相關(guān)的法規(guī),加速合規(guī)進(jìn)程,并實(shí)現(xiàn)自動(dòng)化處理監(jiān)管文本,減少對(duì)第三方法律和合規(guī)支持的依賴(lài)。2023年3月,Medidata平臺(tái)發(fā)布了包含超過(guò)30,000項(xiàng)試驗(yàn)與900萬(wàn)名患者的MedidataAI,將患者層面數(shù)據(jù)直接從試驗(yàn)中的所有病例報(bào)告提取,確保臨床試驗(yàn)產(chǎn)生合規(guī)的數(shù)據(jù)質(zhì)量,對(duì)數(shù)據(jù)輸入中的錯(cuò)誤、異常值、前后不一致和錯(cuò)誤報(bào)告中的不良事件進(jìn)行排序和分類(lèi),以加快藥品審批流程。此外,強(qiáng)生使用的GenAI項(xiàng)目針對(duì)新藥上市合規(guī)審查的需求給予全方面的賦能,通過(guò)獲取國(guó)家藥監(jiān)局、藥物審評(píng)中心、中國(guó)食品藥品檢定研究所的法律法規(guī)、指導(dǎo)原則、相關(guān)公告等內(nèi)容并定期更新,利用大模型的能力進(jìn)行智能語(yǔ)義檢索和細(xì)節(jié)內(nèi)容問(wèn)答,并可通過(guò)內(nèi)置實(shí)體模型對(duì)法規(guī)文檔進(jìn)行主題分類(lèi)和實(shí)體抽取。針對(duì)用戶對(duì)于藥品上市合規(guī)審查指導(dǎo)原則進(jìn)行全文問(wèn)答,并溯源至原文段落、針對(duì)用戶對(duì)于法律法規(guī)中段落內(nèi)容的提問(wèn),能通過(guò)檢索問(wèn)題相關(guān)的文檔,可選單篇或多篇進(jìn)行問(wèn)答,可準(zhǔn)確定位至相應(yīng)內(nèi)容,并總結(jié)回復(fù)、能幫助用戶對(duì)于國(guó)內(nèi)藥品技術(shù)指導(dǎo)原則中較為專(zhuān)業(yè)復(fù)雜的試驗(yàn)設(shè)計(jì)進(jìn)行分析總結(jié)。圖24.AcornAI臨床試驗(yàn)中心分析生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告臨床試驗(yàn)中心的篩選是為了評(píng)估其在臨床試驗(yàn)方面的資質(zhì)、專(zhuān)業(yè)性、合作意愿和經(jīng)驗(yàn)等方面,以確保在該中心開(kāi)展的臨床試驗(yàn)具有可靠性和有效性。這一步驟對(duì)于臨床試驗(yàn)的成功開(kāi)展至關(guān)重要。通過(guò)進(jìn)行可行性研究,可以為項(xiàng)目組提供在該中心開(kāi)展研究的依據(jù),并提前預(yù)判可能會(huì)遇到的問(wèn)題。因此,臨床試驗(yàn)中心的篩選和評(píng)定是臨床試驗(yàn)開(kāi)展前必不可少的重要環(huán)節(jié)。生物醫(yī)藥大健康行業(yè)在臨床試驗(yàn)中心篩選方面存在許多挑戰(zhàn)和痛點(diǎn),其中,信息不對(duì)稱(chēng)是一個(gè)顯著問(wèn)題,醫(yī)藥企業(yè)需要了解每個(gè)臨床試驗(yàn)中心的實(shí)力、經(jīng)驗(yàn)、設(shè)備和人員等方面的信息,但這些信息并不總是公開(kāi)或易于獲取。同時(shí),時(shí)間成本高和風(fēng)險(xiǎn)控制難度大也是臨床試驗(yàn)中心篩選的挑戰(zhàn),醫(yī)藥企業(yè)需要花費(fèi)大量時(shí)間和精力去篩選臨床試驗(yàn)中心,如若選擇不合適的臨床試驗(yàn)中心可能會(huì)導(dǎo)致試驗(yàn)失敗或者延期,增加項(xiàng)目的風(fēng)險(xiǎn)和成本。AcornAI的IntelligentTrials解決方案基于20000項(xiàng)臨床試驗(yàn)的行業(yè)領(lǐng)先數(shù)據(jù),提優(yōu)化試驗(yàn)設(shè)計(jì),選擇最優(yōu)的國(guó)家/地區(qū)與研究中心,并在啟動(dòng)后確保試驗(yàn)表現(xiàn)良好。GenAI可以利用數(shù)據(jù)分析、智能決策支持和預(yù)測(cè)分析等技術(shù)手段,為臨床試驗(yàn)中心的篩選提供全面支持和優(yōu)化。臨床研究中的藥物選擇是指研究人員根據(jù)研究目的和研究設(shè)計(jì),選擇適當(dāng)?shù)乃幬镒鳛檠芯繉?duì)象,進(jìn)行研究。藥物選擇需要考慮藥物的安全性、有效性、劑量、給藥途徑等因素。而患者入組是指研究人員根據(jù)研究設(shè)計(jì)和入選標(biāo)準(zhǔn),從符合條件的患者中篩選出符合研究要求的患者,并將其納入研究中。入選標(biāo)準(zhǔn)包括患者的疾病類(lèi)型、病情嚴(yán)重程度、年齡、性別、病史等因素,患者入組的目的是確保研究結(jié)果的可靠性和有效性。在臨床試驗(yàn)研究中,藥物選擇和患者入組是兩個(gè)關(guān)鍵環(huán)節(jié),但存在一定的痛點(diǎn)。藥物選擇需要確保藥物的安全性、有效性和適應(yīng)癥范圍,這需要大量的前期研究和篩選,耗時(shí)耗力。而患者入組方面,痛點(diǎn)主要涵蓋招募合適的患者、確?;颊叻先虢M標(biāo)準(zhǔn)、排除患者的合并癥和干擾因素等方面。上述痛點(diǎn)可能導(dǎo)致臨床試驗(yàn)進(jìn)度緩慢、成本增加,甚至影響試驗(yàn)結(jié)果的準(zhǔn)確性和可靠性。在藥物選擇方面,GenAI可以通過(guò)結(jié)合多種數(shù)據(jù)源和模型,實(shí)現(xiàn)從分子到人體多層次的模擬和優(yōu)化,為藥物的選擇和評(píng)價(jià)提供更高的精度和效率。此外,還可通過(guò)對(duì)藥物分子結(jié)構(gòu)的分析,預(yù)測(cè)藥物在人體內(nèi)的藥代動(dòng)力學(xué)和藥效學(xué)特性,從而為藥物選擇提供有力支持。英國(guó)人工智能公司Benevolent.AI開(kāi)發(fā)的PrecisionMedicinePlatform系統(tǒng)可以通過(guò)自然語(yǔ)言處理,從文獻(xiàn)、數(shù)據(jù)庫(kù)、臨床數(shù)據(jù)等多種來(lái)源,從中提取出有用的信息,利用人工智能和機(jī)器學(xué)習(xí)技術(shù)進(jìn)行模式識(shí)別和預(yù)測(cè),最終選擇出最適合治療特定疾病的藥物。在篩選患者入組方面,GenAI能夠運(yùn)用多種數(shù)據(jù)來(lái)源,例如電子病歷、基因組學(xué)數(shù)據(jù)和生物標(biāo)志物等,對(duì)患者進(jìn)行全面評(píng)估和分析。這有助于確定最適合參與臨床試驗(yàn)的患者群體。此外,GenAI還可以運(yùn)用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等先進(jìn)技術(shù),對(duì)患者的臨床特征等進(jìn)行深入分析和預(yù)測(cè),從而實(shí)現(xiàn)對(duì)患者的個(gè)性化匹子發(fā)布新一代對(duì)話式藥物研發(fā)助手ChatDD(DrugDesign)和全球首個(gè)千億參數(shù)多模態(tài)生物醫(yī)藥對(duì)話大模型ChatDD-FM100BChatDD-Trial可輔到最適合入組的患者人群。通過(guò)發(fā)現(xiàn)藥物敏感的生物標(biāo)志物,更好地理解疾病亞型,實(shí)現(xiàn)精準(zhǔn)的患者分類(lèi),確保患者與試驗(yàn)藥物更匹配,減少不必要的變量干擾,i00s生物標(biāo)記物與藥物精準(zhǔn)四配找到最適合入組患者人群臨床研究方案設(shè)計(jì)是指在進(jìn)行臨床試驗(yàn)前,制定一份詳細(xì)的計(jì)劃,包括研究的目的、研究對(duì)象、研究方法、研究過(guò)程中的監(jiān)測(cè)和評(píng)估等內(nèi)容。而試驗(yàn)報(bào)告生成是指在臨床試驗(yàn)結(jié)束后,根據(jù)試驗(yàn)方案設(shè)計(jì)的要求,對(duì)試驗(yàn)過(guò)程中的數(shù)據(jù)進(jìn)行整理、分析和總結(jié),撰寫(xiě)一份詳細(xì)的試驗(yàn)報(bào)告,這份報(bào)告需要提交給相關(guān)的機(jī)構(gòu)進(jìn)在臨床研究領(lǐng)域,方案設(shè)計(jì)和試驗(yàn)報(bào)告生成面臨諸多挑戰(zhàn)。首先,傳統(tǒng)的臨床試驗(yàn)設(shè)計(jì)和方案開(kāi)發(fā)過(guò)程往往耗時(shí)較長(zhǎng),需要研究人員對(duì)大量歷史數(shù)據(jù)和文獻(xiàn)進(jìn)行分析和研究,以確定合適的試驗(yàn)設(shè)計(jì)和終點(diǎn)能存在不確定性和不完善的地方,研究人員可能需要多次修改方案以達(dá)到理想的試驗(yàn)效果。這不僅增加了研究成本,還可能影響試驗(yàn)進(jìn)度。此外,臨床試驗(yàn)設(shè)計(jì)方法可能無(wú)法充分利用歷史數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,導(dǎo)致試驗(yàn)結(jié)果的預(yù)測(cè)準(zhǔn)確性不足。這可能會(huì)影響試驗(yàn)的成功率和研究成果的可靠性。試驗(yàn)報(bào)告生成方面,試驗(yàn)報(bào)告需要整合和處理大量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),如試驗(yàn)結(jié)果、患者信息和相關(guān)文獻(xiàn),這對(duì)研究人員來(lái)說(shuō)是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。其次,由于數(shù)據(jù)處理和分析的復(fù)雜性,試驗(yàn)報(bào)告的質(zhì)量可能受到影響,如準(zhǔn)確GenAI基于AI和ML的技術(shù),通過(guò)分析過(guò)往試驗(yàn)數(shù)據(jù)來(lái)優(yōu)化臨床試驗(yàn)設(shè)計(jì)來(lái)構(gòu)建實(shí)現(xiàn)對(duì)于歷史試驗(yàn)的分析和解釋、數(shù)據(jù)注冊(cè)表和科學(xué)文獻(xiàn)中結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告引擎inClinico,高度準(zhǔn)確地預(yù)測(cè)了多項(xiàng)臨床試驗(yàn)Ⅱ期至Ⅲ期的轉(zhuǎn)化結(jié)果,這項(xiàng)研究成果已發(fā)表在《臨床藥理學(xué)與治療學(xué)》期刊上,該期刊是試驗(yàn)與臨床醫(yī)學(xué)領(lǐng)域權(quán)床研究提供首個(gè)完全數(shù)字化的臨床試驗(yàn)解決方案,該解決方案將臨床研究和實(shí)踐整合在一起,支持更輕松的患者識(shí)別和試驗(yàn)同意,并有助于IRB批準(zhǔn)和臨床研合同談判,消除了與數(shù)據(jù)錄入重復(fù)和數(shù)據(jù)監(jiān)控相關(guān)的挑戰(zhàn),并減輕了臨床研究人國(guó)內(nèi)本土企業(yè)也在探索嘗試,上海耀乘健康科技有限公司于2022年發(fā)布PrCreate臨床研究方案生成系統(tǒng)以及PrimeConstruct臨床研究設(shè)計(jì)和建庫(kù)系統(tǒng),支協(xié)助醫(yī)學(xué)、生物統(tǒng)計(jì)、臨床運(yùn)營(yíng)等各部門(mén)專(zhuān)家高效撰寫(xiě)研究方案,便捷開(kāi)展團(tuán)隊(duì)內(nèi)及跨部門(mén)跨組織協(xié)同編輯、審閱、審批和遞交工作,充分利用方案知識(shí)內(nèi)容,實(shí)現(xiàn)知識(shí)留存的數(shù)據(jù)化、結(jié)構(gòu)化,以協(xié)助臨床運(yùn)營(yíng)相關(guān)執(zhí)行文檔和計(jì)劃、指導(dǎo)文件的生成,并高度自動(dòng)化對(duì)接試驗(yàn)建庫(kù)工作,達(dá)成“方案撰寫(xiě)即建庫(kù)”,加速?gòu)呐R床研究中的藥物警戒是指對(duì)正在進(jìn)行的臨床試驗(yàn)中的藥物進(jìn)行監(jiān)測(cè)和評(píng)估,以確保藥物的安全性和有效性。其目的在于及早發(fā)現(xiàn)和解決藥物的不良反應(yīng)和安全在臨床試驗(yàn)過(guò)程中,對(duì)藥物不良反應(yīng)的監(jiān)測(cè)和報(bào)告至關(guān)重要。然而,由于醫(yī)務(wù)人員繁忙、知識(shí)儲(chǔ)備不足或者報(bào)告流程復(fù)雜等原因,可能導(dǎo)致不良反應(yīng)的延遲發(fā)現(xiàn)或者漏報(bào)。這將影響藥物安全性評(píng)估,增加患者風(fēng)險(xiǎn);其次,藥物警戒涉及多個(gè)部門(mén)和專(zhuān)業(yè)人員,如臨床研究者、藥品監(jiān)管部門(mén)、倫理委員會(huì)等。有效的溝通與合作對(duì)于藥物安全監(jiān)測(cè)至關(guān)重要。然而,在實(shí)際操作中,溝通不暢或合作不充分?jǐn)?shù)據(jù)管理方法,分析包括藥物的化學(xué)結(jié)構(gòu)、藥理學(xué)特性、臨床試驗(yàn)等數(shù)據(jù),并利用人工智能技術(shù)來(lái)模擬藥物的作用機(jī)制,識(shí)別藥物的潛在風(fēng)險(xiǎn)和副作用,并確保藥物的安全性和有效性。同時(shí),可將實(shí)時(shí)收集和整合各方信息,提供全面的藥物警戒分析報(bào)告,幫助各部門(mén)及時(shí)識(shí)別風(fēng)險(xiǎn)、制定解決方案。目前,Labcorp推出了基于GenAI架構(gòu)的臨床/上市后藥物警戒平臺(tái)、AI輿情平臺(tái),產(chǎn)品通過(guò)客戶的數(shù)據(jù)生成式人工智能(GenAT)在生物醫(yī)藥大健球行業(yè)應(yīng)用進(jìn)展報(bào)告收集整理,然后用人工智能計(jì)算機(jī)集群服務(wù)做全球的媒體、文獻(xiàn)搜索和訓(xùn)練,提取相關(guān)安全信號(hào),進(jìn)行風(fēng)險(xiǎn)識(shí)別,并將安全信息推送給企業(yè);此外,通義行業(yè)大模型通過(guò)API與交互式問(wèn)答形式提供服務(wù),并提供用于模型二次訓(xùn)練與評(píng)測(cè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度牛只運(yùn)輸車(chē)輛智能調(diào)度與優(yōu)化服務(wù)合同4篇
- 二零二五年度智慧城市暖通管網(wǎng)建設(shè)合同3篇
- 2025年度賭博成癮者離婚后財(cái)產(chǎn)清償及子女監(jiān)護(hù)協(xié)議3篇
- 2025年度出租車(chē)公司股權(quán)轉(zhuǎn)讓及網(wǎng)絡(luò)平臺(tái)建設(shè)合同4篇
- 二零二五版淋浴房產(chǎn)業(yè)投資基金合作協(xié)議4篇
- 個(gè)人過(guò)橋融資協(xié)議模板 2024年適用一
- 2025年度股權(quán)代持與業(yè)績(jī)對(duì)賭條款合同4篇
- 二零二五年度高端商務(wù)面包車(chē)租賃服務(wù)協(xié)議3篇
- 二零二五版高檔住宅門(mén)窗安裝與智能家居集成協(xié)議2篇
- 二零二五年度數(shù)字貨幣交易合作協(xié)議3篇
- 疥瘡病人的護(hù)理
- 人工智能算法與實(shí)踐-第16章 LSTM神經(jīng)網(wǎng)絡(luò)
- 17個(gè)崗位安全操作規(guī)程手冊(cè)
- 2025年山東省濟(jì)南市第一中學(xué)高三下學(xué)期期末統(tǒng)一考試物理試題含解析
- 中學(xué)安全辦2024-2025學(xué)年工作計(jì)劃
- 網(wǎng)絡(luò)安全保障服務(wù)方案(網(wǎng)絡(luò)安全運(yùn)維、重保服務(wù))
- 2024年鄉(xiāng)村振興(產(chǎn)業(yè)、文化、生態(tài))等實(shí)施戰(zhàn)略知識(shí)考試題庫(kù)與答案
- 現(xiàn)代科學(xué)技術(shù)概論智慧樹(shù)知到期末考試答案章節(jié)答案2024年成都師范學(xué)院
- 軟件模塊化設(shè)計(jì)與開(kāi)發(fā)標(biāo)準(zhǔn)與規(guī)范
- 2024年遼寧鐵道職業(yè)技術(shù)學(xué)院高職單招(英語(yǔ)/數(shù)學(xué)/語(yǔ)文)筆試歷年參考題庫(kù)含答案解析
- 有機(jī)農(nóng)業(yè)種植模式
評(píng)論
0/150
提交評(píng)論