科研智能(AI4R研發(fā))研究報告-2024.08-29正式版-WN8_第1頁
科研智能(AI4R研發(fā))研究報告-2024.08-29正式版-WN8_第2頁
科研智能(AI4R研發(fā))研究報告-2024.08-29正式版-WN8_第3頁
科研智能(AI4R研發(fā))研究報告-2024.08-29正式版-WN8_第4頁
科研智能(AI4R研發(fā))研究報告-2024.08-29正式版-WN8_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

科研智能(AI4R&D)——人工智能驅(qū)動的研發(fā)新范式中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)科學智能(AI4S)工作組2024年7月編制說明本報告主要是在中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟指導和組織下起草編寫,主要參編單位包括中國信息通信研究院、華技術(shù)有限公司、北京百度網(wǎng)訊科技有限公司、北京深勢科有限公司、之江實驗室、富信息股份有限公司、北京新數(shù)科技有限公司。云、張艷博、周原野、楊康、王錦海。目錄一、科研智能發(fā)展態(tài)勢...............................................1二、科研智能產(chǎn)業(yè)發(fā)展情況..........................................2(一)科研算力—賦能科研智能高效運行..........................2(二)科研數(shù)據(jù)—驅(qū)動科研智能創(chuàng)新發(fā)現(xiàn)........................4(三)開發(fā)工具鏈—全鏈路打造科開發(fā)工具...................7三、科研智能應(yīng)用發(fā)展情況..........................................15(一)基礎(chǔ)科學研究—開展前沿探索,推動科學邊界拓展............16(二)產(chǎn)業(yè)研發(fā)創(chuàng)新—構(gòu)建核心驅(qū)動力,加速產(chǎn)業(yè)升級變革..........18四、科研智能生態(tài)建設(shè)情況..........................................19(一)產(chǎn)業(yè)組織................................................19(二)社區(qū)設(shè)................................................19(三)科研賽事................................................20(四)會議交流................................................21(五)教學培訓................................................21(六)標準布局................................................1五、總結(jié)與展望....................................................22附錄一............................................................23表目錄表1國外科研領(lǐng)域主要公開數(shù)據(jù)集.....................................5表2國內(nèi)外典型科研智能算法庫.....................................10表3我國代表性科學套件...........................................12表42019年至2023年Science雜志評選的十大學突破................17表5科研智能典型領(lǐng)域模型.....................................23科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式一、科研智能發(fā)展態(tài)勢AIforResearchandDevelopmentAI4R&D,人工智能賦能科學研究及產(chǎn)業(yè)研發(fā))是科學智能(IforScience,AI4S)概念的延伸和擴展,主要包括兩方內(nèi)涵,一是聚焦人工智能加速基礎(chǔ)科學研究,拓展研究思路加速研究進程;二是強調(diào)人工智能在應(yīng)用研究和產(chǎn)業(yè)研發(fā)中重要作用,全面提升工程技術(shù)創(chuàng)新的效率??蒲兄悄艽砹丝萍紕?chuàng)新的新范式和新動能,有望全面加速基礎(chǔ)研究和產(chǎn)業(yè)研發(fā)的進程,并縮短兩者之間的轉(zhuǎn)化周期,推動科技成果在工業(yè)界的產(chǎn)業(yè)化和規(guī)模應(yīng)用??蒲兄悄苷谌蚍秶鷥?nèi)加速發(fā)展。從戰(zhàn)略層面看,各國相繼發(fā)布政策構(gòu)筑科研智能發(fā)展環(huán)境。2023年12的應(yīng)用》,倡導為歐洲量身制定一項政策,促進人工智能在科學領(lǐng)域的應(yīng)用。2023年5月,美國新建7家國家人工智能研究所,推動2022年8月,我國發(fā)布《關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進經(jīng)濟高質(zhì)量發(fā)展的指導意見》,支持探索人工智能技術(shù)用于重大科學研究和技術(shù)開發(fā)的應(yīng)用場景。從賦能層面AI持續(xù)拓展科學領(lǐng)域問題解決的能力,圍繞生命科學、物理等領(lǐng)域,形成了如Alphafold3另一方面AI材料研發(fā)、氣象預(yù)測、計等領(lǐng)域相繼取得技術(shù)突破。科研智能作為個新興的交叉領(lǐng)域,目前尚處于發(fā)展的早期階段,但已經(jīng)展現(xiàn)出巨大的發(fā)展?jié)摿蛷V闊的應(yīng)用場景,中國信息通1科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式信研究院(以下簡稱“中國信通院”)持續(xù)跟蹤科研智能技術(shù)和產(chǎn)業(yè)動態(tài),于2024年發(fā)布報告《科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式》定產(chǎn)業(yè)政策、指導項目布局提供參考,為究機構(gòu)、科技企業(yè)把握技術(shù)方向、開拓應(yīng)用場景提供借鑒速該領(lǐng)域的技術(shù)創(chuàng)新和應(yīng)用實踐,為我國在該領(lǐng)域搶占發(fā)展機提供助力。未來,中國信通院將關(guān)注全球科研智能發(fā)展動向深化對關(guān)鍵技術(shù)和產(chǎn)業(yè)趨勢的研判,加強與科研機構(gòu)、高校、企業(yè)等產(chǎn)學研各界的交流合作,共同推進科研智能生態(tài)體系建設(shè),為科技強國和創(chuàng)新型國家建設(shè)提供有力支撐。二、科研智能產(chǎn)業(yè)發(fā)展情況科研算力與科研數(shù)據(jù)的深度融合為AI4R&D奠定了堅實基礎(chǔ)。由AI框架算法庫套件及領(lǐng)域模型組成的開發(fā)工具鏈極大提升了科研效率,促進了跨學科、跨領(lǐng)域的協(xié)同創(chuàng)新與融合,深刻改變了科學研究范式。(一)科研算力—賦能科研智能高效運行科研算力是指結(jié)合智能算力與超算算力的計算能力,通過異構(gòu)計算架構(gòu)滿足高精度計算和AI模型訓練推理需求。智能算力基于GPU(圖形處理器TP(張量處理單元NPU(神經(jīng)網(wǎng)絡(luò)處理單元AI芯片供并行計算能力,適用于人工智能的訓練和推理計算。超算算力依托超級計算機集群,實現(xiàn)大規(guī)模科學計算和模擬,能夠處理復雜的科學計算問題,廣泛應(yīng)用于如行星模擬、2科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式藥物分子因分析等場景。而科研智能算力整合了AI計算和科學計算兩種方式,采用異構(gòu)計算架構(gòu),結(jié)合多種計算單元,以滿足高精度科學計算和人工智能模型訓練、推理的雙需求。科研智能的研究涉及大量復雜的計算務(wù),包括大規(guī)模數(shù)據(jù)處理、深度學習模型訓練和高精度科擬等,這些任務(wù)均需要充足的算力支撐。在多數(shù)場景下,為足科學研究和工程應(yīng)用的需求,如蛋白質(zhì)結(jié)構(gòu)預(yù)測模型AlphaFold2夠以原子級精度預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),其預(yù)測效果可以與實驗結(jié)果媲美,解決了生物學界長達50年的重大挑戰(zhàn),該成就被Science雜志評為2021年度十大科學突破成果的第一位。這一進展也在很大程度上依賴于大規(guī)模的計算資源支持,在AlphaFold2的研發(fā)過程中,DeepMind團隊投入了大量的算力資源,訓練階段使用了約128個TPUv3,歷時天才能完1。當前業(yè)界提供科研智能算力服務(wù)的方式主要有三種:一是云服務(wù)企業(yè)以公有云模式提供智能算力服務(wù)。云服務(wù)企業(yè)以智能算力平臺的形式提供計算資源,如阿里云靈駿智算平、百度智能云AIStudio華為昇騰云向仿真等場景提供一站式算力服務(wù)。二是由政府、企業(yè)建設(shè)并對外提供服務(wù)的人工智能算力中心。西安的未來人工智能計算中心已成功孵化出多個智能科研領(lǐng)域的大模型球首個面向雷達遙感場景的“秦嶺·西電遙感腦大模型”,及全球首個面向計算流體力學場景的“秦嶺·翱1《HighlyaccurateproteinstructurepredictionwithAlphaFold》3科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式翔大模型”一體機通過將專用硬件、軟件和服務(wù)集成在一個系統(tǒng)中,打造便捷、高性能的科研智能系統(tǒng)。如深勢盒子是面向分子動力學模擬設(shè)計場景推出一體機硬件層面以定制加速卡與CPU結(jié)合的方式提供計算能力,軟件層面預(yù)裝分子動力學專業(yè)模擬軟件。我國科研智能算力面臨多項戰(zhàn),亟需建立普惠的科研算力保一是高端AI芯片的生產(chǎn)和購買受限影響算力供給。二是國內(nèi)智能算力的技術(shù)產(chǎn)業(yè)生態(tài)較弱,應(yīng)用門檻高。三是智能算力資源主要集中于頭部科技類企業(yè),高校、科研機構(gòu)和大量行業(yè)企業(yè)算力儲備相對有限。建議層面,一是建立針對高校、科研機構(gòu)和行業(yè)企業(yè)的算力資源保障機制,實現(xiàn)算力資源的合理供給、動態(tài)分配與高效利用,保障科研智能領(lǐng)域計算需求。二是構(gòu)建跨地區(qū)、跨機構(gòu)的科研算力資源共享平臺,促進科研機構(gòu)與產(chǎn)業(yè)界的協(xié)同創(chuàng)新。三是實施科研算力成本效益評估,優(yōu)化資源投入與產(chǎn)出,加速科技成果的產(chǎn)業(yè)轉(zhuǎn)化。(二)科研數(shù)據(jù)—驅(qū)動科研智能創(chuàng)新發(fā)現(xiàn)科研數(shù)據(jù)是指科學研究和產(chǎn)業(yè)研發(fā)活動產(chǎn)生的原始數(shù)據(jù)、中間數(shù)據(jù)、結(jié)果數(shù)據(jù)和分析數(shù)據(jù)等,主要包括觀測數(shù)據(jù)、實驗數(shù)據(jù)、記錄數(shù)據(jù)、調(diào)查數(shù)據(jù)、模擬數(shù)據(jù)及科研文獻等內(nèi)容。高質(zhì)量的科研數(shù)據(jù)科研數(shù)據(jù)管理是科研智能開展的前提??蒲兄悄軘?shù)據(jù)相較傳統(tǒng)的行業(yè)數(shù)據(jù),有如下特點。一是數(shù)據(jù)來源和類型更加多樣數(shù)據(jù)來自儀器設(shè)備傳感器仿真模擬文獻等,4科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式數(shù)據(jù)格式和語義差別較大。二是數(shù)據(jù)質(zhì)量要求高。數(shù)據(jù)的客觀性、準確性、完備性、分辨率等質(zhì)量要求很高,這會直接影響到計算結(jié)果的可信度。三是數(shù)據(jù)量更大。實驗觀測數(shù)據(jù)、仿真模擬數(shù)據(jù)等不僅規(guī)模巨大且增長快速,遠超普通商業(yè)化據(jù)。四是維度更高。例如氣象、地理、生物數(shù)據(jù)涉及時間間、物種等多個維度,結(jié)構(gòu)更加復雜。國外方面,公開數(shù)據(jù)集資源豐富、體系成熟,已成為全球科研工作者開展研究的重要基礎(chǔ)設(shè)施。美國通過一系列項目推動科研領(lǐng)域公共數(shù)據(jù)集的建設(shè)、共享及應(yīng)用,如美國國家生物信息中心(NCBI)成為全球醫(yī)療AI研究人員的首選數(shù)據(jù)源其數(shù)據(jù)可在亞馬遜云平臺和谷歌云平臺上便捷訪問。在氣象領(lǐng)域,美國國家海洋和大氣管理NOAA數(shù)據(jù)是氣象大模型研發(fā)的重要支撐“材料項目(TheMaterialsProject)經(jīng)過三十年發(fā)展,已成為該領(lǐng)域的標桿性數(shù)據(jù)庫。數(shù)據(jù)資源的長期積累為科技突破奠定了重要基AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的成很大程度上得益于蛋白質(zhì)數(shù)據(jù)庫(PDB)的長期數(shù)據(jù)積累。我方面,近年來在科研數(shù)據(jù)建設(shè)及共享方面也取得了顯著進展。全國已建成50多個國家級行業(yè)科技數(shù)據(jù)中心和200多個地方科技數(shù)據(jù)中心,形成覆蓋多領(lǐng)域的科學數(shù)據(jù)中心體系。、天文、電磁、流體、氣象、生命科學等領(lǐng)域已具備一規(guī)模的公開數(shù)據(jù)集。表1國外科研領(lǐng)域主要公開數(shù)據(jù)集(中國信通院根據(jù)公開資料收集整理)5科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式領(lǐng)域數(shù)據(jù)持有單位全球蛋白質(zhì)結(jié)構(gòu)庫(PDB)ProteinDataBank(wwPDB)人類基因庫(EMBL)洲分子生物學實驗室(EMBL)歐洲生物信息研究所(EBI瑞士生物信息研究所(SIB)生命科學蛋白質(zhì)數(shù)據(jù)庫(UniProt及美國國家生物醫(yī)學研究基金會(NBRF)成立的蛋白質(zhì)信息資源(PIR)DNA序列數(shù)據(jù)庫(Genbank)美國國家醫(yī)學圖書館生物信息技術(shù)信息中心(NCBI)DNA數(shù)據(jù)庫(DDBJ)日本國立遺傳學研究所PubMed)美國國家醫(yī)學圖書館生物信息技術(shù)信息中心(NCBI)高通量材料計算數(shù)據(jù)庫(AFLOW)美國杜克大學劍橋結(jié)構(gòu)數(shù)據(jù)庫(CSD)CCDC)

放量子材料數(shù)據(jù)庫(OQMD)美國西北大學無極晶體結(jié)構(gòu)數(shù)據(jù)庫(ICSD)德國波恩大學材料計算數(shù)據(jù)庫(MaterialsProject)美國加州伯克利大學材料科學金屬和合金晶體數(shù)據(jù)庫()加拿大渥太華大學國際衍射數(shù)據(jù)中心的粉晶數(shù)據(jù)庫(JCPDS)國際衍射數(shù)據(jù)中心開放晶體結(jié)構(gòu)數(shù)據(jù)庫(COD)英國劍橋大學密度泛函理論的材料數(shù)據(jù)集美國國家標準與技術(shù)研究院()(NIST)ERA5大氣再分析數(shù)據(jù)集歐中期天氣預(yù)報中心(ECMWF)海洋再分析數(shù)據(jù)集(HYCOM)海軍研究實驗室(NRL)地球科學海洋生物化學數(shù)據(jù)集美國航天局再分析數(shù)據(jù)法國麥卡托SST衛(wèi)星觀測數(shù)據(jù)英國氣象局ICAR-ENSO)氣候與應(yīng)用前沿研究院ICAR

地球表面氣候預(yù)測數(shù)據(jù)(EarthNet)/

國際自動機工程師學會汽車Shaet斯坦福大學AhmodyAerodynamics英偉達周期山(PH-RANS、)慕尼黑工業(yè)大學流體圓柱繞流數(shù)據(jù)集(CylinderinCrossflow)/6科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式頂蓋驅(qū)動方腔流動(CFDBench)/我國公開數(shù)據(jù)集建設(shè)不足,優(yōu)質(zhì)領(lǐng)域數(shù)據(jù)未能得到有效利用。一方面領(lǐng)域覆蓋度有限數(shù)據(jù)集建設(shè)不完善且質(zhì)量待提升。例如,盤古風烏伏羲等國內(nèi)氣象大模型的研發(fā)依賴國外公開數(shù)據(jù)集,而非國內(nèi)數(shù)據(jù)集。另一方面在科研與行業(yè)企業(yè)中已積累的大量領(lǐng)域數(shù)據(jù)公開意愿致大量的優(yōu)質(zhì)數(shù)據(jù)資源處于“靜默”狀態(tài)。我國需加強數(shù)據(jù)集建設(shè)與共享,推動科研智能產(chǎn)業(yè)高效發(fā)展。我國需建立自己的科研數(shù)據(jù)戰(zhàn)略,系統(tǒng)規(guī)劃科研領(lǐng)域數(shù)據(jù)建設(shè)計劃,推動以國家重點實驗室、重點行業(yè)企業(yè)為代表的機構(gòu),積極開放共享數(shù)據(jù)。一是圍繞公開數(shù)據(jù)集建設(shè)進行戰(zhàn)略布局。建立健全科研領(lǐng)域公開數(shù)據(jù)集體系,在時空、區(qū)域氣象等新興和特色領(lǐng)域進行系統(tǒng)布局。二是建立科研數(shù)據(jù)共享激勵機制,讓數(shù)據(jù)貢獻成為研究貢獻的一部分。通過合理的措施,鼓勵機構(gòu)以及個人將共享數(shù)據(jù),持續(xù)豐富公開數(shù)據(jù)集的資源。同時加強對數(shù)據(jù)的安全保護,避免濫用。三是構(gòu)建統(tǒng)一的科研數(shù)據(jù)空間,匯聚數(shù)據(jù)促進數(shù)據(jù)共享促進跨機構(gòu)、跨領(lǐng)域的數(shù)據(jù)整合與優(yōu)化,為科研工作者和技開發(fā)者提供更加便捷、高效的數(shù)據(jù)服務(wù)。(三)開發(fā)工具鏈—全鏈路打造科研智能開發(fā)工具從人工智能框架的構(gòu)建到算法的集成,再到開發(fā)套件與領(lǐng)域模型的推出,科研智能開具鏈的逐步完善,為科研人員提供了全流程支持。這些工不僅降低科研門檻,提高研發(fā)效率,還加速科研成果的轉(zhuǎn)化與應(yīng)用。通過持續(xù)優(yōu)化與創(chuàng)新,科研智能開發(fā)工具鏈7科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式正逐步成為推動該領(lǐng)域發(fā)展的核心引擎。1.AI框架—構(gòu)建核心架構(gòu),支撐高效算法實現(xiàn)AI框架是一組用于開發(fā)、訓練和部署人工智和接口,它提供了一個結(jié)構(gòu)化的環(huán)境,使發(fā)者能夠更加高效地構(gòu)建、測試和優(yōu)化AI算法和應(yīng)用,當前主流的AI框架主要有PaddlePaddl和MindSpore更有效地支持科研智能(AI4R&D傳統(tǒng)AI框架需要具備高效求解科學計算任務(wù)的基礎(chǔ)能力。一是支持科研智能算子庫,通過提供標準化接口和高度優(yōu)化共性數(shù)學運算單元,如高階微分、傅里葉變換、分數(shù)階微分、積分、線性代數(shù)、復數(shù)運算等科研智能專用算子,降低科研計算程序的復雜度。二是提供科研智能計算庫,通過實現(xiàn)跨領(lǐng)域共性基礎(chǔ)計算庫,如微分方程求解計算庫、幾何形狀定義計算庫、方程符號化定義計算庫、物理信息神經(jīng)網(wǎng)絡(luò)PINN求解方法計算庫等,提升跨學科多領(lǐng)域典型數(shù)理方程求解效率。三是面向科研智能的作業(yè)調(diào)度優(yōu)化,通過高階自動微分變換和編譯優(yōu)化技術(shù),實現(xiàn)異構(gòu)混合架構(gòu)靈活高效計算,整體提升科研計算任務(wù)計算速度。當前和已經(jīng)成為全球范圍最主流的AI框架?;趧討B(tài)計算圖且接口簡潔易用,適合科研探索的快速原型開發(fā)及頻繁迭代,在學術(shù)界廣受歡迎。具備強大的分布式計算能力和完善的工態(tài)系統(tǒng),當前在工業(yè)界廣泛應(yīng)用,支持成熟的部署解決方。兩者均提供科研智能算子庫、科研智能計算庫和科研智能計算此外谷歌推出的JAX框架具8科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式備自動矢量化和即時編譯等先進特性,計算性能出色,適用于科學計算和機器學習任務(wù),且支持高階自動微分,有利于科研智能領(lǐng)域的模型開發(fā)。國內(nèi)PaddlePaddle和MindSpore作為領(lǐng)先的人工智能框架,均將科研智能作為重點方向進行了配和優(yōu)化,目前已具備豐富的算子庫和高階自動微分等能力現(xiàn)有AI框架未能完全適配科智能需求。在大規(guī)模部署時運行效率相對較低,工業(yè)級部署支持相對較弱。缺少基礎(chǔ)算子體系算所需的高階自動微分功能可擴展性不足。JAX處于發(fā)展初期,尚未形成成熟生態(tài)。國內(nèi)框架對算子支持不完無法滿足科研智能發(fā)展的需求為推動科研智能的深入發(fā)展,AI框架需要兼容不同類型的國產(chǎn)化硬件資源GPUNPU等不同類型的AI芯片算解決方案同時分布式計算能力以支持大規(guī)模計算任務(wù)。二是支持跨領(lǐng)域算法和應(yīng)用??蚣軕?yīng)支持特定領(lǐng)域(如地球科學、材料科學等)的算法庫和開發(fā)工具,為各領(lǐng)域科研人員提供通用的開發(fā)和應(yīng)用環(huán)境,提靈活的接口和擴展能力,支持跨學科的協(xié)同研究及應(yīng)用。三富生態(tài)系統(tǒng)建設(shè)。擴展生態(tài)系統(tǒng),提供第三方庫和工具,以及融合已有科學計算領(lǐng)域的算法庫和工具,滿足更廣泛的科研需求。建設(shè)活躍的社區(qū),促進科研工作者交流分享,推創(chuàng)新和進步。9科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式2.算法庫—匯聚智慧結(jié)晶,賦能科研創(chuàng)新突破科研智能算法庫是指面向特定領(lǐng)域科學計算AI框架算庫注重易用性、性能及可拓展性,其核心價值主要體現(xiàn)在下兩方面:一是聚焦對領(lǐng)域單點問題的改進和固化。使用算庫中經(jīng)過優(yōu)化的算法,科研人員能夠更加高效地解決復雜科學計算二是強調(diào)提供最優(yōu)算法選擇。通過收錄該領(lǐng)域最頂尖的算法,強調(diào)提供最優(yōu)的算法選擇,為科研人員提供便捷、高效的工具,助力科研工作的深入開展。高校、研院所及企業(yè)紛紛推出面向多個各領(lǐng)域的科研智能算法庫。國外方面,布朗大學、麻省理工學院紛紛推出算法庫支持科研智能底層算法的實DeepXDE充分利用數(shù)據(jù)和物理知識雙驅(qū)動,解決傳統(tǒng)方法難以求解的復雜問題,支持物理信息神經(jīng)網(wǎng)絡(luò)(PINNDeepONet法深勢科江實驗室等研究機構(gòu)專注于算法庫分子動力學、量子力學、空氣動力學等特定領(lǐng)域的研究,解決該領(lǐng)域計算求解問DeePMD基于神經(jīng)網(wǎng)絡(luò)擬合第一原理數(shù)據(jù)的多體勢能表示和分子動力學深度學習DeepPotential(DP)系列模型可用于多體勢能表示和分子動力學模擬。表2國內(nèi)外典型科研智能法庫(中國信通院根據(jù)公開資料收集整理)算法庫介紹開發(fā)者DeePMD-kit深勢科技10科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式用于大規(guī)模原子及分子動力學模擬。DeePKS-kit基于機器學習對于低精度的DFT泛函進行優(yōu)化。支持DeePHF、DeePKS方法。北京科學智能研究院NeuralUQ神經(jīng)微分方程和運算符不確定性量化的確定性PINN(如貝葉斯PINN等),不確定性DeepONet等布朗學用于求解微分方程的深度學習算庫DeepXDE持多種數(shù)據(jù)驅(qū)動和物理信息融合的算法,包括PINN、DeepONet和PpONet等。布朗大學NeuralPDE基于物理信息神經(jīng)網(wǎng)絡(luò)(PNs)的偏微分方程求解的算法庫。使用人工神經(jīng)網(wǎng)絡(luò)進行科學計算和物理麻省理工學院、都靈大耐基梅隆大學等SCiANN信息約束PINN算法進行科學計算以及偏微分方程(PDE)的求解和發(fā)現(xiàn)。麻省理工學院我國在科研智能算法庫領(lǐng)域也面臨著原創(chuàng)不足等挑戰(zhàn)。我國在基礎(chǔ)理論創(chuàng)新方面存在不足神經(jīng)(PINN傅里葉神經(jīng)(FNO深度算子網(wǎng)絡(luò)(DeepONet典的底層算法多由國外研究機構(gòu)提出。我國算法庫的數(shù)量較少且影響力不足,國內(nèi)深勢科技、之江實驗室等機構(gòu)在特定領(lǐng)域(如分子動力學、量子力學、空氣動力學等)積極DeePMDNeuralUQ等算法庫,但與國際先進水平相比仍有明顯差距。因此,我國仍需進一步鼓勵算法原始創(chuàng)新,提升我國科研智算法庫的自主性和核心競爭力。3.開發(fā)套件—簡科研流程,推動智能化進程科研智能開發(fā)套是指針AI框架開發(fā)的端到端工具集。開發(fā)套件提供標準化接口和用戶界面,覆蓋模型開科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式發(fā)全流程,能夠快速用于解決科研問題。相較于科研智能算法庫,開發(fā)套件的產(chǎn)品化程度更高。一方面,開發(fā)套件通過全流程整合有效提升了科研效率??蒲腥藛T無需在多個工具間切換,使用開發(fā)套件可一站式完成數(shù)據(jù)處理、模型開發(fā)、評及部署等工作,縮短研發(fā)周期,加速成果產(chǎn)出。另一方面發(fā)套件降低了科研人員對計算機專業(yè)知識的依賴。開發(fā)套件供操作界面及案例資源,降低了非計算機背景科研人員的使用門檻??蒲腥藛T可以更加聚焦科研問題本身,無需花費大量時間精力在人工智能模型調(diào)參等技術(shù)環(huán)節(jié)。國內(nèi)外已形成一系列成熟的科研開發(fā)套件。國外方面,形成了相對活躍的開源社區(qū)生態(tài)。高校、研究機構(gòu)及企業(yè)以PyTorch為基礎(chǔ),貢獻了針對特定科學領(lǐng)域的開源套件,如英偉達推出用于流體仿真的Modulus和用于氣象預(yù)測Earth2Studio上述工具成熟度較高且已被廣泛應(yīng)用。國內(nèi)方面,形成了相對自給自足的生態(tài)系統(tǒng)。國內(nèi)開發(fā)套件通常由AI框架企業(yè)提供,如百度和華為基于自身AI框架能力,向各領(lǐng)域延伸形成工具套件覆蓋生物計算子計算、流體仿真、地球科學、電磁仿真、化學仿真等領(lǐng)域。表3我國代表性科學套件(中國信通院根據(jù)公開資料收集整理)領(lǐng)域套件名稱公司功能描述地球科學、材料科學、流體仿真PaddleScie百度基于飛槳深度學習框架的科學計算工具庫的物理模型和AI方法,支持流體力學、電磁學等領(lǐng)域的仿真與優(yōu)化。地球科學MindEarth華為支持短臨、長期天氣以及海12科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式洋領(lǐng)域的各類預(yù)報。流體仿真MindFlow華為支持航空航天、船舶制造以及能源電力等行業(yè)領(lǐng)域的AI流場模擬。支持數(shù)據(jù)建構(gòu)轉(zhuǎn)換、仿真計算、電磁仿真MindElec華為結(jié)果可視化以及端到端的AI電磁

仿。PaddleQuantum百度提供量子線路設(shè)現(xiàn)量子計算和量子經(jīng)典混合優(yōu)化等功能支持多種量子模擬器力量子計算研究與應(yīng)用開發(fā)。MindQuantum華為面向生物計算支持蛋白質(zhì)結(jié)構(gòu)預(yù)MindSPONGE華為測和分子動力學模擬物研發(fā)生物計算提供高效工具,加速新藥篩選和設(shè)PaddleHelix百度計過程。支持多體系(有機/無機/復合材料化學MindChemistry華為化學多尺度任務(wù)(微觀分子生成/預(yù)測、宏觀反應(yīng)優(yōu)化)的化學仿真。開發(fā)套件存在易用性低、功能覆蓋不全等問題。一是使用門檻仍舊較高,用戶需要具備較強的領(lǐng)域知識編程能力,進而限制了套件的廣泛使用。二是功能覆蓋不全面。一方面覆蓋場景有限,開發(fā)套件處于發(fā)展初期,往往針對具體科學問題設(shè)計,支持的場景較為有限。另一方面覆蓋環(huán)節(jié)不足,存在功能欠缺。如針對高溫合金材料研發(fā)的套件,僅提金成分設(shè)計與性能預(yù)測環(huán)節(jié),缺少特定工藝條件下的合金為模擬、疲勞壽命預(yù)測等能力,這會限制套件在實際工程項目的使用。三是標準化程度低,開發(fā)套件之間缺乏統(tǒng)13科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式一的接口和數(shù)據(jù)格式標準,增加了用戶遷移和比較的成本,不利于科研工作的連續(xù)性和數(shù)據(jù)共享。4.領(lǐng)域模型—AI融合知識,加速應(yīng)用踐落地領(lǐng)域的模型主要分為兩大類類是領(lǐng)域?qū)S媚P歪槍μ囟茖W問題設(shè)計和優(yōu)化;另一類是基于大語言模(LLM研模型利用自然語言處理能力輔助科研工作、完善自動化流程。產(chǎn)學界已經(jīng)研發(fā)出面向多個領(lǐng)域解決特定問題的專用模型。材料科學領(lǐng)域,AI技術(shù)結(jié)合高通量計算打破尺度和計算模擬限制,加速材料篩選靶向設(shè)計新材料,完成材料和器件的全鏈條優(yōu)化,為新能源、環(huán)境保護、信息技術(shù)等產(chǎn)業(yè)提供了強大的材料基礎(chǔ)。氣象領(lǐng)域,通過AI技術(shù)對大量氣象觀測和模擬數(shù)據(jù)進行分析識別復雜天氣預(yù)報精度與對臺風、暴雨等極端天氣事件的預(yù)測能力,輔助氣候變化研究。流體仿真領(lǐng)域,AI提升了復雜流體動力學問題的模擬和求解效率,對湍流、液體混合等復雜流體進行流動模擬優(yōu)化、實時仿真,廣泛應(yīng)用于航空航天汽車制造電磁仿真AI模型能夠快速模擬和優(yōu)化復雜電磁場分布,提升仿真和設(shè)計效率。以電磁兼容性分析為例AI能夠預(yù)測和識別潛在干擾優(yōu)化電確保電磁設(shè)備的性能和可靠生命AI模型能夠分析復雜的生物數(shù)據(jù),如蛋白質(zhì)結(jié)構(gòu)預(yù)測因組分析等,加速新藥發(fā)現(xiàn)和個性化醫(yī)療方案的制定,解傳統(tǒng)方法耗時長、成本高的問題。業(yè)內(nèi)典型領(lǐng)域?qū)I(yè)模型詳見附錄一。14科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式大語言模型為科研領(lǐng)域帶來新的輔助手段。大語言模型與科研相融合正在成為新方向,目前大語言模型主要應(yīng)用于科研助手和流程自動化??蒲兄址矫妫笳Z言模型結(jié)合領(lǐng)域知識,不僅可以提供研究假向供科研人員參考還可以作為科研知識助手,為科研人員提供即時的信息查詢和。流程自動化方面,大語言模型可以幫助提高實驗效率、減人為誤差,實現(xiàn)更精準、可重復的實驗管理。典型場景包括輔助決策和實驗設(shè)計、任務(wù)調(diào)度智能加速和實驗室管理等。大語言模型與領(lǐng)域?qū)I(yè)模型的深度融合正推動科研領(lǐng)域?qū)崿F(xiàn)重大突破。大型語言模型擅長發(fā)現(xiàn)并整理科學領(lǐng)域的難點問題,領(lǐng)域?qū)I(yè)模型則負責完成復雜的計算任務(wù),兩者結(jié)合可有效提升人機交互能力,加速科學研究的進程,有望在特定領(lǐng)域取得突破性進展。例如,卡耐基梅隆大學研發(fā)的AI系統(tǒng)Coscientist能夠自主完成從信息檢索到實驗執(zhí)行和數(shù)據(jù)分析的整個流程,該系統(tǒng)成功設(shè)計并合成了阿司匹林、對乙酰氨基酚和布洛芬等常見藥物分子。同時,Coscientist在不到四分鐘內(nèi)成功設(shè)計鈀催化交偶聯(lián)反應(yīng)的實驗方案,并成功復現(xiàn)了這一重要的復雜化學反該研究曾獲諾貝爾化學獎。三、科研智能應(yīng)用發(fā)展情況基礎(chǔ)科學研究領(lǐng)域技術(shù)的應(yīng)用促進了新理論算法的發(fā)現(xiàn)與驗證逐步拓科學研究的邊AI技術(shù)通過加速新藥研發(fā)、優(yōu)化材料篩選、提升工業(yè)設(shè)計效率等方式,提15科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式升產(chǎn)品研發(fā)效率為產(chǎn)業(yè)升級與變革提供強有力的技術(shù)支撐。(一)基礎(chǔ)科學研究—開展前沿探索,推動科學邊界拓展科研智能在基礎(chǔ)科學領(lǐng)域展現(xiàn)出闊的應(yīng)用前景。目前,國內(nèi)外高校和科研機構(gòu)都在積極探索AI與科學研究的深度融合過去5年,AI+科學研究的相關(guān)成果連續(xù)入《Science雜志評選的十大突破。AI賦能科學研究主要體現(xiàn)在以下四個方面:一是AI輔助科學文獻研究。科研人員借助AI能夠高效地分析和挖掘海量的科學文獻,提取關(guān)鍵信息,識別研究趨勢。例如,北京國際科技創(chuàng)新中心使用知網(wǎng)華知大模型打造了開放科學平臺,集成了知網(wǎng)智研助手、學術(shù)問答寫作三大AI工具方位的知識服務(wù)二是AI指導和加速科學實驗通過數(shù)據(jù)分析和機器學習AI能夠優(yōu)化實驗減少不必要的實驗次數(shù)顯著提高實驗效率。如DeepMind通過深度強化學習技術(shù)對托卡馬克等離子體進行精準磁控,將等離子體控制精度提升至65%,為核聚變研究帶來了重要突破。三是AI啟發(fā)新理論和算法發(fā)現(xiàn)。AI的模式識別和預(yù)測能力有助于科研人員發(fā)現(xiàn)新的科學規(guī)論。如物理學家利用神經(jīng)網(wǎng)絡(luò)發(fā)現(xiàn)了質(zhì)子中隱性內(nèi)含粲夸克的存在證據(jù),這一發(fā)現(xiàn)可能會引發(fā)量子色動力學理論的重大更新。四是AI優(yōu)化和加速科學計算。傳統(tǒng)數(shù)據(jù)海量數(shù)據(jù)時會遭遇“維度災(zāi)難”問題,AI技術(shù)可以提高復雜科學計算傳統(tǒng)方法難以處理的問DeepMind發(fā)布的AlphaFold3可預(yù)測地球所有生物分子結(jié)構(gòu),16科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式準確率比現(xiàn)有方法高50%,成為首個在生物分子結(jié)構(gòu)預(yù)測方面超越基于物理工具方法的AI系統(tǒng)。表42019年至2023年Science雜志評選的十大學突破20232022202120202019減肥藥GLP-1有望戰(zhàn)勝肥胖詹姆斯韋伯太空望遠鏡人工智測蛋白質(zhì)結(jié)新冠疫苗點亮希望之光人類歷史上首張黑洞照片問世抗體療法在減緩阿爾茨海默病方面取得進展發(fā)現(xiàn)可能導致多發(fā)性硬化的病毒抗新冠強效藥出現(xiàn)CRISPR首次成功治愈兩種遺傳性血液病與丹尼索瓦

人“面對面”尋找天然氫源的熱潮黑死病如何改變歐洲人基因的新見解迷幻藥物可治療創(chuàng)傷后應(yīng)激障礙“精英控制員”控制艾滋病病毒谷歌宣布實現(xiàn)“量子霸權(quán)”在全球機構(gòu)中系統(tǒng)性改變業(yè)早期科學家的待遇驚人的巨型細菌單克隆抗體治療傳染性疾病AI首次精準預(yù)測蛋白質(zhì)三維結(jié)構(gòu)腸道微生物對抗營養(yǎng)不良接近美洲遠古人類定居的歷史真相200萬年前環(huán)境DNA重現(xiàn)古老生態(tài)系統(tǒng)基因編輯工具CRISPR首次獲得臨床勝利科學家反對種族歧視,支持多樣性小行星撞擊地球及其帶來的影響體外胚胎培地球的碳泵正更易于耕種的養(yǎng)為早期發(fā)全球變暖趨勢最遙遠天體在減速運行多年生稻育研究打開加劇的特寫

新窗戶巨型黑洞合并產(chǎn)生的星際信號在無聲轟鳴人類首次行星防御實驗成功首次在土壤中提取到古人類DNA現(xiàn)快速射電來源“缺失環(huán)節(jié)”的微生物?AI輔助天氣RSV疫苗取得預(yù)報的發(fā)展突破進展“洞察”號首次揭示火星內(nèi)部結(jié)構(gòu)世界最古老狩獵場景面世第一次,有藥物可以治療大多數(shù)囊性纖維化病例抗擊瘧疾的新創(chuàng)造性人希望能的快速發(fā)粒子物理學的標準模型出現(xiàn)了“裂縫”首個室溫超導體面世埃博拉患者終于有了希望百億億次超級美國通過具有核聚變實現(xiàn)鳥類具有驚人AI戰(zhàn)勝多人

計算時代的來里程碑意義的歷史性突破的智力撲克17科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式臨氣候法(二)產(chǎn)業(yè)研發(fā)創(chuàng)新—構(gòu)建核心驅(qū)動力,加速產(chǎn)業(yè)升級變革科研智能在多個產(chǎn)業(yè)領(lǐng)域中取顯著成效。新藥研發(fā)領(lǐng)域,AI可加速藥物發(fā)現(xiàn)和研發(fā)過程如西安交通大學第一附屬醫(yī)院基于盤古藥物分子大模型超級抗菌藥肉桂酰菌素AI減少了人工對小分子化合物的篩選計算量,加快了藥物分子的篩選過程,突破了醫(yī)藥研發(fā)“雙十定律”的瓶頸,使先導藥的研發(fā)周期從數(shù)年縮短至數(shù)本降低約70%電池材料AI可輔助篩選和預(yù)測高能材料通過多尺度模擬預(yù)測材料性能,優(yōu)化實驗設(shè)計,提升實驗效率。如深勢科技在電解液材料研發(fā)領(lǐng)域,通過正向設(shè)計與篩選優(yōu)化的方法,有效提升金羽新能開發(fā)高能量密度電池電解液由原來的14個月縮短至6個月。航空航天仿真測試AI助力評估航空器設(shè)計方案的可行如中國商飛上海飛機設(shè)計研究院基于昇騰AI開發(fā)了業(yè)界首個三維超臨界機翼流體仿真大模“東方·翼精度模大飛機全場景飛行狀況時僅為原來的千分電磁仿真AI可實現(xiàn)高效手機電磁仿真如華為聯(lián)合東南大學打造了金陵·電磁腦基礎(chǔ)模型AI方法進行大規(guī)模陣列電磁仿真,將仿真效率平均提升10倍以上工業(yè)設(shè)計領(lǐng)域AI可提升設(shè)計效率并降低成本中國科學院沈陽自動化研究所與上汽大眾合作開發(fā)了“基于AI和知識圖譜的焊18科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式裝夾具智能設(shè)計軟件”過知識圖譜和生成式AI提升設(shè)計效率80%以上,設(shè)計成本降低至原來的一半,實現(xiàn)需求到制造的一站式交付服務(wù)。工業(yè)制造領(lǐng)域,AI可提升生產(chǎn)效率與產(chǎn)品質(zhì)量。如中冶京誠推出“鋼智通”專家系統(tǒng)通過大語言模型提智能決策進行生產(chǎn)流程優(yōu)化,能耗降低1%,廢品率降低0.,整體管控效率提升10%。四、科研智能生態(tài)建設(shè)情況隨著人工智能與科學研究、產(chǎn)業(yè)研發(fā)的深度融合,產(chǎn)業(yè)界與學術(shù)界也逐漸形成日益緊密的合作,逐步構(gòu)建起多元化產(chǎn)業(yè)生態(tài)體系,為科研智能的健康發(fā)展提供了有力支撐。(一產(chǎn)業(yè)組織中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)AIIA起成立“AI4S)工作組”搭建開放的交流合作平臺組織例征集、供需對接、報告編制等工作,后續(xù)會重點圍繞新材料、地球科學等重點領(lǐng)域開展工作。(二)社區(qū)建設(shè)華為在科研智能領(lǐng)域積極構(gòu)建了一系列業(yè)且富有活力的社區(qū),旨在推動AI技術(shù)的廣泛應(yīng)用與深入發(fā)展。MindFlowSIG社區(qū)專注于昇思MindFlow師及學生提供了高效易用的AI計算流體仿真套件。MindESIG社區(qū)聚焦于昇思MindEarth,為廣大用戶帶來高效便捷AI地球科學套件MindElecSIG社區(qū)緊密圍繞實際生產(chǎn)中的各類電磁應(yīng)用場景,在昇思MindSpore框架下積極19科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式探索和研究基于AI的電磁正問題及反問題,致力于開發(fā)高效精準的AI電磁模型。MindSPONGESIG充分利用昇思MindSpore的優(yōu)勢。聚焦AI計算師及學生提供高效易用的AI計算生物軟件。深勢科技的DeepModng開源社區(qū)提供開源的AIS-Square共創(chuàng)平算數(shù)據(jù)軟件模型和工作流的開發(fā)。百度飛槳河社區(qū)匯集豐富的AI原生應(yīng)用,提供零門檻的開發(fā)工具球科研人員的合山大學牽頭,北京航空航天大學、華為、百度等單位配合共同建設(shè)AI科學智算群智協(xié)作社區(qū),整合多方資源,建數(shù)據(jù)庫與課程,促開放協(xié)作,為科學智算發(fā)展助力。(三)科研賽事百度持續(xù)推出飛槳黑客松AI4S共創(chuàng)計劃灣區(qū)杯—百度賽道等科學智能賽事,聚焦AI4S前沿模型復現(xiàn),貢獻AI4S模型或案例50余個。深勢科技提供真實的科學場景和數(shù)據(jù)舉辦AI4SCup系列比賽。華為舉辦“開源之夏”賽事聚焦科研智能,推出基于圖像深度學習的無線電信號識別A與無線電技術(shù)融合培育科研智能創(chuàng)新人才。中山大學牽頭舉辦首屆“大灣區(qū)杯”粵港澳AI4S科技競賽北京航空航天浙江百度華為等單位整體協(xié)同,針對人工智能科學計算問題設(shè)置3個賽道與24個賽題,賽題涉及AI4S的通用范型算流體醫(yī)藥、分子、金融、社會、電磁、化學、交通等多個領(lǐng)域的典型應(yīng)用。和鯨科技舉辦數(shù)字醫(yī)療算法應(yīng)用創(chuàng)新大賽等500余場專業(yè)數(shù)據(jù)科學20科研智能(AI4R&D)—人工智能驅(qū)動的研發(fā)新范式競賽,覆蓋氣象、醫(yī)療等20余類行業(yè)。(四)會議交流北京科學智能研究院舉辦科學智能峰I4S基礎(chǔ)設(shè)施共建、典型應(yīng)用領(lǐng)域等話題進行深入探討。度聯(lián)合高校舉辦全國智能流體力學研討會等會議與高校師共同探索AI4S的未來“科學智算(AI4S)交叉與賦能”為主題的CCF秀湖會議在蘇州舉辦北京航空航天大學專家就多智能體科學智算模式進行學術(shù)報告,介紹了群體智能研究近期研究成果。首屆“人工智能科學計算學術(shù)研討會”上產(chǎn)學研各界對于人工智能推動科學計算劇變式創(chuàng)新的高度關(guān)注,通過匯聚全球人工智能科學計算領(lǐng)域的專家和先行者,打造科學智算支撐基礎(chǔ)科學探索和交叉前沿發(fā)現(xiàn)的新興社區(qū)生態(tài)。中國計算機大會CNCC2023舉辦的科學智算平臺技術(shù)前沿探討論壇會上北京航空航天大學、華為和百度等專家學者共同探討科學智算的最新研究方向及產(chǎn)業(yè)動向。(五)教學培訓深勢科技支持舉辦AI4S系列主題的哥倫布訓練營活動,提供20余門課程資源、2000余篇實訓案例等國內(nèi)外優(yōu)質(zhì)的AI4S教學資源百度飛槳星河社區(qū)集成豐富的AI課

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論