版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 全球人工智能基礎(chǔ)設施戰(zhàn)略與政策觀察 本報告主要包含以下內(nèi)容:第一部分探究了人工智能基礎(chǔ)設施的內(nèi)涵及范圍;第二部分梳理并總結(jié)全球主要國家及地區(qū)人工智能基礎(chǔ)設施發(fā)展戰(zhàn)略及特點;第三部分圍繞數(shù)據(jù)資源、算法框架、算力資源、開放平臺等人工智能基礎(chǔ)設施核心內(nèi)容進行了系統(tǒng)分析;第四部分對加快我國人工智能基礎(chǔ)設施發(fā)展提出了一些思考。一、人工智能基礎(chǔ)設施的內(nèi)涵及范圍“新型基礎(chǔ)設施”一詞自 2018 年底召開的中央經(jīng)濟工作會議以來備受關(guān)注。強調(diào),要“加強人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新型基礎(chǔ)設施建設”。此后,新型基礎(chǔ)設施這一詞被多次提及。例如,2019 年 12 月中央經(jīng)濟工作會議強調(diào)“加強戰(zhàn)略性、網(wǎng)絡型基礎(chǔ)設
2、施建設,穩(wěn)步推進通信網(wǎng)絡建設”;2020 年 2 月中央全面深化改革委員會第十二次會議強調(diào)“統(tǒng)籌存量和增量、傳統(tǒng)和新型基礎(chǔ)設施發(fā)展,打造集約高效、經(jīng)濟適用、智能綠色、安全可靠的現(xiàn)代化基礎(chǔ)設施體系”;2020 年 4 月召開的國務院常務會議強調(diào)“加快推進信息網(wǎng)絡等新型基礎(chǔ)設施建設”。當前,以人工智能、5G、云計算等為代表的新型基礎(chǔ)設施受到社會各界高度關(guān)注,發(fā)展意義重大。尤其在當前國內(nèi)外經(jīng)濟形勢嚴峻復雜、不穩(wěn)定性不確定性明顯上升、風險挑戰(zhàn)持續(xù)加大的背景下,發(fā)展新基建不僅成為我國穩(wěn)投資、促消費、穩(wěn)增長的有效手段,更是推動行業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵舉措,已成為數(shù)字經(jīng)濟創(chuàng)新發(fā)展的關(guān)鍵支撐??傮w而言,加快新型基
3、礎(chǔ)設施建設是助力我國實現(xiàn)經(jīng)濟高質(zhì)量發(fā)展的重要途徑之一,利當代、惠長遠。(一)何為“新型基礎(chǔ)設施”縱觀人類歷史發(fā)展進程,每一次重大科技變革和工業(yè)革命之際,都出現(xiàn)了一些全新的基礎(chǔ)設施?!靶滦突A(chǔ)設施”是科技進步與經(jīng)濟社會發(fā)展演進相互作用的產(chǎn)物。在第一次工業(yè)革命時期,出現(xiàn)了鐵路、運河等基礎(chǔ)設施;在第二次工業(yè)革命時期,出現(xiàn)了高速公路、電網(wǎng)等基礎(chǔ)設施;在第三次工業(yè)革命期間,發(fā)明了互聯(lián)網(wǎng)、移動通信網(wǎng)等信息基礎(chǔ)設施;當前正處于新一輪科技革命和產(chǎn)業(yè)變革發(fā)展浪潮中,正孕育著新型基礎(chǔ)設施的出現(xiàn)。首先,“基礎(chǔ)設施”是用于保證特定區(qū)域內(nèi)經(jīng)濟社會活動正常運轉(zhuǎn)的公共服務系統(tǒng),是社會賴以生存發(fā)展的一般物質(zhì)條件。廣義上看,基
4、礎(chǔ)設施主要包含三大類:一是經(jīng)濟性基礎(chǔ)設施,指直接參與、支持城市物資生產(chǎn)過程的基礎(chǔ)設施部門,包括交通運輸系統(tǒng)(市內(nèi)交通、對外交通等)、能源系統(tǒng)、信息系統(tǒng)(通信、郵政、廣電等)、水利工程、城市給排水系統(tǒng)、環(huán)境衛(wèi)生設施等,旨在提供經(jīng)濟性公共服務;二是社會性基礎(chǔ)設施,指提高城市福利水平、間接影響城市物資生產(chǎn)過程的基礎(chǔ)設施部門,包括文化教育、醫(yī)療衛(wèi)生、社會福利以及基礎(chǔ)研究等公共服務設施,旨在提供社會性公共服務;三是配套機構(gòu)和制度機制,包括法律法規(guī)、政策性文件、行政管理等?;A(chǔ)設施具備以下特征:一是基礎(chǔ)性,即對各行業(yè)的發(fā)展以及絕大多數(shù)經(jīng)濟活動的展開必不可少;二是先導性,即需要適度超前建設,為經(jīng)濟發(fā)展奠定堅
5、實基礎(chǔ);三是公共普惠性,即能夠形成社會化的服務,受眾廣;四是強外部性,即能夠為自身以及其他各行業(yè)發(fā)展賦能增效。其次,“新型”是基于新一代科學技術(shù)產(chǎn)生的基礎(chǔ)設施新形態(tài)?!靶滦汀笔窍鄬鹘y(tǒng)基礎(chǔ)設施而言的,隨著科學技術(shù)不斷演進、創(chuàng)新,基礎(chǔ)設施形態(tài)也在不斷更新變化。如當前的新基建概念側(cè)重于以數(shù)字化、網(wǎng)絡化、智能化為核心特征,基于人工智能、5G、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、云計算等新一代信息技術(shù)發(fā)展而形成的基礎(chǔ)設施。根據(jù)國家發(fā)展和改革委界定,“新型基礎(chǔ)設施”是以新發(fā)展理念為引領(lǐng),以技術(shù)創(chuàng)新為驅(qū)動,以信息網(wǎng)絡為基礎(chǔ),面向高質(zhì)量發(fā)展需要,提供數(shù)字轉(zhuǎn)型、智能升級、融合創(chuàng)新等服務的基礎(chǔ)設施體系。從分類看,新型基礎(chǔ)設施分
6、為信息基礎(chǔ)設施、融合基礎(chǔ)設施、創(chuàng)新基礎(chǔ)設施三類。信息基礎(chǔ)設施是整個新型基礎(chǔ)設施的核心,包含通信網(wǎng)絡基礎(chǔ)設施、新技術(shù)基礎(chǔ)設施、算力基礎(chǔ)設施。融合基礎(chǔ)設施是傳統(tǒng)基礎(chǔ)設施轉(zhuǎn)型升級的重要支撐,是新一代信息基礎(chǔ)設施在各行業(yè)深度融合的產(chǎn)物。創(chuàng)新基礎(chǔ)設施是指支撐科學研究、技術(shù)開發(fā)、產(chǎn)品研制等具有公共屬性的基礎(chǔ)設施,如重大科技基礎(chǔ)設施、科教基礎(chǔ)設施、產(chǎn)業(yè)技術(shù)創(chuàng)新基礎(chǔ)設施等。人工智能基礎(chǔ)設施是以信息基礎(chǔ)設施為主要形態(tài),同時兼具融合基礎(chǔ)設施以及創(chuàng)新基礎(chǔ)設施部分特點的新型基礎(chǔ)設施。(二)何為“人工智能基礎(chǔ)設施”未來十年是全球發(fā)展數(shù)字經(jīng)濟、邁入智能社會的黃金發(fā)展期。著力發(fā)展人工智能基礎(chǔ)設施,將為我國人工智能產(chǎn)業(yè)發(fā)展壯
7、大、數(shù)字經(jīng)濟蓬勃發(fā)展提供強大牽引力。從推動人工智能產(chǎn)業(yè)發(fā)展看,人工智能基礎(chǔ)設施將推動人工智能與 5G、云計算、大數(shù)據(jù)等領(lǐng)域深度耦合,有效推動技術(shù)資源向創(chuàng)新領(lǐng)域集聚,加快轉(zhuǎn)變發(fā)展方式、拓展發(fā)展空間、增強發(fā)展動力,助力實現(xiàn)智能產(chǎn)業(yè)化與產(chǎn)業(yè)智能化協(xié)同并進。從推進國家戰(zhàn)略轉(zhuǎn)型看,發(fā)展人工智能基礎(chǔ)設施,將促進社會資源的高效利用,為我國構(gòu)建“國內(nèi)國際雙循環(huán)”的新發(fā)展格局提供重要支撐,為全球經(jīng)濟可持續(xù)發(fā)展注入強大動能。報告認為,人工智能基礎(chǔ)設施(AI 基礎(chǔ)設施)是以“高質(zhì)量網(wǎng)絡”為關(guān)鍵支撐,“數(shù)據(jù)、算法、算力”為核心能力要素,以“開放平臺”為主要賦能載體,能夠長期提供公共普惠的智能化服務的基礎(chǔ)設施。AI 基
8、礎(chǔ)設施將有力促進 AI 產(chǎn)業(yè)發(fā)展,深入賦能行業(yè)應用,為培育數(shù)字經(jīng)濟、構(gòu)筑智能社會提供關(guān)鍵承載。從主要特征看,AI 基礎(chǔ)設施既需要滿足兩大類(包括 8 小項)新型基礎(chǔ)設施的基本屬性,即“基礎(chǔ)及公共性”(包括基礎(chǔ)性、公共普惠性、強外部性)和“技術(shù)先進性”(包括技術(shù)迭代快、軟硬兼?zhèn)洹?shù)據(jù)驅(qū)動、協(xié)同融合、價值賦能),同時還需具備 2 項重要特征,即“賦能智能化行業(yè)應用”和“支撐人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展”,如圖 1.1 所示。從核心內(nèi)容看,人工智能基礎(chǔ)設施主要包含兩部分內(nèi)容:一是以算力資源、數(shù)據(jù)資源、算法框架為核心的 AI 能力要素,二是以服務醫(yī)療、交通、制造等各垂直行業(yè)智能化應用的 AI 開放平臺。圖
9、1.2 為AI 基礎(chǔ)設施體系視圖?!皵?shù)據(jù)、算法、算力、開放平臺”是構(gòu)成 AI 新基建的核心內(nèi)容。一是數(shù)據(jù)資源,包括以政府、企業(yè)、高校、開源社區(qū)等為主體構(gòu)建的開放數(shù)據(jù)集(包括行業(yè)專用的開放數(shù)據(jù)集),能夠為 AI 算法提供數(shù)據(jù)供給,加速 AI 模型優(yōu)化,提高 AI 平臺的行業(yè)賦能水平。二是算法框架,既包括傳統(tǒng)機器學習算法、知識圖譜等,也包括開源算法框架、深度學習開發(fā)框架、AI 算法部署工具、開源代碼庫等,能夠充分整合AI 算法及工具集資源,對外輸出智能化技術(shù)能力。三是算力資源,包括 AI 芯片、AI 云、智能計算中心等產(chǎn)品及服務形態(tài),其能夠為 AI 算法及應用提供更高性能、更低成本的計算能力。四是
10、 AI 開放平臺,包括自動駕駛 AI 平臺、城市大腦 AI 平臺、醫(yī)療影像 AI 平臺、智能語音 AI 平臺等賦能各行業(yè)應用的 AI 開放平臺,向下能夠引導數(shù)據(jù)、算法、算力等能力要素的演進路徑,向上可以面向各垂直行業(yè)提供開放、普惠的智能化服務,具有承上啟下的重要作用?!熬W(wǎng)絡連接、安全保障”是支撐 AI 新基建發(fā)展的基礎(chǔ)承載。網(wǎng)絡連接包括 5G、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、光纖固網(wǎng)在內(nèi)的網(wǎng)絡設施,為 AI基礎(chǔ)設施發(fā)展提供互聯(lián)互通服務。安全保障則涵蓋網(wǎng)絡、數(shù)據(jù)、應用、終端等各方面安全能力。“戰(zhàn)略布局、發(fā)展政策、監(jiān)管治理”為 AI 基礎(chǔ)設施發(fā)展提供良好的環(huán)境保障。戰(zhàn)略布局包括發(fā)展目標制定、發(fā)展重點謀劃等,為 A
11、I新基建規(guī)劃布局提供方向指引。發(fā)展政策包括創(chuàng)新政策、產(chǎn)業(yè)政策、人才政策、財稅政策等,為 AI 新基建提供完善的政策保障。監(jiān)管治理則包括倫理引導、標準制定、規(guī)范立法等,涵蓋數(shù)據(jù)治理、算法治理、平臺治理等多方面,為 AI 新基建營造健康有序的發(fā)展環(huán)境。AI 新基建遵循著“從通用技術(shù)工具到開放賦能平臺”的演進邏輯。當前,部分 AI 理論技術(shù)逐漸成熟,正在演進成為開放普惠的 AI賦能平臺,AI 既能作為一項通用技術(shù)為企業(yè)信息化賦能,又能作為一類基礎(chǔ)設施為社會提供智能化服務能力。總體而言,AI 應用賦能的深度、廣度不斷加強,呈現(xiàn)出深度融合、智能泛化的發(fā)展態(tài)勢。二、人工智能基礎(chǔ)設施全球戰(zhàn)略布局人工智能作為
12、引領(lǐng)社會智能化變革的新型基礎(chǔ)設施,正在對各國科技創(chuàng)新、經(jīng)濟發(fā)展、民生改善等產(chǎn)生重大而深遠的影響,加快發(fā)展AI 基礎(chǔ)設施已成全球主要國家的普遍共識。(一)全球人工智能基礎(chǔ)設施戰(zhàn)略圖景為更直觀地了解全球主要國家及地區(qū)在 AI 基礎(chǔ)設施方面的整體發(fā)展情況,報告重點梳理了 12 個國家及地區(qū)所發(fā)布的部分 AI 基礎(chǔ)設施相關(guān)戰(zhàn)略文件,利用詞頻統(tǒng)計法對各國在 AI 基礎(chǔ)設施的 7 個細分領(lǐng)域布局情況做了統(tǒng)計分析(藍色越深,表示該細分領(lǐng)域在文件中被提及的次數(shù)越多,如深藍色表示被提及 5 次以上),如圖 2.1 所示。從發(fā)展梯隊看,被統(tǒng)計的國家及地區(qū)分為兩級發(fā)展梯隊,中國處于第一梯隊。在被統(tǒng)計的 12 個國家
13、及地區(qū)中,美國、歐盟、德國、英國、日本、韓國等出臺的 AI 戰(zhàn)略及政策文件較多,對 AI 基礎(chǔ)設施各細分領(lǐng)域布局更加全面,同時這幾個國家及地區(qū)的 AI 整體發(fā)展水平相對較高,處于全球發(fā)展第一梯隊。法國、挪威、芬蘭、丹麥、俄羅斯、印度等國家發(fā)布的 AI 戰(zhàn)略文件較少,在 AI 基礎(chǔ)設施各細分領(lǐng)域布局較為單一,與第一梯隊國家存在一定差距,處于第二梯隊。從布局重點看,以“數(shù)據(jù)、算法、算力、平臺”等為核心的 AI設施資源備受重視。在被統(tǒng)計的 7 項 AI 基礎(chǔ)設施主要細分領(lǐng)域中,公共數(shù)據(jù)集、計算平臺、算法框架、開放平臺、基礎(chǔ)網(wǎng)絡等 5 項被多次提及,且具備基礎(chǔ)性、公共普惠性、強外部性等特點,是 AI
14、基礎(chǔ)設施發(fā)展重點。從主要國家及地區(qū)發(fā)展思路看,美國、歐盟、英國等根據(jù)本國發(fā)展情況進行精準化布局。美國重點布局公共數(shù)據(jù)集,打造開放數(shù)據(jù)資源是美國政府長期發(fā)展重點。一方面建立服務于不同應用領(lǐng)域的數(shù)據(jù)集,另一方面研發(fā)數(shù)據(jù)處理相關(guān)工具,降低數(shù)據(jù)使用門檻,為 AI 技術(shù)研發(fā)及應用構(gòu)建高質(zhì)量、可共享的數(shù)據(jù)使用環(huán)境。如美國在其國家人工智能研究和發(fā)展戰(zhàn)略計劃中,提出將“開發(fā)用于人工智能訓練及測試的公共數(shù)據(jù)集和環(huán)境”。2019 年 2 月,特朗普簽署行政命令,啟動美國人工智能行動計劃倡議,重點包括“加強人工智能研發(fā)投資、聯(lián)邦政府數(shù)據(jù)和計算資源開放”等。在 AI 算法、算力方面,美國科技企業(yè)(如谷歌、微軟、亞馬遜
15、、臉書等)在該領(lǐng)域具備極強的技術(shù)、產(chǎn)品、市場等優(yōu)勢,因此僅依靠市場力量即可引領(lǐng)全球發(fā)展,無需政府層面提供過多政策指導。歐盟圍繞公共數(shù)據(jù)集、AI 算力、開放平臺等基礎(chǔ)設施進行較為全面的布局,旨在為歐洲所有用戶提供一個開放的綜合性 AI 平臺,包括計算能力(云計算、高性能計算等)、公共數(shù)據(jù)集、算法資源等。原因在于,歐盟(及其他非歐盟歐洲國家)AI 整體發(fā)展水平落后于美國,在 AI 領(lǐng)域缺少行業(yè)領(lǐng)軍企業(yè)。歐盟作為歐洲政治經(jīng)濟聯(lián)盟以及統(tǒng)一戰(zhàn)略主體,有義務為其成員國構(gòu)建開放、普惠、高質(zhì)量的 AI 基礎(chǔ)設施及智能化服務,加快歐洲 AI 發(fā)展步伐。如 2019 年 1 月,歐盟啟動“AI FOR EU”項目
16、,建立人工智能需求平臺、開放協(xié)作平臺,整合匯聚 21 個成員國 79 家研發(fā)機構(gòu)、中小企業(yè)和大型企業(yè)的數(shù)據(jù)、算力、算法等人工智能資源,提供統(tǒng)一開放服務。歐盟通過“地平線2020”計劃和歐洲戰(zhàn)略投資基金等,建立基礎(chǔ)研究及創(chuàng)新框架,打造世界級人工智能研究中心。此外,歐盟著力維護良好的數(shù)據(jù)使用環(huán)境,如歐委會在 2020 年 11 月通過了歐洲數(shù)據(jù)治理條例倡議,推動數(shù)據(jù)跨國、跨部門流通共享,為歐盟民眾及企業(yè)帶來數(shù)據(jù)紅利。英國重點發(fā)展公共數(shù)據(jù)集、寬帶網(wǎng)絡等基礎(chǔ)設施,著力“強長板與補短板”協(xié)同,全面提升國家數(shù)字連接能力。一方面,英國在政府公共數(shù)據(jù)集建設方面全球領(lǐng)先,需持續(xù)鞏固優(yōu)勢,為 AI 基建發(fā)展奠定堅
17、實的數(shù)據(jù)保障。另一方面,泛在高速的通信網(wǎng)絡是發(fā)展 AI 的重要基礎(chǔ)支撐,但英國寬帶網(wǎng)絡基建水平相對落后,因此選擇優(yōu)先升級其光纖固網(wǎng)、4G/5G 等網(wǎng)絡基礎(chǔ)設施,加緊補齊“基建短板”,為 AI長遠發(fā)展打好基礎(chǔ)。如英國政府在 2017 年發(fā)布的產(chǎn)業(yè)戰(zhàn)略:建設適應未來的英國中,確立了人工智能發(fā)展的幾個優(yōu)先領(lǐng)域,包括“建設全球 AI 與數(shù)據(jù)創(chuàng)新中心,支持各行業(yè)利用 AI 和數(shù)據(jù)分析技術(shù),在數(shù)據(jù)和人工智能安全等方面保持世界領(lǐng)先”等,同時強調(diào)將升級寬帶網(wǎng)絡等通信基礎(chǔ)設施。此外,英國對構(gòu)建基礎(chǔ)設施體系有著長遠和系統(tǒng)的規(guī)劃布局,如發(fā)布智能基礎(chǔ)設施愿景系列報告,詳細制定了到 2055 年的分階段目標任務。(二)
18、我國積極推動人工智能基礎(chǔ)設施發(fā)展黨中央、國務院高度重視 AI 基礎(chǔ)設施發(fā)展,強調(diào)要“加快傳統(tǒng)基礎(chǔ)設施和 5G、人工智能等新型基礎(chǔ)設施建設”“深入把握新一代人工智能發(fā)展的特點,加強人工智能和產(chǎn)業(yè)發(fā)展融合,為高質(zhì)量發(fā)展提供新動能”。目前,我國已形成國家、地方、企業(yè)三個層面協(xié)同推進的發(fā)展態(tài)勢。一是國家層面統(tǒng)籌布局,給予方向指引。2017 年,國務院印發(fā)新一代人工智能發(fā)展規(guī)劃,對包括網(wǎng)絡、大數(shù)據(jù)、高效能計算等基礎(chǔ)設施在內(nèi)的智能化基礎(chǔ)設施建設進行了全面部署,指明了發(fā)展方向。2017 年,工信部發(fā)布促進新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(20182020 年),提出加快構(gòu)筑智能化基礎(chǔ)設施,搭建包括數(shù)據(jù)資源
19、庫、云服務平臺、智能化網(wǎng)絡基礎(chǔ)設施在內(nèi)的人工智能產(chǎn)業(yè)支撐體系。此外,工信部鼓勵人工智能創(chuàng)新應用先導區(qū)建設,加速 AI 基礎(chǔ)設施及相關(guān)產(chǎn)業(yè)高質(zhì)量發(fā)展。二是地方政府積極布局,優(yōu)化發(fā)展環(huán)境。自 2017 年以來,超過 20 個省市結(jié)合國家發(fā)展規(guī)劃和自身發(fā)展實際,相繼出臺了本省市人工智能相關(guān)政策,支持人工智能創(chuàng)新發(fā)展以及基礎(chǔ)設施建設。如2020 年 4 月,上海市發(fā)布上海市推進新型基礎(chǔ)設施建設行動方案(20202022 年),提出打造亞太一流的超大規(guī)模人工智能計算與賦能平臺。2020 年 6 月,北京市發(fā)布北京市加快新型基礎(chǔ)設施建設行動方案(20202022 年),面向數(shù)據(jù)智能、生態(tài)系統(tǒng)、智慧應用等六
20、大基礎(chǔ)設施建設領(lǐng)域,實施 30 個重點任務。2020 年 7 月,廣州市發(fā)布廣州市加快推進數(shù)字新基建發(fā)展三年行動計劃(20202022年),提出開展人工智能跨界融合行動,構(gòu)建全球頂尖的“創(chuàng)新型智慧城市”。三是科技企業(yè)紛紛響應,加快創(chuàng)新技術(shù)探索。在科技部指導下,百度、阿里、騰訊、科大訊飛、商湯科技等 15 家科技企業(yè)發(fā)揮自身創(chuàng)新優(yōu)勢,聚焦重點細分領(lǐng)域,打造國家新一代人工智能開放創(chuàng)新平臺,推動我國人工智能技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展。三、人工智能基礎(chǔ)設施發(fā)展態(tài)勢剖析人工智能基礎(chǔ)設施包括數(shù)據(jù)資源、算法框架、算力資源等 AI 能力要素,以及作為智能服務輸出載體的 AI 開放平臺。(一)數(shù)據(jù)資源逐步實現(xiàn)開放共享1
21、、開放數(shù)據(jù)集的概念及價值開放數(shù)據(jù)集是驅(qū)動本輪 AI 浪潮興起的三大基礎(chǔ)要素之一。AI 模型和算法的訓練優(yōu)化需要以海量優(yōu)質(zhì)的數(shù)據(jù)集作為基礎(chǔ)資源。數(shù)據(jù)集的數(shù)量、質(zhì)量、安全直接影響 AI 算法的準確性、有效性和安全性。AI 開放數(shù)據(jù)集是指能夠滿足 AI 研發(fā)需求、具有公共普惠性的數(shù)據(jù)集。從概念定義看,開放數(shù)據(jù)集是指“免費獲取、機器可讀、使用目的不限”的數(shù)據(jù)集?!伴_放數(shù)據(jù)集”一詞最初由科學家們用來指代未經(jīng)處理的科學數(shù)據(jù)集。隨后,一些國際組織和相關(guān)學者對其進行了概念界定,如開放知識基金會將其定義為“可以免費獲得的數(shù)據(jù)集,任何人都可以獲取,并且可以用于任何目的(科研、商業(yè)、公益事業(yè)等),意味著數(shù)據(jù)集需要在
22、開放許可的條件下,以機器可讀的格式在線提供”。因此,開放數(shù)據(jù)集主要具備四點特征:一是開放許可,即必須在公共領(lǐng)域下提供,沒有版權(quán)、專利等其他機制限制;二是可獲取,即可以提供互聯(lián)網(wǎng)免費下載的途徑;三是機器可讀,必須以機器可處理和修改的形式提供;四是開放格式,未對數(shù)據(jù)利用設限(如付費)。開放數(shù)據(jù)集具備公共與商業(yè)的雙重價值屬性。從公共價值角度,開放數(shù)據(jù)集能夠用于提供惠普性公共服務(如天氣預測、醫(yī)療信息等),助力提升社會智能化水平。從商業(yè)價值角度,開放數(shù)據(jù)集能夠降低企業(yè) AI 開發(fā)成本,促進 AI 技術(shù)創(chuàng)新發(fā)展,帶動傳統(tǒng)企業(yè)智能化轉(zhuǎn)型升級,催生基于 AI 開源的新業(yè)態(tài)新模式。從發(fā)布主體看,AI 開放數(shù)據(jù)
23、集呈現(xiàn)出發(fā)布主體多元、各具優(yōu)勢特色的特點。AI 開放數(shù)據(jù)集的發(fā)布主體包括各國政府、高校及研究機構(gòu)、企業(yè)、開源社區(qū)等,如圖 3.1 所示。整體看,政府開放數(shù)據(jù)集的覆蓋范圍較廣,數(shù)據(jù)質(zhì)量較高、安全性及增值性強,可用于商業(yè)、科研等目的,可間接服務于 AI 軟件及產(chǎn)品開發(fā)(如美國 GPS 數(shù)據(jù)服務于谷歌地圖,可間接應用于谷歌無人駕駛研究)。高校/科研院所以及企業(yè)開放數(shù)據(jù)集的覆蓋范圍基本涵蓋 AI 大部分研究領(lǐng)域,質(zhì)量較高、權(quán)威性較強(很多被作為學術(shù)會議及競賽的數(shù)據(jù)基準集),但一般應用于學術(shù)研究而非商業(yè)開發(fā),并且更新周期較長。開源社區(qū)數(shù)據(jù)集的范圍主要集中在 AI 研究熱點領(lǐng)域,其獨特優(yōu)點是公眾可以自由地
24、使用和分享,數(shù)據(jù)迭代更新較快,但其安全性以及質(zhì)量相對較差,較適用于 AI 模型算法的初期訓練。一是政府開放數(shù)據(jù)集:全球多國高度重視,美、英等起步早、發(fā)展成熟,我國政府數(shù)據(jù)開放程度有待進一步提升。政府開放數(shù)據(jù)是由政府或政府控制的實體生成或委托的數(shù)據(jù),任何人都可以自由、不受限地使用、重用、重新分配,能夠激發(fā)社會創(chuàng)新活力,創(chuàng)造巨大公共價值。2009 年,時任美國總統(tǒng)奧巴馬簽署開放政府指令,建立起全球第一個國家級政府開放數(shù)據(jù)網(wǎng)站“D”,開啟全球數(shù)據(jù)開放浪潮。2011 年 9 月,美、英、墨等 8 國發(fā)起成立“開放數(shù)據(jù)聯(lián)盟”,目前成員國已超過 100 個。英國是政府數(shù)據(jù)開源建設模式的提出者
25、和實踐者。從建設模式看,英國首創(chuàng)“社會開放協(xié)作、分布式治理”的開源建設模式,基于CKAN1開源系統(tǒng),構(gòu)建起全國數(shù)據(jù)互聯(lián)、服務互通的統(tǒng)一數(shù)據(jù)門戶。國家級中心平臺不直接負責數(shù)據(jù)管理,而是制定標準并免費提供通用開發(fā)工具,幫助各地方及分支機構(gòu)自建符合標準的開放數(shù)據(jù)平臺。從管理模式看,由時任首相主持建設工作,由內(nèi)閣辦公廳直接負責具體事務,確保建設的權(quán)威與高效。美國是政府開放數(shù)據(jù)的開創(chuàng)者,對充分釋放數(shù)據(jù)價值潛力有著豐富實踐經(jīng)驗。從建設模式看,相比英國“自上而下、由點及面”的建設模式,美國則是聯(lián)邦政府和地方政府同步探索構(gòu)建,允許地方“先試先行”,呈現(xiàn)出各地“多點開花”的態(tài)勢,并最終形成了“國家平臺使用 CK
26、AN,地方平臺采用多種開源系統(tǒng),每天自動完成數(shù)據(jù)匯集更新”的模式。從管理模式看,美國十分重視對數(shù)據(jù)權(quán)益的保護,制定多項與數(shù)據(jù)開放有關(guān)的技術(shù)標準以及法律法規(guī),如 2014 年發(fā)布數(shù)字問責和透明法;2015 年發(fā)布開放政府數(shù)據(jù)法案;2019 年發(fā)布美國 AI 領(lǐng)導力:聯(lián)邦參與制定技術(shù)標準和相關(guān)工具的計劃等。從數(shù)據(jù)價值釋放看,美國對如何釋放開放數(shù)據(jù)公共價值以及商業(yè)價值有著豐富的實踐經(jīng)驗,如美國交通部利用收集到的航空投訴數(shù)據(jù),開發(fā)出對航空公司公眾評價進行等級排名的程序,便于消費者選擇更優(yōu)質(zhì)量的航空公司;The Climate 公司利用政府發(fā)布的氣象大數(shù)據(jù),為消費者提供智能化制定保險服務;iTriage
27、 公司利用公共醫(yī)療健康大數(shù)據(jù),迅速為患者制定出治療解決方案。我國逐漸重視政府開放數(shù)據(jù)建設,當前處于發(fā)展初期,仍需不斷探索實踐。我國按照“頂層設計規(guī)劃、地方平臺建設”的發(fā)展思路,協(xié)同布局、統(tǒng)籌推進政府開放數(shù)據(jù)建設。政府數(shù)據(jù)開放目前已納入國家大數(shù)據(jù)戰(zhàn)略,截至 2019 年底,全國已有超過 100 個地方政府開放數(shù)據(jù)平臺上線,但還存在開放資源建設不足、數(shù)據(jù)利用不充分、數(shù)據(jù)獲取不便捷等問題亟需解決。二是高校開放數(shù)據(jù)集:其質(zhì)量與高校的研究實力及學科建設水平高度相關(guān)。高校在開放數(shù)據(jù)集上的建設水平能夠反映出其在 AI、計算機科學、大數(shù)據(jù)等相關(guān)學科的研究實力。根據(jù) Python 開發(fā)者社區(qū)調(diào)查顯示,在被統(tǒng)計的
28、 39 個用戶反映最好用的 AI 開放數(shù)據(jù)集中,高校開放數(shù)據(jù)集占比達 36%,這其中有近 90%被美國高校占據(jù)(如斯坦福大學、加州大學伯克利分校等名校)。我國高校數(shù)據(jù)集建設穩(wěn)步推進,如清華大學發(fā)布的中文自然文本數(shù)據(jù)集 CTW、語音庫 THCHS-30;香港中文大學發(fā)布的人臉數(shù)據(jù)集 CalebA;中科院自動化所發(fā)布的計算機視覺數(shù)據(jù)集 MALF dataset 等,在國內(nèi)有一定知名度,但國際影響力較弱,這從一定程度上反映出我國在 AI 相關(guān)領(lǐng)域的研究實力仍有較大提升空間。三是企業(yè)開放數(shù)據(jù)集:為企業(yè) AI 產(chǎn)品及服務盈利提供“入口”。相比政府、高校等開放數(shù)據(jù)集公益屬性強的特點,企業(yè)建設開放數(shù)據(jù)集更多
29、以商業(yè)利益為導向,為其開源生態(tài)建設以及 AI 全產(chǎn)品鏈盈利提供重要“入口”。一方面,科技企業(yè)通過建設開放數(shù)據(jù)集能夠為其積累技術(shù)、人才等核心資源,助力培育 AI 開源生態(tài)體系。例如微軟在 2018 年收購知名開源社區(qū) GitHub 后,通過該平臺陸續(xù)發(fā)布開源數(shù)據(jù)集,吸引并獲得了一個擁有超過 3000 萬開發(fā)者的社區(qū),為其開源開發(fā)及研究積累了人才資源。另一方面,企業(yè)能夠以開放數(shù)據(jù)集為基礎(chǔ)構(gòu)建起完整的 AI 產(chǎn)品鏈,形成用戶壟斷、提供高增值服務。如谷歌依托其豐富的數(shù)據(jù)集和強大的開源工具能力,不斷在居家生活、辦公、出行等各領(lǐng)域?qū)ふ覒脠鼍?,迅速擴張用戶數(shù)量、提高用戶粘性;亞馬遜利用其數(shù)據(jù)集提升其 AI
30、 產(chǎn)品智能化水平,鞏固其產(chǎn)品生態(tài)優(yōu)勢;百度以 AI 開放數(shù)據(jù)集等開源服務為切入點,培養(yǎng)用戶使用習慣,引導用戶向其增值服務拓展消費,例如百度大腦能夠提供部分免費的數(shù)據(jù)集、算法、算力等基礎(chǔ)服務,但若需要其提供更強性能算力、解決方案定制等增值服務,則需要額外收費。目前,我國企業(yè)已逐漸重視并著手構(gòu)建以開放數(shù)據(jù)集為基礎(chǔ)的AI開放開源生態(tài),但在數(shù)量、范圍以及用戶規(guī)模等方面與谷歌、亞馬遜、微軟等科技巨頭仍存在差距。我國企業(yè)應利用好國內(nèi)超大規(guī)模市場優(yōu)勢,持續(xù)做好技術(shù)積累,擴大國內(nèi)外影響力。四是開源社區(qū)開放數(shù)據(jù)集:具備“匯眾智、聚眾力”等突出特點。開源社區(qū)主要包括“協(xié)同開發(fā)社區(qū)”以及“知識分享社區(qū)”兩類,開放數(shù)
31、據(jù)集的主要貢獻者是前者。開源社區(qū)開放數(shù)據(jù)集的優(yōu)勢明顯:一是大眾自由參與,公眾能夠較為自由地使用和貢獻數(shù)據(jù)集;二是數(shù)據(jù)較為全面,自下而上的數(shù)據(jù)收集能夠提升數(shù)據(jù)覆蓋領(lǐng)域的全面性;三是時效性較強,能夠緊跟當前熱點研究領(lǐng)域進行更新補充。但開源社區(qū)數(shù)據(jù)集也存在數(shù)據(jù)質(zhì)量參差不齊、數(shù)據(jù)重復嚴重、數(shù)據(jù)安全性較差等問題。從發(fā)展態(tài)勢看,目前 AI 巨頭企業(yè)正通過收購開源社區(qū)等方式,強化其 AI 生態(tài)壟斷地位。如谷歌、微軟等企業(yè)正在通過收購Kaggle、GitHub 等開源社區(qū),強化其技術(shù)壟斷地位,進一步集聚整合資源,積累 AI 生態(tài)優(yōu)勢,以引領(lǐng)全球 AI 技術(shù)創(chuàng)新。我國正逐漸重視開源社區(qū)建設,已推動建立如開源中國
32、等開源社區(qū),但在技術(shù)貢獻度、用戶規(guī)模、品牌影響力等方面與國際知名開源社區(qū)存在明顯差距。應加強對開源技術(shù)的研發(fā)探索,著力培育形成企業(yè)、政府、公眾等多方互動的健康、可持續(xù)的開源生態(tài)體系。(二)算法框架有效集成 AI 核心能力1、AI 開源算法框架總況AI 開源算法框架能夠充分整合 AI 算法及工具集等資源,服務于便捷、高效、低成本的 AI 研究及應用開發(fā),持續(xù)輸出 AI 技術(shù)能力。開源基礎(chǔ)算法框架是 AI 開源算法框架及工具的核心。AI 開源算法框架主要分為開源基礎(chǔ)算法框架和開源應用算法工具兩類。開源基礎(chǔ)算法框架能夠提供通用型、全域型的機器學習及深度學習算法集成服務能力,為 AI 應用開發(fā)提供算法
33、調(diào)用接口、集成軟件工具包等基礎(chǔ)性技術(shù)工具。開源應用算法工具是依托開源基礎(chǔ)算法框架、面向計算機視覺、語音處理等特定領(lǐng)域的開源算法工具庫,為 AI 應用開發(fā)提供專用性技術(shù)服務。開源深度學習算法框架正處于發(fā)展成熟穩(wěn)定期。AI 開源算法框架經(jīng)歷了從閉源到開源的發(fā)展歷程,走過了包括發(fā)展初期、成熟穩(wěn)定期和熱點期在內(nèi)的幾個發(fā)展階段。在發(fā)展初期,主要提供 K-Means 聚類、支持向量機、貝葉斯分類、決策樹等傳統(tǒng)統(tǒng)計學習算法,極大降低了機器學習算法的應用門檻;在發(fā)展成熟穩(wěn)定期,主要提供卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡等深度學習算法,提高了算法智能水平;在發(fā)展熱點期,主要提供強化學習、遷移學習等全新算法能力??萍计髽I(yè)
34、與頂尖高校對開源算法框架的發(fā)展成熟貢獻最為活躍。科技企業(yè)與頂尖高校是推動開源算法框架發(fā)展壯大的兩大主體力量??萍计髽I(yè)依托自身 AI 業(yè)務場景以及龐大的數(shù)據(jù)資源,能夠?qū)λ惴蚣苓M行有效試驗驗證及功能完善,縮短迭代升級周期,更好滿足工業(yè)級應用需求。高校及科研院所擁有強大的人才資源,對開源算法框架開展基礎(chǔ)性理論研究工作,更易實現(xiàn)革命性突破創(chuàng)新。2、企業(yè)主導的開源算法框架全球看,國際主流開源算法框架由谷歌、臉書等美國科技巨頭主導。谷歌 TensorFlow 是全球知名度高、技術(shù)領(lǐng)先的開源框架之一,有如下三方面特點。一是站在巨人肩膀上,獲得海量資源投入。TensorFlow 脫胎于谷歌內(nèi)部機器學習系統(tǒng)
35、DistBelief,之后調(diào)動了相當多的工程師和科學家投入到對 DistBelief 的優(yōu)化升級,才形成了TensorFlow 0.1 版。二是對分布式友好,加快應用部署落地。TensorFlow基于 DataFlow 的計算模型能夠分配到不同的計算設備上,便于開展分布式計算。三是支持多平臺,兼容性強。TensorFlow 從設計之處就考慮將其運行在多個平臺上,例如其接口可以運行在 iOS 和 Android設備上,訓練則可以運行在其他不同的硬件設備上。另外一個知名開源框架是臉書(Facebook)推出的 PyTorch,有如下兩方面特點。一是采用 Python + Torch 模式,受眾廣、
36、接受度高。隨著 Python 編程語言用戶規(guī)模日益壯大,PyTorch 的受眾也在迅速聚集。二是采用動態(tài)計算圖,設計簡單、操作靈活。用戶無需等待編寫完整的代碼即可檢查其是否正確,便于隨時修改優(yōu)化。國內(nèi)看,百度 PaddlePaddle 開源算法框架影響力最大,其他企業(yè)正加緊布局。百度發(fā)布的 PaddlePaddle 開源算法框架呈現(xiàn)出與前述美國企業(yè)主導的開源框架不同的特點。一是深耕工業(yè)場景,逐步提高生態(tài)影響力。PaddlePaddle 融合了百度多年來積累的工業(yè)應用實踐經(jīng)驗,為各行業(yè)企業(yè)提供 44 個經(jīng)過工業(yè)場景驗證的官方模型,成為官方支持模型最多的深度學習框架。二是依托業(yè)務實踐,提升超大規(guī)模
37、并行深度學習能力?;诎俣群A恳?guī)模的業(yè)務場景實踐,PaddlePaddle 可同時支持稠密參數(shù)和稀疏參數(shù)場景的超大規(guī)模深度學習,支持千億規(guī)模參數(shù)的高效并行訓練。三是提供工業(yè)級服務,涵蓋前期訓練到后期部署全流程。從框架開發(fā)環(huán)境搭建到大規(guī)模并行訓練、移動端 GPU 加速等,PaddlePaddle 能提供企業(yè)所需的全流程服務支撐。此外,國內(nèi)AI 獨角獸企業(yè)也正迎頭趕上,如曠視天元 MegEngine 開源框架,架構(gòu)先進、性能優(yōu)異、移植性強,能夠為工業(yè)級深度學習賦能。3、高校主導的開源算法框架高校及科研院所是最早啟動開源算法框架研發(fā)的主導力量之一,并持續(xù)發(fā)揮著積極作用。高校最早推出的 Theano、
38、Caffe 等開源框架能夠滿足學術(shù)研究需求,但在大規(guī)模分布式計算等場景下的性能不及企業(yè)推出的開源框架。隨后,高校通過更換維護主體以持續(xù)釋放作用價值。例如,MXNET 框架發(fā)起于卡內(nèi)基梅隆大學,后捐贈給 Apache基金會,現(xiàn)成為 Amazon AWS 最主要的深度學習框架。我國高校日漸重視開源算法框架研發(fā),如清華大學已陸續(xù)開發(fā)出開源計圖 Jittor、貝葉斯深度學習算法框架“珠算”、深度強化學習算法框架“天授”等。(三)算力資源走向云邊協(xié)同與定制化1、AI 算力資源的構(gòu)成要素AI 算力資源以 AI 芯片為核心,以 AI 云為主要產(chǎn)品形態(tài),面向AI 應用提供專項計算能力。AI 算力資源包括各類
39、AI 芯片、AI 云、智能計算中心等(如圖 3.3 所示)。AI 芯片算力是 AI 算力核心資源,為 AI 應用賦能提供算力底座。傳統(tǒng) CPU 計算架構(gòu)已無法滿足 AI 對算力的需求,具有海量數(shù)據(jù)并行計算能力、與深度學習及訓練(處理非結(jié)構(gòu)化數(shù)據(jù))相適宜的 AI 芯片迎來發(fā)展機遇。AI 芯片是針對 AI算法做了特殊加速設計,專門用來處理大量 AI 計算任務的芯片,也被稱為 AI 加速器,主要包括 GPU、FPGA、ASIC 等。AI 云是 AI 算力資源的主要產(chǎn)品形態(tài)之一。AI 云能夠為用戶按需、隨時提供 AI 算力資源,對 AI 云側(cè)訓練及推理等提供重要算力支撐,如亞馬遜 AI 云平臺,英偉達
40、“GPU+CUDA”一體化平臺,浪潮、華為提出的智能計算中心等。2、AI 芯片算力發(fā)展情況AI 芯片歷經(jīng)四個階段的發(fā)展,目前處于市場成熟前期。第一階段是 2007 年以前,主要以 CPU 為主的傳統(tǒng)通用計算芯片支撐人工智能發(fā)展應用;第二階段是 2007 年到 2010 年,隨著深度學習算法的快速普及,以及高清視頻、游戲等應用需求的增加,GPU 芯片取得快速突破;第三階段是 2011 年到 2015 年,云計算開始普及,“CPU+GPU”混合運算發(fā)展迅速;第四階段是 2015 年至今,更適合海量數(shù)據(jù)并行計算的定制化 AI 芯片(如 FPGA、ASIC 等)逐漸興起。從發(fā)展趨勢看,AI 芯片朝著“
41、算力定制化、云邊一體化”趨勢演進。按照技術(shù)路線劃分,AI 芯片分為采用傳統(tǒng)計算架構(gòu)的芯片(GPU、FPGA、ASIC 等)以及采用創(chuàng)新架構(gòu)的芯片(類腦芯片、可重構(gòu)通用芯片等)。按照場景劃分,可分為用于構(gòu)建模型的芯片(對計算性能、精度要求較高)以及利用模型進行預測的芯片(對計算性能、精度要求不高,但更關(guān)注用戶體驗)。一方面,隨著 AI 融合賦能廣度和深度不斷加強,不同應用場景對 AI 算力提出不同需求,AI 芯片進入算力定制化時代。另一方面,為更好地滿足某些業(yè)務場景對實時處理的需求,云側(cè)推理乃至訓練任務將遷移至邊緣側(cè),“云邊結(jié)合”方案漸成主流,能夠更好地滿足“云邊共需、多場景應用”的發(fā)展趨勢。從
42、市場格局看,我國 AI 芯片企業(yè)整體處于“跟跑”狀態(tài)。全球AI 芯片企業(yè)主要分為三個發(fā)展梯隊。第一梯隊是國際領(lǐng)軍企業(yè),如英偉達、英特爾等。英偉達近年持續(xù)在 AI 芯片領(lǐng)域發(fā)力,并憑借其 GPU產(chǎn)品的廣泛應用,保持著穩(wěn)固的霸主地位。英特爾作為傳統(tǒng)芯片巨頭,技術(shù)及產(chǎn)業(yè)競爭力不容小覷。第二梯隊是挑戰(zhàn)者企業(yè),如高通、微軟、阿里、亞馬遜等。高通作為手機芯片巨頭,積極布局 AI 終端芯片,在移動生態(tài)領(lǐng)域具有較強話語權(quán)。阿里、亞馬遜等在 AI 芯片布局體系逐漸清晰,借助自有業(yè)務加速自研芯片的商用成熟。第三梯隊是跟隨者企業(yè),如寒武紀、地平線、比特大陸等,其中大部分為 AI 芯片領(lǐng)域的初創(chuàng)企業(yè),在特定技術(shù)方向上
43、具備較強實力,發(fā)展前景廣闊??傮w而言,我國在 AI 芯片領(lǐng)域發(fā)展迅速,但仍面臨技術(shù)、產(chǎn)業(yè)、生態(tài)等多重挑戰(zhàn)。我國芯片制造設備、工藝、封測等方面與國際一流水平存在代際差距,集成電路產(chǎn)業(yè)環(huán)境還尚未成熟;我國 AI 芯片產(chǎn)品集中在端側(cè),云側(cè)高端產(chǎn)品基本被國外廠商壟斷。對此,應認真研判、系統(tǒng)應對:技術(shù)方面,重視集成電路基礎(chǔ)技術(shù)研究,通過科技專項支持、產(chǎn)業(yè)基金支持、社會資本補充等方式,全面提升我國芯片基礎(chǔ)技術(shù)及制造水平;產(chǎn)業(yè)方面,云邊兩側(cè)協(xié)調(diào)布局,鼓勵產(chǎn)業(yè)上下游合作攻關(guān),提高國產(chǎn) AI 芯片市場占有率;生態(tài)方面,利用好國內(nèi)超大規(guī)模市場優(yōu)勢,鼓勵并支持國內(nèi)市場使用國產(chǎn)自研芯片,加快我國集成電路產(chǎn)業(yè)生態(tài)培育成
44、熟。3、AI 云算力發(fā)展情況AI 云算力能夠為 AI 訓練、推理等提供強大高效的算力資源。從服務類型角度,主要包括以亞馬遜 AWS、微軟 Azure、阿里云等為代表的 AI 云平臺,以英偉達“GPU+CUDA”一體化解決方案為代表的計算平臺,以及新一代智能計算中心等全新算力型態(tài)。亞馬遜 AWS、微軟 Azure、阿里云等搶先布局 AI 云算力服務,市場化運營成熟穩(wěn)定。亞馬遜、微軟、阿里等依托自身在云服務領(lǐng)域的技術(shù)及市場優(yōu)勢,面向行業(yè)用戶需求,通過 AI 云提供強大的 AI 算力支持,降低企業(yè)對智能化應用服務的使用成本。例如,亞馬遜 AWS推出 Amazon EC22擁有針對機器學習訓練及圖形工
45、作負載的 GPU 實例,能夠在云中提供安全、可控的計算能力。微軟 Azure 注重邊緣 AI算力布局,Azure IoT Edge 等將 Azure 的計算、存儲等能力引入 IoT設備,能夠在邊緣側(cè)運行機器學習算法。阿里云主推的 GPU 云服務器,能夠提供 GPU 彈性計算服務,有效賦能科學計算、圖形可視化、視頻處理等多種應用場景。英偉達通過打造“GPU+CUDA”一體化解決方案,構(gòu)建軟硬件一體化產(chǎn)品形態(tài),成為 AI 云算力中的“新銳玩家”。英偉達依托其在AI 芯片領(lǐng)域的雄厚實力,正在積極布局構(gòu)建“GPU+CUDA3”一體化計算平臺,能夠支持現(xiàn)有大部分人工智能算法、開發(fā)框架和編程語言,為 AI
46、 學習及訓練提供一體化解決方案。2019 年 CUDA 下載次數(shù)超過 1300 萬次,開發(fā)者數(shù)量超過 120 萬,生態(tài)影響力持續(xù)擴大。智能計算中心是為滿足 AI 算力需求而演進形成的全新算力形態(tài),通過運用 AI 最新理論技術(shù)及計算架構(gòu),為 AI 應用提供所需算力等多元化服務。智能計算中心以數(shù)據(jù)為資源,以融合架構(gòu)計算系統(tǒng)為平臺,依靠其強大算力驅(qū)動 AI 模型對數(shù)據(jù)進行深度加工,并通過云服務形式向企業(yè)及個人用戶供給。2020 年 11 月,國家信息中心聯(lián)合浪潮集團發(fā)布智能計算中心規(guī)劃建設指南,指出“智能計算中心作為新型算力公共基礎(chǔ)設施,符合中國當前社會經(jīng)濟發(fā)展階段和轉(zhuǎn)型需求,是促進 AI 產(chǎn)業(yè)化和
47、產(chǎn)業(yè) AI 化的重要引擎”,期望通過構(gòu)建智能計算中心來承載 AI 技術(shù)創(chuàng)新,促進數(shù)據(jù)開放共享,加速智能生態(tài)建設,帶動智能產(chǎn)業(yè)的聚合。(四)開放平臺呈現(xiàn)建設主體多元化1、AI 開放平臺發(fā)展情況AI 開放平臺是面向不同行業(yè)應用需求,有效整合數(shù)據(jù)、算法、算力等能力要素,提供智能化服務的重要載體。AI 開放平臺的建設主體呈現(xiàn)多元化,可分為四類:一是政府 AI 開放平臺,以培育集聚人工智能產(chǎn)業(yè)為目標,強調(diào)普惠性;二是企業(yè) AI 開放平臺,以提升企業(yè) AI 核心技術(shù)競爭力、培育壯大 AI 產(chǎn)業(yè)生態(tài)為目標,強調(diào)工程性;三是行業(yè)組織 AI 開放平臺,以加速 AI 基礎(chǔ)技術(shù)創(chuàng)新與開源共享為目標,強調(diào)開放創(chuàng)新性;
48、四是高校 AI 開放平臺,以支撐 AI 科研項目、加速技術(shù)研究進程為目標,強調(diào)基礎(chǔ)性、前沿性。(1)政府 AI 開放平臺我國政府在人工智能產(chǎn)業(yè)發(fā)展中發(fā)揮出組織協(xié)調(diào)與資源匯聚作用,主導建設了一批 AI 開放平臺,主要包括以下兩大類。一是政府支持并指導企業(yè)建設的 AI 開放平臺。政府部門支持相關(guān)科技企業(yè)面向特定領(lǐng)域建設了一批 AI 開放平臺,提供專業(yè)化 AI 服務,助力完善 AI 產(chǎn)業(yè)生態(tài)。例如,國家發(fā)展和改革委組織建設人工智能基礎(chǔ)資源公共服務平臺,云從科技承擔建設運營,為企業(yè)和個人提供智能圖像識別、人臉識別等基礎(chǔ)技術(shù)服務,以及平安城市全程封鎖、轄區(qū)網(wǎng)格化管控、銀行人證檢驗等 20 種應用服務???/p>
49、技部有序推進國家新一代人工智能開放創(chuàng)新平臺建設,組織國內(nèi) AI 領(lǐng)軍企業(yè)結(jié)合各自優(yōu)勢領(lǐng)域承建,目前已批復 15 個創(chuàng)新平臺的建設工作。工信部為加快完善 AI 技術(shù)產(chǎn)業(yè)體系,提升工業(yè)基礎(chǔ)能力,提出建設面向人工智能操作系統(tǒng)領(lǐng)域的開源測評公共服務平臺、面向人工智能領(lǐng)域的云邊一體化人工智能算力資源開放與適配平臺等 AI 開放平臺。二是政府與高校及科研機構(gòu)合作建立的 AI 開放平臺。針對中小企業(yè)、傳統(tǒng)企業(yè)普遍面臨的如 AI 技術(shù)研發(fā)能力弱、AI 應用水平不高、缺乏數(shù)據(jù)資源等問題,政府與科研院校合作建設了一批提供基礎(chǔ)服務能力的 AI 平臺,加速推進工業(yè)制造等垂直行業(yè)智能化發(fā)展。例如,中國信通院依托國家級人
50、工智能關(guān)鍵技術(shù)和應用評測重點實驗室,建立高性能計算機服務平臺,開展技術(shù)成果轉(zhuǎn)移轉(zhuǎn)化,為企業(yè)提供產(chǎn)品開發(fā)、技術(shù)咨詢、標準制定、評估評測等服務。華中科技大學無錫研究院牽頭建設江蘇省智能制造與機器人應用技術(shù)公共服務平臺,利用AI、工業(yè)互聯(lián)網(wǎng)等技術(shù),推進智能制造應用落地及智能化工廠建設。(2)企業(yè) AI 開放平臺企業(yè)主導推出的 AI 開放平臺規(guī)模大、應用領(lǐng)域廣、落地場景多,有力支撐 AI 生態(tài)體系建設。企業(yè)通過自建 AI 開放平臺,開源開放底層技術(shù)及算法框架等方式,能夠迅速聚攏上下游合作伙伴,匯聚廣大開發(fā)者等人才資源,助力打造具備自主創(chuàng)新實力的生態(tài)體系。一方面通過打造自身產(chǎn)品,加速自有先進技術(shù)的應用落
51、地,另一方面以廣大開發(fā)者及開源社區(qū)為切入點,挖掘其背后蘊藏的豐富應用場景和商業(yè)化價值,推動形成健康可持續(xù)的 AI 生態(tài)體系。例如,百度大腦 AI 開放平臺通過提供“云、邊、軟硬一體”的多種開放方式以及提供 228 項核心 AI 能力,降低 AI 應用門檻,幫助合作伙伴快速實現(xiàn)產(chǎn)業(yè)鏈上下游對接。百度大腦推出了國內(nèi)首個專注于服務 AI 產(chǎn)業(yè)鏈的商業(yè)平臺百度 AI 市場,服務商可以在百度AI 市場開設及管理屬于自己的店鋪并發(fā)布相關(guān)產(chǎn)品,有望實現(xiàn)供需精準對接、產(chǎn)品快速盈利。華為以硬件產(chǎn)品為核心,提供面向“云、邊、端”全場景,“硬件、芯片、IP、軟硬件?!比珬5慕鉀Q方案,通過與合作伙伴共同開發(fā)等方式打造
52、人工智能產(chǎn)業(yè)生態(tài)。華為人工智能基礎(chǔ)軟硬件平臺分為AI 基礎(chǔ)硬件層、AI 基礎(chǔ)軟件層和 AI 開發(fā)服務層:在 AI 基礎(chǔ)硬件層面,華為打造了基于達芬奇芯片架構(gòu)的昇騰系列 IP 和芯片、Atlas 系列板卡、AI 服務器等智能計算硬件,覆蓋云、邊、端全場景;在 AI基礎(chǔ)軟件層面,華為云能提供基礎(chǔ)算子庫、全場景 AI 計算框架MindSpore 等服務;在 AI 開發(fā)服務層面,華為云 ModelArts 全流程模型能夠?qū)崿F(xiàn)算法訓練的參數(shù)自動化選擇和模型自動調(diào)優(yōu),讓零 AI 基礎(chǔ)的業(yè)務開發(fā)者快速完成模型的訓練和部署。(3)行業(yè)組織 AI 開放平臺行業(yè)組織 AI 開放平臺通常以加速 AI 技術(shù)創(chuàng)新與分享
53、為目標,具備開放創(chuàng)新性。例如,Acumos 平臺由 IF 深度學習基金會所創(chuàng)建并運營,提供標準化、可免費獲取的 AI 基礎(chǔ)堆棧及組件,為希望使用 AI技術(shù)的企業(yè)和個人提供了簡單、便捷的技術(shù)工具。ACR AI-LAB 平臺由美國放射學會(ACR)創(chuàng)建并維護,專注于 AI 技術(shù)在醫(yī)療影像方面的應用,通過提供開源數(shù)據(jù)和算法,讓放射科醫(yī)生可以利用本院病人數(shù)據(jù)開發(fā)出所需的 AI 應用工具。我國的 OpenI 啟智平臺是由新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟創(chuàng)建并運營,旨在促進 AI 技術(shù)開源開放與協(xié)同創(chuàng)新。(4)高校 AI 開放平臺高校 AI 開放平臺圍繞 AI 基礎(chǔ)技術(shù)創(chuàng)新,為推動 AI 基礎(chǔ)理論研究與
54、教育教學發(fā)揮了重要作用。例如,微軟亞洲研究院聯(lián)合北京大學、中科大等四所高校,聯(lián)合建立的微軟新一代人工智能開放科研教育平臺,為高校內(nèi)部提供 AI 創(chuàng)新和教育服務;清華大學發(fā)布 AI 使能平臺“紫為云”,通過云、端本地化部署,將 AI 能力共享給伙伴高校,協(xié)助其構(gòu)建滿足各自需求的 AI 應用;上海交通大學牽頭建立的人工智能研發(fā)與轉(zhuǎn)化平臺,承擔起 AI 關(guān)鍵核心技術(shù)研發(fā)等基礎(chǔ)性研究工作。2、國內(nèi)外 AI 開放平臺建設主體對比國外 AI 開放平臺的發(fā)展主體多元化,而我國 AI 開放平臺主要由科技企業(yè)推動構(gòu)建。在我國,AI 開放平臺以領(lǐng)軍企業(yè)為絕對主導,源于企業(yè)自身強大的技術(shù)實力、成熟的商業(yè)運作模式以及
55、在 AI 生態(tài)圈的持續(xù)積累。行業(yè)組織、高校是 AI 開放平臺建設的重要力量,不過作用及影響力相對有限。政府根據(jù)區(qū)域人工智能產(chǎn)業(yè)發(fā)展需要也參與建設 AI 開放平臺,但需要企業(yè)供給核心技術(shù)。在國外(以美國為例),領(lǐng)軍企業(yè)、行業(yè)組織、高校均是很重要的建設運營主體,致力于持續(xù)性的技術(shù)創(chuàng)新,政府則較少直接參與 AI 開放平臺建設。3、AI 開放平臺發(fā)展趨勢AI 開放平臺發(fā)展趨勢表現(xiàn)為“迎合 AI 市場需求,軟硬適配性更為凸顯”。AI 開放平臺的發(fā)展驅(qū)動力與 AI 技術(shù)產(chǎn)品有著顯著區(qū)別。AI技術(shù)產(chǎn)品可以由供給側(cè)驅(qū)動需求側(cè),科技巨頭通過持續(xù)創(chuàng)新研發(fā),推出性能更強的 AI 技術(shù)產(chǎn)品,不斷推動需求側(cè)應用創(chuàng)新與需
56、求增加。而 AI 開放平臺致力于協(xié)助產(chǎn)業(yè)主體以低成本、高效率開展 AI 創(chuàng)新應用,行業(yè)需求側(cè)是驅(qū)動 AI 開放平臺發(fā)展迭代的關(guān)鍵,供給側(cè)需要整合平臺所需的數(shù)據(jù)、算法、算力等要素,需求側(cè)需要一定規(guī)模量級的主體依托平臺資源開展應用創(chuàng)新試驗。從 AI 供給側(cè)看,AI 開放平臺迎合市場需求,領(lǐng)軍企業(yè)、行業(yè)組織等主體主導著 AI 開放平臺技術(shù)趨勢。其中,軟硬適配性、功能延展性是核心著力點,軟硬適配性包括軟硬深度耦合和軟件高度適配硬件兩個方面,功能延展性主要指提供一體化能力方案和提供關(guān)鍵成熟工具。從 AI 需求側(cè)看,AI 開放平臺反映經(jīng)濟社會對 AI 的實際應用需求,且大中小各類主體有著不同的需求特點,包
57、括普適性應用需求和專精性應用需求。從供需對接來看,對于不同用戶的不同需求,AI供給側(cè)有著不同的能力搭配輸出,軟硬適配程度在 AI 開放平臺供需對接中體現(xiàn)得更為顯著。如普適性應用需求驅(qū)動著軟件高度適配硬件以及一體化能力方案功能的供給搭配,聚焦技術(shù)生態(tài)的開放與底層技術(shù)細節(jié)的屏蔽;專精性應用需求則驅(qū)動著軟硬深度耦合與關(guān)鍵成熟工具的供給搭配,關(guān)注封閉型的技術(shù)生態(tài)與特定功能服務的實現(xiàn)。四、為人工智能基礎(chǔ)設施發(fā)展營造良好環(huán)境未來,AI 基礎(chǔ)設施等新基建將從規(guī)劃建設走向應用落地,為人民生產(chǎn)生活提供智能化普惠服務,為經(jīng)濟高質(zhì)量發(fā)展注入新動能。在推進 AI 基礎(chǔ)設施發(fā)展過程中,需要加強政策供給,優(yōu)化投融資模式,
58、探索融合應用路徑,著力解決在數(shù)據(jù)資源、算法框架、算力資源、開放平臺等建設中面臨的問題,營造健康可持續(xù)的發(fā)展環(huán)境。(一)人工智能基礎(chǔ)設施發(fā)展面臨的問題在 AI 基礎(chǔ)設施整體建設推進中面臨的問題:一是政策供給方面,政府應為 AI 新基建發(fā)展提供哪些有利政策;二是投融資方面,如何調(diào)整投融資模式,以應對 AI 新基建投資規(guī)模大、投資收益不確定等風險;三是融合應用路徑方面,如何使 AI 新基建更好地服務于制造、醫(yī)療、農(nóng)業(yè)等垂直領(lǐng)域。在 AI 基礎(chǔ)設施各核心內(nèi)容發(fā)展中面臨的問題。一是 AI 數(shù)據(jù)資源方面,目前仍存在數(shù)據(jù)集體量小、更新不及時、分類和檢索功能不完善、訪問和利用不便捷等問題;產(chǎn)業(yè)數(shù)據(jù)標準化及互聯(lián)
59、互通水平還有待提高;數(shù)據(jù)治理及知識產(chǎn)權(quán)保護還需加強。二是 AI 算法框架方面,我國在 AI 基礎(chǔ)理論、核心算法框架等關(guān)鍵基礎(chǔ)技術(shù)方面與國際領(lǐng)先水平存在差距,開源工具運用水平有待提升。三是 AI 算力資源方面,我國在 AI 芯片制造工藝、基礎(chǔ)材料等環(huán)節(jié)仍需加強;在智能計算中心等新一代算力設施建設思路上有待明確。四是 AI 開放平臺方面,我國 AI 開放平臺的行業(yè)賦能潛力有待挖掘,相關(guān)標準規(guī)范亟需建立健全。(二)加快構(gòu)建人工智能基礎(chǔ)設施的思考針對 AI 新基建過程中面臨的問題挑戰(zhàn),需統(tǒng)籌考慮、積極應對。1、著力營造健康可持續(xù)的發(fā)展環(huán)境第一,政府配套政策方面。堅持“政府引導、市場主導”總體思路,建議
60、各級政府明確發(fā)展方向,加大財稅優(yōu)惠、財政支持力度,簡化行政審批流程,為 AI 新基建構(gòu)建良好發(fā)展環(huán)境。一是強化政策規(guī)劃引導作用。制定中長期發(fā)展規(guī)劃,明確 AI 新基建發(fā)展目標、具體任務等,確立一批重大工程項目;加強技術(shù)創(chuàng)新、應用培育、標準規(guī)范制定、信息安全保護等配套政策供給。二是豐富財政及金融工具供給。設立新型基礎(chǔ)設施相關(guān)投資基金,發(fā)揮財政政策定向引導作用,吸引社會資本參與;鼓勵金融機構(gòu)通過多種方式支持 AI 新基建項目;引導企業(yè)用好各項財政金融工具。三是強化基礎(chǔ)設施相關(guān)企業(yè)科研攻關(guān)責任。支持基礎(chǔ)設施相關(guān)企業(yè)在關(guān)鍵技術(shù)研發(fā)、重大工程建設等方面發(fā)揮引領(lǐng)作用;鼓勵企業(yè)創(chuàng)新科研管理體制機制,增加研發(fā)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度礦業(yè)權(quán)抵押擔保項目合同樣本3篇
- 2024經(jīng)七路施工項目廉潔保障合同版B版
- 二零二五年度廠房裝修安全風險評估合同3篇
- 2025年度高校文印服務外包合同3篇
- 二零二五年度園林景觀裝修合同范本2篇
- 2024版影視融資中介協(xié)議模板版B版
- 簡易勞務派遣合同范本
- 二零二五年度icp許可證辦理與互聯(lián)網(wǎng)企業(yè)合規(guī)性審查與法律支持合同3篇
- 二零二五版二手車按揭轉(zhuǎn)讓合同范本3篇
- 二零二五版建筑材料租賃與合同變更合同3篇
- 人教版(2025新版)七年級下冊英語:寒假課內(nèi)預習重點知識默寫練習
- 【公開課】同一直線上二力的合成+課件+2024-2025學年+人教版(2024)初中物理八年級下冊+
- 高職組全國職業(yè)院校技能大賽(嬰幼兒照護賽項)備賽試題庫(含答案)
- 2024年公安部直屬事業(yè)單位招聘筆試參考題庫附帶答案詳解
- NB-T 47013.15-2021 承壓設備無損檢測 第15部分:相控陣超聲檢測
- SJG 05-2020 基坑支護技術(shù)標準-高清現(xiàn)行
- 汽車維修價格表
- 司爐崗位應急處置卡(燃氣)參考
- 10KV供配電工程施工組織設計
- 終端攔截攻略
- 藥物外滲處理及預防【病房護士安全警示教育培訓課件】--ppt課件
評論
0/150
提交評論