




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 HYPERLINK https:/ 小數(shù)據(jù)人工智能的巨大潛力 HYPERLINK https:/ 【譯者按】2021 年 9 月,美國(guó)安全與新興技術(shù)研究中心(CSET)發(fā)布小數(shù)據(jù)人工智能的巨大潛力報(bào)告。報(bào)告認(rèn)為,人工智能不完全依賴大數(shù)據(jù),“小數(shù)據(jù)”方法可以針對(duì)標(biāo)記數(shù)據(jù)不足的情況提供替代性解決方案,擁有巨大人工智能潛力。報(bào)告介紹了遷移學(xué)習(xí)、數(shù)據(jù)標(biāo)記、人工數(shù)據(jù)生成、貝葉斯方法以及強(qiáng)化學(xué)習(xí)五類小數(shù)據(jù)方法,分析了各類方法在人工智能應(yīng)用方面的優(yōu)勢(shì),并通過對(duì)論文研究集群的統(tǒng)計(jì)分析探究了小數(shù)據(jù)方法研究進(jìn)展、領(lǐng)先國(guó)家相關(guān)領(lǐng)域競(jìng)爭(zhēng)力分析及研究資金投入情況。賽迪智庫(kù)信息化與軟件產(chǎn)業(yè)研究所對(duì)報(bào)告進(jìn)行了編譯,期望對(duì)
2、我國(guó)有關(guān)部門有所幫助。 HYPERLINK https:/ 【關(guān)鍵詞】人工智能小數(shù)據(jù)傳統(tǒng)觀點(diǎn)認(rèn)為,尖端人工智能依賴于大量數(shù)據(jù),一個(gè)國(guó)家(或企業(yè))能夠獲取的數(shù)據(jù)量是其人工智能進(jìn)展的關(guān)鍵指標(biāo)。當(dāng)前很多人工智能系統(tǒng)確實(shí)使用了大量數(shù)據(jù),然而,并非所有人工智能系統(tǒng)都需要海量數(shù)據(jù)作為支撐,小數(shù)據(jù)也擁有巨大人工智能潛力。為此,本文介紹并概述了“小數(shù)據(jù)”人工智能方法,該方法有助于解決標(biāo)記數(shù)據(jù)不足的問題,進(jìn)而挖掘數(shù)據(jù)潛能,并鼓勵(lì)政府部門、行業(yè)企業(yè)突破大數(shù)據(jù)基礎(chǔ)設(shè)施局限,實(shí)現(xiàn)人工智能創(chuàng)新。一、“小數(shù)據(jù)”方法的分類本研究將“小數(shù)據(jù)”方法分為了五大類:遷移學(xué)習(xí)、數(shù)據(jù)標(biāo)記、人工數(shù)據(jù)生成、貝葉斯方法以及強(qiáng)化學(xué)習(xí)。在沒有大
3、型預(yù)標(biāo)記數(shù)據(jù)集的情況下,可以利用這些方法訓(xùn)練人工智能系統(tǒng)。遷移學(xué)習(xí)(Transfer learning)是一種機(jī)器學(xué)習(xí)方法,可以在數(shù)據(jù)豐富的環(huán)境中學(xué)習(xí)執(zhí)行任務(wù),而后將所學(xué)知識(shí)“遷移”到可用數(shù)據(jù)少的任務(wù)中。這一方法對(duì)于解決關(guān)聯(lián)問題標(biāo)記數(shù)據(jù)豐富但所研究問題數(shù)據(jù)不足的情況有很大價(jià)值。例如,某人在開發(fā)用于識(shí)別稀有鳥類品種的應(yīng)用程序時(shí),可能只有少量鳥類照片。利用遷移學(xué)習(xí),可以首先使用更大、更通用的圖像數(shù)據(jù)庫(kù)訓(xùn)練基本圖像分類器,一旦該分類器能夠區(qū)分狗與貓、花與水果、麻雀與燕子,研究人員就可以為該分類器提供更小的稀有鳥類數(shù)據(jù)集。然后,該模型可以“遷移”其已知的圖像分類知識(shí),利用這些知識(shí)從更少的數(shù)據(jù)中學(xué)習(xí)識(shí)別
4、稀有鳥類。數(shù)據(jù)標(biāo)記(Data labeling)方法,即從有限的標(biāo)記數(shù)據(jù)和大量無(wú)標(biāo)記數(shù)據(jù)開始,使用一系列方法來(lái)理解可用的未標(biāo)記數(shù)據(jù)。例如自動(dòng)生成標(biāo)記(自動(dòng)標(biāo)記)或識(shí)別標(biāo)記重要數(shù)據(jù)點(diǎn)(主動(dòng)學(xué)習(xí))。例如,主動(dòng)學(xué)習(xí)可被用于皮膚癌診斷的相關(guān)研究。研究人員基于已進(jìn)行皮膚癌或健康皮膚標(biāo)記的 100 張照片,進(jìn)行圖像分類模型的最初訓(xùn)練。然后,為模型提供更大的潛在訓(xùn)練圖像集,從中選擇另外 100 張照片進(jìn)行標(biāo)記并添加到訓(xùn)練數(shù)據(jù)中。同時(shí),為了盡可能多地從可用數(shù)據(jù)中學(xué)習(xí),該模型可以基于照片信息含量進(jìn)行附加照片選擇,自行選擇信息更豐富的照片進(jìn)行標(biāo)記。人工數(shù)據(jù)生成(Artificial data generation
5、)方法,旨在通過創(chuàng)建新數(shù)據(jù)點(diǎn)或其他相關(guān)技術(shù),最大限度地從少量數(shù)據(jù)中提取更多信息。該方法可以通過對(duì)現(xiàn)有數(shù)據(jù)的小幅更改(如圖像分類數(shù)據(jù)集中裁剪或旋轉(zhuǎn)圖像)或其他更復(fù)雜的方法,推斷可用數(shù)據(jù)的基礎(chǔ)結(jié)構(gòu)并從中進(jìn)行推測(cè)。例如,計(jì)算機(jī)視覺研究人員利用計(jì)算機(jī)輔助設(shè)計(jì)(CAD)軟件生成常見物體的逼真 3D 圖像,并使用這些圖像擴(kuò)充現(xiàn)有的圖像數(shù)據(jù)集。這種方法在處理有關(guān)重點(diǎn)數(shù)據(jù)的單獨(dú)信息源時(shí),相比其他方法更為切實(shí)可行。同時(shí),這種生成更多數(shù)據(jù)的能力不僅僅可用于處理小數(shù)據(jù)集。如果單個(gè)數(shù)據(jù)的細(xì)節(jié)為敏感信息(例如,個(gè)人的健康記錄),但研究人員對(duì)數(shù)據(jù)的整體分布很感興趣,則可以使用合成數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行隨機(jī)更改,以掩蓋私人信息。貝
6、葉斯方法(Bayesian methods)是機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)的一種大類方法,有兩個(gè)共同特點(diǎn)。首先,該方法明確地將問題先驗(yàn)信息納入其解決問題的方法中,而其他方法則更傾向于對(duì)研究問題做出最少的假設(shè)。貝葉斯方法會(huì)在數(shù)據(jù)進(jìn)一步改進(jìn)之前合并這些“先驗(yàn)”信息,因此更適合某些數(shù)據(jù)較為缺乏,但可以采取實(shí)用數(shù)學(xué)形式寫出問題相關(guān)信息的環(huán)境。其次,貝葉斯方法側(cè)重于對(duì)其預(yù)測(cè)的不確定性進(jìn)行良好校準(zhǔn)后的估計(jì)。該方法可以更容易地識(shí)別數(shù)據(jù)點(diǎn),從而極大減少不確定性,在可用數(shù)據(jù)有限的情況下能發(fā)揮很大作用。例如,貝葉斯方法已被用于監(jiān)測(cè)全球地震活動(dòng),這對(duì)于檢測(cè)地震和驗(yàn)證核條約十分重要。通過開發(fā)一個(gè)模型,結(jié)合有關(guān)地震學(xué)的先驗(yàn)知識(shí),研
7、究人員可以充分利用可用數(shù)據(jù)改進(jìn)模型。此外,貝葉斯方法還包括處理大型數(shù)據(jù)集的其他方法。強(qiáng)化學(xué)習(xí)(Reinforcement learning)是一個(gè)關(guān)于機(jī)器學(xué)習(xí)方法的廣義術(shù)語(yǔ),在強(qiáng)化學(xué)習(xí)中,計(jì)算機(jī)系統(tǒng)通過反復(fù)試驗(yàn)來(lái)學(xué)習(xí)如何與環(huán)境進(jìn)行交互。強(qiáng)化學(xué)習(xí)通常用于訓(xùn)練游戲系統(tǒng)、機(jī)器人和自動(dòng)駕駛汽車。例如,強(qiáng)化學(xué)習(xí)已被用于訓(xùn)練學(xué)習(xí)玩視頻游戲的人工智能系統(tǒng),從簡(jiǎn)單的街機(jī)游戲(如 Pong)到戰(zhàn)略游戲(如星際爭(zhēng)霸)。在各種情況下,系統(tǒng)開始時(shí)都對(duì)如何玩游戲知之甚少或一無(wú)所知,但能逐步嘗試,觀察能產(chǎn)生積極獎(jiǎng)勵(lì)信號(hào)的操作,從而逐漸學(xué)習(xí)游戲規(guī)則。強(qiáng)化學(xué)習(xí)系統(tǒng)通常最終是從大量數(shù)據(jù)中學(xué)習(xí),需要大量的計(jì)算資源,但其使用的數(shù)據(jù)
8、通常是在系統(tǒng)訓(xùn)練時(shí)生成,即數(shù)據(jù)產(chǎn)生于模擬環(huán)境,不需要提前收集和標(biāo)記。在強(qiáng)化學(xué)習(xí)問題中,計(jì)算機(jī)系統(tǒng)與環(huán)境交互的能力至關(guān)重要。值得注意的是,人工智能和機(jī)器學(xué)習(xí)研究融合了多種不同的方法、途徑和范例,用于解決多個(gè)不同類型的問題,在實(shí)踐中,很難完全分開以上五種方法類別。圖 1 展示了這些方法間的相互連接關(guān)系。每個(gè)點(diǎn)代表一類研究集群 HYPERLINK l _bookmark0 1,集群之間連線的粗細(xì)程度代表了集群之間的引用強(qiáng)度??梢钥闯?,雖然各集群與同一類別其他集群的聯(lián)系的確最多,但不同類別的集群之間也存在大量聯(lián)系?!皬?qiáng)化學(xué)習(xí)”類別下的集群更為連貫一致,而“人工數(shù)據(jù)生成”集群則更加分散。1 研究集群是由
9、引用鏈接連接在一起的科學(xué)研究文章集合。圖 1:小數(shù)據(jù)研究集群網(wǎng)絡(luò)圖二、“小數(shù)據(jù)”方法的意義與數(shù)據(jù)密集型方法相比,不依賴預(yù)先收集和標(biāo)記的大型數(shù)據(jù)集的人工智能方法具有很多優(yōu)勢(shì)。(一)減少大小實(shí)體之間的能力差異很多人工智能應(yīng)用的大型數(shù)據(jù)集價(jià)值不斷增長(zhǎng),同時(shí)不同機(jī)構(gòu)收集、存儲(chǔ)和處理所需數(shù)據(jù)的能力存在差異,這有可能在人工智能“擁有者”(如大型科技企業(yè))與人工智能“匱乏者”(如小型機(jī)構(gòu))之間形成差距。對(duì)此,遷移學(xué)習(xí)、自動(dòng)標(biāo)記、貝葉斯方法等小數(shù)據(jù)方法能夠以較少的數(shù)據(jù)應(yīng)用人工智能,將有助于減少小型機(jī)構(gòu)進(jìn)入數(shù)據(jù)領(lǐng)域的壁壘,縮小大小實(shí)體之間的能力差異。(二)減少收集大量個(gè)人數(shù)據(jù)的動(dòng)機(jī)多項(xiàng)調(diào)查表明,人們認(rèn)為大型科技
10、企業(yè)會(huì)持續(xù)收集越來(lái)越多與個(gè)人身份相關(guān)的消費(fèi)者數(shù)據(jù),用于訓(xùn)練其人工智能算法,并由此引發(fā)人們對(duì)人工智能威脅個(gè)人隱私的擔(dān)憂。對(duì)此,某些小數(shù)據(jù)方法通過人工生成新數(shù)據(jù)(如合成數(shù)據(jù)生成),或?qū)λ惴ㄟM(jìn)行模擬訓(xùn)練,將有效去除敏感的個(gè)人可識(shí)別屬性,從而減少為訓(xùn)練機(jī)器學(xué)習(xí)模型而收集真實(shí)世界數(shù)據(jù)的需要,減輕人們對(duì)大規(guī)模收集、使用或泄露消費(fèi)者數(shù)據(jù)的擔(dān)憂。(三)推動(dòng)在可獲得數(shù)據(jù)點(diǎn)較少的領(lǐng)域取得進(jìn)展小數(shù)據(jù)方法可以為人們提供一種處理數(shù)據(jù)匱乏或缺失情況的可靠途徑,解決面對(duì)重要問題時(shí),輸入人工智能系統(tǒng)的數(shù)據(jù)很少或不存在的情況。例如,為一組沒有電子健康記錄的人構(gòu)建一個(gè)疾病風(fēng)險(xiǎn)預(yù)測(cè)算法,或者預(yù)測(cè)有很長(zhǎng)噴發(fā)周期的火山再次噴發(fā)的可能性
11、。小數(shù)據(jù)方法可以利用標(biāo)記和無(wú)標(biāo)記數(shù)據(jù)從相關(guān)問題中遷移知識(shí),利用人們手頭的少量數(shù)據(jù)點(diǎn)創(chuàng)建更多數(shù)據(jù)點(diǎn),利用與研究領(lǐng)域相關(guān)的先驗(yàn)知識(shí),或通過構(gòu)建模擬場(chǎng)景或編碼結(jié)構(gòu)化假設(shè)來(lái)進(jìn)入一個(gè)全新領(lǐng)域。(四)規(guī)避臟數(shù)據(jù)問題在數(shù)據(jù)利用過程中,要獲得干凈、結(jié)構(gòu)整齊、方便研究的數(shù)據(jù)常常需要付出大量努力。對(duì)此,遷移學(xué)習(xí)、貝葉斯方法或人工數(shù)據(jù)生成方法可以通過分別依賴相關(guān)數(shù)據(jù)集、結(jié)構(gòu)化模型和合成數(shù)據(jù),減少需要清理的數(shù)據(jù)量,從而顯著降低臟數(shù)據(jù)問題的規(guī)模。例如,美國(guó)國(guó)防部由于數(shù)據(jù)基礎(chǔ)設(shè)施和遺留系統(tǒng)分散孤立的原因擁有大量“臟數(shù)據(jù)”,需要耗費(fèi)大量人力和時(shí)間對(duì)數(shù)據(jù)進(jìn)行清理、標(biāo)記和組織,而數(shù)據(jù)標(biāo)記類別中的方法可以自動(dòng)生成標(biāo)記,從而更輕松
12、地處理大量無(wú)標(biāo)記數(shù)據(jù)。三、研究發(fā)現(xiàn)本節(jié)介紹了從相關(guān)論文研究集群中的發(fā)現(xiàn),涉及“小數(shù)據(jù)”方法研究進(jìn)展、領(lǐng)先國(guó)家狀況及支持研究的主要資金來(lái)源。共為 5 個(gè)類別確定了 150 個(gè)研究集群,包含約 80324 篇論文,這些論文來(lái)自安全與新興技術(shù)中心的學(xué)術(shù)文獻(xiàn)合并語(yǔ)料庫(kù)(截至 2021年 2 月 12 日),包含全球 90%以上的學(xué)術(shù)成果。下表為所用研究集群的基本信息。表 1:各個(gè)“小數(shù)據(jù)”類別中研究集群的基本信息類別確定的研究集群數(shù)量確定的研究集群中的論文數(shù)量(2010-2020 年)確定的研究集群中的人工智能論文百分比(平均值)(最小值、最大值)遷移學(xué)習(xí)9810278%(52%、89%)數(shù)據(jù)標(biāo)記16
13、1140574%(31%、88%)人工數(shù)據(jù)生成4143345%(6%、85%)貝葉斯方法783224741%(10%、85%)強(qiáng)化學(xué)習(xí)432713763%(7%、94%)總計(jì)15080324(一)各類別“小數(shù)據(jù)”方法研究進(jìn)展在研究數(shù)量方面,五類“小數(shù)據(jù)”方法在過去十年中存在發(fā)展程度不同步的問題。如圖 2 所示,強(qiáng)化學(xué)習(xí)和貝葉斯方法相關(guān)研究論文最多,其中,貝葉斯集群中的論文數(shù)在過去十年內(nèi)持續(xù)穩(wěn)步增長(zhǎng),但強(qiáng)化學(xué)習(xí)集群從 2015 年才開始增長(zhǎng),在 2017-2019年間增長(zhǎng)尤為迅速。這可能與深度強(qiáng)化學(xué)習(xí)在近年來(lái)取得的革命性進(jìn)展有關(guān),在 2015 年之前,該領(lǐng)域一直遭受技術(shù)挑戰(zhàn)。相比之下,人工數(shù)據(jù)生
14、成和數(shù)據(jù)標(biāo)記研究集群中的每年論文發(fā)表數(shù)量在十年間一直保持在相當(dāng)?shù)偷乃?。遷移學(xué)習(xí)在 2010 年規(guī)模很小,到 2020 年已有大幅度增長(zhǎng)。圖 2:20102020 年小數(shù)據(jù)出版物趨勢(shì)在論文質(zhì)量方面,本研究利用兩個(gè)指標(biāo)評(píng)估各類集群中論文的質(zhì)量:H 指數(shù)和年齡校正引用。H 指數(shù)是一種常用的度量標(biāo)準(zhǔn),能夠獲取一組論文的出版活動(dòng)和總引用影響。年齡校正引用則可以調(diào)整H 指數(shù)中新發(fā)表論文積累引用次數(shù)偏低的局限。由圖可得,就 H 指數(shù)而言,強(qiáng)化學(xué)習(xí)領(lǐng)域和貝葉斯方法領(lǐng)域旗鼓相當(dāng);但考慮論文的年齡后,強(qiáng)化學(xué)習(xí)便躍居首位。這意味著本研究中貝葉斯方法的累積影響更高,強(qiáng)化學(xué)習(xí)領(lǐng)域由于近期論文發(fā)表和引用影響激增而脫穎而
15、出。圖 3:20102020 年各類別小數(shù)據(jù)方法H 指數(shù)和年齡校正引用此外,由圖 4 可得,強(qiáng)化學(xué)習(xí)并非是過去十年內(nèi)增長(zhǎng)最快的領(lǐng)域。在 20112020 年間,除了其中兩年外,遷移學(xué)習(xí)呈最快的穩(wěn)定增長(zhǎng)趨勢(shì)。該圖表還顯示了過去 5 年內(nèi)人工數(shù)據(jù)生成領(lǐng)域的增長(zhǎng)情況,但由于此類別的論文總數(shù)較少,且 2012-2015 增長(zhǎng)數(shù)出現(xiàn)最大降幅,因此很難得出這一類別增長(zhǎng)軌跡的具體結(jié)論。圖 4:20112020 年各類別小數(shù)據(jù)方法同比增長(zhǎng)圖 5 根據(jù)安全與新興技術(shù)中心開發(fā)的預(yù)測(cè)模型,以“人工智能整體”論文類別為基準(zhǔn),比較了各類別小數(shù)據(jù)方法的三年增長(zhǎng)情況。根據(jù)預(yù)測(cè),遷移學(xué)習(xí)是唯一一個(gè)增長(zhǎng)速度超過人工智能整體研究
16、的類別,遙遙領(lǐng)先于所有其他類別,并保持著前幾年的持續(xù)增長(zhǎng)趨勢(shì)。注:未來(lái)增長(zhǎng)指數(shù)是根據(jù)安全與新興技術(shù)中心對(duì)研究集群增長(zhǎng)的預(yù)測(cè)計(jì)算得出的。圖 5:2023 年各類別小數(shù)據(jù)方法增長(zhǎng)預(yù)測(cè)(二)“小數(shù)據(jù)”方法領(lǐng)域各國(guó)競(jìng)爭(zhēng)力分析本節(jié)查看了全球前十的國(guó)家在每種方法中取得的研究進(jìn)展,并據(jù)此探究各國(guó)在小數(shù)據(jù)方法領(lǐng)域的競(jìng)爭(zhēng)力。本研究使用簡(jiǎn)單的衡量標(biāo)準(zhǔn),如發(fā)表的論文數(shù)量和調(diào)整年齡后的引用數(shù)量,以初步獲得各國(guó)在各個(gè)類別中的相對(duì)地位情況。表 2 顯示了小數(shù)據(jù)出版物數(shù)量排名前十的國(guó)家各類別論文總量。與人工智能整體研究的結(jié)果一致,中國(guó)和美國(guó)是本研究集群中所含論文的前兩大發(fā)表國(guó),英國(guó)緊隨其后。中國(guó)在數(shù)據(jù)標(biāo)記和遷移學(xué)習(xí)方法領(lǐng)域
17、的學(xué)術(shù)出版物總量最多,而美國(guó)在貝葉斯方法、強(qiáng)化學(xué)習(xí)和人工數(shù)據(jù)生成方面領(lǐng)先。表 2:全球前十國(guó)家各類別小數(shù)據(jù)方法出版物數(shù)量強(qiáng)化學(xué)習(xí)貝葉斯方法遷移學(xué)習(xí)數(shù)據(jù)標(biāo)記人工數(shù)據(jù)1.美國(guó)6705美國(guó)7804中國(guó)2546中國(guó)3250美國(guó)4282.中國(guó)4952中國(guó)3963美國(guó)1935美國(guó)1899中國(guó)1833.英國(guó)1540英國(guó)3423英國(guó)472印度815英國(guó)1124.德國(guó)1389德國(guó)1585澳大利亞362英國(guó)344德國(guó)865.日本1162法國(guó)1486印度285日本313臺(tái)灣796.法國(guó)918澳大利亞1017法國(guó)234法國(guó)295澳大利亞727.加拿大902意大利1010日本227澳大利亞295加拿大378.印度630
18、加拿大972德國(guó)222德國(guó)286西班牙329.西班牙545荷蘭770加拿大218加拿大217韓國(guó)3210.澳大利亞520日本719新加坡203巴西215日本28基于論文引用數(shù)來(lái)衡量研究質(zhì)量和影響力,研究結(jié)果表明,中國(guó)的大量研究是大多數(shù)小數(shù)據(jù)類別中的高質(zhì)量研究。如表 2 所示,根據(jù)年齡校正引用(可以粗略解釋為每年的引用次數(shù)),中國(guó)在遷移學(xué)習(xí)和數(shù)據(jù)標(biāo)記方法領(lǐng)域持續(xù)處于領(lǐng)先地位,唯一表現(xiàn)不足的是貝葉斯方法領(lǐng)域,中國(guó)在該領(lǐng)域的研究影響排名第三,低于英國(guó)。這意味著與其他方法相比,該類別相關(guān)研究的質(zhì)量和影響力不太理想。在美國(guó)方面,其研究質(zhì)量表現(xiàn)情況與其年齡校正引用的排名一致。表 3:全球前十國(guó)家各類別小數(shù)
19、據(jù)方法年齡校正引用數(shù)量強(qiáng)化學(xué)習(xí)貝葉斯方法遷移學(xué)習(xí)數(shù)據(jù)標(biāo)記人工數(shù)據(jù)1.美國(guó)2724美國(guó)2376中國(guó)1091中國(guó)776美國(guó)1482.中國(guó)1690英國(guó)1143美國(guó)808美國(guó)494中國(guó)853.英國(guó)562中國(guó)914英國(guó)216印度192英國(guó)374.德國(guó)418德國(guó)535澳大利亞178英國(guó)104澳大利亞285.加拿大350法國(guó)400印度103澳大利亞93德國(guó)266.日本278澳大利亞352新加坡96法國(guó)82臺(tái)灣217.法國(guó)252加拿大299加拿大93日本72加拿大158.印度184意大利276德國(guó)88德國(guó)69瑞士159.以色列181荷蘭251法國(guó)78加拿大62韓國(guó)1310.澳大利亞179瑞士225韓國(guó)78伊朗
20、58法國(guó)11圖 6 顯示了各國(guó)三年增長(zhǎng)預(yù)測(cè)。值得注意的是,相對(duì)于美國(guó)和世界其他地區(qū),預(yù)計(jì)中國(guó)將會(huì)在遷移學(xué)習(xí)方法領(lǐng)域有大幅增長(zhǎng)。如果預(yù)測(cè)準(zhǔn)確,這一預(yù)測(cè)將意味著中國(guó)可能在遷移學(xué)習(xí)方面取得進(jìn)一步發(fā)展,至少?gòu)恼撐陌l(fā)表數(shù)量來(lái)看是這樣。圖 6:美國(guó)、中國(guó)和世界其他地區(qū) 2023 年各類別小數(shù)據(jù)方法增長(zhǎng)預(yù)測(cè)(三)“小數(shù)據(jù)”方法研究的資金投入情況本研究分析了可用于小數(shù)據(jù)方法的投資數(shù)據(jù),以獲得為本研究集群中所含論文提供投資的實(shí)體類型的估計(jì)。需要注意的是,本研究只有大約 2030%涉及論文的投資信息,但有無(wú)投資數(shù)據(jù)支撐的論文應(yīng)該不存在系統(tǒng)性差異。下表列出了按實(shí)體類型劃分的 5 種小數(shù)據(jù)類別和人工智能整體研究領(lǐng)域的
21、受投資論文百分比。表 4 按實(shí)體類型劃分的受投資論文百分比在所有學(xué)科中的政府機(jī)構(gòu)、企業(yè)、學(xué)術(shù)機(jī)構(gòu)和非營(yíng)利機(jī)構(gòu)中,政府主體往往是最大的研究投資者,而作者大多隸屬于學(xué)術(shù)機(jī)構(gòu)?;谶@一點(diǎn),本研究將小數(shù)據(jù)研究結(jié)果與人工智能整體研究結(jié)果進(jìn)行了比較,以了解二者的差異程度。有趣的是,在全球范圍內(nèi),相比于人工智能整體研究,政府資金在本研究集群中的份額占比更大,如圖 7 所示。本研究發(fā)現(xiàn),相比于對(duì)人工智能其他領(lǐng)域的投資,非營(yíng)利機(jī)構(gòu)對(duì)小數(shù)據(jù)研究領(lǐng)域的投資占比較小。貝葉斯方法的投資模式與人工智能整體的投資模式最為相似。圖 7:相比于人工智能整體研究投資的小數(shù)據(jù)方法領(lǐng)域資金來(lái)源圖 8 進(jìn)一步按國(guó)家劃分了與政府實(shí)體相關(guān)
22、的投資信息。研究結(jié)果表明,盡管就總體趨勢(shì)而言,政府對(duì)小數(shù)據(jù)領(lǐng)域的投資占比很高,但美國(guó)政府對(duì)小數(shù)據(jù)研究的投資份額低于其對(duì)人工智能研究領(lǐng)域的投資份額。圖 8:中國(guó)、美國(guó)和世界其他地區(qū)相比于人工智能整體研究領(lǐng)域的小數(shù)據(jù)方法領(lǐng)域政府投資圖 9 顯示了私營(yíng)部門實(shí)體對(duì)小數(shù)據(jù)研究的投資份額數(shù)據(jù)。相比于人工智能整體研究,美國(guó)的私營(yíng)行業(yè)企業(yè)傾向于對(duì)小數(shù)據(jù)研究領(lǐng)域提供更多資金。圖 9:中國(guó)、美國(guó)和世界其他地區(qū)相比于人工智能整體研究領(lǐng)域的小數(shù)據(jù)方法領(lǐng)域企業(yè)投資圖 10 顯示了各國(guó)研究信托和基金會(huì)等非營(yíng)利機(jī)構(gòu)對(duì)小數(shù)據(jù)領(lǐng)域的投資趨勢(shì)。相比于人工智能整體研究領(lǐng)域,美國(guó)和世界其他地區(qū)的非營(yíng)利機(jī)構(gòu)對(duì)小數(shù)據(jù)研究的投資往往不足。相比之下,除了在人工數(shù)據(jù)生成領(lǐng)域中國(guó)非營(yíng)利機(jī)構(gòu)的投資份額較低外,中國(guó)的非營(yíng)利機(jī)構(gòu)更傾向于對(duì)小數(shù)據(jù)類別進(jìn)行投資。圖 10:中國(guó)、美國(guó)和世界其他地區(qū)相比于人工智能整體研究領(lǐng)域的小數(shù)據(jù)方法領(lǐng)域非盈利機(jī)構(gòu)投資最后,圖 11 顯示了學(xué)術(shù)機(jī)構(gòu)對(duì)小數(shù)據(jù)研究類別的投資模式。需要注意的是,與上述其他兩種實(shí)體類型相比,學(xué)術(shù)機(jī)構(gòu)對(duì)小數(shù)據(jù)研究的投資份額,與其對(duì)所有人
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度智能穿戴設(shè)備研發(fā)人員個(gè)人勞動(dòng)合同書
- 2025年度股權(quán)抵押消費(fèi)金融合同
- 二零二五年度同居關(guān)系終止合同書
- 二零二五年度瑜伽教練就業(yè)保障聘用合同
- 2025年度村委會(huì)林地承包與林業(yè)科研合作合同
- 浙江國(guó)企招聘2024臺(tái)州市椒江區(qū)社會(huì)事業(yè)發(fā)展集團(tuán)有限公司招聘3人筆試參考題庫(kù)附帶答案詳解
- 2025青海省投招聘59人查筆試參考題庫(kù)附帶答案詳解
- 《臨床試驗(yàn)的監(jiān)查》課件
- 電梯構(gòu)造知識(shí)培訓(xùn)課件
- 教育測(cè)量與評(píng)價(jià)知到智慧樹章節(jié)測(cè)試課后答案2024年秋石河子大學(xué)
- 山東建筑電氣與智能化疑難問題分析與解答
- 2022年鄭州衛(wèi)生健康職業(yè)學(xué)院?jiǎn)握杏⒄Z(yǔ)模擬試題(附答案解析)
- Q∕GDW 10354-2020 智能電能表功能規(guī)范
- 土壤學(xué)習(xí)題與答案
- 國(guó)家自然科學(xué)基金(NSFC)申請(qǐng)書樣本
- 觀摩臺(tái)標(biāo)準(zhǔn)化建設(shè)方案
- 數(shù)字化影像與PACS教學(xué)大綱
- 凈身出戶離婚協(xié)議書(完善版)
- 壓瘡醫(yī)學(xué)護(hù)理課件
- 最小作業(yè)單元管理規(guī)定1
- excl表格形式綜合曲線坐標(biāo)計(jì)算程序bata
評(píng)論
0/150
提交評(píng)論