賽迪譯叢：《小數(shù)據(jù)人工智能的巨大潛力》

上傳人：b*** IP屬地：北京上傳時(shí)間：2022-07-08 格式：DOCX 頁(yè)數(shù)：21 大?。?.92MB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩16頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 HYPERLINK https:/ 小數(shù)據(jù)人工智能的巨大潛力 HYPERLINK https:/ 【譯者按】2021 年 9 月，美國(guó)安全與新興技術(shù)研究中心（CSET）發(fā)布小數(shù)據(jù)人工智能的巨大潛力報(bào)告。報(bào)告認(rèn)為，人工智能不完全依賴大數(shù)據(jù)，“小數(shù)據(jù)”方法可以針對(duì)標(biāo)記數(shù)據(jù)不足的情況提供替代性解決方案，擁有巨大人工智能潛力。報(bào)告介紹了遷移學(xué)習(xí)、數(shù)據(jù)標(biāo)記、人工數(shù)據(jù)生成、貝葉斯方法以及強(qiáng)化學(xué)習(xí)五類小數(shù)據(jù)方法，分析了各類方法在人工智能應(yīng)用方面的優(yōu)勢(shì)，并通過對(duì)論文研究集群的統(tǒng)計(jì)分析探究了小數(shù)據(jù)方法研究進(jìn)展、領(lǐng)先國(guó)家相關(guān)領(lǐng)域競(jìng)爭(zhēng)力分析及研究資金投入情況。賽迪智庫(kù)信息化與軟件產(chǎn)業(yè)研究所對(duì)報(bào)告進(jìn)行了編譯，期望對(duì)

2、我國(guó)有關(guān)部門有所幫助。 HYPERLINK https:/ 【關(guān)鍵詞】人工智能小數(shù)據(jù)傳統(tǒng)觀點(diǎn)認(rèn)為，尖端人工智能依賴于大量數(shù)據(jù)，一個(gè)國(guó)家（或企業(yè)）能夠獲取的數(shù)據(jù)量是其人工智能進(jìn)展的關(guān)鍵指標(biāo)。當(dāng)前很多人工智能系統(tǒng)確實(shí)使用了大量數(shù)據(jù)，然而，并非所有人工智能系統(tǒng)都需要海量數(shù)據(jù)作為支撐，小數(shù)據(jù)也擁有巨大人工智能潛力。為此，本文介紹并概述了“小數(shù)據(jù)”人工智能方法，該方法有助于解決標(biāo)記數(shù)據(jù)不足的問題，進(jìn)而挖掘數(shù)據(jù)潛能，并鼓勵(lì)政府部門、行業(yè)企業(yè)突破大數(shù)據(jù)基礎(chǔ)設(shè)施局限，實(shí)現(xiàn)人工智能創(chuàng)新。一、“小數(shù)據(jù)”方法的分類本研究將“小數(shù)據(jù)”方法分為了五大類：遷移學(xué)習(xí)、數(shù)據(jù)標(biāo)記、人工數(shù)據(jù)生成、貝葉斯方法以及強(qiáng)化學(xué)習(xí)。在沒有大

3、型預(yù)標(biāo)記數(shù)據(jù)集的情況下，可以利用這些方法訓(xùn)練人工智能系統(tǒng)。遷移學(xué)習(xí)（Transfer learning）是一種機(jī)器學(xué)習(xí)方法，可以在數(shù)據(jù)豐富的環(huán)境中學(xué)習(xí)執(zhí)行任務(wù)，而后將所學(xué)知識(shí)“遷移”到可用數(shù)據(jù)少的任務(wù)中。這一方法對(duì)于解決關(guān)聯(lián)問題標(biāo)記數(shù)據(jù)豐富但所研究問題數(shù)據(jù)不足的情況有很大價(jià)值。例如，某人在開發(fā)用于識(shí)別稀有鳥類品種的應(yīng)用程序時(shí)，可能只有少量鳥類照片。利用遷移學(xué)習(xí)，可以首先使用更大、更通用的圖像數(shù)據(jù)庫(kù)訓(xùn)練基本圖像分類器，一旦該分類器能夠區(qū)分狗與貓、花與水果、麻雀與燕子，研究人員就可以為該分類器提供更小的稀有鳥類數(shù)據(jù)集。然后，該模型可以“遷移”其已知的圖像分類知識(shí)，利用這些知識(shí)從更少的數(shù)據(jù)中學(xué)習(xí)識(shí)別

4、稀有鳥類。數(shù)據(jù)標(biāo)記（Data labeling）方法，即從有限的標(biāo)記數(shù)據(jù)和大量無(wú)標(biāo)記數(shù)據(jù)開始，使用一系列方法來(lái)理解可用的未標(biāo)記數(shù)據(jù)。例如自動(dòng)生成標(biāo)記（自動(dòng)標(biāo)記）或識(shí)別標(biāo)記重要數(shù)據(jù)點(diǎn)（主動(dòng)學(xué)習(xí)）。例如，主動(dòng)學(xué)習(xí)可被用于皮膚癌診斷的相關(guān)研究。研究人員基于已進(jìn)行皮膚癌或健康皮膚標(biāo)記的 100 張照片，進(jìn)行圖像分類模型的最初訓(xùn)練。然后，為模型提供更大的潛在訓(xùn)練圖像集，從中選擇另外 100 張照片進(jìn)行標(biāo)記并添加到訓(xùn)練數(shù)據(jù)中。同時(shí)，為了盡可能多地從可用數(shù)據(jù)中學(xué)習(xí)，該模型可以基于照片信息含量進(jìn)行附加照片選擇，自行選擇信息更豐富的照片進(jìn)行標(biāo)記。人工數(shù)據(jù)生成（Artificial data generation

5、）方法，旨在通過創(chuàng)建新數(shù)據(jù)點(diǎn)或其他相關(guān)技術(shù)，最大限度地從少量數(shù)據(jù)中提取更多信息。該方法可以通過對(duì)現(xiàn)有數(shù)據(jù)的小幅更改（如圖像分類數(shù)據(jù)集中裁剪或旋轉(zhuǎn)圖像）或其他更復(fù)雜的方法，推斷可用數(shù)據(jù)的基礎(chǔ)結(jié)構(gòu)并從中進(jìn)行推測(cè)。例如，計(jì)算機(jī)視覺研究人員利用計(jì)算機(jī)輔助設(shè)計(jì)（CAD）軟件生成常見物體的逼真 3D 圖像，并使用這些圖像擴(kuò)充現(xiàn)有的圖像數(shù)據(jù)集。這種方法在處理有關(guān)重點(diǎn)數(shù)據(jù)的單獨(dú)信息源時(shí)，相比其他方法更為切實(shí)可行。同時(shí)，這種生成更多數(shù)據(jù)的能力不僅僅可用于處理小數(shù)據(jù)集。如果單個(gè)數(shù)據(jù)的細(xì)節(jié)為敏感信息（例如，個(gè)人的健康記錄），但研究人員對(duì)數(shù)據(jù)的整體分布很感興趣，則可以使用合成數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行隨機(jī)更改，以掩蓋私人信息。貝

6、葉斯方法（Bayesian methods）是機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)的一種大類方法，有兩個(gè)共同特點(diǎn)。首先，該方法明確地將問題先驗(yàn)信息納入其解決問題的方法中，而其他方法則更傾向于對(duì)研究問題做出最少的假設(shè)。貝葉斯方法會(huì)在數(shù)據(jù)進(jìn)一步改進(jìn)之前合并這些“先驗(yàn)”信息，因此更適合某些數(shù)據(jù)較為缺乏，但可以采取實(shí)用數(shù)學(xué)形式寫出問題相關(guān)信息的環(huán)境。其次，貝葉斯方法側(cè)重于對(duì)其預(yù)測(cè)的不確定性進(jìn)行良好校準(zhǔn)后的估計(jì)。該方法可以更容易地識(shí)別數(shù)據(jù)點(diǎn)，從而極大減少不確定性，在可用數(shù)據(jù)有限的情況下能發(fā)揮很大作用。例如，貝葉斯方法已被用于監(jiān)測(cè)全球地震活動(dòng)，這對(duì)于檢測(cè)地震和驗(yàn)證核條約十分重要。通過開發(fā)一個(gè)模型，結(jié)合有關(guān)地震學(xué)的先驗(yàn)知識(shí)，研

7、究人員可以充分利用可用數(shù)據(jù)改進(jìn)模型。此外，貝葉斯方法還包括處理大型數(shù)據(jù)集的其他方法。強(qiáng)化學(xué)習(xí)（Reinforcement learning）是一個(gè)關(guān)于機(jī)器學(xué)習(xí)方法的廣義術(shù)語(yǔ)，在強(qiáng)化學(xué)習(xí)中，計(jì)算機(jī)系統(tǒng)通過反復(fù)試驗(yàn)來(lái)學(xué)習(xí)如何與環(huán)境進(jìn)行交互。強(qiáng)化學(xué)習(xí)通常用于訓(xùn)練游戲系統(tǒng)、機(jī)器人和自動(dòng)駕駛汽車。例如，強(qiáng)化學(xué)習(xí)已被用于訓(xùn)練學(xué)習(xí)玩視頻游戲的人工智能系統(tǒng)，從簡(jiǎn)單的街機(jī)游戲（如 Pong）到戰(zhàn)略游戲（如星際爭(zhēng)霸）。在各種情況下，系統(tǒng)開始時(shí)都對(duì)如何玩游戲知之甚少或一無(wú)所知，但能逐步嘗試，觀察能產(chǎn)生積極獎(jiǎng)勵(lì)信號(hào)的操作，從而逐漸學(xué)習(xí)游戲規(guī)則。強(qiáng)化學(xué)習(xí)系統(tǒng)通常最終是從大量數(shù)據(jù)中學(xué)習(xí)，需要大量的計(jì)算資源，但其使用的數(shù)據(jù)

8、通常是在系統(tǒng)訓(xùn)練時(shí)生成，即數(shù)據(jù)產(chǎn)生于模擬環(huán)境，不需要提前收集和標(biāo)記。在強(qiáng)化學(xué)習(xí)問題中，計(jì)算機(jī)系統(tǒng)與環(huán)境交互的能力至關(guān)重要。值得注意的是，人工智能和機(jī)器學(xué)習(xí)研究融合了多種不同的方法、途徑和范例，用于解決多個(gè)不同類型的問題，在實(shí)踐中，很難完全分開以上五種方法類別。圖 1 展示了這些方法間的相互連接關(guān)系。每個(gè)點(diǎn)代表一類研究集群 HYPERLINK l _bookmark0 1，集群之間連線的粗細(xì)程度代表了集群之間的引用強(qiáng)度?？梢钥闯?，雖然各集群與同一類別其他集群的聯(lián)系的確最多，但不同類別的集群之間也存在大量聯(lián)系?！皬?qiáng)化學(xué)習(xí)”類別下的集群更為連貫一致，而“人工數(shù)據(jù)生成”集群則更加分散。1 研究集群是由

9、引用鏈接連接在一起的科學(xué)研究文章集合。圖 1：小數(shù)據(jù)研究集群網(wǎng)絡(luò)圖二、“小數(shù)據(jù)”方法的意義與數(shù)據(jù)密集型方法相比，不依賴預(yù)先收集和標(biāo)記的大型數(shù)據(jù)集的人工智能方法具有很多優(yōu)勢(shì)。（一）減少大小實(shí)體之間的能力差異很多人工智能應(yīng)用的大型數(shù)據(jù)集價(jià)值不斷增長(zhǎng)，同時(shí)不同機(jī)構(gòu)收集、存儲(chǔ)和處理所需數(shù)據(jù)的能力存在差異，這有可能在人工智能“擁有者”（如大型科技企業(yè)）與人工智能“匱乏者”（如小型機(jī)構(gòu)）之間形成差距。對(duì)此，遷移學(xué)習(xí)、自動(dòng)標(biāo)記、貝葉斯方法等小數(shù)據(jù)方法能夠以較少的數(shù)據(jù)應(yīng)用人工智能，將有助于減少小型機(jī)構(gòu)進(jìn)入數(shù)據(jù)領(lǐng)域的壁壘，縮小大小實(shí)體之間的能力差異。（二）減少收集大量個(gè)人數(shù)據(jù)的動(dòng)機(jī)多項(xiàng)調(diào)查表明，人們認(rèn)為大型科技

10、企業(yè)會(huì)持續(xù)收集越來(lái)越多與個(gè)人身份相關(guān)的消費(fèi)者數(shù)據(jù)，用于訓(xùn)練其人工智能算法，并由此引發(fā)人們對(duì)人工智能威脅個(gè)人隱私的擔(dān)憂。對(duì)此，某些小數(shù)據(jù)方法通過人工生成新數(shù)據(jù)（如合成數(shù)據(jù)生成），或?qū)λ惴ㄟM(jìn)行模擬訓(xùn)練，將有效去除敏感的個(gè)人可識(shí)別屬性，從而減少為訓(xùn)練機(jī)器學(xué)習(xí)模型而收集真實(shí)世界數(shù)據(jù)的需要，減輕人們對(duì)大規(guī)模收集、使用或泄露消費(fèi)者數(shù)據(jù)的擔(dān)憂。（三）推動(dòng)在可獲得數(shù)據(jù)點(diǎn)較少的領(lǐng)域取得進(jìn)展小數(shù)據(jù)方法可以為人們提供一種處理數(shù)據(jù)匱乏或缺失情況的可靠途徑，解決面對(duì)重要問題時(shí)，輸入人工智能系統(tǒng)的數(shù)據(jù)很少或不存在的情況。例如，為一組沒有電子健康記錄的人構(gòu)建一個(gè)疾病風(fēng)險(xiǎn)預(yù)測(cè)算法，或者預(yù)測(cè)有很長(zhǎng)噴發(fā)周期的火山再次噴發(fā)的可能性

11、。小數(shù)據(jù)方法可以利用標(biāo)記和無(wú)標(biāo)記數(shù)據(jù)從相關(guān)問題中遷移知識(shí)，利用人們手頭的少量數(shù)據(jù)點(diǎn)創(chuàng)建更多數(shù)據(jù)點(diǎn)，利用與研究領(lǐng)域相關(guān)的先驗(yàn)知識(shí)，或通過構(gòu)建模擬場(chǎng)景或編碼結(jié)構(gòu)化假設(shè)來(lái)進(jìn)入一個(gè)全新領(lǐng)域。（四）規(guī)避臟數(shù)據(jù)問題在數(shù)據(jù)利用過程中，要獲得干凈、結(jié)構(gòu)整齊、方便研究的數(shù)據(jù)常常需要付出大量努力。對(duì)此，遷移學(xué)習(xí)、貝葉斯方法或人工數(shù)據(jù)生成方法可以通過分別依賴相關(guān)數(shù)據(jù)集、結(jié)構(gòu)化模型和合成數(shù)據(jù)，減少需要清理的數(shù)據(jù)量，從而顯著降低臟數(shù)據(jù)問題的規(guī)模。例如，美國(guó)國(guó)防部由于數(shù)據(jù)基礎(chǔ)設(shè)施和遺留系統(tǒng)分散孤立的原因擁有大量“臟數(shù)據(jù)”，需要耗費(fèi)大量人力和時(shí)間對(duì)數(shù)據(jù)進(jìn)行清理、標(biāo)記和組織，而數(shù)據(jù)標(biāo)記類別中的方法可以自動(dòng)生成標(biāo)記，從而更輕松

12、地處理大量無(wú)標(biāo)記數(shù)據(jù)。三、研究發(fā)現(xiàn)本節(jié)介紹了從相關(guān)論文研究集群中的發(fā)現(xiàn)，涉及“小數(shù)據(jù)”方法研究進(jìn)展、領(lǐng)先國(guó)家狀況及支持研究的主要資金來(lái)源。共為 5 個(gè)類別確定了 150 個(gè)研究集群，包含約 80324 篇論文，這些論文來(lái)自安全與新興技術(shù)中心的學(xué)術(shù)文獻(xiàn)合并語(yǔ)料庫(kù)（截至 2021年 2 月 12 日），包含全球 90%以上的學(xué)術(shù)成果。下表為所用研究集群的基本信息。表 1：各個(gè)“小數(shù)據(jù)”類別中研究集群的基本信息類別確定的研究集群數(shù)量確定的研究集群中的論文數(shù)量（2010-2020 年）確定的研究集群中的人工智能論文百分比（平均值）（最小值、最大值）遷移學(xué)習(xí)9810278%（52%、89%）數(shù)據(jù)標(biāo)記16

13、1140574%（31%、88%）人工數(shù)據(jù)生成4143345%（6%、85%）貝葉斯方法783224741%（10%、85%）強(qiáng)化學(xué)習(xí)432713763%（7%、94%）總計(jì)15080324（一）各類別“小數(shù)據(jù)”方法研究進(jìn)展在研究數(shù)量方面，五類“小數(shù)據(jù)”方法在過去十年中存在發(fā)展程度不同步的問題。如圖 2 所示，強(qiáng)化學(xué)習(xí)和貝葉斯方法相關(guān)研究論文最多，其中，貝葉斯集群中的論文數(shù)在過去十年內(nèi)持續(xù)穩(wěn)步增長(zhǎng)，但強(qiáng)化學(xué)習(xí)集群從 2015 年才開始增長(zhǎng)，在 2017-2019年間增長(zhǎng)尤為迅速。這可能與深度強(qiáng)化學(xué)習(xí)在近年來(lái)取得的革命性進(jìn)展有關(guān)，在 2015 年之前，該領(lǐng)域一直遭受技術(shù)挑戰(zhàn)。相比之下，人工數(shù)據(jù)生

14、成和數(shù)據(jù)標(biāo)記研究集群中的每年論文發(fā)表數(shù)量在十年間一直保持在相當(dāng)?shù)偷乃?。遷移學(xué)習(xí)在 2010 年規(guī)模很小，到 2020 年已有大幅度增長(zhǎng)。圖 2：20102020 年小數(shù)據(jù)出版物趨勢(shì)在論文質(zhì)量方面，本研究利用兩個(gè)指標(biāo)評(píng)估各類集群中論文的質(zhì)量：H 指數(shù)和年齡校正引用。H 指數(shù)是一種常用的度量標(biāo)準(zhǔn)，能夠獲取一組論文的出版活動(dòng)和總引用影響。年齡校正引用則可以調(diào)整H 指數(shù)中新發(fā)表論文積累引用次數(shù)偏低的局限。由圖可得，就 H 指數(shù)而言，強(qiáng)化學(xué)習(xí)領(lǐng)域和貝葉斯方法領(lǐng)域旗鼓相當(dāng)；但考慮論文的年齡后，強(qiáng)化學(xué)習(xí)便躍居首位。這意味著本研究中貝葉斯方法的累積影響更高，強(qiáng)化學(xué)習(xí)領(lǐng)域由于近期論文發(fā)表和引用影響激增而脫穎而

15、出。圖 3：20102020 年各類別小數(shù)據(jù)方法H 指數(shù)和年齡校正引用此外，由圖 4 可得，強(qiáng)化學(xué)習(xí)并非是過去十年內(nèi)增長(zhǎng)最快的領(lǐng)域。在 20112020 年間，除了其中兩年外，遷移學(xué)習(xí)呈最快的穩(wěn)定增長(zhǎng)趨勢(shì)。該圖表還顯示了過去 5 年內(nèi)人工數(shù)據(jù)生成領(lǐng)域的增長(zhǎng)情況，但由于此類別的論文總數(shù)較少，且 2012-2015 增長(zhǎng)數(shù)出現(xiàn)最大降幅，因此很難得出這一類別增長(zhǎng)軌跡的具體結(jié)論。圖 4：20112020 年各類別小數(shù)據(jù)方法同比增長(zhǎng)圖 5 根據(jù)安全與新興技術(shù)中心開發(fā)的預(yù)測(cè)模型，以“人工智能整體”論文類別為基準(zhǔn)，比較了各類別小數(shù)據(jù)方法的三年增長(zhǎng)情況。根據(jù)預(yù)測(cè)，遷移學(xué)習(xí)是唯一一個(gè)增長(zhǎng)速度超過人工智能整體研究

16、的類別，遙遙領(lǐng)先于所有其他類別，并保持著前幾年的持續(xù)增長(zhǎng)趨勢(shì)。注：未來(lái)增長(zhǎng)指數(shù)是根據(jù)安全與新興技術(shù)中心對(duì)研究集群增長(zhǎng)的預(yù)測(cè)計(jì)算得出的。圖 5：2023 年各類別小數(shù)據(jù)方法增長(zhǎng)預(yù)測(cè)（二）“小數(shù)據(jù)”方法領(lǐng)域各國(guó)競(jìng)爭(zhēng)力分析本節(jié)查看了全球前十的國(guó)家在每種方法中取得的研究進(jìn)展，并據(jù)此探究各國(guó)在小數(shù)據(jù)方法領(lǐng)域的競(jìng)爭(zhēng)力。本研究使用簡(jiǎn)單的衡量標(biāo)準(zhǔn)，如發(fā)表的論文數(shù)量和調(diào)整年齡后的引用數(shù)量，以初步獲得各國(guó)在各個(gè)類別中的相對(duì)地位情況。表 2 顯示了小數(shù)據(jù)出版物數(shù)量排名前十的國(guó)家各類別論文總量。與人工智能整體研究的結(jié)果一致，中國(guó)和美國(guó)是本研究集群中所含論文的前兩大發(fā)表國(guó)，英國(guó)緊隨其后。中國(guó)在數(shù)據(jù)標(biāo)記和遷移學(xué)習(xí)方法領(lǐng)域

17、的學(xué)術(shù)出版物總量最多，而美國(guó)在貝葉斯方法、強(qiáng)化學(xué)習(xí)和人工數(shù)據(jù)生成方面領(lǐng)先。表 2：全球前十國(guó)家各類別小數(shù)據(jù)方法出版物數(shù)量強(qiáng)化學(xué)習(xí)貝葉斯方法遷移學(xué)習(xí)數(shù)據(jù)標(biāo)記人工數(shù)據(jù)1.美國(guó)6705美國(guó)7804中國(guó)2546中國(guó)3250美國(guó)4282.中國(guó)4952中國(guó)3963美國(guó)1935美國(guó)1899中國(guó)1833.英國(guó)1540英國(guó)3423英國(guó)472印度815英國(guó)1124.德國(guó)1389德國(guó)1585澳大利亞362英國(guó)344德國(guó)865.日本1162法國(guó)1486印度285日本313臺(tái)灣796.法國(guó)918澳大利亞1017法國(guó)234法國(guó)295澳大利亞727.加拿大902意大利1010日本227澳大利亞295加拿大378.印度630

18、加拿大972德國(guó)222德國(guó)286西班牙329.西班牙545荷蘭770加拿大218加拿大217韓國(guó)3210.澳大利亞520日本719新加坡203巴西215日本28基于論文引用數(shù)來(lái)衡量研究質(zhì)量和影響力，研究結(jié)果表明，中國(guó)的大量研究是大多數(shù)小數(shù)據(jù)類別中的高質(zhì)量研究。如表 2 所示，根據(jù)年齡校正引用（可以粗略解釋為每年的引用次數(shù)），中國(guó)在遷移學(xué)習(xí)和數(shù)據(jù)標(biāo)記方法領(lǐng)域持續(xù)處于領(lǐng)先地位，唯一表現(xiàn)不足的是貝葉斯方法領(lǐng)域，中國(guó)在該領(lǐng)域的研究影響排名第三，低于英國(guó)。這意味著與其他方法相比，該類別相關(guān)研究的質(zhì)量和影響力不太理想。在美國(guó)方面，其研究質(zhì)量表現(xiàn)情況與其年齡校正引用的排名一致。表 3：全球前十國(guó)家各類別小數(shù)

19、據(jù)方法年齡校正引用數(shù)量強(qiáng)化學(xué)習(xí)貝葉斯方法遷移學(xué)習(xí)數(shù)據(jù)標(biāo)記人工數(shù)據(jù)1.美國(guó)2724美國(guó)2376中國(guó)1091中國(guó)776美國(guó)1482.中國(guó)1690英國(guó)1143美國(guó)808美國(guó)494中國(guó)853.英國(guó)562中國(guó)914英國(guó)216印度192英國(guó)374.德國(guó)418德國(guó)535澳大利亞178英國(guó)104澳大利亞285.加拿大350法國(guó)400印度103澳大利亞93德國(guó)266.日本278澳大利亞352新加坡96法國(guó)82臺(tái)灣217.法國(guó)252加拿大299加拿大93日本72加拿大158.印度184意大利276德國(guó)88德國(guó)69瑞士159.以色列181荷蘭251法國(guó)78加拿大62韓國(guó)1310.澳大利亞179瑞士225韓國(guó)78伊朗

20、58法國(guó)11圖 6 顯示了各國(guó)三年增長(zhǎng)預(yù)測(cè)。值得注意的是，相對(duì)于美國(guó)和世界其他地區(qū)，預(yù)計(jì)中國(guó)將會(huì)在遷移學(xué)習(xí)方法領(lǐng)域有大幅增長(zhǎng)。如果預(yù)測(cè)準(zhǔn)確，這一預(yù)測(cè)將意味著中國(guó)可能在遷移學(xué)習(xí)方面取得進(jìn)一步發(fā)展，至少?gòu)恼撐陌l(fā)表數(shù)量來(lái)看是這樣。圖 6：美國(guó)、中國(guó)和世界其他地區(qū) 2023 年各類別小數(shù)據(jù)方法增長(zhǎng)預(yù)測(cè)（三）“小數(shù)據(jù)”方法研究的資金投入情況本研究分析了可用于小數(shù)據(jù)方法的投資數(shù)據(jù)，以獲得為本研究集群中所含論文提供投資的實(shí)體類型的估計(jì)。需要注意的是，本研究只有大約 2030%涉及論文的投資信息，但有無(wú)投資數(shù)據(jù)支撐的論文應(yīng)該不存在系統(tǒng)性差異。下表列出了按實(shí)體類型劃分的 5 種小數(shù)據(jù)類別和人工智能整體研究領(lǐng)域的

21、受投資論文百分比。表 4 按實(shí)體類型劃分的受投資論文百分比在所有學(xué)科中的政府機(jī)構(gòu)、企業(yè)、學(xué)術(shù)機(jī)構(gòu)和非營(yíng)利機(jī)構(gòu)中，政府主體往往是最大的研究投資者，而作者大多隸屬于學(xué)術(shù)機(jī)構(gòu)?；谶@一點(diǎn)，本研究將小數(shù)據(jù)研究結(jié)果與人工智能整體研究結(jié)果進(jìn)行了比較，以了解二者的差異程度。有趣的是，在全球范圍內(nèi)，相比于人工智能整體研究，政府資金在本研究集群中的份額占比更大，如圖 7 所示。本研究發(fā)現(xiàn)，相比于對(duì)人工智能其他領(lǐng)域的投資，非營(yíng)利機(jī)構(gòu)對(duì)小數(shù)據(jù)研究領(lǐng)域的投資占比較小。貝葉斯方法的投資模式與人工智能整體的投資模式最為相似。圖 7：相比于人工智能整體研究投資的小數(shù)據(jù)方法領(lǐng)域資金來(lái)源圖 8 進(jìn)一步按國(guó)家劃分了與政府實(shí)體相關(guān)

22、的投資信息。研究結(jié)果表明，盡管就總體趨勢(shì)而言，政府對(duì)小數(shù)據(jù)領(lǐng)域的投資占比很高，但美國(guó)政府對(duì)小數(shù)據(jù)研究的投資份額低于其對(duì)人工智能研究領(lǐng)域的投資份額。圖 8：中國(guó)、美國(guó)和世界其他地區(qū)相比于人工智能整體研究領(lǐng)域的小數(shù)據(jù)方法領(lǐng)域政府投資圖 9 顯示了私營(yíng)部門實(shí)體對(duì)小數(shù)據(jù)研究的投資份額數(shù)據(jù)。相比于人工智能整體研究，美國(guó)的私營(yíng)行業(yè)企業(yè)傾向于對(duì)小數(shù)據(jù)研究領(lǐng)域提供更多資金。圖 9：中國(guó)、美國(guó)和世界其他地區(qū)相比于人工智能整體研究領(lǐng)域的小數(shù)據(jù)方法領(lǐng)域企業(yè)投資圖 10 顯示了各國(guó)研究信托和基金會(huì)等非營(yíng)利機(jī)構(gòu)對(duì)小數(shù)據(jù)領(lǐng)域的投資趨勢(shì)。相比于人工智能整體研究領(lǐng)域，美國(guó)和世界其他地區(qū)的非營(yíng)利機(jī)構(gòu)對(duì)小數(shù)據(jù)研究的投資往往不足。相比之下，除了在人工數(shù)據(jù)生成領(lǐng)域中國(guó)非營(yíng)利機(jī)構(gòu)的投資份額較低外，中國(guó)的非營(yíng)利機(jī)構(gòu)更傾向于對(duì)小數(shù)據(jù)類別進(jìn)行投資。圖 10：中國(guó)、美國(guó)和世界其他地區(qū)相比于人工智能整體研究領(lǐng)域的小數(shù)據(jù)方法領(lǐng)域非盈利機(jī)構(gòu)投資最后，圖 11 顯示了學(xué)術(shù)機(jī)構(gòu)對(duì)小數(shù)據(jù)研究類別的投資模式。需要注意的是，與上述其他兩種實(shí)體類型相比，學(xué)術(shù)機(jī)構(gòu)對(duì)小數(shù)據(jù)研究的投資份額，與其對(duì)所有人

人人文庫(kù)> 全部分類> 行業(yè)資料 > 金融保險(xiǎn)

溫馨提示

1. 本站所有資源如無(wú)特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

賽迪譯叢：《小數(shù)據(jù)人工智能的巨大潛力》

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

賽迪譯叢：《小數(shù)據(jù)人工智能的巨大潛力》

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔