AI驅(qū)動下學(xué)術(shù)出版服務(wù)自然科學(xué)知識生產(chǎn)的機(jī)制分析_第1頁
AI驅(qū)動下學(xué)術(shù)出版服務(wù)自然科學(xué)知識生產(chǎn)的機(jī)制分析_第2頁
AI驅(qū)動下學(xué)術(shù)出版服務(wù)自然科學(xué)知識生產(chǎn)的機(jī)制分析_第3頁
AI驅(qū)動下學(xué)術(shù)出版服務(wù)自然科學(xué)知識生產(chǎn)的機(jī)制分析_第4頁
AI驅(qū)動下學(xué)術(shù)出版服務(wù)自然科學(xué)知識生產(chǎn)的機(jī)制分析_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

AI驅(qū)動下學(xué)術(shù)出版服務(wù)自然科學(xué)知識生產(chǎn)的機(jī)制分析ResearchonKnowledgeProductionInnovationinAcademic

PublishingFieldDrivenbyAITechnology:TakingNaturalScience

KnowledgeasanExample王鵬濤/章紫桐作者簡介:王鵬濤,管理學(xué)博士,南京大學(xué)信息管理學(xué)院教授、博士生導(dǎo)師;章紫桐,南京大學(xué)信息管理學(xué)院2018級碩士生(南京210023)o原發(fā)信息:《出版科學(xué)》(武漢)2021年第20216期第12-19頁內(nèi)容提要:AI技術(shù)的應(yīng)用為學(xué)術(shù)出版商在知識生產(chǎn)領(lǐng)域的探索提供了難得機(jī)遇,智能出版的核心價值在于從已出版文獻(xiàn)、科研實驗數(shù)據(jù)、引用數(shù)據(jù)等資源中發(fā)現(xiàn)知識間的新關(guān)聯(lián),為科學(xué)進(jìn)步貢獻(xiàn)力量。通過文獻(xiàn)調(diào)查、比擬分析和案例探討,指出AI技術(shù)在數(shù)據(jù)的獲取、利用、審核,學(xué)術(shù)語言的翻譯,智能化的信息關(guān)聯(lián)與知識推理,推動科學(xué)家的合作與知識提供,預(yù)測學(xué)科領(lǐng)域前沿等方面提供了前所未有的便利,推動了自然科學(xué)領(lǐng)域出版事業(yè)的智能化轉(zhuǎn)型。自然科學(xué)領(lǐng)域知識生產(chǎn)的內(nèi)在邏輯和AT的獨有特征,共同決定了在以上場景中學(xué)術(shù)出版企業(yè)的數(shù)智化轉(zhuǎn)型升級將大有可為。ResearchonKnowledgeProductionInnovationinAcademicPublishingFieldDrivenbyAITechnology:TakingNaturalScienceKnowledgeasanExample關(guān)鍵詞:理改變B,而B的生理變化又引發(fā)某一器官的疾病C,D藥物是治療疾病C的非針對性藥物,這樣就可快速獲得A作用于C和D并影響B(tài)的有用信息,ABCD間的邏輯關(guān)系便于AI快速抓取關(guān)鍵信息。這種新的關(guān)聯(lián)如果靠傳統(tǒng)的知識生產(chǎn)方式(主要依賴個體經(jīng)驗和思維慣性)來完成,顯然是比擬困難的。增強(qiáng)科研人員的預(yù)估能力??茖W(xué)預(yù)測的正確與否是檢驗科學(xué)理論的重要標(biāo)準(zhǔn),AI的引入解決了人類難以應(yīng)對的復(fù)雜推理和計算,從而增強(qiáng)了科研人員的預(yù)估能力,使科研工作者能發(fā)現(xiàn)簡單實驗無法呈現(xiàn)的深層規(guī)律和內(nèi)在機(jī)制。在化學(xué)領(lǐng)域,約翰威立國際出版公司與美國化學(xué)文摘社合作,將文摘社的化學(xué)信息與威^公司(Wiley)的化學(xué)合成軟件(ChemPlanner)技術(shù)結(jié)合,加速預(yù)測合成反響路線的開展(36)。正是沿著邏輯必然性的規(guī)律,AI技術(shù)根據(jù)已有化學(xué)公式與大量化學(xué)反響數(shù)據(jù),自動地完成推理運(yùn)算過程,預(yù)測出反響結(jié)果,提出了具有預(yù)判價值的觀點,幫助化學(xué)家在目標(biāo)分子和可獲得的起始原料之間選擇最優(yōu)合成路線,提高了新分子的開發(fā)效率,節(jié)約了實驗本錢,推動化學(xué)領(lǐng)域的知識發(fā)現(xiàn)。推動科學(xué)家的合作與知識提供從知識生產(chǎn)過程來看,科學(xué)知識的生產(chǎn)有賴于科學(xué)共同體的互動與合作,科學(xué)思想的無障礙交流和擴(kuò)散離不開科學(xué)知識的公開(37)。在智能技術(shù)應(yīng)用普及的時代背景下,科學(xué)知識在公開的深度、廣度、即時性上到達(dá)前所未有的程度,為科學(xué)家間的提供、協(xié)作奠定堅實的基礎(chǔ)。提升知識公開的速度與深度。有效的科學(xué)知識是通過公開的辯論、協(xié)商、審查、批判和重新表達(dá)而幸存下來的(38),知識的快速提供與發(fā)布提高了學(xué)術(shù)信息交流的活躍度,加快了科技創(chuàng)新的速度,AI技術(shù)在選題策劃、編輯校對、價值評審、精準(zhǔn)發(fā)布等方面全方位提升了學(xué)術(shù)出版的速度,比方智能化的同行評審篩選工具能夠為待發(fā)表的稿件快速地匹配合適的審稿人(39)。不僅如此,研究要素的出版以及虛擬學(xué)術(shù)社區(qū)的建立同樣提高了學(xué)術(shù)成果的公開性和知識提供的自由度。爰思唯爾(Elsevier)(40)、施普林格(Springer)等出版商通過數(shù)據(jù)論文、負(fù)面研究結(jié)果集、數(shù)據(jù)筆記等文章類型,發(fā)表了研究過程中的數(shù)據(jù)資料、與學(xué)界主流相悖的研究成果,保障弱勢學(xué)術(shù)意見的發(fā)表權(quán)利,施普林格推出學(xué)術(shù)社交工具易提供(Sharelt)(41),幫助作者將科研論文免費版鏈接發(fā)送到社交媒體、作者網(wǎng)站和機(jī)構(gòu)倉儲等各個平臺,以最快的速度幫助研究者提升其成果的國際學(xué)術(shù)影響力。此外,知識提供行為的分析也日益智能化,例如可以利用AI辨析一篇文獻(xiàn)中被引用的研究要素,如實驗數(shù)據(jù)、實驗方法甚至單個假設(shè)的引用情況等。從這些行為數(shù)據(jù)的分析結(jié)果中,可以看到一些學(xué)科演化的軌跡,以及科學(xué)家互動的規(guī)律。改善科研人員交流方式。在傳統(tǒng)的科研環(huán)境中,由于實驗過程中的原始數(shù)據(jù)和細(xì)節(jié)信息未能獲得出版機(jī)會,研究者無法看到一個結(jié)論背后的細(xì)節(jié)和完整的開展過程??蒲袛?shù)據(jù)的智能化出版使科學(xué)研究的實驗環(huán)境更加清晰地重現(xiàn),不同時間、不同地點的科研工作者們可以通過智能化科研網(wǎng)絡(luò)遠(yuǎn)程合作,相互啟發(fā)思維、共同利用實驗數(shù)據(jù)、核查科研成果。杰貝?威爾遜(JebelWilson)(42)認(rèn)為,人工智能技術(shù)將不斷地改善科學(xué)工作者的交流方式,鼓勵研究人員通過合作網(wǎng)絡(luò)提供觀點,科學(xué)家們將更傾向于跨地區(qū)、跨領(lǐng)域合作以實現(xiàn)更有價值的科研創(chuàng)新。智能化預(yù)測學(xué)科領(lǐng)域前沿從知識開展過程來看,科學(xué)開展具有毋庸置疑的進(jìn)步性,科學(xué)哲學(xué)家托馬斯?庫恩(ThomasKuhn)認(rèn)為(43),科學(xué)革命本質(zhì)上是一個新范式徹底取代舊范式的過程,成功的科學(xué)發(fā)現(xiàn)并不需要熟記學(xué)科的開展歷史,科學(xué)家們只需專注于前沿問題的探究。科學(xué)創(chuàng)新加速度前進(jìn),科技期刊編輯尤其需要具備追蹤前沿的素養(yǎng),預(yù)測學(xué)科開展的趨勢。湯森路透(ThomsonReuters)與全球研究機(jī)構(gòu)合作,通過分析核心文獻(xiàn)及其引用行為來捕捉學(xué)術(shù)熱點(44),愛思唯爾充分利用用戶的行為數(shù)據(jù),通過分析用戶搜索頻率較高的關(guān)鍵詞來判斷熱點學(xué)科(45)。此外,隨著機(jī)器學(xué)習(xí)與信息抽取技術(shù)在知識圖譜領(lǐng)域的應(yīng)用,前沿知識圖譜的構(gòu)建也日益智能化、可視化,參考價值日益提升。與文獻(xiàn)計量和大數(shù)據(jù)分析不同,AI介入選題分析還可以以信息整理的方式進(jìn)行,通過對學(xué)術(shù)動態(tài)信息的自動獲取,整合生成完整的學(xué)術(shù)前沿報告。傳統(tǒng)科技編輯通過追蹤權(quán)威學(xué)者的研究動態(tài)、權(quán)威數(shù)據(jù)庫和權(quán)威期刊的文獻(xiàn)出版、國家的科技政策、國家級科研工程立項通知、學(xué)術(shù)會議主題設(shè)置等信息,把握學(xué)科的前沿動態(tài)(46),但是這些信息內(nèi)容混雜、價值不一、分布離散、更新頻繁,編輯與學(xué)者想要全面地把握這些信息須耗費大量的時間精力。學(xué)術(shù)出版商可通過自動抓取新的政策、會議、工程信息,追蹤學(xué)科內(nèi)核心學(xué)者的研究行為,對新發(fā)表的核心論文進(jìn)行自動摘要處理和關(guān)鍵詞分析,并將這些內(nèi)容進(jìn)行全方位的整合、分析,生成研究前沿的綜合報告以提供選題參考,以指導(dǎo)研究者的學(xué)術(shù)寫作和出版活動。4結(jié)語遵循社會、文化、市場和技術(shù)環(huán)境的演變邏輯,出版商升級為知識服務(wù)商的趨向愈來愈清,出版業(yè)關(guān)注的幾大主題始終是:"出版能提供什么樣的知識服務(wù)、能通過什么樣的方式提供知識服務(wù)",AI技術(shù)在科學(xué)交流中的融合應(yīng)用,無疑為知識生產(chǎn)類型的豐富和知識傳播方式的創(chuàng)新提供了更多可能(47)。AI技術(shù)在學(xué)術(shù)出版領(lǐng)域的核心價值在于協(xié)助科研人員在更短時間內(nèi)發(fā)現(xiàn)新知識?;谥R生產(chǎn)邏輯的差異,在一段時間內(nèi)AI技術(shù)更適用于自然科學(xué)領(lǐng)域知識的生產(chǎn),人文社會科學(xué)領(lǐng)域由于其倫理價值的原生性特質(zhì),而使AI技術(shù)徘徊于核心圈層之外。盡管如此,探討AI在人文社科領(lǐng)域的應(yīng)用邊界不可回避且有著不容輕忽的意義,受篇幅所限本文未能深入探討。概而言之,目前智能化的知識發(fā)現(xiàn)成果大多出自科研院所和高校實驗室,學(xué)術(shù)出版商在知識生產(chǎn)方面的探索還處于起步階段,并且大多尚處于輔助地位。本研究對出版領(lǐng)域知識生產(chǎn)功能的探索,可以拓寬科學(xué)工作者和學(xué)術(shù)出版商的創(chuàng)新思路,對學(xué)術(shù)出版企業(yè)提高應(yīng)用智能技術(shù)實現(xiàn)創(chuàng)新等問題提供了啟示。展望未來,學(xué)術(shù)出版商如何從整體學(xué)術(shù)環(huán)境和技術(shù)應(yīng)用趨勢出發(fā),搭建智能化出版平臺幫助科研團(tuán)隊和機(jī)構(gòu)更好地開展學(xué)術(shù)創(chuàng)新是后續(xù)研究的核心問題,而不同學(xué)科領(lǐng)域、不同類型的科研合作方式對智能學(xué)術(shù)出版平臺的功能價值、服務(wù)內(nèi)涵有不同要求,因此,分類探究不同類型智能學(xué)術(shù)出版平臺及其服務(wù)創(chuàng)新模式將是下一步研究的重點。注釋:①賀桂;瑩.知識生產(chǎn)與傳播[D].武漢:武漢大學(xué),2018:1-14②王曉光.人工智能與出版的未來[J].科技與出版,2017(11):4-6③張曉林.重新認(rèn)識知識過程和知識服務(wù)[人圖書情報工作,2009,53⑴:6-8④⑦楊炳儒.基于內(nèi)在機(jī)理的知識發(fā)現(xiàn)理論及其應(yīng)用[M].北京:電子工業(yè)出版社,2004:1-2,211-212⑤互聯(lián)網(wǎng)金融.Iris.AI:讓人工智能成為你的科研助手[EB/OL].[2020-11-04],⑥任翔.學(xué)術(shù)傳播的數(shù)據(jù)化與智能化:2017年歐美學(xué)術(shù)出版產(chǎn)業(yè)開展評述[J].科技與出版,2018(2):6-12⑧王宏澤?施普林格自然第一本由機(jī)器生成的書籍問世[EB/OL].[2020-12-14].04/03/content_32713781.htm⑨(26)AndyE.HowAItechnologycantamethescientificliterature[J].Nature,2018,561(7722):273-274⑩梁永霞,劉那么淵,楊中楷.引文分析學(xué)的知識流動理論探析[J].科學(xué)研究f2010,28(5):668-674(11)(12)(13)蘇新寧,朱云霞.面向知識服務(wù)的引文索引數(shù)據(jù)組織研究(I):引用數(shù)據(jù)特征及其作用分析[J].圖書與情報,2013(05):1-6(14)鄧仲華,李志芳.基于情報學(xué)視角的科學(xué)研究第四范式需求分析臼情報科學(xué),2015,33⑺:3-6,20(15)劉磊.從數(shù)據(jù)科學(xué)到第四范式:大數(shù)據(jù)研究的科學(xué)淵源[J].廣告大觀(理論版),2016⑵:44-52Q6)彭鑫,鄧仲華.數(shù)據(jù)密集型科研環(huán)境下的科研數(shù)據(jù)管理框架研究[J].數(shù)字圖書館論壇,2017⑺:61-67(17)梁子裕.國外科研數(shù)據(jù)出版模式研究[J].出版發(fā)行研究,2017(3):82-85Q8)胡紅亮,郭傳斌彳亍業(yè)生態(tài)變革中的醫(yī)學(xué)知識^務(wù)模式創(chuàng)新:以科學(xué)技術(shù)文獻(xiàn)出版社醫(yī)學(xué)出版轉(zhuǎn)型為例[J].出版科學(xué),2018,26(4):47-51(19)李敏."花伴侶":人工智能時代知識^務(wù)的新媒介[J].出版參考,2018(8):23-24(20)王脆濤.出版業(yè)智能化開展研究的學(xué)術(shù)構(gòu)想:關(guān)鍵維度與可用視角[J].新聞界,2018(11):95-100(21)梁祝平.自然科學(xué)與社會科學(xué)方法的異同及其啟示[J].學(xué)術(shù)論壇,2000⑶:12-15(22)崔樹芝.牟宗三對西方科學(xué)源流的反思[J].孔子研究,2018(6):122-129(23)孫小禮.自然科學(xué)方法與社會科學(xué)方法的相互借鑒和結(jié)合[J].清華大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2005(1):76-80(24)李醒民.論科學(xué)經(jīng)驗方法[J].社會科學(xué)論壇(學(xué)術(shù)評論卷),2009(2):5-25(25)(33)黃欣榮.數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)及其哲學(xué)問題[J].自然辯證法研究,2015,31(11):48-54(27)向颯.人工智能對學(xué)術(shù)出版流程的再造及知識服務(wù)提升[J].中國科技期刊研究,2018,29(11):1091-1096(28)(37)李醒民.知識的三大部類:自然科學(xué)、社會科學(xué)和人文學(xué)科[J].學(xué)術(shù)界f2012(8):5-33,286(29)耿云冬,魏向清.科學(xué)研究"第四范式”轉(zhuǎn)向與詞典編纂技術(shù)特征創(chuàng)新研究[〃.外語電化教學(xué),2017⑵:65-70(30)(35)董良廣.出版企業(yè)基于人工智能開展知識服務(wù)的路徑探索:以人民衛(wèi)生出版社為例[J].出版廣角,2017(14):16-19(31)伯納德?巴伯?科學(xué)與社會秩序[M].北京:生活?讀書?新知三聯(lián)書店,1991:21-22(32)張祥龍.人工智能與廣義心學(xué):深度學(xué)習(xí)和本心的時間含義芻議[J].哲學(xué)動態(tài),2018(4):13-22(34)洪娜,錢慶,范煒,等.關(guān)聯(lián)數(shù)據(jù)中關(guān)系發(fā)現(xiàn)的可視化實踐[幾現(xiàn)代圖書情報技術(shù),2013⑵:11-17(36)美國化學(xué)文摘社.約翰威立國際出版公司與美國化學(xué)文摘社宣布合作聯(lián)手為全球科研人員提供先進(jìn)的預(yù)測化學(xué)信息工具[J].上海醫(yī)藥,2017,38(11):32(38)郭榮茂.共建:科學(xué)知識生產(chǎn)過程的"社會"品格[J]自然辯證法通訊f2018,40(5):88-94(39)劉銀娣.學(xué)術(shù)出版領(lǐng)域的人工智能應(yīng)用:現(xiàn)狀、挑戰(zhàn)與應(yīng)對[幾科技與出版,2019,289(1):64-68(40)方卿,王一鳴,李舒格技術(shù)的閘門已開啟:2016年海外學(xué)術(shù)出版技術(shù)熱點分析[J].科技與出版,2017⑵:15-19(41)(47)叢挺.基于知識鏈的全球?qū)W術(shù)出版服務(wù)模式創(chuàng)新研究[J].出版科學(xué),2018,26(1):27-32(42)杰貝威爾遜.2018年AI如何在學(xué)術(shù)出版中落地[EB/OL].(2021-06-21/1433213430.Html(43)托馬斯?庫恩?科學(xué)革命的結(jié)構(gòu)[M].北京:北京大學(xué)出版社,2012:85-87(44)KingC,PendleburyD.2013研究前沿:自然科學(xué)與社會科學(xué)的前100個探索領(lǐng)域[J].科學(xué)觀察,2013(4):1-21(45)胡英奎,游濱,王秀玲,等.科技期刊編輯跟蹤學(xué)術(shù)前沿的途徑[J].編輯學(xué)報,2010,22(4):307-308(46)方卿,王一鳴.論出版的知識服務(wù)屬性與出版轉(zhuǎn)型路徑[J].出版科學(xué),2020,28(1):22-29人工智能/學(xué)術(shù)出版/知識生產(chǎn)/自然科學(xué)/Ar工智cialintelligcncc/Acadcmicpublishicg/Knowlcdg。production/Noturalscience期刊名稱:《出版業(yè)》復(fù)印期號:2022年02期[中圖分類號]G230[文獻(xiàn)標(biāo)識碼]A[文章編號]1009?5853(2021)06?0012-08伴隨著新技術(shù)的開展和應(yīng)用,知識的生產(chǎn)、存儲與傳播方式發(fā)生了顛覆性改變。傳統(tǒng)出版企業(yè)作為作者與讀者的中間機(jī)構(gòu),強(qiáng)調(diào)自身的篩選、過濾、聚合、優(yōu)化和傳播功能,知識生產(chǎn)的核心主體是作者(高校科研人員、職業(yè)科學(xué)家、專業(yè)作家等);如今,信息服務(wù)商、科技企業(yè)、出版機(jī)構(gòu)也紛紛活躍于知識生產(chǎn)的舞臺,尤其是學(xué)術(shù)出版商,掌握著大量的學(xué)術(shù)數(shù)據(jù),不再滿足于知識的把關(guān)人和傳播者身份①,力求在知識生產(chǎn)、優(yōu)化、存儲和傳播等環(huán)節(jié)中發(fā)揮更為重要的參與、服務(wù)作用。1智能出版給知識生產(chǎn)帶來的新機(jī)遇AI技術(shù)為學(xué)術(shù)出版商在知識生產(chǎn)領(lǐng)域的創(chuàng)新性探索提供了契機(jī),傳統(tǒng)出版時期,書籍制度作為一種固定規(guī)范應(yīng)用到知識生產(chǎn)中,人類的知識以有形的方式被切割成有限的文本,集聚在統(tǒng)一的書本中,被賦予序言、目錄、標(biāo)題、后記等形式。這種分割表達(dá)了人為的創(chuàng)造與建構(gòu),表達(dá)了作者的意志和目的,書籍形態(tài)將作為總體的知識分門別類,使知識得以集中表達(dá),但是也有學(xué)者認(rèn)為書籍制度使人類的知識被不合理地斷裂和孤立開來。信息科學(xué)與AI技術(shù)的進(jìn)步催生了人類科研事業(yè)的革命,知識生產(chǎn)形式發(fā)生了巨大轉(zhuǎn)變。一方面,圖書再次被別離成一句句話或一個個段落,重組成面向用戶需求的新文本,如知網(wǎng)的知識元搜索、亞馬遜的單章圖書售賣等都是典型例證。另一方面,知識本身又重新進(jìn)入到更大的統(tǒng)一體中,圖書與圖書、期刊與期刊、學(xué)科與學(xué)科間的界限被打破,知識借力技術(shù)創(chuàng)新經(jīng)過聚合優(yōu)化重歸于完整。在知識生產(chǎn)領(lǐng)域,智能出版的關(guān)鍵作用在于突破學(xué)科間的知識界限,從而在更大的關(guān)聯(lián)網(wǎng)絡(luò)中深化已有知識并發(fā)現(xiàn)、培育新知識的“萌芽"。2智能出版對知識生產(chǎn)的作用機(jī)理知識載體的沿革打破了知識之間的阻隔,創(chuàng)造了新的知識流動空間,智能出版的核心價值在于發(fā)現(xiàn)新的知識②。科研實驗數(shù)據(jù)、已出版文獻(xiàn)、引用數(shù)據(jù)三者按照時間次序貫穿于知識生產(chǎn)前期、中期和后期,數(shù)字密集型科研范式的興起將鼓勵人工智能技術(shù)全方位地介入知識生產(chǎn)的整個流程。在已出版文獻(xiàn)中發(fā)現(xiàn)新知識新知識發(fā)現(xiàn)的關(guān)鍵在于發(fā)現(xiàn)新關(guān)聯(lián),有學(xué)者認(rèn)為關(guān)聯(lián)本身就是知識,數(shù)據(jù)當(dāng)中隱藏著大量的知識內(nèi)容和知識關(guān)系③,人的思維依照相似聯(lián)系律進(jìn)行活動,認(rèn)知過程貫穿著相似信息的搜索、匹配和基于相似的推理,知識發(fā)現(xiàn)過程同樣基于相似性原理并采用挖掘算法發(fā)現(xiàn)新關(guān)聯(lián)④。近年來,語義技術(shù)與機(jī)器學(xué)習(xí)的進(jìn)展彌補(bǔ)了傳統(tǒng)知識發(fā)現(xiàn)方法的缺乏,提升了相似性判斷的準(zhǔn)確性,改善了知識發(fā)現(xiàn)的效果,比方愛麗思AI(Iris.AI)⑤的分析技術(shù)將詞語與語境語義結(jié)合,UNSILO的全自動內(nèi)容加強(qiáng)技術(shù)能夠?qū)崿F(xiàn)跨專業(yè)的內(nèi)容推薦⑥。從科學(xué)哲學(xué)和科學(xué)史的角度來看,科學(xué)研究活動遵循一定的程式和規(guī)范,科學(xué)家通過數(shù)據(jù)驅(qū)動歸納和理論驅(qū)動歸納兩種方式解決問題獲得知識⑦。前者指科學(xué)家先收集大量數(shù)據(jù),然后總結(jié)、發(fā)現(xiàn)規(guī)律,如施普林格?自然通過對大量論文進(jìn)行跨語料自動摘要,基于相似性聚類自動生成了第一本化學(xué)類書籍⑧。后者理論驅(qū)動歸納那么要求研究者具有豐富的學(xué)術(shù)想象力,預(yù)先提出假設(shè)作為研究準(zhǔn)備。計算智能擅于多重推理,研究人員正在嘗試如何基于已有研究結(jié)果來驗證現(xiàn)有的科學(xué)假設(shè),甚至通過揭示不同文獻(xiàn)的研究發(fā)現(xiàn)彼此之間的聯(lián)系,提出指導(dǎo)實驗的新假設(shè)⑨。這兩種方式在人工智能技術(shù)的推動下都能夠為知識的創(chuàng)造、優(yōu)化提供新的路徑。從引用數(shù)據(jù)中發(fā)現(xiàn)新知識引文數(shù)據(jù)本身蘊(yùn)含了作者對于文獻(xiàn)的專業(yè)判斷,展現(xiàn)了知識的進(jìn)化過程,最初借鑒的文章經(jīng)過層層引用,實現(xiàn)了知識的分化、轉(zhuǎn)變和拓展,表面上知識的原型已難以識別⑩,但通過引證信息的梳理,我們能夠追溯知識的基礎(chǔ),發(fā)現(xiàn)學(xué)科的歷史和前沿以及不同學(xué)科之間成熟度的差異,等等(ll)o在傳統(tǒng)科研環(huán)境中,知識間充滿阻礙,知識的開展過程難以識別,數(shù)字時代的科研通過聚集大量文獻(xiàn)實現(xiàn)了對知識開展過程的深度解析。AI的介入使引用數(shù)據(jù)的分析不再局限于分析知識的統(tǒng)計學(xué)特征,而是基于對引用文獻(xiàn)的內(nèi)容理解,縱深挖掘數(shù)據(jù)中含藏的科研價值。舉例來說,引文在文獻(xiàn)中充當(dāng)?shù)慕巧话阌兴姆N:綜述式、繼承式、啟發(fā)式、批評式(12)。通過分析引文角色,可以發(fā)現(xiàn)更多的隱性知識,如屢次被肯定性引用的文章通常蘊(yùn)含更豐富的價值(13),啟發(fā)式引用說明知識在此實現(xiàn)了深度轉(zhuǎn)化。AI技術(shù)可通過對不同引用方式中引用習(xí)慣、引用形式等信息的分析分辨出引用角色,如否認(rèn)性引用的上下文中可能出現(xiàn)批評性、轉(zhuǎn)折性詞匯,肯定性引用的上下文通常直接跟上作者本人的觀點,啟發(fā)式引用的表達(dá)相較于原文通常發(fā)生較大改變。這些分析在傳統(tǒng)出版時代必須由讀者自己根據(jù)專業(yè)知識和閱讀經(jīng)驗來完成,在智能媒體時代引文數(shù)據(jù)中潛藏的知識顯然可以借助技術(shù)的力量來外顯。23在原始科研實驗數(shù)據(jù)中發(fā)現(xiàn)新知識知識與知識的碰撞不僅是知識間的重新關(guān)聯(lián),也是兩個知識形成過程的關(guān)聯(lián)。傳統(tǒng)出版業(yè)僅僅關(guān)注科研鏈條中最為精華的局部,科研數(shù)據(jù)作為記錄科研原始過程的非正式信息逐步喪失(14),這一方面不利于學(xué)術(shù)監(jiān)督和知識記錄,另一方面也不利于充分挖掘科研數(shù)據(jù)的價值,造成了社會資源的浪費。事實上,隨著數(shù)據(jù)密集型科研范式的提出,科研數(shù)據(jù)管理逐步得到各方的重視,1966年,國際科技數(shù)據(jù)委員會(CODATA)成立,它旨在促進(jìn)全球科技數(shù)據(jù)的評價、編輯和分發(fā)工作(15)。國內(nèi)外高校和基金機(jī)構(gòu)也已經(jīng)不同程度地開展了科研數(shù)據(jù)管理工作(16)。學(xué)術(shù)出版領(lǐng)域出現(xiàn)了數(shù)據(jù)期刊和數(shù)據(jù)論文,諸如《地球系統(tǒng)科學(xué)數(shù)據(jù)》(EarthSystemScienceDate,ESSD)等國際期刊要求將數(shù)據(jù)作為論文的附錄一同公布,甚至自建了完整的存儲數(shù)據(jù)服務(wù)中心(17)。盡管如此,目前的科研數(shù)據(jù)管理仍存在不少缺憾,比方數(shù)據(jù)標(biāo)準(zhǔn)不一、質(zhì)量粗糙,真正能用于科研的資源較少,智能化的科研數(shù)據(jù)管理將逐步改善數(shù)據(jù)的質(zhì)量,提高數(shù)據(jù)的利用率。我們認(rèn)為,科研數(shù)據(jù)出版過程包括數(shù)據(jù)收集、數(shù)據(jù)審核、數(shù)據(jù)保存、數(shù)據(jù)共享、數(shù)據(jù)利用五個階段,在上述流程中智能出版可以起到非常關(guān)鍵的作用,從知識服務(wù)的角度看,平臺化、服務(wù)化、社交化和工具化等趨勢是未來科研數(shù)據(jù)出版開展的重要方向。3智能出版在自然科學(xué)知識生產(chǎn)領(lǐng)域應(yīng)用的可行性目前,國內(nèi)學(xué)術(shù)出版企業(yè)在智能出版領(lǐng)域已經(jīng)開展了假設(shè)干探索,如科學(xué)技術(shù)文獻(xiàn)出版社與AI影像公司鷹瞳(Airdoc)等機(jī)構(gòu)合作探索智能化醫(yī)學(xué)知識服務(wù)Q8),中國科學(xué)院植物研究所開發(fā)了物種的智能識別應(yīng)用,以服務(wù)農(nóng)業(yè)、地質(zhì)等學(xué)科開展Q9)。人們已經(jīng)認(rèn)識到,AI介入知識生產(chǎn)關(guān)乎人的主體地位,涉及價值理性、文化開展與科技倫理等問題,AI時代如何合理地運(yùn)用技術(shù)能夠幫助我們?nèi)ニ伎既绾嗡茉煲粋€更加健康的出版業(yè)(20)。以下將立足于自然科學(xué)與人文社會科學(xué)兩大部類的共識性區(qū)分,探討AI在自然科學(xué)知識生產(chǎn)領(lǐng)域的應(yīng)用機(jī)制。智能化的數(shù)據(jù)獲取、審核和利用從研究方法的角度看,自然科學(xué)探索真理的根本屬性是定量研究,主要解決"是多大""有多少"等問題(21),科學(xué)文化的開展是化質(zhì)為量的坎陷過程,從依據(jù)審美精神而向上到落于實然而向下(22)。長期的科學(xué)訓(xùn)練培養(yǎng)了自然科學(xué)家處理仔細(xì)控制的實驗數(shù)據(jù)的能力(23),定量數(shù)據(jù)的采集那么主要通過實驗、觀察、測量等方式來完成(24)。研究方法的定量化與實證化為智能化的數(shù)據(jù)獲取、審核與利用提供了天然便利,讓AI賦能自然科學(xué)知識生產(chǎn)有了廣闊的成長空間。智能化的數(shù)據(jù)獲取和數(shù)據(jù)利用。智能化的學(xué)術(shù)環(huán)境正在重塑科學(xué)家進(jìn)行定量實驗的方式,實證數(shù)據(jù)的獲取不再是一次性的、正式的,各種觀測、實驗設(shè)備都裝備了智能系統(tǒng),實現(xiàn)了數(shù)據(jù)的智能采集和管理(25)。不僅如此,數(shù)據(jù)本身成為了科研活動的研究對象,科研人員通過與數(shù)據(jù)打交道開掘潛在規(guī)律,AI為文獻(xiàn)中的實驗數(shù)據(jù)賦予了深度關(guān)聯(lián)的可能性,打破了實驗數(shù)據(jù)孤立存在的局面,例如在線工具源數(shù)據(jù)(SourceData),能夠為科研人員提供生物實驗數(shù)據(jù)的搜索,可供查詢實驗中生物對象間的關(guān)系,相關(guān)團(tuán)隊還將結(jié)合AI與施普林格?自然(SpringerNature)的基因數(shù)據(jù)幫助腫瘤學(xué)家制定診療方案(26),幫助上述領(lǐng)域的科技工作者針泛數(shù)據(jù)離散導(dǎo)致的痛點。智能化的數(shù)據(jù)審核和加工。量化精神與實驗驗證原那么塑造了科學(xué)研究的典型特征,科學(xué)實驗及其產(chǎn)生的數(shù)據(jù)通常構(gòu)成一篇論文的關(guān)鍵局部,各種數(shù)據(jù)、公式、圖表占據(jù)了較大篇幅,純粹的思辨性文本數(shù)量較少。量化數(shù)據(jù)的主觀想象空間小,AI在提取和解讀數(shù)據(jù)的過程中依據(jù)規(guī)范,不易產(chǎn)生錯誤和歧義,因此,AI在科技論文的寫作、編輯、審議過程中大有作為,比方幫助作者和編輯對實驗樣本、實驗環(huán)境、實驗數(shù)據(jù)的統(tǒng)計方法和數(shù)學(xué)公式進(jìn)行核直和檢驗(27);為的數(shù)據(jù)自動生成曲線圖,或進(jìn)行可視化轉(zhuǎn)換;為數(shù)據(jù)生成描述性文本甚至解讀報告,有效減輕科研工作者的寫作壓力,提高科學(xué)信息交流的效率。智能化的學(xué)術(shù)語言翻譯從表達(dá)方式上看,相較于人文社會科學(xué)用語的模糊性、多義性和隱喻性等特征,自然科學(xué)的語言大多語義明晰、指稱單一,概念、定義、范疇的用語力圖擺脫日常語言和人為因素的干擾,專業(yè)性和區(qū)分度強(qiáng),利于精準(zhǔn)識別,甚至形成了一套形式化、數(shù)學(xué)化、公理化的語言系統(tǒng),奠定了人工智能進(jìn)行計算知識生產(chǎn)的基礎(chǔ)(28),知識表達(dá)的專業(yè)化與規(guī)范化推動了AI在學(xué)術(shù)語言翻譯過程中的應(yīng)用。隨著詞典研編從傳統(tǒng)的“編者主體經(jīng)驗驅(qū)動"轉(zhuǎn)變?yōu)?語言數(shù)據(jù)驅(qū)動”,語料庫成為語言學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論