介尺度中的復(fù)雜性-人工智能發(fā)展中的共性挑戰(zhàn)_第1頁(yè)
介尺度中的復(fù)雜性-人工智能發(fā)展中的共性挑戰(zhàn)_第2頁(yè)
介尺度中的復(fù)雜性-人工智能發(fā)展中的共性挑戰(zhàn)_第3頁(yè)
介尺度中的復(fù)雜性-人工智能發(fā)展中的共性挑戰(zhàn)_第4頁(yè)
介尺度中的復(fù)雜性-人工智能發(fā)展中的共性挑戰(zhàn)_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

一、人工智能取得飛躍式發(fā)展,逐漸成為多學(xué)科共性化技術(shù)手段近年來(lái),各種突破性科技報(bào)道接踵而至。谷歌(Google)公司研制的阿爾法狗(AlphaGo)圍棋程序相繼戰(zhàn)勝人類(lèi)頂尖棋手李世石和柯潔;無(wú)人駕駛汽車(chē)安全行駛數(shù)百萬(wàn)公里,已在美國(guó)十余個(gè)州取得合法行駛權(quán);圖像和語(yǔ)音識(shí)別技術(shù)日臻成熟并廣泛應(yīng)用于智能相機(jī)和手機(jī)等日常消費(fèi)品,給人們生活帶來(lái)極大便利。由此,人工智能(artificialintelligence,AI)這一舊名詞重回公眾視線,并掀起新一輪的發(fā)展熱潮。當(dāng)下,人工智能已然上升為許多國(guó)家的重大發(fā)展戰(zhàn)略,各國(guó)政府將其視為國(guó)家的核心競(jìng)爭(zhēng)力。人工智能涉及領(lǐng)域眾多,有望成為跨學(xué)科研究的示范性工程,并進(jìn)一步推動(dòng)各領(lǐng)域的協(xié)同發(fā)展。從1956年達(dá)特茅斯(Dartmouth)會(huì)議算起,人工智能從誕生至今已逾一個(gè)甲子,其主流技術(shù)發(fā)展大致經(jīng)歷了三個(gè)重要階段:推理期、知識(shí)期、學(xué)習(xí)期。1956年至20世紀(jì)70年代初,人工智能研究處于推理期,這一時(shí)期學(xué)者們主要研究基于規(guī)則的符號(hào)表示和推理模型,代表性成果是各種自動(dòng)定理證明程序。然而,隨著問(wèn)題難度逐漸增加,人們意識(shí)到,機(jī)器僅依靠邏輯推理能力難以實(shí)現(xiàn)智能。于是一些學(xué)者將研究思路由一般思維規(guī)律探索轉(zhuǎn)向了專門(mén)知識(shí)應(yīng)用,人工智能研究由此進(jìn)入了知識(shí)期。20世紀(jì)70年代初至80年代末,大量專家系統(tǒng)問(wèn)世,在一些特定應(yīng)用領(lǐng)域成效顯著。但是,隨著應(yīng)用規(guī)模不斷擴(kuò)大,人們發(fā)現(xiàn),把知識(shí)總結(jié)出來(lái)再教給機(jī)器非常困難。因此,一些學(xué)者主張讓它從數(shù)據(jù)中自動(dòng)學(xué)習(xí)知識(shí),人工智能研究由此進(jìn)入了學(xué)習(xí)期。20世紀(jì)90年代初至今,人工智能主要致力于機(jī)器學(xué)習(xí)理論和算法研究。機(jī)器學(xué)習(xí)不僅在圖像識(shí)別、語(yǔ)音識(shí)別等傳統(tǒng)人工智能任務(wù)上取得了突破性進(jìn)展,同時(shí)還極大促進(jìn)了其他學(xué)科的發(fā)展,諸如預(yù)測(cè)藥物分子活性、分析粒子加速過(guò)程、重建大腦回路、探索外太空行星、自動(dòng)診斷皮膚癌,以及預(yù)測(cè)非編碼DNA變異對(duì)基因表達(dá)和疾病的影響等。最新一輪的人工智能發(fā)展主要得益于三方面因素。第一,數(shù)據(jù)采集、存儲(chǔ)、傳輸技術(shù)的迅猛發(fā)展催生了大數(shù)據(jù),進(jìn)而為人工智能提供了充足的數(shù)據(jù)資源;第二,強(qiáng)力計(jì)算設(shè)備(如GPU和CPU集群)的出現(xiàn),以及并行計(jì)算技術(shù)的日趨成熟,為人工智能研究提供了算力保障;第三,科研人員在構(gòu)造大規(guī)模復(fù)雜模型方面積累了豐富的經(jīng)驗(yàn)和技巧,使得以深度神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)方法飛速發(fā)展,為人工智能提供了有效的技術(shù)途徑。如今人工智能已成為多學(xué)科共性化技術(shù)手段。凡是涉及到數(shù)據(jù)分析需求的領(lǐng)域,就能用到人工智能。二、深度學(xué)習(xí)大行其道、發(fā)展勢(shì)頭迅猛、涉及領(lǐng)域眾多,然其物理機(jī)制尚不明晰深度學(xué)習(xí)模型其實(shí)就是很多層的人工神經(jīng)網(wǎng)絡(luò),為避免混淆,本文統(tǒng)一稱之為深度神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)如圖1所示。該模型包含三個(gè)主要部分:輸入層、(多個(gè))隱藏層、輸出層。輸入層的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)輸入數(shù)據(jù)的一個(gè)維度(如圖像像素);輸出層的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)決策變量(如圖像語(yǔ)義類(lèi)別);隱藏層由很多“神經(jīng)元”互連而成,神經(jīng)網(wǎng)絡(luò)故此得名。

圖1.深度神經(jīng)網(wǎng)絡(luò)樣例從生物機(jī)制來(lái)說(shuō),一個(gè)神經(jīng)元接收其他神經(jīng)元傳送來(lái)的電位信號(hào),當(dāng)累計(jì)信號(hào)高于自身電位時(shí),該神經(jīng)元被激活并向外輸出信號(hào)。該過(guò)程可形式化描述為:y=f(wTx

+

b),其中,x=[x1,…,

xn]T和y分別表示神經(jīng)元接收到的多維信號(hào)和輸出的一維信號(hào),w=[w1,…,

wn]T表示輸入信號(hào)的權(quán)重,b表示偏置量,f為激活函數(shù)。由此可見(jiàn),深度神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個(gè)簡(jiǎn)單函數(shù)通過(guò)多層嵌套而成的數(shù)學(xué)模型。神經(jīng)生理學(xué)僅起到啟發(fā)作用,遠(yuǎn)不像媒體宣傳的那樣“深度神經(jīng)網(wǎng)絡(luò)是一種腦模擬計(jì)算”。實(shí)際上,大腦的工作原理目前尚未完全探明。當(dāng)許多神經(jīng)元按層次組合成深度神經(jīng)網(wǎng)絡(luò)后,該模型相當(dāng)于一個(gè)多層嵌套的復(fù)合函數(shù),每層對(duì)應(yīng)一個(gè)非線性映射(前一層的輸出信號(hào)作為下一層的輸入信號(hào)),整個(gè)網(wǎng)絡(luò)中的信號(hào)傳送可形式化描述為:y=f{W1…f

[W2

f(W1x

+

b1)+b2]…+

bL},其中,Wl和bl

(l

=1,2,…,L)分別表示網(wǎng)絡(luò)第l層所對(duì)應(yīng)的權(quán)重矩陣和偏置向量(即待求解的模型參數(shù))。由于每層網(wǎng)絡(luò)包含多個(gè)神經(jīng)元,故而此處模型參數(shù)被封裝表示為矩陣和向量形式。給定具體應(yīng)用任務(wù),深度神經(jīng)網(wǎng)絡(luò)首先要設(shè)計(jì)損失函數(shù)(用以度量網(wǎng)絡(luò)實(shí)際輸出與期望輸出間的差異),然后采用反向傳播(backpropagation)算法優(yōu)化損失函數(shù)并求解模型參數(shù),以此學(xué)習(xí)數(shù)據(jù)的多層次抽象表示。據(jù)統(tǒng)計(jì)學(xué)習(xí)理論可知,一個(gè)模型的參數(shù)越多,其復(fù)雜度就越高,相應(yīng)的學(xué)習(xí)能力也越強(qiáng)。深度神經(jīng)網(wǎng)絡(luò)可通過(guò)“加寬”或“加深”網(wǎng)絡(luò)結(jié)構(gòu)兩種方式提升模型復(fù)雜度。相比之下,后者效果更好。因?yàn)椤凹訉挕眱H能增加基函數(shù)個(gè)數(shù);而“加深”不僅可增加函數(shù)個(gè)數(shù),還增加了函數(shù)嵌套的層數(shù),從泛函表達(dá)上它的能力更強(qiáng)一些。因此,“深度”對(duì)提升模型復(fù)雜度和學(xué)習(xí)能力很有幫助。以計(jì)算機(jī)視覺(jué)領(lǐng)域的ImageNet競(jìng)賽為例,歷屆冠軍所使用的神經(jīng)網(wǎng)絡(luò)越做越深,從7層的AlexNet到16層的VggNet再到152層的ResNet。目前最深的神經(jīng)網(wǎng)絡(luò)甚至達(dá)到了上千層,模型參數(shù)多達(dá)幾十億。值得注意的是,如何設(shè)計(jì)“合適的”網(wǎng)絡(luò)結(jié)構(gòu)是決定深度神經(jīng)網(wǎng)絡(luò)應(yīng)用成功與否的關(guān)鍵。現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)大多是由專家手動(dòng)完成,這是一個(gè)非常耗時(shí)且容易出錯(cuò)的過(guò)程。近年來(lái),諸多學(xué)者在自動(dòng)機(jī)器學(xué)習(xí)(AutoML)領(lǐng)域開(kāi)了大量工作,特別是在自動(dòng)神經(jīng)結(jié)構(gòu)搜索(networkarchitecturesearch,NAS)方面取得了一些研究進(jìn)展。NAS的思路是定義了一個(gè)理論上包含了所有網(wǎng)絡(luò)結(jié)構(gòu)的搜索空間,然后在這個(gè)搜索空間中采用貝葉斯優(yōu)化、強(qiáng)化學(xué)習(xí)或神經(jīng)進(jìn)化學(xué)習(xí)等方法尋找可在未見(jiàn)數(shù)據(jù)上表現(xiàn)出良好預(yù)測(cè)性能的網(wǎng)絡(luò)結(jié)構(gòu)。雖然深度神經(jīng)網(wǎng)絡(luò)取得了諸多成功,但其模型的可解釋性問(wèn)題始終懸而未決。研究人員使用深度神經(jīng)網(wǎng)絡(luò)對(duì)實(shí)際問(wèn)題建模時(shí),完全將其視為“黑箱”,關(guān)注點(diǎn)主要集中在“黑箱”的輸入端和輸出端;網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)完全依靠科研人員的經(jīng)驗(yàn)和直覺(jué),未能與其待求解問(wèn)題的物理背景掛鉤。盡管深度神經(jīng)網(wǎng)絡(luò)的計(jì)算過(guò)程可以給出清晰的數(shù)學(xué)表達(dá),但很難從物理意義層面對(duì)其解釋,模型缺少反映問(wèn)題本質(zhì)的物理內(nèi)涵。即使AutoML技術(shù)有助于在預(yù)測(cè)性能方面找到“更好”的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),但它仍然無(wú)法從物理層面上得到解釋。人們?cè)鴩L試針對(duì)一些具體應(yīng)用任務(wù)對(duì)深度神經(jīng)網(wǎng)絡(luò)給予解釋。以圖像識(shí)別為例,研究人員對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetwork,CNN)進(jìn)行反卷積操作,試圖可視化每個(gè)隱藏層學(xué)到的視覺(jué)特征,以期對(duì)圖像識(shí)別過(guò)程給予解釋。但是,這種啟發(fā)性的解釋不具有普適性,難以推廣至其他深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用案例,未能深刻揭示模型背后的物理機(jī)制??山忉屝詥?wèn)題將成為阻礙深度神經(jīng)網(wǎng)絡(luò)進(jìn)一步發(fā)展的瓶頸。三、介科學(xué)有望成為揭示深度學(xué)習(xí)物理機(jī)制以及進(jìn)一步推動(dòng)人工智能發(fā)展的可行思路如何將深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)與待解決問(wèn)題的物理機(jī)制相關(guān)聯(lián),是人工智能是否能夠取得突破性進(jìn)展的關(guān)鍵。而物理機(jī)制的普適性則決定了人工智能的適用范圍,也是未來(lái)人工智能必須突破的根本性問(wèn)題。介科學(xué)的核心思想是:復(fù)雜性起源于系統(tǒng)中兩種以上作用機(jī)制的競(jìng)爭(zhēng)與協(xié)調(diào),從而產(chǎn)生復(fù)雜的時(shí)空動(dòng)態(tài)結(jié)構(gòu)。而人工智能研究的系統(tǒng)無(wú)一不是復(fù)雜系統(tǒng)。將介科學(xué)的原理和方法引入人工智能(目前主要是指以深度神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)技術(shù))中,對(duì)需要解決的問(wèn)題以介科學(xué)的原理進(jìn)行思考和分析,并在深度神經(jīng)網(wǎng)絡(luò)中應(yīng)用,或許是解決上述問(wèn)題的一個(gè)可行思路。介科學(xué)從研究化學(xué)工程領(lǐng)域中的氣固系統(tǒng)入手,并逐漸應(yīng)用于氣液系統(tǒng)、湍流、蛋白質(zhì)結(jié)構(gòu)、催化等問(wèn)題的研究中,逐步歸納出了共同的規(guī)律。其要點(diǎn)可歸納如下:復(fù)雜問(wèn)題總是多層次的,不同層次相互關(guān)聯(lián);每一層次又是多尺度的,由無(wú)數(shù)單元構(gòu)成一個(gè)系統(tǒng);介于單元和系統(tǒng)之間,往往出現(xiàn)由于單元群體效應(yīng)而產(chǎn)生的時(shí)空多尺度動(dòng)態(tài)結(jié)構(gòu);這種結(jié)構(gòu)隨邊界和外部條件的變化,會(huì)出現(xiàn)(以兩種機(jī)制控制的系統(tǒng)為例)三個(gè)有完全不同屬性的區(qū)域。A-B區(qū)域:這個(gè)區(qū)域由A和B兩個(gè)機(jī)制共同控制,稱為介區(qū)域。該區(qū)域的結(jié)構(gòu)交替顯現(xiàn)兩種狀態(tài),由A和B的競(jìng)爭(zhēng)中的協(xié)調(diào)控制,此時(shí)系統(tǒng)結(jié)構(gòu)符合:A

區(qū)域:當(dāng)外部條件變化時(shí),B作用消失,A單獨(dú)控制該系統(tǒng),此時(shí)系統(tǒng)結(jié)構(gòu)特征簡(jiǎn)單,符合:A=minB區(qū)域:當(dāng)外部條件向反方向變化,A作用消失,B單獨(dú)控制該系統(tǒng),此時(shí)系統(tǒng)結(jié)構(gòu)符合:B=min最為重要的是,A、A-B、B區(qū)域之間的轉(zhuǎn)變往往伴有系統(tǒng)特征和性能的突變。深度神經(jīng)網(wǎng)絡(luò)所面對(duì)的問(wèn)題往往是復(fù)雜系統(tǒng),系統(tǒng)的輸出與輸入之間的關(guān)聯(lián)關(guān)系通常是復(fù)雜的多變量非線性關(guān)系。采用介科學(xué)理論對(duì)復(fù)雜系統(tǒng)的認(rèn)識(shí)來(lái)審視現(xiàn)有的深度神經(jīng)網(wǎng)絡(luò),可以提出如下“基于介科學(xué)的人工智能”研究與應(yīng)用范式:假設(shè)有一個(gè)龐大的訓(xùn)練數(shù)據(jù)集,希望通過(guò)深度學(xué)習(xí)技術(shù)建立表達(dá)其內(nèi)在規(guī)律的模型,根據(jù)介科學(xué)的概念和邏輯,可以采取如下步驟:(1)分析這些數(shù)據(jù)涉及幾個(gè)層次;(2)對(duì)每一個(gè)層次進(jìn)行分析是否存在三個(gè)區(qū)域;(3)如屬于A或B區(qū)域,結(jié)構(gòu)很簡(jiǎn)單,采用現(xiàn)有深度學(xué)習(xí)技術(shù)即可解決;(4)如處于A-B介區(qū)域,即系統(tǒng)有顯著的時(shí)空動(dòng)態(tài)結(jié)構(gòu),則要分析其控制機(jī)制,采取考慮結(jié)合兩種機(jī)制的多目標(biāo)變分模型進(jìn)行訓(xùn)練建模;(5)對(duì)每一層次進(jìn)行分析后,再進(jìn)行幾個(gè)層次的關(guān)聯(lián)。分析上面的步驟,對(duì)于屬于A或B區(qū)域的問(wèn)題,從介科學(xué)的角度觀察,其極值條件較為簡(jiǎn)單,因此用現(xiàn)有深度學(xué)習(xí)技術(shù)即可快速迭代到解,建立數(shù)學(xué)模型;對(duì)于位于A-B介區(qū)域的問(wèn)題,輸入數(shù)據(jù)與輸出結(jié)果之間的關(guān)聯(lián)關(guān)系是由多個(gè)機(jī)制共同控制的,因此使用原有的技術(shù)需要仔細(xì)調(diào)整網(wǎng)絡(luò)的參數(shù),并且需要花費(fèi)比較長(zhǎng)的時(shí)間才能最終建立模型。此時(shí)若按照介科學(xué)的思想進(jìn)行機(jī)制分解,并針對(duì)不同控制機(jī)制的變化趨勢(shì)采用多目標(biāo)變分方法,與經(jīng)典的反向傳播算法相耦合,可以較快速地迭代到滿足誤差條件的解。對(duì)于需要采用深度學(xué)習(xí)方法解決的復(fù)雜系統(tǒng)問(wèn)題,若能首先在物理層面分析其控制機(jī)制,再按照上述步驟建立模型,不但可加速求解,同時(shí)有利于更深刻地理解系統(tǒng)的物理本質(zhì),也有利于從物理的角度對(duì)所建立的模型進(jìn)行分析和解讀。上面將區(qū)域分解、控制機(jī)制辨識(shí)及多目標(biāo)變分等介科學(xué)的核心思想和方法引入到深度學(xué)習(xí)技術(shù)中,可望實(shí)現(xiàn)一種通用的處理方法,克服現(xiàn)有人工智能存在的一些問(wèn)題。四、介科學(xué)可改進(jìn)人工智能的問(wèn)題求解范式基于深度神經(jīng)網(wǎng)絡(luò)的人工智能理論和應(yīng)用研究的基本流程如圖2所示。其大致過(guò)程為:

圖2.現(xiàn)有的人工智能研究與應(yīng)用流程示意圖(1)收集訓(xùn)練數(shù)據(jù):從應(yīng)用場(chǎng)景(往往是復(fù)雜系統(tǒng))中采集(足夠多的)數(shù)據(jù),若涉及有監(jiān)督學(xué)習(xí)還需對(duì)數(shù)據(jù)進(jìn)行標(biāo)注;(2)構(gòu)造深度神經(jīng)網(wǎng)絡(luò):選擇適當(dāng)?shù)木W(wǎng)絡(luò)結(jié)構(gòu)、優(yōu)化目標(biāo)及算法,通過(guò)訓(xùn)練得到可有效描述數(shù)據(jù)集潛在模式的統(tǒng)計(jì)模型;(3)應(yīng)用模型:將訓(xùn)練好的模型對(duì)新數(shù)據(jù)進(jìn)行預(yù)測(cè)。上述流程的核心是構(gòu)建深度神經(jīng)網(wǎng)絡(luò),但目前受限于人工神經(jīng)網(wǎng)絡(luò)自身的“黑箱”問(wèn)題,研究人員只能憑借經(jīng)驗(yàn)和直覺(jué)設(shè)計(jì)深度神經(jīng)網(wǎng)絡(luò)。為此,本文借鑒介科學(xué)理論方法對(duì)該流程進(jìn)行改進(jìn),進(jìn)而得到如圖3所示的新流程。

圖3.引入介科學(xué)的人工智能研究與應(yīng)用流程示意圖在圖2和圖3中,解決復(fù)雜系統(tǒng)的復(fù)雜問(wèn)題是人工智能的目標(biāo),同時(shí)它也為人工智能提供應(yīng)用場(chǎng)景和海量數(shù)據(jù)集。人腦是一種特殊的復(fù)雜系統(tǒng),腦科學(xué)研究人類(lèi)思維的物質(zhì)基礎(chǔ)和機(jī)制,是人工智能未來(lái)發(fā)展的重要基礎(chǔ),對(duì)于復(fù)雜系統(tǒng)認(rèn)識(shí)的提高,也將促進(jìn)腦科學(xué)的發(fā)展。當(dāng)前深度神經(jīng)網(wǎng)絡(luò)的成功可以看作僅是數(shù)學(xué)上的成功,未來(lái)如果能把腦科學(xué)的研究成果融入人工智能中,必然會(huì)大大推動(dòng)人工智能的研究和應(yīng)用。腦科學(xué)家試圖揭示人類(lèi)大腦的秘密,不但從生理解剖方面、而且要從思維的發(fā)生發(fā)展機(jī)制上進(jìn)行研究,從而可以了解思維和智能是如何發(fā)生和應(yīng)用的,進(jìn)而將這些知識(shí)與IT軟硬件技術(shù)結(jié)合,試圖構(gòu)造出能與人類(lèi)大腦相媲美的“人造大腦”;而另一方面,所有人的大腦構(gòu)造和功能幾乎一致,但是顯然不同的人運(yùn)用大腦解決問(wèn)題的能力是不同的,其中的關(guān)鍵是人在接受了相應(yīng)的教育和訓(xùn)練之后,在面對(duì)問(wèn)題時(shí),將對(duì)問(wèn)題物理本質(zhì)的了解與大腦的推理、歸納等能力相結(jié)合,才能在有限的時(shí)間內(nèi)得到正確的結(jié)果。因此,人工智能解決實(shí)際問(wèn)題的能力應(yīng)該取決于腦科學(xué)和IT技術(shù)的發(fā)展、對(duì)問(wèn)題物理本質(zhì)的了解和應(yīng)用,以及這三者之間有效的集成和耦合。盡管介科學(xué)理論來(lái)源于化學(xué)工程領(lǐng)域,但它的基本原理在其他的復(fù)雜系統(tǒng)中也同樣適用。介科學(xué)的核心思想是發(fā)現(xiàn)系統(tǒng)中的多層次關(guān)聯(lián)和多尺度耦合,從中尋找不同層次的介區(qū)域和控制機(jī)制,用多目標(biāo)變分的數(shù)學(xué)方法尋求各控制機(jī)制在競(jìng)爭(zhēng)中協(xié)調(diào)的規(guī)律,以此來(lái)解決系統(tǒng)的問(wèn)題。在圖3所示的新研究范式中,介科學(xué)對(duì)學(xué)習(xí)方法的改進(jìn)、對(duì)模型的優(yōu)化,以及對(duì)相關(guān)的計(jì)算硬件和計(jì)算方法的優(yōu)化等方面可以發(fā)揮重要的作用。從介科學(xué)理論到人工智能,需要研究的問(wèn)題和克服的困難還有很多。比如,Google的AlphaGoFan所采用的核心技術(shù)是深度強(qiáng)化學(xué)習(xí)(deepreinforcementlearning),它融合了深度學(xué)習(xí)的感知能力和強(qiáng)化學(xué)習(xí)的決策能力,從而能戰(zhàn)勝人類(lèi)圍棋世界冠軍。AlphaGo結(jié)合深度強(qiáng)化學(xué)習(xí)技術(shù)和蒙特卡羅樹(shù)搜索策略,通過(guò)價(jià)值網(wǎng)絡(luò)(valuenetwork)來(lái)評(píng)估棋局當(dāng)前的局面以減小搜索深度,使用策略網(wǎng)絡(luò)(policynetwork)來(lái)降低搜索寬度,從而大幅提高搜索效率。AlphaGo是深度強(qiáng)化學(xué)習(xí)技術(shù)的一個(gè)成功的應(yīng)用實(shí)例。從系統(tǒng)結(jié)構(gòu)上分析深度強(qiáng)化學(xué)習(xí)技術(shù),可分成成千上萬(wàn)個(gè)感知機(jī)→若干深度學(xué)習(xí)網(wǎng)絡(luò)→深度強(qiáng)化學(xué)習(xí)策略三個(gè)層次,正好與介科學(xué)理論中復(fù)雜系統(tǒng)的單元尺度→介尺度→系統(tǒng)尺度的分層相吻合,是否可以將介科學(xué)理論中有關(guān)的分析方法與手段直接應(yīng)用到深度強(qiáng)化學(xué)習(xí)技術(shù)中是一個(gè)值得深入研究的問(wèn)題。值得注意的是,DeepMind開(kāi)發(fā)了四個(gè)AlphaGo版本:Fan、Lee、Master和Zero。早期版本的AlphaGo,如Fan和Lee都是通過(guò)有監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)來(lái)訓(xùn)練的,最新版本的AlphaGoZero則完全是沒(méi)有使用任何人類(lèi)的棋局和知識(shí),僅通過(guò)自我對(duì)弈來(lái)進(jìn)行強(qiáng)化學(xué)習(xí)而完成訓(xùn)練,并且只使用了一個(gè)深層神經(jīng)網(wǎng)絡(luò),而不像早期那樣使用了策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)兩個(gè)網(wǎng)絡(luò)。在本文我們僅以AlphaGoFan為例的原因有二:首先,AlphaGoFan是最復(fù)雜的版本,由于本文聚焦于分析復(fù)雜系統(tǒng),因此AlphaGoFan是四個(gè)版本中最典型的一個(gè);其次,無(wú)論策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)是分離的(如AlphaGoFan和Lee)還是合并的(如AlphaGoZero),按照介科學(xué)的原理來(lái)分析,它們都屬于介尺度的層次。再比如,生成式對(duì)抗網(wǎng)絡(luò)(generativeadversarialnetworks,GAN)是目前應(yīng)用比較成功的深度學(xué)習(xí)模型,它通過(guò)生成模型(generativemodel)和判別模型(discriminativemodel)的互相博弈來(lái)進(jìn)行預(yù)測(cè)學(xué)習(xí)。GAN的最終目標(biāo)是在判別模型的幫助下,由生成模型產(chǎn)生出與真實(shí)數(shù)據(jù)分布一致的偽數(shù)據(jù)。這兩個(gè)模型分別有自己的目標(biāo):生成模型試圖生成可以騙過(guò)判別模型的數(shù)據(jù)結(jié)果,判別模型努力將生成模型產(chǎn)成的數(shù)據(jù)與真實(shí)數(shù)據(jù)進(jìn)行區(qū)分。在GAN的建立

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論