




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
神經(jīng)信息編碼綜述沙漠蟻在尋找食物時會行走很長的距離,當一只螞蟻搜索時,它以一種鋸齒形彎彎曲曲的路徑運動。但是一旦該螞蟻發(fā)現(xiàn)了食源,它便轉(zhuǎn)向巢穴,并直接以直線方式向巢穴進發(fā)。它是怎么做到這一點的呢?原來中樞神經(jīng)系統(tǒng)記錄了該螞蟻的每一次左右轉(zhuǎn)向,并能計算它開始時的位置,進而指導(dǎo)它筆直的回家。如此復(fù)雜的信息整合依賴于由太陽發(fā)出的偏振光[1]提供的坐標。沙漠蟻的眼包含對偏振光敏感的特異光感受器群,這些光感受器向中樞神經(jīng)系統(tǒng)提供信息,由后者計算并記錄在空間中的運動而建立一種新矢量。以上這個簡單而又有趣的案例,向我們暗示了神經(jīng)信息編碼的過程和強大的功能。本章就帶領(lǐng)讀者具體了解人類大腦神經(jīng)信息編碼的生物學基礎(chǔ)和如何使用數(shù)學方法對神經(jīng)信息編碼進行建模分析。當然,本文不是專業(yè)教材,所以對很多知識點只是點到為止,不會過于深入,但是在介紹具體知識點時會不斷穿插一些非常有趣而經(jīng)典的應(yīng)用,使讀者能感受到神經(jīng)信息編碼的巨大魅力。另外,關(guān)鍵的作用是幫助讀者和筆者一起從神經(jīng)元信息編碼開始,到人腦結(jié)構(gòu)、認知心理學、認知-情感體系,最終到意識的涌現(xiàn),勾連出一個邏輯鏈條和理論框架,從而對人類自身活動的認識、理解提升到一個整體的層面,并最終獲得最高層次的精神洗禮。[1]光是一種橫波,由振動方向和光波前進方向構(gòu)成的平面稱為振動面,光的振動面如果只限于某一固定的方向,就是偏振光。第一節(jié)神經(jīng)元的結(jié)構(gòu)神經(jīng)元又稱神經(jīng)細胞,是構(gòu)成神經(jīng)系統(tǒng)結(jié)構(gòu)的基本單位。神經(jīng)元是具有長突起的細胞,它由細胞體和細胞突起構(gòu)成。細胞體位于腦、脊髓和神經(jīng)節(jié)中,細胞突起可延伸至全身和組織中。細胞體是細胞含核的部分,其形狀大小有很大差別,直徑約4um-120um。核大而圓,位于細胞中央,染色質(zhì)少,核仁明顯。細胞體內(nèi)有斑塊狀的核外染色質(zhì)(舊稱尼爾小體),還有許多神經(jīng)纖維。細胞突起是由細胞體延伸出來的細長部分,又可分為樹突和軸突。每個神經(jīng)元都可以有一或多個樹突,可以接受刺激并將興奮傳入細胞體。每個神經(jīng)元只有一個軸突,可以把興奮從胞體傳送到另一個神經(jīng)元或者其他組織,如肌肉或腺體。圖1-1一個神經(jīng)元的典型特征不同部位、不同種類的神經(jīng)元,其胞體大小和形態(tài)各異,甚至同一種類的神經(jīng)元也相差很大。單就大小而言,其直徑在3-155um之間,如人類小腦顆粒細胞之間約為5-8um,而脊髓運動神經(jīng)元直徑可超過120um。胞體的形態(tài)有圓形、橢圓形、錐形、梭形等。如果加上突起,神經(jīng)元的形態(tài)和大小就更加千差萬別,從突起的長短看,有的很短,有的長達1m以上;就突起的多少而言,有一個、兩個的,也有成千上萬的。一個神經(jīng)元通常只有一個軸突。也有的神經(jīng)元缺乏軸突,只有樹突。而且樹突的多少、長短和分布是多種多樣的,故整個神經(jīng)元的形態(tài),主要由樹突決定的。如果神經(jīng)信息編碼是存在于脈沖序列之中[1],神經(jīng)回路是處理這些脈沖序列信號的基礎(chǔ)。而回路的基本單元是神經(jīng)元,首先要考慮一個神經(jīng)元的輸入輸出的變化關(guān)系。當一個神經(jīng)元有成千上萬個樹突,會引發(fā)一個問題,就是信息海量輸入的問題,如圖1-2,是一個小腦中的浦肯野細胞(是從小腦皮質(zhì)發(fā)出的唯一能夠傳出沖動的神經(jīng)元,浦肯野細胞軸突穿過顆粒層和白質(zhì)到達深部小腦核團,浦肯野細胞在運動協(xié)調(diào)中起著重要的作用),樹突可多達15萬個,也就是有15萬的突觸信息輸入處。這么多的突觸會使人們產(chǎn)生很多不可理解的猜測。1)從生理實驗上看,腦中神經(jīng)脈沖一般工作在幾十到幾百HZ的范[1]李軼.神經(jīng)信息處理及其應(yīng)用[D].浙江大學,2011:100-107.圍內(nèi),最高不會超過1000HZ。如果一個突觸1秒鐘內(nèi)接受一個脈沖,那么十幾萬個突觸就有十幾萬個脈沖/秒,這表明細胞工作在1MHZ以上的頻率,一個細胞根本不可能工作在這樣高的脈沖頻率上。如果說細胞在高頻輸入中都是處于閾值以下工作狀態(tài)。如果細胞每接收10個脈沖興奮一次(輸出一個脈沖),則神經(jīng)脈沖輸出仍然有好幾萬。已使神經(jīng)元處于飽和狀態(tài)。每一信號都可以有一個耦合強度問題,要使細胞正常工作,平均耦合強度應(yīng)在1/100。這種情況即使樹突內(nèi)傳遞處在閾值以下的分級電位狀態(tài),這么小的耦合強度已使突觸很難傳遞信號。而且從實驗可看出,樹突中是存在動作電位的,也就是說工作在閾值以上。2)有一種可能的猜測,在平時這些與該細胞相連的十幾萬個細胞,都沒有神經(jīng)脈沖發(fā)出。當一、二個突觸分支都有信號輸入時,其他信號不會輸入,這種狀態(tài)不太可能存在。要知道神經(jīng)系統(tǒng)是靠神經(jīng)脈沖來維持它的生命的“健康”狀態(tài)的條件,如果沒有神經(jīng)脈沖,則這些軸突和相連的細胞突觸一定會萎縮掉。這些現(xiàn)象可從神經(jīng)傷殘病人中看出。神經(jīng)元不管是否工作,每一突觸一定會保持一定頻率的脈沖序列存在。這種脈沖的出現(xiàn)是神經(jīng)系統(tǒng)中存在大量脈沖噪聲的原因。實驗也可證明,腦在休息時還是有脈沖信號存在。3)十幾萬個信息綜合能代表什么?特別是靠一個細胞能綜合出什么?實在使人難以理解。或者有一種可能的解釋是15萬個信息都來自一、二個細胞的信息源。也就是這許許多多的突觸實際上接受同樣信號,以便提供可靠性。即使這樣也用不著這么多,否則表明神經(jīng)系統(tǒng)的效率太低了。4)15萬個突觸輸入必須經(jīng)常保持有脈沖信號輸入,這些信號不是真正的有用信號就是噪聲。對于一個細胞來說,一般不太可能同時需要十幾萬個信號才能處理信息。如果有一部分不是信息而是噪聲,不管你如何合并、融合,合并的結(jié)果一定保有大量的噪聲。特別是當輸入的有用信號太少時,大量的突觸輸入都是低頻噪聲,噪聲的作用會掩蓋有用信號。這種情況細胞是如何處理的?這些噪聲在統(tǒng)計上是有一定規(guī)律嗎?即使有,這種有一定規(guī)律的噪聲也會在很大程度上“模糊”真正有用的信號。5)在腦中存在大量的錐體細胞和蒲肯野細胞,其中錐體細胞,它的突觸也有10000個數(shù)量級,由這些細胞構(gòu)成的神經(jīng)回路,不僅僅是一處具有海量輸入,凡是細胞與細胞相連的地方都有海量信號(噪聲脈沖)輸入到回路中來。這樣的神經(jīng)回路如何工作?在腦中還能用現(xiàn)有的神經(jīng)回路理論來分析問題嗎?這樣的問題還會有很多。海量樹突輸入信號處理實在使人難以理解。似乎以單細胞組成的神經(jīng)回路來分析神經(jīng)編碼是有很大困難。這也許是提出神經(jīng)元群體編碼的重要原因之一。希望從宏觀上(也就是從統(tǒng)計上)找規(guī)律是唯一的途徑。但是這方面的討論所得結(jié)果很少。要分析樹突信息過程,首先要進行樹突的結(jié)構(gòu)分析。蒲肯野細胞從胞體出發(fā)有四個突出部分,其中一個是軸突,其余三個都是樹突,從細胞一個突出部分出發(fā)包括與前面所有相連的樹狀系統(tǒng)可稱為一株樹突。每一樹突可以有很多分支。每一分支端部接收來自另一個細胞軸突輸入。浙江大學李秩博士提出一種新的視角解釋這種現(xiàn)象。他們研究發(fā)現(xiàn)神經(jīng)信號(神經(jīng)脈沖)在神經(jīng)元中各部分的傳遞是屬于可激發(fā)介質(zhì)中的傳遞性質(zhì)。圖1-3在神經(jīng)樹突中取出一段神經(jīng)段在神經(jīng)樹突或者軸突中取出一段神經(jīng)段,在某時刻產(chǎn)生對動作電位的區(qū)域稱為活動區(qū),這也是動作電位峰值所在區(qū)。在活動區(qū)膜內(nèi)為正電荷,而活動區(qū)臨近,如向前(將會出現(xiàn)動作電位)或向后(已經(jīng)出現(xiàn)過動作電位),膜內(nèi)則為負電荷。這種電荷的分布都是由離子通道的作用結(jié)果所致,或者說由于離子通道的作用不同而形成了軸突內(nèi)的離子濃度波。一小段活動興奮區(qū)見圖1-3,它會在它的鄰近產(chǎn)生電場,當電場強度超過閾值時,會促使鄰近區(qū)離子通道的激活,使鄰近區(qū)域離子濃度產(chǎn)生很大變化,從而達到興奮,形成一個脈沖,而此時原活動區(qū)會自動回復(fù)到原來的靜息狀態(tài)。這一過程完成了神經(jīng)脈沖向鄰近傳遞的一步,這種傳遞形式是離子波的形式進行的。照例這種過程應(yīng)該在活動區(qū)兩邊同時進行,但是活動區(qū)興奮時,正好是它的左鄰近區(qū)剛過了興奮期后的不應(yīng)期,這就保證了脈沖只能朝右邊傳播。這是激發(fā)介質(zhì)動力學的特性,這種傳遞的波形并不取決于輸入信號的形狀,只是與當?shù)氐奶匦杂嘘P(guān)(包括膜離子通道和該區(qū)段的電特性),在均勻的軸突中波形傳輸將保持不變。在樹突中傳播的性質(zhì)和軸突一樣,而且這種現(xiàn)象在樹突中表現(xiàn)更有意義。李博士在討論脈沖序列在樹突相互作用時,發(fā)現(xiàn)了樹突系統(tǒng)中出現(xiàn)了一種可激發(fā)介質(zhì)波的傳遞現(xiàn)象,他們稱之為“Pr效應(yīng)”。取一段樹突的直線段,用一直線表示,如果在它的兩段輸入脈沖序列刺激{δi}和{δi′}({δi}頻率較高)。開始時如圖1-4中A所示,兩邊信號可按激發(fā)介質(zhì)動力學規(guī)律相對前進。到B狀態(tài),雙方的第一脈沖在D1處相遇,按上述分析在D1處左右都是不應(yīng)期,所以D1處脈沖很快消失。接著雙方第二個脈沖再相向前進,在D2相遇,如果兩列脈沖頻率一致,則D1和D2在同一地點,由于兩列脈沖存在頻率差,使D2偏離了D1,向低頻方向移動,這一過程繼續(xù)下去,就有D點的D1D2D3的左移,直至低頻{δi′}退出該線段。兩邊信號的頻率差越大,D這一點移動速度越大,這一現(xiàn)象李博士給它定義為highfrequencypreponderanceeffect,或簡寫為Pr效應(yīng)。圖1-4在神經(jīng)元樹突中高頻脈沖壓過低頻脈沖的Pr效應(yīng)把兩個刺激加在一株樹突的兩個分支處,高頻脈沖信號可以逐漸壓制低頻脈沖信號,雖然高低頻脈沖信號的初始相遇點D可能在高頻信號輸入分支上(此時低頻信號可以進入胞體),但是隨著時間的推移,低頻信號會被逐漸壓制住,相遇點D會推移到低頻信號的發(fā)出點,而此時能進入胞體的信號就只能有高頻信號了,而這個過程隨著高低頻率差越大而越短。圖1-5一株樹突上高低頻脈沖信號相遇到此我們得出了一個驚人的結(jié)論,對于圖1-2具有三株樹突樹的浦肯野細胞而言,只有三個信號能同時進入胞體,在胞體把幾路信號融為一體,最后輸出另一串脈沖序列。神經(jīng)元都是工作在高頻脈沖狀態(tài)中的,低頻脈沖序列只是在休息時的一些動作,浦肯野細胞實際可很好的排除低頻噪聲。從神經(jīng)系統(tǒng)的生理上分析看,正因為腦內(nèi)有大量的浦肯野細胞、錐體細胞和多極細胞,才能使腦內(nèi)信息處理回路產(chǎn)生海量的變化。只有這種多樹突細胞的存在,才能保證腦中有大量的各種信息回路的出現(xiàn),而且這種回路一旦沒有了信號,回路就會消失,新的信號出現(xiàn)時又重新形成回路。使每一細胞能不斷改變功能,為各種信息回路服務(wù)。而Pr效應(yīng)保證了回路不受其他低頻信號干擾,這是很有意義的現(xiàn)象。第二節(jié)突觸及其可塑性神經(jīng)元之間進行信息傳遞的特異性功能接觸部位定義為突觸[1]。借助于突觸,神經(jīng)元相互聯(lián)系構(gòu)成了神經(jīng)系統(tǒng),這就是有名的神經(jīng)元學說。突觸一詞是由英國生理學家謝林頓于1897年首次提出的,是一個功能性概念。突觸形態(tài)學概念是在20世紀50年代確立的,即通過電鏡觀察到,突觸兩側(cè)的神經(jīng)元胞漿并不相連通,突觸前、后膜之間存在著與細胞外間隙相連通的突觸間隙,但兩側(cè)膜都有不同的結(jié)構(gòu)特征,成為信息傳遞的結(jié)構(gòu)基礎(chǔ)。隨著后來的發(fā)展,突觸的概念也用于表示神經(jīng)元與非神經(jīng)元之間的功能聯(lián)系,包括感受器與神經(jīng)元之間[1]越來越多的研究表明突觸周圍的膠質(zhì)細胞也是突觸的第三個成分,從而與前后兩個神經(jīng)元形成三重性的突觸。的聯(lián)系,神經(jīng)元與效應(yīng)器之間的聯(lián)系,如神經(jīng)與肌肉之間。 根據(jù)突觸連接的成分分類:依照胞體、軸突和樹突的相互結(jié)合,共有9種(3×3種)突觸連接類型,其中軸-體、軸-樹和軸-軸三種是最主要的突觸。也可以根據(jù)突觸的功能特性分類,若突觸傳遞的功能是興奮下一神經(jīng)元即為興奮性突觸,反之就是抑制性突觸。圖1-6突觸的顯微結(jié)構(gòu)在突觸膜表面上存在兩種受體[1]:離子型受體和代謝型受體。離子型受體上有離子通道,受體與特定的神經(jīng)遞質(zhì)結(jié)合后,離子通道被打開或者關(guān)閉,從而將化學信號轉(zhuǎn)換為電信號,此過程只能持續(xù)數(shù)毫秒,即及時的傳遞著神經(jīng)沖動。而代謝型受體的一端凸出在細胞外,負責識別其他細胞發(fā)出的信號,另一端伸入到胞漿中,與特定的酶結(jié)合。代謝型受體識別并結(jié)合了細胞外的化學信使后,細胞內(nèi)發(fā)生一系列變化,并通過第二信使發(fā)揮作用,代謝型受體產(chǎn)生的變化能促進谷氨酸的釋放,并持續(xù)數(shù)秒至數(shù)分鐘,其作用波及整個細胞。而谷氨酸是哺乳動物大腦中重要的興奮性遞質(zhì)之一。通過增加谷氨酸釋放量的方式增強了突觸后電位,使突觸后細胞更容易產(chǎn)生動作電位,這便是短時記憶形成機理的重要組成部分。[1]見果殼網(wǎng)影歌的專題日志,追尋記憶的痕跡。其內(nèi)容主要來源于2000年諾貝爾獎得主Kandel的同名自傳性科普書。長時記憶的形成需要突觸發(fā)生結(jié)構(gòu)性變化,此時需要激活基因,例如反復(fù)呈現(xiàn)的刺激促使蛋白激酶A與MAP激酶轉(zhuǎn)移到細胞核里。在這里,蛋白激酶A激活CREB-1[1],而MAP激酶使CREB-2失活。CREB-1激活基因表達,而CREB-2抑制基因表達。也就是說突觸聯(lián)系的長時強化不僅需要開啟某些基因,也需要關(guān)閉某些基因。而短時記憶不涉及核內(nèi)機制。長時記憶不只是短時記憶在時間上的延伸。不僅是突觸強度增加,神經(jīng)回路中的突觸數(shù)目也發(fā)生了變化。長時習慣化時(指反復(fù)呈現(xiàn)一種無害的刺激后,動物和細胞都不再對該刺激產(chǎn)生反應(yīng)),感覺神經(jīng)元和運動神經(jīng)元之間的前突觸數(shù)目減少;長時敏感化時(指有害刺激使動物和細胞變得敏感,對隨后呈現(xiàn)的任何刺激(包括無害刺激)都產(chǎn)生強烈的反應(yīng)),感覺神經(jīng)元長出新的前突觸端,其壽命與記憶維持的時間等長。實際上,兩種CREB蛋白的拮抗性作用方式為記憶存儲提供了閾值,只有重要的事件才能超越該閾值進入長時記憶。為了突破閾值,反復(fù)聯(lián)系是必不可少的。例如海兔,反復(fù)電擊它的尾部就是一種聯(lián)系,就好比我們?nèi)祟惙磸?fù)聯(lián)系鋼琴或者法語動詞變位一樣。然而,強烈的情緒狀態(tài)可以不經(jīng)練習直接進入長時記憶,如車禍等經(jīng)歷。在這種情況下,大量的MAP激酶瞬間涌入細胞核內(nèi),足以使全部CREB-2分子失活。解除了CREB-2的拮抗作用后,蛋白激酶A更[1]CREB為環(huán)磷腺苷效應(yīng)元件結(jié)合蛋白,一種調(diào)節(jié)基因轉(zhuǎn)錄的蛋白質(zhì),目前發(fā)現(xiàn)的至少有10種以上,CREB的發(fā)現(xiàn)堪稱心理學一大盛事,它讓人類首度窺見了永久記憶如何形成。容易激活CREB-1,于是,一次經(jīng)歷就能順利地進入長時記憶。最后,需要提及的一點是突觸的可塑性都是針對化學突觸而言的,電突觸(突觸間隙很小僅2-3nm,可以直接流過電流)是定型化的快速傳遞,不具備可塑性,但是它能雙向傳遞信息。第三節(jié)神經(jīng)系統(tǒng)的耦合同步活動1680年,荷蘭旅行家肯普洛在泰國旅行時,記錄下了在湄南河上順流而下的時候觀察的一個奇特現(xiàn)象:“一些明亮發(fā)光的昆蟲飛到一棵樹上,停在樹枝上,有時候它們同時閃光,有時候又同時不閃光,閃光和不閃光很有規(guī)律,在時間上很準確?!笨掀章逵斡浿兴f的昆蟲就是螢火蟲,這是關(guān)于觀察到震蕩系統(tǒng)群體同步的首次記錄。1729年,法國天文學家、數(shù)學家deMairan注意到扁豆的葉子會隨著晝夜的更替同步的移動,之后許多更復(fù)雜的實驗都證明了生命系統(tǒng)的生理節(jié)律與環(huán)境節(jié)律同步(即生物鐘)的存在。隨著電機工程和無線電工程的發(fā)展,同步現(xiàn)象的探索也進入到了新階段。1920年Eccles和Vincent在實驗中將兩個頻率有微小差異的發(fā)電機耦合起來,證明耦合作用使得兩個發(fā)電機以相同的頻率震動,幾年后,VanderPol等重復(fù)并擴展了此實驗,并首次對這一現(xiàn)象進行了理論研究。之后,各個領(lǐng)域的科學家觀察到了很多有趣的同步現(xiàn)象并將其記錄下來,數(shù)學家、工程師、物理學家以及其他領(lǐng)域的科學家進行了大量的研究工作來進一步理解同步現(xiàn)象。另外,有關(guān)同步現(xiàn)象,還有一個有趣的經(jīng)驗現(xiàn)象。上過自習課的學生都有一個經(jīng)驗,就是一個鬧哄哄的教室,會在某個時刻突然安靜下來,似乎是嚴厲的班主任突然出現(xiàn)了,但當大家四周看看發(fā)現(xiàn)沒有任何老師來過,就又繼續(xù)說話了。這是怎么回事呢?有一個可能的解釋是,由于每個學生說話會因為呼吸、思考或者觀望班主任是否到來而產(chǎn)生一定停頓,雖然每個人的停頓周期不同,但是一旦在某個最小公倍周期時,有一定數(shù)量的同學同時安靜,造成了環(huán)境音量的突然降低,其他不在此周期還在說話的學生,也會因音量的突然降低而警惕的觀察而停止說話,如此一來整個教室就在某個瞬間突然安靜下來了??茖W家們在不同神經(jīng)元集群中也觀察到了同步放電現(xiàn)象,比如在貓的視覺腦皮層,麻醉后的貓的視覺皮層,以及在清醒的猴子的腦電記錄中都觀察到了同步現(xiàn)象。SonyaBahar等在實驗中發(fā)現(xiàn)龍蝦通過同步行為在捕獲食物的同時也躲避捕食者的入侵。此外,美國杜克大學醫(yī)學中心神經(jīng)學家發(fā)現(xiàn)神經(jīng)元的同步興奮性可能導(dǎo)致帕金森氏癥,這個新發(fā)現(xiàn)顛覆了人們對帕金森氏癥的原有認識。1同步綁定認知活動需要整合廣泛分布在大腦各區(qū)域功能及區(qū)域間持續(xù)相互作用實現(xiàn)。這種大范圍整合需要調(diào)節(jié)振蕩神經(jīng)元在有限的時間段內(nèi),在特定頻段進入精確的鎖定來完成。這就是神經(jīng)元耦合動力學所說的同步現(xiàn)象[1]。動物和人的實驗表明:小到神經(jīng)元對之間,大到腦的某個區(qū)域內(nèi)或腦的不同區(qū)域之間,都存在同步現(xiàn)象。正常認知活動需要廣泛分布于整個大腦的大量功能區(qū)域的整合傳導(dǎo)和彼此之間相互作[1]神經(jīng)元活動的同步,主要指的是神經(jīng)元電活動的頻率和相位的一致性,振幅基本很難有一致性。用,對于這種大范圍的神經(jīng)整合來說,神經(jīng)電信號同步是一種重要的潛在機制。從視知覺的基本問題出發(fā),有一系列的實驗表明各種不同的視覺信息是在大腦的不同區(qū)域得到處理的,同一客體的表征分布于大腦的不同部位,如單細胞記錄技術(shù)表明,在視知覺中,顏色、形狀與運動是沿不同的通道加工的,顏色與形狀等客體特征是從枕葉到顳葉的腹側(cè)視覺通路上得到表征的,而運動、深度等空間特征是從枕葉到頂葉的背側(cè)通路上得到表征的。因此為了把外部世界的客體知覺為一個統(tǒng)一的整體,以避免形成到一個形狀、顏色或運動等特征被錯誤結(jié)合在一起的無意義的知覺[1],同時也需要避免把先前或隨后的其他客體特征錯誤整合到目前的客體特征中,這就需要把分布與不同皮層區(qū)的的分散信息合理地組織在一起,這就是所謂“綁定”問題?!巴綄崿F(xiàn)綁定”的理論假設(shè)最早是由Milner和Malsburg提出,也就是說神經(jīng)系統(tǒng)要完成復(fù)雜的認知任務(wù),必須把廣泛分布的神經(jīng)反應(yīng)亞單元選擇性綁定在一起,才能進入以后的聯(lián)合加工。為了做到被綁定的神經(jīng)亞單元確屬編碼同一客體的,神經(jīng)系統(tǒng)必須在毫秒級的時間尺度上反應(yīng)同步化。1986年,Singer實驗室首先獲得有關(guān)支持同步機制的實驗證據(jù)。Mioche和Singe在貓的視覺皮層放置多個電極,對[1]顏色、形狀加工通路被稱為what通路,運動、深度通路被稱為where通路。對于聽覺信息同樣有此區(qū)分,不過對應(yīng)的腦區(qū)不同。來自臨床大腦皮層損傷病人的證據(jù)支持視覺皮層的兩條通路理論,枕顳區(qū)的損傷產(chǎn)生的典型癥狀為物體失認癥,面孔失認癥和色盲,而枕頂區(qū)的損傷產(chǎn)生的典型癥狀為視覺運動性共濟失調(diào)、空間忽視、運動不能和空間認知障礙。覺醒的貓進行了多個實驗,實驗的目的是研究貓單眼短期遮蔽前后條件下視覺皮層感受野神經(jīng)元功能變化的時間過程。在這些實驗中,特別需要注意的是當視覺在移動的光柵的刺激下,被同時記錄的、空間上相隔離的神經(jīng)元組均產(chǎn)生振蕩,這些振蕩的頻率大約為40Hz,此振蕩周期區(qū)別于刺激閃爍周期,并排除了是受噪聲干擾的可能。這提示振蕩來自于內(nèi)部神經(jīng)元的相互作用。在隨后的幾年里,一系列在猴子的視覺皮層的運動敏感區(qū)、鴿子的視頂蓋、貓的其他皮層區(qū)和視網(wǎng)膜研究提供了更多關(guān)于振蕩是神經(jīng)元響應(yīng)的方式;而這些振蕩的同步是普遍存在并與刺激內(nèi)容相關(guān)的證據(jù)。綜合胼胝體切片多點記錄及相關(guān)的研究進展顯示遠距離振蕩的同步是通過皮層間的連接網(wǎng)絡(luò)實現(xiàn)的。多位置記錄同時提供了同步也出現(xiàn)在廣泛分布的不同區(qū)域間,例如初級視皮層、視頂蓋和上外側(cè)裂周皮層區(qū)間的證據(jù)。2γ震蕩簡介[1]γ神經(jīng)振蕩(頻率在30-100Hz之間)的一個顯著作用就是對多特征的綁定。實驗表明,它主要由具有快速放電的、表達有小白蛋白的籃狀細胞組成的抑制性中間神經(jīng)元網(wǎng)絡(luò)產(chǎn)生。有研究用移動的光柵作為視覺刺激,記錄貓視覺皮層對光柵方向有不同偏好的兩個神經(jīng)元的放電時發(fā)現(xiàn),如果光柵的方向位于兩個神經(jīng)元共同偏好的方向范圍中,兩個神經(jīng)元就以γ頻率同步放電,而用[1]王靜。γ神經(jīng)震蕩產(chǎn)生機制及其功能研究進展[J].生物化學與生物物理進展.2010,12:1-6各自分別偏好方向的刺激時,兩個神經(jīng)元的活動就不同步。這表明γ神經(jīng)振蕩具有將同一性質(zhì)刺激的不同特征綁定和聯(lián)合的作用。除此之外,EEG(腦電圖)實驗還發(fā)現(xiàn),想像的三角形視覺刺激導(dǎo)致γ同步增加,說明γ神經(jīng)振蕩綁定了三角形的各個特征以形成感覺。γ神經(jīng)振蕩不僅具有綁定同一刺激物的各特征以形成感覺,而且還可以綁定同一事物的兩種不同性質(zhì)的多模態(tài)刺激。如向被試者同時展示同一種動物的圖片和聲音時,γ功率譜增加,而向被試者展示來自不同動物的圖片和聲音時γ功率譜的增加就沒有那么顯著。γ神經(jīng)振蕩的這種作用與γ具有促進神經(jīng)元之間信息交換和整合的功能是一致的。γ神經(jīng)振蕩的另一個重要的功能是參與選擇性注意。注意的過程就是選擇與任務(wù)或目標特征相匹配的刺激。在視覺的空間注意任務(wù)實驗中,提示被試者關(guān)注某一側(cè)屏幕上出現(xiàn)的視覺刺激,當注意側(cè)的刺激信號出現(xiàn)后,γ活動在注意側(cè)的對側(cè)頂枕葉增強。而且,當注意側(cè)視覺刺激的空間發(fā)生變化時,γ活動也顯著增加。說明γ振蕩參與選擇與目標匹配的刺激。軀體感覺刺激的選擇性注意也同樣顯示γ振蕩參與選擇性注意。讓被試者計數(shù)施加于一個手指上的痛覺刺激,以此作為目標刺激,而把讓被試者忽略施加于另一個指頭的刺激,作為對照刺激。實驗發(fā)現(xiàn),目標刺激引發(fā)了更強的γ活動。3目前神經(jīng)同步研究的局限性1)神經(jīng)電活動的同步性,目前還只是表象層面的描述。雖然有很多的數(shù)學工具來檢驗各個腦電信號的同步相干程度,但是對于同步發(fā)生時,神經(jīng)信息具體如何整合起來,只有一個暗喻式的結(jié)論,似乎只要兩個腦電信號同步了,大腦就對它編碼完結(jié)了,而沒有具體指明同步發(fā)生之后,大腦如何獲得一個完整的認知。另外,對綁定后的同步特征進行分析,應(yīng)該由所謂的工作記憶來完成,但是到目前為止,對于工作記憶中存儲的是分離特征(即具體的細節(jié)特征)還是綁定特征(即客體整體),仍然沒有定論,就更遑論工作記憶具體如何對被整合起來的特征進行邏輯推導(dǎo)產(chǎn)生新的判斷、結(jié)論與思想的過程了。 最為重要的是,同步?jīng)]有對神經(jīng)網(wǎng)絡(luò)學習識別各類特征的過程給予解釋,這個問題的重擔基本落在了人工神經(jīng)網(wǎng)絡(luò)模型上。2)為了測量同步性,所有測量方法都隱含一個假設(shè)[1],即所分析數(shù)據(jù)不是疊加信號。但事實是被檢測具有高同步性的兩疊加信號,其未疊加之前的信號分量根本不同步。例如,腦電信號是記錄的頭皮信號,而非腦內(nèi)源信號,即各源信號傳導(dǎo)到頭皮層信號的疊加,有證據(jù)證明疊加信號的同步可能來自于疊加效應(yīng),因此,若不考慮這種效應(yīng)可能導(dǎo)致錯誤的生物學結(jié)論。另外,由于顱骨的傳導(dǎo)效應(yīng),也會導(dǎo)致錯誤的同步作用判斷。因為相關(guān)同步可能是顱內(nèi)同一源信號,沿顱骨傳導(dǎo)的結(jié)果,而非顱內(nèi)實際多個源之間相互作用的結(jié)果。最后,在研究大尺度源間的相互作用時,源活動的輻射傳遞增加了EEG測量通道間原本來源于兩獨立源相互作用的實際同步指數(shù)。當然,學者們過去提出諸如利用盲信號分離重構(gòu)腦內(nèi)源信號、獨立成份分析等辦法[1]周群.腦電信號同步:方法及應(yīng)用研究[D].電子科技大學.2009:85減小疊加信號帶來的影響,但是可以肯定的說,這種影響并沒有徹底排除。總而言之一句話,神經(jīng)電活動同步的研究還在幼稚階段。第四節(jié)人工神經(jīng)網(wǎng)絡(luò)的信息編碼人工神經(jīng)網(wǎng)絡(luò)一直是科幻小說中非?;鸨念}材,同時也是引發(fā)人類對自身未來命運擔憂的一個理論邏輯基礎(chǔ),多少年來我們都在討論智能機器到底可不可能超過人類的大腦。最近幾年也有很多驚動人心或者說令人不安的相關(guān)新聞。2014年6月7日是計算機科學之父阿蘭?圖靈逝世60周年紀念日。這一天,在英國皇家學會舉行的“2014圖靈測試”大會上,聊天程序“尤金?古斯特曼”首次以33%的認可率被誤認為是一個13歲的小男孩而“通過”了圖靈測試。圖靈測試簡單的說就是讓計算機程序與測試人員聊天,如果一群測試人員對對方是人還是計算機程序的判斷比率超過30%,那么這臺躲在幕后的計算機程序就可以認為通過圖靈測試了。這次通過圖靈測試的對話看起來還挺有趣的,在此分享給各位讀者。測試人員:嘿,你是個克林貢人還是臺電腦?人/計算機程序:一個真正的戰(zhàn)士絕不會問出這樣的問題。測試人員:管他呢,回答我的問題。人/計算機程序:你絲毫沒有榮譽感!測試人員:你為什么不肯回答我的問題?人/計算機程序:如果是別人這么問,那我當場就要讓他血濺此地!測試人員:好吧,好吧……那你平常都有哪些娛樂活動?人/計算機程序:我旅行在鮮血匯成的河流之中!測試人員:不,說正經(jīng)的,你都有哪些業(yè)余愛好?人/計算機程序:我所熱愛與渴望的唯有敵人的鮮血!測試人員:我說伙計,你為啥總這么激動?人/計算機程序:RAAAWR!??!測試人員:為什么突然朝我大喊大叫?人/計算機程序:RAAAWR!??!測試人員:我不想玩這個測試了。人/計算機程序:RAAAWR!?。∥衣眯性邗r血匯成的河流之中,這個計算機程序如果真的是個小男孩,還真是讓人不知道他是可愛還是有暴力傾向呢。2012年6月底的時候,一條新聞也是充斥網(wǎng)絡(luò),谷歌的神秘實驗室GoogleX實驗室中的天才們讓一個電子神經(jīng)網(wǎng)絡(luò)成功的自主識別出了貓臉。他們用1.6萬塊電腦處理器構(gòu)建了全球最大的人工電子神經(jīng)網(wǎng)絡(luò),并通過輸入YouTube上隨機選取的1000萬段視頻,這個人工神經(jīng)網(wǎng)絡(luò)就在沒有外界其他指令的情況下,自主的認識了貓臉。當人們認為它今天可以自主識別貓臉,明天能發(fā)現(xiàn)自己的存在,后天能成為科學家的時候,卻發(fā)現(xiàn)它3年來幾乎止步不前。哎,人們不知道這是件可喜的事情還是件可悲的事情。當人們悲喜交加的時候,2015年2月微軟亞洲研究院視覺計算組開發(fā)的基于卷積神經(jīng)網(wǎng)絡(luò)的計算機視覺系統(tǒng)在ImageNet1000挑戰(zhàn)中首次超越了人類進行對象識別分類的能力。這可真是東方不亮,西方亮,人工神經(jīng)網(wǎng)絡(luò)作為一個年輕的物種似乎真的在卯足了勁要打敗被上帝選中坐了幾百萬年萬物之靈頭把交椅的人類。當然這個物種是否真有這個能力,這個問題目前只有哲學家們才知道答案,我們就不參與這種玄學般的討論了,直接進入主題,看看人工神經(jīng)網(wǎng)絡(luò)到底是怎么回事。1感知器1943年,神經(jīng)生物學家MeCulloch和青年數(shù)學家Pitts合作,提出了第一個人工神經(jīng)元模型,并在此基礎(chǔ)上抽象出神經(jīng)元的數(shù)理模型,開創(chuàng)了人工神經(jīng)網(wǎng)絡(luò)的研究。以MeCulloch和Pitts提出人工神經(jīng)元的數(shù)理模型(即神經(jīng)元的閥值加權(quán)模型,簡稱感知器,如圖1-7所示)為標志,神經(jīng)網(wǎng)絡(luò)拉開了研究的序幕。(出于表述嚴謹性的考慮,本節(jié)會出現(xiàn)若干數(shù)學公式,但讀者若對公式理解有困難可以跳過具體的公式只看文字,并不會影響最終的閱讀效果)圖1-7多輸出感知器每個神經(jīng)元的行為都用一個激活函數(shù)F來表示,F(xiàn)一般取一個階躍函數(shù)或者一個S型函數(shù)(如圖1-8所示)。之所以采用階躍函數(shù)來表示神經(jīng)元電活動,主要是為了模擬神經(jīng)元電位的靜息和發(fā)放,當輸入小于零時,輸出也小于零,即神經(jīng)元是靜息的,當輸入大于零,輸出便大于零,即神經(jīng)元開始發(fā)放動作電位了,有時也會加一個偏置θ來表示閾值。輸出層神經(jīng)元的輸入是對每個輸入層X和權(quán)重W之間的圖1-8一個典型的階躍函數(shù)和S型函數(shù)Sigmoid乘積之和,因此它的輸出就是Oj=F(i=1n(我們知道一個二維坐標平面會被一條直線0=x1w1+x2w2+θ分成兩半,當輸入x1w1+x2w2+θ大于零時也就是說點(x1,x2)落在了直線劃分出的上半平面,同理輸入小于零時即點落在了下半平面,由此通過神經(jīng)元的發(fā)放與否判斷出點落在何處,從而最終我們用一個神經(jīng)元完成了對點(x1,x2)的一種歸類劃分,當然類似的點(x1,x2,……,xn)就是n維坐標系被相應(yīng)的n-1維超平面歸類劃分,用一個含有m個輸出神經(jīng)元的神經(jīng)網(wǎng)絡(luò)就完成了對點(x1,x2,……,xn)的m多種歸類劃分。當然這種劃分可能并不是我們需要的劃分方式,我們可以不斷的調(diào)整權(quán)重w,使得劃分方式是我們需要的。調(diào)整權(quán)重的方法就是著名的Hebb原則wij(n+1)=wij(n)+α(yj-oj)xi。這公式因為含有了理想輸出y所以是一個有師學習(又稱有監(jiān)督學習)的過程,很多時候我們并不知道理想的輸出y到底是什么,公式也可以改寫為wij(n+1)=wij(n)+αojxi,這時便是無師學習(又稱無監(jiān)督學習)了。如此不斷的輸入訓(xùn)練樣本、調(diào)節(jié)權(quán)重,直到獲得我們需要的效果。Hebb原則是由加拿大著名生理心理學家唐納德?赫布在其1949年出版的《行為的組織》一書中提出的神經(jīng)心理學理論。赫布認為神經(jīng)網(wǎng)絡(luò)的學習過程最終是發(fā)生在神經(jīng)元之間的突觸部位,突觸的聯(lián)結(jié)強度隨著突觸前后神經(jīng)元的活動而變化,變化的量與兩個神經(jīng)元的活性之積成正比(αojxi)。據(jù)說這個原則是受一條狗的啟發(fā)得出的,這條狗就是巴甫洛夫的狗,估計它是史上最著名的狗了,就像薛定諤的貓是史上最著名的貓一樣。俄國生理學家巴甫洛夫開始每次喂狗食物時,都會搖鈴鐺。等到一段時間后他發(fā)現(xiàn)只要搖鈴鐺,它的狗便會流口水,哪怕沒有骨頭出現(xiàn)。這便是著名的條件反射實驗,內(nèi)在神經(jīng)學原理便是Hebb原則了,它的存在使得,巴普洛夫無意間加強了鈴鐺聽覺神經(jīng)元與唾液分泌神經(jīng)元之間的聯(lián)系。當然,Hebb原則是可以通過線性代數(shù)嚴格導(dǎo)出的,具體過程見下一節(jié)的注釋。當人們對神經(jīng)網(wǎng)絡(luò)學說如癡如醉時,Minsky和Papert對以感知器為代表的網(wǎng)絡(luò)系統(tǒng)的功能及局限性從數(shù)學上做了深入研究,于1969年出版了轟動一時《感知器》一書,指出簡單的線性感知器的功能是有限的,它無法解決線性不可分問題。比如一個異或函數(shù),它有兩類四個點,(0,0),(1,1)為一類,(0,1),(1,0)為一類,這四個點在二維平面上無論圖1-9直線無法把(0,0),(1,1)歸為一類,(0,1),(1,0)歸為另一類哪條直線都不能進行正確的歸類劃分。這個批評性的結(jié)論直接導(dǎo)致了神經(jīng)網(wǎng)絡(luò)學說進入一個長達10年的低谷期。2三層神經(jīng)網(wǎng)絡(luò)其實解決線性不可分問題并不難,只是由于當時集成電路與微電子技術(shù)迅猛發(fā)展,轉(zhuǎn)移了聰明頭腦們的注意力。等到他們回過神來立馬發(fā)現(xiàn)只要讓兩層的感知器網(wǎng)絡(luò)加入一層隱含層成為三層神經(jīng)網(wǎng)絡(luò)就可以徹底解決線性不可分問題。wwjkwijθ………………輸出變量輸入變量輸入層隱含層輸出層xao圖1-10一個典型的Bp神經(jīng)網(wǎng)絡(luò)現(xiàn)已證明,如果隱含層的節(jié)點可以任意設(shè)置,且隱含層用S型激勵函數(shù),三層神經(jīng)網(wǎng)絡(luò)可以一致逼近任意的連續(xù)函數(shù),也可以徹底解決線性不可分問題。具體的證明,專業(yè)書籍里自然有,但是我們可以通過合理外推感知器的分類邏輯來理解這一點。感知器之所以不能解決線性不可分問題,是因為每個神經(jīng)元只能提供一種分類方法,雖然有很多輸出神經(jīng)元同時分類,但是他們的分類效果是獨立的不可疊加的,但當再加上一層神經(jīng)元時,就等于把原先的分類效果疊加后,再一次進行分類。如此便是原先一個二維坐標平面每次都只能由一條直線進行二分,而現(xiàn)在可把多條直線形成的多邊形作為分類標準,那么就是再詭異的分類要求也是可以實現(xiàn)的了。當然直線不一定形成封閉的多邊形,它們可以沿著坐標橫軸一段一段的相連,從而逼近任何目標函數(shù)。 對于隱含層使用S型函數(shù),采用誤差回傳的方式來逐層調(diào)節(jié)權(quán)重[1]的神經(jīng)網(wǎng)絡(luò)稱為Bp神經(jīng)網(wǎng)絡(luò)。Bp神經(jīng)網(wǎng)絡(luò)是目前使用最廣泛的一種神經(jīng)網(wǎng)絡(luò),它可以逼近任何目標函數(shù),不過它仍有很多不足,例如它容易陷入局部極小化,而不能進入全局最小化;收斂的速度很慢,常常需要迭代數(shù)千次甚至更多;最重要的是隱含層神經(jīng)元的個數(shù)選擇沒有具體的理論指導(dǎo),基本憑經(jīng)驗或者多次選擇比較結(jié)果來最終確定。[1]我們簡單說下權(quán)重調(diào)節(jié)過程。包括Hebb原則和Bp神經(jīng)網(wǎng)絡(luò)的內(nèi)在調(diào)節(jié)原則是一致的,都是w(n+1)=w(n)-αdEdw,其中E=12(y-o)2,用文字語言來理解就是誤差E和權(quán)重w之間有函數(shù)關(guān)系,在某個權(quán)重w處能取得最小誤差,通過誤差對權(quán)重的導(dǎo)數(shù)變化關(guān)系來指引當前權(quán)重的改變,從而使得隨機初始化的權(quán)重逐步靠近理想的權(quán)重。對感知器而言,E=12(y-F(xw))2,代入公式立馬可得wij(n+1)=wij(n)+α(yj-oj)xi。對于Bp神經(jīng)網(wǎng)絡(luò)由于有隱含層計算起來稍顯比較麻煩。我們記中間隱含層的輸出為oj=F(wijxi),輸出層的輸出為ok=F(wjkoj),在隨機初始化權(quán)重后,這兩個值在每一步都是已知的。由于E=12(y-ok另外需要提及的一點是,人工神經(jīng)網(wǎng)絡(luò)的隱含層神經(jīng)元激活函數(shù)可以不使用S型函數(shù),這樣可以大大的增加人工神經(jīng)網(wǎng)絡(luò)多樣性,使之有更強大的功能。例如,支持向量機、RBF神經(jīng)網(wǎng)絡(luò)。其中RBF神經(jīng)網(wǎng)絡(luò)隱含層運用的激活函數(shù)是高斯函數(shù),輸入層與隱含層的權(quán)重調(diào)節(jié)采用K-均值聚類方法,隱含層與輸出層的權(quán)重調(diào)節(jié)采用最小二乘法,它同樣可以解決線性不可分問題。3多層神經(jīng)網(wǎng)絡(luò)——卷積神經(jīng)網(wǎng)絡(luò)CNN 在本小節(jié)開篇中提到了三個新聞,其中一個是微軟亞洲研究院使用卷積神經(jīng)網(wǎng)絡(luò)得到了超過人眼識別能力的計算機視覺識別系統(tǒng)?,F(xiàn)在我們來看看這個有著神奇能力的神經(jīng)網(wǎng)絡(luò)是到底怎么回事。圖1-11識別一個32x32交通限速牌的卷積神經(jīng)網(wǎng)絡(luò) 1959年,Hubel和Wiese發(fā)現(xiàn)貓的視覺系統(tǒng)是分級的,這種分級可以看成是逐層迭代、抽象的過程:瞳孔接收像素,方向選擇細胞抽象出邊緣,對邊緣進一步抽象得出是什么形狀,對形狀進一步抽象出是什么物體。換言之,貓視覺系統(tǒng)不斷的對接收的信號分類劃分抽象出特征,其中高級特征是低級特征的進一步抽象與組合。當然高級特征之間如何互相組合是上一節(jié)提到的同步綁定問題,這一部分我們運用卷積網(wǎng)絡(luò)來模擬從基礎(chǔ)視覺景象不斷抽象、組合出高級特征的過程。到了下一節(jié)符號動力學時,我們會進一步看看低級特征是如何從真實的生物神經(jīng)元電脈沖中表現(xiàn)出來的,現(xiàn)在我們先看看卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)CNN是一個多層的神經(jīng)網(wǎng)絡(luò),由多個卷積層、子采樣層交替組成,而每層由多個獨立神經(jīng)元組成,它的基本框架結(jié)構(gòu)如圖1-12所示。其實粗糙點來說,卷積神經(jīng)網(wǎng)絡(luò)就一個含有多個隱含層的分類能力更加強大的Bp神經(jīng)網(wǎng)絡(luò)。圖1-12卷積神經(jīng)網(wǎng)絡(luò)CNN的框架結(jié)構(gòu)示意圖上圖所示的CNN框架由2個卷積層、2個子采樣層交替組成。C標識的為卷積層,也稱為特征提取層,每個神經(jīng)元的輸入與前一層的局部感受野(receptivefield)相連,并提取該局部的特征,一旦該局部特征被提取后,它與其他特征間的位置關(guān)系也隨之確定下來。C層中有多個不同的二維特征圖,一個特征圖提取的是一種特征,多個特征圖表示提取多種不同的特征。在提取特征時,同一個特征圖的權(quán)值是共享的,即使用相同的卷積核,不同的特征圖使用不同的卷積核。C層將不同的局部特征保存下來,使得提取出的特征具有了旋轉(zhuǎn)、平移不變性。如圖1-13所示,由于C層的卷積核進行卷積時,是可以重合的,中間結(jié)果y中間結(jié)果y圖1-138X8的輸入被5X5卷積核卷積后得到4X4的中間結(jié)果即卷積核每次移動時只向右或者向下移動一格,所以一個8X8的輸入圖像被5X5卷積核卷積后得到了一個(8-5+1)X(8-5+1)=4X4的特征圖,同理,圖1-11中輸入32X32的交通限速牌被5X5卷積核卷積后得到了(32-5+1)X(32-5+1)=28X28的一個特征圖。為了充分獲得輸入圖像的特征,會采用不同的卷積核進行多次卷積,而得到多個特征圖,如圖1-11中進行了4次卷積,使得C1層得到了4個特征圖。 一個28X28的特征圖含有28X28個神經(jīng)元,每個神經(jīng)元的激活函數(shù)可取S型激活函數(shù)sigmoid,則C1層每個特征圖中單個神經(jīng)元的最終輸出為O=sigmoid(y)=sigmoid(wx+θ)。θ為每個神經(jīng)元的偏置或稱激活閾值。 依據(jù)以上描述我們可知,圖1-11識別交通限速牌的C1層有4X(5X5+1)=104個參數(shù)需要學習,C1層和輸入層之間總共有(5X5+1)X28X28X4=81536條連接。S標識的層是子采樣層,也稱為特征映射層,它負責將C層獲得的特征進行子采樣,使提取的特征具有縮放不變性。它的采樣過程不同于C層,它的權(quán)重矩陣只有一個變量,如圖1-11中S1層使用2X2矩陣對C1層進行采樣,但是這個矩陣中4個值是一樣的,而且每次移動都不與前一次采樣區(qū)(感受野)重疊,因此它只是做了簡單的縮放平均映射,需要訓(xùn)練的神經(jīng)元權(quán)值相對較少。C1層28X28的特征圖經(jīng)過2X2的縮放采樣后,得到了S1層中28X12X28X12=14X14大小的特征圖,特征圖的張數(shù)同于C1層。同時S層的每個神經(jīng)元也有偏置,它每個神經(jīng)元的輸出就是O=sigmoid(wx+θ因此,S1層中有4X(1+1)=8個參數(shù)需要學習,總共有4X(1+1)X14X14=1568條連接。S2層與S1層一樣采樣方式比較簡單,但是C2層雖然和C1層有些類似,但是它們之間又有重大差別。首先經(jīng)過C1、S1層的卷積、縮放之后,即使C2層的卷積核和C1層一樣大,它的單個神經(jīng)元等效卷積覆蓋面也已經(jīng)遠遠大于C1層的單個神經(jīng)元等效卷積覆蓋面了,比如圖1-11中,C2層采用5X5的卷積核,單個神經(jīng)元等效覆蓋輸入層的大小為(5+7)X(5+7)=12X12。具體解釋而言,由于C1層的卷積核在輸入層上可以重疊移動,那么S1層2X2采樣等效C1層縱橫各移動一次,于是等效原始圖像的(5+1)X(5+1)=6X6大小,而C2層采樣S1層5X5個神經(jīng)元,又因為S1層采樣C1層是不能重疊的(等效于無形中又增多了一次縱橫移動),故縱橫各移動總共1+2+2+2+2=7次,因此等效于原始圖像(5+7)X(5+7)=12X12大小。當然,它的每個特征圖含有的神經(jīng)元為(14-5+1)X(14-5+1)=10X10。再次,C2層的單個神經(jīng)元可以同時使用n個大小相同內(nèi)部變量不同的卷積核對S1層n個特征圖同時采樣,比如用3個卷積核對S1層3個相鄰特征圖采樣求和到一個神經(jīng)元。當然取哪3個是任意的、隨機的,比如也可以隔一個取一個。同時C2層特征圖的數(shù)目可以多設(shè)置些,不必和S1層一樣多。這樣做它可以破壞采樣的對稱性,不同的組合抽取的自然是不同的特征。剩下的C層、S層就依次類推了。一般而言C層、S層各兩層是不夠的,比如在一個植物葉片分類的卷積模型中,各只有兩層時識別準確率只有40%,當增加到各三層時,準確率可以增加到99.56%而超過其他的分類識別方法[1]。最后在CNN的末層一般會接上一個全連接的RBF神經(jīng)網(wǎng)絡(luò),最終輸出層節(jié)點的個數(shù)就是分類目標個數(shù),訓(xùn)練的方法是先由底層開始逐層的進行無監(jiān)督學習,當所有層學習完畢后采用誤差回傳的方法進一步學習。最終目的就是使CNN的輸出盡可能與原始的標簽相近。到目前為止,我們花費了大量的時間、篇幅終于理順了人工神經(jīng)網(wǎng)絡(luò)的內(nèi)在邏輯。雖然人工神經(jīng)網(wǎng)絡(luò)的內(nèi)容極其豐富,我們在此不可能面面俱到,比如可以用電路直接模擬的hopfield神經(jīng)網(wǎng)絡(luò)、自組織特征映射網(wǎng)絡(luò)等等我們就沒有去分析它,但是在本章神經(jīng)信息編碼的主旨下,有了本節(jié)提供的知識點和對人工神經(jīng)網(wǎng)絡(luò)內(nèi)在主要邏輯的了解,我們已經(jīng)足夠去理解人大腦皮層神經(jīng)網(wǎng)絡(luò)的初步建模了。4人的大腦新皮層層級神經(jīng)網(wǎng)絡(luò)的初步模型[1]龔丁禧、曹長榮.基于卷積神經(jīng)網(wǎng)絡(luò)的葉片分類[J].計算機與現(xiàn)代化.2014,4:12-15.如果通過類比人工神經(jīng)網(wǎng)絡(luò)來理解大腦,最簡單的一個模型就是把大腦皮層的感覺區(qū)、聯(lián)合皮層區(qū)、運動區(qū),對應(yīng)為Bp神經(jīng)網(wǎng)絡(luò)的輸入層、隱含層和輸出層。其中感覺區(qū)包括接受來自雙耳聽覺沖動的顳橫回,接受兩眼對側(cè)視覺沖動的距狀溝上、下方皮質(zhì),接受身體對側(cè)的痛、溫、觸和本體感覺沖動的中央后回(1、2、3區(qū))等等腦區(qū)。聯(lián)合皮層區(qū)包括額葉皮層大部,頂、枕和顳葉皮層的一些部分,它是匯集多通道的感覺信息進行決策、規(guī)劃的腦區(qū)。中國有句老話說腦門大的人都比較聰明,其中腦門主要指的是額葉皮層,腦門大即負責決策的皮層區(qū)比較大,因此從這么看這句老話還是有一定的道理的。運動區(qū)主要包括主管精細協(xié)調(diào)功能的頂下小葉的緣上回,姿態(tài)調(diào)節(jié)的位于中央前回之前的6區(qū),控制對側(cè)骨骼肌隨意運動的中央前回4區(qū)。當然把如此多的腦區(qū)都簡單的歸為輸入層、隱含層或輸出層,顯得過于粗糙,只能提供對大腦皮層最基本的理解。圖1-14大腦半球皮層的布羅德曼分區(qū)示意圖(左圖為大腦皮層外側(cè)面,右圖為內(nèi)側(cè)面)但是,如果用Bp神經(jīng)網(wǎng)絡(luò)模型來理解小腦可能就會稍顯貼切。20世紀60年代末,由于對小腦結(jié)構(gòu)和功能的深入研究,人們提出了小腦皮層是一個特殊感知器的設(shè)想。小腦皮層有兩類輸入:攀緣纖維和苔蘚纖維,有五種不同細胞:浦肯野細胞,顆粒細胞、籃狀細胞、星狀細胞和高氏細胞。后三者為抑制性的,起負反饋作用并改善網(wǎng)絡(luò)性能,而前兩者為興奮性細胞,為信息表示和處理的基礎(chǔ)。在實驗中觀察到苔蘚纖維和攀緣纖維所引起的浦肯野細胞的響應(yīng),時間上相差10毫秒。而動物做熟練動作時,攀緣纖維發(fā)放較?。创死w維可能為“教師—誤差回傳”信號)。而去除攀緣纖維后,浦肯野細胞的樹突棘消失。這些說攀緣纖維在學習中起了的作用。由此,人們提出,苔蘚纖維輸入相當于感知層,接受苔蘚纖維輸入的顆粒細胞層相當于隱含層,而浦肯野細胞作為小腦皮層唯一的輸出,當然就相當于輸出層了。攀緣纖維是經(jīng)過下橄欖核中繼的大腦皮層信號,就名副其實的成為了誤差回傳信號。但小腦Bp神經(jīng)網(wǎng)絡(luò)不是一個簡單的神經(jīng)網(wǎng)絡(luò),輸出層有大量的節(jié)點(浦肯野細胞在人腦約2X107個),顆粒細胞與高氏細胞組成反饋抑制網(wǎng)絡(luò),使得在苔蘚纖維中差別不大的模式,在顆粒細胞中有明顯的差別,從而提高了神經(jīng)網(wǎng)絡(luò)的分辨能力。這么看來類比人工神經(jīng)網(wǎng)絡(luò)是理解人腦的一個好辦法,那么我們能不能進行一次終極類比,把整個大腦皮層類別成一個多層卷積神經(jīng)網(wǎng)絡(luò)呢?早在20世紀30年代LorentedoNo就發(fā)現(xiàn),大腦皮層不但在水平方向分為六層,而且在皮層的整個厚度內(nèi),神經(jīng)元呈垂直鏈形排列。1956年,Phillips在貓的運動皮層中發(fā)現(xiàn)有柱形結(jié)構(gòu),之后Mountcastle、Hebel和Wiesed以及Merzenich等相繼分別在貓的體感皮層、貓與猴的視覺皮層及貓的初級聽覺皮層中發(fā)現(xiàn)有柱形結(jié)構(gòu)。1980年,Rockel等報道了大規(guī)模的實驗工作總結(jié)。他們調(diào)查了鼷鼠、家鼠、貓、獼猴以及人的大腦新皮層17區(qū),3、1、2區(qū),4區(qū),22、7區(qū),9區(qū)都有柱狀結(jié)構(gòu)。他們計算了直徑為0.03mm,貫穿皮層整個厚度的一個柱狀空間(相當于微柱)里的神經(jīng)元數(shù)目,發(fā)現(xiàn)各種動物腦的體積不一,皮層各個區(qū)的厚度也有較大的區(qū)別。但是除了靈長類(包括人)的視皮層17區(qū)因能接受雙側(cè)視網(wǎng)膜投射而微柱內(nèi)的神經(jīng)元數(shù)為270以外,以上所列舉的哺乳動物新皮層各區(qū)微柱里的神經(jīng)元絕對數(shù)字都110頂面眼優(yōu)勢柱色小桿321層6(C)5(1)4頂面眼優(yōu)勢柱色小桿321層6(5(4(3(1)2(1)1(C)外膝核朝向柱白質(zhì)IC至外膝核至上丘至外視區(qū)654圖1-15初級視皮層里的一個巨柱(數(shù)字1~6代表大腦皮層1~6細胞層)左右,變異不超過10%。由此我們可以確信,無論是人大腦新皮層輸入端的視聽、體感皮層及輸出端的運動皮層,還是聯(lián)合區(qū)皮層,它們均有微柱結(jié)構(gòu)。一般的測算,整個人大腦新皮層約有6X108個微柱。實驗還證明,很多微柱同時對一種功能作出響應(yīng),相互聯(lián)結(jié)形成更大一級的單位。Mountcastkn在1975年將這個更大一級的單位命名為巨柱。經(jīng)測算,巨柱的直徑為0.5~1mm,高為1.5~4.5mm。在了解到以上信息后,有學者就提出了由神經(jīng)元局部回路第一層第二層第三層第四層第五層功能性質(zhì)功能中樞聯(lián)接群功能中樞巨柱微柱局部回路單元功能中樞巨柱微柱局部回路神經(jīng)元單元數(shù)量1×102102~1041×10210左右3~10輸入單元位于視覺、聽覺、感覺皮層的功能中樞不分不分不分顆粒細胞隱藏單元聯(lián)合區(qū)的功能中樞不分不分不分martinotti細胞
Cajal水平細胞等輸出單元位于運動皮質(zhì)
的功能中樞不分不分不分錐體細胞拓撲結(jié)構(gòu)從箱出層到輸入層
有反饋的階層式相互結(jié)合式等
(沒有明顯的層次)相互結(jié)合式等
(沒有明顯的層次)相互結(jié)合式等
(沒有明顯的層次)輻散式、聚合式
鏈鎖式、環(huán)式等工作范圍整個大腦新皮層102~104mm30.5~1mm直徑
1.5~4.5mm高0.03mm直徑
1.5~4.5mm高約0.001mm3皮層內(nèi)總數(shù)1861~2×104約6×108約6×109表1-1大腦皮層層級神經(jīng)網(wǎng)絡(luò)的基本內(nèi)容微柱巨柱功能中樞功能中樞連接群(大腦皮層)逐級有規(guī)則的組織成一個層級神經(jīng)網(wǎng)絡(luò),具體細節(jié)如上頁表1-1所示[1]。這個模型為我們提供了一幅關(guān)于大腦的全局圖,但同時也抹去了大腦信息處理極其豐富的內(nèi)在細節(jié)。第五節(jié)人工神經(jīng)網(wǎng)絡(luò)與認知心理學的交媾廣義的認知心理學是指以認知過程為主要研究對象的各種心理學流派和理論。狹義的認知心理學僅指自20世紀以后產(chǎn)生的信息加工認知心理學,又稱為現(xiàn)代認知心理學?,F(xiàn)代認知心理學把人的認知和計算機進行功能模擬用信息加工的觀點看待人的認知過程,認為人的認知過程是一個主觀的尋找信息、接受信息并在一定的信息結(jié)構(gòu)中進行加工的過程?,F(xiàn)代認知心理學自產(chǎn)生以來發(fā)展迅速,無論在理論探討還是在研究方法上都有較大突破,并積累了豐富的實驗資料,成了取代行為主義而為現(xiàn)代心理學界的一種最主要思潮。認知心理學恢復(fù)了被行為主義拋棄了的對人的認知等高級心理過程的研究,實現(xiàn)了對心理學研究對象的否定之否定,是心理學發(fā)展的一種歷史進步。在現(xiàn)代認知心理學中主要有兩種理論范式:符號加工主義、聯(lián)結(jié)主義。它們的研究對象是一致的,都是人類的感知覺、注意、記憶、表象、思維和語言等。只是它們在解釋這些心理過程所隱喻類比的對象不同。符號加工主義認為心理過程像電子計算機,心理過程是符號序列的串行加工,是按照數(shù)理邏輯的計算方式一步一步的完成認知過程的。比如他們認為語義是寫在圖靈機的帶子上或者儲存在馮若依曼[1]鄭永昌、葉中行,人大腦新皮層層級神經(jīng)網(wǎng)絡(luò)模型研究[J].高技術(shù)通訊.1996,9:24-26機的地址存儲中,可以用一張命題網(wǎng)絡(luò)來解釋句子的含義。在這個命題網(wǎng)絡(luò)中每個節(jié)點代表一個詞匯,而每個詞匯之間或者相連或者不相連,來代表上下文語義。聯(lián)結(jié)主義認為心理過程是人腦帶來的,是分布表征和網(wǎng)絡(luò)化平行加工的,人們利用網(wǎng)絡(luò)化、可訓(xùn)練的神經(jīng)系統(tǒng)來認識周圍的世界,了解自己所經(jīng)歷的事件,以及處理信息和儲存記憶。有些學者認為不能把聯(lián)結(jié)主義理論看作是認知理論,因為聯(lián)結(jié)主義沒有提供說明認知基本方面所需要的那種表征即思維和語言的系統(tǒng)性。他們認為由于符號加工理論可以提供語言運用和思維的心理學,且模型中具有形式主義所需要的精確表征,而運用這些表征的加工對其結(jié)構(gòu)又很敏感,正是心理表征的構(gòu)成結(jié)構(gòu)和對運用表征的過程結(jié)構(gòu)的敏感性提供了心理系統(tǒng)性的基礎(chǔ),由于聯(lián)結(jié)主義表征不具有構(gòu)成結(jié)構(gòu),因而心智就不能是一種聯(lián)結(jié)主義網(wǎng)絡(luò),既然如此,聯(lián)結(jié)主義在認知過程的解釋中就沒有任何作用。如此,對認知的解釋就必須運用符號加工系統(tǒng)的語言。還有的學者認為認知并非是簡單統(tǒng)一的,對于一些進化的行為如邏輯推理和算法,心智模擬的是傳統(tǒng)的馮一諾依曼結(jié)構(gòu),但對于一些其它形式的心理現(xiàn)象,心智模擬的則是聯(lián)結(jié)主義結(jié)構(gòu)。如直覺處理器處理的是不需要有意地運用規(guī)則的行為,如知覺、技巧性運動和單詞理解,這些行為是典型的快速行為,一旦啟動就很難停止并較少受到其它任務(wù)的影響,對這類行為的解釋,就必須運用聯(lián)結(jié)主義理論。但是,對于那些包括意識規(guī)則運用的行為,如推理和高水平語言操作則必須運用傳統(tǒng)的符號加工理論來解釋。但在筆者看來,聯(lián)結(jié)主義或者說人工神經(jīng)網(wǎng)絡(luò)可以模擬人腦認知活動主義與符號加工主義本質(zhì)上是可以統(tǒng)一的,只要我們發(fā)展人工神經(jīng)網(wǎng)絡(luò)使其也具有一定的符號加工能力便可做到兩個主義的合一,同時也非常符合我們對人腦高級認知活動是從神經(jīng)元活動的網(wǎng)絡(luò)性、系統(tǒng)性中涌現(xiàn)出來的理解。我們先介紹由黃秉憲先生在《腦的高級功能與神經(jīng)網(wǎng)絡(luò)》中提出的兩個認知活動的神經(jīng)網(wǎng)絡(luò)模型,來為聯(lián)結(jié)主義助威,而后再來看看如何發(fā)展人工神經(jīng)網(wǎng)絡(luò)的能力來完成兩個主義的合一。第一個認知活動模型是關(guān)于短時記憶的。短時記憶有存儲時間短、存儲容量有限,以及可以用適當組塊提高其信息存儲容量等特點?,F(xiàn)有的短時記憶腦機制研究表明在大腦前后部多個腦區(qū)參與短時記憶的過程,而實際上,組塊是利用原已學的的長期記憶的信息的結(jié)果。因此將長時記憶與短時記憶過程聯(lián)系起來,將多個腦區(qū)聯(lián)系起來,是使短時記憶模型具有接近實際人腦的性能的必要步驟。由此黃秉憲先生提出了一個指針式的短時記憶神經(jīng)網(wǎng)絡(luò)模型,這個模型中的神經(jīng)元環(huán)路不儲存信息內(nèi)容,而是存儲備用信息的指針,信息內(nèi)容存儲在與長時記憶所共有的信息表達區(qū)。表達神經(jīng)元的興奮表示其信息內(nèi)容,同一指針可在不同時間指向不同的表達區(qū)。存儲信息內(nèi)容的指針的網(wǎng)絡(luò),由多個長度有限的神經(jīng)元環(huán)路組成。由于有多個環(huán)路,因而可以使容量極大的共有記憶表達區(qū)(大腦皮層后部聯(lián)合區(qū))的全體都能與其中一個環(huán)路建立突觸聯(lián)系,而各個指針環(huán)路間有相互抑制存在,故在短時任務(wù)激發(fā)下,僅少數(shù)環(huán)路可以興奮,并成為當前記憶信息內(nèi)容的指針。信息內(nèi)容的表達區(qū)由容量極大的多級聯(lián)想記憶神經(jīng)網(wǎng)絡(luò)組成。其中神經(jīng)元興奮模式表示一個事件被感知,即信息輸入到腦內(nèi)或者被取出。當短時記憶任務(wù)出現(xiàn)時,被記憶的信息內(nèi)容在表達區(qū)中以神經(jīng)元興奮模式的形式出現(xiàn)。與此同時,指針神經(jīng)元環(huán)路中的神經(jīng)元群被依次興奮,從而與表達區(qū)中的興奮神經(jīng)元建立短時的突觸聯(lián)系。指針環(huán)路神經(jīng)元的興奮模式與信息內(nèi)容無直接聯(lián)系,信息內(nèi)容完全由表達區(qū)興奮模式?jīng)Q定。iiiVWUYZXKjiiiVWUYZXKj圖1-16短時記憶模型(X為指針網(wǎng)絡(luò),Y、Z分別為基本、高級事件表達區(qū))圖1-16為短時記憶的模型示意圖,其中權(quán)重V是長時記憶的故而是由經(jīng)驗先行確定的,短時記憶發(fā)生時,W、U按Hebb學習率快速增加然后逐漸衰減,從而建立起指針環(huán)路與表達區(qū)間的神經(jīng)元的暫時聯(lián)系。黃先生利用此網(wǎng)絡(luò)模擬區(qū)分象棋高手和一般棋手的復(fù)盤能力,得到了很好的結(jié)果。第二個認知活動模型是關(guān)于海馬區(qū)參與長時記憶形成的模型。海馬是大腦半球內(nèi)側(cè)的一個神經(jīng)結(jié)構(gòu),由于其外形與海洋生物海馬相似而得名。人類對海馬記憶功能的認識,關(guān)鍵資料是來自對海馬損傷病人的觀察和測試。其中最著名的是對HM的觀察。HM從1942年開始患癲癇病,1953年做切除內(nèi)側(cè)顳葉(包括海馬及其周圍結(jié)構(gòu))手術(shù)。術(shù)后病情緩解但出現(xiàn)了嚴重而持久的遺忘癥狀。他的智商正常,保留短時記憶能力,若不有意復(fù)述則很快忘記。術(shù)后對事件的記憶很差,對1942年-1953年間的時間有不同程度的遺忘,即有逆行性遺忘癥,但對早期的記憶卻保存完好。他還能學的新的認知技巧:如從鏡中閱讀,但又宣稱從未學過,這些現(xiàn)象說明人類多種類型記憶的分離;海馬及其周圍結(jié)構(gòu)主要對長期記憶有影響,但不是長時記憶存儲的腦區(qū),而是事件長時記憶的鞏固過程不可缺少的機構(gòu),尤其是情境記憶的鞏固,如有的海馬損傷者對過往學習到的知識保存的很好,但卻經(jīng)常不能找到放學回家的路。更深入的研究指明,大腦皮層各區(qū)域儲存各種特殊記憶,這些區(qū)域與旁海馬區(qū)由雙向聯(lián)系,對于比較簡單的相互關(guān)系的記憶可知旁海馬皮層中完成。而在海馬主要完成對事件與其上下文(如事件發(fā)生的時間、地點)間的整合,以及靈活的組織存儲信息。旁海馬提供2/3的進入海馬的纖維。海馬可能記憶又分化又交叉型式的信息(如有能分別記住人物、地點和時間;又能將幾方面結(jié)合成具體的事件)。并將特定的情節(jié)及其相關(guān)上下文信息編碼為語義知識,而將這些具體記憶插入到記憶結(jié)構(gòu)中,并提供整個知識結(jié)構(gòu)的入口。神經(jīng)解剖學告訴我們海馬與大腦皮層許多區(qū)域有雙向聯(lián)系,各種不同信息可以匯聚到海馬結(jié)構(gòu),因此我們的模型中不僅包含大腦皮層而且將它劃分為若干區(qū)域。由此可以反映不同信息在海馬的綜合。同時海馬內(nèi)部有不同的結(jié)構(gòu)來實現(xiàn)不同的功能,其中最主要的是CA3和CA1兩個結(jié)構(gòu),由于CA3有大量的反饋聯(lián)系,可以假定它是一個聯(lián)想記憶網(wǎng)絡(luò),而聯(lián)想記憶也是海馬綜合不同來源信息所需的,但CA1無反饋聯(lián)系,且CA3到CA1的發(fā)散聯(lián)系,是CA1可能將CA3綜合結(jié)果形成各事件的單一表示。海馬記憶功能的神經(jīng)網(wǎng)絡(luò)模型如圖1-17所示,圖1-17海馬記憶功能的神經(jīng)網(wǎng)絡(luò)模型其中A、B、C三個神經(jīng)網(wǎng)絡(luò)組成兩級聯(lián)想記憶模型,其中A、B中興奮模式表示不同的感覺事件,而C為高級結(jié)構(gòu),其中興奮模式表示事件的全體。外部的信息經(jīng)感覺系統(tǒng)的預(yù)處理后進入大腦皮層A、B區(qū),然后到達CA3區(qū),CA3區(qū)為聯(lián)想記憶神經(jīng)網(wǎng)絡(luò),將事件的各個組分聯(lián)接起來,并保留各組分的特殊表示。而CA1為競爭網(wǎng)絡(luò)僅對應(yīng)一個興奮模式,它代表事件的整體。CA1輸出到大腦皮層病中C中出現(xiàn)新的興奮模式,它是整個事件在皮層中的表示。依據(jù)神經(jīng)解剖學事實,模型中海馬內(nèi)突觸有長時程增強效應(yīng),它的出圖能按Hebb律快速的增加,隨后緩慢降低,而大腦皮層內(nèi)突觸雖也按Hebb律增加,但是學校速度比較慢,只有多次與海馬作用才能建立鞏固的聯(lián)系。由于海馬神經(jīng)元數(shù)目為數(shù)百萬的級別,而大腦皮層的任一區(qū)域都有幾億的級別,而海馬又能與大腦皮層的所有興奮模式建立聯(lián)系,因而要求海馬中每一個神經(jīng)元都在不同時刻與大腦皮層的不同神經(jīng)元興奮模式中神經(jīng)元相聯(lián)系,使海馬中的興奮模式在某一時刻與某一事件的皮層相聯(lián)系,而另一時刻可以和另一事件的皮層聯(lián)系,因此,在A、B區(qū)與CA3區(qū)神經(jīng)元間應(yīng)有相互競爭和某些隨機因素存在。對這個模型進行仿真,可以較好實現(xiàn)長時記憶的鞏固,以及模擬海馬損傷病人的遺忘模式。由以上兩個模型我們可以看到聯(lián)結(jié)主義解釋認知心理學的強大能力絕不是符號加工理論所能比擬的,如果我們能證明人工神經(jīng)網(wǎng)絡(luò)也擁有符號加工理論中符號序列的串行處理能力,那么符號加工理論所盤踞的人類高級推理過程就也可以被人工神經(jīng)網(wǎng)絡(luò)所模擬,由此符號加工理論對認知心理學而言就可以進入歷史博物館了。在人工神經(jīng)網(wǎng)絡(luò)的研究中有從神經(jīng)網(wǎng)絡(luò)提取規(guī)則以及對專家系統(tǒng)與神經(jīng)網(wǎng)絡(luò)結(jié)合進行知識求精等研究,這些告訴了我們神經(jīng)網(wǎng)絡(luò)有能力把符號序列表達的知識、推理轉(zhuǎn)化為神經(jīng)網(wǎng)絡(luò)表達的內(nèi)部事宜。當然這種結(jié)果的出現(xiàn)在我們看來是水到渠成、理所應(yīng)當?shù)?,畢竟人腦能進行符號操作,能且只能來源于神經(jīng)網(wǎng)絡(luò)的某種能力。1988年Gallant簡述了連接結(jié)構(gòu)的專家系統(tǒng);此后,Yoon和Peterson以及Li和Wee開發(fā)了幾個應(yīng)用實例;1989年Dietz、Kiech和Ali又創(chuàng)建了噴氣和火箭發(fā)動機診斷神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)。1990年Benachenhou、Cader、Szu、Medsher、Wittwer和Garling等指出,神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)的集成方法是有前途的。自此以后神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)不斷地結(jié)合,并在越來越多的符號加工領(lǐng)域獲得新成果。符號加工本質(zhì)上就是用或、與、非、蘊含(if—then)、等價、優(yōu)先、至少/最多/恰好等基本邏輯構(gòu)成推理過程。而每一個基本的邏輯推理都可以表示成某種神經(jīng)網(wǎng)絡(luò),如圖1-18所示。圖1-18基本邏輯單元實現(xiàn)示例(左圖實現(xiàn)“或”,右圖實現(xiàn)“與”)把實現(xiàn)基本邏輯的各種單元組合起來也可以實現(xiàn)復(fù)雜的邏輯過程,如圖1-19所示,實現(xiàn)了如果A與B為真,則X為真;如果A與C為真,則Y為真;如果B與E為真,則Z為真;如果A與D與E為真,則X為真;EDCBRULES:IFAandBTHENXIFAandCTHENYIFBandETHENZIFAandDandETHENXAZYXEDCBRULES:IFAandBTHENXIFAandCTHENYIFBandETHENZIFAandDandETHENXAZYX圖1-19一個實現(xiàn)了較為復(fù)雜邏輯推理的神經(jīng)網(wǎng)絡(luò)案例再例如東華大學碩士學位論文《符號系統(tǒng)與神經(jīng)網(wǎng)絡(luò)相結(jié)合的知識求精技術(shù)研究》報道了使用KRSNN方法依據(jù)貸款人的工作情況、消費情況、婚姻狀況、賬戶余額、還款年限、申請年齡等條件判斷是否同意貸款審批的一個神經(jīng)網(wǎng)絡(luò),在合理的分類精度下,該神經(jīng)網(wǎng)絡(luò)使得判斷規(guī)則數(shù)量減少為原來的1.1%。因此,認知心理學的兩個主義本質(zhì)上是可以合一的,但這并不代表認知心理學的工作只要是不斷的建神經(jīng)網(wǎng)絡(luò)模型模擬已發(fā)現(xiàn)的人類高級認知活動的規(guī)律就萬事大吉了,因為認知心理學正面臨著一次悄然的革命,現(xiàn)在的認知心理學還需要再出發(fā),再出發(fā)去發(fā)現(xiàn)承載神經(jīng)網(wǎng)絡(luò)的大腦、肉身,本身亦是客觀世界的一部分是如何被自己的大腦神經(jīng)網(wǎng)絡(luò)所認識的。20世紀70年代,第二代認知心理學開始起源,隨后與盛行于80年代的具身主義運動同步發(fā)展。70年代后期,西方思想界對傳統(tǒng)的哲學觀、信息加工理論和生成語法提出了一系列不同的觀點,其基本思路是質(zhì)疑認知主義,批判各種形式的客觀主義,諸如二元論、先驗論、形式主義、符號主義等,轉(zhuǎn)而強調(diào)研究認知、心智及語言與身體經(jīng)驗的關(guān)系。認知科學中的各個學科都開始了向身體(包括腦)及其經(jīng)驗的回歸。1977年出版的《認知科學》和1979年召開的第一次認知科學年會是其發(fā)展史上的重大標志性事件。這一具身主義運動在哲學上集中反映在拉考夫在其1987年出版提出的新經(jīng)驗主義的思想中,拉考夫以后又將這一新經(jīng)驗主義在他與約翰森合寫的名著中表述為一種新的哲學體系,即所謂具身哲學或稱體驗哲學。第二代認知科學的核心特征便是心智的具身主義。心智的具身主義意指:心智有賴于身體之生理的、神經(jīng)的結(jié)構(gòu)和活動形式。如果說“活動”實際上是主、客體的相互作用,那么,也可以把心智理解為深植于人的身體結(jié)構(gòu)及身體與世界、環(huán)境的相互作用之中。對相互作用的的重視就必然引發(fā)對主體經(jīng)驗的重視。用西倫的話說,即“認知是具身的,就是說認知源于身體與世界的相互作用。依此觀點,認識依賴于主體的各種經(jīng)驗,這些經(jīng)驗出自具有特殊的知覺和運動能力的身體,而這些能力不可分離地連在一起,共同形成一個記憶、情緒、語言和生命的其他方面在其中編織在一起的機體”。瓦雷拉等人認為,具身認知有兩點含義:其一與西倫的觀點類似,認知依賴于主體的經(jīng)驗種類,而這些經(jīng)驗?zāi)顺鲎杂诰哂懈鞣N感覺運動能力的身體;其二,這些感覺運動能力根植于或嵌入于一個更廣泛的、生物的、心理的和文化的情境之中。因此,人的心智不是某種離身的智慧,偶然而恰巧地發(fā)生在人的身上于是才有了所謂人的心智,它是溫軟的肉身而不是冰冷機器。人的心智不應(yīng)是第一代認知心理學所描述的那樣,對自己的大腦、肉身視而不見、棄之如敝履,建立起漂浮在虛空之中的、無所依附的特征提取、理智推理,而是需要把大腦及其肉身也作為客體的一部分。由此,一個大腦不僅要認識外界客體同時也要認知自身這個客體,從而來完成外界與自身的評估,最終形成一個外界與自身不斷相互作用、不斷協(xié)調(diào)的動力系統(tǒng)。符合具身認識理念的研究有很多,其中自我概念心理表征的文化神經(jīng)科學研究,算是研究中比較經(jīng)典的。這方面研究揭示西方文化觀促使產(chǎn)生的“獨立型自我”與東亞文化對基本社會聯(lián)結(jié)的重視更易產(chǎn)生的“互依型自我”在自我概念表征的神經(jīng)機制方面可以存在明顯的不同,而能被腦成像研究發(fā)現(xiàn)。由于西方文化與東亞文化下的社會環(huán)境存在很大的不同,一個重要問題是成長于不同文化環(huán)境的個體,其自我面孔的加工機制是否也有所不同。根據(jù)Markus和Kitayama(1991)的理論,西方文化重視自我認同,所產(chǎn)生的獨立型自我傾向于更多將注意投向自己而非他人。而東亞文化強調(diào)基本的社會聯(lián)結(jié),所產(chǎn)生的互依型自我通常會對重要他人的信息更為敏感,并且對他們傾注的注意與對自己同樣多。根據(jù)這種觀點,可以預(yù)期自我面孔識別的機制在西方與東亞文化間會有所不同。具體而言,西方文化下的獨立型自我會對自己的面孔分配更多的社會顯著性或更強的正性聯(lián)結(jié),這導(dǎo)致他們在自我面孔與他人面孔同時呈現(xiàn)時,更容易注意到自己的面孔,并對自我面孔有更深層次的加工。相比之下,由于東亞文化中的互依型自我更強調(diào)與他人之間關(guān)系的重要性,他們對自我面孔加工的關(guān)注程度可能不及西方文化中的個體,因而行為上表現(xiàn)較弱的自我面孔優(yōu)勢效應(yīng)。此假設(shè)在近期的一項跨文化事件相關(guān)電位(ERP)研究中得到了驗證。Sui等人(2009)采用相同的實驗刺激和范式記錄了不同文化組被試進行自我面孔加工時的行為和腦電反應(yīng)。實驗中向英國被試與中國被試呈現(xiàn)自我與朋友的面孔,并要求他們判斷面孔朝向。盡管兩組被試對自我面孔的反應(yīng)時均短于他人面孔,這種自我面孔加工優(yōu)勢在英國被試中表現(xiàn)得更為顯著。此外,兩組被試反應(yīng)時上的差異與腦電活動的組間差異呈正相關(guān)。英國被試判斷自我面孔時在大腦額、中央?yún)^(qū)引發(fā)的負波N2,其幅度要大于判斷熟悉面孔時引發(fā)的N2幅度。而中國被試則表現(xiàn)出相反的模式,相比于判斷自我面孔,他們在判斷朋友面孔時引發(fā)的前部N2成分幅度更大。由于前部N2與面孔加工深度相關(guān),并有利于個體化過程(Kubota&Ito,2007),這種文化特異的N2活動說明,相對于中國被試,英國被試對自我相關(guān)信息傾注了更多的注意。因此,獨立型自我構(gòu)念可能會使得自我面孔相對于他人面孔的社會顯著性增強,這導(dǎo)致了西方被試在行為表現(xiàn)與神經(jīng)機制上均表現(xiàn)出自我-他人之間的分離。而東亞文化促生的互依型自我構(gòu)念則演化出不同的認知神經(jīng)機制,對熟悉的他人面孔賦予了比自我面孔更多的社會顯著性。這些研究的結(jié)果充分證明了神經(jīng)網(wǎng)絡(luò)承載著自身與外界協(xié)調(diào)的重大職責,它可以讓自己是獨立型的也可以是互依賴型的,并且還會因此對外界與自身產(chǎn)生不同類型的表征。換言之,神經(jīng)網(wǎng)絡(luò)不是呆板的修改突觸來刻畫外界,而是帶著一副由它自己創(chuàng)造的有色眼鏡來觀察、解釋這個世界。最后,有的學者認為第一代認知科學是認知可計算主義的,這是在現(xiàn)代高科技包裝下的古典畢達哥拉斯主義的復(fù)活,第二代認知科學必須拋棄可計算主義,并舉出認知計算復(fù)雜度過高(可能大于用整個地球資源來構(gòu)建目前最良好的電子計算機的計算能力)和拓撲視覺(拓撲不變性作為物體的高級幾何特征卻比物體的低級特征先行得到處理)來作為支持的證據(jù)。但筆者認為,作為理解宇宙運行的物理學都是符號演繹的,那么人腦的運行是不可能擺脫以符號演繹為內(nèi)核的計算主義的,否則我們只能回到神秘主義了。本書將于第二章嘗試構(gòu)建一個具身主義的動力系統(tǒng)來完成心理學某種程度的統(tǒng)一,并以此作為計算主義成立的支持依據(jù)。第六節(jié)符號動力學的神經(jīng)編碼機制及其應(yīng)用上一節(jié)我們提到人工神經(jīng)網(wǎng)絡(luò)需要再出發(fā),來回答具身主義的問題,去構(gòu)建一個神經(jīng)網(wǎng)絡(luò)自身與外界不斷相互作用的動力系統(tǒng),這可以看作是人工神經(jīng)網(wǎng)絡(luò)描述高級功能方面的再出發(fā)。但其實人工神經(jīng)網(wǎng)絡(luò)在底層方面也需要再出發(fā),因為目前的人工神經(jīng)網(wǎng)絡(luò)的建模都直接輸入數(shù)值或其他被賦予了意義的輸入,而人腦的輸入只有一串串的真實生物神經(jīng)元發(fā)出的神經(jīng)脈沖,沒有任何給定的數(shù)值、模式或者意義,如何從乍看上去凌亂不堪的神經(jīng)脈沖中學習出數(shù)值、特征、符號、感覺、意義,甚至完成意識涌現(xiàn),是一個需要再一次從零開始思考的問題。1神經(jīng)信息編碼的有關(guān)問題Eric總結(jié)了一百年有關(guān)神經(jīng)科學的發(fā)展概況[1],在結(jié)尾處提到:物理學家和化學家常談起現(xiàn)代生物學還是處在非理性階段,可是Eric認為這一日子不會太長了,他所指的“這一日子不會太長了”是指分子神經(jīng)生物學的出現(xiàn)。確實,神經(jīng)遞質(zhì)、離子通道等的生物化學過程分析已經(jīng)有了很明確的結(jié)果,但是它還是不能解決神經(jīng)信息的問題。神經(jīng)元中某些分子成分產(chǎn)生變化,確實會影響到整個神經(jīng)系統(tǒng)的工作。這正像電視機中某些電阻變質(zhì)會影響圖像質(zhì)量一樣,但是電阻的化學成分與圖像還是兩個層次上的概念、是兩回事。因此,即使分子神經(jīng)生物學發(fā)展得很完整,神經(jīng)信息學還只能是處在描述性階段。Gilles在Science上著文,文章開始也有這樣一段話:研究神經(jīng)編碼需要回答如下問題:信號攜帶者的形式是什么?為什么是這一形式?雖然這樣明顯而淺近的問題,在這里卻變得十分困難和出現(xiàn)各種偏見。在現(xiàn)有的文獻中有的認為神經(jīng)脈沖平均頻率代表信息或稱為頻率編碼,有[1]童勤業(yè)等,嗅覺神經(jīng)系統(tǒng)脈沖編碼的機理研究[J].中國科學E輯信息科學.2006,36(4):449~466。該文受“九七三”重大基礎(chǔ)預(yù)研項目資助。的人認為神經(jīng)脈沖各種分布函數(shù)代表信號,也有人認為單個神經(jīng)元脈沖不能代表信號,于是提出了一簇神經(jīng)元發(fā)放脈沖的綜合波形代表信息的神經(jīng)團理論或稱為群體編碼。究竟哪一種理論更正確呢?有學者認為,神經(jīng)編碼是一串串不規(guī)則的神經(jīng)脈沖序列本身,但是,要確定它是否真是神經(jīng)信息編碼還要回答以下幾個問題:1)神經(jīng)脈沖序列的集合中能否找到一個子集與外界輸入信號建立起對應(yīng)關(guān)系。人的神經(jīng)系統(tǒng)所能接受到的信息都是通過感覺器官,感覺器官所感受到的信息要在神經(jīng)系統(tǒng)中反映,神經(jīng)系統(tǒng)中神經(jīng)脈沖序列就要有與外界輸入信號建立起對應(yīng)關(guān)系,至少在神經(jīng)脈沖序列集合中存在一個子集與外界輸入信號建立起對應(yīng)關(guān)系。2)神經(jīng)脈沖序列空間是一個有序空間。如果我們把所有在神經(jīng)系統(tǒng)中可能出現(xiàn)的神經(jīng)脈沖序列集合起來構(gòu)成一個“神經(jīng)脈沖序列空間”,那么這一空間是有序空間嗎?因為所有的感覺器官所感受的刺激(如聲、光、氣味等)信號都有一最基本的特性就是“有序性”,聲音有大小、遠近之分,光有明暗之分,氣味有濃淡之分。如果要把外界信息與神經(jīng)脈沖序列空間建立起對應(yīng)關(guān)系,那么神經(jīng)脈沖序列空間也必須具有這一特征─可排序性。至少其中有一個子空間是有序的。3)神經(jīng)脈沖序列空間內(nèi)具有變換或運算的性質(zhì)嗎?神經(jīng)系統(tǒng)中存在信息處理,這是被人們廣泛接受的事實,信息處理的實質(zhì)就是變換或運算?,F(xiàn)在就要問這一空間具有什么樣的特性?神經(jīng)脈沖序列空間能構(gòu)成什么樣的體系呢?在這空間中能進行什么樣的變換?編碼空間內(nèi)的變換規(guī)則是什么?盡管像EEG之類信號包含有信息,但是EEG所構(gòu)成的空間至少到目前為止不能成為神經(jīng)編碼空間,因為在EEG空間中到目前為止還沒有發(fā)現(xiàn)具有這一特性。這也是衡量神經(jīng)脈沖序列是否能成為真正編碼
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 各行業(yè)各類產(chǎn)品銷售額統(tǒng)計表
- 企業(yè)領(lǐng)導(dǎo)在年度會議上的致辭講稿
- 大學生實習安全協(xié)議書
- 房地產(chǎn)級代理合同
- 廣州勞務(wù)派遣協(xié)議
- 公路運輸與鐵路運輸
- 房地產(chǎn)合作開發(fā)合同
- 2025年福建貨運駕駛員從業(yè)資格題庫
- 國內(nèi)公路運輸合同書
- 化妝品公司員工勞動合同
- 大學生安全知識班會
- 課件圍術(shù)期下肢深靜脈血栓的預(yù)防與護理
- 2025年菏澤家政職業(yè)學院單招職業(yè)技能測試題庫完美版
- 《電力變壓器》課件
- 初級鐵路線路工技能鑒定考試題庫
- 2025年度建筑垃圾運輸與再生資源回收一體化合同樣本
- 2024新人教版英語七下單詞默寫表(開學版)
- (2025)輔警招聘公安基礎(chǔ)知識必刷題庫及參考答案
- 農(nóng)業(yè)機械設(shè)備維護與質(zhì)量保障措施
- 基于圖像處理的CAD圖紙比對算法
- 人教版六年級下冊數(shù)學第二單元百分數(shù)(二)綜合練習卷-(附答案)
評論
0/150
提交評論