人工智能的主題演講稿

上傳人：醉*** IP屬地：貴州上傳時間：2023-09-28 格式：DOCX 頁數(shù)：19 大小：30.48KB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩14頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

1/1人工智能的主題演講稿

各位來賓：

大家好！

我在的部門在百度叫做深度學習實驗室，這是2013年的時候在百度成立的專注于深度學習的實驗室，應該是全世界在工業(yè)里面第一個專注于深度學習研究的實驗室。我今天要和大家分享的首先是看一下最近幾年來人工智能在圖像語言方面的最新的進展，以及分享一下我對人工智能目前它缺少的東西，以及以后我們未來可以去繼續(xù)工作的方向。

人工智能這個概念最近幾年非常火，我們看到人工智能傳統(tǒng)的一些研究方向，像計算機視覺，還有語音識別，這些方面在最近幾年都有了過去幾十年不可想象的巨大進展。尤其是上個月Googel的AlphaGo和李世石下的那盤棋以后，更是激起了大家對人工智能高度的熱情。為什么人工智能在最近幾年有快速的發(fā)展呢?一個最重要的原因就是我們通過了幾十年的積累，我們現(xiàn)在已經(jīng)有了非常可觀的計算能力，同時在這個計算能力的基礎上，可以在一個可接受的時間內(nèi)處理大數(shù)據(jù)。我們最近幾年因為深度學習的發(fā)展，給我們提供了一個非常靈活的，非常具有建模能力的學習系統(tǒng)，正是因為這兩者的結(jié)合，它能夠把我們大數(shù)據(jù)后面蘊藏各種豐富復雜的關系，能夠把它提取出來。從而成為我們?nèi)斯ぶ悄芸焖偾斑M的巨大推動力。

因為看到深度學習的巨大潛力，百度也投入了非常多的力量來開發(fā)一個深度學習的訓練和運算平臺。這個平臺叫做PADDLE。那它的目的就是為了把深度學習更好的應用到百度的各種產(chǎn)品里面去，讓它更方便的，更好的提高我們的用戶體驗，提高智能度。我們這個深度學習的平臺能支持各種豐富的數(shù)據(jù)類型，比如說像二維圖像數(shù)據(jù)，或者是詞的訓練數(shù)據(jù)，尤其像工業(yè)界非常重要的上千億的稀疏數(shù)據(jù)，也能非常有效的支持。

另外也提供了非常靈活的建模表達能力，能非常方便地根據(jù)他應用的需求，配置出不同的深度學習的模型。比如說一個循環(huán)網(wǎng)絡，或者是處理圖像的卷積網(wǎng)絡，任何靈活的組合都可以在我們這個平臺上面很方便的配置出來。

因為在百度我們有非常大量的運算資源，為了能夠充分的應用我們的運算資源，我們這個平臺也非常高效的進行多機的訓練，這樣也能很有效的處理我們的大量的數(shù)據(jù)。

因為有了這么一個非常高效，非常靈活的計算深度學習的平臺。百度最近幾年把深度學習運用到了產(chǎn)品的方方面面。比如說核心的搜索和廣告這樣的產(chǎn)品，還有可能不太想到的，像數(shù)據(jù)中心的智能控制，病毒的查殺，這種產(chǎn)品里面我們都成功的把深度學習應用到上面去，提高我們產(chǎn)品的體驗。

隨著深度學習的逐步在各種人工智能問題里面的更深入的使用，我們現(xiàn)在開始看到機器在一些很特定的感知問題上，它的能力已經(jīng)在逐漸接近甚至超過了人類的水平。比如語音識別，我們百度的語音搜索，在比較短的文字，和上下文沒有太大關系的語音識別這種任務，我們百度的語音識別系統(tǒng)做到明顯比人好的程度，錯誤率不到6%，而人的任務上的錯誤率可以是接近了10%。因為實際上在沒有上下文關系的情況下，這是非常難的任務。

還有另外一個例子就是人臉識別，也是隨著深度學習的使用，人臉識別這個東西也是最近幾年有了非常大的提升。人臉識別一個最核心的任務，就是給兩幅圖，你要判斷是否來自同一個人，包括百度在內(nèi)的很多公司還有研究團體，都取得了明顯比人好的水平。能看到我們的機器錯誤率現(xiàn)在非常低，只有%，而人的任務率是%，現(xiàn)在已經(jīng)不及機器了。

還有像其他一些圖像識別的任務，在最近幾年也都有了非?？焖俚倪M步。比如說細粒度圖像識別，在一類物體里面我們還要區(qū)分它子類，比如說在狗里面要區(qū)分各種不同的狗。這樣的任務實際上是比更普通的物體識別更難，因為要對物體細致的特征有區(qū)分。這樣一個任務上在2013年的時候，我們最好的系統(tǒng)錯誤率都還是50%，到了2015年錯誤率就降到20%，可到今年最新的結(jié)果錯誤率就降到10%幾。像這種細粒度的物體是別人是很困難的，人是很難認識200多種狗的。

下面我們談一些語言方面用深度學習的進展。我們知道其實語言是人類智力的核心的體現(xiàn)。我們是用深度學習的思想來處理語義理解的任務。傳統(tǒng)在語義理解的任務里面，基本上是要分好幾步走的過程。首先要通過詞法解析、語法解析，然后構(gòu)造各種人為的特征，然后得出語義分析的結(jié)果。深度學習的理念就是端到端的，從最原始的數(shù)據(jù)開始的，這里就是一個詞的序列開始的，我們不考慮任何的人為的特征構(gòu)建，就直接用一個完整的模型，得出我們想要的結(jié)果。我們?nèi)藢@個問題的理解，主要是體現(xiàn)在我們模型的結(jié)構(gòu)當中。這樣的思想，過去幾年在圖像識別、語音識別里面都給他們帶來了巨大的提升。我們在語音理解這樣的任務里面，也做到了比傳統(tǒng)方法好的結(jié)果。

另外一個非常好的，端到端的深度學習，在自然語言處理里面非常成功的應用，就是機器翻譯。端到端的機器翻譯的做法，是2014年的Google首次提出來了，因為是一個新方法，大家認為很有潛力的。但是剛提出來的時候還是比傳統(tǒng)的方法有明顯的差距。但僅僅過了一年以后，就能夠達到了傳統(tǒng)方法的質(zhì)量。今年的結(jié)果已經(jīng)比傳統(tǒng)的方法好了。一旦我們用好了以后，就可以對它各種效果有非?？焖俚奶嵘?/p>

除了語言其實最近和語言相關的比較熱點的研究方向，就是把語言理解還有圖像識別，語言生成這些傳統(tǒng)的人工智能比較隔離的研究方向，有機的組合起來，用一個完整的深度學習模型來處理。通過這樣的一個整體的模型，我們機器就可以比較更自然的學到語言和它感知到的物理世界的聯(lián)系。

像這樣的統(tǒng)一的視覺語言統(tǒng)一的模型，我們有一些例子。第一個就是看圖說話，給了圖以后，說出一個非常自然的描述，“一輛火車沿著森林間的鐵軌駛過”。也可以對圖像的自然語言的提問，給出一個合適的答案。甚至也可以理解視頻，看到一段視頻以后也可以給對這個視頻做出描述。這個工作我們在百度是屬于比較早的開始，現(xiàn)在也有很多研究機構(gòu)在做這樣的視覺和語言統(tǒng)一的研究。

深度學習最近還有一個事，就是現(xiàn)在向更深的模式發(fā)展。在去年圖像識別比賽上面，我們看到獲獎最好的一個模型是微軟開發(fā)的深度達到150多層的深度模型。另外我們在翻譯上也發(fā)現(xiàn)，隨著模型深度的不斷加深，翻譯效果也是變得越來越好。

深度學習最近還有另外一些研究的熱點，就是所謂的推理、注意力、記憶，這方面是偏向于人類認知能力的，希望把這樣的一些機制能放在深度學習能力模型里面來。特別是在這里面注意力這樣的機制，在一些實際的應用里面也取得了非常好的效果，比如細粒度的圖像識別，或者翻譯的任務。像記憶的機制，現(xiàn)在還是比較初期的階段。

深度學習給AI帶來了快速的進展，但我們還有很多的路要走。人工智能這個概念是1955年的時候JohnMcCarthy提出的，同時還有3位重量級的研究人物。他們說了要用10個月花兩個月時間，對人工智能做一個非常巨大的進步，實際上我們現(xiàn)在看到他這個是遠遠低估了人工智能的難度?，F(xiàn)在的人工智能還有很多的缺陷，人類智能一個最核心的點就是自我學習和創(chuàng)造的能力，我們看到現(xiàn)在有很多具體的智能的系統(tǒng)，比如說AlphaGo，它還缺乏一種自我學習和創(chuàng)造的能力。比如說來了一個新的棋給他學，還需要大量的人參與工作，才可以改造。而人就不需要，人可以自己主動的學習各種新的任務。

最重要的一點就是說現(xiàn)在人工智能還缺少一種從少量標注數(shù)據(jù)學習的能力，一個例子比如說圖像識別，ImageNet里每個物體種類有幾百幅圖，一個小孩要認識一種東西可能幾幅圖足夠了。還有英法翻譯的訓練數(shù)據(jù)，人可能需要幾萬個小時能閱讀完，但如果你是說英語的，掌握法語的話可能只需要幾百小時。所以看到現(xiàn)在的深度學習缺乏少量標注學習的能力。

那么最核心的一點就是我們需要有對環(huán)境的一個非常好的表示，就是說我們需要通過非常大量的數(shù)據(jù)太能學習出來，非監(jiān)督學習的機制，才能讓我們有效的利用到大量的非標注的數(shù)據(jù)，進行非監(jiān)督學習方式的一個最行之有效的方法，就是用它來預測未來。我們知道預測未來的.能力是人智力的核心體現(xiàn)。比如說物理學是一個對簡單系統(tǒng)的預測，人類的智力包括機器學習，是一個復雜系統(tǒng)的近似預測。如果我們通過這種預測未來的學習方式，就可以有效的掌握環(huán)境的規(guī)律，所以得到有效的表示。

我們現(xiàn)在的人工智能系統(tǒng)缺乏常識，剛才李院士也講了很多的自動車，我們在座的很多人開車可能開幾百公里就非常好了。但大家知道我們現(xiàn)在最好的Google的自動駕駛車，現(xiàn)在已經(jīng)開了超過了200多萬公里，但既使是這樣，現(xiàn)在還是不能夠去駕車。最核心的問題是缺乏一種像人這樣的常識，就是說它遇到很多路況對人是非常簡單的，人看到就知道怎么做。但機器缺乏常識性的理解，就只能通過人一條一條把每種路況導入系統(tǒng)里去。要想解決這樣的問題，我覺得有效的方式就是放到真實的環(huán)境里面學習，像這樣的概念最近在Facebook和微軟也提出了這樣的想法，他們提出創(chuàng)造一個虛擬的模擬環(huán)境，讓人工智能體在這個環(huán)境中自己去探索，然后就可以在這樣和環(huán)境的交互中，就能比較有效的建立它常識一樣的東西。

還有另外一個主要的局限之處，就是通過數(shù)據(jù)來學習。我們現(xiàn)在所有的東西首先要考慮搜集數(shù)據(jù)。我們?nèi)藖韺W習，比如說要區(qū)分這樣兩種不同的鳥，需要收集大量的數(shù)據(jù)，從數(shù)據(jù)里面自動總結(jié)出規(guī)律出來。實際上我們?nèi)藭嬖V他，可以看到這兩個圖的區(qū)別，人可以用非常精煉的語言告訴其他人。而現(xiàn)在的機器學習還非常缺少有效的能夠利用人的知識的途徑。

我認為如果要解決這樣的問題，我們需要把語言作為機器學習系統(tǒng)一個基礎的能力，否則的話我們就很難做到能夠把人類大量的知識傳遞到機器里面去，然后同時來說我們需要這個機器能夠理解語言，這樣我們才能夠表達人類的需求，能夠幫助他的理解。旁邊這就是一個電影里面的人在教機器人來學習讀書。

我們要做真正像人這樣的非常強大的人工智能，可能我們需要從最基礎的東西開始做起。我們需要做的是像幼兒一樣，讓他自主在一個環(huán)境里面去學習感知，學習他的行動的一些基礎的技能，同時把學習語言作為一個最核心的東西，包含在這樣的一個系統(tǒng)里面。這些就是大概我的分享，我們還有非常多的困難，但是我覺得也給我們帶來非常多的機會，我也希望有更多人和我們一起探索人工智能非常有意思的問題，去創(chuàng)造我們?nèi)斯ぶ悄艿奈磥?，謝謝大家。

篇2

各位來賓：

大家好！

剛才大家對機器人開車有一點想法，好像總是感覺不靠譜。汽車——這個曾經(jīng)被稱之為改變了世界的機器，今天受到了人們的質(zhì)疑，最大的問題是，汽車成了人類的第一殺手。我們做一個簡單的調(diào)查，你的親人、朋友、親人朋友的朋友，在這個大朋友圈里，你有沒有發(fā)現(xiàn)，其中會有一個人曾經(jīng)受到過汽車事故的傷害我看到有人點頭了，人類開車，更多的情況下，不是汽車的動力學性能不好，而是人有更多的智能要釋放，他要看路邊的美女好看不好看，結(jié)果壞事了，這叫做注意力轉(zhuǎn)移。情緒不穩(wěn)定，不是我們注意一點就可以的，因為人是個認知主體，他一定要開小差的，他一定要睡眠的，他一定會疲勞的，所以車禍的百分之八十左右都是人為事故，不是車子不好，所以人們對這個人類殺手是耿耿于懷的。我們發(fā)明了汽車，為什么讓它造成我們的不幸呢

人們對汽車的最大意見應該是把駕駛者的活，交給計算機、交給人工智能、交給科學技術(shù)。所以我們就千方百計地提高無人駕駛的可靠性、安全性。經(jīng)過我們的初步估算，人開車的可靠性是十的負三次方，千分之一;而如果改成機器人開車，計算的結(jié)果是十的負五次方，比人開車的事故率會降低百分之一，所以安全問題就解決了。

大家都比較關注剛才看到的那些攝像頭，這些攝像頭大概跟手機的那個攝像頭的價格差不多，一兩百塊錢就可以了。但是，要想看紅綠燈，看高速行駛的障礙物，這個攝像頭還是需要有一些特殊能力的，比如說高動態(tài)。大家知道攝像頭的一個最大問題就是光照，夜間要開車，大霧天也要開車，所以攝像頭的難度很大。我想告訴大家光有傳感器還不夠，這就是認知的作用，智能車本質(zhì)上就是駕駛認知的形式化，需要一個腦子來認知。

重點是要講一下駕駛腦。我們?nèi)ツ暧靡惠v大客車和幾輛小轎車，從鄭州到開封實現(xiàn)了全程的無人駕駛。我們課題組利用這么多年的時間專門從事駕駛腦、駕駛認知的形式化，還是嘗到了一些興奮點，這件事情不是那么容易的。鄭州到開封的實驗成功之后，美國一個叫做“連線”的網(wǎng)站給我們做了個評論，它說：谷歌那個小車子叫smartcar(智能汽車)，固然性感，大車子也性感，我才知道智能公交車，還可以用“性感”這個詞來形容。在智能駕駛當中，我們實際上走了很多的路程，2012年，我們從北京到天津，在高速公路封閉的道路上做無人駕駛，大家可以看一看這段視頻，是三四年前的事情了。

當時的媒體也很震驚，覺得我們從北京到天津無人駕駛很了不起，其實震驚的不應該是這件事，而是我們汽車的頭頂上沒有頂美國的64線激光雷達。我們用的比較簡單的雷達就把它做到了，我覺得這一點還是值得驕傲的。很多開車的朋友都說開車是個樂趣，是人追求驚喜歷險的樂趣，我們用上海汽車集團的一輛新概念車叫iGS，做了一個賽車考駕照的科目，叫做十八米繞樁，既要快又不能碰到錐形標。你看(視頻)，又要快又不能碰到這個錐形標。智能駕駛是個不可改變的方向，我們?nèi)艘谲嚴锩娓墒裁茨貎?yōu)雅地享受移動生活呀，這多好呀。

人工智能六十年了，今天我們來看人工智能在我們這一代人身上到底發(fā)生了多大的變化。今年AlphaGo圍棋跟九段圍棋手李世石下了五盤，四比一贏了，震撼了全世界。不知道在座的有沒有看看這個圍棋現(xiàn)場，我想問一問，圍棋是我們中國的傳統(tǒng)文化，在座的會下圍棋的舉下手，還是少了一點。AlphaGo圍棋能贏，反映了我們?nèi)斯ぶ悄茉诒寂艿牡缆飞弦呀?jīng)有了一個新的里程碑。我想了一下，你到汽車裝配廠，到很多生產(chǎn)線去看，都是工業(yè)機器人在干活，這是一個方面，所以我們國家提出了智能制造2025。另外還有一個方面，就是農(nóng)業(yè)。大家知道由于現(xiàn)在我們國家的城鎮(zhèn)化，使得很多農(nóng)村人到城里來了，尤其是青年人。中國的下一代農(nóng)民的平均年齡你們想過沒有，可能是多少歲我先告訴你們兩個數(shù)字，日本的農(nóng)民的平均年齡是65歲，美國的農(nóng)民的平均年齡是60歲，中國的農(nóng)民將來可能是50歲。年輕人都出來了，那靠什么呢。下一代的新農(nóng)民就是無人拖拉機、無人收割機、農(nóng)用無人機。所以我們可以憧憬一下，人工智能給我們的精準農(nóng)業(yè)、智慧農(nóng)業(yè)展示了很好的前景。尤其是服務機器人，我家里有個鬧鐘，六點鐘就響，在一定程度上也可以叫作叫醒機器人，只不過比較簡單。如果你家里有很多家務活，而一個人有十個機器人為你服務，我們不是可以更加有尊嚴、更加優(yōu)雅、更加有智慧地生活嗎所以我的觀點是：大家對人工智能還要多想一點，就像我們對科學要有一顆敬畏之心一樣，對人工智能也要有一顆敬畏之心。我們一定可以與機器人共舞，而且在共舞的過程當中，我想人類還是領舞者。

篇3

各位來賓：

大家好！

今天非常高興、非常榮幸能參加這樣一個盛會。今天我給帶來的演講是我的一點學習心得，題目叫做自學習的人工智能。首先大家都知道在60周年之際，我們首先應該記住的是這位人工智能的先驅(qū)，圖靈。在他的問題的感召下，我們就有了今天這樣的一個盛會和今天人工智能的飛速發(fā)展。他的問題，機器可以思維嗎?可以從不同的維度來解釋，那么首先人類對人工智能的一個探索也可以圍繞對問題不同解釋的探索。

第一個探索，應該說是在邏輯層面的探索。60年代人工智能的這些先驅(qū)就考慮用邏輯和搜索來研究人工智能，比如下棋、推理，比如說可以去做路徑規(guī)劃等等。那么他們有一個很強的假設，這個假設應該說從某種程度上來說是非常直觀的。智能包括計算機可能賦予的智能，是來自于計算物理符號的排列組合，我們只要能很聰明的把這些物理符號排列組合的話，人類是可以從一系列的零和一的組合來得到。有了一些成就之后也發(fā)現(xiàn)這樣的假設是有它的瓶頸的。在之后大家又有一部分人著力于研究能夠有學習功能的人工智能，就有不同的學習算法，機器學習的計算法被研究出來。其中包括大家都熟悉的人工神經(jīng)網(wǎng)絡。

人工智能的幾個里程碑我們現(xiàn)在也很熟悉，第一個大家公認的是里程碑是深藍，這個比賽意味著幾件事。一個是說在大規(guī)模的搜索的狀態(tài)下，在可能的狀態(tài)空間的搜索，實際上是一個在物理符號的空間的排列組合。也就是說在60年代人們的那些假設有一部分是正確的，我們確實可以從這種搜索和物理符號的排列組合獲得很多的智能。

緊接著的階段是，知識就是力量，這是隨著互聯(lián)網(wǎng)和大數(shù)據(jù)到來的一個熱潮，從網(wǎng)上，從不同的媒體我們會獲得很多數(shù)據(jù)，把這些數(shù)據(jù)經(jīng)過沉淀變成知識，我們就可以贏得像這樣一個電視大賽中的人機對戰(zhàn)。

這個之后，剛剛芮勇博士也深入的回顧了一下最近的人工智能的突破，就是深度神經(jīng)網(wǎng)絡。深度神經(jīng)網(wǎng)絡的突破從計算上來說有幾個好處，其中一個好處是說它把一個全局計算的需求變成一個本地計算的需求，在做到這樣的一個同時呢，又不失掉很多的信息，這個是計算機里面無數(shù)成就的一個中心點。這樣的一個成功就使得我們能夠在不同的層次來觀察同一個數(shù)據(jù)，同樣就可以獲得我們所謂的大局觀。就像這個圖，我們在不同的層次可以得到不同的特征。

這里我們要特別強調(diào)的是人工智能也在另外一個方面潛移默化的默默的在耕耘，這個就叫做強化學習。強化學習應該說是用來做人工智能規(guī)劃的有力工具，但不是唯一的規(guī)矩。規(guī)劃這個領域相對深度學習應該說更古老，研究的力度也很多。但在很長時間一段處于靜默狀態(tài)，這個原因是因為它在計算上有很大的瓶頸，不能有很大得數(shù)據(jù)量。一個例子就是強化學習在很長時間以來只能解決一些玩具型的問題，非常小的數(shù)據(jù)。但是最近的一個突破是Google的DeepMind，把深度學習和強化學習合在一起，這樣的一個議題使得很多強化學習所需要突破的瓶頸，就是狀態(tài)的個數(shù)能隱藏起來。這種隱藏就使得強化學習能夠大規(guī)模的應付數(shù)據(jù)，就是說應付大數(shù)據(jù)。它突出的一點叫做端到端的學習，就是說我們在這里看到一個計算機的游戲，這個游戲的影像是輸入端，輸出端就是你要進行的下一個動作。這個動作是正確還是不正確，到最后會獲得一個反饋，這個反饋不一定是現(xiàn)在得到，也許是后面幾步得到的。這一點和我們剛剛講的深度學習在圖像上面的應用，就大不一樣。就更加復雜，更加契合人的行為，所以強化學習也是下一個突破。

我們看到這種端到端的深度學習，應用在強化學習上，使得DeepMind到今天在很古老的單人的計算機游戲上已經(jīng)把人類完全擊倒，它做到這樣是通過完全的自學習，自我修煉、自我改正，然后一個一個迭代。這個就是它迭代的一些結(jié)果，從左到右是一個時間軸，從下到上是它得到的效果。我們看到每一個游戲它的要求都是在不斷成長的，就像我們一個學生在學習的過程當中學到的知識越來越多，這個完全是自我實現(xiàn)，一個自學習的過程。

包括現(xiàn)在的AlphaGo也應用了很多自學習的這種效果，使得我們現(xiàn)在終于認清原來人工智能從60年代到2000年的物理符號的假設，也就是說以搜索為中心，以邏輯為中心的這種努力并沒有白費，這種努力也是需要的。另外學習也是必不可少的，像我們熟知的深度學習。所以AlphaGo對我們的啟示，就是我們把兩者結(jié)合起來，才是一個完整的智能機器。這個我們可以叫做人工智能的通用性，也就是說我們對于這兩個技術(shù)的某種結(jié)合，比方說多一點搜索，少一點機器學習，或者反之我們夠可以得到用來解釋不同的人類的智能行為。這種通用型，端到端的學習，可以用這個例子來表達。就是這個雞可以吃不同的食物，但是它下的蛋都是對人類有用的。

這里我要特別提到一點，我們并不是找到了最后的目標，這也是在不同的人工智能、強化學習，等等之類的實驗當中我們發(fā)現(xiàn)一個特點。就是我們不能完全的依靠機器去全部自動化的自我學習，至少到現(xiàn)在我們還沒有摸索出這樣一個路徑。這里是大學的例子，中文是永動機器學習，就是說這個機器不斷的在網(wǎng)上爬一些網(wǎng)頁，在每個網(wǎng)頁里面都學到一些知識，把這些知識綜合起來，變成幾千萬條知識，這些知識又會衍生新的知識。那么我們看到從下到上是隨著時間，知識量的增長。那么它到了某一個程度實際上是不能再往上走了，因為知識會自我矛盾。這個時候就需要人進來進行一部分的調(diào)節(jié)，把一部分不正確的知識去掉，讓它繼續(xù)能成長。這個過程為什么會發(fā)生呢?是因為機器學習一個很嚴重的現(xiàn)象，就是自我偏差，這種偏差就可以體現(xiàn)在這種統(tǒng)計學的一個重要的概念，就是我們獲得的數(shù)據(jù)也許是一個有偏數(shù)據(jù)，我們可能建了一個模型，對大部分的數(shù)據(jù)都有用，但其中有一些特例。我們?nèi)绾蝸硖幚磉@些特例，如何來處理我們訓練數(shù)據(jù)和應用數(shù)據(jù)之間的偏差，這個是我們下一步要研究的內(nèi)容。

一個非常有希望的技術(shù)叫做遷移學習，比方說這個是在深度學習的模型上，在上面這一部分是一個領域已經(jīng)訓練好的模型。那么在一個新的領域，如果這兩個領域之間有某種聯(lián)系、某種相似性的話，我們就不一定在新的領域需要那么多的數(shù)據(jù)來學習，你只需要一小部分。我們之所以能做到這一點是我們可以把大部分的模型給遷移過來，我們?nèi)擞羞@種能力，但是我們在做這種數(shù)據(jù)遷移的過程中，我們一定要牢記把這種有偏的數(shù)據(jù)偏差給消除掉。如果能做到這點我們就能做到不同形式的數(shù)據(jù)之間的知識遷移，比方說我們可以讓一個計算機來讀很多文字，這樣的一個計算機去識別圖像，應該比沒有讀這些文字，直接去學習圖像來的要容易。這個就更像我們?nèi)祟惖膶W習。這種學習也離不開從下到上，從粗到細這樣的一種特征的選擇。

所以我們又得到另外一個概念，就是特征工程。深度學習給我們的一個有力的工具是能夠自動的進行不同層次，進行大規(guī)模的新特征的抽取和特征的制造。那么這種特征在搜索引擎、廣告系統(tǒng)上面，可以達到萬億級，也就是說這個已經(jīng)完全不是人類所可以控制的級別了。那么智能在這樣的級別上才可以產(chǎn)生。

但是現(xiàn)在人工智能仍然有一些困境，比方說如何能夠讓人工智能來深層的理解文字，有一個著名的類似于圖靈測試的比賽，深層次理解文字，這個是在自然語言上問一些有歧異的問題，計算機如果要能正確的回答這個問題，那個模型不僅僅理解這些文字，而且要理解深層的背景文字，要理解周邊的文字，有很多文化在里面，如何能達到這一點?也是我們需要解決的。

同時深度模型還可以把它反轉(zhuǎn)，成為一種生成膜型。它不僅可以去對數(shù)據(jù)做一個決策，它還可以自己產(chǎn)生數(shù)據(jù)，可以產(chǎn)生新的數(shù)據(jù)。比方說這個是Google的一些研究員把一個深層模型里面的感知最深刻的那些圖像給描述出來，結(jié)果是這樣的，就非常有趣的生成膜型。

剛剛講的不同數(shù)字格式之間，文字和圖像之間，如果在深層實際上它們的區(qū)別已經(jīng)消失了。那這樣我們就可以對圖像去問文字的問題，甚至對文字去問圖像的問題。這樣數(shù)據(jù)的形式也就不重要了。

如果我們達到了遷移學習的要點，我們想問下一步是不是可以把所有人類經(jīng)歷過的這些學習的任務給沿著時間軸串起來，能夠讓機器向人一樣的，它的學習能力，它的智能在不斷的增長，隨著時間。那么它所需要學習的努力程度，樣本數(shù)也是逐漸減少的。這個也是我們在努力的一個方向。

另外最近發(fā)表了一篇文章也說明了遷移學習的重要性。這個文章叫做bayesianprogramlearning，這是從一個例子就能學會，我們知道深度學習是千萬個例子的。實際上它用了我們過去沒有涉及到的概念，就叫做結(jié)構(gòu)，如果我們了解了一個問題的結(jié)構(gòu)，那么這個結(jié)構(gòu)的一個具體的形式只用一個例子就可以學會了。其他的部分，需要很多例子的那一部分可能是參數(shù)、統(tǒng)計，這一部分我們實際上可以通過遷移學習來學習。也就是說整個這個圓就圓滿了，就是一個閉環(huán)了。

同時人工智能的應用也不僅僅是在圖像方面，這里的一個例子是亞馬遜的倉儲機器人。亞馬遜的倉儲機器人是在一個很大的空間，這些機器人會把這些貨架，每個貨架上面都有不同的貨品，把這些貨架偷到工人的面前，讓工人從貨架上面拿所需的貨品到箱子里面，然后快遞給客戶。為什么是這樣呢?因為現(xiàn)在的機器人技術(shù)在選擇，從貨架上選擇物體還遠遠不如人的熟練程度，但是它在路徑規(guī)劃，在

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

人工智能的主題演講稿

文檔簡介

溫馨提示

最新文檔

評論

相關文檔