版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
人工智能的現(xiàn)狀與未來網(wǎng)經科技劉繼明精品ppt1人工智能概述第一節(jié)深度學習與智能圍棋第二節(jié)人工智能3.0第三節(jié)目錄content人工智能的新革命第一節(jié)人工智能簡述深度學習算法知識圖譜精品ppt3人工智能將引領人類第四次工業(yè)革命–智能化時間18世紀末工業(yè)1.0創(chuàng)造了機器工廠的“蒸汽時代”20世紀初電力廣泛應用蒸汽機信息物聯(lián)系統(tǒng)1970年代初今天工業(yè)2.0將人類帶入分工明確、大批量生產的流水線模式和“電氣時代”工業(yè)3.0應用電子信息技術,進一步提高生產自動化水平自動化、信息化工業(yè)4.0開始應用信息物理融合系統(tǒng)(CPS)復雜度悄悄來臨互聯(lián)網(wǎng)時代正在終結人工智能機器人交通工具(即無人機、無人駕駛等)VR(虛擬現(xiàn)實)AI將催生“無用階層”嗎?人工/腦力勞動:翻譯、記者...人工/體力勞動:保安、保姆...什么是人工智能(AI)?全面實施戰(zhàn)略性新興產業(yè)發(fā)展規(guī)劃,加快人工智能等技術的研發(fā)和轉化,做大做強產業(yè)集群把發(fā)展智能制造作為主攻方向,推進國家智能制造示范區(qū)、制造業(yè)創(chuàng)新中心建設人工智能:國家戰(zhàn)略(2017年政府工作報告)人工智能(ArtificialIntelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學。它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能是對人的意識、思維的信息過程的模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能。什么是人工智能?人工智能有那些類型?弱人工智能,包含基礎的、特定場景下角色型的任務,如Siri等聊天機器人和AlphaGo等下棋機器人;通用人工智能,包含人類水平的任務,涉及機器的持續(xù)學習;強人工智能,指比人類更聰明的機器;195619741980198719932006AI的誕生1956達特矛斯會議,“人工智能”正式誕生孕育期電子計算機機器翻譯與NLP圖靈測試計算機下棋早期神經網(wǎng)絡搜索式推理聊天機器人樂觀思潮所有的AI程序都只是“玩具”運算能力計算復雜性常識與推理專家系統(tǒng)知識工程五代機神經網(wǎng)絡重生未達預期削減投入摩爾定律統(tǒng)計機器學習AI廣泛應用大數(shù)據(jù)計算能力應用增多深度學習人工智能2016人工智能發(fā)展歷程手機中的AI人工智能相關技術剛剛越過曲線高峰(處于狂熱期),是推動透明化身臨其境體驗技術發(fā)展的主要動力涉及透明化身臨其境體驗的人本技術(如智能工作空間、互聯(lián)家庭、增強現(xiàn)實、虛擬現(xiàn)實、腦機接口)是拉動另外兩大趨勢的前沿技術數(shù)字平臺在曲線上處于快速上升期,其中的量子計算和區(qū)塊鏈將在今后5—10年帶來變革性的影響AI處于什么階段?AIRoadmap國人為什么要關注AI?為什么人類能成為地球的主宰?基因:人和大猩猩的基因,有98.4%都是完全一樣的,只有1.6%有區(qū)別“符號語言”(口頭語言和書面文字):傳遞、保存、共享知識“集體知識”:人類的大腦可以相互共享信息,交換知識人類個體比其他動物沒有多大優(yōu)勢,掌握了符號語言,人類社會的結構發(fā)生了突變,有了一個連接在一起的集體大腦。這種物種之間相互關聯(lián)、相互作用的方式,才是我們和其他物種的真正區(qū)別腦容量:歷史上的“尼安德特人”和我們的祖先腦容量是一樣的。但后來尼安德特人就沒留下來,只有我們這一支留下來了《時間地圖:大歷史導論》知識和創(chuàng)新是推動人類發(fā)展的動力AI學科結構AI的幾大門派符號學派聯(lián)結學派行為學派神經網(wǎng)絡知識表示機器人模擬人的心智模擬腦的結構模擬人的行為聰明的AI有學識的AI深度學習知識圖譜感知識別判斷思考語言推理貝葉斯學派進化學派類推學派人工智能產業(yè)生態(tài)的三層基本架構基礎資源層:主要是計算平臺和數(shù)據(jù)中心,屬于計算智能;技術層:通過機器學習建模,開發(fā)面向不同領域的算法和技術,包含感知智能和認知智能;應用層:主要實現(xiàn)人工智能在不同場景下的應用?;A資源支撐AI生態(tài)逐步形成:基礎資源+技術+應用人工智能系統(tǒng)的技術架構智能終端智能云平臺人工智能的新革命第一節(jié)人工智能簡述深度學習算法知識圖譜精品ppt17推理期知識期機器學習期人工智能的三個研究階段1950s1970s1980s基于符號知識表示通過演繹推理技術基于符號知識表示通過獲取和利用領域知識建立專家系統(tǒng)神經網(wǎng)絡第二個高潮NP(non-deterministicpolynomial-time)難題中獲重大進展助力大量現(xiàn)實問題神經網(wǎng)絡第一個高潮期神經網(wǎng)絡以深度學習之名再次崛起大幅提升感知智能準確率201790s中期統(tǒng)計學習登場并占據(jù)主流,支持向量機、核方法為代表性技術提出支持向量、VC維等概念統(tǒng)計學的研究成果經由機器學習研究,形成有效的學習算法聯(lián)結學派對大腦進行逆向分析靈感來自于神經科學和物理學產生的是“黑箱”模型神經網(wǎng)絡可歸置此類符號學派將學習看作逆向演繹并從哲學、心理學、邏輯學中尋求洞見代表包括決策樹和基于邏輯的學習機器學習&深度學習從以“推理”為重點到以“知識”為重點,再到以“學習”為重點機器可以自動“學習”的算法,即從數(shù)據(jù)中自動分析獲得規(guī)律,并利用規(guī)律對未知數(shù)據(jù)進行預測的算法。目前,機器學習=“分類”人工智能>機器學習>深度學習深度學習是使用包含復雜結構或由多重非線性變換構成的多個處理層對數(shù)據(jù)進行高層抽象的算法深度學習是一種基于對數(shù)據(jù)進行表征學習的方法。觀測值(例如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區(qū)域等。而使用某些特定的表示方法更容易從實例中學習任務(例如,人臉識別或面部表情識別)。深度學習的好處是用非監(jiān)督式或半監(jiān)督式的特征學習和分層特征提取高效算法來替代手工獲取特征用數(shù)據(jù)優(yōu)化計算機程序的模型參數(shù)通過經驗自動改進的計算機算法深度學習算法簡介:機器學習機器學習的基本定理模型的出錯率∝推論:模型復雜-》大樣本
樣本小-》簡化模型
Classlabel(Classification)Vector(Estimation)機器學習實施過程特征提取特征1樣本數(shù)據(jù)樣本數(shù)據(jù)樣本數(shù)據(jù)…n預處理特征樣本集原始樣本集機器學習算法訓練預測輸出驗證集評價目標特征1…n目標特征1…n目標特征1…n訓練集目標特征1…n目標特征1…n目標特征1…n驗證集目標特征1…n目標特征1…n目標預測目標預測目標預測目標改進特征提取特征提取特征1樣本數(shù)據(jù)樣本數(shù)據(jù)樣本數(shù)據(jù)…n特征樣本集原始樣本集目標特征1…n目標特征1…n目標統(tǒng)計分析變換特征運算特征選取是成敗的關鍵人腦是通過分級的、多層網(wǎng)絡模型來識別減少數(shù)據(jù)量,保留物體的有用信息低層信息預處理特征提取識別分類對效果影響極大手動化特征工程非常耗時圖像識別的一般流程人腦識別圖像的過程第一個模型是一個線性模型,低度擬合,不能很好地適應訓練集;第三個模型是一個四次方的模型,過度擬合,雖然能非常好地適應我們的訓練集,但在新輸入變量進行預測時可能會效果不好;中間的模型似乎最合適經過算法預測的結果是一個連續(xù)的值,我們稱這樣的問題為回歸問題。算法能夠學會如何將數(shù)據(jù)分類到不同的類里,我們稱這樣的問題為分類問題。深度學習算法簡介:數(shù)學基礎當感知器用于兩類模式的分類時,相當于在高維樣本空間中,用一個超平面將兩類樣本分開神經網(wǎng)絡的學習過程就是神經網(wǎng)絡參數(shù)的設定過程一個神經元網(wǎng)絡結構確定之后,需要對一系列參數(shù)(權重、閾值等)進行有效的設定。這個過程叫做學習或訓練過程,此時的方法叫學習算法是一個由線性閾值元件組成的單層(或多層)神經元的神經網(wǎng)絡當輸入的加權和大于或等于閾值時,輸出為1,否則為0模型假定神經元中間的耦合程度(即加權系數(shù)W)可變,這樣,該模型可以學習深度學習算法簡介:感知器監(jiān)督學習通過已有的訓練樣本(即已知數(shù)據(jù)以及其對應的輸出)訓練得到一個最優(yōu)模型(這個模型屬于某個函數(shù)的集合,最優(yōu)則表示在某個評價準則下是最佳的),再利用這個模型將所有的輸入映射為相應的輸出,對輸出進行簡單的判斷從而實現(xiàn)分類的目的,從而也就具有了對未知數(shù)據(jù)進行分類的能力各種神經網(wǎng)絡類型LogisticRBMAutoEncoderSparseCodingConvolutional(卷積)強化學習類似人類與環(huán)境交互的方式,智能系統(tǒng)從環(huán)境到行為映射的學習,以使獎勵信號函數(shù)值最大。環(huán)境對產生動作的好壞通過獎勵信號作評價,而不是告訴強化學習系統(tǒng)如何去產生正確的動作。強化學習不能立即得到標記,而只能得到一個反饋,因此可以說強化學習是一種具有“延遲標記信息”的監(jiān)督學習典型案例:AlphaGo深度學習的訓練方法2006年,GeoffreyHinton在《科學》上發(fā)表論文提出深度學習主要觀點:多隱層的人工神經網(wǎng)絡具有優(yōu)異的特征學習能力,學習得到的特征對數(shù)據(jù)有更本質的刻畫,從而有利于可視化或分類深度神經網(wǎng)絡在訓練上的難度,可以通過“逐層初始化”(layer-wisepre-training)來有效克服,逐層初始化可通過無監(jiān)督學習實現(xiàn)的在著名的ImageNet問題上將錯誤率從26%降低到了15%,并且輸入沒有用到其他任何人工特征,僅僅是圖像的像素遷移學習將從擁有大數(shù)據(jù)的源領域上學習到的東西應用到僅有小數(shù)據(jù)的目標領域上去,實現(xiàn)個性化遷移,即舉一反三、觸類旁通。典型案例:斯坦福學者使用衛(wèi)星圖像獲取的燈光信息來分析非洲大陸的貧窮情況深度學習的神經網(wǎng)絡訓練方法LeNet-5:卷積神經網(wǎng)絡手寫數(shù)字識別的應用卷積過程包括:用一個可訓練的濾波器fx去卷積一個輸入的圖像,然后加一個偏置bx,得到卷積層Cx。子采樣過程包括:每鄰域四個像素求和變?yōu)橐粋€像素,加權再增加偏置,通過一個激活函數(shù),產生一個縮小四倍的特征映射圖C1層:輸入圖片大小: 32*32卷積窗大小: 5*5卷積窗種類: 6輸出特征圖數(shù)量:6輸出特征圖大?。?8*28 (32-5+1)神經元數(shù)量: 4707[(28*28)*6)]連接數(shù): 12304[(5*5+1)*6]*(28*28)可訓練參數(shù): 156[(5*5+1)*6]精品ppt27局部感受-卷積FeatureMap池化原理:根據(jù)圖像局部相關的原理,圖像某個鄰域內只需要一個像素點就能表達整個區(qū)域的信息常見的方法:最大值池化(max-pooling)L2池化(L2pooling)均值池化(MeanPooling)LeNet-5YannLecun,1989年用美國郵政系統(tǒng)提供的近萬個手寫數(shù)字的樣本來訓練神經網(wǎng)絡系統(tǒng),在獨立的測試樣本中,錯誤率只有5%進一步運用CNN,開發(fā)出LeNet-5用于讀取銀行支票上的手寫數(shù)字,這個支票識別系統(tǒng)在九十年代末占據(jù)了美國接近20%的市場深度學習的訓練方法HintoninImageNet比賽140萬圖像,
1000類圖庫1000萬圖像20000類7層CNN準確率74%->85%深度學習的成功應用AlphaGo戰(zhàn)勝李世乭圖像識別全面超越人類語音識別接近人類將聲學模型中混合高斯模型替換為DNN模型獲得30%+相對提升TeslaAutopilot投入商用GoogleTranslate投入商用它把原文例如中文詞先翻成一個詞向量,變成一個數(shù)字向量。它對這個詞向量再編輯,變成一個語義表示的方式。再把它翻譯成它的目標語言,例如英文。人工智能的新革命第一節(jié)人工智能簡述深度學習算法知識圖譜精品ppt33知識圖譜(KnowledgeGraph)知識圖譜旨在描述真實世界中存在的各種實體或概念及其關系,一般用三元組表示知識圖譜亦可被看作是一張巨大的圖,節(jié)點表示實體或概念,邊則由屬性或關系構成中國國家美國日本英國北京9,634,057平方公里13.5404億2069.3萬北緯38°56'東經116°20'3.1525億華盛頓9,629,091平方公里北緯38°53′西經77°02'178平方公里16410平方公里1.26億377835平方公里東京2188平方公里東經140°50'北緯35°44'……面積人口首都緯度經度面積人口知識圖譜構建Web字典,術語表,百科,書本知識獲取++已有知識庫知識融合知識驗證知識圖譜名稱規(guī)模Yago1千萬實體,35萬類別,1.8億事實,100種屬性,100語言Dbpedia4千萬實體,250類別,5億事實,6000種屬性,F(xiàn)reebase2千5百萬實體,2000主題,1億事實,4000種屬性谷歌知識圖譜5億實體名字,35億條事實NELL3百萬實體名字,300類別500屬性,100萬事實1千5百萬學習規(guī)則基于人工規(guī)則的語義理解神話是孫楠和誰合唱的?文法解析知識庫查詢SPARQL查詢語句生成答案生成孫楠和韓紅合唱了神話韓紅歌手6萬歌曲260萬專輯44萬標簽2000類param:singer孫楠#param:song神話#predicate:chorusWith神話是孫楠和誰合唱的查詢神話這首歌曲的演唱者,演唱者要包括孫楠,輸出還包括的另外一個演唱者文法規(guī)則模板歌手6萬歌曲260萬專輯44萬標簽2000類互聯(lián)網(wǎng)各種音樂相關信息下載融合知識圖譜的成功應用:現(xiàn)代搜索引擎半結構化信息抽取半結構化數(shù)據(jù)結構化數(shù)據(jù)文本數(shù)據(jù)實體對齊推理補充數(shù)據(jù)異構數(shù)據(jù)整合重要度計算實體抽取屬性抽取屬性值決策關系建立知立方數(shù)據(jù)本體生成系統(tǒng)索引生成檢索系統(tǒng)實體識別本體庫Pattern挖掘標簽消岐SPARQL查詢語句排序推理推薦統(tǒng)計Query展現(xiàn)檢索系統(tǒng)索引生成面向知識圖譜的Sogou搜索技術Gene
OntologyLOD
企業(yè)對知識圖譜根據(jù)內部數(shù)據(jù)有大量的業(yè)務需求從兩方面來建設知識圖譜體系:
知識實體,算法企業(yè)知識圖譜的建立語義理解智能檢索與問答數(shù)據(jù)關聯(lián)探索業(yè)務動態(tài)擴展非結構化數(shù)據(jù)計算機難以理解數(shù)據(jù)使用專業(yè)程度過高多元異構數(shù)據(jù)難以融合數(shù)據(jù)模式動態(tài)變遷困難結構化數(shù)據(jù)數(shù)據(jù)融合自由擴展數(shù)據(jù)模式行業(yè)智能問答業(yè)務需求技術方案數(shù)據(jù)挑戰(zhàn)知識圖譜助力企業(yè)商業(yè)智能通用知識圖譜+行業(yè)知識圖譜通用知識圖譜的廣度,行業(yè)知識圖譜的深度,相互補充,形成更加完善的知識圖譜
通用知識圖譜中的知識,可以作為行業(yè)知識圖譜構建的基礎;而構建的行業(yè)知識圖譜,再融合到通用知識圖譜中
通用知識圖譜行業(yè)知識圖譜通用知識圖譜創(chuàng)投專利深度學習與智能圍棋第二節(jié)從AlphaGoLee/Master講起蒙特卡洛樹式搜索AlphaGo的實現(xiàn)原理AlphaGoZero精品ppt4201人機大戰(zhàn):深度學習算法的標志性成果最復雜(注:狀態(tài)復雜度與博弈復雜度)的智力游戲:看似簡單,實為復雜,具有10的170次方狀態(tài)復雜空間涉及邏輯推理,形象思維,優(yōu)化選擇等多種人類智能(注:國際象棋只有邏輯推理,沒有形象思維)02接近人類公認是人工智能領域長期以來的重大挑戰(zhàn)03標志性國際學術界曾經普遍認為解決圍棋問題需要15-20年時間04挑戰(zhàn)為什么做圍棋AI?創(chuàng)新性投入力度業(yè)內龍頭
目前技術優(yōu)勢:起步早,算法新,技術強,資源雄厚最近一年專注于強化學習研究
擬于近期公布新論文和數(shù)據(jù),并從此退出圍棋AI領域GoogleDeepmind簡介精品ppt45深度學習與智能圍棋第二節(jié)從AlphaGo
Lee/Master講起蒙特卡洛樹式搜索AlphaGo的實現(xiàn)原理AlphaGoZero精品ppt46傳統(tǒng)圍棋AI算法—MCTS
(蒙特卡洛樹搜索)雙人一人一步雙方信息完備(棋類—完全信息,牌類—不完全信息)零和動態(tài)博弈問題計算機下棋棋類要素的數(shù)字化——恰當?shù)臄?shù)據(jù)結構棋盤、棋子、棋規(guī)(著法規(guī)則,勝負規(guī)則)用著法推演局面——博弈樹展開從有利局面選擇當前著法——博弈搜索局面評估——指標定義與綜合展開深度為4的博弈樹本方本方本方對方對方Ply1Ply3Ply4Ply2Ply0根節(jié)點為當前局面葉節(jié)點為展開終點雙方輪流出手偶數(shù)層為本方奇數(shù)層為對方圍棋落子蒙特卡洛數(shù)學模型及評估圍棋對弈過程可以看做一個馬爾科夫過程:五元組:{T,S,A(i),P(·|i,a),r(i,a)}T:決策時刻S:狀態(tài)空間,S={i}A(i):可行動集合(可落子點)P(·|i,a):狀態(tài)i下選擇行動a的概率r(i,a):狀態(tài)i下選擇行動a后課獲得的收益從當前局面的所有可落子點中隨機(或者給勝率高的點分配更多的計算力)選擇一個點落子重復以上過程直到勝負可判斷為止經多次模擬后(計算越多越精確),選擇勝率最大的點落子傳統(tǒng)圍棋AI算法—數(shù)學模型MCTS
(蒙特卡洛樹搜索)基本思想與特點:-將可能出現(xiàn)的狀態(tài)轉移過程用狀態(tài)樹表示-從初始狀態(tài)開始重復抽樣,逐步擴展樹中的節(jié)點-某個狀態(tài)再次被訪問時,可以利用已有的結果,提高了效率-在抽樣過程中可以隨時得到行為的評價選擇-從根節(jié)點出發(fā)自上而下地選擇一個落子點擴展-向選定的點添加一個或多個子節(jié)點模擬-對擴展出的節(jié)點用蒙特卡洛方法進行模擬回溯-根據(jù)模擬結果依次向上更新祖先節(jié)點估計值深度學習與智能圍棋第二節(jié)從AlphaGoLee/Master講起蒙特卡洛樹式搜索AlphaGo的實現(xiàn)原理AlphaGoZero精品ppt5113個卷積層,每層192個卷積核,每個卷積核3*3,參數(shù)個數(shù)800萬+GPU3ms/步預測準確率57%PolicyNetwork(策略網(wǎng)絡)在每個分支節(jié)點直接判斷形勢與Rollout隨機模擬相結合,互為補充ValueNetwork(價值網(wǎng)絡)給勝率高的點分配更多的計算力任意時間算法,計算越多越精確1、選取2、展開3、評估4、倒傳MCTS(蒙特卡洛樹搜索)通過隨機模擬走子勝率來判定形勢速度很快(1ms/盤)隨機性與合理性的平衡Rollout(隨機模擬走子)AlphaGo的實現(xiàn)原理控制寬度(250)控制深度(150)基本算法快速模擬圍棋是完全信息博弈,從理論上來說可以通過暴力搜索所有可能的對弈過程來確定最優(yōu)的走法PolicyNetwork策略網(wǎng)絡:落子棋感深度神經網(wǎng)絡的有監(jiān)督學習,目標是獲得在圍棋盤面下的落子棋感學習職業(yè)棋手和業(yè)余高段棋手的棋譜(數(shù)十萬份棋譜,上億數(shù)量級的落子方式)把當前局面作為輸入,預測下一步的走棋。它的預測不只給出最強的一手,而是對棋盤上所有可能的下一著給一個分數(shù)用PolicyNetwork作為第一感,將計算力分配到最有希望的選點分枝數(shù)從上百個減少到幾個優(yōu)先計算PolicyNetwork分數(shù)高的點,計算力充沛時,適當分配到其他分值較低的點PolicyNetwork—輸入特征3×224248×552128×272192×132192×132128×1322048204820482048192×32192×32128×3248×523×112192×32192×32192×132192×132128×132128×27248×5248×552128×321000局部感知域權重共享特征訓練卷積層+池化層模型結構13個卷積層,每層192個3*3卷積核數(shù)百萬個參數(shù)訓練數(shù)據(jù)KGS6d以上對局,17萬,職業(yè)對局8萬。訓練數(shù)據(jù)量5000萬+訓練時間幾十天運算速度GPU,3ms預測準確率57%左右互博,自我進化Agent通過和環(huán)境s的交互,選擇下一步的動作a,這個動作會影響環(huán)境s,給Agent一個reward,Agent然后繼續(xù)和環(huán)境交互。根據(jù)游戲結果迭代更新轉移概率和評估函數(shù)神經網(wǎng)絡結構與策略網(wǎng)絡相同訓練方法:自我對局目標:校正價值導向將策略網(wǎng)絡權值作為初始值,自我對弈更新權值,從而提升棋力Pros:棋藝更高(win80%ofthegameswithSLpolicynetwork)Cons:走法集中,不適應MCTS多搜索范圍的需求強化學習(RL)Fast-Rollout快速走子Rollout(隨機模擬走子)通過隨機模擬走子勝率來判定形勢速度快隨機性,合理性的平衡原因:1.策略網(wǎng)絡的運行速度較慢(3ms)
快速走子在2us
2.用來評估盤面。在同等時間下,模擬走子速度快乃至使用隨機走子,雖然單次估值精度低,但可以多模擬幾次算平均值,效果未必不好。提升棋力結構:局部特征匹配+線性回歸特征:圍棋專業(yè)知識ValueNetwork:勝負棋感深度神經網(wǎng)絡的增強型學習(DeepMind獨創(chuàng))通過自我博弈,學習不同盤面下的勝負情況(三千萬盤自我對局)獲取在圍棋盤面的勝負棋感(注:對每一個落子點給一個當時的快速的勝負感(估算),這個勝負估算并不是根據(jù)分析計算出來的,而是直覺)(通過AlphaGo幾千萬盤的訓練學習得來的)形勢判斷:-1:白棋必勝<0:白棋優(yōu)勢0:雙方均勢>0:黑棋優(yōu)勢1:黑棋必勝ValueNetwork模型模型結構13個卷積層,每層192個卷積核,每個卷積核3*3數(shù)百萬個參數(shù)訓練數(shù)據(jù)PolicyNetwork自我對弈棋譜。3000萬+特定盤面+勝負結果訓練時間幾十天運算速度GPU,3ms方法:在每個分支節(jié)點,使用ValueNetwork直接判斷形勢與Rollout隨機模擬相結合,互為補充效果:職業(yè)水平,AlphaGoMCTS在對局中實時搜索Step1:基于策略網(wǎng)絡落子,可能性大的落子拓展節(jié)點Step2:對未來走勢進行評估,同時使用估值網(wǎng)絡和快速走子,綜合兩者預測未來走法Step3:評估結果作為下一步走法的Q值。重新模擬。Step4:結合下一步走法的Q值和策略網(wǎng)絡進行再一次模擬。如果出現(xiàn)同樣走法,Q值起平均。新分數(shù)=調整后的初始分+0.5*通過模擬(策略網(wǎng)絡+快速走棋)得到的贏棋概率+0.5*估值網(wǎng)絡的局面評估分Step5:反復循環(huán)直到n次,或者timeout,選擇被選擇次數(shù)最多的走法作為下一步Put-Together精品ppt59深度學習與智能圍棋第二節(jié)從AlphaGoLee/Master講起蒙特卡洛樹式搜索AlphaGo的實現(xiàn)原理AlphaGoZero精品ppt60AlphaGoZero第3天,下了490萬局棋,打敗老大老三戰(zhàn)績老三學棋過程剛開始,隨機下子熱衷于吃子,完全不顧死活發(fā)現(xiàn)了如果先占住棋盤的邊和角,后面占便宜學會了如何「打劫」、「征子」懂得看「棋形」第21天,敗了老二第40天,完整走過了一個人類棋手學棋的全過程棋盤/黑子/白子棋子被圍起來就死規(guī)則棋士柯潔10月19日02:22一個純凈、純粹自我學習的AlphaGo是最強的...對于AlphaGo的自我進步來講...人類太多余了老大AlphaGoLee,2016年3月4:1打敗韓國棋手李世石老二AlphaGoMaster,2017年5月3:0打敗中國棋手柯潔老三AlphaGoZero,2017年10月宣布自學圍棋40天,打敗所有人AlphaGoZero解析人類經驗由于樣本空間大小的限制,往往都收斂于局部最優(yōu)而不自知(或無法發(fā)現(xiàn)),阿法元不再被人類認知所局限,而能夠發(fā)現(xiàn)新知識,發(fā)展新策略區(qū)別1:特征提取層采用40個殘差模塊,每個模塊包含2個卷積層。運用殘差模塊提升了網(wǎng)絡深度,更深的網(wǎng)絡能更有效地直接從棋盤上提取特征區(qū)別2:同時訓練走子策略(policy)網(wǎng)絡和勝率值(value)網(wǎng)絡啟示深度學習訓練過程需要消耗大量人類標注樣本,而這對于小樣本應用領域(比如醫(yī)療圖像處理)是不可能辦到的。所以減少樣本和人類標注的方法非常重要開局和收官和專業(yè)棋手的下法并無區(qū)別,但是中盤難于理解;機器經驗與人類經驗有很大差別,我們又該如何去選擇和利用呢?精品ppt62智能圍棋與蒙特卡洛樹搜索沒有棋感直覺不行,完全依賴棋感直覺也不行直覺需要通過嚴格的數(shù)學模型和計算方法,對棋感直覺進行驗證AlphaGo使用蒙特卡洛樹搜索,對落子棋感和勝負感進行計算驗證。蒙特卡洛樹搜索:搜索驗證基于數(shù)學期望的勝負評估模型(勝率)基于蒙特卡洛模擬進行勝負結果采樣(模擬采樣比直覺更可靠)根據(jù)模擬采樣結果驗證盤面勝負的數(shù)學期望可靠程度與采樣規(guī)模相關(采樣越大,離真理會更近些)蒙特卡洛模擬采樣:勝負棋感驗證智能圍棋與神經網(wǎng)絡谷歌的AlphaGo是深度學習算法的標志性成果;深度卷積神經網(wǎng)絡(DeepConvolutionalNeuralNetwork,DCNN),是近年發(fā)展起來,并引起廣泛重視的一種高效識別方法。圍棋算法具有高度的復雜性和代表性(10808,兩個30年)。由于天文數(shù)字的狀態(tài)空間和搜索空間,蠻力計算無法解決圍棋問題(注:解決國際象棋的IBM深藍是用蠻力方法,就是靠計算,這種方法在圍棋這么大的計算與搜索空間是無法進行的)從圍棋算法可以推廣到深度學習應用的一般情形。圍棋職業(yè)棋手的解決方法:棋感直覺+搜索驗證AlphaGo的核心方法完全類似于完全職業(yè)棋手的解決方法AlphaGo的優(yōu)勢:完全以勝率為目標,不受任何其它因素影響直覺:不經過思考過程,很快就能出現(xiàn)的直接想法、感覺、信念或者偏好(這個非常重要,其強大的力量。如:落子的直覺,勝負的直覺、棋盤的直覺、棋形的直覺)通過深度神經網(wǎng)絡和大數(shù)據(jù)的訓練而獲得人工智能的核心方法:直覺獲取驗證:為直覺建立真實性、準確性和可靠性的檢驗過程驗證是核實直覺不存在偏差的一個充分條件由于廉價并行計算和大數(shù)據(jù)的支持,直覺可以通過搜索計算來驗證人工智能的核心方法:搜索驗證人類生活面臨一系列的抉擇問題(注:有了直覺和驗證就可以找一個最好的)A.手里的股票是持有還是拋售B.駕駛員到交通燈前是左拐還是右拐直覺獲取和搜索驗證的結合使用,可以提供優(yōu)化選擇人工智能的核心方法:優(yōu)化選擇精品ppt65人工智能3.0第三節(jié)AI技術的新特征AI走向3.0認知計算AI3.0面對的挑戰(zhàn)精品ppt66Q1:什么領域AI能夠超過人?(完全信息博弈)充分的數(shù)據(jù):需要有超級大的數(shù)據(jù)量,它不能舉一反三,它要舉多反三(完全信息博弈)信息具有確定性:數(shù)據(jù)是要有標注的,不是到網(wǎng)上弄一堆數(shù)據(jù)(完全信息博弈)完全信息:應用一定是單一領域,這個領域越垂直、越細越好。一個人工智能客服的應用不可以用來做導游,應用單一、一定要非常清晰不跨領域有懂行的專家去選擇有效的神經網(wǎng)絡模型,調整各種網(wǎng)絡參數(shù)需要超大計算量,機器容易甩開人類一只烏鴉的啟示圖b:找到了堅果,砸不開。它就發(fā)現(xiàn)一個訣竅,把果子放到路上讓車軋過去圖c:靠近紅綠路燈的路口,車子和人有時候停下了。圖d:選擇了一根正好在斑馬線上方的一根電線蹲下來圖e:把堅果拋到斑馬線上,等車子軋過去,然后等到行人燈亮了日本新喀烏鴉一個完全自主的智能。感知、認知、推理、學習、和執(zhí)行。遠遠超過任何機器人,烏鴉向我們證明了,這個解存在。無大數(shù)據(jù)學習,無人工標注好的訓練數(shù)據(jù),沒人教它烏鴉頭不到人腦的1%大小。人腦功耗大約是10-25瓦,它就只有0.1-0.2瓦啟示Q2:AI+還是+AI?在AI技術成熟之前,這個行業(yè)、產品從未存在過。比如自動駕駛,亞馬遜的Echo智能音箱、蘋果的Siri語音助手。在人工智能技術未突破前,不存在這樣的產品。因為AI,創(chuàng)造出了一條全新的產業(yè)鏈。AI+行業(yè):從0到1行業(yè)本身一直存在,產業(yè)鏈條成熟;以前完全靠人工,效率比較低,現(xiàn)在加入AI元素后,使得行業(yè)效率有了明顯提高。比如安防、醫(yī)療等領域。行業(yè)數(shù)據(jù)控制比AI技術更重要,例如醫(yī)療+AI,最重要的是大量準確的被醫(yī)生標注過的數(shù)據(jù)。在國內,醫(yī)療數(shù)據(jù)拿出來非常困難。行業(yè)+AI:從1到nAI應用需要積累足夠的數(shù)據(jù)和經過充分的學習才兩個起作用當一個AI應用找到第一批用戶時,他們使用的行為和記錄被后臺記錄下來;開發(fā)者再對這種行為和記錄進行迭代的改進,當再把該應用投向第二批用戶的時候,其行為已經比第一代提升了漣漪效應應用場景相對閉可控數(shù)據(jù)比較便宜,且容易獲取犯錯誤的影響不太大的場景輔助人類完成重復性的具體工作,真正能夠提高社會生產力容錯生產力成熟封閉可控數(shù)據(jù)相關技術成熟,具備可實現(xiàn)的切入點Q3:什么AI項目容易成功?新特征1:深度學習+自我博弈進化技術精品ppt與傳統(tǒng)博弈人工知識不同,AlphaGo深度強化學習初步具備了“直覺感知(下一步在哪)”,“棋局推理(全局獲勝機會如何)”,和“新穎落子(想人所不敢想)”等能力。將記憶人類棋局和自我博弈積累棋局結合起來。DeepMind算法減少了40%用于冷卻的電量,即整體用電量效率提升15%2010年全球數(shù)據(jù)中心電力消耗為2355億度,約占全球電力消耗1.3%(美2%,中1.8%)。谷歌公司電力消耗低于全球數(shù)據(jù)中心的1%DeepMind已為谷歌掙錢DeepMind的軟件控制著數(shù)據(jù)中心的風扇、制冷系統(tǒng)和窗戶等120個變量,使谷歌的用電效率提升了15%,幾年內共為谷歌節(jié)約電費數(shù)億美元。據(jù)ICTResearch統(tǒng)計:2015年我國數(shù)據(jù)中心能耗高達1000億度,相當于整個三峽水電站一年發(fā)電量。精品ppt《Science》2016年1月1日發(fā)表“群智之力量(ThePowerofCrowds,Vol.351,issues6268)”的論文認為:結合群體智慧與機器性能來解決快速增長難題。
其將群智計算按難易程度分為三種類型:實現(xiàn)任務分配的
眾包模式(Crowdsourcing)、較復雜支持工作流模式的群(Complexworkflows)以及最復雜的協(xié)同求解問題的生態(tài)系統(tǒng)模式(Problemsolvingecosystem).新特征2:基于網(wǎng)絡的群體智能已經萌芽精品ppt大規(guī)模個體通過互聯(lián)網(wǎng)構架的參與,可以表現(xiàn)出超乎尋常的智慧能力,是解決開放復雜問題的新途徑
美國普林斯頓大學Connetome項目開發(fā)了EyeWire游戲,玩家對顯微圖像中單個細胞及其神經元連接按功能進行涂色。第一次提供了哺乳動物視網(wǎng)膜的神經元結構和組織如何產生檢測運動的功能。145個國家的165000多名科學家(玩家)參與成功的還有:蘋果AppStore(130萬個應用程序)、Wiki百科(4000萬詞條)等等美國普林斯頓大學Connetome項目通過群體參與來探討大腦結構和功能之間映射的神經通路/(繼續(xù))精品ppt
各種穿戴設備、人—車共駕、腦控或肌控外骨骼機器人、人機協(xié)同手術等實現(xiàn)生物智能系統(tǒng)與機器智能系統(tǒng)的緊密耦合。新特征3:人機一體化技術導向混合智能精品ppt自然語言處理視覺計算聽覺感知
精靈寶可夢GO:AR:圖形+視頻谷歌:VR繪畫應用TiltBrushFacebook:視頻描述生成
架構跨媒體間橋梁新特征4:跨媒體推理已經興起在語言、視覺、圖形和聽覺之間語義貫通,是實現(xiàn)聯(lián)想、推理、概括等智能的重要關鍵精品ppt新特征5:無人系統(tǒng)迅速發(fā)展機械手在工業(yè)裝配線上發(fā)展迅速在靈活運動的領域中,無人系統(tǒng)迅猛發(fā)展的速度遠快于機器人因為人類或類動物的機器人,往往不如對機械進行智能化和自主化升級來得高效精品ppt人工智能3.0第三節(jié)AI技術的新特征AI走向3.0認知計算AI3.0面對的挑戰(zhàn)精品ppt78我們正在進入AI3.0時代人工智能基礎理論和基礎學科建立的階段,AI的具體學科,比如語音識別、機器翻譯、自然語言處理、視覺等被建立起來,并形成了人工智能從業(yè)的方法論及學派AI1.0時代:1945-2005年以2006年谷歌翻譯上線為標志的AI2.0時代,人工智能的發(fā)展從學術界到谷歌這樣的公司主導,從以前的軍用到民用,產品從ToB到大規(guī)模的ToC的過程人工智能技術被廣泛用于各類智能產品之中算法(深度學習)+數(shù)據(jù)(大數(shù)據(jù))+基礎設施(計算能力)AI2.0時代:2006-2016年從軟件到AI芯片,走向軟硬結合從信息到服務嶄新的、群雄逐鹿、百花齊放的時代AI3.0時代:2017-20xx年淺層次動因:需求、環(huán)境和技術社會新需求爆發(fā):智能城市、智能醫(yī)療、智能交通、智能游戲、無人駕駛、智能制造等等AI的基礎和目標巨變:大數(shù)據(jù)、多媒體、傳感器網(wǎng)、增強實現(xiàn)(AR)、虛擬實現(xiàn)(VR)等等計算機模擬人的智能人機智能群體智能信息環(huán)境巨變:互聯(lián)網(wǎng)、移動計算、超級計算、穿戴設備、物聯(lián)網(wǎng)、云計算、網(wǎng)上社區(qū)、萬維網(wǎng)、搜索引擎等等人工智能邁向新一代AI走向3.0的原因分析精品pptPHCPH深層次分析:世界正從原來的二元空間進入新的三元空間世界原來是二元空間:人類社會空間(H)和物理空間(P)。但近年來,信息力量的迅速壯大,已長成除P、H兩極之外的新一極:信息空間(C)。精品ppt信息來自于人類社會:書籍、交流、媒體、計算機信息開始互聯(lián):互聯(lián)網(wǎng)、移動通訊和搜索信息繞過人類,直接來自于物理世界:傳感器和物聯(lián)網(wǎng)產生大數(shù)據(jù):信息快速膨脹,人類已無法單獨處理從大數(shù)據(jù)必然會走向大知識,并推動人類認識與控制能力的大變化近50年來,信息空間成長壯大的歷程從AI落后人類的原因看大知識(智能大數(shù)據(jù))面臨的挑戰(zhàn)強在記憶能力和計算能力,但是自我學習、舉一反三的能力還不如5歲孩子面對未知環(huán)境的變化,未知的任務,決策能力很弱AI智能學習與創(chuàng)新的能力:理解尤其是對整體環(huán)境的理解能力,可以通過經驗來學習新事物,獲得新知識,并具備觸類旁通的能力對于信息(不完全信息,模糊信息)的分析和決策能力人類智慧大知識需要結合大數(shù)據(jù)資源和AI的神經網(wǎng)絡、符號智能、知識挖掘、人機交互等技術結合起來,不僅解決可解釋性、通用性問題,而且形成新技術,實現(xiàn)新應用技術融合依靠大數(shù)據(jù)的深度學習和增強學習是AI當前最普遍成功的技術之一。但是,深度學習需要大量的標注數(shù)據(jù),又是黑箱算法,其結果難以解釋,而且只能專用,因為它和人類使用的知識形式差距太大AI技術現(xiàn)狀從PH到CPH的人類空間演變并未結束,而正在深化。AI走向3.0正是這種深化演變?yōu)榈囊粋€結果AI2.0互聯(lián)網(wǎng)多媒體、傳感器人機交互自主裝備大數(shù)據(jù)新一代人工智能自主智能系統(tǒng)群體智能智能大數(shù)據(jù)跨媒體智能人機混合增強智能AI走向3.0認知智能能理解會思考感知智能能聽會說、能看會認計算智能能存會算新一代AI的技術方向空間變化帶來了認知的新門類、新通道、新計算P物理空間C信息空間H人類社會自然科學工程技術多媒體與傳感信息大數(shù)據(jù)自主裝備大數(shù)據(jù)、互聯(lián)網(wǎng)社區(qū)VRAR人機交互學習、預測、創(chuàng)造社會科學新認知精品ppt新門類:認識復雜巨系統(tǒng):城市運行系統(tǒng)、環(huán)境生態(tài)系統(tǒng)、健康醫(yī)療系統(tǒng)(科學+工程+社會+影響)新通道:給自然科學、工程技術、社會科學提供了新途徑、新方法新計算:AI2.0:建立在新老空間的互動CH、CP之上的AI知識表達神經網(wǎng)絡也可以認為是一類新的知識表達,可標記為NN+W(權)
——W是數(shù)據(jù)表達的,可由學習自動生成
——NN是結構,由軟件或硬件生成AI使用的知識表達還有另兩類:符號型:可表達為概念、命題、推理(邏輯、歸納、聯(lián)想……)形象型:可表達為形象(圖形、動畫、圖像、視頻、聲音……)、結構、情景其中,形象型還可分為兩類:——圖形形象類:圖形、動畫……(人工表達)——圖像形象類:圖像、視頻、聲音……(傳感器表達)精品ppt知識表達面臨的挑戰(zhàn)上表中x處,就是大數(shù)據(jù)智能需對付的挑戰(zhàn)圖像形象類:機器不可理解——模式識別技術
?
機器不能推理——跨媒體技術
?NN+W:
人不可理解——跨知識表達
?
機器不可推理——跨知識推理
?圖形形象類的表達只用于圖形學,能與其他表達跨越使用嗎?知識能綜合上述技術而表達嗎?知識表達人可理解機器可理解機器推理符號√√√圖形形象類√√√圖像形象類√××NN+W×√×匯總四種表達的優(yōu)缺點如右大知識的關鍵:新知識生成問題求解的目標與模式識別的目標有較大差異。模式識別目標:分類(如對、錯)問題求解目標:方案(如規(guī)劃、處方、設計等)。往往還需說明方案如何解決問題。——因此,自動生成新知識是問題求解的關鍵。各種生成新知識的工具:傳統(tǒng)工具:邏輯推理、范例推理(CBR)新工具:自動博弈的(如AlphaGo)、知識圖譜推理(如股權發(fā)現(xiàn))、綜合推理、統(tǒng)計推理(IBMWatson)新進展:MITAILab:自主瀏覽網(wǎng)頁進行空白知識填補的能力;DeepMind:開發(fā)新AI技術利用外部記憶來解決需要邏輯推理才能完成的任務精品ppt人工智能3.0第三節(jié)AI技術的新特征AI走向3.0認知計算AI3.0面對的挑戰(zhàn)精品ppt88認知計算認知計算是指一種能夠規(guī)?;瘜W習、有目的推理、并與人類自然交互的系統(tǒng)。它們不需要事先精確地編程,而是從它們與我們之間的交互和與環(huán)境之間的互動中學習和推理認知系統(tǒng)是概率性的。認知系統(tǒng)不僅能回答大量的問題,還能對更加復雜(且有意義)的數(shù)據(jù)提出假說、推理論述和建議認知系統(tǒng)還能理解「非結構化」的數(shù)據(jù)(全世界數(shù)據(jù)的80%),這使得它們能夠跟上現(xiàn)代世界巨量、復雜和不可預測的信息認知計算的成功并不以圖靈測試或模擬人類的能力作為判斷標準。它的標準更加實際,例如投資報酬率、新的市場機會、治療疾病和拯救生命新的「人-機共生」的人機關系讓人與計算機能夠協(xié)作決策,控制復雜情況,綜合了機器的數(shù)據(jù)分析、統(tǒng)計推斷能力,以及人類特殊能力,比如自我引導的目標、常識和價值觀認知的定義認知(cognition)是人們推測和判斷客觀事物的心理過程,是在過去的經驗及有關線索進行分析的基礎上形成的對信息的理解、分類、歸納、演繹和計算認知活動包括思維、語言、定向和意識4部分認知反映個體的思維能力,是制定和執(zhí)行護理計劃的依據(jù)認知計算系統(tǒng)WatsonServicesAPICatalog語言類
Language語音類Speech視覺類Vision數(shù)據(jù)洞察類DataInsights2011年2月16日,第一個認識系統(tǒng)IBM計算機Watson在美國熱門的電視智力問答節(jié)目“危險邊緣”(Jeopardy!)中戰(zhàn)勝了兩位人類冠軍選手,最終勇奪冠軍寶座!Jeopardy!以其復雜、微妙的文字游戲而著稱,真實世界中所產生的各種問題都能在其中有所體現(xiàn)。這也是對于高級認知系統(tǒng)的一次公開實驗:這種系統(tǒng)不是簡單地程序化運行,而是能通過訓練進行自主學習理解、推理以及學習的能力知識圖譜+搜索
主搜索答案源假設與證據(jù)評分深度證據(jù)打分支
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程建設項目招標合同樣本
- 住宅室內設計施工合同
- 住宅建造合同模板
- 電梯設備安裝與定期檢修協(xié)議
- 上海市內銷商品房出售合同
- 2024年個人土地交易合同模板
- 2024意外傷害賠償協(xié)議書范例
- 影視廣告制作合同
- 合伙協(xié)議與法律規(guī)定沖突時的解決途徑
- 2024年技師合同書
- 無償劃轉國有股權及資產的可行性論證報告(附無償劃轉協(xié)議)
- 公務車司機年度工作總結 公務用車駕駛員個人總結
- 第二版《高中物理題型筆記》上冊
- 上海市大學生安全教育(2022級)學習通課后章節(jié)答案期末考試題庫2023年
- 蘇軾生平及創(chuàng)作整理
- 柴油發(fā)電機組應急預案
- 語文《猜猜他是誰》教案
- 繪本:讓誰先吃好呢
- 寬容待人正確交往中小學生教育主題班會
- 移動通信網(wǎng)絡運行維護管理規(guī)程
- 龍頭股戰(zhàn)法優(yōu)質獲獎課件
評論
0/150
提交評論