大數(shù)據(jù)與人工智能

上傳人：1*** IP屬地：廣西上傳時(shí)間：2023-12-14 格式：DOCX 頁(yè)數(shù)：11 大?。?97.43KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩6頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)與人工智能數(shù)據(jù)科學(xué)已經(jīng)在決策科學(xué)、社會(huì)科學(xué)、經(jīng)濟(jì)學(xué)里面扮演越來(lái)越重要的角色，所以這種交叉融合，這種碰撞對(duì)我們每一個(gè)人來(lái)講都是學(xué)習(xí)的時(shí)機(jī)，也是一些施展才華的空間。最近在各個(gè)場(chǎng)合有一些分享，今天我尤其要把這個(gè)講座做好。今天是我兒子第一次坐在下面聽(tīng)我的講座。過(guò)去我們做的這些工作是跟數(shù)據(jù)有關(guān)系的。一個(gè)大數(shù)據(jù)、一個(gè)人工智能，這兩個(gè)放在一起，今天很多的企業(yè)會(huì)這么重視，在這里給大家分享一下我們自己的故事。百度在過(guò)去兩年多的時(shí)間里面，在人工智能領(lǐng)域有很多技術(shù)方面的投入。今年李彥宏在兩會(huì)上提出中國(guó)大腦，很受關(guān)注；麻省理工學(xué)院科技評(píng)論雜志去年專門(mén)發(fā)表了一篇評(píng)論性文章，介紹百度的人工智能之夢(mèng)。在國(guó)外主流的科技雜志里面報(bào)道一個(gè)中國(guó)企業(yè)的科技研發(fā)，還是比擬少的。我自己感到非常的振奮。百度的背景，和很多的互聯(lián)網(wǎng)公司都是一樣的，從技術(shù)的緯度來(lái)講，他本質(zhì)上是一個(gè)基于大數(shù)據(jù)的人工智能公司。我們是提供一個(gè)搜索引擎，這個(gè)搜索引擎下面有一個(gè)非常精致的結(jié)構(gòu)，它可以搜索到各種信息、知識(shí)，而且效勞是完全免費(fèi)的、給用戶帶來(lái)價(jià)值的。但是我們獲得了了大量的搜索行為數(shù)據(jù)，并實(shí)現(xiàn)它的商業(yè)價(jià)值，就得通過(guò)廣告、推送效勞。從數(shù)據(jù)到價(jià)值，這中間就需要大量的技術(shù)，尤其是基于大數(shù)據(jù)的人工智能技術(shù)，包括機(jī)器學(xué)習(xí)，自然語(yǔ)言處理，語(yǔ)音識(shí)別，圖像識(shí)別。最近在全社會(huì)，無(wú)論是在中國(guó)還是美國(guó)，還是科技媒體，還是研究機(jī)構(gòu)，還是商業(yè)公司，都在談自動(dòng)駕駛、機(jī)器人、物聯(lián)網(wǎng)、個(gè)性化、VR、AR。其實(shí)這些都是AI的各個(gè)領(lǐng)域，現(xiàn)在AI已經(jīng)成為科技創(chuàng)新的主戰(zhàn)場(chǎng)，它不光是未來(lái)時(shí)，而且是現(xiàn)在進(jìn)行時(shí)。我們看電影《超能陸戰(zhàn)隊(duì)》，看似是未來(lái)的東西，但是今天很多領(lǐng)域正在發(fā)生，也在產(chǎn)生價(jià)值。到底什么是人工智能？嚴(yán)肅的科學(xué)定義到今天為止，沒(méi)有一個(gè)廣泛接受的定義。比方說(shuō)，有一種說(shuō)法叫強(qiáng)人工智能，有一種說(shuō)法叫弱人工智能，還有基于符號(hào)邏輯的、也有基于統(tǒng)計(jì)模型的，有不同的觀點(diǎn)。拋開(kāi)這些不同的觀點(diǎn)，通常一個(gè)人工智能系統(tǒng)有這樣幾個(gè)方面：第一，我們希望這個(gè)系統(tǒng)具有感知的能力，就像人一樣，有五官，可以感知周?chē)沫h(huán)境是什么樣的。第二，獲取這個(gè)感知以后，對(duì)面臨的環(huán)境有一個(gè)理解。比方說(shuō)對(duì)于一個(gè)機(jī)器人來(lái)講，他在感知到這個(gè)環(huán)境以后，如果想到后面去跟一個(gè)同學(xué)聊天，他需要尋找最正確路徑。他必須要理解，那條路是走不通的，那條是可以走的。第三，在理解的根底上做出決策，從而達(dá)成目的或完成任務(wù)一個(gè)機(jī)器要感知，然后理解，然后決策，這是一個(gè)過(guò)程。今天在市場(chǎng)上面無(wú)處不在充滿著智能產(chǎn)品：智能湯勺、智能水杯等等。我們把一個(gè)老式的收音機(jī)和智能設(shè)備放在一起比擬，他們有什么不同？區(qū)別一個(gè)系統(tǒng)、一個(gè)產(chǎn)品是不是真的具有智能的能力，有一個(gè)很重要的緯度，就是這個(gè)系統(tǒng)能不能隨著用戶用它的次數(shù)越來(lái)越多，它變得越來(lái)越聰明，它是不是真的隨著經(jīng)驗(yàn)積累在不斷的演化。如果它是這樣的，它就是一個(gè)能夠自我學(xué)習(xí)、自我進(jìn)化、自我演化的、智能的系統(tǒng)。所以，學(xué)習(xí)能力是智能的本質(zhì)屬性之一。在座有的年紀(jì)跟我相仿，在小學(xué)的時(shí)候有過(guò)一篇課文，講的是一個(gè)科學(xué)巨匠做小板凳的故事，他做的那個(gè)板凳非常的丑陋，但是我們能不能說(shuō)這個(gè)小朋友不聰明？如果你看他過(guò)去幾天做的每一個(gè)小板凳，他一個(gè)比一個(gè)做的好，他具有不斷的從經(jīng)驗(yàn)里面去學(xué)習(xí)的能力，使我們發(fā)現(xiàn)這個(gè)小朋友是非常具有智慧的。你看一個(gè)系統(tǒng)今天的能力不是最重要的，最重要的是它的增長(zhǎng)曲線，隨著大數(shù)據(jù)不斷增加，不斷去使用這個(gè)系統(tǒng)，它能變得越來(lái)越聰明。這里面我提到了經(jīng)驗(yàn)。經(jīng)驗(yàn)就是數(shù)據(jù)，數(shù)據(jù)就是經(jīng)驗(yàn)。我們?cè)跈C(jī)器學(xué)習(xí)里面有一個(gè)詞叫經(jīng)驗(yàn)數(shù)據(jù)。隨著經(jīng)驗(yàn)演化，就是隨著數(shù)據(jù)的不斷增長(zhǎng)，增長(zhǎng)你的能力。為什么我們迎來(lái)一個(gè)大數(shù)據(jù)的時(shí)代？因?yàn)閺腜C互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)，帶來(lái)了一個(gè)數(shù)據(jù)的爆增，在我們?nèi)粘Ｉ罾锩妫恳粋€(gè)人都在奉獻(xiàn)著大量的數(shù)據(jù)。這樣一個(gè)場(chǎng)景，是在圣彼得教堂門(mén)口的廣場(chǎng)上面，很多人來(lái)等待教皇選舉結(jié)果。在八年以后，在同樣一個(gè)地方，可能是同樣一群人，同樣的故事仍在上演。但從一個(gè)緯度來(lái)看，移動(dòng)互聯(lián)網(wǎng)在改變每個(gè)人的生活，每個(gè)人的手持設(shè)備在跟著你，它無(wú)時(shí)不刻的在產(chǎn)生數(shù)據(jù)。今天，每個(gè)人身上連著兩到三個(gè)移動(dòng)設(shè)備，比方說(shuō)、iPad，這樣一個(gè)趨勢(shì)往前演進(jìn)，人機(jī)交互是指在這個(gè)環(huán)境里面有無(wú)數(shù)個(gè)設(shè)備跟你感知、交互?，F(xiàn)在手表也已經(jīng)是一個(gè)智能終端了?？偟膩?lái)看，具體的趨勢(shì)是我們將進(jìn)入一個(gè)萬(wàn)物互聯(lián)的時(shí)代。隨之帶來(lái)的是每個(gè)你的設(shè)備都會(huì)記錄你的數(shù)據(jù)，人跟設(shè)備的連接，人跟人的連接，物與物的連接，設(shè)備與設(shè)備的連接都在產(chǎn)生數(shù)據(jù)。所以，這是一個(gè)時(shí)機(jī)，萬(wàn)物互聯(lián)將形成大量數(shù)據(jù)無(wú)處不在的生態(tài)，給我們帶來(lái)的時(shí)機(jī)就是智能化時(shí)代的來(lái)臨。2023年，我們突然看到那么多科幻的電影，那么多人在討論這樣那樣的，包括習(xí)總書(shū)記也在院士大會(huì)上談到機(jī)器人。所以這不是偶然，這有一個(gè)時(shí)代的背景。在大數(shù)據(jù)的時(shí)代，智能變得越來(lái)越重要。有一個(gè)技術(shù)，最近很多研究機(jī)構(gòu)，包括公司都有很大的投入，這個(gè)技術(shù)就叫深度學(xué)習(xí)。深度學(xué)習(xí)為什么會(huì)在這個(gè)時(shí)代這么受大家的關(guān)注？谷歌、微軟、Facebook都有專門(mén)的研究團(tuán)隊(duì)，F(xiàn)acebook2023年9月份第一次成立了研究院。今天很多中國(guó)的互聯(lián)網(wǎng)公司都成立了這樣的研究院。百度在這方面做了很多的工作，其中一個(gè)表現(xiàn)就是百度大腦工程，這個(gè)工程是一個(gè)有著上千臺(tái)效勞器，包括PC效勞器和GPU效勞器的大規(guī)模數(shù)據(jù)處理系統(tǒng)。去年我講的是百億級(jí)的產(chǎn)品，世界上最大級(jí)的深度神經(jīng)網(wǎng)絡(luò)，最近我們把它升級(jí)到千億級(jí)的系統(tǒng)?；谶@樣一個(gè)工程的能力，我們能夠去開(kāi)發(fā)各種各樣深度學(xué)習(xí)的算法，用在語(yǔ)音、圖象、自然語(yǔ)音理解、廣告的用戶匹配、用戶的建模等等。百度大腦目前最成功、最重要的四個(gè)利用的領(lǐng)域：第一，搜索。我們用深度學(xué)習(xí)作用在自然語(yǔ)音、文本、網(wǎng)絡(luò)的語(yǔ)意上面，去衡量他們語(yǔ)意的相關(guān)性。第二，廣告。因?yàn)閺V告是要智能的匹配，因?yàn)槿绻@個(gè)廣告不被用戶點(diǎn)擊，我們掙不到錢(qián)。第三，圖象。包括今天李彥宏講到了自動(dòng)駕駛，自動(dòng)駕駛里面圖像技術(shù)是非常重要的。第四，語(yǔ)音識(shí)別和理解。最近這幾年業(yè)界取得的進(jìn)展，包括百度做的工作。語(yǔ)音識(shí)別在三十年的時(shí)間里面是一個(gè)進(jìn)展非常緩慢的領(lǐng)域。但是最近三四年時(shí)間里有一個(gè)突飛猛進(jìn)的進(jìn)展，原因的核心就是基于大數(shù)據(jù)的深度學(xué)習(xí)技術(shù)。這些應(yīng)用領(lǐng)域在業(yè)務(wù)結(jié)構(gòu)里面扮演什么樣的角色？它怎么把這些事情串起來(lái)為公司的核心業(yè)務(wù)產(chǎn)生影響。第一，理解意圖。比方說(shuō)我們的用戶來(lái)到百度這個(gè)平臺(tái)，傳統(tǒng)上來(lái)講，他用關(guān)鍵詞表達(dá)他的搜索需求，但是我們看到最近這兩年有一個(gè)趨勢(shì)：第一，用戶需求表達(dá)越來(lái)越復(fù)雜，以前很多是搜索信息，現(xiàn)在很多是效勞的需求，這里面有很多復(fù)雜的語(yǔ)意來(lái)描述需求。第二，更多自然的方式表達(dá)你的需求。比方說(shuō)自然的語(yǔ)音、句子去問(wèn)問(wèn)題，比方說(shuō)在移動(dòng)終端上面用語(yǔ)音表達(dá)?，F(xiàn)在有的APP就是拍個(gè)照，小朋友幫助你做題。這種自然的表達(dá)方式是第二個(gè)趨勢(shì)。你用深度學(xué)習(xí)理解自然語(yǔ)言、語(yǔ)音識(shí)別、理解圖象變成是理解用戶的意圖。第二，你在理解了意圖以后，你需要連接用戶跟他需要的信息。你在信息、文章那一端需要有更好的理解，這個(gè)理解需要有更好的匹配。匹配用戶的需求，就是優(yōu)化搜索結(jié)果的智能排序。第三，精準(zhǔn)推送廣告和效勞。深度學(xué)習(xí)在每一個(gè)領(lǐng)域都發(fā)揮著重要的作用為什么深度學(xué)習(xí)在今天受到重視？第一點(diǎn)，我覺(jué)得是一個(gè)很浪漫主義的原因，因?yàn)槲覀兛偸窃谙胛覀兊臋C(jī)器能不能復(fù)制人的智能，復(fù)制生物的智能。所以有一個(gè)觀點(diǎn)是，深度學(xué)習(xí)可能跟人腦的機(jī)理是有關(guān)系的。確實(shí)也是，最早期的去啟發(fā)做深度學(xué)習(xí)的研究，確實(shí)是受到人腦的啟發(fā)。第二點(diǎn)，特別適合大數(shù)據(jù)。其實(shí)到今天，深度學(xué)習(xí)為什么重要的第一個(gè)原因是最不重要的，因?yàn)槟闳パ芯盔B(niǎo)類怎么飛行，跟我要造一個(gè)飛機(jī)是不一樣的事情。但對(duì)于我們來(lái)講，尤其對(duì)我們工業(yè)界來(lái)講，我們希望能夠造出智能的機(jī)器，他不是去再現(xiàn)人的智能，而是要利用大數(shù)據(jù)去延伸或者互補(bǔ)人的能力。第三，端到端的學(xué)習(xí)。過(guò)去做模式識(shí)別或者機(jī)器學(xué)習(xí)通常會(huì)分為兩步，第一，根據(jù)你對(duì)問(wèn)題的理解，人工的、人為的去做一些數(shù)據(jù)的預(yù)處理，這里面對(duì)人的要求是很高的，你需要非常精準(zhǔn)的對(duì)問(wèn)題進(jìn)行理解。但是你一旦換一個(gè)問(wèn)題，你需要重新去理解。深度學(xué)習(xí)把學(xué)習(xí)跟判定是連在一起的，前面不是人工的，它也是學(xué)習(xí)，但是一個(gè)一氣呵成的從端到端的學(xué)習(xí)，這個(gè)非常重要。因?yàn)樗屇氵@個(gè)學(xué)習(xí)更加智能，它可以讓你從一個(gè)領(lǐng)域遷移到另外一個(gè)領(lǐng)域，它可以減少人工帶來(lái)的不必要的麻煩。第四，提供一套建模語(yǔ)音。深度學(xué)習(xí)，你不需要對(duì)問(wèn)題有很好的理解，這是一個(gè)錯(cuò)誤的觀點(diǎn)。因?yàn)樯疃葘W(xué)習(xí)跟我們?cè)跈C(jī)器學(xué)習(xí)里面的圖模型一樣，也是一套語(yǔ)言系統(tǒng)，他讓你表達(dá)你對(duì)這個(gè)問(wèn)題的理解，如果你對(duì)這個(gè)問(wèn)題不理解，深度學(xué)習(xí)對(duì)你來(lái)講沒(méi)有用。在不同的問(wèn)題里面，我們需要開(kāi)發(fā)不同的深度學(xué)習(xí)的模型?；氐降谝粋€(gè)浪漫主義的觀點(diǎn)，深度學(xué)習(xí)跟人腦的關(guān)系。計(jì)算機(jī)視覺(jué)里面一個(gè)很著名的深度學(xué)習(xí)的模型是卷積神經(jīng)網(wǎng)絡(luò)。他們做這個(gè)的時(shí)候受到一個(gè)模型的啟發(fā)，這個(gè)模型80年代獲得諾貝爾醫(yī)學(xué)生理學(xué)獎(jiǎng)。他講的是視覺(jué)神經(jīng)系統(tǒng)早期在視覺(jué)皮層里面怎么樣處理視覺(jué)信息。用很多的圖像數(shù)據(jù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)，這個(gè)網(wǎng)絡(luò)能夠非常接近的表達(dá)視覺(jué)神經(jīng)系統(tǒng)的行為。每一層的神經(jīng)元是一個(gè)特征提取器，一個(gè)具體的神經(jīng)元對(duì)什么特征敏感，這里面講的是他對(duì)不同朝向的邊界敏感。更高一層，把下面這一層提取的結(jié)果，去組成更復(fù)雜的模式匹配。如果是兩條邊你結(jié)合在一起會(huì)形成一個(gè)物體的各個(gè)部位，比方說(shuō)鼻子的提取，再往下走，就更具有語(yǔ)意，他可以把下面的東西組成更加豐富的物體結(jié)構(gòu)。這里面他是一個(gè)從信號(hào)逐層抽象、逐層變換的過(guò)程。跟我們今天所了解的生物視覺(jué)系統(tǒng)是非常相關(guān)的。但根本上我們只是知道這個(gè)聯(lián)系，今天為止，我們做的很多的工作跟這個(gè)聯(lián)系并沒(méi)有太多的關(guān)系，也未受這個(gè)聯(lián)系的束縛。從另外一個(gè)觀點(diǎn)來(lái)講，從統(tǒng)計(jì)和計(jì)算方面來(lái)分享。在機(jī)器學(xué)習(xí)里面，我們關(guān)心的是推廣誤差，他不是看在現(xiàn)有數(shù)據(jù)集上面效果怎么樣，而是在未知的數(shù)據(jù)上，這個(gè)系統(tǒng)在訓(xùn)練的時(shí)候沒(méi)有看到的地方，叫推廣誤差。去年夏天，因?yàn)槲覀兗倚『⑹窃诿绹?guó)長(zhǎng)大，剛剛回來(lái)，剛剛從一年級(jí)開(kāi)始學(xué)習(xí)，中文不太好，他有一次考完試以后跟我講，考的不好，70幾分；第二天他特別快樂(lè)的跟我講，爸爸，我考了98分，我說(shuō)這太好了，一天之內(nèi)進(jìn)步這么快。他說(shuō)因?yàn)榻裉斓目碱}跟昨天是一樣的。這不能真實(shí)反響學(xué)習(xí)者的能力。推廣誤差要在你沒(méi)有見(jiàn)過(guò)的數(shù)據(jù)集上面衡量他的效果怎么樣。一個(gè)經(jīng)典的分析方法是把推廣誤差分析成兩局部，我們來(lái)看錯(cuò)誤源在什么地方。第一個(gè)叫Approximationerror，也就是假設(shè)，沒(méi)有假設(shè)就沒(méi)有學(xué)習(xí)，你在學(xué)習(xí)做推廣的時(shí)候就一定有假設(shè)，你從推向未知，中間一定有一個(gè)結(jié)構(gòu)在里面。古代我們講近朱者赤，近墨者黑，這有一個(gè)相似性-如果是相似的物體具有相似的屬性。這里面隱含著函數(shù)平滑假設(shè)，我們做一個(gè)假設(shè)，通常反映在你的模型中間，所有的假設(shè)可能是錯(cuò)的。在統(tǒng)計(jì)學(xué)里面有一個(gè)，假設(shè)不完美，你在假設(shè)空間里面一定能夠找到最完美的那個(gè)。第二個(gè)推廣來(lái)源是Estimationerror，這是來(lái)源于數(shù)據(jù)的不完美。你的訓(xùn)練數(shù)據(jù)和測(cè)試的數(shù)據(jù)來(lái)源分布不一樣。更多的時(shí)候是說(shuō)你的數(shù)據(jù)是有限樣本，如果你在有限樣本上面得到的估計(jì)量是不準(zhǔn)確的。因?yàn)槲覀兊墓烙?jì)量是在無(wú)限樣本里面去估計(jì)他。光分析這兩個(gè)東西是不夠的。通常來(lái)講，在統(tǒng)計(jì)學(xué)的范疇里去分析這兩個(gè)東西，統(tǒng)計(jì)學(xué)家關(guān)心的點(diǎn)，跟計(jì)算機(jī)科學(xué)不太一樣。計(jì)算機(jī)科學(xué)關(guān)心的是，我今天跟老板申請(qǐng)五百臺(tái)機(jī)器，老板說(shuō)不行就五臺(tái)。你說(shuō)老板，給我五個(gè)機(jī)器，我要算兩個(gè)月搞定，老板說(shuō)，你今天不搞定不能回家。所以是有限的資源下面去分析這個(gè)問(wèn)題，在資源的有限性上面，你要去分析這個(gè)問(wèn)題。這里面一般是求解的不完美，考慮計(jì)算的不完美。這里面給我們最近的機(jī)器學(xué)習(xí)提供了最近的誤差，我一開(kāi)始在機(jī)器學(xué)習(xí)上面右層的集成，最好的一層是20層。第二，大量的數(shù)據(jù)，讓你在這上面經(jīng)驗(yàn)性的判斷接近你的期望值。第三，我要設(shè)計(jì)一個(gè)非常精巧的算法，求得一個(gè)非常完美的解，這個(gè)完美的解算法非常復(fù)雜。一個(gè)能用的算法，它得有比擬好的性質(zhì)，讓你可以消化大的數(shù)據(jù)。把這三點(diǎn)都放在一起，大家可以理解，為什么在大數(shù)據(jù)的時(shí)代深度學(xué)習(xí)變得這么重要。我們看這兩個(gè)緯度，隨著數(shù)據(jù)規(guī)模的增長(zhǎng)，效果是怎么樣的。傳統(tǒng)的人工智能算法可能由于這個(gè)模型的空間是有限的，復(fù)雜度不夠高，數(shù)據(jù)多了沒(méi)有用?；蛘吣愕乃惴ū旧聿荒芴幚泶髷?shù)據(jù)，比方說(shuō)他的算法復(fù)雜度是數(shù)據(jù)量的三次方。一萬(wàn)個(gè)數(shù)據(jù)點(diǎn)你可以看懂，但是如果是十萬(wàn)個(gè)你就搞不定。但是深度學(xué)習(xí)算法，由于它的模型足夠的好，又能夠掌握主大數(shù)據(jù)，所以他能夠不斷吸收數(shù)據(jù)紅利，去年百度首席科學(xué)家AndrewNg帶著團(tuán)隊(duì)在語(yǔ)音識(shí)別問(wèn)題上取得了重大進(jìn)展，把數(shù)據(jù)加到了幾萬(wàn)小時(shí)，效果不斷的加強(qiáng)。如果你的商業(yè)模式能夠擁有這樣一個(gè)曲線，我要恭喜你，因?yàn)榇髷?shù)據(jù)真正成為商業(yè)壁壘。。第二，深度學(xué)習(xí)是一個(gè)靈活的建模語(yǔ)音。我們用不同的語(yǔ)音模型表達(dá)你的點(diǎn)，比方說(shuō)圖象，因?yàn)樗莾删S的，用卷積神經(jīng)網(wǎng)絡(luò)更加適合。我們?nèi)ニ阉髡Z(yǔ)意相關(guān)性，傳統(tǒng)的做法是人工抽取很多特征，變成一個(gè)學(xué)習(xí)問(wèn)題，這里面完全是端到端的。我關(guān)心的是對(duì)于一個(gè)搜索的Query，我關(guān)心的是這兩個(gè)相關(guān)性，但是它絕對(duì)的相關(guān)程度我不關(guān)心。深度神經(jīng)網(wǎng)絡(luò)給你的是一個(gè)語(yǔ)言，讓你去表達(dá)你對(duì)問(wèn)題的理解。這是最近非常成功的一個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它叫Long—shorttermmemory，它最近取得很好的進(jìn)展：即在任何一個(gè)地方，時(shí)間跟歷史的相關(guān)性是變化的。比方說(shuō)自然語(yǔ)言處理，你如果碰到一個(gè)右符號(hào)，你只要溯源到左符號(hào)那個(gè)地方，把中間所有的東西拿出來(lái)分析。根據(jù)你當(dāng)前所處的狀態(tài)，你是應(yīng)該去找一個(gè)更長(zhǎng)的。你遇到一個(gè)句號(hào)，你做語(yǔ)意理解的時(shí)候，你把過(guò)去歷史所有的都要清零。在時(shí)間面前，時(shí)間和歷史是不一樣的。這個(gè)模型比以前的模型更加的rich。我們?cè)谶^(guò)去做字符識(shí)別的時(shí)候，一般先把字符分成一個(gè)一個(gè)單的圖片，再識(shí)別它是什么東西，但是我們發(fā)現(xiàn)對(duì)于這樣的問(wèn)題是不可行的。在這種情況下，你可以做的是把整個(gè)字符序列放進(jìn)去，并希望輸出的是一個(gè)完整的字符序列?，F(xiàn)在在這些領(lǐng)域應(yīng)用都是最好的效果。用另外一個(gè)更加不同的神經(jīng)網(wǎng)絡(luò)表達(dá)我的問(wèn)題。我不是識(shí)別這個(gè)圖象里面有什么東西，而是述說(shuō)圖片的故事：下午的陽(yáng)光照在房間，有藍(lán)色的地毯和白色的沙發(fā)…今天我們用理解圖象的神經(jīng)網(wǎng)絡(luò)，經(jīng)過(guò)很多非線性的變換，生成很多表達(dá)。他從這個(gè)詞生成一個(gè)圖象，再生成下一個(gè)詞，我希望這個(gè)句子跟圖象是有關(guān)的，使整個(gè)的語(yǔ)言也跟這個(gè)圖象有關(guān)。根據(jù)你對(duì)這個(gè)問(wèn)題的理解，神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)給你提供了一個(gè)非常豐富的符號(hào)語(yǔ)言系統(tǒng)讓你去表達(dá)你這個(gè)問(wèn)題應(yīng)該怎么搜索。還有很多其他的例子，用深度學(xué)習(xí)提高搜索的先進(jìn)性，用了深度學(xué)習(xí)以后，比沒(méi)有用深度學(xué)習(xí)有翻倍的提升，包括語(yǔ)音的系統(tǒng)。最近我們用的語(yǔ)音系統(tǒng)，是一個(gè)真正的中文語(yǔ)音識(shí)別系統(tǒng)，我們用幾萬(wàn)小時(shí)的聲音來(lái)訓(xùn)練它，在識(shí)別率上面有很大提升。大家看新聞可能看到了，我們?cè)谟⑽牡淖R(shí)別也是優(yōu)于我們的競(jìng)爭(zhēng)對(duì)手。這是另外一個(gè)很有意思的例子，很小的一個(gè)產(chǎn)品，但是它是人工智能很多技術(shù)在一起的綜合體系。這個(gè)是我的一個(gè)朋友，紐約大學(xué)的教授研發(fā)的，他到上海來(lái)，去餐館看到這樣一個(gè)菜單，他拍照識(shí)別，有一個(gè)OCR，翻譯成英文，通過(guò)TTS就可以翻譯出來(lái)。在紐約你想找川菜館，他識(shí)別成中文，翻譯成英文，通過(guò)這個(gè)英文隨便給一個(gè)老外你問(wèn)他。這個(gè)東西正在成為現(xiàn)實(shí)，中間的時(shí)延做的越來(lái)越好。這是百度作業(yè)幫，小朋友夏天玩的沒(méi)有時(shí)間做作業(yè)了，但快要開(kāi)學(xué)了怎么辦？如果我小時(shí)候有這個(gè)玩意兒，我會(huì)很開(kāi)心，因?yàn)槲矣懈嗟臅r(shí)間玩。當(dāng)然這個(gè)技術(shù)要善加利用，你可以去找到關(guān)鍵的識(shí)別點(diǎn)。這一度讓很多朋友玩的很high，每個(gè)小人物都有一個(gè)成明星的夢(mèng)想，我們就能滿足這樣的需求。我訪問(wèn)谷歌的時(shí)候，有個(gè)是做深度學(xué)習(xí)最有名的多倫多大學(xué)的教授，現(xiàn)在在谷歌工作。當(dāng)時(shí)他問(wèn)我，深度學(xué)習(xí)還能活五年嗎？我說(shuō)不能，他聽(tīng)了很沉悶。但是其中的思想是有價(jià)值的，比方說(shuō)分層次的思想，在非神經(jīng)網(wǎng)絡(luò)的系統(tǒng)和其他的系統(tǒng)都有作用。我們用深度學(xué)習(xí)做了這么好玩的東西，我們可以玩一玩，他說(shuō)好，來(lái)玩玩。他得到了這個(gè)結(jié)果非常開(kāi)心，立刻分享給他的老婆。最近我們團(tuán)隊(duì)有一個(gè)挺好的結(jié)果，去年Facebook在測(cè)試上面，得到世界上最好的結(jié)果97.35%，前幾天百度深度學(xué)習(xí)研究院得到了99.85%的成績(jī)，終結(jié)了刷榜。常常我們會(huì)聽(tīng)說(shuō)到某一個(gè)團(tuán)隊(duì)在一個(gè)數(shù)據(jù)上面做到怎么樣的效果，怎么必須要客觀的看，那只是證明他在這個(gè)數(shù)據(jù)集上做的最好，不代表他把這個(gè)問(wèn)題給解決了，也不代表他的這個(gè)問(wèn)題就可用了。人臉識(shí)別，今天誰(shuí)要告訴你，說(shuō)人臉識(shí)別可以用來(lái)代替指紋識(shí)別，我告訴你，那肯定是忽悠，沒(méi)有到那個(gè)程度，但是終究有一天會(huì)做到的?；趫D象的理解，你可以做圖片搜索，他不光做視覺(jué)相似形的匹配，還有語(yǔ)意的匹配。這里的結(jié)果看起來(lái)都不錯(cuò)，有一些細(xì)致的區(qū)別。這邊下面是倒影，是水，這邊看似是水，但是大局部是草坪、陸地，這邊的結(jié)果全都是倒影、都是水。很細(xì)致的不同。去年全球最好的物體檢測(cè)模型，他告訴你有這個(gè)頭盔，他也告訴你這個(gè)頭盔在什么地方，用一個(gè)框給框出來(lái)?；诖髷?shù)據(jù)的人工智能在過(guò)去幾年已經(jīng)發(fā)生了變化，我們靜態(tài)來(lái)看、把這幾年的進(jìn)展串在一起看，效果還是很驚人的。在這個(gè)分類中，2023年世界最好結(jié)果，錯(cuò)誤率接近30%。每一年不同的團(tuán)隊(duì)在這上面努力工作，每一年的錯(cuò)誤率非常驚人的在降低，朝著零趨勢(shì)開(kāi)展。2023年最好的結(jié)果是百度取得的--7%。斯坦福的學(xué)者人工做了一下比對(duì)，他們發(fā)現(xiàn)人的識(shí)別率是5%，今年我們聽(tīng)到微軟和谷歌的朋友已經(jīng)做到大概3%、4%了。當(dāng)然也有一些誤導(dǎo)，比方說(shuō)他能認(rèn)識(shí)六七種不同的青蛙，誰(shuí)能認(rèn)識(shí)那么多種不同的青蛙呢？人的能力還是有限的。過(guò)去的搜索引擎包括幾個(gè)環(huán)節(jié)，數(shù)據(jù)信息的感知、處理、理解、學(xué)習(xí)，到?jīng)Q策、行動(dòng)、創(chuàng)造，這是三個(gè)不同階段。過(guò)去我們主要是從互聯(lián)網(wǎng)上獲取這些信息，今天因?yàn)槭且苿?dòng)互聯(lián)網(wǎng)，我們的效勞離人越來(lái)越近，所以你需要更多從人的數(shù)據(jù)里面獲取很多內(nèi)容。我們跟清華大學(xué)的朱勇武〔音〕老師有973的工程，從人，還有物理世界，物聯(lián)網(wǎng)〔上面有各種各樣的傳感器，里面有一種重要的傳感器是GPS，對(duì)物理世界的感知〕，這些緯度都變得越來(lái)越重要。相反，互聯(lián)網(wǎng)上的數(shù)據(jù)以前是唯一，現(xiàn)在只是其中的一個(gè)信息來(lái)源。把這些信息都獲取，我們也需要去向更加先進(jìn)的人機(jī)交互的領(lǐng)域開(kāi)展。比方說(shuō)更加先進(jìn)的傳感器，我們現(xiàn)在在做3D建模，它是自動(dòng)駕駛很重要的一個(gè)方面。因?yàn)檐?chē)在什么地方可以走，什么地方不能走，哪個(gè)地方是主道，哪個(gè)地方是輔道…要不然這個(gè)車(chē)不知道怎么走。以前傳統(tǒng)的互聯(lián)網(wǎng)的信息分析以后，我們通常去做預(yù)測(cè)、廣告、搜索.但是今天，我們不光是在數(shù)字世界里面去做一些事情，我們是不是也在物理世界做一些事情。有一位專家說(shuō)的很好，清華大學(xué)張?jiān)菏空f(shuō)，機(jī)器人是互聯(lián)網(wǎng)效勞的最后一公里。比方說(shuō)今天你在網(wǎng)上預(yù)定一個(gè)比薩，那邊有人讀到了這個(gè)信息，他來(lái)給你做這個(gè)比薩；某個(gè)人辛辛苦苦把這個(gè)比薩送過(guò)來(lái)…這里面有很多環(huán)節(jié)可以去優(yōu)化。比方說(shuō)這個(gè)比薩是不是真的做的非常的個(gè)性化，是不是非常符合你的口味？比方說(shuō)今天我們?cè)谝苿?dòng)互聯(lián)網(wǎng)上對(duì)每個(gè)用戶的畫(huà)像，可以做幾十萬(wàn)個(gè)來(lái)描述你的興趣。將來(lái)的這個(gè)比薩會(huì)做的非常的個(gè)性化。加多少胡椒粉都是針對(duì)你的口味，可以做到千人千面，可以讓每個(gè)人都感覺(jué)是VIP。到底誰(shuí)能做這件事情？機(jī)器人。因?yàn)樗堰@些數(shù)據(jù)瞬間讀到他的數(shù)據(jù)庫(kù)里面。誰(shuí)來(lái)最高效的把這個(gè)效勞最后完成，送到你家里來(lái)？機(jī)器人。張華院士說(shuō)機(jī)器人是互聯(lián)網(wǎng)效勞的最后一公里，很有道理，很深刻。當(dāng)然人工智能還有一個(gè)很高的層次就是探索和發(fā)現(xiàn)。去探索過(guò)去沒(méi)有的東西，3D打印在這里面扮演一個(gè)東西，他把一個(gè)計(jì)算的結(jié)果變成一個(gè)物理的現(xiàn)實(shí)。計(jì)算是沒(méi)有邊界的，計(jì)算生成的結(jié)果根本上也是沒(méi)有任何的邊界，所以他可以生成任何的東西，3D打印就可以幫助他實(shí)現(xiàn)。將來(lái)的智能延伸到物理世界里面去創(chuàng)造以前從來(lái)沒(méi)有過(guò)的東西，這是一個(gè)可以預(yù)見(jiàn)的未來(lái)。今天對(duì)網(wǎng)絡(luò)模型的規(guī)模有不斷的追求，我經(jīng)常可以聽(tīng)到某某單位可以實(shí)現(xiàn)超大規(guī)模的神經(jīng)網(wǎng)絡(luò)，這里面可以稍微做一些類比，我們可以看到不同物種的變化是很大的。但是如果你看他們的變化之間平均的連接，他們的區(qū)別其實(shí)沒(méi)有那么大。我們發(fā)現(xiàn)更高層次的智慧物種，他有更大規(guī)模的神經(jīng)網(wǎng)絡(luò)，但是他的網(wǎng)絡(luò)連接是稀疏的。你的物種不斷增多，你的連接卻沒(méi)有變化，所以他一定是越來(lái)越稀疏的。這對(duì)我們是有一些啟發(fā)的。今天我們來(lái)比擬一下人類大腦跟Supercomputer。人的大腦一般是1.5KG，2%的位置，但是它要消耗我們2%的能量，所以腦子是很消耗能量的。為什么中午會(huì)犯困，因?yàn)槟愠燥堃院笱憾嫉较览锩嫒チ?。某某朋友一天非常集中的做一件事情，最后?huì)累的虛脫，哪怕他沒(méi)有怎么動(dòng)就是這個(gè)原因。我們的大腦有一千億個(gè)neurons，每個(gè)數(shù)理有5000個(gè)神經(jīng)原，每一個(gè)連接是200次/秒。我們大腦的計(jì)算能力是10的17次方。它是一個(gè)非常高效的計(jì)算，每瓦能量完成的計(jì)算量是5個(gè)Gliops。跟中國(guó)的天河二號(hào)比擬一下，它現(xiàn)在的計(jì)算能力還沒(méi)有到達(dá)人腦計(jì)算的一半，它現(xiàn)在是34個(gè)petaliops，它的計(jì)算效率是每瓦2.14Gliops。這是我們和清華大學(xué)做的一個(gè)工程，它是真正的自行車(chē)，以前我們見(jiàn)到的自行車(chē)都是假的自行車(chē)，因?yàn)樗皇亲孕?。我們?cè)谧鲞@個(gè)工程的時(shí)候有一些思考，這個(gè)思考就是人跟車(chē)的關(guān)系，我們覺(jué)得它未來(lái)是人跟馬的關(guān)系，是朋友。如果你養(yǎng)一匹馬，很親以后，它跟你有一個(gè)交流，它也是懂你的，它也有自己的想法。這是我們?cè)诎俣茸龅淖詣?dòng)駕駛工程。我們不把它叫做無(wú)人駕駛，我們叫做“高度自動(dòng)駕駛〞工程。首先這是一個(gè)非常典型的機(jī)器人工程，一個(gè)自動(dòng)駕駛的車(chē)，裝了這么多的傳感器。這個(gè)車(chē)的后背箱堆滿了效勞器。感知、理解、決策控制，車(chē)的計(jì)算要直接控制、操控這個(gè)車(chē)物理的東西。這里面中國(guó)跟國(guó)外還有一些差距，首先要實(shí)現(xiàn)線控，中國(guó)絕大局部的車(chē)都不是線控。我們做自動(dòng)駕駛，你要控制剎車(chē)，怎么控制？不是一個(gè)接口、一個(gè)計(jì)算機(jī)寫(xiě)進(jìn)去，他是一個(gè)大的鐵桿子、這邊裝了馬達(dá)，鐵桿子踩在剎車(chē)上。我們跟寶馬合作，是因?yàn)樗峁┚€控的技術(shù)。這個(gè)車(chē)我們叫做小紅，小紅，大白，這是我們改裝的第一輛車(chē)，第二輛、第三輛。首先是對(duì)道路的感知，這里是三維高精度的感知。對(duì)車(chē)的定位要能夠做到厘米量級(jí)的定位。這里面需要一些相當(dāng)?shù)膫鞲衅骷夹g(shù)、機(jī)器人技術(shù)。這個(gè)是在G7上面采用的。大家看到劃的很高，因?yàn)槲覀兪侨S的東西，很容易劃的很高，都是計(jì)算出來(lái)的。我們對(duì)車(chē)整合動(dòng)力學(xué)的系統(tǒng)建了這個(gè)模型做仿真，在路上走我們要做模擬的仿真，模擬仿真做的差不多以后，我們?cè)賹?shí)際的去調(diào)試。自動(dòng)駕駛要飛入尋常百姓家，關(guān)鍵是你要用低本錢(qián)的傳感器實(shí)現(xiàn)很強(qiáng)的智能感知能力。谷歌自動(dòng)駕駛有一個(gè)很?chē)?yán)重的問(wèn)題，他用的傳感器比車(chē)本身都貴。他的傳感器要70萬(wàn)人民幣。但是我們要突破一個(gè)技術(shù)，就是怎么讓低本錢(qián)的傳感器大規(guī)模的應(yīng)用。這是我們做的是基于圖象的實(shí)時(shí)道路場(chǎng)景理解。比方說(shuō)識(shí)別道路上的汽車(chē)，在這件事情上我們真的做的比別人好。這個(gè)藍(lán)色的點(diǎn)是我們的標(biāo)注人員做的。這些車(chē)是疊著排在路邊，人在標(biāo)注的時(shí)候不容易精確的說(shuō)這輛車(chē)、這輛車(chē)、這輛車(chē)，不容易看清。這個(gè)地方陰影的遮擋。有一輛車(chē)在這里，被一個(gè)交通標(biāo)志遮擋起來(lái)了，人不容易看到，但是目前我們的算法能夠做到這樣的水平。最后看一下我們對(duì)自動(dòng)駕駛開(kāi)展路徑的看法。為什么我們不認(rèn)為我們要做的是無(wú)人駕駛？真正的無(wú)人駕駛要實(shí)現(xiàn)，還有一個(gè)相當(dāng)長(zhǎng)的路徑，除了技術(shù)的能力以外，還有政府的政策法規(guī)，還有根底建設(shè)，還有保險(xiǎn)公司怎么判定這個(gè)問(wèn)題，出了問(wèn)題到底是誰(shuí)的錯(cuò)，這些事情已經(jīng)遠(yuǎn)超技術(shù)本身，還有倫理的問(wèn)題。真正到無(wú)人駕駛，你要經(jīng)歷幾個(gè)階段：第一階段，輔助駕駛。第二，主動(dòng)駕駛。第三，特定條件下的自動(dòng)駕駛。第四，高度的自動(dòng)化駕駛。比方說(shuō)輔助駕駛，當(dāng)前這個(gè)階段是一個(gè)輔助駕駛的階段，因?yàn)檫@個(gè)車(chē)告訴你哪邊有車(chē)，哪邊有人，如果要出事故，他會(huì)提醒你。輔助駕駛告訴你檢測(cè)的結(jié)果，他不控制這個(gè)車(chē)?？刂七@個(gè)車(chē)變成了主動(dòng)駕駛。特定環(huán)境下面，很多的車(chē)廠跟我們一樣都認(rèn)為在特定的場(chǎng)景，像某些高速公路，在兩到三年的時(shí)間里面會(huì)實(shí)現(xiàn)智能的自適應(yīng)巡航?，F(xiàn)在車(chē)的巡航只是保持速度，如果前面的車(chē)并道過(guò)來(lái)了，你是不是會(huì)做一些改變，或者減低車(chē)速，現(xiàn)在的車(chē)做不到。如果這個(gè)車(chē)本身在巡航狀態(tài)，他是不停在拐彎的，你會(huì)不會(huì)車(chē)道跟隨？這個(gè)會(huì)最先實(shí)現(xiàn)。在某些比擬先進(jìn)的地方，你到了賓館，車(chē)就不用管了。將來(lái)這個(gè)車(chē)是自動(dòng)駕駛的，他把你的車(chē)移到那個(gè)地方。或者在一個(gè)大型的物流中心，或者在一個(gè)礦山里面，他是一個(gè)自動(dòng)駕駛。最后到高度的自動(dòng)駕駛。人車(chē)一體，人不能放棄對(duì)車(chē)的控制，就像現(xiàn)在的飛機(jī)一樣，飛機(jī)在空中的很多時(shí)候它是自動(dòng)駕駛的狀態(tài)，你喝杯咖啡沒(méi)有問(wèn)題，但是任何時(shí)候你要重新恢復(fù)你的控制，你可以做到。因?yàn)槿藢?duì)這個(gè)事情負(fù)責(zé)。關(guān)于人和機(jī)器的關(guān)系，從我自己親身經(jīng)歷的例子來(lái)說(shuō)。我們過(guò)去的團(tuán)隊(duì)在兩年前做過(guò)兩個(gè)事情，一個(gè)事情是讓你自己照的照片找一個(gè)長(zhǎng)的最像的明星。還有一個(gè)是你拍一個(gè)照，理解了以后，生成一首詩(shī)。這里面涉及到計(jì)算機(jī)視覺(jué)，涉及到自然語(yǔ)言。但是從市場(chǎng)的反響來(lái)講，你們可以想象到，哪個(gè)更受歡送？因?yàn)檫@跟每個(gè)人都相關(guān)，每個(gè)普通人都有一個(gè)想當(dāng)大明星的夢(mèng)想，哪怕是一個(gè)虛幻，至少是這個(gè)產(chǎn)品跟每個(gè)用戶之間的關(guān)聯(lián)。拍照寫(xiě)詩(shī)為什么不受歡送？因?yàn)樗莝howoff，他是秀百度的機(jī)器有多牛，不是秀我多牛。這里面有一個(gè)我們的思考，機(jī)器往前，我們回到人工智能的原點(diǎn)，這個(gè)原點(diǎn)叫圖靈測(cè)試，圖靈測(cè)試一直在指導(dǎo)人工智能研究的方向，他的目的是研究這個(gè)智能的機(jī)器能夠取代人。圖靈測(cè)試就是如果拿一個(gè)布檔著，這邊是機(jī)器還是人我就不知道了。我們下國(guó)際象棋，目前他是PASS了圖靈測(cè)試的。這種導(dǎo)致了你的做法，你不斷研究跟人可以PK的機(jī)器，這是不是我們真正想做的，是不是真正的方向。站在今天可以去思考。我剛剛講到了象棋，IBM的深藍(lán)有一個(gè)劃時(shí)代的成果，它做的比最好的象棋冠軍能力還好，看似這樣一個(gè)偉大的科技進(jìn)展，它其實(shí)沒(méi)有給IBM帶來(lái)任何的價(jià)值，沒(méi)有給這個(gè)社會(huì)產(chǎn)生任何的影響，也沒(méi)有使這個(gè)社會(huì)變得更加美好。為什么？因?yàn)樗鼰o(wú)非是造一個(gè)跟人能力差不多可以PK的機(jī)器。我們看另外一個(gè)東西，搜索引擎，無(wú)論是谷歌還是百度，它這個(gè)技術(shù)不完美，因?yàn)槲覀兝硐氲募夹g(shù)是能夠給他扔一個(gè)問(wèn)題，他能夠自動(dòng)尋找問(wèn)題的答案。他做的不完美，他是扔一堆排序的結(jié)果，你自己搞清楚。但是他對(duì)這個(gè)社會(huì)產(chǎn)生了巨大的影響。他能讓北京清華附小一個(gè)家庭環(huán)境非常優(yōu)越的小孩子跟一個(gè)鄉(xiāng)村里面的小孩子，只要有網(wǎng)絡(luò)的情況下，獲取知識(shí)、獲取信息的能力是一樣的。他是因?yàn)槌删土嗣總€(gè)人，讓每一個(gè)普通的人更有知識(shí)，他獲得信息，能夠做更加明智的判斷，這個(gè)事情跟這個(gè)社會(huì)的大需求發(fā)生了共振，產(chǎn)生了巨大的影響。我們思考自動(dòng)駕駛也是這樣，我們是要去思考、去做真正的替代人去駕駛的，還是去做車(chē)成就人的，還是你可以獲取更大的自由。谷歌的這個(gè)車(chē)一開(kāi)始是沒(méi)有方向盤(pán)的。這個(gè)車(chē)真的是你想要的嗎？最近他們把方向盤(pán)加上去了。我們希望車(chē)跟人的關(guān)系，就像人跟馬的關(guān)系一樣。你在萬(wàn)馬奔騰的環(huán)境里面，你騎著這個(gè)馬，你不需要特別細(xì)微的控制這個(gè)馬，它自己知道怎么走，避障，跟周?chē)鸟R協(xié)調(diào)距離，你要把握大方向。你甚至在馬上面如果打瞌睡，馬也可以帶著你走，你什么時(shí)候想要控制它，你是可以控制的。自動(dòng)駕駛是要構(gòu)建人車(chē)一體、以人為主的駕駛環(huán)境。最后，我覺(jué)得什么是一個(gè)偉大的技術(shù)？它不在于讓機(jī)器更偉大，它的偉大之處，是讓每個(gè)平凡的人更有創(chuàng)造力、更加自我、更偉大。這是人工智能和技術(shù)開(kāi)展的方向。世界是我們的，也是機(jī)器人的，但是歸根到底是屬于會(huì)控制機(jī)器人的人的。謝謝大家！提問(wèn)環(huán)節(jié)提問(wèn)1：借用張?jiān)菏空f(shuō)的最后一公里，前面在你的思路中，什么是最先一公里？最先一公里和最后一公里是什么關(guān)系？余凱：信息的搜集、整理是目前來(lái)講先要去做的。提問(wèn)2：假設(shè)我們可以確定機(jī)器智能的開(kāi)展一定會(huì)威脅人的生存，機(jī)器超過(guò)人的時(shí)候，一個(gè)很?chē)?yán)重的問(wèn)題就是人沒(méi)有用了。余凱：首先，我們現(xiàn)在太早去思考這個(gè)問(wèn)題了，因?yàn)槲覀儸F(xiàn)在離那個(gè)階段還非常遠(yuǎn)。第二，我不認(rèn)為將來(lái)機(jī)器會(huì)超過(guò)人或者駕馭人。他應(yīng)該還是人的工具。我覺(jué)得它在很多能力方面是超過(guò)我們，但是最后它還是受人的駕馭。有一點(diǎn)是：機(jī)器人沒(méi)有好奇心。我現(xiàn)在想不到讓一個(gè)計(jì)算模型具有對(duì)未知世界探索的好奇心。因?yàn)槿巳ヌ剿魑粗澜绾闷?，不斷的拓展知識(shí)的邊界，機(jī)器人是去執(zhí)行我們的想法。提問(wèn)3：我正在寫(xiě)一篇文章，這一篇文章的一個(gè)觀點(diǎn)是，當(dāng)機(jī)器要保證自己不斷電的情況下，沒(méi)有人的參與，它會(huì)不會(huì)有好奇心？余凱：會(huì)不會(huì)有好奇心我就不知道了。這種哲學(xué)討論我們可以永遠(yuǎn)討論。因?yàn)槟且惶鞗](méi)有到來(lái)之前，我們可以不斷的去猜想。我的觀點(diǎn)，我們想做對(duì)社會(huì)有用的東西。提問(wèn)4：剛剛余博士介紹很多沖動(dòng)人心的人工智能方面的成果?？墒俏覀儸F(xiàn)在去看應(yīng)用層面，包括剛剛介紹很多百度的應(yīng)用，好玩但是不實(shí)用，比方說(shuō)魔圖、百度拍植物，都不實(shí)用，或者是一個(gè)輔助性。余博士的角度看，在應(yīng)用層面，出現(xiàn)一個(gè)endto-end的應(yīng)用可能會(huì)出現(xiàn)哪一個(gè)領(lǐng)域？余凱：這些人工智能的技術(shù)對(duì)于現(xiàn)實(shí)商業(yè)的影響其實(shí)是巨大的。因?yàn)榻裉斓恼麄€(gè)搜索、廣告系統(tǒng)、電子商務(wù)、大數(shù)據(jù)金融，這些技術(shù)在這里面，你有和沒(méi)有，是生和死的問(wèn)題，不是錦上添花的事情。但是那些好玩的事情，他自己也在不斷的演進(jìn)。我們講的圖象識(shí)別，大家有沒(méi)有聽(tīng)說(shuō)過(guò)MobilEye？這家公司就是做車(chē)輛和行人識(shí)別感知系統(tǒng)，它現(xiàn)在做到很大。還有一個(gè)大數(shù)據(jù)公司叫Palentir，他就是人工智能大數(shù)據(jù)的方法用在國(guó)家平安領(lǐng)域，他現(xiàn)在是一百多億美金的估值。近期來(lái)講，你總會(huì)覺(jué)得技術(shù)開(kāi)展比你想象的要慢。近期大家總是高估技術(shù)對(duì)人類的影響，但是在十年的時(shí)間里面，你一定是低估技術(shù)對(duì)你生活的影響。提問(wèn)5：在您的演講里面有一個(gè)細(xì)節(jié)，您跟Hinton教授談的時(shí)候，說(shuō)這一波深度學(xué)習(xí)浪潮很快就過(guò)去了。在五年之后，在深度學(xué)習(xí)之后是什么樣的開(kāi)展方向，什么樣的技術(shù)引領(lǐng)下一個(gè)開(kāi)展方向？余凱：在某一個(gè)方面做的事情，特別是計(jì)算機(jī)科學(xué)，常常是自己埋葬自己。很多年前，計(jì)算機(jī)體系結(jié)構(gòu)，現(xiàn)在做的時(shí)候它不是一個(gè)你要探索的學(xué)科。深度學(xué)習(xí)一定會(huì)成為一個(gè)非常俗氣的東西，每個(gè)人都會(huì)用。至于未來(lái)的方向，我不能講太遠(yuǎn)、太哲學(xué)的，我更愿意講現(xiàn)實(shí)的?，F(xiàn)實(shí)來(lái)講，自然語(yǔ)言理解是一個(gè)非常重要的方向，期待一個(gè)突破性的進(jìn)展。提問(wèn)6：我是電子系的學(xué)生，深度學(xué)習(xí)的算法用在硬件上面，您覺(jué)得這方面的潛力大嗎？余凱：這個(gè)會(huì)非常有潛力，因?yàn)榘堰@些智能的算法用在硬件里面，可以放進(jìn)各種智能設(shè)備中，這是我很期待的方向。提問(wèn)7

人人文庫(kù)> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)與人工智能

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔