大數(shù)據(jù)與人工智能_第1頁(yè)
大數(shù)據(jù)與人工智能_第2頁(yè)
大數(shù)據(jù)與人工智能_第3頁(yè)
大數(shù)據(jù)與人工智能_第4頁(yè)
大數(shù)據(jù)與人工智能_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)與人工智能數(shù)據(jù)科學(xué)已經(jīng)在決策科學(xué)、社會(huì)科學(xué)、經(jīng)濟(jì)學(xué)里面扮演越來(lái)越重要的角色,所以這種交叉融合,這種碰撞對(duì)我們每一個(gè)人來(lái)講都是學(xué)習(xí)的時(shí)機(jī),也是一些施展才華的空間。最近在各個(gè)場(chǎng)合有一些分享,今天我尤其要把這個(gè)講座做好。今天是我兒子第一次坐在下面聽(tīng)我的講座。過(guò)去我們做的這些工作是跟數(shù)據(jù)有關(guān)系的。一個(gè)大數(shù)據(jù)、一個(gè)人工智能,這兩個(gè)放在一起,今天很多的企業(yè)會(huì)這么重視,在這里給大家分享一下我們自己的故事。百度在過(guò)去兩年多的時(shí)間里面,在人工智能領(lǐng)域有很多技術(shù)方面的投入。今年李彥宏在兩會(huì)上提出中國(guó)大腦,很受關(guān)注;麻省理工學(xué)院科技評(píng)論雜志去年專門(mén)發(fā)表了一篇評(píng)論性文章,介紹百度的人工智能之夢(mèng)。在國(guó)外主流的科技雜志里面報(bào)道一個(gè)中國(guó)企業(yè)的科技研發(fā),還是比擬少的。我自己感到非常的振奮。百度的背景,和很多的互聯(lián)網(wǎng)公司都是一樣的,從技術(shù)的緯度來(lái)講,他本質(zhì)上是一個(gè)基于大數(shù)據(jù)的人工智能公司。我們是提供一個(gè)搜索引擎,這個(gè)搜索引擎下面有一個(gè)非常精致的結(jié)構(gòu),它可以搜索到各種信息、知識(shí),而且效勞是完全免費(fèi)的、給用戶帶來(lái)價(jià)值的。但是我們獲得了了大量的搜索行為數(shù)據(jù),并實(shí)現(xiàn)它的商業(yè)價(jià)值,就得通過(guò)廣告、推送效勞。從數(shù)據(jù)到價(jià)值,這中間就需要大量的技術(shù),尤其是基于大數(shù)據(jù)的人工智能技術(shù),包括機(jī)器學(xué)習(xí),自然語(yǔ)言處理,語(yǔ)音識(shí)別,圖像識(shí)別。最近在全社會(huì),無(wú)論是在中國(guó)還是美國(guó),還是科技媒體,還是研究機(jī)構(gòu),還是商業(yè)公司,都在談自動(dòng)駕駛、機(jī)器人、物聯(lián)網(wǎng)、個(gè)性化、VR、AR。其實(shí)這些都是AI的各個(gè)領(lǐng)域,現(xiàn)在AI已經(jīng)成為科技創(chuàng)新的主戰(zhàn)場(chǎng),它不光是未來(lái)時(shí),而且是現(xiàn)在進(jìn)行時(shí)。我們看電影《超能陸戰(zhàn)隊(duì)》,看似是未來(lái)的東西,但是今天很多領(lǐng)域正在發(fā)生,也在產(chǎn)生價(jià)值。到底什么是人工智能?嚴(yán)肅的科學(xué)定義到今天為止,沒(méi)有一個(gè)廣泛接受的定義。比方說(shuō),有一種說(shuō)法叫強(qiáng)人工智能,有一種說(shuō)法叫弱人工智能,還有基于符號(hào)邏輯的、也有基于統(tǒng)計(jì)模型的,有不同的觀點(diǎn)。拋開(kāi)這些不同的觀點(diǎn),通常一個(gè)人工智能系統(tǒng)有這樣幾個(gè)方面:第一,我們希望這個(gè)系統(tǒng)具有感知的能力,就像人一樣,有五官,可以感知周?chē)沫h(huán)境是什么樣的。第二,獲取這個(gè)感知以后,對(duì)面臨的環(huán)境有一個(gè)理解。比方說(shuō)對(duì)于一個(gè)機(jī)器人來(lái)講,他在感知到這個(gè)環(huán)境以后,如果想到后面去跟一個(gè)同學(xué)聊天,他需要尋找最正確路徑。他必須要理解,那條路是走不通的,那條是可以走的。第三,在理解的根底上做出決策,從而達(dá)成目的或完成任務(wù)一個(gè)機(jī)器要感知,然后理解,然后決策,這是一個(gè)過(guò)程。今天在市場(chǎng)上面無(wú)處不在充滿著智能產(chǎn)品:智能湯勺、智能水杯等等。我們把一個(gè)老式的收音機(jī)和智能設(shè)備放在一起比擬,他們有什么不同?區(qū)別一個(gè)系統(tǒng)、一個(gè)產(chǎn)品是不是真的具有智能的能力,有一個(gè)很重要的緯度,就是這個(gè)系統(tǒng)能不能隨著用戶用它的次數(shù)越來(lái)越多,它變得越來(lái)越聰明,它是不是真的隨著經(jīng)驗(yàn)積累在不斷的演化。如果它是這樣的,它就是一個(gè)能夠自我學(xué)習(xí)、自我進(jìn)化、自我演化的、智能的系統(tǒng)。所以,學(xué)習(xí)能力是智能的本質(zhì)屬性之一。在座有的年紀(jì)跟我相仿,在小學(xué)的時(shí)候有過(guò)一篇課文,講的是一個(gè)科學(xué)巨匠做小板凳的故事,他做的那個(gè)板凳非常的丑陋,但是我們能不能說(shuō)這個(gè)小朋友不聰明?如果你看他過(guò)去幾天做的每一個(gè)小板凳,他一個(gè)比一個(gè)做的好,他具有不斷的從經(jīng)驗(yàn)里面去學(xué)習(xí)的能力,使我們發(fā)現(xiàn)這個(gè)小朋友是非常具有智慧的。你看一個(gè)系統(tǒng)今天的能力不是最重要的,最重要的是它的增長(zhǎng)曲線,隨著大數(shù)據(jù)不斷增加,不斷去使用這個(gè)系統(tǒng),它能變得越來(lái)越聰明。這里面我提到了經(jīng)驗(yàn)。經(jīng)驗(yàn)就是數(shù)據(jù),數(shù)據(jù)就是經(jīng)驗(yàn)。我們?cè)跈C(jī)器學(xué)習(xí)里面有一個(gè)詞叫經(jīng)驗(yàn)數(shù)據(jù)。隨著經(jīng)驗(yàn)演化,就是隨著數(shù)據(jù)的不斷增長(zhǎng),增長(zhǎng)你的能力。為什么我們迎來(lái)一個(gè)大數(shù)據(jù)的時(shí)代?因?yàn)閺腜C互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng),帶來(lái)了一個(gè)數(shù)據(jù)的爆增,在我們?nèi)粘I罾锩妫恳粋€(gè)人都在奉獻(xiàn)著大量的數(shù)據(jù)。這樣一個(gè)場(chǎng)景,是在圣彼得教堂門(mén)口的廣場(chǎng)上面,很多人來(lái)等待教皇選舉結(jié)果。在八年以后,在同樣一個(gè)地方,可能是同樣一群人,同樣的故事仍在上演。但從一個(gè)緯度來(lái)看,移動(dòng)互聯(lián)網(wǎng)在改變每個(gè)人的生活,每個(gè)人的手持設(shè)備在跟著你,它無(wú)時(shí)不刻的在產(chǎn)生數(shù)據(jù)。今天,每個(gè)人身上連著兩到三個(gè)移動(dòng)設(shè)備,比方說(shuō)、iPad,這樣一個(gè)趨勢(shì)往前演進(jìn),人機(jī)交互是指在這個(gè)環(huán)境里面有無(wú)數(shù)個(gè)設(shè)備跟你感知、交互?,F(xiàn)在手表也已經(jīng)是一個(gè)智能終端了??偟膩?lái)看,具體的趨勢(shì)是我們將進(jìn)入一個(gè)萬(wàn)物互聯(lián)的時(shí)代。隨之帶來(lái)的是每個(gè)你的設(shè)備都會(huì)記錄你的數(shù)據(jù),人跟設(shè)備的連接,人跟人的連接,物與物的連接,設(shè)備與設(shè)備的連接都在產(chǎn)生數(shù)據(jù)。所以,這是一個(gè)時(shí)機(jī),萬(wàn)物互聯(lián)將形成大量數(shù)據(jù)無(wú)處不在的生態(tài),給我們帶來(lái)的時(shí)機(jī)就是智能化時(shí)代的來(lái)臨。2023年,我們突然看到那么多科幻的電影,那么多人在討論這樣那樣的,包括習(xí)總書(shū)記也在院士大會(huì)上談到機(jī)器人。所以這不是偶然,這有一個(gè)時(shí)代的背景。在大數(shù)據(jù)的時(shí)代,智能變得越來(lái)越重要。有一個(gè)技術(shù),最近很多研究機(jī)構(gòu),包括公司都有很大的投入,這個(gè)技術(shù)就叫深度學(xué)習(xí)。深度學(xué)習(xí)為什么會(huì)在這個(gè)時(shí)代這么受大家的關(guān)注?谷歌、微軟、Facebook都有專門(mén)的研究團(tuán)隊(duì),F(xiàn)acebook2023年9月份第一次成立了研究院。今天很多中國(guó)的互聯(lián)網(wǎng)公司都成立了這樣的研究院。百度在這方面做了很多的工作,其中一個(gè)表現(xiàn)就是百度大腦工程,這個(gè)工程是一個(gè)有著上千臺(tái)效勞器,包括PC效勞器和GPU效勞器的大規(guī)模數(shù)據(jù)處理系統(tǒng)。去年我講的是百億級(jí)的產(chǎn)品,世界上最大級(jí)的深度神經(jīng)網(wǎng)絡(luò),最近我們把它升級(jí)到千億級(jí)的系統(tǒng)?;谶@樣一個(gè)工程的能力,我們能夠去開(kāi)發(fā)各種各樣深度學(xué)習(xí)的算法,用在語(yǔ)音、圖象、自然語(yǔ)音理解、廣告的用戶匹配、用戶的建模等等。百度大腦目前最成功、最重要的四個(gè)利用的領(lǐng)域:第一,搜索。我們用深度學(xué)習(xí)作用在自然語(yǔ)音、文本、網(wǎng)絡(luò)的語(yǔ)意上面,去衡量他們語(yǔ)意的相關(guān)性。第二,廣告。因?yàn)閺V告是要智能的匹配,因?yàn)槿绻@個(gè)廣告不被用戶點(diǎn)擊,我們掙不到錢(qián)。第三,圖象。包括今天李彥宏講到了自動(dòng)駕駛,自動(dòng)駕駛里面圖像技術(shù)是非常重要的。第四,語(yǔ)音識(shí)別和理解。最近這幾年業(yè)界取得的進(jìn)展,包括百度做的工作。語(yǔ)音識(shí)別在三十年的時(shí)間里面是一個(gè)進(jìn)展非常緩慢的領(lǐng)域。但是最近三四年時(shí)間里有一個(gè)突飛猛進(jìn)的進(jìn)展,原因的核心就是基于大數(shù)據(jù)的深度學(xué)習(xí)技術(shù)。這些應(yīng)用領(lǐng)域在業(yè)務(wù)結(jié)構(gòu)里面扮演什么樣的角色?它怎么把這些事情串起來(lái)為公司的核心業(yè)務(wù)產(chǎn)生影響。第一,理解意圖。比方說(shuō)我們的用戶來(lái)到百度這個(gè)平臺(tái),傳統(tǒng)上來(lái)講,他用關(guān)鍵詞表達(dá)他的搜索需求,但是我們看到最近這兩年有一個(gè)趨勢(shì):第一,用戶需求表達(dá)越來(lái)越復(fù)雜,以前很多是搜索信息,現(xiàn)在很多是效勞的需求,這里面有很多復(fù)雜的語(yǔ)意來(lái)描述需求。第二,更多自然的方式表達(dá)你的需求。比方說(shuō)自然的語(yǔ)音、句子去問(wèn)問(wèn)題,比方說(shuō)在移動(dòng)終端上面用語(yǔ)音表達(dá)?,F(xiàn)在有的APP就是拍個(gè)照,小朋友幫助你做題。這種自然的表達(dá)方式是第二個(gè)趨勢(shì)。你用深度學(xué)習(xí)理解自然語(yǔ)言、語(yǔ)音識(shí)別、理解圖象變成是理解用戶的意圖。第二,你在理解了意圖以后,你需要連接用戶跟他需要的信息。你在信息、文章那一端需要有更好的理解,這個(gè)理解需要有更好的匹配。匹配用戶的需求,就是優(yōu)化搜索結(jié)果的智能排序。第三,精準(zhǔn)推送廣告和效勞。深度學(xué)習(xí)在每一個(gè)領(lǐng)域都發(fā)揮著重要的作用為什么深度學(xué)習(xí)在今天受到重視?第一點(diǎn),我覺(jué)得是一個(gè)很浪漫主義的原因,因?yàn)槲覀兛偸窃谙胛覀兊臋C(jī)器能不能復(fù)制人的智能,復(fù)制生物的智能。所以有一個(gè)觀點(diǎn)是,深度學(xué)習(xí)可能跟人腦的機(jī)理是有關(guān)系的。確實(shí)也是,最早期的去啟發(fā)做深度學(xué)習(xí)的研究,確實(shí)是受到人腦的啟發(fā)。第二點(diǎn),特別適合大數(shù)據(jù)。其實(shí)到今天,深度學(xué)習(xí)為什么重要的第一個(gè)原因是最不重要的,因?yàn)槟闳パ芯盔B(niǎo)類怎么飛行,跟我要造一個(gè)飛機(jī)是不一樣的事情。但對(duì)于我們來(lái)講,尤其對(duì)我們工業(yè)界來(lái)講,我們希望能夠造出智能的機(jī)器,他不是去再現(xiàn)人的智能,而是要利用大數(shù)據(jù)去延伸或者互補(bǔ)人的能力。第三,端到端的學(xué)習(xí)。過(guò)去做模式識(shí)別或者機(jī)器學(xué)習(xí)通常會(huì)分為兩步,第一,根據(jù)你對(duì)問(wèn)題的理解,人工的、人為的去做一些數(shù)據(jù)的預(yù)處理,這里面對(duì)人的要求是很高的,你需要非常精準(zhǔn)的對(duì)問(wèn)題進(jìn)行理解。但是你一旦換一個(gè)問(wèn)題,你需要重新去理解。深度學(xué)習(xí)把學(xué)習(xí)跟判定是連在一起的,前面不是人工的,它也是學(xué)習(xí),但是一個(gè)一氣呵成的從端到端的學(xué)習(xí),這個(gè)非常重要。因?yàn)樗屇氵@個(gè)學(xué)習(xí)更加智能,它可以讓你從一個(gè)領(lǐng)域遷移到另外一個(gè)領(lǐng)域,它可以減少人工帶來(lái)的不必要的麻煩。第四,提供一套建模語(yǔ)音。深度學(xué)習(xí),你不需要對(duì)問(wèn)題有很好的理解,這是一個(gè)錯(cuò)誤的觀點(diǎn)。因?yàn)樯疃葘W(xué)習(xí)跟我們?cè)跈C(jī)器學(xué)習(xí)里面的圖模型一樣,也是一套語(yǔ)言系統(tǒng),他讓你表達(dá)你對(duì)這個(gè)問(wèn)題的理解,如果你對(duì)這個(gè)問(wèn)題不理解,深度學(xué)習(xí)對(duì)你來(lái)講沒(méi)有用。在不同的問(wèn)題里面,我們需要開(kāi)發(fā)不同的深度學(xué)習(xí)的模型?;氐降谝粋€(gè)浪漫主義的觀點(diǎn),深度學(xué)習(xí)跟人腦的關(guān)系。計(jì)算機(jī)視覺(jué)里面一個(gè)很著名的深度學(xué)習(xí)的模型是卷積神經(jīng)網(wǎng)絡(luò)。他們做這個(gè)的時(shí)候受到一個(gè)模型的啟發(fā),這個(gè)模型80年代獲得諾貝爾醫(yī)學(xué)生理學(xué)獎(jiǎng)。他講的是視覺(jué)神經(jīng)系統(tǒng)早期在視覺(jué)皮層里面怎么樣處理視覺(jué)信息。用很多的圖像數(shù)據(jù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)能夠非常接近的表達(dá)視覺(jué)神經(jīng)系統(tǒng)的行為。每一層的神經(jīng)元是一個(gè)特征提取器,一個(gè)具體的神經(jīng)元對(duì)什么特征敏感,這里面講的是他對(duì)不同朝向的邊界敏感。更高一層,把下面這一層提取的結(jié)果,去組成更復(fù)雜的模式匹配。如果是兩條邊你結(jié)合在一起會(huì)形成一個(gè)物體的各個(gè)部位,比方說(shuō)鼻子的提取,再往下走,就更具有語(yǔ)意,他可以把下面的東西組成更加豐富的物體結(jié)構(gòu)。這里面他是一個(gè)從信號(hào)逐層抽象、逐層變換的過(guò)程。跟我們今天所了解的生物視覺(jué)系統(tǒng)是非常相關(guān)的。但根本上我們只是知道這個(gè)聯(lián)系,今天為止,我們做的很多的工作跟這個(gè)聯(lián)系并沒(méi)有太多的關(guān)系,也未受這個(gè)聯(lián)系的束縛。從另外一個(gè)觀點(diǎn)來(lái)講,從統(tǒng)計(jì)和計(jì)算方面來(lái)分享。在機(jī)器學(xué)習(xí)里面,我們關(guān)心的是推廣誤差,他不是看在現(xiàn)有數(shù)據(jù)集上面效果怎么樣,而是在未知的數(shù)據(jù)上,這個(gè)系統(tǒng)在訓(xùn)練的時(shí)候沒(méi)有看到的地方,叫推廣誤差。去年夏天,因?yàn)槲覀兗倚『⑹窃诿绹?guó)長(zhǎng)大,剛剛回來(lái),剛剛從一年級(jí)開(kāi)始學(xué)習(xí),中文不太好,他有一次考完試以后跟我講,考的不好,70幾分;第二天他特別快樂(lè)的跟我講,爸爸,我考了98分,我說(shuō)這太好了,一天之內(nèi)進(jìn)步這么快。他說(shuō)因?yàn)榻裉斓目碱}跟昨天是一樣的。這不能真實(shí)反響學(xué)習(xí)者的能力。推廣誤差要在你沒(méi)有見(jiàn)過(guò)的數(shù)據(jù)集上面衡量他的效果怎么樣。一個(gè)經(jīng)典的分析方法是把推廣誤差分析成兩局部,我們來(lái)看錯(cuò)誤源在什么地方。第一個(gè)叫Approximationerror,也就是假設(shè),沒(méi)有假設(shè)就沒(méi)有學(xué)習(xí),你在學(xué)習(xí)做推廣的時(shí)候就一定有假設(shè),你從推向未知,中間一定有一個(gè)結(jié)構(gòu)在里面。古代我們講近朱者赤,近墨者黑,這有一個(gè)相似性-如果是相似的物體具有相似的屬性。這里面隱含著函數(shù)平滑假設(shè),我們做一個(gè)假設(shè),通常反映在你的模型中間,所有的假設(shè)可能是錯(cuò)的。在統(tǒng)計(jì)學(xué)里面有一個(gè),假設(shè)不完美,你在假設(shè)空間里面一定能夠找到最完美的那個(gè)。第二個(gè)推廣來(lái)源是Estimationerror,這是來(lái)源于數(shù)據(jù)的不完美。你的訓(xùn)練數(shù)據(jù)和測(cè)試的數(shù)據(jù)來(lái)源分布不一樣。更多的時(shí)候是說(shuō)你的數(shù)據(jù)是有限樣本,如果你在有限樣本上面得到的估計(jì)量是不準(zhǔn)確的。因?yàn)槲覀兊墓烙?jì)量是在無(wú)限樣本里面去估計(jì)他。光分析這兩個(gè)東西是不夠的。通常來(lái)講,在統(tǒng)計(jì)學(xué)的范疇里去分析這兩個(gè)東西,統(tǒng)計(jì)學(xué)家關(guān)心的點(diǎn),跟計(jì)算機(jī)科學(xué)不太一樣。計(jì)算機(jī)科學(xué)關(guān)心的是,我今天跟老板申請(qǐng)五百臺(tái)機(jī)器,老板說(shuō)不行就五臺(tái)。你說(shuō)老板,給我五個(gè)機(jī)器,我要算兩個(gè)月搞定,老板說(shuō),你今天不搞定不能回家。所以是有限的資源下面去分析這個(gè)問(wèn)題,在資源的有限性上面,你要去分析這個(gè)問(wèn)題。這里面一般是求解的不完美,考慮計(jì)算的不完美。這里面給我們最近的機(jī)器學(xué)習(xí)提供了最近的誤差,我一開(kāi)始在機(jī)器學(xué)習(xí)上面右層的集成,最好的一層是20層。第二,大量的數(shù)據(jù),讓你在這上面經(jīng)驗(yàn)性的判斷接近你的期望值。第三,我要設(shè)計(jì)一個(gè)非常精巧的算法,求得一個(gè)非常完美的解,這個(gè)完美的解算法非常復(fù)雜。一個(gè)能用的算法,它得有比擬好的性質(zhì),讓你可以消化大的數(shù)據(jù)。把這三點(diǎn)都放在一起,大家可以理解,為什么在大數(shù)據(jù)的時(shí)代深度學(xué)習(xí)變得這么重要。我們看這兩個(gè)緯度,隨著數(shù)據(jù)規(guī)模的增長(zhǎng),效果是怎么樣的。傳統(tǒng)的人工智能算法可能由于這個(gè)模型的空間是有限的,復(fù)雜度不夠高,數(shù)據(jù)多了沒(méi)有用?;蛘吣愕乃惴ū旧聿荒芴幚泶髷?shù)據(jù),比方說(shuō)他的算法復(fù)雜度是數(shù)據(jù)量的三次方。一萬(wàn)個(gè)數(shù)據(jù)點(diǎn)你可以看懂,但是如果是十萬(wàn)個(gè)你就搞不定。但是深度學(xué)習(xí)算法,由于它的模型足夠的好,又能夠掌握主大數(shù)據(jù),所以他能夠不斷吸收數(shù)據(jù)紅利,去年百度首席科學(xué)家AndrewNg帶著團(tuán)隊(duì)在語(yǔ)音識(shí)別問(wèn)題上取得了重大進(jìn)展,把數(shù)據(jù)加到了幾萬(wàn)小時(shí),效果不斷的加強(qiáng)。如果你的商業(yè)模式能夠擁有這樣一個(gè)曲線,我要恭喜你,因?yàn)榇髷?shù)據(jù)真正成為商業(yè)壁壘。。第二,深度學(xué)習(xí)是一個(gè)靈活的建模語(yǔ)音。我們用不同的語(yǔ)音模型表達(dá)你的點(diǎn),比方說(shuō)圖象,因?yàn)樗莾删S的,用卷積神經(jīng)網(wǎng)絡(luò)更加適合。我們?nèi)ニ阉髡Z(yǔ)意相關(guān)性,傳統(tǒng)的做法是人工抽取很多特征,變成一個(gè)學(xué)習(xí)問(wèn)題,這里面完全是端到端的。我關(guān)心的是對(duì)于一個(gè)搜索的Query,我關(guān)心的是這兩個(gè)相關(guān)性,但是它絕對(duì)的相關(guān)程度我不關(guān)心。深度神經(jīng)網(wǎng)絡(luò)給你的是一個(gè)語(yǔ)言,讓你去表達(dá)你對(duì)問(wèn)題的理解。這是最近非常成功的一個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它叫Long—shorttermmemory,它最近取得很好的進(jìn)展:即在任何一個(gè)地方,時(shí)間跟歷史的相關(guān)性是變化的。比方說(shuō)自然語(yǔ)言處理,你如果碰到一個(gè)右符號(hào),你只要溯源到左符號(hào)那個(gè)地方,把中間所有的東西拿出來(lái)分析。根據(jù)你當(dāng)前所處的狀態(tài),你是應(yīng)該去找一個(gè)更長(zhǎng)的。你遇到一個(gè)句號(hào),你做語(yǔ)意理解的時(shí)候,你把過(guò)去歷史所有的都要清零。在時(shí)間面前,時(shí)間和歷史是不一樣的。這個(gè)模型比以前的模型更加的rich。我們?cè)谶^(guò)去做字符識(shí)別的時(shí)候,一般先把字符分成一個(gè)一個(gè)單的圖片,再識(shí)別它是什么東西,但是我們發(fā)現(xiàn)對(duì)于這樣的問(wèn)題是不可行的。在這種情況下,你可以做的是把整個(gè)字符序列放進(jìn)去,并希望輸出的是一個(gè)完整的字符序列?,F(xiàn)在在這些領(lǐng)域應(yīng)用都是最好的效果。用另外一個(gè)更加不同的神經(jīng)網(wǎng)絡(luò)表達(dá)我的問(wèn)題。我不是識(shí)別這個(gè)圖象里面有什么東西,而是述說(shuō)圖片的故事:下午的陽(yáng)光照在房間,有藍(lán)色的地毯和白色的沙發(fā)…今天我們用理解圖象的神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)很多非線性的變換,生成很多表達(dá)。他從這個(gè)詞生成一個(gè)圖象,再生成下一個(gè)詞,我希望這個(gè)句子跟圖象是有關(guān)的,使整個(gè)的語(yǔ)言也跟這個(gè)圖象有關(guān)。根據(jù)你對(duì)這個(gè)問(wèn)題的理解,神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)給你提供了一個(gè)非常豐富的符號(hào)語(yǔ)言系統(tǒng)讓你去表達(dá)你這個(gè)問(wèn)題應(yīng)該怎么搜索。還有很多其他的例子,用深度學(xué)習(xí)提高搜索的先進(jìn)性,用了深度學(xué)習(xí)以后,比沒(méi)有用深度學(xué)習(xí)有翻倍的提升,包括語(yǔ)音的系統(tǒng)。最近我們用的語(yǔ)音系統(tǒng),是一個(gè)真正的中文語(yǔ)音識(shí)別系統(tǒng),我們用幾萬(wàn)小時(shí)的聲音來(lái)訓(xùn)練它,在識(shí)別率上面有很大提升。大家看新聞可能看到了,我們?cè)谟⑽牡淖R(shí)別也是優(yōu)于我們的競(jìng)爭(zhēng)對(duì)手。這是另外一個(gè)很有意思的例子,很小的一個(gè)產(chǎn)品,但是它是人工智能很多技術(shù)在一起的綜合體系。這個(gè)是我的一個(gè)朋友,紐約大學(xué)的教授研發(fā)的,他到上海來(lái),去餐館看到這樣一個(gè)菜單,他拍照識(shí)別,有一個(gè)OCR,翻譯成英文,通過(guò)TTS就可以翻譯出來(lái)。在紐約你想找川菜館,他識(shí)別成中文,翻譯成英文,通過(guò)這個(gè)英文隨便給一個(gè)老外你問(wèn)他。這個(gè)東西正在成為現(xiàn)實(shí),中間的時(shí)延做的越來(lái)越好。這是百度作業(yè)幫,小朋友夏天玩的沒(méi)有時(shí)間做作業(yè)了,但快要開(kāi)學(xué)了怎么辦?如果我小時(shí)候有這個(gè)玩意兒,我會(huì)很開(kāi)心,因?yàn)槲矣懈嗟臅r(shí)間玩。當(dāng)然這個(gè)技術(shù)要善加利用,你可以去找到關(guān)鍵的識(shí)別點(diǎn)。這一度讓很多朋友玩的很high,每個(gè)小人物都有一個(gè)成明星的夢(mèng)想,我們就能滿足這樣的需求。我訪問(wèn)谷歌的時(shí)候,有個(gè)是做深度學(xué)習(xí)最有名的多倫多大學(xué)的教授,現(xiàn)在在谷歌工作。當(dāng)時(shí)他問(wèn)我,深度學(xué)習(xí)還能活五年嗎?我說(shuō)不能,他聽(tīng)了很沉悶。但是其中的思想是有價(jià)值的,比方說(shuō)分層次的思想,在非神經(jīng)網(wǎng)絡(luò)的系統(tǒng)和其他的系統(tǒng)都有作用。我們用深度學(xué)習(xí)做了這么好玩的東西,我們可以玩一玩,他說(shuō)好,來(lái)玩玩。他得到了這個(gè)結(jié)果非常開(kāi)心,立刻分享給他的老婆。最近我們團(tuán)隊(duì)有一個(gè)挺好的結(jié)果,去年Facebook在測(cè)試上面,得到世界上最好的結(jié)果97.35%,前幾天百度深度學(xué)習(xí)研究院得到了99.85%的成績(jī),終結(jié)了刷榜。常常我們會(huì)聽(tīng)說(shuō)到某一個(gè)團(tuán)隊(duì)在一個(gè)數(shù)據(jù)上面做到怎么樣的效果,怎么必須要客觀的看,那只是證明他在這個(gè)數(shù)據(jù)集上做的最好,不代表他把這個(gè)問(wèn)題給解決了,也不代表他的這個(gè)問(wèn)題就可用了。人臉識(shí)別,今天誰(shuí)要告訴你,說(shuō)人臉識(shí)別可以用來(lái)代替指紋識(shí)別,我告訴你,那肯定是忽悠,沒(méi)有到那個(gè)程度,但是終究有一天會(huì)做到的?;趫D象的理解,你可以做圖片搜索,他不光做視覺(jué)相似形的匹配,還有語(yǔ)意的匹配。這里的結(jié)果看起來(lái)都不錯(cuò),有一些細(xì)致的區(qū)別。這邊下面是倒影,是水,這邊看似是水,但是大局部是草坪、陸地,這邊的結(jié)果全都是倒影、都是水。很細(xì)致的不同。去年全球最好的物體檢測(cè)模型,他告訴你有這個(gè)頭盔,他也告訴你這個(gè)頭盔在什么地方,用一個(gè)框給框出來(lái)?;诖髷?shù)據(jù)的人工智能在過(guò)去幾年已經(jīng)發(fā)生了變化,我們靜態(tài)來(lái)看、把這幾年的進(jìn)展串在一起看,效果還是很驚人的。在這個(gè)分類中,2023年世界最好結(jié)果,錯(cuò)誤率接近30%。每一年不同的團(tuán)隊(duì)在這上面努力工作,每一年的錯(cuò)誤率非常驚人的在降低,朝著零趨勢(shì)開(kāi)展。2023年最好的結(jié)果是百度取得的--7%。斯坦福的學(xué)者人工做了一下比對(duì),他們發(fā)現(xiàn)人的識(shí)別率是5%,今年我們聽(tīng)到微軟和谷歌的朋友已經(jīng)做到大概3%、4%了。當(dāng)然也有一些誤導(dǎo),比方說(shuō)他能認(rèn)識(shí)六七種不同的青蛙,誰(shuí)能認(rèn)識(shí)那么多種不同的青蛙呢?人的能力還是有限的。過(guò)去的搜索引擎包括幾個(gè)環(huán)節(jié),數(shù)據(jù)信息的感知、處理、理解、學(xué)習(xí),到?jīng)Q策、行動(dòng)、創(chuàng)造,這是三個(gè)不同階段。過(guò)去我們主要是從互聯(lián)網(wǎng)上獲取這些信息,今天因?yàn)槭且苿?dòng)互聯(lián)網(wǎng),我們的效勞離人越來(lái)越近,所以你需要更多從人的數(shù)據(jù)里面獲取很多內(nèi)容。我們跟清華大學(xué)的朱勇武〔音〕老師有973的工程,從人,還有物理世界,物聯(lián)網(wǎng)〔上面有各種各樣的傳感器,里面有一種重要的傳感器是GPS,對(duì)物理世界的感知〕,這些緯度都變得越來(lái)越重要。相反,互聯(lián)網(wǎng)上的數(shù)據(jù)以前是唯一,現(xiàn)在只是其中的一個(gè)信息來(lái)源。把這些信息都獲取,我們也需要去向更加先進(jìn)的人機(jī)交互的領(lǐng)域開(kāi)展。比方說(shuō)更加先進(jìn)的傳感器,我們現(xiàn)在在做3D建模,它是自動(dòng)駕駛很重要的一個(gè)方面。因?yàn)檐?chē)在什么地方可以走,什么地方不能走,哪個(gè)地方是主道,哪個(gè)地方是輔道…要不然這個(gè)車(chē)不知道怎么走。以前傳統(tǒng)的互聯(lián)網(wǎng)的信息分析以后,我們通常去做預(yù)測(cè)、廣告、搜索.但是今天,我們不光是在數(shù)字世界里面去做一些事情,我們是不是也在物理世界做一些事情。有一位專家說(shuō)的很好,清華大學(xué)張?jiān)菏空f(shuō),機(jī)器人是互聯(lián)網(wǎng)效勞的最后一公里。比方說(shuō)今天你在網(wǎng)上預(yù)定一個(gè)比薩,那邊有人讀到了這個(gè)信息,他來(lái)給你做這個(gè)比薩;某個(gè)人辛辛苦苦把這個(gè)比薩送過(guò)來(lái)…這里面有很多環(huán)節(jié)可以去優(yōu)化。比方說(shuō)這個(gè)比薩是不是真的做的非常的個(gè)性化,是不是非常符合你的口味?比方說(shuō)今天我們?cè)谝苿?dòng)互聯(lián)網(wǎng)上對(duì)每個(gè)用戶的畫(huà)像,可以做幾十萬(wàn)個(gè)來(lái)描述你的興趣。將來(lái)的這個(gè)比薩會(huì)做的非常的個(gè)性化。加多少胡椒粉都是針對(duì)你的口味,可以做到千人千面,可以讓每個(gè)人都感覺(jué)是VIP。到底誰(shuí)能做這件事情?機(jī)器人。因?yàn)樗堰@些數(shù)據(jù)瞬間讀到他的數(shù)據(jù)庫(kù)里面。誰(shuí)來(lái)最高效的把這個(gè)效勞最后完成,送到你家里來(lái)?機(jī)器人。張華院士說(shuō)機(jī)器人是互聯(lián)網(wǎng)效勞的最后一公里,很有道理,很深刻。當(dāng)然人工智能還有一個(gè)很高的層次就是探索和發(fā)現(xiàn)。去探索過(guò)去沒(méi)有的東西,3D打印在這里面扮演一個(gè)東西,他把一個(gè)計(jì)算的結(jié)果變成一個(gè)物理的現(xiàn)實(shí)。計(jì)算是沒(méi)有邊界的,計(jì)算生成的結(jié)果根本上也是沒(méi)有任何的邊界,所以他可以生成任何的東西,3D打印就可以幫助他實(shí)現(xiàn)。將來(lái)的智能延伸到物理世界里面去創(chuàng)造以前從來(lái)沒(méi)有過(guò)的東西,這是一個(gè)可以預(yù)見(jiàn)的未來(lái)。今天對(duì)網(wǎng)絡(luò)模型的規(guī)模有不斷的追求,我經(jīng)常可以聽(tīng)到某某單位可以實(shí)現(xiàn)超大規(guī)模的神經(jīng)網(wǎng)絡(luò),這里面可以稍微做一些類比,我們可以看到不同物種的變化是很大的。但是如果你看他們的變化之間平均的連接,他們的區(qū)別其實(shí)沒(méi)有那么大。我們發(fā)現(xiàn)更高層次的智慧物種,他有更大規(guī)模的神經(jīng)網(wǎng)絡(luò),但是他的網(wǎng)絡(luò)連接是稀疏的。你的物種不斷增多,你的連接卻沒(méi)有變化,所以他一定是越來(lái)越稀疏的。這對(duì)我們是有一些啟發(fā)的。今天我們來(lái)比擬一下人類大腦跟Supercomputer。人的大腦一般是1.5KG,2%的位置,但是它要消耗我們2%的能量,所以腦子是很消耗能量的。為什么中午會(huì)犯困,因?yàn)槟愠燥堃院笱憾嫉较览锩嫒チ?。某某朋友一天非常集中的做一件事情,最后?huì)累的虛脫,哪怕他沒(méi)有怎么動(dòng)就是這個(gè)原因。我們的大腦有一千億個(gè)neurons,每個(gè)數(shù)理有5000個(gè)神經(jīng)原,每一個(gè)連接是200次/秒。我們大腦的計(jì)算能力是10的17次方。它是一個(gè)非常高效的計(jì)算,每瓦能量完成的計(jì)算量是5個(gè)Gliops。跟中國(guó)的天河二號(hào)比擬一下,它現(xiàn)在的計(jì)算能力還沒(méi)有到達(dá)人腦計(jì)算的一半,它現(xiàn)在是34個(gè)petaliops,它的計(jì)算效率是每瓦2.14Gliops。這是我們和清華大學(xué)做的一個(gè)工程,它是真正的自行車(chē),以前我們見(jiàn)到的自行車(chē)都是假的自行車(chē),因?yàn)樗皇亲孕?。我們?cè)谧鲞@個(gè)工程的時(shí)候有一些思考,這個(gè)思考就是人跟車(chē)的關(guān)系,我們覺(jué)得它未來(lái)是人跟馬的關(guān)系,是朋友。如果你養(yǎng)一匹馬,很親以后,它跟你有一個(gè)交流,它也是懂你的,它也有自己的想法。這是我們?cè)诎俣茸龅淖詣?dòng)駕駛工程。我們不把它叫做無(wú)人駕駛,我們叫做“高度自動(dòng)駕駛〞工程。首先這是一個(gè)非常典型的機(jī)器人工程,一個(gè)自動(dòng)駕駛的車(chē),裝了這么多的傳感器。這個(gè)車(chē)的后背箱堆滿了效勞器。感知、理解、決策控制,車(chē)的計(jì)算要直接控制、操控這個(gè)車(chē)物理的東西。這里面中國(guó)跟國(guó)外還有一些差距,首先要實(shí)現(xiàn)線控,中國(guó)絕大局部的車(chē)都不是線控。我們做自動(dòng)駕駛,你要控制剎車(chē),怎么控制?不是一個(gè)接口、一個(gè)計(jì)算機(jī)寫(xiě)進(jìn)去,他是一個(gè)大的鐵桿子、這邊裝了馬達(dá),鐵桿子踩在剎車(chē)上。我們跟寶馬合作,是因?yàn)樗峁┚€控的技術(shù)。這個(gè)車(chē)我們叫做小紅,小紅,大白,這是我們改裝的第一輛車(chē),第二輛、第三輛。首先是對(duì)道路的感知,這里是三維高精度的感知。對(duì)車(chē)的定位要能夠做到厘米量級(jí)的定位。這里面需要一些相當(dāng)?shù)膫鞲衅骷夹g(shù)、機(jī)器人技術(shù)。這個(gè)是在G7上面采用的。大家看到劃的很高,因?yàn)槲覀兪侨S的東西,很容易劃的很高,都是計(jì)算出來(lái)的。我們對(duì)車(chē)整合動(dòng)力學(xué)的系統(tǒng)建了這個(gè)模型做仿真,在路上走我們要做模擬的仿真,模擬仿真做的差不多以后,我們?cè)賹?shí)際的去調(diào)試。自動(dòng)駕駛要飛入尋常百姓家,關(guān)鍵是你要用低本錢(qián)的傳感器實(shí)現(xiàn)很強(qiáng)的智能感知能力。谷歌自動(dòng)駕駛有一個(gè)很?chē)?yán)重的問(wèn)題,他用的傳感器比車(chē)本身都貴。他的傳感器要70萬(wàn)人民幣。但是我們要突破一個(gè)技術(shù),就是怎么讓低本錢(qián)的傳感器大規(guī)模的應(yīng)用。這是我們做的是基于圖象的實(shí)時(shí)道路場(chǎng)景理解。比方說(shuō)識(shí)別道路上的汽車(chē),在這件事情上我們真的做的比別人好。這個(gè)藍(lán)色的點(diǎn)是我們的標(biāo)注人員做的。這些車(chē)是疊著排在路邊,人在標(biāo)注的時(shí)候不容易精確的說(shuō)這輛車(chē)、這輛車(chē)、這輛車(chē),不容易看清。這個(gè)地方陰影的遮擋。有一輛車(chē)在這里,被一個(gè)交通標(biāo)志遮擋起來(lái)了,人不容易看到,但是目前我們的算法能夠做到這樣的水平。最后看一下我們對(duì)自動(dòng)駕駛開(kāi)展路徑的看法。為什么我們不認(rèn)為我們要做的是無(wú)人駕駛?真正的無(wú)人駕駛要實(shí)現(xiàn),還有一個(gè)相當(dāng)長(zhǎng)的路徑,除了技術(shù)的能力以外,還有政府的政策法規(guī),還有根底建設(shè),還有保險(xiǎn)公司怎么判定這個(gè)問(wèn)題,出了問(wèn)題到底是誰(shuí)的錯(cuò),這些事情已經(jīng)遠(yuǎn)超技術(shù)本身,還有倫理的問(wèn)題。真正到無(wú)人駕駛,你要經(jīng)歷幾個(gè)階段:第一階段,輔助駕駛。第二,主動(dòng)駕駛。第三,特定條件下的自動(dòng)駕駛。第四,高度的自動(dòng)化駕駛。比方說(shuō)輔助駕駛,當(dāng)前這個(gè)階段是一個(gè)輔助駕駛的階段,因?yàn)檫@個(gè)車(chē)告訴你哪邊有車(chē),哪邊有人,如果要出事故,他會(huì)提醒你。輔助駕駛告訴你檢測(cè)的結(jié)果,他不控制這個(gè)車(chē)??刂七@個(gè)車(chē)變成了主動(dòng)駕駛。特定環(huán)境下面,很多的車(chē)廠跟我們一樣都認(rèn)為在特定的場(chǎng)景,像某些高速公路,在兩到三年的時(shí)間里面會(huì)實(shí)現(xiàn)智能的自適應(yīng)巡航?,F(xiàn)在車(chē)的巡航只是保持速度,如果前面的車(chē)并道過(guò)來(lái)了,你是不是會(huì)做一些改變,或者減低車(chē)速,現(xiàn)在的車(chē)做不到。如果這個(gè)車(chē)本身在巡航狀態(tài),他是不停在拐彎的,你會(huì)不會(huì)車(chē)道跟隨?這個(gè)會(huì)最先實(shí)現(xiàn)。在某些比擬先進(jìn)的地方,你到了賓館,車(chē)就不用管了。將來(lái)這個(gè)車(chē)是自動(dòng)駕駛的,他把你的車(chē)移到那個(gè)地方。或者在一個(gè)大型的物流中心,或者在一個(gè)礦山里面,他是一個(gè)自動(dòng)駕駛。最后到高度的自動(dòng)駕駛。人車(chē)一體,人不能放棄對(duì)車(chē)的控制,就像現(xiàn)在的飛機(jī)一樣,飛機(jī)在空中的很多時(shí)候它是自動(dòng)駕駛的狀態(tài),你喝杯咖啡沒(méi)有問(wèn)題,但是任何時(shí)候你要重新恢復(fù)你的控制,你可以做到。因?yàn)槿藢?duì)這個(gè)事情負(fù)責(zé)。關(guān)于人和機(jī)器的關(guān)系,從我自己親身經(jīng)歷的例子來(lái)說(shuō)。我們過(guò)去的團(tuán)隊(duì)在兩年前做過(guò)兩個(gè)事情,一個(gè)事情是讓你自己照的照片找一個(gè)長(zhǎng)的最像的明星。還有一個(gè)是你拍一個(gè)照,理解了以后,生成一首詩(shī)。這里面涉及到計(jì)算機(jī)視覺(jué),涉及到自然語(yǔ)言。但是從市場(chǎng)的反響來(lái)講,你們可以想象到,哪個(gè)更受歡送?因?yàn)檫@跟每個(gè)人都相關(guān),每個(gè)普通人都有一個(gè)想當(dāng)大明星的夢(mèng)想,哪怕是一個(gè)虛幻,至少是這個(gè)產(chǎn)品跟每個(gè)用戶之間的關(guān)聯(lián)。拍照寫(xiě)詩(shī)為什么不受歡送?因?yàn)樗莝howoff,他是秀百度的機(jī)器有多牛,不是秀我多牛。這里面有一個(gè)我們的思考,機(jī)器往前,我們回到人工智能的原點(diǎn),這個(gè)原點(diǎn)叫圖靈測(cè)試,圖靈測(cè)試一直在指導(dǎo)人工智能研究的方向,他的目的是研究這個(gè)智能的機(jī)器能夠取代人。圖靈測(cè)試就是如果拿一個(gè)布檔著,這邊是機(jī)器還是人我就不知道了。我們下國(guó)際象棋,目前他是PASS了圖靈測(cè)試的。這種導(dǎo)致了你的做法,你不斷研究跟人可以PK的機(jī)器,這是不是我們真正想做的,是不是真正的方向。站在今天可以去思考。我剛剛講到了象棋,IBM的深藍(lán)有一個(gè)劃時(shí)代的成果,它做的比最好的象棋冠軍能力還好,看似這樣一個(gè)偉大的科技進(jìn)展,它其實(shí)沒(méi)有給IBM帶來(lái)任何的價(jià)值,沒(méi)有給這個(gè)社會(huì)產(chǎn)生任何的影響,也沒(méi)有使這個(gè)社會(huì)變得更加美好。為什么?因?yàn)樗鼰o(wú)非是造一個(gè)跟人能力差不多可以PK的機(jī)器。我們看另外一個(gè)東西,搜索引擎,無(wú)論是谷歌還是百度,它這個(gè)技術(shù)不完美,因?yàn)槲覀兝硐氲募夹g(shù)是能夠給他扔一個(gè)問(wèn)題,他能夠自動(dòng)尋找問(wèn)題的答案。他做的不完美,他是扔一堆排序的結(jié)果,你自己搞清楚。但是他對(duì)這個(gè)社會(huì)產(chǎn)生了巨大的影響。他能讓北京清華附小一個(gè)家庭環(huán)境非常優(yōu)越的小孩子跟一個(gè)鄉(xiāng)村里面的小孩子,只要有網(wǎng)絡(luò)的情況下,獲取知識(shí)、獲取信息的能力是一樣的。他是因?yàn)槌删土嗣總€(gè)人,讓每一個(gè)普通的人更有知識(shí),他獲得信息,能夠做更加明智的判斷,這個(gè)事情跟這個(gè)社會(huì)的大需求發(fā)生了共振,產(chǎn)生了巨大的影響。我們思考自動(dòng)駕駛也是這樣,我們是要去思考、去做真正的替代人去駕駛的,還是去做車(chē)成就人的,還是你可以獲取更大的自由。谷歌的這個(gè)車(chē)一開(kāi)始是沒(méi)有方向盤(pán)的。這個(gè)車(chē)真的是你想要的嗎?最近他們把方向盤(pán)加上去了。我們希望車(chē)跟人的關(guān)系,就像人跟馬的關(guān)系一樣。你在萬(wàn)馬奔騰的環(huán)境里面,你騎著這個(gè)馬,你不需要特別細(xì)微的控制這個(gè)馬,它自己知道怎么走,避障,跟周?chē)鸟R協(xié)調(diào)距離,你要把握大方向。你甚至在馬上面如果打瞌睡,馬也可以帶著你走,你什么時(shí)候想要控制它,你是可以控制的。自動(dòng)駕駛是要構(gòu)建人車(chē)一體、以人為主的駕駛環(huán)境。最后,我覺(jué)得什么是一個(gè)偉大的技術(shù)?它不在于讓機(jī)器更偉大,它的偉大之處,是讓每個(gè)平凡的人更有創(chuàng)造力、更加自我、更偉大。這是人工智能和技術(shù)開(kāi)展的方向。世界是我們的,也是機(jī)器人的,但是歸根到底是屬于會(huì)控制機(jī)器人的人的。謝謝大家!提問(wèn)環(huán)節(jié)提問(wèn)1:借用張?jiān)菏空f(shuō)的最后一公里,前面在你的思路中,什么是最先一公里?最先一公里和最后一公里是什么關(guān)系?余凱:信息的搜集、整理是目前來(lái)講先要去做的。提問(wèn)2:假設(shè)我們可以確定機(jī)器智能的開(kāi)展一定會(huì)威脅人的生存,機(jī)器超過(guò)人的時(shí)候,一個(gè)很?chē)?yán)重的問(wèn)題就是人沒(méi)有用了。余凱:首先,我們現(xiàn)在太早去思考這個(gè)問(wèn)題了,因?yàn)槲覀儸F(xiàn)在離那個(gè)階段還非常遠(yuǎn)。第二,我不認(rèn)為將來(lái)機(jī)器會(huì)超過(guò)人或者駕馭人。他應(yīng)該還是人的工具。我覺(jué)得它在很多能力方面是超過(guò)我們,但是最后它還是受人的駕馭。有一點(diǎn)是:機(jī)器人沒(méi)有好奇心。我現(xiàn)在想不到讓一個(gè)計(jì)算模型具有對(duì)未知世界探索的好奇心。因?yàn)槿巳ヌ剿魑粗澜绾闷?,不斷的拓展知識(shí)的邊界,機(jī)器人是去執(zhí)行我們的想法。提問(wèn)3:我正在寫(xiě)一篇文章,這一篇文章的一個(gè)觀點(diǎn)是,當(dāng)機(jī)器要保證自己不斷電的情況下,沒(méi)有人的參與,它會(huì)不會(huì)有好奇心?余凱:會(huì)不會(huì)有好奇心我就不知道了。這種哲學(xué)討論我們可以永遠(yuǎn)討論。因?yàn)槟且惶鞗](méi)有到來(lái)之前,我們可以不斷的去猜想。我的觀點(diǎn),我們想做對(duì)社會(huì)有用的東西。提問(wèn)4:剛剛余博士介紹很多沖動(dòng)人心的人工智能方面的成果??墒俏覀儸F(xiàn)在去看應(yīng)用層面,包括剛剛介紹很多百度的應(yīng)用,好玩但是不實(shí)用,比方說(shuō)魔圖、百度拍植物,都不實(shí)用,或者是一個(gè)輔助性。余博士的角度看,在應(yīng)用層面,出現(xiàn)一個(gè)endto-end的應(yīng)用可能會(huì)出現(xiàn)哪一個(gè)領(lǐng)域?余凱:這些人工智能的技術(shù)對(duì)于現(xiàn)實(shí)商業(yè)的影響其實(shí)是巨大的。因?yàn)榻裉斓恼麄€(gè)搜索、廣告系統(tǒng)、電子商務(wù)、大數(shù)據(jù)金融,這些技術(shù)在這里面,你有和沒(méi)有,是生和死的問(wèn)題,不是錦上添花的事情。但是那些好玩的事情,他自己也在不斷的演進(jìn)。我們講的圖象識(shí)別,大家有沒(méi)有聽(tīng)說(shuō)過(guò)MobilEye?這家公司就是做車(chē)輛和行人識(shí)別感知系統(tǒng),它現(xiàn)在做到很大。還有一個(gè)大數(shù)據(jù)公司叫Palentir,他就是人工智能大數(shù)據(jù)的方法用在國(guó)家平安領(lǐng)域,他現(xiàn)在是一百多億美金的估值。近期來(lái)講,你總會(huì)覺(jué)得技術(shù)開(kāi)展比你想象的要慢。近期大家總是高估技術(shù)對(duì)人類的影響,但是在十年的時(shí)間里面,你一定是低估技術(shù)對(duì)你生活的影響。提問(wèn)5:在您的演講里面有一個(gè)細(xì)節(jié),您跟Hinton教授談的時(shí)候,說(shuō)這一波深度學(xué)習(xí)浪潮很快就過(guò)去了。在五年之后,在深度學(xué)習(xí)之后是什么樣的開(kāi)展方向,什么樣的技術(shù)引領(lǐng)下一個(gè)開(kāi)展方向?余凱:在某一個(gè)方面做的事情,特別是計(jì)算機(jī)科學(xué),常常是自己埋葬自己。很多年前,計(jì)算機(jī)體系結(jié)構(gòu),現(xiàn)在做的時(shí)候它不是一個(gè)你要探索的學(xué)科。深度學(xué)習(xí)一定會(huì)成為一個(gè)非常俗氣的東西,每個(gè)人都會(huì)用。至于未來(lái)的方向,我不能講太遠(yuǎn)、太哲學(xué)的,我更愿意講現(xiàn)實(shí)的?,F(xiàn)實(shí)來(lái)講,自然語(yǔ)言理解是一個(gè)非常重要的方向,期待一個(gè)突破性的進(jìn)展。提問(wèn)6:我是電子系的學(xué)生,深度學(xué)習(xí)的算法用在硬件上面,您覺(jué)得這方面的潛力大嗎?余凱:這個(gè)會(huì)非常有潛力,因?yàn)榘堰@些智能的算法用在硬件里面,可以放進(jìn)各種智能設(shè)備中,這是我很期待的方向。提問(wèn)7

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論