大數(shù)據(jù)與人工智能_第1頁
大數(shù)據(jù)與人工智能_第2頁
大數(shù)據(jù)與人工智能_第3頁
大數(shù)據(jù)與人工智能_第4頁
大數(shù)據(jù)與人工智能_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)與人工智能數(shù)據(jù)科學(xué)已經(jīng)在決策科學(xué)、社會科學(xué)、經(jīng)濟(jì)學(xué)里面扮演越來越重要的角色,所以這種交叉融合,這種碰撞對我們每一個(gè)人來講都是學(xué)習(xí)的時(shí)機(jī),也是一些施展才華的空間。最近在各個(gè)場合有一些分享,今天我尤其要把這個(gè)講座做好。今天是我兒子第一次坐在下面聽我的講座。過去我們做的這些工作是跟數(shù)據(jù)有關(guān)系的。一個(gè)大數(shù)據(jù)、一個(gè)人工智能,這兩個(gè)放在一起,今天很多的企業(yè)會這么重視,在這里給大家分享一下我們自己的故事。百度在過去兩年多的時(shí)間里面,在人工智能領(lǐng)域有很多技術(shù)方面的投入。今年李彥宏在兩會上提出中國大腦,很受關(guān)注;麻省理工學(xué)院科技評論雜志去年專門發(fā)表了一篇評論性文章,介紹百度的人工智能之夢。在國外主流的科技雜志里面報(bào)道一個(gè)中國企業(yè)的科技研發(fā),還是比擬少的。我自己感到非常的振奮。百度的背景,和很多的互聯(lián)網(wǎng)公司都是一樣的,從技術(shù)的緯度來講,他本質(zhì)上是一個(gè)基于大數(shù)據(jù)的人工智能公司。我們是提供一個(gè)搜索引擎,這個(gè)搜索引擎下面有一個(gè)非常精致的結(jié)構(gòu),它可以搜索到各種信息、知識,而且效勞是完全免費(fèi)的、給用戶帶來價(jià)值的。但是我們獲得了了大量的搜索行為數(shù)據(jù),并實(shí)現(xiàn)它的商業(yè)價(jià)值,就得通過廣告、推送效勞。從數(shù)據(jù)到價(jià)值,這中間就需要大量的技術(shù),尤其是基于大數(shù)據(jù)的人工智能技術(shù),包括機(jī)器學(xué)習(xí),自然語言處理,語音識別,圖像識別。最近在全社會,無論是在中國還是美國,還是科技媒體,還是研究機(jī)構(gòu),還是商業(yè)公司,都在談自動駕駛、機(jī)器人、物聯(lián)網(wǎng)、個(gè)性化、VR、AR。其實(shí)這些都是AI的各個(gè)領(lǐng)域,現(xiàn)在AI已經(jīng)成為科技創(chuàng)新的主戰(zhàn)場,它不光是未來時(shí),而且是現(xiàn)在進(jìn)行時(shí)。我們看電影《超能陸戰(zhàn)隊(duì)》,看似是未來的東西,但是今天很多領(lǐng)域正在發(fā)生,也在產(chǎn)生價(jià)值。到底什么是人工智能?嚴(yán)肅的科學(xué)定義到今天為止,沒有一個(gè)廣泛接受的定義。比方說,有一種說法叫強(qiáng)人工智能,有一種說法叫弱人工智能,還有基于符號邏輯的、也有基于統(tǒng)計(jì)模型的,有不同的觀點(diǎn)。拋開這些不同的觀點(diǎn),通常一個(gè)人工智能系統(tǒng)有這樣幾個(gè)方面:第一,我們希望這個(gè)系統(tǒng)具有感知的能力,就像人一樣,有五官,可以感知周圍的環(huán)境是什么樣的。第二,獲取這個(gè)感知以后,對面臨的環(huán)境有一個(gè)理解。比方說對于一個(gè)機(jī)器人來講,他在感知到這個(gè)環(huán)境以后,如果想到后面去跟一個(gè)同學(xué)聊天,他需要尋找最正確路徑。他必須要理解,那條路是走不通的,那條是可以走的。第三,在理解的根底上做出決策,從而達(dá)成目的或完成任務(wù)一個(gè)機(jī)器要感知,然后理解,然后決策,這是一個(gè)過程。今天在市場上面無處不在充滿著智能產(chǎn)品:智能湯勺、智能水杯等等。我們把一個(gè)老式的收音機(jī)和智能設(shè)備放在一起比擬,他們有什么不同?區(qū)別一個(gè)系統(tǒng)、一個(gè)產(chǎn)品是不是真的具有智能的能力,有一個(gè)很重要的緯度,就是這個(gè)系統(tǒng)能不能隨著用戶用它的次數(shù)越來越多,它變得越來越聰明,它是不是真的隨著經(jīng)驗(yàn)積累在不斷的演化。如果它是這樣的,它就是一個(gè)能夠自我學(xué)習(xí)、自我進(jìn)化、自我演化的、智能的系統(tǒng)。所以,學(xué)習(xí)能力是智能的本質(zhì)屬性之一。在座有的年紀(jì)跟我相仿,在小學(xué)的時(shí)候有過一篇課文,講的是一個(gè)科學(xué)巨匠做小板凳的故事,他做的那個(gè)板凳非常的丑陋,但是我們能不能說這個(gè)小朋友不聰明?如果你看他過去幾天做的每一個(gè)小板凳,他一個(gè)比一個(gè)做的好,他具有不斷的從經(jīng)驗(yàn)里面去學(xué)習(xí)的能力,使我們發(fā)現(xiàn)這個(gè)小朋友是非常具有智慧的。你看一個(gè)系統(tǒng)今天的能力不是最重要的,最重要的是它的增長曲線,隨著大數(shù)據(jù)不斷增加,不斷去使用這個(gè)系統(tǒng),它能變得越來越聰明。這里面我提到了經(jīng)驗(yàn)。經(jīng)驗(yàn)就是數(shù)據(jù),數(shù)據(jù)就是經(jīng)驗(yàn)。我們在機(jī)器學(xué)習(xí)里面有一個(gè)詞叫經(jīng)驗(yàn)數(shù)據(jù)。隨著經(jīng)驗(yàn)演化,就是隨著數(shù)據(jù)的不斷增長,增長你的能力。為什么我們迎來一個(gè)大數(shù)據(jù)的時(shí)代?因?yàn)閺腜C互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),帶來了一個(gè)數(shù)據(jù)的爆增,在我們?nèi)粘I罾锩?,每一個(gè)人都在奉獻(xiàn)著大量的數(shù)據(jù)。這樣一個(gè)場景,是在圣彼得教堂門口的廣場上面,很多人來等待教皇選舉結(jié)果。在八年以后,在同樣一個(gè)地方,可能是同樣一群人,同樣的故事仍在上演。但從一個(gè)緯度來看,移動互聯(lián)網(wǎng)在改變每個(gè)人的生活,每個(gè)人的手持設(shè)備在跟著你,它無時(shí)不刻的在產(chǎn)生數(shù)據(jù)。今天,每個(gè)人身上連著兩到三個(gè)移動設(shè)備,比方說、iPad,這樣一個(gè)趨勢往前演進(jìn),人機(jī)交互是指在這個(gè)環(huán)境里面有無數(shù)個(gè)設(shè)備跟你感知、交互?,F(xiàn)在手表也已經(jīng)是一個(gè)智能終端了??偟膩砜矗唧w的趨勢是我們將進(jìn)入一個(gè)萬物互聯(lián)的時(shí)代。隨之帶來的是每個(gè)你的設(shè)備都會記錄你的數(shù)據(jù),人跟設(shè)備的連接,人跟人的連接,物與物的連接,設(shè)備與設(shè)備的連接都在產(chǎn)生數(shù)據(jù)。所以,這是一個(gè)時(shí)機(jī),萬物互聯(lián)將形成大量數(shù)據(jù)無處不在的生態(tài),給我們帶來的時(shí)機(jī)就是智能化時(shí)代的來臨。2023年,我們突然看到那么多科幻的電影,那么多人在討論這樣那樣的,包括習(xí)總書記也在院士大會上談到機(jī)器人。所以這不是偶然,這有一個(gè)時(shí)代的背景。在大數(shù)據(jù)的時(shí)代,智能變得越來越重要。有一個(gè)技術(shù),最近很多研究機(jī)構(gòu),包括公司都有很大的投入,這個(gè)技術(shù)就叫深度學(xué)習(xí)。深度學(xué)習(xí)為什么會在這個(gè)時(shí)代這么受大家的關(guān)注?谷歌、微軟、Facebook都有專門的研究團(tuán)隊(duì),F(xiàn)acebook2023年9月份第一次成立了研究院。今天很多中國的互聯(lián)網(wǎng)公司都成立了這樣的研究院。百度在這方面做了很多的工作,其中一個(gè)表現(xiàn)就是百度大腦工程,這個(gè)工程是一個(gè)有著上千臺效勞器,包括PC效勞器和GPU效勞器的大規(guī)模數(shù)據(jù)處理系統(tǒng)。去年我講的是百億級的產(chǎn)品,世界上最大級的深度神經(jīng)網(wǎng)絡(luò),最近我們把它升級到千億級的系統(tǒng)?;谶@樣一個(gè)工程的能力,我們能夠去開發(fā)各種各樣深度學(xué)習(xí)的算法,用在語音、圖象、自然語音理解、廣告的用戶匹配、用戶的建模等等。百度大腦目前最成功、最重要的四個(gè)利用的領(lǐng)域:第一,搜索。我們用深度學(xué)習(xí)作用在自然語音、文本、網(wǎng)絡(luò)的語意上面,去衡量他們語意的相關(guān)性。第二,廣告。因?yàn)閺V告是要智能的匹配,因?yàn)槿绻@個(gè)廣告不被用戶點(diǎn)擊,我們掙不到錢。第三,圖象。包括今天李彥宏講到了自動駕駛,自動駕駛里面圖像技術(shù)是非常重要的。第四,語音識別和理解。最近這幾年業(yè)界取得的進(jìn)展,包括百度做的工作。語音識別在三十年的時(shí)間里面是一個(gè)進(jìn)展非常緩慢的領(lǐng)域。但是最近三四年時(shí)間里有一個(gè)突飛猛進(jìn)的進(jìn)展,原因的核心就是基于大數(shù)據(jù)的深度學(xué)習(xí)技術(shù)。這些應(yīng)用領(lǐng)域在業(yè)務(wù)結(jié)構(gòu)里面扮演什么樣的角色?它怎么把這些事情串起來為公司的核心業(yè)務(wù)產(chǎn)生影響。第一,理解意圖。比方說我們的用戶來到百度這個(gè)平臺,傳統(tǒng)上來講,他用關(guān)鍵詞表達(dá)他的搜索需求,但是我們看到最近這兩年有一個(gè)趨勢:第一,用戶需求表達(dá)越來越復(fù)雜,以前很多是搜索信息,現(xiàn)在很多是效勞的需求,這里面有很多復(fù)雜的語意來描述需求。第二,更多自然的方式表達(dá)你的需求。比方說自然的語音、句子去問問題,比方說在移動終端上面用語音表達(dá)?,F(xiàn)在有的APP就是拍個(gè)照,小朋友幫助你做題。這種自然的表達(dá)方式是第二個(gè)趨勢。你用深度學(xué)習(xí)理解自然語言、語音識別、理解圖象變成是理解用戶的意圖。第二,你在理解了意圖以后,你需要連接用戶跟他需要的信息。你在信息、文章那一端需要有更好的理解,這個(gè)理解需要有更好的匹配。匹配用戶的需求,就是優(yōu)化搜索結(jié)果的智能排序。第三,精準(zhǔn)推送廣告和效勞。深度學(xué)習(xí)在每一個(gè)領(lǐng)域都發(fā)揮著重要的作用為什么深度學(xué)習(xí)在今天受到重視?第一點(diǎn),我覺得是一個(gè)很浪漫主義的原因,因?yàn)槲覀兛偸窃谙胛覀兊臋C(jī)器能不能復(fù)制人的智能,復(fù)制生物的智能。所以有一個(gè)觀點(diǎn)是,深度學(xué)習(xí)可能跟人腦的機(jī)理是有關(guān)系的。確實(shí)也是,最早期的去啟發(fā)做深度學(xué)習(xí)的研究,確實(shí)是受到人腦的啟發(fā)。第二點(diǎn),特別適合大數(shù)據(jù)。其實(shí)到今天,深度學(xué)習(xí)為什么重要的第一個(gè)原因是最不重要的,因?yàn)槟闳パ芯盔B類怎么飛行,跟我要造一個(gè)飛機(jī)是不一樣的事情。但對于我們來講,尤其對我們工業(yè)界來講,我們希望能夠造出智能的機(jī)器,他不是去再現(xiàn)人的智能,而是要利用大數(shù)據(jù)去延伸或者互補(bǔ)人的能力。第三,端到端的學(xué)習(xí)。過去做模式識別或者機(jī)器學(xué)習(xí)通常會分為兩步,第一,根據(jù)你對問題的理解,人工的、人為的去做一些數(shù)據(jù)的預(yù)處理,這里面對人的要求是很高的,你需要非常精準(zhǔn)的對問題進(jìn)行理解。但是你一旦換一個(gè)問題,你需要重新去理解。深度學(xué)習(xí)把學(xué)習(xí)跟判定是連在一起的,前面不是人工的,它也是學(xué)習(xí),但是一個(gè)一氣呵成的從端到端的學(xué)習(xí),這個(gè)非常重要。因?yàn)樗屇氵@個(gè)學(xué)習(xí)更加智能,它可以讓你從一個(gè)領(lǐng)域遷移到另外一個(gè)領(lǐng)域,它可以減少人工帶來的不必要的麻煩。第四,提供一套建模語音。深度學(xué)習(xí),你不需要對問題有很好的理解,這是一個(gè)錯(cuò)誤的觀點(diǎn)。因?yàn)樯疃葘W(xué)習(xí)跟我們在機(jī)器學(xué)習(xí)里面的圖模型一樣,也是一套語言系統(tǒng),他讓你表達(dá)你對這個(gè)問題的理解,如果你對這個(gè)問題不理解,深度學(xué)習(xí)對你來講沒有用。在不同的問題里面,我們需要開發(fā)不同的深度學(xué)習(xí)的模型?;氐降谝粋€(gè)浪漫主義的觀點(diǎn),深度學(xué)習(xí)跟人腦的關(guān)系。計(jì)算機(jī)視覺里面一個(gè)很著名的深度學(xué)習(xí)的模型是卷積神經(jīng)網(wǎng)絡(luò)。他們做這個(gè)的時(shí)候受到一個(gè)模型的啟發(fā),這個(gè)模型80年代獲得諾貝爾醫(yī)學(xué)生理學(xué)獎。他講的是視覺神經(jīng)系統(tǒng)早期在視覺皮層里面怎么樣處理視覺信息。用很多的圖像數(shù)據(jù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)能夠非常接近的表達(dá)視覺神經(jīng)系統(tǒng)的行為。每一層的神經(jīng)元是一個(gè)特征提取器,一個(gè)具體的神經(jīng)元對什么特征敏感,這里面講的是他對不同朝向的邊界敏感。更高一層,把下面這一層提取的結(jié)果,去組成更復(fù)雜的模式匹配。如果是兩條邊你結(jié)合在一起會形成一個(gè)物體的各個(gè)部位,比方說鼻子的提取,再往下走,就更具有語意,他可以把下面的東西組成更加豐富的物體結(jié)構(gòu)。這里面他是一個(gè)從信號逐層抽象、逐層變換的過程。跟我們今天所了解的生物視覺系統(tǒng)是非常相關(guān)的。但根本上我們只是知道這個(gè)聯(lián)系,今天為止,我們做的很多的工作跟這個(gè)聯(lián)系并沒有太多的關(guān)系,也未受這個(gè)聯(lián)系的束縛。從另外一個(gè)觀點(diǎn)來講,從統(tǒng)計(jì)和計(jì)算方面來分享。在機(jī)器學(xué)習(xí)里面,我們關(guān)心的是推廣誤差,他不是看在現(xiàn)有數(shù)據(jù)集上面效果怎么樣,而是在未知的數(shù)據(jù)上,這個(gè)系統(tǒng)在訓(xùn)練的時(shí)候沒有看到的地方,叫推廣誤差。去年夏天,因?yàn)槲覀兗倚『⑹窃诿绹L大,剛剛回來,剛剛從一年級開始學(xué)習(xí),中文不太好,他有一次考完試以后跟我講,考的不好,70幾分;第二天他特別快樂的跟我講,爸爸,我考了98分,我說這太好了,一天之內(nèi)進(jìn)步這么快。他說因?yàn)榻裉斓目碱}跟昨天是一樣的。這不能真實(shí)反響學(xué)習(xí)者的能力。推廣誤差要在你沒有見過的數(shù)據(jù)集上面衡量他的效果怎么樣。一個(gè)經(jīng)典的分析方法是把推廣誤差分析成兩局部,我們來看錯(cuò)誤源在什么地方。第一個(gè)叫Approximationerror,也就是假設(shè),沒有假設(shè)就沒有學(xué)習(xí),你在學(xué)習(xí)做推廣的時(shí)候就一定有假設(shè),你從推向未知,中間一定有一個(gè)結(jié)構(gòu)在里面。古代我們講近朱者赤,近墨者黑,這有一個(gè)相似性-如果是相似的物體具有相似的屬性。這里面隱含著函數(shù)平滑假設(shè),我們做一個(gè)假設(shè),通常反映在你的模型中間,所有的假設(shè)可能是錯(cuò)的。在統(tǒng)計(jì)學(xué)里面有一個(gè),假設(shè)不完美,你在假設(shè)空間里面一定能夠找到最完美的那個(gè)。第二個(gè)推廣來源是Estimationerror,這是來源于數(shù)據(jù)的不完美。你的訓(xùn)練數(shù)據(jù)和測試的數(shù)據(jù)來源分布不一樣。更多的時(shí)候是說你的數(shù)據(jù)是有限樣本,如果你在有限樣本上面得到的估計(jì)量是不準(zhǔn)確的。因?yàn)槲覀兊墓烙?jì)量是在無限樣本里面去估計(jì)他。光分析這兩個(gè)東西是不夠的。通常來講,在統(tǒng)計(jì)學(xué)的范疇里去分析這兩個(gè)東西,統(tǒng)計(jì)學(xué)家關(guān)心的點(diǎn),跟計(jì)算機(jī)科學(xué)不太一樣。計(jì)算機(jī)科學(xué)關(guān)心的是,我今天跟老板申請五百臺機(jī)器,老板說不行就五臺。你說老板,給我五個(gè)機(jī)器,我要算兩個(gè)月搞定,老板說,你今天不搞定不能回家。所以是有限的資源下面去分析這個(gè)問題,在資源的有限性上面,你要去分析這個(gè)問題。這里面一般是求解的不完美,考慮計(jì)算的不完美。這里面給我們最近的機(jī)器學(xué)習(xí)提供了最近的誤差,我一開始在機(jī)器學(xué)習(xí)上面右層的集成,最好的一層是20層。第二,大量的數(shù)據(jù),讓你在這上面經(jīng)驗(yàn)性的判斷接近你的期望值。第三,我要設(shè)計(jì)一個(gè)非常精巧的算法,求得一個(gè)非常完美的解,這個(gè)完美的解算法非常復(fù)雜。一個(gè)能用的算法,它得有比擬好的性質(zhì),讓你可以消化大的數(shù)據(jù)。把這三點(diǎn)都放在一起,大家可以理解,為什么在大數(shù)據(jù)的時(shí)代深度學(xué)習(xí)變得這么重要。我們看這兩個(gè)緯度,隨著數(shù)據(jù)規(guī)模的增長,效果是怎么樣的。傳統(tǒng)的人工智能算法可能由于這個(gè)模型的空間是有限的,復(fù)雜度不夠高,數(shù)據(jù)多了沒有用?;蛘吣愕乃惴ū旧聿荒芴幚泶髷?shù)據(jù),比方說他的算法復(fù)雜度是數(shù)據(jù)量的三次方。一萬個(gè)數(shù)據(jù)點(diǎn)你可以看懂,但是如果是十萬個(gè)你就搞不定。但是深度學(xué)習(xí)算法,由于它的模型足夠的好,又能夠掌握主大數(shù)據(jù),所以他能夠不斷吸收數(shù)據(jù)紅利,去年百度首席科學(xué)家AndrewNg帶著團(tuán)隊(duì)在語音識別問題上取得了重大進(jìn)展,把數(shù)據(jù)加到了幾萬小時(shí),效果不斷的加強(qiáng)。如果你的商業(yè)模式能夠擁有這樣一個(gè)曲線,我要恭喜你,因?yàn)榇髷?shù)據(jù)真正成為商業(yè)壁壘。。第二,深度學(xué)習(xí)是一個(gè)靈活的建模語音。我們用不同的語音模型表達(dá)你的點(diǎn),比方說圖象,因?yàn)樗莾删S的,用卷積神經(jīng)網(wǎng)絡(luò)更加適合。我們?nèi)ニ阉髡Z意相關(guān)性,傳統(tǒng)的做法是人工抽取很多特征,變成一個(gè)學(xué)習(xí)問題,這里面完全是端到端的。我關(guān)心的是對于一個(gè)搜索的Query,我關(guān)心的是這兩個(gè)相關(guān)性,但是它絕對的相關(guān)程度我不關(guān)心。深度神經(jīng)網(wǎng)絡(luò)給你的是一個(gè)語言,讓你去表達(dá)你對問題的理解。這是最近非常成功的一個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它叫Long—shorttermmemory,它最近取得很好的進(jìn)展:即在任何一個(gè)地方,時(shí)間跟歷史的相關(guān)性是變化的。比方說自然語言處理,你如果碰到一個(gè)右符號,你只要溯源到左符號那個(gè)地方,把中間所有的東西拿出來分析。根據(jù)你當(dāng)前所處的狀態(tài),你是應(yīng)該去找一個(gè)更長的。你遇到一個(gè)句號,你做語意理解的時(shí)候,你把過去歷史所有的都要清零。在時(shí)間面前,時(shí)間和歷史是不一樣的。這個(gè)模型比以前的模型更加的rich。我們在過去做字符識別的時(shí)候,一般先把字符分成一個(gè)一個(gè)單的圖片,再識別它是什么東西,但是我們發(fā)現(xiàn)對于這樣的問題是不可行的。在這種情況下,你可以做的是把整個(gè)字符序列放進(jìn)去,并希望輸出的是一個(gè)完整的字符序列?,F(xiàn)在在這些領(lǐng)域應(yīng)用都是最好的效果。用另外一個(gè)更加不同的神經(jīng)網(wǎng)絡(luò)表達(dá)我的問題。我不是識別這個(gè)圖象里面有什么東西,而是述說圖片的故事:下午的陽光照在房間,有藍(lán)色的地毯和白色的沙發(fā)…今天我們用理解圖象的神經(jīng)網(wǎng)絡(luò),經(jīng)過很多非線性的變換,生成很多表達(dá)。他從這個(gè)詞生成一個(gè)圖象,再生成下一個(gè)詞,我希望這個(gè)句子跟圖象是有關(guān)的,使整個(gè)的語言也跟這個(gè)圖象有關(guān)。根據(jù)你對這個(gè)問題的理解,神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)給你提供了一個(gè)非常豐富的符號語言系統(tǒng)讓你去表達(dá)你這個(gè)問題應(yīng)該怎么搜索。還有很多其他的例子,用深度學(xué)習(xí)提高搜索的先進(jìn)性,用了深度學(xué)習(xí)以后,比沒有用深度學(xué)習(xí)有翻倍的提升,包括語音的系統(tǒng)。最近我們用的語音系統(tǒng),是一個(gè)真正的中文語音識別系統(tǒng),我們用幾萬小時(shí)的聲音來訓(xùn)練它,在識別率上面有很大提升。大家看新聞可能看到了,我們在英文的識別也是優(yōu)于我們的競爭對手。這是另外一個(gè)很有意思的例子,很小的一個(gè)產(chǎn)品,但是它是人工智能很多技術(shù)在一起的綜合體系。這個(gè)是我的一個(gè)朋友,紐約大學(xué)的教授研發(fā)的,他到上海來,去餐館看到這樣一個(gè)菜單,他拍照識別,有一個(gè)OCR,翻譯成英文,通過TTS就可以翻譯出來。在紐約你想找川菜館,他識別成中文,翻譯成英文,通過這個(gè)英文隨便給一個(gè)老外你問他。這個(gè)東西正在成為現(xiàn)實(shí),中間的時(shí)延做的越來越好。這是百度作業(yè)幫,小朋友夏天玩的沒有時(shí)間做作業(yè)了,但快要開學(xué)了怎么辦?如果我小時(shí)候有這個(gè)玩意兒,我會很開心,因?yàn)槲矣懈嗟臅r(shí)間玩。當(dāng)然這個(gè)技術(shù)要善加利用,你可以去找到關(guān)鍵的識別點(diǎn)。這一度讓很多朋友玩的很high,每個(gè)小人物都有一個(gè)成明星的夢想,我們就能滿足這樣的需求。我訪問谷歌的時(shí)候,有個(gè)是做深度學(xué)習(xí)最有名的多倫多大學(xué)的教授,現(xiàn)在在谷歌工作。當(dāng)時(shí)他問我,深度學(xué)習(xí)還能活五年嗎?我說不能,他聽了很沉悶。但是其中的思想是有價(jià)值的,比方說分層次的思想,在非神經(jīng)網(wǎng)絡(luò)的系統(tǒng)和其他的系統(tǒng)都有作用。我們用深度學(xué)習(xí)做了這么好玩的東西,我們可以玩一玩,他說好,來玩玩。他得到了這個(gè)結(jié)果非常開心,立刻分享給他的老婆。最近我們團(tuán)隊(duì)有一個(gè)挺好的結(jié)果,去年Facebook在測試上面,得到世界上最好的結(jié)果97.35%,前幾天百度深度學(xué)習(xí)研究院得到了99.85%的成績,終結(jié)了刷榜。常常我們會聽說到某一個(gè)團(tuán)隊(duì)在一個(gè)數(shù)據(jù)上面做到怎么樣的效果,怎么必須要客觀的看,那只是證明他在這個(gè)數(shù)據(jù)集上做的最好,不代表他把這個(gè)問題給解決了,也不代表他的這個(gè)問題就可用了。人臉識別,今天誰要告訴你,說人臉識別可以用來代替指紋識別,我告訴你,那肯定是忽悠,沒有到那個(gè)程度,但是終究有一天會做到的?;趫D象的理解,你可以做圖片搜索,他不光做視覺相似形的匹配,還有語意的匹配。這里的結(jié)果看起來都不錯(cuò),有一些細(xì)致的區(qū)別。這邊下面是倒影,是水,這邊看似是水,但是大局部是草坪、陸地,這邊的結(jié)果全都是倒影、都是水。很細(xì)致的不同。去年全球最好的物體檢測模型,他告訴你有這個(gè)頭盔,他也告訴你這個(gè)頭盔在什么地方,用一個(gè)框給框出來?;诖髷?shù)據(jù)的人工智能在過去幾年已經(jīng)發(fā)生了變化,我們靜態(tài)來看、把這幾年的進(jìn)展串在一起看,效果還是很驚人的。在這個(gè)分類中,2023年世界最好結(jié)果,錯(cuò)誤率接近30%。每一年不同的團(tuán)隊(duì)在這上面努力工作,每一年的錯(cuò)誤率非常驚人的在降低,朝著零趨勢開展。2023年最好的結(jié)果是百度取得的--7%。斯坦福的學(xué)者人工做了一下比對,他們發(fā)現(xiàn)人的識別率是5%,今年我們聽到微軟和谷歌的朋友已經(jīng)做到大概3%、4%了。當(dāng)然也有一些誤導(dǎo),比方說他能認(rèn)識六七種不同的青蛙,誰能認(rèn)識那么多種不同的青蛙呢?人的能力還是有限的。過去的搜索引擎包括幾個(gè)環(huán)節(jié),數(shù)據(jù)信息的感知、處理、理解、學(xué)習(xí),到?jīng)Q策、行動、創(chuàng)造,這是三個(gè)不同階段。過去我們主要是從互聯(lián)網(wǎng)上獲取這些信息,今天因?yàn)槭且苿踊ヂ?lián)網(wǎng),我們的效勞離人越來越近,所以你需要更多從人的數(shù)據(jù)里面獲取很多內(nèi)容。我們跟清華大學(xué)的朱勇武〔音〕老師有973的工程,從人,還有物理世界,物聯(lián)網(wǎng)〔上面有各種各樣的傳感器,里面有一種重要的傳感器是GPS,對物理世界的感知〕,這些緯度都變得越來越重要。相反,互聯(lián)網(wǎng)上的數(shù)據(jù)以前是唯一,現(xiàn)在只是其中的一個(gè)信息來源。把這些信息都獲取,我們也需要去向更加先進(jìn)的人機(jī)交互的領(lǐng)域開展。比方說更加先進(jìn)的傳感器,我們現(xiàn)在在做3D建模,它是自動駕駛很重要的一個(gè)方面。因?yàn)檐囋谑裁吹胤娇梢宰?,什么地方不能走,哪個(gè)地方是主道,哪個(gè)地方是輔道…要不然這個(gè)車不知道怎么走。以前傳統(tǒng)的互聯(lián)網(wǎng)的信息分析以后,我們通常去做預(yù)測、廣告、搜索.但是今天,我們不光是在數(shù)字世界里面去做一些事情,我們是不是也在物理世界做一些事情。有一位專家說的很好,清華大學(xué)張?jiān)菏空f,機(jī)器人是互聯(lián)網(wǎng)效勞的最后一公里。比方說今天你在網(wǎng)上預(yù)定一個(gè)比薩,那邊有人讀到了這個(gè)信息,他來給你做這個(gè)比薩;某個(gè)人辛辛苦苦把這個(gè)比薩送過來…這里面有很多環(huán)節(jié)可以去優(yōu)化。比方說這個(gè)比薩是不是真的做的非常的個(gè)性化,是不是非常符合你的口味?比方說今天我們在移動互聯(lián)網(wǎng)上對每個(gè)用戶的畫像,可以做幾十萬個(gè)來描述你的興趣。將來的這個(gè)比薩會做的非常的個(gè)性化。加多少胡椒粉都是針對你的口味,可以做到千人千面,可以讓每個(gè)人都感覺是VIP。到底誰能做這件事情?機(jī)器人。因?yàn)樗堰@些數(shù)據(jù)瞬間讀到他的數(shù)據(jù)庫里面。誰來最高效的把這個(gè)效勞最后完成,送到你家里來?機(jī)器人。張華院士說機(jī)器人是互聯(lián)網(wǎng)效勞的最后一公里,很有道理,很深刻。當(dāng)然人工智能還有一個(gè)很高的層次就是探索和發(fā)現(xiàn)。去探索過去沒有的東西,3D打印在這里面扮演一個(gè)東西,他把一個(gè)計(jì)算的結(jié)果變成一個(gè)物理的現(xiàn)實(shí)。計(jì)算是沒有邊界的,計(jì)算生成的結(jié)果根本上也是沒有任何的邊界,所以他可以生成任何的東西,3D打印就可以幫助他實(shí)現(xiàn)。將來的智能延伸到物理世界里面去創(chuàng)造以前從來沒有過的東西,這是一個(gè)可以預(yù)見的未來。今天對網(wǎng)絡(luò)模型的規(guī)模有不斷的追求,我經(jīng)??梢月牭侥衬硢挝豢梢詫?shí)現(xiàn)超大規(guī)模的神經(jīng)網(wǎng)絡(luò),這里面可以稍微做一些類比,我們可以看到不同物種的變化是很大的。但是如果你看他們的變化之間平均的連接,他們的區(qū)別其實(shí)沒有那么大。我們發(fā)現(xiàn)更高層次的智慧物種,他有更大規(guī)模的神經(jīng)網(wǎng)絡(luò),但是他的網(wǎng)絡(luò)連接是稀疏的。你的物種不斷增多,你的連接卻沒有變化,所以他一定是越來越稀疏的。這對我們是有一些啟發(fā)的。今天我們來比擬一下人類大腦跟Supercomputer。人的大腦一般是1.5KG,2%的位置,但是它要消耗我們2%的能量,所以腦子是很消耗能量的。為什么中午會犯困,因?yàn)槟愠燥堃院笱憾嫉较览锩嫒チ?。某某朋友一天非常集中的做一件事情,最后會累的虛脫,哪怕他沒有怎么動就是這個(gè)原因。我們的大腦有一千億個(gè)neurons,每個(gè)數(shù)理有5000個(gè)神經(jīng)原,每一個(gè)連接是200次/秒。我們大腦的計(jì)算能力是10的17次方。它是一個(gè)非常高效的計(jì)算,每瓦能量完成的計(jì)算量是5個(gè)Gliops。跟中國的天河二號比擬一下,它現(xiàn)在的計(jì)算能力還沒有到達(dá)人腦計(jì)算的一半,它現(xiàn)在是34個(gè)petaliops,它的計(jì)算效率是每瓦2.14Gliops。這是我們和清華大學(xué)做的一個(gè)工程,它是真正的自行車,以前我們見到的自行車都是假的自行車,因?yàn)樗皇亲孕小N覀冊谧鲞@個(gè)工程的時(shí)候有一些思考,這個(gè)思考就是人跟車的關(guān)系,我們覺得它未來是人跟馬的關(guān)系,是朋友。如果你養(yǎng)一匹馬,很親以后,它跟你有一個(gè)交流,它也是懂你的,它也有自己的想法。這是我們在百度做的自動駕駛工程。我們不把它叫做無人駕駛,我們叫做“高度自動駕駛〞工程。首先這是一個(gè)非常典型的機(jī)器人工程,一個(gè)自動駕駛的車,裝了這么多的傳感器。這個(gè)車的后背箱堆滿了效勞器。感知、理解、決策控制,車的計(jì)算要直接控制、操控這個(gè)車物理的東西。這里面中國跟國外還有一些差距,首先要實(shí)現(xiàn)線控,中國絕大局部的車都不是線控。我們做自動駕駛,你要控制剎車,怎么控制?不是一個(gè)接口、一個(gè)計(jì)算機(jī)寫進(jìn)去,他是一個(gè)大的鐵桿子、這邊裝了馬達(dá),鐵桿子踩在剎車上。我們跟寶馬合作,是因?yàn)樗峁┚€控的技術(shù)。這個(gè)車我們叫做小紅,小紅,大白,這是我們改裝的第一輛車,第二輛、第三輛。首先是對道路的感知,這里是三維高精度的感知。對車的定位要能夠做到厘米量級的定位。這里面需要一些相當(dāng)?shù)膫鞲衅骷夹g(shù)、機(jī)器人技術(shù)。這個(gè)是在G7上面采用的。大家看到劃的很高,因?yàn)槲覀兪侨S的東西,很容易劃的很高,都是計(jì)算出來的。我們對車整合動力學(xué)的系統(tǒng)建了這個(gè)模型做仿真,在路上走我們要做模擬的仿真,模擬仿真做的差不多以后,我們再實(shí)際的去調(diào)試。自動駕駛要飛入尋常百姓家,關(guān)鍵是你要用低本錢的傳感器實(shí)現(xiàn)很強(qiáng)的智能感知能力。谷歌自動駕駛有一個(gè)很嚴(yán)重的問題,他用的傳感器比車本身都貴。他的傳感器要70萬人民幣。但是我們要突破一個(gè)技術(shù),就是怎么讓低本錢的傳感器大規(guī)模的應(yīng)用。這是我們做的是基于圖象的實(shí)時(shí)道路場景理解。比方說識別道路上的汽車,在這件事情上我們真的做的比別人好。這個(gè)藍(lán)色的點(diǎn)是我們的標(biāo)注人員做的。這些車是疊著排在路邊,人在標(biāo)注的時(shí)候不容易精確的說這輛車、這輛車、這輛車,不容易看清。這個(gè)地方陰影的遮擋。有一輛車在這里,被一個(gè)交通標(biāo)志遮擋起來了,人不容易看到,但是目前我們的算法能夠做到這樣的水平。最后看一下我們對自動駕駛開展路徑的看法。為什么我們不認(rèn)為我們要做的是無人駕駛?真正的無人駕駛要實(shí)現(xiàn),還有一個(gè)相當(dāng)長的路徑,除了技術(shù)的能力以外,還有政府的政策法規(guī),還有根底建設(shè),還有保險(xiǎn)公司怎么判定這個(gè)問題,出了問題到底是誰的錯(cuò),這些事情已經(jīng)遠(yuǎn)超技術(shù)本身,還有倫理的問題。真正到無人駕駛,你要經(jīng)歷幾個(gè)階段:第一階段,輔助駕駛。第二,主動駕駛。第三,特定條件下的自動駕駛。第四,高度的自動化駕駛。比方說輔助駕駛,當(dāng)前這個(gè)階段是一個(gè)輔助駕駛的階段,因?yàn)檫@個(gè)車告訴你哪邊有車,哪邊有人,如果要出事故,他會提醒你。輔助駕駛告訴你檢測的結(jié)果,他不控制這個(gè)車??刂七@個(gè)車變成了主動駕駛。特定環(huán)境下面,很多的車廠跟我們一樣都認(rèn)為在特定的場景,像某些高速公路,在兩到三年的時(shí)間里面會實(shí)現(xiàn)智能的自適應(yīng)巡航?,F(xiàn)在車的巡航只是保持速度,如果前面的車并道過來了,你是不是會做一些改變,或者減低車速,現(xiàn)在的車做不到。如果這個(gè)車本身在巡航狀態(tài),他是不停在拐彎的,你會不會車道跟隨?這個(gè)會最先實(shí)現(xiàn)。在某些比擬先進(jìn)的地方,你到了賓館,車就不用管了。將來這個(gè)車是自動駕駛的,他把你的車移到那個(gè)地方。或者在一個(gè)大型的物流中心,或者在一個(gè)礦山里面,他是一個(gè)自動駕駛。最后到高度的自動駕駛。人車一體,人不能放棄對車的控制,就像現(xiàn)在的飛機(jī)一樣,飛機(jī)在空中的很多時(shí)候它是自動駕駛的狀態(tài),你喝杯咖啡沒有問題,但是任何時(shí)候你要重新恢復(fù)你的控制,你可以做到。因?yàn)槿藢@個(gè)事情負(fù)責(zé)。關(guān)于人和機(jī)器的關(guān)系,從我自己親身經(jīng)歷的例子來說。我們過去的團(tuán)隊(duì)在兩年前做過兩個(gè)事情,一個(gè)事情是讓你自己照的照片找一個(gè)長的最像的明星。還有一個(gè)是你拍一個(gè)照,理解了以后,生成一首詩。這里面涉及到計(jì)算機(jī)視覺,涉及到自然語言。但是從市場的反響來講,你們可以想象到,哪個(gè)更受歡送?因?yàn)檫@跟每個(gè)人都相關(guān),每個(gè)普通人都有一個(gè)想當(dāng)大明星的夢想,哪怕是一個(gè)虛幻,至少是這個(gè)產(chǎn)品跟每個(gè)用戶之間的關(guān)聯(lián)。拍照寫詩為什么不受歡送?因?yàn)樗莝howoff,他是秀百度的機(jī)器有多牛,不是秀我多牛。這里面有一個(gè)我們的思考,機(jī)器往前,我們回到人工智能的原點(diǎn),這個(gè)原點(diǎn)叫圖靈測試,圖靈測試一直在指導(dǎo)人工智能研究的方向,他的目的是研究這個(gè)智能的機(jī)器能夠取代人。圖靈測試就是如果拿一個(gè)布檔著,這邊是機(jī)器還是人我就不知道了。我們下國際象棋,目前他是PASS了圖靈測試的。這種導(dǎo)致了你的做法,你不斷研究跟人可以PK的機(jī)器,這是不是我們真正想做的,是不是真正的方向。站在今天可以去思考。我剛剛講到了象棋,IBM的深藍(lán)有一個(gè)劃時(shí)代的成果,它做的比最好的象棋冠軍能力還好,看似這樣一個(gè)偉大的科技進(jìn)展,它其實(shí)沒有給IBM帶來任何的價(jià)值,沒有給這個(gè)社會產(chǎn)生任何的影響,也沒有使這個(gè)社會變得更加美好。為什么?因?yàn)樗鼰o非是造一個(gè)跟人能力差不多可以PK的機(jī)器。我們看另外一個(gè)東西,搜索引擎,無論是谷歌還是百度,它這個(gè)技術(shù)不完美,因?yàn)槲覀兝硐氲募夹g(shù)是能夠給他扔一個(gè)問題,他能夠自動尋找問題的答案。他做的不完美,他是扔一堆排序的結(jié)果,你自己搞清楚。但是他對這個(gè)社會產(chǎn)生了巨大的影響。他能讓北京清華附小一個(gè)家庭環(huán)境非常優(yōu)越的小孩子跟一個(gè)鄉(xiāng)村里面的小孩子,只要有網(wǎng)絡(luò)的情況下,獲取知識、獲取信息的能力是一樣的。他是因?yàn)槌删土嗣總€(gè)人,讓每一個(gè)普通的人更有知識,他獲得信息,能夠做更加明智的判斷,這個(gè)事情跟這個(gè)社會的大需求發(fā)生了共振,產(chǎn)生了巨大的影響。我們思考自動駕駛也是這樣,我們是要去思考、去做真正的替代人去駕駛的,還是去做車成就人的,還是你可以獲取更大的自由。谷歌的這個(gè)車一開始是沒有方向盤的。這個(gè)車真的是你想要的嗎?最近他們把方向盤加上去了。我們希望車跟人的關(guān)系,就像人跟馬的關(guān)系一樣。你在萬馬奔騰的環(huán)境里面,你騎著這個(gè)馬,你不需要特別細(xì)微的控制這個(gè)馬,它自己知道怎么走,避障,跟周圍的馬協(xié)調(diào)距離,你要把握大方向。你甚至在馬上面如果打瞌睡,馬也可以帶著你走,你什么時(shí)候想要控制它,你是可以控制的。自動駕駛是要構(gòu)建人車一體、以人為主的駕駛環(huán)境。最后,我覺得什么是一個(gè)偉大的技術(shù)?它不在于讓機(jī)器更偉大,它的偉大之處,是讓每個(gè)平凡的人更有創(chuàng)造力、更加自我、更偉大。這是人工智能和技術(shù)開展的方向。世界是我們的,也是機(jī)器人的,但是歸根到底是屬于會控制機(jī)器人的人的。謝謝大家!提問環(huán)節(jié)提問1:借用張?jiān)菏空f的最后一公里,前面在你的思路中,什么是最先一公里?最先一公里和最后一公里是什么關(guān)系?余凱:信息的搜集、整理是目前來講先要去做的。提問2:假設(shè)我們可以確定機(jī)器智能的開展一定會威脅人的生存,機(jī)器超過人的時(shí)候,一個(gè)很嚴(yán)重的問題就是人沒有用了。余凱:首先,我們現(xiàn)在太早去思考這個(gè)問題了,因?yàn)槲覀儸F(xiàn)在離那個(gè)階段還非常遠(yuǎn)。第二,我不認(rèn)為將來機(jī)器會超過人或者駕馭人。他應(yīng)該還是人的工具。我覺得它在很多能力方面是超過我們,但是最后它還是受人的駕馭。有一點(diǎn)是:機(jī)器人沒有好奇心。我現(xiàn)在想不到讓一個(gè)計(jì)算模型具有對未知世界探索的好奇心。因?yàn)槿巳ヌ剿魑粗澜绾闷?,不斷的拓展知識的邊界,機(jī)器人是去執(zhí)行我們的想法。提問3:我正在寫一篇文章,這一篇文章的一個(gè)觀點(diǎn)是,當(dāng)機(jī)器要保證自己不斷電的情況下,沒有人的參與,它會不會有好奇心?余凱:會不會有好奇心我就不知道了。這種哲學(xué)討論我們可以永遠(yuǎn)討論。因?yàn)槟且惶鞗]有到來之前,我們可以不斷的去猜想。我的觀點(diǎn),我們想做對社會有用的東西。提問4:剛剛余博士介紹很多沖動人心的人工智能方面的成果??墒俏覀儸F(xiàn)在去看應(yīng)用層面,包括剛剛介紹很多百度的應(yīng)用,好玩但是不實(shí)用,比方說魔圖、百度拍植物,都不實(shí)用,或者是一個(gè)輔助性。余博士的角度看,在應(yīng)用層面,出現(xiàn)一個(gè)endto-end的應(yīng)用可能會出現(xiàn)哪一個(gè)領(lǐng)域?余凱:這些人工智能的技術(shù)對于現(xiàn)實(shí)商業(yè)的影響其實(shí)是巨大的。因?yàn)榻裉斓恼麄€(gè)搜索、廣告系統(tǒng)、電子商務(wù)、大數(shù)據(jù)金融,這些技術(shù)在這里面,你有和沒有,是生和死的問題,不是錦上添花的事情。但是那些好玩的事情,他自己也在不斷的演進(jìn)。我們講的圖象識別,大家有沒有聽說過MobilEye?這家公司就是做車輛和行人識別感知系統(tǒng),它現(xiàn)在做到很大。還有一個(gè)大數(shù)據(jù)公司叫Palentir,他就是人工智能大數(shù)據(jù)的方法用在國家平安領(lǐng)域,他現(xiàn)在是一百多億美金的估值。近期來講,你總會覺得技術(shù)開展比你想象的要慢。近期大家總是高估技術(shù)對人類的影響,但是在十年的時(shí)間里面,你一定是低估技術(shù)對你生活的影響。提問5:在您的演講里面有一個(gè)細(xì)節(jié),您跟Hinton教授談的時(shí)候,說這一波深度學(xué)習(xí)浪潮很快就過去了。在五年之后,在深度學(xué)習(xí)之后是什么樣的開展方向,什么樣的技術(shù)引領(lǐng)下一個(gè)開展方向?余凱:在某一個(gè)方面做的事情,特別是計(jì)算機(jī)科學(xué),常常是自己埋葬自己。很多年前,計(jì)算機(jī)體系結(jié)構(gòu),現(xiàn)在做的時(shí)候它不是一個(gè)你要探索的學(xué)科。深度學(xué)習(xí)一定會成為一個(gè)非常俗氣的東西,每個(gè)人都會用。至于未來的方向,我不能講太遠(yuǎn)、太哲學(xué)的,我更愿意講現(xiàn)實(shí)的?,F(xiàn)實(shí)來講,自然語言理解是一個(gè)非常重要的方向,期待一個(gè)突破性的進(jìn)展。提問6:我是電子系的學(xué)生,深度學(xué)習(xí)的算法用在硬件上面,您覺得這方面的潛力大嗎?余凱:這個(gè)會非常有潛力,因?yàn)榘堰@些智能的算法用在硬件里面,可以放進(jìn)各種智能設(shè)備中,這是我很期待的方向。提問7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論