百度副總裁向海龍-技術(shù)是搜索的核心競爭力Word_第1頁
百度副總裁向海龍-技術(shù)是搜索的核心競爭力Word_第2頁
百度副總裁向海龍-技術(shù)是搜索的核心競爭力Word_第3頁
百度副總裁向海龍-技術(shù)是搜索的核心競爭力Word_第4頁
百度副總裁向海龍-技術(shù)是搜索的核心競爭力Word_第5頁
已閱讀5頁,還剩82頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、百度副總裁向海龍:技術(shù)是搜索的核心競爭力百度副總裁向海龍演講網(wǎng)易科技訊5月29日消息,在2014年百度聯(lián)盟峰會上,百度副總裁向海龍表示,技術(shù)是搜索引擎的核心競爭力。向海龍介紹說,互聯(lián)網(wǎng)進入高速發(fā)展階段后,全球信息量呈幾何式躍升,從2005年的130EB(1EB=10億GB)到2015年的8000+EB,10年增長了66倍。同時,來自可穿戴設(shè)備、LBS、語音、網(wǎng)絡(luò)圖片、視頻等各渠道的數(shù)據(jù)類型越來越豐富。面對海量而龐雜的數(shù)據(jù)庫,需要更加智能的技術(shù)來提升搜索的用戶體驗。一個是信息迅猛增長,另外一個是信息的表現(xiàn)形式多種多樣。向海龍在演講中介紹了百度在解決這兩個問題方面所作出的努力。以下是2014百度聯(lián)

2、盟峰會向海龍主題演講實錄:各位合作伙伴,朋友們,還有各位媒體朋友們,大家上午好。再次歡迎大家參加我們2014百度聯(lián)盟峰會的活動,今天我演講的主題是技術(shù)是搜索的核心競爭力。在我開始演講這個話題之前,我想先和嘉賓共同分享我們幾個數(shù)據(jù)。在互聯(lián)網(wǎng)時代,全球的數(shù)據(jù)增長速度是非??斓?,剛才Robin也提到,從這個圖上大家可以看到,在05年的時候,全球的信息量是130EB,EB是一個非常大的計量單位,1EB相當(dāng)于10的GB,到了明年,我們做了一個預(yù)測,全球的信息量增長會達到8000多EB。我們看了這十年的增長,將近是66倍的速度。而且這個速度還會持續(xù)更快的增長。我們看一下,這個增長其實有很多方面的原因,有一

3、方面的原因,我認為是數(shù)據(jù)的類型變得非常多樣化。我記得在我們互聯(lián)網(wǎng)剛發(fā)展起來的時候,在互聯(lián)網(wǎng)上呈現(xiàn)的數(shù)據(jù)更多是文本的數(shù)據(jù),文字的數(shù)據(jù)。但是隨著技術(shù)的發(fā)展,現(xiàn)在我們的數(shù)據(jù)呈現(xiàn)出了多元化,現(xiàn)在有圖片數(shù)據(jù),大家發(fā)現(xiàn)這兩年圖片數(shù)據(jù)的增長更加迅猛。比如現(xiàn)在我們在看微信的朋友圈的時候,大家會發(fā)現(xiàn),朋友圈里其實大量的朋友發(fā)了各種各樣的照片。還有語音數(shù)據(jù),隨著無線互聯(lián)網(wǎng)的發(fā)展,設(shè)備越來越智能,語音的數(shù)據(jù)積累越來越快。還有一些是什么呢?視頻的數(shù)據(jù),但是,現(xiàn)在視頻的數(shù)據(jù)我感覺分享的還不夠多,這可能主要的原因還是在于整個網(wǎng)絡(luò)速度的原因。比如我們在朋友圈里面,我們很少看到有人發(fā)簡單錄下來的視頻。但是我相信,隨著未來設(shè)備

4、的增加,還有一個是我們網(wǎng)絡(luò)寬帶的增加,這種視頻數(shù)據(jù)的產(chǎn)生也會越來越多。還有一個是基于地理位置的數(shù)據(jù),LBS的數(shù)據(jù),這個是根據(jù)無線互聯(lián)網(wǎng)時代的發(fā)展,有了定位技術(shù)以后,我們很多的數(shù)據(jù)都有了地理數(shù)據(jù),這類的數(shù)據(jù)也獲得了非常快的發(fā)展?;谶@些數(shù)據(jù)類型的變化,還有是我們途徑的增長,使得數(shù)據(jù)增長非??欤覀儎偛趴吹?,十年的增長是66倍,未來會更快。我在這里給大家舉個例子,我參加了上個月的北京車展,那個車展剛剛結(jié)束,2010年的時候,百度索引的數(shù)據(jù)量大概是600多萬條,到2014年北京車展的時候,我們看一下這個數(shù)據(jù),百度上我們看到北京車展的索引增加到2100萬條,這里面增長最多的是圖片數(shù)據(jù),我們分析了一下原

5、因,我當(dāng)時去參加了車展,我記得幾年前參加的時候,我看到大量的人都是拿著單反照,幾年前單反還比較貴,更多是一些專業(yè)人士拍,通過一些媒體網(wǎng)站就發(fā)出來,但今年我看的時候,發(fā)現(xiàn)了一個巨大的變化,就是大量的舉著手機拍照,我們現(xiàn)在手機有了很好的拍照功能,而且拍的也非常清晰,帶起來也非常方便,這就使得我們圖片的搜集者和創(chuàng)造者是來自廣大的網(wǎng)民,這是我們可以看到圖片數(shù)字增長非??斓囊粋€很重要的原因。另外一個,視頻,也增長非???,我們現(xiàn)在每個人的手機里面,除了有拍照的功能,還有錄視頻的功能。這個視頻,在傳播視頻的過程中,可能是因為網(wǎng)速的原因,流量的原因,使得受到了一定的抑制,我相信未來速度還會增加。這是我們前面看

6、到的兩個問題,一個是信息迅猛增長,另外一個是信息的表現(xiàn)形式多種多樣,這樣對我們信息的處理提出了更大的要求,其實我們在生活中經(jīng)常會遇到這樣的問題,我不知道在座各位有沒有這樣的感受,我們經(jīng)常會聽到一首歌的時候,突然忘了這個歌叫什么名字了,其實很想知道,甚至想知道這個歌是誰唱的,很著急。另外一個是我相信有孩子的家長,經(jīng)常會有這種困惑,你帶著孩子去動物園,去植物園玩的時候,突然孩子會問,爸爸,這個植物叫什么名字,可能有人就傻了,回答不出來,他很想知道這個到底是什么東西。這就是我說的,我們在生活中經(jīng)常會遇到這些問題。今天我們各個合作伙伴來到了黃山,我這里說一個黃山的例子,這個圖片是不是很像一個枇杷,我不

7、知道他是什么,我可以通過百度的識圖來拍一下,通過這個識圖,我們很快就知道這個植物的名字叫做香榧,這是黃山的特產(chǎn),樹齡特別長,有千年香榧之稱,明天我們組織大家旅游的時候,大家可以看一下。傳統(tǒng)的搜索框主要是滿足用戶文本的搜索,這里面有一個很大的局限性。很多東西其實我們只用文字輸入是非常不方便的,比如我舉這個例子,白毛掌,你用文字輸入形容是很難的事情,最簡單的是拍照進行搜索,反而變得更加容易。百度有這個圖象識別的技術(shù),可以幫助大家以圖搜圖,同時我還可以對這個圖做各種解釋和說明,可以看這個圖背后的一些故事。除了圖片搜索技術(shù)以外,我們還給大家看一個語音搜索和交互搜索的例子。這是一個通過去哪兒的APP購買

8、機票和訂酒店的例子。去哪兒使用的是百度語音搜索的技術(shù),其實這個APP是已經(jīng)做到里面去了,就是去哪兒訂酒店的APP,大家可以試一下,你直接說就行了,不需要進行文字的輸入,他可以很智能的知道你訂什么酒店和機票,他會給你進行一些推薦。除了滿足用戶在多媒體輸入方面的需求以外,我們也在嘗試讓百度變得更加的智能,可能有的合作伙伴第一次來黃山,對黃山不是特別了解,不過這個沒關(guān)系,你可能總知道這里面一兩個信息,比如說黃山松,這個大家知道,沒來過黃山的人也聽朋友講過,這是非常有名的。你可以在百度上搜索黃山松這個詞,百度就會很智能的推薦給你和黃山相關(guān)的一些名勝古跡,或者相應(yīng)的一些植物。他其實是一個聯(lián)想的功能,你在

9、搜這個詞的時候,我可以給你一些和這個相關(guān)的信息,便于你學(xué)習(xí)和理解。在數(shù)據(jù)挖掘和智能的推薦的維度上,百度也做了很多的探索,大家喜歡娛樂的,可以搜索一下黃海波,通過這個事件縱深的挖掘,可以幫助大家理解黃海波事件的來龍去脈,有人突然聽到這個詞,搞不懂什么意思,你搜索一下,我們可以告訴你這個事情怎么發(fā)生的,大家怎么議論的,全部給你梳理一下。還有一個例子,大家也可以查一下馬航,當(dāng)時馬航事件的時候,大家找飛機找了將近一個月,還在不停的找。你搜索這個詞的時候,我們也給你進行一個時間脈絡(luò)的梳理,在這一個月當(dāng)中,馬航事件到底發(fā)生了多少事情。喜歡歷史的朋友,可以搜一下建文帝,歷史學(xué)的不好,沒太大關(guān)系,他是明朝的第

10、二個皇帝,但知識圖譜可以告訴大家明朝的相關(guān)皇帝和大臣,全部的整理在一起,你可以一個個點著看,慢慢就明白這里面這些人的關(guān)系,或者是這些人的故事。喜歡旅行的朋友,比如說有人說,我搜一下頤和園,就可以實時性的推薦,讓大家了解這個經(jīng)典的人群分布,到底這個景點擠不擠,擁不擁堵,我今天要不要去,或者說搜索一下后海,今天晚上這個地方熱不熱鬧。這是我們一個實時推薦的技術(shù)。剛才我也提到了,喜歡動植物的朋友,你搜索一個植物,就可以有一個引導(dǎo)搜索,幫助大家進行分類了解。前面我們講了一些產(chǎn)品創(chuàng)新的例子,其實產(chǎn)品創(chuàng)新的同時,對于百度的基礎(chǔ)設(shè)施也是提出了非常高的要求,首先,要求百度具有強大的數(shù)據(jù)處理能力,這個里面有三個要

11、點,第一個是大數(shù)據(jù),百度收錄了全世界超過一萬億張網(wǎng)頁,百度要有搜集大數(shù)據(jù)的能力,這一萬億張網(wǎng)頁是什么概念呢,我打一個比喻,相當(dāng)于5000個國家圖書館的信息量的總和。數(shù)據(jù)量是非常大的。第二個是高吞吐,百度每天有百億次的訪問請求,還有一點是非常重要的,就是低延遲,網(wǎng)頁從更新到索引,只需要幾十秒,更新的速度要快,這是非常有技術(shù)含量的。我們真正的做到了在大數(shù)據(jù)量下的秒級的索引。同時,百度還有非常強大的計算能力,超大規(guī)模存儲和分布式計算的能力。這是非常重要的。從商業(yè)的角度來看,百度做了十年的精準營銷的服務(wù),一直保持著對相關(guān)性預(yù)測模型的持續(xù)優(yōu)化,在投入資源、算法以及最終的效果上,應(yīng)該都是國內(nèi)頂尖的水平。比

12、如我們對于廣告特征的挖掘,我們達到了千億級別,如果以銀河系恒星計算,就相當(dāng)于把兩個銀河系的恒星。我們每天有超大規(guī)模的樣本來計算,建立這樣一個模型。如果地球上每個人都是一個樣本,我們這個量就相當(dāng)于十萬個地球那么多的人口。在這里面,我們看到樣本的數(shù)據(jù)量是非常大的。還有一些基礎(chǔ)架構(gòu),我們也在嘗試新的搜索體驗,比如最近剛剛推出的極速搜索,特征就是快,比普通的搜索減少了80%的處理速度。具體有多快,我在這里做一個比喻,眨一次眼睛時間是0.2秒,博爾特起跑是0.16秒,子彈穿過木板的時間是0.05秒,極速搜索響應(yīng)的速度是0.04秒。比打一槍子彈穿過木板的速度還要快,天下武功唯快不破。我們的技術(shù)是提升用戶極

13、致搜索體驗,我們把搜索的速度做的非??臁_@是我們最近推出的一個新的技術(shù)。百度在不斷提高基礎(chǔ)技術(shù)能力的同時,也在構(gòu)建大數(shù)據(jù)的開放平臺,百度有非常多自有的數(shù)據(jù),我們搜索的數(shù)據(jù),地圖的數(shù)據(jù),基于LBS的地圖數(shù)據(jù),以及基于地圖上的商業(yè)數(shù)據(jù),還有音樂的數(shù)據(jù),我們知道的數(shù)據(jù),百科的數(shù)據(jù),包括去哪兒這些訂酒店的數(shù)據(jù),愛奇藝看視頻這些數(shù)據(jù)。我們的數(shù)據(jù)量是非常龐大的。另外我們還有幾十萬家聯(lián)盟合作伙伴,一起合作的行業(yè)數(shù)據(jù),我們把這些行業(yè)數(shù)據(jù)進行整合。這些技術(shù)進行整合以后,通過百度的技術(shù),更好的反過來服務(wù)于我們整個行業(yè)和合作伙伴。所以我們就說,我們在構(gòu)建大數(shù)據(jù)平臺,我們會是一個開放的大數(shù)據(jù)平臺。接下來馬上要舉行巴西

14、世界杯,我在這里說一下我們大數(shù)據(jù)的應(yīng)用。我們利用百度大數(shù)據(jù)這樣的優(yōu)勢,我們這次也做了一個世界杯預(yù)測的嘗試,通過大數(shù)據(jù)來預(yù)測世界杯冠軍和本屆比賽的黑馬。當(dāng)然我們也預(yù)測每場比賽誰贏誰輸。世界杯預(yù)測,我們不是瞎預(yù)測,我們是通過大數(shù)據(jù)的技術(shù)來預(yù)測的。這個大數(shù)據(jù)后面有哪些數(shù)據(jù)呢?我們綜合了一千支球隊,最近五年37000場的比賽,還有29610名的球員,還結(jié)合了252萬條Query,以及全球1億1千萬條的基礎(chǔ)數(shù)據(jù),整合到一起做這樣的預(yù)測。感興趣的同學(xué)可以在世界杯期間關(guān)注一下我們這個產(chǎn)品。五岳歸來不看山,黃山歸來不看岳,這是徐霞客對黃山美景的贊嘆,黃山以美景服人,百度是以技術(shù)立本,我們始終認為技術(shù)是搜索的核

15、心競爭力,在百度峰會第12個年頭,我們希望百度通過技術(shù)和在座各位合作伙伴,在一起,盟承未來,讓我們做的更好。(百曉) 本文來源:網(wǎng)易科技報道百度副總裁向海龍演講網(wǎng)易科技訊5月29日消息,在2014年百度聯(lián)盟峰會上,百度副總裁向海龍表示,技術(shù)是搜索引擎的核心競爭力。向海龍介紹說,互聯(lián)網(wǎng)進入高速發(fā)展階段後,全球信息量呈幾何式躍升,從2005年的130EB(1EB=10億GB)到2015年的8000+EB,10年增長瞭66倍。同時,來自可穿戴設(shè)備、LBS、語音、網(wǎng)絡(luò)圖片、視頻等各渠道的數(shù)據(jù)類型越來越豐富。面對海量而龐雜的數(shù)據(jù)庫,需要更加智能的技術(shù)來提升搜索的用戶體驗。一個是信息迅猛增長,另外一個是信

16、息的表現(xiàn)形式多種多樣。向海龍在演講中介紹瞭百度在解決這兩個問題方面所作出的努力。以下是2014百度聯(lián)盟峰會向海龍主題演講實錄:各位合作夥伴,朋友們,還有各位媒體朋友們,大傢上午好。再次歡迎大傢參加我們2014百度聯(lián)盟峰會的活動,今天我演講的主題是技術(shù)是搜索的核心競爭力。在我開始演講這個話題之前,我想先和嘉賓共同分享我們幾個數(shù)據(jù)。在互聯(lián)網(wǎng)時代,全球的數(shù)據(jù)增長速度是非常快的,剛才Robin也提到,從這個圖上大傢可以看到,在05年的時候,全球的信息量是130EB,EB是一個非常大的計量單位,1EB相當(dāng)於10的GB,到瞭明年,我們做瞭一個預(yù)測,全球的信息量增長會達到8000多EB。我們看瞭這十年的增長

17、,將近是66倍的速度。而且這個速度還會持續(xù)更快的增長。我們看一下,這個增長其實有很多方面的原因,有一方面的原因,我認為是數(shù)據(jù)的類型變得非常多樣化。我記得在我們互聯(lián)網(wǎng)剛發(fā)展起來的時候,在互聯(lián)網(wǎng)上呈現(xiàn)的數(shù)據(jù)更多是文本的數(shù)據(jù),文字的數(shù)據(jù)。但是隨著技術(shù)的發(fā)展,現(xiàn)在我們的數(shù)據(jù)呈現(xiàn)出瞭多元化,現(xiàn)在有圖片數(shù)據(jù),大傢發(fā)現(xiàn)這兩年圖片數(shù)據(jù)的增長更加迅猛。比如現(xiàn)在我們在看微信的朋友圈的時候,大傢會發(fā)現(xiàn),朋友圈裡其實大量的朋友發(fā)瞭各種各樣的照片。還有語音數(shù)據(jù),隨著無線互聯(lián)網(wǎng)的發(fā)展,設(shè)備越來越智能,語音的數(shù)據(jù)積累越來越快。還有一些是什麼呢?視頻的數(shù)據(jù),但是,現(xiàn)在視頻的數(shù)據(jù)我感覺分享的還不夠多,這可能主要的原因還是在於整

18、個網(wǎng)絡(luò)速度的原因。比如我們在朋友圈裡面,我們很少看到有人發(fā)簡單錄下來的視頻。但是我相信,隨著未來設(shè)備的增加,還有一個是我們網(wǎng)絡(luò)寬帶的增加,這種視頻數(shù)據(jù)的產(chǎn)生也會越來越多。還有一個是基於地理位置的數(shù)據(jù),LBS的數(shù)據(jù),這個是根據(jù)無線互聯(lián)網(wǎng)時代的發(fā)展,有瞭定位技術(shù)以後,我們很多的數(shù)據(jù)都有瞭地理數(shù)據(jù),這類的數(shù)據(jù)也獲得瞭非??斓陌l(fā)展?;哆@些數(shù)據(jù)類型的變化,還有是我們途徑的增長,使得數(shù)據(jù)增長非???,我們剛才看到,十年的增長是66倍,未來會更快。我在這裡給大傢舉個例子,我參加瞭上個月的北京車展,那個車展剛剛結(jié)束,2010年的時候,百度索引的數(shù)據(jù)量大概是600多萬條,到2014年北京車展的時候,我們看一下這

19、個數(shù)據(jù),百度上我們看到北京車展的索引增加到2100萬條,這裡面增長最多的是圖片數(shù)據(jù),我們分析瞭一下原因,我當(dāng)時去參加瞭車展,我記得幾年前參加的時候,我看到大量的人都是拿著單反照,幾年前單反還比較貴,更多是一些專業(yè)人士拍,通過一些媒體網(wǎng)站就發(fā)出來,但今年我看的時候,發(fā)現(xiàn)瞭一個巨大的變化,就是大量的舉著手機拍照,我們現(xiàn)在手機有瞭很好的拍照功能,而且拍的也非常清晰,帶起來也非常方便,這就使得我們圖片的搜集者和創(chuàng)造者是來自廣大的網(wǎng)民,這是我們可以看到圖片數(shù)字增長非??斓囊粋€很重要的原因。另外一個,視頻,也增長非???,我們現(xiàn)在每個人的手機裡面,除瞭有拍照的功能,還有錄視頻的功能。這個視頻,在傳播視頻的過

20、程中,可能是因為網(wǎng)速的原因,流量的原因,使得受到瞭一定的抑制,我相信未來速度還會增加。這是我們前面看到的兩個問題,一個是信息迅猛增長,另外一個是信息的表現(xiàn)形式多種多樣,這樣對我們信息的處理提出瞭更大的要求,其實我們在生活中經(jīng)常會遇到這樣的問題,我不知道在座各位有沒有這樣的感受,我們經(jīng)常會聽到一首歌的時候,突然忘瞭這個歌叫什麼名字瞭,其實很想知道,甚至想知道這個歌是誰唱的,很著急。另外一個是我相信有孩子的傢長,經(jīng)常會有這種困惑,你帶著孩子去動物園,去植物園玩的時候,突然孩子會問,爸爸,這個植物叫什麼名字,可能有人就傻瞭,回答不出來,他很想知道這個到底是什麼東西。這就是我說的,我們在生活中經(jīng)常會遇

21、到這些問題。今天我們各個合作夥伴來到瞭黃山,我這裡說一個黃山的例子,這個圖片是不是很像一個枇杷,我不知道他是什麼,我可以通過百度的識圖來拍一下,通過這個識圖,我們很快就知道這個植物的名字叫做香榧,這是黃山的特產(chǎn),樹齡特別長,有千年香榧之稱,明天我們組織大傢旅遊的時候,大傢可以看一下。傳統(tǒng)的搜索框主要是滿足用戶文本的搜索,這裡面有一個很大的局限性。很多東西其實我們隻用文字輸入是非常不方便的,比如我舉這個例子,白毛掌,你用文字輸入形容是很難的事情,最簡單的是拍照進行搜索,反而變得更加容易。百度有這個圖象識別的技術(shù),可以幫助大傢以圖搜圖,同時我還可以對這個圖做各種解釋和說明,可以看這個圖背後的一些故

22、事。除瞭圖片搜索技術(shù)以外,我們還給大傢看一個語音搜索和交互搜索的例子。這是一個通過去哪兒的APP購買機票和訂酒店的例子。去哪兒使用的是百度語音搜索的技術(shù),其實這個APP是已經(jīng)做到裡面去瞭,就是去哪兒訂酒店的APP,大傢可以試一下,你直接說就行瞭,不需要進行文字的輸入,他可以很智能的知道你訂什麼酒店和機票,他會給你進行一些推薦。除瞭滿足用戶在多媒體輸入方面的需求以外,我們也在嘗試讓百度變得更加的智能,可能有的合作夥伴第一次來黃山,對黃山不是特別瞭解,不過這個沒關(guān)系,你可能總知道這裡面一兩個信息,比如說黃山松,這個大傢知道,沒來過黃山的人也聽朋友講過,這是非常有名的。你可以在百度上搜索黃山松這個詞

23、,百度就會很智能的推薦給你和黃山相關(guān)的一些名勝古跡,或者相應(yīng)的一些植物。他其實是一個聯(lián)想的功能,你在搜這個詞的時候,我可以給你一些和這個相關(guān)的信息,便於你學(xué)習(xí)和理解。在數(shù)據(jù)挖掘和智能的推薦的維度上,百度也做瞭很多的探索,大傢喜歡娛樂的,可以搜索一下黃海波,通過這個事件縱深的挖掘,可以幫助大傢理解黃海波事件的來龍去脈,有人突然聽到這個詞,搞不懂什麼意思,你搜索一下,我們可以告訴你這個事情怎麼發(fā)生的,大傢怎麼議論的,全部給你梳理一下。還有一個例子,大傢也可以查一下馬航,當(dāng)時馬航事件的時候,大傢找飛機找瞭將近一個月,還在不停的找。你搜索這個詞的時候,我們也給你進行一個時間脈絡(luò)的梳理,在這一個月當(dāng)中,

24、馬航事件到底發(fā)生瞭多少事情。喜歡歷史的朋友,可以搜一下建文帝,歷史學(xué)的不好,沒太大關(guān)系,他是明朝的第二個皇帝,但知識圖譜可以告訴大傢明朝的相關(guān)皇帝和大臣,全部的整理在一起,你可以一個個點著看,慢慢就明白這裡面這些人的關(guān)系,或者是這些人的故事。喜歡旅行的朋友,比如說有人說,我搜一下頤和園,就可以實時性的推薦,讓大傢瞭解這個經(jīng)典的人群分佈,到底這個景點擠不擠,擁不擁堵,我今天要不要去,或者說搜索一下後海,今天晚上這個地方熱不熱鬧。這是我們一個實時推薦的技術(shù)。剛才我也提到瞭,喜歡動植物的朋友,你搜索一個植物,就可以有一個引導(dǎo)搜索,幫助大傢進行分類瞭解。前面我們講瞭一些產(chǎn)品創(chuàng)新的例子,其實產(chǎn)品創(chuàng)新的同

25、時,對於百度的基礎(chǔ)設(shè)施也是提出瞭非常高的要求,首先,要求百度具有強大的數(shù)據(jù)處理能力,這個裡面有三個要點,第一個是大數(shù)據(jù),百度收錄瞭全世界超過一萬億張網(wǎng)頁,百度要有搜集大數(shù)據(jù)的能力,這一萬億張網(wǎng)頁是什麼概念呢,我打一個比喻,相當(dāng)於5000個國傢圖書館的信息量的總和。數(shù)據(jù)量是非常大的。第二個是高吞吐,百度每天有百億次的訪問請求,還有一點是非常重要的,就是低延遲,網(wǎng)頁從更新到索引,隻需要幾十秒,更新的速度要快,這是非常有技術(shù)含量的。我們真正的做到瞭在大數(shù)據(jù)量下的秒級的索引。同時,百度還有非常強大的計算能力,超大規(guī)模存儲和分佈式計算的能力。這是非常重要的。從商業(yè)的角度來看,百度做瞭十年的精準營銷的服務(wù),一直保持著對相關(guān)性預(yù)測模型的持續(xù)優(yōu)化,在投入資源、算法以及最終的效果上,應(yīng)該都是國內(nèi)頂尖的水平。比如我們對於廣告特征的挖掘,我們達到瞭千億級別,如果以銀河系恒星計算,就相當(dāng)於把兩個銀河系的恒星。我們每天有超大規(guī)模的樣本來計算,建立這樣一個模型。如果地球上每個人都是一個樣本,我們這個量就相當(dāng)於十萬個地球那麼多的人口。在這裡面,我們看到樣本的數(shù)據(jù)量是非常大的。還有一些基礎(chǔ)架構(gòu),我們也在嘗試新的搜索體驗,比如

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論