![搜索引擎的智能進(jìn)化引發(fā)無限商機(jī)_第1頁](http://file4.renrendoc.com/view/b694c5a8fad61f598dfa7fd1285b2f71/b694c5a8fad61f598dfa7fd1285b2f711.gif)
![搜索引擎的智能進(jìn)化引發(fā)無限商機(jī)_第2頁](http://file4.renrendoc.com/view/b694c5a8fad61f598dfa7fd1285b2f71/b694c5a8fad61f598dfa7fd1285b2f712.gif)
![搜索引擎的智能進(jìn)化引發(fā)無限商機(jī)_第3頁](http://file4.renrendoc.com/view/b694c5a8fad61f598dfa7fd1285b2f71/b694c5a8fad61f598dfa7fd1285b2f713.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
搜索引擎的智能進(jìn)化引發(fā)無限商機(jī)
§我們熟悉的搜索,使用起來并不容易我們每天出于好奇或者懶惰,或急不可待、或漫不經(jīng)心地使用著搜索,在互聯(lián)網(wǎng)托起的信息世界中追尋著各自不同的線索和方向。根據(jù)comScore的統(tǒng)計,2009年互聯(lián)網(wǎng)平均每天會發(fā)生約44億次搜索,其中發(fā)生在中國的搜索次數(shù)占到10%左右,日均4.4億次。如果結(jié)合中國2.6億的搜索引擎用戶數(shù)來做一個簡單的估算,我們每天都會在互聯(lián)網(wǎng)上搜索1~2次。在我們經(jīng)常使用的搜索工具的背后,是處理能力強(qiáng)大的搜索引擎。它時刻不停地去捕獲互聯(lián)網(wǎng)上公開出來的幾乎所有的網(wǎng)頁內(nèi)容,對取回的內(nèi)容進(jìn)行分析、抽取、分類、標(biāo)識等一系列處理,然而進(jìn)行結(jié)構(gòu)化組織,這一過程即索引的過程,完成之后的索引以搜索服務(wù)的形式提供給互聯(lián)網(wǎng)用戶使用。這一過程并不簡單,要知道,搜索引擎面對的是互聯(lián)網(wǎng)上超過2億3千多萬家的網(wǎng)站,以及這些網(wǎng)站所包含的一層又一層難以計數(shù)的網(wǎng)頁內(nèi)容。但在大眾的眼里,搜索引擎僅僅是關(guān)于提問和解答的簡單工具??墒怯脩羰褂盟阉鲝膩砭筒辉杏X到過簡單。我們經(jīng)歷的搜索歷程往往是,第一次不假思索地輸入幾個關(guān)鍵詞給搜索引擎,很快發(fā)現(xiàn)沒有找到任何想要的結(jié)果;稍加思索后第二次輸入修正的關(guān)鍵詞,仍然對結(jié)果不甚滿意,于是接著繼續(xù)…。一位思想家曾精妙地說道:“任何一次認(rèn)真搜索的結(jié)果只能是把一個問題變成兩個問題”。事實上有調(diào)查證明,我們平均搜索一個問題需要做5次查詢。最后我們發(fā)現(xiàn),向搜索引擎提出一個恰當(dāng)問題本身就是一個令人頭疼的問題。不過令人欣慰的是,對解決這個頭疼問題負(fù)有責(zé)任的永遠(yuǎn)是搜索引擎。一直以來,有追求的搜索引擎工程師們努力的目標(biāo)就是:搜索引擎應(yīng)該理解人們提出的不算太好的問題,也應(yīng)該給出不算太糟的答案。這也就意味著要讓搜索引擎“善解人意”。Google就不止一次對外宣稱,搜索的最終目標(biāo)是理解人的“意思”,即人工智能。挑戰(zhàn)固然很大,然而這也正是搜索引擎存在、并且不斷進(jìn)化的理由?!鞆?fù)雜的算法—一門平衡的藝術(shù)大約10年前我們還會驚嘆于搜索引擎能在零點幾秒的時間內(nèi)反饋數(shù)十萬條結(jié)果。今天,讓我們對搜索引擎不太滿意的已不再是反饋結(jié)果條數(shù)太少,恰恰相反是太多了,尤其是當(dāng)我們在第一頁結(jié)果當(dāng)中沒有發(fā)現(xiàn)任何勉強(qiáng)令人滿意的答案后。按照對搜索用戶的統(tǒng)計,50%以上的用戶至少會點擊一次搜索結(jié)果列出的那些鏈接。但對搜索結(jié)果有翻頁動作的用戶,則不到10%。這證明我們是懶惰的、缺乏耐心的。但這也證明,對于特定用戶所提的特定問題,讓最具相關(guān)性的少量答案出現(xiàn)在最重要、最顯眼的位置,這對搜索引擎來說是至關(guān)重要的。為了讓用戶多一點滿意,搜索引擎一方面仍在源源不斷地搜集互聯(lián)網(wǎng)上更多、更新的數(shù)據(jù),以免遺漏了對任何用戶而言具有價值的信息;另一方面,通過改善搜索引擎對用戶搜索請求的理解能力,并對數(shù)目繁多的搜索結(jié)果做更合理的排序,以便讓用戶心儀的少數(shù)答案出現(xiàn)在最重要、最顯眼的位置,這便是搜索算法要完成的核心任務(wù)。Google資深工程師阿密特.辛格將排序算法的難度形象地比喻為,讓一個機(jī)器人表演同時拋接200個瓶子的高難度雜技。Google早期主要是通過其核心算法PageRank(網(wǎng)頁級別)來幫助確定用戶查詢請求和網(wǎng)頁的相關(guān)程度,并因此贏得了用戶青睞。但如今搜索算法的復(fù)雜程度與當(dāng)初的情況不可同日而語,PageRank已經(jīng)是Google目前使用的200多種信號當(dāng)中的一個而已。更為復(fù)雜的是,左右搜索引擎的并不僅僅是用戶的感受,那些作為信息源頭的網(wǎng)站,常常會想方設(shè)法欺騙搜索引擎,以使自己在搜索結(jié)果列表中得到一個更好的位置。為了防止這種對用戶不利的作弊行為,Google每年都會將其搜索算法調(diào)整幾百次。而且一些搜索引擎有時為顧及自己的利益,而對搜索算法施以“獨家秘方”。因而,當(dāng)前的搜索進(jìn)化已演變?yōu)橛脩?、搜索引擎和信息源頭三方之間的一場博弈,搜索引擎需要在三者之間取得平衡。因而理想的搜索算法并沒有什么恒定的標(biāo)準(zhǔn),各家搜索引擎都有自己的算法配方,對外界諱莫如深?!炀嚯x完美還很遙遠(yuǎn)1998年Google創(chuàng)始人拉里.佩奇向外界推介自己的搜索引擎時,還忍不住這樣舉例來證明自己的技術(shù)優(yōu)勢:“如果你把‘AltaVista’(一款前輩搜索引擎的名稱)輸?shù)搅硗庖粋€搜索引擎中搜索,你能看到AltaVista的主頁嗎?很可能不會。而我們很好地解決了這個問題?!比缃竦乃阉饕娑紤?yīng)該能解決好這個問題,否則就不算合格,因為這個問題太簡單了。盡管Google常常被當(dāng)作丈量搜索引擎的標(biāo)尺,但Google副總裁瑪麗薩.梅耶爾仍將今天的搜索引擎技術(shù)比作15、16世紀(jì)的生物學(xué)和物理學(xué),她認(rèn)為搜索引擎到目前為止只完成了10%。搜索引擎的進(jìn)化還剛剛開始,這對剛剛加入、或即將加入搜索引擎競賽的后來者來說,無疑是一種鼓舞。這會讓他們有理由重拾信心,義無反顧地加入到搜索引擎的競爭行列。的確,我們今天使用的搜索距離完美還很遙遠(yuǎn)。事實上,我們越是熟練地使用搜索,反而花在互聯(lián)網(wǎng)上探索的時間就越長。我們有理由去多憧憬一下搜索進(jìn)化的未來。二.搜索引擎的智能進(jìn)化今天,搜索領(lǐng)域的專家們正在熱烈探討著關(guān)于社區(qū)搜索、移動搜索、個性化搜索、實時搜索、跨語言搜索等諸多話題。如果將這些話題理解為各個不同發(fā)展方向的搜索技術(shù)分支,我們會很容易偏離基本方向—“搜索是關(guān)于提出問題和給出答案的科學(xué)”。我們最終會發(fā)現(xiàn),各種努力都將殊途同歸,圍繞搜索引擎核心技術(shù)革新,始終都只有一個核心話題—如何讓搜索引擎更加智能?!鞆膫€性化走向智能一次午餐閑聊,我問幾位從事技術(shù)研發(fā)的同事:“你們是否知道自己平均每天Google了多少次?”他們回答,雖然經(jīng)常會在登錄狀態(tài)下使用Google,但完全沒有注意到自己每天的Google次數(shù),因為這樣的事情太習(xí)以為常了。于是我們進(jìn)一步探討,“如果你發(fā)現(xiàn)某天自己的Google次數(shù)處于高峰狀態(tài),是否可以推斷那一天你正處于趕工的重壓之下?”對這個問題大家有些遲疑。于是我修正了一下:“如果你某天Google次數(shù)驚人,幾乎可以說明你當(dāng)天正為解決某個工作問題而焦頭爛額”,大家都笑了。是的,搜索引擎已經(jīng)不僅僅是理解你的習(xí)慣而已了,它甚至已經(jīng)開始理解你在特定時段的精神狀態(tài)和情緒了。如果某一天,當(dāng)你過于頻繁地查詢一堆專業(yè)術(shù)語或者參考資料的時候,搜索引擎會在結(jié)果頁面的某個地方提示你要注意自己的健康狀況,并且向你推薦一些調(diào)節(jié)方法,你無需因為搜索引擎猜中了你的心思、切中了你的要害而感到恐懼。當(dāng)然,前提是你預(yù)先授權(quán)搜索引擎為你提供這樣的服務(wù)。其實,個性化搜索所帶來的技術(shù)革新意義,主要還是圍繞讓搜索引擎更好地理解用戶提出的問題,或者說能更好地理解特定用戶的特定意圖。過去幾年里,搜索已經(jīng)由“給我輸入的東西”轉(zhuǎn)變?yōu)椤敖o我想要的東西”。個性化搜索有兩條具體的發(fā)展路線。一方面,搜索引擎記錄關(guān)于用戶行為線索的一切能夠獲得的數(shù)據(jù)。當(dāng)這些數(shù)據(jù)多到足以描繪出該用戶的明顯蹤跡時,搜索引擎就能在一定程度上理解這個特定用戶的特定意圖。這時,搜索引擎就有能力實現(xiàn)上面提到過的場景。即使保守一點來看,當(dāng)兩個個性迥異的用戶用相同的搜索行為查詢相同的問題時,搜索引擎可能會為他們給出兩個完全不同的答案。因為此時搜索引擎掌握了他們兩人的個性,因而可以因人而異地回答問題了。另一方面,搜索引擎通過一切的客戶端工具,直接收集用戶在特定場景下有關(guān)特定狀態(tài)的一切數(shù)據(jù)。例如正在同別人聊天的用戶查詢某個問題的時候,可能會因為剛才聊天時表達(dá)了某種意向而得到更合心意的答案;或者正在下載音樂的用戶查詢時可能會得到一份流行排行榜。有人將這種個性化搜索稱為情境搜索。然而無論哪條路線,隱私安全的問題都是至關(guān)重要的。搜索引擎必須在征得用戶同意的前提下,來發(fā)展個性化搜索。因為它對個人的影響實在是太大了?!焐鐣挠绊懽屗阉饕娓咧腔坌侣劸酆暇W(wǎng)站Digg是一家被稱為“用戶驅(qū)動的內(nèi)容網(wǎng)站”。它也有自己的“頭版頭條”,頭版列表的每個標(biāo)題旁都有一個數(shù)字,標(biāo)識該篇報道得到用戶投票的數(shù)量。Digg的每一位用戶都可以為自己喜歡的報道透上一票。得到足夠多票數(shù)的報道就有可能享受到出現(xiàn)在頭版的那份榮耀。這個在Web2.0時代風(fēng)靡一時的新聞社區(qū)網(wǎng)站,使得群體用戶可以施加對信息屬性的影響,例如重要性、關(guān)注度等。而在以前這些都是傳媒大亨、媒體主編們的特權(quán)。再看另一個例子-Twitter。在這個移動互聯(lián)網(wǎng)時代非常典型的微博社區(qū)里,作者受關(guān)注程度,或者說號召力,取決于他或她,甚至是它的跟隨者(Follows)的人數(shù)。這與在現(xiàn)實社會當(dāng)中的影響力或者號召力是如此的相似,而且Twitter的規(guī)律卻比現(xiàn)實社會確定得多,因為它被精確地量化了。盡管上述兩個社區(qū)也都提供自己的搜索功能,而且Twitter搜索量驚人,已超過日均6億次,然而,更值得關(guān)注的是在這些社區(qū)里,由用戶群體自發(fā)催生出來的,關(guān)于信息內(nèi)容的各種新的屬性信號,這是典型的社會性信號,社會性特征被帶到了信息世界里了。搜索引擎如果在捕獲信息的同時,獲得這些社會性信號,其價值將遠(yuǎn)勝過類似PageRank計算出來的信號。實際上,這意味著搜索引擎開始理解社會了,而其最終的意義是,搜索引擎能為同樣具有社會性特征的用戶,提供更好的搜索結(jié)果?!煲苿铀阉鞯母镄乱饬x關(guān)于移動搜索,工程師們最早的設(shè)計意圖就是為用戶提供隨時可以使用的搜索。但是圍繞隨時、隨地、隨身的搜索的話題,已經(jīng)讓人感到索然無味。歸根結(jié)底,這些都是移動網(wǎng)絡(luò)與搜索引擎的簡單接合所帶來的變化。即便我們?nèi)魏螘r候都可以使用搜索了,如果搜索結(jié)果不能令人滿意,一切也于事無補(bǔ)。是的,如果我們拋棄“移動的”搜索這樣片面的理解,我們會發(fā)現(xiàn)圍繞移動搜索要探究的命題始終還是關(guān)于:提出更好的問題,給出更好的答案。伏爾泰說過:“根據(jù)一個人提的問題而不是他給的答案來判斷他的為人”。然而根據(jù)統(tǒng)計,我們平均每次搜索只會鍵入2個左右的詞,作為用戶的我們是如此的懶惰,以至于我們所提問題包含的信息常常太少,而且還可能含義模糊,很難讓機(jī)器做出正確的判斷。有遠(yuǎn)見一點的工程師已經(jīng)在考慮如何將移動網(wǎng)絡(luò)的能力挖掘出來,以便幫助用戶向搜索引擎提供更多的輸入信號,最終幫助搜索引擎理解用戶。例如移動網(wǎng)絡(luò)帶來的定位能力,使得用戶每次搜索時不用任何額外動作,搜索引擎都將獲得一個重要的、同時足夠準(zhǔn)確的搜索條件—位置。當(dāng)你搜索一家加油站的時候,搜索引擎如果知道你所在位置,就可以把離你最近的一家加油站的位置顯示在搜索結(jié)果當(dāng)中。更讓我著迷的是那些智能手機(jī)具有的日益強(qiáng)大的感知能力。如今,蘋果的iPhone4已經(jīng)具備陀螺儀(感知三維姿態(tài))、水平儀(感知二維姿態(tài))、指南針(辨別方向)、距離遠(yuǎn)近傳感器、速度傳感器、光亮度傳感器、震動傳感器、GPS(定位能力)、攝像頭(捕捉影像)等等能力。這些能力綜合起來幾乎可以模仿人類去感知周圍的世界了。試想,智能手機(jī)感知它的主人所處的,特定現(xiàn)實情境的各類信號,同時也感知主人本身的特定狀態(tài)的各類信號,通過移動網(wǎng)絡(luò)傳遞給搜索引擎,如此豐富的信號可以幫助搜索引擎做到善解人意。不用等到用戶主動查詢,搜索引擎就可以主動地、及時地給出各種必要的提示、幫助等等信息。三.搜索引擎的智能進(jìn)化催生新的商業(yè)模式【數(shù)據(jù)來源于兩家公司的財報】從Google和Yahoo的,我們看到的不僅僅是兩條截然不同的典型企業(yè)的發(fā)展軌跡,這背后更大的含義在于,代表舊媒介規(guī)則的勢力正在讓位于新媒介規(guī)則下的新生代。運(yùn)作于舊規(guī)則下的企業(yè)或許幾年前還在以巨人姿態(tài)傲視一切,但現(xiàn)在它們已完全跟不上新媒介規(guī)則下脫胎換骨的企業(yè)的步伐了。雖然同樣是開展廣告業(yè)務(wù),但互聯(lián)網(wǎng)搜索的商業(yè)模式與門戶網(wǎng)站等按傳統(tǒng)媒介規(guī)則運(yùn)作的公司完全不同。Google開展廣告業(yè)務(wù)的模式主要有兩種:針對廣告主的AdWords和針對中小網(wǎng)站或內(nèi)容發(fā)布者的AdSence。對于AdWords,當(dāng)用戶搜索某一關(guān)鍵詞時,搜索結(jié)果右側(cè)可能會出現(xiàn)相關(guān)性很強(qiáng)的一系列商品廣告鏈接。Google將關(guān)鍵詞出售給廣告主,按點擊量獲得廣告收入。而AdSence其實是一種廣告聯(lián)盟,如果一個網(wǎng)站與Google達(dá)成這一模式的合作,當(dāng)有用戶訪問該網(wǎng)站時,就能夠看到Google的廣告,如果他們點擊這個廣告,Google就會和該網(wǎng)站分享這些點擊所獲得的收入。Google通過自動的廣告投放和運(yùn)營系統(tǒng),相對傳統(tǒng)模式極大地降低了廣告成本,精確的效果量化,讓廣告客戶可以了解到他們的投資回報率(ROI)。Google專注于這一商業(yè)模式近10年,其收入從2001年的8千6百多萬美元,一直到2009年達(dá)到236.5億美元。通常人們會將Google商業(yè)模式歸結(jié)為“售賣注意力”,我更傾向于將它歸結(jié)為“售賣相關(guān)性”,搜索引擎實現(xiàn)的廣告與用戶查詢結(jié)果的相關(guān)性才是成功的關(guān)鍵,這才是搜索引擎的核心商業(yè)價值。當(dāng)你搜索“嬰兒用品”的時候,搜索結(jié)果旁邊只會出現(xiàn)一些實際的嬰兒商品廣告,而不會是別的。不會分散或擾亂你的注意力,甚至很可能給你帶來幫助。事實上,相關(guān)性的潛在價值可能催生出比廣告更加直接的商業(yè)模式。用戶搜索目標(biāo)常常就是商品本身,或者更直接的干脆就是如何購買商品。據(jù)統(tǒng)計,人們提出帶有商業(yè)性質(zhì)的問題的比例接近25%。同時,伴隨著互聯(lián)網(wǎng)電子商務(wù)的日漸成熟,出現(xiàn)搜索引擎和電子商務(wù)結(jié)合的商業(yè)模式也就自然而然了。我在這里探討的這一商業(yè)模式與電子商務(wù)網(wǎng)站自己提供的商品搜索服務(wù)完全不同。例如阿里巴巴的淘寶網(wǎng)也提供搜索,而且搜索對它越來越重要了,但這僅是局限于一個網(wǎng)站內(nèi)部。面向互聯(lián)網(wǎng)的搜索引擎首先為用戶(同時也是潛在的消費者)解決信息流的問題,而后通過電子支付為消費者提供直接的在線商品交易的途徑,最后是線下的物流環(huán)節(jié),這一般是傳統(tǒng)電子商務(wù)運(yùn)營商去負(fù)責(zé)解決的問題。用戶在這一過程當(dāng)中得到了一站式的體驗,不用在不同的網(wǎng)站間來回切換。而這種商業(yè)模式對商家的投資匯率更有優(yōu)勢,它已經(jīng)繞過了廣告的環(huán)節(jié)。當(dāng)搜索引擎進(jìn)化到更加智能的階段、變得善解人意的時候,當(dāng)搜索引擎開始引導(dǎo)你的每一天的工作、生活、日常方方面面活動的時候,我們已經(jīng)很難估量它的商業(yè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 部編初中歷史八下第12課民族大團(tuán)結(jié)教案
- 年產(chǎn)50萬套中醫(yī)醫(yī)療器械生產(chǎn)線技術(shù)改造項目可行性研究報告模板-立項拿地
- 中藥烏藥課件
- 2025-2030全球數(shù)字道路行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球SCR 尿素系統(tǒng)行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國鉺鐿共摻光纖行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國魚塘凈水器行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030全球汽車出風(fēng)口空氣清新劑行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國IG100氣體滅火系統(tǒng)行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國電子學(xué)習(xí)開發(fā)服務(wù)行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年春節(jié)安全專題培訓(xùn)(附2024年10起重特大事故案例)
- 2025年江蘇太倉水務(wù)集團(tuán)招聘筆試參考題庫含答案解析
- 遼寧省沈陽名校2025屆高三第一次模擬考試英語試卷含解析
- 《中小學(xué)校園食品安全和膳食經(jīng)費管理工作指引》專題知識培訓(xùn)
- 2024年新疆區(qū)公務(wù)員錄用考試《行測》真題及答案解析
- 第三章-自然語言的處理(共152張課件)
- 行政事業(yè)單位國有資產(chǎn)管理辦法
- 六年級口算訓(xùn)練每日100道
- 高一生物生物必修一全冊考試題帶答題紙答案
- 北師大版五年級上冊四則混合運(yùn)算100道及答案
- 人教部編版道德與法治八年級下冊:6.3 《國家行政機(jī)關(guān)》說課稿1
評論
0/150
提交評論