![搜索引擎基本資料.doc_第1頁](http://file.renrendoc.com/FileRoot1/2020-2/5/d85d98c8-c772-4b58-adb4-f2824d5e1012/d85d98c8-c772-4b58-adb4-f2824d5e10121.gif)
![搜索引擎基本資料.doc_第2頁](http://file.renrendoc.com/FileRoot1/2020-2/5/d85d98c8-c772-4b58-adb4-f2824d5e1012/d85d98c8-c772-4b58-adb4-f2824d5e10122.gif)
![搜索引擎基本資料.doc_第3頁](http://file.renrendoc.com/FileRoot1/2020-2/5/d85d98c8-c772-4b58-adb4-f2824d5e1012/d85d98c8-c772-4b58-adb4-f2824d5e10123.gif)
![搜索引擎基本資料.doc_第4頁](http://file.renrendoc.com/FileRoot1/2020-2/5/d85d98c8-c772-4b58-adb4-f2824d5e1012/d85d98c8-c772-4b58-adb4-f2824d5e10124.gif)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
搜索引擎一、搜索引擎的概念搜索引擎(search engine)是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,在對信息進(jìn)行組織和處理后,并將處理后的信息顯示給用戶,是為用戶提供檢索服務(wù)的系統(tǒng)。新競爭力通過對搜索引擎營銷的規(guī)律深入研究認(rèn)為:搜索引擎推廣是基于網(wǎng)站內(nèi)容的推廣這就是搜索引擎營銷的核心思想。這句話說起來很簡單,如果仔細(xì)分析會(huì)發(fā)現(xiàn),這句話的確包含了搜索引擎推廣的一般規(guī)律。本文作者在“網(wǎng)站推廣策略之內(nèi)容推廣思想漫談”一文中提出一個(gè)觀點(diǎn):“網(wǎng)站內(nèi)容不僅是大型ICP網(wǎng)站的生命源泉,對于企業(yè)網(wǎng)站網(wǎng)絡(luò)營銷的效果同樣是至關(guān)重要的”。因?yàn)榫W(wǎng)站內(nèi)容本身也是一種有效的網(wǎng)站推廣手段,只是這種推廣需要借助于搜索引擎這個(gè)信息檢索工具,因此網(wǎng)站內(nèi)容推廣策略實(shí)際上也就是搜索引擎推廣策略的具體應(yīng)用。二、搜索引擎的分類1、全文索引全文索引引擎是名副其實(shí)的搜索引擎,國外代表有Google,國內(nèi)則有著名的百度搜索。它們從互聯(lián)網(wǎng)提取各個(gè)網(wǎng)站的信息(以網(wǎng)頁文字為主),建立起數(shù)據(jù)庫,并能檢索與用戶查詢條件相匹配的記錄,按一定的排列順序返回結(jié)果。 根據(jù)搜索結(jié)果來源的不同,全文搜索引擎可分為兩類,一類擁有自己的網(wǎng)頁抓取、索引、檢索系統(tǒng)(Indexer),有獨(dú)立的“蜘蛛”(Spider)程序、或爬蟲(Crawler)、或“機(jī)器人”(Robot)程序(這三種稱法意義相同),能自建網(wǎng)頁數(shù)據(jù)庫,搜索結(jié)果直接從自身的數(shù)據(jù)庫中調(diào)用,上面提到的Google和百度就屬于此類;另一類則是租用其他搜索引擎的數(shù)據(jù)庫,并按自定的格式排列搜索結(jié)果,如Lycos搜索引擎。 2、目錄索引目錄索引雖然有搜索功能,但嚴(yán)格意義上不能稱為真正的搜索引擎,只是按目錄分類的網(wǎng)站鏈接列表而已。用戶完全可以按照分類目錄找到所需要的信息,不依靠關(guān)鍵詞(Keywords)進(jìn)行查詢。目錄索引中最具代表性的莫過于大名鼎鼎的Yahoo、新浪分類目錄搜索。 3、元搜索引擎元搜索引擎(META Search Engine)接受用戶查詢請求后,同時(shí)在多個(gè)搜索引擎上搜索,并將結(jié)果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索結(jié)果排列方面,有的直接按來源排列搜索結(jié)果,如Dogpile;有的則按自定的規(guī)則將結(jié)果重新排列組合,如Vivisimo。 4、垂直搜索引擎垂直搜索引擎為2006年后逐步興起的一類搜索引擎。不同于通用的網(wǎng)頁搜索引擎,垂直搜索專注于特定的搜索領(lǐng)域和搜索需求(例如:機(jī)票搜索、旅游搜索、生活搜索、小說搜索、視頻搜索等等),在其特定的搜索領(lǐng)域有更好的用戶體驗(yàn)。相比通用搜索動(dòng)輒數(shù)千臺(tái)檢索服務(wù)器,垂直搜索需要的硬件成本低、用戶需求特定、查詢的方式多樣。 5、其他非主流搜索引擎形式:1、集合式搜索引擎:該搜索引擎類似元搜索引擎,區(qū)別在于它并非同時(shí)調(diào)用多個(gè)搜索引擎進(jìn)行搜索,而是由用戶從提供的若干搜索引擎中選擇,如HotBot在2002年底推出的搜索引擎。 2、門戶搜索引擎:AOL Search、MSN Search等雖然提供搜索服務(wù),但自身既沒有分類目錄也沒有網(wǎng)頁數(shù)據(jù)庫,其搜索結(jié)果完全來自其他搜索引擎。 3、免費(fèi)鏈接列表(Free For All Links簡稱FFA):一般只簡單地滾動(dòng)鏈接條目,少部分有簡單的分類目錄,不過規(guī)模要比Yahoo!等目錄索引小很多。 三、搜索引擎的工作原理1、抓取網(wǎng)頁每個(gè)獨(dú)立的搜索引擎都有自己的網(wǎng)頁抓取程序(spider)。Spider順著網(wǎng)頁中的超鏈接,連續(xù)地抓取網(wǎng)頁。被抓取的網(wǎng)頁被稱之為網(wǎng)頁快照。由于互聯(lián)網(wǎng)中超鏈接的應(yīng)用很普遍,理論上,從一定范圍的網(wǎng)頁出發(fā),就能搜集到絕大多數(shù)的網(wǎng)頁。 2、處理網(wǎng)頁搜索引擎抓到網(wǎng)頁后,還要做大量的預(yù)處理工作,才能提供檢索服務(wù)。其中,最重要的就是提取關(guān)鍵詞,建立索引文件。其他還包括去除重復(fù)網(wǎng)頁、分詞(中文)、判斷網(wǎng)頁類型、分析超鏈接、計(jì)算網(wǎng)頁的重要度/豐富度等。 3、提供檢索服務(wù)用戶輸入關(guān)鍵詞進(jìn)行檢索,搜索引擎從索引數(shù)據(jù)庫中找到匹配該關(guān)鍵詞的網(wǎng)頁;為了用戶便于判斷,除了網(wǎng)頁標(biāo)題和URL外,還會(huì)提供一段來自網(wǎng)頁的摘要以及其他信息。 四、全文搜索引擎在搜索引擎分類部分我們提到過全文搜索引擎從網(wǎng)站提取信息建立網(wǎng)頁數(shù)據(jù)庫的概念。搜索引擎的自動(dòng)信息搜集功能分兩種。一種是定期搜索,即每隔一段時(shí)間(比如Google一般是28天),搜索引擎主動(dòng)派出“蜘蛛”程序,對一定IP地址范圍內(nèi)的互聯(lián)網(wǎng)站進(jìn)行檢索,一旦發(fā)現(xiàn)新的網(wǎng)站,它會(huì)自動(dòng)提取網(wǎng)站的信息和網(wǎng)址加入自己的數(shù)據(jù)庫。蜘蛛搜索引擎另一種是提交網(wǎng)站搜索,即網(wǎng)站擁有者主動(dòng)向搜索引擎提交網(wǎng)址,它在一定時(shí)間內(nèi)(2天到數(shù)月不等)定向向你的網(wǎng)站派出“蜘蛛”程序,掃描你的網(wǎng)站并將有關(guān)信息存入數(shù)據(jù)庫,以備用戶查詢。由于近年來搜索引擎索引規(guī)則發(fā)生了很大變化,主動(dòng)提交網(wǎng)址并不保證你的網(wǎng)站能進(jìn)入搜索引擎數(shù)據(jù)庫,因此目前最好的辦法是多獲得一些外部鏈接,讓搜索引擎有更多機(jī)會(huì)找到你并自動(dòng)將你的網(wǎng)站收錄。 當(dāng)用戶以關(guān)鍵詞查找信息時(shí),搜索引擎會(huì)在數(shù)據(jù)庫中進(jìn)行搜尋,如果找到與用戶要求內(nèi)容相符的網(wǎng)站,便采用特殊的算法通常根據(jù)網(wǎng)頁中關(guān)鍵詞的匹配程度,出現(xiàn)的位置/頻次,鏈接質(zhì)量等計(jì)算出各網(wǎng)頁的相關(guān)度及排名等級(jí),然后根據(jù)關(guān)聯(lián)度高低,按順序?qū)⑦@些網(wǎng)頁鏈接返回給用戶。 這種引擎它的特點(diǎn)是搜全率比較高。 五、目錄索引與全文搜索引擎相比,目錄索引有許多不同之處。 首先,搜索引擎屬于自動(dòng)網(wǎng)站檢索,而目錄索引則完全依賴手工操作。用戶提交網(wǎng)站后,目錄編輯人員會(huì)親自瀏覽你的網(wǎng)站,然后根據(jù)一套自定的評判標(biāo)準(zhǔn)甚至編輯人員的主觀印象,決定是否接納你的網(wǎng)站。 其次,搜索引擎收錄網(wǎng)站時(shí),只要網(wǎng)站本身沒有違反有關(guān)的規(guī)則,一般都能登錄成功。而目錄索引對網(wǎng)站的要求則高得多,有時(shí)即使登錄多次也不一定成功。尤其象Yahoo這樣的超級(jí)索引,登錄更是困難。 此外,在登錄搜索引擎時(shí),我們一般不用考慮網(wǎng)站的分類問題,而登錄目錄索引時(shí)則必須將網(wǎng)站放在一個(gè)最合適的目錄(Directory)。 最后,搜索引擎中各網(wǎng)站的有關(guān)信息都是從用戶網(wǎng)頁中自動(dòng)提取的,所以用戶的角度看,我們擁有更多的自主權(quán);而目錄索引則要求必須手工另外填寫網(wǎng)站信息,而且還有各種各樣的限制。更有甚者,如果工作人員認(rèn)為你提交網(wǎng)站的目錄、網(wǎng)站信息不合適,他可以隨時(shí)對其進(jìn)行調(diào)整,當(dāng)然事先是不會(huì)和你商量的。 目錄索引,顧名思義就是將網(wǎng)站分門別類地存放在相應(yīng)的目錄中,因此用戶在查詢信息時(shí),可選擇關(guān)鍵詞搜索,也可按分類目錄逐層查找。如以關(guān)鍵詞搜索,返回的結(jié)果跟搜索引擎一樣,也是根據(jù)信息關(guān)聯(lián)程度排列網(wǎng)站,只不過其中人為因素要多一些。如果按分層目錄查找,某一目錄中網(wǎng)站的排名則是由標(biāo)題字母的先后順序決定(也有例外)。 目前,搜索引擎與目錄索引有相互融合滲透的趨勢。原來一些純粹的全文搜索引擎現(xiàn)在也提供目錄搜索,如Google就借用Open Directory目錄提供分類查詢。而象 Yahoo! 這些老牌目錄索引則通過與Google等搜索引擎合作擴(kuò)大搜索范圍(注)。在默認(rèn)搜索模式下,一些目錄類搜索引擎首先返回的是自己目錄中匹配的網(wǎng)站,如國內(nèi)搜狐、新浪、網(wǎng)易等;而另外一些則默認(rèn)的是網(wǎng)頁搜索,如Yahoo。 這種引擎的特點(diǎn)是找的準(zhǔn)確率比較高。 六、搜索引擎的發(fā)展史互聯(lián)網(wǎng)發(fā)展早期,以雅虎為代表的網(wǎng)站分類目錄查詢非常流行。網(wǎng)站分類目錄由人工整理維護(hù),精選互聯(lián)網(wǎng)上的優(yōu)秀網(wǎng)站,并簡要描述,分類放置到不同目錄下。用戶查詢時(shí),通過一層層的點(diǎn)擊來查找自己想找的網(wǎng)站。也有人把這種基于目錄的檢索服務(wù)網(wǎng)站稱為搜索引擎,但從嚴(yán)格意義上講,它并不是搜索引擎。 1990年,加拿大麥吉爾大學(xué)(University of McGill)計(jì)算機(jī)學(xué)院的師生開發(fā)出Archie。當(dāng)時(shí),萬維網(wǎng)(World Wide Web)還沒有出現(xiàn),人們通過FTP來共享交流資源。Archie能定期搜集并分析FTP服務(wù)器上的文件名信息,提供查找分別在各個(gè)FTP主機(jī)中的文件。用戶必須輸入精確的文件名進(jìn)行搜索,Archie告訴用戶哪個(gè)FTP服務(wù)器能下載該文件。雖然Archie搜集的信息資源不是網(wǎng)頁(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動(dòng)搜集信息資源、建立索引、提供檢索服務(wù)。所以,Archie被公認(rèn)為現(xiàn)代搜索引擎的鼻祖。 搜索引擎的起源:所有搜索引擎的祖先,是1990年由Montreal的McGill University三名學(xué)生(Alan Emtage、Peter Deutsch、Bill Wheelan)發(fā)明的Archie(Archie FAQ)。Alan Emtage等想到了開發(fā)一個(gè)可以用文件名查找文件的系統(tǒng),于是便有了Archie。Archie是第一個(gè)自動(dòng)索引互聯(lián)網(wǎng)上匿名FTP網(wǎng)站文件的程序,但它還不是真正的搜索引擎。Archie是一個(gè)可搜索的FTP文件名列表,用戶必須輸入精確的文件名搜索,然后Archie會(huì)告訴用戶哪一個(gè)FTP地址可以下載該文件。 由于Archie深受歡迎,受其啟發(fā),Nevada System Computing Services大學(xué)于1993年開發(fā)了一個(gè)Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后來另一個(gè)Gopher搜索工具。 搜索引擎的影響一、搜索引擎給網(wǎng)吧行業(yè)帶來的影響走進(jìn)網(wǎng)吧,不難發(fā)現(xiàn)各個(gè)網(wǎng)吧內(nèi)的電腦瀏覽器首頁或工具條上都會(huì)有g(shù)oogle或百度的標(biāo)志。百度甚至還推出了網(wǎng)吧聯(lián)盟,可見搜索引擎?zhèn)儗W(wǎng)吧行業(yè)都格外的青睞?,F(xiàn)在我們常用的搜索引擎無非就是百度和google兩種。從百度方面來看,百度聯(lián)盟可以算是目前唯一一個(gè)能夠覆蓋所有網(wǎng)吧并和幾乎所有主流網(wǎng)吧軟件締結(jié)合作關(guān)系的媒體運(yùn)營平臺(tái)。而google方面也不甘示弱,谷歌已經(jīng)注意到了網(wǎng)吧市場,網(wǎng)吧已經(jīng)成為了谷歌的新型合作伙伴。網(wǎng)吧的首頁和工具條上都會(huì)出現(xiàn)谷歌的標(biāo)志,相應(yīng)地會(huì)給谷歌帶去流量。谷歌對網(wǎng)吧市場的關(guān)注,表明谷歌注意到網(wǎng)吧作為中國互聯(lián)網(wǎng)市場的特色之一。由于我國PC擁有量遠(yuǎn)落后于美國等西方國家,網(wǎng)吧作為網(wǎng)民主要上網(wǎng)地點(diǎn)的比例逐年在上升,我國網(wǎng)民在網(wǎng)吧上網(wǎng)的比例偏高。據(jù)CNNIC 第20次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告顯示,超過1/3(37.2)的網(wǎng)民表示經(jīng)常去網(wǎng)吧上網(wǎng),比2006年12月的32.3高了5個(gè)百分點(diǎn),第一次超過網(wǎng)民在工作單位上網(wǎng)的比例而成為第二大上網(wǎng)場所。 七、搜索引擎對網(wǎng)站的影響一個(gè)網(wǎng)站的命脈就是流量,而網(wǎng)站的流量可以分為兩類。一類是自然流量,一類就是通過搜索引擎而來的流量。如果搜索引擎能夠能多能有效的抓取網(wǎng)站內(nèi)容,那么對于網(wǎng)站的好處是不言而喻的。所以,SEO也應(yīng)運(yùn)而生了。 在百度和谷歌兩大搜索引擎的工作中,百度的工作周期相對來說短一些,百度大約在10天左右重新訪問網(wǎng)站一次,Google大約在15天左右重新訪問一次網(wǎng)站。由于一天之內(nèi)不能游歷全球所有的網(wǎng)站,如果推廣網(wǎng)站時(shí),能到更多的網(wǎng)站上提交相應(yīng)的網(wǎng)站信息,也是加快蜘蛛收錄網(wǎng)站內(nèi)容的重要環(huán)節(jié)。 搜索引擎作用搜索引擎是網(wǎng)站建設(shè)中針對“用戶使用網(wǎng)站的便利性”所提供的必要功能,同時(shí)也是“研究網(wǎng)站用戶行為的 一個(gè)有效工具”。高效的站內(nèi)檢索可以讓用戶快速準(zhǔn)確地找到目標(biāo)信息,從而更有效地促進(jìn)產(chǎn)品/服務(wù)的銷售, 而且通過對網(wǎng)站訪問者搜索行為的深度分析,對于進(jìn)一步制定更為有效的網(wǎng)絡(luò)營銷策略具有重要價(jià)值。 1、從網(wǎng)絡(luò)營銷的環(huán)境看,搜索引擎營銷的環(huán)境發(fā)展為網(wǎng)絡(luò)營銷的推動(dòng)起到舉足輕重的作用 2、從效果營銷看,很多公司之所以可以應(yīng)用網(wǎng)絡(luò)營銷是利用了搜索引擎營銷 3、就完整型電
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度荒山荒坡生態(tài)修復(fù)與承包投資合作協(xié)議
- 2025年度海洋牧場建筑工程種類合同
- 2025年度夫妻共同財(cái)產(chǎn)捐贈(zèng)協(xié)議
- 2025年度交通設(shè)施工程監(jiān)理合同范本
- 2025年度農(nóng)產(chǎn)品供應(yīng)鏈管理服務(wù)合同
- 2025年度救護(hù)車跨區(qū)域緊急派遣合作協(xié)議
- 2025年度跨境數(shù)據(jù)傳輸合同內(nèi)容與數(shù)據(jù)安全保護(hù)
- 2025年度股權(quán)質(zhì)押貸款合同范本(針對高新技術(shù)項(xiàng)目)
- 二零二五年度農(nóng)產(chǎn)品加工企業(yè)技術(shù)改造合作合同
- 2025年中國金屬復(fù)合材料行業(yè)市場集中度、市場規(guī)模及未來前景分析報(bào)告
- 暢捷通g6財(cái)務(wù)管理系統(tǒng)專業(yè)版使用手冊
- 化工儀表及自動(dòng)化ppt課件匯總?cè)譸pt完整版課件最全教學(xué)教程整套課件全書電子教案全套電子講義
- 2022注冊電氣工程師專業(yè)考試規(guī)范清單匯總
- 一年級(jí)寫字下學(xué)期課件(PPT 38頁)
- 桂花-作文ppt-PPT課件(共14張)
- 高一數(shù)學(xué)概率部分知識(shí)點(diǎn)總結(jié)及典型例題解析 新課標(biāo) 人教版 必修
- 鐵路運(yùn)費(fèi)計(jì)算方法
- 《小腦梗死護(hù)理查房》
- 免疫及炎癥相關(guān)信號(hào)通路
- 某風(fēng)電場設(shè)備材料設(shè)備清單
- —橋梁專業(yè)施工圖設(shè)計(jì)審查要(終)
評論
0/150
提交評論