搜索引擎概述_第1頁(yè)
搜索引擎概述_第2頁(yè)
搜索引擎概述_第3頁(yè)
搜索引擎概述_第4頁(yè)
搜索引擎概述_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SEO搜索引擎優(yōu)化:基礎(chǔ)、案例與實(shí)戰(zhàn)(第2版)第2章搜索引擎概述目錄Contents2.1認(rèn)識(shí)搜索引擎2.2搜索引擎的工作原理2.3搜索引擎的使用方法2.4本章實(shí)訓(xùn)2.1.1搜索引擎的定義搜索引擎(SearchEngine)指根據(jù)一定的策略,運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,再對(duì)信息進(jìn)行組織和處理后,為用戶(hù)提供檢索服務(wù),最后將用戶(hù)檢索的相關(guān)信息展示給用戶(hù)的網(wǎng)站系統(tǒng)。簡(jiǎn)而言之,搜索引擎通過(guò)收集并整理互聯(lián)網(wǎng)上眾多網(wǎng)頁(yè)中的關(guān)鍵詞并進(jìn)行索引,進(jìn)而建立索引數(shù)據(jù)庫(kù)。當(dāng)用戶(hù)搜索某個(gè)關(guān)鍵詞時(shí),所有頁(yè)面內(nèi)容中包含該關(guān)鍵詞的網(wǎng)頁(yè)都將被作為搜索結(jié)果展現(xiàn)出來(lái)。搜索結(jié)果展現(xiàn)2.1.2搜索引擎的發(fā)展史1990年,加拿大麥吉爾大學(xué)(McGillUniversity)計(jì)算機(jī)學(xué)院的AlanEmtage研發(fā)了Archie。Archie可以定期搜集并分析FTP服務(wù)器上的文件名信息,為用戶(hù)提供查找分散保存在各個(gè)FTP主機(jī)中的文件的服務(wù)。Archie搜集的信息資源被公認(rèn)為搜索引擎的雛形。工作原理自動(dòng)搜集信息資源建立索引提供檢索服務(wù)2.1.2搜索引擎的發(fā)展史隨著互聯(lián)網(wǎng)的出現(xiàn),為了方便查詢(xún)互聯(lián)網(wǎng)中的網(wǎng)頁(yè)信息,真正的搜索引擎也應(yīng)運(yùn)而出,并隨著互聯(lián)網(wǎng)的發(fā)展不斷地發(fā)展和進(jìn)步??傮w說(shuō)來(lái),搜索引擎分為4代。1234分類(lèi)目錄時(shí)代用戶(hù)中心時(shí)代文本檢索時(shí)代整合分析時(shí)代2.1.3搜索引擎的分類(lèi)全文搜索引擎(FullTextSearchEngine)是目前應(yīng)用較廣泛的主流搜索引擎。1.全文搜索引擎全文搜索引擎從互聯(lián)網(wǎng)中提取各個(gè)網(wǎng)站的信息(以網(wǎng)頁(yè)文字為主),建立起網(wǎng)頁(yè)數(shù)據(jù)庫(kù),并檢索與用戶(hù)搜索條件相匹配的記錄,按一定的排列順序返回結(jié)果。國(guó)外搜索引擎Google國(guó)內(nèi)的百度和360搜索2.1.3搜索引擎的分類(lèi)全文搜索引擎又可以分為兩類(lèi)。1.全文搜索引擎租用其他搜索引擎的數(shù)據(jù)庫(kù)這種搜索引擎不能夠創(chuàng)建自己的數(shù)據(jù)庫(kù),無(wú)法滿足用戶(hù)的需求,現(xiàn)已逐漸被第一類(lèi)搜索引擎所替代。擁有自己的檢索程序能夠自己從互聯(lián)網(wǎng)中抓取網(wǎng)頁(yè)建立數(shù)據(jù)庫(kù),從自身的數(shù)據(jù)庫(kù)中調(diào)用搜索結(jié)果。2.1.3搜索引擎的分類(lèi)目錄搜索引擎(SearchIndex/Directory)也被稱(chēng)為“分類(lèi)檢索”,是以人工方式或者半自動(dòng)方式搜索網(wǎng)頁(yè)的內(nèi)容,并根據(jù)網(wǎng)頁(yè)的內(nèi)容和性質(zhì)將其歸納到不同層次的類(lèi)目之下,形成一定的人工信息摘要,最終形成像圖書(shū)館目錄一樣的樹(shù)狀分類(lèi)結(jié)構(gòu)索引。2.目錄搜索引擎目錄搜索引擎的結(jié)構(gòu)圖2.1.3搜索引擎的分類(lèi)元搜索引擎(MetaSearchEngine)是為了彌補(bǔ)傳統(tǒng)搜索引擎的不足而出現(xiàn)的一種輔助搜索工具,它可以使用戶(hù)只搜索一次就得到在多個(gè)搜索引擎中搜索的結(jié)果。典型的元搜索引擎有以下幾個(gè)。3.元搜索引擎InfoSpaceDogpileVivisimo2.1.3搜索引擎的分類(lèi)元搜索引擎由3個(gè)部分組成,分別是搜索請(qǐng)求處理模塊、搜索接口代理模塊、搜索結(jié)果顯示模塊。3.元搜索引擎元搜索引擎的工作原理2.1.3搜索引擎的分類(lèi)4.垂直搜索引擎垂直搜索引擎(VerticalSearchEngines)更專(zhuān)注于特定的搜索領(lǐng)域和搜索需求,如圖片搜索、視頻搜索、法律搜索、專(zhuān)利搜索、論文搜索等,它是對(duì)通用搜索內(nèi)容的細(xì)分。在其特定的搜索領(lǐng)域有更好的用戶(hù)體驗(yàn),如百度學(xué)術(shù)、百度文庫(kù)、Google學(xué)術(shù)等都是垂直搜索引擎。垂直搜索引擎的工作原理2.1.3搜索引擎的分類(lèi)4.垂直搜索引擎相比于其他無(wú)序化的搜索引擎,垂直搜索引擎更加專(zhuān)業(yè)和深入,進(jìn)而保證所收錄信息的完整性和及時(shí)性,且其返回的結(jié)果重復(fù)率低、相關(guān)性強(qiáng)、查準(zhǔn)率高。垂直搜索引擎最大的特點(diǎn)有如下幾點(diǎn)。最大特點(diǎn)精準(zhǔn)深行業(yè)色彩2.1.4常用的搜索引擎介紹1.百度百度是全球知名的中文搜索引擎,致力于向人們提供“簡(jiǎn)單,可依賴(lài)”的信息獲取方式。2000年1月,百度創(chuàng)立于北京中關(guān)村,百度的“百度”二字源于中國(guó)宋朝詞人辛棄疾的《青玉案》詩(shī)句:“眾里尋他千百度”,象征著百度對(duì)中文信息檢索技術(shù)的執(zhí)著追求。百度的服務(wù)器分布在全國(guó)各地,能直接從最近的服務(wù)器上把所搜索信息返回給當(dāng)?shù)赜脩?hù),使用戶(hù)享受極快的搜索體驗(yàn)。百度首頁(yè)2.1.4常用的搜索引擎介紹360搜索屬于全文搜索引擎,是目前廣泛應(yīng)用的主流搜索引擎之一,360搜索包含網(wǎng)頁(yè)、新聞、影視等搜索產(chǎn)品,能為用戶(hù)帶來(lái)更安全、更真實(shí)的搜索服務(wù)體驗(yàn)。360搜索不僅掌握通用搜索技術(shù),而且獨(dú)創(chuàng)PeopleRank算法、拇指計(jì)劃等創(chuàng)新技術(shù)。目前,360搜索已建立由數(shù)百名工程師組成的核心搜索技術(shù)團(tuán)隊(duì),擁有上萬(wàn)臺(tái)服務(wù)器,龐大的蜘蛛爬蟲(chóng)系統(tǒng)每日抓取網(wǎng)頁(yè)數(shù)量高達(dá)十億,收錄的優(yōu)質(zhì)網(wǎng)頁(yè)數(shù)量超過(guò)數(shù)百億,網(wǎng)頁(yè)搜索速度和質(zhì)量都非常領(lǐng)先。2.360搜索360搜索首頁(yè)2.1.4常用的搜索引擎介紹搜狗搜索是搜狐公司于2004年推出的第三代互動(dòng)式中文搜索引擎。其致力于中文互聯(lián)網(wǎng)信息的深度挖掘,幫助中國(guó)上億互聯(lián)網(wǎng)用戶(hù)加快信息獲取速度,為用戶(hù)創(chuàng)造價(jià)值。其中音樂(lè)搜索具有小于2%的死鏈率,圖片搜索具有獨(dú)特的組圖瀏覽功能,新聞搜索具有能夠及時(shí)反映互聯(lián)網(wǎng)熱點(diǎn)事件的看熱鬧首頁(yè),地圖搜索具有全國(guó)無(wú)縫漫游功能。3.搜狗搜索搜狗搜索首頁(yè)2.1.4常用的搜索引擎介紹谷歌(Google)是目前被公認(rèn)的全球最大的搜索引擎,是互聯(lián)網(wǎng)上最受歡迎的網(wǎng)站之一,在全球范圍內(nèi)擁有無(wú)數(shù)的用戶(hù)。Google允許以多種語(yǔ)言進(jìn)行搜索,有多達(dá)30余種語(yǔ)言可供選擇。Google以簡(jiǎn)單、干凈的頁(yè)面設(shè)計(jì)和最有關(guān)的搜索結(jié)果贏得了用戶(hù)的認(rèn)同。但目前Google退出了中國(guó)市場(chǎng),在國(guó)內(nèi)暫時(shí)無(wú)法訪問(wèn)。4.谷歌谷歌首頁(yè)2.1.4常用的搜索引擎介紹雅虎(Yahoo!)是美國(guó)著名的門(mén)戶(hù)網(wǎng)站之一,其服務(wù)范圍包括搜索引擎、電子郵件、新聞等,服務(wù)業(yè)務(wù)遍及24個(gè)國(guó)家和地區(qū)。Yahoo是最早實(shí)行“分類(lèi)目錄”的搜索數(shù)據(jù)庫(kù),也是目前重要的搜索服務(wù)網(wǎng)站之一。5.雅虎雅虎首頁(yè)目錄Contents2.1認(rèn)識(shí)搜索引擎2.2搜索引擎的工作原理2.3搜索引擎的使用方法2.4本章實(shí)訓(xùn)2.2.1蜘蛛爬行數(shù)據(jù)抓取系統(tǒng)是搜索引擎最重要組成系統(tǒng)之一,主要負(fù)責(zé)互聯(lián)網(wǎng)信息的搜集、保存和更新等,它就像蜘蛛一樣在互聯(lián)網(wǎng)上爬來(lái)爬去,因此也被叫做網(wǎng)絡(luò)蜘蛛(spider)或機(jī)器人(bot)。搜索引擎抓取網(wǎng)頁(yè)時(shí)會(huì)同時(shí)運(yùn)行多個(gè)蜘蛛程序,從一些重要的種子網(wǎng)址開(kāi)始,通過(guò)其網(wǎng)頁(yè)上的超鏈接,不斷發(fā)現(xiàn)新的網(wǎng)址并抓取,并不斷重復(fù)這個(gè)過(guò)程,盡最大可能抓取到更多網(wǎng)頁(yè)。由于互聯(lián)網(wǎng)中每時(shí)每刻都存在網(wǎng)頁(yè)被修改、刪除或出現(xiàn)新的超鏈接的可能,所以對(duì)于百度這樣的大型搜索引擎來(lái)說(shuō),還要不斷地對(duì)過(guò)去抓取過(guò)的頁(yè)面進(jìn)行更新。2.2.1蜘蛛爬行當(dāng)網(wǎng)絡(luò)蜘蛛爬行到某個(gè)網(wǎng)站時(shí),會(huì)首先檢查網(wǎng)站的根目錄下是否存在Robots文件,如果有,則會(huì)根據(jù)其約定不抓取禁止抓取的網(wǎng)頁(yè)。進(jìn)入允許抓取的網(wǎng)站后,網(wǎng)絡(luò)蜘蛛會(huì)采用如下3種策略爬行網(wǎng)站中的所有網(wǎng)頁(yè)。最佳優(yōu)先寬度優(yōu)先深度優(yōu)先2.2.1蜘蛛爬行深度優(yōu)先策略是早期使用較多的網(wǎng)絡(luò)蜘蛛爬行策略。在網(wǎng)站中,當(dāng)網(wǎng)絡(luò)蜘蛛發(fā)現(xiàn)一個(gè)鏈接后,網(wǎng)絡(luò)蜘蛛就會(huì)沿著這個(gè)鏈接爬到下一個(gè)網(wǎng)頁(yè),然后在這個(gè)網(wǎng)頁(yè)中又沿著新發(fā)現(xiàn)的鏈接爬下去,直到?jīng)]有未爬行的鏈接,再返回到第一個(gè)網(wǎng)頁(yè),沿著另一條鏈接繼續(xù)爬行。當(dāng)不再有新的超鏈出現(xiàn)時(shí),整個(gè)爬行過(guò)程結(jié)束。如圖所示,為深度優(yōu)先爬行策略,其中的數(shù)字為網(wǎng)絡(luò)蜘蛛爬行網(wǎng)頁(yè)的順序。1.深度優(yōu)先策略首頁(yè)12345678910111213142.2.1蜘蛛爬行寬度優(yōu)先策略指網(wǎng)絡(luò)蜘蛛來(lái)到一個(gè)網(wǎng)頁(yè)后,先爬行該網(wǎng)頁(yè)上的所有鏈接,然后再爬行下一層網(wǎng)頁(yè)的鏈接。如圖所示,為寬度優(yōu)先爬行策略,網(wǎng)絡(luò)蜘蛛首先爬行第1層的所有頁(yè)面,再爬行第2層的所有頁(yè)面,然后以此類(lèi)推,直到爬行完所有頁(yè)面。2.寬度優(yōu)先策略首頁(yè)14101151226131437892.2.1蜘蛛爬行最佳優(yōu)先策略指網(wǎng)絡(luò)蜘蛛到達(dá)一個(gè)網(wǎng)頁(yè)時(shí),將網(wǎng)頁(yè)中的所有鏈接收集到地址庫(kù)中,并對(duì)其進(jìn)行分析,從中篩選出重要性較高的鏈接進(jìn)行爬行。影響鏈接重要性的因素主要有網(wǎng)頁(yè)權(quán)重、網(wǎng)站規(guī)模和反應(yīng)速度等。當(dāng)某個(gè)鏈接的網(wǎng)頁(yè)權(quán)重值越高、網(wǎng)站規(guī)模越大、反應(yīng)速度越快時(shí),就會(huì)優(yōu)先被抓取。3.最佳優(yōu)先策略2.2.2抓取建庫(kù)網(wǎng)絡(luò)蜘蛛在經(jīng)過(guò)較長(zhǎng)時(shí)間的爬行后,就可以爬行完互聯(lián)網(wǎng)上的所有網(wǎng)站,但這些網(wǎng)站資源極其龐大,而且其中還夾雜著大量的垃圾網(wǎng)站,再加上搜索引擎的資源有限,通常只會(huì)抓取其中的部分網(wǎng)頁(yè)到數(shù)據(jù)庫(kù)中。網(wǎng)絡(luò)蜘蛛到達(dá)一個(gè)網(wǎng)頁(yè)后,會(huì)對(duì)其內(nèi)容進(jìn)行檢測(cè),判斷其中的信息是否為垃圾信息,如大量的重復(fù)內(nèi)容、亂碼以及與已收錄的內(nèi)容高度重復(fù)等。檢測(cè)通過(guò)后,搜索引擎會(huì)對(duì)有價(jià)值的網(wǎng)頁(yè)進(jìn)行收錄,將網(wǎng)頁(yè)的信息存儲(chǔ)到數(shù)據(jù)庫(kù)中。2.2.3網(wǎng)頁(yè)處理網(wǎng)絡(luò)蜘蛛抓取到的網(wǎng)頁(yè)數(shù)據(jù)中,除了用戶(hù)在瀏覽器上可以看到的可見(jiàn)文字外,還包含了HTML標(biāo)簽、JavaScript程序、導(dǎo)航、友情鏈接、廣告等無(wú)法用于排名計(jì)算的內(nèi)容。結(jié)構(gòu)化網(wǎng)頁(yè)就是從網(wǎng)頁(yè)數(shù)據(jù)中去除這些內(nèi)容,保留可以用于排名的正文文本、Meta標(biāo)簽、錨文本、圖片視頻的注釋等內(nèi)容。1.結(jié)構(gòu)化網(wǎng)頁(yè)如圖所示,這段HTML代碼,在經(jīng)過(guò)結(jié)構(gòu)化網(wǎng)頁(yè)后,剩下的用于排名的文字為“2019年新款運(yùn)動(dòng)鞋”。2.2.3網(wǎng)頁(yè)處理分詞是中文搜索引擎所特有的處理操作,這是因?yàn)橛⑽牡日Z(yǔ)言的單詞與單詞之間是有空格分隔的,而中文的詞與詞之間則沒(méi)有任何分隔符,所以搜索引擎必須首先將一句話分解成若干個(gè)詞語(yǔ)。2.分詞基于字典的分詞法基于理解的分詞法基于統(tǒng)計(jì)的分詞法分詞的方法2.2.3網(wǎng)頁(yè)處理無(wú)論是中文還是英文,出現(xiàn)頻率高,對(duì)頁(yè)面內(nèi)容沒(méi)有任何影響的詞,被稱(chēng)為停止詞。因?yàn)樗鼈儗?duì)句子的主要意思沒(méi)什么影響,所以搜索引擎會(huì)去掉這些詞。這樣就可以使索引數(shù)據(jù)的主題更為突出,也可以減少一些無(wú)謂的計(jì)算量。3.去停止詞4.降噪與網(wǎng)頁(yè)主題完全不相關(guān)的內(nèi)容都屬于噪聲,而搜索引擎需要識(shí)別并消除這些噪聲,其基本方法是:根據(jù)HTML標(biāo)簽對(duì)頁(yè)面分塊,區(qū)分出頁(yè)頭、導(dǎo)航、正文、頁(yè)腳、廣告等區(qū)域,剔除無(wú)關(guān)區(qū)域的內(nèi)容,剩下的就是頁(yè)面主體內(nèi)容。5.去重互聯(lián)網(wǎng)中還存在大量的重復(fù)內(nèi)容,這些重復(fù)內(nèi)容主要是由于網(wǎng)站之間的相互轉(zhuǎn)載以及使用網(wǎng)頁(yè)模板產(chǎn)生的。如果用戶(hù)的搜索結(jié)果中包含大量的相同內(nèi)容,則說(shuō)明用戶(hù)體驗(yàn)太差,因此需要搜索引擎只返回其中的一篇,這就要求搜索引擎在索引前對(duì)重復(fù)內(nèi)容進(jìn)行識(shí)別和刪除,這個(gè)過(guò)程就稱(chēng)為“去重”。2.2.3網(wǎng)頁(yè)處理搜索引擎會(huì)記錄每一個(gè)關(guān)鍵詞等信息,并根據(jù)這些信息計(jì)算出每個(gè)關(guān)鍵詞的重要性,再按照重要性對(duì)關(guān)鍵詞進(jìn)行排序。然后搜索引擎會(huì)將頁(yè)面及其對(duì)應(yīng)的關(guān)鍵詞構(gòu)建為正排索引并存儲(chǔ)到索引庫(kù)。6.建立索引庫(kù)文檔ID網(wǎng)頁(yè)內(nèi)容1小米手機(jī)22019年新款手機(jī)3華為手機(jī)4蘋(píng)果手機(jī)5小米手機(jī)評(píng)測(cè)6華為手機(jī)評(píng)測(cè)關(guān)鍵字ID關(guān)鍵詞1手機(jī)2小米3華為4蘋(píng)果5評(píng)測(cè)62019年7新款假設(shè)的6個(gè)頁(yè)面內(nèi)容對(duì)關(guān)鍵詞按照重要性進(jìn)行排序后的結(jié)果2.2.3網(wǎng)頁(yè)處理在實(shí)際搜索中搜索引擎是通過(guò)關(guān)鍵詞來(lái)查找包含它的頁(yè)面,因此正排索引就需要掃描每一個(gè)頁(yè)面來(lái)判斷其是否包含該關(guān)鍵詞,這樣計(jì)算量就會(huì)非常大,因而搜索引擎還會(huì)將正排索引重新構(gòu)建為倒排索引,將頁(yè)面對(duì)應(yīng)到關(guān)鍵詞的映射轉(zhuǎn)換為關(guān)鍵詞到頁(yè)面的映射。6.建立索引庫(kù)倒排索引簡(jiǎn)化表關(guān)鍵字ID關(guān)鍵字文檔ID1文檔ID2文檔ID3文檔ID4文檔ID5文檔ID61手機(jī)1234562小米15

3華為36

4蘋(píng)果4

5評(píng)測(cè)56

62019年2

7新款2

2.2.3網(wǎng)頁(yè)處理搜索引擎在對(duì)頁(yè)面進(jìn)行排序時(shí),還需要引入網(wǎng)頁(yè)以外的標(biāo)準(zhǔn)來(lái)衡量網(wǎng)頁(yè)。在這些網(wǎng)頁(yè)以外的標(biāo)準(zhǔn)中,鏈接分析是最為重要的,搜索引擎會(huì)分析鏈接到這個(gè)網(wǎng)頁(yè)的所有外部鏈接,這些外部鏈接的數(shù)量和質(zhì)量都能反映該網(wǎng)頁(yè)的質(zhì)量,以及和關(guān)鍵詞的相關(guān)度。7.鏈接分析8.?dāng)?shù)據(jù)整合除了HTML文件外,搜索引擎通常還能抓取和索引以文字為基礎(chǔ)的多種文件類(lèi)型。用戶(hù)在搜索結(jié)果中,但只能通過(guò)其說(shuō)明性文本進(jìn)行處理。不同的數(shù)據(jù)格式被分別存儲(chǔ),但是在建立索引以及排序時(shí),往往又會(huì)聯(lián)系與數(shù)據(jù)相關(guān)的內(nèi)容,以判斷其相關(guān)性與重要性,然后最終形成一個(gè)有利于搜索排名的檢索數(shù)據(jù)庫(kù)。2.2.4檢索服務(wù)搜索引擎建好檢索數(shù)據(jù)庫(kù)后,就可以為用戶(hù)提供檢索服務(wù)了。當(dāng)用戶(hù)輸入一個(gè)查詢(xún)關(guān)鍵詞后,搜索引擎首先會(huì)處理搜索關(guān)鍵詞,將其進(jìn)行過(guò)濾和拆分,然后從索引庫(kù)中將與之匹配的頁(yè)面提取出來(lái),再通過(guò)不同的維度對(duì)頁(yè)面的得分進(jìn)行綜合排序,最后再通過(guò)收集用戶(hù)搜索數(shù)據(jù)對(duì)結(jié)果進(jìn)行優(yōu)化,此時(shí)就可以得到最終的搜索結(jié)果。如圖所示為基數(shù)服務(wù)基本流程。2.2.4檢索服務(wù)和處理頁(yè)面的關(guān)鍵詞一樣,對(duì)用戶(hù)輸入的搜索關(guān)鍵詞也需要進(jìn)行拆分和降噪等操作,將其拆分為關(guān)鍵詞組,并剔除掉對(duì)搜索結(jié)果影響不大的詞。1.處理搜索關(guān)鍵詞拆分搜索關(guān)鍵詞2.2.4檢索服務(wù)確定好關(guān)鍵詞后,搜索引擎就會(huì)從檢索數(shù)據(jù)庫(kù)中提取出包含有這些關(guān)鍵詞的頁(yè)面。但要全部進(jìn)行排名會(huì)使計(jì)算量非常大、速度非常慢。因此搜索引擎通常,只會(huì)顯示權(quán)重最高的幾百條搜索結(jié)果。2.提取頁(yè)面搜索結(jié)果頁(yè)數(shù)2.2.4檢索服務(wù)搜索引擎會(huì)根據(jù)不同方面的得分對(duì)參與排名的頁(yè)面進(jìn)行綜合排序,以得到最終的搜索結(jié)果。3.綜合排序 相關(guān)性 權(quán)威性 時(shí)效性 豐富度 降權(quán) 加權(quán)降權(quán)指降低有作弊嫌疑的網(wǎng)頁(yè)的位置的做法。豐富度指頁(yè)面內(nèi)容的豐富程度。時(shí)效性指頁(yè)面是否為新出現(xiàn)的網(wǎng)頁(yè),且頁(yè)面內(nèi)容是新鮮的加權(quán)指通過(guò)人工方式提高某些頁(yè)面(如官方網(wǎng)站、特殊通道頁(yè)面等)的排名。權(quán)威性更高的網(wǎng)站提供的內(nèi)容更真實(shí)可靠,所以其網(wǎng)頁(yè)排名越靠前相關(guān)性指頁(yè)面內(nèi)容與搜索關(guān)鍵詞的匹配程度。2.2.4檢索服務(wù)搜索引擎還會(huì)根據(jù)用的IP地址、搜索時(shí)間、以往的搜索記錄以及瀏覽過(guò)的網(wǎng)頁(yè)等信息對(duì)搜索結(jié)果進(jìn)行優(yōu)化。通過(guò)IP地址可以獲取用戶(hù)所在的地區(qū),根服各地區(qū)用戶(hù)的搜索習(xí)慣,可以返回用戶(hù)特定地域的排名結(jié)果。通過(guò)搜索時(shí)間、以往的搜索記錄以及瀏覽過(guò)的網(wǎng)頁(yè)等信息可以了解用戶(hù)的搜索習(xí)慣、以及對(duì)哪些內(nèi)容更為關(guān)心,從而給出更準(zhǔn)確化和個(gè)性化的搜索結(jié)果。4.檢索優(yōu)化2.2.5結(jié)果展現(xiàn)搜索結(jié)果的展現(xiàn)形式是多種多樣的,最簡(jiǎn)單的展現(xiàn)形式由標(biāo)題、摘要、網(wǎng)頁(yè)鏈接、“百度快照”超鏈接組成,這種展現(xiàn)形式也稱(chēng)為摘要式。標(biāo)題摘要網(wǎng)頁(yè)鏈接“百度快照”超鏈接2.2.5結(jié)果展現(xiàn)圖片式視頻式軟件下載式步驟式除了摘要式外,搜索結(jié)果的常見(jiàn)展現(xiàn)形式還有圖片式、視頻式、軟件下載式、步驟式等。目錄Contents2.1認(rèn)識(shí)搜索引擎2.2搜索引擎的工作原理2.3搜索引擎的使用方法2.4本章實(shí)訓(xùn)2.3.1基本查詢(xún)基本查詢(xún)指直接輸入搜索關(guān)鍵詞進(jìn)行查詢(xún)。其具體操作如下。1搜索結(jié)果2輸入網(wǎng)址2.3.1基本查詢(xún)3選擇文件類(lèi)型4搜索結(jié)果2.3.1基本查詢(xún)5選擇發(fā)布時(shí)間6搜索結(jié)果2.3.2高級(jí)查詢(xún)使用搜索引擎的高級(jí)查詢(xún)方法可以在搜索時(shí)實(shí)現(xiàn)包含完整的關(guān)鍵詞、包含任意的關(guān)鍵詞或不包含某些關(guān)鍵詞等功能。其具體操作如下。1高級(jí)搜索2搜索結(jié)果2.3.3使用搜索引擎指令site指令有兩種用法:一種是查詢(xún)某個(gè)網(wǎng)站中被搜索引擎收錄的頁(yè)面數(shù)量。1.site指令site+半角冒號(hào)“:”+網(wǎng)站域名一種是在指定的網(wǎng)站范圍內(nèi)搜索包含相應(yīng)關(guān)鍵詞的網(wǎng)頁(yè)。site+半角冒號(hào)“:”+網(wǎng)站域名+空格+關(guān)鍵詞2.3.3使用搜索引擎指令1.site指令其具體操作如下。1京東網(wǎng)站被百度收錄的網(wǎng)頁(yè)數(shù)量2在京東網(wǎng)站中進(jìn)行搜索2.3.3使用搜索引擎指令網(wǎng)頁(yè)URL中包含的某些信息常常具有某種特殊價(jià)值的含義。因此,使用inurl指令對(duì)搜索結(jié)果中的URL進(jìn)行限定,就可以獲得比較精準(zhǔn)的搜索結(jié)果。2.inurl指令inurl+半角冒號(hào)“:”+指定文本inurl+半角冒號(hào)“:”+指定文本+空格+關(guān)鍵詞2.3.3使用搜

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論