第5章--友好的網(wǎng)站結(jié)構(gòu)設(shè)計_第1頁
第5章--友好的網(wǎng)站結(jié)構(gòu)設(shè)計_第2頁
第5章--友好的網(wǎng)站結(jié)構(gòu)設(shè)計_第3頁
第5章--友好的網(wǎng)站結(jié)構(gòu)設(shè)計_第4頁
第5章--友好的網(wǎng)站結(jié)構(gòu)設(shè)計_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、SEO 教程:搜索引擎優(yōu)化基礎(chǔ)實戰(zhàn)入門(微課版)沙旭 陳成主編徐紅 楊學彬副主編第5章 友好的網(wǎng)站結(jié)構(gòu)設(shè)計本章導讀本章主要帶讀者學習網(wǎng)站的結(jié)構(gòu)優(yōu)化通過本章學習讀者能夠為自己的網(wǎng)站設(shè)計一個友好的網(wǎng)站結(jié)構(gòu)通過本章學習讀者能夠掌握網(wǎng)站的301、404 和偽靜態(tài)設(shè)置學習目標避免蜘蛛陷阱物理結(jié)構(gòu)和鏈接結(jié)構(gòu)友好的網(wǎng)站導航設(shè)計禁止抓取和收錄機制URL靜態(tài)化網(wǎng)址規(guī)范設(shè)計和301永久重定向設(shè)置網(wǎng)站地圖的設(shè)置頁面權(quán)重分配404錯誤頁面的設(shè)置技能要點了解蜘蛛無法抓取的現(xiàn)象有哪些掌握網(wǎng)站導航的設(shè)計原則掌握網(wǎng)站301、404和偽靜態(tài)的設(shè)計掌握網(wǎng)站地圖的設(shè)置掌握nofollow、robots.txt和meta robot

2、s標簽的使用方法實訓任務(wù)設(shè)置網(wǎng)站的301、404和偽靜態(tài)設(shè)置網(wǎng)站地圖為站點添加次導航效果欣賞5.1 避免蜘蛛陷阱 5.1.1 Flash 動畫 在網(wǎng)頁的某一部分使用 flash 動畫可以增加視覺效果,吸引用戶的目光,常見于首頁中的 banner 或者輪播圖。 這種flash動畫只是網(wǎng)頁中的一小部分,對搜索引擎的收錄和抓取沒有任何影響。 但是有的網(wǎng)站將首頁直接設(shè)置成一個全屏flash動畫,這種做法用戶可以看懂,但是搜索引擎是無法讀取flash動畫里面的文字信息和鏈接的,這就是我們常說的蜘蛛陷阱。 隨著互聯(lián)網(wǎng)的發(fā)展,人們對SEO的重要性認識逐漸加深,即使是網(wǎng)站首頁的輪播圖已經(jīng)很少有站長使用 fla

3、sh動畫了,一般會使用js文件替換flash動畫。 5.1.2 各種跳轉(zhuǎn) 網(wǎng)站跳轉(zhuǎn)情況每一個互聯(lián)網(wǎng)用戶基本上都遇到過,大家打開某一個 URL 之后,網(wǎng)站會自動跳轉(zhuǎn)到另外一個 URL,實現(xiàn)跳轉(zhuǎn)的方法有很多種,包括 301 跳轉(zhuǎn)、302 跳轉(zhuǎn)、js 跳轉(zhuǎn)、Meta Refresh 跳轉(zhuǎn)等。 301 跳轉(zhuǎn)是我們最常見,也是搜索引擎推薦的跳轉(zhuǎn)方式,除去 301 跳轉(zhuǎn)之外的其他跳轉(zhuǎn)方式搜索引擎都比較敏感,不建議大家使用。 5.1.3 框架 這里所說的框架,最常見的就是一個頁面中包含左右兩部分,一般左側(cè)為文章列表,右側(cè)為文章詳細內(nèi)容;當我們點擊左側(cè)文章列表中的某一個標題的時候,右側(cè)會顯示相應(yīng)的內(nèi)容。 5.

4、1.4 動態(tài)網(wǎng)址(動態(tài) URL)我們所說的動態(tài)網(wǎng)址指的是由數(shù)據(jù)庫驅(qū)動,網(wǎng)站內(nèi)容實時生成并且?guī)в袉柼枴⒌忍柡蛡鲄?shù)的網(wǎng)址。早期搜索引擎抓取動態(tài)網(wǎng)址要弱一些,目前搜索引擎抓取動態(tài)網(wǎng)址已經(jīng)沒有任何問題了,但是過多的傳參數(shù)的動態(tài)網(wǎng)址仍不利于搜索引擎爬行和抓取,所以我們要盡量避免或者通過偽靜態(tài)將動態(tài)網(wǎng)址改成靜態(tài)網(wǎng)址顯示。 5.1.5 要求登錄有些站點(論壇形式比較多)需要用戶登錄才能看到一些會員區(qū)域,或者強制用戶登錄才可以看到文章的內(nèi)容。這些會員區(qū)域和內(nèi)容,搜索引擎是無法看到的,蜘蛛只不過是一個機器人,不會自動注冊、登錄甚至回復。 現(xiàn)在我們也就可以理解為什么好多站長喜歡將文章部分內(nèi)容供讀者瀏覽,剩下的部

5、分內(nèi)容需要注冊才可以閱讀,這也是為了迎合搜索引擎。5.2 物理結(jié)構(gòu)和鏈接結(jié)構(gòu) 5.2.1 物理結(jié)構(gòu) 網(wǎng)站物理結(jié)構(gòu)指的是網(wǎng)站真實存在空間中的目錄文件夾及文章所在的位置所決定的結(jié)構(gòu),我們用超市來幫助大家理解。 超市中某一款產(chǎn)品的具體擺放位置就是它的物理結(jié)構(gòu),而從超市入口開始通過某幾條通道可以達到該產(chǎn)品所在的位置就是它的鏈接結(jié)構(gòu)。 互聯(lián)網(wǎng)中網(wǎng)站的物理結(jié)構(gòu)主要包含兩種扁平式結(jié)構(gòu)和樹形結(jié)構(gòu)。 1扁平式結(jié)構(gòu) 扁平式結(jié)構(gòu)指的是網(wǎng)站中的所有網(wǎng)頁文件全部放在網(wǎng)站根目錄下,如:/index.htm/list1.htm/list2.htm/page1.htm/page2.htm/page3.htm 2樹形結(jié)構(gòu) 樹形

6、結(jié)構(gòu)也被稱為金字塔結(jié)構(gòu)。根目錄下以文件夾形式生成多個產(chǎn)品分類(也被稱為頻道、欄目、板塊等) ,然后在每一個分類文件夾中放置屬于該分類的所有文章(也被稱為帖子、產(chǎn)品、內(nèi)容等)頁面。如:網(wǎng)站首頁http:/網(wǎng)站欄目http:/list1/http:/list2/具體文章頁面放到相應(yīng)分類目錄中http:/list1/page1.htmhttp:/list1/page2.htmhttp:/list1/page3.htmhttp:/list2/page1.htmhttp:/list2/page2.htmhttp:/list2/page3.htm 5.2.2 鏈接結(jié)構(gòu) 網(wǎng)站鏈接結(jié)構(gòu)也被稱為邏輯結(jié)構(gòu),指的是

7、網(wǎng)站內(nèi)部鏈接形成的鏈接網(wǎng)絡(luò)圖。 互聯(lián)網(wǎng)中用得最多的鏈接結(jié)構(gòu)是樹形結(jié)構(gòu),這也是比較合理的一種鏈接結(jié)構(gòu),如圖 5-1 所示。 H為網(wǎng)站首頁,C1和C2是網(wǎng)站的分類首頁,P1、P2是 C1下的文章頁面,P3、P4 是C2下的文章頁面。鏈接關(guān)系如下: (1)首頁鏈接向所有分類首頁; (2)首頁一般不直接鏈向產(chǎn)品頁面,除了幾個需要特殊推廣的產(chǎn)品,如 P3; (3)所有分類首頁鏈向其他分類首頁,一般以網(wǎng)站導航形式體現(xiàn); (4)分類首頁都鏈向網(wǎng)站首頁; (5)分類首頁鏈向本分類下產(chǎn)品頁面; (6)分類首頁一般不鏈接向其他分類的產(chǎn)品頁面; (7)產(chǎn)品頁都鏈向所有分類首頁,一般以網(wǎng)站導航形式出現(xiàn); (8)產(chǎn)品頁

8、面都鏈向網(wǎng)站首頁,一般以網(wǎng)站導航形式出現(xiàn); (9)產(chǎn)品頁面可以鏈向同一個分類的其他產(chǎn)品頁面; (10)產(chǎn)品頁面一般不鏈接向其他分類的產(chǎn)品頁面; (11)在某些情況下,產(chǎn)品頁面可以用適當?shù)年P(guān)鍵詞鏈接向其他分類的產(chǎn)品頁,如 P2 鏈接向 P3。圖 5-1 網(wǎng)站鏈接結(jié)構(gòu)5.3 友好的網(wǎng)站導航設(shè)計 5.3.1 導航分類 1導航主導航,一般放置在網(wǎng)站頁面頂部或者網(wǎng)站logo下方,主導航存在于網(wǎng)站的每一個頁面中。從用戶體驗的角度出發(fā):一般情況下,網(wǎng)站主導航中放置著網(wǎng)站中一些最主要的內(nèi)容,也是除去首頁之外,站長最希望用戶點擊的一些網(wǎng)站欄目或者頁面。 從搜索引擎的角度出發(fā):網(wǎng)站的主導航位于SEO優(yōu)化網(wǎng)站中F區(qū)

9、的最重要的位置,是搜索引擎蜘蛛檢索最看重、 權(quán)重較高的一個位置, 同時在網(wǎng)站的主導航上還布局了網(wǎng)站欄目及各個單頁面的導入鏈接(各個二級欄目間的回流設(shè)置),這是設(shè)置整個網(wǎng)站回流的最核心的部分。 2面包屑導航面包屑導航在 SEO 優(yōu)化中的重要性雖然比不過主導航,但是我們?nèi)匀徊豢珊鲆暋?網(wǎng)站的主導航主要用于網(wǎng)站主要欄目或者頁面之間的切換,面包屑導航主要用于告知用戶所在的網(wǎng)站位置,它增加了用戶體驗,同時也有利于搜索引擎的抓取,幫助搜索引擎了解網(wǎng)站的結(jié)構(gòu)。 3次導航次導航,主要是相對于主導航而言的,一般情況下會放在網(wǎng)站的頁腳部分。 互聯(lián)網(wǎng)中的站點各種各樣,某些公司站點的主導航中放置了公司榮譽、在線報名、

10、人才招聘等欄目。 從優(yōu)化的角度來說,這些欄目沒有必要放置在主導航中,但是公司為了顯示自己的公司實力又不得不放。類似于上述情況,因為某些原因無法在網(wǎng)站主導航中布置關(guān)鍵詞,我們就需要在頁面底部布置次導航,在頁面底部布置一句包含優(yōu)化關(guān)鍵詞的語句,并且將關(guān)鍵詞做錨文本鏈接指向?qū)?yīng)的 URL。 5.3.2 導航設(shè)置要點1一定要使用文字導航2導航中要布置關(guān)鍵詞3主導航中的欄目需要按用戶需求排列4主導航中的欄目布置需要遵循用戶習慣5.4 禁止抓取和收錄機制 5.4.1 抓取和收錄的概念 在SEO優(yōu)化中抓取和收錄是兩個不同的概念。站長可以自由設(shè)置網(wǎng)站中的某些頁面可以被抓取,也可以設(shè)置某些頁面不被抓?。坏撬阉?/p>

11、引擎抓取的頁面不一定就會被收錄,搜索引擎抓取的頁面會暫時被放到搜索引擎的臨時庫中,一些被搜索引擎認為不可讀、無用的頁面會被舍棄掉。 只有被搜索引擎認為有價值的頁面才會被放到索引庫中,才有排名機會。我們常常說的收錄就是搜索引擎的索引量。 5.4.2 robots.txt 文件 robots.txt 文件是搜索引擎來到網(wǎng)站之后訪問的第一文件,robots.txt 文件中設(shè)置了搜索引擎的抓取范圍。1robots.txt 設(shè)置要求 (1)robots.txt 文件必須放置在網(wǎng)站根目錄; (2)robots.txt 文件名必須小寫。 如百度 robots.txt 文件訪問路徑是: https:/robo

12、ts.txt 2robots.txt 文件規(guī)則解讀 robots.txt 的書寫格式為:: 常見的 robots.txt 指令為: User-agent: * Disallow: / 主流的搜索引擎都會遵守 robots 文件指令, 但是被robots 文件禁止抓取的網(wǎng)址還會出現(xiàn)在搜索引擎結(jié)果中,這就好比你雖然不告訴我發(fā)生了什么事,但是我從別人那里知道了你的事情一樣。 只要禁止被抓取的網(wǎng)址在互聯(lián)網(wǎng)中存在導入鏈接,搜索引擎就會知道這個網(wǎng)址的存在,這個網(wǎng)址就有可能被搜索引擎收錄,但是搜索結(jié)果標題下方會出現(xiàn)提示,如圖 5-2 和圖 5-3 所示。圖 5-2 淘寶登錄界面禁止百度抓取圖 5-3 百度依

13、然收錄該頁面 5.4.3 meta robots 標簽 meta robots 標簽是頁面 HTML 代碼中 head 標簽中的一部分, 它的作用是禁止搜索引擎索引本頁面,此頁面將不會出現(xiàn)在搜索引擎搜索結(jié)果中。 meta robots 標簽中沒有大小寫之分,最簡單的 meta robots 書寫格式為: meta name=robots代表所有的搜索引擎,也可以針對某一個搜索引擎,只需要將 robots 替換成搜索引擎的蜘蛛名稱即可。 content 指令有個選項,分別是 index、noindex、follow、nofollow、all 和none,它們的含義分別是:index:指令搜索引擎

14、可以索引本頁面;noindex:指令搜索引擎禁止索引本頁面;follow:指令搜索引擎可以跟蹤本頁面上的鏈接;nofollow:指令搜索引擎禁止跟蹤本頁面上的鏈接;all:相當于 index 和 follow 指令的總和, 指令搜索引擎既可以索引本頁面, 也可以跟蹤頁面上的鏈接;none:相當于 noindex 和 nofollow 指令的總和,指令搜索引擎禁止索引本頁面和跟蹤頁面上的鏈接。 5.4.4 nofollow 屬性 這里所說的 nofollow 屬性和上面講解的 meta robots 中的 nofollow 是兩個不同的概念。 嚴格意義上來說,nofollow 屬性不算作一個標簽

15、,只是 a 標簽的一個屬性,其使用格式是: 錨文字 鏈接中的 nofollow 屬性只適用于本鏈接,意思是告訴搜索引擎不要跟蹤本鏈接,也不傳遞權(quán)重。5.5 URL 靜態(tài)化 5.5.1 為什么要做 URL 靜態(tài)化隨著互聯(lián)網(wǎng)的發(fā)展,現(xiàn)在的大部分站點都是數(shù)據(jù)庫驅(qū)動,頁面由程序?qū)崟r生成。 搜索引擎在發(fā)展初期一般不太愿意抓取動態(tài)頁面,主要原因是有可能陷入無限循環(huán)或者抓取大量重復內(nèi)容。 5.5.2 如何做 URL 靜態(tài)化1pache 設(shè)置方法 (1)httpd.conf 文件httpd.conf文件是apache程序安裝目錄中的一個文件,我們可以通過 httpd.conf 文件設(shè)置網(wǎng)站的偽靜態(tài),但是此文件

16、一般不要隨意更改,這個文件是 apache 的配置文件,設(shè)置不當?shù)脑挄绊懢W(wǎng)站的運作。 (2).htaccess 文件 我們可以通過.htaccess文件設(shè)置網(wǎng)站的偽靜態(tài),.htaccess 放置于網(wǎng)站根目錄中,將偽靜態(tài)代碼放到.htaccess 中即可。 在windows平臺中.htaccess是無法直接建立的,需要建立一個文本文檔另存為.htaccess。 Apache 默認情況下不支持.htaccess,站長或者空間商需要修改 Apache 安裝目錄中的 httpd.conf 文件。第一步:打開 apache 安裝目錄下的 httpd.conf 文件,把 AllowOverride No

17、ne 改為 AllowOverride All,如圖 5-4 所示。圖 5-4 httpd.conf 文件修改示例第二步:搜索。#LoadModule rewrite_modulemodules/mod_rewrite.so 去掉前面的#,如圖 5-5 所示,重啟即可。圖 5-5 httpd.conf 文件中去掉對應(yīng)的# 2IIS6.0 設(shè)置方法 Windows平臺服務(wù)器操作系統(tǒng)有Windows2003 、Windows2008 和Windows2012,這三個操作系統(tǒng)默認安裝的 IIS 版本是不一樣的: Windows2003 配備 IIS6.0; Windows2008 配備 IIS7.0

18、 或者 IIS7.5; Windows2012 配備 IIS8.0 或者 IIS8.5。圖 5-6 點擊 IIS 中的屬性選項圖 5-7 添加對應(yīng)的篩選器名稱 圖 5-8 默認名稱前面不顯示箭頭圖 5-9 重啟 IIS 圖5-10 顯示向上的綠色箭頭證明配置成功3IIS7.0 以上版本設(shè)置方法圖 5-11 Microsoft URL 重寫模塊 2.0 下載頁面圖 5-12 將對應(yīng)的代碼添加到 web.config 文件中 4空間(虛擬主機)設(shè)置方法 在購買空間之前需要了解空間的參數(shù)或者詢問客服,一般空間的控制面板中會提供偽靜態(tài)設(shè)置模塊。 有些 Apache 服務(wù)器提供的空間控制面板中無此模塊,

19、直接在根目錄中建立.htaccess 文件即可。5.6 網(wǎng)址規(guī)范化和 301 設(shè)置 5.6.1 規(guī)范網(wǎng)址 網(wǎng)址規(guī)范化指的是網(wǎng)站因為種種原因,同一個頁面可能會出現(xiàn)多個 URL,搜索引擎挑選的 URL 有可能不是最合適的 URL。 這種情況下,我們需要通過網(wǎng)站設(shè)置,使搜索引擎更容易挑選出最合適,也是最規(guī)范的 URL。1頁面為什么會出現(xiàn)不同網(wǎng)址2網(wǎng)址未進行規(guī)范的嚴重性3解決網(wǎng)址規(guī)范化問題 5.6.2 301 永久重定向1301 永久重定向的含義 301 永久重定向,也稱為 301 轉(zhuǎn)向、301 重定向、301 跳轉(zhuǎn),指的是當用戶或搜索引擎向網(wǎng)站服務(wù)器發(fā)出瀏覽請求時,服務(wù)器返回的 HTTP 數(shù)據(jù)流中頭

20、信息(header)中的狀態(tài)碼的一種,表示本網(wǎng)頁永久性轉(zhuǎn)移到另一個地址。 2301 永久重定向的重要性 (1)規(guī)范網(wǎng)站 URL,使搜索引擎更容易抓取和收錄頁面。 (2)301 轉(zhuǎn)向會傳遞網(wǎng)站權(quán)重,google 傳遞大部分權(quán)重,百度會傳遞所有權(quán)重,但是百度對 301 處理比較保守,跳轉(zhuǎn)的頁面會在百度的搜索結(jié)果中保留很長時間。 3301 永久重定向的設(shè)置 IIS 服務(wù)器都可以在軟件中直接設(shè)置 301,互聯(lián)網(wǎng)中有具體的操作教程,不過不建議讀者操作,防止操作不當造成網(wǎng)站打不開的現(xiàn)象出現(xiàn)。 如果您購買的是虛擬主機,虛擬主機的控制面板中一般都提供 301 跳轉(zhuǎn)模塊,讀者直接設(shè)置即可,如圖 5-13 所示。

21、圖 5-13 空間控制面板中設(shè)置 3014301 永久重定向的檢查301設(shè)置完成之后,我們需要使用工具進行檢查,要確保跳轉(zhuǎn)的域名的狀態(tài)碼是 301?;ヂ?lián)網(wǎng)中查詢工具有很多,我們可以在百度中搜索“http 狀態(tài)碼查詢” ,在這里我們使用站長工具網(wǎng)提供的查詢工具,網(wǎng)址是: http:/pagestatus/我們使用圖5-11所示中的域名進行查詢,其效果如圖5-14所示。圖 5-14 使用 http 狀態(tài)碼查詢工具檢查設(shè)置效果5.7 網(wǎng)站地圖設(shè)置 5.7.1 網(wǎng)站地圖的含義 1網(wǎng)站地圖的含義網(wǎng)站地圖,又稱站點地圖,就是在一個頁面上面放置了網(wǎng)站上需要搜索引擎抓取的所有頁面的鏈接(注:不是所有頁面) 。

22、大多數(shù)人在網(wǎng)站上找不到自己所需要的信息時,可能會將網(wǎng)站地圖作為一種補救措施。 2為什么要制作網(wǎng)站地圖 (1)為搜索引擎蜘蛛提供可以瀏覽整個網(wǎng)站的鏈接,簡單地體現(xiàn)出網(wǎng)站的整體框架給搜索引擎看; (2)為搜索引擎蜘蛛提供一些鏈接,指向動態(tài)頁面或者采用其他方法比較難以到達的頁面; (3)作為一種潛在的著陸頁面,可以為搜索流量進行優(yōu)化; (4)如果用戶試圖訪問網(wǎng)站所在域內(nèi)并不存在的 URL,那么用戶就會被轉(zhuǎn)到“無法找到文件”的錯誤頁面,而網(wǎng)站地圖可以作為該頁面的“準”內(nèi)容。 5.7.2 網(wǎng)站地圖的制作1網(wǎng)站地圖的制作技巧 (1)網(wǎng)站地圖要包含網(wǎng)站最重要的一些頁面,包括產(chǎn)品分類頁面、主要產(chǎn)品頁面、訪問量

23、比較大的頁面等; (2)網(wǎng)站地圖布局一定要簡潔,所有的鏈接都是標準的 HTML 文本,并且要盡可能多地包含關(guān)鍵字;(3)盡量在站點地圖上增加文本說明;(4)站點的每個頁面里面都需要放置網(wǎng)站地圖的鏈接;(5)確保網(wǎng)站地圖里的每一個鏈接都是正確、有效的。 2HTML 網(wǎng)站地圖的制作 網(wǎng)站地圖有兩種表現(xiàn)形式,第一種是后綴名為.html 的網(wǎng)站地圖,一般命名使用 sitemap。 HTML 版本的網(wǎng)站地圖針對的目標是用戶,也就是用戶在網(wǎng)站上可以看到的網(wǎng)站地圖,一般情況下在網(wǎng)站每個頁面的頂部或者底部添加一個網(wǎng)站地圖的錨文本鏈接,用戶點擊之后看到的內(nèi)容主要是網(wǎng)站主要欄目和頁面的鏈接。 對于小網(wǎng)站來說,網(wǎng)站

24、地圖可以列出整個網(wǎng)站所有頁面的鏈接,如果是大中型網(wǎng)站,內(nèi)容頁面較多的話,建議列出網(wǎng)站的主要目錄和部分重要頁面的鏈接。 HTML 版本的網(wǎng)站地圖建議進行人工手動編輯,也可以使用 Dreamweaver 來完成,如圖 5-15所示。圖 5-15 HTML 格式的地圖 3XML 網(wǎng)站地圖的制作 網(wǎng)站地圖的第二種形式是 XML 版本的網(wǎng)站地圖,一般命名為 Sitemap.xml(首字母S通常大寫) ,簡單來講,Sitemap.xml 放置的是網(wǎng)站上鏈接的列表。它由XML標簽組成,文件本身必須是utf8編碼。 制作 Sitemap.xml,并提交給搜索引擎可以使網(wǎng)站的內(nèi)容完全被收錄,包括那些隱藏比較深的

25、頁面。這是一種網(wǎng)站與搜索引擎對話的好方式。 標準的 XML 網(wǎng)站地圖格式為:/1.002017-07-24Always第一步:下載愛站 SEO 工具包并安裝,下載地址是:/,如圖 5-16 所示。圖 5-16 愛站工具包下載界面第二步:打開軟件登錄之后選擇“網(wǎng)站地圖/sitemap” ,如圖 5-17 所示。圖 5-17 愛站工具包默認界面第三步:點擊方框內(nèi)的按鈕添加一個站點,添加完成之后單擊右側(cè)的網(wǎng)站圖標,如圖 5-18 和圖 5-19所示。圖 5-18 添加對應(yīng)的域名圖 5-19 雙擊添加之后的域名第四步:設(shè)置網(wǎng)站地圖的抓取類型和生成的格式,設(shè)置好之后單擊右下角的“抓爬”按鈕,如圖 5-2

26、0所示。圖 5-20 設(shè)置網(wǎng)站抓取格式第五步:待程序抓爬完成之后,單擊右下角的“生成 XML 文件” 。生成完成之后,在程序的提示下找到地圖文件,如圖 5-21 所示。圖 5-21 生成 XML 文件 4網(wǎng)站地圖的提交 (1)一般的搜索引擎都會有自己的站長平臺,我們需要登錄站長平臺驗證網(wǎng)址之后,將自己的網(wǎng)站地圖提交給搜索引擎。以百度站長平臺(/)為例,如圖 5-22 所示。圖 5-22 將網(wǎng)站地圖提交到百度站長平臺 (2)第二種辦法,將網(wǎng)站地圖在 robots.txt 中進行聲明,告訴搜索引擎網(wǎng)站地圖的位置。使用方法如下: sitemap:http:/sitemap.xml 所有的主流搜索引擎

27、都支持使用 robots.txt 文件聲明網(wǎng)站地圖的位置。5.8 頁面權(quán)重分配 網(wǎng)站頁面的布局我們遵循以下幾點。 (1)首頁的權(quán)重在一個站點中是最高的; (2)首頁 banner 下方應(yīng)該放置用戶最感興趣的內(nèi)容,但不一定是最新發(fā)表的內(nèi)容。如果一個首頁的用戶主要來源于某一個關(guān)鍵詞,那么首頁 banner 下方應(yīng)該放置和該關(guān)鍵詞相關(guān)的產(chǎn)品或者內(nèi)容; (3)相對于一個頁面來說,蜘蛛根據(jù)代碼是從上往下抓取的,所以一個頁面位置越高,權(quán)重相對會越高,這也是許多人在網(wǎng)站左上角的 logo 中添加錨文本的原因; (4)網(wǎng)站中的“隱私權(quán)政策” “用戶登錄” “聯(lián)系我們” “在線報名”等頁面鏈接從 SEO 角度看

28、是沒有必要的頁面,但是相對于用戶體驗來說很重要,所以我們要有所取舍,類似于上述的頁面要么只在首頁添加鏈接,以降低這些頁面的權(quán)重,要么為這些鏈接添加“nofollow”屬性。5.9 404 錯誤頁面的設(shè)置 5.9.1 404 錯誤頁面的產(chǎn)生 一個站點隨著時間的推移,網(wǎng)站中的頁面也會越來越多,在網(wǎng)站運營的過程中不可避免地會因為各種因素(服務(wù)器癱瘓、黑客入侵、網(wǎng)站搬家、誤刪等)導致網(wǎng)站中的頁面丟失。當用戶訪問網(wǎng)站中不存在的頁面時,服務(wù)器通常會返回 404 錯誤。 如果站長沒有設(shè)置好 404 錯誤頁面,服務(wù)器會顯示對用戶體驗極不友好的一個默認錯誤頁面。 5.9.2 404 錯誤代碼 當一個頁面不存在的

29、時候,一定要返回404狀態(tài)碼。 在URL后面隨意添加幾個字符,將組合成的URL放到“http 狀態(tài)碼檢測工具”中查詢一下即知,如圖 5-23 所示。圖 5-23 http 狀態(tài)碼檢測 404 是否設(shè)置成功 5.9.3 404 錯誤頁面的設(shè)計 1404 頁面設(shè)置要點 (1)404 頁面設(shè)計要保持網(wǎng)站的統(tǒng)一,包括模板、logo 和名稱,條件允許的話建議保留網(wǎng)站的頂部和底部內(nèi)容,不要讓用戶搞不清楚來到了哪個站點。 (2)404 頁面應(yīng)該在最顯著的位置明確錯誤信息,告知用戶其訪問的頁面不存在,同時可以加上造成頁面不存在的幾種可能性。 (3)在錯誤信息下方添加網(wǎng)站的主要幾個鏈接,包括首頁、重要欄目或者網(wǎng)站地圖的鏈接,甚至還可以加上站內(nèi)搜索框,讓用戶自己去選擇點擊選項。 2404 頁面功能實現(xiàn) (1)一般的虛擬主機控制面板中都有 404 錯誤設(shè)置模塊,讀者可以在空間控制面板中直接設(shè)置即可。 (2)Apache 服務(wù)器可以在根目錄中的.htaccess 文件中進行設(shè)置,代碼如下: ErrorDocument 404 /404.htm (3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論