網(wǎng)站主頁(yè)優(yōu)化的十大注意事項(xiàng).doc_第1頁(yè)
網(wǎng)站主頁(yè)優(yōu)化的十大注意事項(xiàng).doc_第2頁(yè)
網(wǎng)站主頁(yè)優(yōu)化的十大注意事項(xiàng).doc_第3頁(yè)
網(wǎng)站主頁(yè)優(yōu)化的十大注意事項(xiàng).doc_第4頁(yè)
網(wǎng)站主頁(yè)優(yōu)化的十大注意事項(xiàng).doc_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

最近百度似乎在做一些更新調(diào)整,很多站長(zhǎng)抱怨百度收錄困難!甚至在尋找了大量鏈接后百度都不收錄你的站,是不是百度真的不愿意收錄新站呢?可能確實(shí)做了一些調(diào)整,但是應(yīng)該是站長(zhǎng)方法不對(duì)。下面我給大家講講搜索引擎收錄過(guò)程,并且用一個(gè)案例來(lái)說(shuō)明怎么讓百度更快的收錄你的網(wǎng)站。搜索引擎收錄過(guò)程:1、抓取網(wǎng)頁(yè)每個(gè)獨(dú)立的搜索引擎都有自己的網(wǎng)頁(yè)抓取程序(spider)。Spider順著網(wǎng)頁(yè)中的超鏈接,連續(xù)地抓取網(wǎng)頁(yè)。由于互聯(lián)網(wǎng)中超鏈接的應(yīng)用很普遍,理論上,從一定范圍的網(wǎng)頁(yè)出發(fā),就能搜集到絕大多數(shù)的網(wǎng)頁(yè)。 2、處理網(wǎng)頁(yè) 搜索引擎抓到網(wǎng)頁(yè)后,還要做大量的預(yù)處理工作,才能提供檢索服務(wù)。其中,最重要的就是提取關(guān)鍵詞,建立索引文件。其他還包括去除重復(fù)網(wǎng)頁(yè)、分析超鏈接、計(jì)算網(wǎng)頁(yè)的重要度。 3、提供檢索服務(wù) 用戶輸入關(guān)鍵詞進(jìn)行檢索,搜索引擎從索引數(shù)據(jù)庫(kù)中找到匹配該關(guān)鍵詞的網(wǎng)頁(yè);為了用戶便于判斷,除了網(wǎng)頁(yè)標(biāo)題和URL外,還會(huì)提供一段來(lái)自網(wǎng)頁(yè)的摘要以及其他信息。 這是摘自的一段總結(jié):首先蜘蛛讀取抓取站點(diǎn)的URL列表,取出一個(gè)站點(diǎn)URL,將其放入未訪問(wèn)的URL列表(UVURL列表)中,如果UVURL不為空剛從中取出一個(gè)URL判斷是否已經(jīng)訪問(wèn)過(guò),若沒(méi)有訪問(wèn)過(guò)則讀取此網(wǎng)頁(yè),并進(jìn)行超鏈分析及內(nèi)容分析,并將些頁(yè)存入文檔數(shù)據(jù)庫(kù),并將些URL放入已訪問(wèn)URL列表(VURL列表),直到UVRL為空為止,此時(shí)再抓取其他站點(diǎn),依次循環(huán)直到所有的站點(diǎn)URL列表都抓取完為止。如何更快被百度收錄:先給大家看個(gè)成功案例(圖一),當(dāng)天建立的網(wǎng)頁(yè)當(dāng)天被收錄。另外還有幾個(gè)案例,我不一一截圖了,最快有個(gè)域名我當(dāng)天晚上7點(diǎn)多才注冊(cè)的,更晚些時(shí)候就被收錄了,我給大家一個(gè)方法,大家可以按照此方法做:1. 建立一個(gè)單頁(yè)面,從百度百科找一段關(guān)于網(wǎng)站關(guān)鍵詞的介紹,再去其他地方找另外一種介紹。如網(wǎng)站做SEO,就找SEO在百科的解釋,再去維基百科找找seo的介紹,二者結(jié)合拼湊成一個(gè)單頁(yè)面;2. 單頁(yè)面命名為index.htm或者default.htm,成為網(wǎng)站的首頁(yè)。再去百度的登錄入口去登錄一次你的網(wǎng)站:/search/url_submit.html3. 無(wú)需任何外部鏈接,最多兩天后你將在搜索引擎看到你的網(wǎng)站在當(dāng)天就被收錄了!比如 你27日登錄的,雖然百度可能27日就收錄了你的站,但是你可能需要再過(guò)一兩天才能看到被收錄。/ 4. 以上方法我已經(jīng)測(cè)試了數(shù)十個(gè)域名,屢試不爽!收錄后再改版你的網(wǎng)站吧最后給大家一些收錄的建議:核糖體/ 1. 收錄前就把首頁(yè)title的關(guān)鍵詞定義好,避免更改關(guān)鍵詞太快,引起搜索引擎反感2. 主動(dòng)去登錄你的網(wǎng)站,而不需要急著去找任何外部鏈接(新站的目標(biāo)是被收錄)3. 安裝好搜索引擎工具條/ 4. 單頁(yè)面文件不要太長(zhǎng)太大,100K以內(nèi)最好5. 隨時(shí)關(guān)注收錄情況,去搜索新站的網(wǎng)址或者site一下問(wèn)題:我如何在 Sitemaps 中表示網(wǎng)址? 對(duì)于所有 XML 文件,任何數(shù)據(jù)數(shù)值(包括網(wǎng)址)都應(yīng)使用以下字符實(shí)體轉(zhuǎn)義碼:& 符號(hào) (&)、單引號(hào) ()、雙引號(hào) ()、小于 ()。還應(yīng)確保所有網(wǎng)址遵循 RFC-3986 URI 標(biāo)準(zhǔn)、RFC-3987 IRI 標(biāo)準(zhǔn)以及 XML 標(biāo)準(zhǔn)。如果您要使用腳本來(lái)生成網(wǎng)址,通??梢允褂镁W(wǎng)址轉(zhuǎn)義的方式將其轉(zhuǎn)義為該腳本的一部分。并且您仍然需要對(duì)它們進(jìn)行實(shí)體轉(zhuǎn)義。例如,以下 Python 腳本實(shí)體轉(zhuǎn)義 /view?widget=3&count2 以下是引用片段:$python Python2.2.2(#1,Feb242003,19:13:11) importxml.sax.saxutils xml.sax.saxutils.escape(/view?widget=3&count2) 以上示例所得網(wǎng)址為:/view?widget=3&count>2 問(wèn)題:使用哪種字符編碼方法生成 Sitemaps 文件有關(guān)系嗎? 是的。您的 Sitemaps 文件應(yīng)該使用 UTF-8 編碼。 問(wèn)題:如何指定時(shí)間? 對(duì)此協(xié)議中的 lastmod 時(shí)間戳以及所有其他日期和時(shí)間,請(qǐng)使用 W3C Datetime 編碼。例如,2004-09-22T14:12:14+00:00。 此編碼允許您省去 ISO8601 格式的時(shí)間部分,例如:2004-09-22 也是有效的。然而,如果您的網(wǎng)站頻繁更改,則鼓勵(lì)您使用時(shí)間部分,以便抓取工具可獲取關(guān)于您網(wǎng)站的更全面的信息。 問(wèn)題:如何計(jì)算 lastmod 日期? 對(duì)于靜態(tài)文件,這是實(shí)際的文件更新日期??梢允褂?UNIX 日期命令獲取此日期:以下是引用片段:$date-iso-8601=seconds-u-r/home/foo/www/bar.html 2004-10-26T08:56:39+00:00對(duì)于許多動(dòng)態(tài)網(wǎng)址,您可以根據(jù)基本數(shù)據(jù)的更改時(shí)間或使用一些基于定期更新(如果可行的話)的近似值輕松地計(jì)算 lastmod 日期。使用一個(gè)近似日期或時(shí)間戳就可以幫助抓取工具避免抓取還未更改的網(wǎng)址。這將降低 Web 服務(wù)器的帶寬和 CPU 要求。 問(wèn)題:我將 Sitemaps 放在哪里?強(qiáng)烈建議將 Sitemaps 放置在 HTML 服務(wù)器的根目錄中,即,將其放置在 /sitemap.xml.gz。 在某些情況下,您或許會(huì)希望在網(wǎng)站上針對(duì)不同的路徑創(chuàng)建對(duì)應(yīng)的 Sitemaps 例如,如果在您的組織中,安全許可對(duì)應(yīng)不同目錄劃分上傳權(quán)限。 我們認(rèn)為如果您有上傳 /path/sitemap.xml.gz 的許可,那么您也可以通過(guò) /path/ 報(bào)告元數(shù)據(jù)。 問(wèn)題:我的 Sitemaps 可以有多大? Sitemaps 在壓縮時(shí)不應(yīng)超過(guò) 10MB(10,485,760 字節(jié)),且最多可以包含 50,000 個(gè)網(wǎng)址。也就是說(shuō),如果您的網(wǎng)站包含的網(wǎng)址超過(guò) 50,000 個(gè)或 Sitemaps 大于 10MB,您需要?jiǎng)?chuàng)建多個(gè) Sitemaps 文件,并使用 Sitemaps 索引文件。即使您的網(wǎng)站較小,但計(jì)劃的網(wǎng)址數(shù)量超出 50,000 個(gè)或文件大小超過(guò) 10MB,也應(yīng)使用 Sitemaps 索引文件。 問(wèn)題:我的網(wǎng)站擁有數(shù)千萬(wàn)個(gè)網(wǎng)址;我可以采用某種方式只提交最近更改過(guò)的網(wǎng)址嗎? 您可以在少數(shù)頻繁更改的 Sitemaps 中列出已更新的網(wǎng)址,然后使用 Sitemaps 索引文件中的 lastmod 標(biāo)記驗(yàn)證這些 Sitemaps 文件。隨后,搜索引擎即可逐步抓?。ㄖ蛔ト。┻@些已更改的 Sitemaps。 問(wèn)題:創(chuàng)建 Sitemaps 后會(huì)發(fā)生什么? 在創(chuàng)建 Sitemaps 后,您需要通知搜索引擎 Sitemaps 的位置。得到通知的搜索引擎就可以檢索您的 Sitemaps 并使網(wǎng)址可以由抓取工具抓取。 問(wèn)題:需要完整地指定 Sitemaps 中的網(wǎng)址嗎? 是的。您需要在網(wǎng)址中提供協(xié)議(例如,http)。如果 Web 服務(wù)器有要求,您還需要提供尾隨斜線。例如,/ 是有效的 Sitemaps 網(wǎng)址,而 則不是。 問(wèn)題:我的網(wǎng)站有“http”和“https”兩個(gè)網(wǎng)址版本。需要把它們都列出來(lái)嗎? 否。請(qǐng)?jiān)谀?Sitemaps 中只列出一種版本的網(wǎng)址。包含多個(gè)版本的網(wǎng)址可能導(dǎo)致抓取工具無(wú)法完整抓取您的網(wǎng)站。問(wèn)題:我網(wǎng)站上的網(wǎng)址中包含會(huì)話 ID 號(hào)。需要將其刪除嗎? 是的。網(wǎng)址中包含會(huì)話 ID 號(hào)可能導(dǎo)致網(wǎng)站抓取不完整以及重復(fù)抓取。 問(wèn)題:Sitemaps 中網(wǎng)址的位置是否會(huì)影響它的使用? 否。網(wǎng)址在 Sitemaps 中的位置不會(huì)影響搜索引擎對(duì)它的使用或識(shí)別方式。問(wèn)題:我們網(wǎng)站上的一些網(wǎng)頁(yè)使用框架。我們應(yīng)該提供框架組網(wǎng)址或框架內(nèi)容的網(wǎng)址嗎? 請(qǐng)將兩種網(wǎng)址都包括進(jìn)來(lái)。問(wèn)題:可以壓縮 Sitemaps 嗎?或者需要以 gzip 壓縮嗎? 請(qǐng)使用 gzip 壓縮您的 Sitemaps。 問(wèn)題:XML Sitemaps 中的“priority”提示會(huì)改變我的網(wǎng)頁(yè)在搜索結(jié)果中的排名碼? 否。Sitemaps 中的“priority”提示只表示在您網(wǎng)站上,某一特定網(wǎng)址與其他網(wǎng)址的相對(duì)重要性。 問(wèn)題:有可以用作 XML Sitemaps 驗(yàn)證依據(jù)的 XML 架構(gòu)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論