版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、SEO是什么與搜索引擎原理目錄1、SEO的含義2、SEO常見方向3、Spider4、內(nèi)容處理、中文分詞和索引5、頁面去重原理6、用戶需求分析7 7、內(nèi)容相關(guān)性計(jì)算8 8、連接分析9 9、用戶體驗(yàn)判斷1010、有效索引和緩存機(jī)制1111、反作弊和人工干預(yù)1、SEO的含義思考?”http:/ 搜索引擎原理互聯(lián)網(wǎng)Spider內(nèi)容處理分詞索引去重反作弊內(nèi)容相關(guān)性鏈接分析用戶體驗(yàn)查詢分析緩存機(jī)制頁面排序搜索引擎原理搜索引擎主動(dòng)抓取網(wǎng)頁進(jìn)行的流程和機(jī)制用戶進(jìn)行查詢后,搜索引擎工作流程和機(jī)制2、對抓回的網(wǎng)頁進(jìn)行鏈接抽離、內(nèi)容處理,消除噪聲、提取該頁面文本內(nèi)容3、對網(wǎng)頁的文本內(nèi)容進(jìn)行中文分詞、去除停止詞4、判
2、斷該頁面內(nèi)容與已索引網(wǎng)頁是否重復(fù),剔除重復(fù)頁,對剩余網(wǎng)頁進(jìn)行倒排索引,然后等待用戶檢索1、對用戶所查關(guān)鍵詞進(jìn)行分詞,并根據(jù)用戶地理位置和歷史檢索特征進(jìn)行用戶需求分析2、查找緩存中是否有該關(guān)鍵詞的查詢結(jié)果,如果有,搜索引擎會(huì)根據(jù)當(dāng)下用戶的各種信息判斷其真正需求,對緩存中的結(jié)果進(jìn)行微調(diào)或直接呈現(xiàn)給用戶3、如果用戶查詢的關(guān)鍵詞在緩存中不存在,那么就在索引庫中的網(wǎng)頁進(jìn)行調(diào)取排名呈現(xiàn),并將該關(guān)鍵詞和對應(yīng)的搜索結(jié)果加入到緩存中4、網(wǎng)頁排名是根據(jù)用戶的搜索詞和搜索需求,對索引庫中的網(wǎng)頁進(jìn)行相關(guān)性、重要性(鏈接權(quán)重分析)和用戶體驗(yàn)的高低進(jìn)行分析所得出的http:/ 3.3Spider再次抓取更新策略用戶體驗(yàn)歷
3、史更新頻率網(wǎng)頁類型搜索引擎會(huì)搜集所有用戶的搜索請求,然后統(tǒng)計(jì)所有搜索結(jié)果中用戶可能看到的網(wǎng)頁,繼而進(jìn)行優(yōu)先再次抓取和更新。不同的網(wǎng)頁類型有不同的更新頻率網(wǎng)頁權(quán)重網(wǎng)頁權(quán)重是決定抓取頻率的重要因素3.4分布式Spider和降權(quán)蜘蛛分布式Spider分布式抓取策略任務(wù)分發(fā)機(jī)制抓取范圍常規(guī)網(wǎng)頁分類站點(diǎn)質(zhì)量等級分類網(wǎng)頁類型分類站點(diǎn)或網(wǎng)頁內(nèi)容所在行業(yè)分類沈陽沈陽SEO 3.5Spider和普通用戶的區(qū)別Spider可以容易的分辨網(wǎng)頁中是否有隱藏內(nèi)容,是否被掛了黑鏈,但不能完全了解網(wǎng)頁的圖片,JS,F(xiàn)lash中的內(nèi)容,普通用戶卻恰恰相反Spider對網(wǎng)站的抓取全部都是直接訪問,而普通用戶中除了直接訪問的用戶
4、外一般都是有上級訪問路徑的Spider不支持Cookie,但普通用戶的瀏覽器一般是支持的Spider不會(huì)主動(dòng)注冊登錄網(wǎng)站,但是普通用戶是可以的;Spider不會(huì)抓取網(wǎng)站Robots中屏蔽的內(nèi)容,但是普通用戶是可以訪問的Spider對于有多個(gè)動(dòng)態(tài)參數(shù)網(wǎng)站的抓取,可能會(huì)陷入死循環(huán),但是普通用戶不會(huì)Spider對于列表中前幾頁的新內(nèi)容抓取可能不好,但是感興趣的普通用戶會(huì)依次瀏覽Spider暫時(shí)還不能真正判斷文章是不是原創(chuàng),但是普通用戶可以通過多種方式來確定是原創(chuàng)還是轉(zhuǎn)載http:/ N中的文件進(jìn)行排序6.搜索引擎還會(huì)分析文件的外鏈數(shù)量、質(zhì)量和錨文本,根據(jù)錨文本輔助分析文件和關(guān)鍵詞的相關(guān)度。外鏈的數(shù)量
5、和質(zhì)量來確定文件的重要程度,以進(jìn)行排序調(diào)整7.2語義分析只根據(jù)關(guān)鍵詞匹配和外部鏈接對網(wǎng)頁的描述(錨文本),搜索引擎還不能真正理解網(wǎng)頁的內(nèi)容語義分析技術(shù)其實(shí)就是同各國對海量內(nèi)容的分析找出詞匯之間的關(guān)系,當(dāng)兩個(gè)詞或一組詞經(jīng)常出現(xiàn)在同一個(gè)文檔中時(shí),就可以認(rèn)為這些詞之間是語義相關(guān)的8、連接分析網(wǎng)頁之間的鏈接關(guān)系在一定程度上反映了每個(gè)網(wǎng)頁各自的重要程度,理論上重要的網(wǎng)頁獲得的連接數(shù)量會(huì)比較多。同時(shí)鏈接的屬性中還有錨文本,用來描述被連接頁面的內(nèi)容,對搜索引擎的排名有很大的影響9、用戶體驗(yàn)判斷現(xiàn)在的搜索引擎已經(jīng)不是以連接分析為中心了,而是以用戶體驗(yàn)為中心。在正常的內(nèi)容相關(guān)性判斷和鏈接分析的基礎(chǔ)上,網(wǎng)頁的用戶
6、體驗(yàn)對于搜索排名的影響越來越大。網(wǎng)站的用戶體驗(yàn)優(yōu)化(UEO)9.1正常用戶體驗(yàn)普通用戶瀏覽網(wǎng)站時(shí)的用戶體驗(yàn),可以分以下五大類:1.感官體驗(yàn):呈現(xiàn)給用戶視聽上的體驗(yàn),強(qiáng)調(diào)舒適性;3.情感體驗(yàn):呈現(xiàn)給用戶心理上的體驗(yàn),強(qiáng)調(diào)友好性;4.瀏覽體驗(yàn):呈現(xiàn)給用戶瀏覽上的體驗(yàn),強(qiáng)調(diào)吸引性;5.信任體驗(yàn):呈現(xiàn)給用戶的信任體驗(yàn),強(qiáng)調(diào)可靠性。10、有效索引和緩存機(jī)制 10.1有效索引用戶搜索時(shí),可能會(huì)匹配戶幾十萬上至幾億的網(wǎng)頁,但是大部分用戶只會(huì)瀏覽前三頁,這樣搜索引擎就沒有必要相應(yīng)每次搜索時(shí)都對全部的索引文件進(jìn)行檢索,只需要對一個(gè)適當(dāng)數(shù)量范圍內(nèi)的索引文件進(jìn)行索引就可以了。百度最多呈現(xiàn)760個(gè)結(jié)果,Google最
7、多呈現(xiàn)1000個(gè)結(jié)果。10.2緩存機(jī)制緩存就是臨時(shí)文件交換區(qū),是可以進(jìn)行高速數(shù)據(jù)交換的存儲(chǔ)器,它先于內(nèi)存與CPU交換數(shù)據(jù),因此速率極快。緩存淘汰機(jī)制把使用頻率小的搜索結(jié)果剔除,補(bǔ)充進(jìn)來使用頻率大的搜索結(jié)果,來保證緩存空間中的內(nèi)容可以相應(yīng)及命中當(dāng)下盡可能多的用戶搜索請求。緩存更新機(jī)制搜索引擎為了節(jié)約資源,不可能對緩存中的內(nèi)容進(jìn)行實(shí)時(shí)更新,而是會(huì)選擇搜索請求比較少的時(shí)間段進(jìn)行更新緩存。11、反作弊和人工干預(yù)自從有搜索引擎以來,就有人不斷研究搜索引擎的排名機(jī)制,進(jìn)而尋找搜索引擎排名的技術(shù)和邏輯漏洞,來快速提升自己網(wǎng)站的搜索排名。11.1反作弊算法反作弊就是過濾環(huán)節(jié)的重要組成部分黑白名單搜索引擎會(huì)根據(jù)網(wǎng)站內(nèi)容的質(zhì)量、權(quán)重、品牌建立白名單,也會(huì)找出明顯作弊嚴(yán)重的網(wǎng)站建立黑名單。作弊特征研究作弊特征研究是現(xiàn)在搜索引擎進(jìn)行反作弊的主要手法。當(dāng)發(fā)現(xiàn)一個(gè)對搜索結(jié)果影響很大的作弊網(wǎng)站或一種新的作弊收法時(shí),一般不會(huì)只是人工地把這個(gè)或這些網(wǎng)站降權(quán)或者屏蔽,而是潛心研究這個(gè)網(wǎng)站或這些網(wǎng)站到底是怎么作弊的,以及鉆了搜索引擎技術(shù)和邏輯上的什么漏洞。SEO工作中體現(xiàn)最明顯的就是選擇服務(wù)器和交換友情鏈
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蘇州科技大學(xué)天平學(xué)院《中國經(jīng)典管弦樂曲賞析》2021-2022學(xué)年第一學(xué)期期末試卷
- 2024賓館經(jīng)營承包合同
- 蘇州科技大學(xué)天平學(xué)院《市場營銷學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷
- 托兒所服務(wù)的家庭參與與合作考核試卷
- 中高端服飾品牌推廣案例分析考核試卷
- 化學(xué)礦物的利用與市場發(fā)展前景研究考核試卷
- 固體飲料行業(yè)品牌傳播與宣傳效果評估與分析考核試卷
- 摩托車的空氣動(dòng)力學(xué)與氣動(dòng)性能考核試卷
- 有效的銷售和談判技巧考核試卷
- 廣告創(chuàng)意設(shè)計(jì)趨勢展望考核試卷
- 蘇州某校蘇教版六年級數(shù)學(xué)上冊第四單元《解決問題的策略》教材分析及全部教案(共含3課時(shí))
- 國家開放大學(xué)電大本科《社會(huì)統(tǒng)計(jì)學(xué)》2023期末試題及答案(試卷代號:1318)
- 《小鯉魚跳龍門》教學(xué)設(shè)計(jì)3篇
- 新能源公司商業(yè)計(jì)劃書
- 農(nóng)田灌溉水渠施工方案
- 部編 統(tǒng)編 人教版九年級上冊初中語文 期末總復(fù)習(xí)課件 全冊專題課件
- 《大數(shù)據(jù)分析與應(yīng)用》教學(xué)大綱
- 三維激光掃描原理及應(yīng)用課件
- 民事訴訟法概述《民事訴訟法學(xué)》馬工程課件
- (完整版)環(huán)境保護(hù)考核表
- 箱變安裝施工方案66375
評論
0/150
提交評論