電子商務(wù)-B-第08講課件_第1頁
電子商務(wù)-B-第08講課件_第2頁
電子商務(wù)-B-第08講課件_第3頁
電子商務(wù)-B-第08講課件_第4頁
電子商務(wù)-B-第08講課件_第5頁
已閱讀5頁,還剩36頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1/41電子商務(wù)副教授電話:Email:課程安排講授(36學(xué)時(shí),共17講)第1講:緒論第10講:電子商務(wù)物流規(guī)劃技術(shù)第2講:電子商務(wù)的概念與結(jié)構(gòu)第11講:物流信息系統(tǒng)集成技術(shù)第3講:電子商務(wù)戰(zhàn)略第12講:物流配送優(yōu)化調(diào)度技術(shù)第4講:電子商務(wù)系統(tǒng)設(shè)計(jì)第13講:電子商務(wù)資金流第5講:電子商務(wù)網(wǎng)站設(shè)計(jì)第14講:電子支付技術(shù)第6講:電子商務(wù)交易流程第15講:電子支付平臺(tái)工具第7講:電子商務(wù)商品展示技術(shù)第16講:電子支付安全技術(shù)第8講:電子商務(wù)搜索引擎技術(shù)第17講:電子商務(wù)法律法規(guī)第9講:電子商務(wù)商品推薦技術(shù)考試:最后一次課

2/413/41第8講電子商務(wù)搜索引擎技術(shù)5/41引言互聯(lián)網(wǎng)信息的爆炸性增長(zhǎng)表層網(wǎng)絡(luò)鏈接相連網(wǎng)站110,460,149深層網(wǎng)絡(luò)數(shù)據(jù)庫、動(dòng)態(tài)信息約為表層網(wǎng)絡(luò)500倍搜索引擎成為最重要的Web信息檢索工具全面、準(zhǔn)確、快速注:引自NetCraft6/41引言查閱資料所花費(fèi)的時(shí)間7/41圖:美國(guó)化學(xué)文摘(CA)中各類型文獻(xiàn)所占的比例

引言內(nèi)容提要搜索引擎如何工作如何被搜索引擎發(fā)現(xiàn)10/41搜索引擎的基本原理google(谷歌)、baidu(百度)的價(jià)值何在?搜索引擎是如何找到你所要的信息的?宣傳你公司產(chǎn)品的網(wǎng)頁怎么才能被著名的搜索引擎搜索到?輸出結(jié)果排名的奧秘在哪里?

搜索引擎的原理11/41搜索引擎的基本原理搜索引擎是能夠提供信息檢索服務(wù)的工具,根據(jù)查詢請(qǐng)求,檢索所需信息。

搜索引擎的原理從互聯(lián)網(wǎng)抓取網(wǎng)頁建立索引數(shù)據(jù)庫在索引數(shù)據(jù)庫中搜索排序13/41

搜索引擎的原理搜索引擎結(jié)構(gòu)的原理www索引器檢索器用戶接口robot…robot文檔庫索引庫圖:搜索引擎的組成和結(jié)構(gòu)14/41

搜索引擎的原理信息搜集各個(gè)搜索引擎都派出綽號(hào)為蜘蛛(Spider)或機(jī)器人(Robots)的“網(wǎng)頁搜索軟件”,在互聯(lián)網(wǎng)中漫游,發(fā)現(xiàn)和搜集信息。訪問網(wǎng)絡(luò)中公開區(qū)域的每一個(gè)站點(diǎn)并記錄其網(wǎng)址,將它們帶回搜索引擎,要盡可能多、盡可能快地搜集各種類型的新信息。因?yàn)榛ヂ?lián)網(wǎng)上的信息更新很快,所以還要定期更新已經(jīng)搜集過的舊信息,以避免死鏈接和無效鏈接。15/41

搜索引擎的原理搜索器的工作原理:搜索器的功能是在互聯(lián)網(wǎng)中漫游,發(fā)現(xiàn)和搜集信息。它常常是一個(gè)計(jì)算機(jī)程序,日夜不停地運(yùn)行。它要盡可能多、盡可能快地搜集各種類型的新信息,同時(shí)因?yàn)榛ヂ?lián)網(wǎng)上的信息更新很快,所以還要定期更新已經(jīng)搜集過的舊信息,以避免死連接和無效連接。目前有兩種搜集信息的策略:從一個(gè)起始URL集合開始,順著這些URL中的超鏈(Hyperlink),以寬度優(yōu)先、深度優(yōu)先或啟發(fā)式方式循環(huán)地在互聯(lián)網(wǎng)中發(fā)現(xiàn)信息。這些起始URL可以是任意的URL,但常常是一些非常流行、包含很多鏈接的站點(diǎn)(如Yahoo?。eb空間按照域名、IP地址或國(guó)家域名劃分,每個(gè)搜索器負(fù)責(zé)一個(gè)子空間的窮盡搜索。搜索器的實(shí)現(xiàn)常常用分布式、并行計(jì)算技術(shù),以提高信息發(fā)現(xiàn)和更新的速度。商業(yè)搜索引擎的信息發(fā)現(xiàn)可以達(dá)到每天幾百萬網(wǎng)頁。17/41

搜索引擎的原理索引器的工作原理索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項(xiàng),用于表示文檔以及生成文檔庫的索引表。索引項(xiàng)有客觀索引項(xiàng)和內(nèi)容索引項(xiàng)兩種:客觀項(xiàng):與文檔的語意內(nèi)容無關(guān),如作者名、URL、更新時(shí)間、編碼、長(zhǎng)度、鏈接流行度(LinkPopularity)等等;內(nèi)容索引項(xiàng):是用來反映文檔內(nèi)容的,如關(guān)鍵詞及其權(quán)重、短語、單字等等。內(nèi)容索引項(xiàng)可以分為單索引項(xiàng)和多索引項(xiàng)(或稱短語索引項(xiàng))兩種。單索引項(xiàng)對(duì)于英文來講是英語單詞,比較容易提取,因?yàn)閱卧~之間有天然的分隔符(空格);對(duì)于中文等連續(xù)書寫的語言,必須進(jìn)行詞語的切分。18/41

搜索引擎的原理檢索器-信息查詢根據(jù)用戶的查詢需求在索引庫中快速檢出相關(guān)網(wǎng)頁,并反饋檢索結(jié)果。一般包括分類目錄及關(guān)鍵詞兩種信息查詢方式。19/741

搜索引擎的原理檢索器的工作原理檢索器的功能是根據(jù)用戶的查詢?cè)谒饕龓熘锌焖贆z出文檔,進(jìn)行文檔與查詢的相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果進(jìn)行排序,并實(shí)現(xiàn)某種用戶相關(guān)性反饋機(jī)制。檢索器常用的信息檢索模型有集合理論模型、代數(shù)模型、概率模型和混合模型四種。

21/41

搜索引擎的原理排序技術(shù)存在不足和發(fā)展趨勢(shì)目前的排序技術(shù)存在兩大不足:沒有真正解決相關(guān)性。相關(guān)性是指搜索詞和頁面的相關(guān)程度。僅僅通過鏈接、錨文本、版式信息等表面特征,不能真正判斷搜索詞和文章的相關(guān)性,解決這個(gè)問題的根本方法是增加語意理解,例如主題詞和關(guān)鍵詞的提取,從語意上分析,得出搜索詞和網(wǎng)頁的相關(guān)程度,分析越準(zhǔn),效果越好。搜索結(jié)果單一化。在搜索引擎上,任何人搜索同一個(gè)詞的結(jié)果都是一樣。這樣明顯不能滿足訪問者的要求。為了克服搜索結(jié)果的單一化問題,需要對(duì)搜索結(jié)果進(jìn)行個(gè)性化設(shè)置。搜索結(jié)果排序要實(shí)現(xiàn)從單一化到個(gè)性化,最理想的結(jié)果應(yīng)該是針對(duì)每個(gè)訪問者,根據(jù)訪問者的搜索習(xí)慣和意愿,對(duì)搜索結(jié)果進(jìn)行排序。搜索引擎的技術(shù)改進(jìn)和優(yōu)化都直接反應(yīng)到搜索結(jié)果的排序上。22/41

搜索引擎的原理中文搜索引擎存在不足和發(fā)展趨勢(shì)中文分詞:中文分詞就是把中文的漢字序列切分成有意義的詞。因?yàn)樵谏习賰|的網(wǎng)頁中找到所有結(jié)果沒有太大意義,對(duì)于搜索引擎來說,最重要的并不是找到所有結(jié)果,而是把最相關(guān)的結(jié)果排在最前面,這也稱為相關(guān)度排序。中文分詞的準(zhǔn)確與否,常常直接影響到中文搜索引擎結(jié)果的相關(guān)度排序。中文分詞技術(shù)屬于自然語言處理技術(shù)范疇,現(xiàn)有的分詞算法可分為基于字符串匹配的分詞方法;基于理解的分詞方法;基于統(tǒng)計(jì)的分詞方法。23/41

搜索引擎的原理用戶接口用戶接口的作用是輸入用戶查詢、顯示查詢結(jié)果、提供用戶相關(guān)性反饋機(jī)制。主要的目的是方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時(shí)的信息。用戶接口的設(shè)計(jì)和實(shí)現(xiàn)使用人機(jī)交互的理論和方法,以充分適應(yīng)人類的思維習(xí)慣。25/41討論影響搜索引擎搜索結(jié)果排名的技術(shù)性因素Meta標(biāo)記域名Title標(biāo)記URLBody標(biāo)記關(guān)鍵字26/41討論影響網(wǎng)站排名因素-Meta標(biāo)記

對(duì)于搜索引擎來說,<META>標(biāo)記中最重要的是關(guān)鍵詞(keywords)和網(wǎng)頁描述(description),在HTML語言中形式如下:<HEAD><TITLE>Title</TITLE><METAName="keywords"Content="網(wǎng)頁描述"><METAName="description"Content="關(guān)鍵詞">......</HEAD>27/41討論29/74130/74131/74132/74133/74134/41討論網(wǎng)站在搜索引擎中排名的關(guān)鍵因素-域名

擁有獨(dú)立域名如果你的域名包含人們搜索你的產(chǎn)品或服務(wù)的關(guān)鍵詞,則你的網(wǎng)頁排在結(jié)果頁的前十名的機(jī)會(huì)就會(huì)大大增加,當(dāng)然如何確定關(guān)鍵詞有許多“說道”,避免域名包含太多的詞,除非用連接符分開。對(duì)于搜索引擎來說,像“”這樣的域名意味著排名機(jī)會(huì)減少,如果是“”,則能給你帶來更多的好運(yùn)。35/41討論網(wǎng)站在搜索引擎中排名的影響因素-Title

<TITLE>應(yīng)該出現(xiàn)在<HEAD>中,如下所示:<HEAD><TITLE>Title</TITLE><METAName="keywords"Content="......">......</HEAD>在計(jì)算網(wǎng)頁相關(guān)性時(shí),多數(shù)搜索引擎對(duì)出現(xiàn)在<TITLE>中的關(guān)鍵詞一個(gè)加重的“砝碼”,特別是當(dāng)關(guān)鍵詞同時(shí)在<BODY>文本中出現(xiàn)時(shí)。所以,一定要在<TITLE>中包含該網(wǎng)頁的關(guān)鍵詞。36/41討論網(wǎng)站在搜索引擎中排名的影響因素-URL

對(duì)于URL地址,應(yīng)該是英文名稱還是漢語拼音?

對(duì)于域名,應(yīng)以企業(yè)的名字或名字縮寫、注冊(cè)商標(biāo)的英語或漢語拼音來注冊(cè),同時(shí)考慮使用行業(yè)或商品變稱為其域名(因域名管理機(jī)構(gòu)不允許注冊(cè)行業(yè)或商品名稱)。對(duì)于根目錄下的子目錄名字應(yīng)該用英語,而不是漢語拼音。如下所示,如果你公司的某部門經(jīng)營(yíng)汽車生意,應(yīng)建一個(gè)子目錄,名稱為cars,而不是qiche。對(duì)于中國(guó)人來說,漢語拼音給不熟悉英語的讀者提供了方便,但是對(duì)搜索引擎來說,使用漢語拼音可能要失去排名計(jì)分,對(duì)于很多搜索引擎來說,其翻譯系統(tǒng)是英語-漢語,不是漢語拼音-漢語。37/41討論網(wǎng)站在搜索引擎中排名的影響因素-Body

<HTML><HEAD>......</HEAD><BODY>......</BODY></HTML>對(duì)于一篇特定主題的文章,其論點(diǎn)應(yīng)明確,結(jié)構(gòu)主次分明,這就是<H>標(biāo)題的作用,<H1>標(biāo)題對(duì)應(yīng)文章主論點(diǎn),并通過<H2>、<H3>標(biāo)題展開論述,所以說,<H>是Web文檔的框架,在其文本中一定要包含關(guān)鍵詞。另外有些時(shí)候,當(dāng)你需要強(qiáng)調(diào)某部分字體時(shí),不應(yīng)通過改變字體大小或加黑等措施實(shí)現(xiàn),而是利用<H>域來實(shí)現(xiàn)顯示效果。<BODY>在HTML代碼中的位置:38/41討論網(wǎng)站在搜索引擎中排名的關(guān)鍵因素-關(guān)鍵字

位置頻率法則:搜索引擎如何決定網(wǎng)頁的相關(guān)性?有很多影響因素,其中最主要的就是網(wǎng)頁中關(guān)鍵詞出現(xiàn)的位置和頻率,即位置頻率法則。網(wǎng)頁中一部分文本對(duì)網(wǎng)頁內(nèi)容有很高的概括性,搜索引擎在計(jì)算網(wǎng)頁排名時(shí)給這部分文本一個(gè)加重的“砝碼”,包含:1.<TITLE>中的文本2.<METANAME="KEYWORD">中的文本3.<METANAME="DESCRIPTION">中的文本4.<H1>或<H2>等中的文本5.<BODY>最前面自然段的部分文本6.網(wǎng)頁鏈接<A>中的文本7.注釋<!--insertcommentshere>中的文本8.圖像<ALT>tags中的文本9.你的網(wǎng)站URL地址中的文本頻率是衡量搜索引擎網(wǎng)頁相關(guān)性的另一個(gè)主要因素,搜索引擎將計(jì)算關(guān)鍵詞在網(wǎng)頁中(或某部分)出現(xiàn)的次數(shù)占該網(wǎng)頁(或某部分)詞匯總量的比率。頻率較高,則網(wǎng)頁相關(guān)性較高。

39/41討論如何確定關(guān)鍵詞

通過各種技巧查找到競(jìng)爭(zhēng)對(duì)手,分析其網(wǎng)站,并查看他們使用什么樣的關(guān)鍵詞,作為自己設(shè)計(jì)網(wǎng)站的參考。您可以使用<登錄奇兵>軟件提取META標(biāo)記功能或者<排名奇兵>軟件提取各搜索引擎相關(guān)關(guān)鍵字排名第一位網(wǎng)站的META標(biāo)記,用來參考;根據(jù)客戶群來制定戰(zhàn)略關(guān)鍵詞。如果你的網(wǎng)站經(jīng)銷生產(chǎn)資料,則應(yīng)以行業(yè)常用詞或?qū)I(yè)術(shù)語來作為關(guān)鍵詞;如果經(jīng)銷的是消費(fèi)品,則應(yīng)以人們?cè)趥鹘y(tǒng)媒體上經(jīng)常見到的詞語作為關(guān)鍵詞的首選。相近詞。比如你的網(wǎng)站銷售電腦,你還可以利用“計(jì)算機(jī)”、“品牌機(jī)”、“兼容機(jī)”等作為網(wǎng)站關(guān)鍵詞的補(bǔ)充,因?yàn)樵诟鞣N媒體上這些詞也很“流行”。相關(guān)詞。如果你的網(wǎng)站經(jīng)銷化妝品,你可以站在消

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論