版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、Google從入門到精通主要內(nèi)容溫故而知新搜索引擎概述Google從入門到精通百度的特色搜索本次課的重點、難點、要求本次課的重點與難點:搜索引擎基本原理、Goolge搜索。本次課的要求:掌握Google搜索技術(shù)。一、溫故而知新網(wǎng)站設(shè)計與實現(xiàn)問題1:簡述網(wǎng)站設(shè)計的基本過程;答案:定位網(wǎng)站主題、名稱與網(wǎng)站CI形象,確定網(wǎng)站的欄目和板塊、目錄結(jié)構(gòu)和鏈接結(jié)構(gòu)、網(wǎng)站的整體風(fēng)格和創(chuàng)意設(shè)計、設(shè)計首頁溫故而知新(續(xù)1)問題2:網(wǎng)站實現(xiàn)時用到的技術(shù)有哪些?答案:HTML、ASP、Flash、Java Applet、XML一、溫故而知新二、搜索引擎概述搜索引擎的產(chǎn)生與發(fā)展搜索引擎的分類搜索引擎的原理搜索引擎的未來
2、2.1 搜索引擎的產(chǎn)生與發(fā)展Internet迅猛發(fā)展網(wǎng)絡(luò)信息資源急劇增長搜索引擎(Search Engine)技術(shù) 以一定的策略在互聯(lián)網(wǎng)上搜索、發(fā)現(xiàn)信息,對信息進(jìn)行理解、提取、組織和處理,并為用戶提供檢索服務(wù),從而起到了信息導(dǎo)航的目的。二、搜索引擎概述搜索引擎的產(chǎn)生與發(fā)展(續(xù)1)1990年以前,沒有任何人能搜索互聯(lián)網(wǎng);1990年,archie,第一個自動索引互聯(lián)網(wǎng)上匿名ftp網(wǎng)站文件的程序,不是真正的搜索引擎;1994年,Yahoo,手工輸入數(shù)據(jù),不能真正被歸為搜索引擎;1994年,WebCrawler,互聯(lián)網(wǎng)上第一個支持搜索文件全部文字的全文搜索引擎。二、搜索引擎概述搜索引擎的產(chǎn)生與發(fā)展(續(xù)
3、2)Lycos,相關(guān)性排序、前綴匹配、字符相近限制和網(wǎng)頁自動摘要;Infoseek,非常友善的用戶界面和大量附加服務(wù),與Netscape建立了戰(zhàn)略合作關(guān)系;1995年,一種新的搜索引擎形式:元搜索引擎;二、搜索引擎概述搜索引擎的產(chǎn)生與發(fā)展(續(xù)3)1995年底,AltaVista,大量的創(chuàng)新功能,最突出的優(yōu)勢是速度極快,第一個支持自然語言搜索,第一個實現(xiàn)高級搜索語法,還可以搜索新聞組,搜索圖片名稱中的文字;二、搜索引擎概述搜索引擎的產(chǎn)生與發(fā)展(續(xù)4)1998年9月27日,Google,頁面排序、動態(tài)摘要、網(wǎng)頁快照、每日更新、多文檔格式支持、地圖股票詞典尋人等集成搜索、多語言支持、用戶界面等功能上
4、的革新,再一次改變了搜索引擎的定義;二、搜索引擎概述搜索引擎的產(chǎn)生與發(fā)展(續(xù)5)1998年1月,Openfind,早期中文搜索引擎,在臺灣中正大學(xué)吳升教授的GAIS實驗室誕生;1997年10月,北大天網(wǎng)利用教育網(wǎng)資源,有強大的ftp搜索功能;二、搜索引擎概述搜索引擎的產(chǎn)生與發(fā)展(續(xù)6)2000年1月,百度baidu,超鏈分析專利發(fā)明人李彥宏,目前擁有最大的中文數(shù)據(jù)庫;二、搜索引擎概述2.2 搜索引擎的分類按照信息搜集方法和服務(wù)提供方式的不同,搜索引擎系統(tǒng)可以分為三大類: 1、目錄式:以人工或半自動方式搜集信息,然后人工形成信息摘要; 信息大多面向網(wǎng)站,提供目錄瀏覽服務(wù)和直接檢索服務(wù);由于加入人
5、的智能,所以信息準(zhǔn)確、搜索質(zhì)量高,但需要人工介入、維護(hù)量大、信息量少、更新不及時; 代表是Yahoo、新浪;二、搜索引擎概述搜索引擎的分類(續(xù)1) 2、機器人:、機器人:由一個稱為蜘蛛(spider)的機器人程序以某種策略自動地在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫,并將查詢結(jié)果返回給用戶; 服務(wù)方式是面向網(wǎng)頁的全文搜索,優(yōu)點是信息量大、更新及時、不需要人工干預(yù),缺點是返回信息過多,用戶必須從結(jié)果中進(jìn)行篩選; 代表是:AltaVista、Excite、Infoseek、Google、天網(wǎng);二、搜索引擎概述搜索引擎的分類(續(xù)2) 3、元搜索
6、引擎:、元搜索引擎:沒有自己的數(shù)據(jù),而是將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶; 服務(wù)方式為面向網(wǎng)頁的全文搜索,優(yōu)點是返回的信息量更大、更全,缺點是不能充分使用所使用搜索引擎的功能,用戶需要做更多的篩選; 代表是WebCrawler、InfoMarket等;二、搜索引擎概述2.3 搜索引擎的原理從互聯(lián)網(wǎng)上抓取網(wǎng)頁(爬行器、蜘蛛人搜集) 建立索引數(shù)據(jù)庫(索引器整理) 在索引數(shù)據(jù)庫中搜索排序(檢索器服務(wù)) 將結(jié)果返回用戶;二、搜索引擎概述2.4 搜索引擎的未來發(fā)展是硬道理:1、擁有大量用戶,有很高的經(jīng)濟價值;2、涉及信息檢索、人
7、工智能、計算機網(wǎng)絡(luò)、分布式處理、數(shù)據(jù)庫、數(shù)據(jù)挖掘、數(shù)字圖書館、自然語言處理等多領(lǐng)域的理論和技術(shù),所以具有綜合性和挑戰(zhàn)性。二、搜索引擎概述搜索引擎的未來(續(xù)1)發(fā)展的方向:1、重心放在如何提高查詢結(jié)果的精度,提高檢索的有效性上;2、基于智能代理的信息過濾和個性化服務(wù);3、采用分布式體系結(jié)構(gòu)提高系統(tǒng)規(guī)模和性能;4、重視交叉語言檢索的研究和開發(fā);http:/ Google簡介Google(www.G),Larry Page與Sergey Brin,1998年9月。http:/www.G Google搜索入門進(jìn)入google主頁 搜索一下“搜索引擎”:一個意外的發(fā)現(xiàn)!三、Google從入門到精通3.3
8、 Google初階搜索(1)要求包含兩個及兩個以上的關(guān)鍵詞:空格“ ”三、Google從入門到精通Google初階搜索(2)要求不包含某些特定信息:“-”這里的“ ”和“-”號,是英文字符,而不是中文字符的“”和“”。此外,操作符與作用的關(guān)鍵字之間,不能有空格。三、Google從入門到精通Google初階搜索(3)要求至少包含多個關(guān)鍵字中的任意一個:ORGoogle用大寫的用大寫的“OR”表示邏輯表示邏輯“或或”操作。操作。例題:搜索如下網(wǎng)頁,要求必須含有例題:搜索如下網(wǎng)頁,要求必須含有“搜索引擎搜索引擎”和和“歷史歷史”,沒有沒有“文化文化”,可以含有以下關(guān)鍵字中人任何一個或者多個:,可以含
9、有以下關(guān)鍵字中人任何一個或者多個:“Archie”、“蜘蛛蜘蛛”、“Lycos”、“Yahoo”。答案:答案:搜索引擎搜索引擎 歷史歷史 archie OR 蜘蛛蜘蛛 OR lycos OR yahoo -文化文化三、Google從入門到精通Google初階搜索(4)小結(jié):如何縮小搜索范圍,迅速找到目的資訊的一般方法:目標(biāo)信息一定含有的關(guān)鍵字(用“ ”連起來),目標(biāo)信息不能含有的關(guān)鍵字(用“-”去掉),目標(biāo)信息可能含有的關(guān)鍵字(用“OR”連起來)。三、Google從入門到精通Google初階搜索(5)一些雜項語法問題:1、通配符:google目前只可以用“*”來代替單個字符,而且包含“*”必須
10、用“”引起來:2、關(guān)鍵字的大小寫:google對英文字符大小寫不敏感;3、搜索整個短語或者句子:用短語做關(guān)鍵詞,必須加英文引號,否則空格會被當(dāng)作“與”來處理;三、Google從入門到精通Google初階搜索(6) 4、搜索引擎忽略的字符以及強制搜索:一些出現(xiàn)頻率極高的英文單詞,如“i”、”com”、”www”以及一些符號如“*”、“.”作忽略處理; 三、Google從入門到精通3.4 Google進(jìn)階搜索(1)對搜索的網(wǎng)站進(jìn)行限制:“site:”表示搜索結(jié)果局限于某個具體網(wǎng)站,如果要排除某網(wǎng)站或者某域名范圍內(nèi)的頁面,只需用“-網(wǎng)站/域名”; site后的冒號為英文字符,而且,冒號后不能有空格;
11、網(wǎng)站域名不能有“http:/”前綴,也不能有任何“/”的目錄后綴;網(wǎng)站頻道則只局限于“頻道名.域名”方式,而不能是“域名/頻道名”方式。三、Google從入門到精通例題1:查找斯坦福大學(xué)(Stanford University) 網(wǎng)站上的入學(xué) (admission) 信息。搜索:搜索:admission site:Google進(jìn)階搜索(2)三、Google從入門到精通admission site:Google進(jìn)階搜索(2)例題2:搜索中文教育科研網(wǎng)站()上關(guān)于搜索引擎技巧的頁面,搜索:搜索引擎 技巧 site:例題3:上著名IT門
12、戶網(wǎng)站ZDNET和CNET搜索一下關(guān)于搜索引擎技巧方面的資訊,搜索: search engine tips site: OR site:三、Google從入門到精通Google進(jìn)階搜索(2)例題4:搜索教育部科技發(fā)展中心網(wǎng)站()上關(guān)于統(tǒng)計資料的頁面。:三、Google從入門到精通搜索:統(tǒng)計統(tǒng)計 site:得到 8910 條查詢結(jié)果Google進(jìn)階搜索(3)在某一類文件中查找信息:“filetype:”是google開發(fā)的非常強大實用的一個搜索語法; Google已經(jīng)能檢索Office的.xls、.ppt、.doc,.rtf,WordPerfect文檔,Lotus1-2-3文檔,Adobe的.p
13、df文檔,ShockWave的.swf文檔(Flash動畫)等。三、Google從入門到精通Google進(jìn)階搜索(4)例題1:搜索幾個資產(chǎn)負(fù)債表的Office文檔;搜索:資產(chǎn)負(fù)債表 filetype:doc OR filetype:xls OR filetype:ppt例題2:搜索一些關(guān)于搜索引擎知識和技巧方面的PDF文檔搜索:search engine tips OR tutorial filetype:pdf三、Google從入門到精通Google進(jìn)階搜索(5)搜索的關(guān)鍵字包含在搜索的關(guān)鍵字包含在URL(Uniform Resource Locator,即統(tǒng)一資源定位系統(tǒng),也就是我們通常所
14、說的網(wǎng)址)鏈接即統(tǒng)一資源定位系統(tǒng),也就是我們通常所說的網(wǎng)址)鏈接中中:“inurl”語法返回的網(wǎng)頁鏈接中包含第一個關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁文檔中。有很多網(wǎng)站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網(wǎng)頁名稱中,比如“MP3”、“VEDIO”等,于是,就可以用INURL語法找到這些相關(guān)資源鏈接,然后,用第二個關(guān)鍵詞確定是否有某項具體資料。INURL語法和基本搜索語法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。“allinurl”語法返回的網(wǎng)頁的鏈接中包含所有作用關(guān)鍵字。三、Google從入門到精通Google進(jìn)階搜索(6)例題1:查找MIDI曲“滄海一聲笑”。搜索:
15、inurl:midi 滄海一聲笑例題2:查找可能具有PHF安全漏洞的公司網(wǎng)站。通常這些網(wǎng)站的CGI-BIN目錄中含有PHF腳本程序(這個腳本是不安全的),表現(xiàn)在鏈接中就是“域名/cgi-bin/phf”。搜索:allinurl:cgi-bin phf +com三、Google從入門到精通Google進(jìn)階搜索(7)搜索的關(guān)鍵字包含在網(wǎng)頁標(biāo)題中:使用“intitle”和“allintitle”表示對網(wǎng)頁的標(biāo)題欄進(jìn)行查詢;網(wǎng)頁標(biāo)題,就是HTML標(biāo)記語言title中的部分。網(wǎng)頁設(shè)計的一個原則就是要把主頁的關(guān)鍵內(nèi)容用簡潔的語言表示在網(wǎng)頁標(biāo)題中。因此,只查詢標(biāo)題欄,通常也可以找到高相關(guān)率的專題頁面。大家可
16、比較一下:例題:搜索教育部科技發(fā)展中心網(wǎng)站()上標(biāo)題中含“統(tǒng)計”資料的頁面。 搜索:intitle:統(tǒng)計 site:三、Google從入門到精通搜索intitle:”統(tǒng)計統(tǒng)計” site:得到 95 條查詢結(jié)果,與前例得到的 8910 條查詢結(jié)果相比,大大提高了檢索結(jié)果的相關(guān)性。Google進(jìn)階搜索(8)一些罕用語法:1、搜索所有鏈接到某個URL地址的網(wǎng)頁,如果你擁有一個個人網(wǎng)站,估計很想知道有多少人對你的網(wǎng)站作了鏈接。使用“l(fā)ink”語法就能讓你迅速達(dá)到這個目的。例題:搜索所有含指向華軍軟件園“”鏈接的網(wǎng)頁。搜索:link:三、Google從入門到精通Google進(jìn)階搜索(9)2、查找與某個
17、頁面結(jié)構(gòu)內(nèi)容相似的頁面,使用“related”來搜索結(jié)構(gòu)內(nèi)容方面相似的網(wǎng)頁;3、從google服務(wù)器上緩存頁面中查詢信息,使用“cache”語法,通常用于查找某些已經(jīng)被刪除的死鏈接網(wǎng)頁;4、其它罕用語法如info、stock等不一一介紹,有興趣的讀者可以參閱Google大全。三、Google從入門到精通Google進(jìn)階搜索(10)圖片搜索: ,Google圖像搜索目前支持的語法包括基本的搜索語法如“ ”、“-”、“OR”、“site”和 “filetype:”。其中“filetype:”的后綴只能是幾種限定的圖片類似,如JPG,GIF等。三、Google從入門到精通Google進(jìn)階搜索(11)
18、目錄檢索,訪問 ;目前Google使用的分類目錄采用了ODP的內(nèi)容?!癘pen Directory Project”是網(wǎng)景公司所主持的一項大型公共網(wǎng)頁目錄。由全世界各地的義務(wù)編輯人員來審核挑選網(wǎng)頁,并依照網(wǎng)頁的性質(zhì)及內(nèi)容來分門別類。因此,在某一目錄門類中進(jìn)行搜索往往能有更高的命中率。三、Google從入門到精通3.5 Google的其它杰出功能(1)網(wǎng)頁快照,是Google抓下來緩存在服務(wù)器上的網(wǎng)頁。它有三個作用 (可使用google快照助手)1、如果原地址打開很慢,那么可以直接查看Google緩存頁面,因為Google服務(wù)器速度極快。2、如果原鏈接已經(jīng)死掉或者因為網(wǎng)絡(luò)的原因暫時鏈接不通,那么
19、可以通過Google快照看到該頁面信息。當(dāng)然,快照內(nèi)容不是該頁最新頁面。3、如果打開的頁面信息量巨大,一下子找不到關(guān)鍵詞所在位置,那么可以通過Google快照,因為快照中Google用黃色表明關(guān)鍵字位置。三、Google從入門到精通Google的其它杰出功能(2)每日要點參考工具選擇關(guān)鍵字本地搜索旅行策劃查詢優(yōu)化按數(shù)字搜索股票查詢?nèi)?、Google從入門到精通天氣天氣 用Google 查詢中國城市地區(qū)的天氣和天氣預(yù)報,只需輸入一個關(guān)鍵詞(“天氣天氣”、“tq” 或或“TQ” 任選其一)。股票報價股票報價 用 Google 查詢股票價格和股市行情,非常簡潔方便。您只需輸入想查詢的股票證券名稱股票證
20、券名稱或是其六位其六位數(shù)代碼數(shù)代碼,Google就會返回其他鏈接讓您只要一次點擊便能得到有關(guān)股票證券的詳盡資料。每日要點例一:例一:利用利用google查找本地未來兩天的天氣情況。查找本地未來兩天的天氣情況。搜索:搜索:tq例二:例二:利用利用google查找查找“中國電信中國電信”的股市行情。的股市行情。搜索:搜索:中國電信中國電信計算器計算器 要使用內(nèi)置計算器功能,只需在搜索框中輸入想要想要完成的算式完成的算式即可。單位換算 可進(jìn)行諸如高度、重量等眾多計量單位間的換算。只需在搜索框中輸入想要進(jìn)行的換算想要進(jìn)行的換算即可。 參考工具同義詞搜索同義詞搜索 如果您并不僅僅想搜索單個字詞,而是想一
21、并搜索其同義詞,則在搜索字詞前加上一個代字符在搜索字詞前加上一個代字符 () 。 字典定義 查看某個字詞或詞組的定義,在此字詞或詞組前加上“define:”即可。 選擇關(guān)鍵字例三:例三:利用利用google查找查找“信息檢索信息檢索”的定義的定義搜索:搜索:define:信息檢索信息檢索本地搜索本地搜索 查找商店、餐館或其他本地商戶,鍵入商戶類別商戶類別和位置位置,Google 會將搜索結(jié)果連同地圖地圖、評論評論及其聯(lián)系方式聯(lián)系方式一并返回。 電影放映時間 查找上演的電影的評論和放映時間,鍵入“電影電影”、“影訊影訊”、影院名稱或近期電影的名稱、影院名稱或近期電影的名稱即可。房地產(chǎn)和住房 查看房源信息,鍵入“房地產(chǎn)房地產(chǎn)”以及城市城市的名字。 本地搜索貨幣換算貨幣換算 使用使用Google內(nèi)置的貨幣換算器,鍵入所要完成的內(nèi)置的貨幣換算器,鍵入所要完成的換算,換算,Google 會在結(jié)果頁中直接提供換算結(jié)果。會在結(jié)果頁中直接提供換算結(jié)果。 地圖 鍵入鍵入位置名稱位置名稱以及以及“map”或或“地圖地圖”,就會返回,就會返回相關(guān)地圖。點擊此地圖可將其放大查看。相關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 體檢科主任先進(jìn)事跡(7篇)
- 二級職稱專業(yè)技術(shù)工作總結(jié)(5篇)
- 企業(yè)舉辦年會總結(jié)主持詞結(jié)束語
- DB12T 487-2013 放射性同位素與射線裝置安全使用管理制度編制規(guī)范
- 書香校園演講稿模板九篇
- 中考前國旗下講話稿
- 個人師德師風(fēng)剖析材料范文(6篇)
- 與感恩同行演講稿錦集六篇
- DB12∕T 1048-2021 蚯蚓養(yǎng)殖技術(shù)規(guī)程
- 驗光技術(shù)課件教學(xué)課件
- 《艾滋病宣傳教育》課件
- 家長會課件:三年級家長會幻燈片
- 2024屆河南省九師聯(lián)盟高一化學(xué)第一學(xué)期期中達(dá)標(biāo)檢測試題含解析
- 我國競技體育后備人才培養(yǎng)研究述評
- 2023-2024學(xué)年南京地區(qū)五年級語文上冊期中自測(統(tǒng)編版)
- 船舶系固設(shè)備操作規(guī)程
- 新時代大中小學(xué)思政課一體化建設(shè)研究
- 工業(yè)自動化系統(tǒng)集成項目驗收方案
- 新教科版科學(xué)六年級上冊全冊實驗匯總 (超全)
- 王洪圖黃帝內(nèi)經(jīng)80課時講稿
- 攤鋪機司機班組級安全教育試卷
評論
0/150
提交評論