信息檢索教學(xué)課件:第三章 網(wǎng)絡(luò)信息資源檢索_第1頁
信息檢索教學(xué)課件:第三章 網(wǎng)絡(luò)信息資源檢索_第2頁
信息檢索教學(xué)課件:第三章 網(wǎng)絡(luò)信息資源檢索_第3頁
信息檢索教學(xué)課件:第三章 網(wǎng)絡(luò)信息資源檢索_第4頁
信息檢索教學(xué)課件:第三章 網(wǎng)絡(luò)信息資源檢索_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章 網(wǎng)絡(luò)信息資源檢索第三章 網(wǎng)絡(luò)信息資源檢索3.1 網(wǎng)絡(luò)信息資源概述3.2 網(wǎng)絡(luò)信息檢索方法3.3 搜索引擎檢索技術(shù)3.4 重要的信息檢索網(wǎng)站3.5 學(xué)術(shù)信息資源檢索 3.1 網(wǎng)絡(luò)信息資源概述3.1.1 含義 指通過計(jì)算機(jī)網(wǎng)絡(luò)可以利用的各種信息資源的總和,即以數(shù)字化形式記錄的,以多媒體形式表達(dá)的,分布式存儲(chǔ)在網(wǎng)絡(luò)計(jì)算機(jī)的磁介質(zhì)、光介質(zhì)以及各類通信介質(zhì)上,并通過計(jì)算機(jī)網(wǎng)絡(luò)通信方式進(jìn)行傳遞的信息內(nèi)容的集合。3.1.2 類型 從文獻(xiàn)信息檢索角度分1、網(wǎng)上圖書信息 因特網(wǎng)上提供的圖書信息主要包括書目信息和電子圖書,這些信息可從以下途徑來獲取: (1)出版商提供的書目信息 (2)圖書館、文獻(xiàn)情報(bào)中心

2、提供的聯(lián)機(jī)圖書館館藏目錄 (3)數(shù)字圖書館提供的電子圖書 (4)網(wǎng)上書店2網(wǎng)上電子期刊信息 電子期刊是非常重要的網(wǎng)絡(luò)資源。網(wǎng)上電子期刊時(shí)效性強(qiáng)、內(nèi)容豐富、檢索途徑多樣,已成為利用率非常高的網(wǎng)絡(luò)信息源,特別是免費(fèi)的電子期刊。網(wǎng)上電子期刊包括與印刷版同時(shí)發(fā)行和僅在網(wǎng)上發(fā)行的兩種,其主要來源渠道有: (1)出版商和文摘索引服務(wù)商提供的期刊檢索服務(wù) (2)網(wǎng)絡(luò)數(shù)據(jù)庫信息服務(wù)商提供的服務(wù) (3)文獻(xiàn)情報(bào)部門或?qū)W術(shù)性機(jī)構(gòu)提供的服務(wù) (4)網(wǎng)絡(luò)版期刊提供的服務(wù) 3、專利信息 4、會(huì)議信息、技術(shù)標(biāo)準(zhǔn)、統(tǒng)計(jì)數(shù)據(jù)、科技新聞、政 策法規(guī)等5、數(shù)據(jù)庫信息6、多媒體信息7、軟件信息8、電子布告欄、博客等 (1)信息量大

3、,傳播廣泛;(2)信息層次多,品種多樣;(3)自由發(fā)布,交流直接;(4)信息傳播速度快,變化頻繁;(5)檢索方便,價(jià)廉實(shí)惠;(6)分散無序,缺乏管理;(7)內(nèi)容龐雜,質(zhì)量不一。3.1.3 網(wǎng)絡(luò)信息資源的特點(diǎn)3.2.1 直接瀏覽(1)網(wǎng)址查詢:用戶要訪問已知地址的信息資源,可以在瀏覽器地址欄中輸入已知的網(wǎng)站或網(wǎng)頁地址,直接進(jìn)行瀏覽。(2)偶然發(fā)現(xiàn):即在日常的網(wǎng)絡(luò)閱讀、漫游過程中、意外發(fā)現(xiàn)一些有用信息。(3)順“鏈”而行:指用戶在閱讀超文本文檔時(shí),利用文檔中的鏈接從一網(wǎng)頁轉(zhuǎn)向另一相關(guān)網(wǎng)頁。3.2 網(wǎng)絡(luò)信息資源檢索方法3.2.2 利用搜索引擎進(jìn)行信息檢索 一.搜索引擎的定義 搜索引擎(Search

4、engine): 狹義的搜索引擎主要指利用網(wǎng)絡(luò)自動(dòng)搜索技術(shù)軟件或人工方式,對Internet(主要是Web)網(wǎng)絡(luò)資源進(jìn)行收集、整理與組織,并提供檢索服務(wù)的一類信息服務(wù)系統(tǒng)。 利用搜索引擎進(jìn)行檢索的優(yōu)點(diǎn)是:省時(shí)省力,簡單方便,檢索速度快、范圍廣,能及時(shí)獲取新增信息。缺點(diǎn)在于,由于采用計(jì)算機(jī)軟件自動(dòng)進(jìn)行信息的加工處理,且檢索軟件的智能性不是很高,造成檢索的準(zhǔn)確性不是很理想,與人們的檢索需求及對檢索效率的期望有一定差距。 各種搜索引擎的工作過程類似,基本包括以下三個(gè)方面: (1)通過“網(wǎng)頁搜索程序”在網(wǎng)上搜尋所有信息,并將它們帶回搜索引擎。 (2)將信息進(jìn)行分類整理,建立搜索引擎數(shù)據(jù)庫。 (3)通過

5、Web服務(wù)器端軟件,為用戶提供瀏覽器界面下的信息查詢。 二. 搜索引擎工作原理三. 國外主要搜索引擎 (1) (2) (3)www. (4)www. (5)www. 四. 國外典型的元搜索引擎 (1) (2) (3) (4) (5) (6)http:/ (7)http:/科技搜索引擎Scirus評價(jià):目前互聯(lián)網(wǎng)上最全面、綜合性最強(qiáng)的面向科技信息的專業(yè)搜索引擎。類型:到目前為止已經(jīng)有45億科技信息編入索引中,包括學(xué)術(shù)期刊、研究所、政府、科學(xué)組織、會(huì)議、科學(xué)家的主頁和公司主頁等網(wǎng)站信息Scirus 是專門用于科技信息檢索的世界上最全面的科技搜索引擎。Scirus 與其它搜索引擎最大的區(qū)別在于,其既

6、可以搜索網(wǎng)站(Web),也可以搜索期刊資源,而且專注于科技方面的內(nèi)容。Scirus可檢索免費(fèi)資源和期刊資源。涵蓋超過1.05億個(gè)與科技相關(guān)的網(wǎng)站,包括9,000萬個(gè)網(wǎng)頁,以及1,700萬個(gè)來自其它信息源的記錄,這些信息源包括:Science Direct, IDEAL, MEDLINE on BioMedNet, Beilstein on ChemWeb, US Patent Office, E-Print ArXiv, Chemistry Preprint Server, Mathematics Preprint Server, CogPrints和NASA等。文獻(xiàn)類型:論文、專利、技術(shù)報(bào)告

7、、新聞等(文摘、全文)學(xué)科領(lǐng)域:農(nóng)業(yè)與生物學(xué),天文學(xué),生物科學(xué),化學(xué)與化工,計(jì)算機(jī)科學(xué),地球與行星科學(xué),經(jīng)濟(jì)、金融與管理科學(xué),工程、能源與技術(shù),環(huán)境科學(xué),語言學(xué),法學(xué),生命科學(xué),材料科學(xué),數(shù)學(xué),醫(yī)學(xué),神經(jīng)系統(tǒng)科學(xué),藥理學(xué),物理學(xué),心理學(xué),社會(huì)與行為科學(xué),社會(huì)學(xué)等。獲取途徑:免費(fèi)瀏覽所有檢索到的互聯(lián)網(wǎng)主頁的信息。Scirus提供的期刊資源可以免費(fèi)查看題錄和文摘。但是,獲取非免費(fèi)期刊全文需要預(yù)先注冊并支付費(fèi)用。(1)搜索客()(2)尤里卡()(3)北極星()(4)常青藤()(5)若比鄰()(6)21世紀(jì)搜索引擎()(7)悠游()(8)天網(wǎng)()(9)中國搜索()(10)百度()(11)搜狐(www.

8、 )(12)新浪()(13)萬緯搜索: http:/六. 常用中文搜索引擎3.3.1 布爾邏輯檢索 (1)邏輯與 算符:*、AND、& (2)邏輯或 算符:+、OR、 (3)邏輯非 算符:-、NOT、! 3.3 搜索引擎檢索技術(shù)3.3.2 詞組檢索 詞組檢索也稱為短語檢索,或字符串檢索。它是將一個(gè)詞組或短語用雙引號(hào)“”括起作為一個(gè)獨(dú)立運(yùn)算單元,進(jìn)行嚴(yán)格匹配,以提高檢索準(zhǔn)確度的一種方法。幾乎所有的搜索引擎都支持詞組搜索。 3.3.3 加/減號(hào)檢索 加/減號(hào)檢索是搜索引擎支持的常規(guī)功能,即在檢索詞前置“+”/“-”號(hào),其作用相當(dāng)于布爾邏輯“與”/“非”運(yùn)算。 例如:“+熱點(diǎn)+問題”相當(dāng)于“熱點(diǎn)AN

9、D問題”;“熱點(diǎn)-問題”相當(dāng)于“熱點(diǎn)NOT問題”。 3.3.4 截詞檢索 截詞是指在檢索詞的合適位置進(jìn)行截?cái)?,然后使用截詞符進(jìn)行處理。 特點(diǎn)是可節(jié)省輸入的字符,又可預(yù)防漏檢,提高查全率。 截詞符多采用通配符“?”或者“*”,可以用它代表多個(gè)字符。3.3.5 字段檢索 字段檢索是一種用于限定提問關(guān)鍵詞在數(shù)據(jù)庫記錄中出現(xiàn)的區(qū)域,控制檢索結(jié)果的相關(guān)性,提高檢索效果的檢索方法,多以字段限定方式實(shí)現(xiàn)。搜索引擎常用的字段有: 1)title/t:題名字段,表示查找標(biāo)題中包含檢索提問式的頁面 2)URL/U:網(wǎng)址字段,表示查找網(wǎng)址中包含檢索提問式的頁面 (1)雙引號(hào)精確匹配 (2)intitle關(guān)鍵詞在網(wǎng)頁

10、標(biāo)題中 注意:intitle:和后面的關(guān)鍵詞之間不要有空格。 (3)inurl限定在URL鏈接中搜索,使用的方式是用“inurl:”, 后跟需要在url中出現(xiàn)的關(guān)鍵詞。 (4)filetype對搜索對象做格式限制 使用方法是在“Filetype:”后跟文件格式?!癋iletype:”可以跟以下文件格式:DOC、XLS、PPT、PDF、TXT、RTF、ALL,其中,ALL表示搜索所有這些文件類型。 檢索式為:霍金 黑洞 filetype:pdf。 3.3.6 百度的主要搜索語法(5)書名號(hào)精確匹配 如:手機(jī)(6)site限定搜索目標(biāo)范圍,使用的方式是在查詢內(nèi)容的后面,加上“site:站點(diǎn)域名” 。(7) 邏輯查詢 邏輯“與”:空格。 邏輯“或”:“|” 邏輯“非”:“-” 百度的高級(jí)搜索如果用戶對百度各種查詢語法不熟悉,可以使用百度集成的高級(jí)搜索界面,可以方便的做各種搜索查詢。3.3.7 Google主要搜索語法 (1)空格:默認(rèn)連接符 (2)OR:搜索結(jié)果至少包含多個(gè)關(guān)鍵字中的任意一個(gè) (3)減號(hào)(-):搜索結(jié)果要求不包含某些特定信息 (4)雙引號(hào)(“”):短語或句子搜索 (5)site:對搜索的網(wǎng)站進(jìn)行限制 (6)filetype:在某一類文件中查找信息 (7)inurl:搜索的關(guān)鍵字包含在URL鏈接中(8) inti

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論