人文社科文獻(xiàn)檢索課第五章_第1頁(yè)
人文社科文獻(xiàn)檢索課第五章_第2頁(yè)
人文社科文獻(xiàn)檢索課第五章_第3頁(yè)
人文社科文獻(xiàn)檢索課第五章_第4頁(yè)
人文社科文獻(xiàn)檢索課第五章_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、人文社科文獻(xiàn)檢索課第五章第1頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日 5.1 網(wǎng)絡(luò)信息資源一、什么是網(wǎng)絡(luò)信息資源?廣義:網(wǎng)絡(luò)信息資源是在網(wǎng)上以各種方式存在并傳播的信息集合。 具體表現(xiàn):網(wǎng)上計(jì)算機(jī)中的無(wú)數(shù)信息、網(wǎng)上的各種信息工具以及網(wǎng)絡(luò)通信渠道。 網(wǎng)上信息:計(jì)算機(jī)中的數(shù)據(jù)庫(kù)、電子出版物、網(wǎng)頁(yè)、軟件以及各種文件所包含的信息。信息工具:FTP,Telnet,e-mail,WWW瀏覽器,搜索引擎等。網(wǎng)絡(luò)通訊渠道:網(wǎng)絡(luò)提供的信息交流渠道。第2頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日狹義概念:網(wǎng)絡(luò)信息資源通常只指公網(wǎng)上的信息資源,即訪問(wèn)不受任何限制的信息資源,它不包含使

2、用權(quán)受IP、用戶名及其密碼限制的資源。商業(yè)性數(shù)據(jù)庫(kù)因可以通過(guò)網(wǎng)絡(luò)加以使用,將它們歸入網(wǎng)絡(luò)信息資源是可以的,但由于這些數(shù)據(jù)庫(kù)的使用或者受IP限制,或者要求用戶名和密碼,是不能歸入公網(wǎng)信息資源范疇的。(本章將要介紹的內(nèi)容僅限于狹義的網(wǎng)絡(luò)信息資源,不包括使用權(quán)有限制的網(wǎng)上信息資源。)第3頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日二、網(wǎng)絡(luò)信息資源的特點(diǎn)數(shù)量龐大,增長(zhǎng)迅速(網(wǎng)頁(yè)增長(zhǎng))整體無(wú)序,局部有序(無(wú)序性特征)更新頻繁,變化無(wú)常(網(wǎng)頁(yè)壽命)多維顯示,交互方便(載體類型/通訊方式)良莠混雜,參差不一第4頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日三、網(wǎng)絡(luò)學(xué)術(shù)信息資源類型定

3、義:與學(xué)術(shù)研究有關(guān)的網(wǎng)絡(luò)資源。A. 按內(nèi)容區(qū)分:1. 網(wǎng)上傳播的學(xué)術(shù)機(jī)構(gòu)信息 2. 學(xué)術(shù)任務(wù)信息 3. 科研信息 4. 科研成果信息B. 按出版類型區(qū)分:網(wǎng)上學(xué)術(shù)信息資源有著和紙質(zhì)型出版物類似的對(duì)應(yīng)信息,但這種對(duì)應(yīng)關(guān)系并非一一對(duì)應(yīng)的。第5頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日C. 按照是否具有原創(chuàng)性區(qū)分: 1. 一次資源(原創(chuàng)性) 2. 二次資源(轉(zhuǎn)載或提?。〥. 按照是否經(jīng)過(guò)審核: 1. 正式出版物(ISBN/ISSN,學(xué)術(shù)價(jià)值相對(duì)較高) 2. 非正式出版物(學(xué)術(shù)價(jià)值變化較大)E. 按照是否屬于搜索引擎范圍:(400:1) 1. 不可見(jiàn)資源 2.可見(jiàn)資源第6頁(yè),共23頁(yè),

4、2022年,5月20日,11點(diǎn)23分,星期日網(wǎng)絡(luò)學(xué)術(shù)信息資源網(wǎng)上商用數(shù)據(jù)庫(kù)網(wǎng)上公開(kāi)資源一次資源二次資源一次資源二次資源全文期刊數(shù)據(jù)庫(kù)全文圖書(shū)數(shù)據(jù)庫(kù)其他全文數(shù)據(jù)庫(kù)期刊文摘數(shù)據(jù)庫(kù)會(huì)議文摘數(shù)據(jù)庫(kù)其他文摘數(shù)據(jù)庫(kù)學(xué)術(shù)機(jī)構(gòu)網(wǎng)站個(gè)人學(xué)術(shù)網(wǎng)站其他學(xué)術(shù)網(wǎng)站iPAC數(shù)據(jù)庫(kù)搜索引擎數(shù)據(jù)庫(kù)虛擬圖書(shū)館網(wǎng)絡(luò)導(dǎo)航其他網(wǎng)絡(luò)二次資源網(wǎng)上商用數(shù)據(jù)庫(kù)第7頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日四. 人文社會(huì)科學(xué)學(xué)術(shù)網(wǎng)站網(wǎng)頁(yè)、網(wǎng)站和主頁(yè)的概念 網(wǎng)頁(yè):學(xué)名HTML文件,是一種可以在互聯(lián)網(wǎng)上傳輸,并被瀏覽器認(rèn)識(shí)、翻譯成頁(yè)面顯示出來(lái)的文件。 網(wǎng)站:有獨(dú)立域名,由若干相關(guān)網(wǎng)頁(yè)組成的一個(gè)站點(diǎn)。(一般每個(gè)網(wǎng)站都有一個(gè)主頁(yè)Hom

5、epage) 主頁(yè):用戶通過(guò)超鏈接訪問(wèn)其他網(wǎng)頁(yè)或服務(wù)器的起始點(diǎn),用于引導(dǎo)訪問(wèn)者瀏覽網(wǎng)站。人文社會(huì)科學(xué)學(xué)術(shù)網(wǎng)站的類型 網(wǎng)絡(luò)學(xué)術(shù)信息資源的主要來(lái)源:學(xué)術(shù)網(wǎng)站 第8頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日學(xué)術(shù)網(wǎng)站的分類:1. 按內(nèi)容特征 綜合性社會(huì)科學(xué)學(xué)術(shù)網(wǎng)站 ??菩陨鐣?huì)科學(xué)學(xué)術(shù)網(wǎng)站2. 按主辦機(jī)構(gòu) 個(gè)人網(wǎng)站 雜志社網(wǎng)站 科研機(jī)構(gòu)網(wǎng)站3.按網(wǎng)站功能 學(xué)科門戶網(wǎng)站 學(xué)科資源網(wǎng)站 學(xué)科性論壇博客網(wǎng)站第9頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日4.學(xué)術(shù)網(wǎng)站的判斷方法 a. 網(wǎng)站和網(wǎng)頁(yè)的區(qū)別,主要依據(jù)顯示網(wǎng)頁(yè)的結(jié)構(gòu)和內(nèi)容。 b. 學(xué)術(shù)和非學(xué)術(shù)網(wǎng)站的區(qū)別主要依據(jù)網(wǎng)站本身的主

6、旨介紹。第10頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日5.2 網(wǎng)絡(luò)信息檢索工具和檢索方法 一、相關(guān)概念I(lǐng)P地址和域名 IP地址:因特網(wǎng)協(xié)議(Internet Protocol)地址, 類似于計(jì)算機(jī)在信息高速公路上的門牌號(hào)碼。由四段數(shù)字組成,中間用圓點(diǎn)隔開(kāi),例如 域名:Domain Name,簡(jiǎn)稱DN。一般由代表通訊協(xié)議、主機(jī)名、機(jī)構(gòu)性質(zhì)域名四段字母組成,類似于服務(wù)器在信息告訴公路上的門牌號(hào)碼,例如。 主機(jī)(host):又名服務(wù)器名稱,通常是使用機(jī)構(gòu)的簡(jiǎn)稱。 第11頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日2. IP地址和域名的關(guān)系及常見(jiàn)域名關(guān)系:域名只有作為服

7、務(wù)器的計(jì)算機(jī)必須,域名和IP地 址間有對(duì)應(yīng)互換的關(guān)系,域名更方便記憶。常見(jiàn)域名及其含義: .ac academic.co commercial .com educational .gov governmental .net Internet service provide國(guó)家、地區(qū)域名:.ca Canada .cn China .de G International .gb Great Britain .uk United Kingdom第12頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日3. 網(wǎng)址 定義:又稱統(tǒng)一資源定位器(Uni

8、form Resource Locator,簡(jiǎn)稱URL),代表了網(wǎng)上一切資源,包括上網(wǎng)計(jì)算機(jī)及其各種文件的地址。網(wǎng)址是由域名加文件地址構(gòu)成的。 作用:指明信息資源所在的目錄和文件名,還指明信息文件存在于網(wǎng)絡(luò)的那個(gè)計(jì)算機(jī)上,以及可以訪問(wèn)的方式等。4. 網(wǎng)上常見(jiàn)文件格式和后綴名bmp. Windows位圖 jpg. Jpg靜態(tài)圖形swf. 動(dòng)畫(huà) asf. 流媒體 rm. Real Video 第13頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日二、搜索引擎的基本概念搜索引擎的定義:Search Engines是網(wǎng)上信息搜索工具的通稱??梢允且粋€(gè)獨(dú)立的每戶網(wǎng)站,也可以是附在其他類型網(wǎng)站或

9、主頁(yè)上的一個(gè)搜索工具。搜索引擎的類型 (1)按工作方式區(qū)分,分為主題引擎、目錄引擎和多元引擎??煞譃橹黝}引擎、目錄引擎和多元引擎。 a. 主題引擎一般由搜索軟件(spider、robot、crawler),索引軟件(它的任務(wù)是建立索引)和檢索軟件三部分組成。它的優(yōu)點(diǎn)是信息量大、更新及時(shí)、無(wú)需人工干預(yù) 第14頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日 缺點(diǎn)是返回信息中常有很多無(wú)關(guān)信息,身子有一定比例的死鏈接,用戶必須從結(jié)果中進(jìn)行篩選。 b.目錄引擎又稱目錄指南性搜索引擎。這種引擎的信息收集和處理有人工干預(yù)過(guò)程,信息處理的層席位網(wǎng)站,檢索所得結(jié)果的網(wǎng)頁(yè)中不一定含有檢索詞。 目錄引擎

10、的用戶界面基本上都為分級(jí)結(jié)構(gòu)。 它與主題引擎的主要區(qū)別是由于目錄引擎旨在數(shù)據(jù)庫(kù)保存的編輯人員對(duì)站點(diǎn)的描述中進(jìn)行搜索,因此站點(diǎn)本身的動(dòng)態(tài)變化不會(huì)反映到搜索結(jié)果中來(lái)。 c.多元引擎又稱圓搜索引擎。它本身沒(méi)有存放網(wǎng)頁(yè)信息的數(shù)據(jù)庫(kù),當(dāng)用戶查詢一個(gè)關(guān)鍵詞是,它把請(qǐng)求轉(zhuǎn)換成其他數(shù)個(gè)搜索引擎能夠接受的命令格式,并行地活著有選擇性的訪問(wèn)這些搜索引擎并查詢這個(gè)關(guān)鍵詞,處理這些搜索引擎返回的結(jié)果,然后再返回給用戶。多元引擎的服務(wù)方式為面向網(wǎng)頁(yè)的檢索。但是嚴(yán)格來(lái)說(shuō),它只算是一個(gè)用戶代理。第15頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日 (2). 按照工作語(yǔ)種區(qū)分,可分為中文搜索引擎和外文搜索引擎。

11、(3). 按照搜索內(nèi)容區(qū)分,可分為門戶索索引擎和垂直搜索引擎。提供綜合性信息服務(wù)的搜索引擎稱之為門戶搜索引擎(如搜狐),而垂直引擎目前最普遍的是博客引擎。 它們的主要區(qū)別是: a. 門戶引擎內(nèi)容信息范圍要比處置引擎的來(lái)得廣; b. 門戶網(wǎng)站信息內(nèi)容的實(shí)效性相對(duì)新一些; c. 垂直引擎在信息的深度上往往比門戶引擎優(yōu)越一些。第16頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日三、幾個(gè)重要的引擎的使用方法1. 百度 輸入的檢索詞可以使研究的主題、網(wǎng)站、新 聞等任何內(nèi)容,形式可以使中文英文,數(shù)字或者中英數(shù)字的混合體;并且它不區(qū)分字母大小寫(xiě);它沒(méi)有模糊檢索和截詞檢索功能。 它可以使用兩個(gè)以上

12、檢索詞的檢索邏輯。 字段檢索。 標(biāo)題檢索。 在url中搜索。 特色功能:百度快照,相關(guān)檢索,專門內(nèi)容檢索。第17頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日2.谷歌(Google)它是優(yōu)點(diǎn)是網(wǎng)址數(shù)量大,檢索語(yǔ)種多,響應(yīng)速度快,它頁(yè)提供“網(wǎng)頁(yè)快照”功能,但是這只限國(guó)外站點(diǎn),點(diǎn)擊Cached鏈接即可。谷歌檢索文本框中可以任意輸入中英文檢索詞,故宮不支持借此福,但有默認(rèn)的截詞功能。檢索與反方面,檢索多個(gè)檢索詞時(shí)。3.Dogpile 它是個(gè)多元引擎,而且是目前性能比較好的一個(gè)并行式元搜索引擎。它可同時(shí)調(diào)用25個(gè)網(wǎng)頁(yè)引擎、新聞組引擎和ftp引擎等。 它的輸入框下方可選查Web, Usene

13、t, ftp等。 特色: a. 采用獨(dú)特的并行和串行相結(jié)合的查詢方式。 b. 可使用布爾算符合模糊查詢。第18頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日1. 選擇適合的檢索詞 a. 切分檢索提問(wèn)。 b. 檢索提問(wèn)具體化。 c. 使用搜索引擎要注意不能寫(xiě)錯(cuò)別字,還應(yīng)該盡量使用比較常用的詞語(yǔ)。 d. 避免使用禁用詞作為檢索詞。2.小時(shí)網(wǎng)頁(yè)和網(wǎng)站信息的獲取方法 有時(shí)由于網(wǎng)站整理、文件被重新命名引起的,有時(shí)是由于更換服務(wù)器引起的“404-Not Found”的錯(cuò)誤信息。此時(shí),我們可以用網(wǎng)址回溯法,還可以用字段檢索法,或者服務(wù)器緩存法。3.檢索策略的調(diào)整,即增減檢索同義詞、近義詞等,或者

14、使用邏輯與或者字段限制等策略。四、用搜索引擎學(xué)院注意的問(wèn)題和搜索引擎檢索策略實(shí)例第19頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日五、虛擬圖書(shū)館和網(wǎng)絡(luò)資源導(dǎo)航1. 虛擬圖書(shū)館的出現(xiàn)時(shí)為了減少信息選擇的難度。 較早提出該概念的人是美國(guó)人卡耶(Gapen D Kaye)。2. 何時(shí)使用虛擬圖書(shū)館: a.當(dāng)時(shí)間短促,不允許瀏覽有搜索引擎查得的巨量的信息時(shí); b.當(dāng)希望看到比較可靠的網(wǎng)絡(luò)信息; c.當(dāng)希望對(duì)某個(gè)領(lǐng)域有個(gè)整體的、較全面的了解時(shí);第20頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日5.3 學(xué)術(shù)網(wǎng)站的評(píng)價(jià)方法一、客觀評(píng)價(jià)方法(根據(jù)人工干預(yù)程度,進(jìn)行優(yōu)選有3種方法)1. 網(wǎng)站排名法 網(wǎng)站排名法是以客觀方法評(píng)價(jià)一個(gè)常用方法。某些排名網(wǎng)站通過(guò)定期自動(dòng)統(tǒng)計(jì)網(wǎng)站的訪問(wèn)量,分析網(wǎng)站的狀態(tài)和地位。 Alexa是當(dāng)前擁有排名網(wǎng)址數(shù)量較大、信息發(fā)布較詳細(xì)的一個(gè)排名網(wǎng)站。2. 鏈接分析法 它是利用某些搜索引擎提供的Link命令,檢查評(píng)價(jià)對(duì)象網(wǎng)站的被他人連接的情況也是評(píng)價(jià)網(wǎng)站的一個(gè)常用的客觀方法。3. 專家分析法 它是指利用網(wǎng)站組織的專家或者資源人員對(duì)網(wǎng)站做出的人工評(píng)價(jià)結(jié)果來(lái)評(píng)價(jià)網(wǎng)站。第21頁(yè),共23頁(yè),2022年,5月20日,11點(diǎn)23分,星期日二、主觀評(píng)價(jià)方法1.內(nèi)容評(píng)價(jià)法 從內(nèi)容角度對(duì)網(wǎng)站提供的信息進(jìn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論