互聯(lián)網(wǎng)信息檢索原理_第1頁
互聯(lián)網(wǎng)信息檢索原理_第2頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

互聯(lián)網(wǎng)信息檢索原理?從信息利用的角度考察,互聯(lián)網(wǎng)信息資源由哪三方面構(gòu)成?答:從信息利用的角度考察,互聯(lián)網(wǎng)信息資源由連接在網(wǎng)上的計算機中的無數(shù)信息、網(wǎng)上的各種信息工具以及網(wǎng)絡(luò)通信渠道三方面構(gòu)成。2?簡述網(wǎng)絡(luò)信息資源的特點。答:網(wǎng)絡(luò)信息資源的特點是數(shù)量龐大、增長迅速;更新頻繁、變化無常、分布散亂;良莠混雜。3.如何正確認(rèn)識網(wǎng)絡(luò)信息與印刷性出版物在出版類型上的對應(yīng)關(guān)系?按照出版類型區(qū)分,網(wǎng)絡(luò)信息資源有著和印刷型出版物類似的對應(yīng)關(guān)系。例如,印刷型的期刊有網(wǎng)絡(luò)期刊與其相對應(yīng),印刷型的圖書有網(wǎng)絡(luò)圖書與其相對應(yīng),印刷型的報告有網(wǎng)絡(luò)報告與其相對應(yīng),如此等等。這種對應(yīng)關(guān)系,僅限于我們對網(wǎng)絡(luò)文獻(xiàn)信息類型的認(rèn)識,不能應(yīng)用于具體的文獻(xiàn)。例如,早期的印刷型文獻(xiàn)一般不會有網(wǎng)絡(luò)形式,多數(shù)的當(dāng)前印刷型學(xué)術(shù)文獻(xiàn)也不太可能找到對應(yīng)的網(wǎng)上電子版本。4.何謂原創(chuàng)性網(wǎng)絡(luò)信息和二次網(wǎng)絡(luò)信息?按照內(nèi)容是否具有原創(chuàng)性,網(wǎng)絡(luò)信息資源有一次資源和二次資源的區(qū)分。一次資源是指首次發(fā)表的原創(chuàng)性信息,二次資源是轉(zhuǎn)載已有的信息。5.何謂可見網(wǎng)絡(luò)信息和不可見網(wǎng)絡(luò)信息?按照是否屬于搜索引擎檢索范圍,網(wǎng)絡(luò)信息資源可分為可見資源和不可見資源兩類。簡述網(wǎng)絡(luò)可見信息的兩個條件??梢娰Y源是搜索引擎可搜索到的資源。這種資源要滿足兩個條件:一是必須含有HTML超鏈接,二是沒有設(shè)置口令,簡述網(wǎng)站和網(wǎng)頁的關(guān)系。網(wǎng)頁是用HTML或DHTML、XML等語言寫成的文本文件。而網(wǎng)站則是有獨立的域名,由若干相關(guān)網(wǎng)頁組成的一個站點。按照微軟公司的比喻,如果把WWW當(dāng)作是Internet上的大型圖書館,則每個Web站點就是一本書,每個Web頁面就是書的一頁。為什么說網(wǎng)絡(luò)學(xué)術(shù)信息不能唾手可得?原因主要有三:一是查找主頁信息通常要通過查找搜索引擎之類的中介數(shù)據(jù)庫才能進(jìn)行。而使用這些工具需要一些專門的技術(shù),希望高效率地查找網(wǎng)絡(luò)信息時尤其如此。二是一般情況下只使用一兩種搜索引擎所得的結(jié)果往往是滄海一粟。三是互聯(lián)網(wǎng)上學(xué)術(shù)類與非學(xué)術(shù)類信息的比例是1:10。再則,網(wǎng)上學(xué)術(shù)信息很多是以不可見資源形式存在著。因此查找網(wǎng)上信息的難度更大一些。9?按工作方式區(qū)分的搜索引擎有哪三類搜索引擎?按照工作方式的不同,搜索引擎可以分為主題引擎、目錄引擎和多元引擎。.簡述主題引擎的三個組成部分。主題引擎由三個主要部分構(gòu)成:Robot、Index和搜索軟件。?請舉出典型的國外和國內(nèi)主題引擎各一個。國外主題引擎的代表是Google,國內(nèi)代表為百度。

.為什么主題引擎的分類途徑不如目錄指南型引擎?主題搜索引擎提供的分類途徑或者為自動分類的結(jié)果,或是借用其他目錄引擎的分類數(shù)據(jù)(例如Google利用網(wǎng)景公司的OpenDirectory分類),因而分類檢索效果不如由人工仔細(xì)分類的目錄指南型搜索引擎。.簡述主題引擎與目錄指南型引擎的主要區(qū)別。(1)信息處理深度,目錄指南型引擎為網(wǎng)站,主題型引擎為網(wǎng)頁;(2)信息處理方式,目錄指南型引擎為有人工參與,主題型引擎為全自動化;(3)信息的質(zhì)量和數(shù)量,目錄指南型引擎質(zhì)量上相對較高,主題型引擎數(shù)量上相對較多。.為什么目錄指南型引擎的主題查找效果不如主題型引擎?目錄指南型引擎的主題檢索只在對站點人工描述語言中進(jìn)行,查找范圍有限,所得結(jié)果通常是分類類名和網(wǎng)站名稱,結(jié)果數(shù)量遠(yuǎn)不如主題引擎。.舉出國內(nèi)外目錄指南型引擎典型代表各一個。目錄引擎的國外代表是Yahoo!,國內(nèi)代表有新浪網(wǎng)。16.什么是多元搜索引擎?簡述其工作原理。多元引擎是一種起檢索中介作用的搜索引擎。多元引擎本身沒有存放網(wǎng)頁信息的數(shù)據(jù)庫。當(dāng)用戶查詢一個關(guān)鍵詞時,它把查詢請求轉(zhuǎn)換成其他數(shù)個搜索引擎能夠接受的命令格式,并行地或者有選擇性地訪問這些搜索引擎并查詢這個關(guān)鍵詞,處理這些搜索引擎返回的結(jié)果,然后再返回給用戶。.舉出國內(nèi)外多元引擎典型代表各一個。國外多元搜索引擎的代表是Dogpile,國內(nèi)的代表是萬緯等。?簡述中外問搜索引擎的主要區(qū)別。中文引擎可以使用英語等外文查找信息,外文引擎也可以使用中文;因而這兩種引擎的區(qū)別不在于使用的語言,而在于收集和處理信息的側(cè)重點。中文引擎主要收集和處理的信息是中文網(wǎng)頁,查找中文資料的效果通常勝過外文引擎。反之,如果需要查找英文信息,直接使用境外英文引擎效果更好。.百度引擎的網(wǎng)頁快照可以起什么作用?百度服務(wù)器通過程序收集網(wǎng)頁時,在緩存器中保留了網(wǎng)頁備份?!熬W(wǎng)頁快照”即是網(wǎng)頁備份的鏈接。當(dāng)點擊檢索結(jié)果標(biāo)題沒有結(jié)果時,“網(wǎng)頁快照”可以用于幫助獲取某些“消失”了的網(wǎng)頁信息。20?分別給出百度引擎限制于URL字段、標(biāo)題字段和網(wǎng)站字段的檢索命令。他們分別是inurl,intitle和site.21.簡述百度引擎的三種邏輯運算符。邏輯與為空格,邏輯或為“|”,邏輯非為“-”?.什么是虛擬圖書館?虛擬圖書館是一種網(wǎng)絡(luò)信息利用工具。它針對某一學(xué)科或領(lǐng)域的研究者的需要,將互聯(lián)網(wǎng)上與之有關(guān)的各種資源線索,包括與該學(xué)科或領(lǐng)域有關(guān)的研究機構(gòu)、實驗室、電子書籍、學(xué)術(shù)期刊、會議論壇、專家學(xué)者等的URL,進(jìn)行系統(tǒng)地收集、核實并加以組織,以網(wǎng)站、網(wǎng)頁或數(shù)據(jù)庫形式提供給用戶瀏覽或者檢索。

.簡述使用虛擬圖書館的場合。使用虛擬圖書館查找信息的場合為:當(dāng)時間短促,不允許瀏覽由搜索引擎查得的巨量的信息時;當(dāng)希望看到比較可靠的網(wǎng)絡(luò)信息;當(dāng)希望對某個領(lǐng)域有個整體的、較全面的了解時。.能否以網(wǎng)上信息資源完全代替印刷型文獻(xiàn)。哪一些文獻(xiàn)的全文更適合從網(wǎng)上獲得?目前,網(wǎng)上信息資源不能完全代

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論