互聯(lián)網(wǎng)信息檢索原理

上傳人：蠟*** IP屬地：天津上傳時(shí)間：2022-12-16 格式：DOCX 頁數(shù)：4 大?。?3.38KB 積分：12 舉報(bào) 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

互聯(lián)網(wǎng)信息檢索原理?從信息利用的角度考察，互聯(lián)網(wǎng)信息資源由哪三方面構(gòu)成？答：從信息利用的角度考察，互聯(lián)網(wǎng)信息資源由連接在網(wǎng)上的計(jì)算機(jī)中的無數(shù)信息、網(wǎng)上的各種信息工具以及網(wǎng)絡(luò)通信渠道三方面構(gòu)成。2?簡(jiǎn)述網(wǎng)絡(luò)信息資源的特點(diǎn)。答：網(wǎng)絡(luò)信息資源的特點(diǎn)是數(shù)量龐大、增長(zhǎng)迅速；更新頻繁、變化無常、分布散亂；良莠混雜。3.如何正確認(rèn)識(shí)網(wǎng)絡(luò)信息與印刷性出版物在出版類型上的對(duì)應(yīng)關(guān)系？按照出版類型區(qū)分，網(wǎng)絡(luò)信息資源有著和印刷型出版物類似的對(duì)應(yīng)關(guān)系。例如，印刷型的期刊有網(wǎng)絡(luò)期刊與其相對(duì)應(yīng)，印刷型的圖書有網(wǎng)絡(luò)圖書與其相對(duì)應(yīng)，印刷型的報(bào)告有網(wǎng)絡(luò)報(bào)告與其相對(duì)應(yīng)，如此等等。這種對(duì)應(yīng)關(guān)系，僅限于我們對(duì)網(wǎng)絡(luò)文獻(xiàn)信息類型的認(rèn)識(shí)，不能應(yīng)用于具體的文獻(xiàn)。例如，早期的印刷型文獻(xiàn)一般不會(huì)有網(wǎng)絡(luò)形式，多數(shù)的當(dāng)前印刷型學(xué)術(shù)文獻(xiàn)也不太可能找到對(duì)應(yīng)的網(wǎng)上電子版本。4.何謂原創(chuàng)性網(wǎng)絡(luò)信息和二次網(wǎng)絡(luò)信息？按照內(nèi)容是否具有原創(chuàng)性，網(wǎng)絡(luò)信息資源有一次資源和二次資源的區(qū)分。一次資源是指首次發(fā)表的原創(chuàng)性信息，二次資源是轉(zhuǎn)載已有的信息。5.何謂可見網(wǎng)絡(luò)信息和不可見網(wǎng)絡(luò)信息？按照是否屬于搜索引擎檢索范圍，網(wǎng)絡(luò)信息資源可分為可見資源和不可見資源兩類。簡(jiǎn)述網(wǎng)絡(luò)可見信息的兩個(gè)條件?？梢娰Y源是搜索引擎可搜索到的資源。這種資源要滿足兩個(gè)條件：一是必須含有HTML超鏈接，二是沒有設(shè)置口令，簡(jiǎn)述網(wǎng)站和網(wǎng)頁的關(guān)系。網(wǎng)頁是用HTML或DHTML、XML等語言寫成的文本文件。而網(wǎng)站則是有獨(dú)立的域名，由若干相關(guān)網(wǎng)頁組成的一個(gè)站點(diǎn)。按照微軟公司的比喻，如果把WWW當(dāng)作是Internet上的大型圖書館，則每個(gè)Web站點(diǎn)就是一本書，每個(gè)Web頁面就是書的一頁。為什么說網(wǎng)絡(luò)學(xué)術(shù)信息不能唾手可得？原因主要有三：一是查找主頁信息通常要通過查找搜索引擎之類的中介數(shù)據(jù)庫才能進(jìn)行。而使用這些工具需要一些專門的技術(shù)，希望高效率地查找網(wǎng)絡(luò)信息時(shí)尤其如此。二是一般情況下只使用一兩種搜索引擎所得的結(jié)果往往是滄海一粟。三是互聯(lián)網(wǎng)上學(xué)術(shù)類與非學(xué)術(shù)類信息的比例是1:10。再則，網(wǎng)上學(xué)術(shù)信息很多是以不可見資源形式存在著。因此查找網(wǎng)上信息的難度更大一些。9?按工作方式區(qū)分的搜索引擎有哪三類搜索引擎？按照工作方式的不同，搜索引擎可以分為主題引擎、目錄引擎和多元引擎。.簡(jiǎn)述主題引擎的三個(gè)組成部分。主題引擎由三個(gè)主要部分構(gòu)成：Robot、Index和搜索軟件。?請(qǐng)舉出典型的國外和國內(nèi)主題引擎各一個(gè)。國外主題引擎的代表是Google，國內(nèi)代表為百度。

.為什么主題引擎的分類途徑不如目錄指南型引擎？主題搜索引擎提供的分類途徑或者為自動(dòng)分類的結(jié)果，或是借用其他目錄引擎的分類數(shù)據(jù)（例如Google利用網(wǎng)景公司的OpenDirectory分類），因而分類檢索效果不如由人工仔細(xì)分類的目錄指南型搜索引擎。.簡(jiǎn)述主題引擎與目錄指南型引擎的主要區(qū)別。（1）信息處理深度,目錄指南型引擎為網(wǎng)站，主題型引擎為網(wǎng)頁；（2）信息處理方式，目錄指南型引擎為有人工參與，主題型引擎為全自動(dòng)化；（3）信息的質(zhì)量和數(shù)量,目錄指南型引擎質(zhì)量上相對(duì)較高，主題型引擎數(shù)量上相對(duì)較多。.為什么目錄指南型引擎的主題查找效果不如主題型引擎？目錄指南型引擎的主題檢索只在對(duì)站點(diǎn)人工描述語言中進(jìn)行，查找范圍有限，所得結(jié)果通常是分類類名和網(wǎng)站名稱，結(jié)果數(shù)量遠(yuǎn)不如主題引擎。.舉出國內(nèi)外目錄指南型引擎典型代表各一個(gè)。目錄引擎的國外代表是Yahoo!，國內(nèi)代表有新浪網(wǎng)。16.什么是多元搜索引擎?簡(jiǎn)述其工作原理。多元引擎是一種起檢索中介作用的搜索引擎。多元引擎本身沒有存放網(wǎng)頁信息的數(shù)據(jù)庫。當(dāng)用戶查詢一個(gè)關(guān)鍵詞時(shí)，它把查詢請(qǐng)求轉(zhuǎn)換成其他數(shù)個(gè)搜索引擎能夠接受的命令格式，并行地或者有選擇性地訪問這些搜索引擎并查詢這個(gè)關(guān)鍵詞，處理這些搜索引擎返回的結(jié)果，然后再返回給用戶。.舉出國內(nèi)外多元引擎典型代表各一個(gè)。國外多元搜索引擎的代表是Dogpile，國內(nèi)的代表是萬緯等。?簡(jiǎn)述中外問搜索引擎的主要區(qū)別。中文引擎可以使用英語等外文查找信息，外文引擎也可以使用中文；因而這兩種引擎的區(qū)別不在于使用的語言，而在于收集和處理信息的側(cè)重點(diǎn)。中文引擎主要收集和處理的信息是中文網(wǎng)頁，查找中文資料的效果通常勝過外文引擎。反之，如果需要查找英文信息，直接使用境外英文引擎效果更好。.百度引擎的網(wǎng)頁快照可以起什么作用？百度服務(wù)器通過程序收集網(wǎng)頁時(shí)，在緩存器中保留了網(wǎng)頁備份。“網(wǎng)頁快照”即是網(wǎng)頁備份的鏈接。當(dāng)點(diǎn)擊檢索結(jié)果標(biāo)題沒有結(jié)果時(shí)，“網(wǎng)頁快照”可以用于幫助獲取某些“消失”了的網(wǎng)頁信息。20?分別給出百度引擎限制于URL字段、標(biāo)題字段和網(wǎng)站字段的檢索命令。他們分別是inurl,intitle和site.21.簡(jiǎn)述百度引擎的三種邏輯運(yùn)算符。邏輯與為空格，邏輯或?yàn)椤皘”，邏輯非為“-”?.什么是虛擬圖書館？虛擬圖書館是一種網(wǎng)絡(luò)信息利用工具。它針對(duì)某一學(xué)科或領(lǐng)域的研究者的需要，將互聯(lián)網(wǎng)上與之有關(guān)的各種資源線索，包括與該學(xué)科或領(lǐng)域有關(guān)的研究機(jī)構(gòu)、實(shí)驗(yàn)室、電子書籍、學(xué)術(shù)期刊、會(huì)議論壇、專家學(xué)者等的URL，進(jìn)行系統(tǒng)地收集、核實(shí)并加以組織，以網(wǎng)站、網(wǎng)頁或數(shù)據(jù)庫形式提供給用戶瀏覽或者檢索。

.簡(jiǎn)述使用虛擬圖書館的場(chǎng)合。使用虛擬圖書館查找信息的場(chǎng)合為:當(dāng)時(shí)間短促，不允許瀏覽由搜索引擎查得的巨量的信息時(shí)；當(dāng)希望看到比較可靠的網(wǎng)絡(luò)信息；當(dāng)希望對(duì)某個(gè)領(lǐng)域有個(gè)整體的、較全面的了解時(shí)。.能否以網(wǎng)上信息資源完全代替印刷型文獻(xiàn)。哪一些文獻(xiàn)的全文更適合從網(wǎng)上獲得？目前，網(wǎng)上信息資源不能完全代

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

互聯(lián)網(wǎng)信息檢索原理

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

互聯(lián)網(wǎng)信息檢索原理

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔