計(jì)算機(jī)信息檢索2016_第1頁
計(jì)算機(jī)信息檢索2016_第2頁
計(jì)算機(jī)信息檢索2016_第3頁
計(jì)算機(jī)信息檢索2016_第4頁
計(jì)算機(jī)信息檢索2016_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、筒述互聯(lián)網(wǎng)信息資源的局限性? 分散無序多變信息質(zhì)量難以控制信息安全難以保障筒述元搜索引擎的缺點(diǎn)?檢索結(jié)果全面性和可靠性較差不能靈活控制結(jié)果的輸出檢索結(jié)構(gòu)排序不夠理想信息搜索覆蓋面存在局限性檢索式處理較復(fù)雜筒述圖書館館藏目錄檢索系統(tǒng)的檢索途徑?題目檢索責(zé)任者檢索分類檢索主題/關(guān)鍵詞檢索號(hào)碼檢索出版社名稱檢索搜索引擎的“瓶頸”?搜索引擎的索引能力,搜索引擎收錄信息的全面性是衡量其質(zhì)量水平的重要指標(biāo),能夠被索引進(jìn)數(shù)據(jù)庫的信息是有限的,搜索引擎的索引量,索引的更新時(shí)滯等都是制約搜索引擎的做。迎戰(zhàn)“深網(wǎng)”,在深網(wǎng)的搜索滲透過程中,主流搜索引擎面對(duì)不小的挑戰(zhàn)。由于種種原因,目前搜索引擎的排序和輸出主要有相

2、關(guān)性差和搜索結(jié)構(gòu)單一 化等問題。目錄型網(wǎng)絡(luò)檢索工具與搜索引擎的區(qū)別?適用性:目錄型檢索工具適合希望了解某一方面、某一概念的全面信息,而 搜索引擎對(duì)搜錄某一特定信息較為有用。優(yōu)勢(shì)與不足:目錄型檢索工具收錄的網(wǎng)站經(jīng)過專家人工精選,內(nèi)容豐*學(xué) 術(shù)性強(qiáng),信息質(zhì)量穩(wěn)定,檢準(zhǔn)率高,但搜索范圍比搜索引擎小,信息更新速 度較慢,很難檢到較專業(yè)、深入的信息,搜索引擎查詢?nèi)娑浞?、方便?捷,但是可選擇的網(wǎng)絡(luò)信息資源太多,檢準(zhǔn)率,查全率都比目錄型檢索工具 差,而且感覺使用復(fù)雜,門檻高。發(fā)展趨勢(shì):目錄型網(wǎng)絡(luò)檢索工具和檢索引擎各有優(yōu)缺點(diǎn),將來的發(fā)展趨勢(shì)是 將兩者結(jié)合起來,使結(jié)果更為全面、準(zhǔn)確。超文本傳輸協(xié)議是器與

3、web 服器之間相互通信、傳輸,響應(yīng)用戶請(qǐng)求的協(xié)議。超文本標(biāo)記語言是一種專門編程語言,具體規(guī)定和描述了文件顯示的顯體格式元搜索引擎元搜索引擎又稱集合式搜索引擎、并行搜索引擎或搜索引擎之搜索引擎,它是將 多個(gè)搜索引擎集成在一起,并提供一個(gè)統(tǒng)一的檢索界面。目錄型網(wǎng)絡(luò)檢索工具目錄型網(wǎng)絡(luò)檢索工具一般采用人工或半人工方式采集和存儲(chǔ)網(wǎng)絡(luò)信息,由專業(yè)人 員對(duì)網(wǎng)絡(luò)資源進(jìn)行調(diào)查收集,并遵循某種分類體系進(jìn)行分類,存儲(chǔ)和組織。標(biāo)準(zhǔn)標(biāo)準(zhǔn)指按規(guī)定程序制定,經(jīng)公認(rèn)權(quán)威機(jī)構(gòu)或主管機(jī)關(guān)批準(zhǔn)的,一整套在特定領(lǐng)域 內(nèi)必須執(zhí)行的規(guī)格、規(guī)則,技術(shù)要求等規(guī)范性文獻(xiàn)。傳記資料記錄歷史人物或當(dāng)代著名人物的生平資料等相關(guān)信息,這些信息一般包

4、括出卒年、 學(xué)歷、職務(wù)、經(jīng)歷、家庭、政治背景、學(xué)術(shù)觀點(diǎn)、團(tuán)體評(píng)價(jià)等。機(jī)構(gòu)目錄機(jī)構(gòu)目錄又稱名錄、指南、行名錄等,是用來查找機(jī)構(gòu)團(tuán)體相關(guān)的一類檢索工具。會(huì)議文獻(xiàn)學(xué)術(shù)會(huì)議是科學(xué)工作者進(jìn)行學(xué)術(shù)交流等的重要場(chǎng)所,會(huì)議文獻(xiàn)是在各種學(xué)術(shù)會(huì)議 上所發(fā)表的論文、報(bào)告、講演等的統(tǒng)稱。參考信息指人名、地名、機(jī)構(gòu)、事件、統(tǒng)計(jì)數(shù)據(jù)等一類數(shù)據(jù)、事實(shí)信息,是人們?cè)诠ぷ餮?究和日常生活中經(jīng)常要查考、弓用的信息。網(wǎng)絡(luò)資源目錄是以整個(gè)互聯(lián)網(wǎng)資源為檢索對(duì)象,將一些重要、優(yōu)質(zhì)的網(wǎng)絡(luò)資源組織成分類目錄,提供給用戶檢索.黃頁信息 黃頁是國(guó)際通用的按企業(yè)性質(zhì)和產(chǎn)品類別編排的工商電話號(hào)碼薄湘當(dāng)于一個(gè)城 市或地區(qū)的工商企業(yè)的戶口薄洞絡(luò)上的黃頁

5、信息還含有相應(yīng)工商企業(yè)的地址、產(chǎn)品和經(jīng)營(yíng)等的有關(guān)信息.基于內(nèi)容的圖像檢索(CBIR)基于內(nèi)容的圖像檢索是針對(duì)圖像的顏色、形狀、紋理和空間布局等可視化內(nèi)容進(jìn)行分析和檢索的圖像檢索技術(shù).年鑒年鑒是系統(tǒng)匯集一年內(nèi)人、事、物各方面發(fā)展變化的新情況和統(tǒng)計(jì)資料,按年度連續(xù)出版的資料性參考工具。用戶組信息資源,它的主要優(yōu)點(diǎn)是什么?用戶組信息資源實(shí)質(zhì)上都是由一組對(duì)某一特定主題事物有共同興趣的網(wǎng)絡(luò)用戶組成的郵件群組或電子論壇,是一種有組織的電子郵件系統(tǒng),用戶在期間通過電子郵件進(jìn)行一對(duì)多的交流。優(yōu)點(diǎn):直接交互;全球互聯(lián);主題鮮明互聯(lián)網(wǎng)檢索工具的性能評(píng)價(jià)主要從哪5個(gè)方面進(jìn)行?其中反映檢索系統(tǒng)效率的主要是什么?(檢全

6、率和檢準(zhǔn)率)收錄范圍檢索功能檢索效率檢索結(jié)果的處理和展示用戶界面設(shè)計(jì)什么是垂直搜索引擎?主要特征是什么?關(guān)鍵技術(shù)主要有哪兩項(xiàng)?垂直搜索引擎是針對(duì)某一特定領(lǐng)域,某一特定人群或某一特定需求提供的信息搜 素和有一定價(jià)值的相關(guān)信息服務(wù),其特點(diǎn)是專、精、深,且具有行業(yè)色彩。主要特征是:1.在信息采集上,采用主動(dòng)采集與被動(dòng)采集相結(jié)合的方式在信息加工上,對(duì)網(wǎng)頁信息進(jìn)行結(jié)構(gòu)化信息提取加工在信息檢索上,能夠提供結(jié)構(gòu)化與非結(jié)構(gòu)化相結(jié)合的方式進(jìn)行檢索目錄型網(wǎng)絡(luò)檢索工具主要適用于什么檢索情況?請(qǐng)列舉有代表性的網(wǎng)絡(luò)資源目 錄,國(guó)內(nèi)外各兩個(gè)?主要適用于:1.用戶進(jìn)行較籠統(tǒng)的主題瀏覽和檢索,允許用戶從登記類目中任意 選擇檢

7、索范虱對(duì)這些不同深度的主題類目進(jìn)行瀏覽或檢索當(dāng)用戶未形成很精確的檢索概念時(shí),采用主題指南作為檢索起點(diǎn) 非常有效。有代表的網(wǎng)絡(luò)資源目錄:國(guó)外:雅虎,Galaxy,Dmoz國(guó)內(nèi):搜狗,新浪HTML是一種專門編程語言,具體規(guī)定和描述了文件顯示的具體格式,也即web的描 述語言,用于編制通過www顯示的超文本文件Web信息資源又稱 word wide web,是因特網(wǎng)信息資源最主要、最常見的形式。它是指建立在 超文本、超媒體技術(shù)的基礎(chǔ)上。集文本、圖像、圖形、聲音為一體,并以直觀的 圖形用戶界面展示和提供信息的網(wǎng)絡(luò)資源形式。檢全率對(duì)于一項(xiàng)檢索,實(shí)際檢出的文件數(shù)目與所有應(yīng)該被檢出的文件數(shù)的比率簡(jiǎn)述 CBI

8、R(基于內(nèi)容的圖片檢索)的特點(diǎn)直接從圖像中提取語義和特征,并根據(jù)這些線索從大量存儲(chǔ)在數(shù)據(jù)庫的圖像 中查找,檢索出具有相似特征的圖像數(shù)據(jù)。可使檢索過程更加有效,適應(yīng)性 更強(qiáng)。以相似匹配similarity代替精確匹配match方式提問方式直觀,檢索交互性強(qiáng)多層次的高效檢索簡(jiǎn)述因特網(wǎng)上的主要信息內(nèi)容包括哪些種類(政科教,媒商休)政府信息科研信息.教育信息.媒體信息.商務(wù)信息.休閑娛樂信息簡(jiǎn)述人們對(duì)因特網(wǎng)提供的信息與服務(wù)的誤解認(rèn)為因特網(wǎng)無所不能,無所不包,所有信息均可在網(wǎng)上找到認(rèn)為在網(wǎng)上找到的,下載的信息都是對(duì)的認(rèn)為因特網(wǎng)上的信息可以取代其他的媒體或信息渠道認(rèn)為因特網(wǎng)上的信息無太多利用價(jià)值目錄型網(wǎng)絡(luò)

9、檢索工的分類法與類型 分類法有:1.主題分類法(主學(xué)圖分)2岸科分類法圖書分類法分面組配法類型有:1.網(wǎng)絡(luò)資源目錄(網(wǎng)學(xué)搜)2學(xué)科信息門戶搜索工具門戶鏈接鏈接是web網(wǎng)頁的元素,是指向其他信息資源的指針,把web頁捆綁在一起,跟隨鏈接可從一個(gè)文檔跳到另一個(gè)文檔。搜索工具門戶是將主要的搜索引擎集中起來,并按檢索對(duì)象或檢索功能的不同進(jìn)行分類、編排組織成目錄,通過目錄向用戶提供網(wǎng)絡(luò)檢索工具的分布、選擇與推薦、引導(dǎo)。圖像檢索是通過搜索圖像的文本表示或者視覺特征,為用戶提供互聯(lián)網(wǎng)上相關(guān)圖像資料檢 素服務(wù)的專業(yè)搜索引擎系統(tǒng)。網(wǎng)絡(luò)信息檢索技術(shù)發(fā)展需要以什么核心?主要在哪6個(gè)領(lǐng)域進(jìn)行開發(fā)和創(chuàng)新?以提高搜索工具

10、的信息服務(wù)功能,完善搜索服務(wù)為核心6個(gè)領(lǐng)域:(智語垂,基跨信)智能檢索語義檢索垂直檢索基于內(nèi)容的多媒體信息檢索跨語言檢索信息檢索可視化網(wǎng)絡(luò)信息資源質(zhì):的評(píng)價(jià)標(biāo)準(zhǔn)主要分為哪5條?評(píng)價(jià)方法主要分為哪兩類?目的(目范內(nèi)費(fèi)評(píng))(定性,定量)范圍內(nèi)容費(fèi)用評(píng)論評(píng)價(jià)方法:1癥性評(píng)價(jià)2癥量評(píng)價(jià),按檢索對(duì)象、檢索機(jī)制和集成檢索工具數(shù)量的不同,分別如何進(jìn)行劃分?按對(duì)象:web M源索XM(web 與非 web)非web資源檢索機(jī)制按檢索機(jī)制:目錄型(目索混)索引型混合型按集成檢索工具數(shù)量劃分:獨(dú)立型網(wǎng)絡(luò)檢索工具(獨(dú)立,集成)集成型網(wǎng)絡(luò)檢索工具在信息檢索策略中,試給出任意7個(gè)進(jìn)階檢索技巧?猜測(cè)URL右截?cái)嗑W(wǎng)址利用網(wǎng)

11、頁快照注意多義詞避免拼寫錯(cuò)誤利用瀏覽器的“查找”功能利用檢索工具的特殊功能使用輔助關(guān)鍵詞順藤摸瓜使用自然語言檢索注意單詞的大小寫垂直搜索善于利用錯(cuò)誤技巧搜索引擎檢索的對(duì)象是實(shí)時(shí)匹配互聯(lián)網(wǎng)上的網(wǎng)頁嗎?說明其工作原理的四個(gè)步驟,及其工作需要的四種主要信息預(yù)處理技術(shù)。搜索引擎實(shí)際檢索的對(duì)象不是真正的互聯(lián)網(wǎng),而是預(yù)先經(jīng)過加工整理的網(wǎng)頁索 引數(shù)據(jù)庫淇對(duì)網(wǎng)頁的檢索并不是基于語義,而是一種機(jī)械性的匹配網(wǎng)頁文字。工作原理的4個(gè)步驟:1 抓取:從互聯(lián)網(wǎng)抓取網(wǎng)頁索引:建立索引數(shù)據(jù)庫搜索、排序:在索引數(shù)據(jù)庫中搜索排序顯示:對(duì)搜索結(jié)果進(jìn)行處理排序四種主要信息預(yù)處理技術(shù):(關(guān)垃鏈網(wǎng))關(guān)鍵詞提取技術(shù)垃圾信息消除技術(shù)鏈接分

12、析技術(shù)網(wǎng)頁重要性計(jì)算技術(shù)在使用搜索引擎時(shí),關(guān)鍵詞的有效選取非常重要,請(qǐng)說明關(guān)鍵詞選取常用的5步驟,以及常見的可配套使用的布爾邏輯操作符。關(guān)鍵詞選取步驟:抽取基礎(chǔ)關(guān)鍵詞,排除常用詞考慮基礎(chǔ)關(guān)鍵詞的同義詞考慮上位詞和下位詞考慮相關(guān)詞總結(jié)審視常見的可配套使用的布爾邏輯操作符:and 操作符or 操作符“”(引號(hào)操作符)Near 操作符Before 和 after 操作符And not操作符通配符括號(hào)操作符簡(jiǎn)述互聯(lián)網(wǎng)信息檢索的類型順鏈而行的瀏覽基于目錄型檢索工具的互聯(lián)網(wǎng)信息檢索基于索引型檢索工具的互聯(lián)網(wǎng)信息檢索筒述目錄型網(wǎng)絡(luò)檢索工具的特點(diǎn)面向用戶的易用性提供準(zhǔn)確性較高的信息內(nèi)容提供導(dǎo)航作用良好的檢索體系結(jié)構(gòu)以明確的主題和對(duì)象為中心設(shè)置確定類目有兼容性強(qiáng)的多元類目筒述網(wǎng)上參考信息源的主要類型百科知識(shí)檢索網(wǎng)站人物信息檢索網(wǎng)站地理信息檢索網(wǎng)站時(shí)事新聞信息檢索網(wǎng)站機(jī)構(gòu)信息檢索網(wǎng)站語詞信息檢索網(wǎng)站統(tǒng)計(jì)信息檢索網(wǎng)站試述互聯(lián)網(wǎng)信息資源的評(píng)價(jià)方法1).定性評(píng)價(jià),按照一定的評(píng)價(jià)標(biāo)準(zhǔn)對(duì)被評(píng)站點(diǎn)的各方面特征、質(zhì)量做出主觀評(píng)判定量評(píng)價(jià),利用數(shù)量分析方法。對(duì)相關(guān)數(shù)據(jù)進(jìn)行調(diào)查采集,統(tǒng)計(jì)分柝進(jìn)而做出較系統(tǒng).客觀的評(píng)判用戶可以通過以下途徑做出評(píng)價(jià):從URL中得到信息.查看網(wǎng)站描述和版權(quán)聲明。3從鏈接中獲取信息參與他人評(píng)價(jià).試述網(wǎng)絡(luò)值息檢索技術(shù)將來的發(fā)展領(lǐng)域智能檢索:將人工智能技術(shù)引入檢索系統(tǒng),實(shí)現(xiàn)智能化的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論