信息檢索與科技寫(xiě)作課件:網(wǎng)絡(luò)信息檢索與在線檢索工具_(dá)第1頁(yè)
信息檢索與科技寫(xiě)作課件:網(wǎng)絡(luò)信息檢索與在線檢索工具_(dá)第2頁(yè)
信息檢索與科技寫(xiě)作課件:網(wǎng)絡(luò)信息檢索與在線檢索工具_(dá)第3頁(yè)
信息檢索與科技寫(xiě)作課件:網(wǎng)絡(luò)信息檢索與在線檢索工具_(dá)第4頁(yè)
信息檢索與科技寫(xiě)作課件:網(wǎng)絡(luò)信息檢索與在線檢索工具_(dá)第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

網(wǎng)絡(luò)信息檢索與在線檢索工具網(wǎng)絡(luò)信息檢索與在線檢索工具隨著計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,計(jì)算機(jī)網(wǎng)絡(luò)在現(xiàn)代信息社會(huì)中的作用越來(lái)越重要,人們可以通過(guò)互聯(lián)網(wǎng)獲得數(shù)據(jù)、圖片、文本、科技文獻(xiàn)等信息,也可以通過(guò)互聯(lián)網(wǎng)進(jìn)行信息的保存和整理。在信息社會(huì),檢索、保存和利用網(wǎng)絡(luò)信息資源,是科研工作者必須具備的基本素質(zhì)。本章的主要內(nèi)容3.1網(wǎng)絡(luò)信息資源概述3.2網(wǎng)絡(luò)信息檢索基礎(chǔ)3.3網(wǎng)絡(luò)信息在線檢索工具網(wǎng)絡(luò)信息檢索與在線檢索工具3.1網(wǎng)絡(luò)信息資源概述3.1.1網(wǎng)絡(luò)信息資源的概念網(wǎng)絡(luò)信息資源也稱(chēng)虛擬信息資源,是互聯(lián)網(wǎng)時(shí)代的產(chǎn)物。,網(wǎng)絡(luò)信息資源以數(shù)字化形式記錄,以多媒體形式表達(dá),存儲(chǔ)在網(wǎng)絡(luò)計(jì)算機(jī)磁介質(zhì)、光介質(zhì)以及各類(lèi)通信介質(zhì)上,并通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)進(jìn)行信息傳遞。資源提供方基于http、ftp、telnet、ed2k、thunder等協(xié)議通過(guò)網(wǎng)絡(luò)對(duì)外提供信息服務(wù),用戶(hù)利用計(jì)算機(jī)、智能手機(jī)等網(wǎng)絡(luò)終端設(shè)備對(duì)這些信息進(jìn)行獲取或下載。網(wǎng)絡(luò)信息檢索與在線檢索工具3.1網(wǎng)絡(luò)信息資源概述3.1.2網(wǎng)絡(luò)信息資源的特點(diǎn)傳統(tǒng)信息資源的載體體積較大且不易攜帶,會(huì)受地域空間的影響,導(dǎo)致信息在短時(shí)間內(nèi)無(wú)法共享?,F(xiàn)代網(wǎng)絡(luò)信息資源則突破了信息檢索的區(qū)域性和局限性,極大地增加了檢索范圍,優(yōu)化了檢索途徑。與傳統(tǒng)信息資源相比,網(wǎng)絡(luò)信息資源包括以下特點(diǎn):(1)開(kāi)放性、共享性。網(wǎng)絡(luò)信息資源的共享,使得人們獲取信息的方式得到了很大改善,不再受時(shí)空和地理位置差異的影響。(2)檢索的便捷性。網(wǎng)絡(luò)環(huán)境下信息的傳遞和反饋快速靈敏,具有動(dòng)態(tài)性和實(shí)時(shí)性等特點(diǎn)。信息在網(wǎng)絡(luò)中的流動(dòng)性非常迅速,無(wú)線電和衛(wèi)星通信技術(shù)的充分運(yùn)用,使得上傳到網(wǎng)上的任何信息資源,只需要短短的數(shù)秒鐘就能傳遞到世界各地的每一個(gè)角落網(wǎng)絡(luò)信息檢索與在線檢索工具3.1網(wǎng)絡(luò)信息資源概述3.1.2網(wǎng)絡(luò)信息資源的特點(diǎn)(3)網(wǎng)絡(luò)信息資源建設(shè)的高效性。網(wǎng)絡(luò)信息資源的高效性并不是指速度方面的高效率,而是指用戶(hù)所需要的知識(shí)信息對(duì)自己從事的活動(dòng)具有較高價(jià)值。(4)時(shí)效性強(qiáng)、交互功能強(qiáng)。網(wǎng)絡(luò)信息資源從本質(zhì)上改變了信息的創(chuàng)造交流和獲取方式,實(shí)現(xiàn)了無(wú)紙化出版,去掉了傳統(tǒng)出版的紙質(zhì)書(shū)稿的印刷投遞等,使得時(shí)效性得到巨大提升,減少了出版時(shí)間,加快了知識(shí)傳播速度。此外,網(wǎng)絡(luò)平臺(tái)具有強(qiáng)大的交互功能,在網(wǎng)絡(luò)信息資源高效共享下,有關(guān)專(zhuān)家可以就某一專(zhuān)題開(kāi)展電子論壇,大家都可以參與討論交流。作者、出版社和讀者對(duì)文章的討論也更加方便。網(wǎng)絡(luò)信息檢索與在線檢索工具3.1網(wǎng)絡(luò)信息資源概述3.1.2網(wǎng)絡(luò)信息資源的特點(diǎn)(5)容量大、內(nèi)容豐富、形式復(fù)雜。與基于紙介質(zhì)的傳統(tǒng)信息資源不同,數(shù)字化存儲(chǔ)是網(wǎng)絡(luò)信息資源存儲(chǔ)的基本形式,存儲(chǔ)介質(zhì)主要以磁介質(zhì)、光介質(zhì)為主。高密度、大容量的數(shù)字化存儲(chǔ)不僅適合計(jì)算機(jī)的高速處理、低成本遠(yuǎn)距離傳輸,同時(shí)也方便用戶(hù)查詢(xún)和獲取。盡管數(shù)字化的網(wǎng)絡(luò)信息資源在物理層面都是以二進(jìn)制表示,但其外在表現(xiàn)形式復(fù)雜多樣,具體包括文本、圖形、圖像、音頻、視頻、軟件等多種形式。網(wǎng)絡(luò)信息檢索與在線檢索工具3.1網(wǎng)絡(luò)信息資源概述3.1.2網(wǎng)絡(luò)信息資源的特點(diǎn)(6)微觀有序、宏觀無(wú)序與不均衡性。從微觀層面來(lái)看,網(wǎng)絡(luò)獲取的多數(shù)內(nèi)容都經(jīng)過(guò)不同程度的有序化,并存儲(chǔ)在一個(gè)具體的系統(tǒng)中,從而呈現(xiàn)局部有序狀態(tài)。但是從宏觀來(lái)看,由眾多來(lái)源不同的微觀有序系統(tǒng)組合而成的網(wǎng)絡(luò)信息資源系統(tǒng)呈現(xiàn)無(wú)序分散狀態(tài),其結(jié)構(gòu)復(fù)雜,難以控制,缺乏穩(wěn)定性。這種宏觀無(wú)序的狀態(tài)降低了信息獲取的效率,增加了信息獲取的難度。信息資源的非均衡性表現(xiàn)為地域的非均衡性和語(yǔ)言的非均衡性。在全球范圍內(nèi),以美國(guó)為首的西方發(fā)達(dá)國(guó)家信息資源發(fā)展水平遠(yuǎn)高于發(fā)展中國(guó)家。在我國(guó),東部地區(qū)的信息資源發(fā)展水平高于西部地區(qū)。網(wǎng)絡(luò)信息檢索與在線檢索工具3.1網(wǎng)絡(luò)信息資源概述3.1.3網(wǎng)絡(luò)信息資源的分類(lèi)1、按照網(wǎng)絡(luò)類(lèi)型劃分局域網(wǎng)信息資源。局域網(wǎng)是指將一定區(qū)域內(nèi)的各類(lèi)計(jì)算機(jī)、外部設(shè)備和數(shù)據(jù)庫(kù)連接起來(lái)形成計(jì)算機(jī)通信網(wǎng)。通過(guò)專(zhuān)用數(shù)據(jù)線路與其他局域網(wǎng)或數(shù)據(jù)庫(kù)連接,可以形成更大范圍的信息處理系統(tǒng)。聯(lián)機(jī)檢索信息資源。聯(lián)機(jī)檢索是指用戶(hù)借助通信線路,通過(guò)終端設(shè)備連接檢索系統(tǒng)進(jìn)行文獻(xiàn)與數(shù)據(jù)檢索?;ヂ?lián)網(wǎng)信息資源?;ヂ?lián)網(wǎng)以相互交流信息資源為目的,基于通信協(xié)議,由路由器和通信線路聯(lián)結(jié)而成,是一個(gè)實(shí)現(xiàn)資源共享的綜合平臺(tái)。網(wǎng)絡(luò)信息檢索與在線檢索工具3.1網(wǎng)絡(luò)信息資源概述3.1.3網(wǎng)絡(luò)信息資源的分類(lèi)2、按照網(wǎng)絡(luò)傳輸協(xié)議或技術(shù)劃分萬(wàn)維網(wǎng)信息資源。萬(wàn)維網(wǎng)信息資源(www)以超文本和超媒體技術(shù)為基礎(chǔ),集文本、圖像、圖形和聲音于一體。它通過(guò)超文本傳輸協(xié)議在萬(wàn)維網(wǎng)客戶(hù)端和服務(wù)器之間傳輸。文件傳輸協(xié)議信息資源。文件傳輸協(xié)議(filetransferprotocol,F(xiàn)TP)信息資源是指網(wǎng)絡(luò)中基于FTP進(jìn)行交流的文件信息資源。流媒體信息資源。流媒體信息資源基于流媒體技術(shù)進(jìn)行傳輸,將一連串的媒體數(shù)據(jù)壓縮后,以流的方式在網(wǎng)絡(luò)中分段傳送,實(shí)現(xiàn)在網(wǎng)絡(luò)上實(shí)時(shí)傳輸影音。P2P信息資源。P2P信息資源指基于P2P傳輸模式的信息資源。P2P傳輸模式是指不通過(guò)中樞服務(wù)器在個(gè)人電腦之間實(shí)現(xiàn)文件交換和共享的一種新模式。其他信息資源。從傳輸協(xié)議的角度分析,除上述幾種信息資源之外,還有一些基于其他協(xié)議傳輸?shù)木W(wǎng)絡(luò)信息資源,如Telnet信息資源、Gopher信息資源等。網(wǎng)絡(luò)信息檢索與在線檢索工具3.1網(wǎng)絡(luò)信息資源概述3.1.3網(wǎng)絡(luò)信息資源的分類(lèi)3、按信息交流方式劃分正式出版信息資源。正式出版信息資源是指受到知識(shí)產(chǎn)權(quán)保護(hù),信息質(zhì)量可靠,利用率較高的網(wǎng)絡(luò)信息資源,包括電子圖書(shū)、電子期刊、電子報(bào)紙、搜索引擎、網(wǎng)絡(luò)導(dǎo)航、檢索數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)述評(píng)、在線字(辭)典、在線百科全書(shū)、在線參考數(shù)據(jù)庫(kù)等。半正式出版信息資源。半正式出版信息資源是指受到知識(shí)產(chǎn)權(quán)保護(hù)但沒(méi)有納入正式出版系統(tǒng)的信息資源。這部分信息資源可以從各種學(xué)術(shù)團(tuán)體、教育機(jī)構(gòu)、企業(yè)部門(mén)、國(guó)際組織、政府機(jī)構(gòu)、行業(yè)協(xié)會(huì)等單位的網(wǎng)站上獲取。非正式出版信息資源。非正式出版信息資源是指數(shù)量大、流動(dòng)性較強(qiáng)、質(zhì)量難以保證的動(dòng)態(tài)性信息。任何組織和個(gè)人都有機(jī)會(huì)成為網(wǎng)絡(luò)信息資源的內(nèi)容制造者。網(wǎng)絡(luò)信息檢索與在線檢索工具3.1網(wǎng)絡(luò)信息資源概述3.1.4網(wǎng)絡(luò)信息資源的載體形式信息載體是指在信息傳播中攜帶信息的媒介,即用于記錄、傳輸、積累和保存信息的實(shí)體,包括以能源和介質(zhì)為特征,運(yùn)用聲波、光波、電波傳遞信息的無(wú)形載體和以實(shí)物形態(tài)記錄為特征,運(yùn)用紙張、膠卷、膠片、磁帶和磁盤(pán)傳遞和貯存信息的有形載體。網(wǎng)絡(luò)信息資源的載體為無(wú)形載體,具體表型形式包括文本、圖形、圖像、音頻、視頻、動(dòng)畫(huà)、軟件等。網(wǎng)絡(luò)信息檢索與在線檢索工具3.2網(wǎng)絡(luò)信息檢索基礎(chǔ)3.2.1網(wǎng)絡(luò)信息檢索特點(diǎn)網(wǎng)絡(luò)信息檢索克服了傳統(tǒng)信息檢索的眾多缺點(diǎn),將人工查詢(xún)和獲取轉(zhuǎn)變?yōu)榛ヂ?lián)網(wǎng)操作,減少了檢索時(shí)間,簡(jiǎn)化了操作流程,提高了檢索精確度,突破了傳統(tǒng)信息檢索的局限性。網(wǎng)絡(luò)信息檢索具備以下主要特點(diǎn):(1)檢索范圍廣。互聯(lián)網(wǎng)將全球網(wǎng)絡(luò)信息資源連成一個(gè)整體,消除了信息資源檢索和獲取的空間障礙和地域界限。通過(guò)專(zhuān)業(yè)網(wǎng)絡(luò)檢索工具,用戶(hù)可以隨時(shí)檢索到世界各地可供查閱的網(wǎng)絡(luò)信息資源。(2)檢索速度快。互聯(lián)網(wǎng)技術(shù)的發(fā)展提升了網(wǎng)絡(luò)信息檢索速度,專(zhuān)業(yè)檢索工具提高了網(wǎng)絡(luò)信息檢索的效率。對(duì)于一般的網(wǎng)絡(luò)信息搜索引擎而言,從檢索條件的提交到檢索結(jié)果的返回,其時(shí)間跨度一般在一秒以?xún)?nèi),而檢索結(jié)果則成千上萬(wàn),極大地提高了網(wǎng)絡(luò)信息資源的檢索效率。網(wǎng)絡(luò)信息檢索與在線檢索工具3.2網(wǎng)絡(luò)信息檢索基礎(chǔ)3.2.1網(wǎng)絡(luò)信息檢索特點(diǎn)(3)交互性強(qiáng)。交互式作業(yè)是目前所有網(wǎng)絡(luò)信息檢索工具的必備特征,網(wǎng)絡(luò)信息檢索工具能夠從用戶(hù)命令中獲取指令并及時(shí)響應(yīng)用戶(hù)的要求、具有良好的信息反饋功能。網(wǎng)絡(luò)檢索工具提供的錯(cuò)別字提示、拼音提示、相關(guān)搜索、聯(lián)想搜索、模糊搜索等功能,都是網(wǎng)絡(luò)信息檢索交互性的具體體現(xiàn)。(4)檢索過(guò)程簡(jiǎn)單。在網(wǎng)絡(luò)信息檢索中,盡管不同的檢索工具、檢索系統(tǒng)在結(jié)構(gòu)和功能上千差萬(wàn)別,但它們都追求一個(gè)共同的目標(biāo),即盡量簡(jiǎn)化用戶(hù)的操作和使用。生活中那些簡(jiǎn)潔明了的搜索引擎(如百度、谷歌等)、條理清晰的導(dǎo)航網(wǎng)站(如hao123),無(wú)不體現(xiàn)了網(wǎng)絡(luò)信息檢索工具操作簡(jiǎn)單的設(shè)計(jì)理念。網(wǎng)絡(luò)信息檢索與在線檢索工具3.2網(wǎng)絡(luò)信息檢索基礎(chǔ)3.2.2網(wǎng)絡(luò)信息檢索策略互聯(lián)網(wǎng)中蘊(yùn)含了豐富的信息資源,且每時(shí)每刻都在變化更新,如何找尋所需的信息是網(wǎng)絡(luò)信息檢索主要目標(biāo)??萍颊撐牡臋z索不僅要講求方法,更要講求策略。檢索策略的完善度直接決定著檢索結(jié)果是否符合要求。用戶(hù)制定文獻(xiàn)檢索策略,要根據(jù)文獻(xiàn)檢索的需要與可能性,制定一套符合文獻(xiàn)分布規(guī)律的檢索方案,其基本內(nèi)容包括多個(gè)檢索步驟。網(wǎng)絡(luò)信息檢索與在線檢索工具圖3-1網(wǎng)絡(luò)信息檢索過(guò)程3.2網(wǎng)絡(luò)信息檢索基礎(chǔ)3.2.2網(wǎng)絡(luò)信息檢索策略目前常用的檢索策略有基于有效信息來(lái)源的檢索策略和基于檢索工具的網(wǎng)絡(luò)信息檢索策略。1、基于有效信息來(lái)源的檢索策略(1)直接法。直接發(fā)指利用文獻(xiàn)檢索系統(tǒng)對(duì)所需文獻(xiàn)的關(guān)鍵詞進(jìn)行查詢(xún),最后獲得系統(tǒng)數(shù)據(jù)庫(kù)中全部包含此關(guān)鍵詞的文獻(xiàn)。直接法根據(jù)查詢(xún)時(shí)間范圍還可分為順查法、逆查法和抽查法三種。(2)追溯法。追溯法又稱(chēng)引文法,是一種跟蹤查找法,指對(duì)文獻(xiàn)末尾的參考文獻(xiàn)進(jìn)行跟蹤查找。(3)綜合法。綜合法是一種將直接法與追溯法兩種方法相結(jié)合的檢索方法。綜合法通過(guò)利用檢索工具或檢索系統(tǒng)進(jìn)行常規(guī)檢索,再利用文獻(xiàn)后的參考文獻(xiàn)進(jìn)行追溯檢索。網(wǎng)絡(luò)信息檢索與在線檢索工具3.2網(wǎng)絡(luò)信息檢索基礎(chǔ)3.2.2網(wǎng)絡(luò)信息檢索策略2、基于檢索工具的網(wǎng)絡(luò)信息檢索方法(1)隨意瀏覽法。隨意瀏覽法又稱(chēng)為漫游法,在沒(méi)有明確的檢索目的和要求的情況下,用戶(hù)從一個(gè)網(wǎng)頁(yè)鏈接到另一個(gè)想要瀏覽的頁(yè)面,沒(méi)有確切的檢索目的。(2)搜索引擎檢索法。搜索引擎檢索法是最為常規(guī)的網(wǎng)絡(luò)信息檢索方法。搜索引擎是利用關(guān)鍵詞、詞組或自然語(yǔ)言檢索的工具。(3)網(wǎng)絡(luò)導(dǎo)航檢索法。網(wǎng)絡(luò)導(dǎo)航檢索法是基于分類(lèi)體系的目錄型檢索方法,也是較為常用的信息檢索方法。(4)專(zhuān)業(yè)資源系統(tǒng)檢索法。專(zhuān)業(yè)資源系統(tǒng)在人工參與的前提下,通過(guò)對(duì)大量整理后信息資源進(jìn)行存儲(chǔ)、管理和維護(hù)更新,并在互聯(lián)網(wǎng)上借助一個(gè)具體的檢索網(wǎng)頁(yè)為用戶(hù)提供查詢(xún)服務(wù)。網(wǎng)絡(luò)信息檢索與在線檢索工具3.3網(wǎng)絡(luò)信息在線檢索工具3.3.1搜索引擎檢索工具搜索引擎指根據(jù)一定的策略,運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,并對(duì)信息進(jìn)行組織和處理后,為用戶(hù)提供檢索服務(wù)的系統(tǒng)工具。1、搜索引擎分類(lèi)(1)全文搜索引擎。如谷歌、百度等全文搜索引擎從互聯(lián)網(wǎng)中獲取各個(gè)網(wǎng)站的信息資源,通過(guò)建立數(shù)據(jù)庫(kù)使用戶(hù)能夠獲取與檢索內(nèi)容匹配的內(nèi)容,并按照一定順序呈現(xiàn)檢索結(jié)果(2)目錄索引搜索引擎。用戶(hù)可以按照分類(lèi)目錄找到所需要的信息,而不依靠關(guān)鍵詞進(jìn)行查詢(xún)。目錄索引用最具代表性的是“雅虎搜索”“新浪分類(lèi)目錄搜索”,各類(lèi)引文索引平臺(tái)亦屬于目錄索引。網(wǎng)絡(luò)信息檢索與在線檢索工具3.3網(wǎng)絡(luò)信息在線檢索工具3.3.1搜索引擎檢索工具(3)元搜索引擎。元搜索引擎是將多個(gè)單一搜索引擎集成在一起,提供統(tǒng)一的檢索界面,對(duì)用戶(hù)的檢索需求同時(shí)在多個(gè)搜索引擎中進(jìn)行搜索,并將結(jié)果反饋給用戶(hù)。有的元搜索引擎則按自定的規(guī)則將結(jié)果重新排列組合,如“360搜索”;有的元搜索引擎直接按來(lái)源引擎排列搜索結(jié)果,如“Jopee元搜索”。(4)垂直搜索引擎。垂直搜索引擎是專(zhuān)門(mén)檢索某一主題或某一類(lèi)型信息的搜索引擎,以專(zhuān)業(yè)性與服務(wù)性作為特點(diǎn)。常用的垂直搜索引擎有:“Jooble搜索(找工作搜索引擎)”“新浪微博搜索(博客、微博搜索引擎)”“百度學(xué)術(shù)搜索(學(xué)術(shù)搜索引擎)”“書(shū)問(wèn)搜索(圖書(shū)搜索引擎)”等。網(wǎng)絡(luò)信息檢索與在線檢索工具3.3網(wǎng)絡(luò)信息在線檢索工具3.3.1搜索引擎檢索工具(5)后搜索引擎。后搜索引擎是對(duì)眾多流行搜索引擎的搜索結(jié)果進(jìn)行歸納整理,它是由全球最大的中介搜索引擎“Ixquick搜索”提出的。(6)計(jì)算型搜索引擎。計(jì)算型搜索引擎是指一種利用自然語(yǔ)言檢索技術(shù)的搜索引擎。通過(guò)這種計(jì)算型搜索引擎,用戶(hù)檢索到的信息已經(jīng)不限于互聯(lián)網(wǎng)中已有的信息資源,而是經(jīng)過(guò)服務(wù)器處理計(jì)算得到的新信息。較其他搜索引擎,用戶(hù)能檢索關(guān)鍵詞后,直接獲得檢索引擎返回的處理結(jié)果,而不是網(wǎng)頁(yè)鏈接。例如,在WolframAlpha搜索引擎中中輸入“HowmanypeopleinXi’an”,結(jié)果顯示“12million952thousandpeople”等結(jié)果。網(wǎng)絡(luò)信息檢索與在線檢索工具3.3網(wǎng)絡(luò)信息在線檢索工具3.3.1搜索引擎檢索工具2、搜索引擎工作基本原理搜索引擎的工作步驟一般包括爬行、抓取存儲(chǔ)、預(yù)處理以及排序,其中每一步的工作原理如下:(1)爬行。搜索引擎是通過(guò)一種特定規(guī)律的算法跟蹤網(wǎng)頁(yè)的鏈接,像蜘蛛在蜘蛛網(wǎng)爬行一樣,從一個(gè)鏈接爬到另外一個(gè)鏈接,所以被稱(chēng)為“爬行”。它需要遵從一些跟蹤算法的命令或相關(guān)文件的指令。(2)抓起存儲(chǔ)。搜索引擎通過(guò)爬行跟蹤鏈接到網(wǎng)頁(yè),并將抓取的數(shù)據(jù)存入原始頁(yè)面數(shù)據(jù)庫(kù)。搜索引擎在抓取頁(yè)面時(shí),也做一定的重復(fù)內(nèi)容檢測(cè),一旦遇到權(quán)重很低的網(wǎng)站(如包含有大量抄襲、采集或者復(fù)制的內(nèi)容),搜索引擎很可能就不再抓取存儲(chǔ)。網(wǎng)絡(luò)信息檢索與在線檢索工具3.3網(wǎng)絡(luò)信息在線檢索工具3.3.1搜索引擎檢索工具

(3)預(yù)處理。搜索引擎將抓取回來(lái)的頁(yè)面,進(jìn)行以下步驟的預(yù)處理:①

提取文字;②

中文分詞;③

去停止詞;④

消除噪音;⑤

正向索引;⑥

倒排索引;⑦

鏈接關(guān)系計(jì)算;⑧

特殊文件處理。(4)排序。用戶(hù)在搜索引擎檢索框中輸入需要檢索的關(guān)鍵詞后,排序程序調(diào)動(dòng)索引庫(kù)數(shù)據(jù),計(jì)算排序并顯示給用戶(hù)。搜索引擎檢索出來(lái)的匹配結(jié)果很多,一般情況下都是按照日、周、月等時(shí)間間隔進(jìn)行階段性更新。網(wǎng)絡(luò)信息檢索與在線檢索工具3.3網(wǎng)絡(luò)信息在線檢索工具3.3.2引文索引類(lèi)檢索工具引文索引是利用文獻(xiàn)之間的印證關(guān)系,將文獻(xiàn)的參考文獻(xiàn)表編在一起的引文機(jī)制。引文索引的基本作用是在檢索工具中利用引文去查找相關(guān)文獻(xiàn)。它能夠體現(xiàn)文獻(xiàn)間引用和被引用的關(guān)系、規(guī)律以及論文后所附參考文獻(xiàn)的作者、題目、出處等項(xiàng)目。用戶(hù)可以使用引文索引方法,以某一信息為查找點(diǎn),檢索出其他與之有關(guān)的信息。1、引文索引的編制原理引文索引的編制原理是按照文獻(xiàn)的相互引用關(guān)系建立索引系統(tǒng)。文獻(xiàn)之間的相互引用形成文獻(xiàn)網(wǎng)絡(luò),根據(jù)該文獻(xiàn)網(wǎng)絡(luò)可以檢索相關(guān)文獻(xiàn),并通過(guò)追溯檢索查找更多相關(guān)的參考文獻(xiàn)。因此,引文索引的核心是引證索引和來(lái)源索引。網(wǎng)絡(luò)信息檢索與在線檢索工具3.3網(wǎng)絡(luò)信息在線檢索工具3.3.2引文索引類(lèi)檢索工具2、引文索引的意義和作用引文檢索雖然不是常規(guī)的檢索途徑,但在學(xué)術(shù)交流和科研評(píng)價(jià)中的作用越來(lái)越大。隨著時(shí)間的推移,論文可能被另外的論文所引用,引用和被引用的相互作用就逐漸形成了一個(gè)網(wǎng)絡(luò),即引文網(wǎng)絡(luò)。引文索引的作用有以下幾個(gè)方面:(1)文獻(xiàn)檢索獲取。由于被引文獻(xiàn)和引用文獻(xiàn)在內(nèi)容上存在關(guān)聯(lián)性。因此通過(guò)檢索一位知名學(xué)者或一篇較有質(zhì)量的文獻(xiàn),通??色@得一系列主題相關(guān)的新文獻(xiàn)。(2)科研管理與研究預(yù)測(cè)。一篇文獻(xiàn)一經(jīng)發(fā)表,其參考文獻(xiàn)永遠(yuǎn)不變,但被引用次數(shù)可能會(huì)逐漸變多。該論文被其他文獻(xiàn)引用說(shuō)明其學(xué)術(shù)觀點(diǎn)和研究成果有被人參考借鑒的作用,被引用頻次越高表示論文的影響力越大。網(wǎng)絡(luò)信息檢索與在線檢索工具3.3網(wǎng)絡(luò)信息在線檢索工具3.3.2引文索引類(lèi)檢索工具(3)分析評(píng)價(jià)。目前學(xué)術(shù)界普遍認(rèn)為文獻(xiàn)質(zhì)量與文獻(xiàn)被引次數(shù)成正比。在晉升職稱(chēng)和引進(jìn)人才時(shí),通常要求出示具有檢索資質(zhì)圖書(shū)館驗(yàn)證的查收查引報(bào)告。用文獻(xiàn)被權(quán)威數(shù)據(jù)庫(kù)收錄和被他人引用頻次來(lái)評(píng)價(jià)科研人員學(xué)術(shù)水平高低。文獻(xiàn)被引總頻次主要取決于文獻(xiàn)發(fā)表量和文獻(xiàn)本身的學(xué)術(shù)質(zhì)量,對(duì)科研機(jī)構(gòu)、大學(xué)乃至國(guó)家而言,文獻(xiàn)被引總頻次在一定程度上能反映其總體實(shí)力。網(wǎng)絡(luò)信息檢索與在線檢索工具3.3網(wǎng)絡(luò)信息在線檢索工具3.3.2引文索引類(lèi)檢索工具3、常見(jiàn)的引文索引機(jī)構(gòu)網(wǎng)絡(luò)信息檢索與在線檢索工具序號(hào)名稱(chēng)簡(jiǎn)介1《科學(xué)引文索引》科學(xué)引文索引(ScienceCitationIndex,簡(jiǎn)稱(chēng)S

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論