信息檢索復(fù)習(xí)整理_第1頁
信息檢索復(fù)習(xí)整理_第2頁
信息檢索復(fù)習(xí)整理_第3頁
信息檢索復(fù)習(xí)整理_第4頁
信息檢索復(fù)習(xí)整理_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、一、什么是信息(Information)? 在西方英文中 information一詞有情報(bào)、資料、消息、報(bào)道之意,我國大陸曾譯為情報(bào)或信息,后經(jīng)國家有關(guān)部門核準(zhǔn),統(tǒng)一譯成“信息”。在我國臺(tái)灣、香港地區(qū),該詞被譯為“資訊”。信息是被反映物的屬性再現(xiàn),信息的屬性在于表現(xiàn)它物。也就是說,信息不是事物的本身,而是由事物發(fā)出的消息、情報(bào)、指令、數(shù)據(jù)、信號(hào)中所包含的內(nèi)容,是對(duì)客觀世界中各種事物發(fā)出的特征、變化及其相互聯(lián)系的最新反映。一切事物包括自然界和人類社會(huì)都會(huì)產(chǎn)生信息。一個(gè)完整的信息過程,包括信息的傳遞、接收、貯存、加工和利用。2、 信息具有以下特征:1)普遍性(2)時(shí)效性:信息在一定的時(shí)間內(nèi)是有效的

2、信息,在此時(shí)間之外就是無效信息。而且任何信息從信源傳播到信宿都需要經(jīng)過一定的時(shí)間,都有其時(shí)滯性。(3)傳遞性(4)可轉(zhuǎn)換性:信息是可以由一種形態(tài)轉(zhuǎn)換成另一種形態(tài)。信息一般有4種形態(tài):數(shù)據(jù)、文本、聲音、圖像。這4種形態(tài)可以相互轉(zhuǎn)化,例如,照片被傳送到計(jì)算機(jī),就把v圖像轉(zhuǎn)化成了數(shù)字。(5)可再生性(6)共享性:同一信源可以供給多個(gè)信宿,因此信息是可以共享的 ,且不因共享而減少(7)可識(shí)別性 :信息是可以識(shí)別的,識(shí)別又可分為直接認(rèn)別和間接識(shí)別,直接認(rèn)別是指通過感官的識(shí)別,間接識(shí)別是指通過各種測(cè)試手段的識(shí)別。不同的信息源有不同的識(shí)別方法。 (8)可存儲(chǔ)性:信息是可以通過各種方法存儲(chǔ)的。 二、信息檢索廣

3、義:將信息按一定的方式組織和存儲(chǔ)起來,并根據(jù)用戶需要找出相關(guān)文獻(xiàn)的過程。其中包括存與取兩個(gè)環(huán)節(jié),存即信息存儲(chǔ),是對(duì)信息進(jìn)行收集、標(biāo)引、描述、及組織,并對(duì)其特征化表達(dá)集加以整序,形成信息檢索工具或檢索系統(tǒng)的過程。取即信息查找,是通過某種查詢機(jī)制從檢索工具或檢索系統(tǒng)中查找出用戶所需的特定信息或獲取其線索的過程。狹義:僅僅指信息查找的過程。即取的環(huán)節(jié)。三、信息檢索的發(fā)展1、第一階段:完全手工檢索階段2、第二階段:半機(jī)械檢索系統(tǒng)-機(jī)電、光電檢索系統(tǒng)的發(fā)展階段3、第三階段:計(jì)算機(jī)檢索系統(tǒng)的發(fā)展階段4、第四階段:基于Internet 的網(wǎng)絡(luò)化檢索系統(tǒng)階段信息資源的分類:1、信息源可分為自然信息源和社會(huì)信息

4、源。2、按信息資源所依附的載體劃分 (不用全背)(1)體裁信息資源:以人體為載體并能為他人識(shí)別的信息資源。按其表述方式又可分為口語信息源和體語信息源??谡Z信息源是人類以口頭方式表述但未被記錄下來的口語信息,如:談話、講課、講演、討論、唱歌等。體語信息源是以人的體態(tài)為載體表述出來的信息資源,如:表情、手勢(shì)、姿態(tài)等方式表述的體語信息。(2)實(shí)物信息資源:以實(shí)物為載體的信息資源。又分為自然實(shí)物信息源與人工實(shí)物信息源。如:化石、產(chǎn)品、樣品等。(3)文獻(xiàn)信息資源:以文字、圖形、符號(hào)、聲頻、視頻等發(fā)生記錄在各種載體上的知識(shí)和信息資源。(4)網(wǎng)絡(luò)信息資源:以網(wǎng)絡(luò)為紐帶連接起來的信息資源和以網(wǎng)絡(luò)為主要交流、傳

5、遞、存儲(chǔ)的手段與形式的信息資源。3、按信息資源傳遞的范圍劃分:(1)公開信息資源:又稱共享信息資源或白色信息資源(white information),指公開發(fā)行、流通和傳遞的信息資源,其蘊(yùn)涵的信息人人可以使用。一般來說,公開信息資源的數(shù)量最大,而且能夠作為信息商品進(jìn)行流通領(lǐng)域。(2)半公開信息資源:又稱灰色信息資源(grey information),指非公開發(fā)行、流通和傳遞,從常規(guī)途徑難以獲取的信息(內(nèi)部信息)。這類信息出版量小,發(fā)行渠道復(fù)雜,流通傳遞范圍有限,不易收集。例如:內(nèi)部的刊物、技術(shù)報(bào)告、會(huì)議資料等。 (3)非公開信息資源:又稱黑色信息資源(black information),

6、指人們未破譯或未被識(shí)別的,也指處于保密狀態(tài)的信息。例如:考古發(fā)現(xiàn)的古老文字、未解密的政府文件、內(nèi)部檔案、個(gè)人日記、私人信件等。 自然信息均屬于不可檢信息。超文本型(Hypertext):是用超鏈結(jié)的方法,將各種不同空間的文字信息組織在一起的網(wǎng)狀文本。文獻(xiàn)信息資源1、按信息資源所依附的載體的物質(zhì)形態(tài)劃分 (1)刻寫型:包括手稿、日記、信件、原始檔案、碑刻等。 (2)印刷型:主要是指以紙張為載體,以印刷為記錄手段,把信息內(nèi)容固化在紙張上的形式。其優(yōu)點(diǎn)是便于直接閱讀、使用方便,其缺點(diǎn)是較笨重、存儲(chǔ)密度低、收藏占用空間大、加工保存等花費(fèi)人力物力大、識(shí)別和提取難以實(shí)現(xiàn)機(jī)械化和自動(dòng)化。 (3)縮微型:以感

7、光材料為載體,以縮微照相為記錄手段而產(chǎn)生的一種載體形式,如縮微膠卷、縮微膠片等。其優(yōu)點(diǎn)是存儲(chǔ)密度較大、體積小、便于收藏保存和遠(yuǎn)距離傳遞。缺點(diǎn)是不能直接閱讀、需借助縮微閱讀機(jī)或閱讀復(fù)印機(jī)才能使用。 縮微型一般針對(duì)于數(shù)量大、利用率低但又有較大保存和利用價(jià)值的信息資源。(4)聲像型:以磁性和感光材料為載體,借助特殊的機(jī)械裝置(如復(fù)錄機(jī)、攝像機(jī)、錄像機(jī)等)直接記錄聲音、圖像信號(hào)的信息載體,又稱視聽資料,如唱片、錄音帶、錄像帶、幻燈片、電影片、多媒體資料等。 其優(yōu)點(diǎn)是可以聞其聲、觀其形,直觀而真切,給人以生動(dòng)鮮明的印象。其缺點(diǎn)是制造成本較高,且需要借助于一定的設(shè)備才能使用。2、按信息資源的加工深度和結(jié)構(gòu)

8、等級(jí)劃分(1)零次文獻(xiàn):指未經(jīng)過任何加工的原始文獻(xiàn)。如:實(shí)驗(yàn)記錄、手稿、日記、原始錄音、原始錄像、談話記錄。(2)一次文獻(xiàn):未經(jīng)加工或粗略加工的原始信息資源,以本人的研究成果為基本素材而創(chuàng)作的文獻(xiàn),具體、詳盡和系統(tǒng)化。如期刊論文、專利文獻(xiàn)、科技報(bào)告、會(huì)議錄、學(xué)位論文等等。 (3)二次文獻(xiàn):它是將大量分散、零亂、無序的一次文獻(xiàn)進(jìn)行進(jìn)行加工、整理、標(biāo)引、著錄、濃縮,并按照一定的邏輯順序和科學(xué)體系加以編排存儲(chǔ),使之系統(tǒng)化,以便于檢索利用。如:目錄、題錄、索引、文摘。具有報(bào)道和檢索功能。(4)三次文獻(xiàn):通過二次信息資源提供的線索,對(duì)某一范圍內(nèi)的一次信息資源進(jìn)行分析、研究、加工而成的信息資源,它包括綜述

9、、述評(píng)、專題情報(bào)研究報(bào)告、百科全書、年鑒、指南、手冊(cè)、詞典等。特點(diǎn):一次文獻(xiàn)是最重要的文獻(xiàn),是全部文獻(xiàn)的基礎(chǔ)。數(shù)量龐大、內(nèi)容分散、無系統(tǒng)性,不便于管理和傳播。二次文獻(xiàn)作為尋找一次文獻(xiàn)的指南與向?qū)В芴峁┒喾N檢索途徑(分類、主題、著者、團(tuán)體著者、會(huì)議名稱等)。三次文獻(xiàn)可以充分利用反映某一領(lǐng)域研究動(dòng)態(tài)的綜述類文獻(xiàn)信息,在短時(shí)間內(nèi)了解其歷史、動(dòng)態(tài)、水平等。一次文獻(xiàn)是二次文獻(xiàn)和三次文獻(xiàn)的基礎(chǔ),是文獻(xiàn)檢索的主要對(duì)象;二次文獻(xiàn)具有濃縮性,是一次文獻(xiàn)的簡略及有序化,是文獻(xiàn)檢索的工具;三次文獻(xiàn)具有綜合性,既是檢索對(duì)象,又可提供一定的檢索途徑與檢索手段??傊墨I(xiàn)經(jīng)過加工、壓縮,從零次信息到三次信息,使科技信息

10、由分散到集中,由無序到有序,由無組織到系統(tǒng)化,由博而精的對(duì)知識(shí)信息進(jìn)行不同層次的加工的過程。信息的不同出版類型劃分為:圖書 期刊 科技報(bào)告 會(huì)議文獻(xiàn)C論題集中、新穎、豐富、專深、學(xué)術(shù)性強(qiáng),是了解各國科技發(fā)展水平和動(dòng)向的重要文獻(xiàn)來源。(5) 專利文獻(xiàn)P:(6)技術(shù)標(biāo)準(zhǔn)和規(guī)范S:7)政府出版物(8)學(xué)位論文D:(9)產(chǎn)品資料 (10)技術(shù)檔案 (11)報(bào)紙N3)科技報(bào)告R (理解) scientific and technical report :報(bào)道(記錄)研究工作和開發(fā)調(diào)查工作的成果或進(jìn)展情況的一種文獻(xiàn)類型。又稱研究報(bào)告、報(bào)告文獻(xiàn)。出現(xiàn)于20世紀(jì)初,第二次世界大戰(zhàn)后迅速發(fā)展,成為科技文獻(xiàn)中的一

11、大門類。大多與政府的研究活動(dòng)、國防及尖端科技領(lǐng)域有關(guān),發(fā)表及時(shí),課題專深,內(nèi)容新穎、成熟,數(shù)據(jù)完整,且注重報(bào)道進(jìn)行中的科研工作,是一種重要的信息源。查尋科技報(bào)告有專門的檢索工具。特點(diǎn): 反映新的科研成果迅速。以科技報(bào)告形式反映科研成果比這些成果在期刊上發(fā)表,一般要早一年左右,有的則不在期刊上發(fā)表。內(nèi)容多樣化。它幾乎涉及整個(gè)科學(xué)、技術(shù)領(lǐng)域和社會(huì)科學(xué)、行為科學(xué)以及部分人文科學(xué)領(lǐng)域。保密性。大量科技報(bào)告都與政府的研究活動(dòng)、高新技術(shù)有關(guān),使用范圍控制較嚴(yán)。報(bào)告質(zhì)量參差不齊。大部分科技報(bào)告是合同研究計(jì)劃的產(chǎn)物,由工程技術(shù)人員編寫,由于撰寫受時(shí)間限制、因保密需要以工作文件形式出現(xiàn)等因素影響,使報(bào)告的質(zhì)量相

12、差很大。每份報(bào)告自成一冊(cè),裝訂簡單,一般都有連續(xù)編號(hào),出版發(fā)行不規(guī)則。通常載有主持單位、報(bào)告撰寫者、密級(jí)、報(bào)告號(hào)、研究項(xiàng)目號(hào)和合同號(hào)等。附:美國四大科技報(bào)告(AD,PB, NASA , DOE )按檢索對(duì)象的內(nèi)容區(qū)分:(1)文獻(xiàn)檢索(document retrieval)(2)數(shù)據(jù)檢索(data retrieval)(3)事實(shí)檢索(fact retrieval)手工檢索:以手工操作的方式,利用檢索工具書進(jìn)行信息檢索。手工信息檢索是信息檢索的傳統(tǒng)方式,已經(jīng)歷經(jīng)了一個(gè)多世紀(jì)的發(fā)展歷程。檢索效率高;直接性靈活性好,瀏覽功能差附: 查全率:是指檢出的相關(guān)文獻(xiàn)量與檢索系統(tǒng)中相關(guān)文獻(xiàn)總量的比率,是衡量信息

13、檢索系統(tǒng)檢出相關(guān)文獻(xiàn)能力的尺度。查全率=(檢出相關(guān)文獻(xiàn)量/系統(tǒng)中相關(guān)文獻(xiàn)總量)*100% 查準(zhǔn)率:是指檢出的相關(guān)文獻(xiàn)量與檢出文獻(xiàn)總量的比率,是衡量信息檢索系統(tǒng)精確度的尺度。查準(zhǔn)率=(檢出相關(guān)文獻(xiàn)量/檢出文獻(xiàn)總量)*100%三、按檢索對(duì)象區(qū)分:(1)文本檢索:查找含有特定信息的文本文獻(xiàn)的檢索,其結(jié)果是以文本形式反映特信息反映的文獻(xiàn)。這是一種傳統(tǒng)的信息檢索類型,在信息檢索中至今占據(jù)主要地位。(2)多媒體檢索:多媒體是指將聲音、圖像、通信等在內(nèi)的多種媒體的功能有機(jī)結(jié)合在一起,并用某種新媒體代替?zhèn)鹘y(tǒng)媒體的多種媒體。 多媒體檢索是指根據(jù)用戶的需求,對(duì)文字、聲音、圖像、圖形等多種媒體信息進(jìn)行組織、存儲(chǔ)從而

14、識(shí)別、查找并獲取所需信息的過程。在因特網(wǎng)上存在著大量的多媒體文獻(xiàn),用戶常常需要查找特定的聲音、圖像、動(dòng)畫等。多媒體文獻(xiàn)的信息組織與處理傳統(tǒng)文本的處理截然不同,其檢索要求和檢索途徑也別具特色,這是現(xiàn)代信息檢索的新課題。(3)超媒體檢索(hyper media retrieval) 如果超文本節(jié)點(diǎn)中的信息除文本塊以外 ,還有圖形、圖像、聲音、視頻等多媒體信息 ,則稱為超媒體 (hyper media )。即存儲(chǔ)對(duì)象超出了文本范疇,融入了靜、動(dòng)態(tài)圖像(形)以及聲音等多種媒體信息。 (同樣具有超文本檢索的優(yōu)點(diǎn),并且檢索內(nèi)容與形式更為豐富)(1)強(qiáng)相關(guān)檢索: 強(qiáng)調(diào)檢索的準(zhǔn)確性,也稱作特性檢索。這種檢索注

15、重查準(zhǔn)率。只要檢索得到的文獻(xiàn)信息能滿足用戶的需求就行,對(duì)于檢索結(jié)果的數(shù)量多少不作要求。(2)弱相關(guān)檢索: 強(qiáng)調(diào)檢索的全面性,向用戶提供系統(tǒng)完整的信息的檢索。也稱族性檢索。這種檢索注重查全性,要求檢索出一段時(shí)間期限內(nèi)有關(guān)特定主題的所有信息。為了盡可能避免漏檢相關(guān)信息,對(duì)于檢索的準(zhǔn)確性相對(duì)要求較低。 要注意的是,這是兩種檢索要求比較極端的檢索類型。實(shí)際上是介于兩者之間,保證一定的查全率和查準(zhǔn)率。按時(shí)間跨度(1)定題檢索 SDI (selective dissemination of information)查找有關(guān)特定主題最新信息的檢索。(2)回溯檢索 RS (retrospective sear

16、ch)查找一段時(shí)期內(nèi)有關(guān)特定主題信息的檢索。文獻(xiàn)檢索是以文獻(xiàn)作為檢索對(duì)象,查找含有用戶所需信息內(nèi)容的文獻(xiàn),文獻(xiàn)是一種相關(guān)性檢索而非確定性檢索,系統(tǒng)不直接解答用戶所提出的問題本身,只提供與之相關(guān)文獻(xiàn)或文獻(xiàn)的屬性信息與來源指示供用戶參考和取舍。所以其檢索對(duì)象是包含特定信息的各種文獻(xiàn)七、按檢索途徑的特點(diǎn)區(qū)分(1) 常用法, 工具法,利用檢索工具或系統(tǒng)中常設(shè)的檢索入口查找文獻(xiàn)信息的方法。如主題、分類、著者、題名等。其具體操作分為 順查,倒查,抽查 順查方式是根據(jù)有關(guān)課題的起始年代利用選定的檢索工具由遠(yuǎn)及近的進(jìn)行逐年查找。 倒查方式則相反。從最新時(shí)間查找起,直到滿足檢索要求為止。 抽查是針對(duì)有關(guān)學(xué)科的發(fā)

17、展特點(diǎn),抽查某些特定時(shí)期的文獻(xiàn)信息。通常抓住學(xué)科專業(yè)發(fā)展興旺的時(shí)期,此時(shí)的不僅文獻(xiàn)發(fā)表的數(shù)量多,質(zhì)量也高。分類語言(大體了解):用分類號(hào)和類名來表達(dá)信息的內(nèi)容主題概念,并按知識(shí)門類的邏輯次序?qū)⑿畔①Y源系統(tǒng)地加以劃分和組織的語言。其意義在于根據(jù)文獻(xiàn)信息的內(nèi)容特征和分類表,把相同內(nèi)容的文獻(xiàn)、信息集中在一起,同時(shí)又把不同內(nèi)容的文獻(xiàn)信息區(qū)別開來 ,以實(shí)現(xiàn)相關(guān)集中的功能。 分類語言的主要特點(diǎn):按學(xué)科、專業(yè)集中相關(guān)文獻(xiàn)信息,從知識(shí)分類的角度揭示文獻(xiàn)信息之間的區(qū)別和聯(lián)系,提供從學(xué)科專業(yè)領(lǐng)域檢索文獻(xiàn)信息的途徑。(大體了解)事實(shí)檢索是檢索關(guān)于某些客體(如機(jī)構(gòu)、人物等)的指示性描述,或關(guān)于某一事件發(fā)生的時(shí)間、地點(diǎn)

18、、經(jīng)過等信息并將其查找出來的檢索。如:名詞術(shù)語、概念、定義、理論、方法、公式、事件等。 事實(shí)檢索屬于數(shù)據(jù),因?yàn)槭聦?shí)也是一種數(shù)據(jù),即非數(shù)值性數(shù)據(jù)。 數(shù)據(jù)檢索是將經(jīng)過選擇、整理、鑒定的數(shù)值存入數(shù)據(jù)庫中,根據(jù)需要查出可回答某一問題的數(shù)據(jù)的檢索。數(shù)據(jù)檢索是一種確定性的檢索,即直接提供用戶所需要的確切數(shù)據(jù)。而且檢索結(jié)果一般也是確定性的,要么是有,要么是沒有;要么是對(duì),要么是錯(cuò)。有些數(shù)據(jù)檢索系統(tǒng)不僅能查出數(shù)據(jù),還提供一定的運(yùn)算、推導(dǎo)能力。信息檢索語言(retrieval language)又稱為情報(bào)語言、情報(bào)存儲(chǔ)和檢索語言、信息組織語言,是用來描述文獻(xiàn)特征,表達(dá)主題提問的一種專門的人工語言,是由給定領(lǐng)域中

19、的一切可用來描述信息內(nèi)容和信息需求的詞匯或符號(hào),及其使用規(guī)則構(gòu)成的供標(biāo)引和檢索的工具。是溝通信息存儲(chǔ)與檢索兩個(gè)過程,標(biāo)引人員與檢索人員的橋梁。 信息檢索語言是檢索系統(tǒng)的語言基礎(chǔ),主要作用是:表達(dá)描述信息內(nèi)容和信息需求;用于信息的組織和整序;用于對(duì)檢索系統(tǒng)中索引標(biāo)識(shí)或提問標(biāo)識(shí)的規(guī)范和控制。 根據(jù)結(jié)構(gòu)原理劃分:(大體了解)1)分類語言 (2)主題語言 (3)分類主題一體化語言 (4)代碼語言 (5)引文語言分類語言主要可分為等級(jí)體系型分類語言和分面組配型分類語言兩種。目前我國廣泛采用中國圖書館分類法(簡稱中圖法)進(jìn)行分類,該分類法由5大部類、22個(gè)大類組成主題語言:以主題詞來表達(dá)信息主題概念的語言

20、,它按事物對(duì)文獻(xiàn)信息進(jìn)行濃縮、描述和整序,借用自然語言的語詞,作為文獻(xiàn)信息和檢索提問的內(nèi)容標(biāo)示。 特點(diǎn):按特定的事物集中文獻(xiàn)信息,有較強(qiáng)的直接性。 構(gòu)成原理:利用自然語言中的名詞術(shù)語,經(jīng)過一定程度的規(guī)范化處理,作為表達(dá)文獻(xiàn)和提問內(nèi)容的主題詞;利用參照系統(tǒng)中的各種手段,顯示主題標(biāo)識(shí)之間的各種關(guān)系,并以此把主題詞表中的眾多主題詞相互聯(lián)系起來,構(gòu)成多維的主題詞體系;利用主題詞的字順序列,按事物的名稱來排列和檢索文獻(xiàn)信息。標(biāo)題語言:采用規(guī)范化了的自然語言,即經(jīng)過標(biāo)準(zhǔn)化處理的名詞術(shù)語作為標(biāo)識(shí),來表達(dá)文獻(xiàn)所論述或涉及的事物-主題,并將全部標(biāo)識(shí)按字順排列。例:一篇文章用“微型計(jì)算機(jī)”這個(gè)術(shù)語來敘述它的研究對(duì)

21、象,另一篇文章用“微型電腦”這個(gè)術(shù)語來敘述它的研究對(duì)象,第三篇文章用“微機(jī)”這個(gè)術(shù)語來敘述,雖然都表示同一概念,這時(shí)就不能直接用“微型電腦”或“微機(jī)”來作標(biāo)題詞了,這三篇文章都必須用“微型計(jì)算機(jī)”作標(biāo)題詞(根據(jù)詞表決定)。因?yàn)檫@三個(gè)術(shù)語是等同概念,如果同時(shí)用三個(gè)術(shù)語來標(biāo)引,便會(huì)導(dǎo)致文獻(xiàn)被分散。當(dāng)然,讀者若從“微型電腦”或“微機(jī)”入手檢索時(shí),都可以在標(biāo)題詞表中看到“見:微型計(jì)算機(jī)”的參照指示。關(guān)鍵詞語言(keyword):以關(guān)鍵詞(從文獻(xiàn)題名或文摘以及正文中抽取的,能夠表達(dá)文獻(xiàn)主題并具有實(shí)質(zhì)意義的未經(jīng)規(guī)范化處理的自然語言詞匯)作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索依據(jù)的一種信息檢索語言。關(guān)鍵詞與其他主題語言的區(qū)

22、別在于:前者是沒有經(jīng)過規(guī)范處理的自然語言。屬于非受控語言。后者是經(jīng)過規(guī)范處理的自然語言,屬于受控語言。元詞語言:敘詞語言檢索途徑及其選擇1、內(nèi)容特征檢索途徑:內(nèi)容特征是指表征文獻(xiàn)實(shí)質(zhì)意義的特征,如主題詞、關(guān)鍵詞、分類號(hào)、內(nèi)容摘要等。(1)分類途徑(2)主題途徑(3)分類主題途徑2、外部特征檢索途徑:外部特征是指文獻(xiàn)上顯而易見的,一般情況下不反映文獻(xiàn)實(shí)質(zhì)意義的那些特征,如書名(題名、篇名)、人名、各種符號(hào)標(biāo)識(shí)(專利號(hào)、標(biāo)準(zhǔn)號(hào)、報(bào)告號(hào)等)、機(jī)構(gòu)名、文獻(xiàn)出處等(1)責(zé)任者途徑(2)題名途徑(3)序號(hào)途徑(4)引文途徑西文詞典一般都是按本國文字的字母順序排列,查詢時(shí)按字順查找;日文字典大多按五十音順排

23、列,查找時(shí)按音順查找;中文字典排列方法較多,有部首法、筆畫筆順法、漢語拼音法、四角號(hào)碼法等。 百科全書可按收錄范圍分為綜合性百科全書(如:中國百科全書、專業(yè)性百科全書(如:化工百科全書;還可按編輯規(guī)模分為:大百科全書(20卷以上)、小百科全書(10卷以下)、百科詞典(單卷)。 編排方式有三種:按字順編排、按分類編排和分類與字順相結(jié)合編排。目前,按字順編排條目已成為百科全書編排方式的主流,也有采用分類與字順相結(jié)合的形式編排的。 百科全書一般都有各種索引,其中最主要的是主題索引(了解)中國大百科全書是中國第一部大型綜合性百科全書,也是世界上規(guī)模較大的幾部百科全書之一。美國百科全書名為Encyclo

24、pedia Americana,簡稱EA不列顛百科全書(Encyclopedia Britannica)(又稱大英百科全書,簡稱EB)科利爾百科全書(Collier' Encyclopedia)簡稱EC 世界ABC三大百科全書:美國百科全書、不列顛百科全書、科利爾百科全書 年鑒大體可分為綜合性年鑒和專業(yè)性年鑒兩大類,前者如百科年鑒、統(tǒng)計(jì)年鑒等;后者如經(jīng)濟(jì)年鑒、歷史年鑒、文藝年鑒、出版年鑒等。名錄可分為人名錄、地名錄和機(jī)構(gòu)名錄文獻(xiàn)檢索工具是用于報(bào)道、存貯和查找文獻(xiàn)線索的工具,它通過對(duì)文獻(xiàn)特征的描述,并按一定的科學(xué)方法排列、提供多種檢索途徑,使我們能從文獻(xiàn)的汪洋大海里找到特定的文獻(xiàn)。 檢索

25、工具必須具備四個(gè)條件:第一,必須詳細(xì)描述文獻(xiàn)的外部特征和內(nèi)容特征。第二,每條描述記錄都必須具有各種檢索標(biāo)識(shí)。(所謂檢索標(biāo)識(shí)是指描述文獻(xiàn)外部特征和內(nèi)容特征的專門用于信息檢索的詞、詞組或代碼,如主題詞、分類號(hào)、著者姓名、文獻(xiàn)序號(hào)等。)第三,全部描述記錄要科學(xué)地組織成一個(gè)有機(jī)的整體第四,能夠提供多種檢索途徑。按著錄方式分,有目錄型、題錄型和文摘型。其中按著錄方式劃分體現(xiàn)了檢索工具對(duì)文獻(xiàn)內(nèi)容揭示的深淺程度,體現(xiàn)了檢索工具的性質(zhì),這是檢索工具最主要的劃分方法。目錄是以出版物(如一本圖書、一種期刊等)為報(bào)道對(duì)象,揭示出版物外部特征的檢索工具。所以目錄對(duì)文獻(xiàn)的描述比較淺顯,一般只描述文獻(xiàn)的外部特征,有時(shí)也通

26、過簡單的內(nèi)容提要介紹文獻(xiàn)的內(nèi)容,但它不涉及文獻(xiàn)中的具體章節(jié)或具體文獻(xiàn)。目錄主要用于報(bào)道、登記出版物的出版發(fā)行情況,揭示其收藏情況,供人們選購、查閱和獲取文獻(xiàn)時(shí)使用。目錄的著錄項(xiàng)目通常包括出版物名稱、責(zé)任者(著者、編者或譯者)、出版項(xiàng)(出版者、出版地、出版時(shí)間、版次等)和稽核項(xiàng)(頁數(shù)、開本、價(jià)格等)。目錄型檢索工具主要有圖書館館藏目錄、聯(lián)合目錄、出版社目錄、國家書目等。題錄是以單篇文獻(xiàn)作為報(bào)道單位,揭示文獻(xiàn)外部特征的檢索工具。由于它是以單篇文獻(xiàn)為單位來報(bào)道和存儲(chǔ)文獻(xiàn)的,所以對(duì)文獻(xiàn)的揭示程度比目錄要具體、深入。 但題錄與文摘相比,對(duì)文獻(xiàn)內(nèi)容的揭示又相對(duì)較淺,不過,它也因此具有加工容易、可以縮短報(bào)道

27、的時(shí)差、文體簡短、可以增加檢索刊物的容量的優(yōu)點(diǎn)。題錄的著錄項(xiàng)目一般包括題錄號(hào)、文獻(xiàn)題目、作者及其工作單位、出處、原文文種、主題詞、文中所附圖表數(shù)及參考文獻(xiàn)數(shù)等。文摘(abstract)是指對(duì)一份文獻(xiàn)或一個(gè)文獻(xiàn)單元的內(nèi)容所做的簡略、準(zhǔn)確的描述,通常不包含對(duì)原文的補(bǔ)充、解釋和評(píng)論。文摘的報(bào)道對(duì)象與題錄相同,但它對(duì)文獻(xiàn)內(nèi)容的揭示程度較題錄更深入具體,它不僅描述文獻(xiàn)的外部特征,還進(jìn)一步描述文獻(xiàn)的主題內(nèi)容。對(duì)內(nèi)容的介紹主要由其中的“文摘”部分完成。文摘是最常用的文獻(xiàn)檢索工具。原文出處。指刊載原文的地方。(材料題)文摘的主要著錄項(xiàng)目為:(1)文摘號(hào)、入藏號(hào)(abstract number ,referen

28、ce number , accession number )。它是在文獻(xiàn)處理完以后,為每條文摘編的號(hào)碼,起排序并幫助讀者識(shí)別特寫文摘的作用。它可以是簡單的順序號(hào),也可以是含有某種情報(bào)內(nèi)容的代碼符號(hào)。(2)文獻(xiàn)名稱(document title)。即文獻(xiàn)的題目(篇名),它是讀者識(shí)別特定文獻(xiàn)的重要標(biāo)志之一。文獻(xiàn)名稱一般是逐字照錄,有時(shí)也可以刪去某些引導(dǎo)性的詞,或?qū)x不清及不完整的名稱加以改寫、補(bǔ)充。外文文獻(xiàn)一般要同時(shí)著錄譯名和原名。有些英文檢索工具對(duì)非拉丁文字的文獻(xiàn)一般不著錄原名,而著錄原名的音譯名。(3)著者(author)及其工作單位(affiliation)。是讀者迅速鑒別文獻(xiàn)的依據(jù)之一,

29、著錄著者姓名可以用全稱,也可以用簡稱。許多國家的人名表述是名在前,姓在后,一般姓用全稱,名可以縮寫。但大多數(shù)檢索工具都采用姓在前、名在后的形式。英文檢索工具對(duì)非拉丁文姓名用音譯法著錄。 4)合同號(hào)(contract number)或撥款號(hào)( grant number)。如果該文獻(xiàn)是在某項(xiàng)合同或撥款的支持下進(jìn)行的,一般都要標(biāo)明該項(xiàng)合同的編號(hào)或撥款文件的編號(hào)??萍紙?bào)告都有這一項(xiàng)目。(5)原文出處。指刊載原文的地方。原文如果是某種期刊中的論文,出處包括該刊的刊名、出版地、卷期號(hào)、出版日期和起訖頁碼;如果是圖書或其中的一部分,出處就是書名、編著者、出版地、出版者、出版時(shí)間和起訖頁碼。科技報(bào)告的出處就是

30、入藏號(hào)、訂購號(hào)或原來的報(bào)告號(hào)。專利說明書的出處就是專利申請(qǐng)書或?qū)@f明書的編號(hào)。原文出處的著錄是讀者順利找到原文的重要線索。(6)原文文別和譯文來源。原文文別一般用某種語言的簡稱標(biāo)明,放在文獻(xiàn)出處之后,有的放在文獻(xiàn)的譯名之后。若所摘錄的文獻(xiàn)是一篇譯文,應(yīng)給出譯文的來源(被譯文獻(xiàn)的出處),如“譯自X刊X卷X期X頁”。此項(xiàng)的用處是免得使讀者去找他所不能閱讀的東西。(7)主題詞或索引詞。指用來描述該文獻(xiàn)的主題內(nèi)容的若干個(gè)詞或詞組。該項(xiàng)的用途很多,既可以幫助讀者了解原文主題,也可以用以查找其他相關(guān)文獻(xiàn),或供計(jì)算機(jī)識(shí)別和進(jìn)行邏輯組配檢索。(8)文摘正文。對(duì)文獻(xiàn)內(nèi)容所做的簡略描述??梢杂袌?bào)道性文摘和指示性

31、文摘之分。前者需概述原文的內(nèi)容要點(diǎn),特別是創(chuàng)新點(diǎn),向讀者提供原文中的定量信息(如距離、最大值、最小值、公式等)和定性信息(如發(fā)現(xiàn)、結(jié)果、新方法、新設(shè)備、結(jié)論等)。它是原文內(nèi)容的濃縮,基本上能反映原文的技術(shù)內(nèi)容、信息量大,字?jǐn)?shù)也較多。后者則是為了把原文的主題范圍、目的和方法概略地指示給讀者的一種文摘,一般不包含具體的數(shù)據(jù)、方法、設(shè)備、結(jié)論等內(nèi)容。它指示讀者將在原文中發(fā)現(xiàn)什么,幫助讀者判斷原文是否與自己的需要相關(guān)以及是否需要閱讀原文,字?jǐn)?shù)也相對(duì)較少。例:計(jì)算機(jī)應(yīng)用文摘 9609321 復(fù)雜的混合信號(hào)集成電路的參量成品率預(yù)測(cè)刊,英/Oleary,M. /Int.J.Electron. 1995,78

32、(2) . 267-394 借助圖象處理技術(shù)能從硅片圖象提取文摘號(hào)文獻(xiàn)篇名文獻(xiàn)類型、文種著者姓名文獻(xiàn)出處:刊名縮寫、年卷期起訖頁碼文獻(xiàn)摘要 索引通常不提供文獻(xiàn)內(nèi)容本身,只指明文獻(xiàn)的物理位置,是一種檢索文獻(xiàn)的系統(tǒng)指南,使讀者能準(zhǔn)確地找出文獻(xiàn)或文獻(xiàn)集合體中的特定信息。最常用的索引有著者索引、主題索引、分類索引、題名索引。被抽選出來的關(guān)鍵詞都可以作為標(biāo)引詞在索引中進(jìn)行輪排,作為檢索詞進(jìn)行檢索主題索引可分為四種: 1、標(biāo)題索引 2、關(guān)鍵詞索引 3、單元詞索引 4、敘詞索引 1、布爾邏輯組配檢索技術(shù)(問答)布爾邏輯組配檢索是現(xiàn)行計(jì)算機(jī)檢索的基本技術(shù),它利用布爾邏輯運(yùn)算符表示兩個(gè)檢索詞之間的邏輯關(guān)系,將檢索提問轉(zhuǎn)換成邏輯表達(dá)式。常用的運(yùn)算符有: 邏輯“與” AND 邏輯“或” OR 邏輯“非” NOT練習(xí): 頭孢菌素鈉或磺胺甲惡唑治療呼吸道感染的引起的副作用研究 檢索式: (頭孢菌素鈉 OR 磺胺甲惡唑) AND 呼吸道感染 AND 副作用、美國DIALOG系統(tǒng)是目前世界上最強(qiáng)大的國際聯(lián)機(jī)檢索

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論