第四講檢索工具技術(shù)步驟與評(píng)價(jià)_第1頁(yè)
第四講檢索工具技術(shù)步驟與評(píng)價(jià)_第2頁(yè)
第四講檢索工具技術(shù)步驟與評(píng)價(jià)_第3頁(yè)
第四講檢索工具技術(shù)步驟與評(píng)價(jià)_第4頁(yè)
第四講檢索工具技術(shù)步驟與評(píng)價(jià)_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四講檢索工具技術(shù)步驟與評(píng)價(jià)第1頁(yè),共60頁(yè),2023年,2月20日,星期三24.1信息檢索工具(系統(tǒng))P254.1.1信息檢索工具的定義檢索工具是人們?yōu)榱丝焖佟⑷妗?zhǔn)確地查詢(xún)已有的文獻(xiàn)信息資源,按照一定的著錄規(guī)則編制而成的用以報(bào)道、存儲(chǔ)和查找信息的工具。

二次文獻(xiàn)即是一種檢索工具。現(xiàn)在主流的檢索工具形式是數(shù)據(jù)庫(kù)。第2頁(yè),共60頁(yè),2023年,2月20日,星期三34.1.2信息檢索工具的作用:存儲(chǔ)作用將大量分散的、不同種類(lèi)、不同學(xué)科的信息資料,進(jìn)行組織排列使信息由分散到集中,由無(wú)序到系統(tǒng)化。報(bào)道作用把不同學(xué)科信息的類(lèi)型、數(shù)量、質(zhì)量展示給信息利用者,促進(jìn)信息傳遞和使用檢索作用以特征序化而形成檢索途徑可使人們根據(jù)特征來(lái)尋求與之相對(duì)應(yīng)的信息或文獻(xiàn)。第3頁(yè),共60頁(yè),2023年,2月20日,星期三44.1.3檢索工具的類(lèi)型可按收錄范圍、載體形式、加工手段等劃分一、按檢索工具提供文獻(xiàn)信息的特點(diǎn)劃分為:一)線索型(目錄、題錄、文摘、索引)二)事實(shí)型三)全文型四)引文型第4頁(yè),共60頁(yè),2023年,2月20日,星期三5目錄:是以一件或一種完整的出版物(如一本書(shū)、一種期刊等)作為著錄基本單位的檢索工具。

主要揭示、報(bào)道出版物的外表特征。作用主要是提示藏書(shū),指導(dǎo)閱讀。一)線索型檢索工具第5頁(yè),共60頁(yè),2023年,2月20日,星期三6題錄:是以單篇或單份文獻(xiàn)為著錄的基本單位的檢索工具,題錄也主要揭示、報(bào)道文獻(xiàn)的外表特征,但其著錄格式于目錄有所不同?!菊撐念}名】網(wǎng)絡(luò)環(huán)境下信息檢索與報(bào)道服務(wù)淺析

【英文題名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云DINGCai-yun

【作者單位】湖南化工職業(yè)技術(shù)學(xué)院,圖書(shū)館,湖南,株洲,412004

【刊名】株洲師范高等專(zhuān)科學(xué)校學(xué)報(bào)

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【關(guān)鍵詞】圖書(shū)館;網(wǎng)絡(luò)環(huán)境;信息搜集;信息檢索;信息報(bào)道

一)線索型檢索工具第6頁(yè),共60頁(yè),2023年,2月20日,星期三7文摘:是在題錄的基礎(chǔ)上,在每條著錄款目后邊再加上文獻(xiàn)內(nèi)容的摘要?!菊撐念}名】網(wǎng)絡(luò)環(huán)境下信息檢索與報(bào)道服務(wù)淺析

【英文題名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云DINGCai-yun

【作者單位】湖南化工職業(yè)技術(shù)學(xué)院,圖書(shū)館,湖南,株洲,412004

【刊名】株洲師范高等專(zhuān)科學(xué)校學(xué)報(bào)

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【關(guān)鍵詞】圖書(shū)館;網(wǎng)絡(luò)環(huán)境;信息搜集;信息檢索;信息報(bào)道

【摘要】網(wǎng)絡(luò)環(huán)境下的信息服務(wù)已對(duì)圖書(shū)館的機(jī)構(gòu)組織、人員素質(zhì)、服務(wù)水平和社會(huì)地位產(chǎn)了巨大影響.掌握網(wǎng)絡(luò)環(huán)境下的信息服務(wù)特點(diǎn)和方法,盡快適應(yīng)網(wǎng)絡(luò)環(huán)境已成為圖書(shū)館提高信息服務(wù)質(zhì)量的重要課題.

一)線索型檢索工具第7頁(yè),共60頁(yè),2023年,2月20日,星期三8索引:是把特定范圍內(nèi)文獻(xiàn)中的有關(guān)款目或知識(shí)單元(如書(shū)名、刊名、人名、地名、語(yǔ)詞等外表或內(nèi)容特征)按照描述語(yǔ)言形成標(biāo)識(shí),按其固有順序排列起來(lái),并指明出處,為用戶(hù)提供文獻(xiàn)線索的一種檢索工具。

一)線索型檢索工具第8頁(yè),共60頁(yè),2023年,2月20日,星期三二)事實(shí)型檢索工具檢索結(jié)果是回答問(wèn)題的知識(shí)本身,而不是查找知識(shí)的線索。包括事實(shí)、數(shù)據(jù)、知識(shí)內(nèi)容等。三)全文型檢索工具特點(diǎn):提供完整的文獻(xiàn)單元內(nèi)容;不保證內(nèi)容是否絕對(duì)真實(shí)、正確。四)引文型檢索工具主要功能是用來(lái)查找文獻(xiàn)間引證關(guān)系(繼承、評(píng)價(jià))如SCI、CSCD等。9第9頁(yè),共60頁(yè),2023年,2月20日,星期三二、按信息加工處理的手段分一)手工檢索工具歷史悠久;形式多樣;詞義檢索;人腦判斷與篩選(詹德優(yōu)《中文工具書(shū)導(dǎo)論》中分為8類(lèi)):書(shū)目、索引、文摘;字典、辭典;類(lèi)書(shū)、政書(shū);百科全書(shū);年鑒、手冊(cè)、名錄;表譜;圖錄;叢集匯要。二)機(jī)械檢索工具(過(guò)渡形式)三)計(jì)算機(jī)檢索工具(數(shù)據(jù)庫(kù))當(dāng)前主流。更能滿足用戶(hù)對(duì)檢索的主要要求:準(zhǔn):要求檢出的文獻(xiàn)有針對(duì)性,能解決研究中的具體問(wèn)題。全:全面了解某一特定領(lǐng)域(問(wèn)題)的發(fā)生、發(fā)展和現(xiàn)狀。新:掌握最新動(dòng)態(tài)或進(jìn)展??欤鹤疃虝r(shí)間內(nèi)獲得結(jié)果。定義、歷史發(fā)展、系統(tǒng)構(gòu)成、類(lèi)型劃分(自學(xué),教材P50-54)10第10頁(yè),共60頁(yè),2023年,2月20日,星期三11常用的外文生物醫(yī)學(xué)數(shù)據(jù)庫(kù):PubMed數(shù)據(jù)庫(kù)荷蘭《醫(yī)學(xué)文摘》數(shù)據(jù)庫(kù)(EM)《生物學(xué)文摘》數(shù)據(jù)庫(kù)(BA)化學(xué)文摘數(shù)據(jù)庫(kù)(CA)《科學(xué)引文索引》數(shù)據(jù)庫(kù)(SCI)常見(jiàn)的中文生物醫(yī)學(xué)數(shù)據(jù)庫(kù):中國(guó)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)(CBMdisc)中國(guó)知網(wǎng)維普資訊網(wǎng)(維普智立方)萬(wàn)方數(shù)字化期刊中醫(yī)藥文獻(xiàn)數(shù)據(jù)庫(kù)第11頁(yè),共60頁(yè),2023年,2月20日,星期三121、數(shù)據(jù)庫(kù)的結(jié)構(gòu)第12頁(yè),共60頁(yè),2023年,2月20日,星期三13數(shù)據(jù)庫(kù)是檢索系統(tǒng)的信息源和核心。利用一個(gè)數(shù)據(jù)庫(kù),首先要了解其結(jié)構(gòu)。不同的數(shù)據(jù)庫(kù),雖然利用原理相同,但由于數(shù)據(jù)內(nèi)容和利用目的的不同,使得其數(shù)據(jù)結(jié)構(gòu)和文獻(xiàn)記錄標(biāo)引方式也有一定的差異,因而其利用也各有特點(diǎn)。數(shù)據(jù)庫(kù)對(duì)文獻(xiàn)特征的組織和揭示影響著數(shù)據(jù)庫(kù)的利用及效果。各種數(shù)據(jù)庫(kù)的共同點(diǎn)(P54)數(shù)據(jù)庫(kù)結(jié)構(gòu)均為字段、記錄、文檔3個(gè)層次的構(gòu)成。第13頁(yè),共60頁(yè),2023年,2月20日,星期三14

(從大到?。┪臋n記錄字段

若干個(gè)記錄構(gòu)成的信息集合稱(chēng)為文檔。大型的數(shù)據(jù)庫(kù)分割成若干文檔。記錄是構(gòu)成數(shù)據(jù)庫(kù)的完整的信息單元,每條記錄描述了原始信息的外部特征和內(nèi)部特征。組成記錄的數(shù)據(jù)項(xiàng)目第14頁(yè),共60頁(yè),2023年,2月20日,星期三15文章號(hào)篇名作者文摘全文001asdZhouXxx……..002bysDangYyy……..……vcaWenzzz……..篇名文章號(hào)Asd001Bys002vca……作者文章號(hào)Dang002Wen……Zhou001索引文檔1:篇名索引索引文檔2:作者索引主文檔(順排文檔)檢索篇名檢索作者當(dāng)你要在篇名中查找時(shí),搜索指令將在篇名索引中進(jìn)行搜索,然后將主文檔中對(duì)應(yīng)的記錄調(diào)出來(lái)各項(xiàng)數(shù)據(jù)以構(gòu)成一張橫豎對(duì)齊的二維表格形式存放于數(shù)據(jù)庫(kù)文件(庫(kù)文件)中。文章號(hào)唯一,且索引文檔與主文檔的文章號(hào)一一對(duì)應(yīng)索引文檔(倒排文檔)文檔(File)由眾多記錄按一定方式組織在一起形成。第15頁(yè),共60頁(yè),2023年,2月20日,星期三162、搜索引擎(Searchengine)P58概念:是根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,在對(duì)信息進(jìn)行組織和處理后顯示給用戶(hù),為用戶(hù)提供檢索服務(wù)的系統(tǒng)。原理:同樣分為信息存儲(chǔ)與信息檢索兩個(gè)過(guò)程。將存儲(chǔ)信息與檢索需求進(jìn)行相似度計(jì)算,并按一定的排序原則顯示在屏幕上。第16頁(yè),共60頁(yè),2023年,2月20日,星期三17搜索引擎分類(lèi)按工作方式:全文搜索引擎代表:百度,谷歌目錄索引類(lèi)搜索引擎代表:早期的Yahoo其他搜索引擎名稱(chēng):元搜索引擎集合式搜索引擎門(mén)戶(hù)搜索引擎免費(fèi)鏈接列表本部分內(nèi)容安排有實(shí)習(xí),此處不展開(kāi)講解。第17頁(yè),共60頁(yè),2023年,2月20日,星期三184.2計(jì)算機(jī)信息檢索基本技術(shù)P55計(jì)算機(jī)信息檢索技術(shù):是指從計(jì)算機(jī)信息系統(tǒng)中提取符合用戶(hù)信息需求相關(guān)信息的技術(shù)。常用計(jì)算機(jī)算符:布爾邏輯算符字段限定符截詞符位置算符其他……第18頁(yè),共60頁(yè),2023年,2月20日,星期三194.2.1布爾邏輯檢索與布爾算符:來(lái)源:(布爾代數(shù))邏輯與、邏輯或、邏輯非。作用:布爾邏輯運(yùn)算符用來(lái)表示兩個(gè)檢索詞之間的邏輯關(guān)系,用以形成一個(gè)邏輯表達(dá)式。計(jì)算機(jī)根據(jù)邏輯表達(dá)式查找符合限定條件的文獻(xiàn)信息。

布爾算符形式(3種):邏輯與(AND)邏輯或(OR)邏輯非(NOT)第19頁(yè),共60頁(yè),2023年,2月20日,星期三20布爾邏輯算符一、邏輯“與”(AND)表達(dá)概念間交叉限定關(guān)系的一種組配;作用:描述更為準(zhǔn)確,縮小檢索范圍,提高查準(zhǔn)率。例:查找“胰島素治療糖尿病”的文獻(xiàn),基本檢索式為:

insulinANDdiabetes胰島素AND糖尿病檢索式“AandB”表示文獻(xiàn)中同時(shí)包含檢索詞A和檢索詞B的文獻(xiàn)才是命中文獻(xiàn)。(如右圖)

第20頁(yè),共60頁(yè),2023年,2月20日,星期三21布爾邏輯算符

二、邏輯“或”(算符:OR)表達(dá)概念間并列關(guān)系的一種組配;作用:擴(kuò)大檢索范圍,提高查全率。

如:查找“腫瘤”的檢索式為cancer(癌)

ortumor(瘤)orcarcinoma(癌)orSarcomas(肉瘤)

or

neoplasm(新生物)orlymphoma(淋巴瘤)……。檢索式“AorB”表示包含檢索詞A的文獻(xiàn)或者包含檢索詞B的文獻(xiàn)或者同時(shí)包含檢索詞A和B的文獻(xiàn)為命中文獻(xiàn)。

使用注意:處理好整體與部分的關(guān)系,避免漏檢。第21頁(yè),共60頁(yè),2023年,2月20日,星期三22布爾邏輯算符三、邏輯“非”(算符:NOT)表達(dá)概念間不包含關(guān)系的一種組配。作用:縮小檢索范圍,提高查準(zhǔn)率。例:查“動(dòng)物(非人類(lèi)的)感染乙肝病毒”的相關(guān)文獻(xiàn)。檢索式:hepatitisBvirus(乙肝病毒)NOThuman(人類(lèi))?“AnotB”表示包含檢索詞A但不包含檢索詞B的文獻(xiàn)為命中文獻(xiàn)。使用需注意:處理好交叉關(guān)系,避免漏檢。第22頁(yè),共60頁(yè),2023年,2月20日,星期三23運(yùn)算次序與注意事項(xiàng)運(yùn)算次序在一個(gè)檢索式中,可以同時(shí)使用多個(gè)邏輯運(yùn)算符,構(gòu)成一個(gè)復(fù)合邏輯檢索式。一般情況下,運(yùn)算優(yōu)先級(jí)別如下所示(可以使用括號(hào)改變運(yùn)算次序)。()>NOT>AND>OR例:檢索厚樸或檳榔對(duì)兔離體腸平滑肌運(yùn)動(dòng)功能的影響.(厚樸OR檳榔)AND平滑肌實(shí)際使用中,不同數(shù)據(jù)庫(kù)對(duì)運(yùn)算次序解釋不同。第23頁(yè),共60頁(yè),2023年,2月20日,星期三24檢索實(shí)例:例:查找有關(guān)腫瘤引起的貧血的非英文文獻(xiàn)

neoplasms(腫瘤)/complications(并發(fā)癥)

anemia(貧血)/etiology(病因?qū)W)

English

#11687NEOPLASMS/complications#2179ANEMIA/etiology#323867EnglishinLA(或LA=English)#420(#1and#2)not#3第24頁(yè),共60頁(yè),2023年,2月20日,星期三25截詞檢索:利用計(jì)算機(jī)特有的指定位對(duì)比判斷功能,使不完整詞能與標(biāo)引詞進(jìn)行比較、匹配的一種檢索。實(shí)質(zhì)是用邏輯OR對(duì)具有相同的詞頭或詞尾的詞匯進(jìn)行檢索。截詞符號(hào)也稱(chēng)通配符,通常用“*”代表無(wú)限多字符組合,而用“?”代表任意一個(gè)字符。4.2.2截詞檢索與截詞符第25頁(yè),共60頁(yè),2023年,2月20日,星期三26一、后截?cái)啵簩⒔卦~符號(hào)放在一個(gè)字符串的右方,以表示其右的有限或無(wú)限個(gè)字符組合方式均符合該字符串的檢索要求。后截?cái)鄼z索技術(shù)最常用,其主要用途有:詞的單復(fù)數(shù),如book?同根詞,例如biolog*,physic*年代,例如199?,19??作者,例如:Lancaster*例如:

hypertensi??可查到hypertension、hypertensive。

hyperthyr*可查到hyperthyre、hyperthyreosis、hyperthyroid、hyperthyroidosis、hyperthyroidism等。

第26頁(yè),共60頁(yè),2023年,2月20日,星期三27

二、前截?cái)啵簩⒔卦~符號(hào)放在一個(gè)字符串的左方,以表示其左方有有限或無(wú)限個(gè)字符。前截?cái)嘁驗(yàn)閷?shí)現(xiàn)技術(shù)上較困難,在檢索系統(tǒng)中比較少見(jiàn)。其主要用途在于:進(jìn)行一個(gè)主題在不同領(lǐng)域應(yīng)用情況的檢索;在化學(xué)化工文獻(xiàn)中多有類(lèi)似情況。例1:*magnetic,可檢索出magnetic(有磁性的)、electro-magnetic(電磁的)、patamagnetic(順磁的)、thermo-magnetic(熱磁的)thermomagnetic等詞的文獻(xiàn)。例2:*sighted,可查到farsighted與nearsighted。

第27頁(yè),共60頁(yè),2023年,2月20日,星期三28

三、中截?cái)啵簩⒔卦~符號(hào)放在一個(gè)檢索詞的中間的一種截詞方式。只允許有限截?cái)?,用于檢索詞的單復(fù)數(shù)或英美式不同拚法。例如:

wom?n,可查到Woman,Women。

defen?e,可查到defense,defence。第28頁(yè),共60頁(yè),2023年,2月20日,星期三29截詞檢索在大多數(shù)檢索系統(tǒng)可基本實(shí)現(xiàn)。截詞檢索的優(yōu)勢(shì):是防止漏檢的有力手段。能擴(kuò)大檢索范圍,提高查全率;可以減少檢索詞的輸入工作量;簡(jiǎn)化檢索步驟(不需要用OR進(jìn)行同義詞的組配)。注意截?cái)嗖课皇欠窈线m:不是所有用截詞符產(chǎn)生的單詞與你的檢索意圖相一致。第29頁(yè),共60頁(yè),2023年,2月20日,星期三304.2.3限定檢索與字段限定符(1)“in”表示將“in”左側(cè)檢索詞限定在某個(gè)字段名內(nèi)查找。如:HypertensioninTI_(2)“=”、“<”、“>”、“>=”、“<=”符號(hào)主要用于限定查找年代。如:PY=2014,表示要求檢出2014年出版的文獻(xiàn)。第30頁(yè),共60頁(yè),2023年,2月20日,星期三314.2.4位置檢索與位置算符(了解即可)又稱(chēng)鄰近檢索,是對(duì)檢索詞之間的相對(duì)位置進(jìn)行限制。包括在記錄中出現(xiàn)的順序和相對(duì)位置。運(yùn)算符都用“()”括起,前后不留空格。(1)with算符:(W)與(nW)表示此算符兩側(cè)的檢索詞在命中記錄中必須出現(xiàn)在同一字段中(如篇名或文摘等),位置相鄰且順序不可顛倒。(2)near算符:(N)與(nN)

A(N)B表示命中記錄中左右兩個(gè)檢索詞出現(xiàn)在同一句子中。無(wú)論語(yǔ)序。

第31頁(yè),共60頁(yè),2023年,2月20日,星期三324.2.5其他檢索技術(shù)一、加權(quán)檢索(WeightingSearching

是一種定量檢索的技術(shù)。從權(quán)重方面對(duì)檢索詞之間的組配關(guān)系加以限制和表示。在每個(gè)提問(wèn)詞后面給定一個(gè)數(shù)值表示其重要程度,這個(gè)數(shù)值稱(chēng)為權(quán)(Weight),在檢索時(shí),先查找這些檢索詞在數(shù)據(jù)庫(kù)記錄中是否存在,然后計(jì)算存在的檢索詞的權(quán)值總和。權(quán)值之和超過(guò)閾值,該記錄為命中文獻(xiàn)。縮小檢索范圍,提高檢準(zhǔn)率的有效方法。第32頁(yè),共60頁(yè),2023年,2月20日,星期三33二、聚類(lèi)檢索:計(jì)算文獻(xiàn)的相似度,并把相似度較高的文獻(xiàn)集中在一起,形成一個(gè)個(gè)的文獻(xiàn)類(lèi)。主題相近、內(nèi)容相關(guān)的文獻(xiàn)聚在一起,相異的被區(qū)分開(kāi)來(lái)。根據(jù)不同的聚類(lèi)水平的要求,可以形成不同聚類(lèi)層次的類(lèi)目體系。第33頁(yè),共60頁(yè),2023年,2月20日,星期三34三、擴(kuò)展檢索:主題詞或副主題詞都可能存在含義的等級(jí)關(guān)系。檢索領(lǐng)域常見(jiàn)的“擴(kuò)展”選項(xiàng)是指如果選擇該方式,系統(tǒng)將自動(dòng)在指定的等級(jí)關(guān)系體系中把該詞的下位詞同時(shí)選中,詞間關(guān)系為“邏輯或/OR”的關(guān)系。第34頁(yè),共60頁(yè),2023年,2月20日,星期三354.3信息檢索步驟P28一、分析研究課題、明確檢索要求明確檢索目的和要求。了解檢索者的具體要求,以及需檢索出文獻(xiàn)要解決的實(shí)質(zhì)問(wèn)題(一個(gè)課題可有多個(gè)問(wèn)題,一次檢索最好解決一個(gè)問(wèn)題)。尋找探索性、開(kāi)創(chuàng)性課題——需要查出一些啟發(fā)性文獻(xiàn);課題申報(bào)——盡可能全面掌握相關(guān)資料;科研過(guò)程中問(wèn)題解決——針對(duì)性、可行性方案篩選;鑒定評(píng)獎(jiǎng)——與科研成果最相關(guān)的信息;確定檢索范圍。確定解決某一特定問(wèn)題需涉及的學(xué)科范圍、文獻(xiàn)類(lèi)型、時(shí)間區(qū)段、文獻(xiàn)語(yǔ)種,以及文獻(xiàn)數(shù)量等。學(xué)科范圍:(如藥物:基礎(chǔ)研究or臨床應(yīng)用?)厘清檢索詞及詞間關(guān)系。有檢索意義的術(shù)語(yǔ)(拼寫(xiě),同義詞、近義詞及相關(guān)詞)及其他特征(如文獻(xiàn)類(lèi)型、有無(wú)專(zhuān)利申請(qǐng)可能)。通過(guò)檢索詞及其組成的邏輯關(guān)系式來(lái)進(jìn)行檢索檢索詞的選擇直接關(guān)系到檢索結(jié)果的質(zhì)量。第35頁(yè),共60頁(yè),2023年,2月20日,星期三36二、選擇檢索工具或數(shù)據(jù)庫(kù)注意——根據(jù)檢索課題的主題及學(xué)科范圍來(lái)選擇相對(duì)應(yīng)的檢索系統(tǒng)或工具。1)與課題關(guān)系密切的信息源或檢索系統(tǒng)有哪些?熟悉檢索課題所涉及的學(xué)科范圍、有無(wú)分支問(wèn)題?了解課題專(zhuān)業(yè)涉及的數(shù)據(jù)庫(kù)學(xué)科覆蓋范圍。2)檢索者的目的?一般了解?系統(tǒng)了解?對(duì)科研項(xiàng)目?jī)?nèi)容的全部研究的把握?能解決問(wèn)題的可行方法?一種?多種?1.選擇檢索工具(系統(tǒng))時(shí)注意:①收錄文獻(xiàn)要全(量大);②文獻(xiàn)的著錄要標(biāo)準(zhǔn)(結(jié)果準(zhǔn)確);③檢索途徑要多(索引功能完備);④時(shí)差要短(更新快)。4.3信息檢索步驟第36頁(yè),共60頁(yè),2023年,2月20日,星期三374.3信息檢索步驟三、確定檢索方法(教材P28)檢索方法應(yīng)根據(jù)檢索工具的收藏條件、檢索要求、檢索范圍以及對(duì)學(xué)科背景等因素的了解程度而確定。①瀏覽法:科技人員通過(guò)瀏覽閱讀核心期刊來(lái)獲取本學(xué)科信息的方法。平時(shí)獲取信息的重要方法。優(yōu)點(diǎn):最快獲取信息;直接閱讀全文;基本上能掌握本學(xué)科發(fā)展動(dòng)態(tài)和水平。缺點(diǎn):必須事先了解本學(xué)科核心期刊種類(lèi);檢索范圍小,易漏檢。②追溯法:利用已獲得的有較大參考價(jià)值的文獻(xiàn)后面的參考文獻(xiàn),以之為線索由近及遠(yuǎn),進(jìn)行逐一追蹤的查找方法。優(yōu)點(diǎn):不需利用檢索系統(tǒng),查找方法簡(jiǎn)單;缺點(diǎn):檢索效率不高;漏檢率高;對(duì)最新進(jìn)展掌握不夠。第37頁(yè),共60頁(yè),2023年,2月20日,星期三38①瀏覽法:②追溯法:③常用法:利用檢索工具查找文獻(xiàn)的方法。順查法:是由遠(yuǎn)到近的查找。多用于已知所查主題起始年代時(shí)。查全率高。倒查法:是由近及遠(yuǎn)的查找。效率高,最快速度獲取最新信息。計(jì)算機(jī)檢索多不區(qū)分,但倒查法因效率高多用,且可用于掌握課題的新資料。抽查法:在事先了解某學(xué)科呈波浪式發(fā)展情況下使用。集中在學(xué)科發(fā)展高峰期獲取較多文獻(xiàn)。④循環(huán)法:又稱(chēng)分段法,是交替使用“常用法”和“追溯法”來(lái)進(jìn)行檢索的綜合檢索方法。即利用檢索系統(tǒng)查到一批文獻(xiàn)資料,又利用這些文獻(xiàn)所附的參考文獻(xiàn)追溯查找。優(yōu)點(diǎn):即全面獲得一段時(shí)間內(nèi)某課題的最新資料,又能了解重要觀點(diǎn)的歷史發(fā)展??蒲袝r(shí)常用。4.3信息檢索步驟第38頁(yè),共60頁(yè),2023年,2月20日,星期三394.3信息檢索步驟四、確定檢索途徑與檢索標(biāo)識(shí)1、根據(jù)檢索課題的要求和已知條件,結(jié)合檢索工具的特點(diǎn),確定檢索途徑。每篇文獻(xiàn)均有內(nèi)容特征及外表特征,在檢索系統(tǒng)中特征表現(xiàn)為標(biāo)識(shí)符號(hào)。同性質(zhì)檢索標(biāo)識(shí)的集合形成了檢索工具的檢索途徑。也稱(chēng)檢索點(diǎn)(accesspoint)。2、確定在該檢索途徑中有效的檢索詞(檢索標(biāo)識(shí))課題中有檢索意義的特征形成檢索標(biāo)識(shí)。在檢索中能有效使用的特征標(biāo)識(shí),應(yīng)是所使用檢索工具有效的檢索標(biāo)識(shí)。第39頁(yè),共60頁(yè),2023年,2月20日,星期三40文獻(xiàn)檢索的常用途徑1.題名:注意題名關(guān)鍵詞的排序特征2.作者:通常按姓在前名在后方式檢索3.分類(lèi):我國(guó)文獻(xiàn)資料一般采用《中國(guó)圖書(shū)館圖書(shū)分類(lèi)法》(簡(jiǎn)稱(chēng)《中圖法》)進(jìn)行分類(lèi)。4.主題詞:主題是指表征文獻(xiàn)內(nèi)容特征、經(jīng)過(guò)規(guī)范化的名詞術(shù)語(yǔ)。檢索者通過(guò)檢索這些規(guī)范的詞語(yǔ)來(lái)找到所要的文獻(xiàn)和情報(bào)?!冬F(xiàn)代漢語(yǔ)主題詞表》5.關(guān)鍵詞:直接從文獻(xiàn)中抽取出來(lái)的非規(guī)范化檢索詞。6.順序號(hào)檢索:專(zhuān)利號(hào),標(biāo)準(zhǔn)號(hào),研究報(bào)告號(hào)。7.引文檢索:利用被引文獻(xiàn)來(lái)查找原文獻(xiàn)的檢索方法。如:CNKI中國(guó)期刊網(wǎng)被引用字段,維普期刊數(shù)據(jù)庫(kù)引文檢索途徑。

8.其它:超文本檢索,基于概念的自然語(yǔ)言檢索,圖象等。第40頁(yè),共60頁(yè),2023年,2月20日,星期三414.3信息檢索步驟1、分類(lèi)途徑按學(xué)科屬性,借助特定分類(lèi)法來(lái)檢索文獻(xiàn);檢索標(biāo)識(shí):分類(lèi)號(hào)或類(lèi)目名稱(chēng);優(yōu)點(diǎn):將同一學(xué)科的文獻(xiàn)集中在一起,比較直觀展示學(xué)科的系統(tǒng)性、全面性,能滿足族性檢索的要求;缺點(diǎn):專(zhuān)指性不強(qiáng),對(duì)交叉學(xué)科、邊緣學(xué)科、新興學(xué)科難以處理,易漏檢或誤檢。2、主題途徑根據(jù)文獻(xiàn)的主題內(nèi)容,通過(guò)規(guī)范化的名詞或詞組來(lái)查找文獻(xiàn)的途徑;檢索標(biāo)識(shí):主題詞;優(yōu)點(diǎn):專(zhuān)指性強(qiáng),能將同一主題的文獻(xiàn)全部集中在該主題詞下,滿足族性檢索的要求;缺點(diǎn):不具備分類(lèi)途徑的系統(tǒng)性,難以顯示與其他檢索詞的關(guān)系;如果主題詞選擇不準(zhǔn),會(huì)造成誤檢或漏檢。第41頁(yè),共60頁(yè),2023年,2月20日,星期三424.3信息檢索步驟3、關(guān)鍵詞途徑同主題途徑,根據(jù)文獻(xiàn)的主題內(nèi)容檢索。但檢索詞不需或部分需要規(guī)范化處理。選擇文獻(xiàn)中有實(shí)際意義的詞作為關(guān)鍵詞。優(yōu)點(diǎn):易學(xué),好用,檢索入口多;費(fèi)用低;缺點(diǎn):不經(jīng)規(guī)范化處理,易漏檢。在檢索時(shí)應(yīng)全面考慮在意義上相關(guān)的同義、近義及可能的詞性或組詞而造成的詞形變化。4、題名途徑題名即書(shū)名、刊名、篇名;現(xiàn)代學(xué)術(shù)論文的題名通常能反映文獻(xiàn)的主要內(nèi)容特征。5、著者途徑按姓名字順排列,編排方便;檢索直接;查準(zhǔn)率高。注意各國(guó)的不同姓名排列方式。6、序號(hào)途徑利用文獻(xiàn)某些特征具有的代號(hào)而編制。如專(zhuān)利號(hào)、化學(xué)物質(zhì)登記號(hào)、ISBN、ISSN、標(biāo)準(zhǔn)號(hào)等。序號(hào)簡(jiǎn)明、具有唯一性。查準(zhǔn)率高。第42頁(yè),共60頁(yè),2023年,2月20日,星期三43五、查找文獻(xiàn)線索使用一種途徑或多種途徑綜合使用,找出符合檢索要求的文獻(xiàn)線索(或文獻(xiàn)本身)。注意:1、要對(duì)查到的文獻(xiàn)進(jìn)行內(nèi)容閱讀,以判斷檢索是否正確或者還需對(duì)結(jié)果進(jìn)行調(diào)整(擴(kuò)檢或縮檢)。2、如結(jié)果偏離要求需返回重新組織檢索要求。重新確定檢索所表達(dá)的要求。修改檢索途徑或檢索標(biāo)識(shí)。4.3信息檢索步驟第43頁(yè),共60頁(yè),2023年,2月20日,星期三444.3信息檢索步驟六、獲取原始文獻(xiàn)在全文數(shù)據(jù)庫(kù)中可直接獲取原始文獻(xiàn)。傳統(tǒng)上通過(guò)檢索工具獲得的是文獻(xiàn)線索,需根據(jù)線索去尋找原始文獻(xiàn)。原則:由近到遠(yuǎn)、由方便至復(fù)雜、由免費(fèi)到收費(fèi)。順序:所在單位圖書(shū)館本地其他圖書(shū)館、同學(xué)、在外進(jìn)修學(xué)習(xí)的同事、其他關(guān)系……直接聯(lián)系文獻(xiàn)著者本地圖書(shū)館的文獻(xiàn)傳遞服務(wù)專(zhuān)業(yè)文獻(xiàn)中心(如全國(guó)科技文獻(xiàn)信息中心……)的有償服務(wù)第44頁(yè),共60頁(yè),2023年,2月20日,星期三454.4信息檢索效果評(píng)價(jià)P32檢索效果(retrievaleffectiveness)是指在檢索過(guò)程中滿足檢索者檢索信息的全面性和準(zhǔn)確性的程度。理想的檢索結(jié)果是無(wú)遺漏、無(wú)誤差地檢索出檢索者所需的所有文獻(xiàn)。4.4.1

檢索效果評(píng)價(jià)的目的4.4.2評(píng)價(jià)標(biāo)準(zhǔn)4.4.3影響檢索效果的因素4.4.4提高信息檢索效果的措施第45頁(yè),共60頁(yè),2023年,2月20日,星期三464.4.1信息檢索效果評(píng)價(jià)的目的

1.找出檢索中存在的問(wèn)題和影響檢索效果的各種因素,以便提高檢索的有效性;(影響因素主要來(lái)自:信息系統(tǒng)、檢索者、用戶(hù)三方面)2.是為了準(zhǔn)確地掌握系統(tǒng)的各種性能和水平,改進(jìn)系統(tǒng)的性能,提高系統(tǒng)的服務(wù)質(zhì)量,保持并加強(qiáng)系統(tǒng)在市場(chǎng)上的競(jìng)爭(zhēng)力。第46頁(yè),共60頁(yè),2023年,2月20日,星期三474.4.2評(píng)價(jià)標(biāo)準(zhǔn)

根據(jù)F.W.Lancaster的闡述,判定一個(gè)檢索系統(tǒng)的優(yōu)劣,主要從質(zhì)量、費(fèi)用和時(shí)間三方面來(lái)衡量。因此,對(duì)信息檢索的效果評(píng)價(jià),應(yīng)該從這三個(gè)方面進(jìn)行。第47頁(yè),共60頁(yè),2023年,2月20日,星期三48一、費(fèi)用標(biāo)準(zhǔn)即檢索費(fèi)用是指用戶(hù)為檢索課題所投入的費(fèi)用。二、時(shí)間標(biāo)準(zhǔn)是指花費(fèi)時(shí)間,包括檢索準(zhǔn)備時(shí)間、檢索過(guò)程時(shí)間、獲取文獻(xiàn)時(shí)間等。三、質(zhì)量標(biāo)準(zhǔn)主要通過(guò)具體的指標(biāo)進(jìn)行評(píng)價(jià)。評(píng)價(jià)指標(biāo)是衡量檢索系統(tǒng)性能和檢索效果的標(biāo)準(zhǔn),一般包括查全率、查準(zhǔn)率、漏檢率、誤檢率等四項(xiàng)指標(biāo)。查全率和查準(zhǔn)率是判定檢索效果的主要標(biāo)準(zhǔn),而后兩者相對(duì)來(lái)說(shuō)要次要些。第48頁(yè),共60頁(yè),2023年,2月20日,星期三49主要指標(biāo)的計(jì)算方法ab

cda:表示檢索系統(tǒng)中檢出的相關(guān)文獻(xiàn)b:表示檢索系統(tǒng)中檢出的非相關(guān)文獻(xiàn)c:表示檢索系統(tǒng)中未檢出的相關(guān)文獻(xiàn)d:表示檢索系統(tǒng)中未檢出的非相關(guān)文獻(xiàn)查全率R=a/(a+c)*100%查準(zhǔn)率p=a/(a+b)*100%漏檢率O=c/(a+c)*100%誤檢率N=b/(a+b)*100%第49頁(yè),共60頁(yè),2023年,2月20日,星期三501、查全率(檢全率)

查全率:它是指系統(tǒng)在進(jìn)行某一檢索時(shí),檢出的相關(guān)文獻(xiàn)量與檢索系統(tǒng)中相關(guān)文獻(xiàn)總量的比率。查全率=[檢出相關(guān)文獻(xiàn)量/系統(tǒng)內(nèi)相關(guān)文獻(xiàn)總量]×100%反映該系統(tǒng)文獻(xiàn)庫(kù)中實(shí)有的相關(guān)文獻(xiàn)量在多大程度上被檢索出來(lái)。衡量信息檢索系統(tǒng)敏感度的尺度,是衡量信息檢索系統(tǒng)檢出相關(guān)文獻(xiàn)能力的尺度。第50頁(yè),共60頁(yè),2023年,2月20日,星期三512、查準(zhǔn)率(檢準(zhǔn)率)查準(zhǔn)率:是指系統(tǒng)在進(jìn)行某一檢索時(shí),檢出的相關(guān)文獻(xiàn)量與檢出文獻(xiàn)總量的比率。查準(zhǔn)率=[檢出相關(guān)文獻(xiàn)量/檢出文獻(xiàn)總量]×100%

查準(zhǔn)率反映每次從該系統(tǒng)文獻(xiàn)中實(shí)際檢出的全部文獻(xiàn)中有多少是相關(guān)的。是衡量信息檢索系統(tǒng)精確度的尺度,是用來(lái)描述系統(tǒng)拒絕不相關(guān)文獻(xiàn)的能力,有人也稱(chēng)查準(zhǔn)率為“相關(guān)率”。第51頁(yè),共60頁(yè),2023年,2月20日,星期三523、漏檢率漏檢率=[漏檢相關(guān)文獻(xiàn)量/系統(tǒng)內(nèi)相關(guān)文獻(xiàn)總量]×100%漏檢率是衡量信息檢索系統(tǒng)漏檢文獻(xiàn)的尺度。漏檢率與查全率是互補(bǔ)的關(guān)系。第52頁(yè),共60頁(yè),2023年,2月20日,星期三534、誤檢率

誤檢率=[誤檢文獻(xiàn)量/檢出文獻(xiàn)總量]×100%誤檢率是衡量信息檢索系統(tǒng)誤檢文獻(xiàn)和程度的尺度。誤檢率與

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論