文獻檢索基本概念課件_第1頁
文獻檢索基本概念課件_第2頁
文獻檢索基本概念課件_第3頁
文獻檢索基本概念課件_第4頁
文獻檢索基本概念課件_第5頁
已閱讀5頁,還剩61頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、“新的力量源泉不是少數(shù)人手中的金錢,而是多數(shù)人手中的信息?!?- 約翰 . 奈斯比特對新信息的敏銳,學習新知識的熱情獲取、處理信息的能力,包括檢索、組織和使用等技能對獲得的信息進行辨識和選擇;創(chuàng)新知識的能力繼承已有知識成果,尊重知識產權信息有各種來源和形式,如打印文本、電視、視頻、圖書館數(shù)據(jù)庫、網(wǎng)站等等。一個具備 “信息素養(yǎng)” 的人,能夠知道自己為什么、什么時間和如何使用這些信息來源,并且對信息源提供的信息質量有敏銳的洞察力。 你不可能一夜之間就具備信息素養(yǎng)。象培養(yǎng)閱讀,寫作能力一樣,你需要不斷地從課題檢索過程中獲得經(jīng)驗,在尋找,選擇,評價你遇到的信息和思想中,你的信息素養(yǎng)逐漸提高了。 信息知

2、識知識是人類對客觀事物規(guī)律性的認識,是人類認識世界的成果或結晶。人的認識過程實際上就是信息的感知和處理過程,人類既要通過信息來認識世界、改造世界,又要將所獲得的信息形成知識。人的認識過程是從感性認識到理性認識,只有通過人腦的思維活動,對感知的信息進行重組、提煉和升華,才能形成知識,所以說理性認識即構成知識。文獻文獻就是用文字、圖形、符號和聲頻、視頻等技術手段記錄有知識信息的物質載體?;蛟还袒谖镔|載體上的知識信。信息、知識、文獻、情報的關系宇宙的萬事萬物都具有自身的信息,所以信息是無限的。人們獲取這些信息后,加以分析研究,從感性認識變成了理性認識就構成了知識。知識信息用文字、符號、圖片、聲波、

3、視頻等記錄在紙張、膠片、磁盤、磁帶或者計算機網(wǎng)絡上就形成了文獻。當人們需要的時候,及時獲取了這些知識信息和文獻,或者說人們獲取的這些知識信息和文獻在有用的時候,就成為其情報。 所以信息、知識、情報的關系可以表示為:信息 知識 情報。 文獻的類型 文獻按其出版形式可劃分為十大類,通稱“十大情報源。 圖書(Book) ISODIS52 17的定義:“凡篇幅達48頁以上并構成一個書目單元的文獻稱為圖書(Book)。特點:成熟,全面,可靠,時效性差 用途:初步了解一般性問題 科技報告(Science & Technical Report) 指科研工作成果的正式報告或研究過程中每階段進展的實際記錄 特點

4、:連續(xù)出版、有機構名稱、統(tǒng)一編號、自成一冊;內容專深具體,數(shù)據(jù)完整(似書不似刊);往往是最新成果. 會議文獻(Conference Document) 指在各種會議上發(fā)表的文獻,包括會議錄中收集的論文或報告。其特點是內容新,觀點可能不成熟,是了解某學科水平動態(tài)的重要情報源。會議文獻分會前文獻,會后文獻。 政府出版物(Goverment Publication) 專利文獻(Patent Document) 標準文獻(Standard Literature) 公司產品資料(Company & Products Data) 學位論文(Dissertation) 技術檔案(Technical File

5、s) 期刊核心期刊 指某學科(或專業(yè))所涉及期刊中刊載相關論文較多,能反映本學科最新研究成果及本學科前沿研究狀況和發(fā)展趨勢,得到該學科讀者普遍重視的期刊。核心期刊的確立是基于一定的理論基礎和科學統(tǒng)計的,不同學科會有不同的核心期刊表.而且核心期刊是一個動態(tài)的概念,核心期刊表一般每年或隔幾年會有修訂。中文核心期刊要目總覽是由北京大學圖書館主編的4年評選一次。中國科學引文數(shù)據(jù)庫 (Chinese Science Citation Database)/cscd_source.html/cscd_source.jsp檢索本專業(yè)的CSCD或CSSCI期刊(核心)信息檢索基礎什么是信息檢索?為滿足用戶的信息

6、需要而建立的,存儲有經(jīng)過整理的信息結合,擁有一定存儲、檢索與傳送技術設備,提供一定存儲、檢索方法和服務功能的工作系統(tǒng)或工具。檢索類型1 依據(jù)數(shù)據(jù)格式和檢索技術的層次不同劃分文本信息檢索、多媒體檢索、超媒體及超文本檢索2 依據(jù)用戶使用信息的目的不同撰寫論文的信息檢索、學科建設和學科研究的信息檢索生產開發(fā)的信息檢索、回答或解決問題的信息檢索對已知文獻的查找常規(guī)檢索方法常規(guī)法:利用常規(guī)檢索工具查找有關文獻,使信息時代應該掌握的最基本的方法順查、倒查、時間抽樣引文法:利用文獻后附的參考文獻、相關書目、推薦文章或引文注釋查找相關文獻交替法事實型檢索:以檢索特定的事實為檢索對象,如查找名詞術語的解釋、了解

7、某人或某機構的簡況,或考證某一事件發(fā)生的前因后果。數(shù)據(jù)型檢索:檢索特定的數(shù)值。如查找某一統(tǒng)計數(shù)據(jù)、某一數(shù)學公式、某一材料的成分檢索語言 檢索語言 就是為溝通文獻標引與文獻檢索而編制的人工語言,也是連接信息存儲和檢索兩個過程中標引人員與檢索人員雙方思路的渠道,是用于文獻標引和檢索提問的約定語言。檢索語言分類1 分類語言/索引根據(jù)學科之間的邏輯歸屬關系,從總到分,從一般到具體,逐級展開劃分。常用的如:中國圖書館圖書分類法、國際專利分類查找“制藥化學”相關的書,可從 R 醫(yī)藥、衛(wèi)生=R9 藥學=R91藥物基礎科學專利分類 /zgzl/zlfl/default.htm中國圖書館分類法基本大類表生物科學

8、的類目結構分類途徑的優(yōu)缺點1)優(yōu)點(1)族性檢索,查全率較高。 (2)按照人們認識事物的習慣,以學科分類為基礎,容易被人們接受和應用 【例題】檢索英語會話類辭典,例如美國語會話百科、英語會話大全、現(xiàn)代英漢生活用語圖解詞典,請選擇,哪種檢索途徑才能夠同時查出這3本書? 【選項】 A.用關鍵詞“會話”和“詞典” B.用中國圖書分類號H319.9-61 C.用書名“英語會話”和“大全” D.用書名“英語會話”和“詞典”分類途徑的優(yōu)缺點2)缺點 (1)不適用于特性檢索,查準率比主題詞低 【例題】論文多功能昆蟲鳴聲信號采集和分析系統(tǒng)及其在褐飛虱鳴聲研究中的應用和論文活菌制劑與抗生素對仔豬飼料消化率和腸道

9、微生物數(shù)量的影響適合用分類途徑還是主題途徑檢索? 【題解】這類課題僅僅采用分類號無法準確表達課題,用分類號只能粗略表達,并且分到兩個類目,不易歸類,適宜用主題途徑檢索。 論文1的【關鍵詞】是:昆蟲 insect鳴聲信號acoustic signal 信號采集signal acquisition 信號分析 signal analysis行為觀察 褐飛虱brown planthopper 水稻rice 害蟲pest (2)不能適應學科發(fā)展中的變化,難以反映新學科和新名詞術語 【實例】食品風險分析是保證食品安全的一種新模式,同時也是一門正在發(fā)展中的新興學科。風險分析的目標在于保護消費者的健康和促進公

10、平的食品貿易。目前的文章在分類上暫時歸入 R155.5 食品衛(wèi)生與檢驗和 TS201.6 食品安全與衛(wèi)生。沒有一個專門的“食品風險分析”分類號。(3)人們認識的不統(tǒng)一,往往造成分類不一致及排檢的錯誤,不易反映交叉學科。 【實例】例如管理心理學,它是心理學的一個分支,主要是研究企業(yè)中人的心理活動規(guī)律,用科學的方法改進管理工作,充分調動人的積極性的一門學科。但是,人們很可能誤解為歸入管理學。檢索語言分類 主題語言/索引依照文獻的主題概念而編制的索引體系,其內容一般按照主題詞字的順序排列。如工程索引敘詞表主題語言關鍵詞語言敘詞語言代碼語言規(guī)范化科學名詞來標引信息主題概念并排列組織信息的一種人工語言。

11、敘詞表可分兩類:綜合性的和專業(yè)性的。綜合性敘詞表中比較有影響的是美國工程與科學主題詞表和日本科學技術情報中心主題詞表;專業(yè)性敘詞表有美國的航空和航天局主題詞表、國際核情報系統(tǒng)主題詞表、英國的電機工程師協(xié)會主題詞表等。中國有60余部敘詞表,其中綜合性敘詞表有漢語主題詞表和國防科學技術主題詞典;專業(yè)性敘詞表有航空科技資料主題詞表、電子技術漢語主題詞表、化學工業(yè)主題詞表等。主題詞規(guī)范實例:同義詞【實例】“煤炭”與“煤”是同義詞,都可以使用,但是只能用“煤”作為主題詞。術語“商品煤”,英文是Commercial coal/salable coal,含義是作為商品出售的煤,其同義詞“銷煤”,現(xiàn)在已經(jīng)停止

12、使用。術語“精煤”,英文是cleaned coal,含義是煤經(jīng)精選(干選或濕選)后生產出來的、符合質量要求的產品,其同義詞“洗精煤”現(xiàn)在已經(jīng)停止使用。 【實例】“如“實驗”與“試驗”、“天然資源”與“自然資源”這兩組詞匯,應該選擇“實驗”和“自然資源”作為主題詞。【實例】“計算機”與 “電腦”,是同義詞,都可以使用,電腦是俗名,計算機是正式用名,就用“計算機”作為主題詞?!鞍l(fā)動機”與“馬達”(motor)是同義詞,但是選擇“發(fā)動機”作為主題詞;同理,“貧銅礦”宜用“低品位銅礦”表達;土豆、洋芋用“馬鈴薯”表達?!緦嵗俊皩Σ煌瑢懛ǎ纭癤射線”與“愛克斯射線”,“氟利昂”與“氟里昂”,應該選擇

13、最常用的“X射線”、“氟利昂”。多義詞的規(guī)范 限定多義的主題詞含義或在特定檢索工具規(guī)定只有一個特定意義,排除歧義?!緦嵗俊癈ell”既表示生物學中的“細胞”,又表示電學中的“電池”,這種多義詞易造成誤檢。在生物學檢索工具里規(guī)定“Cell”表示生物學中的“細胞”,“battery”表示電學中的“電池”?!緦嵗慷霹N既表示一種鳥,也表示一種花,就須限定說明為:杜鵑(動物)、杜鵑(植物)。 檢索系統(tǒng)的檢索功能1 邏輯檢索 邏輯“與”: AND 邏輯“或”: OR 邏輯“非”: NOT2 截詞檢索 一種常用的模糊檢索方法,是指在檢索時使用詞的一個局部(某些位置上的字符被截去)進行檢索,凡滿足這個詞局

14、部中的所有字符(串)的記錄,均為命中結果。截詞檢索需要使用專門的符號(截詞符)以指定截詞的具體位置與截斷字符的數(shù)量。檢索系統(tǒng)的檢索功能截詞檢索用于解決一些詞干相同、詞義相近、但詞尾或詞頭不一致的派生詞(如由同一詞根派生出的名詞、動名詞、動詞、形容詞、副詞等),或名詞的單、復數(shù)形式,或同一詞的英美不同拼寫形式等詞的一次輸入。 截詞方式 按截斷的位置分: 右截斷 (前方一致) 中截斷 (中間屏蔽) 按截斷的字符數(shù)量分: 有限截斷 無限截斷截詞符有限截 ? 例:process? 檢出 process processes 等? 例:process? 檢出 process processes proce

15、ssing procession 等注意:不同的檢索系統(tǒng)有不同的規(guī)則定義截詞符無限截 ? 例: prevent? 檢出 prevent prevents prevented preventing prevention preventable .截詞符中間屏蔽 ? 例: s organi?ation 檢出 organisation ,organization中文數(shù)據(jù)庫檢索有沒有截詞?3 位置算符要求檢索詞在檢索結果中出現(xiàn)時,其間的相互距離不應超過若干個字符的范圍限制。用于限定詞與詞之間的位置關系,以提高查準率。當檢索詞為詞組形式時,或兩個檢索詞之間可能被禁用詞或標點符號隔開時,均應使用位置算符。

16、檢索系統(tǒng)的檢索功能位置算符舉例 (W) 算符 例: real(w)estate 檢出 real estate 位置算符(N) 算符 例:fiber? ?(n)optic? 檢出 fiber optics optical fibers 檢索方法直接檢索多次檢索跟蹤檢索回溯檢索綜合檢索檢索策略廣義 指為實現(xiàn)檢索目的而制定的全盤計劃和檢索方案,是對整個檢索過程的指導和謀劃;狹義 指輸入計算機的檢索式。事實上,在構造檢索策略過程中,要涉及到許多方面的知識與技能。如對檢索課題的明確程度,對檢索課題的分析;對數(shù)據(jù)庫及其系統(tǒng)特性和功能的掌握;編制邏輯檢索式的技巧以及調整檢索策略的方法等方面都會影響用戶檢索的

17、整體效果。因此制定檢索策略是一種全面的知識與技能,也是一種經(jīng)驗.掌握了這種技能和經(jīng)驗,再通過廣泛實習,可以獲得比較好的檢索效果。檢索策略制定步驟1 分析課題、明確檢索要點 明確檢索目的。需要解決研究中的某一關鍵問題?開展科研立項?成果查新?專利申請?了解最新動態(tài)、研究進展? 明確課題的主題內容和研究重點 明確課題的學科范圍 明確所需信息的外部特征:需要的是文獻型,還是數(shù)值型、事實型;是全文型,還是書目型?檢索策略制定步驟2 根據(jù)檢索目的選擇數(shù)據(jù)庫 數(shù)據(jù)庫的類型 數(shù)據(jù)庫的內容 數(shù)據(jù)庫的收錄范圍 數(shù)據(jù)庫的實時性 數(shù)據(jù)庫的價格一般來說,選擇數(shù)據(jù)庫應遵循以下幾條原則:(1)根據(jù)檢索目的確定所需數(shù)據(jù)庫的

18、類型(2)根據(jù)信息需求的內容、專業(yè)范圍選擇數(shù)據(jù)庫(3)根據(jù)記錄來源選擇數(shù)據(jù)庫(4)根據(jù)熟悉程度選擇數(shù)據(jù)庫1) 開始某一項科學研究或承接某項工程設計,需要對課題進行全面的文獻普查,并從中篩選出所需的資料,用以編寫可行性報告、計劃任務書等。 對這樣的課題,應選擇一個年限比較長的,收錄比較廣泛的相關專業(yè)的二次文獻數(shù)據(jù)庫,在全面回溯檢索的基礎上,選出相關的文獻,再獲取一次文獻。 2) 為解決某個技術難題,查找關鍵性的技術資料。 對這樣的課題,應選擇工程和技術類數(shù)據(jù)庫或專利數(shù)據(jù)庫。 3) 為貿易與技術引進、合資談判,了解國外市場、產品與公司的行情。 查找科學數(shù)據(jù)庫以了解技術的先進性,查找市場、產品、公司

19、等商情數(shù)據(jù)庫以對手的情況。 4) 為申報專利或鑒定成果,查找參考依據(jù)。 以選擇國內外專利數(shù)據(jù)庫為主。 5) 為某項決策查找有關情報。 根據(jù)決策的不同性質,進行綜合性的全面文獻調研,涉及到科學研究、技術研究、產品、市場等最新發(fā)展動態(tài)。 6) 為撰寫論文查找相關文獻等。 以期刊論文、學位論文等學術研究性的數(shù)據(jù)庫為主。檢索策略制定步驟3 確定檢索詞,選擇相應的檢索字段,構造檢索式 課題進行主題分析,掌握課題的內容實質,找出最能代表主題概念的若干檢索詞。正確的主題分析是制定檢索策略的依據(jù),它決定了檢索策略的質量和檢索效果的好壞。進行主題分析,確定檢索詞、編制檢索式的基本方法可歸納為如下幾點:(1)在所

20、檢數(shù)據(jù)庫主題詞與自由詞并用時,應首先從相應的主題詞表中選擇所需的檢索詞,以便獲得最佳檢索效果。(2)沒有確切表達課題內容的主題詞時,可采用自由詞檢索,此時應注意以下幾點: 使用各學科在國際上通用的、文獻中出現(xiàn)過的術語。盡量避免選用冷僻詞和自選詞,對于一些專業(yè)性極強的罕見詞,確實是課題需要,也可選作檢索詞。 從專業(yè)詞典、手冊、分類表以及期刊中選擇檢索詞或者參考現(xiàn)有的原始文獻。 考慮同義詞、近義詞、上位詞、下位詞等,注意使用縮略語、截詞以及西文的不同拼寫形式等。 分析課題的內容實質,找出隱性的主題概念,將抽象主題轉化為具體概念,使用較專指的下位詞。(3)以課題核心概念為主,排除無關概念,把重復概念

21、進行歸并,簡化檢索式,提高檢索效果。過多過嚴的概念組配,很可能導致大量相關文獻的漏檢,甚至出現(xiàn)檢索結果為零的情況。(4)初步檢索后,瀏覽檢索結果,從記錄中重新選擇檢索詞進行檢索。這一方法主要適用于檢索選詞無把握或難以確定恰當檢索詞的情況。(5)根據(jù)檢索需求選擇正確的檢索途徑。如主題詞途徑、自由詞途徑、作者途徑、期刊名途徑、分類途徑等。(6)合理運用邏輯運算符構造檢索式。符號的使用一定要正確、符合概念邏輯,并力求簡潔、優(yōu)化,還應注意運算符的優(yōu)先級和括號的使用。 檢索策略制定步驟4 上機檢索、調整檢索方案 檢索后通過查看文獻檢索結果數(shù)量的多少或相關程度的高低,可以評價檢索策略的好壞。通常情況下,需要多次修改檢索策略,直到檢索結果滿意為止。 在實際檢索中,當放寬檢索以提高查全率時,就會降低查準率;反之,當縮小檢索范圍以提高查準率時,就會降低查全率。因此要正確分析誤檢、漏檢原因,及時調整策略。1)誤檢原因分析 沒有對檢索詞進行限制。包括字段限制,時間限制,分類限制等。 主題概念不夠具體或具有多義性導致誤檢。 對所選的檢索詞截詞截得過短。(2)漏檢原因分析 錯選數(shù)據(jù)庫。 檢索概念太多、檢索概念錯誤或拼寫錯誤。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論