第一次課信息檢索基礎醫(yī)學研究生_第1頁
第一次課信息檢索基礎醫(yī)學研究生_第2頁
第一次課信息檢索基礎醫(yī)學研究生_第3頁
第一次課信息檢索基礎醫(yī)學研究生_第4頁
第一次課信息檢索基礎醫(yī)學研究生_第5頁
已閱讀5頁,還剩111頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

文獻信息檢索課的主要內容

信息檢索基礎知識圖書檢索及網絡信息檢索常用中文電子文獻數(shù)據庫的檢索常用外文電子文獻數(shù)據庫的檢索特種文獻信息的檢索醫(yī)學信息檢索與利用

教師:黃桂娟QQ:653309895郵箱:jocelyn.huang@163.com目的:提高信息素養(yǎng),助力學習與科研學科資源有哪些如何查找專業(yè)文獻以及外文文獻文獻的利用、評價等內容助力科研目的基本方法截詞布爾邏輯鄰近專類信息數(shù)據庫搜索引擎學術性CNKI萬方WOSSDPubMed學位論文期刊論文專利標準流程問題工具檢索式調整應用信息思維及訓練信息分析與評價……第一講緒論學科領域及其認知學習資料類型學習管理規(guī)劃制定學習和科研規(guī)劃科研工作基本流程學科領域及其認知研究領域自然科學生命科學學科領域及其認知研究方法數(shù)學方法科學實驗系統(tǒng)科學方法學習資料類型教材教輔學術論文學術專著特種文獻學習管理規(guī)劃研究生學習計劃第一學期——學習期第二學期——知識補充期第三學期——論文材料收集與開題寫作期第四學期——研究工作、資料整理期第五學期——論文完成和擇業(yè)思考期第六學期——論文答辯和擇業(yè)沖刺學期研究生期間學習流程圖課程學習選題文獻調研科研設計開題報告研究工作中期檢查整理資料撰寫論文論文答辯學位委員會審議授予學位科研工作的基本流程閱讀、實踐、實驗問題?信息檢索、分析、閱讀、思考……新學說、新理論、新發(fā)現(xiàn)實驗證明、驗證發(fā)布:口頭報告、論文發(fā)表……新問題?發(fā)展、延伸……同行評價、引用、應用……如何從紛繁復雜的信息海洋中發(fā)現(xiàn)自己所需的有用信息如何辨別信息的真?zhèn)蝹X筋如何。。。。。什么是信息素養(yǎng)(informationliteracy)呢?信息素養(yǎng)的定義:利用大量的信息工具及主要信息源使問題得到解答時所利用信息的技術與技能。---美國信息產業(yè)協(xié)會主席保羅·澤考斯基(PaulZurkowski)1974年首次提出。簡單地說,信息素養(yǎng)是指個人“能認識到何時需要信息,和有效地搜索、評估和使用所需信息的能力”。信息素養(yǎng)包含4個內涵:信息意識:對新知識新信息的敏感力、觀察力、判斷力、吸收能力以及對開發(fā)利用信息知識的主動性信息知識:指一切與信息有關的理論、知識和方法信息能力:指獲取、處理、利用和創(chuàng)新信息的能力信息道德:指整個信息活動中的道德規(guī)范,包括:尊重他人的學術成果;尊重知識產權;抵制違法信息及信息行為;學會在信息活動中的團隊精神,合作精神。第一章:信息檢索基礎知識1.信息信息是物質存在的一種方式、形態(tài)或運動狀態(tài)也是是事物的一種普遍屬性。P1例:某病人,年齡58,性別男,身高1.72,體重69kg,體溫37.2℃,患有糖尿病。信息的特征

信息的普遍性和客觀性 信息可識別性 信息的依附性 信息的可傳遞性 信息價值的相對性 信息的共享性信息的時效性信息的類型自然信息:由自然界客觀存在的固有事物發(fā)出的信息,如形形色色的天氣變化、地殼運動、天體演變、自然奇觀等。如指由生物體發(fā)出的信息,虎嘯、鳥鳴、體溫升降等。社會信息:是指人類活動所產生及伴隨的各類信息。如人口信息、法律與政治信息、教育狀況的信息等。信息資源定義信息資源是人類在認識世界與改造世界的過程中所產生、整理和記錄的有用信息的集合。p2信息資源類型按開發(fā)程度劃分:

潛在的信息資源

口語信息資源

現(xiàn)實的信息資源體語信息資源

文獻信息資源*

實物信息資源

文獻(literature、document)

定義:“記錄有知識的一切載體”。如:甲骨文、碑刻、帛書、圖書、連續(xù)出版物、錄音磁帶、縮微平片、電影片等不同載體的各種文獻甲骨文簡牘長沙馬王堆1號墓出土的彩繪T型帛畫碑刻錄像帶二文獻的主要類型按文獻的載體形式劃分:按文獻的加工程度劃分:按文獻的出版形式劃分:(一)按文獻的記錄及載體形式劃分:手工型印刷型縮微型聲像型電子型

印刷型

載體:紙張記錄手段:手寫、打字、印刷和復印等優(yōu)點:便于直接閱讀,使用方便缺點:較笨重、存儲密度低,不便于加工、整理和收藏。此類型文獻有:期刊、圖書等縮微型

載體:感光材料記錄手段:縮微照相優(yōu)點:存儲密度較大、體積小、便于收藏保存、便于遠距離傳遞缺點:缺點是不能直接閱讀,需借助縮微閱讀機才能閱讀此類型文獻有:縮微膠卷、縮微膠片等聲像型

載體:磁性和感光材料記錄手段:借助于特殊的機械裝置(如復錄機、攝像機、錄像機等)直接記錄聲音、圖像優(yōu)點:直觀、生動缺點:制作成本較高,需要借助于一定的設備才能閱讀此類型文獻有:唱片、錄音帶、錄像帶、幻燈片、電影片、多媒體資料等電子型

載體:光、電、磁介質記錄手段:利用計算機進行存儲優(yōu)點:存儲密度高,出版周期短、易更新,傳遞信息迅速,存取速度快,可以融文本、圖像、聲音等多媒體信息于一體,信息共享性好、易復制,識別和提取易于實現(xiàn)自動化.缺點:需借助計算機等先進技術設備才能閱讀此類文獻有:電子圖書、電子期刊、聯(lián)機數(shù)據庫、網絡數(shù)據庫、光盤數(shù)據庫(二)按文獻的加工程度分類

一次文獻二次文獻三次文獻一次文獻通常是指原始制作,即作者以本人的研究成果為基本素材而創(chuàng)作(或撰寫)的文獻。如期刊論文、科技報告、會議論文、專利說明書一次文獻二次文獻也叫檢索工具。是將大量分散的無組織的一次文獻經濃縮、加工、整理后形成的文獻。如目錄、題錄、文摘、索引等。二次文獻:如館藏目錄檢索系統(tǒng)三次文獻是指利用二次文獻,選用一次文獻內容,經綜合,分析和評述后形成的指南性文獻。如綜述、述評、詞典、百科全書、年鑒、指南數(shù)據庫。文獻結構示意圖(三)按文獻的出版形式:⑴圖書⑵連續(xù)出版物⑶會議文獻⑷科技報告⑸學位論文⑹專利文獻⑺標準文獻⑻政府出版物⑼產品資料⑽檔案(1)圖書定義:一般不少于49頁并構成一個書目單元的文獻。特點:內容系統(tǒng),全面,可靠,但時效性差。類別:閱讀性和工具型閱讀型:教科書(Textbook)、專著(Monograph)、文集(Anthology)等工具型:詞典(Dictionary)、百科全書(Encyclopedia)、手冊(Handbook)、年鑒(Yearbook)等國際標準書號(ISBN)ISBN是internationalstandardofbooknumber幾個英文字母的縮寫,即國際標準書號。它由10位數(shù)字組成,這10位數(shù)字由組號、出版者號、書名號、校驗號這四部分組成,其間用“-”相連。

ISBN號是由10位數(shù)字組成,共分四段:

如:ISBN:7①-5383②-0276③-X④其中,①是地域號(國家、地區(qū)、語言區(qū))。其中7代表中國②是出版社號。③是該出版社出版的圖書種數(shù)的流水號。④是計算機檢驗位。各有固定的編碼:0、1代表英語,使用這兩個代碼的國家有:澳大利亞、加拿大、愛爾蘭、新西蘭、南非、英國、美國、津巴布韋等;2代表法語,法國、盧森堡以及比利時、加拿大和瑞士的法語區(qū)使用該代碼;3代表德語,德國、奧地利和瑞士德語區(qū)使用該代碼;4是日本出版物的代碼;5是俄羅斯出版物的代碼;7是中國出版物使用的代碼(2)期刊定義:是一種定期或不定期的連續(xù)性出版物,每期版式基本相同,有固定的刊名,有連續(xù)的年、卷、期號。特點:出版周期短,報道速度快,數(shù)量大,內容新,發(fā)行面廣。什么是ISSN?ISSN即國際標準連續(xù)出版物號(InternationalStandardSerialNumber,簡稱ISSN),每一種期刊在注冊登記時,就得到一個永久專屬的ISSN;

每組ISSN是由八位數(shù)字構成,分前后兩段,每段四位數(shù),段與段間用“-”相連,其中后段的最末一數(shù)字為檢查號,如:ISSN0211-9153(3)會議文獻定義:會議文獻是指國際學術會議和各種國內重要學術會議上發(fā)表的論文、報告。特點:學術性強,內容新穎。類別:會前文獻和會后文獻會前文獻:日程表、會議議程、預印本、論文摘要會后文獻:經整理、編輯的正式文獻(4)科技報告定義:科技報告是國家政府部門或科研生產單位關于某項科學研究成果的正式報告,或是對研究和試驗過程中各階段進展情況的實際記錄。特點:內容比較專深具體,能代表一個國家和專業(yè)的發(fā)展水平與動向。是不定期出版物,一個報告為一單行本,有統(tǒng)一編碼。比期刊論文新穎詳盡出版周期短,能反映一個國家或某一學科的科研水平。具有保密性。(5)學位論文定義:指高等學校、科研機構的研究生、畢業(yè)生為獲得某種學位所撰寫的論文。根據不同的學位,一般分為學士論文、碩士論文和博士論文。特點:具有獨創(chuàng)性,內容專一,論述詳細、系統(tǒng),是經過一定審查的原始研究成果。(6)專利文獻定義:專利文獻主要指由各國專利機構公布的正式出版物,包括專利公報、專利檢索工具書、與專利有關的法律文件及訴訟資料。這里所介紹的專利文獻主要是指對科學研究具有參考價值的專利說明書。專利說明書包括發(fā)明的詳細說明、專利權范圍、插圖3個部分。我國專利的種類:發(fā)明專利,外觀設計,實用新型專利文獻(7)標準文獻定義:主要是對工、農業(yè)產品和工程建設的質量、規(guī)格及其檢驗方法等方面所作的技術規(guī)定,是從事生產、建設的一種共同技術依據。等級:按審批機構級別可分為國際標準、國家標準、部頒標準、企業(yè)標準4個等級,(8)政府出版物定義:是指各國政府部門及其所屬機構出版的文獻,又稱官方出版物。類別:行政性文獻和科技文獻行政性文獻(包括立法、司法文獻),主要有政府法令、方針政策、規(guī)章制度、決議、指示、統(tǒng)計資料等,主要涉及政治、法律、經濟等方面??萍嘉墨I主要是政府部門的研究報告、標準、專利文獻、科技政策文件、公開后的科技檔案等。特點:內容范圍廣泛;具有權威性;一些非正式出版的文獻不易收集。用途:對了解各國的方針政策、經濟狀況及科技水平,有一定的參考價值。(9)產品資料定義:是廠商為推銷產品而印發(fā)的介紹產品情況的文獻,包括產品樣本、產品說明書、產品目錄、廠商介紹等。特點:反映的技術比較成熟,數(shù)據也較為可靠,內容具體、通俗易懂,常附較多的外觀照片和結構簡圖,形象、直觀。但產品樣本的時間性強,使用壽命較短,且多不提供詳細數(shù)據和理論依據。用途:1、作為技術人員設計、制造新產品的一種有價值的參考資料。2、了解各廠商出廠產品現(xiàn)狀、掌握產品市場情況及發(fā)展動向。(10)檔案定義:指國家機構、社會組織以及個人從事政治、經濟、軍事、科學、技術。特點:內容真實、詳盡、具體、準確可靠,保密性強,保存期長久,是科研和生產建設工作的重要依據,具有很大參考價值。用途:了解生產領域和科學實踐中的經驗和技術竅門信息檢索信息檢索01信息檢索方法03信息檢索策略04信息檢索效果05信息檢索技術02信息檢索的涵義完整的信息檢索概念包括兩項工作:(1)信息存儲過程,即搜集、篩選、整理、積累現(xiàn)有信息及檢索工具,建立信息檢索系統(tǒng);(2)信息檢索過程,即利用信息檢索工具查找所需要的信息信息檢索系統(tǒng)(或信息檢索工具)定義:是指按某種方式、方法建立起來的供讀者查檢信息的一種有層次的體系,是表征有序的信息特征的集合體。功能:報道文獻信息、存儲文獻信息、檢索文獻信息。信息檢索系統(tǒng)(或信息檢索工具)信息檢索系統(tǒng)類型(1).按照信息存儲和檢索所采用的設備和手段劃分:

手工信息檢索系統(tǒng):書本式檢索系統(tǒng)卡片式檢索系統(tǒng)

計算機信息檢索系統(tǒng):計算機光盤檢索系統(tǒng)、計算機聯(lián)機檢索系統(tǒng)、計算機網絡檢索系統(tǒng)。信息檢索系統(tǒng)類型(2).按揭示信息內容的程度劃分

目錄題錄索引文摘

全文信息檢索系統(tǒng)(或信息檢索工具)目錄:是以一件或一種完整的出版物(如一本書、一種期刊等)作為著錄基本單位的檢索工具。一般目錄主要揭示、報道這些單位出版物的外表特征。

信息檢索系統(tǒng)(或信息檢索工具)索引:是根據一定的需要,把特定范圍內的某些重要文獻中的有關款目或知識單元(如書名、刊名、人名、地名、語詞等),按照一定的方法編排,并指明出處,為用戶提供文獻線索的一種檢索工具。

題錄:以報道論文為主的篇目索引,題錄揭示、報道文獻的外表特征為主?!菊撐念}名】網絡環(huán)境下信息檢索與報道服務淺析

【英文題名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云DINGCai-yun

【作者單位】湖南化工職業(yè)技術學院,圖書館,湖南,株洲,412004

【刊名】株洲師范高等??茖W校學報

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【關鍵詞】圖書館;網絡環(huán)境;信息搜集;信息檢索;信息報道文摘:是在題錄的基礎上,在每條著錄款目后邊再加上文獻內容的摘要?!菊撐念}名】網絡環(huán)境下信息檢索與報道服務淺析

【英文題名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云DINGCai-yun

【作者單位】湖南化工職業(yè)技術學院,圖書館,湖南,株洲,412004

【刊名】株洲師范高等專科學校學報

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【關鍵詞】圖書館;網絡環(huán)境;信息搜集;信息檢索;信息報道

【摘要】網絡環(huán)境下的信息服務已對圖書館的機構組織、人員素質、服務水平和社會地位產了巨大影響.掌握網絡環(huán)境下的信息服務特點和方法,盡快適應網絡環(huán)境已成為圖書館提高信息服務質量的重要課題.

信息檢索系統(tǒng)(或信息檢索工具)全文:全文檢索技術是一種面向全文、提供全文的新型檢索技術。它可以使用原文中任何一個有實際意義的詞作為檢索入口,得到的結果是源文獻而不是文獻的線索。信息檢索語言信息檢索語言:是為建立信息檢索系統(tǒng)而創(chuàng)建的專門用來描述文獻特征的一種符號系統(tǒng)。又稱信息組織語言、情報語言、標引語言、索引語言等作用:

1、保證不同標引人員表征文獻信息的一致性,使內容相同及相關的文獻集中化。

2、保證檢索提問與文獻信息標引的一致性。提高信息的查全率和查準率。檢索語言的類型描述內容特征語言描述外表特征語言主題語言分類語言代碼語言責任者題名其他關鍵詞語言——(keyword)標題詞語言——(heading)單元詞語言——(uniterm)敘詞語言——(descriptor)信息檢索語言分類法與分類語言p7

分類法是將文獻按其學科體系或事物性質進行歸類標引的整序方法。

分類語言是按信息資源內容的學科知識屬性或者事物的性質分門別類的系統(tǒng)的標志和組織信息資源,一般用分類號和相應分類款目來表達各種主題概念的信息檢索語言學科體系分類法事物性質(組配)分類法1.體系分類法體系分類法是直接體現(xiàn)知識分類等級制概念的標識系統(tǒng),它通過對概括文獻信息內容及其某些外部特征的概念進行邏輯分類和系統(tǒng)排列而構成。主要特點:是按學科、專業(yè)集中文獻,并從知識分類角度揭示各類文獻在內容上的區(qū)別和聯(lián)系,提供從學科分類角度檢索文獻信息的途徑。中國圖書館圖書分類法基本部類:1、馬克思主義、列寧主義、毛澤東思想、鄧小平理論2、哲學3、社會科學4、自然科學5、綜合性圖書基本大類:(22個)

A馬列主義毛澤東思想鄧小平理論N自然科學總論

B哲學O數(shù)理化科學

C社會科學總論P天文學、地理

D政治、法律Q生物科學

E軍事R醫(yī)學、衛(wèi)生

F經濟S農業(yè)科學

G文化、科學、教育、體育T工業(yè)技術

H語言、文字U交通運輸

I文學V航空、航天

J藝術X環(huán)境科學

K歷史、地理Z綜合性圖書

什么是分類號分類號:依據一定的分類工具(分類法),采用字母和數(shù)字作為類目的標識符號。R126.9 城市的噪音、振動的衛(wèi)生標準與管理分類號分類語言的優(yōu)缺點優(yōu)點:分類法是一種體現(xiàn)知識分類等級概念的標識系統(tǒng),具有按學科或專業(yè)集中、系統(tǒng)揭示文獻信息內容的功能,用分類方法檢索文獻具有較高的查全率。分類法將概念逐級劃分,具有等級結構,便于擴大和縮小檢索范圍。分類法既能用于組織檢索工具和檢索系統(tǒng),又能用來組織圖書資料的分類和排架。用分類號檢索,可以不受語種的限制缺點:間接性。分類法用分類號作為檢索標識,不能直接表達概念。分類法不能經常修訂,因而不能及時反映新的科學技術主題。分類法的類目不可能詳盡無余地列舉一切事物概念,遇到檢索主題狹窄的課題,可能難以找到相應的類目,查準率不高。信息檢索語言主題法與主題語言p9主題法:一種用自然語言作為標識符號標引文獻中心內容的整序方法主題檢索語言:是用語詞作為概念標識,按字順排列,并用參照系統(tǒng)等方法間接顯示概念間相互關系的一種信息檢索語言,也稱主題法系統(tǒng)。標題詞語言單元詞語言敘詞語言關鍵詞語言標題詞檢索語言單元詞檢索語言人工語言敘詞檢索語言關鍵詞檢索語言自然語言標題詞語言:以文獻信息中表達主題概念的標題詞作為文獻內容標志和檢索依據的一種主題語言單元詞語言:以單元詞作為文獻內容標志和檢索依據的一種主題語言

敘詞語言:以敘詞作為信息單元的主題標志和檢索依據,專為標引和檢索文獻信息而設計的人工檢索語言。又稱主題詞、敘述詞、描述詞漢語主題詞表醫(yī)學主題詞表

關鍵詞(Keyword),是指出現(xiàn)在文獻中,對表征文獻主題內容具有實質意義的自由語詞,它不受詞表控制,可自由進行組配,對揭示和描述文獻主題內容起著關鍵性作用的語詞。

關鍵詞是屬于自然語言的范疇,未經規(guī)范化處理,也不受主題詞表的控制。主題語言的優(yōu)缺點

優(yōu)點不必知道學科門類,只需使用關鍵性詞匯進行標引。簡單直接,不像分類語言需要轉換為分類號。能形成專指度高的檢索標識,查準率高。主題詞在詞表中按照字順排列,沒有等級性,便于增刪、修改。規(guī)范化主題語言有一套較完整的參照系統(tǒng),能顯示詞間關系,可供擴檢和縮檢用。缺點分散文獻學科體系。詞表收錄有限,很多概念在詞表中沒有反映。表達概念的受限,詞匯轉換的失真,標引、檢索前處理量大且難以達到統(tǒng)一。查全率低。分類語言與主題語言的異同點:相同點:1)揭示和檢索的對象都是各種類型的文獻信息。2)都是從文獻信息的內容途徑進行揭示和檢索。3)都是文獻信息機構廣泛使用的文獻信息整序法。不同點:1)揭示對象屬性不同—學科知識屬性,主題概念2)使用標識不同—分類號,主題詞或關鍵詞3)排列方式不同—按大小排列,按字順排列4)檢索效果不同—族性檢索,特性檢索5)用途不同—用于排架,用于檢索描述外表特征的檢索語言

1.題名:書名、刊名、專利名稱等

2.責任者:編著者、專利申請人等

3.編號:標準號、專利號、索書號等

4.機構名稱:出版社、責任者等

5.其他檢索方法p12順查法以課題的起始年代為起點,按時間順序,由遠及近系統(tǒng)地收集該課題的文獻。檢索目的:了解該課題發(fā)展的全過程。優(yōu)點:漏檢率低缺點:工作量大倒查法從現(xiàn)在開始,由近及遠,逆著時間順序向前查找文獻。檢索重點在于近期文獻,達到目的為止。檢索目的:把握課題的最新進展優(yōu)點:快速獲得該課題最新的資料缺點:容易造成漏檢抽查法以課題研究最活躍的年代為檢索的時間段引文追溯法通過文章后面所列參考文獻目錄的線索,查找所需信息。綜合法將幾種檢索方法綜合利用檢索途徑p121.題名途徑2.責任者和責任方式途徑3.文獻類型途徑

4.版本途徑5.標識6.權限管理7.主題8.描述9.語句10.全文11.與其他資源的關系檢索技術檢索技術:是指應用于信息檢索過程的原理、技術、方法、策略的總稱,是檢索系統(tǒng)為了提高檢索效率,從概念相關性、位置相關性等方面對檢索提問進行組配、加權、擴展、截詞、鄰近、限定的比較和運算處理技術。

檢索技術計算機檢索常用技術91

1.布爾檢索(booleanretrieval)是用布爾邏輯算符將檢索詞、短語或代碼進行邏輯組配的一種技術,也是目前最常用的一種檢索技術。

邏輯“與”具有概念交叉或概念限定關系的組配,用“*”或“AND”算符表示(少數(shù)工具用“+”或空格表示)。

檢索詞A和檢索詞B用“與”組配,檢索式為:

AANDB,或者A*B它表示檢出同時含有A、B兩個檢索詞的記錄。

邏輯“或”邏輯“或”是一種具有概念并列關系的組配,用“+”或“OR”算符表示(也有用“|”或“/”表示)。檢索詞A和檢索詞B用“或”組配,檢索式為:

AORB,或者A+B它表示檢出所有含有A詞或者B詞的記錄。邏輯“非”

邏輯“非”是一種具有概念排除關系的組配,用“–”或“NOT”算符表示。檢索詞A和檢索詞B用“非”組配,檢索式為:

ANotB,或者A-B它表示檢出含有A詞,但同時不含B詞的記錄。

布爾邏輯檢索使用注意事項布爾檢索執(zhí)行順序

()NOTANDOR例如(農民工子女+留守兒童)*教育如果拆去括號輸出結果:(板書)加上括號輸出結果:(板書)

截詞技術

p60截詞檢索:用截詞符號“?”、“*”或“$”加在檢索詞的前后或中間,以檢索一組概念相關或同一詞根的詞。后截斷中截斷前截斷無限截斷如:economic???有限截斷截詞檢索與截詞檢索算符economiceconomicseconomicsteconomicalismeconomiceconomicseconomicst如:economic*如:wom?nwomanwomen一般僅允許有限截斷如:?lish

sul*ursulfursulphur無限截斷有限截斷前后截斷如:?computer?可檢出:computer、computers、computerize、computerized、minicomputer、minicomputers、microcomputer、microcomputers

位置算符:

是一種可以不依賴敘詞表而直接使用自由詞進行檢索的一種技術,它以數(shù)據庫原始記錄中詞語的相對次序或者位置關系為對象進行組配運算。黃金金黃奶牛牛奶教書育人育人教書美好生活生活美好位置算符

p61(W)與(nW)算符

(W)算符是“With”的縮寫,表示此算符兩側的檢索詞必須按此前后鄰接的順序排列,順序不可顛倒,而且檢索詞之間不允許有其他的詞或字母,但允許有空格或連字符號。(nW)算符是“nWords”的縮寫,表示此算符兩側的檢索詞之間允許插入n個實詞或虛詞,但兩個檢索詞的次序還是不能顛倒。(N)與(nN)算符

(N)算符是“Near”的縮寫,表示此算符兩側的檢索詞彼此必須相鄰接,但兩個檢索詞的前后關系可以顛倒,即查找兩個連在一起的單詞,但兩詞之間不能插入任何詞。(nN)

算符是“nNear”的縮寫,表示此算符兩邊的檢索詞之間插入詞的最多數(shù)目是

n

個,且兩個檢索詞的次序可以任意顛倒。(S)算符和

(F)算符

(S)算符是“Sub-field”的縮寫,要求被連接的檢索詞必須同時出現(xiàn)在記錄的同一句子中,中間插入詞的數(shù)量也不限。(F)

算符是“Field”的縮寫,要求被連接的檢索詞出現(xiàn)在同一的字段中,字段類型和詞序均不限。(L)算符

(L)

算符是“l(fā)ink”的縮寫,表示該算符連接的檢索詞之間為從屬或限制關系,如一個為一級標題此,另一個為二級標題詞。限定檢索

p62限制檢索:是用于限定提問關鍵詞在數(shù)據庫記錄中出現(xiàn)的區(qū)域,控制檢索結果的相關性,是提高檢索效果的一種有效檢索方法。限定檢索為了縮小檢索范圍,可利用字段代碼來限制檢索詞出現(xiàn)的字段,以提高檢索速度和命中率。

如:riceinti(表示只在題目字段中查找文獻)

riceinde(只在主題詞中查找)

riceinab(只在文摘中查找)

au=Smith,J.C(查作者為Smith,J.C的文章)py=1998(只查1998年的文章)la=Chinese(只查語種為中文的文獻)信息檢索方法信息檢索原理

信息檢索(Informationretrieval)是指將信息按照一定的方式組織和存儲起來,并根據信息用戶的需要找出有關信息的過程和技術。信息檢索是用戶進行信息查詢和獲取的主要方式。

信息檢索包括信息存儲和信息檢索兩個部分信息檢索流程圖輸出一次信息信息特征檢索語言信息特征標識檢索結果信息需求檢索提問檢索提問標識分析標引標引輸入檢索信息檢索系統(tǒng)(工具)存儲過程檢索過程分析檢索原理:

檢索提問標識與存儲標引標識進行比較,兩者一致或信息標引的標識包含著檢索提問標識,則具有該標識的信息就從檢索系統(tǒng)輸出,輸出的信息就是檢索命中的信息。信息檢索步驟p14分析檢索課題確定檢索詞選擇檢索工具及數(shù)據庫選擇檢索方式、檢索途徑確定檢索式索取文獻第一步分析課題(1)明確檢索目的:

a關于某一個課題的系統(tǒng)詳盡的信息,包括掌握其歷史、現(xiàn)狀和發(fā)展。

b關于某個課題的最新信息。

c了解一些片斷信息。(3)明確檢索要求和檢索范圍b課題涉及的學科范圍c所需信息的數(shù)量、語種、年代范圍、文獻類型等具體指標a明確課題的主題或主要內容確定檢索詞選擇檢索工具或數(shù)據庫(全)(新)(準)(2)多途徑了解課題的背景第二步制定檢索策略(1)選擇檢索詞(2)選擇檢索工具或檢索系統(tǒng)及數(shù)據庫(3)選擇檢索方法(4)選擇檢索途徑(5)構造檢索式

檢索式是檢索策略的邏輯表達式,是用來表達用戶檢索提問的,由基于檢索概念產生的檢索詞和各種組配算符構成。構造檢索式以“中國艾滋病的流行病學研究”為例('hiv'+'艾滋病'+'AIDS'+'獲得性免疫缺陷綜合癥')*('流行病學'+'流行'+'發(fā)病率'+'發(fā)生率'+'患病率'+'死亡率')所以:一個檢索任務的執(zhí)行一般是有過程、按步驟地有序完成。檢索步驟的科學安排就是檢索策略。包括:分析檢索課題確定檢索詞確定檢索式選擇檢索工具及數(shù)據庫輸出結果或索取原始文獻檢索需求分析檢索課題制定檢索策略試檢索正式檢索索取原文不滿意信息檢索的基本過程①②③④⑤檢索課題:1985-2015中國艾滋病的流行病學研究例:分析課題:本研究的目的是進行全面、系統(tǒng)的文獻回顧和分析,綜合艾滋病的在中國的流行病學證據。分析艾滋病流行的規(guī)模和人口的影響高度異構的地理分布,優(yōu)化全國艾滋病毒反應,監(jiān)測和預防工作。檢索詞:中文數(shù)據庫使用

hiv艾滋病AIDS獲得性免疫缺陷綜合癥流行病學流行發(fā)病率發(fā)生率患病率死亡率外文數(shù)據庫使用HIVAIDS'humanimmunodeficiencyvirus''AcquiredImmuneDeficiencySyndrome'epidemiologymorbidityIncidence'prevalencerate'學科范圍:流行病學類文獻類型:國內文獻,國外文獻,期刊論文,會議文獻……分析課題例:檢索工具:1中國知網CNKI2維普期刊服務平臺3萬方數(shù)據服務平臺

例:1、Pubmed2、webofscience檢索途徑:篇名/關鍵詞/摘要……檢索表達式:('hiv'+'艾滋病'+'AIDS'+'獲得性免疫缺陷綜合癥')*('流行病學'+'流行'+'發(fā)病率'+'發(fā)生率'+'患病率'+'死亡率')

((HIVORaidsORhumanimmunodeficiencyvirusORacquiredimmunedeficiencysyndrome))AND(epidemiologyORmorbidityORincidenceorprevalencerate))ANDchina用戶向檢索系統(tǒng)提交檢索后,系統(tǒng)返回檢索的結果的有效程度評價檢索效果的常用兩個物理量是:查全率查全率是用來描述系統(tǒng)檢出相關文獻能力的一種尺度,是指檢索出的相關信息量與信息系統(tǒng)中的相關信息總量之比查準率查準率是用來描述檢索精確度的指標,是指檢索出的相關信息量和檢索出的信息總量之比

用戶相關性判斷系統(tǒng)相關性預報相關文獻非相關文獻總計被檢出文獻aba+b未檢出文獻cdc+d總計a+cb+da+b+c+d信息檢索效果p15例如:某一檢索系統(tǒng),有1000萬條數(shù)據,其中含有“濱州市環(huán)境保護與治理”的文獻2000條,在對該系統(tǒng)進行檢索時,共

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論