信息檢索重點(diǎn)2016_第1頁(yè)
信息檢索重點(diǎn)2016_第2頁(yè)
信息檢索重點(diǎn)2016_第3頁(yè)
信息檢索重點(diǎn)2016_第4頁(yè)
信息檢索重點(diǎn)2016_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

玉第一章緒論1、信息素養(yǎng)的概念、具體內(nèi)容(內(nèi)涵)信息素養(yǎng)的概念:信息素養(yǎng)又稱信息素質(zhì)、信息文化,它的本質(zhì)三信息全球化需要人們具備的一種基本能力。信息素養(yǎng)是一個(gè)含義廣泛而又不斷變化發(fā)展的綜合性概念。它不僅包括利用信息檢索工具和獲取信息資源的能力,還包括組織、加工處理信息、傳遞創(chuàng)造信息的能力,更重要的是能夠?qū)κ占降男畔⑦M(jìn)行有效評(píng)估,并將他們運(yùn)用于實(shí)際問題的解決和進(jìn)行創(chuàng)新性思維的綜合的信息能力。信息素養(yǎng)的具體內(nèi)容(內(nèi)涵):信息意識(shí)、信息知識(shí)、信息能力、信息道德。2:信息、知識(shí)、情報(bào)和文獻(xiàn)的定義、關(guān)系;信息的基本特征;情報(bào)的屬性;構(gòu)成文獻(xiàn)的基本要素。信息:信息的定義(P9):信息(Information)是物質(zhì)運(yùn)動(dòng)規(guī)律總和。信息是客觀事物狀態(tài)和運(yùn)動(dòng)特征的一種普遍形式,客觀世界中大量地存在、產(chǎn)生和傳遞著以這些方式表示出來的各種各樣的信息。信息的目的是用來“消除不確定的因素”。信息是自然界、人類社會(huì)以及思維活動(dòng)中普遍存在的現(xiàn)象,信息無處不在,無時(shí)不有。信息的特征(p9):客觀性、時(shí)效性、價(jià)值性、傳遞性、共享性、開發(fā)性。知識(shí):知識(shí)的定義(P10):知識(shí)是人類社會(huì)實(shí)踐經(jīng)驗(yàn)的總結(jié),是人類智慧的結(jié)晶,是人的大腦通過思維對(duì)客觀事物本質(zhì)與規(guī)律性的認(rèn)識(shí)和掌握。簡(jiǎn)單地說,知識(shí)就是經(jīng)過思維加工了的信息。*情報(bào):情報(bào)的定義(P11):情報(bào)是人們?yōu)榻鉀Q某一個(gè)特定的問題而搜索、傳遞有特定效用的知識(shí)或信息。情報(bào)是對(duì)特定的人而言的。對(duì)需要它的人而言是情報(bào),對(duì)不需要的人而言它只是信息與知識(shí)。情報(bào)的屬性(P11):知識(shí)性、傳遞性、效用性。文獻(xiàn):文獻(xiàn)的定義(P11):在存儲(chǔ)、檢索、利用或傳遞信息的過程中,可作為一個(gè)單元處理的,在載體內(nèi),載體上或依附載體而存儲(chǔ)有信息或數(shù)據(jù)的載體。凡是記錄有信息或知識(shí)的一切載體均為文獻(xiàn)。文獻(xiàn)的基本要素(缺一不可)(P11):知識(shí)內(nèi)容、記錄符號(hào)、物質(zhì)載體、記錄手段。*信息、知識(shí)、情報(bào)和文獻(xiàn)的關(guān)系(P11-12):信息、知識(shí)、情報(bào)和文獻(xiàn)四者之間是相輔相成的、既相互包含又獨(dú)立存在:關(guān)系:包含關(guān)系、轉(zhuǎn)化關(guān)系、交叉關(guān)系。3文獻(xiàn)信息資源:指人類用文字、圖形、符號(hào)、聲頻、視頻等方式記錄在各種載體上的信息資源,是信息傳播的重要手段,也是現(xiàn)代社會(huì)最常用、最重要的信息資源。4:一些文獻(xiàn)類型的特征號(hào)碼:ISBN:國(guó)際標(biāo)準(zhǔn)書號(hào)(InternationalStandardBookNumber),簡(jiǎn)稱ISBN,是專門為識(shí)別圖書(或獨(dú)立的出版物)等文獻(xiàn)而設(shè)計(jì)的國(guó)際編號(hào)。ISSN:ISSN(國(guó)際標(biāo)準(zhǔn)連續(xù)出版物編號(hào),InternationalStandardSerialNumber)是根據(jù)國(guó)際標(biāo)準(zhǔn)ISO3297制定的連續(xù)出版物國(guó)際標(biāo)準(zhǔn)編碼,其目的是使世界上每一種不同題名、不同版本的連續(xù)出版物都有一個(gè)國(guó)際性的唯一代碼標(biāo)識(shí)。CN:“CN”是國(guó)內(nèi)統(tǒng)一刊號(hào)的識(shí)別標(biāo)志。GB/T:GB/T是指推薦性國(guó)家標(biāo)準(zhǔn)(GB/T),"T"在此讀"推"。推薦性國(guó)標(biāo)是指生產(chǎn)、交換、使用等方面,通過經(jīng)濟(jì)手段或市場(chǎng)調(diào)節(jié),而自愿采用的國(guó)家標(biāo)準(zhǔn)。ISO:國(guó)際標(biāo)準(zhǔn)化組織(InternationalOrganizationforStandardization,ISO)簡(jiǎn)稱ISO,是一個(gè)全球性的非政府組織,是國(guó)際標(biāo)準(zhǔn)化領(lǐng)域中一個(gè)十分重要的組織。IEC:際電工委員會(huì)(IEC)成立于1906年,至2015年已有109年的歷史。它是世界上成立最早的國(guó)際性電工標(biāo)準(zhǔn)化機(jī)構(gòu),負(fù)責(zé)有關(guān)電氣工程和電子工程領(lǐng)域中的國(guó)際標(biāo)準(zhǔn)化工作。6:文獻(xiàn)的幾種劃分類型:⑴按物質(zhì)載體與記錄方式劃分(P15-16):手寫型信息資源、印刷型信息資源、縮微型信息資源、聲像型信息資源、機(jī)讀型信息資源。⑵按加工程度劃分(P16-17):①零次文獻(xiàn):未經(jīng)出版發(fā)行或未進(jìn)入社會(huì)交流的最原始的文獻(xiàn)(私人化的)eg:私人筆記、私人信件、手稿、實(shí)驗(yàn)記錄、工程圖紙、論文草稿、設(shè)計(jì)草稿②一次文獻(xiàn)(原始文獻(xiàn)):作者以本人的生產(chǎn)經(jīng)驗(yàn)、實(shí)踐或科研工作為基本素材創(chuàng)作、撰寫并首次公開發(fā)表的文獻(xiàn)。eg:個(gè)人專著、大多數(shù)的期刊論文、科技報(bào)告、專利說明書、會(huì)議論文③二次文獻(xiàn):具有報(bào)道和檢索作用,包括目錄、題錄、索引、文摘、機(jī)讀型書目數(shù)據(jù)庫(kù)④三次文獻(xiàn)(參考性文獻(xiàn)):綜述、專題述評(píng)、學(xué)科年度總結(jié)、進(jìn)展報(bào)告、數(shù)據(jù)手冊(cè)、百科全書、年鑒、名錄、圖錄、表譜、指南(參考工具書)⑶根據(jù)文獻(xiàn)出版形式和內(nèi)容區(qū)分(P17-26):圖書(按其用途可劃分為:閱讀性圖書、參考工具書、檢索工具書)、期刊、報(bào)紙、科技報(bào)告、學(xué)位論文、會(huì)議文獻(xiàn)、專利文獻(xiàn)、標(biāo)準(zhǔn)文獻(xiàn)、政府出版物、產(chǎn)品資料、技術(shù)檔案,共11種。特種文獻(xiàn)(灰色文獻(xiàn))7、圖書、期刊的類型及特點(diǎn)圖書閱讀性圖書:包括教科書、專著、文集、叢書等。參考工具書:供人們解決疑難問題或提供查閱參考的一定特殊類型的圖書,包括字典、詞典、百科全書、年鑒、手冊(cè)、名錄、圖錄、年表、歷表等。檢索工具書:以圖書形式刊行的,供人們查找一定范圍內(nèi)信息線索的出版物,包括書目、題錄、文摘等。它的特點(diǎn)是:工具書本身并不直接向讀者提供所需資料。而是提供資料的線索,使讀者依據(jù)這些線索,較方便地查找所需的情報(bào)信息。期刊學(xué)術(shù)性技術(shù)性期刊:主要刊登科學(xué)研究和生產(chǎn)方面的學(xué)術(shù)論文、實(shí)驗(yàn)報(bào)告、研究報(bào)告;臨床報(bào)告、會(huì)議論文等原始文獻(xiàn)。檢索性刊物:以期刊的形式出版的專供人們用于查找信息線索的一類刊物,如以期刊形式出版的目錄、題錄、文摘等。其他類型刊物:包括快報(bào)性刊物、資料性刊物、科普性刊物等。8種文獻(xiàn)的文獻(xiàn)類型代碼及參考文獻(xiàn)著錄格式文獻(xiàn)代碼參考文獻(xiàn)(即引文出處)的類型以單字母方式標(biāo)識(shí),具體如下:M——專著

C——論文集

N——報(bào)紙文章

J——期刊文章D——學(xué)位論文

R——報(bào)告

S——標(biāo)準(zhǔn)

P——專利1.期刊類【格式】[序號(hào)]作者.篇名[J].刊名,出版年份,卷號(hào)(期號(hào)):起止頁(yè)碼.【舉例】[1]周融,任志國(guó),楊尚雷,厲星星.對(duì)新形勢(shì)下畢業(yè)設(shè)計(jì)管理工作的思考與實(shí)踐[J].電氣電子教學(xué)學(xué)報(bào),2003(6):107-109.(來源出處)[2]夏魯惠.高等學(xué)校畢業(yè)設(shè)計(jì)(論文)教學(xué)情況調(diào)研報(bào)告[J].高等理科教育,2004(1):46-52.[3]Heider,E.R.&D.C.Oliver.Thestructureofcolorspaceinnamingandmemoryoftwolanguages[J].ForeignLanguageTeachingandResearch,1999,(3):62–67.2.專著類【格式】[序號(hào)]作者.書名[M].出版地:出版社,出版年份:起止頁(yè)碼.【舉例】[4]劉國(guó)鈞,王連成.圖書館史研究[M].北京:高等教育出版社,1979:15-18,31.[5]Gill,R.MasteringEnglishLiterature[M].London:Macmillan,1985:42-45.3.報(bào)紙類【格式】[序號(hào)]作者.篇名[N].報(bào)紙名,出版日期(版次).【舉例】[6]李大倫.經(jīng)濟(jì)全球化的重要性[N].光明日?qǐng)?bào),1998-12-27(3).[7]French,W.BetweenSilences:AVoicefromChina[N].AtlanticWeekly,1987-8-15(33).4.論文集【格式】[序號(hào)]作者.篇名[C].出版地:出版者,出版年份:起始頁(yè)碼.【舉例】[8]伍蠡甫.西方文論選[C].上海:上海譯文出版社,1979:12-17.[9]Spivak,G.“CantheSubalternSpeak?”[A].InC.Nelson&L.Grossberg(eds.).VictoryinLimbo:Imigism[C].Urbana:UniversityofIllinoisPress,1988,pp.271-313.[10]Almarza,G.G.Studentforeignlanguageteacher’sknowledgegrowth[A].InD.FreemanandJ.C.Richards(eds.).TeacherLearninginLanguageTeaching[C].NewYork:CambridgeUniversityPress.1996.pp.50-78.5.學(xué)位論文【格式】[序號(hào)]作者.篇名[D].出版地:保存者,出版年份:起始頁(yè)碼.【舉例】[11]張筑生.微分半動(dòng)力系統(tǒng)的不變集[D].北京:北京大學(xué)數(shù)學(xué)系數(shù)學(xué)研究所,1983:1-7.6.研究報(bào)告【格式】[序號(hào)]作者.篇名[R].出版地:出版者,出版年份:起始頁(yè)碼.【舉例】[12]馮西橋.核反應(yīng)堆壓力管道與壓力容器的LBB分析[R].北京:清華大學(xué)核能技術(shù)設(shè)計(jì)研究院,1997:9-10.7.專利【格式】[序號(hào)]專利所有者.題名[P].國(guó)別:專利號(hào),發(fā)布日期.【舉例】[13]姜錫洲.一種溫?zé)嵬夥笏幹苽浞桨竅P].中國(guó)專利:881056073,1989–07–26.8.標(biāo)準(zhǔn)【格式】[序號(hào)]標(biāo)準(zhǔn)編號(hào),標(biāo)準(zhǔn)名稱[S].【舉例】[14]GB/T16159—1996,漢語(yǔ)拼音正詞法基本規(guī)則[S].第二章1.信息檢索的含義P29廣義:包括信息存儲(chǔ)和檢索兩個(gè)過程。指運(yùn)用編好的檢索工具或檢索系統(tǒng),查找出滿足用戶要求的特定信息。狹義:指依據(jù)一定的方法,從已經(jīng)組織好的大量有關(guān)信息集合中,查找并獲取特定的相關(guān)信息的過程。2.信息檢索類型P30-31⑴按檢索手段劃分:a.手工檢索b.計(jì)算機(jī)檢索⑵按檢索的對(duì)象劃分:a.文獻(xiàn)檢索(書目檢索,全文檢索,引文分析檢索)(相關(guān)性)b.事實(shí)信息檢索(確定性)c.數(shù)據(jù)型信息檢索(確定性)d.聲頻與視頻檢索⑶依據(jù)數(shù)據(jù)格式和檢索技術(shù)的層次劃分A文本信息檢索B多媒體檢索C超文本檢索D超媒體檢索3.信息檢索系統(tǒng)和計(jì)算機(jī)檢索系統(tǒng)的構(gòu)成P32.P34a.信息檢索系統(tǒng)由檢索文檔(也稱檢索工具),檢索設(shè)備,系統(tǒng)規(guī)則和操作人員四個(gè)要素構(gòu)成。b.計(jì)算機(jī)檢索系統(tǒng)由硬件設(shè)備,軟件設(shè)備和數(shù)據(jù)庫(kù)三個(gè)部分組成。4數(shù)據(jù)庫(kù)結(jié)構(gòu)數(shù)據(jù)庫(kù)是計(jì)算機(jī)技術(shù)與信息檢索技術(shù)相結(jié)合的產(chǎn)物,是現(xiàn)代文獻(xiàn)信息資源管理的重要工具,不同的數(shù)據(jù)庫(kù)結(jié)構(gòu)各有不同,所提供的檢索途徑也有差異,但基本結(jié)構(gòu)都具有共同特征,主要由字段,記錄,文檔,幫助文件等組成。①字段是信息庫(kù)中最基本的信息單元,根據(jù)描述文獻(xiàn)特征的不同。可分為三類,存取號(hào)字段,基本索引字段,輔助索引字段。②記錄:是構(gòu)成數(shù)據(jù)庫(kù)的完整信息單元③文檔。一般由三個(gè)文檔組成。順排文檔(是數(shù)據(jù)庫(kù)核心文檔),倒排文檔,索引文檔。④幫助文件。每個(gè)數(shù)據(jù)庫(kù)都有幫助文件,使用戶了解數(shù)據(jù)庫(kù)的使用方法,及常見問題的解決方法。數(shù)據(jù)庫(kù)類型有參考型數(shù)據(jù)庫(kù)(書目數(shù)據(jù)庫(kù),事實(shí))源數(shù)據(jù)庫(kù)(數(shù)值型,圖像,術(shù)語(yǔ),)混合型數(shù)據(jù)庫(kù)(超文本,多媒體)5信息標(biāo)引標(biāo)引是指在文獻(xiàn)信息處理的過程中,將文獻(xiàn)的內(nèi)容特征和外部特征分析轉(zhuǎn)換成檢索標(biāo)識(shí)的過程,即對(duì)信息資源中具有檢索價(jià)值的特征信息,例如姓名,作者,主題內(nèi)容,類別等進(jìn)行提取與標(biāo)識(shí),并組織成索引文檔,為用戶的查詢和訪問提供準(zhǔn)確而有效的檢索入口。*6信息檢索原理信息檢索的全過程應(yīng)包括信息標(biāo)引(標(biāo)引是用分類號(hào),主題詞等檢索語(yǔ)言表示信息,通過對(duì)大量無序的信息資源進(jìn)行標(biāo)引處理,使之有序化,并按科學(xué)的方法儲(chǔ)存組成檢索系統(tǒng),這是組織檢索系統(tǒng)的過程)和存儲(chǔ)過程和信息的需求和檢索過程(分析用戶的信息需求,利用組織好的檢索系統(tǒng),按照系統(tǒng)提供的檢索方法和途徑檢索匹配信息,這是檢索系統(tǒng)的利用過程)。需求集合,信息集合,匹配和選擇檢索語(yǔ)言的概念:是標(biāo)引者與檢索者共同使用的約定語(yǔ)言。(1)用于描述信息系統(tǒng)中信息的內(nèi)容特征以及外部特征和表達(dá)用戶信息提問的人工語(yǔ)言,就是檢索語(yǔ)言。檢索語(yǔ)言是標(biāo)引語(yǔ)言也是索引語(yǔ)言。作用:①對(duì)信息的內(nèi)容加以標(biāo)引,揭示其外表特征和內(nèi)在內(nèi)容②對(duì)內(nèi)容相同或相關(guān)的信息加以集中或揭示其相關(guān)性③對(duì)大量信息加以系統(tǒng)化和程序化④便于用戶進(jìn)行類型:按規(guī)范化程度劃分:自然語(yǔ)言(未規(guī)范化語(yǔ)言)和受控語(yǔ)言(規(guī)范化語(yǔ)言)。按標(biāo)識(shí)的組配方法劃分:先組式語(yǔ)言(文獻(xiàn)標(biāo)識(shí)在編表時(shí)就固定組配好)和后組式語(yǔ)言(文獻(xiàn)標(biāo)識(shí)在檢索時(shí)才組配)。按表達(dá)信息的特征劃分:描述外部特征語(yǔ)言和描述內(nèi)容特征語(yǔ)言。主題語(yǔ)言按照選詞方式不同,可分為哪三種。可分為標(biāo)題詞語(yǔ)言、敘詞語(yǔ)言和關(guān)鍵詞語(yǔ)言。關(guān)鍵詞語(yǔ)言的特點(diǎn):隨意性大不受限制,抽取于文獻(xiàn)標(biāo)題、文摘和正文,專指度高,要是有實(shí)質(zhì)意義的詞9、主題檢索語(yǔ)言的特點(diǎn):(1)直觀性強(qiáng)(2)專指性強(qiáng)(3)靈活性強(qiáng)分類檢索語(yǔ)言(分類法):是按照學(xué)科范疇及知識(shí)之間的關(guān)系列出類目,并用數(shù)字、字母符號(hào)對(duì)類目進(jìn)行標(biāo)識(shí)的一種語(yǔ)言體系特點(diǎn):(1)分類語(yǔ)言是以文獻(xiàn)信息內(nèi)容所屬的學(xué)科性質(zhì)來劃分和集中文獻(xiàn),能夠較好地體現(xiàn)學(xué)科的系統(tǒng)性,便于人們從某學(xué)科或?qū)I(yè)的方面來查找文獻(xiàn)。(2)分類語(yǔ)言能夠較好地反映各個(gè)類目間的縱向?qū)哟侮P(guān)系。(3)分類語(yǔ)言是圖書館中圖書組織排架的依據(jù)。10、分類法有哪些?掌握中圖法體系結(jié)構(gòu)、標(biāo)記符號(hào)P43-44(1)分類法:《中國(guó)圖書館分類法》、《中國(guó)科學(xué)院圖書館圖書分類法》、《中國(guó)人民大學(xué)圖書館圖書分類法》、《杜威十進(jìn)分類法》(DDC)、《國(guó)際十進(jìn)分類法》(UDC)、《中國(guó)標(biāo)準(zhǔn)文獻(xiàn)分類法》、《國(guó)際標(biāo)準(zhǔn)分類法》(ICS)、《國(guó)際專利分類法》(IPC)等。(2)中圖法體系結(jié)構(gòu):5個(gè)基本部類(馬克思主義列寧主義毛澤東思想,哲學(xué),社會(huì)科學(xué),自然科學(xué),綜合性圖書)22個(gè)基本大類P43表格(3)標(biāo)記符號(hào):采用英文字母與阿拉伯?dāng)?shù)字相結(jié)合的混合制代碼,各個(gè)類目由大寫英文字母和數(shù)字組成的分類代碼和相應(yīng)的類名構(gòu)成。它用一個(gè)大寫英文字母標(biāo)記一個(gè)基本大類,通過字母的順序反映基本大類的序列,26個(gè)英文字母除了“MLWY”4個(gè)字母外的22個(gè)字母表示22個(gè)大類,在字母后用數(shù)字表示大類下的類目。索書號(hào):分類號(hào)/作者號(hào)計(jì)算機(jī)檢索基礎(chǔ)知識(shí)布爾邏輯算符作用與用法P48邏輯與(乘):“and”或“*”,交叉和限定關(guān)系??s小檢索范圍、提高查準(zhǔn)率邏輯或(和):“or”或“+”,并列關(guān)系,擴(kuò)大檢索范圍、提高查全率邏輯非(差):“not”或“﹣”,排除關(guān)系,縮小命中文獻(xiàn)范圍、提高專指度布爾邏輯算符執(zhí)行順序:同級(jí)從左到右,優(yōu)先順序是非>與>或,括號(hào)內(nèi)的先執(zhí)行(多括號(hào)時(shí)從最里面的括號(hào)開始執(zhí)行)2、截詞檢索(概念、截詞方式、作用);位置算符(with、Near的用法——(w)、(nW)、(N)、(Nn));字段限定檢索;短語(yǔ)檢索算符P49-54(1)截詞檢索:概念:指將檢索詞在合適的地方截?cái)?,取其中的詞干(詞片段)再加上截詞符號(hào)一起輸入檢索系統(tǒng),計(jì)算機(jī)按照截?cái)嗟脑~干(詞片段)與數(shù)據(jù)庫(kù)里的索引詞進(jìn)行比較匹配,凡包含這個(gè)詞干(片斷詞語(yǔ))的文獻(xiàn),均為命中文獻(xiàn)。截詞方式:按位置分,前截詞、后截詞、前后截詞、中間截詞;按截?cái)嘧址麛?shù)分,有限截詞、無限截詞。作用:(2)位置算符:(W):biological(W)control相當(dāng)于檢索biologicalcontrol(nW):wear(1W)material相當(dāng)于檢索wearmaterial、wearofmaterial等詞(N):robot(N)control相當(dāng)于檢索robotcontrol或controlrobot的文獻(xiàn)(nN):control(1N)system相當(dāng)于檢索controlsystem、controlofsystem、controlinsystem、systemofcontrol、systemwithoutcontrol等詞。字段限定檢索p53短語(yǔ)檢索算符3、信息檢索途徑的定義:檢索途徑是指利用信息的外部特征與內(nèi)容特征來查找所需信息的入口。常用信息檢索途徑:①分類途徑:檢索標(biāo)識(shí)是分類號(hào)、族性檢索②主題途徑:檢索標(biāo)識(shí)是主題詞、適合檢索內(nèi)容較具體專深③題名途徑④著者途徑⑤號(hào)碼途徑⑥其他途徑重點(diǎn)掌握主題途徑、分類途徑的用法、優(yōu)缺點(diǎn)、查全查準(zhǔn)比較:分類途徑是從信息所屬學(xué)科專業(yè)特征來檢索信息的途徑。用法:數(shù)據(jù)庫(kù)檢索用“分類檢索”中的類目名或字段檢索中的“分類號(hào)”來提供分類檢索途徑。使用分類途徑時(shí),需先熟悉檢索工具所用的分類法,正確確定課題所屬的分類號(hào)或類目名。優(yōu)點(diǎn):分類途徑能滿足從學(xué)科體系出發(fā)進(jìn)行族性檢索的需要缺點(diǎn):不適應(yīng)專指度高的主題、新興學(xué)科或跨學(xué)科主題的信息檢索。主題途徑是從信息主題內(nèi)容角度來檢索信息的途徑。用法:它以主題詞作為檢索標(biāo)識(shí),利用檢索書刊中的主題索引或關(guān)鍵詞索引、數(shù)據(jù)庫(kù)檢索中的主題詞字段檢索來提供主題檢索途徑。檢索時(shí)應(yīng)根據(jù)課題和具體的檢索工具來確定主題詞。優(yōu)點(diǎn):主題途徑適合檢索內(nèi)容較具體專深的內(nèi)容的信息,能滿足從主題概念出發(fā)進(jìn)行特性檢索的需要。缺點(diǎn):用戶使用時(shí)需注意了解掌握有關(guān)的主題詞表和關(guān)鍵詞的規(guī)范問題,才能選對(duì)選準(zhǔn)主題詞或關(guān)鍵詞。4、信息檢索流程:分析檢索需求,選擇檢索手段、選擇檢索工具,確定檢索途徑、選擇檢索詞,構(gòu)建檢索提問式,實(shí)施檢索并調(diào)整檢索提問式,輸出檢索結(jié)果。主題概念的選詞方法:①分析檢索課題,選取主題概念②確定檢索詞③選擇檢索詞須考慮的其他幾個(gè)注意點(diǎn)(1.注意常用術(shù)語(yǔ)的選用2.選擇檢索詞要全面3.注意同義詞或相關(guān)詞的選用4.不可忽視縮寫詞的選用5.注意所用檢索詞拼寫法的不同6.注意上位概念與下位概念的選用)同義詞的擴(kuò)展:學(xué)名或俗名,上位詞和下位詞,簡(jiǎn)稱與全程,術(shù)語(yǔ)與代碼等。檢索表達(dá)式的構(gòu)建:檢索表達(dá)式是指將選擇出的檢索詞,用布爾邏輯算符、截詞算符、位置算符以及系統(tǒng)規(guī)定的其他連接符號(hào)等,按檢索課題的具體需要進(jìn)行合理組配,形成表達(dá)具體信息需求的邏輯表達(dá)式。:一、搜索引擎的定義、種類定義:搜索引擎是查找互聯(lián)網(wǎng)上信息資源的工具,也稱網(wǎng)絡(luò)檢索工具。種類:分類檢索、關(guān)鍵詞檢索二、搜索引擎關(guān)鍵詞語(yǔ)法規(guī)則(布爾邏輯算符、截詞算符、字段限定檢索、鄰近符等)(一)布爾邏輯運(yùn)算符邏輯“與”:一般用“AND”谷歌用“空格”百度用“空格”或“*”邏輯“或”:谷歌用“OR”百度用“|”邏輯“非”:一般用“NOT”谷歌和百度用“-”(減號(hào)前必須留一個(gè)空格)截詞算符搜索引擎的截詞符一般采用星號(hào)(*)表示,且“*”只能置于檢索詞的末尾,不能用在檢索詞的開始和中間。截詞檢索可以使檢索詞輸入簡(jiǎn)化,并起到擴(kuò)大檢索范圍的作用。限定字段檢索標(biāo)題限定檢索標(biāo)題檢索就是在網(wǎng)頁(yè)的標(biāo)題中查找輸入的檢索詞格式:title:檢索式或intitle:檢索式文件類型限定檢索文件類型限定檢索指查出特定文件類型的相關(guān)結(jié)果格式:檢索式filetype:文件類型站點(diǎn)限定檢索把搜索范圍限定在已知站點(diǎn)格式:檢索式site:域名或網(wǎng)站inurl搜索對(duì)搜索結(jié)果的url做某種限定格式:檢索式inurl:URL中的詞鏈接檢索鏈接檢索就是在與特定網(wǎng)頁(yè)或域有鏈接的所有網(wǎng)頁(yè)中進(jìn)行檢索格式:link:特定網(wǎng)頁(yè)地址或域名中的詞鄰近符鄰近符(NEAR)用于檢索在一定區(qū)域范圍內(nèi)同時(shí)出現(xiàn)的檢索詞的文獻(xiàn),它指定了檢索詞之間的距離。例如:Computernear/10Network可查找出computer和Network兩次之間插入不大于10個(gè)單詞的文獻(xiàn)三、常用搜索引擎選介、如百度、谷歌檢索規(guī)則與技巧1、谷歌檢索規(guī)則與技巧:布爾邏輯算符:邏輯與用空格,邏輯或用大寫的or,邏輯非用減號(hào),邏輯關(guān)系優(yōu)先級(jí)用圓括號(hào)。文件類型:pdf.Microsoftoffice.shockwaveflash.postscript.當(dāng)有兩個(gè)以上檢索詞時(shí),且都限定在標(biāo)題時(shí),用allintitle命令比較好。只有一個(gè)檢索詞時(shí),可以選擇title命令。限定在網(wǎng)頁(yè)的url內(nèi)搜索指定內(nèi)容限定檢索的網(wǎng)站用site.2、百度檢索規(guī)則與技巧:布爾邏輯算符:邏輯與(空格或“*”)邏輯或(“∣”)邏輯非(“-”),“-”與前一個(gè)關(guān)鍵詞間應(yīng)有空格。文件類型filetype后的文件格式有doc.xls.ppt.pdf.rtf.all.用title和intitle限定在標(biāo)題檢索限定在網(wǎng)頁(yè)和網(wǎng)站的檢索同谷歌檢索。五、檢索平臺(tái)通用規(guī)則(掌握一個(gè)檢索平臺(tái)(或數(shù)據(jù)庫(kù)),可從哪幾個(gè)方面入手)P801、了解數(shù)據(jù)庫(kù)收錄文獻(xiàn)情況(學(xué)科、文獻(xiàn)類型)。2、了解數(shù)據(jù)庫(kù)平臺(tái)的資源組織方式,所提供的檢索方式(如快速檢索、高級(jí)檢索、分類檢索、專業(yè)檢索等)。3、掌握檢索系統(tǒng)的具體運(yùn)算符號(hào)(布爾邏輯符號(hào)的表達(dá)、字段限定符、截詞符、位置算符等)。4、詳細(xì)了解檢索結(jié)果提供的信息及其輸出。5、了解個(gè)性化服務(wù)功能。六、三大中文數(shù)據(jù)庫(kù)平臺(tái)運(yùn)算符配備情況P83中文三大數(shù)據(jù)庫(kù)平臺(tái)運(yùn)算符配備情況表運(yùn)算符維普CNKI萬方邏輯算符有有有截詞有(模糊、精確)有(模糊、精確)有(默認(rèn)為前后截詞,要精確用“”)字段限定符有(十四個(gè))有(不同庫(kù)配備不同)有(不同庫(kù)配備不同)位置算符無有無七、運(yùn)算符在維普數(shù)據(jù)庫(kù)平臺(tái)不同檢索方式中表現(xiàn)形式運(yùn)算符快速檢索高級(jí)檢索傳統(tǒng)檢索邏輯算符與在結(jié)果中搜索、下拉菜單“與”下拉菜單“與”、*下拉菜單“與”、*或在結(jié)果中添加、下拉菜單“或”下拉菜單“或”、+下拉菜單“或”、+非在結(jié)果中去除、下拉菜單“非”下拉菜單“非”、—下拉菜單“非”、—截詞默認(rèn)“模糊”默認(rèn)“模糊”下拉菜單選字段限定符下拉菜單選前綴、下拉菜單選前綴、下拉菜單選第五章Fulink平臺(tái)p90Cnkip95維普p106萬方p114Webofsciencep151第九章;檢索效率P295一、檢索效率評(píng)價(jià)信息檢索效率,常用查準(zhǔn)率與查全率兩項(xiàng)指標(biāo)查準(zhǔn)率是檢出的相關(guān)信息數(shù)量與檢出的全部信息總量的比率。普遍表示為:查準(zhǔn)率=(檢索出的相關(guān)信息量/檢索出的信息總量)x100%。查全率,檢出的相關(guān)信息數(shù)量與檢索系統(tǒng)中全部相關(guān)信息總量的比率。查全率=(檢索出的相關(guān)信息量/系統(tǒng)中的相關(guān)信息總量)x100%。漏檢率:指未檢出的相關(guān)信息數(shù)量與檢索系統(tǒng)中該種相關(guān)信息總量的比率。誤檢率:指檢驗(yàn)出的無關(guān)信息數(shù)量與檢出的全部信息總量的比率漏檢率=(未檢索出的相關(guān)信息量/系統(tǒng)中的相關(guān)信息總量)x100%。誤檢率=(檢出的無關(guān)信息量/檢出的全部信息總量)x100%。檢索效率評(píng)價(jià)指標(biāo)(查全率、查準(zhǔn)率)及相互關(guān)系(1)查全率和查準(zhǔn)率:評(píng)價(jià)信息檢索效率,常用查全率和查準(zhǔn)率兩項(xiàng)指標(biāo)。查全率:又稱檢全率、召回率,是指檢出的相關(guān)信息數(shù)量與檢索系統(tǒng)中全部相關(guān)信息總量的比率。查準(zhǔn)率:也稱檢準(zhǔn)率、精確率,是指檢出的相關(guān)信息數(shù)量與檢出的全部信息總量的比率。(2)相互關(guān)系:大量的檢索評(píng)價(jià)試驗(yàn)表明,查全率與查準(zhǔn)率之間存在著一種互逆關(guān)系。即在一個(gè)信息檢索系統(tǒng)中,當(dāng)查準(zhǔn)率和查全率達(dá)到一定程度以后,兩者就會(huì)呈現(xiàn)出非線性的互逆關(guān)系。即在同一次檢索中,采取措施,限制檢索條件,縮小檢索范圍,提高查準(zhǔn)率的同時(shí),查全率也會(huì)下降;反之,放寬檢索條件,擴(kuò)大檢索范圍以提高查全率的同時(shí),查準(zhǔn)率也會(huì)下降。圖形詳見書本296頁(yè)。查全率、查準(zhǔn)率的計(jì)算公式:查全率(R)=檢出的相關(guān)信息數(shù)量/檢索系統(tǒng)中全部相關(guān)信息總數(shù)=(a/a+c)*100%查準(zhǔn)率(P)=檢出的相關(guān)信息數(shù)量/檢出的全部信息總數(shù)=(a/a+b)*100%影響信息檢索效率的因素檢索詞的選取存在問題檢索限制過于嚴(yán)格或?qū)捤蓹z索關(guān)系的組配不準(zhǔn)確檢索詞與字段檢索配合不當(dāng)截詞使用不當(dāng)未能充分掌握數(shù)據(jù)庫(kù)的檢索特點(diǎn)提高信息檢索效果的主要措施提高查全率的方法1降低檢索詞的專指度,采用上位詞、擴(kuò)展詞。2選用主要概念、核心概念,排除次要概念,進(jìn)行檢索。3增加檢索詞的同義詞,近義詞,相關(guān)詞,充分挖掘隱含概念詞,使用邏輯或組配。4檢索

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論