文獻(xiàn)信息檢索課件_第1頁(yè)
文獻(xiàn)信息檢索課件_第2頁(yè)
文獻(xiàn)信息檢索課件_第3頁(yè)
文獻(xiàn)信息檢索課件_第4頁(yè)
文獻(xiàn)信息檢索課件_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(優(yōu)選)文獻(xiàn)信息檢索課件現(xiàn)在是1頁(yè)\一共有46頁(yè)\編輯于星期六第一節(jié)文獻(xiàn)信息檢索技術(shù)(一)檢索方式1、命令式檢索:用邏輯運(yùn)算符、位置算符及其他檢索符號(hào),把不同的檢索詞連接起來(lái)進(jìn)行檢索的一個(gè)種方式,如數(shù)據(jù)庫(kù)中的專(zhuān)業(yè)檢索。適用于專(zhuān)業(yè)人員。2、菜單式檢索:一種通過(guò)窗口菜單進(jìn)行檢索的簡(jiǎn)單、易操作的檢索方式。現(xiàn)各數(shù)據(jù)庫(kù)的高級(jí)檢索、初級(jí)檢索都屬于菜單式檢索,是最常用的檢索方式,適用于一般讀者檢索。3、導(dǎo)航檢索:點(diǎn)擊檢索界面上的超鏈接進(jìn)行檢索,也叫超鏈接檢索?,F(xiàn)在是2頁(yè)\一共有46頁(yè)\編輯于星期六現(xiàn)在是3頁(yè)\一共有46頁(yè)\編輯于星期六現(xiàn)在是4頁(yè)\一共有46頁(yè)\編輯于星期六現(xiàn)在是5頁(yè)\一共有46頁(yè)\編輯于星期六分類(lèi)途徑主題途徑關(guān)鍵詞途徑題名途徑責(zé)任者途徑引文途徑第二節(jié)檢索途徑與檢索語(yǔ)言P25-26

檢索途徑(檢索項(xiàng),檢索點(diǎn)、檢索入口)

1現(xiàn)在是6頁(yè)\一共有46頁(yè)\編輯于星期六2、檢索語(yǔ)言:用來(lái)描述檢索提問(wèn)主題、學(xué)科分類(lèi)等內(nèi)容的語(yǔ)言,它和檢索途徑是相對(duì)應(yīng)的。(P27)常見(jiàn)的檢索語(yǔ)言有主題語(yǔ)言和分類(lèi)語(yǔ)言。檢索語(yǔ)言的類(lèi)型表述文獻(xiàn)外表特征的語(yǔ)言表述文獻(xiàn)內(nèi)容特征的語(yǔ)言題名責(zé)任者代碼引文分類(lèi)法主題法現(xiàn)在是7頁(yè)\一共有46頁(yè)\編輯于星期六

主題詞是規(guī)范化的檢索語(yǔ)言,主題詞檢索途徑的檢索系統(tǒng)都有相應(yīng)的主題詞詞表,利用主題詞途徑標(biāo)引或檢索文獻(xiàn)時(shí),一定要先查對(duì)詞表,再進(jìn)行標(biāo)引或檢索。國(guó)內(nèi)中文主題詞表一般采用《中國(guó)主題詞表》或《中國(guó)圖書(shū)館圖書(shū)分類(lèi)主題詞表》,英文文獻(xiàn)檢索系統(tǒng)一般采用《美國(guó)國(guó)會(huì)圖書(shū)館標(biāo)題表》。

主題途徑現(xiàn)在是8頁(yè)\一共有46頁(yè)\編輯于星期六

根據(jù)分類(lèi)語(yǔ)言進(jìn)行檢索的途徑,它是一種按學(xué)科范疇和體系來(lái)劃分事物的檢索語(yǔ)言,以分類(lèi)表的形式體現(xiàn)。國(guó)內(nèi)文獻(xiàn)分類(lèi)一般使用《中國(guó)圖書(shū)館圖書(shū)分類(lèi)法》(簡(jiǎn)稱(chēng)《中圖法》).(P30)

專(zhuān)利使用《國(guó)際專(zhuān)利分類(lèi)法》(IPC)分類(lèi)。國(guó)外分類(lèi)法很多,比較常見(jiàn)的有《美國(guó)國(guó)會(huì)圖書(shū)館分類(lèi)法》(LC)、《國(guó)際十進(jìn)分類(lèi)法》等。分類(lèi)途徑現(xiàn)在是9頁(yè)\一共有46頁(yè)\編輯于星期六A馬克思主義、列寧主義、毛澤東思想B哲學(xué)C社會(huì)科學(xué)總論D政治、法律E軍事F經(jīng)濟(jì)G文化、科學(xué)、教育、體育H語(yǔ)言、文字I文學(xué)J藝術(shù)K歷史、地理N自然科學(xué)總論O數(shù)理科學(xué)和化學(xué)P天文學(xué),地球科學(xué)Q生物科學(xué)R醫(yī)藥、衛(wèi)生S農(nóng)業(yè)、林業(yè)T工業(yè)技術(shù)總論TB一般工業(yè)技術(shù)TD礦業(yè)工程TE石油、天然氣工業(yè)TF治金工業(yè)TG金屬學(xué)、金屬工藝TH機(jī)械、儀表工業(yè)TJ武器工業(yè)TK動(dòng)力工程TL原子能技術(shù)TM電工技術(shù)TN無(wú)線電電子學(xué)、電訊技術(shù)TP自動(dòng)化技術(shù)、計(jì)算技術(shù)TQ化學(xué)工業(yè)TS輕工業(yè)、手工業(yè)TU建筑科學(xué)TV水利工程U交通運(yùn)輸V航空、宇宙飛行X環(huán)境科學(xué)Z綜合性圖書(shū)中圖法分類(lèi)體系返回分類(lèi)途徑現(xiàn)在是10頁(yè)\一共有46頁(yè)\編輯于星期六

以關(guān)鍵詞進(jìn)行檢索的方式,關(guān)鍵詞又稱(chēng)自由詞,是從文獻(xiàn)的題名、摘要和正文中抽出的具有實(shí)際意義的非規(guī)范化自然語(yǔ)言。其優(yōu)點(diǎn)是:A、簡(jiǎn)捷,降低對(duì)檢索人員的要求;B、易用,易于計(jì)算機(jī)編制和檢索;C、及時(shí),能及時(shí)更新詞匯。關(guān)鍵詞途徑現(xiàn)在是11頁(yè)\一共有46頁(yè)\編輯于星期六缺點(diǎn):1、不規(guī)范,有大量的同義詞、近義詞,影響查全率和查準(zhǔn)率。如“高速公路”有”highway”“autoroute”,“freeway”,“speedway”,“thruway”等,“圖形圖像”和“圖形圖象”同義,檢索時(shí)如果不能全部記住,會(huì)出現(xiàn)漏檢;而“cell”既指細(xì)胞又指電池,檢索時(shí)會(huì)出現(xiàn)誤檢。2、詞匯量大,給存取帶來(lái)困難。由于關(guān)鍵詞是未經(jīng)人工干預(yù)的自然語(yǔ)言,符合大眾的檢索習(xí)慣,大多數(shù)檢索系統(tǒng)都有關(guān)鍵詞檢索?,F(xiàn)在是12頁(yè)\一共有46頁(yè)\編輯于星期六

題名途徑:根據(jù)文獻(xiàn)名稱(chēng)包括書(shū)名、刊名、論文篇名等來(lái)檢索文獻(xiàn)的途徑。責(zé)任者途徑:指根據(jù)已知文獻(xiàn)著者來(lái)查找文獻(xiàn)的途徑,包括個(gè)人著者和機(jī)關(guān)團(tuán)體。

引文途徑:從被引文獻(xiàn)去檢索引用文獻(xiàn)的檢索途徑?,F(xiàn)在是13頁(yè)\一共有46頁(yè)\編輯于星期六第三節(jié)計(jì)算機(jī)信息檢索技術(shù)(一)邏輯運(yùn)算符邏輯運(yùn)算符又稱(chēng)布爾算符,是用來(lái)表達(dá)各檢索詞之間的邏輯關(guān)系的符號(hào)。邏輯運(yùn)算符有“與”、“或”、“非”三種,分別用“and”、“or”、“not”來(lái)表示,也可以用“*”“+”“-”來(lái)表示?,F(xiàn)在是14頁(yè)\一共有46頁(yè)\編輯于星期六

1、邏輯“或”—————————————————AB用符號(hào)“or”或“+”表示,其邏輯表達(dá)式為:

AorB或A+B

其意義為檢索記錄中凡含有檢索詞A或檢索詞B,或同時(shí)含有檢索詞A和B的,均為命中文獻(xiàn)。

例:現(xiàn)在是15頁(yè)\一共有46頁(yè)\編輯于星期六

2、邏輯“與”————————————————AB用符號(hào)“and”或“*”表示,其邏輯表達(dá)式為:

A*B或AandB

其意義為檢索記錄中必須同時(shí)含有檢索詞A和B的文獻(xiàn),才算命中文獻(xiàn)。

例現(xiàn)在是16頁(yè)\一共有46頁(yè)\編輯于星期六

3、邏輯“非”

————————————————AB用符號(hào)“not”或“-”,其邏輯表達(dá)式為:

AnotB或A-B

其意義為:檢索記錄中含有檢索詞A,但不能含有檢索詞B的文獻(xiàn),才算命中文獻(xiàn)。例

現(xiàn)在是17頁(yè)\一共有46頁(yè)\編輯于星期六邏輯提問(wèn)式(布爾邏輯組配):計(jì)算機(jī)檢索的基本技術(shù),主要通過(guò)邏輯運(yùn)算符(布爾算符)“與(and,*)”、“或(or,+)”、“非(not,-)”等將檢索詞連接的提問(wèn)式。注意:優(yōu)先級(jí)為not,

and,

or,用括號(hào)保證優(yōu)先權(quán);運(yùn)算符兩側(cè)必須各有一個(gè)空格(半角)?,F(xiàn)在是18頁(yè)\一共有46頁(yè)\編輯于星期六實(shí)例:膜法提取甘露醇中的微生物污染控制(膜法+膜集成)*甘露醇*(細(xì)菌污染+微生物污染)

寫(xiě)出以下檢索詞,并用上述布爾邏輯符寫(xiě)出檢索式:固氮和固碳的生化機(jī)理或基因機(jī)制

現(xiàn)在是19頁(yè)\一共有46頁(yè)\編輯于星期六

在檢索詞之間使用,規(guī)定算符兩邊的檢索詞出現(xiàn)在記錄中的的位置,以提高檢準(zhǔn)率。比如:如果不用with位置算符,則詞組可能被系統(tǒng)識(shí)別為邏輯運(yùn)算,proteindisulfideisomerase(蛋白質(zhì)二硫鍵異構(gòu)酶)可能被識(shí)別成“proteinANDdisulfideANDisomerase”。尤其是出現(xiàn)數(shù)字等符號(hào)時(shí)不易識(shí)別成詞組。(二)、位置算符現(xiàn)在是20頁(yè)\一共有46頁(yè)\編輯于星期六常見(jiàn)的位置算符如下:位置算符表示方法說(shuō)明with(W)或()兩個(gè)詞在命中結(jié)果中相鄰(可有空格、標(biāo)點(diǎn)和連字符),詞序不得顛倒。(nW)兩個(gè)詞之間最多可夾入n個(gè)詞,詞序不得顛倒。near(N)兩個(gè)詞在命中結(jié)果中相鄰,詞序可顛倒。(nN)兩個(gè)詞之間最多可夾入n個(gè)詞,詞序可顛倒。field(F)兩個(gè)詞在同一字段出現(xiàn),位置不固定。subfield(S)兩個(gè)詞在同一子字段出現(xiàn),位置不固定。link(L)兩個(gè)詞在同一規(guī)范詞單元內(nèi)出現(xiàn),位置不固定?,F(xiàn)在是21頁(yè)\一共有46頁(yè)\編輯于星期六(三)、通配符(截詞檢索)

截詞檢索,就是將截詞符如“*”、“?”等等,放在檢索詞中檢索者認(rèn)為合適的地方截?cái)?,用截?cái)嗟脑~的一個(gè)局部進(jìn)行檢索,并認(rèn)為凡滿(mǎn)足這個(gè)詞局部中的所有字符(串)的文獻(xiàn),都為命中文獻(xiàn)。多用于外文檢索,因?yàn)槲魑恼Z(yǔ)言的特點(diǎn)是構(gòu)詞靈活,在詞干上前綴或后綴就可以派生出許多新的詞匯。

檢索詞的詞干后(前)加一個(gè)“?”(有的系統(tǒng)為加*),表示詞干后(前)可以有任意個(gè)字符。如“apple?”可代替(apple+apples+apple-pie+applesauce);現(xiàn)在是22頁(yè)\一共有46頁(yè)\編輯于星期六由于文字結(jié)構(gòu)方面的原因,中文檢索系統(tǒng)極少使用通配符進(jìn)行截詞。椰殼制備高比表面積活性炭,椰殼可能表達(dá)為椰子殼,可以用“(椰子殼十椰殼)*高比表面積活性炭”,或直接用“椰*高比表面積活性炭”現(xiàn)在是23頁(yè)\一共有46頁(yè)\編輯于星期六(四)、禁用詞在絕大多數(shù)的檢索系統(tǒng)中,介詞、代詞、等單獨(dú)使用無(wú)實(shí)際意義的詞以及使用頻率很高的詞不能作為檢索詞,被稱(chēng)為禁用詞,如an,and,by,for,from,of,the,to,with等等?,F(xiàn)在是24頁(yè)\一共有46頁(yè)\編輯于星期六(五)、限制檢索(檢索途徑)在命令式檢索中,通常要用字段代碼來(lái)限定檢索的字段,不同的數(shù)據(jù)庫(kù)使用的字段代碼略有不同。

現(xiàn)在是25頁(yè)\一共有46頁(yè)\編輯于星期六六加權(quán)檢索是一種定量檢索技術(shù):在每個(gè)提問(wèn)詞后面給定一個(gè)數(shù)值表示其重要程度,這個(gè)數(shù)值稱(chēng)為權(quán),在檢索時(shí)先查找這些詞在記錄中是否存在,然后計(jì)算存在的權(quán)值總和,權(quán)值之和達(dá)到或超過(guò)給定閾值,該記錄即為命中記錄?,F(xiàn)在是26頁(yè)\一共有46頁(yè)\編輯于星期六七聚類(lèi)檢索把相似度較高的文獻(xiàn)集中在一起形成一個(gè)個(gè)的文獻(xiàn)類(lèi)的檢索技術(shù)?,F(xiàn)在是27頁(yè)\一共有46頁(yè)\編輯于星期六八、匹配方式P37-38前方一致:檢出文獻(xiàn)的相關(guān)字段前方和檢索詞一致,如:檢索詞為“世界貿(mào)易組織”,可檢出《世界貿(mào)易組織概論》,檢不出《大學(xué)世界貿(mào)易組織教程》精確檢索:表示檢索詞和檢出文獻(xiàn)的相關(guān)字段完全一致,如檢索詞為“世界貿(mào)易組織”,可檢出《世界貿(mào)易組織》,檢不出《大學(xué)世界貿(mào)易組織教程》和《世界貿(mào)易組織概論》模糊檢索:包含關(guān)系,檢索詞可以在相關(guān)字段的任何位置。這是最常見(jiàn)的匹配方式?,F(xiàn)在是28頁(yè)\一共有46頁(yè)\編輯于星期六在許多檢索系統(tǒng)中(CNKI、萬(wàn)方、搜索引擎),精確檢索表示包含關(guān)系,即檢索詞不被切分,包含在相關(guān)字段的任何位置,與前述的模糊檢索相同。模糊檢索表示自動(dòng)分詞檢索?,F(xiàn)在是29頁(yè)\一共有46頁(yè)\編輯于星期六分析檢索課題選擇工具確定檢索詞編制檢索式顯示及判斷檢索結(jié)果獲取原始文獻(xiàn)文獻(xiàn)閱讀和分析評(píng)價(jià)輸出檢索結(jié)果否不滿(mǎn)意是滿(mǎn)意第四節(jié)檢索步驟

現(xiàn)在是30頁(yè)\一共有46頁(yè)\編輯于星期六

普查型:需要全面收集有關(guān)某一主題的文獻(xiàn)資料,如以課題開(kāi)題、教材編寫(xiě)等。具有普查、回溯的特點(diǎn),要求盡可能高的查全率。

攻關(guān)型:需要收集有關(guān)某一主題某一特定方面的文獻(xiàn),其目的在于解決科研、生產(chǎn)中的關(guān)鍵問(wèn)題,這類(lèi)需求不強(qiáng)調(diào)查詢(xún)的文獻(xiàn)數(shù)量,但需要查得的文獻(xiàn)具有較強(qiáng)的專(zhuān)指性。

學(xué)習(xí)型:需要了解掌握某一領(lǐng)域的研究動(dòng)向、研究成果或相關(guān)知識(shí),要求查到的文獻(xiàn)具有新穎及時(shí)的特點(diǎn),而對(duì)查全率和查準(zhǔn)率不一定有很高的要求。

1、課題分析現(xiàn)在是31頁(yè)\一共有46頁(yè)\編輯于星期六2、選擇檢索工具全面性:即是否與課題相關(guān)的內(nèi)容都要檢索,包括的工具有一次文獻(xiàn)和二次文獻(xiàn)數(shù)據(jù)庫(kù),以及網(wǎng)上相關(guān)資源等。針對(duì)性:保證選擇的檢索工具與檢索課題的學(xué)科一致專(zhuān)業(yè)性:即選擇與學(xué)科專(zhuān)業(yè)相關(guān)的工具,特別注意跨學(xué)科領(lǐng)域內(nèi)容權(quán)威性:盡量選用該學(xué)科的權(quán)威性檢索工具現(xiàn)在是32頁(yè)\一共有46頁(yè)\編輯于星期六提取檢索詞時(shí)要注意切分句子或詞組、刪除多余詞、替換模糊詞、補(bǔ)充合理邏輯。選擇規(guī)范化的檢索詞;使用各學(xué)科在國(guó)際上通用的、國(guó)外文獻(xiàn)中出現(xiàn)過(guò)的術(shù)語(yǔ)作檢索詞;找出課題涉及的隱性主題概念作檢索詞;選擇課題核心概念作檢索詞;注意檢索詞的縮寫(xiě)詞、詞形變化以及英美的不同拼法;聯(lián)機(jī)方式確定檢索詞。例:土豆——馬鈴薯,世界貿(mào)易組織——WorldTradeOrganization、WTO3、確定檢索詞現(xiàn)在是33頁(yè)\一共有46頁(yè)\編輯于星期六根據(jù)檢索目的選詞。如“個(gè)性化推薦系統(tǒng)”,我們要弄清是電子商務(wù)中的推薦系統(tǒng),還是其他方面的個(gè)性化推薦系統(tǒng)。合理切分句子或詞組,切不可用句子作為檢索詞,盡量不用短語(yǔ)作檢索詞。一些非規(guī)范的詞組也要進(jìn)行合理切分。如:紅辣椒,可切分為紅*辣椒,因?yàn)榭赡軙?huì)檢出紅色辣椒。但活性炭則不可切分為活性*炭,因?yàn)檫@是不可分的規(guī)范詞。

考慮相應(yīng)的同義詞。對(duì)同一事物,人們對(duì)其有不同的稱(chēng)呼和表達(dá),如“計(jì)算機(jī)”又稱(chēng)“電腦”、“圖形圖像與圖形圖象”要用邏輯或進(jìn)行檢索。現(xiàn)在是34頁(yè)\一共有46頁(yè)\編輯于星期六上位詞、下位詞:檢索詞有上位詞下位詞之分,一般來(lái)說(shuō),如果檢索上位詞,要同時(shí)檢索下位詞,如在EBSCO中,我們檢索“芭蕾舞服裝(balletcostume)”,必須同時(shí)檢索“芭蕾舞裙(balletskirt)”、“芭蕾舞鞋(toeshoe)”,才能得到滿(mǎn)意的查全率。當(dāng)然,如果下位詞太多,則不能全部選擇。如果下位詞檢索效果不理想,也可以在上位詞中檢索。海南黃花梨病蟲(chóng)害防治,沒(méi)有專(zhuān)門(mén)的書(shū),但在《景觀植物病蟲(chóng)害防治》一書(shū)中有一節(jié)專(zhuān)門(mén)論述。不同外來(lái)詞譯法的變化:如:“歐幾里德”、“歐幾里得”、“歐基里德”、“歐幾理德”、“Euclid”。“aspirin”、“阿斯匹林”,“阿司匹林”,“乙酰水楊酸”?,F(xiàn)在是35頁(yè)\一共有46頁(yè)\編輯于星期六例:苯胺的烷基化反應(yīng)催化劑研究

檢索式:苯胺*烷基化*催化劑(37篇)詞表——烷基化

F甲基化

乙基化

修訂后檢索式:苯胺*(烷基化+甲基化+乙基化)*催化劑(61篇)

現(xiàn)在是36頁(yè)\一共有46頁(yè)\編輯于星期六4選擇檢索途徑現(xiàn)在是37頁(yè)\一共有46頁(yè)\編輯于星期六

檢索式:又稱(chēng)檢索策略,由檢索詞和各種布爾邏輯算符、位置算符、截詞算符等組成。在命令式檢索中可根據(jù)檢索式進(jìn)行高級(jí)組配檢索。檢索式可一次完成,也可分步完成,檢索式的表達(dá)對(duì)一個(gè)課題不是唯一的,有多種選擇、組配、限定。

5、制定檢索式現(xiàn)在是38頁(yè)\一共有46頁(yè)\編輯于星期六例1:查找“科技英語(yǔ)寫(xiě)作”的文獻(xiàn)(1)分析課題,確定學(xué)科范圍;(2)選擇數(shù)據(jù)庫(kù):CNKI(3)確定關(guān)鍵詞:科技、英語(yǔ)、寫(xiě)作(4)檢索式:科技*英語(yǔ)*寫(xiě)作例2:化妝品檢測(cè)方面的文獻(xiàn)(1)分析課題,確定學(xué)科范圍;(2)選擇數(shù)據(jù)庫(kù):CNKI(3)確定主題詞:化妝品、分析、檢測(cè)、測(cè)定等。(4)檢索式:化妝品*(分析+檢測(cè)+測(cè)定)現(xiàn)在是39頁(yè)\一共有46頁(yè)\編輯于星期六例1:查找“造紙廢水處理技術(shù)”的外文文獻(xiàn)A、抽詞:造紙(papermaking,paperpulp)廢水(wastewater)處理(treat,treatmen

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論