




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、信息檢索技術(shù)基礎(chǔ)信息檢索與利用1主要內(nèi)容2.1 信息檢索語(yǔ)言2.2 信息檢索技術(shù)2.3 檢索效果評(píng)價(jià)2.4 檢索詞的確定2.5 信息檢索策略及策略式2.6 信息檢索步驟2.7 科技查新2檢索語(yǔ)言:在信息的存儲(chǔ)和檢索過(guò)程中,為使信息在用戶(hù)和系統(tǒng)間有效傳遞,各種檢索工具使用專(zhuān)門(mén)的語(yǔ)言體系來(lái)描述信息的內(nèi)部特征和外部特征,同時(shí)要求用戶(hù)依此構(gòu)造檢索提問(wèn)式來(lái)進(jìn)行信息檢索,這種專(zhuān)門(mén)的語(yǔ)言體系成為檢索語(yǔ)言。2.1 信息檢索語(yǔ)言3檢索語(yǔ)言描述文獻(xiàn)內(nèi)容特征分類(lèi)語(yǔ)言主題語(yǔ)言描述文獻(xiàn)外表特征題名(書(shū)名、刊名、篇名)著者出版事項(xiàng)代碼/序號(hào)關(guān)鍵詞語(yǔ)言敘詞語(yǔ)言標(biāo)題詞語(yǔ)言2.1 信息檢索語(yǔ)言單元詞語(yǔ)言4主題語(yǔ)言(內(nèi)容特征)按
2、照主題性質(zhì)的不同可分為:標(biāo)題詞單元詞敘詞關(guān)鍵詞2.1 信息檢索語(yǔ)言5標(biāo)題詞語(yǔ)言:是表征文獻(xiàn)內(nèi)容特征的、經(jīng)過(guò)規(guī)范化處理的名詞術(shù)語(yǔ)(包括詞和短語(yǔ))。 例如:飛機(jī):plane、airplane、aeroplane aircraft 用aircraft來(lái)表示所有“飛機(jī)”概念,以此作為規(guī)范詞.使用aircraft一詞的檢索結(jié)果將包括全部有飛機(jī)概念的文獻(xiàn).單元詞:指從信息內(nèi)容中抽出的最基本的詞匯。關(guān)鍵詞語(yǔ)言:關(guān)鍵詞是從文題、文摘或正文中抽出,具有實(shí)質(zhì)意義,能夠代表文獻(xiàn)內(nèi)容主題的名詞術(shù)語(yǔ)。關(guān)鍵詞可直接用于文獻(xiàn)標(biāo)引。2.1 信息檢索語(yǔ)言6敘詞語(yǔ)言 敘詞:指從信息的內(nèi)容中抽出的、能概括表達(dá)信息內(nèi)容基本概念的名詞
3、或術(shù)語(yǔ),它是經(jīng)規(guī)范化處理的自然語(yǔ)言詞匯。敘詞受敘詞表控制,有組配功能。 通常使用的敘詞表有:國(guó)內(nèi)漢語(yǔ)主題詞表,英國(guó)科學(xué)文摘使用的INSPEC Thesaurus,美國(guó)工程索引使用的Ei Thesaurus等。 運(yùn)輸飛機(jī)設(shè)計(jì)運(yùn)輸飛機(jī)設(shè)計(jì)運(yùn)輸飛機(jī)飛機(jī)設(shè)計(jì)7EI(Thesaurus)8作用檢索詞用來(lái)組織信息(信息工作者)對(duì)文獻(xiàn)信息內(nèi)容進(jìn)行標(biāo)引;對(duì)內(nèi)容相同或相關(guān)的信息加以集中或揭示其相關(guān)性;對(duì)信息進(jìn)行系統(tǒng)化、有序化;檢索詞用于檢索(檢索用戶(hù))進(jìn)行主題檢索進(jìn)行分類(lèi)檢索進(jìn)行外表特征檢索檢索詞是信息資源組織與檢索者檢索提問(wèn)的橋梁,在數(shù)據(jù)庫(kù)中,對(duì)應(yīng)為檢索點(diǎn)、檢索入口2.1 信息檢索語(yǔ)言9對(duì)文獻(xiàn)信息內(nèi)容進(jìn)行標(biāo)引
4、特征1特征2特征3特征4特征5特征n10字段名數(shù)據(jù)庫(kù)中文獻(xiàn)的記錄方式112.2.1 布爾邏輯2.2.2 截詞檢索2.2.3 限制檢索2.2.4 位置邏輯2.2.5 檢索策略式2.2 信息檢索技術(shù)12在進(jìn)行信息檢索時(shí),檢索項(xiàng)之間概念有相交關(guān)系、同義關(guān)系或相關(guān)關(guān)系,這時(shí)采用布爾邏輯進(jìn)行檢索項(xiàng)之間的邏輯組配。用“與”(AND)、“或”(OR)、“非”(NOT)來(lái)表達(dá)。2.2.1 布爾邏輯檢索13布爾邏輯檢索:在進(jìn)行信息檢索時(shí),檢索項(xiàng)之間概念有相交關(guān)系、同義關(guān)系或相關(guān)關(guān)系,這時(shí)采用布爾邏輯進(jìn)行檢索項(xiàng)之間的邏輯組配。 布爾邏輯算符有三種: 邏輯與、邏輯或、邏輯非用“與”(AND)、“或”(OR)、“非”
5、(NOT)來(lái)表達(dá)。2.2.1 布爾邏輯14邏輯“與”在計(jì)算機(jī)信息檢索時(shí),“與”用于表示概念的交叉、限定關(guān)系邏輯符號(hào):and、還可用空格表示表達(dá)形式:A and B、 A * B 、或 A B具有縮小檢索范圍和提高專(zhuān)指性的功能。例: computer and control (SCI) computer*control (Dialog) computer control (Google) AB15邏輯或邏輯“或”算符,用來(lái)表示概念的并列、平行、等同關(guān)系代表符號(hào):“or”、“”表達(dá)形式:A OR B 或 A + B具有擴(kuò)大檢索范圍,減少漏檢的功能。例:AIRPLANE OR AIRCRAFT (G
6、oogle) 或 AIRPLANE+AIRCRAFTAB16邏輯“非”算符,是具有概念包含關(guān)系的一種組配,可以從原檢索范圍中排除某一內(nèi)容。 表達(dá)形式:A not B、A-B具有縮小命中范圍,提高查準(zhǔn)率,增強(qiáng)檢索的專(zhuān)指性,減少輸出量的作用。 例:Energy not nuclear邏輯非AB17布爾邏輯檢索技術(shù)邏輯或(OR): 擴(kuò)大檢索范圍,有利于提高查全率。邏輯與(AND):縮小檢索范圍,有利于提高查準(zhǔn)率。邏輯非(NOT):縮小檢索范圍,有利于提高查準(zhǔn)率。ABAB邏輯與A*B 邏輯或A+B邏輯非 A - BAB18運(yùn)用“布爾算符”的注意事項(xiàng): 布爾邏輯運(yùn)算符運(yùn)算順序?yàn)椋?notandor 運(yùn)算
7、符遵循數(shù)學(xué)運(yùn)算法則; (a) 括號(hào)優(yōu)先;(A or B) and C not D (b) 在檢索式中只有and或or前后的檢索標(biāo)識(shí)可 以交換; (c) 檢索式中有not時(shí)前后檢索詞不能交換。 備注: ( )必須在半角和英文狀態(tài)下輸入 2.2.1 布爾邏輯19布爾邏輯檢索表達(dá)式的特點(diǎn)布爾檢索表達(dá)式式目前信息檢索系統(tǒng)中使用最多的一種方法。優(yōu)點(diǎn):表現(xiàn)直觀清晰,方便擴(kuò)檢和縮檢。易于計(jì)算機(jī)實(shí)現(xiàn)。缺點(diǎn):沒(méi)有反映文獻(xiàn)內(nèi)容(或信息需求)所涉及的多個(gè)概念的相對(duì)重要性。沒(méi)有反應(yīng)概念之間的內(nèi)在語(yǔ)義關(guān)系。20 寫(xiě)出下圖的布爾邏輯檢索式21截詞(truncation):是指檢索者將檢索詞在認(rèn)為比較合適的地方截?cái)?,也稱(chēng)模
8、糊檢索,又稱(chēng)詞干檢索法截詞檢索,用截?cái)嗟脑~的一個(gè)局部進(jìn)行的檢索即利用檢索詞的詞干加上截詞符號(hào)去數(shù)據(jù)庫(kù)中進(jìn)行檢索。(模糊檢索)截詞符號(hào):一般為“?”或 “*” 。各種檢索系統(tǒng)有不同規(guī)定,沒(méi)有統(tǒng)一標(biāo)準(zhǔn)。截詞符具有“OR ”運(yùn)算符的功能,能夠擴(kuò)大檢索范圍,而且減少了輸入檢索詞的時(shí)間,節(jié)約了機(jī)時(shí)。2.2.2 截詞檢索22截詞的分類(lèi)按位置分類(lèi): 前截詞 中間截詞 后截詞按取代數(shù)量分: 有限截詞 無(wú)限截詞 23后截詞,也稱(chēng)前方一致。它是將截詞符放在一串字符的后面,用以表示以相同字符串開(kāi)頭,而結(jié)尾不同的所有詞。詞尾的有限截?cái)嘞嗤址罂赡茏兓粋€(gè)字符時(shí),則在其后使用一個(gè)“?” ,常用來(lái)表示檢索詞的單復(fù)數(shù)變
9、化。 例如用system? 可以查出sytem 和systems 的文獻(xiàn)。相同字符串后可能變化兩個(gè)以上字符時(shí),則在其后連續(xù)使用若干個(gè)“?”代替可能變化的字符。例如,?表示兩個(gè)字符,?表示三個(gè)字符,以此類(lèi)推如表示九十年代;199?如表示20世紀(jì):19?后截詞24詞尾的無(wú)限截?cái)嘞嗤址罂赡茏兓魏巫址畷r(shí),則在其后使用一個(gè)“?”或“*”。這種方法可以查找出含有相同字符串的所有檢索詞。例如,comput*可查出compute ,computer , computing ,computation ,computerisation 等如physic*可檢出: physical, physic , p
10、hysicalism physician, physicists, physicochenistry, physics 等.即相當(dāng)于為上述各檢索詞的邏輯 OR運(yùn)算后截詞25中間截詞:可變化的字符出現(xiàn)在單詞的中間位置。例如:“woman ”和“women ”,可用“wom?n”代替;“defence ”和“defense”可用“defen?e”代替。查找英美不同拼法最有效中間截詞26前截?cái)啵簩⒔卦~符號(hào)放在一個(gè)字符串的左方是后方一致的檢索。 例如: *physics 可檢 physics、astrophysics 、biophysics. *Chem* 可檢 chemical,electroche
11、mic,chemistry, thermochemistry.很少使用前截?cái)?7 *Ei Village,Web of Science, Elsevier,EBSCO Janes 航空數(shù)據(jù)庫(kù) ?PQDD , INSPEC ,Dialog 截 詞28限制檢索是限定檢索詞出現(xiàn)在數(shù)據(jù)庫(kù)記錄中某一字段范圍的一種檢索技術(shù)。檢索時(shí),系統(tǒng)只對(duì)指定字段進(jìn)行匹配運(yùn)算,提高了效率和查準(zhǔn)率?;緳z索字段 標(biāo)題、文摘、敘詞、自由標(biāo)引詞 Title 、abstract 、 descriptor、 identifier輔助檢索字段 作者、刊名、語(yǔ)種、年代、專(zhuān)利號(hào)等 author、 journal 、language 、p
12、ublication year、 patent number2.2.3 限制檢索29字段檢索常用代碼30 目前各個(gè)檢索系統(tǒng)所設(shè)立的字段是各不相同的,即同一字段,也可能采用不同的字段代碼表示。如題名字段 Ei中,用 highway transport* within TI 來(lái)表示; OCLC Firstsearch 中,用 TI: highway transport* 來(lái)表示。 在進(jìn)行字段檢索時(shí),應(yīng)先看一下該數(shù)據(jù)庫(kù)的使用指南。例: Ei CPX Web 網(wǎng)絡(luò)版數(shù)據(jù)庫(kù)主要字段的字段代碼如下: CV Ei敘詞表受控語(yǔ) TI 題名 AB 文摘 AU 著者姓 AF 著者機(jī)構(gòu)名稱(chēng) ST 連續(xù)出版物名稱(chēng) P
13、N 出版時(shí)間注意31例:檢索2005年以后在情報(bào)學(xué)報(bào)上發(fā)表的有關(guān)信息價(jià)值計(jì)算方法的文獻(xiàn)限定范圍:2005以后 ;情報(bào)學(xué)報(bào)檢索詞:信息價(jià)值、計(jì)算時(shí)間上的限定,有“”、“”、“”、“=”、“=”。例如:PY=2004表示檢索2004年以來(lái)(包括2004)發(fā)表的文獻(xiàn)。檢索式: (年=2005)*(刊名=情報(bào)學(xué)報(bào))*(主題=信息價(jià)值*計(jì)算)323334Search within a specific field using wn test bed wn ALL AND atm networks wn TI(window wn TI AND sapphire wn TI) OR Sakamoto, K*
14、 wn AU35利用位置算符來(lái)表示檢索詞之間的位置關(guān)系,以實(shí)現(xiàn)位置邏輯檢索功能。特征這是一種可以不依賴(lài)主題詞表而直接使用自由詞進(jìn)行檢索的技術(shù)方法??杀磉_(dá)復(fù)合內(nèi)容屬于提高專(zhuān)指度的方法引入位置算符的目的是增加檢索式的靈活性,表達(dá)復(fù)雜專(zhuān)深的概念,從而提高檢索的專(zhuān)指度,彌補(bǔ)布爾邏輯算符難以表達(dá)某些復(fù)雜提問(wèn)的不足。2.2.4 位置邏輯36分類(lèi):記錄級(jí)檢索:要求檢索詞在同一記錄中有 L字段級(jí)檢索:要求檢索詞在同一字段中,有 F子字段或自然句級(jí)檢索:要求檢索詞出現(xiàn)在同一子字段或同一自然句中,有 S,詞位置檢索:要求詞之間相互位置滿(mǎn)足某些條件,有W, NW, N. nN 等2.2.4 位置邏輯37(W)表示該
15、算符兩側(cè)的檢索詞相鄰,且兩者之間只允許只有一個(gè)空格或標(biāo)點(diǎn)符號(hào),不允許有任何字母或詞,順序不能顛倒。(W)也可以簡(jiǎn)寫(xiě)為( )。例如: Aircraft( )design 可檢索出含有Aircraft design 的文獻(xiàn)記錄。Computer( )aided( )design 可檢索出含有Computer aided design 的文獻(xiàn)記錄 ( Dialog 為例)(1 )(W)With38(nW)表示在此算符兩側(cè)的檢索詞之間最多允許間隔n 個(gè)詞(實(shí)詞或虛詞),且兩者的相對(duì)位置不能顛倒。例如:laser(1w)printer 可檢出含有l(wèi)aser printer 和laser color pr
16、inter 的文獻(xiàn)記錄Computer(1w)animation可檢出Computer assisted animation( Dialog 為例)(2 )(nW)nWords(W),(1W),(nW)39Wn 如:W8EBSCO 例:tax W8 reformADJElsevier兩詞按指定順序排列, 相當(dāng)于短語(yǔ) 例:remote ADJ educationPRE/n PQDD 例:military PRE/1 weapons常見(jiàn)的另外的表達(dá)形式40(N)表示該算符兩側(cè)的檢索詞相鄰,但兩者的相對(duì)位置可以顛倒。例如:computer(N)network 可檢出含有computer networ
17、k 、network computer 形式的文獻(xiàn)記錄。例ECONOMI*(1NEAR)RECOVER*可包含多重組合和含義( Dialog 為例)(3) (N)Near41(nN)表示此算符兩側(cè)的檢索詞之間允許間隔最多n 個(gè)詞,且兩者的順序可以顛倒。例如 computer(2N)system 可檢出含有computer system ,computer code system ,computer aided design system ,system using modern computer 等形式的文獻(xiàn)記錄。(4) (nN)nNear(N),(1N),(nN)42Nn 例: tax N5
18、 reform (EBSCO) NEARN 例: remote NEAR5 ducation (Elsevier) W/n 例:intelligent W/10 buildings PQDD 常見(jiàn)的另外的表達(dá)形式43鄰接符號(hào)F (field), 表示其兩側(cè)的檢索詞必須是在文獻(xiàn)記錄的同一字段中,而它們?cè)谠撟侄沃械南鄬?duì)次序不限。檢索式為A(F)B。例如:computer (F) control,只要這兩個(gè)詞在一個(gè)字段同時(shí)出現(xiàn)就算命中。例如:water( )pollution(F)control 表示在同一個(gè)字段中(如篇名、文摘、敘詞等)同時(shí)含有water pollution 和control 的文
19、獻(xiàn)記錄均可檢索出來(lái)。(5)(F)Field44鄰接符號(hào)S (sentence), 表示其兩側(cè)的檢索詞必須是在文獻(xiàn)記錄的同一子字段中,用(S)連接的兩個(gè)詞都出現(xiàn)在同一個(gè)子字段中詞序不限。檢索式為A(S)B,(S) 在文摘字段中,一個(gè)句子就是一個(gè)子字段, 用句號(hào)或豆號(hào)結(jié)束。例如computer( )control(s)system 可檢出文摘中含有“This paper is concerned with an application of the computer control technique in a intelligent system for testing inner walls
20、of pipes.”這樣一句話(huà)的文獻(xiàn)記錄。(6) S -sentence452.2.4 位置邏輯檢索精確度排序(W)(nW)(N)(nN)(S)(F)高低46L表示所連接的兩個(gè)詞之間有一定叢屬關(guān)系,后者修飾、限定前者,兩者為主從關(guān)系。如主題表中的主題詞和副主題就具有叢屬關(guān)系。在EI,MEDLINE中使用如: SOLAR(L)ENERGY 系統(tǒng)會(huì)自動(dòng)到敘詞字段查找和太陽(yáng)能相關(guān)的文獻(xiàn)。(7) L-link47檢索執(zhí)行的優(yōu)先順序 括號(hào)中的檢索詞 高 W,N,或L, F, NOT AND OR 低48信息檢索效果是評(píng)價(jià)一個(gè)信息檢索系統(tǒng)性能優(yōu)劣的質(zhì)量標(biāo)準(zhǔn),它始終貫穿信息存儲(chǔ)和檢索的全過(guò)程。 衡量信息檢索
21、效率的指標(biāo):查全率、查準(zhǔn)率、漏檢率、誤檢率。理想的檢索效果是查全率和查準(zhǔn)率同時(shí)達(dá)到100%。但事實(shí)上很難達(dá)到全部檢出和全部檢準(zhǔn)的要求,而只能達(dá)到某個(gè)百分比。2.3 檢索效果評(píng)價(jià)49查全率:檢索結(jié)果中相關(guān)記錄數(shù)與數(shù)據(jù)庫(kù)中總的相關(guān)記錄數(shù)的比值即檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫(kù)中存在的合乎該需要的所有文獻(xiàn)的比例。查全率高說(shuō)明有用的東西都被你檢中了,但對(duì)于數(shù)量巨大的數(shù)據(jù)庫(kù)而言,要達(dá)到100%的查全率是不可能的,在網(wǎng)絡(luò)條件下尤其如此。查全率=檢索出相關(guān)文獻(xiàn)總數(shù)系統(tǒng)中的相關(guān)文獻(xiàn)總數(shù)X 100%2.3 檢索效果評(píng)價(jià)50查準(zhǔn)率:檢索結(jié)果中相關(guān)記錄數(shù)與檢索結(jié)果總數(shù)的比值查全率和查準(zhǔn)率之間存在近似于互逆關(guān)系在
22、查全與查準(zhǔn)兩個(gè)方面一般難以?xún)扇?,為了獲得很多有用的東西(達(dá)到高的查全率),需要較少的限制檢索條件,但這樣檢出的無(wú)用的東西就會(huì)很多(查準(zhǔn)率不高),反之亦然。在計(jì)算機(jī)檢索中,一般認(rèn)為查準(zhǔn)率為6070、查全率為4060是較為理想的。 查準(zhǔn)率=檢索出相關(guān)文獻(xiàn)總數(shù)檢出文獻(xiàn)總數(shù)X 100%2.3 檢索效果評(píng)價(jià)51 擴(kuò)檢方法:1) 準(zhǔn)確把握檢索對(duì)象及目的, 選擇合適的數(shù)據(jù)庫(kù)。2) 降低檢索詞或分類(lèi)號(hào)的專(zhuān)指度, 可選上位詞和相關(guān)詞加入其中。3) 調(diào)整檢索式的網(wǎng)羅度,刪除不重要的概念面。4) 更多地采用學(xué)科分類(lèi)途徑來(lái)擴(kuò)大檢索范圍。5) 減少邏輯“與”及邏輯“非”的使用。6) 增加邏輯“或”及截詞檢索技術(shù)的使用。
23、7) 采用“全文檢索”。8) 不限定檢索對(duì)象的文獻(xiàn)類(lèi)型、時(shí)間段、文種等。提高查全率的主要方法52 縮檢方法 1) 準(zhǔn)確把握檢索對(duì)象及目的,選擇合適的數(shù)據(jù)庫(kù)。 2) 提高檢索詞或分類(lèi)號(hào)的專(zhuān)指度。 3) 更多地采用專(zhuān)用名詞及特性檢索的途徑。 4) 選擇邏輯“與”及邏輯“非”的使用。 5) 減少或不采用邏輯“或”及截詞檢索技術(shù)的使用。 6) 限定檢索詞出現(xiàn)的字段及在段落、文句中的位置。 7) 不選“全文檢索”. 8) 限定檢索對(duì)象的文獻(xiàn)類(lèi)型、時(shí)間段、文種及其它特征。提高查準(zhǔn)率的主要方法532.4 檢索詞的確定必須明確所需信息涉及的主題范疇選擇合適的主題詞注意關(guān)鍵詞與標(biāo)題詞、敘詞的區(qū)別注意關(guān)鍵詞中的同
24、義詞、近義詞的選擇注意用數(shù)據(jù)庫(kù)自帶的詞表選擇合適的檢索詞注意檢索詞的上下位概念詞的選擇注意選擇已輸入的檢索詞的相關(guān)復(fù)合檢索詞注意有些數(shù)據(jù)庫(kù)有禁用詞:the、about、on等等54專(zhuān)業(yè)技術(shù)詞典詞表利用數(shù)據(jù)庫(kù)自帶的詞表利用搜索引擎選擇2.4 檢索詞的確定55利用搜索引擎選擇檢索詞搜索引擎是關(guān)鍵字、詞、詞組、復(fù)合詞組的檢索搜索引擎能檢索各種語(yǔ)言的信息,特別是中英文檢索可以利用搜索引擎對(duì)已檢索的內(nèi)容進(jìn)行字詞的選擇,特別是英文詞的選擇當(dāng)有些數(shù)據(jù)庫(kù)(SCI、ScienceDirect )沒(méi)有檢索詞表可以選擇,搜索引擎對(duì)詞的選擇將是主要可參考的途徑2.4 檢索詞的確定56課題:大型船舶運(yùn)輸安全的風(fēng)險(xiǎn)評(píng)估方
25、法與決策技術(shù)檢索前對(duì)課題檢索詞分析:船舶運(yùn)輸、船舶 maritime transportation, Vessel, ship, boat危險(xiǎn)可操作性分析、危險(xiǎn)與可操作性分析Hazard and Operability Analysis, HAZOP評(píng)估、評(píng)價(jià) Evaluate, evaluation, assess, assessment, assessing, appraisal, estimate安全評(píng)估、風(fēng)險(xiǎn)評(píng)估 Safety Assessment, safety evaluation, Risk Assessment、hazard assessment, exposure ratin
26、g、利用搜索引擎選擇檢索詞57用搜索引擎查看可以利用的檢索詞,發(fā)現(xiàn)除了“船舶運(yùn)輸”外,還可以用“海上運(yùn)輸”。而英文詞方面,有maritime transport、maritime transportation兩種 利用搜索引擎選擇檢索詞58此處檢索所得詞是:危險(xiǎn)與可操作性分析結(jié)論:前后兩次檢索說(shuō)明“危險(xiǎn)與可操作性分析”、“危險(xiǎn)可操作性分析”都可以是檢索的對(duì)象59利用數(shù)據(jù)庫(kù)功能選擇檢索詞利用數(shù)據(jù)庫(kù)查看這些詞的可靠性(是否常用、規(guī)范,有無(wú)其他用法)利用CNKI數(shù)據(jù)庫(kù)查看所選詞的其他相關(guān)詞并利用利用維普數(shù)據(jù)庫(kù)查看同義詞利用外文數(shù)據(jù)庫(kù)功能查看、選擇檢索詞(CSA、EI、Ebsco)60中國(guó)學(xué)術(shù)期刊網(wǎng)6
27、16263利用維普數(shù)據(jù)庫(kù)的同義詞庫(kù),可以查詢(xún)出有關(guān)檢索詞的同義、近義詞。在檢索中,這些同義詞與近義詞都要用來(lái)檢索,才不至于“漏檢”由于清華同方、萬(wàn)方數(shù)據(jù)庫(kù)中沒(méi)有同義詞查看功能,因此要充分利用維普數(shù)據(jù)庫(kù)這一功能,將查看到的詞用于其他數(shù)據(jù)庫(kù)檢索中。6465666768在EI數(shù)據(jù)庫(kù)的“受控詞匯”索引中,選擇合適的、規(guī)范化的檢索詞。使用時(shí),只要在上方對(duì)話(huà)框中輸入自身的檢索詞,查對(duì)一下數(shù)據(jù)庫(kù)合適的、受控的檢索詞。用“受控詞匯”檢索,更能檢索到符合內(nèi)容的信息69詞表最合適的檢索詞查看詞表詞序?yàn)g覽相關(guān)性檢索詞的查看702.5 檢索策略及檢索策略式檢索策略式:它將各種檢索點(diǎn)用邏輯算符、位置算符、截詞符等組配符
28、連接起來(lái),形成完整的檢索概念和檢索順序。檢索策略,即在分析檢索課題內(nèi)容實(shí)質(zhì)基礎(chǔ)上,選擇檢索系統(tǒng)、檢索途徑、確定檢索詞及其相互間的邏輯關(guān)系等的信息檢索方案。 關(guān)鍵:構(gòu)造能夠確切表達(dá)信息需求的檢索式。 71課題1:查找有關(guān)面包添加劑方面的文獻(xiàn)資料 可有兩種檢索途徑分類(lèi)途徑:分類(lèi)號(hào)主題途徑:主題詞檢索字段及檢索標(biāo)識(shí):分類(lèi)號(hào)字段:TS202.3 (食品添加劑)、 TS213.21(面包類(lèi))題名、文摘、關(guān)鍵詞字段:面包、添加劑72分類(lèi)檢索表達(dá)式: 分類(lèi)號(hào): (TS202.3 * TS213.21) 主題檢索表達(dá)式:題名: (面包* 添加劑)題名或關(guān)鍵詞: (面包* 添加劑)分類(lèi)、主題組配檢索表達(dá)式:分類(lèi)
29、號(hào): (TS202.3 ) * 題名: (面包)分類(lèi)號(hào): (TS202.3 ) +主題: (添加劑) * 題名: (面包) 主題:中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)中的一個(gè)組合字段,表示在題名、關(guān)鍵詞和文摘三個(gè)字段中進(jìn)行檢索73課題2:“論企業(yè)生產(chǎn)線(xiàn)的優(yōu)化”企業(yè) * 生產(chǎn)線(xiàn) * 優(yōu)化 (企業(yè)+工廠)*(生產(chǎn)線(xiàn)+流水線(xiàn))*(優(yōu)化+計(jì)算機(jī)控制+在線(xiàn)控制+智能控制)741)選詞切分、刪除例:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用研究切分:神經(jīng)網(wǎng)絡(luò)、在、旋轉(zhuǎn)機(jī)械、故障診斷、中、的、應(yīng)用、研究刪除:在 中 的 應(yīng)用 研究最終:神經(jīng)網(wǎng)絡(luò)、旋轉(zhuǎn)機(jī)械、故障診斷替換 將表達(dá)不清晰、概念不明確的詞替換掉如:酸洗費(fèi)液的處理處理:“回收”、
30、“再生”提取概念例如:公司勞動(dòng)獎(jiǎng)勵(lì)、職工培訓(xùn)和養(yǎng)老保險(xiǎn)制度管理的理論和實(shí)踐公司, 勞動(dòng)獎(jiǎng)勵(lì),職工培訓(xùn),養(yǎng)老保險(xiǎn),制度,管理“勞動(dòng)力資源管理:勞動(dòng)獎(jiǎng)勵(lì)、職工培訓(xùn)和養(yǎng)老保險(xiǎn)最終:“勞動(dòng)力資源”,“管理”2. 5 檢索策略式752 )擴(kuò)展補(bǔ)充進(jìn)行同義詞、近義詞、上位詞、相關(guān)詞等的擴(kuò)充中英文同義、近義詞上位詞、相關(guān)詞 - 神經(jīng)網(wǎng)絡(luò):上位詞:人工智能 - 故障診斷:相關(guān)詞:故障定位、故障檢測(cè) 上位詞:容錯(cuò)技術(shù)2.5 檢索策略式762 )擴(kuò)展補(bǔ)充截詞方法 當(dāng)某些檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(shí)(多數(shù)英語(yǔ)單詞的單復(fù)數(shù)變化和英美不同拼寫(xiě)形式),可以采用截詞方法擴(kuò)展檢索詞。在詞干后使用截詞符。2
31、.5 檢索策略式773 )組合把檢索詞用組配符連接起來(lái),組合成檢索式 例:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用研究(神經(jīng)網(wǎng)絡(luò) or 人工智能)and(旋轉(zhuǎn)機(jī)械)and (故障診斷 or 故障定位 or 故障檢測(cè)or 容錯(cuò)技術(shù))2.5 檢索策略式78制定檢索式時(shí)要注意: 主要檢索詞放在最前面,并且限制在基本索引字段里。 正確使用各種算符。 檢索式應(yīng)簡(jiǎn)單不復(fù)雜。2.5 檢索策略式79例:亞音速飛機(jī)在飛行控制方面的研究檢索詞:亞音速 、飛機(jī)、飛行控制 檢索式:摘要(亞音速*飛機(jī) +亞音速飛機(jī))*飛行控制外文檢索詞:subsonic velocity; aircraft(s)、 airplane(s);
32、subsonic aircraft(s);flight control檢索式:AB= (subsonic()velocity)*(aircraft? ?+airplane? ?) +(subsonic()aircraft? ?)*(flight()control)2.5 檢索策略式80總結(jié):提高查準(zhǔn)率從以下幾個(gè)方面著手檢索結(jié)果多時(shí)采用“AND”縮小檢索范圍檢索下位詞時(shí)不使用上位詞使用 “NOT” 將不需要的檢索標(biāo)識(shí)排除將“AND”改為更精確的狹隘的位置符使用限定符限定檢索標(biāo)識(shí)所在字段81練習(xí)1 寫(xiě)出下列課題的中文檢索式: 2005年后在信號(hào)處理上發(fā)表的有關(guān)雷達(dá)抗干擾檢測(cè)方面的文獻(xiàn)2 描述下列檢索式的含義: 工作單位= (南京航空航天大學(xué) OR 北京航空航天大學(xué)) AND 關(guān)鍵詞=(無(wú)人機(jī) OR 無(wú)人駕駛飛機(jī))82練習(xí)1 寫(xiě)出下列課題的中文檢索式: 2005年后在信號(hào)處理上發(fā)表的有關(guān)雷達(dá)抗干擾檢測(cè)方面的文獻(xiàn) 摘要= (雷達(dá) AND 抗干擾) AND 刊名=信號(hào)處理AND 出版年=2005 83練習(xí)2 描述下列檢索式的含義: 工作單位= (南京航空航天大學(xué) OR 北京航空航天大學(xué)) AND 關(guān)鍵詞=(無(wú)人機(jī) OR 無(wú)人駕駛飛機(jī)) 含義:南京航空航天大學(xué)和北京航空航天大學(xué)發(fā)表的有關(guān)無(wú)人機(jī)研究的文獻(xiàn)84分析課題選擇檢索系統(tǒng)確定檢索途徑確定檢索
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 汽車(chē)運(yùn)輸合同協(xié)議書(shū)
- 信息技術(shù)支持下的農(nóng)業(yè)智能生產(chǎn)合作協(xié)議
- 陜西省渭南市富平縣2024-2025學(xué)年八年級(jí)上學(xué)期期末生物學(xué)試題(含答案)
- 湖南省新高考教研聯(lián)盟2024-2025學(xué)年高三下學(xué)期一模聯(lián)考地理試題(含答案)
- 機(jī)器人產(chǎn)業(yè)發(fā)展項(xiàng)目投資合同
- 網(wǎng)絡(luò)科技產(chǎn)品測(cè)試協(xié)議
- 外包服務(wù)委托協(xié)議與質(zhì)量控制書(shū)
- 現(xiàn)場(chǎng)施工安全協(xié)議書(shū)進(jìn)場(chǎng)安全協(xié)議
- 2024-2025學(xué)年高二化學(xué)人教版選擇性必修3教學(xué)課件 第一章 第二節(jié) 第1課時(shí) 有機(jī)物的分離與提純
- 洗車(chē)場(chǎng)場(chǎng)地租賃合同協(xié)議書(shū)
- 陶土瓦屋面施工施工方法及工藝要求
- 第三課 多彩的鉛筆 教案 五下信息科技河南大學(xué)版
- 河南省創(chuàng)新發(fā)展聯(lián)盟2023-2024學(xué)年高一下學(xué)期3月月考化學(xué)試題(解析版)
- 農(nóng)村自建房包工包料施工合同
- 《鐵路職業(yè)道德》課件-第6章 鐵路職業(yè)道德修養(yǎng)
- 中考心理減壓輔導(dǎo) 中考前心理健康教育主題班會(huì)
- 小學(xué)四年級(jí)心理健康教育課
- 【上市公司的財(cái)務(wù)風(fēng)險(xiǎn)的分析和防范:以三只松鼠為例10000字(論文)】
- 幼兒園消防安全知識(shí)競(jìng)賽試題及答案
- 莫高窟群文閱讀教學(xué)設(shè)計(jì)
- 樂(lè)理視唱練耳簡(jiǎn)明教程課后習(xí)題答案
評(píng)論
0/150
提交評(píng)論