版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第2章計算機文獻檢索
第一節(jié)概述第二節(jié)計算機檢索基礎第三節(jié)網絡信息資源檢索
1第一節(jié)概述1.1計算機檢索的發(fā)展歷程1.脫機檢索2.聯機檢索3.國際聯機檢索4.單機光盤檢索5.光盤網絡檢索6.Web信息資源檢索21.脫機檢索(20世紀50年代末~60年代中期)計算機檢索的原始時期,計算機由電子管組成,主要存儲介質是磁帶、磁鼓,只能進行簡單的檢索。(第一臺計算機誕生于1946年,美國的賓夕法尼亞州)專業(yè)檢索人員定期批量處理用戶的情報要求用戶不能立刻獲得檢索結果檢索結果為題名,作者,文摘等在脫機檢索階段,計算機主要進行文獻目錄、索引、文摘等前處理工作。32.聯機檢索(20世紀60年代末~70年代初)1963年-1964年間,美國洛克希德導彈與宇航公司的情報實驗室建立了“人-機對話”的聯機情報檢索系統(tǒng)(DIALOG的前身),此后在20世紀60年代末到70年代初聯機檢索系統(tǒng)得以快速發(fā)展。國際著名的DIALOG系統(tǒng)、ORBIT系統(tǒng)、MEDLINE系統(tǒng)都是從這個時期發(fā)展起來的。多個檢索終端,通過通訊線路與聯機檢索系統(tǒng)中央計算機(主機)聯接利用分時技術,使多個用戶可同時與主機以“對話”方式進行檢索用戶可隨時瀏覽檢索結果由于這個階段的計算機網絡主要是通過電話線聯接,因而聯機檢索受到地區(qū)的限制43.國際聯機檢索(20世紀70年代中期-)衛(wèi)星通訊技術的出現,使得聯機檢索系統(tǒng)打破了地域限制。數據庫生產的迅速發(fā)展及微機大量的涌現,使得國際聯機檢索蓬勃發(fā)展。用戶利用終端設備,通過國際衛(wèi)星通訊網與世界各地的大型計算機情報檢索系統(tǒng)中央計算機直接進行“人-機對話”,查找世界各國的情報文獻資料。聯機檢索系統(tǒng)進入發(fā)展的黃金時期。5國際聯機檢索的貢獻方便和加速了世界情報資源的交流與利用過去千里迢迢不能找到看到的情報資料,現在利用國際聯機情報檢索終端,只用幾分鐘就可以從幾年到幾十年幾萬種期刊中查到實現了人類情報資源的共享。優(yōu)點:信息量大、快速、方便數據庫內容更新快64.單機光盤檢索(20世紀80年代--)CD-ROM技術促使計算機檢索成本迅速下降(一張光盤可存貯600〔MB〕兆字節(jié)機讀數據,成本價格便宜,而一張DVD光盤的容量最少可達4.7G)光盤檢索系統(tǒng)---普通的微機上配備光盤驅動器及光盤數據庫及檢索軟件75.光盤網絡檢索(20世紀90年代-)以太網技術的出現推動網絡版光盤數據庫的出現光盤網絡是一種計算機網絡,如圖書館局域網實現多用戶光盤資源共享例如:美國“化學文摘”(CA)從1987-1991年的五年累積索引(含文摘)光盤數據庫共6張,價值40.5萬元。86.Web信息資源檢索(20世紀90年代末-)進入20世紀90年代后,隨著網絡技術的發(fā)展,尤其是互聯網的迅猛發(fā)展,使計算機檢索進入一個嶄新的時期。檢索方法更簡單,檢索結果更全面經過40多年的發(fā)展,從早期的書目信息到后來的全文本信息,到今天的網絡與多媒體信息,網絡信息資源已成為現代社會不可缺少的資源財富。其處理技術從簡單的字段與關鍵詞檢索到全文檢索,再到今天成為網絡主流的超文本與多媒體處理。處理技術的演進與發(fā)展,一方面使網絡信息資源的內容從單一的書目到圖文并茂的多媒體,更富有吸引力和使用價值;另一方面,超文本的廣泛利用改變傳統(tǒng)的信息組織的線性方法,使電子資源的組織更接近于“自然”,大大方便了用戶的使用,使電資源的利用變得非常容易,用戶不需要太多的檢索知識與技術。91.2現代計算機網絡檢索數據庫的種類1.按訪問方式網絡數據庫可分為:(1)光盤局域網數據庫。(2)傳統(tǒng)的聯機數據庫。撥號,專線,費用昂貴。(3)異軍突起的Internet網絡數據庫。內容最豐富,包括圖書館的館藏目錄、數字圖書館、專業(yè)數據庫、電子圖書、電子期刊,搜索引擎……102.按是否收費網絡數據庫可分為:(1)商業(yè)數據庫:內容系統(tǒng)、豐富、全面。圖書館通過購買獲得的都是商業(yè)數據庫,如:EiVillage、《中國期刊網全文數據庫》。(2)免費數據庫:遜于商業(yè)數據庫。一般是由政府部門開發(fā),提供相關信息;或是暫未成熟收費的商業(yè)數據庫。如:美國能源部的官方網站,提供免費的DOE報告全文檢索和下載;
http:///
國家知識產權局的官方網站,可免費檢索專利(帶專利全文),并提供知識產權方面的信息。
e-書時空,
提供大量電子圖書供讀者免費下載。113.按提供的內容網絡信息資源可分為:(3)參考型數據庫。指引用戶到另一信息源以獲得原文或其他細節(jié)的一類數據庫。包括各種書目數據庫和引文數據庫。這種數據庫具有參考和評價的功能,多用于查新、開題。如:SCI、EI、維普的中文期刊數據庫……(4)全文數據庫。指存儲文獻全文或其中主要部分的數據庫。如新聞消息全文庫、法律法規(guī)全文庫、博碩論文全文庫等。(5)事實型數據庫。直接提供事實或數值的數據庫。如:萬方的企業(yè)產品數據庫、彼得森大學指南等。123.按提供的內容網絡信息資源可分為:(1)電子圖書。計算機利用計算機檢索并下載閱讀的圖書。如書生之家、超星數字圖書館、各種數字圖書館等(2)電子期刊。直接在網上就可以檢索和閱讀的期刊。如:萬方數字化期刊,中國期刊網全文數據庫,scienceonline等(3)電子報紙。如:人民日報的網絡版。(4)其它類型。如電子公告版(bbs),網絡論壇、新聞等,13第二節(jié)計算機檢索基礎2.1常用的檢索方式2.2布爾邏輯檢索2.3位置運算符2.4截詞算符2.5檢索限定142.1常用的檢索方式命令檢索(commandsearch)使用特定的操作命令來實施檢索靈活快捷速地進行檢索菜單檢索(menusearch)方便,易掌握,稱“easy-to-use”檢索多用于光盤檢索和web檢索152.2布爾邏輯檢索當今檢索理論中最成熟的理論之一,也是構造檢索表達式最基本、最簡單的匹配模式。布爾邏輯檢索是通過布爾邏輯算符來實現的,這些運算符能把一些具有簡單概念的檢索詞(或檢索項)組配成為一個具有復雜概念的檢索式,用以表達用戶的檢索要求。邏輯運算符有三種:與、或、非161.邏輯與:一般用and或*表示是一種用于交叉概念和限定關系的組配它可以縮小減縮范圍,有利于提高查準率凡是用AND的檢索式,AND兩側的檢索詞必須同時出現在同一條記錄中,該記錄才算命中如:?SAU=CHENG,GENGDONGANDPY=1997:1998?sSolar*Energy172.邏輯或:一般用or或+表示,少數數據庫用|表示
是一種用于并列關系的組配它可以擴大檢索范圍,防止漏檢,有利于提高查全率凡是用OR的檢索式,OR兩側的檢索詞只要有一個在一條記錄中出現,該記錄就算命中如:?S(AU=QIU,DAHONGORAU=QIU,D.H.ORAU=QIU,DHORORAU=QIU,DA-HONGORAU=DAHONG,QIU)ANDCS=DALIAN?swww+internet+network183.邏輯非:一般用not或-表示,少數數據庫用#或/表示
是一種排斥關系的組配用來從原來的檢索范圍中排除不需要的概念或影響檢索結果的概念,有利于提高查全率凡是用NOT的檢索式,NOT前面的檢索詞必須在記錄中出現,而后面的檢索詞一定不能出現,該記錄才算命中如:?SOPTICALNOTFIBER光學纖維?sEnergy/Nuclear能源核19NOTWebofScience中的邏輯運算舉例20輸入檢索式選擇文獻類型Semiconductornanometernanoparticle
nanofilm
CompositecompositesPreparepreparationsynthesizesynthesisSemiconduct*andnano*andcomposite*and(prepar*orsynthes*)21優(yōu)先順序邏輯運算符的優(yōu)先順序為NOT、AND、OR如果要改變運算順序需要用“()”如:AAND(BORC)22邏輯“與”的缺點邏輯“與”只要求兩個檢索詞必須同時出現在同一篇文獻中,而沒有限定算符兩側檢索詞之間的位置關系,有時難免造成誤檢。例如:查找“細菌對染料破壞”方面的文獻檢索詞:細菌、破壞、染料采用邏輯“與”組配:細菌and
破壞and染料檢索結果:命中同時用這三個詞標引的文獻有“細菌對染料的破壞”方面的文獻也會有“染料對細菌的破壞”方面的文獻要排除后一部分的文獻,就需用位置算符限定詞與詞之間的位置關系。232.3位置運算符又稱鄰接算符(adjacentoperators),適用于兩個檢索詞以指定間隔距離或者指定的順序出現的場合。跟AND運算符類似,但比AND運算符功能更具體。比如:通過“communicationANDsatellite”進行檢索時,命中的文獻可能既含有“communicationsatellite”,又含有“satellitecommunication”;也可能含有“communicationdevicesforsatellite”“communicationlinkswithoutsatellite”等等。顯然其中有些記錄與課題要求毫無關系。位置運算符可以用于改進AND運算符的這種不足之處,因此,它們可以看成是特殊功能的AND運算符。242.3位置運算符按照兩個檢索詞出現的順序和距離,可以有多種位置運算符,而且對于同一功能的運算符,不同的檢索系統(tǒng)可能有不同的表達方式,也有的檢索系統(tǒng)不支持位置運算符,檢索之前應該先看看數據庫的幫助信息。常用位置運算符有(w)、(n)、(s)、(f)251.(W)
(W)算符中的W含義為“With”。詞序不許顛倒兩詞之間不許插詞,只允許出現空格或連字符號(W)算符還可以使用其簡略形式--()例如:?SCD(W)ROM將命中CDROM或CD-ROM?Ssolar()energy檢出solarenergy?SCD(W)ROM/de,id2627282.(nW)(nW)算符中的W含義為“Word”它允許兩詞中間可以插入0-n個其他詞,包括系統(tǒng)禁用詞詞序不變例如:?communication(2W)satellite將檢索出含有communicationsatellite、communicationviasatellite、communicationonthesatellite的記錄。2930313.(N)(N)算符中的N含義為“Near”詞序可以顛倒兩詞之間不許插詞,只允許出現空格或連字符號例:?Scross(N)section可檢出crosssection和sectioncross324.(nN)(nN)是(N)算符的變形檢索詞之間允許插入0-n個詞,包括系統(tǒng)禁用詞詞序可以顛倒例如:?cotton(2N)processing可檢出cottonprocessing、processingofcotton、processingofEgyptiancotton3334355.(S)(S)算符中的S含義為“Sentence”詞序可以顛倒兩詞必須出現在同一句子(子字段)中(在EI的AB字段中為在兩個句號之間同時出現,在DE字段中為在兩個分號之間同時出現)36tio2samenano*samecomposite*same(prepar*orsynthes*)37386.(F)(F)算符中的F含義為“Field”兩詞必須出現在同一字段中詞序不限例如:?pollution(F)control可檢出controlandmanagementofindustrialpollution39(F)與and的區(qū)別(F)鄰近算符指定兩個檢索詞在同一個字段中出現,而AND布爾邏輯組配中的兩個檢索詞會出現在不同的字段中此外同位置運算符相比,AND可以連接兩個以上的檢索詞,還可以兩個以上的檢索集合進行組配。例如:au=cheng,gengdongANDcs=dalianANDpy=1998或s1ands2ands3402.4截詞算符截詞算符就是使計算機保留檢索詞中的相同詞干部分,允許檢索詞可有一定范圍的變化,這種功能可減少輸入步驟,簡化檢索程序,擴大檢索范圍,從而節(jié)省機時,降低費用,提高查全率。不同的數據庫有不同的截詞符,DIALOG系統(tǒng)用“?”,ORBIT系統(tǒng)用“+”,此外還有的系統(tǒng)用“$”或“*”截詞有前方一致、后方一致、中間一致和中間屏蔽四種形式。截詞是計算機檢索中常用的方法,尤其是英語的單詞詞尾變化較多,為避免漏檢經常要使用前方一致的截詞檢索。411.前方一致也叫后截斷,將截詞符置于一個字符串的后面,以表示其后的有限或無限個字符的檢索。無限截詞如:?Physic?可檢出physic、physical、physican、physicalism截斷兩個字符如:?physic??
可檢出physic、physical、physican截斷一個字符如:?textile??
可檢出textitle、textitles中間有一個空格422.后方一致(支持的檢索系統(tǒng)較少,EI光盤不支持)也叫前截斷,將截斷符置于一個字符串的前面,以表示其前的無限個字符的檢索。均為無限截詞。如:??polymer可檢出polymer、copolymer、homopolymer433.中間截斷也叫中間屏蔽如:?defen?e
可檢出defence、defense?fib??s可檢出fibers和fibres
44WebOfScience平臺:
Lap*roscop*
可檢索到Laparoscopic,Laproscopic,LaparoscopyCSA平臺:
*截斷任意個字符
patent*
可檢索到patent,patents,patentable;h*ophilia
可檢索到haemophilia,hemophilia;
?
截斷一個字符,在單詞中最多可使用三個?
wom?n
可檢到woman,women;fib??
可檢到fiber,fibre;45人大復印報刊資料全文書庫:
!:兩詞(字)之間允許隔零個至多個字,最多允許出九個“?”例:旅游!!企業(yè)可檢索到“旅游企業(yè)”、“旅游服務企業(yè)”、“旅游重點企業(yè)”等
?:兩詞(字)之間允許隔幾個字,相隔字的個數等于出現?的個數,最多允許出九個“?”例:旅游??企業(yè)可檢索到“旅游服務企業(yè)”、“旅游重點企業(yè)”等464.中間一致(支持的檢索系統(tǒng)較少,EI光盤不支持)詞頭詞尾都可變化如:?
?wave?
可檢出wave、waves、microwave472.5檢索限定字段限定時間范圍限定分類限定語種限定等481.字段限定字段限定也是調整檢索策略的一種重要手段。多數檢索系統(tǒng)對不指定字段的檢索詞通常在所有字段(allfield)或所有基本字段中進行檢索。如果想指定在文獻的題目等特定字段中檢索,就需要使用字段限制。字段限制適用于在已有一定數量輸出記錄的基礎上,通過指定字段的方法,減少輸出篇數,提高檢索的查準率。例如:?OPTICALNOTFIBER在EI98光盤中有14799條記錄。字段限制的優(yōu)先級要比邏輯運算符的優(yōu)先級高要把OPTICALNOTFIBER限制在題名字段就要輸入:?(OPTICALNOTFIBER)/TI49502.EI光盤中常用的基本索引字段/TITitle篇名/ABAbstract文摘/DEDescriptor規(guī)范詞/IDIdentifiers自由詞51基本索引字段檢索在Ei光盤中基本索引字段用后綴方式表示如:?Polymer/ti,ab?Information(w)society/ti?nondestructive(w)(testingorexamination)/ti,ab,de,id523.Ei光盤中常見的輔助索引字段代碼 解釋AU= Author(著者) CS= CorporateSource(機構)CT= ConferenceTitle(會名) JN= JournalName(刊名) DT= DocumentType(文獻類型) LA= Language(語種) PY= PublicationYear(出版年)53在Ei光盤中輔助索引字段用前綴方式表示如:?LA=English
查找原文為英文的文獻。?
PY=1993:1994
查找1993年至1994年間發(fā)表的文獻。輔助索引字段檢索54復雜檢索式的構造:
((ctorcomput?(1w)tomography)and(solid(s)rocket?orpropellant?)and(nondestruct?orndtorndeorndi))/de,id,ti,ab,1990-2000
檢索1990年至2000年以來CT用于固體火箭無損檢測方面的文獻,在規(guī)范詞、自由詞、篇名及文摘字段中檢索。55第三節(jié)計算機檢索的常用方法563.1直接法(常用法)直接法是指直接利用檢索工具(系統(tǒng))檢索文獻信息的方法,這是文獻檢索中最常用的一種方法。它又分為順查法、倒查法和抽查法。(1)順查法
順查法是指按照時間的順序,由遠及近地利用檢索系統(tǒng)進行文獻信息檢索的方法。這種方法能收集到某一課題的系統(tǒng)文獻,它適用于較大課題的文獻檢索。例如,已知某課題的起始年代,現在需要了解其發(fā)展的全過程,就可以用順查法從最初的年代開始,逐漸向近期查找。573.1直接法(常用法)(2)倒查法
倒查法是由近及遠,從新到舊,逆著時間的順序利用檢索工具進行文獻檢索的方法。此法的重點是放在近期文獻上。使用這種方法可以最快地獲得最新資料。(3)抽查法
抽查法是指針對項目的特點,選擇有關該項目的文獻信息最可能出現或最多出現的時間段,利用檢索工具進行重點檢索的方法。583.2追溯法(引文法)追溯法是指利用已經掌握的文獻末尾所列的參考文獻,進行逐一地追溯查找“引文”的一種最簡便的擴大信息來源的方法。它還可以從查到的“引文”中再追溯查找“引文”,像滾雪球一樣,依據文獻間的引用關系,獲得越來越多的內容相關文獻。缺點:查全率、查準率較低,易誤檢漏檢
59追溯法—原始文獻60追溯法—原始文獻所附的參考文獻613.3綜合法綜合法又稱為循環(huán)法,它是把上述兩種方法加以綜合運用的方法。綜合法既要利用檢索工具進行常規(guī)檢索,又要利用文獻后所附參考文獻進行追溯檢索,分期分段地交替使用這兩種方法。即先利用檢索工具(系統(tǒng))檢到一批文獻,再以這些文獻末尾的參考目錄為線索進行查找,如此循環(huán)進行,直到滿足要求時為止。綜合法兼有常用法和追溯法的優(yōu)點,可以查得較為全面而準確的文獻,是實際中采用較多的方法。623.4計算機檢索的步驟確定檢索目標選擇數據庫編制檢索提問式上機檢索整理檢索結果并對檢索效率進行評價631.確定檢索目標要進行信息檢索,首先必須確定信息檢索的目標,即對信息用戶的需求進行具體的分析,這種分析應主要包括以下內容:(1)明確檢索的目的明確用戶是要查新、查參考資料還是查詢論文被收錄或引用情況等,以便對檢索的查準、查全和時間范圍的指標要求有一個大致的了解,從而制定出符合情況的檢索策略。(2)課題分析對課題內容進行分析,找出核心概念和隱含概念,排除無關的概念,明確概念之間相互的邏輯關系。64課題分析---直接從項目名稱中確定檢索概念例:項目“聚乙烯的合成(synthesisofpolyethylene)”主要概念:聚乙烯、合成(synthesis、polyethylene)檢索式:聚乙烯and合成Synthesisandpolyethylene656667686970課題分析---找出隱含概念例:項目“灌溉用的橡塑多孔管”Rubber-PlasticPorousPipeForIrrigation橡塑多孔管也稱為橡塑滲灌管,其主要原料為橡膠粉(由廢舊輪胎制得)和塑料(如粉狀聚乙烯)。隱含概念:橡膠、塑料該產品主要用于農林、園藝等方面的灌溉。主要概念:橡膠、塑料、多孔管、灌溉檢索式:(橡膠or塑料or橡塑)and多孔管and灌溉71課題分析---泛指概念具體化例:項目“唐山綜合防災的研究”由于唐山是一個城市,因此該項目實際上是“城市綜合防災的研究”。該項目針對的主要災害是地震、洪水和火災,所采用的研究手段是決策支持系統(tǒng)和專家系統(tǒng)。防災地震、洪水、火災研究決策支持系統(tǒng)、專家系統(tǒng)主要概念:城市、地震、洪水、火災、決策支持系統(tǒng)、專家系統(tǒng)檢索式:城市
and(地震or洪水or火災)and(決策支持系統(tǒng)or專家系統(tǒng))72排除重復無關的概念可避免漏檢,節(jié)省檢索費用。例4:項目“河豚毒素的液相色譜分析”從項目名稱上看,其主要概念為“河豚毒素”、“液相色譜”和“分析”,但由于液相色譜本身就是一種分析方法,它隱含了“分析”這一概念主要概念:河豚毒素、液相色譜檢索式:河豚毒素and液相色譜732.選用合適數據庫根據檢索目標分析所確定的檢索目的、涉及的學科范圍和信息類型,選擇合適的數據庫。具體選擇過程中還應考慮數據庫的類型(參考、全文還是電子期刊)、內容(專利、標準、會議)、收錄的數據學科范圍、數據庫的更新周期,收錄文獻的語種等因素。例如,要查新就要選擇收錄文獻最全,更新周期快的數據庫;要看全文就要選用全文數據庫或電子期刊;要查標準或專利就要選擇標準庫或專利庫。743.使用適當的檢索語言,構造檢索表達式分析各個檢索詞之間的位置關系和邏輯組配關系分析檢索詞應該限定在哪個字段中檢索(是在所有基本索引中檢索還是限定在分類、主題、自由詞、文摘還是其他輔助索引字段中檢索?)754.上機檢索上機檢索是用戶的實際操作過程,檢索策略輸入檢索系統(tǒng)后,系統(tǒng)響應的檢索結果通常很難一次就能滿足課題的要求,例如,有時輸出的篇數太多,而且不相關的文獻所占的比例很大,而有時輸出的文獻數量太少,甚至為零。因此在檢索的過程中用戶需要不斷地根據檢索結果對檢索策略進行調整和修改,包括檢索詞的重新選取以及檢索提問式的重新構造,經過反復的檢索最終獲得比較滿
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鐵柜合同范本
- 錢幣轉讓合同范本
- 2024年專項化學用品項目合作計劃書
- 內科綜合大樓科室內標識指引牌技術方案
- 醫(yī)院項目砌體工程技術專項方案
- 班級自我評價與目標調整計劃
- 重慶市高新區(qū)中學聯盟2024-2025學年上期期中調研測試 八年級數學試題卷(無答案)
- 施工合股合同范本
- 黑龍江哈爾濱市(2024年-2025年小學五年級語文)人教版階段練習(下學期)試卷及答案
- 精準農業(yè)供應鏈追溯整體方案
- QCT1177-2022汽車空調用冷凝器
- 24春國家開放大學《學前兒童美術教育活動指導》期末大作業(yè)參考答案
- 數字化時代背景下教師角色的思考
- 醫(yī)院績效考核分配方案及實施細則
- 水工環(huán)地質調查技術標準手冊
- 血液科常用化療方案(1)
- 7上unit2reading
- 王維的生平經歷
- 拉刀基本知識(完整版)
- 次氯酸鈉溶液 MSDS
- 命題作文“懂你”寫作指導與佳作示例
評論
0/150
提交評論