第01章信息檢索的基礎(chǔ)知識(shí)nnew_第1頁
第01章信息檢索的基礎(chǔ)知識(shí)nnew_第2頁
第01章信息檢索的基礎(chǔ)知識(shí)nnew_第3頁
第01章信息檢索的基礎(chǔ)知識(shí)nnew_第4頁
第01章信息檢索的基礎(chǔ)知識(shí)nnew_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2023年2月3日第1頁第1章信息檢索

的基礎(chǔ)知識(shí)2023年2月3日第2頁例子:鮑勃和托德的故事鮑勃和托德同一天到公司上班,托德一再被提拔,鮑勃卻一直在基層。鮑勃實(shí)在忍無可忍,他大膽地指出總經(jīng)理偏愛吹牛拍馬的人,而辛勤工作的人卻得不到提拔??偨?jīng)理聽他講完后說:“好吧,也許你說的對(duì),不過我很想證實(shí)一下,你現(xiàn)在到集市去,看看有什么賣的?!?023年2月3日第3頁鮑勃很快從集市上回來,說剛才集市上有一個(gè)農(nóng)民拉了車土豆在賣。“一車大約多少斤?”總經(jīng)理問。鮑勃立即趕回去,過了一會(huì)兒回來說,車上有40多袋土豆,每袋約20斤?!岸嗌馘X一斤?”總經(jīng)理問。鮑勃又要跑回去,但總經(jīng)理把他拉住了:“鮑勃先生,請(qǐng)休息一會(huì)吧。”2023年2月3日第4頁他派人把托德叫來,對(duì)他說:“托德先生,你馬上去集市看看今天有什么賣的?!辈灰粫?huì)兒,托德回來了,他向總經(jīng)理匯報(bào)說集市上只有一個(gè)農(nóng)民在賣土豆,有40多袋,共800多斤,價(jià)格適中,質(zhì)量很好,他已經(jīng)帶回幾個(gè)土豆請(qǐng)總經(jīng)理過目。他還了解到這位農(nóng)民今天下午還要拉一車西紅柿上集市,據(jù)說價(jià)格還可以,他準(zhǔn)備再和這個(gè)農(nóng)民聯(lián)系一下。鮑勃一直在一旁看著,現(xiàn)在他終于知道自己和托德之間的差距了。2023年2月3日第5頁請(qǐng)問:鮑勃和托德之間的差距是什么?由于托德總是能夠主動(dòng)對(duì)總經(jīng)理的指示進(jìn)行分析,獲取相關(guān)的信息,為總經(jīng)理的決策提供有效信息,得到了總經(jīng)理的賞識(shí),獲得了事業(yè)的成功。也就是信息素質(zhì)的最好體現(xiàn).信息檢索課程的教學(xué)目的和核心就是培養(yǎng)和提高人的信息素質(zhì)。2023年2月3日第6頁1、現(xiàn)代社會(huì)“信息素質(zhì)的內(nèi)部結(jié)構(gòu)”信息素質(zhì):P9

大眾理解:是個(gè)體先天所賦予的生理素質(zhì)的基礎(chǔ)上,通過后天學(xué)習(xí)實(shí)踐形成的信息品質(zhì),它是社會(huì)成員的信息意識(shí)、信息道德、信息能力、信息潛能等多項(xiàng)基本素質(zhì)的結(jié)合。內(nèi)部結(jié)構(gòu)如下:A、信息需求是指人們?cè)谝粋€(gè)階段的目標(biāo)、任務(wù)位置中產(chǎn)生的信息需要行為。B、信息意識(shí)是人們對(duì)信息的敏銳意識(shí)(由信息需求激發(fā)出來,包括人們對(duì)信息的感受力、持久的注意力和對(duì)信息價(jià)值的洞察力、判斷力)。C、信息知識(shí)是人們有關(guān)信息的特點(diǎn)與類型、信息交流和傳播的基本規(guī)律與方式、信息的功用及效應(yīng)、信息檢索的方法和技能等方面的知識(shí)。D、信息道德是人們?cè)谑占畔?、獲取信息和使用信息時(shí)必須遵守的倫理道德規(guī)范。E、信息能力是人們?cè)谔角笈c個(gè)人興趣有關(guān)的信息活動(dòng)中,能夠精確地、批判性地評(píng)價(jià)信息,對(duì)信息進(jìn)行創(chuàng)造性表達(dá)和知識(shí)創(chuàng)新,最佳地收集、分析和使用信息,從而完成解決實(shí)際問題和探求知識(shí)的能力。2023年2月3日第7頁信息素質(zhì)的“金字塔”結(jié)構(gòu)信息能力信息道德信息知識(shí)信息意識(shí)信息需求2023年2月3日第8頁1.1信息的概念1信息一詞的出現(xiàn)最早《三國志》中出現(xiàn)西晉陳壽早在一干多年前唐代詩里便有了“信息”這個(gè)詞。唐代詩人李中在《碧云集·暮春懷故人》詩中就留下了“夢(mèng)斷美人沉信息,目穿長路倚樓臺(tái)”的佳句,南宋陳亮在《梅花》詩中寫到:“欲傳春信息,不怕雪埋藏”

這里的“信息”含義為音信、消息。2023年2月3日第9頁人周圍的信息信息在包圍著我們,人的五官、身體所感受到的可以說首先都是信息。同時(shí),人們又在借助于語言等手段向外傳遞、交流信息。(文獻(xiàn),網(wǎng)絡(luò)世界-理解最深刻,感受最多)人類社會(huì)中,即使人們用非語言的交流符號(hào),也在本能地用一些常見的形式向外界發(fā)布信息,如:

--用體態(tài)身勢(shì),即用手勢(shì)、面部表情、體態(tài)表情;

--用眼光,所謂含情脈脈、暗送秋波等,眼睛被看作是心靈的窗戶;

--人與人交流的空間距離,也無時(shí)不在表達(dá)一種信息:相距很近,為親密區(qū),相距1米左右,屬于熟人區(qū),相距1至3米左右,屬于社交區(qū),相距4米以上的,屬于公眾交際區(qū)。

--一個(gè)人同你談話時(shí),隔著很遠(yuǎn)地方而不靠近的,這時(shí)他已向你傳遞這樣的信息:不愿和你過分的親密。人們交往中還會(huì)用些“喊”、“哭”等輔助語言以傳遞信息2023年2月3日第10頁信息的定義(不同的人有不同的看法)P1是經(jīng)過加工的數(shù)據(jù),是傳遞知識(shí)的工具。2023年2月3日第11頁2、信息的特征A、客觀性B、時(shí)效性C、傳遞性D、共享性2023年2月3日第12頁1.4信息源信息的來源即信息源,是指滿足用戶所需信息的出處。P18可以說,一切信息來源于自然界,來源于人類社會(huì)。人們的生產(chǎn)、科研、生活以及政治活動(dòng)等等是信息產(chǎn)生的源泉。三類:A、人物信息源,主要指語言信息源(零次信息)例如沙龍、授課B、實(shí)物信息源例如樣本、模型、雕塑等P36-37C、文獻(xiàn)信息源:課程以它為主講解信息源的特點(diǎn):P422023年2月3日第13頁文獻(xiàn):一種最重要的信息源,記錄有知識(shí)的一切載體。P19重點(diǎn)文獻(xiàn)有四個(gè)最基本的要素:

——(1)構(gòu)成文獻(xiàn)內(nèi)核(內(nèi)容)的信息、數(shù)據(jù)、事實(shí)和知識(shí)。(文獻(xiàn)信息)——(2)負(fù)載信息、數(shù)據(jù)、事實(shí)和知識(shí)的物質(zhì)載體。(文獻(xiàn)載體)——(3)記錄信息、數(shù)據(jù)、事實(shí)和知識(shí)的符號(hào)系統(tǒng)。(符號(hào)系統(tǒng))——(4)代表文獻(xiàn)符號(hào)進(jìn)入載體的方法和過程.(記錄方式)物質(zhì)形態(tài)構(gòu)成文獻(xiàn)的重要手段信息、數(shù)據(jù)、事實(shí)和知識(shí)內(nèi)核載體符號(hào)系統(tǒng)2023年2月3日第14頁P(yáng)35文獻(xiàn)按信息的加工程度或等級(jí)結(jié)構(gòu)分為:零次信息、一次信息、二次信息、三次信息一次信息又稱原始信息,常常通過二次信息才能獲取獲取原始文獻(xiàn)的方法和途徑

P165①利用文獻(xiàn)線索,查詢館藏目錄(本單位圖書館館)②借助館藏聯(lián)合目錄(館際互借)③申請(qǐng)文獻(xiàn)定購、傳遞服務(wù)(文獻(xiàn)傳遞)④試查網(wǎng)上免費(fèi)電子期刊⑤全文數(shù)據(jù)庫⑥利用文獻(xiàn)資源保障系統(tǒng)⑦E—mail向著者索?。ㄙ徺I)2023年2月3日第15頁參考文獻(xiàn)標(biāo)準(zhǔn)格式1、概念

是學(xué)術(shù)論文的重要組成部分。是在學(xué)術(shù)研究過程中,對(duì)某一著作或論文的整體的參考或借鑒。征引過的文獻(xiàn)在注釋中已注明,不再出現(xiàn)于文后參考文獻(xiàn)中。2、作用

A、以示在前人研究成果基礎(chǔ)上的繼承和發(fā)展,表明作者從事研究工作的真實(shí)科學(xué)依據(jù)和嚴(yán)肅的科學(xué)態(tài)度。B、表示作者對(duì)他人勞動(dòng)成果的尊重和承認(rèn)。C、提供引用資料的出處,便于讀者擴(kuò)大檢索范圍。2023年2月3日第16頁參考文獻(xiàn)標(biāo)準(zhǔn)格式1、概念

是學(xué)術(shù)論文的重要組成部分。是在學(xué)術(shù)研究過程中,對(duì)某一著作或論文的整體的參考或借鑒。征引過的文獻(xiàn)在注釋中已注明,不再出現(xiàn)于文后參考文獻(xiàn)中。2、作用

A、以示在前人研究成果基礎(chǔ)上的繼承和發(fā)展,表明作者從事研究工作的真實(shí)科學(xué)依據(jù)和嚴(yán)肅的科學(xué)態(tài)度。B、表示作者對(duì)他人勞動(dòng)成果的尊重和承認(rèn)。C、提供引用資料的出處,便于讀者擴(kuò)大檢索范圍。2023年2月3日第17頁一:參考文獻(xiàn)類型(實(shí)驗(yàn)相關(guān))專著[M],論文集[C],期刊文章[J],學(xué)位論文[D],標(biāo)準(zhǔn)[S],專利[P],論文集中的析出文獻(xiàn)[A]電子文獻(xiàn)類型:數(shù)據(jù)庫[DB],計(jì)算機(jī)[CP],電子公告[EB]電子文獻(xiàn)的載體類型:互聯(lián)網(wǎng)[OL],光盤[CD],磁帶[MT],磁盤[DK]2023年2月3日第18頁舉例:1.專著、學(xué)位論文

格式:[序號(hào)]主要責(zé)任者.文獻(xiàn)題名[文獻(xiàn)類型標(biāo)識(shí)].出版地:出版者,出版年.起止頁碼(可選)

A.劉國鈞,陳紹業(yè).圖書館目錄[M].北京:高等教育出版社,1957.15-18.B、[3]張筑生.微分半動(dòng)力系統(tǒng)的不變集[D].北京:北京大學(xué)數(shù)學(xué)系數(shù)學(xué)研究所,1983.2.期刊文章[序號(hào)]主要責(zé)任者.文獻(xiàn)題名[J].刊名,年,卷(期):起止頁碼

A.[1]何齡修.讀南明史[J].中國史研究,1998,(3):167-173.2023年2月3日第19頁3.論文集中的析出文獻(xiàn)(會(huì)議)[序號(hào)]析出文獻(xiàn)主要責(zé)任者.析出文獻(xiàn)題名[A].原文獻(xiàn)主要責(zé)任者(可選).原文獻(xiàn)題名[C].出版地:出版者,出版年.起止頁碼例子:[7]鐘文發(fā).非線性規(guī)劃在可燃毒物配置中的應(yīng)用[A].趙煒.運(yùn)籌學(xué)的理論與應(yīng)用——中國運(yùn)籌學(xué)會(huì)第五屆大會(huì)論文集[C].西安:西安電子科技大學(xué)出版社,1996.468.2023年2月3日第20頁4.國際、國家標(biāo)準(zhǔn)[序號(hào)]標(biāo)準(zhǔn)編號(hào),標(biāo)準(zhǔn)名稱[S].

實(shí)例:

[13]GB/T16159-1996,漢語拼音正詞法基本規(guī)則[S].5.專利實(shí)例:[序號(hào)]專利所有者.專利題名[P].專利國別:專利號(hào),出版日期

[14]姜錫洲.一種溫?zé)嵬夥笏幹苽浞桨竅P].中國專利:881056073,1989-07-262023年2月3日第21頁5.電子文獻(xiàn)

[文獻(xiàn)類型/載體類型標(biāo)識(shí)]:[J/OL]網(wǎng)上期刊、[EB/OL]網(wǎng)上電子公告、[M/CD]光盤圖書、[DB/OL]網(wǎng)上數(shù)據(jù)庫、[DB/MT]磁帶數(shù)據(jù)庫格式:[序號(hào)]主要責(zé)任者.電子文獻(xiàn)題名[電子文獻(xiàn)及載體類型標(biāo)識(shí)].電子文獻(xiàn)的出版或獲得地址,發(fā)表更新日期/引用日期例子:[12]王明亮.關(guān)于中國學(xué)術(shù)期刊標(biāo)準(zhǔn)化數(shù)據(jù)庫系統(tǒng)工程的進(jìn)展[EB/OL]./pub/wml.html,1998-08-16/1998-10-01.2023年2月3日第22頁4二十大信息源圖書、期刊、、會(huì)議文獻(xiàn)、專利文獻(xiàn)、標(biāo)準(zhǔn)文獻(xiàn)、學(xué)術(shù)論文、電子文獻(xiàn)、報(bào)紙、報(bào)告、政府文獻(xiàn)、產(chǎn)品資料、檔案、古籍、制圖資料、樂譜、縮微品、圖形制品、視聽資料、檢索工具、參考工具等2023年2月3日第23頁4.1圖書聯(lián)合國教科文組織規(guī)定:5~49頁印刷品為小冊(cè)子,50頁以上的正式印刷品為圖書。圖書有以下優(yōu)缺點(diǎn):出版量大,穩(wěn)定性強(qiáng),質(zhì)量較高,保存期長,但編輯出版周期較長,傳遞知識(shí)信息相對(duì)較慢。圖書主要包括專著、教科書、工具書、圖冊(cè)、讀物和文集等。圖書著錄的主要外部特征是:書名、著者、出版社名稱、出版地、出版時(shí)間、總頁數(shù)和國際標(biāo)準(zhǔn)書號(hào)(ISBN)。其中出版社名稱①、出版地或出版國②、出版時(shí)間③、總頁數(shù)或頁碼范圍④、國際標(biāo)準(zhǔn)書號(hào)(ISBN)⑤是辨識(shí)圖書的主要外部特征;圖書辨識(shí)的直接關(guān)鍵詞①是“出版(社、者)”,英文詞是Press、Publication(Pub.)、Publisher。

2023年2月3日第24頁例如:(1)江永紅,主編.統(tǒng)計(jì)學(xué).合肥②:中國科學(xué)技術(shù)大學(xué)出版社①,2002③,239頁④,ISBN7-312-01363-5⑤(2)C.Granell,J.Poveda,M.Gould.IncrementalCompositionofGeographicWebServices:AnEmergencyManagementContext..F.Toppen,P.Pastracos(eds.):Proc.ofthe7thConferenceonGeographicInformationScience(AGILE2004③)Heraklion②,Creta(Grecia)②.Abril2004③,CreteUniversityPress①,pp.343-348④(ISBN:960-524-176-5⑤)(3)JavierNogueras-Iso,F(xiàn).J.Zarazaga-Soria,P.R.Muro-Medrano.GeographicInformationMetadataForSpatialDataInfrastructures-Resources,Interoperability,InformationRetrieval.SpringerVerlag①,Germany②,ISBN:3-540-24464-6⑤,264pages④,March2005③2023年2月3日第25頁ISBN號(hào)是國際標(biāo)準(zhǔn)書號(hào)(InternationalStandardBookNumber)的簡稱,它是國際標(biāo)準(zhǔn)化組織于1972年、2005年公布的一項(xiàng)國際通用的出版物統(tǒng)一編號(hào)方法。2007年1月1日以前的ISBN號(hào)由10位數(shù)字組成,以后由13位組成。2007年1月1日以前的ISBN號(hào)由10位數(shù)字組成,分成4段組成,各段依次是:地區(qū)或語種號(hào)-出版商代號(hào)-書名號(hào)-校驗(yàn)號(hào)。其中地區(qū)或語種號(hào):英、美、加、南非等英語區(qū)為0,其它英語區(qū)為1,法語區(qū)為2,德語區(qū)為3,日本是4,俄語區(qū)為5,中國大陸為7,印度等為8,東南亞地區(qū)為9。如7-302-02372-7,表示中國大陸代號(hào)為302的(清華大學(xué))出版社,出版的一種圖書,其書號(hào)為02372、該書的校驗(yàn)碼為7。2007年1月1日以后由13位組成目前共分五段:978(979)+地區(qū)或語種號(hào)-出版商代號(hào)-書名號(hào)-校驗(yàn)號(hào)(1)前綴978或979,為3位EAN(歐洲商品編號(hào)),代表圖書。后面同10位ISBN例如:《Frontpage網(wǎng)頁設(shè)計(jì)》一書的ISBN號(hào)是:978-7-118-01984-4,所代表的意思是:“978”為歐洲商品編號(hào)中圖書;“7”代表中國(中文);“118”代表國防工業(yè)出版社;“01984”代表書名號(hào);“4”代表檢驗(yàn)碼。2023年2月3日第26頁圖書的主要檢索工具(數(shù)據(jù)庫)檢索途徑:書名、著者、ISBN、分類、主題(知道5種以上)圖書檢出版信息檢索工具:《全國新書目》、《新華書目報(bào)》、《出版社目錄》圖書館目錄信息檢索系統(tǒng):本館OPAC(ILAS)、本地互借館、北圖、中科圖、CALIS等。網(wǎng)上書店:亞馬遜網(wǎng)上書店、當(dāng)當(dāng)書店、上海書城數(shù)字圖書館:美國國會(huì)圖書館、中國國家圖書館、上海圖書館、本地?cái)?shù)字圖書館(書生、超星、Apabi)、讀秀、NetLibrary、MyiLibrary和中美百萬冊(cè)數(shù)字圖書館(CADAL)等。其他:中國ISBN信息網(wǎng)(/main)網(wǎng)絡(luò)小說:基本上是一些固定的網(wǎng)站。2023年2月3日第27頁4.2期刊期刊(Periodical),又稱“雜志”(Journal)、“連續(xù)出版物”(Serials),指有固定名稱、統(tǒng)一開本、有編號(hào)或年月標(biāo)志、定期或不定期連續(xù)出版、每期內(nèi)容不重復(fù)并由多名責(zé)任者撰寫不同文章的出版物。與圖書相比,期刊的特點(diǎn)是:出版周期較短,內(nèi)容新穎,學(xué)術(shù)性強(qiáng),信息量大,能及時(shí)反映各學(xué)科發(fā)展的最新動(dòng)向和科學(xué)研究的最新成果,被稱為“整個(gè)科學(xué)史上最成功的無處不在的科學(xué)信息載體”。學(xué)術(shù)質(zhì)量高的兩類期刊

——核心期刊,指那些發(fā)表該學(xué)科或該領(lǐng)域論文較多、使用率(被引率)較高、學(xué)術(shù)影響較大的期刊。

——同行評(píng)審(PeerReview)期刊。圖書館一般把當(dāng)年的期刊稱為“現(xiàn)刊”,當(dāng)年以前的期刊稱為“過刊”。相應(yīng)地也有“現(xiàn)刊閱覽室”和“過刊閱覽室”的設(shè)置和稱呼。2023年2月3日第28頁期刊的類型有五大類,并且有自己的常用冠名:i.學(xué)術(shù)性、技術(shù)性刊物,是科技期刊的核心部分??话銥椋篈cta(學(xué)報(bào))、Journal(雜志)、Annals、Chronicle(紀(jì)事)、Annual(年刊)、Bulletin(通報(bào))、Transactions(匯刊)、Proceedings(會(huì)刊)、Review(評(píng)論)、Progress或Advancesin...(進(jìn)展)等。ii.快報(bào)性刊物。刊名一般為:Communication(通訊)、Letters(快報(bào))、Bulletin等。iii.消息性(NewsyJournals)刊物。多數(shù)是新聞,刊名一般為:News(新聞)、NewsLetters(新聞快報(bào))等。iv.資料性(DataJournals)刊物??话銥椋篋ata、Event等。v.檢索性刊物??话銥椋篒ndex,Abstract等。期刊文獻(xiàn)著錄的主要外部特征是:論文題名、著者、刊名、卷號(hào)(Vol.)、期號(hào)(No.)、年月號(hào)、起止頁號(hào)、國際標(biāo)準(zhǔn)刊號(hào)(1SSN)。其中:卷號(hào)(Vol.)①、期號(hào)(No.)②、年月號(hào)③、起止頁號(hào)④、國際標(biāo)準(zhǔn)刊號(hào)(1SSN)⑤是辨識(shí)期刊文獻(xiàn)的主要外部特征;上述期刊類型的常用冠名也是辨識(shí)期刊的直接關(guān)鍵詞⑥。

2023年2月3日第29頁(1)王玲.基于知識(shí)發(fā)現(xiàn)的生物信息學(xué).生物工程進(jìn)展⑥,2000③,Vol.20①,No.3②:27-29④,ISSN1003-3565⑤(2)Guterman,L.ThePromiseandPerilof“OpenAccess”.Chronicle⑥ofHigherEducation,January30,2004③,50①(21②):A10-12,A14④,ISSN:0009-5982⑤(3)Poveda,J.andM.Gould.TheBQValgorithmforpoint-in-polygondetermination.GESTSInternationalTransactions⑥onComputerScienceandEngineering,Vol.6①,No.1②,

pages:207-218④.Jan.2005③常見形式——Poveda,J.andM.Gould.TheBQValgorithmforpoint-in-polygondetermination.GESTSInternationalTransactionsonComputerScienceandEngineering,2005,6(1):207-218.2023年2月3日第30頁國際標(biāo)準(zhǔn)刊號(hào)(ISSN)等由8位數(shù)字分兩段組成,如1000-0135,前7位是期刊代號(hào),末位是校驗(yàn)號(hào)。我國正式出版的期刊都有國內(nèi)統(tǒng)一刊號(hào)(CN),它由地區(qū)號(hào)、報(bào)刊登記號(hào)和《中圖法》分類號(hào)組成,如CN11-2257/G3。地區(qū)號(hào)依《中華人民共和國行政區(qū)劃編碼表GB2260-82》取前兩位,如北京為11、天津12、上海31、遼寧21、吉林22、四川51等。2023年2月3日第31頁圖書館目錄信息檢索系統(tǒng):本館OPAC(ILAS)、本地互借館、北圖、中科圖、CALIS、全國報(bào)刊目錄索引等。中文期刊全文數(shù)據(jù)庫:《中文科技期刊全文數(shù)據(jù)庫》(維普)、《中國期刊網(wǎng)全文數(shù)據(jù)庫》(CNKI)、《中國數(shù)字化期刊群》(萬方)、中國國家科技圖書文獻(xiàn)中心(NSTL)的期刊數(shù)據(jù)庫、讀秀等。外文期刊文摘數(shù)據(jù)庫:cnpLINKer、Ingenta、NSTL、CASHL、GeoRef、PetroleumAbstracts(Ovid平臺(tái))、(Engineeringindex)EiVillage2、SCI(ISIWebofScience

)和國外石油文獻(xiàn)數(shù)據(jù)庫等。外文期刊全文數(shù)據(jù)庫:ElsevierSDOL(ScienceDirectOnline)、Wiley-Blackwell、Springer、OxfordJournals、InfoTrac、IEL、ASMEElectronicLibrary、ACSJournals、GeoScienceWorld、ProQuestLibrary、EBSCOhost等。期刊的主要檢索工具(數(shù)據(jù)庫)(知道5種以上)

2023年2月3日第32頁4.3報(bào)紙報(bào)紙(Paper,Newspaper)在國外被稱為新聞報(bào)紙。是專門刊載新聞報(bào)道和時(shí)事評(píng)論為主的定期出版物;但有些報(bào)紙同時(shí)也刊載學(xué)術(shù)論文和其它信息。報(bào)紙具有時(shí)事性、時(shí)效性、普及性、大眾性,出版周期短,傳遞信息快速,傳播范圍廣,是不容忽視的文獻(xiàn)信息源。2023年2月3日第33頁4.4會(huì)議文獻(xiàn)會(huì)議文獻(xiàn)(ConferenceLiterature)是指在學(xué)術(shù)會(huì)議上宣讀或書面交流的報(bào)告、論文、會(huì)議記錄、會(huì)議紀(jì)要等有關(guān)資料,是科學(xué)交流的一條重要渠道。它往往反映出科學(xué)技術(shù)的發(fā)展趨勢(shì),其特點(diǎn)是與最新成果的間隔時(shí)間短,但其內(nèi)容與期刊相比可能不太成熟。會(huì)議文獻(xiàn)具有水平高、針對(duì)性強(qiáng)、發(fā)表快的特點(diǎn),不少論文常常在正式發(fā)表前先提交學(xué)術(shù)會(huì)議交流。全世界每年召開的學(xué)術(shù)會(huì)議超過上萬次,正式發(fā)行的各種專業(yè)論文集、會(huì)議錄近4000種,約有50%的會(huì)議只在會(huì)前印發(fā)論文、論文摘要或論文目錄等會(huì)前文獻(xiàn),不出版會(huì)后論文集、會(huì)議錄。2023年2月3日第34頁會(huì)議和會(huì)議文獻(xiàn)常用的主要名稱有Conference(大會(huì))、Meeting(小型會(huì)議)、Symposium(討論會(huì))、Seminar(研討會(huì))Proceeding(會(huì)議錄)、Paper(單篇論文)、Transaction(匯報(bào))等。英文常用Transactions表示會(huì)議上發(fā)表的匯編論文;Proceedings、Symposium表示會(huì)議的記錄和會(huì)后整理出版的會(huì)議論文錄、論文集。會(huì)議文獻(xiàn)著錄的主要外部特征是:論文題名、著者、編者、會(huì)議名稱或會(huì)議論文集名稱、會(huì)議地或主辦國、會(huì)議年月日、論文在會(huì)議論文集中起止頁號(hào)、會(huì)議論文號(hào)。其中:會(huì)議名稱或會(huì)議論文集名稱①、會(huì)議地或主辦國②、會(huì)議年月日③、論文在會(huì)議論文集中起止頁號(hào)④、會(huì)議論文編號(hào)⑤是辨識(shí)會(huì)議文獻(xiàn)的主要外部特征;上述會(huì)議和會(huì)議文獻(xiàn)常用的主要名稱也是辨識(shí)的直接關(guān)鍵詞⑥。2023年2月3日第35頁例如:(1)X.Gai,S.Sun,M.F.WheelerandH.Klie,Atimesteppingschemeforcoupledreservoirflowandgeomechanicsonnonmatchinggrids,In:Proceedings⑥ofthe2005SPEAnnualTechnicalConferenceandExhibition①,Dallas,Texas,USA②,October9-12,2005③.(SPE97054⑤)[downloadPDF](2)S.SunandM.F.Wheeler,AdaptivediscontinuousGalerkinmethodsforcoupleddiffusion-andadvection-dominatedtransportphenomena,In:Proceedings⑥ofthe3rdInternationalConferenceonComputing①,CommunicationandControlTechnologies(CCCT'05),VolumeI,

ISBN:980-6560-46-9,H.-W.Chu,M.J.Savoie,andB.Sanchez,Eds.,pp.130-135④,Austin,Texas②,July24-27,2005③.[downloadPDF](3)R.Hedges,B.Loewe,andC.Morrone.ParallelFileSystemTestingfortheLunaticFringe:thecareandfeedingofrestlessI/OPowerUsers.Twenty-SecondIEEE/ThirteenthNASAGoddardConference⑥onMassStorageSystemsandTechnologies(MSST2005)①,Monterey,California,USA②.2005③,Pages.3-17④2023年2月3日第36頁圖書館目錄信息檢索系統(tǒng):本館OPAC(ILAS)、本地互借館、北圖、中科圖等。中文會(huì)議論文檢索工具(數(shù)據(jù)庫):中國學(xué)術(shù)會(huì)議論文庫、(/),包括中國學(xué)術(shù)會(huì)議論文文摘數(shù)據(jù)庫(CACP)和中國學(xué)術(shù)會(huì)議論文全文數(shù)據(jù)庫(PACC)、讀秀等。中文會(huì)議論文全文數(shù)據(jù)庫:NSTL中文會(huì)議論文數(shù)據(jù)庫(通過文獻(xiàn)傳遞)、CNKI會(huì)議論文數(shù)據(jù)庫、萬方數(shù)據(jù)會(huì)議論文類數(shù)據(jù)庫等。外文會(huì)議論文檢索工具(數(shù)據(jù)庫):NSTL外文會(huì)議論文數(shù)據(jù)庫、GeoRef、PetroleumAbstracts(Ovid平臺(tái))、Engineeringindex(EiVillage2)、ISIProceedings和國外石油文獻(xiàn)數(shù)據(jù)庫等。外文會(huì)議全文數(shù)據(jù)庫:IEL、SPEeLibrary和OTCPapersOnline等。會(huì)議文獻(xiàn)的主要檢索工具(數(shù)據(jù)庫)2023年2月3日第37頁4.5學(xué)位論文學(xué)位論文(Thesis,Dissertation)指高等學(xué)校、科研機(jī)構(gòu)所培養(yǎng)的碩士生、博士生為取得學(xué)位資格而呈遞的畢業(yè)論文,具有較高的學(xué)術(shù)水平和學(xué)術(shù)價(jià)值。學(xué)位論文是非賣品也不公開發(fā)行,通常只在學(xué)位授予單位的圖書館和按國家規(guī)定接受呈繳本的圖書館保存有副本,故學(xué)位論文的收集與利用不如其它類型的文獻(xiàn)方便。例如:在中國,國家科技文獻(xiàn)中心(NSTL)、中國科技信息研究所、萬方數(shù)據(jù)、CNKI(同方)都集中收藏和報(bào)道國內(nèi)各學(xué)位授予單位的博/碩士學(xué)位論文。在美國,由國際大學(xué)縮微品公司(UniversityMicrofilmsInternational--UMI)負(fù)責(zé)收藏和報(bào)道全美的博士、碩士論文,并收集報(bào)道其他國家的學(xué)位論文。在英國,由英國國家圖書館(不列顛圖書館)負(fù)責(zé)收藏和報(bào)道本國的學(xué)位論文。在日本,國立大學(xué)的學(xué)位論文由日本國立圖書館統(tǒng)一收藏,私立大學(xué)的學(xué)位論文則收藏在學(xué)位授予單位的圖書館中。2023年2月3日第38頁學(xué)位論文著錄的主要外部特征是:學(xué)位名稱、導(dǎo)師姓名、學(xué)位授予機(jī)構(gòu)、學(xué)位授予時(shí)間等。學(xué)位論文辨識(shí)的直接關(guān)鍵詞①是“學(xué)位論文”和“學(xué)位名稱”,英文詞是DoctoralDissertation和MS、M.B.A.、Ph.D.、Eng.D、D.S.等。例如:(1)Chang,D.H.(2000).Knowledge,culture,andidentity:AmericaninfluenceonthedevelopmentofLibraryandInformationScienceinSouthKorea.Unpublisheddoctoraldissertation①,Univ.ofTexasatAustin(2)2005,Tsai,Hwai.PricingDiscreteDouble-BarrierOptionswiththeQuadratureMethod.MBAthesis①.(3)Allen,B.,LearningBodyShapeModelsfromReal-WorldData,Ph.D.Thesis①,2005.(pdf)2023年2月3日第39頁4.7標(biāo)準(zhǔn)文獻(xiàn)標(biāo)準(zhǔn)文獻(xiàn)(StandardLiterature)是經(jīng)權(quán)威主管機(jī)構(gòu)批準(zhǔn),采用文件形式或規(guī)定基本單位(物理常數(shù))這兩種形式固定下來、以文件形式出現(xiàn)的法定性文獻(xiàn)。標(biāo)準(zhǔn)文獻(xiàn)以特定形式對(duì)重復(fù)性事物和概念所作統(tǒng)一規(guī)定,是科學(xué)、技術(shù)和社會(huì)實(shí)踐中非常重要的信息資源。按標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容劃分有基礎(chǔ)標(biāo)準(zhǔn)、產(chǎn)品標(biāo)準(zhǔn)、方法標(biāo)準(zhǔn)、安全衛(wèi)生標(biāo)準(zhǔn)等;按成熟程度劃分有法定標(biāo)準(zhǔn)、推薦標(biāo)準(zhǔn)、試行標(biāo)準(zhǔn);按使用范圍劃分有國際標(biāo)準(zhǔn)、區(qū)域標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、企業(yè)標(biāo)準(zhǔn)等。國際標(biāo)準(zhǔn)化機(jī)構(gòu)中最重要、影響最大的是1947年成立的國際標(biāo)準(zhǔn)化組織(ISO)和1906年成立的國際電工委員會(huì)(IEC),它們制定或批準(zhǔn)的標(biāo)準(zhǔn)具有廣泛的國際影響。2023年2月3日第40頁標(biāo)準(zhǔn)文獻(xiàn)都有標(biāo)準(zhǔn)號(hào),它通常由國別(組織)代碼+順序號(hào)+年代組成,如ISO3297-1986。我國的國家標(biāo)準(zhǔn)分為強(qiáng)制性的國標(biāo)(GB)和推薦性的國標(biāo)(GB/T),如GB18187-2000、GB/T2662-1999;行業(yè)標(biāo)準(zhǔn)代碼以主管部門名稱的漢語拼音聲母表示,如JT表示交通行業(yè)標(biāo)準(zhǔn)、SY表示石油行業(yè)標(biāo)準(zhǔn);企業(yè)標(biāo)準(zhǔn)編號(hào):Q/省、市簡稱+企業(yè)名代碼+年份。國際常用標(biāo)準(zhǔn)文獻(xiàn)的代碼如下表:代碼國家或組織代碼國家或組織ISO國際標(biāo)準(zhǔn)化組織DIN德國國家標(biāo)準(zhǔn)IEC國際電工委員會(huì)ГOCT俄羅斯國家標(biāo)準(zhǔn)ANSI美國國家標(biāo)準(zhǔn)GB中國國家標(biāo)準(zhǔn)BS英國國家標(biāo)準(zhǔn)ASME美國機(jī)械工程師協(xié)會(huì)標(biāo)準(zhǔn)CEN歐洲標(biāo)準(zhǔn)化委員會(huì)ASTM美國材料和實(shí)驗(yàn)標(biāo)準(zhǔn)CENELEC歐洲電子技術(shù)標(biāo)準(zhǔn)委員會(huì)API美國石油協(xié)會(huì)標(biāo)準(zhǔn)JIS日本工業(yè)標(biāo)準(zhǔn)IEEE美國電氣與電子標(biāo)準(zhǔn)NF法國國家標(biāo)準(zhǔn)ITU國際電訊聯(lián)盟標(biāo)準(zhǔn)2023年2月3日第41頁標(biāo)準(zhǔn)文獻(xiàn)著錄的主要外部特征是:標(biāo)準(zhǔn)級(jí)別、標(biāo)準(zhǔn)名稱、標(biāo)準(zhǔn)號(hào)、審批機(jī)構(gòu)、頒布時(shí)間、實(shí)施時(shí)間等。標(biāo)準(zhǔn)文獻(xiàn)辨識(shí)的直接關(guān)鍵詞①是“標(biāo)準(zhǔn)”(Standard)與“標(biāo)準(zhǔn)號(hào)”。例如:(1)評(píng)定水在烴和脂肪酯潤滑劑中溶解度的標(biāo)準(zhǔn)①試驗(yàn)方法,ASTMD4056-2001①(2)信息技術(shù)自動(dòng)識(shí)別與數(shù)據(jù)采集技術(shù)條碼碼制規(guī)范①交插二五條碼,GB/T16829-2003①(3)RecommendedPracticeStandard①ProcedureforFieldTestingWater-BasedDrillingFluids.SecondEdition,Addendum,1May2000.APIRP13B-1①(4)NACE

Standard①

RP0775-2005①.Preparation,Installation,Analysis,andInterpretationofCorrosionCouponsinOilfieldOperations.2005-04-07.

2023年2月3日第42頁4.9專利文獻(xiàn)專利(Patent)是受專利法保護(hù)的技術(shù)發(fā)明,并獨(dú)占其制造、使用和銷售的權(quán)利。專利文獻(xiàn)(PatentLiterature)是實(shí)行專利的國家、地區(qū)及國際專利組織在審批專利過程中產(chǎn)生的官方文件及出版物,包括專利說明書、專利權(quán)利要求書、專利公報(bào)、專利分類表、專利檢索工具等。專利類型有:發(fā)明專利(InventionPatent)、實(shí)用新型專利(UtilityModelPatent)和外觀設(shè)計(jì)專利(DesignPatent)等。專利文獻(xiàn)著錄的主要外部特征有:申請(qǐng)?zhí)?、公開號(hào)、申請(qǐng)(專利權(quán))人、發(fā)明(設(shè)計(jì))人、申請(qǐng)日、公開(公告)日等。申請(qǐng)?zhí)柕慕M成:年份(2位)-專利類型(1位)-流水號(hào)(5位)-.X(校驗(yàn)位)。如02126306.x。公開號(hào),亦稱專利文獻(xiàn)號(hào),在專利的初審結(jié)束后,給予公開號(hào),組成方式為“國別號(hào)+分類號(hào)+流水號(hào)+標(biāo)識(shí)代碼”,如CN1340998A,表示中國的第340998號(hào)發(fā)明專利。

2023年2月3日第43頁專利文獻(xiàn)辨識(shí)的直接關(guān)鍵詞①是“專利號(hào)”(包括申請(qǐng)?zhí)?、公開號(hào))。例如:(1)一種消除注氣驅(qū)油過程中固溶物沉淀傷害的方法。CN200310103591.7①(申請(qǐng)?zhí)枺?,CN1616794①(公開號(hào))。(2)Shmakova-Lindeman,OlgaE.Paraffininhibitors.US

20050215437①(3)Miklos,H.Methodforthetreatmentandpreventionofasphaltene-paraffin-vaxprecipitatesinoil-wells,wellheadsandpipelinesbytheuseofbiocolloidsuspensions.EP1552106①;WO2004031536(A1)①;CA2501359(A1)①;AU2003274389①2023年2月3日第44頁4.10電子文獻(xiàn)的信息源

電子文獻(xiàn)也稱數(shù)字文獻(xiàn)、計(jì)算機(jī)文件。P33網(wǎng)絡(luò)或特定服務(wù)器上的電子文獻(xiàn)是用戶便捷的信息來源。1.二次信息數(shù)據(jù)庫,有時(shí)習(xí)慣上稱為文摘數(shù)據(jù)庫。主要包括:書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫、索引數(shù)據(jù)庫,其中文摘數(shù)據(jù)庫的作用、影響最大。如《科學(xué)引文索引》(SCI)、《化學(xué)文摘》(CA)、《工程索引》(EI)、《石油文摘》(PA)等數(shù)據(jù)庫。2.全文數(shù)據(jù)庫。它是收錄有原始文獻(xiàn)全文的數(shù)據(jù)庫,以圖書、期刊論文、會(huì)議論文、政府出版物、研究報(bào)告、法律條文和案例、商業(yè)信息等為主。收錄有全文圖書的數(shù)據(jù)庫有時(shí)稱為數(shù)字圖書館,如前面提到的超星數(shù)字圖書館等。有的全文數(shù)據(jù)庫也收錄文獻(xiàn)的文摘信息,如國外的EBOCO、ProQuestLibrary等。3.數(shù)值和事實(shí)數(shù)據(jù)庫。4.多媒體數(shù)據(jù)庫。2023年2月3日第45頁1.4信息檢索現(xiàn)象:

查找資料:例如,常跑書店和圖書館的新書閱覽室,注意相應(yīng)領(lǐng)域新書出版的情況,定期閱覽書評(píng)與文獻(xiàn)報(bào)道,了解學(xué)術(shù)會(huì)議的召開和論文交流情況等,在此基礎(chǔ)上建立個(gè)人的資料檔,在需要時(shí)隨時(shí)調(diào)看。這種方法雖然有效,但只限于本人所遇到的機(jī)會(huì),發(fā)現(xiàn)有價(jià)值的資料帶有一定的偶然性。

現(xiàn)實(shí):檢索,是根據(jù)特定的需求,運(yùn)用某種檢索工具,按照一定的方法,去尋找資料或信息的工作過程,這種方法利用的是序化的信息系統(tǒng)和信息業(yè)提供的服務(wù)來滿足自己的信息需求。需要知道和利用一些工具。2023/2/3第46頁1信息檢索的基本概念1.1信息檢索的涵義P1從信息集合中找出所需信息的過程。

從廣義上講,信息檢索包括兩個(gè)過程,一是信息存儲(chǔ)(informationstorage),即信息的標(biāo)引、加工和存儲(chǔ)過程:二是信息檢索(informationretrieval),即信息用戶的查找過程。從狹義上講,信息檢索僅指后一部分。信息檢索的本質(zhì)是一個(gè)匹配的過程即用戶的信息需求和信息存儲(chǔ)的信息集合進(jìn)行比較和選擇的過程2023年2月3日第47頁P(yáng)5-11信息檢索的方法、意義和作用2023/2/3第48頁信息存儲(chǔ)和檢索過程的基本原理

P153輸出一次信息信息特征檢索語言信息特征標(biāo)識(shí)檢索結(jié)果信息需求檢索提問檢索提問標(biāo)識(shí)分析標(biāo)引標(biāo)引輸入檢索信息檢索系統(tǒng)(工具)存儲(chǔ)過程檢索過程分析2023年2月3日第49頁信息檢索的發(fā)展手工檢索機(jī)械信息檢索計(jì)算機(jī)信息檢索網(wǎng)絡(luò)檢索移動(dòng)搜索2023/2/3第50頁

計(jì)算機(jī)信息檢索是對(duì)信息進(jìn)行收集、分類、標(biāo)引、著錄,并加以有序化組織,將信息儲(chǔ)存到計(jì)算機(jī)存儲(chǔ)信息系統(tǒng)中,編制出一個(gè)信息檢索系統(tǒng)或信息檢索工具的過程。1.2計(jì)算機(jī)信息檢索2023/2/3第51頁用戶輸入檢索需求分析轉(zhuǎn)換處理需求數(shù)據(jù)庫檢索=概念詞的相關(guān)匹配運(yùn)算概念詞典控制詞表信息源篩選錄入分類、詞索引文檔預(yù)處理

計(jì)算機(jī)信息檢索的基本原理2023年2月3日第52頁2檢索系統(tǒng)

檢索系統(tǒng)(retrievalsystem)是指根據(jù)特定的信息需求而建立起來的一種有關(guān)信息搜集、加工、存儲(chǔ)和檢索的程序化系統(tǒng),其主要目的是為人們提供信息服務(wù)。檢索系統(tǒng)也稱檢索工具,他們都具有相同的(P56)檢索界面

掌握一種檢索工具,其他的都基本一樣只要知道URL(P54)就OK了。2023年2月3日第53頁3檢索語言

檢索語言(retrievallanguage)是文獻(xiàn)信息標(biāo)引和檢索提問而約定的人工語言。

檢索語言是為溝通文獻(xiàn)標(biāo)引與文獻(xiàn)檢索而編制的人工語言,也是連接信息存儲(chǔ)和檢索兩個(gè)過程中標(biāo)引人員與檢索人員雙方思路的渠道。

——在存儲(chǔ)的過程中用于標(biāo)引信息稱為標(biāo)引語言;

——用于編制索引就稱為索引語言;

——用于信息檢索則稱為檢索語言。2023年2月3日第54頁中國圖書館圖書分類法基本部類:1、馬克思主義、列寧主義、毛澤東思想、鄧小平理論2、哲學(xué)3、社會(huì)科學(xué)4、自然科學(xué)5、綜合性圖書基本大類:(22個(gè))

A馬列主義毛澤東思想鄧小平理論N自然科學(xué)總論

B哲學(xué)O數(shù)理化科學(xué)

C社會(huì)科學(xué)總論P(yáng)天文學(xué)、地理

D政治、法律Q生物科學(xué)

E軍事R醫(yī)學(xué)、衛(wèi)生

F經(jīng)濟(jì)S農(nóng)業(yè)科學(xué)

G文化、科學(xué)、教育、體育T工業(yè)技術(shù)

H語言、文字U交通運(yùn)輸

I文學(xué)V航空、航天

J藝術(shù)X環(huán)境科學(xué)

K歷史、地理Z綜合性圖書

2023年2月3日第55頁3.2信息檢索的途徑

檢索途徑:以信息源的某一特征為檢索的出發(fā)點(diǎn)。如著作途徑、題名檢索途徑。

一般有以下兩種途徑

A、外部特征

B、內(nèi)部內(nèi)容2023年2月3日第56頁3.2信息檢索的途徑

2023年2月3日第57頁4計(jì)算機(jī)檢索技術(shù)

計(jì)算機(jī)檢索技術(shù)是指應(yīng)用于信息檢索過程的原理、技術(shù)、方法、策略的總稱,是檢索系統(tǒng)為了提高檢索效率,從概念相關(guān)性、位置相關(guān)性等方面對(duì)檢索提問進(jìn)行組配、加權(quán)、擴(kuò)展、截詞、鄰近、限定的比較和運(yùn)算處理技術(shù)。2023年2月3日第58頁常用的計(jì)算機(jī)檢索技術(shù)布爾檢索技術(shù)1鄰近檢索技術(shù)3字段限定檢索技術(shù)4截詞檢索技術(shù)22023年2月3日第59頁布爾檢索P61布爾檢索(booleanretrieval)是用布爾邏輯算符將檢索詞、短語或代碼進(jìn)行邏輯組配的一種技術(shù),也是目前最常用的一種檢索技術(shù)。2023年2月3日第60頁邏輯“與”具有概念交叉或概念限定關(guān)系的組配,用“*”或“AND”算符表示。

檢索詞A和檢索詞B用“與”組配,檢索式為:

AANDB,或者A*B它表示檢出同時(shí)含有A、B兩個(gè)檢索詞的記錄。2023年2月3日第61頁邏輯“或”邏輯“或”是一種具有概念并列關(guān)系的組配,用“+”或“OR”算符表示。檢索詞A和檢索詞B用“或”組配,檢索式為:

AORB,或者A+B它表示檢出所有含有A詞或者B詞的記錄。2023年2月3日第62頁邏輯“非”

邏輯“非”是一種具有概念排除關(guān)系的組配,用“–”或“NOT”算符表示。檢索詞A和檢索詞B用“非”組配,檢索式為:

ANotB,或者A-B它表示檢出含有A詞,但同時(shí)不含B詞的記錄。2023年2月3日第63頁5信息檢索的基本步驟(書上第第六章)分析檢索課題1.主題概念2.信息類型3.時(shí)間范圍4.檢索目的構(gòu)造檢索式(試驗(yàn)性檢索)1.簡單提問式2.上下文提問式3.復(fù)合提問式4.結(jié)構(gòu)性提問式調(diào)整檢索策略(正式檢索)1,信息量過多時(shí)2.信息量太少時(shí)輸出檢索結(jié)果1.文摘2.全文選擇檢索系統(tǒng)1.學(xué)科范圍2.系統(tǒng)類型3.系統(tǒng)功能

確定檢索詞

1.切分2.刪除3.替補(bǔ)4.組合5.增加用戶評(píng)價(jià)

2023年2月3日第64頁5調(diào)整檢索策略(正式檢索)P155-161

所謂檢索策略(searchstrategy)就是為完成檢索課題,實(shí)現(xiàn)檢索目的,對(duì)檢索的全過程進(jìn)行謀劃之后所制定的全盤檢索方案。檢索策略的制定過程就是檢索提問式的不斷完善的過程,使用最初的檢索提問式是試驗(yàn)性檢索,使用調(diào)整后的完善檢索策略提問式是正式檢索。2023年2月3日第65頁調(diào)整檢索策略(正式檢索)1.當(dāng)檢索結(jié)果信息量過多時(shí)原因:選用了多義性的檢索詞;截詞截得過短;輸入的檢索詞太少;應(yīng)該使用“與(AND)”的使用了“或(OR)”;優(yōu)先運(yùn)算符“()”使用錯(cuò)誤??紤]縮小檢索范圍,方法如下:(1)采用專指性強(qiáng)的主題詞(主題詞表),減少同義詞、同族相關(guān)詞等相關(guān)性不強(qiáng)的檢索詞;(2)增加限制概念,采用“AND”算符連接檢索詞或進(jìn)行二次檢索;(3)使用字段限定,把檢索詞限定在題目、主題詞等主要字段;(4)縮短檢索年限,限制檢索結(jié)果的文獻(xiàn)類型、語種及出版國;(5)使用“NOT”算符,排除無關(guān)概念;(6)調(diào)整位置算符,由松變嚴(yán);(7)改模糊檢索為精確檢索。2023年2月3日第66頁調(diào)整檢索策略(正式檢索)例5:檢索建筑物的windows(窗口、窗戶)部分設(shè)計(jì)方面的文獻(xiàn)。檢索策略調(diào)整為以下檢索式:((((constructionORbuildingORarchitectur*)WNAllfields)AND((window*)WNTI))NOT((microsoft)WNAllfields))

。例4的檢索式在檢索英文時(shí)是沒有問題的,但如果檢索中文時(shí)仍使用以下檢索式:((((序列分析)WNTI)AND((方法*OR工具*OR儀器t*)WNAllfields))AND((地震)WNAllfields)),就會(huì)將許多不相關(guān)的內(nèi)容檢索出來。因?yàn)橹形臋z索詞“地震”有兩種完全不同的含義:一是英文用“earthquake”,二是英文用“seismic”。因此,正式檢索中文資料時(shí),應(yīng)該調(diào)整檢索策略,像例5那樣使用“NOT”算符,如輸入:災(zāi)害、損失、傷亡等進(jìn)行限制。2023年2月3日第67頁2.當(dāng)檢索結(jié)果信息量太少時(shí)P164原因:檢索詞拼寫錯(cuò)誤;遺漏重要的同義詞或隱含概念;檢索詞過于冷僻具體;沒有使用截詞算符;位置算符和字段算符使用的過多;使用過多的“AND”算符。考慮擴(kuò)大檢索范圍,方法如下:(1)根據(jù)詞表的分類結(jié)構(gòu)體系擴(kuò)展關(guān)鍵的檢索詞,用“擴(kuò)展”按鈕增加同義詞和相關(guān)詞并用“OR”算符連接這些詞;(2)降低檢索詞的專指度,可從詞表或檢出文獻(xiàn)中選擇上位詞或泛指詞補(bǔ)充到檢索式中;(3)減少檢索年限、文獻(xiàn)類型、語種及出版國的限制,如增加回溯檢索年限;(4)取消某些限制過嚴(yán)的字段限制、位置算符限制(或者改用限制程度較小的位置算符)(5)在詞干相同的單詞后使用截詞符(?或*);(6)改精確檢索為模糊檢索;(7)同時(shí)使用拼寫正確的詞,以及拼寫錯(cuò)誤的詞或存在多種普遍錯(cuò)別字的詞作為檢索詞。2023年2月3日第68頁調(diào)整檢索策略(正式檢索)例6:

在數(shù)據(jù)庫中檢索同時(shí)含有草莓、香草和巧克力三種口味的冰淇淋。英文檢索式:(((icecream)ANDstrawberryANDvanillaANDchocolate)WNAllfields)

。中文檢索式:(((冰淇淋)AND草莓AND香草AND巧克力)WNAllfields)進(jìn)行試驗(yàn)性檢索后發(fā)現(xiàn),由于中文“冰淇淋”存在多種普遍的錯(cuò)別字,如:“冰激凌”、“冰激淋”、“冰淇凌”等,檢索結(jié)果極不完整,需要將幾種普遍錯(cuò)別字的詞作為檢索詞,并用“OR”算符連接這些詞,進(jìn)一步調(diào)整檢索策略。此外,例3也是擴(kuò)大檢索范圍提高檢索結(jié)果查全率的一個(gè)典型實(shí)例。2023年2月3日第69頁調(diào)整檢索策略(正式檢索)在實(shí)施檢索時(shí),應(yīng)及時(shí)分析檢索結(jié)果與檢索的內(nèi)容、目的和要求是否一致,同時(shí)根據(jù)檢索結(jié)果的多少對(duì)檢索策略進(jìn)行相應(yīng)的修改和調(diào)整,以獲得最佳的查全率和查準(zhǔn)率,直至得到比較滿意的檢索結(jié)果為止。2023年2月3日第70頁調(diào)整檢索策略幾個(gè)措施P155-1641)信息需求分析這是第一步,大家必須掌握P155寫出課題名稱課題主題內(nèi)容,主要的詞匯主題內(nèi)容的相關(guān)詞,信息源類型年代、語種以及其他檢索條件分析2)選擇數(shù)據(jù)庫3)確定檢索詞4)編制檢索式.執(zhí)行檢索5)調(diào)整檢索式,優(yōu)化策略信息檢索的基本步驟1)分析檢索課題

2)選擇檢索系統(tǒng)

3)確定檢索詞

4)構(gòu)造檢索式5)調(diào)整檢索策略6)輸出檢索結(jié)果

2023年2月3日第71頁6輸出檢索結(jié)果

輸出結(jié)果一般文摘或全文。文摘數(shù)據(jù)庫的記錄輸出方式一般有三種方式:瀏覽、打印和存盤;輸出格式一般有四種方式:“打印格式(formatforprint)”、“存為文件格式(savetofile)”、“輸出格式(export)”、“email發(fā)送格式(E-mail)”。

全文數(shù)據(jù)庫的輸出方式一般也有三種方式:瀏覽、打印和存盤;輸出格式一般有四種情況:(1)HTML文件;(2)PDF文件;(3)圖像文件(需安裝IE瀏覽器插件);(4)數(shù)據(jù)庫專用閱讀器文件(需安裝數(shù)據(jù)庫商的專用瀏覽器,如國內(nèi)的CAJViewer、超星閱覽器)。2023年2月3日第72頁將向同學(xué)們推薦實(shí)現(xiàn)書目和全文信息檢索數(shù)據(jù)庫有:國內(nèi)數(shù)據(jù)庫中文科技期刊數(shù)據(jù)庫(vip)-學(xué)校已購買中國期刊全文數(shù)據(jù)庫(cnki)-學(xué)校已購買萬方數(shù)據(jù)庫-學(xué)校已購買超星電子圖書館-學(xué)校已購買NSTL-國家科技圖書文獻(xiàn)中心

–網(wǎng)絡(luò)注冊(cè)使用中國國家知識(shí)產(chǎn)權(quán)局專利數(shù)據(jù)庫-網(wǎng)絡(luò)注冊(cè)使用2023年2月3日第73頁國外數(shù)據(jù)庫Eivillage2-已購買使用權(quán)ElsevierScience-已購買使用權(quán)IEEE/IEEElectronicLibrary-已購買使用權(quán)

ISIWebofScienceCambridgeScientificAbstractsProQuestDigitalDissertations美國專利文獻(xiàn)數(shù)據(jù)庫:加拿大專利數(shù)據(jù)庫:http://patents1.ic.gc.ca/歐洲專利數(shù)據(jù)庫:/日本專利數(shù)據(jù)庫:www.jpo.go.jp2023年2月3日第74頁查全率和查準(zhǔn)率信息檢索的查全率和查準(zhǔn)率是信息檢索領(lǐng)域內(nèi)的概念,二者是反映檢索效果的重要指標(biāo)

查準(zhǔn)率(精度)是衡量某一檢索系統(tǒng)的信號(hào)噪聲比的一種指標(biāo),即檢出的相關(guān)文獻(xiàn)與檢出的全部文獻(xiàn)的百分比。普遍表示為:查準(zhǔn)率=(檢索出的相關(guān)信息量/檢索出的信息總量)x100%。查全率(召回率),是衡量某一檢索系統(tǒng)從文獻(xiàn)集合中檢出相關(guān)文獻(xiàn)成功度的一項(xiàng)指標(biāo),即檢出的相關(guān)文獻(xiàn)量與檢索系統(tǒng)中相關(guān)文獻(xiàn)總量的比率。普遍表示為:查全率=(檢索出的相關(guān)信息量/系統(tǒng)中的相關(guān)信息總量)x100%。使用泛指性較強(qiáng)的檢索語言(如上位類、上位主題詞)能提高查全率,但查準(zhǔn)率下降。兩者的關(guān)系:查全率和查準(zhǔn)率之間具有互逆的關(guān)系,一個(gè)IR系統(tǒng)可以在它們之間進(jìn)行折中。改變檢索項(xiàng)、減少限制條件,都可以提高查全率。書上:P164-1652023年2月3日第75頁信息檢索效果的評(píng)價(jià)指標(biāo)(2/3)1、信息檢索查全率查全率=相對(duì)查全率=

式中,a為相關(guān)的文獻(xiàn)的命中數(shù);c相關(guān)文獻(xiàn)的遺漏數(shù)。

2、信息檢索查準(zhǔn)率查準(zhǔn)率=

相對(duì)查準(zhǔn)率=式中,b為不相關(guān)的文獻(xiàn)數(shù)(噪聲)。

2023年2月3日第76頁信息檢索效果的評(píng)價(jià)指標(biāo)(3/3)3、信息檢索漏檢率漏檢率=

4、信息檢索誤檢率誤檢率=

5、信息檢索響應(yīng)時(shí)間及其他指標(biāo)

傳統(tǒng)的評(píng)價(jià)指標(biāo)還有:

1)收錄范圍:一個(gè)系統(tǒng)收錄的文獻(xiàn)是否齊全,包括專業(yè)范圍、語種、年份與文獻(xiàn)類型等,這是提高查全率的物質(zhì)基礎(chǔ);

2)工作量:從系統(tǒng)獲得相關(guān)文獻(xiàn),必需消耗的精力和工作時(shí)間;

3)可用性:按可靠性、年代與全面性的因素看檢出文獻(xiàn)的價(jià)值;

4)外觀:檢索結(jié)果的輸出形式。2023年2月3日第77頁舉例:網(wǎng)絡(luò)環(huán)境下政府信息資源開發(fā)利用的研究來闡述信息檢索的步驟這個(gè)與檢索策略的步驟是有區(qū)別的:①分析檢索課題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論