數(shù)字信息資源檢索_第1頁(yè)
數(shù)字信息資源檢索_第2頁(yè)
數(shù)字信息資源檢索_第3頁(yè)
數(shù)字信息資源檢索_第4頁(yè)
數(shù)字信息資源檢索_第5頁(yè)
已閱讀5頁(yè),還剩49頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)字信息資源檢索第一頁(yè),共五十四頁(yè),編輯于2023年,星期三自我介紹崔明Cming@第二頁(yè),共五十四頁(yè),編輯于2023年,星期三能學(xué)到什么?從事專業(yè)學(xué)習(xí)的需要

開(kāi)展科學(xué)研究、創(chuàng)新的需要

提高素質(zhì)和終身學(xué)習(xí)能力的需要

第三頁(yè),共五十四頁(yè),編輯于2023年,星期三課程設(shè)置講授上機(jī)7周信息檢索概述搜索引擎概述數(shù)據(jù)庫(kù)資源概述文獻(xiàn)綜合查詢6-7周Baidu、Google使用中文期刊、圖書數(shù)據(jù)庫(kù)外文期刊、索引數(shù)據(jù)庫(kù)中外專利、NoteExpress使用網(wǎng)上課件第四頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源1.1.1信息的涵義:

信息是生物以及具有自動(dòng)控制系統(tǒng)的機(jī)器通過(guò)感覺(jué)器官或者細(xì)胞組織,或者具有類似功能的設(shè)備部件與外界進(jìn)行交流的一切內(nèi)容。第五頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源1.1.2信息的類型自然信息生物信息機(jī)器信息社會(huì)信息描述對(duì)象第六頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源文獻(xiàn)信息口頭信息電子信息依附載體第七頁(yè),共五十四頁(yè),編輯于2023年,星期三差異性1.1.3信息特征一信息及信息資源傳遞性時(shí)效性可轉(zhuǎn)換性共享性第八頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源差異性1.中國(guó)的外貿(mào)出口造成極大的傷害2.降低對(duì)外資的吸引力3.國(guó)際化定價(jià)的行業(yè)石化、鋼鐵、電子元器件等利潤(rùn)下降4.國(guó)家的外匯儲(chǔ)備隨著升值幅度多少,相應(yīng)損失。1、有利于中國(guó)進(jìn)口2、原材料進(jìn)口依賴型廠商成本下降3、國(guó)內(nèi)企業(yè)對(duì)外投資能力增強(qiáng)4、有利于旅游和留學(xué)。第九頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源傳遞性接受者傳播途徑信息源第十頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源時(shí)效性第十一頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源可轉(zhuǎn)換性第十二頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源共享性非物質(zhì)資源和能源資源所表現(xiàn)的占有和消耗同程度的享用,獲取信息量因人而已第十三頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源1.2信息資源信息資源是經(jīng)過(guò)人類主觀或客觀處理了的,并且能夠被傳播或傳輸?shù)奈淖?、聲音、圖像、數(shù)據(jù)等。網(wǎng)絡(luò)技術(shù)、存儲(chǔ)技術(shù)、多媒體技術(shù)、計(jì)算機(jī)技術(shù)推動(dòng)下,以數(shù)字化形式(即二進(jìn)制代碼0、1)表現(xiàn)字、圖、音、動(dòng)的內(nèi)容。1.2.1電子信息資源第十四頁(yè),共五十四頁(yè),編輯于2023年,星期三數(shù)字化電子信息資源特點(diǎn)一信息及信息資源存儲(chǔ)多樣化內(nèi)容豐富容量大互動(dòng)性強(qiáng)第十五頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源類型:1.網(wǎng)絡(luò)傳輸協(xié)議1Web信息資源3Telnet信息資源2Ftp信息資源第十六頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源1Web信息資源HTTP超文本傳輸協(xié)議第十七頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源2Ftp信息資源FTP文件傳輸協(xié)議第十八頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源3Telnet信息資源Telnet遠(yuǎn)程登陸協(xié)議第十九頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源1.出版物類型1電子圖書3電子報(bào)紙2電子期刊第二十頁(yè),共五十四頁(yè),編輯于2023年,星期三一信息及信息資源第二十一頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理1.檢索原理:人們?cè)谟?jì)算機(jī)或者計(jì)算機(jī)檢索網(wǎng)絡(luò)的終端機(jī)上,使用特定的檢索指令、檢索詞和檢索策略從計(jì)算機(jī)檢索系統(tǒng)的數(shù)據(jù)庫(kù)中檢索出所需信息再由終端設(shè)備顯示或打印的過(guò)程。第二十二頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理主題分析著錄標(biāo)引原始信息信息標(biāo)示數(shù)據(jù)庫(kù)紀(jì)錄信息存儲(chǔ)第二十三頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理主題分析選定編制信息需求檢索主題檢索策略信息檢索第二十四頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理匹配第二十五頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理90年代以后脫機(jī)批處理聯(lián)機(jī)檢索光盤檢索網(wǎng)絡(luò)化檢索計(jì)算機(jī)信息檢索發(fā)展70年代初80年代60年代第二十六頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理1946.2ENIAC第二十七頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理1981.8IBM5150第二十八頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理1952.5IBM--726第二十九頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理1956.9IBM350RAMAC第三十頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理1978Philips--LD第三十一頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理1969ARPAnet第三十二頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理1985Windows1.0第三十三頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理1994.101995.08第三十四頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理服務(wù)方式回溯檢索定題檢索隨機(jī)問(wèn)答聯(lián)機(jī)訂購(gòu)第三十五頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理回溯檢索Viableoffspringderivedfromfetalandadultmammaliancells.從胚胎和成年哺乳動(dòng)物細(xì)胞中獲得的成活的后代Nature,1997,385:810~~813第三十六頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理檢索語(yǔ)言1布爾邏輯檢索(Booleanlogic)

布爾邏輯檢索一般指“與”、“或”、“非”三種運(yùn)算。

第三十七頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理

邏輯“與”的布爾運(yùn)算符為“AND”、“and”,有時(shí)也可用“*”表示。其含義是“與”前后的檢索詞全部出現(xiàn)時(shí),所檢索到的結(jié)果才算符合條件。

AANDB

或者A*B檢索時(shí),數(shù)據(jù)庫(kù)中同時(shí)含有檢索詞A和檢索詞B的文獻(xiàn),為命中文獻(xiàn)。

第三十八頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理邏輯“或”的布爾運(yùn)算符為“OR”、“or”,有時(shí)也可用“+”表示。其含義是“或”前后的檢索詞有一個(gè)出現(xiàn)或全部出現(xiàn),所檢索到的結(jié)果均算符合條件AORB或者

A+B檢索時(shí),數(shù)據(jù)庫(kù)中的文獻(xiàn)凡含有檢索詞A或者檢索詞B或者同時(shí)含有檢索詞A和B的,均為命中文獻(xiàn)。第三十九頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理邏輯“非”的布爾運(yùn)算符為“NOT”、“not”,有時(shí)也可用“-”符號(hào)表示。其含義是搜索結(jié)果應(yīng)滿足“NOT”前面的檢索詞而排除“NOT”后面的檢索詞。

ANOTB

或者A-B對(duì)于這個(gè)提問(wèn)式,數(shù)據(jù)庫(kù)中凡含有檢索詞A而不含有檢索詞B的文獻(xiàn),即為命中文獻(xiàn)。第四十頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理2詞組檢索(phrasesearch)

詞組檢索(phrase),也稱為短語(yǔ)檢索,或字符串檢索。它是將一個(gè)詞組或短語(yǔ)用雙引號(hào)“

”括起作為一個(gè)獨(dú)立運(yùn)算單元,進(jìn)行嚴(yán)格匹配,以提高檢索準(zhǔn)確度的一種方法。幾乎所有的搜索引擎都支持詞組檢索。“computernetwork”“山東大學(xué)威海分?!钡谒氖豁?yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理3截詞檢索(truncationsearch)

所謂截詞(truncation),是指檢索者將檢索詞在他認(rèn)為合適的地方截?cái)啵欢卦~檢索,則是用截?cái)嗟脑~的一個(gè)局部進(jìn)行的檢索,凡滿足這個(gè)詞局部中的所有字符(串)的文獻(xiàn),都為命中的文獻(xiàn)。

后截?cái)?/p>

前截?cái)?/p>

中間截?cái)?/p>

第四十二頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理

1)后截?cái)嗪蠼財(cái)嗍亲畛S玫慕卦~檢索技術(shù)。它是將截詞符放在一串字符的右面,用以表示截詞符右面的有限或無(wú)限個(gè)字符不影響該字符串的檢索,這種方式稱為檢索詞的后截?cái)?。從檢索性質(zhì)上講,后截?cái)嗍乔胺揭恢聶z索。

有限截?cái)酂o(wú)限截?cái)嗟谒氖?yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理例1system??這是兩個(gè)字符有限截?cái)鄼z索,該表達(dá)式可檢出的詞匯有:systemic但不能檢索出下列詞匯systematicsystematicalsystematicianSystematics┇

有限截?cái)嗟谒氖捻?yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理無(wú)限截?cái)嗬?comput*這是一個(gè)無(wú)限后截?cái)嗟睦印_@種方法可以查找出含有相同字符串的所有檢索詞。Comput*可檢出詞匯有computabilitycomputablecomputationcomputationalcomputativecomputecomputer┇第四十五頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理2)前截?cái)嗯c后截?cái)嘞鄬?duì),前截?cái)嗍菍⒔卦~符號(hào)置放在一個(gè)字符串左方,以表示截詞符左面的有限或無(wú)限個(gè)字符不影響該字符串的檢索。這種方式稱為檢索詞的前截?cái)唷臋z索性質(zhì)上講,前截?cái)嗍呛蠓揭恢聶z索。

第四十六頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理例3.*magnetic這是一個(gè)無(wú)限前截?cái)嗟谋磉_(dá)式,可檢出下列詞匯:magnetic有磁性的electro-magnetic電磁的electromagnetic電磁的paramagnetic順磁的thermo-magnetic熱磁的thermomagnetic熱磁的但是檢索不出magneticsmagnetical等等。

第四十七頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理3)中間截?cái)嘀虚g截?cái)嘤址Q為中間屏蔽,是一種用截詞符屏蔽詞中不同字符的方法。例如,“woman”和“women”,可用“wom?n”代替;“defence”和“defense”,可用“defen?e”代替。一般地,中間截詞僅允許有限截?cái)唷?/p>

第四十八頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理4字段限定檢索(fieldlimiting)字段檢索(field)是一種用于限定提問(wèn)關(guān)鍵詞在數(shù)據(jù)庫(kù)記錄中出現(xiàn)的區(qū)域,控制檢索結(jié)果的相關(guān)性,提高檢索效果的檢索方法,多以字段限定方式實(shí)現(xiàn)。

第四十九頁(yè),共五十四頁(yè),編輯于2023年,星期三二計(jì)算機(jī)信息檢索原理字段代碼字段名稱ABAbstract文摘AUAuthor作者CCClassificationCode分類代碼CSCorporateSource機(jī)構(gòu)名稱DEDescriptor敘詞DTDocumentType文獻(xiàn)類型IDIdentifier標(biāo)識(shí)詞JNJournalName刊名LALanguage語(yǔ)種PYPublicationYear出版年TITitle題名如在DIALOG系統(tǒng)中,情況是這樣的:第五十頁(yè),共五十四頁(yè),編輯于2023年,星期三二

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論