版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
大學(xué)計算機基礎(chǔ)湖南工業(yè)大學(xué)計算機與通信學(xué)院湖南工業(yè)大學(xué)計算機公共基礎(chǔ)課程系列第七章信息檢索與應(yīng)用基礎(chǔ)湖南工業(yè)大學(xué)計算機與通信學(xué)院湖南工業(yè)大學(xué)《大學(xué)計算機基礎(chǔ)》學(xué)習(xí)目標(biāo)1.了解信息檢索相關(guān)的概念。2.掌握信息檢索的方法和技術(shù)。3.了解常用中外數(shù)據(jù)庫檢索系統(tǒng)。4.了解如何利用綜合信息資源。重點
、難點*3W+1H學(xué)習(xí)法WhyWhereHowWhat什么是信息檢索和檢索系統(tǒng)?如何利用計算機資源進行信息檢索?
*為什么要學(xué)習(xí)要信息檢索的相關(guān)方法和技巧?*信息檢索的應(yīng)用和強大功能體現(xiàn)在哪些方面?3W+1H
目錄一種多方互動式學(xué)教系統(tǒng)(發(fā)明專利)7.1信息檢索概述一種多方互動式學(xué)教系統(tǒng)(發(fā)明專利)7.2網(wǎng)絡(luò)信息檢索的方法和技巧一種多方互動式學(xué)教系統(tǒng)(發(fā)明專利)一種多方互動式學(xué)教系統(tǒng)(發(fā)明專利)7.5本章小結(jié)7.3常用數(shù)據(jù)庫檢索系統(tǒng)的介紹7.4信息資源的綜合利用信息檢索概述7.1.1問題提出信息檢索的定義What
所謂“信息檢索(InformationStorageandRetrieval)”,它是指將信息按照一定的方式組織和存儲起來,并能根據(jù)用戶的需要找出其中相關(guān)信息的過程。信息檢索系統(tǒng)(InformationRetrievalSystem)是指根據(jù)特定的信息需求而建立起來的一種有關(guān)信息搜集、加工、存儲和檢索的程序化系統(tǒng),其主要目的是為人們提供信息服務(wù)。
發(fā)展原理7.1.2信息檢索的發(fā)展歷程計算機信息檢索的發(fā)展過程:第一階段第二階段第三階段脫機批處理檢索聯(lián)機檢索
網(wǎng)絡(luò)化信息檢索7.1.3信息檢索的原理信息檢索的基本原理:
信息檢索廣義上講包括信息的存儲和檢索兩個方面:
信息的存儲過程是:將收集到的原始文獻進行主題概念分析,根據(jù)一定的檢索語言抽取出主題詞、分類號以及文獻的其他特征進行標(biāo)識或者寫出文獻的內(nèi)容摘要。然后再把這些經(jīng)過“前處理”的數(shù)據(jù)按一定格式輸入到計算機存儲起來。信息的檢索過程是:用戶對檢索課題加以分析,明確檢索范圍,弄清主題概念,并用系統(tǒng)檢索語言來表示,然后形成相應(yīng)的檢索標(biāo)識及檢索策略進行檢索。7.2信息檢索的方法和技巧信息檢索的方法與技巧7.2.1信息檢索的方法1、布爾邏輯檢索
即運用布爾邏輯算符對檢索詞進行邏輯組配,來表達兩個概念之間的邏輯關(guān)系。布爾邏輯算符主要有:AND(*)、OR(+)、NOT(-)
如邏輯與:用運算符AND或*連接檢索詞例1:查“有關(guān)計算機在圖書館中的應(yīng)用”的文獻,
檢索式=計算機*圖書館例3:
查“玉米但不是甜玉米”方面的文獻。
檢索式=玉米—甜玉米例2:查“蘋果或梨”方面的文獻
檢索式=蘋果+梨2、位置算符檢索
在檢索式中,檢索詞的相對次序不同,表達的檢索意圖也不一樣,布爾邏輯運算符有時難以表達某些檢索課題的確切提問要求,用詞間位置算符來限定和組配檢索詞,可彌補布爾邏輯算符造成誤檢的不足。
位置算符檢索就是利用一些特定的位置算符來表達檢索詞之間的位置關(guān)系,有的書上把這種檢索稱為原文檢索。常用的位置算符有:W、W/N、WITH、WITHIN、nW、PRE、N、NEAR、ADJ、nN、F、SAME。下面介紹使用頻率較高的幾個位置算符。(1)W、W/N、WITH、WITHIN:功能:兩詞相鄰,按輸入時順序排列(也有數(shù)據(jù)庫允許順序顛倒)表達式:Education(W)school或EducationWITHschool檢索結(jié)果:Educationschool;educationschools(2)SAME:功能:兩詞出現(xiàn)在同一自然句中,其詞序與詞量不受限制表達式:EducationSAMEschool檢索結(jié)果:Education和school兩詞出現(xiàn)在同一句子中即可3、截詞檢索截詞運算符號有兩個:“?、*”。它們在不同系統(tǒng)中表示的含義不同。(1)有限截詞。即在檢索詞后后截幾個有限的字母,如名詞的單復(fù)數(shù),動詞的詞尾變化等。原因:在英語詞匯中,一個詞可能有多種形態(tài),如詞的單、復(fù)數(shù)形式的不同,英美拼寫方法不同、詞性不同等。如輸入computer??表示有0-2個字母變化,可檢出computer和computers。
輸入stud???表示截斷處有0-3個字母變化,可檢出study,studies,tudied,studing。(2)無限截詞:在檢索詞后加一個“*“,表示該詞后可加任意個字符。使用無限截詞,所截詞根不能太短,否則會輸出許多無關(guān)文獻,造成誤檢。如:computer*可檢出computers,computering,computered,computerization.(3)中間截詞:在檢索詞中間加一個或幾個?號,主要解決一些英美拼寫不同,可簡化單復(fù)數(shù)形式不同的詞的輸入。
如:輸入wom?n可檢出woman,women4、詞組檢索
將一個詞組或短語用雙引號“”括起作為一個獨立運算單元,進行嚴(yán)格匹配,以提高檢索準(zhǔn)確度。如:“GlobalPositioningSystem”,只檢索出規(guī)定字段中包含完整詞組的記錄。5、字段限制檢索將檢索詞限定在某一字段中,檢索時,計算機只對限定字段進行運算,以提高檢索效果。常用的檢索符號有:
in、=、<、>、≤、≥例:限定在某字段中檢索,后跟一個字段名,如appleinti(ti表示題目字段),表示命中文獻中“apple”一詞必須在題目中出現(xiàn)。6、括號檢索用于改變運算的先后次序,括號內(nèi)的做優(yōu)先運算。
如比較(GPS
OR
GIS)AND
China
GPS
OR
GISAND
China總結(jié):在一個復(fù)雜的檢索式中,不僅可以有多個運算符,也可以使用括號來指定運算的優(yōu)先順序、以及體現(xiàn)概念的完整性。7.2.2網(wǎng)絡(luò)信息檢索的常用技術(shù)1.全文信息檢索技術(shù)
全文檢索是指以文檔的全部文本信息作為檢索對象的一種信息檢索技術(shù),目前搜索引擎基本上都采用全文檢索技術(shù)。
搜索引擎(searchengine)是指根據(jù)一定的策略、運用特定的計算機程序搜集互聯(lián)網(wǎng)上的信息,在對信息進行組織和處理后,將信息顯示給用戶。目前常用的搜索引擎有百度、google等。(1)百度搜索
2000年1月1日,公司創(chuàng)始人李彥宏、徐勇攜120萬美元風(fēng)險投資,從美國硅谷回國,創(chuàng)建了百度公司?,F(xiàn)在百度已是全球最大的中文搜索引擎。
在瀏覽器的地址欄中輸入()即進入百度搜索。
演示常用的搜索引擎(2)Google搜索引擎
Google成立的第一步始于1998年,Google創(chuàng)始人LarryPage和SergeyBrin在斯坦福大學(xué)的學(xué)生宿舍內(nèi)共同開發(fā)了全新的在線搜索引擎。在瀏覽器的地址欄中輸入/,即進入Google首頁。(3)其他搜索引擎
除上述兩種最常用的搜索引擎外,還有其它一些搜索引擎:搜狗:/雅虎全能搜:/,搜索范圍涵蓋生活服務(wù)、黃頁、資訊、音樂、圖片、知識堂等領(lǐng)域。奇虎問答:是一個互助問答平臺,網(wǎng)址為:/CNKI知識搜索:主要是學(xué)術(shù)方面的搜索,網(wǎng)址:/狗狗搜索:主要用于搜索影視、軟件,網(wǎng)址為:。2.多媒體信息檢索技術(shù)
多媒體信息資源是數(shù)字圖書館中獨具特色的一類信息資源,既包括數(shù)字化的文本信息、圖形與圖像信息,又包括數(shù)字化的視頻與音頻信息。當(dāng)詞語難以形象和準(zhǔn)確地描述視覺或聽覺感知時,例如一種東西的式樣、顏色或紋理,用戶就需要利用媒體呈現(xiàn)的視覺和聽覺特性來查詢。多媒體信息檢索包括:(1)圖像信息檢索(2)音頻信息檢索(3)視頻信息檢索3.超文本和超媒體信息檢索技術(shù)
超媒體和超文本都以非線性方式組織信息,本質(zhì)上具有同一性。在超文本中,信息的主要形態(tài)是文本和圖形,以節(jié)點形式存儲信息,實現(xiàn)相關(guān)節(jié)點間的非線性、聯(lián)想式檢索。而超媒體是一種在一條條信息間創(chuàng)建明確關(guān)系的方法,它把超文本的含義擴展為包含多媒體對象,而且能夠?qū)崿F(xiàn)音頻與視頻信號的同步。Internet上的WWW可以實現(xiàn)超文本和超媒體的信息檢索。4.智能信息檢索技術(shù)
數(shù)據(jù)庫系統(tǒng)是儲存某個學(xué)科大量事實的計算機系統(tǒng),隨著應(yīng)用的進一步發(fā)展,存儲的信息量越來越大,因此解決智能檢索的問題具有了實際意義。
智能信息檢索系統(tǒng)應(yīng)具有如下的功能:
(1)能理解自然語言,允許用自然語言提出各種問題;(2)具有推理能力,能根據(jù)存儲的事實,演繹出所需的答案;(3)系統(tǒng)具有一定的常識性知識來補充學(xué)科范圍的專業(yè)知識。系統(tǒng)根據(jù)這些常識,將能演繹出更一般的答案來。
當(dāng)然,實現(xiàn)這些功能要應(yīng)用人工智能的方法。5.文本聚類技術(shù)
文本聚類是進行文本信息檢索的重要方法,被廣泛應(yīng)用于網(wǎng)絡(luò)信息和檔案資料的篩選和檢索,聚類就是按照事物間的相似性進行區(qū)分和分類的過程。國內(nèi)外的研究者提出了很多聚類算法,這些算法被用于眾多應(yīng)用領(lǐng)域,如模式識別、數(shù)據(jù)分析、圖象處理以及市場研究等。7.2.3
網(wǎng)絡(luò)信息檢索的策略與技巧網(wǎng)絡(luò)信息檢索存在的問題網(wǎng)絡(luò)信息檢索的技巧(檢索策略)什么是檢索策略?
為實現(xiàn)檢索目標(biāo)而制定的全盤計劃或方案。檢索策略的概念未完待續(xù)。。。。。。信息檢索策略常用數(shù)據(jù)庫檢索系統(tǒng)的介紹
本節(jié)通過對國內(nèi)外常用數(shù)據(jù)庫資源的介紹,讓大家對各個數(shù)據(jù)庫的收錄范圍、檢索功能、收錄核心期刊、檢索結(jié)果等情況進行有效地分析和評價,因而能夠確切地區(qū)分其特點和功能,進行有目的地選用。7.3
常用數(shù)據(jù)庫檢索系統(tǒng)的介紹7.3.1常用中文檢索數(shù)據(jù)庫1、期刊檢索
CNKI(中國知識基礎(chǔ)設(shè)施工程)工程于1995年正式立項,在政府及社會各界多方努力下,經(jīng)過10年建成了世界上全文信息量規(guī)模最大的“CNKI數(shù)字圖書館”,并全力建設(shè)《中國知識資源總庫》,以“中國知網(wǎng)()”為網(wǎng)絡(luò)出版與知識服務(wù)平臺,通過產(chǎn)業(yè)化運作,為全社會提供最豐富的信息資源和數(shù)字化學(xué)習(xí)平臺??梢酝ㄟ^中國知識基礎(chǔ)設(shè)施工程(CNKI)的網(wǎng)址:/,或者各高校圖書館的“數(shù)字資源”,進入中國期刊全文數(shù)據(jù)庫并實施數(shù)據(jù)庫的檢索。如圖7-4所示,首次閱讀時,要先下載閱讀器,如CAJViewer和AdobeReader等。演示圖7-4中國期刊全文數(shù)據(jù)庫檢索主頁
目前有很多電子圖書的檢索,下面先介紹一種目前最方便、也頗受爭議的電子圖書——google電子圖書。電子圖書是指以數(shù)字代碼方式將圖、文、聲、像等信息存儲在磁、光、電介質(zhì)上,通過計算機或類似設(shè)備使用,并可復(fù)制發(fā)行的大眾傳播體。2、電子圖書檢索
方法舉例
進入google電子圖書很容易,它無需任何閱讀器,即能在IE上閱讀。在IE地址欄上網(wǎng)址:/即進入。
如圖所示。舉例:查詢關(guān)于EXCEL這本書。方法:在搜索欄中輸入“excel”,然后單擊“搜索圖書”,則搜索出如圖所示,選擇感興趣的圖書即可。3、中國學(xué)位論文文摘檢索數(shù)據(jù)庫(CDDB)
收錄了自1977年恢復(fù)高考以來我國自然科學(xué)、哲學(xué)、經(jīng)濟、管理、語言、文學(xué)等領(lǐng)域博士、博士后及碩士研究生論文,其中文摘已達40余萬篇,它不但是我國最早建設(shè)的全國性學(xué)位論文數(shù)據(jù)庫,而且也是我國目前收錄學(xué)位論文信息最多、最全的數(shù)據(jù)庫。(1)中國學(xué)位論文全文數(shù)據(jù)庫檢索介紹先登錄某圖書館(清華)主頁-數(shù)據(jù)庫-中文數(shù)據(jù)庫-萬方數(shù)據(jù)資源系統(tǒng)-學(xué)位論文全文,如圖所示。(2)其他中文學(xué)位論文網(wǎng)站①CNKI中國優(yōu)秀博碩士論文全文數(shù)據(jù)庫:至2005年8月止,累積博碩士學(xué)位論文全文文獻近25萬篇。文摘網(wǎng)上可免費檢索/②國家科技圖書文獻中心學(xué)位論文:1984-,收藏我國高等院校、研究生院及研究院所的碩博士論文和博士后報告,涉及自然科學(xué)各專業(yè)領(lǐng)域,并兼顧人文社科,目前包含50余萬條記錄,每年新增6萬余條記錄,中文學(xué)位論文663796條(文摘),外文74350(文摘)/nstl/user/ywjsdg.jsp③國家圖書館學(xué)位論文:1981,國家圖書館是教育部指定的全國博士論文、博士后研究報告收藏機構(gòu),并收藏我國海外留學(xué)生的部分博士論文。7.3.2三大外文檢索數(shù)據(jù)庫1、EI數(shù)據(jù)庫檢索(1)簡介
美國《工程索引》(TheEngineeringIndex)簡稱EI,創(chuàng)刊于1884年,由美國工程信息公司編輯出版。所報道的文獻學(xué)科覆蓋面廣,涉及工程技術(shù)領(lǐng)域各個方面。經(jīng)過100多年的發(fā)展,《工程索引》已經(jīng)成為全球工程技術(shù)領(lǐng)域最著名的檢索系統(tǒng),同時它也是世界引文分析和文獻評價的四大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國紙杯紙碗行業(yè)市場競爭現(xiàn)狀及發(fā)展前景規(guī)劃研究報告
- 2025-2030年中國紅外耳機產(chǎn)品行業(yè)發(fā)展現(xiàn)狀規(guī)劃研究報告新版
- 2025-2030年中國粉末冶金模市場發(fā)展趨勢與十三五規(guī)劃研究報告
- 2025年生態(tài)修復(fù)項目樹木種植與生態(tài)監(jiān)測承包協(xié)議3篇
- 2025-2030年中國碳酸鈣母料市場前景規(guī)模及發(fā)展趨勢預(yù)測報告
- 2025-2030年中國睡衣市場前景規(guī)模及發(fā)展趨勢分析報告
- 二零二五年度影視作品演員定制化出演合同3篇
- 2025-2030年中國電容筆行業(yè)競爭格局及前景趨勢預(yù)測報告
- 2025-2030年中國電光源行業(yè)前景展望及未來投資規(guī)劃研究報告
- 2025-2030年中國液晶電視市場運行狀況及投資發(fā)展前景預(yù)測報告
- 中醫(yī)診所內(nèi)外部審計制度
- 自然辯證法學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 2024年國家危險化學(xué)品經(jīng)營單位安全生產(chǎn)考試題庫(含答案)
- 護理員技能培訓(xùn)課件
- 家庭年度盤點模板
- 河南省鄭州市2023-2024學(xué)年高二上學(xué)期期末考試 數(shù)學(xué) 含答案
- 2024年資格考試-WSET二級認(rèn)證考試近5年真題集錦(頻考類試題)帶答案
- 試卷中國電子學(xué)會青少年軟件編程等級考試標(biāo)準(zhǔn)python三級練習(xí)
- 公益慈善機構(gòu)數(shù)字化轉(zhuǎn)型行業(yè)三年發(fā)展洞察報告
- 飼料廠現(xiàn)場管理類隱患排查治理清單
- 【名著閱讀】《紅巖》30題(附答案解析)
評論
0/150
提交評論