信息技術(shù)(第2版)課件 劉來權(quán) 【ch01】信息檢索_第1頁
信息技術(shù)(第2版)課件 劉來權(quán) 【ch01】信息檢索_第2頁
信息技術(shù)(第2版)課件 劉來權(quán) 【ch01】信息檢索_第3頁
信息技術(shù)(第2版)課件 劉來權(quán) 【ch01】信息檢索_第4頁
信息技術(shù)(第2版)課件 劉來權(quán) 【ch01】信息檢索_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

信息技術(shù)(第2版)信息檢索第一章高等職業(yè)院校精品教材系列01精確檢索《海南自由貿(mào)易港建設(shè)白皮書(2021)》文檔在信息化時(shí)代的今天,人們對(duì)信息表現(xiàn)出了前所未有的依賴,信息已經(jīng)成為人們生活中不可或缺的資源——除物質(zhì)、能源外的第三種資源。根據(jù)《CNNIC:2022年第49次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,截至2021年12月,我國網(wǎng)民規(guī)模達(dá)10.32億,網(wǎng)站有418萬個(gè),網(wǎng)頁有3350億個(gè),App有252萬款,互聯(lián)網(wǎng)普及率達(dá)73.0%,網(wǎng)民人均每周上網(wǎng)時(shí)長達(dá)到28.5小時(shí),網(wǎng)民用手機(jī)、臺(tái)式計(jì)算機(jī)、筆記本電腦、電視、平板電腦上網(wǎng)的比例分別是99.7%、35.0%、33.0%、28.1%和27.4%。網(wǎng)民上網(wǎng)的過程就是獲取信息、處理信息、產(chǎn)生信息的過程。1.1.1什么是信息是對(duì)客觀世界中各種事物的運(yùn)動(dòng)狀態(tài)和變化的反映,是客觀事物之間相互聯(lián)系和相互作用的結(jié)果,表現(xiàn)的是客觀事物運(yùn)動(dòng)狀態(tài)和變化的實(shí)質(zhì)內(nèi)容。文字、圖像、聲音、動(dòng)畫、視頻等均為承載信息的媒體。1.1.1什么是信息信息(information)隨著互聯(lián)網(wǎng)的發(fā)展,越來越多的傳統(tǒng)業(yè)務(wù)已遷移到線上,越來越多的網(wǎng)民活躍在互聯(lián)網(wǎng)上,每天都會(huì)產(chǎn)生大量的數(shù)據(jù)。據(jù)有關(guān)資料,全球每年產(chǎn)生的數(shù)據(jù)總量在2018年為33ZB,在2020年為59ZB,預(yù)計(jì)到2025年將增長到175ZB,那時(shí)候相當(dāng)于每天將產(chǎn)生491EB的數(shù)據(jù),如圖1.1.1所示。1.1.2什么是信息檢索用戶進(jìn)行信息查詢和獲取的主要方式。狹義的信息檢索僅指信息查詢(informationsearch),即用戶根據(jù)需要,采用一定的方法,借助檢索工具,從信息集合中找出所需要信息的查找過程。廣義的信息檢索是指對(duì)信息按一定的方式進(jìn)行加工、整理、組織并存儲(chǔ)起來,再根據(jù)用戶特定的信息需求將相關(guān)信息準(zhǔn)確地查找出來的過程,又稱為信息的存儲(chǔ)與檢索。1.1.2什么是信息檢索信息檢索(informationretrieval)1.1.2什么是信息檢索信息檢索(informationretrieval)(1)site:用于在指定網(wǎng)站檢索信息,如檢索式“學(xué)習(xí)site:.**”表示僅從“.**”網(wǎng)站檢索包含“學(xué)習(xí)”的信息。(2)filetype:制定檢索文檔的格式,如pdf、rtf、doc、xls、ppt等,如檢索式“英語四級(jí)filetype:pdf”表示檢索包含“英語四級(jí)”的pdf文件。1.1.3常用數(shù)據(jù)庫利用百度檢索時(shí),可以選用“高級(jí)搜索”或選用以下檢索條件。(3)intitle:對(duì)網(wǎng)頁標(biāo)題進(jìn)行精準(zhǔn)搜索。(4)inrul:在URL(統(tǒng)一資源定位器)中檢索特定的名稱。(5)link:檢索鏈接到某網(wǎng)站的所有網(wǎng)頁。1.1.3常用數(shù)據(jù)庫利用百度檢索時(shí),可以選用“高級(jí)搜索”或選用以下檢索條件。確定檢索需求,根據(jù)檢索需求選擇合適的數(shù)據(jù)庫,確定檢索詞,根據(jù)檢索詞的邏輯關(guān)系確定檢索式,然后實(shí)施檢索,根據(jù)檢索結(jié)果調(diào)整檢索式或檢索詞,甚至重新選擇數(shù)據(jù)庫,直到獲得滿意的檢索結(jié)果,如圖1.1.3所示。1.1.4信息檢索的基本流程信息檢索的基本流程1.1.4信息檢索的基本流程信息檢索的基本流程02檢索非接觸電梯按鍵專利文檔即專有的權(quán)利和利益,是由國家知識(shí)產(chǎn)權(quán)局根據(jù)申請(qǐng)而頒發(fā)的一種文件,這種文件記載了發(fā)明創(chuàng)造的內(nèi)容,并且在一定時(shí)期內(nèi)產(chǎn)生這樣一種法律狀態(tài),即獲得專利的發(fā)明創(chuàng)造在一般情況下他人只有經(jīng)專利權(quán)人許可才能予以實(shí)施。在我國專利分為發(fā)明專利、實(shí)用新型專利和外觀設(shè)計(jì)專利三種類型?!吨腥A人民共和國2021年國民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)》顯示,在2021年我國授予專利權(quán)460.1萬件。1.2.1專利數(shù)據(jù)庫專利(patent)1.2.1專利數(shù)據(jù)庫布爾邏輯檢索是使用標(biāo)準(zhǔn)的布爾邏輯關(guān)系符號(hào)來表達(dá)檢索詞之間的邏輯關(guān)系的檢索方法。目前最常用的布爾邏輯運(yùn)算符有“與”(AND)、“或”(OR)、“非”(NOT),見表1.2.2。在檢索實(shí)踐中,組合使用布爾邏輯運(yùn)算符,可以準(zhǔn)確地表達(dá)檢索主題。1.2.2常用檢索方法1.布爾邏輯檢索1.2.2常用檢索方法1.布爾邏輯檢索(1)“與”,用AND表示,用來表達(dá)不同含義檢索詞之間的并列限定關(guān)系。檢索詞A、B以AND相連,即“AANDB”,表示同時(shí)包含A、B兩詞的文獻(xiàn)才能符合檢索要求,從而縮小檢索范圍,提高檢索結(jié)果的查準(zhǔn)率。例如,要查找“海南自貿(mào)港”方面的文獻(xiàn),中文檢索式為“海南AND自貿(mào)港”,運(yùn)算的結(jié)果是同時(shí)包含檢索詞“海南”和檢索詞“自貿(mào)港”的文獻(xiàn)才能被檢索出來。一般情況下,在搜索引擎中默認(rèn)使用空格代替AND。1.2.2常用檢索方法1.布爾邏輯檢索(2)“或”,用OR表示,用來表達(dá)同義或者同族檢索詞之間的并列允許關(guān)系。檢索詞A、B以O(shè)R相連,即“AORB”,表示只要包含A、B之一或者同時(shí)包含A、B的文獻(xiàn)都是符合檢索要求的。因而“或”運(yùn)算可用于擴(kuò)大檢索范圍。例如,要查找“按鍵”方面的文獻(xiàn),因?yàn)椤鞍存I”和“按鈕”是同義詞,所以為了避免漏檢,檢索式就可表示為“按鍵OR按鈕”。運(yùn)算的結(jié)果包含“按鍵”或“按鈕”中任意一個(gè)或者同時(shí)包含兩個(gè)詞的文獻(xiàn)均可被檢索到。1.2.2常用檢索方法1.布爾邏輯檢索(3)“非”,用NOT表示,用來表達(dá)不包含的關(guān)系,可以從原檢索范圍中排除一部分,從而縮小檢索范圍。檢索詞A、B以NOT相連,表示只包含檢索詞A而不包含B的文獻(xiàn)才能符合檢索要求。例如,要查找有關(guān)“能源”,但又不涉及“核能”方面的文獻(xiàn),檢索式可表示為“能源NOT核能”。運(yùn)算的結(jié)果是包含“能源”,但不包含“核能”的文獻(xiàn)將被檢索出來。1.2.2常用檢索方法1.布爾邏輯檢索截詞檢索是在英文數(shù)據(jù)庫中廣泛應(yīng)用的檢索技術(shù),用特定的符號(hào)表示檢索詞的某一部分字符,常用的截詞符為“?”和“*”(見表1.2.3)。例如,“*”表示任何字符組,包括空字符;“?”表示任意一個(gè)字符。1.2.2常用檢索方法2.截詞檢索截詞檢索按截詞位置可以分為左截詞、中間截詞、右截詞以及左右截詞。按照截?cái)嗟淖址L度不同,可以分為有限截詞和無限截詞。1.2.2常用檢索方法2.截詞檢索臨近檢索,又稱為未知檢索,通過檢索式中的特定符號(hào)限制相應(yīng)檢索詞的相對(duì)位置。例如,使用“NEAR/x”作為特定的符號(hào),如檢索式“ComputerNEAR/5Tools”表示查找同時(shí)包含“Computer”和“Tools”的記錄,且兩個(gè)字符之間相隔不超過5個(gè)單詞。1.2.2常用檢索方法3.臨近檢索1.2.2常用檢索方法4.字段檢索字段檢索是限定字段在數(shù)據(jù)庫范圍內(nèi)進(jìn)行的一種檢索技術(shù)。在檢索時(shí),數(shù)據(jù)僅僅支持從限定的字段中檢索結(jié)果。中國知網(wǎng)的常用字段名稱見表1.2.4。03精確檢素“紅色娘子軍”學(xué)術(shù)文獻(xiàn)圖書館是搜集、整理、收藏圖書資料以供人閱覽的機(jī)構(gòu),據(jù)有關(guān)考證我國早在3000年前就出現(xiàn)了圖書館——在安陽殷墟考古發(fā)現(xiàn)的殷人保存典冊的府庫。在圖書館中收藏著圖書、期刊、報(bào)紙等文獻(xiàn),有些是紙質(zhì)的文獻(xiàn),也有電子文獻(xiàn)。圖書的紙質(zhì)文獻(xiàn)一般采用中國圖書館分類法編碼。為了方便讀者檢索,圖書館一般建有文獻(xiàn)檢索系統(tǒng),通過在線檢索找到圖書的分類號(hào),然后按分類號(hào)到相應(yīng)書架上找書。國內(nèi)常見的中文電子文獻(xiàn)提供機(jī)構(gòu)主要有:中國知網(wǎng)(ki.n**)、萬方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)(.**)、超星讀書(book.chaoxing.c**)、暢想之星館配電子書(www.cxstar.c**)等。1.3.1圖書館中國知網(wǎng)(ki.n**)萬方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)(.**)超星讀書(book.chaoxing.c**)暢想之星館配電子書(www.cxstar.c**)1.3.1圖書館國內(nèi)常見的中文電子文獻(xiàn)提供機(jī)構(gòu)1.3.2中國圖書館分類法基本部類基本大類標(biāo)識(shí)符號(hào)類

名馬克思主義、列寧主義、

毛澤東思想、鄧小平理論A馬克思主義、列寧主義、

毛澤東思想、鄧小平理論哲學(xué)、宗教B哲學(xué)、宗教社會(huì)科學(xué)C社會(huì)科學(xué)總論D政治、法律E軍事F經(jīng)濟(jì)G文化、科學(xué)、教育、體育H語言、文字

文學(xué)J藝術(shù)K歷史、地理1.3.2中國圖書館分類法基本部類基本大類標(biāo)識(shí)符號(hào)類

名自然科學(xué)N自然科學(xué)總論O數(shù)理科學(xué)和化學(xué)P天文學(xué)、地球科學(xué)Q生物科學(xué)R醫(yī)藥、衛(wèi)生S農(nóng)業(yè)科學(xué)T工業(yè)技術(shù)U交通運(yùn)輸V航空、航天X環(huán)境科學(xué)、安全科學(xué)綜合性圖書Z綜合性圖書第一個(gè)字母表示一個(gè)大類;二級(jí)類目以下的標(biāo)志可以用字母,也可以用數(shù)字。以字母或數(shù)字的順序反映類目的系列。在字母后用數(shù)字表示類目的細(xì)分,當(dāng)數(shù)字超過三位時(shí)在第三位后加間隔符號(hào)“”。1.3.2中國圖書館分類法具體的分類號(hào)采用字母與阿拉伯?dāng)?shù)字相結(jié)合的混合制號(hào)碼。以“網(wǎng)絡(luò)瀏覽器”說明其分類號(hào),具體類目的細(xì)分如下:T工業(yè)技術(shù)TP自動(dòng)化技術(shù)、計(jì)算機(jī)技術(shù)TP3計(jì)算技術(shù)、計(jì)算機(jī)技術(shù)TP39計(jì)算機(jī)的應(yīng)用TP393計(jì)算機(jī)網(wǎng)絡(luò)TP393.0一般性問題TP393.09計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用程序TP393.092網(wǎng)絡(luò)瀏覽器1.3.2中國圖書館分類法具體的分類號(hào)采用字母與阿拉伯?dāng)?shù)字相結(jié)合的混合制號(hào)碼。由清華大學(xué)、清華同方股份有限公司發(fā)起,始建于1999年6月,采用自主開發(fā)并具有國際領(lǐng)先水平的數(shù)字圖書館技術(shù),建成了世界上全文信息量最大的“CNKI數(shù)字圖書館”,促進(jìn)了全社會(huì)知識(shí)資源的高效共享,提供了最豐富的知識(shí)信息資源和最有效的知識(shí)傳播與數(shù)字化學(xué)習(xí)平臺(tái)。1.3.3中國知網(wǎng)中國知網(wǎng)中國知網(wǎng)收錄中文學(xué)術(shù)期刊8560余種,含北大核心期刊1970余種,網(wǎng)絡(luò)首發(fā)期刊2240余種,發(fā)表時(shí)間最早可回溯至1915年,共約有5910萬篇全文文獻(xiàn);外文學(xué)術(shù)期刊包括來自80個(gè)國家及地區(qū)900余家出版社的7.5萬余種期刊,覆蓋JCR(《期刊引用報(bào)告》)收錄期刊的96%、Scopus收錄期刊的90%,發(fā)表時(shí)間最早可回溯至19世紀(jì),共約有1.1億篇外文題錄,并且可鏈接全文。對(duì)于中國知網(wǎng)的在線數(shù)據(jù),檢索不收費(fèi),但如果要查閱全文或下載文件,就需要付費(fèi)。中國知網(wǎng)是國內(nèi)高校常用的數(shù)據(jù)庫之一,有不少學(xué)校以IP授權(quán)方式購買了部分?jǐn)?shù)據(jù)庫一定時(shí)期的使用權(quán),在校內(nèi)均可訪問。1.3.3中國知網(wǎng)04精確檢索“信息檢索”網(wǎng)絡(luò)課程我國從2000年后就開始發(fā)展網(wǎng)絡(luò)課程建設(shè),國內(nèi)不少高校還借此開展了學(xué)歷型“網(wǎng)絡(luò)教育

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論