![社科文獻(xiàn)檢索(檢索原理)_第1頁(yè)](http://file4.renrendoc.com/view/2dbbe4f2defeae27ffa457d8049719b8/2dbbe4f2defeae27ffa457d8049719b81.gif)
![社科文獻(xiàn)檢索(檢索原理)_第2頁(yè)](http://file4.renrendoc.com/view/2dbbe4f2defeae27ffa457d8049719b8/2dbbe4f2defeae27ffa457d8049719b82.gif)
![社科文獻(xiàn)檢索(檢索原理)_第3頁(yè)](http://file4.renrendoc.com/view/2dbbe4f2defeae27ffa457d8049719b8/2dbbe4f2defeae27ffa457d8049719b83.gif)
![社科文獻(xiàn)檢索(檢索原理)_第4頁(yè)](http://file4.renrendoc.com/view/2dbbe4f2defeae27ffa457d8049719b8/2dbbe4f2defeae27ffa457d8049719b84.gif)
![社科文獻(xiàn)檢索(檢索原理)_第5頁(yè)](http://file4.renrendoc.com/view/2dbbe4f2defeae27ffa457d8049719b8/2dbbe4f2defeae27ffa457d8049719b85.gif)
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
社科文獻(xiàn)檢索(六)文獻(xiàn)信息檢索原理2023/2/61本課要點(diǎn)一、檢索的意義二、檢索的基本原理三、檢索點(diǎn)四、檢索手段五、檢索效果2023/2/62一、檢索的意義
“意義”一詞有兩個(gè)意義:
1、他清楚地闡釋了“人文”這個(gè)術(shù)語(yǔ)的意義。
2、你們這樣做到底有什么意義?在句1中的意思是“含義”,在句2中是“功用”。就前者而言:文獻(xiàn)信息具有共享性,信息資源共享(informationresourcesharing)是當(dāng)今社會(huì)的一個(gè)熱點(diǎn)問(wèn)題。為了分享人類(lèi)共同的知識(shí)財(cái)富、研究成果,人們必須通過(guò)一種科學(xué)的方法從取之不盡的信息源中去識(shí)別和獲取所需要的那部分信息,這個(gè)過(guò)程就是檢索(searching)。2023/2/63檢索的意義就后者而言:信息具有可擴(kuò)充性,人們對(duì)信息的處理能力越強(qiáng),信息擴(kuò)充得就越快。檢索在信息處理和增值中有重要意義。信息的檢索、利用和創(chuàng)造是一個(gè)循環(huán)和增值的過(guò)程,人們通過(guò)工具檢索獲得信息,經(jīng)過(guò)處理篩選出需要的部分,在利用信息的過(guò)程中又創(chuàng)出新的信息,這些信息經(jīng)過(guò)核準(zhǔn)后又被標(biāo)引、組織進(jìn)檢索工具,再提供人們使用,信息在這個(gè)循環(huán)的處理過(guò)程中不斷得到擴(kuò)充,它的增長(zhǎng)是沒(méi)有窮盡的。
2023/2/64檢索的意義進(jìn)一步說(shuō),信息的檢索是與信息的存貯對(duì)應(yīng)的。從廣義上講,信息檢索應(yīng)包括信息存貯與檢索兩方面的含義。沒(méi)有存儲(chǔ)就無(wú)所謂檢索。圖書(shū)館里沒(méi)有書(shū),就用不著檢索;有了很多書(shū),放了很多書(shū)架、甚至有很多書(shū)庫(kù),就需要檢索,否則就找不到要用的那一本書(shū)。所以信息檢索應(yīng)包括信息存貯與檢索兩方面的含義。2023/2/65檢索的意義存貯(informationstoring):將信息按一定的方式有序的組織起來(lái)。檢索
(informationretrieval):根據(jù)用戶(hù)特定的需求將相關(guān)信息準(zhǔn)確的提取出來(lái)。所以當(dāng)前更普遍使用的術(shù)語(yǔ)是信息存取。
信息存取
(informationaccess):"Access"該詞源于計(jì)算機(jī)學(xué)科領(lǐng)域,指計(jì)算機(jī)訪(fǎng)問(wèn)文檔或數(shù)據(jù)集的方式。引入信息檢索范疇,則從本質(zhì)上拓寬了檢索的內(nèi)涵及其應(yīng)用。信息存取將所有信息的組織、檢索活動(dòng)及其先進(jìn)的技術(shù)手段融合在一起。如果檢索的對(duì)象是文獻(xiàn)信息,那么就屬于文獻(xiàn)檢索。
2023/2/66二、檢索的基本原理
信息檢索基本原理的核心是用戶(hù)信息需求與文獻(xiàn)信息集合的比較和選擇,是兩者匹配(match)的過(guò)程。
2023/2/67檢索的基本原理
一方面是用戶(hù)的信息需求,一方面是組織有序的文獻(xiàn)信息集合,檢索就是從用戶(hù)特定的信息需求出發(fā),對(duì)特定的信息集合采用一定的方法、技術(shù)手段,根據(jù)一定的線(xiàn)索與規(guī)則從中找出(search,locate,hit)相關(guān)的信息。
2023/2/68檢索的基本原理匹配有其匹配標(biāo)準(zhǔn),這里涉及到兩者一致性、相關(guān)度等問(wèn)題,按一定的標(biāo)準(zhǔn)篩選出符合要求的信息。其圖示如右:
2023/2/69三、檢索點(diǎn)
檢索點(diǎn)(accesspoint)是檢索的出發(fā)點(diǎn),切入點(diǎn)。
每件文獻(xiàn)均有內(nèi)部的(信息內(nèi)容)特征及其相關(guān)的外部特征,在檢索系統(tǒng)中檢索點(diǎn)是標(biāo)目的總稱(chēng)。從文獻(xiàn)的特征出發(fā),將其特征值與檢索系統(tǒng)中標(biāo)目數(shù)據(jù)進(jìn)行計(jì)算比較,通過(guò)匹配達(dá)到檢索目的。
2023/2/610檢索點(diǎn)文獻(xiàn)信息特征是多方面的,可供用于文獻(xiàn)檢索的檢索點(diǎn)很多。反映文獻(xiàn)信息內(nèi)容特征的有: 分類(lèi)檢索,按照?qǐng)D書(shū)的分類(lèi)來(lái)檢索主題檢索;按照書(shū)或文章內(nèi)容主題詞(關(guān)鍵詞)來(lái)檢索反映文獻(xiàn)外部特征的有:作者檢索,按照書(shū)或文章的作者來(lái)檢索名稱(chēng)檢索,按照書(shū)名或篇名來(lái)檢索號(hào)碼檢索,按照書(shū)刊號(hào)碼來(lái)檢索,
等等。2023/2/6111.分類(lèi)檢索廣泛用于圖書(shū)資料的是圖書(shū)分類(lèi)法。圖書(shū)分類(lèi)法的作用是指示用戶(hù)根據(jù)學(xué)科內(nèi)容檢索圖書(shū)資料,指導(dǎo)用戶(hù)從開(kāi)架書(shū)庫(kù)(openshelf)中按類(lèi)號(hào)順序找到指定的圖書(shū)及其內(nèi)容相關(guān)的資料。許多出版物上都有“圖書(shū)在版編目”CIP(CatalogingInPrint)。在我國(guó)出版的圖書(shū)、專(zhuān)著上“圖書(shū)在版編目”數(shù)據(jù)中有"中圖法分類(lèi)號(hào)"一項(xiàng)。2023/2/6122.主題檢索
主題(subject)檢索是從反映文獻(xiàn)內(nèi)容的有關(guān)主題詞出發(fā)來(lái)檢索文獻(xiàn),主題是檢索點(diǎn),它對(duì)應(yīng)文獻(xiàn)主題概念。我國(guó)出版的《漢語(yǔ)主題詞表》是通用的漢語(yǔ)敘詞表,分為自然科學(xué)和社會(huì)科學(xué)兩個(gè)部分?!吨袊?guó)分類(lèi)主題詞表》是一部大型綜合性的分類(lèi)語(yǔ)言和主題語(yǔ)言兼容的文獻(xiàn)標(biāo)引工具,是一種新型的文獻(xiàn)檢索語(yǔ)言。詞表共收錄分類(lèi)法類(lèi)目5萬(wàn)多個(gè),主題詞(串)21萬(wàn)多條,包括社會(huì)科學(xué)和自然科學(xué)各學(xué)科領(lǐng)域的主題概念。2023/2/613
3.作者檢索作者(author)檢索是從文獻(xiàn)的作者姓名出發(fā)來(lái)檢索其文獻(xiàn)。
"作者"廣義上還應(yīng)包括:匯編者(compiler)、編者(editor)、主辦者(sponsoringbody)、譯者(translator)等。
2023/2/6144.名稱(chēng)檢索名稱(chēng)(title)檢索點(diǎn)包括:書(shū)名、刊名、資料名、出版物名、出版社名、會(huì)議名、物質(zhì)名稱(chēng)等等,也包括人名和機(jī)構(gòu)名。2023/2/6155.號(hào)碼檢索號(hào)碼包括文獻(xiàn)的編號(hào)(number)、代碼(code)等。
在對(duì)圖書(shū)和期刊檢索時(shí)常用到兩個(gè)號(hào)碼:國(guó)際標(biāo)準(zhǔn)書(shū)號(hào)ISBN(InternationalStandardBookNumber)及國(guó)際標(biāo)準(zhǔn)刊號(hào)ISSN(InternationalStandardSerialNumber),它們分別是一種圖書(shū)和一種期刊的唯一標(biāo)號(hào)。
2023/2/616國(guó)際標(biāo)準(zhǔn)書(shū)號(hào)ISBNISBN號(hào)有十位,分四段構(gòu)成,第一段為組號(hào),第二段為出版社編號(hào),第三段為圖書(shū)序號(hào),第四段為校驗(yàn)碼。如:
ISBN7-215-04848-9(《瀟灑人生》)其中:組號(hào)有:0(英、美、加拿大、南非等英語(yǔ)區(qū)),1(其它英語(yǔ)區(qū)),2(法語(yǔ)區(qū)),3(德語(yǔ)區(qū)),4(日本),5(俄語(yǔ)區(qū)),7(中國(guó)),8(印度等),9(新加坡等東南亞地區(qū))。
2023/2/617國(guó)際標(biāo)準(zhǔn)刊號(hào)ISSNISSN號(hào)有八位數(shù)字組成,前七位為出版物序號(hào),最后一位為校驗(yàn)碼。如:
ISSN
1008-4339(天津大學(xué)學(xué)報(bào)[社科版])2023/2/618檢索點(diǎn)
由于文獻(xiàn)加工的細(xì)化,計(jì)算機(jī)標(biāo)引的介入,新型電子文獻(xiàn)出現(xiàn)等情況,形成了更多的可檢索點(diǎn),比如:文獻(xiàn)類(lèi)型、文獻(xiàn)屬性、參考文獻(xiàn)、語(yǔ)種、出版年份等檢索點(diǎn),它們提供了更多的檢索途徑。
2023/2/619四、檢索手段
1.檢索手段的分類(lèi)2.計(jì)算機(jī)檢索的優(yōu)勢(shì)3.計(jì)算機(jī)檢索系統(tǒng)
2023/2/6201.檢索手段的分類(lèi)檢索從技術(shù)手段上分有:手工檢索(手檢)和計(jì)算機(jī)檢索(機(jī)檢)
2023/2/621手工檢索手工檢索(manualretrieval)使用的多為印刷型或書(shū)本型檢索(paper-basedretrieval)
工具,早些有檢索卡片,現(xiàn)在使用最多的是檢索刊,手檢工具能提供的檢索點(diǎn)十分有限,檢索結(jié)果往往不盡人意。
2023/2/622計(jì)算機(jī)檢索計(jì)算機(jī)檢索(computer-basedretrieval)技術(shù)含量高,它通過(guò)數(shù)據(jù)庫(kù)系統(tǒng)來(lái)實(shí)現(xiàn)的。機(jī)檢不僅需要先進(jìn)的技術(shù)設(shè)施,也要求較高的人的文化素質(zhì)。
2023/2/6232、計(jì)算機(jī)檢索的優(yōu)勢(shì)2、計(jì)算機(jī)檢索的優(yōu)勢(shì)
計(jì)算機(jī)檢索明顯優(yōu)于手工檢索,主要表現(xiàn)為1)檢索的信息量大,2)數(shù)據(jù)更新快,3)檢索功能強(qiáng),4)檢索結(jié)果輸出的多樣性等。
2023/2/6241)檢索的信息量大
且不說(shuō)大型機(jī)器的海量存貯,一張普通光盤(pán)的信息存貯量就達(dá)650M,相當(dāng)與幾十萬(wàn)頁(yè)的書(shū)。高密度的光盤(pán)可以容納4G以上的信息。計(jì)算機(jī)若與全球網(wǎng)絡(luò)相連,就能獲得世界范圍的信息。
2023/2/6252)數(shù)據(jù)更新快計(jì)算機(jī)處理與電子傳輸?shù)难杆佟?shù)據(jù)的動(dòng)態(tài)和即時(shí)、及時(shí)的更新、檢索的實(shí)時(shí)性都是手檢工具無(wú)法比擬的。但是我們也不能迷信計(jì)算機(jī)。有時(shí)候計(jì)算機(jī)業(yè)會(huì)讓我們上當(dāng)。商家常常說(shuō)“電腦哪會(huì)有錯(cuò)”,坑害顧客。
2023/2/6263)檢索功能強(qiáng)
機(jī)檢系統(tǒng)可提供很多檢索點(diǎn),對(duì)一個(gè)檢索點(diǎn)還可以同時(shí)取若干個(gè)檢索屬性值,從多點(diǎn)交叉切入,有多重限定,有多種組合方式,允許人機(jī)交互,能達(dá)到高效、高精度的檢索效果。并具多庫(kù)檢索,多媒體和知識(shí)檢索功能。2023/2/6274)檢索結(jié)果輸出的多樣性用戶(hù)可以選擇各種輸出形式和輸出格式,比如屏幕顯示、拷貝、下載、打印等都是常用的方式,輸出的內(nèi)容、格式和形式可選擇或自行定義。
總的趨勢(shì)是機(jī)檢方將逐步取代手檢方式。當(dāng)前許多經(jīng)典的印刷型工具都有其對(duì)應(yīng)的電子數(shù)據(jù)格式、數(shù)據(jù)庫(kù),印刷工具則成了電子數(shù)據(jù)加工輸出的"副產(chǎn)品",許多新生的數(shù)據(jù)庫(kù)不再與印刷型工具有緣,僅有其電子版本。
2023/2/6283.計(jì)算機(jī)檢索系統(tǒng)
1)信息主體。2)檢索語(yǔ)言。
2023/2/6291)信息主體信息主體。這里指的是文獻(xiàn)全文數(shù)據(jù)庫(kù)、文獻(xiàn)書(shū)目數(shù)據(jù)庫(kù)等。
書(shū)目型數(shù)據(jù)庫(kù)有字段,記錄,文檔等構(gòu)成。文獻(xiàn)全文數(shù)據(jù)庫(kù)還包括文獻(xiàn)的全文(文本型或照片型)2023/2/6302)
檢索語(yǔ)言
檢索語(yǔ)言。語(yǔ)言是一種人們用以交流溝通的重要工具,用于人與人之間的通信活動(dòng)(communication)。人與計(jì)算機(jī)對(duì)話(huà),需要有計(jì)算機(jī)語(yǔ)言,人與檢索系統(tǒng)對(duì)話(huà)來(lái)實(shí)施檢索,則需要有檢索語(yǔ)言(retrievallanguage)。
2023/2/631檢索語(yǔ)言的分類(lèi)
A)根據(jù)檢索語(yǔ)言不同的特征將檢索語(yǔ)言進(jìn)行分類(lèi)。
2023/2/632檢索語(yǔ)言的分類(lèi)
B)按其規(guī)范的情況分類(lèi)可分為:人工語(yǔ)言
(規(guī)范語(yǔ)言)
自然語(yǔ)言(非規(guī)范語(yǔ)言);
2023/2/633自然語(yǔ)言自然語(yǔ)言有較大的靈活性,使用隨意,專(zhuān)指性強(qiáng),查準(zhǔn)率高。它能及時(shí)地反映最新出現(xiàn)的詞匯,反映規(guī)范詞難于表達(dá)的特定概念或新概念。在全文檢索中自然語(yǔ)言獨(dú)領(lǐng)風(fēng)騷。大容量、高速、高性能的計(jì)算機(jī)檢索系統(tǒng)的自動(dòng)標(biāo)引,使得自由詞的全文檢索,即自由文本檢索(free-textsearch)占的比例越來(lái)越高。自然語(yǔ)言的缺點(diǎn)是由于它不規(guī)范,缺乏對(duì)詞匯的控制能力,也無(wú)法指示概念之間的關(guān)系,影響到檢索效率。
2023/2/634人工語(yǔ)言人工語(yǔ)言(規(guī)范語(yǔ)言)(artificiallanguage,controlledlanguage)。人工語(yǔ)言的規(guī)范處理重在兩個(gè)方面:一是使一個(gè)概念只用一個(gè)詞匯來(lái)表達(dá),這樣就避免了多詞一義的情況;二是使一個(gè)標(biāo)引詞只能表達(dá)一個(gè)概念,這樣就排除了一詞多義現(xiàn)象。
2023/2/635檢索語(yǔ)言
在實(shí)際檢索中,檢索詞的選擇是個(gè)復(fù)雜的問(wèn)題,必須考慮表達(dá)概念的準(zhǔn)確與完善,通常是規(guī)范語(yǔ)言和非規(guī)范語(yǔ)言交混使用來(lái)滿(mǎn)足各種不同的需要。
2023/2/636五、檢索效果
檢索效果(retrievaleffectiveness)的評(píng)價(jià)指標(biāo)有6項(xiàng),包括:收錄范圍查全率查準(zhǔn)率響應(yīng)時(shí)間用戶(hù)負(fù)擔(dān)輸出形式。其中兩個(gè)主要的衡量指標(biāo)是查全率(Recallratio)和查準(zhǔn)率(precisionratio),分別用R和P大寫(xiě)字母表示。
2023/2/637檢索效果2023/2/638檢索效果2023/2/639檢索效果一系列的實(shí)驗(yàn)結(jié)果表明查全率與查準(zhǔn)率之間存在互逆關(guān)系。即查全率高時(shí),查準(zhǔn)率較低,反之亦然。R和P各自的最佳狀態(tài)是逼近100%,魚(yú)和熊掌不可得兼。
2023/2/640檢索效果
其
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 商務(wù)星球版地理八年級(jí)下冊(cè):8.2 《新疆維吾爾自治區(qū)》 聽(tīng)課評(píng)課記錄
- 八年級(jí)政治下冊(cè)第六單元我們的人身權(quán)利6.2《維護(hù)人格尊嚴(yán)》情境探究型聽(tīng)課評(píng)課記錄(粵教版)
- 個(gè)人中介房屋租賃協(xié)議書(shū)范本
- 房屋轉(zhuǎn)租三方合同范本
- 樓層架管出租協(xié)議書(shū)范本
- 私立中學(xué)轉(zhuǎn)讓合同書(shū)
- 2025年度互聯(lián)網(wǎng)廣告合同終止的多重市場(chǎng)監(jiān)管情形
- 區(qū)中心房屋租賃合同范本
- 2025年度商品車(chē)運(yùn)輸與新能源汽車(chē)充電設(shè)施安裝合同
- 二零二五年度新能源研發(fā)私人廠(chǎng)房租賃合同
- 2025南網(wǎng)科研院系統(tǒng)內(nèi)招聘13人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 關(guān)于合同知識(shí)的全面解讀
- IEC 62368-1標(biāo)準(zhǔn)解讀-中文
- HG+20231-2014化學(xué)工業(yè)建設(shè)項(xiàng)目試車(chē)規(guī)范
- 2024年湖南高速鐵路職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)附答案
- 典當(dāng)業(yè)務(wù)計(jì)劃方案
- 老化箱點(diǎn)檢表A4版本
- 音標(biāo)教學(xué)課件(共73張PPT)
- 群雄起源-武將表(按智排序)
- Image-Pro_Plus圖像分析軟件
- 自由組合定律的應(yīng)用9331的變式
評(píng)論
0/150
提交評(píng)論