版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章 信息組織的基本原理學(xué)習(xí)目的和要求通過對(duì)本章的學(xué)習(xí),使學(xué)生對(duì)信息組織最常用的基本原理從宏觀上有一個(gè)把握和了解,為后面章節(jié)的學(xué)習(xí)打下基礎(chǔ)。本章學(xué)習(xí)重點(diǎn)掌握情報(bào)檢索語(yǔ)言的涵義、類型;掌握檢索語(yǔ)言的語(yǔ)法和句法控制;信息檢索系統(tǒng)的評(píng)價(jià)及評(píng)價(jià)指標(biāo);了解概念的種類、概念之間的各種關(guān)系;內(nèi)容安排第一節(jié) 語(yǔ)言學(xué)原理第二節(jié) 系統(tǒng)論原理第三節(jié) 知識(shí)分類原理第四節(jié) 概念邏輯原理第一節(jié) 語(yǔ)言學(xué)原理一、信息組織的語(yǔ)言工具檢索語(yǔ)言是信息檢索系統(tǒng)的重要組成部分,是信息組織和檢索的語(yǔ)言保證。張琪玉對(duì)情報(bào)檢索語(yǔ)言的定義情報(bào)檢索語(yǔ)言根據(jù)情報(bào)檢索的需要而創(chuàng)制的,專門用于各種手工的和計(jì)算機(jī)化的文獻(xiàn)情報(bào)存貯檢索系統(tǒng),能夠唯一地表
2、達(dá)各種概括文獻(xiàn)情報(bào)內(nèi)容(主題概念),能夠顯示概念之間的相互關(guān)系,并便于進(jìn)行系統(tǒng)排列,便于將標(biāo)引用語(yǔ)和檢索用語(yǔ)進(jìn)行相符性比較的人工語(yǔ)言。含義分析:檢索語(yǔ)言的目的是用于標(biāo)引和檢索,而根本的目的是滿足檢索的需要;它是一個(gè)規(guī)范化的概念體系,能準(zhǔn)確表達(dá)信息主題并顯示其相互關(guān)系;它是有序的,可用于系統(tǒng)排序;它是一種人工語(yǔ)言。切爾內(nèi)對(duì)檢索語(yǔ)言的闡述檢索語(yǔ)言一種專門的人工語(yǔ)言,它用于描述(表示)文獻(xiàn)的中心問題或主題和外表特征,以便以后在其他文獻(xiàn)集合中查找需要的文獻(xiàn),或者用于表示情報(bào)提問的內(nèi)容和檢索需要的文獻(xiàn)。二、檢索語(yǔ)言的類型基本劃分二、檢索語(yǔ)言的類型譜系分類譜系分類是將檢索語(yǔ)言按語(yǔ)系、語(yǔ)族、語(yǔ)支和語(yǔ)種體系劃
3、分的一種方法。三、語(yǔ)言學(xué)原理在信息組織中的應(yīng)用普通語(yǔ)言學(xué)的應(yīng)用英國(guó)的奧斯汀(D.Austin) 設(shè)計(jì)“保留上下文索引系統(tǒng)”(PRECIS)時(shí),就運(yùn)用了喬姆斯基(N.Chomsky)轉(zhuǎn)換生成語(yǔ)言學(xué)及其表層桔構(gòu)和深層結(jié)構(gòu)理論。陶布單元詞語(yǔ)言,就是根據(jù)美國(guó)描寫語(yǔ)言學(xué)的“分布理論”制定了單元詞之間的“同現(xiàn)關(guān)系”(Cooccurence)。計(jì)算語(yǔ)言學(xué)的應(yīng)用用詞頻統(tǒng)計(jì)分析方法進(jìn)行標(biāo)引和檢索詞匯的選擇。標(biāo)引詞在文獻(xiàn)庫(kù)中的分布服從正態(tài)分布分類號(hào)在大型文獻(xiàn)庫(kù)中的頻率分布符合雙曲線分布:出現(xiàn)頻率最高的詞不一定是最具描述率的。逆文獻(xiàn)加權(quán)四、檢索語(yǔ)言的語(yǔ)法(一)檢索語(yǔ)言語(yǔ)法體系的構(gòu)成檢索語(yǔ)言由詞匯和語(yǔ)法組成,語(yǔ)法包括
4、詞法和句法兩大部分。檢索語(yǔ)言通過制定的詞法規(guī)則來(lái)創(chuàng)造詞匯或從自然語(yǔ)言中擇取可用的自然語(yǔ)詞組成詞匯集合,并建立詞間的語(yǔ)義關(guān)系,以及通過一定的句法規(guī)則來(lái)規(guī)定這些詞匯在標(biāo)引和檢索過程中的使用。詞匯控制的內(nèi)容:詞量控制詞類控制詞形控制詞義控制詞間關(guān)系控制專指度控制(二)檢索語(yǔ)言的詞匯控制優(yōu)選自然語(yǔ)言建立詞間關(guān)系計(jì)算機(jī)編表輸出各種詞表 自然語(yǔ)言 人工語(yǔ)言 檢索語(yǔ)言 控制語(yǔ)言選定敘詞 詞類、詞形控制詞義控制 詞間關(guān)系控制專指度控制檢索語(yǔ)言提供外部形式的句法手段主要是指:引用次序控制符號(hào)句式變換(三)檢索語(yǔ)言的句法控制1.引用次序引用次序(Citation Order)或稱組配次序(Combination
5、Order),和語(yǔ)言學(xué)中的“詞序”這一術(shù)語(yǔ)相對(duì)應(yīng)。檢索語(yǔ)言把引用次序作為重要句法手段。引用次序主要有四類:“顯著性引用次序”;“范疇職能引用次序”;“概念關(guān)系引用次序”;“上下文從屬引用次序”阮岡納贊提出本體、物質(zhì)、動(dòng)力、空間、時(shí)間五個(gè)范疇,即著名的PMEST公式“范疇職能引用次序”上下文從屬引用次序(Context dependency)上下文從屬引用次序保留了部分自然語(yǔ)言句法手段(虛詞)和自然語(yǔ)序。如:“題內(nèi)關(guān)鍵詞索引”(KWIC) 和“題外關(guān)鍵詞索引”(KWOC) “掛接主題索引”“保留上下文索引系統(tǒng)”(PRECIS)“嵌套短語(yǔ)索引系統(tǒng)”(NEPHIS)和“鏈接短語(yǔ)索引系統(tǒng)”(LIPHI
6、S)等。ERIC題內(nèi)關(guān)鍵詞索引MeSH詞表題外關(guān)鍵詞索引樣例2.控制符號(hào)句法控制符號(hào)采用人工制定的成套的控制符號(hào)控制符號(hào)包括聯(lián)號(hào)、職號(hào)、關(guān)系符號(hào)(組配分類法中的“+”、“:”)、加權(quán)等類型并列符號(hào)“+”“41 +73 ”表示英美,“510 +47”表示中蘇關(guān)聯(lián)符號(hào) “:”“31 統(tǒng)計(jì)學(xué)”、“63 農(nóng)業(yè)科學(xué)”,用“:”連接表示“63:31 農(nóng)業(yè)統(tǒng)計(jì)學(xué)”?!?.句式變換句式變換檢索語(yǔ)言句子有一個(gè)檢索入口問題,即句首詞起著引導(dǎo)檢索者的作用。主要方式:輪排和倒置輪排是最主要的句式變換的手法。簡(jiǎn)單輪排詞對(duì)式輪排循環(huán)輪排循環(huán)輪排第二節(jié) 系統(tǒng)論原理一、系統(tǒng)論的基本原理和核心思想系統(tǒng)論認(rèn)為,整體性、關(guān)聯(lián)性、等
7、級(jí)結(jié)構(gòu)性、動(dòng)態(tài)平衡性、時(shí)序性等是所有系統(tǒng)的共同基本特征。系統(tǒng)論的核心思想是系統(tǒng)的整體觀念。任何系統(tǒng)都是一個(gè)有機(jī)的整體,它不是各個(gè)部分的機(jī)械組合或簡(jiǎn)單相加,系統(tǒng)的整體功能是各要素在孤立狀態(tài)下無(wú)法實(shí)現(xiàn)的。二、信息檢索系統(tǒng)理想的信息檢索系統(tǒng)具有信息組織和檢索兩大功能,并能實(shí)現(xiàn)較為理想的信息檢索效率。信息檢索系統(tǒng)生命周期信息檢索系統(tǒng)的系統(tǒng)構(gòu)成從系統(tǒng)分析的角度信息檢索系統(tǒng)的構(gòu)成有五個(gè)方面:硬件、軟件、數(shù)據(jù)件、人員件和系統(tǒng)件。從完整的結(jié)構(gòu)分析來(lái)分析信息檢索系統(tǒng)一般有六個(gè)子系統(tǒng):(1)資源采集與選擇子系統(tǒng);(2)詞表子系統(tǒng);(3)標(biāo)引子系統(tǒng);(4)查尋子系統(tǒng);(5)系統(tǒng)用戶接口子系統(tǒng);(6)匹配子系統(tǒng)。其中
8、,檢索語(yǔ)言和標(biāo)引是系統(tǒng)的中心環(huán)節(jié),它起著承上啟下,連接用戶與系統(tǒng)的關(guān)鍵作用。三、信息檢索系統(tǒng)的評(píng)價(jià)信息檢索系統(tǒng)性能評(píng)價(jià)的方面:檢索系統(tǒng)效能評(píng)價(jià)檢索性能評(píng)價(jià)(一)檢索系統(tǒng)效能評(píng)價(jià)檢索系統(tǒng)效能評(píng)價(jià)度量指標(biāo):系統(tǒng)響應(yīng)時(shí)間+系統(tǒng)所需空間度量參數(shù):索引結(jié)構(gòu)的性能;與操作系統(tǒng)交互的效能;通信信道的延遲;軟件開銷 通常時(shí)間越短,占用的空間越少,系統(tǒng)的性能越好。但是,在空間和時(shí)間之間有一個(gè)折衷的問題。(二)檢索系統(tǒng)效能評(píng)價(jià)檢索性能評(píng)價(jià)信息檢索的關(guān)鍵問題相關(guān)性如何從文檔集中找出與用戶查詢要求相關(guān)的文檔,因此度量文檔與查詢之間的相關(guān)性是檢索任務(wù)的核心。“相關(guān)性”是一個(gè)多維的概念、動(dòng)態(tài)的、復(fù)雜而系統(tǒng)的、可以定量化測(cè)
9、量的一個(gè)度量體系。主要取決于用戶對(duì)檢索結(jié)果集滿足用戶信息需求之間程度的判斷。一個(gè)比較具有代表性的觀點(diǎn),相關(guān)性=滿意度+有用性+針對(duì)性+時(shí)效性檢索性能定量評(píng)價(jià)指標(biāo)檢索性能評(píng)價(jià)指標(biāo)查全率查準(zhǔn)率Lancaster的評(píng)價(jià)指標(biāo)查全率(Recall)查準(zhǔn)率(Precision)響應(yīng)時(shí)間(檢索速度)收錄范圍用戶負(fù)擔(dān)輸出形式三、網(wǎng)絡(luò)檢索系統(tǒng)性能評(píng)價(jià)版本一數(shù)據(jù)庫(kù)規(guī)模和內(nèi)容(覆蓋范圍、索引組成、更新周期);索引方法(自動(dòng)、人工索引);檢索功能(布爾邏輯檢索、截詞檢索、字面檢索、大小寫區(qū)分、概念檢索、詞語(yǔ)加權(quán)、詞語(yǔ)位置限定、字段限定、重復(fù)辨別、上下文關(guān)鍵詞、查詢集操作);檢索結(jié)果(相關(guān)性排序(單純排序或注明排序分值
10、)、顯示內(nèi)容(注釋或摘要)、輸出數(shù)量選擇(限定或改變顯示數(shù)量)、顯示格式選擇);用戶負(fù)擔(dān)(幫助文件、數(shù)據(jù)庫(kù)和檢索功能說明、查詢舉例、構(gòu)造檢索式的幫助措施,);檢索效率(檢全率、檢準(zhǔn)率和響應(yīng)時(shí)間)。版本二在技術(shù)方面:對(duì)新網(wǎng)站登錄的支持;數(shù)據(jù)庫(kù)的更新頻率和時(shí)效性;錯(cuò)誤鏈接和重復(fù)鏈接的數(shù)量;搜索的速度;搜索結(jié)果排序的相關(guān)度;中文還有對(duì)英文和多內(nèi)碼的支持; 在用戶使用方面:有首頁(yè)設(shè)計(jì)的美觀性;幫助文件的實(shí)用性;查詢操作的便利性;搜索結(jié)果的準(zhǔn)確性。版本三與“檢索技術(shù)”密切相關(guān)的測(cè)試指標(biāo):索引數(shù)據(jù)庫(kù)構(gòu)成:標(biāo)引深度、更新頻率;檢索功能:基本檢索功能與高級(jí)檢索功能;檢索效果:響應(yīng)時(shí)間、相對(duì)查全率R,查準(zhǔn)率P、
11、重復(fù)率R,、死鏈接率Rd;檢索結(jié)果組織和顯示:結(jié)果顯示格式的種類與內(nèi)容(反饋信息)、相關(guān)性排序依據(jù)等;用戶負(fù)擔(dān):用戶界面(用戶檢索界面也非決定搜索引擎性性能的關(guān)鍵因素)、相關(guān)文獻(xiàn),信息過濾等。第三節(jié) 知識(shí)分類原理一、檢索語(yǔ)言的知識(shí)分類體系(一)哲學(xué)家的知識(shí)分類體系培根知識(shí)分類體系圖毛澤東關(guān)于知識(shí)的概括和分類 (二)大學(xué)教學(xué)知識(shí)分類體系聯(lián)合國(guó)教科文組織的分類體系.普通高等學(xué)校本科專業(yè)目錄(1998年頒布)學(xué)科體系(三)科學(xué)學(xué)知識(shí)分類體系學(xué)科分類與代碼(GB/T 13745-92)學(xué)科體系示意圖第四節(jié) 概念邏輯原理一、概念種類、內(nèi)涵與外延概念集合概念和非集合概念;普遍概念和單獨(dú)概念。概念的含義與適
12、用的范圍就是一個(gè)概念的內(nèi)涵與外延。當(dāng)概念的內(nèi)涵擴(kuò)大(加深)時(shí),則它的外延就縮?。划?dāng)概念的內(nèi)涵縮?。ㄗ儨\)時(shí),則它的外延就擴(kuò)大。二、概念之間的關(guān)系屬種關(guān)系一個(gè)概念的外延包含另一概念的全部外延同一關(guān)系兩個(gè)概念在外延上完全重合交叉關(guān)系兩個(gè)概念之間有且只有一部分外延是重合的三、概念邏輯方法(一)概念的限定與概括概念的限定是指通過增加概念(限定詞)的內(nèi)涵以縮小概念的外延,由屬概念過渡到種概念的邏輯方法。概念的概括是通過減少概念的內(nèi)涵從而擴(kuò)大其外延,由外延較小的種概念到屬概念。(二)概念的劃分概念的劃分是以事物的某種屬性為分類標(biāo)準(zhǔn),將一個(gè)屬概念的外延劃分成若干個(gè)種概念的方法。事物有各種各樣的屬性,根據(jù)不同
13、的屬性就可作不同的劃分。概念劃分的基本規(guī)則劃分得到的子項(xiàng)的外延之和應(yīng)當(dāng)?shù)扔谀疙?xiàng)的外延;劃分得到的各子項(xiàng)的外延必須相互排斥;每次劃分應(yīng)當(dāng)使用同一標(biāo)準(zhǔn)進(jìn)行;劃分必須是按逐級(jí)進(jìn)行。(三)概念的分析與綜合概念的分析是對(duì)整體事件和復(fù)雜事物進(jìn)行分解的研究方法,包括把整體事物分解為各個(gè)部分和把復(fù)雜事物分解為簡(jiǎn)單的要素并對(duì)分解的部分和要素進(jìn)行考察。概念的綜合是在思維過程中把對(duì)象的各個(gè)部分、各個(gè)方面和各個(gè)因素聯(lián)系起來(lái)考察,得出有關(guān)它們共性的、本質(zhì)的認(rèn)識(shí)。概念分析與綜合的關(guān)系綜合建立在分析基礎(chǔ)上。分析與綜合按其思維的方向是相反的,一是在整體基礎(chǔ)上去認(rèn)識(shí)部分,一是在對(duì)部分認(rèn)識(shí)的基礎(chǔ)上又去重新認(rèn)識(shí)整體,二者是辯證統(tǒng)一的。四、概念邏輯方法的應(yīng)用概念的邏輯方法是編制信息分類法基本方法??疾旄鱾€(gè)知識(shí)領(lǐng)域的要素及其屬性,從眾多的知識(shí)領(lǐng)域依據(jù)它們共同的屬性概括出分類法的基本大類,這就是分析與綜合的方法。對(duì)每一個(gè)類目通過選取適當(dāng)?shù)姆诸悩?biāo)準(zhǔn)(即分類標(biāo)準(zhǔn)引用次序)進(jìn)行逐級(jí)地劃分,一層層展開就構(gòu)成一個(gè)等級(jí)并列關(guān)系分明、概念內(nèi)涵外延清晰的類目體系,這個(gè)過程始終是概念邏輯方法的運(yùn)用。分類標(biāo)準(zhǔn)引用次序的選
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版新型城鎮(zhèn)化建設(shè)項(xiàng)目融資租賃合同
- 二零二五年度居民生活用水價(jià)格調(diào)整合同范本3篇
- 二零二五年度學(xué)生健康保險(xiǎn)合同3篇
- 第16講-金屬材料與合金(學(xué)生版)
- 安全事故中的人為因素及責(zé)任追究問題研究報(bào)告
- 小學(xué)體育游戲教學(xué)的課程評(píng)價(jià)與反饋機(jī)制
- 河北機(jī)電職業(yè)技術(shù)學(xué)院《微納光學(xué)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 小學(xué)階段學(xué)生心理健康與家庭情感教育的關(guān)系研究
- 學(xué)生視力保健教育的實(shí)踐與挑戰(zhàn)
- 二零二五年度快遞快遞末端網(wǎng)點(diǎn)經(jīng)營(yíng)權(quán)轉(zhuǎn)讓及合作框架合同3篇
- 2024年國(guó)家公務(wù)員錄用考試公共基礎(chǔ)知識(shí)復(fù)習(xí)題庫(kù)2500題及答案
- DBJ41-T 108-2011 鋼絲網(wǎng)架水泥膨脹珍珠巖夾芯板隔墻應(yīng)用技術(shù)規(guī)程
- 水利工程全生命周期管理-洞察分析
- 2024年物業(yè)公司服務(wù)質(zhì)量保證合同條款
- JJF(陜) 049-2021 變壓器交流阻抗參數(shù)測(cè)試儀校準(zhǔn)規(guī)范
- 詞語(yǔ)理解-2025年中考語(yǔ)文專項(xiàng)復(fù)習(xí)(遼寧專用)(原卷版)
- 娛樂場(chǎng)所突發(fā)事件應(yīng)急措施及疏散預(yù)案(三篇)
- 八大危險(xiǎn)作業(yè)安全培訓(xùn)考核試卷
- 《孫子兵法》與執(zhí)政藝術(shù)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 九宮數(shù)獨(dú)200題(附答案全)
- 2024年南京信息職業(yè)技術(shù)學(xué)院高職單招(英語(yǔ)/數(shù)學(xué)/語(yǔ)文)筆試歷年參考題庫(kù)含答案解析
評(píng)論
0/150
提交評(píng)論