第2章__信息存儲與檢索基礎(chǔ)_第1頁
第2章__信息存儲與檢索基礎(chǔ)_第2頁
第2章__信息存儲與檢索基礎(chǔ)_第3頁
第2章__信息存儲與檢索基礎(chǔ)_第4頁
第2章__信息存儲與檢索基礎(chǔ)_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第2章 信息存儲與檢索基礎(chǔ)l本章重點(diǎn):本章重點(diǎn):l信息存儲與檢索得基本概念、原理l信息存儲基本形式及發(fā)展l信息檢索模型l信息存儲與檢索得基本類型l索引的概念及其類型劃分l2.1 信息存儲與檢索原理l2.1.1 信息存儲與檢索概念l2.1.2 信息存儲形式l2.1.3 信息存取模型l2.2 信息存儲與檢索類型l2.2.1按存取活動的執(zhí)行主體劃分l2.2.2按查詢信息的特征劃分l2.2.3按檢索系統(tǒng)的工作方式劃分l2.2.4依檢索策略劃分l2.2.5依照系統(tǒng)載體劃分l2.3 索引款目的結(jié)構(gòu)與類型l2.3.1 索引款目結(jié)構(gòu)l2.3.2 主要索引類型2.1.1 2.1.1 信息存儲與檢索概念信息存儲與

2、檢索概念l信息存儲與檢索(簡稱為信息檢索或信息存取)是信息存儲與檢索(簡稱為信息檢索或信息存?。┦切畔z索的全稱形式或廣義的信息檢索,它既包括著采用多種形式記錄信息、排序信息的信息存儲過程,也包括著通過一定的設(shè)備、采用一定的手段與技巧從信息系統(tǒng)中快速、準(zhǔn)確地搜尋所需信息的方法與活動。l信息檢索的基本原理:信息檢索的基本原理:為了促進(jìn)信息資源的充分交流和有效利用,使用戶在信息集合中快速、精確、全面地獲得特定需要的信息資源,必須要對廣泛、大量、分散、無序的信息進(jìn)行搜集、記錄、組織、存儲,以建成各種信息存取系統(tǒng)。用戶則根據(jù)檢索需要,將需求轉(zhuǎn)變?yōu)橄到y(tǒng)所能識別的檢索式,再與存取系統(tǒng)中表征信息資源特征的標(biāo)

3、識進(jìn)行逐一的相符性匹配與比較,兩者完全一致或部分一致時,即為命中信息,可按用戶要求從存取系統(tǒng)中輸出。l信息存儲與檢索走過了文獻(xiàn)檢索文獻(xiàn)檢索、情報檢索情報檢索的歷程,并且正在向著知識檢索知識檢索的領(lǐng)域邁進(jìn)。l從信息需求與查詢結(jié)果信息需求與查詢結(jié)果看,信息檢索通常包括四種類型:l關(guān)于文獻(xiàn)的檢索l關(guān)于某事實(shí)或事項(xiàng)的知識檢索l關(guān)于數(shù)值或數(shù)據(jù)的情報檢索1.關(guān)于圖像信息的信息檢索l信息檢索信息檢索一般是通過信息存取系統(tǒng)(亦稱檢索工具)來實(shí)現(xiàn)的,任何一種存取系統(tǒng)都包括有信息存儲子系統(tǒng)和信息檢索子系統(tǒng),它們是同一事物中兩個相互對立的方面,如圖21所示: l存儲子系統(tǒng)存儲子系統(tǒng)的建設(shè),要求根據(jù)一定的原則記錄和描

4、述信息或知識載體的內(nèi)容與形式特征,然后按特征序化成各類信息集合并組織成系統(tǒng)。信息存儲部分是揭示信息特征、整序信息、建設(shè)系統(tǒng)的過程。檢索子系統(tǒng)檢索子系統(tǒng)的主要功能是根據(jù)信息用戶的需求,利用一定的設(shè)備與技術(shù)查詢特定信息的過程。但是只有經(jīng)過記錄、描述與組織序化的知識集合,才能提供有效的信息檢索。因此,信息存儲是基礎(chǔ),信息檢索是目的。2.1.2 信息存儲形式l根據(jù)存儲介質(zhì)及其存儲技術(shù)劃分:根據(jù)存儲介質(zhì)及其存儲技術(shù)劃分:(1)信息的印刷存儲)信息的印刷存儲l由于紙張上的文字、圖形信息直觀易讀、攜帶方便,直到今天仍然是用戶所樂于接受的最常使用的信息載體。紙張載體的弊端是存儲信息的密度太小、占用空間大、存儲

5、速度慢、印刷周期長,難以實(shí)現(xiàn)信息內(nèi)容的快速傳遞;此外,紙張載體易受溫度、濕度、光線、灰塵、蛀蟲影響,難以長期保管。(2)信息的微縮存儲)信息的微縮存儲l微縮存儲是微縮攝影技術(shù)的簡稱,主要利用攝影機(jī)將印刷資料微縮拍攝到感光膠片上,沖洗微縮膠片后保存起來,以供拷貝發(fā)行、檢索與閱讀之用。l微縮存儲的主要的特點(diǎn)有:存儲容量大、密度高;體積小、重量輕;忠實(shí)于信息原件、不出差錯;成本低、價格便宜;保存時(3 3)信息的磁存儲)信息的磁存儲l磁存儲的主要類型有計(jì)算機(jī)磁帶,硬盤,軟盤,溫盤。l磁存儲的主要特點(diǎn)有:l 能夠存儲一切可以轉(zhuǎn)換成電信號的信息,如文字、聲音、圖像等。 l可長久保存在磁帶中,可重復(fù)使用,

6、可隨時抹去重新記錄新信息。1. 能同時進(jìn)行多路信息的存儲,并保證信息之間的時間和相位關(guān)系。l 存儲頻帶寬廣,可存儲直流2兆赫以上的信號。l可根據(jù)需要或高速存入高頻信息慢速復(fù)放,或慢速存入低頻信息快速復(fù)放。l磁帶存儲磁帶存儲的主要優(yōu)點(diǎn)是:價格便宜、存儲量大、占用空間小、性能價格比高。其缺點(diǎn)是只適用于順序存儲,而且速度有限;工作時由于磁頭與磁帶表面的接觸容易損壞磁表面層;磁帶存儲器的順序存儲方式?jīng)Q定了其特別適用于大批量的回溯檢索。l磁盤存儲器磁盤存儲器的最大優(yōu)點(diǎn)是,能夠隨機(jī)存儲所需數(shù)據(jù),數(shù)據(jù)傳輸速度快,適合作為計(jì)算機(jī)大容量的外部存儲設(shè)備。l軟盤軟盤的優(yōu)點(diǎn)是:驅(qū)動器體積小、重量輕、結(jié)構(gòu)簡單、價格低,

7、缺點(diǎn)是存儲容量小,存取速度與數(shù)據(jù)傳輸率較低,容易攜帶病毒。l溫盤溫盤存儲具有以下特點(diǎn):l(1)采用組合件方法消除影響磁頭定位精度的機(jī)械變動因素;l(2) 采用密封防塵結(jié)構(gòu)減少浮動高度和有效記錄磁道寬度;l(3)采用體積小、重量輕、負(fù)荷小的磁頭和表面潤滑的磁盤,從而消除磁頭集中加載對盤面的沖擊可能造成的頭盤損傷;l(4)采用薄的高性能的磁盤媒體提高讀寫能力;l(5)采用讀用集成電路,并盡可能把它安裝在靠近磁頭處,以改善高頻信號的傳輸質(zhì)量l (6)溫盤的上述特征增加了系統(tǒng)的穩(wěn)定性與可靠性,對于提高磁盤機(jī)的性能價格比起到了重要的作用。(4 4)半導(dǎo)體存儲)半導(dǎo)體存儲l半導(dǎo)體存儲(Semiconduc

8、tor memory)是采用集成化的技術(shù)將存儲單元電路及其外圍電路直接置放在半導(dǎo)體芯片上制成的。按照半導(dǎo)體存儲器的功能可分為隨機(jī)存取存儲器和只讀存儲器。l(1)隨機(jī)存儲器RAMlRAM(Random Access Memory)是易失性存儲器,一旦去掉電源,信息將全部丟失。RAM工作的特點(diǎn)是:可以按照需要隨時向其任一存儲單元寫入信息,也可以隨時從其任一存儲單元讀出信息。l(2)只讀存儲器ROMlROM(Read-only memory)是非易失存儲器,去掉電源,信息仍保持不變。ROM的工作特點(diǎn)是:存儲的信息一般不變,可以隨時讀取任一存儲單元的信息,但不能隨時寫入信息。(5 5)光盤存儲)光盤存

9、儲l光盤是用聚焦成直徑小于1微米的激光束在記錄介質(zhì)上寫入與讀出信息的高密度存儲載體,其基本結(jié)構(gòu)分為三層:基體、信息層和保護(hù)層。l光盤載體的主要優(yōu)點(diǎn)光盤載體的主要優(yōu)點(diǎn): : l信息存儲密度極高、容量大l價格低廉,便于復(fù)制l具有隨機(jī)存儲特性,便于和計(jì)算機(jī)接口l可以存儲和顯示多種信息l光盤堅(jiān)固耐用,存儲壽命長1. 1.光盤載體的主要缺點(diǎn):光盤載體的主要缺點(diǎn):誤碼率比較高,核對誤碼需占20%30%的光盤空間。 l光盤的類型:光盤的類型: l只讀型光盤l寫一次型光盤l可擦型光盤(6 6)計(jì)算機(jī)的存儲技術(shù)與設(shè)備)計(jì)算機(jī)的存儲技術(shù)與設(shè)備l計(jì)算機(jī)信息存儲技術(shù)近幾年發(fā)展非常迅速,各種新產(chǎn)品、新技術(shù)層出不窮,但從

10、總體上看它們呈現(xiàn)出一種類似金字塔的結(jié)構(gòu),其中塔尖為CPU,距離CPU越近則存儲速度越快、每兆字節(jié)的存儲成本越昂貴,容量也??;反之則存儲速度越慢、每兆字節(jié)的存儲成本越低,容量也越大。如圖2-2所示。(7 7)網(wǎng)絡(luò)存儲)網(wǎng)絡(luò)存儲l直接連接存儲直接連接存儲a.又稱附服務(wù)器存儲(Sever Attached Storage,簡稱SAS)。這是最為基本的一種存儲結(jié)構(gòu),是如今在校園網(wǎng)或辦公環(huán)境中最常見的一種。存儲器通過一個通用服務(wù)器連接在網(wǎng)絡(luò)上,存儲器與服務(wù)器之間通過傳統(tǒng)的I/O總線通訊??蛻魴C(jī)如需要訪問存儲器的數(shù)據(jù),首先必須給文件服務(wù)器發(fā)送一個請求消息,文件服務(wù)器解析這個請求并給存儲器發(fā)送訪問消息,存儲

11、器訪問數(shù)據(jù)發(fā)送至文件服務(wù)器的內(nèi)存,最終由服務(wù)器把數(shù)據(jù)傳給客戶機(jī)。l這種結(jié)構(gòu)的缺點(diǎn):這種結(jié)構(gòu)的缺點(diǎn):l客戶機(jī)訪問的所有數(shù)據(jù)都需要通過通用文件服務(wù)器存儲轉(zhuǎn)發(fā),嚴(yán)重占用服務(wù)器的內(nèi)存、CPU和I/O總線等系統(tǒng)資源,并產(chǎn)生嚴(yán)重的I/O瓶頸。l這種存儲結(jié)構(gòu)可擴(kuò)展性差,其擴(kuò)充網(wǎng)絡(luò)存儲容量的方法是為服務(wù)器增加更新、更快的盤。l附網(wǎng)存儲附網(wǎng)存儲l 附網(wǎng)存儲是計(jì)算機(jī)信息存儲領(lǐng)域中的最新技術(shù)之一,可以簡單、可靠、經(jīng)濟(jì)有效地在網(wǎng)絡(luò)中添加共享存儲區(qū),從而使各部門和工作組可以通過網(wǎng)絡(luò)快速訪問數(shù)據(jù),并實(shí)現(xiàn)多人同時訪問。這種方案中的存儲設(shè)備與網(wǎng)絡(luò)設(shè)備直接相連,有利于客戶機(jī)與存儲器之間直接傳送數(shù)據(jù),減輕服務(wù)器的工作負(fù)載,大大改

12、善服務(wù)器的工作性能。NAS之所以對設(shè)備的要求低且易于維護(hù),是由于它采用了瘦服務(wù)器這項(xiàng)最新技術(shù)。l存儲區(qū)域網(wǎng)絡(luò)存儲區(qū)域網(wǎng)絡(luò)(SAN)(SAN)lSAN是一種數(shù)據(jù)存儲設(shè)備及服務(wù)器間通信的專用網(wǎng)絡(luò),能夠提供幾乎無限的信息交換能力。lSAN基于一個極為簡單的原則,即任何一個服務(wù)器可以與任何存儲設(shè)備直接進(jìn)行數(shù)據(jù)交換,而不受NAS體系結(jié)構(gòu)的限制。SAN不僅可以容納Web服務(wù)器、Extranet及Intranet上的所有信息,而且可以在一個中心節(jié)點(diǎn)上完成對所有數(shù)據(jù)的管理。(8 8)存儲技術(shù)發(fā)展趨勢)存儲技術(shù)發(fā)展趨勢l各種信息存儲技術(shù)將在較長的時期內(nèi)并存,互為補(bǔ)充;l各項(xiàng)信息存儲技術(shù)的相互結(jié)合:2.1.3 信

13、息存取模型信息存取模型 l所謂信息存取模型(也叫做檢索模型)信息存取模型(也叫做檢索模型),是用于描述信息(文檔)表示,用戶查詢及其相互關(guān)系(主要指相關(guān)性和度量)的框架形式,它是存取系統(tǒng)中用于實(shí)施查詢的相關(guān)性的度量模式前后描述的一致性問題l以用戶查詢信息的行為用戶查詢信息的行為為標(biāo)準(zhǔn),可以將信息存取模型劃分為兩大類:即檢索模型和瀏覽模型。l檢索模型又可以進(jìn)一步劃分:l基于文檔內(nèi)容文檔內(nèi)容的檢索模型和基于文檔結(jié)構(gòu)文檔結(jié)構(gòu)的檢索模型l基于文檔內(nèi)容文檔內(nèi)容的檢索模型檢索模型常用的有布爾邏輯模型、概率統(tǒng)計(jì)模型和矢量空間模型三種類型,如表21所示: l1. 1. 布爾邏輯模型布爾邏輯模型l這是一種基于集

14、合理論和布爾代數(shù)原理的檢索模型,其查詢可以由and、or、not布爾符號連接多個索引項(xiàng)或檢索詞組成。檢索結(jié)果是這些索引項(xiàng)或檢索詞相互匹配的布爾組合。布爾邏輯模型的主要優(yōu)點(diǎn)是模型描述的形式化與操作簡單,主要缺點(diǎn)是精確匹配所導(dǎo)致的結(jié)果文檔過多或丟失。l2.2.概率統(tǒng)計(jì)模型概率統(tǒng)計(jì)模型 l概率統(tǒng)計(jì)模型是在布爾邏輯模型的基礎(chǔ)上,為解決檢索過程中存在的一些不確定性而引入的。它利用概率論的原理,通過賦予標(biāo)引詞的概率值來表示這些詞在相關(guān)文檔集合或無關(guān)文檔集合中出現(xiàn)的概率,然后計(jì)算某一給定文檔與給定查詢之間的相關(guān)概率,存取系統(tǒng)據(jù)此做出檢索決策。l3. 3. 矢量空間模型,也稱向量空間模型。矢量空間模型,也稱向

15、量空間模型。l鑒于布爾模型“準(zhǔn)確匹配”策略上所產(chǎn)生的檢索弊端,20世紀(jì)60年代后期,美國的薩爾頓(G. Salton)在其開發(fā)的試驗(yàn)存取系統(tǒng)SMART中提出并采用線性代數(shù)理論和方法構(gòu)建了一種新型的信息存取模型,這就是著名的向量空間模型(Vector Space Model,簡稱VSM)。這種基于部分匹配框架的矢量空間模型采用了非二值的索引項(xiàng)權(quán)重,將文檔和用戶查詢用t維權(quán)重矢量來表示,通過計(jì)算這兩個矢量之間的相似度對返回的結(jié)果進(jìn)行排序。l它主要包括以下幾種具體的模型:1.并列鏈表模型并列鏈表模型層次鄰接模型層次鄰接模型平面瀏覽模型平面瀏覽模型目錄導(dǎo)航模型目錄導(dǎo)航模型網(wǎng)狀結(jié)構(gòu)模型網(wǎng)狀結(jié)構(gòu)模型2.2

16、.1按存取活動的執(zhí)行主體劃分l按存取活動存取活動的執(zhí)行主體劃分:l手工存?。ㄊ止ご嫒。∕anual RetrievalManual Retrieval)l計(jì)算機(jī)存?。ㄓ?jì)算機(jī)存取(Computer-based RetrievalComputer-based Retrieval)2.2.2按查詢信息的特征劃分按查詢信息的特征劃分 l按查詢信息查詢信息的特征劃分:l書目存?。〞看嫒。˙ibliographic RetrievalBibliographic Retrieval)l數(shù)據(jù)存取數(shù)據(jù)存取(Data Retrieval)(Data Retrieval)l事實(shí)存取事實(shí)存取(Fact Retrie

17、val)(Fact Retrieval)l全文存取全文存取(Full Text Retrieval)(Full Text Retrieval)l圖像存取圖像存取(Image Retrieval)(Image Retrieval)l多媒體信息存取多媒體信息存取(Multimedia Data Retrieval)(Multimedia Data Retrieval)2.2.3按檢索系統(tǒng)的工作方式劃分按檢索系統(tǒng)的工作方式劃分 l按檢索系統(tǒng)的工作方式工作方式劃分:l脫機(jī)存取(脫機(jī)存?。∣ff-line RetrievalOff-line Retrieval)l聯(lián)機(jī)存取(聯(lián)機(jī)存?。∣n-line Re

18、trievalOn-line Retrieval)l光盤存?。ü獗P存取(CD-ROM RetrievalCD-ROM Retrieval)l國際互聯(lián)網(wǎng)絡(luò)存?。▏H互聯(lián)網(wǎng)絡(luò)存?。↖nternet RetrievalInternet Retrieval)2.2.4依檢索策略劃分依檢索策略劃分 l依檢索策略檢索策略劃分:l布爾邏輯存取檢索布爾邏輯存取檢索(Logical Operator Retrieval)(Logical Operator Retrieval)l截詞存?。ń卦~存取(Truncation RetrievalTruncation Retrieval)l位置邏輯存取位置邏輯存取(Pro

19、ximate Operator Retrieval(Proximate Operator Retrievall限定存取限定存取(Range Retrieval)(Range Retrieval)l加權(quán)存取加權(quán)存取Weighting Retrieval)Weighting Retrieval)2.2.5依照系統(tǒng)載體劃分依照系統(tǒng)載體劃分 l依照系統(tǒng)載體系統(tǒng)載體劃分:l印刷型文本系統(tǒng)存取(印刷型文本系統(tǒng)存?。≒rinted Text RetrievalPrinted Text Retrieval)l縮微磁帶存取縮微磁帶存取(Microfilm Retrieval)(Microfilm Retriev

20、al)l光盤系統(tǒng)存取光盤系統(tǒng)存取(CD-ROM Retrieval)(CD-ROM Retrieval)l計(jì)算機(jī)存取計(jì)算機(jī)存取 (Computer-based Retrieval)(Computer-based Retrieval)2.3.1 索引款目結(jié)構(gòu)l索引(索引(IndexIndex)是存取信息資源“地址”或“出處”的標(biāo)識系統(tǒng),是信息存儲與檢索的基本形式。索引的基本功能是指示知識點(diǎn)在正文或文獻(xiàn)款目中的位置。傳統(tǒng)的文本式檢索工具通常由兩部分組成,即文摘正文部分和輔助索引部分。l索引款目索引款目是有關(guān)信息資源所涉及的主題、事物及其它特征的信息單元,并指向其地址的一條記錄。它取決于索引系統(tǒng)的算

21、法或模型,取決于索引的編制目的和對索引形式的要求。索引款目是構(gòu)成索引的基本單元,一般只起指示特定信息單元地址的作用,不報道信息內(nèi)容。l索引款目索引款目一般由索引標(biāo)題詞、說明語和地址參照項(xiàng)組成,而簡單的索引款目往往只有索引標(biāo)題詞和地址參照項(xiàng)兩部分內(nèi)容。l1. 1.索引標(biāo)題詞索引標(biāo)題詞l索引標(biāo)題詞亦稱標(biāo)目、索引鍵、索引標(biāo)題等,一般處于索引款目中最醒目的位置,是索引款目的核心,也是信息資源外部特征與內(nèi)容特征的標(biāo)志。l2.2.說明語說明語l說明語,也稱為上下文或修飾語,通常位于索引標(biāo)題詞的右邊或下面,是用來說明、解釋、限定索引標(biāo)題詞含義的輔助項(xiàng)目,說明語可用來區(qū)別同一索引標(biāo)題詞的不同意義。l3.3.地

22、址參考項(xiàng)地址參考項(xiàng)l地址參考項(xiàng)位于索引標(biāo)題詞和說明語之后,索引地址所指明的是索引標(biāo)題詞所在的頁碼或在檢索系統(tǒng)中的文獻(xiàn)順序號、分類號或文獻(xiàn)號等,即索引標(biāo)題詞的出處。2.3.2 主要索引類型l索引的類型是由索引標(biāo)題詞的性質(zhì)確定,不同性質(zhì)的索引標(biāo)題詞構(gòu)成了不同類型的索引。l依據(jù)索引標(biāo)題詞性質(zhì)索引標(biāo)題詞性質(zhì)劃分:有揭示信息資源內(nèi)容特征的主題索引、分類索引、關(guān)鍵詞索引、分子式索引、結(jié)構(gòu)式索引;有揭示信息資源形式特征的題名索引、人名索引、物名索引、代碼索引和引文索引。l依據(jù)索引標(biāo)題詞的排序方式索引標(biāo)題詞的排序方式劃分:有按照標(biāo)題詞字順組織的主題索引、題名索引、人名索引、關(guān)鍵詞索引、語詞專用索引等;有按照文

23、獻(xiàn)代碼組織的報告號索引、合同號索引、專利號索引、標(biāo)準(zhǔn)號索引、分類號索引等;按照其它排序方式組織的有網(wǎng)絡(luò)信息自動索引、重量索引、速度索引、專用索引等等。l按照檢索方式檢索方式劃分,有先組式索引和后組式索引;l按照索引所包括的對象劃分索引所包括的對象劃分,有綜合索引(包括多種標(biāo)題特征的索引)和專門索引(單一特征索引)等等。1. 1.題名索引(題名索引(Title IndexTitle Index)l題名索引,是將信息資源的題名特征(書名、刊名、篇名)選作為索引標(biāo)題詞所編制的索引系統(tǒng)。l例如: 未來的地球人/王佃亮 31l 解構(gòu)愛因斯坦/一茗 32l 一流大學(xué)校長必須是教育家等6則/睦依凡 36l

24、宇宙是什么顏色等6則 /本刊資料室 42 l說明:索引標(biāo)題詞(題名) 文獻(xiàn)作者 地址參照項(xiàng)(所在頁碼)2.2.人名索引(人名索引(People Name IndexPeople Name Index)l人名索引,是以文獻(xiàn)上署名的著者、譯者、編撰者、注釋者以及文獻(xiàn)中所論述的人物名稱作為索引標(biāo)題詞所編制的一種索引系統(tǒng)。l例一:Sadykov,A . A lChemical Study of Persica 91:135089kl例二: Harris,A . E 001536l例三:伽利略 (Galilei,Galilei) B503.922l例四:梁啟超(1873-1929) B259.1l說明:

25、索引標(biāo)題詞 說明語(原文名、生卒年)地址參照項(xiàng)(文摘號、文獻(xiàn)號、分類號)3.3.文獻(xiàn)序號索引(文獻(xiàn)序號索引(Document Number IndexDocument Number Index)l文獻(xiàn)序號索引,是根據(jù)信息資源的外表特征文獻(xiàn)排序號所編制的索引。在一些特定類型的文獻(xiàn)資源中,每一份文獻(xiàn)都有一個特定的專門排序號。l例一 :合同/基金號索引(CONTRACT/GRANT NUMBER INDEX)lMIPR-FY7616-02-00394lCold Regions Research and Engineering Lab. Hanover. NHlAD-A121 330/5 933lMI

26、PR-82-504lVaval Research Lab. Washington,DClAD-A121 087/1 714l說明: 合同基金號 執(zhí)行機(jī)構(gòu) 報告號 索引地址號4.4.引文索引(引文索引(Citation IndexCitation Index)l引文索引是近30年來出現(xiàn)的一種新型的索引形式。其特點(diǎn)是,把一系列具有引用與被引用關(guān)系的科學(xué)文獻(xiàn)以多向線性的方式聯(lián)系起來,提供一個以引證關(guān)系為依據(jù)來檢索文獻(xiàn)的新途徑。l引文索引的主要職能是,回答某作者的論文曾經(jīng)被哪些人的文章所引證,這些文章何時發(fā)表在何種刊物上。5.5.分類索引分類索引(Classification Index)(Class

27、ification Index)l這是一種以文獻(xiàn)內(nèi)容的學(xué)科范疇的分類標(biāo)識(又稱分類號)為依據(jù)編制而成的索引系統(tǒng)。l6.6.主題索引(主題索引(Subject IndexSubject Index)l主題索引,是將表征文獻(xiàn)主題內(nèi)容的主題詞作為索引標(biāo)題詞,其后注明地址(或頁碼)編制而成的索引系統(tǒng)。l例一:lParallel access computer, in self-organizing 1234.6533.4211l(并行存取計(jì)算機(jī)) (自組織系統(tǒng)中的)l例二:lSword, Manufacture, review on, 6385.4246.5367l(刺刀)(制造) (有關(guān)評論)l例三

28、:l反義詞 ,漢語現(xiàn)代 H136.2l例四:l反潛飛機(jī) V271.4; TJ85l說明:索引標(biāo)題詞 說明語(修飾語) 地址參照7.7.關(guān)鍵詞索引(關(guān)鍵詞索引(Keyword IndexKeyword Index)l又稱鍵詞索引,屬于廣義的主題索引。這是從文獻(xiàn)題名、文摘、原文或網(wǎng)站、網(wǎng)頁、網(wǎng)址甚至網(wǎng)頁正文中抽取的,對于表述信息資源的主題內(nèi)容具有關(guān)鍵意義的名詞或名詞性詞組,作為索引標(biāo)題詞,其后注明出處所組成的索引。l關(guān)鍵詞索引按形式劃分關(guān)鍵詞索引按形式劃分有題內(nèi)關(guān)鍵詞索引(KWIC Index)、題外關(guān)鍵詞索引(KWOC Index)與單純關(guān)鍵詞索引等類型。l(1)題內(nèi)關(guān)鍵詞索引題內(nèi)關(guān)鍵詞索引 (

29、Keyword in Context Index,簡稱KWIC Index),又稱上下文關(guān)鍵詞索引,其特點(diǎn)是將選作為索引標(biāo)題詞的關(guān)鍵詞放在索引款目的中間位置,上下文作為說明語放在關(guān)鍵詞的兩邊,索引標(biāo)題詞的地址參考位于右端。l(2)題外關(guān)鍵詞索引題外關(guān)鍵詞索引(Keyword out of Context Index, 簡稱KWOC Index),是針對KWIC索引易讀性差進(jìn)行改進(jìn)而產(chǎn)生的索引系統(tǒng)。其具體做法是將作為索引標(biāo)題詞和關(guān)鍵詞抽出列于文獻(xiàn)題名的首位或提行,其后是文獻(xiàn)題名,并在題名中將索引標(biāo)題詞所在位置采用“*”或“+”代替。l例一例一:文獻(xiàn)“Microcomputer for Infor

30、mation Management 0367”可構(gòu)成兩條題外關(guān)鍵詞款目:lMICROCOMPUTERl* for Information Management 0367lINFORMATION MANAGEMENTl MICROCOMPUTER FOR * 0367l(3)輪排關(guān)鍵詞索引輪排關(guān)鍵詞索引(Permuted Keyword Index),又稱標(biāo)字索引,即將文獻(xiàn)題目中的每個關(guān)鍵詞或詞組輪流作為索引標(biāo)題詞排在款目之首,題目中的其它詞語根據(jù)其相互之間的語義關(guān)系進(jìn)行輪排,以便用戶研讀與理解。l例如例如:文獻(xiàn)Resources for Information about Distance E

31、ducation and Its Providers(關(guān)于遠(yuǎn)程教育提供機(jī)構(gòu)的信息資源)。l除開題目中的for, about, and, Its幾個非關(guān)鍵詞,其它均為關(guān)鍵詞,所構(gòu)成的輪排索引款目如下:lResources for Information about Distance Education and Its Providers 67883lInformation, Resources,about Distance Education and Its Providers, for 67883lDistance Education and Its Providers, Resources

32、for Information, about 67883l(4 4)單純關(guān)鍵詞索引)單純關(guān)鍵詞索引(Keyword Index),所謂單純關(guān)鍵詞索引即簡單關(guān)鍵詞索引。其特點(diǎn)是在索引款目中不包含非關(guān)鍵詞,單純地由若干個關(guān)鍵詞構(gòu)成,其后注明文獻(xiàn)地址。l例如例如文獻(xiàn)“病理學(xué)家和畸形學(xué)家用以評定毒物危害的計(jì)算機(jī)技術(shù)(設(shè)文獻(xiàn)代號為00386)”即可形成四條單純關(guān)鍵詞索引款目。l 病理學(xué)家 畸形學(xué)家 毒物危害 計(jì)算機(jī)技術(shù) 00286l 畸形學(xué)家 毒物危害 計(jì)算機(jī)技術(shù) 病理學(xué)家 00286l 毒物危害 計(jì)算機(jī)技術(shù) 病理學(xué)家 畸形學(xué)家 00286l 計(jì)算機(jī)技術(shù) 病理學(xué)家 畸形學(xué)家 毒物危害 00286l(5

33、5)掛接主題索引)掛接主題索引(Articulated Subject Index),又稱為題外關(guān)鍵詞索引,是由英國謝菲爾德大學(xué)的林奇(Lynch)和阿米塔奇(Armitage)設(shè)計(jì)出的一種便于計(jì)算機(jī)操作的印刷形態(tài)索引,其索引數(shù)據(jù)均由標(biāo)引員根據(jù)文獻(xiàn)的主題范圍編寫而成,每一條索引款目則是由若干名詞詞組與介詞構(gòu)成的一個描述性短語。l例如例如,一條文獻(xiàn)代號為00436的經(jīng)過加工的名詞短語為: “Organization of Knowledge in the age for Information Economy”,可從中抽出4個索引標(biāo)題詞:l“Organization”(k1),“Knowledg

34、e(k2)”, “age(k3)”, “Information Economy(k4)”l即可編寫成:(Organization )of( Knowledge) in the (age) for (Information Economy) 00436l然后交給計(jì)算機(jī)去自動掛接排列,便可形成以下5種款目形式:lOrganizationlof Knowledge in the age for Information Economy 00436lKnowledgelOrganization of, in the age for Information Economy 00436lAgelOrganization o

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論