信息組織 第3、4章 信息描述語言、傳統(tǒng)著錄法_第1頁
信息組織 第3、4章 信息描述語言、傳統(tǒng)著錄法_第2頁
信息組織 第3、4章 信息描述語言、傳統(tǒng)著錄法_第3頁
信息組織 第3、4章 信息描述語言、傳統(tǒng)著錄法_第4頁
信息組織 第3、4章 信息描述語言、傳統(tǒng)著錄法_第5頁
已閱讀5頁,還剩103頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第3章信息描述語言信息組織第3章信息描述語言信息描述(InformationDescription,InformationRepresentation),是網絡時代學術界對傳統(tǒng)“文獻編目”概念的一種繼承和發(fā)展,是依據(jù)一定的規(guī)則和標準,對存儲于一定物理載體或網絡上的信息的外部特征和內容特征進行選擇、描述并予以記錄的過程或活動。信息資源描述的結果是獲得描述記錄,即元數(shù)據(jù)(結構化數(shù)據(jù),MARC也是一種元數(shù)據(jù))。信息描述語言是對信息外部特征和內容特征進行揭示和描述的語言工具,是有效進行信息組織的語言工具。CONTENTS教學內容01信息描述語言概述02分類語言03主題語言1信息描述語言概述信息描述語言概述信息描述的目的是滿足信息檢索的需要,因此傳統(tǒng)的信息描述語言也稱為檢索語言或標引語言。信息描述包括對信息外部特征的描述和對信息內容特征的標引,從而形成不同的檢索標識以提供多途徑的信息檢索服務。在信息檢索中,不管從何種途徑入手進行檢索,最終目的都是查找到具有特定內容的信息。為了解決信息內容標引工作的規(guī)范化、一致性問題,在圖書情報工作實踐中創(chuàng)制出了情報檢索語言。情報檢索語言是根據(jù)信息檢索的需要而創(chuàng)制的人工語言,專門用于各種手工和計算機化的信息檢索系統(tǒng),表達信息的主題概念和用戶檢索需求的主題概念。情報檢索語言是對信息內容進行描述的語言工具,是經過人工規(guī)范的,所以也稱為規(guī)范的信息描述語言。1.1規(guī)范語言規(guī)范語言是從自然語言出發(fā),根據(jù)信息描述與信息檢索的需要,從自然語言中篩選出特定的詞匯來網羅和指示概念,并依據(jù)一定的規(guī)則對自然語言進行事先規(guī)范而形成的人工語言,是符號化的概念表示系統(tǒng)。因為規(guī)范語言經過人為的規(guī)范和控制,所以也被稱受控語言(ControlledLanguage)、人工語言(ArtificialLanguage)。規(guī)范語言的定義及相關概念1規(guī)范語言因其主要用于對信息內容特征的揭示與標引,以建立主題索引系統(tǒng),也被稱為標引語言或索引語言,最終目的是滿足信息檢索之需,通常被稱為檢索語言或情報檢索語言;在網絡環(huán)境下,各種傳統(tǒng)信息描述語言和新型知識組織工具被統(tǒng)稱為知識組織系統(tǒng)(Know-ledgeOrganizationSystems,KOS)。1.1規(guī)范語言規(guī)范語言在其產生和發(fā)展過程中,以語言學、邏輯學、知識分類理論為基礎,廣泛吸收和引進了其他相關學科的研究方法。與其他語言一樣,規(guī)范語言也由詞匯和語法兩大部分組成。規(guī)范語言的組成2規(guī)范語言是人工控制的語言系統(tǒng),詞匯控制和句法控制是其核心所在。01①詞匯的選擇②詞形的控制③詞義的控制規(guī)范語言的詞匯控制02①引用次序②控制符號③句式變換規(guī)范語言的句法控制1.1規(guī)范語言規(guī)范語言的詞匯控制體現(xiàn)在其編制過程中,根據(jù)控制程度的不同,形成了不同的規(guī)范語言系統(tǒng)。圖3-1是不同受控程度的13種主要的規(guī)范語言,橫坐標展現(xiàn)了規(guī)范語言受控的程度和受控的內容;縱坐標標識了規(guī)范的結構化程度,受控越強,結構化程度越高。規(guī)范語言的組成21.2自然語言“自然語言”(NaturalLanguage)是人類在社會生活中發(fā)展起來的用來交流的聲音符號系統(tǒng)。從信息檢索的角度來理解,自然語言是在信息描述和信息檢索中可直接使用的、人們在科學交流中采用的書面語言或口頭語言。自然語言概述1自然語言語詞具有較大的靈活性、專指性,能及時地反映最新出現(xiàn)的詞匯,反映規(guī)范詞難于表達的特定概念或新概念。在計算機全文檢索中自然語言獨領風騷,大容量、高速、高性能的計算機檢索系統(tǒng)的自動標引,使得基于關鍵詞的全文檢索(Free-textSearch)占計算機信息檢索的比例越來越高。1.2自然語言自然語言在計算機檢索和網絡檢索環(huán)境下開始復興,促使自然語言復興的原因除了計算機應用和網絡的普及,還歸根于其自身的一些突出優(yōu)點。自然語言概述1信息標引工作可以擺脫規(guī)范語言繁復的分析轉換過程,降低標引負擔和成本,提高標引速度??蛇_到足夠的專指度且不存在類目或詞匯更新滯后的問題。符合檢索者的習慣,簡便易行,對于日益增大的普遍用戶群而言更是如此。自然語言具有通用性,不存在規(guī)范語言的統(tǒng)一兼容問題,可實現(xiàn)標引、檢索成果的共享。自然語言標引為計算機的自動處理創(chuàng)造了條件,其發(fā)展將可能替代費時、費力的人工標引。03040501021.2自然語言自然語言處理(NaturalLanguageProcessing,NLP)是自然語言得以應用所要解決的首要問題。自然語言處理是人工智能領域的一個重要分支,主要研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法,是一門融語言學、計算機科學、數(shù)學于一體的科學。如前所述,自然語言較之規(guī)范語言更適于當前的信息狀況及機檢條件,并且數(shù)十年來在信息組織與信息檢索實踐中得到了相當?shù)膽煤桶l(fā)展。按照美國圖書館學家蘭開斯特的劃分,自然語言標引可分為自由標引、自動標引、不標引或全標引三種。自然語言的應用21.2自然語言自然語言的應用2自由標引自由標引即人工關鍵詞標引,由標引人員在對信息內容進行主題分析的基礎上,按照一定的規(guī)則自擬標引詞來表達信息主題。自動標引自動標引是指利用計算機從各種文獻中自動抽取相關標識的過程。自動標引包括主題自動標引和分類自動標引兩種,如圖3-2所示。不標引或全標引所謂不標引方式,即對信息不進行任何標引,全標引”,是為了解決漢語分詞問題而提出的單漢字索引1.2自然語言自然語言檢索是用戶用自然語言作為提問輸入到基于自然語言處理技術的信息檢索系統(tǒng)的一種檢索方式。根據(jù)用戶輸入檢索詞的形式,自然語言檢索可以分為關鍵詞檢索和自然語言語句提問式檢索。自然語言的應用2關鍵詞檢索是用戶提交其認為能表達其信息需求的關鍵性語詞,由計算機在經過自然語言標引或全文索引的系統(tǒng)中進行匹配并返回相應的結果。自然語言語句提問式檢索允許用戶直接以日常用語的自然語句形式向系統(tǒng)提問,由帶有一定人工智能的自然語言接口對這種提問式進行分析,然后返回相應結果。1.2自然語言以往的規(guī)范語言在文獻或信息描述時就對標引詞先行加以控制,因此這種規(guī)范語言也被稱為前控制詞表(Pre-controlledVocabulary)。這種控制帶有一定的粗泛性、滯后性,有時甚至失控,因而人們開始嘗試使用自然語言進行檢索,但造成了與規(guī)范語言的脫節(jié)。于是,在標引時使用自然語言,在檢索時使用自然語言并實施一些不嚴格的控制,這就成了后控制詞表(Post-controlledVocabulary)的最初思路。對自然語言不足的彌補31.2自然語言信息檢索中的控制體現(xiàn)在信息標引和信息檢索兩個階段。按照控制與否及控制所處階段,信息檢索的控制可分為四種模式。對自然語言不足的彌補301在信息描述和信息檢索階段,都要采用規(guī)范語言來進行標引和檢索,是一種純人工語言模式?!皹艘刂疲珯z索控制”模式02在信息描述階段和檢索階段,都使用自然語言,不使用任何詞表,是一種純自然語言模式。“標引不控制+檢索不控制”模式03在系統(tǒng)內部存儲有一部自然語言→規(guī)范語言的轉換詞典,把檢索用戶的自然語言轉化為受控語言,相當于在檢索端增加了一個自然語言接口。標引控制+檢索不控制”模式04在標引階段使用自然語言,檢索時則既可以使用自然語言也可以使用存放在機內只供檢索用的詞表,即后控制詞表來加以控制。“標引不控制+檢索后控制”模式1.2自然語言后控制詞表利用規(guī)范語言的受控原理來彌補自然語言檢索的不足,是提高自然語言檢索效率的有效措施。后控制詞表在自然語言檢索系統(tǒng)中的應用主要有三種方式:

后控制詞表對自然語言不足的彌補3其一,用戶檢索前通過瀏覽后控制詞表選擇合適的檢索詞構造檢索式,檢索負擔相對較重01其二,由系統(tǒng)自動執(zhí)行調整檢索式,既能減輕用戶負擔又能提高檢索效率,但受限于目前的自然語言處理技術,效果不甚明顯02其三,是前兩種方式的融合,系統(tǒng)根據(jù)用戶輸入的自然語言檢索式從后控制詞表中給出相關詞,供用戶選擇來調整檢索式03圖3-3揭示了后控制詞表在自然語言檢索系統(tǒng)中的應用。1.2自然語言后控制詞表的機器編制方式歸納起來主要有詞典實現(xiàn)模式、積累提問式模式、詞形實現(xiàn)模式、聚類控制實現(xiàn)模式、詞頻統(tǒng)計模式和人工智能模式等。后控制詞表對自然語言不足的彌補304聚類控制實現(xiàn)模式01詞典實現(xiàn)模式02積累提問式模式05詞頻統(tǒng)計模式06人工智能模式03詞形實現(xiàn)模式2分類語言2.1分類法的原理信息資源分類是指根據(jù)信息資源的內容屬性和其他特征,將其分門別類地、系統(tǒng)地組織和揭示的方法。一般說來,信息資源分類是以知識分類或學科分類為基礎,結合信息資源各種載體的實際編制的類目體系,與知識分類既有相同點又有所不同。信息資源分類1信息資源分類是一種從主題內容角度組織和揭示信息資源的方法,是分類方法在信息資源組織中的應用,具有以下特征。按照內容特征的相互關系對信息資源進行組織采用一定的標記符號作為排序工具從一定角度出發(fā)組織和揭示信息資源通過類目索引提供從字順角度查找類目的途徑2.1分類法的原理信息資源分類的作用如下:信息資源分類1進行資源組織兼容工具分類統(tǒng)計建立分類檢索工具2.1分類法的原理從編制方式的角度,信息資源分類法通常分為三種:等級列舉式、分面組配式、列舉–組配式。分類法的類型2(1)等級列舉式分類法等級列舉式分類法是一種傳統(tǒng)的分類法類型,是將所有的類目組織成一個等級系統(tǒng),并且采用盡量列舉的方式編制的分類法。等級列舉式分類法通常將類目體系組織成一個樹結構,按照劃分的層次逐級列出詳盡的專指類目,并在以線性形式顯示時,以縮格表示類目的等級關系。等級列舉式分類法是目前國內外使用得最普遍的分類法形式,比較著名的等級列舉式分類法有《杜威十進分類法》、《美國國會圖書館圖書分類法》和《中國圖書館分類法》。2.1分類法的原理(2)分面組配式分類法分面組配式分類法是依據(jù)概念的分析與綜合原理,將概括信息資源內容與事物的主題概念組成“分面–亞面–類目”的結構體系,通過各分面內類目之間的組配來表達信息資源主題的一種信息資源分類法,也稱為組配分類法或分析–綜合分類法。分面組配式分類法的最典型的代表是印度著名圖書館學家阮岡納贊創(chuàng)制的《冒號分類法》(ColonClassification)。分類法的類型2與等級列舉式分類法相比,分面組配式分類法放棄了詳細列舉類目體系的做法,采用以簡單概念組成復合類目的方式。《冒號分類法》中使用的分面符號如表3-2所示。2.1分類法的原理(3)列舉–組配式分類法列舉–組配式分類法又稱為半分面分類法,是在等級列舉式的詳盡類表的基礎上,廣泛采用各種組配方式的分類法。列舉–組配式分類法兼有前面兩種分類法的特點。分類法的類型2列舉–組配式分類法的優(yōu)點是:以列舉式類表為基礎,具有一定的直觀性,同時廣泛采用組配方法,基本上可以達到與分面組配式類表同等的標引水平。列舉–組配式分類法的不足是:在相關類目的修訂或改進方面需要投入大量的資源和精力,而且實現(xiàn)類目之間的組配時,需要使用分面組配式分類法的多種輔助符號或號碼進行標記,最終導致分類標引方面的標記程序比較復雜,標記符號也顯得冗長。2.2分類法的編制分類法的結構體系一般由類目體系、標記符號、說明與注釋、類目索引四部分組成。分類法的結構體系1(1)類目體系類目體系是根據(jù)類目內在關系和一定原則建立起來的類目集合,是分類法的主體,是分類語言進行詞匯控制的主要依據(jù)。類目體系一般是以知識分類為基礎,按照信息資源分類的實際需要而建立的。類目體系由主表和復分表構成。主表一般在基本部類的基礎上,由基本大類、簡表和詳表等構成。復分表就是將主表中按相同標準劃分某些類所產生的一系列相同子目抽取出來,配以特定號碼,單獨編制成表,供主表有關類目進一步復分用的類目表。2.2分類法的編制復分表是一種輔助區(qū)分的手段,使用時一般應注意:分類法的結構體系1B是否使用復分表,應按表中有關的規(guī)定進行,通??筛鶕?jù)復分表中的說明及類目下的注釋確定。C各文獻單位可以根據(jù)需要對復分表的使用加以調整或限定,但一旦確定,就應嚴格遵守,不得隨意變動,以保持復分表使用的一致性。D分表使用意味著新的分類成分的插入,一般應注意標記配置方面的有關規(guī)定。A除有明確規(guī)定的之外,一般不得單獨使用,必須結合主表類目使用。2.2分類法的編制類目體系建立的過程就是類目分析的過程。類目分析是指在編制分類法時,對于要建立的類目體系中的類目進行嚴格分析的過程。建立類目體系的方法有如下兩種。分類法類目體系的建立201即從個別到一般,根據(jù)個體屬性的相同點集合成類,并逐步將小類聚合成大類,建立起類目體系。歸納方法02即從總到分,將若干概略性類目作為一級類目,按照特定的分類標準逐級劃分、層層展開,建立類目體系。劃分方法2.2分類法的編制(1)標記符號標記符號,亦稱分類號,是分類法中用于標識類目的代號。標記符號是現(xiàn)代分類法的重要組成部分,在一部分類法中,特定的標記符號與具體的類目之間存在著對應的關系?,F(xiàn)代文獻分類法正是以標記符號為中介,將分類體系有效地用于組織文獻收藏和建立檢索工具的。信息資源分類法的標記符號具有如下4種性能。分類法的標記系統(tǒng)301容納性02表達性03簡明性04助記性2.2分類法的編制(2)標記制度標記制度是指分類號碼的編制方法,即為類目編配號碼的方式。按照號碼的組成方式,分類標記一般可以分為層累標記制、順序標記制、順序–層累標記制、分面標記制等基本類型。分類法的標記系統(tǒng)3(3)幾種特殊的標記方法為了使標記系統(tǒng)具有較好的性能,在具有容納性的同時保持一定的表達性和簡明性,分類標記一般還采用以下標記技術,以更好地適應類目體系及其發(fā)展的需要。八分法雙位制借號法預留空號法雙位加點法字母標記法對應編號法2.3國內外常用分類法介紹(1)編制《中國圖書館分類法》(ChineseLibraryClassification,CLC,即《中圖法》)前3版的名稱均為《中國圖書館圖書分類法》,由于分類法使用的范圍不斷擴大,第4版改為現(xiàn)在的名稱?!吨袊鴪D書館分類法》1(2)類目體系《中圖法》根據(jù)毛澤東關于知識分類的思想,將人類全部知識劃分為哲學、社會科學、自然科學三部分,并以此作為確定分類法基本結構的理論依據(jù)。除此以外,認為馬克思主義、列寧主義、毛澤東思想是分類法編制的指導思想,故將其作為特殊部類列于首位。2.3國內外常用分類法介紹《中圖法》第1版與第5版基本部類和基本大類對照如表3-5所示?!吨袊鴪D書館分類法》12.3國內外常用分類法介紹(3)標記符號和配號制度《中圖法》采用漢語拼音與阿拉伯數(shù)字相結合的混合號碼,一般以一個大寫字母標志一個大類。在工業(yè)技術大類中,為了適應工業(yè)部門分類的需要,采用雙字母方式標記二級類目?!吨袊鴪D書館分類法》1其余類目均采用數(shù)字標記,所有數(shù)字按小數(shù)對待。為了使號碼醒目,規(guī)定每三位數(shù)字加一“.”間隔,“.”不包含任何意義?!吨袌D法》的配號制度基本上遵循層累標記制的原則。數(shù)字部分使用小數(shù)制編號,即首先順序字母后的第一位數(shù)字,然后順序第二位,以此類推。分類號的排列嚴格按照小數(shù)制的排列方法。2.3國內外常用分類法介紹(4)修訂與管理《中圖法》第2版修訂增加了1173個新類目,刪除了870個類目,改動了577個類目,也對有些類目注釋、復分表進行了一定的修訂?!吨袌D法》第3版由于類目的增補、刪除、改動而使圖書必須隨之進行改編的地方多達2190多處?!吨袌D法》第4版還全方位地對整個分類法的類目體系進行了調整,擴充或加細了許多類目,增加或改動了大量類目注釋,對復分表也做了大幅度的增補和擴充?!吨袊鴪D書館分類法》第5版在第4版的基礎上對類表進行了較大幅度的增、刪、改:對D、G、TS大類進行了局部調整;增補了大量新主題類目;合并使用頻率過低的類目;刪除重復或列類不當?shù)念惸?。《中國圖書館分類法》12.3國內外常用分類法介紹概括地說,《中圖法》具有以下優(yōu)點。①基本大類設置比較合理。②類目體系的展開比較系統(tǒng)、適用。③重視類表的靈活性。④追求編號技術的最佳結合。⑤發(fā)展了適合各種規(guī)模和對象的文獻標引與檢索的配套產品。⑥管理健全、規(guī)范。《中國圖書館分類法》1《中圖法》目前存在如下主要問題。①部分類目體系需要進一步完善②通用復分表還不夠充分、集中。③分類法系列中不同類表之間需要加強協(xié)調。2.3國內外常用分類法介紹(1)發(fā)展概況《杜威十進分類法》由美國著名的圖書館學家杜威(1851—1931)創(chuàng)立,首次出版于1876年,取名為《圖書館圖書、小冊子排架和編目用分類法及主題索引》,是一本僅有40多頁的小冊子,收入近1000個類目,用3位阿拉伯數(shù)字作為號碼。《杜威法》是當今世界上影響最大、用戶最多的圖書館分類法,目前有35種語言版本,使用于140多個國家/地區(qū)的約20多萬個圖書館,不僅用來組織圖書館藏書,也廣泛用于書目和文摘數(shù)據(jù)庫及網絡信息資源的組織和檢索?!抖磐M分類法》2(2)體系結構杜威編制《杜威法》的指導思想是實用主義。他強調,實用就是一切,實用、方便是杜威編制《杜威法》最重要的標準。2.3國內外常用分類法介紹(3)標記符號和標記制度DDC采用的標記符號是通俗易懂的阿拉伯數(shù)字(也有少數(shù)類目可采用拉丁字母或其他符號作為標記符號的一部分)。全部數(shù)字符號按小數(shù)來理解,按小數(shù)值的順序來排列。為了醒目和便于閱讀,第三位與第四位小數(shù)之間用小圓點隔開。《杜威十進分類法》2(4)類目注釋系統(tǒng)、復分表和類目索引《杜威法》的類目注釋系統(tǒng)豐富、詳細,主要包括描述類目內容的注釋、包括注釋、涉及其他類目的注釋、修訂注釋和標引方法注釋。2.3國內外常用分類法介紹(5)主要貢獻與不足《杜威法》對世界分類法的主要貢獻也是最值得其他分類法學習和借鑒的成就是:在文獻排架和目錄組織中首次使用了相關排列法。在標記制度方面首次采用了小數(shù)層累標記制。創(chuàng)建了等級分明的類目體系。首次配置了詳細的相關索引。建立了對DDC進行定期修訂的穩(wěn)定的管理機構?!抖磐M分類法》2《杜威法》也存在一些明顯的不足,例如:由基本大類構成的類目體系對不同學科門類之間所具有的內在聯(lián)系反映得不夠充分,影響了整個類目體系的學科系統(tǒng)性。大類的設置不能適應現(xiàn)代科學的發(fā)展。過于突出美國中心的特征,在使用和發(fā)展方面具有一定的局限性。小數(shù)層累標記制度使類號冗長,不利于文獻排架。2.3國內外常用分類法介紹(1)發(fā)展概況《國際十進分類法》,也稱為通用十進分類法,是由比利時學者奧特勒和拉芳丹共同編制的一部著名的列舉–組配式分類法?!秶H十進分類法》也被稱為世界上第一部半分面分類法。UDC是一種文獻分類法,其分類對象為各種類型文獻,包括小冊子、科技報告和期刊論文等,主要不是作為文獻排架的工具編制的。目前,UDC主要用于歐洲各國的專業(yè)圖書館、文獻中心和情報機構,不少文摘和索引工具也采用UDC,是國外使用較廣的三大分類法之一。《國際十進分類法》3(2)體系結構UDC突出實用這一編制思想,自稱是一種實用的分類法。奧特勒明確提出:不應該將UDC看成一種知識的哲學分類,類目的次序也不是最重要的。2.3國內外常用分類法介紹(3)標記符號和標記制度UDC最突出的特點是:在詳盡類表的基礎上,結合輔助表和一系列復分標記的使用,廣泛采用了組配的方式。UDC的標記由主表類號和各種輔助符號組成?!秶H十進分類法》3(4)輔助符號UDC不僅編有多種通用復分表與專類復分表,還根據(jù)組配的需要設置了多種輔助符號。主表類號與各種輔助符號的組配,使復合主題得到了多方面的揭示,從而使分類法具有更大的靈活性。(5)修訂和管理20世紀80年代前,UDC的修訂由國際文獻聯(lián)合會(FID)負責,由FID分類法中心委員會進行日常管理工作,F(xiàn)ID的成員國也建立相應國家的委員會,負責該語種版本的管理。2.3國內外常用分類法介紹(6)主要優(yōu)點與不足UDC比較突出的優(yōu)點是:在世界分類法發(fā)展史上首次將概念分析原理應用于文獻分類標引實踐,是組配分類的先驅。類表列舉詳盡,組配靈活,既利用復分表進行組配,也大量使用各種輔助符號進行類目之間的組織,達到了充分揭示文獻主題的目的。標記符號表達性強,運用各種輔助符號表達文獻的主題成分,可以輪排,以適應計算機檢索的需要?!秶H十進分類法》3UDC存在的一些不足是:基本大類的設置缺乏均衡性。組配規(guī)則過于靈活,影響了標引的一致性。分類號碼冗長,輔助符號繁多復雜,給手工排檢帶來了不便。缺乏穩(wěn)定而強有力的機構負責管理和修訂工作,沒有統(tǒng)一的修訂方針。2.3國內外常用分類法介紹(1)發(fā)展概況《美國國會圖書館圖書分類法》(LibraryofCongressClassification,LCC)是為了適應美國國會圖書館圖書分類和排架的要求而編制的大型綜合性分類法。《美國國會圖書館圖書分類法》4(2)體系結構LCC的分類體系基本上是以學科為中心而建立的。21個基本大類的設置參考了克特展開式分類法的體系,并以美國國會圖書館的收藏特點為依據(jù)。整個大類次序按照總類、哲學、歷史和地理、社會科學、藝術和文學、科學技術的順序組織。(3)標記符號和標記制度LCC采用字母加阿拉伯數(shù)字的混合號碼來標記類目,類號通常由三部分組成:一是大寫字母,二是阿拉伯數(shù)字1~9999表示其子類,三是在許多類下進一步用字母和數(shù)字組成克特號(書號),再加上出版年代號。2.3國內外常用分類法介紹(4)修訂和管理美國國會圖書館編目方針和支持辦公室主要負責LCC的修訂工作,LCC的編目人員起協(xié)助作用?!睹绹鴩鴷D書館圖書分類法》4(5)主要優(yōu)點與不足LCC的優(yōu)點主要是:①因為是一部依據(jù)文獻保證原則編制的分類體系,所以能較好地適應文獻標引的需要。②類目體系由各學科專家編制,適合研究性圖書館的分類特點。③標記簡短,容納性強,使用組配少,便于號碼配置。④以日常編目工作為修訂依據(jù),增補和變動比較及時。⑤類表結構穩(wěn)定,類目體系變動較少,有利于實際編目工作。2.3國內外常用分類法介紹LCC存在的不足主要是:①分類法的編制及修訂工作均缺乏明確的理論指導,降低了類表應有的系統(tǒng)性和規(guī)律性。②因受組織和檢索美國國會圖書館藏書的制約,削弱了整個分類法的通用性,并且以西方為中心的傾向也比較明顯。③類表從一開始就按照分冊編制、修訂,缺乏整體性。④詳盡列舉方式使類表篇幅巨大,增加了類表管理和更新的費用。⑤采用的順序標記制雖然適用于藏書排架,但表達性差,尤其是在計算機系統(tǒng)中不利于通過標記對類表進行等級顯示?!睹绹鴩鴷D書館圖書分類法》42.3國內外常用分類法介紹(1)發(fā)展概況《冒號分類法》是印度著名圖書館學家阮岡納贊所創(chuàng)制的分面分類法。阮岡納贊以概念分析與綜合原理編制的《冒號分類法》標志著分類語言的一個新發(fā)展,對當代分類法的理論與實踐產生了廣泛影響?!睹疤柗诸惙ā?(2)類表結構《冒號分類法》的類表結構主要包括基本大類、慣用類、基本類、分面分析法等內容。2.3國內外常用分類法介紹所謂慣用類,就是根據(jù)傳統(tǒng)習慣予以區(qū)分的一系列類目。大類和慣用類均稱為基本類?;绢惣捌錁擞浄柸绫?-5所示。《冒號分類法》52.3國內外常用分類法介紹(3)主要優(yōu)點與不足《冒號分類法》突出的優(yōu)點是:類表十分簡練,標記的表達性強,可以在確切揭示文獻主題的同時充分揭示復雜主題的關系。類表采用分面組配結構,對新出現(xiàn)的主題具有比較強的接納能力和揭示能力,能較好地適應科學技術的變化發(fā)展,成為一種不同于傳統(tǒng)分類法的全新的分類法類型?!睹疤柗诸惙ā?《冒號分類法》也存在一些不足:大類結構以神秘主義為中心展開,對整個分類體系依據(jù)的思想沒有明確的說明。標記結果雖然表達性強,但標記方法復雜、符號種類繁多,給類表的使用造成困難。類表的展開不夠均衡,有的大類采用深度分類,有的大類只是概略分類。雖然在理論上代表著分類法發(fā)展的新的階段,但是類表本身的編制水平尚有待于提高,編輯和印刷錯誤較多,影響使用質量。3主題語言3.1主題法概述主題語言,又稱為主題檢索語言或主題法。主題法是指直接以表達主題內容的語詞作為檢索標識,以字順為主要檢索途徑,以參照系統(tǒng)等方法揭示詞間關系的標引和檢索信息資源的方法。主題法的含義1主題法實際上包含兩個含義:第一,是指信息資源的主題整序方法,即用語詞標識標引信息資源和組織檢索系統(tǒng)的方法;第二,是指主題語言。也就是說,主題法包含主題標引和主題語言。主題標引是指對信息進行主題分析,用主題語言表達分析出的主題,賦予信息資源主題標識的過程;而主題語言是一種檢索語言,標題詞、元詞、敘詞等主題詞就是主題語言的主體。3.1主題法概述主題法的原理2直接以語詞作為主題標識通過參照系統(tǒng)等方式揭示主題詞之間的關系以主題為中心集中信息資源以字順序列作為主要檢索途徑3.1主題法概述主題法的類型3可以分為標題法、元詞法、敘詞法、關鍵詞法等按照選詞方法可以分為先組定組式主題法、后組式主題法和先組散組式主題法按照主題詞使用時組配的先后可以分為受控主題法與非受控主題法按照使用時是否對主題詞進行控制3.2國內外常用主題詞表介紹《美國國會圖書館標題表》(LibraryofCongressSubjectHeadings,LCSH)是世界上最具影響的一部標題表,是美國國會圖書館在編目實踐的基礎上編制而成的。《美國國會圖書館標題表》1LCSH由主表、副表和使用說明三部分組成。其中,主表是標題表的主體。目前,其印刷版分為5卷,包括導言和字順表,其副表和使用說明收入《主題編目手冊:標題表》中。3.2國內外常用主題詞表介紹LCSH能在世界上許多國家廣泛流行,是因為它具有以下特點:美國國會圖書館在其發(fā)行的印刷卡片、機讀目錄和西文圖書的在版編目數(shù)據(jù)上都標有LCSH的標題,擴大了影響,使其成為國外使用最廣的主題詞表。較好地體現(xiàn)了克特關于標題法的理論,確立了主題法的一些基本原則。以美國國會圖書館藏書的實際需要為基礎而編制,學科面廣,標題詳細,有很強的實用性。有專門的管理機構,由美國國會圖書館編目部負責定期修訂,保證其使用的一致和規(guī)范。缺乏專指度,采用先組方式無法充分標引較專指的信息資源。社會科學領域的標題帶有強烈的美國中心和政治、社會等方面意識形態(tài)的影響,對于有不良傾向的某些主題須做修改?!睹绹鴩鴷D書館標題表》13.2國內外常用主題詞表介紹但是LCSH也有一些不足,主要表現(xiàn)在:缺乏統(tǒng)一的理論指導,不同時期在標題方式和形式(如同類標題在使用正寫與倒置、短語與加副標題、單數(shù)與復數(shù)等方面)的處理中存在不一致。參照不嚴密,缺乏規(guī)律性和一致性,許多款目未做互逆參照,不少款目在從傳統(tǒng)標題參照形式向敘詞參照形式轉換時未準確揭示關系類型?!睹绹鴩鴷D書館標題表》13.2國內外常用主題詞表介紹(1)概況《漢語主題詞表》(以下簡稱《漢表》)是“漢字信息處理工程”的配套項目,1975年開始編制,由原中國科技情報研究所和原北京圖書館主持編制,1980年出版?!稘h語主題詞表》2(2)結構《漢語主題詞表》由主表、輔助索引、附表組成。主表是詞表的主體,作為信息資源標引和檢索的依據(jù);附表主要收錄專有名詞;輔助索引是通過改變組織方式,提供從不同途徑著手查找敘詞的工具,包括范疇索引、詞族索引、輪排索引和英漢對照索引4種。3.2國內外常用主題詞表介紹(3)《漢語主題詞表》評價《漢表》是目前我國規(guī)模最大的一部敘詞表,是我國情報檢索語言發(fā)展史上的一個重要里程碑。其特點可歸納為以下幾點。結構完備。詞匯豐富。探索了詞表編制方法。探索了敘詞表的實際使用方法。國家圖書館在發(fā)行的印刷卡片、機讀目錄及再版編目數(shù)據(jù)上都使用《漢表》的主題詞,是國內文獻單位通用的綜合性主題標引工具。《漢語主題詞表》23.2國內外常用主題詞表介紹《漢表》有如下幾個發(fā)展方向:①《漢表》的國家標準化與專業(yè)詞表的研制同時進行,處理好專業(yè)主題詞表與《漢表》的兼容與統(tǒng)一問題,建立起一個主題詞表統(tǒng)一和兼容的整體系統(tǒng)。②對《漢表》進行改造,如在詞匯方面,縮減詞匯,減少先組詞的比例;在結構方面,簡化詞表宏觀結構,細化詞表微觀結構,合并詞族索引于主表中,使詞族展開的形式與自動標引中廣泛采用的最長匹配法的工作形式相吻合,從而有利于提高系統(tǒng)效率③利用《漢表》的編制成果來構建領域本體,實現(xiàn)敘詞表到本體的轉換。《漢語主題詞表》23.2國內外常用主題詞表介紹(1)概況《社會科學檢索詞表》是中國社會科學文獻信息中心編制的一部供社會科學文獻資源標引和檢索的詞表,為分面敘詞表,是一部分類主題一體化詞表。(2)分類表分類表部分是一部將傳統(tǒng)分類法設置特點和分面分類方法相結合而編制的分面分類系統(tǒng)。即將整個社會科學領域區(qū)分為17個基本大類,27個專業(yè)類目。(3)字順表《社會科學檢索詞表》的字順表收入的全部主題詞包括正式敘詞和非正式敘詞。敘詞款目通常由款目敘詞、分類號、參照項組成,分類號用于揭示與分類體系的聯(lián)系。(4)英漢譯名對照表英漢譯名對照表是詞表的輔助工具,主要供對外交流文獻時英文譯名對照參考使用。《社會科學檢索詞表》33.2國內外常用主題詞表介紹(5)概要評價《社會科學檢索詞表》作為我國社會科學領域的一部多學科詞表,有如下主要特點。采用了分面敘詞表的模式,這是分類語言與主題語言的最佳結合分類表部分基本上采用了分面結構,在分類表的編制中重視傳統(tǒng)分類與分面模式的結合重視類表編制中學術性、實用性的結合《社會科學檢索詞表》3《社會科學檢索詞表》也存在一些不足,主要表現(xiàn)在如下幾方面。主要分面的設置不夠充分,不能涵蓋所有的分面。分面敘詞表的大類設置上有欠缺在選詞上應增加一些比較關鍵的主題詞一些用代關系欠妥雖然類表采用了分面結構3.2國內外常用主題詞表介紹(1)概況《中國分類主題詞表》是在《中圖法》類目與《漢表》主題詞對應的基礎上,將分類法與主題法融為一體的一種信息資源標引和檢索的工具?!吨袊诸愔黝}詞表》4(2)結構《中國分類主題詞表》包括《分類號—主題詞對應表》和《主題詞—分類號對應表》兩部分?!峨m然《中國分類主題詞表》第二版已經做了大量的修訂,但仍然存在一些不足,主要表現(xiàn)在以下幾方面:類目對應標引深度較低,不能滿足自動分類的需要。詞表修訂周期過長,詞匯更新滯后。詞表的性能和功能有待完善。印刷版版面設計有待改進。本章小結無論是傳統(tǒng)的代碼語言、分類語言、主題語言,還是新出現(xiàn)的本體語言,它們都是對信息外部特征和內容特征進行描述和揭示的語言系統(tǒng)。隨著信息檢索技術、方式、手段的變革,信息描述語言也經歷非控→先控→后控的不同發(fā)展階段,但無論信息描述語言怎樣發(fā)展,“詞匯控制是永遠不會消失的,變化的只是詞匯控制的方式、方法和手段”。本章習題1.網絡環(huán)境下,自然語言是否會取代規(guī)范語言?2.隨著全文檢索的普及,信息標引是消亡還是更加深化?3.規(guī)范語言與自然語言有何異同?感謝您的觀看第4章信息著錄法信息組織第4章信息著錄法將信息實體的有關特征著錄下來,就是信息著錄。有關如何著錄的具體規(guī)定和具體做法就是信息著錄法。按照一定的著錄法對某信息實體的內容和形式特征所做的描繪就形成一條款目或記錄。一條款目或記錄是一種信息實體的高度概括和濃縮。有了款目或記錄,才能對款目或記錄進行分類、主題等各種標引,才能在標引的基礎上對款目或記錄進行編排,才能通過款目或記錄對龐雜的信息資源進行有序的組織和控制。因此,著錄出高質量的款目或記錄是信息組織的基礎性工作。CONTENTS教學內容01傳統(tǒng)著錄法02機讀目錄著錄法03元數(shù)據(jù)著錄法1傳統(tǒng)著錄法1.1傳統(tǒng)著錄法概述“著錄”一詞在我國具有悠久的歷史。它的原意是指在簿籍上的記載,后來用以泛指在任何載體上的記載。在國外,著錄的英文對應詞為Description、Descriptive或Bibliographicaldescription(書目著錄)。但長期以來,作為專業(yè)術語的“著錄”的明確概念在我國一直沒有形成。直到1983年《文獻著錄總則》(GB3792.1—1983)正式頒布,才給著錄下了一個明確的定義,即:著錄是指在編制文獻目錄時,對文獻內容和形式特征進行分析、選擇和記錄的過程。什么是著錄1從上述定義中,可以看出“著錄”主要包括以下兩層含義。①明確了著錄的對象和內容。②明確了著錄的基本方法與工作環(huán)節(jié),即分析文獻信息的特征、從中選擇具有著錄價值的內容、記錄必要的文獻目錄信息。1.1傳統(tǒng)著錄法概述款目與記錄是著錄的結果,是目錄編制的基本單元。(1)款目款目是指依據(jù)一定的規(guī)則和方法,對文獻特征與編目業(yè)務信息所做的記錄。其表現(xiàn)形式是反映文獻內容特征和形式特征的著錄項目的組合,包括描述項目、檢索點(標目)、編目業(yè)務注記三部分信息??钅亢陀涗?款目是組成傳統(tǒng)目錄的基本要素,其主要作用是:揭示文獻的檢索點(即著錄標目),明確各條款目在目錄中的排列位置,提供檢索途徑。01揭示文獻的主要形式特征與內容特征,提供認識、選擇文獻的依據(jù)。02揭示編目業(yè)務注記,以提供文獻索取、管理及款目更新、管理的依據(jù)。031.1傳統(tǒng)著錄法概述(2)記錄《中國文獻編目規(guī)則》(第二版)給“記錄”下的定義是:記錄是指表述事物的特征,具有完整的含義,從內容和使用的角度能被作為一個整體來識別的一組相關數(shù)據(jù)項的組合。在編目領域,通常將以機讀形式存儲于目錄數(shù)據(jù)庫中的目錄數(shù)據(jù)稱為“記錄”。款目和記錄2一條記錄相當于手工編目中的一條“款目”,但記錄所“著錄”的內容更為豐富、復雜,不僅極大地擴充了“款目”上的信息,還增加了代碼信息及計算機識別與處理的符號。1.1傳統(tǒng)著錄法概述著錄信息源(SourceofInformation)是指款目或記錄中著錄信息的來源。明確著錄信息源是準確、一致地進行文獻著錄的保障。著錄信息源3著錄信息源可以劃分為主要信息源與參考信息源,還有更為具體的規(guī)定信息源。(1)主要信息源主要信息源是指在著錄中優(yōu)先選作著錄信息來源的文獻信息組成部分。著錄信息的基本來源是文獻信息本身,是被著錄的整部文獻信息。各類型文獻信息的著錄信息源,均為被著錄的文獻信息本身。1.1傳統(tǒng)著錄法概述(2)參考信息源參考信息源是指在著錄中參考使用的信息來源,如有關工具文獻與參考文獻等。之所以使用參考信息源,是由于主要來自文獻信息本身的著錄信息源有時無法提供足夠的著錄信息,如文獻殘缺、特征不詳或有誤等。這時可以考慮使用文獻信息本身之外的信息即參考信息源,利用各種工具文獻與參考文獻來解決著錄中的問題,彌補主要信息源的不足。著錄信息源3(3)規(guī)定信息源規(guī)定信息源是指各著錄項目及其單元著錄信息的特定來源。為確保著錄信息選取的一致性,著錄規(guī)則進一步規(guī)定了每個著錄項目的著錄信息源,通常為文獻信息的某一個或某幾個組成部分。著錄各著錄項目及其單元時,必須依據(jù)規(guī)定信息源規(guī)定的內容及其先后順序來選擇使用信息源。各類型文獻信息著錄中,規(guī)定信息源也不盡相同。1.1傳統(tǒng)著錄法概述著錄項目及著錄用標識符401著錄項目是指用以揭示文獻信息形式特征與內容特征的記錄事項,如題名與責任說明項、出版發(fā)行項等。著錄項目可以包括著錄單元。著錄單元是指著錄項目的組成部分,如題名與責任說明項中的題名、責任者名等。著錄項目02著錄用標識符是指著錄中用以識別著錄項目及其單元的特定符號。一般包括著錄項目標識符號與著錄單元標識符號。在文獻信息著錄中采用標準的著錄用標識符的主要作用是能跨越不同的語言文字障礙,實現(xiàn)國際文獻目錄信息的交流與共享。著錄用標識符1.2文獻信息著錄規(guī)則文獻信息著錄規(guī)則是指根據(jù)文獻信息本身的客觀情況,結合讀者檢索要求而制定的一整套系統(tǒng)記錄文獻信息特征的原則和方法。著錄規(guī)則是編目工作發(fā)展到一定時期的產物,是人們從長期編目工作實踐總結出來的基本原則和規(guī)律,也是編目工作制度化、規(guī)范化的結果。文獻信息著錄規(guī)則的主要作用是:指導文獻信息著錄工作,處理文獻信息著錄中的一般性問題,使文獻信息著錄保持一致性,使各具特色的文獻信息在目錄中有相對統(tǒng)一的表現(xiàn)形式。1.2文獻信息著錄規(guī)則由ISBD修訂委員會推薦,IFLA編目專業(yè)組常設委員會通過。與以往的著錄規(guī)則相比,ISBD在編制體例上有所創(chuàng)新。ISBD的總則與各分則分別制定、陸續(xù)出版,是一套既緊密聯(lián)系,又相對獨立、自成體系的著錄規(guī)則?!秶H標準書目著錄》1《國際標準書目著錄》(ISBD)自1971年以來,先后出版了ISBD(G)與一系列著錄各種不同類型文獻的ISBD分則,而且從1978年開始,其版本不斷修訂更新。1.2文獻信息著錄規(guī)則ISBD是一整套文獻信息著錄的國際標準,主要特點如下。①編制目的明確②措施具體有效③適用范圍廣《國際標準書目著錄》11.2文獻信息著錄規(guī)則ISBD具體規(guī)定了著錄項目、著錄項目的順序及著錄標識符,如表4-1所示。所采取的這些措施具體而有效。1.2文獻信息著錄規(guī)則《英美編目條例》(第2版)2《英美編目條例》(第2版)(Anglo-AmericanCatalogingRules2nded.,AACR2)由美國圖書館協(xié)會、英國圖書館協(xié)會、加拿大圖書館編目委員會、英國圖書館、美國國會圖書館聯(lián)合提出,由戈爾曼(MichaelGorman)和溫克勒(PaulW.Winkler)負責編輯,于1978年在芝加哥、倫敦與渥太華同時出版。1988年,修訂版AACR2R出版。1998年,修訂版AACR2-1998出版。2002年,修訂版AACR2-2002出版。1.2文獻信息著錄規(guī)則AACR2是一部適用于多種類型、多種文字、多種載體的文獻信息著錄條例。以2002年修訂版為例,它的結構如下:《英美編目條例》(第2版)21.2文獻信息著錄規(guī)則AACR2中各類型文獻信息的主要信息源如表4-2所示。(4)AACR2的主要特點貫徹了編目標準化的原則改革了條例的組織結構和方法沿用并更新了“主要款目”標目概念和“著者原則”增強了條例使用的靈活性《英美編目條例》(第2版)21.2文獻信息著錄規(guī)則中國文獻著錄國家標準——《文獻著錄總則》3《文獻著錄總則》(GB3792.1—1983)由我國的全國文獻工作標準化技術委員會提出,全國文獻工作標準化技術委員會第六分委員會起草,國家標準局1983年7月2日發(fā)布,1984年4月1日起實施。之后,我國又頒布了與其配套的適合普通圖書、古籍、連續(xù)性出版物、非書資料等各種類型文獻著錄的一系列國家標準。2009年,該標準被新的《文獻著錄總則》(GB/T3792.1—2009)所替代。2021年10月,《信息與文獻資源描述》(GB/T3792—2021)正式實施,將各資源類型著錄規(guī)則合并,增加了學位論文、拓片、手稿等資源,是一個面向各種類型資源的通用資源描述標準。1.2文獻信息著錄規(guī)則主要內容包括著錄項目及其標識符和著錄格式兩部分。中國文獻著錄國家標準——《文獻著錄總則》3①第一部分,著錄項目及其標識符,如表4-3所示1.2文獻信息著錄規(guī)則②第二部分,著錄格式著錄格式是指著錄記錄內各著錄項目的記錄次序和表述方式,分為書本式和卡片式兩種?!段墨I著錄總則》的書本式著錄格式如下:中國文獻著錄國家標準——《文獻著錄總則》31.2文獻信息著錄規(guī)則《中國文獻編目規(guī)則》由中國文獻編目規(guī)則編撰小組編輯,全國情報文獻工作標準化技術委員會、中國圖書館學會推薦使用。2005年,由國家圖書館《中國文獻編目規(guī)則》修訂組編輯、北京圖書館出版社出版第2版。《中國文獻編目規(guī)則》4《中國文獻編目規(guī)則》各章既互相銜接、有機聯(lián)系,又自成系統(tǒng)。第2版的內容結構如下:2機讀目錄著錄法2.1MARC在全球的發(fā)展概述MARC(MachineReadableCatalogue,機器可讀目錄)是以代碼形式結構和特定結構記錄在計算機存儲載體上的、可用計算機識別與閱讀的目錄。美國MARC1MARC21由5部分組成。①MARC21書目數(shù)據(jù)格式(MARC21FormatforBibliographicData)②MARC21規(guī)范數(shù)據(jù)格式(MARC21FormatforAuthorityData)③MARC21館藏數(shù)據(jù)格式(MARC21FormatforHoldingsData)④MARC21分類數(shù)據(jù)格式(MARC21FormatforClassificationData)⑤MARC21團體/社區(qū)信息格式(MARC21FormatforCommunityInformation)2.1MARC在全球的發(fā)展概述1973年,ISO在審核MARCⅡ格式后,將其格式結構定為國際標準,即《文獻目錄信息交換用磁帶記錄格式》(ISO2709)。1981年、1996年、2008年分別進行修訂,改名為《信息交換格式》。國際標準化組織:ISO27092ISO2709規(guī)定了書目信息機讀目錄的邏輯組織原則與實施方法,制定了一個通用的格式,規(guī)定了一條機讀目錄記錄必須由頭標區(qū)、目次區(qū)及數(shù)據(jù)區(qū)三大部分構成,還規(guī)定了頭標區(qū)中各固定位置的含義,目次區(qū)的構成方法及標識符和分隔符的選取。2.1MARC在全球的發(fā)展概述由于各國不同的機讀編目格式造成書目記錄共享障礙,為了方便不同格式之間的數(shù)據(jù)交換與共享,國際圖聯(lián)(TheInternationalFederationofLibraryAssociationsandInstitutions,IFLA)在1977年研制出《UNIMARC:UniversalMARCFormat》,對圖書、印刷材料及各種包括音像在內的非書資料的格式進行了規(guī)范。國際圖聯(lián):UNIMARC3目前最新版本是2008年發(fā)表的第3版。UNIMARC還發(fā)布了相應的規(guī)范格式、分類格式和館藏格式手冊。2.1MARC在全球的發(fā)展概述1978年,聯(lián)合國教科文組織UNESCO提出開發(fā)一種圖書館、書目機構和文摘、索引機構通用的格式,并于1984年推出公共交換格式(CommonCommunicationFormat,CCF)。聯(lián)合國教科文組織:CCF4CCF把文獻分為目標文獻和相關文獻,把文獻的相關關系分成縱向關系和橫向關系兩種。被描述的主要文獻稱為目標文獻,而與目標文獻具有各種關系的所有其他文獻稱為相關文獻。同時,CCF引入了區(qū)段的概念,用來在描述主要文獻的同時描述多個相關文獻,每個區(qū)段中存放一個文獻,同一區(qū)段中有關系的字段也可以連接起來。2.1MARC在全球的發(fā)展概述CNMARC(ChinaMachine-ReadableCatalogue,中國機讀目錄)的研制開始于20世紀70年代。于1982年通過了參考ISO2709制定的國家標準《文獻目錄信息交換用磁帶格式》(GB2901—1982),為中文MARC格式奠定了基礎;1991年2月,《中國機讀目錄通訊格式》正式出版;1996年2月6日,《中國機讀目錄格式》(ChinaMARCFormat)正式發(fā)布,1996年7月1日起實施。2004年,北京圖書館出版社出版了國家圖書館編的《新版中國機讀目錄格式使用手冊》(NewChinaMARCFormatManual)。中國:CNMARC52.2MARC記錄基本格式MARC記錄由記錄結構、內容標識符和數(shù)據(jù)內容組成。記錄結構遵循美國國家標準InformationInterchangeFormat(ANSIZ39.2)和國際標準FormatforInformationExchange(ISO2709);內容標識符用來識別MARC記錄的數(shù)據(jù)元素,或提供有關數(shù)據(jù)元素附加信息的特殊符號或編碼,包括字段標識符、字段指示符和子字段代碼;數(shù)據(jù)元素內容通常遵循格式以外的其他標準,如英美編目條例(AACR)、美國國會圖書館主題詞表(LCSH)。2.2MARC記錄基本格式下面以武漢大學圖書館提取的一條MARC記錄來說明MARC21書目數(shù)據(jù)格式,圖4-1為該記錄的磁盤數(shù)據(jù)格式,圖4-2為按閱讀習慣設計的字段數(shù)據(jù)加工表。MARC21書目數(shù)據(jù)格式由記錄頭標區(qū)、地址目次區(qū)和可變長字段三部分組成,每個記錄均以記錄終止符結束,如圖4-3所示。2.2MARC記錄基本格式記錄頭標區(qū)(Leader)位于每個記錄的起始位置,是對一條記錄的總體說明,由24個字符位組成固定長度,為計算機處理提供該記錄的基本參數(shù),概括了該記錄各方面的特點,供計算機識別該記錄使用。該區(qū)沒有指示符和子字段代碼。記錄頭標區(qū)1圖4-1中頭標區(qū)的值為“01756cama2200361a4500”,其含義如表4-4所示。2.2MARC記錄基本格式地址目次區(qū)(Directory)緊接在記錄頭標區(qū)后,由若干固定長度的目次區(qū)款目項和區(qū)末的字段分隔符構成,如圖4-4所示。地址目次區(qū)2地址目次區(qū)有計算機系統(tǒng)自動生成,每個目次區(qū)款目項共12個字符位,可以分為3個部分:字段標識符(占3個字符位)、字段長度(占4個字符位)、字段起始字符位置(占5個字符位)。將圖4-1中地址目次區(qū)內容轉為表4-5進行說明。2.2MARC記錄基本格式可變長字段(VariableFields)由兩部分構成:控制字段和數(shù)據(jù)字段。(1)控制字段(ControlFields)(2)數(shù)據(jù)字段數(shù)據(jù)字段(DataFields)包含字段指示符、子字段代碼和長度不固定的子字段數(shù)據(jù)元素。其結構如圖4-5所示??勺冮L字段3根據(jù)可變長數(shù)據(jù)字段的第一個字段標識符,可以將MARC21書目數(shù)據(jù)格式分為以下字段塊,具體如表4-6所示。2.3MARC著錄的優(yōu)缺點MARC格式是在傳統(tǒng)的文獻編目工作中發(fā)展起來的,規(guī)范了圖書館書目信息,推動了圖書館自動化的發(fā)展,其優(yōu)點如下。(1)著錄信息豐富(2)實現(xiàn)規(guī)范控制(3)方便訪問,便于計算機處理(4)便于實現(xiàn)資源共享(5)有專門機構進行維護和修訂(6)提高圖書館工作效率MARC的優(yōu)點12.3MARC著錄的優(yōu)缺點網絡資源的劇增、新型媒介的出現(xiàn)及電子出版的迅速發(fā)展對現(xiàn)有的編目規(guī)則和MARC格式提出了新的挑戰(zhàn)。2002年,RoyTennant曾在LibraryJournal上發(fā)文號召廢止MARC,引發(fā)了MARC是廢除還是保留的一場大討論??偨Y起來,MARC格式有以下缺點。(1)編目人員的高要求性(2)MARC格式著錄單元的限制(3)MARC的標識系統(tǒng)的難閱讀性(4)對多媒體信息描述不夠(5)使用環(huán)境和范圍的限制(6)FRBR對MARC的沖擊MARC的缺點13元數(shù)據(jù)著錄法3.1元數(shù)據(jù)簡介元數(shù)據(jù)(Metadata),又稱為“描述數(shù)據(jù)”或“詮釋數(shù)據(jù)”,就是“關于數(shù)據(jù)的數(shù)據(jù)”(dataaboutdata)。元數(shù)據(jù)并不是個陌生的概念。我們在日常的工作中有意或無意地使用了元數(shù)據(jù),如地圖的圖例、圖書目錄等。元數(shù)據(jù)的定義1本書認為:元數(shù)據(jù)是按照一定的標準,規(guī)范化描述一個具體的資源對象的各項特征元素集,通過這組特征元素集實現(xiàn)對這個資源對象的定位、發(fā)現(xiàn)與獲取等功能。3.1元數(shù)據(jù)簡介①描述。這是元數(shù)據(jù)的最基本職能。是指通過對信息資源的描述,揭示信息資源的形式特征和內容特征。描述的詳細與深入程度則根據(jù)不同元數(shù)據(jù)格式而不同。②定位。主要是指通過對信息資源的位置信息的描述,幫助人們了解信息資源所在之處的信息,方便信息資源的獲取。此外,一旦確定信息資源的位置元數(shù)據(jù)后,也可以確定該信息資源在整個信息資源集合中的位置,這是定位的另一層含義。③檢索。在著錄過程中,通過描述信息資源的主要特征,并賦予檢索點,建立信息資源之間的聯(lián)系,有利于從多途徑、多角度檢索到該信息資源。元數(shù)據(jù)的功能23.1元數(shù)據(jù)簡介④選擇。通過對信息資源的描述,使用戶無須瀏覽信息資源本身,就能對信息資源的內容有所了解、認識,結合使用環(huán)境,用戶可以選擇符合要求的資源。⑤評估。利用統(tǒng)計工具,對信息資源的版本、使用、保存管理等信息進行統(tǒng)計分析,方便資源的建立與管理者更好地組織資源,了解該信息資源在同類資源中的重要性。⑥管理。元數(shù)據(jù)元素除包含比較全面的著錄描述信息外,還往往包括權利管理、電子簽名、資源評鑒、使用管理、支付審計等管理方面的信息。⑦保存。元數(shù)據(jù)中往往包括詳細的格式信息、制作信息、保護條件、轉換方式、保存責任等內容,從而支持對資源的保護與長期保存。元數(shù)據(jù)的功能23.1元數(shù)據(jù)簡介從資料來看,元數(shù)據(jù)的劃分主要有以下方法。(1)按功能分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論