信息組織元數(shù)據(jù)_第1頁
信息組織元數(shù)據(jù)_第2頁
信息組織元數(shù)據(jù)_第3頁
信息組織元數(shù)據(jù)_第4頁
信息組織元數(shù)據(jù)_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

信息組織元數(shù)據(jù)第一頁,共一百零八頁,編輯于2023年,星期五元數(shù)據(jù)的定義我們所說的“元數(shù)據(jù)”,英文作Metadata。目前在國內(nèi)有多種譯法,大陸一般譯作“元數(shù)據(jù)”。香港和臺(tái)灣則譯法較多,臺(tái)灣有人譯作“預(yù)設(shè)資料”、“詮釋資料”、“元資料”,也有人譯作“后設(shè)資料”。

第二頁,共一百零八頁,編輯于2023年,星期五關(guān)于這一名稱,西方學(xué)者大多定義為:DataaboutData,即關(guān)于數(shù)據(jù)的數(shù)據(jù)。它是用于描述信息資源的高度結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)是手提箱,而元數(shù)據(jù)是它上面的姓名標(biāo)牌;數(shù)據(jù)是文件夾,而元數(shù)據(jù)是夾子的標(biāo)簽;數(shù)據(jù)是書的內(nèi)容,元數(shù)據(jù)是書脊上的杜威十進(jìn)制數(shù)碼。第三頁,共一百零八頁,編輯于2023年,星期五圖書管理信息書名信息作者信息圖像信息第四頁,共一百零八頁,編輯于2023年,星期五資料庫建庫人員來源及類別所用平臺(tái)信息組織方式管理維護(hù)人員反饋信息后續(xù)信息檢索方法第五頁,共一百零八頁,編輯于2023年,星期五第二節(jié)元數(shù)據(jù)的分類一、按功能分管理性描述性技術(shù)性保存性使用性第六頁,共一百零八頁,編輯于2023年,星期五第二節(jié)元數(shù)據(jù)的分類二、按復(fù)雜程度分采用簡單的記錄格式結(jié)構(gòu)化的格式復(fù)雜格式第七頁,共一百零八頁,編輯于2023年,星期五第二節(jié)元數(shù)據(jù)的分類三、按描述的資源類型分采用簡單的記錄格式結(jié)構(gòu)化的格式復(fù)雜格式第八頁,共一百零八頁,編輯于2023年,星期五元數(shù)據(jù)的結(jié)構(gòu)內(nèi)容結(jié)構(gòu)句法結(jié)構(gòu)語義結(jié)構(gòu)第九頁,共一百零八頁,編輯于2023年,星期五都柏林核心元數(shù)據(jù)一、DC概述二、DC定義DC核心元素集參考描述如表:資源名創(chuàng)建者第十頁,共一百零八頁,編輯于2023年,星期五MARC于1965年由美國會(huì)圖書館一個(gè)研究小組制定,后來不斷完善,成為圖書館數(shù)字化檢索的重要格式。1991年,我國有關(guān)部門在UNIMARC基礎(chǔ)上加上我們所需的特定字段,編制了《中國機(jī)讀目錄通訊格式》(CNMARC),此后多次修訂DublicCore最初于1995年制定,從時(shí)間上看要比MARC晚,在技術(shù)上要先進(jìn)MARC及Dublic(DC)

第十一頁,共一百零八頁,編輯于2023年,星期五由來:在1995年聯(lián)合召開了第一次都柏林(都柏林為美國俄亥俄州的一個(gè)城市)核心集會(huì)議。來自圖書館、計(jì)算機(jī)及有關(guān)領(lǐng)域的專家達(dá)成一致意見,創(chuàng)建了只包含能夠描述電子文獻(xiàn)基本特征的DublinCore從1995年開始,專家小組共召開了13次會(huì)議,討論與核心集相關(guān)的各種問題。2004年10月11-14日,我國上海圖書館主辦了第12次會(huì)議。最近一次會(huì)議于2005年9月12-15日在西班牙首都馬德里召開,來自33個(gè)國家和地區(qū)共計(jì)214名專家學(xué)者出席了會(huì)議。DublicCore

(DC)第十二頁,共一百零八頁,編輯于2023年,星期五簡單性原則”。定義一個(gè)能得到最廣泛應(yīng)用、被全球所理解和接受的最小元素集,并能作為特殊用戶詳細(xì)描述需求的一個(gè)核心集?!耙子眯栽瓌t”。能方便作者和信息提供者描述自己的文檔,而不給他們增加太多的負(fù)擔(dān),并能方便地實(shí)現(xiàn)資源發(fā)現(xiàn)工具之間的互操作性。DublicCore的原則

第十三頁,共一百零八頁,編輯于2023年,星期五“內(nèi)在性(intrinsicality)原則”。指DC元數(shù)據(jù)以揭示描述對(duì)象自身的內(nèi)容屬性為主,外部屬性為輔?!翱蓴U(kuò)展性原則”。希望DC成為一個(gè)“核心”元素集合而可以通過各種方式擴(kuò)展為適應(yīng)各領(lǐng)域資源描述需要的元數(shù)據(jù)方案。第十四頁,共一百零八頁,編輯于2023年,星期五“句法獨(dú)立(syntaxindependence)原則”。指DC元數(shù)據(jù)的元素可以以多種方式編碼,應(yīng)用于各類技術(shù)平臺(tái)中。DC只規(guī)定元素的基本語義?!翱蛇x擇性”。指DC元素集合中的任何元素都是可選的。第十五頁,共一百零八頁,編輯于2023年,星期五“可重復(fù)性”。指DC元素集合中的任何元素都是可重復(fù)的?!翱尚薷男浴薄V冈诰唧w應(yīng)用中可以對(duì)DC元素集中的任何元素進(jìn)行進(jìn)一步“修飾”或“限定”,但不能擴(kuò)大或改變元素的基本語義。第十六頁,共一百零八頁,編輯于2023年,星期五元素:標(biāo)題、作者、主題、出版者、描述、其他參與者、日期、類型、格式、標(biāo)識(shí)、關(guān)系、資料來源、語言、內(nèi)容范圍、版權(quán)15個(gè)元素組成第十七頁,共一百零八頁,編輯于2023年,星期五都柏林核心集目前已經(jīng)擴(kuò)展成一個(gè)世界性元數(shù)據(jù)標(biāo)準(zhǔn),有五個(gè)國家(澳大利亞、芬蘭、丹麥、英國、美國)把它確定為國家標(biāo)準(zhǔn),各類推薦方案被翻譯成33種語言。第十八頁,共一百零八頁,編輯于2023年,星期五當(dāng)前對(duì)都柏林?jǐn)?shù)據(jù)集的看法第十九頁,共一百零八頁,編輯于2023年,星期五由于Google等檢索工具出現(xiàn),一些人甚至斷言,元數(shù)據(jù)特別是DC,在還沒有成為通用標(biāo)準(zhǔn)以前,已經(jīng)壽終正寢了。Google等通用檢索工具,查全查準(zhǔn)兩方面都還有很多問題。第二十頁,共一百零八頁,編輯于2023年,星期五而在這兩個(gè)方面,使用元數(shù)據(jù)的專用信息庫則會(huì)充分發(fā)揮自己的優(yōu)勢。在今后的一段時(shí)間內(nèi),元數(shù)據(jù)不會(huì)因?yàn)樾畔⒓夹g(shù)的進(jìn)步而失去其存在的價(jià)值。這是我們斷續(xù)研究和使用元數(shù)據(jù)的最主要的動(dòng)力。

第二十一頁,共一百零八頁,編輯于2023年,星期五使用者元數(shù)據(jù)服務(wù)器使用者數(shù)據(jù)服務(wù)器數(shù)據(jù)服務(wù)器數(shù)據(jù)服務(wù)器第二十二頁,共一百零八頁,編輯于2023年,星期五DC分為兩類:基本DC和限定DC語種描述模式體系屬性類型第二十三頁,共一百零八頁,編輯于2023年,星期五機(jī)讀目錄(MachineReadableCatalogue,MARC)是一種以代碼形式特定結(jié)構(gòu)記錄在存儲(chǔ)載體上,可由特種機(jī)器及計(jì)算機(jī)閱讀、控制、處理和編輯輸出的目錄格式。第二十四頁,共一百零八頁,編輯于2023年,星期五機(jī)讀目錄的發(fā)展簡史美國。LC在世界圖書館界率先開展了計(jì)算機(jī)在圖書館編目技術(shù)上的應(yīng)用研究。1964年LC提出了著名的“馬爾克計(jì)劃”,即以機(jī)器可讀形式記錄圖書館的書目記錄,從而開創(chuàng)了文獻(xiàn)資源信息描述的新階段。第二十五頁,共一百零八頁,編輯于2023年,星期五美國LC運(yùn)用集中編目的思想,一開始就把機(jī)讀目錄的研制方向確定為向全國發(fā)行機(jī)讀目錄磁帶,便于共享。1966年2月開始實(shí)施MARC試驗(yàn)計(jì)劃,11月完成MARCⅠ機(jī)讀目錄格式并生產(chǎn)出試驗(yàn)性磁帶,稱為“MARCⅠ”磁帶。第二十六頁,共一百零八頁,編輯于2023年,星期五美國1967年對(duì)MARCⅠ進(jìn)行改進(jìn),開始轉(zhuǎn)入MARCⅡ的設(shè)計(jì)和研究,并邀請(qǐng)了英國國家書目部的專家參加。1968年MARCⅡ研制成功,它是目前使用的各種機(jī)讀目錄的母體。1969年LC的機(jī)讀目錄發(fā)行服務(wù)部開始向圖書館界發(fā)行MARCⅡ磁帶,稱之為LCMARC,得到廣泛應(yīng)用和推廣。第二十七頁,共一百零八頁,編輯于2023年,星期五美國1971年,美國國家標(biāo)準(zhǔn)局將LCMARC格式定為國家標(biāo)準(zhǔn);1982年LCMARC改稱為USMARC;1998年6月至2000年7月經(jīng)修訂后,正式更名為MARC21。第二十八頁,共一百零八頁,編輯于2023年,星期五國際標(biāo)準(zhǔn)化組織1969年,MARCⅡ作為美國/英國國家標(biāo)準(zhǔn)局推薦格式,呈交ISO。1973年ISO將其作為國際標(biāo)準(zhǔn)頒布,即ISO2709(文獻(xiàn)目錄信息交換用磁帶記錄格式),它為世界機(jī)讀目錄格式結(jié)構(gòu)大體上的統(tǒng)一鋪平了道路。第二十九頁,共一百零八頁,編輯于2023年,星期五國際圖聯(lián)IFLA1977年正式出版了UNIMARC,指出其基本目的是為了方便國家書目機(jī)構(gòu)之間不同機(jī)讀格式數(shù)據(jù)的國際性轉(zhuǎn)換。1981年UNIMARC出第二版。1991年《UNIMARC規(guī)范格式》。采用國家:中國、日本、歐洲許多國家。第三十頁,共一百零八頁,編輯于2023年,星期五聯(lián)合國教科文組織1978年,UNECO提議開發(fā)一種圖書館、書目機(jī)構(gòu)和文摘、索引機(jī)構(gòu)的通用格式,1983年制定了書目文獻(xiàn)公共交換格式規(guī)范(CommonCommunicationFormat,CCF),并于1984年出版。第三十一頁,共一百零八頁,編輯于2023年,星期五MARC211994年12月起,美、加、不列顛圖書館開始推動(dòng)USMARC、CANMARC、UKMARC三者的機(jī)讀編目格式整合計(jì)劃,但最后的成果MARC21(1999年)是CANMARC和USMARC的之間的合作與發(fā)展。MARC21是一套響應(yīng)網(wǎng)絡(luò)時(shí)代而產(chǎn)生的一種通用的開放的資料格式。第三十二頁,共一百零八頁,編輯于2023年,星期五MARC21MARC21基本上發(fā)展成為五大部分:書目數(shù)據(jù)MARC21規(guī)范數(shù)據(jù)MARC21分類數(shù)據(jù)MARC21館藏?cái)?shù)據(jù)MARC21團(tuán)體信息MARC21第三十三頁,共一百零八頁,編輯于2023年,星期五MARC21MARC21在原有基礎(chǔ)上增加了538字段(系統(tǒng)需求和存取注釋)、516字段(計(jì)算機(jī)文件類型或數(shù)據(jù)注釋)、256字段(計(jì)算機(jī)文件特征)以及856字段(電子地址和存?。┑茸侄?。第三十四頁,共一百零八頁,編輯于2023年,星期五中國機(jī)讀目錄的研制過程1975年劉國均發(fā)表的《馬爾克計(jì)劃簡介——兼論圖書館引進(jìn)電子計(jì)算機(jī)問題》揭開了我國計(jì)算機(jī)編目和機(jī)讀目錄研制工作序幕。1979年北京圖書館等單位組成“北京地區(qū)機(jī)讀目錄研制協(xié)作組”,開始研究LCMARC磁帶。1980年我國正式頒布了國家標(biāo)準(zhǔn)字符集。第三十五頁,共一百零八頁,編輯于2023年,星期五中國機(jī)讀目錄的研制過程1982年,《文獻(xiàn)目錄信息交換用磁帶格式》(GB2901-82),主要參考了ISO2709-81。1986年,UNIMARC2版中文譯本問世,北京圖書館等單位據(jù)此編寫了CNMARC討論稿,1989年得到認(rèn)定。1995年,《中國機(jī)讀目錄格式使用手冊》,2001年又出修訂版。第三十六頁,共一百零八頁,編輯于2023年,星期五為了兼容MARC數(shù)據(jù)的應(yīng)用,在全球范圍內(nèi)掀起了從MARC到元數(shù)據(jù)metadata的研究熱潮。第三十七頁,共一百零八頁,編輯于2023年,星期五MARC記錄基本格式無論是ISO2709標(biāo)準(zhǔn),還是GB2901標(biāo)準(zhǔn),都對(duì)每一個(gè)用于交換的書目記錄規(guī)定了必須遵循的標(biāo)準(zhǔn)記錄結(jié)構(gòu),即:記錄頭標(biāo)區(qū)、地址目次區(qū)、數(shù)據(jù)字段區(qū)和記錄分隔符。第三十八頁,共一百零八頁,編輯于2023年,星期五一、記錄頭標(biāo)區(qū)ISO2709規(guī)定,每個(gè)記錄的頭部要有一個(gè)24位字符的記錄頭標(biāo),包含元素:記錄類型、目錄級(jí)別、在層次中的位置、記錄完整程度以及是完全采用還是部分采用ISBD規(guī)則。第三十九頁,共一百零八頁,編輯于2023年,星期五二、地址目次區(qū)目次區(qū)緊接在頭標(biāo)區(qū)之后,含有一個(gè)/多個(gè)目次款目。每個(gè)目次長12個(gè)字符,包括三位數(shù)字字段號(hào)、四位數(shù)字?jǐn)?shù)據(jù)字段長度和五位數(shù)字字段起始符位置。描述中由計(jì)算機(jī)自動(dòng)生成。第四十頁,共一百零八頁,編輯于2023年,星期五三、數(shù)據(jù)字段區(qū)目次區(qū)之后為數(shù)據(jù)字段區(qū),由若干個(gè)定長和變長字段構(gòu)成,每個(gè)字段之間由字段分隔符隔開。數(shù)據(jù)字段區(qū)所含數(shù)據(jù)有兩種形式。定長數(shù)據(jù)字段。主要包括001記錄標(biāo)識(shí)號(hào)和005記錄處理時(shí)間等以00-標(biāo)識(shí)的字段,不設(shè)指示符和子字段。第四十一頁,共一百零八頁,編輯于2023年,星期五變長數(shù)據(jù)字段。010-999所有字段。其結(jié)構(gòu)為:指示符1指示符2子字段標(biāo)識(shí)符數(shù)據(jù)子字段標(biāo)識(shí)符數(shù)據(jù)…字段分隔符第四十二頁,共一百零八頁,編輯于2023年,星期五數(shù)據(jù)字段區(qū)劃分為10個(gè)功能塊,每個(gè)功能塊包含若干個(gè)字段。而字段標(biāo)識(shí)符的第一個(gè)(最左邊)數(shù)字表示字段所屬的功能塊。第四十三頁,共一百零八頁,編輯于2023年,星期五10大功能塊0—標(biāo)識(shí)塊1—編碼信息塊2—著錄信息塊3—附注塊4—連接款目塊5—相關(guān)題名塊6—主題分析塊7—知識(shí)責(zé)任塊8—國際使用塊9—國內(nèi)使用塊第四十四頁,共一百零八頁,編輯于2023年,星期五四、記錄分隔符MARC格式規(guī)定,在每一個(gè)MZRC記錄的最后面,放置一個(gè)專門的符號(hào)以表示該MARC記錄的結(jié)束。第四十五頁,共一百零八頁,編輯于2023年,星期五機(jī)讀目錄的編制方式聯(lián)機(jī)編制方式原始編制方式聯(lián)機(jī)聯(lián)合編制方式第四十六頁,共一百零八頁,編輯于2023年,星期五中國機(jī)讀目錄格式使用手冊

1.1目的和范圍格式是用于中國國家書目機(jī)構(gòu)同其他國家書目機(jī)構(gòu)以及中國國內(nèi)圖書館與情報(bào)部門之間,以標(biāo)準(zhǔn)的計(jì)算機(jī)可讀形式交換書目信息。格式在數(shù)據(jù)規(guī)范方面為書目數(shù)據(jù)庫的建立和書目數(shù)據(jù)處理提供參考或依據(jù)。第四十七頁,共一百零八頁,編輯于2023年,星期五格式對(duì)專著、連續(xù)出版物、測繪資料、樂譜、聲像等類的機(jī)讀形式的書目記錄,規(guī)定了字段標(biāo)識(shí)符指示符和子字段代碼,以及書目記錄的內(nèi)容標(biāo)識(shí)在各種載體上的邏輯的和物理的格式。第四十八頁,共一百零八頁,編輯于2023年,星期五1.2關(guān)于格式內(nèi)容擴(kuò)充的說明格式結(jié)構(gòu)將保持穩(wěn)定,今后機(jī)讀格式的變化僅限于追加有限的字段、子字段和代碼,為了使我國的機(jī)讀目錄在國際范圍內(nèi)具有良好的可交換性,編制格式的主要依據(jù)是國際圖聯(lián)的UNIMARC以及我國出版物的一些特殊情況和規(guī)則的新變化。第四十九頁,共一百零八頁,編輯于2023年,星期五1.3定義檢索點(diǎn):用于檢索書目記錄的名稱,詞語和代碼。數(shù)據(jù)元素:被明確標(biāo)識(shí)的最小信息單元。在可變長字段中,數(shù)據(jù)元素構(gòu)成子字段,用子字段標(biāo)識(shí)符標(biāo)識(shí)。字段:由字段標(biāo)識(shí)符標(biāo)識(shí)的被定義的特定字符串,可包含一個(gè)或多個(gè)子字段。字段分隔符:位于每一個(gè)可變長字段末尾的控制符,用來區(qū)分每一個(gè)相鄰的字段。此外,還用于地址目次區(qū)的末尾。第五十頁,共一百零八頁,編輯于2023年,星期五定長子字段:長度固定的子字段。它可包含一個(gè)或多個(gè)數(shù)據(jù)元素。可用于定長字段,如100字段中的$a子字段。也可用于變長字段,如200字段的$z子字段。層次等級(jí):分配給主書目實(shí)體的一個(gè)數(shù)值。該數(shù)值標(biāo)識(shí)主實(shí)體在一個(gè)預(yù)先確定的層次等級(jí)結(jié)構(gòu)中所處的位置。如多卷集各卷的目錄描述和多卷集整體的目錄描述,可看作是一個(gè)屬于另一個(gè)的兩個(gè)不同層次等級(jí)。層次等級(jí)僅僅在整體及其各獨(dú)立部分均已生成書目記錄的情況下才可以使用。第五十一頁,共一百零八頁,編輯于2023年,星期五子字段:字段內(nèi)所定義的數(shù)據(jù)單位。變長字段:長度可變的字段。可包含一個(gè)或多個(gè)數(shù)據(jù)元素或子字段。其長度包括文字?jǐn)?shù)據(jù),字段指示符,子字段標(biāo)識(shí)符及字段分割符。第五十二頁,共一百零八頁,編輯于2023年,星期五2.格式結(jié)構(gòu)2.1結(jié)構(gòu)它對(duì)每一個(gè)用于交換的書目記錄規(guī)定了必須遵循的標(biāo)準(zhǔn)記錄結(jié)構(gòu)。其標(biāo)準(zhǔn)構(gòu)成為:記錄頭標(biāo):位于一條機(jī)讀記錄的開端,記載了該記錄的有關(guān)參數(shù)。記錄頭標(biāo)區(qū)是為計(jì)算機(jī)處理一條記錄提供必不可少的基本參數(shù)。它由24個(gè)字符構(gòu)成。其中很多元素由計(jì)算機(jī)自動(dòng)生成。第五十三頁,共一百零八頁,編輯于2023年,星期五地址目次區(qū):區(qū)內(nèi)含有一個(gè)或多個(gè)目次款目和字段分隔符,目次項(xiàng)的長度是固定的,而地址目次區(qū)的長度則為可變的,這是由于每條記錄的字段數(shù)量不等,地址目次區(qū)所占字符數(shù)長度不定的緣故。地址目次區(qū)終止處的字段分隔符用以表示該區(qū)結(jié)束。地址目次區(qū)的用途在于供計(jì)算機(jī)準(zhǔn)確、迅速的存取相應(yīng)字段的數(shù)據(jù)。第五十四頁,共一百零八頁,編輯于2023年,星期五數(shù)據(jù)字段區(qū):將有關(guān)文獻(xiàn)的數(shù)據(jù)按功能塊,字段,子字段或數(shù)據(jù)元素這三個(gè)層次組織起來。層次級(jí)別為:子字段構(gòu)成字段,字段構(gòu)成功能塊?!陡袷健返臄?shù)據(jù)字段區(qū)設(shè)置了0——標(biāo)識(shí)塊1——編碼信息塊2——著錄信息塊3——附注塊4——款目連接塊5——相關(guān)題名塊6——主題分析塊7——知識(shí)責(zé)任塊8——國際使用塊9——國內(nèi)使用塊十個(gè)功能塊。記錄分隔符:至于每條機(jī)讀記錄的末尾,用來區(qū)分記錄的控制字符。第五十五頁,共一百零八頁,編輯于2023年,星期五3功能模塊簡介3.10—標(biāo)識(shí)塊本塊用來標(biāo)識(shí)記錄或標(biāo)識(shí)出版物實(shí)體上的號(hào)碼。如010國際標(biāo)準(zhǔn)書號(hào)子字段標(biāo)識(shí)符子字段內(nèi)容$aISBN$b限定$d獲得方式和/或價(jià)格第五十六頁,共一百零八頁,編輯于2023年,星期五例:010##$a7-118-00249-1$b精裝$dCNY55.00010##$a7-81023-606-7$dCNY6.80(上冊);CNY9.80(下冊)第五十七頁,共一百零八頁,編輯于2023年,星期五011國際標(biāo)準(zhǔn)連續(xù)出版物號(hào)子字段標(biāo)識(shí)符子字段內(nèi)容$aISSN$b限定$d獲得方式和/或價(jià)格例:011##$a0101-0064$d函索即贈(zèng)011##$a0009-3947$dCNY1.00,CNY13.25(全年)第五十八頁,共一百零八頁,編輯于2023年,星期五3.21—信息編碼塊本塊用來標(biāo)識(shí)出版物的一般性數(shù)據(jù)如101作品語種子字段標(biāo)識(shí)符子字段內(nèi)容$a正文語種$b中間語種$c原作語種第五十九頁,共一百零八頁,編輯于2023年,星期五例:101##$achi《周恩來選集》正文為中文101##$achi$ceng《戰(zhàn)爭與回憶》原著為英文,譯成中文101##$achi$beng$cger《希臘的神話和傳說》原著為德文,由英譯本轉(zhuǎn)譯成中文101##$achi$alat《生物學(xué)詞匯》漢語,拉丁語對(duì)照第六十頁,共一百零八頁,編輯于2023年,星期五3.32—著錄信息塊本塊包括有關(guān)出版物形式特征的著錄項(xiàng)目,但附注項(xiàng)和標(biāo)準(zhǔn)號(hào)除外。如200題名與責(zé)任說明項(xiàng)子字段標(biāo)識(shí)符子字段內(nèi)容$a正題名$d并列題名$e其他題名信息$f第一責(zé)任者$g其他責(zé)任說明第六十一頁,共一百零八頁,編輯于2023年,星期五例:《逸周書》源流考辨/黃懷信著200##$a《逸周書》源流考辨$f黃懷信著$9yizhoushuyuanliukaobian談《紅樓夢》,又名,紅學(xué)芻言/張畢來著200##$a談《紅樓夢》$a紅學(xué)芻言$f張畢來著

第六十二頁,共一百零八頁,編輯于2023年,星期五備急千斤藥方;銀海精微/(唐)孫思邈撰;(宋)高保衡等校正200##$a備急千斤藥方$a銀海精微$f(唐)孫思邈撰$g(宋)高保衡等校正中華人民共和國婦女權(quán)益保障法=LawofthePeople’sRepublicofChinaontheprotectionofrightsandinterestofwomen:中英對(duì)照/全國人民代表大會(huì)通過200##$a中華人民共和國婦女權(quán)益保障法$dLawofthePeople’sRepublicofChinaontheprotectionofrightsandinterestofwomen$e中英對(duì)照$f全國人民代表大會(huì)通過$zeng第六十三頁,共一百零八頁,編輯于2023年,星期五210出版發(fā)行項(xiàng)本字段含有文獻(xiàn)出版,發(fā)行和制作日期的信息。子字段標(biāo)識(shí)符子字段內(nèi)容$a出版發(fā)行地$b出版者,發(fā)行者地址等$c出版者,發(fā)行者名稱等$d出版,發(fā)行日期例:第六十四頁,共一百零八頁,編輯于2023年,星期五210##$a[鄭州]$c中州古籍出版社$d1991.2出版地不是取自主要信息源,放在方括號(hào)內(nèi)210##$a芒市[云南]$c德宏民族出版社$d[1991?]出版地不太有名,而地區(qū)名是編目員補(bǔ)充的,出版日期不確定.第六十五頁,共一百零八頁,編輯于2023年,星期五3.43—附注塊本塊所設(shè)的附注是對(duì)著錄項(xiàng)目或檢索點(diǎn)做進(jìn)一步陳述的信息,可涉及文獻(xiàn)或其內(nèi)容的物理組成的各個(gè)方面.如300一般性附注本子字段對(duì)文獻(xiàn)及其相關(guān)紀(jì)錄的任何方面的附注$a附注內(nèi)容第六十六頁,共一百零八頁,編輯于2023年,星期五例:300##$a本書另有地圖兩頁置于書后袋中300##$a本書據(jù)北圖珍藏抄本影印301標(biāo)識(shí)號(hào)附注本子段所含標(biāo)識(shí)號(hào)指出現(xiàn)在文獻(xiàn)各處的任何標(biāo)識(shí)號(hào)子字段$a附注內(nèi)容例:301##$a“DOE/EIA-0031/2”.出現(xiàn)在文獻(xiàn)題名上的一個(gè)報(bào)告號(hào)第六十七頁,共一百零八頁,編輯于2023年,星期五3.54—款目連接塊款目連接塊是用來明晰的解釋相關(guān)書目記錄之間的關(guān)系。這種關(guān)系可歸納為三類。(1)層次關(guān)系。如總集,分集,單冊等(2)平行關(guān)系。同一作品的不同語種或不同載體形式的記錄。(3)時(shí)間關(guān)系。如更名連續(xù)出版物的先前款目和后續(xù)款目等。第六十八頁,共一百零八頁,編輯于2023年,星期五3.65—相關(guān)題名塊本塊含有除正題名外而又通常出現(xiàn)在出版物實(shí)體上的與所編文獻(xiàn)相關(guān)的題名。例:500##$aGenesis$n(Anglo-Saxonpoem)為題名是Genesis的Anglo-Saxon詩集的統(tǒng)一題名加上了限定,以便將其與作為圣經(jīng)中的Genesis(創(chuàng)世紀(jì))這本書區(qū)分開第六十九頁,共一百零八頁,編輯于2023年,星期五3.76—主題分析塊本塊所標(biāo)引的是文獻(xiàn)的主題數(shù)據(jù),即可是詞語也可是符號(hào),如600個(gè)人名稱主題601團(tuán)體名稱主題605題名主題等。例:600##$f唐$a杜甫$x傳記($a款目要素,用于排序$f年代$x學(xué)科主題復(fù)分)

第七十頁,共一百零八頁,編輯于2023年,星期五200##$a燕園史話601##$a北京大學(xué)$x史料601##$a徐匯天文臺(tái)$x史料題名為《徐匯天文臺(tái)記》第七十一頁,共一百零八頁,編輯于2023年,星期五3.87—知識(shí)責(zé)任塊本塊對(duì)所編文獻(xiàn)負(fù)有某種責(zé)任形式的個(gè)人或團(tuán)體的名稱,需要建立檢索點(diǎn)的知識(shí)責(zé)任入此。如700個(gè)人名稱-主要知識(shí)責(zé)任701個(gè)人名稱-次要知識(shí)責(zé)任710團(tuán)體名稱-主要知識(shí)責(zé)任等。例:700##$a朱熹$f宋701$a易海秋$4主編$a趙衛(wèi)濱$4主編該出版物為二人主編第七十二頁,共一百零八頁,編輯于2023年,星期五3.98—國際使用塊本塊包含國際上一致約定的不適于在0—至7—處理的字段第七十三頁,共一百零八頁,編輯于2023年,星期五3.109—國內(nèi)使用塊本塊是中國國內(nèi)各系統(tǒng)在處理一些超出通用范圍的本單位館藏?cái)?shù)據(jù)的字段。

第七十四頁,共一百零八頁,編輯于2023年,星期五其它元數(shù)據(jù)METSMODSEADGILSPICSCDF第七十五頁,共一百零八頁,編輯于2023年,星期五元數(shù)據(jù)的互操作元數(shù)據(jù)的互操作的背景元數(shù)據(jù)的層次元數(shù)據(jù)的互操作協(xié)議標(biāo)準(zhǔn)第七十六頁,共一百零八頁,編輯于2023年,星期五整合檢索模式集中式聯(lián)合目錄聯(lián)合編目系統(tǒng)人工上傳批處理采用協(xié)議,自動(dòng)收割(Harvesting)元數(shù)據(jù),如OAI分布式聯(lián)合目錄采用標(biāo)準(zhǔn)協(xié)議實(shí)時(shí)查詢各資源站點(diǎn)的元數(shù)據(jù),如Z39.50,SDLIP,OpenURL采用動(dòng)態(tài)頁面分析技術(shù),以元搜索方式實(shí)時(shí)查詢資源站點(diǎn)元數(shù)據(jù)。第七十七頁,共一百零八頁,編輯于2023年,星期五互操作的現(xiàn)實(shí)目標(biāo)整合下述資源:Abstracting/IndexingServicesPublishers(e.g.ElsevierScienceDirect)–importanttobeabletopulltogtherAggregatorsElectronicreservesLocaldatabasesincludingdigitizationprojectsOAIresourcesInstitutionalrepositories

第七十八頁,共一百零八頁,編輯于2023年,星期五跨庫檢索系統(tǒng)用戶界面認(rèn)證管理Session管理總控管理統(tǒng)一檢索入口連接器引擎API統(tǒng)一格式結(jié)果反饋檢索參數(shù)定制檢索結(jié)果保存檢索請(qǐng)求處理API檢索結(jié)果處理API用戶管理檢索請(qǐng)求處理模塊各協(xié)議連接器引擎檢索結(jié)果處理模塊HTTP連接器Z39.50連接器JDBC連接器OAI連接器Internet數(shù)據(jù)源Z39.50服務(wù)器本地?cái)?shù)據(jù)庫OAI服務(wù)器日志管理針對(duì)特定資源的元數(shù)據(jù)結(jié)果格式轉(zhuǎn)換配置文件資源定制第七十九頁,共一百零八頁,編輯于2023年,星期五支持跨系統(tǒng)的信息組合支持跨系統(tǒng)的服務(wù)集成第八十頁,共一百零八頁,編輯于2023年,星期五互操作的層次不同的元數(shù)據(jù)方案具有差異性:語義差別句法差別結(jié)構(gòu)差別第八十一頁,共一百零八頁,編輯于2023年,星期五互操作層次:語義互操作句法互操作結(jié)構(gòu)互操作第八十二頁,共一百零八頁,編輯于2023年,星期五語義互操作:映射、OAI(OpenArchivesInitiativeProtocolforMetadataHarvesting)元數(shù)據(jù)互操作協(xié)議。結(jié)構(gòu)互操作:RDF(資源描述框架)語法互操作:XML(可擴(kuò)展標(biāo)記語言)第八十三頁,共一百零八頁,編輯于2023年,星期五Z39.50標(biāo)準(zhǔn)和協(xié)議Z39.50標(biāo)準(zhǔn)的名稱:信息檢索--應(yīng)用服務(wù)定義與協(xié)議規(guī)范Z39.50協(xié)議是在分布式網(wǎng)絡(luò)環(huán)境下,用以支持信息搜索和信息檢索的計(jì)算機(jī)系統(tǒng)間的通信協(xié)議第八十四頁,共一百零八頁,編輯于2023年,星期五標(biāo)準(zhǔn)所依據(jù)的相關(guān)技術(shù)基礎(chǔ)標(biāo)準(zhǔn)規(guī)定了數(shù)據(jù)庫管理系統(tǒng)的客戶端和服務(wù)器端對(duì)話的規(guī)則。這種規(guī)則建立在客戶機(jī)/服務(wù)器的體系結(jié)構(gòu)基礎(chǔ)之上。數(shù)據(jù)庫客戶端和服務(wù)器端的通訊通過網(wǎng)絡(luò)實(shí)現(xiàn)。第八十五頁,共一百零八頁,編輯于2023年,星期五Z39.50標(biāo)準(zhǔn)與協(xié)議的對(duì)應(yīng)關(guān)系標(biāo)準(zhǔn)Z39.50--1988Z39.50--1992Z39.50--1995標(biāo)準(zhǔn)規(guī)范的協(xié)議Z39.50第一版Z39.50第二版Z39.50第二版和第三版第八十六頁,共一百零八頁,編輯于2023年,星期五源端與目標(biāo)端的概念Z39.50標(biāo)準(zhǔn)是按典型的客戶機(jī)/服務(wù)器體系結(jié)構(gòu)定義的。在Z39.50標(biāo)準(zhǔn)術(shù)語中,客戶端計(jì)算機(jī)和服務(wù)器在通訊過程中分別被稱為“源端”(Origin)和“目標(biāo)端”(Target)。使用“源端”和“目標(biāo)端”代表客戶機(jī)與服務(wù)器描述數(shù)據(jù)通訊過程,是為了概念上更準(zhǔn)確。第八十七頁,共一百零八頁,編輯于2023年,星期五Z39.50信息檢索模型用戶界面轉(zhuǎn)換客戶端Z-server轉(zhuǎn)換數(shù)據(jù)庫數(shù)據(jù)集搜索檢索結(jié)果檢索檢索結(jié)果數(shù)據(jù)庫記錄搜索第八十八頁,共一百零八頁,編輯于2023年,星期五根據(jù)Z39.50標(biāo)準(zhǔn)實(shí)現(xiàn)的圖書館管理系統(tǒng)標(biāo)準(zhǔn)數(shù)據(jù)格式及統(tǒng)一的檢索邏輯Z39.50標(biāo)準(zhǔn)接口BER編碼TCP/IP或其它協(xié)議第八十九頁,共一百零八頁,編輯于2023年,星期五設(shè)施、服務(wù)與操作Z39.50標(biāo)準(zhǔn)規(guī)定了源端和目標(biāo)端互操作的規(guī)范。這些操作抽象為設(shè)施和服務(wù),并對(duì)其過程作出各種約定。這些設(shè)施中的服務(wù),需要通過特定的操作指令來表達(dá)。配合這些操作指令,還約定了屬性集和記錄語法,用代碼來表示特定的操作屬性和記錄語法形態(tài)。第九十頁,共一百零八頁,編輯于2023年,星期五Z39.50標(biāo)準(zhǔn)的主要內(nèi)容設(shè)施名稱 服務(wù)名稱初始化 初始化搜索 搜索獲取 提交、分段刪除結(jié)果集 刪除瀏覽 掃描排序 排序存取控制 存取控制帳務(wù)與資源管理 資源管理、觸發(fā)資源管理、資源報(bào)告解釋 (使用搜索和獲取設(shè)施中的服務(wù))擴(kuò)展服務(wù) 擴(kuò)展服務(wù)終止 關(guān)閉第九十一頁,共一百零八頁,編輯于2023年,星期五Z39.50協(xié)議的服務(wù)與機(jī)制機(jī)制記帳/資源控制機(jī)制解釋機(jī)制擴(kuò)展服務(wù)群機(jī)制終止機(jī)制機(jī)制中的服務(wù)資源控制服務(wù)、觸發(fā)資源控制服務(wù)、資源報(bào)告服務(wù)擴(kuò)展服務(wù)群服務(wù)關(guān)閉服務(wù)第九十二頁,共一百零八頁,編輯于2023年,星期五Z39.50的操作Init(初始化)Search(檢索)Present(提交)Delete(刪除)Scan(掃描)Sort(排序)Resource-report(資源報(bào)告)Extended-services(擴(kuò)展服務(wù))。Z39.50標(biāo)準(zhǔn)描述了八種操作類型:第九十三頁,共一百零八頁,編輯于2023年,星期五關(guān)于屬性集在Z39.50標(biāo)準(zhǔn)實(shí)施中,bib-1是最主要的屬性集,包括6組屬性或?qū)傩灶愋停菏褂脤傩裕褐付ㄋ阉鬟^程將要訪問的檢索點(diǎn)。關(guān)系屬性:指定用戶輸入的檢索詞與數(shù)據(jù)庫索引值的關(guān)系。截?cái)鄬傩裕褐付z索詞在索引的哪一部分作為命中條件。完整性屬性:指定檢索詞在索引中是唯一值或非唯一值。位置屬性:指定在索引字段中與檢索詞相關(guān)的內(nèi)容應(yīng)出現(xiàn)在哪個(gè)位置。結(jié)構(gòu)屬性:指定搜索的格式。第九十四頁,共一百零八頁,編輯于2023年,星期五Z39.50的基本服務(wù)Z39.50應(yīng)用程序在實(shí)現(xiàn)其功能的過程中,根據(jù)需要選擇這些服務(wù)。有三種服務(wù)是最基本的服務(wù):初始化(Initialization)搜索(Search)提交(Present)在各種現(xiàn)有的Z39.50應(yīng)用中,通常都包括了上述三種服務(wù)功能。第九十五頁,共一百零八頁,編輯于2023年,星期五基本服務(wù)之一:初始化初始化是在任何查詢過程中的第一步。在這個(gè)服務(wù)中,源端需要:向目標(biāo)端表明自己的身份與目標(biāo)端約定某些后續(xù)查詢處理過程中的基本規(guī)則與目標(biāo)端交換驗(yàn)證信息的具體內(nèi)容第九十六頁,共一百零八頁,編輯于2023年,星期五搜索功能包括了系統(tǒng)的主要工作由源端向目標(biāo)端提交查詢請(qǐng)求

這些查詢請(qǐng)求可以是非常簡單的請(qǐng)求,也可能是含有復(fù)雜邏輯檢索式(與、或、非、大于、小于等等)的請(qǐng)求。服務(wù)器端通常使用描述文件(Profiles)說明支持的服務(wù)類型和應(yīng)用程序兼容性,很多描述文件還說明了哪些是本系統(tǒng)能夠支持的檢索屬性?;痉?wù)之二:搜索第九十七頁,共一百零八頁,編輯于2023年,星期五提交功能的作用是說明管理結(jié)果被返回用戶端時(shí)的形態(tài)。在提交功能中,用戶可以:指定提供記錄的數(shù)量,例如:當(dāng)命中記錄較多時(shí),只提交前十條命中的記錄。指定提供記錄的格式,例如:要求按英國機(jī)讀格式標(biāo)準(zhǔn)提交,不要按美國機(jī)讀格式標(biāo)準(zhǔn)提交?;痉?wù)之三:提交第九十八頁,共一百零八頁,編輯于2023年,星期五OAI:OpenArchivalInitiative第九十九頁,共一百零八頁,編輯于2023年,星期五定義OpenArchivesInitiativeProtocolforMetadataHarvesting,(OAI-PMH)簡稱OAI協(xié)議,協(xié)議的制定目的是提供具有獨(dú)立于應(yīng)用程序的、可互操作的,能夠提供和促進(jìn)Web上信息資源發(fā)布和共享的社區(qū)的應(yīng)用框架。其主要目標(biāo)為:簡化文件內(nèi)容的有效傳播

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論