信息組織元數據_第1頁
信息組織元數據_第2頁
信息組織元數據_第3頁
信息組織元數據_第4頁
信息組織元數據_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

信息組織元數據第一頁,共一百零八頁,2022年,8月28日元數據的定義我們所說的“元數據”,英文作Metadata。目前在國內有多種譯法,大陸一般譯作“元數據”。香港和臺灣則譯法較多,臺灣有人譯作“預設資料”、“詮釋資料”、“元資料”,也有人譯作“后設資料”。

第二頁,共一百零八頁,2022年,8月28日關于這一名稱,西方學者大多定義為:DataaboutData,即關于數據的數據。它是用于描述信息資源的高度結構化數據。數據是手提箱,而元數據是它上面的姓名標牌;數據是文件夾,而元數據是夾子的標簽;數據是書的內容,元數據是書脊上的杜威十進制數碼。第三頁,共一百零八頁,2022年,8月28日圖書管理信息書名信息作者信息圖像信息第四頁,共一百零八頁,2022年,8月28日資料庫建庫人員來源及類別所用平臺信息組織方式管理維護人員反饋信息后續(xù)信息檢索方法第五頁,共一百零八頁,2022年,8月28日第二節(jié)元數據的分類一、按功能分管理性描述性技術性保存性使用性第六頁,共一百零八頁,2022年,8月28日第二節(jié)元數據的分類二、按復雜程度分采用簡單的記錄格式結構化的格式復雜格式第七頁,共一百零八頁,2022年,8月28日第二節(jié)元數據的分類三、按描述的資源類型分采用簡單的記錄格式結構化的格式復雜格式第八頁,共一百零八頁,2022年,8月28日元數據的結構內容結構句法結構語義結構第九頁,共一百零八頁,2022年,8月28日都柏林核心元數據一、DC概述二、DC定義DC核心元素集參考描述如表:資源名創(chuàng)建者第十頁,共一百零八頁,2022年,8月28日MARC于1965年由美國會圖書館一個研究小組制定,后來不斷完善,成為圖書館數字化檢索的重要格式。1991年,我國有關部門在UNIMARC基礎上加上我們所需的特定字段,編制了《中國機讀目錄通訊格式》(CNMARC),此后多次修訂DublicCore最初于1995年制定,從時間上看要比MARC晚,在技術上要先進MARC及Dublic(DC)

第十一頁,共一百零八頁,2022年,8月28日由來:在1995年聯合召開了第一次都柏林(都柏林為美國俄亥俄州的一個城市)核心集會議。來自圖書館、計算機及有關領域的專家達成一致意見,創(chuàng)建了只包含能夠描述電子文獻基本特征的DublinCore從1995年開始,專家小組共召開了13次會議,討論與核心集相關的各種問題。2004年10月11-14日,我國上海圖書館主辦了第12次會議。最近一次會議于2005年9月12-15日在西班牙首都馬德里召開,來自33個國家和地區(qū)共計214名專家學者出席了會議。DublicCore

(DC)第十二頁,共一百零八頁,2022年,8月28日簡單性原則”。定義一個能得到最廣泛應用、被全球所理解和接受的最小元素集,并能作為特殊用戶詳細描述需求的一個核心集?!耙子眯栽瓌t”。能方便作者和信息提供者描述自己的文檔,而不給他們增加太多的負擔,并能方便地實現資源發(fā)現工具之間的互操作性。DublicCore的原則

第十三頁,共一百零八頁,2022年,8月28日“內在性(intrinsicality)原則”。指DC元數據以揭示描述對象自身的內容屬性為主,外部屬性為輔。“可擴展性原則”。希望DC成為一個“核心”元素集合而可以通過各種方式擴展為適應各領域資源描述需要的元數據方案。第十四頁,共一百零八頁,2022年,8月28日“句法獨立(syntaxindependence)原則”。指DC元數據的元素可以以多種方式編碼,應用于各類技術平臺中。DC只規(guī)定元素的基本語義。“可選擇性”。指DC元素集合中的任何元素都是可選的。第十五頁,共一百零八頁,2022年,8月28日“可重復性”。指DC元素集合中的任何元素都是可重復的?!翱尚薷男浴?。指在具體應用中可以對DC元素集中的任何元素進行進一步“修飾”或“限定”,但不能擴大或改變元素的基本語義。第十六頁,共一百零八頁,2022年,8月28日元素:標題、作者、主題、出版者、描述、其他參與者、日期、類型、格式、標識、關系、資料來源、語言、內容范圍、版權15個元素組成第十七頁,共一百零八頁,2022年,8月28日都柏林核心集目前已經擴展成一個世界性元數據標準,有五個國家(澳大利亞、芬蘭、丹麥、英國、美國)把它確定為國家標準,各類推薦方案被翻譯成33種語言。第十八頁,共一百零八頁,2022年,8月28日當前對都柏林數據集的看法第十九頁,共一百零八頁,2022年,8月28日由于Google等檢索工具出現,一些人甚至斷言,元數據特別是DC,在還沒有成為通用標準以前,已經壽終正寢了。Google等通用檢索工具,查全查準兩方面都還有很多問題。第二十頁,共一百零八頁,2022年,8月28日而在這兩個方面,使用元數據的專用信息庫則會充分發(fā)揮自己的優(yōu)勢。在今后的一段時間內,元數據不會因為信息技術的進步而失去其存在的價值。這是我們斷續(xù)研究和使用元數據的最主要的動力。

第二十一頁,共一百零八頁,2022年,8月28日使用者元數據服務器使用者數據服務器數據服務器數據服務器第二十二頁,共一百零八頁,2022年,8月28日DC分為兩類:基本DC和限定DC語種描述模式體系屬性類型第二十三頁,共一百零八頁,2022年,8月28日機讀目錄(MachineReadableCatalogue,MARC)是一種以代碼形式特定結構記錄在存儲載體上,可由特種機器及計算機閱讀、控制、處理和編輯輸出的目錄格式。第二十四頁,共一百零八頁,2022年,8月28日機讀目錄的發(fā)展簡史美國。LC在世界圖書館界率先開展了計算機在圖書館編目技術上的應用研究。1964年LC提出了著名的“馬爾克計劃”,即以機器可讀形式記錄圖書館的書目記錄,從而開創(chuàng)了文獻資源信息描述的新階段。第二十五頁,共一百零八頁,2022年,8月28日美國LC運用集中編目的思想,一開始就把機讀目錄的研制方向確定為向全國發(fā)行機讀目錄磁帶,便于共享。1966年2月開始實施MARC試驗計劃,11月完成MARCⅠ機讀目錄格式并生產出試驗性磁帶,稱為“MARCⅠ”磁帶。第二十六頁,共一百零八頁,2022年,8月28日美國1967年對MARCⅠ進行改進,開始轉入MARCⅡ的設計和研究,并邀請了英國國家書目部的專家參加。1968年MARCⅡ研制成功,它是目前使用的各種機讀目錄的母體。1969年LC的機讀目錄發(fā)行服務部開始向圖書館界發(fā)行MARCⅡ磁帶,稱之為LCMARC,得到廣泛應用和推廣。第二十七頁,共一百零八頁,2022年,8月28日美國1971年,美國國家標準局將LCMARC格式定為國家標準;1982年LCMARC改稱為USMARC;1998年6月至2000年7月經修訂后,正式更名為MARC21。第二十八頁,共一百零八頁,2022年,8月28日國際標準化組織1969年,MARCⅡ作為美國/英國國家標準局推薦格式,呈交ISO。1973年ISO將其作為國際標準頒布,即ISO2709(文獻目錄信息交換用磁帶記錄格式),它為世界機讀目錄格式結構大體上的統(tǒng)一鋪平了道路。第二十九頁,共一百零八頁,2022年,8月28日國際圖聯IFLA1977年正式出版了UNIMARC,指出其基本目的是為了方便國家書目機構之間不同機讀格式數據的國際性轉換。1981年UNIMARC出第二版。1991年《UNIMARC規(guī)范格式》。采用國家:中國、日本、歐洲許多國家。第三十頁,共一百零八頁,2022年,8月28日聯合國教科文組織1978年,UNECO提議開發(fā)一種圖書館、書目機構和文摘、索引機構的通用格式,1983年制定了書目文獻公共交換格式規(guī)范(CommonCommunicationFormat,CCF),并于1984年出版。第三十一頁,共一百零八頁,2022年,8月28日MARC211994年12月起,美、加、不列顛圖書館開始推動USMARC、CANMARC、UKMARC三者的機讀編目格式整合計劃,但最后的成果MARC21(1999年)是CANMARC和USMARC的之間的合作與發(fā)展。MARC21是一套響應網絡時代而產生的一種通用的開放的資料格式。第三十二頁,共一百零八頁,2022年,8月28日MARC21MARC21基本上發(fā)展成為五大部分:書目數據MARC21規(guī)范數據MARC21分類數據MARC21館藏數據MARC21團體信息MARC21第三十三頁,共一百零八頁,2022年,8月28日MARC21MARC21在原有基礎上增加了538字段(系統(tǒng)需求和存取注釋)、516字段(計算機文件類型或數據注釋)、256字段(計算機文件特征)以及856字段(電子地址和存取)等字段。第三十四頁,共一百零八頁,2022年,8月28日中國機讀目錄的研制過程1975年劉國均發(fā)表的《馬爾克計劃簡介——兼論圖書館引進電子計算機問題》揭開了我國計算機編目和機讀目錄研制工作序幕。1979年北京圖書館等單位組成“北京地區(qū)機讀目錄研制協作組”,開始研究LCMARC磁帶。1980年我國正式頒布了國家標準字符集。第三十五頁,共一百零八頁,2022年,8月28日中國機讀目錄的研制過程1982年,《文獻目錄信息交換用磁帶格式》(GB2901-82),主要參考了ISO2709-81。1986年,UNIMARC2版中文譯本問世,北京圖書館等單位據此編寫了CNMARC討論稿,1989年得到認定。1995年,《中國機讀目錄格式使用手冊》,2001年又出修訂版。第三十六頁,共一百零八頁,2022年,8月28日為了兼容MARC數據的應用,在全球范圍內掀起了從MARC到元數據metadata的研究熱潮。第三十七頁,共一百零八頁,2022年,8月28日MARC記錄基本格式無論是ISO2709標準,還是GB2901標準,都對每一個用于交換的書目記錄規(guī)定了必須遵循的標準記錄結構,即:記錄頭標區(qū)、地址目次區(qū)、數據字段區(qū)和記錄分隔符。第三十八頁,共一百零八頁,2022年,8月28日一、記錄頭標區(qū)ISO2709規(guī)定,每個記錄的頭部要有一個24位字符的記錄頭標,包含元素:記錄類型、目錄級別、在層次中的位置、記錄完整程度以及是完全采用還是部分采用ISBD規(guī)則。第三十九頁,共一百零八頁,2022年,8月28日二、地址目次區(qū)目次區(qū)緊接在頭標區(qū)之后,含有一個/多個目次款目。每個目次長12個字符,包括三位數字字段號、四位數字數據字段長度和五位數字字段起始符位置。描述中由計算機自動生成。第四十頁,共一百零八頁,2022年,8月28日三、數據字段區(qū)目次區(qū)之后為數據字段區(qū),由若干個定長和變長字段構成,每個字段之間由字段分隔符隔開。數據字段區(qū)所含數據有兩種形式。定長數據字段。主要包括001記錄標識號和005記錄處理時間等以00-標識的字段,不設指示符和子字段。第四十一頁,共一百零八頁,2022年,8月28日變長數據字段。010-999所有字段。其結構為:指示符1指示符2子字段標識符數據子字段標識符數據…字段分隔符第四十二頁,共一百零八頁,2022年,8月28日數據字段區(qū)劃分為10個功能塊,每個功能塊包含若干個字段。而字段標識符的第一個(最左邊)數字表示字段所屬的功能塊。第四十三頁,共一百零八頁,2022年,8月28日10大功能塊0—標識塊1—編碼信息塊2—著錄信息塊3—附注塊4—連接款目塊5—相關題名塊6—主題分析塊7—知識責任塊8—國際使用塊9—國內使用塊第四十四頁,共一百零八頁,2022年,8月28日四、記錄分隔符MARC格式規(guī)定,在每一個MZRC記錄的最后面,放置一個專門的符號以表示該MARC記錄的結束。第四十五頁,共一百零八頁,2022年,8月28日機讀目錄的編制方式聯機編制方式原始編制方式聯機聯合編制方式第四十六頁,共一百零八頁,2022年,8月28日中國機讀目錄格式使用手冊

1.1目的和范圍格式是用于中國國家書目機構同其他國家書目機構以及中國國內圖書館與情報部門之間,以標準的計算機可讀形式交換書目信息。格式在數據規(guī)范方面為書目數據庫的建立和書目數據處理提供參考或依據。第四十七頁,共一百零八頁,2022年,8月28日格式對專著、連續(xù)出版物、測繪資料、樂譜、聲像等類的機讀形式的書目記錄,規(guī)定了字段標識符指示符和子字段代碼,以及書目記錄的內容標識在各種載體上的邏輯的和物理的格式。第四十八頁,共一百零八頁,2022年,8月28日1.2關于格式內容擴充的說明格式結構將保持穩(wěn)定,今后機讀格式的變化僅限于追加有限的字段、子字段和代碼,為了使我國的機讀目錄在國際范圍內具有良好的可交換性,編制格式的主要依據是國際圖聯的UNIMARC以及我國出版物的一些特殊情況和規(guī)則的新變化。第四十九頁,共一百零八頁,2022年,8月28日1.3定義檢索點:用于檢索書目記錄的名稱,詞語和代碼。數據元素:被明確標識的最小信息單元。在可變長字段中,數據元素構成子字段,用子字段標識符標識。字段:由字段標識符標識的被定義的特定字符串,可包含一個或多個子字段。字段分隔符:位于每一個可變長字段末尾的控制符,用來區(qū)分每一個相鄰的字段。此外,還用于地址目次區(qū)的末尾。第五十頁,共一百零八頁,2022年,8月28日定長子字段:長度固定的子字段。它可包含一個或多個數據元素??捎糜诙ㄩL字段,如100字段中的$a子字段。也可用于變長字段,如200字段的$z子字段。層次等級:分配給主書目實體的一個數值。該數值標識主實體在一個預先確定的層次等級結構中所處的位置。如多卷集各卷的目錄描述和多卷集整體的目錄描述,可看作是一個屬于另一個的兩個不同層次等級。層次等級僅僅在整體及其各獨立部分均已生成書目記錄的情況下才可以使用。第五十一頁,共一百零八頁,2022年,8月28日子字段:字段內所定義的數據單位。變長字段:長度可變的字段。可包含一個或多個數據元素或子字段。其長度包括文字數據,字段指示符,子字段標識符及字段分割符。第五十二頁,共一百零八頁,2022年,8月28日2.格式結構2.1結構它對每一個用于交換的書目記錄規(guī)定了必須遵循的標準記錄結構。其標準構成為:記錄頭標:位于一條機讀記錄的開端,記載了該記錄的有關參數。記錄頭標區(qū)是為計算機處理一條記錄提供必不可少的基本參數。它由24個字符構成。其中很多元素由計算機自動生成。第五十三頁,共一百零八頁,2022年,8月28日地址目次區(qū):區(qū)內含有一個或多個目次款目和字段分隔符,目次項的長度是固定的,而地址目次區(qū)的長度則為可變的,這是由于每條記錄的字段數量不等,地址目次區(qū)所占字符數長度不定的緣故。地址目次區(qū)終止處的字段分隔符用以表示該區(qū)結束。地址目次區(qū)的用途在于供計算機準確、迅速的存取相應字段的數據。第五十四頁,共一百零八頁,2022年,8月28日數據字段區(qū):將有關文獻的數據按功能塊,字段,子字段或數據元素這三個層次組織起來。層次級別為:子字段構成字段,字段構成功能塊。《格式》的數據字段區(qū)設置了0——標識塊1——編碼信息塊2——著錄信息塊3——附注塊4——款目連接塊5——相關題名塊6——主題分析塊7——知識責任塊8——國際使用塊9——國內使用塊十個功能塊。記錄分隔符:至于每條機讀記錄的末尾,用來區(qū)分記錄的控制字符。第五十五頁,共一百零八頁,2022年,8月28日3功能模塊簡介3.10—標識塊本塊用來標識記錄或標識出版物實體上的號碼。如010國際標準書號子字段標識符子字段內容$aISBN$b限定$d獲得方式和/或價格第五十六頁,共一百零八頁,2022年,8月28日例:010##$a7-118-00249-1$b精裝$dCNY55.00010##$a7-81023-606-7$dCNY6.80(上冊);CNY9.80(下冊)第五十七頁,共一百零八頁,2022年,8月28日011國際標準連續(xù)出版物號子字段標識符子字段內容$aISSN$b限定$d獲得方式和/或價格例:011##$a0101-0064$d函索即贈011##$a0009-3947$dCNY1.00,CNY13.25(全年)第五十八頁,共一百零八頁,2022年,8月28日3.21—信息編碼塊本塊用來標識出版物的一般性數據如101作品語種子字段標識符子字段內容$a正文語種$b中間語種$c原作語種第五十九頁,共一百零八頁,2022年,8月28日例:101##$achi《周恩來選集》正文為中文101##$achi$ceng《戰(zhàn)爭與回憶》原著為英文,譯成中文101##$achi$beng$cger《希臘的神話和傳說》原著為德文,由英譯本轉譯成中文101##$achi$alat《生物學詞匯》漢語,拉丁語對照第六十頁,共一百零八頁,2022年,8月28日3.32—著錄信息塊本塊包括有關出版物形式特征的著錄項目,但附注項和標準號除外。如200題名與責任說明項子字段標識符子字段內容$a正題名$d并列題名$e其他題名信息$f第一責任者$g其他責任說明第六十一頁,共一百零八頁,2022年,8月28日例:《逸周書》源流考辨/黃懷信著200##$a《逸周書》源流考辨$f黃懷信著$9yizhoushuyuanliukaobian談《紅樓夢》,又名,紅學芻言/張畢來著200##$a談《紅樓夢》$a紅學芻言$f張畢來著

第六十二頁,共一百零八頁,2022年,8月28日備急千斤藥方;銀海精微/(唐)孫思邈撰;(宋)高保衡等校正200##$a備急千斤藥方$a銀海精微$f(唐)孫思邈撰$g(宋)高保衡等校正中華人民共和國婦女權益保障法=LawofthePeople’sRepublicofChinaontheprotectionofrightsandinterestofwomen:中英對照/全國人民代表大會通過200##$a中華人民共和國婦女權益保障法$dLawofthePeople’sRepublicofChinaontheprotectionofrightsandinterestofwomen$e中英對照$f全國人民代表大會通過$zeng第六十三頁,共一百零八頁,2022年,8月28日210出版發(fā)行項本字段含有文獻出版,發(fā)行和制作日期的信息。子字段標識符子字段內容$a出版發(fā)行地$b出版者,發(fā)行者地址等$c出版者,發(fā)行者名稱等$d出版,發(fā)行日期例:第六十四頁,共一百零八頁,2022年,8月28日210##$a[鄭州]$c中州古籍出版社$d1991.2出版地不是取自主要信息源,放在方括號內210##$a芒市[云南]$c德宏民族出版社$d[1991?]出版地不太有名,而地區(qū)名是編目員補充的,出版日期不確定.第六十五頁,共一百零八頁,2022年,8月28日3.43—附注塊本塊所設的附注是對著錄項目或檢索點做進一步陳述的信息,可涉及文獻或其內容的物理組成的各個方面.如300一般性附注本子字段對文獻及其相關紀錄的任何方面的附注$a附注內容第六十六頁,共一百零八頁,2022年,8月28日例:300##$a本書另有地圖兩頁置于書后袋中300##$a本書據北圖珍藏抄本影印301標識號附注本子段所含標識號指出現在文獻各處的任何標識號子字段$a附注內容例:301##$a“DOE/EIA-0031/2”.出現在文獻題名上的一個報告號第六十七頁,共一百零八頁,2022年,8月28日3.54—款目連接塊款目連接塊是用來明晰的解釋相關書目記錄之間的關系。這種關系可歸納為三類。(1)層次關系。如總集,分集,單冊等(2)平行關系。同一作品的不同語種或不同載體形式的記錄。(3)時間關系。如更名連續(xù)出版物的先前款目和后續(xù)款目等。第六十八頁,共一百零八頁,2022年,8月28日3.65—相關題名塊本塊含有除正題名外而又通常出現在出版物實體上的與所編文獻相關的題名。例:500##$aGenesis$n(Anglo-Saxonpoem)為題名是Genesis的Anglo-Saxon詩集的統(tǒng)一題名加上了限定,以便將其與作為圣經中的Genesis(創(chuàng)世紀)這本書區(qū)分開第六十九頁,共一百零八頁,2022年,8月28日3.76—主題分析塊本塊所標引的是文獻的主題數據,即可是詞語也可是符號,如600個人名稱主題601團體名稱主題605題名主題等。例:600##$f唐$a杜甫$x傳記($a款目要素,用于排序$f年代$x學科主題復分)

第七十頁,共一百零八頁,2022年,8月28日200##$a燕園史話601##$a北京大學$x史料601##$a徐匯天文臺$x史料題名為《徐匯天文臺記》第七十一頁,共一百零八頁,2022年,8月28日3.87—知識責任塊本塊對所編文獻負有某種責任形式的個人或團體的名稱,需要建立檢索點的知識責任入此。如700個人名稱-主要知識責任701個人名稱-次要知識責任710團體名稱-主要知識責任等。例:700##$a朱熹$f宋701$a易海秋$4主編$a趙衛(wèi)濱$4主編該出版物為二人主編第七十二頁,共一百零八頁,2022年,8月28日3.98—國際使用塊本塊包含國際上一致約定的不適于在0—至7—處理的字段第七十三頁,共一百零八頁,2022年,8月28日3.109—國內使用塊本塊是中國國內各系統(tǒng)在處理一些超出通用范圍的本單位館藏數據的字段。

第七十四頁,共一百零八頁,2022年,8月28日其它元數據METSMODSEADGILSPICSCDF第七十五頁,共一百零八頁,2022年,8月28日元數據的互操作元數據的互操作的背景元數據的層次元數據的互操作協議標準第七十六頁,共一百零八頁,2022年,8月28日整合檢索模式集中式聯合目錄聯合編目系統(tǒng)人工上傳批處理采用協議,自動收割(Harvesting)元數據,如OAI分布式聯合目錄采用標準協議實時查詢各資源站點的元數據,如Z39.50,SDLIP,OpenURL采用動態(tài)頁面分析技術,以元搜索方式實時查詢資源站點元數據。第七十七頁,共一百零八頁,2022年,8月28日互操作的現實目標整合下述資源:Abstracting/IndexingServicesPublishers(e.g.ElsevierScienceDirect)–importanttobeabletopulltogtherAggregatorsElectronicreservesLocaldatabasesincludingdigitizationprojectsOAIresourcesInstitutionalrepositories

第七十八頁,共一百零八頁,2022年,8月28日跨庫檢索系統(tǒng)用戶界面認證管理Session管理總控管理統(tǒng)一檢索入口連接器引擎API統(tǒng)一格式結果反饋檢索參數定制檢索結果保存檢索請求處理API檢索結果處理API用戶管理檢索請求處理模塊各協議連接器引擎檢索結果處理模塊HTTP連接器Z39.50連接器JDBC連接器OAI連接器Internet數據源Z39.50服務器本地數據庫OAI服務器日志管理針對特定資源的元數據結果格式轉換配置文件資源定制第七十九頁,共一百零八頁,2022年,8月28日支持跨系統(tǒng)的信息組合支持跨系統(tǒng)的服務集成第八十頁,共一百零八頁,2022年,8月28日互操作的層次不同的元數據方案具有差異性:語義差別句法差別結構差別第八十一頁,共一百零八頁,2022年,8月28日互操作層次:語義互操作句法互操作結構互操作第八十二頁,共一百零八頁,2022年,8月28日語義互操作:映射、OAI(OpenArchivesInitiativeProtocolforMetadataHarvesting)元數據互操作協議。結構互操作:RDF(資源描述框架)語法互操作:XML(可擴展標記語言)第八十三頁,共一百零八頁,2022年,8月28日Z39.50標準和協議Z39.50標準的名稱:信息檢索--應用服務定義與協議規(guī)范Z39.50協議是在分布式網絡環(huán)境下,用以支持信息搜索和信息檢索的計算機系統(tǒng)間的通信協議第八十四頁,共一百零八頁,2022年,8月28日標準所依據的相關技術基礎標準規(guī)定了數據庫管理系統(tǒng)的客戶端和服務器端對話的規(guī)則。這種規(guī)則建立在客戶機/服務器的體系結構基礎之上。數據庫客戶端和服務器端的通訊通過網絡實現。第八十五頁,共一百零八頁,2022年,8月28日Z39.50標準與協議的對應關系標準Z39.50--1988Z39.50--1992Z39.50--1995標準規(guī)范的協議Z39.50第一版Z39.50第二版Z39.50第二版和第三版第八十六頁,共一百零八頁,2022年,8月28日源端與目標端的概念Z39.50標準是按典型的客戶機/服務器體系結構定義的。在Z39.50標準術語中,客戶端計算機和服務器在通訊過程中分別被稱為“源端”(Origin)和“目標端”(Target)。使用“源端”和“目標端”代表客戶機與服務器描述數據通訊過程,是為了概念上更準確。第八十七頁,共一百零八頁,2022年,8月28日Z39.50信息檢索模型用戶界面轉換客戶端Z-server轉換數據庫數據集搜索檢索結果檢索檢索結果數據庫記錄搜索第八十八頁,共一百零八頁,2022年,8月28日根據Z39.50標準實現的圖書館管理系統(tǒng)標準數據格式及統(tǒng)一的檢索邏輯Z39.50標準接口BER編碼TCP/IP或其它協議第八十九頁,共一百零八頁,2022年,8月28日設施、服務與操作Z39.50標準規(guī)定了源端和目標端互操作的規(guī)范。這些操作抽象為設施和服務,并對其過程作出各種約定。這些設施中的服務,需要通過特定的操作指令來表達。配合這些操作指令,還約定了屬性集和記錄語法,用代碼來表示特定的操作屬性和記錄語法形態(tài)。第九十頁,共一百零八頁,2022年,8月28日Z39.50標準的主要內容設施名稱 服務名稱初始化 初始化搜索 搜索獲取 提交、分段刪除結果集 刪除瀏覽 掃描排序 排序存取控制 存取控制帳務與資源管理 資源管理、觸發(fā)資源管理、資源報告解釋 (使用搜索和獲取設施中的服務)擴展服務 擴展服務終止 關閉第九十一頁,共一百零八頁,2022年,8月28日Z39.50協議的服務與機制機制記帳/資源控制機制解釋機制擴展服務群機制終止機制機制中的服務資源控制服務、觸發(fā)資源控制服務、資源報告服務擴展服務群服務關閉服務第九十二頁,共一百零八頁,2022年,8月28日Z39.50的操作Init(初始化)Search(檢索)Present(提交)Delete(刪除)Scan(掃描)Sort(排序)Resource-report(資源報告)Extended-services(擴展服務)。Z39.50標準描述了八種操作類型:第九十三頁,共一百零八頁,2022年,8月28日關于屬性集在Z39.50標準實施中,bib-1是最主要的屬性集,包括6組屬性或屬性類型:使用屬性:指定搜索過程將要訪問的檢索點。關系屬性:指定用戶輸入的檢索詞與數據庫索引值的關系。截斷屬性:指定檢索詞在索引的哪一部分作為命中條件。完整性屬性:指定檢索詞在索引中是唯一值或非唯一值。位置屬性:指定在索引字段中與檢索詞相關的內容應出現在哪個位置。結構屬性:指定搜索的格式。第九十四頁,共一百零八頁,2022年,8月28日Z39.50的基本服務Z39.50應用程序在實現其功能的過程中,根據需要選擇這些服務。有三種服務是最基本的服務:初始化(Initialization)搜索(Search)提交(Present)在各種現有的Z39.50應用中,通常都包括了上述三種服務功能。第九十五頁,共一百零八頁,2022年,8月28日基本服務之一:初始化初始化是在任何查詢過程中的第一步。在這個服務中,源端需要:向目標端表明自己的身份與目標端約定某些后續(xù)查詢處理過程中的基本規(guī)則與目標端交換驗證信息的具體內容第九十六頁,共一百零八頁,2022年,8月28日搜索功能包括了系統(tǒng)的主要工作由源端向目標端提交查詢請求

這些查詢請求可以是非常簡單的請求,也可能是含有復雜邏輯檢索式(與、或、非、大于、小于等等)的請求。服務器端通常使用描述文件(Profiles)說明支持的服務類型和應用程序兼容性,很多描述文件還說明了哪些是本系統(tǒng)能夠支持的檢索屬性?;痉罩核阉鞯诰攀唔?,共一百零八頁,2022年,8月28日提交功能的作用是說明管理結果被返回用戶端時的形態(tài)。在提交功能中,用戶可以:指定提供記錄的數量,例如:當命中記錄較多時,只提交前十條命中的記錄。指定提供記錄的格式,例如:要求按英國機讀格式標準提交,不要按美國機讀格式標準提交?;痉罩禾峤坏诰攀隧?,共一百零八頁,2022年,8月28日OAI:OpenArchivalInitiative第九十九頁,共一百零八頁,2022年,8月28日定義OpenArchivesInitiativeProtocolforMetadataHarvesting,(OAI-PMH)簡稱OAI協議,協議的制定目的是提供具有獨立于應用程序的、可互操作的,能夠提供和促進Web上信息資源發(fā)布和共享的社區(qū)的應用框架。其主要目標為:簡化文件內容的有效傳播。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論