信息組織新課件_第1頁
信息組織新課件_第2頁
信息組織新課件_第3頁
信息組織新課件_第4頁
信息組織新課件_第5頁
已閱讀5頁,還剩387頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

我們淹沒在信息中,但是卻渴求信息。

———奈斯比特《大趨勢》1我們淹沒在信息中,但是卻渴求信息。1第二章信息組織

檢索工具以及檢索系統(tǒng)的形成

2第二章信息組織

檢索工具以及檢索系統(tǒng)的形成

2主要內(nèi)容第一節(jié)傳統(tǒng)信息組織第二節(jié)網(wǎng)絡(luò)信息組織第三節(jié)信息檢索過程以及方法3主要內(nèi)容第一節(jié)傳統(tǒng)信息組織3第一節(jié)傳統(tǒng)信息組織一、信息組織認識二、文獻著錄法三、信息檢索語言四、檢索工具的形成4第一節(jié)傳統(tǒng)信息組織一、信息組織認識4

為什么圖書館的書籍被整理的井然有序?5為什么圖書館的書籍被整理的井然有序?5圖書的整理加工工具書工作人員檢索人員(讀者)6圖書的整理加工工具書工作人員檢索人員(讀者)6圖書館等機構(gòu)是如何做的?

1、圖書的收集2、圖書的內(nèi)容著錄3、圖書的分類4、圖書的排架5、圖書館目錄的形成7圖書館等機構(gòu)是如何做的?1、圖書的收集7

實質(zhì):信息組織現(xiàn)代信息檢索的起源8實質(zhì):信息組織8自我評價并討論:對于圖書館你的了解?

從圖書館業(yè)務中去理解信息組織9自我評價并討論:對于圖書館你的了解?從圖書館業(yè)務中去理解信一、信息組織即信息序化或者信息整序,也就是利用一定的科學規(guī)則和方法,通過對信息外在特征和內(nèi)容特征的表征和序化,實現(xiàn)無序信息流到有序信息流的轉(zhuǎn)換,從而保證用戶對信息的有效獲取和利用、信息的有效流通和組合。包括:信息的收集——信息的描述——信息的標引——信息的排列——信息檢索工具的形成10一、信息組織即信息序化或者信息整序,也就是利用一定的科學規(guī)則

1、圖書的收集

購買:報刊目錄專家建議郵局書店網(wǎng)上訂購捐贈:11

1、圖書的收集

購買:報刊目錄112、文獻著錄方法(圖書的特征描述)1)定義:指按照一定的規(guī)則,對文獻外表形式、物質(zhì)形態(tài)和內(nèi)容特征進行分析、選擇和記錄的過程,是客觀描述信息和文獻的過程,其結(jié)果稱為款目。所有的款目有序排列,形成目錄。122、文獻著錄方法(圖書的特征描述)1)定義:12著錄舉例信息檢索:從手工到聯(lián)機、光盤、因特網(wǎng)/陸建平著.上海:華東師范大學出版社,2001,1256頁:圖表;26cm

ISBN

7-5617-2380-6:24.00元

I.信息….II.陸建平III

.情報檢索--教材IV.G252.713著錄舉例信息檢索:從手工到聯(lián)機、光盤、因2)著錄標準1)ISBD:InternationalStandardBiblioraphicdescription,《國際標準書目著錄》《文獻著錄總則》2)著錄項目以及著錄源題名與責任說明項、版本項、出版、發(fā)行項、載體形態(tài)項、叢編項、附注項、標準號與獲得方式項

著錄源版權(quán)頁或題名頁、封面、出版說明等處

142)著錄標準1)ISBD:International《文獻著錄總則》格式正題名=并列題名:副題名/第一責任者;其他責任者.___版次及其它版本形式.___出版發(fā)行地:出版社,出版發(fā)行年頁數(shù)或卷冊數(shù);圖;文獻尺寸或開本+附件附注說明國際標準書號;中國標準書號:獲得方式(即價格)內(nèi)容摘要或評論

I.題名II.責任者III.主題詞IV.分類號15《文獻著錄總則》格式正題名=并列題名:副題名/第一練習請對本教材進行標準著錄16練習請對本教材進行標準著錄16

3、圖書的分類G252.7/16網(wǎng)絡(luò)信息檢索科技信息檢索G文化、科學、教育、體育

G2信息與知識傳播

G25圖書館學、圖書館事業(yè)

G252讀者工作

G252.7文獻檢索

具體方法下節(jié)內(nèi)容17

3、圖書的分類G252.7/16網(wǎng)絡(luò)信息檢索科技信4、圖書的排架

了解我院圖書館書庫的排列184、圖書的排架了解我院圖書館書庫的排列185、圖書館目錄的形成目錄:通往知識海洋的鑰匙目錄的用途:查找自己需要的書籍查看圖書館藏有什么書自己要找的圖書在哪里收藏現(xiàn)在某本書的借閱情況195、圖書館目錄的形成目錄:通往知識海洋的鑰匙19二、檢索語言—語言學原理信息檢索語言是根據(jù)信息檢索的需要而創(chuàng)造的人工語言。一般又稱為情報檢索語言、信息存貯與檢索語言,索引語言,標引語言,文獻工作語言,標識系統(tǒng)等。20二、檢索語言—語言學原理信息檢索語言是根據(jù)信息檢索的需要而創(chuàng)張琪玉為代表:根據(jù)情報檢索的需要而創(chuàng)制的,專門用于各種手工的和計算機化的文獻情報存儲檢索系統(tǒng),能夠唯一地表達各種概括文獻情報內(nèi)容的概念(主題概念),能夠顯示概念之間的相互關(guān)系,并便于進行系統(tǒng)排列,便于將標引用語和檢索用語進行相符性比較的人工語言。目的、規(guī)范化、有序、人工語言21張琪玉為代表:根據(jù)情報檢索的需要而創(chuàng)制的,專門用于各種手工的蘇聯(lián)切爾內(nèi)為代表:一種專門的人工語言,用于描述(表示)文獻中心問題或主題和外表特征,以便以后在其他文獻集合中查找需要的文獻,或者用于表示情報提問的內(nèi)容和檢索需要的文獻。22蘇聯(lián)切爾內(nèi)為代表:一種專門的人工語言,用于描述(表示)文獻中檢索語言的功能(1)對文獻的信息內(nèi)容(及某些外表特征)加以標引;(2)對內(nèi)容相同、相關(guān)的信息加以集中或揭示其相關(guān)性;(3)對大量信息加以系統(tǒng)化或組織化;(4)便于將標引用語和檢索用語進行相符性比較。(5)是溝通信息的存貯和檢索兩個過程,標引人員和檢索人員雙方思想的橋梁。23檢索語言的功能(1)對文獻的信息內(nèi)容(及某些外表特征)加以標檢索語言三要素1、專用的詞匯(符號,語詞)2、有一定數(shù)量的基本詞匯(分類表)3、有一定的語法規(guī)則。24檢索語言三要素1、專用的詞匯(符號,語詞)24檢索語言的分類分類語言主題語言引文語言自然語言分類-主題一體化25檢索語言的分類分類語言25三

分類法介紹

分類語言是以號碼為基本字符,以科學分類為基礎(chǔ),即用表示文獻學科性質(zhì)的分類號來表達文獻主題概念的檢索語言。26三

分類法介紹分類語言是以號碼為基本字符,以科學著名的圖書分類法

《國際十進分類法》UDC《美國國會圖書館圖書分類法》LC《杜威十進制分類法》DDC《中國圖書館分類法》《中國人民大學圖書分類法》《中國科學院圖書分類法》27著名的圖書分類法

《國際十進分類法》UDC27《中國圖書館圖書分類法》《中圖法》由5大部類、22個大類、6個總論復分表、30多個專類復分表、4萬余條類目組成了一個完善的分類體系。。標記制度采用漢語拼音字母與阿拉伯數(shù)字相結(jié)合的混合小數(shù)層累制,以字母的順序反映大類序列,對類目的排列采用不同的字體和行、格等形式來表示類目之間的關(guān)系。28《中國圖書館圖書分類法》《中圖法》由5大部類、22個大類、6

等級列舉式分類語言,采取對文獻信息概念層層劃分,層層隸屬的辦法來形成一系列標識。按照科學體系將分類標識組織成具有隸屬、并列關(guān)系的概念登記標識系統(tǒng)。類目介紹:5大部22大類29等級列舉式分類語言,采取對文獻信息概念層層劃分,層層隸屬的C社會科學總論D政治、法律E軍事F經(jīng)濟G文教、科學、體育H語言J藝術(shù)I文學K歷史、地理

自然科學總論NRSTO數(shù)理化P天文學、地球科學Q生物科學醫(yī)藥、衛(wèi)生農(nóng)業(yè)科學工業(yè)技術(shù)U交通運輸V航空、航天X環(huán)境科學Z綜合性圖書社會科學自然科學機械、儀表建筑科學

馬列主義、毛澤東思想A馬列B哲學哲學綜合TBTDTETFTGTHTJTLTKTMTNTPTQTSTUTV一般工業(yè)技術(shù)礦業(yè)工程石油冶金工業(yè)無線電、電子學、電訊技術(shù)自動化計算化學工業(yè)輕工業(yè)、手工業(yè)金屬學武器工業(yè)動力工程原子能技術(shù)電工技術(shù)水利工程中圖法展開圖30C社會科學總論D政治、法律E軍事F經(jīng)濟G文教、科學、體育H語其它分類法介紹《人民大學圖書分類法》杜威十進分類法(DDC)美國國會圖書分類法(LC)

l

必須要記住中圖法的大類號碼l樹立針對不同的機構(gòu)采取不同分類法的觀念

31其它分類法介紹《人民大學圖書分類法》31對具體圖書索書號的認識舉例:分類號/種次號TP37/4G252.7/16網(wǎng)絡(luò)信息檢索科技信息檢索G文化、科學、教育、體育

G2信息與知識傳播

G25圖書館學、圖書館事業(yè)

G252讀者工作

G252.7文獻檢索

T工業(yè)技術(shù)

TP自動化技術(shù)、計算機技術(shù)

TP3計算技術(shù)、計算機技術(shù)

TP37多媒體技術(shù)與多媒體計算32對具體圖書索書號的認識舉例:分類號/種次號T工業(yè)技術(shù)

TP體系分類語言的優(yōu)缺點優(yōu)點便于組織排架,其它語言無此功能。按學科、專業(yè)集中文獻,符合人們的習慣,方便。缺點:無法群盡所有類目(對號入座,先組式)由于學科發(fā)展快,新增類目不好加進去,增刪困難。由于現(xiàn)代學科交叉重復,同一主題的文獻分散在不同的學科中。33體系分類語言的優(yōu)缺點優(yōu)點33討論

分析你收集的類號特點,看它們有什么優(yōu)點,并且分析有沒有什么缺點?34討論分析你收集的類號特點,看它們有什么優(yōu)點,并且分

以上類號為什么不一樣呢?35以上類號為什么不一樣呢?35分散同一主題職業(yè)道德B222.9商業(yè)工作者職業(yè)道德F718教師職業(yè)道德G451.6體育工作者道德G823文藝工作者道德I0336分散同一主題職業(yè)道德B222.936分散同一主題心理學B84軍事心理學E0教育心理學G446管理心理學C93商業(yè)、消費、市場心理學F713.56廣告心理學F713.8037分散同一主題心理學B8437分散同一主題廣告藝術(shù)J524.3廣告管理F713.82廣告學F713.80廣告設(shè)計軟件1.4138分散同一主題廣告藝術(shù)J524.338分散同一主題會計:會計學F23,工業(yè)會計F40,農(nóng)業(yè)會計F30統(tǒng)計:統(tǒng)計學C8,教育統(tǒng)計G45,貿(mào)易統(tǒng)計F712數(shù)理統(tǒng)計O212TP39計算機的應用

信息處理、數(shù)據(jù)庫及總論用電子計算機進行設(shè)計工作的著作的著作入此。

數(shù)據(jù)處理裝置入TP27機器翻譯入H085

機器檢索入G354模式識別理論入O23機器教學入G43339分散同一主題會計:會計學F23,工業(yè)會計F40,農(nóng)業(yè)會計分散同一主題電子商務F713.6電子商務網(wǎng)站設(shè)計TP393.092電子商務與現(xiàn)代物流F252電子商務與交易安全D922.29440分散同一主題電子商務F713.640討論

在資料查找中如何使用分類法?41討論在資料查找中如何使用分類法?41

用分類號表示信息需求42用分類號表示信息需求42體系分類檢索語言在信息檢索時使用的步驟如下:(1)分析信息需求的主題內(nèi)容,確定其所用學科和大類(2)按學科大類號查找簡表,得其二級或三級類號;(3)按所知二級或三級類號查詳表中的相應類目,進一步得到符合該信息主題內(nèi)容的確切類號;4)按所得確切類號查找檢索工具,則會獲得該類主題內(nèi)容的大量信息資料,再篩選取舍。值得說明的是,在實際檢索中,由于檢索工具所采用的分類法不盡相同,因此,往往是先選定檢索工具,明確其所用分類法的類型,然后分析信息需求的內(nèi)容,從而獲得所需的文獻信息資料。因此,在運用分類檢索語言的時候,要根據(jù)檢索工具的分類體系和特點,按其分類規(guī)律靈活運用,方可精一通百,運用自如。43體系分類檢索語言在信息檢索時使用的步驟如下:(1)分析信息需實例分析

電子商務安全研究

44實例分析電子商務安全研究44電子商務安全涉及學科分析電子商務F713.6法律D9計算機安全TP309計算機網(wǎng)絡(luò)安全TP393.08商業(yè)道德F745電子商務安全涉及學科分析電子商務F713.645討論確定你的研究課題,并且分析它所涉及到的學科46討論類號查找/library/ztflf/search.asp47類號查找/li中國數(shù)理科學文獻數(shù)據(jù)庫電子版文獻標引系統(tǒng)12/shuliku/index.asp/shuliku/sitetenet.htm本站為國家科學數(shù)字圖書館科學文獻數(shù)據(jù)庫主題詞標引的專業(yè)信息網(wǎng)站,關(guān)鍵詞“主題詞、主題標引、標引、分類、數(shù)理科學”。48中國數(shù)理科學文獻數(shù)據(jù)庫電子版文獻標引系統(tǒng)http://15912/shuliku/index.asp分類法入口4912/shuliku輸入要查詢的內(nèi)容50輸入要查詢的內(nèi)容5051515252可以直接輸入分類號53可以直接輸入分類號53課后關(guān)注準備54課后關(guān)注準備54課后作業(yè)2.1一、寫出如下類號的名稱1、C931.62、B8483、G354.44、A7115、TP3166、H317、F760.58、J524.49、K8110、Z812/shuliku/index.asp中國數(shù)理科學文獻數(shù)據(jù)庫電子版文獻標引系統(tǒng)(分類)55課后作業(yè)2.1一、寫出如下類號的名稱55課后作業(yè)2.1二、類分如下圖書(要求到一級類目即可)1、現(xiàn)代信息檢索技術(shù)2、英語四、六級語法練習3、電子商務教程4、Flash動畫制作5、計算機百科全書6、毛澤東傳記7、中國百科全書8、網(wǎng)絡(luò)媒體概論9、中國國畫教程10、SQLserver數(shù)據(jù)庫開發(fā)實例56課后作業(yè)2.1二、類分如下圖書(要求到一級類目即可)56網(wǎng)絡(luò)信息分類中存在的問題分類體系不嚴密。一些搜索引擎在劃分類目時,并未真正從知識領(lǐng)域、知識體系的角度來分類,而僅僅從商業(yè)角度考慮,因而使得分類體系漏掉了許多重要的知識領(lǐng)域,體系的系統(tǒng)性和完整性受到很大的影響。如雅虎中國(Yahoo!)的基本大類中沒有設(shè)置工業(yè)類、農(nóng)業(yè)類等基礎(chǔ)性類目,而把它們作為二級類目、三級類目,或是分散到其它類目57網(wǎng)絡(luò)信息分類中存在的問題分類體系不嚴密。一些搜索引擎在劃分類類目之間缺乏邏輯性,隸屬關(guān)系混亂。部分中文搜索引擎分類體系的類目之間缺乏邏輯性,類目歸屬關(guān)系不盡合理。表現(xiàn)在某些上、下位類之間隸屬關(guān)系模糊,缺乏合理的知識聯(lián)系。如“東方網(wǎng)景”把教育列于自然科學類下,“網(wǎng)易”在文學類下列出入文歷史和宗教等58類目之間缺乏邏輯性,隸屬關(guān)系混亂。部分中文搜索引擎分類體系的類目名稱不規(guī)范。主要表現(xiàn)為類名不統(tǒng)一,類名用語不準確,類名不能確切概括類目的內(nèi)涵。如搜狐稱“計算機與互聯(lián)網(wǎng)”,中文雅虎稱“電腦與因特網(wǎng)”,網(wǎng)易中熱門查詢的“另類”等。類目劃分標準模糊。由于類目設(shè)置采用多元標準劃分,一些類下往往使用兩個或多個分類標準,有的甚至在同一層次上列出不同等級的類目,致使同位類設(shè)置顯得混亂。59類目名稱不規(guī)范。主要表現(xiàn)為類名不統(tǒng)一,類名用語不準確,類名不6060分類法在網(wǎng)絡(luò)信息組織中的應用(YAHOO)分類搜索61分類法在網(wǎng)絡(luò)信息組織中的應用(YAHOO)分類搜索612008.3.23622008.3.23626363SOHUYAHOO分類數(shù)目1814分類比較相同分類教育社會與文化社會科學新聞與媒體不同的分類工商經(jīng)濟商業(yè)與經(jīng)濟科學與技術(shù)科學地區(qū)區(qū)域計算機與互聯(lián)網(wǎng)電腦與因特網(wǎng)綜合參考參考資料衛(wèi)生與健康健康與醫(yī)藥藝術(shù)藝術(shù)與人文娛樂休閑休閑與運動娛樂YAHOO特有政府與政治64SOHUYAHOO分類數(shù)目1814分類比較相四、主題語言主題語言是指以自然語言的語詞為字符,以名詞術(shù)語為基本詞匯,用一組名詞術(shù)語作為檢索標識的一類檢索語言。以主題語言來描述和表達信息內(nèi)容的信息處理方法稱為主題法。主題語言又可分為標題詞、元詞、敘詞、關(guān)鍵詞。主題檢索語言的主要特征是以語詞為概念標識,標識詞按字順排列,按照文獻所論述的事物來聚集文獻,并用“參照系統(tǒng)”等方法輔助顯示概念之間的相互關(guān)系。

65四、主題語言主題語言是指以自然語言的語詞為字符,以名詞術(shù)語為舉例美國國會標題表(LCSH)美國醫(yī)學標題詞表(MeSH)《中國漢語主題詞表》《中國公文主題詞表》66舉例美國國會標題表(LCSH)66《漢語主題詞表》《漢語主題詞表》由中國科技信息研究所和北京圖書館主持編輯,是我國第一部大型綜合性敘詞表?!稘h語主題詞表》作為一部大型綜合性科技檢索工具,收詞范圍包括自然科學、醫(yī)學、農(nóng)業(yè)、工程技術(shù)等各學科領(lǐng)域的主要名詞術(shù)語,共收錄主題詞81,198條,其中正式主題詞68,823條,非正式主題詞12,375條。它是主題標引、檢索和組織目錄、索引的主要工具。

67《漢語主題詞表》《漢語主題詞表》由中國科技信息研究所《漢語主題詞表》《漢語主題詞表》分3卷10冊:第一卷(2冊)為社會科學部分,第二卷(7冊)為自然科學部分,兩部分均包括字順主表、范疇索引、詞族索引和英漢對照索引,第三卷為附表,包括世界各國政區(qū)名稱、自然地理區(qū)劃名稱、組織機構(gòu)名稱及人物名稱68《漢語主題詞表》《漢語主題詞表》分3卷10冊:第一卷(2冊)

正式敘詞與非正式敘詞款目結(jié)構(gòu)

shoufakaiguanguan

收發(fā)開關(guān)管[56CD]Transmitreceivetubes

D放電器

收發(fā)管

F放電管

寬頻帶開關(guān)管

窄頻帶開關(guān)管

S充氣管

Z電子管*

C反收發(fā)開關(guān)管shoufaguan

收發(fā)管[56CD]Transmit-receivetubes

Y收發(fā)開關(guān)管

6969Bianjixiaoyongxuepai

邊際效用學派

05DB

Marginalutilityschool

D

邊際學派

邊際主義

F

奧地利學派

劍橋?qū)W派

洛桑學派

數(shù)理學派

S

庸俗資產(chǎn)階級政治經(jīng)濟學

經(jīng)濟學派*

Z

政治經(jīng)濟學

C

費邊社會主義

凱恩斯主義

瑞典學派

新古典學派

新劍橋?qū)W派

Bianjixuepai

邊際學派

05DB

Marginalschool

Y

邊際效用學派

70Bianjixiaoyongxuepai

Xianxiangguan顯像管[E56]

D電視顯像管

監(jiān)視管

F彩色顯像管

固體顯像管

黑白顯像管

S電子束管

Z電子管

C顯示管

指示管

71Xianxia7272符號

簡稱參照項名稱英文(全稱)作用Y用

用項Use(Use)指引相應的正式主題詞D代代項UF(Usefor)指引非正式主題詞F分分項NT(NarrowTerms)指引所含的下位主詞

S屬屬項BT(BroadTerms)指引所從屬的上位主題詞C參

參照RT(RelatedTerms指引有語義關(guān)系的相關(guān)詞Z族族項TT(TopTerms)指引所從屬的族首詞73符號簡稱參照項名稱英文(全稱)作用Y用用項Use(Us(1)詞族索引又稱詞族表或族系索引,是從詞族角度查詞或選詞的重要工具。它把主表中具有族性語義關(guān)系的全部敘詞按其本質(zhì)屬性逐級展開,全面顯示。所有詞族按族首詞(能概括一族敘詞的外延最大、等級最高的敘詞)字順排列。這就賦予了敘詞表以結(jié)構(gòu)化的特性,提高了敘詞法的系統(tǒng)性,滿足人們?nèi)孢x詞和擴檢或縮檢的需要。詞族索引款目結(jié)構(gòu)如下

74(1)詞族索引又稱詞族表或族系索引,是從詞族角度查詞或選詞的舉例

chudengshuxue

初等數(shù)學

*

·初等代數(shù)

·初等幾何

··立體幾何··平面幾何

·三角

··球面三角

·算術(shù)75舉例chudengshuxue75(2)范疇索引又稱范疇表、分類索引。它采用三級分類制體系,數(shù)字與字母混合的號碼標記制度,把主表中全部敘詞按學科分類排列,從而滿足人們從學科入手查詞的需要,提高了敘詞法的系統(tǒng)性。但范疇表只是借鑒了分類法,它不同于一般的分類表。因為它的分類對象是詞匯,范疇設(shè)立完全根據(jù)敘詞的實際情況,而不受學科體系和從屬派生關(guān)系的約束。例如:

76(2)范疇索引又稱范疇表、分類索引。76舉例45生物科學45R人類學45RA古人類學

阿特拉猿人

Y毛里坦直立人

北京猿人

Y北京直立人

北京直立人77舉例45生物科學77(3)英漢對照索引由敘詞的英文名稱和漢語名組成,按英文名稱字母順序排列。它提供從英文名查找敘詞的檢索途徑。

Airdrag

空氣阻力

Y大氣阻力

Airdrilling

空氣鉆進

Airdrills

風鉆78(3)英漢對照索引由敘詞的英文名稱和漢語名組成,按英文名稱字使用注意《漢表》是文獻檢索的重要輔助工具,使用時要注意從多角度查詞,要充分利用輔助表。當查不到與某個具體概念相對應的專指敘詞時,可以把該概念分解為幾個較一般的概念(外延相對寬的),然后再去查表。79使用注意79(3)敘詞檢索語言的使用

①明確信息檢索的主題內(nèi)容,選擇適合該檢索內(nèi)容的檢索系統(tǒng)或工具;②索取用于該檢索工具或系統(tǒng)的敘詞表并掌握其使用方法;③對信息需求進行主題分析。在分析信息主題類型和主題結(jié)構(gòu)的基礎(chǔ)上,對具有檢索意義的主題概念進行提煉和取舍;④查對敘詞表,將析出的主題概念轉(zhuǎn)化為規(guī)范化的主題詞,即敘詞;⑤按檢索工具或檢索系統(tǒng)的檢索規(guī)則,形成檢索式進行檢索,從而獲取所需文獻信息。80(3)敘詞檢索語言的使用

①明確信息檢索的主題內(nèi)容主題標引規(guī)則以及舉例總原則:正式主題詞主題標引舉例

/hanyucibiao/cibiao.asp

81主題標引規(guī)則以及舉例總原則:正式主題詞818282舉例(比較)“信息化提升企業(yè)競爭力”

F270.7計算機應用-企業(yè)管理物流企業(yè)核心競爭力”

F259.23物資企業(yè)-企業(yè)管理-中國83舉例(比較)“信息化提升企業(yè)競爭力”83課后關(guān)注

主題法在網(wǎng)絡(luò)信息組織中的進一步完善84課后關(guān)注主題法在網(wǎng)絡(luò)信息組織中的進一步完善84討論

分類語言與主題語言的區(qū)別

基本思想符號檢索特性修改,增加計算機檢索85討論

分類語言與主題語言的區(qū)別

基本思想85作業(yè)2.1類分如下圖書(要求到一級類目即可)1、網(wǎng)絡(luò)信息檢索原理與技術(shù)2、英語四、六級試題3、電子商務教程4、網(wǎng)頁設(shè)計新浪潮5、安徒生童話6、鄧小平傳記7、中國百科全書8、網(wǎng)絡(luò)媒體概論9、中國民族聲樂教程10、VISUALFOXPRO數(shù)據(jù)庫開發(fā)實例86作業(yè)2.1類分如下圖書(要求到一級類目即可)86關(guān)鍵詞語言

直接從題名、文摘、正文中抽取能反映文獻信息的語詞——關(guān)鍵詞。不用編制受控制表,不進行詞匯控制,不顯示詞間關(guān)系,保留一個詞的上、下文有助于解釋或限定其含義,從而消除一詞多義對檢索的影響,并提高標引的專指度。為了增加檢索入口,并進行輪排形成字順排序體系。

87關(guān)鍵詞語言

直接從題名、文摘、正文中抽取能反映引文檢索語言(教材)什么是引文?引文檢索的原理?引文檢索的特點?網(wǎng)絡(luò)搜索引擎中應用的典型例子?解決的問題88引文檢索語言(教材)什么是引文?解決的問題881、什么是引文?引文檢索語言是一種新型的信息檢索語言,它是利用文獻之間的相互引證關(guān)系而建立的一種自然語言,其標引詞來自文獻的主要著錄項目。假如A在文中引用了B的文獻,則稱B是A的引文,由于A引用了B的文獻,所以B也叫“被引文獻”,由于是通過A引出B的,所以A也叫“來源文獻”,或者是“引證文獻”。891、什么是引文?引文檢索語言是一種新型的信息檢索語言,它是利2、引文思想以及原理傳統(tǒng)情報檢索理論中的引文分析方法認為:一篇學術(shù)論文的重要性和質(zhì)量可以通過其他學術(shù)論文對它引用的數(shù)量來衡量,如果被其他學術(shù)論文引用得越多,那么這篇文章就顯得越重要。902、引文思想以及原理傳統(tǒng)情報檢索理論中的引文分析方法認為:一

(一)引文檢索語言的產(chǎn)生和形成1、1873年美國出版一種稱作《謝波德引文》的“法律案例索引”。2、20世紀50年代,美國人E.加菲爾德對這種索引法進行了較深入的研究,并編制了一種專利索引,證明“引文法”的實用性和可行性。91

(一)引文檢索語言的產(chǎn)生和形成1、1873年美國出版一種稱SCI3、直到1963年美國《科學引文索引》編輯出版,報道了1961年內(nèi)出版的613種重要科學期刊發(fā)表的文獻113318篇,及其引證的1370000篇文獻間的相互引證關(guān)系,從而獲得巨大成功,也使得《科學引文索引,SCI》成為世界上最主要的檢索工具之一。

92SCI3、直到1963年美國《科學引文索引》編輯出版,報道了(二)引文檢索語言的特點.其主要檢索標識為被引文獻的著者姓名。著者姓名不僅是文獻的外形特征,說明某文獻由某人撰寫,而且從一定意義上說也是文獻的內(nèi)容特性,即著者姓名也能夠說明文獻的學科屬性。如某人因在某方面的成就而享譽該領(lǐng)域,或者因其特殊的貢獻,以其發(fā)明、創(chuàng)造等命名,故出現(xiàn)了一些行業(yè)中的人名代學科、專業(yè)的現(xiàn)象,因此,著者姓名作為一種檢索標識在西方圖書信息界已較普遍。

93(二)引文檢索語言的特點93(三)引文索引的組成部分

引文索引由三個來源相同的部分組成,但它們具有不同的排列方式。1.引文索引。列出一段時間發(fā)表文獻的全部被引文獻,按被引文獻的第一著者排列,其下按時間先后列出各被引文獻的出處,包括年份、刊名、卷次、頁次等,再在各條被引文獻之下依次列出引證過它的全部文獻。引證款目以第一著者姓名的字順排列,再列引證文獻的出處,包括刊名、卷次、頁次、年份等。在引證文獻和被引文獻的出處部分均不列出篇名。

94(三)引文索引的組成部分

引文索引由三個來源相同的部分組成,(三)引文索引的組成部分2.來源索引。是引文索引最基本的部分,因為從另兩部分初步查到的線索都要到此部分從篇名上加以核實。這一特點使其類似傳統(tǒng)檢索工具中正文部分的作用。來源索引按引證著者姓名的字順排,每個款目可包括姓名、文種代號、篇名、刊名、卷次、期次、頁號和發(fā)表年份。此外,還列出參考文獻的數(shù)量和第一著者的聯(lián)系地址。3.輪排主題索引。按照文獻篇名的主題詞輪排。

95(三)引文索引的組成部分2.來源索引。是引文索引最基本的部分基本格式被引文獻的著者被引文獻的刊名,卷,期引用文獻的著者引用文獻的刊名,卷,期96基本格式被引文獻的著者96舉例:張三信息檢索<計算機應用>2005,3,41王五<情報檢索>2006,3王六<大學圖書館學報>張四基于語義的信息組織方式〈情報技術(shù)〉2003,4,89

李軍。。。。97舉例:張三97①REICHENSPURNER,H

②1996

ANNTHORACSURG

62

1467

③RIISEGC

④EURRESPJ 14 1123 99

③WAGNERFM

④ANNTHORAC 68 2033 99

②1999

JTHORACCARDIOVASC

1

11

③BARRACLO,BH

④MEDJAUST 172 33 00

⑤E98①REICHENSPURNER,H 98《SCI》引文索引的著錄格式說明說明:①被引文獻的作者;②被引文獻的出版年、發(fā)表的期刊(縮寫刊名)、卷、頁碼;③引用文獻的作者;④引用文獻發(fā)表的期刊(縮寫刊名)、卷、頁碼、出版年;⑤引用文獻類型代碼:B書評、C更正或勘誤、D會議論文、E社論、I傳記、K編年表、L通訊或快報、M會議摘要、N技術(shù)札記、R評論和專題目錄、W對計算機軟硬件或數(shù)據(jù)庫等的評論,無代碼者為期刊論文或科技報告。99《SCI》引文索引的著錄格式說明說明:①被引文獻的作者;②引文原理在搜索引擎中的應用PageRank是Google用來測度網(wǎng)頁“重要性”的方法。Google利用PageRank來調(diào)整搜索結(jié)果以使得那些更為“重要的”網(wǎng)頁在用戶的搜索結(jié)果頁中的排名獲得相應的提升。PageRank出現(xiàn)以前,網(wǎng)絡(luò)搜索引擎的排序算法大多是基于詞頻統(tǒng)計的,詞權(quán)的計算一般把該詞在HTML網(wǎng)頁中出現(xiàn)的位置也考慮進來。100引文原理在搜索引擎中的應用PageRank是Google用來PageRank算法把引文分析思想借鑒到確定網(wǎng)絡(luò)文檔重要性的計算中來,利用網(wǎng)絡(luò)自身的超鏈接結(jié)構(gòu)給所有網(wǎng)頁確定一個標志網(wǎng)頁重要性的等級數(shù)。即網(wǎng)頁的重要性可以通過其他網(wǎng)頁對其超鏈接的數(shù)量來衡量。當從網(wǎng)頁A鏈接到網(wǎng)頁B時,就認為“網(wǎng)頁A投了網(wǎng)頁B一票”,從而增加了網(wǎng)頁B的重要性。直觀來講,如果網(wǎng)頁A被1000個網(wǎng)頁鏈接,而網(wǎng)頁B僅被10個網(wǎng)頁鏈接,那么網(wǎng)頁A顯然就要比網(wǎng)頁B重要。101PageRank算法把引文分析思想借鑒到確定網(wǎng)絡(luò)文檔重要性的

假設(shè)網(wǎng)頁A被網(wǎng)頁T1,…,Tn所指向;PR(A)表示網(wǎng)頁A的PageRank值;?PR(Ti){i∈[1,n]}表示網(wǎng)頁Ti的PageRank值;?C(Ti){i∈[1,n]}表示網(wǎng)頁Ti的導出鏈接的數(shù)目。?d是取值在[0,1]之間的阻尼因子,是為了減少網(wǎng)頁T1,…,Tn對網(wǎng)頁A的PageRank的貢獻,常令d=0.85。由公式(2)可以看出,影響網(wǎng)頁A的PageRank值的因素有3個:網(wǎng)頁A的導入鏈接的數(shù)量;網(wǎng)頁Ti{i∈[1,n]}的PageRank值;網(wǎng)頁Ti{i∈[1,n]}的導出鏈接的數(shù)量C(Ti){i∈[1,n]}。102假設(shè)網(wǎng)頁A被網(wǎng)頁T1,…,Tn所指向;102檢索語言的發(fā)展趨勢-自然語言初步討論:自然語言檢索的優(yōu)點、缺點(相對與我們所說的主題語言)103檢索語言的發(fā)展趨勢-自然語言103作業(yè)3.2(課題準備)選擇一個你所感興趣的論題確定你的論題的分類號寫出你的論題的主題詞(關(guān)鍵詞)例如:“信息化提升企業(yè)競爭力”

F270.7計算機應用-企業(yè)管理“物流企業(yè)核心競爭力”

F259.23物資企業(yè)-企業(yè)管理-中國104作業(yè)3.2(課題準備)選擇一個你所感興趣的論題104舉例“防火墻與網(wǎng)絡(luò)安全”

TP393.08計算機網(wǎng)絡(luò)-安全技術(shù)“無線網(wǎng)絡(luò)的安全”

TN92無線電通信

--

通信網(wǎng)

--

安全技術(shù)105舉例“防火墻與網(wǎng)絡(luò)安全”TP393.0810思考如何將傳統(tǒng)檢索語言應用到網(wǎng)絡(luò)信息組織中去?106思考如何將傳統(tǒng)檢索語言應用到網(wǎng)絡(luò)信息組織中去?106四、信息的序化以及檢索工具的形成

信息組織問題我們已經(jīng)完成了哪些方面的討論?107四、信息的序化以及檢索工具的形成信息組織問題我們已經(jīng)完1、檢索工具的形成將文獻描述體和文獻標識按照一定的方式組織起來,就形成了文獻的檢索工具。傳統(tǒng)信息組織有哪些著錄項目和標識?1081、檢索工具的形成將文獻描述體和文獻標識按照一定工具的組成

文獻庫(描述體)文獻索引(某種標識)有序排列檢索途徑檢索工具109工具的組成傳統(tǒng)工具與計算機系統(tǒng)的不同名稱文獻庫文獻庫索引文獻描述體手工工具正文輔助索引文摘、題錄計算機系統(tǒng)主文檔(順排擋)倒排檔文摘、題錄、記錄110傳統(tǒng)工具與計算機系統(tǒng)的不同名稱文獻庫文獻庫索引文獻描述體手工檢索工具的類型和特點文獻檢索工具的類型及特點、結(jié)構(gòu)。事實與數(shù)據(jù)檢索工具類型及結(jié)構(gòu)。解決的問題111檢索工具的類型和特點文獻檢索工具的類型及特點、結(jié)構(gòu)。解決的問如何排列著錄項目(排檢法)

排列的根據(jù)各種著錄項目的特征112如何排列著錄項目(排檢法)排列的根據(jù)各種著錄項目的特征112排檢法

形序排檢法

部首法,540部(康熙字典)214部(新辭海)字順法

筆畫筆形法:《中國人名大辭典》

韻部排檢法:《辭通》音序排檢法注音字母法:《新華字典》(1956)漢語拼音音序法(IUV)<百科全書>類序法學科分類法主題法:《漢語主題詞表》《EI》《Medline》時序法:《中國歷史紀年表》《中國大事記》地序法:《中國地方志縱錄》《歷代地理沿革表》113排檢法形序排檢法部首法,540部(康熙字2、檢索途徑內(nèi)容特征的檢索途徑:分類主題外表特征的檢索途徑:著者題名序號引文其他途徑:時間、國家、出版類型,地區(qū)1142、檢索途徑內(nèi)容特征的檢索途徑:分類114分類途徑分類途徑是指按照文獻資料所屬學科(專業(yè))類別進行檢索的途徑,它所依據(jù)的是檢索工具中的分類索引。

分類途徑檢索文獻關(guān)鍵在于正確理解檢索工具的分類表,將待查項目劃分到相應的類目中去。一些檢索工具如《中文科技資料目錄》是按分類編排的,可以按照分類進行查找。115分類途徑分類途徑是指按照文獻資料所屬學科(專業(yè))類別進行主題途徑主題途徑是指通過文獻資料的內(nèi)容主題進行檢索的途徑,它依據(jù)的是各種主題索引或關(guān)鍵詞索引,檢索者只要根據(jù)項目確定檢索詞(主題詞或關(guān)鍵詞),便可以實施檢索。

主題途徑檢索文獻關(guān)鍵在于分析項目、提煉主題概念,運用詞語來表達主題概念。主題途徑是一種主要的檢索途徑。116主題途徑主題途徑是指通過文獻資料的內(nèi)容主題進行檢索的途著者途徑著者途徑是指根據(jù)已知文獻著者來查找文獻的途徑,它依據(jù)的是著者索引,包括個人著者索引和機關(guān)團體索引。117著者途徑著者途徑是指根據(jù)已知文獻著者來查找文獻的途徑,它題名途徑按照文獻的書名、篇名、刊名等來形成檢索途徑引文途徑按照引用與被應用的關(guān)系,提供的檢索途徑。按照文章后面所提供的參考文獻來檢索。118題名途徑118思考與關(guān)注傳統(tǒng)信息組織的方法是否會對網(wǎng)絡(luò)信息組織有借鑒之處?119思考與關(guān)注傳統(tǒng)信息組織的方法是否會對網(wǎng)絡(luò)信息組織有借鑒之處?第二節(jié)網(wǎng)絡(luò)信息組織

一、網(wǎng)絡(luò)信息組織認識二、DC描述法三、MARC描述法四、傳統(tǒng)檢索語言在網(wǎng)絡(luò)信息組織中的應用討論。120第二節(jié)網(wǎng)絡(luò)信息組織

120一、網(wǎng)絡(luò)信息組織認識1、網(wǎng)絡(luò)信息組織的內(nèi)容網(wǎng)絡(luò)信息組織是對網(wǎng)絡(luò)中的節(jié)點(服務器)以及節(jié)點中的各種格式的文件和數(shù)據(jù)庫的各個信息單元(如數(shù)據(jù)項)所進行的組織。

特定網(wǎng)絡(luò)服務器中的具體信息對整個網(wǎng)絡(luò)信息(網(wǎng)站集合)的組織121一、網(wǎng)絡(luò)信息組織認識1、網(wǎng)絡(luò)信息組織的內(nèi)容特定網(wǎng)絡(luò)服務器中的2、網(wǎng)絡(luò)信息組織的過程網(wǎng)絡(luò)信息資源組織是指采用一定的方法與模式,按照一定的原則將因特網(wǎng)上某一領(lǐng)域大量的、分散的、雜亂無章的、良莠不齊的信息通過搜索、評價、篩選、分析、標引、著錄、排序、存貯等手段加工處理,使其形成一個有序的,便于用戶獲取與利用的信息系統(tǒng)的過程。1222、網(wǎng)絡(luò)信息組織的過程網(wǎng)絡(luò)信息資源組織是指采3、組織的目的建立有序的信息空間,便于用戶獲取與利用信息有利于用戶理解、判斷與吸收信息獲得知識,1233、組織的目的建立有序的信息空間,便于用戶獲取與利用信息124、網(wǎng)絡(luò)信息資源的組織形式文件組織形式主題樹組織形式數(shù)據(jù)庫超媒體搜索引擎書目控制方式1244、網(wǎng)絡(luò)信息資源的組織形式文件組織形式1244、網(wǎng)絡(luò)信息資源的組織形式1文件組織方式:以文件為單位共享和傳輸信息。以文件方式組織網(wǎng)絡(luò)信息資源簡單方便,但隨著網(wǎng)絡(luò)信息資源利用的不斷普及和信息量的不斷增多,以文件為單位共享和傳輸信息會使網(wǎng)絡(luò)負載越來越大;而且當信息結(jié)構(gòu)較為復雜時,文件系統(tǒng)難以實現(xiàn)有效的控制和管理。因此,文件方式只能是組織網(wǎng)絡(luò)信息資源的輔助形式。1254、網(wǎng)絡(luò)信息資源的組織形式1文件組織方式:以文件為單位共享2主題樹組織方式指將所有獲得的信息資源按照某種事先確定的體系結(jié)構(gòu),分門別類地加以組織,用戶通過瀏覽的方式逐層進行選擇,層層遍歷,直到找到所需要的信息資源如:搜索引擎的分類目錄檢索方式1262主題樹組織方式指將所有獲得的信息資源按照某種事先確定的體3數(shù)據(jù)庫組織方式指將所有獲得的信息資源按照固定的記錄格式存儲,用于網(wǎng)絡(luò)信息資源的組織。

數(shù)據(jù)庫記錄:文檔標題、摘要、關(guān)鍵詞URL、文件大小、語種、詞的出現(xiàn)頻率以及位置。1273數(shù)據(jù)庫組織方式指將所有獲得的信息資源按照固定的記錄格式存4超媒體組織方式就是將超文本與多媒體技術(shù)結(jié)合起來。它將文字、表格、聲音、圖像、視頻等多媒體信息以超文本方式組織起來,使人們可以通過高度鏈接的網(wǎng)絡(luò)結(jié)構(gòu)在各種信息庫自由航行,找到所需要的信息。這種方式符合人們思維聯(lián)想和跳躍的習慣,加上通過瀏覽的方式搜尋所需信息,避免了檢索語言的復雜性。但當超媒體網(wǎng)絡(luò)過于龐大時,就難以避免地會造成用戶“迷航”的現(xiàn)象。1284超媒體組織方式就是將超文本與多媒體技術(shù)結(jié)合起來。5、搜索引擎方式搜索引擎通過大量的網(wǎng)絡(luò)資源的搜集,利用相關(guān)的數(shù)據(jù)庫,提供給用戶快速查找網(wǎng)絡(luò)上相關(guān)資源的工具。如:搜索引擎的關(guān)鍵詞搜索方式。

1295、搜索引擎方式搜索引擎通過大量的網(wǎng)絡(luò)資源的搜集,利6、書目控制方式圖書情報機構(gòu)的相關(guān)工作者利用傳統(tǒng)的信息組織方式,將相關(guān)的信息內(nèi)容通過互聯(lián)網(wǎng)提供給用戶進行使用。比如:OPAC1306、書目控制方式圖書情報機構(gòu)的相關(guān)工作者5、網(wǎng)絡(luò)信息的收集一)人工收集二)自動收集1315、網(wǎng)絡(luò)信息的收集一)人工收集131二、描述:MARC(P27)MARC是用于描述、存儲、交換、控制和檢索的一套機讀書目數(shù)據(jù)標準。它開始主要針對印刷型書本的描述,隨著856字段的引入,USMARC也逐步被用來對電子資源進行描述。它的數(shù)據(jù)結(jié)構(gòu)嚴密,能很好地描述電子信息,尤其是在檢索點的選取原則上,能確保其數(shù)據(jù)元素組成具有統(tǒng)一性,有利于資源交換。此外,這種經(jīng)過編目人員過濾、篩選過的信息,確保了數(shù)據(jù)描述的可靠性、完全性和精確性。132二、描述:MARC(P27)133133134134MARC的組成135MARC的組成135856電子資源定位與檢索“電子位置和存取”(ElectronicLocationandAccess)。856字段的內(nèi)容有:存取方式(如電子函件、FTP、遠程登錄、Gopher或HTTP)、主機名稱、路徑、文檔名稱或其它可以協(xié)助用戶通過網(wǎng)絡(luò)獲取電子信息的方法等。1993年1月此議案經(jīng)修正獲得通過,目前已成為美國機讀編目格式(USMARC)中的正式字段。136856電子資源定位與檢索“電子位置和存取”(Electro856電子資源定位與檢索“電子位置和存取”(ElectronicLocationandAccess)。856字段的內(nèi)容有:存取方式(如電子函件、FTP、遠程登錄、Gopher或HTTP)、主機名稱、路徑、文檔名稱或其它可以協(xié)助用戶通過網(wǎng)絡(luò)獲取電子信息的方法等。1993年1月此議案經(jīng)修正獲得通過,目前已成為美國機讀編目格式(USMARC)中的正式字段。137856電子資源定位與檢索“電子位置和存取”(Electro856電子資源定位與檢索

字段號指示符子字段定義必備性重復性12856

電子資源定位與檢索有則必備可

#

無信息提供

0

電子郵件

1

文件傳輸協(xié)議

2

遠程登錄

3

撥號入網(wǎng)

4

超文本傳輸協(xié)議

7

檢索方法在$y說明

138856電子資源定位與檢索必備性重復性12856

電子856字子段

$a主機名稱有則必備可

$b檢索號碼有則必備可

$c文件壓縮信息有則必備可

$c路徑有則必備可

$e最近一次查詢與檢索的日期與時間有則必備否

$f電子文件名稱有則必備可

$g統(tǒng)一資源名稱有則必備可

$h(信息)請求處理者有則必備否

$I指令自選可

$j每秒傳輸?shù)亩M制位(BPS)有則必備否

$k口令有則必備否

$l登錄有則必備否

$m協(xié)助檢索的聯(lián)系信息自選可

$n子字段$a指定的主機地址名稱有則必備否

$o操作系統(tǒng)有則必備否

$p端口有則必備否

$q電子格式類型有則必備否139856字子段

$a主機名稱有則必備可

$b檢索號碼856字子段

$r設(shè)置有則必備否

$s文件大小自選可

$t終端仿真有則必備可

$u統(tǒng)一資源定位地址(URL地址)有則必備否

$v可檢索時間有則必備可

$w記錄控制號自選可

$x非公用附注自選可

$y檢索方法有則必備否

$z公用附注自選可140856字子段

$r設(shè)置有則必備否

$s文件大小自選四、數(shù)據(jù)的描述標準——元數(shù)據(jù)1、概念Dataaboutdata關(guān)于數(shù)據(jù)的數(shù)據(jù).提供關(guān)于信息資源或數(shù)據(jù)的一種結(jié)構(gòu)化的數(shù)據(jù),是對信息資源的結(jié)構(gòu)化的描述。其作用為:描述信息資源或數(shù)據(jù)本身的特征和屬性,規(guī)定數(shù)字化信息的組織,具有定位、發(fā)現(xiàn)、證明、評估,選擇等功能。141四、數(shù)據(jù)的描述標準——元數(shù)據(jù)1、概念1412、Metadata的應用目的1)確認和檢索(Discoveryandentification),主要致力于如何幫助人們檢索和確認所需要的資源,數(shù)據(jù)元素往往限于作者、標題、主題、位置等簡單信息,DublinCore是其典型代表。

(2)著錄描述(Cataloging),用于對數(shù)據(jù)單元進行詳細、全面的著錄描述,數(shù)據(jù)元素囊括內(nèi)容、載體、位置與獲取方式、制作與利用方法、甚至相關(guān)數(shù)據(jù)單元方面等,數(shù)據(jù)元素數(shù)量往往較多,MARC、GILS和FGDC/CSDGM是這類Metadata的典型代表。1422、Metadata的應用目的1)確認和檢索(Discov2、Metadata的應用目的(3)資源管理(ResourceAdministration),支持資源的存儲和使用管理,數(shù)據(jù)元素除比較全面的著錄描述信息外,還往往包括權(quán)利管理(Rights/PrivacyManagement)、電子簽名(DigitalSignature)、資源評鑒(SealofApproval/Rating)、使用管理(AccessManagement)、支付審計(PaymentandAccounting)等方面的信息。

(4)資源保護與長期保存(PreservationandArchiving),支持對資源進行長期保存,數(shù)據(jù)元素除對資源進行描述和確認外,往往包括詳細的格式信息、制作信息、保護條件、轉(zhuǎn)換方式(MigrationMethods)、保存責任等內(nèi)容。1432、Metadata的應用目的(3)資源管理(Resourc3、Metadata格式在各個不同領(lǐng)域的表現(xiàn)網(wǎng)絡(luò)資源:DublinCore、CDF、WebCollections

文獻資料:MARC(with856Field),DublicCore

博物館與藝術(shù)作品:CIMI、CDWA、VRACore

政府信息:GILS

地理空間信息:FGDC/CSDGM

檔案庫與資源集合:EAD

技術(shù)報告:RFC1807

連續(xù)圖像:MPEG-71443、Metadata格式在各個不同領(lǐng)域的表現(xiàn)網(wǎng)絡(luò)資源:D

4、DCDublinCore(DublinMetedateCoreElemnet)都柏林核心元數(shù)據(jù)元素集1995年由美國OCLC和國家超級計算機中心聯(lián)合52家圖書館界和電腦網(wǎng)絡(luò)界的專家共同研究產(chǎn)生。它是信息資源描述的標準,比較全面的表述了信息資源的主要特征。定義一系列較少但又能夠被廣泛理解和接受的元數(shù)據(jù)元素集,而且盡可能的簡單,一方面使著者和信息出版者能夠描述他們的信息,增加信息傳輸中的互用性,另一方面,用戶對這些簡單的核心元素的理解可以讓他們更有效地查詢信息,促進信息資源的共享。145

4、DCDublinCore(DublinMeted教材:P57

DC15個元素146教材:P57 DC15個元素146Dc15個元素集1.名稱(Title)

標識:Title

定義:分配給資源的名稱。

解釋:使資源為眾所周知的有代表性的正規(guī)名稱。

2.創(chuàng)作、制作者(Creator)

標識:Creator

定義:制作資源內(nèi)容的主要責任實體。

解釋:創(chuàng)作、制作者包括個人、組織或機構(gòu)。

應該是用于標識創(chuàng)作、制作者實體的具有代表性的名稱。

147Dc15個元素集1.名稱(Title)

標識:Title

Dc15個元素集3.主題及關(guān)鍵詞(SubjectandKeywords)

標識:Subject定義:資源內(nèi)容的主題。

解釋:用以描述資源主要內(nèi)容的關(guān)鍵詞語或分類號碼表示的有代表性的主題詞。

4.說明(Description)

標識:Description

定義:有關(guān)資源內(nèi)容的說明。

解釋:該說明可以包括但并不限于:摘要,內(nèi)容目次,內(nèi)容圖示或內(nèi)容的文字說明。

148Dc15個元素集3.主題及關(guān)鍵詞(SubjectandDc15個元素集5.出版者(Publisher)

標識:Publisher

定義:制作資源有重要作用的責任實體。

解釋:如包括個人、組織或機構(gòu)的出版者。

應是用于標識出版者實體的有代表性的名稱。

6.發(fā)行者(Contributor)

標識:Contributor

定義:對資源內(nèi)容負有發(fā)行責任的實體。

解釋:發(fā)行者包括個人、組織或機構(gòu)。

應是用于標識發(fā)行者實體的有代表性的名稱。

149Dc15個元素集5.出版者(Publisher)

標識:PDc15個元素集7.時間(Date)

標識:Date

定義:與資源使用期限相關(guān)的日期、時間。

解釋:資源產(chǎn)生或有效使用的日期、時間。推薦使用ISO8601[W3CDFT]定義的編碼形式,跟隨的是YYYY-MM-DD形式。

8.類型(Type)

標識:Type

定義:資源內(nèi)容方面的特征或體裁。

解釋:類型包括種類、功能、體裁或作品集成級別等描述性術(shù)語。推薦從可控詞表(如DublinCoreTypes[DCT1])中選用有關(guān)術(shù)語。對于資源物理或數(shù)字化方面表示,采用"格式"項描述。

150Dc15個元素集7.時間(Date)

標識:Date

定義Dc15個元素集9.格式(Format)

標識:Format

定義:資源物理或數(shù)字化的特有表示。

解釋:格式可包括媒體類型或資源容量。也可用于限定資源顯示或操作所需的軟件、硬件或其它設(shè)備,如容量包括數(shù)據(jù)所占空間和存在期間。

151Dc15個元素集9.格式(Format)

標識:Forma10.標識(Identifier)

標識:Identifier

定義:依據(jù)有關(guān)規(guī)定分配給資源的標識性信息。

解釋:推薦使用依據(jù)格式化標識系統(tǒng)規(guī)定的字符或號碼標識資源。如正規(guī)標識系統(tǒng)包括統(tǒng)一資源標識(URI),統(tǒng)一資源地址(URL)、數(shù)字對象標識(DOI)以及國際標準書號(ISBN)、國際標準刊號(ISSN)等。

15210.標識(Identifier)

標識:IdentifiDc15個元素集11.來源(Source)

標識:Source

定義:可獲取現(xiàn)存資源的有關(guān)信息。

解釋:可從原資源整體或部分獲得現(xiàn)有資源。建議使用正規(guī)標識系統(tǒng)確定的字符或號碼標引資源來源信息。

12.語言(Language)

標識:Language

定義:資源知識內(nèi)容使用的語種。

解釋:推薦使用由RFC1766定義的語種代碼,它由兩位字符(源自ISO639)組成。隨后可選用兩字符的國家代碼(源自ISO3166)。如"en"表示英語,"fr"表示法語

153Dc15個元素集11.來源(Source)

標識:SourDc15個元素集13.相關(guān)資源(Relation)

標識:Relation

定義:對相關(guān)資源的參照。

解釋:推薦用依據(jù)正規(guī)標識系統(tǒng)確定的字符或號碼標引資源參照信息。

14.范圍(Coverage)

標識:Coverage

定義:資源內(nèi)容的領(lǐng)域或范圍。

解釋:范圍包括空間定位(地名或地理座標),時代(年代、日期或日期范圍)或權(quán)限范圍。

154Dc15個元素集13.相關(guān)資源(Relation)

標識:Dc15個元素集15.版權(quán)(Rights)

標識:Rights

定義:持有或擁有該資源權(quán)力的信息。

解釋:版權(quán)項包括資源版權(quán)管理的說明。

版權(quán)信息通常包含智力知識內(nèi)容所有權(quán)(IPR)、著作權(quán)和各種擁有權(quán)。如果缺少版權(quán)項,就意味著不考慮有關(guān)資源的上述版權(quán)和其它權(quán)力。

155Dc15個元素集15.版權(quán)(Rights)

標識:RighDc15個元素集包括三個方面

網(wǎng)絡(luò)信息資源內(nèi)容的元素:

Title,subjectandkeywords,Descriptions,Source,language,relation,coverage關(guān)于網(wǎng)絡(luò)信息資源知識產(chǎn)權(quán)的元素:AuthororCreator,Publisher,Contributor,Rrights關(guān)于網(wǎng)絡(luò)信息資源外部屬性的元素:Date,Type,Format,,Identifer。156Dc15個元素集包括三個方面

網(wǎng)絡(luò)信息資源內(nèi)容的元素:156元數(shù)據(jù)的創(chuàng)建157元數(shù)據(jù)的創(chuàng)建157元數(shù)據(jù)的創(chuàng)建1、可以由信息創(chuàng)建者在創(chuàng)建信息的同時,利用HTML標記語言嵌入在信息中,<html><head>

<metaname=“recorddc”content=“zs0001227”><title></title></head><body>

<metatitle=“DC.Title”content=“歡迎光臨蘭州商學院主頁”>……</body></html>158元數(shù)據(jù)的創(chuàng)建1、可以由信息創(chuàng)建者在創(chuàng)建信息的同時,利用HTMDC為自己設(shè)置了兩種HTML語言的標簽“NAME”和“CONTENT”,同時將每個單元都加了著錄標識,著錄時既可以使用HTML語言為輸出結(jié)果的網(wǎng)絡(luò)產(chǎn)品形式,也保留了自己的著錄標識和系統(tǒng)

159DC為自己設(shè)置了兩種HTML語言的標簽“NAME”和“CONMETA中的著錄在META標簽中,DC元素名的第一個字母要大寫,但對元素值的大小寫沒有要求,也沒有限制同時出現(xiàn)的META元素的個數(shù)與順序。同一個DC元素可以出現(xiàn)多次,每個DC元素都是可選的。<METANAME=”DC.Title”CONTENT=”世紀前線”><METANAME=“DC.Creator”CONTENT=“廣州市電信局數(shù)據(jù)通信分局”><METANAME=“DC.Subject”CONTENT="互聯(lián)網(wǎng)

網(wǎng)站“”><METANAME=“DC.Description”CONTENT=“世紀前線[計算機文檔]/廣州市電信局數(shù)據(jù)通信分局

160META中的著錄在META標簽中,DC元素名的第一個字母要大元數(shù)據(jù)生成工具DCDOT161元數(shù)據(jù)生成工具DCDOT161162162163163164164165165DC與XML/RDF雖然將DC元數(shù)據(jù)嵌入到HTML文件中使用方便,句法簡單,但考慮到HTML本身的結(jié)構(gòu)性不強,擴展能力和描述能力較差,以后的應用方向應該是與XML相關(guān),基于RDF(ResourceDescriptionFramework)的形式。XML在結(jié)構(gòu)化、擴展性、內(nèi)容描述等方面都要大大優(yōu)于HTML,是Internet發(fā)展的一個重要方向。DC元數(shù)據(jù)可以很好地嵌入到基于XML的RDF框架中,適應將來技術(shù)發(fā)展的需要,也為不同元數(shù)據(jù)體系之間提供更好的互操作性。在XML中,置標的語法是通過文件類型定義DTD(DocumentTypeDefinition)來描述的。

166DC與XML/RDF雖然將DC元數(shù)據(jù)嵌入到HTML文件中使用一個RDF文件包含多個資源描述,而一個資源描述是由多個語句構(gòu)成,一個語句是由資源、屬性類型、屬性值構(gòu)成的三元體,表示資源具有的一個屬性。資源描述中的語句可以對應于自然語言的語句,資源對應于自然語言中的主語,屬性類型對應于謂語,屬性值對應于賓語。屬性類型P資源R屬性值V屬性值V是資源R的屬性類型P的值RDF采用XML作為交換和處理元數(shù)據(jù)的通用語法結(jié)構(gòu)體系167一個RDF文件包含多個資源描述,而一個資源描述是由多個語句構(gòu)RDF描述屬性類型P168RDF描述屬性類型P168169169

170170發(fā)展趨勢:

網(wǎng)絡(luò)新的組織技術(shù)WEB2.0171發(fā)展趨勢:網(wǎng)絡(luò)新的組織技術(shù)WEB2.0171國內(nèi)知名的WEB2.0網(wǎng)站172國內(nèi)知名的WEB2.0網(wǎng)站172173173174174五、傳統(tǒng)檢索語言在網(wǎng)絡(luò)信息組織中的應用討論(P62)

網(wǎng)絡(luò)資源的分類有什么特點?175五、傳統(tǒng)檢索語言在網(wǎng)絡(luò)信息組織中的應用討論(P62)網(wǎng)絡(luò)資網(wǎng)絡(luò)信息分類中存在的問題分類體系不嚴密。一些搜索引擎在劃分類目時,并未真正從知識領(lǐng)域、知識體系的角度來分類,而僅僅從商業(yè)角度考慮,因而使得分類體系漏掉了許多重要的知識領(lǐng)域,體系的系統(tǒng)性和完整性受到很大的影響。如雅虎中國(Yahoo!)的基本大類中沒有設(shè)置工業(yè)類、農(nóng)業(yè)類等基礎(chǔ)性類目,而把它們作為二級類目、三級類目,或是分散到其它類目176網(wǎng)絡(luò)信息分類中存在的問題分類體系不嚴密。一些搜索引擎在劃分類問題分析類目之間缺乏邏輯性,隸屬關(guān)系混亂。部分中文搜索引擎分類體系的類目之間缺乏邏輯性,類目歸屬關(guān)系不盡合理。表現(xiàn)在某些上、下位類之間隸屬關(guān)系模糊,缺乏合理的知識聯(lián)系。如“東方網(wǎng)景”把教育列于自然科學類下,“網(wǎng)易”在文學類下列出入文歷史和宗教等。177問題分析類目之間缺乏邏輯性,隸屬關(guān)系混亂。部分中文搜索引擎分問題分析類目名稱不規(guī)范。主要表現(xiàn)為類名不統(tǒng)一,類名用語不準確,類名不能確切概括類目的內(nèi)涵。如搜狐稱“計算機與互聯(lián)網(wǎng)”,中文雅虎稱“電腦與因特網(wǎng)”,網(wǎng)易中熱門查詢的“另類”等。類目劃分標準模糊。由于類目設(shè)置采用多元標準劃分,一些類下往往使用兩個或多個分類標準,有的甚至在同一層次上列出不同等級的類目,致使同位類設(shè)置顯得混亂。178問題分析類目名稱不規(guī)范。主要表現(xiàn)為類名不統(tǒng)一,類名用語不準確建議與改進:

分類—主題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論