《檔案文獻檢索》課件_第1頁
《檔案文獻檢索》課件_第2頁
《檔案文獻檢索》課件_第3頁
《檔案文獻檢索》課件_第4頁
《檔案文獻檢索》課件_第5頁
已閱讀5頁,還剩525頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

檔案文獻檢索聯(lián)系方式Emailtjlifj@tjlifj@Te于《檔案文獻檢索》課程在專業(yè)課中的地位是一門專業(yè)課是檔案學的主干課講授和學習方法互動式課堂教學方法實踐教學方法課程的考核和要求考核方式要求——出勤、課堂討論、小論文、課堂發(fā)言等教學參考文獻期刊檔案學通訊檔案學研究檔案工作國內著作丁振寧.檔案管理工作標準與檔案分類法操作指南.吉林音像出版社1陳兆祦.文件論與檔案管理.北京:中國檔案出版社,1993國外著作[美]戴維.比爾曼.電子證據(jù)當代機構文件管理戰(zhàn)略.北京:中國人民大學出版社,2000陳兆祦.六十國檔案工作概況.北京:檔案出版社國外檔案學論文GUIDELINESONMANAGINGELECTRONICMESSAGESASRECORDS,NationalArchivesandRecordsAdministration,January14,1997,/elecroic/intro.html國際檔案理事會電子文件管理委員會報告:電子文件管理文獻回顧.http:

SueMcKemmishi,GlendaAcland.AccessingEssentialEvidenceontheWeb:TowardsanAustralianRecordkeepingMetadataStandard.

http://.au/aw99/papers/mckemmish國外檔案機構和檔案資源網(wǎng)站國際檔案理事會,網(wǎng)址為http://www.archives.ca/ica/。這是國際非政府組織。它收錄了ICA的計劃,成員、地區(qū)機構和出版物等信息。檔案人員資格認證學院(AcademyofCertifiedArchivists),網(wǎng)址為http://www.certifiedarchivists.org/。此網(wǎng)站收錄了由超鏈接連接該學院領導層人員名單、該學院新會員調查官計劃、檔案資格認可考試、考試題目所依據(jù)的檔案人員職責描述文件的文本、1998年檔案資格認證考試的數(shù)據(jù)、資格認證維護的準則和建議,等等。美國檔案工作者協(xié)會,網(wǎng)址為http://www.archivists.org/。此網(wǎng)站收錄了美國檔案工作者協(xié)會教育和研討會信息、協(xié)會指南、美國和加拿大組織的鏈接信息、會員信息、年度會議信息等。它也收錄了經過挑選的美國檔案工作者協(xié)會情況介紹手冊,如“捐贈者信息”,這對于整個檔案界來說是非常重要的資源。國外檔案機構和檔案資源網(wǎng)站檔案人員日記簿(ArchivistsDay-book),網(wǎng)址為http://www.tulane.edu/lmiller/daybookhtml。從這里您可以找到檔案人員感興趣的全世界的全文、研討會、研討班和其他信息的鏈接信息。美國地區(qū)性、州和當?shù)貦n案組織機構目錄,網(wǎng)址為http://www.smith.edu/pnelson/regionals/。此網(wǎng)站收錄了美國所有檔案協(xié)會的鏈接信息,包括組織機構的郵寄地址、機構主席和工作簡報編輯、會員數(shù)量、職責和義務。它也可以鏈接到加拿大省/地區(qū)理事會和協(xié)會(http://www.usask.ca/archives/mona3.html)和美國檔案工作者協(xié)會下屬的學生部達到目錄。全國歷史促進協(xié)調委員會。/ncc。能夠使檔案人員及時了解與檔案和歷史有關的美國政治事件和政府事務。1982年以來,此委員會還充當起全美歷史和檔案專業(yè)的咨詢辦公室的職責。緒論一.“檔案檢索”在檔案學中的地位二.檔案信息特征三.檔案信息管理系統(tǒng)簡述一.“檔案檢索”在檔案學中的地位首先,是從檔案管理學中剝離出來的一門專業(yè)課。其次,從環(huán)節(jié)上分析,是一個單獨的管理環(huán)節(jié)。第三,從二元檔案學理論上分析,是檔案信息開發(fā)的一項工作。1.檔案管理的基本內容文書或檔案室階段收集收集整理保管反饋調整編研提供利用檢索鑒定統(tǒng)計登記文書或檔案室階段實體管理收集、整理、保管、鑒定、統(tǒng)計登記工作之一反饋階段信息開發(fā)檢索、提供利用、編研、統(tǒng)計登記工作之一2.檔案的二元管理——實體管理與信息開發(fā)二.檔案信息特征檔案信息與載體的不可分離性檔案信息傳遞中的增值性檔案信息在傳遞過程中被官方利用,其內在價值不單完整無損,反而會在信息交流中擴散、增值,產生直接或間接的社會效益或經濟效益。檔案信息在利用過程中,通過一定的加工方式(編纂、研制、設計等),會再生出與原始檔案信息形式完全不同的新的信息或其他文獻信息,反映出檔案信息實現(xiàn)其價值的多次性和高效性。如方志、年鑒、大事記、機構沿革、統(tǒng)計資料匯集、科技陳國匯編、產品介紹等。檔案信息的可濃縮性檔案信息可通過加工、選擇、組織等技術進行壓縮,以便于利用。目前檔案信息海量,如要高效利用,需借助信息加工處理技術。常見的檔案目錄、索引、數(shù)據(jù)庫等,即位濃縮加工的檔案信息。檔案信息存儲與擴散的一致性存儲的目的是更快更好的傳遞、擴散和交流,便于共享。檔案信息存儲是擴散的先決條件。檔案信息總是處于不斷積累和傳遞使用的動態(tài)循環(huán)之中。檔案信息的原始性三.檔案信息管理系統(tǒng)簡述

(一)檔案信息管理系統(tǒng)的結構與功能輸入子系統(tǒng)其功能是收集和揀選檔案材料,將有價值的檔案信息輸入系統(tǒng)。存儲加工子系統(tǒng)其功能是對檔案中包含的信息進行揭示、加工于組織,以檔案條目和機讀數(shù)據(jù)的形式,對收集的檔案信息進行存儲輸出子系統(tǒng)其功能是將加工處理的檔案信息提供利用反饋子系統(tǒng)其功能是通過統(tǒng)計和用戶調研等方式隨時掌握和分析系統(tǒng)運行情況和用戶需求狀況,使用和和系統(tǒng)之間得以交互,使系統(tǒng)不斷晚會和優(yōu)化。檔案信息管理系統(tǒng)結構與功能圖檔案信息管理系統(tǒng)輸入子系統(tǒng)存儲加工子系統(tǒng)輸出子系統(tǒng)反饋子系統(tǒng)收集揀選著錄標引編目摘要編研報道檢索用戶調研統(tǒng)計(二)檔案信息管理系統(tǒng)的優(yōu)化控制統(tǒng)一規(guī)劃,整體協(xié)調,合理劃分與組織系統(tǒng)的內部結構,保障系統(tǒng)流通渠道的暢通,使系統(tǒng)有目標、有計劃的順利進行。通過規(guī)范化、標準化等措施,提高系統(tǒng)的工作效率和質量,避免浪費,并達到信息資源的共享。及時引進先進技術設備,強化系統(tǒng)功能??茖W評價系統(tǒng),及時發(fā)現(xiàn)問題,逐漸完善系統(tǒng)結構和功能。保持與外界的聯(lián)系與溝通,隨時吸取其他信息系統(tǒng)長處,達到系統(tǒng)與外界環(huán)境的動態(tài)平衡。第一章檔案文獻檢索系統(tǒng)概述

第一節(jié)檔案文獻檢索系統(tǒng)的構成檔案文獻檢索的含義對“檔案文獻檢索”一詞可以有廣義和狹義兩種解釋。廣義的檔案文獻檢索包括存儲和查找兩個具體過程。前者是指將檔案中具有檢索意義的特征標識出來,通過編制檢索工具、建立數(shù)據(jù)庫等方法使之成為有序的檔案信息集合的過程;后者則是指在檔案信息集合中選擇、獲取特定檔案信息的過程。狹義的檔案文獻檢索僅指后一過程。存儲是查找檔案信息的前提或基礎,沒有存儲就無法查找;查找則是存儲檔案信息的目的,沒有查找,存儲也就失去了意義。本教材從檔案文獻檢索的廣義概念出發(fā),把存儲過程和查找過程作為一個整體來研究。存儲階段的目的是使檔案信息達到高度的組織化。主要采取對檔案文獻進行標識化壓縮處理的方法,即把檔案文獻中具有檢索意義的特征用語詞、代碼等符號表示出來,過編目、編寫提要等方式將檔案原件轉換成一種篇幅較短的特殊文獻形式,一般成為簡短記錄檔案文獻特征的一個條目,并按照一定的規(guī)則把這些條目組織起來,形成有序的檔案信息集合,供查找之用。查找階段的目的是獲取所需檔案信息,主要方法是對檔案需求課題進行標識化處理,形成檢索提問,再將提問標識與檔案信息集合中的標識進行相符性比較,選擇出所需要的檔案信息,也就是說,在存儲的逆過程中把所需檔案查找出來。所謂逆過程,是指查找與存儲時的思路一致,只是程序相反,形象地說,就是“怎么放進去,就怎么取出來”。檔案文獻檢索的三種形式1.數(shù)據(jù)檢索(dataretrieval)。這種檢索是直接回答利用者所需要的有關特定主題的查詢,檢索出的結果是數(shù)據(jù)、公式、圖表等。包括數(shù)值型數(shù)據(jù),如某一觀測數(shù)據(jù)、實驗數(shù)據(jù);非數(shù)值型數(shù)據(jù),如化合物分子式、產品規(guī)格等。數(shù)據(jù)檢索是一種確定性檢索,檢索結果(有或無,對或錯)可直接供利用者利用。2.事實檢索(factretrieval)。這種檢索也是直接回答利用者所需特定主題的確定性檢索,檢索出的結果是某種事實,如某一事物發(fā)生的時間、地點、過程等。有時它是對檢索出的數(shù)據(jù)進行某種邏輯推理后再輸出。3.文獻檢索(documentretrieval)。這種檢索是要查出記載所需信息的檔案文獻,但檢索結果所提供的并不是文獻本身,而只是文獻線索,檢索人員借助.文獻線索中提供的存址提取檔案文獻,再從文獻中獲得所需信息。因此,文獻檢索是一種相關性檢索,一般說來,并不能直接回答利用者提出的問題。二、檔案文獻檢索系統(tǒng)的構成檔案文獻群主題分析概念轉換目錄編制檢索工具體系/數(shù)據(jù)庫用戶群主題分析概念轉換查找檢索語言待標檔案主題概念檢索標識目錄數(shù)據(jù)用戶提問主題概念(檢索表達式)(標引記錄)檢索標識著錄標引編制檢索策略三.檔案文獻檢索方式(一)文獻單元方式又稱順檢方式、順序文檔。(sequentialfile)以一份文獻為一個條目,指明該文獻的各種特征,即以文獻為單元進行檢索,其條目按文獻順序排列。如:案卷目錄、分類目錄、主題目錄等。適用手檢系統(tǒng)(二)標識單元方式又稱逆檢方式、倒排文檔(invertedfile)以文獻的一個屬性標識為單元,指明含有該屬性的全部文獻,一般只有標識和文獻號(檔號)。如人名索引、主題索引等適用計檢系統(tǒng)第二節(jié)檢索效率一.查全率和查準率查全率是衡量某一檢索系統(tǒng)從文獻集合中檢出相關文獻成功度的指標。即檢出的相關文獻與全部相關文獻的百分比。查全率=檢出的相關文獻全部相關文獻*100%漏檢率未檢出的相關文獻與全部相關文獻的百分比。漏檢率=未檢出的相關文獻

全部相關文獻*100%查準率衡量某一檢索系統(tǒng)的信號噪聲比的一種指標,即檢出的相關文獻與檢出的全部文獻的百分比。出查準率=檢出的相關文獻檢出的全部文獻*100%誤檢率檢出的不相關文獻與檢出的全部文獻的百分比。誤檢率=檢出的不相關文獻檢出的全部文獻*100%二.查全率與查準率的關系查全率與查準率之間是互逆的關系。如果放寬檢索以達到較好的查全率,那么查準率就會降低;反之,若限制檢索范圍以改善查準率,則查全率降低。資料:如何衡量搜索引擎的性能?我們可以將WEB信息的搜索看作一個信息檢索問題,即在由WEB網(wǎng)頁組成的文檔集中檢索出與用戶查詢相關的文檔.所以我們可以用衡量傳統(tǒng)信息檢索系統(tǒng)的性能參數(shù)查全率(Recall)和查準率(Precision)–來衡量一個搜索引擎的性能。

查全率是檢索出的相關文檔數(shù)和文檔集中所有的相關文檔數(shù)的比率.衡量的是檢

索系統(tǒng)(搜索引擎)的查全率;查準率是檢索出的相關文擋數(shù)與檢索出的文檔總數(shù)的

比率.衡最的是檢索系統(tǒng)(控索引擎)的查準率.對于一個檢索系統(tǒng)來講.查全率和

查準率不可能兩全其美:查全率高時.查準率低;查準率高時,查全率低.所以常常

用11種查全率下11種查準率的平均值(即11點平均查準率)來衡量一個檢索系統(tǒng)的

查準率.對于搜索引擎系統(tǒng)來講,因為對于一個查詢總能返回很多信息.所以查全率

一般不成問題;加之.沒有一個搜索引擎系統(tǒng)能夠搜集到所有的WEB同頁·查全率很

難比較,所以衡量搜索引擎的性能時.查全率很少使用.目前的搜索引擎系統(tǒng)都非常

關心查準率.即是否為用戶提供了相關度報高的、高質量的導航信息.

搜索引擎系統(tǒng)的其它衡量指標還有響應時間、支持峰值查詢的能力、易用性、返

回結果的有效性(是否為死鏈、過時信息)等等.

影響一個搜索引擎系統(tǒng)的性能有很多因素.最主要的是信息搜集策略和檢索模型,

包括索引庫的更新頻率和策略、文檔和查詢的表示方法、評價文檔和用戶查詢相關性

的匹配策略,查詢結果的排序方法和用戶進行相關度反饋的機制.三.影響檢索效率的因素檢索語言的性能檢索語言的詞匯的范圍、專指度、相關關系的顯示等,以及檢索語言語法的嚴格、準確度等,影響檢索語言的性能。檢索途徑的數(shù)量檢索途徑多,查全率高。但目錄種類和數(shù)據(jù)庫的數(shù)據(jù)結構有制約作用。著錄標引的質量檢索標識的準確性是影響查全率和查準率的重要因素。標識是著錄標引的結果。檢索策略的優(yōu)劣檢索策略指檢索途徑的選擇、檢索標識的邏輯表達、檢索表達式的靈活調整等。檢索人員的素質第二章檔案檢索語言第一節(jié)檢索語言的特點與功能第二節(jié)檢索語言的結構第三節(jié)檢索語言的分類第一節(jié)檔案檢索語言的特點與功能一.檢索語言的特點概念檢索語言是根據(jù)檢索的需要而創(chuàng)制的人工語言,專門用于各種手工的和計算機化的文獻信息檢索系統(tǒng),表達文獻主題概念和檢索課題概念。它作為檢索系統(tǒng)的一個構成因素,在提供文獻內容檢索途徑方面起著語言保障作用。檢索語言的種類繁多檢索語言的實質檢索語言的實質是表達一系列概括文獻情報內容的概念及其相互關系的概念標識系統(tǒng),用以對文獻內容和情報需求進行主題標引、特征描述或邏輯分類。檢索語言的特點檢索語言是人工語言,與自然語言相比,其特點:能簡單明白、比較患肢地表達文獻及檢索課題的主題概念語詞與概念一一對應,排出多詞一義、一詞多義和詞一含糊現(xiàn)象能明確顯示出概念之間的相互關系更容易將概念進行系統(tǒng)排列在檢索時便于將文獻標引用語與檢索用語進行相符性比較。檢索語言的詞匯、語法和書面形式詞匯:指登錄在分類表、詞表、代碼表中的全部標識,一個標識就是一個詞匯。分類表、詞表、代碼表是詞典語法:如何創(chuàng)造和運用標識來正確表達文獻內容和情報需要的一整套規(guī)則。書面形式:主要以書面形式使用,對書寫形式有嚴格要求。二.檢索語言的基本功能對文獻的主題(及某些外表特征加以標引的功能;對內容相同及相關的文獻主題加以集中或揭示其相關性的功能;對大量文獻信息加以系統(tǒng)化或組織化:便于將標引用語和檢索用語進行相符性比較。檢索語言通過它的一套簡單明白并具有唯一性和相當專指度的”語詞”(即標識)以及明確規(guī)定的“語法”(即規(guī)則),能夠把文獻的內容特征和某些檢索意義較大的外表特征盡可能確切地表達出來,從而提高查全率和查準率.在檢索中,不但內容相同的文獻對檢索課題有用.內容相近.相關的文獻對檢索課題也可能有用。檢索語言通過其標識的唯一性,將內容相同的文獻集中,并通過它顯示概念之間相互關系的各種結構,將內容相近或相關的文獻集中,或將其相關性揭示出來,從而有助于準確選擇檢索標識,提高查全率和查準率。所謂系統(tǒng)化,是指將文獻檢索標識按文獻主題概念之間的相關性進行排列;所謂組織化,是指將文獻檢索標識按某種嚴格的序列進行排列。檢索語言通過分類排列法或字順排列法將檢索系統(tǒng)中的大量檢索標識加以排列使之系統(tǒng)化或組織化,從而明確每一個標記的準確排列位置.這樣就可以大大縮小查尋范圍,提高檢索速度。

檢索語言之便于將標引用語和檢索用語進行相符性比較主要表現(xiàn)在:一是由于其標識的簡潔性、規(guī)范化和有序性,進行比對操作十分容易;二是大部分標識采用層次結構.或采用自由組配方式.不僅能進行整體相符性比較(查明文獻主題與檢索課題是否完全一致),而且還能進行局部相符性比較(查明文獻主題與檢索課題是否部分一致)-第二節(jié)檢索語言的結構一.檢索語言結構與功能的辯證關系任何一種檢索語言,都是由若干種語言要素按一定機構形式結合起來的一個有機統(tǒng)一體,各種要素互相聯(lián)系、互相作用,共同實現(xiàn)著檢索語言的四項基本功能。因此,檢索語言的機構狀況,對其性能和效率有決定性影響。二.產生檢索語言基本功能的各種結構(一)產生檢索語言第一項基本功能的結構第一項功能對文獻主題加以標引的功能實現(xiàn)用標識標引什么是概念標識表達文獻主題內容(及某些外形特征)的概念標識,是檢索語言的基本要素:它不僅是檢索語言發(fā)揮第一項基本功能的工具,而且也是發(fā)揮其他三項基本功能的基礎.概念標識的區(qū)分

從標識的編碼形式上號碼標識語詞標識.代碼標識概念標識的區(qū)分

從標識形成的階段上固定標識組配標識概念標識的區(qū)分

從標識層次上層次結構標識無層次結構標識概念標識的區(qū)分

從標識組配結果上作后組式使用的組配標識作先組散組式使用的組配標識不同類型的標識結構對第一功能的影響1.編碼型2.組配型3.層次型1.編碼型標識結構

號碼標識是利用數(shù)字、字母按照一定的編碼方法組合而成的標識。如“BA2人民代表大會常務委員會會議”因為號碼都是后配的,用號碼標識編碼時可服從于反映知識分類體系的要求.按知識分類體系(事物.學科和職能分工的分類體系)組織文獻信息,形成分類法系統(tǒng)的各種語言。優(yōu)點:具有很好的系統(tǒng)性語詞標識是利用自然語言的語詞經過規(guī)范化處理后作為標識的。如“上海會議”、“令狐沖”、“獨孤劍法”語詞標識一般只按字順排列,因此必須是以語詞所表達的事物為中心集中文獻信息,形成主題法系統(tǒng)的各種語言。優(yōu)點:具有很好的直觀性代碼標識與號碼標識類似,也是利用字母、數(shù)字按照一定的編碼方法組合而成的標識,但它一般僅限于標引某類事物的某一方面的特征,相當于從某一角度對某類事物進行命名2.組配型標識結構通過文獻標引工序實際賦予—個文獻主題的標識稱為文獻標識,文獻標識所表達的大多是具有多個概念因素的復雜概念。固定標識表達復雜概念的文獻標識可以是固定的(即預先組配好的,在分類表、詞表編制階段對復雜概念一一列出專指標識)組配標識表達復雜概念的文獻表識是組配而成的,即復雜主題概念要在文獻標引階段,從分類表、詞表中選取機構表達概念因素或簡單概念的標識來組配表達標識的組合方式先組式標識先組散組式標識后組式標識標識組合(形成)的階段標引階段編表階段檢索階段先組式標識先組散組式標識后組式標識組配型標識的邏輯原理基于概念的可分析性和可綜合性的邏輯原理.即一個復雜概念可以分解為若干簡單概念(或概念因素),若干簡單概念(或概念因素)也可以綜合為一個復雜概念。因此,一個復雜的文獻主題概念可以用若干個表達簡單概念(或比較簡單的概念)的標識的組配來表達電影彩色寬銀幕武打兒童美國數(shù)字組配標識的優(yōu)點能反映事物概念多向成族的實際能進行多途徑檢索包羅主題概念的能力和及時反映新事物、新學科的能力較強標識專指度高擴大.縮?。淖儥z索范圍相當自由.檢索時可任意選擇專指度,能進行多因素組配檢索和邏輯運算,既適用于電子計算機槍索系統(tǒng)電適用于手工檢索系統(tǒng),既可作先組散組式標識使用也可作后組式標識使用組配標識適應的檢索方式組配標識系統(tǒng)只有與標識單元方式配合使用時,才能充分發(fā)揮其優(yōu)越性能3.層次型結構標識每一個復雜主題概念都可分出若干層次。標引復雜主題概念的先組式文獻標識可以采用無層次結構,包可以采用層次結構,先組散組弍文獻標識必定是一種層次結構。無層次結構的文獻標識只能回答一個與其完全一致的檢索提問;一個層次結構的文獻標識能夠回答與其層次數(shù)相等且層次的順序相同的多個檢索提問。后組式文獻標識是無所謂層次結構或無層次結構的.它能夠回答任意的檢索提問。(二)產生檢索語言第二項基本功能的結構第二項功能對內容相同及相關文獻加以集中或揭示其相關性實現(xiàn)方式將一種檢索語言的全部或部分概念標識置于某種顯示概念關系的結構形式中。顯示概念關系的結構形式1.等級結構2.參照系統(tǒng)結構3.輪排聚類結構1.等級結構等級結構等級結構使各種概念按相關性排列成一個具有隸屬、并列關系的概念等級體系。應用體系分類法分面類表詞族索引范疇索引等事例(摘自《中國檔案分類法》)LA商業(yè)

1國內商業(yè)

11商品購銷

111工業(yè)品購銷

1111五金

1112交電

2.參照系統(tǒng)結構參照系統(tǒng)參照系統(tǒng)是主題法系統(tǒng)中各種語言顯示概念關系的主要結構形式。是將具有相關性但因為按自順排列而被分散的那些概念聯(lián)系起來。應用主題語言事例(摘自《檔案主題詞表》)DuiWaizhengce

對外政策

D外交政策

F閉關政策

S政策

C和平共處五項原則3.輪排聚類結構輪排聚類結構將表達復雜概念或多因素主題的標識,按它們所表達的每個有檢索意義的概念因素或主題因素進行輪排。當某一概念因素或主題因素輪排到檢索入口位置時,就能將具有這一特征的標識排列在一起,起到聚類作用。應用標題詞敘詞關鍵詞分類號(三)產生檢索語言第三項功能的結構第三項功能對大量文獻信息加以系統(tǒng)化和組織化實現(xiàn)方式將標識置于某種嚴格有序的結構形式中。應用分類序列結構(分類語言)字順序列結構(主題語言)字順分類結構(主題——分類語言)分類字順結構(分類——主題語言)(四)產生檢索語言第四項功能的機構第四項功能便于將標引用語與檢索用語進行相符性比較實現(xiàn)方式利用標識的簡潔性、規(guī)范性、有序性采用標識的層次結構或自由組配結構第三節(jié)檔案檢索語言的分類分類方法按構成原理分按標識的組合方式分按學科、專業(yè)分按結構原理分

分類語言按學科(職能)集中文獻;以號碼為標識;按號碼順序排列體系分類法組配分類法描述語言按事物集中文獻;以語詞為標識按字順排列標題法敘詞法關鍵詞法代碼語言就事物的某一特征,用某種代碼標引、排列按標識的組合方式分先組式語言標識在編表時就固定組配好后組式語言標識在檢索時才組配起來按學科和專業(yè)范圍分

綜合性語言

多學科語言專業(yè)性語言第二章內容總結第一節(jié)檢索語言的特點與功能第二節(jié)檢索語言的結構第三節(jié)檢索語言的分類第三章分類檢索語言及《中國檔案分類法)第一節(jié)體系分類法原理第二節(jié)《中國檔案分類法》第三節(jié)《中國檔案分類法》的管理第一節(jié)體系分類法原理一.體系分類法二.類目的劃分三.分類體系四.分類規(guī)則五.類名與注釋六.類目之間相互關系的顯示和處理七.分類標記的配置八.體系分類法的局限性一.體系分類法概念是一種直接體現(xiàn)學科分類、專業(yè)分類和職能分類的等級制概念標識系統(tǒng),它是對概括文獻情報內容及某些外表特征的概念進行邏輯分類和系統(tǒng)排列而構成的。二.類目的劃分1.類目是許多具有某種(或某些)共同屬性的事物的集合。而對這些事物所具有的共同屬性的概括反映,就形成概念,因此,表達一類事物的概念的名稱又稱為類名,在文獻資料的分類上,成為類目。2.類目的劃分分類——類是可分的,因為其包含的事物除了具有共性外,每一事物都有自己的個性,因此,可以依據(jù)事物的不同屬性作為劃分標準對一類事物進行層層劃分。關于類目劃分的例子和有關概念武功劍法刀法棒法子類(下位類):經過一次劃分所形成的一系列概念。母類(上位類):被劃分的類母類與子類的聯(lián)系:表征母類的屬性存在于其子類之中。各子類間的聯(lián)系與區(qū)別:聯(lián)系——具有表征母類的共性區(qū)別——具有各個子類的特性三.分類體系

由于事物一般具有多種屬性,這些屬性都可作為劃分標準,所以分類是可以連續(xù)進行的,即經過一次劃分所得到的子類,還可用別的屬性作為劃分標準再次劃分。例如武功劍法獨孤劍法華山劍法衡山劍法恒山劍法前令狐沖時代恒山劍法后令狐沖時代恒山劍法刀法棒法每次劃分出來的各子類互相并列,共同隸屬于其母類。形成的體系:即概念等級體系四.分類規(guī)則第一,每一次劃分時,只使用一個劃分標準第二,劃分后所得各子類的外延之和應等于其母類的外延要選擇反映事物本質的、符合分類目的的屬性作為劃分標準五.類名與注釋(一)類名類名是限定類目所表達的事物概念的內涵和外延。例如:MA216165寒潮類名的涵義類名涵義受上位類、下位類、注釋、相關類的制約。(二)類目注釋1.作用:明確類目的涵義——更加明確地規(guī)定每一個類目的內涵和外延。明確類目之間的關系——完全揭示類目之間的關系以及相似類目之間的關系。明確分類方法——分類表使用的特殊規(guī)定。2.注釋的方式簡單的注釋與帶實例的注釋籠統(tǒng)的注釋與具體的注釋指示性的注釋與參考性注釋對一個類目的注釋與對一組類目的注釋六.類目之間相互關系的顯示和處理(一)體系分類法類目關系處理的一般方法1.利用體系分類法的結構形式——處理等級關系和并列關系。2.設置交替類目——處理可隸屬于兩個門類的類目。3.類目內容劃分規(guī)則

類目注釋等同關系等(二)類目內容范圍劃分規(guī)則——處理各學科、職能間關系1.邊緣學科——在重點關系方面設置正式類目,在另一方面設交替類目。如:地球化學——正式類目在地球科學下2.兩門學科為各自目的所研究的共同問題,處理1。如:農業(yè)經濟學——正式類目在經濟學下,在農業(yè)科學下設交替類目。3.一類事物的總論和分論——按重點關系分類,而不是按學科或問題完全集中。是《中檔法》中一個非常典型的問題如機械、建筑等類。4.兩門學科、職能的交叉關系——用注釋,設參見關系。如有關干部管理問題,在A和B類下都涉及,則在兩類下設互參關系。注意:具有交叉關系的類目很多,不可能完全顯示。而不完全顯示,就會造成漏檢。七.分類標記的配置(一)分類標記即分類號,是由具有自然順序的標記符合構成的。分類號是類目的代號,是分類檢索語言的語詞。(二)分類標記的條件有較大的容納性,易于增補和擴展新類目;有較好的表達性,能從分類號辨別類目的涵義和關系;易排易檢,排列無特殊規(guī)則;號碼簡短;有伸縮性,便于擴檢、縮檢;助記性好(三)層累標記制度以一位數(shù)字或一個字母標志大類,再加一位數(shù)字或字母標志其下位類,如此層層累加數(shù)字或字母,來表達類目的層層劃分以及類目之間的隸屬和并列關系。

1.武功

11.劍法

111.獨孤劍法

112.華山劍法

113.衡山劍法

114.恒山劍法

1141.前令狐沖時代恒山劍法

1142.后令狐沖時代恒山劍法(四)變通、特殊的標記方法1.八分法用途:解決同位類超過十個時的標記方法。用法:用1——8標記同位類,當同位類超過8個是,不用9,而用91、92、93標記;當同位類超過16個時,不用99,而用991、992來標記。特點:9不算一級,要與其后面的一位數(shù)字結合起來才算一級。即91=9(8+1),

92=10(8+2),

991=17(8+8+1)2.雙位法用途:解決同位類個數(shù)很多的一種標記方法。用法:在展開時一下就用兩位數(shù)字。如《中檔法》中的NJ151111/151199。特點:不用00-09;10、20等號碼,實際標識81個子目。八.體系分類法的局限性1.局限性的最大表現(xiàn)——集中與分散的矛盾。2.典型反映:黨政職能的交叉問題總論與分論問題—職能手段的應用。如機械、建筑、經濟、教育等。會議問題3.產生集中與分散矛盾的根本原因客觀事物的多向成族性與體系分類法類目單線排列原則之間的矛盾。體系分類法采取類目單線排列原則的原因,在于其標識是先組定組標識。反映多種屬性的概念因獲得了固定的組配形式而成為一體。第二節(jié)《中國檔案分類法》一.檔案分類法與圖書分類法的異同二.《中檔法》的體系結構三.對于幾個問題的處理四.《中檔法》的管理一.檔案分類法與圖書分類法的異同(一)相同構成原理相同:以概念邏輯和知識分類為基礎。結構體系大同小異:由基本大類、主表、附表、索引等組成采用的方法、手段類似采用復分、仿分、類號組配、注釋、設置交替類目等標記制度、標記符號及標記方法相似采用混合號碼、層累制、八分法、雙位制及輔助符號等(二)不同1.分類對象檔案分類法——類分檔案圖書分類法——類分圖書資料2.分類標準

檔案分類法——以人類社會實踐活動的職能分工為基礎,以檔案內容所反映的事物屬性為注意分類標準圖書分類法——以科學分類為基礎,以圖書所反映的學科屬性為主要分類標準3.分類體系檔案分類法——根據(jù)國家機構、社會組織和個人從事政治、經濟、科學、文化等社會實踐活動的分工,并結合檔案記述和反映的事物的屬性關系,形成的邏輯分類體系。圖書分類法——根據(jù)圖示內容的學科性質形成的比較嚴密的知識分類體系。4.用途檔案分類法——主要用于檔案分類標引、編制檔案分類目錄。一般不用于檔案實體的分類排架。圖書分類法——用于類分圖書、編制分類目錄、進行分類檢索,也用于組織分類排架,對藏書建設和圖書流通情況進行分類統(tǒng)計等。二.《中檔法》的體系結構(一)基本大類大部政治科學文化經濟政治中國共產黨黨務國家政務總類政法軍事外交政協(xié)、民主黨派、群眾團體科學文化G文化、教育、衛(wèi)生、體育H科學研究經濟J計劃、經濟管理K財政、金融L貿易、旅游M農業(yè)、林業(yè)、水利N工業(yè)P交通Q郵電R城鄉(xiāng)建設、建筑業(yè)S環(huán)境保護、土地管理T海洋、氣象、地震、測繪U標準、計量、專利(二)主表類目類目之間的關系標記制度注釋1.類目是分類法的基本單位,《中檔法》(第2版)共有10萬條類目,分為單一類目和組合類目(類組)。單一類目:如KA326關稅組合類目(類組):如KA31企業(yè)上繳利潤、預算收入2.類目之間的關系

(《中檔法》類目體系圖示)

K財政、金融、保險、審計………………一級類目

KA財政……………………

二級類目

1財政制度……………

三級類目

11預算………………

四級類目

12工交財務

13商貿、金融財務

14農業(yè)財務

︰︰2財政預算、決算

21︰29其他預算、決算(年報)

︰326關稅

參見LA74

等同關系同位類并列關系相關關系等級關系3.標記制度混合編號制《中檔法》采用漢語拼音和阿拉伯數(shù)字相結合的混合編號制,數(shù)字的位數(shù)一般表示類目的級位,基本遵循了層累制編號原則。變通方法當同位類過多時,采用了八分法和雙位制。補充方法為了補充基本類號的不足,采用了一些輔助符號:“+”

并列符號“:”關聯(lián)符號“-”

綜合復分號“/”

起訖符號“《》”

民族復分號“()”世界各國和地區(qū)復分號“〔〕”

中國地區(qū)復分號4.注釋(三)輔助表概念又稱復分表、附表。是將分類表中某些具有共性的類目從主表中抽出,匯編成各種復分表。作用統(tǒng)一類目,簡化類表,縮短篇幅,幫助記憶。類型通用復分表——適用于分類表各大類。專類復分表——是主表中某一類或某幾類里所附加的專用性復分表,只供某一類或某些類目使用。1.通用復分表——適用于分類表各大類(1)綜合復分表也稱總論復分表。是各類具有共性的有關綜合事務方面檔案復分的依據(jù)。復分符號:“—”如《農業(yè)條例》標引為“MA—13”農業(yè)條例使用要求綜合復分表的類目一般不在主表反映,但有時也作為專類在主表或專用復分表中列出,此時應本著“主表——專用復分表——綜合復分表”的選擇方案。具有綜合復分表中兩種以上特征的檔案文件,只能選擇其中主要的一種加以復分,不能重復使用。(2)世界各國和地區(qū)表是各類目需要按國家和地區(qū)標準復分時的依據(jù)。凡主表中表明“依世界各國和地區(qū)表分”的類目,都可使用此表復分。復分符號:“()”如《日本漁業(yè)》的標識為“MD(113)”漁業(yè)日本(3)中國地區(qū)表是各類目檔案需要按行政區(qū)劃復分時的依據(jù)。凡主表中注明“依中國地區(qū)表分”的,均可用該表復分。復分符號:“〔〕”在該表中還編列了舊的省區(qū)名稱,并注明該地區(qū)存在的年代,如“〔熱河省〕(1928—1955)”(4)中國民族表需按民族復分時使用。凡主表中注明“依中國民族表分”,均可使用該表。復分符號:“《》”。如《回族自治》為“B41《03》”(5)科技檔案復分表是各類具有共性的科技檔案復分的依據(jù)。2.專類復分表是主表中某一類或某幾類里所附加的專用性復分表,只供某一類或某些類目使用。其使用范圍在主表中有規(guī)定。如《地質工業(yè)規(guī)劃》的符號為“NA031”使用方法復分時將復分表的號碼之間加在主表號碼之后。工業(yè)專用綜合復分表關于仿分通過標引聯(lián)系了解。組配編號把兩個或三個互相關聯(lián)的類目組配起來,表示分類表中未列出的一個復雜概念。如:NJ37專用機械設備

宜入各類,如愿在此集中,采用組配編號法,按本分類法序列排。例如石油化工機械為NJ37:NR7三.對于幾個問題的處理1.交叉關系的處理中共各級組織所形成的檔案,內容屬于綜合性的和黨內事務的,歸入黨務類;內容屬專門業(yè)務的,歸入有關專類。各項專業(yè)活動所形成的具有交叉關系的檔案,恰當劃分各個類目的歸屬范圍設置互參2.集中與分散問題的處理基本原則——從總到分的原則,集中與分散相結合的辦法。具體處理:標準、計量、專利、環(huán)?!性O類干部管理——黨、政、軍三方面集中設類,即各方面形成的有關干部管理的檔案,分別集中于有關的三個類內;計劃、科學研究、基本建設、機械設備、經費——部分集中、部分分散。綜合性的、通用的、基礎性的——集中設類專項的、應用性的、專業(yè)的——歸入有關專類

第三節(jié)《中檔法》的管理一對《中檔法》實施管理的作用檔案分類法在使用過程中,會出現(xiàn)許多漏洞和錯誤。為修正這些錯誤,要修訂。新事物、新概念不斷涌現(xiàn),檔案材料不斷增加,要求分類表增加新類目。二.分類法修訂和管理的內容1.增加新類目,擴充加細。2.刪除不必要的類目3.調整類目體系4.增設附表和注釋5.采用分類新方法1.增加新類目,擴充加細。(1)直接增加下位類的細分。NL13運輸機細分為NL13運輸機

131運5型

132運7型

133運10型(2)把注釋改為下位類R122城市詳細規(guī)劃包括居住區(qū)規(guī)劃、中心規(guī)劃區(qū)、商業(yè)區(qū)規(guī)劃、工業(yè)區(qū)規(guī)劃、歷史地段保護規(guī)劃、專業(yè)工程詳細規(guī)劃、城市設計

細分R122城市詳細規(guī)劃

1221居住區(qū)規(guī)劃

1222中心區(qū)規(guī)劃

1223商業(yè)區(qū)規(guī)劃

1224工業(yè)區(qū)規(guī)劃

1226

歷史地段保護規(guī)劃

1227專業(yè)工程詳細規(guī)劃

1229其他

(3)加注“復分、仿分”進行細分。

TA6海洋資源開發(fā)與利用

依世界各國和地區(qū)表(Ⅰ)分ND78通用設備、儀器

仿NJ分(4)擴大組配編號法的使用范圍

TD49其他專業(yè)測量

宜入各專業(yè)類,如愿在此集中,采用組配編號法,按本分類法序列排。例:水文測量為TD49:ND2112.刪除不必要的類目對分類表中的漏洞、錯誤進行訂正、修改。3.調整類目體系增設基本大類、調整類目之間的關系以及不合理的排列順序,甚至對某些類的體系進行徹底修改。4.增設附表和注釋5.采用分類新方法三.《中檔法》的修訂第一版1987年12月特點:是我國第一部統(tǒng)一的檔案分類法是一個簡表,類目太粗,不能滿足分類需要。使用允許各使用單位根據(jù)本專業(yè)或本部門檔案的實際情況,對有關類目進行擴充加細。類目細分后,填寫《細分類目登記表》,報《中檔法》編委會審批。管理和修訂第2版1995年1月第2版在以下方面對第1版進行了修訂:根據(jù)我國檔案資源構成的實際情況,確定了“一法四表”的體系結構《中華人民共和國檔案分類表》《民國檔案分類表》《清代檔案分類表》《新民主主義革命檔案分類表》在第1版19大類基本穩(wěn)定的情況下,對類目進行了調整和擴充,類目總量由5000條增至10萬條。加大了使用復分、仿分、注釋、參見等現(xiàn)代文獻分類技術的力度,提高了分類表的檢索功能。第四章主題檢索語言與《中國檔案主題詞表》第一節(jié)主題檢索語言的構成、特點與性能第二節(jié)標題詞法與單元詞法的原理第三節(jié)敘詞法原理第四節(jié)《中國檔案主題詞表》體系結構第五節(jié)《檔案主題詞表》的評價與管理第五章第一節(jié)主題檢索語言的構成、特點與性能一.主題檢索語言用語詞表達文獻的主題內容,按字順排列,并設置參照系統(tǒng)顯示文獻主題之間關系和提供各種查詞途徑的概念標識系統(tǒng)。文件(案卷)內容概念主題標識(語詞)分類標識(分類號)標識主題分析概念轉換檔案數(shù)據(jù)值標準分類號、主題詞分類語言主題語言主題檢索語言的類型主題檢索語言標題詞語言單元詞語言敘詞語言關鍵詞語言二.特點標識(語詞)是事物名稱,一個檢索系統(tǒng)中,關于同一事物的全部文獻集中的同一標識下。如:主題語言大豆種植計劃、產量、收購、價格、進出口貿易、栽培技術、良種推廣、加工等分類語言經濟管理大豆計劃、產量農業(yè)大豆栽培、良種推廣輕工業(yè)大豆加工三.主題檢索語言的主要性能1.控制主題檢索系統(tǒng)所用的語詞標識,以保證其具有較高的檢索效率——規(guī)范化語詞2.引導使用者周密選詞——參照系統(tǒng)3.方便標引人員和檢索人員查找所需檢索詞——多種索引規(guī)范化標識之案例1.

文件級目錄工資薪金薪水薪餉薪俸俸給餉金文件題名檢索結果:檢索詞:工資薪金薪水薪餉薪俸俸給餉金

檢索結果60217959329480988累計:≥1755查全率34.3%10.19%3.3%18.7%27.35.58%0.45%規(guī)范化標識之案例2.

案卷級目錄工資共檢索到7條有關工資的條目薪金共檢索到3條有關薪金的條目薪水共檢索到3條有關薪水的條目薪餉共檢索到20條有關薪餉的條目薪俸共檢索到15條有關薪俸的條目共檢索到15條有關薪俸的條目案卷題名檢索結果:檢索詞:工資薪金薪水薪餉薪俸

檢索結果7332015第二節(jié)標題詞法與單元詞法的原理一.標題詞法(一)概念標題詞法是以標題詞作為語詞標識,對文獻進行標引與檢索的主題檢索語言。(二)標識1.標題詞一種檢索用的,經過規(guī)范化的自然語言的語詞標識。2.標題詞的類型依據(jù)標題詞在檢索系統(tǒng)中的作用,標題詞分為兩種:(1)主標題詞2.副標題詞在檢索系統(tǒng)中起主導作用的詞。多為表示事物概念的名詞。飛機、信息論、磨損在檢索系統(tǒng)中起次要作用的詞。多為表現(xiàn)主標題詞某一方面概念或通用概念的詞。對主標題詞起說明或限定作用。穩(wěn)定性、安全、應用、設計(三)標題詞法的特點1.采用規(guī)范的檢索用的語詞標識,主、副標題詞經過規(guī)范處理后,按固定的順序排列于標題詞表中。2.采用定組方式,即以主標題詞與副標題詞的固定組配形式來表達某一主題概念,標題詞法中未規(guī)定的組配關系,不能任意采用。3.一般采用二元組配,即一組檢索款目多由一個主標題詞和一個副標題詞組成。典型的標題詞法的檢索方式汽車

設計861231

液壓系統(tǒng)862022氣墊船

設計861568

維修863330

噪音865225組配結果:汽車設計汽車液壓系統(tǒng)定組不能組配:汽車維修汽車噪音不能三級組配:汽車液壓系統(tǒng)噪音(四)對標題詞法的分析優(yōu)點組配固定;組配誤差??;直觀性強。缺點采用定組方式,不能充分發(fā)揮主題詞法組配靈活的特點;二元組配難于表現(xiàn)專指度高的主題概念,降低了查準率。在反映概念之間關系方面,只能反映同義關系(“用—代”),不能反映等級(“屬—分”)關系,族性檢索功能較差。二.單元詞法(一)概念是一種以單元詞作為語詞標識,對文獻進行標引與檢索的主題檢索語言。(二)標識1.單元詞采用自然語言的形式;具有概念的獨立性與概念的單元性。單元詞所表達的概念具有獨立而完整的含義。單元詞所表達的概念是一個最基本的概念單元無論在含義上,還是在字面上,都不能再拆分令狐沖教育檔案武功武功秘籍2.在單元詞法中,單元詞按字順排列。(二)單元詞法的特點1.單元詞必須是規(guī)范的自然語言語詞,一個檢索系統(tǒng)所使用的全部單元詞記錄在規(guī)范的單元詞表中。2.采用后組配方式(后組),即在標引時單元詞不組配,而是在檢索時才將有關單元詞下所列出的文獻號加以對比,號碼相同者表明有組配關系。典型的單元詞語言的檢索方式不銹鋼焊接861081862522863519866330866332867573868582868996862111866332863519863981864530866332869091兩組文獻在兩個標識下都出現(xiàn),表明這兩個語詞有組配關系不銹鋼焊接(三)對單元詞法的分析優(yōu)點:運用組配功能,可以用較少的詞量,反映較多的主題概念。2.缺點:單元詞法的組配是字面組配,容易產生組配誤差,降低檢準率。實用性較差,在實際中很少使用。第三節(jié)敘詞法原理一.敘詞法的一般原理二.主題詞的編表選詞三.敘詞的組配四.主題詞的規(guī)范和控制五.主題詞法的特點第四節(jié)一.敘詞法的一般原理(一)概念(二)敘詞法對多種檢索語言原理的吸收(三)敘詞法的構成原理(四)敘詞的性質節(jié)目錄(一)概念敘詞法是一種采用表示單元概念的規(guī)范化詞語的組配來對文獻主題進行描述的后組式詞匯型概念標識系統(tǒng)。(二)敘詞法對多種檢索語言原理的吸收敘詞法功能組配功能輪排功能索引參照系統(tǒng)語詞規(guī)范化

單詞組配單元詞法概念組配組配分類法預先組配標題法對語詞的嚴格規(guī)范完善的參照系統(tǒng)關鍵詞法范疇索引等級索引主題詞輪排索引體系分類法一(三)敘詞法的構成原理1.按主題(文獻所論述或涉及的事物)集中文獻。2.用規(guī)范化的、可以通過組配(概念組配)來表達復雜概念的語詞直接標引文獻主題。3.用參照系統(tǒng)、分類索引、等級索引、輪排索引和主題詞關系圖等多種方式顯示主題概念之間的相互關系。4.用字順序列直接提供主題檢索途徑。5.用于標識單元方式手工檢索系統(tǒng)或用于計算機檢索系統(tǒng)時,具有標引深度大、能夠實現(xiàn)多途徑檢索,擴大、縮小或改變檢索范圍靈活,適應多種檢索要求等優(yōu)點。(四)敘詞的性質

1.概念性和描述性敘詞選用的是基本名詞術語,具有很強的概念性。(抽象)敘詞法允許用多個主題詞來比較具體地表達一個復雜的主題概念,因此有很好的描述性。(具體)如“草食性魚類”2.組配性主題詞組配是敘詞法的主要特征。主題詞組配嚴格遵守概念組配原則,檢索噪音大大降低。(與單元詞法相比)3.規(guī)范性敘詞法對主題詞采用了全面、嚴格的規(guī)范化措施,保證主題詞作為一種概念標識的高質量。4.語義關聯(lián)性采用比較嚴密的參照系統(tǒng)。還采用分類索引、等級索引、輪排索引、圖示法等,以多種形式建立主題詞語義網(wǎng)絡。有助于保證選詞的準確性和全面性,提高標引和檢索質量。5.動態(tài)性主題詞表定期修訂,根據(jù)實際需要進行增詞,刪減、改換詞,具有較輕反映新事物、新學科、新概念的能力。6.詞匯控制特點主題詞選詞主要依據(jù)詞的使用頻率,并據(jù)此對詞表進行增刪條件,保證現(xiàn)行主題詞都有一定實用價值和適當?shù)膶V付取?.適應計算機檢索系統(tǒng)的特點。由于主題詞標識是組配使用的,比較靈活,在檢索中可以運用邏輯檢索、加權檢索法等,能充分發(fā)揮計算機的邏輯運算能力。節(jié)目錄二.主題詞的編表選詞(一)選詞范圍(二)選詞原則(一)選詞范圍1.普通主題詞表示各種事物及其屬性的名詞。這些名詞所表達的是普通概念。反映各門學科、各種職能活動的基本術語多屬于這類名詞。如:土壤、棉花、檔案館2.專有主題詞表示某一特定事物的專有名詞。這些名詞表達的都是單獨概念如:地名、民族名和語言名、時代和年代、人名、機構、會議名、產品名、事件名、法規(guī)條約名等檔案主題詞表選詞范圍(二)選詞原則以所編主題詞表規(guī)定的專業(yè)或職能范圍為依據(jù)。要考慮被標引文獻的數(shù)量及其增長速度,文獻數(shù)量與主題詞數(shù)量要成一定比例。(用戶保障原則)要考慮檢索的具體要求:籠統(tǒng)要求,選表示事物名稱的詞;專深要求則還要選用反映事物方面、部分、特種的詞。充分發(fā)揮主題詞的優(yōu)異性能??紤]被選詞的使用頻率和檢索意義。使用頻率過高或過低的詞都不適用作為主題詞(文獻保障原則)。要有完備而數(shù)量盡可能少的基本詞匯。完備——針對大部分文獻的標引精煉——避免標引分散。注意選用詞義明確,符合科學性、通用性要求的詞。避免詞義含糊??紤]主題詞對檢索系統(tǒng)的適應性。機檢——少選詞組手檢——多選詞組節(jié)目錄三.敘詞的組配1.概念組配2.敘詞組配形式3.敘詞組配的作用節(jié)目錄1.概念組配

敘詞法的基本原理是概念組配

采用概念分析與綜合的邏輯方法,將復雜概念分解為幾個表達簡單概念的語詞收錄到敘詞表中,標引、檢索時用敘詞的組配來表達復雜主題概念。當某些概念分解后產生歧義時,就直接用詞組來表示。字面組配與概念組配的區(qū)別字面組配其實質是詞的分拆與組合(即拆詞)概念組配實質是詞義的分析與綜合(即拆義)區(qū)別方法概念組配的結果是參與組配的任何一個概念的下位類。圖示字面組配與概念組配區(qū)別字面組配宗教+社會學

宗教社會學

航空+病理學航空病理學

香蕉+蘋果香蕉蘋果

概念組配宗教+社會學

宗教社會學航空醫(yī)學+病理學航空病理學香蕉味食品+蘋果

香蕉蘋果2.敘詞組配形式(1)同級詞組配(交叉組配)同級詞:指表達相同性質概念的敘詞。同級詞組配:在兩個或兩個以上具有交叉關系的同級詞之間進行的組配。同級詞組配可以形成一個新概念。如:高等教育*教育改革高等教育改革(2)方面詞組配(限定組配)在一個表示事物的敘詞和表示事物某一屬性、某一方面的敘詞之間進行的組配。組配的結果可以形成一個新概念。這種組配形式在敘詞組配中應有最廣。如:水稻——栽培水稻栽培

錄音檔案——檔案保護技術錄音檔案保護技術(3)關系詞組配(概念聯(lián)結組配)在兩個或兩個以上具有密切聯(lián)系的敘詞之間進行的組配。其結果并不形成新的概念,而是反映了參加組配的敘詞之間的聯(lián)系。如:圖書館學-關系-檔案學圖書館學與檔案學的關系敘詞組配3.敘詞組配的作用可以控制詞匯量,縮小詞表篇幅??梢猿浞直磉_檔案主題,提高標引專指度。可以進行多途徑檢索和精確檢索,自由擴大、縮小和改變檢索范圍??梢约皶r反映新事物、新概念。使用計算機檢索的需要。敘詞組配四.主題詞的規(guī)范和控制詞匯控制,是指對大量的自然語言詞匯進行壓縮、優(yōu)選和規(guī)范化處理的過程。敘詞法選用表達文獻主題概念的自然語言語詞作標識,在選詞過程中進行了嚴格的詞匯控制。節(jié)目錄控制的內容:1.詞量控制2.詞類控制3.詞形控制4.詞義控制5.詞間關系控制節(jié)目錄1.詞量控制作用:自然語言詞匯量巨大,如果不加選擇地采用,會給檔案信息的存儲、組織和檢索帶來困難。因此,須對自然語言詞匯進行壓縮和精選,只將檔案標引和檢索鎖需要的詞匯精選出來加以系統(tǒng)組織和排列,對那些使用頻率過低的詞匯予以刪除或者合并。詞量控制的方法第一,建立一套完備而精煉的核心詞匯。完備——核心詞匯應是各學科專業(yè)所通用的基本詞匯,應相當完備,使得絕大部分檔案標引和信息組織不致困難。精煉——要將不常用的詞匯壓縮至最低限度。第二,控制專指度。專指度指檔案主題法的標識與檔案主題概念的相符程度。專指度過高的詞匯使用頻率較低,可將它們合并到其上位詞中,以減少詞匯量。第三,控制先組度。先組度指表達專指概念的復合詞(先組詞)在整個敘詞詞匯中所占的比例。詞匯中收錄的復合詞越多,其先組度越高,詞匯量也隨之增大。敘詞法作為組配型檢索語言,既選用了表達簡單概念的單詞(后組詞),也收入了相當數(shù)量的表達復雜概念的詞組(復合詞、先組詞),同一復雜概念,是選用復合詞,還是用單詞組配表達,是敘詞法中須解決的問題。一般來說,凡是用單詞組配能準確表達不會產生歧義的概念,都應選用單詞而在下列情況須使用復合詞當組配表達會產生意義失真或失去檢索意義時。如獵戶星云親屬語言文化水平在標引和檢索中使用頻率很高的詞組,分拆后又要組合在一起。如火箭推進器表達單獨概念的專用名詞。如環(huán)境工廠北京圖書館2、對詞類的控制檔案主題詞可選用的詞類,主要是能夠表達檔案主題概念的詞,包括

名詞名詞性詞組極少量形容詞由兩個或兩個以上的詞所組成的語言單位。一個詞組可以分拆為兩個詞。單純詞合成詞水戲劇其他詞類,如動詞、副詞、介詞、連詞、感嘆詞等,一概不選用。數(shù)詞不列入詞表,當標引需要時可按照規(guī)則使用。3.詞形控制漢字不同形體的優(yōu)選。簡體字、繁體字、異體字等的優(yōu)選漢語詞不同寫法的優(yōu)選。如壯族僮族主題詞詞序的規(guī)定。選擇自然詞序,不采用倒置詞序。如科技檔案(正式主題詞)科技,檔案(非正式主題詞)同義詞的優(yōu)選。學名與俗名,選學名新稱與舊稱,選新稱不同譯名、全稱、簡稱,選通行詞普通同義詞之間,選科學、確切、通用的詞準同義詞的優(yōu)選準同義詞指那些在詞語上十分相近、不是同義詞但可作為同義詞處理等那些詞。優(yōu)選的做法:將近義詞合并到其中較為通行的詞中。如經濟滲透

Y經濟擴張、將反義詞、否定詞合并到其正義詞和肯定詞中如漏檢率

Y檢全率將過于專指的詞合并到其上位詞中如象形

Y六書4.詞義控制指對多義詞和詞義含糊的詞加以限定和注釋。詞義控制方法限義詞——從學科、專業(yè)、地域、時間等方面對詞的含義加以限定如詞(語言學)詞(文學)黒旗軍(山東)黒旗軍(廣西)注釋——是對詞義含糊的詞進行說明或加定義,以明確詞的含義。如特大城市注:100萬人以上的城市限義詞和注釋的區(qū)別限義詞作為敘詞的組成部分,標引時要標出;注釋只是用來明確詞的含義和范圍,標引時不標出。5.詞間關系控制敘詞法采用的詞間關系控制方法:建立參照系統(tǒng)(主要手段)編制各種索引參照系統(tǒng)顯示詞間關系的方法用參照符號將敘詞間的等同關系、等級關系和相關關系予以全面顯示,形成一個語義網(wǎng)絡。漢語敘詞表所采用的參照符號等同關系

YD相關關系C等級關系

SF碳元素Y非合金鋼非合金鋼D碳元素檔案館F綜合性檔案館專業(yè)性檔案館信息論C控制論系統(tǒng)論綜合性檔案館S檔案館控制論C系統(tǒng)論信息論專業(yè)性檔案館S檔案館系統(tǒng)論C信息論控制論參照符號“Z”(族)為族首詞指引符,當詞表附有詞族索引(等級索引)時,才采用此符號,也顯示等級關系。參照符號

Z球類運動排球運動足球運動籃球運動乒乓球運動

……

……族首詞排球運動

Z球類運動五.主題詞法的特點1.直接性檔案主題法直接采用自然語言語詞作標識,較之分類法中的號碼標識在表達概念上比較直觀。主題法標識按字順排列,每個標識都處于同等地位,任何細小主題概念都可按字順索得,而不想分類法中被埋沒于層層類目之下。2.專指性由于主題法直接從檔案材料所論述和涉及的具體對象和問題選詞,并可通過組配方法來描述復雜主題概念,因此,無論主題如何專深,概念之間的關系如何復雜,只要其具有實際檢索意義,都可以根據(jù)需要進行主題標引,而不像分類法那樣受分類體系的限制,難于歸類。3.靈活性主題法中的每個標識都處于相對獨立的位置,能夠比較方便地加以增刪和修改??梢约皶r反映新學科、新事物、新概念,而不像分類法中的類目,受上位類、下位類、相關類、分類號的限制,牽一發(fā)而動全身。節(jié)目錄第四節(jié)《檔案主題詞表》的體系結構一.主表二.范疇索引三.詞族索引四.附表一.主表(一)概念:是詞表的正文部分,有全部正式主題詞和非正式主題詞按漢語拼音順序排列而成。。(二)《中國檔案主題詞表》的選詞范圍20世紀初葉以來反映黨、政管理工作的詞匯,及檔案中經常涉及的政治活動、科學研究、生產技術、經濟建設等方面的專業(yè)詞匯和反映新事物、新概念的詞匯主要包括以下方面的詞匯:1.中國各民族、各民族文字與語言的名稱,世界上其他主要文字、語言的名稱,主要宗教名稱;2.行政職務與專業(yè)技術職務名稱,軍職與軍銜名稱;3.部分國家法律和規(guī)章名稱;4.節(jié)目、節(jié)令名稱,具有特殊重要意義的會議名稱和有重大影響的歷史事件名稱;5.學科名稱及反映學科具體內容概念的部分詞目,重要的常見的化學元素、礦物、合金、化合物名稱;6.小說、戲劇、曲藝、詩歌、繪畫等文學藝術作品的泛稱詞及其使用頻率高的下位詞;7.田徑運動、水上運動、冰上運動和體操等體育運動項目名稱及其直接下位詞;8.常見的動物、植物、疾病、醫(yī)藥及各類工農業(yè)產品的名稱;9.槍械、火炮、彈藥等武器稱謂及其直接下位詞(三)詞的款目結構款目項Youyong………………漢語拼音游泳[CE]………………款目詞及其范疇號參照項D游水…………………“代”項F蝶泳……”分“項蛙泳仰泳自由泳S水上運動………………”屬“項Z體育運動*……………

”族”項C水球運動…………

…”參“項等級關系(等同關系)(相關關系)起排列和檢索入口作用該詞在范疇索引中的分類號顯示詞間關系節(jié)目錄二.范疇索引又稱分類索引。概念:將主表中的全部主題詞按其概念屬性劃分成大大小小的類目排列而成,以滿足從分類的途徑查詞的族性檢索的要求。《中國檔案主題詞表》范疇索引的特點其類目是參照《中檔法》主表的類目,并結合主題詞的特點而設置的,所有類目不超過三級。其標識符號采用漢語拼音字母與數(shù)字混合制,一、二級類目用字母標識,三級類目用阿拉伯數(shù)字標識?!吨袊鴻n案主題詞表》范疇索引的結構G文化、教育、衛(wèi)生、體育……一級類目GA文化……………二級類目GA1文學……

……三級類目當一個詞具有兩個類目的屬性時,在有關類目重復出現(xiàn)。節(jié)目錄三.詞族索引又稱等級索引概念將具有等級關系的主題詞匯集在一起,構成一個從泛指詞到專指詞的等級系統(tǒng)。作用可以從一族詞中外延最廣的族首詞出發(fā),找到一系列同族的主題詞,顯示其間的層層隸屬關系,增強詞表的族性檢索功能?!吨袊鴻n案主題詞表》的詞族索引《中國檔案主題詞表》確定族首詞1233個,入族主題詞1398條,占正式主題詞總數(shù)的52%,包括詞表中具有屬種關系、包含關系以及一部分具有整體與部分關系的主題詞?!吨袊鴻n案主題詞表》詞族索引的結構其結構是將入族的詞按等級展開的形式排列在族首詞之下,族首詞之間以及族首詞之下的同級主題詞之間依據(jù)拼音序列排列,族首詞為一級詞,其下分詞前置一個點為二級詞,二個點為三級詞,三個點為四級詞,以此類推。詞族索引無標注項和參照項,不包括非正式主題詞。節(jié)目錄四.附表附表一般由專有敘詞詞匯匯編而成,包括人名、地名、機構名、產品名等。附表的作用將專有敘詞單獨編成附表,可避免主表體積過大,方便查詞。附表中所收詞匯與主表一般不重復,實際上是主表的一個組成部分?!吨袊鴻n案主題詞表》的附表1.人名表共11771位明清以來重要人物主要收錄明清時期進士、三品以上命官;民國重要政府及執(zhí)政黨的正部級官員;中華人民共和國中央人民政府及中共中央部委局辦一級機構正職以上領導人,其他黨派、團體主義負責人,上將、正軍級以上國職人員,全國各界著名人士,著名華僑與國際友人,與中國重大歷史事件有關的著名外國人等。人名表的結構Shenjunru沈鈞儒(1875——1963浙江嘉興)

D沈秉甫沈衡山2.機構名表收錄明清1900個明清以來中央級黨、政、軍、社團、企事業(yè)機構名稱包括:明清時期重要政府機構以及著名工礦、學堂名稱,辛亥革命以來中央政府及其直屬機構和派出機構名稱,中央立法、司法、軍事機構以及大軍區(qū)的名稱,執(zhí)政黨中央機構和派出機構名稱,其他政但、團體中央機構名稱,有影響的全國學會、協(xié)會、宗教團體名稱,重要級企事業(yè)單位名稱以及與上述機構有相同級別的臨時機構的名稱等機構名表的款目結構及款目詞排序方法與主表級別相同,但不標范疇號,也無注釋。參照項設Y、D、C。Zhongxuanbu中宣部

D中共中央宣傳部Disijixiegongyebu第四機械工業(yè)部

C電子工業(yè)部節(jié)目錄第五節(jié)檔案主題詞表的評價與管理一.檔案主題詞表的評價二.檔案主題詞表的管理一.檔案主題詞表的評價(一)詞表結構評價1.詞表結構的嚴密性詞表的各個組成部分相互對應、相互指引的程度。主表和輔助表各司其職,功能互補,提供不同的查詞途徑,又相互聯(lián)系,構成有機整體。2.詞表結構與功能的成本效益用盡可能見簡明的結構達到盡可能齊全的功能。功能齊全但結構復雜、不編使用,或結構簡單但功能單一,都是不可取的。3.詞表的易用性指詞表的結構模式、排檢方式是否易于標引和檢索,如有無詳盡的使用說明,是否提供了多種查檢手段或輔助工具等。(二)詞匯水平評價1.完備性與詞匯量的大小有關,詞表詞匯量的多少決定了詞表的規(guī)模。一般說來,詞匯量越大,詞匯的完備性越高。完備性受詞表性質、專業(yè)范圍、檔案數(shù)量、先組度等多種因素制約。應以基本滿足標引需要為限。2.專指度指詞匯表表達檔案主題概念的確切程度。可通過詞匯的使用頻率來衡量。使用頻率過高,說明專指度偏低,需

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論