版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
檔案的檢索第七章內(nèi)容提要本章著重介紹和講述了檔案檢索的原理、規(guī)則、標(biāo)準(zhǔn)和方法等方面的管理知識(shí)。主要內(nèi)容包括:檔案檢索概述,檔案檢索語(yǔ)言,檔案的著錄標(biāo)引,檔案檢索體系和檔案目錄數(shù)據(jù)庫(kù)的建設(shè),等等。第七章檔案檢索概述第一節(jié)檔案的檢索檔案檢索語(yǔ)言第二節(jié)檔案的著錄標(biāo)引第三節(jié)檔案檢索體系和檔案目錄數(shù)據(jù)庫(kù)的建設(shè)第四節(jié)檔案安全保障體系和檔案應(yīng)急處置管理第五節(jié)一、檔案檢索的概念與基本內(nèi)容二、檔案檢索的意義和作用三、檔案檢索的基本原理四、檔案檢索的類(lèi)型五、檔案檢索效率和檢索策略檔案檢索概述第一節(jié)第七章檔案的檢索第一節(jié)檔案檢索概述一般來(lái)說(shuō),檔案檢索是對(duì)檔案信息進(jìn)行系統(tǒng)存儲(chǔ)并根據(jù)需要進(jìn)行查找的過(guò)程。檔案檢索是開(kāi)展檔案信息服務(wù)的必要條件和開(kāi)發(fā)檔案信息資源的重要手段。檔案檢索可以有廣義和狹義兩種解釋。廣義的檔案檢索包括存儲(chǔ)與查找兩個(gè)過(guò)程。狹義的檔案檢索就是查找檔案中有用數(shù)據(jù)和信息的過(guò)程。因此,就整體而言,檔案檢索的全過(guò)程由檔案信息存儲(chǔ)和查找兩個(gè)部分構(gòu)成。存儲(chǔ)是指把檔案中具有檢索意義的屬性和特征揭示出來(lái),加以組織,形成檢索工具或檔案信息數(shù)據(jù)庫(kù)的過(guò)程;查找是指利用檔案檢索工具或數(shù)據(jù)庫(kù),找到用戶(hù)所需檔案數(shù)據(jù)、信息的過(guò)程。存儲(chǔ)是查找的前提,查找是存儲(chǔ)的目的。檔案檢索除了具備一般信息檢索的功能和特性外,還有一種較為重要的功能表現(xiàn),即在檔案檢索體系中,館藏性檔案檢索工具所起到的登記、統(tǒng)計(jì)、審計(jì)、監(jiān)督等作用。不僅館藏性的檔案檢索工具有這種特殊的作用,其他按照檔案著錄規(guī)則編制或建立的檢索工具、檢索系統(tǒng),還具有記錄和反映檔案的來(lái)源、所屬全宗、所屬檔案分類(lèi)體系之間歷史有機(jī)聯(lián)系特征的作用。檔案檢索的這些特點(diǎn),是由檔案資源本身的形成規(guī)律和特點(diǎn)決定的,也是檔案檢索有別于其他信息檢索、文獻(xiàn)檢索的突出特點(diǎn)。因此,那種認(rèn)為檔案檢索就是信息檢索的觀點(diǎn)是有失偏頗的。一、檔案檢索的概念與基本內(nèi)容(一)檔案檢索的概念檔案檢索的存儲(chǔ)工作的主要內(nèi)容包括:(1)著錄和標(biāo)引。著錄是對(duì)檔案的來(lái)源、全宗、類(lèi)別、管理史、內(nèi)容和形式特征進(jìn)行分析、選擇和記錄的過(guò)程;標(biāo)引主要是根據(jù)檔案記錄和反映的職能活動(dòng)主題內(nèi)容,賦予其規(guī)范化檢索標(biāo)識(shí)的過(guò)程。相關(guān)知識(shí)可參閱本章第三節(jié)的內(nèi)容。(2)組織檢索工具。即對(duì)著錄和標(biāo)引后形成的條目進(jìn)行系統(tǒng)排列,組成各種檢索工具,或輸入檔案信息管理系統(tǒng),建立檔案目錄數(shù)據(jù)庫(kù)的過(guò)程。檔案檢索的查檢工作的主要內(nèi)容包括:(1)確定查檢內(nèi)容。即對(duì)用戶(hù)的檢索需求進(jìn)行分析,明確用戶(hù)需求主題的過(guò)程。(2)查檢操作。即檔案人員或用戶(hù)利用檔案目錄、索引、指南或檔案信息檢索系統(tǒng),從中找到與所需主題相匹配的信息線(xiàn)索或檔案數(shù)據(jù)、信息的過(guò)程。(二)檔案檢索的主要內(nèi)容檔案檢索,尤其是在信息網(wǎng)絡(luò)環(huán)境下開(kāi)展的檔案檢索工作,要求檔案的著錄、標(biāo)引人員具備較好的業(yè)務(wù)素養(yǎng),不斷地根據(jù)信息技術(shù)的發(fā)展要求和信息檢索技術(shù)的應(yīng)用要求,提高自身的業(yè)務(wù)素質(zhì)和工作能力。立檔單位的檔案部門(mén)和國(guó)家檔案館的用戶(hù)滿(mǎn)意度高低,在很大程度上取決于檔案檢索系統(tǒng)的質(zhì)量和檔案檢索服務(wù)的水平。二、檔案檢索的意義和作用(一)是提高檔案管理部門(mén)業(yè)務(wù)工作質(zhì)量和利用服務(wù)水平的重要手段從某種意義上說(shuō),檔案檢索是一種在大量的檔案信息和用戶(hù)需求之間進(jìn)行居間促成的過(guò)程,是從最接近用戶(hù)請(qǐng)求的檔案信息中檢索選定的相關(guān)信息線(xiàn)索和信息內(nèi)容的過(guò)程。這說(shuō)明,檔案檢索常常是促進(jìn)檔案價(jià)值實(shí)現(xiàn)的必由途徑。通過(guò)檢索,可以及時(shí)、準(zhǔn)確地將用戶(hù)所需要的檔案數(shù)據(jù)、信息查找出來(lái),實(shí)現(xiàn)檔案信息及時(shí)利用、有效利用和廣泛傳播的檔案管理目標(biāo)。(二)是廣泛傳播檔案信息,促進(jìn)檔案利用價(jià)值實(shí)現(xiàn)的必要途徑通過(guò)編制和使用某些檔案檢索工具,開(kāi)展規(guī)范的檔案著錄標(biāo)引工作,可以實(shí)現(xiàn)對(duì)檔案資源的智力控制,保證為利用者提供可靠、真實(shí)、可理解、可利用的檔案資源。例如,通過(guò)對(duì)多級(jí)檔案著錄等規(guī)則的應(yīng)用,立檔單位和國(guó)家檔案館可以有效地分析、選擇和記錄檔案的所屬全宗、檔案文件及其組合體的來(lái)源線(xiàn)索、檔案的管理史、檔案的所屬類(lèi)項(xiàng)及法律法規(guī)約束要求等方面的信息線(xiàn)索,從而為從事歷史研究、科學(xué)研究、業(yè)務(wù)研究的檔案用戶(hù)以及檔案管理人員等,提供清晰可辨的歷史線(xiàn)索及檔案文件之間的關(guān)聯(lián)信息線(xiàn)索。(三)是維護(hù)檔案真實(shí)性、可理解性、可利用性的必要手段就整體而言,檔案檢索的一般原理可以被理解為:對(duì)經(jīng)過(guò)系統(tǒng)化整合的檔案資源檢索信息集合與檔案利用者需求信息集合進(jìn)行合理匹配、選擇的過(guò)程。三、檔案檢索的基本原理存儲(chǔ):也稱(chēng)檔案資源信息組織,其目的是通過(guò)一定的方式,按照一定的規(guī)則要求,把原始狀態(tài)的檔案資源轉(zhuǎn)化為一種有序的檔案信息集合?!皺n案資源”與“檔案”的區(qū)別是:檔案資源既包括一般意義上的檔案,同時(shí)也包括通過(guò)數(shù)字化加工而獲得的檔案數(shù)字化副本、可以彌補(bǔ)檔案內(nèi)容不足的文獻(xiàn)資料等。所以,檔案資源是一個(gè)綜合性的概念。(一)存儲(chǔ)檔案檢索的查檢過(guò)程實(shí)質(zhì)上是存儲(chǔ)過(guò)程的逆過(guò)程。查檢的過(guò)程是利用者的信息提問(wèn)與檔案資源檢索信息相比較而決定檔案取舍的過(guò)程。在一般的檢索實(shí)踐中,檔案利用者首先要通過(guò)自然語(yǔ)言將自己對(duì)檔案資源的需求表達(dá)出來(lái),之后檔案資源管理部門(mén)針對(duì)用戶(hù)的信息提問(wèn),進(jìn)行需求主題概念分析,并將概念分析的結(jié)果根據(jù)一定的檢索語(yǔ)言規(guī)則轉(zhuǎn)換成檢索詞。最后則是用檢索詞與存儲(chǔ)的檢索信息相比較和匹配,如能取得一致,則被檔案信息檢索系統(tǒng)檢索命中,找到所需檔案資源;如果無(wú)法匹配,就需改換或修改檢索詞,繼續(xù)重新查找,直到兩者一致為止。(二)查檢一是全文檢索。這種檢索是以檔案文件或其組合體的全文、摘要等為對(duì)象的檔案檢索活動(dòng)。例如,利用者為了進(jìn)行歷史研究、科學(xué)研究、編寫(xiě)參考資料等,需要大量的檔案文件作為參考和支撐,為滿(mǎn)足這些利用需求,就需要檔案部門(mén)開(kāi)展相應(yīng)的全文檢索服務(wù)。二是數(shù)據(jù)檢索。檔案數(shù)據(jù)庫(kù)中存儲(chǔ)了大量的業(yè)務(wù)活動(dòng)數(shù)據(jù)、專(zhuān)業(yè)性數(shù)據(jù)、科技數(shù)據(jù)、自然現(xiàn)象的觀測(cè)觀察及分析性數(shù)據(jù)、各種統(tǒng)計(jì)數(shù)據(jù)等,這些數(shù)據(jù)資源常常是決策者、研究者、設(shè)計(jì)者、市場(chǎng)分析者、數(shù)據(jù)分析工程師等用戶(hù)經(jīng)常需要檢索和訪(fǎng)問(wèn)的對(duì)象。為此,檔案部門(mén)應(yīng)利用相應(yīng)的檔案信息檢索系統(tǒng),滿(mǎn)足此類(lèi)用戶(hù)對(duì)數(shù)據(jù)查詢(xún)、數(shù)據(jù)分析的利用需求。三是事實(shí)檢索。檔案資源的檢索信息集合中,包含了大量的反映人類(lèi)活動(dòng)事件、項(xiàng)目、案件等方面的著錄信息線(xiàn)索(如時(shí)間、地點(diǎn)、人物、事件過(guò)程、事件結(jié)果等)和相關(guān)的元數(shù)據(jù)。這些信息可以有效地滿(mǎn)足相關(guān)檔案用戶(hù)對(duì)歷史事件的事實(shí)性數(shù)據(jù)查詢(xún)的需要。四、檔案檢索的類(lèi)型(一)從存儲(chǔ)和查檢的內(nèi)容角度事實(shí)檢索是一個(gè)相當(dāng)復(fù)雜的過(guò)程,目前通常還需要依靠人工來(lái)完成。具體做法是:首先利用檔案檢索工具、工具書(shū)、數(shù)據(jù)庫(kù)或其他途徑查出相關(guān)的原始檔案數(shù)據(jù)、事實(shí)或檔案文件的信息線(xiàn)索,然后進(jìn)行比較分析,篩選過(guò)濾,最后才將得到的事實(shí)數(shù)據(jù)提供給利用者。隨著信息社會(huì)的進(jìn)步和發(fā)展,數(shù)字檔案資源和電子檔案資源在整個(gè)檔案資源中所占的比重越來(lái)越高,尤其是電子政務(wù)、電子商務(wù)、物聯(lián)網(wǎng)的發(fā)展,極大地改變了人們保存和利用信息資源的理念和做法。檔案資源的檢索對(duì)象越來(lái)越數(shù)字化,檔案檢索的類(lèi)型也出現(xiàn)了新的變化。文本檢索、圖像檢索、聲音檢索、圖片檢索等都已成為現(xiàn)代檔案資源信息檢索的重要組成部分。1.文本檢索文本檢索,亦稱(chēng)自然語(yǔ)言檢索,是指根據(jù)文本內(nèi)容(如關(guān)鍵字、語(yǔ)意等)對(duì)文本集合進(jìn)行檢索、分類(lèi)、過(guò)濾等。從信息技術(shù)角度來(lái)說(shuō),文本檢索,指在不對(duì)檔案資源對(duì)象進(jìn)行任何標(biāo)引的情況下,直接通過(guò)計(jì)算機(jī)以自然語(yǔ)言中的語(yǔ)詞匹配查找的系統(tǒng)檢索方式。文本檢索進(jìn)行匹配的對(duì)象,可以是完整的檔案文件或其組合體,也可以是它的各個(gè)數(shù)據(jù)元,如題名、責(zé)任者、成文時(shí)間、職能主題、事件主題、業(yè)務(wù)活動(dòng)主題、記錄對(duì)象等。以檔案文件正文為對(duì)象進(jìn)行的匹配查找,被稱(chēng)為全文檢索。這種方式無(wú)須標(biāo)引,數(shù)據(jù)庫(kù)制作快,可以很快投入運(yùn)行。2.圖像檢索基于內(nèi)容的圖像檢索是通過(guò)對(duì)圖像集中的各個(gè)對(duì)象進(jìn)行內(nèi)容特征分析、相似度匹配來(lái)實(shí)現(xiàn)檢索目標(biāo)的。20世紀(jì)90年代以后,出現(xiàn)了對(duì)圖像的內(nèi)容語(yǔ)義,如圖像的顏色、紋理、布局等進(jìn)行分析和檢索的圖像檢索技術(shù),即基于內(nèi)容的圖像檢索(ContentBasedImageRetrieval,CBIR)技術(shù)。CBIR屬于基于內(nèi)容檢索(ContentBasedRetrieval,CBR)的一種,CBR中還包括對(duì)動(dòng)態(tài)視頻、音頻等其他形式多媒體信息的檢索技術(shù)。該技術(shù)的出現(xiàn)和應(yīng)用,為檔案部門(mén)提升對(duì)圖像型檔案資源的檢索能力,創(chuàng)造了有利條件。。1.全文檢索全文檢索是依托全文數(shù)據(jù)庫(kù)而進(jìn)行的一種檔案檢索類(lèi)型。檔案全文數(shù)據(jù)庫(kù)是將一個(gè)完整的信息源的全部?jī)?nèi)容轉(zhuǎn)化為計(jì)算機(jī)可以識(shí)別、處理的信息單元而形成的數(shù)據(jù)集合,它具有對(duì)全文數(shù)據(jù)進(jìn)行詞、字、段落等更深層次的編輯加工的功能。檔案全文數(shù)據(jù)庫(kù)的特點(diǎn)是:(1)檔案全文數(shù)據(jù)庫(kù)包含的信息基本上是未經(jīng)信息加工的原始文本,具有良好的客觀性。(2)檔案全文數(shù)據(jù)庫(kù)的信息檢索可對(duì)文中任何內(nèi)容及其位置關(guān)系進(jìn)行查檢。(3)以自然語(yǔ)言檢索檔案文件。(4)檔案數(shù)據(jù)具有相對(duì)穩(wěn)定性。(5)數(shù)據(jù)庫(kù)中的檔案數(shù)據(jù)結(jié)構(gòu)具有非結(jié)構(gòu)性。(二)從檢索系統(tǒng)中檔案信息的組織方式角度檔案全文檢索系統(tǒng)的實(shí)現(xiàn)技術(shù),主要包括:(1)檔案數(shù)據(jù)準(zhǔn)備。即對(duì)計(jì)劃加載到全文數(shù)據(jù)庫(kù)中的檔案數(shù)據(jù)進(jìn)行預(yù)處理,并組織專(zhuān)門(mén)人員錄入建庫(kù)。(2)文本預(yù)處理。包括規(guī)范格式,當(dāng)格式多種多樣時(shí),應(yīng)加以整理,使檔案文件的格式規(guī)范化。(3)數(shù)據(jù)加載。數(shù)據(jù)準(zhǔn)備好以后,便可以加載到數(shù)據(jù)庫(kù)文件中去了。加載數(shù)據(jù)可用單件方式或批量方式。單件方式一次加載一份,適用于平時(shí)對(duì)檔案文件的隨時(shí)加載。批量方式一次加載多份,適用于集中大量加載的情況。(4)數(shù)據(jù)檢索。數(shù)據(jù)庫(kù)建立起來(lái)之后,利用者便可根據(jù)全文檢索系統(tǒng)提供的檢索功能對(duì)數(shù)據(jù)庫(kù)進(jìn)行檢索了。(5)數(shù)據(jù)維護(hù)。在全文數(shù)據(jù)庫(kù)建立以后,檔案部門(mén)需要經(jīng)常對(duì)數(shù)據(jù)庫(kù)的內(nèi)容進(jìn)行索引、更新、追加和清理。2.多媒體檢索多媒體檢索是一種基于內(nèi)容的圖像(視頻)的檢索,是通過(guò)提取圖像(視頻)的顏色、紋理、形狀和運(yùn)動(dòng)等視覺(jué)特征來(lái)表征圖像(視頻)內(nèi)容所蘊(yùn)含的語(yǔ)義,進(jìn)而實(shí)現(xiàn)查詢(xún)與管理圖像(視頻)數(shù)據(jù)的檢索目標(biāo)。多媒體檢索一般指多媒體分類(lèi)分檢索?;趦?nèi)容的視頻檢索、音頻檢索和基于視覺(jué)、聽(tīng)覺(jué)感知特征相似度比較的檢索,對(duì)多媒體內(nèi)容的描述都是基于其所蘊(yùn)含的語(yǔ)義信息來(lái)實(shí)現(xiàn)的。目前,語(yǔ)義概念模型主要包括:(1)高級(jí)語(yǔ)義,是對(duì)不同時(shí)空的若干多媒體事件高度抽象概念化的結(jié)果,它需要探討人腦的思維機(jī)制。(2)中級(jí)語(yǔ)義,是對(duì)高級(jí)語(yǔ)義中涉及的人、事件的分別描述,不涉及幾個(gè)事件的交叉。(3)低級(jí)語(yǔ)義,是利用視覺(jué)、聽(tīng)覺(jué)信息對(duì)多媒體數(shù)據(jù)進(jìn)行初步分類(lèi),如音樂(lè)、語(yǔ)音等。檔案部門(mén)及相關(guān)信息管理部門(mén)可以通過(guò)對(duì)多媒體數(shù)據(jù)進(jìn)行語(yǔ)義標(biāo)注,實(shí)現(xiàn)多媒體檔案的結(jié)構(gòu)化,從而有效組織多媒體數(shù)據(jù)流,為多媒體檔案資源的檢索提供方便。(二)從檢索系統(tǒng)中檔案信息的組織方式角度3.超媒體檢索超媒體即“超級(jí)媒體”。超媒體是一種采用非線(xiàn)性網(wǎng)狀結(jié)構(gòu)對(duì)塊狀多媒體信息(包括文本、圖像、視頻等)進(jìn)行組織和管理的技術(shù)。超媒體在本質(zhì)上和超文本是一樣的,只不過(guò)超媒體技術(shù)在誕生的初期所管理的對(duì)象是純文本,所以被叫作超文本。隨著多媒體檢索技術(shù)的興起和發(fā)展,超媒體檢索技術(shù)的管理對(duì)象從純文本擴(kuò)展到了多媒體。從檔案檢索的實(shí)現(xiàn)方式角度來(lái)劃分,檔案檢索包括線(xiàn)下檢索和線(xiàn)上網(wǎng)絡(luò)檢索兩種類(lèi)型。從今后的發(fā)展趨勢(shì)看,線(xiàn)上網(wǎng)絡(luò)檢索,尤其是移動(dòng)網(wǎng)絡(luò)檢索,將成為檔案利用者檢索和利用檔案資源的主要方式。從歷史上看,檔案資源的信息檢索經(jīng)歷了從手工檢索、計(jì)算機(jī)輔助檢索到網(wǎng)絡(luò)化、智能化檢索等多個(gè)發(fā)展階段。檔案資源的信息檢索的對(duì)象從相對(duì)封閉、穩(wěn)定一致、由獨(dú)立數(shù)據(jù)庫(kù)集中管理的檔案資源的信息內(nèi)容擴(kuò)展到開(kāi)放、動(dòng)態(tài)、更新快、分布廣泛、管理松散的網(wǎng)絡(luò)內(nèi)容;檔案資源的信息檢索的利用者也由原來(lái)的檔案專(zhuān)業(yè)人員擴(kuò)展到包括公務(wù)員、企業(yè)人員、教師學(xué)生等在內(nèi)的人群。利用者對(duì)檔案資源的信息檢索從結(jié)果到方式都提出了更高的要求。適應(yīng)網(wǎng)絡(luò)化、智能化以及個(gè)性化的需要,是目前檔案資源的信息檢索技術(shù)發(fā)展的新趨勢(shì)。(三)從檔案檢索的實(shí)現(xiàn)方式角度我國(guó)的《數(shù)字檔案館建設(shè)指南》《企業(yè)數(shù)字檔案館(室)建設(shè)指南》均對(duì)數(shù)字檔案館、數(shù)字檔案室的信息檢索系統(tǒng)的功能提出了指導(dǎo)性的要求。包括:不設(shè)定檢索字段的簡(jiǎn)單檢索,選定多項(xiàng)檢索字段及其邏輯關(guān)系的高級(jí)檢索,精確檢索和模糊檢索,跨檔案門(mén)類(lèi)檢索,全文檢索,篩選檢索,截詞檢索,等等。應(yīng)支持用戶(hù)根據(jù)需要設(shè)定任意檢索條件查找其權(quán)限許可范圍內(nèi)的數(shù)字檔案資源,并能在檢索結(jié)果中做更精確查找。1.精確檢索精確檢索,又稱(chēng)精確搜索,即精確匹配檢索,是指檢索詞與資源庫(kù)中某一字段完全相同的檢索方式。精確匹配是指只有整個(gè)字段與檢索詞相同才匹配。精確檢索是指將輸入的檢索詞作為固定詞組進(jìn)行檢索。2.模糊檢索模糊檢索,即同義詞檢索,是指檔案信息檢索系統(tǒng)自動(dòng)按照利用者輸入關(guān)鍵詞的同義詞進(jìn)行模糊檢索,從而獲得更多檢索結(jié)果。(四)從檔案檢索的匹配方式角度3.跨檔案門(mén)類(lèi)檢索跨檔案門(mén)類(lèi)檢索,又稱(chēng)跨庫(kù)檢索,是指檔案信息檢索系統(tǒng)自動(dòng)按照利用者輸入的檢索詞,在不同的檔案數(shù)據(jù)庫(kù)(包括目錄庫(kù)、全文庫(kù)、專(zhuān)題庫(kù)等資源庫(kù))中進(jìn)行檢索,為利用者提供更多檢索結(jié)果的匹配檢索方式。這種檢索可以極大地提高檔案資源利用者所需檔案信息的查全率。4.篩選檢索篩選檢索,又稱(chēng)篩選搜索,是檔案資源數(shù)據(jù)檢索流程中的一個(gè)重要階段。數(shù)據(jù)檢索包括數(shù)據(jù)排序和數(shù)據(jù)篩選兩項(xiàng)操作。(1)數(shù)據(jù)排序。在查看數(shù)據(jù)時(shí),往往需要按照實(shí)際需要,把數(shù)據(jù)按一定的順序排列展示出來(lái),這個(gè)過(guò)程被稱(chēng)為數(shù)據(jù)排序。(2)數(shù)據(jù)篩選,是指根據(jù)給定的條件,從排序表中查找滿(mǎn)足條件的記錄并且顯示出來(lái),不滿(mǎn)足條件的記錄會(huì)被隱藏起來(lái),這些條件被稱(chēng)為篩選條件。5.截詞檢索檔案信息截詞檢索是預(yù)防漏檢、提高檔案信息查全率的一種常用檢索技術(shù)。檔案信息檢索系統(tǒng)應(yīng)具備提供截詞檢索的功能。所謂截詞,是指在檔案檢索詞的合適位置進(jìn)行截?cái)?,然后使用截詞符①進(jìn)行處理,這樣既可減少輸入的字符數(shù)目,又可達(dá)到較高的查全率。截詞檢索一般采用后截?cái)?,部分支持中截?cái)?,能夠幫助提高檢索的查全率。檔案檢索效率,主要是指查找所需檔案信息、數(shù)據(jù)的全、準(zhǔn)程度,即查全率和查準(zhǔn)率。衡量檔案檢索效率的指標(biāo)有查全率、查準(zhǔn)率、漏檢率、誤檢率、檢索速度。這五個(gè)評(píng)價(jià)指標(biāo)的具體含義和計(jì)算方法如下。1.查全率檔案查全率,是指從檔案資源數(shù)據(jù)庫(kù)內(nèi)檢出的相關(guān)的信息量與總量的比例查全率=(檢出的相關(guān)文檔數(shù)據(jù)量÷數(shù)據(jù)庫(kù)內(nèi)相關(guān)文檔數(shù)據(jù)總量)×100%2.查準(zhǔn)率檔案查準(zhǔn)率是衡量某一檢索系統(tǒng)的信號(hào)噪聲比的一種指標(biāo),是指檢出的相關(guān)檔案數(shù)據(jù)(檔案信息線(xiàn)索)與檢出的全部數(shù)據(jù)(檔案信息線(xiàn)索)的百分比查準(zhǔn)率=(檢出的相關(guān)文檔數(shù)據(jù)量÷檢出的文檔數(shù)據(jù)總量)×100%五、檔案檢索效率和檢索策略(一)檔案檢索效率3.漏檢率檔案漏檢率即漏檢比例或漏檢概率,是與查全率相對(duì)應(yīng)的概念漏檢率=(未檢出的相關(guān)文檔數(shù)據(jù)量÷數(shù)據(jù)庫(kù)內(nèi)相關(guān)文檔數(shù)據(jù)總量)×100%4.誤檢率檔案誤檢率是指檢出的不相關(guān)文檔數(shù)據(jù)量與檢出的文檔數(shù)據(jù)總量之比誤檢率=(檢出的不相關(guān)文檔數(shù)據(jù)量÷檢出的文檔數(shù)據(jù)總量)×100%5.檢索速度檔案檢索速度是指利用者檢索相關(guān)檔案信息時(shí)的系統(tǒng)響應(yīng)時(shí)間長(zhǎng)短影響檔案檢索效率的因素是多種多樣的,具體來(lái)說(shuō)包括如下因素:(1)造成檔案查全率低的因素主要包括:檔案資源庫(kù)收錄數(shù)據(jù)不全;檔案索引詞匯缺乏控制和專(zhuān)指性;檔案詞表結(jié)構(gòu)不完整;詞間關(guān)系模糊或不正確;標(biāo)引不詳;檔案標(biāo)引前后不一致;檔案標(biāo)引人員遺漏了檔案文件的重要概念或用詞不當(dāng);檢索策略過(guò)于簡(jiǎn)單;等等。(2)造成檔案查準(zhǔn)率低的因素主要有:索引詞不能準(zhǔn)確描述檔案主題和檔案檢索要求;檔案標(biāo)引的組配規(guī)則不嚴(yán)密;選詞及詞間關(guān)系不正確;標(biāo)引過(guò)于詳盡;組配錯(cuò)誤;檔案檢索時(shí)所用檢索詞(或檢索表達(dá)式)的專(zhuān)指度不夠,檔案檢索面寬于檢索要求;等等。檔案檢索策略,就是在分析檢索提問(wèn)的基礎(chǔ)上,確定檢索的數(shù)據(jù)庫(kù)、檢索用詞,并明確檢索詞之間的邏輯關(guān)系和查找步驟的計(jì)劃安排。所謂“檢索表達(dá)式”是指檢索用詞與各運(yùn)算符組配成的算式。(二)檔案檢索策略檔案部門(mén)在對(duì)檔案利用者的需求分析中,通常應(yīng)澄清如下問(wèn)題:1.分析檔案信息利用者的檢索目的2.主題分析對(duì)利用者需求的主題分析應(yīng)注意處理好以下幾個(gè)問(wèn)題:第一,需求概念的表達(dá)要確切。抓住需求的實(shí)質(zhì)性?xún)?nèi)容,分析出需求中有幾個(gè)概念組面。第二,找出核心需求的概念因素,排除掉無(wú)關(guān)概念因素;對(duì)意義不大的概念和重復(fù)概念,應(yīng)加以排除。事實(shí)上,過(guò)多過(guò)嚴(yán)的概念組配很可能導(dǎo)致大量的漏檢,甚至使檢索結(jié)果為零。因此有時(shí)需要簡(jiǎn)化邏輯關(guān)系,減少概念的限定詞,以提高檢索效果。第三,找出隱含的概念。檔案數(shù)據(jù)庫(kù)的標(biāo)引往往使用比較專(zhuān)指的詞,而用戶(hù)對(duì)標(biāo)引規(guī)則又不甚了解,往往會(huì)列出比較抽象的概念,而忽略了較專(zhuān)指的概念。第四,明確概念之間的邏輯(“與”“或”“非”)關(guān)系。弄清什么概念可用于擴(kuò)大檢索范圍,什么概念可作為進(jìn)一步縮小檢索范圍的用詞。一、檔案檢索語(yǔ)言概述二、《中國(guó)檔案分類(lèi)法》簡(jiǎn)介三、《中國(guó)檔案主題詞表》簡(jiǎn)介檔案檢索語(yǔ)言第二節(jié)第七章檔案的檢索第二節(jié)檔案檢索語(yǔ)言檔案檢索語(yǔ)言由詞匯和語(yǔ)法組成。通常具有三個(gè)構(gòu)成要素:一組系統(tǒng)的文字或符號(hào),用來(lái)構(gòu)成檢索詞匯要素,如分類(lèi)號(hào)、主題詞、檔號(hào)等;具有一定量的詞匯,基本上可以表達(dá)檔案信息中所包含的主題概念;一套明確的語(yǔ)法規(guī)則,用以滿(mǎn)足檔案檢索系統(tǒng)多樣化的檢索需求。主要特點(diǎn):可以簡(jiǎn)明、專(zhuān)指地表達(dá)檔案及檢索需求的主題概念;詞語(yǔ)與概念一一對(duì)應(yīng);可以明確顯示出概念之間的相互關(guān)系,便于對(duì)概念進(jìn)行系統(tǒng)排列;方便檢索時(shí)對(duì)檔案標(biāo)引用語(yǔ)進(jìn)行相符性比較;對(duì)人類(lèi)活動(dòng)的職能、事務(wù)、事件等概念的明確表達(dá),有助于利用者更好地理解和使用檔案的信息內(nèi)容。一、檔案檢索語(yǔ)言概述(一)檔案檢索的概念《中檔法》是以國(guó)家機(jī)構(gòu)及其他社會(huì)組織所從事的社會(huì)實(shí)踐活動(dòng)的職能分工為基礎(chǔ),結(jié)合檔案記述內(nèi)容和特點(diǎn),分門(mén)別類(lèi)組成的分類(lèi)表。這個(gè)分類(lèi)法的編制原則包括:(1)分類(lèi)體系的確立、類(lèi)目的設(shè)置和其序列的先后,都力求具有思想性、科學(xué)性、邏輯性、實(shí)用性,充分反映我國(guó)檔案的特點(diǎn),適應(yīng)我國(guó)社會(huì)各項(xiàng)事業(yè)利用檔案的需要。(2)分類(lèi)法的體系和基本類(lèi)目的設(shè)置,以不同歷史時(shí)期的國(guó)家機(jī)構(gòu)、組織從事社會(huì)實(shí)踐活動(dòng)的職能分工為基礎(chǔ),緊密結(jié)合檔案內(nèi)容記述和反映的事物屬性關(guān)系,采取從總到分、從一般到具體的邏輯體系。(3)分類(lèi)法在總體上具有概括性和包容性,能夠容納各個(gè)歷史時(shí)期、各項(xiàng)社會(huì)實(shí)踐活動(dòng)所形成的各類(lèi)檔案,并力求保持基本類(lèi)目的穩(wěn)定性。分類(lèi)法既能滿(mǎn)足檔案管理部門(mén)現(xiàn)存檔案的內(nèi)容信息分類(lèi)的需要,又給今后的變化留下了充分的余地。(4)分類(lèi)法的類(lèi)目名稱(chēng)和標(biāo)記符號(hào),力求準(zhǔn)確、規(guī)范、簡(jiǎn)明、易懂、好記,便于人們掌握和使用。二、《中國(guó)檔案分類(lèi)法》簡(jiǎn)介(一)《中檔法》的編制原則《中檔法》的宏觀結(jié)構(gòu)包括:(1)編制說(shuō)明。包括《中檔法》的編制目的、原則、體系結(jié)構(gòu)、標(biāo)記制度、適用范圍,以及使用《中檔法》應(yīng)注意的問(wèn)題等。(2)分類(lèi)表?!吨袡n法》提供的分類(lèi)表包括中華人民共和國(guó)檔案分類(lèi)表、新民主主義檔案分類(lèi)表、民國(guó)檔案分類(lèi)表和清代檔案分類(lèi)表。四個(gè)分類(lèi)表中的每一個(gè)分類(lèi)表,都由主表和輔助表組成。主表是分類(lèi)法的主體,是分類(lèi)體系的具體體現(xiàn)。輔助表是對(duì)主表類(lèi)目進(jìn)行復(fù)分的依據(jù)。(3)附錄。《中檔法》的附錄包括編委會(huì)名單、綜合編審組名單,以及審定委員會(huì)的審定意見(jiàn)和后記等。(二)《中檔法》的體例結(jié)構(gòu)《中檔法》的微觀結(jié)構(gòu)——四大分類(lèi)表中華人民共和國(guó)檔案分類(lèi)表包括主表和輔助表兩大部分,主表共設(shè)置了19個(gè)基本大類(lèi)1.中華人民共和國(guó)檔案分類(lèi)表(二)《中檔法》的體例結(jié)構(gòu)2.新民主主義檔案分類(lèi)表新民主主義檔案分類(lèi)表由主表和綜合復(fù)分表組成,主表中其設(shè)置了13個(gè)基本大類(lèi)3.民國(guó)檔案分類(lèi)表民國(guó)檔案分類(lèi)表由主表和輔助表構(gòu)成,主表中共設(shè)置了16個(gè)基本大類(lèi)4.清代檔案分類(lèi)表清代檔案分類(lèi)表由主表和輔助表構(gòu)成,主表中設(shè)置的大類(lèi)參見(jiàn)下表《中國(guó)檔案主題詞表》(以下簡(jiǎn)稱(chēng)《中主表》)共收錄主題詞27288條,其中正式主題詞22759條,非正式主題詞4529條。在選詞中遵循的原則是:第一,以馬列主義、毛澤東思想為指導(dǎo),堅(jiān)持辯證唯物主義和歷史唯物主義觀點(diǎn),力求思想性、科學(xué)性和實(shí)用性的統(tǒng)一。第二,選用的主題詞能夠反映綜合性檔案館、機(jī)關(guān)檔案室收藏檔案內(nèi)容的主題概念,在標(biāo)引和檢索中具有使用價(jià)值和一定的使用頻率。第三,選用的主題詞符合漢語(yǔ)的結(jié)構(gòu)特點(diǎn),詞形簡(jiǎn)練、概念明確、詞義單一。三、《中國(guó)檔案主題詞表》簡(jiǎn)介(一)選詞原則《中主表》由主表、詞族索引、范疇索引、首字筆畫(huà)檢字表和附表、附錄組成。(1)主表。主表的基本單元是主題詞款目。主題詞款目由款目主題詞及其漢語(yǔ)拼音、范疇號(hào)、注釋和詞間關(guān)系項(xiàng)等內(nèi)容構(gòu)成。(2)詞族索引。詞族索引是把主表中具有屬分關(guān)系、包含關(guān)系和整體部分關(guān)系的正式主題詞,按規(guī)定屬分級(jí)別展開(kāi)全顯示的一種詞族系統(tǒng)。這種索引在標(biāo)引和檢索中提供系統(tǒng)查詞和選定標(biāo)引詞的輔助工具;在機(jī)檢系統(tǒng)中是實(shí)現(xiàn)自動(dòng)擴(kuò)檢、縮檢、上位登錄及滿(mǎn)足族性檢索的重要手段。(3)范疇索引。它是將主表中的全部主題詞按照既定的類(lèi)目分類(lèi)排列,以便按類(lèi)查詞的一種輔助工具。(4)附表。即人名表和機(jī)構(gòu)名表。(二)體例結(jié)構(gòu)根據(jù)主題概念查找《中主表》,選詞的方法包括:(1)按漢語(yǔ)拼音音序、調(diào)序、字形筆畫(huà)參照天頭提示,從主表或附表中查找標(biāo)引用的主題詞,或按筆畫(huà)筆順從詞目首字筆畫(huà)檢字表中檢出主題詞的首字,再按該字所在頁(yè)碼從主表中查找標(biāo)引用的主題詞。(2)按分類(lèi)類(lèi)目從范疇索引中查找標(biāo)引用的主題詞,必要時(shí)再?gòu)闹鞅碇胁殚喸撛~的詞間關(guān)系項(xiàng),以選定更恰當(dāng)?shù)闹黝}詞。(3)所選詞在主表、附表或范疇索引中標(biāo)明屬非正式主題詞者,應(yīng)轉(zhuǎn)換為正式主題詞做標(biāo)引詞。(4)在主表中查到的主題詞,如果不能恰當(dāng)反映檔案文件主題,可參考該詞的詞間關(guān)系進(jìn)行校正,也可按該詞的范疇號(hào)或族首詞在索引表中查找更恰當(dāng)?shù)脑~。(5)從詞族索引中查找屬性相同的某一族詞,從中選定最專(zhuān)指的主題詞。必要時(shí),再?gòu)闹鞅碇胁殚喸撛~的其他詞間關(guān)系,以選定更恰當(dāng)?shù)闹黝}詞。(6)在應(yīng)用計(jì)算機(jī)進(jìn)行標(biāo)引、檢索時(shí),可利用計(jì)算機(jī)機(jī)讀主題詞表中的詞族索引進(jìn)行上位登錄和自動(dòng)擴(kuò)檢、縮檢,以提高標(biāo)引速度和檢索效率。(三)《中主表》的使用方法一、檔案著錄的概念和價(jià)值二、檔案的標(biāo)引三、檔案著錄的主要規(guī)則四、檔案標(biāo)引的步驟檔案的著錄標(biāo)引第三節(jié)第七章檔案的檢索第三節(jié)檔案的著錄標(biāo)引檔案界對(duì)檔案著錄概念的理解是:“在編檔案目錄時(shí),對(duì)檔案內(nèi)容和形式特征進(jìn)行分析、選擇和記錄的過(guò)程。”檔案著錄是在編檔案目錄和建立檔案信息檢索系統(tǒng)時(shí),按照檔案管理的基本原則,依據(jù)一定規(guī)則,對(duì)檔案的來(lái)源、內(nèi)容和形式特征進(jìn)行分析、選擇和記錄的過(guò)程。這個(gè)術(shù)語(yǔ)概念的基本含義是:第一,明確了檔案著錄的主要目標(biāo)。開(kāi)展檔案著錄的主要目標(biāo)是建立方便檔案管理和檔案內(nèi)容信息利用的檔案目錄和檔案信息檢索系統(tǒng)。第二,明確了檔案著錄需要遵循的基本思想和行為準(zhǔn)則。檔案著錄是檔案業(yè)務(wù)工作的一項(xiàng)重要內(nèi)容,肩負(fù)著維護(hù)檔案的來(lái)源、全宗等方面歷史聯(lián)系的使命,所以它不僅僅是為檔案用戶(hù)提供檢索利用檔案資源的服務(wù)的。通過(guò)有效地著錄檔案的各數(shù)據(jù)項(xiàng),它也可以為檔案用戶(hù)深刻地理解檔案的內(nèi)容、系統(tǒng)客觀地總結(jié)歷史經(jīng)驗(yàn)、呈清歷史事實(shí)、發(fā)現(xiàn)業(yè)務(wù)活動(dòng)的規(guī)律和發(fā)展趨勢(shì)等,提供可靠、真實(shí)的歷史信息線(xiàn)索。一、檔案著錄的概念和價(jià)值(一)檔案著錄概念的術(shù)語(yǔ)定義第三,明確了檔案著錄應(yīng)按一定規(guī)則進(jìn)行的基本要求。編制較為理想的檔案著錄規(guī)則可以通過(guò)制定必要的行業(yè)統(tǒng)一標(biāo)準(zhǔn)來(lái)實(shí)現(xiàn)。目前我國(guó)在開(kāi)展檔案著錄活動(dòng)中,雖然有《檔案著錄規(guī)則》等行業(yè)標(biāo)準(zhǔn),但是由于其制定的時(shí)間較早,針對(duì)的又主要是以紙質(zhì)檔案為對(duì)象的手工著錄,所以在標(biāo)準(zhǔn)引領(lǐng)方面還需加強(qiáng)。當(dāng)在采標(biāo)方面,積極向ISAD(G)靠攏,并組織人力加速進(jìn)行《檔案著錄規(guī)則》等標(biāo)準(zhǔn)的修訂和完善工作,并將多極著錄的規(guī)則作為檔案著錄的規(guī)則納入標(biāo)準(zhǔn)的規(guī)范性要求之中。第四,著錄不能僅局限在對(duì)檔案的內(nèi)容和形式特征的分析、選擇和記錄的層面,還應(yīng)對(duì)著錄的檔案對(duì)象所屬的全宗、來(lái)源特征及分類(lèi)結(jié)果等信息線(xiàn)索進(jìn)行分析、選擇和準(zhǔn)確記錄。1.檔案著錄是人類(lèi)實(shí)現(xiàn)對(duì)檔案資源進(jìn)行全生命周期管理和利用的重要手段2.檔案著錄是對(duì)檔案進(jìn)行智力控制,保證利用者所用檔案資源的可靠性、真實(shí)性、可理解性、可利用性的重要措施3.檔案著錄具有登記、介紹、報(bào)道、傳播檔案內(nèi)容信息的功能和促進(jìn)檔案資源利用與開(kāi)發(fā)的價(jià)值(二)檔案著錄的價(jià)值和作用1.基本規(guī)則依據(jù)《檔案分類(lèi)標(biāo)引規(guī)則》檔案分類(lèi)標(biāo)引應(yīng)遵守以下六項(xiàng)基本要求:(1)確定分類(lèi)標(biāo)引依據(jù)要求。檔案分類(lèi)標(biāo)引應(yīng)以社會(huì)組織從事實(shí)踐活動(dòng)的職能分工為基礎(chǔ),結(jié)合檔案記述和反映的事物屬性關(guān)系,并兼顧檔案的其他特征。(2)分類(lèi)標(biāo)引工具選擇要求。應(yīng)選擇《中檔法》(包括各專(zhuān)業(yè)主管部門(mén)編制的檔案分類(lèi)法)及其使用指南。(3)分類(lèi)標(biāo)引類(lèi)目理解要求。要正確地理解分類(lèi)標(biāo)引詞典中的類(lèi)目含義和范圍,避免脫離類(lèi)目之間的聯(lián)系和類(lèi)目注釋的限定,片面地理解類(lèi)目含義。(4)分類(lèi)標(biāo)引深度和分類(lèi)標(biāo)識(shí)要求。分類(lèi)標(biāo)引應(yīng)充分考慮實(shí)際的檢索需求和檢索方式,根據(jù)檔案的具體內(nèi)容和用途,選定適當(dāng)?shù)姆诸?lèi)標(biāo)引深度。(5)專(zhuān)指性要求。分類(lèi)標(biāo)引必須按專(zhuān)指性的要求,分入恰當(dāng)?shù)念?lèi)目,切不可分入較寬的上位類(lèi)或較窄的下位類(lèi)。(6)一致性要求。分類(lèi)標(biāo)引應(yīng)保持一致性。含有相同或相似主題內(nèi)容的檔案對(duì)象所標(biāo)引的分類(lèi)號(hào)均應(yīng)一致。(二)檔案分類(lèi)標(biāo)引規(guī)則2.各種類(lèi)型檔案分類(lèi)標(biāo)引規(guī)則《檔案分類(lèi)標(biāo)引規(guī)則》(GB/T15418—2009)明確了各種類(lèi)型檔案分類(lèi)標(biāo)引時(shí)選擇標(biāo)引工具的規(guī)則和標(biāo)引級(jí)次的確定規(guī)則。具體要求包括:(1)檔案分類(lèi)表的選用。清代檔案使用清代檔案分類(lèi)表進(jìn)行分類(lèi)標(biāo)引;民國(guó)檔案使用民國(guó)檔案分類(lèi)表進(jìn)行分類(lèi)標(biāo)引;革命歷史檔案使用新民主主義檔案分類(lèi)表進(jìn)行分類(lèi)標(biāo)引;中華人民共和國(guó)時(shí)期的檔案使用中華人民共和國(guó)檔案分類(lèi)表進(jìn)行分類(lèi)標(biāo)引;專(zhuān)業(yè)檔案館(室)、部門(mén)檔案館(室)、企事業(yè)單位檔案館(室),在使用《中檔法》進(jìn)行分類(lèi)標(biāo)引時(shí),本專(zhuān)業(yè)的檔案可使用行業(yè)分類(lèi)表進(jìn)行分類(lèi)標(biāo)引。(2)檔案分類(lèi)標(biāo)引級(jí)次。一般以文件級(jí)、案卷級(jí)為單元進(jìn)行分類(lèi)標(biāo)引。若遇檔案內(nèi)容聯(lián)系緊密或者幾份文件或幾個(gè)案卷記述同一事物的情況,也可以將其作為一個(gè)單元進(jìn)行分類(lèi)標(biāo)引。3.各種主題檔案分類(lèi)標(biāo)引規(guī)則(1)單主題文件或案卷,一般依主題主體因素所屬的類(lèi)目標(biāo)引。若是從一個(gè)方面對(duì)主題進(jìn)行論述,就依這方面所屬類(lèi)目標(biāo)引;若是從多方面對(duì)主題進(jìn)行論述,一般只依主題所屬類(lèi)目做整體標(biāo)引。(2)文件或案卷論述的主題內(nèi)容互相交叉時(shí),應(yīng)依據(jù)《中檔法》關(guān)于集中與分散的有關(guān)規(guī)定進(jìn)行標(biāo)引。(3)文件或案卷論述的主題涉及國(guó)家、地區(qū)、民族、時(shí)代等因素時(shí),若《中檔法》中注明需要復(fù)分,則應(yīng)標(biāo)出復(fù)分號(hào),否則可以省略。(4)多主題的文件或案卷,標(biāo)引時(shí)應(yīng)充分考慮利用者的檢索需要、主題價(jià)值及主題邏輯關(guān)系加以綜合分析,再賦予一個(gè)或幾個(gè)分類(lèi)號(hào)。(5)文件、案卷論述的多個(gè)主題之間是并列關(guān)系且均具有檢索價(jià)值,可分別予以標(biāo)引。(6)文件、案卷論述的多個(gè)主題之間是從屬關(guān)系,一般應(yīng)對(duì)母主題做整體標(biāo)引;如果子主題也具有檢索價(jià)值,也可對(duì)子主題做互見(jiàn)標(biāo)引。(7)文件、案卷論述的多個(gè)主題之間是因果或影響關(guān)系,一般應(yīng)對(duì)結(jié)果或受影響的主題進(jìn)行標(biāo)引。對(duì)于互為因果的、互相影響的主題,做全面標(biāo)引。(8)檔案內(nèi)容涉及的幾個(gè)主題之間,如存在應(yīng)用關(guān)系,一般依被應(yīng)用主題所屬類(lèi)目標(biāo)引。必要時(shí)可以對(duì)其他主題附加相應(yīng)的分類(lèi)號(hào)。檔案分類(lèi)標(biāo)引的一般工作程序如下。第一步,研讀分類(lèi)標(biāo)引詞典,如《中檔法》等。深入透徹地掌握其使用方法。第二步,分析檔案主題。應(yīng)充分考慮立檔單位的性質(zhì)、職能和任務(wù),通過(guò)分析題名、瀏覽正文、參考文件版頭和案卷封面,從而了解檔案的中心內(nèi)容和涉及的主要問(wèn)題,判明其屬性特征,以便正確歸類(lèi)。第三步,判定所屬類(lèi)別。進(jìn)行主題分析后,須確定在文件、案卷所論述的事物中,哪些主題能為利用者提供檢索途徑,應(yīng)予以標(biāo)引。然后根據(jù)主題性質(zhì),到分類(lèi)標(biāo)引工具書(shū)(分類(lèi)表)中查找其所屬的類(lèi)目。第四步,標(biāo)引分類(lèi)號(hào)。這是用《中檔法》等工具書(shū)(分類(lèi)表)中的類(lèi)號(hào)來(lái)表達(dá)檔案主題性質(zhì)的標(biāo)引過(guò)程,也就是將判定的類(lèi)別賦予分類(lèi)標(biāo)識(shí)。給予分類(lèi)號(hào),應(yīng)根據(jù)文件、案卷內(nèi)容的屬性、主題多寡、起草意圖、利用對(duì)象檢索需求等特點(diǎn),采用恰當(dāng)?shù)姆绞胶头椒ǎ瑴?zhǔn)確、一致、適度地標(biāo)引出來(lái)。遇有難以分類(lèi)的新事物、新主題的檔案材料,分類(lèi)表上無(wú)確切類(lèi)目可歸時(shí),各檔案館(室)可增設(shè)新類(lèi)目予以分類(lèi)標(biāo)引,同時(shí)上報(bào)《中檔法》編委會(huì)確認(rèn)。今后若遇到同類(lèi)主題的文件、案卷亦照此辦理,確保一致性。第五步,審校。審校是分類(lèi)標(biāo)引的最后一道工序,是確保標(biāo)引質(zhì)量的最后關(guān)口。審校內(nèi)容包括檢查驗(yàn)證檔案的內(nèi)容是否得到全面的分析,主題概念是否準(zhǔn)確、恰當(dāng),類(lèi)目辨識(shí)是否準(zhǔn)確,同一主題的檔案是否歸類(lèi)一致,標(biāo)引的類(lèi)號(hào)是否充分、完整、準(zhǔn)確,書(shū)寫(xiě)是否正確無(wú)誤。審校程序通常包括自校、互校和總校等。(三)檔案分類(lèi)標(biāo)引程序1.主題分析主題分析是主題標(biāo)引的基礎(chǔ),是通過(guò)對(duì)檔案的內(nèi)容特征進(jìn)行分析,準(zhǔn)確提煉和選定主題概念的過(guò)程。其工作內(nèi)容包括:(1)審讀檔案。(2)明確主題類(lèi)型。檔案的主題類(lèi)型可以被分為單主題和多主題兩種。(3)分析主題結(jié)構(gòu)。構(gòu)成主題的因素一般可以被分解為:主體因素、通用因素、位置因素、時(shí)間因素、文種因素等。(4)選定主題概念。選定主題概念的原則是:選定的主題概念應(yīng)是檔案中論述的問(wèn)題,應(yīng)具有實(shí)際檢索意義,應(yīng)能準(zhǔn)確地表達(dá)檔案的核心主題及有檢索價(jià)值的主題。(四)檔案主題標(biāo)引2.選詞標(biāo)引選詞標(biāo)引即對(duì)檔案主題概念給予主題詞標(biāo)識(shí)的過(guò)程。具體內(nèi)容包括:(1)選出的主題概念應(yīng)轉(zhuǎn)化成檔案主題詞表中的正式主題詞進(jìn)行標(biāo)引,書(shū)寫(xiě)形式應(yīng)與詞表中的詞形相一致,非正式主題詞不能作為標(biāo)引詞使用。(2)應(yīng)選用檔案主題詞表中與檔案主題概念直接相對(duì)應(yīng)的、專(zhuān)指的主題詞。(3)當(dāng)詞表中沒(méi)有與檔案主題概念直接相對(duì)應(yīng)的專(zhuān)指主題詞時(shí),應(yīng)選用兩個(gè)或兩個(gè)以上的主題詞進(jìn)行組配標(biāo)引。組配應(yīng)是概念組配,其中包括交叉組配(指用兩個(gè)或兩個(gè)以上具有概念交叉關(guān)系的同級(jí)主題詞組配表達(dá)相應(yīng)的下位概念)和限定組配(指由一個(gè)表示事物的主題詞與另外一個(gè)或幾個(gè)表示事物某個(gè)屬性或某個(gè)方面的主題詞組配表達(dá)相應(yīng)的下位概念)。組配標(biāo)引的規(guī)則是:優(yōu)先考慮交叉組配,然后考慮限定組配;應(yīng)選用與檔案主題概念關(guān)系最密切、最臨近的主題詞進(jìn)行組配,不能越級(jí)組配,即不能用其上位或下位主題詞組配;組配結(jié)果所表達(dá)的概念應(yīng)清楚、確切,只能表達(dá)一個(gè)主題概念;避免多主題虛假組配造成誤檢;當(dāng)某一主題概念在詞表中有組代主題詞(先組復(fù)合詞)時(shí),應(yīng)選用規(guī)定的組代主題詞,不應(yīng)另選其他主題詞進(jìn)行組配標(biāo)引。(4)當(dāng)某一主題概念在詞表中查不到專(zhuān)指的主題詞,也無(wú)法通過(guò)組配標(biāo)引來(lái)表達(dá)該主題概念時(shí),可以采用靠詞標(biāo)引法。(5)關(guān)鍵詞標(biāo)引??吭~標(biāo)引法有兩種:一是用上位概念主題詞做靠詞標(biāo)引,即從詞族索引中選用最直接的上位概念主題詞進(jìn)行標(biāo)引,但不應(yīng)使用越級(jí)上位主題詞標(biāo)引。二是用近義詞做靠詞標(biāo)引,即從范疇索引中選用與主題概念含義最相近的主題詞進(jìn)行標(biāo)引。某些概念采用組配的結(jié)果會(huì)出現(xiàn)多義;某些概念雖可進(jìn)行靠詞標(biāo)引,但這些概念的被標(biāo)引頻率較高;詞表中明顯漏選的詞;表達(dá)新生事物的詞。關(guān)鍵詞應(yīng)盡可能選自其他詞表或較權(quán)威的參考書(shū)、工具書(shū),選用的關(guān)鍵詞應(yīng)詞形簡(jiǎn)練、概念明確、實(shí)用性強(qiáng)。使用關(guān)鍵詞標(biāo)引后,應(yīng)有所記錄,并反饋到所用檔案主題詞表的管理部門(mén)。一個(gè)標(biāo)引對(duì)象,標(biāo)引用詞一般為2~10個(gè)。ISAD(G)的著錄規(guī)則主要包括“檔案多級(jí)著錄規(guī)則”和“各檔案著錄項(xiàng)規(guī)則”兩個(gè)部分。檔案多級(jí)著錄規(guī)則:是指根據(jù)檔案實(shí)體分類(lèi)的不同級(jí)次,自上而下依次加以著錄的規(guī)則。ISAD(G)中的著錄規(guī)則共細(xì)分為26項(xiàng),其中有一部分與《檔案著錄規(guī)則》中的著錄規(guī)則相同,但有許多著錄規(guī)則是《檔案著錄規(guī)則》沒(méi)有的。這些目前還沒(méi)有被我們列入檔案著錄規(guī)則的內(nèi)容包括:1.行政管理沿革、傳記梗概著錄規(guī)則該著錄規(guī)則主要是對(duì)著錄單位形成負(fù)有責(zé)任的組織機(jī)構(gòu)的由來(lái)、形成、發(fā)展及工作等的重要信息,或?qū)χ泦挝回?fù)有責(zé)任的個(gè)人的生平或工作等的重要信息進(jìn)行簡(jiǎn)要著錄。規(guī)則目標(biāo)是:提供檔案形成單位的行政管理沿革或檔案形成者的生平傳記的情況,以便使檔案處于一定的歷史背景中,使之能被更好地理解。對(duì)于個(gè)人或家族,著錄其全名和頭銜、生卒年月、出生地、曾經(jīng)居住地、活動(dòng)、職業(yè)或職務(wù)、原名及其他名稱(chēng)、重要的成就及死亡地等信息。三、檔案著錄的主要規(guī)則(一)ISAD(G)的著錄規(guī)則介紹2.檔案歷史沿革著錄規(guī)則該著錄規(guī)則主要是對(duì)著錄單位形成負(fù)有責(zé)任的組織機(jī)構(gòu)的由來(lái)、形成、發(fā)展及工作等的重要信息,或?qū)χ泦挝回?fù)有責(zé)任的個(gè)人的生平或工作等的重要信息進(jìn)行簡(jiǎn)要著錄。規(guī)則目標(biāo)是:提供檔案形成單位的行政管理沿革或檔案形成者的生平傳記的情況,以便使檔案處于一定的歷史背景中,使之能被更好地理解。對(duì)于個(gè)人或家族,著錄其全名和頭銜、生卒年月、出生地、曾經(jīng)居住地、活動(dòng)、職業(yè)或職務(wù)、原名及其他名稱(chēng)、重要的成就及死亡地等信息。3.檔案整理體系著錄規(guī)則該著錄規(guī)則主要是對(duì)著錄單位的內(nèi)部結(jié)構(gòu)、排序及分類(lèi)體系等的有關(guān)情況,以及檔案工作人員的處理情況進(jìn)行著錄。對(duì)于電子文件,還需著錄有關(guān)系統(tǒng)設(shè)計(jì)方面的文件或參考信息。規(guī)則的目標(biāo)是:提供檔案內(nèi)部結(jié)構(gòu)、排序及(或)分類(lèi)體系等有關(guān)信息。4.檔案查閱管理?xiàng)l件著錄規(guī)則主要是對(duì)影響著錄單位查閱的法律或法律情況、契約、規(guī)章制度和政策等情況的著錄。著錄時(shí),還應(yīng)說(shuō)明該著錄單位不可被查閱的時(shí)間期限和未來(lái)將適時(shí)開(kāi)放查閱的時(shí)間。規(guī)則的目標(biāo)是:給檔案利用者提供有關(guān)限制或影響查閱檔案的法律情況或規(guī)章制度等方面的信息。5.檔案復(fù)制管理?xiàng)l件著錄規(guī)則該著錄規(guī)則主要是對(duì)在著錄單位被提供查閱后有關(guān)其是否可被復(fù)制的管理?xiàng)l件的著錄,如版權(quán)的著錄。如果有關(guān)這些管理?xiàng)l件的情況不詳,那么應(yīng)予以著錄說(shuō)明。規(guī)則的目標(biāo)是:明確檔案利用時(shí)對(duì)檔案是否可進(jìn)行復(fù)制的任何限制條件。6.檔案物理特征與技術(shù)要求著錄規(guī)則該著錄規(guī)則主要是對(duì)任何影響著錄單位使用的重要的物理?xiàng)l件進(jìn)行著錄,如對(duì)保管要求及對(duì)利用著錄單位所需的軟件、硬件進(jìn)行著錄。規(guī)則的目標(biāo)是:說(shuō)明影響檔案使用的任何重要的物理特征或技術(shù)要求的信息。7.檔案檢索工具著錄規(guī)則該著錄規(guī)則主要是對(duì)檔案機(jī)構(gòu)或文件形成者所能夠提供檢索著錄單位的背景及內(nèi)容信息的檢索工具進(jìn)行著錄。規(guī)則的目標(biāo)是:確認(rèn)可供檢索檔案的任何檢索工具。8.檔案原件的留存及收藏地規(guī)則該著錄規(guī)則主要是對(duì)可利用的著錄單位的原件的收藏地進(jìn)行著錄。如果原件已不存在,或其收藏地不詳,也應(yīng)說(shuō)明此情況。規(guī)則的主要目標(biāo)是:當(dāng)利用的檔案是復(fù)制件時(shí),說(shuō)明其原件的留存、收藏地、可利用性及毀壞情況。10.相關(guān)檔案的著錄單位著錄規(guī)則該著錄規(guī)則主要是對(duì)在同一收藏機(jī)構(gòu)或別處收藏機(jī)構(gòu)中根據(jù)來(lái)源或其他聯(lián)系相關(guān)的著錄單位的信息進(jìn)行著錄。規(guī)則的主要目標(biāo)是:提供相關(guān)檔案材料的著錄信息。9.復(fù)制件的留存及收藏地著錄規(guī)則該著錄規(guī)則主要是對(duì)可利用的著錄單位的復(fù)制件的收藏地進(jìn)行著錄。規(guī)則的主要目標(biāo)是:說(shuō)明檔案復(fù)制件的留存、收藏地及可利用的情況。我國(guó)現(xiàn)行的檔案著錄規(guī)則是國(guó)家檔案局于1999年5月31日批準(zhǔn)的,自1999年12月1日起開(kāi)始實(shí)施的行業(yè)推薦標(biāo)準(zhǔn)《檔案著錄規(guī)則》(DA/T18—1999)?!稒n案著錄規(guī)則》(DA/T18—1999)的主要內(nèi)容包括支持手工檔案目錄編制工作的著錄項(xiàng)目、標(biāo)識(shí)符號(hào)、著錄格式、著錄級(jí)次、著錄用文字和著錄來(lái)源、著錄細(xì)則等。其中著錄細(xì)則是《檔案著錄規(guī)則》(DA/T18—1999)的核心內(nèi)容,共包括7個(gè)大項(xiàng)(題名與責(zé)任說(shuō)明項(xiàng)、稿本與文種項(xiàng)、密級(jí)與保管期限項(xiàng)、時(shí)間項(xiàng)、載體形態(tài)項(xiàng)、附注與提要項(xiàng)、排檢與編號(hào)項(xiàng))和若干個(gè)小項(xiàng)(子項(xiàng))。《檔案著錄規(guī)則》(DA/T18—1999)規(guī)定的7個(gè)大項(xiàng)的著錄項(xiàng)目中,每個(gè)大項(xiàng)還包括若干個(gè)子項(xiàng)。其中所規(guī)定的著錄項(xiàng)目用標(biāo)識(shí)符號(hào)主要適用于手工檢索工具,編制記錄目錄及建立檔案目錄數(shù)據(jù)庫(kù)應(yīng)執(zhí)行相關(guān)的標(biāo)準(zhǔn),一般應(yīng)省略這些著錄項(xiàng)目用標(biāo)識(shí)符號(hào)。(二)《檔案著錄規(guī)則》(DA/T
18—1999)的著錄規(guī)則介紹主題分析是確定被標(biāo)引檔案內(nèi)容主題概念的過(guò)程。檔案的內(nèi)容主題因素主要有五種。其中包括:四、檔案標(biāo)引的步驟(一)主題分析(1)主體因素,它是反映檔案主題內(nèi)容的關(guān)鍵性概念;(2)通用因素,它是對(duì)主體因素起補(bǔ)充和限定作用的通用概念;(3)位置因素,它是檔案內(nèi)容所記述對(duì)象的空間和地理位置概念;(4)時(shí)間因素,它是檔案所記述對(duì)象的存在時(shí)間概念;(5)檔案文件類(lèi)型因素,它是檔案文件所屬類(lèi)型和形式方面的概念。在檔案標(biāo)引中,檔案內(nèi)容的主體因素是最重要的,是不可遺漏的標(biāo)引對(duì)象(即必須通過(guò)規(guī)范的分類(lèi)號(hào)、主題詞或關(guān)鍵詞予以表達(dá)的對(duì)象);而其他主題因素,則可通過(guò)分析,選擇有意義的予以標(biāo)引。概念轉(zhuǎn)換:利用檔案標(biāo)引工具(如《中檔法》《中主表》)等,將分析所得的檔案主題概念以檢索語(yǔ)言的形式表達(dá)或標(biāo)識(shí)出來(lái)。檔案分類(lèi)標(biāo)引概念轉(zhuǎn)換的基本做法是:根據(jù)對(duì)檔案主題分析的結(jié)果查找檔案分類(lèi)標(biāo)引工具書(shū),如《中檔法》及其他專(zhuān)業(yè)檔案分類(lèi)法(表),將用自然語(yǔ)言或書(shū)目語(yǔ)言表達(dá)出來(lái)的檔案主題概念,轉(zhuǎn)換為分類(lèi)號(hào)并賦予檔案分類(lèi)標(biāo)引對(duì)象。檔案主題標(biāo)引概念轉(zhuǎn)換的基本做法是:根據(jù)檔案主題分析的結(jié)果查找規(guī)范化的檔案主題詞轉(zhuǎn)換工具書(shū),如《中主表》及各相關(guān)專(zhuān)業(yè)的檔案主題詞表等,將用自然或書(shū)面語(yǔ)言表達(dá)出來(lái)的檔案主題概念,轉(zhuǎn)換為規(guī)范的主題詞并賦予檔案主題標(biāo)引對(duì)象。如果采用自然語(yǔ)言中的關(guān)鍵詞直接表達(dá)檔案的主題概念,即為關(guān)鍵詞標(biāo)引。對(duì)單主題的檔案標(biāo)引對(duì)象的概念轉(zhuǎn)換,只要賦予其相應(yīng)的一個(gè)分類(lèi)號(hào)或一個(gè)(或若干個(gè))主題詞標(biāo)引即可;對(duì)多主題的檔案標(biāo)引對(duì)象的概念轉(zhuǎn)換,首先要將多主題分解為單主題,然后再分別賦予其相應(yīng)的分類(lèi)號(hào)或主題詞。(二)檔案主題概念轉(zhuǎn)換一、檔案檢索體系二、檔案機(jī)讀目錄的建設(shè)三、檔案目錄數(shù)據(jù)庫(kù)管理系統(tǒng)四、常用的手工檔案檢索工具檔案檢索體系和檔案目錄數(shù)據(jù)庫(kù)的建設(shè)第四節(jié)第六章檔案保護(hù)與安全管理第四節(jié)檔案檢索體系和檔案目錄數(shù)據(jù)庫(kù)的建設(shè)1.建設(shè)原則各立檔單位的檔案部門(mén)和國(guó)家檔案館在建設(shè)檔案檢索體系的過(guò)程中,應(yīng)遵循如下三項(xiàng)基本原則:第一,規(guī)范性原則。檔案檢索體系的建設(shè)應(yīng)嚴(yán)格遵從國(guó)家及行業(yè)性標(biāo)準(zhǔn)和規(guī)范的要求,為檔案資源的有效查找和管理服務(wù)奠定基礎(chǔ)。第二,適用性原則。檔案檢索體系的建設(shè)應(yīng)充分考慮本單位及相關(guān)用戶(hù)的信息檢索需求,以為用戶(hù)提供快捷、滿(mǎn)意的檔案資源檢索服務(wù)為目標(biāo)。第三,可擴(kuò)展性原則。檔案檢索體系的建設(shè)應(yīng)考慮檔案資源數(shù)據(jù)庫(kù)(目錄數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù))建設(shè)對(duì)標(biāo)準(zhǔn)提出的更新、擴(kuò)展和延伸的要求,為將來(lái)的技術(shù)發(fā)展提供框架和發(fā)展余地,并隨著信息技術(shù)發(fā)展和相關(guān)國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)的不斷完善而對(duì)檔案檢索體系進(jìn)行充實(shí)和修訂。一、檔案檢索體系(一)檔案檢索體系的建設(shè)原則和概念模型2.概念模型檔案檢索體系的建設(shè)是為立檔單位和國(guó)家檔案館保存的檔案資源的有效管理、合理控制和有效利用提供途徑。檔案檢索體系的建設(shè)可參照下圖的概念模型來(lái)進(jìn)行。無(wú)論是手工檔案檢索工具還是電子檔案檢索工具,按其編制體例,都可以被分為如下三種類(lèi)型:(1)目錄(2)索引(3)指南檔案檢索工具按其載體形式,可以被分為:(1)書(shū)本式檢索工具(2)卡片式檢索工具(3)縮微式檢索工具(4)機(jī)讀式檢索工具檔案檢索工具按其按功能,可以被分為:(1)館藏性檢索工具(2)查找性檢索工具(3)介紹性檢索工具(三)檔案檢索工具的種類(lèi)從檔案檢索工具的發(fā)展趨勢(shì)上看,機(jī)讀目錄代表了今后立檔單位和國(guó)家檔案館檔案目錄建設(shè)的發(fā)展方向。檔案機(jī)讀目錄的建設(shè)也是檔案部門(mén)實(shí)現(xiàn)檔案信息檢索現(xiàn)代化(信息化、網(wǎng)絡(luò)化)的必然要求。2006年3月15日,中國(guó)國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局和中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)發(fā)布了《中國(guó)檔案機(jī)讀目錄格式》(GB/T20163—2006),當(dāng)年10月1日起實(shí)施。在《中國(guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)實(shí)施前后,我國(guó)各地檔案行政管理部門(mén)和專(zhuān)業(yè)主管部門(mén)也陸續(xù)出臺(tái)了一系列的相關(guān)機(jī)讀目錄格式標(biāo)準(zhǔn)和規(guī)范文件,如《明清檔案機(jī)讀目錄數(shù)據(jù)交換格式》(DA/T33—2005)、《民國(guó)檔案機(jī)讀目錄軟磁盤(pán)數(shù)據(jù)交換格式》(DA/T20.4—1999)、《革命歷史檔案機(jī)讀目錄軟磁盤(pán)數(shù)據(jù)交換格式》(DA/T17.5—1995)等。二、檔案機(jī)讀目錄的建設(shè)(一)中國(guó)檔案機(jī)讀目錄相關(guān)標(biāo)準(zhǔn)的建設(shè)現(xiàn)狀《中國(guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)是我國(guó)各立檔單位和國(guó)家檔案館機(jī)讀目錄建設(shè)的基本指導(dǎo)性標(biāo)準(zhǔn)依據(jù)。1.總則(1)字段描述?!吨袊?guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)為各種字段的使用提供了指南,為保證敘述的完整性和查找的方便性,該標(biāo)準(zhǔn)按字段標(biāo)識(shí)符數(shù)字遞增順序予以說(shuō)明,并規(guī)定各種數(shù)字字段的描述結(jié)構(gòu),即:字段定義:對(duì)每個(gè)字段內(nèi)容做簡(jiǎn)要說(shuō)明。出現(xiàn)情況:對(duì)每個(gè)字段是否重復(fù),是必備字段還是選擇使用字段進(jìn)行說(shuō)明。在有些字段中,還包括了對(duì)字段出現(xiàn)情況的說(shuō)明和限定。指示符:對(duì)指示符的值進(jìn)行說(shuō)明。子字段:按序列出子字段,及其適用范圍、重復(fù)性和是否必備的說(shuō)明。字段內(nèi)容注釋?zhuān)簩?duì)字段的數(shù)據(jù)內(nèi)容和字段中子字段之間的關(guān)系進(jìn)行說(shuō)明,包括適用范圍、著錄用標(biāo)識(shí)符以及字段內(nèi)容形式的建議。相關(guān)字段:列出與本字段內(nèi)容相關(guān)的字段或數(shù)據(jù)元,以有助于字段的比較,并對(duì)相關(guān)字段的用法進(jìn)行簡(jiǎn)要的說(shuō)明。如果在某一字段的描述結(jié)構(gòu)中缺省其中的某一項(xiàng),則表明該項(xiàng)內(nèi)容在該字段中尚無(wú)說(shuō)明。(二)《中國(guó)檔案機(jī)讀目錄格式》(GB/T
20163—2006)的主要內(nèi)容(2)符號(hào)規(guī)范《中國(guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)所列舉的字段、指示符和子字段以及在與其有關(guān)的著錄和實(shí)例中,對(duì)符號(hào)采用下列規(guī)范:字段標(biāo)識(shí)符:用符號(hào)“&”表示《信息技術(shù)信息交換用七位編碼字符集》(GB/T1988—1998)中的IS1,作為子字段標(biāo)識(shí)符的第一個(gè)符號(hào)??崭穹河梅?hào)“?!北硎尽缎畔⒓夹g(shù)信息交換用七位編碼字符集》(GB/T1988—1998)中的空格符,即七位編碼字符集代碼表中的2/0位置上的這個(gè)字符?!埃!北硎驹摌?biāo)準(zhǔn)文本中的空格,或表示行文上顯現(xiàn)得不明顯但又必須出現(xiàn)的空格。子字段分隔符:用符號(hào)“@”表示《信息技術(shù)信息交換用七位編碼字符集》(GB/T1988—1998)中的IS2,作為完整實(shí)例中的字段分隔符。記錄結(jié)束符:用符號(hào)“%”表示《信息技術(shù)信息交換用七位編碼字符集》(GB/T1988—1998)中的IS3,作為完整實(shí)例中的記錄結(jié)束符?!拔炊x”:當(dāng)短語(yǔ)“未定義”與指示符連用時(shí),則表示在該指示符位置沒(méi)有賦值,用空格填充。系統(tǒng)外字符號(hào):對(duì)目前暫不能錄入的系統(tǒng)外字符采用系統(tǒng)外字符號(hào)“=”代替。非排序字符:ISO6630目錄控制字符集中的08/08與08/09位置上的字符,即“≠NBS≠”和“≠NBE≠”字符,分別表示“不排序開(kāi)始”和“不排序結(jié)束”,即指明在兩個(gè)排序符號(hào)之間的數(shù)據(jù)是不用于排序的。2.記錄結(jié)構(gòu)(1)框架結(jié)構(gòu)。《中國(guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)是國(guó)際標(biāo)準(zhǔn)化組織制定的ISO2709的執(zhí)行格式,對(duì)用于交換的機(jī)讀目錄數(shù)據(jù)記錄規(guī)定了必須遵循的框架結(jié)構(gòu),即由記錄頭標(biāo)、記錄目次區(qū)、數(shù)據(jù)字段區(qū)(變長(zhǎng))和記錄結(jié)束符構(gòu)成。(2)記錄頭標(biāo)。根據(jù)ISO2709的規(guī)定,每一條記錄由24個(gè)字符的記錄頭標(biāo)開(kāi)始,記錄頭標(biāo)包含有ISO2709中定義的關(guān)于記錄結(jié)構(gòu)的數(shù)據(jù)和作為ISO2709的執(zhí)行格式而由《中國(guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)專(zhuān)門(mén)定義的數(shù)據(jù)元①。這些作為執(zhí)行格式而定義的數(shù)據(jù)元是:記錄類(lèi)型、記錄級(jí)別、記錄級(jí)別關(guān)系、檔案控制、著錄等級(jí)、記錄的完整程度以及在編制記錄中是否采用《檔案著錄規(guī)則》(DA/T18—1999)等。記錄頭標(biāo)中的數(shù)據(jù)元主要是為滿(mǎn)足記錄處理的需要,并被間接地用來(lái)確認(rèn)檔案著錄單位。(3)記錄目次區(qū)。在記錄頭標(biāo)之后為記錄的目次區(qū),目次區(qū)中每個(gè)目次項(xiàng)由三個(gè)部分構(gòu)成:三位十進(jìn)制數(shù)表示的字段標(biāo)識(shí)符、四位十進(jìn)制數(shù)表示的數(shù)據(jù)字段的長(zhǎng)度,以及由五位十進(jìn)制數(shù)表示的字段起始字符位置。除此之外,在目次項(xiàng)中不再允許有其他字符。(4)變長(zhǎng)數(shù)據(jù)字段。變長(zhǎng)數(shù)據(jù)字段在目次區(qū)之后,其通常包括檔案目錄數(shù)據(jù),而不是處理數(shù)據(jù)。(5)必備字段。機(jī)讀目錄的必備字段是指在機(jī)讀目錄記錄中必須提供的字段。《中國(guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)要求的必備字段包括:001——記錄標(biāo)識(shí)號(hào);020——檔號(hào);100——通用處理數(shù)據(jù);101——檔案語(yǔ)種;200——題名與責(zé)任說(shuō)明項(xiàng);801——記錄來(lái)源。(6)記錄長(zhǎng)度?!吨袊?guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)對(duì)記錄長(zhǎng)度的限定為99999個(gè)字符。記錄的長(zhǎng)度當(dāng)然也可以由交換單位雙方協(xié)商來(lái)確定。(7)記錄連接。在實(shí)際著錄工作中,如果需要將一個(gè)著錄單位②的記錄與另一個(gè)著錄單位的記錄連接,可使用記錄連接塊中的連接字段,這些字段就是專(zhuān)門(mén)為建立這樣的連接而設(shè)定的。(8)字符集。根據(jù)《中國(guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)生成的檔案機(jī)讀目錄,應(yīng)使用國(guó)家的字符集標(biāo)準(zhǔn),或使用由國(guó)際標(biāo)準(zhǔn)化組織制定的字符集標(biāo)準(zhǔn)。記錄頭標(biāo)、記錄目次區(qū)、指示符、子字段標(biāo)識(shí)符以及《中國(guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)所規(guī)定的代碼值,應(yīng)使用《信息技術(shù)信息交換用七位編碼字符集》(GB/T1988—1998)中的功能字符和圖形字符,該字符集在機(jī)讀目錄中被認(rèn)為是默認(rèn)的字符集。(9)數(shù)據(jù)重復(fù)。數(shù)據(jù)可能會(huì)出現(xiàn)重復(fù)的情況包括:數(shù)據(jù)既以編碼形式又以文字形式出現(xiàn),既以顯示形式又以非顯示形式出現(xiàn);檔案中含有不同語(yǔ)言文字的同一種信息;為熟悉多種語(yǔ)言文字的讀者提供多種著錄語(yǔ)言文字;為適應(yīng)各種復(fù)雜的輸出要求,同一種信息以不同文字形式重復(fù)。(10)記錄塊功能?!吨袊?guó)檔案機(jī)讀目錄格式》(GB/T20163—2006)的數(shù)據(jù)字段區(qū)共分為10塊。各個(gè)字段標(biāo)識(shí)符的第一個(gè)數(shù)字表示字段所屬的塊。3.記錄頭標(biāo)和數(shù)據(jù)字段——基本說(shuō)明這部分內(nèi)容主要說(shuō)明了“字段和子字段重復(fù)”、“字段順序”(記錄中的字段不需要規(guī)定其順序)、“子字段順序”、“字符”、“有歧義時(shí)使用的字符”、“非排序控制符”、“數(shù)據(jù)的形式與內(nèi)容”、“著錄用標(biāo)識(shí)符”、“中國(guó)追加字段”等方面的規(guī)則和建議。4.記錄頭標(biāo)和數(shù)據(jù)字段——字段描述記錄頭標(biāo)部分的內(nèi)容主要包括:記錄頭標(biāo)的定義,出現(xiàn)情況,字段標(biāo)識(shí)符、指示符和子字段,定長(zhǎng)數(shù)據(jù)元,字段內(nèi)容注釋?zhuān)嚓P(guān)字段等。記錄頭出現(xiàn)在每條記錄的開(kāi)始,必備且不可重復(fù);總長(zhǎng)度為24個(gè)字符(其中記錄長(zhǎng)度為5個(gè)字符,記錄狀態(tài)為1個(gè)字符,執(zhí)行代碼為4個(gè)字符,指示符長(zhǎng)度為1個(gè)字符,子字段標(biāo)識(shí)符長(zhǎng)度為1個(gè)字符,數(shù)據(jù)基地址為5個(gè)字符,記錄附加定義為3個(gè)字符,目次區(qū)目次項(xiàng)結(jié)構(gòu)為4個(gè)字符)。記錄頭標(biāo)部分主要對(duì)10個(gè)功能塊的定義、出現(xiàn)情況(說(shuō)明是否必備)、指示符、子字段、字段內(nèi)容注釋、相關(guān)字段、代碼符號(hào)等方面的著錄規(guī)則和要求進(jìn)行說(shuō)明。5.附錄A(規(guī)范性附錄)中國(guó)檔案機(jī)讀目錄格式數(shù)據(jù)格式樣例該附錄對(duì)“記錄交換形式”和“記錄字段形式”進(jìn)行了舉例說(shuō)明。6.附錄B(資料性附錄)中國(guó)檔案機(jī)讀目錄格式數(shù)據(jù)字段實(shí)例該附錄共列舉了11個(gè)類(lèi)別的實(shí)例。其中包括:“B.1記錄頭標(biāo)實(shí)例”“B.20——標(biāo)識(shí)塊實(shí)例”“B.31——編碼信息塊實(shí)例”“B.42——著錄信息塊實(shí)例”“B.53——附注塊實(shí)例”“B.64——記錄連接塊實(shí)例”“B.75——相關(guān)題名塊實(shí)例”“B.86——主題分析塊實(shí)例”“B.97——文件責(zé)任塊實(shí)例”“B108——國(guó)際使用塊實(shí)例”“B119——國(guó)內(nèi)使用塊實(shí)例”等??紤]到檔案目錄數(shù)據(jù)管理向檔案全文數(shù)據(jù)管理的延伸,所選的數(shù)據(jù)庫(kù)管理系統(tǒng)應(yīng)當(dāng)符合以下要求:(1)安全性能高(2)具有良好的開(kāi)放性(3)數(shù)據(jù)處理能力強(qiáng)(4)操作簡(jiǎn)便(5)支持多用戶(hù)共享(6)具有高性?xún)r(jià)比和適用性三、檔案目錄數(shù)據(jù)庫(kù)管理系統(tǒng)(一)檔案目錄數(shù)據(jù)庫(kù)管理系統(tǒng)的性能要求數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)是管理數(shù)據(jù)庫(kù)的系統(tǒng)軟件,它將大量的結(jié)構(gòu)化數(shù)據(jù)按照一定的數(shù)據(jù)模型組織、存儲(chǔ)起來(lái),并提供建立、操作、維護(hù)檔案目錄數(shù)據(jù)的命令和方法。目前,結(jié)構(gòu)化的檔案目錄數(shù)據(jù)庫(kù)均選擇關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),如SQLServer、Oracle、Access等。作為檔案管理系統(tǒng)的“內(nèi)核”,產(chǎn)品的選擇對(duì)系統(tǒng)的運(yùn)行效率和性?xún)r(jià)比的提高具有舉足輕重的作用。一般來(lái)說(shuō),館藏量較豐富的國(guó)家檔案館或大型企事業(yè)單位的檔案館,可以?xún)?yōu)先考慮SQLServer:主流產(chǎn)品,其品牌信譽(yù)和市場(chǎng)支持程度較高,在兼容性和售后服務(wù)方面比較優(yōu)秀。Oracle、DB2這些大型數(shù)據(jù)庫(kù)產(chǎn)品雖然系統(tǒng)性能和安全性更好,但價(jià)格過(guò)高,對(duì)操作人員的要求也偏高,更適合高端的商業(yè)性應(yīng)用,對(duì)一般檔案機(jī)構(gòu)來(lái)說(shuō)軟硬件配置費(fèi)用過(guò)高。有條件的國(guó)家檔案館或大型企業(yè)集團(tuán)檔案館也可以考慮選用這些數(shù)據(jù)庫(kù)管理系統(tǒng)。庫(kù)藏量不大的檔案館或綜合檔案室,考慮到今后的可擴(kuò)充性,在條件允許的情況下可選擇用中型的數(shù)據(jù)庫(kù)管理系統(tǒng),如SQLServer、Sybase等。普通檔案室檔案數(shù)據(jù)量少,一般僅對(duì)本單位內(nèi)部提供服務(wù),對(duì)網(wǎng)上查詢(xún)和網(wǎng)絡(luò)安全的要求較低,可以選擇Access或VFP。Access的網(wǎng)絡(luò)性能比VFP好一些,要在網(wǎng)上提供檔案目錄查詢(xún)的檔案室最好使用Access。這兩種數(shù)據(jù)庫(kù)管理系統(tǒng)的優(yōu)點(diǎn)是價(jià)格便宜、操作簡(jiǎn)單,普通用戶(hù)適當(dāng)培訓(xùn)即可使用;缺點(diǎn)是安全性和網(wǎng)絡(luò)功能較差。(二)檔案目錄數(shù)據(jù)庫(kù)管理系統(tǒng)的選擇購(gòu)置數(shù)據(jù)庫(kù)管理系統(tǒng)可采取兩種辦法:一是選擇一些基本軟件包,保證應(yīng)用系統(tǒng)的運(yùn)行和一些數(shù)據(jù)庫(kù)的輔助操作,然后在此基礎(chǔ)上編程。二是不考慮經(jīng)濟(jì)因素,選擇其全部軟件包,然后根據(jù)自己的技術(shù)能力進(jìn)行深層次開(kāi)發(fā)。檔案目錄數(shù)據(jù)庫(kù)建設(shè)工作量大,一個(gè)縣級(jí)檔案館的文件級(jí)條目數(shù)量就達(dá)百萬(wàn)以上。立檔單位和國(guó)家檔案館可在保證檔案安全的前提下,引入市場(chǎng)力量,組織實(shí)施檔案目錄數(shù)據(jù)庫(kù)建設(shè)工作。具體措施可包括:(1)引入市場(chǎng)化運(yùn)作機(jī)制。將檔案目錄數(shù)據(jù)的錄入工作外包給專(zhuān)門(mén)從事數(shù)據(jù)處理的公司,或者聘用數(shù)據(jù)錄入人員專(zhuān)職從事該項(xiàng)工作。在引入外部力量時(shí),必須注意引入模式,并進(jìn)行合理分工。例如,通過(guò)招投標(biāo)方式來(lái)選擇合作公司,通過(guò)簽約來(lái)明確技術(shù)要求和雙方的權(quán)利、責(zé)任。在合作過(guò)程中,檔案部門(mén)要科學(xué)地分解任務(wù),采取“兩頭在內(nèi)、中間在外”的分工模式,即前處理工作和質(zhì)量驗(yàn)收工作由檔案部門(mén)負(fù)責(zé),而著錄數(shù)據(jù)的錄入工作主要依靠外部力量來(lái)完成。動(dòng)用社會(huì)力量建庫(kù),必須對(duì)參與者進(jìn)行嚴(yán)格的專(zhuān)項(xiàng)培訓(xùn)并保證館藏檔案的安全。(2)分解任務(wù),館、室共建。檔案館對(duì)于新移交的文件,可通過(guò)行政命令規(guī)定移交單位在移交檔案的同時(shí),必須提交按規(guī)范格式制作的機(jī)讀檔案目錄。(三)檔案目錄數(shù)據(jù)庫(kù)建設(shè)工作的組織實(shí)施案卷目錄是以案卷為單位,依據(jù)檔案整理順序組織起來(lái)的,固定案卷位置,統(tǒng)計(jì)案卷數(shù)量,監(jiān)督、保護(hù)檔案材料的一種管理工具。它也是檔案館(室)最基本的一種檢索工具。它既是查找檔案最基本的工具,又是編制其他檢索工具所必須參考使用的工具。四、常用的手工檔案檢索工具(一)案卷目錄卷內(nèi)文件目錄匯集亦稱(chēng)“全引目錄”,即根據(jù)全宗或全宗的某一部分案卷內(nèi)的文件目錄匯編而成的檢索工具。它是案卷目錄與卷內(nèi)文件目錄“合二而一”的產(chǎn)物。其主要形式是,先列出每一個(gè)案卷的卷號(hào)、標(biāo)題、起止日期、頁(yè)數(shù),接著就在下面列出這個(gè)卷的卷內(nèi)文件目錄。這種檢索工具的優(yōu)點(diǎn)是不僅有案卷號(hào)、案卷標(biāo)題,而且有卷內(nèi)每份文件的作者、文號(hào)、文件標(biāo)題、文件成文日期、所在頁(yè)碼,揭示內(nèi)容和成分比較具體,查找案卷或單份文件都方便;即便檔案被保存在分庫(kù),檔案人員對(duì)庫(kù)存情況也可了如指掌;編制也比較簡(jiǎn)便,只需將案卷目錄與卷內(nèi)文件目錄打印或復(fù)印裝訂成冊(cè)即可。缺點(diǎn)是案卷文件目錄匯編之后,往往條目和冊(cè)數(shù)較多,體積龐大;而且只能沿用原來(lái)案卷的分類(lèi)體系,不能按照每份文件內(nèi)容的性質(zhì)來(lái)分類(lèi),問(wèn)題不夠集中,不便按專(zhuān)題查找利用。(二)卷內(nèi)文件目錄匯集檔案分類(lèi)目錄是根據(jù)立檔單位的檔案實(shí)體體系分類(lèi)方案編制的一種檢索工具。檔案分類(lèi)目錄的著錄項(xiàng)目主要包括分類(lèi)號(hào)(簡(jiǎn)稱(chēng)“類(lèi)號(hào)”)、案卷號(hào)(簡(jiǎn)稱(chēng)“卷號(hào)”)、案卷題名、年度、數(shù)量(頁(yè)、件、張)數(shù)、保管期限、備注等。(三)檔案分類(lèi)目錄專(zhuān)題目錄是系統(tǒng)揭示檔案館(室)內(nèi)有關(guān)某一專(zhuān)門(mén)題目檔案內(nèi)容和成分的一種檢索工具。專(zhuān)題目錄的編制方法大致如下:(1)選題(2)制訂計(jì)劃(3)選材(4)條目
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年服務(wù)器性能優(yōu)化與升級(jí)服務(wù)合同3篇
- 二零二五年度知識(shí)產(chǎn)權(quán)國(guó)際注冊(cè)與維權(quán)合同正規(guī)范本3篇
- 二零二五年度還建小區(qū)房屋買(mǎi)賣(mài)及配套設(shè)施合同3篇
- 2025年度鋼筋套筒法律咨詢(xún)服務(wù)合同
- 二零二五年智能機(jī)器人研發(fā)與銷(xiāo)售合同3篇
- 項(xiàng)目融資ppp模式課程設(shè)計(jì)
- 二零二五年度智能綠色節(jié)能廠房建設(shè)項(xiàng)目承包合同3篇
- 二零二五年度防水材料企業(yè)信用評(píng)級(jí)與金融服務(wù)合同3篇
- 轉(zhuǎn)臺(tái)模塊課程設(shè)計(jì)
- 二零二五年度特色民宿租賃代理服務(wù)合同范本3篇
- 供銷(xiāo)合同(完整版)
- 二零二五年企業(yè)存單質(zhì)押擔(dān)保貸款合同樣本3篇
- 鍋爐安裝、改造、維修質(zhì)量保證手冊(cè)
- 城鎮(zhèn)老舊小區(qū)改造項(xiàng)目計(jì)劃書(shū)
- 2025年山東省濟(jì)南市萊蕪高新區(qū)農(nóng)畜產(chǎn)品質(zhì)量協(xié)管員招聘10人歷年管理單位筆試遴選500模擬題附帶答案詳解
- 2025年白銀有色集團(tuán)招聘筆試參考題庫(kù)含答案解析
- (2024)河南省公務(wù)員考試《行測(cè)》真題及答案解析
- 帕金森病指南2024年
- 1000只肉羊養(yǎng)殖基地建設(shè)項(xiàng)目可行性研究報(bào)告
- 《勞保用品安全培訓(xùn)》課件
- 二零二四年度物業(yè)管理合同標(biāo)的的管理內(nèi)容和質(zhì)量要求
評(píng)論
0/150
提交評(píng)論