近現(xiàn)代文獻資料的數(shù)字出版與保護_第1頁
近現(xiàn)代文獻資料的數(shù)字出版與保護_第2頁
近現(xiàn)代文獻資料的數(shù)字出版與保護_第3頁
近現(xiàn)代文獻資料的數(shù)字出版與保護_第4頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

近現(xiàn)代文獻資料的數(shù)字出版與保護

內(nèi)容是數(shù)字出版行業(yè)的靈魂。高度價值的出版內(nèi)容和合理有效的管理方法是數(shù)字出版行業(yè)健康可持續(xù)發(fā)展的基本要求和動力。我國古代歷史、近代革命和現(xiàn)代建設中遺留下來的海量文獻資料,是數(shù)字出版內(nèi)容的重要來源之一。近現(xiàn)代文獻資料,指的是自1911年辛亥革命到21世紀初近百年間所創(chuàng)作出的圖書、報刊、日記等文獻資料。由于近現(xiàn)代文獻資料距今時間較短,因此普遍存在不必緊急搶救開發(fā)的認識誤區(qū);同時,長期以來人們一直認為近現(xiàn)代文獻的價值遠不如古籍善本,所以它們的安置待遇也就遠低于古籍文獻。近現(xiàn)代文獻資料淪為歷史文獻中的“亞珍貴文獻”,甚至是“弱勢群體”。需要引起人們重視的是,這些資料記錄著近代的革命浪潮、百家爭鳴的學術(shù)思想、抗戰(zhàn)時期的跌宕政局和新中國成立后的治國滄桑,其珍貴性并不比古籍善本低。利用數(shù)字出版平臺來挖掘、開發(fā)和管理近現(xiàn)代文獻資料,是數(shù)字出版產(chǎn)業(yè)實現(xiàn)保護、傳播人類文化知識遺產(chǎn)這一歷史使命的重要方式。一、歷史文化:現(xiàn)代數(shù)字化和現(xiàn)代文獻的必要性1.私權(quán)和文獻資料中國近現(xiàn)代歷史是一部政局跌宕、風潮暗涌的革命史,其不同政見和立場的政治實體孕育了各具特色的經(jīng)濟、文化、思想文獻載體,如《大公報》《滿洲三省志》《蔣中正日記》《論持久戰(zhàn)》等等都誕生于此。此外,在新中國成立之后,全國范圍內(nèi)轟轟烈烈開展起來的土地改革、社會主義改造和改革開放等運動,也都留下了大量的私人記錄、文學作品、公開發(fā)行報刊和政府機構(gòu)出版物等文獻資料。數(shù)字出版產(chǎn)業(yè)有責任重現(xiàn)這宏大壯觀的歷史語境,將其數(shù)字化,以保留這些珍貴的資料,從而更加真實地還原歷史原貌和歷史真相,更加清晰地展示新中國的奮斗及成長歷程,為中國解決發(fā)展中出現(xiàn)的各種社會問題提供必要的參考。2.數(shù)字出版是中國近代新興學科的基本前提中國近現(xiàn)代的政治雖然起伏動蕩,文化事業(yè)卻非常繁榮。近現(xiàn)代的中國思想文化異彩紛呈,圖書、報刊、手記、海報、檔案、圖片等豐富多彩的文獻形式,反映出了近現(xiàn)代時期百家爭鳴的文化盛況。在民國時期,學術(shù)啟蒙和思想交鋒一度達到頂峰,民國學人以《新青年》雜志為陣地,轟轟烈烈地開展新文化運動,在這段重要的歷史時期內(nèi),誕生了諸如梁啟超的《中國近三百年學術(shù)史》、馮友蘭的《中國哲學史》、李大釗的《我的馬克思主義觀》等學術(shù)巨著。新中國成立之后,中共中央適時提出了“百花齊放,百家爭鳴”的振興文化事業(yè)的方針政策,文化事業(yè)得到了迅速的繁榮和發(fā)展,產(chǎn)出了大量如《紅巖》《蔡文姬》等優(yōu)秀作品。改革開放之后,我國文化事業(yè)再次迎來輝煌發(fā)展的春天,涌現(xiàn)并出版了更多的文化精品。數(shù)字出版產(chǎn)業(yè)有責任演繹和傳播這百家爭鳴的文化思潮。近現(xiàn)代涌現(xiàn)出的這些文化精品,是中國近現(xiàn)代學術(shù)史上首批具有開創(chuàng)意義的奠基之作,不僅對我國近代新興學科的創(chuàng)建具有重要的學術(shù)價值和參考價值,在全世界范圍也被視作第一手研究資料。作為延續(xù)民族文化的重要手段,數(shù)字化出版這些近現(xiàn)代文獻資料可以重新演繹出近現(xiàn)代歷史中的文化風采和思想交鋒。3.確保文獻原始特征海量的近現(xiàn)代文獻資料中,相當一部分在中國近現(xiàn)代學術(shù)史上占據(jù)著重要地位。數(shù)字化采集提取和編輯處理過的近現(xiàn)代精品文獻,可以完整保存文獻資料的文本信息,更能保持文獻的初始面目,如原件的印章、墨跡、筆跡、批注等各種原始特征,使當代研究學者可以足不出戶地拜讀到近現(xiàn)代文獻的原始樣貌,體會到近現(xiàn)代文獻的原始韻味,為研究學者提供更多挖掘原始資料的線索,有助于當代科學研究更廣泛和更深入的開展,對當代多種學科的建設有著不可替代的作用。4.數(shù)字信息資源進入互聯(lián)網(wǎng)時代,網(wǎng)絡傳播所具有的不受時空限制、信息量大、傳播速度快的特點,使數(shù)字信息成為最重要的文化資源。數(shù)字化手段將使人類的精神文化寶庫跨越時空,在全人類面前實現(xiàn)資源共享,可以讓神秘的中國文化——尤其是近現(xiàn)代文化歷史——借助現(xiàn)代信息技術(shù)再現(xiàn)輝煌,讓全世界人民感受到東方文化恒久彌新的獨特魅力。二、優(yōu)化數(shù)字出版的內(nèi)容源源不斷地提供優(yōu)質(zhì)內(nèi)容,是保證數(shù)字出版行業(yè)健康科學、可持續(xù)發(fā)展的基本要素。對于近現(xiàn)代文獻而言,從浩如煙海的近現(xiàn)代文獻史料中挖掘和優(yōu)選出具備人文、思想、經(jīng)濟、歷史價值的優(yōu)質(zhì)資源,是數(shù)字出版的第一步。然而,海量的文史資料中必然玉石同室,精華與糟粕同在。因此,數(shù)字出版前應對這些內(nèi)容資源進行優(yōu)選,實現(xiàn)對數(shù)字出版內(nèi)容質(zhì)量的宏觀控制。長期以來,受“片紙只字不得銷毀”思想的誤導,我國的近現(xiàn)代文獻整理和數(shù)字化工程一直持有“有文必收”的錯誤態(tài)度,這難免會將內(nèi)容價值極其一般的事務性、零散性和重復性文件也收錄其中,導致數(shù)字出版產(chǎn)業(yè)“內(nèi)容龐雜、魚龍混雜、玉石不分”,也造成了人力、財力和物力的巨大浪費。對近現(xiàn)代文獻資料進行挖掘和優(yōu)選,除對國家所有的文獻資料進行整理外,更要重視民間對文化遺產(chǎn)的容納力。要通過民間走訪和考古發(fā)掘進行文獻挖掘,然后對散落在民間的文獻資料和館藏文獻進行擇優(yōu)鑒選,使投入的人力、財力、物力、時間等要素得以充分、合理和有效的配置,最大限度發(fā)揮數(shù)字化成果的經(jīng)濟效益和社會效益,提高數(shù)字資源的利用率。對數(shù)字化對象的鑒選,應當采取歷史文化價值優(yōu)先性原則,從重要文獻到次要文獻,從亟須文獻到一般文獻,依次鋪開,循序推進,打造優(yōu)質(zhì)化和精品化的數(shù)字出版產(chǎn)業(yè)。三、大量的內(nèi)容非結(jié)構(gòu)化數(shù)字出版產(chǎn)業(yè)的內(nèi)容管理,是指在內(nèi)容上進行包括收集、編輯處理、格式轉(zhuǎn)換、審核、版本控制、內(nèi)容測試、發(fā)布等處理的過程。在大量的內(nèi)容資源中,絕大部分內(nèi)容是非結(jié)構(gòu)化的,內(nèi)容管理的目的是把非結(jié)構(gòu)化的信息,制作成圖書、報刊、光盤、網(wǎng)頁等產(chǎn)品,供用戶以各種媒體形式閱讀、檢索、查詢、分析和共享。以近現(xiàn)代文獻資料為來源的出版內(nèi)容數(shù)字化處理,就是指對近現(xiàn)代紙質(zhì)文獻進行數(shù)字化提取、格式轉(zhuǎn)換、數(shù)字化編輯整理等加工與整合,以及進一步搭建和應用近現(xiàn)代文獻數(shù)據(jù)庫。1.縮微技術(shù)在古籍數(shù)字化處理中的應用通過數(shù)字化手段,把破損的紙質(zhì)文獻當中的文本內(nèi)容提取出來,是數(shù)字化出版近現(xiàn)代文獻資料的第一步。從古籍文獻的保護經(jīng)驗和國外數(shù)字化科技的發(fā)展趨勢來看,對近現(xiàn)代文獻資料可采用以下兩種數(shù)字化加工技術(shù):(1)通過光學字符識別——OCR軟件,把近現(xiàn)代文獻資料的內(nèi)容錄入計算機,制成文本文件等。OCR技術(shù)可將近現(xiàn)代文獻資料轉(zhuǎn)化為文本,并能從圖像文件中自動抽取題名、著者、文中插題、文內(nèi)關(guān)鍵詞等檢索點,并轉(zhuǎn)化為索引。該技術(shù)在古籍數(shù)字化處理中已有較為成熟的應用,如電子版《文淵閣四庫全書》。(2)通過影像縮微與掃描將文獻的內(nèi)容掃入計算機,制成圖像文件。縮微品存儲載體的穩(wěn)定性強,預期壽命可達500年以上,是長期安全保存文獻資料的最佳存儲介質(zhì)之一。對于非常珍貴、不可再生的近現(xiàn)代文獻資料,非常有必要使用可靠性更強的縮微技術(shù)進行處理。隨著掃描技術(shù)與縮微技術(shù)的結(jié)合,近現(xiàn)代文獻的數(shù)字化加工又可分為直接縮微處理和先掃描后縮微處理兩種形式。縮微技術(shù)在古籍數(shù)字化處理中取得的成果,值得借鑒,如廣東省立中山圖書館建成的“古籍全文數(shù)據(jù)庫”??紤]到文獻價值和保存狀況的不同,筆者建議對文獻資料采取差異化數(shù)字加工手段:(1)對于價值珍貴且易老化損壞的、或價值一般但老化壞損嚴重的文獻,建議采用縮微技術(shù),將文獻的影像記錄在縮微膠片上,以實現(xiàn)對文獻的搶救和保護。(2)對于價值高且使用頻率高的文獻,建議首先應用縮微技術(shù)制作影像膠片以便保護,在此基礎上再將縮微膠片進行數(shù)字化轉(zhuǎn)換以便編輯和使用。(3)對于價值一般、保存情況好、使用頻率高的文獻,可采用OCR光學識別技術(shù)將文獻數(shù)字化以便于傳播使用。2.各自為政、訴訟后的編纂過程數(shù)字出版絕非簡單地將數(shù)字內(nèi)容資源提取出來,還須經(jīng)過必要的編輯、整理和加工,使用戶可以對內(nèi)容資源進行檢索、復制等必需的操作。近年來,信息組織技術(shù)方法逐漸被應用于典籍文獻的數(shù)字化整理工作中,對于近現(xiàn)代文獻資料的編輯整理有參考借鑒價值。數(shù)字化編輯整理工作主要包括近現(xiàn)代文獻索引的自動編纂和近現(xiàn)代文獻電子圖書的編纂:(1)近現(xiàn)代文獻索引的自動編纂。主要是指借助OCR技術(shù)對提取出來的文獻原文進行機編索引,可采用的技術(shù)手段包括索引之星、Word索引軟件和自編語詞索引軟件等,此外,在索引排序方法方面可借鑒較為成熟的科學技術(shù)。(2)近現(xiàn)代文獻電子圖書編纂。電子圖書就是“以電子的方式儲存信息,并以電子的方式進行閱讀的圖書”。在完成掃描、識別等預處理之后,近現(xiàn)代文獻電子圖書編纂主要包括電子排版、Word文檔拆分、添加模板、制作網(wǎng)頁文件等環(huán)節(jié),EasyCHM電子圖書編輯軟件是當前最常用的電子圖書編纂軟件。王雅戈等學者以吳覺農(nóng)先生所著的《中國茶葉問題》為例,對機編索引的方法和索引軟件的應用進行了研究,并進一步應用EasyCHM電子圖書編輯軟件對民國文獻電子圖書編纂進行了實驗。其研究對民國農(nóng)業(yè)文獻數(shù)字化整理、開展農(nóng)史研究都有重要的貢獻,對其他近現(xiàn)代文獻的數(shù)字化編輯處理亦有指導借鑒意義。3.法律法規(guī)數(shù)據(jù)庫傳統(tǒng)的出版方式難以有機綜合這些文字、圖像和聲音等不同載體的內(nèi)容資源和信息,而計算機數(shù)字化處理技術(shù)和數(shù)據(jù)庫存儲管理技術(shù)則可以實現(xiàn)近現(xiàn)代文獻聲、文、圖并茂的多維度展示和傳播,改變出版作品單一的出版形式,賦予其更加生動的形象和更加強大的生命力。所以,在對海量的文獻資源完成挖掘、開發(fā)和編輯處理后,還需要對近現(xiàn)代文獻資料進行數(shù)據(jù)庫式的管理。實際上,隨著科技的發(fā)展,數(shù)據(jù)庫技術(shù)已經(jīng)成為較為先進的文獻數(shù)字化管理手段,在近現(xiàn)代文獻資料的管理中,文化出版企業(yè)和文化管理機構(gòu)已經(jīng)逐步采用這一方式。如湖南省青蘋果數(shù)據(jù)中心就走在了行業(yè)的前列。中心成立20年來,已經(jīng)數(shù)字化了從清朝至今200多年的400種報刊,建立了擁有4000億漢字和4億篇文章的海量歷史文獻庫——“華文報刊文獻數(shù)據(jù)庫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論