




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 epub3.1數(shù)字出版技術研究 遲亮摘要:本文了闡述epub 3.1數(shù)字出版標準的特點優(yōu)勢,分析了epub數(shù)字出版物的文件結構,詳細分析了epub3.1標準的組成和關鍵文件的內容。關鍵詞:epub3.1;數(shù)字出版;文件結構:tp3 :a :1009-3044(2018)19-0239-04epub(electronic publication)是免費開放的數(shù)字出版物文檔格式標準,以oeps(open ebook publication structure)開放式電子書出版結構為前身發(fā)展至今,具有開放靈活等特點,是國際數(shù)字出版論壇的正式標準,
2、也是當前較為流行的數(shù)字出版技術。epub一個較為重要的版本規(guī)范epub 3.0是2011年10月推出的,之后于2013年進行了微小的修訂,直至2017年國際數(shù)字出版論壇將epub 3.1版本批準為標準推薦規(guī)范。本文對epub 3.1標準的優(yōu)勢、內容組成、文件格式以及關鍵文件進行了研究論述。1 epub3.1標準的特點與優(yōu)勢epub標準的最大特點是基于web標準,它實現(xiàn)了將包括xhtml(extensible hyper text markup language)可擴展超文本標記語言、css層疊樣式表、svg(scalable vector graphics)可縮放矢量圖形、圖像文件及其他媒體資
3、源在內的多種格式的內容結構化地壓縮打包為一個單一文件,便于數(shù)字出版物的分發(fā)與交換,同時具有以下特點:1.1 可利用的媒體資源種類多epub支持多種格式的媒體文件。在epub3.1標準新中增加了w3c萬維網聯(lián)盟公布的woff 2.0字體格式和起源于蘋果macintosh的snft字體格式作為核心媒體類型。同時eupb 3.1 動態(tài)地將html 5和svg的最新推薦版本作為使用標準,放棄了epub 3.0.1版本中只針對html 5.0和svg 1.1的過時參考。epub3.1定義核心媒體類型格式見表1。1.2 格式開放,易于在線解析與生成epub對開發(fā)人員友好,采用簡單zip格式進行壓縮打包,易
4、于傳輸。內部標準遵循xml和xhtml規(guī)范,易于解析與閱讀。同時epub標準是自由開放的,便于web在線生成、處理和解析。1.3 排版布局靈活,適用多種設備epub標準充分體現(xiàn)了內容適應用戶的原則,使用它可以呈現(xiàn)固定布局排版的文檔,也可以現(xiàn)實內容自動重排。內容重排的最大優(yōu)勢在于可以根據(jù)閱讀設備的性能用最適于用戶閱讀的方式呈現(xiàn)作品。epub3.1還提供多種功能樣式表,允許更改文字排列方向,允許用戶在日夜閱讀模式之間進行選擇。2 epub 3.1的文件格式結構epub標準發(fā)布的數(shù)字出版作品最終只呈現(xiàn)一個擴展名為.epub的文件。epub在作品文件內部劃分成“出版物”(publication)、“書
5、卷集”(renditions)、“包”(package)三級結構來進行管理。1) epub出版物,即用epub規(guī)范最終生成的數(shù)字作品文件,它通過文件容器(epub container)來進行組織和呈現(xiàn)。即epub發(fā)布的數(shù)字作品中所有的內容都存放在文件容器當中,通過文件容器進行壓縮打包后,可以對epub出版物進行存儲和傳輸。2) 書卷集。一個數(shù)字出版物中可以由一個或多個內容獨立的作品來組成,epub標準將出版物中一個個獨立的作品稱內容為“rendition”,rendition類似于傳統(tǒng)出版的一套書中多個獨立成冊的書卷,本文將“rendition”譯作“書卷”。多個書卷即組成可用的書卷集(ren
6、ditions)。3) epub包。一個書卷占用一個epub包。每個epub包內都是由包文檔(package document)、導航文檔(navigation document)和內容資源(publication resources)三部分組成。包文檔是每個書卷內必備的資源描述文件,它含有書卷的基礎元信息,提供書卷內的資源清單,并定義默認的閱讀順序。導航文檔是書卷內專用必備文檔,提供了人機可讀的導航信息。內容資源則是出版物要呈現(xiàn)的內容的集合,包括有以xhtml、html或svg文件形式出現(xiàn)的內容文件、css樣式表、音頻、視頻、圖像、嵌入式字體和腳本等。epub3.1標準下的三級格式結構,見圖
7、1。3 epub 3.1標準內容的組成epub標準具有模塊化的特點,它把自身的核心特性和功能用一系列的子規(guī)范來進行分別定義。epub 3.1標準較之前的版本,最重要的變化是啟用了多個新標準模塊,子規(guī)范由之前的4個變?yōu)榱?0個。這10個模塊中包括了核心標準和可選的補充規(guī)范兩大類。同時從epub 3.1從版本開始,每個模塊均從epub格式和epub軟件應用兩個方面來進行描述,從而體現(xiàn)創(chuàng)作與呈現(xiàn)的一致性要求。epub軟件應用指的是使用epub標準用來編輯發(fā)布或閱讀展示作品的應用程序。3.1 epub 3.1的核心標準epub 3.1的核心標準主要有六個規(guī)范組成,它們分別是:1) epub包規(guī)范(ep
8、ub packages 3.1)。該規(guī)范對書卷所包含的內容以及與出版物資源相關聯(lián)的設置進行描述,主要包括了包文檔、包的元數(shù)據(jù)和導航文檔內容的規(guī)范。2) epub內容文件規(guī)范(epub content documents 3.1)。該規(guī)范定義了出版物中使用的xhtml,svg、css文件以及其中含有的腳本、固定布局、詞匯發(fā)音的標準。3) epub媒體覆蓋規(guī)范(media overlays 3.1)。本規(guī)范通過smil(synchronized multimedia integration language)同步多媒體集成語言定義了文本和音頻同步的格式和處理模型,對epub出版物中媒體層定議及媒體
9、的建立和播放行為等內容的描述,用于要求文字與媒體同步的數(shù)字出版物。4) epub開放容器格式規(guī)范(open container format 3.1),該規(guī)范簡稱ocf,是epub標準中一個非常重要的容器技術規(guī)范,它定義了epub出版物的文件格式和處理模型,并將出版物所有相關內容按規(guī)范打包封裝在單一的文檔容器中,同時還定義了一種出版物資源混淆嵌入的方法。本規(guī)范中定義的容器包括抽象容器和zip容器兩部分。ocf抽象容器是一種文件系統(tǒng)模型,它要求epub出版物內所有內容使用一個共同的根目錄中,所有本地資源都位于根目錄所在的目錄樹中,但不強制資源目錄的結構形式。抽象容器模型要求在根目錄下強制包含一個
10、名為meta-inf文件夾,用于存儲特殊的配置文件,相關配置文件的名稱和作用見表2。抽象容器模型在根目錄中的強制包含一個文件名“mimetype”的文件,保留供ocf zip容器使用。抽象容器模型對資源文件的要求較為寬松,理論上ocf抽象容器中所有資源文件可以位于根目錄下的任何位置,只要它們不在meta-inf文件夾中即可,但是為方便對出版物的解析,建議將epub出版物的內容存儲在根目錄下的一個專用文件夾中。ocf zip容器規(guī)定了最終的出版物采用一個zip壓縮的文件來進行發(fā)布,文件擴展名為.epub。ocf允許使用“deflate”算法或“不壓縮”兩種情況進行文件壓縮,之外的算壓不支持,不能
11、進行加密壓縮,不允許分卷壓縮。5) epub可訪問性規(guī)范(epub accessibility)。該規(guī)范定義為了出版物定義了可訪問性、一致性和發(fā)現(xiàn)元數(shù)據(jù)(discovery metadata)的標準。本規(guī)范不針對單個版本的epub。它旨在適用于符合任何版本或配置文件(包括未來版本的標準)的epub出版物。6) 替代樣式標簽規(guī)范(alternate style tags)。定義了使用微格式標記替代樣式表的模式。3.2 epub 3.1可選規(guī)范epub 3.1的可選規(guī)范主要有:epub規(guī)范片段標識符(canonical fragment identifiers)、epub詞典和詞匯表(dictio
12、naries and glossaries)、epub索引(epub indexes)、epub多書卷呈現(xiàn)(multiple renditions)、epub預覽(previews)和epub區(qū)域導航(region-based navigation)等,用于增強epub出版物的功能和用戶體驗。4 epub3.1標準中的關鍵文件在epub 3.1標準中指定了epub出版物必備或重要的配置文件,這些文件對出版物的制作和閱讀起到了重要作用,要想在線生成或解析閱讀epub數(shù)字出版物,必對這些關鍵文件進行準確配置。其中幾個必要文件的文件格式分析如下:4.1 mimetype文件在epub文件根目錄下必須
13、存在一個名“mimetype”的文件,它內容較為簡單,僅對壓縮包的打開方式進行了說明,其文件內容為“application/epub+zip”,它表示出版物的壓縮包文檔可以用eupb和zip兩種方式來進行解析使用。實事上epub格式的出版物將擴展名由.epub改為.zip后,可以使用相應的解壓縮文件解壓或打開,并且不影響文件內容。4.2 opf文件epub出版物中的每個書卷都必須一個包文檔,包文檔的文件名稱不限定,但擴展名必須為“.opf”,內部文件格式采用xml標準,通過包文檔可以準確識別整個數(shù)字出版物的結構及閱讀順序,是解析出版物及顯示epub出版物的主要信息來源。包文檔內部使用作為根標簽
14、。標簽有“version”、“unique-identifier”、“dir”、“id”、“prefix”和“xml:lang”等六個屬性,其中“version”、“unique-identifier”是必須定義的?!皏ersion”屬性值表明一epub文件所采用epub規(guī)范的版本,“unique-identifier”屬性值設定了對文件內標簽的引用,以獲取作品的唯一標識符,如uuid、doi、isbn或issn等。標簽內按照順序依次包含、和等四個標簽。其中、和三個為必備的標簽。標簽提供書卷基本信息和內容布局的顯示信息,便于檢索書目信息和訪問控制。標簽提供書卷內容資源的列表,每一個資源都由一個標簽來表示。標簽提供書書卷內容資源的順序列表,通過子標簽的順序定義默認閱讀順序。、和可用的屬性和子標簽的信息見表3。表3 、和標簽的可用屬性和子標簽表標簽名 順序 可用屬性 可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年輔警招聘考試綜合提升試卷及答案詳解(易錯題)
- (2025)輔警招聘考試試題庫及完整答案詳解
- 2022年2月馬鞍山市直遴選面試真題帶詳細解析
- 2022年2月青海省稅務系統(tǒng)遴選面試真題附詳細解析
- 2022年2月銅陵市稅務系統(tǒng)遴選面試真題附解析
- 2025年行政執(zhí)法基礎知識綜合練習題有答案詳解
- 2024年甘肅陜煤集團韓城煤礦招聘真題附答案詳解(滿分必刷)
- 2025年皖北煤電集團總醫(yī)院招聘護理筆試備考題庫(含答案詳解)
- 宴請長輩致詞
- 24年高級經濟師考試試題及答案
- 2024年公安機關理論考試題庫500道附參考答案【基礎題】
- 人教PEP版五年級英語下冊期末預測卷(含答案含聽力原文無音頻)
- AI驅動的美容護理機器人技術-洞察闡釋
- 血管內導管相關性血流感染預防與診治指南(2025)解讀
- 實驗操作考試試題及答案
- 2025年湖南省長沙市語文中考作文趨勢預測(基于近十年分析)
- 2025至2030中國PDH裝置市場深度調查與競爭格局研究報告
- 助理醫(yī)師考試行為規(guī)范試題及答案
- 健康風險的評估與管理策略試題及答案
- 集團統(tǒng)借統(tǒng)還管理制度
- 酒店二次供水管理制度
評論
0/150
提交評論