EPUB3.1數(shù)字出版技術(shù)研究_第1頁
EPUB3.1數(shù)字出版技術(shù)研究_第2頁
EPUB3.1數(shù)字出版技術(shù)研究_第3頁
EPUB3.1數(shù)字出版技術(shù)研究_第4頁
EPUB3.1數(shù)字出版技術(shù)研究_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余2頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、    epub3.1數(shù)字出版技術(shù)研究    遲亮摘要:本文了闡述epub 3.1數(shù)字出版標(biāo)準(zhǔn)的特點(diǎn)優(yōu)勢,分析了epub數(shù)字出版物的文件結(jié)構(gòu),詳細(xì)分析了epub3.1標(biāo)準(zhǔn)的組成和關(guān)鍵文件的內(nèi)容。關(guān)鍵詞:epub3.1;數(shù)字出版;文件結(jié)構(gòu):tp3 :a :1009-3044(2018)19-0239-04epub(electronic publication)是免費(fèi)開放的數(shù)字出版物文檔格式標(biāo)準(zhǔn),以oeps(open ebook publication structure)開放式電子書出版結(jié)構(gòu)為前身發(fā)展至今,具有開放靈活等特點(diǎn),是國際數(shù)字出版論壇的正式標(biāo)準(zhǔn),

2、也是當(dāng)前較為流行的數(shù)字出版技術(shù)。epub一個(gè)較為重要的版本規(guī)范epub 3.0是2011年10月推出的,之后于2013年進(jìn)行了微小的修訂,直至2017年國際數(shù)字出版論壇將epub 3.1版本批準(zhǔn)為標(biāo)準(zhǔn)推薦規(guī)范。本文對epub 3.1標(biāo)準(zhǔn)的優(yōu)勢、內(nèi)容組成、文件格式以及關(guān)鍵文件進(jìn)行了研究論述。1 epub3.1標(biāo)準(zhǔn)的特點(diǎn)與優(yōu)勢epub標(biāo)準(zhǔn)的最大特點(diǎn)是基于web標(biāo)準(zhǔn),它實(shí)現(xiàn)了將包括xhtml(extensible hyper text markup language)可擴(kuò)展超文本標(biāo)記語言、css層疊樣式表、svg(scalable vector graphics)可縮放矢量圖形、圖像文件及其他媒體資

3、源在內(nèi)的多種格式的內(nèi)容結(jié)構(gòu)化地壓縮打包為一個(gè)單一文件,便于數(shù)字出版物的分發(fā)與交換,同時(shí)具有以下特點(diǎn):1.1 可利用的媒體資源種類多epub支持多種格式的媒體文件。在epub3.1標(biāo)準(zhǔn)新中增加了w3c萬維網(wǎng)聯(lián)盟公布的woff 2.0字體格式和起源于蘋果macintosh的snft字體格式作為核心媒體類型。同時(shí)eupb 3.1 動態(tài)地將html 5和svg的最新推薦版本作為使用標(biāo)準(zhǔn),放棄了epub 3.0.1版本中只針對html 5.0和svg 1.1的過時(shí)參考。epub3.1定義核心媒體類型格式見表1。1.2 格式開放,易于在線解析與生成epub對開發(fā)人員友好,采用簡單zip格式進(jìn)行壓縮打包,易

4、于傳輸。內(nèi)部標(biāo)準(zhǔn)遵循xml和xhtml規(guī)范,易于解析與閱讀。同時(shí)epub標(biāo)準(zhǔn)是自由開放的,便于web在線生成、處理和解析。1.3 排版布局靈活,適用多種設(shè)備epub標(biāo)準(zhǔn)充分體現(xiàn)了內(nèi)容適應(yīng)用戶的原則,使用它可以呈現(xiàn)固定布局排版的文檔,也可以現(xiàn)實(shí)內(nèi)容自動重排。內(nèi)容重排的最大優(yōu)勢在于可以根據(jù)閱讀設(shè)備的性能用最適于用戶閱讀的方式呈現(xiàn)作品。epub3.1還提供多種功能樣式表,允許更改文字排列方向,允許用戶在日夜閱讀模式之間進(jìn)行選擇。2 epub 3.1的文件格式結(jié)構(gòu)epub標(biāo)準(zhǔn)發(fā)布的數(shù)字出版作品最終只呈現(xiàn)一個(gè)擴(kuò)展名為.epub的文件。epub在作品文件內(nèi)部劃分成“出版物”(publication)、“書

5、卷集”(renditions)、“包”(package)三級結(jié)構(gòu)來進(jìn)行管理。1) epub出版物,即用epub規(guī)范最終生成的數(shù)字作品文件,它通過文件容器(epub container)來進(jìn)行組織和呈現(xiàn)。即epub發(fā)布的數(shù)字作品中所有的內(nèi)容都存放在文件容器當(dāng)中,通過文件容器進(jìn)行壓縮打包后,可以對epub出版物進(jìn)行存儲和傳輸。2) 書卷集。一個(gè)數(shù)字出版物中可以由一個(gè)或多個(gè)內(nèi)容獨(dú)立的作品來組成,epub標(biāo)準(zhǔn)將出版物中一個(gè)個(gè)獨(dú)立的作品稱內(nèi)容為“rendition”,rendition類似于傳統(tǒng)出版的一套書中多個(gè)獨(dú)立成冊的書卷,本文將“rendition”譯作“書卷”。多個(gè)書卷即組成可用的書卷集(ren

6、ditions)。3) epub包。一個(gè)書卷占用一個(gè)epub包。每個(gè)epub包內(nèi)都是由包文檔(package document)、導(dǎo)航文檔(navigation document)和內(nèi)容資源(publication resources)三部分組成。包文檔是每個(gè)書卷內(nèi)必備的資源描述文件,它含有書卷的基礎(chǔ)元信息,提供書卷內(nèi)的資源清單,并定義默認(rèn)的閱讀順序。導(dǎo)航文檔是書卷內(nèi)專用必備文檔,提供了人機(jī)可讀的導(dǎo)航信息。內(nèi)容資源則是出版物要呈現(xiàn)的內(nèi)容的集合,包括有以xhtml、html或svg文件形式出現(xiàn)的內(nèi)容文件、css樣式表、音頻、視頻、圖像、嵌入式字體和腳本等。epub3.1標(biāo)準(zhǔn)下的三級格式結(jié)構(gòu),見圖

7、1。3 epub 3.1標(biāo)準(zhǔn)內(nèi)容的組成epub標(biāo)準(zhǔn)具有模塊化的特點(diǎn),它把自身的核心特性和功能用一系列的子規(guī)范來進(jìn)行分別定義。epub 3.1標(biāo)準(zhǔn)較之前的版本,最重要的變化是啟用了多個(gè)新標(biāo)準(zhǔn)模塊,子規(guī)范由之前的4個(gè)變?yōu)榱?0個(gè)。這10個(gè)模塊中包括了核心標(biāo)準(zhǔn)和可選的補(bǔ)充規(guī)范兩大類。同時(shí)從epub 3.1從版本開始,每個(gè)模塊均從epub格式和epub軟件應(yīng)用兩個(gè)方面來進(jìn)行描述,從而體現(xiàn)創(chuàng)作與呈現(xiàn)的一致性要求。epub軟件應(yīng)用指的是使用epub標(biāo)準(zhǔn)用來編輯發(fā)布或閱讀展示作品的應(yīng)用程序。3.1 epub 3.1的核心標(biāo)準(zhǔn)epub 3.1的核心標(biāo)準(zhǔn)主要有六個(gè)規(guī)范組成,它們分別是:1) epub包規(guī)范(ep

8、ub packages 3.1)。該規(guī)范對書卷所包含的內(nèi)容以及與出版物資源相關(guān)聯(lián)的設(shè)置進(jìn)行描述,主要包括了包文檔、包的元數(shù)據(jù)和導(dǎo)航文檔內(nèi)容的規(guī)范。2) epub內(nèi)容文件規(guī)范(epub content documents 3.1)。該規(guī)范定義了出版物中使用的xhtml,svg、css文件以及其中含有的腳本、固定布局、詞匯發(fā)音的標(biāo)準(zhǔn)。3) epub媒體覆蓋規(guī)范(media overlays 3.1)。本規(guī)范通過smil(synchronized multimedia integration language)同步多媒體集成語言定義了文本和音頻同步的格式和處理模型,對epub出版物中媒體層定議及媒體

9、的建立和播放行為等內(nèi)容的描述,用于要求文字與媒體同步的數(shù)字出版物。4) epub開放容器格式規(guī)范(open container format 3.1),該規(guī)范簡稱ocf,是epub標(biāo)準(zhǔn)中一個(gè)非常重要的容器技術(shù)規(guī)范,它定義了epub出版物的文件格式和處理模型,并將出版物所有相關(guān)內(nèi)容按規(guī)范打包封裝在單一的文檔容器中,同時(shí)還定義了一種出版物資源混淆嵌入的方法。本規(guī)范中定義的容器包括抽象容器和zip容器兩部分。ocf抽象容器是一種文件系統(tǒng)模型,它要求epub出版物內(nèi)所有內(nèi)容使用一個(gè)共同的根目錄中,所有本地資源都位于根目錄所在的目錄樹中,但不強(qiáng)制資源目錄的結(jié)構(gòu)形式。抽象容器模型要求在根目錄下強(qiáng)制包含一個(gè)

10、名為meta-inf文件夾,用于存儲特殊的配置文件,相關(guān)配置文件的名稱和作用見表2。抽象容器模型在根目錄中的強(qiáng)制包含一個(gè)文件名“mimetype”的文件,保留供ocf zip容器使用。抽象容器模型對資源文件的要求較為寬松,理論上ocf抽象容器中所有資源文件可以位于根目錄下的任何位置,只要它們不在meta-inf文件夾中即可,但是為方便對出版物的解析,建議將epub出版物的內(nèi)容存儲在根目錄下的一個(gè)專用文件夾中。ocf zip容器規(guī)定了最終的出版物采用一個(gè)zip壓縮的文件來進(jìn)行發(fā)布,文件擴(kuò)展名為.epub。ocf允許使用“deflate”算法或“不壓縮”兩種情況進(jìn)行文件壓縮,之外的算壓不支持,不能

11、進(jìn)行加密壓縮,不允許分卷壓縮。5) epub可訪問性規(guī)范(epub accessibility)。該規(guī)范定義為了出版物定義了可訪問性、一致性和發(fā)現(xiàn)元數(shù)據(jù)(discovery metadata)的標(biāo)準(zhǔn)。本規(guī)范不針對單個(gè)版本的epub。它旨在適用于符合任何版本或配置文件(包括未來版本的標(biāo)準(zhǔn))的epub出版物。6) 替代樣式標(biāo)簽規(guī)范(alternate style tags)。定義了使用微格式標(biāo)記替代樣式表的模式。3.2 epub 3.1可選規(guī)范epub 3.1的可選規(guī)范主要有:epub規(guī)范片段標(biāo)識符(canonical fragment identifiers)、epub詞典和詞匯表(dictio

12、naries and glossaries)、epub索引(epub indexes)、epub多書卷呈現(xiàn)(multiple renditions)、epub預(yù)覽(previews)和epub區(qū)域?qū)Ш剑╮egion-based navigation)等,用于增強(qiáng)epub出版物的功能和用戶體驗(yàn)。4 epub3.1標(biāo)準(zhǔn)中的關(guān)鍵文件在epub 3.1標(biāo)準(zhǔn)中指定了epub出版物必備或重要的配置文件,這些文件對出版物的制作和閱讀起到了重要作用,要想在線生成或解析閱讀epub數(shù)字出版物,必對這些關(guān)鍵文件進(jìn)行準(zhǔn)確配置。其中幾個(gè)必要文件的文件格式分析如下:4.1 mimetype文件在epub文件根目錄下必須

13、存在一個(gè)名“mimetype”的文件,它內(nèi)容較為簡單,僅對壓縮包的打開方式進(jìn)行了說明,其文件內(nèi)容為“application/epub+zip”,它表示出版物的壓縮包文檔可以用eupb和zip兩種方式來進(jìn)行解析使用。實(shí)事上epub格式的出版物將擴(kuò)展名由.epub改為.zip后,可以使用相應(yīng)的解壓縮文件解壓或打開,并且不影響文件內(nèi)容。4.2 opf文件epub出版物中的每個(gè)書卷都必須一個(gè)包文檔,包文檔的文件名稱不限定,但擴(kuò)展名必須為“.opf”,內(nèi)部文件格式采用xml標(biāo)準(zhǔn),通過包文檔可以準(zhǔn)確識別整個(gè)數(shù)字出版物的結(jié)構(gòu)及閱讀順序,是解析出版物及顯示epub出版物的主要信息來源。包文檔內(nèi)部使用作為根標(biāo)簽

14、。標(biāo)簽有“version”、“unique-identifier”、“dir”、“id”、“prefix”和“xml:lang”等六個(gè)屬性,其中“version”、“unique-identifier”是必須定義的。“version”屬性值表明一epub文件所采用epub規(guī)范的版本,“unique-identifier”屬性值設(shè)定了對文件內(nèi)標(biāo)簽的引用,以獲取作品的唯一標(biāo)識符,如uuid、doi、isbn或issn等。標(biāo)簽內(nèi)按照順序依次包含、和等四個(gè)標(biāo)簽。其中、和三個(gè)為必備的標(biāo)簽。標(biāo)簽提供書卷基本信息和內(nèi)容布局的顯示信息,便于檢索書目信息和訪問控制。標(biāo)簽提供書卷內(nèi)容資源的列表,每一個(gè)資源都由一個(gè)標(biāo)簽來表示。標(biāo)簽提供書書卷內(nèi)容資源的順序列表,通過子標(biāo)簽的順序定義默認(rèn)閱讀順序。、和可用的屬性和子標(biāo)簽的信息見表3。表3 、和標(biāo)簽的可用屬性和子標(biāo)簽表標(biāo)簽名 順序 可用屬性 可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論