下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第五章第五章 中文信息處理中文信息處理內(nèi)容內(nèi)容 漢字字形概述 字形描述技術(shù) 字形的壓縮和還原 字形的放大和縮小 TTF字形技術(shù) 字庫的設(shè)計(jì)和管理技術(shù) 漢字字庫的應(yīng)用 5.1 5.1 漢字字形概述漢字字形概述 漢字字形及其特點(diǎn) 字形、字型和字形庫 字形描述技術(shù)及其種類5.1.1 5.1.1 漢字字形及其特點(diǎn)漢字字形及其特點(diǎn) 漢字字形指的是漢字形體結(jié)構(gòu)的圖像。 漢字字形的特點(diǎn):漢字的字形呈方塊形漢字從字形上可以分成各種結(jié)構(gòu)漢字字形的分解方法和分解標(biāo)準(zhǔn)尚未統(tǒng)一,常用的字形分解方法一般從單字、字根、筆畫(或筆形)和形素這四個(gè)層次入手。5.1.2 5.1.2 字形、字型和字形庫字形、字型和字形庫 字形:
2、字符的一個(gè)實(shí)例。 有的時(shí)候,幾個(gè)字符可以合成一個(gè)字形,例如美元符號(hào):一個(gè)“S”形狀加上一根豎線:一個(gè)“S”形狀加上一根割斷的豎線:一個(gè)“S”形狀加上兩根豎線:一個(gè)“S”形狀加上兩根割斷的豎線: 漢字的字形更加復(fù)雜,我國制定了一系列的國家標(biāo)準(zhǔn)來嚴(yán)格定義各種字符集中字符的字形。5.1.2 5.1.2 字形、字型和字形庫(續(xù))字形、字型和字形庫(續(xù))字型:某一個(gè)字體的實(shí)例,如某個(gè)特定的磅值。西文的印刷字型有: serif sans serif script中文使用的主要字型有: 宋體 仿宋體 楷體 黑體5.1.2 5.1.2 字形、字型和字形庫(續(xù))字形、字型和字形庫(續(xù))西文字型和中文字型的對應(yīng)關(guān)
3、系 西文字型西文字型中文字型中文字型SerifSong(宋體)Sans serifHei(黑體)ScriptKai(楷體)OtherFangsong(仿宋體)5.1.2 5.1.2 字形、字型和字形庫(續(xù))字形、字型和字形庫(續(xù)) 字形庫中存儲(chǔ)的是某個(gè)集合所有字符的字形信息。 實(shí)際上,字形庫是一個(gè)計(jì)算機(jī)的存儲(chǔ)器系統(tǒng),它的設(shè)計(jì)、管理和使用原則上與計(jì)算機(jī)存儲(chǔ)器系統(tǒng)是一致的。5.1.3 5.1.3 字形描述技術(shù)及其種類字形描述技術(shù)及其種類 字形描述技術(shù)是以數(shù)字代碼描述字的形狀,在輸出版面的時(shí)候,由計(jì)算機(jī)將代碼還原,恢復(fù)字原來的形狀,由輸出設(shè)備輸出。字形描述技術(shù)也被稱為字形壓縮還原技術(shù)。 字形描述技術(shù)
4、的水平高低,不僅決定了輸出字的速度、字形美觀和輸出效果,同時(shí)也影響到:字庫存儲(chǔ)空間字形還原的計(jì)算量5.1.3 5.1.3 字形描述技術(shù)及其種類(續(xù))字形描述技術(shù)及其種類(續(xù)) 字形描述技術(shù)描述一般可分為:點(diǎn)陣字形描述技術(shù)輪廓矢量字形描述技術(shù)曲線輪廓字形描述技術(shù)5.2 5.2 字形描述技術(shù)字形描述技術(shù) 點(diǎn)陣字形描述技術(shù) 輪廓矢量字形描述技術(shù) 曲線輪廓字形描述技術(shù) 其他字形描述技術(shù)5.2.1 5.2.1 點(diǎn)陣字形描述技術(shù)點(diǎn)陣字形描述技術(shù) 漢字點(diǎn)陣的規(guī)模一般是:m2n m2n 在一般情況下,16 16點(diǎn)陣和24 24點(diǎn)陣使用的比較多。隨著激光印字機(jī)、激光照排機(jī)、圖文記錄機(jī)等輸出設(shè)備分辨力的提高,又有
5、了48 48、96 96、128 128、256 256、512 512、1024 1024的點(diǎn)陣字庫。 下面以16 16點(diǎn)陣介紹點(diǎn)陣字形描述的方法。5.2.1 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))點(diǎn)陣字形描述技術(shù)(續(xù)) 把一個(gè)方塊橫向分成16格,縱向也分成16格,形成256個(gè)小方格,即該矩陣有256個(gè)“點(diǎn)”。每一個(gè)點(diǎn)可以有黑、白兩種顏色。 用這樣的點(diǎn)陣覆蓋到漢字上,凡是與筆畫重疊的點(diǎn),規(guī)定它是黑色;凡是不與筆畫重疊的點(diǎn),規(guī)定它是白色。5.2.1 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))點(diǎn)陣字形描述技術(shù)(續(xù))漢字“啊”的點(diǎn)陣字形 漢字“啊”點(diǎn)陣字形數(shù)字化表示 5.2.1 5.2.1 點(diǎn)陣字形描述技術(shù)(
6、續(xù))點(diǎn)陣字形描述技術(shù)(續(xù)) 一個(gè)漢字點(diǎn)陣字形的存儲(chǔ)量:16 16:256位,即32個(gè)字節(jié)24 24:72個(gè)字節(jié)32 32:128個(gè)字節(jié)5.2.1 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))點(diǎn)陣字形描述技術(shù)(續(xù)) 橫向點(diǎn)陣:每個(gè)點(diǎn)陣數(shù)字代碼均描述漢字橫向點(diǎn)的情況。數(shù)字代碼是順序從左到右、自上而下掃描點(diǎn)陣各點(diǎn)狀態(tài)而形成的。一般適用于顯示器 。 縱向點(diǎn)陣:每個(gè)點(diǎn)陣數(shù)字代碼均描述漢字縱向點(diǎn)的情況。數(shù)字代碼是順序從上到下、自左至右掃描點(diǎn)陣各點(diǎn)狀態(tài)而形成的。一般適用于打印機(jī) 5.2.1 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))點(diǎn)陣字形描述技術(shù)(續(xù))16 16橫向點(diǎn)陣的情況 5.2.1 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))
7、點(diǎn)陣字形描述技術(shù)(續(xù)) 漢字“啊” 用橫向點(diǎn)陣來表示,其數(shù)字代碼是:00H、04H、2FH、7EH、F9H、04H、A9H、04H、AAH、14H、AAH、7CH、ACH、54H、AAH、54H、AAH、54H、A9H、54H、E9H、74H、ADH、54H、0AH、04H、08H、04H、08H、14H、08H、0CH5.2.1 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))點(diǎn)陣字形描述技術(shù)(續(xù))16 16縱向點(diǎn)陣的情況 5.2.1 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))點(diǎn)陣字形描述技術(shù)(續(xù)) 漢字“啊”用縱向點(diǎn)陣來表示,其數(shù)字代碼是:3FH、F0H、20H、20H、7FH、F0H、20H、00H、7FH、
8、FFH、42H、10H、4DH、88H、70H、70H、00H、00H、47H、F0H、44H、20H、4FH、F2H、44H、01H、FFH、FFH、40H、00H、00H、00H 5.2.1 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))點(diǎn)陣字形描述技術(shù)(續(xù)) 各種精度的點(diǎn)陣字形其特點(diǎn)和用途 :16 16(簡易型)24 24(普通型)32 32(提高型)其他更高精度的點(diǎn)陣字形5.2.2 5.2.2 輪廓矢量字形描述技術(shù)輪廓矢量字形描述技術(shù) 輪廓矢量字庫的出現(xiàn)是為了改進(jìn)點(diǎn)陣字庫鋸齒狀輪廓,同時(shí)也是因?yàn)槔L圖機(jī)用筆輸出的需要而發(fā)展起來的一種字形描述技術(shù)。 輪廓矢量的字形描述技術(shù)的核心是用多條直線逼近字形,并
9、進(jìn)行封閉處理,字形效果明顯改觀。5.2.2 5.2.2 輪廓矢量字形描述技術(shù)(續(xù))輪廓矢量字形描述技術(shù)(續(xù))輪廓矢量字形描述技術(shù)的直角坐標(biāo)系 5.2.2 5.2.2 輪廓矢量字形描述技術(shù)(續(xù))輪廓矢量字形描述技術(shù)(續(xù))5.2.2 5.2.2 輪廓矢量字形描述技術(shù)(續(xù))輪廓矢量字形描述技術(shù)(續(xù))輪廓字庫解決了點(diǎn)陣字庫縮放后失真的問題。這種字形描述技術(shù)對漢字橫平豎直的字形有很好的描述效果,但對于撇、捺、點(diǎn),以及圓弧裝飾效果的字體,仍然不能十分逼近字形,而且字體放大之后,輪廓仍然具有折線感。在大的點(diǎn)陣做成的矢量輪廓字庫縮小到很小或小的點(diǎn)陣做成的矢量字放大得很大時(shí),都會(huì)帶 來失真。因此大號(hào)字用2562
10、56點(diǎn)陣為基礎(chǔ)的矢量輪廓,而小號(hào) 字仍用9696或128128點(diǎn)陣為基礎(chǔ)的矢量輪廓。 5.2.3 5.2.3 曲線輪廓字形描述技術(shù)曲線輪廓字形描述技術(shù) 曲線輪廓字庫是以二次曲線和三次曲線逼近字形輪廓的字形描述方法。其中以PostScript字形描述技術(shù)為代表。 PostScript字形描述技術(shù)是用美國Adobe公司的PostScript頁面描述語言來描述字形的一種技術(shù)。其特點(diǎn)是以貝塞爾曲線(Bezier curve)擬合文字形狀,比較完整地保留了文字原有的字形信息。5.2.3 5.2.3 曲線輪廓字形描述技術(shù)(續(xù))曲線輪廓字形描述技術(shù)(續(xù)) 解決字形質(zhì)量的失真問題:特征參數(shù):對用直線、二次曲線
11、或三次曲線描述字形輪廓的字形描述技術(shù)的一種補(bǔ)充。智能復(fù)原:依靠字形復(fù)原軟件的判斷和處理來保證字形復(fù)原的質(zhì)量,而字形描述本身不包含很多的特征信息。5.2.3 5.2.3 曲線輪廓字形描述技術(shù)(續(xù))曲線輪廓字形描述技術(shù)(續(xù))PostScript Type 1語言中的特征參數(shù): 字符級特征參數(shù): hstem/vstem:給出水平/垂直筆段的位置和寬度。 hstem 3/vstem 3:給出等距等寬的三個(gè)平行筆段的位置和寬度。 字庫級特征參數(shù): StdHW, StdVW, StemSnapH, StemSnapV:給出字庫中字符的標(biāo)準(zhǔn)筆畫寬帶,或者筆畫寬度的跳躍變化,參數(shù)為寬度值的數(shù)組。 BlueVa
12、lues:給出西文字形的準(zhǔn)線位置,參數(shù)為準(zhǔn)線位置的數(shù)組。 5.2.3 5.2.3 曲線輪廓字形描述技術(shù)(續(xù))曲線輪廓字形描述技術(shù)(續(xù))部分筆畫水平段的情況 5.2.3 5.2.3 曲線輪廓字形描述技術(shù)(續(xù))曲線輪廓字形描述技術(shù)(續(xù))筆鋒高度的測量 5.2.3 5.2.3 曲線輪廓字形描述技術(shù)(續(xù))曲線輪廓字形描述技術(shù)(續(xù)) 字庫中每個(gè)漢字的特征參數(shù)生成完畢以后,還要添加合適的字庫級特征參數(shù),主要包括:筆畫標(biāo)準(zhǔn)寬度StdHW/StdVW筆畫寬度的跳躍變化StemSnapH/StemSnapV5.2.3 5.2.3 曲線輪廓字形描述技術(shù)(續(xù))曲線輪廓字形描述技術(shù)(續(xù)) 比較有影響的PostScri
13、pt西文字庫有:Type 1Type 3Type 5 國內(nèi)用PostScript語言描述的輪廓字體只有以Type 1 和Type 3的格式做出的字庫。5.2.3 5.2.3 曲線輪廓字形描述技術(shù)(續(xù))曲線輪廓字形描述技術(shù)(續(xù))用PostScript技術(shù)描述漢字時(shí),在字符筆畫過大、字又太細(xì)長時(shí),軟件為了要顯示所有黑色筆畫就會(huì)忽略筆畫間的空白,造成筆畫重疊、比例變形等問題。對于低分辨力的輸出設(shè)備(如顯示器和針式打印機(jī)),這種字庫的輸出效果反倒不如點(diǎn)陣字庫優(yōu)越,即使增加大量的特征參數(shù)描述也得不到較大的改善。因此也采用字庫中包含點(diǎn)陣字庫用于輸出小字號(hào)文字的變通方法。5.2.4 5.2.4 其他字形描述
14、技術(shù)其他字形描述技術(shù) TrueType字庫。微軟公司協(xié)助蘋果公司開發(fā)并于1990年底推出TrueType字庫。這種字庫放棄以三次曲線逼近字形輪廓的優(yōu)點(diǎn),而采用二次曲線逼近字形輪廓。TrueType字庫有精心設(shè)計(jì)的特征參數(shù)處理。Folio字庫。在Unix作站的領(lǐng)域中,有Sun公司的Folio字庫技術(shù)。由于Sun工作站在美國廣泛用于社團(tuán)和專業(yè)用的出版系統(tǒng),因此Folio F3字形描述格式也是值得一提的字形描述技術(shù)。智能字庫(Intellifont)。由愛克發(fā)計(jì)算機(jī)國際公司開發(fā),用于惠普系列激光印字機(jī)。5.3 5.3 字形的壓縮和還原字形的壓縮和還原 什么是字形的壓縮和還原 字形點(diǎn)陣的壓縮和還原 輪
15、廓矢量字形的壓縮方法 其他字形壓縮技術(shù)5.3.1 5.3.1 什么是字形的壓縮和還原什么是字形的壓縮和還原 對于正式出版物來說,文字分辨率需29.2線/毫米以上。因此,最常用的五號(hào)漢字點(diǎn)陣為108 108,特大號(hào)字則為576 576。不同精度的點(diǎn)陣表示一個(gè)漢字需要的字節(jié)數(shù):48482889696115212812820482K25625681928K5125123276832K1024 1024131072 128K5.3.1 5.3.1 什么是字形的壓縮和還原(續(xù))什么是字形的壓縮和還原(續(xù)) 512512點(diǎn)陣字庫GB2312字符集宋體、楷體、黑體、仿宋體4種字體字庫容量是845.375M
16、10241024點(diǎn)陣字庫GB2312字符集宋體、楷體、黑體、仿宋體4種字體字庫容量是3381.5M5.3.1 5.3.1 什么是字形的壓縮和還原(續(xù))什么是字形的壓縮和還原(續(xù))字形信息壓縮技術(shù)應(yīng)滿足以下幾方面要求: 字形信息壓縮技術(shù)不允許信息壓縮后丟失或發(fā)生錯(cuò)誤,也就是說壓縮信息能正確再現(xiàn)原字形信息,否則在文字復(fù)原時(shí)將會(huì)引起字形畸變。 字形信息壓縮過程應(yīng)當(dāng)簡便易行,并且可用專門的軟件和硬件自動(dòng)完成,便于用戶獨(dú)立進(jìn)行缺字補(bǔ)充的操作。 由文字字形壓縮信息向最終輸出的點(diǎn)陣字形信息的轉(zhuǎn)換應(yīng)當(dāng)迅速可靠。 壓縮效果顯著。5.3.1 5.3.1 什么是字形的壓縮和還原(續(xù))什么是字形的壓縮和還原(續(xù))追求
17、壓縮效果和文字復(fù)原速度這兩個(gè)指標(biāo)是相互沖突的,因?yàn)閴嚎s倍率越高,字形復(fù)原過程就越復(fù)雜,復(fù)原工作量也越大,文字還原速度也就越慢。事實(shí)上,任何字形信息的壓縮方法都是以損失文字復(fù)原速度和輸出速度為代價(jià)而換來存貯空間的節(jié)約的。評價(jià)一種字形壓縮技術(shù)的優(yōu)劣,不僅要看信息壓縮倍率的高低,而且還要看是否能做到快速復(fù)原。不能進(jìn)行快速文字復(fù)原的字形壓縮方法是不實(shí)用的。5.3.2 5.3.2 字形點(diǎn)陣的壓縮和還原字形點(diǎn)陣的壓縮和還原黑白段表示法黑白段表示法是考慮到漢字筆畫中黑白連續(xù)變化的特點(diǎn)而產(chǎn)生的壓縮方法。壓縮時(shí)計(jì)算機(jī)逐行地?cái)?shù)取點(diǎn)陣中的空白點(diǎn)數(shù)(白段)和非空白點(diǎn)數(shù)(黑段), 按一定格式相間地記錄下一串?dāng)?shù)字構(gòu)成行點(diǎn)
18、陣信息。同樣也可用重復(fù)行數(shù)來壓縮相鄰的重復(fù)行信息。行標(biāo)志重復(fù)行數(shù)白段黑段白段黑段 *N W1 B1 Wn Bn5.3.2 5.3.2 字形點(diǎn)陣的壓縮和還原(續(xù))字形點(diǎn)陣的壓縮和還原(續(xù)) 線性增量表示法 采用黑、白段信息格式,保留上述的豎直壓縮,增加一種新的壓縮格式。 線性增量表示法用以處理漢字筆畫中大量存在的斜線。 在一行黑、白段記錄信息的后面再注明線段的增量,這樣下一行的黑、白段長度在上一行的基礎(chǔ)上按增量的大小作相應(yīng)的變化。5.3.2 5.3.2 字形點(diǎn)陣的壓縮和還原(續(xù))字形點(diǎn)陣的壓縮和還原(續(xù))行標(biāo)志重復(fù)行數(shù)白段白段增量黑段黑段增量 *N W1 W1 B1 B1白段白段增量黑段黑段增量
19、 Wn Wn Bn Bn用增量記錄的行數(shù)要超過兩行(n大于2),壓縮才有意義。第1行是不考慮增量值的黑、白段信息,最后一行是加上相應(yīng)增量后的黑、白段信息,中間的n-2行的黑白段長段均在上一行的長度基礎(chǔ)上,加上線性增量來補(bǔ)齊的。 5.3.2 5.3.2 字形點(diǎn)陣的壓縮和還原(續(xù))字形點(diǎn)陣的壓縮和還原(續(xù))考慮10241024點(diǎn)陣字庫,如采用黑白段表示法得到一行信息:“* 2 1024 0”,則表示?如果相鄰行不相同的概率為50%,平均每行有5個(gè)黑段,則一個(gè)漢字的字形信息有:(1+1+10*2)*1024*(100%-50%)=11K國內(nèi)早期在蒙納激光照排系統(tǒng)中使用一種13801380點(diǎn)陣的字庫,
20、1種字體就要約2000MB的存儲(chǔ)量。采用這兩種壓縮方法以后,這個(gè)系統(tǒng)的黑體、宋體、仿宋體、楷體4種字體的字庫總存儲(chǔ)量約為65MB。5.3.3 5.3.3 輪廓矢量字形的壓縮方法輪廓矢量字形的壓縮方法規(guī)則筆畫:橫、豎、折。規(guī)則筆畫主要由直線段、起筆筆鋒、收筆筆鋒和轉(zhuǎn)折筆鋒等構(gòu)成。筆鋒總共可以分成7種,因此在宋體橫這一筆畫的壓縮表示中,用3位表示收筆筆鋒的號(hào)碼(06),其余的信息將指示橫的起始點(diǎn)的x、y坐標(biāo),橫的長度、寬度以及有無起筆筆鋒等。這樣宋體的一筆橫需34字節(jié)便可精確描述而絲毫不失真。筆畫豎也是如此,起筆筆鋒用3位信息來表示,收起筆鋒用2位信息來表示,其余的信息則表示起點(diǎn)坐標(biāo)、豎的長度和寬
21、度,此外還用1個(gè)字節(jié)來詳細(xì)描述筆畫左、右傾斜的情況,這樣描述宋體的豎需要5個(gè)字節(jié)。 5.3.3 5.3.3 輪廓矢量字形的壓縮方法(續(xù))輪廓矢量字形的壓縮方法(續(xù)) 不規(guī)則筆畫:點(diǎn)、撇、捺、鉤 對不規(guī)則筆畫,用向量折線對輪廓曲線作一般性的描述。 為了減少數(shù)位的浪費(fèi),使壓縮信息更加緊湊,采用增設(shè)控制字節(jié)的方法,按下述規(guī)則對之進(jìn)行裝配:5.3.3 5.3.3 輪廓矢量字形的壓縮方法(續(xù))輪廓矢量字形的壓縮方法(續(xù)) 若控制字節(jié)的頭兩位為11,則該字節(jié)其余6位與下一節(jié)合起來,指示不規(guī)則筆畫起始點(diǎn)的x、y坐標(biāo)。7654321011筆畫起始點(diǎn)的x坐標(biāo)x7筆畫起始點(diǎn)的y坐標(biāo)5.3.3 5.3.3 輪廓矢量
22、字形的壓縮方法(續(xù))輪廓矢量字形的壓縮方法(續(xù)) 若控制字節(jié)的頭兩位為10,表示所指示的向量的x、y的絕對值中至少有一個(gè)大于等于16,此時(shí)控制字節(jié)的末6位與下一字節(jié)合起來表示該向量的x、y的數(shù)值,數(shù)值以原碼表示。7654321010向量的xx7向量的y5.3.3 5.3.3 輪廓矢量字形的壓縮方法(續(xù))輪廓矢量字形的壓縮方法(續(xù))N7654321001向量的個(gè)數(shù)N象限| x | y |象限| x | y |若控制字節(jié)的頭兩位為01,表示后面N個(gè)向量的x、y絕對值均小于8,N由控制字節(jié)的最末5位指示。后面N個(gè)向量中的每個(gè)向量用一個(gè)字節(jié)表示,其中2位指示該向量所處的象限,3 位指示x的絕對值,3位
23、指示y的絕對值。5.3.3 5.3.3 輪廓矢量字形的壓縮方法(續(xù))輪廓矢量字形的壓縮方法(續(xù))N7654321000象限向量的個(gè)數(shù)N| x | y | x | y |若控制字節(jié)的頭兩位為00,表示后面N個(gè)向量處于同一象限,且x、y的絕對值均小于16。N由控制字節(jié)的最末4位表示,控制字節(jié)的中間2位指明象限,后面N個(gè)向量都由一個(gè)字節(jié)表示,其中4位指示x的絕對值,4位指示y的絕對值。5.3.3 5.3.3 輪廓矢量字形的壓縮方法(續(xù))輪廓矢量字形的壓縮方法(續(xù))在采用了上述的進(jìn)一步壓縮的措施之后,1個(gè)五號(hào)漢字字形信息平均需要120字節(jié)來記錄,而記錄1個(gè)五號(hào)漢字字形點(diǎn)陣信息大約需用1400多個(gè)字節(jié),
24、因此單字的平均壓縮倍率大約為12倍。由于五號(hào)字最常用,且非變倍字形的恢復(fù)速度也最快,故系統(tǒng)字庫中只存入五號(hào)字的字形壓縮信息,而其余字號(hào)均由計(jì)算機(jī)通過五號(hào)字字模變倍得到。目前的計(jì)算機(jī)漢字出版系統(tǒng)上中宋體、黑體、仿宋體、楷體、報(bào)宋體、小標(biāo)題宋體幾種字模的壓縮信息,存儲(chǔ)量約為5MB,字??傮w壓縮倍率在500倍左右。5.3.3 5.3.3 輪廓矢量字形的壓縮方法(續(xù))輪廓矢量字形的壓縮方法(續(xù)) 字形壓縮信息與最終輸出的點(diǎn)陣字形信息,這兩種數(shù)據(jù)之間存在著“結(jié)構(gòu)沖突”。“次序沖突”:字模壓縮信息以筆畫為序,規(guī)則筆畫在前,不規(guī)則筆畫在后,一筆信息完畢再有另一筆信息;而輸出點(diǎn)陣信息則是從左至右,一行完了再開
25、始新的一行,二者的次序關(guān)系完全不同?!斑吔鐩_突”:字模壓縮信息以筆畫劃分內(nèi)部信息的邊界,而最終要輸出的點(diǎn)陣信息以行劃分邊界,二者的邊界完全不同。5.3.4 5.3.4 其他字形壓縮技術(shù)其他字形壓縮技術(shù) 骨架向量法:又稱筆畫骨架法。用能夠表示漢字筆畫特征的線段,作為組成漢字字形的最基本元素的字形表示法??捎孟铝袛?shù)據(jù)來表示:(15,1E)、(80,8D)(F5,F(xiàn)E)、(1D,F(xiàn)D)5.3.45.3.4 其他字形壓縮技術(shù)(續(xù))其他字形壓縮技術(shù)(續(xù)) 部件組字法:抽取漢字的共性,以最少量的部件和筆畫作為基本字元來組織出盡可能多的漢字字形,這就是所謂的組字技術(shù)。組字技術(shù)并非信息壓縮技術(shù)。 漢字字形壓縮
26、法還有:無失真向量擬合法、曲線參數(shù)擬合法、筆畫函數(shù)疊加法、輪廓特征分析法、復(fù)合壓縮法、遞推偏差擬合法、折線法、疊加法字形壓縮、哈夫曼綜合處理法等。5.45.4 字形的放大和縮小字形的放大和縮小 漢字的字號(hào) 字形放大和縮小的基本原理 防止字形放大和縮小失真的措施 字形放大縮小的應(yīng)用5.4.15.4.1 漢字的字號(hào)漢字的字號(hào) 書版宋體、報(bào)版宋體、標(biāo)題宋體、仿宋體、黑體和楷體這六種字體,均以五號(hào)字為基本字號(hào)。 字模存儲(chǔ)器中只存放五號(hào)字的壓縮信息,其余字號(hào)都由五號(hào)字變倍而得。 基本字體還可以通過拉長和壓扁的變倍方法變化出各種長字體和扁字體。5.4.25.4.2 字形放大和縮小的基本原理字形放大和縮小的
27、基本原理字形在放大和縮小時(shí),也分為規(guī)則筆畫和不規(guī)則筆畫這兩種情況來處理。無論使規(guī)則筆畫還是不規(guī)則筆畫,都是用輪廓折線表示的,它們很容易被放大縮小。例如,要使得圖形放大r倍(這里r不一定是整數(shù)),只需把對應(yīng)的每段輪廓折線放大r倍,也即對每條折線的x、y值都乘以r。要得到高質(zhì)量的放大或縮小的字形,需要采取一系列的措施來防止在變倍過程中的失真。5.4.35.4.3 防止字形放大和縮小失真的措施防止字形放大和縮小失真的措施 1. 防止字形變倍時(shí)的舍入誤差積累。變倍時(shí)舍入誤差的積累 5.4.35.4.3 防止字形放大和縮小失真的措施(續(xù))防止字形放大和縮小失真的措施(續(xù)) 結(jié)點(diǎn)變倍方法,用下面的公式獲得
28、變倍后的x、y(變倍率=r):AB折線的x = B點(diǎn)的x坐標(biāo) A點(diǎn)的x坐標(biāo)= (B點(diǎn)x坐標(biāo) r)(舍入) - (A點(diǎn)x坐標(biāo) r)(舍入)AB折線的y = B點(diǎn)的y坐標(biāo) A點(diǎn)的y坐標(biāo)= (B點(diǎn)y坐標(biāo) r)(舍入) - (A點(diǎn)y坐標(biāo) r)(舍入)* 這里(p)(舍入)表示p經(jīng)過四舍五入后取整數(shù)值。5.4.35.4.3 防止字形放大和縮小失真的措施(續(xù))防止字形放大和縮小失真的措施(續(xù)) 2. 保證規(guī)則筆畫寬度的一致性。 對于規(guī)則筆畫橫、豎、折的寬度部分,不采用結(jié)點(diǎn)變倍法,而按下述公式計(jì)算:變倍后的寬度 = (變倍前寬度 r)(舍入) 5.4.35.4.3 防止字形放大和縮小失真的措施(續(xù))防止字形
29、放大和縮小失真的措施(續(xù)) 3. 規(guī)則筆畫與不規(guī)則筆畫銜接部分的處理筆畫勾的下延伸 A點(diǎn)的A點(diǎn)由直線變倍得到,而對應(yīng)B點(diǎn)的B點(diǎn)由結(jié)點(diǎn)變倍得到。這樣,AB直線本來是直的,但變倍后的AB折線可能變成向左或向右傾斜一格的斜線??刹扇∫韵麓胧┛朔耸д妫寒?dāng)延伸的第一筆原x = 0,則變倍后永遠(yuǎn)使這一筆的x = 0。5.4.35.4.3 防止字形放大和縮小失真的措施(續(xù))防止字形放大和縮小失真的措施(續(xù)) 4. 小號(hào)字橫的寬度的控制和筆鋒的細(xì)致描述。 字號(hào)縮小很小時(shí),在變倍過程中會(huì)引起某些部分變得過分密集,尤其當(dāng)一個(gè)字內(nèi)橫的數(shù)量很多時(shí)。在橫的壓縮信息中,用兩位二進(jìn)制數(shù)細(xì)致刻畫橫寬。5.4.45.4.4
30、字形放大縮小的應(yīng)用字形放大縮小的應(yīng)用 點(diǎn)陣方法描述的字形在縮放時(shí)采用插值加線或抽線的方法,會(huì)產(chǎn)生嚴(yán)重變形或以質(zhì)量損失為代價(jià)??梢圆捎闷交夹g(shù)使鋸齒邊的臺(tái)階縮小或用斜邊代替鋸齒。但是無論平滑技術(shù)如何好,所產(chǎn)生的字形因鋸齒或折線而產(chǎn)生的不平滑感只能縮小而不能排除。 5.4.45.4.4 字形放大縮小的應(yīng)用(續(xù))字形放大縮小的應(yīng)用(續(xù))輪廓矢量方法是為了改進(jìn)點(diǎn)陣字形在縮放時(shí)會(huì)出現(xiàn)鋸齒狀輪廓而產(chǎn)生。在文字復(fù)原時(shí),通過對向量的長度進(jìn)行變倍放大或縮小,便可獲得不同的字號(hào)。如果在變倍時(shí)對x方向和y方向分別選不同的倍率,還可以獲得變形長體字或扁體字。輪廓字庫在還原時(shí)需經(jīng)特定的運(yùn)算將這些用輪廓描述的字形轉(zhuǎn)化成點(diǎn)
31、陣方式,再由輸出設(shè)備輸出。這個(gè)運(yùn)算可以在輸出設(shè)備內(nèi)進(jìn)行,也可在計(jì)算機(jī)上先轉(zhuǎn)換成位圖再輸出。5.4.45.4.4 字形放大縮小的應(yīng)用(續(xù))字形放大縮小的應(yīng)用(續(xù)) 輪廓字庫解決了點(diǎn)陣字庫縮放后失真的問題。這種字形描述技術(shù)對漢字橫平豎直的字形有很好的描述效果,但對于撇、捺、點(diǎn),以及圓弧裝飾效果的字體,即使是縮小直線距,仍然不能十分逼近字形,而且字體放大之后,輪廓仍然具有折線感。 由于近年來硬件的迅速發(fā)展,有能力用二次曲線或三次曲線代替直線描述字形輪廓的字庫。5.55.5 TTF TTF字形技術(shù)字形技術(shù) 什么是TrueType TrueType的基本原理 TrueType字體文件結(jié)構(gòu) TrueTyp
32、e的特點(diǎn)和優(yōu)勢 TrueType的應(yīng)用 OpenType的出現(xiàn)5.5.15.5.1 什么是什么是TrueTypeTrueType TrueType是Apple公司和Microsoft公司合作開發(fā)的PDL(Page Description Language)語言TrueImage中的字形描述部分。 TrueType有一套專門的指令集,用于完成字形的描述、特征參數(shù)的描述及其他一些描述。它用的輪廓描述曲線是二次B-樣條(Bezier-spline)函數(shù)。 5.5.25.5.2 TrueType TrueType的基本原理的基本原理 TrueType字體對字形的描述是輪廓描述,在輪廓上有一串結(jié)點(diǎn)組成,
33、這些結(jié)點(diǎn)有on-line和off-line兩種屬性來描述一個(gè)封閉的輪廓線。 TrueType對字形輪廓上的結(jié)點(diǎn)都給出一個(gè)編號(hào),其順序是按順時(shí)針方向走一圈,即填黑的部分永遠(yuǎn)在其右邊。5.5.25.5.2 TrueType TrueType的基本原理(續(xù))的基本原理(續(xù))TrueType字庫中的主要特征參數(shù)在X方向上有5個(gè)關(guān)鍵距離值: 字身最左邊的起始點(diǎn)到字母主干的空間; 字母主體部分的寬度; 字身的寬度(西文字母字身不等寬); 字母主干(stem)的寬度; 字母襯線(serif)的大小。在Y方向上: 字母橫干(crossbar)的厚度; 字母襯線的厚度; 字母主體的高度; 字母橫干的高度。5.5
34、.25.5.2 TrueType TrueType的基本原理(續(xù))的基本原理(續(xù)) 在變倍時(shí)用數(shù)學(xué)方法將相同的特征參數(shù)值同等定義,在任何字號(hào)下都同等還原,這時(shí)考慮的是字體各特征點(diǎn)的形狀,而不考慮坐標(biāo)格的修整。 TrueType的字形文件不單單由輪廓數(shù)據(jù)而且還有用TrueType指令寫的程序,TrueType的字形包括指令和數(shù)據(jù)及TrueType字形發(fā)生器。5.5.35.5.3 TrueType TrueType字體文件結(jié)構(gòu)字體文件結(jié)構(gòu)TrueType字體文件總體結(jié)構(gòu):文件頭(12 Bytes)描述表目錄(每個(gè)16 Bytes)描述表數(shù)據(jù)5.5.35.5.3 TrueType TrueType字
35、體文件結(jié)構(gòu)(續(xù))字體文件結(jié)構(gòu)(續(xù)) 文件頭共12B:Fixedsfnt_version/TTF文件版本號(hào)碼(0 x00010000)USHORTnumTables/描述表數(shù)目USHORTsearchRange/描述表快速查找范圍USHORTentrySelector/描述表入口選擇USHORTrangeShift/范圍調(diào)整5.5.35.5.3 TrueType TrueType字體文件結(jié)構(gòu)(續(xù))字體文件結(jié)構(gòu)(續(xù)) 描述表目錄。其目錄個(gè)數(shù)由numTables決定,每個(gè)目錄項(xiàng)16B:ULONGtag/描述表名稱(4 Bytes)ULONGcheckSum/描述表內(nèi)容的校驗(yàn)和ULONGoffset/
36、此描述表的位置偏移(從文件頭開始)ULONGlength/描述表字節(jié)長度5.5.35.5.3 TrueType TrueType字體文件結(jié)構(gòu)(續(xù))字體文件結(jié)構(gòu)(續(xù))常用的TTF文件描述表共有19個(gè),其中有10個(gè)為每個(gè)TTF文件所必須包含的,其他的9個(gè)可根據(jù)需要任選。10個(gè)必須的描述表: cmap字符代碼到文字序號(hào)的映射表 glyf文字輪廓數(shù)據(jù) head文件頭信息 hhea水平度量頭信息 hmtx水平度量信息 loca字符輪廓數(shù)據(jù)位置索引 maxp最大值描述 name名字表 postPostScript打印機(jī)控制 OS/2OS/2和Windows度量信息5.5.35.5.3 TrueType T
37、rueType字體文件結(jié)構(gòu)(續(xù))字體文件結(jié)構(gòu)(續(xù))9個(gè)可選的描述表: cvt 控制值表 fpgm定義程序區(qū) hdmx水平設(shè)備度量 kern緊排控制 LTSH線性門限 prepCVT程序區(qū) WIN 保留 VDMX垂直設(shè)備度量 FOCA保留5.5.45.5.4 TrueType TrueType的的特點(diǎn)特點(diǎn)和優(yōu)勢和優(yōu)勢 TrueType的特點(diǎn)是:TrueType既可作打印字體,又可以用作屏幕顯示。由于它是由指定字形進(jìn)行描述,因此它與分辨率無關(guān),輸出時(shí)總是按照打印機(jī)的分辨率輸出。無論放大或縮小,字符總是光滑的,不會(huì)有鋸齒出現(xiàn)。相對PostScript字體來說,其質(zhì)量要差一些。特別是在文字太小時(shí),表現(xiàn)
38、得不是很清楚。5.5.45.5.4 TrueType TrueType的特點(diǎn)和的特點(diǎn)和優(yōu)勢優(yōu)勢 由于TrueType技術(shù)本身的特點(diǎn)而使它具有以下優(yōu)勢:真正的所見即所得效果支持字體嵌入技術(shù),保證文件的跨系統(tǒng)傳遞性操作系統(tǒng)平臺(tái)的兼容性ABC字寬值精確的字體輪廓描述品種繁多的字體家族5.5.55.5.5 TrueType TrueType的應(yīng)用的應(yīng)用 TTF字體的創(chuàng)建:使用已有的TTF字體編輯軟件。 TTF字體在面向?qū)ο蟪绦蛑械囊茫篧indows使用LOGFONT結(jié)構(gòu)定義字體文件的屬性。此結(jié)構(gòu)可以在程序中直接引用。程序片斷。5.5.65.5.6 OpenTypeOpenType的出現(xiàn)的出現(xiàn) 為了解
39、決 “前后端不一致”的問題,微軟和Adobe公司聯(lián)合推出了一種新的通用字體格式OpenType(簡稱OTF)。 OpenType集中了TrueType和Type 1兩種字形描述技術(shù)的特點(diǎn),是一個(gè)開放、無版權(quán)的字形描述技術(shù)。5.5.65.5.6 OpenTypeOpenType的出現(xiàn)(續(xù))的出現(xiàn)(續(xù)) OpenType字體格式能達(dá)到以下目的:更寬的多平臺(tái)支持;更好的支持國際字符集;更強(qiáng)的字體數(shù)據(jù)保護(hù);字體文件更小,有利于提高發(fā)送效率;為先進(jìn)的字體印刷控制提供更多的支持。5.65.6 字庫的設(shè)計(jì)和管理技術(shù)字庫的設(shè)計(jì)和管理技術(shù) 漢字字庫的基本要求 漢字庫性能的評測 漢字庫結(jié)構(gòu)的設(shè)計(jì) 點(diǎn)陣字庫的制作5.6.15.6.1 漢字字庫的基本要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年醫(yī)院后勤工作計(jì)劃選文
- 2025幼兒園后勤主任工作計(jì)劃
- 人教版八年級歷史與社會(huì)上冊說課稿綜合探究二從宗教景觀看文化的多樣性
- 全國浙教版信息技術(shù)高中選修1新授課 第一節(jié) 枚舉算法 說課稿
- 稅務(wù)工作總結(jié)信息化升級業(yè)務(wù)提速
- 2025年高二英語教學(xué)計(jì)劃-高二英語下學(xué)期教學(xué)計(jì)劃
- 2025年新學(xué)期幼兒園家長工作計(jì)劃
- 園林園藝行業(yè)前臺(tái)工作總結(jié)
- 2025年度人力資源工作計(jì)劃參考
- 人教版八年級 歷史與社會(huì)上冊 1.3.2《羅馬帝國的興衰》 說課稿
- 神通數(shù)據(jù)庫管理系統(tǒng)v7.0企業(yè)版-2實(shí)施方案
- 人體內(nèi)臟器官結(jié)構(gòu)分布圖詳解
- 八年級上冊科學(xué)(浙教版)復(fù)習(xí)提綱
- 商務(wù)溝通第二版第4章書面溝通
- 基金會(huì)項(xiàng)目基金捐贈(zèng)立項(xiàng)表
- OCT青光眼及視野報(bào)告
- 人音版小學(xué)音樂四年級下冊課程綱要
- 初中語文人教七年級上冊朝花夕拾學(xué)生導(dǎo)讀單
- 山西鄉(xiāng)寧焦煤集團(tuán)臺(tái)頭煤焦公司礦井兼并重組整合項(xiàng)目初步設(shè)計(jì)安全專篇
- 弱電工程自檢報(bào)告
- DB33∕T 628.1-2021 交通建設(shè)工程工程量清單計(jì)價(jià)規(guī)范 第1部分:公路工程
評論
0/150
提交評論