談漢字編碼研究的誤區(qū)_第1頁
談漢字編碼研究的誤區(qū)_第2頁
談漢字編碼研究的誤區(qū)_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、談漢字編碼研究的誤區(qū)今天“漢字編碼”和“中文信息技術(shù)”二個(gè)專業(yè)委員會(huì)在這里聯(lián)合召開漢字輸入 技術(shù)與應(yīng)用研討會(huì),這是在漢字輸入學(xué)術(shù)領(lǐng)域里值得慶賀的一件人事。我首先向研討 會(huì)的組織者和承辦者表示深切地感謝,感謝你們給了我一個(gè)漢字編碼“發(fā)燒友”與專 家們一起坐而論道的機(jī)會(huì)。從1996年11月的蘇州會(huì)議到今天2002年11月的溫州會(huì)議,已經(jīng)過了整整6個(gè) 年頭。在這6年里,微機(jī)行業(yè)和互聯(lián)網(wǎng)行業(yè)的飛速發(fā)展,形成鮮明反弟的是漢字編碼 研究和中文輸入技術(shù)發(fā)展的相對(duì)沉悶。當(dāng)然這沉悶是個(gè)表面現(xiàn)象,在這表面現(xiàn)象卜; 是廣大中文輸入研究者的迷悟反思和對(duì)理想的中文輸入法的探索與追求。本人反思的 一孔之見是漢字編碼研究存

2、在著許多誤區(qū)?,F(xiàn)坦陳于諸位專家學(xué)者面前,期望得著指 點(diǎn)。本人所指“誤區(qū)”是指本領(lǐng)域?qū)W術(shù)帶頭人提出的得到許多專家學(xué)者認(rèn)同的似是而 非的觀點(diǎn)。首先在談及正題之前必須說明,本人認(rèn)為的漢字編碼研究領(lǐng)域里的幾個(gè)誤區(qū),絲 毫沒有一點(diǎn)輕視或貶低學(xué)術(shù)前輩和專家學(xué)者的意思,也絲毫沒有否定幾十年來漢字編 碼工作者付出的辛勤勞動(dòng)和取得的豐碩成果的意思。恰恰相反,本人心中時(shí)時(shí)涌動(dòng)的 是對(duì)本領(lǐng)域?qū)W術(shù)前輩,專家學(xué)者和廣人編碼工作者,業(yè)余編碼“發(fā)燒友”的敬仰和欽 佩之意。因?yàn)楸救擞芍缘卣J(rèn)為,口前流行使用的各種漢字編碼和輸入法,都是十分優(yōu) 秀的,即使是還沒有進(jìn)行商品化開發(fā)的,也都是非常優(yōu)秀的,它們的設(shè)計(jì)者,從各個(gè) 方面,齊個(gè)

3、角度對(duì)漢語、漢字對(duì)中文與計(jì)算機(jī)的結(jié)合進(jìn)行了卓有成效的探索研究和實(shí) 踐。可以毫不夸張地說,漢字編碼決無平庸之作,都是國人聰明才智的結(jié)晶,都是漢 字文化寶庫里的瑰寶。人家提出的一些建議和意見,即使是不成熟的意見,都休現(xiàn)了 對(duì)真理的追求,閃耀著智慧的光芒,顯示了漢字編碼研究的強(qiáng)人活力和促進(jìn)中文信息 事業(yè)發(fā)展的強(qiáng)人動(dòng)力。迄今為止,漢字編碼方案“萬碼奔騰”的人好局面來之不易,應(yīng)該得到公正的評(píng) 價(jià)和真誠的鼓勵(lì),因?yàn)檫@是理想的漢字編碼和中文輸入法誕生的先兆。誤區(qū)之一是在全球信息化革命大潮中對(duì)漢字的誤解與貶低。在最近幾年,作為人學(xué)教材的語言文字原理一書中有這樣一段結(jié)論:“漢字永 遠(yuǎn)只能作為'客人

4、9;在電腦中出現(xiàn),真正的'主人'還是拼音文字,因?yàn)槿藗儫o法直 接用漢字設(shè)計(jì)電腦程序,無法使?jié)h字成為電腦符號(hào)”。這個(gè)結(jié)論如果從一個(gè)初學(xué)電腦的 人口中說出,人們可能只會(huì)付之一笑,但這個(gè)結(jié)論是從幾十位教授級(jí)專家聯(lián)合編寫的 教材中出現(xiàn),可見中國語言文字學(xué)界高層專家對(duì)漢字的誤解和貶低有多嚴(yán)重,對(duì)漢字 信息化革命的負(fù)面彩響有多嚴(yán)重。也許可以說,計(jì)算機(jī)是先進(jìn)的電子技術(shù)和西方文明的產(chǎn)物,從它的誕生到成熟, 幾乎沒有一點(diǎn)漢字文化的因子。但是更正確地說,它是整個(gè)人類文化技術(shù)高度發(fā)展的 產(chǎn)物,它的出現(xiàn)能促進(jìn)世界上任何文化技術(shù)的發(fā)展。計(jì)算機(jī)自從具備了圖文處理的能 力以后,人們就親切地稱它為電腦。對(duì)于電

5、腦來說,儲(chǔ)存、檢索、處理、輸出,西文 字符和中文字符的原理并無本質(zhì)的區(qū)別,也無難易的區(qū)別。ii前尚未圓滿解決的,只 是中文在人機(jī)交流上有點(diǎn)小麻煩而己,說簡單一點(diǎn)就是在普及中文輸入上有一點(diǎn)小困 難而已。我們廣人編碼工作者不正在努力解決這個(gè)問題嗎?相信不久的將來,理想的 漢字編碼和中文輸入法的問世,將使中文在人機(jī)交流方面比西文更簡便、更快捷。常言道,哀莫人于心死,面對(duì)心己死的的那些專家學(xué)者們我們還能說些什么呢? 還是讓我們從正面來理解那個(gè)結(jié)論吧,它將激勵(lì)廣大的漢字編碼研究者、廣人的中文 軟件設(shè)計(jì)師發(fā)奮工作,不達(dá)目的,決不收兵,這個(gè)目的最終就是體現(xiàn)中文的優(yōu)越性。誤區(qū)之二是把漢字編碼與漢字輸入及相關(guān)軟

6、硬件及經(jīng)濟(jì)性等糾纏在一起,忽視了 漢字編碼的獨(dú)槪平價(jià)標(biāo)準(zhǔn)。劉勇泉先生在有關(guān)漢字信息處理研究的幾個(gè)問題一文中說:“我要強(qiáng)調(diào)說 明的一點(diǎn)就是,我們不能孤立地談?wù)摼幋a,我們必須從整個(gè)系統(tǒng)的角度來論證這個(gè)問 題,即考慮編碼時(shí),還必須考慮輸入是否方便,處理是否容易,存儲(chǔ)是否節(jié)約,等等 同樣,評(píng)定一個(gè)編碼方案時(shí),絕不能單單以某種編碼法'規(guī)則很少,容易掌握'為依 據(jù),也絕不能以沒有同碼字為依據(jù),必須綜合各種指標(biāo)(字碼無二義性,操作方便易 學(xué),輸入和處理效率高,存儲(chǔ)節(jié)省,傳輸可靠,設(shè)備經(jīng)濟(jì)實(shí)用等等)加以全面比較, 才能得出匸確結(jié)論”。劉先生的這段論述,看似全面,公允,仔細(xì)推敲卻使人糊涂,漢 字

7、編碼怎么能與那么多的各項(xiàng)指標(biāo)相關(guān)呢?李逸之先生在關(guān)于漢字編碼的幾點(diǎn)設(shè)想(2) 文中曾對(duì)漢字編碼有一個(gè)確切 的定義 他說:“我們現(xiàn)在使用的漢字在6000個(gè)以上,把這么多的漢字,編排成輸入 計(jì)算機(jī)的數(shù)字或字母符號(hào),就叫漢字編碼”。事實(shí)也確實(shí)如此,據(jù)說現(xiàn)在已有漢字編碼 方案數(shù)千種,這數(shù)千種方案抽象起來,都是用幾個(gè)數(shù)字或字母表示一個(gè)或幾個(gè)漢字, 對(duì)于計(jì)算機(jī)來說,幾千種漢字編碼都只是一種。這串字符含義有多豐富,只有設(shè)計(jì)若 和操作者知道,計(jì)算機(jī)是不管的。本人認(rèn)為,漢字編碼只與設(shè)計(jì)它,用它的人有關(guān), 與計(jì)算機(jī)是無關(guān)的。評(píng)價(jià)漢字編碼只有一條標(biāo)準(zhǔn):以人為本,易學(xué)難忘,其它指標(biāo)如 輸入是否方便,處理是否容易,存儲(chǔ)

8、是否節(jié)省,傳輸是否可靠,設(shè)備是否經(jīng)濟(jì)實(shí)用都 不應(yīng)該是漢字編碼設(shè)計(jì)者、評(píng)論者考慮的,也是無法考慮和解決的。一位軟件專家說 得好,只愁理想的編碼方案設(shè)計(jì)不出來,別愁設(shè)計(jì)出來后,不能在微機(jī)上實(shí)現(xiàn)它。本人建議,由漢字編碼專業(yè)委員會(huì),籌集經(jīng)費(fèi),組織力量,攻其一點(diǎn),不及余力, 這個(gè)一點(diǎn)當(dāng)然就是“以人為本,易學(xué)難忘”。具體方法是,收羅方案,博采眾長,逐級(jí) 遴選,去粗存精,精雕細(xì)刻,鑲金嵌寶,巧集大成,共成人業(yè)。誤區(qū)之三是把易學(xué)難忘與高速高效相提并論,混為一談。陳明遠(yuǎn)先生在漢字編碼研究的進(jìn)展及分析(3) 一文中談到對(duì)于中文編碼的七 個(gè)原則要求時(shí)說:“高效率是現(xiàn)代化的重要特征之一。這不僅是對(duì)字碼本身的要求,也

9、是對(duì)'人機(jī)系統(tǒng)'的要求。單純強(qiáng)調(diào)減少擊鍵次數(shù),不一定能保持高效率。如果一味 追求字碼的碼長,卻加重了操作者的記憶和動(dòng)作負(fù)擔(dān),忽視了方便性和簡易性,那么 實(shí)際速度不僅僅不能捉高,反而會(huì)降低”。本人之所以把易學(xué)難忘與高速高效相提并論作為一個(gè)重要誤區(qū)來討論,是因?yàn)檫@ 種觀點(diǎn),混淆了知識(shí)與技能兩個(gè)完全不同的概念?,F(xiàn)在有很多人把高速肓打吹得神乎 其神,似乎成了評(píng)價(jià)編碼方案的特別重要標(biāo)準(zhǔn)。本人認(rèn)為,易學(xué)難忘是對(duì)編碼的第一 要求,而高速高效是對(duì)操作手的第一要求,嚴(yán)格意義上講二者是不相關(guān)的。其實(shí),高 速高效對(duì)于職業(yè)打字員來說只是雕蟲小技,是打字員必備的職業(yè)技能而己。陳明遠(yuǎn)先生是最早把西文打字的

10、觸打法比作彈鋼琴的人之一,他說:“觸打法規(guī) 定這類似于彈鋼琴-看譜不看鍵,以提高效率?!笨梢婈愊壬彩前鸭寄苡?xùn)練作為提 高效率的重要手段的。為了說明知識(shí)和技能的區(qū)別,這里也把彈鋼琴作一比喻,一個(gè) 人懂音高,懂節(jié)奏,會(huì)識(shí)譜,懂樂理,這是知識(shí),想學(xué)彈鋼琴,這是技能,老師告訴 他7個(gè)白鍵,5個(gè)黑鍵一組,從左到右一共七組八組,他就會(huì)彈曲子了嗎?十天半月 可培養(yǎng)一個(gè)打字員,幾個(gè)月可練成一個(gè)打字高手,幾個(gè)月能練成一個(gè)鋼琴演奏家嗎? 沒有三、五年,十來年的苦練,能成為一個(gè)演奏家嗎?再別把高速肓打吹得神乎其神 了,吹口琴 吹笛子,拉手風(fēng)琴,拉二胡,彈琵琶,彈吉他,哪一樣不是“肓奏” 的卿 說白了,熟能生巧罷了,條件反射而已。一組數(shù)字或字符表示一個(gè)或幾個(gè)漢字,這組符號(hào)就是漢字編碼,這組字符序列表 示的定義和規(guī)則復(fù)雜一點(diǎn),這種漢字編碼就相對(duì)難學(xué)易忘一點(diǎn),而這種符號(hào)序列表示 的定義規(guī)則簡單一點(diǎn),這種漢字編碼就相對(duì)易學(xué)難忘一點(diǎn)。從學(xué)習(xí)掌握知識(shí)的角度來 看編碼,符號(hào)序列代表的定義規(guī)則應(yīng)該力求最簡單,而輸入高

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論