版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、轉(zhuǎn)載 地球上最偉大的事業(yè) 漢字?jǐn)?shù)字化原文地址:地球上最偉大的事業(yè)-漢字?jǐn)?shù)字化作者:漢谷輸入法各位朋友,大家好!到這里來的朋友,都是想尋覓發(fā)展事業(yè)良機的朋友,我說的對吧?為了給大家提供一個極佳的發(fā)展事業(yè)良機,下面,我就將一個地球上最偉大的事業(yè)介紹給大家。這個事業(yè)就是漢字?jǐn)?shù)字化,它的基礎(chǔ)就是漢字?jǐn)?shù)碼。漢字?jǐn)?shù)碼是個什么東西?難道只是用來查查字、打打字,像五筆字型一樣,僅僅是個輸入法而已?你們心里一定會泛起這樣或者那樣的疑問。實際上,輸入法也是很有市場的。大家知道,手機嵌入的中文輸入技術(shù)大多是美國公司提供的,我們在購買手機時至少要向美國人交納10元錢的專利費。我們中國人輸入自己的民族文字,卻要向美國人
2、交錢,損失的是不僅是每年七、八個億的市場利益,更是我們的民族尊嚴(yán)和文字主權(quán)。最近,國家信息產(chǎn)業(yè)部召集來自中國移動、中國聯(lián)通等信息產(chǎn)業(yè)界的上百位企業(yè)領(lǐng)導(dǎo)和研究機構(gòu)的專家,專題研究手機中文輸入問題,急切呼吁手機漢字輸入技術(shù)中國制造。面對巨大的市場需求和國家需要,目前,國內(nèi)許多公司紛紛投巨資研發(fā)手機中文輸入技術(shù),許多省、市政府大力支持本地企業(yè)開發(fā)嵌入式輸入技術(shù)。例如,廣東省及廣州市政府積極扶持國筆集團,建立了中華中文信息研究院,一次就注入了上百萬資金。然而,這些公司開發(fā)的嵌入式輸入技術(shù),由于沒有實質(zhì)性突破,因而很難打破國外輸入技術(shù)的壟斷地位??v觀漢字輸入法市場,從事研究的人員數(shù)以萬計,申請了專利的發(fā)
3、明數(shù)以千計,宣傳報道的方案數(shù)以百計,推向市場的產(chǎn)品數(shù)以十計,真正獲得了國家發(fā)明專利卻寥寥無幾。成千上萬的研究者都擁擠在漢字拉丁化這條寬道上,而在漢字?jǐn)?shù)字化這條窄道一直是冷冷清清,只是這幾年才開始熱鬧起來。這些來湊熱鬧的人,大多是沖著手機輸入這塊大蛋糕而來的,他們沒有想到這是漢字?jǐn)?shù)字化,更沒想到漢字?jǐn)?shù)字化將成為地球上最亮麗的風(fēng)景,亮麗得讓人不可思議,讓人懷疑那是不是夢幻?不過,這已經(jīng)不再是夢幻,而是我們中國人創(chuàng)造的又一個奇跡。創(chuàng)造這一奇跡的人就是漢字?jǐn)?shù)碼發(fā)明人鐘林先生。十年前他就開始了漢字?jǐn)?shù)字化研究工作,可以說他是我國研究漢字?jǐn)?shù)字化的第一人。當(dāng)人們還熱衷于用字母給漢字編碼時,他已經(jīng)意識到字母鍵盤
4、早晚要讓位于數(shù)字鍵盤,包括漢字在內(nèi)的世界各國文字,都需要數(shù)字編碼。到時候,以字母為基礎(chǔ)的拼音文字將不再神氣,漢字完全有可能借助于數(shù)字化而鑄就輝煌。當(dāng)人們自覺或不自覺地將漢字編碼與漢字輸入劃上等號時,他已經(jīng)意識到漢字編碼是漢字信息處理技術(shù)的核心內(nèi)容,漢字信息的采集、貯存、傳遞、加工、轉(zhuǎn)換等都離不開漢字編碼,漢字編碼在漢字信息的檢索、點播、加密、識別等方面都將發(fā)揮重要的作用。當(dāng)人們將中文信息技術(shù)研發(fā)的重點從漢字處理轉(zhuǎn)向漢語處理時,他已經(jīng)意識到漢字處理才是中文信息技術(shù)的靈魂,許多以漢語方式難以解決的信息自動化處理問題,如漢語的自動分詞、自動校對、機器翻譯、語音識別等,通過漢字方式就可以輕松地解決,當(dāng)
5、然,這些都需要借助于漢字編碼才能實現(xiàn)。當(dāng)人們將自然語言的識別與處理作為人機交互方式研究的突破口時,他已經(jīng)意識到數(shù)字語言才是人與機器交流的最簡單、最直接、最有效的方法。通過數(shù)字編碼來實現(xiàn)自然語言與數(shù)字語言的相互轉(zhuǎn)換,這樣一來,電腦操作控制問題、人機對話問題、人工智能問題,這些難題都將迎刃而解。鐘林先生花費了十多年時間,發(fā)明了漢字?jǐn)?shù)碼系列專利技術(shù),解決了中文信息處理的一系列關(guān)鍵性問題,尤其是解決了人機對話這一人類普遍關(guān)注、跨國公司傾全力解決而仍未解決的世界性難題。目前,他已經(jīng)獲得了兩項國家發(fā)明專利,成功地開辟了漢字?jǐn)?shù)字化這一嶄新的事業(yè)。下面我就從八個方面來描述一下這個事業(yè)的光明前景。第一、創(chuàng)業(yè)要有
6、戰(zhàn)略眼光俗話說:女怕嫁錯郎,男怕入錯行。選對行業(yè)對于一個人成就一番事業(yè),關(guān)系太大了!比爾蓋茨當(dāng)年創(chuàng)業(yè)時只花了100美元注冊微軟,現(xiàn)在他的身價早已是幾百億美元!當(dāng)初蓋茨在大家都在搞硬件根本看不起軟件的時候,竟然能夠發(fā)現(xiàn)軟件行業(yè)這個大市場,搶占先機,成了首富。所以,要創(chuàng)業(yè)首先要有戰(zhàn)略眼光,要善于選擇最有未來價值的行業(yè)。在確定未來的發(fā)展方向和選擇將要獻身的事業(yè)這個問題上,你必須慎之又慎。在戰(zhàn)術(shù)上你可以失敗一千次,在戰(zhàn)略上你決不能失敗一次。人生是否成功,很大程度上取決于選擇,如果你連方向都搞錯了,你向前走得越快,偏離你的目標(biāo)就越遠,就這么一個簡單的道理。古人云:不謀全局,不足以謀一域;不謀萬世,不足以
7、謀一時。民諺也說:吃不窮,穿不窮,不會謀劃一世窮。雖說我們不要畏懼失敗,但是,一個人是經(jīng)不起折騰的?,F(xiàn)在不被人看好的行業(yè),并不就是將來沒有前途的事業(yè)。如果這個事業(yè)現(xiàn)在就被很多人看好,社會上有那么多的實力機構(gòu),他們早就將這些財富瓜分完畢了,還有你我的份嗎?就像股市到了最狂熱、人人都有錢賺的時候,正是股市即將見頂回落的時候,不知又有多少后知后覺者被套住。股市機會還是允許你隨時進入,但實業(yè)機會你連準(zhǔn)入市場的資格都沒有,更不用說參與社會財富的分配了。所以,我們需要做的就是尋找未來的機會,提前布好局,先坐上轎子,讓別人來抬我們好了。這就需要有眼光,要選那些含金量很高、來抬的人很多的轎子。這就需要有毅力,
8、千萬不要坐上轎子,只是因為一時還沒有人來抬,就急急忙忙從轎子上下來,而去尋找有人抬的轎子。殊不知,凡是有人抬的轎子,上面一定是坐著人的,不可能空著位置等著你的。在移動電話還被稱作大哥大的年代,在眾人還不知網(wǎng)絡(luò)是何物的時候,漢字?jǐn)?shù)碼發(fā)明人就開始了漢字?jǐn)?shù)字化的艱苦研究。他放棄了優(yōu)越的工作,放棄了豐厚的待遇,在一無資料可循、二無資金支持,憑著對漢字文化的無限熱愛和對數(shù)字化事業(yè)的執(zhí)著追求,經(jīng)受了無數(shù)次失敗和挫折的考驗,克服了許多難以想像的困難,花費了十多年時間,終于使?jié)h字在世界上各種文字中率先實現(xiàn)了數(shù)字化,在技術(shù)上達到了世界先進水平。第二、我們的事業(yè)是漢字?jǐn)?shù)字化現(xiàn)在你知道了,我們的事業(yè)叫做漢字?jǐn)?shù)字化,
9、而漢字?jǐn)?shù)碼則是漢字?jǐn)?shù)字化的核心技術(shù)。現(xiàn)在一提到數(shù)字化,大家的感覺一定非常好,因為你會馬上聯(lián)想到互聯(lián)網(wǎng)絡(luò),聯(lián)想到數(shù)碼相機,聯(lián)想到第三代移動通信,聯(lián)想到數(shù)字電視等等,可以說,人類社會正在進入到一個數(shù)字化時代。鄧小平同志說過:科學(xué)技術(shù)是第一生產(chǎn)力?,F(xiàn)在全世界都在發(fā)展高科技。大家都知道,高科技的核心是信息技術(shù),信息技術(shù)的核心是信息的數(shù)字化。信息主要體現(xiàn)在文字、聲音、圖像三大載體上。在聲音和圖像數(shù)字化領(lǐng)域里,我們國家已經(jīng)落后了,追趕的難度很大。但在文字?jǐn)?shù)字化領(lǐng)域,我們中國人完全可以有所作為。說到這里,懂一點信息技術(shù)的人都知道,在計算機內(nèi)部文字也早就數(shù)字化了,漢字就是作為一種圖形符號來處理的。那么,我們在
10、文字?jǐn)?shù)字化領(lǐng)域還能有什么作為呢?原來,文字語言環(huán)境分為三類,第一類人與人之間溝通的人人環(huán)境,使用的是像漢語、英語這樣的自然語言;第二類是機器與機器溝通的機機環(huán)境,使用的二進制語言;第三類是人與機器溝通的人機環(huán)境,使用什么語言最好、最有效,這個問題到現(xiàn)在仍然沒有解決。人類一直有個夢想,就是讓人我們與機器之間能夠無障礙地交流,讓我們和計算機之間能夠自由地對話。盡管計算機技術(shù)一直以任何其他行業(yè)都望塵莫及的速度發(fā)展,盡管全世界的科學(xué)家們已經(jīng)做了半個多世紀(jì)的努力,但是,讓計算機能和人類自由交流這一夢想的真正實現(xiàn)依然十分遙遠,其中的根本性原因在于計算機不能理解自然語言的內(nèi)容。為什么這么說呢?要讓電腦理解我
11、們?nèi)祟惖恼Z言,電腦就必須像人腦一樣聰明。人腦是什么?人腦是世界上最復(fù)雜、最高級、最有效、儲存容量最大的超級計算機。你知不知道,人腦一生中儲存的信息總量有多少?我告訴你,與全世界所有圖書館的藏書量信息差不多。你知道人腦的神經(jīng)網(wǎng)絡(luò)容量有多大嗎?說出來你可能不會相信,與全世界的通信網(wǎng)絡(luò)容量差不多。人腦的工作效率有多高?毫不夸張地說,就像數(shù)千萬臺電腦在同時工作一樣。你要知道,一個偌大的中國,所擁有的電腦也不過數(shù)千萬臺。計算機的智能水平不要說與人腦相比,就是和動物相比也有天壤之別。一只狗在百碼之外就可以通過你的步態(tài)認(rèn)出你來,然而電腦卻甚至連你就在那兒都不知道。你生氣的時候,幾乎任何一只寵物都會察覺氣氛不
12、對,但是電腦卻一片茫然。甚至連小狗都知道自己做了錯事,而電腦還是懵懂無知。比計算機聰明千萬倍的動物尚且只會簡單語言,而要讓計算機能夠完全理解人類的自然語言,只能是個美好的夢想。美國、歐洲、日本多家著名跨國公司對自然語音識別技術(shù)進行了長達幾十年的研究,雖然投入了數(shù)百億美元的資金,到目前為止,都沒有一個成熟的產(chǎn)品投入到商業(yè)應(yīng)用領(lǐng)域。與跨國公司動輒就是幾千萬美元的研發(fā)資金投入相比,漢字?jǐn)?shù)字化是在沒有任何資金支持的條件下開始研究的。我們中國人找到了解決語音識別這一世界性難題的一個再簡單不過的方法,這就是對機器用數(shù)字說話。第三、數(shù)字化有著嚴(yán)格的界定事實上,要實現(xiàn)對機器用數(shù)字說話,并不是一件容易的事情。雖
13、然許多年前,世界上就有科學(xué)家預(yù)言,數(shù)字將是人類與機器溝通和交流的最簡單、最直接、最有效的方式,但是,在漢字?jǐn)?shù)碼發(fā)明之前,沒有人能夠?qū)⑦@一預(yù)言變?yōu)楝F(xiàn)實。這是因為,如果僅僅是用數(shù)字來表示自然語言,那是一件非常簡單的事情,人人都可以提出自己的表示方法。關(guān)鍵的問題是,一個數(shù)字只能表示一個字詞,或者說一個字詞只能對應(yīng)一個數(shù)字,如果一個數(shù)字表示了兩個或兩個以上字詞的話,電腦是無法準(zhǔn)確地認(rèn)定你的意思的。要知道,如果電腦不能百分之百地正確地理解人類意思的話,所帶來的誤操作就是不可避免的,而因誤操作所帶來的后果可能就是災(zāi)難性的?,F(xiàn)在,我可以告訴大家,數(shù)字化有著嚴(yán)格的界定。不是將信息簡單地用數(shù)字來表示就是數(shù)字化。
14、數(shù)字化是指將信息轉(zhuǎn)化為數(shù)字來復(fù)制、貯存、傳遞和處理。為了保證信息不失真和丟失,信息與數(shù)字之間必須是一一對應(yīng)的,是可以相互轉(zhuǎn)換的。例如,將聲音和圖像轉(zhuǎn)化為二進制數(shù)字貯存在光盤中,放映時再將這些數(shù)字轉(zhuǎn)化為各種物理量呈現(xiàn)給人們。數(shù)字電話、數(shù)字電視、數(shù)碼相機在機器內(nèi)部都實現(xiàn)了圖像、聲音的物理信號與數(shù)字信號的相互轉(zhuǎn)換。由于數(shù)字信號在傳遞、保存、復(fù)制過程中不易失真,從而確保了圖像、聲音的質(zhì)量。從這個意義上講,電報碼、區(qū)位碼就實現(xiàn)了漢字的數(shù)字化,還有郵政編碼、物品條形碼和其它形形色色的數(shù)字代碼,也實現(xiàn)了漢字的數(shù)字化。因為它們都是用數(shù)字編碼來表示漢字符號的,同時,每一個數(shù)字編碼所對應(yīng)的漢字符號都是唯一的。但是
15、,電報碼也好、區(qū)位碼也好,它們僅僅將幾千個常用漢字?jǐn)?shù)字化了,并沒有將全部漢字?jǐn)?shù)字化,更沒有將大量的詞語數(shù)字化。最要命的是,電報碼、區(qū)位碼是按照一定順序給漢字進行數(shù)字編碼的,漢字的數(shù)字編碼與漢字的字形、字義、字音之間沒有任何聯(lián)系。人們使用電報碼、區(qū)位碼只能通過查找和死記的方式,除了訓(xùn)練有素的專業(yè)人員外,很難得到普及和推廣。要讓漢字?jǐn)?shù)碼成為每個人都能夠掌握的數(shù)字化工具,不僅要求漢字?jǐn)?shù)碼做到一個數(shù)字只能表示一個漢字或者詞語,用專業(yè)術(shù)語來講,就是無重碼,而且這種表示的方法必須完全規(guī)則的,表示的結(jié)果必須簡潔明了。第四、數(shù)字化帶來意想不到的效果在使用了幾十個字母、數(shù)字和其它符號以及制定出一系列編碼規(guī)則的條
16、件下都還玩不轉(zhuǎn)的漢字編碼,要用幾個數(shù)字來實現(xiàn),而且還要不重碼,規(guī)則要簡單得人人都能輕松地掌握,這簡直比登天還要困難。也許是太難了,沒有人敢往這個方面想,更沒有人認(rèn)為能夠?qū)崿F(xiàn)它。雖說現(xiàn)在的漢字?jǐn)?shù)字編碼方案如雨后春筍一樣層出不窮,但它們設(shè)計者的初衷無不是僅僅為了解決在手機數(shù)字鍵盤上的漢字輸入問題,以至于一提起漢字編碼,人們自然就認(rèn)為是漢字輸入法,沒有人意識到漢字編碼在漢字信息處理方面還有許許多多非常重要的應(yīng)用領(lǐng)域,更沒有人會想到,漢字編碼原來是我國實現(xiàn)信息化和數(shù)字化的最核心技術(shù)。關(guān)鍵問題是漢字編碼必須具有唯一性、規(guī)律性和簡潔性,否則就只能應(yīng)用于查字和打字,派不上其他用場,更不用說成為信息核心技術(shù)了
17、?,F(xiàn)在我們就來看看,將漢字表示成具有唯一性、規(guī)律性和簡潔性的數(shù)碼后,究竟會發(fā)生什么樣的變化?漢字有上千個音節(jié),同音字、同音詞比比皆是,電腦識別起來非常困難。如果我們能夠?qū)⒊汕先f個漢字和詞語用十個數(shù)字唯一地表示出來,那么,人類只要通過十個數(shù)字符號,就能夠?qū)⑸先f個漢字承載的信息準(zhǔn)確無誤地傳達給機器;機器只要識別出十個數(shù)字聲音,就能夠完全明白上千個音節(jié)都難以表達清楚的人類意思。人類告訴機器的是一串?dāng)?shù)字,機器回答人類的是自然語言。通過這種交互方式,數(shù)字在人類與機器之間架起了一座溝通的橋梁。如果這個設(shè)想得以實現(xiàn),就足以震撼信息世界里以英文為主的一統(tǒng)天下,就足以引發(fā)信息技術(shù)領(lǐng)域里的一場革命。在這里,我可
18、以十分自豪地告訴大家,這個設(shè)想已經(jīng)實現(xiàn)了。漢字?jǐn)?shù)碼將數(shù)以萬計的漢字表示成數(shù)字,還要將數(shù)以十萬計的詞語和句子統(tǒng)統(tǒng)地表示成數(shù)字,并且沒有一個重碼,平均兩個數(shù)字就表示出一個漢字。你相信這是真的嗎?當(dāng)我們嘗試著將這個消息發(fā)布在網(wǎng)上時,沒有一個網(wǎng)友相信這是真的,他們都不約而同地說我們燒糊涂了。這不是在做夢,也不是在吹牛,這是一個客觀存在的事實,在座的每一個人都可以見證這個事實。這個許多人都不敢相信的事實,我們只能稱之為奇跡了。說實話,最初連發(fā)明人本人也沒預(yù)料到會出現(xiàn)如此理想的結(jié)果。一次,我跟一個數(shù)學(xué)博士談到這件事,他連聲說,很難想象,簡直不可思議。是啊,漢字?jǐn)?shù)碼只用了九個數(shù)字。你想想看,一位數(shù)字只能表示
19、出九個字詞,兩位數(shù)只能表示出八十一個字詞,不用說編碼要有規(guī)則了,就是挨著編碼,而且不留任何空隙,即使是四位數(shù)頂多也只能表示出六千多個漢字,連新華字典上的漢字都表示不完!第五、數(shù)字化超越微軟視窗操作系統(tǒng)提起美國微軟公司,人們自然就會想到它是世界軟件業(yè)的巨無霸,其富可敵國的強大實力,無人可以與之抗衡。一談到中國的軟件企業(yè),最有趣的話題無非是哪家軟件企業(yè)可能成為中國的微軟,哪個軟件精英可能成為中國的蓋茨,很少有人敢說要超越微軟,即使宣稱挑戰(zhàn)微軟,也只是說說而已,因為我們沒有那個技術(shù)實力可以與微軟相抗衡,更不用說微軟十分超強的商業(yè)能力了。今天,在中國的西部,居然有人宣稱要挑戰(zhàn)微軟視窗,這已不是說說而已
20、,而且是像模像樣的,還拿得出核心技術(shù)作為殺手锏,實在是膽大包天,或者說是不知天高地厚。不過,引人關(guān)注的是,這個來自四川的大熊貓能夠與來自美國的恐龍過招嗎?當(dāng)然,建立在漢字?jǐn)?shù)碼基礎(chǔ)之上的數(shù)字化操作方式才剛剛誕生,還是個襁褓中的嬰兒,憑目前的實力,顯然無法與微軟視窗操作系統(tǒng)過招。正如像微軟視窗操作系統(tǒng)最初因為太糟糕了而被業(yè)界嘲諷一樣,數(shù)字化操作系統(tǒng)從成長壯大到被人們所接受,也是需要經(jīng)受住時間考驗的。但是,新生事物具有強大的生命力,這是任何力量都扼殺不了的。有人會說,數(shù)字化操作方式最多只是個可實施的方案,連個像樣的演示模型都沒有,怎么能夠與龐大的視窗操作系統(tǒng)相提并論呢?從表面上看,微軟視窗系統(tǒng)龐大而
21、且功能強大。但是,只要我們深入到微軟視窗系統(tǒng)的技術(shù)核心,你就會發(fā)現(xiàn),微軟視窗操作系統(tǒng)的原理其實是很簡單。它的圖標(biāo)無非就是一個個浮動的控制按鈕,只不過我們不是用手、而是用鼠標(biāo)來按下這些控制按鈕。它將若干個圖標(biāo)放在一個控制面板上,與將若干個控制按鈕做在機器的一個控制板上,并沒有實質(zhì)上的區(qū)別。要說有區(qū)別的話,就是機器的控制板上只容納得下少數(shù)幾個控制按鈕,而微軟的視窗可以容納得下很多控制面板,每個控制面板又能夠容納得下更多控制按鈕。這樣,裝有視窗系統(tǒng)的電腦就能做許多許多的事情,成了萬能的機器,視窗系統(tǒng)也就成了無所不包的大雜燴。經(jīng)過多年的不斷改進和完善,微軟視窗使電腦屏幕上顯示的內(nèi)容漂亮多了,窗口、菜單
22、、工具條等都有了美麗的外觀。這種圖形用戶界面向人們提供了一個良好的視覺空間環(huán)境,不僅減輕了操作者的記憶負(fù)擔(dān),而且允許操作者一次開幾個窗口、同時做幾件事情。計算機終于發(fā)展成為一種工作場所,從此微軟視窗操作系統(tǒng)風(fēng)靡了全球。然而,任何事物都不是十全十美的,微軟視窗也不例外。只要我們冷靜地分析一下,就會發(fā)現(xiàn)微軟視窗存在著許多軟肋,我們且不去說這個龐大系統(tǒng)帶給人們等待、死機、病毒等等麻煩,至少在以下兩個方面,微軟視窗存在著致命弱點:首先,由于是圖形界面,它離不開用于顯示圖形的顯示器,離不開用于操作圖形的鼠標(biāo)鍵盤,因此,當(dāng)它被移植到其它數(shù)字化產(chǎn)品時,就會遇到巨大的障礙。就連手機這樣有屏幕的數(shù)字化產(chǎn)品,那塊
23、小小的屏幕已經(jīng)難以容納下微軟的圖形界面,更不用說大量的數(shù)字化產(chǎn)品根本就沒有屏幕,沒有鍵盤,更沒有鼠標(biāo)。其次,圖形界面難以做到完全聲控。雖然微軟視窗也設(shè)置了語音控制功能,但是,由于自然語音識別技術(shù)的不成熟,它的語音控制功能只能是個附屬品,甚至是個擺設(shè),并不能真正地實現(xiàn)語音控制這種人類最習(xí)慣、最自由、最直接的交互方式,人們還必須借助手、而不是用口來進行交流。在這個界面上實現(xiàn)君子動手不動口,仍然是個美麗的夢想。第六、席卷全球的又一次狂潮比爾蓋茨曾經(jīng)說過:工業(yè)界應(yīng)對語音識別技術(shù)領(lǐng)域的重大突破作好充分準(zhǔn)備,那將是席卷全球的又一次狂潮。我非常高興地告訴大家,蓋茨預(yù)言的這次狂潮即將來臨,而且這次狂潮將首先出
24、現(xiàn)在中華大地上,中國將成為數(shù)字化革命新的策源地。如果你已經(jīng)學(xué)會了漢字?jǐn)?shù)碼,我可以告訴你一個規(guī)則,你也不妨利用這個規(guī)則作個實驗,將微軟視窗操作系統(tǒng)的漢化命令統(tǒng)統(tǒng)只用四個數(shù)字來表示,看看編碼效果怎么樣。你還可以對各種家用電器、辦公設(shè)備的操作控制命令用四個數(shù)字來表示,再看看編碼效果怎么樣。我相信,你會驚訝地發(fā)現(xiàn),很少有重碼出現(xiàn),即使偶爾有重碼出現(xiàn),由于漢語詞匯無比的豐富,你可以選擇另一個同義詞匯來代替,這樣就能讓這些數(shù)字組成的命令都是唯一的。你知道你這個小小的舉動所具有的劃時代意義嗎?你是在展現(xiàn)一個歷史上從未有過的、令人類耳目一新的人機交互界面。這是一種更加自然、簡單、方便的人機交互界面,我們稱之為
25、數(shù)字語音界面。漢字?jǐn)?shù)碼將漢語漢字轉(zhuǎn)化為機器能夠完全識別的數(shù)字語音,再將這些數(shù)字語音按照一定規(guī)則組合成機器能夠完全理解的數(shù)字語音命令。讓每個中國人都學(xué)會用普通話念準(zhǔn)十個數(shù)字,或者讓電腦去適應(yīng)各地方言對十個數(shù)字的念法,都不是什么困難的事情。由于漢語的發(fā)音響亮清晰,十個數(shù)字的聲音差別又很大,所以即使在有噪聲的環(huán)境中,電腦也能很容易地準(zhǔn)確識別它們。普通話有四百多個音節(jié),每個音節(jié)又有四種聲調(diào)之分,電腦識別起來非常困難。為了提高識別正確率,人們必須拿著麥克風(fēng)講話,或者把臉貼近電腦講話。漢語語音識別沒能讓人們的雙手空出來做別的事情,也沒能讓人們在一臂遠的距離之外使用電腦。人們本來對人機對話抱有極大的興趣和熱
26、情,但是,目前這種非自然、非談話的狀態(tài)以及語音識別的頻繁出錯,往往讓任何一個使用者喪失信心。只是在數(shù)字語音技術(shù)廣泛應(yīng)用之后,你在使用電腦時才不必正襟危坐、不必全神貫注。你可以在走來走去的過程中使用電腦,即使你轉(zhuǎn)過身去背對著電腦做些別的事情,或者走到看不見電腦的地方,只要你說的數(shù)字語言還能夠傳到電腦的耳朵里,你照樣可以對電腦發(fā)號施令。第七、信息處理一攬子解決方案毫不夸張地說,數(shù)字語音技術(shù)是繼計算機技術(shù)、網(wǎng)絡(luò)技術(shù)之后又一項可以改變?nèi)祟惿罘绞降闹卮笮畔⒓夹g(shù),數(shù)字交互技術(shù)可以應(yīng)用于任何需要人機交互的產(chǎn)品和服務(wù)領(lǐng)域。你認(rèn)真地想一想,利用漢字?jǐn)?shù)碼方法將漢字信息轉(zhuǎn)化數(shù)字信息后,還會發(fā)生什么意想不到的效果?
27、首先,我們使用漢字?jǐn)?shù)碼將漢字文件轉(zhuǎn)化為數(shù)碼文件,這個轉(zhuǎn)換結(jié)果是唯一的,所以數(shù)碼文件就是漢字文件的另一種形式。由于數(shù)碼文件的信息形態(tài)本身是數(shù)字化的,用不著轉(zhuǎn)化為漢字內(nèi)碼。而在此之前,由于計算機不能直接處理漢字文件,必須在計算機內(nèi)部通過編碼將這些漢字轉(zhuǎn)化為數(shù)字,這些數(shù)字編碼就是漢字內(nèi)碼。這樣一來,漢字?jǐn)?shù)碼就可以代替漢字內(nèi)碼進行漢字信息的傳輸、存儲等處理了。你可能要問,用漢字?jǐn)?shù)碼代替漢字內(nèi)碼有什么好處呢?我認(rèn)為,至少有以下五大好處:一是統(tǒng)一了全球的漢字編碼?,F(xiàn)在全球的漢字內(nèi)碼并沒有統(tǒng)一,中國大陸是一套,中國臺灣是另一套,其它華人地區(qū)還有十幾套。因此,我們從網(wǎng)上看到的臺灣地區(qū)的網(wǎng)頁都是些亂七八糟的符號
28、,當(dāng)然,臺灣人民看到我們的網(wǎng)頁也是這個樣子。如果在全球華人中間普及了漢字?jǐn)?shù)碼,在不改變現(xiàn)有漢字內(nèi)碼的格局下,漢字編碼的統(tǒng)一問題也就得到解決了。二是消除了網(wǎng)上的漢字亂碼問題?;叵胍幌履闵暇W(wǎng)的情形,是不是經(jīng)常會出現(xiàn)這樣的情況,即使訪問國內(nèi)網(wǎng)站,明明是打開了網(wǎng)頁,網(wǎng)頁上也是一片空白,或者就是些堆亂七八糟、莫名其妙的符號,當(dāng)你在閱讀朋友的電子郵件時也會出現(xiàn)這種情況。這就是由于漢字亂碼造成的。為什么會出現(xiàn)漢字亂碼呢?這是因為漢字內(nèi)碼與字母內(nèi)碼互不相容。字母內(nèi)碼是單字節(jié)的,而漢字內(nèi)碼則是雙字節(jié)的。由于計算機不能有效地處理漢字和其它文字的混合轉(zhuǎn)換問題,因而經(jīng)常出現(xiàn)亂碼或者白版現(xiàn)象。而采用漢字?jǐn)?shù)碼代替漢字內(nèi)碼
29、后,亂碼現(xiàn)象將完全消失。這是由于數(shù)字與字母都是單字節(jié)的,它們之間不存在互不相容的問題。三是提高了漢字信息的傳遞速度,增加漢字信息的存儲容量。我們都知道,在計算機內(nèi)部,一個字節(jié)可以表示出一個數(shù)字或者一個字母,四個字節(jié)才能表示一個漢字,而漢字?jǐn)?shù)碼平均兩個數(shù)字就可以表示出一個漢字,這就是說,只需要兩個字節(jié)就可以表示出一個漢字,從這個角度來看,同樣內(nèi)容的漢字信息,漢字?jǐn)?shù)碼所占的存儲空間只有漢字內(nèi)碼的一半。這是什么意思呢?就是說,原來需要存儲在兩張光盤上的漢字信息,現(xiàn)在只需要一張光盤就夠了,或者說,原來傳遞一個小時的漢字信息,現(xiàn)在只需要半個小時了。最重要的是,漢字信息處理效率也將因此提高一倍!四是實現(xiàn)了
30、對漢字信息的加密。由于數(shù)碼文件是一堆數(shù)字,我們就可以對這堆數(shù)字實施數(shù)學(xué)運算,使其變成一堆破譯難度巨大的亂數(shù),這些亂數(shù)既可以存貯在計算機硬盤和光盤中,也可以通過網(wǎng)絡(luò)公開傳遞,在防火墻、加密狗等信息隔離措施失效的情況下,仍然能夠保證國家機密、軍事秘密、商業(yè)秘密和個人隱私的安全。當(dāng)然,漢字內(nèi)碼也可以做到這一點。但是,由于漢字內(nèi)碼存在亂碼現(xiàn)象,對漢字內(nèi)碼實施數(shù)學(xué)運算并不能保證漢字信息存儲和傳遞的安全性,反而會增加安全隱患。同時,由于人們掌握不了漢字內(nèi)碼,就不能使用漢字內(nèi)碼進行人工加密,不能隨時改變加密方法,而只能借助于計算機軟件的加密功能,要知道,計算機軟件的加密功能是比較容易被破譯的。五是解決了漢語
31、分詞的難題。在座各位都學(xué)過英語,一定知道英語的書寫方式與漢語是不同的。在書寫過程中,英語的詞語之間是空格分開的,而漢語的詞語之間就沒有這個空格。我們在閱讀漢語時,憑所積累的知識和經(jīng)驗,就能夠輕松地將這些詞語分開,來理解這些詞語組合成句子所表達的意思。但是,計算機沒有這些知識和經(jīng)驗,它無法將這些漢字準(zhǔn)確無誤地分割成一個個詞語。這樣一來,計算機在處理漢語信息時就遇到了巨大的困難。比如機器翻譯,如果連詞語都分不對,翻譯出來的東西是個什么樣子的,就可想而知了。再比如,上網(wǎng)查資料時,在輸入查詢的內(nèi)容后,經(jīng)常會出現(xiàn)大量我們并不需要的內(nèi)容,令我們哭笑不得。一個小小的分詞問題,不知難倒了多少專家權(quán)威,更是阻礙
32、了我國漢語信息處理的技術(shù)進步。在外國文字都用詞語來處理信息的時代,唯獨我國文字還基本停留在字處理階段,其間的差距是顯而易見的。漢字?jǐn)?shù)碼非常巧妙地解決了這個問題。我們在使用漢字?jǐn)?shù)碼輸入漢字時,每輸完一個詞語,就需要按一下數(shù)字0鍵。這個數(shù)字0是什么?這個數(shù)字就是漢語詞語之間的分隔符號,相當(dāng)于英語詞語之間的空格。毫無疑問,使用數(shù)字來表示詞語之間的界限,較之使用空格來說,在技術(shù)上又是個很大的進步。你想到過嗎?龐然大物般的漢字竟有如此魔力,它搖身一變,居然變成了輕飄飄的十個數(shù)字。計算機處理起這十個數(shù)字來得心應(yīng)手,比起處理幾十個字母來速度快多了。誰也想不到,曾經(jīng)是效率最低的中文信息處理,一下子就變成了效率
33、最高的了,漢字也從丑小鴨一下子就變成了白天鵝。如果你感興趣的話,不妨也對漢字?jǐn)?shù)碼作些變換,說不定又能夠解決哪個中文信息處理的重大問題或者疑難問題,從而為我國的信息化建設(shè)作出貢獻。第八、這是具有世界水平的核心技術(shù)當(dāng)代高新科技的核心是信息技術(shù),信息技術(shù)的核心是數(shù)字化,在各類信息的數(shù)字化之中,文字?jǐn)?shù)字化起著統(tǒng)領(lǐng)作用,而漢字是世界上最多人口使用的文字,所以,漢字?jǐn)?shù)字化就成了核心之核心。漢字?jǐn)?shù)字化的實質(zhì)是解決人與機器之間的數(shù)字化溝通問題,從而實現(xiàn)信息傳遞最后一米的數(shù)字化連接,這一連接具有劃時代的意義。我們掌握的漢字?jǐn)?shù)字化技術(shù),在國內(nèi)是獨一無二的,在國際上是遙遙領(lǐng)先的。雖說科學(xué)的發(fā)展是永無止境的,就像人類
34、的體育競技一樣,總能在一次次的體育競爭中,不斷地突破原有的成績,把紀(jì)錄一點一點地提高到新的水平。從某個階段來看,這種看法應(yīng)該是沒錯的,但從理論上研究,我們就會認(rèn)識到,這種提高終歸會有停止的一天,總有達到人類極限的一天,人類所不知道的,只是最高紀(jì)錄將由誰在哪一天來創(chuàng)造。同樣道理,漢字編碼雖然有不斷改進和變革的可能性,但是,如果思路對頭、方法對路,就有可能找到一種實現(xiàn)了規(guī)則的致簡性和性能的卓越性趨近于極限的方案?,F(xiàn)在,真相已大白于天下,這樣的方案看來非漢字?jǐn)?shù)碼莫屬。這么講是有根據(jù)的。漢字?jǐn)?shù)碼已經(jīng)將兩畫筆形簡化為一畫筆形,又將一畫筆形簡化為橫、豎、撇、捺這四個漢字基因,你說還能夠簡化成什么?簡化成直
35、筆和斜筆嗎?不用說這么做既不符合國家的文字規(guī)范,也不符合人們的認(rèn)知習(xí)慣,而且只有一畫和兩畫的直筆和斜筆這四個筆形,只能采用四個數(shù)字,比漢字五種筆畫都不如,又怎能最簡約地將漢字和詞語都唯一地表示出來呢?更重要的是,漢字?jǐn)?shù)碼的編碼理據(jù)是中國的易經(jīng),那么,這種編碼的理據(jù)是什么呢?有一種觀點曾經(jīng)非常流行,說漢字不如英文,要求廢除漢字,要中文改變?yōu)槠匆粑淖?。因為英文只有二十六個字母,而中文則有成千上萬個漢字。在電腦上處理文字時,英文根本不需要編碼,英文是由哪幾個字母組成的,就敲哪幾個字母鍵。只要會英文字母,就會電腦操作。因此,很少有美國人是不會電腦的,難怪在美國的網(wǎng)民中,老年人就占了一半左右。而在中國的網(wǎng)民中,老年人還占不到百分之五。為什么存在著這么大的差距呢?原來,許多中國的老年人不是不愿意上網(wǎng),也不是沒有錢買電腦,而是被漢字輸入這只攔路虎給擋在了網(wǎng)絡(luò)大門之外。好像上帝特別親睞中國人似的,就在我們?yōu)榱诉m應(yīng)電腦的字母鍵盤,而不得不強迫自己去練習(xí)指法的時候,就在我們?yōu)榱四茉谧帜告I盤上打字,而不得不強迫自己去死記字根的時候,手機出現(xiàn)了,機頂盒出現(xiàn)了,還有數(shù)不清的數(shù)字化產(chǎn)品如電子筆記本、電話機、掌上電腦產(chǎn)品等。在這些場合,你不可能將26個字母的標(biāo)準(zhǔn)鍵
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 踩高蹺幼兒園教案
- 保護牙齒教案反思小班
- 漢真有趣說課稿
- 航空航天履約管理辦法
- 塑料大棚建設(shè)安裝協(xié)議
- 臨時醫(yī)療電源租賃合同
- 電信業(yè)不合格服務(wù)管理
- 航空航天設(shè)施保溫施工協(xié)議
- 脊椎病診斷與治療
- 研發(fā)項目保密規(guī)則
- 三年級上冊數(shù)學(xué)除法豎式計算300道帶答案
- 供應(yīng)室停水停電應(yīng)急預(yù)案
- JGJ72-2004 高層建筑巖土工程勘察規(guī)程
- 冷庫采購安裝項目招標(biāo)文件
- 人品態(tài)度和能力
- 食堂副食品配送服務(wù)物資裝備計劃
- 銅礦的熱法冶煉與電法冶煉
- 股東合作協(xié)議(經(jīng)典版本)
- 社區(qū)警務(wù)工作培訓(xùn)
- 人大代表履職工作總結(jié)
- 招聘專員轉(zhuǎn)正工作總結(jié)
評論
0/150
提交評論