![計算機畢業(yè)論文-機器翻譯中漢語動結(jié)式生成的過程和困難_第1頁](http://file4.renrendoc.com/view4/M01/0C/04/wKhkGGal84GAL3lBAAI11FIEsxY079.jpg)
![計算機畢業(yè)論文-機器翻譯中漢語動結(jié)式生成的過程和困難_第2頁](http://file4.renrendoc.com/view4/M01/0C/04/wKhkGGal84GAL3lBAAI11FIEsxY0792.jpg)
![計算機畢業(yè)論文-機器翻譯中漢語動結(jié)式生成的過程和困難_第3頁](http://file4.renrendoc.com/view4/M01/0C/04/wKhkGGal84GAL3lBAAI11FIEsxY0793.jpg)
![計算機畢業(yè)論文-機器翻譯中漢語動結(jié)式生成的過程和困難_第4頁](http://file4.renrendoc.com/view4/M01/0C/04/wKhkGGal84GAL3lBAAI11FIEsxY0794.jpg)
![計算機畢業(yè)論文-機器翻譯中漢語動結(jié)式生成的過程和困難_第5頁](http://file4.renrendoc.com/view4/M01/0C/04/wKhkGGal84GAL3lBAAI11FIEsxY0795.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第第頁計算機畢業(yè)論文-機器翻譯中漢語動結(jié)式生成的過程和困難計算機畢業(yè)論文
1.引言
當電子計算機1946年問世的時候,人們就提出了機器翻譯的想法,并且在1954年進行了第一次機器翻譯試驗。然而與后來的各種語言信息處理研究和應(yīng)用(語言信息檢索、文本自動分類、自動文摘、信息提取等等)相比,機器翻譯卻是進展最慢的。學者們傾其大半生精力、商家投入為數(shù)可觀的資金,經(jīng)歷五十多年不懈的研究和開發(fā),得到的成果或者產(chǎn)品卻常常不能令人滿意。
原因是什么呢?從語言研究的角度來說,機器翻譯系統(tǒng)分析、理解和生成自然語言的能力都還不到位,處理不了的語言現(xiàn)象很多:有的是句子結(jié)構(gòu)層次弄錯了,有的是結(jié)構(gòu)關(guān)系弄錯了,有的是成分之間的語義關(guān)系弄錯了,有的是詞義辨識錯了,還有的錯誤是源語和目標語之間的對比差異造成的。下面是機器翻譯處理漢語動結(jié)式不成功的幾個例子(來自三個機器翻譯系統(tǒng))。
先看生成的情況,機器翻譯目前還很難生成漢語的動結(jié)式,所以我們很少在漢語譯文里見到含有動結(jié)式的句子。對于下面這個英譯漢的例子,三個系統(tǒng)都不能翻譯成“他把地掃干凈了”:
Hesweptthefloorclean.
*他干凈地掃地了。
*他清掃清潔的地板。
*他清掃地板干凈。
再看漢語動結(jié)式翻譯成英語的例子,它們可以說明目前機器翻譯系統(tǒng)分析和理解漢語動結(jié)式的能力:
他踢壞了三雙鞋。*Heplaysthreepairsofevilshoes.
*Hekickedthreepairsofshoesbad.
*Himkickspoil3pairsofshoes.
這段路把媽媽走累了。*Thewaymakemothertiredafterthewalk.
*Thissectionofwaywaswalkedmothertired(ly).
*Thisroadmotherwalktired.
大家吃膩了剩菜。*Everybodyhasfeddedupwiththeleftovers.
*Thateverybodyategreasy(ly)surplusvegetable.
*Alleat,isloathetoleavevegetable.
下面我們只討論動結(jié)式的生成問題,其中不包括以下三種情況:1)補語用“得”字連接的;2)補語虛化的,如:“抓住”、“買著”、“看完”、“辦成”等;3)補語和動結(jié)式的賓語有固定搭配關(guān)系的,如:“說走了板”、“看愣了神”、“苦出了頭”等等。
2.機器翻譯中的動結(jié)式問題
為了說明機器翻譯如何處理動結(jié)式述語結(jié)構(gòu),我們需要先看看機器翻譯的過程。下圖說明了機器翻譯的原理,也是機器翻譯的整個過程。
附圖
圖1機器翻譯的過程
顯然,這是一個理想化的機器翻譯過程。從S到I再到T的過程是中介語言的翻譯策略,中介語言通常是某種獨立于源語和目標語的邏輯表達式。如果是英譯漢,對英語的分析和理解要從表層深入到底層,得到描述句子意義的中介語言邏輯表達式。同樣地,漢語也要從底層到表層一步一步生成。分析時從表層到底層走得越深,生成時從底層回到表層的過程也就越復(fù)雜。因此,需要分別對這兩種語言的句法和語義系統(tǒng)作深入的研究。實際上目前大部分機器翻譯系統(tǒng)都作不到這個程度,常見的翻譯策略是直接法或轉(zhuǎn)換法,或直接和轉(zhuǎn)換相結(jié)合的混合方法。我們可以通過一個英譯漢的例子對直接法、轉(zhuǎn)換法和中介語言法這三種翻譯策略作一個比較:
Yougetgoodreceptiononyourradio.(摘自某產(chǎn)品說明書)
譯句1你得到好的接收在你的收音機上。
譯句2你用你的收音機得到好的接收。
譯句3你的收音機接收情況良好。
在機器翻譯系統(tǒng)中,用直接法可以得到譯句1;用基于句法的轉(zhuǎn)換法,再加上一些語義關(guān)系的分析,能得到譯句2;譯句3是基于理解的,用中介語言法有可能作到。顯然,前一節(jié)關(guān)于動結(jié)式英譯漢和漢譯英的例子,都不是基于理解的翻譯。
動結(jié)式的結(jié)構(gòu)形式簡潔,語義關(guān)系復(fù)雜,在漢語里是很有特點的一種結(jié)構(gòu)。呂叔湘先生(1986)曾用它說明漢語句法的靈活性。人們在從各種角度論述動結(jié)式述補結(jié)構(gòu)的時候,常常會提到它在對外漢語教學當中是個難點。同樣,在機器翻譯中它也是個難題。在漢語翻譯成外語的系統(tǒng)里,難的是如何分析和理解動結(jié)式述補結(jié)構(gòu)。在外語翻譯成漢語的系統(tǒng)里,難的是如何生成含有動結(jié)式的句子。
我們在這里只討論生成的情況。在這種情況下,源語(例如英語)往往沒有相當于漢語動結(jié)式的結(jié)構(gòu)形式,也很難用轉(zhuǎn)換規(guī)則把英語的某些結(jié)構(gòu)形式與漢語動結(jié)式聯(lián)系起來。所以除非用個別處理的辦法,采用直接法和轉(zhuǎn)換法翻譯策略的系統(tǒng)很難生成漢語的動結(jié)式譯文。要讓系統(tǒng)有生成動結(jié)式的能力,就要按中介語言法的思路,增加分析的深度,理解源語句子要表達的意思(各個成分的概念意義、成分之間的關(guān)系意義,句子的句式意義,等等),然后根據(jù)意義表達的需要,選擇動結(jié)式的一種結(jié)構(gòu)形式,再生成表層的句子。目前我們對漢語的研究還不足以支持這樣的生成過程。所以在現(xiàn)有的機器翻譯系統(tǒng)輸出的漢語譯文當中,很難找到地道的含有動結(jié)式述補結(jié)構(gòu)的句子。于是就有了下面的譯文:
Hehasmadethequestioncomplicated.他已使問題復(fù)雜化。(他把問題搞復(fù)雜了。)
Thechildrenhavehadenoughtoeat.孩子們已吃了足夠。(孩子們吃飽了。)
這樣的譯文對機器翻譯來說就算不錯了,只是念起來有些別扭,有點“機器味兒”。
3.動結(jié)式的生成過程
機器翻譯譯文生成的任務(wù)是從要表達的意義出發(fā),經(jīng)過選擇詞語、確定詞語間的語義關(guān)系、確定目標語句子的句法結(jié)構(gòu)等步驟,最終輸出與源語言句子在意義上等價的表層字符串。對于動結(jié)式的生成,有以下幾步:
(一)確定要表達的意思(四)整合語義結(jié)構(gòu)
(二)選擇詞語、分派語義角色(五)選擇句法表現(xiàn)形式
(三)判斷合法性(六)處理表層詞語
3.1制定要表達的意思
漢語動結(jié)式述語結(jié)構(gòu)表達的是一種“動作—結(jié)果”事件。比如要生成的意思是:小王讀了這篇文章,結(jié)果小王懂了這篇文章。在漢語生成開始之前,機器翻譯系統(tǒng)用中介語言邏輯表達式表示要生成的譯文是什么意思。一般來說,如果這個表達式里面有兩個謂詞結(jié)構(gòu),并且二者之間有“動作—結(jié)果”關(guān)系,就可以進入漢語動結(jié)式的生成過程。
中介語言邏輯表達式是從源語(譬如英語)分析得到的,源語中的述謂結(jié)構(gòu)和“動作—結(jié)果”關(guān)系會在表達式中有所體現(xiàn)。但這并不是判斷能否生成漢語動結(jié)式的惟一依據(jù)。我們在上一節(jié)提到,英語往往沒有相當于漢語動結(jié)式的結(jié)構(gòu)形式,也很難用轉(zhuǎn)換規(guī)則把英語的某些結(jié)構(gòu)形式與漢語動結(jié)式聯(lián)系起來,這是就句法結(jié)構(gòu)來說的。實際上,由于英、漢語之間在“動作—結(jié)果”關(guān)系表達上的差異,(注:戴浩一(2002)指出:“動作—結(jié)果”基模雖然在漢、英語中都存在,但是在漢語中占主導地位,而在英語中占次要甚至邊緣地位。而且,這個基模在兩個語言對客觀情況的構(gòu)建上也因經(jīng)驗的概念化不同而呈現(xiàn)不同的形式。)在從源語分析得來的語義表達式里,可以用漢語動結(jié)式生成的“動作—結(jié)果”關(guān)系有時是隱含的,與此相關(guān)的述謂關(guān)系也有不同的表現(xiàn)形式。比如:
英語對動作對象的描寫在漢語中有時可以表達成動作的結(jié)果:
Shemarriedthewrongperson.她嫁錯了人。
Heenteredthewrongdoor.他進錯了門。
漢語中動詞的結(jié)果補語在英語中有時是說明動作的狀態(tài)和程度的成分:
電視看久了。towatchTVforaverylongtime.
我英語學晚了。ItwasverylatewhenIstartedtolearnEnglish.
還有,致使“動作—結(jié)果”事件發(fā)生的某些因素在漢語里常常可以充當動結(jié)式的一個論元角色,(注:袁毓林(2001)稱其為外來的致事。)而在英語里它們往往充當其他成分:
那場可怕的暴風雪凍死了不少人。Manypeoplefrozetodeathintheterriblesnowstorm.
沙發(fā)把你坐懶了。Youarebecominglazyonthesofa.
所以我們需要一組規(guī)則,在要生成的語義表達式里判斷有沒有應(yīng)該用漢語動結(jié)式表達的述謂關(guān)系。在這組規(guī)則里,除了兩個謂詞結(jié)構(gòu)及其顯性的“動作—結(jié)果”關(guān)系符合判斷條件以外,還應(yīng)該有能夠識別和提取隱含的“動作—結(jié)果”關(guān)系及其述謂結(jié)構(gòu)的條件。這就需要研究英語和漢語在表達“動作—結(jié)果”關(guān)系時的差異。這種差異有時在某種類別下表現(xiàn)出來,有時又很個性化,只跟具體詞語有關(guān)。目前機器翻譯系統(tǒng)還沒有找到這樣的規(guī)則。所以我們就暫時只能看到“她嫁給了錯誤的人”和“他進了錯誤的門”這樣的譯文。
3.2選擇詞語
選擇詞語需要有一部用于信息處理的漢語詞典,告訴我們詞語
和它們的意義,以及它們的用法(比如,謂詞的配價結(jié)構(gòu)及其論元的限制條件)。對于前面的例子,需要先在詞典里選出“小王”、“讀”、“懂”、“文章”這些詞,然后根據(jù)詞語的意義和邏輯關(guān)系為它們分派語義角色。這些詞在中介語言邏輯表達式里是實體和謂詞?!傲恕薄ⅰ敖Y(jié)果”、“這”等是算子或關(guān)系,把它們轉(zhuǎn)成詞匯形式還需要另外的分析和處理。詞語選擇和語義角色分派的結(jié)果可以表示成樹形圖或特征集合等形式。
附圖
圖2詞語選擇和角色分派的結(jié)果
Agen表示施事,Pred表示謂詞,Pati表示受事,Cont表示內(nèi)容,Expe表示經(jīng)驗者(當事)。
即使有一部詳盡的詞典,要讓機器根據(jù)意義選擇詞語也不是一件容易的事情。我們經(jīng)常需要在幾個同義詞或近義詞當中進行取舍。比如,漢語的“看”有read的意思,用它來表達我們要生成的意思比“讀”更地道。根據(jù)什么樣的規(guī)則選擇“看”,不選擇“讀”?目前漢語詞匯和語義的研究還不能形式化地回答這個問題。機器翻譯系統(tǒng)只好先根據(jù)詞語搭配的優(yōu)先關(guān)系來判斷。一種作法是,借助描寫詞語概念的語義詞典,用統(tǒng)計語言模型計算語義相似度,讓計算機學會表示和比較詞語搭配的優(yōu)先關(guān)系。但是,用這種工程化的方法并不能繞過漢語研究的作用,因為一個統(tǒng)計語言模型能否達到比較好的處理效果,很大程度上取決于采用什么樣的語言學知識作為參數(shù)。
3.3判斷合法性
經(jīng)過詞語選擇和角色分派,得到了圖2表示的兩個謂詞結(jié)構(gòu)。這一步的任務(wù)是,判斷能不能用動結(jié)式述語結(jié)構(gòu)表示這兩個謂詞結(jié)構(gòu)及其關(guān)系。具體說就是,“看”和“懂”能不能合成“看懂”,并且表示中介語言邏輯表達式要求的“動作—結(jié)果”關(guān)系。因此合法性的問題關(guān)系到哪些動詞和哪些形容詞(或動詞)能夠組合成符合漢語習慣的動結(jié)式。
如果給機器翻譯系統(tǒng)提供一個詞表,列出一批動結(jié)式的詞語,而“看懂”又剛好在這個詞表里,那么判斷這件事情就比較容易。譬如,在動詞“學”的兩個義項(“學習”和“模仿”)下面,《漢語動詞用法詞典》(孟琮等,1999)列舉了8個動結(jié)式實例,《中國語補語例解》(侯精一等,2001)列舉了12個。這兩部詞典是面向人的,如果給機器翻譯用就還需要收錄更多的實例。比如“學懂”、“學膩”,等等(我們在本文的第四部分列舉了“學”下面84個可能需要生成的動結(jié)式實例)。實際上,詞表只適用于小范圍的實驗型翻譯系統(tǒng)。動結(jié)式述語是一種自由結(jié)構(gòu),是根據(jù)說話的需要臨時造出來的,因此應(yīng)該是不勝枚舉的。
我們可以這樣想,“學”是一種認知行為,“懂”、“明白”等詞語表示認知活動的效果,因此可以當“學”的結(jié)果補語。但人們也常說“這孩子學歪了”、“把身體學垮了”?!巴帷焙汀翱濉庇指鶕?jù)什么是“學”的結(jié)果補語呢?這些補語該用什么條件來生成?我們將在第四部分進一步討論這個問題。
如果這一步判斷的結(jié)果是不能生成合法的動結(jié)式,那么就需要回到上一步,重新選擇詞語,直到找不到符合預(yù)定的語義要求的詞語為止。
3.4整合語義結(jié)構(gòu)
作為一個述謂性的結(jié)構(gòu)整體,動結(jié)式有自己語義上的支配成分,包括論元成分和附加成分,我們把這些語義關(guān)系的和統(tǒng)稱為語義結(jié)構(gòu)。在這一步,我們需要根據(jù)動詞和補語各自的語義結(jié)構(gòu),確定動結(jié)式整體的語義結(jié)構(gòu),主要是配價結(jié)構(gòu)(價語的數(shù)量和性質(zhì))。
動結(jié)式的配價結(jié)構(gòu)不等于其構(gòu)件(動詞或補語)的配價結(jié)構(gòu),也不簡單地等于二者之和。動結(jié)式的配價與其構(gòu)件的配價之間有沒有對應(yīng)關(guān)系?如何從動詞和補語各自的配價結(jié)構(gòu)得到動結(jié)式的配價結(jié)構(gòu)?袁毓林(2001)、郭銳(1995)和王紅旗(1995)都曾經(jīng)作過研究,在解釋成因的同時,尋找動結(jié)式對其構(gòu)件原有的論元進行選擇的控制規(guī)則。在一定范圍內(nèi)應(yīng)用這些規(guī)則,我們可以從動詞和補語的配價結(jié)構(gòu)推算出動結(jié)式的配價結(jié)構(gòu)。包括價語的數(shù)量:動結(jié)式是一價的、二價的,還是三價的;以及價語的性質(zhì):動結(jié)式述語結(jié)構(gòu)中各個論元的語義角色是什么(主要分為主體格(主論元)、客體格(賓論元))。對于前面的例句,我們就可以得到,動結(jié)式“看懂”是二價的,它的兩個論元是“他”(主體格)和“文章”(客體格)。價語的數(shù)量和性質(zhì)是下一步選擇句法結(jié)構(gòu)的主要依據(jù)。在動結(jié)式生成的整個過程中,漢語語法學者提出的論元整合規(guī)則是可以直接影響生成算法的規(guī)則,這樣的結(jié)論在目前的漢語語法研究中還為數(shù)甚少。機器翻譯十分重視這一組規(guī)則的作用,也期待著對它更加深入的研究和完善。(注:譬如,袁毓林(2001)提出的準入規(guī)則在論元整合結(jié)果為等價的情況下是有效的,也是可操作的,對增價的情況雖然有處理的規(guī)則,但是計算機不大容易操作,對減價的情況還沒有提出有效的處理辦法。)
3.5選擇句法表現(xiàn)形式
這一步要做的是,選擇什么樣的句法手段去表現(xiàn)動結(jié)式的語義結(jié)構(gòu)。動結(jié)式有很多表層結(jié)構(gòu)類型,李臨定(1986,181-204頁)曾歸納了五類句型:
(1)N[,1]VC媽媽急哭了
(2)N[,1]VN[,2]VC他走路走累了
(3)N[,1]VCN[,2]我點亮了油燈
(4)N[,1]VN[,2]VCN[,3]他拍桌子拍疼了手
(5)N[,1]把N[,2]VCN[,3]火把他的衣服燒穿了幾個洞
前四類還各有四種可能的表層變換形式(“把”、“被”、“得”字句及其他)。到底應(yīng)該選取哪一種生成我們的句子呢?這是如何在語義結(jié)構(gòu)和句法結(jié)構(gòu)之間尋找對應(yīng)關(guān)系的問題,我們打算在第五部分就這個問題作進一步的討論。
3.6處理表層詞語
選定了句子的表層結(jié)構(gòu)和語序以后,剩下的事是用詞匯手段表達某些句法或語義范疇。比如:時、體、否定、指代、有定、數(shù)量,等等。然后輸出最后生成的結(jié)果。對于我們的例子就是:“他看懂了這篇文章”。句子里的“了”、“這”和“篇”是在這一步生成的。
機器翻譯生成漢語動結(jié)式時,在句子表層要處理的問題很多,每一個問題也都很復(fù)雜,比如時體成分、否定成分的語序等,需要作專門的研究。
3.7操作過程的控制
需要說明的是,上面各個步驟的操作并不是無條件依次進行的。當在某一步無法得到確定的結(jié)論時,應(yīng)該中止動結(jié)式的生成過程。
4.動詞和結(jié)果補語的組合關(guān)系
動詞和結(jié)果補語的組合應(yīng)該是基于語義的。要想離開詞表的限制,判斷哪些動詞和哪些形容詞(或動詞)可以組合成符合漢語習慣的動結(jié)式,就需要從語義上研究動補之間的組合類型和規(guī)則。顯然,這件事情不是機器翻譯力所能及的。在這里我們只能先從個例入手,看看單音節(jié)動詞和單音節(jié)形容詞作動詞“學”的結(jié)果補語的情況,或許能夠從中看到這個問題的困難所在。
動詞“學”的意思是“學習”或“模仿”。在《現(xiàn)代漢語語法信息詞典》(注:由北京大學研制的用于信息處理的電子詞典,其中有按義項收錄的14479個動詞,2856個形容詞。通過檢索每個詞的屬性,我們可以知道哪些動詞可以帶結(jié)果補語,哪些形容詞、動詞可以作結(jié)果補語。)(俞士汶,1998,以下稱《語法信息詞典》)中,列出了可以作結(jié)果補語的單音節(jié)形容詞204個,(注:馬真等(1997)列出了可以作結(jié)果補語的單音節(jié)形容詞153個。)單音節(jié)動詞112個。經(jīng)過一一搭配測試,其中有54個形容詞和30個動詞能作“學”的結(jié)果補語。這樣我們就從《語法信息詞典》中一共得到了84個可能的動結(jié)式實例。然后按照《知網(wǎng)》(注:用于自然語言處理的知識系統(tǒng),由董振東等研制。以從大量詞語中提取出來的“義原”為基本描述單位,采用一種結(jié)構(gòu)化的描述語言來描述概念與概念之間,以及概念的屬性與屬性之間的關(guān)系,包括上下位關(guān)系、同義關(guān)系、反義關(guān)系、對義關(guān)系、部件與整體關(guān)系、材料和成品關(guān)系、屬性和宿主關(guān)系,以及屬性值和屬性的指向關(guān)系、時間和角色關(guān)系?;ヂ?lián)網(wǎng)網(wǎng)址:)(董振東等,2001)的定義為每一個實例的補語作語義類別標注,再作聚類分析,整理出“學”的結(jié)果補語的六個語義類別。其中A、E、F三類作補語的是形容詞,B、C、D三類作補語的是動詞,分別列在下面(括號里面是《知網(wǎng)》定義的義原)。
A.人的客觀屬性(智能、舉止、年齡、外貌、品性、經(jīng)濟狀況)
A1.[智能]學笨了學昏了學蒙了學癡了學蠢了學土了學呆了學木了學乖了學傻了
A2.[舉止]學刁了學歪了學賊了學油了學浮了學狠了學犟了學俗了學倔了學皮了學酸了學混了學摳了
A3.[年齡]學老了
A4.[經(jīng)濟狀況]學富了學窮了
A5.[品性]學差了學廢了學好了學黑了學壞了學糟了
A6.[外貌]學俏了
B.人的主觀感受(態(tài)度、感知)
B1.[態(tài)度]學煩了學夠了學慣了學迷了學惱了學膩了學怕了
B2.[感知]學懂了學乏了學會了學累了學通了學忘了
C.人的狀態(tài)和行為(狀態(tài)、行動)
C1.[狀態(tài)]學病了學成了學瘋了學垮了學虧了學蔫了學瘸了學死了學癱了學啞了學暈了
C2.[行動]學哭了學跑了學散了學走了
D.事物的狀態(tài)(狀態(tài))
學丟了學沒了
E.事物的特性(特性)
學反了學活了學偏了學淺了學深了學雜了學窄了學足了
F.事
件的特性(特性)
學遍了學遲了學重了學錯了學對了學多了學久了學濫了學全了學少了學透了學晚了學早了
可以看出,“學”和它的結(jié)果補語之間在概念意義的組合上遵循一定的規(guī)律。能否根據(jù)這些規(guī)律,用計算機可操作的方法,在一定范圍內(nèi)判斷詞表以外的動結(jié)式實例是否合法?比如,《語法信息詞典》沒有把“精”列入可作結(jié)果補語的形容詞當中,但是“學精了”是個合法的動結(jié)式實例。計算機可以這樣來確認它的合法性:根據(jù)《知網(wǎng)》,“精”的定義是[智能>靈](“>”的右部是左部的下位概念。下同),在A1類[智能>愚/訥/智/靈](“/”表示“或”的意思。下同。)的范圍內(nèi)。同樣,與“精”定義相同的“鬼”、“靈”、“巧”,雖然也沒有被《語法信息詞典》指明可作結(jié)果補語,但計算機仍然能夠判定“學鬼了”、“學靈了”和“學巧了”是合法的動結(jié)式實例。
對于動補之間的語義組合,結(jié)果補語的概念意義是在動詞概念意義的制約下起作用的。我們再來看與“學”有對義關(guān)系(Converse)的動詞“教”?!皩W”和“教”都表示認知行為,前者是使自我認知,后者是使他人認知。因此有可能要求相似的結(jié)果補語。實際上,“學”的結(jié)果補語基本上都可以作“教”的結(jié)果補語。(注:盡管各自的語義指向可能不同,比如:“學笨了”和“教笨了”。這與動詞的配價結(jié)構(gòu)有關(guān)。在機器翻譯生成動結(jié)式的過程中,由“整合語義結(jié)構(gòu)”這一步處理。)它們或者表示認知行為對其主體(“學”的施事、“教”的與事)產(chǎn)生的效果:改變主體的客觀屬性(智能、舉止、年齡、外貌、品性、經(jīng)濟狀況)、主觀感受(態(tài)度、感知)、狀態(tài)和行為;或者表示認知行為對其涉及的事物產(chǎn)生的效果:改變涉及對象的狀態(tài)、性質(zhì)(長短、寬窄、深淺、多少、正反、美丑);或者表示認知行為本身的特性(度量、頻率、程度)。不同的“動作—結(jié)果”關(guān)系產(chǎn)生了不同的動補組合關(guān)系,要把它們研究清楚,整理成規(guī)則,是一件非常復(fù)雜的事情。
即使有了基于詞語概念意義的規(guī)則,也還不能完全解決問題。在《知網(wǎng)》中,與“懂”有相同定義的單音節(jié)動詞還有“認”、“審”、“識”、“通”、“悉”、“曉”、“知”。除了“通”以外,其余的都不能作“學”的結(jié)果補語。與“精”定義相同的雙音節(jié)形容詞“聰明”、“機靈”、“伶俐”、“乖巧”可以作“學”的結(jié)果補語,而同樣定義的“聰穎”、“聰慧”卻不行。這說明影響動詞和結(jié)果補語組合關(guān)系的因素不僅僅是詞語的概念意義。那么,到底還有哪些因素可以作為判斷動結(jié)式合法與否的條件?如何把這些條件變成計算機可以操作的規(guī)則?我們現(xiàn)在還不得而知。
5.從語義結(jié)構(gòu)到句法表現(xiàn)形式
在動結(jié)式的整個生成過程中,選擇什么樣的句法手段來表現(xiàn)其語義結(jié)構(gòu)是比較復(fù)雜的一步。人們常說,漢語句法結(jié)構(gòu)和語義結(jié)構(gòu)之間的聯(lián)系比較松散,或者說句法成分和語義成分的配位很靈活,一種結(jié)構(gòu)形式經(jīng)常表示多種意義,一種語義內(nèi)容也可以用多種結(jié)構(gòu)形式來表示。這就給機器翻譯的漢語生成帶來很大的困難。對于動結(jié)式表層句法結(jié)構(gòu)的選擇,我們目前能用到的條件非常有限,所以能生成的句型也很有限。
5.1使生成目標受限
通過整合語義結(jié)構(gòu)我們得到了動結(jié)式的配價結(jié)構(gòu),價語的數(shù)量可以幫助我們選擇句型。如果動結(jié)式是一價的,選擇有一個體詞性成分出現(xiàn)的句型;是二價的,選擇包含兩個體詞性成分的句型。至于在同屬一類句型的多個表層結(jié)構(gòu)形式中間應(yīng)該選擇哪一個,還需要更細致的條件和規(guī)則。下面討論如何把動結(jié)式組成成分之間的語義關(guān)系作為選擇的條件。
為了簡化討論的過程,我們在這里只考慮二價動結(jié)式的情況(略去“媽媽急哭了”、“他看書看花了眼”、“他扔進屋一塊石頭”等)。這樣,討論的范圍就限制在只含有兩個體詞性成分的表層結(jié)構(gòu)形式里面。呂叔湘(1986)曾經(jīng)按照補語跟主語或賓語的語義關(guān)系,把動結(jié)式述補結(jié)構(gòu)分成15類(略去“得”字句等),其中有兩個體詞性論元成分出現(xiàn)的共9類(包括用“把”和“被的句子),分屬以下三種語義關(guān)系格式,其中S是V的主體格。(注:在本節(jié)討論的范圍內(nèi),主體格包括施事、當事;客體格包括受事、內(nèi)容。)
附圖
綜合上述各種情況可以看出,二價動結(jié)式的六種語義結(jié)構(gòu)可以用以下五種表層結(jié)構(gòu)形式來表達。下面的討論將在這個范圍以內(nèi)進行:
表層結(jié)構(gòu)1:SVCO
表層結(jié)構(gòu)2:S“把”O(jiān)VC
表層結(jié)構(gòu)3:O“把”SVC
表層結(jié)構(gòu)4:O“被”SVC
表層結(jié)構(gòu)5:S“被”O(jiān)VC
我們注意到,同時與二價動結(jié)式的六種語義結(jié)構(gòu)有對應(yīng)關(guān)系的只有表層結(jié)構(gòu)1(SVCO),所以可以把它當作生成動結(jié)式表層的首選??墒沁M一步觀察就會發(fā)現(xiàn),在用表層結(jié)構(gòu)1表
達某些語義結(jié)構(gòu)時會受到限制。譬如語義結(jié)構(gòu)Ⅱ,我們可以說“大家吃膩了剩菜”,卻不能說“我丟怕了錢包”,也不能說“他看傻了那幅畫”。能說與不能說應(yīng)該有條件來控制,O和C之間的語義關(guān)系可能是一個控制條件,但是目前還沒有確切的規(guī)則可用。
在這種情況下,只好先避開表層結(jié)構(gòu)1,選擇2和3。經(jīng)過初步實驗我們看到,就表達命題意義來說,用表層結(jié)構(gòu)3表達語義結(jié)構(gòu)Ⅱ,用表層結(jié)構(gòu)2表達語義結(jié)構(gòu)Ⅰ、Ⅲ、Ⅳ、Ⅴ、Ⅵ,受到的限制最少。這樣,討論的范圍又縮小到了兩種表層結(jié)構(gòu)形式。問題就變成了:如何找到用這兩種句法形式表達六種語義關(guān)系格式的控制條件。我們把這種逐步縮小問題范圍的做法叫作使生成目標受限,實際上這是對復(fù)雜問題的一種妥協(xié)。也就是對二價動結(jié)式,放棄生成所有的表層句式,尋找盡可能簡單和有效的控制條件,先用部分表層結(jié)構(gòu)形式表達其多種語義格式。
5.2生成表層結(jié)構(gòu)的控制條件
從語義結(jié)構(gòu)生成表層結(jié)構(gòu)的主要控制條件是動結(jié)式組成成分之間的語義關(guān)系。
對于二價動結(jié)式的組成成分S、O、V、C,如果S是V的主體格,而且:
(一)如果S、O、V、C相互之間滿足下列五個條件之一,則可以用表層結(jié)構(gòu)2表達:
1.(O是V的客體格)且(O是C的主體格)且(C是一價的)
2.(S是C的主體格)且(O是V的客體格)且(O是C的客體格)
3.(O是C的主體格)且(V和C都是一價的)
4.(S是C的主體格)且(O是C的客體格)且(V是一價的)
5.(O是V的客體格)且(C是V的修飾成分)
(二)如果S、O、V、C相互之間滿足條件6,則可以用表層結(jié)構(gòu)3表達:
6.(O是V的客體格)且(S是C的主體格)且(C是一價的)
表層結(jié)構(gòu)2和3都是“把”字句。關(guān)于“把”字句,很多學者從各種角度作過研究。張伯江(2000)曾根據(jù)句式語法的觀點指出,除了組成成分的作用以外,“把”字句的整體意義當中還有句式意義的作用。因此,生成的時候還應(yīng)當考慮上述控制條件能否符合“把”字句句式意義的要求。我們注意到,動結(jié)式與“把”字句似乎有一種自然的聯(lián)系?!鞍选弊志渲蠽的“處置”意義、C是“把”后面賓語產(chǎn)生的變化等句式意義與動結(jié)式的句式意義基本相似。(注:在動結(jié)式的表層結(jié)構(gòu)2中,賓語是O;在表層結(jié)構(gòu)3中,賓語是S。)另外,為了體現(xiàn)“把”字句里動作過程的完整性,我們在生成過程的最后一步(處理表層詞語)規(guī)定,“把”字后面排斥否定謂語形式。根據(jù)我們的觀察和實驗,在二價動結(jié)式述語結(jié)構(gòu)的五種表層形式中,“把”字句在語義表達的適應(yīng)性上比較好,常常能夠包容除語義關(guān)系之外的其他一些選擇控制因素。譬如,補語是雙音節(jié)的動結(jié)式一般不宜選擇表層結(jié)構(gòu)SVCO,但“把”字句不受這個限制。再如,用“把”字句來表達“你把坑挖淺了”這一類含有動結(jié)式的句子,正好能夠表示其偏離預(yù)期結(jié)果的意思,比用其他表層結(jié)構(gòu)更合適一些。“把”字句在動結(jié)式生成中為什么會有這樣的表現(xiàn)?這不是機器翻譯能夠解釋的問題。
現(xiàn)在再來看我們要生成的例句:“小王讀了這篇文章,結(jié)果小王懂了這篇文章”。經(jīng)過“動作—結(jié)果”述謂關(guān)系的判斷、詞語選擇、合法性判定和語義結(jié)構(gòu)整合,我們得知,它可以生成一個二價的動結(jié)式述補結(jié)構(gòu),其中各個組成成分之間的語義關(guān)系是:
SVO&SCO
這種語義結(jié)構(gòu)符合控制條件2(S是V和C的主體格,而且O是V和C的客體格)。因此為它選擇的表層句法形式是:
S“把”O(jiān)VC
再經(jīng)過表層詞語的處理,最后生成:
小王把這篇文章看懂了。
6.余論
戴浩一(2002)在論述漢語語法的哲學基礎(chǔ)時指出,語法現(xiàn)象是概念系統(tǒng)概念化的結(jié)果。他從宏觀角度提出了從概念結(jié)構(gòu)到漢語句法和詞匯形式的過程,說明在這個過程中起作用的是漢語的概念化原則。應(yīng)該說,機器翻譯從中介語言邏輯表達式生成動結(jié)式譯文的過程就是這樣一個實例。從“動作—結(jié)果”述謂關(guān)系的判斷、詞語選擇、合法性判定、語義結(jié)構(gòu)整合、直到句法形式選擇和表層詞語處理,我們需要的是具體的、可操作的句法化、詞匯化的原則和規(guī)則,這樣才能從生成機制上找到動結(jié)式的構(gòu)成條件。多年來,漢語語法一直比較重視動結(jié)式述語結(jié)構(gòu)的研究,在結(jié)構(gòu)層次、結(jié)構(gòu)關(guān)系、句法功能、語義關(guān)系、配價結(jié)構(gòu),還有組成成分的特征和性質(zhì)等問題上有許多論述。只是研究結(jié)論多數(shù)是面向人的,能為漢語信息處理和機器翻譯所用的還不多。比如,關(guān)于動結(jié)式是如何形成的,人們大多從歷時的角度,指出它的來源是古代漢語的使動用法。而機器翻譯需要的是從共時的角度找到動結(jié)式形成的控制條件,告訴計算機,在什么情況下,哪些動詞和哪些形容詞(或動詞)可以組合成、以及怎么組合成符合漢語習慣的動結(jié)式述語結(jié)構(gòu)。還有,如何從要生成的句子意思里找到“動作—結(jié)果”關(guān)系及其述謂結(jié)構(gòu)?如何根據(jù)要表達的意思選擇合適的詞語?如何從動詞和補語的配價結(jié)構(gòu)推算出動結(jié)式的配價結(jié)構(gòu)?如何從動結(jié)式的語義結(jié)構(gòu)選擇它的句法表現(xiàn)形式?以及如何在句子表層處理時體成分、否定成分、指代關(guān)系、數(shù)量關(guān)系?在沒有找到解決這些問題的有效規(guī)則以前,機器翻譯系統(tǒng)還只能采用某些權(quán)宜之計來生成漢語的動結(jié)式。
在強調(diào)規(guī)則的作用的同時,我們也看到統(tǒng)計語言模型的方法近年來越來越多地應(yīng)用在語言工程中,出現(xiàn)了基于實例的和基于統(tǒng)計的機器翻譯系統(tǒng)。在人們對語言和翻譯的機制還缺乏系統(tǒng)的了解,還沒有一種適合信息處理的語言理論可以應(yīng)用的時候,統(tǒng)計語言模型可能會起到某種依靠“量”來獲取“質(zhì)”的作用。它的前提是,大量語言現(xiàn)象的統(tǒng)計規(guī)律能夠確切地反映語句的構(gòu)造規(guī)律和言語過程的認知規(guī)律。而實際上,這還是有待證明的觀點。更何況統(tǒng)計語言模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 晉中山西晉中市太谷區(qū)面向2025屆公費師范生招聘教師18人筆試歷年參考題庫附帶答案詳解
- 2025年中國太子佛工藝品市場調(diào)查研究報告
- 2025至2031年中國高壓透鏡行業(yè)投資前景及策略咨詢研究報告
- 2025年藝術(shù)道閘項目可行性研究報告
- 2025年紅外線按摩棒項目可行性研究報告
- 2025年電加熱針織物呢毯預(yù)縮機項目可行性研究報告
- 成都四川成都天府國際競技訓練中心招聘運動員4人筆試歷年參考題庫附帶答案詳解
- 2025年曲印項目可行性研究報告
- 2025年揉切粉碎機項目可行性研究報告
- 2025年安康魚野菜串項目可行性研究報告
- 情侶自愿轉(zhuǎn)賬贈與協(xié)議書范本
- 綜合實踐項目 制作水族箱飼養(yǎng)淡水魚 教學設(shè)計-2024-2025學年魯科版生物六年級上冊
- 公轉(zhuǎn)私付款合同模板
- 安徽省2024年高考語文模擬試卷及答案5
- 江西省“振興杯”信息通信網(wǎng)絡(luò)運行管理員競賽考試題庫-上(單選題)
- DLT 5756-2017 額定電壓35kV(Um=40.5kV)及以下冷縮式電纜附件安裝規(guī)程
- 關(guān)于餐飲合同范本
- 2023高考數(shù)學藝考生一輪復(fù)習講義(學生版)
- CHT 4019-2016 城市政務(wù)電子地圖技術(shù)規(guī)范(正式版)
- 廣西壯族自治區(qū)南寧市2024年七年級下學期語文期末試卷附答案
- 冀教版五年級數(shù)學下冊全冊課件【完整版】
評論
0/150
提交評論