自然語言處理-第9章 句法和語義的關(guān)系_第1頁
自然語言處理-第9章 句法和語義的關(guān)系_第2頁
自然語言處理-第9章 句法和語義的關(guān)系_第3頁
自然語言處理-第9章 句法和語義的關(guān)系_第4頁
自然語言處理-第9章 句法和語義的關(guān)系_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Chapter 9 句法和語義的關(guān)系句法和語義的關(guān)系 2000.04 這一章將討論聯(lián)系句子的邏輯形式和句法結(jié)構(gòu)的方法。 這使得在剖析句子過程中,可以的到它的邏輯形式,這種方法我們稱之為 (semantic interpretation); 另外,有一種方法允許我們由一個(gè)特定的邏輯形式產(chǎn)生相應(yīng)的句子結(jié)構(gòu)樹,即 (semantic realization)。 為了完整的聯(lián)系句法和語義,就需要每一個(gè)成分都有其合適的意思表達(dá)式。成分的意思和子成分的意思之間的關(guān)系可以在帶有特征的文法中指定,因?yàn)槊恳粋€(gè)句法規(guī)則都有其相應(yīng)的語義理解規(guī)則,這種方法常稱為 rule-by-rule方式 的語義理解。9.7 由邏

2、輯形式產(chǎn)生句子9.1 語義理解和合成性9.2 一個(gè)用于語義理解的簡單文法 字典9.3 介詞短語和動(dòng)詞短語9.4 詞條化的語義理解和語義角色9.5 簡單問題的處理9.6 用特征合一的語義理解End 考查語言中的一些基本結(jié)構(gòu),在剖析一小段英語過程中建立一個(gè)文法來產(chǎn)生每一個(gè)成分的邏輯形式,在這兩節(jié)中所用的邏輯形式是命題-變量的結(jié)構(gòu)。 討論語義合成的觀點(diǎn)并引入演算演算(lambda calculus)作為建立合成理論的工具。 如何用語義角色來產(chǎn)生邏輯形式,并主要討論建立分級字典的必要性,因?yàn)橛盟梢詼p少確定詞條意思的工作量。 討論語義理解中如何處理簡單的問題 。 講述形成邏輯形式的另一種方法,它將利用

3、附加特征,從而比表達(dá)方法更具有選擇性,這樣允許我們表達(dá)可逆的文法。 討論語義實(shí)現(xiàn),闡述對于給出邏輯形式和可逆文法,如何產(chǎn)生相應(yīng)的句子。 在語義理解過程中,我們有一個(gè)重要的假定:語義的合合成過程成過程(compositional process)。這就意味著一個(gè)成分的意思可以由它的子成分的意思單獨(dú)地推導(dǎo)出。合成理論有一些很吸引人的性質(zhì),尤其理解可以隨著子短語的理解而增加,例如句法中的上下文無關(guān)文法就是關(guān)于句法的合成理論,只需將規(guī)則應(yīng)用于子成分的類型,不用考慮它們的內(nèi)部結(jié)構(gòu),如規(guī)則:S NP VP,不管NP的特定形式,通過簡單的加入一個(gè)NP規(guī)則:NP PRO,這樣一個(gè)新類型的句子就產(chǎn)生了,即具有一

4、個(gè)代詞處于可接受的位置的任何句子,這個(gè)吸引人的性質(zhì)正是我們進(jìn)行語義理解所需要的。 語言的合成性常根據(jù)嚴(yán)格的標(biāo)準(zhǔn)來定義,一個(gè)子成分的意思將在其它子成分的意思映射到新成分的過程中起作用,而在合成方法中,要求常大大放寬,只要按一個(gè)成分,一個(gè)成分的意思逐漸增加即可。 這將是我們用合成理論所會(huì)碰到的難題之一。圍繞這個(gè)問題,可以引入無范圍的邏輯形式(the unscoped logical form)。如果我們定義語義理解的目標(biāo)是產(chǎn)生一個(gè)無范圍的邏輯形式,則上個(gè)句子將表達(dá)成:(LOVES l1 (NAME j1 “Jill”) )它更加接近句子的句法結(jié)構(gòu)。 例例1一個(gè)典型的問題是帶有量詞的句子: Jill

5、 loves every dog. 這個(gè)句子的句法結(jié)構(gòu)只是將詞聚集在一起組成短語:(Jill) (loves (every dog) 但這個(gè)句子的無歧義的邏輯形式若用謂詞-變量的形式(predicate-argument form)描述,則為:(EVERY d :(DOG1 d) (LOVES1 l1 (NAME j1 “Jill”) d) 合成模型傾向于使文法更容易擴(kuò)展和維持。但建立一個(gè)語義理解的合成理論看似容易,但做起來難:首先,句子的句法結(jié)構(gòu)和邏輯形式的結(jié)構(gòu)之間存在結(jié)構(gòu)的不一致。例如:短語every dog是動(dòng)詞短語 loves every dog的一個(gè)子成分,然而它的語義理解廣義的量化

6、短語(EVERY d :(DOG1 d) 看起來象是把動(dòng)詞短語的意思作為它的一部分;更糟糕的是好象把every dog的理解分裂開了:將量詞結(jié)構(gòu)和變量從謂詞中分離出來。結(jié)果是很難看出every dog孤立地代表什么意思及如何用它來構(gòu)造整個(gè)句子的意思。這表明對于每條狗 d 都有一個(gè)由 Jill loving d 的事件l1。在這當(dāng)中,邏輯形式的各個(gè)部分和句法分析中的成分之間就不是簡單的一一對應(yīng)關(guān)系。 它的意思是 Jack died,這種理解似乎與動(dòng)詞 kick 以及 bucket 毫無關(guān)系。這樣的句子的意思就不象是由子成分的意思構(gòu)造出來,處理這種情況的一種方法是允許將語義意思賦予整個(gè)短語,而不是

7、根據(jù)語義合成。我們原來就假設(shè)基本單元是單詞(或詞素),習(xí)慣用語的表達(dá)則建議將其推廣,使得一個(gè)完整的短語可以有一個(gè)基本的(即不用推導(dǎo)的)意思。這樣動(dòng)詞短語 kick the bucket 有著類似于動(dòng)詞 die 的基本意思。在合成意思不能應(yīng)用于理解習(xí)慣用語時(shí),通過觀察特定的句法意譯來匹配這些句子。 例如:表示被動(dòng)的句子The bucket was kicked by Jack,就不能解釋成 Jack died。 對于合成理論的另外一個(gè)挑戰(zhàn)是習(xí)慣用語。 例2 你可以說Jack kicked the bucket。 解決這個(gè)問題的另一種方法是對習(xí)慣用語中出現(xiàn)的單詞引入新的意義。例如,kick 將有一

8、個(gè)意思 DIE1,它的賓語的子詞類是 BUCKET1 類型。雖然習(xí)慣用語是語言中一個(gè)非常有趣而且很重要的方面,但在接下去的幾章中,我們將沒有討論它。為了達(dá)到本書的目的,你可以假設(shè)基本意思總是和單詞聯(lián)系在一起。 有趣的是,這個(gè)句子是有歧義的,它有一個(gè)由每個(gè)詞的意思所構(gòu)造的意思:(KICK1 k1 (NAME j1 “Jack”) 而另一個(gè)由詞Jack和短語kick the bucket的基本意思所構(gòu)造的意思:(DIE1 d1 (NAME j1 “Jack”) 如果語義理解的過程是合成,那么你必須能夠賦予任何的句法成分一個(gè)相應(yīng)的語義結(jié)構(gòu)。比如:你必須能夠賦予每一個(gè)動(dòng)詞短語一些固定的意思形式,使它能

9、夠用于含有VP子成分的規(guī)則。 考慮最簡單的情況,動(dòng)詞短語只包含一個(gè)不及物動(dòng)詞,如句子 Jack laughed。一種方法是動(dòng)詞短語 laughed 的意思是作為一個(gè)一元謂詞 ( (a unary predicatea unary predicate),這對任何對象的 laughed(過去形式)動(dòng)作來說是為真。這種方法能一般化嗎?也就是說,每個(gè)動(dòng)詞短語VP都有一個(gè)意思,即是作為一個(gè)一元謂詞嗎?考慮句子 Jack kissed Sue。它的邏輯形式是:KISS1 k1 (NAME j1 “Jack”) (NAME s1 “Sue”) 動(dòng)詞短語 kiss Sue 的意思是什么?它作為一元謂詞,對任意

10、對象作了kissed Sue 的動(dòng)作來說都是為真的嗎? 但是,到目前為止我們?nèi)詿o法表達(dá)這樣復(fù)雜的一元謂詞。BOX 9.1 演算演算 (lambda calculus) 和和變換變換( (lambda reduction)lambda reduction)演算的式子包含一個(gè)等價(jià)的斷言: = 這個(gè)系統(tǒng)中最關(guān)鍵的公理是 ( x Px )a) = Px/a其中Px是包含x的任意式子,在式子Px/a中,用a替代所有的x。我們定義兩種操作:變換變換(lambda reduction) lambda reduction) 提取提取(lambda abstraction) lambda abstraction

11、) 演算將可以用來表達(dá)上面的例子,尤其表達(dá)式 (x (KISS k1 x(NAME s1 “Sue”) 是帶一個(gè)變量的謂詞,你可以將 x 看作變量,而且這個(gè)謂詞對任意的對象 O 來說都是為真的,這樣在表達(dá)式的最終結(jié)果中子成分 O 對 x 來說是一個(gè)正確的命題。象其他謂詞,你可以由表達(dá)式和變量構(gòu)造一個(gè)命題。在邏輯形式語言,下面這個(gè)命題:(x (KISS1 k1 x (NAME s1 “Sue”) (NAME j1 “Jack”) 我們通常說的最終表達(dá)式是通過表達(dá)式 (x (KISS1 x (NAME s1 “Sue”)應(yīng)用于變量 (NAME j1 “Jack”)而獲得的,這個(gè)操作稱為 變換變換

12、(lambda reduction )(lambda reduction )。 當(dāng)且僅當(dāng) (NEME j1 “Jack”) 滿足謂詞 (x(KISS k1 x(NAMEs1 “Sue”)時(shí),這個(gè)命題為真。 而當(dāng)且僅當(dāng) (KISS1 k1 (NAME j1 “Jack”) (NAME s1 “Sue”)為真,上述定義的命題為真。 我們已經(jīng)不得不引入新的概念如表達(dá)式。你可以試圖放去這種方法,而建立其他方式的語義理解,然而,當(dāng)處理更大的文法或更復(fù)雜的情況時(shí),合成理論將更吸引人。 例3 用這種方式,動(dòng)詞短語可以容易地連接,即使他們具有不同的句法結(jié)構(gòu),象句子:Sue laughs and opens t

13、he door. 這個(gè)句子含有兩個(gè)VP:laughs和opens the door。 它們可以合并成為一個(gè)復(fù)雜的一元謂詞,即(a (&LAUGHS1 l2 a) (OPENS1 o2 a ) 它在句子someone who both laughs and open the door.中作一元的謂詞是為真的。 這是動(dòng)詞短語的正確形式,它可以和其它成分 (如其它VP) 連接,比如可以應(yīng)用于作主語的NP,其邏輯形式為 (NAME s1 “Sue”) ,從而形成一個(gè)原始的句子: (& (LAUGHS1 l2 (NAME s1 “Sue”) (OPENS1 o2 (NAME s1 “Su

14、e”) ) 前者是在句子 someone who laughs. 中作一元謂詞是為真的,即 (a (LAUGHS1 l2 a); 后者在句子 someone who opens the door. 中作一元謂詞是為真的,即(a (OPENS1 o2 a )。 考慮其它例子:介詞短語修飾的名詞短語可以有很多方法處理,例如對于名詞短語 The man in the store 中的介詞短語 in the store,我們可以有一個(gè)不獨(dú)立的意思。一種特定的技巧可先尋找修飾的位置,然后合起來理解。但這種技巧在理解句子 The man is in the store.或The man was thoug

15、ht to be in the store.時(shí)是無助的。如果介詞短語有一個(gè)獨(dú)立的意思,如一元謂詞:(o (IN-LOC1 o ) 它作為名詞短語的修飾語(增加一個(gè)新的限制)以及作為句子的謂語一樣,很容易理解。 名詞短語The man in the store的邏輯形式是:THE m1 (MAN1 m1) (IN-LOC1 m1 ) 而句子The man is in the store.的邏輯結(jié)構(gòu)則為IN-LOC1 ) 這是兩個(gè)簡單的例子,如果你采納語義合成的話,那么還會(huì)產(chǎn)生許多其他推廣。 通常,每個(gè)主要的句法短語都對應(yīng)著特定的語義結(jié)構(gòu): VPs和PPs 映射為一元的謂詞 (可能是不能用表達(dá)式建

16、立的復(fù)雜的表達(dá)式); 句子映射到命題; NPs則映射到術(shù)語; 小的詞類映射到表達(dá)式,在表達(dá)式中定義它們在大的詞類中的作用。 既然在相同的句法中的每個(gè)成分映射到同種的語義結(jié)構(gòu),這可以按一定的格式處理,例如:你可以不知道VP的特定結(jié)構(gòu),只要它的意思是一個(gè)一元謂詞,你就可以用它來建立包含它的更大的成分。 這一部分將構(gòu)造一個(gè)簡單文法和字典來說明:在剖析時(shí)如何利用特征建立邏輯形式。為了使例子簡單化,我們所要的邏輯形式先不用主題角色表示(the thematic role representation) ,而是采用上一節(jié)的來表示,這使得所有帶相同子類型結(jié)構(gòu)的動(dòng)詞可以以相同的方法處理。在9.4節(jié)再討論確定主

17、題角色的框架是如何生成。 對于每一條詞條和文法規(guī)則,我們需要增加一個(gè)SEM特征,例如:規(guī)則(S SEM (?semvp ?semnp) (NP SEM ?semnp) (VP SEM ?semvp) 在給了帶有SEM (NAME m1 “Mary”) 的NP子成分和帶有SEM (a (SEE1 e8 a (NEME j1 “Jack”)的VP子成分時(shí),考慮這條規(guī)則是什么? 新成分S的SEM特征是簡單的表達(dá)式: ( (a (SEES e8 a (NAME j1 “Jack”) (NAME m1 “Mary”) ) 用變換簡化后:(SEES1 e8 (NAME m1 “Mary”) (NAME j

18、1 “Jack”) 它正是我們所希望得到的句子。 圖9.1 給出了當(dāng)每個(gè)成分帶有SEM特征時(shí)句子的剖析過程。S SEM (SEES1 e8 (NAME m1 “Mary”) (NAME j1 “Jack”) NPSEM (NAME m1“Mary”) VP SEM ( a (SEES1 e8 a NAME j1“Jack”)V SEM SEES1NP SEM (NAME m1 “Jack”)圖9.1 帶有SEM特征的一棵剖析樹Exit 在字典中,我們用SEM特征來描述各個(gè)單詞的可能意思,因?yàn)橛胁煌囊辉^詞, 故通常一個(gè)詞的不同子類型有著不同詞意。圖9.2給了一個(gè)簡單的字典。 a (art A

19、GR 3s SEM INDEF1)can (aux SUBCAT base SEM CAN1)decide (v SEM DECIDES1 VFORM base SUBCAT _none)decide (v SEM DECIDES_ON1 VFORM base SUBCAT _pp:on)fish (n SEM FISH1 AGR 3s)fish (n SEM (PLUR FISH1) AGR 3p)圖9.2 一個(gè)帶SEM特征的詞典 (詳見Page 269) 一個(gè)詞的不同 SEM 形式取決于它的句法特征,這就需要有不同的詞條。例如:動(dòng)詞decide有兩個(gè)詞條:一是 SUBCAT 為 _none

20、 的情況;另一個(gè)是 SUBCAT為 _pp:on;單詞fish也有兩個(gè)詞條,因?yàn)樗腟EM特征取決它是單數(shù)還是復(fù)數(shù)。 (VP VAR ?v SEM ( a2 (?semv ?v a2) (V_none SEM ?semv) (VP VAR ?v SEM ( a3 (?semv ?v a3 ?semnp ) (V_np SEM ?semv) (NP SEM ?semnp) 規(guī)則2、3則處理及物和不及物動(dòng)詞并形成合適的VP解釋。它們都帶有SEM特征 (?semv) 從而構(gòu)造了一個(gè)一元謂詞,這個(gè)謂詞能夠應(yīng)用于主語。代表動(dòng)詞時(shí)態(tài)的變量包含三部分:一個(gè)事件變量 an event variable (存儲(chǔ)

21、于VAR特征中)、代表主語的變量以及其它子類型成分變量。 對于文法9.3,它能接受很簡單的句子和動(dòng)詞短語并建立其邏輯形式,注意到我們又引入一個(gè)附加于SEM特征的新特征:VER。它存貯著與成分相對應(yīng)的語段變量(the discourse variable),它對后面處理一定形式的修飾語特別有用。當(dāng)由單詞構(gòu)造詞條成分時(shí),VER特征將由剖析器自動(dòng)生成,通過把VER當(dāng)作主特征來沿剖析樹傳遞,它保證了語段變量的唯一。 (S SEM (?semvp ?semnp) (NP SEM ?semnp) (VP SEM ?semvp) Exit (NP WH- VAR ?v SEM (PRO ?v ?sempro

22、) (PRO SEM ?sempro) 給定代詞的形態(tài) (?sempro) 后,規(guī)則4則為代詞構(gòu)造一個(gè)帶合適的SEM特征 ; (NP VAR ?v SEM (NAME ?v ?semname) (NAME SEM ?semname) 規(guī)則5對合適的names做同樣的變換; (NP VAR ?v SEM ) (ART SEM ?semart) (CNP SEM ?semcnp)規(guī)則6定義一個(gè)未量化的表達(dá)式,它包含量詞 ?semart,語段變量 ?v 和一個(gè)命題(可以將一元謂詞 ?semcnp 應(yīng)用于語段變量來獲得)。例如:假設(shè)語段變量 ?v 為m1,名詞短語the man將綁定 the 的SEM

23、特征 (即操作THE)和 man 的SEM特征(即MAN1),從而得到表達(dá)式; (CNP SEM ?semn) (N SEM ?semn) 規(guī)則7建立一個(gè)關(guān)于單個(gè)N的簡單CNP,因?yàn)槠胀~的SEM特征已經(jīng)是一元謂詞,故其值就是CNP的SEM特征。 為了處理SEM特征,關(guān)于詞型推導(dǎo)的詞條規(guī)則就需要修改,如將一個(gè)帶有SEM特征的單數(shù)名詞轉(zhuǎn)換成復(fù)數(shù),就要增加復(fù)數(shù)操作:(N AGR 3p SEM (PLUR?semn) (N AGR 3s IRREG-PL SEM ?semn) +S 我們可以用一個(gè)相似的技巧:對于現(xiàn)在時(shí)和過去時(shí),插入一個(gè)無時(shí)態(tài)操作。修改后的詞型規(guī)則如文法9.4所示,這些規(guī)則和文法4

24、.5的初始規(guī)則相同,只增加了SEM特征 (詳見Page 269): 文法 4.5 文法 9.4 在處理語義理解時(shí),只需修改標(biāo)準(zhǔn)的圖表剖析方法中的兩個(gè)地方: 當(dāng)一條詞條規(guī)則能使用時(shí),將VER特征賦予一個(gè)新的語段變量。 無論何時(shí)建立一個(gè)成分,都用所有可能的變換來簡化SEM特征。 經(jīng)過這兩個(gè)變化,現(xiàn)有的剖析器可以剖析并形成邏輯形式??紤]句子:Jill saw the dog.它的剖析過程如圖9.5所示。 這一節(jié)總的介紹基本的語義理解過程,并引入兩個(gè)新的特征和兩處小的擴(kuò)展。在剖析過程中由文法建立其邏輯形式,這種技術(shù)可以用于本書討論的任何基于圖表剖析方法。圖9.5 首先,考慮處理助動(dòng)詞的規(guī)則:(VP S

25、EM (a1 (?semaux (?semvp a1) (AUX SUBCAT ?v SEM ?semaux) (VP VFORM ?v SEM ?semvp) 這樣有助于觀察這種類型的SEM式子:通過將表示主語的變量移動(dòng) (“l(fā)ifting”)到 CAN1 操作之后。以動(dòng)詞短語的理解 (x (LAUGHS1 e3 x)開始,建立一個(gè)新的包含CAN1操作的式子,而在式子的外部仍為主語保留變量。注意到:象所有的VPs,新的SEM特征是一個(gè)一元謂詞,可以將它應(yīng)用于主語,因此,助動(dòng)詞規(guī)則就可以遞歸地分析更復(fù)雜的助動(dòng)詞系列。 在這條規(guī)則為新的VP在合適位置插入一個(gè)情態(tài)動(dòng)詞,如果?semaux是情態(tài)動(dòng)詞

26、 (如CAN1);?semvp為表達(dá)式 (x (LAUGHS1 e3 x),根據(jù)助動(dòng)詞規(guī)則,動(dòng)詞短語can laugh的SEM特征是(a1 (CAN1 ( x (LAUGHS1 e3 x)a1),它可以簡化為 (a1 (CAN1 (LAUGHS1 e3 a1)。 上一節(jié)已引入我們在語義理解時(shí)所需要的東西,而這只引入簡單的理解技術(shù)而已。這一節(jié)將舉一些例子:利用文法規(guī)則來處理一些更復(fù)雜的情況,更詳細(xì)的討論對動(dòng)詞短語和介詞短語的理解。 我們先考慮作修飾語的情況,此時(shí)PP的SEM特征是一元謂詞,它將應(yīng)用于最終修飾的成分。這樣下面的規(guī)則是用于建立PP修飾語:(PP SEM ( y (?semp y ?s

27、emnp) (P SEM ?semp)(NP SEM ?semnp) 如介詞短語in the corner,如果P的SEM特征是IN-LOC1,NP的SEM特征是。這樣PP的SEM特征將是一元謂詞:(y (IN-LOC1 y ) 為了分析介詞短語,我們要認(rèn)識(shí)到介詞短語在句子中可以起兩種不同的語義作用:一個(gè)是PP作為名詞短語或動(dòng)詞短語的修飾語,另一個(gè)是作為主詞的子類型,介詞充當(dāng)一個(gè)位置變量的標(biāo)志而不是一個(gè)獨(dú)立的謂詞。 現(xiàn)在你可以理解名詞短語the man in the corner了,連接PP修飾語的規(guī)則為: (CNP SEM (n1 (&(?semcnp n1) (?sempp n1)

28、 ( (CNP SEM ?semcnp) (PP SEM ?sempp) 連接一個(gè)限定詞 (如the),利用規(guī)則6,將形成SEM特征(如THE m2 (z (&(MAN1 z)(IN1 z)m2)它可以簡化為THE m2(&(MAN1 m2) (IN1 m2) 如果CNP:man的SEM特征是一元謂詞MAN1,介詞短語in the corner的SEM特征是( y (IN1 y ),則新的CNP的SEM特征為 ( n1 (&(MAN1 n1) ( y (IN1 y)n1) 其中子表達(dá)式( y (INI y)n1)可以簡化為(IN1 n1),這樣整個(gè)表達(dá)式變成:( n1(

29、&(MAN1 n1) (IN1 n1) 這個(gè)一元謂詞對“any man who is in the corner”為真,這正是我們希望的意思。 PPs也可以修飾動(dòng)詞短語,如cry in the corner 和 Jill can cry in the corner。 PP修飾語的句法規(guī)則是VP VP PP 問題是如果我們將這個(gè)VP子成分的一元謂詞應(yīng)用于主語,其中PP修飾語的一元謂詞則應(yīng)用于語段變量,這樣將不能得到正確的答案。而是,應(yīng)由PP構(gòu)造的SEM應(yīng)用于語段變量。也就是說,合適的規(guī)則是:(VP VAR ?v SEM (x (& (?semvp x) (?sempp ?v) (

30、VP VAR ?v SEM ?semvp) (PP SEM ?sempp)利用這條規(guī)則剖析動(dòng)詞短語cry in the corner的剖析樹如圖9.6所示。 你可以跟修飾名詞短語的方式一樣,處理PP的SEM特征式子,但這兒有更復(fù)雜的情況:要考慮希望的動(dòng)作。如動(dòng)詞短語的子成分cry的邏輯形式:( x (CRIES1 e1 x) 介詞短語PP的邏輯形式如上面所示,整個(gè)VP:cry in the corner的邏輯形式為( a (&(CRIES1 e1 a) (IN-LOC1 e1)(VP SEM ( x (& (CRIES e1 x) (IN-LOC1 e1) VAR e1 (V

31、SEM ( x (& (CRIES e1 x) VAR e1PP SEM (y (IN-LOC1 y ) P SEM IN-LOC1ART SEM THEN SEM CORNER1VAR c1NP SEM VAR c1cryinthecorner圖9.6 帶VAR特征的PP (作VPs的修飾語) 介詞短語也可以在動(dòng)詞短語中充當(dāng)子類型成分,這種情況必須另外考慮。動(dòng)詞短語將決定如何理解介詞短語,例如:單獨(dú)的介詞短語on a couch可以描述物體或事件的所處的位置,但是動(dòng)詞decide,它可以描述決定了什么事情。兩者連接后情況就不同了,如句子Jill decided on the couc

32、h,它是個(gè)有歧義的句子: Jill made a decision while she was on a couch. Jill made a decision about a couch. 其中第一個(gè)句子將on the couch看作是作狀語的介詞短語;而第二個(gè)句子的語義理解等式又是什么呢?其合適的句法規(guī)則是:VP V_pp:on NP PPon最終VP的邏輯形式為:( s (DECIDES-ON1 d1 s ) 注意在這種情況下,詞on將沒有語義貢獻(xiàn)。對于這兩種不同類型的介詞短語,在很多系統(tǒng)中子類型PPs將被區(qū)別對待,我們引入一個(gè)新的二值特征PRED,+ 表示介詞短語被理解為一個(gè)謂詞,而

33、則表示作為變量。加入PRED后,如文法9.7的第8和第9條規(guī)則所示。8. (PP PRED+ SEM ( x (?semp x ?semnp) (P SEM ?semp) (NP SEM ?semnp)9. (PP PRED PFORM ?pf SEM ?semnp ) (P ROOTS ?pf) (NP SEM ?semnp)10.10.(VP VAR ?v SEM ( ag1 (& (?semvp ag1) (?sempp ?v) (VP SEM ?semvp) (PP PRED+ SEM ?sempp)11.11.(VP VAR ?v SEM ( ag2 (& (?sem

34、vp ag2) (?sempp ?v) (VP_np_pp:on SEM ?semvp) (PP PRED PFORM on SEM ?sempp)12.12.(VP SEM ( a1 (?semaux (?semvp a1) (AUX SUBCAT ?v SEM ?semaux) (VP VPFORM ?v SEM ?semvp)13. (CNP SEM ( n1 (& (?semcnp n1) (?sempp n1) (CNP SEM ?semcnp) (PP PRED+ SEM ?sempp)文法9.7 用于處理動(dòng)詞短語中的PPsVP SEM a (DECIDES-ON1 e1)

35、 V SEM DECIDES-ON VAR e1PP SEM PFORM on P SEM ON-LOC1NP SEM decideona couch圖9.8.1 動(dòng)詞短語 decide on a couch的剖析樹(一)VP SEM ( a (& (DECIDES e1 a) (ON-LOC1 e1) VAR e1 V SEM ( y (DECIDES e1 y) VAR e1PP SEM x (ON-LOC1 x ) P SEM ON-LOC1NP SEM decideona couch圖9.8.2 動(dòng)詞短語 decide on a couch的剖析樹(二)V SEM DECIDE

36、S1 VAR e1 到現(xiàn)在為止,詞條的語義形式只包括每個(gè)詞的各種意思,所有的復(fù)雜的語義理解可以在文法規(guī)則中編碼。因?yàn)檫@是個(gè)合理的策略,許多研究者采用了不同的方法,在這些方法中,如果詞條編碼比較復(fù)雜,文法就會(huì)比較簡單。在文法規(guī)則的復(fù)雜性和詞條的復(fù)雜性之間存在一種矛盾。 考慮動(dòng)詞decide,作為不及物動(dòng)詞DECIDES1,它的SEM特征只是簡單地為DECIDES1,文法9.3的規(guī)則2建立表達(dá)式 (y (DECIDES1 e1 y),一個(gè)可供選擇的方法定義SEM特征為 (y (DECIDES1 e1 y),然后規(guī)則2中的SEM式子就是用動(dòng)詞的SEM特征值; 而在及物動(dòng)詞時(shí),表達(dá)式為 (o (y (

37、DECIDES-ON1 e1 y o)。按照前面的方法,在規(guī)則3中,將這個(gè)謂詞用于對象的SEM就可以獲得合適的SEM特征值。 為了處理這兩種情況,我們需要為每個(gè)詞條加入一個(gè)新的特征ROLES,這樣就有如下的文法規(guī)則:(VP VAR ?v SEM (a (?semv ?vAGENT aTHEME ?semnp) (V ROLES AG-THEME SEM ?semv) (NP SEM ?semnp)(VP VAR ?v SEM (a (?semv ?vINSTR aTHEME ?semnp) (V ROLES INSTR-THEME SEM ?semv) (NP SEM ?semnp) 這樣我們

38、需要為動(dòng)詞可能充當(dāng)?shù)乃薪巧尤肷鲜龅母郊右?guī)則。 舉個(gè)例子,考慮如何確定一個(gè)文法,用它產(chǎn)生基于主題角色(thematic role)的邏輯形式。先考慮如果字典中只存儲(chǔ)單個(gè)詞的意思,那將會(huì)出現(xiàn)什么情況呢?前面用的文法只用一條規(guī)則可以覆蓋所有的及物動(dòng)詞,新的文法則需根據(jù)及物動(dòng)詞所充當(dāng)?shù)闹黝}角色來分類,每一種情況一條規(guī)則。例如動(dòng)詞see和eat,這兩個(gè)都有及物動(dòng)詞的形式,此時(shí),主語充當(dāng)AGENT角色,賓語充當(dāng)THEME角色。另一個(gè)方面,動(dòng)詞break,它的主語充當(dāng)INSTR角色,賓語充當(dāng)THEME角色,象在句子The hammer broke the window.中就是這樣。 顯然,這種方法很笨重

39、,因?yàn)樗谧值渲屑尤胫黝}角色的信息 (用 ROLES特征),它可以簡化成只在字典中為那些合適的形式進(jìn)行編碼,例如,如果詞條為:see: (V VAR ?v SEM (o (a (SEES1 ?v AGENT aTHEME ?o)break: (V VAR ?v SEM (o (a (BREAKS1 ?v INSTR aTHEME ?o)這樣一個(gè)簡單的文法規(guī)則如下:(VP SEM (?semv ?semnp)(V SEM ?semv) (NP SEM ?semnp)它將覆蓋所有的情況。 考慮動(dòng)詞短語see the book,其中see的SEM特征和上面一樣,the book的SEM為,那么VP

40、的SEM特征為:( o (a (SEES1 b1 AGENT aTHEME ?o) 用變換可以簡化為(a (SEES1 b1 AGENT aTHEME ) 對于動(dòng)詞短語break the book,我們可以用上面的break的SEM特征和the book的SEM特征,利用同樣的規(guī)則產(chǎn)生簡化的邏輯形式:(a (BREAKS1 b1 INSTR aTHEME ) 在制作字典時(shí)所碰到的問題是有很多單詞,即使詞條很簡單,確定一個(gè)字典也是很困難的。就是只為最普通的意思規(guī)定語義理解規(guī)則,這樣的工作也是很煩人的,因?yàn)閷τ趧?dòng)詞的每一個(gè)補(bǔ)充結(jié)構(gòu)都要有不同的語義理解規(guī)則。例4 如果每個(gè)動(dòng)詞都要這樣重復(fù),那將是個(gè)很

41、大的負(fù)擔(dān)。幸運(yùn)的是,我們可以利用英語中動(dòng)詞的一些普遍的規(guī)律性,例如,英語中有一大類動(dòng)詞,包括大部分及物動(dòng)詞,它們都用相同的語義理解規(guī)則:其SUBCAT為_np的形式。這種類型的動(dòng)詞,如give,take,see,find,paint等等,實(shí)際上都描述某種動(dòng)作。 在分級的頂部是抽象的動(dòng)詞意思,它定義一般動(dòng)詞類,如抽象類 INTRANS-CAT定義一類的動(dòng)詞,它允許SUBCAT為 _none并且有語義理解規(guī)則: s (?PREDN *AGENT s). 其中?PREDN是一個(gè)由動(dòng)詞決定的謂詞名,除了它還須確定外,這條規(guī)則已明確地描述不及物動(dòng)詞(如run,laugh,sit等等)的語義理解。 分級字

42、典分級字典 (hierarchical lexicon)的思想是簡練地獲得動(dòng)詞的共同性質(zhì),用這種方法來組織動(dòng)詞的意思。這要依靠繼承 (inheritance)這項(xiàng)技術(shù),單詞的意思得到繼承或在分級中獲得抽象類的性質(zhì),例如一個(gè)很有用的分級詞條可以基于動(dòng)詞的SUBCAT和SEM性質(zhì)。 另外一個(gè)共同的形式是簡單的及物動(dòng)詞,包括上面所列的動(dòng)詞,這種形式,TRANS-ACT則有一個(gè)SUBCAT為_np和一個(gè)SEM為o a (?PREDN *AGENT aTHEME o)。 我們可以為所有的具有共同形式的動(dòng)詞定義相似的類,然后建立分級結(jié)構(gòu),使動(dòng)詞的意思和它所能帶的形式相關(guān)聯(lián)。圖9.9所示的分級詞條為四種不同

43、的動(dòng)詞意思編碼。它和下面沒有分級的詞條等價(jià):run (作不及物動(dòng)詞,RUN1) (SUBCAT _none SEM a(RUN1 *AGENT a)run (作及物動(dòng)詞,OP1) (SUBCAT _np SEM o a (OP1 *AGENT aTHEME o)圖 9.9donate (允許及物和帶“to”的形式) (SUBCAT _np SEM o a (DONATE1 *AGENT aTHEME o) (SUBCAT _np_pp:to SEM o r a (DONATE1 *AGENT a THEME o TO-POSS r)當(dāng)然,還有:give (先前討論的所有形式)(SUBCAT _

44、np SEM o a (GIVE1 *AGENT aTHEME o)(SUBCAT _np_pp:to SEM o r a (GIVE1 *AGENT aTHEME oTO-POSS r) (SUBCAT _np_np SEM r o a (GIVE1 *AGENT aTHEME oTO-POSS r) 你也可以通過增加另一個(gè)特征SUP,這個(gè)特征將抽象類型的列表作為它的值,這個(gè)列表是成分繼承的性質(zhì),然后編寫一個(gè)程序來查找這個(gè)分級詞條,從中尋找所有相關(guān)的特征值。這樣動(dòng)詞give的詞條可能象:give:(VROOT give PREDN GIVES1 SUP (BITRANS-TO-ACT TRA

45、NS-ACT) 到現(xiàn)在為止,我們所建立的文法只能處理簡單的陳述語句,為了處理其它類型的句子,我們需要擴(kuò)展文法,增加規(guī)則來理解Wh-引導(dǎo)的條件句、倒裝句以及處理Wh-引導(dǎo)的疑問句所需要的缺口傳播缺口傳播 (gap propagation)。 你所需做的只是先用SEM特征擴(kuò)展第5章中的S規(guī)則。 這兒可能要對SEM特征和GAP特征之間的如何相互影響作一下解釋。 現(xiàn)在為了能夠進(jìn)行語義理解,我們在 gap 特征中增加 SEM 特征,使它成為 S 結(jié)構(gòu)的一部分,當(dāng)找到缺口時(shí),可以利用它。修改后的規(guī)則變?yōu)椋?S INV SEM (WH-query ?sems)(NP WH Q AGR ?a SEM ?sem

46、np) (S INV + SEM ?sems GAP (NP AGR ?a SEM ?semnp) 回憶一下,為了處理疑問句,當(dāng)時(shí)我們引入規(guī)則:(S INV ) (NP WH Q AGR ?a) (S INV + GAP (NP AGR ?a)文法9.10 給出了處理這種類型的問題所需要的規(guī)則。14. (S INV SEM (WH-query ?sems) (NP WH Q AGR ?a SEM ?semnp) (S INV + SEM ?sems GAP (NP AGR ?a SEM ?semnp)15. (S INV + GAP ?g SEM (?semaux (?semvp ?semnp

47、) (AUX AGR ?a SUBCAT ?s SEM ?semaux)(NP AGR ?a GAP ?g SEM ?sempp)(VP VFORM ?s GAP ?g SEM ?semvp)16. (NP WH Q VAR ?v SEM ) (PRO WH Q SEM ?sempro)文法9.10 處理簡單的Wh-問句的規(guī)則 相應(yīng)地,Wh-引導(dǎo)的單詞的詞條也要增加SEM特征,例如:單詞who的詞條將變?yōu)?(PRO WH Q R SEM WHO1 AGR 3s 3p) 其中謂詞 WHO1 對任何符合這個(gè)問題答案的對象為真,包括人以及其它可能的活動(dòng)物體。ExitS2 SEM (WH-QUERY(

48、SEES1 (NAME j1 “Jill”) (WH p1 WHO1) Who(NP1 SEM S1 GAP SEM ( (SEES1 (NAME j1 “Jill”) ?semnp) didJillVP1 GAP SEM ( ag (SEES1 ag ?semnp) GAP1 SEMV1 SEM SEES1see 為了說明SEM和GAP特征如何相互影響,我們可以看圖9.11,Exit這個(gè)成分可以作為規(guī)則14的開始,這樣我們需要下面的成分來完成規(guī)則:(S INV + GAP (NP AGR 3s SEM ) SEM ?sems)文法9.10(VP VFORM base GAP(NP AGR 3

49、s SEM ) SEM ?semvp) 這是一個(gè)帶有NP缺口的VP,將文法9.3中的規(guī)則3應(yīng)用于及物動(dòng)詞see,GAP特征用于填充這個(gè)缺口,變量?semnp為。 這樣新的VP的SEM特征為:(a3 (SEES1 s1 a3 ) 初始的單詞who的SEM特征剛好和句子中的合適的位置相匹配,這樣剖析就能夠完成。 文法9.10圖9.11(VP VFORM baseGAP(NP AGR 3s SEM )SEM ?semvp) 這種將在GAP中增加SEM特征的技巧可以推廣,用它可以處理第5章所討論的所有類型的疑問句。 疑問句也可以以介詞短語開頭,如 In which box did you put th

50、e book?Where did you put the book?When did he disappear? 對這些問題的語義理解依賴于 PPs是作為動(dòng)詞的子類型還是作VP的修飾語,許多這種問題可以象規(guī)則14那樣處理(規(guī)則14用于處理NP),即:(S INV SEM (WH-query ?sems) (PP WH Q PRED ?p PTYPE ?pt SEM ?sempp) (S INV+ SEM ?sems GAP(PP PRED ?p PTYPE ?pt SEM ?sempp) 為了正確地處理Wh-引導(dǎo)的條件句(如where),需要增加下面的規(guī)則:(PP PRED ?pd PTYPE

51、 ?pt SEM ?sem) (PP-WRD PRED ?pd PTYPE ?pt SEM ?sem) 作為Wh-型條件句的引導(dǎo)詞where,將有兩個(gè)詞條,每一個(gè)PRED值各一個(gè):(PP-WRD PTYPE LOC MOT PRED VAR ?v SEM )(PP PRED + VAR ?v SEM (x (AT-LOC x ) 這些規(guī)則可以擴(kuò)展現(xiàn)存的文法以便許多這樣的問題可以得到回答。 圖9.12顯示了問句Where did Jill go?的部分剖析樹。 注意到要處理以 +PRED 介詞短語開頭的疑問句依賴于第5章提到的缺口傳播問題的解決。具體地講,如果規(guī)則VP VP PP按通常的情況,只

52、是使GAP成為VP子成分的一部分,我們稱之為非詞頭(the nonlexical head)。這樣我們好象無法創(chuàng)建 一個(gè)PP缺口來修飾動(dòng)詞短語,這本來也是一個(gè)句法問題,但它的解決將推遲到語義理解的時(shí)候。圖9.12 到現(xiàn)在為止,我們已用表達(dá)式和變換來進(jìn)行語義理解,它提供一個(gè)好的框架來解釋以及好的技巧來進(jìn)行語義理解。 然而,很多系統(tǒng)不是明確的使用表達(dá)式,也不直接用特征值和變量來進(jìn)行語義理解,而基本的思想是引入新的特征,作為變量所處位置,而這個(gè)位置原來是用變換所填充。 舉個(gè)例子,將用下面的規(guī)則替代9.3中的規(guī)則1:(S SEM (?semvp ?semnp) (NP SEM ?semnp) (VP

53、SEM ?semvp) 這樣,我們要引入新的特征SUBJ,上面的規(guī)則將變成:(S SEM ?semvp) (NP SEM ?semnp) (VP SUBJ ?semnp SEM ?semvp) 主語的SEM特征被加入到VP成分作為SUBJ特征,相應(yīng)的VP的SEM式子也在適當(dāng)位置插入主語。 文法9.3中的規(guī)則3的新版本將變?yōu)椋?VP VAR ?v SUBJ ?semsubj SEM (?semv ?v ?semsubj ?semnp)(V_none SEM ?semv) (NP SEM ?semnp)文法9.3 如圖9.13所示,利用這些規(guī)則建立句子Jill saw the dog.的SEM特征

54、。與用文法9.3的分析 (圖9.5)相比較,不同表現(xiàn)在對VP的處理,在這兒SEM特征是帶有主語帶有主語的完整命題,而在以前SEM特征是一個(gè)表達(dá)式表達(dá)式,在形成S時(shí),這個(gè)表達(dá)式才應(yīng)用于主語。圖9.13圖9.5 這種方法的一個(gè)優(yōu)點(diǎn)是:我們不需要引入特定的技巧來處理語義理解,特別是,不需要變換的步驟,通過特征合一就能完成所要做的事情; 文法9.3用這種技術(shù)修改后就變成文法9.14。文法9.14文法9.3 另一個(gè)重要的優(yōu)點(diǎn)是以這種方式確定的文法具有可逆性,因此也可以用它們產(chǎn)生句子,這將在下一節(jié)中討論。 然而,并不是所有的表達(dá)式都可以用這種技術(shù)來消除,例如處理并列主語 (如 Sue and Sam sa

55、w Jack.)時(shí),動(dòng)詞短語的意思理解仍需用表達(dá)式。因?yàn)槿绻肧UBJ的變量將主語被插入到VP中,那么變量就需要用Sue和Sam的 SEMs特征來合一,而這種方法不能做到。JillsawthedogS4 SEM ( s1 (NAME j1 “Jill”) NP1 SEM (NAME j1 “Jill”) VP SUBJ (NAME j1 “Jill”) SEM ( s1 (NAME j1 “Jill”) ) VAR s1NP3 SEM VAR ev1CNP1 SEM (DOG1 d1) VAR d1圖9.13 句子Jill saw the dog的剖析樹(用SUBJ特征)Exit(S SEM

56、 ?semvp) (NP SEM ?semnp) (VP SUBJ ?semsubj SEM ?semvp) (VP VAR ?v SUBJ ?semsubj SEM (?semv ?v ?semsubj) (V_none SEM ?semv)(VP VAR ?v SUBJ ?semsubj SEM(?semv ?v ?semsubj ?semnp ) (V_np SEM ?semv) (NP SEM ?semnp)(NP VAR ?v SEM (PRO ?v ?sempro) (PRO SEM ?sempro)(NP VAR ?v SEM (NAME?v ?semname) (NAME SE

57、M ?semname)(NP VAR ?v SEM ) (ART SEM ?semart) (CNP SEM ?semcnp) (CNP VAR ?v SEM (?semn ?v) (N SEM ?semn)文法9.14 一個(gè)帶SEM特征的簡單文法Exit 9.7文法9.3(S SEM (?semvp ?semnp) (NP SEM ?semnp) (VP SEM ?semvp) (VP VAR ?v SEM ( a2 (?semv ?v a2) (V_none SEM ?semv)(VP VAR ?v SEM ( a3 (?semv ?v a3 ?semnp ) (V_np SEM ?sem

58、v) (NP SEM ?semnp) (NP WH- VAR ?v SEM (PRO ?v ?sempro) (PRO SEM ?sempro) (NP VAR ?v SEM (NAME ?v ?semname) (NAME SEM ?semname) (NP VAR ?v SEM ) (ART SEM ?semart) (CNP SEM ?semcnp) (CNP SEM ?semn ) (N SEM ?semn)Exit文法9.3 一個(gè)帶SEM特征的簡單文法文法9.14 事實(shí)上,文法9.3不具有可逆性,因?yàn)樗昧俗儞Q。 注:變換也有一個(gè)可逆操作,我們稱之為提取(lambda abstrac

59、tion),用它可以尋找匹配。 憑直覺知道,如果你有一個(gè)可用于剖析的文法,那么它應(yīng)該能夠反過來,用它來產(chǎn)生句子,即給出一個(gè)成分的SEM特征集,這樣的句子產(chǎn)生器將利用文法把這個(gè)成分分解成一系列的有合適意義的詞條成分。然而并不是所有的文法都具有可逆性。 文法9.3不具有可逆性。 假設(shè)你要產(chǎn)生一個(gè)句子,它的意思是:( s1 (NAME j1 “Jill”) ) 文法9.3只有一條S規(guī)則,如果你想將規(guī)則1中的SEM值和這個(gè)邏輯形式合一的話,那么就會(huì)失?。阂?guī)則1中形式 (?semvp ?semnp)可以和由一個(gè)一元謂詞和一個(gè)變量組成的任意命題相匹配,但所確定的邏輯形式中的代詞帶有三個(gè)變量。 問題是已經(jīng)用

60、變換改變了初始的邏輯形式,這個(gè)邏輯形式的原形為: (a ( s1 a ) (NAME j1 “Jill”) 但是問題仍存在,這兒有三個(gè)可能的提取:(e (PAST SEES1 e (NAME j1 “Jill”) )(a (PAST SEES1 s1 a )(o (PAST SEES1 s1 (NAME j1 “Jill”) o) 在規(guī)則1中沒有指出哪一條是正確的,但只有第2條可以提供正確的句子。 另一方面,象文法9.14那樣利用特征的方法是具有可逆性的。 因?yàn)樗3至巳绾螛?gòu)造邏輯形式的所必需的信息。 在很多方法中,剖析和實(shí)現(xiàn)是很類似的過程,兩者都可以看作是建立句法樹:一個(gè)剖析器是從單詞開始,試圖尋找一棵樹來說明它們,從而決定句子的邏輯形式;而一個(gè)實(shí)現(xiàn)器剛好相反。 這個(gè)分析建議我們可以修改標(biāo)準(zhǔn)的剖析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論