第11章自然語(yǔ)言理解_第1頁(yè)
第11章自然語(yǔ)言理解_第2頁(yè)
第11章自然語(yǔ)言理解_第3頁(yè)
第11章自然語(yǔ)言理解_第4頁(yè)
第11章自然語(yǔ)言理解_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 11 章 自然語(yǔ)言理解 第 11 章 自然語(yǔ)言理解 11.1 簡(jiǎn)單句理解簡(jiǎn)單句理解 11.2 復(fù)合句理解復(fù)合句理解11.3 轉(zhuǎn)換文法和轉(zhuǎn)換網(wǎng)絡(luò)轉(zhuǎn)換文法和轉(zhuǎn)換網(wǎng)絡(luò)第 11 章 自然語(yǔ)言理解 11.1.1 理解的實(shí)現(xiàn)過(guò)程理解的實(shí)現(xiàn)過(guò)程 10.1.1 理解的實(shí)現(xiàn)過(guò)程理解的實(shí)現(xiàn)過(guò)程 要理解一個(gè)語(yǔ)句,需建立起一個(gè)和該簡(jiǎn)單句相對(duì)應(yīng)的機(jī)內(nèi)表達(dá)。而要建立機(jī)內(nèi)表達(dá),需要做以下兩方面的工作: (1)理解語(yǔ)句中的每一個(gè)詞。 (2)以這些詞為基礎(chǔ)組成一個(gè)可以表達(dá)整個(gè)語(yǔ)句意義的結(jié)構(gòu)。第 11 章 自然語(yǔ)言理解 第一項(xiàng)工作看起來(lái)很容易, 似乎只是查一下字典就可以解決。 而實(shí)際上由于許多單詞有不止一種含義, 因而只由單

2、詞本身不能確定其在句中的確切含義, 需要通過(guò)語(yǔ)法分析, 并根據(jù)上下文關(guān)系才能最終確定, 例如, 單詞diamond有“菱形”、“棒球場(chǎng)”和“鉆石”三種意思, 在語(yǔ)句John saw Susans diamond shimmering from across the room.中, 由于“shimmering”的出現(xiàn), 則顯然“diamond”是“鉆石”的含義, 因?yàn)椤傲庑巍焙汀鞍羟驁?chǎng)”都不會(huì)閃光。 再如在語(yǔ)句 Ill meet you at the diamond. 第 11 章 自然語(yǔ)言理解 中, 由于“at”后面需要一個(gè)時(shí)間或地點(diǎn)名詞作為它的賓語(yǔ), 顯然這里的“ diamond”是“棒球場(chǎng)

3、”的含義, 而不能是其他含義。 第二項(xiàng)也是一個(gè)比較困難的工作。因?yàn)橐赃@些單詞為基礎(chǔ)來(lái)構(gòu)成表示一個(gè)句子意義的結(jié)構(gòu), 需要依賴各種信息源, 其中包括所用語(yǔ)言的知識(shí)、 語(yǔ)句所涉及領(lǐng)域的知識(shí)以及有關(guān)該語(yǔ)言使用者應(yīng)共同遵守的習(xí)慣用法的知識(shí)。由于這個(gè)解釋過(guò)程涉及到許多事情, 因而常常將這項(xiàng)工作分成以下三個(gè)部分來(lái)進(jìn)行: 第 11 章 自然語(yǔ)言理解 (1) 語(yǔ)法分析。 將單詞之間的線性次序變換成一個(gè)顯示單詞如何與其他單詞相關(guān)聯(lián)的結(jié)構(gòu)。語(yǔ)法分析確定語(yǔ)句是否合乎語(yǔ)法, 因?yàn)橐粋€(gè)不合語(yǔ)法的語(yǔ)句就更難理解。 (2) 語(yǔ)義分析。各種意義被賦予由語(yǔ)法分析程序所建立的結(jié)構(gòu), 即在語(yǔ)法結(jié)構(gòu)和任務(wù)領(lǐng)域內(nèi)對(duì)象之間進(jìn)行映射變換。

4、 (3) 語(yǔ)用分析。 為確定真正含義, 對(duì)表達(dá)的結(jié)構(gòu)重新加以解釋。 第 11 章 自然語(yǔ)言理解 11.1.2 11.1.2 語(yǔ)法分析語(yǔ)法分析 要進(jìn)行語(yǔ)法分析, 必須首先給出該語(yǔ)言的文法規(guī)則, 以便為語(yǔ)法分析提供一個(gè)準(zhǔn)則和依據(jù)。 對(duì)于自然語(yǔ)言人們已提出了許多種文法, 例如, 喬姆斯基(Chomsky)提出的上下文無(wú)關(guān)文法就是一種常用的文法。 一個(gè)語(yǔ)言的文法一般用一組文法規(guī)則(稱為產(chǎn)生式或重寫規(guī)則)以及非終結(jié)符與終結(jié)符來(lái)定義和描述。例如, 下面就是一個(gè)英語(yǔ)子集的上下文無(wú)關(guān)文法: 第 11 章 自然語(yǔ)言理解 11.1.2 11.1.2 語(yǔ)法分析語(yǔ)法分析 要進(jìn)行語(yǔ)法分析, 必須首先給出該語(yǔ)言的文法規(guī)則

5、, 以便為語(yǔ)法分析提供一個(gè)準(zhǔn)則和依據(jù)。對(duì)于自然語(yǔ)言人們已提出了許多種文法, 例如, 喬姆斯基(Chomsky)提出的上下文無(wú)關(guān)文法就是一種常用的文法。 一個(gè)語(yǔ)言的文法一般用一組文法規(guī)則(稱為產(chǎn)生式或重寫規(guī)則)以及非終結(jié)符與終結(jié)符來(lái)定義和描述。 例如, 下面就是一個(gè)英語(yǔ)子集的上下文無(wú)關(guān)文法: 第 11 章 自然語(yǔ)言理解 sentence=nounphraseverbphrasenounphrase=determinernounverbphrase=verbnounphrase|verbdeterminer=the|a|announ=man|student|apple|computerverb=e

6、ats|operats 這個(gè)文法有6條文法規(guī)則, 它們是用BNF范式表示的。其中帶尖括號(hào)的項(xiàng)為非終結(jié)符,第一個(gè)非終結(jié)符稱為起始符, 不帶尖括號(hào)的項(xiàng)為終結(jié)符, 符號(hào)“= ”的意思是“定義為”, 符號(hào)“|”是“或者”的意思, 而不帶“|”的項(xiàng)之間是“與”關(guān)系。 符號(hào)“=”也可以用箭頭“”表示。 第 11 章 自然語(yǔ)言理解 有了文法規(guī)則, 對(duì)于一個(gè)給定的句子, 就可以進(jìn)行語(yǔ)法分析, 即根據(jù)文法規(guī)則來(lái)判斷其是否合乎語(yǔ)法。可以看出, 上面的文法規(guī)則實(shí)際是非終結(jié)符的分解、變換規(guī)則。分解、變換從起始符開(kāi)始, 到終結(jié)符結(jié)束。所以,全體文法規(guī)則就構(gòu)成一棵如圖 111所示的與或樹(shù), 我們稱其為文法樹(shù)。所以, 對(duì)一

7、個(gè)語(yǔ)句進(jìn)行語(yǔ)法分析的過(guò)程也就是在這個(gè)與或樹(shù)上搜索解樹(shù)的過(guò)程。 可以看出, 搜索解樹(shù)可以自頂向下進(jìn)行, 也可以自底向上進(jìn)行。自頂向下搜索就是從起始符sentence出發(fā), 推導(dǎo)所給的句子; 自底向上搜索就是從所給的句子出發(fā), 推導(dǎo)起始符sentence。 第 11 章 自然語(yǔ)言理解 圖 11-1 文法樹(shù) 第 11 章 自然語(yǔ)言理解 例例11.111.1下面是一個(gè)基于上述文法的語(yǔ)法分析程序。 它采用自頂向下搜索。 sentence(X):append(Y, Z, X), noun_phrase(Y), verb_phrase(Z).noun_phrase(X):append(Y, Z, X), d

8、eterminer(Y), noun(Z).verb_phrase(X):append(Y, Z, X), verb(Y), noun_phrase(Z).verb_phrase(X):verb(X).determiner(the).noun(H|_): member(H, man, student, apple, banana, computer).verb(H|_):member(H, eats, study, programming, operats). append(, L, L).append(H|T, L, H|L2): append(T, L, L2). member(X, X|

9、_).member(X, _|T): member(X, T). 第 11 章 自然語(yǔ)言理解 這個(gè)程序是先把所給的句子以符號(hào)表的形式約束給謂詞sentence的變量X,然后對(duì)其進(jìn)行分解和變換。如果最終分解、 變換的結(jié)果與語(yǔ)言的文法樹(shù)相符, 則證明所給的句子語(yǔ)法正確; 否則語(yǔ)法錯(cuò)誤。 例如, 對(duì)于句子 the student operats the computer要用該程序進(jìn)行語(yǔ)法分析, 則應(yīng)給出詢問(wèn): ?-sentence(the, student, operats, the, computer).這時(shí), 系統(tǒng)則回答: yes 分析這個(gè)句子所產(chǎn)生的解樹(shù)如圖 11-2所示。 這個(gè)解樹(shù)稱為該句子

10、的語(yǔ)法分析樹(shù)。 第 11 章 自然語(yǔ)言理解 圖 11-2 語(yǔ)法分析樹(shù) 第 11 章 自然語(yǔ)言理解 需指出的是, 這個(gè)程序雖然易于理解, 但運(yùn)行效率較低。 因?yàn)樵谟胊ppend謂詞對(duì)句子進(jìn)行分解時(shí)一般要進(jìn)行多次回溯。 為此, 我們把這個(gè)程序修改為如下形式: sentence(X, Y): noun_phrase(X, Z), verb_phrase(Z, Y).noun_phrase(X, Y): determiner(X, Z), noun(Z, Y).verb_phrase(X, Y): verb(X, Z), noun_phrase(Z, Y).verb_phrase(X, Y): ver

11、b(X, Y).determiner(the|T, T).noun(H|T, T): member(H, man, student, apple, computer).verb(H|T, T): member(H, eats, operats). 第 11 章 自然語(yǔ)言理解 這個(gè)程序的每個(gè)謂詞有兩個(gè)參量, 它們都是符號(hào)表。對(duì)于一個(gè)給定的句子, 后一個(gè)表是前一個(gè)表的余表。語(yǔ)法分析時(shí), 把所給的句子以符號(hào)表的形式約束給sentence 的第一個(gè)變量X, 第二個(gè)變量約束為空表。如 ?-sentence(the,student,operats,the,computer, ).則系統(tǒng)仍然回答: yes

12、這個(gè)程序雖然難讀, 但它的運(yùn)行效率較高。 語(yǔ)法分析可判斷一個(gè)句子的語(yǔ)法結(jié)構(gòu)是否正確, 但不能判斷一個(gè)句子是否有意義。例如把上面詢問(wèn)中的例句改為?-sentence(the,computer,operats,the,student,).系統(tǒng)則仍然回答:yes。對(duì)于諸如此類的問(wèn)題, 語(yǔ)義分析則可解決。 第 11 章 自然語(yǔ)言理解 11.1.311.1.3語(yǔ)義分析語(yǔ)義分析 語(yǔ)義分析就是要識(shí)別一個(gè)語(yǔ)句所表達(dá)的意思。語(yǔ)義分析的方法很多, 如運(yùn)用格文法、語(yǔ)義文法等。 語(yǔ)義文法是進(jìn)行語(yǔ)義分析的一種簡(jiǎn)單方法。所謂語(yǔ)義文法, 就是在傳統(tǒng)的短語(yǔ)結(jié)構(gòu)文法的基礎(chǔ)上, 將名詞短語(yǔ)、動(dòng)詞短語(yǔ)等不含語(yǔ)義信息的純語(yǔ)法類別,用

13、所討論領(lǐng)域的專門類別來(lái)代替。 例如, 下面就是一個(gè)語(yǔ)義文法的例子: 第 11 章 自然語(yǔ)言理解 SPRESENT the ATTRIBUTE of SHIPPRESENTwhat is|can you tell meATTRIBUTElength|classSHIPthe SHIPNAME|CLASSNAME class shipSHIPNAMEHuanghe|ChangjiangCLASSNAMEcarrier|submarine 這是一個(gè)艦船管理數(shù)據(jù)庫(kù)系統(tǒng)自然語(yǔ)言接口的語(yǔ)義文法片段。 第 11 章 自然語(yǔ)言理解 可以看出, 語(yǔ)義文法的重寫規(guī)則與上下文無(wú)關(guān)文法的形式是類似的。但這里沒(méi)有出現(xiàn)像

14、名詞短語(yǔ)和動(dòng)詞短語(yǔ)等語(yǔ)法類別,而是用了PRESENT、ATTRIBUTE、SHIP等專門領(lǐng)域中的類別。 對(duì)于語(yǔ)義文法的分析方法,可以使用與上下文無(wú)關(guān)文法相類似的方法。利用上面給出的語(yǔ)義文法, 可以從語(yǔ)義上識(shí)別如下的語(yǔ)句: What is the class of the Changjiang? Can you tell me the length of the Huanghe? 語(yǔ)義文法可以排除無(wú)意義的句子。 當(dāng)然, 它只能適應(yīng)于嚴(yán)格限制的應(yīng)用領(lǐng)域。 第 11 章 自然語(yǔ)言理解 11.2復(fù)復(fù) 合合 句句 理理 解解 簡(jiǎn)單句的理解不涉及句與句之間的關(guān)系,它的理解過(guò)程首先是賦單詞以意義, 然后再給

15、整個(gè)語(yǔ)句賦予一種結(jié)構(gòu)。而一組語(yǔ)句的理解,無(wú)論它是一個(gè)文章選段, 還是對(duì)話節(jié)錄,句子之間都有相互關(guān)系。所以,復(fù)合句的理解,就不僅要分析各個(gè)簡(jiǎn)單句,而且要找出句子之間的關(guān)系。這些關(guān)系的發(fā)現(xiàn),對(duì)于理解起著十分重要的作用。 句子之間的關(guān)系包括以下幾種: (1) 相同的事物, 例如: “小華有個(gè)計(jì)算器, 小劉想用它。”單詞“它”和“計(jì)算器”指的是同一物體。 第 11 章 自然語(yǔ)言理解 (2) 事物的一部分, 例如:“小林穿上她剛買的大衣, 發(fā)現(xiàn)掉了一個(gè)扣子。 ”“扣子”指的是“剛買的大衣”的一部分。 (3) 行動(dòng)的一部分, 例如:“王宏去北京出差, 他乘早班飛機(jī)動(dòng)身?!?乘飛機(jī)應(yīng)看成是出差的一部分。 (

16、4) 與行動(dòng)有關(guān)的事物, 例如:“李明準(zhǔn)備騎車去上學(xué), 但他騎上車子時(shí), 發(fā)現(xiàn)車胎沒(méi)氣了。 ” 李明的自行車應(yīng)理解為是與他騎車去上學(xué)這一行動(dòng)有關(guān)的事物。 第 11 章 自然語(yǔ)言理解 (5) 因果關(guān)系, 例如: “今天下雨, 所以不能上早操?!?下雨應(yīng)理解為是不能上操的原因。 (6) 計(jì)劃次序, 例如: “小張準(zhǔn)備結(jié)婚, 他決定再找一份工作干?!?小張對(duì)工作感興趣, 應(yīng)理解為是由于他要結(jié)婚, 而結(jié)婚需要錢而引起的。 第 11 章 自然語(yǔ)言理解 要能做到理解這些復(fù)雜的關(guān)系, 必須具有相當(dāng)廣泛領(lǐng)域的知識(shí)才行, 也就是要依賴于大型的知識(shí)庫(kù), 而且知識(shí)庫(kù)的組織形式對(duì)能否正確理解這些關(guān)系, 起著很重要的作

17、用。特別對(duì)于較大的知識(shí)庫(kù), 應(yīng)考慮如何將問(wèn)題的“焦點(diǎn)”集中在知識(shí)庫(kù)的相關(guān)部分。 例如,對(duì)于下面的一段話: “接著, 把虎鉗固定到工作臺(tái)上。螺栓就放在小塑料袋中。 ” 顯然, 第二句中的螺栓就是第一句中用來(lái)固定虎鉗的螺栓。 所以, 如果在理解第一句時(shí), 就把需用的螺栓置于“焦點(diǎn)”之中, 則全句的理解就容易了。因此, 需要表示出與“固定”有關(guān)的知識(shí), 以便當(dāng)見(jiàn)到“固定”時(shí), 能方便地提取出來(lái)。 第 11 章 自然語(yǔ)言理解 對(duì)于描述與行為有關(guān)的復(fù)合語(yǔ)句, 也可采用目標(biāo)結(jié)構(gòu)的方法幫助理解。 即對(duì)于常見(jiàn)的一些行為目標(biāo), 事先制定出其行動(dòng)規(guī)劃, 這樣, 當(dāng)語(yǔ)句所描述的情節(jié)中的某些信息省略時(shí), 可以調(diào)用這些

18、規(guī)劃, 通過(guò)推導(dǎo)找到問(wèn)題的答案。 例如對(duì)于下面的文章片段: “小王有點(diǎn)餓。 他便向行人打聽(tīng)餐館在哪里。 ”如果有這樣的行動(dòng)規(guī)劃: 打聽(tīng)地址去餐館吃飯不餓則就不難理解第二個(gè)句子了。 第 11 章 自然語(yǔ)言理解 11.3轉(zhuǎn)換文法和轉(zhuǎn)換網(wǎng)絡(luò)轉(zhuǎn)換文法和轉(zhuǎn)換網(wǎng)絡(luò) 11.3.111.3.1轉(zhuǎn)換文法轉(zhuǎn)換文法 人們對(duì)自然語(yǔ)言句子的結(jié)構(gòu)進(jìn)行研究, 發(fā)現(xiàn)同一個(gè)意思往往有許多不同的表示形式(說(shuō)法)。 例如語(yǔ)句: Mary read me a story.和 Mary read a story to me. 第 11 章 自然語(yǔ)言理解 說(shuō)法雖然不同, 但意思實(shí)際是完全一樣的。再如主動(dòng)句和被動(dòng)句也是常用的兩種不同的表示

19、形式。于是,人們就提出了語(yǔ)句的深層結(jié)構(gòu)和表層結(jié)構(gòu)的概念。認(rèn)為一個(gè)句子可以有多個(gè)不同的表層結(jié)構(gòu), 但其深層結(jié)構(gòu)都是相同的。鑒于這樣的認(rèn)識(shí),轉(zhuǎn)換文法(transformational grammar)便應(yīng)運(yùn)而生。 第 11 章 自然語(yǔ)言理解 轉(zhuǎn)換文法就是可把句子的一種結(jié)構(gòu)轉(zhuǎn)換為另一種結(jié)構(gòu)的文法。轉(zhuǎn)換文法是由基礎(chǔ)和轉(zhuǎn)換兩部分組成?;A(chǔ)部分是一個(gè)上下文無(wú)關(guān)文法,它產(chǎn)生句子的深層結(jié)構(gòu)表示;轉(zhuǎn)換部分是一個(gè)轉(zhuǎn)換規(guī)則(重寫規(guī)則)集, 它負(fù)責(zé)句子結(jié)構(gòu)的轉(zhuǎn)換。 轉(zhuǎn)換文法的工作過(guò)程是: 先用上下文無(wú)關(guān)文法建立相應(yīng)句子的深層結(jié)構(gòu),然后再應(yīng)用轉(zhuǎn)換規(guī)則將深層結(jié)構(gòu)轉(zhuǎn)換為符合人們習(xí)慣的表層結(jié)構(gòu)。圖 11-3給出了一條把主動(dòng)句

20、轉(zhuǎn)換為被動(dòng)句的轉(zhuǎn)換規(guī)則。 第 11 章 自然語(yǔ)言理解 圖 11-3 轉(zhuǎn)換規(guī)則 第 11 章 自然語(yǔ)言理解 轉(zhuǎn)換又可分為被動(dòng)轉(zhuǎn)換、分割轉(zhuǎn)換、疑問(wèn)轉(zhuǎn)換等等, 運(yùn)用這些轉(zhuǎn)換, 轉(zhuǎn)換文法可以將一個(gè)句子轉(zhuǎn)換為多種不同的表達(dá)形式。例如, 對(duì)于下面這個(gè)簡(jiǎn)單的主動(dòng)句: John ate the banana.運(yùn)用被動(dòng)轉(zhuǎn)換, 得到: The banana was eaten by John.運(yùn)用分割轉(zhuǎn)換, 得到: It was John who ate the banana.先進(jìn)行被動(dòng)轉(zhuǎn)換, 再進(jìn)行分割轉(zhuǎn)換, 得到: It was the banana that was eaten by John. 第 11 章 自然語(yǔ)言理解 運(yùn)用疑問(wèn)轉(zhuǎn)換, 得到: Did John eat the banana? 轉(zhuǎn)換也可以將語(yǔ)句的表層結(jié)構(gòu)逆轉(zhuǎn)換為其深層結(jié)構(gòu)。這樣, 我們可以將一組不同形式的相關(guān)語(yǔ)句, 通過(guò)一個(gè)轉(zhuǎn)換序列而映射為一個(gè)單一的句子。例如把上述各種其他形式的語(yǔ)句轉(zhuǎn)換為一個(gè)主動(dòng)句。這顯然對(duì)于自然語(yǔ)言理解和機(jī)器翻譯有重要作用。 第 11 章 自然語(yǔ)言理解 11.3.211.3.2轉(zhuǎn)換網(wǎng)絡(luò)轉(zhuǎn)換網(wǎng)絡(luò) 轉(zhuǎn)換網(wǎng)絡(luò)(Transition Network)全稱為狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)。 它是一種由節(jié)點(diǎn)和有向邊(弧)組成的有向圖

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論