自然語言理解 人工智能課程 北京大學(xué)_第1頁
自然語言理解 人工智能課程 北京大學(xué)_第2頁
自然語言理解 人工智能課程 北京大學(xué)_第3頁
自然語言理解 人工智能課程 北京大學(xué)_第4頁
自然語言理解 人工智能課程 北京大學(xué)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第十一章自然語言理解教學(xué)內(nèi)容:自然語言理解的一般概念、句法和語法的自動分析原理、句子的自動理解方法和語言的自動生成等。教學(xué)重點(diǎn):句法模式匹配、語義的分析、句子的自動理解和語言的自動生成。教學(xué)難點(diǎn):轉(zhuǎn)移網(wǎng)絡(luò)、詞匯功能語法(LFG)。教學(xué)方法:課堂教學(xué)為主。注意結(jié)合學(xué)生已學(xué)的內(nèi)容,及時提問、收集學(xué)生學(xué)習(xí)的情況。并充分利用網(wǎng)絡(luò)課程中的多媒體素材來表示比較抽象的概念。教學(xué)要求:掌握句法分析方法,掌握句子的自動理解,初步了解語言的自動生成一般了解自然語言理解系統(tǒng)的應(yīng)用實(shí)例。語言及其理解的一般問題教學(xué)內(nèi)容:本小節(jié)主要討論自然語言理解的概念、發(fā)展簡史以及系統(tǒng)組成與模型等。教學(xué)重點(diǎn):語言和語言理解的概念、自然語言理解系統(tǒng)的模型。教學(xué)難點(diǎn):自然語言理解與人類智能的關(guān)系、理解自然語言的計算機(jī)系統(tǒng)的組成方式。教學(xué)方法:課堂教學(xué)為主,結(jié)合網(wǎng)絡(luò)課程中的多媒體素材來講述。教學(xué)要求:掌握語言和語言理解的概念、自然語言理解過程的四個層次;一般了解自然語言理解研究的國內(nèi)外進(jìn)展。語言與語言理解1、語言的構(gòu)成語言是人類進(jìn)行通信的自然媒介,它包括口語、書面語以及動作語(如啞語和旗語)等。語言由語句組成,每個語句又由單詞組成;組成語句和語言時,應(yīng)遵循一定的語法與語義規(guī)則。語言是音義結(jié)合的詞匯和語法體系,是實(shí)現(xiàn)思維活動的物質(zhì)形式。語言是以詞為基本單位的,詞匯又受到語法的支配才可構(gòu)成有意義的和可理解的句子,句子按一定的形式再構(gòu)成篇章等。語法是語言的組織規(guī)律。語法規(guī)則制約著如何把詞素構(gòu)成詞,詞構(gòu)成詞組和句子。語言正是在這種嚴(yán)密的制約關(guān)系中構(gòu)成的。用詞素構(gòu)成詞的規(guī)則叫構(gòu)詞規(guī)則。語法中的另一部分就是句法。句法也可分成兩部分:詞組構(gòu)造法和造句法。詞組構(gòu)造法是詞搭配成詞組的規(guī)則。造句法則是用詞或詞組造句的規(guī)則。圖11.1就是上述構(gòu)造的一個完整的圖解。圖11.1語言的構(gòu)成另一方面,語言是音義結(jié)合的,每個詞匯有其語音形式。自然語言中所涉及的音素并不多,一種語言一般只有幾十個音素。由一個發(fā)音動作所構(gòu)成的最小的語音單位就是音素。提問:構(gòu)成詞的最小的有意義的單位是什么?舉例:列舉幾個由詞素構(gòu)成詞的例子,“教師”、“teacher”等。2、語言的理解從微觀上講,語言理解是指從自然語言到機(jī)器(計算機(jī)系統(tǒng))內(nèi)部之間的一種映射。從宏觀上看,語言理解是指機(jī)器能夠執(zhí)行人類所期望的某些語言功能。這些功能包括:回答有關(guān)提問;提取材料摘要;不同詞語敘述;不同語言翻譯。對自然語言的理解卻是一個十分艱難的任務(wù)。自然語言不僅有語義、語法和語音問題,而且還存在模糊性等問題。具體地說,自然語言理解的困難是由下列3個因素引起的:目標(biāo)表示的復(fù)雜性;映射類型的多樣性;源表達(dá)中各元素間交互程度的差異性。自然語言理解是語言學(xué)、邏輯學(xué)、生理學(xué)、心理學(xué)、計算機(jī)科學(xué)和數(shù)學(xué)等相關(guān)學(xué)科發(fā)展和結(jié)合而形成的一門交叉學(xué)科;它能夠理解口頭語言或書面語言。語言理解包括下列幾個方面的內(nèi)容:能夠理解句子的正確詞序規(guī)則和概念,又能理解不含規(guī)則的句子。知道詞的確切含義、形式、詞類及構(gòu)詞法。了解詞的語義分類以及詞的多義性和歧義性。指定和不定特性及所有(隸屬)特性。問題領(lǐng)域的結(jié)構(gòu)知識和時間概念。語言的語氣信息和韻律表現(xiàn)。有關(guān)語言表達(dá)形式的文學(xué)知識。論域的背景知識。思考題:什么是語言和語言理解?自然語言理解研究的進(jìn)展隨著計算機(jī)技術(shù)和人工智能總體技術(shù)的發(fā)展,自然語言理解不斷取得進(jìn)展。機(jī)器翻譯是自然語言理解最早的研究領(lǐng)域。由于早期研究中理論和技術(shù)的局限,所開發(fā)的機(jī)譯系統(tǒng)的技術(shù)水平較低,不能滿足實(shí)際應(yīng)用的要求。到了70年代初期,對語言理解對話系統(tǒng)的研究取得進(jìn)展。伍茲(Woods)的LUNAR系統(tǒng)、威諾甘德(Winogand)的SHRDLU系統(tǒng)和香克(Schank)的MARGIE系統(tǒng)等是語言理解對話系統(tǒng)的典型實(shí)例。進(jìn)入80年代之后,自然語言理解的應(yīng)用研究廣泛開展,機(jī)器學(xué)習(xí)研究又十分活躍,并出現(xiàn)了許多具有較高水平的實(shí)用化系統(tǒng)。這些系統(tǒng)是自然語言理解研究的重要成果,表明自然語言理解在理論上和應(yīng)用上取得了突破性進(jìn)展。自然語言是表示知識最為直接的方法。因此,自然語言理解的研究也為專家系統(tǒng)的知識獲取提供了新的途徑。此外,自然語言理解的研究已促進(jìn)計算機(jī)輔助語言教學(xué)(CALI)和計算機(jī)語言設(shè)計(CLD)等的發(fā)展。自然語言理解過程的層次語言的分析和理解過程是一個層次化的過程。現(xiàn)代語言學(xué)家把這一過程分為3個層次:詞法分析、句法分析和語義分析。如果接收到的是語音流,那么在上述3個層次之前還應(yīng)當(dāng)加入一個語音分析層。雖然這種層次之間并非是完全隔離的,但是這種層次化的劃分的確有助于更好地體現(xiàn)語言本身的構(gòu)成。1、語音分析語音分析則是根據(jù)音位規(guī)則,從語音流中區(qū)分出一個個獨(dú)立的音素,再根據(jù)音位形態(tài)規(guī)則找出一個個音節(jié)及其對應(yīng)的詞素或詞。2、詞法分析詞法分析的主要目的是找出詞匯的各個詞素,從中獲得語言學(xué)信息。3、句法分析句法分析是對句子和短語的結(jié)構(gòu)進(jìn)行分析。自動句法分析的方法很多,有短語結(jié)構(gòu)語法、格語法、擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)、功能語法等等。句法分析的最大單位就是一個句子。分析的目的就是找出詞、短語等的相互關(guān)系以及各自在句子中的作用等,并以一種層次結(jié)構(gòu)來加以表達(dá)。4、語義分析語義分析就是通過分析找出詞義、結(jié)構(gòu)意義及其結(jié)合意義,從而確定語言所表達(dá)的真正含義或概念。在語言自動理解中,語義愈來愈成為一個重要的研究內(nèi)容。思考題:自然語言理解過程有哪些層次,各層次的功能如何?句法和語義的自動分析教學(xué)內(nèi)容:本小節(jié)主要討論句法和語義的自動分析問題。它們是理解自然語言的基礎(chǔ)。教學(xué)重點(diǎn):句法分析的方法和語義分析的步驟。教學(xué)難點(diǎn):轉(zhuǎn)移網(wǎng)絡(luò)的實(shí)現(xiàn)、詞匯功能語法(LFG)的理解。教學(xué)方法:課堂教學(xué)為主,結(jié)合網(wǎng)絡(luò)課程中的多媒體素材來講述。教學(xué)要求:重點(diǎn)掌握句法分析的方法和語義分析的步驟,了解轉(zhuǎn)移網(wǎng)絡(luò)的概念和用LFG語法對句子進(jìn)行分析的過程。11.2.1句法模式匹配和轉(zhuǎn)移網(wǎng)絡(luò)1、用轉(zhuǎn)移網(wǎng)絡(luò)表示句法模式句法模式匹配就是采用句法模式來對語言的句子進(jìn)行匹配從而進(jìn)行句法分析。但是自然語言是非常多樣化的,因而需要有許多模式。這些模式可用狀態(tài)轉(zhuǎn)移圖來表示,這種用狀態(tài)轉(zhuǎn)移圖來表示的表達(dá)方式稱之為轉(zhuǎn)移網(wǎng)絡(luò)(TN,transitionnetwork)。如圖11.2所示,圖中,q,q,…,q是狀態(tài),q是初態(tài),0 1 T 0q是終態(tài)。弧上給出了狀態(tài)轉(zhuǎn)移的條件以及轉(zhuǎn)移的方向。該網(wǎng)絡(luò)可用于分析句子T也可用于生成句子。圖11.2轉(zhuǎn)移網(wǎng)絡(luò)(TN)用TN來識別句子Thelittleorangeducksswallowflies的過程如表11.1。表11.1句子識別過程詞當(dāng)前狀態(tài)新狀態(tài)theablittlebborangebbducksbcswallowceflieseF(識別)這里忽略了詞法分析,網(wǎng)絡(luò)如圖11.3所示圖11.3轉(zhuǎn)移網(wǎng)絡(luò)實(shí)例2、網(wǎng)絡(luò)識別算法識別過程到達(dá)f狀態(tài)(終態(tài)),所以該句子被成功地識別了。分析結(jié)果如圖11.4所示。從上述過程中可以看出,這個句子還可以在網(wǎng)絡(luò)中走其他弧,如詞ducks也可以走弧空一 /,但接下來的swallow就找不到合適的弧了。此時對應(yīng)于這個路徑,該句子就被拒識了。由此看出,網(wǎng)絡(luò)識別的過程中應(yīng)找出各種可能的路徑,因此算法要采用并行或回溯機(jī)制。圖11.4TN分析樹(1)并行算法關(guān)鍵是在任何一個狀態(tài)都要選擇所有可以到達(dá)下一個狀態(tài)的弧,同時進(jìn)行試驗。(2)回溯算法在所有可以通過的弧中選出一條往下走,并保留其他的可能性,以便必要時可回過來選擇之。思考題:畫出下列上下文無關(guān)語法所對應(yīng)的轉(zhuǎn)移網(wǎng)絡(luò):S—NPVPNP—AdjectiveNounNP—DeterminerNounPPNP—DeterminerNounVP—VerbAdverbNPVP—VerbVP—VerbAdverbVP—VerbPPPP—PropositionNP擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)1、擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)的構(gòu)成擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)ATN是由伍茲(Woods)在1970年提出的。ATN是由一組網(wǎng)絡(luò)所構(gòu)成的,每個網(wǎng)絡(luò)都有一個網(wǎng)絡(luò)名,每條弧上的條件擴(kuò)展為條件加上操作。這種條件和操作采用寄存器的方法來實(shí)現(xiàn),在分析樹的各個成分結(jié)構(gòu)上都放上寄存器,用來存放句法功能和句法特征,條件和操作將對它們不斷地進(jìn)行訪問和設(shè)置。ATN的每個寄存器由兩部分構(gòu)成:句法特征寄存器和句法功能寄存器。在特征寄存器中,每一維特征都有一個特征名和一組特征值,以及一個缺省值來表示。功能寄存器則反映了句法成分之間的關(guān)系和功能。分析樹的每個節(jié)點(diǎn)都有一個寄存器,寄存器的上半部分是特征寄存器,下半部分是功能寄存器。圖11.5所示是一個簡單的名詞短語(NP)的擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò),網(wǎng)絡(luò)中弧上的條件和操作如下:圖11.5名詞短語(NP)的擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)2、擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)示例該網(wǎng)絡(luò)主要是用來檢查NP中的數(shù)的一致值問題。圖11.6是一個句子的ATN,主要用來識別主、被動態(tài)的句子,從中可以看到功能寄存器的應(yīng)用。圖11.6句子的擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)網(wǎng)絡(luò)描述如下:S—1:A:Subject—?/FONT>*.A:Main-Verb—?/FONT>*.S—3:A:Main-Verb—?/FONT>*.S—3:C:Main-Verb.Type=Be,Do,HaveorModalA:Auxs〈二Main-Verb,Main-VerbJ?/FONT>*.S-4:D:*.Form=Past-partandMain-Verb.Type=BeA:Voice~?/FONT>Passive,Auxs〈二Main-Verb,Main-Verb—?/FONT>*.Direct-Obj—?/FONT>Subject,SubjectJ?/FONT>dummy-NP.S-5:A:Direct-Obj—?/FONT>*.S-6:A:Modifiers<=*.S-7:C:Voice=PassiveandSubject=dummy-NPand*.Prep=“by”.A:Subject~?/FONT>*.Prep-Object.S-8:也一 NoConditions,actionsorinitializations.當(dāng)然作為一完整的ATN是相當(dāng)復(fù)雜的,在實(shí)現(xiàn)過程中還必須解決許多問題,如非確定性分析、弧的順序、非直接支配關(guān)系的處理等等。ATN方法在自然語言理解的研究中得到了廣泛的應(yīng)用。詞匯功能語法1、詞匯功能語法的結(jié)構(gòu)詞匯功能語法(LFG)是由卡普蘭和布魯斯南(Bresnan)在1982年提出的,它是一種功能語法,但是更加強(qiáng)調(diào)詞匯的作用。LFG用一種結(jié)構(gòu)來表達(dá)特征、功能、詞匯和成分的順序。LFG對句子的描述分為兩部分:直接成分結(jié)構(gòu)(ConstituentStructure,簡稱C-Strueture)和功能結(jié)構(gòu)(FunctionalStructure,簡稱F-strueture),C-strueture是由上下文無關(guān)語法產(chǎn)生的表層分析結(jié)果。在此基礎(chǔ)上經(jīng)一系列代數(shù)變換產(chǎn)生F-strueture。LFG采用兩種規(guī)則:加入下標(biāo)的上下文無關(guān)語法規(guī)則和詞匯規(guī)則。表11.2給出了一些詞匯功能語法的規(guī)則和詞條。表11.2LFG語法與詞典S—NPVP(tSubject)二\t=\NP—DeterminerNounVP—VerbNPNPt=((tObject)二\(tObject-2)=\Lexicalentries:ADeterminer(tDefiniteness)=Indefinite(tNumber)二SingularbabyNoun(tNumber)二Singular(tPredicate)二‘Baby'girlNoun(tNumber)二Singular(tPredicate)二‘Girl'handedVerb(tTense)二Past(tPredicate)二HandV(tSubject),(tObject),(tObject 2)〉2、詞匯功能語法對句子的分析過程用LFG語法對句子進(jìn)行分析的過程如下:用上下文無關(guān)語法分析獲得C-strueture,不考慮語法中的下標(biāo);該C-strueture就是一棵直接成分樹;將各個非葉節(jié)點(diǎn)定義為變量,根據(jù)詞匯規(guī)則和語法規(guī)則中的下標(biāo),建立功能描述(一組方程式);對方程式作代數(shù)變換,求出各個變量,獲得功能結(jié)構(gòu)F-strueture。建立句法結(jié)構(gòu)只是語言理解模型中的一個步驟,進(jìn)一步則要求獲得語言所表達(dá)的意義。第一步是要確定每個詞在句子中所表達(dá)的詞義,這涉及到詞義和句法結(jié)構(gòu)上的歧義問題;第二步是要根據(jù)已有的背景知識來確定語義。邏輯形式表達(dá)是一種框架式的結(jié)構(gòu),它表達(dá)一個特定形式的事例及其一系列附加的事實(shí),如“JackkissedJill”,可以用如下邏輯形式來表達(dá):(PASTS1KISS-ACTION[AGENT(NAMEj1PERSON“Jack”)][THEMENAME(NAMEj2PERSON“Jill”)])它表達(dá)了一個過去的事例SI。PAST是一個操作符,表示結(jié)構(gòu)的類型是過去的,S1是事例的名,KISS-ACTION是事例的形式,AGENT和THEME是對象的描述,有施事和主位。舉例;已知“張經(jīng)理開車去了商店”,要回答“張經(jīng)理是否坐進(jìn)汽車?”句子的自動理解教學(xué)內(nèi)容:本小節(jié)主要討論簡單句和復(fù)合句的理解。教學(xué)重點(diǎn):簡單句的理解方法。教學(xué)難點(diǎn):復(fù)合句的理解方法。教學(xué)方法:課堂教學(xué)為主,結(jié)合網(wǎng)絡(luò)課程中的多媒體素材來講述教學(xué)要求:重點(diǎn)掌握簡單句的理解方法,了解復(fù)合句的理解方法11.3.1簡單句的理解方法1、簡單句理解的內(nèi)容由于簡單句是可以獨(dú)立存在的,因而為了理解一個簡單句,即建立起一個和該簡單句相對應(yīng)的機(jī)內(nèi)表達(dá),需要做以下兩方面的工作:理解語句中的每一個詞。以這些詞為基礎(chǔ)組成一個可以表達(dá)整個語句意義的結(jié)構(gòu)。常常將這項工作分成以下3個部分來進(jìn)行:句法分析將單詞之間的線性次序變換成一個顯示單詞如何與其它單詞相關(guān)聯(lián)的結(jié)構(gòu)。語義分析各種意義被賦于由句法分析程序所建立的結(jié)構(gòu),即在句法結(jié)構(gòu)和任務(wù)領(lǐng)域內(nèi)對象之間進(jìn)行映射變換。語用分析為確定真正含義,對表達(dá)的結(jié)構(gòu)重新加以解釋。思考:考慮下列句子Theoldman'sglasseswerefilledwithsherry.選擇單詞glasses合適的意思需要什么信息?什么信息意味著不合適的意思?2、簡單句理解方法關(guān)鍵字匹配法關(guān)鍵字匹配法是最簡單的自然語言理解方法。該方法簡單歸納起來為:在程序中規(guī)定匹配和動作兩種類型的樣本。然后建立一種由匹配樣本到動作樣本的映射。當(dāng)輸入語句與匹配樣本相匹配時,就去執(zhí)行相應(yīng)樣本所規(guī)定的動作,這樣從外表看來似乎機(jī)器真正實(shí)現(xiàn)了能理解用戶問話的目的。(2) 句法分析樹法關(guān)于文法的形式,在許多自然語言處理程序中提出過很多各不相同的定義,作為一個例子,下面我們給出一種文法的形式化定義。文法G在其形式上為如下的四元組:G=(V,工,P,S)其中,V為有窮非空集,稱作總詞匯表;工為V的一個非空子集,稱作終結(jié)字母表,而N二V-工稱作非終結(jié)字母表;P為如下形式的有窮產(chǎn)生式集:a—B式中,aUV*NV*,BUV*,*表示它前面的字符可以重復(fù)出現(xiàn)任意次;S為非終結(jié)字母表的一個元素,稱為起始符。圖11.7是使用該文法對語句:Joehittheball.進(jìn)行句法分析而建立的文法分析樹。示例:一個英語子集的簡單文法:S—NPVPNP—theNP1NP—NP1ADJS—ulADJADJSVP—VVP—VNPN—JoeIboyIballADJ—littleIdigV—hitIran其中,大寫的是非終結(jié)符,而小寫的是終結(jié)符,丘表示空字符串。圖11.7文法分析樹示例(3) 語義分析只是根據(jù)詞性信息來分析一個語句文法結(jié)構(gòu),是不能保證其正確性的,這是因為有些句子的文法結(jié)構(gòu),需要借助于詞義信息來確定,也就是要進(jìn)行語義分析進(jìn)行語義分析的一種簡單方法是使用語義文法。所謂語義文法,是在傳統(tǒng)的短語結(jié)構(gòu)文法的基礎(chǔ)上,將N(名詞)、V(動詞)等語法類別的概念,用所討論領(lǐng)域的專門類別來代替。思考:對下列每個語句給出句法分析樹:DavidwantedtogotothemoviewithLinda.DavidwantedtogotothemoviewithGeorgyWilliam.Heheardthestorylisteningtotheradio.Heheardtheboyslisteningtotheradio.11.3.2復(fù)合句的理解方法1、復(fù)合句理解的復(fù)雜性正像上述介紹的,簡單句的理解不涉及句與句之間的關(guān)系,它的理解過程是首先賦單詞以意義,然后再給整個語句賦以一種結(jié)構(gòu)。而一組語句的理解,無論它是一個文章選段還是一段對話節(jié)錄,均要求發(fā)現(xiàn)句子之間的相互關(guān)系。在特定的文章中,這些關(guān)系的發(fā)現(xiàn),對于理解起著十分重要的作用。這種關(guān)系包括以下幾種:相同的事物事物的一部分行動的一部分與行動有關(guān)的事物因果關(guān)系計劃次序要能做到理解這些復(fù)雜的關(guān)系,必須具有相當(dāng)廣泛領(lǐng)域的知識才行,也就是要依賴于大型的知識庫,而且知識庫的組織形式對能否正確理解這些關(guān)系,起著很重要的作用。如果知識庫的容量較大,則有一點(diǎn)是比較重要的,即如何將問題的焦點(diǎn)集中于知識庫的相關(guān)部分。第二章介紹的一些知識表示方法,如語義網(wǎng)絡(luò)和劇本等將有助于這項工作的進(jìn)行。2、分區(qū)語義網(wǎng)絡(luò)圖11.8所示的分區(qū)語義網(wǎng)絡(luò)具有4個分區(qū):S分區(qū)含有一些一般的概念,如0美元、兌換和螺栓等;S分區(qū)含有與購買螺栓有關(guān)的特殊實(shí)體;S分區(qū)含有與把水12泵固定在工作臺上這一操作有關(guān)的特殊實(shí)體;S分區(qū)含有與同一固定操作有關(guān)的3特殊實(shí)體等。運(yùn)用分區(qū)語義網(wǎng)絡(luò),利用其分區(qū)在某些層次上的關(guān)聯(lián),可以較好地處理集中焦點(diǎn)的問題。當(dāng)某一分區(qū)為焦點(diǎn)時,則某高層分區(qū)內(nèi)的元素即變?yōu)榭捎^察的了。對于上例,當(dāng)?shù)诙浔焕斫鈺r,因其講的是“將水泵固定在工作臺上”這一事件,因而圖11.8分區(qū)語義網(wǎng)絡(luò)示例焦點(diǎn)處于S分區(qū)。由于S分區(qū)的層次高20于S分區(qū),所以S分區(qū)是可以觀察的。當(dāng)理解第二句時,顯然“螺栓”不能與S202分區(qū)的任何元素匹配,因而焦點(diǎn)區(qū)由S變成更低一級的S分區(qū),并且使得“螺栓”23與B匹配,匹配的結(jié)果使得第二句中的“螺栓”必定是第一句中用來進(jìn)行固定的1螺栓,從而使得前后兩個句子成為一個前后連貫的文章片斷。圖11.8分區(qū)語義網(wǎng)絡(luò)示例舉例:我們來看一下如下的文章片段:接著,把水泵固定到工作臺上。螺栓就放在小塑料袋中。”第二句中的螺栓,應(yīng)該理解為是用來固定水泵的螺栓。因此,如果在理解第全句時,就把需用的螺栓置于“焦點(diǎn)”之中,則全句的理解就不成什么問題了。為此,我們需要表示出和“固定”有關(guān)的知識,以便當(dāng)見到“固定”時,能方便地提取出來。圖11.8給出的是一個和固定水泵有關(guān)的分區(qū)語義網(wǎng)絡(luò)。所謂分區(qū)語義網(wǎng)絡(luò),就是將語義網(wǎng)絡(luò)中的有關(guān)弧和節(jié)點(diǎn)集中起來,組成一個分區(qū)。語言的自動生成教學(xué)內(nèi)容:本小節(jié)主要探討語言的自動生成問題。教學(xué)重點(diǎn):語言生成的定義和內(nèi)容。教學(xué)難點(diǎn):如何把要交流的信息表示為機(jī)器內(nèi)部的一種結(jié)構(gòu)。教學(xué)方法:課堂教學(xué)為主,結(jié)合網(wǎng)絡(luò)課程中的多媒體素材來講述。教學(xué)要求:重點(diǎn)掌握語言生成的過程和處理方法,了解語言生成過程中可能遇到的難題。語言生成就是把在計算機(jī)內(nèi)部以某種形式存放的需要交流的信息,以自然語言的形式表達(dá)出來。它是自然語言理解的一個逆過程。一般包括以下兩部分:建立一種結(jié)構(gòu),以表達(dá)出需要交流的信息。以適當(dāng)?shù)脑~匯和一定的句法規(guī)則,把要交流的信息以句子形式表達(dá)出來。同自然語言理解一樣,語言生成的處理方法有很多種,這不僅由于它們所采用的內(nèi)部表達(dá)結(jié)構(gòu)不同(如采用語義網(wǎng)絡(luò)或者概念從屬等),而且由于語言生成的

目的不同(如有的目的是為了對輸入文章作摘要,有的是為了作為問題回答系統(tǒng)的人-機(jī)界面等)。語言生成也有許多難點(diǎn),特別是第一部分,顯得更加困難一些。有時,要交流的信息由問題回答系統(tǒng)在回答問題時加以估計。在這些系統(tǒng)中,信息的生成過程要受到回答問題的約束。在語言生成系統(tǒng)中遇到的許多問題與在自然語言理解系統(tǒng)中所遇到的問題是一樣的。其處理方法,也可以使用在自然語言理解中所使用的各種方法。思考:自然語言理解和語言自動生成的關(guān)系為何?研究這兩者時有什么共同點(diǎn)。11.5自然語言理解系統(tǒng)應(yīng)用舉例11.5自然語言理解系統(tǒng)應(yīng)用舉例教學(xué)內(nèi)容:本小節(jié)主要介紹2個與自然語言理解有關(guān)的應(yīng)用實(shí)例。教學(xué)重點(diǎn):自然語言自動理解系統(tǒng)的功能和作用。教學(xué)難點(diǎn):自然語言問答系統(tǒng)的實(shí)現(xiàn)。教學(xué)方法:課堂教學(xué)為主,結(jié)合網(wǎng)絡(luò)課程中的多媒體素材來講述。教學(xué)要求:重點(diǎn)掌握自然語言自動理解系統(tǒng),了解自然語言問答系統(tǒng)11.5.1自然語言自動理解系統(tǒng)自然語言情報檢索系統(tǒng)LUNARLUNAR系統(tǒng)是由伍茲于1972年研制成功的一個自然語言情報檢索系統(tǒng),具有語義分析能力,用于幫助地質(zhì)學(xué)家比較從月球衛(wèi)星Apollo-11上得到的月球巖石和土壤組成的化學(xué)成分?jǐn)?shù)據(jù)。這個系統(tǒng)具有一定的實(shí)用性,為地質(zhì)學(xué)家們提供了一個有用的工具,也顯示了自然語言理解系統(tǒng)對科學(xué)和生產(chǎn)的積極作用。LUNAR系統(tǒng)的工作過程

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論