下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、國內(nèi)外隱喻知識庫建設(shè)綜述 摘 要:就國外的幾個隱喻知識庫,包括Master Metaphor List、Sense?frame、MetaBank、Metalude、Hamburg Metaphor Database、ATT?Meta以及國內(nèi)的隱喻句庫的建設(shè)進行綜述,并對上述隱喻知識庫作了簡單評述。最后提出了一種建立面向計算的大規(guī)模漢語隱喻知識庫構(gòu)建的設(shè)想。?關(guān)鍵詞:隱喻; 知識庫; 自然語言理解?中圖分類號:TP391 文獻標(biāo)志碼:A 文章編號:1001-3695(2008)09-2561-05?Introduction of metaphor c
2、orpus?ZHANG Xiaojun1,2a,QU Weiguang2b,3?(1.School of Foreign Language, Shaanxi Normal University, Xian 710062, China;2a.School of Art & Literature, b.School of Mathematics & Computer, Nanjing Normal University, Nanjing 210097, China;3.Institute of Computational Linguistics, Peking University
3、, Beijing 100081, China)?Abstract:This paper introduced and reviewed six foreign language databases,it included Master Metaphor List,Sense?frame,MetaBank,Metalude,Hamburg Metaphor Database,ATT?Meta and one Chinese metaphor database. Finally, it designed a large?scale Chinese metaphor knowledge datab
4、ase oriented to computation.?Key words:metaphor; knowledge database; natural language understanding0 引言 ?隱喻理解的計算模型離不開隱喻知識庫。這是由隱喻的認(rèn)知性決定的。隱喻涉及本體概念與喻體概念之間的對比,因此隱喻計算模型的前提是要求系統(tǒng)具有概念描述和推理能力1。隨著自然語言理解從字面義(literal meaning)到非字面義(non?literal meaning)研究的轉(zhuǎn)變,隱喻作為非字面義的典型,越來越受到計算語言學(xué)家、認(rèn)知語言學(xué)家和心理學(xué)家的重視,隱喻計算也成為自然語言處理的一個
5、熱點問題。國內(nèi)對隱喻計算的研究越來越深入,主要集中在對隱喻計算的模型方法的介紹和研究上2,3,但對隱喻知識庫建設(shè)的討論不夠深刻。目前,應(yīng)用于隱喻計算的模型方法主要有以下四種:?a)基于優(yōu)先語義的方法。這種方法認(rèn)為理解隱喻義的方法不同于理解正常字面義的方法,突出語義知識的描寫而不強調(diào)隱喻知識在隱喻理解中的應(yīng)用。當(dāng)句子中字面意義出現(xiàn)沖突(即選擇限制發(fā)生沖突)時,就需要進行隱喻處理。比較有代表性的系統(tǒng)有Fass4提出的可以處理隱喻、轉(zhuǎn)喻、字面義反常表達的隱喻理解模型Met5系統(tǒng)。?b)基于知識表示的方法。與基于優(yōu)先語義的方法不同,該方法強調(diào)隱喻知識的表示以及隱喻知識在隱喻理解中的作用。其包括隱喻突顯
6、理論5,6和基于實例的模型,如Martin7設(shè)計的用來解釋常規(guī)隱喻和識別新生隱喻的MIDAS系統(tǒng),以及人工神經(jīng)網(wǎng)絡(luò)模型,如Veale8的Sapper模型。?c)基于類比推理和邏輯推理的方法。隱喻的理解需要人們運用常識進行推理,因此,許多學(xué)者采用邏輯方法進行隱喻的機器理解。典型模型包括Stainhart9提出的隱喻的結(jié)構(gòu)理論和隱喻邏輯論、Gentner等人10,11的結(jié)構(gòu)映射引擎SME、Holyoak等人12的ACME隱喻分析模型。?d)基于語料庫統(tǒng)計機器學(xué)習(xí)的方法。隨著語料庫語言學(xué)的發(fā)展,利用統(tǒng)計方法處理語言信息得到了廣泛的關(guān)注,出現(xiàn)了許多基于統(tǒng)計學(xué)習(xí)方法的隱喻識別模型,如Kintsch等人1
7、3,14的基于潛在語義分析方法的模型,以及Mason15,16提出的基于語料庫的隱喻句抽取引擎CorMet。?從上面的計算模型來看,隱喻表達往往涉及到概念的推理關(guān)系,因此隱喻表達的識別、解釋、提取往往需要富含隱喻理解信息的隱喻知識庫的支撐。具有代表性的國外隱喻庫有Master Metaphor List、Sense?frame、MetaBank、Metalude、Hamburg Metaphor Database、ATT?Meta。國內(nèi)的隱喻庫建設(shè)起步較晚,目前公布的只有廈門大學(xué)的漢語隱喻標(biāo)注句庫。?1 國外隱喻知識庫建設(shè)綜述?1.1 Master Metaphor List(MML)?MML
8、(詳見/lakoff/)是加利福尼亞大學(xué)Berkeley分校George Lakoff等人搜集的英語常規(guī)隱喻表達的一個在線知識庫;他們從出版的隱喻文獻、加利福尼亞大學(xué)Berkeley分校的學(xué)生寫作及研究生論壇中收集隱喻用例,手工編輯而成。后來由George Lakoff等人完成了第二版。該知識庫包含了隱喻映射和每個隱喻的隱喻實現(xiàn),并在互聯(lián)網(wǎng)上公布。數(shù)據(jù)庫中的隱喻分為event structure(事件結(jié)構(gòu))、mental events(心理事件)、emotions(情感)和other(其他)四個范疇,共涉及詞條69條;每個詞條又分為不同層級的隱
9、喻類別,共約200多個不同層級的隱喻類別。每種隱喻的類別都包含了各種隱喻方式的源域(source domains)和目標(biāo)域(target domains)的描述及隱喻例句;每一類隱喻都有一個簡要分析。MML依照專家們的直覺分成不同的概念隱喻類別,不去考慮這些隱喻是否已經(jīng)詞匯化。?例如,在詞條“force”下“Force is a substance contained in affecting causes”隱喻類別示例如下:?Force is a substance contained in affecting causes? Put more force into your punches
10、.? He said some forceful words.? His punches carry a lot of force.? Each sentence contained the force of an order.? His punches have a lot of force.? Her death hit us all forcefully.? Her death hit us with a lot of force.? The force of the blow knocked me over.? The force adde
11、d to the swing was enough to send the ball over the fence?Related metaphors:related to Causes are Forces?Source domain:sustance,contents,container,hitting?Target domain:force?Note:? The amount of force determines the degree of change in the affected party? Either the force or the causal?container ca
12、n cause the effect.? Force is placed in the container by the person who wants the change in the affected part? Force is the ability to cause?示例給出了該類別的九個相關(guān)例句,有對該類別的簡要分析(note),指出了隱喻的源域為“sustance, contents, container, hitting”,目標(biāo)域為“force”,而且還給出了與詞類別相關(guān)的隱喻類別“Related metaphors: related to Causes are Force
13、s”。?MML第一版完成于1989年,第二版完成于1991年。很快,這200多個隱喻類就成為各類形式化的、為隱喻計算服務(wù)的隱喻知識庫建設(shè)的主要資源。?1.2 Sense-rame?Sense-rame是一個詞例化的語義知識庫,共包含500條詞條。Dan Fass根據(jù)Wilks的優(yōu)先語義學(xué)理論的優(yōu)先中斷思想提出了修正語義學(xué)的方法,在一個統(tǒng)一的語義框架內(nèi)對轉(zhuǎn)喻(metonymy)、隱喻和詞義異常使用進行解釋,并給出了實現(xiàn)程序Met5。Sense?frame就是為該程序的實現(xiàn)而建設(shè)的詞例化隱喻知識庫。在該知識庫中,每個詞義框架包含arcs和 node兩部分。Arcs部分包含了該詞條類屬條目(一個詞條
14、和它的意義描述),語義框架所有的arcs構(gòu)成了詞語深層結(jié)構(gòu)化的語義網(wǎng)絡(luò);node部分包含了被定義的語義框架的差異。?名詞“animal”在Sense?frame中的描述如下:?sf(animal1,? arcs, supertype,organism1,?node0,?biology1,animal1,? composition1,flesh1,? it1,drink1,drink1,? it1,eat1,food1).?其中:supertype,organism1是一個語義網(wǎng)絡(luò)體系;node0表示該詞條是一個名詞;biology1,animal和composition1,flesh1為該詞條
15、的語義優(yōu)先特征; it1,drink1,drink1和it1,eat1,food1為該詞條的句法組合模式;it1指該詞條,即animal1在 it1,drink1,drink1中能夠被it1代替,在it1,eat1,food1中也能夠被it1代替。該句法組合模式在 Sense?frame中被稱為cell。?形容詞“yellow”在Sense?frame中的描述如下:?sf(yellow1,?arcs, superproperty,coloured1,? property,yellow1? node1,? preference,?bounds1,bounded1,? composition1,p
16、hysical1,? extent1, not1,zero_dimensional1? animacy1,nonliving1? assertion,? color1,yellow1).?其中:superproperty,coloured1和property,yellow1是一個語義網(wǎng)絡(luò)體系;node1表示該詞條是一個形容詞/副詞;preference部分為該詞條的語義優(yōu)先特征;assertion部分為該詞條在命題中的斷言。?動詞“eat”在Sense?frame中的描述如下:?sf(eat1,?arcs,supertype,ingest1,expend1? node2,?agent,pref
17、erence,animal1? object,preference,food1)?其中:supertype,ingest1,expend1是一個語義網(wǎng)絡(luò)體系;node2表示該詞條是一個動詞;agent,preference,animal1和object,preference,food1為該詞條的語義優(yōu)先特征。?利用上述對名詞、動詞和形容詞/副詞的不同形式化描述,F(xiàn)ass用程序Met5實現(xiàn)了對隱喻理解的模型解釋。例如對“car drinks gasoline”,Met5系統(tǒng)就是利用如下知識表示實現(xiàn)的:?sfdrink1,?arcs,?supertypeingest1,expend1.?node2,?agent,?preference.animal1?object,?preference.drink1?sfanimal1,sfcar1,?arcs,arcs,?supertype,organism1,supertype.motor_veh
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DB11T 1205-2015 工業(yè)用能單位能源審計報告編制與審核技術(shù)規(guī)范
- 離心式冷水機組技術(shù)規(guī)格書
- 江西省九江市六校2024-2025學(xué)年九年級上學(xué)期期中聯(lián)考化學(xué)試題(含答案)
- 第六章《世界的發(fā)展差異》 2024-2025學(xué)年湘教版七年級上冊地理單元測試卷(含解析)
- 撥浪鼓玩具產(chǎn)品供應(yīng)鏈分析
- 對流式烤箱產(chǎn)品供應(yīng)鏈分析
- 壓茶磚機市場需求與消費特點分析
- 雙向觸發(fā)極管產(chǎn)業(yè)深度調(diào)研及未來發(fā)展現(xiàn)狀趨勢
- 人教版英語八年級上冊 期末常見題型能力提升練習(xí)
- 湖北省武漢市洪山區(qū)魯巷實驗小學(xué)2024~2025學(xué)年二年級上學(xué)期期中數(shù)學(xué)試題
- 安徽省合肥市第四十五中學(xué)2022-2023學(xué)年九年級上學(xué)期數(shù)學(xué)期中考試卷
- 滬教版八年級上英語語法專項課件
- 樁基礎(chǔ)工程施工組織方案
- 鄉(xiāng)村振興戰(zhàn)略試題和答案(精簡100題)
- 供水運營管理實施方案(4篇)
- 水電站基本構(gòu)造原理與類型ppt版(共67)
- 秦朝統(tǒng)一PPT課件教學(xué)
- 2022-2023學(xué)年 選擇性必修2 浙科版 人類與環(huán)境章末核心素養(yǎng)整合 課件(15張)
- 《民族團結(jié)》- 完整版課件
- 醫(yī)院 交班站位圖
- 修改病句(句子成分講解)課件
評論
0/150
提交評論