漢語隱喻自動(dòng)處理研究進(jìn)展_第1頁
漢語隱喻自動(dòng)處理研究進(jìn)展_第2頁
漢語隱喻自動(dòng)處理研究進(jìn)展_第3頁
漢語隱喻自動(dòng)處理研究進(jìn)展_第4頁
漢語隱喻自動(dòng)處理研究進(jìn)展_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1漢語隱喻自動(dòng)處理研究進(jìn)展?jié)h語隱喻自動(dòng)處理研究進(jìn)展賈玉祥賈玉祥2008-12-092主要內(nèi)容主要內(nèi)容n隱喻概述隱喻概述n隱喻自動(dòng)處理任務(wù)隱喻自動(dòng)處理任務(wù)n基于語義選擇限制的動(dòng)詞性隱喻識(shí)別基于語義選擇限制的動(dòng)詞性隱喻識(shí)別n基于顯著特征的隱喻理解與生成基于顯著特征的隱喻理解與生成n下一步工作下一步工作3隱喻概述隱喻概述n隱喻與修辭隱喻與修辭n使語言表達(dá)生動(dòng)形象,說明事理等作用。使語言表達(dá)生動(dòng)形象,說明事理等作用。qBut the greatest thing by far is to be a master of metaphor. It is the one thing that cannot

2、be learnt from others. 亞里士多德亞里士多德q能近取譬。能近取譬。論語論語.雍也雍也qBank your dream。夢(mèng)想靠岸。夢(mèng)想靠岸。4隱喻概述隱喻概述n隱喻與語言隱喻與語言n隱喻是語言發(fā)展和變化的一種重要方式。隱喻是語言發(fā)展和變化的一種重要方式。n隱喻是新詞創(chuàng)造和多義詞產(chǎn)生的基礎(chǔ)。隱喻是新詞創(chuàng)造和多義詞產(chǎn)生的基礎(chǔ)。q山腳、卵石、垃圾箱、高峰、瓶頸、病毒、線索山腳、卵石、垃圾箱、高峰、瓶頸、病毒、線索n隱喻在語句層面創(chuàng)生新的意義。隱喻在語句層面創(chuàng)生新的意義。q地球是人類的母親。地球是人類的母親。q化干戈為玉帛化干戈為玉帛。5隱喻概述隱喻概述n隱喻與認(rèn)知隱喻與認(rèn)知n概念

3、隱喻概念隱喻:我們的概念系統(tǒng)本質(zhì)上是隱喻的,我們的:我們的概念系統(tǒng)本質(zhì)上是隱喻的,我們的日常生活離不開隱喻,隱喻普遍存在于我們的語言、日常生活離不開隱喻,隱喻普遍存在于我們的語言、思維和行動(dòng)中。思維和行動(dòng)中。n隱喻的本質(zhì)隱喻的本質(zhì)是通過一種事物來理解和體驗(yàn)另外一種事是通過一種事物來理解和體驗(yàn)另外一種事物,即隱喻是兩個(gè)概念域之間的映射,通過源域(喻物,即隱喻是兩個(gè)概念域之間的映射,通過源域(喻體)概念來刻畫目標(biāo)域(本體)概念。體)概念來刻畫目標(biāo)域(本體)概念。n生命是旅程,人生如戲。生命是旅程,人生如戲。6隱喻概述隱喻概述n隱喻表達(dá)與概念隱喻隱喻表達(dá)與概念隱喻n隱喻表達(dá)很普遍,每個(gè)隱喻表達(dá)都對(duì)應(yīng)

4、一個(gè)概念隱喻。隱喻表達(dá)很普遍,每個(gè)隱喻表達(dá)都對(duì)應(yīng)一個(gè)概念隱喻。她像鮮花一樣漂亮。她像鮮花一樣漂亮。女人十八一枝花。女人十八一枝花。我們要大力培植人才。我們要大力培植人才。小朋友茁壯成長(zhǎng)。小朋友茁壯成長(zhǎng)。 植物植物 人人她正值豆蔻年華。她正值豆蔻年華。小生命在秋風(fēng)中凋零。小生命在秋風(fēng)中凋零。教師是辛勤的園丁。教師是辛勤的園丁。n概念隱喻是隱喻理解(概念隱喻是隱喻理解(自然語言理解自然語言理解范疇)的理論基礎(chǔ),隱喻表達(dá)是范疇)的理論基礎(chǔ),隱喻表達(dá)是研究概念隱喻進(jìn)而研究人的概念系統(tǒng)研究概念隱喻進(jìn)而研究人的概念系統(tǒng)(認(rèn)知(認(rèn)知范疇)的途徑。范疇)的途徑。7隱喻概述隱喻概述n隱喻分類隱喻分類按詞類按詞類

5、q名詞性隱喻(名詞性隱喻(祖國(guó)的花朵,歷史舞臺(tái)祖國(guó)的花朵,歷史舞臺(tái))q動(dòng)詞性隱喻(動(dòng)詞性隱喻(放飛理想,經(jīng)濟(jì)滑坡放飛理想,經(jīng)濟(jì)滑坡)q形容詞性隱喻(形容詞性隱喻(跳躍的音符,快樂的小雨點(diǎn)跳躍的音符,快樂的小雨點(diǎn))q 8隱喻概述隱喻概述n隱喻分類隱喻分類按語法單位按語法單位q構(gòu)詞隱喻(構(gòu)詞隱喻(杏仁眼,櫻桃口,席卷,囊括杏仁眼,櫻桃口,席卷,囊括)q詞語級(jí)隱喻(詞語級(jí)隱喻(潮流,包袱,燃燒,滑坡潮流,包袱,燃燒,滑坡)q短語級(jí)隱喻(短語級(jí)隱喻(知識(shí)的海洋,希望的種子知識(shí)的海洋,希望的種子)q句子級(jí)隱喻(句子級(jí)隱喻(汽車喝汽油,女人是水汽車喝汽油,女人是水)q篇章級(jí)隱喻(篇章級(jí)隱喻(打起黃鶯兒,莫

6、教枝上啼。啼時(shí)驚妾夢(mèng),不得打起黃鶯兒,莫教枝上啼。啼時(shí)驚妾夢(mèng),不得到遼西。到遼西。) 以名詞性、動(dòng)詞性隱喻,短語級(jí)、句子級(jí)隱喻的處理為主。以名詞性、動(dòng)詞性隱喻,短語級(jí)、句子級(jí)隱喻的處理為主。9隱喻自動(dòng)處理任務(wù)隱喻自動(dòng)處理任務(wù)n隱喻識(shí)別隱喻識(shí)別知識(shí)的海洋,汽車喝汽油。知識(shí)的海洋,汽車喝汽油。n隱喻理解(找出源域、目標(biāo)域、喻底)隱喻理解(找出源域、目標(biāo)域、喻底)女人是水女人是水女人女人像像水水一樣一樣溫柔溫柔。n隱喻生成(找源域)隱喻生成(找源域)A fine, small, and innocent child. The child is like a puppy(小狗)(小狗).n隱喻應(yīng)用(情

7、感計(jì)算、文本蘊(yùn)涵、信息檢索等)隱喻應(yīng)用(情感計(jì)算、文本蘊(yùn)涵、信息檢索等)nT:Lyon is actually the gastronomic(烹飪)(烹飪) capital of France.H:Lyon is the capital of France.查詢?cè)~查詢?cè)~“潮水潮水”:愛如潮水。:愛如潮水。10基于語義選擇限制的動(dòng)詞性隱喻識(shí)別基于語義選擇限制的動(dòng)詞性隱喻識(shí)別11引言引言n動(dòng)詞性隱喻:動(dòng)詞和論元之間存在語義沖突。動(dòng)詞性隱喻:動(dòng)詞和論元之間存在語義沖突。q 汽車喝汽油。汽車喝汽油?!昂群取钡闹髡Z(主體):通常優(yōu)選的主語(主體):通常優(yōu)選“有生命有生命”q 編織夢(mèng)想。編織夢(mèng)想。“編織

8、編織”的賓語(客體):通常優(yōu)選的賓語(客體):通常優(yōu)選“具體物具體物”n識(shí)別方法:基于語義選擇限制識(shí)別方法:基于語義選擇限制(selectional preferences)。q一般情況下,字面用法(一般情況下,字面用法(哥哥喝汽水哥哥喝汽水)符合語義選擇限制,而隱)符合語義選擇限制,而隱喻用法(喻用法(汽車喝汽油汽車喝汽油)違反語義選擇限制。)違反語義選擇限制。q(Wilks,1975)()(Fass,1991)()(Mason,2004)n關(guān)鍵問題是語義選擇限制的獲取。關(guān)鍵問題是語義選擇限制的獲取。12句法關(guān)系句法關(guān)系抽取抽取隱喻判別隱喻判別自動(dòng)獲取自動(dòng)獲取優(yōu)先語義類優(yōu)先語義類 語料庫語料

9、庫CCD汽車喝汽油汽車喝汽油sub(喝喝, 汽車汽車)obj(喝喝, 汽油汽油)End識(shí)別過程識(shí)別過程基礎(chǔ):基礎(chǔ):13獲取語義選擇限制獲取語義選擇限制n基于某一語義分類體系(如基于某一語義分類體系(如WordNet),通過某種計(jì)算模),通過某種計(jì)算模型,從語料中獲取謂詞對(duì)論元的選擇限制。型,從語料中獲取謂詞對(duì)論元的選擇限制。q(Resnik,1993)KL距離距離q(Li,1998)最小描述長(zhǎng)度)最小描述長(zhǎng)度MDLq(Clark,2002)假設(shè)檢驗(yàn))假設(shè)檢驗(yàn)q(Abney,1999)隱馬爾可夫模型)隱馬爾可夫模型q(Ciaramita,2000)貝葉斯網(wǎng)絡(luò))貝葉斯網(wǎng)絡(luò)n不需要語義分類體系,聚類

10、方法。不需要語義分類體系,聚類方法。q(Rooth,1999)基于)基于EM算法的聚類算法的聚類q(Erk,2007)基于詞間相似度的方法)基于詞間相似度的方法14獲取語義選擇限制獲取語義選擇限制n選擇優(yōu)先強(qiáng)度(選擇優(yōu)先強(qiáng)度(selectional preference strength)n選擇關(guān)聯(lián)度(選擇關(guān)聯(lián)度(selectional association),即),即selects: (p, r, c)a。crcpcpccpcDps)Pr()|Pr(log)|Pr()Pr(|)|(Pr()()Pr()|Pr(log)|Pr()(1),(cpcpcpscpArr15參數(shù)估計(jì)參數(shù)估計(jì)n最大似然

11、估計(jì)最大似然估計(jì)n用詞頻用詞頻freq(w)或共現(xiàn)詞或共現(xiàn)詞頻頻freq(p,w)來估計(jì)語義來估計(jì)語義類出現(xiàn)的頻率類出現(xiàn)的頻率freq(c)或或共現(xiàn)頻率共現(xiàn)頻率freq(p,c)。nclasses(w)是由是由w所在所在的各個(gè)概念及其所有上的各個(gè)概念及其所有上位概念組成。位概念組成。) ()()r(Pccfreqcfreqc)(),()|r(Ppfreqcpfreqpc)(| )(|1)()(wfreqwclassescfreqcwordsw)(),(| )(|1),(cwordswwpfreqwclassescpfreq16w = 晚餐晚餐Sense 1 = = = = = = Sense

12、2 = = = = = = Sense 3 = = = = classes(w)=, , , , , , , , , , , , 從從CCD中獲取中獲取classes(w)17實(shí)驗(yàn)與分析實(shí)驗(yàn)與分析n從從2000年人民日?qǐng)?bào)全年語料中自動(dòng)抽取年人民日?qǐng)?bào)全年語料中自動(dòng)抽取二元對(duì),所有參數(shù)估計(jì)均在該二元二元對(duì),所有參數(shù)估計(jì)均在該二元對(duì)上進(jìn)行。對(duì)上進(jìn)行。n中心詞的抽取,是在分詞、標(biāo)注的基礎(chǔ)上,采用簡(jiǎn)單啟發(fā)中心詞的抽取,是在分詞、標(biāo)注的基礎(chǔ)上,采用簡(jiǎn)單啟發(fā)式規(guī)則實(shí)現(xiàn)。例如,賓語中心詞,式規(guī)則實(shí)現(xiàn)。例如,賓語中心詞,q邊界確定:邊界確定:目標(biāo)動(dòng)詞之后,下一個(gè)動(dòng)詞或標(biāo)點(diǎn)之前。目標(biāo)動(dòng)詞之后,下一個(gè)動(dòng)詞或標(biāo)點(diǎn)之前

13、。q歧義消解歧義消解:如果有多個(gè)候選名詞,則選擇最后一個(gè)。如果有多個(gè)候選名詞,則選擇最后一個(gè)?!?果斷/ad 采取采取/v 一/m 系列/q 宏觀/n 經(jīng)濟(jì)/n 政策/n 措施措施/n ,/wd” “ 采取采取/v 市民/n 代表代表/n 座談/v 、/wu 張貼/v 公開欄/n 等/u 形式/n ,/wd” 18實(shí)驗(yàn)與分析實(shí)驗(yàn)與分析SynsetCSynsetAssociationCommon_people人人 世人世人 人們?nèi)藗?大眾大眾 平民平民 百姓百姓 普通人普通人0.0288588Living_thing機(jī)體機(jī)體 生命生命 有機(jī)體有機(jī)體 生物體生物體0.0260849person人人

14、 個(gè)人個(gè)人 個(gè)體個(gè)體0.0243593people人人 人們?nèi)藗?人民人民 人類人類 公民公民0.0216022friend友人友人 朋友朋友 熟人熟人 相相識(shí)識(shí) 良師益友良師益友0.012325SynsetCSynsetAssociationliquid液體液體 液汁液汁0.089294fluid流體流體 液體液體 液液汁汁0.08928substance物物 物料物料 物質(zhì)物質(zhì)0.067677beverage飲品飲品 飲料飲料0.047034water水水 H H2 2O O0.044359主語語義類主語語義類賓語語義類賓語語義類實(shí)例實(shí)例“喝喝”19實(shí)驗(yàn)與分析實(shí)驗(yàn)與分析n隱喻識(shí)別隱喻識(shí)別動(dòng)

15、詞動(dòng)詞賓語賓語優(yōu)先語義類優(yōu)先語義類隱喻隱喻透支透支生命生命 1澆灌澆灌希望希望播撒播撒愛心愛心釀造釀造悲劇悲劇提煉提煉經(jīng)驗(yàn)經(jīng)驗(yàn)點(diǎn)燃點(diǎn)燃激情激情編織編織夢(mèng)想夢(mèng)想注注1 1 優(yōu)先語義類,其中優(yōu)先語義類,其中09633105CCD中的概念中的概念I(lǐng)D,信用卡,信用卡同義詞代表。同義詞代表。20實(shí)驗(yàn)與分析實(shí)驗(yàn)與分析n抽象概念過濾抽象概念過濾n優(yōu)先語義類對(duì)應(yīng)于字面用法,常是具體概念。優(yōu)先語義類對(duì)應(yīng)于字面用法,常是具體概念。n自動(dòng)獲取的優(yōu)先語義類因考慮使用頻率,引入了抽象自動(dòng)獲取的優(yōu)先語義類因考慮使用頻率,引入了抽象概念。概念。q比如,動(dòng)詞比如,動(dòng)詞“兌現(xiàn)兌現(xiàn)”自動(dòng)獲取的優(yōu)先語義類是自動(dòng)獲取的優(yōu)先語義類是

16、,而字面用法對(duì)應(yīng)的具體概念,而字面用法對(duì)應(yīng)的具體概念“獎(jiǎng)金、匯票、存單獎(jiǎng)金、匯票、存單”等的優(yōu)先級(jí)反而較低。等的優(yōu)先級(jí)反而較低。q因而,利用語義詞典中的概念抽象程度信息,過濾掉抽象概因而,利用語義詞典中的概念抽象程度信息,過濾掉抽象概念,從而獲得正確的優(yōu)先語義類。念,從而獲得正確的優(yōu)先語義類。21基于顯著特征的隱喻理解與生成基于顯著特征的隱喻理解與生成22本文思路本文思路n源域和目標(biāo)域同時(shí)出現(xiàn)的隱喻表達(dá)。源域和目標(biāo)域同時(shí)出現(xiàn)的隱喻表達(dá)。q女人是水,理解為女人是水,理解為“女人像水一樣溫柔女人像水一樣溫柔”。q用源域用源域“水水”的的顯著特征顯著特征“溫柔溫柔”來凸顯目標(biāo)域來凸顯目標(biāo)域“女人女人

17、”的的“溫溫柔柔”。n隱喻往往使用源域的顯著特征來凸顯目標(biāo)域這一特征,該隱喻往往使用源域的顯著特征來凸顯目標(biāo)域這一特征,該特征就是源域和目標(biāo)域的相似點(diǎn),即喻底。特征就是源域和目標(biāo)域的相似點(diǎn),即喻底。n本文提出基于顯著特征的方法,在統(tǒng)一框架下實(shí)現(xiàn)隱喻的本文提出基于顯著特征的方法,在統(tǒng)一框架下實(shí)現(xiàn)隱喻的理解與生成。理解與生成。 23顯著特征知識(shí)庫顯著特征知識(shí)庫n名詞的顯著特征可通過一定句法模式獲得。名詞的顯著特征可通過一定句法模式獲得。q“像像n一樣一樣P”,“如如n般般P”等。等。q通過通過“像雪一樣白像雪一樣白”可以得到可以得到“雪雪”的顯著特征的顯著特征“白白”。n本文選擇模式本文選擇模式“

18、像像n一樣一樣a”,利用搜索引擎從,利用搜索引擎從海量網(wǎng)頁中自動(dòng)獲取名詞及其顯著特征實(shí)例,海量網(wǎng)頁中自動(dòng)獲取名詞及其顯著特征實(shí)例,并通過語義詞典進(jìn)行義項(xiàng)化的處理。并通過語義詞典進(jìn)行義項(xiàng)化的處理。24實(shí)例獲取實(shí)例獲取1. 從現(xiàn)代漢語語法信息詞典(從現(xiàn)代漢語語法信息詞典(Grammatical Knowledge Base, GKB)(俞士汶)(俞士汶 2003)中抽取所有形容詞;對(duì)每個(gè)形容詞)中抽取所有形容詞;對(duì)每個(gè)形容詞a,構(gòu)造查詢,構(gòu)造查詢“像像*一樣一樣a”(*是通配是通配符,使用整串匹配),由搜索引擎符,使用整串匹配),由搜索引擎搜索網(wǎng)頁;對(duì)每個(gè)查詢結(jié)搜索網(wǎng)頁;對(duì)每個(gè)查詢結(jié)果,抓取前果,

19、抓取前100個(gè)網(wǎng)頁的片段(個(gè)網(wǎng)頁的片段(Snippets),一起形成原始語料庫;對(duì)原始語),一起形成原始語料庫;對(duì)原始語料庫進(jìn)行分詞、詞性標(biāo)注處理;抽取符合模式料庫進(jìn)行分詞、詞性標(biāo)注處理;抽取符合模式“像像n一樣一樣a”的串,形成實(shí)例的串,形成實(shí)例庫庫EB1。2. 從從EB1中獲取名詞列表,對(duì)每個(gè)名詞中獲取名詞列表,對(duì)每個(gè)名詞n,構(gòu)造查詢,構(gòu)造查詢“像像n一樣一樣*”,同,同1進(jìn)行網(wǎng)頁進(jìn)行網(wǎng)頁抓取,分詞、詞性標(biāo)注,抽取實(shí)例,形成實(shí)例庫抓取,分詞、詞性標(biāo)注,抽取實(shí)例,形成實(shí)例庫EB2。3. 合并實(shí)例庫,并用合并實(shí)例庫,并用GKB過濾實(shí)例庫中的詞,消除分詞錯(cuò)誤。最后得到實(shí)例過濾實(shí)例庫中的詞,消除分

20、詞錯(cuò)誤。最后得到實(shí)例(對(duì))對(duì))71555個(gè),無重復(fù)實(shí)例個(gè),無重復(fù)實(shí)例20922個(gè)。個(gè)。4. 由實(shí)例庫構(gòu)造名詞由實(shí)例庫構(gòu)造名詞-特征庫、特征特征庫、特征-名詞庫。涵蓋名詞名詞庫。涵蓋名詞3666個(gè),形容詞個(gè),形容詞1804個(gè)。個(gè)。25n水水水水水水水水水水水水水水a(chǎn)安靜安靜安寧安寧安穩(wěn)安穩(wěn)骯臟骯臟博大博大純潔純潔純凈純凈名詞名詞特征數(shù)特征數(shù)特征特征水水187安靜安靜 安寧安寧 安穩(wěn)安穩(wěn) 骯臟骯臟 博大博大 純潔純潔 純凈純凈 純情純情 純真純真 從容從容 脆弱脆弱 單單純純 淡淡 淡漠淡漠 淡雅淡雅 特征特征名詞數(shù)名詞數(shù)名詞名詞溫柔溫柔107愛心愛心 波斯貓波斯貓 晨光晨光 春風(fēng)春風(fēng) 大地大地

21、大海大海 風(fēng)風(fēng) 羔羊羔羊 鴿子鴿子 海風(fēng)海風(fēng) 海水海水 海豚海豚 和風(fēng)和風(fēng) 江水江水 康乃馨康乃馨 流水流水 柳樹柳樹 柳絮柳絮 柳枝柳枝 鹿鹿 貓貓 美人魚美人魚 綿羊綿羊 實(shí)例庫實(shí)例庫名詞名詞-特征庫特征庫特征特征-名詞庫名詞庫26義項(xiàng)映射義項(xiàng)映射n同義詞詞林?jǐn)U展版(哈工大)。同義詞詞林?jǐn)U展版(哈工大)。n同義分組、擴(kuò)展。同義分組、擴(kuò)展。n按顯著性排序。按顯著性排序。q比如,比如,“水水”的特征里,的特征里,“清澈清澈”比比“甜甜”更顯著。更顯著。q用每個(gè)同義詞組中的特征個(gè)數(shù)除以特征總數(shù)來表示。用每個(gè)同義詞組中的特征個(gè)數(shù)除以特征總數(shù)來表示。n對(duì)特征對(duì)應(yīng)的名詞集合做類似處理。對(duì)特征對(duì)應(yīng)的名詞

22、集合做類似處理。 27水:水:Ef04A01 0.059 /安靜安靜 沉靜沉靜 靜靜 靜謐靜謐 冷靜冷靜 寧靜寧靜 清靜清靜 清凈清凈 恬靜恬靜 幽靜幽靜 幽深幽深Ed15C01 0.037 /平和平和 輕柔輕柔 柔和柔和 溫和溫和 溫柔溫柔 溫軟溫軟 優(yōu)柔優(yōu)柔Eb19A01 0.037 /純凈純凈 明澈明澈 明凈明凈 清清 清澈清澈 清亮清亮 清冽清冽Ef12A01 0.032 /干凈干凈 潔凈潔凈 凈凈 清潔清潔 清爽清爽 清新清新Eb10B01 0.027 /綿軟綿軟 柔柔 柔嫩柔嫩 柔韌柔韌 柔軟柔軟Ee15A01 0.027 /快快 靈靈 靈動(dòng)靈動(dòng) 靈活靈活 敏感敏感Ee07A01

23、0.021 /溫存溫存 溫和溫和 溫柔溫柔 溫潤(rùn)溫潤(rùn)Ga01A01 0.021 /歡快歡快 快快 快活快活 快樂快樂28溫柔:溫柔:Bf02A 0.065 /春風(fēng)春風(fēng) 風(fēng)風(fēng) 海風(fēng)海風(fēng) 和風(fēng)和風(fēng) 輕風(fēng)輕風(fēng) 晚風(fēng)晚風(fēng) 微風(fēng)微風(fēng)Bi06D 0.047 /羔羊羔羊 羚羊羚羊 綿羊綿羊 山羊山羊 羊羔羊羔Ab01B 0.047 /婦女婦女 娘娘 女兒女兒 女人女人 女子女子Bg01A 0.037 /海水海水 江水江水 流水流水 水水Bg03B 0.037 /晨光晨光 陽光陽光 月光月光 月色月色Bh02A 0.037 /合歡合歡 康乃馨康乃馨 山茶花山茶花 茉莉花茉莉花29隱喻理解隱喻理解n形式化為:形

24、式化為:P=C(S,T) 。qSalient Property,Comprehension,Source domain,Target domainnS的顯著特征為的顯著特征為P提供了候選,最終提供了候選,最終P的確定還要參照的確定還要參照T。n堅(jiān)持堅(jiān)持P是是“S、T的相似點(diǎn)的相似點(diǎn)”、“S的顯著特征的顯著特征”等原則。等原則。n具體算法為:具體算法為:q如果如果S和和T的顯著特征交集不空,則的顯著特征交集不空,則P取特征交集;取特征交集;q否則,否則,P取取S的最顯著特征。的最顯著特征。q如果如果S不在知識(shí)庫的名詞列表中,則理解失敗。不在知識(shí)庫的名詞列表中,則理解失敗。30隱喻生成隱喻生成n形

25、式化為:形式化為:S=G(T,P) 。qSource domain,Generation,Target domain,Salient PropertynP對(duì)應(yīng)的名詞集合為對(duì)應(yīng)的名詞集合為S提供了候選,最終提供了候選,最終S的確定還需要考的確定還需要考慮慮T。n原則是保證原則是保證S和和T分屬兩個(gè)不同的概念域。分屬兩個(gè)不同的概念域。n具體算法為:具體算法為:q在保證在保證S、T所在的概念域不相同的前提下,所在的概念域不相同的前提下,S取取P對(duì)應(yīng)的最顯對(duì)應(yīng)的最顯著的名詞。著的名詞。q如果如果P不在知識(shí)庫的特征列表中,則生成失敗。不在知識(shí)庫的特征列表中,則生成失敗。 31數(shù)據(jù)數(shù)據(jù)n目前知識(shí)庫中包含的

26、形容詞占形容詞總數(shù)(來自目前知識(shí)庫中包含的形容詞占形容詞總數(shù)(來自GKB)的的1804/315557.18%。q說明知識(shí)庫能為說明知識(shí)庫能為57.18%的形容詞提供源域候選。的形容詞提供源域候選。n名詞比例為名詞比例為3666/3516210.43%。q只有約只有約10%的名詞用作源域,體現(xiàn)了源域概念的選擇性。的名詞用作源域,體現(xiàn)了源域概念的選擇性。n測(cè)試數(shù)據(jù):從抓取的網(wǎng)頁中抽取符合模式測(cè)試數(shù)據(jù):從抓取的網(wǎng)頁中抽取符合模式“像像n一樣一樣a的的n”的串,如的串,如“像大海一樣廣闊的胸懷像大海一樣廣闊的胸懷”,從中選擇樣本,從中選擇樣本262個(gè)。個(gè)。32理解舉例理解舉例n女人是水。女人是水。q特

27、征交集是特征交集是“溫柔溫柔”,理解為,理解為“女人像水一樣溫柔女人像水一樣溫柔”。n人生如夢(mèng)。人生如夢(mèng)。q特征交集是特征交集是“短暫短暫”,最顯著特征是,最顯著特征是“縹緲縹緲”,理解為,理解為“人人生像夢(mèng)一樣短暫、縹緲生像夢(mèng)一樣短暫、縹緲”,形容世事無定,人生短促。,形容世事無定,人生短促。n人是會(huì)思想的蘆葦。人是會(huì)思想的蘆葦。q特征交集是特征交集是“脆弱脆弱”,理解為,理解為“人像蘆葦一樣脆弱人像蘆葦一樣脆弱”,強(qiáng)調(diào),強(qiáng)調(diào)人的脆弱性。人的脆弱性。33實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)結(jié)果n隱喻理解和生成均未出現(xiàn)失敗的情況。隱喻理解和生成均未出現(xiàn)失敗的情況。n隱喻理解的正確率達(dá)到隱喻理解的正確率達(dá)到86.26%。特征交集特征交集最顯著特征最顯著特征總體總體正確樣本數(shù)正確樣本數(shù)106120226樣本數(shù)樣本數(shù)116146262正確率正確率91.38%82.19%86.26%隱喻理解結(jié)果隱喻理解結(jié)果34實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)結(jié)果n隱喻生成的滿意率是隱喻生成的滿意率是205/262=78.24%。n錯(cuò)誤來源主要是形成的隱喻理解起來不夠直觀,錯(cuò)誤來源主要是形成的隱喻理解起來不夠直觀,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論