面向中文信息處理的“N+V”結(jié)構(gòu)的句法語義研究_第1頁
面向中文信息處理的“N+V”結(jié)構(gòu)的句法語義研究_第2頁
面向中文信息處理的“N+V”結(jié)構(gòu)的句法語義研究_第3頁
面向中文信息處理的“N+V”結(jié)構(gòu)的句法語義研究_第4頁
面向中文信息處理的“N+V”結(jié)構(gòu)的句法語義研究_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

面向中文信息處理的“N+V”結(jié)構(gòu)的句法語義研究

關(guān)鍵詞 :中文信息處理“N+V”結(jié)構(gòu)自動消歧

“N+V”格式是一種比較常見的同形異構(gòu)結(jié)構(gòu),雖然表層形式簡潔,從層次劃分上不存在困難,但是內(nèi)部可能存在不同的語法關(guān)系、語義關(guān)系。

一、“N+V”結(jié)構(gòu)本體分析

(一)“N+V”結(jié)構(gòu)的語法關(guān)系

本文所指“N+V”結(jié)構(gòu)是指可以自足的、無其他成分或標記的合法語言單位,不包括“把N+V了”“N的V”等結(jié)構(gòu)形式。根據(jù)馮志偉先生的潛在歧義理論,我們將這種結(jié)構(gòu)底層存在的語法關(guān)系區(qū)分如下:

主謂關(guān)系,其中“N”作主語,“V”作謂語,二者之間是陳述與被陳述的關(guān)系,如:糧食豐收、媽媽做飯、小二黑結(jié)婚;

偏正關(guān)系,其中“N”為修飾語,“V”是中心語,如:口頭創(chuàng)作、直線上升、文藝演出、汽車制造、語言研究、核試驗;

既可以分析成主謂關(guān)系也可以分析成偏正關(guān)系,這種結(jié)構(gòu)在沒有給定語境時會產(chǎn)生理解上的歧義,如:機器生產(chǎn)、專業(yè)人員培訓。

其中,前兩種屬于“格式真歧義短語”,它們具有相同的表層類型形式,但是對應著兩種句法功能結(jié)構(gòu),計算機在處理時不能判斷采取哪種句法結(jié)構(gòu),就會產(chǎn)生兩種結(jié)果,而這種歧義對人來說是不存在的;最后一種屬于“實例真歧義短語”,即實例化后產(chǎn)生的短語對應至少兩種句法結(jié)構(gòu),這種歧義對人和計算機都是存在的。

除此之外,由于已經(jīng)給定短語格式,其中成分的詞類已經(jīng)確定,不會作為結(jié)構(gòu)歧義的產(chǎn)生原因;另一方面,只涉及兩個成分的“N+V”結(jié)構(gòu),詞與詞搭配時不會產(chǎn)生不同的結(jié)構(gòu)層次,也就不會成為結(jié)構(gòu)歧義的產(chǎn)生原因。

(二)“N+V”結(jié)構(gòu)的語義、語用關(guān)系

“N”和“V”之間的語義關(guān)系不止一種,“N”既可以作為施事支配“V”,又可以作為“V”的受事受到“V”的支配,還可以作為狀語修飾“V”,當同一個結(jié)構(gòu)能夠分析出不同關(guān)系時就會產(chǎn)生歧義。如“機器”既可以作為“生產(chǎn)”動作的對象,又可以作為“生產(chǎn)”動作的施行者,就會產(chǎn)生歧義。因此,我們可以認為,不及物動詞只能構(gòu)成主謂結(jié)構(gòu)和部分狀中結(jié)構(gòu),而不會產(chǎn)生歧義,只有“V”可以帶賓語并且能帶體詞性賓語時,才會反過來支配前面的“N”,才會產(chǎn)生理解上的區(qū)別。如“專業(yè)人員培訓”中的“培訓”是及物動詞,“專業(yè)人員”既可以作為狀語,表示“培訓”動作的執(zhí)行者,又可以作為賓語,表示“培訓”動作的對象。

當進入結(jié)構(gòu)的“N”和“V”之間構(gòu)成動作與受事、對象關(guān)系時,有可能構(gòu)成定中結(jié)構(gòu)。當進入結(jié)構(gòu)的“N”和“V”之間構(gòu)成施事主體與動作關(guān)系時可能構(gòu)成主謂結(jié)構(gòu)。當這兩種關(guān)系同時存在時,就會構(gòu)成歧義結(jié)構(gòu),這也是歧義格式中最常見的雙重歧義關(guān)系,還有一些歧義結(jié)構(gòu)的語義關(guān)系比較特殊,如:西部開發(fā)(“N”既是客體又是地點)、每個人都給一本書(“N”既是主體又是與事)。而當這兩種關(guān)系都不存在時,“N”通常表示“V”的某種方式、手段,或是動作的時間、原因、范圍等,此時構(gòu)成偏正結(jié)構(gòu)中的另一種——狀中結(jié)構(gòu)。

名詞性的“N+V”結(jié)構(gòu)還具有一種特殊的語篇特征,即“N”失去話題性,不能被回指,而“V”失去謂詞性,得到指稱意義,有時可以被數(shù)量詞修飾,如:一項季度考核、一份會議記錄。據(jù)此,整個結(jié)構(gòu)就產(chǎn)生指稱的語義效果,具有類別義和概念性的傾向,伴隨著“N”的改變,類別也會發(fā)生變化。

根據(jù)現(xiàn)有“N+V”結(jié)構(gòu)的研究成果來看,學者們對定中式的研究比較多,其討論主要集中在此結(jié)構(gòu)的性質(zhì)、產(chǎn)生機制和限制條件方面。

對于進入定中結(jié)構(gòu)的“N”的限制條件,李晉霞提出高生命度、高個體度的名詞不易進入;缺省賓語不能進入;區(qū)別性的下位名詞更易進入;概念信息非常具體的“N”不易進入。耿國鋒則提出語義抽象、泛化,分布上失去名詞形態(tài)特征的名詞比較容易進入,還有抽象名詞、集合名詞較容易進入。對于“V”的限制條件,馬真、陸儉明《“名詞+動詞”詞語串淺析》中提出四類排斥進入主謂結(jié)構(gòu)的動詞:企圖類、成為類、“使”類和“著想”類;并提出進入偏正結(jié)構(gòu)的動詞必須是名動詞。李晉霞則提出:強動作動詞、特征動詞、口語動詞、黏著動詞、不及物動詞不易進入,但可以舉出很多反例。耿國鋒提出,動作具有無界性的動詞、非完成性和非瞬時性的動詞、及物性降低的動詞比較容易進入,且進入后失去動詞的典型句法功能。但是,名詞性“N+V”結(jié)構(gòu)處在不穩(wěn)定的發(fā)展變化中,許多曾經(jīng)排斥的情況已經(jīng)有為數(shù)不少的用例,需要重新考慮相應的規(guī)則。

這些限制條件具有啟發(fā)價值,但其中某些概念比較模糊,有些對音節(jié)的限制幾乎只是現(xiàn)象描寫,還有一些從詞類角度總結(jié)的限制條件更是瑣碎而充滿例外,不適合直接作為計算機消歧的策略。

二、歧義成因與識別方法

計算機處理自然語言時,是以詞類標記序列為對象的,除了需要切分和了解各個詞的詞類、意義之外,還需要知道搭配規(guī)則與結(jié)果。根據(jù)馮志偉先生的潛在歧義理論,抽象的歧義格式所包含的歧義在代入具體成分時可能消除或保留。這里我們將“N+V”歧義格式分化為單義結(jié)構(gòu)分別進行歧義成因和消解的討論。

(一)主謂結(jié)構(gòu)

在主謂結(jié)構(gòu)中,“N”擔任施事或感事,是動作行為的發(fā)出者或主體。參照知網(wǎng)的信息結(jié)構(gòu)庫,我們將典型的主謂結(jié)構(gòu)的模式總結(jié)為以下幾類:

N→V=[施事](個人名詞/團體名詞)→(事件,行動)

N→V=[施事](動物)→(事件,行動/狀態(tài))

N→V=[感事](表人名詞/表物名詞)→(事件,關(guān)系/狀態(tài))

通常來說,人或動物更容易發(fā)出動作,作為施事構(gòu)成主謂結(jié)構(gòu),比較常見;而沒有生命的物體也可以進入這種結(jié)構(gòu),如:長江奔騰、工程竣工,它們可以作為動作的感事進入結(jié)構(gòu),所以我們可以制定這樣的規(guī)則,其中zwp表示主謂結(jié)構(gòu):

R1IFN∈V的主體語義類(即N的語義類為V的主體語義類或其子集)

ANDV[+單獨作謂語]

THENN+V≌zwp

ENDIF

此條件的實現(xiàn)方法在于建立以動詞為中心的詞匯網(wǎng)絡,針對動詞的每個論元關(guān)系建立詞庫,再作為外部調(diào)用。高生命度的名詞容易將N+V語符串通過心理加工構(gòu)成主謂結(jié)構(gòu),當聽到這類名詞時聽眾容易產(chǎn)生“怎么樣?”的語義期待,這也是這類名詞不易構(gòu)成偏正結(jié)構(gòu)的原因。而“N”為人所共知的著名人物時,容易產(chǎn)生歧義,例如:魯迅研究。

“N+V”形式的獨立的主謂結(jié)構(gòu)單獨成句時往往受到語義上的很大限制,通常只能用于祈使句、表示對比或在口語中提問與回答,比較容易識別。如:

你說。

——誰去?——小明去。

我忘了,他記得。

(二)偏正結(jié)構(gòu)

在偏正狀中結(jié)構(gòu)中,“N”描述“V”具有的某種特性,往往表示非常態(tài)的情況。其中有一種是由“N”作狀語與某種不及物動詞共同構(gòu)成的,如:直線上升、五點出發(fā)、火線入黨等,區(qū)分度比較明顯,可以制定這樣的規(guī)則,其中zzp表示狀中結(jié)構(gòu):

R2IFV[+自身動作]orV[+趨向動詞]

ANDN∈V的主體語義類①

THENN+V≌zzp

ENDIF

對于其他偏正狀中結(jié)構(gòu)來說,語義具有如下幾種模式:

“N”表示范圍。這種模式中的“V”在語義上一定存在一個域外的施事論元,如:局部調(diào)整、全線出擊、側(cè)面打聽。

“N”表示時間、處所、方式、工具。這幾種模式都是狀語的常見用法,如:電話報名、網(wǎng)上繳費、鄉(xiāng)村支教。

這種名詞作為狀語直接修飾動詞的現(xiàn)象,簡潔便當且鮮明直觀,在古代漢語中就已經(jīng)存在,如:風馳電掣、天翻地覆、灰飛煙滅等,在成語中仍有許多保留。另外,許多“N單+V單”的偏正結(jié)構(gòu)已經(jīng)被看作雙音節(jié)動詞收入了詞典,如“龜縮、云集、瓜分”等。這些詞數(shù)量有限且穩(wěn)定封閉,用建立詞庫的方法進行標記就可以實現(xiàn)計算機對它們的自動識別。

在偏正定中結(jié)構(gòu)中,“V”是中心語,具有動名兼類的性質(zhì),動詞性減弱,名詞性增強;“N”從自己的語義出發(fā)對“V”的類別進行限定,與“V”間是屬性關(guān)系。有些結(jié)構(gòu)中的“V”本身就與相關(guān)意義的“N”同形,如:合唱指揮、語文測驗、學歷證明。有些結(jié)構(gòu)中的“V”則是在語境中獲得名詞性,如:政策調(diào)整、干部提拔等,其中的“V”指的是“V”所代表的動作事件。定中結(jié)構(gòu)作賓語時,前面的謂語往往是既可以帶體詞性賓語又可以帶謂詞性賓語的,如表示判斷、變化、心理態(tài)度等意義的動詞。

定中結(jié)構(gòu)主要有如下幾種模式:

N→V=[受事](具體名詞)→(事件,行動)

其中“N”是“V”的賓語,可以進入“把”字結(jié)構(gòu),這種情況在所有偏正式結(jié)構(gòu)中所占比例最大,如“身體檢查、日程安排、罪犯抓捕”。值得注意的是,“V”的缺省賓語一般不能構(gòu)成這種結(jié)構(gòu),如“*學生教育”,因為“教育”的客體必然是學生,通常不這樣說,而“學生”的下位概念則比較容易進入。如:小學生教育。

N→V=[結(jié)果](具體名詞)→(事件,行動)

“N”的實體在“V”的影響下產(chǎn)生、改變或消失,可以用“出來”“成”檢驗。如:產(chǎn)品開發(fā)、服裝剪裁、文件起草。

這兩種結(jié)構(gòu)中,“V”一般都是及物動詞,“N”是“V”的賓語,有相應的“N+V”格式。對于這兩種格式,我們制定這樣的規(guī)則,其中dzp表示定中結(jié)構(gòu):

R3IFN∈V的客體語義類②

ANDV[+過程性]

THENN+V≌dzp

ENDIF

其它結(jié)構(gòu)還包括“N”表示對象、目的,有時還包括表示處所、方式、工具等,這些情況下一般沒有對應的“N+V”格式或變換后語義上發(fā)生改變。如:

對象:質(zhì)量保證、會場布置、難民補助、社區(qū)服務

目的:會議籌備、主席選舉、毒品搜查

工具:糧食救濟、津貼補助、金錢獎勵

方式:網(wǎng)絡服務、行政干預、電話采訪

處所:西部開發(fā)、地下工作、異地就業(yè)

對于這些格式,我們制定這樣的規(guī)則:

R4IFN∈V的狀況語義類∪V的時空語義類∪V的目的語義類③

ANDV[+過程性]

THENN+V≌dzp

ENDIF

其中有些“N”的意義與狀中結(jié)構(gòu)難以區(qū)分,有時狀中結(jié)構(gòu)也能充當名詞性成分。為了對其進行區(qū)分,我們考慮這樣的情況:偏正結(jié)構(gòu)都是向心結(jié)構(gòu),整體性質(zhì)由中心詞的性質(zhì)決定,狀語修飾謂詞而定語修飾體詞,定中結(jié)構(gòu)中的“V”呈現(xiàn)出明顯的名詞化。齊滬揚在《偏正式“N+V”短語研究》一文中將偏正式“N+V”結(jié)構(gòu)的名詞性和動詞性連續(xù)情況繪制如下圖④:

因此我們制定這樣的補充規(guī)則:

R5在句中作為謂語的一定是狀中結(jié)構(gòu),作為主語、賓語、定中結(jié)構(gòu)中心語和定語的一定是定中結(jié)構(gòu)。如:

記者電話采訪了張先生。(作謂語)

電話采訪是一種調(diào)查手段。(作主語)

張先生接受了電話采訪。(作賓語)

電話采訪的內(nèi)容無可奉告。(作定語)

(三)歧義結(jié)構(gòu)

上文所述皆是基于約束法的消歧策略,但是不管語料的規(guī)模多大也無法概括語言的全貌,這些規(guī)則是根據(jù)現(xiàn)有語料制定的,難免掛一漏萬。且有一種無法處理的情況,即:當“N”既屬于“V”的主體語義類又屬于“V”的客體語義類時構(gòu)成歧義結(jié)構(gòu),無法以形式化的規(guī)則判斷。好在語言自有其整體性,各個部分間能夠相互影響,可以將其放到具體語境中,根據(jù)上下文信息,基于優(yōu)選法,從若干備選語義中選擇最優(yōu)方案。沒有上下文的、獨立成句的情況,上文已經(jīng)討論過,一般都出現(xiàn)在對話中,也可以根據(jù)語境區(qū)分。例如,“理事會審查”原本是個歧義結(jié)構(gòu),但在下列語境中可以輕易區(qū)分:

XX公司的理事會審查工作已近尾聲。

理事會審查通過了這項提案。

對此,基于現(xiàn)有語料,我們提出幾個假設性質(zhì)的規(guī)則:

R6當句中出現(xiàn)了“V”的其他客體時,就可以認為這個“N+V”是主謂關(guān)系。例如:

在與中方新聞界交流、座談的過程中,非洲朋友介紹了各自國家的新聞體制及運作情況。

蒙古教官培訓阿富汗軍隊的費用大部分是由美國提供的。

雞吃了混合食物比牛更能轉(zhuǎn)化蛋白質(zhì)。

R7將“N+V”結(jié)構(gòu)的左端記為Wi,若Wi-1為“由”“用”等介詞,則可以認為這個“N+V”是主謂關(guān)系。

這種情況已經(jīng)不是前述的自足結(jié)構(gòu),“N”由介詞引入,語義上支配動詞。例如:

我是公司的法人代表,是由任局長任命的。

這些工具大部分仍然由手工業(yè)或工場手工業(yè)方式生產(chǎn),然后才裝到由機器生產(chǎn)的工作機的機體上。

即將派往伊拉克的軍人是根據(jù)美格“訓練與裝備”計劃由美國教官培訓的。

通過對這兩個假設規(guī)則的分析,我們發(fā)現(xiàn)不能獨立成句、必須作為句子成分才能出現(xiàn)的“N+V”結(jié)構(gòu)已經(jīng)上升到句子層面的語言形式了,本文不再討論。

(本文得到國家“973”重大基礎理論研究項目子課題“語言計算模型與理論:面向網(wǎng)絡語言的句法和語義分析的理論模型[項目編號:2024CB340500]”的支持。)

本文寫作過程中得到南京大學文學院沈陽教授、鐘叡逸老師的具體指導;本文在解放軍外國語學院作報告時,李宗江教授提供了寶貴意見。特此致謝!

注釋:

①主體語義類包括:施事(agent)、當事(relevant)、感事(experiencer)、領事(possessor)

②客體語義類包括:受事(patient)、內(nèi)容(content)、結(jié)果(resultevent)、致事(beneficiary)

③狀況語義類包括:方式(manner)、工具(instrument)、材料(material)時空語義類包括:時間(time)、空間(location)

④轉(zhuǎn)引自:章婧.現(xiàn)代漢語定中N+V結(jié)構(gòu)研究[D].北京,中國人民大學,2024.

參考文獻:

[1]俞士汶.計算語言學概論[M].北京:商務印書館,2024.

[2]章婧.現(xiàn)代漢語定中N+V結(jié)構(gòu)研究[D].北京:中國人民大學,2024.

[3]馮志偉.論歧義結(jié)構(gòu)的潛在性[J].中文信息學報,1995,(4):14~24.

[4]李晉霞.定中“N賓+V”結(jié)構(gòu)構(gòu)成因素的考察[D].北京:教育部語言文字應用研究所,2024.

[5]馬真,陸儉明.“名詞+動詞”詞語串淺析[J].中國語文,1996,(3):183~188.

[6]耿國

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論