范疇語法”及其在漢語中的應(yīng)用_第1頁
范疇語法”及其在漢語中的應(yīng)用_第2頁
范疇語法”及其在漢語中的應(yīng)用_第3頁
范疇語法”及其在漢語中的應(yīng)用_第4頁
范疇語法”及其在漢語中的應(yīng)用_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、“范疇語法”及其在漢語中的應(yīng)用作者:孫紅舉來源:現(xiàn)代語文(語言研究)2008年第06期摘要: 范疇語法通過確立句子中詞語對應(yīng)的范疇及應(yīng)用一定的演算規(guī)則可以判定一定語言中句子的“合法性”。它在對句子的生成的解釋上具有一定的解釋力,在計(jì)算機(jī)語言處理上也有很大的應(yīng)用前景。作為一種純形式語法,在實(shí)際應(yīng)用中,特別是在漢語中,范疇語法還存在著一系列問題。如何促進(jìn)形式跟語義的結(jié)合,應(yīng)該是其發(fā)展中亟待解決的問題。關(guān)鍵詞:范疇語法 語法范疇 計(jì)算語言學(xué) 形式 語義一、“范疇語法”的簡要介紹范疇語法是一種用數(shù)學(xué)方法構(gòu)造的、描寫自然語言的句法理論,它是從生成的角度來對句子的形成進(jìn)行的一種“數(shù)學(xué)運(yùn)算”,可以說,范疇語

2、法也是生成語法的一種。1953年,著名數(shù)理邏輯專家巴爾希列爾(Y.Bar-Hillel)在句法描寫的準(zhǔn)算術(shù)記法一文中,用數(shù)學(xué)中演算的方法對句法類型進(jìn)行了描寫。1958年,數(shù)學(xué)家蘭姆貝克(J.Lambek)在句子結(jié)構(gòu)的數(shù)學(xué)中,提出了句法類型演算的理論。接著,巴爾希列爾進(jìn)一步發(fā)展了句法類型演算的理論,并且對自然語言結(jié)構(gòu)的生成制定了一系列判定程序。句法類型是從語法方面對句子結(jié)構(gòu)所作的一種歸類,是一種語法范疇,1960年巴爾希列爾等在論范疇語法和短語結(jié)構(gòu)語法中,把這種理論稱為范疇語法(categorial grammar)1。這樣,范疇語法逐漸成為一種成熟的句法理論,人們將這種語法理論應(yīng)用到對自然語言

3、的句法研究上,可以判定某個(gè)符號串在某種語言中對語言的計(jì)算處理產(chǎn)生的影響。作為一種新興的句法理論,范疇語法對語言的句法分析也產(chǎn)生了較大影響。范疇語法是通過建立句子中詞語相對應(yīng)的“句法類型”或“范疇”,來實(shí)現(xiàn)對整個(gè)句法結(jié)構(gòu)的“演算”或“推演”的。范疇語法中的兩個(gè)基本范疇是S和N,S相當(dāng)于句子,N相當(dāng)于名詞,句子中的句法成分都可以根據(jù)它的句法功能用S和N(再加上范疇構(gòu)造符“/”“”和左右括號“(”“)”,“/”“”分別表示“左缺”“右缺”)以不同的方式組合起來表示自身的“句法類型”或“范疇”,規(guī)則是:如果有某個(gè)詞,其后面的詞的句法類型是,而它們所構(gòu)成的詞的序列的功能與相同,則這個(gè)詞的句法類型記為/;

4、如果有某個(gè)詞,其前面的詞的句法類型為,而它們所構(gòu)成的詞的序列的功能與相同,則這個(gè)詞的句法類型記為;如果有某個(gè)詞,其前面的詞的句法類型為,其后面的詞的句法類型為,而它們所構(gòu)成的詞的序列的功能與相同,則這個(gè)詞的句法類型為/。例如在漢語中:“蘋果”的句法類型為N,“青蘋果”中的“青”,它后面為名詞“蘋果”,而“青蘋果”的功能與名詞相同,故“青”的句法類型為N/N;“蘋果熟了”中的“熟”,它前面為名詞“蘋果”,而“蘋果爛了”的功能與句子相同,故其句法類型為N;“他吃蘋果”中的“吃”,它前面為名詞“他”,后面為名詞“蘋果”,而“他吃蘋果”的功能與句子相同,故其句法類型為NN;“他吃飽了”中的“飽”,它前

5、面的“吃”的范疇為N,而“吃飽了”的功能與“吃”相同,故其句法類型為(N)N等等。 但是,范疇的標(biāo)注類型與詞類之間并非是一一對應(yīng)的關(guān)系,它主要是針對成分的功能的(這里的功能主要是語法功能),因此,同一個(gè)詞在不同的句法位置上可以有不同的范疇標(biāo)注,如,“吃”在“我吃”中屬于N,而在“我吃蘋果”中屬于NN。根據(jù)這種范疇標(biāo)記的方法,語言中詞語的“句法類型”,即“范疇”都可以描寫出來,這樣,符號串之間的關(guān)系就可以用一系列的范疇表示出來,句子成分的組配相當(dāng)于詞語對應(yīng)范疇之間所進(jìn)行的一系列數(shù)學(xué)演算,演算規(guī)則是“如果有形如a、ar、r的符號序列,那么就用來替換它,同時(shí),它包含兩個(gè)規(guī)則:如果有形如a、 a的符號

6、序列,那么就用來替換它;如果有形如r、r的符號序列,那么就用來替換它?!?根據(jù)范疇標(biāo)注及運(yùn)算規(guī)則可以對語言中的任何符號串進(jìn)行判定,我們可以根據(jù)運(yùn)算最后所得到的結(jié)果是否是“S”來判定句子的語法是否“合格”,即是否能夠成句。如果經(jīng)過有窮的運(yùn)算步驟,運(yùn)算結(jié)果最后為S,那么這個(gè)符號串便是合格的句子。如:首先對該句中的每個(gè)詞進(jìn)行范疇標(biāo)注,根據(jù)范疇標(biāo)注進(jìn)行演算,最后結(jié)果為S,說明“她是一個(gè)漂亮女孩兒”是“合法”的句子。當(dāng)然,這種演算在對自然語言的處理過程中會遇到很多問題,有些句子的處理絕非這么簡單,因?yàn)檎Z言中的句子既是合規(guī)則的又是不合規(guī)則的。很多時(shí)候,現(xiàn)實(shí)語言中的句子并不都是中規(guī)中距的,這就給這種理想化了

7、的語言處理方法帶來非常大的障礙,在漢語這種缺少形態(tài)標(biāo)志的語言中運(yùn)用時(shí)就會碰到更多的問題。二、范疇語法的應(yīng)用及對我們的啟示范疇語法作為一種生成語法,早在1975年,馮志偉先生就在計(jì)算機(jī)應(yīng)用與應(yīng)用數(shù)學(xué)雜志上介紹過,但當(dāng)時(shí)并未引起學(xué)界的重視,直到近年來才在語言的計(jì)算處理方面被廣泛關(guān)注。“生成語法的一個(gè)特點(diǎn)是把語言看作數(shù)學(xué)客體,跟數(shù)學(xué)一樣,它由一組公理和一組推導(dǎo)規(guī)則組成,也跟數(shù)學(xué)中用公理和推導(dǎo)規(guī)則證明一個(gè)數(shù)學(xué)定理是否為真一樣,生成語法用公理和推導(dǎo)規(guī)則證明一個(gè)句子是否符合語法,因此生成語法是一種證明的理論。”2Chomsky并不是生成語法的唯一代表,范疇語法作為生成語法中的一種句法理論,它的光輝幾乎被C

8、homsky的轉(zhuǎn)換生成語法的光芒所遮蓋,因此在產(chǎn)生后很長一段時(shí)間以來,并未產(chǎn)生如轉(zhuǎn)換生成語法那么大的影響,直到后來人們在機(jī)器處理方面才發(fā)現(xiàn)了它巨大的應(yīng)用價(jià)值。范疇語法把語言的構(gòu)成看作是一系列詞語的范疇標(biāo)記的演算過程,通過這種演算我們可以判斷一定的句子在一定的語言中是否“合法”。范疇語法對句子生成的描述可以說是通過詞語之間的互相依存關(guān)系一步一步建立起來的,這種互相依存的關(guān)系往往是一種線性的排列關(guān)系,因此,可以說它的操作前提是語言本身是一個(gè)線性的有序的規(guī)則的系統(tǒng)。對于語言的生成范疇語法是從微觀的一個(gè)個(gè)具體的詞出發(fā)來建立一個(gè)跟這個(gè)詞有關(guān)的合法的鏈條,如果這個(gè)鏈條是按照這個(gè)詞所應(yīng)該后加或前加的范疇來建

9、立的話,那么它就是一個(gè)合法的鏈條。而Chomsky的轉(zhuǎn)換生成語法則基本上是從句子格局的宏觀著眼,通過建立一系列的規(guī)則,通過層層轉(zhuǎn)換來生成一個(gè)具體的句子,語言是從一個(gè)底層的深層裝置(語義層面)通過一系列的轉(zhuǎn)換規(guī)則層層轉(zhuǎn)換為表層裝置(語音平面)輸出來的??梢哉f轉(zhuǎn)換生成語法在對句子的生成的描寫上還注意到了句子的層次性,而范疇語法則較多注意了語言的線性排列。因此,我們說,范疇語法是近年來語言學(xué)中詞匯主義的典型代表。范疇語法在對句子本身生成的闡釋上也有問。范疇語法的實(shí)際操作是在一個(gè)符號串(而不管它到底是否合法)存在的前提下進(jìn)行的,對詞語范疇的標(biāo)記必然涉及到其在符號串中所對應(yīng)的語法功能,這樣,就有了一個(gè)先

10、入為主的理念在前面。“范疇語法”和“語法范疇”是兩個(gè)完全不同的概念,但是我們覺得應(yīng)該在兩者之間尋找一種對應(yīng)關(guān)系。在范疇語法中我們過分強(qiáng)調(diào)句法的形式特征,而對那些僅僅由語義關(guān)系而結(jié)合在一起的結(jié)構(gòu)或變式句、移位句難以描述和解釋清楚。這就要求我們從語義上去尋求解釋的可能性,語義上的尋求必須要建立一定的范疇,即“語義范疇”,即把具有相同或相似的語義功能的詞歸為一類,在兩者之間找到一種聯(lián)系?,F(xiàn)在所出現(xiàn)的詞語的語義網(wǎng)絡(luò)文法可以說是尋求詞語之間語義聯(lián)系的很好代表,我們可以通過這種語義上的網(wǎng)絡(luò)進(jìn)行選擇,然后,再根據(jù)范疇語法里的范疇標(biāo)記進(jìn)行數(shù)學(xué)的演算。這樣,就會克服很大一部分范疇語法里的缺點(diǎn)。或者還可以嘗試將范

11、疇語法與配價(jià)語法(這時(shí)應(yīng)該主要是潛在的語義上的配價(jià))中對語義關(guān)系的研究成果結(jié)合起來。三、范疇語法存在的主要問題及發(fā)展前景范疇語法的提出,它的前提假設(shè)是語言的一種理想狀態(tài)。因?yàn)槿绻覀円獜脑~匯的句法類型中推導(dǎo)出各個(gè)上級結(jié)構(gòu)成分的類型,那就必須認(rèn)為語言中所有的結(jié)構(gòu)都是由詞匯負(fù)載的。事實(shí)上,并非如此,語言中還經(jīng)常存在一些其他結(jié)構(gòu),如:漢語中的主謂謂語結(jié)構(gòu)、連謂結(jié)構(gòu)以及復(fù)句中小句之間的結(jié)構(gòu),很難說是詞匯結(jié)構(gòu)。而有些語義結(jié)構(gòu)僅僅用詞匯的結(jié)構(gòu)是難以描述完備的,特別是在實(shí)際的語言運(yùn)用中,變式句和移位句是經(jīng)常存在的,這些句子的實(shí)際內(nèi)部結(jié)構(gòu)肯定不能簡單的按照詞匯結(jié)構(gòu)的標(biāo)準(zhǔn)去認(rèn)定。范疇語法只有詞庫而沒有規(guī)則,它主

12、要是通過詞庫中詞語的范疇標(biāo)記的運(yùn)算來生成句子的。如果要按照運(yùn)算規(guī)則實(shí)現(xiàn)句法類型的演算,那么它就必須假設(shè)語言中所有成分的結(jié)合必定是鄰接成分的結(jié)合,而不能有超越鄰接成分的超距離結(jié)合。事實(shí)上這也是不可能的,像剛才我們所提到的變式句和移位句,它們的內(nèi)部結(jié)構(gòu)都是超距離的,并不是線性的。再如,語句中有些成分的語義指向并不是簡單的前指或后指,它可以跨越語言的層次和別的成分發(fā)生語義上的關(guān)系等等。特別是在漢語中,句子語言成分之間的意合性非常強(qiáng),因此對某些句子的存在就更加難以預(yù)料和解釋清楚。因此,這些理想的假設(shè),就使范疇語法在語言學(xué)的句法分析和機(jī)器計(jì)算上產(chǎn)生了一系列問題:在確定句法成分的范疇標(biāo)記時(shí),它和詞類不是一

13、一對應(yīng)的,我們必須在一定的符號串中才能確定。而有時(shí)候確定起來就相當(dāng)困難,尤其是遇到虛字詞時(shí),困難就更加明顯。漢語的詞語缺少形態(tài)標(biāo)記,很多詞的詞性本身就很難確定,漢語詞語的兼類現(xiàn)象又大量存在(指絕對數(shù)量),這都給范疇標(biāo)記的確定帶來一定的困難;當(dāng)我們遇到那些超距離成分時(shí),符號串的演算就很難或無法進(jìn)行,如變式句和移位句的演算,以及遇到那些超常搭配的句子,如:一定語境下,不及物動(dòng)詞帶上賓語的句子;動(dòng)詞或形容詞做主語或謂語的句子等。范疇語法中存在的兩個(gè)基本范疇S和N有時(shí)候無法承擔(dān)表達(dá)復(fù)雜類型之間的演算關(guān)系的任務(wù),特別是在漢語這種“意合性”極強(qiáng)的語言中,其對句法完備性的要求是很低的,很多時(shí)候句子都可以省掉

14、一些成分或隱含一些成分而不影響句子本身的合法性和理解,如漢語中的主語承前省略或謂詞隱含等,用范疇語法描述的時(shí)候所遇到的困難就會有很多。應(yīng)用范疇語法來建立漢語語義范疇的演算系統(tǒng),還有很多問題需要探索,還有很長的路要走,需要大家的共同努力。范疇語法所存在的問題主要是由于它本身過分注重形式而較少關(guān)注句子成分之間的語義關(guān)系而造成的,因此,我們應(yīng)該探求把句法范疇和語義范疇結(jié)合起來,以便在句法描述和語義描述之間找到一種對應(yīng)關(guān)系。只能用此方法我們才能不停留在理想的層面,而是更加現(xiàn)實(shí)、更加詳細(xì)完備地描述復(fù)雜的規(guī)則而又非規(guī)則的自然語言。范疇語法作為一種句法理論,它在句子生成領(lǐng)域所作的探討具有先導(dǎo)性。雖然還存在著種種不足,但是其成果在句法分析和語言的計(jì)算處理上還是顯示出了它的實(shí)際可操作性,特別是在計(jì)算機(jī)處理領(lǐng)域,越來越多的人認(rèn)識到了范疇語法的重要性。它已經(jīng)成為當(dāng)代計(jì)算語言學(xué)的理論基石之一,具有很好發(fā)展空間和前景。范疇語法存在的問題,需要我們在以后的研究中,逐步建立各種規(guī)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論