![基于語料庫的中國高級英語學(xué)習(xí)者詞塊使用研究_第1頁](http://file4.renrendoc.com/view/705e2288212c7d7566b27df43a0fcf8c/705e2288212c7d7566b27df43a0fcf8c1.gif)
![基于語料庫的中國高級英語學(xué)習(xí)者詞塊使用研究_第2頁](http://file4.renrendoc.com/view/705e2288212c7d7566b27df43a0fcf8c/705e2288212c7d7566b27df43a0fcf8c2.gif)
![基于語料庫的中國高級英語學(xué)習(xí)者詞塊使用研究_第3頁](http://file4.renrendoc.com/view/705e2288212c7d7566b27df43a0fcf8c/705e2288212c7d7566b27df43a0fcf8c3.gif)
![基于語料庫的中國高級英語學(xué)習(xí)者詞塊使用研究_第4頁](http://file4.renrendoc.com/view/705e2288212c7d7566b27df43a0fcf8c/705e2288212c7d7566b27df43a0fcf8c4.gif)
![基于語料庫的中國高級英語學(xué)習(xí)者詞塊使用研究_第5頁](http://file4.renrendoc.com/view/705e2288212c7d7566b27df43a0fcf8c/705e2288212c7d7566b27df43a0fcf8c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
基于語料庫的中國高級英語學(xué)習(xí)者詞塊使用研究
1.引言短語學(xué)(phraseology)是近年來語言學(xué)研究關(guān)注的焦點(diǎn),詞塊則是語料庫和相應(yīng)技術(shù)出現(xiàn)后形成的一種短語研究單位。短語研究大體可分為理論驅(qū)動(dòng)和語料庫驅(qū)動(dòng)研究兩類(衛(wèi)乃興2007)。語料庫問世之前,經(jīng)典的短語學(xué)研究始于俄羅斯學(xué)派(Cowie1998),以定性研究為主,對短語進(jìn)行了詳盡分類,最早的“詞級”(word-like)和“句級”(sentence-like)短語、成語和“限制性搭配”(restrictedcollocation)的二分法即來源于俄羅斯學(xué)派(Zgusta1971;Mel’cuk1988),其依據(jù)是直覺或“心理凸顯性”(psycholoicalsalience),沒有真實(shí)語言使用中的頻率、分布等定量信息支持。與此相反,語料庫驅(qū)動(dòng)的短語學(xué)研究基于真實(shí)數(shù)據(jù),以頻數(shù)信息為出發(fā)點(diǎn),研究涉及大量多種多樣的詞語序列及其形式與功能特征。另外,還有一類過渡型的短語研究結(jié)合了經(jīng)典理論和語料庫信息,如Moon(1998)調(diào)查權(quán)威字典中的短語在專門語料庫中的使用情況。這一類研究的不足之處在于無法揭示語言使用中大量未收入字典和文獻(xiàn)的“半規(guī)則”短語的用法規(guī)律。這些短語的形式和功能受句法之外的使用規(guī)約限制,同時(shí)又是母語式選擇與流利的標(biāo)志(native-likeselectionandfluency,Pawley&Syder1983),其最大的使用特征就是頻率高、分布廣,是語料庫驅(qū)動(dòng)短語學(xué)研究的主要研究對象。2.詞塊的界定與分類詞塊(lexicalchunk)是語料庫驅(qū)動(dòng)短語學(xué)研究的一種詞語序列或單位。詞塊的界定可包括“詞性”和“塊性”:詞性即作為語言單位使用的屬性,描述了詞塊在語言使用中頻率高、分布廣,在實(shí)時(shí)語言處理中不同程度地都具有像單個(gè)詞一樣的作用和功能特征,如“howareyou”的整體使用及其問候功能;塊性則是詞塊區(qū)別于其他語言單位的特性:一個(gè)較長的詞語序列,詞序相對固定,以連續(xù)的形式出現(xiàn)。試將詞塊與一般意義上的“搭配”比較:后者在形式上較為靈活,通常由一定跨距內(nèi)的兩個(gè)詞形構(gòu)成,不一定連續(xù),有一定的句法關(guān)系,如“take…bus”(衛(wèi)乃興2002);而詞塊則是包括功能詞在內(nèi)的一個(gè)相對連續(xù)的語言使用單位,長度或結(jié)構(gòu)相對靈活,是語言社團(tuán)在給定語境中表達(dá)特定意義或功能的手段,如“takeiteasy”(Stubbs2002)。語料庫驅(qū)動(dòng)的詞塊研究中,Altenberg的工作特別值得關(guān)注,因?yàn)樗钤绮捎谜Z料庫頻率信息識(shí)別詞塊。他早期對“London-LundCorpus(LLC)”口語語料庫的調(diào)查發(fā)現(xiàn)LLC中70%都是“復(fù)現(xiàn)詞語組合”(recurrentword-combination),復(fù)現(xiàn)詞語組合在口語中無處不在而且富于變化(Altenberg1998;Altenberg&Eeg-Olofsson1990)。Altenberg另外一個(gè)被廣為引用的詞塊研究成果就是他對復(fù)現(xiàn)詞語組合所做的結(jié)構(gòu)分類和數(shù)據(jù)分布描述,包括句子層面的獨(dú)立小句(independentclause)、依附小句(dependentclause)和詞語層面的多個(gè)句子成分(multipleclauseconstituent)、單個(gè)句子成分(singleclauseconstituent)和不完整短語(incompletephrase)。其中,多個(gè)句子成分又依據(jù)在小句中的分布位置分為框架語(frame)、起始語(onset)、主干語(stem)、中間語(medial)、述位語(rheme)、尾巴語(tail)和過渡語(transition):框架語處于小句單位的首位,多由連詞或句子修飾成分構(gòu)成;起始語通常由話語連接語(discourseitem)和部分或全部主語構(gòu)成;主干語由主語和部分或全部謂語構(gòu)成;中間語由謂語和部分或全部賓語構(gòu)成;述位語①由賓語和補(bǔ)語構(gòu)成;尾巴語和過渡語則由句子尾部的狀語和話語修飾成分構(gòu)成。這個(gè)分類承上啟下,體現(xiàn)了詞塊在傳統(tǒng)語法范式中的句法結(jié)構(gòu)和小句分布位置上的靈活性。Biber是另一個(gè)詞塊研究的先鋒人物。他的貢獻(xiàn)在于將單純頻率之外的分布因素納入詞塊的判斷標(biāo)準(zhǔn)。Biber等(1999)對“LongmanCorpusofWrittenandSpokenEnglish”中頻率高、分布廣的“詞串”(lexicalbundle)做了詳細(xì)調(diào)查。Biber等(2004)還對“T2K-SWAL”(TOEFL2000SpokenandWrittenAcademicLanguage)語料庫中的高頻且廣泛分布的詞串做了文體對比研究。Biber的另一重要貢獻(xiàn)就是對詞串所做的功能分類(Biberetal2003;Biberetal2004),其中的四個(gè)核心分類:指稱性詞串(referentialbundle)、組織性詞串(textorganizer)、態(tài)度性詞串(stancebundle)和人際性詞串(interactionalbundle)以Halliday(1994)提出的語言的概念、人際和組織(ideational,interpersonal,organizational)三個(gè)元功能為框架。指稱性詞串指客觀或抽象的對象甚至篇章自身,既可以指稱對象本身,也可以指稱對象的特定特征,如“there’salotof”,“alittlebitmore”;組織性詞串組織話語或篇章,表明前后話語的關(guān)系,如“ifyoulookat”,“ontheotherhand”;態(tài)度性詞串表明說話人對說話內(nèi)容的態(tài)度或評價(jià),如“Idon’tknowif”,“Ithinkitwas”;人際性詞串則表明說話人對說話對象的態(tài)度,如“thankyouverymuch”。3.詞塊與二語習(xí)得在語言描述中起關(guān)鍵作用的詞塊在語言習(xí)得中也同樣重要,詞塊集中體現(xiàn)了語言使用的規(guī)約性,對詞塊使用的掌握最終表現(xiàn)為母語式的選擇與流利,也就是習(xí)得的成功(Pawley&Syder1983)。二語或外語習(xí)得不同于母語習(xí)得,各種各樣的因素如中介語資源的不足、語內(nèi)和語際的干擾等都會(huì)引起學(xué)習(xí)者詞塊使用的偏差。而二語習(xí)得和母語習(xí)得之間一些更為本質(zhì)的不同,包括不同的習(xí)得外部環(huán)境如語言輸入和教學(xué)模式等、不同的學(xué)習(xí)者個(gè)人特點(diǎn)如分析能力等(Wray2002)更是導(dǎo)致代表語言使用規(guī)約性的詞塊成為二語習(xí)得的瓶頸,尤其是對高級學(xué)習(xí)者而言。對學(xué)習(xí)者詞塊使用的研究,如Milton和Freeman(1996)對香港EFL學(xué)習(xí)者作文中的詞塊調(diào)查,發(fā)現(xiàn)學(xué)習(xí)者對一些固定用法過度依賴。DeCock等(1998,2000,2004)研究了母語為法語的EFL學(xué)習(xí)者的詞塊使用,證偽了兩個(gè)長期存在的命題:口語比筆語更多使用詞塊,學(xué)習(xí)者詞塊大多由規(guī)則生成而缺乏應(yīng)有的本族語規(guī)約;學(xué)習(xí)者的詞塊使用也反映出他們目標(biāo)語資源的缺乏。衛(wèi)乃興(2004)則研究了中國EFL學(xué)習(xí)者的詞塊使用并提出了一套適合中國學(xué)習(xí)者的詞塊結(jié)構(gòu)和功能的分類法。此外,Milton和Freeman(1996)、衛(wèi)乃興(2004)、趙娟(2003)還發(fā)現(xiàn)了小句或話語的某些分布位置。例如,句子或話語開頭傾向于多用表達(dá)特定功能的詞塊,像表明態(tài)度、爭取時(shí)間等類的詞塊。詞塊與理論驅(qū)動(dòng)范式下短語的一個(gè)區(qū)別在于詞塊的句法特征不一定完整,這也從一個(gè)側(cè)面反映了語言使用是創(chuàng)新性與規(guī)約性的辯證統(tǒng)一。句法規(guī)則不是萬能的,可能生成符合語法但不為本族語者接受的句子(grammaticalbutunacceptable,Miller&Chomsky1963),規(guī)約性是對句法規(guī)則創(chuàng)新性的制約。詞塊就是語言使用中規(guī)約性的集中體現(xiàn),句法特征不完整的部分則是創(chuàng)新性與句法規(guī)則發(fā)生作用的部分,也就是Sinclair(1991)所論述的“成語原則”(idiomprinciple)與“開放選擇原則”(open-choiceprinciple)在語言使用中的交替作用。如對語料庫中抽取出的詞塊進(jìn)行合理抽象或擴(kuò)展,形成有一定抽象程度的詞塊或“詞匯化句干”(lexicalizedsentencestems,Pawley&Syder1983),其形式、意義和功能都相對完整,則可以較為有效地應(yīng)用于語言教學(xué)實(shí)踐。4.研究方法本研究的目的是設(shè)計(jì)一套詞匯抽取和分類方案,較為細(xì)致地考察中國高級EFL學(xué)習(xí)者口筆語中詞塊使用的偏差,分析產(chǎn)生偏差的內(nèi)在機(jī)理,并在此基礎(chǔ)上進(jìn)一步提出教學(xué)方面的相關(guān)建議。4.1采用的語料庫本研究探討中國高級EFL學(xué)習(xí)者的詞塊使用,主要采用的學(xué)習(xí)者語料庫是COLSEC(CollegeLearners’SpokenEnglishCorpus)和CLEC(ChineseLearnerEnglishCorpus)的非英語專業(yè)大學(xué)生語料庫COLEC(CollegeLearnerEnglishCorpus)。這兩個(gè)庫是學(xué)習(xí)者口語和筆語產(chǎn)出的姊妹庫,也是目前為止最具代表性的中國非英語專業(yè)大學(xué)生英語語料庫。本研究采用的本族語對比語料庫是BNC(BritishNationalCorpus)的會(huì)話部分和LOCNESS(LouvainCorpusofNativeEnglishEssays),后者是比利時(shí)Louvain大學(xué)建立的本族語大學(xué)生作文語料庫,也是ICLE(InternationalCorpusofLearnerEnglish)系列研究中常用的本族語筆語參照庫。在經(jīng)過“去碼”等一系列處理后,兩個(gè)口語語料庫均為560,000詞左右,兩個(gè)筆語語料庫均為280,000詞左右。因此,筆語庫生成的所有統(tǒng)計(jì)數(shù)據(jù)都經(jīng)過了乘以2的“標(biāo)準(zhǔn)化”(normalization)處理,以使結(jié)果具有可比性。4.2詞塊抽取方案本研究的詞塊抽取方案包括詞塊長度和最低頻率、詞塊分布及詞塊邊界確定等三個(gè)內(nèi)容。4.2.1詞塊長度和最低頻率詞塊是在語言使用中具有詞匯地位的多詞單位。參考以往研究及筆者的先導(dǎo)研究,本研究詞塊抽取的長度范圍定為2-6詞,2詞詞塊是多詞單位的起點(diǎn),6詞以上詞塊在各種語言使用中則較為少見。詞塊使用受社會(huì)因素制約,一定是語言使用中相對高頻出現(xiàn)的。目前現(xiàn)有關(guān)于最低頻率的研究大多給每個(gè)長度的詞塊單獨(dú)定一個(gè)最低頻率,稍顯主觀。本研究則參考DeCock(1998)的做法,將每一長度詞塊的前10%的高頻實(shí)例作為研究對象。4.2.2詞塊分布Wray(2002)曾經(jīng)提到單純頻率標(biāo)準(zhǔn)的不可靠性,其一是可能納入一些只有“十五分鐘熱度”或有話題或文體偏向性的表達(dá)法,其二是單純頻率標(biāo)準(zhǔn)無法解決詞塊抽取中一直困擾研究者的詞塊邊界確定問題。上文提到Biber(1999)最早把分布標(biāo)準(zhǔn)引入詞塊研究。他的做法是:經(jīng)過頻率初選后的備選詞塊在所研究語料庫的5篇以上文本中出現(xiàn)才是合格的研究對象。本研究所采取的方法如下:把要研究的語料庫盡量均勻、隨機(jī)分成7等分。以COlSEC為例,該庫由302個(gè)獨(dú)立文本構(gòu)成,分別從1到302進(jìn)行編號(hào),然后用一個(gè)隨機(jī)數(shù)生成工具把這302個(gè)編號(hào)盡量平均地編為7組,再用隨機(jī)生成的7組編號(hào)把原語料庫分為7個(gè)子庫,在這7個(gè)子庫中用Wordsmith軟件做“詳細(xì)一致性分析”②,先取得在4個(gè)以上子庫中都出現(xiàn)的頻率在4次以上的詞塊,再取每一長度詞塊的前10%作為備選詞塊,這樣取得的備選詞塊滿足了分布范圍廣且出現(xiàn)頻率高兩個(gè)判斷標(biāo)準(zhǔn)。4.2.3詞塊邊界確定上文提到,詞塊邊界確定一直是困擾研究者的問題,在本文中這一問題表現(xiàn)為不同長度詞塊的重疊;如果不加處理,3詞詞塊中可能出現(xiàn)“makefriendswith”,而2詞詞塊中也會(huì)出現(xiàn)“makefriends”,進(jìn)而影響詞塊頻率的統(tǒng)計(jì)信息。為了解決這一問題,本研究采取了以下做法:抽取工作從長詞塊起,抽取短詞塊時(shí)在語料庫中屏蔽所有已經(jīng)抽取的長詞塊,即先抽取6詞詞塊,選定合格詞塊后在語料庫中屏蔽所有合格的6詞詞塊,然后抽取5詞詞塊,選定合格詞塊后把語料庫中所有合格的5詞詞塊也屏蔽,再抽取4詞詞塊,以此類推,從而最大限度地避免了長短詞塊的重疊問題。從各子庫抽取出的備選詞塊經(jīng)必要的手工過濾之后,連同它們的頻率信息形成了初步的詞塊數(shù)據(jù)庫,下一步工作就是詞塊結(jié)構(gòu)和功能的分類。4.3詞塊賦碼方案本研究的詞塊結(jié)構(gòu)分類參照上文提到的Altenberg(1998)系統(tǒng)并稍加改動(dòng),減掉了跨多個(gè)句子成分MCC中的尾巴語和過渡語,因?yàn)橄葘?dǎo)研究發(fā)現(xiàn)這兩種詞塊極少出現(xiàn)。句子類結(jié)構(gòu)分獨(dú)立小句和依附小句、結(jié)構(gòu)跨越多個(gè)句子成分的MCC和單個(gè)句子成分,另外還有類似短語框架的不完整短語。其中,MCC又可分為框架語、起始語、主干語、中間語和述位語。功能分類則參考Biber等(1999)提出的4個(gè)核心類別,分別分為指稱性、態(tài)度性、人際性和組織性詞塊。賦碼后的數(shù)據(jù)庫大致如表1所示。表1以BNC為例的詞塊賦碼數(shù)據(jù)庫示例5.結(jié)果與討論圖1顯示了CLEC、COLSEC、BNC和LOCNESS4個(gè)語料庫中有關(guān)詞塊的數(shù)據(jù)分布特征。由數(shù)據(jù)可見,學(xué)習(xí)者和本族語者口筆語中的5個(gè)結(jié)構(gòu)類詞塊,不論“類符”(type)還是“形符”(token)③,都是跨越多個(gè)句子成分MCC所占比例最高。進(jìn)一步比較口語和筆語數(shù)據(jù),口語中的MCC詞塊比例又相對較高。本族語者口語數(shù)據(jù)庫中,即BNC中MCC類符占所有詞塊類符的66%。學(xué)習(xí)者數(shù)據(jù)庫中,COLSEC的MCC類符占了63%,COLEC的MCC類符占了51%。這一特征與Altenberg(1998)對本族語者口語語料庫LLC(London-LundCorpus)所做調(diào)查的結(jié)果一致,其中MCC的類符比例為56%。這從一個(gè)側(cè)面說明了MCC較為集中地反映了詞塊的本質(zhì)特征,即詞塊是語言使用中規(guī)約性和創(chuàng)新性結(jié)合的產(chǎn)物,形式相對固定,本身有一定的穩(wěn)定性,而其前后的擴(kuò)展則可以根據(jù)句法規(guī)則的允許度生成,如附在句前表示態(tài)度的框架語中的“youknow”,“Imean”,中間語中的“usedto”,“supposedtobe”等。兩組筆語數(shù)據(jù)中MCC詞塊比例也占絕對優(yōu)勢,但與口語數(shù)據(jù)相比,筆語中如“duetothefactthat”的依附小句類詞塊、如“anexampleof”的類似搭配框架的不完整短語類詞塊,比例上升,體現(xiàn)了筆語句子較為復(fù)雜的文體特征。本節(jié)將從兩個(gè)方面描述和分析中國高級EFL學(xué)習(xí)者的詞塊使用情況:首先從宏觀角度出發(fā),以MCC詞塊為例考察詞塊功能在不同語料庫中的分布及詞塊功能與分布的交互,以期發(fā)現(xiàn)學(xué)習(xí)者詞塊功能的一些重要趨勢和問題;其次從微觀角度出發(fā),以MCC中的述位語為例對比分析學(xué)習(xí)者的詞塊使用特征,并討論研究結(jié)果在教學(xué)實(shí)踐中的應(yīng)用。圖1四庫中的結(jié)構(gòu)分布比例堆積圖(圖例:cs代表COLSEC,bnc代表BNC,cl代表COLEC,loc代表LOCNESS,以下圖表均依此例)5.1宏觀角度本節(jié)將首先采用相應(yīng)分析這一統(tǒng)計(jì)手段考察不同語料庫中的詞塊功能分布。相應(yīng)分析可以把不同維度的真實(shí)數(shù)據(jù)置于同一平面展示其距離關(guān)系,其方法是通過主成分分析(principalcomponentialanalysis)用抽象維度代替真實(shí)維度。圖2即通過抽象維度直觀展示了語料庫和詞塊功能的距離關(guān)系。統(tǒng)計(jì)結(jié)果顯示,這兩個(gè)抽象維度共同揭示了兩個(gè)真實(shí)維度97.5%的“慣量”(inertia),因此相應(yīng)分析的結(jié)果是可靠的。由圖2可以看出,本族語者筆語靠近指稱功能,本族語者口語與人際功能最接近,口筆語間有較明顯的文體差異。而學(xué)習(xí)者口筆語用法都與態(tài)度功能成簇,在筆語中也傾向于寫下想要說的話,文體意識(shí)不明確。學(xué)習(xí)者用詞塊表達(dá)功能的能力有待發(fā)展。圖2詞塊功能和不同語料庫的相應(yīng)分析繼而,我們將目光轉(zhuǎn)向詞塊功能與分布的交互。結(jié)果發(fā)現(xiàn),表達(dá)特定功能的詞塊有時(shí)傾向于出現(xiàn)在特定的小句位置上。如下頁圖3所示,組織性詞塊大部分出現(xiàn)在主干語stem之前的分布位置上,學(xué)習(xí)者和本族語者主干語位置上的組織性詞塊多是框架語和起始語的延續(xù)。數(shù)據(jù)顯示,組織性詞塊多以“and”、“but”、“so”和“then”開始??谡Z中較多使用“so”開頭的組織性詞塊,可能是因?yàn)椤皊o”一詞的多種意義,即既可以表示邏輯上的因果關(guān)系意義,又可以表達(dá)特定的語用功能。學(xué)習(xí)者口筆語和本族語者筆語中的中間語位置上也有少量組織功能詞塊,都是圍繞“also”展開,“also”詞塊運(yùn)用是否是本族者語筆語用法的文體特征還有待于通過更大規(guī)模的語料庫調(diào)查進(jìn)行求證。圖3按分布分類的四庫指稱性詞塊的分布位置比例堆積圖圖4按分布分類的四庫態(tài)度性詞塊的分布位置比例堆積圖圖5按分布分類的四庫人際性詞塊的分布位置比例堆積圖圖6按分布分類的四庫組織性詞塊的分布位置比例堆積圖圖3-6給出了四庫中四種詞塊的分布位置比例堆積圖。由圖可見,學(xué)習(xí)者偏愛態(tài)度性詞塊,而本族語者多用指稱性詞塊。四庫中的指稱性詞塊多出現(xiàn)在小句的主干語位置上。本族語者口筆語中的指稱性主干語詞塊均比學(xué)習(xí)者口筆語多。數(shù)據(jù)顯示,本族語者數(shù)據(jù)中的大量指稱性主干語詞塊涉及多樣化的主語、時(shí)態(tài)、情態(tài)和語態(tài),而學(xué)習(xí)者則多用第一、二人稱,時(shí)態(tài)、情態(tài)、語態(tài)等也較單一。態(tài)度性詞塊則正好相反,學(xué)習(xí)者口筆語中的態(tài)度性詞塊都超過了本族語者口筆語,主干語位置上的態(tài)度性詞塊比其他分布位置上多,但態(tài)度性詞塊在四庫中的位置傾向不像指稱性詞塊那么明顯。值得注意的是,本族語者口語中的人際性詞塊使用一枝獨(dú)秀,尤其出現(xiàn)在主干語位置上,包括“Ibetyou”,“Itoldyou”,“whydon’tyou”等。實(shí)際上,本族語者口語中的人際性詞塊數(shù)量多且富有多樣性,包括MCC在內(nèi)的各種結(jié)構(gòu)層次的詞塊均是如此。最典型的是獨(dú)立小句,常見的人際性詞塊包括“that’sright”,“comeon”,“goonthen”,“don’tworryaboutit等。學(xué)習(xí)者口語中的人際性詞塊使用則稍顯單調(diào),大部分是問候語和考試場景下使用的“Iquiteagreewithyou”,“Idon’tagreewithyou”,話語發(fā)展IRF(Initiation-Response-Follow-up)模型(Sinclair&Coulthard1975)中的回應(yīng)和反饋手段缺乏,有待發(fā)展。5.2微觀角度由賓語和補(bǔ)語構(gòu)成的述位語是一個(gè)特殊的分布位置,在Halliday(1994)的小句信息結(jié)構(gòu)中屬于新信息(newinformation)的所在位置,而此前的框架語、起始語等則是給定信息(giveninformation)所在的位置。如此,話語的新舊信息才能交替推進(jìn)。據(jù)此設(shè)想,述位語處的詞塊使用應(yīng)該相對最少,圖7的MCC分布位置比例信息和表2的述位語詞塊類符/形符信息也證明了這一點(diǎn)。LOCNESS即本族語者筆語語料庫中,甚至沒有出現(xiàn)述位語詞塊。但學(xué)習(xí)者數(shù)據(jù)庫中的述位語詞塊不僅使用比例高,而且口筆語間沒有明顯的文體差別,與本族語者數(shù)據(jù)特征明顯不同。圖7四庫中MCC分布位置比例堆積圖表2四庫中述位語詞塊的類符/形符信息為調(diào)查學(xué)習(xí)者多用述位語詞塊的原因,我們首先分析了各庫述位語的功能。從圖8來看,本族語者口語中的述位語詞塊多為指稱性詞塊,而學(xué)習(xí)者口筆語中的述位語多是態(tài)度性詞塊。本族語者口語中的指稱性述位語多涉及意義虛化的動(dòng)詞,如“doit”,“getit”,“takeit”,在句中的擴(kuò)展形態(tài)有“doitproperly”,“getitover”,“takeitoff”等,顯示出規(guī)約性下的詞匯語法變異。而學(xué)習(xí)者使用的指稱性詞塊則意義比較單一,如“studyhard”,“savemoney”,“helpeachother”,“spendalotoftime”等。這雖然與語料的考試場景有一定關(guān)系,但還是從一個(gè)側(cè)面反映了學(xué)習(xí)者詞塊的形式與意義單調(diào)性。再與學(xué)習(xí)者最常用的態(tài)度性詞塊結(jié)合起來看,更說明學(xué)習(xí)者詞塊的高度重復(fù)和單調(diào)性。這一點(diǎn)從表3所示COLSEC的態(tài)度性述位語詞塊可見一斑。學(xué)習(xí)者筆語中為數(shù)不多的述位語詞塊中,30%是類似“isthebestway”,“isveryimportant”這樣的態(tài)度性詞塊。學(xué)習(xí)者口語中獨(dú)有的人際性述位語詞塊,如“agreewithyou”,“gladtomeetyou”,應(yīng)該是COLSEC語料考試場景的制約因素所致。圖8按功能分類的四庫述位語詞塊的比例分布堆積圖表3COLSEC中述位語詞塊示例如前所述,詞塊對語言描述最大的啟示就是語言使用中規(guī)約性與創(chuàng)新性的相輔相成。如何將詞塊有效地應(yīng)用于語言教學(xué)是一個(gè)值得認(rèn)真思考的問題。本研究提出如下方案:對研究所得的詞塊進(jìn)行歸并或抽象,歸并或抽象后的詞塊既有一定的生成力,又保留了語言使用的規(guī)約性。例如,表3中的“ISGOOD”,“ISNOTGOOD”和“ISNOTVERYGOOD”可以歸并和抽象為“(S)IS(NOT|VERY)GOOD④”;同理,“ISIMPORTANT”,“ISVERYIMPORTANT”,“ISALSOVERYIMPORTANT”可以歸并成“(S)IS(ALSO|VERY)IMPORTANT”。抽象程度還可以進(jìn)一步提高,例如把詞塊抽取放在詞性碼(partofspeech)賦碼以后進(jìn)行,這樣就可以得到如下直接可用的詞塊:ITIS(adv1|adv2)IMPORTANT[advl=also,adv2=very]。對其擴(kuò)展還可以得到Pawley和Syder(1983)所提倡的詞匯化句干,如“NPbe-TENSEsorrytokeep-TENSEyouwaiting”變體之一為“Iamsorrytohavekeptyouwaiting”。有一定抽象程度的詞塊,因其形式、意義和功能都相對完整,可以作為語言教學(xué)單位使用。詞塊在語言教學(xué)中的應(yīng)用還不止于此,還可以從功能入手讓學(xué)習(xí)者發(fā)現(xiàn)使用中的偏差并加以改正。如前述學(xué)習(xí)者表示態(tài)度的詞塊可擴(kuò)展為“itISADJPhrase|NounPhrase(forsb.)(todosth.)”,變體包括“itisveryimportanttostudyhard”,“itisthebestwayforustohelpeachother”。而本族語者表明態(tài)度的手段則主要為使用以情態(tài)動(dòng)詞為核心的詞塊⑤。表4是LOCNESS中的態(tài)度性詞塊示例,在真實(shí)交際中的使用實(shí)例包括“TVcanbeanexcellenttoolforunderstandingtheworld”,“theyshouldbemoreselectivewithwhattheychoose”,“thejobtrainingmustberealistic”等。從中可以看出,用情態(tài)動(dòng)詞詞塊表明態(tài)度不僅形式多樣,所表達(dá)的態(tài)度意義也更加豐富。在語言教學(xué)中可以用詞語索引顯示學(xué)習(xí)者偏好并與本族語者語言實(shí)例對比,突出差異,引導(dǎo)學(xué)習(xí)者修正。表4LOCNESS中態(tài)度性詞塊示例6.結(jié)論與展望本研究設(shè)計(jì)了一套可操作的詞塊抽取和賦碼方案,并將之應(yīng)用于中國高級英語學(xué)習(xí)者詞塊使用的調(diào)查分析。詞塊抽取方案中的頻率和分布兩個(gè)標(biāo)準(zhǔn)在以往研究經(jīng)驗(yàn)基礎(chǔ)上做了合理改進(jìn),解決了詞塊邊界確定問題,即由長至短抽取詞塊,抽取短詞塊時(shí)屏蔽長詞塊。本文以多個(gè)句子成分MCC為例,先從宏觀角度考察了學(xué)習(xí)者和本族語者不同性質(zhì)詞塊的使用趨勢、詞塊功能和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年患者隱私保護(hù)協(xié)議與策劃
- 2025年企業(yè)銷售人員招聘合同范例
- 2025年企業(yè)人員臨時(shí)借調(diào)合同范文
- 2025年居民安置過渡性協(xié)議
- 2025年個(gè)人流轉(zhuǎn)養(yǎng)殖水面使用權(quán)協(xié)議
- 2025年共享發(fā)展市場拓展協(xié)議
- 2025年產(chǎn)業(yè)園區(qū)企業(yè)使用條款協(xié)議
- 2025年醫(yī)療設(shè)備更新協(xié)議文本
- 2025年醫(yī)院食堂后勤服務(wù)合同標(biāo)準(zhǔn)格式
- 農(nóng)業(yè)合作社土地使用權(quán)入股框架協(xié)議
- 高中英語定語從句之哪吒-Attributive Clause 課件
- 仁愛版八年級英語下冊全冊教案
- 醫(yī)療安全不良事件警示教育課件
- 《幼兒園健康》課件
- 醫(yī)保物價(jià)培訓(xùn)課件
- 2024年國新國際投資有限公司招聘筆試參考題庫含答案解析
- 心肌梗死心律失常的機(jī)制和處置
- 塑料產(chǎn)品報(bào)價(jià)明細(xì)表
- 供應(yīng)商來料包裝運(yùn)輸存儲(chǔ)規(guī)范標(biāo)準(zhǔn)
- 化療藥物分類及不良反應(yīng)的處理課件
- 銀行職工學(xué)習(xí)違規(guī)違紀(jì)典型案例心得體會(huì)5篇
評論
0/150
提交評論