語料庫語言學(xué)_第1頁
語料庫語言學(xué)_第2頁
語料庫語言學(xué)_第3頁
語料庫語言學(xué)_第4頁
語料庫語言學(xué)_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

應(yīng)用語言學(xué)的最新成果語料庫語言學(xué)(CorpusLinguistics)

1.定義語料庫語言學(xué)(Corpuslinguistics)是基于語言運(yùn)用的實(shí)例(即語料庫)的語言研究。語料庫語言學(xué)可以對(duì)自然語言進(jìn)行語法與句法分析,還可以研究它與其他語言的關(guān)系。語料庫最初由手工完成,而現(xiàn)在主要是由計(jì)算機(jī)自動(dòng)完成。語料庫語言學(xué)家相信,可靠的語言分析需建立在新鮮的語料、自然的語言環(huán)境,和最小的實(shí)驗(yàn)干擾之上。在語料庫語言學(xué)中,語料標(biāo)注的意義眾說紛紜,從約翰?辛克萊主張最少量的標(biāo)注,并允許文本“為自己說話”,到“英語用法調(diào)查組”(設(shè)在倫敦大學(xué)學(xué)院)鼓勵(lì)更多的標(biāo)注,并認(rèn)為它是通向更完備和嚴(yán)謹(jǐn)?shù)恼Z言理解的道路。約翰?辛克萊約翰·辛克萊是第一代現(xiàn)代語料庫語言學(xué)家和COBUILD項(xiàng)目的創(chuàng)始人。該項(xiàng)目的目標(biāo)是為了學(xué)習(xí)英語的外國學(xué)生,建立語料庫驅(qū)動(dòng)的詞典。他成為了柯林斯COBUILD英語詞典(第一版出版于1987年)的首席顧問。他開創(chuàng)了對(duì)語料庫語言學(xué),話語分析,詞典編纂和語言教學(xué)的研究。語料庫語言學(xué)是一個(gè)獨(dú)立的學(xué)科,它有自己獨(dú)到的理論體系和操作方法。由于語料庫語言學(xué)立足于大量真實(shí)的語言數(shù)據(jù),對(duì)語料庫所做的系統(tǒng)而窮盡的觀察和概括所得到的結(jié)論對(duì)語言理論建設(shè)具有無可比擬的創(chuàng)新意義。而在另外一些研究者看來,語料庫語言學(xué)并非語言學(xué)的又一個(gè)分支學(xué)科,而是一種研究方法,這種方法基于大量的真實(shí)語言,可以用來回答通過其他途徑很難回答的問題,從而極大地豐富已有的研究方法。語料庫語言學(xué)以大量精心采集而來的真實(shí)文本(authentictexts)為研究素材,主要通過概率統(tǒng)計(jì)的方法得出結(jié)論,因此語料庫語言學(xué)從本質(zhì)上講是實(shí)證性的(empirical)。2.發(fā)展語料語言學(xué)受行為主義的影響下,從60年代開始發(fā)展,迄今已經(jīng)有近五十年的歷史。語料庫在發(fā)展的初期,只進(jìn)行詞的一般分析,如詞頻統(tǒng)計(jì)等,后來增加了詞的語法屬性標(biāo)注(如,詞性等),直到現(xiàn)在,人們?cè)絹碓介_始重視對(duì)語料庫作不同層次的標(biāo)注,如:語音、構(gòu)詞、句法、語義以及語用等層次的標(biāo)注。語料語言學(xué)在其發(fā)展的初期并沒有引起太大的共鳴,但是現(xiàn)代語料語言學(xué)已經(jīng)得到越來越多人的承認(rèn),其應(yīng)用也越來越廣泛,從語言分析、語言教學(xué)、詞典編撰到人工智能等領(lǐng)域都開始應(yīng)用語料庫。現(xiàn)代語料庫語言學(xué)的一個(gè)里程碑是亨利·庫切拉和W.納爾遜弗朗西斯在1967年出版的《當(dāng)代美語的計(jì)算分析》(ComputationalAnalysisofPresent-DayAmericanEnglish)一書。該項(xiàng)工作基于對(duì)布朗語料庫的分析,布朗語料庫是一個(gè)精心編制的美國英語語料庫,規(guī)模約有一百萬詞次。庫切拉和弗朗西斯將這些語料用于各種計(jì)算分析,獲得了豐富??和多樣化的成果,該成果結(jié)合了語言學(xué)、語言教學(xué)、心理學(xué)、統(tǒng)計(jì)學(xué)、和社會(huì)學(xué)元素。另一關(guān)鍵出版物是1960年倫道夫·夸克的《當(dāng)代英語語法》(TowardsadescriptionofEnglishUsage),在這本書中他介紹了“英語用法調(diào)查”項(xiàng)目(TheSurveyofEnglishUsage)。布朗語料庫也催生了類似的語料庫:LOB語料庫(Lancaster-Oslo-BergenCorpus,20世紀(jì)60年代英國英語),科爾哈帕(Kolhapur,印度英語),惠靈頓(Wellington,新西蘭英語),澳大利亞英語語料庫(AustralianCorpusofEnglish,澳大利亞英語),皺眉語料庫(FrownCorpus,20世紀(jì)90年代初,美國英語),以及FLOB語料庫(FLOBCorpus,20世紀(jì)90年代,英國英語)。其他語料庫包括國際英語語料庫(InternationalCorpusofEnglish),和英國國家語料庫(BritishNationalCorpus,收集了1億詞次的口頭和書面語料,在20世紀(jì)90年代時(shí)由出版商、牛津大學(xué)、蘭卡斯特大學(xué)和大英圖書館創(chuàng)建)。至于說到當(dāng)代的美國英語,現(xiàn)已有了美國國家語料(AmericanNationalCorpus),以及可以在線訪問的4億多詞次的美國當(dāng)代英語語料庫(CorpusofContemporaryAmericanEnglish,1990年創(chuàng)建)。

3.方法語料庫語言學(xué)已經(jīng)有了一大批研究方法,這些研究方法都試圖找到從數(shù)據(jù)到理論的解決方案。瓦利斯和尼爾森最先介紹了他們的3A觀點(diǎn):注釋(Annotation),抽象(Abstraction)和分析(Analysis)。注釋

包括語料的數(shù)據(jù)庫方案。注釋可能包括結(jié)構(gòu)標(biāo)注,詞性標(biāo)注,句法分析和其他形式。抽象

包括該方案在理論上的啟發(fā)式模型或數(shù)據(jù)集中的翻譯(映射)。抽象通常包括面向語言學(xué)家的定向搜索,但也可能包括句法研究者的句法規(guī)則學(xué)習(xí)。分析

包括統(tǒng)計(jì)學(xué)探測,操縱和對(duì)數(shù)據(jù)集的歸納概括。分析可能包括統(tǒng)計(jì)學(xué)評(píng)估,規(guī)則庫優(yōu)化和知識(shí)探索方法。4.在我國的發(fā)展與應(yīng)用語料語言學(xué)經(jīng)歷過這幾十年的發(fā)展,不論在理論上,還是在技術(shù)上,都已趨于成熟。在語言教學(xué)領(lǐng)域中的應(yīng)用也開始引起注意。我國對(duì)語料語言學(xué)研究取得了一定的成果,早在1982年,上海交通大學(xué)的黃人杰、楊惠中教授就主持建立了一百萬詞次的專門用途英語語料庫(JDEST)。2003年,桂詩春和楊惠中兩位教授主持完成了中國英語學(xué)習(xí)者語料庫(ChineseLearnerEnglishCorpus,簡稱CLEC),這是國際上第一部公開發(fā)布的學(xué)習(xí)者語料庫,它對(duì)研究中國學(xué)生的語言應(yīng)用和使用失誤等特征,以及它們與外語學(xué)習(xí)之間的關(guān)系等都具有十分重要的指導(dǎo)作用。除了書面語語料庫之外,研究者們也開始建立口語語料庫。如南京大學(xué)創(chuàng)建的中國學(xué)習(xí)者英語口語語料庫(SpokenEnglishCorpusofChineseLearners,簡稱SECCL)。上海交通大學(xué)也建立了大學(xué)英語學(xué)習(xí)者英語口語語料庫。與此同時(shí),隨著個(gè)人電腦的普及,許多研究者個(gè)人也開始建立適合自己的小型語料庫,許多英語語料庫應(yīng)運(yùn)而生。這些英語語料庫大部分是中國英語學(xué)習(xí)者的中介語語料庫。在應(yīng)用語言學(xué)領(lǐng)域,詞典編纂和語言教學(xué)同是語料庫的最大受益者。目前已有多部詞典在編纂或修訂過程中,不同程度地使用語料庫或電子文檔收集詞語數(shù)據(jù),用于收詞、釋義、例句、屬性標(biāo)注等。南京大學(xué)近年來開發(fā)了NULEXID語料庫暨雙語詞典編纂系統(tǒng),涉及英漢兩種語言,在《新時(shí)代英漢大詞典》的編纂過程中起了重要作用。語料庫用于語言教學(xué)的一個(gè)例子是上海交通大學(xué)的JDEST英語語料庫,利用這個(gè)語料庫,通過語料比較、統(tǒng)計(jì)、篩選等方法為中國大學(xué)英語教學(xué)提供通用詞匯和技術(shù)詞匯的應(yīng)用信息,為確定大學(xué)英語教學(xué)大綱的詞表提供了可靠的量化依據(jù)。這個(gè)語料庫也在英語語言研究中發(fā)揮了作用,支持基于語料庫的英語語法的頻率特征、語料庫驅(qū)動(dòng)的詞語搭配等項(xiàng)研究。5.近幾年的發(fā)展成果許家金和梁茂成(2011)認(rèn)為語料庫的建設(shè)之初,主要是為了進(jìn)行文本儲(chǔ)存,而研究者要基于語料庫進(jìn)行研究,則需要建設(shè)子語料庫從不同的研究目的出發(fā),從而促進(jìn)對(duì)比研究。他們旨在成為由中國學(xué)者開發(fā)建成的BROWN(布朗)語料庫的子語料庫,于2011開發(fā)建設(shè)的CBROWN(科朗)語料庫和CLOB語料庫兩個(gè)語料庫。張素敏(2011)基于自建語料庫研究學(xué)習(xí)者因素對(duì)教師話語的影響作用進(jìn)行分析,研究表明教師的母語使用與學(xué)習(xí)者的語言概念認(rèn)知和態(tài)度情感因素有關(guān),且適當(dāng)?shù)哪刚Z使用有利于教學(xué)目標(biāo)的順利實(shí)現(xiàn)。劉日升,楊振力(2012)通過分析語料庫共享平臺(tái)建設(shè)現(xiàn)狀及其建設(shè)必要性,提出由圖書館起主導(dǎo)作用的語料庫資源共享平臺(tái)建設(shè)的設(shè)想。這些研究對(duì)語料庫實(shí)現(xiàn)共享有重要意義。桂詩春(2010)也積極推進(jìn)語料庫語言資源的共享,語料庫只有共享才能變成財(cái)富,“藏諸名山,束之高閣”只能是一堆數(shù)據(jù)垃圾,必將自毀前程。馮志偉(2010)支持語料庫的共享,表明語料庫只有普及才能發(fā)展6.從國內(nèi)學(xué)術(shù)組織和學(xué)術(shù)會(huì)議

看語料庫語言學(xué)發(fā)展的最新動(dòng)態(tài)國內(nèi)學(xué)術(shù)界出現(xiàn)了幾只具有代表性的團(tuán)隊(duì),其蓬勃的生命力不斷推動(dòng)了國內(nèi)語料庫語言學(xué)的發(fā)展。北京外國語大學(xué)中國外語教育研究中心以梁茂成、許家金、文秋芳等為代表的研究團(tuán)隊(duì)。以李文中為中心主任的河南師范大學(xué)語料庫與外語教學(xué)研究中心。以何安平為帶頭人的華南師范大學(xué)外文學(xué)院語料庫語言學(xué)研究室,以解放軍外國語學(xué)院團(tuán)隊(duì),上海外國語大學(xué)研究團(tuán)隊(duì),上海交通大學(xué)外國語學(xué)院語言文字工程研究所,廣東外語外貿(mào)大學(xué)外國語言學(xué)及應(yīng)用語言學(xué)研究中心等組織。各組織的影響力體現(xiàn)在大型會(huì)議的召開,學(xué)術(shù)組織的成立。語料庫語言學(xué)研究會(huì)(CorpusLinguisticSocietyofChina,CLSC)的成立,成為中國語料庫語言學(xué)發(fā)展的里程碑自2010年10月29日,首次中國外語教育研究中心“語料庫語言學(xué)沙龍”(CorpusResearchGroup)在北京外國語大學(xué)成功舉行之后,分別舉行了2010年秋季,2011年春季,2011年秋季2012年四期有關(guān)語料庫語言學(xué)研究的名家及學(xué)者的交流活動(dòng)。沙龍由語言學(xué)界的相關(guān)大家,許家金、文秋芳、馮志偉、王克非,熊文新等參與講座,對(duì)語料庫語言學(xué)的研究發(fā)展具有啟發(fā)式的引導(dǎo)。1.語料庫建設(shè)。文秋芳的“學(xué)習(xí)者語料庫的創(chuàng)建與研究”。在介紹國內(nèi)研究現(xiàn)狀的同時(shí),還重點(diǎn)分析了語料庫語言學(xué)研究方法的優(yōu)勢和局限。2.新的研究工具和軟件的介紹。開源統(tǒng)計(jì)軟件R的命令行操作方式以及下載模塊的方法。語料庫文本元信息添加(作文作者性別、年齡、年級(jí)、成績等)方法的介紹。這些新方法和新工具的介紹,也預(yù)示著語料庫發(fā)展的新方向。3.語料庫在語言學(xué)上的研究成果。主要是有關(guān)語料庫與詞匯、語法及話語分析的研究。鏈語法與語料庫語言學(xué)的研究,有關(guān)語料庫在語言學(xué)方面的應(yīng)用,是一場變革和飛躍。1)2010首屆廣外應(yīng)用語言學(xué)論壇。由廣東外語外貿(mào)大學(xué)外國語言學(xué)及應(yīng)用語言學(xué)研究中心于2010年9月24-25日成功舉辦了備受矚目的首屆廣外應(yīng)用語言學(xué)論壇。語料庫語言學(xué)首次以獨(dú)立議題的形式提出。會(huì)議包括:1.語料庫的資源共享;2.雙語語料庫建設(shè),我國單語語料庫很多,還沒有高質(zhì)量的英漢雙語語料庫;3.語料庫促進(jìn)外語教學(xué)發(fā)展。外語學(xué)習(xí)者語料庫等在外語教學(xué)中的應(yīng)用,推動(dòng)外語教學(xué)的發(fā)展;4.語料庫語言學(xué)的現(xiàn)狀和未來。桂詩春肯定了語料學(xué)對(duì)外語教學(xué)的積極作用,并大力提倡資源共享,互助互利。2)2011年語料庫語言學(xué)大會(huì)。2011年中國語料庫語言學(xué)大會(huì)是中國語料庫語言學(xué)研究會(huì)成立后的首屆全國性語料庫語言學(xué)的學(xué)術(shù)研討會(huì)。大會(huì)以“語料庫語言學(xué)的多維視角”為主題,旨在加強(qiáng)國內(nèi)語料庫語言學(xué)研究者的學(xué)術(shù)交流與合作,探討學(xué)術(shù)發(fā)展動(dòng)態(tài)與關(guān)鍵技術(shù),促進(jìn)語料庫語言學(xué)學(xué)科建設(shè)和發(fā)展。1.“多維視角下的短語語料庫建設(shè)和研究”。2.“語料庫加工處理技術(shù)研究”中以漢語為處理語言的語料庫加工技術(shù),彌補(bǔ)了本土語料庫的不足。3.“語料庫與語言描寫”指出語言描寫不是語料庫語言學(xué)研究的終點(diǎn)而是整個(gè)研究的出發(fā)點(diǎn),最終揭示語言系統(tǒng)隱含的規(guī)律和趨勢。4.“中介語語料庫建設(shè)和研究”有助于發(fā)現(xiàn)和分析英語學(xué)習(xí)者二語習(xí)得過程中經(jīng)常遇到的問題,這類語料庫的建設(shè)和研究對(duì)二語習(xí)得及外語教學(xué)研究具有重要意義。5.“平行語料庫及翻譯研究”平行語料庫的建

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論