美國(guó)當(dāng)代英語語料庫(kù)(COCA)使用介紹_第1頁(yè)
美國(guó)當(dāng)代英語語料庫(kù)(COCA)使用介紹_第2頁(yè)
美國(guó)當(dāng)代英語語料庫(kù)(COCA)使用介紹_第3頁(yè)
美國(guó)當(dāng)代英語語料庫(kù)(COCA)使用介紹_第4頁(yè)
美國(guó)當(dāng)代英語語料庫(kù)(COCA)使用介紹_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2021/3/141美國(guó)當(dāng)代英語語料庫(kù)(COCA)使用說明2021/3/1422021/3/143一、COCA語料庫(kù)簡(jiǎn)介 COCA簡(jiǎn)介 COCA:美國(guó)當(dāng)代英語語料庫(kù)(Corpus of Contemporary American English)是由美國(guó)楊伯翰大學(xué)(Brigham Young University)的Mark Davies 教授開發(fā)的美國(guó)最新當(dāng)代英語語料庫(kù),是當(dāng)今世界上最大的英語平衡語料庫(kù)。2021/3/144COCA語料庫(kù)簡(jiǎn)介 COCA美國(guó)當(dāng)代英語語料庫(kù)涵蓋美國(guó)這一時(shí)期的口語(spoken)、小說(fiction)、流行雜志(pop magzine)、報(bào)紙(newspaper

2、)和學(xué)術(shù)期刊(academic)五大類型的語料庫(kù),并且在這五個(gè)類型方面基本呈均勻平衡分布。 網(wǎng)址:COCA簡(jiǎn)介2021/3/145選擇學(xué)習(xí)COCA的原因 1. COCA免費(fèi)且在線方便。 2. 規(guī)模大(4.5億,1990-2012)、速度快(一般幾秒)、詞性標(biāo)注易于理解。 3.時(shí)效性強(qiáng)每年至少更新兩次,并且每年新增2000萬詞匯。2021/3/146COCA界面簡(jiǎn)介主要包括三大功能區(qū): 顯示及查詢條件界定區(qū),包括:顯示方式區(qū),字串查詢區(qū),語料庫(kù)分類區(qū),查詢結(jié)果排列方式區(qū)。 查詢結(jié)果數(shù)據(jù)顯示區(qū) 例句顯示區(qū)2021/3/147 COCA界面簡(jiǎn)介2021/3/148 COCA界面簡(jiǎn)介 顯示方式區(qū): 1

3、.LIST列表顯示 2.CHART圖表顯示,可以顯示在各語料庫(kù)類型中的使用頻率和各時(shí)間段內(nèi)的使用情況。 3.KWICKey word in context,上下文關(guān)鍵詞顯示 4.COMPARE單詞比較顯示,比較兩個(gè)不同詞或短語的搭配情況。2021/3/149 COCA界面簡(jiǎn)介2021/3/1410 COCA界面簡(jiǎn)介 字串查詢區(qū): 、WORDS:輸入字符串。 、COLLOCATES:上下文限定。 、POS LIST:詞性列表2021/3/1411 COCA界面簡(jiǎn)介2021/3/1412COCA界面簡(jiǎn)介 語料庫(kù)分類區(qū)(五大類型語料庫(kù)共包括42個(gè)子語料庫(kù))。 功能:此區(qū)可以對(duì)查詢的字符串限定語料類型

4、(Genre)和時(shí)段(Year) ,并且可以明確到查詢某一個(gè)子語料庫(kù),時(shí)段也可以查詢?nèi)魏我荒甑哪硞€(gè)字詞的使用情況。2021/3/1413COCA界面簡(jiǎn)介 語料庫(kù)分類區(qū)(五大類型語料庫(kù)共包括42個(gè)子語料庫(kù))。2021/3/1414COCA界面簡(jiǎn)介 語料庫(kù)分類區(qū)(五大類型語料庫(kù)共包括42個(gè)子語料庫(kù))。2021/3/1415二、COCA主要搜索功能 2.1 搜索搜索words、phrases、lemmas(單(單詞的所有形式)、詞的所有形式)、wildcards(通配符)和(通配符)和其他更加復(fù)雜的字詞。其他更加復(fù)雜的字詞。 例1. 輸入單詞“mysterious” (圖2.1.1-1):得到相關(guān)結(jié)

5、果(圖2.1.1-2):在各子庫(kù)中的頻率,每百萬詞使用的頻率。 若對(duì)圖2中的相應(yīng)條塊進(jìn)行點(diǎn)擊,那么就可以看到KWIC,如圖2.1.1-3 (以點(diǎn)Fiction的條塊為例):2021/3/1416圖2.1.1-12021/3/1417圖2.1.1-2使用CHART顯示2021/3/1418圖2.1.1-3 例句顯示區(qū)例句顯示區(qū)使用的是KWIC顯示2021/3/1419KWIC顯示方式2021/3/1420 藍(lán)色名詞 紫色動(dòng)詞 綠色形容詞 棕色副詞 灰色代詞 黃色介詞KWIC顯示方式2021/3/1421COCA主要搜索功能 例2. 輸入詞組輸入詞組“white+名詞名詞” (圖2.1.2-1),

6、得到的結(jié)果都是white后面跟的名詞短語 (圖2.1.2-2),檢索表達(dá)式為:white n*。圖2.1.2-12021/3/1422圖2.1.2-2 White+名詞的短語規(guī)則規(guī)則:輸入名詞的話用正表達(dá)式輸入名詞的話用正表達(dá)式: nn*;動(dòng)詞動(dòng)詞: v*; 形容詞形容詞: j*; 副詞副詞: r*;代詞代詞:p*;連詞連詞:c*2021/3/1423POS LIST 詞性列表2021/3/1424p noun.ALL=名詞p noun.SG=單數(shù)名詞p noun.PL=復(fù)數(shù)名詞p noun.CMN=普通名詞p noun.+PROP=專有名詞p noun.-PROP=非專有名詞POS LIST

7、 2021/3/1425POS LIST p verb base=動(dòng)詞原形p verb.INF=動(dòng)詞不定式p verb MODAL=情態(tài)動(dòng)詞p verb 3SG=動(dòng)詞第三人稱單數(shù)p verb ED=過去式p verb EN=過去分詞p verb ING=現(xiàn)在分詞p verb.LEX=lexical verb實(shí)意動(dòng)詞p verb.BE=系動(dòng)詞p verb.DO=dop verb.HAVE=have2021/3/1426p pron.INDF 不定代詞p pron.PERS 人稱代詞p pron.WH 疑問代詞p pron.REFL 反身代詞p adj.CMP 形容詞比較級(jí) (comparativ

8、e)p adj.SPRL 形容詞最高級(jí) (superlative)p adv.particle 副詞小品詞p adv.WH 疑問副詞POS LIST2021/3/1427p det.GEN 類指限定詞p det.POS 物主限定詞p num.CARD 基數(shù)詞p num.ORD 序數(shù)詞p conj.CRD 并列連詞p conj.SUB 從屬連詞p Interj. 嘆詞p PUNC 標(biāo)點(diǎn)POS LIST2021/3/1428詞性列表的使用 1)查詢多義詞特定的詞性 2)某個(gè)詞前或者后面特定詞性的若干搭配詞,如confidence前的形容詞 3)詞性附碼放置的位置WORDS或 COLLOCATES處

9、2021/3/1429 例3.輸入通配符輸入通配符(wildcards),如分別輸入un*ly和r?n*,結(jié)果如圖。COCA主要功能(一)? 代替一個(gè)字母* 代替任意數(shù)量字母2021/3/1430EXAMPLE 32021/3/1431EXAMPLE 32021/3/1432 例4.輸入輸入lemmaslemmas(即一個(gè)單詞的單復(fù)數(shù)單復(fù)數(shù)、時(shí)態(tài)時(shí)態(tài)等所有形式),若要得到sing這個(gè)單詞的所有形式,可以如下圖所示。 COCA主要搜索功能2021/3/1433規(guī)則:若要得到某個(gè)單詞的所有單復(fù)數(shù)和時(shí)態(tài)形式,那么就要在輸入時(shí),在這個(gè)單詞外加 。EXAMPLE 42021/3/1434形容詞early

10、的原形,比較級(jí)和最高級(jí)三種形式一次性檢索出來檢索EXAMPLE 42021/3/1435 例5.輸入某種詞性且部分帶有某些字母的命令輸入某種詞性且部分帶有某些字母的命令,如要得到以u(píng)n-開頭、-ed結(jié)尾的所有形容詞的所有形式(見圖2.1.5-1)和得到動(dòng)詞+任何詞+ground的所有詞組(見圖2.1.5-2):規(guī)則:若要得到某種詞性且詞中帶有部分帶有某些字母的形式時(shí),如要得到以u(píng)n-開頭、-ed結(jié)尾的所有形容詞的所有形式,那么輸入: un*ed.j*;若要得到動(dòng)詞+任何詞+ground的所有詞組,那么輸入: v*ground即可。前者用來研究詞匯,后者用來查詢特定詞性的搭配。COCA主要功能(

11、一)2021/3/1436圖2.1.5-1 2021/3/1437圖2.1.5-2 動(dòng)詞+任何詞+ground的所有詞組2021/3/1438 2.2 搜索搭配詞和出現(xiàn)的頻率搜索搭配詞和出現(xiàn)的頻率 如“thick后跟的名詞” (圖2.2-1)COCA主要搜索功能(二)2021/3/1439圖2.2-1 規(guī)則規(guī)則:在collocates里輸入n* 后選擇4,表示在thick4后面(4跨距范圍內(nèi))出現(xiàn)的任何名詞2021/3/1440 如:跟在 “smile前面的形容詞” (圖2.2-2)規(guī)則:在words里輸入: smile.n*,表示作為名詞的smile; 在collocates里輸入: aj*

12、表示其前后出現(xiàn)形容詞的語境。COCA主要功能(二)2021/3/1441Confidence前使用的形容詞 圖2.2-32021/3/1442 2.3 搜索在子語料庫(kù)內(nèi)搜索在子語料庫(kù)內(nèi)(或之間或之間)出現(xiàn)的頻率出現(xiàn)的頻率(或比較或比較)(不同語域中的用法不同語域中的用法) 如在Fiction和Newspaper子語料庫(kù)中passionate后面可以跟任何名詞的詞及頻率,分別如兩圖(2.3-1和2.3-2)。COCA主要功能(三)2021/3/1443圖2.3-1 圖2.3-2 2021/3/1444 但是也可以之間對(duì)兩者子語料庫(kù)中它們出現(xiàn)頻率的對(duì)比,操作:分別選擇section 1&2,如下圖

13、(圖2.3-3): COCA主要功能(三)2021/3/1445 2.4 進(jìn)行語義傾向比較進(jìn)行語義傾向比較 2.4.1 比較近義詞 如:近義形容詞hot和warm后面所跟名詞的區(qū)別(如圖2.4.1):COCA主要功能(四)2021/3/1446圖2.4.1 規(guī)則:在words的方格里分別輸入hot和warm,再在collocates方框里輸入nn*,表示后面所跟任何名詞。當(dāng)然也可以比較在某個(gè)子語料庫(kù)中出現(xiàn)的頻率比較。 2021/3/14472021/3/14482021/3/1449 2.4.2 比較反義詞 如:woman和man前面所跟的形容詞的區(qū)別(如圖2.4.2)圖2.4.2 規(guī)則:在w

14、ords的方格里分別輸入woman和man,再在collocates方框里輸入j*,選在左3,表示前面3個(gè)跨距內(nèi)所有的形容詞。當(dāng)然也可以比較在某個(gè)子語料庫(kù)中出現(xiàn)的頻率比較。2021/3/1450 2.4.3 搜索近義詞搜索近義詞 如:搜索beautiful的所有近義詞(如圖2.4.3-1)規(guī)則:在words的方格里輸入=beautiful,表示和beautiful語義相近的所有形容詞。2021/3/1451 再如:搜索動(dòng)詞clean的所有近義詞,如下圖:圖2.4.3-2 2021/3/1452Question Application和increase能否作主謂搭配?2021/3/1453查詢結(jié)果2021/3/1454篩選出篩選出“應(yīng)用應(yīng)用”和和“增加增加”作主謂搭配的例句作主謂搭配的例句 The annual application of fertilizers has increased by 5.48% on average since 1980, and that of pesticide In ten Member States, average application of nitrogen increased almost 40

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論