AntConc的詳細使用說明_第1頁
AntConc的詳細使用說明_第2頁
AntConc的詳細使用說明_第3頁
AntConc的詳細使用說明_第4頁
AntConc的詳細使用說明_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、完美 WORD 格式 AntConc3.2.0的使用說明 此說明書由華南師范大學外文學院2007研究生張杏娟編寫,導師何安平訂正和補充。其中限定范圍的檢索方法由香港城市大學D.Lee博士提供,僅此致謝。1. 提取語境共現(xiàn)1.1設(shè)置檢索項(1)單項檢索a) 點擊file下拉菜單中的“open files”,選擇要打開的語料(如果想打開整個文件夾,可以選擇open directory);b) 在“Search Term”一欄鍵入要檢索的詞項,如go;c) 在“Search Window Size” 一欄設(shè)置每一共現(xiàn)行出現(xiàn)的詞數(shù);d) 點擊,開始檢索。檢索結(jié)果如圖1.1所示:圖1.1單項檢索結(jié)果(2

2、)多項檢索l 設(shè)置多項檢索除了檢索單個詞項以外,AntConc還具有檢索多個詞項的功能,檢索方法為在檢索項間鍵入“|”符號。例:要檢索動詞go的各種時態(tài)形式,可在“Search Term”中輸入go|went|gone|goesl 設(shè)置語境詞檢索為了限制語境共現(xiàn)的檢索,可以設(shè)定一個語境詞在檢索項周邊一定的語境范圍內(nèi)出現(xiàn)。例:如要研究 a of 這一類詞組,可通過AntConc提取所有的詞項,檢索方法如下:a) 在“Search Term”一欄鍵入a;圖1.2 Advanced Search界面b) 點擊“Search Term”旁的,進入“Advanced Search”界面,如圖1.2所示。

3、點擊“Use context words and horizons”,然后在“Context Words”一欄鍵入of,點擊。如要重新設(shè)置語境詞,可先點擊清除原來語境詞,后重復以上操作。另外,還需設(shè)定語境詞距離檢索項的位置,如本研究中,of在a的右二位置,所以“Content Horizon”確定為,最后點擊;c) 回到語境共現(xiàn)的界面后,點擊,開始檢索。結(jié)果可提取a lot of, a bit of 等詞塊。l 設(shè)置多字語檢索在研究中,如需檢索多個詞項,除了使用“”以外,也可使用以下方法,尤其適合檢索項數(shù)目較多的情況。例:研究感官動詞watch, sound, feel, hear, smel

4、la) 在TXT文本中鍵入所有要檢索的詞項,可多達250個詞。然后為該文本起名保存。需注意:鍵入的詞項需以列的形式排列。如:feelfeelsfeltb) 點擊Search Term旁的,選擇“Use search term(s) from list below”。 點擊,在保存以上新建的文本的盤符路徑點擊文本名,然后點擊;c) 回到語境共現(xiàn)的界面后,點擊,開始檢索。(3)類別檢索l 使用通配符檢索符號意義檢索項檢索結(jié)果*零個或多個字符book*提取所有以book打頭的詞,如book、books、booking、bookshop等*book提取所有以book結(jié)尾的詞,如book、noteboo

5、k等*book*可以同時提取包括以上兩類詞+零個或一個字符book+提取所有以book打頭的詞,但之后有零個或一個字母,如book、books?任意一個字符?ough提取所有以字母組合ough結(jié)尾的,但之前有一個字母的詞,如cough、rough等零個或一個詞thinkof提取所有含有的詞組,如think of、think highly of等#任意一個詞look#提取所有與look的搭配,如look after、look at等l 附碼檢索因研究需要,有些語料經(jīng)過整理加工并附加上各種符號標記,稱為“附碼語料庫”。 如附有詞性標注的LOBTAG和附有錯誤類型標記的CLEC等。檢索時只需鍵入某個

6、標記符號便可提取帶附有該標碼的所有詞。例:提取LOBTAG語料庫中所有的名詞,只需鍵入*_NN(NN為名詞標碼,關(guān)于其他詞性的詳細標記,請參閱何安平,2004,語料庫語言學與英語教學一書的附錄113頁。(4)在指定范圍內(nèi)檢索a) 在concordance的檢索界面上選擇"Regex" (regular expression),鍵入.* 為檢索項便可提取語料庫中所有在起止符號“”和“”之間的所有文字內(nèi)容,其他符號照似類推。b) 在concordance的檢索界面上選擇"Regex" (regular expression),鍵入.*write.* 為檢索項

7、便可提取語料庫中所有在起止符號“”和“”之內(nèi)的“write”的語境共現(xiàn)行,其他詞項照似類推。鍵入的檢索項計較大小寫,但是可以用通配符*。 1.2分析檢索結(jié)果(1)觀察頻數(shù)、分布l 頻數(shù)即該檢索項出現(xiàn)的次數(shù),可在“Concordance Hits”一欄中獲得。l 點擊,查看檢索項在語料文本中的分布狀況。(2)凸顯周邊語境詞圖1.4 Tool Preferences下拉菜單界面為了具體某個教學等目的,可通過凸顯檢索項周邊的某些詞匯。方法是選擇“Kwic Sort”, R1和L1分別代表檢索項右方和左方的第一個詞,一次可設(shè)置三列凸現(xiàn)詞,均按字母順序排列。檢索結(jié)果如圖1.3所示。如想使凸顯內(nèi)容的顏色一

8、致,可通過設(shè)置下拉菜單中的“Color Settings”改變顏色。另外,若要凸顯的部分不是一個詞,而是單詞中的字母,可選擇下拉菜單中的“Concordance”選項中的“Sort by characters instead of words”,如圖1.4所示。圖1.3凸顯周邊語境詞檢索結(jié)果(3)提取搭配詞表通過點擊主界面中的,可獲得檢索項的搭配詞表,同時可以設(shè)置搭配詞的位置、出現(xiàn)的最少次數(shù)與詞表的排列方式。例:觀察look右一的搭配詞a) 點擊主界面中的;b) 在“Search Term”一欄鍵入look;c) 設(shè)置搭配詞的位置,如;d) 點擊,開始檢索,檢索結(jié)果如圖1.5所示。e) 點擊“

9、Sort by Freq” 可根據(jù)不同的需要設(shè)定搭配詞表的排列方式,如按頻數(shù)排,按拼寫字母排等等。圖1.5 提取搭配詞表檢索結(jié)果(4)提取搭配短語另外,也可以使用這一工具來提取搭配詞塊,且可設(shè)置檢索項在詞塊中的位置。例:檢索以ask開頭的搭配詞塊a) 點擊主界面中的;b) 在“Search Term”一欄鍵入ask;c) 設(shè)置檢索項的位置,如選擇“On the left”;d) 設(shè)置搭配詞塊的長度,如Min.Size:3, Max.Size:3;圖1.6提取搭配短語檢索結(jié)果e) 點擊,開始檢索,檢索結(jié)果如圖1.6所示,所有的ask被列在詞塊的左邊。(5)隱藏、分類和刪除“隱藏”是指把檢索結(jié)果中

10、的檢索項挖空,可用于教學或測試。具體操作方法如下:a) 在“Search Term”一欄鍵入要檢索的詞項,如look;b) 點擊,選擇“Concordance”,再選擇“Hide search term in KWIC display”, 最后點擊;c) 點擊,開始檢索。檢索結(jié)果如下: you always do your own homework? Do you * for help when you think it necessary? Do you help2. 提取詞頻表2.1單字和N字語詞頻表單字詞頻表是指目標語料庫的單詞表,且詞頻表的檢索結(jié)果是以每個詞的形式及其頻數(shù)排列。方法如下

11、:a) 選擇要生成單字詞頻的目標語料庫;b) 進入界面,設(shè)置詞頻表排列排序方式,如“Sort by Freq”;也可以設(shè)置為按詞頭的或者詞尾的拼寫字母順序排列。c) 點擊,開始檢索,檢索結(jié)果如圖2.1所示。圖2.1 單字詞頻表檢索結(jié)果N字語詞頻表是指目標語料庫的多字語頻數(shù)表。例如,檢索句子“This is a pen”的2字語詞頻表結(jié)果為:“this is”、“is a”、“a pen”。N字語詞頻表的提取方法如下:a) 選擇要生成單字詞頻的目標語料庫;b) 進入界面,后點擊;c) 設(shè)置N字語詞頻表的長度,如d) 選擇詞表的排序方式,如“Sort by Freq”;e) 點擊,開始檢索,檢索結(jié)

12、果如圖2.2所示。圖2.2 N字語詞頻表檢索結(jié)果2.2詞項重組-詞簇化(lemmatizing)詞簇化是將同一詞性的某個詞的所有曲折變化形式作削尾處理,并歸為一個詞簇來計算頻數(shù)。其好處是可以簡約詞頻表并且引起對構(gòu)詞法的關(guān)注。對詞頻表進行詞簇化的方法如下:在界面生成詞頻表之后,拉下Tool Preference菜單,選擇Lemma list options, 點擊open 和load,上傳lemma1文檔(可在本網(wǎng)站下載)點擊Apply (如圖2. 3所示)。詞簇化的部分結(jié)果見圖2.4. 圖2. 3 設(shè)置詞簇化界面圖2.4 詞頻表被詞簇化后的結(jié)果(部分)。圖中1142例a和133例an被歸為同一個詞簇a共1275例。3. 提取關(guān)鍵詞表關(guān)鍵詞表是指兩個語料庫的詞頻表相比,其中一個明顯地高頻于另一個的那部分詞項表。前一個稱目標語料庫;后一個稱參照語語料庫,通常規(guī)模要大一些,以此來凸現(xiàn)目標語料庫的一些特別高頻詞以浮現(xiàn)該語料庫的主題或內(nèi)容特色。3.1凸顯目標語料庫中顯著性高頻于對照語料庫的詞項具體操作方法如下:a) 點擊file下拉菜單中的“open files”,選擇要對比的目標語料的語料(如果對比整個文件夾,可以選擇o

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論