AntConc的詳細使用說明.doc_第1頁
AntConc的詳細使用說明.doc_第2頁
AntConc的詳細使用說明.doc_第3頁
AntConc的詳細使用說明.doc_第4頁
AntConc的詳細使用說明.doc_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、AntConc3.2.0的使用說明 此說明書由華南師范大學外文學院2007研究生張杏娟編寫,導師何安平訂正和補充。其中限定范圍的檢索方法由香港城市大學D.Lee博士提供,僅此致謝。1. 提取語境共現1.1設置檢索項(1)單項檢索a) 點擊file下拉菜單中的“open files”,選擇要打開的語料(如果想打開整個文件夾,可以選擇open directory);b) 在“Search Term”一欄鍵入要檢索的詞項,如go;c) 在“Search Window Size” 一欄設置每一共現行出現的詞數;d) 點擊,開始檢索。檢索結果如圖1.1所示:圖1.1單項檢索結果(2)多項檢索l 設置多項

2、檢索除了檢索單個詞項以外,AntConc還具有檢索多個詞項的功能,檢索方法為在檢索項間鍵入“|”符號。例:要檢索動詞go的各種時態(tài)形式,可在“Search Term”中輸入go|went|gone|goesl 設置語境詞檢索為了限制語境共現的檢索,可以設定一個語境詞在檢索項周邊一定的語境范圍內出現。例:如要研究 a of 這一類詞組,可通過AntConc提取所有的詞項,檢索方法如下:a) 在“Search Term”一欄鍵入a;圖1.2 Advanced Search界面b) 點擊“Search Term”旁的,進入“Advanced Search”界面,如圖1.2所示。點擊“Use cont

3、ext words and horizons”,然后在“Context Words”一欄鍵入of,點擊。如要重新設置語境詞,可先點擊清除原來語境詞,后重復以上操作。另外,還需設定語境詞距離檢索項的位置,如本研究中,of在a的右二位置,所以“Content Horizon”確定為,最后點擊;c) 回到語境共現的界面后,點擊,開始檢索。結果可提取a lot of, a bit of 等詞塊。l 設置多字語檢索在研究中,如需檢索多個詞項,除了使用“”以外,也可使用以下方法,尤其適合檢索項數目較多的情況。例:研究感官動詞watch, sound, feel, hear, smella) 在TXT文本中

4、鍵入所有要檢索的詞項,可多達250個詞。然后為該文本起名保存。需注意:鍵入的詞項需以列的形式排列。如:feelfeelsfeltb) 點擊Search Term旁的,選擇“Use search term(s) from list below”。 點擊,在保存以上新建的文本的盤符路徑點擊文本名,然后點擊;c) 回到語境共現的界面后,點擊,開始檢索。(3)類別檢索l 使用通配符檢索符號意義檢索項檢索結果*零個或多個字符book*提取所有以book打頭的詞,如book、books、booking、bookshop等*book提取所有以book結尾的詞,如book、notebook等*book*可以同

5、時提取包括以上兩類詞+零個或一個字符book+提取所有以book打頭的詞,但之后有零個或一個字母,如book、books?任意一個字符?ough提取所有以字母組合ough結尾的,但之前有一個字母的詞,如cough、rough等零個或一個詞thinkof提取所有含有的詞組,如think of、think highly of等#任意一個詞look#提取所有與look的搭配,如look after、look at等l 附碼檢索因研究需要,有些語料經過整理加工并附加上各種符號標記,稱為“附碼語料庫”。 如附有詞性標注的LOBTAG和附有錯誤類型標記的CLEC等。檢索時只需鍵入某個標記符號便可提取帶附有

6、該標碼的所有詞。例:提取LOBTAG語料庫中所有的名詞,只需鍵入*_NN(NN為名詞標碼,關于其他詞性的詳細標記,請參閱何安平,2004,語料庫語言學與英語教學一書的附錄113頁。(4)在指定范圍內檢索a) 在concordance的檢索界面上選擇Regex (regular expression),鍵入.* 為檢索項便可提取語料庫中所有在起止符號“”和“”之間的所有文字內容,其他符號照似類推。b) 在concordance的檢索界面上選擇Regex (regular expression),鍵入.*write.* 為檢索項便可提取語料庫中所有在起止符號“”和“”之內的“write”的語境共現

7、行,其他詞項照似類推。鍵入的檢索項計較大小寫,但是可以用通配符*。 1.2分析檢索結果(1)觀察頻數、分布l 頻數即該檢索項出現的次數,可在“Concordance Hits”一欄中獲得。l 點擊,查看檢索項在語料文本中的分布狀況。(2)凸顯周邊語境詞圖1.4 Tool Preferences下拉菜單界面為了具體某個教學等目的,可通過凸顯檢索項周邊的某些詞匯。方法是選擇“Kwic Sort”, R1和L1分別代表檢索項右方和左方的第一個詞,一次可設置三列凸現詞,均按字母順序排列。檢索結果如圖1.3所示。如想使凸顯內容的顏色一致,可通過設置下拉菜單中的“Color Settings”改變顏色。另

8、外,若要凸顯的部分不是一個詞,而是單詞中的字母,可選擇下拉菜單中的“Concordance”選項中的“Sort by characters instead of words”,如圖1.4所示。圖1.3凸顯周邊語境詞檢索結果(3)提取搭配詞表通過點擊主界面中的,可獲得檢索項的搭配詞表,同時可以設置搭配詞的位置、出現的最少次數與詞表的排列方式。例:觀察look右一的搭配詞a) 點擊主界面中的;b) 在“Search Term”一欄鍵入look;c) 設置搭配詞的位置,如;d) 點擊,開始檢索,檢索結果如圖1.5所示。e) 點擊“Sort by Freq” 可根據不同的需要設定搭配詞表的排列方式,如

9、按頻數排,按拼寫字母排等等。圖1.5 提取搭配詞表檢索結果(4)提取搭配短語另外,也可以使用這一工具來提取搭配詞塊,且可設置檢索項在詞塊中的位置。例:檢索以ask開頭的搭配詞塊a) 點擊主界面中的;b) 在“Search Term”一欄鍵入ask;c) 設置檢索項的位置,如選擇“On the left”;d) 設置搭配詞塊的長度,如Min.Size:3, Max.Size:3;圖1.6提取搭配短語檢索結果e) 點擊,開始檢索,檢索結果如圖1.6所示,所有的ask被列在詞塊的左邊。(5)隱藏、分類和刪除“隱藏”是指把檢索結果中的檢索項挖空,可用于教學或測試。具體操作方法如下:a) 在“Searc

10、h Term”一欄鍵入要檢索的詞項,如look;b) 點擊,選擇“Concordance”,再選擇“Hide search term in KWIC display”, 最后點擊;c) 點擊,開始檢索。檢索結果如下: you always do your own homework? Do you * for help when you think it necessary? Do you help2. 提取詞頻表2.1單字和N字語詞頻表單字詞頻表是指目標語料庫的單詞表,且詞頻表的檢索結果是以每個詞的形式及其頻數排列。方法如下:a) 選擇要生成單字詞頻的目標語料庫;b) 進入界面,設置詞頻表排列

11、排序方式,如“Sort by Freq”;也可以設置為按詞頭的或者詞尾的拼寫字母順序排列。c) 點擊,開始檢索,檢索結果如圖2.1所示。圖2.1 單字詞頻表檢索結果N字語詞頻表是指目標語料庫的多字語頻數表。例如,檢索句子“This is a pen”的2字語詞頻表結果為:“this is”、“is a”、“a pen”。N字語詞頻表的提取方法如下:a) 選擇要生成單字詞頻的目標語料庫;b) 進入界面,后點擊;c) 設置N字語詞頻表的長度,如d) 選擇詞表的排序方式,如“Sort by Freq”;e) 點擊,開始檢索,檢索結果如圖2.2所示。圖2.2 N字語詞頻表檢索結果2.2詞項重組-詞簇化

12、(lemmatizing)詞簇化是將同一詞性的某個詞的所有曲折變化形式作削尾處理,并歸為一個詞簇來計算頻數。其好處是可以簡約詞頻表并且引起對構詞法的關注。對詞頻表進行詞簇化的方法如下:在界面生成詞頻表之后,拉下Tool Preference菜單,選擇Lemma list options, 點擊open 和load,上傳lemma1文檔(可在本網站下載)點擊Apply (如圖2. 3所示)。詞簇化的部分結果見圖2.4. 圖2. 3 設置詞簇化界面圖2.4 詞頻表被詞簇化后的結果(部分)。圖中1142例a和133例an被歸為同一個詞簇a共1275例。3. 提取關鍵詞表關鍵詞表是指兩個語料庫的詞頻表相比,其中一個明顯地高頻于另一個的那部分詞項表。前一個稱目標語料庫;后一個稱參照語語料庫,通常規(guī)模要大一些,以此來凸現目標語料庫的一些特別高頻詞以浮現該語料庫的主題或內容特色。3.1凸顯目標語料庫中顯著性高頻于對照語料庫的詞項具體操作方法如下:a) 點擊file下拉菜單中的“open files”,選擇要對比的目標語料的語料(如果對比整個文件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論