北語動態(tài)作文語料庫符號說明_第1頁
北語動態(tài)作文語料庫符號說明_第2頁
北語動態(tài)作文語料庫符號說明_第3頁
北語動態(tài)作文語料庫符號說明_第4頁
北語動態(tài)作文語料庫符號說明_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、“HSK動態(tài)作文語料庫”語料標(biāo)注及代碼說明 “HSK動態(tài)作文語料庫”從字、詞、句、篇、標(biāo)點(diǎn)符號等角度,對所收入的作文語料中存在的外國人使用漢語的中介語偏誤進(jìn)行全面標(biāo)注。 1 、字處理(包括標(biāo)點(diǎn)符號) C:錯字標(biāo)記,用于標(biāo)示考生寫的不成字的字。用C代表錯字,在C前填寫正確的字。 例如:地球C(“球”是錯字)、這C。 :別字標(biāo)記,用于標(biāo)示把甲字寫成乙字的情況。別字包括同音的、不同音而只是形似的、既不同音也不形似但成字的等等。把別字移至中B的后面,并在前填寫正確的字。 例如:提B題高、考慮B虎。 L:漏字標(biāo)記,用于標(biāo)示作文中應(yīng)有而沒有的字。用L表示漏掉的字,并在L前填寫所漏掉的字。 例如: 后悔L,

2、表示“悔”在原文中是漏掉的字。 農(nóng)L藥,表示“農(nóng)”在原文中是漏掉的字。 D:多字標(biāo)記,用于標(biāo)示作文中不應(yīng)出現(xiàn)而出現(xiàn)的字。把多余的字移至D中D的后面。 例如:我的D的,表示括號中的“的”是多余的字(原文中寫了兩個“的”)。 F:繁體字標(biāo)記,用于標(biāo)示繁體字。把繁體字移至F中F的后面,并在F前填寫簡體字。 例如:記憶F憶、單F單純、養(yǎng)F養(yǎng)分F份。 注意: 1)繁體字標(biāo)記標(biāo)示的是使用正確的繁體字,如果該繁體字同時又是別字,則先標(biāo)繁體字標(biāo)記,再標(biāo)別字標(biāo)記。 例如:儉樸F樸B僕。 2)繁體字寫錯了,標(biāo)為:后F後C。 Y:異體字標(biāo)記,用于標(biāo)示異體字。把異體字移至Y中Y的后面,并在Y前填寫簡體字。 例如:偏Y

3、徧、沉Y沈。 P:拼音字標(biāo)記,用于標(biāo)示以漢語拼音代替漢字的情況。把拼音字移至P中P的后面,并在P前填寫簡體字。 例如:緣Pyúan分、保護(hù)Phù。 #:無法識別的字的標(biāo)記,用于標(biāo)示無法識別的字。每個不可識別的字用一個#表示。 例如:更#保存自己的生命, BC:錯誤標(biāo)點(diǎn)標(biāo)記,用于標(biāo)示使用錯誤的標(biāo)點(diǎn)符號。把錯誤標(biāo)點(diǎn)移至BC中BC的后面,并在BC前填寫正確的標(biāo)點(diǎn)符號。例如:勤奮、BC,刻苦的精神。 BQ:空缺標(biāo)點(diǎn)標(biāo)記,用于標(biāo)示應(yīng)用標(biāo)點(diǎn)符號而未用的情況。把BQ插入空缺標(biāo)點(diǎn)之處,并在BQ中BQ的后面填寫所缺的標(biāo)點(diǎn)符號。 例如:周圍的環(huán)境很安靜BQ,生活也非常平凡。 BD:多余標(biāo)點(diǎn)標(biāo)記

4、,用于標(biāo)示不應(yīng)用標(biāo)點(diǎn)符號而用了的情況。把多余的標(biāo)點(diǎn)移至BD中BD的后面。 例如:我家周圍的BD,美麗風(fēng)景。 2、詞處理:(包括成語) CC:錯詞標(biāo)記,用于標(biāo)示錯誤的詞和成語。包括4種情況: 1)把詞的構(gòu)成成分寫錯順序的。 把寫錯的詞移至CC中CC的后面,并在CC前填寫正確的詞。 例如:首先CC先首、眾所周知CC眾所知周。 2)該用甲詞而用乙詞的。這種情況類似別字,但屬于用詞層面上的錯誤。 標(biāo)示方法同上。 例如: 雖然現(xiàn)在還沒有實(shí)現(xiàn)CC實(shí)踐, 它在CC對價格方面有點(diǎn)貴,所以沒得到廣大消費(fèi)者的支持CC持支。 3)生造詞。指考生自造的、或某些外語中可能有而漢語中不存在的詞。 例如: 農(nóng)作物CC農(nóng)產(chǎn)物

5、/農(nóng)物、農(nóng)產(chǎn)品CC農(nóng)作品 但長期來看造成環(huán)境污染,破壞自然生態(tài)CC目態(tài), 綠色食品的好處在于吃這些食品后在身體里沒有農(nóng)藥的殘留量CC潛留量。 4)詞語搭配錯誤。包括詞性、音節(jié)等方面的搭配錯誤。 例如: 最好的辦法是兩個都保持CC走去平衡。 我也回CC1回去沈陽。 吃這種東西會CC1可以得CC1得到病CC1疾病。 CLH:離合詞錯誤標(biāo)記,用于標(biāo)示各種和離合詞相關(guān)的錯誤。標(biāo)在有錯誤的離合詞的后邊,表示前邊的離合詞用法有誤。 例如: 我快要畢業(yè)CLH大學(xué)CQ了。 雖然這么L多年都沒見面CLH過, 我對哈爾濱CJ-zy很感興趣。有觀光CLH哈爾濱的宿愿。 W:外文詞標(biāo)記,用于標(biāo)示以外文詞代替漢語詞的情

6、況。把外文詞移至W中W的后面,并在W前填寫相應(yīng)的漢語詞。在W和外文詞之間填寫漢語詞的字?jǐn)?shù)。 例如: 非洲W2Africa、爵士樂W3jazz。 教我工作的方法W2ABC。 CQ:缺詞標(biāo)記,用于標(biāo)示作文中應(yīng)有而沒有的詞。在缺詞之處加此標(biāo)記,并在CQ中CQ的后面填寫所缺的詞。 例如: 這就CQ要由有關(guān)部門和政策管理制度來控制。 有的農(nóng)民CQ在不使用化肥和農(nóng)藥的情B精況下BD,養(yǎng)農(nóng)作物, CD:多詞標(biāo)記,用于標(biāo)示作文中不應(yīng)有而有的詞。把多余的詞移至CD中CD的后面。 例如: 然后肯德基的收入有所增加CD了。 中國政府應(yīng)該采取良好的措施來管理農(nóng)業(yè)CD方面, 但我覺得CD按照上面所寫的方法是現(xiàn)在很多人或

7、國家用的方法。 詞處理中需要注意下列問題: 1)因介詞、方位詞等的缺少或多余造成的結(jié)構(gòu)不完整,助詞的錯用、多用、漏用,詞性誤用等,均視為詞的錯誤。 例如: 隨著社會CQ的發(fā)展,人們CQ對吃的東西很重視。 在這個過程CQ中 特別是非洲CD的話,問題很大的。 2)結(jié)構(gòu)助詞“的” 、“地” 、“得”混用:按錯詞處理。 例如: 按照人們的要求不用化肥和農(nóng)藥的話,產(chǎn)量會大大地CC的下降。 我認(rèn)為當(dāng)你很餓的時候,什么東西都吃得CC的下。 孩子們餓得CC地大哭小叫, 3)該用漢語數(shù)字而用阿拉伯?dāng)?shù)字的,一律按錯詞處理。 例如: 那應(yīng)該怎樣解決呢?所以我想出了一CC1個辦法,少用化肥和農(nóng)藥。 把“十五”寫成了“

8、一五”,應(yīng)把“一五”整體按錯詞處理,而不能僅僅把“一”處理為別字。 4)錯詞、多詞、成分贅余的一個標(biāo)注符號中可以包括兩個或兩個以上的詞。 例如: 我想任何人CC每一個都不要有浪費(fèi)食品的習(xí)慣,(每/一/個) 沒有CC2重視做未經(jīng)污染的食品就是綠色食品。(重視/做/未/經(jīng)) 5)原文字?jǐn)?shù)和改后字?jǐn)?shù)不一致的,須在括號中CC之后且緊靠CC處加一個阿拉伯?dāng)?shù)字,表明改后的字?jǐn)?shù)。 例如: 戰(zhàn)Pzhan爭中最困難的人是沒有力氣的孩子和老人CC5老弱子。 所以我認(rèn)為首先農(nóng)民可以使用天然肥料CC4化肥,代替化肥來種植農(nóng)作物 6)不清楚或無法理解的詞用CY標(biāo)示,表示“存疑”,標(biāo)在該詞的后面。 例如: 雖然這么L多年

9、都沒見面CLH過,但我和他們的憶慣CY,是忘不了的。 3、句處理: CJ:病句標(biāo)記,用于標(biāo)示錯誤的句子。一般標(biāo)在有錯誤的句子之后、該句標(biāo)點(diǎn)之前,并用小寫漢語拼音字母簡要標(biāo)明病句的錯誤類型。 例如: 他把那本書看CJba。 我認(rèn)為我們先盡量地B的產(chǎn)出農(nóng)作物給他們,先給他們不挨餓CJjy。 如果有人批評這是太奢侈CJxw, 句子錯誤類型代碼: CJba : 把字句錯誤 CJbei : 被字句錯誤 CJbi : 比字句錯誤 CJl : 連字句錯誤 CJy : 有字句錯誤 CJs : 是字句錯誤 CJsd : “是的”句錯誤 CJcx : 存現(xiàn)句錯誤 CJjy : 兼語句錯誤 CJld : 連動句錯誤

10、 CJshb : 雙賓語句錯誤 CJxw : 形容詞謂語句錯誤 CJ- :句子成分殘缺錯誤標(biāo)記,用于標(biāo)示由于成分殘缺造成的病句。在短橫后邊標(biāo)明所缺成分的名稱,該名稱用小寫代碼表示;在小寫代碼之后填寫所缺的具體詞語。標(biāo)在成分殘缺之處。 例如: 為了增加CC滿足糧食,CJ-zhuy人們使用了化肥和農(nóng)藥,這樣產(chǎn)量就會大大提高。 這樣的活動CJ-sy開展以來,肯德基的垃B拉圾C總量大大降低。 那兩種CC個東西就容易傷害人類的CJ-dy健康系統(tǒng)。 從具體CJ-zxy情況來看, CJ+ :句子成分多余錯誤標(biāo)記,用于標(biāo)示由于成分多余(贅余)造成的病句。后邊用小寫代碼標(biāo)明多余成分的名稱,并把所多余的具體詞語移

11、至該名稱的后面。標(biāo)在成分多余之處。 例如: 這是我們CJ+dy做人的責(zé)任。 而且研究CJ+buy下去產(chǎn)量能提高的辦法。 而且CJ+zy正在還死去好多人。 句子成分采用層次分析法的觀點(diǎn),共8種: CJ-/+zhuy :主語殘缺或多余 CJ-/+wy :謂語殘缺或多余 CJ-/+sy :述語殘缺或多余 CJ-/+by :賓語殘缺或多余 CJ-/+buy :補(bǔ)語殘缺或多余 CJ-/+dy :定語殘缺或多余 CJ-/+zy :狀語殘缺或多余 CJ-/+zxy :中心語殘缺或多余 CJX :語序錯誤標(biāo)記,用于標(biāo)示由于語序錯誤造成的病句。標(biāo)在語序錯誤的詞語的后邊。如果是相鄰的兩個成分語序錯誤,按照自然順序

12、,把CJX標(biāo)在前一個成分的后邊。 例如: 大多數(shù)CJX這些人生活CC2活在很不好的地方, 可是這兩個問題同時CJX要解決非常不容易, 現(xiàn)在每個人很重視健康,受歡迎CJX綠色食品。 CJZR :句式雜糅錯誤標(biāo)記,用于標(biāo)示把兩種不同句式、兩種不同說法混在一起的病句。標(biāo)在句子末尾,標(biāo)點(diǎn)之前。 例如: 這個問題不可能一兩年解決的問題CJZR。 現(xiàn)在,全世界流行是綠色食品CJZR。 每次吃對身體有害于健康的東西CJZR。 因?yàn)?,人們的必生存之一中最重要的是飲食CJZR, CJcd :重疊錯誤標(biāo)記,用于標(biāo)示句中詞語的重疊錯誤,包括重疊方式上的錯誤,也包括不該用而用重疊,或該用而不用重疊的情況。標(biāo)在出現(xiàn)重疊

13、錯誤的詞語之后。 例如: 而對生產(chǎn)者來說,盡量不用化肥和農(nóng)藥,在出貨之前,進(jìn)C行洗洗CJcd。 還有我們CQ應(yīng)對綠色食品研究研究CJcd。 CJgd :固定格式錯誤標(biāo)記,用于標(biāo)示固定格式搭配上的錯誤。 例如: “一就”缺少“一”或者“就”。 現(xiàn)代社會應(yīng)當(dāng)認(rèn)“保護(hù)自己,尊重其他人”為口號CJgd! WWJ :未完句標(biāo)記,用于標(biāo)示沒寫完的半截子的句子。標(biāo)在未完成句的末尾處。 例如: 只是全球WWJ 最后國家政府不考慮經(jīng)濟(jì)問題、積WWJ 不知道什么時候會普及起來,但是我認(rèn)為這還是不是個WWJ CJ? :句處理存疑標(biāo)志,用于標(biāo)示錯誤類型不清楚的、或錯誤類型標(biāo)注很不方便的、或句義不明且有語法錯誤的的病句

14、。標(biāo)在存疑病句之后、該句標(biāo)點(diǎn)之前。 例如: 地球上,有的地方還在“饑餓”來艱苦CJ?。 還要想每個人的健康是幫助饑餓人的辦法越來多健康的人會越來多幫饑餓的人CJ?。 把化肥可以取代CC代取用草、剩飯做的自然肥料CJ?,把農(nóng)藥也可以取代CC代取喜歡吃害蟲的動物CJ?。 4、篇章處理:(包括復(fù)句) CP :篇章錯誤標(biāo)記,用于標(biāo)示篇章錯誤。大括號的前半和后半分別表示有錯誤的篇章的起點(diǎn)和終點(diǎn),在起點(diǎn)處標(biāo)CP,在終點(diǎn)處標(biāo)P。即:CP,。,。P 所謂篇章錯誤,主要指句子和句子之間在銜接方面的錯誤。最典型的情況是每個單句都正確,但作為一個整體來看則句子相互之間缺乏聯(lián)系,不能構(gòu)成一個緊湊、自然、流暢的成段表達(dá)

15、。而產(chǎn)生這種情況的原因,可能是語義方面的,也可能是連接方式方面的。 例如: CP我們經(jīng)過了漫長的歷史,一些沒有用的人死于歷史中,挨餓其實(shí)是可以克服的。P (前后句意義上無關(guān)) CP吸煙對孩子們CJ-sy有不好的影響,這一觀念他會不會知道呢?所以我早就不理他了。P (用了表示因果關(guān)系的連詞,但句子之間并不存在因果關(guān)系) CP目前,隨著人們生活水平CQ的提高,CJ-zhuy人們CD就對飲食品很重視。就CJXCQ用未經(jīng)污染的農(nóng)產(chǎn)品加工的食品叫做“綠色食品”。P (前后句之間缺少過渡句) CP我以前看報(bào)紙的時候,有一篇關(guān)于農(nóng)藥的文章。他說,一般的食品,比如說,米,蔬菜、水果等CD的東西,好好兒洗一下就

16、行了,不用擔(dān)B但心。P (“他”指稱不明,使兩句之間失去聯(lián)系) 5、其他相關(guān)問題說明: 1)標(biāo)注的順序優(yōu)先原則:從大到小,即:篇句詞字。 篇章錯誤中含有句、詞、字錯誤的,錯句中包含詞、字錯誤的,詞中包含字的錯誤的,均應(yīng)按照從大到小的順序依次處理,分別標(biāo)注。 對同一個錯誤,能按篇章錯誤處理的即按篇章錯誤處理,否則按句式錯誤處理,其次按句子成分錯誤處理,再次按詞的錯誤處理,最后按字的錯誤處理。 從句式的角度看,把字句缺“把”、被字句缺“被”、有字句缺“有”、是字句缺“是”、“是的”句缺“的”等,均按特殊句式錯誤處理,而不按成分殘缺或缺詞處理。換句話說,有些錯誤雖然可以按句子成分錯誤或錯詞處理,但如

17、果是涉及某種特殊句式的問題,則一般優(yōu)先按句式錯誤處理。 從詞的角度看,句中所缺之詞如果涉及某種句式,則標(biāo)為錯句;雖然不涉及句式,但可以充當(dāng)某種句子成分,則應(yīng)按成分殘缺處理;與句式、成分都無關(guān)的才按缺詞處理。 例如: 如果我的祖國CC母國是西方的先進(jìn)國的話,我選“綠色食品”。CP如果我不是西方先進(jìn)國的人,而且缺少糧食國家的人的話BQ,不選“綠色食品”BQ。P (復(fù)句中關(guān)聯(lián)詞語的使用錯誤按篇章錯誤處理,而不視為錯詞或別字) 我對這個問題以下幾個觀點(diǎn)CJy。 (該句應(yīng)為有字句,所以按錯句處理,而不按缺述語或缺詞處理) 對于非洲來說CC來看,這是還不夠CJxw。 (漢語中形謂句無需用“是”,所以按錯句

18、處理,而不按多述語或多詞處理) 我認(rèn)為這種CD的現(xiàn)象,在很多人身上CJ-zy都會有的。 (“都”可以做狀語,所以按成分殘缺處理,而不按缺詞處理) 從CC對現(xiàn)在的情況來說,讓大家去吃“綠色食品”是太早了CC的。 (正確的說法并不是“是的”句,因而按錯詞處理,不視為錯句) 目前CC目先、祖國CC母國。 (“目先”、“母國”,作為詞是不存在的,屬用詞層面上的錯誤,所以按錯詞處理,而不視為別字) 現(xiàn)在各個B各國家都有“綠色食品”。 (考生知道有“各個”一詞,但誤將“個”寫成了“各”,所以按別字處理,而不視為錯詞) 2)同一個錯誤有兩種標(biāo)注方法的,可以把兩種標(biāo)法都標(biāo)上,中間用斜豎線分開。 例如: 隨著現(xiàn)代化CJ-dy科技的/CJ-zxy的發(fā)展 電子郵件是很方便CJxw/CJsd! 3)無需處理的情況: 分段錯誤,指該分而未分段、或不該分而分段的情況。不予處理。 內(nèi)容上

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論