




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、詞類與詞類標記原則:詞類與詞類標記原則:現(xiàn)代漢語現(xiàn)代漢語 邱智銘邱智銘 中央研究院語言學研究所中央研究院語言學研究所 E-mail: .twE-mail: .tw詞類標記詞類標記n詞類標記集詞類標記集n詞類標記與功能詞類標記與功能n特徵標記集特徵標記集n詞類標記原則及範例詞類標記原則及範例n中研院平衡語料庫詞類標記表中研院平衡語料庫詞類標記表n詞庫小組中文詞知識庫詞庫小組中文詞知識庫n中研院現(xiàn)代漢語平衡語料庫中研院現(xiàn)代漢語平衡語料庫詞類標記集詞類標記集n八大類別A : 非謂形容詞 C: 連接詞 D:
2、 副詞 N:體詞 (名詞) I : 感嘆詞 T: 語助詞 P: 介詞 V:述詞 (動詞) n178個詞類 (詞庫小組1993)n 43個簡化標記n 3個特殊標記詞類標記集詞類標記集n非謂形容詞(A): 主要是作名詞的修飾語,不具謂語作用,是純粹的形容詞。n非謂形容詞(A)類型: 1. 以名詞成分為基礎 : 空心 2. 以動態(tài)述詞性成分為基礎 : 平裝 野生 新興 3. 以狀態(tài)不及物的形容成分為基礎 : 大紅 上好 全盛 4. 其他 : 真正 共同 有機 詞類標記集詞類標記集n連接詞(C C): 主要是在連接兩個或兩個以上的語言單位,組成較大的語言單位。n連接詞(C C)類型: 1. Ca: 並
3、列連接詞 1.1. Caa: 和 跟 1.2. Cab: 等 等等 之類 2. Cb: 關聯(lián)連接詞 2.1 Cba( 移動性前繫連接詞): 因為 即使 2.2 Cbb(非移動性前繫連接詞): 就是 不但 2.3 Cbc(後繫連接詞): 那麼 而且詞類標記集詞類標記集n語助詞(T): 是一種後置成份,必須附在句子或詞組之後,藉以修飾句子或詞組,為表示說話者的語氣n語助詞分類: (以出現(xiàn)先後次序分) 1. Ta: 了 的 2. Tb: 沒 而已 罷了 也好 3. Tc: 啊 哇 呢 耶 喔 4. Td: 了嗎 而已嗎 與否 哉詞類標記集詞類標記集n感歎詞( I ): 表說者情緒或態(tài)度,是永遠獨用的
4、語式,一般出現(xiàn)在句字前,有時也在句後n感歎詞為列得完的一類,依情緒分如下: 1. 表驚訝或感嘆: 哎呀 哇 7. 表了解: 喔 噢 2. 表悲痛或痛惜: 嗚呼 唉 8. 表否定: 噯 3. 表憤怒或鄙斥: 哼 呸 9. 表應諾: 欸 嗯 4. 表懊悔或惋惜: 咳 10. 表招呼: 喂 嗨 哈囉 5. 表疑惑: 咦 哦 11. 表警語: 噓 6. 表稱讚: 妙哉 嘿 詞類標記集詞類標記集n介詞(P P): 介詞在漢語中屬於前置詞(preposition) ,同時也是功能詞的一種,其判斷標準為: 1.介詞必須引介一論元,且此論元成分不可省略。 2.介詞不做謂語中心。 3.介詞沒有時態(tài)(aspect
5、),沒有嘗試貌。n介詞為一封閉的集合,詞庫小組依介詞的語法表現(xiàn)和扮演的語意角色歸類66組介詞(P01P66)詞類標記集詞類標記集n副詞(D): 主要是當作謂語或句子的修飾語,副詞在句中出現(xiàn)的位置常在主語和述詞之間,部分可出現(xiàn)在句首,極少數(shù)可出現(xiàn)在述詞後。n副詞的次分類是依語意判斷的,可分以下11類: 1. DaDa (數(shù)量副詞): 一共 都 2. DbaDba (法相副詞): 可能 應該 3. Dbb,DbcDbb,Dbc (評價副詞): 居然 難怪 4. Dc Dc (否定副詞): 未曾 從不 5. DdDd (時間副詞): 時常 漏夜 近來 6. DfDf (程度副詞): 非常 很 極了詞
6、類標記集詞類標記集 7. Dg Dg (地方副詞): 當街 一路 處處 8. Dh Dh (方式副詞): 變相 私自 千方百計 9. DiDi (標誌副詞): 著 過 起 10. DjDj (疑問副詞): 為何 幹啥 是否 11. DkDk (句副詞): 總之 老實說 據(jù)說詞類標記集詞類標記集n體詞(N N) : 一般而言,名詞在句中充當主語或賓語,只有少數(shù)名詞才會充當謂語。n體詞的分類: 1. NaNa(名詞) 2. NbNb(專有名稱): 人名 部落名 歷史事件 3. NcNc(地方名詞): 地方名稱 行政單位 4. NdNd(時間名詞): 季節(jié) 朝代 5. NeNe(定詞): 指示定詞
7、特指定詞 數(shù)詞定詞 數(shù)量定詞 6. NfNf(量詞): 計量的單位詞 7. NgNg(方位詞) 8. NhNh(代名詞)詞類標記集詞類標記集n述詞(V): 為一個句子的中心語,其所承載的訊息,包括述詞必要的論元個數(shù)、述詞論元的詞組形式、論元的語意角色及語意限制,都是述詞分類架構的依歸。n述詞分類: 1. VAVA(動作不及物述詞): 只需一個論元作主語 /坐/睡/進駐 2. VBVB(動作類單賓述詞): 需兩個參與論元,且賓語不能直接出現(xiàn)在述 詞之後 /求婚/洗塵/拜年 3. VCVC(動作單賓述詞): 需兩參與論元,且皆為名詞組 /檢查/學 4. VDVD(雙賓述詞): 一個述詞,後接兩個賓
8、語需三個論元來滿足其語 意表現(xiàn) /送/交 5. VEVE(動作句賓述詞): 接句子論元的動作述詞需二或三個 論元 /自言自語/大聲急呼詞類標記集詞類標記集 6. VFVF(動作謂賓述詞): 以述詞組為其賓語的及物述詞,需二或三個 論元 /打算/勸 7. VGVG(分類述詞): 連結客體(THEME)與範圍(RANGE)兩個角色,需二 或三個論元 /稱呼/等於 8. VHVH(狀態(tài)不及物述詞): 只有一必要論元 /動聽/瀰漫 9. VIVI(狀態(tài)類單賓述詞): 需兩參與論元,但賓語不能直接出現(xiàn)在述詞 之後 /鍾情/失信 11. VKVK(狀態(tài)句賓述詞): 接句子論元之狀態(tài)述詞,需兩論元 /了解/
9、不滿 12. VLVL(狀態(tài)謂賓述詞): 以述詞組為其賓語的狀態(tài)述詞,需二或三個論 元 /輪/讓詞類標記集詞類標記集n3個特殊標記: 1. DE: 的,之,得,地 2. SHI: 是 3. FW: 外文標記詞類標記與功能詞類標記與功能n詞類給定的的原則,理論上是一個詞一個類,但就語法功能來說,一個標記不一定只代表一個功能,所以詞類標記可分為兩大類,一是單一功能標記,另一是多功能標記。n單一功能標記:Caa、Cab、Cba 、Cbb 、 Dfa 、 Dfb 、 Di 、 Dk 、 D 、 Nf 、 Ng 、 Neu 、 Nes 、 Neqb 、 P 、 I 、 T 。n多功能標記: A、Da、D
10、E、SHI、N*(Nf、Ng、Nd、Nep、Neqa.)、V*(VH 、 V_2.) 。 特徵標記集特徵標記集n除了標記詞類外,詞庫小組也為某些特殊句法表現(xiàn)做標記,目前使用的特徵標記共九個,包括: 1. 動補式特徵標記 2. 動賓式特徵標記 3. 合併詞中插特徵標記 4. 外來語特徵標記 5. 名物化特徵標記 6. 專有名詞特徵標記 特徵標記集特徵標記集n中研院平衡語料庫特徵標記集特徵標記使 用 情 況例子+vrvV of a separable VR compound叫Vc+vrv不醒+vrrR of a separable VR compound叫不醒 Vc+vrr+spvV of a s
11、eparable V N compound吃Vc+spv了他的虧+spoN of a separable V N compound吃了他的虧 Na+spo+p1the first part of a separated compound初(Nc)+p1、高中(Nc)+p2the second part of a separated compound星期六(Nd)、日(Nd) +p2+fwthe feature of a foreign word卡拉OK(Na)+fw+nomthe feature for verbal nominalization他的不講理(VA)+nom+propthe fe
12、ature for proper nouns人本(A)+prop基金會(Nc)詞類標記原則及範例詞類標記原則及範例n詞類標記原則詞類標記原則 1. 詞類標記應符合它在語境中所扮演的語法功能。 2. 一個字串在辭典中有一個以上的標記,依它在語 境中的語意及語法功能給予適當標記。 3. 一個字串在辭典中有一個以上的標記,且標記間 有功能重疊之處,則依各類型的規(guī)範處理。 詞類標記原則及範例詞類標記原則及範例n範例範例: 過(Di, Dfa, VH,VCL) 1. 我看過過(Di)這本雜誌 2. 他的體重是過過(Dfa)重了點 3. 他的檢定考沒過過(VH) 4. 時間真的過過(VC)的太快了! 5.
13、 他走過走過(VCL)這座橋。 6. 這座橋,他走過過(Di)/走過走過(VCL) 。中研院平衡語料庫詞類標記表中研院平衡語料庫詞類標記表 簡 化 標 記 對 應 的 CKIP 詞 類 標 記 A A /*非謂形容詞*/ Caa Caa/*對等連接詞,如:和、跟*/ Cab Cab/*連接詞,如:等等*/ Cba Cbab/*連接詞,如:的話*/ Cbb Cbaa, Cbba, Cbbb, Cbca, Cbcb/*關聯(lián)連接詞*/ D Dab, Dbaa, Dbab, Dbb, Dbc, Dc, Dd, Dg, Dh, Dj/*副詞*/ Da Daa/*數(shù)量副詞*/ DE /*的, 之, 得,
14、地*/ Dfa Dfa/*動詞前程度副詞*/ Dfb Dfb/*動詞後程度副詞*/ Di Di/*時態(tài)標記*/ Dk Dk/*句副詞*/中研院平衡語料庫詞類標記表中研院平衡語料庫詞類標記表 FW /*外文標記*/ I I/*感嘆詞*/ Na Naa, Nab, Nac, Nad, Naea, Naeb/*普通名詞*/ Nb Nba, Nbc/*專有名稱*/ Nc Nca, Ncb, Ncc, Nce/*地方詞*/ Ncd Ncda, Ncdb/*位置詞*/ Nd Ndaa, Ndab, Ndc, Ndd/*時間詞*/ Nep Nep/*指代定詞*/ Neqa Neqa/*數(shù)量定詞*/ Neqb
15、 Neqb/*後置數(shù)量定詞*/ Nes Nes/*特指定詞*/ Neu Neu/*數(shù)詞定詞*/ Nf Nfa, Nfb, Nfc, Nfd, Nfe, Nfg, Nfh, Nfi/*量詞*/中研院平衡語料庫詞類標記表中研院平衡語料庫詞類標記表 Ng Ng/*後置詞*/ Nh Nhaa, Nhab, Nhac, Nhb, Nhc/*代名詞*/ P P*/*介詞*/ SHI /*是*/ T Ta, Tb, Tc, Td/*語助詞*/ VA VA11,12,13,VA3,VA4/*動作不及物動詞*/ VAC VA2/*動作使動動詞*/ VB VB11,12,VB2/*動作類及物動詞*/ VC VC2, VC31,32,33/*動作及物動詞*/ VCL VC1/*動作接地方賓語動詞*/ VD VD1, VD2/*雙賓動詞*/ VE VE11, VE12, VE2/*動作句賓動詞*/ VF VF1, VF2/*動作謂賓動詞*/中研院平衡語料庫詞類標記表中研院平衡語料庫詞類標記表 VG VG1, VG2/*分類動詞*/ VH VH11,12,13,14,15,17,VH21/*狀態(tài)不及物動詞*/ VHC VH16, VH22/*狀態(tài)使動動詞/ VI VI1,2,3/*狀態(tài)類及物動詞*/ VJ VJ1,2,3/*狀態(tài)及物動詞*/ VK VK1,2/*狀態(tài)句賓動詞*
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 消防教育培訓方案
- 3月份安全生產(chǎn)例會
- 教育新生態(tài)全球在線教育平臺的優(yōu)勢對比
- 標準化考試中心建設規(guī)劃與實施方案
- 糧食安全視角下的耕地保護問題與解決方案
- 音樂廳舞臺保潔與布置流程
- 教育機構部門協(xié)同發(fā)展方案
- 智慧農(nóng)批市場發(fā)展分析報告
- 藝術哲學與倫理學的結合研究-洞察闡釋
- 其他新興問題與探索性研究方向-洞察闡釋
- LS 8010-2014植物油庫設計規(guī)范
- GB/T 20041.21-2017電纜管理用導管系統(tǒng)第21部分:剛性導管系統(tǒng)的特殊要求
- GB/T 19465-2004工業(yè)用異丁烷(HC-600a)
- GB/T 18255-2022焦化粘油類產(chǎn)品餾程的測定方法
- GB/T 11832-2002翻斗式雨量計
- 防損培訓課程之一防損基礎知識
- GA/T 1147-2014車輛駕駛人員血液酒精含量檢驗實驗室規(guī)范
- 學前兒童心理學論文
- 輪機英語詞匯匯總
- 溝通秘訣-報聯(lián)商課件
- 充電樁檢測報告模板
評論
0/150
提交評論