(完整word版)現(xiàn)代漢語常用詞表_第1頁
(完整word版)現(xiàn)代漢語常用詞表_第2頁
(完整word版)現(xiàn)代漢語常用詞表_第3頁
(完整word版)現(xiàn)代漢語常用詞表_第4頁
(完整word版)現(xiàn)代漢語常用詞表_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

(完整word版)現(xiàn)代漢語常用詞表(完整word版)現(xiàn)代漢語常用詞表(完整word版)現(xiàn)代漢語常用詞表現(xiàn)代漢語常用詞表(草案)現(xiàn)代漢語常用詞表(草案)

1.范圍本規(guī)范(草案)提出了現(xiàn)當(dāng)代社會生活中比較穩(wěn)定的、使用頻率較高的漢語普通話常用詞語56008個,形成《現(xiàn)代漢語常用詞表》,給出了詞語的詞形。本規(guī)范(草案)可供中小學(xué)語文教學(xué)、掃盲教育、漢語教育、中文信息處理和辭書編纂等方面參考、采用。2.術(shù)語和定義2.1常用詞現(xiàn)代漢語普通話范疇中使用頻率高、適用范圍廣的詞語。2.2詞形本規(guī)范(草案)指詞語的書寫形式。2.3詞頻在一定數(shù)量的語料中同一個詞語出現(xiàn)的頻度,一般用詞語的出現(xiàn)次數(shù)或覆蓋率來表示。本規(guī)范(草案)指詞語的出現(xiàn)次數(shù)。2.4頻級同一語料調(diào)查范圍中詞頻數(shù)相同的為一個頻級。本詞表頻級統(tǒng)計(jì)分兩步:第一步形成不同類型語料庫的頻級,即原始頻級。第二步形成總語料的頻級,就是將幾個原始頻級之和再除以不同類型語料庫的數(shù)目。3.研制原則3.1詞和語兼顧原則本規(guī)范(草案)的詞語收錄,以單音節(jié)詞和雙音節(jié)詞為主。同時(shí),根據(jù)語言使用的實(shí)際情況,也收錄一些常用的縮略語、成語、慣用語等熟語,以及表達(dá)整體概念名稱的其他固定短語。3.2系統(tǒng)性和實(shí)用性兼顧原則本規(guī)范(草案)的詞語收錄,既注意詞語的系統(tǒng)性,又注意詞語在語用中的實(shí)用性。如以表示季節(jié)為根詞的一些詞,全部收錄它的加綴詞“初春”“初冬”“初秋”“初夏”,但對于“‘晚’+季節(jié)”的詞語,只收錄“晚春”“晚秋”,未收錄“晚冬”“晚夏”;對于“‘殘’+季節(jié)”的詞語,只收錄“殘冬”未收錄“殘春”“殘秋”“殘夏”。4.《現(xiàn)代漢語常用詞表》(草案)說明4.1本表研制過程中,收集詞語同國家語委“現(xiàn)代漢語通用語料庫”核心語料庫、廈門大學(xué)的新詞語語料庫、《現(xiàn)代漢語規(guī)范詞典》、《現(xiàn)代漢語詞典》、《新華詞典》等所收詞語進(jìn)行了比對,并查驗(yàn)了該詞在人民網(wǎng)《人民日報(bào)》報(bào)系網(wǎng)頁以及Google網(wǎng)簡體中文網(wǎng)頁、百度網(wǎng)等常用網(wǎng)頁上的使用情況。4.2本表用來檢測詞頻的語料庫有:國家語委“現(xiàn)代漢語通用語料庫”中經(jīng)分詞標(biāo)注的4500萬字語料、《人民日報(bào)》2001年~2005年約1.35億字的分詞標(biāo)注語料和廈門大學(xué)的現(xiàn)當(dāng)代文學(xué)作品語料庫約7000萬字的語料??偣?.5億字。4.3本表共收錄常用詞語56008個,包括單音節(jié)詞3181個,雙音節(jié)詞語40351個,三音節(jié)詞語6459個,四音節(jié)詞語5855個,五音節(jié)和五音節(jié)以上詞語162個。表內(nèi)條目按頻級升序排列,頻級相同的按漢語拼音音序排列。4.4本規(guī)范(草案)提供了《現(xiàn)代漢語常用詞表》的音序索引,按漢語拼音音序排列,同音的條目按筆畫數(shù)由少到多排列。其中,詞語的讀音只供檢索使用,不代表詞語的讀音規(guī)范。頻序號詞語1的2是3在4一5不6有7這8個9上10也11他12人13就14對15說16我17要18到19大20我們21多22把23來24等25年26兩27從28而29能30又31他們頻序號詞語32以33時(shí)34沒有35會36之37但38三39被40很41下42自己43后44中國45并46使47向48已49出50用51新52所53里54給55她56更57次58最59于60可以61可62去頻序號詞語63由64問題65小66工作67讓68其69你70這個71生活72起73這樣74天75它76高77做78家79已經(jīng)80再81或82才83前84走85這些86一些87卻88二89條90位91起來92各93成頻序號詞語94什么95元96現(xiàn)在97社會98比99同100四101關(guān)系102名103想104如105第一106因?yàn)?07該108開始109許多110內(nèi)111時(shí)間112人們113今天114國家115本116點(diǎn)117思想118至119此120一定121如果122副123無124張125同時(shí)126需要127月128則頻序號詞語129重要130為了131日132老133就是134作135五136人民137事138認(rèn)為139成為140像141北京142歷史143水144方面145情況146而且147黨148學(xué)生149每150這里151但是152孩子153可能154發(fā)生155必須156只有157外158要求159全160發(fā)現(xiàn)161進(jìn)行162特別163因頻序號詞語164歲165得到166件167文化168分169便170同志171發(fā)展172即173日本174總175因此176對于177領(lǐng)導(dǎo)178帶179既180時(shí)候181錢182自183政府184吃185非186決定187進(jìn)188還是189受190國191應(yīng)該192近193美194政治195話196公司197干部198出現(xiàn)頻序號詞語199開200一切201研究202認(rèn)識203寫204十分205十206站207之間208問209希望210快211雖然212相(xi?。瞑溃?13美國214知道215講216大家217學(xué)校218組織219見220由于221正在222法223表示224一樣225活動226如何227教育228書229據(jù)230城市231道232藝術(shù)頻序號詞語233經(jīng)濟(jì)234以及235部236影響237太238其中239學(xué)240先生241完全242連243主要244繼續(xù)245頭246革命247之后248參加249能夠250住251上海252經(jīng)過253非常254低255甚至256聽257先258一直259學(xué)習(xí)260仍261辦262所以263代表264變265最后266一起267萬頻序號詞語268所有269那么270心271越272較273辦法274路275有些276未277通過278找279按280拿281解決282一般283另284經(jīng)285半286強(qiáng)287或者288時(shí)代289手290作品291不斷292以后293關(guān)于294青年295各種296真297其他298農(nóng)民299那些300余301段302有的頻序號詞語303買304根本305縣306作者307者308請309叫310感到311怎么312任何313六314表現(xiàn)315反316存在317然而318準(zhǔn)備319送320約321比較322書記323愛324單位325群眾326應(yīng)當(dāng)327王328早329女330門331個人332座333全國334意義335花336條件337環(huán)境頻序號詞語338了解339搞340力量341不僅342目前343經(jīng)驗(yàn)344產(chǎn)生345真正346回347隊(duì)348有關(guān)349字350會議351生命352今年353努力354靠355八356市357類358共359意見360死361民族362塊363只要364文學(xué)365成功366變化367句368管369你們370指371地區(qū)372方頻序號詞語373和(hé)374項(xiàng)375注意376當(dāng)然377達(dá)378面379坐380家庭381原因382進(jìn)入383病384介紹385下來386事情387方式388首389計(jì)劃390人類391報(bào)告392世紀(jì)393方法394入395信396化397步398生399聲400圖401電話402能力403片404作用405臺406如此(略)附錄《現(xiàn)代漢語常用詞表(草案)》音序索引詞語漢語拼音頻序號阿爸ābà18137阿昌族?。悖瑷。瞑溃?0849阿斗?。洙?2632阿飛?。妯ィ?8603阿富汗?。妯矗瑷ぃ?461阿訇?。瑷瞑?4432阿拉伯?dāng)?shù)字?。歙。猕螅瑷矗?5937阿拉伯語?。歙。猕?0476阿媽āmā16220阿門?。悫Γ?7913阿QāQ20845阿司匹林?。蟥皎歙?0294阿嚏ātì54643阿姨?。?842啊(?。┄?6090啊呀āyā15418啊喲?。。?3908?。èⅲ┄?8693?。è#┄?8287?。èぃ┄?514?。è唬┄?175哎?。?497哎呀āiyā8456哎喲?。椋。?1815哀兵必勝?。椋猕瞑?bìshènɡ53102哀愁?。椋悖瑷?5684哀悼?。椋洙ぃ?091哀告?。楱括ぃ?6418哀歌āiɡē40509哀號?。椋瑷ⅲ?9605哀嚎āiháo45194哀叫?。椋辏楱ぃ?5031哀哭?。椋毹?1402哀憐?。椋欤楱ⅲ?5032哀鳴āimínɡ28081哀戚?。椋瘿?6661哀泣?。椋瘿?4322哀求?。椋瘢楱?1984哀傷āish?。瞑?9763哀思?。椋蟥?3975哀嘆?。椋舁ぃ?6507哀慟?。椋舁埃瞑?6377哀痛āitònɡ27828哀婉?。椋鳕#?2720哀怨āiyuàn23209哀樂?。椋酲?0602埃?。?336埃及?。椋戗?121挨(āi)?。?736挨邊兒?。椋猓楱。睿?3583挨次?。椋悒?0951挨個兒?。楱括ǎ?2370挨戶āihù17735挨肩兒?。椋辏楱。睿?6979挨近?。椋戗?6596唉(āi)?。?474唉聲嘆氣āishēnɡ-tànqì24870唉呀?。椋?5872挨(ái)ái4436挨餓ái'è16362挨批áipī34907挨整áizhěnɡ37482挨揍áizòu36941皚皚ái'ái28598癌ái10793癌變áibiàn35321癌細(xì)胞áixìb?。?9156癌癥áizhènɡ6730癌腫áizhǒnɡ44071噯ǎi9372矮ǎi5267矮墩墩ǎidūndūn53103矮胖ǎipànɡ27829矮小ǎixiǎo16293矮子ǎizi22440艾ài9226艾蒿àih?。?6593艾窩窩àiwōwo55566艾滋病àizībìnɡ3427唉(ài)ài4115愛ài323愛不釋手àibùshìshǒu24929愛財(cái)如命àicái-rúmìnɡ54115愛稱àichēnɡ46662愛答不理àid?。猕矗歙?2602愛戴àidài11712愛爾蘭ài'ěrlán6977愛撫àifǔ19330愛國àiɡuó2338愛國主義àiɡuózhǔyì3990愛好àihào5492愛河àihé36942愛護(hù)àihù5862愛將àijiànɡ34908愛克斯光àikèsīɡuānɡ55082愛憐àilián23303愛戀àiliàn22255愛美àiměi21216愛面子àimiànzi31481愛莫能助àimònénɡzhù31595愛慕àimù18550愛女àinǚ29712愛情àiqínɡ2005愛人àiren5519愛神àishén30357愛屋及烏àiwū-jíwū47287愛惜àixī14976愛心àixīn4350愛憎àizēnɡ24550愛憎分明àizēnɡ-fēnmínɡ33081隘口àikǒu39452礙ài10576礙口àikǒu54644礙難àinán48993礙事àishì24816礙手礙腳àishǒu-àijiǎo45495礙眼àiyǎn43825曖昧àimèi17148安?。?651安步當(dāng)車?。睿猕?dànɡchē53104安插?。睿悖瑷?7587安抵?。睿洙?5796安定?。睿洙瞑?956安度?。睿洙?7830安頓āndùn15085安放?。睿妯ぃ瞑?5202安分?。睿妯ǎ?9045安分守己?。睿妯ǎ?shǒujǐ30358安撫?。睿妯?6334安好?。睿瑷#?6594安徽?。睿瑁酲?002安家ānjiā21467安檢?。睿辏楱#?0603安靜?。睿戗瞑?113安居?。睿戗?5923安居工程?。睿戗报括瞑溃悖瑷Γ瞑?8340安居樂業(yè)ānjū-lèyè10051安康?。睿毹。瞑?2674安樂?。睿歙?9724安樂死ānlèsǐ38044安樂窩?。睿歙ǎ鳕?7483安樂椅ānlèyǐ44323安理會?。睿歙瑁酲?752安謐?。睿悫?6770安眠?。睿恚楱ⅲ?2861安眠藥?。睿恚楱ⅲ睿ぃ?1184安民告示?。睿悫瞑括ぃ铮螅瑷?5797安寧?。睿瞑瞑?724安排?。睿皎ⅲ?13安培ānpéi22659安貧樂道?。睿皎?lèdào46980安琪兒?。睿瘿?ér38213安寢?。睿瘿?4324安全?。睿瘢酲ⅲ?09安全帶?。睿瘢酲ⅲ睿洙ぃ?9797安全島?。睿瘢酲ⅲ睿洙#?8994安全閥?。睿瘢酲ⅲ睿妯?8251安全感?。睿瘢酲ⅲ瞑括#?1863安全帽?。睿瘢酲ⅲ睿悫ぃ?0135安全門?。睿瘢酲ⅲ睿悫Γ?2371安全套ānquántào23630安全系數(shù)?。睿瘢酲ⅲ睿螅瑷?9177安然?。睿颞ⅲ?1659安如磐石?。睿颞玻皎ⅲ睿螅瑷?5849安如泰山ānrútàish?。?5083安設(shè)?。睿螅瑷?2847安身?。睿螅瑷ィ?7022安身立命?。睿螅瑷ィ?lìmìnɡ27259安神?。睿螅瑷Γ?4572安生ānshenɡ22441安適?。睿螅瑷?1376安睡ānshuì28897安泰?。睿舁ぃ?9037安土重遷āntǔ-zhònɡqi?。?3584安危?。睿鳕ィ?0168安慰?。睿鳕ǎ?875安穩(wěn)ānwěn14568安息?。睿?8762安閑?。睿楱ⅲ?5466安詳?。睿楱ⅲ瞑?2330安享ānxiǎnɡ33609安歇?。睿楱?8045安心?。睿?180安養(yǎng)?。睿#瞑?4116安逸?。睿?8491安營?。睿瞑?6943安營扎寨?。睿瞑?zh?。瑷ぃ?7510安于ānyú24930安葬?。睿ぃ瞑?7219安之若素?。睿瑷?ruòsù43360安置?。睿瑷?645安裝ānzhu?。瞑?200桉樹?。睿螅瑷?2345氨?。?1115氨基酸ānjīsu?。?5442氨氣ānqì41641氨水?。睿螅瑁酲?4573庵?。?2110庵堂?。睿舁ⅲ瞑?6088諳練?。睿欤楱ぃ?5567諳熟?。睿螅瑷?6771鵪鶉?。睿悖瑷玻?9290鞍馬?。睿悫?6027鞍馬勞頓ānmǎ-láodùn48604鞍前馬后?。睿瘢楱ⅲ?mǎhòu44325鞍子?。睿?8627俺ǎn2677埯ǎn51701岸àn4679岸然ànrán50468按àn279按兵不動ànbīnɡ-bùdònɡ27023按部就班ànbù-jiùbān25179按鍵ànjiàn32346按揭ànjiē23054按理ànlǐ30787按例ànlì48995按脈ànmài52135按摩ànmó10229按捺ànnà25943按鈕ànniǔ18863按期ànqī12723按時(shí)ànshí5677按說ànshuō19355按圖索驥àntú-suǒjì39235按壓ànyā37125按語ànyǔ34909按照ànzhào634案àn1109案板ànbǎn28985案牘àndú48605案發(fā)ànfā13946案犯ànfàn20151案件ànjiàn1461案卷ànjuàn23156案例ànlì7184案情ànqínɡ11301案頭àntóu18138案由ànyóu36095案值ànzhí13209案子ànzi6523暗àn2609(略)《現(xiàn)代漢語常用詞表(草案)》研制報(bào)告一研制背景為給語文應(yīng)用和有關(guān)政策的制定提供科學(xué)的詞匯依據(jù),積極服務(wù)于漢語規(guī)范化、推廣普通話,積極服務(wù)于中小學(xué)語文教學(xué)、掃盲教育、漢語教育、中文信息處理和辭書編纂等工作,1998年7月國家語言文字工作委員會批準(zhǔn)立項(xiàng),成立《現(xiàn)代漢語通用詞表》研制課題組。該詞表作為國家已經(jīng)公布的《現(xiàn)代漢語通用字表》等的配套規(guī)范,是我國語言文字規(guī)范化、語文教育和研究方面的基本建設(shè)項(xiàng)目。研制工作自1998年7月啟動,于2001年年底完成并通過了專家鑒定。鑒于5年來漢語詞語發(fā)展變化很大,研究和統(tǒng)計(jì)手段又有很大提高,為把詞表研制工作做得更加扎實(shí)完善,課題組希望對原詞表進(jìn)行修訂。2005年6月教育部語信司決定在原詞表的基礎(chǔ)上進(jìn)行修訂,此項(xiàng)工作由原課題組和新立項(xiàng)的《現(xiàn)代漢語通用詞量與分級》課題組合作進(jìn)行,共同研制一個常用詞表。根據(jù)5年來語言發(fā)展變化的情況和對詞條增刪調(diào)整,按新的統(tǒng)計(jì)處理方法確定其常用度并以此重新排序,使之能更真實(shí)地反映我國現(xiàn)代漢語詞匯系統(tǒng)的概貌。這次修訂工作進(jìn)行了一年半,主要是對詞語作了較大規(guī)模的增刪調(diào)整,并根據(jù)詞頻調(diào)查結(jié)果確定了使用頻級。修訂的主體工作于2007年1月完成,之后又根據(jù)有關(guān)專家和部門的意見陸續(xù)作了增補(bǔ)和修改。二研制過程(一)初稿的形成本詞表初稿的研制工作,主要包含下列幾方面的內(nèi)容:(1)搜集有關(guān)文獻(xiàn)資料,研究前人制訂各種詞表的經(jīng)驗(yàn)和教訓(xùn);(2)比較現(xiàn)有的、在社會上影響較大的辭書的詞目,并研究它們的取舍標(biāo)準(zhǔn);(3)進(jìn)行社會調(diào)查,了解群眾使用漢語詞匯的具體情況;(4)在把《現(xiàn)代漢語規(guī)范詞典》開編時(shí)的詞目和其他10多本詞典、詞表進(jìn)行對比后進(jìn)行增刪的基礎(chǔ)上,用山西大學(xué)和清華大學(xué)計(jì)算機(jī)中心所儲存的語料進(jìn)行詞匯覆蓋率的檢驗(yàn)。對條目的增刪,除了利用計(jì)算機(jī)之外,還進(jìn)行了人工干預(yù),逐條審核。通過以上工作,形成了總詞目為61000多個的“詞表”。2000年2月26日在北京經(jīng)專家鑒定通過。鑒定委員有陸儉明、陳章太、曹先擢、常寶儒、劉慶隆、林杏光和蘇培成,由蘇培成主持。(二)詞表的修訂2005年春天,為了加快詞表研制工作的進(jìn)度和提高質(zhì)量,在教育部語言文字信息管理司的組織下,研制組聯(lián)合蘇新春主持的“現(xiàn)代漢語通用詞量與分級”課題組對原詞表作了修訂并再次進(jìn)行詞頻統(tǒng)計(jì)工作。將“詞表”同國家語委研制的“通用語料庫”的核心語料庫所收詞語進(jìn)行比對。核心語料庫約有15萬多個詞語,除去專有名詞、行業(yè)詞語、人名、地名等以外,語文類詞語約10萬個。將“詞表”同這10萬個詞語進(jìn)行逐一比對,按照常用詞表既定的收錄原則逐條篩選。在審慎分析各詞語在通用語料庫中詞頻的基礎(chǔ)上,考察社會語文生活中的實(shí)際使用情況,經(jīng)過人工干預(yù)增選出約4000多個詞語。將“詞表”同《現(xiàn)代漢語規(guī)范詞典》、《現(xiàn)代漢語詞典》(第5版)、《新華詞典》等所收詞語進(jìn)一步比對。排除其中的方言詞語、專有名詞、行業(yè)詞語以及現(xiàn)代語文生活中存活率或使用率明顯偏低的文言詞語,再按照常用詞表既定的收錄原則進(jìn)行審核,增補(bǔ)了500多個詞語。將“詞表”同新詞語語料庫所收新詞語進(jìn)行比對。利用廈門大學(xué)研制的新詞語語料庫,按照課題組既定的收錄原則進(jìn)行篩選,經(jīng)現(xiàn)代漢語通用語料庫檢測,增補(bǔ)了1000余個詞語。至此,“詞表”的詞語收錄總數(shù)擴(kuò)展到了66000多個。對“詞表”詞語進(jìn)行綜合審讀,必要時(shí)查驗(yàn)了該詞在人民網(wǎng)《人民日報(bào)》報(bào)系網(wǎng)頁以及Google網(wǎng)簡體中文網(wǎng)頁、百度網(wǎng)等常用網(wǎng)頁上的使用情況,作了再次調(diào)整(主要是刪除尚不具備本表所界定的“常用”規(guī)格的詞語),另外也考慮到作為常用性詞表的詞,不宜象一般詞典那樣因語音或語法的細(xì)小差異而將詞目作過細(xì)的區(qū)分。后來在送專家和有關(guān)部門審讀中,又根據(jù)審讀意見陸續(xù)作了調(diào)整和刪減。最終形成的《現(xiàn)代漢語常用詞表》,收錄詞語共56008個。[1]包括單音節(jié)詞3181個,雙音節(jié)詞語40351個,三音節(jié)詞語6459個,四音節(jié)詞語5855個,五音節(jié)和五音節(jié)以上詞語162個。調(diào)查所有詞語的使用頻次。用來檢測詞頻的語料庫有三種:第一種是國家語委主持研制的“通用語料庫”中經(jīng)分詞標(biāo)注的4500萬字語料。第二種是《人民日報(bào)》2001年~2005年約1.35億字的分詞標(biāo)注語料。第三種是廈門大學(xué)研制的現(xiàn)當(dāng)代文學(xué)作品語料庫,約7000萬字的語料。總共2.5億字。以上三種語料均作有分詞與標(biāo)注,從中獲得詞頻數(shù)據(jù)。對以下兩種情況作了人工檢測。第一種是分詞后在該語料中沒有出現(xiàn)的詞語。做法是將被檢詞放到未作分詞標(biāo)注的原始語料中以查檢字符串的方式調(diào)出所有用例進(jìn)行人工甄別,從而避免原始語料中有詞卻因軟件分詞而消失了。在查檢時(shí)對數(shù)量大的語例則用隨機(jī)抽樣的方法抽檢。第二種是同形詞。對同形異義詞在實(shí)際語例中進(jìn)行人工干預(yù),區(qū)分意義,分別統(tǒng)計(jì)詞頻。三研制原則和方法(一)收詞原則本詞表所稱的“常用詞”是指以漢語為母語的中等文化程度的人,在社會語文生活中經(jīng)常見到和使用的現(xiàn)代漢語普通話詞語。本詞表要求給現(xiàn)當(dāng)代社會語文生活中通用的、穩(wěn)定性較強(qiáng)、使用頻率較高的漢語普通話詞語劃出一個范圍,作為現(xiàn)代漢語詞匯系統(tǒng)的基干部分,從而為語言應(yīng)用和有關(guān)語言文字政策的制訂提供科學(xué)的詞匯依據(jù)。在研制中,既注重了書面詞語的收集,也兼顧了常用口語詞語的考察,還適當(dāng)收了一些在現(xiàn)代社會大眾傳媒中時(shí)有出現(xiàn),跟語文生活有所關(guān)聯(lián)的行業(yè)性、歷史性詞語。至于更專業(yè)些的詞語將另行研制,作為《現(xiàn)代漢語常用詞表》的附表。本詞表以收錄單音節(jié)詞和雙音節(jié)詞為主。同時(shí),根據(jù)語言交際實(shí)際也收錄一些使用頻率明顯較高的縮略語、成語、慣用語等熟語,以及表達(dá)整體概念名稱的其他固定短語。1.鑒于漢語詞語本身在縮略、擴(kuò)展、拆用,以及跟別的詞語組合成新的固定語等方面的靈活性和復(fù)雜情況,本詞表的詞語篩選還貫徹了以下規(guī)則:(1)對于帶有詞根性質(zhì)的詞語(如“群眾化”“群眾性”中的“群眾”)和它們的擴(kuò)展詞形、組合短語,從詞語構(gòu)成的能產(chǎn)性考慮,優(yōu)先收錄帶有詞根性質(zhì)的詞語,對它們的擴(kuò)展詞形或組合短語,根據(jù)實(shí)際使用頻度和規(guī)范狀況等有選擇地收錄,原則上雙音節(jié)者適當(dāng)從寬,三音節(jié)及其以上者適度從嚴(yán)。(2)對于簡縮詞語或簡稱和它們的原形詞語,根據(jù)實(shí)際使用頻度和規(guī)范狀況等做出不同的選擇。如:“安理會”“安全理事會”“聯(lián)合國安全理事會”,收錄“安理會”,而不再收錄“安全理事會”和“聯(lián)合國安全理事會”;“福利彩票”和“福彩”,收錄“福利彩票”,而不收錄“福彩”。(3)可以拆用的四字以上的固定語(多是八字熟語),原則上收錄其完整式,而不分別收錄拆用式。如:收錄“種瓜得瓜,種豆得豆”,不分別收錄“種瓜得瓜”和“種豆得豆”。(4)經(jīng)常出現(xiàn)的雙音節(jié)結(jié)構(gòu),如果其中一個組成語素在現(xiàn)代漢語中基本不單用,則把該結(jié)構(gòu)視為詞加以收錄,如“烏云、李子、鯽魚、松樹”等;如果該結(jié)構(gòu)中有一個成分的意義已經(jīng)虛化,也視為詞加以收錄,如“達(dá)到、釀成、成為、致以、覺得”等。2.鑒于本詞表的研制目的和使用價(jià)值,對于確實(shí)存活在社會語文生活中、但較為特殊的幾類詞語,采用以下處理辦法:(1)人名。原則上不予收錄,但有比喻、借代等引申意義的,適當(dāng)收錄其中穩(wěn)定而高頻的。如“阿Q”“諸葛亮”等。(2)地名。原則上不予收錄,但收錄使用頻率相對較高的我國各?。捌涫⒆灾螀^(qū)(及其首府)、直轄市名稱,以及它們常用的別稱或簡稱。(3)國名。只收錄我國周邊國家以及在社會語文生活中出現(xiàn)頻率明顯較高的一些國家和城市的名稱。(4)我國各歷史朝代名稱。只收錄歷史上影響較大、在現(xiàn)當(dāng)代社會語文生活中出現(xiàn)頻率明顯較高的朝代名稱。(5)黨、國家、社會團(tuán)體和企事業(yè)各機(jī)構(gòu)的名稱,以及這些機(jī)構(gòu)的領(lǐng)導(dǎo)職務(wù)的名稱。原則上不予收錄,但在現(xiàn)當(dāng)代社會語文生活中明顯穩(wěn)定而高頻的“支部”、有著明確比喻意義的“班長”等,則予以收錄。本詞表的詞語收錄,既注意詞語的系統(tǒng)性,又注意詞語在語用中的實(shí)用性。如以表示季節(jié)為根詞的一些詞,全部收錄它的加綴詞“初春”“初冬”“初秋”“初夏”,但對于“晚+季節(jié)”的詞語,只收錄“晚春”“晚秋”未收錄“晚冬”“晚夏”;對于“殘+季節(jié)”的詞語,只收錄“殘冬”未收錄“殘春”“殘秋”“殘夏”??傊?,在詞語收錄的具體操作中,盡量處理好詞語的系統(tǒng)性和詞語的常用性的相互關(guān)系,特別注意詞頻的高低,一切從語言使用實(shí)際出發(fā)。本詞表的詞語收錄,既充分尊重社會語文生活的客觀實(shí)際,又嚴(yán)格控制不符合規(guī)范以及格調(diào)低俗的詞語,切實(shí)起到促進(jìn)社會語文生活向著規(guī)范、文明方向發(fā)展的積極作用。本詞表所收錄的詞語,在用字上基本涵蓋了《現(xiàn)代漢語常用字表》中的全部漢字,不超出《現(xiàn)代漢語通用字表》的范圍。凡是獨(dú)立成詞的字,列出單音節(jié)詞;不能獨(dú)立成詞的字,收錄于復(fù)音詞中。單音節(jié)詞條中包括了某些只作常用姓氏的字,如“鄧”。(二)根據(jù)“詞頻頻級排序法”確定詞語的使用頻度順序本詞表確定詞語的使用頻度順序使用的是“詞頻頻級排序法”。由于詞語的來源面比較寬,各種語料都有自己的覆蓋面與構(gòu)成特點(diǎn),詞表中的詞語不能在每種語料中都得到全部顯現(xiàn)。同一個詞語在不同語料庫中的頻次也可能相差較大,因而不同語料庫中的具體頻次之間缺乏嚴(yán)格的可比性。用頻級統(tǒng)計(jì)則能較客觀地顯示每個詞語的使用情況。頻級排序法就是同一語料庫中所有詞語按頻次數(shù)的多少進(jìn)行的一種排序方法。相同頻次的為一個頻級。頻級統(tǒng)計(jì)分兩步施行。第一步形成不同類型語料的頻級。檢測語料有“通用語料庫”、“人民日報(bào)”、“文學(xué)作品”三種,這樣每一個詞語就有了三個不同的原始頻級。第二步形成總語料的頻級,就是將每個詞語的三種語料的頻級之和除以三??傉Z料的頻級共有2969級,1級為最高,2969級為最低。同一頻級的詞語最多有1781條,最少的只有1條詞語。相同頻級的詞語,根據(jù)總頻次的多少由高到低排序,相同頻次的根據(jù)讀音按字母升序排列。四研制的內(nèi)容本詞表包括“頻級序號”“詞語”等內(nèi)容?!邦l級序號”是根據(jù)“頻級統(tǒng)計(jì)法”排序,其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論