漢字應用水平測試用字的統(tǒng)計與分級

上傳人：我*** IP屬地：天津上傳時間：2022-08-21 格式：DOC 頁數(shù)：8 大小：51.50KB 積分：30 舉報 版權申訴

已閱讀5頁，還剩3頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、漢字應用水平測試用字的統(tǒng)計與分級* “漢字應用水平測試研究”課題組孫曼均執(zhí)筆（教育部語言文字應用研究所北京 100010）內容提要本文論述了漢字應用水平測試字表的編制過程，包括測試字表編制的主要依據，編制總原則和具體原則，編制經過，以及測試字表分級的目的、依據、原則、標準和方法。在編制過程我們認識到：1.編制漢字應用水平測試字表，并對漢字進行應用水平分級，是我國字表編制史上的首次嘗試，也是現(xiàn)代漢字學、漢字教學、測試學相結合的一種嘗試；2.任何字表字量字種的確定和分級都必須采用定量與定性相結合的綜合方法；3.漢字應用水平測試字表的編制過程是從字到詞，再從詞到字，建立字詞對應關系?？傊?，漢字

2、應用水平測試字表體現(xiàn)了實際測查與字頻數(shù)據的結合，定量統(tǒng)計與定性分析的結合，科學理論與經驗知識的結合，漢字學、詞匯學、統(tǒng)計學與測試學等多學科的結合，它把對漢字大量零散的定性認識，與漢字的實際應用數(shù)據和字頻統(tǒng)計結果，匯集在一起，形成一個整體，最終達到較為完整和系統(tǒng)的定量認識的過程。關鍵詞漢字；應用水平;測試字表 1.前言 1.1. “漢字應用水平測試研究”課題是國家語委“十五”科研規(guī)劃重點項目，它的目的是要研制一套科學的標準化漢字應用水平測試體系，以檢驗社會上與漢字使用有密切關系的一些行業(yè)的從業(yè)人員在書面交際過程中掌握和應用漢字所達到的程度。不同的人使用漢字的數(shù)量不同，掌握漢字的程度及漢字應用的

3、水平也有較大差異。根據我們的調查，一些與漢字應用有關的行業(yè)和部門早就迫切希望制定一個切實可行的漢字應用水平測試標準，作為考核、錄用和培訓從業(yè)人員的依據之一。因此，制定漢字應用水平等級標準和編制漢字應用水平測試大綱不僅是對社會上不同人群漢字實際使用情況的客觀反映，也是為了滿足社會對提高人們語言文字水平的一種迫切需求。漢字應用水平測試在我國尚屬首次，這是一項具有開創(chuàng)性的關于漢字應用水平的量化研究，其研究成果不僅能豐富現(xiàn)代漢字學、測試學等學科的內容，而且對提高全社會的語言文字規(guī)范意識和應用水平，進而提高人們的文化素養(yǎng)，促進社會應用漢字的規(guī)范化和標準化，起到積極的推動和促進作用。這對我國語言文字應用

4、的理論和實踐都具有非常重要的意義。 1.2.這項課題研究的重點之一就是確定測試用字的數(shù)量和范圍，以便據此逐步建立漢字應用水平等級標準及測試大綱，并建設相應的測試題庫。漢字應用水平測試字表是這項課題的基礎性工作，也是今后測試的重要內容。它將為漢字應用水平等級標準的劃分、測試大綱的編寫及題庫的建設等提供基本的內容和大致的范圍。沒有測試字表，測試就無從談起。鑒于漢字應用水平測試在我國歷史上還是首次，它不同于以往的語文水平測試或書面語測試，它面向社會上使用文字較多的行業(yè)和人群，針對人們漢字使用中的各種實際問題，應用性很強；因此，漢字應用水平測試字表必然不同于已有的常用字表和通用字表，其字種和字量必須

5、能夠真實反映出社會上使用文字較多行業(yè)和人群的漢字應用的實際情況。 2.漢字統(tǒng)計的歷史及現(xiàn)狀 2.1.歷史上我國就有對常用漢字和通用漢字的統(tǒng)計。編寫常用漢字字表是中國語文教育的傳統(tǒng)，也是古代語文教學的基礎。古時的蒙學課本就是典型而突出的例子，南北朝的千字文共有漢字1000個；宋代的百家姓共有漢字576個，三字經共有漢字1248個。西漢的字書倉頡篇有漢字3300個，清代的文字蒙求則從說文解字收錄的9353個漢字中選取2044個常用字，附加字義的解釋。這些文字學習教材都是選取當時的常用漢字匯編成冊，供兒童學習漢字用，它們可以算得上是中國古代的常用字表。歷代的字書則反映了不同時代通行的漢字字量和字種，

6、是對當時使用的漢字的統(tǒng)計和匯編。雖然隨著時代的推移，字書所收漢字的數(shù)量日益龐大，到了現(xiàn)代，大型辭書所收漢字大多有數(shù)萬之巨；但是除掉其中的異體字、罕用字、方言字、古字甚至廢字，古往今來，就在社會上應用的漢字而言，一般都在萬字之內，人們日常使用的漢字也大致在30006000字之間。 2.2.我國現(xiàn)代意義的動態(tài)性字頻統(tǒng)計是教育家陳鶴琴于1928年完成的，統(tǒng)計出常用漢字4261個。從1928年到1988年的60年間，我國進行的漢字統(tǒng)計資料（重點是對常用漢字的統(tǒng)計）約有十幾種。在這些字表中，有兩個字表特別值得注意。一個是信息交換用漢字編碼字符集基本集，這是中國最大的一次字頻統(tǒng)計工作。在數(shù)以億計的浩瀚文獻

7、資料中，統(tǒng)計出實際通用的漢字數(shù)為6763個，其中有3000多個漢字的累積使用頻度達到了99.9%，另3000多個累積頻度不到0.1%。這個成果說明了常用漢字與次常用漢字的數(shù)量不足7000個，框定了電腦漢字輸入常用字的范圍，為國家制定漢字庫標準提供了重要的科學依據。另一個是當代漢字整理與統(tǒng)計研究的重要里程碑，即國家語委于1988年完成的現(xiàn)代漢語常用字表和現(xiàn)代漢語通用字表，這兩個字表按照漢字的頻率和使用度，確定了2500個常用字、1000個次常用字和包括上述兩類字在內的7000個通用字。這個成果說明了當代漢字使用的范圍在7000字以內，常用漢字的范圍在3500字之內，由此確定了教學用字以及出版印刷

8、、辭書編纂、信息處理等通用漢字的范圍。 2.3.據新華社最新統(tǒng)計信息（見北京晚報2001.9.26），目前漢字的總數(shù)雖已超過了8萬，而歷代日常書面語常用的漢字數(shù)量一般都在三四千個。據統(tǒng)計，李白994首7.7萬字的詩文里，用字3560個，杜甫1500余首詩作用字4350個，白居易3000余首詩共18萬字，用字4600個。老舍的代表作駱駝祥子共用漢字量10萬余，單字僅有2413個。66萬字的毛澤東選集1-4卷的用字量為2891個，毛澤東公開出版的全部著作也僅用單字3136個。孫中山全集的用字量為2673個。從上述統(tǒng)計資料可以看出，無論在中國古代還是當代，對常用漢字的選擇大都在20004000字之

9、間浮動，即3000字上下；而通用漢字則一般在7000字以內，基本為6000字左右。這些材料和數(shù)據是我們編制漢字應用水平測試字表的重要參考依據。 2.4.在編制測試字表的過程中，我們遇到了一些問題。主要是目前我們對現(xiàn)代漢字的研究還缺乏一些最基礎的定量研究，對現(xiàn)代漢字的實際應用情況缺乏宏觀掌握和微觀分析。比如，對不同文化程度、不同行業(yè)等不同人群的識字量，人們往往憑語感來估算，卻沒有源于實際調查的科學準確的統(tǒng)計數(shù)據，心中無數(shù)；又如，對漢字諸如構詞能力等諸因素尚無全面而精細的定量分析；等等。這就為測試字表的編制帶來了很大的困難，也使進一步提高全社會的漢字應用水平無所依據。而現(xiàn)有的常用字表和通用字表，一

10、個是反映受過基本教育、具有中等文化程度的人的常用識字量，一個是反映遠遠大于一般人識字量的現(xiàn)代漢字流通、應用的范圍，它們都不能代表社會人群的實際識字量，更反映不出具有不同文化水平、分屬不同行業(yè)的人們對漢字實際掌握的字量和字種。因此，現(xiàn)有的各種字表都不能作為漢字應用水平測試所需要的測試用字表。 2.5.根據以上情況，課題組經過認真分析研究、多方征求意見，決定應為漢字應用水平測試編制專用的漢字測試字表。漢字應用水平測試字表的字量和字種應以常用漢字為基礎，但要高于常用漢字；應在通用字的范圍之內，但應低于通用字；測試用字必須要從實際中來，要能夠精確反映受測人群的漢字實際使用情況。課題組決定，以3500個

11、常用字為測試用字的基本內容，在7000通用字的范圍內，對社會上經常使用文字的人群進行實際測查，根據掌握的第一手數(shù)據來選取測試用字；同時，依據國家語委語料庫的漢字頻率統(tǒng)計數(shù)據，對經測查而篩選出來的漢字進行必要的人工干預。測試用字字量和字種的大致框架由此確定。 3.漢字應用水平測試字表的編制 3.1.測試字表編制的依據和原則 3.1.1.編制的主要依據測試字表編制的主要依據是現(xiàn)代漢語常用字表和現(xiàn)代漢語通用字表，實際測查統(tǒng)計結果，以及國家語委兩個大規(guī)模語料庫的字頻統(tǒng)計數(shù)據。上面已經說過，我們首先確定漢字應用水平測試字表應以現(xiàn)代漢語常用字表和現(xiàn)代漢語通用字表為重要依據，即測試字表以現(xiàn)代漢語常用字表

12、為基礎，測試用字包括3500個常用字；測試字表以現(xiàn)代漢語通用字表為選字的基本范圍，字量要低于7000字，字種則基本在7000字之內選定。其次，鑒于上面所述我們面臨的問題，我們認為確定漢字應用水平測試字表的字量和字種必須首先進行實際調查，以掌握社會上與文字使用密切的相關人群的漢字實際使用情況，并以此作為漢字應用水平測試字表的重要依據。在研制漢字應用水平測試字表的過程中，無論是對測試用字字量的統(tǒng)計和字種的選取，還是對測試用字進行分級，我們都是以課題組測查的實際數(shù)據作為主要參數(shù)的。另外，我們充分利用了國家語委兩個大規(guī)模語料庫的字頻統(tǒng)計數(shù)據，以此對實際測查的漢字字量和字種進行增刪和調整。這兩個語料

13、庫，一個是國家語委于1990年開始建設，反映現(xiàn)代漢語全貌的國家級“現(xiàn)代漢語大型通用語料庫”，其庫容量為7000萬漢字，時間跨度從1919年至今（其中1977年至今的語料選取比例為50%）。另一個是語用所于2002年承接，面向中文信息處理領域，為自然語言處理研究服務的國家高技術研究發(fā)展計劃(863計劃)智能化中文信息處理平臺課題的子課題“超大規(guī)模通用平衡語料庫”，其庫容量為15億字（2002年第一期完成7000萬字），時間跨度以近十年為主（特別以近三年為主，1989年以前為輔）。 3.1.2.編制總原則是實際定量統(tǒng)計與專家定性分析相結合首先進行目標定性，然后根據定量原則為主、定性原則為輔的選字

14、原則，對實際測查的漢字進行篩選，以其中識別率高的字、在語料庫中經查詢頻率高、使用度大的字，作為選字的基本范圍，再采用人工聯(lián)想的定性方法作為定量標準的補充。即從定性到定量統(tǒng)計，從實際測查到字頻統(tǒng)計，再到專家干預。如此反復，不斷使之更完善，更接近實際。 3.1.3.漢字篩選的具體原則 1）規(guī)范性原則：從語言學的角度，測試用字應為普通話語詞范圍內的用字，方言用字一律不收；測試用字應為規(guī)范的現(xiàn)代漢字字型，不規(guī)范的字型不收。如：囡、伢、嬤、甭、摜、矬、擼等，現(xiàn)代漢語詞典均注明為方言用字，測試字表不收。又如：垅，是“壟”的異體字，雖然目前它尚在7000通用字內，也不予收入。 2）應用性原則：從應用語言學

15、的角度，測試用字應在現(xiàn)代漢字的范圍內選字，要充分考慮到現(xiàn)代漢字的實際使用情況。對于一些常用的口語用字，如：洇、焯、磴、硌、蕻、痄、搽等，雖然這些字在書面語中較少使用，字頻統(tǒng)計或統(tǒng)計不到或頻率很低，但在日常生活中卻較常用，我們則適當選取。對于文言用字，除現(xiàn)在還使用的或有構詞（包括成語）能力的，一般不收，如：筮、笏、耜、騍、黼等，這些字指稱的古代事物已經消亡，在現(xiàn)代漢語中既不再使用，又無構詞能力，則不予選取。 3)常用性原則：依據頻率統(tǒng)計的原理，測試用字應以實際人群的漢字識別率以及在語料庫中的統(tǒng)計頻率為重要參數(shù)，即選取高識別率和高頻率的字。 4)均勻性原則：同樣依據頻率統(tǒng)計的原理，測試用字還要考慮

16、到其在語料庫中的覆蓋率，即選取分布廣泛、覆蓋率大的字。 5)聯(lián)想性原則：任何字表的編制，都不能完全依照頻率，必要而適當?shù)娜斯じ深A必不可少。對一些成系列的字要進行縱橫相關的多種聯(lián)想，綜合考慮其取舍。如：天干地支、節(jié)氣用字，數(shù)字的漢字大寫用字，民族名稱，省、自治區(qū)、直轄市的簡稱和別稱，地、縣級以上的地名用字以及連綿字等，我們都是綜合考慮，平等對待，成系列收??；其中為保持地縣級以上的地名用字的完整性，我們收入了琊、埗、埇、猇等4個7000通用字以外的縣級地名用字。對動植物名稱，金屬、化學元素名稱以及姓氏、人名用字等則根據常用程度和頻率的高低決定取舍。 6)等級性原則：測試用字既要能反映出被試的漢字實

17、際使用情況，又要便于測試等級的確定；因此，測試用字要根據識別率和字頻的高低，覆蓋范圍的大小，構詞能力的強弱及其構成詞語的常用程度分出等級。以上6條原則不是孤立的，而是綜合運用以決定取舍。 3.2.測試字表編制經過從目標定性開始，到定量統(tǒng)計，再回到定性篩選，最后形成限定性等級字表。這就是測試字表產生的基本過程。 3.2.1.首先進行目標定性。確定3500常用字為測試字表的核心內容，同時確定在7000通用字范圍內確定字量，篩選其他字種。 3.2.2.用7000字除外3500常用字余下的3500字進行實際測查。經研究決定，在使用漢字較多的行業(yè)中，選定對漢字掌握的廣度和深度有著不同層次的三種人群，

18、即中等教育程度、高等教育程度、具有高等教育程度又從事文字工作的三種人群作為測試對象。經過實際測試，依照實測人群掌握漢字的平均水準，篩選出其中識別率高的2023個字作為備選字。實際測查結果不僅較為準確地反映了使用漢字較多行業(yè)的人群實際掌握漢字的數(shù)量，即高限為5500字上下，低限為4000字上下（均含3500字）；而且基本上篩出了相應的字種。從源于實際的第一手材料篩選備選字，避免了用傳統(tǒng)主觀方法確定字表時受專家個人文化素養(yǎng)、專業(yè)學科、社會地位以及個人用字習慣等影響而造成的缺陷。 3.2.3.對備選字實施人工干預。課題組與專家根據語感，采用群體性聯(lián)想的方法逐字進行定性分析，以此作為上述定量統(tǒng)計的補充

19、。這時的定性分析避免和減少了實際測查中的種種不完善所造成的背景干擾，進一步完善備選字。 3.2.4.對備選字進行字頻統(tǒng)計。將備選字放到語委的兩個語料庫中進行分類的頻率和覆蓋率統(tǒng)計，依據統(tǒng)計結果對備選字再次增刪、調整，從中確定了2000個備選字。測試用字的字量至此基本確定。再一次的定量統(tǒng)計可以糾正實測的客觀誤差和人工干預的主觀偏見。 3.2.5. 對備選字再次實施人工干預。采用專家集體審讀會、專家個人分頭審讀和課題組集體討論等多種方法，在2000字的范圍內對備選字種又進行多次調整，使備選字更加科學、系統(tǒng)和完善。 3.2.6.漢字應用水平測試不是測試單個的漢字，而是以詞語為單位，在具體語境中進行測

20、試，這樣才能體現(xiàn)被試的漢字應用水平。這種測試方式決定了測試不僅需要測試字表，還需要測試詞表。課題組經研究決定采用現(xiàn)代漢語通用詞表為測試詞表。因此，課題組又對現(xiàn)代漢語通用詞表中的用字進行了字量和字頻統(tǒng)計，將備選字與現(xiàn)代漢語通用詞表中的用字進行對比，結果絕大部分字種重合，現(xiàn)代漢語通用詞表中有287個字種備選字沒有，這些字大多是一些口語用字和方言用字；備選字中有473個字種現(xiàn)代漢語通用詞表沒有，這些字中大部分是姓氏、人名用字及地、縣級地名用字。課題組又對這一小部分不重合的字種逐一分析，對備選字再做調整。如：對詞表用字中的一些普通話常用的口語用字，我們作了適當增收。總之，課題組將備選字從定性分析到定

21、量統(tǒng)計，從定量統(tǒng)計再回到定性分析，循環(huán)反復多次，分別將幾種不同的定量統(tǒng)計數(shù)據放在一起相互參照研究，對備選字多次增刪、調整，歷經9稿，終于形成漢字應用水平測試字表（初稿）。定性定量深化應用，這就是制訂漢字應用水平測試字表的循環(huán)過程。 3.3測試字表的分級 3.3.1.分級的目的 1)將測試用字等級系列化，以反映漢字應用水平的不同層次和階段，同時也為人們掌握漢字、提高漢字應用水平提供方便。 2)為等級標準、測試大綱的制定和編寫提供總目標和分期目標，為測試提供統(tǒng)一性的命題及評分依據。 3.3.2.分級的依據 1)必須從實際應用出發(fā)，將實測的漢字識別率和動態(tài)性的字頻統(tǒng)計結合起來，作為分級的主要依據。

22、2)分級時不僅要考慮漢字本身形、音、義等問題，還要考慮到漢字的構詞能力以及所構成詞語的情況。 3.3.3.分級原則 1)在分級過程中，要以現(xiàn)代漢語常用字表為分級構成的最核心內容和測試用字字量的底線；以現(xiàn)代漢語通用字表為選字范圍，除個別字之外，測試用字基本上應在7000字范圍之內。 2）在分級過程中，仍然要運用定量統(tǒng)計與定性分析相結合的方法，在一定范圍內進行必要的定向聯(lián)想以調整字種的級別。如：對連綿字分級時，我們采用了這樣的原則：如果構成連綿詞的字不再構成其他的連綿詞，即兩個字都不具有構成其他詞的能力，則以該連綿詞的第一個字的識別率和字頻為準，將第二個字與第一個字一起放在同一級別；如果構成連綿詞

23、的字各自還能構成其他的詞，或兩個字的構詞能力有顯著差異，即兩個字分別具有不同的構詞能力，則依每個字的識別率和字頻，分別放入不同的級別。 3)測試用字的總量及測試用字的分級要考慮到相應的詞匯總量及詞匯分級。 3.3.4.分級的標準和方法測試用字分級共有3個界標：4000字種（3500常用字+500字），4500字種（3500常用字+500字+500字），5500字種（3500常用字+500字+500字+1000字）。這3個級別分別為測試字表甲表（4000字），乙表（4500字），丙表（5500字）。 1)3500常用字是國家現(xiàn)行的規(guī)范標準，是經過幾十年科研、教學的積累和實踐，并在較廣泛的語料中

24、反復統(tǒng)計后得出的第一個權威的常用漢字量，它已經得到了人們的共識。這一共識與當前我國漢字教學、應用的基礎階段的漢字量相一致。因此，我們尊重這一科研成果，將3500常用字全部納入第一個分級界標內，由此構成測試字表甲表的核心內容。由于3500常用字是目前初中教育階段應掌握的漢字量，代表具有中等偏下文化水平人群的識字量；而根據我們的實際測查，具有高中文化程度的人群一般識字量為4000字左右。因此，根據這類實測人群的識別率（實測的具體過程見另文）和語料庫的字頻統(tǒng)計，又篩選出500字，與3500常用字合并，形成測試字表的甲表；即甲表含全部常用字，又增加500字，共計4000字，作為第一個分級界標。 2)

25、實測結果顯示，具有大學文化程度的人群一般識字量為4500字左右。因此，根據這類實測人群的識別率和語料庫的字頻統(tǒng)計，再篩選出500字，與甲表合并，形成測試字表乙表；即乙表含全部甲表字，又增加500字，共計4500字，作為第二個分級界標。 3）實測結果顯示，具有大學文化水平以上，從事文字工作，且具有較高漢字應用水平的人群的識字量為5500字左右。因此，根據這類實測人群的識別率和語料庫的字頻統(tǒng)計，再篩選出1000字，與乙表合并，形成測試字表丙表；即丙表含全部甲、乙表字，又增加1000字，共計5500字，作為第三個分級界標。總之，對于漢字應用水平測試來說，高級水平應掌握45005500字，中級水平應

26、掌握40004500字，基本水平應掌握35004000字。課題組在從定性分析到定量統(tǒng)計，從定量統(tǒng)計再到定性分析，循環(huán)反復篩選、調整測試用字的同時，在保持每個等級字量不變的情況下，對每個等級中的字種（除外3500常用字，常用字是測試用字的底線，全部在甲表內），也反復進行了多次調整，使之更平衡與協(xié)調。因此，與篩選、確定測試用字的字量和字種相同，分級時，也是以實測的漢字識別率和語料庫的字頻數(shù)據為主，但并不完全依據識別率和字頻數(shù)據，仍然要運用定量與定性相結合的方法。 4.編制測試字表過程中的幾點認識 4.1.編制漢字應用水平測試字表，并對漢字進行應用水平分級，這在我國字表編制史上是首次，也是現(xiàn)代漢字

27、學、漢字教學、測試學相結合的一種有益嘗試。在編制字表和分級的過程中，我們發(fā)現(xiàn)：現(xiàn)代漢字研究中還有不少空白和盲點，尤其是現(xiàn)代漢字應用研究領域，還缺乏宏觀的、系統(tǒng)的、動態(tài)的、精細的定量研究和統(tǒng)計數(shù)據，缺乏對漢字應用各個層面實際情況的調查，這是現(xiàn)代漢字研究的一個很大缺憾，應當引起漢字學界的重視。時代和社會以及其他科學、其他行業(yè)的發(fā)展，對語言文字提出了新的、更高的要求，語言文字研究的傳統(tǒng)理論和經驗與之相比有其局限性，這就要求語言文字研究要力求發(fā)展和創(chuàng)新，以不斷適應新的時代要求。因此，對于編制漢字應用水平測試字表來說，就必須進行新的探索，那就是實施實際測查，這是非常重要和必不可少的。正是基于這種認識，

28、課題組首先對從事與文字工作相關的幾個不同層次的人群（即今后的受測者）漢字應用的實際情況進行摸底測查，對這些人群的識字量分別進行統(tǒng)計，并首次將這種源于實際的測查數(shù)據與語料庫的字頻數(shù)據結合起來，相互比照，共同作為確定字表的字量和字種、實行分級的重要參數(shù)。從而使我們對當前漢字實際應用的字量、字種及等級的確定，有了扎實而可靠的基礎。 4.2.任何字表字量字種的確定和分級都必須采用定量與定性相結合的綜合方法。編制字表應以實測的識別率和字頻統(tǒng)計數(shù)據為重要依據，但是，實際測查和字頻統(tǒng)計會受到語料的選取及其年代、文體、內容，調查的時間、方式以及被試各方面的情況等等諸多背景因素的影響，有些數(shù)據會與實際情況相差

29、甚遠；在使用不同語料統(tǒng)計出來的漢字頻度表中，最常用漢字的排列順序都有一定差別，至于次常用漢字，差別會更顯著，尤其是目前國內漢語語料庫的建設還有待完善。另外，漢字的問題很復雜，有些情況僅僅依據數(shù)據統(tǒng)計解決不了。因此，對于一個科學和完善的字表，其字量、字種的確定仍離不開必要的人工干預，定性分析具有同樣的重要性。漢字應用水平測試字表的編制，正是科學理論、定量統(tǒng)計與專家、課題組的定性分析相結合的成果。它充分利用國家語委的兩個大型語料庫，匯集了數(shù)種統(tǒng)計數(shù)據、專家與課題組對漢字的知識、分析和評判，把各種相關的科學理論、實驗數(shù)據與人的經驗知識結合起來，形成了有機的系統(tǒng)工程。 4.3.漢字應用水平測試字表的編制過程是從字到詞，再從詞到字，建立字詞對應關系。現(xiàn)有的各種字表，包括現(xiàn)代漢語常用字表和現(xiàn)代漢語通用字表，都有一個共同的特點，即定量統(tǒng)計和定性分析的對象都是單個的漢字，雖然要考慮漢字的構詞能力，但并不涉及詞語的數(shù)量和分級。而用于HSK考試的漢字等級大綱中的常用

人人文庫> 全部分類> 應用文書 > 事務文書

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

漢字應用水平測試用字的統(tǒng)計與分級

文檔簡介

溫馨提示

最新文檔

評論

漢字應用水平測試用字的統(tǒng)計與分級

文檔簡介

溫馨提示

最新文檔

評論

相關文檔