版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第15卷第4期V ol.15N o.4重慶工學(xué)院學(xué)報Journal of Chongqing Institute of T echnology2001年8月Aug.2001文章編號:16710924(200104009503關(guān)于語言測試現(xiàn)代化的思考趙紅梅(重慶工學(xué)院基礎(chǔ)系,重慶400050摘要:通過分析語言測試的作用以及當(dāng)前語言測試所存在的問題,主要討論了如何實現(xiàn)語言測試的現(xiàn)代化這個問題,并從語言測試手段、測試標(biāo)準(zhǔn)、語言教師、宏觀組織管理和評分系統(tǒng)等方面著手,探討了如何實現(xiàn)語言測試的現(xiàn)代化。關(guān)鍵詞:語言測試;效度;信度;區(qū)分度;現(xiàn)代化中圖分類號:G424.74文獻(xiàn)標(biāo)識碼:A近年來,語言測試發(fā)展
2、很快,己成為應(yīng)用語言學(xué)、教育學(xué)中一門比較完整而系統(tǒng)的獨立學(xué)科。語言測試要對被測試者的語言能力做出準(zhǔn)確、公正的測量,就必須保證試題設(shè)計的科學(xué)性,評定分?jǐn)?shù)的可靠性,從而使語言測試在教學(xué)中切實發(fā)揮它的指導(dǎo)作用。而要達(dá)到此目的,就需要研究和實現(xiàn)語言測試的現(xiàn)代化。1語言測試的作用語言測試的作用主要表現(xiàn)在3個方面:其一是用于語言教學(xué)。科學(xué)的、符合教育學(xué)原理的測試具有診斷和指導(dǎo)教學(xué)的作用,可以增強學(xué)生的學(xué)習(xí)動力,使教師和學(xué)生有階段感、程序感和成功感。其二,可用于選拔人才。測試在人才選拔中已成為可信的重要參數(shù)。目前升學(xué)、招工和評職稱等都常采用語言測試法。其三,可用于社會調(diào)查。語言的應(yīng)用反映了社會變革和社會風(fēng)俗
3、習(xí)慣等,由此便可通過對某一地區(qū)的語言測試來調(diào)查社會變革的深度。2目前我國語言測試存在的問題2.1語言測試的基礎(chǔ)知識還不夠普及目前,廣大語言教師天天都在使用測試手段,年年出題、閱卷、評分,決定著數(shù)以萬計的學(xué)生的成績。然而,所設(shè)計的試卷是否科學(xué),是否測出了應(yīng)測的項目,就很難說了。而且,每次考試之后,很少有人對試卷進(jìn)行分析和評估,很少有人用數(shù)據(jù)證明某次考試成績是否可靠,更沒有人肯花些時間研究學(xué)生的錯誤答案,以便改進(jìn)試題的設(shè)計,從而嚴(yán)重影響了語言測試功效的發(fā)揮。2.2題目設(shè)計不夠講究,評分的主觀因素太多,考試成績的參考價值不大以每屆學(xué)生的期末考試成績?yōu)槔?某屆學(xué)生水平高,就把試題設(shè)計難一點;某屆學(xué)生水
4、平較低,則把試題設(shè)計簡單一點??傊尳^大多數(shù)學(xué)生及格。因此,說一個學(xué)生成績是80分,聽是滿好聽,實際上其意義并不大。第一,80分是好是差,要與其他學(xué)生相比。如果其他人都是90分以上,他就是差的;第二,80分要與歷屆學(xué)生成績相比。如果每年的試卷有難有易,這個80分也說明不了什么問題;第三,80分還要與其他學(xué)校學(xué)生相比。學(xué)校并不使用統(tǒng)一試卷,因此,80分的普遍意義也就不大。相反,如果說一個學(xué)生的CET-4或CET-6的成績是85分,我們可以知道這個分?jǐn)?shù)意味著什么,因為兩者的考題難度幾年來幾乎是前后一致的。2.3試題的設(shè)計缺乏延續(xù)性和繼承性在一些全國性的語言測試中,參與測試試題的設(shè)計者大都是臨時委
5、任,完成任務(wù)之后就散伙。從而在一定程度上決定了試卷測試不出考生的真正水平。加上評分的不公平,勢必造成測試的不科學(xué)性。如歷年高考試卷,有些優(yōu)秀人才就成為不科學(xué)測試的犧牲品;就一個學(xué)校自行組織的語言測試而言,更是缺乏延續(xù)性與繼承性,測試目的是否實現(xiàn)往往很難準(zhǔn)確評估。3實現(xiàn)語言測試的現(xiàn)代化,構(gòu)建完善的語收稿日期:2001-04-03作者簡介:趙紅梅(1970-,女(漢族,四川閬中人,講師,主要從事英語教學(xué)研究.言測試系統(tǒng)3.1語言測試標(biāo)準(zhǔn)的科學(xué)化語言測試系統(tǒng)的完善首先要求的是標(biāo)準(zhǔn)的完善。語言測試的標(biāo)準(zhǔn)是由5個方面構(gòu)成的,即:效度(validity,信度(reliability,區(qū)分度(discrim
6、ination,實用性(practicality和產(chǎn)出的影響(backwash effect。只有實現(xiàn)標(biāo)準(zhǔn)的科學(xué)化,才能保證整個語言測試的完備。效度就是說一套測試題測量了需要考查和測量的內(nèi)容與能力。其中包括表面效度(face validity,就是首先從表面上看是合適的,并能引起應(yīng)試者的興趣;內(nèi)容效度(content validity,即從內(nèi)容上看,應(yīng)考查的語言要素和技能均要有所體現(xiàn);編制效度(construct validity,即指測試要以一定的語言行為理論和語言學(xué)習(xí)理論為依據(jù);經(jīng)驗效度(em pirical validity又分為共時效度(concurrent validity和預(yù)示效度
7、(predictive validity,前者是指把一次測試的結(jié)果同另一次時間相近的有效測試相比較,或同教師對學(xué)生的評估相比較而得出的系數(shù),后者是指把一次測試的結(jié)果同后來的語言能力相比較,或同教師后來對學(xué)生的評估相比較而得出的系數(shù)(Leemann1981:116。由于測試的種類不同,對各種效度的需求也就不一樣。如語言潛能測試多基于某種語言行為理論和語言學(xué)習(xí)理論,因此重視編制制度。水平測試強調(diào)有共時效度和預(yù)示效度。成績測試和診斷測試受教學(xué)大綱的限制,因此側(cè)重于內(nèi)容效度?;谶@種情況,應(yīng)對不同類型的測試,制定出不同程度的各種效度,以便于測試設(shè)計人員在設(shè)計試題時,做到有“法”可依。信度也叫可靠性,即
8、一套試題測驗結(jié)果比較穩(wěn)定,無論時間如何改變都能均衡地體現(xiàn)被測試者的能力,其主要體現(xiàn)在學(xué)生分?jǐn)?shù)的穩(wěn)定性上(Leemann1981:119。信度與效度有著密切的關(guān)系,但二者又不能相互混淆。只有信度較高的測試才能有較高的效度,信度差則效度差,但效度差不一定信度差,影響信度的因素很多,如:測驗時的時間與環(huán)境,測驗的器械,學(xué)生個人因素,評分人的個人因素,試題的覆蓋面與代表性等。要保證信度,就必須從各個方面嚴(yán)格加以控制,如提高評分人的責(zé)任心,增加客觀測試,實現(xiàn)主觀測試閱卷的現(xiàn)代化等。區(qū)分度即是指學(xué)生所得分?jǐn)?shù)的離散度。這就要求試題設(shè)計人員要把握好試題的難易程度,做到由易到難,循序漸進(jìn)。通過測試,顯示出考生之
9、間的細(xì)微差別。而不同的測試對區(qū)分度的要求又不一樣,如診斷測試則不太重視區(qū)分度,成績測試應(yīng)有一定的區(qū)分度,水平測試最強調(diào)區(qū)分度,編班測試對區(qū)分度的要求則更高。實用性,即是指試卷便于學(xué)生使用,強調(diào)試卷的實用性。那么試題設(shè)計人員就要有高度的責(zé)任心,做到試卷清晰干凈,試題無過失錯誤,測試時間恰當(dāng),題目措辭清楚易懂,一目了然。試題的設(shè)計盡量少用各種輔助機(jī)械。3.2語言測試手段的現(xiàn)代化隨著教育測試技術(shù)的發(fā)展及計算機(jī)性能的提高,新的機(jī)助測試系統(tǒng)被不斷開發(fā)出來。以美國的ETS為例,其計算機(jī)化的T OEF L已在北美許多國家推廣。英國劍橋大學(xué)考試委員會也開發(fā)出了基于計算機(jī)語言測試系統(tǒng)C ommu2 ni-C A
10、T。與紙筆測試相比,計算機(jī)化測試有許多優(yōu)點。它可以使用先進(jìn)的測試模式,如自適應(yīng)測試。計算機(jī)自適應(yīng)測試(C om puter Adaptive T esting屬于個體化的測試,它不僅節(jié)省測試項目,縮短測試時間,而且測量誤差較低。同時在21世紀(jì),隨著人們對語言運用理論更深刻的理解及因特網(wǎng)技術(shù)的發(fā)展,語言測試手段將會發(fā)生重大變革。因特網(wǎng)徹底消除了人們的時空觀念,把地球上每個角落里的人都聯(lián)系起來。將來,人們通過網(wǎng)絡(luò)可腳不出戶對自己的語言水平進(jìn)行測量。因此,在網(wǎng)絡(luò)計算技術(shù)發(fā)展的今天,在語言測試中,應(yīng)適時利用現(xiàn)代計算機(jī)作為輔助手段,提高語言測試的效率。當(dāng)然,使用計算機(jī)畢竟只是其中的一個執(zhí)行手段,而測試的
11、設(shè)計標(biāo)準(zhǔn),設(shè)計類型等還需廣大語言教師來完成。因此,在實現(xiàn)語言測試手段現(xiàn)代化同時,還必須慮及人與計算機(jī)的結(jié)合。這就涉及語言測試現(xiàn)代化的第二個方面,語言教師的素質(zhì)。3.3語言教師素質(zhì)的提高語言測試的標(biāo)準(zhǔn)決定了語言教師必須從各個方面提高自身素質(zhì)。第一是深諳語言測試的理論,懂得如何設(shè)計各種各樣的小題目,設(shè)計時要考慮到哪些問題,體現(xiàn)哪些原則,有哪些忌諱的事。并能通過自己設(shè)計的隨堂測驗,了解自己教學(xué)情況和學(xué)生學(xué)習(xí)情況,這是每位教師應(yīng)該做到的;第二是能根據(jù)科研的性質(zhì)、目的和科研中的變量情況,來設(shè)計一套比較完整的、標(biāo)準(zhǔn)化了的、尤其是多項技能配合的試卷。其中要注意區(qū)分難易程度,把握效度和信度,保證測試結(jié)果和科研
12、的可靠性;第三是能掌握基本的語言測試中的統(tǒng)計學(xué)知識,學(xué)會利用計算機(jī),對你測試的結(jié)果進(jìn)行綜合分析,劃出分?jǐn)?shù)的分布曲線圖,評估一下測驗分?jǐn)?shù)是否正常,計算一下測驗的效度、信度和項目的區(qū)分度;第四是不僅能設(shè)計題,會算題,而且還可以評論別人的試題。對于某次測試,作出自己的分析與評論,寫出材料,算出統(tǒng)計數(shù)據(jù),更有利于改進(jìn)自己的教學(xué);最后便是能分析學(xué)生的錯誤答案,而且注意保存自己用過的試卷。學(xué)生的錯誤答案是設(shè)計干擾項的重要參考資料,經(jīng)常收集學(xué)生錯誤答案的老師,一定能設(shè)計出高明的干擾項。而且,會有意識在教學(xué)中明確教學(xué)的重點,特別注意對學(xué)生在錯誤方面進(jìn)行講解與強調(diào)。另外,試卷積累多了,就是研究測試的寶貴材料。3
13、.4宏觀組織管理的現(xiàn)代化首先,成立測試小組,培養(yǎng)他們成為測試專家,由他們69重慶工學(xué)院學(xué)報負(fù)責(zé)全系和全校重大試題的設(shè)計和分析;其次,建立各種外語測試的題庫,因為題庫能使重要的測試標(biāo)準(zhǔn)化。把許多題目用計算機(jī)儲存起來,到考試時,從計算機(jī)題庫中抽出合適的題目,拼成一套試題。在建立題庫時,應(yīng)把測試的要求、內(nèi)容、題型決定下來;爾后發(fā)動專業(yè)人員和教學(xué)第一線的教師編寫題目,各項指標(biāo)(信度、效度、難度、區(qū)分度合格的項目編入題庫備用。3.5評分系統(tǒng)的現(xiàn)代化語言測試現(xiàn)代化的一個重要方面就是評分系統(tǒng)的現(xiàn)代化,電子計算機(jī)不僅可以用來貯存材料,建立題庫,編制試卷等,而且可以用來閱卷評分,做題目分析和模擬錄取等。一臺現(xiàn)代
14、化光學(xué)掃瞄儀器1小時可以輸入60000份答卷的數(shù)據(jù),為大規(guī)模的評分和統(tǒng)計工作創(chuàng)造了良好的條件不僅節(jié)約了人力,其客觀性和準(zhǔn)確性也大大提高了。因此,結(jié)合最新技術(shù)開發(fā)智能型電子評分系統(tǒng),減少因人為因素而造成的測試結(jié)果的不科學(xué)、不標(biāo)準(zhǔn)、不客觀,使學(xué)生“在計算機(jī)面前人人平等”,這樣做,不僅為教師“解了圍”,而且可以打消學(xué)生的僥幸心理,因為機(jī)器閱卷是不留情面的。在以前,機(jī)器閱卷僅限于客觀試題,現(xiàn)在,由于行為測試越來越受到重視。語言測試中出現(xiàn)較多主觀性題目。主觀題的批改既費時又費力,且標(biāo)準(zhǔn)不易掌握。目前,研究者已嘗試用計算機(jī)來對被測試主觀題的大體情況進(jìn)行評分,ETS 就是采用先進(jìn)計算機(jī)與語言學(xué)技術(shù)成功地開發(fā)
15、出了一套電子作文打分系統(tǒng)(E lectronic Easy Rater ,簡稱e -rater 。它與人工閱卷相比其準(zhǔn)確率已達(dá)87%至94%。E -rater 開發(fā)利用大大降低了閱卷的成本,將會引起閱卷的革命。E -rater 系統(tǒng)的測試原理是,根據(jù)評分專家事先設(shè)定的評估作文成績的標(biāo)準(zhǔn),計算機(jī)自動分析被試作文的特征,并與專家設(shè)定的特征相對照,然后給出一個等級。這樣,把計算機(jī)技術(shù)、認(rèn)知科學(xué)理論和人工智能技術(shù)結(jié)合起來探討人們解決問題的過程,無疑將有助于我們更好地了解被試者的答題思路和考官閱卷思路,這對了解被試的困難所在,改進(jìn)教學(xué)和指導(dǎo)學(xué)習(xí),提高測試評估的信度等有著深遠(yuǎn)的意義。參考文獻(xiàn):1劉潤清.論
16、大學(xué)英語教學(xué)M.北京:外語教學(xué)與研究出版社,1999.2劉潤清.語言測試和它的方法M.外語教學(xué)與研究出版社,1991.3韓寶成.語言測試:理論、實踐與發(fā)展J .北京:外語教學(xué)與研究,2000,(1:47-52.4胡壯麟,劉潤清,李廷福.語言學(xué)教程M.北京:北京大學(xué)出版社,1987.5Alders o ,J &B.N ortyM.1991Language T esting in the 1990s Lon 2don and Basingstoke :M acm illan Publishers Lim ited.6Canal ,M.&M.S wainM.1980Theoreric
17、al bases of communicative approaches to second language teaching and testing.Applied Linguistics 1:1-47.7M orrow ,K.1979C ommunicative language testing :rev olution and ev olutionJ .In M.P ortal (ed.Innovation in Language T esting W inds or :NEFR -Nels on :1-13.8Leemann ,E.(1981,Evaluating Language
18、Assessment T ests J .S ome practical considerations ,in :Ericks on and Omark (1981:28-115.R eflections on the Modernization of Language TestingZHAO H ong -mei(Department of Basic Sciences ,Chongqing Institute of T echnology ,Chongqing 400050,China Abstract :In the light of the analysis on the functions of language testing and the existing problems in it ,this article mainly discusses the problem of how to realize the
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB 17353-2024摩托車和輕便摩托車防盜裝置
- 2024年度云南省高校教師資格證之高等教育法規(guī)能力檢測試卷B卷附答案
- 贛南師范大學(xué)《教育統(tǒng)計學(xué)》2021-2022學(xué)年第一學(xué)期期末試卷
- 阜陽師范大學(xué)《大學(xué)體育一》2021-2022學(xué)年第一學(xué)期期末試卷
- 蘇州市2024-2025學(xué)年六年級上學(xué)期11月期中調(diào)研數(shù)學(xué)試卷二(有答案)
- 福建師范大學(xué)協(xié)和學(xué)院《幼兒歌曲彈唱》2022-2023學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《專業(yè)色彩訓(xùn)練》2021-2022學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《學(xué)校團(tuán)體心理輔導(dǎo)》2022-2023學(xué)年第一學(xué)期期末試卷
- 2024二建管理點睛三小時講義(可打印版)
- 福建師范大學(xué)《體育保健學(xué)》2021-2022學(xué)年第一學(xué)期期末試卷
- 電網(wǎng)運行安全校核技術(shù)規(guī)范
- 汽車坡道玻璃雨棚施工方案
- 二輪復(fù)習(xí)微專題湖泊專題
- 2024年德陽發(fā)展控股集團(tuán)有限公司招聘筆試參考題庫附帶答案詳解
- 餐前檢查表(標(biāo)準(zhǔn)模版)
- 2022-2023學(xué)年廣東深圳福田區(qū)七年級上冊期中地理試卷及答案
- 關(guān)于小學(xué)數(shù)學(xué)課堂中數(shù)形結(jié)合教學(xué)的調(diào)查研究的開題報告
- 傳統(tǒng)文化的傳承和創(chuàng)新
- 2024春國開會計實務(wù)專題形考任務(wù)題庫及答案匯總
- 2024年科技部事業(yè)單位招聘95人歷年高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 2024年深圳市公務(wù)員考試申論真題A卷綜覽
評論
0/150
提交評論