版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、2000年1月第32卷第1期外語教學(xué)與研究(外國語文雙月刊Foreign Language Teaching and Research (bimonthly Jan.2000Vol.32No.1語言測試:理論、實(shí)踐與發(fā)展北京外國語大學(xué)韓寶成提要:本文綜合分析語言測試的兩個(gè)基本問題:語言能力和如何對(duì)其進(jìn)行測量,并討論語言測試研究與發(fā)展趨勢,如重視行為測試、注意研究被試特征對(duì)測試行為的影響、在語言測試中采用新的研究方法及結(jié)合計(jì)算機(jī)技術(shù)開發(fā)新一代測試及評(píng)估系統(tǒng)等。關(guān)鍵詞:語言能力、行為測試、被試特征、e 2rater 中圖分類號(hào)H310.4文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào)1000-0429(200001-004
2、7-611引言 語言測試的主要目的是對(duì)被試的語言能力做出準(zhǔn)確、公正的測量。那么,什么是語言能力?如何對(duì)語言能力進(jìn)行測量?這是語言測試研究要解決的兩個(gè)基本問題。本文綜合分析關(guān)于這兩個(gè)問題的研究情況,并結(jié)合計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)等方面的進(jìn)展,分析未來語言測試的發(fā)展。21什么是語言能力?這是任何語言測試工作者首先面對(duì)并必須回答的問題。對(duì)于什么是語言能力,歷史上不同時(shí)期人們的觀點(diǎn)和看法不盡一致。在科學(xué)前語言測試時(shí)期,語言學(xué)雖然有了一定的發(fā)展,但尚未形成指導(dǎo)語言教學(xué)的系統(tǒng)理論,外語教學(xué)基本上是一種憑經(jīng)驗(yàn)或遵循傳統(tǒng)的教學(xué)。語言教師把語言當(dāng)作一門知識(shí)在教,包括語音知識(shí)、語法知識(shí)和詞匯知識(shí)。語言測試也就考察被試對(duì)這
3、三方面知識(shí)的掌握情況。20世紀(jì)40年代,結(jié)構(gòu)主義語言學(xué)興起。語言學(xué)家提出“語言是一套形式結(jié)構(gòu),一套符號(hào)系統(tǒng)”的論斷。與此同時(shí),行為主義心理學(xué)大行其道。受結(jié)構(gòu)主義語言學(xué)和行為主義心理學(xué)的影響,人們認(rèn)為學(xué)習(xí)語言就是要獲得操作這套符號(hào)系統(tǒng)的技能,即訓(xùn)練對(duì)刺激做出正確反應(yīng)的一套語言習(xí)慣。在這個(gè)時(shí)期,心理測量學(xué)理論對(duì)語言測試也產(chǎn)生了很大的影響。心理測量學(xué)堅(jiān)持語言能力可分說,認(rèn)為語言可以分解為語言技能和語言成分,人們運(yùn)用這些語言技能和語言成分的能力就是一個(gè)人的語言能力。這個(gè)時(shí)期的語言測試稱為心理測量學(xué)結(jié)構(gòu)主義語言學(xué)測試。與科學(xué)前語言測試相比,它更加注重聽說技能,尤其是聽的技能。這種測試在5060年代占統(tǒng)治
4、地位,到80年代甚至90年代初仍是主流。60年代中期,Chomsky (1965提出了語言能力和語言行為的概念。Chomsky 所說的能力,只是抽象的語言能力。不少語言學(xué)家指出,人們進(jìn)行交往,光有抽象的語言能力是不夠的,還會(huì)涉及到許多超出語言能力的能力。如語言的運(yùn)用涉及到一系列的社會(huì)文化因素。另外,一些語言學(xué)家也提出了語言的功能作用。至此,人們對(duì)語言能力的認(rèn)識(shí)擴(kuò)大了,不僅認(rèn)識(shí)到使用語言時(shí)考慮語境的重要性,同時(shí)還認(rèn)識(shí)到語言的使用是一個(gè)動(dòng)態(tài)的交際過程,由此便產(chǎn)生了交際能力這一概念。由此可見,交際能力不僅包括語言能力,還包括超出語言能力的能力。交際能力,作為一個(gè)整體,是由哪些因素構(gòu)成的呢?這個(gè)問題決
5、74定著教學(xué)和測試內(nèi)容。在1979年舉行的第一次語言測試研究研討會(huì)上(Language Testing Research Colloquium ,簡稱L TRC ,Canale 和Swain (1980向大會(huì)提交了“交際語言能力的理論模式”。此模式充分吸收了許多研究者的成果,在80年代的外語教學(xué)界和測試界產(chǎn)生了深遠(yuǎn)的影響。Canale 和Swain 的交際語言能力模式由四個(gè)部分組成:1語法能力;2社會(huì)語言能力;3語篇能力;4交際策略能力。雖然這一模式在80年代很流行,但問題是它沒有明確指出這四種能力之間的關(guān)系。進(jìn)入90年代,Bach 2man (1990,1996又提出了一個(gè)全新的交際語言能力
6、模式。他認(rèn)為,交際語言能力就是把語言知識(shí)和語言使用的場景特征結(jié)合起來,創(chuàng)造并解釋意義的能力(capacity ,它由語言知識(shí)(language knowledge 、策略能力(strategic com 2petence 和心理生理機(jī)制(psychophysiological mechanisms 三部分組成:語言知識(shí)由組織篇章;策略能力指在具體的語言交際時(shí),運(yùn)用各種語言知識(shí)的心理能力(mental capacity ,它是語言能力通向現(xiàn)實(shí)世界的橋梁,是將語言知識(shí)運(yùn)用于交際目的的手段;心理生理機(jī)制則指把語言交際看作一種物理現(xiàn)象,運(yùn)用語言交際時(shí)所牽涉到的神經(jīng)和心理過程(關(guān)于Bachman 交際語
7、言能力的詳細(xì)評(píng)述,見韓寶成1995。由此可見,以Bachman 等為代表的新模式與舊模式的區(qū)別主要是:第一,舊模式把語言看成知識(shí)或一種體系,而新模式則認(rèn)為語言是用來表達(dá)思想和辦事情的手段。語言的使用不僅受制于語音、詞匯、語法規(guī)則,還受使用環(huán)境、社會(huì)文化背景的影響。第二,舊模式認(rèn)為考生語言知識(shí)掌握得越多越全面,其語言運(yùn)用能力就越強(qiáng)。而新模式認(rèn)為,語言能力是一個(gè)動(dòng)態(tài)的概念,不僅包括對(duì)知識(shí)的掌握,而且包括在交際時(shí)對(duì)所掌握的知識(shí)的運(yùn)用,這就是所謂交際語言能力,它意味著測試時(shí)要把涉及交際能力的各種因素結(jié)合成一個(gè)整體加以測試。Bachman 的交際語言能力模式比舊模式確實(shí)有了質(zhì)的改進(jìn),對(duì)近十年來的外語教學(xué)
8、和測試產(chǎn)生了深刻的影響。但是,如何正確理解交際語言能力的各個(gè)方面,尤其是如何理解其中的語用能力和策略能力,它們之間的相互關(guān)系和相互影響,以及如何對(duì)它們做出有效的測量等,還有待語言測試工作者進(jìn)一步探討。31設(shè)計(jì)、開發(fā)語言測試的原則3.1一致性原則語言測試的第二個(gè)基本問題是如何測量。這里我們不談具體的測試方法,只是介紹設(shè)計(jì)或開發(fā)語言測試應(yīng)該遵循的幾條原則。Bach 2man 和Palmer 在其新著(1996中指出,設(shè)計(jì)或開發(fā)一項(xiàng)新的考試時(shí),應(yīng)首先考慮語言測試行為要與語言的實(shí)際使用情況相一致。眾所周知,語言測試的目的是根據(jù)被試的考試分?jǐn)?shù)對(duì)其語言能力做出推斷。此時(shí)必須能夠證明被試的測試行為與在具體場
9、景下的語言使用存在一致關(guān)系。要做到這一點(diǎn),需要設(shè)定一套理論框架,使我們能夠考慮把被試的測試行為視為語言使用的一個(gè)特例。設(shè)計(jì)這個(gè)理論框架時(shí)需要考慮兩方面的因素。首先要考慮的是語言使用任務(wù)和情景(language use task and situation 的特征及測試任務(wù)和情景(test task and situation 的特征??紤]任務(wù)特征的目的是為了確保并證明測試任務(wù)與語言使用任務(wù)相一致。此外,還要考慮語言使用者的特征和被試的特征,目的是為了證明這些特征在語言使用任務(wù)和測試任務(wù)中參與的程度有多大。因此,影響語言使用和測試行為的這兩組特征是我們開發(fā)和設(shè)計(jì)考試時(shí)最關(guān)心的問題。個(gè)人特征與對(duì)語
10、言能力做出推斷的構(gòu)念(construct 效度有關(guān),而任務(wù)特征與確定所做推斷的范圍有關(guān)。這兩組特征對(duì)語言使用和語言測試行為產(chǎn)生的影響可用下圖(圖1表示:如圖所示,橫線A 表示語言測試行為與非測試環(huán)境下的語言使用應(yīng)存在一致關(guān)系,它是設(shè)計(jì)、開發(fā)及使用語言測試的核心問題。不管我們自己設(shè)計(jì)、開發(fā)一項(xiàng)測試,還是采用他人開842000年外語教學(xué)與研究第1期圖11語言使用與語言測試行為的一致關(guān)系發(fā)的測試,都需要證明語言使用任務(wù)與情景特征和測試任務(wù)與情景特征之間存在一致關(guān)系,這種關(guān)系在圖中由橫線B表示;此外,還要能證明無論是語言使用者還是被試,他們之間也存在一致關(guān)系,這種關(guān)系由橫線C表示。圖1顯示,個(gè)人特征包
11、括幾個(gè)方面,其中最重要的是語言能力,因?yàn)樗俏覀兺ㄟ^測試要作出推斷的東西。另外兩個(gè)特征是話題知識(shí)和情感圖式。需要考慮這幾個(gè)特征的理由有兩條:第一,它們無論對(duì)語言使用或測試行為都有重要的影響;第二,這些特征應(yīng)當(dāng)有助于而不是妨礙被試語言水平的發(fā)揮。3.2有用性原則設(shè)計(jì)、開發(fā)語言測試的第二條原則是,測試工作者要對(duì)測試有用性(test usefulness的性質(zhì)有一個(gè)正確的清晰的定義。在Bachman看來,語言測試的有用性包括六個(gè)方面的特性,即:信度(reliability+效度(validity+真實(shí)性(au2 thenticity+交互性(interactiveness+影響(impact+可實(shí)
12、踐性(practicality。信度和效度是語言測試的兩個(gè)基本概念,在此不再贅述。我們重點(diǎn)談?wù)鎸?shí)性和交互性。語言測試的真實(shí)性指目標(biāo)語言使用任務(wù)特征(target language use task與測試任務(wù)(test task特征的一致性。一致性越高,測試的真實(shí)性就越強(qiáng)。真實(shí)性是語言測試一個(gè)很重要的特征。測試任務(wù)越真實(shí),與被試平時(shí)使用的語言或內(nèi)容越接近,其測試行為就會(huì)發(fā)揮得越好,那么,根據(jù)測試結(jié)果(分?jǐn)?shù)對(duì)被試語言能力所做的推斷就越準(zhǔn)確,因而測試的構(gòu)念效度就越高。測試任務(wù)真實(shí)還會(huì)使被試對(duì)測試產(chǎn)生良好的感覺,從而使其能力得到充分發(fā)揮。如果測試任務(wù)與被試平時(shí)所用的語言相去甚遠(yuǎn),會(huì)對(duì)被試造成錯(cuò)覺,影響
13、其水平發(fā)揮。因此,設(shè)計(jì)一件真實(shí)的測試任務(wù),必須首先調(diào)查目標(biāo)語言使用環(huán)境下語言任務(wù)的特征。交互性指被試在完成一件測試任務(wù)時(shí),涉及到的個(gè)人特征類型及程度。與語言測試最有關(guān)的個(gè)人特征主要有語言能力、話題知識(shí)和情感圖式。被試在完成一件測試任務(wù)時(shí),這三個(gè)方面的特征是否都起作用?抑或只是其中的一個(gè)或兩個(gè)方面起作用?各自起作用的程度有多大?前面談到,語言能力包括語言知識(shí)和策略能力(或稱元認(rèn)知策略,為了對(duì)被試的語言能力作出推斷,測試任務(wù)的設(shè)計(jì)就必須能夠激發(fā)被試運(yùn)用其語言知識(shí)或認(rèn)知策略來完成,否則就無法根據(jù)被試的測試行為對(duì)其語言能力作出推斷。影響指測試對(duì)社會(huì)、教育制度以及處于這個(gè)制度內(nèi)的個(gè)人的影響??蓪?shí)踐性則指
14、從物力或財(cái)力上測試是否得以實(shí)施,是否可行。如不可行,就必須對(duì)測試做出修改。上述六種特性不應(yīng)在測試實(shí)施以后才加以考慮,而應(yīng)貫穿測試質(zhì)量控制的每個(gè)階段,只有這樣才能保證測試的有用性。在測試界,傳統(tǒng)的看法認(rèn)為上述這些性質(zhì)互不相干,或片面地強(qiáng)調(diào)其中一個(gè)特征。有的學(xué)者認(rèn)為信度和效度是矛盾的(Heaton1988,或者認(rèn)為同時(shí)兼顧真實(shí)性和信度是不可能的(Morrow1986。而Bachman(1996的觀點(diǎn)是,要充分認(rèn)識(shí)到各種性質(zhì)的互補(bǔ)性,從中找到平衡,根據(jù)不同情況又可有所側(cè)重,以取得某一測試在整體上的有用性,因?yàn)槿魏螠y試都有其特定的目的,都是針對(duì)特定的被試和特定的語言使用范圍。大規(guī)模測試通常對(duì)被試做出某
15、種決策,因而注重測試的信度和效度。一般的隨堂94韓寶成語言測試:理論、實(shí)踐與發(fā)展 測試則更加注重測試的真實(shí)性、交互性和影響。41語言測試研究及發(fā)展方向4.1行為測試通過對(duì)語言能力研究的回顧發(fā)現(xiàn),語言測試由重視知識(shí)轉(zhuǎn)向重視技能,再轉(zhuǎn)向重視語言能力的實(shí)際運(yùn)用,這種測試現(xiàn)在被稱為交際能力測試或行為測試。其特點(diǎn)是對(duì)被試進(jìn)行直接測量,如讓被試寫作文,或?qū)Ρ辉囘M(jìn)行口試等。Bachman的語言測試?yán)碚撃J綖樾袨闇y試注入了新的特點(diǎn),即強(qiáng)調(diào)測試任務(wù)和測試過程的真實(shí)性。行為測試研究自70年代末期起逐漸成為 測試界研究的熱點(diǎn)。行為測試首先要解決的問題是確定測試構(gòu)念,并把它與測試方法區(qū)分開來。如口語測試中,按照當(dāng)今的
16、語言能力模式,首先確定口語測試要測量什么,即確定口語測試的構(gòu)念,而且還要能夠解釋方法因素,如測試任務(wù)或評(píng)分人因素對(duì)測試分?jǐn)?shù)的影響。方法因素會(huì)使人們對(duì)測試分?jǐn)?shù)的解釋變得模糊。關(guān)于測試方法對(duì)測試行為的影響,Bach2man(1990已提出一個(gè)模式。但應(yīng)用到行為測試上來,Milanovic(1996認(rèn)為除測試任務(wù)和參與者因素之外,還應(yīng)考慮其他因素以及它們之間的相互影響。他提出的模式如圖2所示:圖21行為測試中各種因素及其相互作用圖2顯示了在行為測試(口語和寫作中涉及到的各種因素及其影響。Milanovic認(rèn)為,作為測試開發(fā)人員,應(yīng)首先確定在某一特定環(huán)境下評(píng)估被試口語或書面表達(dá)能力的程序,按此程序操作
17、便會(huì)得到被試的測試分?jǐn)?shù)或?qū)Ρ辉囆袨?表達(dá)能力的描述,測試的結(jié)果由使用者作出解釋。為了獲得被試口語或書面語的真實(shí)情況,測試任務(wù)及環(huán)境的設(shè)定必須恰當(dāng)合理,與評(píng)估條件相吻合。與閱讀和聽力測試不同,口語和寫作測試要求被試在特定的環(huán)境下講出或?qū)懗鲆欢卧?然后由考官打分定級(jí)。定級(jí)需有定級(jí)量表,且考官必須經(jīng)過嚴(yán)格培訓(xùn)(Alderson1991。傳統(tǒng)行為測試的研究重點(diǎn)是放在評(píng)估標(biāo)準(zhǔn)上面,認(rèn)為這是保證測試信度的重要措施。但現(xiàn)在的研究重點(diǎn)則轉(zhuǎn)移到研究評(píng)估過程本身。因此,測試開發(fā)或設(shè)計(jì)人員要清楚地預(yù)見到上圖中各因素之間的相互作用。這些因素之間的關(guān)系相當(dāng)復(fù)雜,被試的分?jǐn)?shù)會(huì)受多種因素的影響。測試工作者更要花大氣力對(duì)此進(jìn)
18、行研究。4.2研究方法從對(duì)行為測試的研究方法上來看,既有定量方法,也有定性方法。有的研究則兩種方法并用。需要指出的是,一些新的統(tǒng)計(jì)方法被應(yīng)用到行為測試研究上來,如推斷理論(G eneral2izability Theory,Brennan1983。推斷理論又稱泛化力理論,是經(jīng)典測試?yán)碚?Classical TestTheory的一種擴(kuò)展。在所有行為測試中,幾乎52000年外語教學(xué)與研究第1期總是有一個(gè)或多個(gè)可能的誤差源(error sources。經(jīng)典測試?yán)碚摪堰@些誤差源作為一個(gè)整體(entity來對(duì)待,而推斷理論則把它們分別對(duì)待,并采用方差分析的方法估計(jì)每個(gè)誤差源對(duì)總體誤差的貢獻(xiàn)有多大。該理
19、論在用來調(diào)查不同評(píng)分人(rater對(duì)同一被試測試行為的打分情況時(shí)非常有用??陬^記錄分析(Verbal Protocol Analysis,以下簡稱VPA也是目前外語測試界經(jīng)常用到的一種方法。它是根據(jù)被試講出的話(verbalisa2 tion來研究其思維過程。注意要把它和面談( Interview及會(huì)話分析(Discourse Analysis區(qū)別開來。VPA指被試在特定環(huán)境下一邊解決問題,一邊把他腦子里想到的解決問題的思路講出來(think aloud,而面談和會(huì)話分析著重分析講出來的話的內(nèi)容和語言結(jié)構(gòu)。VPA屬于一種定性研究方法,無需經(jīng)過統(tǒng)計(jì)運(yùn)算研究者就可根據(jù)所收集到的信息做出相關(guān)的推論,
20、因試任務(wù)涉及到的各種信息。VPA對(duì)研究測試的效度非常有用。例如,一項(xiàng)測試是不是測量了它要測量的東西,我們可以通過研究被試的口頭記錄來回答這個(gè)問題。當(dāng)然,傳統(tǒng)的測試研究及評(píng)估方法,如項(xiàng)目分析、項(xiàng)目反應(yīng)理論、相關(guān)分析及因素分析等仍然是目前語言測試分析的主要分析方法。4.3被試特征研究同外語教學(xué)界由研究教學(xué)方法轉(zhuǎn)移到研究學(xué)習(xí)者本身上來一樣,被試特征對(duì)測試行為的影響也是當(dāng)前測試界十分關(guān)注的問題。被試特征包括文化背景、背景知識(shí)、認(rèn)知能力、性別和年齡等(Bachman1990。就筆者接觸的材料來看,英國的UCL ES(University of Cambridge Local Examination Sy
21、ndicate和美國的ETS(E2 ducational Testing Service合作,就FCE(First Certificate in English和TOEFL進(jìn)行對(duì)比研究,其中一個(gè)很重要的問題就是研究被試特征對(duì)測試行為的影響,它是目前該領(lǐng)域最大的一個(gè)研究項(xiàng)目。研究在Milanovic和Bachman的指導(dǎo)下進(jìn)行,研究范圍主要包括兩個(gè)方面:第一,社會(huì)心理因素,包括態(tài)度、動(dòng)機(jī)、焦慮感和努力程度四個(gè)因素;第二,策略因素,包括認(rèn)知策略、元認(rèn)知策略和交際策略。作為該研究的一個(gè)部分,Kunnan(1995采用一種結(jié)構(gòu)模式方式(structural modeling approach著重研究了
22、文化背景、接觸英語的機(jī)會(huì)、學(xué)習(xí)英語的態(tài)度和動(dòng)機(jī)及監(jiān)察模式對(duì)測試行為的影響。在談到研究被試特征及測試方法因素對(duì)測試行為影響的意義時(shí),Bachman(1990:156指出,隨著個(gè)人特征及測試方法對(duì)測試行為影響研究的不斷深入,測試開發(fā)人員對(duì)哪些特征因素與方法因素產(chǎn)生交互作用會(huì)了解得更透徹,并且在實(shí)踐中能夠設(shè)法減少這些因素對(duì)測試行為帶來的影響,為被試最大限度地發(fā)揮其測試水平提供機(jī)會(huì),這樣我們就會(huì)更好地、更公正地測量其語言能力。4.4機(jī)助測試計(jì)算機(jī)是20世紀(jì)一大發(fā)明,它對(duì)我們生活各個(gè)方面的影響是顯而易見的,對(duì)語言測試的影響亦如此。計(jì)算機(jī)發(fā)明之后即被嘗試應(yīng)用到語言測試上來。早期的機(jī)助測試多屬練習(xí)性質(zhì)。隨著
23、教育測試技術(shù)的發(fā)展及計(jì)算機(jī)性能的提高,新的機(jī)助測試系統(tǒng)被不斷開發(fā)出來。以美國的ETS為例,其計(jì)算機(jī)化TOEFL考試已在北美和世界許多國家推廣。2002年我國將引進(jìn)這種測試方式。英國劍橋大學(xué)考試委員會(huì)也開發(fā)出了基于計(jì)算機(jī)語言測試系統(tǒng)Commu2 ni2CA T。與紙筆測試相比,計(jì)算機(jī)化測試有許多優(yōu)點(diǎn)。它可以使用先進(jìn)的測試模式,如自適應(yīng)測試。計(jì)算機(jī)自適應(yīng)測試(Computer Adap2 tive Testing屬于個(gè)體化的測試,它不僅節(jié)省測試項(xiàng)目,縮短測試時(shí)間,而且測量誤差較低。在21世紀(jì),隨著人們對(duì)語言運(yùn)用理論更深刻的理解及因特網(wǎng)技術(shù)的發(fā)展,語言測試將會(huì)發(fā)生重大變革。因特網(wǎng)徹底消除了人們的時(shí)空
24、觀念,把地球上每個(gè)角落里的人都聯(lián)系起來。將來,人們通過網(wǎng)絡(luò)可足不出戶對(duì)自己的語言水平進(jìn)行測量。4.5電子評(píng)分系統(tǒng)由于行為測試越來越受到重視,語言測試15韓寶成語言測試:理論、實(shí)踐與發(fā)展2000 年 外語教學(xué)與研究 1 期 第 中會(huì)出現(xiàn)較多主觀性題目 。主觀題的批改既費(fèi) 時(shí)又費(fèi)力 , 且標(biāo)準(zhǔn)不易掌握 。研究者嘗試用計(jì) 算機(jī)來對(duì)被試主觀題的答題情況進(jìn)行評(píng)分 。經(jīng) 過 5 年的努力 , ETS 采用先進(jìn)的計(jì)算語言學(xué)技 術(shù)成 功 地 開 發(fā) 出 了 一 套 電 子 作 文 打 分 系 統(tǒng) ( Elect ronic Essay Rater ,簡稱 e2rater 。與人工 閱卷相比 ,其準(zhǔn)確率已達(dá) 8
25、7 %至 94 % 。e2rater 的開發(fā)和利用 ,大大降低了閱卷的成本 ,將會(huì)引 起測試評(píng)分的革命 。e2rater 系統(tǒng)的設(shè)計(jì)原理 是 ,根據(jù)評(píng)分專家事先設(shè)定的評(píng)估作文成績的 rater 的準(zhǔn)確率 ,并開發(fā)其診斷和解釋功能 。可 實(shí)的語言運(yùn)用 ; 第三 ,從測試以設(shè)計(jì)者為中心到 注意研究測試方法及被試特征對(duì)測試行為的影 響 ; 第四 ,從只看答卷結(jié)果到注意研究被試的答 題過程 ; 第五 ,開始糾正主觀題閱卷中的固有毛 病 ,結(jié)合最新電子技術(shù)開發(fā)智能型電子評(píng)分及 測試系統(tǒng) 。 參考書目 Alderson , J . & B. Nort h. 1991. L anguage Testi ng
26、 i n t he 1990 s. London and Basingstoke : Macmillan 標(biāo)準(zhǔn) ,計(jì)算機(jī)自動(dòng)分析被試作文的特征 ,并與專 家設(shè)定的特征相對(duì)照 , 然后給出一個(gè)等級(jí) 。該 系統(tǒng)實(shí)行 6 分制 。如果被試文章內(nèi)容切題 , 結(jié) 構(gòu)合理 , 邏輯性強(qiáng) , 句式 、 用詞等富有變化 , e2 rater 可給出 526 分 。如果被試作文不具備這 些特征 , 得分自然很低 。目前 , e2rater 還不能 完全取代人工閱卷 ,當(dāng) e2rater 和人工閱卷的結(jié) 果出現(xiàn)較大差異時(shí) , ETS 再請(qǐng)第三位閱卷人對(duì) 被試的作文進(jìn)行評(píng)閱 , 因此也提高了作文閱卷 的信度 。他們
27、的下一個(gè)目標(biāo)是進(jìn)一步提高 e2 以相信 , 隨著 e2rater 功能的不斷完善 , 總有一 天人們會(huì)對(duì)自己閱卷的思維過程有一個(gè)透徹的 了解 。而且隨著語音合成技術(shù)的發(fā)展 , 這樣的 電子口語打分系統(tǒng)也將會(huì)實(shí)現(xiàn) 。 語言測試總的發(fā)展趨勢是 : 第一 ,從只看單一的 語言能力到注意被試全面的能力 ; 第二 ,從只測 量假設(shè)的 、 不自然的語言項(xiàng)目到注意自然的 、 真 52 Publishers Limited. Bachman , L . F. 1990. Fundamental Consi derations i n L anguage Testi ng. Oxford : OU P. Bac
28、hman , L . F. & A. S. Palmer. 1996. L anguage Elements of Generaliz ability Testi ng i n Practice. Oxford : OU P. Brennan , R. L . 1983. Theory. Iowa City , IA : The American College Testing Program. Canale , M. & M. Swain. 1980. Theoretical bases of ing and testing. A pplied L i nguistics 1 , 1- 47. Mass : MIT Press. communicative approaches to second language teach2 Second edit
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度鋼材行業(yè)投資分析與風(fēng)險(xiǎn)評(píng)估合同
- 2025版學(xué)校體育器材租賃與維護(hù)服務(wù)協(xié)議3篇
- 教育科技在心理健康領(lǐng)域的創(chuàng)新應(yīng)用
- 二零二五年度打字員與出版社合同:圖書編輯與排版服務(wù)協(xié)議2篇
- 社交媒體在小學(xué)數(shù)學(xué)教學(xué)中的作用與影響
- 教育信息化背景下的探究式學(xué)習(xí)法研究
- 2025年度能源管理創(chuàng)業(yè)合伙人共同投資協(xié)議4篇
- 二零二五年度成都離婚協(xié)議公證辦理材料審核及處理合同4篇
- 企業(yè)可持續(xù)發(fā)展與創(chuàng)新型組織架構(gòu)的關(guān)系
- 小學(xué)階段數(shù)學(xué)與信息技術(shù)課程的資源整合
- 2025-2030年中國MPV汽車市場全景調(diào)研及投資策略分析報(bào)告
- 二零二五年度數(shù)據(jù)存儲(chǔ)與備份外包服務(wù)協(xié)議2篇
- 2024-2025學(xué)年初中七年級(jí)上學(xué)期數(shù)學(xué)期末綜合卷(人教版)含答案
- 2023年1月浙江高考英語聽力試題及答案(含MP3+錄音原文)
- 房產(chǎn)抵押注銷申請(qǐng)表
- 【課件】第三課 蒙娜麗莎 課件高中美術(shù)湘美版美術(shù)鑒賞
- 新媒體研究方法教學(xué)ppt課件(完整版)
- 2020新版?zhèn)€人征信報(bào)告模板
- 東芝空調(diào)維修故障代碼匯總
- 工藝管道儀表流程圖(共68頁).ppt
- 五項(xiàng)管理行動(dòng)日志excel表格
評(píng)論
0/150
提交評(píng)論