《英語(yǔ)測(cè)試的理論與實(shí)踐》_第1頁(yè)
《英語(yǔ)測(cè)試的理論與實(shí)踐》_第2頁(yè)
《英語(yǔ)測(cè)試的理論與實(shí)踐》_第3頁(yè)
《英語(yǔ)測(cè)試的理論與實(shí)踐》_第4頁(yè)
《英語(yǔ)測(cè)試的理論與實(shí)踐》_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一講 概論第一節(jié) 語(yǔ)言測(cè)試與教學(xué)的關(guān)系第二節(jié) 國(guó)外英語(yǔ)測(cè)試?yán)碚撌返谌?jié) 國(guó)內(nèi)英語(yǔ)測(cè)試?yán)碚撌返谒墓?jié) 英語(yǔ)測(cè)試的基本原則第五節(jié) 英語(yǔ)測(cè)試中的真實(shí)性問(wèn)題第六節(jié) 英語(yǔ)測(cè)試的功能和類型第七節(jié) 測(cè)試評(píng)估手段及其功能第一節(jié) 語(yǔ)言測(cè)試與教學(xué)法的關(guān)系v辨證關(guān)系:v英語(yǔ)測(cè)試是對(duì)英語(yǔ)教學(xué)結(jié)果的檢驗(yàn),是英語(yǔ)教學(xué)法的檢測(cè)工具,是英語(yǔ)教學(xué)中不可缺少的重要環(huán)節(jié)。v英語(yǔ)教學(xué)法是英語(yǔ)教學(xué)手段理論化的方法,是英語(yǔ)測(cè)試的標(biāo)準(zhǔn)。v英語(yǔ)測(cè)試法應(yīng)適應(yīng)教學(xué)法,否則測(cè)試方法缺乏有效性、客觀性和可信性。v教學(xué)法應(yīng)為測(cè)試法提供合理的標(biāo)準(zhǔn),否則教學(xué)法缺乏有效性、教育性。v1、應(yīng)試教育 初、中、高考 指揮棒?v2、Arthur Hughes 教學(xué)

2、與測(cè)試=伙伴?v3、大學(xué)英語(yǔ)四六級(jí)考試成績(jī)=學(xué)位?v4、各級(jí)各類職稱 = 外語(yǔ)成績(jī)?v5、標(biāo)準(zhǔn)化考試 = 多項(xiàng)選擇題?(multiple choice)v6、取消考試?思考第二節(jié) 國(guó)外英語(yǔ)測(cè)試?yán)碚摰陌l(fā)展vOld Testament: Judges (舊約全書:士師記第12章)v Jephthah then called together the men of Gilead and fought against Ephraim. The Gileadites struck them down because the Ephraimites had said, “You Gileadites ar

3、e renegades from Ephraim and Manasseh.” The Gileadites captured the fords of the Jordan leading to Ephraim, and whenever a suvivor of Ephraim said, “Let me cross over,” the men of Gilead asked him, “Are you an Ephraimite?” If he replied, “No,” they said, “All right, say Shibboleth” If he said, “Sibb

4、oleth,” because he could not pronounce the word correctly, they seized him and killed him at the fords of the Jordan. Forty-two thousand Ephraimites were killed at that time第一階段 前科學(xué)語(yǔ)言測(cè)試或傳統(tǒng)語(yǔ)言測(cè)試階段(The Pre-scientific Language Testing 或 Traditional Language Testing Phase)v20世紀(jì)四十年代以前v語(yǔ)言被當(dāng)作是包括語(yǔ)法、詞匯、語(yǔ)音的一套知

5、識(shí)體系。v測(cè)試中對(duì)技巧、技能的考查沒(méi)有量度依據(jù),測(cè)試結(jié)果主要根據(jù)教師的主觀判斷。v試題常包括短文寫作(Essay Writing)、翻譯(Translation)、語(yǔ)法分析(Grammatical Analysis)v忽視聽(tīng)力、口語(yǔ)v測(cè)試法為短文寫作-翻譯法(Essay-writing Translation Approach)第二階段 心理測(cè)量-結(jié)構(gòu)主義語(yǔ)言測(cè)試或現(xiàn)代語(yǔ)言測(cè)試階段(The Psychometic-structuralist Language Testing 或Modern Language Testing Phase)v20世紀(jì)四十年至70年代中期 拉多路子階段(Lados

6、Approach Phase)v語(yǔ)言規(guī)則知識(shí)的學(xué)習(xí)不等于語(yǔ)言的學(xué)習(xí)vBloomfield (結(jié)構(gòu)主義語(yǔ)言學(xué)家):語(yǔ)言是一套形式結(jié)構(gòu),是一套習(xí)慣(a set of habits)vSkinner (行為主義心理學(xué)家):語(yǔ)言行為是一連串刺激-反應(yīng)過(guò)程;提出結(jié)構(gòu)主義教學(xué)法,如聽(tīng)說(shuō)法。結(jié)合心理語(yǔ)言學(xué)領(lǐng)域的心理測(cè)量學(xué)(psychometrics)的方法。v結(jié)構(gòu)主義語(yǔ)言學(xué):語(yǔ)言是一套符號(hào)系統(tǒng),可以分解為語(yǔ)音、詞匯、語(yǔ)法等。vLado Language Testing:語(yǔ)言能力分為語(yǔ)音、句法、詞匯、文化;用聽(tīng)說(shuō)讀寫方式可測(cè)試。v可設(shè)計(jì)出分點(diǎn)式測(cè)試(discrete-point test),認(rèn)為試題應(yīng)該每題只

7、考查一個(gè)考點(diǎn),其主要題型有選擇填空、詞匯填空、語(yǔ)法填空、完成句子、改錯(cuò)等。v特點(diǎn):v將心理測(cè)量法引入語(yǔ)言測(cè)試,強(qiáng)調(diào)信度(reliability)和客觀性(objectivity) 。v將統(tǒng)計(jì)方法引入語(yǔ)言測(cè)試,對(duì)試題難度、區(qū)分度、整卷信度等進(jìn)行定量分析。v語(yǔ)言測(cè)試成為一門既有堅(jiān)實(shí)理論基礎(chǔ)又有相對(duì)科學(xué)的測(cè)量統(tǒng)計(jì)方法的學(xué)科。v對(duì)語(yǔ)言測(cè)試的效度少有關(guān)注。v與第一階段相比,強(qiáng)調(diào)了口頭語(yǔ)言;在教學(xué)中,把聽(tīng)說(shuō)擺在讀寫之前,在測(cè)試中給聽(tīng)說(shuō)技能一定的比重;但忽略了語(yǔ)言情景;為了考查結(jié)構(gòu),試題有明顯的人工捏造的痕跡。第三階段 心理語(yǔ)言學(xué)-社會(huì)語(yǔ)言學(xué)語(yǔ)言測(cè)試或后現(xiàn)代語(yǔ)言測(cè)試階段(The Psycholinguist

8、ic-sociolinguistic Testing或Post-modern Testing Phase)vChomsky (1965): 語(yǔ)言能力(linguistic competence)和語(yǔ)言行為(linguistic performance)vHymes (1972): 交際能(communicative competence);使用語(yǔ)言不但要能夠按照語(yǔ)法規(guī)則產(chǎn)出形式合格的句子,而且還應(yīng)具有在不同語(yǔ)境中使用這些句子的能力,即語(yǔ)言使用涉及社會(huì)文化因素。語(yǔ)言能力假說(shuō)的演變(一)vJ. Oller (1979): 單一語(yǔ)言能力假說(shuō)(Unitary Competence Hypothesis

9、, UCH)。認(rèn)為語(yǔ)言能力是一個(gè)整體,語(yǔ)言測(cè)試可以通過(guò)綜合性的完形填空和聽(tīng)寫來(lái)衡量語(yǔ)言能力,因?yàn)檫@兩種形式的測(cè)試包含全部或幾乎全部的語(yǔ)言能力;針對(duì)分點(diǎn)式測(cè)試,提出綜合式測(cè)試(integrative approach),主張通過(guò)一次測(cè)試全面評(píng)價(jià)被試者總體語(yǔ)言水平,被試者須綜合運(yùn)用各種語(yǔ)言知識(shí)或技能;題型有完形填空、綜合改錯(cuò)、聽(tīng)寫、口試、作文等。vCanale & Swain (1980): 語(yǔ)言四能力 1、語(yǔ)言能力(linguistic competence),含語(yǔ)音、詞匯、語(yǔ)法等語(yǔ)言知識(shí);2、社會(huì)語(yǔ)言能力(sociolinguistic competence),在不同的社會(huì)環(huán)境中,理解

10、和表達(dá)形式和意義皆恰當(dāng)?shù)恼Z(yǔ)言能力。3、交際策略能力(strategic competence),如交際時(shí)如何開(kāi)始、如何維持、如何調(diào)整、轉(zhuǎn)換、如何結(jié)束等能力。4、語(yǔ)篇能力(discoursal competence),即組織連貫而非獨(dú)立機(jī)組的能力。語(yǔ)言能力假說(shuō)的演變(二)vL. F. Bachman (1990) Fundamental Consideration in Language Testing: 交際語(yǔ)言能力(communicative language ability, CLA),由語(yǔ)言能力、策略能力、心理生理機(jī)制構(gòu)成。其中,語(yǔ)言能力包括:1、語(yǔ)言組織能力(organizationa

11、l competence) a. 語(yǔ)法能力(grammatical competence)(含詞匯、詞法、句法、語(yǔ)音學(xué)/書寫);b. 語(yǔ)篇能力(discoursal competence) (含詞語(yǔ)聯(lián)結(jié)知識(shí)、修辭知識(shí))。2、語(yǔ)言使用能力(utilizing competence) a. 功能能力(illocutionary competence)(含達(dá)意、操縱、探索、想象功能);b. 社會(huì)語(yǔ)言能力(sociolinguistic competence) (含方言或變體知識(shí)的敏感性、語(yǔ)域知識(shí)的敏感性、自然地到語(yǔ)言的敏感性、文化典故和比喻知識(shí))。策略能力是在語(yǔ)言交際時(shí)運(yùn)用各種語(yǔ)言知識(shí)的心理能力。心

12、理生理機(jī)制是語(yǔ)言交際時(shí)作為物質(zhì)現(xiàn)象如聲光等所涉及的心理和神經(jīng)活動(dòng)過(guò)程。語(yǔ)言能力假說(shuō)的演變(三)vWeir (1990): 詳細(xì)闡述交際語(yǔ)言測(cè)試的理論原則并介紹了交際語(yǔ)言測(cè)試的題目類型。(IELTS)v交際語(yǔ)言測(cè)試的主要特征:v1、重點(diǎn)是意義;v2、語(yǔ)境化(contextualized);v3、語(yǔ)言活動(dòng)帶有可接受的目的性(purposive);v4、有實(shí)際意義的語(yǔ)言;v5、使用真實(shí)的語(yǔ)言材料(authentic material);v6、文本處理有真實(shí)性;v7、反應(yīng)結(jié)果不可預(yù)見(jiàn)性(unpredictable);v8、以互動(dòng)為基礎(chǔ)(interaction-based);v9、考生在真實(shí)心理狀態(tài)下展

13、示語(yǔ)言能力;v10、根據(jù)實(shí)際交際結(jié)果判定成績(jī)。思考v1、結(jié)合實(shí)際,談?wù)勀慊蚰銈儗W(xué)校所采用的英語(yǔ)測(cè)試法符合那個(gè)發(fā)展階段?試舉例說(shuō)明之。v2、你認(rèn)為現(xiàn)階段應(yīng)該采用哪種測(cè)試法(理論),為什么?v3、你認(rèn)為交際語(yǔ)言測(cè)試最重要的是什么?為什么?第三節(jié) 我國(guó)語(yǔ)言測(cè)試的發(fā)展脈絡(luò)(一)全國(guó)普通高等學(xué)校入學(xué)考試歷年高考英語(yǔ)題型分值分布主觀題(短文翻譯)離散題綜合題1978年以前100%/1978198516%35%40%70%15%-30%1986 2009/10%40%60%90%1950年以來(lái)我國(guó)高考英語(yǔ)發(fā)展分析v1、改革開(kāi)放前:題型單一,幾乎全部為主觀題(1950和1977年有少量客觀題),其形式以翻譯、

14、問(wèn)答式閱讀和寫作為主,有的年份偶爾出現(xiàn)一些新的題型(介詞填空、句型轉(zhuǎn)換、單詞變形、完形填空),但不具有連續(xù)性。短文翻譯雖然給出了一定的情景,但常常是為了考核某些語(yǔ)言點(diǎn)而拼湊出來(lái)的,缺乏真實(shí)感;閱讀段落的題材和體裁不夠多樣化;寫作的內(nèi)容與被試的生活實(shí)際聯(lián)系不大。v2、19781985:主要采用離散式測(cè)試,以分散、孤立地測(cè)試語(yǔ)音、詞匯、語(yǔ)法等語(yǔ)言成分為特征,一般每題只考核一個(gè)語(yǔ)言點(diǎn),題型包括單詞辨音、詞匯題(單詞拼寫、單詞釋義、詞類適當(dāng)形式轉(zhuǎn)換)、選擇填空、介詞/副詞填空、動(dòng)詞正確形式填空以及句型轉(zhuǎn)換等。命題的核心集中在技能(主要是讀寫技能)和語(yǔ)言點(diǎn)兩個(gè)方面;試題的每個(gè)部分針對(duì)某項(xiàng)技能,而其中的每

15、個(gè)小題又針對(duì)某個(gè)語(yǔ)言點(diǎn)。本階段題型逐步多樣化、標(biāo)準(zhǔn)化,命題逐步走向科學(xué)合理,客觀題成為一項(xiàng)重要的測(cè)試手段。v3、1986年以后:以一個(gè)整體來(lái)測(cè)試不同語(yǔ)言點(diǎn)為特征的綜合題分值的比重明顯增加,由之前的15%30上升到60%-90,比如聽(tīng)力、完形填空、閱讀理解、綜合改錯(cuò)、作文等。這些綜合題大多以語(yǔ)篇為基本單位,有語(yǔ)境,且關(guān)照語(yǔ)言知識(shí)和語(yǔ)言技能,能夠在一定程度上反映被試在具體的交際情景中使用語(yǔ)言的能力。作文的命題比較靈活,既有控制性的作文(改對(duì)話為短文、看圖作文等)、情景作文,也有應(yīng)用文寫作、開(kāi)放性作文。這些作文從被試生活實(shí)際出發(fā),把被試學(xué)習(xí)語(yǔ)言的目標(biāo)、需要的信息、交際的情景、語(yǔ)料的真實(shí)以及使用語(yǔ)言的

16、需要等因素都考慮在內(nèi),正確、流利、得體成為了作文的評(píng)分標(biāo)準(zhǔn)。這個(gè)階段的高考試題在設(shè)計(jì)上盡管仍然受到離散點(diǎn)測(cè)試的v影響,但已經(jīng)能夠比較靈活地處理聽(tīng)、說(shuō)、讀、寫技能和語(yǔ)言知識(shí)的問(wèn)題,并開(kāi)始反對(duì)機(jī)械地分離語(yǔ)言技能和劃分語(yǔ)言知識(shí),提倡語(yǔ)言的綜合運(yùn)用。不難看出,這個(gè)階段的高考英語(yǔ)測(cè)試基本實(shí)現(xiàn)了從綜合型語(yǔ)言測(cè)試階段向心理語(yǔ)言學(xué)一社會(huì)語(yǔ)言學(xué)時(shí)期的過(guò)渡,交際測(cè)試已經(jīng)萌生。 v4、值得注意的是,較之往年,2002年的高考英語(yǔ)試題有了明顯的變動(dòng):它完全摒棄了諸如詞匯與結(jié)構(gòu)選擇填空、句型轉(zhuǎn)換、正誤判斷與改錯(cuò)等傳統(tǒng)題型,減少了翻譯題所占的比重,增加了聽(tīng)力能力的測(cè)試。這些變動(dòng)并非偶然,而是我國(guó)中學(xué)階段英語(yǔ)教學(xué)改革在測(cè)試

17、領(lǐng)域的一個(gè)具體體現(xiàn),也是教育部全日制義務(wù)教育、普通高級(jí)中學(xué)英語(yǔ)課程標(biāo)準(zhǔn)頒布后高考英語(yǔ)測(cè)試的一次變革。 v小結(jié):總之,我國(guó)高考英語(yǔ)測(cè)試的實(shí)踐基本體現(xiàn)了語(yǔ)言測(cè)試?yán)碚摪l(fā)展的軌跡,但由于信息不夠通暢、測(cè)試?yán)碚撗芯科鸩捷^晚等原因,無(wú)論是在命題的科學(xué)性還是系統(tǒng)性方面,我國(guó)的高考英語(yǔ)測(cè)試都滯后于國(guó)際水平。從高考的角度來(lái)看,我國(guó)目前已經(jīng)進(jìn)入了測(cè)試發(fā)展的第三階段,即心理語(yǔ)言學(xué)一社會(huì)語(yǔ)言學(xué)時(shí)期。 第三節(jié) 我國(guó)語(yǔ)言測(cè)試的發(fā)展脈絡(luò)(二)研究生入學(xué)考試歷年研考英語(yǔ)題型分值分布主觀題(翻譯)離散題綜合題1980198435%50%32%45%5%20%1985198735%30%45%20%-35%1988 200910

18、%35%0%25%40%90%1980年以來(lái)我國(guó)研考英語(yǔ)發(fā)展分析v1、1980至1984年,以篇章翻譯為代表的主觀題比重居高,尤其是1980、1981年,分值高達(dá)50%。此外,離散題也占了相當(dāng)?shù)谋戎兀?2%45%),分值較高;綜合題雖然有所涉及,但權(quán)重不大(5%20%),且更側(cè)重考核被試的語(yǔ)言知識(shí),而并非語(yǔ)言技能。主觀翻譯題大多為測(cè)試某些語(yǔ)言知識(shí)而改編或編寫的句段,語(yǔ)境不夠自然真實(shí),語(yǔ)言也不夠得體;離散題多局限于語(yǔ)言形式結(jié)構(gòu)(詞匯與結(jié)構(gòu)選擇填空、句型轉(zhuǎn)換、詞型轉(zhuǎn)換等),缺乏使用語(yǔ)言的交際環(huán)境;綜合題的主要形式是完形填空、錯(cuò)誤改正等題項(xiàng),閱讀理解、聽(tīng)力理解和寫作等題目則在試卷中完全缺失。由此可見(jiàn)

19、,這個(gè)階段的研究生入學(xué)英語(yǔ)測(cè)試重視語(yǔ)言知識(shí),但在形式上已經(jīng)開(kāi)始借鑒離散測(cè)試題型,正處于以主觀題為主的前科學(xué)時(shí)期向心理測(cè)量一結(jié)構(gòu)主義時(shí)期過(guò)渡的階段。v2、1985-1987年,研究生入學(xué)英語(yǔ)試題出現(xiàn)了明顯的調(diào)整。首先,翻譯題的比重下降,離散題的比例走高(占整個(gè)比值的45%),綜合題的分量逐漸增加。其次,靠死記硬背的題項(xiàng)(如詞匯與結(jié)構(gòu)選擇填空、句型轉(zhuǎn)換等)在分值和比重上或有所減少或被摒棄,注重考查反應(yīng)速度和操作技能的閱讀理解題開(kāi)始被引入,再次,從分值分配上來(lái)看,命題已經(jīng)從語(yǔ)言知識(shí)和技能兩個(gè)方面入手,并注意在一定程度上反應(yīng)出被試的學(xué)習(xí)層次。這些特點(diǎn)均表明,這個(gè)階段的研究生入學(xué)測(cè)試已進(jìn)入心理測(cè)量一結(jié)構(gòu)

20、主義時(shí)期。v3、從1988年起,將語(yǔ)言看成一個(gè)整體、將語(yǔ)言知識(shí)與技能綜合起來(lái)考核的綜合測(cè)試題占據(jù)了研究生入學(xué)測(cè)試的主宰地位,其比重由先前的35%升至90。1991、2000、2002年詞形變化、錯(cuò)誤判斷與改錯(cuò)、詞匯與結(jié)構(gòu)選擇填空等題型相繼被取消,代之為1991、2002年分別增加的寫作和聽(tīng)力板塊,研究生入學(xué)試題在題型和模塊方面進(jìn)入了一個(gè)相對(duì)較為穩(wěn)定的階段。這個(gè)階v段的主要模塊為語(yǔ)言應(yīng)用、聽(tīng)力理解、閱讀理解和寫作,題型包括完形填空、多項(xiàng)選擇、短文和圖表填空、回答問(wèn)題、翻譯、作文等。值得注意的是,每個(gè)模塊均以語(yǔ)篇為單位,選取的材料在題材(人物傳記社會(huì)、文化、日常知識(shí)、科普常識(shí)等)和體裁(敘述文、說(shuō)

21、明文、議論文、應(yīng)用文等)上紛繁多樣,相關(guān)的題目在設(shè)計(jì)上也呈多樣化(例如,閱讀理解不再是單一的多項(xiàng)選擇題目,而包括了多項(xiàng)選擇、復(fù)合填空、正誤判斷、是非選擇、表格填充、問(wèn)題簡(jiǎn)答等),且靈活處理了聽(tīng)、讀、寫、譯等技能之間以及它們與語(yǔ)言點(diǎn)之間的關(guān)系,做到了接收型技能和產(chǎn)出型技能緊密聯(lián)系,語(yǔ)言技能和語(yǔ)言知識(shí)有機(jī)結(jié)合。總之,這個(gè)階段的試題在測(cè)試任務(wù)方面考慮到了被試的真實(shí)生活情景,設(shè)計(jì)了適度的信息量和信息差,關(guān)注到了語(yǔ)言接收和語(yǔ)言產(chǎn)出技能的平衡,交際測(cè)試的基本特征得到體現(xiàn)。 v小結(jié):總體看來(lái),我國(guó)研究生入學(xué)考試同高考測(cè)試一樣,雖落后于語(yǔ)言測(cè)試?yán)碚摰珖?yán)格遵循其發(fā)展軌跡,目前暫處于第三發(fā)展階段,即心理語(yǔ)言學(xué)一社

22、會(huì)語(yǔ)言學(xué)時(shí)期。 第三節(jié) 我國(guó)語(yǔ)言測(cè)試的發(fā)展脈絡(luò)(二)大學(xué)英語(yǔ)四、六級(jí)考試大學(xué)英語(yǔ)四級(jí)考試題型和計(jì)分序號(hào)題號(hào)測(cè)試題型計(jì)分I120聽(tīng)力理解20II2140閱讀理解40III4170詞匯與結(jié)構(gòu)15IV7190完形填空10V91短文寫作15第三節(jié) 我國(guó)語(yǔ)言測(cè)試的發(fā)展脈絡(luò)(二)大學(xué)英語(yǔ)四、六級(jí)考試大學(xué)英語(yǔ)六級(jí)考試題型和計(jì)分序號(hào)題號(hào)測(cè)試題型計(jì)分I120聽(tīng)力理解20II2140閱讀理解40III4170詞匯與結(jié)構(gòu)15IV7190綜合改錯(cuò)10V91短文寫作151987年以來(lái)我國(guó)大學(xué)英語(yǔ)四、六級(jí)分析v1、試題內(nèi)容規(guī)范,題型相對(duì)穩(wěn)定、自施考以來(lái),四、六級(jí)試卷主要由聽(tīng)力、閱讀、寫作、詞匯與語(yǔ)法結(jié)構(gòu)、完形填空綜合改錯(cuò)

23、等板塊構(gòu)成,題型包括多項(xiàng)選擇、簡(jiǎn)短回答、復(fù)合填空、句子翻譯等。盡管從1996年開(kāi)始,四級(jí)增加了諸如英譯漢、簡(jiǎn)短回答、復(fù)合聽(tīng)寫等新題型,但這些新題型只是與原題型中的某項(xiàng)題型輪流互換。v 2、起點(diǎn)高。四、六級(jí)考試施考之時(shí),正值我國(guó)改革開(kāi)放成就斐然、外語(yǔ)學(xué)習(xí)蔚然成風(fēng)之際。國(guó)外先進(jìn)的語(yǔ)言教學(xué)理念被推介到國(guó)內(nèi),語(yǔ)言測(cè)試?yán)碚撆c研究倍受關(guān)注,這些都決定著四、六級(jí)考試從一開(kāi)始就具備了較高的起點(diǎn)。除了詞匯與結(jié)構(gòu)部分之外,四、六級(jí)試題選取的都是語(yǔ)篇層次的語(yǔ)言材料,試卷構(gòu)成以綜合題為主體。毋庸置疑,由語(yǔ)言測(cè)試?yán)碚撝蔚乃?、六?jí)考試旨在考核綜合語(yǔ)言能力,交際化趨勢(shì)明顯,而話題式口語(yǔ)考試的引人則是其交際化的另外一個(gè)佐證

24、。v 3、語(yǔ)言技能之間的關(guān)系處理得更為合理。四、六級(jí)試題在形式上呈板塊,但測(cè)試任務(wù)卻體現(xiàn)了設(shè)計(jì)者的匠心。聽(tīng)與寫、讀與寫、讀與譯等測(cè)試任務(wù)折射出的不僅僅是語(yǔ)言技能之間的互賴關(guān)系,同時(shí)也彰顯了語(yǔ)言作為交際工具的一個(gè)屬性,即接收型技能和產(chǎn)出型技能的平衡。由此我們可以看出,全國(guó)四、六級(jí)考試的發(fā)展印證了80年代中后期我國(guó)英語(yǔ)測(cè)試所處的階段。v小結(jié):我國(guó)大學(xué)英語(yǔ)四、六級(jí)考試分別從1987、1989年開(kāi)始正式施考,現(xiàn)已成為一項(xiàng)大規(guī)模標(biāo)準(zhǔn)化考試。與高考、研究生入學(xué)考試相比,大學(xué)英語(yǔ)四、六級(jí)考試起步晚,但起點(diǎn)高、作為大規(guī)模標(biāo)準(zhǔn)化考試,大學(xué)英語(yǔ)四、六級(jí)考試無(wú)論在設(shè)計(jì)上還是在操作流程上都比較規(guī)范:它們以大學(xué)英語(yǔ)教學(xué)

25、大綱和大學(xué)英語(yǔ)四、六級(jí)考試大綱為依據(jù),設(shè)立有專門的考試委員會(huì),建立了相當(dāng)穩(wěn)定的命題員網(wǎng)絡(luò),其信度、效度都經(jīng)過(guò)了嚴(yán)格的檢驗(yàn)。 我國(guó)英語(yǔ)測(cè)試的發(fā)展趨勢(shì)v通過(guò)對(duì)我國(guó)大規(guī)模英語(yǔ)考試題型的統(tǒng)計(jì)分析,可以發(fā)現(xiàn)我國(guó)語(yǔ)言測(cè)試的實(shí)踐基本遵循了理論發(fā)展的脈絡(luò):20世紀(jì)70年代之前英語(yǔ)測(cè)試處于前科學(xué)時(shí)期;20世紀(jì)七八十年代,處于心理測(cè)量一結(jié)構(gòu)主義時(shí)期;20世紀(jì)80年代中后期至今,處于測(cè)試?yán)碚摪l(fā)展的第三階段,即心理語(yǔ)言學(xué)一社會(huì)語(yǔ)言學(xué)時(shí)期。目前,我國(guó)英語(yǔ)測(cè)試越來(lái)越呈交際化趨勢(shì),主要體現(xiàn)在:v1、在作文方面,最近幾年各類考試的作文題大體以應(yīng)用文為主,涉及書信、電子郵件、導(dǎo)游詞、投訴、出國(guó)申請(qǐng)等與現(xiàn)實(shí)社會(huì)息息相關(guān)的題目???/p>

26、見(jiàn),現(xiàn)在的作文命題反套路、反模塊,要求考生具有用書面語(yǔ)表達(dá)思想的能力,既考查被試的語(yǔ)言基本功,更考查他們?cè)趯?shí)際生活中運(yùn)用語(yǔ)言的能力。v2、在聽(tīng)力方面加大了分?jǐn)?shù)的比重,采用了增加原聲、背景音、多人交談等語(yǔ)言材料,更注重采用“真實(shí)語(yǔ)言材料”。v3、在閱讀方面增加了快速閱讀內(nèi)容,使閱讀任務(wù)更加細(xì)化。v4、四、六級(jí)口語(yǔ)考試逐步推廣,研究生入學(xué)考試也把口語(yǔ)測(cè)試列入了復(fù)試范圍,旨在考核被試的實(shí)際語(yǔ)言運(yùn)用能力。結(jié)束語(yǔ)及思考v 教學(xué)與測(cè)試是相輔相成的。在我國(guó)英語(yǔ)教學(xué)改革的大環(huán)境下,教育部制訂的全日制義務(wù)教育、普通高級(jí)中學(xué)英語(yǔ)課程標(biāo)準(zhǔn))(2001)和大學(xué)英語(yǔ)課程教學(xué)要求(2004)不約而同地把培養(yǎng)學(xué)生的綜合應(yīng)用

27、語(yǔ)言能力作為教學(xué)目標(biāo),而作為檢驗(yàn)教學(xué)效果的測(cè)試必然要緊跟教學(xué)的發(fā)展。由此可見(jiàn),交際型語(yǔ)言測(cè)試必將成為我國(guó)未來(lái)英語(yǔ)測(cè)試的主流。v思考:v1、結(jié)合本人了解或參加過(guò)的考試,談?wù)勀阈?荚嚨默F(xiàn)狀及建議。v2、依據(jù)本人的教學(xué),結(jié)合測(cè)試的發(fā)展趨勢(shì),展望未來(lái)考試的前景。第四節(jié) 英語(yǔ)測(cè)試的基本原則v1、效度v2、信度v3、真實(shí)性v4、互動(dòng)性v5、沖擊力v6、可行性1、語(yǔ)言測(cè)試的效度(validity)v測(cè)試的效度是一次考試對(duì)其所要測(cè)試的語(yǔ)言能力能夠測(cè)到的程度。效度側(cè)重的是測(cè)試的內(nèi)容,它檢驗(yàn)測(cè)試的目的是否一致。測(cè)試有各種不同的效度,總的來(lái)說(shuō)可分為四種類型。v(1)卷面效度。也稱為表面效度,是指考試在表面上使考生及

28、其他有關(guān)人員憑直覺(jué)感到的有效程度。Ingrem認(rèn)為卷面效度指的是“考試的表面信譽(yù)或公眾對(duì)考試的接受程度”。如果測(cè)試項(xiàng)目表面上適合于側(cè)試者、受試者和教師,它就可被看作具有卷面效度。如果一份測(cè)試具有好的卷面效度,學(xué)習(xí)者的學(xué)習(xí)意愿就能得到激發(fā)和保持因?yàn)檠芯勘砻鞔蠖鄶?shù)受試者在測(cè)試表現(xiàn)出適合于他們的時(shí)候會(huì)加倍努力;相反,如果受試者看到某一測(cè)試與測(cè)量其某一語(yǔ)言能力無(wú)關(guān)或者高出其語(yǔ)言能力水平,考生就容易喪失參與的積極性。v(2)內(nèi)容效度。指考試內(nèi)容對(duì)預(yù)測(cè)內(nèi)容的代表性的程度。內(nèi)容效度評(píng)價(jià)一個(gè)考試的出發(fā)點(diǎn)是看其內(nèi)容是否與考試目的一致,在內(nèi)容正確的基礎(chǔ)上,再看其內(nèi)容是否具有代表性。內(nèi)容的代表性與內(nèi)容樣本量的充足性

29、-考試的題量、主題覆蓋面等。如果一項(xiàng)詞匯測(cè)試只檢測(cè)考生介詞的能力,內(nèi)容效度就很低;再如,一項(xiàng)聽(tīng)力側(cè)試采用口語(yǔ)考試的形式進(jìn)行,這類考試肯定缺乏內(nèi)容效度。 v(3)構(gòu)卷效度。指測(cè)試題目反映出測(cè)試構(gòu)建于某個(gè)理論本質(zhì)方面的程度。如果一項(xiàng)測(cè)試能夠反映出與語(yǔ)言學(xué)習(xí)理論一致的一些具體特征,那它就有構(gòu)卷效度。它要求測(cè)試的語(yǔ)言理論基礎(chǔ)要與最終的語(yǔ)言行為相符。它不僅要揭示現(xiàn)在的語(yǔ)言行為,而且應(yīng)能揭示最終的語(yǔ)言行為。測(cè)試的設(shè)計(jì)者應(yīng)根據(jù)語(yǔ)言學(xué)習(xí)者將來(lái)會(huì)如何使用語(yǔ)言的預(yù)見(jiàn)來(lái)設(shè)計(jì)試題。一種試題的編制要以某種語(yǔ)言行為理論和語(yǔ)言學(xué)習(xí)理論作為依據(jù)。如果以功能語(yǔ)法為基礎(chǔ),認(rèn)為語(yǔ)言習(xí)慣主要是通過(guò)語(yǔ)言環(huán)境和實(shí)際運(yùn)用而獲得的,那么強(qiáng)調(diào)

30、句型操練和語(yǔ)法分析的測(cè)試就失去了編制效度。 v(4)經(jīng)驗(yàn)效度(尺度關(guān)聯(lián)效度)。指一項(xiàng)測(cè)試的結(jié)果如果與一些外部測(cè)量標(biāo)準(zhǔn)相關(guān)聯(lián),這份側(cè)試就可以說(shuō)具有經(jīng)驗(yàn)效度。經(jīng)驗(yàn)效度是通過(guò)把測(cè)試與一個(gè)或更多的標(biāo)準(zhǔn)測(cè)量相比較而得出的,這種比較可以通過(guò)兩種方式得到:共時(shí)效度和預(yù)測(cè)效度。v共時(shí)效度,即同時(shí)從外部而不是從內(nèi)部通過(guò)某些方法論證考試的效度。它是通過(guò)定性與定量分析兩個(gè)方式來(lái)進(jìn)行的。如,對(duì)共時(shí)效度的定量分析,是通過(guò)用一個(gè)得到公認(rèn)的外部考試的方式與被評(píng)估的考試作比較,看求得的相關(guān)系數(shù)是否理想,如兩者之間的相關(guān)系數(shù)達(dá)到理想的數(shù)值,那么就表示被評(píng)估的考試與外部的考試具有同等效度。當(dāng)測(cè)試結(jié)果在同一時(shí)期與其它測(cè)試結(jié)果相一致

31、時(shí),它可被看作具有共時(shí)效度。v預(yù)測(cè)效度,即考試成績(jī)要能夠預(yù)測(cè)考生以后的學(xué)習(xí)狀況。它的測(cè)量方法是將兩組數(shù)據(jù)進(jìn)行相關(guān)比較,論證它們之間的關(guān)系。當(dāng)測(cè)試結(jié)果與以后的其它測(cè)試結(jié)果或以后取得的其它行為標(biāo)準(zhǔn)相一致時(shí),那么這個(gè)測(cè)試就可以說(shuō)具有預(yù)測(cè)效度。 2、語(yǔ)言測(cè)試的信度(reliability) v語(yǔ)言測(cè)試的信度是指考試測(cè)量學(xué)生語(yǔ)言能力一致性、可靠性的程度。它是任何一個(gè)好的語(yǔ)言測(cè)試必備的特征,也是考試結(jié)果是否可靠的關(guān)鍵指標(biāo)。一個(gè)測(cè)試的信度主要看該測(cè)試所要測(cè)量的東西是否達(dá)到前后一致的程度即考試結(jié)果不受考試施考時(shí)間、監(jiān)考人員、場(chǎng)地等外部因素的影響。如果對(duì)同一個(gè)受試者連續(xù)進(jìn)行兩次測(cè)試或試卷被不同的人批改而得到的結(jié)

32、果相同或相似,這樣的測(cè)試就被看作是具有較高的信度??煽啃砸部煞Q為一致性(consistency),這種可靠性或一致性是任何一種考試都不可缺少的一個(gè)重要特征,否則考試成績(jī)將無(wú)法真實(shí)準(zhǔn)確地反映出考生的被測(cè)試語(yǔ)言能力和水平。而且用不可靠的成績(jī)來(lái)決定,就會(huì)不可避免地造成一些失誤甚至是不可彌補(bǔ)的損失。影響信度的因素有:v (1)試卷編制。信度側(cè)重的是測(cè)試內(nèi)容的覆蓋面是否大,是否具有代表性,項(xiàng)目是否均勻。采樣越多,測(cè)試的信度越高。郝利群認(rèn)為,一套試卷無(wú)論是常模參照考試(norm-referenced),還是標(biāo)準(zhǔn)參照考試(criterion-referenced),長(zhǎng)的要比短的更具可靠性。測(cè)試必須包含各種類

33、型內(nèi)容的試題。一種測(cè)試必須涵蓋本專業(yè)領(lǐng)域內(nèi)盡可能多的內(nèi)容,而且試題必須有一定的難度。測(cè)試提出的任務(wù)必須具有標(biāo)準(zhǔn)性。在試題庫(kù)中任意挑出的試題在難度、類型、形式上都必須基本一致。事實(shí)上,只要試卷中所使用的試題具有測(cè)試某種能力的代表性,這種試題越多,試卷對(duì)某種能力的反映就越充分和越可靠。因此越是重要的考試,題量越要充分。當(dāng)然,題量也不能過(guò)大,否則考生的疲勞和厭倦就會(huì)影響考試的信度。v(2)測(cè)試的執(zhí)行。主要是涉及考試環(huán)境、試卷安排、時(shí)間分配、題意說(shuō)明、考試方式、答題方式、評(píng)分標(biāo)準(zhǔn)等是否所有的考生對(duì)試題的要求都很清楚。是否相同的測(cè)試是在不同的受試對(duì)象之間,不同的條件下及不同的時(shí)間內(nèi)進(jìn)行的,這是決定信度的

34、一個(gè)重要因素。如在一次聽(tīng)力測(cè)試中,一組考生所聽(tīng)到的錄音效果好另一組考生聽(tīng)到的錄音效果差,那么,這次聽(tīng)力測(cè)試就無(wú)信度可言。試題說(shuō)明在考生的答題中起著舉足輕重的作用。如果考生對(duì)題目要求的理解程度和他們對(duì)所要完成任務(wù)的清楚程度很高他們就會(huì)積極地投人考試中去。相反,含糊不清的試題說(shuō)明會(huì)直接影響考生的答題,降低測(cè)試結(jié)果的信度。所以試題說(shuō)明一定要做到簡(jiǎn)潔、準(zhǔn)確、明了,試題說(shuō)明所使用的語(yǔ)言應(yīng)簡(jiǎn)單清楚,避免考生不熟悉的術(shù)語(yǔ)出現(xiàn)。v(3)個(gè)人因素。受試者的個(gè)體因素如動(dòng)機(jī)、情感、心理狀況、身體條件會(huì)對(duì)測(cè)試信度有很大的影響。這些因素包括考生考試前和考試中的心理或生理方面的波動(dòng)或變化,如疾病、疲勞、缺乏考試動(dòng)力、情緒

35、波動(dòng)等。這些因素會(huì)影響考生的正常發(fā)揮,從而降低測(cè)試結(jié)果的可靠性。盡管這些因素是不可預(yù)測(cè)的、也常常因一些意外而無(wú)法控制,但教師們也要有所作為,要設(shè)法將這些因素的影響降到最低點(diǎn)。同時(shí)閱卷員的評(píng)分也是影響信度的一個(gè)重要因素??陀^試題的評(píng)分基本沒(méi)有問(wèn)題,信度較高,關(guān)鍵是對(duì)主觀試題評(píng)分標(biāo)準(zhǔn)的把握。為減少評(píng)閱的誤差首先要制定詳細(xì)的評(píng)分標(biāo)準(zhǔn),而且所有的閱卷人應(yīng)統(tǒng)一進(jìn)行培訓(xùn),讓大家選用一些例卷共同進(jìn)行打分練習(xí)和討論,從而給出相近的分?jǐn)?shù),使語(yǔ)言測(cè)試充分體現(xiàn)公平公正。 v常通過(guò)以下方法來(lái)測(cè)定考試信度:v(1)重復(fù)測(cè)試法,即通過(guò)對(duì)同一組學(xué)生重復(fù)使用同一份試卷來(lái)確定試卷的信度。v(2)平行卷測(cè)試法,即通過(guò)A、B卷的形

36、式來(lái)分析試卷的信度。v(3)對(duì)半分析法,也叫內(nèi)部一致性法(internal consistency)把一份試卷看作為兩個(gè)相對(duì)獨(dú)立且相應(yīng)的部分,通過(guò)對(duì)這兩部分分?jǐn)?shù)的比較以獲得整份試卷的信度。3、語(yǔ)言測(cè)試的真實(shí)性vBachman &Palmer(1996):真實(shí)性指某一語(yǔ)言測(cè)試任務(wù)與實(shí)際語(yǔ)言運(yùn)用任務(wù)在特征方面的對(duì)應(yīng)程度。任務(wù)特征包括觀察類(形式)特征(即方式、內(nèi)容、情景等)和非觀察類(性質(zhì))特征(即語(yǔ)言運(yùn)用性質(zhì)、語(yǔ)言能力等)。其對(duì)應(yīng)程度可指形式上的也可指性質(zhì)上的對(duì)應(yīng)。v當(dāng)今語(yǔ)言測(cè)試界在考試真實(shí)性方面的兩大派別:v1、現(xiàn)實(shí)生活法(real-life approach): 通過(guò)設(shè)計(jì)能復(fù)制具體語(yǔ)

37、言使用環(huán)境的考試來(lái)達(dá)到真實(shí)性。主要有3個(gè)側(cè)重點(diǎn):1) 考試的表面效度;2) 考試的預(yù)測(cè)效度;3)考試的內(nèi)容效度。此派在口語(yǔ)測(cè)試領(lǐng)域里獨(dú)領(lǐng)風(fēng)騷。v2、交際/能力法(interactional/ability approach): 強(qiáng)調(diào)交際語(yǔ)言運(yùn)用過(guò)程中的顯著特征,如“語(yǔ)言使用者、情景與語(yǔ)篇之間的相互作用”,而不是某一個(gè)具體的語(yǔ)言運(yùn)用行為。其主要側(cè)重的是語(yǔ)言能力或能力結(jié)構(gòu),也就會(huì)結(jié)構(gòu)效度。4、語(yǔ)言測(cè)試的互動(dòng)性v互動(dòng)性(交互性)指在考試所設(shè)計(jì)的任務(wù)中學(xué)生的參與程度。試比較兩種考試的互動(dòng)性:v考試1:50道多項(xiàng)選擇題,其中25道語(yǔ)法題,25道詞匯題。v考試2:口試,采取小組討論的形式,題目是The I

38、mpact of TV Ads on Teenagers。5、語(yǔ)言測(cè)試的沖擊力v一般來(lái)講,教學(xué)目標(biāo)決定語(yǔ)言測(cè)試目標(biāo)。因此語(yǔ)言測(cè)試目標(biāo)必須為實(shí)現(xiàn)語(yǔ)言教學(xué)目標(biāo)服務(wù)。然而,語(yǔ)言教學(xué)與語(yǔ)言測(cè)試的發(fā)展并非總是同步的。語(yǔ)言測(cè)試體系一經(jīng)確定,它就具有一定時(shí)限的相對(duì)穩(wěn)定性,對(duì)語(yǔ)言教學(xué)產(chǎn)生積極或消極的反撥作用。v語(yǔ)言測(cè)試目標(biāo)對(duì)語(yǔ)言教學(xué)目標(biāo)的反撥作用極其重要:如果語(yǔ)言測(cè)試目標(biāo)科學(xué)、準(zhǔn)確、就能夠科學(xué)有效地檢測(cè)教學(xué)目標(biāo)并積極地促進(jìn)教學(xué)目標(biāo)的實(shí)現(xiàn)或進(jìn)一步修正。反之就不能科學(xué)檢測(cè)教學(xué)目標(biāo),同時(shí)阻礙后續(xù)教學(xué)目標(biāo)的確定與實(shí)現(xiàn)。v從理論上看,教學(xué)先于測(cè)試。教什么內(nèi)容就檢測(cè)什么內(nèi)容。這是一種理想的教學(xué)和測(cè)試的關(guān)系。然而,在具體的

39、教學(xué)與測(cè)試實(shí)踐中往往是要考什么然后才教什么。這種語(yǔ)言測(cè)試與語(yǔ)言教學(xué)的邏輯倒置,我們可以看作是語(yǔ)言測(cè)試內(nèi)容對(duì)語(yǔ)言教學(xué)內(nèi)容的反撥作用。v語(yǔ)言測(cè)試方法對(duì)語(yǔ)言教學(xué)方法也會(huì)產(chǎn)生重要的反撥作用。比如科學(xué)的考卷應(yīng)采取多種題型,主客觀試題相結(jié)合的方法。科學(xué)的語(yǔ)言測(cè)試對(duì)語(yǔ)言教學(xué)的各方面都應(yīng)起著正面的引導(dǎo)作用。 v歸納起來(lái),考試的沖擊力作用直接影響兩個(gè)方面,即教和學(xué)。教指的是教師或?qū)W校,包括教學(xué)方法、課程設(shè)置、教學(xué)內(nèi)容、課程評(píng)估等;學(xué)指的是學(xué)生,包括學(xué)習(xí)方法、學(xué)習(xí)動(dòng)機(jī)等。6、語(yǔ)言測(cè)試的可行性v可行性即可操作性,與前面5點(diǎn)相比,可行性是指制約施考過(guò)程的因素,而前面5點(diǎn)主要指考試質(zhì)量或結(jié)果的使用。v制約施考過(guò)程的因素

40、有:資源、人力、時(shí)間。資源因素指考試場(chǎng)地、設(shè)備、閱卷設(shè)施等;人力因素指考官、監(jiān)考人員、閱卷人員等;時(shí)間因素是實(shí)際考試可用時(shí)間。v這要求試題設(shè)計(jì)者和考務(wù)人員做到以下幾點(diǎn):v(1)試題的題目要求要清楚易懂,試題要設(shè)計(jì)得一目了,然無(wú)深?yuàn)W難懂的術(shù)語(yǔ),最好在試題要求下給出相應(yīng)例子,試題要求無(wú)需監(jiān)考人員作口頭解釋。v(2)試卷必須整齊、干凈,盡量避免出現(xiàn)拼寫、打印等技術(shù)錯(cuò)誤。v(3)考試輔助設(shè)備必須正常。如無(wú)線聽(tīng)力系統(tǒng)、錄音機(jī)、計(jì)算機(jī)工作必須正常穩(wěn)定,考場(chǎng)座位必須具有舒適度,遠(yuǎn)離外界干擾。v(4)答題紙的使用。答題紙大小和編排要與相應(yīng)的題量相一致,滿足考生準(zhǔn)確地書寫答案。同時(shí)它也必須能使教師清楚地看清答卷

41、,以增加閱卷的準(zhǔn)確性和閱卷速度。 結(jié)束語(yǔ)及思考v語(yǔ)言測(cè)試應(yīng)符合國(guó)際形勢(shì)與新時(shí)代經(jīng)濟(jì)發(fā)展的需要,還應(yīng)與專業(yè)設(shè)置、課程建設(shè)、教學(xué)過(guò)程與方法等緊密結(jié)合,應(yīng)借鑒國(guó)際通行的評(píng)價(jià)體系,創(chuàng)新課堂教學(xué)模式,重視靈活教學(xué),設(shè)計(jì)以學(xué)生為主體、學(xué)習(xí)和創(chuàng)造為核心的教學(xué)方法,大力提倡和運(yùn)用各種現(xiàn)代手段,以科學(xué)靈活的考試培養(yǎng)學(xué)生的自主意識(shí)、創(chuàng)新精神和創(chuàng)造能力。然而在語(yǔ)言測(cè)試的具體實(shí)施過(guò)程中,由于受使用目的的影響,往往會(huì)出現(xiàn)一些偏差比如語(yǔ)言測(cè)試純粹為鑒別語(yǔ)言水平等級(jí)為目的、純粹作為高一級(jí)學(xué)校錄取新生或用人單位錄用人才的尺度等。這樣,在理論上加劇了語(yǔ)言測(cè)試的信度和效度之間的矛盾,狹隘了語(yǔ)言測(cè)試的內(nèi)涵;在實(shí)踐中,受試者或?qū)W生常

42、常感到教學(xué)、學(xué)習(xí)同測(cè)試脫節(jié),提高語(yǔ)言技能同測(cè)試脫節(jié)。筆者在個(gè)人研究的基礎(chǔ)上,對(duì)語(yǔ)言測(cè)試設(shè)計(jì)的原則與實(shí)踐作一個(gè)理論上的探討,以便更清楚地認(rèn)識(shí)語(yǔ)言測(cè)試本質(zhì),避免被語(yǔ)言測(cè)試的一些意義模糊了概念,更有效地把語(yǔ)言測(cè)試同教學(xué)、素質(zhì)教育結(jié)合起來(lái),最大限度地克服測(cè)試的負(fù)面反撥效應(yīng)。 v思考:v1、就測(cè)試效度和信度的關(guān)系,有人說(shuō)測(cè)試效度是首要的,也有人說(shuō)測(cè)試信度是首要的。試分析二種說(shuō)法的立足點(diǎn)并談?wù)勀銈€(gè)人如何看待二者的關(guān)系。v2、舉一個(gè)身邊的例子來(lái)說(shuō)明考試對(duì)教學(xué)的沖擊力。v3、從表面效度、真實(shí)性和交互性3個(gè)角度討論下面的考試題目或任務(wù)。v例1 根據(jù)中文提示,將對(duì)話中缺少的部分寫在線上。全句必須符合英語(yǔ)表達(dá)習(xí)慣。

43、(提示:澳大利亞商人Williams先生在外貿(mào)博覽會(huì)上看到某廠生產(chǎn)的臺(tái)燈,有意購(gòu)買。他找到金廠長(zhǎng),談了他的意向,并請(qǐng)金廠長(zhǎng)詳細(xì)介紹產(chǎn)品。金廠長(zhǎng)告訴他,工廠年產(chǎn)20萬(wàn)臺(tái)燈,一半以上銷往亞洲國(guó)家。Williams先生詢問(wèn)了價(jià)格。金廠長(zhǎng)告訴他每臺(tái)是15美元。Williams先生表示這價(jià)格可以接受,接著問(wèn)他是否只有一種型號(hào)。金廠長(zhǎng)說(shuō),有好幾種型號(hào),如果Williams先生感興趣,可以帶他去廠里看看。)Mr. Williams: Mr. Jin, I have seen your table lamps at the Foreign Trade Fair. I wish to order some fo

44、r the Australian market. _?Mr. Jin: Id be glad to. As a matter of fact, we have been thinking of selling our lamps to Australia a well, _. About half of them are sold to countries in Asia.Mr. Williams: _?Mr. Jin: 15 US dollars each.Mr. Williams: _. And is this the only model you produce?Mr. Jin: No.

45、 We have several others. If you are interested, _.Mr. Williams: That would be fine.例2 辨認(rèn)錯(cuò)誤在下列各句的劃線部分A、B、C、D中各有一個(gè)錯(cuò)誤,指出這一錯(cuò)誤。1. Three weeks ago, I went to my uncle; my aunt told me that he had left for A B CSingapore on a lecture. D2. She looks very young, but is twice as older as my twenty-year-old si

46、ster. A B C D3. There is a lot of noise in big cities, but it isnt much in the countryside. A B C D4. Though my neighbor has the great number of science books, he never A B C reads any of them. D例3 某公司要招聘英語(yǔ)打字員,應(yīng)聘考試中的一項(xiàng)內(nèi)容是在規(guī)定的時(shí)間里打出一定字?jǐn)?shù)的文章。第五節(jié) 英語(yǔ)測(cè)試的真實(shí)性問(wèn)題vBachman: 真實(shí)地反映語(yǔ)言測(cè)試中語(yǔ)言使用的本質(zhì)。vWood:語(yǔ)言測(cè)試中的兩個(gè)主要問(wèn)題,信

47、度和效度,可以歸結(jié)為一個(gè)更為重要的問(wèn)題,即真實(shí)與不真實(shí)。vPalmer:真實(shí)性是語(yǔ)言測(cè)試中的一個(gè)重要特征,是語(yǔ)言測(cè)試開(kāi)發(fā)者在設(shè)計(jì)測(cè)試時(shí)需要認(rèn)真考慮的問(wèn)題。vDouglas:真實(shí)性是區(qū)分特定目標(biāo)語(yǔ)言測(cè)試和一般目標(biāo)語(yǔ)言測(cè)試的兩個(gè)特征之一(另一個(gè)特征是語(yǔ)言知識(shí)和特定目標(biāo)內(nèi)容知識(shí)的互動(dòng))。一、對(duì)于真實(shí)性的早期認(rèn)識(shí)v20世紀(jì)60年代中期。一些學(xué)者,比如Close和Broughton,認(rèn)為,語(yǔ)言學(xué)習(xí)者所接觸的文本并不能代表他們所學(xué)的目標(biāo)語(yǔ)。這個(gè)時(shí)期,研究者關(guān)注測(cè)試文本,認(rèn)為真實(shí)性是指測(cè)試的文本應(yīng)該是從真實(shí)情景中提取出來(lái)而未被改動(dòng)的原始文本,而不是為了教學(xué)目的而設(shè)置或改編的文本。v問(wèn)題:1、把真實(shí)性等同于未

48、作任何改寫或簡(jiǎn)化處理的文本,產(chǎn)生了“真實(shí)-非真實(shí)”的二分法觀點(diǎn)。2、每個(gè)文本都有自己特定的語(yǔ)境,原封不動(dòng)地提取源文本用于測(cè)試,雖保證了源文本的完整性,但會(huì)使測(cè)試失去真實(shí)性。v困境:因?yàn)樗菑恼鎸?shí)世界中提取出來(lái)的,而認(rèn)為它是真實(shí)的,還是因?yàn)樗撾x了源語(yǔ)境被用于測(cè)試,而認(rèn)為它是非真實(shí)的。v70年代末期,Widdowson提出兩個(gè)概念即“翔實(shí)性”(genuineness)和“真實(shí)性”(authenticity)。翔實(shí)性是語(yǔ)篇自身的特征,是個(gè)絕對(duì)的概念。真實(shí)性是語(yǔ)篇與讀者之間關(guān)系的特征,與恰當(dāng)?shù)淖龃鹩嘘P(guān)。因此,翔實(shí)的文本只有在經(jīng)過(guò)真實(shí)化(authentication)過(guò)程之后,才算具有真實(shí)性,這個(gè)過(guò)程

49、可能只有通過(guò)本族語(yǔ)者才能實(shí)現(xiàn)。二二 真實(shí)性的概念化(真實(shí)性的概念化(Conceptualization of authenticity) vBachman:真實(shí)生活觀(real-life approach)和交互能力觀(interactional - ability approach)。v(一)真實(shí)生活觀(一)真實(shí)生活觀v概念:語(yǔ)言水平是在非測(cè)試環(huán)境中完成語(yǔ)言任務(wù)的能力,而真實(shí)性就是測(cè)試任務(wù)重現(xiàn)真實(shí)生活語(yǔ)言使用任務(wù)的程度。這種觀點(diǎn)為把語(yǔ)言測(cè)試分為“直接測(cè)試”和“間接測(cè)試”奠定了基礎(chǔ)。v原則:1、把語(yǔ)言水平看做是語(yǔ)用能力;2、把真實(shí)生活行為作為真實(shí)性的標(biāo)準(zhǔn);3、表面效度上給人一種感性的真實(shí);預(yù)測(cè)

50、效度上預(yù)測(cè)考生在非測(cè)試情景中語(yǔ)言使用行為;內(nèi)容相關(guān)性和覆蓋性上測(cè)試的內(nèi)容和過(guò)程與真實(shí)生活中的語(yǔ)言使用相對(duì)應(yīng)。v20世紀(jì)80年代,真實(shí)生活觀在語(yǔ)言測(cè)試中,尤其是外語(yǔ)口語(yǔ)測(cè)試中,占據(jù)著主導(dǎo)地位。v缺點(diǎn):1、停留在輸入層面,缺乏對(duì)考生處理這些輸入的過(guò)程關(guān)注。在測(cè)試中真正關(guān)心的不是考生在某一特定時(shí)間、特定場(chǎng)合完成特定測(cè)試任務(wù)的行為,而是這一行為在多大程度上反映了考生的語(yǔ)言能力。2、真實(shí)生活或非測(cè)試情景中的任務(wù)和行為難以被絕對(duì)而完全地復(fù)制到測(cè)試情景中。vBachman:這種觀點(diǎn)存在兩個(gè)問(wèn)題:一是沒(méi)有把語(yǔ)言能力和語(yǔ)言行為區(qū)分開(kāi)。二是真實(shí)生活觀未能給效度提供一個(gè)充分的基礎(chǔ),即表面效度、預(yù)測(cè)效度、內(nèi)容相關(guān)性和

51、覆蓋性并不能完全說(shuō)明某項(xiàng)測(cè)試效度的高低。v(二)交互能力觀(二)交互能力觀v概念:真實(shí)性存在于考生、考試任務(wù)與考試情景之間的相互作用中?;?dòng)程度愈強(qiáng),試題的真實(shí)性程度就越高。交互能力觀注重的是結(jié)構(gòu)效度。vWiddowson:不應(yīng)當(dāng)把真實(shí)性當(dāng)作語(yǔ)言運(yùn)用實(shí)例本身所具備的特征,而應(yīng)該把它當(dāng)作由語(yǔ)言使用者反饋所產(chǎn)生的、附加在語(yǔ)言運(yùn)用實(shí)例上的特征。也就是說(shuō),語(yǔ)言素材是否有真實(shí)性不是由其來(lái)源或特點(diǎn)所決定的,而是要看它能否在作者與讀者之間產(chǎn)生共鳴和交流。真實(shí)性是篇章和讀者之間的關(guān)系特征,并與讀者的恰當(dāng)反應(yīng)有關(guān)。因此,描述真實(shí)性時(shí)必須注重交際語(yǔ)言使用的關(guān)鍵特征,而不是去獲取整個(gè)語(yǔ)言使用情景。而且這一理論描述不

52、僅要包括語(yǔ)境特征還要包括語(yǔ)言使用者的交際語(yǔ)言能力。v特點(diǎn):1、強(qiáng)調(diào)交際語(yǔ)言使用的區(qū)別性特征,即語(yǔ)言使用者、語(yǔ)境、語(yǔ)篇之間的交互作用。2、強(qiáng)調(diào)除了要考慮語(yǔ)境特征,還要考慮考生的交際語(yǔ)言能力。(3)強(qiáng)調(diào)真實(shí)性語(yǔ)言測(cè)試的開(kāi)發(fā)要基于一個(gè)包括考生語(yǔ)言能力和測(cè)試情景特征的框架。三三 真實(shí)性的框架化(真實(shí)性的框架化(Framing of authenticity)vBachman的兩種真實(shí)性:情景真實(shí)性(situational authenticity)和交際真實(shí)性(interactional authenticity)。前者指測(cè)試任務(wù)特征與目標(biāo)語(yǔ)使用任務(wù)特征的對(duì)應(yīng),后者指考生與測(cè)試任務(wù)之間的互動(dòng)。vBac

53、hman和Palmer把真實(shí)性定義為“特定測(cè)試任務(wù)的特征與目標(biāo)語(yǔ)使用任務(wù)特征的一致性程度?!?他們還提出了一個(gè)任務(wù)特征框架,這個(gè)框架包括測(cè)試安排(test setting)、測(cè)試說(shuō)明(test rubrics)、輸入(input)、期待做答(expected response)以及輸入和期待做答的關(guān)系(relationship between input and response),為匹配目標(biāo)語(yǔ)使用任務(wù)特征和測(cè)試任務(wù)特征提供了一個(gè)系統(tǒng)的方法。既然特征的一致性是真實(shí)性的關(guān)鍵,那么,只要使測(cè)試任務(wù)盡可能具有目標(biāo)語(yǔ)使用任務(wù)的特征,該測(cè)試就具有較高的真實(shí)性。vDouglas:情景真實(shí)性和交互性是真實(shí)性

54、的兩個(gè)方面,在特定目的語(yǔ)言測(cè)試中這兩方面都需要具備。vLewkowicz:真實(shí)性一部分決定于測(cè)試任務(wù)與目標(biāo)語(yǔ)使用任務(wù)互動(dòng)的對(duì)應(yīng)關(guān)系,而把真實(shí)性和交互性分割來(lái)看待是有失偏頗的。四四 真實(shí)性的繼續(xù)發(fā)展(真實(shí)性的繼續(xù)發(fā)展(Step forward)vSpence Brown:真實(shí)性的四個(gè)方面:1、測(cè)試任務(wù)的真實(shí)性;2、考生與測(cè)試任務(wù)之間互動(dòng)的真實(shí)性;3、考生與其他參與者之間互動(dòng)的真實(shí)性;4、評(píng)分過(guò)程及其標(biāo)準(zhǔn)的真實(shí)性。v(一)考生與其他參與者之間互動(dòng)的真實(shí)性(一)考生與其他參與者之間互動(dòng)的真實(shí)性vMcNamara:要對(duì)測(cè)試中互動(dòng)的社會(huì)維度特性加以重視,包括考生、測(cè)試者以及其他參與者之間的互動(dòng)。對(duì)互動(dòng)的

55、研究表明,交際中的話語(yǔ)是交際雙方共建的,是所有交際方共同參與的結(jié)果。許多有關(guān)口語(yǔ)測(cè)試的實(shí)驗(yàn)已證明其他的參與者(如搭檔或考官)的表現(xiàn)能夠極大地影響考生的語(yǔ)言行為。v(二)評(píng)分過(guò)程及其標(biāo)準(zhǔn)的真實(shí)性(二)評(píng)分過(guò)程及其標(biāo)準(zhǔn)的真實(shí)性v評(píng)分的真實(shí)性主要指兩個(gè)方面:評(píng)分標(biāo)準(zhǔn)和評(píng)分過(guò)程。v產(chǎn)出性測(cè)試的評(píng)分標(biāo)準(zhǔn)問(wèn)題:Bachman和Palmer建議對(duì)答案的正確性使用多維標(biāo)準(zhǔn),提倡對(duì)部分正確的做答給予一定的分?jǐn)?shù)。在確定評(píng)分標(biāo)準(zhǔn)時(shí)要考慮到目標(biāo)語(yǔ)使用域和測(cè)試目的,如:在分班測(cè)試中,語(yǔ)法正確性被認(rèn)為是最重要的因素,而在職業(yè)目標(biāo)測(cè)試中,適切性和是否完成任務(wù)會(huì)更好地反映目標(biāo)語(yǔ)使用的要求。vBachman:不存在普遍適用的評(píng)

56、分標(biāo)準(zhǔn)。如果說(shuō)一個(gè)測(cè)試是真實(shí)的,就要在“對(duì)誰(shuí)來(lái)說(shuō)、在誰(shuí)看來(lái)、在什么時(shí)間、什么地點(diǎn)、什么目的、什么水平層次等方面”說(shuō)明其真實(shí)性。Spence Brown:讓目標(biāo)語(yǔ)使用域的專家(非語(yǔ)言教師或語(yǔ)言學(xué)家)參與到測(cè)試開(kāi)發(fā)過(guò)程中。v聶建中:在探討英語(yǔ)產(chǎn)出性測(cè)試評(píng)分標(biāo)準(zhǔn)的真實(shí)性時(shí),應(yīng)注意區(qū)分下面兩個(gè)概念:語(yǔ)言展示(language一displaying)和語(yǔ)言運(yùn)用(language一applying)。v評(píng)分標(biāo)準(zhǔn)如果從語(yǔ)言展示的角度出發(fā),主要考察的就是學(xué)生的產(chǎn)出性做答中詞匯、語(yǔ)法、句法、段落組織、長(zhǎng)度等方面。v根據(jù)交際語(yǔ)言測(cè)試的要求,真實(shí)性評(píng)分應(yīng)該側(cè)重學(xué)生的語(yǔ)言運(yùn)用能力,也就是側(cè)重考查學(xué)生做答的社會(huì)得體性、

57、可理解性、是否完成任務(wù)等方面。vSpence-Brown通過(guò)研究澳大利亞高中入學(xué)日語(yǔ)口語(yǔ)面試發(fā)現(xiàn):日本學(xué)生的分?jǐn)?shù)都比較低,他們用“是”、“不是”、單詞或短語(yǔ)回答所有問(wèn)題,因此沒(méi)有很好地展示他們的語(yǔ)言能力,也就不會(huì)獲得高分,而學(xué)習(xí)日語(yǔ)的澳大利亞學(xué)生的回答都比較詳細(xì),甚至有些做作,然而卻充分展示了他們的語(yǔ)言能力,因此分?jǐn)?shù)都比較高。日本學(xué)生的回答在現(xiàn)實(shí)生活的語(yǔ)言使用中顯得更為簡(jiǎn)練得體,但沒(méi)有對(duì)應(yīng)測(cè)試情景的要求,而澳大利亞學(xué)生大多在面試前做了充分準(zhǔn)備,事先練習(xí)了大量的面試句型和可能被問(wèn)到的問(wèn)題。由此面試分?jǐn)?shù)來(lái)看,在實(shí)際的評(píng)分中測(cè)試者看重的是考生是否充分展示出他們的語(yǔ)言能力,而并不是真正意義上的語(yǔ)言使用

58、。從這個(gè)意義上來(lái)說(shuō),語(yǔ)言測(cè)試中的問(wèn)題并不算是真實(shí)性的問(wèn)題。因此在產(chǎn)出性測(cè)試評(píng)分中,如何在語(yǔ)言展示標(biāo)準(zhǔn)的基礎(chǔ)上融入真實(shí)性標(biāo)準(zhǔn),從而使測(cè)試的評(píng)分環(huán)節(jié)更加符合交際性測(cè)試的要求,是今后語(yǔ)言測(cè)試評(píng)分環(huán)節(jié)中有待解決的問(wèn)題。 五五 結(jié)束語(yǔ)及思考結(jié)束語(yǔ)及思考v語(yǔ)言測(cè)試的真實(shí)性是個(gè)復(fù)雜的問(wèn)題,雖然學(xué)者們對(duì)真實(shí)性的理論構(gòu)成及其在測(cè)試實(shí)踐中的實(shí)現(xiàn)方式的看法不盡相同,但對(duì)真實(shí)性在語(yǔ)言測(cè)試中的重要性問(wèn)題上已經(jīng)達(dá)成共識(shí)。v但在真實(shí)性涉及的因素、真實(shí)性的本質(zhì)、真實(shí)性對(duì)于測(cè)試實(shí)踐的影響等許多方面尚無(wú)定論。v在實(shí)踐中,真實(shí)性原則體現(xiàn)在整個(gè)語(yǔ)言測(cè)試的各個(gè)環(huán)節(jié)中,包括測(cè)試設(shè)計(jì)、文本、題型、題目、實(shí)施、評(píng)分以及分?jǐn)?shù)釋義等各個(gè)方面,要

59、達(dá)到真實(shí)性的要求、就要從測(cè)試的各個(gè)環(huán)節(jié)確保其真實(shí)性。v思考:v1、說(shuō)說(shuō)你對(duì)測(cè)試真實(shí)性的理解。v2、選一套或一部分你曾經(jīng)測(cè)試過(guò)的試題,研究其真實(shí)性。第六節(jié) 測(cè)試的功能和類型v一、測(cè)試的功能一、測(cè)試的功能v(一)教學(xué)功能(一)教學(xué)功能v教師是測(cè)試試使用者的一部分,其他有關(guān)使用者包括學(xué)生本人、家長(zhǎng)、教育教師是測(cè)試試使用者的一部分,其他有關(guān)使用者包括學(xué)生本人、家長(zhǎng)、教育管理部門。管理部門。v測(cè)試的教學(xué)功能主要體現(xiàn)在測(cè)試信息的反饋與使用上。對(duì)學(xué)生而言,測(cè)試反測(cè)試的教學(xué)功能主要體現(xiàn)在測(cè)試信息的反饋與使用上。對(duì)學(xué)生而言,測(cè)試反饋的信息在一定程度上反映學(xué)習(xí)上的進(jìn)展和存在的問(wèn)題;對(duì)于家長(zhǎng)而言,考饋的信息在一定程

60、度上反映學(xué)習(xí)上的進(jìn)展和存在的問(wèn)題;對(duì)于家長(zhǎng)而言,考試反饋的信息是他們了解自己子女學(xué)業(yè)進(jìn)展的主要途徑之一;對(duì)于教育管理試反饋的信息是他們了解自己子女學(xué)業(yè)進(jìn)展的主要途徑之一;對(duì)于教育管理部門,考試反饋信息可以作為評(píng)估教學(xué)或課程設(shè)置的一部分。部門,考試反饋信息可以作為評(píng)估教學(xué)或課程設(shè)置的一部分。v(二)科研功能(二)科研功能v在應(yīng)用語(yǔ)言學(xué)領(lǐng)域,測(cè)試作為一種具體的測(cè)量形式有其潛在的重要價(jià)值。在應(yīng)用語(yǔ)言學(xué)領(lǐng)域,測(cè)試作為一種具體的測(cè)量形式有其潛在的重要價(jià)值。vBachman: 語(yǔ)言測(cè)試可以用在語(yǔ)言能力性質(zhì)語(yǔ)言測(cè)試可以用在語(yǔ)言能力性質(zhì)(nature of language proficiency)、語(yǔ)言處理、語(yǔ)言處理(la

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論