從試題分析談?dòng)行Ы虒W(xué)策略_第1頁(yè)
從試題分析談?dòng)行Ы虒W(xué)策略_第2頁(yè)
從試題分析談?dòng)行Ы虒W(xué)策略_第3頁(yè)
從試題分析談?dòng)行Ы虒W(xué)策略_第4頁(yè)
從試題分析談?dòng)行Ы虒W(xué)策略_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、PAGE PAGE 19從試題分析談?dòng)行Ы虒W(xué)策略 左太政/國(guó)立高雄師範(fàn)大學(xué)數(shù)學(xué)系一、九年一貫課程數(shù)學(xué)學(xué)習(xí)領(lǐng)域之教學(xué)評(píng)量的要求:1、評(píng)量量是檢驗(yàn)驗(yàn)教學(xué)效效果的過(guò)過(guò)程,教教師應(yīng)透透過(guò)各種種評(píng)量方方式,來(lái)來(lái)改善自自己的教教學(xué)。2、教學(xué)學(xué)評(píng)量宜宜同時(shí)關(guān)關(guān)照到學(xué)學(xué)習(xí)成就就與學(xué)習(xí)習(xí)歷程,分析學(xué)學(xué)生是否否能達(dá)到到能力指指標(biāo)的要要求。3、根據(jù)據(jù)學(xué)生個(gè)個(gè)人的評(píng)評(píng)量結(jié)果果,教師師可以理理解學(xué)生生既有的的知識(shí)與與經(jīng)驗(yàn),也可以以從學(xué)生生發(fā)生的的錯(cuò)誤,回溯其其學(xué)習(xí)上上的問(wèn)題題並加以以輔導(dǎo)修修正。4、評(píng)量量時(shí),應(yīng)應(yīng)注意評(píng)評(píng)量時(shí)機(jī)機(jī)的選擇擇,避免免對(duì)評(píng)量量結(jié)果作作錯(cuò)誤或或不當(dāng)解解讀。5、評(píng)量量時(shí),應(yīng)應(yīng)配合評(píng)評(píng)量的目目的,讓

2、讓問(wèn)題能能恰當(dāng)反反應(yīng)學(xué)生生的學(xué)習(xí)習(xí)狀態(tài),並讓所所有的評(píng)評(píng)量題型型,發(fā)揮揮該題型型的特長(zhǎng)長(zhǎng)。二、測(cè)驗(yàn)驗(yàn)理論測(cè)驗(yàn)理論論是一種種解釋測(cè)測(cè)驗(yàn)資料料間實(shí)證證關(guān)係的的有系統(tǒng)統(tǒng)的理論論學(xué)說(shuō),通常劃劃分成二二大學(xué)派派:一為為古典測(cè)測(cè)驗(yàn)理論論主要使使以真實(shí)實(shí)分模式式數(shù)為骨骨幹;另另一為當(dāng)當(dāng)代測(cè)驗(yàn)驗(yàn)理論主要是是以試題題反應(yīng)理理論為架架構(gòu)。(一)古古典測(cè)驗(yàn)驗(yàn)理論古典測(cè)驗(yàn)驗(yàn)理論(claassiicall teest theeoryy,簡(jiǎn)稱CTTT)稱為古典真真分?jǐn)?shù)理理論,其內(nèi)涵涵主要是是以真實(shí)實(shí)分?jǐn)?shù)模模式為其其理論架架構(gòu),其其中X為為觀察分分?jǐn)?shù),是受試試者在測(cè)測(cè)驗(yàn)中所所得到的的分?jǐn)?shù);T為真真實(shí)分?jǐn)?shù)數(shù),是受試試者接受受

3、測(cè)驗(yàn)無(wú)無(wú)數(shù)次之之得分的的平均數(shù)數(shù)或期望望值,並並無(wú)法正正確的被被測(cè)量到到;E為為誤差分分?jǐn)?shù),指的是是測(cè)量的的誤差,也就是是受試者者觀察分分?jǐn)?shù)和真真實(shí)分?jǐn)?shù)數(shù)的差。由於CCTT是是依據(jù)弱弱勢(shì)假設(shè)設(shè)而來(lái),故又稱稱為弱弱真分?jǐn)?shù)數(shù)理論。古典測(cè)驗(yàn)驗(yàn)理論衍衍生出試試題分析析時(shí)的重重要指標(biāo)標(biāo),如難難易度(diffficcultty)、鑑別度度(diiscrrimiinattionn)和信信度(relliabbiliity)等。(二)試試題反應(yīng)應(yīng)理論古典測(cè)驗(yàn)驗(yàn)理論在在作試題題分析時(shí)時(shí)既有上上述諸多多缺點(diǎn),遂有試題反反應(yīng)理論論(iteem rrespponsse ttheoory,簡(jiǎn)稱 IRTT)誕生。IRTT

4、模式式其主要要是以個(gè)個(gè)別試題題的觀點(diǎn)點(diǎn),來(lái)解解釋測(cè)驗(yàn)驗(yàn)分?jǐn)?shù)的的涵意。它認(rèn)認(rèn)為學(xué)生生在某一一試題上上的表現(xiàn)現(xiàn)情形,與其背背後的某某種潛在在特質(zhì)(即能力力)之間具具有某種種關(guān)係存存在,該該關(guān)係可可以透過(guò)過(guò)一條連連續(xù)性遞遞增的數(shù)數(shù)學(xué)函數(shù)數(shù)來(lái)加以以表示和和詮釋,這個(gè)數(shù)數(shù)學(xué)函數(shù)數(shù)便稱作作試題題特徵曲曲線(iteem ccharractteriistiic ccurvve,簡(jiǎn)簡(jiǎn)稱 ICCC)。Tuckker是是第一位位使用試題特特徵曲線線一詞的的學(xué)者,其表示示此曲線線是將受受試者的的潛在能能力和實(shí)實(shí)際得分分情形聯(lián)聯(lián)結(jié)在一一起,受受試者的的測(cè)驗(yàn)成成績(jī)是由由一些看看不見的的潛在特特質(zhì)來(lái)決決定,經(jīng)經(jīng)由測(cè)驗(yàn)驗(yàn)試題

5、表表現(xiàn)出這這些特質(zhì)質(zhì),每個(gè)個(gè)受試者者在接受受測(cè)驗(yàn)後後,會(huì)有有不同的的潛力表表現(xiàn)出來(lái)來(lái),通常常用數(shù)值值來(lái)表達(dá)達(dá)不同受受試者潛潛在特質(zhì)質(zhì)上的相相對(duì)程度度,亦即即 IRTT 中受受試者的的能力參參數(shù)。IICC 能清楚楚扼要地地表示試試題參數(shù)數(shù)與能力力間的關(guān)關(guān)係變化化,藉由由模式求求出受試試者在試試題上的的表現(xiàn)與與對(duì)其能能力之估估計(jì)量的的關(guān)係。不同的的 ICCC 就代代表不同同的試題題參數(shù)與與能力間間的變化化關(guān)係,每一種種關(guān)係就就有其相相對(duì)應(yīng)的的一條 ICCC,亦即即每一種種試題反反應(yīng)模式式都是用用來(lái)描述述受試者者能力與與答對(duì)機(jī)機(jī)率間的的關(guān)係。常用的三三種IRRT模式式,每一一種模式式都依其其採(cǎi)用的的

6、試題參參數(shù)的數(shù)數(shù)目多寡寡來(lái)命名名,都僅僅適用於於二元化化的反應(yīng)應(yīng)資料(亦即,正確反反應(yīng)者登登錄為 1,錯(cuò)錯(cuò)誤反應(yīng)應(yīng)者為 0 的資料料)(余民民寧,119922):1.單參參數(shù)洛吉吉數(shù)模式式(onee-paarammeteer llogiistiic mmodeel)又稱 Rassch Moddel 其中:第第s位受試試者的能能力參數(shù)數(shù):表示能能力參數(shù)數(shù)為的受受試者,答對(duì)試試題或在在試題上上正確反反應(yīng)的機(jī)機(jī)率。:表示常常數(shù)為 1:試題難難易度的的參數(shù)根據(jù)公式式的定義義,試題題難易度參數(shù)數(shù)的位置置正好座座落在正正確反應(yīng)應(yīng)機(jī)率為為0.55時(shí)的能能力量尺尺(abiilitty sscalle)上的點(diǎn)點(diǎn)

7、;換言言之,當(dāng)當(dāng)?shù)陬}的的難易度度參數(shù)落落在試題題特徵曲曲線上答答對(duì)機(jī)率率為0.55的點(diǎn)時(shí)時(shí),試題題的難易易度參數(shù)數(shù)會(huì)等於於受試者者能力值值。愈困困難的試試題,其其試題特特徵曲線線愈是座座落在能能力量尺尺的右方方;反之之愈簡(jiǎn)單單的試題題,其試試題特徵徵曲線愈愈是座落落在能力力量尺的的左方。試題難難易度參數(shù)數(shù)有時(shí)又又叫做位位置參數(shù)數(shù)(lcccatiion parrameeterr)。單參參數(shù)的試試題特徵徵曲線如如圖2-1-11所示,一個(gè)參參數(shù)模式式認(rèn)為影影響受試試者正確確反應(yīng)的的機(jī)率大大小的試試題特徵徵,只有有試題難難易度,不不把試題題的鑑別別度和猜猜測(cè)度考考慮在內(nèi)內(nèi)。也就就是說(shuō),一個(gè)參數(shù)的的模式

8、是是假設(shè)所所有試題題的鑑別別度是相相等的,而且試試題的猜猜測(cè)度為為零。如如此多的的假設(shè),使得單單參數(shù)假假設(shè)的適適用性相相對(duì)的降降低。理理論上,難易度度值介於於之間,但實(shí)際際應(yīng)用上上,通常常只取之之間的範(fàn)範(fàn)圍。相相對(duì)於古古典測(cè)驗(yàn)驗(yàn)理論的的難易度度指數(shù),其所指指的是試試題真正正的難難度,不是古古典測(cè)驗(yàn)驗(yàn)理論所所指的易度度,而且且古典測(cè)測(cè)驗(yàn)理論論的難易易度指數(shù)數(shù)是一種種樣本依依賴(sammplee deepenndennt)的指標(biāo)標(biāo),其值值受到受受試者樣樣本的影影響很大大。圖1四四條典型型的單參參數(shù)試題題特徵曲曲線2.洛吉吉數(shù)雙參參模式(twoo-paarammeteer llogiistiic m

9、modeel) (2.11.7)其中:第第s 位受受試者的的能力參參數(shù):表示能能力參數(shù)數(shù)為 的受試試者s,答對(duì)對(duì)試題ii 或在在試題ii 上正正確反應(yīng)應(yīng)的機(jī)率率。:表示常常數(shù)為11:試題鑑鑑別度的的參數(shù):試題難難易度的的參數(shù)與單參數(shù)數(shù)模式相相比,雙雙參數(shù)模模式多了了一個(gè)參參數(shù):試試題鑑別別度通常常以表示示,是指指試題對(duì)對(duì)不同能能力的受受試者是是否能反反應(yīng)出其其答題的的差異,也就是是說(shuō)鑑別別度大的的試題,對(duì)於能能力高的的受試者者而言,其答對(duì)對(duì)率高;對(duì)能力力低的受受試者而而言,其其答對(duì)率率低。而而試題鑑鑑別度參參數(shù)的值值,剛好好與在點(diǎn)點(diǎn)的試題題特徵曲曲線的斜斜率(sloope)成某種種比例。試題特

10、特徵曲線線愈陡(steeepeer)的試題題比稍平平滑的試試題,具具有較大大的鑑別別度參數(shù)數(shù)值;換換句話說(shuō)說(shuō),鑑別別度愈大大的試題題,其區(qū)區(qū)別出不不同能力力水準(zhǔn)考考生的功功能愈好好,亦即即分辨的的效果愈愈好。理理論上,值的範(fàn)範(fàn)圍在之之間,我我們通常常捨棄負(fù)負(fù)的值不不用,因因?yàn)閹в杏胸?fù)值的的試題特特徵曲線線代表著著:能力力愈高的的考生答答對(duì)試題題的機(jī)率率愈低,這似乎乎與學(xué)理理相違背背,所以以負(fù)的值值不用。因此,在實(shí)際際應(yīng)用上上也不能能太大,其範(fàn)圍圍常介於於0到22之間。值愈大大,試題題特徵曲曲線愈陡陡,試題題愈具有有良好的的分辨能能力;反反之,值值愈小,代表試試題特徵徵曲線愈愈平坦,試題則則愈無(wú)

11、法法明顯的的分辨出出考生能能力的水水準(zhǔn)(余民寧寧,19992)。圖2四四條典型型的雙參參數(shù)試題題特徵曲曲線由圖2可可知:試試題2的曲線,其斜率率較小,亦即鑑鑑別度較較低,故故無(wú)法有有效分辨辨考生能能力。另另外,這這些曲線線的下限限值都是是零,亦亦即兩個(gè)個(gè)參數(shù)模模式未把把考生的的猜測(cè)度度因素考考慮在內(nèi)內(nèi),所以以本模式式適用於於自由反反應(yīng)(freee rrespponsse)的試題題分析或或試題不不太困難難的單選選題測(cè)驗(yàn)驗(yàn)分析,對(duì)於有有良好施施測(cè)指導(dǎo)導(dǎo)語(yǔ)的能能力測(cè)驗(yàn)驗(yàn)資料亦亦可適用用。3.洛吉吉數(shù)三參參模式(thrree-parrameeterr loogissticc moodell) 其中:第

12、第s 位受受試者的的能力參參數(shù):表示能能力參數(shù)數(shù)為的受受試者ss,答對(duì)對(duì)試題ii 或在在試題ii 上正正確反應(yīng)應(yīng)的機(jī)率率。:表示常常數(shù)為11:試題鑑鑑別度的的參數(shù):試題難難易度的的參數(shù):試題猜猜測(cè)度的的參數(shù)洛吉數(shù)三三參數(shù)模模式是由由洛吉數(shù)數(shù)雙參數(shù)數(shù)模式延延伸演變變而來(lái),它多增增加一個(gè)個(gè)猜測(cè)度度參數(shù),通常用用來(lái)表示示,是指指將能力力極低或或能力參參數(shù)值為為零的受受試者考考慮到模模式裡,計(jì)算出出此類受受試者答答對(duì)試題題的機(jī)率率,亦即即把低能能力受試試者的表表現(xiàn)好壞壞因素也也考慮在在模式裡裡,當(dāng)然然,猜題題可能是是這些受受試者在在某些測(cè)測(cè)驗(yàn)試題題(如選擇擇題)上唯一一的表現(xiàn)現(xiàn)行為。從ICCC 來(lái)看,

13、它是位位於該曲曲線的左左下漸近近線。通通常猜測(cè)測(cè)度參數(shù)數(shù)值比受受試者在在完全隨隨機(jī)猜測(cè)測(cè)下猜答答的機(jī)率率稍小,亦即值值小於試試題選項(xiàng)項(xiàng)數(shù)目的的倒數(shù),也就是是說(shuō)如果果一個(gè)試試題有四四個(gè)選項(xiàng)項(xiàng),則應(yīng)應(yīng)小於00.255。猜測(cè)測(cè)度參數(shù)數(shù)只出現(xiàn)現(xiàn)在三參參數(shù)以上上的模式式中,在在單參數(shù)數(shù)及雙參參數(shù)模式式中均將將其假定定為 0 或接近近 0 而忽略略不計(jì)。值愈小小,表示示猜測(cè)的的因素愈愈小,試試題愈有有效,最最理想的的值是等於於 0,表表示試題題完全不不受猜測(cè)測(cè)影響,但是只只要測(cè)驗(yàn)驗(yàn)的型式式是選擇擇題型,通常很很難避免免受試者者的猜測(cè)測(cè)行為。圖3 六條典典型的三三個(gè)參數(shù)數(shù)試題特特徵曲線線由圖2-1-33得知

14、,曲線第第3、55、6條條與第11、2、4條曲曲線的比比較,可可以看出出試題猜猜測(cè)度參參數(shù),前前者大於於零,後後者等於於零,也也就是能能力低的的受試者者在於前前者試題題上具有有較高的的猜測(cè)行行為。以下就古古典測(cè)驗(yàn)驗(yàn)理論的的缺失與與當(dāng)代測(cè)測(cè)驗(yàn)理論論的特點(diǎn)點(diǎn)整理如如下表11做相互互比較:表1古典典測(cè)驗(yàn)理理論的缺缺失與當(dāng)當(dāng)代測(cè)驗(yàn)驗(yàn)理論的的特點(diǎn)的的比較古典測(cè)驗(yàn)驗(yàn)理論的的缺失當(dāng)代測(cè)驗(yàn)驗(yàn)理論的的特點(diǎn)一、古典測(cè)驗(yàn)驗(yàn)理論所所採(cǎi)用的的指標(biāo),諸如:難度、鑑別度度,和信信度等,都是一一種樣本本依賴(sammplee deepenndennt)的指標(biāo)標(biāo);也就就是說(shuō),這些指指標(biāo)的獲獲得會(huì)因因接受測(cè)測(cè)驗(yàn)的受受試者樣樣本的

15、不不同而不不同。因因此,同同一份試試卷很難難得獲得得一的難難度、鑑鑑別度,或信度度。一、二、當(dāng)代測(cè)驗(yàn)驗(yàn)理論所所採(cǎi)用的的試題參參數(shù)(iteem pparaametterss)(如:難度、鑑別度度、猜測(cè)測(cè)度等),是一一種不受受樣本影影響(Sammplee-frree)的指標(biāo)標(biāo);也就就是說(shuō),這些參參數(shù)的獲獲得,不不會(huì)因?yàn)闉樗x出出接受測(cè)測(cè)驗(yàn)的受受試者樣樣本的不不同而不不同。當(dāng)代測(cè)驗(yàn)驗(yàn)理論能能夠針對(duì)對(duì)每位受受試者,提供個(gè)個(gè)別差異異的測(cè)量量誤差表2-11-1(續(xù))古典測(cè)驗(yàn)驗(yàn)理論的的缺失當(dāng)代測(cè)驗(yàn)驗(yàn)理論的的特點(diǎn)二、三、四、五、古典測(cè)驗(yàn)驗(yàn)理論以以一個(gè)相相同的測(cè)測(cè)驗(yàn)標(biāo)準(zhǔn)準(zhǔn)誤(sstanndarrd eerroo

16、r oof mmeassureemennt),作為每每位受試試者的測(cè)測(cè)量誤差差指標(biāo),這種作作法並沒沒有考慮慮受試者者能力的的個(gè)別差差異,對(duì)對(duì)高、低低能力兩兩極端組組的受試試者而言言,這種種指標(biāo)極極為不合合理且不不準(zhǔn)確,致使理理論假設(shè)設(shè)的適當(dāng)當(dāng)性受到到懷疑。測(cè)驗(yàn)理論論對(duì)於非非複本(nonnparralllel)但功能能相同的的測(cè)驗(yàn)所所測(cè)得的的分?jǐn)?shù)間間,無(wú)法法提供有有意義的的比較,有意義義的比較較僅侷限限於相同同測(cè)驗(yàn)的的前後測(cè)測(cè)分?jǐn)?shù)或或複本測(cè)測(cè)驗(yàn)分?jǐn)?shù)數(shù)之間。古典測(cè)驗(yàn)驗(yàn)理論對(duì)對(duì)信度的的假設(shè),是建立立在複本本(parralllel forrms)測(cè)驗(yàn)的的概念假假設(shè)上,但是這這種假設(shè)設(shè)往往不不存在於於實(shí)

17、際測(cè)測(cè)驗(yàn)情境境裡。道道理很簡(jiǎn)簡(jiǎn)單,因因?yàn)椴豢煽赡芤笄竺课皇苁茉囌呓咏邮芡灰环轀y(cè)驗(yàn)驗(yàn)無(wú)數(shù)次次,而仍仍然假設(shè)設(shè)每次測(cè)測(cè)量間都都彼此獨(dú)獨(dú)立不相相關(guān)。況況且,每每一種測(cè)測(cè)驗(yàn)並不不一定同同時(shí)都有有製作複複本,因因此複本本測(cè)驗(yàn)的的理論假假設(shè)是行行不通的的,從方方法學(xué)邏邏輯觀點(diǎn)點(diǎn)而言,它的假假設(shè)也是是不合理理的、矛矛盾的。古典測(cè)驗(yàn)驗(yàn)理論忽忽視受試試者的試試題反應(yīng)應(yīng)組型(iteem rrespponsse ppattternn),認(rèn)為為原始得得分相同同的受試試者,期期能力必必定一樣樣:其實(shí)實(shí)不然,即使原原始得分分相同的的受試者者,其反反應(yīng)組型型亦不見見得會(huì)完完全一致致。因此此,其能能力估計(jì)計(jì)值應(yīng)該該會(huì)有所

18、所不同。三、四、五、六、指數(shù),而而非單一一相同測(cè)測(cè)量標(biāo)準(zhǔn)準(zhǔn)誤,因因此能精精確推估估受試者者的能力力估計(jì)值值。當(dāng)代測(cè)驗(yàn)驗(yàn)理論可可經(jīng)由適適用的同同質(zhì)性試試題組成成得分試試驗(yàn),測(cè)測(cè)量估計(jì)計(jì)出受試試者個(gè)人人的能力力,不受受測(cè)驗(yàn)的的影響(tesst-ffreee),並且且對(duì)於不不同受試試者的分分?jǐn)?shù),亦亦可進(jìn)行行有意義義的比較較。當(dāng)代測(cè)驗(yàn)驗(yàn)理論提提出以試試題訊息息量(iteem iinfoormaatioon)及試卷卷訊息量量(tesst iinfoormaatioon)的概念念,來(lái)作作為評(píng)定定某個(gè)試試題或整整份試卷卷的測(cè)量量準(zhǔn)確性性,倒有有取代古古典測(cè)驗(yàn)驗(yàn)理論的的信度度,作作為評(píng)定定試卷內(nèi)內(nèi)部一致致性指

19、標(biāo)標(biāo)之勢(shì)。當(dāng)代測(cè)驗(yàn)驗(yàn)理論同同時(shí)考慮慮受試者者的反應(yīng)應(yīng)組型與與試題參參數(shù)等特特性,因因此在估估計(jì)個(gè)人人能力時(shí)時(shí),除了了能夠提提供一個(gè)個(gè)較精確確的估計(jì)計(jì)值外,對(duì)於原原始得分分相同的的受試者者,也往往往給予予不同的的能力估估計(jì)值。當(dāng)代測(cè)驗(yàn)驗(yàn)理論所所採(cǎi)用的的適合度度考驗(yàn)值值(staatissticc off gooodnnesss-off-fiit),可以以提供考考驗(yàn)?zāi)J绞脚c資料料間之適適合度、受試者者的反應(yīng)應(yīng)是否為為非尋常常(unuusuaal)等參考考指標(biāo)。三、國(guó)中中數(shù)學(xué)科科測(cè)驗(yàn)命命題原則則(一)、一般注注意事項(xiàng)項(xiàng)1.試題題的表達(dá)達(dá)方式要要能切合合該題的的評(píng)量目目標(biāo)。2.試題題要能清清楚的表表達(dá)題

20、意意。3.每個(gè)個(gè)試題只只問(wèn)一個(gè)個(gè)問(wèn)題,避免同同時(shí)包含含太多概概念。4.試題題的文字字?jǐn)⑹鰬?yīng)應(yīng)簡(jiǎn)潔、明白,避免出出現(xiàn)跟答答案無(wú)關(guān)關(guān)的內(nèi)容容。5.標(biāo)點(diǎn)點(diǎn)符號(hào)的的使用要要準(zhǔn)確。6.試題題的文字字?jǐn)⑹鰬?yīng)應(yīng)加以變變化,避避免直接接抄襲課課文。7.試題題宜與學(xué)學(xué)生的生生活經(jīng)驗(yàn)驗(yàn)相結(jié)合合。(二)、題幹與與選項(xiàng)的的設(shè)計(jì)原原則1.題幹幹與選項(xiàng)項(xiàng)的文法法要一致致,邏輯輯上要能能連貫。2.題幹幹或選項(xiàng)項(xiàng)中,應(yīng)應(yīng)避免出出現(xiàn)可能能暗示正正確答案案的線索索。3.題幹幹應(yīng)儘量量用正面面的敘述述,避免免使用否否定句。若用否否定句時(shí)時(shí),請(qǐng)?jiān)谠诜穸ㄗ肿盅巯录蛹釉]雙底底線。4.題幹幹的敘述述應(yīng)保持持完整,避免被被選項(xiàng)分分割成兩兩個(gè)

21、部份份或段落落。5.各選選項(xiàng)中重重複出現(xiàn)現(xiàn)的文字字請(qǐng)放在在題幹內(nèi)內(nèi)。6.每個(gè)個(gè)選項(xiàng)應(yīng)應(yīng)使用相相似的表表達(dá)方式式。7.選項(xiàng)項(xiàng)中只有有一個(gè)最最佳或正正確答案案。8.錯(cuò)誤誤選項(xiàng)應(yīng)應(yīng)具有誘誘答力。9.錯(cuò)誤誤選項(xiàng)要要能有充充分的理理由,足足以說(shuō)明明其不正正確。10.應(yīng)應(yīng)儘量避避免以以上皆是是或以上皆皆非的的選項(xiàng)。11.選選項(xiàng)應(yīng)相相互獨(dú)立立,彼此此之間沒沒有邏輯輯上的關(guān)關(guān)聯(lián)(相相互依賴賴、相反反)。12.選選項(xiàng)中應(yīng)應(yīng)避免出出現(xiàn)絕對(duì)對(duì)性的字字眼。(三)、題組1.選用用的短文文、圖表表、地圖圖或?qū)嶒?yàn)驗(yàn)等資料料,必須須符合該該題的評(píng)評(píng)量目標(biāo)標(biāo)。2.選用用的資料料需簡(jiǎn)短短而且有有意義。3.試題題的數(shù)目目應(yīng)與所所選

22、用資資料之長(zhǎng)長(zhǎng)度成恰恰當(dāng)?shù)谋缺壤?四)、公平性性1.試題題中應(yīng)避避免歧視視性別或或種族的的字眼。2.試題題中的訊訊息不宜宜是某些些群體(種族、性別、居住地地區(qū))所所特別熟熟悉。3.考生生答對(duì)試試題的機(jī)機(jī)會(huì),不不應(yīng)受到到該題學(xué)學(xué)力指標(biāo)標(biāo)以外的的因素所所影響。(五)、原創(chuàng)性性1.試題題不應(yīng)在在課本、參考書書或補(bǔ)習(xí)習(xí)班講義義中出現(xiàn)現(xiàn)過(guò)。2.試題題不應(yīng)在在任何考考試中出出現(xiàn)過(guò)(包括歷歷屆聯(lián)考考、推薦薦甄試、學(xué)??伎荚嚮蚱淦渌笮托涂荚?。四、試題題分析(iteem aanallysiis)試題分析析的目的的即在透透過(guò)客觀觀的量化化分析,找出每每個(gè)試題題所具有有的統(tǒng)計(jì)計(jì)特徵為為何,以以幫助教教師明瞭瞭

23、自編或或成就測(cè)測(cè)驗(yàn)試題題的特性性,方便便作為建建立題庫(kù)庫(kù)的基礎(chǔ)礎(chǔ),供作作他日之之用。一一份好的的測(cè)驗(yàn),是由良良好品質(zhì)質(zhì)的試題題所組成成的,如如何知道道各個(gè)題題目的品品質(zhì)?這這必須藉藉由試題題分析以以提供訊訊息,而而試題分析析的功能能,即是是在於暸暸解試題題的品質(zhì)質(zhì),刪去去或改寫寫品質(zhì)不不佳的試試題,進(jìn)進(jìn)而改善善試題的品品質(zhì),以以達(dá)成提提升測(cè)驗(yàn)驗(yàn)品質(zhì)的的目的。試題分析析具有下下列幾項(xiàng)項(xiàng)功能,茲分述述如下:(一)作作為改進(jìn)進(jìn)學(xué)生學(xué)學(xué)習(xí)的參參考在施測(cè)之之後,每每位學(xué)生生有權(quán)力力知道他他的得分分以及他他在每道道試題上上作答結(jié)結(jié)果的正正誤。教教師可以以利用試試題分析析後對(duì)試試題特徵徵的瞭解解,來(lái)和和學(xué)生

24、做做逐題的的討論和和解釋原原因,以以期能夠夠澄清學(xué)學(xué)生的錯(cuò)錯(cuò)誤概念念和迷思思想法,更更正因不不良學(xué)習(xí)習(xí)習(xí)慣與與應(yīng)試技技巧不當(dāng)當(dāng)所造成成的疏忽忽,激發(fā)發(fā)改進(jìn)下下次測(cè)驗(yàn)驗(yàn)表現(xiàn)的的動(dòng)機(jī),及矯正正不當(dāng)?shù)牡膶W(xué)習(xí)方方法和習(xí)習(xí)慣。(二)作作為實(shí)施施補(bǔ)救教教學(xué)的依依據(jù)根據(jù)試題題分析的的結(jié)果,教師可可以明瞭瞭學(xué)生答答題的分分布情形形,並且且從中看看出學(xué)生生共同感感覺學(xué)習(xí)習(xí)困難的的地方,然後針針對(duì)這些些困難所所在設(shè)計(jì)計(jì)有效的的校正策策略,對(duì)對(duì)癥下藥藥,實(shí)施施補(bǔ)救教教學(xué)或其其他矯正正措施。(三)作作為修改改課程建建議的憑憑據(jù)試題分析析可以幫幫助教師師評(píng)鑑學(xué)學(xué)習(xí)成果果與課程程內(nèi)容是是否適合合所教導(dǎo)導(dǎo)的學(xué)生生。例如如,

25、在測(cè)測(cè)量某些些教學(xué)單單元的試試題上,如果學(xué)學(xué)生時(shí)常常重複發(fā)發(fā)生錯(cuò)誤誤,或發(fā)發(fā)生的錯(cuò)錯(cuò)誤遍及及所有的的學(xué)校及及學(xué)生時(shí)時(shí),那就就表示這這些試題題已反應(yīng)應(yīng)出某些些教材可可能不適適合學(xué)生生的學(xué)習(xí)習(xí),此時(shí)時(shí)便需要要建議修修改課程程,或調(diào)調(diào)整教材材內(nèi)容的的順序,或改採(cǎi)採(cǎi)其他版版本的複複本教材材,或採(cǎi)採(cǎi)去其他他更有效效的教學(xué)學(xué)策略和和教學(xué)方方法。(四)增增進(jìn)教師師編製測(cè)測(cè)驗(yàn)的經(jīng)經(jīng)驗(yàn)試題分析析可以幫幫助教師師明瞭哪哪些試題題的難度度是否過(guò)過(guò)度困難難或過(guò)度度容易、鑑別度度是否過(guò)過(guò)高或過(guò)過(guò)低,有有無(wú)提供供答案線線索,誘誘答選項(xiàng)項(xiàng)是否有有效,或或題意的的表達(dá)是是否清楚楚等訊息息。這些些訊息可可以做為為教師修修訂或刪

26、刪改試題題的參考考依據(jù),提供教教師寶貴貴的命題題經(jīng)驗(yàn),增進(jìn)日日後編製製新測(cè)驗(yàn)驗(yàn)的命題題技巧。(五)增增進(jìn)測(cè)驗(yàn)驗(yàn)題庫(kù)運(yùn)運(yùn)用的效效能題庫(kù)並不不只是一一堆試題題的集合合體,它它必須是是經(jīng)過(guò)試試題分析析後,保保留下來(lái)來(lái)具有優(yōu)優(yōu)良試題題特徵(如:內(nèi)內(nèi)容效度度、內(nèi)部部一致性性信度、難度、鑑別度度、和誘誘答力)的試題題所組合合而成。因此,試題分分析可以以協(xié)助教教師篩選選出優(yōu)良良試題,以作為為題庫(kù)的的基本試試題;行行之有年年後,教教師便擁?yè)碛凶约杭喝谓炭瓶颇康念}題庫(kù)。日日後,當(dāng)當(dāng)需要編編製新測(cè)測(cè)驗(yàn)向?qū)W學(xué)生施測(cè)時(shí)時(shí),教師師只要依依據(jù)教學(xué)學(xué)評(píng)量目目標(biāo)及雙雙向細(xì)目目表,從從題庫(kù)中中隨機(jī)抽抽取符合合要求的的試題,便可

27、以以輕易、隨時(shí)及及有系統(tǒng)統(tǒng)地組成成新測(cè)驗(yàn)驗(yàn)卷,這這不僅可可以省下下重編一一份新測(cè)測(cè)驗(yàn)的時(shí)時(shí)間、人人力和物物力的花花費(fèi),更更可以增增進(jìn)測(cè)驗(yàn)驗(yàn)運(yùn)用的的效能,達(dá)成隨隨心所欲欲的測(cè)量量目的。在測(cè)驗(yàn)編編製過(guò)程程中,試試題分析析是一件件非常重重要的工工作。試試題分析析可分為為質(zhì)的分分析與量量的分析析兩部分分。(一)試試題質(zhì)的的分析在試題編編製時(shí),應(yīng)特別別注意命命題的基基本原則則,才能能編出適適切的試試題,例例如:學(xué)學(xué)科成就就測(cè)驗(yàn)的的主要目目的為評(píng)評(píng)量受受試者接接受某一一學(xué)科正正式教學(xué)學(xué)後的學(xué)學(xué)習(xí)結(jié)果果,因因此試題題必須要要能符合合課程的的內(nèi)容,並依據(jù)據(jù)所要達(dá)達(dá)成的教教學(xué)目標(biāo)標(biāo),就受受試者行行為變化化的不同

28、同層面加加以評(píng)量量,也就就是說(shuō)試試題在質(zhì)質(zhì)方面的的分析,可由試試題的內(nèi)內(nèi)容審查查、有效效命題原原則及教教學(xué)目標(biāo)標(biāo)等評(píng)鑑鑑工作來(lái)來(lái)進(jìn)行。試題本身身的編製製內(nèi)容與與方式也也需符合合測(cè)驗(yàn)編編製的原原理與要要求。試試題編製製完成之之後,可可邀請(qǐng)學(xué)學(xué)科專家家3至55人,針針對(duì)測(cè)驗(yàn)驗(yàn)計(jì)劃、測(cè)驗(yàn)題題目與測(cè)測(cè)驗(yàn)形式式三個(gè)向向度,評(píng)評(píng)估試題題的適切切性,使使對(duì)整份份測(cè)驗(yàn)品品質(zhì)有所所建議與與改善,以達(dá)到到對(duì)試題題品質(zhì)的的要求。試題的的檢視與與編輯應(yīng)應(yīng)注意下下列事項(xiàng)項(xiàng):1.每道道試題是是否均能能測(cè)量到到雙向細(xì)細(xì)目表中中的每一一項(xiàng)重要要學(xué)習(xí)結(jié)結(jié)果?2.試題題的類型型是否適適合於所所要測(cè)量量的學(xué)習(xí)習(xí)結(jié)果?3.試題題的敘

29、述述是否明明確,是是否遺漏漏了重要要的條件件?4.應(yīng)使使用簡(jiǎn)單單且清晰晰的用語(yǔ)語(yǔ)來(lái)陳述述。5.試題題應(yīng)避免免提供額額外之線線索。6.試題題是否難難易適中中?7.每道道試題是是否彼此此獨(dú)立、未採(cǎi)用用連鎖題題?8.測(cè)驗(yàn)驗(yàn)所包括括的試題題,是否否能夠涵涵蓋整個(gè)個(gè)雙向細(xì)細(xì)目表的的內(nèi)容?(二)試試題量的的分析1.難易易度分析析試題的難難易度與與測(cè)驗(yàn)的的效率有有關(guān),難難易度適適當(dāng)?shù)脑囋囶}是構(gòu)構(gòu)成優(yōu)良良測(cè)驗(yàn)的的必要條條件。通通常以代代表試題題難易度度,代表表全體受受試者人人數(shù),為為答對(duì)該該題的人人數(shù),表表示高分分組(全體受受試者當(dāng)當(dāng)中,分分?jǐn)?shù)最高高的277%)答對(duì)該該題的百百分比,表示低低分組(全體受受試者

30、當(dāng)當(dāng)中,分分?jǐn)?shù)最低低的277%)答對(duì)該該題的百百分比。難易度度的計(jì)算算方式有有二種方式式:(1)例如:有有一個(gè)測(cè)測(cè)驗(yàn)共有有1000名受試試者,其其中某一一題答對(duì)對(duì)的人數(shù)數(shù)為255人,則則此題的的難易度度為。(2)例如:有有一個(gè)測(cè)測(cè)驗(yàn)總共共有1000名受受試者,其中某某一題高高分組答答對(duì)的百百分比為為75%,低分分組答對(duì)對(duì)的百分分比為225%,因此可可算得難難易度為為。質(zhì)介於於0與11之間的的一個(gè)值值,值愈愈大表示示試題愈愈容易,相反的的值愈靠靠近0表表示試題題愈難,例如:三個(gè)試試題其難難易度分分別為、和,表示示第一題題比第二二題難,第二題題又比第第三題難難,但難難易度為為一次序序量尺(ordd

31、inaal sscalle),差距距單位並並不相等等,其值值僅代表表試題難難易程度度的相對(duì)對(duì)位置,兩個(gè)難難易度的的差不具具任何意意義,由由上面的的例子說(shuō)說(shuō)明,不不能說(shuō)第第一題關(guān)於如何何利用難難度值來(lái)來(lái)挑戰(zhàn)試試題,一一般都將將試題的的難度分分為五個(gè)個(gè)等級(jí),如下表表2-22-1所所示:表2-11 試題題難易度度等級(jí)表表難易度難易度等等級(jí)極容易容易難易適中中困難極困難一般測(cè)驗(yàn)驗(yàn)專家均均建議挑挑選難易易度約為為0.55的試題題,也就就是難易易適中的的試題,因?yàn)檫@這樣的試試題評(píng)鑑鑑度可以以達(dá)到最最大,不不過(guò)在實(shí)實(shí)際的選選題上,要使每每一題的的難易度度都接近近0.55是有些些困難的的。因此此有學(xué)者者便主張

32、張以0.4到0.88之間的的難易度度範(fàn)圍作作為選擇擇題的挑挑選標(biāo)準(zhǔn)準(zhǔn)。平均而而言,整整份測(cè)驗(yàn)驗(yàn)的平均均難度值值還是以以接近00.5為為佳。2.鑑別別度分析析構(gòu)成測(cè)驗(yàn)驗(yàn)的試題題,必須須具有鑑鑑別某種種心理特特質(zhì)的作作用,才才能使測(cè)測(cè)驗(yàn)成為為可靠又又正確的的測(cè)量工工具。也也就是說(shuō)說(shuō),試題題的鑑別別度高低低與測(cè)驗(yàn)驗(yàn)的信度度和效度度有著密密切的關(guān)關(guān)係,欲欲增進(jìn)測(cè)測(cè)驗(yàn)的預(yù)預(yù)測(cè)與診診斷的功功能,必必須要很很仔細(xì)的的分析試試題的鑑鑑別度,分析鑑鑑別度的的方式主主要有兩兩方面:(1)內(nèi)內(nèi)部一致致性分析析內(nèi)部一致致性分析析旨在瞭瞭解各個(gè)個(gè)試題的的功能是是否和整整體測(cè)驗(yàn)驗(yàn)的功能能相符合合一致。此種分分析的一一個(gè)基

33、本本假設(shè)是是:整個(gè)個(gè)測(cè)驗(yàn)的的分?jǐn)?shù)具具有某種種程度的的效度。如果此此架設(shè)成成立。則則個(gè)別試試題的反反應(yīng)若和和總分間間具有一一致性,就表示示題目有有某種程程度的效效度。換換言之,高分組組答對(duì)的的比例顯顯著大於於低分組組的比例例,故該該題的作作用和總總分的作作用一致致?;鹅洞?,鑑鑑別力的的分析方方法,採(cǎi)採(cǎi)用下列列公式: :鑑別別力指數(shù)數(shù)。:高分組組答對(duì)百百分比(全體受受試者當(dāng)當(dāng)中分?jǐn)?shù)數(shù)最高的的27)。:低分組組答對(duì)百百分比(全體受受試者當(dāng)當(dāng)中分?jǐn)?shù)數(shù)最低的的27)。當(dāng)測(cè)驗(yàn)分分?jǐn)?shù)是常常態(tài)分配配時(shí),以以27分組可可以獲得得試題鑑鑑別度的的最大可可靠性;百分比比低於227時(shí),結(jié)結(jié)果的可可靠性較較低,而而百

34、分比比較大時(shí)時(shí)會(huì)影響響試題的的鑑別作作用。對(duì)對(duì)教師而而言,合合理的分分組百分分比可在在25到333之間。鑑別力力指數(shù)(iteem ddisccrimminaatioon iindeex)通常以以小數(shù)表表示,其其值介於於之間。指數(shù)愈愈高,表表示鑑別別力愈大大。指數(shù)數(shù)愈低,表示鑑鑑別力愈愈小。如如果指數(shù)數(shù)為0,表示題題目沒有有鑑別作作用,此此種現(xiàn)象象可以是是:(1)因?yàn)轭}題目太容容易或太太艱難,所有人人均答對(duì)對(duì)或所有有人均答答錯(cuò);(2)因?yàn)轭}題目不清清楚。如如果低分分組答對(duì)對(duì)百分比比高於高高分組,則鑑別別力將是是負(fù)的,此種題題目具有有反向作作用,應(yīng)應(yīng)淘汰之之。人數(shù)數(shù)太少,題目不不清楚或或正確答答案

35、錯(cuò)誤誤,均有有可能導(dǎo)導(dǎo)致此種種情形。表2-22 鑑別別度評(píng)鑑鑑標(biāo)準(zhǔn)表表鑑別指數(shù)數(shù)試題評(píng)鑑鑑0.4以以上非常優(yōu)良良0.30.339優(yōu)良,但但須小幅幅度修改改0.2000.29尚可,但但須部分分修改0.199以下劣,須要要大幅度度修改或或刪除(2)外外在效度度分析外在效度度分析的的目的在在於檢驗(yàn)驗(yàn)題目是是否具有有預(yù)定的的某種鑑鑑別作用用。其分分析的過(guò)過(guò)程與上上述內(nèi)部部一致性性分析方方法,大大致相同同,唯一一不同之之處,為為外在效效度分析析系統(tǒng)依依據(jù)外在在效標(biāo)的的分?jǐn)?shù)分分為高、低兩組組。例如如,數(shù)學(xué)學(xué)成就測(cè)測(cè)驗(yàn)的編編製,可可用學(xué)校校數(shù)學(xué)科科成績(jī)?yōu)闉橥庠谛?biāo),分分成高、低兩組組,將兩兩組分?jǐn)?shù)數(shù)相減,

36、其差數(shù)數(shù)可顯示示各個(gè)試試題在預(yù)預(yù)定功能能上的鑑鑑別力。內(nèi)部一一致性分分析則依依預(yù)試測(cè)測(cè)驗(yàn)總分分分為高高、低兩兩組。前前者在於於使測(cè)驗(yàn)驗(yàn)的外在在效度變變得很大大,而後後者在於於使測(cè)驗(yàn)驗(yàn)的內(nèi)部部一致性性變得很很大。這這兩者均均為測(cè)驗(yàn)驗(yàn)編製所所希望的的相標(biāo),應(yīng)以何何者為分分析依據(jù)據(jù),需視視測(cè)驗(yàn)的的目的而而定。選項(xiàng)分析析選擇題的的選項(xiàng)包包括正確確選項(xiàng)與與誘答選選項(xiàng),正正確選項(xiàng)項(xiàng)必須明明確且不不會(huì)引起起任何爭(zhēng)爭(zhēng)議,而而誘答選選項(xiàng)則必必須具有有誘答的的功能,要知道道這些特特質(zhì)是否否成立,則需透透過(guò)選項(xiàng)項(xiàng)分析。選項(xiàng)分析析可以讓讓施測(cè)者者清楚知知道每一一試題的的所有選選項(xiàng)是否否符合命命題的原原則,選選項(xiàng)分析析

37、是透過(guò)過(guò)比較高高分組與與低分組組對(duì)正確確與誘答答選項(xiàng)的的選答率率,如果果分析的的結(jié)果符符合下面面兩項(xiàng)要要求,則則表示該該試題的的所有選選項(xiàng)是合合理有效效的(郭生玉玉,19989):(一)正正確選項(xiàng)項(xiàng)的選答答率,高高分組必必須高於於低分組組。(二)每每一個(gè)誘誘答選項(xiàng)項(xiàng)均有低低分組的的受試者者選答,且低分分組的選選答率高高於高分分組。如果不符符和第一一個(gè)要求求,表示示此試題題具有負(fù)負(fù)向的鑑鑑別度,不能清清楚區(qū)分分高分組組與低分分組;至至於第二二個(gè)要求求,又有有兩個(gè)方方面需要要討論,首先是是如果一一個(gè)選項(xiàng)項(xiàng)沒有任任何低分分組或高高分組受受試者選選答,表表示該選選項(xiàng)不具具任何誘誘答率,應(yīng)該在在修改題題

38、目將此此選項(xiàng)更更換;而而如果是是該誘答答選項(xiàng)高高分組的的選答率率高於低低分組,則表示示該誘答答選項(xiàng)的的敘述可可能有不不清楚或或錯(cuò)誤誘誘導(dǎo)的地地方,使使得高分分組的受受試者有有較多誤誤選的情情形,因因此在修修改試題題時(shí),應(yīng)應(yīng)該特別別注意這這些選項(xiàng)項(xiàng)。四、試題題特徵曲曲線試題特徵徵曲線是是用來(lái)描描述所測(cè)測(cè)量的潛潛在特質(zhì)質(zhì)與其在在試題上上正確反反應(yīng)機(jī)率率間的關(guān)關(guān)係,亦亦即受試試者潛在在能力(在標(biāo)準(zhǔn)準(zhǔn)化的座座標(biāo)中,以橫軸軸表示)相對(duì)於於此能力力在這試試題中的的答對(duì)機(jī)機(jī)率P()(在標(biāo)標(biāo)準(zhǔn)化的的座標(biāo)中中,以縱縱軸表示示)的關(guān)係係曲線,藉此可可以預(yù)測(cè)測(cè)受試者者的反應(yīng)應(yīng)與能力力間的關(guān)關(guān)係。 1.0 0.8 0

39、.6 0.4 0.2 -2.5 -1.2 1.2 2.5試題答對(duì)機(jī)率P()00受試者能力圖2-22-1 試題題特徵曲曲線圖試題特徵徵曲線的的應(yīng)用原原則,有有下列幾幾點(diǎn):1.在任任一特定定的能力力範(fàn)圍內(nèi)內(nèi),曲線線的斜率率(sloope)可當(dāng)作作試題在在該能力力範(fàn)圍內(nèi)內(nèi)的鑑別別度。2.透過(guò)過(guò)試題特特徵曲線線可以求求得的是是試題的的總體難難易度和總總鑑別度度。即當(dāng)當(dāng)通過(guò)比比率等於於0.55時(shí)的對(duì)對(duì)應(yīng)總分分或能力力值,這這個(gè)數(shù)值值可當(dāng)作作試題的的總體難難易度。此此外,在在總體難難易度這點(diǎn)點(diǎn)上的斜斜率亦可可以當(dāng)試試題的總總鑑別度度。3.好的的試題其其試題特特徵曲線線應(yīng)該呈呈現(xiàn)出正正的斜率率與適中中的難度

40、度。五、信度度及效度度一份測(cè)驗(yàn)驗(yàn),除了了透過(guò)個(gè)個(gè)別試題題的分析析之外,若能針針對(duì)整份份測(cè)驗(yàn)做做測(cè)驗(yàn)整整體的分分析(即測(cè)驗(yàn)驗(yàn)分析),必能能提高測(cè)測(cè)驗(yàn)的品品質(zhì)。測(cè)測(cè)驗(yàn)分析析在此主主要以信信度、效效度及雙雙向細(xì)目目表為主主。(一)信信度信度可以以說(shuō)是可可靠度,從字面面上的意意義來(lái)解解釋,就就是一份份測(cè)驗(yàn)的的結(jié)果是是否可可靠。一般而而言,一一份優(yōu)良良的教育育測(cè)驗(yàn)至至少應(yīng)該該具有00.8以以上的信信度值,才具有有使用的的價(jià)值。1.信度度的種類類與求法法常用估計(jì)計(jì)信度的的方法有有四種:重測(cè)法法、複本本法、內(nèi)內(nèi)部一致致性方法法、評(píng)分分者方法法,茲介介紹如下下:(1)重重測(cè)法(tesst-rreteest m

41、etthodd)估計(jì)測(cè)驗(yàn)驗(yàn)分?jǐn)?shù)是是否穩(wěn)定定,最直直接的方方法是重重測(cè)方法法。此種種方法是是採(cǎi)用同同一個(gè)測(cè)測(cè)驗(yàn)在不不同的時(shí)時(shí)間,重重複測(cè)量量相同的的一群受受試者兩兩次,根根據(jù)這兩兩次分?jǐn)?shù)數(shù)求得的的相關(guān),稱為重重測(cè)信度度係數(shù)(tesst-rreteest relliabbiliity coeeffiicieent),或稱稱再測(cè)信信度。(2)複複本法(equuivaalennt-fformms mmethhod)此種信度度主要在在確定我我們有多多少信心心能夠從從個(gè)人在在測(cè)驗(yàn)上上的得分分,推論論到其他他相等複複本測(cè)驗(yàn)驗(yàn)上的得得分。估估計(jì)複本本信度,必須有有真正的的複本測(cè)測(cè)驗(yàn),否否則無(wú)法法估計(jì)。兩個(gè)複複

42、本測(cè)驗(yàn)驗(yàn)實(shí)施於於一群相相同的受受試者,依據(jù)所所測(cè)量到到的分?jǐn)?shù)數(shù)求相關(guān)關(guān),即為為複本信信度。此此信度係係數(shù)可以以說(shuō)明兩兩個(gè)複本本測(cè)驗(yàn)測(cè)測(cè)量相同同行為或或內(nèi)容的的程度。因此,信度愈愈高,表表示所測(cè)測(cè)量的試試題樣本本愈可靠靠,愈能能以之代代表所欲欲測(cè)量?jī)?nèi)內(nèi)容的範(fàn)範(fàn)圍。(3)內(nèi)內(nèi)部一致致性方法法(intternnal-connsisstenncy metthodd)上述兩種種信度的的估計(jì)方方法,均均需實(shí)施施兩次的的測(cè)驗(yàn),受試者者的合作作、動(dòng)機(jī)機(jī)、疲勞勞和厭煩煩等可能能影響測(cè)測(cè)驗(yàn)的實(shí)實(shí)施。因因此,只只根據(jù)一一次測(cè)驗(yàn)驗(yàn)結(jié)果就就可以估估計(jì)信度度的分法法,較受受歡迎,內(nèi)部一一致性方方法就是是屬於這這種的估估計(jì)

43、方法法。此種種方法包包括有:折半方方法(spllit-hallf mmethhod)、庫(kù)李李方法(Kudder-Riccharrdsoon mmethhod)、Crronbbachhs 和霍霍意特變變異數(shù)分分析法(Hoyytss annalyysiss off vaariaancee prroceedurre)。以下下將只介介紹本論論文所採(cǎi)採(cǎi)用Crronbbachhs 的信信度係數(shù)數(shù)之計(jì)算算方法。Cronnbacchss 係係數(shù):因因?yàn)閹?kù)李李信度適適用於非非對(duì)即錯(cuò)錯(cuò)的計(jì)分分方式,也只能能處理計(jì)計(jì)分測(cè)驗(yàn)驗(yàn)的缺失失,但很很多測(cè)驗(yàn)驗(yàn)的計(jì)分分是採(cǎi)多多重計(jì)分分的方式式,這時(shí)時(shí),就必必須採(cǎi)用用Croonbaachs 係數(shù),此方法法為統(tǒng)計(jì)計(jì)學(xué)者CCronnbacch於119511年提出出的,若若設(shè)為為估計(jì)的的信度,則其公公式為: 係數(shù)公公式的一一個(gè)特例例,其中:表題數(shù)數(shù)表第題的的變異數(shù)數(shù)表總分的的變異數(shù)數(shù)(4)評(píng)評(píng)分者方方法採(cǎi)用不同同評(píng)分者者評(píng)閱試試卷,來(lái)來(lái)估計(jì)評(píng)評(píng)分者的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論