心理測量第七章測驗的項目分析課件_第1頁
心理測量第七章測驗的項目分析課件_第2頁
心理測量第七章測驗的項目分析課件_第3頁
心理測量第七章測驗的項目分析課件_第4頁
心理測量第七章測驗的項目分析課件_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章

測驗的

項目分析第七章測驗的

項目分析1導學

項目分析是在組成測驗之前,通過預測被試對組成測驗的各個題目(項目)的反應進行的分析。它是編制和修訂測驗的重要環(huán)節(jié)。

通過本章的學習可解決三個問題:一、掌握什么是測驗的難度,如何計算測驗的難度(重點)二、掌握什么是測驗的區(qū)分度,如何計算測驗的區(qū)分度,難度和區(qū)分度的關系怎樣(重點)三、掌握項目分析的其他特殊形式

導學項目分析是在組成測驗之前,通過預測被試對2第一節(jié)難度

一、難度的定義二、難度的計算三、難度水平的確定四、測驗的難度與測驗分數(shù)的分布五、常態(tài)化等距難度量表

第一節(jié)難度一、難度的定義3一、項目的難度難度,是指項目的難易程度。在能力測驗中通常需要一個反映難度水平的指標,在非能力測驗中,類似的指標是“通俗性”,即取自相同總體的樣本中,能在答案上回答該題的人數(shù)。

一、項目的難度4二、難度的計算難度通常以答對百分比作指標。(一)二分法記分的項目若試題為二分法記分項目(即答對給1分,答錯記0分)時,難度的指標通常以通過率表示,即以答對或通過該題的人數(shù)的百分比來表示:P=R/N×100%

式中,P代表項目的難度,N代表全體被試者人數(shù),R為答對或通過該項目的人數(shù)。

二、難度的計算5(二)非二分法計分的項目當測驗項目是問答題或其他不能用二分法計分的形式時,常常對部分正確的反應也給一定的分數(shù)。對于這類型題目,一般用下面的公式計算難度:P=X/Xmax×100%式中X為全體受測者在該題上的平均分,Xmax為該題的滿分。

(二)非二分法計分的項目6(三)分組法當被試人數(shù)較多時,則可根據(jù)測驗總成績將被試分成三組:分數(shù)最高的27%被試者為高分組(NH),分數(shù)最低的27%被試者為低分組(NL)。分別計算高分組和低分組的通過率,以兩組通過率的平均值作為每一題的難度。其公式為:P=(PH+PL)/2式中P代表難度,PH和PL分別代表高分組和低分組通過率。

(三)分組法7(四)難度的校正由于選擇題允許猜測,所以通過率可能因機遇作用而變大。備選答案的數(shù)目越少,機遇的作用越大,越不能反映測驗的難度。為了平衡機遇對難度的影響,吉爾福特提出了一個難度的校正公式:CP=(KP-1)/(K-1)式中CP為校正后的通過率,P為實際得到的通過率,K為備選答案的數(shù)目。

(四)難度的校正8三、難度水平的確定進行難度分析的主要目的是為了篩選項目,項目的難度多高合適,取決于測驗的目的、性質以及項目的形式。在教育工作中,有些測驗的目的是為了考察學生對某方面的知識、技能是否掌握,此時可以不考慮難度。當測驗用于選人時,應該比較多的采用那些難度值接近錄取率的題目。三、難度水平的確定9對于選擇題來說,P值一般應大于概率水平。P值等于概率,說明題目可能過難或題意不清,被試者憑猜測作答;P值小于概率無意義,說明題目質量有問題。對于選擇題來說,P值一般應大于概率水平。P值等于概率,說明題10四、測驗的難度與測驗分數(shù)的分布測驗的難度直接依賴于組成測驗的項目的難度。通過考察測驗分數(shù)的分布,可以對測驗的難度做出直觀檢驗。由于人的心理基本上是呈常態(tài)分布的,而我們目前所采用的統(tǒng)計方法大都以正態(tài)分布為前提,因此大多數(shù)測驗在設計時希望分數(shù)呈現(xiàn)常態(tài)分布的模型。如果被試樣本具有代表性,對于中等難度的測驗,其測驗總分應接近常態(tài)分配。四、測驗的難度與測驗分數(shù)的分布11五、常態(tài)化等距難度量表以通過率作為難度指標,實際上是以順序量表來表示難度,它僅僅能指出題目難度的順序或相對難度高低。因此美國教育測驗服務社建議用轉換過的分數(shù)來表示試題難度值。其轉換公式為Δ=13+4Z,(Δ為難度指標,Z為標準分數(shù),13為轉換公式的平均值,4為轉換公式的標準差)由于Z分數(shù)通常只取±3之間的數(shù)值,因此可知:

五、常態(tài)化等距難度量表12P=0.9987時,Z=-3,故Δ=13+4(-3)=1P=0.9772時,Z=-2,故Δ=13+4(-2)=5P=0.8413時,Z=-1,故Δ=13+4(-1)=9P=0.5000時,Z=0,故Δ=13+4(0)=13P=0.1587時,Z=+1,故Δ=13+4(+1)=17P=0.0228時,Z=+2,故Δ=13+4(+2)=21P=0.0013時,Z=+3,故Δ=13+4(+3)=25由此可見,常用的Δ值域介于1~25之間,Δ值越大,試題越難;Δ值越小,試題越容易。

P=0.9987時,Z=-3,故Δ=113第二節(jié)區(qū)分度

一、區(qū)分度的定義二、確定區(qū)分度的方法三、區(qū)分度的相對性四、區(qū)分度與難度的關系

第二節(jié)區(qū)分度一、區(qū)分度的定義14一、區(qū)分度的定義區(qū)分度是指測驗項目對所測量的心理特性的區(qū)分程度或鑒別能力。若區(qū)分度高,則水平高者得分高,水平低者得分低。若區(qū)分度低,則無鑒別力。

一、區(qū)分度的定義15(一)相關法即以某一項目分數(shù)與效標分數(shù)(或測驗總分)的相關作為該項目區(qū)分度的指標。相關越高,區(qū)分能力越好。

(一)相關法16(二)鑒別指數(shù)

區(qū)分度分析的一種簡便方法是比較測驗總分高和總分低的兩組被試在項目通過率上的差別:D=PH-PL式中PH為高分組在某項目上的通過率,PL為低分組在某項目上的通過率。二者通過率之差為鑒別指數(shù)D。D值越大,項目的區(qū)分度越高,即項目越有效。

(二)鑒別指數(shù)17三、區(qū)分度的相對性區(qū)分度的值亦具有相對性,這表現(xiàn)在以下四個方面:(一)采用不同的計算方法區(qū)分度的值不同(二)用相關法計算的區(qū)分度值受樣本大小影響(三)用兩個極端組通過率的差異作為區(qū)分度的指標,其值受分組標準的影響。(四)區(qū)分度的大小與樣本的同質性有關。

三、區(qū)分度的相對性18四、區(qū)分度與難度的關系區(qū)分度與難度有密切關系。例如,某項目的通過率為1.00或0,則說明高分組與低分組在通過率上不存在差異,因此鑒別指數(shù)D為0。假如,項目的通過率為0.50,則可能是高分組的所有人都通過了,而低分組卻無人通過,這樣D的最大值為1.00。從上面的分析中可以看出,難度越接近0.50,項目的潛在區(qū)分度越大,難度越接近1.00或0時,項目的潛在區(qū)分度越小。

四、區(qū)分度與難度的關系19但是在實際編制測驗中,不能要求所有項目的難度均為0.50。事實上,如果測驗的所有項目都是中等難度,只有項目的內在相關為零時,整個測驗才能產(chǎn)生正態(tài)分布??紤]到一般測驗項目之間都有某種相關,難度的分布廣一些,梯度多一些,是合乎需要的。但是在實際編制測驗中,不能要求所有項目的難度均為20難度與區(qū)分度都是相對的,是針對一定團體而言的。一般來說,較難的項目對高水平被試區(qū)分度高,較易的項目對低水平被試區(qū)分度高,中等難度的項目對中等水平的被試區(qū)分度高。由于人的多數(shù)心理特征呈正態(tài)分布,所以當需要人作最大程度的區(qū)分時,項目難度的分布也以正態(tài)為好,即特別難與特別容易的項目較少,越接近中等難度的項目越多,而所有項目的平均難度為0.50。

難度與區(qū)分度都是相對的,是針對一定團體而言的。一般來21第三節(jié)項目分析的特殊形式

一、備選答案的反應模式二、速度測驗的項目分析三、標準參照測驗的項目分析四、項目—團體的相互作用五、有效性與可靠性的矛盾

第三節(jié)項目分析的特殊形式一、備選答案的反應模式22一、備選答案的反應模式對于選擇題,除了分析其難度和區(qū)分度外,還要分析被試對每個備選答案的反應情況。一般主要做以下分析:(一)如果正確的備選答案被所有被試選擇,則說明該題目太容易或者題目中可能提供了某種暗示:(二)如果某個錯誤答案沒有一個被試選擇,說明該項目不具迷惑性,錯得過于明顯;

一、備選答案的反應模式23(三)如果所有被試都選擇了同一錯誤答案,可能是編制測驗時把答案定錯了,也可能是在教學中發(fā)生了錯誤;(四)如果高分組被試的選擇集中在兩個答案上,二者選擇率相近,說明該題可能有兩個正確答案或另一個答案也有一定道理;

(三)如果所有被試都選擇了同一錯誤答案,可能是編制測驗時把答24(五)如果高分組對正確答案的選擇與低分組相等或低于后者,說明所考察的東西與水平無關;(六)如果一個題目被試未答人數(shù)過多或選擇各個備選答案人數(shù)相等,則說明題目過難或題意不清,使得被試無法做答或憑猜測做答。

(五)如果高分組對正確答案的選擇與低分組相等或低于后者,說明25二、速度測驗的項目分析就難度來說,速度測驗前部的項目通過率高,后部的項目通過率低,即使后邊的項目比前邊容易,也會出現(xiàn)這種情況。就區(qū)分度來說,速度測驗前部的項目幾乎人人都能通過,因此鑒別力很低;測驗后部的項目只有能力強、反應快或總分高的被試才能通過,因而鑒別力被高估。二、速度測驗的項目分析26由此看來,在速度測驗中,不管項目本身性質如何,只要出現(xiàn)在測驗前部,只有較低的難度和區(qū)分度,而出現(xiàn)在測驗后部,便有較高的難度和區(qū)分度。由此看來,在速度測驗中,不管項目本身性質如何,只要出現(xiàn)在測驗27三、標準參照測驗的項目分析在標準參照測驗中,只要研究者和測驗編制者認為是重要的項目,不管其通過率和鑒別力如何,都可以包含在測驗中。對這種測驗最好通過比較前測與后測的結果來進行項目分析。

三、標準參照測驗的項目分析28四、項目—團體的相互作用不同的團體具有不同的文化背景,因而在知識技能上也有某種差異。這些差異會在測驗分數(shù)上反映出來。由此帶來的一個問題是,同樣的項目對于不同的團體可能有不同的通過率,這不但會影響難度的絕對值,還可能影響難度的等級順序。

四、項目—團體的相互作用29在測驗編制中也有另外一種情況,不是選擇團體間差異盡可能小的項目,而是選擇使團體差異盡可能大的項目。

由于項目—團體相互作用的復雜性,所以對項目的選擇標準不能做刻板的規(guī)定。對于引起一定團體的顯著差異的項目是保留還是淘汰,取決于編制測驗的目的。并且,對測驗分數(shù)的解釋時,一定要了解該測驗的選題依據(jù)。

在測驗編制中也有另外一種情況,不是選擇團體間差異30五、有效性與可靠性的矛盾有效性與可靠性的矛盾是由信度和效度的復雜性引起的。信度有多種,效度也有多種。同質性(跨項目間的一致性)信度是構想效度的必要條件,穩(wěn)定性(跨時間的一致性)信度是預測效度的必要條件。這兩個目標在某些方面不能共存。前者要求項目之間有高度相關,后者卻要求很低的相關;前者要求項目有同等難度,后者卻要求項目難度廣泛分布。

五、有效性與可靠性的矛盾31一個測驗在追求一個目標時,必須在另一個目標上有所犧牲。對于多數(shù)心理測驗來說,項目間中等程度的相關,便可使二者調和,獲得較為滿意的信度和效度。測驗的信度、效度受項目的難度、區(qū)分度、內部一致性等多種因素的交互影響,所有這些指標間的關系是非常復雜的,因此不能把它們割裂開來分析。

一個測驗在追求一個目標時,必須在另一個目標上有所32第七章

測驗的

項目分析第七章測驗的

項目分析33導學

項目分析是在組成測驗之前,通過預測被試對組成測驗的各個題目(項目)的反應進行的分析。它是編制和修訂測驗的重要環(huán)節(jié)。

通過本章的學習可解決三個問題:一、掌握什么是測驗的難度,如何計算測驗的難度(重點)二、掌握什么是測驗的區(qū)分度,如何計算測驗的區(qū)分度,難度和區(qū)分度的關系怎樣(重點)三、掌握項目分析的其他特殊形式

導學項目分析是在組成測驗之前,通過預測被試對34第一節(jié)難度

一、難度的定義二、難度的計算三、難度水平的確定四、測驗的難度與測驗分數(shù)的分布五、常態(tài)化等距難度量表

第一節(jié)難度一、難度的定義35一、項目的難度難度,是指項目的難易程度。在能力測驗中通常需要一個反映難度水平的指標,在非能力測驗中,類似的指標是“通俗性”,即取自相同總體的樣本中,能在答案上回答該題的人數(shù)。

一、項目的難度36二、難度的計算難度通常以答對百分比作指標。(一)二分法記分的項目若試題為二分法記分項目(即答對給1分,答錯記0分)時,難度的指標通常以通過率表示,即以答對或通過該題的人數(shù)的百分比來表示:P=R/N×100%

式中,P代表項目的難度,N代表全體被試者人數(shù),R為答對或通過該項目的人數(shù)。

二、難度的計算37(二)非二分法計分的項目當測驗項目是問答題或其他不能用二分法計分的形式時,常常對部分正確的反應也給一定的分數(shù)。對于這類型題目,一般用下面的公式計算難度:P=X/Xmax×100%式中X為全體受測者在該題上的平均分,Xmax為該題的滿分。

(二)非二分法計分的項目38(三)分組法當被試人數(shù)較多時,則可根據(jù)測驗總成績將被試分成三組:分數(shù)最高的27%被試者為高分組(NH),分數(shù)最低的27%被試者為低分組(NL)。分別計算高分組和低分組的通過率,以兩組通過率的平均值作為每一題的難度。其公式為:P=(PH+PL)/2式中P代表難度,PH和PL分別代表高分組和低分組通過率。

(三)分組法39(四)難度的校正由于選擇題允許猜測,所以通過率可能因機遇作用而變大。備選答案的數(shù)目越少,機遇的作用越大,越不能反映測驗的難度。為了平衡機遇對難度的影響,吉爾福特提出了一個難度的校正公式:CP=(KP-1)/(K-1)式中CP為校正后的通過率,P為實際得到的通過率,K為備選答案的數(shù)目。

(四)難度的校正40三、難度水平的確定進行難度分析的主要目的是為了篩選項目,項目的難度多高合適,取決于測驗的目的、性質以及項目的形式。在教育工作中,有些測驗的目的是為了考察學生對某方面的知識、技能是否掌握,此時可以不考慮難度。當測驗用于選人時,應該比較多的采用那些難度值接近錄取率的題目。三、難度水平的確定41對于選擇題來說,P值一般應大于概率水平。P值等于概率,說明題目可能過難或題意不清,被試者憑猜測作答;P值小于概率無意義,說明題目質量有問題。對于選擇題來說,P值一般應大于概率水平。P值等于概率,說明題42四、測驗的難度與測驗分數(shù)的分布測驗的難度直接依賴于組成測驗的項目的難度。通過考察測驗分數(shù)的分布,可以對測驗的難度做出直觀檢驗。由于人的心理基本上是呈常態(tài)分布的,而我們目前所采用的統(tǒng)計方法大都以正態(tài)分布為前提,因此大多數(shù)測驗在設計時希望分數(shù)呈現(xiàn)常態(tài)分布的模型。如果被試樣本具有代表性,對于中等難度的測驗,其測驗總分應接近常態(tài)分配。四、測驗的難度與測驗分數(shù)的分布43五、常態(tài)化等距難度量表以通過率作為難度指標,實際上是以順序量表來表示難度,它僅僅能指出題目難度的順序或相對難度高低。因此美國教育測驗服務社建議用轉換過的分數(shù)來表示試題難度值。其轉換公式為Δ=13+4Z,(Δ為難度指標,Z為標準分數(shù),13為轉換公式的平均值,4為轉換公式的標準差)由于Z分數(shù)通常只取±3之間的數(shù)值,因此可知:

五、常態(tài)化等距難度量表44P=0.9987時,Z=-3,故Δ=13+4(-3)=1P=0.9772時,Z=-2,故Δ=13+4(-2)=5P=0.8413時,Z=-1,故Δ=13+4(-1)=9P=0.5000時,Z=0,故Δ=13+4(0)=13P=0.1587時,Z=+1,故Δ=13+4(+1)=17P=0.0228時,Z=+2,故Δ=13+4(+2)=21P=0.0013時,Z=+3,故Δ=13+4(+3)=25由此可見,常用的Δ值域介于1~25之間,Δ值越大,試題越難;Δ值越小,試題越容易。

P=0.9987時,Z=-3,故Δ=145第二節(jié)區(qū)分度

一、區(qū)分度的定義二、確定區(qū)分度的方法三、區(qū)分度的相對性四、區(qū)分度與難度的關系

第二節(jié)區(qū)分度一、區(qū)分度的定義46一、區(qū)分度的定義區(qū)分度是指測驗項目對所測量的心理特性的區(qū)分程度或鑒別能力。若區(qū)分度高,則水平高者得分高,水平低者得分低。若區(qū)分度低,則無鑒別力。

一、區(qū)分度的定義47(一)相關法即以某一項目分數(shù)與效標分數(shù)(或測驗總分)的相關作為該項目區(qū)分度的指標。相關越高,區(qū)分能力越好。

(一)相關法48(二)鑒別指數(shù)

區(qū)分度分析的一種簡便方法是比較測驗總分高和總分低的兩組被試在項目通過率上的差別:D=PH-PL式中PH為高分組在某項目上的通過率,PL為低分組在某項目上的通過率。二者通過率之差為鑒別指數(shù)D。D值越大,項目的區(qū)分度越高,即項目越有效。

(二)鑒別指數(shù)49三、區(qū)分度的相對性區(qū)分度的值亦具有相對性,這表現(xiàn)在以下四個方面:(一)采用不同的計算方法區(qū)分度的值不同(二)用相關法計算的區(qū)分度值受樣本大小影響(三)用兩個極端組通過率的差異作為區(qū)分度的指標,其值受分組標準的影響。(四)區(qū)分度的大小與樣本的同質性有關。

三、區(qū)分度的相對性50四、區(qū)分度與難度的關系區(qū)分度與難度有密切關系。例如,某項目的通過率為1.00或0,則說明高分組與低分組在通過率上不存在差異,因此鑒別指數(shù)D為0。假如,項目的通過率為0.50,則可能是高分組的所有人都通過了,而低分組卻無人通過,這樣D的最大值為1.00。從上面的分析中可以看出,難度越接近0.50,項目的潛在區(qū)分度越大,難度越接近1.00或0時,項目的潛在區(qū)分度越小。

四、區(qū)分度與難度的關系51但是在實際編制測驗中,不能要求所有項目的難度均為0.50。事實上,如果測驗的所有項目都是中等難度,只有項目的內在相關為零時,整個測驗才能產(chǎn)生正態(tài)分布??紤]到一般測驗項目之間都有某種相關,難度的分布廣一些,梯度多一些,是合乎需要的。但是在實際編制測驗中,不能要求所有項目的難度均為52難度與區(qū)分度都是相對的,是針對一定團體而言的。一般來說,較難的項目對高水平被試區(qū)分度高,較易的項目對低水平被試區(qū)分度高,中等難度的項目對中等水平的被試區(qū)分度高。由于人的多數(shù)心理特征呈正態(tài)分布,所以當需要人作最大程度的區(qū)分時,項目難度的分布也以正態(tài)為好,即特別難與特別容易的項目較少,越接近中等難度的項目越多,而所有項目的平均難度為0.50。

難度與區(qū)分度都是相對的,是針對一定團體而言的。一般來53第三節(jié)項目分析的特殊形式

一、備選答案的反應模式二、速度測驗的項目分析三、標準參照測驗的項目分析四、項目—團體的相互作用五、有效性與可靠性的矛盾

第三節(jié)項目分析的特殊形式一、備選答案的反應模式54一、備選答案的反應模式對于選擇題,除了分析其難度和區(qū)分度外,還要分析被試對每個備選答案的反應情況。一般主要做以下分析:(一)如果正確的備選答案被所有被試選擇,則說明該題目太容易或者題目中可能提供了某種暗示:(二)如果某個錯誤答案沒有一個被試選擇,說明該項目不具迷惑性,錯得過于明顯;

一、備選答案的反應模式55(三)如果所有被試都選擇了同一錯誤答案,可能是編制測驗時把答案定錯了,也可能是在教學中發(fā)生了錯誤;(四)如果高分組被試的選擇集中在兩個答案上,二者選擇率相近,說明該題可能有兩個正確答案或另一個答案也有一定道理;

(三)如果所有被試都選擇了同一錯誤答案,可能是編制測驗時把答56(五)如果高分組對正確答案的選擇與低分組相等或低于后者,說明所考察的東西與水平無關;(六)如果一個題目被試未答人數(shù)過多或選擇各個備選答案人數(shù)相等,則說明題目過難或題意不清,使得被試無法做答或憑猜測做答。

(五)如果高分組對正確答案的選擇與低分組相等或低于后者,說明57二、速度測驗的項目分析就難度來說,速度測驗前部的項目通過率高,后部的項目通過率低,即使后邊的項目比前邊容易,也會出現(xiàn)這種情況。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論