心理學測量知識總結(jié)_第1頁
心理學測量知識總結(jié)_第2頁
心理學測量知識總結(jié)_第3頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、心理測量的基本理論Ps:我是今年才考完北師大心理學專碩的研究生,這是自己在準備研究生考試時整理的一些 心理測量方面的資料, 希望能夠幫助到想考心理學研究生或者是心理學本科專業(yè)的同學, 錯誤的話,也希望能夠指出來,評論或者私信都好,目的是方便大家共同學習。(一)心理測量的理論基礎1心理測量的基本概念(1 )心理測量的定義心理測量:根據(jù)一定的法則用數(shù)字對人的行為加以確定即依據(jù)一定的心理學理論,使用一定的操作程序,給人的行為和心理屬性確定出一種數(shù)量化的價值。心理測驗:對行為樣組進行客觀和標準化的測量,其本質(zhì)上是心理測量的工具心理測驗有三個要素,即 行為樣組 、標準化 、客觀性 。(2 )心理測量的特

2、點 間接性心理屬性是內(nèi)在的不可直接測量到的特質(zhì) ,但可表現(xiàn)為一系列具有內(nèi)在聯(lián)系的外顯行為,測量者可以通過一定的 方法測量這些外顯行為,并由這些行為判別特質(zhì)的性質(zhì)。 相對性對人的行為進行比較,沒有絕對的標準 ,亦即沒有絕對零點,我們有的只是一個連續(xù)的行為序列。所有的心理測量都是看每個人處在這個序列的什么位置上,也就是只有順序量表的特征。 客觀性實際上就是測驗的標準化問題。 測驗用的項目,說明、言語、態(tài)度、評分、分數(shù)轉(zhuǎn)換、解釋都需要標準化。2心理測量的特征分類(1 )按所測量的心理特征分類 能力測驗 個人已有的知識、經(jīng)驗、技能 成就測驗 經(jīng)過正式教育或訓練后對新知識和技能的掌握程度 人格測驗 性格

3、、氣質(zhì)、興趣、態(tài)度、品德、情緒、動機、信念、價值觀等(2 )按接受測量的人數(shù)分類 個別測驗 一名主試在一段時間內(nèi)測量一名被試 團體測驗 一段時間內(nèi)一名主試同時測量許多人(3 )按測驗目的分類 描述性測驗 僅僅是進行描述 診斷性測驗 對為了解決存在的問題而預先做出的診斷 預示性測驗 了解人的潛能和未來的表現(xiàn)(4 )按測驗要求分類 最高作為測驗 被試盡可能做出最好的表現(xiàn) 典型作為測驗 被試按通常的習慣和沒有壓力的方式做出反應 (5 )按評價所參照的標準分類 常模參照測驗 將被試的水平與常模比較,以評價被試在團體中的相對地位為目的 目標參照測驗 將被試水平與一個絕對標準比較 潛力參照測驗 將被試水平

4、與自身潛力相比較3經(jīng)典測量理論和真分數(shù)理論模型(1 )基本定義 真分數(shù):反映被試某種心理特質(zhì)真正水平的數(shù)值其是一個在理論上構想出來的抽象概念,在實際測量中很難得到觀察分數(shù):實測到的分數(shù) 我們希望通過改進和完善測量工具及方法的方式來使得觀察分數(shù)盡量接近真分數(shù)。CTT數(shù)學模型:觀察分數(shù)與真分數(shù)之間是一種線形關系,并只相差一個隨機誤差X T E 其中 X 表示觀察分數(shù); T表示真分數(shù); E 表示隨機誤差(不包含系統(tǒng)誤差)(2 )CTT 模型的三個假設公理 反復測量得到的觀察分數(shù)的平均值會接近真分數(shù), E 服從均值為零的正態(tài)分布 真分數(shù)和誤差分數(shù)之間的相關為零 平行測驗上的誤差分數(shù)之間相關為零 平行測

5、驗:題目不同的測驗測的是同一特質(zhì),且題目形式、數(shù)量、難度、區(qū)分度以及測查等值團體后所得分數(shù)的分布一致(3 )CTT 模型的方差關系 在一次測量中,被試觀察分數(shù)的方差等于其真分數(shù)方差與誤差分數(shù)方差之和SX2 ST2 SE2 真分數(shù)變異還可以分成與測量目的有關的變異和與測量目的無關的變異ST2 SV2 SI2二)測量的信度與效度1測量的信度(1 )信度的定義信度:測量結(jié)果的穩(wěn)定程度若能用同一測量工具反復測量某人的同一心理特質(zhì),則其多次測量的結(jié)果間的一致性程度就叫信度。信度的三個等價操作定義: 信度是一個被測團體的真分數(shù)的變異數(shù)與實得分數(shù)的變異數(shù)之比 信度是一個被試團體的真分數(shù)與實得分數(shù)的相關系數(shù)的

6、平方 信度是一個測驗與其任意一個平行測驗的相關系數(shù) (這個定義具有實際意義)2)信度系數(shù)的估計 重測信度:用同一個量表對同一組被試施測兩次所得結(jié)果的一致性程度計算:其大小等一同一組被試兩側(cè)測驗所得分數(shù)的皮爾遜積差相關系數(shù)(參見MJ心理大綱詳解 - 心統(tǒng) P8)實用的前提條件: 所測量的心理特性必須是穩(wěn)定的遺忘和聯(lián)系的效果基本上互相抵消 兩側(cè)測驗的間隔被試的特質(zhì)沒有變化 復本信度:兩個平行的測驗測量同一批被試所得結(jié)果的一致性程度計算:其大小亦等于兩側(cè)測驗分數(shù)的皮爾遜積差相關系數(shù)。 前提: 有條件構造出兩份或以上真正平行的測驗被試有條件接受兩個測驗 分半信度:將一個測驗分成對等的兩半后,所有被試在

7、這兩半上所得分數(shù)的一致性程度也可以把對等的半測驗堪稱是在最短時距內(nèi)施測的兩個平行測驗。計算:先按照復本信度的方式計算出半個測驗的信度,然后用斯皮爾曼- 布朗公式校正rXX若兩個分半測驗分數(shù)變異不等時則用前提: 通常在只能施測一次或沒有復本的情況下使用由于將測驗分半的方法很多,因此一個測驗有多個分半信度值 同質(zhì)性信度:測驗內(nèi)部所有題目間的一致程度這里的一致性指所有題目都測的是同在一種心理特質(zhì),也指所有題目得分之間都具有較高的正相關計算:K 為題目數(shù), piqi為答對答錯 i 題的比例, Si2 表示所有被試在 i 題上的分數(shù)變異 評分者信度:多個評分者給同一批人的答卷進行評分的一致性程度計算:評

8、分者為 2 用積差相關或登記相關,大于2 用肯德爾和諧系數(shù)估計(參見 MJ心理大綱詳解 - 心統(tǒng) P9)(3 )信度的影響因素與改進 影響因素:被試方面、主試方面、施測情景、測量工具、兩側(cè)施測間隔(越短越好) 提高方法:適當增加測驗的項目數(shù) 使測驗中試題的難度接近中等水平的正態(tài)分布 提高測驗試題的區(qū)分度 盡量選取同質(zhì)性較強的團體上的信度2測量的效度(1 )效度的定義效度:一個測驗或量表實際能測出其所要測得心理特質(zhì)的程度 效度的操作定義:效度是總變異中由所測量的特性造成的變異所占的百分比效度的三個性質(zhì): 效度是針對一次或某幾次測驗的具體結(jié)果的 效度是針對某種特定的測驗目的的 效度只是程度上的差異

9、,不是有無的差別(2 )效度的估計 效度估計就是多方尋找證據(jù)來證明測驗的有效性程度的過程。 (測量中效度與實驗中不同,區(qū)別理解。 MJ注) 內(nèi)容效度:一個測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度 估計一個測驗的內(nèi)容效度就是去確定該測驗在多大程度上代表了所要測量的行為領域。 適用范圍:內(nèi)容效度主要應用于成就測驗,也適合于某些用于選拔和分類的職業(yè)測驗而不是和能力和人格測驗 確定方法:明確欲測內(nèi)容的范圍,包括知識范圍和能力要求兩個方面確定每個題目所測得內(nèi)容,并與測驗編制者所列的雙向細目表對照制定評定表, 考察題目對內(nèi)容的覆蓋率及其比例和內(nèi)容的適當性并判斷題目難度與能力要求間差異 統(tǒng)計計算:

10、從同一內(nèi)容中抽兩套平行測驗對一批被試測驗 ,兩次相關高說明有效度 (除非兩個測驗偏向同一方面) 也可以用再測法,通過后側(cè)成績與前側(cè)成績比較。 結(jié)構效度:測驗能說明心理學上的理論結(jié)構或特質(zhì)的程度,或用心理學上某種結(jié)構或特質(zhì)來解釋測驗分數(shù)的恰當程度 結(jié)構指用來解釋人類行為的理論框架或心理特質(zhì),是心理學中抽象的假設性概念、特性或變量。特點: 結(jié)構效度的大小首先取決于實現(xiàn)假定的心理特質(zhì)理論 當實際測量的資料無法證實我們的理論假設時,不一定表明該測驗結(jié)構效度不高 結(jié)構效度是市通過對測量內(nèi)容的選擇的證據(jù)累計起來確定的,不是靠單一數(shù)量指標描述的 確定方法:提出理論假設,并把假設分解成一些細小的綱目依據(jù)理論框

11、架,推演出有關測驗成績的假設用邏輯的和實證的方法來驗證假設 應用范圍:主要用于治理測驗、人格測驗等 估計方法:從測驗內(nèi)部尋找證據(jù),先考察測驗的內(nèi)容效度在測驗間尋找,將新編測驗與已知有效的測驗比較考察測驗的實證效度 多種特質(zhì) - 多種方法矩陣法 實證效度:一個測驗對處于特定情景中的個體的行為進行估計的有效性,也就是說以實踐效果作為檢驗有效性的表準 根據(jù)效標資料搜集的時間差異,實證效度可分為 同時效度 和預測效度 兩種。 效標是作為檢驗效度的標準的被估計的行為,即衡量測驗是否有效且獨立與測驗的外在標準。 確定方法:明確觀念效標確定效標測量 考察測驗分數(shù)與效標測量的關系估計方法:相關法 計算測驗分數(shù)

12、與效標測量的相關系數(shù) 區(qū)分法 被試接受測驗后,讓他們工作一段時間,再根據(jù)工作成績的好壞分成兩組。這時再回過 頭來分析這兩組被試原先分數(shù)的差異,將成績與分數(shù)比較 命中率 決策的命中率是測驗有效性的較好指標(3 )效度的影響因素與改進影響因素:測驗的構成、測驗的實施過程、被試情況、所選效標的性質(zhì)、測量的信度 提高方法:精心編制測驗量表,避免出現(xiàn)較大的系統(tǒng)誤差妥善組織測驗,控制隨機誤差創(chuàng)設標準的應試情景,讓每個被試都能發(fā)揮正常的水平 選擇正確的效標、定好恰當?shù)男藴y量,正確地使用有關公式3信度和效度的關系根據(jù)公式 SX2 SV2 SI2 SE2 ,可以得到信度與效度的關系如下: 信度高是效度高的必要

13、而非充分條件 測驗的效度受它的信度制約三)心理測量的誤差誤差是世界本原通往人類認知途中的收費站和化妝師。 Major S.Lu1測量誤差的定義測量誤差:在測量過程中由那些與測量目的無關的變化因素所產(chǎn)生的一種不準確或不一致的測量效應 心理測量的誤差包括 隨機誤差 和系統(tǒng)誤差 兩種。隨機誤差:由與測量目的無關的、偶然因素引起的、而又不易控制的誤差 它使多次測量產(chǎn)生不一致的結(jié)果,其方向和大小的變化完全是隨機的,只符合某種統(tǒng)計規(guī)律。系統(tǒng)誤差:由與測量目的無關的變量引起的一種恒定而又規(guī)律的效應 這種誤差穩(wěn)定的存在與每次測量之中,盡管多次測量結(jié)果一致,但仍與真實值有所差異。2測量的隨機誤差來源及控制(1)

14、來源測試環(huán)境 溫度、光線、噪音等測試時間 時間安排不統(tǒng)一,或測試時間過短主試因素 年齡、性別、穿著、言談舉止、表情,主試的數(shù)量過多也會造成壓力 意外干擾 停電、巨響、有人生病、作弊、測驗用品出問題、糧食漲價、火星人入侵 評分計分 主觀題評分不客觀,有個人偏好(2)控制測驗準備盡可能充分細致,實測個方面盡量標準化3測量的系統(tǒng)誤差來源及控制(1)來源 測驗難度 過高或過低 測驗內(nèi)容 選題不當、題數(shù)太少、模棱兩可、表述不清被試因素 應試動機變化、測驗焦慮、測試經(jīng)驗、學習與發(fā)展、反應傾向、生理因素(2)控制 題目編制認真用心,測驗標準化4測量誤差的估計?SE ST 1 rtt 其中 rtt 為信度系數(shù)

15、(四)心理測驗的項目分析項目分析:測驗編制過程中,為了改善和提高測驗的信度和效度,在組成測驗之前,應對組成測驗的每個題目進行分析1題目的難度(1)定義難度:測驗項目的難易程度,一個測驗項目,如果大部分被試都能答對,則該項目的難度就小,反之亦然 測驗的記分方法不同,項目難度的計算方法也不同。(2)計算 二分法記分項目的難度以通過率來表示 (注:這里通過率的概念和我們通常理解的難度相反)P R N 其中 P 代表項目難度; N 為全體被試數(shù); R 為答對通過該項目的人數(shù)當被試人數(shù)較多時,將被試依照測驗總分從高到低排列,用總分最高的27%作為高分組,總分最低的 27%作為低分組PH PLP H L

16、其中 PH 和 PL 分別代表高分組合低分組的通過率2x 非二分法記分項目的難度 P 其中 x 為被試在某一項目上的平均分; xmax 為該項目的滿分(3 )難度水平的確定進行難度分析的主要目的是為了篩選項目,項目的難度水平多高合適,取決于測驗的目的及性質(zhì): 水平考試: 目的在于了解被試某方面知識技能的掌握情況 不必過多考慮難度,認為重要的內(nèi)容都可選用,甚至極高極低通過率的題 選拔考試: 目的在于選拔并錄用人員 項目難度易控制在錄取率左右,即較多地采用那些難度值接近錄取率的項目(4 )難度的等距變換 普通難度指數(shù)是順序變量,無法指出難度之間差異的大小,我們設法將其轉(zhuǎn)變?yōu)榈染嗔繑?shù): 根據(jù)正態(tài)分布

17、曲線將難度 P 作為正態(tài)曲線下的面積,轉(zhuǎn)換成 Z分數(shù) 為避免小數(shù)和負值,再用公式進行變換 13 4 Z (注:可以看出新難度與我們通常理解的難度相同)(5 )難度對測驗的影響 難度過大和過小都造成測驗分數(shù)偏離正態(tài),而心理特質(zhì)和我們經(jīng)常使用的統(tǒng)計分布卻都是正態(tài)的 過難或過易題目的存在都會使得測驗分數(shù)相對集中,造成分數(shù)全距縮小2題目的區(qū)分度(1)定義 區(qū)分度:測驗項目對被試心理品質(zhì)水平差異的區(qū)分能力 具有良好區(qū)分度的項目,能將不同水平的被試區(qū)分開來,反之則不能。(2)計算 鑒別指數(shù)法適合于二分法記分的項目D PH PL 其中 PH 和 PL 分別代表高分組合低分組的通過率 相關法以項目分數(shù)與效標分

18、數(shù)或測驗總分的相關作為項目區(qū)分度的指標 常用的有:點二列相關、二列相關、 相關、積差相關3題目的綜合分析和篩選 難度越接近 0.5 ,項目潛在區(qū)分度越大,因此整個測驗的難度平均應保持在 0.5 左右 測驗中各項目之間有一定相關,為了使成績分布均勻,項目難度的應廣一些,梯度大一些,最好成正態(tài)分布 每項題目理想的區(qū)分度都應在 0.3 以上,至少是 0.2(五)心理測驗的編制技術1心理測驗編制的基本程序 確定測驗目的 明確測量的對象、目標、用途 制定編題計劃 雙向細目表編輯測驗項目 收集測驗資料、選擇項目形式、編寫測驗項目 預測與項目分析 合成測驗 測驗項目的選擇和編排,并在必要時編制副本 測驗的標

19、準化 測驗內(nèi)容、施測過程、評分、分數(shù)解釋,都要標準化 鑒定測驗 鑒定其信度和效度,并確定測驗量表和常模 編寫測驗說明書2測驗目標與命題雙向細目表(1 )測驗目標測驗目標:所編測驗是用來測量什么心理變量或行為特征的測驗目標必須有操作定義,即目標要非常具體。(2 )命題雙向細目表命題雙向細目表:測驗編制過程中的重要依據(jù),即相當于編題的計劃清單,是包括兩個維度( 雙向)的表格指出測驗所包含的內(nèi)容與要測定的各種技能,以及對每一個內(nèi)容和技能的相對重要程度。功能:雙向細目表可以使命題工作避免盲目性而具有計劃性; 使命題者明確測驗的目標,把握試題的比例與份量,提高命題的效率和質(zhì)量。同時,它對于審查試題的效度

20、和覆蓋面也有重要的指導意義。3 題目編制技術 #題目編制的一般原則: 測試題要反映測驗目的,并對所測量的內(nèi)容有代表性 測試題適合于被試的能力水平,且能區(qū)分出不同水平的被試 測試題所提供的信息不能對答案有暗示作用 題目之間互相獨立,不能互相暗示 題干簡明,重點突出 避免雙重否定的語法 題目的敘述要簡明易懂,杜絕晦澀語言 題目盡量有唯一正確答案 避免使用性別歧視、種族歧視和攻擊性用語及涉及社會禁忌和個人隱私的內(nèi)容 一個測試題測量一個內(nèi)容或概念(六)心理測驗的施測1測驗的設計測驗設計:對測驗的結(jié)構和內(nèi)容、可達到的目的、結(jié)果可提供的信息、使用范圍、心理學指標等進行總體設計2施測的程序和步驟 # 施測前

21、的準備工作準備材料、掌握程序、熟記指導語 指導語直接影響受測者反映的態(tài)度和方式測驗情景盡量標準化 測驗焦慮穩(wěn)定被試情緒 與受測者建立良好的協(xié)調(diào)關系 評分技術標準化測驗中答卷最好與測驗分開(七)測驗常模當一個人的測驗分數(shù)通過與其他人的分數(shù)進行比較而得到解釋的時候,這個比較被稱為基于常模的解釋, 而比較每個個體所用的分數(shù)被稱為常模,它為解釋測驗分數(shù)提供了標準。常模群體規(guī)定了系列標準,基于 常模的分數(shù)是個體與特定常模群體相比較所處的位置。1常模與常模團體(1)定義 常模:根據(jù)標準化樣本的測驗分數(shù)經(jīng)過統(tǒng)計處理而建立起來的具有參照點和單位的測驗量表 常模團體:獲得常模的具有某種共同特征的群體樣本(2 )

22、確定常模團體的注意事項 群體構成的界限必須明確 必須是所測群體的一個代表性樣本 取樣過程必須明確且有詳盡的描述 樣本大小要適當 常模團體應試現(xiàn)時代的 注意一般常模與特殊常模的結(jié)合2分數(shù)的轉(zhuǎn)換與合成(1 )分數(shù)轉(zhuǎn)換 (這部分內(nèi)容請參考心統(tǒng)學習) 原始分數(shù):被試在接受測驗后,根據(jù)測驗的積分標準,對照被試的反映所計算出的測驗分數(shù) 其反映了被試作答的正確程度,但不能直接反映出被試之間的差異狀況和被試在總體分布中的位置。導出分數(shù):在原始分數(shù)轉(zhuǎn)換的基礎上,按照一定的規(guī)則,經(jīng)過統(tǒng)計處理后獲得的具有一定參考點和單位且可以相互比較的分數(shù) 分數(shù)轉(zhuǎn)換:按某種規(guī)則將原始分數(shù)轉(zhuǎn)化為導出分數(shù)的過程 百分等級在一個群體的測

23、驗分數(shù)中,得分低于這個分數(shù)的人數(shù)的百分比計算: PR 100 100R 50 其中 PR為百分等級, R 為排名順序的序號, N 為被試總?cè)藬?shù)團體人數(shù)過大分數(shù)以次數(shù)分布表的形式呈現(xiàn)時:L fFb其中 X 為被試原始分數(shù), L 為被試所在組分數(shù)下限, f 為被試所在組次數(shù), i 為組距, Fb 為被試所組以下各組次數(shù)和評價:百分等級雖然方便,但單位不等,只具有順序性特征而無法說明被試差異的數(shù)量XX 標準分數(shù)一種具有相等單位的量數(shù),又稱Z 分數(shù),即 ZS由于 Z分數(shù)常出現(xiàn)小數(shù)和負值,我們可進一步將其轉(zhuǎn)變?yōu)門分數(shù): T 10Z 50(2 )分數(shù)合成 分數(shù)合成:將幾個分數(shù)或幾個預測源組合起來,以獲得一

24、個合成分數(shù)或作總的預測具體包括三種情況,即:項目的組合、分測驗的組合、測驗的組合 直覺合成這種根據(jù)直覺的經(jīng)驗,主觀地將各種因素加權,而獲得結(jié)論或預測的方法叫臨床診斷 優(yōu)點:具有高度和綜合性具有靈活的針對性缺點:易受決策者的偏見影響缺乏精確的數(shù)量分析 加權求和將各測驗分數(shù)相加或乘以加權系數(shù)后相加 前提:各測驗所測特質(zhì)間有互相代償作用,這些測驗的分數(shù)又是連續(xù)性資料,并能大體同時獲得 多重回歸研究一種事物或現(xiàn)象與其他多種事物或現(xiàn)象在數(shù)量上相互聯(lián)系和互相制約的統(tǒng)計方法 很多情況下,需要利用測驗結(jié)果對預測效標做出估計,即求出效標估計與預測變量之間的數(shù)量關系式:Y a b1x1 b2 x2bn xn范圍:

25、適合于所測特質(zhì)具有某種程度的互償性 多重劃分在各個特質(zhì)上多定一個標準,所有測驗按順序?qū)嵤?,通過一個才能進行下一個,完全合格要全面達標 (3 )常模的編制 確定有關的比較團體 獲得該團體成員的測驗分數(shù) 把原始分數(shù)轉(zhuǎn)化為量表分數(shù) (4)幾種常用的常模 心理年齡首先尋找并設計出可區(qū)分各年齡兒童智力的題目,每個題目放在大部分的兒童都能成功地完成的那個年齡水平。把每個年齡 水平的題目綜合得到一個可評價兒童智力發(fā)展水平的年齡量表。一個兒童在量表上所得的分數(shù),就是最能代表他的智力水平 的年齡,即稱(林)智齡。 年級當量將被試的測驗成績與某一年級的學生的平均分數(shù)做比較,而說明相當于某一年級水平。 教育商數(shù)教育

26、年齡EQ 100 其中教育年齡是指某歲兒童所取得的平均教育成就實際年齡 成就商數(shù)將一個學生的教育成就與其智力作比較,反映學生的努力度和教師的教學效果:教育商數(shù)智力商數(shù)100教齡智齡100(八)標準參照測驗1標準參照測驗的定義與作用標準參照測驗:根據(jù)某一明確界定的內(nèi)容范圍而縝密編制的測驗,并且被試在測驗上所得結(jié)果也是根據(jù)某一明確界定的行為標準直接進行解釋的作用:了解個體在所規(guī)定的測量內(nèi)容上的行為水平,因此其出發(fā)點是個體本身的絕對水平而不再是個體間的水平差異2標準參照測驗的題目分析 #(1 )內(nèi)容范圍的確定 內(nèi)容范圍具有明確的邊界 范圍的內(nèi)容可進行細致分類,有明確的結(jié)構 特定測驗目的的確定常為內(nèi)容

27、范圍的界定提供依據(jù)(2 )內(nèi)容效度分析對構成測驗的每一個題目是否合適以及有效進行分析,即檢驗題目與測驗內(nèi)容范圍所要求的內(nèi)容與目標的一致性,這一過程缺 乏客觀的統(tǒng)計分析手段,通常采用專家評定的方法。(3 )測驗的預測前測 - 后測方法 在一組被試接受教學過程前后各施測一次 已接受教學組 - 未接受教學組方法 對照組方法 由教師評定是否掌握知識的兩組(4 )難度分析用通過率來表示。5 )區(qū)分度分析 鑒別指數(shù) :掌握組在某項目上的通過率減去未掌握組在該項的通過率,即 D PA PB個人獲得指數(shù) :前測- 后測法中,前測中錯誤回答某項目的被試在后測中能正確回答的人數(shù)與之前錯誤人數(shù)之比 相關系數(shù) :項目

28、的分和測驗總分之間的一致性程度3標準參照測驗的信度與效度 #1)信度測驗 A及格不及格測驗 B及格ab不及格cd考察被試在同一測驗的兩次施測中是否被分在同一類中(2)效度內(nèi)容效度照搬常模分析中的內(nèi)容效度分析方法效標關聯(lián)效度運用剛才在信度中使用的四格表的分析法,只不過這里的測驗 AB 分別指預測源測驗和效標測驗4標準參照測驗的分數(shù)解釋(1 )專家判定法 在測驗的內(nèi)容范圍明確界定的基礎之上,由專家來判斷處于臨界水平的被試在每一題目上正確回答的可能性,進一步一次為標 準確定分數(shù)分界點。臨界水平被試:那些剛由未掌握水平轉(zhuǎn)入掌握水平的被試,這些被試實際上是在專家的想象中虛擬出來的(2 )效標組預測法臨界

29、組法 :由專家判定和選擇一組正處于臨界水平的被試,將測驗施測于該組被試,計算他們在測驗上的平均成績,以體現(xiàn) 測驗的內(nèi)容范圍所要求的臨界水平,因而可以視之為測驗分數(shù)分界點的估計值對照組法 :采取專家判定的方法來事先確定兩組被試,一組被明確判定為掌握組,另一組則被明確判定為非掌握組,那些不 太容易被判定的被試一概提出。對這樣兩組被試施測測驗,可以得到原始分布圖,途中兩條曲線的交叉點即為測 驗分數(shù)的分界點(九)心理測驗理論的新發(fā)展1經(jīng)典測驗理論的局限對信度的估計精度不高, 平行測驗難以實現(xiàn)誤差指標籠統(tǒng)單一 ,僅把測驗分數(shù)劃分成真分數(shù)和隨機測量誤差兩部分 各種參數(shù)的估計對樣本抽樣的依賴性太大 ,如題目

30、的難度是相對考生而言的 參數(shù)指標之間的配套性較差 真分數(shù)與觀測分數(shù)之間存在線性關系的假定不合理2項目反應理論潛在特質(zhì):沒有明確的物理與生理屬性的,制約人的行為的心理特征 項目反應理論:以受測者回答問題的情況,通過某種數(shù)學函數(shù)曲線,推算出受測者某個心理特質(zhì)變量大小 所依據(jù)的函數(shù)叫做項目特征函數(shù)。項目反應理論的優(yōu)點:題目參數(shù)的跨群體不變性 (題目的特征函數(shù)是固定的) 潛在特質(zhì)量表的可選擇性 參數(shù)設計的科學性 信息函數(shù)概念的引進與信息函數(shù)的可加性3概化理論概化理論的基本思想:任何測量都是依賴于特定的測驗情景關系的,測驗情景關系中的測量目標、測量側(cè)面、測量側(cè)面的水平 都是會變化的,它們的變化會引起測驗誤差的來源、測驗誤差的大小、真分數(shù)的種類以及測驗信度的變化,同時測驗分數(shù)的解 釋范圍也發(fā)生變化。概化理論

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論