心理學(xué)考研筆記(測(cè)量心理學(xué))_第1頁
心理學(xué)考研筆記(測(cè)量心理學(xué))_第2頁
心理學(xué)考研筆記(測(cè)量心理學(xué))_第3頁
心理學(xué)考研筆記(測(cè)量心理學(xué))_第4頁
心理學(xué)考研筆記(測(cè)量心理學(xué))_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、三、心理測(cè)量的基本理論心理測(cè)量的根本目的是幫助人們做出重要的決定。(一)心理測(cè)量的理論基礎(chǔ)1心理測(cè)量的基本概念(1)心理測(cè)量的定義心理測(cè)量:根據(jù)一定的法則用數(shù)字對(duì)人的行為加以確定 即依據(jù)一定的心理學(xué)理論,使用一定的操作程序,給人的行為和心理屬性確定出一種數(shù)量化的價(jià)值。心理測(cè)驗(yàn):對(duì)行為樣組進(jìn)行客觀和標(biāo)準(zhǔn)化的測(cè)量,其本質(zhì)上是心理測(cè)量的工具 心理測(cè)驗(yàn)有三個(gè)要素,即行為樣組、標(biāo)準(zhǔn)化、客觀性。(2)心理測(cè)量的特點(diǎn)間接性心理屬性是內(nèi)在的不可直接測(cè)量到的特質(zhì),但可表現(xiàn)為一系列具有內(nèi)在聯(lián)系的外顯行為,測(cè)量者可以通過一定的 方法測(cè)量這些外顯行為,并由這些行為判別特質(zhì)的性質(zhì)。相對(duì)性對(duì)人的行為進(jìn)行比較,沒有絕對(duì)的標(biāo)

2、準(zhǔn),亦即沒有絕對(duì)零點(diǎn),我們有的只是一個(gè)連續(xù)的行為序列。所有的心理測(cè)量都是看每個(gè)人處在這個(gè)序列的什么位置上,也就是只有順序量表的特征??陀^性實(shí)際上就是測(cè)驗(yàn)的標(biāo)準(zhǔn)化問題。測(cè)驗(yàn)用的項(xiàng)目,說明、言語、態(tài)度、評(píng)分、分?jǐn)?shù)轉(zhuǎn)換、解釋都需要標(biāo)準(zhǔn)化。2心理測(cè)量的特征分類(1)按所測(cè)量的心理特征分類能力測(cè)驗(yàn)個(gè)人已有的知識(shí)、經(jīng)驗(yàn)、技能成就測(cè)驗(yàn)經(jīng)過正式教育或訓(xùn)練后對(duì)新知識(shí)和技能的掌握程度人格測(cè)驗(yàn)性格、氣質(zhì)、興趣、態(tài)度、品德、情緒、動(dòng)機(jī)、信念、價(jià)值觀等(2)按接受測(cè)量的人數(shù)分類個(gè)別測(cè)驗(yàn)一名主試在一段時(shí)間內(nèi)測(cè)量一名被試團(tuán)體測(cè)驗(yàn)一段時(shí)間內(nèi)一名主試同時(shí)測(cè)量許多人(3)按測(cè)驗(yàn)?zāi)康姆诸惷枋鲂詼y(cè)驗(yàn)僅僅是進(jìn)行描述診斷性測(cè)驗(yàn)對(duì)為了解決

3、存在的問題而預(yù)先做出的診斷預(yù)示性測(cè)驗(yàn)了解人的潛能和未來的表現(xiàn)(4)按測(cè)驗(yàn)要求分類最高作為測(cè)驗(yàn)被試盡可能做出最好的表現(xiàn)典型作為測(cè)驗(yàn)被試按通常的習(xí)慣和沒有壓力的方式做出反應(yīng)(5)按評(píng)價(jià)所參照的標(biāo)準(zhǔn)分類常模參照測(cè)驗(yàn)將被試的水平與常模比較,以評(píng)價(jià)被試在團(tuán)體中的相對(duì)地位為目的目標(biāo)參照測(cè)驗(yàn)將被試水平與一個(gè)絕對(duì)標(biāo)準(zhǔn)比較潛力參照測(cè)驗(yàn)將被試水平與自身潛力相比較3經(jīng)典測(cè)量理論和真分?jǐn)?shù)理論模型(1)基本定義真分?jǐn)?shù):反映被試某種心理特質(zhì)真正水平的數(shù)值 其是一個(gè)在理論上構(gòu)想出來的抽象概念,在實(shí)際測(cè)量中很難得到觀察分?jǐn)?shù):實(shí)測(cè)到的分?jǐn)?shù) 我們希望通過改進(jìn)和完善測(cè)量工具及方法的方式來使得觀察分?jǐn)?shù)盡量接近真分?jǐn)?shù)。CTT數(shù)學(xué)模型:

4、觀察分?jǐn)?shù)與真分?jǐn)?shù)之間是一種線形關(guān)系,并只相差一個(gè)隨機(jī)誤差 其中X表示觀察分?jǐn)?shù);T表示真分?jǐn)?shù);E表示隨機(jī)誤差(不包含系統(tǒng)誤差)(2)CTT模型的三個(gè)假設(shè)公理反復(fù)測(cè)量得到的觀察分?jǐn)?shù)的平均值會(huì)接近真分?jǐn)?shù),E服從均值為零的正態(tài)分布真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零平行測(cè)驗(yàn)上的誤差分?jǐn)?shù)之間相關(guān)為零 平行測(cè)驗(yàn):題目不同的測(cè)驗(yàn)測(cè)的是同一特質(zhì),且題目形式、數(shù)量、難度、區(qū)分度以及測(cè)查等值團(tuán)體后所得分?jǐn)?shù)的分布一致(3)CTT模型的方差關(guān)系在一次測(cè)量中,被試觀察分?jǐn)?shù)的方差等于其真分?jǐn)?shù)方差與誤差分?jǐn)?shù)方差之和真分?jǐn)?shù)變異還可以分成與測(cè)量目的有關(guān)的變異和與測(cè)量目的無關(guān)的變異(二)測(cè)量的信度與效度1測(cè)量的信度(1)信度的定義信度

5、:測(cè)量結(jié)果的穩(wěn)定程度 若能用同一測(cè)量工具反復(fù)測(cè)量某人的同一心理特質(zhì),則其多次測(cè)量的結(jié)果間的一致性程度就叫信度。信度的三個(gè)等價(jià)操作定義:信度是一個(gè)被測(cè)團(tuán)體的真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)的變異數(shù)之比信度是一個(gè)被試團(tuán)體的真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平方信度是一個(gè)測(cè)驗(yàn)與其任意一個(gè)平行測(cè)驗(yàn)的相關(guān)系數(shù)(這個(gè)定義具有實(shí)際意義)(2)信度系數(shù)的估計(jì) 重測(cè)信度:用同一個(gè)量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的一致性程度 計(jì)算:其大小等一同一組被試兩側(cè)測(cè)驗(yàn)所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)(參見MJ心理大綱詳解-心統(tǒng)P8) 實(shí)用的前提條件:所測(cè)量的心理特性必須是穩(wěn)定的 遺忘和聯(lián)系的效果基本上互相抵消 兩側(cè)測(cè)驗(yàn)的間隔被試的特質(zhì)沒有

6、變化 復(fù)本信度:兩個(gè)平行的測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致性程度 計(jì)算:其大小亦等于兩側(cè)測(cè)驗(yàn)分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。 前提:有條件構(gòu)造出兩份或以上真正平行的測(cè)驗(yàn) 被試有條件接受兩個(gè)測(cè)驗(yàn) 分半信度:將一個(gè)測(cè)驗(yàn)分成對(duì)等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度 也可以把對(duì)等的半測(cè)驗(yàn)堪稱是在最短時(shí)距內(nèi)施測(cè)的兩個(gè)平行測(cè)驗(yàn)。 計(jì)算:先按照復(fù)本信度的方式計(jì)算出半個(gè)測(cè)驗(yàn)的信度,然后用斯皮爾曼-布朗公式校正 若兩個(gè)分半測(cè)驗(yàn)分?jǐn)?shù)變異不等時(shí)則用 或 前提:通常在只能施測(cè)一次或沒有復(fù)本的情況下使用 由于將測(cè)驗(yàn)分半的方法很多,因此一個(gè)測(cè)驗(yàn)有多個(gè)分半信度值 同質(zhì)性信度:測(cè)驗(yàn)內(nèi)部所有題目間的一致程度 這里的一致性

7、指所有題目都測(cè)的是同在一種心理特質(zhì),也指所有題目得分之間都具有較高的正相關(guān) 計(jì)算:,為題目數(shù),為答對(duì)答錯(cuò)題的比例 ,表示所有被試在題上的分?jǐn)?shù)變異 評(píng)分者信度:多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致性程度 計(jì)算:評(píng)分者為2用積差相關(guān)或登記相關(guān),大于2用肯德爾和諧系數(shù)估計(jì)(參見MJ心理大綱詳解-心統(tǒng)P9)(3)信度的影響因素與改進(jìn)影響因素:被試方面、主試方面、施測(cè)情景、測(cè)量工具、兩側(cè)施測(cè)間隔(越短越好)提高方法:適當(dāng)增加測(cè)驗(yàn)的項(xiàng)目數(shù) 使測(cè)驗(yàn)中試題的難度接近中等水平的正態(tài)分布 提高測(cè)驗(yàn)試題的區(qū)分度 盡量選取同質(zhì)性較強(qiáng)的團(tuán)體上的信度2測(cè)量的效度(1)效度的定義效度:一個(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)得

8、心理特質(zhì)的程度效度的操作定義:效度是總變異中由所測(cè)量的特性造成的變異所占的百分比效度的三個(gè)性質(zhì):效度是針對(duì)一次或某幾次測(cè)驗(yàn)的具體結(jié)果的效度是針對(duì)某種特定的測(cè)驗(yàn)?zāi)康牡男Ф戎皇浅潭壬系牟町?,不是有無的差別(2)效度的估計(jì)效度估計(jì)就是多方尋找證據(jù)來證明測(cè)驗(yàn)的有效性程度的過程。(測(cè)量中效度與實(shí)驗(yàn)中不同,區(qū)別理解。 MJ注) 內(nèi)容效度:一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到的內(nèi)容與所要測(cè)量的內(nèi)容之間的吻合程度 估計(jì)一個(gè)測(cè)驗(yàn)的內(nèi)容效度就是去確定該測(cè)驗(yàn)在多大程度上代表了所要測(cè)量的行為領(lǐng)域。 適用范圍:內(nèi)容效度主要應(yīng)用于成就測(cè)驗(yàn),也適合于某些用于選拔和分類的職業(yè)測(cè)驗(yàn)而不是和能力和人格測(cè)驗(yàn) 確定方法:明確欲測(cè)內(nèi)容的范圍,包括知識(shí)范圍

9、和能力要求兩個(gè)方面 確定每個(gè)題目所測(cè)得內(nèi)容,并與測(cè)驗(yàn)編制者所列的雙向細(xì)目表對(duì)照 制定評(píng)定表,考察題目對(duì)內(nèi)容的覆蓋率及其比例和內(nèi)容的適當(dāng)性并判斷題目難度與能力要求間差異 統(tǒng)計(jì)計(jì)算:從同一內(nèi)容中抽兩套平行測(cè)驗(yàn)對(duì)一批被試測(cè)驗(yàn),兩次相關(guān)高說明有效度(除非兩個(gè)測(cè)驗(yàn)偏向同一方面); 也可以用再測(cè)法,通過后側(cè)成績(jī)與前側(cè)成績(jī)比較。 結(jié)構(gòu)效度:測(cè)驗(yàn)?zāi)苷f明心理學(xué)上的理論結(jié)構(gòu)或特質(zhì)的程度,或用心理學(xué)上某種結(jié)構(gòu)或特質(zhì)來解釋測(cè)驗(yàn)分?jǐn)?shù)的恰當(dāng)程度 結(jié)構(gòu)指用來解釋人類行為的理論框架或心理特質(zhì),是心理學(xué)中抽象的假設(shè)性概念、特性或變量。 特點(diǎn):結(jié)構(gòu)效度的大小首先取決于實(shí)現(xiàn)假定的心理特質(zhì)理論 當(dāng)實(shí)際測(cè)量的資料無法證實(shí)我們的理論假設(shè)

10、時(shí),不一定表明該測(cè)驗(yàn)結(jié)構(gòu)效度不高 結(jié)構(gòu)效度是市通過對(duì)測(cè)量?jī)?nèi)容的選擇的證據(jù)累計(jì)起來確定的,不是靠單一數(shù)量指標(biāo)描述的 確定方法:提出理論假設(shè),并把假設(shè)分解成一些細(xì)小的綱目 依據(jù)理論框架,推演出有關(guān)測(cè)驗(yàn)成績(jī)的假設(shè) 用邏輯的和實(shí)證的方法來驗(yàn)證假設(shè) 應(yīng)用范圍:主要用于治理測(cè)驗(yàn)、人格測(cè)驗(yàn)等 估計(jì)方法:從測(cè)驗(yàn)內(nèi)部尋找證據(jù),先考察測(cè)驗(yàn)的內(nèi)容效度 在測(cè)驗(yàn)間尋找,將新編測(cè)驗(yàn)與已知有效的測(cè)驗(yàn)比較 考察測(cè)驗(yàn)的實(shí)證效度 多種特質(zhì)-多種方法矩陣法 實(shí)證效度:一個(gè)測(cè)驗(yàn)對(duì)處于特定情景中的個(gè)體的行為進(jìn)行估計(jì)的有效性,也就是說以實(shí)踐效果作為檢驗(yàn)有效性的表準(zhǔn) 根據(jù)效標(biāo)資料搜集的時(shí)間差異,實(shí)證效度可分為同時(shí)效度和預(yù)測(cè)效度兩種。 效標(biāo)

11、是作為檢驗(yàn)效度的標(biāo)準(zhǔn)的被估計(jì)的行為,即衡量測(cè)驗(yàn)是否有效且獨(dú)立與測(cè)驗(yàn)的外在標(biāo)準(zhǔn)。 確定方法:明確觀念效標(biāo) 確定效標(biāo)測(cè)量 考察測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的關(guān)系 估計(jì)方法:相關(guān)法計(jì)算測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)系數(shù) 區(qū)分法被試接受測(cè)驗(yàn)后,讓他們工作一段時(shí)間,再根據(jù)工作成績(jī)的好壞分成兩組。這時(shí)再回過頭來分析這兩組被試原先分?jǐn)?shù)的差異,將成績(jī)與分?jǐn)?shù)比較 命中率決策的命中率是測(cè)驗(yàn)有效性的較好指標(biāo)(3)效度的影響因素與改進(jìn)影響因素:測(cè)驗(yàn)的構(gòu)成、測(cè)驗(yàn)的實(shí)施過程、被試情況、所選效標(biāo)的性質(zhì)、測(cè)量的信度提高方法:精心編制測(cè)驗(yàn)量表,避免出現(xiàn)較大的系統(tǒng)誤差 妥善組織測(cè)驗(yàn),控制隨機(jī)誤差 創(chuàng)設(shè)標(biāo)準(zhǔn)的應(yīng)試情景,讓每個(gè)被試都能發(fā)揮正常的水平

12、 選擇正確的效標(biāo)、定好恰當(dāng)?shù)男?biāo)測(cè)量,正確地使用有關(guān)公式3信度和效度的關(guān)系根據(jù)公式,可以得到信度與效度的關(guān)系如下:信度高是效度高的必要而非充分條件測(cè)驗(yàn)的效度受它的信度制約(三)心理測(cè)量的誤差誤差是世界本原通往人類認(rèn)知途中的收費(fèi)站和化妝師。 Major S.Lu1測(cè)量誤差的定義測(cè)量誤差:在測(cè)量過程中由那些與測(cè)量目的無關(guān)的變化因素所產(chǎn)生的一種不準(zhǔn)確或不一致的測(cè)量效應(yīng) 心理測(cè)量的誤差包括隨機(jī)誤差和系統(tǒng)誤差兩種。隨機(jī)誤差:由與測(cè)量目的無關(guān)的、偶然因素引起的、而又不易控制的誤差 它使多次測(cè)量產(chǎn)生不一致的結(jié)果,其方向和大小的變化完全是隨機(jī)的,只符合某種統(tǒng)計(jì)規(guī)律。系統(tǒng)誤差:由與測(cè)量目的無關(guān)的變量引起的一種恒

13、定而又規(guī)律的效應(yīng) 這種誤差穩(wěn)定的存在與每次測(cè)量之中,盡管多次測(cè)量結(jié)果一致,但仍與真實(shí)值有所差異。2測(cè)量的隨機(jī)誤差來源及控制(1)來源測(cè)試環(huán)境溫度、光線、噪音等測(cè)試時(shí)間時(shí)間安排不統(tǒng)一,或測(cè)試時(shí)間過短主試因素年齡、性別、穿著、言談舉止、表情,主試的數(shù)量過多也會(huì)造成壓力意外干擾停電、巨響、有人生病、作弊、測(cè)驗(yàn)用品出問題、糧食漲價(jià)、火星人入侵評(píng)分計(jì)分主觀題評(píng)分不客觀,有個(gè)人偏好(2)控制測(cè)驗(yàn)準(zhǔn)備盡可能充分細(xì)致,實(shí)測(cè)個(gè)方面盡量標(biāo)準(zhǔn)化3測(cè)量的系統(tǒng)誤差來源及控制(1)來源測(cè)驗(yàn)難度過高或過低測(cè)驗(yàn)內(nèi)容選題不當(dāng)、題數(shù)太少、模棱兩可、表述不清被試因素應(yīng)試動(dòng)機(jī)變化、測(cè)驗(yàn)焦慮、測(cè)試經(jīng)驗(yàn)、學(xué)習(xí)與發(fā)展、反應(yīng)傾向、生理因素(

14、2)控制題目編制認(rèn)真用心,測(cè)驗(yàn)標(biāo)準(zhǔn)化4測(cè)量誤差的估計(jì)?其中為信度系數(shù)(四)心理測(cè)驗(yàn)的項(xiàng)目分析項(xiàng)目分析:測(cè)驗(yàn)編制過程中,為了改善和提高測(cè)驗(yàn)的信度和效度,在組成測(cè)驗(yàn)之前,應(yīng)對(duì)組成測(cè)驗(yàn)的每個(gè)題目進(jìn)行分析1題目的難度(1)定義難度:測(cè)驗(yàn)項(xiàng)目的難易程度,一個(gè)測(cè)驗(yàn)項(xiàng)目,如果大部分被試都能答對(duì),則該項(xiàng)目的難度就小,反之亦然 測(cè)驗(yàn)的記分方法不同,項(xiàng)目難度的計(jì)算方法也不同。(2)計(jì)算 二分法記分項(xiàng)目的難度以通過率來表示(注:這里通過率的概念和我們通常理解的難度相反) 其中代表項(xiàng)目難度;為全體被試數(shù);為答對(duì)通過該項(xiàng)目的人數(shù) 當(dāng)被試人數(shù)較多時(shí),將被試依照測(cè)驗(yàn)總分從高到低排列,用總分最高的27%作為高分組,總分最低的

15、27%作為低分組 其中和分別代表高分組合低分組的通過率 非二分法記分項(xiàng)目的難度其中為被試在某一項(xiàng)目上的平均分;為該項(xiàng)目的滿分(3)難度水平的確定進(jìn)行難度分析的主要目的是為了篩選項(xiàng)目,項(xiàng)目的難度水平多高合適,取決于測(cè)驗(yàn)的目的及性質(zhì):水平考試:目的在于了解被試某方面知識(shí)技能的掌握情況 不必過多考慮難度,認(rèn)為重要的內(nèi)容都可選用,甚至極高極低通過率的題選拔考試:目的在于選拔并錄用人員 項(xiàng)目難度易控制在錄取率左右,即較多地采用那些難度值接近錄取率的項(xiàng)目(4)難度的等距變換普通難度指數(shù)是順序變量,無法指出難度之間差異的大小,我們?cè)O(shè)法將其轉(zhuǎn)變?yōu)榈染嗔繑?shù):根據(jù)正態(tài)分布曲線將難度P作為正態(tài)曲線下的面積,轉(zhuǎn)換成Z

16、分?jǐn)?shù)為避免小數(shù)和負(fù)值,再用公式進(jìn)行變換(注:可以看出新難度與我們通常理解的難度相同)(5)難度對(duì)測(cè)驗(yàn)的影響難度過大和過小都造成測(cè)驗(yàn)分?jǐn)?shù)偏離正態(tài),而心理特質(zhì)和我們經(jīng)常使用的統(tǒng)計(jì)分布卻都是正態(tài)的過難或過易題目的存在都會(huì)使得測(cè)驗(yàn)分?jǐn)?shù)相對(duì)集中,造成分?jǐn)?shù)全距縮小2題目的區(qū)分度(1)定義區(qū)分度:測(cè)驗(yàn)項(xiàng)目對(duì)被試心理品質(zhì)水平差異的區(qū)分能力 具有良好區(qū)分度的項(xiàng)目,能將不同水平的被試區(qū)分開來,反之則不能。(2)計(jì)算 鑒別指數(shù)法適合于二分法記分的項(xiàng)目 其中和分別代表高分組合低分組的通過率 相關(guān)法以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)或測(cè)驗(yàn)總分的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo) 常用的有:點(diǎn)二列相關(guān)、二列相關(guān)、相關(guān)、積差相關(guān)3題目的綜合分析和

17、篩選難度越接近0.5,項(xiàng)目潛在區(qū)分度越大,因此整個(gè)測(cè)驗(yàn)的難度平均應(yīng)保持在0.5左右測(cè)驗(yàn)中各項(xiàng)目之間有一定相關(guān),為了使成績(jī)分布均勻,項(xiàng)目難度的應(yīng)廣一些,梯度大一些,最好成正態(tài)分布每項(xiàng)題目理想的區(qū)分度都應(yīng)在0.3以上,至少是0.2(五)心理測(cè)驗(yàn)的編制技術(shù)1心理測(cè)驗(yàn)編制的基本程序確定測(cè)驗(yàn)?zāi)康拿鞔_測(cè)量的對(duì)象、目標(biāo)、用途制定編題計(jì)劃雙向細(xì)目表編輯測(cè)驗(yàn)項(xiàng)目收集測(cè)驗(yàn)資料、選擇項(xiàng)目形式、編寫測(cè)驗(yàn)項(xiàng)目預(yù)測(cè)與項(xiàng)目分析合成測(cè)驗(yàn)測(cè)驗(yàn)項(xiàng)目的選擇和編排,并在必要時(shí)編制副本測(cè)驗(yàn)的標(biāo)準(zhǔn)化測(cè)驗(yàn)內(nèi)容、施測(cè)過程、評(píng)分、分?jǐn)?shù)解釋,都要標(biāo)準(zhǔn)化鑒定測(cè)驗(yàn)鑒定其信度和效度,并確定測(cè)驗(yàn)量表和常模編寫測(cè)驗(yàn)說明書2測(cè)驗(yàn)?zāi)繕?biāo)與命題雙向細(xì)目表(1)測(cè)

18、驗(yàn)?zāi)繕?biāo)測(cè)驗(yàn)?zāi)繕?biāo):所編測(cè)驗(yàn)是用來測(cè)量什么心理變量或行為特征的 測(cè)驗(yàn)?zāi)繕?biāo)必須有操作定義,即目標(biāo)要非常具體。(2)命題雙向細(xì)目表命題雙向細(xì)目表:測(cè)驗(yàn)編制過程中的重要依據(jù),即相當(dāng)于編題的計(jì)劃清單,是包括兩個(gè)維度(雙向)的表格 指出測(cè)驗(yàn)所包含的內(nèi)容與要測(cè)定的各種技能,以及對(duì)每一個(gè)內(nèi)容和技能的相對(duì)重要程度。 功能:雙向細(xì)目表可以使命題工作避免盲目性而具有計(jì)劃性;使命題者明確測(cè)驗(yàn)的目標(biāo),把握試題的比例與份量,提高命題的效率和質(zhì)量。同時(shí),它對(duì)于審查試題的效度和覆蓋面也有重要的指導(dǎo)意義。3題目編制技術(shù)#題目編制的一般原則:測(cè)試題要反映測(cè)驗(yàn)?zāi)康?,并?duì)所測(cè)量的內(nèi)容有代表性測(cè)試題適合于被試的能力水平,且能區(qū)分出不同水

19、平的被試測(cè)試題所提供的信息不能對(duì)答案有暗示作用題目之間互相獨(dú)立,不能互相暗示題干簡(jiǎn)明,重點(diǎn)突出避免雙重否定的語法題目的敘述要簡(jiǎn)明易懂,杜絕晦澀語言題目盡量有唯一正確答案避免使用性別歧視、種族歧視和攻擊性用語及涉及社會(huì)禁忌和個(gè)人隱私的內(nèi)容一個(gè)測(cè)試題測(cè)量一個(gè)內(nèi)容或概念(六)心理測(cè)驗(yàn)的施測(cè)1測(cè)驗(yàn)的設(shè)計(jì)測(cè)驗(yàn)設(shè)計(jì):對(duì)測(cè)驗(yàn)的結(jié)構(gòu)和內(nèi)容、可達(dá)到的目的、結(jié)果可提供的信息、使用范圍、心理學(xué)指標(biāo)等進(jìn)行總體設(shè)計(jì)2施測(cè)的程序和步驟#施測(cè)前的準(zhǔn)備工作準(zhǔn)備材料、掌握程序、熟記指導(dǎo)語指導(dǎo)語直接影響受測(cè)者反映的態(tài)度和方式測(cè)驗(yàn)情景盡量標(biāo)準(zhǔn)化測(cè)驗(yàn)焦慮穩(wěn)定被試情緒與受測(cè)者建立良好的協(xié)調(diào)關(guān)系評(píng)分技術(shù)標(biāo)準(zhǔn)化測(cè)驗(yàn)中答卷最好與測(cè)驗(yàn)分開(七

20、)測(cè)驗(yàn)常模當(dāng)一個(gè)人的測(cè)驗(yàn)分?jǐn)?shù)通過與其他人的分?jǐn)?shù)進(jìn)行比較而得到解釋的時(shí)候,這個(gè)比較被稱為基于常模的解釋,而比較每個(gè)個(gè)體所用的分?jǐn)?shù)被稱為常模,它為解釋測(cè)驗(yàn)分?jǐn)?shù)提供了標(biāo)準(zhǔn)。常模群體規(guī)定了系列標(biāo)準(zhǔn),基于常模的分?jǐn)?shù)是個(gè)體與特定常模群體相比較所處的位置。1常模與常模團(tuán)體(1)定義常模:根據(jù)標(biāo)準(zhǔn)化樣本的測(cè)驗(yàn)分?jǐn)?shù)經(jīng)過統(tǒng)計(jì)處理而建立起來的具有參照點(diǎn)和單位的測(cè)驗(yàn)量表常模團(tuán)體:獲得常模的具有某種共同特征的群體樣本(2)確定常模團(tuán)體的注意事項(xiàng)群體構(gòu)成的界限必須明確必須是所測(cè)群體的一個(gè)代表性樣本取樣過程必須明確且有詳盡的描述樣本大小要適當(dāng)常模團(tuán)體應(yīng)試現(xiàn)時(shí)代的注意一般常模與特殊常模的結(jié)合2分?jǐn)?shù)的轉(zhuǎn)換與合成(1)分?jǐn)?shù)轉(zhuǎn)換

21、(這部分內(nèi)容請(qǐng)參考心統(tǒng)學(xué)習(xí))原始分?jǐn)?shù):被試在接受測(cè)驗(yàn)后,根據(jù)測(cè)驗(yàn)的積分標(biāo)準(zhǔn),對(duì)照被試的反映所計(jì)算出的測(cè)驗(yàn)分?jǐn)?shù) 其反映了被試作答的正確程度,但不能直接反映出被試之間的差異狀況和被試在總體分布中的位置。導(dǎo)出分?jǐn)?shù):在原始分?jǐn)?shù)轉(zhuǎn)換的基礎(chǔ)上,按照一定的規(guī)則,經(jīng)過統(tǒng)計(jì)處理后獲得的具有一定參考點(diǎn)和單位且可以相互比較的分?jǐn)?shù)分?jǐn)?shù)轉(zhuǎn)換:按某種規(guī)則將原始分?jǐn)?shù)轉(zhuǎn)化為導(dǎo)出分?jǐn)?shù)的過程 百分等級(jí)在一個(gè)群體的測(cè)驗(yàn)分?jǐn)?shù)中,得分低于這個(gè)分?jǐn)?shù)的人數(shù)的百分比 計(jì)算:其中為百分等級(jí),為排名順序的序號(hào),為被試總?cè)藬?shù) 團(tuán)體人數(shù)過大分?jǐn)?shù)以次數(shù)分布表的形式呈現(xiàn)時(shí): 其中為被試原始分?jǐn)?shù),為被試所在組分?jǐn)?shù)下限,為被試所在組次數(shù),為組距,為被試所組

22、以下各組次數(shù)和 評(píng)價(jià):百分等級(jí)雖然方便,但單位不等,只具有順序性特征而無法說明被試差異的數(shù)量 標(biāo)準(zhǔn)分?jǐn)?shù)一種具有相等單位的量數(shù),又稱Z分?jǐn)?shù),即 由于Z分?jǐn)?shù)常出現(xiàn)小數(shù)和負(fù)值,我們可進(jìn)一步將其轉(zhuǎn)變?yōu)門分?jǐn)?shù):(2)分?jǐn)?shù)合成分?jǐn)?shù)合成:將幾個(gè)分?jǐn)?shù)或幾個(gè)預(yù)測(cè)源組合起來,以獲得一個(gè)合成分?jǐn)?shù)或作總的預(yù)測(cè) 具體包括三種情況,即:項(xiàng)目的組合、分測(cè)驗(yàn)的組合、測(cè)驗(yàn)的組合 直覺合成 這種根據(jù)直覺的經(jīng)驗(yàn),主觀地將各種因素加權(quán),而獲得結(jié)論或預(yù)測(cè)的方法叫臨床診斷 優(yōu)點(diǎn):具有高度和綜合性具有靈活的針對(duì)性 缺點(diǎn):易受決策者的偏見影響缺乏精確的數(shù)量分析 加權(quán)求和將各測(cè)驗(yàn)分?jǐn)?shù)相加或乘以加權(quán)系數(shù)后相加 前提:各測(cè)驗(yàn)所測(cè)特質(zhì)間有互相代償作

23、用,這些測(cè)驗(yàn)的分?jǐn)?shù)又是連續(xù)性資料,并能大體同時(shí)獲得 多重回歸研究一種事物或現(xiàn)象與其他多種事物或現(xiàn)象在數(shù)量上相互聯(lián)系和互相制約的統(tǒng)計(jì)方法 很多情況下,需要利用測(cè)驗(yàn)結(jié)果對(duì)預(yù)測(cè)效標(biāo)做出估計(jì),即求出效標(biāo)估計(jì)與預(yù)測(cè)變量之間的數(shù)量關(guān)系式: 范圍:適合于所測(cè)特質(zhì)具有某種程度的互償性 多重劃分在各個(gè)特質(zhì)上多定一個(gè)標(biāo)準(zhǔn),所有測(cè)驗(yàn)按順序?qū)嵤?,通過一個(gè)才能進(jìn)行下一個(gè),完全合格要全面達(dá)標(biāo)(3)常模的編制確定有關(guān)的比較團(tuán)體獲得該團(tuán)體成員的測(cè)驗(yàn)分?jǐn)?shù)把原始分?jǐn)?shù)轉(zhuǎn)化為量表分?jǐn)?shù)(4)幾種常用的常模 心理年齡首先尋找并設(shè)計(jì)出可區(qū)分各年齡兒童智力的題目,每個(gè)題目放在大部分的兒童都能成功地完成的那個(gè)年齡水平。把每個(gè)年齡水平的題目綜合

24、得到一個(gè)可評(píng)價(jià)兒童智力發(fā)展水平的年齡量表。一個(gè)兒童在量表上所得的分?jǐn)?shù),就是最能代表他的智力水平的年齡,即稱(林)智齡。 年級(jí)當(dāng)量 將被試的測(cè)驗(yàn)成績(jī)與某一年級(jí)的學(xué)生的平均分?jǐn)?shù)做比較,而說明相當(dāng)于某一年級(jí)水平。 教育商數(shù) 其中教育年齡是指某歲兒童所取得的平均教育成就 成就商數(shù) 將一個(gè)學(xué)生的教育成就與其智力作比較,反映學(xué)生的努力度和教師的教學(xué)效果: (八)標(biāo)準(zhǔn)參照測(cè)驗(yàn)1標(biāo)準(zhǔn)參照測(cè)驗(yàn)的定義與作用標(biāo)準(zhǔn)參照測(cè)驗(yàn):根據(jù)某一明確界定的內(nèi)容范圍而縝密編制的測(cè)驗(yàn),并且被試在測(cè)驗(yàn)上所得結(jié)果也是根據(jù)某一明確界定的行為標(biāo)準(zhǔn)直接進(jìn)行解釋的作用:了解個(gè)體在所規(guī)定的測(cè)量?jī)?nèi)容上的行為水平,因此其出發(fā)點(diǎn)是個(gè)體本身的絕對(duì)水平而不再

25、是個(gè)體間的水平差異2標(biāo)準(zhǔn)參照測(cè)驗(yàn)的題目分析#(1)內(nèi)容范圍的確定內(nèi)容范圍具有明確的邊界范圍的內(nèi)容可進(jìn)行細(xì)致分類,有明確的結(jié)構(gòu)特定測(cè)驗(yàn)?zāi)康牡拇_定常為內(nèi)容范圍的界定提供依據(jù)(2)內(nèi)容效度分析對(duì)構(gòu)成測(cè)驗(yàn)的每一個(gè)題目是否合適以及有效進(jìn)行分析,即檢驗(yàn)題目與測(cè)驗(yàn)內(nèi)容范圍所要求的內(nèi)容與目標(biāo)的一致性,這一過程缺乏客觀的統(tǒng)計(jì)分析手段,通常采用專家評(píng)定的方法。(3)測(cè)驗(yàn)的預(yù)測(cè)前測(cè)-后測(cè)方法在一組被試接受教學(xué)過程前后各施測(cè)一次已接受教學(xué)組-未接受教學(xué)組方法對(duì)照組方法由教師評(píng)定是否掌握知識(shí)的兩組(4)難度分析用通過率來表示。(5)區(qū)分度分析鑒別指數(shù):掌握組在某項(xiàng)目上的通過率減去未掌握組在該項(xiàng)的通過率,即個(gè)人獲得指數(shù):

26、前測(cè)-后測(cè)法中,前測(cè)中錯(cuò)誤回答某項(xiàng)目的被試在后測(cè)中能正確回答的人數(shù)與之前錯(cuò)誤人數(shù)之比相關(guān)系數(shù):項(xiàng)目的分和測(cè)驗(yàn)總分之間的一致性程度3標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度與效度#(1)信度考察被試在同一測(cè)驗(yàn)的兩次施測(cè)中是否被分在同一類中測(cè)驗(yàn)A及格不及格測(cè)驗(yàn)B及格ab不及格cd(2)效度內(nèi)容效度照搬常模分析中的內(nèi)容效度分析方法效標(biāo)關(guān)聯(lián)效度運(yùn)用剛才在信度中使用的四格表的分析法,只不過這里的測(cè)驗(yàn)AB分別指預(yù)測(cè)源測(cè)驗(yàn)和效標(biāo)測(cè)驗(yàn)4標(biāo)準(zhǔn)參照測(cè)驗(yàn)的分?jǐn)?shù)解釋(1)專家判定法在測(cè)驗(yàn)的內(nèi)容范圍明確界定的基礎(chǔ)之上,由專家來判斷處于臨界水平的被試在每一題目上正確回答的可能性,進(jìn)一步一次為標(biāo)準(zhǔn)確定分?jǐn)?shù)分界點(diǎn)。臨界水平被試:那些剛由未掌握水平

27、轉(zhuǎn)入掌握水平的被試,這些被試實(shí)際上是在專家的想象中虛擬出來的(2)效標(biāo)組預(yù)測(cè)法臨界組法:由專家判定和選擇一組正處于臨界水平的被試,將測(cè)驗(yàn)施測(cè)于該組被試,計(jì)算他們?cè)跍y(cè)驗(yàn)上的平均成績(jī),以體現(xiàn)測(cè)驗(yàn)的內(nèi)容范圍所要求的臨界水平,因而可以視之為測(cè)驗(yàn)分?jǐn)?shù)分界點(diǎn)的估計(jì)值對(duì)照組法:采取專家判定的方法來事先確定兩組被試,一組被明確判定為掌握組,另一組則被明確判定為非掌握組,那些不太容易被判定的被試一概提出。對(duì)這樣兩組被試施測(cè)測(cè)驗(yàn),可以得到原始分布圖,途中兩條曲線的交叉點(diǎn)即為測(cè)驗(yàn)分?jǐn)?shù)的分界點(diǎn)(九)心理測(cè)驗(yàn)理論的新發(fā)展1經(jīng)典測(cè)驗(yàn)理論的局限對(duì)信度的估計(jì)精度不高,平行測(cè)驗(yàn)難以實(shí)現(xiàn)誤差指標(biāo)籠統(tǒng)單一,僅把測(cè)驗(yàn)分?jǐn)?shù)劃分成真分?jǐn)?shù)

28、和隨機(jī)測(cè)量誤差兩部分各種參數(shù)的估計(jì)對(duì)樣本抽樣的依賴性太大,如題目的難度是相對(duì)考生而言的參數(shù)指標(biāo)之間的配套性較差真分?jǐn)?shù)與觀測(cè)分?jǐn)?shù)之間存在線性關(guān)系的假定不合理2項(xiàng)目反應(yīng)理論潛在特質(zhì):沒有明確的物理與生理屬性的,制約人的行為的心理特征項(xiàng)目反應(yīng)理論:以受測(cè)者回答問題的情況,通過某種數(shù)學(xué)函數(shù)曲線,推算出受測(cè)者某個(gè)心理特質(zhì)變量大小所依據(jù)的函數(shù)叫做項(xiàng)目特征函數(shù)。項(xiàng)目反應(yīng)理論的優(yōu)點(diǎn):題目參數(shù)的跨群體不變性(題目的特征函數(shù)是固定的)潛在特質(zhì)量表的可選擇性參數(shù)設(shè)計(jì)的科學(xué)性信息函數(shù)概念的引進(jìn)與信息函數(shù)的可加性3概化理論概化理論的基本思想:任何測(cè)量都是依賴于特定的測(cè)驗(yàn)情景關(guān)系的,測(cè)驗(yàn)情景關(guān)系中的測(cè)量目標(biāo)、測(cè)量側(cè)面、測(cè)

29、量側(cè)面的水平都是會(huì)變化的,它們的變化會(huì)引起測(cè)驗(yàn)誤差的來源、測(cè)驗(yàn)誤差的大小、真分?jǐn)?shù)的種類以及測(cè)驗(yàn)信度的變化,同時(shí)測(cè)驗(yàn)分?jǐn)?shù)的解釋范圍也發(fā)生變化。概化理論的統(tǒng)計(jì)分析分為兩個(gè)階段,即G研究和D研究。(1)G研究觀察領(lǐng)域:研究者設(shè)計(jì)的測(cè)驗(yàn)情景關(guān)系及用一定方法采集的測(cè)驗(yàn)數(shù)據(jù)G研究在觀察領(lǐng)域數(shù)據(jù)上進(jìn)行,其目的是要定量估計(jì)觀察領(lǐng)域中測(cè)量目標(biāo)的方差以及各測(cè)量側(cè)面所產(chǎn)生的測(cè)量誤差方差。從統(tǒng)計(jì)角度說就是要分解觀察數(shù)據(jù)總體方差,估計(jì)各因素期望方差,采用的方法是方差分量分析法,把總體方差分解為測(cè)量目標(biāo)主效應(yīng)方差、測(cè)量側(cè)面主效應(yīng)方差、各種交互效應(yīng)方差。(2)D研究D研究稱作決策研究,其目的是利用G研究的結(jié)果數(shù)據(jù),在原設(shè)計(jì)

30、的測(cè)驗(yàn)情況關(guān)系范圍之內(nèi),分析比較各種可能的測(cè)驗(yàn)方案,測(cè)驗(yàn)工作者可以根據(jù)分析結(jié)果,結(jié)合可能的實(shí)施條件優(yōu)選實(shí)際測(cè)驗(yàn)方差。D研究最終提供各種測(cè)驗(yàn)方案下的測(cè)驗(yàn)誤差估計(jì)值。4測(cè)驗(yàn)等值測(cè)驗(yàn)等值:通過對(duì)考核同一心理品質(zhì)的多個(gè)測(cè)驗(yàn)形式做出測(cè)量分?jǐn)?shù)系統(tǒng)轉(zhuǎn)換,使得這些不同測(cè)驗(yàn)形式的測(cè)驗(yàn)分?jǐn)?shù)之間有可比性 測(cè)驗(yàn)等值可使不同形式的測(cè)驗(yàn)分?jǐn)?shù)均對(duì)應(yīng)起來,測(cè)驗(yàn)主持者可以任意指定其中的一個(gè)分?jǐn)?shù)形式作為基準(zhǔn),而使其他形式的分?jǐn)?shù)都轉(zhuǎn)化到這個(gè)基準(zhǔn)形式上。(1)測(cè)驗(yàn)等值的條件同質(zhì)性被等值的不同測(cè)驗(yàn)形式所測(cè)的必須是同一種心理品質(zhì)且內(nèi)容與范圍基本相同等信度被等值的不同測(cè)驗(yàn)形式必須有相等的測(cè)驗(yàn)信度公平性考生參加被等值的不同測(cè)驗(yàn)形式中的任一個(gè)

31、測(cè)試,等之后的結(jié)果都是一樣的可遞推性不同遞推途徑所得到結(jié)果相同對(duì)稱性測(cè)驗(yàn)間的等值轉(zhuǎn)換關(guān)系是雙向的樣本不變性兩測(cè)驗(yàn)的轉(zhuǎn)換關(guān)系是內(nèi)在的,不隨所使用樣本的變化而變化(2)計(jì)算方法等百分位等值:如果連個(gè)分?jǐn)?shù)對(duì)于任何一個(gè)被試群體都有相同的百分等級(jí),那么這兩個(gè)分?jǐn)?shù)就被認(rèn)為是等值的線性等值:如果兩個(gè)分?jǐn)?shù)在各自的群體內(nèi)標(biāo)準(zhǔn)分?jǐn)?shù)相等,這兩個(gè)分?jǐn)?shù)被認(rèn)為是等值的四、心理測(cè)驗(yàn)的應(yīng)用(一)成就測(cè)驗(yàn)1成就測(cè)驗(yàn)的定義成就測(cè)驗(yàn):對(duì)個(gè)體在一階段的學(xué)習(xí)或訓(xùn)練之后知識(shí)、技能的發(fā)展水平的測(cè)定 與其他心里測(cè)驗(yàn)不同的是,成就測(cè)驗(yàn)希望看到練習(xí)和發(fā)展的效應(yīng);與能力測(cè)驗(yàn)一樣,成就測(cè)驗(yàn)屬于最佳行為測(cè)驗(yàn)。2成就測(cè)驗(yàn)的編制確定測(cè)驗(yàn)?zāi)康模x定測(cè)驗(yàn)編制

32、的方法分析測(cè)量目標(biāo),擬定測(cè)驗(yàn)編制計(jì)劃編題征題與選題組卷調(diào)查測(cè)驗(yàn)質(zhì)量參數(shù),編制測(cè)驗(yàn)常模編寫測(cè)驗(yàn)指導(dǎo)書,正式出版發(fā)行3成就測(cè)驗(yàn)的標(biāo)準(zhǔn)化命題組卷標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化施測(cè)評(píng)分標(biāo)準(zhǔn)化測(cè)驗(yàn)分?jǐn)?shù)解釋標(biāo)準(zhǔn)化(二)智力測(cè)驗(yàn)1智力測(cè)驗(yàn)的定義智力測(cè)驗(yàn):以一定的智力理論為基礎(chǔ),通過測(cè)驗(yàn)得到智力的量化數(shù)據(jù)比率智商:2個(gè)體智力測(cè)驗(yàn) 小學(xué)教師培養(yǎng)工作總結(jié) 一年來,我校在上級(jí)部門的指導(dǎo)下,積極開展教師教育教學(xué)能力的提高培訓(xùn)工作,有效提高了教師的各種教育教學(xué)實(shí)際能力,為我校取得良好的辦學(xué)成效起了重要的作用?;仡櫸覀兊墓ぷ鳎饕邢旅鎺c(diǎn)做法和體會(huì):一、制定計(jì)劃,常抓不懈這一學(xué)年雖然新來教師不多只有湯毛毛一位老師,但是我們還是很重視對(duì)她的成長(zhǎng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論