心理測量學的知識

上傳人：y*** IP屬地：天津上傳時間：2022-01-14 格式：DOCX 頁數(shù)：19 大小：35.06KB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩14頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

1、第五章心理測量學知識第一節(jié) 概述第一單元測量與測量量表一、什么是測量1. 測量是依據(jù)一定的法則用數(shù)字對事物加以確定。該定義包括三個要素，即事物、數(shù)字和法則。2. 數(shù)字具有區(qū)分性、序列性、等距性和可加性。二、則量要素（一）參照點1. 要確定事物的量，必須有一個計算的起點，這個起點叫做參照點。2. 參照點有兩種：一是絕對零點。二是人為確定的參照點，即相對零點。3. 理想的參照點是絕對零點，但在心理測量中很難找到絕對零點，多采用人為標定的測量零點。（二）單位：具備兩個條件1. 有確定的意義。2. 有相同的價值。三、測量量表根據(jù)量表的精確程度，斯蒂文斯將測量從低級到高級分成四種水平：（一）命名量

2、表1. 命名量表是測量水平最低的一種量表形式，只用數(shù)字來代表事物或把事物歸類。2. 這種量表分為兩種：（1）代號用數(shù)字來代表個別事物。（2）類別用數(shù)字來代表具有某一屬性的事物的全體。3. 在命名量表中，數(shù)字只用來作標記和分類，而不能作數(shù)量化分析，既不能比大小，也不能做加、減、乘、除運算。（二）順序量表1. 順序量表比命名量表水平高，其中的數(shù)字不僅指明類別，同時也指明類別的大小或含有某種屬性的程度。 2數(shù)字包含有數(shù)量關系，代表符號是“>”，如A > B > C等，主要用于分等或排出順序。3. 順序量表既無相等單位，又無絕對零點，數(shù)字僅表示等級，并不表示某種屬性的真正量或絕

3、對值。（三）等距量表1. 有大小關系，而且具有相等的單位，其數(shù)值可做加、減運算，但因為沒有絕對零點，所以不能做乘、除運算。2. 等距量表的數(shù)值加上或減去一個常數(shù)，或者用一個常數(shù)去乘或除，不會破壞原來數(shù)據(jù)之間的等距關系。（四）等比量表1. 等比量表是最高水平的量表，既有相等單位，又有絕對零點。2. 長度、重量、時間等都是等比量表，其數(shù)值可以做加、減、乘、除運算。心理測量是在順序量表上進行，利用某種統(tǒng)計方法，可以把順序量表得到的數(shù)據(jù)換算為等距數(shù)據(jù)來進行統(tǒng)計。第二單元心理測量的基本概念一、心理測量的定義：依據(jù)心理學理論，使用一定的操作程序，通過觀察人的少數(shù)有代表性的行為，對于貫穿在人的全部行

4、為活動中的心理特點做出推論和數(shù)量化分析的一種科學手段。二、心理測量的性質(zhì)（一）間接性（二）相對性（三）客觀性第三單元心理測驗的分類一、按測驗的功能分類（一）智力測驗：智力測驗的功能是測量人的一般智力水平。（二）特殊能力測驗：特殊能力測驗偏重測量個人的特殊潛在能力。（三）人格測驗：主要用于測量性格、氣質(zhì)、興趣、態(tài)度、情緒、動機、信念等方面的個性心理特征，亦即個性中除能力以外的部分。二、按測驗材料的性質(zhì)分類（一）文字測驗（二）操作測驗：又稱非文字測驗。三、按測驗材料的嚴謹程度分類（一）客觀測驗：絕大多數(shù)心理測驗都屬這類測驗。（二）投射測驗：代表性有羅夏測驗、主題統(tǒng)覺測驗、自由聯(lián)想測驗和句

5、子完成測驗。四、按測驗的方式分類（一）個別測驗（二）團體測驗：團體測驗材料，也可以個別方式實施，但個別測驗材料不能以團體方式進行。五、按測驗的要求分類（一）最高行為測驗（二）典型行為測驗：各種人格測驗均屬典型行為測驗。第四單元糾正錯誤的測驗觀一、錯誤的測驗觀（一）測驗萬能論（二）測驗無用論（三）心理測驗即智力測驗二、正確的測驗觀（一）心理測驗是重要的心理學研究方法之一，是決策的輔助工具。（二）心理測驗作為研究方法和測量工具尚不完善第五單元心理測驗在心理咨詢中的應用一、智力測驗二、人格測驗三、心理評定量表第六單元心理測量的發(fā)展史一、科學心理測驗的產(chǎn)生與發(fā)展1. 首先倡導科學心理測驗的學

6、者是英國生物學家和心理學家高爾頓。2. 高爾頓提出人的不同氣質(zhì)特點和智能是按身體特點的不同而遺傳的。為了研究差異的遺傳性，便設計了測量差異的方法。4.皮爾遜創(chuàng)立積差相關法，這使判定3. 高爾頓為心理測驗奠定了統(tǒng)計學基礎，第一個提出了相關的概念。心理測驗的信度、效度和進行因素分析成為可能。5.卡特爾發(fā)表“心理測驗與測量”一文，這是心理測驗第一次出現(xiàn)于心理學文獻中。心理測驗如果有一個普遍的標準，則其科學的與實用的價值都可以增加。6.比內(nèi)用一種測驗的方法去辨別和發(fā)現(xiàn)智力落后的兒童，是世界上第一個正式的心理測驗。（一）操作測驗的發(fā)展（二）團體智力測驗的發(fā)展（三）能力傾向測驗的發(fā)展（四）人格測驗的

7、發(fā)展二、現(xiàn)代心理測驗在我國的發(fā)展近年來，我國的心理學家正在致力于心理測驗的本土化，編制適合我國文化背景的智力測驗、適應行為量表等，并已取得了初步成果。第二節(jié) 測驗的常模第一單元常模團體一、常模團體的性質(zhì)1. 掌柜團體是由具有某種共同特征的人所組成的一個群體，或者是該群體的一個樣本。2. 在確定常模團體時，先確定一般總體，再確定目村總體，最后確定樣本。二、常模團體的條件（一）群體的構(gòu)成必須明確界定（二）常模團體群體必須是所測群體的代表性樣本（三）樣本的大小要適當1. 取樣誤差與樣本大小成反比。2. 應從經(jīng)濟的或?qū)嵱玫目赡苄院蜏p少誤差這兩方面來綜合考慮樣本的大小。般最低不小于 30 或

8、100 個；3. 如果總體數(shù)目小，只有幾十個人，則需要100%的樣本；如果總體數(shù)目大，全國性常模，一般應有 20003000 人為宜。4. 樣本大小適當?shù)年P鍵是樣本要有代表性。（四）標準化樣組是一定時空的產(chǎn)物三、取樣的方法取樣即是從目標人群中選擇有代表性的樣本。（一）簡單隨機抽樣（二）系統(tǒng)抽樣（又稱等距抽樣）：要求目標總體無等級結(jié)構(gòu)存在，無內(nèi)部循環(huán)規(guī)律存在。（三）分組抽樣：可以先將群體進行分組，再在組內(nèi)進行隨機取樣。（四）分層抽樣：分為兩種方法：即分層比例抽樣和分層非比例抽樣。四、常模與常模分數(shù)（一）常模：1. 常模是一種供比較的標準量數(shù)，由標準化樣本測試結(jié)果計算而來，它是心理測驗時用于比

9、較和解釋測驗結(jié)果的參照分數(shù)標準。2. 按照樣本的大小和來源，通常有全國常模、區(qū)域常模和特殊常模。3. 根據(jù)具體應用標準和分數(shù)特征，則有百分位常模和標準分常模等。（二）常模分數(shù)1. 常模分數(shù)就是施測常模樣本后，將受測者的原始分數(shù)按一定規(guī)則轉(zhuǎn)換出來的導出分數(shù)。2. 導出分數(shù)的特性包括等單位、帶參照點的有意義的導出分數(shù)。第二單元常模的類型一、發(fā)展常模個人的成績與各種發(fā)展水平的人的平均表現(xiàn)相比較。根據(jù)這種平均表現(xiàn)所制成的量表就是發(fā)展常模，亦稱年齡量表。在此量表中，個人的分數(shù)指出他的行為在按正常途徑發(fā)展方面處于什么樣的發(fā)展水平。（一）發(fā)展順序量表1. 最直觀的發(fā)展常模是發(fā)展順序量表，說明兒童發(fā)

10、育情況：發(fā)育正常、發(fā)育超前和發(fā)育滯后。適應性、語言、社會性四個方面的大致發(fā)展水平。28 周手； 40 周軀干、坐、爬； 52 周腿腳、站、行走。兒童 5 歲時理解質(zhì)量守恒， 6 歲掌握重量守恒， 7 歲有容量2. 葛塞爾發(fā)展程序表，按月份顯示兒童在運動水平、3. 嬰兒的感覺運動發(fā)展是 4 周眼睛； 16 周頭；4. 皮亞杰最著名的工作就是對守恒概念的研究。守恒概念。（二）智力年齡1. 比內(nèi)西蒙量表中首先使用智力年齡的概念。2. 一個兒童在年齡量表上所得的分數(shù)，就是最能代表他的智力水平的年齡。這種分數(shù)叫做智力年齡，簡稱智齡。3. 年級當量：常模樣本中 6年級的算術(shù)平均分為 35,某兒童在算術(shù)測

11、驗中也得 35 分，那么，就有“該兒童的算術(shù)能力是 6 年級水平”的表述。二、百分位常模（一）百分等級：應用最廣的表示測驗分數(shù)的方法。（二）百分點：也稱百分位數(shù)1. 在分數(shù)量表上，相對于某一百分等級的分數(shù)點就叫百分點或百分位數(shù)。2. 由原始分數(shù)計算百分等級，又可以由百分等級確定原始分數(shù)。通過這樣的雙向方式編制的原始分數(shù)與百分等級對照表，就是百分位常模。（三）四分位數(shù)和十分位數(shù)25%、50%、75%1. 百分位數(shù)是將量表分成100 份，而四分位數(shù)是將量表分成四等份，相當于百分等級的對應的三個百分點分成的四段。2. 十分位數(shù)也可以依此類推， 1%10%為第一段， 91%100% 為第十段。三、

12、標準分常模標準分常模是將原始分數(shù)與平均數(shù)的距離以標準差為單位表示出來的量表。基本單位是標準差，所以叫標準分數(shù)。（一）線性轉(zhuǎn)換的標準分數(shù)： Z 分數(shù)為最典型的線性轉(zhuǎn)換的標準分數(shù)。原始分數(shù)轉(zhuǎn)換成標準分數(shù)：X 為任一原始分數(shù)， X 為樣本平均數(shù)， SD 為樣本標準差。轉(zhuǎn)換形式為： Z=A+B Z 為轉(zhuǎn)換后的標準分數(shù)， A、B 為根據(jù)需要指定的常數(shù)。加上一個常數(shù)是為了去掉負值，乘以一個常數(shù)是為了使單位變小從而去掉小數(shù)點。T 分數(shù)是以 50 為平均數(shù)，以 10 為標準差來表示的。標準九分是以 5 為平均數(shù)、以 2 為標準差的一個分數(shù)量表。標準十分是以 5.5 為平均數(shù)，以 1.5 為標準差。標

13、準二十分是以 10為平均數(shù)，以 3 為標準差。離差智商是以 100 為平均數(shù)，一般是以 15 為標準差。（二）非線性轉(zhuǎn)換的標準分數(shù)：當原始分數(shù)不是常態(tài)分布時，也可以通過非線性轉(zhuǎn)換使之常態(tài)化。常態(tài)化過程主要是將原始分數(shù)轉(zhuǎn)化為百分等級，再將百分等級轉(zhuǎn)化為常態(tài)分布上相應的標準分數(shù)。四、智商及其意義若心理年齡高于其生理年齡，則智力較一般兒童高，若心理年齡低于其生理年齡，則智力較一般兒童低。但在使用中發(fā)現(xiàn)，單純用心理年齡來表示智力高低的方法缺乏不同年齡兒童間的可比性，提出用比率智商和離差智商來表示智力的高低。（一）比率智商：心理年齡 MA與實足年齡 CA之比。由于個體心理年齡與實足年齡并不同

14、步增長，所以比率智商并不適合于年齡較大的受測者。（二）離差智商：韋克斯勒將離差智商的平均數(shù)定為 100, 標準差定為 15. 離差智商建立在統(tǒng)計學的基礎之上，它表示的是個體智力在年齡組中所處的位置，因而是表示智力高低的一種理想的指標。從不同測驗獲得的離差智商只有當標準差相同或相近時才可以比較，標準差不同，其分數(shù)的意義便不同。第三單元常模分數(shù)的表示方法一、轉(zhuǎn)換表法1. 最簡單、最基本的表示常模的方法就是轉(zhuǎn)換表，也叫常模表。2. 一個轉(zhuǎn)換表顯示出一個特定的標準化樣組的原始分數(shù)與其相對應的等值分數(shù)百分位數(shù)、標準分數(shù)、 T分數(shù)或者其他任何分數(shù)。3. 測驗的使用者利用轉(zhuǎn)換表可將原始分數(shù)轉(zhuǎn)換為與其對

15、應的導出分數(shù)，從而對測驗的分數(shù)作出有意義的解釋。二、剖面圖法：是將測驗分數(shù)的轉(zhuǎn)換關系用圖形表示出來。從剖面圖上可以很直觀地看出受測者在各個分測驗上的表現(xiàn)及其相對的位置。第三節(jié) 測驗的信度第一單元信度的概念一、信度的定義1. 信度是指同一受測者在不同時間內(nèi)用同一測驗重復測量，所得結(jié)果的一致程度。2. 信度只受隨機誤差的影響，隨機誤差越大，信度越低。二、信度的指標（一）信度系數(shù)與信度指數(shù)1. 信度是以信度系數(shù)為指標，它是一種相關系數(shù)。常常是同一受測者樣本所得的兩組資料的相關。2. 信度指數(shù)也可作信度的指標。信度指數(shù)的平方就是信度系數(shù)。（二）測量標準誤測量的標準誤與信度之間有互為消長的關系：

16、信度越高，標準誤越小；信度越低，標準誤越大。第二單元信度評估的方法不同的信度反映測驗誤差的不同來源。一、重測信度1. 重測信度又稱穩(wěn)定性系數(shù)。它的計算方法是采用重測法，即使用同一測驗，在同樣條件下對同一組受測者前后施測兩次，求兩次得分間的相關系數(shù)。2. 重測估計信度的優(yōu)點：能提供有關測驗是否隨時間而變化的資料，可作為受測者將來行為表現(xiàn)的依據(jù)。其缺點是易受練習和記憶的影響。最適宜的時距一般是兩周到四周較宜，間隔時間最好不超過六個月。二、復本信度1. 復本信度又稱等值性系數(shù)。復本信度反映的是測驗在內(nèi)容上的等值性，故又稱等值性系數(shù)。2. 兩個復本的施測相隔一段時間，則稱重測復本信度或穩(wěn)定與等值

17、系數(shù)。3. 復本信度的優(yōu)點是能夠避免重測信度的一些問題，局限性：其一，如果測量的行為易受練習的影響，則復本信度只能減少而不能完全消除這種影響；其二，由于第二個測驗只改變了題目的內(nèi)容，已經(jīng)掌握的解題原則，可以很容易地遷移到同類問題上去；其三，對于許多測驗來說，建立復本是十分困難的。三、內(nèi)部一致性信度重測信度和復本信度主要考察了測驗跨時間的一致性（穩(wěn)定性）和跨形式的一致性（等值性）（一）分半信度：指采用分半法估計所得的信度系數(shù)。通常是在測驗實施后將測驗按項目編號的奇數(shù)、偶數(shù)分為等值的兩半，并分別計算每位受測者在兩半測驗上的得分，求出這兩半分數(shù)的相關系數(shù)。這個相關系數(shù)就代表了兩半測驗內(nèi)容取

18、樣的一致程度。（二）同質(zhì)性信度1.同質(zhì)性主要代表測驗內(nèi)部所有題目間的一致性。2.所有題目看起來好像測量同一特質(zhì)，但相關很低或為負相關時，其測驗為異質(zhì)。四、評分者信度為了衡量評分者之間的信度高低，可隨機抽取若干份測驗卷，由兩位評分者按評分標準分別給分，然后再根據(jù)每份測驗卷的兩個分數(shù)計算相關，即得評分者信度。一般要求在成對的受過訓練的評分者之間平均一致性達 0.9 以上，才認為評分是客觀的。第三單元信度與測驗分數(shù)的解釋一、解釋真實分數(shù)與實得分數(shù)的相關10%是來自測驗的誤差。 rxx=1.00,0.00 到 1.00 的正數(shù)范圍，代表0.95；而人格測驗、興趣、態(tài)度、當 rxx=0.9 時，說

19、明實得分數(shù)中有90%的變異是真分數(shù)造成的，僅則表示完全沒有測量誤差，rxx=O,反映的是測量誤差。信度系數(shù)的分布是從了從缺乏信度到完全可信的所有狀況。二、確定信度可以接受的水平一般的能力測驗和成就測驗的信度系數(shù)都在0.90以上，有的可以達價值觀等測驗的信度一般在0.800.85或更高些。一般原則是：當rxxV 0.70時，測驗因不可靠而不能用;當0.70 < rxx< 0.85時，可用于團體比較；當0.85時，才能用來鑒別或預測個人成績或作為。另一個原則是：新編的測驗信度應高于原有的同類測驗或相似測驗。三、解釋個人分數(shù)的意義1. 主要體現(xiàn)在兩個方面：一是估計真實分數(shù)的范圍；二是為

20、了解實得分數(shù)再測時可能的變化情形。人們一般采用 95%的概率水平，其置信區(qū)間：X-1.96SE < Xt<X+1.96SE四、比較不同測驗分數(shù)的差異第四單元影響信度的因素一、樣本特征（一）樣本團體異質(zhì)性的影響一般而言，若獲得信度的取樣團體較為異質(zhì)的話，往往會高估測驗的信度，相反則會低估測驗的信度。（二）樣本團體平均能力水平的影響二、測驗長度1. 測驗長度，亦即測題的數(shù)量。一般來說，在一個測驗中增加同質(zhì)的題目，可以使信度提高。第一，測驗越長，測驗的測題取樣或內(nèi)容取樣就越有代表性。第二，測驗越長，受測者的猜測因素影響就越小。增加測驗長度的效果應遵循報酬遞減率原則，測驗過長是得

21、不償失的，有時反而會引起受測者的疲勞和反感而降低可靠性。三、測驗難度難度對信度的影響，只存在于某些測驗中，如智力測驗、成就測驗、能力傾向測驗等，對于人格測驗、興趣測驗、態(tài)度量表等不存在難度問題，因為這些測驗的題目的答案沒有正確或錯誤之分。四、時間間隔以再測法或復本法求信度，兩次測驗相隔進間越短，其信度系數(shù)越大；間隔時間越久，其他變因介入的可能性越大，受外界的影響也越大，信度系數(shù)便越低。第四節(jié) 測驗的效度第一單元效度的概念一、效度的定義1. 在心理測驗中，效度是指所測量的與所要測量的心理特點之間的符合程度，或者簡單地說是指一個心理測驗的準確性。2. 測量的效度除受隨機誤差影響外

22、，還受系統(tǒng)誤差的影響。可信的測驗未必有效，而有效的測驗必定可信。二、效度的性質(zhì)（一）相對性：必須考慮其目的與功能（二）連續(xù)性第二單元效度評估的方法一、內(nèi)容效度（一）內(nèi)容效度：指的是測驗題目對有關內(nèi)容或銅佛取樣的適用性，即該測驗是否是所欲測量的行為領域的代表性取樣。（二）內(nèi)容效度的評估方法1.專家判斷法：請有關專家對測驗題目與原定內(nèi)容的符合性做出判斷，看測驗的題目是否代表規(guī)定的內(nèi)容。如果專家認為測驗題目恰當?shù)卮砹怂鶞y內(nèi)容，則測驗具有內(nèi)容效度，內(nèi)容效度有時又稱“邏輯效度”2. 內(nèi)容效度確定的三個步驟：（1）定義好測驗內(nèi)容的總體范圍，描述有關的知識與技能及所用材料的來源；（ 2）編制雙

23、向細目表。（3）制定評定量表來測量測驗的整個效度。2. 統(tǒng)計分析法：除了描述性語言外，內(nèi)容效度的確定也可采用一些統(tǒng)計分析方法，如計算兩個評分者之間評定的一致性，復本相關，再測法。3. 經(jīng)驗推測法（三）內(nèi)容效度的特性1.表面效度是由外行對測驗作表面上的檢查確定的，它不反映測驗實際測量的東西，只是指測驗表面上看來好像是測量所要測的東西。祥盡地、系統(tǒng)地對測驗作評價而建立的。典型行為測驗卻要求較低的表面效度。2. 內(nèi)容效度是由夠資格的判斷者（專家）3. 最高行為測驗要求有較高的表面效度，：涉及的是心理學的理論概念問題，是指測驗能夠測量到理論上的二、構(gòu)想效度（一）什么是構(gòu)想效度（或結(jié)構(gòu)效度）構(gòu)想或

24、特質(zhì)的程度，即測驗的結(jié)果是否能證實或解釋某一理論的假設、術(shù)語或構(gòu)想，解釋的程度如何。（二）構(gòu)想效度的估計方法1. 對測驗本身的分析：是通過研究測驗內(nèi)部結(jié)構(gòu)來界定理論要想，從而為構(gòu)想效度提供證據(jù)。如測驗的內(nèi) 容效度，測驗的內(nèi)部一致性指標，分析受測者對題目的反應特點。2.測驗間的相互比較：計算兩種測驗之間得分的相關，其中一個測驗是待研究效度，另一個是已有效度證據(jù)的成熟的測驗，但兩者測量的是同一種心理特質(zhì)。假如相關高，說明新測驗能所測量的特質(zhì)確實是老測驗所反映的特質(zhì)或行為。兩種測驗之間的相關系數(shù)稱為相容效度，相容效度是構(gòu)想效度的證據(jù)之一。如區(qū) 分效度，因素分析法。3. 效標效度的研究證明（ 1

25、）根據(jù)效標選取不同的受測者形成相對照的兩組，再比較兩組受測者的測驗成績，若測驗分數(shù)能很好地將兩組分開，則說明構(gòu)想效度不錯。（2）另一種證實構(gòu)想效度的方法是分析心理持質(zhì)的發(fā)展變化。4. 實驗法和觀察法證實三、效標效度（一）什么是效標效度1. 效標效度反映的是測驗預測個體在某種情境下行為表現(xiàn)的有效性程度。這種效度需要在實踐中檢驗，所以又稱實證效度。2.根據(jù)效標資料是否與測驗分數(shù)同時獲得，又可以分為同時效度和預測效度兩類。同時效度和預測效度意義上的差異，主要不是來源于時間，而是來自測驗的目的，前者與用來診斷現(xiàn)狀的測驗有關，后者與預測將來結(jié)果的測驗有關。3. 一個好的效標必須具備四個條件：（

26、 1）效標必須能最有效地反映測驗的目標，即效標測量本身必須有效。（2）效標必須具有較高的信度，穩(wěn)定可靠，不隨時間等因素而變化。（3）效標可以客觀地加以測量，可用數(shù)據(jù)或等級來表示。（4）效標測量的方法簡單，省時省力，經(jīng)濟實用。（二）效標效度的評估方法1. 相關法：是評估效標效度最常用的方法，是求測驗分數(shù)與效標資料間的相關，這一相關系數(shù)稱為效度系數(shù)。計算效度系數(shù)最常用積差相關法。當測驗成績是連續(xù)變量，而效標資料是二分變量時，計算效度系數(shù) 可用點二列相關公式或二列相關公式。點二列相關與二列相關的區(qū)別是前者其中一個是真正的二分稱名變量，而后者兩個變量原來都是連續(xù)變量，其中一個由于某種原因，被人為

27、地分為兩個類別，變成了二分稱名變量。當測驗分數(shù)為連續(xù)變量，效標資料為等級評定時，用賈斯朋多系列相關公式計算。2. 區(qū)分法：是檢驗測驗分數(shù)能否有效地區(qū)分由效標所定義的團體的一種方法。3. 命中率法：（ 1）預測成功而且實際也成功；預測成功但實際失敗；預測失敗而事實上成功；預測失敗且實際上也失敗。我們稱正確的預測（決定）為命中，不正確的預測（決定）為失誤。（ 2）正命中率高低常隨劃分測驗分數(shù)成功與失敗的臨界分數(shù)的高低而變化，臨界分數(shù)越高，正命中率越高；臨界分數(shù)越低，則正命中率也越低。第三單元效度的功能一、預測誤差：效度系數(shù)的實際意義常常以決定性系數(shù)來表示，決定性系數(shù)是效度系數(shù)的平方，它表示

28、測驗正確預測或解釋的效標的方差占總方差的比例。二、預測效標分數(shù)是預測的效標分數(shù)三、預測效率指數(shù)第四單元影響效度的因素凡能產(chǎn)生隨機誤差和系統(tǒng)誤差的因素都會降低測驗的效度。一、測驗本身的因素要保證測驗具有較高效度，要做好如下幾點：第一，測驗材料必須對整個內(nèi)容具有代表性。第二，測題設計時應盡量避免容易引起誤差的題型。第三，測題難度要適中，具有較高的區(qū)分度。第四，測驗長度要恰當，要有一定的測題量。第五，測題的排列按先易后難的順序排列。二、測驗實施中的干擾因素（一）主測者的影響因素（二）受測者的影響因素三、樣本團體的性質(zhì)（一）樣本團體的異質(zhì)性：與信度系數(shù)一樣，如果其他條件相同，樣本團體越同質(zhì)

29、，分數(shù)分布范圍越小，測驗效度就越低；樣本團體越異質(zhì)，分數(shù)分布范圍越大，測驗效度就越高。（二）干涉變量1. 對于不同性質(zhì)的團體，同一測驗的效度會有很大的不同。這些性質(zhì)包括年齡、性別、教育水平、智力、動機、興趣、職業(yè)和任何其他有關的特征。由于這些特征的影響，使得測驗對于不同的團體具有不同的預測能力，故測量學上稱這些特征為干涉變量。D。如果2. 確定干涉變量引用美國心理學家吉賽利提出的一套方法：第一，用回歸方程求得每個人的預測效標分數(shù)，將該分數(shù)與實際效標分數(shù)相比較，獲得差異分數(shù) D 的絕對值很大，說明測驗中可能存在干涉變量。第二，根據(jù)樣本團體的組成分析，找出對照組，分別計算效度。第三，對于

30、欲測團體，根據(jù)某些易見的干涉變量將其區(qū)分為預測性高和預測性低的兩個亞團體。四、效標的性質(zhì)：效標測量本身的可靠性即效標測量的信度，就是值得考慮的一個問題。第五節(jié) 項目分析測驗的項目分析包括定性分析和定量分析兩個方面。定性分析包括考慮內(nèi)容效度、題目編寫的恰當性和有效性等；定量分析主要是指對題目難度和區(qū)分度等進行分析。第一單元項目的難度一、定義1. 難度是指項目的難易程度。在能力測驗中通常需要一個反映難度水平的指標，在非能力測驗中，類似的指標是“通俗性” 。2. 公式：難度越高。3. 以通過率表示難度時，通過人數(shù)越多，難度越低；通過人數(shù)越小，二、計算方法（一）二分法記分的項目：通過記 1 分

31、，錯誤記 0 分。其中Ph和Pl分別代表高分組和低分組通過率。二）非二分記分的項目其中 Xmax 為該題的滿分。三、難度水平的確定（一）項目的難度取決于測驗的目的、性質(zhì)以及項目的形式。0.75 最為合適；而對于四選一的題目，其1. 進行難度分析的主要目的是為了篩選項目，項目難度的大小，2. P 值一般應大于概率水平。對于是非題而言，其難度值應該為難度值約為 0.63 最為合適。（二）測驗的難度1. 受測者樣本具有代表性，對于中等難度的測驗，其測驗總分應該接近常態(tài)分布。2. 最好使測驗中所包含的試題的難度在0.50±0.20 之間，平均難度接近 0.50.實際水平高的受測者能順利通

32、過，第二單元項目的區(qū)分度一、定義：也叫鑒別力，是指測驗項目對受測者的心理特性的區(qū)分能力。百實際水平低的受測者不能通過，我們就可以認為該項目有較高的區(qū)分度。二、計算方法（一）鑒別指數(shù)：步驟第一，按測驗總分的高低排列答卷。第二，確定高分組與低分組，每一組取答卷總數(shù)的27%。第三，分別計算高分組與低分組在該項目上的通過率或得分率。第四，按下列公式估計出項目的鑒別指數(shù)：高分組若在該測驗上的得分率高于低分組，則D> 0,D越大，說明該項目區(qū)分兩種不同水平的程度越高。若DV0,則反映高水平組在該項目上的得分率低于低水平組，說明項目有問題。鑒別指數(shù) 0.40 以上，很好；鑒別指數(shù) 0.19

33、以下，差，必須淘汰。（二）相關法：常用的計算方法有點二列相關、二列相關和相關法等。相關越高，表明項目越具有區(qū)分的功能。區(qū)分度取值范圍介于 -1 至+1 之間，若呈正相關，則區(qū)分度為正值；相關系數(shù)越大，區(qū)分度越高。三、區(qū)分度與難度的關系1. 較難的項目對高水平的受測者來說區(qū)分度高，較易的項目對低水平的受測者來說區(qū)分度高，中等難度的項目對中等水平的受測者區(qū)分度高。2. 項目難度的分布以常態(tài)分布為好，這樣不僅能保證多數(shù)項目具有較高的區(qū)分度，而且可以保證整個測驗對受測者具有較高的區(qū)分能力。第六節(jié) 測驗編制的一般程序第一單元測驗的目標分析一、測驗的對象：在編制測驗前，首先要明確測量的對象，也就是該測

34、驗編成后要用于哪些團體。只有對受測者的年齡、文化程度、社會經(jīng)濟狀況以及閱讀水平等做到心中有數(shù)，編制測驗時才能有的放矢。古德納夫分為樣本測驗和標記測驗。二、測驗的用途（一）顯示性測驗：是指測驗題目和所要測量的心理特征相似的測驗。（二）預測性測驗：是指預測一些沒被測量的行為的測驗。三、測驗的目標：是指編制的測驗是測什么的，即用來測量什么樣的心理變量或行為特征。（一）工作分析：步驟第一，確定哪些心理特征和行為可以使要預測的活動達到成功。第二，建立衡量受測者是否成功的標準，這個標準我們稱之為效標。（二）對特定概念下定義（三）確定測驗的具體內(nèi)容第二單元測題的編寫編制測驗題目是心理測驗編制

35、過程中最重要的一環(huán)。一、搜集資料：題目的來源分三方面（一）已出版的標準測驗：最簡單、最直接的方法是從已經(jīng)出版的各種標準測驗中選擇合適的題目。（二）理論和專家的經(jīng)驗（三）臨床觀察和記錄二、命題原則（一）內(nèi)容方面：要求題目的內(nèi)容符合測驗的目的，避免貪多而亂出題目；內(nèi)容取樣要有代表性，題目之間的內(nèi)容要相互獨立。（二）文字方面：使用準確的當代語言，語句要簡明扼要，既排除與答案無關的因素，最好是一句話說明一個概念。（三）理解方面：題目應有確切的答案，題目的內(nèi)容不要超出受測團體的知識水平和理解能力；題目不可令人費解，更不能有歧義。社會敏感性方面涉及這類社會敏感性問題鼓勵受測者做出真實回答采取三條

36、策略：命題時假定受測者具有某種行為。命題時假定規(guī)范不一致。指出該行為雖然是違規(guī)的，但是卻是常見的。（四）第一，第二，第三，三、編制要領（一）選擇題：分題干和選項。注意六點：第一，題干所提的問題必須明確。第二，選項切忌冗長，要簡明扼要。第三每道題只給一個正確答案，其他屬誘答。第四，各選項長度應相等，盡量不要有長有短。第五，避免題干用詞與選項用詞一致，否則成了選擇答案的線索。第六，選項最好用同一形式。（二）是非題，又叫正誤題，注意五點：第一，內(nèi)容應以有意義的概念、事實或基本原則為基礎。第二，每道題只能包含一個概念。第三，第四，第五，（二、第一，第二，第三，（四）

37、第一，第二，第三，第四，盡量避免否定的敘述，尤其是要避免用雙重否定的敘述。若是表達意見的題目，最好說明意見的來源和根據(jù)。是非題的數(shù)目應有適當比例，基本相等，且要隨機排列。簡答題：三條原則最好采用問句形式。如果是填充形式，空格不宜太多。每道題應只有一個正確答案，而且答案要簡短而具體。操作題：四條原則明確所要測量的目標，并將其操作化。盡量選擇逼真度較高的項目。指導語要簡明扼要。制訂評分標準，確定記分方法。第三單元測驗的編排和組織一、合成測驗（一）選擇與審定試題1. 選擇試題形式：關鍵是如何選擇“最優(yōu)”形式?？紤]三點（1）測驗的目的和材料的性質(zhì)。（2）接受測驗的團體的特點。（

38、 3）各種實際因素。2. 審定題目：四個問題題目的范圍應與測驗計劃所列的內(nèi)容技能雙向細目表相一致。題目的數(shù)量要比最后所需的數(shù)目多一倍至幾倍，以備篩選或編制復本。題目的難度必須符合測驗的目的。題目的說明必須清楚明白。（1）（2）（3）（4）（二）測題的編排：1. 原則第一，測題的難度排列宜逐步上升。第二，盡可能將同類型的測題組合在一起。第三，注意各種類型測題本身的特點。2. 兩種常見的測題排列方式：第一，并列直進式。第二，混合螺旋式。二、測驗的預試（一）預測：注意四個問題第一，預測對象應取自將來正式測驗準備應用的群體。第二，預測的實施過程與情境應力求與將來正式測驗時的情況相近似

39、。第三，預測的時限可稍寬一些，最好使每個受測者都能將題目做完，以搜集較充分的反應資料，使統(tǒng)計分析的結(jié)果更為可靠。第四，在預測過程中，應對受測者的反應情形隨時加以記錄。（二）項目分析：包括質(zhì)的分析和量的分析兩個方面。三、信度和效度考察四、常模制訂五、編寫指導手冊：內(nèi)容第一，測驗的目的和功用。第二，測驗編制的理論背景以及測驗中的材料是根據(jù)什么原則、應用什么方法選擇出來的。第三，如何實施測驗的說明。第四，測驗的標準答案或記分標準。第五，常模資料。第六，測驗的基本特征。第七節(jié) 心理測驗的使用第一單元主測者的資格主測者的資格包括技術(shù)和道德兩方面的要求。一、知識結(jié)構(gòu)：是指開展心理測驗工

40、作所必須具備的基礎知識和專業(yè)知識。二、專業(yè)理論知識和專業(yè)技能（一）專業(yè)理論知識：包括要求主測者對心理測驗的特點和性質(zhì)、作用和局限性有清楚的認識；了解測驗的基本特征；熟悉心理測驗標準化的必要性。（二）專業(yè)技能：主測者必須具有實際操作心理測驗的專業(yè)技能和經(jīng)驗，接受嚴格、系統(tǒng)的心理測驗專業(yè) 訓練，熟悉有關測驗的內(nèi)容、適用范圍、測驗程序和記分方法等。三、職業(yè)道德（一）測驗的保密和控制使用（二）測驗中個人隱私的保護第二單元測驗的選擇一、所選測驗必須適合測量的目的二、所選測驗必須符合心理測量學的要求第三單元測驗前的準備及注意事項一、測驗前的準備工作（一）預告測驗（二）準備測驗材料（三）熟悉

41、測驗指導語（四）熟悉測驗的具體程序二、測驗中主測者的職責第一，應按照指導語的要求實施測驗，不帶任何暗示。第二，測驗前不講太多無關的話。第三，對于受測者的反應，主測者不應做出點頭、皺眉、搖頭等暗示性動作，會影響對受測者以后的施測，主測者應時刻保持和藹、微笑的態(tài)度。第四，對特殊問題要有心理準備。三、建立協(xié)調(diào)關系：是主測者和受測者之間一種友好的、合作的、能促使受測者最大限度地做好測驗的一種關系。第四單元測驗實施的程序及要素一、指導語（一）對受測者的指導語：一般由以下內(nèi)容構(gòu)成：第一，如何選擇反應形式。第二，如何記錄這些反應。第三，時間限制。第四，如果不能確定正確反應時該如何操作。第五，例題。第六，有時告知受測者測驗目的。（二）對主測者的指導語二、時限：大多數(shù)典型行為測驗是不受時間限制的。三、測驗的環(huán)境條件：對于測驗的環(huán)境條件，不僅必須完全遵從測驗手冊的要求，而且還要記錄任何意外的測驗環(huán)境因素，并且在解釋測驗結(jié)果時也必須考慮這一因素。第五單元受測者誤差及控制方法一、應試技巧與練習效應（一）應試技巧： “測驗油子”能覺察出正確答案與錯誤答案的細小差別，懂得合理分配測驗時間，而且常常是各種題型都見過。著重速度的測驗，練習效應較為明顯。重復實施相同的測驗。兩次測驗之間的時距越大，練習效應越小，相距三個月以上的練習效應可忽略不計。一

人人文庫> 全部分類> 應用文書 > 作業(yè)報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

心理測量學的知識

文檔簡介

溫馨提示

最新文檔

評論

心理測量學的知識

文檔簡介

溫馨提示

最新文檔

評論

相關文檔