心理測量學知識年_第1頁
心理測量學知識年_第2頁
心理測量學知識年_第3頁
心理測量學知識年_第4頁
心理測量學知識年_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

心理測量學知識年第1頁,課件共80頁,創(chuàng)作于2023年2月講課內(nèi)容

第一節(jié)

概述

第二節(jié)測驗的常模第三節(jié)

測驗的信度第四節(jié)測驗的效度第五節(jié)項目分析第六節(jié)測驗編制的一般程序第七節(jié)心理測驗的使用第2頁,課件共80頁,創(chuàng)作于2023年2月第一節(jié)概述第一單元測量與測量量表第二單元心理測驗的基本概念第三單元心理測驗的分類第四單元糾正錯誤的測驗觀第五單元心理測驗在心理咨詢中的應用第六單元心理測驗的發(fā)展史3第3頁,課件共80頁,創(chuàng)作于2023年2月第一單元測量與測量量表什么是測量測量要素測量量表4第4頁,課件共80頁,創(chuàng)作于2023年2月什么是測量測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。從字面上看,該定義包括三個主要的元素:⑴事物;⑵數(shù)字;⑶法則。

1.“事物”,指的是我們要測量的對象,更準確地說,就是引起我們興趣的事物的屬性或特征。

2.“數(shù)字”,是代表某一事物或事物某一屬性的量。

3.“法則”,代表的是測量所依據(jù)的規(guī)則和方法。5第5頁,課件共80頁,創(chuàng)作于2023年2月測量要素任何測量都應該具備這樣兩個要素:即參照點和單位。參照點:要確定事物的量,必須有一個計算的起點,這個起點叫做參照點。絕對零點人定的參照點即相對零點單位:是測量的基本要求,沒有單位就無法進行測量

確定的意義有相同的價值

6第6頁,課件共80頁,創(chuàng)作于2023年2月測量量表

測量的本質(zhì)是根據(jù)某一法則將事物數(shù)量化,即在一個定有單位和參照點的連續(xù)體上把事物的屬性表現(xiàn)出來,這個連續(xù)體稱為量表。量表的四種水平命名量表:代號/類別順序量表:在順序量表中,既無相等單位,又無絕對零點,數(shù)字僅表示等級,并不表示某種屬性的真正量或絕對值。等距量表:不但有大小關系,而且具有相等的單位,其數(shù)值可以相互做加、減運算,但沒有絕對的零點,因此不能做乘、除運算。等比量表:是最高水平的量表,既有相等單位又有絕對零點。

那么,心理測量中使用的量表一般是什么量表呢?一般說來,心理測量是在順序量表上進行的。7第7頁,課件共80頁,創(chuàng)作于2023年2月第二單元心理測驗的基本概念

心理測驗的定義心理測驗的性質(zhì)8第8頁,課件共80頁,創(chuàng)作于2023年2月心理測驗的定義所謂心理測驗,就是依據(jù)心理學理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為,對于貫穿在人的全部行為活動中的心理特點作出推論和數(shù)量化分析的一種科學手段。首先,心理測驗測量的是人的行為。其次,心理測驗在測量個別差異的時候,往往只是對少數(shù)經(jīng)過慎重選擇的行為樣本進行觀察,來間接推知被試者的心理特征。第三,為了使不同的被試者所獲得的分數(shù)有比較的可能性,測驗的條件對所有的被試者都必須是相同的。第四,個人在測驗中所得到的原始分數(shù)并不具有什么意義,只有將它與其他人的分數(shù)或常模相比較才有意義。

9第9頁,課件共80頁,創(chuàng)作于2023年2月心理測驗的性質(zhì)心理測量的間接性迄今為止,我們還無法直接測量人的心理,只能通過測量人的外顯行為,即通過測量人們對測驗題目的反應來推論出他的心理特質(zhì)。心理測量的相對性我們在比較不同人之間的行為或心理特征時,沒有絕對的標準,也沒有絕對的零點,我們有的只是一個連續(xù)的行為序列。

心理測量的客觀性:

1、測驗的刺激是客觀的

2、對反應的量化是客觀的

3、對結果的推論是客觀的10第10頁,課件共80頁,創(chuàng)作于2023年2月第三單元心理測驗的分類

按測驗的功能分類

智力測驗、特殊能力測驗、人格測驗按測驗材料的性質(zhì)分類文字測驗、操作測驗按測驗材料的嚴謹程度分類客觀測驗、投射測驗按測驗的方式分類個別測驗、團體測驗按測驗的要求分類最高作為測驗、典型行為測驗11第11頁,課件共80頁,創(chuàng)作于2023年2月第四單元糾正錯誤的測驗觀

錯誤的測驗觀測驗萬能論測驗無用論某些人格測驗侵犯了個人隱私,違背民主原則測驗為宿命論和種族歧視提供了心理學依據(jù)

心理測驗=智力測驗=智商=遺傳決定論正確的測驗觀心理測驗是重要的心理學研究方法之一,是決策的輔助工具心理測驗作為研究方法和測量工具尚不完善12第12頁,課件共80頁,創(chuàng)作于2023年2月第五單元心理測驗在心理咨詢中的應用智力測驗:可在求助者有特殊要求時及對方有可疑智力障礙的情況下應用;人格測驗:有助于治療者對求助者人格特征的了解,以便于對其問題有更深入的理解,并可針對性地開展咨詢與心理治療工作;

心理評定量表:用于檢查求助者某方面心理障礙的存在與否或其程度如何。13第13頁,課件共80頁,創(chuàng)作于2023年2月第六單元心理測驗的發(fā)展史科學心理測驗的產(chǎn)生與發(fā)展現(xiàn)代心理測驗在我國的發(fā)展14第14頁,課件共80頁,創(chuàng)作于2023年2月科學心理測驗的產(chǎn)生與發(fā)展(1)首先倡導科學心理測驗的學者是英國生物學家和心理學家高爾登(F.Galton),因此他的工作被視為心理測驗的開端。此外,高爾登也為心理測驗奠定了統(tǒng)計學基礎,即首先提出了相關的概念。FrancisGalton(1822-1911)15第15頁,課件共80頁,創(chuàng)作于2023年2月

1890年,卡特爾在《心理》雜志上發(fā)表“心理測驗與測量”一文,這是心理測驗第一次出現(xiàn)于心理學文獻中。并提出心理測驗的結果應與常模進行比較??茖W心理測驗的產(chǎn)生與發(fā)展(2)J.M.Cattell(1860-1944)16第16頁,課件共80頁,創(chuàng)作于2023年2月科學心理測驗的產(chǎn)生與發(fā)展(3)1905年,比內(nèi)(A.Binet)與其助手西蒙(T.Simon)研究制作了世界上第一個正式的心理測驗。AfredBinet(1857-1911)17第17頁,課件共80頁,創(chuàng)作于2023年2月科學心理測驗的產(chǎn)生與發(fā)展(4)操作測驗的發(fā)展

由于理論上的缺陷和實際上的需要,所以有操作測驗的問世。團體智力測驗的發(fā)展

團體測驗始于第一次世界大戰(zhàn),在推孟的研究生歐提斯所編團體智力測驗的基礎上發(fā)展了陸軍甲種和乙種智力測驗。能力傾向測驗的發(fā)展

分析個人心理品質(zhì)的內(nèi)部結構,為職業(yè)選拔與安置提供依據(jù)。

普通能力傾向(智力)測驗也向多元化發(fā)展。人格測驗的發(fā)展

測量情感或行為等非智力方面的人格因素。18第18頁,課件共80頁,創(chuàng)作于2023年2月現(xiàn)代心理測驗在我國的發(fā)展

我國近代心理測驗大約源于1914年前后。上世紀二、三十年代,我國心理學家曾兩次修訂過比內(nèi)-西蒙量表。

1979年后,全國各地的心理學家組織起多個協(xié)作組,先后對國外的廣泛采用的智力和人格測量工具進行修訂。近些年來我國的心理學家正在致力于測驗本土化,編制適合我國文化背景的智力測驗,適應行為量表等,并已取得了初步成功。19第19頁,課件共80頁,創(chuàng)作于2023年2月第二節(jié)

測驗的常模第一單元常模團體第二單元常模的類型第三單元常模分數(shù)的表示方法20第20頁,課件共80頁,創(chuàng)作于2023年2月第一單元常模團體

常模團體的性質(zhì)常模團體的條件取樣的方法常模分數(shù)與常模21第21頁,課件共80頁,創(chuàng)作于2023年2月常模團體的性質(zhì)常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。對測驗編制者而言,常模的選擇主要是基于對測驗將要施測的總體的認識,常模團體必須能夠代表該總體。這種工作包括:確定一般總體確定目標總體確定樣本。對測驗的使用者來說,要考慮的問題是,現(xiàn)有的常模團體哪一個最合適。22第22頁,課件共80頁,創(chuàng)作于2023年2月常模團體的條件群體的構成必須明確界定

可以用來區(qū)分和限定群體的變量是很多的,如性別、年齡、職業(yè)、文化程度、民族、地理地域、社會經(jīng)濟地位等。常模團體必須是所測群體的代表性樣本當所要測量的群體很小時,將所有的人逐個測量,其平均分便是該群體的最可靠的常模。在群體較大時,因為時間和人力物力的限制,只能測量一部分人作為總體的代表。樣本的大小要適當總體數(shù)目小,只有幾十個人,則需要100%的樣本。如果總體數(shù)目大,相應的樣本也大,一般最低不小于30或100個。全國性常模,一般應有2000~3000人為宜。標準化樣組是一定時空的產(chǎn)物23第23頁,課件共80頁,創(chuàng)作于2023年2月取樣的方法取樣即從目標總體中選擇有代表性的樣本簡單隨機抽樣:在簡單隨機抽樣中,每個人或抽樣單位都有相同的機會作為常模中的一部分。系統(tǒng)抽樣:有時在總體數(shù)目為N的情況下,若要選擇K分之一的被試作為樣本,則可以在抽樣范圍內(nèi)選擇每個第K個人來構成樣本。要求目標總體無序可排,也無等級結構存在。分組抽樣:先將群體分組,再在組內(nèi)進行隨機取樣。分層抽樣:先將目標總體分成若干層次,再從各層次中隨機抽取若干被試,最后把各層的被試組合成常模樣本。包括分層比例抽樣和分層非比例抽樣24第24頁,課件共80頁,創(chuàng)作于2023年2月常模分數(shù)與常模常模分數(shù)

常模分數(shù)就是施測常模樣本被試后,將被試者的原始分數(shù)按一定規(guī)則轉換出來的導出分數(shù)。常模常模分數(shù)構成的分布,就是通常所說的常模(norm),它是解釋心理測驗分數(shù)的基礎。常模有一般常模與特殊常模之分

25第25頁,課件共80頁,創(chuàng)作于2023年2月第二單元常模的類型

發(fā)展常模百分位常模標準分常模智商的計算及意義

26第26頁,課件共80頁,創(chuàng)作于2023年2月發(fā)展常模發(fā)展順序量表智力年齡年級當量27第27頁,課件共80頁,創(chuàng)作于2023年2月發(fā)展常模(1)/發(fā)展順序量表最直觀的發(fā)展常模是發(fā)展順序量表,因為它告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育正常,相應能力或行為早于某年齡出現(xiàn),說明發(fā)育超前,否則即為發(fā)育滯后。最早的一個范例是葛塞爾發(fā)展程序表,其中按月份顯示出兒童在運動水平、適應性、語言、社會性四個方面的大致發(fā)展水平。28第28頁,課件共80頁,創(chuàng)作于2023年2月發(fā)展常模(2)/智力年齡方法一:基礎年齡與在較高年齡水平的題目上獲得的附加月份之和。方法二:將標準化樣本中每個年齡組的平均原始分數(shù)作為年齡常模。通過將原始分數(shù)與年齡常模對比,便可求得每個人的智齡。29第29頁,課件共80頁,創(chuàng)作于2023年2月發(fā)展常模(3)/年級當量年級當量實際上就是年級量表,測驗結果說明屬哪一年級的水平,在教育成就測驗中最常用。其表述方式常常是:某學生的算術是6年級水平,閱讀是4年級水平,理解是5年級的水平等。年級量表的單位通常為10個月間隔,在一學年中假設兩個月的假期在所測量目標上的發(fā)展是不重要的,因此以10個月為一個年級。例如,4—0(或4.0)表示四年級開始時的平均成績,4—5(或4.5)表示學年中間的平均成績。30第30頁,課件共80頁,創(chuàng)作于2023年2月百分位常模百分等級指在常模樣本中低于這個分數(shù)的人數(shù)百分比。百分點百分點也稱百分位數(shù),與百分等級的計算方法正好相反。百分等級是計算低于某測驗分數(shù)的人數(shù)百分比,而百分點則是計算處于某一百分比例的人對應的測驗分數(shù)是多少。四分位數(shù)和十分位數(shù)百分位數(shù)是將量表分成100份,而四分位數(shù)是將量表分成四等份,相當于百分等級的25%、50%和75%對應的三個百分點分成的四段。十分位數(shù)也可以依此類推出,1%~10%為第一段,91%~100%為第十段。31第31頁,課件共80頁,創(chuàng)作于2023年2月標準分常模標準分數(shù)是將原始分數(shù)與平均數(shù)的距離以標準差為單位表示出來的量表。因為它的基本單位是標準差,所以叫標準分數(shù)。

1.線性轉換的標準分數(shù)(常態(tài))

2.非線性轉換的標準分數(shù)(非常態(tài))對每個原始分數(shù)值計算累積百分比;在常態(tài)曲線面積表中,求出對于該百分比的標準(z’)分數(shù)。T分數(shù):平均數(shù)為50,標準差為10標準九分:以5為平均數(shù),以2為標準差標準十分:平均數(shù)為5.5,標準差為1.5;標準二十分:平均數(shù)為10,標準差為3。32第32頁,課件共80頁,創(chuàng)作于2023年2月智商的計算及其意義比率智商離差智商表示個體智力在年齡組中所處的位置,因而是表示智力高低的一種理想的指標。33第33頁,課件共80頁,創(chuàng)作于2023年2月第三單元常模分數(shù)表示法轉換表表示法最簡單而且最基本的表示常模的方法就是轉換表,有時也叫常模表。測驗的使用者利用轉換表可將原始分數(shù)轉換為與其對應的導出分數(shù),從而對測驗的分數(shù)作出有意義的解釋。剖面圖表示法剖面圖是將測驗分數(shù)的轉換關系用圖形表示出來。從剖面圖上可以很直觀地看出被試在各個分測驗上的表現(xiàn)及其相對的位置。34第34頁,課件共80頁,創(chuàng)作于2023年2月第三節(jié)測驗的信度第一單元信度的概念第二單元信度的估計方法第三單元信度與測驗分數(shù)的解釋第四單元影響信度的因素35第35頁,課件共80頁,創(chuàng)作于2023年2月第一單元信度的概念信度的定義描述定義:指同一被試在不同時間內(nèi)用同一測驗(或用另一套相等的測驗)重復測量,所得結果的一致程度。操作定義:一組測量分數(shù)的真分數(shù)方差與總方差(實得分數(shù)的方差)的比率。X=T+ESX2=ST2+SE2rxx=ST2/SX2信度的指標信度系數(shù)和信度指數(shù)

測量標準誤

36第36頁,課件共80頁,創(chuàng)作于2023年2月第二單元信度的估計方法

重測信度復本信度內(nèi)部一致性信度評分者信度37第37頁,課件共80頁,創(chuàng)作于2023年2月信度的估計方法(1)重測信度(test-retestreliability)

又稱穩(wěn)定性系數(shù)。它的計算方法是采用重測法,即使用同一測驗,在同樣條件下對同一組被試者前后施測兩次測驗,求兩次得分間的相關系數(shù)。最適宜的時距隨測驗的目的、性質(zhì)和被試特點而異,一般是兩周到四周較宜,間隔時間最長不超過六個月。38第38頁,課件共80頁,創(chuàng)作于2023年2月信度的估計方法(2)復本信度(alternate-formreliability)

又稱等值性系數(shù),它是以兩個等值但題目不同的測驗(復本)來測量同一群體,然后求得被試者在兩個測驗上得分的相關系數(shù),這個相關系數(shù)就代表了復本信度的高低。如果兩個復本的施測相隔一段時間,則稱重測復本信度或穩(wěn)定與等值系數(shù)。在計算復本信度時,應該有半數(shù)的被試先作A本再作B本,另一半被試先作B本再作A本,由此可以抵消施測順序的效應。39第39頁,課件共80頁,創(chuàng)作于2023年2月信度的估計方法(3)內(nèi)部一致性信度(internalconsistencyreliability)

分半信度(split-halfreliability)是在測驗實施后將測驗按奇、偶數(shù)分為等值的兩半,并分別計算每位被試在兩半測驗上的得分,求出這兩半分數(shù)的相關系數(shù)。分半法經(jīng)常會低估信度,必須修正(斯皮爾曼-布朗公式),借以估計整個測驗的信度。同質(zhì)性信度(homogeneityreliability)同質(zhì)性主要代表測驗內(nèi)部所有題目間的一致性。當各個測題的得分有較高的正相關時,不論題目的內(nèi)容和形式如何,則測驗為同質(zhì)的。相反,即使所有題目看起來好象測量同一特質(zhì),但相關很低或為負相關時,則測驗為異質(zhì)的。40第40頁,課件共80頁,創(chuàng)作于2023年2月信度的估計方法(4)評分者信度(scorerreliability)

隨機抽取若干份測驗卷,由兩位評分者按評分標準分別給分,然后再根據(jù)每份測驗卷的兩個分數(shù)計算相關,即得評分者信度。一般要求在成對的受過訓練的評分者之間平均一致性達0.90以上,才認為評分是客觀的。當多個評分者評定多個對象,并以等級法記分時,可采用肯德爾和諧系數(shù)作為評分者信度的估計。41第41頁,課件共80頁,創(chuàng)作于2023年2月第三單元信度與測驗分數(shù)的解釋解釋真實分數(shù)與實得分數(shù)的相關信度系數(shù)可以解釋為總的方差中有多少比例是由真實分數(shù)的方差決定的,也就是測驗的總變異中真分數(shù)造成的變異占百分之幾。確定信度可以接受的水平當rxx<0.70時,測驗不能用于對個人作出評價或預測,而且不能作團體比較;當0.70≤rxx<0.85時,可用于團體比較;當rxx≥0.85時,才能用來鑒別或預測個人成績或作為。解釋個人分數(shù)的意義其一是估計真實分數(shù)的范圍;其二是了解實得分數(shù)再測時可能的變化情形。這就是測量標準誤的應用。比較不同測驗分數(shù)的差異這種比較包括兩個人不同分數(shù)的差別和同一被試在兩個測驗上的差別。這就是差異分數(shù)的標準誤問題。42第42頁,課件共80頁,創(chuàng)作于2023年2月第四單元影響信度的因素樣本特征樣本團體的異質(zhì)性:一般而言,若獲得信度的取樣團體較常??傮w為異質(zhì)的話,往往會高估測驗的信度,相反會低估測驗的信度。樣本團體的平均能力水平:不同水平的團體,難度不同測驗的長度:一般來說,在一個測驗中增加同質(zhì)的題目,可以使信度提高。測驗的難度通常難度的平均水平為0.50較好。測量的時間間隔43第43頁,課件共80頁,創(chuàng)作于2023年2月第四節(jié)測驗的效度第一單元效度的概念第二單元效度評估的方法第三單元效度的功能第四單元影響效度的因素44第44頁,課件共80頁,創(chuàng)作于2023年2月第一單元效度的概念效度的定義描述定義:指所測量的與所要測量的心理特點之間的符合程度,或者說是指一個心理測驗的準確性.操作定義:在一組測量中,與測量目標有關的真實方差(或稱有效方差)與總方差的比率.

r2xy=Sv2/Sx2

X=T+E=V+I+E

SX2=ST2+SE2=SV2+SI2+SE2效度的性質(zhì)效度具有相對性效度具有連續(xù)性45第45頁,課件共80頁,創(chuàng)作于2023年2月專欄5-4信度與效度的關系信度是效度的必要而非充分條件效度高必然信度高,而信度高并不一定保證效度高,說明信度高只是效度高的必要條件,并不是效度高的充分條件。效度是受信度制約的信度系數(shù)與效度系數(shù)之間有這樣一種關系:信度系數(shù)的平方根是效度系數(shù)的最高限度。用公式表示如下:

46第46頁,課件共80頁,創(chuàng)作于2023年2月第二單元效度的估計方法內(nèi)容效度構想效度效標效度47第47頁,課件共80頁,創(chuàng)作于2023年2月內(nèi)容效度定義:內(nèi)容效度也稱邏輯效度,指的是測驗題目對有關內(nèi)容或行為取樣的適用性,從而確定測驗是否是所欲測量的行為領域的代表性取樣。估計方法專家判斷法定義好測驗內(nèi)容的總體范圍;編制雙向細目表,確定內(nèi)容和技能各自所占的比例;由每位評判者在評定量表上作出判斷。統(tǒng)計分析法計算兩個評分者之間評定的一致性(評分者信度)兩個測驗復本上得分之相關(復本信度)再測法也可用于內(nèi)容效度的評估(測驗-學習-再測驗)經(jīng)驗推測法這種效度是通過實踐來檢驗效度內(nèi)容效度與表面效度48第48頁,課件共80頁,創(chuàng)作于2023年2月構想效度定義:是指測驗能夠測量到理論上的構思或特質(zhì)的程度,即測驗的結果是否能證實或解釋某一理論的假設、術語或構思,解釋的程度如何。估計方法對測驗本身的分析測驗的內(nèi)容效度測驗的同質(zhì)性分析被試者對題目的反應特點測驗間的相互比較相容效度是構思效度的一個證據(jù)。區(qū)分效度是構思效度的又一個證據(jù)。因素分析法也是建立構思效度的常用方法。效標效度的研究證明(效標分組/分數(shù)分組,年齡變化)實驗法和觀察法證實(訓練)49第49頁,課件共80頁,創(chuàng)作于2023年2月效標效度定義:又稱實證效度,反映的是測驗預測個體在某種情境下行為表現(xiàn)的有效性程度。估計方法相關法:相關法是評估效標效度最常用的方法,它是求測驗分數(shù)與效標資料間的相關,這一相關系數(shù)稱為效度系數(shù)。區(qū)分法:是檢驗測驗分數(shù)能否有效地分析由效標所定義的團體的一種方法?;蛘哂嬎忝恳唤M內(nèi)得分超過(或低于)另一組平均數(shù)的人數(shù)百分比,或者計算兩組分布的共同區(qū)的百分比。重疊量越大,說明兩組分數(shù)差異越小,即測驗的效度越差。命中率法:命中率法是當測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標的一種方法。50第50頁,課件共80頁,創(chuàng)作于2023年2月第三節(jié)效度意義的確定預測效標分數(shù)在測驗工作中,人們感興趣的是從測驗分數(shù)預測效標成績,因此最常用的是Y對X的回歸方程。預測誤差效度系數(shù)的實際意義常常以決定性系數(shù)來表示,意旨相關系數(shù)的平方,其表達式是rxy2,它表示測驗正確預測或解釋的效標的方差占總方差的比例。另一種表達方法是估計的標準誤,簡寫為Sest,它是指所有具有某一測驗分數(shù)的被試其效標分數(shù)(Y)分布的標準差,也即真正效標分數(shù)落在某一范圍內(nèi)有多大可能性。預測效率指數(shù)51第51頁,課件共80頁,創(chuàng)作于2023年2月第四單元影響效度的因素測驗本身的因素:測驗取材的代表性、測驗長度、試題類型、難度、區(qū)分度以及編排方式都會影響效度。測驗實施中的干擾因素主試的影響因素:包括導語、時限、評分、測驗情境等。被試的影響因素:包括興趣、動機、情緒、態(tài)度、心身狀態(tài)等。樣本團體的性質(zhì)樣本團體的異質(zhì)性干涉變量:如動機、興趣(0.20↗0.60)等。效標的性質(zhì)效標與測驗分數(shù)之間的關系是否線性相關是很重要的一個因素。效標測量本身的可靠性如何亦是值得考慮的一個問題。

52第52頁,課件共80頁,創(chuàng)作于2023年2月第五節(jié)項目分析第一單元項目的難度第二單元項目的區(qū)分度53第53頁,課件共80頁,創(chuàng)作于2023年2月第一單元項目的難度難度(difficulty)的定義:是指項目的難易程度,在非能力測驗中類似的指標稱為通俗性。難度的計算二分法記分的項目非二分記分的項目難度水平的確定項目的難度:P值越接近于0.50,區(qū)別力越高。測驗的難度如果被試樣本具有代表性,對于中等難度的測驗,其測驗總分應該接近常態(tài)分配。對于正偏態(tài)分布,必須增加足夠數(shù)量的較容易的項目;對于負偏態(tài)分布,必須增加足夠數(shù)量的有較高難度的項目。54第54頁,課件共80頁,創(chuàng)作于2023年2月第二單元項目的區(qū)分度定義:也叫鑒別力,是指測驗項目對被試者的心理特性的區(qū)分能力。計算方法鑒別指數(shù)D=PH-PL相關法點二列相關:適用于一類變量為二分稱名變量,另一類變量為連續(xù)變量的成對變量的相關計算。二列相關:適用于兩個連續(xù)變量,但其中一個變量被人為分成兩類相關法:適用于兩個變量均為二分稱名變量。若將測驗總分按及格、不及格或錄取、淘汰劃分,便可計算相關系數(shù)。區(qū)分度與難度的關系55第55頁,課件共80頁,創(chuàng)作于2023年2月第六節(jié)

測驗編制的一般程序

第一單元測驗的目標分析第二單元測題的編寫第三單元測題的編排與組織56第56頁,課件共80頁,創(chuàng)作于2023年2月第一單元測驗的目標分析測驗的對象測驗的用途測驗的目標57第57頁,課件共80頁,創(chuàng)作于2023年2月測驗的對象

描述:在編制測驗時必須明確測量對象,也就是該測驗編成后要用于何種團體。如WAIS,我們不能用于兒童,而編制時也不會出1+1=?的題目,因為這樣的題目對幼年兒童比較合適。要考慮的因素:年齡、文化程度、社會經(jīng)濟條件、文化背景、智力水平及閱讀水平等。58第58頁,課件共80頁,創(chuàng)作于2023年2月心理測驗的用途描述:心理測驗的用途就是指我們編制測驗是干什么用的,是要對被試做描述,還是做診斷,抑或是選拔和預示,這一點在測驗編制前就應明確。用途不同,編制測驗時的取材范圍及試題難度等也不盡相同。測驗的分類:顯示性測驗:指測驗題目和要測量的特征相似的測驗,比如成就測驗,它所反映的是被試具有什么能力,能完成什么任務。預測性測驗:為了預測一些沒有被測量的行為的測驗,即希望測驗能作出對未知情況的預測。59第59頁,課件共80頁,創(chuàng)作于2023年2月測驗的目標描述:指編制的測驗是測什么的,即測什么樣的心理特征或人格特點。目標分析工作分析/選拔和預測功用的預測性測驗第一是確定哪些心理特征和行為可以使要預測的活動達到成功第二是建立衡量被試是否成功的標準,這個標準我們稱之為效標對特定概念下定義/測量某種特殊心理品質(zhì)的測驗確定測驗的具體內(nèi)容/描述性的顯示測驗60第60頁,課件共80頁,創(chuàng)作于2023年2月第二單元測題的編寫搜集資料命題原則編制要領61第61頁,課件共80頁,創(chuàng)作于2023年2月搜集資料

已出版的標準測驗最簡單、最直接的方法是從已經(jīng)出版的各種標準測驗中選擇合適的題目理論和專家的經(jīng)驗理論和專家經(jīng)驗有時也可以作為題目的來源之一臨床觀察和記錄臨床的觀察也可以作為題目的來源62第62頁,課件共80頁,創(chuàng)作于2023年2月命題原則(1)內(nèi)容方面試題要符合測驗的目的;內(nèi)容取樣要有代表性;題目間內(nèi)容相互獨立,互不牽連,對不同題目的回答不致相互影響;文字方面使用準確的當代語言,避免使用生僻的字句或詞匯語句要簡明扼要,既要排除與答案無關的因素,又不能遺漏答題所依據(jù)的必要條件;最好是一句話說明一個概念,盡量少使用雙重否定句理解方面題目內(nèi)容不能超出受測團體的知識水平和理解能力;答案明確,不引起爭議;題目格式不要被人誤解;社會敏感性方面避開社會敏感性問題,如涉及社會禁忌或個人隱私的題目不應使用。63第63頁,課件共80頁,創(chuàng)作于2023年2月命題原則(2)可是有些測驗必須涉及這類社會敏感性問題,那么怎樣鼓勵被試作出真實的回答呢?菲力普(Phillips,D.L.)列舉了幾條策略值得參考:命題時假定被試具有某種行為,使他不得不在確實沒有該行為時才否定,可避免否定答案過多的傾向。命題時假定規(guī)范不一致指出該行為是常見的,雖然是違規(guī)的64第64頁,課件共80頁,創(chuàng)作于2023年2月編制要領

對心理測驗的題目進行分類的標準很多,常見的分類是根據(jù)對被試的要求不同來分,可以分為兩大類:提供型(supply)和選擇型(selection)題目。提供型題目:要求被試提供答案論文題:簡答題填充題選擇型題目:要求被試在幾個選項中選擇正確答案是非題選擇題匹配題65第65頁,課件共80頁,創(chuàng)作于2023年2月第三單元測驗的編排和組織合成測驗測驗的預試信度與效度考察常模制定編寫指導手冊66第66頁,課件共80頁,創(chuàng)作于2023年2月合成測驗(1)篩選與審定試題選擇試題形式測驗的目的和材料的性質(zhì):簡答題、選擇題、論文題接受測驗的團體的特點:口頭測驗、操作測驗

各種實際因素:團體測驗、個別測驗

審定題目材料內(nèi)容以及所測量的認知技能上的比率與計劃相符,必要時須加以適當調(diào)整。題目的數(shù)量要比最后所需的數(shù)目多一倍至幾倍,以備篩選和編制復份。題目的難度必須符合測驗目的的需要。

題目的說明必須清楚明白。

67第67頁,課件共80頁,創(chuàng)作于2023年2月合成測驗(2)測題的編排編排原則題目的難度排列宜逐步上升;盡可能將同類型的測題盡可能組合在一起;注意根據(jù)各種類型測題本身的特點排列題目。編排方式并列直進式混合螺旋式68第68頁,課件共80頁,創(chuàng)作于2023年2月測驗的預試預測應注意的幾個問題預試對象必須和將來正式測驗準備測試的對象相似預試的實施過程與情境應力求與正式測驗的情況相似預試的時限可稍寬些,以搜集充分的反應資料應將被試的各種反應情形隨時加以記錄。項目分析確定題目的難度、區(qū)分度、備選答案的合適度等為了檢驗所選出的項目的性能是否真正符合要求,通常需再選取來自同一總體的另一樣本再測一次,并進行第二次項目分析,看兩次分析結果是否一致69第69頁,課件共80頁,創(chuàng)作于2023年2月信度和效度考察與常模的制定信度和效度考察編好后的測驗可在小范圍內(nèi)試用,以對其可靠性和有效性進行鑒定,初步確定該測驗是否可用。然后再在較大的范圍內(nèi)試用,進一步檢驗其信度和效度。信度和效度的考察方法很多,一般應視測量的性質(zhì)和目的而定。常模的制定常用的心理測驗常模有百分位常模、標準分常模、發(fā)展常模及商數(shù)等。70第70頁,課件共80頁,創(chuàng)作于2023年2月編寫指導手冊測驗的目的和功用。測驗編制的理論背景以及測驗中的材料是根據(jù)什么原則、應用什么方法選擇出來的,許多手冊還提供選擇題目的統(tǒng)計指標。如何實施測驗的說明。測驗的標準答案和記分標準。常模資料,包括常模表、常模適用的團體及對測驗分數(shù)如何做解釋。測驗的基本特征,包括難度、鑒別力、信度、效度和因素分析的資料,以及這些資料取得的條件和情境,包括調(diào)查

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論