心理測量學(xué)課件_第1頁
心理測量學(xué)課件_第2頁
心理測量學(xué)課件_第3頁
心理測量學(xué)課件_第4頁
心理測量學(xué)課件_第5頁
已閱讀5頁,還剩319頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

心理測量學(xué)第一節(jié)概述

測量與測量量表心理測驗(yàn)的基本概念心理測驗(yàn)的分類糾正錯誤的測驗(yàn)觀心理測驗(yàn)在心理咨詢中的應(yīng)用心理測驗(yàn)的發(fā)展史第一單元測量與測量量表元素一、什么是測量對象——工具——結(jié)果——事物(屬性)法則數(shù)字(區(qū)分,等級,等距,可加)定義:法則→事物(屬性)→數(shù)量化確定物理、社會和心理測量共性單位(事物標(biāo)準(zhǔn)量名稱)意義明確單位等距參照點(diǎn)(量的計(jì)算起點(diǎn))絕對零點(diǎn)相對零點(diǎn)全無人為二、測量要素

三、測量量表按標(biāo)準(zhǔn)化樣本中大量測驗(yàn)結(jié)果制定的、有一定單位和參照點(diǎn)的、

標(biāo)度由低到高排列的連續(xù)體。含義種類

基本特征

功能

運(yùn)算

舉例命名屬性、類別分類或描述性別、民族職業(yè)、?順序無相等單位無絕對零點(diǎn)1+等級不能+-×÷品德、能力、愛好?等距有相等單位無絕對零點(diǎn)2+差異決策和比較可+-溫度、成績分?jǐn)?shù)?比率有相等單位有絕對零點(diǎn)3+比值決策和比較可+-×÷身高、體重、投資?不同水平的量表第二單元心理測驗(yàn)的基本概念一、心理測驗(yàn)的定義法則事物數(shù)字心理學(xué)理論操作程序代表性行為推論數(shù)量化分析二、心理測驗(yàn)的性質(zhì)間接性外部行為—→心理特質(zhì)行為樣本含義:反映被試行為特征的一組代表性行為相對性——比較而言解釋測驗(yàn)分?jǐn)?shù)的參照標(biāo)準(zhǔn)常??陀^性——標(biāo)準(zhǔn)化含義:反映被試行為特征的一組代表性行為。標(biāo)準(zhǔn)化含義:編制和實(shí)施等所遵循的一套標(biāo)準(zhǔn)程序。目的:測量結(jié)果的準(zhǔn)確性和客觀性。標(biāo)準(zhǔn)化測驗(yàn)材料測驗(yàn)實(shí)施評分記分分?jǐn)?shù)解釋客觀性——試卷試題信度效度難度區(qū)分度評價(jià)測驗(yàn)的指標(biāo)第三單元

心理測驗(yàn)的分類

一、測驗(yàn)功能智力測驗(yàn):一般能力水平特殊能力測驗(yàn):潛能或發(fā)展傾向人格測驗(yàn):非認(rèn)知性的特征二、測驗(yàn)材料的性質(zhì)文字測驗(yàn)操作測驗(yàn)(圖形,儀器,工具,實(shí)物)三、測驗(yàn)材料的嚴(yán)謹(jǐn)程度客觀測驗(yàn)投射測驗(yàn)呈現(xiàn)的刺激詞句、圖形等意義明確,可直接理解刺激無明確意義被試反應(yīng)無明確規(guī)定四、測驗(yàn)的方式個(gè)別測驗(yàn)團(tuán)體測驗(yàn)五、測驗(yàn)要求最高行為測驗(yàn)認(rèn)知測驗(yàn)(智力測驗(yàn),成就測驗(yàn))典型行為測驗(yàn)人格測驗(yàn)第四單元糾正錯誤的測驗(yàn)觀錯誤觀測驗(yàn)萬能論測驗(yàn)無用論正確觀重要的研究方法之一——輔助工具尚不完善第五單元

心理測驗(yàn)在心理咨詢中的應(yīng)用

智力測驗(yàn)吳天敏:中國比內(nèi)智力量表龔耀先韋氏成人智力量表(WAIS-RC)韋氏兒童智力量表(C-WISC)韋氏幼兒智力量表(C-WYCSI)林傳鼎:韋氏兒童量表(WISC-CR)張厚粲:瑞文標(biāo)準(zhǔn)型測驗(yàn)(SPM)李丹:聯(lián)合型瑞文測驗(yàn)(CRT)

人格測驗(yàn)艾森克人格問卷(EPQ)卡特爾16項(xiàng)人格因素問卷(16PF)明尼蘇達(dá)多項(xiàng)人格調(diào)查表(MMPI)

心理評定量表精神病評定量表躁狂狀態(tài)評定量表抑郁量表,焦慮量表,恐怖量表

案例二明尼蘇達(dá)多相人格問卷(MMPI)

背景:1942年首發(fā)。新版MMPI-2,1989年發(fā)行。新版

MMPI-A用于青少年。設(shè)計(jì):標(biāo)準(zhǔn)記分鍵,個(gè)人回答模式與已被診斷歸入某一臨床人群者比較。出自8個(gè)臨床量表分?jǐn)?shù)加男子氣—

女子氣和社交內(nèi)向性及三個(gè)效度量表。題目:原版550題,“是”,“否”或“不肯定”回答。新版替換了約100題。計(jì)分:分?jǐn)?shù)剖析圖?,F(xiàn)測驗(yàn)解釋按高分模式,產(chǎn)生編碼描述不同的剖析圖。有電腦測驗(yàn)解釋。應(yīng)用:臨床評估,為臨床篩選設(shè)計(jì)。子版本:加州心理問卷從中抽取一半題目,用于正常人;

5000多已發(fā)表研究用了MMPI。第六單元心理測驗(yàn)的發(fā)展史歷史時(shí)期先驗(yàn)期時(shí)間:20世紀(jì)以前特點(diǎn):重實(shí)用,缺理論,主觀性強(qiáng)科學(xué)期時(shí)間:20世紀(jì)初~至今階段經(jīng)典測驗(yàn)理論:50′前現(xiàn)代測驗(yàn)理論:50′后特點(diǎn)測驗(yàn)理論形成測驗(yàn)工作系統(tǒng)化一、中國古代的心理測驗(yàn)思想1.測驗(yàn)思想

孔子

孟子中人、中人以上、中人以下“中人以上可以語上也、中人以下不可語上也”權(quán),然后知輕重;度,然后知短長。物皆然,心為甚,王者度之。

劉劭“觀其感變,以審常度”?!皯?yīng)贊”

劉勰思《人物志》J.K.Shryock《人類能力的研究》使左物畫方,右的畫圓,無一時(shí)俱成《新論·專學(xué)篇》由心不兩用則物不并運(yùn)也。

民間七巧板九連環(huán)等顏氏家訓(xùn)《風(fēng)操篇》周歲試兒

描述性,不定量,分類的;心理特點(diǎn)與道德觀念相結(jié)合;2.科舉考試3千年前六藝取士及隋唐科舉制起源特點(diǎn)

二、科學(xué)心理測驗(yàn)的產(chǎn)生與發(fā)展原因社會需要個(gè)別差異研究實(shí)驗(yàn)心理學(xué)鑒別智殘和精神障礙專才訓(xùn)練和職業(yè)指導(dǎo)早期嘗試E.G.Boring(美)19世紀(jì)80年代是高爾頓的十年,90年代是卡特爾的十年,20世紀(jì)頭十年是比奈的十年高爾頓的10年

F.Galton,英,1822測驗(yàn)運(yùn)動首倡者第1個(gè)使用智力測驗(yàn)者;第1個(gè)大量系統(tǒng)測量個(gè)別差異者;1884-1890,“人類測量實(shí)驗(yàn)室”,測9337人。應(yīng)用評定量表和問卷法的先驅(qū);統(tǒng)計(jì)學(xué)家、生物學(xué)家、業(yè)余心理學(xué)家;優(yōu)生學(xué)的創(chuàng)始人;首次提出“測驗(yàn)”和“心理測驗(yàn)”術(shù)語(《人的能力研究》,1883)反應(yīng)時(shí)間,拉力和擰力,吹氣的力量,身高,體重,臂長,呼吸力量,肺活量,視力和聽力的靈敏度,色彩分辨能力,判斷長度的能力“人體測量研究室”測量內(nèi)容卡特爾的10年CattellJ.M.,美,1861實(shí)驗(yàn)心理與測驗(yàn)運(yùn)動結(jié)合;“心理測驗(yàn)”首次在心理學(xué)文獻(xiàn)出現(xiàn)(《心理測驗(yàn)與測量》);創(chuàng)立心理測驗(yàn)公司;培養(yǎng)優(yōu)秀學(xué)生:桑代克,佛朗茲等;握力,動作速度,觸覺兩點(diǎn)閾,重量辨別,聲音反應(yīng)時(shí),痛感受性說出四種混雜顏色名稱的速度,時(shí)間判斷力,平分線段的精確性復(fù)述聽過一次字母數(shù)目的能力卡特爾智力測驗(yàn)內(nèi)容1891-1901:成績與人體測驗(yàn)無明顯相關(guān),各測驗(yàn)間相關(guān)性也極差。二、科學(xué)期1.比奈的10年A.Binet,法,1857-19111898年,《個(gè)性心理學(xué)中的測量》,近代思想1903年,《智力的實(shí)驗(yàn)研究》,廣義智力概念;1905年,B-S量表;第一個(gè)正式智力量表。(一)經(jīng)典測驗(yàn)理論階段2.測驗(yàn)的發(fā)展特點(diǎn)20’—狂熱,40’—頂峰,50’—平穩(wěn)操作測驗(yàn)的發(fā)展團(tuán)體智力測驗(yàn)發(fā)展Otis陸軍甲種測驗(yàn)(1917)Otis陸軍乙種測驗(yàn)(1927)能力傾向測驗(yàn)標(biāo)準(zhǔn)化成就測驗(yàn)斯坦福成就測驗(yàn)(1923)美國教育測驗(yàn)中心(ETS,1947)成立;人格測驗(yàn)的發(fā)展先驅(qū)—E.Kraepelin20世紀(jì)40年代后三、現(xiàn)代心理測驗(yàn)在我國的發(fā)展時(shí)間:1914年前后修訂:智力測驗(yàn)1979年后修訂智力、人格種類測驗(yàn)編制本土化的智力、人格等測驗(yàn)國內(nèi)參考書目戴忠恒《心理與教育測量》江蘇,87《教育測量》余嘉元《教育測量》王孝玲華東師大,88)《心理測量》鄭日昌湖南,88凌文輇,濱治世《心理測驗(yàn)法》科學(xué),88凌文輇,方利略.心理與行為的測量.02

常模團(tuán)體常模的類型常模分?jǐn)?shù)的表示方法第一單元常模團(tuán)體

一、常模團(tuán)體的性質(zhì)

常模團(tuán)體共同特征的人或總體的代表性樣本常模的選擇

確定一定總體確定目標(biāo)總體抽取研究樣本大學(xué)生湖南大學(xué)生文理科大學(xué)生常模團(tuán)體的成員成就測驗(yàn)和能力傾向測驗(yàn)?zāi)壳暗臐撛诘母偁幷邚V泛的能力測驗(yàn)和人格測驗(yàn)同齡或同等教育水平者此外,性別、年齡、教育水平、職業(yè)、社經(jīng)地位、種族等也可作為常模團(tuán)體的標(biāo)準(zhǔn)。二、常模團(tuán)體的條件

群體明確性別、年齡、教育水平、職業(yè)、社經(jīng)地位、種族、地理地域

代表性樣本——案例樣本大小適當(dāng)一般標(biāo)準(zhǔn):最低不少于30或100。全國常模:一般2000~3000。時(shí)空性代表性樣本抽取——智力測驗(yàn)第1層第2層要求年齡姓別地域民族職業(yè)城鄉(xiāng)教育各年齡階段各姓別組各地區(qū)各民族各類職業(yè)城市和鄉(xiāng)村教育水平16~64各年齡組男女人數(shù)相等西部、中部、東部…白人、黑人、西班牙…工程師、教師、管理者…5000人以上為城市高中、大學(xué)、碩士…三、取樣的方法

(一)簡單隨機(jī)抽樣隨機(jī)原則——總體——樣本操作方法抽簽法——有放回抽樣和無放回抽樣

隨機(jī)數(shù)字表特點(diǎn):機(jī)會均等,操作簡便局限性總體較分散—→樣本也較分散總體個(gè)體差異較大—→樣本容量要大樣本容量較小—→分布不均勻(二)系統(tǒng)抽樣以某個(gè)隨機(jī)數(shù)字為起點(diǎn),間隔一定單位抽取樣本。抽樣間隔:特點(diǎn)樣本分布均勻,抽樣誤差較小不足有系統(tǒng)誤差,隨機(jī)性較差改進(jìn)與簡單隨機(jī)抽樣結(jié)合使用(三)分層抽樣標(biāo)志—→總體—→若干層次—→樣本分層比例抽樣

如用50名學(xué)生數(shù)學(xué)推理平均成績估計(jì)500名學(xué)生平均成績。設(shè)在數(shù)學(xué)成就測驗(yàn)中100人為優(yōu),320人為中,80人差,求每一層容量???cè)萘棵繉涌側(cè)萘繕颖救萘糠謱臃潜壤闃犹攸c(diǎn)分布較均勻:各層都有被抽取的機(jī)會,抽樣誤差更小,代表性更強(qiáng)在總體分布不均勻時(shí),該方法效果更好

(四)分組抽樣(整群抽樣)以“群”抽樣單位抽樣特點(diǎn)組織形式簡便易行,不會打亂學(xué)校或單位的正常秩序不足樣本分布不均勻,抽樣誤差較大改進(jìn)方法適當(dāng)擴(kuò)大樣本容量,減小抽樣誤差與分層抽樣法或其他方法配合使用常模分?jǐn)?shù)原始分?jǐn)?shù)

導(dǎo)出分?jǐn)?shù)。導(dǎo)出分?jǐn)?shù)用相應(yīng)數(shù)學(xué)模型對原始分進(jìn)行轉(zhuǎn)換所得分?jǐn)?shù)具有一定的參照點(diǎn)和單位——測驗(yàn)量表分四、常模分?jǐn)?shù)與常模

(一)常模分?jǐn)?shù)原始分?jǐn)?shù)轉(zhuǎn)化的目的個(gè)體間差異個(gè)人的某種心理特質(zhì)處于常模團(tuán)體中的相對地位個(gè)體內(nèi)差異提供相同尺度量數(shù)使個(gè)人在2種以上測驗(yàn)的結(jié)果可相互比較案例:WAIS-CR:言語分量表分測驗(yàn)原始分?jǐn)?shù)量表分IQ知識2716城市:137農(nóng)村:130領(lǐng)悟2818算術(shù)1614相似性2013數(shù)字廣度1817詞匯7415合計(jì)—93一28歲被試WAIS測驗(yàn)結(jié)果(二)常模(norm)常模

解釋測驗(yàn)結(jié)果的參照依據(jù)常模分?jǐn)?shù)構(gòu)成的分布標(biāo)準(zhǔn)化測驗(yàn)必須有常模一般常模與特殊常模一般常模:測驗(yàn)手冊的常模特殊常模:非典型團(tuán)體的常模二者可結(jié)合使用第二單元常模的類型

適用范圍全國常模區(qū)域常模特殊群體常模解釋方式發(fā)展常模百分常模標(biāo)準(zhǔn)分?jǐn)?shù)常模…

一、發(fā)展常模定義特質(zhì)按正常途徑發(fā)展所處的發(fā)展水平類型發(fā)展順序常模年級常模年齡常模(一)發(fā)展順序常模定義在嬰幼兒行為發(fā)展觀察中建立的量表發(fā)展變化與年齡相聯(lián)系葛塞爾(1947)嬰兒早期行為發(fā)展順序量表特點(diǎn)最早的量表嬰幼兒智力發(fā)展量表葛塞爾發(fā)展量表(1940,4周~5歲)麥利爾-帕爾默量表(1歲半~6歲)卡特爾嬰幼兒評定量表(1973,3天~4周)貝利嬰兒發(fā)展是表(1933,1969,2~30月)麥卡錫兒童能力量表(1972,2歲半~8歲半)考夫曼兒童成套評估測驗(yàn)(1983,2.5~12.5)丹佛發(fā)展篩選測驗(yàn)(1967,初生~6歲)中國0~3歲小兒精神檢查表(茅于燕)中國3~6歲兒童發(fā)展量表(1985,張厚粲)葛塞爾嬰兒感覺運(yùn)動發(fā)展順序周行為表現(xiàn)4控制眼睛運(yùn)動,能追隨一個(gè)對象看等16能使頭保持平衡28能用手抓握并玩弄東西40能控制軀干、聳立和爬52能控制腿和腳的運(yùn)動、站立和行走皮亞杰兒童守恒概念發(fā)展守恒概念年齡質(zhì)量守恒5重量長度6容量長度7(二)年齡常模定義個(gè)體在某個(gè)年齡組的平均操作水平智力年齡mentalage通過率指標(biāo)確定方法題目年齡水平平均數(shù)例如:某兒童6歲在B-S量表中,通過6歲組全部題目,通過7歲組4題,8歲組3題,9歲組1題,則智齡為(三)年級常模定義某年級全體學(xué)生典型水平的一個(gè)分?jǐn)?shù)年級水平平均數(shù)教育成就測驗(yàn)指標(biāo)應(yīng)用一剛升入4年級的學(xué)生,其閱讀水平為4.4,計(jì)算水平為3.8.(四)年齡與年級常模的評價(jià)年齡常模優(yōu)點(diǎn)易理解易解釋不足不穩(wěn)定不適于成人年級常模局限性適于一般課程,不適于高中以上解釋較難常被誤用為標(biāo)準(zhǔn)二、百分位常模

百分等級(perceptilerank)四分位數(shù)(quartile)十分位數(shù)(deciles)百分位數(shù)(perceptile)(一)百分等級方式以X與PR對照表的方式呈現(xiàn)定義一群分?jǐn)?shù)中低于某分?jǐn)?shù)者所占的百分比分析方法個(gè)體分?jǐn)?shù)各組分?jǐn)?shù)計(jì)算公式個(gè)體分?jǐn)?shù)各組分?jǐn)?shù)某團(tuán)體共100人,試問第15名的百分等級是多少?若團(tuán)體人數(shù)分別為50人,40人,20人時(shí),其百分等級是多少?若團(tuán)體人數(shù)為200,500,1000呢?(二)百分位數(shù)(點(diǎn))例5-3:高考選得分高于15%的被試。已知最高分為695,其PR為100;最低分103,PR為1。求其分?jǐn)?shù)的最低限是多少?求相當(dāng)于85%的測驗(yàn)分?jǐn)?shù)分析百分等級與百分位數(shù)的關(guān)系

百分位數(shù):已知_________,求________。

百分等級:已知_________,求________。百分等級分?jǐn)?shù)分?jǐn)?shù)百分等級(三)四分位數(shù)和十分位數(shù)百分位數(shù)任一百分位數(shù)值四分位數(shù)四分之一或四分之三等位置上的數(shù)值十分位數(shù)十分之一等位置上的數(shù)值(四)百分位常模的評價(jià)優(yōu)點(diǎn)局限易計(jì)算易解釋不受原始分分布形態(tài)影響單位不等距無法比較不同被試間分?jǐn)?shù)差異的數(shù)量三、標(biāo)準(zhǔn)分?jǐn)?shù)

(一)標(biāo)準(zhǔn)分?jǐn)?shù)的定義

定義以標(biāo)準(zhǔn)差所表示的原始分?jǐn)?shù)(X)與平均數(shù)的偏差公式z分?jǐn)?shù)某研究者得到以下兩組成績:分組測驗(yàn)成績(X)甲組54637274828899乙組67717376798284

試問:

①兩組分?jǐn)?shù)的分布是否一樣?為什么?表2-2兩組學(xué)生測驗(yàn)得分表∑XM5327653276②哪個(gè)均數(shù)的代表性更好?為什么?數(shù)據(jù)的基本分布特征及量數(shù)集中趨勢——集中量數(shù)——平均數(shù)描述一組數(shù)據(jù)向中間某一值靠攏的量數(shù)離中趨勢——差異量數(shù)——標(biāo)準(zhǔn)差描述一組數(shù)據(jù)離中趨勢的量數(shù)標(biāo)準(zhǔn)差的意義與計(jì)算含義表示一組數(shù)據(jù)的平均距離符號:S或SD(Standarddeviation)公式定義式:計(jì)算式:離均差(離差)理解練習(xí)試估計(jì)49和51分的平均數(shù)和標(biāo)準(zhǔn)差。分析結(jié)果(二)標(biāo)準(zhǔn)分?jǐn)?shù)的實(shí)質(zhì)把單位不等距和缺乏明確參照點(diǎn)的分?jǐn)?shù)轉(zhuǎn)換成以標(biāo)準(zhǔn)差為單位,以均數(shù)為參照點(diǎn)的量表分?jǐn)?shù)。-5

-4

-3

-2

-1

01

2

3

4

5

99.73%(三)常見標(biāo)準(zhǔn)分?jǐn)?shù)z分?jǐn)?shù)Z分?jǐn)?shù)正態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)T分?jǐn)?shù)標(biāo)準(zhǔn)九分離差智商(IQ)(四)線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)

1、z分?jǐn)?shù)z分?jǐn)?shù)是最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)特點(diǎn)以M為0點(diǎn),S為1的量表表示;絕對值表示:X與M的距離正負(fù)號表示:X在M上下的位置分布形狀與X分布形狀相同正態(tài)偏態(tài)2、Z分?jǐn)?shù)應(yīng)用普通學(xué)科測驗(yàn)普通分類測驗(yàn)美大學(xué)入學(xué)考試

線性轉(zhuǎn)換標(biāo)準(zhǔn)分(五)正態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)

1.意義X分布正態(tài),Z與曲線下面積有特定關(guān)系直接作正態(tài)轉(zhuǎn)換正態(tài)化標(biāo)準(zhǔn)分X分布非正態(tài)時(shí)的正態(tài)轉(zhuǎn)換X→PR→Z→T2.T標(biāo)準(zhǔn)分?jǐn)?shù)定義經(jīng)正態(tài)化的一種標(biāo)準(zhǔn)分?jǐn)?shù)轉(zhuǎn)換公式(W.A.McCall,1939)3.標(biāo)準(zhǔn)九分均數(shù):5標(biāo)準(zhǔn)差:2最高分:9最低分:1

除1和9,其余分?jǐn)?shù)包含0.5個(gè)σ標(biāo)準(zhǔn)九與S、Pm的對應(yīng)關(guān)系標(biāo)準(zhǔn)九標(biāo)準(zhǔn)差范圍百分位數(shù)范圍9+1.75以上96~998+1.25~+1.7589~957+0.75~+1.7577~886+0.25~+0.7560~765-0.25~+0.2541~594-0.75~-0.2524~403-1.25~-0.7512~232-1.75~-1.255~111-1.75以下1~44.標(biāo)準(zhǔn)十分和標(biāo)準(zhǔn)二十分標(biāo)準(zhǔn)十分平均數(shù):5標(biāo)準(zhǔn)差:1.5標(biāo)準(zhǔn)二十分平均數(shù):10標(biāo)準(zhǔn)差:3量表分:四、智商及其意義

(一)比率智商

斯坦福-比內(nèi)量表修訂者:推孟時(shí)間:1916智商計(jì)算心理年齡實(shí)際年齡一兒童實(shí)際年齡7歲,S-B測驗(yàn)的心理年齡為8歲,則其智商為(二)離差智商

韋氏離差智商編制者:韋克斯勒公式:IQ=15Z+100分析從不同測驗(yàn)獲得的IQ,其S不同只有當(dāng)S相同或接近時(shí)才可比較S-B離差智商(1960)IQ=16Z+100IQ分組S=12S=14S=16S=18130以上0.71.63.15.1120-1294.36.37.58.5110-11915.216.015.815.4100-10929.826.123.621.090-9929.826.123.621.080-8915.216.015.815.470-794.36.37.58.570以下0.71.63.15.1S不同時(shí):IQ水平的百分比韋氏智力測驗(yàn)構(gòu)架評估多種認(rèn)知能力的測驗(yàn)組合分測驗(yàn)的量表分:IQ=3Z+10言語、操作和全量表:IQ=15Z+100量表構(gòu)成全量表言語操作常識類同算術(shù)詞匯記憶廣度填圖積木拼圖譯碼排序理解迷律第三單元常模分?jǐn)?shù)的表示方法轉(zhuǎn)化表由X、導(dǎo)出分?jǐn)?shù)和對常模團(tuán)體的具體描述等三要素構(gòu)成的表格。

剖面圖

一、轉(zhuǎn)換表或常模表簡單轉(zhuǎn)換表把單項(xiàng)測驗(yàn)X轉(zhuǎn)換成一種或幾種導(dǎo)分?jǐn)?shù)。復(fù)雜轉(zhuǎn)換表多個(gè)分測驗(yàn)或各種常模團(tuán)體的X與導(dǎo)出分?jǐn)?shù)的對應(yīng)關(guān)系。1、簡單轉(zhuǎn)換表范例X分組PRT分?jǐn)?shù)75-7999.4(99)7570-7496.6(97)6865-6990.8(91)6360-6481.8(82)5955-5966.6(67)5450-5443.8(44)48某測驗(yàn)X的PR和T轉(zhuǎn)化表2、復(fù)雜轉(zhuǎn)化表大學(xué)生戈登人格問卷的百分等級分?jǐn)?shù)男性

謹(jǐn)慎獨(dú)創(chuàng)人際活力女性謹(jǐn)慎獨(dú)創(chuàng)人際活力38373635343399999899989799989795989796929795999998999897989796999796959896949397分?jǐn)?shù)大學(xué)生中學(xué)生工人干部383736353433

9998979699989998969389999897959188不同團(tuán)體戈登問卷“謹(jǐn)慎性”PR常模轉(zhuǎn)化表(二)剖面圖

以圖形方式表示測驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換關(guān)系特點(diǎn)直觀性IQ各分量表分的PR及質(zhì)的描述分量表分百分等級質(zhì)的描述教育描述1999189817971696159514911384127511631050937825716695542312111強(qiáng)處弱處資質(zhì)優(yōu)異優(yōu)秀中上中等或平均中下愚笨白癡資質(zhì)優(yōu)異中等或平均中上中下學(xué)習(xí)遲緩智能不足信度概念信度的評估方法信度與測驗(yàn)分?jǐn)?shù)的解釋影響信度的因素成熟標(biāo)志20世紀(jì)50年代古利科遜《心理測驗(yàn)理論》三大支柱基本假設(shè)信度效度第一單元信度的概念一、經(jīng)典測驗(yàn)理論ClassicalTestTheory(CTT)(一)測量誤差1、定義與測量目的無關(guān)不準(zhǔn)確測量效應(yīng)測量因素測量結(jié)果或不一致2、誤差的種類

系統(tǒng)誤差隨機(jī)誤差隨機(jī)誤差與系統(tǒng)誤差的比較類型產(chǎn)生原因結(jié)果表現(xiàn)(結(jié)果不一致)特點(diǎn)指標(biāo)同異隨機(jī)誤差…偶然因素不易控制方向和大小上完全隨機(jī)穩(wěn)定性準(zhǔn)確性信度系統(tǒng)誤差…因素恒定、規(guī)律穩(wěn)定地存在于每次測量中正確性效度3、誤差來源三層面模式測量工具測試對象施測過程(二)基本假設(shè)與真分?jǐn)?shù)1、分?jǐn)?shù)觀測分?jǐn)?shù)誤差分?jǐn)?shù)真分?jǐn)?shù)測驗(yàn)所得未加工無誤差理論上真正特質(zhì)水平操作上多個(gè)平等測驗(yàn)的平均數(shù)2、基本假設(shè)例2-1:某一物理測量結(jié)果(單位:微)物質(zhì)編號實(shí)測重量X真正重量T誤差EA12102B1920-1C2730-3D41401E51501∑1501500

S2

203.22003.2SE--1.8M30300定義T與X關(guān)系數(shù)學(xué)模型X=T+ET=X-E二、信度的概念S2T,S2E

,S2X的關(guān)系與信度S2XS2XS2TS2ES2TS2E(一)信度的定義

1、理論定義真分?jǐn)?shù)方差與觀測分?jǐn)?shù)方差的比值或2、操作定義兩組測驗(yàn)分?jǐn)?shù)之間的相關(guān)系數(shù)測量工具或結(jié)果的一致性(穩(wěn)定性)程度3、rXX值與測驗(yàn)誤差的關(guān)系r=0.50r=0.75r=0.90S2ES2TS2TS2TS2ES2E(二)信度的指標(biāo)

1、信度系數(shù)與信度指數(shù)信度系數(shù)同一群人幾次測驗(yàn)結(jié)果一致性信度系數(shù)的平方根信度指數(shù)緣由:rXX只反映X與T的符合程度未反映個(gè)體測驗(yàn)分?jǐn)?shù)的變異2、測驗(yàn)標(biāo)準(zhǔn)誤測驗(yàn)中個(gè)體真分?jǐn)?shù)的指標(biāo)理論上:一個(gè)個(gè)體多次測驗(yàn)結(jié)果分布的變異實(shí)際上:一組個(gè)體兩次測驗(yàn)結(jié)果分布的變異測量標(biāo)準(zhǔn)誤測量誤差分?jǐn)?shù)分布的標(biāo)準(zhǔn)差用途衡量測量值(X)與測量對象真值(T)的偏離程度的一種指標(biāo)用來估計(jì)個(gè)人的真分?jǐn)?shù)個(gè)人分?jǐn)?shù)的誤差個(gè)體測驗(yàn)分?jǐn)?shù)重測時(shí)的變化公式實(shí)得分?jǐn)?shù)標(biāo)準(zhǔn)差

個(gè)人分?jǐn)?shù)的誤差

rXX越大:變化的可能性越小

rXX=1:完全不變化第二單元信度評估的方法信度重測信度復(fù)本信度內(nèi)部一致性信度評分者信度分半信度同質(zhì)性信度重測復(fù)本信度一、重測信度含義同一測驗(yàn)同組對象前后測2次相關(guān)系數(shù)穩(wěn)定性程序誤差時(shí)間太短練習(xí)效應(yīng)記憶效應(yīng)A卷一定時(shí)距A卷太長身心變化

優(yōu)點(diǎn)省力、省時(shí)測量屬性相同提供隨時(shí)間變化的資料

不足適用范圍異質(zhì)性運(yùn)動技能速度時(shí)間間隔長短評價(jià)二、復(fù)本信度含義兩等值測驗(yàn)最短時(shí)間內(nèi)對同組對象施測結(jié)果r等值性程序誤差內(nèi)容取樣A卷最短時(shí)距B卷

優(yōu)點(diǎn)代表性增強(qiáng),信度更準(zhǔn)避免練習(xí)、記憶效應(yīng)

不足編制復(fù)本難影響積極性觸類旁通評價(jià)三、重測復(fù)本信度含義兩等值測驗(yàn)一定時(shí)間內(nèi)對同組對象施測結(jié)果r等值性穩(wěn)定性程序誤差內(nèi)容取樣時(shí)間A卷一定時(shí)距B卷重測信度與復(fù)本信度有何異同?重測復(fù)本信度與重測、復(fù)本信度誰得估計(jì)更嚴(yán)格,為何?小結(jié)與問題重測信度復(fù)本信度內(nèi)部一致性跨時(shí)間一致性跨形式一致性試題之間有何關(guān)系三、內(nèi)部一致性信度含義測驗(yàn)各題間一致性題目一致性行為變量異質(zhì)性分半信度類型內(nèi)容取樣同質(zhì)性信度(一)分半信度1、分半條件與程序分半方法奇偶題分半分析程序兩半相關(guān):rhh校正:rnn難易:低

高分半條件兩半相似:M、S項(xiàng)目組間相關(guān)分布形態(tài)內(nèi)容2、校正方法斯皮爾曼-布朗公式方差相等時(shí)弗拉南根公式盧尤公式方差不等時(shí)(二)同質(zhì)信度同質(zhì)性題目間的內(nèi)部一致性類型庫-理信度克龍巴赫

系數(shù)0、1題型K-R20難度不同k-R21難度相近各類題型四、評分者信度(一)含義與方法含義評分者評分的一致性方法2評分者2個(gè)以上者rXYrρ肯德爾和諧系數(shù)(二)肯德爾和諧系數(shù)K個(gè)評價(jià)者評N個(gè)被評者或作品1、應(yīng)用范圍和W系數(shù)應(yīng)用1個(gè)評價(jià)者先后K次評N個(gè)被評者或作品W范圍0~1第三單元信度與測驗(yàn)分?jǐn)?shù)的解釋真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)相關(guān)的解釋信度系數(shù)和信度指數(shù)測量標(biāo)準(zhǔn)誤信度的評價(jià)直接解釋一、真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)相關(guān)的解釋rXX間接解釋信度系數(shù)決定系數(shù)∵r2XT=ST2/SX2=rXX∴rXX為各方差的百分比S2X分為各S2E和S2T∵誤差源不同信度估計(jì)法不同rXX=0.90(一)信度系數(shù)和指數(shù)

例2-13:設(shè)有兩平等的創(chuàng)造力測驗(yàn)(A和B)?,F(xiàn):

1)間隔兩月施測100人,其信度為0.70;

2)兩卷分半信度校正值為0.80;

3)第2個(gè)評分者隨機(jī)抽50份,信度0.92;試問:

1)真分?jǐn)?shù)的方差是多少?

2)各種信度的誤差是多少?間接解釋范例信度類型rXX重測復(fù)本0.70分半信度0.80評分者信度0.92總誤差方差真分?jǐn)?shù)方差分析結(jié)果

誤差源時(shí)間、內(nèi)容內(nèi)容取樣評分者差異

兩者之差誤差的方差時(shí)間取樣1-0.70=0.31-0.80=0.20.3-0.2=0.10.2+0.1+0.08=0.381-0.38=0.621-0.92=0.08X與T的接近程度信度指數(shù)rXX=0.90(二)測量標(biāo)準(zhǔn)誤用途衡量測量值(X)與測量對象真值(T)的偏離程度的一種指標(biāo)用來估計(jì)個(gè)人的真分?jǐn)?shù)個(gè)人分?jǐn)?shù)的誤差

rXX越大:變化的可能性越小

rXX=1:完全不變化

例2-14:某測驗(yàn)信度0.89,S為15,其測量標(biāo)準(zhǔn)誤是多少?表2-12用rXX與SX估計(jì)測量標(biāo)準(zhǔn)誤

信度

S0.950.900.850.800.750.70306.79.511.613.415.016.4286.38.910.812.514.015.8265.88.210.111.613.014.2245.47.89.310.712.013.1224.97.08.59.811.012.0204.56.37.78.910.011.0184.05.77.08.09.09.9163.65.16.27.28.08.8143.14.45.46.37.07.7122.73.84.65.46.06.6102.23.23.94.55.05.581.82.53.13.64.04.461.31.92.32.73.03.340.91.31.51.82.02.220.40.60.80.91.01.1

優(yōu)點(diǎn)解釋個(gè)人分?jǐn)?shù)時(shí),可指出其誤差的范圍不受群體異質(zhì)性的影響

局限不同測驗(yàn)間的信度無法比較標(biāo)準(zhǔn)誤因信度計(jì)算法不同而不同“不論高低分,SEe相等”的假設(shè)不完全成立二、確定信度可接受水平測驗(yàn)類型最低標(biāo)準(zhǔn)標(biāo)準(zhǔn)化測驗(yàn)人格測驗(yàn)非標(biāo)準(zhǔn)化測驗(yàn)0.900.80-0.850.60-0.85典型測驗(yàn)的一般標(biāo)準(zhǔn)典型測驗(yàn)的信度高低水平測驗(yàn)類型

低中高成套成就測驗(yàn)學(xué)術(shù)能力測驗(yàn)成套傾向性測驗(yàn)客觀人格測驗(yàn)興趣問卷態(tài)度量表.66.92.98.56.90.97.26.88.96.46.85.97.42.84.93.47.79.98三、解釋個(gè)人分?jǐn)?shù)的意義公式——個(gè)體真分?jǐn)?shù)估計(jì)例如:某班一次標(biāo)準(zhǔn)化成就測驗(yàn)(rxx=0.80)中的SE為5,某生的測驗(yàn)分80。試問該生測驗(yàn)的真分?jǐn)?shù)是多少?置信度D=.95置信區(qū)間

分析結(jié)果

表2-9某生測驗(yàn)真分?jǐn)?shù)的信度區(qū)間SEe數(shù)目置信水平置信區(qū)間168.2680±5(75~85)295.4580±10(70~90)399.9380±15(85~95)1.969580±9.8(70.2~89.8)2.589980±12.9(67.1~92.9)四、比較不同測驗(yàn)分?jǐn)?shù)的差異

例如,某生在韋氏成人智測中,語言IQ為102,操作IQ為106。且知言語與操作的分半信度各為0.96和0.93。問該生操作能力是否顯著優(yōu)于言語能力?分析結(jié)果結(jié)論差異未達(dá)1個(gè)標(biāo)準(zhǔn)誤操作IQ并不高于語言IQ差異顯著性:

本例:(106-102=4)第四單元影響信度的因素

測驗(yàn)長度樣本特征測驗(yàn)難度時(shí)間間隔

一、測驗(yàn)長度含義測驗(yàn)試題的數(shù)量特點(diǎn)測驗(yàn)越長,試題取樣越恰當(dāng),測驗(yàn)越長,猜測性越小長度與信度的關(guān)系

例2-16:某測驗(yàn)有40題,信度0.65,若增至120題,信度會是多少?

例2-17:某測驗(yàn)有30題,信度0.75,試問要達(dá)到多少題才能使信度達(dá)到0.90?特點(diǎn)樣本越異質(zhì),分?jǐn)?shù)分布越廣,S↑,r↑,測驗(yàn)越可靠二、樣本特征

(一)樣本團(tuán)體異質(zhì)性的影響分析信度相關(guān)散布圖計(jì)算散布圖整段范圍低高

(二)樣本團(tuán)體平均能力水平的影響

例如,S-B量表,不同年齡和難度水平信度值從0.83~0.98。顯然,每個(gè)信度都要求對建立信度的團(tuán)體進(jìn)行描述。選擇測驗(yàn)時(shí)應(yīng)注意取樣團(tuán)體的變異性和能力水平建立信度的團(tuán)體與欲測團(tuán)體是否一致趨勢分別對非常同質(zhì)團(tuán)體建立標(biāo)準(zhǔn)化樣本??紤]年齡、性別、年級、職業(yè)和相似性等,選擇適合其所在測驗(yàn)團(tuán)體性質(zhì)的信度系數(shù)和測驗(yàn)。一般趨勢難度分布越廣,信度越高難度與題型簡答題:P=0.5時(shí),X為0~100,信度最高。選擇題的理想難度三、測驗(yàn)難度滿分值理論概率

例2-22:在100個(gè)正誤題測驗(yàn)中,滿分為100,其理想難度是多少?例2-23:在100個(gè)五擇一測驗(yàn)中,滿分為100,其理想難度是多少?分析結(jié)果例2-22例2-23學(xué)績測驗(yàn)選擇題的理想平均難度(洛德)五擇一:0.70四擇一:0.74三擇一:0.77是非題:0.85智力的時(shí)間變化

間隔期信度系數(shù)同日或次日0.90~0.951年0.852~2.5年0.805年0.75~0.809年0.78四、時(shí)間間隔S-B隔六年,rXX的變化年齡的時(shí)間變化年齡越低,信度越低

第一次第二次rXX4100.739150.8711170.92理論假設(shè):T=X-E;S2T=S2X

-S2E信度:測量結(jié)果的穩(wěn)定性類型重測、復(fù)本、重測復(fù)本內(nèi)部一致性:分半、同質(zhì)性評分者本章小結(jié)

(Validity)效度的概念效度評估的方法效度的功能影響效度的因素第一單元效度的概念效度的定義效度的性質(zhì)一、效度的定義

(一)理論定義信度S2X=S2T+S2E效度S2X=S2V+S2I+S2E隨機(jī)誤差有效方差S2V系統(tǒng)誤差S2I與測驗(yàn)?zāi)康挠嘘P(guān)的有效SV2和實(shí)得SX2

的比值效度效度定義測到欲測東西的程度效度效度定義(二)操作定義(三)信度與效度的關(guān)系信度是效度的必要條件非充分條件S2E↓,S2T↑,rxx↑信度高,給S2V增加提供可能能否提高效度,再看S2I大小信度高不一定效度高效度要高,S2V須占較大比重,S2T↑效度高,信度必高ST2信效度關(guān)系SV2SI2SE2SV2SI2SE2SV2SI2SE2ST2SX2ST2SX2ST2rxyrxx

rxyrxx

rxyrxx

↑↓↑↑↓↓相對性無普遍性:針對某種特殊用途而言只有程度不同,無所謂全有或全無連續(xù)性評價(jià)上:無“全有”或“全無”二、效度的性質(zhì)第二單元效度評估的方法

弗蘭士(J.W.French)和米希貝爾(W.B.Michbel):1966美國心理學(xué)會(1974,1985,1999):StandardsforEducationalandsychologicalTests內(nèi)容效度結(jié)構(gòu)效度效標(biāo)關(guān)聯(lián)效度

一、內(nèi)容效度意義方法特點(diǎn)應(yīng)用評價(jià)(contentvalidity)一、內(nèi)容效度

(一)意義定義:測驗(yàn)對欲測內(nèi)容的覆蓋程度作用:探討測題取樣的恰當(dāng)性條件內(nèi)容范圍明確取樣有代表性成就測驗(yàn)內(nèi)容效度的要素教學(xué)目標(biāo)教材內(nèi)容

測驗(yàn)內(nèi)容

測驗(yàn)?zāi)繕?biāo)知識技能解釋(概念)(計(jì)算)(其它)方差標(biāo)準(zhǔn)差8257103515合計(jì)186022合計(jì)4060100表3-1差異量測驗(yàn)的雙向細(xì)目表含義專家按測題和假設(shè)內(nèi)容范圍作出的符合度判斷即邏輯效度作法與程序確定總體范圍編制雙向細(xì)目表;制定評定量表;(二)評估方法1、專家判斷法局限無良好的數(shù)量指標(biāo)描述這種符合性的程度;不同專家對同一測驗(yàn)內(nèi)容效度的判斷可能不一致;不同專家對內(nèi)容范圍會有不同的理解2、經(jīng)驗(yàn)推測法檢查不同年級被試總分與每題分?jǐn)?shù)變化情況若隨年級增高總分和每題通過率也升高,可推論該測驗(yàn)基本測量了教學(xué)內(nèi)容和目標(biāo)檢查不同年齡兒童測驗(yàn)分?jǐn)?shù)的變化情況是否隨年齡增長而增加信度指標(biāo)評分者信度復(fù)本信度r高:內(nèi)容效度r低:至少一個(gè)缺乏內(nèi)容效度再測度度經(jīng)驗(yàn)法3、統(tǒng)計(jì)分析法(三)特性特定性:測驗(yàn)編制者與使用者的關(guān)系與表面效度(facevalidity)混淆

一個(gè)測驗(yàn)看上去適合欲測目的的程度,而非實(shí)際適合欲測目的的程度。

測驗(yàn)在使用者或被試主觀上感覺有效的程度。

編制測驗(yàn)應(yīng)適當(dāng)考慮表面效度。二、構(gòu)想效度定義確定步驟估計(jì)方法(constructvalidity)二、構(gòu)想效度

(一)定義構(gòu)想(理論,結(jié)構(gòu))解釋行為的理論框架或心理特質(zhì)的抽象概念。結(jié)構(gòu)效度心理學(xué)理論所能解釋的程度測驗(yàn)在多大程度上測量了所要測的理論構(gòu)想(二)確定步驟提出理論提出假設(shè)檢驗(yàn)假設(shè)解釋被試的測驗(yàn)表現(xiàn)測驗(yàn)成績的假設(shè)邏輯和實(shí)證檢驗(yàn)方法關(guān)于情緒穩(wěn)定性的假設(shè)測驗(yàn)分?jǐn)?shù)和心理學(xué)家的評價(jià)有某種程度的相關(guān)精神病人和正常人的測驗(yàn)分?jǐn)?shù)是有區(qū)別的;測驗(yàn)分?jǐn)?shù)和同伴的評價(jià)有一定的關(guān)系;測驗(yàn)分?jǐn)?shù)與IQ沒有什么關(guān)系;測驗(yàn)分?jǐn)?shù)和性別沒有關(guān)系;關(guān)于智力的假設(shè)智力隨年齡而增長;智力與學(xué)業(yè)成績有密切關(guān)系;智商是相對穩(wěn)定的;智力受遺傳的影響關(guān)于創(chuàng)造力的假設(shè)測驗(yàn)分?jǐn)?shù)與根據(jù)創(chuàng)造力的心理學(xué)理論觀察被試行為所作出的判斷有相關(guān);具有創(chuàng)造力的個(gè)體行為與其他人不同;(三)估計(jì)方法

1、對測驗(yàn)本身的分析測驗(yàn)內(nèi)方法測驗(yàn)間方法效標(biāo)關(guān)聯(lián)效度實(shí)驗(yàn)操作概化能力的研究(三)估計(jì)方法

1.對測驗(yàn)本身的分析——測驗(yàn)內(nèi)方法研究測驗(yàn)內(nèi)部構(gòu)造分析測驗(yàn)的結(jié)構(gòu)效度。具體方法內(nèi)容效度法內(nèi)部一致性法分析解題的心理過程

1)內(nèi)容效度法確定取樣內(nèi)容范圍后,利用這些資料定義測驗(yàn)欲測的結(jié)構(gòu)性質(zhì)韋氏智力測驗(yàn)言語:常識、理解、算術(shù)、相似性、詞匯、記憶廣度操作:譯碼、填圖、積木圖案、圖片排列、圖形拼湊內(nèi)容范圍的描述見到老師、小朋友是否主動打招呼?愿意自己獨(dú)自玩,還是與其他孩子一起玩?語言較多還是較少,見生人時(shí)是否害羞?是否大方?做游戲時(shí),與人交往時(shí),能與人合得來嗎?獨(dú)生子女合群性測驗(yàn)卡特爾16PF16個(gè)特質(zhì),187個(gè)題目樂群性,聰慧性,穩(wěn)定性,持續(xù)性,興奮性,有恒性,敢為性,敏感性,懷疑性,幻想性,世故性,憂慮性,實(shí)驗(yàn)性,獨(dú)立性,自律性,緊張性分測驗(yàn)間關(guān)系的分析:特質(zhì)間相互獨(dú)立分測驗(yàn)內(nèi)項(xiàng)目關(guān)系的分析:項(xiàng)目相互聯(lián)系2)內(nèi)部一致性法目的推斷測驗(yàn)是否測量單一特質(zhì)方法極端組比較法(extreme-groupmethod)二列相關(guān)法:求題目與總分的相關(guān)分測驗(yàn)與總分的相關(guān)2.測驗(yàn)間的相互比較——測驗(yàn)間方法含義同時(shí)考慮幾個(gè)測驗(yàn)間的關(guān)聯(lián),考察是否測同一結(jié)構(gòu)。常用方法相容效度區(qū)分效度因素分析其它方法

1)相容效度concurrentvalidity含義測相同結(jié)構(gòu)的各種測驗(yàn)間應(yīng)有較高的相關(guān)。求一個(gè)新編測驗(yàn)與另一已知結(jié)構(gòu)測驗(yàn)間的相關(guān)。2)區(qū)分效度含義某一特定測驗(yàn)的分?jǐn)?shù)與已知測量不同結(jié)構(gòu)的測驗(yàn)分?jǐn)?shù)無關(guān)會聚效度某一特定測驗(yàn)的分?jǐn)?shù)與測同一結(jié)構(gòu)的其他測驗(yàn)的分?jǐn)?shù)有關(guān)相關(guān)高說明新測驗(yàn)的效度有問題3)因素分析意義找出變量間內(nèi)在本質(zhì)聯(lián)系的一種多元統(tǒng)計(jì)方法。通過縮減變量的方法,用反映變量本質(zhì)聯(lián)系的少數(shù)幾個(gè)基本因素(或公共因素)來說明先前需要用較多變量才能說明的原因或特性?;驹砜傋儺?共同因素+特殊因素+誤差兩個(gè)變量之間的相關(guān)等于它們共同因素負(fù)荷的交互乘積之和。

Cronbach對Loger-Thorndike

智力測驗(yàn)的因素分析結(jié)果分測驗(yàn)1.圖形分類2.數(shù)字序列3.圖形分析4.句子填充5.詞語分析6.算術(shù)推理7.詞匯特征值總方差%

因素負(fù)荷

AB共同性(h2)0.4610.5870.5570.3830.7050.6440.4630.6880.6870.816-0.0500.6680.8430.0970.7200.6200.2570.4500.870-0.0470.7593.0911.3944.485442064語詞非語詞(美)霍爾津格(Holzinger)和斯溫福德(Swineford)的因素分析取樣:芝加哥效區(qū)被試:145名7~8年級學(xué)生內(nèi)容:實(shí)施24個(gè)心理測驗(yàn)結(jié)果:4個(gè)基本因素圖——詞測驗(yàn)的功能不明顯。24個(gè)心理測驗(yàn)的因素歸類詞語速度推理記憶1.一般知識段落理解2.句子填空3.詞匯分類4.詞義解釋5.加法6.編碼7.計(jì)數(shù)8.點(diǎn)子9.直-曲10.算術(shù)問題11.視知覺15.數(shù)字游戲12.體積16.問題推理13.面積17.系列填空14.打旗18.演繹推理19.詞匯識別20.數(shù)字識別21.圖形識別22.實(shí)物-數(shù)23.圖-詞24.數(shù)-圖3、效標(biāo)效度的研究證明測驗(yàn)

效標(biāo)效標(biāo)效度資料:提供與結(jié)構(gòu)效度有關(guān)的信息。考察X能否區(qū)分不同團(tuán)體的人。4、實(shí)驗(yàn)法和觀察法的證實(shí)考察實(shí)驗(yàn)變量對X的影響比較實(shí)驗(yàn)處理:前后分?jǐn)?shù)的差異搜集某些變異上的證據(jù)。三、效標(biāo)效度criterion-relatedvalidity定義效標(biāo)估計(jì)方法(一)定義測驗(yàn)分與外在獨(dú)立效標(biāo)的關(guān)系。在特定條件下測驗(yàn)對被試操作行為所作預(yù)測的有效性符號:rxy。又稱統(tǒng)計(jì)效度或?qū)嵶C效度。(二)效標(biāo)或標(biāo)準(zhǔn)

1.定義衡量測驗(yàn)效度的外在標(biāo)準(zhǔn)。做預(yù)測所依據(jù)的標(biāo)準(zhǔn)。檢驗(yàn)效度的參照標(biāo)準(zhǔn)。測驗(yàn)所要測的或要預(yù)測的行為特質(zhì)。將X與隔一定時(shí)期后同組對象的成績求相關(guān)。檢查新編測驗(yàn)的效度。2.良好效標(biāo)的選擇依據(jù)反映測驗(yàn)的目標(biāo)較高的信度可客觀地測量測量方法簡單,省時(shí)省力,經(jīng)濟(jì)實(shí)用各類測驗(yàn)的可用效標(biāo)測驗(yàn)類型常見效標(biāo)成就學(xué)年平均分,教師評定結(jié)果,學(xué)習(xí)量,知識應(yīng)用力,評判知識的批判力,自學(xué)能力…智力學(xué)科成績,教師評定結(jié)果,學(xué)生總成績能力傾向特殊課程或訓(xùn)練成績,工作或?qū)W習(xí)成績職業(yè)興趣從業(yè)者的實(shí)際成績或工作表現(xiàn)人格主試主觀標(biāo)準(zhǔn),被試以后行為,臨床資料3、效標(biāo)效度的類型

1.同時(shí)效度含義根據(jù)測驗(yàn)分區(qū)分已有的狀態(tài)或預(yù)測已知的效標(biāo)表現(xiàn)來評估測驗(yàn)效度的方法。對同組對象求新編測驗(yàn)得分與現(xiàn)有測驗(yàn)得分(效標(biāo)值)之間的相關(guān)。應(yīng)用:效標(biāo)分和新編測驗(yàn)分能同時(shí)得到。度量指標(biāo):測驗(yàn)分與效標(biāo)分的相關(guān)系數(shù)2.預(yù)測效度定義根據(jù)測驗(yàn)分?jǐn)?shù)預(yù)測其在效標(biāo)上將來成績來考察測驗(yàn)效度的方法。一個(gè)測驗(yàn)對被試心理特質(zhì)或未來績效所作預(yù)測的準(zhǔn)確程度。應(yīng)用:測驗(yàn)分與效標(biāo)分不能同時(shí)得到。度量指標(biāo):測驗(yàn)分與效標(biāo)分的相關(guān)系數(shù)(三)估計(jì)方法

1、相關(guān)法效度系數(shù)組的分類預(yù)期表命中率功利率(三)估計(jì)方法

1.相關(guān)法效度系數(shù)測驗(yàn)分(新編)與效標(biāo)分的相關(guān)系數(shù)符號rXY或val.相關(guān)方法描述多列數(shù)據(jù)相關(guān)程度與相關(guān)方向的統(tǒng)計(jì)方法。計(jì)算方法積差相關(guān)法二列相關(guān)、點(diǎn)二列相關(guān),多系列相關(guān)等2、區(qū)分法——t檢驗(yàn)?zāi)康模罕容^高低分組的差異高分組和低分組25%-33%,特別是27%例如:團(tuán)體高分組的平均數(shù)為6.05,標(biāo)準(zhǔn)差為2.02;低分組的平均數(shù)為4.25,標(biāo)準(zhǔn)差為1.3。試問兩組的平均數(shù)有無顯著差異?評價(jià)缺點(diǎn)組間均數(shù)差異顯著性取決于團(tuán)體大小。處理方法求兩組分布的重疊量:指標(biāo)一組內(nèi)均數(shù)超過另一組均數(shù)的百分率;兩組分?jǐn)?shù)分布共同區(qū)域的百分率;結(jié)果報(bào)告:均數(shù)、標(biāo)準(zhǔn)差、重迭量、檢驗(yàn)值3.命中率法含義:正確決策的比例用途人才選拔方法正確決策的結(jié)果正確接受正確拒絕

業(yè)績Y012345678910能力傾向測驗(yàn)分(X)12345678910112152231469211352412633212524151211213373822錯誤接受正確拒絕正確接受錯誤拒絕結(jié)果正確決策正確接受正確拒絕383371第三單元效度的功能預(yù)測誤差預(yù)測效標(biāo)分?jǐn)?shù)預(yù)測效率指數(shù)一、預(yù)測誤差

(一)決定系數(shù)效度系數(shù)決定系數(shù):r2正確預(yù)測或解釋效標(biāo)的方差占總方差的比例。(二)估計(jì)標(biāo)準(zhǔn)誤含義效度分?jǐn)?shù)(Y)分布的標(biāo)準(zhǔn)差:預(yù)測誤差大小的估計(jì)值。公式:誤差為0,預(yù)測完全準(zhǔn)確:全為誤差,預(yù)測完全不準(zhǔn)

二、預(yù)測效標(biāo)分?jǐn)?shù)線性回歸方程變量X和Y呈現(xiàn)直線相關(guān)方程預(yù)測的效標(biāo)分?jǐn)?shù)測驗(yàn)分?jǐn)?shù)截距:糾正平均數(shù)的差異斜率:回歸系數(shù)三、預(yù)測效率指數(shù)預(yù)測標(biāo)準(zhǔn)誤無關(guān)系數(shù)(K)預(yù)測效率指數(shù)例如,某測驗(yàn)的效度系數(shù)為0.80,其預(yù)測效率指數(shù)是多少?第四單元影響效度的因素

測驗(yàn)組成測驗(yàn)實(shí)施樣本團(tuán)體的性質(zhì)效標(biāo)的性質(zhì)一、測驗(yàn)本身的因素

(一)影響因素試題性質(zhì)測驗(yàn)取材、測驗(yàn)長度、試題難度和鑒別力及編排方式。增加新試題對信度的影響大于效度;測驗(yàn)長度與信度和效度的關(guān)系題數(shù)與原測驗(yàn)題數(shù)之比信度效度1010.3000.4002020.4620.4963030.5620.5486060.7200.619120120.8370.688240240.9110.697480480.9540.713(二)提高方法取材代表性避免易引起誤差的題型(如是非題)難度適中長度恰當(dāng)先易后難排序二、測驗(yàn)實(shí)施

(一)主試的影響主試測驗(yàn)情境的控制按測驗(yàn)手冊各項(xiàng)規(guī)定實(shí)施測驗(yàn)。施測過程場地布置材料準(zhǔn)備作答方式說明時(shí)間的限制等二、測驗(yàn)實(shí)施

(一)主試的影響主試是否按測驗(yàn)手冊各項(xiàng)規(guī)定實(shí)施測驗(yàn)指導(dǎo)語是否統(tǒng)一正確時(shí)限是否一致評分是否合理測驗(yàn)情境的控制場地布置材料準(zhǔn)備作答方式說明時(shí)間的限制等(二)被試影響因素人格興趣、動機(jī)、情緒、態(tài)度身心健康狀況作答真實(shí)性是否充分合作與盡力三、樣本團(tuán)體的性質(zhì)

(一)異質(zhì)性特點(diǎn)越異質(zhì),分?jǐn)?shù)分布越廣,效度越高;越同質(zhì),分?jǐn)?shù)分布越窄,效度越低;影響因素只以選拔上的被試為樣本進(jìn)行效度研究選拔標(biāo)準(zhǔn)太高(二)干涉變量

1、干涉變量的含義相同測驗(yàn)對不同團(tuán)體的測量功能不同;干涉變量因性質(zhì)不同(性別、興趣、職業(yè)、年齡等)使不同團(tuán)體具有不同的預(yù)測能力。2、對干涉變量的確定提出者吉塞利(E.E.Ghiselli,美)測量學(xué)家具體方法確定是否存在干涉變量D=個(gè)人預(yù)測效標(biāo)分-實(shí)際效標(biāo)分找出干涉變量選擇不同對照組分別計(jì)算效度對亞團(tuán)體的進(jìn)一步分析四、效標(biāo)的性質(zhì)效標(biāo)本身的性質(zhì)——效標(biāo)可靠性相同條件下:測量行為與效標(biāo)行為相似,效度越高。效標(biāo)與測驗(yàn)分的關(guān)系——關(guān)系線性兩變量不呈線性關(guān)系兩變量呈線性關(guān)系,但分布不均勻效標(biāo)的性質(zhì)效標(biāo)本身的性質(zhì)相同條件下:測量行為與效標(biāo)行為相似,效度越高。效標(biāo)與測驗(yàn)分?jǐn)?shù)的關(guān)系類型兩變量不呈線性關(guān)系;兩變量呈線性關(guān)系,但分布不均勻;第一單元難度分析通過率或正答率試題的難易程度以全體被試答對或通過該題百分比表示對知識和能力水平的適合程度的指標(biāo)。與測驗(yàn)效率的關(guān)系難度適當(dāng)是構(gòu)成優(yōu)良測驗(yàn)的必要條件。

一、定義1、定義式二、計(jì)算方法(一)0、1記分的項(xiàng)目通過人數(shù)參測人數(shù)含義以高低分組平均通過率表示的難度2、極端分組法步驟高、低分組通過率平均通過率例4-1:200人參加某項(xiàng)測驗(yàn),在一填空題上高分組48人通過,低分組23人通過。試問該題的難度值是多少?例4-2:在100名學(xué)生中,高分組與低分組各有27人。其中高分組答對第一題的有20人,低分組答對第一題的有10人。試問該題的難度是多少?3、選擇題的校正原通過率備選答案數(shù)目例4-3:某題有5個(gè)選項(xiàng),該題通過的人數(shù)為0.75,試問校正后的通過率是多少?(二)非0、1記分項(xiàng)目某題的平均得分該題的滿分值例4-4:某試卷中一論述題為20分,10名參加測驗(yàn)者得分為10、18、14、8、18、3、14、10、9、8。試問該題的難度是多少?三、難度水平的確定依據(jù)測驗(yàn)?zāi)康男再|(zhì)試題形式內(nèi)容試題難度水平測驗(yàn)難度水平(一)測題的難度

1、基本要求一般原則

各種測驗(yàn)的難度標(biāo)準(zhǔn)化測驗(yàn):0.30~0.70;一般測驗(yàn):

極難(P﹤.1)→極易P﹥.9)選拔和診斷測驗(yàn):接近錄取率效標(biāo)參照測驗(yàn):有時(shí)不考慮難度

2.選擇題難度的確定一般:>概率水平P=概率水平:過難或題意不清,猜測性;P﹤概率水平:無意義,質(zhì)量問題;概率水平正誤試題:P=0.75四擇一題:P=0.63(二)測驗(yàn)的難度依據(jù)取決于構(gòu)成測驗(yàn)的試題難度一般原則標(biāo)準(zhǔn)化測驗(yàn):正態(tài)分布效標(biāo)參照測驗(yàn):允許偏態(tài)分布

低高

圖4-1正偏態(tài)分布圖難度大低高

圖4-2

負(fù)偏態(tài)分布圖

難度大第二單元項(xiàng)目的區(qū)分度

一、定義目的區(qū)分優(yōu)劣(Good-Poor)定義測題對所測心理特質(zhì)的區(qū)分程度或鑒別能力二、計(jì)算方法

(一)鑒別指數(shù)含義高、低分組通過率之差:步驟按測驗(yàn)總分高低排序試卷確定高低分組:每組占27%分別計(jì)算各組的通過率代入鑒別指數(shù)公式

例4-7:100人參加某項(xiàng)測驗(yàn),對其中四道題做對的人數(shù)分布如表所求,試問這些試題的區(qū)分度分別是多少?題做對人數(shù)

目高分組低分組12724212136842212結(jié)果題做對人數(shù)

目高分組低分組12724212136842212

通過百分比高分組低分組1.000.890.440.040.220.300.810.44D0.110.40-0.080.37測題鑒別指數(shù)與評價(jià)標(biāo)準(zhǔn)區(qū)分度(D)評價(jià)0.40以上0.30-0.390.20-0.290.19以下非常良好良好,如能改進(jìn)則更佳尚可,仍需再改進(jìn)劣,必須淘汰或加以修改提出者美國測驗(yàn)學(xué)家:伊貝爾(L.Ebel)(二)相關(guān)法某一測題分與效標(biāo)成績或測驗(yàn)總分的相關(guān)具體方法點(diǎn)二列相關(guān)——客觀題二列相關(guān)——主觀題Φ相關(guān)變量點(diǎn)二列相關(guān)二列相關(guān)Φ相關(guān)一列連續(xù)變量二分名稱一列二分名稱二分名稱(人為的)二分名稱點(diǎn)二列相關(guān)、二列相關(guān)和Φ相關(guān)三、區(qū)分度與難度的關(guān)系難度是區(qū)分度的必要條件難度愈接近.50,試題區(qū)別作用愈大。較難項(xiàng)目,對高水平被試區(qū)分能力高較易項(xiàng)目,對低水平被試區(qū)分能力高中等項(xiàng)目,對中等水平被試區(qū)分能力高P與D最大值的關(guān)系P最大鑒別值1.000.00.900.20.800.40.700.60.600.80.501.00.400.80.300.60.200.40.100.20.000.00P、D與答案分析實(shí)例例4-12:有人計(jì)劃編制一套上海市中學(xué)幾何學(xué)科測驗(yàn),按預(yù)定題數(shù)加倍制定測題再以項(xiàng)目分析法選擇最適當(dāng)?shù)臏y題?,F(xiàn)從上海初三全域抽取代表性樣本370人為預(yù)測對象接受測驗(yàn)。按學(xué)生總分高低順序排列,抽取最高和最低的試卷各27%為高低分組?,F(xiàn)從中選出4個(gè)選擇題,經(jīng)過項(xiàng)目分析獲得以下結(jié)果。題組選答人數(shù)號別ABCD未答1高分組592120

低分組2250121602高分組581015161

低分組2621153623高分組1715282812

低分組25111934114高分組14414365

低分組15610285正確答案BADC抽取代表性樣本(370人),預(yù)測;按總分高低排序,確定高低分組(27%)求兩組的通過率及平均通過率;求鑒別力指數(shù)和相關(guān)系數(shù);比較高低分組的難度和區(qū)分度及不同答案的反應(yīng);根據(jù)分析結(jié)果,篩選試題或修改試題;分析程序題組選答人數(shù)號別ABCD未答1高分組592120

低分組225012160

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論