心理與教育測量復習資料覃瑞_第1頁
心理與教育測量復習資料覃瑞_第2頁
心理與教育測量復習資料覃瑞_第3頁
心理與教育測量復習資料覃瑞_第4頁
心理與教育測量復習資料覃瑞_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

心理與教育測量復習資料戴海崎張峰陳雪楓主編第三版覃瑞(21267529)心理與教育測量概論測量是依據(jù)一定法則使用量尺對事物屬性定量描述的過程。測量關鍵詞:1一定法則(科學原理和方法)2事物屬性(客體特征)3量尺(度量工具)4定量描述(對屬性量的確定)數(shù)量的四個特性:1區(qū)分性2序列性3等距性4可加性測量的精度影響因素:一對象的性質(zhì)(1確定型是一定條件下,恒定不變2隨機型是量隨機改變。短時記憶容量3模糊型是事物量本身模糊、難以確定。人格)二測量工具的精度測量的基本類型:1物理測量(長、寬)2生理測量(生物)3社會測量(人口普查)4心理測量(智力、人格)測量的基本要素:一測量參照點(1絕對參照點以絕對零作為測量的起點,是最理想的參照點,意義最為明確,如長度2相對參照點以人為確認的零點為起點,如海拔高度)二測量單位(前提條件:1確定的意義,沒有歧義2相等的價值,如1+1=2)量表是使事物特征數(shù)量化的連續(xù)體度量是建立系統(tǒng)的法則,選擇有意義的參照點及單位來量化事物屬性測量的量表種類:1名稱量表(用數(shù)字對事物分類,沒有數(shù)學意義)2順序量表(用數(shù)字指代類別,有大小、等級,程度)3等距量表(指代事物的類別和等級,具有相等距離的測量單位,可以加減,是相對零點)4比率量表(任何一個非零點數(shù)值均可以表示為其他數(shù)值的比值,具有類別、等級、等距的特征,是最完善的測量量表)心理與教育測量是根據(jù)心理學和教育法則對心理特征和教育成就指派數(shù)字描述的過程心理與教育測量的特性:1心理與教育測量依據(jù)的法則相當程度上是理論,達不到物理測量的嚴密水平2測量對象是心理特質(zhì)和教育成就,是一種根據(jù)外顯行為推測,間接的測量3尺度是又專家長期編制、試用、完善逐漸標準化4測量目標是進行定量分析心理特質(zhì)是相對穩(wěn)定,對行為調(diào)節(jié)的心理特征心理特質(zhì)特點:復雜性、流動性、內(nèi)隱性(間接測量)心理與教育測量的理論基礎:1桑代克提出“客觀存在的事物都有其數(shù)量”2麥柯爾提出“有其數(shù)量的事物都可以測量”3哲學觀點--事物都是質(zhì)和量的統(tǒng)一,質(zhì)的差異是分類的前提,量的差異是測量的前提4一百多年積累的經(jīng)驗,初步形成比較科學的測量原理與技術心理與教育測量的量表特點:1本質(zhì)上屬于順序量表2參照點都是相對零點,不是絕對零點3使用的單位意義不明確,單位常常不等值4其值具有順序性心理測驗是對行為樣本的客觀的和標準化的測量測驗應當具備的四個基本條件:1行為樣本(測量的項目行為與欲測量的行為域高度相關)2標準化(測驗的編制、實施、記分以及測量分數(shù)解釋的程序的一致性)3難度或應答率(難度是計算被試答對某一項目的人數(shù)比例來確定,太高或太低都不能有效區(qū)分個體水平應答率用在態(tài)度、興趣、性格測驗不存在難度的問題上,回答“是”“否”人太多或太少,都不能有效區(qū)分人的心理特征)4信度和效度(信度是測驗的可靠性,多次測驗的一致性程度。效度是測驗的有效性,多大程度上測驗的結(jié)果反映了測量的心理特質(zhì))能被實現(xiàn)行為抽樣的所有行為的總體是行為域從行為域中被抽取出來的、作為直接測量對象的行為樣例就是行為樣本測量數(shù)學運算能力的高低,數(shù)學知識范圍是知識域,一組解答數(shù)學問題得行為就是行為樣本測驗標準化要點:1實施相同或等值的測驗內(nèi)容2測驗條件的標準化(情景、指導語、時限)3評分規(guī)則的標準化(評分規(guī)則足以使不同評分人的評分結(jié)果保持最大限度的一致)4測驗常模的標準化(常模是一組有代表性的普通人為被試的一般情況平均測驗分數(shù),一個相對參照點,關鍵是抽取有代表性的被試樣本)以常模為參照編制的測驗叫常模參照測驗以標準為參照編制的測驗叫目標參照測驗根據(jù)測量對象分類:1智力測量2能力傾向測驗(一般能力、特殊能力)3成就測驗(科學成就、綜合成就)4人格測驗(自陳人格問卷、投射測驗)根據(jù)測量方式分類:一個別測驗(同一時間段,只能測試一個。優(yōu)點:1行為的仔細觀察,獲得測驗意外的信息2與被試交流,建立合作關系3特殊被試只能單獨測驗缺點:1費時間2測驗復雜,需較高技能個別測驗不能用于團體測驗)二團體測驗(同一時間,測試多個。優(yōu)點:1節(jié)省時間2不宜有效控制被試行為3容易有誤差團體測驗可以用于個別測驗)根據(jù)測驗內(nèi)容表達和反應形式的分類:1文字紙筆測驗(容易受被試文化背景影響,降低測驗效度)2非文字操作測驗(局限于個別測驗,時間上不經(jīng)濟)根據(jù)測試功能的分類:1成就測試與預測測驗(成就是測驗某領域已達到的成就預測是測驗未來某領域成功的可能性)2難度測試與速度測驗(難度是測驗個人達到的最高水平速度是測驗個人做題的速度)3描述測試與診斷測驗(描述是通過測驗來描述心理特質(zhì)診斷是通過測驗對問題行為及其原因的診斷)心理與教育測驗的作用:1理論研究功能(收集研究資料、建立和檢驗理論假設、實驗分組)2實際應用功能(人才選拔、人員安置、心理診斷、描述評價、心理咨詢)心理與教育測量工作者的素質(zhì)要求:1知識結(jié)構(gòu)(基礎知識:普通心理學、發(fā)展心理學、教育心理學、心理統(tǒng)計、教育學等專業(yè)知識:人格心理、智力心理、測量心理等)2科學的態(tài)度(測量是研究的重要工具、也是解決實際問題的重要工具)心理與教育測量工作者的道德要求:1測驗的保密和控制使用2測驗中個人隱私的保護(必要情況下才問隱私、征得被試同意、為被試保密、)心理與教育測量簡史中國古代的心理與教育測量:一能力測量(孔子將智力分為三等:中上之人和中人之人可以語、中下之人;董仲舒的測驗:一手畫方,一手畫圓,莫能成;三國劉邵的《人物志》;清代的七巧板、九連環(huán)是創(chuàng)造力測驗)二人格測量(孔子將人分三種:狂者、中行、狷juan者)三教育測量(西周的“國學”已建立比較系統(tǒng)的教育測量制度;西漢考試三種形式:口試、策試、射策;隋朝開始的科舉制度)四對測驗理論的最初探索(孟子:權,然后知輕重,度,然后知長短,物皆然,心為甚)中國古代心理與教育測量思想特點:1都是描述性的,非定量2分類式的3對人作整體的評價,并傾向和道德品質(zhì)聯(lián)系4因材施教、強烈的應用性心理與教育測量的三位奠基者:一高爾頓是運用統(tǒng)計的方法,優(yōu)生學的創(chuàng)始人二卡特爾首次提出“心理測量”,一套能力測驗三比內(nèi)與西蒙的世界第一個智力量表“比內(nèi)--西蒙量表”心理與教育測量的發(fā)展階段:20世紀20年代的狂熱期,40年代達到頂峰,50年代以后是經(jīng)典測量理論趨于成熟,60年代后測量理論出現(xiàn)新動向1916年推孟修訂的斯坦福--比內(nèi)量表軍隊中出現(xiàn)了團體施測方法能力傾向測驗的結(jié)構(gòu)測驗桑代克的第一個標準化教育成就測驗克雷培林用聯(lián)想法做了最早的人格測量1917年出現(xiàn)了自陳人格問卷人格測量的另一種重要技術是投射測驗,1910年,羅夏克的墨跡測驗心理與教育測量的當代趨勢:1將實驗法與測驗法結(jié)合,產(chǎn)生了信息加工測驗2計算機軟件測驗提高了效率3對經(jīng)典測量理論的缺陷,提出了概化理論和項目反應理論1931年,成立中國測驗學會1924年,陸志韋的《訂正比內(nèi)西蒙智力測驗說明書》肖孝嶸rong編制的9--15歲的常模中國人自己人格量表,王登峰的7種人格特質(zhì)經(jīng)典測驗理論的基本假設心理特質(zhì)是表現(xiàn)在人身上所特有的相對穩(wěn)定的行為方式。心理特質(zhì)的要點:1內(nèi)部相關行為的一組概括,有抽象性2神經(jīng)心理系統(tǒng)綜合不同的刺激,做出相同的反應3比較穩(wěn)定4精神面貌由多種特質(zhì)分多層次的有機組合而成5決定對特定刺激的反應傾向6可預測性測量誤差是測量過程中與測量目的無關的變化因素產(chǎn)生的不準確或不一致的測量效應測量誤差的要點:1由無關變量所致2表現(xiàn)為不準確或不一致測量誤差的種類:隨機誤差(由與測量目的無關的偶然因素引起的而又不易控制的誤差。方向和大小都是隨機的,影響穩(wěn)定性和準確性)和系統(tǒng)誤差(與測量目的無關的變因引起的一種恒定而有規(guī)律的效應。存在每次測量中,只影響準確性,不影響穩(wěn)定性)測量誤差的來源:1測量工具(量表的穩(wěn)定性、量表測量到的內(nèi)容)2測量對象(受測試者的發(fā)揮、狀態(tài))3實施過程(情景、主試、意外干擾)一套以測驗(問卷)為核心的刺激反應系統(tǒng)稱為量表真分數(shù)T是反映被試心理特質(zhì)真正水平的數(shù)值,是個理論上構(gòu)想出來的抽象概念,因為誤差總會存在觀察分數(shù)是實測的分數(shù)CTT數(shù)學模型是線性關系:X觀察分數(shù)T真分數(shù)E隨機誤差X=T+E三個關聯(lián)的假設公理:一心理特質(zhì)可以通過平行測驗反復測量多次,觀察分數(shù)的平均值會接近真分數(shù)二真分數(shù)和誤差分數(shù)之間的相關為零三各平行測驗上的誤差分數(shù)之間相關為零四測量誤差是完全隨機的,均值為零的正態(tài)分布五真分數(shù)假定不會變,測量就是估計這一真分數(shù)大小對于測驗總體中的任意一個被試而言,被試在兩個測驗上的觀測分數(shù)(X)同時滿足CTT的數(shù)學模型和三大假設,并且具有相等的真分數(shù)(T)和相等的誤差標準差(σ2),則這兩個測驗被稱為嚴格平行的測驗,通俗的說:兩個題目不同的測驗測得的是同一特質(zhì),并且題目形式、數(shù)量、難度、區(qū)分度、測得分數(shù)的分布都一致的兩個測驗對于測驗總體中的任意被試,被試在兩個測驗上的觀測分數(shù)(X1、X2)同時滿足CTT的數(shù)學模型和三大假設,并且其真分數(shù)(T1=T2+C12)之間僅相差一個常數(shù)(C12),則這兩個測驗被稱為基本等價的測驗S2X=S2T+S2E觀測分數(shù)方差=真分數(shù)方差+誤差方差S2T=S2V+S2I真分數(shù)方差=測量目的有關變異+測量目的無關變異S2X=S2V+S2I+S2E觀測=有關變異(有效分數(shù))+穩(wěn)定的無關變異(系統(tǒng)誤差)+測量誤差變異(隨機)測量信度信度指同一測量工具多次測量同一被試的同一心理特質(zhì),多次測量結(jié)果的一致性程度。一個好的測量必須有較高的信度信度另外三種等價定義:一是一個被測團體的真分數(shù)的變異數(shù)與實得分數(shù)的變異數(shù)之比rxx=S2T/S2x二是一個被試團體的真分數(shù)與實得分數(shù)的相關系數(shù)的平方rxx=ρ2xT三是一個測驗x與它的一個平行測驗x`的相關系數(shù)rxx=ρxx`描述測量一致性程度的指標還可以用信度指數(shù)ρxT,它實際上是信度系數(shù)的平方根信度的作用:一信度反映測量過程中的隨機誤差的大小二信度可以解釋個人測驗分數(shù)的意義,信度越大越精確三信度可以幫助不同測驗分數(shù)的比較,轉(zhuǎn)化為標準分數(shù)Z標準誤公式:SE=SxSE標準誤Sx實得分標準差rxx`信度置信區(qū)間X--ZCSE≤T≤X+ZCSEX觀測分數(shù)SE標準誤ZC統(tǒng)計檢驗顯著性水平的標準正態(tài)分布下的臨界值(1.96=95%2.58=99%)兩種不同測驗的“差異的標準誤”公式:SE=SS相同尺度的標準分數(shù)的標準差rxx和ryy分別是兩個測驗的信度系數(shù)重測信度是同一個量表、同一組被試施測兩次結(jié)果的一致性程度,使用條件:1所測量的心理特性必須是穩(wěn)定的2遺忘和練習效果基本上相互抵消(間隔時間適度)3在間隔期間內(nèi),被試要測量的心理特質(zhì)沒有得到訓練重測信度計算用皮爾遜積差相關系數(shù):使用條件是:1成對數(shù)據(jù)2都是測量數(shù)據(jù)3正態(tài)分布4兩變量有線性關系復本信度是兩個平行的測驗測量同一批被試所得結(jié)果的一致性程度。計算用皮爾遜積差相關系數(shù),分為兩種:等值性系數(shù)(同時連續(xù)施測)和穩(wěn)定性與等值性系數(shù)(相距一段時間分兩次施測),為抵消施測的順序效應,可采用平衡設計,隨機選出一半被試先做A卷再做B卷,另一半被試先做B卷再做A卷,使用條件:1構(gòu)造出兩份或以上的平行測驗(不同題目測量相同內(nèi)容)2被試要能接受兩次測驗半分信度是一個測驗分成對等的兩半后,被試在這兩半上所得分數(shù)的一致性程度。使用條件:1只能施測一次或沒有復本的情況下2分半方法(奇偶性分半、題目難度分半、題目內(nèi)容分半)分半法題目數(shù)K減小,所以信度減小當兩半測驗分數(shù)的變異數(shù)相等時,兩半測驗得分的相關系數(shù)只是半個測驗的信度,必須用斯皮爾曼--布朗公式校jiao正:rhh分半分數(shù)間的相關系數(shù)rxx整個測驗的信度值當兩半測驗分數(shù)的變異數(shù)不相等時,用弗fu朗那根公式:S2a和S2b分別是被試在兩半測驗上得分的變異數(shù)(方差)S2x全體被試在整個測驗上總得分的變異數(shù)(方差)同質(zhì)信度,內(nèi)部一致性系數(shù),是測驗內(nèi)部所有題目間的一致性程度。題目一致性有兩層意思:1所有題目測的都是同一種心理特質(zhì)2所有題目得分之間都具有較高的正相關測量單一特性是同質(zhì)性高的必要條件,不是充分條件。同質(zhì)性高是測驗測得單一特質(zhì)的充分條件當測驗是(0、1)記分時,可以用庫德--理查德遜公式:K題目數(shù)pi答對第i題的人數(shù)比例qi答錯第i題的人數(shù)比例S2x測驗總分的變異(方差)當測驗不是(0、1)記分時,用克龍巴赫α系數(shù):S2i所有被試在第i題上的分數(shù)變異(方差)K題目數(shù)S2x測驗總分的變異(方差)評分者信度是多個評分者給同一批人的答卷進行評分的一致性程度。當評分者為2個時,就是兩個所得分數(shù)的相關系數(shù),可以用積差相關或等級相關當評分者多于2時,用肯德爾和諧系數(shù),公式:K評分人數(shù)N被評的對象(通常是被試人數(shù))Ri第i個被評對象(考卷)被評的水平等級之和成套測驗綜合分數(shù)的信度,要注意分數(shù)合成的權重(加權計算)影響測量信度的主要因素:1被試(應試動機、注意力、耐心、團體內(nèi)部水平的離散度、團體的整體水平、團體的異質(zhì)大時,分布廣,信度就打)2主試(嚴格按照規(guī)則施測、評分標準一致)3施測情境(安靜、光線、空氣、空間狹窄)4測量工具(題目的數(shù)量、同質(zhì)性、抽樣、區(qū)分度)5兩次施測的間隔時間(間隔越小,受外界影響越小,信度越大)提高測量信度的方法:1適當增加測驗的難度(題目數(shù))2題目難度成正態(tài)分布,并在中等難度3提高題目的區(qū)分度4選取恰當?shù)谋辉噲F體,提高測驗在各同質(zhì)性較強的亞團體上的信度(很好的代表性)5主試嚴格執(zhí)行實測規(guī)程,客觀評分,好的實測環(huán)境,減小干擾因素測量效度效度是測驗或量表實際能測出其所要測(目標)的心理特質(zhì)的程度效度的三個特點:1效度是一個相對概念(不能百分之百的準確,一個量表的效度也不會為零)2效度是測量的隨機誤差和系統(tǒng)誤差的綜合反映(有兩種誤差)3判斷一個測量是否有效要從多方面收集證據(jù)(因為不能直接測量)效度用rxy表示,有多大比例的變異是由測驗所要測量的變因引起的,數(shù)學定義的公式:S2v有效變異S2x總變異S2X=S2V+S2I+S2E效度與信度的關系:一信度高是效度高的必要非充分條件二測驗的效度受它的信度制約rxy2<rxx內(nèi)容效度是測驗實際測到的內(nèi)同與所要測量的內(nèi)同之間的吻合程度內(nèi)容效度的應用面:1成就測驗2選拔職業(yè)測驗內(nèi)容效度的確定方法:一主要是邏輯分析法(專家判斷1明確測量內(nèi)容的范圍2確定每個題目測量的內(nèi)容3制定評定量表)二克龍巴赫的統(tǒng)計分析法三再測法表面效度是外行人對測驗從表面看好像是測了某種心理特質(zhì)的一種現(xiàn)象,不算一種效度結(jié)構(gòu)效度是測驗實際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度,主要應用于內(nèi)隱的心理理論,測驗同質(zhì)只是結(jié)構(gòu)效度的高的必要條件結(jié)構(gòu)效度的確定的步驟:1提出理論假設,并分解成細小的綱目,以解釋被試測驗上的表現(xiàn)2依據(jù)理論框架,推演出有關測驗成績的假設3用邏輯的和實證的方法來驗證假設結(jié)構(gòu)效度確定的方法:1測驗內(nèi)部尋找證據(jù)法(測驗的內(nèi)同效度、被試答題過程、計算測驗的同質(zhì)信度)2測驗之間尋找證據(jù)法(新的測驗與舊的已知測驗的對比,相關度高,就相同)3考查測驗的實證效度法(根據(jù)效標或測驗得分,把被試分為高低兩組,比較差異)4多種特質(zhì)--多種方法矩陣(相容效度和區(qū)分效度的綜合運用,用相關系數(shù)判定)5因素分析法(探索性因素分析、驗證性因素分析)實證效度是測驗對處于特定情境中的個體的行為進行估計的有效性實證效度根據(jù)時間分類:同時效度(效標與測驗分數(shù)同時搜集)和預測效度(效標在測驗分數(shù)之后搜集)效標是衡量一個測驗是否有效的外在標準,獨立于測驗并可從實踐中直接獲得的行為,常用的效標主要有:學業(yè)成就、等級評定、臨床診斷、專門的訓練成績、實際的工作表現(xiàn)、對團體的區(qū)分能力同一個觀念效標(觀念)可以有多個效標測量(數(shù)字表達)實證效度的確定步驟:1明確觀念效標2確定效標測量3考查測驗分數(shù)與效標測量的關系實證效度的確定方法:1相關法(測驗分數(shù)與效標的相關系數(shù))2區(qū)分法(效標為依據(jù)分為高低兩組,與原來測驗分數(shù)進行差異分析)3命中率(正命中率、負命中率、總命中)4基礎率、靈敏度、確認度正命中率是被測驗選出來的人中真正被選對了的人數(shù)的比率負命中率是被測驗所淘汰的人中真正應該被淘汰的人數(shù)比率總命中率是被測驗選對了的人數(shù)和被淘汰對了的人數(shù)之和與總?cè)藬?shù)的比率,總命中率高,測量的效度就高基礎率是符合篩選要求的群體在整個人群總體中所占的比率靈敏度是所有真正符合要求的人能被測驗鑒別出來的人數(shù)的比率確認度是所有不符合要求的人能被測驗正確淘汰的人數(shù)的比率基礎率低時,靈敏度高的工具才有效,“優(yōu)中選優(yōu)”“絕不放過一個壞人”基礎率高時,確認度高的工具才有效,“盡量不冤枉一個好人”“淘汰無藥可救的員工”測量效度的影響因素:一測驗的構(gòu)成(試題、增加測驗的長度提高信度,為提高效度提供可能性)二測驗的實施過程(嚴格施測,意外干擾、評分)三接受測驗的被試(應試動機、狀態(tài))四所選效標的性質(zhì)(一個觀念效標有多個效標測量、不同測驗效標系數(shù)要求不同)五測量的信度(信度不高,效度一定不高)提高測量效度的方法:1精心編制測驗量表,避免出現(xiàn)較大的系統(tǒng)誤差2妥善組織測驗,控制隨機誤差3創(chuàng)設標準的應試情境,讓每個被試都能發(fā)揮正常的水平4選好正確的效標,定好恰當?shù)男藴y量,正確的使用相關公式5適當增加題目測驗的項目分析測驗項目的難度是被試完成測驗項目任務時所遇到的困難程度項目難度的計算:一二分法記分項目的難度(1通過率用P表示,0<P<1,N全體被試、R答對的人數(shù),公式:2極端分組法,最高的27%為高分組NH人數(shù)、RH高分組通過的人數(shù)、最低的27%為低分組NL、RL低分組通過的人數(shù),公式:)二非二分法記分項目的難度(該項目平均分、該項目滿分,公式:)對知識的掌握情況的測驗,可以不考慮難度選拔的測驗,難度就是錄取率速度測驗的難度不宜太高通過率表示難度,是順序變量,沒有相等的單位,所以需要等距變換,P是面積,轉(zhuǎn)換為具有相等單位的等距量數(shù),Z分數(shù),Z分數(shù)的另一種形式是難度指標,公式:難度指標Z是P值轉(zhuǎn)換的標準分數(shù)值越大,難度越高難度對測驗的影響:一難度影響測驗分數(shù)的分布(難度大側(cè)正偏態(tài)左,難度小側(cè)負偏態(tài)右)二難度影響測驗分數(shù)的離散程度(難度在0.5左右時,分數(shù)的分布較廣,信度值較高)區(qū)分度是測驗對被試心理品質(zhì)水平差異的區(qū)分能力,用D表示,取值-1<D<1,為正值是積極區(qū)分,負值是消極區(qū)分,為“0”是無區(qū)分作用,D值越大,區(qū)分越好區(qū)分度的計算:一項目鑒別指數(shù)法(適用于二分法記分1鑒別指數(shù)按27%分組,公式:D=PH-PLPH與PL分別是高、低分組的通過率當D=1時,高分組全過,低分組全失敗D>0.4很好0.3<D<0.39良好改進0.2<D<0.29尚可修改D<0.2差淘汰2極端分組的劃分,當團體樣本人數(shù)<100時,分數(shù)標準用50%,分為兩半)二相關法(相關越高,區(qū)分度越高1點二列相關系數(shù),適用二分變量,公式:rpb相關系數(shù)通過該項目被試的平均分未通過該項目被試的平均分p通過該項目被試人數(shù)的百分比q未通過該項目被試人數(shù)的百分比St全體被試效標分數(shù)的標準差全體被試的平均效標分數(shù)2二列相關,適用連續(xù)變量被人為分為兩類3φ相關fai,適用兩個變量是二點分配的資料,二分名義變量4積差相關,適用連續(xù)數(shù)據(jù))區(qū)分度的相對性:1不同的計算方法,值不同,采用同一方法,便于分析比較2樣本容量大小影響相關法區(qū)分度值的大小,用顯著性檢驗法難度與區(qū)分度的關系難P區(qū)D100.90.20.70.60.60.80.510.40.80.30.60.10.20.00檢驗顯著3分組標準影響鑒別指數(shù)值,分組越極端,D值越大4被試樣本的同質(zhì)性程度影響區(qū)分值大小,被試越同質(zhì),個體水平越接近,項目區(qū)分度越小猜測誤差是猜測是非題和選擇題給測量帶來的誤差猜測誤差的來源:1猜和不猜引起的誤差2猜的正確和錯誤引起的誤差猜測誤差的校正:1被試是團體(CP校正后的通過率P實際通過率K答案的選擇項數(shù)Q=1-P公式:)2被試是個體(S校正后的得分R被試答對的項目數(shù)W被試答錯的項目數(shù)K答案的選擇項數(shù)公式:)多重選擇題的項目分析:1每題都分為高低兩組2列出每個選項的選擇人數(shù)3列出每題的正確答案4計算難度、區(qū)分度的鑒別指數(shù)D和相關系數(shù)rpb5分析誘答選項、答案本身是否正確、題意是否有多種歧義、測驗常模根據(jù)測驗和計分標準,計算的出來的測驗分數(shù)是原始分數(shù)導出分數(shù)是在原始分數(shù)的基礎上,按照規(guī)則,統(tǒng)計處理后獲得具有一定參照點和單位,且可以比較的分數(shù)量表系統(tǒng)分數(shù)的轉(zhuǎn)換是將原始分數(shù)轉(zhuǎn)化為導出分數(shù)的過程常用的導出分數(shù):百分等級分數(shù)、標準分數(shù)、T分數(shù)、IQ分數(shù)百分等級是在一個團體的測驗中,得分低于這個分數(shù)的人的百分比百分等級的計算:1未分組的分數(shù)資料(公式:PR百分等級R從高到底的排名N被試總?cè)藬?shù))2分組分數(shù)資料(首先排序,然后按組距從高到底分組,統(tǒng)計每組的人次,從低到高累每組的人次公式:PR百分等級X被試原始分數(shù)L被試所在組的下限f被試所在組的人次Fb被試所在組以下各組人次之和i組距N被試總?cè)藬?shù))百分等級按四舍五入的原則取整數(shù)百分等級優(yōu)缺點:1易于計算、解釋方便2適用不同對象和性質(zhì)不同的測驗3被試在所屬團體中的相對位置,既是分數(shù)不是正態(tài)分布,也不會改變百分等級的常模解釋能力4單位不等,尤其是在兩個極端,只具有順序性,不能說明不同被試的差異5同一被試無法在多項測驗上的百分等級進行合成匯總6百分等級是相對于被試的團體,解釋不能離開特定的參照團體標準分數(shù)具有相等單位的數(shù)量,Z分數(shù)標準分數(shù)的特點:1以標準差為單位的等距量表,平均數(shù)為參照點,不受原始測量單位的影響2可以進行統(tǒng)計處理3正號在平均數(shù)以上,負號在平均數(shù)一下,絕對值是離平均數(shù)的距離4分布與原始分數(shù)一樣,-3--+3占全體的99.73%,X原始分數(shù)、X團體平均分數(shù)、S團體標準差、公式:T分數(shù)是標準分數(shù)的變式,平均數(shù)為50,標準差為10,公式:T=10*Z+50韋氏智力測驗采用的離差智商:IQ=15*Z+100100是平均數(shù),15是標準差T分數(shù)的優(yōu)缺點:1避免了小數(shù)和負號2等單位,可以進一步統(tǒng)計分析3正態(tài)分布時,導出分數(shù)可與百分等級分數(shù)作換算4正態(tài)分布時,不同測驗的分數(shù)直接作比較5分數(shù)過于抽象,不易理解6非正態(tài)分布時,不可相互比較和相加求和分數(shù)合成的意義:常常要將多個測驗的分數(shù)組合起來,以獲得一個合成總分數(shù)作比較,高考分數(shù)合成的種類:1項目的組合2分測驗或量表的組合3測驗或預測源的組合分數(shù)合成的問題:1采用什么方法合成?取決測驗目的2什么形式是最適當?shù)姆謹?shù)組合?取決效度3需要多少及何種測驗分數(shù)作最適當?shù)慕M合分數(shù)?當增加測驗,而效度不增加,為最合適的分數(shù)合成的方法:一臨床診斷--直覺合成(根據(jù)直覺經(jīng)驗主觀地將各種因素加權而獲得結(jié)論或預測的方法優(yōu)缺點:1高度綜合性2靈活的針對性,根據(jù)個體作具體的結(jié)論3主觀加權,偏見、不客觀4缺乏精確數(shù)量分析和指標5對主試專業(yè)要求高、經(jīng)驗豐富)二加權求和合成(適用于:1各測驗特質(zhì)間有相互代償作用2分數(shù)為連續(xù)性資料3能同時獲得常用加權系數(shù)的確定方法:1抽象推理,從理論推理2使用統(tǒng)計學方法)三多重回歸四多重劃分(用多元回歸分析組合分數(shù),適用于特質(zhì)具有互償性)常模是根據(jù)標準化樣本的測驗分數(shù)經(jīng)過統(tǒng)計處理而建立的具有參照點和單位的測驗量表常模團體是具有某種共同特征的人所組成的一個群體,或是該群體的一個樣本確定常模團體的注意事項:1群體構(gòu)成的界限必須明確(測量目的的性質(zhì)和特征)2常模團體必須是所測群體的一個代表性樣本(隨機抽樣)3取樣過程必須明確且有詳盡的描述4樣本大小要適當(總體、性質(zhì)、精確度)5常模團體必須是近時的6注意一般與特色常模的結(jié)合定制常模的過程:1確定測驗將用于哪一個群體(統(tǒng)計量、抽樣誤差、抽樣方法)2對常模團體施測,得到分數(shù)和分布3確定常模分數(shù)類型,制作常模分數(shù)轉(zhuǎn)換表,即常模量表,說明書和解釋指南主要的常模參照分數(shù):一發(fā)展量表(隨時間發(fā)展,1年齡常模最大的優(yōu)點是易于理解與解釋2年級常模有代表性問題)二商數(shù)(是兩個分數(shù)的比率,例如:智商教育商數(shù)EQ、教育年齡EA、實際年齡CA、公式:成就智商AQ、智力年齡MA、公式:)三百分等級常模(1簡單轉(zhuǎn)化表--原始總分數(shù)轉(zhuǎn)換成百分等級分數(shù)2復雜轉(zhuǎn)化表--各個分項百分等級)四標準分數(shù)常模(原始分數(shù)轉(zhuǎn)換成標準分數(shù)Z或?qū)С龇謹?shù)T量表)五剖pou析圖(把一套測驗中幾個分測驗分數(shù)同時用圖表和圖形表示出來)心理與教育測驗的編制與實施編制測驗的基本程序:一確定測驗目的(對象、目標、用途)二制定編題計劃(框架)三編輯測驗項目(就是題目,1收集測驗資料原則:資料豐富、普遍性、趣味性2選擇項目形式原則:容易理解、過程簡單、計分簡單、不會有歧義3編寫測驗項目,需反復修改,要點:反應測量目的特征、在計劃列項內(nèi)、難度有區(qū)分度、語言簡單明了、初編題目多以便篩選、測驗項目說明簡明)四預測與項目分析(小范圍施測,預測檢查被試對項目反應,分析確定難度和區(qū)分度)五合成測驗(形成問卷,避免練習效應,保持興趣等,1測驗項目的選擇,依據(jù)測驗的性質(zhì)、難度、區(qū)分度2測驗項目的編排,常見的兩種方式:并列直徑式,先性質(zhì)分類、后難度從易到難;混合螺旋式,先難度分層次,后性質(zhì)交叉)六測驗標準化(程序結(jié)果的一致性,具體內(nèi)容:1測驗內(nèi)容是前提,要求是相同或等值2施測過程,環(huán)境條件相同,包括:情境、指導語、時限3評分要求是客觀,包括:被試反應及時記錄、標準答案或適當反應的表格即記分鍵、得分的記分標準化4測驗分數(shù)的解釋,建立好的常模)七鑒定測驗(鑒定:信度、效度、常模表)八編寫測驗說明書(目的、用途、理論依據(jù)、施測方法、標準答案和評分、信度、效度、常模表)測驗實施的過程:一施測前的準備工作,最重要(準備測驗材料、熟悉施測過程)二指導語(使被試正確對題目做出反應,要求是:態(tài)度中立、執(zhí)行標準時間限制)三測驗情境(通風、安靜、光線、桌椅高度、同一種紙張、排版)四測驗焦慮(注意:抱負水平、過度焦慮、低焦慮)五與被試建立良好的協(xié)調(diào)關系六評分技術測驗解釋的類型:1敘述的解釋(描述狀態(tài))2溯su因的解釋(追溯過去找原因)3預測解釋4評價的解釋(作價值判斷,高考錄?。┙忉寽y驗分數(shù)的原則:1主試充分了解測驗的性質(zhì)和功能2解釋因慎重、防片面極端,對被試作積極影響3充分估計測驗的常模和效度的局限性4解釋分時應參考其他相關資料,測驗分數(shù)不是唯一,情境影響5應以“一段分數(shù)”來解釋,誤差的存在6不同測驗的分數(shù)不能直接比較如何向受試者報告分數(shù):1使用當事人能理解的語言,非專業(yè)語言2保證當事人知道測驗的目的和內(nèi)容3告知當事人分數(shù)解釋的參照體4告知當事人分數(shù)不是一個精確的值5分數(shù)只是決策的依據(jù),不是決策本身6充分估計分數(shù)可能給當事人造成的影響7測驗結(jié)果對無關人員保密8對低分者解釋因慎重9鼓勵當人事表達對測驗結(jié)果的感受,予以引導和咨詢第九章測驗等值測驗等值是通過考核同一心理品質(zhì)的多個測驗形式做出的測量分數(shù)系統(tǒng)的轉(zhuǎn)換,使不同測驗形式的測驗分數(shù)之間具有可比性測驗等值的條件:1同質(zhì)性2等信度3公平性(同一被試,結(jié)果一樣)4可遞推性5對稱性(可逆)6樣本一樣經(jīng)典理論等值CTT與項目反應理論等值IRT測驗分數(shù)等值(總分)與項目參數(shù)等值(每題分數(shù))水平等值(難度、被試能力相同)與垂直等值(不同)測驗等值設計是尋找不同測驗形式之間的等值關系而預先對數(shù)據(jù)的采集方法、等值實現(xiàn)途徑、等值的計算方法進行周密的設計錨測驗是在測驗等值設計中,用同一組測驗試題關聯(lián)兩個待等值的測驗形式,找到兩形式的等值關系的那些測驗試題數(shù)據(jù)平滑法是通過處理使分布曲線趨于光滑的方法,兩種常用方法:對數(shù)線性平滑模式、β二項平滑模式等值標準誤差是評價由抽樣引起的等值誤差大小的指標,是隨機誤差等值偏差是在測驗等值中除了抽樣引起的等值隨機誤差之外,等值方法不當引起的誤差,也稱等值的系統(tǒng)誤差等值結(jié)果的表示方法:列表法、公式法、圖示法測驗等值的步驟:1確定等值目標2進行等值設計3施測并采集測驗數(shù)據(jù)4選擇一個等值的操作性定義5選擇一種等值關系計算方法進行等值計算6評價等值結(jié)果測驗等值計算的基本方法:一等百分位等值(百分等級相等認為等值,公式:)二線性等值法(標準分數(shù)相等認為等值,公式:)常用測驗等值設計:一隨機分組--每組實施一個測驗二隨機分組--各個測驗對每組都實施三隨機分組--每組各實施一個測驗,錨測驗向每組實施四非隨機分組--每組各實施一個測驗、錨測驗向每組實施(鏈等值法是加個中介錨測驗)目標參照測驗目標參照測驗是根據(jù)明確的內(nèi)容范圍而編制的測驗,被試的測驗結(jié)果,根據(jù)明確界定的行為標準直接解釋(測驗知識的掌握與否)目標參照測驗與常模參照測驗的區(qū)別:一前者關心是否達到預定學習目標,后者關心學生之間的比較二前者用于診斷和發(fā)現(xiàn)不足后改進,后者選撥性考試和總結(jié)性評定目標參照測驗的項目分析:一內(nèi)容范圍的確定二測驗項目的內(nèi)容效度分析(專家法)三測驗項目難度和區(qū)分度分析(1測驗的預測,三種方法:前測--后測方法、已接受教學組--為接受教育組、對照組方法2測驗項目的難度分析3測驗項目的區(qū)分度分析,不是高低分組,而是掌握與非掌握分組,兩類指標:難度差值--鑒別指--個人獲得指數(shù)DIG數(shù)、相關系數(shù))目標參照測驗信度估計方法:一分類一致性信度二方差分析方法--荷伊特信度目標參照測驗效度估計方法:一內(nèi)容效度二效標關聯(lián)效度目標參照測驗分數(shù)的解釋:一專家判定法(Nedelsky法、Angoff法、Bookmark法)二效標組預測法(臨界組法、對照組法)學績測驗學績測驗是對一個階段的學習或訓練掌握知識和技能的水平鑒定學績測驗與能力測驗都是最佳行為測驗一般性向測驗預測學習的成就學績測驗的作用:鑒定學業(yè)成績、提高的量、反饋給學生和老師改進提高、升學、留級、畢業(yè)、劃分班級、教學管理學績測驗的分類:教師自編課堂測驗、標準化學績測驗單科測驗、多科測驗考查性測驗、診斷性測驗常模參照測驗、目標參照測驗定向反應型(客觀題)、自由反應型(主觀題)標準化學績測驗是在心理與教育測量學原理指導下,按一定的程序編制的各方面的質(zhì)量都達到規(guī)定標準的學績測驗標準化學績測驗的基本要求:1命題組卷標準化(目標明確、語義清晰、難度、區(qū)分度)2施測標準化(指導語、外環(huán)境、時間、順序)3評分標準化(答案、規(guī)則)4測驗分數(shù)解釋標準化(參照常模)標準化學績測驗的編制步驟國外常用的標準化學績測驗:1斯坦福成就測驗(常模參照測驗,適用1--9年級,美國中小學)2關鍵數(shù)學算術診斷測驗(適用兒童--六年級)教師自編課堂測驗特點:1形式靈活多變,與測驗目的完全一致2測驗內(nèi)容與教材內(nèi)容高度一致3測驗難度切合學生的實際水平4測驗編制簡易快速教師自編課堂測驗的步驟:1審查測驗目的2制訂測驗編制計劃3命題與組卷教師自編課堂測驗應該注意的問題:1深入研究教材,深入調(diào)查學生2維護準確穩(wěn)定的合格標準(合格能基本掌握知識內(nèi)容、學生測驗結(jié)果不能忽高忽低)3客觀評價自己的命題技術,合理使用各種題型4總結(jié)命題經(jīng)驗,提高命題技術5控制評分誤差、防治簡單粗糙6一定的定量的分析研究能力測驗上斯皮爾曼提出智力二因素論,G因素是共同因素、S因素是特殊因素瑟se斯頓提出智力多因素論,七種(語文理解、語言流暢性、推理、空間表象、數(shù)字、記憶、知覺速度等)吉爾福特提出智力三個維度:內(nèi)容因素、操作因素、結(jié)果因素弗農(nóng)提出智力三層次模型:最高層是G因素、第二層是語言和操作能力、第三層是心理能力(數(shù)學、空間知覺等)智力PASS模型分三層:注意系統(tǒng)是基礎、同時性加工--繼時性加工系統(tǒng)是中間層、計劃系統(tǒng)是最高層傳統(tǒng)智力測驗的問題:一傳統(tǒng)智力測驗的結(jié)構(gòu)效度問題(理論假設是G因素)二傳統(tǒng)智力測驗的功能問題(基本功能是測量個體差異、預測源測驗行使預測功能、診斷補救措施)三傳統(tǒng)智力測驗的公平性問題(性別差異、職業(yè)差異、文化和教育差異)四傳統(tǒng)智力測驗的預測效度(智力的可變性:1隨年齡變化2隨環(huán)境變化,城和鄉(xiāng)3隨個性特質(zhì)變化,退縮降低、積極面對提高)智力測驗廣泛應用的原因:1個體有可變性、也具有穩(wěn)定性2應用于選拔和安置人員,提高決策正確率,實踐證明效標效度較好3不同團體可能存在不公平性,正在試圖改善4沒有成熟、沒有出現(xiàn)超越傳統(tǒng)智力測驗工具比內(nèi)--西蒙量表,診斷異常兒童智力,第一個年齡量表斯坦福--比內(nèi)量表,1961年首次引入比率智商,1960年引入離差智商,平均分100,標準差16中國比內(nèi)測驗,20世紀20年代,離差智商韋克斯勒智力量表中國版WAIS--RC,語言量表(常識、算術、理解、同類、背數(shù)、詞匯),操作量表(數(shù)字符號、填圖、積木圖案、圖片排序、拼圖),平均分100,標準差15戴斯--納格利爾里認知評估系統(tǒng)CAS,每個分測驗有三種任務:計劃、注意、同時性和繼時性加工認知能力測驗,桑代克編制,四個不同部分:初級型、文字測驗、數(shù)量測驗、非文字測驗陸軍乙種測驗,非文字測驗瑞文推理測驗,非文字測驗,題目形式(挖掉一塊圖片、缺少一塊圖片),5--老年,可團體和個別測驗,百分等級常模解釋,不受文化等影響,分三個水平:1標準推理測驗,中等水平2采圖推理測驗,最低水平3高級推理測驗,最高水平第十三章能力測驗下能力傾向測驗的特點:1測驗目的,預測未來、目的性更強2測驗的編制,每個分測驗針對一種能力3測驗結(jié)果的解釋,不同的工作,不同能力因素權重不同學術能力傾向測驗SAT,美國高考分辨能力傾向測驗DAT,適用美國初中和高中的教育咨詢和就業(yè)指導,八個分測驗:1語言推理2數(shù)的能力3抽象推理4文書速度與準確5機械推理6空間關系7語言運用拼寫8語言運用文法一般能力傾向成套測驗GATB,美國的綜合式職業(yè)性向測驗,九種能力:1一般智力G2語言能力3數(shù)的能力4空間關系5形狀知覺6文書知覺7動作協(xié)調(diào)8手指靈巧9手部靈巧行政職業(yè)能力傾向測驗,中國公務員考試,考查職業(yè)一般素質(zhì)和能力,題目簡

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論