




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、心理測量(戴海琦版)課后習題答案 第一章 心理與教育測量概論練習與思考 練習與思考:1.與物理測量相比較,闡明心理測量的特點。2.為什么人們不能象對物理測量那樣容易接受心理測量?(此題為思考題)3.如何才能證明心理測量的必要性和可能性?解答要點:1.(1)從依據(jù)的法則來說,心理與教育測量依據(jù)的法則在很大程度上只是一種理論。 (2)從測量的內(nèi)容來說,心理與教育測量的內(nèi)容是復雜的 ,內(nèi)隱的,其測量只能是間接的。 (3) 相對與物理測量的定量分析的精確度而言,心理與教育測量定量分析的精確度很低。3.(1) 從心理與教育測量的理論基礎來看,心理測量是可能的。 (2) 人的心理現(xiàn)象和知識水平如同其他一切
2、物理現(xiàn)象一樣是有差異的,這種差異既有質(zhì)的方面,也有量的方面,因此有必要測定出這些差異的數(shù)量。第二章 心理與教育測量的產(chǎn)生與發(fā)展練習與思考練習與思考1.簡述古代中國對心理與教育測量的貢獻及其特點。2.心理與教育測量從卡特爾到比內(nèi)的發(fā)展過程中可以看出什么特點?(此題為思考題)3.推孟和韋克斯勒在智力測驗發(fā)展過程中各有什么貢獻?解答要點:1.在古代中國,在測驗實踐和測驗理論方面都對心理與教育測量作出了貢獻并具有自己的特點。 一、在測驗實踐方面的貢獻。1、在能力測量方面。早在2500年前,思想家和教育家孔子憑自己的經(jīng)驗觀察,首先評定學生能力的個別差異,并將人的智力分成中上之人、中人和中下之人三個等級。
3、董仲舒已論及到注意測驗。劉邵把人的才能劃分為12種類型。6世紀中葉,中國江南出現(xiàn)了類似現(xiàn)在的嬰兒發(fā)展測驗的周歲試兒習俗。出現(xiàn)于清代的益智圖、九連環(huán)可以認為是最早的創(chuàng)造力測驗。2、在人格測量方面。孔子把人分為狂者、狷者和中行3種。劉邵根據(jù)陰陽、五行和形體的關系及其人的行為表現(xiàn),把人的性格劃分成12種類型。3、在教育測量方面。世界上最早的教育測量出現(xiàn)于中國西周奴隸時期。據(jù)記載,在西周的國學中已經(jīng)建立具有相當系統(tǒng)性的教育測量制度。在漢代,考試制度、考試類型和考試功能方面都作了重要的發(fā)展。除了學校內(nèi)部測量的自身發(fā)展以外,取士制度自漢以來的發(fā)展,客觀上也對我國的古代乃至西方的教育測量發(fā)展起了促進作用。
4、二、在測驗理論方面的貢獻??鬃雍蠹s150年,大思想家孟子就指出了測量人類心理的必要性和可能性。他說:權,然后知輕重;度,然后知長短。物皆然,心為甚。劉邵認為,人才鑒定對于知人善任、振興國家事業(yè)具有重要意義。他說:夫圣賢之所美,莫美乎聰明。聰明之所貴,莫貴乎知人。知人誠智,則眾材得其序,而庶績之業(yè)興矣。 三、古代中國心理與教育測量的特點。 第一、中國古代社會的心理與教育測量思想都是描述性的,而非定量的;第二、中國古代社會的心理與教育測量是分類式的;第三、注重對人作整體的鑒定和評價,并傾向于和人的道德品質(zhì)聯(lián)系起來。第四、是與教育中的因材施教及人才使用有著密切的聯(lián)系,它從一開始就具有強烈的應用性質(zhì)。
5、3. 推孟在智力測驗發(fā)展過程中的貢獻是他采用了比率智商的概念來表示智力水平的高低。 韋克斯勒在智力測驗發(fā)展過程中的貢獻是:第一,他用離差智商代替比率智商,克服了比率智商的局限;第二,他編制的智力量表分為言語量表和操作量表兩部分,不僅能夠獲得總體智力水平的信息,而且可以獲得手測者智力優(yōu)勢的信息。第三章 經(jīng)典測量理論的基本假設練習與思考練習與思考:1.簡述心理特質(zhì)的含義。2.心理測量的誤差來源主要包括哪些?3.CTT模型及其假設的重要內(nèi)容是什么?答案要點:1.心理特質(zhì)指表現(xiàn)在一個人身上所特有的相對穩(wěn)定的行為方式,就是人的心理特質(zhì)。可以從下面幾個方面來理解:(1)特質(zhì)是一組具有內(nèi)部相關的行為的概括,
6、具有一定的抽象性。(2)特質(zhì)是一種一般的神經(jīng)心理系統(tǒng),它可以綜合不同刺激,使人對這些刺激做出相同的反應。(3)特質(zhì)是一個人身上比較穩(wěn)定的特點。(4)一個人的精神面貌(人格)是由多種特質(zhì)分多個層次有機組合而成的。(5)特質(zhì)可以決定一個人對特定刺激的反應傾向,可以對人的行為進行某種預測。2.心理測量的誤差主要來自3個方面:測量工具、被測對象和施測過程。3.CTT模型是:經(jīng)典測驗理論假定,觀察分數(shù)(記為X)與真分數(shù)(T)之間是一種線性關系,并只相差一個隨機誤差(記為E)。 即:X=T+E 其主要內(nèi)容為: (1)若一個人的某種心理特質(zhì)可以用平行的測驗反復測量足夠多次,則其觀察分數(shù)的平均值會接近于真分數(shù)
7、。 即:E(X)=T或E(E)=0 (2)真分數(shù)和誤差分數(shù)之間的相關為零。 即:(T,E)=0 (3)各平行測驗上的誤差分數(shù)之間相關為零。 即:(E1,E2)=0第四章 測量信度練習與思考 練習與思考: 1.指出各種信度系數(shù)所對應的誤差來源。 2.已知16人參加一次測驗后在奇數(shù)題和偶數(shù)題上的得分情況,試用兩種以上方法估計測量信度。(此題為思考題)被 試 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16奇數(shù)題 32 40 42 28 35 30 41 28 32 34 26 34 36 25 40 41偶數(shù)題 31 39 45 30 40 29 39 30 32 30
8、 30 40 36 26 40 42 3.已知某態(tài)度量表用道題,被試在各題上得分的方差分別是0.80,0.81,0.79,0.78,0.80,0.82,測驗總分的方差為16.00,求值。(此題為思考題) 4.怎樣提高測量信度?解答要點: 1.對重測信度來說,其對應的誤差來源有: 所測量的心理特質(zhì)不穩(wěn)定; 遺忘和練習的效果沒有相互抵消; 在兩次施測的時間間隔里,所要測的被試的心理特質(zhì)得到了學習和訓練; 兩次測查的時間間隔不同在信度不同。 對復本信度來說,其對應的誤差來源有: 所用的復本不是真正的平行測驗;產(chǎn)生的遷移效應會影響信度的大小。 對分半信度來說,其對應的誤差來源有: 分半的方法會影響測驗
9、的信度。 對同質(zhì)性信度來說,其對應的誤差來源有: 題目間的相關性;測驗所測內(nèi)容的單一性與異質(zhì)性。 對評分者信度來說,其對應的誤差來源有:3. =6/6-11-(0.80+0.81+0.79+0.78+0.80+0.82) =6/5(1-0.3) =0.84 4.由于項目數(shù)量太少會降低測量的信度,所以,提高測量信度的一個常用方法是增加一些與原測驗中項目具有較好的同質(zhì)性的項目,增大測驗長度。但是應該注意: 1.新增項目必須與試卷中原有項目同質(zhì)。 2.新增項目的數(shù)量必須適度。 適當增加測驗的長度。 使測驗中所有試題的難度接近正態(tài)分布,并控制在中等水平。 當測驗中所有試題的難度接近正態(tài)分布并控制在中等
10、水平時,被試團體的得分分布也會接近正態(tài)分布,且標準差會較大,以相關為基礎的信度值必然也會增大。努力提高測驗試題的區(qū)分度。 努力提高測驗試題的區(qū)分度。 選取恰當?shù)谋辉噲F體,提高測驗在各同質(zhì)性較強的亞團體上的信度。 主試者嚴格執(zhí)行實測規(guī)程,評分者嚴格按標準給分,實測場地按測驗手冊的要求進行布置,減少無關因素的干擾。第五章 測量效度練習與思考 練習與思考: 1.什么是測量的效度?它與信度的關系這樣? 2.什么是內(nèi)容效度?測驗編制者和使用者應分別從哪幾個方面來把握內(nèi)容效度? 3.什么是結(jié)構效度?測驗編制者和使用者應分別怎樣把握結(jié)構效度? 4.什么的實證效度?它與內(nèi)容效度和結(jié)構效度有何異同? 5.什么是
11、效標和效標測量? 6.已知 若希望把效度系數(shù)提高到0.65和0.70,則測驗長度要增加幾倍? 解答要點:1.(1)效度是指一個測驗或量表實際能測出其所要測的心理特質(zhì)的程度。 信度高是效度高的必要而非充分條件 當隨機誤差的變異( )減小時,真實分數(shù)的變異數(shù)增加,測驗信度( )隨之提高。信度的提高只給有閑變異數(shù)( 的增加提供了可能)至于是否能提高效度,還要看系統(tǒng)誤差變異數(shù)( 的大?。???梢?,信度高不一定效度就高。但一個測驗要想效度高,真分數(shù)的變異數(shù)必須占較大的比重,即測驗的信度必須高。 測驗的效度受它的信度制約根據(jù)效度和信度的定義( )以及公式( )可得到:2.(1)內(nèi)容效度是指一個測驗實際測到的
12、內(nèi)容與所要測量的內(nèi)容之間的吻合程度。(2)測驗的編制者和使用者應該從以下幾個方面來把握內(nèi)容效度: 首先應該明確內(nèi)容效度的含義; 應該明確內(nèi)容效度的應用范圍; 在使用時還要主要不要跟表面效度相混淆; 對測驗的編制者來說應該懂得確定測驗內(nèi)容效度的方法,明確確定內(nèi)容效度的步驟。3.(1)結(jié)構效度是指一個測驗實際測到所要測量的理論結(jié)構和特質(zhì)的程度,或者說它是指測驗分數(shù)能夠說明心理學理論的某種結(jié)構或特質(zhì)的程度。(2)對于編制者和使用者來說應該從以下幾個方面來把握結(jié)構效度: 首先應該明確結(jié)構效度含義; 其次也應該了解結(jié)構效度的特點; 應知道結(jié)構效度的應用范圍; 對測驗的編制者來說應該懂得確定測驗結(jié)構效度的
13、方法,明確確定結(jié)構效度的步驟。 4.(1)實證效度是指一個測驗對處于特定情境中的個體的行為進行估計的有效性。(2)實證效度與內(nèi)容效度和結(jié)構效度一樣都用于估計測驗效度。(3)實證效度與內(nèi)容效度和結(jié)構效度的不同之處在于: 它們是估計測驗效度的不同方面; 它們的應用范圍不同; 確定它們的方法也不同。 5.(1)效標是衡量一個測驗是否有效的外在標準,它是獨立于測驗并可以從實踐中直接獲得的我們所感興趣的行為。 (2)效標測量就是把我們所感興趣的行為用數(shù)字或等級表達出來。6題: 得當效度系數(shù)提高到0.65時,測驗長度要增加6.4倍; 當效度系數(shù)提高到0.70時,測驗長度要增加20倍。第六章 測驗的項目分析
14、練習與思考1.測驗項目分析的作用是什么?1.因為用測驗的項目分析可以解決以下問題:(一)項目是否具有所預期的功能?對于常模參照測驗,測題是否有足夠的區(qū)分度?對目標參照測驗來說,測題是否能充分地測量到教學的結(jié)果。(二)項目的難度是否得當?(三)項目是否有缺陷?第七章 測驗常模練習與習題 練習與思考:1.試比較各種導出分數(shù)的優(yōu)缺點。2.列舉你所了解的各種測驗的分數(shù)合成方法,并評價它們的合理性。3.選擇常模團體與制定常模有什么關系?任何選擇好常模團體?4.離差智商與比率智商的本質(zhì)差異是什么? (此題為思考題)解答要點:1.常用的導出分數(shù)有百分等級、標準分數(shù)、T分數(shù)。 百分等級 百分等級的優(yōu)點:百分等
15、級是一種相對位置量數(shù),具有可比性,且具有易于計算、解釋方便等優(yōu)點,對一般教師、學生和家長來說,均能了解百分等級的意義,所以它較適用于不同的對象和性質(zhì)不同的測驗。另外,百分等級不受原始分數(shù)分布狀態(tài)的影響,即使分數(shù)分配不是正態(tài)的,也不會改變百分等級常模的解釋能力。 百分等級的缺點:(1)百分等級的單位不等,尤其在分配的兩個極端。如果原始分數(shù)的分配是正態(tài)或近似正態(tài)分布,則靠近中央(平均數(shù)或中位數(shù)附近)的原始分數(shù)轉(zhuǎn)換成百分等級時,分數(shù)之間的差異便夸大了,雖然原始分數(shù)比較靠近,但轉(zhuǎn)換成百分等級后,卻顯示出很大的差異性;對接近兩極端的原始分數(shù),百分等級反應遲鈍,即使原始分數(shù)發(fā)生較大的變化,也不能引起百分等
16、級的相應變化,使得其差異被縮小了。(2)百分等級只具有順序性,無法用它來說明不同被試之間分數(shù)差異的數(shù)量。它不適合計算平均數(shù)、相關系數(shù)及其它統(tǒng)計量數(shù)。(3)百分等級只相對于特定的被試團體而言的。因此在解釋時不能離開特定的參照團體。被試得分不變,但參照團體改變了,百分等級值就可能發(fā)生變化。所以在報告百分等級時,一定要說明是相對于什么參照團體來說的。 標準分數(shù) 標準分數(shù)的優(yōu)點:標準分數(shù)是一個抽象值,不受原始測量單位的影響,并可接受進一步的統(tǒng)計處理。具有可比性和可加性。 標準分數(shù)的缺點:由于計算中經(jīng)常出現(xiàn)負數(shù)和小數(shù),且單位過大(一個標準差單位),所以,使用起來不夠方便。 T分數(shù) T分數(shù)的優(yōu)點:(1)
17、具有等單位特點,便于工作進一步的統(tǒng)計分析。(2)正態(tài)分布下,可以利用正態(tài)分布表將各種導出分數(shù)與百分數(shù)等級分數(shù)作換算。(3)正態(tài)分布下,運用某種變式分數(shù)可以將幾個測驗上的分數(shù)作直接的比較。即使是非正態(tài)分布,也可運用由正態(tài)化的Z分數(shù)轉(zhuǎn)換而得的變式分數(shù)進行直接比較分析。 T分數(shù)的缺點:(1)分數(shù)過于抽象,不易理解,正如在介紹麥柯爾的T分數(shù)時所提到的那樣不為一般人所熟悉。(2)在非正態(tài)分布下,分布形態(tài)不同的變式分數(shù),仍然不可以作相互比較,也不能相加求和。2.(1)臨床診斷-直覺合成:在實際工作中,最常用的組合測驗分數(shù)的方法是根據(jù)經(jīng)驗對測驗分數(shù)作直覺的組合,這就好比臨床醫(yī)生,把各種化驗、檢驗所獲得的資料
18、與實際觀察所得的結(jié)果結(jié)合起來,根據(jù)經(jīng)驗作出診斷一樣。象這種根據(jù)直覺的經(jīng)驗,主觀地將各種因素加權,而獲得結(jié)論或預測的方法叫作臨床診斷。臨床診斷-直覺合成的合理性表現(xiàn)在: 具有高度的綜合性。它允許我們從整體上來考察問題,充分考慮各測驗所測特質(zhì)間交互影響,各測驗上所得分數(shù)的對比關系與組合類型的結(jié)構特點,測驗分數(shù)與實際反應表現(xiàn)其中的生動關系等。 具有靈活的針對性,能就特定的個人作具體的結(jié)論。而一般的統(tǒng)計方法具有常模性,常模性的統(tǒng)計模式難于適應每個個體所具有的獨特性,更難于適應非典型的新穎形式。(2)加權求和合成:如果各個測驗所測特質(zhì)間相互代償作用,這些測驗上的分數(shù)又是連續(xù)性資料,并能大體同時獲得,那么
19、可以采用加權求和的立法對分數(shù)進行合成。 加權求和合成的合理性表現(xiàn)在: 將變量做了等量加權后適合于各測驗對預測效標具有同等重要性的場合,根據(jù)各個變數(shù)與效標之間的經(jīng)驗關系作差異加權后適合于各測驗對預測效標具有不相等的場合。(3)多重回歸:多重回歸就是研究一種事物或現(xiàn)象與其他多種事物或現(xiàn)象在數(shù)量上相互聯(lián)系和相互制約的統(tǒng)計方法。 多重回歸的合理性表現(xiàn)在:(4)多重劃分:多重劃分就是在各個特質(zhì)上都確定一個標準,從而把成績劃分為合格與不合格兩類。在一個測驗上合格了,不能保證總的要求一定能合格。只有每個測驗都合格時,總要求才算合格。多重劃分的合理性表現(xiàn)在:3.選擇常模團體與制定常模的關系:制定常模首先要確定
20、出常模團體。應該這樣選擇常模團體:(1) 群體構成的界限必須明確。 在確定常模團體時,必須清楚地說明所要測量的群體的性質(zhì)與特征。雖然有關常模團體的一般規(guī)定取決于測驗的目的與使用,且可能有多個常模團體。但對每個常模團體的性質(zhì)和特征必須有一個簡短而明確的描述,若群體過大,群體內(nèi)部也許有許多小團體,它們在一個測驗上的表現(xiàn)也時常有差異,假如這種差異較為顯著,就必須對每個小團體分別建立常模。例如,艾森克個性預測(EPQ),就是分性別,以不同年齡組而建立常模的。(2) 常模團體必須是所測群體的一個代表性樣本。 當所要測量的群體較小時,將所有的被試逐個測量以得到常模。在群體較大時,則不可能如此,只能測量一部
21、分被試作為群體的代表,此時就存在取樣是否具有代表性的問題。如果常模團體缺乏代表性,將會使常模資料產(chǎn)生偏差,從而影響到測驗結(jié)果解釋的準確性。為了克服取樣偏差,保證具有代表性,一般在抽樣時應遵循隨機化原則,采用統(tǒng)計學的方法抽取樣本。關于具體抽樣方法,可參閱有關統(tǒng)計學著作中的抽樣推斷部分。(3) 取樣的過程必須明確且有詳盡的描述。 取樣的過程必須明確且有詳盡的描述,這主要是為了使測驗的使用者不至于誤用測驗和錯誤地解釋測驗結(jié)果,所以在一般的測驗手冊中,都有相當篇幅詳細介紹常模團體的大小、取樣策略、取樣時間以及其他有關情況。這些說明和描述越明確、越詳盡夜好。(4) 樣本大小要適當。 所謂大小適當并沒有明
22、確的指標。根據(jù)統(tǒng)計學原理,取樣誤差與樣本大小成反比。所以,在其他條件相同時,樣本越大越好。但是還應考慮到人力、物力等方面的因素,通常在決定樣本大小時,應注意: 總體的數(shù)目。總體數(shù)目小,樣本相應可小些,但不應過小,若總體過小,則可將全部被試入選;當總體較大時,相應樣本也大。 群體的性質(zhì),如果群體性質(zhì)單一,則樣本不必太大,即可以反映群體性質(zhì);若群體性質(zhì)復雜,則樣本容量(n)就應大一些。 測驗結(jié)果的精確度。根據(jù)統(tǒng)計學原理,抽樣誤差的大小與樣本容量成反比,若要提高精確度,即是說減低抽樣誤差,就必須加大樣本容量(n)。(5) 常模團體必須是近時的。由于當今教育發(fā)展迅速,所以建立的常模必須是近時的,過時的
23、常模是不能作為參照標準的,一個常模不能一勞永逸地使用。(6) 注意一般常模與特殊常模的結(jié)合。測驗手冊上所列的常模通常為一般常模,它的使用范圍比較廣。有時對于某些特殊的群體不一定完全適用。因此,測驗在希望使用更為具體的、適合特殊情況的常模。即特殊常模。將特殊常模與一般常模結(jié)合起來,可使被試與最接近的群體進行比較。因為各個具體群體在某些方面是獨特的,它的成員將與測驗手冊所列的常模團體成員不符。所以,依據(jù)一般常模解釋所得的結(jié)論可能不夠恰當,如果將兩者結(jié)合使用,解釋分數(shù)便會更加準確。但特殊常模只提供有關特殊信息,適用范圍較窄。所得結(jié)論不能在廣泛的背景作解釋。第八章 心理與教育測驗的編制與實施練習與思考
24、 練習與思考:1.結(jié)合實例簡述編制一個心理測驗的基本程序。2.闡述實施心理測驗應注意的問題。3.如何正確解釋測驗分數(shù)的意義。4.論述向當事人報告測驗分數(shù)的基本原則。解答要點:1.編制一個可供使用的標準化的心理與教育測驗,一般要經(jīng)過以下幾個步驟: 確定測驗目的。制定編題計劃。編輯測驗項目。預測與分析。 合成測驗。 測驗標準化。 鑒定測驗。 編寫測驗說明書。2.施測前應做好準備工作; 指導語應不要暗示受測者應該選什么; 進行測驗時不能受到外界和施測者的干擾; 評分時要客觀公正。3.主試應充分了解測驗的性質(zhì)與功能。對導致測驗結(jié)果的原因的解釋應慎重,謹防片面極端。必須充分估計測驗的常模和效度的局限性。
25、解釋分數(shù)應參考其他有關資料。對測驗分數(shù)應以一段分數(shù)來解釋,而不應以特定的數(shù)值來解釋。對來自不同測驗的分數(shù)不能直接加以比較。4.使用當事人所理解的語言。 要保證當事人知道這個測驗測量或預測什么,這里并不需要作詳細的技術性解釋。 如果分數(shù)是以常模為參考的,就要使當事人知道他是和什么團體在進行比較。 要使當事人認識到分數(shù)只是一個估計。 要使當事人知道如何運用他的分數(shù)。 要考慮測驗分數(shù)將給受測者帶來什么影響。 測驗結(jié)果應向無關的人員保密。 對低分者的解釋應謹慎小心。 報告測驗分數(shù)時應設法了解當事人的心理感受,并采取適當?shù)拇胧┘右砸龑?。第十?目標參照測驗練習與思考 練習與思考:1.請根據(jù)表10.3中專
26、家評定結(jié)果的平均數(shù)對表中14道題目的內(nèi)容效度進行評定,并決定題目的取舍。2.目標參照測驗的題目區(qū)分度可以通過哪些方法來確定?3.目標參照測驗的信度與效度為何不適宜以相關系數(shù)作為評價指標?4.試比較目標參照測驗與常模參照測驗的異同。5.試分析內(nèi)容范圍的界定在目標參照測驗的標準化過程中的重要性。6.試分析分數(shù)分界點在目標參照測驗的質(zhì)量評估中的作用。7.試分析題目內(nèi)容效度與目標參照測驗的內(nèi)容效度間的聯(lián)系。解答要點:1.首先進行專家的取舍。由于第二位專家在所有題目上所評等級與各等級平均數(shù)之間的差異之和較大,因此可以不考慮該專家的意見,只保留另外八位專家的評定結(jié)果,并重新計算這八位專家評定結(jié)果的等級平均
27、數(shù)。 其次根據(jù)八位專家評定結(jié)果的等級平均數(shù)對每道題目進行評定,并決定題目的取舍。等級平均數(shù)越高,說明題目內(nèi)容與其欲測量的目標內(nèi)容之間的匹配程度越高,即內(nèi)容效度越高。題目2、7、14、4、12、5、11的內(nèi)容效度很高(等級平均值均在4以上),可以得到完整的保留;題目1、3、6、9的內(nèi)容效度較高(等級平均值均在3-4之間),適當修改后即可;題目8、13、10的內(nèi)容效度較差(等級平均值均在3以下),一般需做較大修改或直接刪除。2.目標參照測驗的題目區(qū)分度可以通過計算題目的難度差值和題目得分與測驗總分之間的相關系數(shù)來表示。難度差值包括掌握組-未掌握組鑒別指數(shù)和個人獲得指數(shù)兩種。3.相關系數(shù)受到受測者團
28、體異質(zhì)性的影響,團體的異質(zhì)性越高,測驗分數(shù)的分布就越廣,所計算出來的相關系數(shù)就接近真實值。由于目標參照測驗的目的在于了解個體在所測內(nèi)容上的掌握水平,因此大多數(shù)情況下,被試團體在目標參照測驗上的分數(shù)分布比較集中,并且絕大多數(shù)被試都能夠達到所要求的水平。如果用相關系數(shù)作為信效度指標,由于受到分數(shù)分布的影響,即使該測驗本身具有較高的穩(wěn)定性和一致性,所得的信度系數(shù)也會和低,所以目標參照測驗的信度與效度不適宜以相關系數(shù)作為評價指標。4.常模參照測驗的目的在于度量和比較個體之間的差異,并以被試在團體中的相對位置來評價和解釋測量結(jié)果。目標參照測驗的主要目的則在于了解個體在所規(guī)定的測量內(nèi)容上的行為水平,其出發(fā)
29、點是個體本身的絕對水平,而不再是個體間的水平差異。由于測驗性質(zhì)的不同和受測人群可能存在的差異,兩種測驗的項目分析和信效度評估需采用不同的方法和評價指標。另外,目標參照測驗通常要根據(jù)切割分數(shù)線對被試進行分類,所以在目標參照測驗中對分數(shù)分界點的確定具有十分重要的意義。5.從目標參照測驗的定義來看,構成測驗的各個項目是否合適,測驗是否有效,測驗的分數(shù)是否能夠得到有意義而準確的解釋,這一切的前提都在于測驗有沒有明確的目的以及與之相應的嚴格界定的內(nèi)容范圍。因此對于目標參照測驗而言,測驗編制的前期過程,尤其是內(nèi)容范圍的確定十分重要。6.在目標參照測驗的實際應用中,常常要根據(jù)分數(shù)分界點來判斷某考生是否達到了
30、升一個年級或畢業(yè)所要求掌握的最低知識技能水平,或者是否達到了從事特定專業(yè)工作所需的最低水平。這個分數(shù)分界點的確定科學與否,直接決定了我們最終決策的正確與否。因此分數(shù)分界點在目標參照測驗的質(zhì)量評估中具有十分重要的作用。7.題目內(nèi)容效度與目標參照測驗的內(nèi)容效度之間有著重要的聯(lián)系。要確定目標參照測驗是否有效,必須首先要對構成測驗的每一個題目是否合適以及有效性進行分析,即檢驗題目與測驗內(nèi)容范圍所要求的內(nèi)容與目標的一致性。目標參照測驗注重被試在其所測內(nèi)容范圍內(nèi)的掌握程度,測驗本身的題目組成對其欲測的內(nèi)容范圍的覆蓋程度或代表性程度-即測驗的內(nèi)容效度-顯得尤其重要。第十一章 學績測驗練習與思考 練習與思考:
31、1.結(jié)合實際的測驗例子試述學績測驗的性質(zhì)和作用。2.就心理與教育測量前10章內(nèi)容,設計一份測驗編制計劃。(此題為思考題)3.標準化學績測驗的標準化要求有哪些?如何才能做到?4.舉例說明診斷測驗如何實現(xiàn)它的診斷功能? (此題為思考題)5.題庫的基本要求是哪些?你認為建設題庫有些什么好處?6.就你的經(jīng)驗談談教師自編測驗存在哪些不是?改進的途徑是什么?解答要點:1.學績測驗是對個體在一個階段的學習或訓練之后知識、技能的發(fā)展水平的測定,學績測驗與能力測驗一樣在測量學中屬于最佳行為測驗,其所測對象為個體的認知性心理品質(zhì),主要包括知識能力兩個方面。學績測驗有時也用來預測被試在今后的學習或工作中的成就,但是
32、它與一般的性向測驗有所不同。 學校使用學績測驗鑒定學生的學績成績以及輔助本學校的教學管理;現(xiàn)代社會的人事管理中的人員取錄、晉職提級常以學績測驗成績作為重要的評價標準;教育科學研究工作者利用學績測驗信息評價教育決策、優(yōu)選教育方案。3.標準化學績測驗的標準化要求包括: (一)命題組卷標準化。標準化試卷的試題測量目標明確,語詞意義清晰、試題難度、區(qū)分度達到規(guī)定標準。全卷的結(jié)構與測量的目標一致,題型比例恰當,題量適度,試題難度分布符合規(guī)定要求,試卷的信、效度都達到規(guī)定標準。 (二)施測標準化。標準化測驗必須在統(tǒng)一標準的環(huán)境下施測,統(tǒng)一標準環(huán)境包括測驗場所的標準統(tǒng)一、測驗時間統(tǒng)一、測驗的指導語統(tǒng)一、提供
33、給考生的測驗材料統(tǒng)一、材料出示的順序統(tǒng)一。 (三)評分標準化。標準化測驗的答案要正確、規(guī)范、唯一,評分規(guī)則應盡量細致、客觀、最好是沒有伸縮性。 (四)測驗分數(shù)解釋標準化。對于常模參照測驗,必須編制好測驗常模;對于目標參照測驗必須認真研究教材和教學大綱,分析合格標準的確切含義,通過調(diào)整試卷難度結(jié)構準確劃定合格分數(shù)線。5.題庫的基本要求包括: (1)植基于一種科學的測量理論; (2)儲備有一定數(shù)量的試題,所有試題品質(zhì)優(yōu)良,技術參數(shù)完備; (3)題庫內(nèi)容結(jié)構層次清楚、分類嚴謹,試題檢索方便; (4)題庫管理方便、可控性強、易于維護更新; (5)保密性強,應用題庫組拼標準化學績測驗的試卷,具有經(jīng)濟、高
34、效、保密性強等優(yōu)點。 6.(一)教師要深入研究教材,深入調(diào)查學生。僅憑經(jīng)驗命題容易形成所測內(nèi)容往往只涉及自己熟悉的或自己注重的內(nèi)容,考試對象只以自己熟悉的或親近學生為代表,這樣會造成命題試卷內(nèi)容部全面,或脫離學生實際。 (二)要維護準確穩(wěn)定的合格標準。所謂準確就是要保證凡被評為合格的學生確實都是達到教學基本要求的人,凡被評為部合格的學生確實是未達到學科基本要求的人,要盡量減少誤判之處;所謂穩(wěn)定,就是在各次測驗中都維持同一個合格標準,不能忽高忽低。 (三)要客觀評價自己的命題技術,合理使用各種題型。定向反應型試題命題技術要求比較高,沒有一定的命題經(jīng)驗和技術,編寫定向反應型試題,有時反而會達不到預
35、期的要求。 (四)要注意總結(jié)命題經(jīng)驗,提高命題技術。教師要通過不斷總結(jié)成功、反思失敗,逐漸掌握命題的各種技巧??偨Y(jié)命題經(jīng)驗還具體包括不斷積聚優(yōu)秀試題,不斷充實個人的題庫。 (五)要盡量控制評分誤差,防止簡單粗糙。教師自編測驗應防止評分簡單粗糙、草率從事,要防止簡單地以對錯判分,特別是對于自由反應型試題評分應詳細分析學生的作答過程,評價他的思維方式和思維水平。 (六)要做一些定量分析研究。教師在自編測驗施測后對試卷做一些定量的分析研究,比如計算試題難度、區(qū)分度、信度、效度等,可以逐步總結(jié)命題經(jīng)驗,提高命題技術。第十二章 能力測驗(上)練習與思考 練習與思考:1.試談智力測驗的效度問題。2.智力測
36、驗的功能是什么?3.為什么說智力測驗前并非人人平等?4.試析智力測驗存在的合理性。5.試析智力的形式與發(fā)展過程中的遺傳與環(huán)境的關系。(此題為思考題)解答要點:1.結(jié)構效度方面,傳統(tǒng)的智力測驗是在智力G因素論的基礎上編制的,但G因素論仍存在很多問題。關于智力測驗的結(jié)構效度,目前只能做狹義的解釋,即以不同智力理論模型為基礎的智力測驗,其結(jié)構效度應具備不同的含義,并且最終對測驗結(jié)果的解釋也相應不同。 預測效度方面,智力測驗對個體的未來成就進行預測時,首先假定所測的智力是個體相當穩(wěn)定的特質(zhì)。但事實上智力會因為某些因素而發(fā)生變化。由于智力的可變性,利用智力測驗來預測個體今后的可能成功程度的效能有被夸大的
37、可能。2.傳統(tǒng)智力測驗的功能是對智力的個體差異的測量,在實際應用中常常行使將人群分類的功能。傳統(tǒng)智力測驗也常被用做預測源測驗行使預測的功能。3.智力測驗存在著性別差異、職業(yè)差異文化和教育差異。有研究表明男性和女性在不同的能力因素上存在著差異。而一般的智力測驗都包括多種性質(zhì)的題目,有些可能更適于男性,有些則更適于女性,因此智力測驗本身的內(nèi)容和結(jié)構對男女兩性未必公平。 關于智力的職業(yè)差異的異類研究表明不同職業(yè)的人在智商上具有明顯的差異,這可能是由于傳統(tǒng)的智力測驗并不能全面反映人的各方面能力的原因。而僅以智商高低來判斷人的智愚也是不充分的。 智力測驗結(jié)果反映出來的城鄉(xiāng)差異和種族差異,并不能完全歸因于
38、城鄉(xiāng)或種族本身由遺傳引起的差異,事實上文化和教育因素可能在此起了主導作用。4.智力具有穩(wěn)定性,這種穩(wěn)定性表現(xiàn)在個體智力在其相應團體中的相對位置長時期內(nèi)保持穩(wěn)定,個體智力的相對穩(wěn)定性為智力測驗具有一定預測效度提供了可能性;智力測驗被實踐證明對學生和職業(yè)等效標的預測具有較好的效度,可以有效地幫助決策者提高決策正確率;盡管智力測驗對不同團體可能存在不公平,但我們更應該看重其預測效度;至盡仍無更有效的智力評估工具。第十三章 能力測驗(下)練習與思考 練習與思考:1.能力傾向測驗與智力才而言、成就測驗之間有何不同?2.能力傾向測驗與特殊能力測驗在應用上有何區(qū)別?3.現(xiàn)在流行的創(chuàng)造力測驗依據(jù)的理論基礎是什
39、么?4.試分析社會發(fā)展與需要在能力測驗的產(chǎn)生和發(fā)展中的影響。(此題為思考題)5.試分析創(chuàng)造力的實質(zhì)與表現(xiàn)。(此題為思考題)解答要點:1.成就測驗是對個體過去學習經(jīng)驗的總結(jié);智力測驗的主要目的是預測,但它所做出的預測比較籠統(tǒng),針對性較弱。能力傾向測驗則是對個體在不同能力因素上潛在的優(yōu)劣傾向的測量,它的預測的目的性更強,試圖說明個體在多種能力上的潛在優(yōu)勢。2.能力傾向測驗可以從不同能力因素上來評估個體,但如果只用于測量某一種特殊的能力,成套的能力傾向測驗就顯得有些累贅,而且不夠充分。特殊能力測驗是針對一種特殊能力所包含的各個方面因素進行測量,其性質(zhì)介于成就測驗和能力測驗之間,測量的目的既想了解個體
40、在此專業(yè)領域的既有水平,又想預測個體今后在此專業(yè)領域成功的可能性。3.現(xiàn)在流行的創(chuàng)造力測驗依據(jù)的理論基礎是吉爾福特的關于智力結(jié)構的理論。吉爾福特認為在智力操作維度上存在著聚合與發(fā)散兩種不同類型的思維,而創(chuàng)造力的核心正是發(fā)散思維能力。第十四章 人格測量練習與思考練習與思考:1.試綜合比較自陳量表和投射測驗的異同。2.查閱有關人格心理學著作,討論人格的理論研究對發(fā)展人格測量技術的作用。(此題為思考題)3.查閱有關文獻,分析中國人格測量研究的現(xiàn)狀和特點,并論述你對開展人格測量與研究工作的看法。(此題為思考題)解答要點:1.自陳量表采用客觀測驗和紙筆測驗的形式,事先根據(jù)操作性定義編制好許多有關某些人格
41、特質(zhì)的問題,要求受測者根據(jù)自己的實際情況逐一回答這些問題,并用此來衡量受測者在這些人格特質(zhì)上的表現(xiàn)的一種人格測量工具。它的項目形式一般采用是非式,記分比較客觀,施測較簡單,測量分數(shù)容易解釋。投射測驗是向受測者提供一些未經(jīng)組織的、意義模糊的標準化刺激情景,讓受測者在不受任何限制的情況下,自由地對刺激情景做出反應,然后分析這些反應,推斷受測者的人格特征的一種人格測量手段。 投射測驗的測驗材料沒有明確的結(jié)構和確切的意義,受測者對測驗材料的反應不受限制,可以根據(jù)自己對測驗材料的理解做任何想象式的解釋。其測驗的目的具有隱蔽性,測驗結(jié)果的解釋重在對受測者的人格特征獲得整體性的了解,可廣泛用于人格的跨文化研究。投射測驗的最大局限在于記分上的困難,并難以進行定量分析。第十五章 其他心理與教育測驗練習與思考 練習與思考:1.如何理解焦慮?常用的焦慮測量工具有哪些?2.職業(yè)興趣測驗的量表發(fā)展趨勢是什么?如何評價職業(yè)興趣測驗在職業(yè)選擇中的作用?3.態(tài)度和品德測量的常用方法有哪些?優(yōu)缺點何在?解答要點:1. 焦慮是一種正常的、具有適應意義的負性情緒體驗,它可以是一時的情緒狀,也可以內(nèi)化為穩(wěn)定的個體情緒特質(zhì)。嚴重的、持續(xù)的焦慮可能形成病態(tài)人格。常用的焦慮測量工具有顯性焦慮量表(MAS)、狀態(tài)-特質(zhì)焦慮量表(STAI)、測驗焦慮
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 復混肥料在農(nóng)業(yè)現(xiàn)代化進程中的角色考核試卷
- 智能交通管理系統(tǒng)的運營與維護考核試卷
- 體育表演跨國合作案例考核試卷
- 辦公設備培訓課程考核試卷
- 推廣會議合同范本
- 工地噴錨合同范本
- 兼職項目加工合同范本
- 物聯(lián)網(wǎng)技術在智能家居領域的合同
- 年度項目進度計劃及任務分配方案書
- 智慧農(nóng)業(yè)技術服務合同
- 2025年舞蹈培訓機構學員培訓合同范本
- 2025年保險銷售業(yè)務人員崗位職業(yè)技能資格知識考試題(附答案)
- 兒科護理模擬考試題與參考答案
- 注意缺陷與多動障礙疾病科普幼兒心理健康教育課件
- 區(qū)域臨床檢驗中心
- 2024年07月長沙農(nóng)村商業(yè)銀行股份有限公司2024年招考3名信息科技專業(yè)人才筆試歷年參考題庫附帶答案詳解
- 中醫(yī)預防流感知識講座
- 船舶水下輻射噪聲指南 2025
- 2024年黑龍江哈爾濱市中考英語真題卷及答案解析
- 房屋市政工程生產(chǎn)安全重大事故隱患判定標準(2024版)宣傳畫冊
- 2025年中國配音行業(yè)市場現(xiàn)狀、發(fā)展概況、未來前景分析報告
評論
0/150
提交評論