9. 測驗分?jǐn)?shù)的解釋_第1頁
9. 測驗分?jǐn)?shù)的解釋_第2頁
9. 測驗分?jǐn)?shù)的解釋_第3頁
9. 測驗分?jǐn)?shù)的解釋_第4頁
9. 測驗分?jǐn)?shù)的解釋_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、幻燈片1第九講測驗分?jǐn)?shù)的解釋幻燈片2本章主要內(nèi)容:9.1 參照常模的分?jǐn)?shù)9.2 參照標(biāo)準(zhǔn)的分?jǐn)?shù)9.3 測驗分?jǐn)?shù)的解釋幻燈片3l 從測驗中直接獲得的分?jǐn)?shù),稱為原始分?jǐn)?shù),它是通過將被試的反應(yīng)與標(biāo)準(zhǔn)答案相比較而獲得的。原始分?jǐn)?shù)本身并不具有多大的意義,必須與一定的參照體系作比較,才能顯示其意義。l 例:語文85分,游泳第3名。l 確定原始分?jǐn)?shù)意義的參照體系有兩類:l 其他被試的分?jǐn)?shù),即其他被試在所測特質(zhì)上的一般水平。l 社會在所測特質(zhì)上的客觀要求,即被試在所測特質(zhì)上發(fā)展應(yīng)該達(dá)到的標(biāo)準(zhǔn)?;脽羝?l 第一種稱為參照常模的分?jǐn)?shù)解釋。參照常模的分?jǐn)?shù)解釋方法是將被試的分?jǐn)?shù)和常模團(tuán)體測驗分?jǐn)?shù)進(jìn)行比較來解釋的,并且

2、主要以個人在常模團(tuán)體中所處的相對位置來說明。l 第二種是參照標(biāo)準(zhǔn)的分?jǐn)?shù)解釋。參照標(biāo)準(zhǔn)的分?jǐn)?shù)解釋方法是用被試測驗分?jǐn)?shù)與應(yīng)有的標(biāo)準(zhǔn)作比較來確定被試測驗分?jǐn)?shù)的意義。凡達(dá)到要求的標(biāo)準(zhǔn),就是“合格”或“達(dá)標(biāo)”;未達(dá)到要求的標(biāo)準(zhǔn),就是“不合格”或“未達(dá)標(biāo)”,它全然不管其他被試在同一測驗上的分?jǐn)?shù)如何?;脽羝?9.1 參照常模的分?jǐn)?shù)l 參照常模的分?jǐn)?shù)解釋是把被試的測驗分?jǐn)?shù)與具有某種特征的人所組成的有關(guān)團(tuán)體的一般水平作比較,以確定被試在該團(tuán)體內(nèi)的相對位置。l 用來比較的參照團(tuán)體稱常模團(tuán)體(norm group),常模團(tuán)體的分?jǐn)?shù)分布叫常模,它是我們解釋測驗分?jǐn)?shù)的基礎(chǔ)。l 9.1.1 常模團(tuán)體的性質(zhì)l 9.1.2

3、確定常模團(tuán)體的注意事項l 9.1.3 常?;脽羝?9.1.1 常模團(tuán)體的性質(zhì)l 常模團(tuán)體是由具有某種共同特征的人所組成的一個群體,或是該群體的一個樣本。l 從測驗的編制者來說,確定常模團(tuán)體的問題就是確定所編制的測驗將來用于什么總體。所選定的常模團(tuán)體必須能夠代表該總體。l 例如,測驗是用來評價高中畢業(yè)生的學(xué)業(yè)成就,則常模團(tuán)體應(yīng)包括全體高中畢業(yè)生,或是能足夠代表該總體的一個樣本,由于大部分的測驗要用于各種不同團(tuán)體,所以大部分測驗都有不止一個常模團(tuán)體?;脽羝?l 如,瑞文標(biāo)準(zhǔn)推理測驗,常模團(tuán)體就有兒童,成人、城市、農(nóng)村等多個。l 對測驗的使用者,要從不同角度來選定常模。首先要考慮的問題是現(xiàn)有的常模團(tuán)

4、體哪一個最適合?因為標(biāo)準(zhǔn)化測驗通常提供許多原始分?jǐn)?shù)與各種常模團(tuán)體的比較轉(zhuǎn)換表,被試的分?jǐn)?shù)必須與最合適的常模比較?;脽羝?l 無論是測驗編制者還是測驗使用者,常模團(tuán)體通常包括具有同樣年齡或教育水平的人,當(dāng)然,在一些特殊情況下,還有許多方面也可用來定義常模團(tuán)體,如性別、年齡,年級或教育水平、職業(yè)、社會經(jīng)濟(jì)地位、民族等?;脽羝?9.1.2 確定常模團(tuán)體的注意事項l 常模團(tuán)體的界限必須明確l 在確定常模團(tuán)體時,必須清楚地說明所要測量的群體的性質(zhì)與特征。雖然有關(guān)常模團(tuán)體的一般規(guī)定取決于測驗的目的與使用,且可能有多個常模團(tuán)體,但對每個常模團(tuán)體的性質(zhì)和特征必須有一個簡短而明確的描述。若群體過大,群體內(nèi)部也許

5、有許多小團(tuán)體,它們在一個測驗上的表現(xiàn)也時常有差異,假如這種差異較為顯著,就必須對每個小團(tuán)體分別建立常模。幻燈片10l 例如,在機(jī)械能力傾向測驗上,男性通常比女性做得好些,因此這類測驗通常分別提供男性、女性的常模。 身高 體重幻燈片11l 常模團(tuán)體的取樣要有代表性l 當(dāng)所要測量的群體較小時,將所有的被試逐個測量以得到常模。在群體較大時,只能測量一部分被試作為群體的代表。此時就存在取樣是否具有代表性的問題。根據(jù)隨機(jī)化原則抽樣能確保樣本具有代表性。關(guān)于具體抽樣方法,可參閱有關(guān)統(tǒng)計學(xué)書中的抽樣推斷部分?;脽羝?2l 取樣過程應(yīng)詳盡描述l 取樣的過程必須明確且有詳盡的描述。這主要是為了使測驗的使用者不至

6、于誤用測驗和錯誤地解釋測驗結(jié)果。所以在一般的測驗手冊中,都有相當(dāng)?shù)钠敿?xì)介紹常模團(tuán)體的大小、取樣策略、取樣時間以及其他有關(guān)情況,這些說明和描述越明確,越詳盡越好。l 樣本的大小要適當(dāng)l 所謂“大小適當(dāng)”并沒有明確的指標(biāo),根據(jù)統(tǒng)計學(xué)原理,取樣誤差與樣本大小成反比。幻燈片13l 在其他條件相同時,樣本越大越好,但還應(yīng)考慮到人力、物力等方面的因素,通常在決定樣本大小時,應(yīng)注意:l (1)總體的數(shù)目??傮w數(shù)目小,樣本相應(yīng)可小一些。若總體過小,則可將全部被試入選;當(dāng)總體較大時,相應(yīng)的樣本也大。一般最低不小于30或100。全國性常模,一般應(yīng)有2000-3000人。l (2)群體的性質(zhì)。如果群體性質(zhì)單一,

7、則樣本不必太大,就可以反映群體性質(zhì);若群體性質(zhì)復(fù)雜,則樣本容量就應(yīng)大一些。幻燈片14l (3)測驗結(jié)果的精確度。根據(jù)統(tǒng)計學(xué)原理,抽樣誤差的大小與樣本容量成反比,若要提高精確度,減少抽樣誤差,就必須加大樣本容量(n)。 l 常模必須是近時的l 建立的常模必須是近時的。過時的常模是不能作為參照標(biāo)準(zhǔn)的。例如對瑞文智力測驗來說,幾年以前所修訂的常模對現(xiàn)今可能就不再適用,否則所得智商將產(chǎn)生偏高的趨勢。常模必須定期修訂?;脽羝?5l 一般常模與特殊常模的結(jié)合l 測驗手冊上的常模通常為一般常模,它的適用范圍比較廣,有時對于某些特殊的群體不一定完全適用。因此,測驗有時須有特殊常模。將特殊常模與一般常模結(jié)合起來

8、,可使被試與最接近的群體進(jìn)行比較。因為各個具體群體在某些方面是獨特的,它的成員將與測驗手冊所列的常模團(tuán)體成員不符,所以,依據(jù)一般常模解釋所得的結(jié)論可能不夠恰當(dāng),如果將兩者結(jié)合使用,解釋分?jǐn)?shù)便會更加準(zhǔn)。幻燈片169.1.3 常模l 常模團(tuán)體的分?jǐn)?shù)分布叫常模,有了常模,我們就可以了解被試在常模團(tuán)體中的相對位置,從而參照其他個體評價他的成績。通常把常模分為發(fā)展常模和團(tuán)體內(nèi)常模兩大類型。 l 發(fā)展常模l 發(fā)展常模表示個體在正常發(fā)展線上心理特征處于什么樣的發(fā)展水平。l 例如我們可以說一個8歲兒童具有10歲兒童的智力水平,也可以說一個四年級的學(xué)生具有五年級或三年級閱讀水平?;脽羝?7嬰幼兒頭圍與胸圍發(fā)育的

9、正常值(生理發(fā)展常模)幻燈片18兒童口語獲得的年齡和不同階段的特征(心理發(fā)展常模)幻燈片19 常用的發(fā)展常模有以下三種:l (一)智力年齡(mental age)l 比奈在本世紀(jì)初認(rèn)為:測量兒童心理成長,可以將一個兒童的行為與各年齡水平的兒童比較,以獲得該兒童的心理發(fā)展水平。l 在此設(shè)想基礎(chǔ)上,他首先尋找并設(shè)計出可區(qū)分各種年齡兒童智力的題目,因為兒童在這些題目上的反應(yīng),隨著年齡的變化而有系統(tǒng)的改變。每個題目放在大部分的兒童都能成功地完成的那個年齡水平?;脽羝?0l 例如標(biāo)準(zhǔn)化樣本中大多數(shù)8歲兒童都能通過的那些項目, 就代表8歲兒童的智力水平,就將該題放在8歲水平。每個年齡水平制定適當(dāng)?shù)念}目,可

10、以得到一個可評價兒童智力發(fā)展水平的年齡量表。l 一個兒童在年齡量表上所得的分?jǐn)?shù),就是最能代表他的智力水平的年齡,這樣的分?jǐn)?shù)就稱作智力年齡,簡稱智齡。l 所有的年齡量表基本上都是利用相同的推理與步驟制定的,年齡量表將個人的行為與各年齡組的一般兒童比較而給予一個年齡分?jǐn)?shù)。l (比率智商 = 智齡/實齡)幻燈片21l 年齡量表的基本要素是:l (1)一組可區(qū)分不同年齡組的題目。l (2)一個常模團(tuán)體。該團(tuán)體是由各個年齡的被試所組成的具有代表性的樣本。l (3)常模表,即一個表明答對哪些題目或得多少分就該歸入哪個年齡的對照表。l 年齡常模最大的優(yōu)點是易于理解與解釋,并可以與同年齡團(tuán)體作直接比較。但必須

11、注意人在很多方面發(fā)展的速率是先快后慢并隨著年齡的增長而逐漸減慢,當(dāng)長到青春期或成年期,便逐漸停止。此時,年齡常模便不再適用?;脽羝?2l (二) 年級當(dāng)量(grade equivalents)l 教育成就測驗上的分?jǐn)?shù)經(jīng)常按照年級當(dāng)量來解釋,即將被試的測驗成績與某一年級的學(xué)生的平均分?jǐn)?shù)作比較,以確定他相當(dāng)于哪一年級的水平。l 這種年級當(dāng)量選擇題目與指定分?jǐn)?shù)的方法與步驟與年齡常模類似,所不同的是用年級水平代替了年齡水平。l 例:一個學(xué)生如果能解答六年級的題目或他(她)在測驗上的得分與六年級的平均分?jǐn)?shù)相同,則他(她)在該測驗上的年級當(dāng)量便是6?;脽羝?3l (三) 順序量表(ordinal scal

12、es)l 這種常模源于兒童心理學(xué)的研究。通過對嬰兒的行為發(fā)展的經(jīng)驗觀察,人們描述各種機(jī)能隨著年齡發(fā)展的典型行為。(如前例)l 例:格塞爾發(fā)展順序量表按月份表明,從4周到36周的兒童在運動、適應(yīng)性、語言、社會性等四個方面的大致發(fā)展水平。如嬰兒的感覺運動發(fā)展順序是:4周,控制眼睛運動,能追隨一個對象看等;16周,能使頭保持平衡;28周,能用手抓握并玩弄東西等。 l 順序量表用來鑒別兒童在具體行為機(jī)能的發(fā)展中所達(dá)到的階段。幻燈片24l 團(tuán)體內(nèi)常模l 現(xiàn)在,幾乎所有的標(biāo)準(zhǔn)化測驗都提供某種的團(tuán)體內(nèi)常模。這類常模是根據(jù)被試在常模團(tuán)體中所處的相對位置來評價被試的成績。l 團(tuán)體內(nèi)分?jǐn)?shù)具有統(tǒng)一的、定義明確的定量

13、意義,能夠適用于大多數(shù)類型的統(tǒng)計分析。團(tuán)體內(nèi)常模常用兩類數(shù)據(jù)來標(biāo)示:l 百分等級l 標(biāo)準(zhǔn)分?jǐn)?shù)幻燈片25l (一)百分等級 (簡稱PR值)l 百分等級是應(yīng)用最廣的表示測驗分?jǐn)?shù)的方法。一個原始分?jǐn)?shù)的百分等級是指在常模團(tuán)體中低于這個分?jǐn)?shù)的人數(shù)的百分比。l 例如,一被試在一項測驗中得82分,經(jīng)過換算,百分等級分?jǐn)?shù)為75,就表示參加該項測驗的人得分低于82分的占全體被試的75,并說明超過他的成績82分的人僅有25。l 我們通常用PR來表示百分等級。l 百分等級取值越大,說明成績越優(yōu)秀?;脽羝?6l 百分等級的計算方法:l 將被試團(tuán)體的全體原始分?jǐn)?shù)從大到小排序,然后采用下列公式計算 :l PR =100-

14、(100 R-50)Nl 式中PR為百分等級,R為排名順序的序號,N為被試總?cè)藬?shù)。l 例:某被試在一次由50人參加的成績測驗中得80分,排名第9,則該生成績(80分)的百分等級為:l PR =100-(100R-50)Nl =100-(1009-50)50 = 83l 其百分等級為83,說明?l 總體中有83的人分?jǐn)?shù)低于80分?;脽羝?7l 如對原始分?jǐn)?shù)已作過初步整理,通常以次數(shù)分布表的形式呈現(xiàn),即數(shù)據(jù)已分組。此時,可采用分組數(shù)據(jù)的公式求百分等級。l (參見統(tǒng)計學(xué)的有關(guān)部分)幻燈片28l 百分等級的優(yōu)缺點:l 百分等級是一種相對位置量數(shù),具有可比性,便于計算、易于理解等優(yōu)點。l 主要缺點是單位

15、不等,尤其在分?jǐn)?shù)分布的兩端。原始分?jǐn)?shù)轉(zhuǎn)換成百分等級時,靠近分布中央(平均數(shù)或中位數(shù)附近)的原始分?jǐn)?shù)的分?jǐn)?shù)之間的差異被夸大了,而靠近分布兩端的原始分?jǐn)?shù)的差異被縮小了。l 另一個缺點是百分等級只具有順序性,而無法用它來說明不同被試之間分?jǐn)?shù)差異量。 l 例:某被試甲在一個成就測驗中的百分等級為10,被試乙為20,被試丙為30,我們只能說丙優(yōu)于乙,乙優(yōu)于甲,而不能推斷他們之間差異的程度相等?;脽羝?9l 在使用百分等級時應(yīng)注意,百分等級是相對于特定的被試團(tuán)體而言的。所以,解釋時不能離開特定的參照團(tuán)體。被試得分不變,但參照團(tuán)體改變了,百分等級值就可能發(fā)生變化。l 所以在報告百分等級時,一定要說明是相對于

16、什么的參照團(tuán)體來說的?;脽羝?0(二) 標(biāo)準(zhǔn)分?jǐn)?shù)l 標(biāo)準(zhǔn)分?jǐn)?shù)是一種具有相等單位的量數(shù)。它是將原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量數(shù),它的基本單位是標(biāo)準(zhǔn)差,所以叫標(biāo)準(zhǔn)分?jǐn)?shù)。l 標(biāo)準(zhǔn)分?jǐn)?shù)可分為兩類:l 線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)(簡稱Z分?jǐn)?shù))l 非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)(稱為正態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù),常見的有T分?jǐn)?shù)、標(biāo)準(zhǔn)九分)?;脽羝?1l Z分?jǐn)?shù)l 通過線性轉(zhuǎn)換得到的標(biāo)準(zhǔn)分?jǐn)?shù)稱為Z分?jǐn)?shù)l 它是將個體原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來。l Z分?jǐn)?shù)之間差異的相對大小,準(zhǔn)確地反映了原始分?jǐn)?shù)之間的相對大小。l Z分?jǐn)?shù)的計算方法 l Z = ( XX )S幻燈片32l Z分?jǐn)?shù)具有以下幾個性質(zhì):l Z分?jǐn)?shù)是

17、以一批分?jǐn)?shù)的平均數(shù)為參照點,以標(biāo)準(zhǔn)差為單位的等距量表。l Z分?jǐn)?shù)的正負(fù)符號表示原始分?jǐn)?shù)在平均數(shù)之上或之下,絕對值表示原始分?jǐn)?shù)與平均數(shù)的距離。l Z分?jǐn)?shù)分布形態(tài)與原始分?jǐn)?shù)分布完全一樣。Z分?jǐn)?shù)之間差異的相對大小,準(zhǔn)確地反映了原始分?jǐn)?shù)之間的相對大小?;脽羝?3l 由于Z分?jǐn)?shù)在計算中經(jīng)常出現(xiàn)負(fù)數(shù)和小數(shù),且單位過大(一個標(biāo)準(zhǔn)差單位),使用起來不夠方便,所以通常需要將Z分?jǐn)?shù)進(jìn)行進(jìn)一步線性轉(zhuǎn)換,其形式為: l Z= A + BZl (Z為轉(zhuǎn)換后的標(biāo)準(zhǔn)分?jǐn)?shù),A,B為常數(shù))l 加上一個常數(shù)目的是為了去掉負(fù)值,乘上一個常數(shù)是為了使單位變小從而去掉小數(shù)點。原來分?jǐn)?shù)間的關(guān)系不會改變。幻燈片34l 例如,美國大學(xué)入學(xué)考

18、試委員會的學(xué)業(yè)評定測驗(SAT)所使用的分?jǐn)?shù)轉(zhuǎn)換公式為: l CEEB分?jǐn)?shù)100Z500 l (平均分?jǐn)?shù)為500,標(biāo)準(zhǔn)差為100)。l 我國一種出國人員英語水平考試(EPT)所使用的分?jǐn)?shù)轉(zhuǎn)換公式為:l EPT分?jǐn)?shù)20Z90 l (平均分?jǐn)?shù)為90,標(biāo)準(zhǔn)差為20)幻燈片35l 常(正)態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)l 用線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)只有在分布形態(tài)相同或相近時才能進(jìn)行比較, 若兩個分布的偏斜方向不同,那么相同的標(biāo)準(zhǔn)分?jǐn)?shù)可能代表不同的百分等級,兩個測驗的分?jǐn)?shù)仍無法比較。為了能將來自不同分布形態(tài)的分?jǐn)?shù)具有可比性,可以采用非線性轉(zhuǎn)換,將原分?jǐn)?shù)分布都轉(zhuǎn)化為正態(tài)分布。有了相同的分布,不同測驗的分?jǐn)?shù)就可以比較了?;脽羝?

19、6l 具體步驟是:l 先將每個原始分?jǐn)?shù)轉(zhuǎn)換為百分等級,然后使用正態(tài)分布表,將對應(yīng)的百分等級直接看成是正態(tài)分布曲線下的面積值,找出所對應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù),由這種方式得到的分?jǐn)?shù)稱為正態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)。l (1)T分?jǐn)?shù)l 把正態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)乘以10(以消除小數(shù))再加上50(消除負(fù)號),它就被轉(zhuǎn)換成T分?jǐn)?shù)。即: T10Z50 幻燈片37(2)標(biāo)準(zhǔn)九分(standard nine) 標(biāo)準(zhǔn)九分是標(biāo)準(zhǔn)化九分制的簡稱。它將正態(tài)曲線下的橫軸分為九段,最高一端為9分,最低一端為1分,中間一段為5分。除兩端(1分,9分)外,每段均有半個標(biāo)準(zhǔn)差寬。 標(biāo)準(zhǔn)九分是根據(jù)分?jǐn)?shù)范圍從1到9而得名。在正態(tài)曲線下,每個標(biāo)準(zhǔn)九分所包含的百分比為

20、:幻燈片38l 要把原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)九分,首先按大小排列原始分?jǐn)?shù),然后根據(jù)上表給出的正態(tài)曲線百分比來指定九分。即將得分最高的4%的被試給予9分,其次7%的被試給予8分,按上表依次類推。l 亦可將原始分?jǐn)?shù)轉(zhuǎn)換為百分等級,然后得到其相應(yīng)的標(biāo)準(zhǔn)九分值?;脽羝?9標(biāo)準(zhǔn)九(stanine)l 標(biāo)準(zhǔn)化九級分制l 標(biāo)準(zhǔn)九=5+2Z,即平均數(shù)為5,標(biāo)準(zhǔn)差為2幻燈片40正態(tài)Z分?jǐn)?shù)與標(biāo)準(zhǔn)九的轉(zhuǎn)換方法幻燈片41正態(tài)Z分?jǐn)?shù)與標(biāo)準(zhǔn)十的轉(zhuǎn)換方法(M=5,s=1.5)幻燈片42l (3)離差智商(deviation IQ) l 離差智商是標(biāo)準(zhǔn)分?jǐn)?shù)的另一種變式,也是通過正態(tài)轉(zhuǎn)化得到的。l 最早的智力測驗采用比率智商IQ(即

21、智力年齡與實足年齡的比率,再乘100)。使用比率智商的缺點是,不同年齡組智商分布的標(biāo)準(zhǔn)差不盡相同,因而相同的智商分?jǐn)?shù)在不同年齡具有不同意義,無法進(jìn)行比較。l 因此,離差智商取代了比率智商。離差智商是將一個人的測驗分?jǐn)?shù)與同年齡組的人比較所得到標(biāo)準(zhǔn)分?jǐn)?shù),其優(yōu)點是同樣的智商分?jǐn)?shù)在任何年齡水平上都代表相同的相對位置?;脽羝?3l 現(xiàn)在大部分智力測驗都采用離差智商。l 為了使離差智商的單位與比率智商相當(dāng),需要選擇接近比率智商分布的平均數(shù)和標(biāo)準(zhǔn)差。韋氏智力測驗的離差智商的平均數(shù)是100,標(biāo)準(zhǔn)差是15。l (IQ = 100+15Z)l 標(biāo)準(zhǔn)分?jǐn)?shù)的優(yōu)點:l 具有相等的單位,便于作進(jìn)一步的統(tǒng)計分析;l 正態(tài)化

22、標(biāo)準(zhǔn)分?jǐn)?shù)可利用正態(tài)曲線面積表直接轉(zhuǎn)換成百分等級分?jǐn)?shù),易于理解;l 允許將兩個或兩個以上的測驗的分?jǐn)?shù)作直接的比較?;脽羝?4l 標(biāo)準(zhǔn)分?jǐn)?shù)也有它的缺陷:l 分?jǐn)?shù)比較抽象,不易讓一般人理解;l 正態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)是人為使分?jǐn)?shù)呈正態(tài)分布,當(dāng)所測特質(zhì)的分?jǐn)?shù)不是正態(tài)時,便扭曲了分布的形狀?;脽羝?59.2 參照標(biāo)準(zhǔn)的分?jǐn)?shù)l 參照常模的分?jǐn)?shù)是將被試的分?jǐn)?shù)和常模團(tuán)體測驗分?jǐn)?shù)進(jìn)行比較來的,并且主要以個人在常模團(tuán)體中所處的相對位置來確定。l 參照標(biāo)準(zhǔn)的分?jǐn)?shù)不同,一個人的測驗成績不是和其他人比較,而是和某種特定的標(biāo)準(zhǔn)比較。它關(guān)心的是一個人是否達(dá)到某種標(biāo)準(zhǔn),它反映的是一個人的行為水平或成就水平如何。l 標(biāo)準(zhǔn)參照分?jǐn)?shù)可分為

23、內(nèi)容參照分?jǐn)?shù)和結(jié)果參照分?jǐn)?shù)?;脽羝?69.2.1 內(nèi)容參照分?jǐn)?shù)l 內(nèi)容參照分?jǐn)?shù)主要依據(jù)被試對某個確定的材料內(nèi)容或技能的掌握和熟悉程度來確定的。l 使用內(nèi)容參照分?jǐn)?shù),關(guān)鍵是要預(yù)先制定一個能判定被試是否已掌握某種內(nèi)容或熟練程度的標(biāo)準(zhǔn),這種標(biāo)準(zhǔn)主要有:幻燈片47l 掌握分?jǐn)?shù)l 最簡便的方法是訂出一個判別被試是否通過或掌握某種內(nèi)容的最低分?jǐn)?shù)線,即最低標(biāo)準(zhǔn)水平。在此分?jǐn)?shù)以上,表明被試已達(dá)到掌握或熟練的水平;在此分?jǐn)?shù)以下,表明被試沒有達(dá)到掌握或熟練的水平。l 如何確定這個水平?通常是選擇有80%到90%的人通過的那一水平。l 如:考查科分合格與不合格兩級?;脽羝?8l 正確百分?jǐn)?shù)l 正確百分?jǐn)?shù)指被試在測驗

24、中答對題目的百分比。l 這一指標(biāo)更為常用,因為它能更好地反映被試對所測內(nèi)容的掌握或熟練程度。l 采用這一指標(biāo)解釋測驗分?jǐn)?shù)時必須注意測題應(yīng)該確是該目標(biāo)范圍的代表性的取樣,否則答對多少題并不反映對該目標(biāo)的掌握程度。 幻燈片49l 內(nèi)容標(biāo)準(zhǔn)分?jǐn)?shù)l 內(nèi)容標(biāo)準(zhǔn)分?jǐn)?shù)是把內(nèi)容分?jǐn)?shù)與常模分?jǐn)?shù)結(jié)合起來使用。l 編制內(nèi)容標(biāo)準(zhǔn)量表時,不但要明確界定內(nèi)容、范圍,還要詳細(xì)說明每一種水平的“典型”人物正確回答和不正確回答的問題的類型。這樣,將一個人的測驗分?jǐn)?shù)與此種量表對照,便既能指出他正確反應(yīng)的百分比,又能指出他的成績達(dá)到了哪種人的水平以及他能解決哪一類問題。l 如:智力年齡幻燈片50l 等級評定量表 l 在某些情況下,

25、我們感興趣的不是人們是否掌握了某種知識,而是一個人完成某種過程或生產(chǎn)出某種產(chǎn)品的技能。 l 通常我們需要采用等級評定量表來報告一種活動的熟練水平或一種產(chǎn)品的質(zhì)量。l 為了使評定盡可能客觀,需要對各種等級定出標(biāo)準(zhǔn)。對每種水平都定出標(biāo)準(zhǔn)樣本,并作出詳細(xì)說明。l 如:各種等級考試 幻燈片51l 內(nèi)容參照分?jǐn)?shù)的主要優(yōu)點是用個人所掌握的知識或技能的水平來描述行為,指出一個人知道什么和能做什么。在大多數(shù)情況下,這比知道一個人在團(tuán)體中的相對位置更有價值。l 內(nèi)容參照分?jǐn)?shù)主要用于成就測驗以及能確定出可接受的最低標(biāo)準(zhǔn)的資格測驗(如醫(yī)生或司機(jī)的證書考試),對于大多數(shù)能力傾向和人格測驗來說,由于所測的范圍很難確定,

26、因而一般不用內(nèi)容參照分?jǐn)?shù)?;脽羝?29.2.2 結(jié)果參照分?jǐn)?shù)l 結(jié)果參照又叫效標(biāo)參照。它是將效標(biāo)材料直接結(jié)合到測驗結(jié)果的解釋過程中。這種分?jǐn)?shù)適合于用測驗來作預(yù)測的情況。l 例如,高考平均分?jǐn)?shù)在80分(各科滿分為100分)以上的人,我們可以預(yù)測其入大學(xué)后的學(xué)習(xí)成績將為優(yōu)等。這里,是用結(jié)果來解釋測驗分?jǐn)?shù),而不是用常模和內(nèi)容來解釋。l 要得到結(jié)果參照分?jǐn)?shù)必須有兩個前提條件:l 需要有效度證據(jù),即測驗分?jǐn)?shù)必須與一個重要的效標(biāo)具有高相關(guān)?;脽羝?3l 要有將測驗分?jǐn)?shù)和效標(biāo)之間的關(guān)系結(jié)合起來的方法,如轉(zhuǎn)換圖表。l 例如,如果一個學(xué)生在大學(xué)入學(xué)考試委員會的學(xué)術(shù)測驗(SAT)上得530分,他在一所具體大學(xué)的一

27、年級平均成績處于A、B、C、D、F等類的可能性各是多少?考察預(yù)測分?jǐn)?shù)(SAT)對效標(biāo)成績(一年級平均成績)的雙變量分布,就能獲得這類信息。l 幻燈片54l 如果把這種雙變量分布的每個單元的人數(shù)轉(zhuǎn)換成百分比,結(jié)果就是期望表。l 例:預(yù)測分?jǐn)?shù)是第一學(xué)期末 “區(qū)別能力傾向測驗”中的數(shù)推理測驗(DAT),效標(biāo)則是第二學(xué)期最后一次考試的課程成績。數(shù)據(jù)從211名六年級學(xué)生中得出。測驗分?jǐn)?shù)和效標(biāo)的相關(guān)是0.60。 :(見下表)?;脽羝?5表:211名六年級學(xué)生DAT數(shù)推理測驗與數(shù)學(xué)課程成績之間的關(guān)系幻燈片569.3 測驗分?jǐn)?shù)的解釋9.3.1 如何看待測驗分?jǐn)?shù)的意義9.3.2 如何向受測者報告測驗分?jǐn)?shù) 幻燈片

28、579.3.1 如何看待測驗分?jǐn)?shù)的意義l 施測者進(jìn)行測驗結(jié)果的解釋必須:l 對所做的測驗(包括它的常模的代表性、信度、效度、難度等)要熟悉了解。l 對受測者的情況(文化程度、職業(yè)、是否可能接觸測驗中的有關(guān)問題等)也要有所了解。l 對當(dāng)時測驗的具體情況,例如是否有干擾,受測者當(dāng)時有無情緒波動或身體不適等情況的了解?;脽羝?8l 同一個分?jǐn)?shù)可能是由于不同原因造成的,應(yīng)結(jié)合以上三方面的因素對測驗分?jǐn)?shù)作出解釋。同一分?jǐn)?shù)可作出不同解釋。l 例如,用具有初中文化程度的標(biāo)準(zhǔn)化樣本常模的智力測驗來測量一個小學(xué)文化程度的受測者,如果測得IQ為85,就可以認(rèn)為他基本上是中等智力水平;如果受測者原來文化程度是大學(xué)畢

29、業(yè),也測得IQ為85,就可解釋為受測者可能由于某種原因而使智力有所減退,屬于中下水平?;脽羝?9l 解釋測驗分?jǐn)?shù)有4種類型:l (1)敘述的解釋:指描述個人的心理特征狀態(tài)。例如,這個學(xué)生是一位怎樣的學(xué)生,聰明的?中等的?或愚笨的?他的語文推理是否優(yōu)于非語文推理?他喜歡做些什么?有什么樣的性格特點?l (2)溯因的解釋:指追溯過去以解釋個人目前的發(fā)展情況。例如,他為什么會這樣?他的閱讀困難是否是情緒困擾的結(jié)果?或缺乏基本的閱讀技能?或缺乏學(xué)習(xí)的興趣?他拒絕機(jī)械的學(xué)習(xí)活動是否由于父母的壓力?或過去的失???或興趣太廣泛所致?幻燈片60l (3)預(yù)測的解釋:指推估個人未來的可能發(fā)展情形。例如,他上高中

30、的成績會怎樣?他升入大學(xué)的可能性有多大?他在理科方面的發(fā)展是否比在文科方面的發(fā)展更能成功?他是否可能成為一個問題青年?l (4)判斷(利評價)的解釋:指作價值的判斷或做決定。此種解釋是依據(jù)上述幾種解釋而作的判斷。例如,準(zhǔn)許入高中或大學(xué)。他應(yīng)該學(xué)習(xí)什么樣課程。進(jìn)什么樣大學(xué)。他應(yīng)該成為工程師或商務(wù)經(jīng)理?;脽羝?1l 解釋分?jǐn)?shù)的意義應(yīng)遵循的基本原則l (1)主試應(yīng)充分了解測驗的性質(zhì)與功能。測驗使用者必須具備心理測驗的基本知識。使用者在解釋之前必須從其編制手冊中,詳細(xì)了解編制過程的標(biāo)準(zhǔn)化及測驗的信度、效度、常模等是否適當(dāng)。更重要的,應(yīng)知道測驗?zāi)軠y量什么,不能測量什么,分?jǐn)?shù)在使用上有何限制。有時兩個測驗

31、的類型雖然相同,但測量的功能往往不同。l 例如,卡特爾測驗16PF與明尼蘇達(dá)多相人格調(diào)查表MMPI都是人格測驗,但后者更多地發(fā)揮臨床診斷的功能,前者則更多地針對正常人?;脽羝?2l (2)對導(dǎo)致測驗結(jié)果的原因的解釋應(yīng)慎重,謹(jǐn)防片面極端。l 遺傳特征、測驗前的學(xué)習(xí)與經(jīng)驗以及測驗情境對一個人的測驗成績都會產(chǎn)生影響。所以我們應(yīng)該把測驗分?jǐn)?shù)看成對受測者目前狀況的測量,至于他是如何達(dá)到這一狀況的,則受許多因素的影響。為了能對分?jǐn)?shù)作出有意義的解釋,必須將個人在測驗前的經(jīng)歷或背景因素考慮在內(nèi),比如,在詞匯上得到相同的分?jǐn)?shù),對于大城市的孩子與邊遠(yuǎn)山區(qū)的孩子具有不同的意義。 幻燈片63l (3)必須充分估計測驗

32、的常模和效度的局限性l 對測驗分?jǐn)?shù)作出確切的解釋,只有常模資料是不夠的,還必須有效度資料。沒有效度證據(jù)的常模資料,只告訴我們一個人在一個常模團(tuán)體中的相對等級,不能做預(yù)測或更多的解釋。在解釋分?jǐn)?shù)時人們最常犯的錯誤就是僅根據(jù)測驗的標(biāo)題和常模數(shù)據(jù)去推論測驗分?jǐn)?shù)的意義,而忽略效度的不足或缺乏。假若一個測驗的名稱是內(nèi)外向量表,并有可利用的常模資料,那么就很容易把得高分的人說成是內(nèi)向性格?;脽羝?4l (4)解釋分?jǐn)?shù)應(yīng)參考其他有關(guān)資料。測驗分?jǐn)?shù)不是了解學(xué)生的唯一資料,為正確了解其心理特質(zhì)尚需參考其他有關(guān)資料。l 例如,某生智力測驗上得到IQ為80,在不考慮其他資料的情況下,只能解釋:“某生的智力屬于中等偏

33、下”。但是,如果考慮他的在校成績時,解釋可能大不相同,如果他的在校成績經(jīng)常保持在年級前五名,則不可能作出如上的解釋,可能需要進(jìn)一步探討他在做測驗時的動機(jī),態(tài)度,情緒與健康狀況等,有了這些資料作為佐證,才能正確判斷其智力是否全部正常發(fā)揮,測驗結(jié)果是否可靠。幻燈片65l 解釋時亦可參考其它的測驗資料,只憑單一的測驗分?jǐn)?shù)加以解釋,可能全然不同于綜合考慮幾個測驗分?jǐn)?shù)。l 例如,根據(jù)自陳量表測驗的分?jǐn)?shù),某生的性壓抑分?jǐn)?shù)高于平均數(shù)兩個標(biāo)準(zhǔn)差;但在投射測驗中有關(guān)性的反應(yīng),卻高于平均數(shù)一個標(biāo)準(zhǔn)差,如僅依自陳量表的分?jǐn)?shù)解釋時,只能解釋說:“某生的性壓抑傾向甚強(qiáng)?!钡绻Y(jié)合投射測驗的分?jǐn)?shù)作出綜合解釋,則可解釋說

34、:“某生的性興趣強(qiáng)于一般人(投射測驗),但他卻將性興趣加以嚴(yán)重的壓抑(自陳量表)。 l 總之,測驗分?jǐn)?shù)的解釋應(yīng)盡可能多種資料相互參照,綜合評定?;脽羝?6l (5)對測驗分?jǐn)?shù)應(yīng)以“一段分?jǐn)?shù)”來解釋,而不應(yīng)以“特定的數(shù)值”來解釋。l 由于每個測驗均會受到測量誤差的影響,因此在解釋測驗分?jǐn)?shù)時也應(yīng)考慮到測量誤差的存在。測量誤差的大小與信度的高低有關(guān),信度越高,則誤差越小,但永遠(yuǎn)不可能完全消除誤差,因此,應(yīng)該把測驗分?jǐn)?shù)視為一個范圍而不是一些確定的點,也就是要對測驗分?jǐn)?shù)提供帶狀的解釋。倘若使用確切的分?jǐn)?shù),應(yīng)說明這些分?jǐn)?shù)不是精確的指標(biāo),而是我們對某人真實分?jǐn)?shù)的大體估計?;脽羝?7l (6)對來自不同測驗的

35、分?jǐn)?shù)不能直接加以比較。l 即使兩個測驗名稱相同,由于所包含的具體內(nèi)容不同(因而所測量的特質(zhì)不完全相同),建立標(biāo)準(zhǔn)化樣本的組成不同,量表的單位(如標(biāo)準(zhǔn)差)不同,其分?jǐn)?shù)也不具備可比性。如來自兩個智力測驗的分?jǐn)?shù),在沒有其他信息的情況下,我們無法判斷誰高誰底。必須把它們放在統(tǒng)一的量表上進(jìn)行比較?;脽羝?8 具體做法是:將兩個測驗都對同一個樣本進(jìn)行施測,并把兩種測驗的原始分?jǐn)?shù)都轉(zhuǎn)換成百分等級,然后用該百分等級作為中轉(zhuǎn)點,就可以做出一個等價的原始分?jǐn)?shù)表。 如果某人在測驗A中原始分?jǐn)?shù)55是90百分等級,而測驗B中原始分?jǐn)?shù)36也是90百分等級,那么他在測驗A獲得的55分就與在測驗B 獲得的36分等值?;脽羝?

36、99.3.2 如何向受測者報告測驗分?jǐn)?shù)l 如何向當(dāng)事人及與當(dāng)事人有關(guān)的人員(如家長,教師,雇主等)報告測驗分?jǐn)?shù),使他們更好地理解分?jǐn)?shù)的意義是一件非常重要的事,下面所列舉的一些原則,可供報告測驗分?jǐn)?shù)時作參考。l 使用當(dāng)事人所理解的語言l 測驗具有自己的詞匯,你所理解的詞并不意味著當(dāng)事人也一定理解。你懂得標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)分?jǐn)?shù),然而當(dāng)事人可能不懂。因此你必須用非技術(shù)性的用語來解釋標(biāo)準(zhǔn)分?jǐn)?shù),可以把它解釋成相對位置(如百分等級)?;脽羝?0l 要保證當(dāng)事人知道測驗的目的 l 這里并不需要作詳細(xì)的技術(shù)性解釋。l 如果分?jǐn)?shù)是以常模為參考的,就要使當(dāng)事人知道他是和什么團(tuán)體在進(jìn)行比較。l 例如,同一個百分等級對于普

37、通學(xué)校和重點學(xué)校其意義是不同的。幻燈片71l 要使當(dāng)事人認(rèn)識到分?jǐn)?shù)只是一個估計。l 由于測驗的信度、效度不足,分?jǐn)?shù)可能有誤差,而且對于一個團(tuán)體總體來說有效的測驗,不一定對每個人都同樣有效,但也不能讓受測者感到分?jǐn)?shù)是毫不可信的?;脽羝?2l 要使當(dāng)事人知道如何運用他的分?jǐn)?shù)l 當(dāng)測驗用于人員選拔和安置問題時這點是特別重要的。要向當(dāng)事人講清測驗分?jǐn)?shù)在作決定過程中起什么作用,是完全由分?jǐn)?shù)決定取舍,還是只把分?jǐn)?shù)作為參考;有沒有規(guī)定最低分?jǐn)?shù)線;測驗上的低分?jǐn)?shù)能否由其他方面補(bǔ)償?shù)鹊??;脽羝?3l 要考慮測驗分?jǐn)?shù)將給受測者帶來什么心理影響。l 由于對分?jǐn)?shù)的解釋會影響受測者的自我認(rèn)識、自我體驗和自我評價,所以在解釋分?jǐn)?shù)時要把對分?jǐn)?shù)意義的解釋和必要的咨詢工作結(jié)合起來?;脽羝?4l 測驗結(jié)果應(yīng)向無關(guān)的人員保密l 當(dāng)事人的測驗分?jǐn)?shù)不應(yīng)讓其他無關(guān)的人員知道,以免對當(dāng)事人造成不良的影響。因此,分?jǐn)?shù)的報告采用個人的解釋為宜,不宜采用團(tuán)體解釋或公告通知的方式行之。l 報告測驗分?jǐn)?shù)時設(shè)法了解當(dāng)事人的心理感受。l 報告測驗分?jǐn)?shù)時,宜先讓當(dāng)事人充分表達(dá)測驗時的心理感受,如他的動機(jī)、態(tài)度、情緒、注意、健康等,以便知道他的測驗分?jǐn)?shù)是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論