版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、一、基本介紹(第一章、第二章)第一章 心理與教育測量概論第一節(jié) 測量概述一、測量的定義:依據(jù)一定的法則使用量具對事物的特征進行定量描述的過程。四個方面:(1)測量的法則給事物屬性分派數(shù)字的依據(jù)(2)測量的對象事物的屬性或特征(3)量具測量工具(4)測量的結(jié)果描述事物屬性的數(shù)字或符號二、測量的要素(重要)(1)參照點絕對零點 相對零點(2)單位理想的單位必須符合的兩個條件:有確定的意義;有相等的價值,即相鄰兩個單位之間的差別總相等。三、四種測量水平和測量量表(重要)類別量表:簡單進行分類。次數(shù)統(tǒng)計:百分比,X2檢驗。等級量表:順序量表,分等級,除次數(shù)統(tǒng)計外,中位數(shù)、百分位數(shù)、等級相關(guān)、肯德爾和諧
2、系數(shù)、秩次變差分析。等距量表:單位等值,但沒有絕對零點,可進行加減運算。T檢驗、F檢驗、積距相關(guān)、均數(shù)、變差等。等比量表:最高水平的測量,以上統(tǒng)計方法、幾何平均數(shù)、相對差異量。第二節(jié) 心理與教育測量的性質(zhì)一、心理與教育測量的定義二、心理與教育測量的理論基礎(chǔ)三、心理與教育測量的水平(重要)心理測量屬于哪一種水平的測量,為什么?心理測量是順序量表原因:(1)使用的參照點:心理測量領(lǐng)域的參照點均為相對參照點。(2)使用的單位:意義不太明確;單位常常不等值四、心理與教育測驗(重要)心理測驗實質(zhì)是對行為樣本客觀化標準化的測量.簡述心理測驗的基本條件,測驗為什么要標準化,怎樣保證測驗的標準化?(1)行為樣
3、組:被抽取出來的作為直接的測量對象的行為。(2)標準化:為什么要進行標準化?有可比性;怎樣保證測驗的標準化?測驗內(nèi)容、施測條件、評分規(guī)則、測驗常模。(3)難度或應(yīng)答率:對題目分析的指標。如智力測驗的項目的難度,態(tài)度測驗的項目的應(yīng)答率。(4)信度和效度:是否科學的重要指標。第三節(jié) 測驗的類型與功能 1.按測量的對象分類:認知測驗(又稱能力測驗);智力測驗,能力傾向測驗(又稱性向測驗),教育測驗(又稱成就測驗);人格測驗。2.按測量的方式分類:個別測驗 ,團體測驗團體測驗可個別施測,但個體測驗不能以團體方式實施。3.按測驗內(nèi)容的形式分類:語言或文字測驗,非語言或操作性測驗。4.按測驗功能分類:成就
4、測驗與預(yù)測測驗;按測驗的難度分類:速度測驗,難度測驗。5.按評價所參照的標準分常模參照測驗:此種測驗是將一個人的分數(shù)常模比較,看其在某一團體中所處的位置。標準參照測驗:將被試的分數(shù)與某種標準進行比較來解釋。各種專業(yè)資格測驗都屬于標準參照測驗測驗。6.按測驗要求分類:最高行為測驗,典型行為測驗,潛力參照測驗。投射測驗和瑞文測驗為非語言測驗,韋氏測驗既包含語言又包含非語言,復本信度為最高行為測驗。重點總結(jié)1.心理測量屬于哪一種水平的測量,為什么?2.簡述心理測驗的基本條件。3.測驗為什么要標準化,怎樣保證測驗的標準化?4.什么是常模參照測驗和標準參照測驗。第二章 心理與教育測量的歷史1.孟子最早對
5、心理能力和心理特征的可測量性進行了明確表述。(權(quán),然后知輕重;度,然后知長短。物皆然,心為甚。)2.高爾頓是直接推動測驗運動發(fā)展的第一人。3.1890年卡特爾撰文,使“心理測驗”一詞首次出現(xiàn)于心理學文獻中;4.1905年編制第一個智力量表是比內(nèi)-西蒙智力量表。5.比內(nèi)是心理測驗的鼻祖。二、經(jīng)典測驗介紹(第十二章十五章)第十二章 智力測驗第一節(jié) 智力測驗概述一、智力實質(zhì)的探討二、智力測驗的實踐探索1、高爾頓和生理計量法: 以感覺敏銳度為指標測量智力2、比奈和智力年齡:第一個心理取向的智力測驗;首次采用智齡。3、推孟和比率智商:智商=心理年齡/實足年齡×1004、韋克斯勒與離差智商:同年
6、齡組的標準分,根據(jù)同年齡組測得的平均分和標準差計算。離差智商把某一個兒童的智力與同齡伙伴相比后,算出它們的離差;比率智商是把兒童智力與同齡伙伴相比后,算出它們的比率。判斷:比奈智力測量是世界上第一個智力測驗,首次使用智商的概念。 三、對傳統(tǒng)智力測驗的評價第二節(jié) 常用智力測驗介紹(重要)一、中國比內(nèi)量表(1)測試對象:適合2歲到18歲; (2)測驗內(nèi)容:51道題,每歲3個項目,最適合測查小學生和初中生的智力水平。題目由易到難排列。(3)實施過程:計算被試的實足年齡,幾歲幾個月(出生年月日);實足年齡的計算:用測驗的年、月、日減去出生的年、月、日。凡超過15天或整15天的日數(shù)按一月計,不足15天的
7、一律不計。根據(jù)實足年齡,查尋開始的題目;嚴格遵守指導書的記分標準記分。答對1題得1分,連續(xù)5題未通過即停止。計算測驗總分時,除了累加答對的題目分外,還要補加一定的分數(shù)。根據(jù)實足年齡和總分,從智商表中查出相應(yīng)的智商分數(shù)。(離差智商)(4)施測注意事項:施行測驗之前,應(yīng)安排好一間安靜房子,內(nèi)設(shè)一桌兩凳。施測時主試、被試對坐。主試可將指導書立在面前,以免被試窺視主試的記錄,思想受到擾亂。主試者對被試者必須保持和善態(tài)度。對于被試的有關(guān)試題內(nèi)容的探索性問題,一概支吾過去,比如對他說:“你自己想一想”。對于他的答案,不論對與不對,都不要表示肯定或否定的神態(tài),以免影響他的測驗結(jié)果。主試必須按照各試題的時限控
8、制時間,不可隨意延長或縮短。時限不包括主試用的時間。記錄要盡量錄被試者原話,以便根據(jù)真實材料核對分數(shù)。在測驗進行過程中,主試者除按指導語讓被試者回答試題外,凡屬閑話,一概不說。(5)結(jié)果評價指標:智齡(6)評價:直觀,易理解,但不同年齡組間不好比較。二、韋克斯勒智力量表:(1)適用對象:韋式成人量表、韋式兒童量表、韋式學齡前兒童和學齡初期兒童智力量表(2)測驗內(nèi)容(成人智力測驗各分測驗的具體實施方法):知識(常識)分測驗;領(lǐng)悟(理解)分測驗;算術(shù)分測驗;相似性(類同)分測驗;數(shù)字廣度分測驗;詞匯(定義)分測驗;數(shù)字符號(譯碼)分測驗;圖畫填充分測驗;積木拼圖分測驗;圖片排列分測驗;圖形拼湊(拼
9、板)分測驗。(3)施測注意事項:施測程序和時間n 兒童:言語測驗和操作測驗交叉進行;成人測驗一般先言語后操作測驗。n 時間:大約55-80分鐘,盡可能一次施測完,分兩次進行,間隔時間不要超過一周n 測驗時間要選擇恰當,被試者應(yīng)在精力充沛、身體舒適、沒有急事的時候來接受測驗。測驗場所n 除主試和被試外不得有第三者在場,隔桌對坐。施測前的注意事項n 檢查所有材料n 填寫個人資料,年齡應(yīng)準確計算。n 在場,隔桌對坐。測試過程中注意事項n 有些測驗項目在計分紙上寫下答案,測驗過后評分n 記錄特殊問題,如被試的不合作態(tài)度,測驗中斷的原因,語言障礙,左利手等。(4)記分方法:原始分的獲得¨ 注意
10、時間限制:算術(shù)、圖片排列、木塊圖案、物體拼湊、數(shù)字符號和圖畫填充有時間限制。以反應(yīng)的速度和正確性作為評分依據(jù),超時即使通過也記0分,提前完成的按提前時間的長短記獎勵分。¨ 不限時間的項目,則按反應(yīng)的質(zhì)量給予不同的分數(shù)。 原始分換算成量表分¨ 分測驗:轉(zhuǎn)化成平均數(shù)為10,標準差為3的量表分(可查表)。¨ 言語測驗和操作測驗的量表分相加,得言語量表分和操作量表分。 言語量表分+操作量表分=全量表分 量表分算成智商分數(shù)¨ 量表分+年齡(查表)換算成言語智商、操作智商和總智商。(5)評價:n 優(yōu)點:¨ 能較好地反映一個人智力的全貌和測量各種智力。
11、68; 用離差智商代替比率智商,克服了計算成人智商的困難。n 缺點:¨ 測驗的起點偏難,有的分測驗(如相似性測驗)方法對低智力者難以說明,故不便測量低智力者。¨ 有的分測驗項目過多(如詞匯測驗),增加測驗時間;有的相反,項目過少(如物體拼湊測驗),難以調(diào)整項目難度。三、瑞文智力測驗(團體智力測驗):使用百分等級(1)測驗功能:非文字智力測驗,主要測驗一個人的智力觀察力和清晰邏輯推理能力。(2)適用對象n 漸進矩陣標準型SPM(5.5歲以上正常人)n 漸進矩陣彩色型(幼兒和智力水平低的人)n 漸進矩陣高級型(高智力水平的人)(3)測驗內(nèi)容整個測驗共有60張圖組成,按逐步增加難
12、度的順序分成A、B、C、D、E五組,每組都有一定的主題,題目的類型略有不同。從直觀上看,· A組主要測知覺辨別力,圖形比較,圖形想象力等;· B組主要測類同比較,圖形組合等;· C組主要測比較推理和圖形組合;· D組主要測系列關(guān)系,圖形套合,比擬等;· E組主要測互換、交錯等抽象推理能力。 (4)施測注意事項:· 一般沒有時間限制,但在必要時也可限制時間。· 在個別測驗時,如果記錄下測試所用時間,并分析其錯誤的特性,還可以有助于了解被試者的氣質(zhì),性格和情緒等方面的特點。· 一般人完成瑞文標準推理測驗大約需要半小時,
13、最好在45分鐘之內(nèi)完成。(5)記分方法(評估指標)一級:測驗標準分等于或超過同年齡常模組的95%,為高水平智力二級:測驗標準分在75%與95%之間,智力水平良好三級:測驗標準分在25%與75%之間,智力水平中等四級:測驗標準分在5%與25%之間,智力水平中下五級:測驗標準分低于5%,為智力缺陷(6)評價l 適用范圍廣 l 使用方便,經(jīng)濟,且測驗結(jié)果比較可靠。 l 較高的信度和中等效度。四、希內(nèi)學習能力測驗:測量對象:3-16歲的聾啞兒童。不要求被試用言語或文字回答,全部采用操作的方式,測智力的G因素。第三節(jié) 智力測驗的新發(fā)展重點理解:1.中國比內(nèi)量表:適用對象、施測過程、施測注意事項、結(jié)果評價
14、指標、評價。2.韋克斯勒智力量表:適用對象、測驗內(nèi)容、施測注意事項、記分方法、評價。 3.瑞文智力測驗:測驗功能、適用對象,測驗內(nèi)容、施測注意事項、記分方法、評價。第十四章 人格測驗第一節(jié) 人格測驗概述一、人格與人格測驗二、人格測驗的發(fā)展1、前科學水平:顱相學、相面術(shù)、筆跡學2、科學探索:1884年,高爾頓首先提倡用科學方法測量人格。心律和脈律的變化測量情緒;情景觀察分析人的性情、脾氣。1905年,榮格用詞語聯(lián)想測驗檢查和分析了心理情結(jié);1919年,武德沃斯發(fā)表第一個自陳人格量表個人資料調(diào)查表;1920年,羅夏墨跡測驗問世;1943年,明尼蘇達多相人格問卷MMPI;1956年,卡特爾人格因素問
15、卷16PF1975年,艾森克EPQ三、人格測驗的種類(重要)1、問卷式人格測驗: 自陳量表; 評定量表。2、投射測驗;3、其他方法: 客觀測量(生理測量、知覺和認知測量);行為觀察(特殊觀察技術(shù)、情景測驗、非語言行為、晤談法)。自陳量表的種類(編制方法):1.內(nèi)容效度人格問卷(邏輯法)q 根據(jù)某種人格理論,確定所要測量的特質(zhì),用邏輯分析的方法編寫和選擇一些看起來能測驗這些特質(zhì)的題目。步驟:(1)確定所要測量的特質(zhì)美國默瑞的人類需求理論人的15種需要和動機:自責、接近他人、攻擊、自主、求變、關(guān)注他人、支配、執(zhí)著、表現(xiàn)、異性戀、內(nèi)省、幫助他人等。(2)編寫一些看來能測這些特質(zhì)的題目。舉例:1.當我
16、的朋友有麻煩時,我喜歡幫助他們。 對我所承擔的一切事情,我都盡我最大的努力去做。2.因素分析人格問卷q 依據(jù)因素分析的統(tǒng)計結(jié)果來選取題目。步驟: (1)先給被試施測大量題目;(2)統(tǒng)計分析得出幾個因素(相關(guān));(3)一種因素代表一種人格特質(zhì),根據(jù)題目內(nèi)容進行因素命名;舉例:卡特爾人格因素問卷16PF3.經(jīng)驗效標人格問卷q 不是從某種理論出發(fā),而是完全依據(jù)經(jīng)驗來選擇題目。步驟: (1)根據(jù)經(jīng)驗選擇題目;(2)抽取已公認為不同類型的幾組被試,施測題目。(3)選出那些能把不同類型被試區(qū)分開的題目組成人格測驗。舉例:明尼蘇達多相人格問卷第二節(jié) 自陳人格量表自陳量表的特點:題量較大,多數(shù)用于測量人格的若
17、干特質(zhì)。通常采用紙筆測驗。操作簡單,容易評分,易于掌握。人格自陳量表的問題:人格自陳量表的主要問題反應(yīng)偏差(response bias)Ø 反應(yīng)定勢(response set):受測者有意識或無意識地“扭曲”其對測驗項目的反應(yīng),從而塑造出一種其內(nèi)心中所希望顯現(xiàn)的形象,而這一形象并不真正代表他自己。 主要有掩飾、裝壞、偽裝等,社會贊許傾向。編制時可采取的對策ü 避免反應(yīng)定勢:題目盡量選擇不誘發(fā)假裝傾向的題目,以減少測題的社會評價意義,避免引起心理防衛(wèi)和反感。選擇表面效度和內(nèi)容效度適當分離的題目注意量表的名稱安排測題的選答方式創(chuàng)設(shè)使受測者老實回答的情景設(shè)置防偽題組成各種防偽量表
18、一、艾森克人格問卷(EPQ)(重點)EPQ分為成人和幼年兩套問卷,龔耀先修訂。各包括精神質(zhì)(P)、內(nèi)外向(E)、神經(jīng)質(zhì)(N)和說謊(L)四個量表,均為88個項目。1、計分方法(原始分的計算):P量表分;E量表分;N量表分;L量表分。2、標準分的轉(zhuǎn)換T=50+10*(X-MD)/SD 查表:獲得平均數(shù)和標準差3、結(jié)果解釋當T=50時為同齡人的平均值根據(jù)計學方法計算: T分在43.356.7占50%, 38.561.5占75%各維度的典型人格特征(1)典型外向(E分特高)表現(xiàn)為:愛社交、朋友多、喜歡冒險、追求剌激、不甘寂寞、好談笑、沖動行事不愛做研究工作,喜歡實際的工作,反應(yīng)迅速,隨和,但情緒容易
19、失去控制,做事粗心,從外表看似乎是一個不太可靠的人。(2)典型內(nèi)向(E分特低)表現(xiàn):保守,交際不廣,但有摯友,好靜,做事瞻前顧后,行為不易受沖動的影響,不喜歡剌激,喜歡有秩序的生活和工作,極少發(fā)脾氣,做事有計劃,情緒傾向于悲觀(3)典型的情緒不穩(wěn)(N分特高)表現(xiàn)為:焦慮、緊張,易怒,往往又有抑郁,對各種剌激的反應(yīng)都過于強烈,情緒被激發(fā)后以很難平復下來,好抱偏見,常患有多種心身障礙。(4)情緒極穩(wěn)(N分特低)表現(xiàn)為:情緒反應(yīng)緩慢,不強烈,而且容易平復,很難生氣,在一般人難以忍耐的剌激下也有所反應(yīng),但不強烈。(5)P分高表現(xiàn)為:獨身,不關(guān)心人,常到哪里都覺得不合適,有的可能表現(xiàn)為殘忍,不人道,缺乏
20、同情心,對人常抱有敵意,攻擊性強,喜惡作劇。兒童:好惡作劇,很麻煩,缺乏是非感,令人討厭的調(diào)皮。(6)L分高表現(xiàn)為:測量被試的掩飾或自身隱蔽,或測定其社會性樸實幼稚的水平。高分者,表示有掩飾性,也可能較成熟老練,它本身代表一種穩(wěn)定的人格功能。二、卡特爾人格因素問卷(16PF)三、明尼蘇達多相人格問卷(MMPI)明尼蘇達多相人格調(diào)查表最新研究與多類量表解釋(紀術(shù)茂 戴政生 科學出版社)功能:幫助醫(yī)生在短時間內(nèi)對病人進行全面的客觀檢查和分類。測查個體的人格特點,判別精神病患者和正常者。編制者:美國的郝茲威和莫金利時間:20世紀40年代初期內(nèi)容(分量表簡介):題目:566題,其中16個重復題目,用于
21、檢驗被試反應(yīng)的一致性,看作答是否認真,實際只有550題。10個臨床量表: 1、疑病 2、抑郁 3、癔病 4、病態(tài)人格5、男性化女性化 6、妄想 7、精神衰弱8、精神分裂癥 9、輕躁狂 10、社會內(nèi)向8個臨床量表編制時標準組是精神病人,5.10不是。4個效度量表: (用于識別被試是否作假)第三節(jié) 投射測驗一、理論假設(shè)(1)人們對外界刺激的反應(yīng)都是有原因且可以預(yù)測的;(2)個人的反應(yīng)固然取決于當時的刺激和情景,反映者過去的人格特征、他當時的心理狀態(tài)以及他對未來的期望等心理因素會滲透在他對刺激的反應(yīng)過程及結(jié)果中。(3)人格結(jié)構(gòu)的大部分處于潛意識中,通過向受測者提供意義模糊的情景,讓受測者解釋,來獲得
22、對其人格的認識。二、基本分類聯(lián)想型:要求受試說出刺激(如字詞或墨跡)引起的聯(lián)想。字詞聯(lián)想測驗和墨跡測驗。構(gòu)造型:要求受試者針對某種情景或圖片編制一些故事。如主題統(tǒng)覺測驗。完成型:要求被試將測驗中未完成的語句或其他作業(yè)加以完成。如語句完成測驗。表露型:要求被試利用某種媒介(繪畫、游戲、心理劇等)自由表露他的心理狀態(tài),如畫人測驗等。選排型:要求被試根據(jù)某一準則選擇項目,或作各種排列。可用圖畫、照片、數(shù)字等作為刺激項目。理解:人格測驗的發(fā)展歷史;人格測驗的種類;MMPI問卷的內(nèi)容;投射測驗的類型;自陳人格量表的特點;自陳人格量表編制中的問題。掌握:自陳人格量表的分類(編制);自陳人格量表編制中的策略
23、;EPQ的使用及解釋;投射測驗的理論假設(shè)。第十五章 其他心理與教育測量國內(nèi)常用心理健康量表總結(jié)心理健康綜合評鑒工具| 主要是癥狀自評量表(SCL-90)、心理健康診斷測驗(MHT)、Achenbach兒童行為量表(CBCL)。對情緒及相關(guān)問題的評鑒工具| 依次為狀態(tài)-特質(zhì)焦慮量表(STAI)、考試焦慮量表(TAS)、抑郁自評量表(SDS)常用人格特點的評鑒工具| 卡特爾16種人格因素量表(16PF)、艾森克人格問卷(EPQ)、大五人格量表(BFI)、王登峰和崔紅編制的大七人格因素量表(QZPS)。第一節(jié) 焦慮測驗一、顯性焦慮量表二、狀態(tài)特質(zhì)焦慮量表STAI| 1970年由斯皮而博格編制。| 內(nèi)
24、容: 1.狀態(tài)焦慮,評定人們“現(xiàn)在”或最近一個特定時間內(nèi)的感受或人們將要遇到特別情景時的感受;一般為短暫性的。 2.特征焦慮:用來描述相對穩(wěn)定的、作為一種人格特質(zhì)、具有個體差異的焦慮傾向。適用于焦慮癥者。| 施測:如果兩個測驗都做,最好先做狀態(tài)焦慮,再做特征焦慮。三、測驗(考試)焦慮量表TAI| 斯皮爾伯格,把測驗焦慮看成是特質(zhì),看成個體的焦慮傾向性。| 內(nèi)容: W因素(憂慮性) :指對失敗結(jié)果的認知。 E因素(情緒性):指由評價的緊張所引起的自主性神經(jīng)系統(tǒng)反應(yīng)。 要求被試報告他們在考試之前、之中、之后所經(jīng)歷的怎樣程度的焦慮體驗。 四、臨床焦慮量表1、貝克焦慮量表| 1985年由貝克等人編制,
25、適合具有焦慮癥狀的成年人。共21個條目。| 施測: 1評定時間范圍應(yīng)是“現(xiàn)在”或“最近一周”內(nèi)的自我體驗。 2應(yīng)仔細評定結(jié)果,不要漏項或重復評定。 3可隨臨床診治或研究需要反復評定,一般間隔時間至少一周。| 計分:4點評分。Y=INT(1.19X),大于45分即為陽性。2、漢密頓焦慮量表(唯一的一個他評量表)| 漢密頓1959年編制,用于評定神經(jīng)癥和其他病人的焦慮嚴重程度,5點評分,| 施測人員:受過訓練的評定員。| 一種醫(yī)生用焦慮量表,最經(jīng)典的焦慮量表,在同類量表中,使用歷史最長,用得最多。 第二節(jié) 興趣測驗一、斯特朗職業(yè)興趣問卷二、庫德職業(yè)興趣調(diào)查表三、自我指導問卷(霍蘭德職業(yè)興趣量表)|
26、 1959年,Holland指出,個體的人格特征和背景因素決定了他的職業(yè)選擇方向,職業(yè)選擇是個體人格的一種表現(xiàn)方式。| 核心思想:個體趨于選擇最能滿足個人需要、實現(xiàn)職業(yè)滿意的職業(yè)環(huán)境。理想的職業(yè)選擇是使人格類型與職業(yè)類型相互協(xié)調(diào)和匹配。第三節(jié) 態(tài)度測驗一、等距量表法二、李克特量表法(等級評定)| 問卷設(shè)計中運用十分廣泛的一種量表。| 不是受訪者對這些問題的態(tài)度是簡單的同意或不同意兩類,而是將贊成度分為若干類,范圍從非常贊成到非常不贊成,中間為中性類。| 它通過回答選項的類型增多,人們在態(tài)度上的差別就能充分體現(xiàn)出來。 三、內(nèi)隱聯(lián)想測驗第三節(jié) 品德的測量三、經(jīng)典測驗理論(第三章第十章)第三章 經(jīng)典
27、測量理論的基本假設(shè)第一節(jié) 心理特質(zhì)及其可測性假設(shè)第二節(jié) 測量誤差及其來源(重要)一、誤差的含義測量中由那些與測量目的無關(guān)的變化因素所產(chǎn)生的不準確或不一致的測量效應(yīng)。二、誤差的種類Ø 隨機誤差:由與測驗?zāi)康臒o關(guān)的、偶然因素引起的又不易控制的誤差。測量誤差,使測量結(jié)果既不一致又不準確。Ø 系統(tǒng)誤差:由與測量目的無關(guān)的變因引起的恒定的、有規(guī)律的效應(yīng)。存在于每一次測量之中,影響測量的準確性,不影響穩(wěn)定性。三、誤差的來源測量研究的任務(wù):研究如何控制測量的誤差。Ø 測量工具:量表是否穩(wěn)定、是否真正測到了要測量的東西。Ø 測量對象:生理和心理因素。比如:應(yīng)試動機;焦慮
28、;測驗經(jīng)驗。Ø 測驗實施過程:物理環(huán)境;主試方面;意外干擾;評分不客觀,計算、登記分數(shù)出錯。第三節(jié) 真分數(shù)模型及其假設(shè)(重要)一、真分數(shù)的含義n 反映被試某種心理特質(zhì)真正水平的那個數(shù)值稱為該特質(zhì)的真分數(shù)(T)n 實際測量得到的分數(shù)稱為觀察分數(shù)(X)真分數(shù)只是一個理論概念,實際測量中無法得到。無論什么測量工具都不可能沒有誤差。真分數(shù)理論n 真分數(shù)理論,又稱經(jīng)典測量理論,認為人的心理特質(zhì)水平經(jīng)測量之后應(yīng)表現(xiàn)為一個數(shù)值。但是,由于測量誤差的存在,實際測得的數(shù)值往往不會剛好等于該特質(zhì)的真實水平,它總會略高于或略低于其真實水平值,有時甚至嚴重偏離。該理論把反映被試某種心理特質(zhì)真正水平的那個數(shù)值
29、稱作該特質(zhì)的真分數(shù)(簡稱為T分數(shù)),把實測的分數(shù)稱作該特質(zhì)的觀察分數(shù)(X),而兩者之間的差異是一個隨機誤差(E)。觀察分數(shù)與真分數(shù)之間是一種線性關(guān)系,由此得出真分數(shù)理論模型:X=T+E。二、數(shù)學模型及假設(shè)Ø CTT的數(shù)學模型:XTE 觀察分數(shù)(X)與真分數(shù)(T)之間是一種線性關(guān)系,并只相差一個隨機誤差(E)三大基本假設(shè):n 如果一個人的某種心理特質(zhì)可以用平行測驗反復測量足夠多次,則其觀察分數(shù)的平均值會接近于真分數(shù)。(平行測驗:兩個題目不同的測驗測的是同一特質(zhì),并且題目形式、數(shù)量、難度、區(qū)分度以及測查等值團體后所得分數(shù)的分布都一致。)n 真分數(shù)和誤差分數(shù)之間的相關(guān)為零。n 各平行測驗上
30、的誤差分數(shù)之間相關(guān)為零。理解:誤差的種類;測量誤差的來源。掌握:什么是真分數(shù)理論?第四章 測量信度第一節(jié) 信度概述(重點)一、信度的定義信度是對測量一致性程度的估計。用同一測量工具反復測量某人的同一種心理特質(zhì),多次測量結(jié)果間的一致性程度就叫信度,也叫可靠性。信度達到多高才算可靠?能力或?qū)W績測驗、學習成就測驗信度應(yīng)在0.90以上;性格、興趣、價值觀等人格測驗信度應(yīng)在0.80以上。二、信度的作用(1)信度是測量過程中存在的隨機誤差大小的反映(2)信度可以用來解釋個人測驗分數(shù)的意義(3)信度可以幫助進行不同測驗分數(shù)的比較第二節(jié) 估計信度的方法(重點)一、重測信度1、含義:一組被試在不同時間用同一測驗
31、測量兩次,兩次測驗分數(shù)的相關(guān)系數(shù)。2、誤差來源:(1)測驗本身:測驗所測的心理特性是否穩(wěn)定;(2)被試方面:成熟、知識的發(fā)展,練習因素、記憶效果;(3)施測過程:每次施測是否完全一致,如意外干擾、記時錯誤;主要誤差來源:時間造成的被試狀態(tài)和施測情境的變化。3、適用條件:人格、心理健康、社會調(diào)查等典型行為測驗適合;智力測驗不適合短期重測(一般6個月);學科測驗不適合重測。同一量表在不同的重測時間得到的重測信度是否相同?二、復本信度1、含義:又稱等值系數(shù),是指兩個平行測驗測量同一批被試所得結(jié)果的一致性程度。2、誤差來源:(1)測驗本身:測題取樣、格式、內(nèi)容、題數(shù)、難度、區(qū)分度等是否一致;(2)被試
32、方面:情緒波動、動機變化;(3)施測過程:意外干擾.主要誤差來源:測驗題目造成的不一致。穩(wěn)定等值系數(shù):經(jīng)過一段時間后,再實施復本測驗。穩(wěn)定等值系數(shù)往往要低于重測信度和復本信度。3、適用條件:適合學科測驗;不適合人格測驗、社會調(diào)查。很難編制復本三、內(nèi)在一致性信度跨項目(使用最多)1、含義:又稱內(nèi)部一致性系數(shù),反映測驗內(nèi)部的一致性,即項目的同質(zhì)性。包括分半信度和同質(zhì)性信度。2、計算:(1)分半信度一個測驗分成對等的兩半后,所有被試在這兩半上所得分數(shù)的一致性程度。注意:當一個測驗無法分成對等的兩半時,分半信度不宜使用。不同的分半方法,分半信度不同。(2)同質(zhì)性信度實際是求所有題目間的一致性程度。庫德
33、理查遜公式;克隆巴赫系數(shù)(通用公式,使用最多)四、評分者信度跨評分者一般要求在成對的受過訓練的評分者之間,其平均一致性達到(0.9)以上,才認為評分是客觀的。幾種信度處理的主要誤差類型 重測信度時間取樣(跨時間)復本信度(連續(xù)施測)內(nèi)容取樣(跨形式)復本信度(間隔施測)時間與內(nèi)容取樣分半信度內(nèi)容取樣(跨項目)同質(zhì)性信度內(nèi)容取樣(跨項目)評分者信度評分者間的差異(跨評分者)練習:1.同質(zhì)性信度主要代表測驗內(nèi)部(C)間的一致性。 A兩半測驗 B題目與分測驗 C所有題目 D分測驗2.信度只受(B)的影響。A系統(tǒng)誤差 B隨機誤差 C恒
34、定效應(yīng) D概化理論3.重測信度即(B)。A等值系數(shù)(B)穩(wěn)定性系數(shù)(C)相關(guān)系數(shù)(D)X 系數(shù)4.在不同時間內(nèi)用同一測驗重復測量同一被試者,所得結(jié)果的一致程度稱為(A)。(A)信度 (B)效度 (C)難度 (D)區(qū)分度第三節(jié) 提高測量信度的方法(重點)一、影響測量信度的因素被試、主試、施測情境、測量工具、施測間隔的時間二、提高測驗信度的常用方法(1)適當增加測驗的長度(2)控制試題的難度分布,中等水平(3)努力提高每道題的區(qū)分度(4)選取恰當?shù)谋辉噲F體,努力提高測驗在被試中各個同質(zhì)亞團體上的信度(5)規(guī)范施測程度、嚴格控制評分誤差,統(tǒng)一施測環(huán)境。適當增加測驗的長度:測驗長度的增加與信度的提高不
35、是等比例的報酬遞減增加測驗長度與信度提高之間關(guān)系的公式:例:有一包含10題的測驗,其信度系數(shù)為0.30,若把測驗增加到原測驗長度的3倍,那么新測驗的信度系數(shù)應(yīng)該是多少?例:原測驗共10題,信度系數(shù)為0.30,如要把測驗信度系數(shù)提高到0.94,需要把原測驗延長多少倍?增加多少題?結(jié)論:分數(shù)分布范圍越寬,信度系數(shù)就越高。 注意:當某測驗在一個團體中有較高的信度時,在另一個團體中也具有較高的信度。 “某測驗的信度是0.92” 。() “某測驗的信度系數(shù)為0.92,該數(shù)值是通過計算一份能力測驗間隔兩周兩次測試成績的相關(guān)系數(shù)得出的。數(shù)據(jù)來源是從某市隨機抽取的500名小學5年級的學生施測”。()理解:1.
36、什么是測量的信度?2.信度的作用 3.信度的估計方法有哪些?它們的主要誤差來源是什么?適用條件(適用于哪種測驗)?掌握:4.影響信度的因素有哪些?5.提高測量信度的方法有哪些?學會計算提高測驗長度提高測驗信度第五章 測量效度第一節(jié) 效度的概述一、效度的定義一個測驗對其所要測量的特性測量到什么程度的估計。(科學測量工具最重要的條件)二、效度的性質(zhì)· 效度是針對測驗結(jié)果的;· 效度是針對某種特定的測驗?zāi)康牡模?效度是一個相對的概念,即相對于某種特殊用途,具有較高或較低的效度。 關(guān)系1:高信度是高效度的必要條件,而不是充分條件。關(guān)系2:信度系數(shù)的平方根(信度指數(shù))是效度系數(shù)的最高
37、限度。 第二節(jié) 效度的估計一、內(nèi)容效度· 含義:指一個測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度;· 關(guān)注的是測驗的內(nèi)容方面。· 測題取樣的代表性是主要考察的方面。(一)驗證內(nèi)容效度的方法· 1.邏輯分析法(專家評定法):讓一組獨立的專家判斷測題與所研究內(nèi)容的吻合程度(即題目的代表性)。· 2.克隆巴赫的估計方法:先獲得被試在兩個獨立取自同樣內(nèi)容范圍的測驗上的得分,計算出它們的相關(guān),把這個相關(guān)作為對內(nèi)容效度的數(shù)量估計。· 3.再測法:被試學習某種知識前做測驗,學過該知識后再做測驗,若后測顯著高于前測,則說明內(nèi)容效度較高。(二)提
38、高內(nèi)容效度的方法編寫雙向細目表(三)表面效度· 含義:表面看起來測驗內(nèi)容與測驗?zāi)康牡囊恢滦猿潭取?#183; 與內(nèi)容效度的區(qū)別:· 表面效度不是真正的效度。· 表面效度會影響被試的測驗動機,影響測驗的效度。典型行為測驗,高表面效度不合適。最高行為測驗往往表面效度較高。二、結(jié)構(gòu)效度· 定義:一個測驗實際測到所要測量的理論結(jié)構(gòu)或特質(zhì)的程度。 即測量結(jié)果是否能證實或解釋某一理論的假設(shè)或構(gòu)想,解釋的程度如何。(一)驗證結(jié)構(gòu)效度的方法方法1:測驗內(nèi)方法· 內(nèi)容效度:測驗的內(nèi)容· 口語報告法:被試解答測題時的反應(yīng)過程· 測驗的同質(zhì)性(相
39、關(guān)分析法):(使用最多)項目間或分測驗間的關(guān)系,判斷測驗測的是單一特質(zhì)還是多種特質(zhì)。方法2:測驗間方法· 相容效度(聚斂效度):測量相同結(jié)構(gòu)或同一特質(zhì)的各測驗之間應(yīng)該有較高的相關(guān)。· 區(qū)分效度:如果兩個測驗測量的是不同的特質(zhì),即使使用了相同的方法進行測量,他們之間的相關(guān)較低。· 因素效度(因素分析法):通過對一組測驗(題目)進行因素分析,找到影響測驗分數(shù)的共同因素(維度),每個測驗(題目)與共同因素(維度)的相關(guān)(因素負荷),即測驗的因素效度。方法3:實證效度三、實證效度(一)概念· 實證效度:指一個測驗對處于特定情境中的個體行為進行估計的有效性。用實踐
40、效果檢驗測驗的準確性。· 效標:衡量一個測驗是否有效的外在標準,通常以一種測驗分數(shù)或活動來表示。· 如:學業(yè)成就、教師評定、實際工作表現(xiàn)、其他現(xiàn)成的有效測驗。· 種類:· 預(yù)測性效度:測驗分數(shù)和以后的某個效標之間的相關(guān)· 同時性效度:同時獲得測驗分數(shù)和某個效標之間的相關(guān)。(二)效標的測量· 必須對效標下一個操作性定義;· 避免效標的污染。· 由于評定者知道被試測驗的原分數(shù)而使被試的效標分數(shù)受到影響的情況。(三)實證效度的估計方法· 1.相關(guān)法 指測驗分數(shù)和效標分數(shù)之間的相關(guān)系數(shù)· 2.區(qū)分法如果
41、根據(jù)被試在效標上的行為表現(xiàn),將他們分為不同的組別,那么,這些組在預(yù)測分數(shù)上也應(yīng)該有顯著性差異。· 3.命中率· 錄取率:采用測驗作為工具錄取人員的比例。實證效度的較好指標:· 正命中率:正確選取率,可作為預(yù)測效度。· 總命中率:正確取舍率。任何一個測驗都需要各式各樣的效度證據(jù)。效度的驗證通常是在測驗編制完成之后,但是其指導思想貫穿于整個編制過程。第三節(jié) 提高測量效度的方法1.精心編制測驗量表,避免出現(xiàn)較大的系統(tǒng)誤差。2.妥善組織測驗,控制隨機誤差。3.創(chuàng)設(shè)標準應(yīng)試情景,讓被試發(fā)揮正常水平。4.選好正確的效標,定好恰當效標測量,正確使用相關(guān)公式理解:效度,
42、表面效度、內(nèi)容效度、結(jié)構(gòu)效度、效標、效標效度、信度與效度關(guān)系。內(nèi)容效度的主要驗證方法;實證效度的確定方法。掌握:1.驗證結(jié)構(gòu)效度的方法有哪些?2.提高測量效度的方法有哪些?第六章 項目分析第一節(jié) 項目難度(重點)一、項目難度的計算(重點)(一)二值記分測題1、P=R/NP:試題的難度;R:答對該題的人數(shù);N:總?cè)藬?shù)。 P值越大,則難度越小。2、分組法重要前提:將被試按總分高低排列。一般標準為27。計算公式:P=(PH+PL)/2PH:高分組答對該題的百分比。PL:低分組答對該題的百分比。(二)測題不是二值記分時P=X/XmaxX:全體考生在該題上的平均分。Xmax:該題的滿分。二、測驗難度的確
43、定防止被試得滿分項目和測驗的難度水平取決于測驗?zāi)康暮蜏y驗性質(zhì)常模參照測驗:區(qū)分被試,大多數(shù)項目在0.30.7之間。標準參照測驗:不必過多考慮難度;速度測驗:難度不宜過高,每個項目的難度值基本相等;難度測驗:難度值在0.5左右;三、項目難度對測驗的影響(重點)1.對測驗分數(shù)分布形態(tài)的影響由一個標準化樣組所構(gòu)成的測驗分數(shù)的分布,一般來說是常態(tài)分布。出現(xiàn)偏態(tài)分布的情況:左偏態(tài);右偏態(tài)。2.對信度系數(shù)的影響項目難度集中在0.5左右最佳,分數(shù)分布范圍廣,信度高。第二節(jié) 項目的鑒別力(區(qū)分度)(重點)一、項目區(qū)分度的計算(重點)(一)項目鑒別指數(shù)法D=PH-PLPH:高分組答對該題的人數(shù)比率。PL:低分組
44、答對該題的人數(shù)比率當人數(shù)小于100時,一般直接分為兩半作為高低分組。D值越大,項目的鑒別力越大,表示項目的質(zhì)量越好。例題:某測驗被試共100人,高分組和低分組各取總?cè)藬?shù)的27,第五題高分組25人答對,低分組3人答對,則該題的鑒別指數(shù)是多少?D測題評鑒0.4以上優(yōu)良0.30-0.39良好,如能修改更好0.20-0.29尚可,仍需修改0.19以下劣,必須淘汰(二)相關(guān)法1.項目與總分(維度分)相關(guān)說明項目與總分有一致性(1)點二列相關(guān):項目是二值記分,總分連續(xù)變量。 (2)二列相關(guān):其中一個變量是人為分成兩類。 (3)皮爾遜積差相關(guān)2.項目與外部準則(效標)的相關(guān):項目效度分析含義:被試在項目上的
45、反應(yīng)和在效標上表現(xiàn)的關(guān)系。目的:選取那些和效標有較高相關(guān)較高的題目。估計方法:相關(guān)系數(shù)的計算公式。(三)其他方法臨界比率法利用問卷總分分為高低兩組組27%,對高低兩組在每一道題上做獨立樣本T檢驗;若高低兩組在題目上差異顯著,則說明該題符合要求,若差異不顯著,則刪除。二、難度與區(qū)分度的關(guān)系當P=0.50時,項目的鑒別力最大。難度PD最大值1.000.000.900.200.800.400.700.600.600.800.501.00項目難度、鑒別力、組間相關(guān)與測驗信度的關(guān)系組間相關(guān)越大,內(nèi)部一致性信度越 高 ;項目難度越相近相關(guān)越大信度越 高 ;所有項目都是中等難度,且組間相關(guān)為1.0,測驗分數(shù)
46、U型分布。(鑒別力)低項目難度不同,組間適當相關(guān),測驗分數(shù)成長方形。(鑒別力)高結(jié)論:這幾者之間的關(guān)系十分復雜,甚至相互矛盾。妥協(xié)的方法:組間相關(guān)在0.100.60之間;項目與測驗總分(維度分)相關(guān)為0.30.8。第三節(jié) 猜測問題與猜測率選擇題難度的矯正計算:CP=(KP-1)/(K-1)CP:矯正后的難度;P:未矯正的難度;K:選項的數(shù)目。例題:一個五擇一的測量難度值是0.61,另一個四擇一的測題難度值為0.64,請問這兩個測題哪個題更難一些? 被試原始分數(shù)的矯正:XC=R-W/(k-1)R:答對的題目數(shù);W:答錯的題目數(shù);K:選項的數(shù)目。例題:被試參加由100道題組成的測驗,答對了82道題,答錯18道題,被試的實得分數(shù)為多少(每題1分)? 第四節(jié) 選擇題的項目分析理解:PPT中標有重點符號的內(nèi)容。掌握:鑒別力的估計方法;選擇題難度的矯正計算。第七章 測驗的常模第一節(jié) 分數(shù)轉(zhuǎn)換一、原始分數(shù)與導出分數(shù)二、百分等級 把測驗的原始分數(shù)分成100個單位或等級。 某原始分數(shù)的百分等級指:在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二四年商業(yè)廣告燈箱安裝施工合同
- 2025年度大曰金地產(chǎn)樓盤銷售代理合同全案策劃執(zhí)行合同4篇
- 2025年私人住房買賣合同書含物業(yè)管理服務(wù)條款范本2篇
- 2025年度高端鈦礦資源批量采購合同
- 二零二五版鍋爐設(shè)備買賣合同附安全使用操作手冊3篇
- 2025年度醫(yī)療設(shè)備租賃合同擔保與維修保養(yǎng)服務(wù)范本4篇
- 二零二五年度屋頂防水隔熱一體化合同
- 2025年BEC商務(wù)英語專業(yè)課程研發(fā)與授權(quán)使用合同3篇
- 二零二五版智慧城市基礎(chǔ)設(shè)施用地租賃合同3篇
- 預(yù)應(yīng)力專項施工方案
- 足球訓練基地管理制度
- 太平洋藍鯨計劃制度和基本法
- (承諾書)安防監(jiān)控售后服務(wù)承諾書范文
- 高低溫交變濕熱試驗檢測報告
- 蘇教版四年級數(shù)學下冊《全冊》完整課件ppt
- 《高一地理必修一全套課件》
- 新點軟件算量基礎(chǔ)知識內(nèi)部培訓講義
- 幼兒園學前-《拍蚊子》教學課件設(shè)計
- 移動商務(wù)內(nèi)容運營(吳洪貴)任務(wù)三 APP的品牌建立與價值提供
- 北師大版三年級數(shù)學上冊《總復習》教案及教學反思
- 新聞評論-第五章新聞評論的選題技巧課件
評論
0/150
提交評論