心理測量學分析課件_第1頁
心理測量學分析課件_第2頁
心理測量學分析課件_第3頁
心理測量學分析課件_第4頁
心理測量學分析課件_第5頁
已閱讀5頁,還剩133頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

測量心理學藍武功主講:測量心理學藍武功主講:

心理學各分支(回顧)心理學理論心理學應用心理學一般心理學差異心理學管理心理學消費心理學談判心理學心理測量學跨文化心理學普通心理學實驗心理學發(fā)展心理學社會心理學

心理學各分支(回顧)心理論心理學應用心理學一般心理學差異心2心理測量的編制程序Contents測量與心理測驗是什么?心理測量的必備要素心理測驗的應用1234心理測量的編制程序Contents測量與心理測驗是什么?心理31、什么是測量P348參照點單位測量與測量量表測量的定義測量量表命名量表順序量表等距量表等比量表測量要素(1)事物;(2)數(shù)字;(3)法則1、什么是測量P348參照點測量與測量的定義測量量表命名量表4①測量的定義測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。三個主要的元素:(1)事物;(2)數(shù)字;(3)法則。①測量的定義測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。5②測量要素(一)參照點參照點就是確定事物的量時,計算的起點。參照點有兩種:絕對零點人定的參照點,即相對零點(二)單位好的單位必須具備兩個條件:確定的意義相同的價值②測量要素(一)參照點60攝氏度-273.151020身高:厘米090180哪個是絕對零點海拔是絕對0點還是相對0點?0攝氏度-273.151020身高:厘米090180哪個是絕7零高度零重量零體積零面積零人口零產量零資產真正的零:一無所有零高度零重量零體積零面積零人口零產量零資產8

③量表的種類甲乙丙甲乙丙甲乙丙1751501251007550………甲乙丙1751501251007550250 ③量表的種類甲乙丙甲乙丙甲乙丙17515012510079四種測量在三個維度上的表現(xiàn)四種測量在三個維度上的表現(xiàn)10四種量表的運算心理測量表一般屬于哪一類量表?有絕對零點四種量表的運算心理測量表一般屬于哪一類量表?有絕對零點11性別(1代表男,2代表女)種族(56個民族)運動項目命名量表性別種族(56個民族)運動項目命名量表12>>-≠-≠≠大學生中學生小學生順序量表>>-≠-≠≠大學生中學生小學生順序量表13溫度天氣預報:沈陽:最高溫度3℃,最低-7℃

大連:最高溫度6℃,最低-2℃兩地最高溫度相差3℃沈陽最低溫度較大連最低溫度低5℃大連最高溫度是沈陽最高溫度的2倍等距量表溫度天氣預報:沈陽:最高溫度3℃,最低-7℃兩地最高溫度相差14紀年公元2000年公元元年黃帝4491年黃帝4698年黃帝4711年黃帝元年歷史時間起點?公元2000年紀年公元2000年公元元年黃帝4491年黃帝4698年黃帝4151970年出生

30歲1985年出生

15歲甲乙二人年齡之差:1985-1970=15歲或30-15=15歲二人年齡之比:30÷15=2(倍)

1985÷1970=1.0076(倍)1970年出生30歲1985年出生15歲甲乙二人年齡之16④心理測驗的基本概念和測驗觀P351/p354錯誤正確萬能論無用論即智力測驗重要的研究方法理論基礎不夠堅實測驗觀④心理測驗的基本概念和測驗觀P351/p354錯誤正確萬能論17正確理解心理測驗的注意點測量的是人的行為只是對少數(shù)行為樣本進行觀察為使結果具有可比性,測驗條件應相同原始分數(shù)沒有意義,通過與別人或常模比較才有意義。正確理解心理測驗的注意點測量的是人的行為18⑤心理測驗的分類P352⑤心理測驗的分類P35219(題1、題2、題3、……)項目分析難度區(qū)分度常模信度效度(穩(wěn)定性)(有效性)(確定個人在總體中的位置)試卷——原始分數(shù)量表——原始分數(shù)——標準分數(shù)例子:小學時候的考試,如果你是他們的語文或者數(shù)學老師,你會怎么出卷子?2

心理測驗的要素(題1、題2、題3、……)項目分析難度常模信度效度(穩(wěn)202、心理測驗要素p360群體構成的界定所測群體的代表性樣本樣本的大小適當標準化樣組是時空的產物常模團體性質取樣的方法常模分數(shù)與常模簡單隨機抽樣系統(tǒng)抽樣分組抽樣分層抽樣條件①常模團體常模類型發(fā)展常模百分位常模標準分常模2、心理測驗要素p360群體構成的界定常模團體性質取樣的21(1)發(fā)展常模(年齡量表,置換成一定的順序進行比較,如年齡)(滯后—正?!埃?/p>

發(fā)展順序量表它告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育正常。最早的范例是葛賽爾的發(fā)展順序量表。(看抓爬坐走)

智力年齡(重點是計算智力年齡)比內—西蒙首先使用智力年齡概念。每個年齡6道題,通過一道題即得到智齡2個月。一個兒童,6歲組的題目全通過,7歲組通過4題,8歲組通過3題,9歲組通過2題,其智齡為多少?常模類型p363年級當量處在哪一個年級的水平。(表示方法)你的IQ幾歲?(1)發(fā)展常模(年齡量表,置換成一定的順序進行比較,如年齡)22(2)百分位常模:百分等級—指在常模樣本中低于這個分數(shù)的人數(shù)百分比

“A處在80的百分等級”,即有80%的人比他的分數(shù)低。例:小明的成績是73,但他百分等級是80,那么全部參與測試的同學中有80%在他之下。百分點——百分等級對應的分數(shù)點例5個百分點(百分位數(shù))指95%大于他們四分位數(shù)和十分位數(shù)(2)百分位常模:23心理測量學分析課件24標準分常模標準差平均數(shù)表示的是數(shù)據(jù)的集中度,但對這組數(shù)據(jù)只考慮平均數(shù)并不全面,我們還應考慮其變異度(離散、離中趨勢)。方差與標準差是表示一組數(shù)據(jù)離散程度的最好指標。

標準分常模25標準分數(shù)標準分數(shù)(線性轉換的標準分數(shù))標準分數(shù)又稱z分數(shù),是以標準差為單位表示一個分數(shù)在團體中所處位置的相對位置數(shù)。如何使用標準分數(shù)呢?標準分數(shù)的實質把單位不等距和缺乏明確參照點的分數(shù)轉換成以標準差為單位,以平均數(shù)為參照點的量表分數(shù)。標準分數(shù)標準分數(shù)(線性轉換的標準分數(shù))如何使用標準分數(shù)呢?標26Z分數(shù)存在的意義及運用(附)某班進行語文和數(shù)學兩種測驗。已知語文的平均分為65分,標準差為7分,甲生得72分,數(shù)學測驗的平均分為30分,標準差為6分,甲生得38分,問甲生哪個測驗成績在班級的位置較高?Z分數(shù)存在的意義及運用(附)某班進行語文和數(shù)學兩種測驗。已知27由于Z分數(shù)中經常出現(xiàn)小數(shù)點和負數(shù),所以將其轉換為:當原始分不是常態(tài)分布時,也讓可以通過非線性轉換使之常態(tài)化的,稱常態(tài)化標準分數(shù),先計算百分等級再轉化為Z分數(shù)。標準分常模是將原始分數(shù)與平均數(shù)的距離以標準差為單位表示出來的量表。常見標準分常模離差智商:100為平均數(shù),15為標準差T分數(shù):50為平均數(shù),10為標準差標準九分:5為平均數(shù),2為標準差標準10分:5.5為平均數(shù),1.5為標準差標準20分:10為平均數(shù),3為標準差由于Z分數(shù)中經常出現(xiàn)小數(shù)點和負數(shù),所以將其轉換為:當原始分不28幾種導出分數(shù)間的相互關系幾種導出分數(shù)間的相互關系29常模分數(shù)的表示方法p368一、轉換表法二、剖析圖將測驗分數(shù)的轉換關系用圖形表示出來。常模分數(shù)的表示方法p368一、轉換表法30常模轉換表

常模轉換表

31剖面圖剖面圖32②信度與效度p371-p388什么是信度?信度就是可靠性,比如某心理測試第一次測試得出某人活潑開朗,第二天又測卻得出此人害羞內向,可以得出刺測驗信度低?;蛘呖荚嚂r候的AB卷,AB卷的難度和范圍都相當,是用奇數(shù)偶數(shù)題抽出編排的,但是某學生考試A卷得了99分,B卷卻得了33分,說明此卷信度低(隨機誤差強)②信度與效度p371-p388什么是信度?33一、信度的定義

信度是指同一被試者在不同時間內用同一測驗(或用另一套相等的測驗)重復測量,所得結果的一致程度。——操作定義一、信度的定義34信度受隨機誤差影響(系統(tǒng)誤差:比如奧運會的槍,每次瞄得很準發(fā)射總是向左歪一點點,后來檢測原來是槍的瞄準口歪了,尺子溫度計稱,特別是稱都可能出現(xiàn)系統(tǒng)誤差,有時候可以是人為的)(隨機誤差:有一次考試,小明靠的極其超常發(fā)揮,原來是考試內容正好是他剛做過的題目/剛好都蒙對了,不知道下次考試還能不能這么好運)心理測量學分析課件35信度評估的方法p372一、重測信度---再測法二、復本信度---等價法(AB卷)三、內部一致性信度(分半信度、同質性信度)四、評分者信度(同樣試卷,不同老師改0.9)信度評估的方法p372一、重測信度---再測法36信度的解釋p373信度系數(shù)

大部分的信度指標都以相關系數(shù)表示,即用同一被試樣本所得的兩組資料的相關系數(shù)作為測量一致性的指標,稱作信度系數(shù)(rxx),信度指數(shù)是其平方。信度的解釋p373信度系數(shù)37解釋真分數(shù)與實得分數(shù)的相關信度系數(shù)可解釋為總方差中由真分數(shù)決定的比例。

如rxx=0.85,如何解釋?在極端的情況下,如有rxx=1.00,則表示完全沒有測量誤差,所有的變異均來自真實分數(shù);若有rxx=0,則所有的變異和差別都反映的是測量誤差。解釋真分數(shù)與實得分數(shù)的相關信度系數(shù)可解釋為總方差中由真分38確定信度可以接受的水平一般原則是:當rxx<0.70時,測驗不能用于對個人做出評價或預測,而且不能作團體比較;當0.70≤rxx<0.85時,可用于團體比較;當rxx≥0.85時,才能用來鑒別或預測個人成績或作為。確定信度可以接受的水平一般原則是:39解釋個人分數(shù)的意義兩個作用其一是估計真實分數(shù)的范圍;其二是了解實得分數(shù)再測時可能的變化情形。(公式5-6)人們一般采用95%的或然率(概率)水平,其置信區(qū)間為:

(公式5-7)大約有95%的可能性真分數(shù)落在所得分±1.96Se的范圍內,或有5%的可能性落在范圍之外。(重點P374)解釋個人分數(shù)的意義兩個作用40比較不同測驗分數(shù)的差異差異分數(shù)的標準誤公式為:(公式5-8)甲被試在韋氏成人智力測驗中言語智商為102,操作智商為110。已知兩個分數(shù)都是以100為平均數(shù),15為標準差的標準分數(shù)。假設言語測驗和操作測驗的分半信度分別為0.87和0.88,那么其操作智商是否顯著高于言語智商?—P375(重點)比較不同測驗分數(shù)的差異差異分數(shù)的標準誤公式為:41影響信度的因素p375影響信度的因素樣本特征測驗長度測驗難度時間間隔異質性平均能力水平影響信度的因素p375影響信度的因素樣本特征測驗長度測驗難度421、異質性如果大家水平都差不多,那么考試名次(百分等級)更多的在于運氣(隨機誤差),而非真實水平(真分數(shù))的體現(xiàn),如果水平不一樣來參加考試,則名次也不會變化太大,那么測驗的信度也才高。1、異質性432、平均能力水平

比如一個能力選擇題測驗,如果給小毛毛測試,他們大多時候時候就是猜,隨意選,那么完全體現(xiàn)不出真實水平,分數(shù)也容易變化,能力高點的瞎選的就少,分數(shù)也穩(wěn)定一些2、平均能力水平443、測驗長度測驗越長,受隨機誤差影響就越?。ㄈ缙谥锌既慷伎嫉降脑?,就不會被那些剛好復習到某部分的人撿到了運氣),這樣的測驗也更有代表性。反之如果考投籃水平,只投一次的話,水平就會時高時低,反應不了真實水平。3、測驗長度454、測驗難度

測驗太難,大家都猜測驗太易,分數(shù)高低不在水平在運氣5、時間間隔中間可學習可復習,再測法或者復本發(fā)求信度,時間越短,信度越高,反之越低4、測驗難度46③測驗的效度p378效度定義性質相對性

連續(xù)性

效度的評估方法影響效度的因素③測驗的效度p378效度定義性質相對性

連續(xù)性

效度的評估方47心理測量學分析課件48內容效度定義一個測驗實際測到的內容與所要測量的內容之間的吻合性程度。這是根據(jù)測量的內容來闡述測驗的目的。適用范圍更適用于成就測驗,包括學績測驗,還有某些用于選拔和分類的職業(yè)測驗。不適用于能力傾向測驗和人格測驗。內容效度定義49舉例:小學自然雙向細目表舉例:小學自然雙向細目表50制定內容評定表,請各位專家評定所測內容是否與欲測內容是否一致。制定內容評定表,請各位專家評定所測內容是否與欲測內容是否一致51結構效度(constructvalidity)含義

心理學中有許多假設性地構建出來的結構,是用來對某些可直接觀測的行為加以分類和描述的觀念。心理結構是不能直接觀測到的,不同的測驗編制者要根據(jù)一定的理論來編制測驗,而測驗是否真的體現(xiàn)了之前依據(jù)的理論結構及體現(xiàn)的程度,即為結構效度/構想效度。即測驗的結果能否證實/解釋某一理論的假設、術語、構想,解釋的程度如何。結構效度(constructvalidity)含義52如:16PF理論基礎是人格特質理論;EPQ是人格三維度理論(精神質、外傾性、神經質)

如:16PF理論基礎是人格特質理論;EPQ是人格三維度理論(53效標效度(實證效度)定義是指一個測驗對處于特定情境中的個體的行為進行估計的有效性。理解要點:測驗對個體行為或品質估計是否準確要有一個客觀標準,或有一個公認的標準,客觀標準、公認標準要到個體實踐活動中找,這個標準在測量學中被稱為效度的標準,簡稱效標。將測量結果與效標比較,其一致性程度稱為實證效度,也稱效標關聯(lián)效度。效標效度(實證效度)定義54例:某工廠考慮采用一項考試作為招收工人的依據(jù)。為了檢驗這項考試的效度,對20名新工人施測考試之后,讓他們工作了一年,并根據(jù)其工作各方面表現(xiàn)進行綜合評定。這20名工人的考試成績和工作評定成績如表。例:某工廠考慮采用一項考試作為招收工人的依據(jù)。為了檢驗這55效度的功能一、預測誤差二、預測效標分數(shù)三、預測效率分數(shù)效度的功能一、預測誤差56影響效度的因素P387一、測驗本身二、主測和被測的影響因素三、樣本團體的性質(同質性與干涉變量)四、效標的性質(如效標的信度)影響效度的因素P387一、測驗本身57③項目的難度P389③項目的難度P389定義難度(difficulty),顧名思義,是指項目的難易程度。難度的指標通常以通過率表示,即以答對或通過該題的人數(shù)百分比來表示:

(公式5-31)通過人數(shù)越多(即P值越大),難度越低;定義難度(difficulty),顧名思義,是指項目的難易程59項目難度的估計方法(1)二值記分的測題:答對的百分比(或比率)

P值越大,則難度越小。項目難度的估計方法(1)二值記分的測題:答對的百分比(或比率60(2)不是二值記分(3)分組計分項目(2)不是二值記分61難度水平的確定(一)項目的難度選擇題目時,最好使試題的平均難度接近0.50,而各題難度在0.50±0.20之間。(二)測驗的難度如果被試樣本具有代表性,對于中等難度的測驗,其測驗總分應該接近常態(tài)分配。難度水平的確定(一)項目的難度62項目的區(qū)分度定義項目區(qū)分度(itemdiscrimination),也叫鑒別力,是指測驗項目對被試的心理特性的區(qū)分能力。P391項目的區(qū)分度定義項目區(qū)分度(itemdiscrimina63項目鑒別指數(shù)與項目評價---熟記P392項目鑒別指數(shù)與項目評價---熟記P39264計算方法(一)鑒別指數(shù)P391按測驗總分高低排列答卷確定高分組與低分組,每組取答卷總數(shù)的27%分別計算高分組與低分組在該項目上的通過率高分組通過率-低分組通過率得項目鑒別指數(shù)據(jù)項目鑒別指數(shù)進行項目取舍(二)相關法P392計算區(qū)分度最常用的方法是相關法某一項目分數(shù)與效標成績或測驗總分的相關度計算方法(一)鑒別指數(shù)P39165區(qū)分度與難度的關系一般來說,較難的項目對高水平的被試區(qū)分度高,較易的項目對水平低的被試區(qū)分度高,中等難度的項目對中等水平的被試區(qū)分度高。區(qū)分度與難度的關系一般來說,較難的項目對高水平的被試區(qū)分度高663、測驗編制的一般程序P394測驗目標分析測題編寫測驗編排和組織測驗對象測驗用途測驗目標顯示性預測性工作分析定義概念具體內容搜集資料命題原則編題要領合成測驗預測與項目分析信度和效度已出版標準測驗理論和專家經驗臨床觀察和記錄內容方面文字方面理解方面社會敏感性選擇題是非題簡答題操作題常模制訂編寫指導手冊選擇題型審定試題編排測題3、測驗編制的一般程序P394測驗測題編寫測驗測驗對象測驗674、心理測驗的使用P404a、主試的資格b、測驗的選擇c、測驗前的準備及注意事項d、測驗實施的程序及要素e、被試誤差及控制方法f、測驗的評分g、測驗結果的報告4、心理測驗的使用P404a、主試的資格68ThankYou!ThankYou!測量心理學藍武功主講:測量心理學藍武功主講:

心理學各分支(回顧)心理學理論心理學應用心理學一般心理學差異心理學管理心理學消費心理學談判心理學心理測量學跨文化心理學普通心理學實驗心理學發(fā)展心理學社會心理學

心理學各分支(回顧)心理論心理學應用心理學一般心理學差異心71心理測量的編制程序Contents測量與心理測驗是什么?心理測量的必備要素心理測驗的應用1234心理測量的編制程序Contents測量與心理測驗是什么?心理721、什么是測量P348參照點單位測量與測量量表測量的定義測量量表命名量表順序量表等距量表等比量表測量要素(1)事物;(2)數(shù)字;(3)法則1、什么是測量P348參照點測量與測量的定義測量量表命名量表73①測量的定義測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。三個主要的元素:(1)事物;(2)數(shù)字;(3)法則。①測量的定義測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。74②測量要素(一)參照點參照點就是確定事物的量時,計算的起點。參照點有兩種:絕對零點人定的參照點,即相對零點(二)單位好的單位必須具備兩個條件:確定的意義相同的價值②測量要素(一)參照點750攝氏度-273.151020身高:厘米090180哪個是絕對零點海拔是絕對0點還是相對0點?0攝氏度-273.151020身高:厘米090180哪個是絕76零高度零重量零體積零面積零人口零產量零資產真正的零:一無所有零高度零重量零體積零面積零人口零產量零資產77

③量表的種類甲乙丙甲乙丙甲乙丙1751501251007550………甲乙丙1751501251007550250 ③量表的種類甲乙丙甲乙丙甲乙丙175150125100778四種測量在三個維度上的表現(xiàn)四種測量在三個維度上的表現(xiàn)79四種量表的運算心理測量表一般屬于哪一類量表?有絕對零點四種量表的運算心理測量表一般屬于哪一類量表?有絕對零點80性別(1代表男,2代表女)種族(56個民族)運動項目命名量表性別種族(56個民族)運動項目命名量表81>>-≠-≠≠大學生中學生小學生順序量表>>-≠-≠≠大學生中學生小學生順序量表82溫度天氣預報:沈陽:最高溫度3℃,最低-7℃

大連:最高溫度6℃,最低-2℃兩地最高溫度相差3℃沈陽最低溫度較大連最低溫度低5℃大連最高溫度是沈陽最高溫度的2倍等距量表溫度天氣預報:沈陽:最高溫度3℃,最低-7℃兩地最高溫度相差83紀年公元2000年公元元年黃帝4491年黃帝4698年黃帝4711年黃帝元年歷史時間起點?公元2000年紀年公元2000年公元元年黃帝4491年黃帝4698年黃帝4841970年出生

30歲1985年出生

15歲甲乙二人年齡之差:1985-1970=15歲或30-15=15歲二人年齡之比:30÷15=2(倍)

1985÷1970=1.0076(倍)1970年出生30歲1985年出生15歲甲乙二人年齡之85④心理測驗的基本概念和測驗觀P351/p354錯誤正確萬能論無用論即智力測驗重要的研究方法理論基礎不夠堅實測驗觀④心理測驗的基本概念和測驗觀P351/p354錯誤正確萬能論86正確理解心理測驗的注意點測量的是人的行為只是對少數(shù)行為樣本進行觀察為使結果具有可比性,測驗條件應相同原始分數(shù)沒有意義,通過與別人或常模比較才有意義。正確理解心理測驗的注意點測量的是人的行為87⑤心理測驗的分類P352⑤心理測驗的分類P35288(題1、題2、題3、……)項目分析難度區(qū)分度常模信度效度(穩(wěn)定性)(有效性)(確定個人在總體中的位置)試卷——原始分數(shù)量表——原始分數(shù)——標準分數(shù)例子:小學時候的考試,如果你是他們的語文或者數(shù)學老師,你會怎么出卷子?2

心理測驗的要素(題1、題2、題3、……)項目分析難度常模信度效度(穩(wěn)892、心理測驗要素p360群體構成的界定所測群體的代表性樣本樣本的大小適當標準化樣組是時空的產物常模團體性質取樣的方法常模分數(shù)與常模簡單隨機抽樣系統(tǒng)抽樣分組抽樣分層抽樣條件①常模團體常模類型發(fā)展常模百分位常模標準分常模2、心理測驗要素p360群體構成的界定常模團體性質取樣的90(1)發(fā)展常模(年齡量表,置換成一定的順序進行比較,如年齡)(滯后—正?!埃?/p>

發(fā)展順序量表它告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育正常。最早的范例是葛賽爾的發(fā)展順序量表。(看抓爬坐走)

智力年齡(重點是計算智力年齡)比內—西蒙首先使用智力年齡概念。每個年齡6道題,通過一道題即得到智齡2個月。一個兒童,6歲組的題目全通過,7歲組通過4題,8歲組通過3題,9歲組通過2題,其智齡為多少?常模類型p363年級當量處在哪一個年級的水平。(表示方法)你的IQ幾歲?(1)發(fā)展常模(年齡量表,置換成一定的順序進行比較,如年齡)91(2)百分位常模:百分等級—指在常模樣本中低于這個分數(shù)的人數(shù)百分比

“A處在80的百分等級”,即有80%的人比他的分數(shù)低。例:小明的成績是73,但他百分等級是80,那么全部參與測試的同學中有80%在他之下。百分點——百分等級對應的分數(shù)點例5個百分點(百分位數(shù))指95%大于他們四分位數(shù)和十分位數(shù)(2)百分位常模:92心理測量學分析課件93標準分常模標準差平均數(shù)表示的是數(shù)據(jù)的集中度,但對這組數(shù)據(jù)只考慮平均數(shù)并不全面,我們還應考慮其變異度(離散、離中趨勢)。方差與標準差是表示一組數(shù)據(jù)離散程度的最好指標。

標準分常模94標準分數(shù)標準分數(shù)(線性轉換的標準分數(shù))標準分數(shù)又稱z分數(shù),是以標準差為單位表示一個分數(shù)在團體中所處位置的相對位置數(shù)。如何使用標準分數(shù)呢?標準分數(shù)的實質把單位不等距和缺乏明確參照點的分數(shù)轉換成以標準差為單位,以平均數(shù)為參照點的量表分數(shù)。標準分數(shù)標準分數(shù)(線性轉換的標準分數(shù))如何使用標準分數(shù)呢?標95Z分數(shù)存在的意義及運用(附)某班進行語文和數(shù)學兩種測驗。已知語文的平均分為65分,標準差為7分,甲生得72分,數(shù)學測驗的平均分為30分,標準差為6分,甲生得38分,問甲生哪個測驗成績在班級的位置較高?Z分數(shù)存在的意義及運用(附)某班進行語文和數(shù)學兩種測驗。已知96由于Z分數(shù)中經常出現(xiàn)小數(shù)點和負數(shù),所以將其轉換為:當原始分不是常態(tài)分布時,也讓可以通過非線性轉換使之常態(tài)化的,稱常態(tài)化標準分數(shù),先計算百分等級再轉化為Z分數(shù)。標準分常模是將原始分數(shù)與平均數(shù)的距離以標準差為單位表示出來的量表。常見標準分常模離差智商:100為平均數(shù),15為標準差T分數(shù):50為平均數(shù),10為標準差標準九分:5為平均數(shù),2為標準差標準10分:5.5為平均數(shù),1.5為標準差標準20分:10為平均數(shù),3為標準差由于Z分數(shù)中經常出現(xiàn)小數(shù)點和負數(shù),所以將其轉換為:當原始分不97幾種導出分數(shù)間的相互關系幾種導出分數(shù)間的相互關系98常模分數(shù)的表示方法p368一、轉換表法二、剖析圖將測驗分數(shù)的轉換關系用圖形表示出來。常模分數(shù)的表示方法p368一、轉換表法99常模轉換表

常模轉換表

100剖面圖剖面圖101②信度與效度p371-p388什么是信度?信度就是可靠性,比如某心理測試第一次測試得出某人活潑開朗,第二天又測卻得出此人害羞內向,可以得出刺測驗信度低?;蛘呖荚嚂r候的AB卷,AB卷的難度和范圍都相當,是用奇數(shù)偶數(shù)題抽出編排的,但是某學生考試A卷得了99分,B卷卻得了33分,說明此卷信度低(隨機誤差強)②信度與效度p371-p388什么是信度?102一、信度的定義

信度是指同一被試者在不同時間內用同一測驗(或用另一套相等的測驗)重復測量,所得結果的一致程度?!僮鞫x一、信度的定義103信度受隨機誤差影響(系統(tǒng)誤差:比如奧運會的槍,每次瞄得很準發(fā)射總是向左歪一點點,后來檢測原來是槍的瞄準口歪了,尺子溫度計稱,特別是稱都可能出現(xiàn)系統(tǒng)誤差,有時候可以是人為的)(隨機誤差:有一次考試,小明靠的極其超常發(fā)揮,原來是考試內容正好是他剛做過的題目/剛好都蒙對了,不知道下次考試還能不能這么好運)心理測量學分析課件104信度評估的方法p372一、重測信度---再測法二、復本信度---等價法(AB卷)三、內部一致性信度(分半信度、同質性信度)四、評分者信度(同樣試卷,不同老師改0.9)信度評估的方法p372一、重測信度---再測法105信度的解釋p373信度系數(shù)

大部分的信度指標都以相關系數(shù)表示,即用同一被試樣本所得的兩組資料的相關系數(shù)作為測量一致性的指標,稱作信度系數(shù)(rxx),信度指數(shù)是其平方。信度的解釋p373信度系數(shù)106解釋真分數(shù)與實得分數(shù)的相關信度系數(shù)可解釋為總方差中由真分數(shù)決定的比例。

如rxx=0.85,如何解釋?在極端的情況下,如有rxx=1.00,則表示完全沒有測量誤差,所有的變異均來自真實分數(shù);若有rxx=0,則所有的變異和差別都反映的是測量誤差。解釋真分數(shù)與實得分數(shù)的相關信度系數(shù)可解釋為總方差中由真分107確定信度可以接受的水平一般原則是:當rxx<0.70時,測驗不能用于對個人做出評價或預測,而且不能作團體比較;當0.70≤rxx<0.85時,可用于團體比較;當rxx≥0.85時,才能用來鑒別或預測個人成績或作為。確定信度可以接受的水平一般原則是:108解釋個人分數(shù)的意義兩個作用其一是估計真實分數(shù)的范圍;其二是了解實得分數(shù)再測時可能的變化情形。(公式5-6)人們一般采用95%的或然率(概率)水平,其置信區(qū)間為:

(公式5-7)大約有95%的可能性真分數(shù)落在所得分±1.96Se的范圍內,或有5%的可能性落在范圍之外。(重點P374)解釋個人分數(shù)的意義兩個作用109比較不同測驗分數(shù)的差異差異分數(shù)的標準誤公式為:(公式5-8)甲被試在韋氏成人智力測驗中言語智商為102,操作智商為110。已知兩個分數(shù)都是以100為平均數(shù),15為標準差的標準分數(shù)。假設言語測驗和操作測驗的分半信度分別為0.87和0.88,那么其操作智商是否顯著高于言語智商?—P375(重點)比較不同測驗分數(shù)的差異差異分數(shù)的標準誤公式為:110影響信度的因素p375影響信度的因素樣本特征測驗長度測驗難度時間間隔異質性平均能力水平影響信度的因素p375影響信度的因素樣本特征測驗長度測驗難度1111、異質性如果大家水平都差不多,那么考試名次(百分等級)更多的在于運氣(隨機誤差),而非真實水平(真分數(shù))的體現(xiàn),如果水平不一樣來參加考試,則名次也不會變化太大,那么測驗的信度也才高。1、異質性1122、平均能力水平

比如一個能力選擇題測驗,如果給小毛毛測試,他們大多時候時候就是猜,隨意選,那么完全體現(xiàn)不出真實水平,分數(shù)也容易變化,能力高點的瞎選的就少,分數(shù)也穩(wěn)定一些2、平均能力水平1133、測驗長度測驗越長,受隨機誤差影響就越?。ㄈ缙谥锌既慷伎嫉降脑?,就不會被那些剛好復習到某部分的人撿到了運氣),這樣的測驗也更有代表性。反之如果考投籃水平,只投一次的話,水平就會時高時低,反應不了真實水平。3、測驗長度1144、測驗難度

測驗太難,大家都猜測驗太易,分數(shù)高低不在水平在運氣5、時間間隔中間可學習可復習,再測法或者復本發(fā)求信度,時間越短,信度越高,反之越低4、測驗難度115③測驗的效度p378效度定義性質相對性

連續(xù)性

效度的評估方法影響效度的因素③測驗的效度p378效度定義性質相對性

連續(xù)性

效度的評估方116心理測量學分析課件117內容效度定義一個測驗實際測到的內容與所要測量的內容之間的吻合性程度。這是根據(jù)測量的內容來闡述測驗的目的。適用范圍更適用于成就測驗,包括學績測驗,還有某些用于選拔和分類的職業(yè)測驗。不適用于能力傾向測驗和人格測驗。內容效度定義118舉例:小學自然雙向細目表舉例:小學自然雙向細目表119制定內容評定表,請各位專家評定所測內容是否與欲測內容是否一致。制定內容評定表,請各位專家評定所測內容是否與欲測內容是否一致120結構效度(constructvalidity)含義

心理學中有許多假設性地構建出來的結構,是用來對某些可直接觀測的行為加以分類和描述的觀念。心理結構是不能直接觀測到的,不同的測驗編制者要根據(jù)一定的理論來編制測驗,而測驗是否真的體現(xiàn)了之前依據(jù)的理論結構及體現(xiàn)的程度,即為結構效度/構想效度。即測驗的結果能否證實/解釋某一理論的假設、術語、構想,解釋的程度如何。結構效度(constructvalidity)含義121如:16PF理論基礎是人格特質理論;EPQ是人格三維度理論(精神質、外傾性、神經質)

如:16PF理論基礎是人格特質理論;EPQ是人格三維度理論(122效標效度(實證效度)定義是指一個測驗對處于特定情境中的個體的行為進行估計的有效性。理解要點:測驗對個體行為或品質估計是否準確要有一個客觀標準,或有一個公認的標準,客觀標準、公認標準要到個體實踐活動中找,這個標準在測量學中被稱為效度的標準,簡稱效標。將測量結果與效標比較,其一致性程度稱為實證效度,也稱效標關聯(lián)效度。效標效度(實證效度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論