心理測量2-PPT幻燈片_第1頁
心理測量2-PPT幻燈片_第2頁
心理測量2-PPT幻燈片_第3頁
心理測量2-PPT幻燈片_第4頁
心理測量2-PPT幻燈片_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三節(jié)測驗的信度

第一單元信度的概念一、信度的定義P348信度(reliability):是指同一被試者在不同時間內(nèi)用同一測驗(或用另一套相等的測驗)重復(fù)測量,所得結(jié)果的一致程度。用于考察測驗結(jié)果的穩(wěn)定性和可靠性。信度只受隨機誤差的影響。隨機誤差越大,信度越低。系統(tǒng)誤差產(chǎn)生恒定效應(yīng),不影響信度。每個測驗的實得分數(shù)(X),總是由真實分數(shù)(T)和誤差(E)兩部分構(gòu)成的,用公式表示如下:根據(jù)經(jīng)典測驗理論,得到類似公式:

其中,是測驗實得分數(shù)的方差,是測驗真實分數(shù)的方差,是測驗隨機誤差的方差。2.測量標準誤標準誤,即真分數(shù)的變異,公式是:

公式中,SE為測量的標準誤,是所得分數(shù)的標準差,為測驗的信度系數(shù)。測量的標準誤與信度之間有一種互為消長的關(guān)系:信度越高,標準誤越??;信度越低,標準誤越大。第二單元信度評估的方法信度評估的方法P3501.重測信度2.復(fù)本信度3.內(nèi)部一致性信度4.評分者信度一、重測信度又稱穩(wěn)定性系數(shù)優(yōu)點缺點最適宜的時距二、復(fù)本信度又稱等值性系數(shù)復(fù)本信度反映的是測驗在內(nèi)容上的等值性優(yōu)點局限性三、內(nèi)部一致性信度內(nèi)部一致性信度系數(shù)主要反映的是題目之間的關(guān)系。主要包括:1.分半信度;2.同質(zhì)性信度。四、評分者信度P351一般要求在成對的受過訓(xùn)練的評分者之間平均一致性達到0.90以上,才認為評分是客觀的。當多個評分者評定多個對象,并以等級法記分時,可采用肯德爾和諧系數(shù)(W)作為評分者信度的估計。第三單元信度與測驗分數(shù)的解釋

(信度的用途)信度的用途P352一、解釋真實分數(shù)與實得分數(shù)的相關(guān)二、確定信度可以接受的水平三、解釋個人分數(shù)的意義四、比較不同測驗分數(shù)的差異第四單元影響信度的因素一、樣本特征P3541.樣本團體異質(zhì)性的影響

一般而言,若獲得信度的取樣團體較為異質(zhì)的話,往往會高估測驗的信度,相反在同質(zhì)團體中則會低估測驗的信度。2.樣本團體平均能力水平的影響

對年幼者和能力水平較低者,其信度相對較低。

二、測驗長度一般來說,在一個測驗中增加同質(zhì)的題目,可以使信度提高。1.測驗越長,測驗的測題取樣或內(nèi)容取樣就越有代表性。2.測驗越長,被試的猜測因素影響就越小。在此需要注意的是,增加測驗長度的效果應(yīng)遵循報酬遞減率原則,測驗過長是得不償失的,有時反而會引起被試的疲勞和反感而降低可靠性。斯皮爾曼-布朗公式的導(dǎo)出公式三、測驗難度難度對信度的影響,只存在于某些測驗中,如智力測驗、成就測驗、能力傾向測驗等。對于人格測驗、興趣測驗、態(tài)度測驗等不存在難度問題,因為這些測驗的題目沒有正確或錯誤答案之分。就難度與信度間的關(guān)系而言,并沒有簡單的對應(yīng)關(guān)系。從理論上說,只有平均難度水平為50%時,才能使測驗分數(shù)分布范圍最大,求得的信度也最高。四、時間間隔時間間隔只對重測信度和不同時測量時的復(fù)本信度(重測復(fù)本信度)有影響,對其余的信度來說不存在時間間隔問題。第四節(jié)測驗的效度

第一單元效度的概念一、效度的定義P357效度(validity):是指所測量的與所要測量的心理特點之間符合的程度,或者簡單的說是指一個心理測驗的準確性。效度是科學測量工具最重要的必備條件,用來考察測驗的準確性、有效性。測量的效度除受隨機誤差影響外,還受系統(tǒng)誤差的影響。二、效度的性質(zhì)P3571.效度具有相對性2.效度具有連續(xù)性第二單元效度評估的方法效度的三大類P3591.內(nèi)容效度2.構(gòu)想效度3.效標效度一、內(nèi)容效度P359(一)什么是內(nèi)容效度內(nèi)容效度:指的是測驗題目對有關(guān)內(nèi)容或行為取樣的適用性,從而確定測驗是否是所欲測量的行為領(lǐng)域的代表性取樣。又叫“邏輯效度”。(二)內(nèi)容效度的評估方法1.專家判斷法(最常用)2.統(tǒng)計分析法3.經(jīng)驗推測法(三)表面效度二、構(gòu)想效度P361(一)什么是構(gòu)想效度構(gòu)想效度,又叫構(gòu)思效度、結(jié)構(gòu)效度、構(gòu)念效度、建構(gòu)效度。(二)構(gòu)想效度的估計方法1.對測驗本身的分析2.測驗間的相互比較1)相容效度2)區(qū)分效度3)因素分析法3.效標效度的研究證明4.實驗法和觀察法證實三、效標效度P363(一)什么是效標效度效標效度又稱實證效度,反映的是測驗預(yù)測個體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測的行為是檢驗效度的標準,簡稱效標。在檢驗一個測驗的效標效度時,難點在于找到合適的效標。因此,效標的選擇至關(guān)重要。一個好的效標必須具備以下條件:P363

(二)效標效度的評估方法1.相關(guān)法(最常用)2.區(qū)分法3.命中率法第三單元效度的功能效度的功能P365一、預(yù)測誤差二、預(yù)測效標分數(shù)三、預(yù)測效率指數(shù)第四單元影響效度的因素一、測驗本身的因素

P366二、測驗實施中的干擾因素

1.主試的影響因素2.被試的影響因素三、樣本團體的性質(zhì)1.樣本團體的異質(zhì)性:如果其他條件相同,樣本團體越異質(zhì),測驗效度就越高;樣本團體越同質(zhì),效度就越低。2.干涉變量四、效標的性質(zhì)第五節(jié)項目分析P368第一單元項目的難度一、難度的定義P368難度(difficulty):是指項目的難易程度。難度的指標通常以通過率表示,即以答對或通過該題的人數(shù)百分比來表示。P值大小與難度高低程反比,所以也有人將其稱作易度。

難度的取值范圍,在0-1.00之間。二、難度的計算方法P3681.二分法記分的項目心理測驗的項目大多為選擇題,通過記1分,錯誤記0分,即二分法記分。當被試人數(shù)較多時,可通過測驗總成績將被試分成三組:分數(shù)最高的27%被試為高分組,分數(shù)最低的27%為低分組,中間46%的被試為中間組。分別計算高分組和低分組的通過率,以兩組通過率的平均值作為每一題的難度。難度校正公式2.非二分記分的項目當測驗項目為問答題或不能用二分法記分的形式時,一般用下面的公式計算難度。

為全體被試者在該題上的平均分,為該題的滿分。三、難度水平的確定P3691.項目的難度項目的難度多高合適,取決于測驗的目的、性質(zhì)以及項目的形式。為了使測驗具有更大的區(qū)別力,各題難度最好在0.50±0.20之間。2.測驗的難度測驗的難度直接依賴于組成測驗的項目的難度。大多數(shù)測驗在設(shè)計時希望分數(shù)呈現(xiàn)常態(tài)分布的模型。如果被試樣本具有代表性,對于中等難度的測驗,其測驗總分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論