人才測(cè)評(píng)的信度與效度綜述

上傳人：5*** IP屬地：湖北上傳時(shí)間：2021-10-14 格式：PPT 頁(yè)數(shù)：28 大?。?8.50KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩23頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第十章、人才測(cè)評(píng)的信度與效度人才測(cè)評(píng)的核心價(jià)值在于預(yù)測(cè)的有效性預(yù)測(cè)好預(yù)測(cè)不好實(shí)際好實(shí)際不好在進(jìn)行測(cè)量時(shí)，誤差是難免的，這就使得真實(shí)值和測(cè)量值之間是不可能完全一致。我們可以這樣來表示真實(shí)值和測(cè)量值之間的關(guān)系。 X=T+B+E T表示真實(shí)值，B表示偏差即系統(tǒng)誤差，E表示測(cè)量誤差即隨機(jī)誤差。一、信度測(cè)試信度(test reliability)也叫測(cè)試的可靠性，指測(cè)驗(yàn)結(jié)果的一致性、穩(wěn)定性及可靠性，一般多以內(nèi)部一致性來加以表示該測(cè)驗(yàn)信度的高低。信度系數(shù)愈高即表示該測(cè)驗(yàn)的結(jié)果愈一致、穩(wěn)定與可靠。系統(tǒng)誤差對(duì)信度沒什么影響，因?yàn)橄到y(tǒng)誤差總是以相同的方式影響測(cè)量值的，因此不會(huì)造成不一致性。反之，隨機(jī)誤

2、差可能導(dǎo)致不致性，從而降低信度。信度可以定義為隨機(jī)誤差R影響測(cè)量值的程度。如果R=0，就認(rèn)為測(cè)量是完全可信的，信度最高。信度評(píng)估的方法（一）重測(cè)信度重測(cè)信度，又稱為穩(wěn)定性系數(shù)，它的計(jì)量方法是采用重測(cè)法：用同一測(cè)驗(yàn)，在不同時(shí)間對(duì)同一群體施測(cè)兩次，這兩次測(cè)量分?jǐn)?shù)的相關(guān)系數(shù)即為重測(cè)系數(shù)。重測(cè)信度所考察的誤差來源是時(shí)間的變化所帶來的隨機(jī)影響。在評(píng)估重測(cè)信度時(shí)，必須注意重測(cè)間隔的時(shí)間。對(duì)于人格測(cè)驗(yàn)，重測(cè)間隔在兩周到6個(gè)月之間比較合適。在進(jìn)行重測(cè)信度的評(píng)估時(shí)，還應(yīng)注意以下兩個(gè)重要問題：重測(cè)信度一般只反映由隨機(jī)因素導(dǎo)致的變化，而不反映被試行為的長(zhǎng)久變化。不同的行為受隨機(jī)誤差影響不同。（二）復(fù)本信

3、度復(fù)本信度，是以兩個(gè)測(cè)驗(yàn)復(fù)本來測(cè)量同一群體，然后求得應(yīng)試者在這兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)。復(fù)本信度的高低反映了這兩個(gè)測(cè)驗(yàn)復(fù)本在內(nèi)容上的等值性程度。兩個(gè)等值的測(cè)驗(yàn)互為復(fù)本。計(jì)算復(fù)本信度的主要目的在于考察兩個(gè)測(cè)驗(yàn)復(fù)本的題目取樣或內(nèi)容取樣是否等值。復(fù)本信度也考慮兩個(gè)復(fù)本實(shí)施的時(shí)間間隔。復(fù)本信度的主要優(yōu)點(diǎn)在于：能夠避免重測(cè)信度的一些問題，如記憶效果、練習(xí)效應(yīng)等；適用于進(jìn)行長(zhǎng)期追蹤研究或調(diào)查某些干涉變量對(duì)測(cè)驗(yàn)成績(jī)影響；減少了輔導(dǎo)或作弊的可能性。復(fù)本信度的局限性在于：如果測(cè)量的行為易受練習(xí)的影響，則復(fù)本信度只能減少而不能消除這種影響；有些測(cè)驗(yàn)的性質(zhì)會(huì)由于重復(fù)而發(fā)生改變；有些測(cè)驗(yàn)很難找到合適的復(fù)本。（

4、三）內(nèi)部一致性信度內(nèi)部一致性信度，主要反映的是測(cè)驗(yàn)內(nèi)部題目之間的關(guān)系，考察測(cè)驗(yàn)的各個(gè)題目是否測(cè)量了相同的內(nèi)容或特質(zhì)。內(nèi)部一致性信度又分為分半信度和同質(zhì)性信度。分半信度系數(shù)是通過將測(cè)驗(yàn)分成兩半，計(jì)算這兩半測(cè)驗(yàn)之間的相關(guān)性而獲得的信度系數(shù)。測(cè)驗(yàn)愈長(zhǎng)，信度系數(shù)愈高。同質(zhì)性信度是指測(cè)驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。同質(zhì)性信度低時(shí)，即使各個(gè)測(cè)試題看起來似乎是測(cè)量同一特質(zhì)，但測(cè)驗(yàn)實(shí)際上是異質(zhì)的，即測(cè)驗(yàn)測(cè)量了不止一種特質(zhì)。同質(zhì)性分析與項(xiàng)目分析中的內(nèi)部一致性分析相類似。（四）評(píng)分者信度評(píng)分者信度，是指不同評(píng)分者對(duì)同樣對(duì)象進(jìn)行評(píng)定時(shí)的一致性。最簡(jiǎn)單的估計(jì)方法就是隨機(jī)抽取若干份答卷，由兩個(gè)獨(dú)立的評(píng)

5、分者打分，再求每份答卷兩個(gè)評(píng)判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法，也可以采用斯皮爾曼等級(jí)相關(guān)方法。提高測(cè)驗(yàn)信度的方法影響測(cè)驗(yàn)信度的誤差歸納起來主要有 :(1) 抽樣誤差 : 簡(jiǎn)單說 , 這是在抽樣過程中由于被試間的差異所造成的誤差。被試間的差異可以用全距和方差大小來表示。全距是指某一心理量最大值與最小值之差。全距大說明被試間差異大 , 全距小說明被試間差異小。被試間在某一心理量上參差不齊 , 差別懸殊 , 則該心理量的方差大 ; 反之 , 方差小。對(duì)于方差小的樣本 , 被試間在某一心理特征上相差較小 , 則前后兩次測(cè)驗(yàn)結(jié)果的一致性較低 , 即降低了信度。因?yàn)楸辉囍g的差

6、別越小其同質(zhì)性越高 , 被試的分?jǐn)?shù)只要發(fā)生小的變化 , 其名次就可能改變 , 從而降低信度。(2) 隨機(jī)誤差 : 由于各種偶然因素的影響而產(chǎn)生的誤差 , 表現(xiàn)為用同一方法多次測(cè)量同一對(duì)象時(shí)結(jié)果上不一致。隨機(jī)誤差是由許多因素造成的 , 如量標(biāo)的質(zhì)量 , 測(cè)量的程序 , 被試的身心狀態(tài) , 測(cè)量的環(huán)境等。根據(jù)影響測(cè)驗(yàn)信度的因素 , 可從以下幾方面來提高測(cè)驗(yàn)的信度 : 一是從測(cè)驗(yàn)本身考慮 , 如測(cè)驗(yàn)的長(zhǎng)度、難度、區(qū)分度、速度、程序、環(huán)境條件與計(jì)分方法等 ; 一是從被試自身考慮 , 如被試在被測(cè)心理特征上的差異大小 , 參加測(cè)驗(yàn)的動(dòng)機(jī)水平 , 對(duì)測(cè)驗(yàn)的態(tài)度和積極性等。在此主要介紹如下幾種提高測(cè)驗(yàn)信度

7、的方法 :（ 1 ）適當(dāng)延長(zhǎng)測(cè)驗(yàn)的長(zhǎng)度 : 測(cè)驗(yàn)的長(zhǎng)度主要指量表所包含的題目多少。對(duì)一個(gè)測(cè)驗(yàn)來說 , 測(cè)驗(yàn)的題目越少 , 得分越容易受偶然因素的影響 , 故測(cè)驗(yàn)的信度越低。反之如果測(cè)驗(yàn)題目較多 , 即測(cè)驗(yàn)長(zhǎng)度延長(zhǎng) , 擴(kuò)大了被試得分范圍 , 可在一定程度上排除偶然因素的影響 , 從而提高測(cè)驗(yàn)信度。但是測(cè)驗(yàn)信度的增加并不是等比例提高信度系數(shù)。當(dāng)信度系數(shù)較小時(shí) , 延長(zhǎng)測(cè)驗(yàn)長(zhǎng)度信度系數(shù)增加較大 ; 當(dāng)信度系數(shù)已經(jīng)較大時(shí) , 延長(zhǎng)測(cè)驗(yàn)長(zhǎng)度對(duì)信度系數(shù)的影響就較小了。而且 , 在延長(zhǎng)測(cè)驗(yàn)長(zhǎng)度時(shí) , 還需考慮其他因素的影響 , 如被試在回答問題時(shí)是否疲倦或產(chǎn)生厭煩情緒 , 是否節(jié)省時(shí)間、物力和財(cái)力 , 測(cè)

8、題是否附合測(cè)驗(yàn)?zāi)康牡取?（ 2 ）測(cè)驗(yàn)的難度要適中 : 難度即測(cè)驗(yàn)的難易程度 , 當(dāng)測(cè)驗(yàn)難度太大時(shí) , 被試得分普遍太低 , 呈負(fù)偏態(tài)分布 ; 當(dāng)測(cè)驗(yàn)難度太小時(shí) , 被試得分普遍較高 , 呈正偏態(tài)分布。太難太易的測(cè)驗(yàn)都使被試得分差異減小 , 使實(shí)得分?jǐn)?shù)方差減小 , 從而降低測(cè)驗(yàn)信度。（ 3 ）測(cè)驗(yàn)的內(nèi)容盡量同質(zhì) : 性質(zhì)相同的測(cè)驗(yàn)內(nèi)容 , 對(duì)被試也要求相同的能力、知識(shí)和技能 ; 而內(nèi)容不同質(zhì)的測(cè)驗(yàn) , 則要求被試不同的能力、知識(shí)和技能。因而為了提高測(cè)驗(yàn)信度 , 測(cè)驗(yàn)內(nèi)容應(yīng)盡量同質(zhì)。（ 4 ）測(cè)驗(yàn)的時(shí)間要充分 : 對(duì)某一測(cè)驗(yàn)而言 , 應(yīng)保證絕大多數(shù)被試在規(guī)定時(shí)間內(nèi)完成測(cè)驗(yàn) ; 否則 , 如果

9、被試不能從容回答所有問題 , 就不能反映被試的真實(shí)水平。（ 5 ）測(cè)驗(yàn)的程序要統(tǒng)一 : 包括測(cè)驗(yàn)的題目統(tǒng)一 , 指導(dǎo)語(yǔ)、回答問題的方式、分收試卷的方法、測(cè)驗(yàn)時(shí)間等都要統(tǒng)一。（ 6 ）評(píng)分要客觀 : 評(píng)分是否客觀對(duì)測(cè)驗(yàn)信度有直接的影響。對(duì)于客觀性題目 , 評(píng)分標(biāo)準(zhǔn)明確 , 評(píng)分容易做到客觀 ; 但對(duì)于主觀性題目 , 受評(píng)分者影響較大 , 不易做到客觀。為了盡可能客觀評(píng)分 , 應(yīng)制定明確而易掌握的評(píng)分標(biāo)準(zhǔn) , 盡量做到一卷多評(píng) , 或一人只評(píng)一題等。二、效度效度（Validity）即有效性，它是指測(cè)量工具或手段能夠準(zhǔn)確測(cè)出所需測(cè)量的事物的程度。效度是指所測(cè)量到的結(jié)果反映所想要考察內(nèi)容的程度，測(cè)

10、量結(jié)果與要考察的內(nèi)容越吻合，則效度越高；反之，則效度越低。效度分為三種類型：內(nèi)容效度、準(zhǔn)則效度和結(jié)構(gòu)效度。從內(nèi)容效度到準(zhǔn)則效度再到構(gòu)念效度可視為一種累進(jìn)即構(gòu)念效度需要比準(zhǔn)則效度更多的信息準(zhǔn)則效度需要比內(nèi)容效度更多的信息。效度比信度有更高的要求信度是效度的必要條件沒有信度的測(cè)量工具就談不上具有效度但信度高的測(cè)量工具未必具有高的效度。測(cè)試維度測(cè)試維度 1）表面效度（face validity）。指測(cè)試應(yīng)達(dá)到的卷面標(biāo)準(zhǔn)，即一套測(cè)試題從表面看來是否是合適的。例如，若一次閱讀理解力的測(cè)試包括許多受試者沒有學(xué)過的方言詞匯，則可認(rèn)為這次測(cè)試缺乏表面效度。表面效度是測(cè)試出受試者正常水平的一種保證因素。

11、2）內(nèi)容效度（content validity）。指一套測(cè)試題是否測(cè)試了應(yīng)該測(cè)試的內(nèi)容或者說所測(cè)試的內(nèi)容是否反映了測(cè)試的要求，即測(cè)試的代表性和覆蓋面的程度。例如，如果某一套發(fā)音技能測(cè)試題僅僅考查發(fā)音所必須具備的某些技能，如只考單一音素的發(fā)音，而不考查重讀、語(yǔ)調(diào)或音素在詞語(yǔ)中的發(fā)音，那么，該測(cè)試的內(nèi)容效度就很低。 3）編制效度（construct validity）。指一套測(cè)試題的諸項(xiàng)目對(duì)編制該測(cè)試所依據(jù)的理論的各個(gè)基本方面的反映程度。例如，以結(jié)構(gòu)主義語(yǔ)言理論為基礎(chǔ)，認(rèn)為系統(tǒng)的語(yǔ)言習(xí)慣是通過句型而獲得的，那么，強(qiáng)調(diào)詞匯和語(yǔ)法環(huán)境的測(cè)試題目就失去了編制效度。 4）經(jīng)驗(yàn)效度（empirical va

12、lidity）。經(jīng)驗(yàn)效度是一種衡量測(cè)試有效性的量度，通過把一次測(cè)試與一個(gè)或多個(gè)標(biāo)準(zhǔn)尺度相對(duì)照而得出。經(jīng)驗(yàn)效度可分為兩種：一是共時(shí)效度（concurrent validity），即將一次測(cè)試的結(jié)果同另一次時(shí)間相近的有效測(cè)試的結(jié)果相比較，或同教師的鑒定相比較而得出的系數(shù)；二是預(yù)測(cè)效度（predictive validity），即將一次測(cè)試的結(jié)果同后來的語(yǔ)言能力相比較，或是同教師后來對(duì)學(xué)生的鑒定相比較而得出的系數(shù)。提高測(cè)驗(yàn)效度的方法（ 1）控制系統(tǒng)誤差 : 系統(tǒng)誤差是影響測(cè)驗(yàn)效度的主要因素。它主要包括儀器不準(zhǔn) , 題目和指導(dǎo)語(yǔ)有暗示性 , 答案按排不當(dāng) ( 被試可以猜測(cè) ) 等 , 控制這些因素

13、可以降低系統(tǒng)誤差 , 提高效度。 (2) 精心編制測(cè)題和測(cè)驗(yàn)量表 : 首先測(cè)題內(nèi)容要適合測(cè)驗(yàn)?zāi)康?, 如知識(shí)性測(cè)題就不能全面反映被試的智力水平 , 它主要測(cè)量其知識(shí)水平。其次 , 測(cè)題要清楚明了 , 用語(yǔ)要讓被試?yán)斫?, 排列由易到難。第三 , 測(cè)題的難度和區(qū)分度要合適。 (3) 嚴(yán)格按照測(cè)驗(yàn)程序進(jìn)行測(cè)量 , 防止測(cè)量誤差 : 要嚴(yán)格按照測(cè)驗(yàn)手冊(cè)進(jìn)行測(cè)量 , 不能作過多的解釋 , 按標(biāo)準(zhǔn)評(píng)分 , 兩次測(cè)驗(yàn)間隔要適當(dāng)。 (4) 樣本容量要適當(dāng) : 當(dāng)樣本容量增大時(shí) , 樣本對(duì)總體的代表性提高 , 樣本大 , 被試的內(nèi)部差異增大 , 擴(kuò)大了真分?jǐn)?shù)的方差 , 使效度提高。樣本容量一般不應(yīng)低于 30

14、。另外 , 抽樣方法也很重要 , 一般用隨機(jī)抽樣 , 當(dāng)群體很大時(shí) , 可分層抽樣 , 樣本容量擴(kuò)大時(shí) , 其代表性才隨之增大。 (5) 正確處理好信度與效度的關(guān)系 : 信度是效度的必要條件 , 但信度高的測(cè)驗(yàn) , 效度不一定高 ; 而效度高的測(cè)驗(yàn) , 信度卻比較高。但是 , 既要有高效度 , 又要有高信度是不容易做到的?！白畲罂煽慷龋ㄐ哦龋┮鬁y(cè)驗(yàn)項(xiàng)目之間有高度的組間相關(guān)；最大預(yù)測(cè)有效度卻要求低度的組間相關(guān)。最大可靠度（信度）要求項(xiàng)目等同的難度；最大預(yù)測(cè)有效度卻要求項(xiàng)目的難度有所區(qū)別。中等程度的組間相關(guān)（ 0.10 0.60), 通?？僧a(chǎn)生良好的效度 (0.30 0.80), 并且產(chǎn)生滿意的

15、信度 (0.90) ?！?(6) 適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度 : 增加測(cè)驗(yàn)的長(zhǎng)度可提高測(cè)驗(yàn)的信度 , 也可以提高效度 , 但增加測(cè)驗(yàn)的長(zhǎng)度對(duì)信度的影響大于對(duì)效度的影響。三、測(cè)評(píng)手段有效度切忌以點(diǎn)代面，比如：韓復(fù)榘的選任方法過分依賴一個(gè)情景也會(huì)降低面試效度比如：某商場(chǎng)老總招聘員工的方法員員工工未未來來工工作作績(jī)績(jī) 效效預(yù)預(yù) 測(cè)測(cè) 方方法法的的有有效效性性系系數(shù)數(shù)招聘新雇員并進(jìn) 行培訓(xùn) 時(shí) 的預(yù) 測(cè) 方法根據(jù) 當(dāng) 前績(jī) 效預(yù) 測(cè) 未來績(jī) 效時(shí) 的方法智力測(cè) 驗(yàn) 0.53工作試用 0.44個(gè) 人簡(jiǎn) 歷 0.37背景調(diào) 查 0.26實(shí) 際工作 0.18面試 0.14培訓(xùn) 和實(shí) 際工作成績(jī) 0.13學(xué) 術(shù) 成果 0.11教育背景 0.10興趣 0.10年齡 0.01工作實(shí) 例測(cè) 試 0.54智力測(cè) 驗(yàn) 0.53同事評(píng) 價(jià) 0.49以往工

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

人才測(cè)評(píng)的信度與效度綜述

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

人才測(cè)評(píng)的信度與效度綜述

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔