第四章人員測(cè)評(píng)系統(tǒng)的構(gòu)建與效度信度檢驗(yàn)_第1頁(yè)
第四章人員測(cè)評(píng)系統(tǒng)的構(gòu)建與效度信度檢驗(yàn)_第2頁(yè)
第四章人員測(cè)評(píng)系統(tǒng)的構(gòu)建與效度信度檢驗(yàn)_第3頁(yè)
第四章人員測(cè)評(píng)系統(tǒng)的構(gòu)建與效度信度檢驗(yàn)_第4頁(yè)
第四章人員測(cè)評(píng)系統(tǒng)的構(gòu)建與效度信度檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章人員測(cè)評(píng)系統(tǒng)的構(gòu)建與效度信度檢驗(yàn)本章內(nèi)容人員測(cè)評(píng)系統(tǒng)的構(gòu)建與效度信度檢驗(yàn)1、測(cè)評(píng)系統(tǒng)的構(gòu)成2、測(cè)評(píng)的效度3、測(cè)評(píng)的信度4、信度與效度的關(guān)系及提升策略一、測(cè)評(píng)系統(tǒng)的構(gòu)成人員測(cè)評(píng)過(guò)程:測(cè)評(píng)考官根據(jù)崗位需要,運(yùn)用測(cè)評(píng)工具對(duì)被測(cè)人員施以刺激,被測(cè)人員對(duì)此刺激做出反應(yīng),測(cè)評(píng)考官對(duì)被測(cè)人員的反應(yīng)情況進(jìn)行度量與評(píng)價(jià)。測(cè)評(píng)考官測(cè)評(píng)工具被測(cè)人員測(cè)評(píng)考官測(cè)評(píng)體系的主體,是決定人員測(cè)評(píng)能否成功的關(guān)鍵要素。在我國(guó),測(cè)評(píng)考官分三類(lèi):具有人員測(cè)評(píng)專(zhuān)門(mén)知識(shí)的專(zhuān)門(mén)人士(咨詢(xún)師、高校教師、研究人員)從事人力資源管理實(shí)務(wù)的專(zhuān)業(yè)人士(HR)人員使用部門(mén)的資深人士(主管或骨干)測(cè)評(píng)考官應(yīng)具備的基本素質(zhì):良好的個(gè)人品格和道德修養(yǎng)測(cè)評(píng)組織方面的知識(shí)(程序公平)和與測(cè)評(píng)內(nèi)容相關(guān)的知識(shí)(評(píng)分公平)測(cè)評(píng)技巧(無(wú)領(lǐng)導(dǎo)小組討論中的座位擺放,面試中隨機(jī)場(chǎng)景的設(shè)置等)工作經(jīng)驗(yàn)和社會(huì)經(jīng)驗(yàn)(經(jīng)驗(yàn)直覺(jué)判斷)測(cè)評(píng)工具與方法能力測(cè)驗(yàn)(一般能力、特殊能力)成就測(cè)驗(yàn)(知識(shí)測(cè)驗(yàn)、工作樣本測(cè)試)人格量表(自陳式量表)面試(結(jié)構(gòu)化、非結(jié)構(gòu)化)評(píng)價(jià)中心(針對(duì)管理者)書(shū)面信息分析(申請(qǐng)表、履歷表、人事檔案、推薦信)測(cè)評(píng)客體——被測(cè)人員測(cè)評(píng)焦慮測(cè)評(píng)前訓(xùn)練:針對(duì)測(cè)評(píng)的項(xiàng)目做大量的強(qiáng)化練習(xí)適應(yīng)性訓(xùn)練認(rèn)識(shí)技能訓(xùn)練要實(shí)現(xiàn)人-職匹配,就要對(duì)其全過(guò)程進(jìn)行監(jiān)控,監(jiān)控的依據(jù)和標(biāo)準(zhǔn)主要是測(cè)評(píng)的效度和信度二、測(cè)量的信度一、信度(reliability)(一)信度的概念:是測(cè)量結(jié)果的一致性(consistency)或者穩(wěn)定性(sta-bility)程度,也就是研究者對(duì)相同或者相似的測(cè)量對(duì)象進(jìn)行不同形式或不同時(shí)間的測(cè)量所得結(jié)果的一致性程度。在測(cè)量理論中,信度是指一組測(cè)驗(yàn)分?jǐn)?shù)的真變異數(shù)與總變異數(shù)的比率。在實(shí)際應(yīng)用中,它通常以同一樣本所得的兩組資料的相關(guān)作為測(cè)量一致性的指標(biāo)。

信度能夠回答測(cè)量工具是否穩(wěn)定;測(cè)量結(jié)果是否可以推論,也就是概化能力,即從一次測(cè)量來(lái)推論總體的正確程度。我們可以舉例說(shuō)明信度的問(wèn)題:如果想知道某人的體重,我們可以叫兩個(gè)人來(lái)估計(jì),一個(gè)人的估計(jì)為150鎊,另一個(gè)人的估計(jì)為300鎊,那么我們就可以認(rèn)為,叫別人來(lái)估計(jì)體重是非常不可信的方法。如果用磅秤,連續(xù)測(cè)量?jī)纱蔚慕Y(jié)果都是相同的,因而我們可以說(shuō),在測(cè)量體重方面,用磅秤的方法要比叫人來(lái)估計(jì)更可信。例:如果想知道一個(gè)人的智商,首先我們請(qǐng)對(duì)這個(gè)人熟悉的兩個(gè)老師來(lái)估計(jì),一個(gè)人的估計(jì)為110,另一個(gè)人的估計(jì)為150,顯然,這種巨大的差距說(shuō)明叫人來(lái)估計(jì)智商是非常不可信的方法。但是,用智力測(cè)量量表,連續(xù)測(cè)量?jī)纱蔚慕Y(jié)果差別卻很小。因而我們可以說(shuō),在測(cè)量智商方面,用智力測(cè)量量表的方法要比叫人來(lái)估計(jì)具有更高的信度。在人員測(cè)評(píng)的過(guò)程中,應(yīng)該選擇具有較高信度的測(cè)量工具,這樣才能保證測(cè)量結(jié)果的可靠性。信度---就是對(duì)隨機(jī)誤差的一種測(cè)量,隨機(jī)誤差決定了信度的高低。(二)信度的種類(lèi)由于誤差來(lái)源的不同,對(duì)信度的測(cè)量也有不同的方法。具體有以下三種不同的信度類(lèi)型和相應(yīng)的評(píng)估方法。1.再測(cè)信度(test-retestreliability)(與時(shí)間有關(guān))又稱(chēng)為穩(wěn)定性系數(shù),它是指對(duì)同樣的一個(gè)測(cè)驗(yàn)在不同的時(shí)間對(duì)相同的群體測(cè)量?jī)纱危@兩次測(cè)量的分?jǐn)?shù)的相關(guān)系數(shù)就是再測(cè)信度。我們通過(guò)再測(cè)信度的相關(guān)系數(shù)可以了解測(cè)量結(jié)果在經(jīng)過(guò)一段時(shí)間后的穩(wěn)定程度。再測(cè)信度的兩次測(cè)評(píng)使用的是同一個(gè)測(cè)評(píng)工具,同一種測(cè)評(píng)方式,但較難把握的是兩次測(cè)評(píng)間隔的時(shí)間長(zhǎng)短。時(shí)間間隔過(guò)長(zhǎng),被測(cè)者特征將隨時(shí)間的增加而發(fā)展變化,由此計(jì)算的穩(wěn)定系數(shù)將失去意義;若時(shí)間間隔過(guò)短,又可能產(chǎn)生記憶與練習(xí)效應(yīng),這也將影響穩(wěn)定系數(shù)。

2.與測(cè)評(píng)內(nèi)容有關(guān)的信度

單個(gè)項(xiàng)目的信度組成信度內(nèi)部一致性信度(主要關(guān)注的是測(cè)驗(yàn)內(nèi)部題目之間的關(guān)系。它所考慮的問(wèn)題是一個(gè)測(cè)量工具所有的維度測(cè)量的均一性)折半信度(將一份測(cè)驗(yàn)按照一定的方法分成盡可能平行的兩個(gè)半份測(cè)驗(yàn)(例如按照奇偶分半),然后計(jì)算兩半之間的相關(guān),得到的相關(guān)系數(shù)即為折半信度系數(shù))復(fù)本信度

3.與評(píng)分者有關(guān)的評(píng)分者信度相關(guān)系數(shù)法(隨機(jī)抽取若干份答卷,有兩個(gè)以上獨(dú)立的評(píng)分者打分,再求每份答卷兩個(gè)評(píng)判分?jǐn)?shù)的相關(guān)系數(shù))概化系數(shù)和可靠性系數(shù)(相對(duì)誤差-概化系數(shù)-常模參照測(cè)評(píng),絕對(duì)誤差-可靠性系數(shù)-標(biāo)準(zhǔn)參照測(cè)評(píng))(三)影響信度的因素1.被試者的特征被試者的特征對(duì)信度的影響主要表現(xiàn)在被試者在測(cè)量屬性方面的個(gè)體差異上。如果一種測(cè)量工具對(duì)某種屬性的測(cè)量得分的差別幅度越大,那么該測(cè)量工具能區(qū)別開(kāi)被測(cè)量的個(gè)體,因而我們說(shuō)該測(cè)量工具有較好的信度;個(gè)體之間被測(cè)量的特征或者屬性差別差異很小,那么很難進(jìn)行可靠的測(cè)量,測(cè)驗(yàn)信度可能會(huì)很低。

2.測(cè)驗(yàn)的長(zhǎng)度和難度一般來(lái)說(shuō),測(cè)量分?jǐn)?shù)分布越廣,信度系數(shù)就相對(duì)越高。這就好比讓你來(lái)速記一組數(shù)字,隨著讓你觀察這組數(shù)字的時(shí)間的延長(zhǎng),你會(huì)發(fā)現(xiàn)你能夠描述的數(shù)字的準(zhǔn)確性和詳細(xì)程度也在不斷提高。一個(gè)給定的測(cè)驗(yàn),當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度并且相應(yīng)地延長(zhǎng)測(cè)驗(yàn)的時(shí)間的時(shí)候,也會(huì)發(fā)生上述類(lèi)似的效果。

3.不同信度測(cè)驗(yàn)方法的選擇

前面我們可以看到,不同的信度測(cè)量方法處理測(cè)量誤差的方式都不同,這樣在我們估計(jì)信度的過(guò)程中對(duì)不同方法的選擇就會(huì)產(chǎn)生不同的估計(jì)值。有些方法傾向于對(duì)信度范圍做上限估計(jì),有些傾向于做下限估計(jì),這樣針對(duì)不同特點(diǎn)的測(cè)驗(yàn)我們要學(xué)會(huì)選擇估計(jì)方法。

4.測(cè)驗(yàn)過(guò)程中的誤差

測(cè)試現(xiàn)場(chǎng)因?yàn)檎彰鳌⒈尘耙魳?lè)、溫度、噪聲、通風(fēng)、桌椅和空間不符合人體工程學(xué)等原因?qū)е卤辉嚲窈蜕眢w狀況的不適,或者被試由于不熟悉答題的樣式,答題經(jīng)驗(yàn)的不足或者生病等突發(fā)狀況的發(fā)生,都會(huì)導(dǎo)致測(cè)量的誤差。三、測(cè)量的效度(一)效度的含義和特性

效度(Validity)即有效性,它是指測(cè)量工具或手段能夠準(zhǔn)確測(cè)出所需測(cè)量的某素質(zhì)特征的程度。效度是指所測(cè)量到的結(jié)果反映所想要考察內(nèi)容的程度,測(cè)量結(jié)果與要考察的內(nèi)容越吻合,則效度越高;反之,則效度越低?;蛘吆?jiǎn)單地說(shuō)是指一個(gè)測(cè)驗(yàn)的準(zhǔn)確性、有用性。如果我們用體重秤來(lái)測(cè)身高,顯然這種測(cè)量工具的選擇是不正確的,所以說(shuō)這個(gè)測(cè)量工具沒(méi)有效度。測(cè)評(píng)過(guò)程:測(cè)評(píng)工具的研制、計(jì)分和指導(dǎo)語(yǔ)的標(biāo)準(zhǔn)化、被試作答反應(yīng)、主試或評(píng)分者、測(cè)驗(yàn)的實(shí)施、數(shù)據(jù)整理、統(tǒng)計(jì)分析、結(jié)果的解釋。每一步都要保證其科學(xué)性和準(zhǔn)確性,這樣才能保證測(cè)量的結(jié)果和結(jié)論是有效而正確的。

效度的性質(zhì)

1.效度具有相對(duì)性

任何測(cè)驗(yàn)的效度是對(duì)一定的目標(biāo)來(lái)說(shuō)的,或者說(shuō)測(cè)驗(yàn)只有用于與測(cè)驗(yàn)?zāi)繕?biāo)一致的目的和場(chǎng)合才會(huì)有效。所以,在評(píng)價(jià)測(cè)驗(yàn)的效度時(shí),必須考慮效度測(cè)驗(yàn)的目的與功能。

2.效度具有連續(xù)性

測(cè)驗(yàn)效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒(méi)有“全有”或“全無(wú)”的區(qū)別。效度是針對(duì)測(cè)驗(yàn)結(jié)果的。

效標(biāo)和效標(biāo)測(cè)量

效標(biāo),即衡量測(cè)驗(yàn)有效性的參照標(biāo)準(zhǔn),指的是可以直接而且獨(dú)立測(cè)量的我們感興趣的行為。我們感興趣的行為,就是要預(yù)測(cè)的行為,這是一個(gè)總的觀念,故必須以可操作的測(cè)量來(lái)確定才有實(shí)際意義。因此有必要把效標(biāo)細(xì)分為兩個(gè)層次,其一是理論水平的“觀念效標(biāo)”,其二是操作定義水平的“效標(biāo)測(cè)量”。常用的效標(biāo)有:

1、學(xué)業(yè)成就:如在校成績(jī)、學(xué)歷、有關(guān)的獎(jiǎng)勵(lì)和榮譽(yù)、教師對(duì)學(xué)生智力的評(píng)定等,常作為智力測(cè)驗(yàn)的效標(biāo),也可作為某些多重能力傾向測(cè)驗(yàn)和人格測(cè)驗(yàn)的效標(biāo)。2、實(shí)際工作表現(xiàn):是最滿(mǎn)意的效標(biāo)測(cè)量,為一般智力測(cè)驗(yàn)、人格測(cè)驗(yàn)和一些能力傾向測(cè)驗(yàn)的效標(biāo);3、特殊訓(xùn)練成績(jī);4、精神病診斷;5、等級(jí)評(píng)定:是觀察者根據(jù)測(cè)驗(yàn)欲測(cè)量的心理特質(zhì)在被試身上的表現(xiàn)而作出的一種個(gè)人判斷;6、效標(biāo)團(tuán)體的比較:即找出兩個(gè)在效標(biāo)表現(xiàn)上有差別的團(tuán)體,比較他們?cè)跍y(cè)驗(yàn)分?jǐn)?shù)上的差別;7、先前有效的測(cè)驗(yàn):一個(gè)新測(cè)驗(yàn)與先前有效的測(cè)驗(yàn)的相關(guān)也經(jīng)常作為效度檢驗(yàn)的證據(jù)。(二)效度的類(lèi)型根據(jù)效度評(píng)估方法不同,效度可以從六個(gè)角度來(lái)劃分:內(nèi)容、反應(yīng)過(guò)程、內(nèi)部結(jié)構(gòu)、與其他變量的關(guān)系、測(cè)驗(yàn)結(jié)果。1.內(nèi)容效度(contentvalidity)內(nèi)容效度就是檢驗(yàn)測(cè)驗(yàn)的內(nèi)容對(duì)所要考核范圍的代表性程度。例如面試的時(shí)候?qū)σ粋€(gè)技術(shù)人員所掌握的技術(shù)水平的測(cè)驗(yàn)可以通過(guò)選取不同水平的具有代表性的技術(shù)問(wèn)題來(lái)測(cè)量,這樣就能大致推斷技術(shù)人員的技術(shù)水平。

內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。目的→“構(gòu)念”→“構(gòu)念”具體化→確定測(cè)評(píng)內(nèi)容不同于其他幾種效度,內(nèi)容效度首先重點(diǎn)是強(qiáng)調(diào)新測(cè)量工具的建構(gòu)而不是己有測(cè)量工具的效度。設(shè)計(jì)并采用這種方法的目的是幫助確保測(cè)量工具的建構(gòu)是針對(duì)所要測(cè)量的內(nèi)容。這種方法主要是依靠專(zhuān)家根據(jù)經(jīng)驗(yàn)來(lái)判斷一個(gè)測(cè)量工具的效度,而不是依靠相關(guān)系數(shù)。因此,內(nèi)容效度被稱(chēng)作一種"描述性"效度。

為了確保內(nèi)容效度的客觀,可以通過(guò)以下的流程來(lái)保證:1.對(duì)所測(cè)量的內(nèi)容進(jìn)行全面的分析,盡可能地搜索到最齊全的資料。2.挑選參與內(nèi)容效度研究的專(zhuān)家,這些專(zhuān)家應(yīng)該能夠承擔(dān)相關(guān)測(cè)量范圍的職責(zé)并且具有這些職責(zé)所具備的知識(shí)、技術(shù)和能力。3.瓢選測(cè)量?jī)?nèi)容。4.評(píng)估顫選測(cè)量工具與被測(cè)量?jī)?nèi)容的相關(guān)性。2.基于反應(yīng)過(guò)程的效度

3.基于內(nèi)部結(jié)構(gòu)的效度——建構(gòu)效度建構(gòu)效度:指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想或特質(zhì)的程度,即測(cè)驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語(yǔ)或構(gòu)想,解釋的程度如何。

例如我捫根據(jù)理論的假設(shè)結(jié)構(gòu)來(lái)編制一份心理測(cè)量量表或者測(cè)驗(yàn),如果實(shí)際測(cè)量結(jié)果所測(cè)得的實(shí)際分?jǐn)?shù)經(jīng)過(guò)統(tǒng)計(jì)檢驗(yàn)?zāi)軌蛴行У亟忉屖茉囌叩男睦硖刭|(zhì),那么我們說(shuō)這個(gè)量表或者測(cè)驗(yàn)具有良好的建構(gòu)效度。

3.基于與其他變量的關(guān)系的效度—效標(biāo)關(guān)聯(lián)效度

(criterion-relatedvalidity)

(1)效標(biāo)與效標(biāo)測(cè)量

效標(biāo)是衡量一個(gè)測(cè)驗(yàn)有效性的參照標(biāo)準(zhǔn)。效標(biāo)測(cè)量就是將效標(biāo)轉(zhuǎn)化為某種可以操作的測(cè)量指標(biāo)。效標(biāo)具有四個(gè)特性:多樣性、復(fù)雜性、特殊性、時(shí)間性。(2)效標(biāo)關(guān)聯(lián)效度

效標(biāo)關(guān)聯(lián)效度是指測(cè)驗(yàn)與外在效標(biāo)間關(guān)聯(lián)的程度。即一個(gè)測(cè)驗(yàn)對(duì)處于特定情境中的個(gè)體行為進(jìn)行預(yù)測(cè)時(shí)的有效性(準(zhǔn)確性)。效標(biāo)效度主要考慮的是測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)之間的關(guān)系。

效標(biāo)關(guān)聯(lián)效度根據(jù)使用時(shí)間間隔的長(zhǎng)短又分為同時(shí)效度與預(yù)測(cè)效度。同時(shí)效度(concurrentvalidity)是指收集效標(biāo)材料與測(cè)驗(yàn)分?jǐn)?shù)差不多同時(shí)進(jìn)行,多用于對(duì)現(xiàn)有員工的測(cè)評(píng)。例如,有兩個(gè)智力測(cè)驗(yàn)A和B,A實(shí)施起來(lái)很費(fèi)時(shí)間,而B(niǎo)測(cè)驗(yàn)時(shí)間短。如果B的成績(jī)與A的成績(jī)有很高的相關(guān),則B可以作為A的替代測(cè)驗(yàn)。預(yù)測(cè)效度(predictivevalidity)是指收集效標(biāo)材料在實(shí)際測(cè)量結(jié)束后隔一段時(shí)間再獲得,多用于人員選拔和配置等工作。區(qū)分同時(shí)效度與預(yù)測(cè)效度的標(biāo)準(zhǔn)不是時(shí)間,而是測(cè)驗(yàn)的目的。前者主要用于測(cè)量現(xiàn)在的狀態(tài),后者主要用于預(yù)測(cè)未來(lái)的情況。例如,入學(xué)考試成績(jī)?nèi)裟軌蚝芎玫仡A(yù)測(cè)入學(xué)后的學(xué)習(xí)成績(jī)的話(huà),這個(gè)入學(xué)考試的預(yù)測(cè)效度就高。

(3)確定效標(biāo)關(guān)聯(lián)效度的方法

A.相關(guān)法

相關(guān)法是指計(jì)算測(cè)驗(yàn)結(jié)果分?jǐn)?shù)與效標(biāo)之間的相關(guān),得到的結(jié)果為效度系數(shù)。計(jì)算效度系數(shù)常用的相關(guān)方法是積差相關(guān)又叫皮爾森(Pearson)相關(guān)。

要使用積差相關(guān)必須同時(shí)具備如下兩個(gè)條件:①兩個(gè)變量都是由測(cè)量獲得的連續(xù)性數(shù)據(jù),即等距或等比數(shù)據(jù)。②兩個(gè)變量的總體都呈正態(tài)分布,或接近正態(tài)分布。一般來(lái)說(shuō),相關(guān)系數(shù)必須達(dá)到統(tǒng)計(jì)上的顯著水平。如果其他情況己定,那么效度系數(shù)越高越好。

B.區(qū)分度

區(qū)分度是指預(yù)測(cè)源分?jǐn)?shù)是否能區(qū)分由效標(biāo)測(cè)量所定義的群體。操作方法是選取兩種效標(biāo)A和B,先根據(jù)A將群體區(qū)分開(kāi)來(lái),再用B將群體區(qū)分開(kāi)來(lái),根據(jù)兩種效標(biāo)區(qū)分的結(jié)果來(lái)判斷,如果A和B區(qū)分的結(jié)果一致,那么說(shuō)明效度較高。C.命中率

命中率是根據(jù)測(cè)驗(yàn)所做的正確決定的比率。它主要用作取舍決策。某種測(cè)量工具的效度高不高,主要是看做的決定是否與實(shí)際一致,這就是命中率的高低。命中率包括有:總命中率、正命中率、負(fù)命中率。

對(duì)于測(cè)驗(yàn)的效果,從圖2-2中可以更直觀地理解。在左下角的正確拒絕區(qū)域中,我們可以看出,這部分的被試是屬于工作成績(jī)和測(cè)驗(yàn)分?jǐn)?shù)都很低的被試群體,所以拒絕這些被試是正確的;左上角的區(qū)域是工作成績(jī)高但是測(cè)驗(yàn)分?jǐn)?shù)卻相對(duì)較低的被試群體,這里如果拒絕了,顯然是錯(cuò)誤的;右下角的區(qū)域是屬于工作成績(jī)低但是測(cè)驗(yàn)分?jǐn)?shù)卻相對(duì)較高的被試群體,如果錄取了他們,顯然是錯(cuò)誤的;右上角的區(qū)域是工作成績(jī)高而且測(cè)驗(yàn)分?jǐn)?shù)也高的被試群體,錄取他們顯然是正確的。

5.基于測(cè)評(píng)結(jié)果的效度統(tǒng)計(jì)結(jié)論效度(衡量對(duì)測(cè)評(píng)數(shù)據(jù)進(jìn)行分析時(shí)所用程序與方法的有效性的指標(biāo))重點(diǎn)是測(cè)評(píng)本身的質(zhì)量和統(tǒng)計(jì)方法的恰當(dāng)性?xún)?nèi)部效度(目的:找出導(dǎo)致績(jī)效的原因)外部效度(測(cè)評(píng)結(jié)果能一般化和普遍適用于樣本所在的總體以及其他同類(lèi)總體)內(nèi)部效度是外部效度的必要條件,但不是充分條件(三)影晌效度的因素效度的大小主要受以下幾方面因素影響:1.測(cè)量工具本身因素

如果一個(gè)測(cè)量工具本身存在誤差,那么就是不可靠的。這些誤差越多,不可靠性就越大,效度也隨之降低。具體表現(xiàn)在測(cè)量?jī)?nèi)容的難度不適當(dāng)、區(qū)分度不高、試題題目描述內(nèi)容或選項(xiàng)設(shè)置存在迷惑性問(wèn)題、題目太多、測(cè)量?jī)?nèi)容的范圍太廣等。這些測(cè)量工具本身的因素對(duì)效度的影響是很大的,如果不注意控制,那么就無(wú)法保證測(cè)量的較高效度。2.樣本的因素人是復(fù)雜的,參加測(cè)試的人會(huì)受到各方面因素的影響,有可能一頓油膩的早飯就能讓一個(gè)參加測(cè)試的人臨場(chǎng)發(fā)揮表現(xiàn)不佳。被試者的情緒、動(dòng)機(jī)、興趣、身體健康、態(tài)度等方面的因素都會(huì)影響測(cè)試的效度。

在其他條件相同的情況下,被測(cè)者異質(zhì)性越高,效度越高,因?yàn)樾Ф仁艿奖辉噲F(tuán)體分?jǐn)?shù)分布的影響3.效標(biāo)污染效標(biāo)污染(contenoncontamination)是指效標(biāo)受到預(yù)測(cè)變量以外的變量的影響,偏見(jiàn)結(jié)果導(dǎo)致效度下降。例如當(dāng)我們想考核一個(gè)員工的工作績(jī)效的時(shí)候,如果評(píng)價(jià)者帶有個(gè)人的種族、性別偏見(jiàn)或者個(gè)人恩怨來(lái)考核下屬的時(shí)候,那么效標(biāo)就被污染了。顯然,這樣的考核結(jié)果肯定與實(shí)際情況相差甚遠(yuǎn),效度也隨之下降。而且上述行為對(duì)效度的影響程度也是無(wú)法預(yù)知的。

研究者可以通過(guò)以下的方法來(lái)控制效標(biāo)污染:一是改變效度研究本身的設(shè)計(jì);二是采用部分相關(guān)的統(tǒng)計(jì)方法。只有盡可能地控制效標(biāo)污染,才能更準(zhǔn)確地了解測(cè)量工具和效標(biāo)間的真實(shí)關(guān)系。四、信度和效度之間的關(guān)系根據(jù)前面所論述的信度和效度的定義和作用可以看出,信度和效度所解決的是不同類(lèi)型的誤差問(wèn)題。信度——一致性、穩(wěn)定性效度——有效性信度是一致性的函數(shù),不管它是否射在靶心上,只要是一種密集點(diǎn)狀態(tài)就可以。效度是準(zhǔn)確性的函數(shù),在這里就是射中靶心周?chē)c(diǎn)的函數(shù)。失敗的信度可以看作是一種隨機(jī)誤差,失敗的效度可以看作是一種系統(tǒng)誤差。缺乏信度或者效度的測(cè)量都是沒(méi)有用的。

可見(jiàn),效度是測(cè)量的首要條件,信度是效度的必要條件而非充分條件。

如果信度很低,那么效度也不可能高,因?yàn)槿绻麥y(cè)量的數(shù)據(jù)不準(zhǔn)確,就不能有效地說(shuō)明所研究的對(duì)象。即使信度很高,效度也未必高。

例如,如果我們想測(cè)量一個(gè)人的數(shù)學(xué)能力,但是測(cè)驗(yàn)是用文言文出題,而這個(gè)人的文言文能力很差,那么測(cè)量出來(lái)的結(jié)果是零分。因?yàn)闇y(cè)量的方法不得當(dāng),所以我們不能說(shuō)這個(gè)人的數(shù)學(xué)能力很差。這說(shuō)明信度很高,但是測(cè)量選擇的方法是錯(cuò)誤的,所以效度不高。

信度與效度的提升策略測(cè)評(píng)考官測(cè)評(píng)工具被測(cè)者施測(cè)場(chǎng)景每一次的加油,每一次的努力都是為了下一次更好的自己。3月-233月-23Friday,March10,2023天生我材必有用,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論