醫(yī)學(xué)課件問(wèn)卷與量表的編制講義_第1頁(yè)
醫(yī)學(xué)課件問(wèn)卷與量表的編制講義_第2頁(yè)
醫(yī)學(xué)課件問(wèn)卷與量表的編制講義_第3頁(yè)
醫(yī)學(xué)課件問(wèn)卷與量表的編制講義_第4頁(yè)
醫(yī)學(xué)課件問(wèn)卷與量表的編制講義_第5頁(yè)
已閱讀5頁(yè),還剩60頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、測(cè)量的定義 ? 測(cè)量的定義: 運(yùn)用一套符號(hào)系統(tǒng)去描述某個(gè)被觀察對(duì)象的某個(gè)屬性的過(guò)程 將某個(gè)研究者所關(guān)心的現(xiàn)象予以變量化的具體步驟,也就是把某一個(gè)屬性的內(nèi)容,以變量的形式來(lái)呈現(xiàn)。 ? 符號(hào)系統(tǒng)的表現(xiàn)形式 度量化(scaling):以數(shù)字的形式去呈現(xiàn)某個(gè)屬性的數(shù)量(quantities)。 分類(lèi)(classification):以分類(lèi)的模式,去界定被觀察對(duì)象的某個(gè)屬性或特質(zhì)是屬于何種類(lèi)型。 測(cè)量的種類(lèi)與形式 ?(1)根據(jù)具體對(duì)象分:認(rèn)知測(cè)驗(yàn)(成就檢測(cè)、智力檢測(cè)、能力傾向檢測(cè))與人格測(cè)驗(yàn)(態(tài)度、興趣、性格、道德) ?(2)依據(jù)目的分:描述性、預(yù)測(cè)性、診斷咨詢、挑選性、配置性、計(jì)劃性、研究性 ?(3)

2、依據(jù)檢測(cè)的材料分:文字性測(cè)驗(yàn)、非文字性測(cè)驗(yàn) ?(4)根據(jù)檢測(cè)的質(zhì)量要求分:標(biāo)準(zhǔn)化檢測(cè)與非標(biāo)準(zhǔn)化檢測(cè) ?(5)根據(jù)檢測(cè)的事實(shí)對(duì)象分:個(gè)別檢測(cè)、團(tuán)體檢測(cè) ?(6)根據(jù)檢測(cè)是否有時(shí)間限制:速度檢測(cè)、難度檢測(cè)、最佳行為檢測(cè)、典型行為檢測(cè) ?(7)根據(jù)檢測(cè)的具體領(lǐng)域:教育檢測(cè)、職業(yè)檢測(cè)、臨床檢測(cè)、研究性檢測(cè) 心理測(cè)量的功能 ? 收集研究資料 ? 建立和檢驗(yàn)理論假設(shè) ? 實(shí)驗(yàn)分組 ? 選拔人才 ? 人員安置 ? 心理診斷 ? 心理咨詢 ? 描述評(píng)價(jià) 心理測(cè)量的使用 ?使用資格: 心理專(zhuān)業(yè)本科以上學(xué)歷者; 在心理測(cè)量專(zhuān)家指導(dǎo)下具有兩年以上測(cè)驗(yàn)使用經(jīng)驗(yàn)者; 經(jīng)過(guò)心理測(cè)量培訓(xùn)班專(zhuān)門(mén)訓(xùn)練并獲得資格認(rèn)定書(shū)者。 ?測(cè)

3、驗(yàn)的保密: 保證測(cè)驗(yàn)的價(jià)值、防止測(cè)驗(yàn)的失效 保護(hù)個(gè)人隱私: 只有在必要的情況下,才詢問(wèn)個(gè)人隱私;保證為受測(cè)者保密;凡測(cè)驗(yàn)中必要涉及個(gè)人隱私就事先征得同意 測(cè)量的格式 ? 指量表的整體形式 結(jié)構(gòu)與非結(jié)構(gòu)化測(cè)量 ? 量表題目的特性 開(kāi)放性測(cè)量 ? 數(shù)字型問(wèn)題 ? 文字型問(wèn)題 封閉式測(cè)量 ? 類(lèi)別性測(cè)量 ? 連續(xù)性測(cè)量 編制測(cè)驗(yàn)的一般程序 (一) 確定測(cè)驗(yàn)的目的 (二) 擬定編制計(jì)劃 (三) 設(shè)計(jì)測(cè)試項(xiàng)目 (四) 項(xiàng)目的試測(cè)和分析 (五) 合成測(cè)驗(yàn) (六) 測(cè)試使用的標(biāo)準(zhǔn)化 (七) 搜集信度、效度資料 (八) 編寫(xiě)測(cè)驗(yàn)手冊(cè) 確定測(cè)驗(yàn)的目的 ? 明確對(duì)象 ? 明確目標(biāo) ? 明確用途 擬定編制計(jì)劃 ?

4、雙向細(xì)目表:測(cè)驗(yàn)項(xiàng)目;項(xiàng)目比例??捎脕?lái)核對(duì)項(xiàng)目是否覆蓋所測(cè)領(lǐng)域;確定項(xiàng)目分?jǐn)?shù) 設(shè)計(jì)測(cè)試項(xiàng)目 ? 收集資料 ? 選擇項(xiàng)目形式(全開(kāi)放型;單一反應(yīng)型;多重選擇型;雙極等級(jí)評(píng)定;利克特型;排序;分類(lèi)信息 ? 編寫(xiě)修訂項(xiàng)目(項(xiàng)目取樣代表性;項(xiàng)目范圍與測(cè)驗(yàn)計(jì)劃的一致性;項(xiàng)目數(shù)量的要求;項(xiàng)目難度的要求 項(xiàng)目的試測(cè)和分析 ? 預(yù)測(cè):與正式測(cè)驗(yàn)有一致性(同樣群體,情境一致);與正式測(cè)驗(yàn)不同(時(shí)限寬,人數(shù)不必太多) ? 項(xiàng)目分析:難度;區(qū)分度;答案的適當(dāng)性;內(nèi)容適當(dāng)性;表達(dá)清楚 合成測(cè)驗(yàn) ? 項(xiàng)目選擇:難度、區(qū)分度選擇 ? 項(xiàng)目的編排:并列直進(jìn)式、混合螺旋式 ? 編制復(fù)本:同一心理特質(zhì); 相同內(nèi)容范圍;題型相同

5、;題量相等;難度分布相同 Likert scale(李克特式量表) 題 目 1 非常不同意 4 同意 2 不同意 5 非常同意 3 沒(méi)所謂同意或不同意 1. 小孩不打不成器。 1 2 3 4 5 2. 打小孩是免不了的,只是不要當(dāng)著他人的面打就是了。 1 2 3 4 5 3. 教養(yǎng)小孩應(yīng)該恩威并施。 1 2 3 4 5 4. 即使小孩犯了大錯(cuò),應(yīng)考慮講理,再考慮輕微的體罰。 1 2 3 4 5 5. 打小孩不但不會(huì)有幫助,還會(huì)有反效果。 1 2 3 4 5 李克特式問(wèn)卷是廣泛應(yīng)用在社會(huì)與行為研究中的一種問(wèn)卷格式,適合于態(tài)度測(cè)量和意見(jiàn)的判定。典型的 Likert量表由一組測(cè)量某一個(gè)相同特質(zhì)或現(xiàn)象

6、的題目所組成,每一個(gè)題目均有相同的重要性。每一個(gè)單一的題目,包含了一個(gè)陳述句與一套量尺。量尺由一組連續(xù)數(shù)字所組成,每一個(gè)數(shù)字代表一定的程度,用以反映被試對(duì)于該陳述句同意、贊成或不同意、反對(duì)的程度。 李克特氏量表分?jǐn)?shù)的計(jì)算與運(yùn)用有一個(gè)基本的假設(shè),即數(shù)字與數(shù)字之間的距離是相同的,在這一假設(shè)下,不同的題目才可以加總得到一個(gè)量表的總分,因此 Likert量表又稱(chēng)為總加量表,表示量表的總分由個(gè)別題目加總所得。 ? 李克特式量表 編寫(xiě)的基本步驟 ? 編寫(xiě)項(xiàng)目(Item Generation) 編寫(xiě)出許多表面效度的項(xiàng)目。 ? 項(xiàng)目分析與選擇(Item Analysis and Selection) 計(jì)算項(xiàng)目

7、得分與總分的相關(guān)系數(shù),然后選擇10到20個(gè)相關(guān)程度最高的項(xiàng)目(0.80以上較好),以得到一量表。 ? 施測(cè)(Administration) 將項(xiàng)目隨機(jī)排列后,給被試填寫(xiě),且要安排反向題,以發(fā)現(xiàn)那些被試是完全不看項(xiàng)目?jī)?nèi)容,而只在按照某一個(gè)習(xí)慣作答。至于分?jǐn)?shù)的計(jì)算,則為被試各個(gè)項(xiàng)目得分的加總。因此又稱(chēng)為總加量表。 評(píng)價(jià) ? 優(yōu)點(diǎn) 最通用,因?yàn)槭褂煤?jiǎn)單。 ? 缺點(diǎn) 不一定為等距尺度。所以是否可由各項(xiàng)目得分相加以求算總分尚有待商榷。 被試間不一定存有可比較性。因此相同的分?jǐn)?shù)所代表的意義不一定相同。 被試內(nèi)不一定存有可比較性。所以一被試所謂的常常看電影與常常打籃球,所表示的實(shí)際頻率可能不同。 被試通常不

8、愿選擇太極端的值,或因順從社會(huì)規(guī)范而不誠(chéng)實(shí)作答,致使測(cè)量存在誤差。 Thurston scale(瑟斯頓量表) 以Thurstone格式所編寫(xiě)的量表稱(chēng)為T(mén)hurstone量表,此量表也是由一組測(cè)量某相同特質(zhì)的題目所組成,但是每一個(gè)題目具有不同的強(qiáng)度,被試勾選某一個(gè)題目時(shí),即可獲得一個(gè)強(qiáng)度分?jǐn)?shù),當(dāng)一組題目被評(píng)估完畢后,所有被勾選為同意的題目的強(qiáng)度分?jǐn)?shù)的中位數(shù),即代表該量表的分?jǐn)?shù)。 分?jǐn)?shù) 評(píng) 定 題 目 10.2 ?同意 ?不同意 1. 小孩不打不成器。 9.1 ?同意 ?不同意 2. 打小孩是免不了的,只是不要當(dāng)著他人的面打就是了。 6.2 ?同意 ?不同意 3. 教養(yǎng)小孩應(yīng)該恩威并施。 4.8

9、 ?同意 ?不同意 4. 即使小孩犯了大錯(cuò),應(yīng)考慮講理,再考慮輕微的體罰。 1.5 ?同意 ?不同意 5. 打小孩不但不會(huì)有幫助,還會(huì)有反效果。 Thurstone量表的編制 首先,編制者先將編寫(xiě)完成的一組題目(約數(shù)十個(gè)),交由一群相關(guān)的實(shí)務(wù)人員,請(qǐng)這些評(píng)估者按照個(gè)人喜好或?qū)崉?wù)上的重要性,將題目歸類(lèi),例如將最不重要或輕微的標(biāo)為1,最重要的歸為11,其它的依序給予1至11不同的數(shù)字,代表不同的重要性。評(píng)分完成之后,每一題可以計(jì)算出一個(gè)平均數(shù)或四分位差(Q Score),每一個(gè)題目的Q分?jǐn)?shù)如果越大,代表大家的評(píng)分越分散,重要性越模糊,但是如果大家一致認(rèn)為某個(gè)題目很重要或很不重要,該題目的Q分?jǐn)?shù)則會(huì)

10、越小,變異情況較小,模糊性低。研究者即依模糊性的高低選出最一致性的題目10至20題,并使其平均數(shù)能涵蓋不同輕度高低,組成一套Thurstone量表,此時(shí)這十幾題不但內(nèi)容上具有特定的重要性,而且模糊性低,且每個(gè)題目都有一定的重要性權(quán)重(即重要性平均數(shù))。 ?Thurstone量表完成后,由受測(cè)者逐題依“同意”或“不同意”作答,回答同意的題目計(jì)1分,并乘以該題重要性的權(quán)重得到個(gè)體分?jǐn)?shù),再以各題分?jǐn)?shù)的中數(shù)代表該量表的得分。 ?該量表的測(cè)量較Likert尺度更符合等距的原則,因此,該方法也被稱(chēng)為等距量表法。但是,該量表制作過(guò)于復(fù)雜,評(píng)分者選擇有其代表性與客觀性問(wèn)題,且耗時(shí)較多,因此并不經(jīng)常被采用。 (

11、4)評(píng)價(jià) ? 優(yōu)點(diǎn) 最符合用單一數(shù)值來(lái)表達(dá)一概念的要求。 ? 缺點(diǎn) 所測(cè)量的概念須定義得非常嚴(yán)謹(jǐn)并有一固定或順序性的模式存在,如嬰幼兒的發(fā)展階段;較難用在態(tài)度的測(cè)量上。 過(guò)程耗費(fèi)時(shí)間、人力。 不論所測(cè)量的概念為何,但若被試皆為異質(zhì)性的,也很難得到滿意的測(cè)量值。 語(yǔ)意差別測(cè)量 評(píng)定對(duì)象 : 大學(xué)教授 非常 有點(diǎn) 都不是 有點(diǎn) 非常 -2 1 0 1 2 溫暖的 _ _ _ _ _ 冷酷的 聰明的 _ _ _ _ _ 愚蠢的 忙碌的 _ _ _ _ _ 悠閑的 吹毛求疵的 _ _ _ _ _ 大而化之的 易于相處的 _ _ _ _ _ 難以相處的 語(yǔ)意差別測(cè)量 使用兩極化形容詞來(lái)表示測(cè)量的內(nèi)容。語(yǔ)

12、意差別法對(duì)于題目分?jǐn)?shù)的計(jì)算,除了個(gè)別的使用每一個(gè)形容詞配對(duì)來(lái)進(jìn)行平均數(shù)的計(jì)算之外,還可以將形容詞加總獲得總分來(lái)計(jì)算,因此,也是一種總加量表。 此外,除了可以用 Likert 量表的尺度之外,另一種替代的方法是以一段開(kāi)放的線段,讓被試自由點(diǎn)出其意見(jiàn)傾向,再以點(diǎn)選的距離來(lái)代表被試的強(qiáng)度,因此也被稱(chēng)為視覺(jué)類(lèi)比測(cè)量。 強(qiáng)迫選擇問(wèn)題 ? 強(qiáng)迫選擇問(wèn)題 1. 甲:我喜歡狂熱的,隨心所欲的聚會(huì)。 乙:我比較喜歡可以好好聊天,安安靜靜的聚會(huì)。 2. 甲:有很多電影,我喜歡一看再看。 乙:我不能忍受,看過(guò)的電影還要一看再看。 3. 甲:我常常希望自己能成為一位登山者。 乙:我不能了解為什么有人會(huì)冒險(xiǎn)去登山。 強(qiáng)

13、迫選擇問(wèn)題 強(qiáng)迫選擇問(wèn)題是利用兩個(gè)立場(chǎng)相反的描述句,其中一句代表正面的立場(chǎng),另一句代表反面的立場(chǎng),要求被試自兩者中選擇出比較接近自己想法的題目,然后將正面的題項(xiàng)勾選題數(shù)加總得到量表的總分。 強(qiáng)迫選擇量表主要在于改善 Likert量尺對(duì)于兩極端強(qiáng)度測(cè)量敏感度不足的問(wèn)題,當(dāng)被試在兩個(gè)立場(chǎng)向左的陳述句作二選一選擇時(shí),即明確的指出個(gè)人的立場(chǎng),而不會(huì)由中庸模糊的分?jǐn)?shù)。此外,強(qiáng)迫選擇問(wèn)題能夠回避一些反應(yīng)心向的問(wèn)題,減少被試以特定答題趨勢(shì)去回答問(wèn)題(例如中庸取向,一致偏高分作答等等)。 強(qiáng)迫選擇量表的缺點(diǎn)之一時(shí)量表的長(zhǎng)度比傳統(tǒng) Likert量表多出一倍,增加了編題者的工作量。 強(qiáng)迫選擇量表在銷(xiāo)售調(diào)查或民意測(cè)

14、驗(yàn)時(shí),用以了解被試的立場(chǎng)時(shí)有其強(qiáng)迫表態(tài)的優(yōu)點(diǎn)。 形容詞評(píng)定技術(shù) 問(wèn)題: 創(chuàng)意的廣告人特質(zhì) ? 對(duì)于一個(gè)具有創(chuàng)意的廣告工作者,你認(rèn)為下列人格特質(zhì)的重要性為何 ? 1 非常不重要 2 不重要 3 重要 4 非常重要 1. 熱情的 1 2 3 4 2. 理性的 1 2 3 4 3. 外向的 1 2 3 4 4. 冷靜的 1 2 3 4 5. 有耐心的 1 2 3 4 形容詞評(píng)定技術(shù) 形容詞表單可以說(shuō)時(shí)一種簡(jiǎn)化的Likert量尺的測(cè)量格式,正對(duì)某一個(gè)測(cè)量的對(duì)象或特制,研究者列出一組關(guān)鍵的形容詞,并要求被試針對(duì)各形容詞的重要性進(jìn)行評(píng)估。 形容詞表單是一種探索性的測(cè)量方法,一般研究中對(duì)于形容詞的選擇大多并

15、沒(méi)有理論依據(jù)。當(dāng)被試針對(duì)一組形容詞進(jìn)行判定之后,利用因素分析的技術(shù)來(lái)進(jìn)行分類(lèi)或以特定方式重新分組。在某些人格量表中,測(cè)驗(yàn)編制者基于特定的理論或?qū)嵶C的研究數(shù)據(jù),列出某一心理特質(zhì)相關(guān)的重要形容詞,組成形容詞表單,對(duì)被試進(jìn)行施測(cè),加總得到的分?jǐn)?shù)即代表該心理特質(zhì)的強(qiáng)度。 問(wèn)卷編制注意事項(xiàng) ? (1)項(xiàng)目至少能區(qū)分兩個(gè)組的不同 ? (2)避免裝假傾向 ? (3)避免默認(rèn)傾向 ? (4)避免社會(huì)贊許性 ? (5)避免無(wú)回答 ? (6)避免防衛(wèi)傾向 ? (7)避免暗示答案 問(wèn)卷編制注意事項(xiàng) (8)對(duì)籠統(tǒng)、抽象、含混概念不加操作性定義,造成問(wèn)卷設(shè)計(jì)者與調(diào)查對(duì)象或調(diào)查對(duì)象之間的理解不一致。 比如,“你的家庭布局

16、是:A學(xué)術(shù)氣氛 B現(xiàn)代化 C時(shí)髦 D整潔 E一般” (9)兩個(gè)以上概念在同一題目中出現(xiàn)。如“你經(jīng)常教小孩識(shí)字和算術(shù)嗎?”(使那些只教小孩識(shí)字或只教算術(shù)的家長(zhǎng)很犯難) (10)使用專(zhuān)門(mén)術(shù)語(yǔ)、行語(yǔ)、俗語(yǔ)。 (11)答案設(shè)置漏掉了綜合性的選擇項(xiàng)目。比如,你在為孩子選擇書(shū)包時(shí),首先重視的是書(shū)包的:A質(zhì)量 B容量 C價(jià)格 D色彩 問(wèn)卷編制注意事項(xiàng) (12)使用不肯定的詞,如“某些”、“相當(dāng)”、“非?!薄ⅰ敖?jīng)?!?。 (13)使用可作多種解釋?zhuān)饬x含糊的詞。如“你父親屬于哪一社會(huì)階層”(“屬于”可理解為“目前是”、“最終或應(yīng)該屬于”) (14)問(wèn)卷中出現(xiàn)調(diào)查對(duì)象未經(jīng)歷過(guò)的或不知道的,導(dǎo)致問(wèn)卷結(jié)果的虛假性。(

17、如要求學(xué)生從其并未看過(guò)的電影名稱(chēng)中挑選他最喜歡的一部) 問(wèn)卷編制注意事項(xiàng) (15)問(wèn)題的陳述使用否定句(特別是雙重否定句),致使答卷者忽略其中的否定詞而誤解題意,造成回答不真實(shí)。 (16)問(wèn)題帶有刺激性的詞,傷害調(diào)查對(duì)象的感情,使人受窘,引起反感。如“你家里有酒鬼嗎?” (17)問(wèn)題缺乏受限制的前提。比如,為了解高師生的職業(yè)理想變化情況,設(shè)問(wèn)“入學(xué)以來(lái),你從事教師職業(yè)的態(tài)度有所變化嗎?” (18)題目中供選擇的項(xiàng)目未包含所有的程度。 問(wèn)卷題目的編制的竅門(mén) 所設(shè)置的問(wèn)題與所研究的主題密切相關(guān); 題目應(yīng)清楚,無(wú)歧義; 盡量不要使用帶有傾向性的問(wèn)題; 所提出的問(wèn)題應(yīng)為被調(diào)查者能夠回答的問(wèn)題(在其知識(shí)

18、或經(jīng)驗(yàn)范圍內(nèi)); 盡量不提帶有社會(huì)壓力的問(wèn)題; 所提問(wèn)題應(yīng)盡量具體;所提問(wèn)題應(yīng)盡量具體;“你小時(shí)侯(在讀初中時(shí))暑你小時(shí)侯(在讀初中時(shí))暑假在家干什么” 問(wèn)題中提供選擇答案要么全列出來(lái),要么全不列;“在你的公司中你的升遷主要靠所創(chuàng)造的價(jià)值嗎?在你的公司中你的升遷主要靠所創(chuàng)造的價(jià)值嗎?” 問(wèn)卷題目的編制的竅門(mén) 對(duì)某些不易理解的問(wèn)題應(yīng)盡量作些簡(jiǎn)單解釋?zhuān)?詢問(wèn)回答者的切身體驗(yàn)比普遍提法要好; 采用多種方式減輕問(wèn)題可能給回答者帶來(lái)的社會(huì)壓力 投射式提問(wèn),提示其他人可能處于相同情景。“中學(xué)生對(duì)能否談戀愛(ài)有不同的看法,請(qǐng)你對(duì)下面的看法作出評(píng)定:A應(yīng)公開(kāi)提倡 B應(yīng)任其自然發(fā)展 C應(yīng)對(duì)其進(jìn)行淡化 D應(yīng)旗幟鮮明

19、地反對(duì) E其他” 假定性提問(wèn):假定回答者可能會(huì)否認(rèn)某種問(wèn)題,就要讓他無(wú)法否定。比如,“你第一次吸毒是在什么時(shí)候?” (假定他吸過(guò)毒,而不問(wèn)“你吸毒嗎?”) 迂回、間接地提問(wèn) 委婉性提問(wèn)。(清潔工“環(huán)境衛(wèi)生技師”) 第二部分 心理測(cè)驗(yàn)客觀性指標(biāo) 1、信度: reliability 2、 效度;validity 3、 項(xiàng)目分析(難度和鑒別力) 1、信度、信度 指測(cè)驗(yàn)結(jié)果的可靠程度。只有測(cè)驗(yàn)結(jié)果接近或等于實(shí)際真值,或多次測(cè)驗(yàn)結(jié)果十分接近,就可以認(rèn)為測(cè)驗(yàn)結(jié)果是可靠的。 科學(xué)的東西必須能夠重復(fù),兩次測(cè)驗(yàn)的結(jié)果必須具有一定的一致性,差異比較小,信度問(wèn)題實(shí)質(zhì)是一組被試兩次測(cè)驗(yàn)結(jié)果的一致性問(wèn)題。測(cè)驗(yàn)的可靠性,

20、是指對(duì)某一群體而言,不是針對(duì)某一個(gè)被試而言。 信度高低可以用相關(guān)系數(shù)來(lái)表示。 信度的作用和意義 作用:1)解釋預(yù)測(cè)個(gè)人分?jǐn)?shù)的意義 2)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)間的關(guān)系 3)確定測(cè)驗(yàn)好壞的一個(gè)指標(biāo);最理想 r=1.00 意義:1)信度系數(shù)為樣本測(cè)驗(yàn)分?jǐn)?shù)的總方差中有多少比例是真分?jǐn)?shù)方差,也就是測(cè)驗(yàn)的總變異中真分?jǐn)?shù)造成的變異占百分之幾; 2)測(cè)量的標(biāo)準(zhǔn)誤是有多大可能性真實(shí)分?jǐn)?shù)在某一分?jǐn)?shù)范圍內(nèi)。并且可以預(yù)測(cè)實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情況。 信度估計(jì)方法信度估計(jì)方法 (1)重測(cè)信度 同一量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的一致性程度。主要針對(duì)時(shí)間變量,采集數(shù)據(jù)方法是對(duì)同一組被試間隔一定的時(shí)間相同的測(cè)驗(yàn)重復(fù)測(cè)試

21、一次。時(shí)間間隔選擇依測(cè)驗(yàn)性質(zhì)和目的而定。 條件:所測(cè)特質(zhì)須是穩(wěn)定的;施測(cè)間隔期內(nèi),所測(cè)特質(zhì)沒(méi)有獲得更多的學(xué)習(xí)和訓(xùn)練;遺忘和練習(xí)效果基本相互抵消。 ?重測(cè)信度計(jì)算:皮爾遜積差相關(guān)法 YXssNxyr?(2)復(fù)本信度 又叫等值性系統(tǒng),考慮誤差來(lái)源是內(nèi)容取樣,采集數(shù)據(jù)方法:給被試施測(cè)兩個(gè)內(nèi)容等值但題目不同的測(cè)驗(yàn),即:一個(gè)測(cè)驗(yàn)有平行的兩個(gè)版本測(cè)驗(yàn)A、B,先作A式測(cè)驗(yàn),在最短時(shí)間內(nèi)再作測(cè)驗(yàn)B式,求兩組數(shù)值的相關(guān),計(jì)算積差相關(guān)法。 復(fù)本信度的高低反映兩個(gè)互為復(fù)本的測(cè)驗(yàn)等價(jià)的程度,而不是反映一個(gè)測(cè)驗(yàn)本身受隨機(jī)誤差影響的大小,關(guān)鍵取決于復(fù)本測(cè)驗(yàn)的選擇。 (3)分半信度(內(nèi)在一致性信度) 劈半信度或折半信度,如

22、智力測(cè)驗(yàn),成就測(cè)驗(yàn),是一種將測(cè)驗(yàn)分成等值的兩半來(lái)求相關(guān)系數(shù)的信度??疾煲粋€(gè)測(cè)驗(yàn)內(nèi)容兩半題目測(cè)量的是否同一個(gè)心理特點(diǎn)或行為。采集數(shù)據(jù)方法:一次測(cè)驗(yàn)結(jié)束后,將測(cè)驗(yàn)按一定標(biāo)準(zhǔn)分為等值的兩半,分別計(jì)算每位被試在兩半測(cè)驗(yàn)上的分?jǐn)?shù),求出相關(guān)系數(shù),計(jì)算用積差相關(guān)法。 常用的方法是將一個(gè)測(cè)驗(yàn)分裂為兩個(gè)假定相等而獨(dú)立的部分,然后計(jì)算這兩部分的得分相關(guān)系數(shù)(如奇偶項(xiàng)),之后再用斯皮爾曼布朗公式(r=2r/1+r)估計(jì)整個(gè)測(cè)驗(yàn)的信度。 (4)同質(zhì)性信度 同質(zhì)性信度:所有題目間的一致性程度,考慮測(cè)驗(yàn)內(nèi)容是否異質(zhì)。同質(zhì)性是測(cè)驗(yàn)單一特質(zhì)的必要條件。 判別標(biāo)準(zhǔn):題目間呈高正相關(guān)。數(shù)據(jù)采集方法:施測(cè)一次測(cè)驗(yàn),算出所有題的得分

23、,求出各題目的相關(guān)。 同質(zhì)性信度也是一種構(gòu)思效度,或叫結(jié)構(gòu)效度。 ?計(jì)算公式:克龍巴赫系數(shù) ?XSiSKK2211?例題:某態(tài)度量表共7題,100個(gè)被試在各題上得分的方差分別是0.81,0.82,0.79,0.83,0.85,0.76,0.77,測(cè)驗(yàn)總分的方差為14.00,求信度系數(shù)。 評(píng)分信度:考慮測(cè)驗(yàn)隨機(jī)誤差來(lái)源是評(píng)分者間的差別,由評(píng)分者造成,用積差相關(guān)法求得不同評(píng)分者所評(píng) 分值間的相關(guān)。 2個(gè)評(píng)分者用斯皮爾曼等級(jí)相關(guān)法,3人以上用肯德?tīng)柡椭C系數(shù)。 ?計(jì)算公式: YXRRNNDrR?D)1(6122?NRRNRRsNNNNKRWiiiii22222113112?影響信度的因素影響信度的因素

24、 1) 樣本特征樣本特征:樣本團(tuán)體得分分布的影響,樣本越分散信度越高;樣本團(tuán)體異質(zhì)性的影響,異質(zhì)性越高信度越高;樣本團(tuán)體平均能力水平的影響,平均能力越低信度越高 2) 測(cè)驗(yàn)的長(zhǎng)度測(cè)驗(yàn)的長(zhǎng)度:測(cè)驗(yàn)越長(zhǎng)題目越多,測(cè)驗(yàn)的內(nèi)容取樣就越有代表性;測(cè)驗(yàn)越長(zhǎng)被試的猜測(cè)因素影響越小,信度就高。 3) 測(cè)驗(yàn)的難度測(cè)驗(yàn)的難度:測(cè)驗(yàn)難度對(duì)信度有間接影響。對(duì)于人格測(cè)驗(yàn)、興趣、態(tài)度、價(jià)值觀等測(cè)驗(yàn),不存在難度問(wèn)題。從理論上說(shuō),只有難度水平為 50%時(shí),才能使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大,求得的信度也最高。 4) 測(cè)量的時(shí)間間隔測(cè)量的時(shí)間間隔:時(shí)間間隔只對(duì)重測(cè)信度和不同時(shí)測(cè)量的復(fù)本有影響,時(shí)間越短信度值越高。 2、 效度 它表示一

25、個(gè)測(cè)驗(yàn)實(shí)際測(cè)量出所測(cè)特性或功能的真實(shí)性程度,或指一個(gè)測(cè)驗(yàn)真正確實(shí)地測(cè)量到它所欲測(cè)量的東西的程度 。 含義:1)測(cè)驗(yàn)測(cè)量什么? 2)測(cè)驗(yàn)對(duì)測(cè)量目標(biāo)的測(cè)量精確度和真實(shí)性是多少? 鑒別一個(gè)測(cè)驗(yàn)的好壞,首要的指標(biāo)就是效度。 效度是針對(duì)測(cè)驗(yàn)?zāi)康亩缘?。不同測(cè)驗(yàn)有不同的目的。比如智力測(cè)驗(yàn),如果用來(lái)測(cè)驗(yàn)智力就可能是高效的,用來(lái)測(cè)驗(yàn)性格則肯定是無(wú)效的。所以在使用心理測(cè)驗(yàn)時(shí)必須明白測(cè)驗(yàn)的目的。 效度估計(jì)方法 (1)內(nèi)容效度 表示測(cè)驗(yàn)所選的題目(測(cè)題)符合所欲測(cè)驗(yàn)內(nèi)容的程度。是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為總體取樣的適當(dāng)性程度。用于成就測(cè)驗(yàn),不適合能力傾向和人格測(cè)驗(yàn) 確定內(nèi)容效度的方法: ? 邏輯法:專(zhuān)家判斷,專(zhuān)家對(duì)測(cè)

26、驗(yàn)題目進(jìn)行考核,看測(cè)驗(yàn)是否能夠測(cè)出所要測(cè)的內(nèi)容; ? 經(jīng)驗(yàn)法:經(jīng)驗(yàn)判斷,通過(guò)實(shí)踐檢查測(cè)驗(yàn)?zāi)芊駵y(cè)出欲測(cè)的內(nèi)容。 ?統(tǒng)計(jì)法:抽取兩套平行測(cè)驗(yàn),測(cè)同批被試求相關(guān) (2)結(jié)構(gòu)效度,也叫構(gòu)想效度,表示測(cè)驗(yàn)實(shí)際測(cè)量出所欲測(cè)量的心理結(jié)構(gòu)或特征的程度。用一個(gè)結(jié)構(gòu)框架去衡量效度。構(gòu)思效度無(wú)單一指標(biāo),由各方面證據(jù)累積直接來(lái)作出評(píng)價(jià)。 確定方法:測(cè)驗(yàn)內(nèi)部方法(內(nèi)容效度、同質(zhì)性信度),測(cè)驗(yàn)間方法(求與效度高測(cè)量相同特質(zhì)的舊測(cè)驗(yàn)的相關(guān)或與不同特質(zhì)的測(cè)驗(yàn)的相關(guān);因素分析法),效標(biāo)效度研究,實(shí)驗(yàn)和觀察法驗(yàn)證 (3)效標(biāo)關(guān)聯(lián)效度)效標(biāo)關(guān)聯(lián)效度 又稱(chēng)效標(biāo)效度,實(shí)證效度或準(zhǔn)則關(guān)聯(lián)效度。它是測(cè)驗(yàn)分?jǐn)?shù)與作為效標(biāo)的另一獨(dú)立測(cè)驗(yàn)結(jié)果之間

27、的一致性程度;或測(cè)驗(yàn)總分?jǐn)?shù)與外在標(biāo)準(zhǔn)之間的相關(guān)程度,反映的是用測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)如何的有效性程度。 同時(shí)效度:效標(biāo)資料與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得。主要用來(lái)查明新編測(cè)驗(yàn)的效度。 預(yù)測(cè)效度:效標(biāo)分?jǐn)?shù)在測(cè)驗(yàn)之后相當(dāng)長(zhǎng)時(shí)間獲得。主要用來(lái)評(píng)價(jià)測(cè)驗(yàn)的預(yù)測(cè)能力。反映從測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)任何效標(biāo)情境或一段時(shí)間后被試的行為表現(xiàn)程度 常用效標(biāo):學(xué)業(yè)成就,臨床診斷,實(shí)際工作表現(xiàn),特殊訓(xùn)練成績(jī),效標(biāo)團(tuán)體比較,先前有效測(cè)驗(yàn),等級(jí)評(píng)定。 ?實(shí)證效度確定方法 相關(guān)法 :計(jì)算測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)系數(shù) 區(qū)分法:被試接受測(cè)驗(yàn)并工作一段時(shí)間后,根據(jù)其工作成績(jī)分成好壞兩組,比較兩組原測(cè)驗(yàn)分?jǐn)?shù) 命中率:正命中率(測(cè)驗(yàn)選出的人中合格

28、中所占比例 );總命中率(測(cè)驗(yàn)所選出的人中合格人數(shù),淘汰的人中不合格的人數(shù)和與總?cè)藬?shù)之比 ) (4)表面效度 它是一個(gè)測(cè)驗(yàn)看起來(lái)好像是測(cè)量所要測(cè)的東西的程度,不是效度,不反映測(cè)驗(yàn)正測(cè)量的東西,只是外行人的一種評(píng)價(jià)。 影響效度的因素 1) 測(cè)驗(yàn)本身因素,包括:測(cè)驗(yàn)題目質(zhì)量,測(cè)驗(yàn)長(zhǎng)度,測(cè)驗(yàn)實(shí)施中的干擾,被試因素,增加測(cè)驗(yàn)誤差,降低測(cè)驗(yàn)效應(yīng)。 2) 測(cè)驗(yàn)施測(cè)的樣本性質(zhì)測(cè)驗(yàn)施測(cè)的樣本性質(zhì),樣本同質(zhì)性越高,效度越低。不同團(tuán)體對(duì)同一測(cè)驗(yàn)反應(yīng)可能不同;同一測(cè)驗(yàn),效度團(tuán)體性質(zhì)不同;樣本團(tuán)體的異質(zhì)性 3) 效標(biāo)的性質(zhì):若其它條件一樣,所測(cè)量的行為或心理特質(zhì)與效標(biāo)行為或特質(zhì)越相似,效度系數(shù)就越高 信度和效度的關(guān)系

29、信度和效度的關(guān)系 St2=Sco2+Ssp2+Se2 St2 :總分變差。 Sco2 :由所測(cè)量的心理特性引起的主要變差。 Ssp2 :由與所測(cè)量的特性無(wú)關(guān)的其它個(gè)別性質(zhì)所造成的變差(系統(tǒng)誤差引起的變差)。 Se2 :誤差變異。 rtt=(Sco2+Ssp2) / St2 ; Val= Sco2 / St2 信度和效度的關(guān)系說(shuō)明: 相同相同:信度和效度是以相關(guān)系統(tǒng)來(lái)表示的 不同不同:涉及的誤差不同,信度僅考慮偶然的隨機(jī)誤差占測(cè)驗(yàn)總變異的比例;效度則還包括與測(cè)驗(yàn)無(wú)關(guān)但穩(wěn)定的測(cè)量誤差 聯(lián)系: 1)信度是效度的必要而非充分條件,信度越高,效度不一定越高 2)效度是受信度制約的,在同一個(gè)測(cè)驗(yàn)里其信度必

30、然高于效度,至少相等。 3、項(xiàng)目分析(難度和鑒別力) 測(cè)驗(yàn)的好壞與項(xiàng)目(測(cè)題)的選擇有很大的關(guān)系,好的測(cè)題是鑒別力高并且難度適宜的項(xiàng)目。 項(xiàng)目分析三內(nèi)容 1) 誘答分析:每個(gè)項(xiàng)目只有一個(gè)正確答案其余均為誘答。2) 難度分析:通過(guò)率:回答某個(gè)項(xiàng)目的樣本中,正確回答該項(xiàng)目的人數(shù)P=R/N*100。 3) 鑒別力分析:鑒別力是對(duì)于所測(cè)量的心理特性的區(qū)分能力。 (1)項(xiàng)目難度 項(xiàng)目難度是衡量測(cè)題難易水平的數(shù)量指標(biāo)。估計(jì)項(xiàng)目難度的方法通常是以被試通過(guò)每個(gè)項(xiàng)目的百分比來(lái)決定的,如果一個(gè)項(xiàng)目通過(guò)百分比太高或太低,說(shuō)明該項(xiàng)目太易或太難,一般情況下這兩個(gè)項(xiàng)目應(yīng)該刪除。 通過(guò)率:回答某個(gè)項(xiàng)目的樣本中,正確回答該項(xiàng)目的人數(shù)P=R/N*100, ?二分法記分項(xiàng)目的難度 NRP ?通過(guò)率 極端分組法 ?LLHHLHNRNRPPP212?非二分法記分項(xiàng)目的難度 maxxxP ? (2)項(xiàng)目鑒別力(區(qū)分度) 它是衡量測(cè)題對(duì)不同水平被試區(qū)分程度的指標(biāo)。如

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論