教育統(tǒng)計(jì)與測(cè)量測(cè)量質(zhì)量_第1頁(yè)
教育統(tǒng)計(jì)與測(cè)量測(cè)量質(zhì)量_第2頁(yè)
教育統(tǒng)計(jì)與測(cè)量測(cè)量質(zhì)量_第3頁(yè)
教育統(tǒng)計(jì)與測(cè)量測(cè)量質(zhì)量_第4頁(yè)
教育統(tǒng)計(jì)與測(cè)量測(cè)量質(zhì)量_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

測(cè)量質(zhì)量分析難度與區(qū)分度信度與效度為了使測(cè)驗(yàn)得到的分?jǐn)?shù)準(zhǔn)確可靠,我們要求使用的測(cè)驗(yàn)是高質(zhì)量的,因此必須對(duì)分析測(cè)驗(yàn)的質(zhì)量,而測(cè)驗(yàn)又是由一個(gè)個(gè)題目或者說(shuō)測(cè)試項(xiàng)目所組成,整個(gè)測(cè)驗(yàn)質(zhì)量要高,必然要求各個(gè)題目的質(zhì)量要高。因此分析一個(gè)測(cè)驗(yàn)的質(zhì)量,一般就要從兩個(gè)方面來(lái)進(jìn)行:一是考察整個(gè)測(cè)驗(yàn)的質(zhì)量指標(biāo),即考察測(cè)驗(yàn)效度與信度;二是考察所含項(xiàng)目的質(zhì)量指標(biāo),即考察測(cè)驗(yàn)項(xiàng)目的難度和區(qū)分度。測(cè)驗(yàn)項(xiàng)目的難度測(cè)驗(yàn)項(xiàng)目的難度,就是被試完成項(xiàng)目作答任務(wù)時(shí)所遇到的困難程度。有的項(xiàng)目很容易,幾乎所有初試都能正確完成作答任務(wù);有的項(xiàng)目卻很難,只有少數(shù)高水平被試能正確完成任務(wù)。困難的項(xiàng)目,被試在其上得分的可能性就小,失分的可能性就大;容易的項(xiàng)目,被試在其上得分的可能性就大,失分的可能性就小??傊?,每一個(gè)測(cè)驗(yàn)項(xiàng)目都有自己的難度;不同項(xiàng)目間其難度常常是不同的。定量刻畫(huà)一個(gè)測(cè)驗(yàn)項(xiàng)目的被試作答困難程度的量數(shù)就叫項(xiàng)目的難度指數(shù)或難度系數(shù)。難度系數(shù)的求法最通用的項(xiàng)目難度系數(shù)的求法就是計(jì)算被試在項(xiàng)目上的得分率或者說(shuō)通過(guò)率。像選擇題這種測(cè)驗(yàn)項(xiàng)目,評(píng)分采取“全或無(wú)”的方式,答對(duì)給滿(mǎn)分,答錯(cuò)給零分,難度指數(shù)就可以求通過(guò)人數(shù)比例或稱(chēng)通過(guò)率。對(duì)于不采用“全或無(wú)”的方式給分的測(cè)驗(yàn)項(xiàng)目,難度系數(shù)的求取方法是先求所有被試在該項(xiàng)目上的平均得分值,可記為;再用它去對(duì)測(cè)驗(yàn)項(xiàng)目總分(滿(mǎn)分),可記為K,求比值,這個(gè)比值就是全體被試在該測(cè)驗(yàn)項(xiàng)目上的得分率即難度指數(shù)p了。R通過(guò)人數(shù)n接受測(cè)試的總?cè)藬?shù)P難度指數(shù)例如,有一滿(mǎn)分值K=5的試題,測(cè)試10名被試,實(shí)得成績(jī)?yōu)?,3,4.5,2,5,0,3.5,1,3,4要求其難度指數(shù)p。先求平均得分然后用平均得分值對(duì)滿(mǎn)分值求比整體試卷的難度,就是全體被試測(cè)驗(yàn)的總分平均值與全卷滿(mǎn)分的比值。有人覺(jué)得用得分率p來(lái)表示難度別扭,主張用失分率q來(lái)作為難度指數(shù)。得分率p是可以與失分率q相互轉(zhuǎn)換的,q=1-p。我們一般用得分率p來(lái)表示難度,但也有人用失分率q來(lái)表示難度,所以當(dāng)我們聽(tīng)取人家報(bào)告難度系數(shù)時(shí),一定要弄清是指p還是q值不同目的的測(cè)試,測(cè)驗(yàn)難度系數(shù)要求也不相同。一般的標(biāo)準(zhǔn)化測(cè)試,目的是要盡可以把握住被試的個(gè)別差異,因此希望測(cè)驗(yàn)后所有被試的分?jǐn)?shù)“盡可能拉開(kāi)距離”。這樣,測(cè)驗(yàn)項(xiàng)目的恰當(dāng)難度,就應(yīng)該是p值盡量接近0.5.如果一個(gè)測(cè)驗(yàn)對(duì)某一被試團(tuán)體來(lái)說(shuō),難度相對(duì)顯得大,那么,被試團(tuán)體中大多數(shù)人就會(huì)得低分,被試總分分布就會(huì)形成正偏態(tài)分布;如果相反,難度相對(duì)顯得小,被試團(tuán)體中就會(huì)有很多人得高分,總分分布就會(huì)形成負(fù)偏態(tài)。區(qū)分度項(xiàng)目區(qū)分度就是項(xiàng)目區(qū)別被試水平高低的能力的量度。項(xiàng)目是用來(lái)測(cè)試被試水平高低的;在所測(cè)特質(zhì)上,被試水平也不會(huì)人人相等,總是會(huì)有高低水平差異的。倘若,高水平被試,在測(cè)驗(yàn)項(xiàng)目上能利市中分,而低水平被試則只能得低分,測(cè)驗(yàn)項(xiàng)目區(qū)分被試高低的能力就強(qiáng);如果高水平被試和低水平被試在測(cè)驗(yàn)項(xiàng)目上所得分?jǐn)?shù)并無(wú)差別,項(xiàng)目提供不出被試水平差異的信息,它的區(qū)分能力就弱,更糟糕的是,高水平被試在測(cè)驗(yàn)項(xiàng)目上反而得低分,低水平被試在測(cè)驗(yàn)項(xiàng)目上所得分?jǐn)?shù)卻不低,這種項(xiàng)目的性能就跟測(cè)驗(yàn)?zāi)康南噙`背,只會(huì)起破壞作用。所以,項(xiàng)目區(qū)分度是測(cè)驗(yàn)性能的一個(gè)重要指標(biāo),說(shuō)明的正是項(xiàng)目對(duì)測(cè)驗(yàn)?zāi)康膩?lái)說(shuō)的有效性程度區(qū)分度度指數(shù)數(shù)的求求法計(jì)算被被試在在該項(xiàng)項(xiàng)目上上的得得分與與其測(cè)測(cè)驗(yàn)總總分的的相關(guān)關(guān)系數(shù)數(shù)。如如相關(guān)關(guān)一致致性高高就認(rèn)認(rèn)定該該項(xiàng)目目區(qū)分分力強(qiáng)強(qiáng);如如果相相關(guān)低低,甚甚至負(fù)負(fù)相關(guān)關(guān),就就認(rèn)定定為區(qū)區(qū)分力力弱整整形無(wú)無(wú)效的的項(xiàng)目目。這里,,確定定項(xiàng)目目區(qū)分分度的的標(biāo)準(zhǔn)準(zhǔn)就是是測(cè)驗(yàn)驗(yàn)總分分,要要考察察總分分高的的被試試在該該項(xiàng)目目上是是否也也得高高分,,總分分低的的被試試在該該項(xiàng)目目上是是否也也得低低分。。顯然然,這這種標(biāo)標(biāo)準(zhǔn)就就是測(cè)測(cè)驗(yàn)內(nèi)內(nèi)部而而非測(cè)測(cè)驗(yàn)外外部標(biāo)標(biāo)準(zhǔn)。。假定有有30名被被試在在兩個(gè)個(gè)項(xiàng)目目上的的題分分以及及全卷卷總分分情況況如下下表,,請(qǐng)計(jì)計(jì)算項(xiàng)項(xiàng)目①與項(xiàng)項(xiàng)目②②的區(qū)區(qū)分度度項(xiàng)目①計(jì)算項(xiàng)項(xiàng)目①①的區(qū)區(qū)分度度指數(shù)數(shù),也也就是是計(jì)算算被試試在該該項(xiàng)目目上的的得分分與總總分的的相關(guān)關(guān)系數(shù)數(shù)。項(xiàng)目①①為二二分稱(chēng)稱(chēng)名變變量,,總分分為連連續(xù)變變量,,該用用哪種種相關(guān)關(guān)法??需要用用點(diǎn)雙雙列相相關(guān),,點(diǎn)雙雙列相相關(guān)公公式為為:答對(duì)被被試的的比率率為::p=18/30==0.6答錯(cuò)被被試的的比率率為::q=0.4答對(duì)被被試的的總分分平均均成績(jī)績(jī):(100+100+98+……+)÷÷18=69.94答錯(cuò)被被試的的總分分平均均成績(jī)績(jī):(90+79+89+……+0)÷÷12=59.42所有被被試總總分標(biāo)標(biāo)準(zhǔn)差差:29.23項(xiàng)目②項(xiàng)目2與總總分都都為連連續(xù)變變量,,應(yīng)該該采用用哪種種相關(guān)關(guān)方法法呢??積差相相關(guān)的的公式式為::采用軟軟件分分析,,得到到結(jié)果果為高低分分組法法求取項(xiàng)項(xiàng)目區(qū)區(qū)分度度指數(shù)數(shù)的主主要辦辦法,,是求求題分分與總總分的的相關(guān)關(guān)系數(shù)數(shù)。但但是,,還有有一種種“高高低分分組求求得分分率差差”的的辦法法。方法::將全全體被被試按按總分分寡加加以排排隊(duì),,然后后取得得分最最多的的27%的的被試試作為為“高高分組組”,,得分分最少少的27%的被被試作作為““低分分組””,最最后求求這兩兩個(gè)組組上項(xiàng)項(xiàng)目得得分率率(通通過(guò)率率)的的差來(lái)來(lái)作為為區(qū)分分度指指數(shù)的的取值值。D=PH––PL以上面面的30名名被試試為例例先將30名名被試的總總分從高至至低排序30人的27%:30*27%=8.1=8((人)計(jì)算高分組組8人的得得分率PH:PH1=0.63;PH2=4.44/5=0.89計(jì)算低分組組8人的得得分率PL:PL1=0.50;Pl2=2.06/5=0.41D1=PH1–PL1=0.13;D2=PH2–PL2=0.48用高低分組組法丟棄了了中部的數(shù)數(shù)據(jù),因此此只能是較較為粗糙的的估計(jì)值,,當(dāng)被試總總?cè)藬?shù)夠多多,高分組組與低分組組容量都相相當(dāng)大時(shí),,這種估計(jì)計(jì)值還是可可以滿(mǎn)足實(shí)實(shí)用要求的的。所以高高、低分組組法,是一一種常用的的項(xiàng)目區(qū)分分度指數(shù)求求取方法。。項(xiàng)目區(qū)分度度指數(shù)的取取值范圍,,跟一般的的相關(guān)系數(shù)數(shù)的取值范范圍一樣,,在-1.00至+1.00之間。如果項(xiàng)目區(qū)區(qū)分度指數(shù)數(shù)D≤0.20,項(xiàng)項(xiàng)目應(yīng)該被被淘汰如果0.2<D<<0.3,需要修改改如果0.3≤D<<0.4,合格如果0.4≤D,性能優(yōu)優(yōu)良測(cè)驗(yàn)信度測(cè)驗(yàn)信度,,就是測(cè)驗(yàn)驗(yàn)在測(cè)量它它所測(cè)特質(zhì)質(zhì)時(shí)得到的的分?jǐn)?shù)的一一致性(穩(wěn)穩(wěn)定性)。。它是反映映測(cè)驗(yàn)性能能的一個(gè)重重要的質(zhì)量量指標(biāo)。各種類(lèi)型的的測(cè)量,無(wú)無(wú)論是物理理測(cè)量還是是教育與心心理測(cè)量,,先后對(duì)同同一對(duì)象施施測(cè),所得得測(cè)量值都都很難做到到絕對(duì)一致致。同一教育與與心理測(cè)驗(yàn)驗(yàn)先后向同同一被試對(duì)對(duì)象施測(cè),,所得測(cè)值值會(huì)系統(tǒng)地地起伏變化化,原因是是多方面的的。這可以以是由于測(cè)測(cè)驗(yàn)項(xiàng)目抽抽樣不妥,,或語(yǔ)言表表達(dá)引起誤誤解,也可可以是施測(cè)測(cè)環(huán)境影響響,施測(cè)時(shí)時(shí)指導(dǎo)語(yǔ)、、完成時(shí)限限、主被試試關(guān)系的影影響或者是是評(píng)分過(guò)程程的偏向與與誤差,還還可以是被被試的動(dòng)機(jī)機(jī)和情緒等等因素所造造成的。測(cè)驗(yàn)信度,,就是指對(duì)對(duì)這種無(wú)系系統(tǒng)的隨機(jī)機(jī)誤差的控控制。測(cè)驗(yàn)驗(yàn)本身抗干干擾能力強(qiáng)強(qiáng),測(cè)驗(yàn)實(shí)實(shí)施過(guò)程各各方面誤差差因素都控控制得好,,多次施測(cè)測(cè)時(shí)所得分分?jǐn)?shù)的一致致性程度就就會(huì)好,這這就叫測(cè)驗(yàn)驗(yàn)信度高,,人們?cè)谑故褂盟脺y(cè)測(cè)值時(shí)就會(huì)會(huì)感覺(jué)可靠靠。改進(jìn)測(cè)驗(yàn)信信度,就是是要努力從從各個(gè)方面面控制測(cè)量量誤差,使使所得分?jǐn)?shù)數(shù)(測(cè)值))盡量接近近被試在所所測(cè)特質(zhì)上上的真值。。如果從測(cè)驗(yàn)驗(yàn)實(shí)施過(guò)程程中實(shí)際得得到的被試試分?jǐn)?shù),叫叫做觀察分分?jǐn)?shù),這可可記為X;;被試在所所測(cè)特質(zhì)上上客觀具有有的水平值值,叫真分分?jǐn)?shù),這可可記為T(mén),,那么,觀觀察分?jǐn)?shù)與與真分?jǐn)?shù)的的差就是測(cè)測(cè)量誤差,,它可記為為E。X=T+E信度的測(cè)量量方法與種種類(lèi)重測(cè)相關(guān)法法(重測(cè)信信度)平行相關(guān)法法(復(fù)本信信度)內(nèi)部一致性性系數(shù)法((折半系數(shù)數(shù),a-系系數(shù))重測(cè)信度同一測(cè)驗(yàn)向向同一批被被試重測(cè)兩兩次,將得得到的兩批批獨(dú)立測(cè)值值進(jìn)行相關(guān)關(guān)分析,求求出相關(guān)系系數(shù),就可可為測(cè)驗(yàn)信信度的估計(jì)計(jì)值。這樣的相關(guān)關(guān)系數(shù),就就叫信度系系數(shù),一般般記為rxx。例如,編制制了一個(gè)詞詞匯理解測(cè)測(cè)驗(yàn),測(cè)試試一批被試試共15人人,頭一次次測(cè)驗(yàn)與第第二次測(cè)驗(yàn)驗(yàn)分開(kāi)獨(dú)立立進(jìn)行,間間隔時(shí)間兩兩周。所獲獲資料如下下表:計(jì)算兩次測(cè)測(cè)驗(yàn)的相關(guān)關(guān)系數(shù)———積差相關(guān)關(guān)Rxx=0.94由于重測(cè)法法十分強(qiáng)調(diào)調(diào)特質(zhì)的穩(wěn)穩(wěn)定性,所所以,用這這種方法求求取的信度度系數(shù)就叫叫做穩(wěn)定性性系數(shù)大家討論一一下重測(cè)信信度的局限限性復(fù)本信度復(fù)本信度是是指通過(guò)使使用兩個(gè)平平行形式的的測(cè)驗(yàn)來(lái)測(cè)測(cè)查同一批批被試,這這樣也可獲獲得同一批批被試的兩兩批獨(dú)立值值,從而通通過(guò)求相關(guān)關(guān)系數(shù),估估出測(cè)驗(yàn)的的信度。這要求兩個(gè)個(gè)測(cè)驗(yàn)所測(cè)測(cè)的東西實(shí)實(shí)質(zhì)完全相相同,只是是使用的具具體測(cè)驗(yàn)項(xiàng)項(xiàng)目不同。。這種用平行行形式相關(guān)關(guān)求得的信信度系數(shù),,因?yàn)樘貏e別強(qiáng)調(diào)兩測(cè)測(cè)驗(yàn)形式的的等值關(guān)系系,所以又又叫等值性性系數(shù)。內(nèi)部一致性性系數(shù)利用單一測(cè)測(cè)驗(yàn)內(nèi)的項(xiàng)項(xiàng)目之間的的一致性關(guān)關(guān)系來(lái)估出出測(cè)驗(yàn)信度度。常用的有折折半相關(guān)系系數(shù),a系系數(shù)折半相關(guān)系系數(shù)“折半”是是指將一個(gè)個(gè)測(cè)驗(yàn)拆成成兩個(gè)半測(cè)測(cè)驗(yàn),再計(jì)計(jì)算兩個(gè)半半測(cè)驗(yàn)的相相關(guān)系數(shù),,通過(guò)此相相關(guān)系數(shù)來(lái)來(lái)估計(jì)整個(gè)個(gè)測(cè)驗(yàn)的信信度。拆分測(cè)驗(yàn),,可以采用用項(xiàng)目序號(hào)號(hào)拆分,奇奇數(shù)項(xiàng)目構(gòu)構(gòu)成半個(gè)測(cè)測(cè)驗(yàn),偶數(shù)數(shù)項(xiàng)目構(gòu)成成另外半個(gè)個(gè)測(cè)驗(yàn),例例如:rxx=0.86由“半測(cè)驗(yàn)驗(yàn)”得來(lái)的的相關(guān)系數(shù)數(shù),還需要要進(jìn)行校正正,才能得得到估計(jì)““全測(cè)驗(yàn)””的信度系系數(shù),校正正公式是::ru是經(jīng)校正后后的“全測(cè)測(cè)驗(yàn)”信度度系數(shù)值rxx是“半測(cè)驗(yàn)驗(yàn)”上的信信度系數(shù)值值a一致性系系數(shù)用折半法求求測(cè)驗(yàn)信度度系數(shù),可可以利用單單一測(cè)驗(yàn)形形式作施測(cè)測(cè)所得數(shù)據(jù)據(jù)來(lái)進(jìn)行,,顯得簡(jiǎn)單單有效。但但問(wèn)題是要要把一個(gè)現(xiàn)現(xiàn)成的測(cè)驗(yàn)驗(yàn)分拆成真真正平行等等值的兩半半,卻并不不容易。那那能否不作作分拆而直直接利用單單一形式作作一次施測(cè)測(cè)所獲資料料來(lái)估計(jì)測(cè)測(cè)驗(yàn)信度呢呢?于是就有人人研究提出出了求a-系數(shù)的辦辦法,公式式是:a就是是測(cè)驗(yàn)信度度系數(shù)n是測(cè)測(cè)驗(yàn)所含項(xiàng)項(xiàng)目個(gè)數(shù)是被試在第第i個(gè)項(xiàng)目目上得分的的方差是被試總分分的方差折半法(經(jīng)經(jīng)校正)求求信度系數(shù)數(shù),可以看看成在測(cè)驗(yàn)驗(yàn)內(nèi)部求項(xiàng)項(xiàng)目間的相相關(guān);研究究說(shuō)明,求求a-系數(shù)數(shù),也可看看成在測(cè)驗(yàn)驗(yàn)內(nèi)部求項(xiàng)項(xiàng)目間的相相關(guān)。因此此,折半相相關(guān)系數(shù)和和a-系數(shù)數(shù)都被叫做做測(cè)驗(yàn)的內(nèi)內(nèi)部一致性性系數(shù)。測(cè)驗(yàn)的內(nèi)部部一致性系系數(shù)取值高高,說(shuō)明測(cè)測(cè)驗(yàn)項(xiàng)目同同質(zhì)性好,,都在有效效測(cè)查同一一特質(zhì)。信度系數(shù)的的應(yīng)用信度系數(shù)取取值大,所所得測(cè)值偏偏離真分?jǐn)?shù)數(shù)值的幅度度就小,誤誤差就得到到了較好控控制。而實(shí)實(shí)際測(cè)驗(yàn)中中所得測(cè)值值偏離真分分?jǐn)?shù)的程度度,被叫做做測(cè)量標(biāo)準(zhǔn)準(zhǔn)誤差??煽捎洖镾EM,它跟跟信度系數(shù)數(shù)之間顯然然存在著必必然的聯(lián)系系。這種關(guān)關(guān)系可定量量地表示為為:rxx是測(cè)測(cè)驗(yàn)驗(yàn)的的信信度度系系數(shù)數(shù);;SX是被被試試在在該該測(cè)測(cè)驗(yàn)驗(yàn)上上所所得得觀觀察察分分?jǐn)?shù)數(shù)的的標(biāo)標(biāo)準(zhǔn)準(zhǔn)差差。。假設(shè)設(shè)52名名被被試試在在拼拼寫(xiě)寫(xiě)測(cè)測(cè)驗(yàn)驗(yàn)中中,,所所得得分分?jǐn)?shù)數(shù)的的標(biāo)標(biāo)準(zhǔn)準(zhǔn)差差SX=9.48,已已知知拼拼寫(xiě)寫(xiě)測(cè)測(cè)驗(yàn)驗(yàn)的的信信度度系系數(shù)數(shù)rxx=0.92,,按按照照上上述述公公式式,,該該測(cè)測(cè)驗(yàn)驗(yàn)的的測(cè)測(cè)量量標(biāo)標(biāo)準(zhǔn)準(zhǔn)誤誤為為::也就就是是說(shuō)說(shuō),,該該拼拼寫(xiě)寫(xiě)測(cè)測(cè)驗(yàn)驗(yàn)所所測(cè)測(cè)52名名被被試試的的真真分分?jǐn)?shù)數(shù),,并并不不恰恰好好就就是是所所測(cè)測(cè)到到的的觀觀察察值值。。觀觀察察分分?jǐn)?shù)數(shù)與與真真分分?jǐn)?shù)數(shù)有有一一定定程程度度的的偏偏離離,,大大約約偏偏離離2.68分分。。就就最最高高分分59分分的的被被試試來(lái)來(lái)說(shuō)說(shuō),,其其真真分分?jǐn)?shù)數(shù)值值應(yīng)應(yīng)為為59+2.68==61.68((分分)),,或或59-2.68==56.32((分分)),,或或其其間間的的任任何何一一個(gè)個(gè)值值。。從以以上上公公式式可可以以看看出出,,測(cè)測(cè)量量標(biāo)標(biāo)準(zhǔn)準(zhǔn)誤誤的的大大小小,,取取決決于于測(cè)測(cè)驗(yàn)驗(yàn)值值信信度度系系數(shù)數(shù)rxx取值值的的高高低低。。rxx值越越高高,,則則觀觀察察分分?jǐn)?shù)數(shù)偏偏離離真真分分?jǐn)?shù)數(shù)越越小小。。假設(shè)設(shè)上上述述例例子子中中測(cè)測(cè)驗(yàn)驗(yàn)的的信信度度為為0.82,,則則其其SEM==4.02;;如如果果信信度度為為0.98,則則其其SEM==1.34.一個(gè)個(gè)測(cè)測(cè)驗(yàn)驗(yàn)其其信信度度系系數(shù)數(shù)rxx的取取值值處處在在0.00和和1.00之之間間;;當(dāng)當(dāng)然然值值越越高高越越好好。。一一般般來(lái)來(lái)說(shuō)說(shuō),,公公開(kāi)開(kāi)大大規(guī)規(guī)模模使使用用的的標(biāo)標(biāo)準(zhǔn)準(zhǔn)化化測(cè)測(cè)驗(yàn)驗(yàn),,其其信信度度系系數(shù)數(shù)的的取取值值不不應(yīng)應(yīng)小小于于0.90;;主主要要用用來(lái)來(lái)起起預(yù)預(yù)測(cè)測(cè)作作用用的的標(biāo)標(biāo)準(zhǔn)準(zhǔn)化化測(cè)測(cè)驗(yàn)驗(yàn),,希希望望能能更更大大一一點(diǎn)點(diǎn),,最最好好能能接接近近或或大大于于0.95;;當(dāng)當(dāng)然然,,教教師師自自編編的的課課堂堂測(cè)測(cè)驗(yàn)驗(yàn),,對(duì)對(duì)其其信信度度系系數(shù)數(shù)值值的的要要求求就就不不能能過(guò)過(guò)高高測(cè)驗(yàn)效度測(cè)驗(yàn)效度,就就是測(cè)驗(yàn)實(shí)際際上測(cè)到它打打算要測(cè)的東東西的程度。。真正測(cè)到了要要測(cè)的東西,,就是有效、、效度高;否否則,就是無(wú)無(wú)效或不十分分有效,就是是效度低。顯顯然,測(cè)驗(yàn)只只有真正測(cè)到到了要測(cè)的特特性、特質(zhì)、、結(jié)構(gòu),測(cè)驗(yàn)驗(yàn)結(jié)果即測(cè)驗(yàn)驗(yàn)分?jǐn)?shù)的應(yīng)用用與解釋?zhuān)挪拍芷鸬剿鼞?yīng)應(yīng)起的作用,,才能發(fā)揮出出有效性。因此,測(cè)驗(yàn)效效度就是測(cè)驗(yàn)驗(yàn)工具的正確確性問(wèn)題,是是測(cè)驗(yàn)分?jǐn)?shù)的的真實(shí)有效性性問(wèn)題,是測(cè)測(cè)驗(yàn)質(zhì)量高低低的根本表現(xiàn)現(xiàn)所在,是測(cè)測(cè)驗(yàn)性能的最最重要的指標(biāo)標(biāo)。心理與教育測(cè)測(cè)量具有間接接性特點(diǎn),所所測(cè)對(duì)象是被被試的內(nèi)部心心理特性、特特質(zhì)或結(jié)構(gòu),,測(cè)量工具是是否真正測(cè)到到了它,絕非非一目了然,,而且,這種種特性、特質(zhì)質(zhì)、結(jié)構(gòu)本身身到底什么樣樣,許多都沒(méi)沒(méi)有公認(rèn)的定定義,甚至還還存在嚴(yán)重的的分歧。如語(yǔ)言能力和和水平,就是是一個(gè)不很清清楚概念,它它的內(nèi)涵與外外延是什么,,存在著分歧歧,那測(cè)量語(yǔ)語(yǔ)言能力就存存在著很大的的困難。也許許目的是測(cè)量量語(yǔ)言能力但但是實(shí)際測(cè)到到的是語(yǔ)言知知識(shí)。效度的種類(lèi)根據(jù)驗(yàn)證測(cè)驗(yàn)驗(yàn)效度的角度度與方法的差差異,可以把把效度驗(yàn)證工工作大體分為為三類(lèi),即內(nèi)內(nèi)容效度、效效標(biāo)關(guān)聯(lián)效度度和結(jié)構(gòu)效度度。三種效度度說(shuō)明的都是是測(cè)驗(yàn)的正確確性,不過(guò)是是從三個(gè)不同同的方面來(lái)說(shuō)說(shuō)明而已。內(nèi)容效度———通過(guò)對(duì)測(cè)所所含項(xiàng)目作內(nèi)內(nèi)容的系統(tǒng)考考察,以確定定由這些項(xiàng)目目所構(gòu)成的測(cè)測(cè)驗(yàn),是否是是測(cè)驗(yàn)應(yīng)測(cè)特特質(zhì)行為領(lǐng)域域的代表性樣樣本。代表性程度高高,就是內(nèi)容容效度好;代代表性程度低低,就是內(nèi)容容效度差;根根本不具任何何代表性,就就是全無(wú)內(nèi)容容效度。內(nèi)容效度內(nèi)容效度的分分析首先就要要求測(cè)驗(yàn)所測(cè)測(cè)特質(zhì)涵蓋的的整個(gè)行為領(lǐng)領(lǐng)域有明確的的范圍,有比比較清楚的組組織結(jié)構(gòu)。但但許多心理特特質(zhì),如“智智力”、“創(chuàng)創(chuàng)造力”等,,都是外延范范圍不明、內(nèi)內(nèi)部結(jié)構(gòu)復(fù)雜雜,人們對(duì)其其看法很不統(tǒng)統(tǒng)一、無(wú)法滿(mǎn)滿(mǎn)足上述要求求的測(cè)量對(duì)象象。所以,內(nèi)內(nèi)容效度主要要適應(yīng)于對(duì)學(xué)學(xué)業(yè)成就測(cè)驗(yàn)驗(yàn)的正確有效效性的分析。。主要分析測(cè)測(cè)驗(yàn)項(xiàng)目所考考核的知識(shí)技技能覆蓋面、、能力水平的的考核情況、、以及各部分分內(nèi)容的深度度廣度與結(jié)構(gòu)構(gòu)比例等。分析的辦法一一般是請(qǐng)學(xué)科科專(zhuān)家作出系系統(tǒng)評(píng)判;側(cè)側(cè)重定性分析析,也輔之以以定量評(píng)價(jià);;還可以采用用恰當(dāng)辦法把把不同遙意見(jiàn)見(jiàn)綜合起來(lái)。。有一個(gè)跟內(nèi)容容效度有關(guān)的的概念叫表面效度,指的是從被被試或非專(zhuān)業(yè)業(yè)人員看來(lái),,測(cè)驗(yàn)表現(xiàn)得得是否在有效效地測(cè)驗(yàn)著應(yīng)應(yīng)測(cè)的東西。。在那些需要被被試盡其所能能對(duì)所測(cè)問(wèn)題題正確作答的的測(cè)驗(yàn)中,比比如學(xué)業(yè)成就就與智力測(cè)驗(yàn)驗(yàn)中,它有改改善與被試合合作關(guān)系的作作用。由于合合作改進(jìn),測(cè)測(cè)驗(yàn)質(zhì)量也就就更有保證。。這樣的測(cè)驗(yàn)驗(yàn),應(yīng)力爭(zhēng)有有高的表面效效度。而人格格測(cè)驗(yàn)和態(tài)度度測(cè)量等,有有時(shí)被試并不不愿意直陳自自己內(nèi)心想法法,所以就不不必明白在測(cè)測(cè)查什么,不不必追求高的的表面效度。。效標(biāo)關(guān)聯(lián)效度度效標(biāo)關(guān)聯(lián)效度度就是指測(cè)驗(yàn)驗(yàn)預(yù)測(cè)個(gè)體在在類(lèi)似或某種種特定情境下下行為表現(xiàn)的的有效性。這這里的“預(yù)測(cè)測(cè)”既指同時(shí)時(shí)性的類(lèi)似情情境下的行為為的“預(yù)測(cè)””,也指間隔隔一段時(shí)間特特定情境下的的行為的“預(yù)預(yù)測(cè)”。因此,效標(biāo)關(guān)關(guān)聯(lián)效度又包包含“并存””效度和“預(yù)預(yù)測(cè)”效度這這兩個(gè)小類(lèi)別別。效標(biāo)關(guān)聯(lián)效度度是可以測(cè)量量的,可以通通過(guò)求取有待待驗(yàn)證的測(cè)驗(yàn)驗(yàn)的測(cè)值與效效標(biāo)測(cè)驗(yàn)所得得的測(cè)值之間間的相關(guān)系數(shù)數(shù)獲得。得到到的相關(guān)系數(shù)數(shù),就叫效度度系數(shù)結(jié)構(gòu)效度結(jié)構(gòu)效度指的的是測(cè)驗(yàn)測(cè)行行心理學(xué)理論論所定義的某某一心理結(jié)構(gòu)構(gòu)或特質(zhì)的程程度。這種結(jié)結(jié)構(gòu)或特質(zhì)的的例子有智力力、學(xué)術(shù)能力力傾向、人格格結(jié)構(gòu)以及焦焦慮等。這種結(jié)構(gòu)或特特質(zhì)都是理論論上定義的,,其內(nèi)涵與外外延并不十分分確定,人們們之間的看法法也可能有分分歧;但又的的確反映了客客觀存在著的的心理現(xiàn)象與與事實(shí),所以以又是可測(cè)的的。通過(guò)分析析這些結(jié)構(gòu)與與特質(zhì)的性質(zhì)質(zhì),可以推論論出一些假設(shè)設(shè),然后使用用測(cè)驗(yàn)來(lái)檢驗(yàn)驗(yàn)這些假設(shè)。。倘若測(cè)驗(yàn)結(jié)結(jié)果能證實(shí)這這些假設(shè),那那么這就從一一個(gè)方面驗(yàn)證證了測(cè)驗(yàn)的結(jié)結(jié)構(gòu)效度。比如,我們知知道,智力在在人們兒童和和青少年時(shí)期期,會(huì)隨年齡齡增長(zhǎng)而發(fā)展展提高,因此此,智力測(cè)驗(yàn)驗(yàn)的分?jǐn)?shù)也應(yīng)應(yīng)隨年齡增大大而增加,直直到個(gè)人成熟熟為止。如果果所編出的智智力測(cè)驗(yàn),施施測(cè)結(jié)果說(shuō)明明情況果真如如此,能證實(shí)實(shí)這種看法,,我們就說(shuō)從從發(fā)展成熟的的角度看,所所編智力測(cè)驗(yàn)驗(yàn)確具有較好好的結(jié)構(gòu)效度度。效度系數(shù)與估估計(jì)標(biāo)準(zhǔn)誤驗(yàn)證測(cè)驗(yàn)實(shí)測(cè)測(cè)值與效標(biāo)測(cè)測(cè)量值之間的的相關(guān)系數(shù),,就是效度系系數(shù)。一般為為符號(hào)rxy表示。一般來(lái)說(shuō),測(cè)測(cè)驗(yàn)即使相當(dāng)當(dāng)有效,效度度系數(shù)的取值值也很少能超超過(guò)0.70,一般取值值能達(dá)到0.40就

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論