教育科學(xué)研究方法_第1頁
教育科學(xué)研究方法_第2頁
教育科學(xué)研究方法_第3頁
教育科學(xué)研究方法_第4頁
教育科學(xué)研究方法_第5頁
已閱讀5頁,還剩179頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、教育科學(xué)研究方法揚州大學(xué)教育科學(xué)學(xué)院郭兆明guozhaom教育科學(xué)研究方法教育研究的過程(第三編)教育研究方法的類型(第二編)教育研究的過程(第三編)課題的選擇(第八章)研究方案的設(shè)計(第九章)資料的整理與成果的表述(第十章)第八章 研究課題的選擇發(fā)現(xiàn)研究問題檢索相關(guān)文獻確立研究課題發(fā)現(xiàn)研究問題實際需要前人的研究實際需要(討論)數(shù)學(xué)(閱讀)學(xué)習(xí)不良學(xué)生的認知特點及其干預(yù)研究盧仲衡的自學(xué)輔導(dǎo)實驗法顧冷沅青浦數(shù)學(xué)教學(xué)改革布盧姆的教學(xué)評價的新突破80年代以來師范生素質(zhì)的發(fā)展趨勢研究高職院校學(xué)生職業(yè)性向測試分析研究前人的研究“一步評價”技術(shù)研究樣例學(xué)習(xí)的研究(1)單個樣例的研究(子目標,無具體目標)(

2、2)多個樣例的研究(樣例個數(shù)、樣例呈現(xiàn)方式)(3)樣例學(xué)習(xí)與問題解決的比較檢索相關(guān)文獻文獻檢索在教育科研中的作用教育文獻的種類及主要分布文獻檢索的過程和主要方法文獻檢索在教育科研中的作用避免重復(fù)勞動,提高科學(xué)研究的效益做好文獻綜述教育文獻的種類及主要分布書籍報刊網(wǎng)絡(luò)媒體(中國知網(wǎng),CNKI)文獻檢索的過程和方法過程(主題、關(guān)鍵詞、作者、來源)方法(按時間查、按照引文查)確立研究課題確立研究課題的思維策略論證研究課題的主要問題確立研究課題的思維策略分析課題的研究價值(結(jié)合項目申報)(1)理論價值(2)實踐價值考察研究人員的主觀條件考慮研究的客觀條件 在選擇課題時,要盡量避免:(1)范圍太大,無從

3、下手;(2)在現(xiàn)有條件下,難度較大,資料缺乏;(3)屬于經(jīng)驗感想之談,而不是科研題目。論證研究課題的主要問題研究問題的性質(zhì)(理論研究、應(yīng)用研究)研究的目的和意義(研究價值)國內(nèi)外相關(guān)研究現(xiàn)狀、可能有所突破之處。研究的可能性、基本條件研究的步驟及成果形式第九章 教育研究方案的設(shè)計制定研究方案的主要注意事項:(1)陳述研究課題(2)論述研究的目的和意義(3)闡述研究假設(shè)和依據(jù)(4)闡述研究內(nèi)容(5)確定研究對象(6)選擇抽樣方法(7)選擇研究方法和工具(8)制定行動計劃第十章 教育研究的資料整理與成果表述研究成果的的基本格式(1)題目(20字以內(nèi))(2)摘要和關(guān)鍵詞(3)主體【引言、方法、結(jié)果、討

4、論(定量研究)】(4)參考文獻第二編 教育研究方法的類型教育研究的實證方法(第四章)1、問卷調(diào)查法2、教育測量法3、教育實驗法4、內(nèi)容分析法教育研究的質(zhì)性方法(第五章)1、訪談?wù){(diào)查法2、敘事研究法第四章 教育研究的實證方法問卷調(diào)查法教育測量法教育實驗法內(nèi)容分析法問卷調(diào)查法界定特點步驟案例研究【問卷舉例(SCL90,職業(yè)興趣、16PF,開發(fā)者問卷)】界定是研究者用嚴格設(shè)計的問卷,通過書面語言與被調(diào)查者進行交流,來收集研究對象關(guān)于教育問題或教育現(xiàn)象的信息和資料的方法。特點調(diào)查工具標準化調(diào)查過程標準化調(diào)查結(jié)果標準化研究效率高步驟設(shè)計前的探索設(shè)計問卷的結(jié)構(gòu)設(shè)計問卷初稿試用和修改問卷發(fā)放和回收問卷(回收

5、率應(yīng)不低于70)分析調(diào)查結(jié)果設(shè)計問卷初稿選擇調(diào)查類型選擇問題形式斟酌問題表述設(shè)計規(guī)范答案關(guān)注問題數(shù)量(時間控制)合理排列問題選擇調(diào)查類型就調(diào)查內(nèi)容而言,選擇綜合調(diào)查或?qū)n}調(diào)查。就調(diào)查目的而言,選擇常模調(diào)查或比較調(diào)查就調(diào)查范圍而言,選擇普遍調(diào)查或抽樣調(diào)查選擇問題形式填空式是否式多項單選式多項限選式表格式(答題紙)或量表式(P83)排序式(P83)案例研究中小學(xué)生家庭作業(yè)心理現(xiàn)狀的調(diào)查分析上海市中小學(xué)生家庭教育現(xiàn)狀的調(diào)查分析五年制師范生心理健康狀況SCL90的調(diào)查分析小學(xué)數(shù)學(xué)作業(yè)批改的現(xiàn)狀的調(diào)查分析中小學(xué)生閑暇生活狀況的調(diào)查分析物理教師課堂教學(xué)行為的調(diào)查分析教育測量法界定特點步驟個案研究界定教育測

6、量法:根據(jù)某種規(guī)則,以數(shù)量化的形式描述教育現(xiàn)象的某種屬性。特點以測驗為工具對研究對象進行測試,從而獲得數(shù)量化的結(jié)果,并通過進一步分析獲得相關(guān)結(jié)論。例如,了解學(xué)生的知識和能力發(fā)展情況。編制測驗的步驟確定測驗?zāi)康拇_定測驗內(nèi)容確定測驗形式篩選題目(難度、區(qū)分度)標準化過程鑒定測驗(信度、效度)編寫測驗指導(dǎo)書項目分析 第一單元 項目難度 第二單元 項目區(qū)分度 第一單元 項目難度 項目難度的定義 項目難度的計算方法 難度水平的確定 項目難度的定義 項目難度(difficulty)是指題目的難度?!咀ⅰ浚?)在非能力測驗(如人格測驗)中,類似的指標是“通俗性”,即取自相同總體的樣本中,能在答案方向上回答該

7、題的人數(shù),其計算方法與難度相同。(2)難度的指標通常以通過率表示,以答對(通過)該題的人數(shù)百分比來表示: P(R/N)100,P表示項目難度,N表示全體被試數(shù),R為答對(通過)該項目的人數(shù)。從公式可以發(fā)現(xiàn):難度越大,P值越小。 計算方法 二分法計分項目 非二分記分的項目 二分法計分項目 心理測驗的項目大多為選擇題,通過計1分,錯誤計0分。1、當被試較少時,對這類題目可以直接使用公式P(R/N)100計算難度。2、當被試較多時,則可根據(jù)測驗總成績將被試分成三組:分數(shù)最高的27被試分為高分組,分數(shù)最低27被試為低分組,中間46的被試為中間組。分別計算高分組和低分組的通過率,以兩組通過率的平均值作為

8、每一題的難度。其公式為: P(PHPL)/2 式中P表示難度,PH和PL分別代表高分組和低分組通過率。非二分記分的項目 當測驗項目為問答題或不能用二分法記分的形式時,一般用下面的公式計算難度。 難度水平的確定 項目難度 測驗的難度 項目難度 進行難度分析的主要目的是為了篩選項目,項目的難度多高合適,取決于測驗的目的、性質(zhì)以及項目的形式。 測驗?zāi)康?準確測量個體的差異。 在選擇題目時,最好使試題的平均難度接近0.50,而各題難度在0.500.20之間。注:(1)若P0或1時; (2)P0.5時,舉一個極端的例子,假如某測驗各試題間的相關(guān)系數(shù)均為1,難度均為0.50,那么就有可能使50的被試答對所

9、有的題目得滿分;另外50的被試無法通過任何試題得0分) 測驗的性質(zhì) 當測驗用于選拔或診斷時,應(yīng)該比較多地選擇難度值接近錄取率的項目。(1)若測驗是要選拔少數(shù)最優(yōu)秀的被試,測驗就應(yīng)該有相當高的難度,P值就應(yīng)該小。例如,如果錄取率為20,那么題目難度最好確定為20,使得恰好20的優(yōu)秀被試通過;(2)假如測驗是要診斷出少數(shù)較差的被試,則測驗難度應(yīng)該小,P值應(yīng)該高,使得只有少數(shù)被試不能通過。 測驗的形式 對于選擇題來說,P值一般應(yīng)該大于概率水平。例如,對于是非題,其難度值應(yīng)該為0.75最為合適;而對于四選一的題目,其難度值約為0.63時最為適宜。 測驗的難度 通過考察測驗分數(shù)的頻數(shù)分布,可以對測驗的難

10、度作出直觀檢驗(常態(tài)分布,偏態(tài)分布:正偏態(tài)分布、負偏態(tài)分布)。(1)如果被試的取樣具有代表性,對于中等難度的測驗,其測驗總分應(yīng)該接近常態(tài)分布。如果得分多數(shù)偏高或偏低,則分別為“負偏態(tài)分布”和“正偏態(tài)分布”。(2)正偏態(tài)分布,即大多數(shù)得分集中在低端,說明編制的測驗對于所要研究的樣本團體來說偏難,因此,必須增加足夠數(shù)量的較容易的項目;(3)負偏態(tài)分布,即大多數(shù)得分集中在高分端,說明測驗過容易,必須增加足夠數(shù)量的有高難度的項目。 第二單元 項目區(qū)分度 項目區(qū)分度的定義 項目區(qū)分度的計算方法 區(qū)分度與難度的關(guān)系 項目區(qū)分度的定義 項目區(qū)分度(item discrimination),也叫鑒別力,是指測

11、驗項目對被試的心理特性的區(qū)分能力。 項目區(qū)分度的計算方法 鑒別指數(shù) 相關(guān)法 鑒別指數(shù) 1按測驗總分高低排列答卷;2確定高分組與低分組,每一組取答卷總數(shù)的27;3分別計算高分組與低分組在該項目上的通過率或得分率。4按下列公式估計出項目的鑒別指數(shù):DPHPL,式中D為鑒別指數(shù),PH為高分組在該項目上的通過率或得分率,PL為低分組在該項目上的通過率或得分率?!咀ⅰ扛叻纸M若在該測驗上的得分率高于低分組,則D0,D越大,說明該項目區(qū)分兩種不同水平的程度越高。若D0,則反映高水平組在該項目上的得分率反而低于低水平組,說明有問題。 1965年,美國測驗專家(L.Ebel)根據(jù)長期的經(jīng)驗提出用鑒別指數(shù)評價項目

12、性能的標準,鑒別指數(shù)D項目評價040以上0300.390.20-0.290.19以下很好良好,修改會更佳尚可,但需修改差,必須淘汰相關(guān)法 計算區(qū)分度最常用的方法是相關(guān)法,即以某一項目分數(shù)與效標成績或測驗總分的相關(guān)作為該項目區(qū)分度的指標。相關(guān)越高,表明項目越具有區(qū)分的功能。區(qū)分度與難度的關(guān)系 難度和區(qū)分度是相對的,是針對一定團體而言的,絕對的難度和區(qū)分度是不存在的。一般來說,較難的項目對高水平的被試區(qū)分度高,較易的項目對水平低的被試區(qū)分度高,中等難度的項目對中等水平的被試區(qū)分度高。由于人的大多數(shù)心理特性呈常態(tài)分布,所以項目難度的分布也以常態(tài)分布好,即特別難與特別易的項目少一些,接近中等的項目多一

13、些,而所有項目的平均難度為0.50,這樣不僅能夠保證多數(shù)項目具有較高的區(qū)分度,而且可以保證整個測驗對被試具有較高的區(qū)分能力。 測驗的信度 信度的概念 信度評估的方法 信度的概念 信度的定義 信度(reliability)指的是測量結(jié)果的穩(wěn)定性程度。注: (1)若能用統(tǒng)一測量工具反復(fù)測量某人的同一心理特質(zhì),則其多次測量的結(jié)果間的一致性程度就叫信度。有時也叫測量的可靠性。 (2)例如:比較鋼尺與具有彈性的皮尺測量長度的信度。第二單元 信度評估的方法 (1)重測信度(2)復(fù)本信度 (3)內(nèi)部一致性系數(shù)(4)評分者信度 重測信度 含義和計算 使用的前提條件 優(yōu)點、缺點 注意點 使用重測信度的量表舉例

14、定義和計算 重測信度(1)含義:是指同一量表對同一組被試兩次所得結(jié)果的一致性程度。(2)計算:大小等于同一組被試在兩次測驗上所得分數(shù)的皮爾遜積差相關(guān)系數(shù)。注:(1)此測驗主要測量測驗跨時間的穩(wěn)定性,所以,又稱穩(wěn)定性系數(shù)。 (2)當信度較大時,說明前后兩次測量的結(jié)果比較一致,測量工具比較穩(wěn)定,被試的心理特質(zhì)受被試狀態(tài)和環(huán)境變化的影響較小。 使用的前提條件 (1)所測量的心理特性必須是穩(wěn)定的。例如,成人的人格測驗就可以;但兒童的成就測驗就不行(例如,剛?cè)雽W(xué)兒童的識字量)。(2)遺忘和練習(xí)的效果基本上互相抵消。智力測驗的間隔時間一般在6個月左右。(3)在兩次施測的間隔時期內(nèi),被試的心理特質(zhì)方面沒有獲

15、得更多的學(xué)習(xí)和訓(xùn)練。 優(yōu)、缺點 優(yōu)點:能夠提供測驗是否隨時間而變異的資料,可作為被試將來行為表現(xiàn)的依據(jù)。缺點:易受練習(xí)和記憶的影響。(1)如果兩次施測間隔的時間太短,則記憶猶新,練習(xí)的影響較大;(2)如果間隔的時間太長,則身心發(fā)展與學(xué)習(xí)經(jīng)驗的積累等足以改變分數(shù)的意義,而使得相關(guān)減低。最適宜的時距隨測驗的目的、性質(zhì)和被試特點而異,一般是兩周到四周為宜,時間間隔最好不超過六個月。 注意點: 同一量表,隨著第二次測量的時間不同,它可以有不同的重測信度。因此,在報告重測信度時,應(yīng)說明兩次施測的間隔,以及在此期間被試的有關(guān)經(jīng)歷。例如,韋氏兒童智力量表手冊中國修訂版(CWISC)中,就報告了兩次測驗的時間

16、間隔(27周)以及兩次的相關(guān)系數(shù)(城市:0.59-0.86,農(nóng)村:0.59-0.81)。 使用重測信度的量表舉例 MMPI:臨床量表在相隔兩周重測,其值在0.580.92之間。CPI:加州心理調(diào)查表的重測信度各量表分別為0.380.77,平均0.66.SB4(斯坦福比奈量表第四版)瑞文:三個版本的一些重測信度研究結(jié)果不一,正常成人為0.800.93。 復(fù)本信度 含義與計算 使用的前提條件 優(yōu)、缺點 注意點 使用復(fù)本信度的量表舉例 含義與計算 復(fù)本信度(1)含義:指兩個平行的測驗測量同一組被試所得結(jié)果的一致性程度。(2)計算:大小等于同一組被試在兩個復(fù)本測驗上所得分數(shù)的皮爾遜積差相關(guān)系數(shù)。它是研

17、究測驗跨形式的一致性(等值性)。復(fù)本信度的分類:(1)等值性系數(shù)(同時);(2)穩(wěn)定性與等值性系數(shù)(不同時)。 等值性系數(shù)定義:如果兩個復(fù)本測驗是同時連續(xù)施測的,則這種復(fù)本信度稱為等值性系數(shù)。大?。悍从硟蓚€復(fù)本測驗的題目差別所帶來的變異情況。穩(wěn)定性與等值性系數(shù)定義:如果兩個復(fù)本測驗是相距一段時間分兩次施測的,則這種復(fù)本信度稱為穩(wěn)定性與等值性系數(shù)。它既考慮了測驗在時間上的穩(wěn)定性,也考慮了不同題目樣本反應(yīng)的一致性。大小:與其它信度系數(shù)相比,此種復(fù)本信度最小,也就是說,穩(wěn)定性與等值性系數(shù)是對信度的最嚴格的檢驗,其值最低。使用的前提條件 條件1:構(gòu)造出兩份或兩份以上真正平行的測驗。注:復(fù)本測驗必須在題

18、目內(nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語、時限以及所用的例題、公式和測驗等其它方面都相同或相似。條件2:被試有條件接受兩個測驗。例如,時間、經(jīng)費等。 優(yōu)、缺點優(yōu)點:能夠避免重測信度的一些問題,如記憶、學(xué)習(xí)等。 缺點:(1)如果測量的行為易受練習(xí)的影響,則復(fù)本信度只能減少而不能完全消除這種影響;由于第二個測驗只改變了題目的內(nèi)容,已經(jīng)掌握的解題原則,可以很容易地遷移到同類問題。(2)對許多測驗來說,建立復(fù)本是非常困難的。 注意點 :第二次測驗仍會受到練習(xí)和記憶等因素的影響、一些解題的策略等技能也會產(chǎn)生也會產(chǎn)生遷移。對于穩(wěn)定性與等值性系數(shù),在報告結(jié)果時,也需要報告兩次施測的間隔,以及在此間隔內(nèi)被試的

19、有關(guān)經(jīng)歷。 使用復(fù)本信度的量表舉例 成就測驗的A、B卷。 內(nèi)部一致性系數(shù)內(nèi)部一致性系數(shù)主要反映的是題目之間的關(guān)系,表示測驗?zāi)軌驕y量相同內(nèi)容或特質(zhì)的程度。 (1)分半信度 (2)同質(zhì)性信度 分半信度 含義 計算 使用的前提條件及范圍 使用分半信度的量表舉例 含義 分半信度是指將兩個測驗分成對等的兩半后,所有被試在這兩半上所得分數(shù)的一致性程度。這種方法估計信度系數(shù)只需一種測驗形式,實施一次測驗。通常是在測驗實施后將測驗按奇、偶數(shù)分為等值的兩半,并分別計算每位被試在兩半測驗上的得分,求出這兩半分數(shù)的相關(guān)系數(shù)。這個相關(guān)系數(shù)就代表了兩個半測驗內(nèi)容取樣的一致性程度,因而屬于內(nèi)部一致性系數(shù)。 計算 先求半測

20、驗的信度(皮爾遜積差相關(guān)系數(shù)) (1)如果兩半測驗的變異數(shù)相等,則使用斯皮爾曼布朗公式:式中rhh表示一半分數(shù)的相關(guān)系數(shù),rxx為測驗原長度的信度估計值。 (2)如果兩半測驗的變異數(shù)不相等,則使用弗朗拉根(Flanagan)公式或盧侖公式使用的前提條件及范圍: (1)分半信度通常在只能施測一次或沒有復(fù)本的情況下使用。(2)將一個測驗分成兩半的方法很多,所以,同一測驗通常會有多個分半信度。分半的方法有:按題號的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半等。 使用分半信度的量表舉例 (1)CPI的分半相關(guān)系數(shù)為0.63-0.86,平均為0.78.(2)瑞文彩色本的分半信度在0.65-0.94,

21、年輕受試者較低。標準本的分半相關(guān)信度為0.86,也是年輕者較低。(3)韋克斯勒三套智力量表(WAPPSIR,WISC3,WAISR)言語量表:分半信度在0.86-0.97操作量表:分半信度在0.85-0.94全量表:分半信度在0.90-0.98(4)SB4:內(nèi)在一致性系數(shù)均在0.9-0.99之間。 同質(zhì)性信度 含義 計算 使用同質(zhì)性信度的量表舉例 含義 同質(zhì)性信度是指測驗內(nèi)部所有題目間的一致性程度。題目間的一致性:(1)所有題目都測的是同一種心理特質(zhì);(2)所有題目得分之間具有較高的正相關(guān)。當一個測驗具有較高的同質(zhì)性信度時,說明測驗主要測的是某一單一心理特質(zhì),實測結(jié)果是該特質(zhì)水平的反映。如果一

22、個測驗的同質(zhì)性信度不高,則說明測驗結(jié)果可能是幾種心理特質(zhì)的綜合反映(應(yīng)采用分測驗)。 計算同質(zhì)性信度KR20KR21克倫巴赫系數(shù)(1)KR20公式 庫德和理查德遜于1937年提出,僅適用于0、1記分測驗。(2)KR21 庫德和理查德遜于1937年提出,僅適用于0、1記分測驗。此公式只有當所有題目的難度接近時才可使用。不需逐題計算通過率。 (3)克龍巴赫系數(shù) 此公式是由克龍巴赫(Cronbach)提出的,它不要求測驗題目僅是0、1記分,可以處理任何測驗的內(nèi)部一致性系數(shù)的計算問題。 例 題某態(tài)度量表共7題,100個被試在各題上得分的方差分別是0.81,0.82,0.79,0.83,0.85,0.7

23、6,0.77,測驗總分的方差是14.00,此時測量的值為? 使用同質(zhì)性信度的量表舉例 (1)諾森伯格(Rosenberg,1985)自尊量表:克龍巴赫系數(shù)為0.77-0.88。(2)SB4的KR20,各測驗各年齡中數(shù)平均值為0.73-0.98 評分者信度 含義 計算 含義 評分者信度是指多個評分者給同一組人的答卷進行評分的一致性程度。用于測量不同評分者產(chǎn)生的誤差。一般要求在成對的受過訓(xùn)練的評分者之間平均一致性達0.90以上,才認為評分是客觀的。 計算 當評分者為兩人時,評分者信度等于兩個評分者的積差相關(guān)或等級相關(guān)系數(shù)。當多個評分者評定多個對象,評分者信度等于兩個評分者的肯德爾和諧系數(shù)進行估計。

24、 效 度 第一單元:效度的概念 第二單元:效度評估的方法 第一單元 效度的概念效度的定義 效度的性質(zhì) 效度的定義 效度是指所測量的與所要測量的心理特點之間符合的程度。效度是科學(xué)測量工具最重要的必備條件,一個測驗若無效度,則無論具有其它任何優(yōu)點,一律無法發(fā)揮其真正的功能。因此,選用測量工具時首先要看效度。 效度的性質(zhì) 效度具有相對性 效度具有連續(xù)性 效度的相對性 任何測驗的效度是對一定的目標來說的,或者說測驗只有用于與測驗?zāi)繕艘恢碌哪康暮蛨龊喜艜行?。因此,不能籠統(tǒng)地說某測驗有效,而應(yīng)該說它對測量什么有沒有效。 效度的連續(xù)性 測驗效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無

25、”的區(qū)別。因此,評價一個測驗時,不應(yīng)該說“有效”或“無效,而應(yīng)該說效度較高或效度較低。當然,效度是指“測量結(jié)果”的有效程度。 第二單元 效度評估的方法 (1)內(nèi)容效度(2)構(gòu)想效度(結(jié)構(gòu)效度)(3)效標效度 內(nèi)容效度 內(nèi)容效度的定義內(nèi)容效度的評估方法內(nèi)容效度與表面效度 內(nèi)容效度的定義 內(nèi)容效度是指項目對欲測的內(nèi)容取樣的適當程度。由于這種測驗的效度主要與測驗內(nèi)容有關(guān),所以稱內(nèi)容效度。注:人們要測定“憂慮性”,就要對這個概念有個明確的內(nèi)容范圍,然后從臨床觀察、病人自述、醫(yī)生筆記以及文獻報道中了解具有憂慮性的人具有哪些行為特點,從而編制“憂慮性”測驗。 內(nèi)容效度的評估方法 專家判斷法 (P65,雙向

26、細目表)構(gòu)想效度(結(jié)構(gòu)效度) 構(gòu)想效度的概念構(gòu)想效度的估計方法 構(gòu)想效度的概念指測驗對理論上結(jié)構(gòu)的測量程度。 構(gòu)想效度的估計方法 測驗內(nèi)法 測驗間的相互比較 測驗內(nèi)法這類方法主要是通過研究測驗的內(nèi)部結(jié)構(gòu)(如測驗的內(nèi)容以及題目間的關(guān)系等)來分析測驗的結(jié)構(gòu)效度。 (1)確定測驗的內(nèi)容效度 (2)考察測驗的同質(zhì)性(同質(zhì)性信度) 確定測驗的內(nèi)容效度 通過確定測驗取樣的內(nèi)容范圍,我們就可以利用這些資料來定義測驗所測的結(jié)構(gòu)的性質(zhì)。通過確定測量的內(nèi)容效度便為結(jié)構(gòu)效度提供了有關(guān)證據(jù)。例如:在編制語文能力測驗時,我們將內(nèi)容總體描述為對詞匯下定義、對語言進行類比推理以及在文章篇句中正確運用文字的能力,這在實際上給

27、“語文能力”的結(jié)構(gòu)下了定義。 考察測驗的同質(zhì)性通過對被試在項目上的反應(yīng)與總分的相關(guān)計算,以及分半系數(shù)、系數(shù)、KR20、KR21等指標的計算,可以推算出測驗所測的是單一特質(zhì)還是多種特質(zhì),從而確定測驗是否具有結(jié)構(gòu)效度。 測驗間的相互比較 相容效度 區(qū)分效度 因素效度 相容效度 計算被試在新舊(已有效度證據(jù)的成熟測驗)兩個同類測驗上的分數(shù)之間的相關(guān)。 區(qū)分效度 看它是否與測量不同結(jié)構(gòu)的測驗是否具有較低的相關(guān),用此方法確定的效度叫區(qū)分效度。例如,數(shù)學(xué)推理能力測驗與閱讀能力測驗。 因素效度 建立結(jié)構(gòu)效度最常用的方法是:通過對一組測驗進行因素分析,找到影響測驗分數(shù)的共同因素,這種因素可能就是我們要測量的心

28、理特質(zhì)(構(gòu)思)。 效標效度 效標效度的定義 效標效度的評估方法 效標效度的定義 衡量測驗有效性的一個重要方法是根據(jù)測驗所作出的預(yù)測是否能證實,如果一個測驗的預(yù)測與將來實際發(fā)生的事情非常接近,那么這就是一個好測驗。例如,用大學(xué)入學(xué)考試來預(yù)測被試入學(xué)后的學(xué)習(xí),如果預(yù)測準確性高,便說明這是一個好測驗。 效標效度的定義效標:被預(yù)測的行為是衡量測驗是否有效的標準。效標效度:就是考查測驗分數(shù)與效標的關(guān)系,看測驗對我們感興趣的行為預(yù)測得如何。因為效標效度需要在實踐中檢驗,所以,又稱實證效度。 效標效度的分類1、同時效度:與用來診斷現(xiàn)狀的測驗有關(guān)。例如,智力測驗以學(xué)生當時的學(xué)業(yè)成績?yōu)樾?,由于學(xué)業(yè)成績是現(xiàn)成的

29、,所以這種效度稱為同時效度。2、預(yù)測效度:與預(yù)測將來結(jié)果的測驗有關(guān)。例如,大學(xué)入學(xué)考試可用學(xué)生入學(xué)后的學(xué)習(xí)成績作效標,因為效標資料是在考試以后間隔一段時間后才能獲得,所以高考的效度則是一種預(yù)測效度。 注:此種效度對人員的選拔和安置工作非常重要。常用的效標是專業(yè)訓(xùn)練的成績、實際工作的表現(xiàn)等。 效標效度的評估方法 相關(guān)法 區(qū)分法(分組法) 命中率法 相關(guān)法 確定效標效度最常用的方法是計算測驗分數(shù)與效標測量的相關(guān)。根據(jù)變量的性質(zhì)不同,可分別采用積差相關(guān)法、等級相關(guān)法、二列相關(guān)法等。當測驗分數(shù)為連續(xù)性變量,效標資料為等級評定時,可用賈斯朋(Juspen)多系列相關(guān)公式計算。 區(qū)分法(分組法) 區(qū)分法:

30、是檢驗測驗分數(shù)能否有效地區(qū)分由效標所定義的團體的一種方法。例如,在大學(xué)里,我們根據(jù)教師評定,把學(xué)生分為合格與不合格兩組,然后回過頭去查他們的高考分數(shù),若兩組在高考分數(shù)上有顯著差異,那就可以認為高考是有效的,否則就認為是無效的。 命中率法使用命中率法,可將測驗分數(shù)和效標資料分成兩類。在測驗分數(shù)方面是確定一個臨界分數(shù)(即分數(shù)線),高于臨界分數(shù)者預(yù)測其成功,低于臨界分數(shù)者預(yù)測其失??;在效標資料方面是根據(jù)實際工作或?qū)W習(xí)成績,確定一個合格標準,在標準之上者為成功,在標準之下者為失敗。 這樣便會有四種情況:(1)預(yù)測成功而實際也成功(B);(2)預(yù)測成功而實際上失?。ˋ);(3)預(yù)測失敗而實際上成功(D)

31、;(4)預(yù)測失敗事實上也失?。–)。我們稱正確預(yù)測的為命中;不正確預(yù)測的為失誤。 表55 測驗命中與失誤的四種情況測驗預(yù)測失敗成功成功(A)失誤(B)命中失?。–)命中(D)失誤兩個指標 總命中率 正命中率 教育實驗法界定特點步驟案例研究界定根據(jù)一定的理論假設(shè),有計劃地控制教育活動的某些因素,以引起其它因素朝著有利于提高教育效果的方向轉(zhuǎn)變,然后檢驗假設(shè),并由此揭示教育活動規(guī)律的綜合性研究活動。教育實驗法的步驟形成實驗假說界定實驗變量選擇實驗?zāi)J酱_定實驗對象制定實驗方案實施實驗評價實驗結(jié)果界定實驗變量確定和分解應(yīng)變量選擇和設(shè)計自變量確定需要控制的干擾變量選擇實驗?zāi)J絾我蛩卦O(shè)計(1)單組單因素前后

32、測實驗(2)單因素隨機實驗(3)單因素隨機匹配實驗(4)協(xié)方差設(shè)計兩因素設(shè)計案例研究盧仲衡的自學(xué)輔導(dǎo)法實驗樣例學(xué)習(xí)(個數(shù),變異性、呈現(xiàn)方式)數(shù)學(xué)學(xué)習(xí)不良的個案研究個案研究問題提出方法(1)被試選擇(2)實驗材料(3)實驗程序:基線、處理、概括、維持結(jié)果分析與討論舉例:認知策略訓(xùn)練對學(xué)習(xí)不良學(xué)生應(yīng)用題解決成績的影響被試6個學(xué)生1519歲被選擇于LD群體中??侷Q在85115(WISCR,1975,Wais,1955)。所有6個學(xué)生還滿足另外幾個條件。WISCR或WAIS的算術(shù)子測試低于平均數(shù)的1個標準差。閱讀水平至少4年級水平。此外,每個被試完成10個隨機的2步數(shù)學(xué)應(yīng)用題40分,或低于40分。

33、材料材料包括策略的掛圖(圖2)和19個測試(2步應(yīng)用題)、1個測試(三步應(yīng)用題)、練習(xí)題(每個類型),記錄測試分數(shù)和時間的圖形。測試問題從220題的2步應(yīng)用題和50題的3步應(yīng)用題隨機選出。10個2步問題組成被試選擇測試和每個因變量測試(在基線、處理、維持和重新訓(xùn)練階段)。概括測驗包括10個3步問題。項目不返回試題庫。每個測量中,問題的次序是隨機的。在策略獲得和策略運用練習(xí)階段,應(yīng)用題的次序也是隨機的。 程序在課堂教學(xué)中接受策略訓(xùn)練。策略訓(xùn)練者是研究者之一。教學(xué)和測試都在課堂上。多基線設(shè)計的實驗條件包括基線、處理、概括和保持、重新訓(xùn)練。 基線在基線期間,記錄測試的時間和分數(shù)?;€數(shù)據(jù)繼續(xù)收集,直

34、到穩(wěn)定的基線是明顯的(對每一組的第一個學(xué)生)。當繼續(xù)收集剩下來的兩個學(xué)生的基線數(shù)據(jù)時,給第一個學(xué)生干預(yù)。當上升趨勢明顯,至少10個項目中至少7個正確反應(yīng)的成績穩(wěn)定時,策略訓(xùn)練給第二個被試。在這個階段,繼續(xù)收集每組第三個被試的基線數(shù)據(jù)。對第三個被試來說,相似的程序。 處理 處理包括策略獲得階段、策略運用練習(xí)階段和測試階段,在測試階段期間收集因變量測量數(shù)據(jù)。 策略獲得階段策略獲得訓(xùn)練進行了3課時(每課時50分鐘)。訓(xùn)練中使用的步驟包括訓(xùn)練策略模型(Deschler,1981)中的6步獲得步驟。獲得步驟包括:(1)分析現(xiàn)在的學(xué)習(xí)習(xí)慣;(2)描述新策略;(3)模仿新策略;(4)復(fù)述新策略(5)學(xué)生練習(xí)

35、;(6)在獲得階段的正確反饋。圖2呈現(xiàn)了訓(xùn)練程序總結(jié)。 8步數(shù)學(xué)應(yīng)用題的問題解決策略: 大聲閱讀問題:教師大聲讀題,解釋學(xué)生不懂的詞語。大聲復(fù)述陳述重要信息(特別是數(shù)字);(2)大聲重復(fù)問題部分;利用自我提問技術(shù):題目問什么?我正在尋找什么?轉(zhuǎn)化:畫一個圖形陳述問題:大聲說“我知道了,我想求”。強調(diào)題目中的重要信息。假設(shè):大聲說“如果我,那么”,“需要多少步驟”寫下運算符號估計:寫下估計的答案計算自我檢查:(1)參照問題,檢查每一步,決定運算符號的正確性;(2)檢查計算的正確性;(3)運用自我提問技術(shù)問自己是否理解答案的意思。 策略獲得訓(xùn)練概要(圖2)第一階段(1)討論基線分數(shù)、被試解決問題的

36、方法、界定提高多少作為教學(xué)的目標(2)描述訓(xùn)練的形式(3)向被試閱讀策略,回答被試提出的問題(4)使用樣例模仿策略的使用(5)使用隨機選擇的問題模仿策略的使用(6)當被試解決問題時,提供正確的反饋(7)當被試復(fù)述策略時,提供正確的反饋 第二階段(1)復(fù)習(xí)策略步驟(2)被試一邊說步驟,一邊解決問題(3)監(jiān)控被試策略的復(fù)述(4)重復(fù)(2)(5)重復(fù)(3) 第三階段(1)監(jiān)控被試的策略復(fù)述(2)當被試一邊說步驟,一邊解決問題時,提供正確的反饋。(3)重復(fù)(1)(4)重復(fù)(2)(5)策略步驟言語表達的測試。 圖3 數(shù)學(xué)應(yīng)用題解決的步驟1、大聲閱讀問題2、復(fù)述(1)重要信息;(2)大聲重復(fù)問題部分;(3

37、)題目問什么?我正在尋找什么?3、轉(zhuǎn)化:畫一個圖形4、陳述問題:我知道了,我想求。5、假設(shè):(1)如果我,那么,(2)需要多少步驟?6、估計:寫下估計答案7、計算8、自我檢查:(1)檢查每一步運算符號;(2)檢查計算;(3)理解答案的意思。策略練習(xí)階段要求被試在策略步驟的言語表達達到100的正確標準(圖3列舉了要求記憶的信息)。達到這個目標后,策略運用階段開始,在測試前一天,練習(xí)階段開始。包括策略步驟的言語表達和使用策略練習(xí)解決數(shù)學(xué)應(yīng)用題。在練習(xí)期間,列出步驟的圖形可以得到。及時的正確反饋被提供。如果學(xué)生在2個或者3個測試中,保持7分或者更好成績,練習(xí)階段結(jié)束。如果學(xué)生分數(shù)低于7,練習(xí)階段恢復(fù)

38、。測試階段測試階段收集因變量。每個測試包含10個2步數(shù)學(xué)應(yīng)用題,使用與基線條件下相同的程序。此外,提示學(xué)生使用策略。不能得到圖3。測試時間被記錄。沒有完成的測試第二天完成。測試分數(shù)測試完成后告訴被試。數(shù)據(jù)包括每個測試正確的數(shù)目,完成每個測試的時間,收集這些數(shù)據(jù)作圖。成績提高的標準是在連續(xù)4次測試中至少都正確7題。通常,70只是一個平均水平。在連續(xù)四個測試中都高于7個的維持成績表明成績的可接受性。 概括在最后一個處理測試的第二天,一個包含10個題目的3步數(shù)學(xué)應(yīng)用題決定策略是否概括到更復(fù)雜的數(shù)學(xué)應(yīng)用題中去了。5條正確作為作為可接受的標準。 維持概括測試2周后,一個包含10個2步數(shù)學(xué)應(yīng)用題的測試,決定維持的水平。如果學(xué)生不能完成至少7個正確回答,被試被重新訓(xùn)練到策略記憶達到100的水平,提供練習(xí)階段,重新測試。當在一個測試中達到至少7個的正確率,實驗結(jié)束。為了考察更大的維持水平,3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論