




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、西南大學研究生課程考試答卷紙考試科目 教育測量與評價院、所、中心 外國語學院專業(yè)或?qū)I(yè)領(lǐng)域研究方向級 別 學年2013-2014 學年學期2014年秋季學期姓名學號類別(全日制博士全日制碩士教育碩士 高師碩士工程碩士農(nóng)推碩士 獸醫(yī)碩士 進修)2014年7月18日研究生院(籌)制課程類別課程考試方式題號得分教師評價一一三四五六七八九十總分任課教師簽名:備注:成績評定以百分制或等級制評分,每份試卷均應標明課 程類別(必修課選修課同等學力補修課)與考核方式( 閉卷筆試口試開卷筆試課程論文)。課程論文應給出評O西南大學外國語學院免師教育碩士2014 級“學科(英語)教育測量與評價”課程作業(yè)要求: 保留
2、原題題干及數(shù)據(jù),然后在其下面插入空白來呈現(xiàn)答案。不得篡改問題或者數(shù)據(jù)。 在編輯將要提交的作業(yè)的 Word文件時,需確保欲呈現(xiàn) 的內(nèi)容能被打印出來。一、簡答題( 50 分)1. 測量的基本要素有哪些?(1 分)答:測量的量具、測量的單位和測量的參照點是測量的三個基本要素。2. 什么是教育測量?(1 分)答: 教育測量就是針對學校教育影響下學生各方面的發(fā)展,側(cè)重從量的規(guī)定性上予以確定和描述的過程。3. 教育測量有哪些量表類型?(1 分)答:有稱名量表、順序量表、等距量表和比率量表。4. 什么是教育評價?(1 分)答: 教育評價是指根據(jù)一定的標準,對教育事物或現(xiàn)象進行系統(tǒng)的調(diào)查,在獲取足夠多的資料事
3、實(定性與定量資料)基礎(chǔ)上,做出價值分析和價值判斷。5. 教育測量與教育評價有什么不同?(1 分)答: 教育測量時一種以量化為主要特征的事實判斷,而教育評價是指根據(jù)一定的標準, 對教育事物或現(xiàn)象進行系統(tǒng)的調(diào)查,在獲取足夠多的資料事實(定性與定量資料) 基礎(chǔ)上, 做出價值分析和價值判斷。所以教育評價最根本的特征是做出價值判斷;而教育測量過程的完結(jié),在給出數(shù)量事實的描述與判斷之后,不一定都要做出價值判斷。6. 教育評價與教育評估有什么異同?(1 分)答:教育評估和教育評價是兩個近義詞,他們在內(nèi)容上有交叉,也有區(qū)別。教育評估可能有價值判斷,也可能沒有價值判斷當教育評估過程含有價值判斷時,它和教育評價
4、是一樣的;當教育評估過程沒有價值判斷時,它和教育評價就有一定的差別。7. 教育測驗、考試與教育測量有什么不同?(1 分)答: 教育測驗是教育測量的一個工具,在教育評價和教育評估過程中常被用來收集資料(如有關(guān)態(tài)度測驗、民意問卷測驗、學科成就測驗等)。教育考試是根據(jù)教育內(nèi)容和目標,選擇有代表性的內(nèi)容與問題,按照一定的方式,對應試者的知識、 技能等進行測量與評價的過程??荚囈彩且环N教育測驗。測驗或考試皆是教育測量與評價的一種工具。8. 教育測量與評價,按照實施的時間階段的不同,可以區(qū)分為哪幾種類型?各自使用的目的是什么?(1 分)答:可以分為形成性測量與評價、診斷性測量與評價和終結(jié)性測量與評價。形成
5、下測量與評價的目的對于老師而言是為了獲得教學延續(xù)性的反饋,了解學生的學習效果、學習歷程、學習特點、學習困難等信息,隨時修正自己的教學參考;對于學生而言可以根據(jù)反饋的結(jié)果獲知自己學習后的表現(xiàn)情況。從而肯定或修正自己的學習方式。診斷性測量與評價的目的是對個人的問題行為及原因進行診斷。 終結(jié)性測量與評價的目的有兩個,一是在教學目標之下,檢查學生一學期的學業(yè)達到了什么程度,從而判斷教學效果的得失;二是評定學生的學業(yè)成就,并將評定結(jié)果通知家長或記入檔案。9. 教育測量與評價,按照參照點的不同,區(qū)分為哪幾種類型?各自適用的情形是什么?(1 分)答: 分為常模參照、標準參照和潛力參照。常模參照適用于評價被團
6、體中的相對地位;標準參照測量與評價是將被試的表現(xiàn)與既定的教育目標或行為標準相比較, 以評價被試在多大程度上達到標準;潛力參照測量與評價是將被試實際水平與其自身潛在水平相比較,以評價被試有無充分發(fā)揮自身潛力的目的。10. 教育測量與評價,按照被測量與評價的行為的性質(zhì),區(qū)分為哪些類型?它們各自適用于什么情形?(1 分)最佳行為測量與評價適用答 : 分為最佳行為測量與評價和典型行為測量與評價。于以能力為基礎(chǔ)的評價情景,例如學校教學后的考試或升學考試;典型行為測量與評價適用于測量被試的態(tài)度、情感、人格、興趣等。11. 按照教育測量與評價的內(nèi)容,教育測量與評價區(qū)分為哪幾種類型?它們各自適用于什么情形?(
7、1 分)答: 分為智力與評價、能力傾向測量與評價、成就測量與評價和人格測量與評價。12. 什么是重測信度?(1 分)答: 重測信度指的是用同一個量表(測驗和評價表)對同一組被試施測兩次所得結(jié)果的一致性程度,其大小等于同一組被試在兩次測驗上所得分數(shù)的相關(guān)系數(shù)。13. 什么是復本信度?(1 分)答: 復本信度指的是兩個平行測驗測量同一批被試所得結(jié)果的一致性程度,其大小等于同一批被試在兩個復本測驗上所得分數(shù)的相關(guān)系數(shù)。14. Kappa一致性分析可以用來說明教育測量與評價的哪些類型的信度?(1分)答: Kapa 一致性系數(shù)是指實際別評定為一致的百分比與在理論上被評定為一致的最大可能次數(shù)百分比的比率。
8、15. 肯德爾和諧系數(shù)分析的功能是什么?(1 分)答:肯德爾和諧系數(shù)時表示多列等級變量相關(guān)程度的一種方法,既讓K個評價者對 N 個被試的試卷(或作品)進行登記評定,每個評價者都對N 份試卷 (或作品)排出一個等級順序。16. 什么叫分半(half-split) 信度 ? ( 1 分)答: 分半信度指的是將一個測驗分成對等的兩半后,所有被試在這兩半上所得分數(shù)的一致性程度。17. 什么叫克倫巴赫alpha 系數(shù)?(1 分)答:克倫巴赫alpha 系數(shù)是一套常用的衡量心理或教育測驗可靠性的方法, 依一定公式估量測驗的內(nèi)部一致性, 是目前社會研究最常使用的信度指標, 它是測量一組同義或平行測"
9、;總和”的信度其公式為:a=K/(K-1)1-(ES2i)/(S2x).其中 ,K 為量表中題項的總數(shù),S2i 為第 i 題得分的題內(nèi)方差,S2x 為全部題項總得分的方差 . 從公式中可以看出,a 系數(shù)評價的是量表中各題項得分間的一致性, 屬于內(nèi)在一致性系數(shù). 這種方法適用于態(tài)度、意見式問卷(量表)的信度分析。18. 什么叫效度(validity )?什么叫效度驗證(validation )?(1 分)答: 效度指的是一次測量的有效程度,通過收集大量資料和證據(jù)來檢驗測量效度的工作過程叫做效度驗證。19. 什么叫內(nèi)容效度?什么叫表面效度?什么叫反應效度?(1 分)答: 內(nèi)容效度指的是測驗樣本對于
10、應測內(nèi)容與行為領(lǐng)域的代表性程度,表面效度指的是在被試和非專業(yè)人士看來,測試表面上是否在有效的測量著應測特質(zhì)的量的程度。20. 什么叫構(gòu)念(construct)? 什么叫構(gòu)念效度(construct validity)? ( 1 分)答: 構(gòu)念指的是心理學或社會學上的一種理論構(gòu)想或特質(zhì),結(jié)構(gòu)效度指的是測驗能夠測量到理論上所定義的某一心理結(jié)構(gòu)或特質(zhì)的程度。21. 什么叫效標(Criterion) ? 什么叫效標效度( criterion-related validity )( 1 分)答:效標志的檢驗測量效度的外在的、客觀的標準,即效度標準,效標關(guān)聯(lián)效度指的是一個測驗對于處于特定情境中的個體行為進
11、行預測時有效性。22. 什么叫同期效度(concurrent validity) 和預測效度(predictive validity)?( 1 分)答: 測驗分數(shù)與效標資料的取得約在同一時間內(nèi)連續(xù)完成,計算這兩種資料的相關(guān)系數(shù)即代表測驗的同時效度,在測驗分數(shù)取得一段時間后才獲得效標資料,計算這兩種資料間的相關(guān)系數(shù)即代表測驗的預測效度。23. 試題的難度系數(shù)可以怎么計算?(1 分)答: 對于二值記分題可以用題目的答對率來表示,對于多值記分題可以用平均分和滿分的比值來表示,此外還可以全體被試失分率為難度系數(shù),以兩端被試得分率的均值為難度系數(shù)。24. 什么是測試題目的區(qū)分度(Discriminati
12、on Index)? 題目的區(qū)分度如何計算?(1 分)答: 區(qū)分度就是題目區(qū)分被試誰批能力的量度,計算區(qū)分度可以用點雙列相關(guān)系數(shù)法,二雙列相關(guān)系數(shù)法,積差相關(guān)系數(shù)和高低分組法來計算。25. 什么是級差相關(guān)(Pearson correlation)? ( 1 分)答: 級差相關(guān)指的是對非二分法積分的項目,因得分具有連續(xù)性,在被試團體較大時,可以認為題目分數(shù)服從正態(tài)分布,題目總分與測驗總分級差相關(guān)系數(shù)。26. 什么是等級相關(guān)(Spearman correlation)? ( 1 分)答:對不服從正態(tài)分布的資料、原始資料等級資料、一側(cè)開口資料、總體分布類型未知的資料不符合使用積矩相關(guān)系數(shù)來描述關(guān)聯(lián)性
13、。此時可采用秩相關(guān)( rank correlation ) ,也稱等級相關(guān),來描述兩個變量之間的關(guān)聯(lián)程度與方向。在SPSS中,怎么計算但其中一個變量因為某種原負相關(guān)因變量隨著自變量的27. 什么是點二列相關(guān)(point-biserial correlation)?點二列相關(guān)系數(shù)?(1 分)答: 點二列相關(guān)指的是兩個變量都是正態(tài)連續(xù)變量,因被人為地分成兩類。28. 什么正相關(guān)?什么是負相關(guān)?(1 分)答: 正相關(guān)指的是因變量隨著自變量的增大而增大,增大而變小。29. 什么是相關(guān)系數(shù)顯著性檢驗中的雙側(cè)(2-tailed )檢驗和單側(cè)(1-tailed )檢驗?(1 分)答:在相關(guān)系數(shù)顯著性檢驗中,
14、1-tailed test 和 2-tailed test 分別指單側(cè)檢驗和雙側(cè)檢驗,單側(cè)檢驗具有方向性,更有針對性,而雙側(cè)檢驗是指一組數(shù)據(jù)的方差可能大于, 等于或小于另一組數(shù)據(jù)的方差的情況,不具有方向性。30. 什 么 是 獨 立 樣 本 (independent samples) ? 什 么 是 相 關(guān) 樣 本 (related samples) ?(1 分)31. 什么是獨立樣本t 檢驗中的雙側(cè)(2-tailed) 檢驗和單側(cè)(1-tailed) 檢驗? ( 1分)32. 通常情況下,教育評價表的構(gòu)成要素有哪些?(1 分)答: ( 1)評價指標( 2)指標權(quán)重( 3)評價標準33. 什么
15、是評價標準的標度,標號,強度或頻率?(1 分)答: 標度是達到標準的程度,它說明什么樣的程度屬于什么等級。所謂的標準強度和頻率,是指評價標準的內(nèi)容,也就是各種規(guī)范行為或?qū)ο蟮某潭然蛳鄬Υ螖?shù)。 標準強度和頻率屬于評價的主要組成部分。所謂標號,是指不同強度的頻率的標記符號,34. 什么是客觀性試題和主觀性試題?客觀性試題和主觀性試題分別有些什么類型?( 2 分)答:客觀性試題評分客觀,不同評分者獨立評分,所得結(jié)果基本上是相同的,客觀性試題主要包括選擇題、匹配題和供答題中地簡答題、填空題;主觀性試題指的是答案不固定,被試可以自由作答,被試只要在題目所限的范圍內(nèi),在深度、廣度、 組織方式等方面享有很大
16、的自由,包括論述題、作文題與表現(xiàn)性測驗題等題型。35. 什么是表現(xiàn)性測驗?表現(xiàn)性測驗有些什么類型?(2 分)答:所謂表現(xiàn)性測驗是指以行動、作品、表演、展示、口頭回答、操作、寫作、科學研究、制作等更真實的行為表現(xiàn),來測量與評價學生在真實情景或模擬真實情景下的所知所能的一種測驗類型。表現(xiàn)性測驗分為(1)紙筆的表現(xiàn)性測驗、辨認的表現(xiàn)性測驗、結(jié)構(gòu)化的表現(xiàn)性測驗、模擬情景的表現(xiàn)性測驗、工作樣本的表現(xiàn)性測驗。36. 教育目標,教學目標,測驗目標幾者之間有什么關(guān)系?(2 分)答: 教育目標分為終極教育目標、中程教育目標和具體教育目標。教學目標是中程教育目標,是對終極教育目標的細化和具體落實,他對學生應掌握的
17、知識,應發(fā)展的能力和應該形成的優(yōu)良品德提出了明確要求,將教學目標進一步分化,用測試題的形式加以表達就是測驗目標。37. 布盧姆教育目標分類的認知領(lǐng)域的內(nèi)容,在早期理論和修訂版框架之間,有什么異同?(2 分)38. 答:原始的分類法(1956)分成知識和心智的能力與技巧兩部分,共6 個類別。除了應用外,每一個類別都包含了子類別。這些類別是從簡單到復雜、具體到抽象進行排列,強調(diào)累積性的階層概念。修訂版將教育目標的分類分成知識向度和認知歷程向度。知識向度包含四個主要的類別(事實、概念、程序、 元認知) 。前三個類別包括了原始分類中知識的子類別。元認知知識是新增加的類別。認知歷程向度分成6 個類別,由
18、較低層級的記憶、了解、應用和分析,到較高層級的評價和創(chuàng)造,其中記憶和學習保留有密切的關(guān)聯(lián),其余五者和學習遷移較有關(guān)。原始分類中的三個類別被重新命名,兩個類別的順序被交換。39. 布盧姆教育目標分類的經(jīng)典理論中的認知領(lǐng)域的1 級和 2 級目標內(nèi)容有哪些?(3 分)40. 答:認知領(lǐng)域的一級目標是知識,二級目標是領(lǐng)會、運用、分析、綜合和評價。41.布魯姆教育目標分類體系的情感領(lǐng)域的 1級和2級目標內(nèi)容有哪些? (3分) 答:情感領(lǐng)域的1級目標內(nèi)容有接受和反應,二級目標有價值評價、組織、有價 值和價值復合體形成的性格化。42.布魯姆教育目標分類體系的動作技能領(lǐng)域的 1級和2級目標內(nèi)容有哪些? (3
19、分)答:動作技能領(lǐng)域的1級目標內(nèi)容包括知覺、準備、指導反應;2級目標包括機 械化、復雜反應、適應性和獨創(chuàng)性。二、計算題 (35分)1.有30個被試在間隔不久的時間內(nèi)前后兩次接受了同一個測試。 具測試結(jié)果如 下表所示。問這個測試的信度如何? ( 2.5分)被試前測后測被試前測后測18788167882267701776693757318818046668199088581782088876908721877676971227574873722376789817924818210798025878811697126798312697227828013757428878914737829898615
20、7973308584答:本次測試的重測信度為0.41,信度較低。2.有一個測驗含A、B卷。30個被試分別接受了 A卷和B卷的測驗,測驗結(jié)果如下表所示。問這個測驗的 A、B兩份試卷的等值系數(shù)如何? ( 2.5分)被試A卷B卷被試A卷B卷1878816787626766177675375731881804666819878858180208887671722186837697122757487372237674972732481821079802587851173712679811269722782801374742887861473782984861574733085843.有100個被試接受了
21、一個測驗,其測驗結(jié)果被兩個評分員獨立地進行了二分法的評價(即“及格”與“不及格)。兩個評分員對這些被試的評價結(jié)果的頻數(shù)信息見下面的頻數(shù)分布表。問這兩個評分員的評價結(jié)果的一致性如何? (5分)評分員B及格不及格及格7010評分員A不及格515解:兩位評分員的百分比一致性 Pa=).85; k一致性系數(shù)k=0.36 o兩位評分員評分 的一致性較高。4.有一電影網(wǎng)站對觀看其電影的10名觀眾進行了調(diào)查。調(diào)查的是他們對于各類 電影的偏愛程度, 從1到8,代表從“最喜歡”到“最不喜歡”的8種態(tài)度。 問這10個接受調(diào)查的觀眾的電影愛好顯著一致嗎?平均而言,他們對被調(diào)查 的8種電影類型各自的偏愛程度如何? (
22、 5分)電影類型觀眾12345678910犯罪3523443243戰(zhàn)爭6 678757886諜戰(zhàn)5 141 576二 68 ;4二54武俠1812822112懸疑4344385638喜劇2 12r 81 11口1 13r 21 1愛情8 171 65 1576 1577倫理7136234765解:這十位觀眾的肯德爾和諧系數(shù) W=0.57, 10位觀眾對8種類型喜愛程度的顯 著性較一致。觀眾對8種類型的電影的喜愛程度的平均數(shù)分別為 3.3 , 6.8 , 5.4 , 2.8 , 4.3 , 2.2, 6.3, 4.4,由此可見觀眾最喜歡的類型是戰(zhàn)爭類和愛情類電影,其次為諜戰(zhàn)、倫理、懸疑類,最不喜
23、歡的喜劇和武俠類。5. 一研究者進行了一個教學實驗。在實驗班采用積極培養(yǎng)和引導學生使用優(yōu)秀學習者的學習策略的方法進行閱讀理解的教學,而在對照班則按照傳統(tǒng)的講解和完成多項選擇練習的方法進行教學。研究者期望實驗班的教學效果優(yōu)于 對照班的效果。在實驗開始前挑選了實驗組與對照組的受試,各有 36人, 并對他們的閱讀能力進行統(tǒng)一的測試(前測)。然后,實施了教學實驗。經(jīng) 過一個學期后,研究者對兩個組的受試實施了題型和難度與前測近似的另一 個測試(后測)。兩個組受試的前測和后測成績?nèi)缦卤硭?。問兩個組的受 試在實驗前的閱讀水平相當嗎?研究者的新的教學方法有明顯的優(yōu)勢嗎?(請報告結(jié)果并解釋結(jié)果)(10分)被試
24、前測后測實驗組對照組實驗組對照組16157726026059736136358715946273757256360726167862736276657745786970755896560705910635971601177607061126666726213656274601460577858156156735516615876591767627263186262776419626175602052667367216665746422675977582365587759246867766825536875692656597660277059756128686177602953567859305
25、56374623169607458327262736133646075593454617660356968726536716873636.下面是5個受試做一個試卷的5個部分的得分數(shù)據(jù)。問這個試卷的內(nèi)部一致性信度如何?請分析一下第3部分的區(qū)分度? ( 10分)SubjectPart1Part 2Part 3Part 4Part 5Total187798392121011121257398779404129991251512101041248解:5個受試的克龍巴赫系數(shù)?=0.54,由此可見,試卷的內(nèi)部一致性不高,第 部分的積差相關(guān)系數(shù)r=0.94 ,區(qū)分度很高。三、圖表制作題(15分)10 分)1. 請繪制一個測驗的命題雙向細目表,并做簡單的文字說明。高二英語期末測試試題雙向細目表題 型考
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 歡樂周末團隊歷奇小組(計劃書)
- 項目管理制度 (二)
- 襄陽棗陽市招聘事業(yè)單位工作人員考試試題及答案
- 2025年新型分子篩系列產(chǎn)品項目合作計劃書
- 2025年玻璃、陶瓷制品生產(chǎn)專用設(shè)備合作協(xié)議書
- 2025年郵政專用機械及器材項目建議書
- 2025年高純度丙烯酰胺及聚丙烯酰胺項目建議書
- 學習動力與教育環(huán)境的互動關(guān)系
- 教育創(chuàng)新論壇國際在線教育平臺的挑戰(zhàn)與機遇
- 教育國際合作打破教育壁壘的實踐研究
- 霍爾果斯人才集團招聘筆試沖刺題2025
- 2024年中級咖啡師技能認證考試復習題庫(含答案)
- 新課標(水平三)體育與健康《籃球》大單元教學計劃及配套教案(18課時)
- GB/T 44910-2024琥珀分級
- 應急文化守護萬家
- 臨時施工出入口交通疏導方案
- 醫(yī)療設(shè)備器材供貨安裝、調(diào)試及售后服務方案
- 汽車內(nèi)飾件及材料氣味評價標準解析
- 大學生創(chuàng)新創(chuàng)業(yè)基礎(chǔ)(創(chuàng)新創(chuàng)業(yè)課程)完整全套教學課件
- 部編版語文三年級上冊第四單元教材解讀大單元集體備課
- 《論語十二章》挖空練習及答案
評論
0/150
提交評論