版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、教育統(tǒng)計與測量學(xué)原理第1頁,共79頁,2022年,5月20日,17點4分,星期三教育統(tǒng)計與測量學(xué)原理學(xué)習(xí)教育統(tǒng)計與教育測量的重要意義1、教育統(tǒng)計和測量是認(rèn)識教育本質(zhì)的有力武器;2、是分析處理教育工作中各種數(shù)據(jù)資料、進(jìn)行 教育督導(dǎo)與評價的有效工具;3、對教育管理科學(xué)化具有重要意義 ;4、是教育科學(xué)研究中,發(fā)現(xiàn)探索教育教學(xué)規(guī)律、指導(dǎo)教育教學(xué)實踐、為教育行政部門決策提供依據(jù)的重要思想方法;5、是黨和政府制定教育方針、政策以及認(rèn)清教育事業(yè)和整個國民經(jīng)濟(jì)發(fā)展關(guān)系的重要工具。第2頁,共79頁,2022年,5月20日,17點4分,星期三 第一部分:教育統(tǒng)計學(xué)一、概述 1、什么是教育統(tǒng)計學(xué) 2、教育統(tǒng)計學(xué)的歷
2、史 3、教育統(tǒng)計學(xué)的內(nèi)容二、描述統(tǒng)計 1、常用的統(tǒng)計表、圖與統(tǒng)計量 2、相關(guān)分析 3、正態(tài)分布三、推斷統(tǒng)計 1、相關(guān)概念 2、總體平均數(shù)估計 3、平均數(shù)差異的顯著性檢驗四、實驗設(shè)計簡介第3頁,共79頁,2022年,5月20日,17點4分,星期三一、概述教育統(tǒng)計學(xué)概念、發(fā)展歷史、內(nèi)容 1、概念:教育統(tǒng)計學(xué)就是運(yùn)用數(shù)理統(tǒng)計的原理和方法研究教育問題的一門應(yīng)用科學(xué)。它是研究如何收集、整理、分析和解釋教育方面的數(shù)據(jù),從而表明教育上某些現(xiàn)象的特征及規(guī)律的一門科學(xué),它是處理教育實際工作和進(jìn)行教育研究以及提高管理質(zhì)量的科學(xué)水平、提高教育質(zhì)量的重要工具。 教育統(tǒng)計學(xué)的主要任務(wù):對教育現(xiàn)象進(jìn)行調(diào)查和實驗,在占有充
3、分?jǐn)?shù)據(jù)資料的基礎(chǔ)上,經(jīng)過對數(shù)據(jù)的整理計算、統(tǒng)計分析和統(tǒng)計檢驗等方法,對研究結(jié)果予以科學(xué)說明。即從數(shù)量方面的研究,來探索教育和心理現(xiàn)象的發(fā)展變化的特征和規(guī)律,或根據(jù)研究結(jié)果的數(shù)據(jù)處理、統(tǒng)計推斷,做出正確決策。 第4頁,共79頁,2022年,5月20日,17點4分,星期三教育統(tǒng)計學(xué)概念、發(fā)展歷史、內(nèi)容 2、教育統(tǒng)計學(xué)發(fā)展史:教育統(tǒng)計學(xué)產(chǎn)生于上個世紀(jì)初,發(fā)展于五、六十年代,廣泛應(yīng)用于八十年代以后。 (1)國外:20世紀(jì)初統(tǒng)計學(xué)傳入美國,桑代克()為了達(dá)到“極力以心理學(xué)與統(tǒng)計學(xué)為工具研究教育學(xué),使教育科學(xué)化”的目的,1904年出版世界上第一本有關(guān)教育統(tǒng)計學(xué)的專著心理與社會測量導(dǎo)論。 (2)國內(nèi):我國的
4、教育統(tǒng)計學(xué)是在辛亥革命以后,隨著西方科學(xué)技術(shù)成就一起被引入。當(dāng)時的大學(xué)教育系和中等師范學(xué)校,都把教育統(tǒng)計學(xué)作為必修課程,很多學(xué)者撰寫專著,如薛鴻志教育統(tǒng)計方法(1925)、王書林教育測驗與統(tǒng)計(1935)等。1979年隨著全國教育科學(xué)規(guī)劃會議的召開,教育統(tǒng)計學(xué)恢復(fù)了新生,各師范大學(xué)又都開設(shè)了教育統(tǒng)計學(xué)課程。教育部組織葉佩華、萬梅亭、郝德元、陳一百等教授編寫教育統(tǒng)計學(xué)作為全國通用教材。 經(jīng)過100多年的發(fā)展,各種教育統(tǒng)計方法已相當(dāng)豐富。但每一種方法的運(yùn)用在我國還處于推廣和適用階段,因此不少人對它的作用缺乏足夠的認(rèn)識,特別是對復(fù)雜的教育問題,由于統(tǒng)計方法本身的限制,還有十分重要的實驗設(shè)計和統(tǒng)計推斷
5、的問題不能在理論上得到有力解決,還有待于教育學(xué)家親自動手來推進(jìn)統(tǒng)計理論和改進(jìn)統(tǒng)計工具。第5頁,共79頁,2022年,5月20日,17點4分,星期三教育統(tǒng)計學(xué)概念、發(fā)展歷史、內(nèi)容 3、教育統(tǒng)計學(xué)的內(nèi)容: 教育統(tǒng)計學(xué)按應(yīng)用分為描述統(tǒng)計、推斷統(tǒng)計、實驗設(shè)計(多元統(tǒng)計)三部分內(nèi)容。 (1)描述統(tǒng)計的主要作用就在于就所關(guān)心的教育現(xiàn)象進(jìn)行全面調(diào)查和觀測,然后將所得的大量數(shù)據(jù)加以整理、簡縮、制成圖表;或就這些數(shù)據(jù)的分布特征(如集中趨勢、離散趨勢、相關(guān)度等等)計算出具有概括性的數(shù)字作為標(biāo)志。借助這些概括性的數(shù)字,我們就可以從雜亂無章的數(shù)據(jù)中取得有意義的信息。 (2)推斷統(tǒng)計也叫抽樣統(tǒng)計,它是在描述統(tǒng)計的基礎(chǔ)上
6、發(fā)展起來的。是用抽樣的方法,根據(jù)部分?jǐn)?shù)據(jù)來推斷一般情況,即通過局部對全局的情況加以推斷的一種方法。它可以幫我們透過現(xiàn)象看到本質(zhì),對客觀現(xiàn)象作出本質(zhì)性的判斷 ,它是從樣本的研究中得出統(tǒng)計量。來推斷總體的有關(guān)特征,以便作出具體的措施和決策。常用的方法有:u檢驗、t檢驗、卡方檢驗和非參數(shù)檢驗,還有多元分析中的主成份分析和因素分析等。 (3)實驗設(shè)計通常指實驗程序的計劃和安排。而實驗程序的計劃和安排離不開統(tǒng)計和檢驗。 第6頁,共79頁,2022年,5月20日,17點4分,星期三二、描述統(tǒng)計 第一章 常用統(tǒng)計表、統(tǒng)計圖及統(tǒng)計量 (一)常用統(tǒng)計表 1、統(tǒng)計表的結(jié)構(gòu):由標(biāo)題、項目(標(biāo)目)、數(shù)據(jù)、線條、表注(
7、數(shù)據(jù)來源)組成 1983年我國普通中學(xué)教師學(xué)歷統(tǒng)計表 學(xué) 歷 人 數(shù) 百分比(%) 大學(xué)本科以上 300887 11.6 大專畢業(yè) 566863 21.8 中專畢業(yè)以下 1729750 66.6 合 計 2596900 100.0 注:引自中國教育成就統(tǒng)計資料,1984年人民教育出版社標(biāo)題 項目 線條 數(shù)據(jù) 表注第7頁,共79頁,2022年,5月20日,17點4分,星期三二、描述統(tǒng)計 第一章 常用統(tǒng)計表、圖及統(tǒng)計量數(shù)2、制表的一般要求A、統(tǒng)計表的內(nèi)容要簡要,最好一個表說明一個中心內(nèi)容。標(biāo)題的措詞要簡明扼要,正確說明內(nèi)容,使人一望便知。B、分項要準(zhǔn)確,以能說明問題為主,分項的好壞是決定統(tǒng)計表質(zhì)量
8、的關(guān)鍵,切忌分項太細(xì)。C、數(shù)據(jù)是統(tǒng)計表的語言,說明內(nèi)容,要求準(zhǔn)確,書寫整齊,一律用阿拉伯?dāng)?shù)字,單位要統(tǒng)一,位數(shù)對齊,有效數(shù)字要一致,表格內(nèi)不能有空白。D、線條不要太多,表的上下端有頂線與底線,左右兩邊不要用線封死,縱項目用細(xì)線格開,橫項目一律不畫線條,合計項目用粗線條或雙線與其它項目分開。第8頁,共79頁,2022年,5月20日,17點4分,星期三(二)常用統(tǒng)計圖1、統(tǒng)計圖結(jié)構(gòu):圖題、圖目、圖尺、圖例、圖形、圖注人數(shù) 70 60 50 40 30 20 10 1980年 1985年 1991年某校近十年教師人數(shù)及性別變化圖示男 女年份圖例圖形第一章 常用統(tǒng)計表、統(tǒng)計圖及統(tǒng)計量圖目圖尺(制圖的尺
9、度線。點、單位的總稱)圖題第9頁,共79頁,2022年,5月20日,17點4分,星期三2、統(tǒng)計圖的類型及繪制要求繪制統(tǒng)計圖的要求A、根據(jù)數(shù)據(jù)和目的選擇合適的圖形B、圖形所表示的面積或距離要比例適當(dāng)C、表示不同的事物要用不同的顏色與線條類型:1 直條圖 2 圓形圖 3 曲線圖 4直方圖 講師42.9%助教28.8% 教授0.4%某大學(xué)教師職稱圖副教授21.9%某市7至18歲男女生身高比較圖1.751.701.651.601.551.501.451.40歲7 8 9 10 11 12 13 14 15 16 17 18米某校某班50名學(xué)生家庭背景情況比較 20 15 10 5人數(shù)其他農(nóng)工商企業(yè)職員
10、公務(wù)與科教人員141615 5 20 15 10 5人數(shù)其他農(nóng)工商企業(yè)職員公務(wù)與科教人員141615 5(二)常用統(tǒng)計圖第10頁,共79頁,2022年,5月20日,17點4分,星期三 3、次數(shù)分布表與直方圖 對一批數(shù)據(jù)按一定次序排列并加以分組、編成反映這群數(shù)據(jù)在各組上出現(xiàn)次數(shù)的統(tǒng)計表和圖,就是次數(shù)分布表和直方圖。例:一次考試之后,某班48名學(xué)生的成績?nèi)缦拢?86,77,63,78,92,72,66,87,75,83,74,47,83,81,76,82,97,69,82,88,71,67,65,75,70,82,77,86,60,93,71,80,76,78,57,95,78,64,79,82,
11、68,74,73,84,76,79,86,68 將該組數(shù)據(jù)整理成次數(shù)分布表與直方圖(二)常用統(tǒng)計圖第11頁,共79頁,2022年,5月20日,17點4分,星期三 1求全距:R=maxxi-minxi用該組數(shù)據(jù)最大數(shù)減最小數(shù) 2定組數(shù)和組距 :數(shù)據(jù)劃分組數(shù)、每組上下限之間距離(全距除以組數(shù)) 3列組限:從最高分至最低分以組距為單位依次分組 4歸組劃記:計算數(shù)據(jù)出現(xiàn)次數(shù),并計算累積次數(shù)及相對次數(shù) 步驟:例:一次考試之后,某班48名學(xué)生的成績?nèi)缦拢?6,77,63,78,92,72,66,87,75,83,74,47,83,81,76,82,97,69,82,88,71,67,65,75,70,82
12、,77,86,60,93,71,80,76,78,57,95,78,64,79,82,68,74,73,84,76,79,86,68 組限 組中值 劃記 次數(shù) f 累積次數(shù)f 相對次數(shù)Rf 累積相對次數(shù)Rf95 90 85 80 75 70 65 60 55 50 4599 94 89 84 79 74 69 64 59 54 49 2 2 5 9 12 7 6 3 1 0 1 2 4 9 18 30 37 43 46 47 47 48 0.040.040.100.190.250.150.130.060.0200.020.040.080.180.370.620.770.900.960.980.
13、981.00正 正 正 正 正正合計 48 48 1.00次 數(shù) 分 布 表 97 92 87 82 77 72 67 62 57 52 47K=1.87(n-1)2/5第12頁,共79頁,2022年,5月20日,17點4分,星期三14 12 10 8 6 4 245 50 55 60 65 70 75 80 85 90 95 100次數(shù)分?jǐn)?shù) 直方圖第13頁,共79頁,2022年,5月20日,17點4分,星期三(三)常用統(tǒng)計量集中量數(shù)1、集中量數(shù) :代表一組數(shù)據(jù)的集中趨勢和典型特征 常用的有:平均數(shù) 中數(shù) 眾數(shù)第一章 常用統(tǒng)計表、統(tǒng)計圖及統(tǒng)計量 (1) 平均數(shù)(算數(shù)平均數(shù)) X1、X=(X1+
14、X2+-+Xn)/n=(1/n)Xi (原始數(shù)據(jù)公式)2、X=fxc/n (分組數(shù)據(jù)公式) xc:組中值 f:次數(shù)3、X=(n1 x1+n2x2+-+nkxk)/(n1+n2+-nk) (加權(quán)平均數(shù)公式)第14頁,共79頁,2022年,5月20日,17點4分,星期三(2)中數(shù)(中位數(shù)):用 Md表示,是在一組按大小順序排列的數(shù)據(jù)中位置居中的那個數(shù)。數(shù)據(jù)是奇數(shù)個時,正好是中間位置的數(shù),即第(N+1)/2 個那個數(shù);數(shù)據(jù)是偶數(shù)個時,求中間位置兩個數(shù)的平均數(shù)。如:1 3 6 7 9 Md6; 3 6 7 9 20 21 Md(7+9)/2=8(3)眾數(shù):用 M0表示,是一組數(shù)據(jù)中次數(shù)出現(xiàn)最多的那個數(shù)
15、。在眾數(shù)不明顯的情況下,一般可看眾數(shù)段,即哪個分?jǐn)?shù)段的次數(shù)多,就以該段中點值作眾數(shù)。一般用觀察法求得。 眾中平 眾中平 平中眾 正態(tài)分布 正偏態(tài)分布 負(fù)偏態(tài)分布平均數(shù)、中數(shù)、眾數(shù)在數(shù)據(jù)常態(tài)分布中的相對位置第15頁,共79頁,2022年,5月20日,17點4分,星期三2、差異量數(shù):全距 平均差 標(biāo)準(zhǔn)差 差異量數(shù)是描述次數(shù)分布中“離中趨勢”這一特征的統(tǒng)計量,簡稱“差異量”。一組數(shù)據(jù),若離中趨勢小,則集中量的代表性就大;反之,若離中趨勢大,則集中量的代表性就小。但是,僅考慮集中量數(shù)是不夠的。要了解兩組學(xué)生成績分布的全貌,還必須研究兩個組的差異量數(shù)。最常用的差異量有全距、平均差和標(biāo)準(zhǔn)差。 (1)全距(
16、符號為“R”),指一組數(shù)據(jù)中由最大量數(shù)到最小量數(shù)的距離。R小說明離散程度小,比較整齊。 (2)平均差,指一組數(shù)據(jù)內(nèi)的每個數(shù)與均數(shù)差的絕對值的算術(shù)平均數(shù),通常用AD表示。平均差的計算公式為: 常用統(tǒng)計量差異量數(shù)AD=(1/n) Xi-X 或 AD=(1/n) Xi-Md第16頁,共79頁,2022年,5月20日,17點4分,星期三差異量數(shù)方差與標(biāo)準(zhǔn)差 (3)、標(biāo)準(zhǔn)差:指一組數(shù)據(jù)中每一個數(shù)值與它們的平均數(shù)之差的平方的算術(shù)平均數(shù)的平方根,其符號為S(樣本標(biāo)準(zhǔn)差)、總體標(biāo)準(zhǔn)差用表示。 S的計算公式為: S 越大表明離散程度越大,數(shù)據(jù)不均勻,集中量的代表性小。 方差與標(biāo)準(zhǔn)差除具有平均差的優(yōu)點之外,還具有
17、受抽樣影響小和適于代數(shù)運(yùn)算等優(yōu)點,是最優(yōu)良的差異量數(shù)。()()()()nxxxxxxxxSn2232221-+-+-+-= X X1 X22S2表示樣本方差 表示總體方差第17頁,共79頁,2022年,5月20日,17點4分,星期三標(biāo)準(zhǔn)差的應(yīng)用:變異系數(shù)、標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)差的應(yīng)用變異系數(shù)變異系數(shù)計算公式:主要用于:同一團(tuán)體不同觀測值離散程度的比較;對于水平相差較大,但進(jìn)行的是同一種觀測的各種團(tuán)體離散程度的比較。例:已知某小學(xué)一年級學(xué)生的平均體重為25千克,標(biāo)準(zhǔn)差是3.7千克,平均身高110厘米,標(biāo)準(zhǔn)差為6.2厘米,問體重與身高的離散程度那個大? 解:CV體重3.7/2514.8 CV身高6.2/1
18、10=5.64答:通過比較差異系數(shù)可知,體重的分散程度比身高的分散程度大(14.85.64)。變異系數(shù)是一種相對差異量,常用cv表示第18頁,共79頁,2022年,5月20日,17點4分,星期三標(biāo)準(zhǔn)差的應(yīng)用標(biāo)準(zhǔn)分 標(biāo)準(zhǔn)分?jǐn)?shù)(又稱Z分?jǐn)?shù))。它是一種以平均數(shù)為參照點,以標(biāo)準(zhǔn)差為單位的,表示一個分?jǐn)?shù)在團(tuán)體分?jǐn)?shù)中所處位置的量數(shù),其計算方法為:由原始分?jǐn)?shù)與平均分?jǐn)?shù)的差除以標(biāo)準(zhǔn)差所得的量數(shù),其符號為“Z”,計算公式是:標(biāo)準(zhǔn)分是以標(biāo)準(zhǔn)差為單位的,故稱為標(biāo)準(zhǔn)分。它是一種相對地位分。標(biāo)準(zhǔn)分有正負(fù)之分,一般在-3,3中(幾率為99.74%) ,平均值為零。標(biāo)準(zhǔn)分可比性根據(jù)在于標(biāo)準(zhǔn)正態(tài)分布。 T分?jǐn)?shù):T=10Z+5
19、0 (一般20T80) E分?jǐn)?shù):E=20Z+90 (一般30E150)第19頁,共79頁,2022年,5月20日,17點4分,星期三例:有某生三次數(shù)學(xué)考試的成績分別為70、57、45,三次考試的班平均分為70、55、42,標(biāo)準(zhǔn)差分別為8、4、5。如何看待該生的三次考試成績? 答:如果僅從原始分?jǐn)?shù)看,肯定認(rèn)為第一次最好,其實不然,要計算出各次的標(biāo)準(zhǔn)分?jǐn)?shù),才能說明問題。 根據(jù)公式得出: Z1=(7070)/8=0 Z2=(5755)/4=0.5 Z3=(4542)/5=0.6 這說明,原始分?jǐn)?shù)為70,其位置正在平均線上,而原始分?jǐn)?shù)為57的,其位置在平均線上0.5處,而原始分?jǐn)?shù)為45的,其位置在平均
20、線上0.6處。很顯然第三次成績最好,第一次最差。標(biāo)準(zhǔn)差的應(yīng)用標(biāo)準(zhǔn)分第20頁,共79頁,2022年,5月20日,17點4分,星期三標(biāo)準(zhǔn)分?jǐn)?shù): 運(yùn)用標(biāo)準(zhǔn)分比較不同教育測驗成績總分的優(yōu)劣,更為合理。例:甲乙兩學(xué)生五科考試成績?nèi)缦?,試分析哪名學(xué)生成績好些?語文數(shù)學(xué)地理歷史政治合計70.0 14.0 80 85 0.71 1.07 85.0 3.5 90 88 1.43 0.8655.0 4.0 57 51 0.50 1.0042.0 5.0 45 40 0.60 0.4070.0 8.0 70 90 0 2.50 342 354 3.24 3.03兩考生總成績標(biāo)準(zhǔn)分?jǐn)?shù)計算表 甲生 乙生 甲生 乙生 科
21、 目 X S X Z 如果按原始分?jǐn)?shù)乙生總分是354分優(yōu)于甲生的342分總分,但按標(biāo)準(zhǔn)分?jǐn)?shù)則甲生的3.24分優(yōu)于乙生的3.03分。標(biāo)準(zhǔn)差的應(yīng)用標(biāo)準(zhǔn)分第21頁,共79頁,2022年,5月20日,17點4分,星期三二、描述統(tǒng)計相關(guān)分析:研究兩自變量之間的關(guān)系緊密程度的過程,統(tǒng)計學(xué)上稱為相關(guān)分析。事物的變化總是伴隨著一定的量的變化,有些是單變量,有些是雙變量或多變量,也有些是復(fù)變量。集中量數(shù)和差異量數(shù)反映的是單變量數(shù)據(jù)特征,相關(guān)分析主要研究雙變量數(shù)據(jù)特征。 我們都知道事物現(xiàn)象間的相互關(guān)系,如果從數(shù)量關(guān)系的角度考察,可分為函數(shù)關(guān)系和相關(guān)關(guān)系兩種類型。相關(guān)關(guān)系可分為正相關(guān)、負(fù)相關(guān)、直線相關(guān)、曲線相關(guān)、完
22、全相關(guān)(函數(shù)關(guān)系)、高度相關(guān)、低相關(guān)和零相關(guān)。如:教育經(jīng)費的投入與教育事業(yè)發(fā)展規(guī)模和速度之間的關(guān)系是正相關(guān); 復(fù)習(xí)次數(shù)與遺忘量之間的關(guān)系是負(fù)相關(guān)。相關(guān)分析的方法有二:一是圖示法,一為計算法。第二章 相關(guān)分析圖示法:將兩組觀測值標(biāo)在坐標(biāo)系中曲線相關(guān)直線相關(guān)第22頁,共79頁,2022年,5月20日,17點4分,星期三二、描述統(tǒng)計 相關(guān)系數(shù):是描述兩組數(shù)據(jù)之間相關(guān)程度的量數(shù)種類有:積差相關(guān)系數(shù)、等級相關(guān)、點二列相關(guān)和 相關(guān)積差相關(guān)系數(shù)(皮爾遜系數(shù)):是描述來自正態(tài)總體兩個連續(xù)變量 之間線性相關(guān)程度的一種相關(guān)量數(shù)r=nxy-(x)(y)/ nX 2-(X)2ny2-(y)2 相關(guān)系數(shù)的范圍: -1
23、r1 當(dāng)r是正值時為正相關(guān); 當(dāng)r是負(fù)值時為負(fù)相關(guān);r=0為零相關(guān)。 通常1 r 0.70 為高度相關(guān);0.70 r 0.40為較顯著相關(guān) 0.40 r 0 為低相關(guān)。當(dāng)然在下結(jié)論時還要進(jìn)行顯著性檢驗 第二章 相關(guān)分析對相關(guān)系數(shù)的解釋注意以下問題: A在小樣本中要做顯著性檢驗;B相關(guān)系數(shù)大小差異不是絕對的;C相關(guān)系數(shù)不是等距的不能進(jìn)行大小比較;D相關(guān)關(guān)系不一定是因果關(guān)系第23頁,共79頁,2022年,5月20日,17點4分,星期三第二章 相關(guān)分析數(shù)學(xué)物理英語物理70757675606360638275657544605660525570559097859780894889r 0.91 r 0.
24、26 例:數(shù)學(xué)與物理、物理與英語相關(guān)性比較第24頁,共79頁,2022年,5月20日,17點4分,星期三 第三章 正態(tài)分布 在社會、教育現(xiàn)象中大多數(shù)隨機(jī)變量都呈現(xiàn)是或近似正態(tài)分布的情形。正態(tài)分布是統(tǒng)計理論與統(tǒng)計應(yīng)用中最重要應(yīng)用最廣泛的一種分布。正態(tài)曲線的特點1 1.5 2.5 3 4.5 6 X Y0.80.60.40.2 0 =0.8, =1.5、2.5、4.5二、描述統(tǒng)計 一個正態(tài)分布是由總體的平均數(shù)和總體的方差所決定的。1、 正態(tài)曲線及其特點正態(tài)分布 x(, )的密度函數(shù)曲線2正態(tài)曲線位于x軸上方,以x= 為對稱軸,以x軸為漸近線曲線的位置和形狀取決于 值和值 , 決定位置,決定形狀。越
25、大曲線越矮胖, 越小曲線越陡峭 x= 時曲線處于最高點,即當(dāng)x= 時f()1/ 2 為最大值 ,曲線呈中間高兩邊低的形態(tài)。p正態(tài)曲線方程:f(x)=【1/(2 ) 】e-(x- ) /2 22其中: 是園周率;e是自然對數(shù)的底;x為隨機(jī)變量的取值; 為正態(tài)分布的均 值; 為正態(tài)分布的方差。2pp第25頁,共79頁,2022年,5月20日,17點4分,星期三第三章 正態(tài)分布2、正態(tài)分布曲線的重要性質(zhì): -3-2- 0 2 3 68.26%95.46%99.73% 從概率的角度而言: 觀測數(shù)據(jù)落在(+1)內(nèi)的概率為68.26%;落在(+2 )內(nèi)的概率為95.46%;落在(+3 )內(nèi)的概率為99.7
26、3%。 z=(x-)/標(biāo)準(zhǔn)正態(tài)分布 x(0, 1 )z 、 P的意義如: z=1時 P=0.3413 z=2時 P=0.4772 z=2.5時 P=0.4938 z=3時 P=0.4987第26頁,共79頁,2022年,5月20日,17點4分,星期三3、正態(tài)曲線理論的應(yīng)用(1)推求學(xué)生成績中某些分?jǐn)?shù)的人數(shù) 例:假定500個學(xué)生某科成績近似正態(tài)分布,其X=70,=10,試問(1)75分以下有多少人(2)85分以上有多少人(3)75-85分之間有多少人。解:(1)z=(75-70)/10=0.5,查正態(tài)分布表中值為0.6915,因此75分以下的學(xué)生占69.15%,75分以下的人數(shù)是500X69.1
27、5%=346(人) (2) z=(85-70)/10=1.5,查正態(tài)分布表中值為0.93319, 85分以下的學(xué)生占93.319%,因此85分以上的學(xué)生占100%-93.319%=6.681%,所以85分以上的人數(shù)是500X 6.681%=33(人) (3)75分至85分之間,實際上是75分以上至85分以下的范圍,因此85分的百分率減去75分以下的百分率即為所求 93.319%-69.15%=24.169% 500 x24.169%=121(人) -3-2- 0 23 第27頁,共79頁,2022年,5月20日,17點4分,星期三正態(tài)曲線理論的應(yīng)用(2)推求某一特定百分率的成績界限 例:某縣對
28、初一年級學(xué)生1000名學(xué)生進(jìn)行能力測驗,其結(jié)果為X=75,=10,現(xiàn)擬根據(jù)此次結(jié)果選取25名學(xué)生作為“尖子班”培養(yǎng),假定測驗成績近似正態(tài)分布,問多少分以上才能被選到“尖子班”學(xué)習(xí)。97.5% 2.5%X 1.9675 94.6在正態(tài)分布表中查表中值0.975所對應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù),z=1.96,既是說1000名學(xué)生中有97.5的人數(shù)在標(biāo)準(zhǔn)分?jǐn)?shù)1.96以下,因此有2.5的人數(shù)在標(biāo)準(zhǔn)分1.96以上,再將標(biāo)準(zhǔn)分?jǐn)?shù)1.96化為原始分?jǐn)?shù)得: 1.96X1075=94.6(分) 答:分?jǐn)?shù)在94.6分以上才能進(jìn)“尖子班”。 分析:“尖子班”的人數(shù)占全年級的百分比為: 25/1000=2.5%用標(biāo)準(zhǔn)分計算更容易理解
29、:xxZ-=Z1.96(x-75)/10X= 1.96X1075=94.6(分)第28頁,共79頁,2022年,5月20日,17點4分,星期三正態(tài)曲線理論的應(yīng)用(3)分析測驗試題的難度例:某校學(xué)生在一次測驗中,第一題的答對率為15%,第二題的答對率為25%,第三題的答對率為35%,假設(shè)這三題所測量的能力近似正態(tài)分布,問1、2、3題的難度值各為多少?各題之間的難度差異怎樣?解: 試題難度值比較表題號 答對率 答錯率 難度值 難度差異 1 15% 85% 1.04 2 25% 75% 0.67 0.37 3 35% 65% 0.39 0.28在正態(tài)分布中,通常是根據(jù)答錯率找出所對應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)界限值
30、,此值即為該題的難度比值。由左表可知雖然三題的答對率都相差10,但第二題與第三題的難度差異卻比第一題與第二題的難度差異要小。x0 0.65 0.75 0.85 0.39 0.67 1.04第29頁,共79頁,2022年,5月20日,17點4分,星期三三、推斷統(tǒng)計 教育現(xiàn)象和一切客觀物質(zhì)世界中的現(xiàn)象一樣,不僅存在質(zhì)的方面,同時也存在量的方面,而且這兩方面是辯證統(tǒng)一的。教育統(tǒng)計學(xué)就是在教育現(xiàn)象的質(zhì)與量中,專門研究其數(shù)量方面特征的重要工具。在建立了以概率論和抽樣方法為主要依據(jù)后,教育統(tǒng)計學(xué)便具有了以局部推知全體,以樣本資料推知總體性質(zhì)的科學(xué)推斷功能。 根據(jù)樣本信息對總體參數(shù)狀況的推斷有兩種不同形式,
31、既總體參數(shù)估計和假設(shè)檢驗,二者既有區(qū)別也有聯(lián)系。第30頁,共79頁,2022年,5月20日,17點4分,星期三三、推斷統(tǒng)計 1、總體和樣本 所要研究對象的全體叫做總體。其中每一個研究對象叫做個體。從總體中抽取的一部分叫做總體的一個樣本,樣本中個體的數(shù)目叫做樣本容量。 例1:對家用電器質(zhì)量抽查,確定次品率。不能采用全部檢測的方法。 例2:全市要檢查初中學(xué)生體育鍛煉達(dá)標(biāo)情況,對每名學(xué)生一一測試工作量很大,不僅耗費人力、物力和時間,而且沒有必要。有沒有一種科學(xué)的方法只抽測一少部分學(xué)生,然后根據(jù)這部分學(xué)生的測試成績?nèi)ネ浦兄袑W(xué)生的體育達(dá)標(biāo)情況? 2、參數(shù)與統(tǒng)計量 總體參數(shù)是指一切由觀察測定總體的全部
32、個體而得到的統(tǒng)計量數(shù)(,); 樣本統(tǒng)計量是指為估計總體參數(shù)從樣本所得的統(tǒng)計( ,s )。第一章 相關(guān)概念第31頁,共79頁,2022年,5月20日,17點4分,星期三推斷統(tǒng)計4、抽樣方法3、隨機(jī)誤差樣本統(tǒng)計量與總體參數(shù)之間的差距。 從某市參加高考的1200名學(xué)生中抽取200名試卷組成一個樣本,計算這200份試卷的平均分和標(biāo)準(zhǔn)差,這200份試卷的平均分和標(biāo)準(zhǔn)差與1200名考生的平均分和標(biāo)準(zhǔn)差是有差距的,不同的抽取帶來不同的差距,這種差距稱之為隨機(jī)誤差。A、隨機(jī)抽樣(抽簽法、隨機(jī)數(shù)字法) B、機(jī)械抽樣 C、分層抽樣 D、整群抽樣 抽取樣本應(yīng)遵循的原則。第一總體中每一個個體被抽中的機(jī)會均等,即抽中與
33、抽不中純屬偶然;第二任一個體與其它個體在抽取時無聯(lián)帶關(guān)系,即抽中的個體與抽不中的個體無關(guān);第三在條件允許的情況下,盡量使樣本容量大一些。 5. 小概率事 在隨機(jī)事件中,概率很小的事件被稱為小概率事件,習(xí)慣上約定在0.05以下,即當(dāng)P(A) 5%時,則稱A為小概率事件。在統(tǒng)計推斷中認(rèn)為,小概率事件在一次試驗或觀察中是不可能發(fā)生的。第32頁,共79頁,2022年,5月20日,17點4分,星期三 第二章 總體平均數(shù)的區(qū)間估計 (總體平均數(shù)的置信區(qū)間) 推斷統(tǒng)計的基本理論之一就是抽樣理論,而推斷統(tǒng)計的任務(wù)則是根據(jù)樣本資料來推斷總體的特征,從而揭示總體的本質(zhì)和規(guī)律。 抽樣分布的幾個重要定理(統(tǒng)計推斷的理
34、論依據(jù)) 1.從總體中隨機(jī)抽出容量為n的一切可能樣本的平均數(shù)的平均數(shù)等于總體的平均數(shù)。E(x)= 2.容量為n的平均數(shù)在抽樣分布上的標(biāo)準(zhǔn)差,等于總體標(biāo)準(zhǔn)差除以n的方根。 x=n 3、從正態(tài)總體中,隨機(jī)抽取的容量為n的一切可能的樣本平均數(shù)的分布也呈正態(tài)分布。 4、雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體和的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。多個樣本平均數(shù)呈正態(tài)分布 N(, )xn第33頁,共79頁,2022年,5月20日,17點4分,星期三 第二章 總體平均數(shù)的區(qū)間估計 (總體平均數(shù)的置信區(qū)間) (一)、原總體的方差已知 樣本平均數(shù)的總體分布,在樣本容量很大時其分布近似于正態(tài)分布,
35、樣本平均數(shù)分布的標(biāo)準(zhǔn)差為/ n,根據(jù)正態(tài)分布的性質(zhì)U=(X- )/ X 服從正態(tài)分布。對于給定的 值(01),則稱(1-)為置信度,可求出滿足P(UU)=1-。一般取=0.01或=0.05,對應(yīng)的U0.05=1.96 U0.01=2.58。置信區(qū)間:=0.05 (x-1.96/ n, x+ 1.96/n )為總體平均 數(shù)95%的置信區(qū)間 =0.01 (x-2.58/ n, x+ 2.58/n )為總體平均數(shù)99%的置信區(qū)間根據(jù)樣本平均數(shù)估計總體平均數(shù)的所在區(qū)間,稱為總體平均數(shù)的區(qū)間估計?;驹恚喊匆欢ǜ怕室螅鶕?jù)樣本平均數(shù)估計總體平均數(shù)的所在區(qū)間。01/2 /2區(qū)間估計示意圖x-1.96/
36、 nx+ 1.96/n x+ 1.96/n 01/2 /2區(qū)間估計示意圖x-1.96/ nx+ 1.96/n 01/2 /2區(qū)間估計示意圖x-1.96/ nx+ 1.96/n 第34頁,共79頁,2022年,5月20日,17點4分,星期三(二)、原總體的方差未知 對于總體方差未知且容量n30,則用S代 相應(yīng)的有置信區(qū)間為:=0.05 (x-1.96S/ n, x+ 1.96S/n )為總體平均數(shù)95%的置信區(qū)間 =0.01 (x-2.58S/ n, x+ 2.58S/n )為總體平均數(shù)99%的置信區(qū)間例:從某地區(qū)高考初試的數(shù)學(xué)試卷中,隨機(jī)抽取40份,分析后得到如下數(shù)據(jù),平均成績?yōu)?1.2,標(biāo)準(zhǔn)
37、差為3.8,問這一地區(qū)初試數(shù)學(xué)平均成績在怎樣的范圍內(nèi)?答:已知 X=51.2 S=3.8 n=40, 本題屬于總體方差未知且大樣本n30, 因此: 置信區(qū)間的下限40=50 置信區(qū)間的上限40=52 這一地區(qū)初試數(shù)學(xué)平均成績有95%的可能性在(50,52)范圍內(nèi)。 同理也可以計算出有99的可能性在(49.6,52.7)范圍內(nèi)。第35頁,共79頁,2022年,5月20日,17點4分,星期三 三、推斷統(tǒng)計 第三章 顯著性檢驗 平均數(shù)差異的顯著性檢驗(Z檢驗與t檢驗)一、顯著性檢驗的基本思想 顯著性檢驗是統(tǒng)計推斷的一種方法,它是確定一個具有已知統(tǒng)計量的樣本是不是從已知對應(yīng)參數(shù)的總體中抽出來的或是兩樣
38、本的統(tǒng)計量是來自同一總體還是來自不同的總體。或從另外的角度說,樣本統(tǒng)計量與總體參數(shù)的差異或兩個樣本統(tǒng)計量的差異究竟是由于抽樣所引起的隨機(jī)誤差,還是本質(zhì)上的誤差,這需要檢驗才能加以確定。判斷這種差異是否顯著,要用概率來回答。如果差異是由于抽樣誤差而引起的可能性大,那末兩者的差異就不顯著,反之兩者的差異就顯著。 抽樣誤差的概率大小是由顯著性水平來衡量的。通常采用的顯著性水平為0.05或0.01,如果 P0.05為差異不顯著;如果 0.05P0.01差異顯著;如果Pt(df)0.05,從上表可知,概率P0.05時,和0之間的差異顯著。因此可下結(jié)論為:拒斥H0:=0,而肯定H1:0,又因 0,故結(jié)論表
39、明新教材實驗有成效。第44頁,共79頁,2022年,5月20日,17點4分,星期三平均數(shù)差異的顯著性檢驗(t檢驗) 3、其它檢驗公式 如果是按同一組樣本不同情況的測試所得的平均值 1和 2來檢驗平均值的差異程度,其計算公式為:式中,D為兩次測試中每對分?jǐn)?shù)之差即D=X2X1。 對于兩個獨立的正態(tài)總體,如果已知兩總體方差相等但未知總體方差具體數(shù)值,從中各抽取一隨機(jī)樣本,兩樣本平均數(shù)之差將服從自由度為 的t 分布。其檢驗統(tǒng)計量的計算公式 第45頁,共79頁,2022年,5月20日,17點4分,星期三實驗設(shè)計簡述實驗設(shè)計:實驗者為了揭示實驗中的自變量與因變量的關(guān)系,在實驗之前所作的實驗計劃,通常指實驗
40、程序的計劃和安排。而實驗程序的計劃和安排離不開統(tǒng)計、檢驗。實驗設(shè)計的內(nèi)容:包括怎樣選擇被試(實驗對象),控制那些因素,指出什么假設(shè),觀察那些內(nèi)容,如何安排實驗步驟,采取何種統(tǒng)計方法來處理和分析實驗結(jié)果等等。第46頁,共79頁,2022年,5月20日,17點4分,星期三例:控制變量 指示語(一)目的:通過把指示語作為自變量,觀察被試對反應(yīng)變量的不同影響,從而了解到不是以指示語為自變量的實驗中控制指示語的重要性。(二)材料:數(shù)學(xué)試卷一份,馬表。(三)程序:1按全班被試的數(shù)學(xué)程度,分為數(shù)學(xué)能力相同的甲、乙兩組。 2主試僅向甲組被試著重指出:你們在運(yùn)算時必須注意試題 中數(shù)字之間的關(guān)系,余內(nèi)容兩者相同。
41、 3主試說明實驗要求,發(fā)給各被試試題一張,覆置桌上。主試發(fā)“預(yù)備”口令 時,被試把題紙翻轉(zhuǎn)正面,寫好姓名等項,主試發(fā)“開始”口令時,同時開 動馬表,被試答題。 4被試做完題目,立即停筆并問得答題時間,記錄在試題紙上。 5全組做完,主試宣布答案,被試加以核對,并記錄成績,以便整理全組結(jié)果。 (四)結(jié)果:1統(tǒng)計甲乙兩組的平均成績(做對題數(shù)和做題的時間) 2檢驗兩組時間(或成績)差異的顯著性 (五)討論:1在本實驗中,你是怎樣發(fā)現(xiàn)題目的規(guī)律的 2指導(dǎo)語在解題中所起作用如何第47頁,共79頁,2022年,5月20日,17點4分,星期三實驗設(shè)計簡述附:數(shù)學(xué)試題如下 姓名組別時間在下列各數(shù)列后的橫線上,填
42、寫你認(rèn)為應(yīng)該填寫的數(shù)字(1)2 6 10 14 18 (2)3 12 48 192 768 (3)8 4 2 1 (4)31/4 8 33/4 (5)4 5 5 6 6 7 (6)3 8 13 18 23 (7)1 3 4 6 7 9 (8)7 2 5 0 3 -2 (9)1 3 4 6 10 12 22 (10)1 2 2 2 4 2 8 第48頁,共79頁,2022年,5月20日,17點4分,星期三第二部分 教育測量學(xué)原理簡介第一章 教育測量概述 一 教育測量的含義與特點 二 教育測量發(fā)展的歷史 三 教育測量的要素和種類 四 教育測量的功能及對教育測量應(yīng)持的態(tài)度第二章 測驗的信度、效度、難
43、度與區(qū)分度 一、測驗的信度 二、測驗的效度 三、測驗的難度 四、測驗的區(qū)分度第三章 測驗的編制與實施 一、確定測驗?zāi)康?二、教育目標(biāo)分類 三、編制測驗雙向細(xì)目表 四、試題的編制 五、試題評分 六、試卷的編輯與測驗實施 七、試卷分析第四章 題型編制的一般原理與方法第49頁,共79頁,2022年,5月20日,17點4分,星期三 第一章 教育測量概述 一、教育測量的含義與特點 1、教育測量的含義 測量(Measurement) :通常指人們對客觀事物進(jìn)行某種數(shù)量化的測定。 測量是以數(shù)量來表述結(jié)果的,沒有數(shù)量來表述的結(jié)果不能稱為測量。 教育測量(Educational Mcasufement) :就是
44、對學(xué)生的學(xué)習(xí)能力、學(xué)業(yè)成績、興趣愛好、思想品德以及教育措施上許多問題的數(shù)量化測定。 教育測量主要對學(xué)生精神特性的測定。 凡物之存在必有其數(shù)量,凡有數(shù)量的東西都可以測量,測不準(zhǔn)原理。第50頁,共79頁,2022年,5月20日,17點4分,星期三一、教育測量的含義與特點測量、測驗、考試、評價的聯(lián)系與區(qū)別 測量與測驗:測驗(Test)是引起某種行為的工具,通常是指運(yùn)用某些儀器、試題來引起人們的某種行為,從而測定人們的某種特性。它是進(jìn)行數(shù)量化分析和科學(xué)推斷的前提和手段。 測量比測驗的含義要廣泛,測量不僅包括著運(yùn)用儀器、試題來進(jìn)行測定事物的質(zhì)量與特性,而且還包括著運(yùn)用調(diào)查、觀察等方法來測量事物的質(zhì)量與特
45、性,測量既包括對事物的測驗,又包含對事物進(jìn)行數(shù)量化的分析,并對測驗結(jié)果進(jìn)行一定的解釋和評價。 測驗與考試(Examination)也不盡相同。我們平時所說的考試,通常只憑教師自己的經(jīng)驗去出試題和評分,帶有主觀隨意性。測驗是經(jīng)過較細(xì)致的科學(xué)分析才編制出測驗的題目,在測驗的程序和評分方面也有較嚴(yán)格的要求。考試一般用于考核學(xué)生的學(xué)業(yè)成績,測驗不僅用于考核學(xué)生的學(xué)業(yè)成績,還用于心理特性的測量。 測量與評價(Eval ution)既有聯(lián)系,也有區(qū)別。測量強(qiáng)調(diào)的是數(shù)量化,評價則是突出價值觀,充分重視對問題的分析與評斷。 第51頁,共79頁,2022年,5月20日,17點4分,星期三一、教育測量的含義與特點
46、2、教育測量的特點 (1)教育測量一般是間接測量 我們只能通過學(xué)生對測驗題目的反應(yīng)和一些行為表現(xiàn)運(yùn)用推理、判斷的方法,來間接的測量出他們的知識水平、智力高低和品德好壞。 (2)教育測量的度量單位是相對的 學(xué)生的學(xué)業(yè)成績好壞、智力高低和能力大小等,都是就其在所在團(tuán)體的整個分?jǐn)?shù)序列、行為序列中的地位來說的,其測量的分?jǐn)?shù)單位,并非絕對的。 (3)教育測量是為實現(xiàn)教育目的服務(wù)的 是為改進(jìn)教育工作,提高教育質(zhì)量,更好地實現(xiàn)教育目的服務(wù)的。不能脫離教育目的和教材的要求,隨意地制定測驗量表,任意地進(jìn)行測量。對各種教育測量結(jié)果的評價,也都應(yīng)依據(jù)教育目的的要求來進(jìn)行。 第52頁,共79頁,2022年,5月20日
47、,17點4分,星期三第一章 教育測量概述二、教育測量發(fā)展的歷史主觀經(jīng)驗性考試階段(1864年以前) 教育測量起源于我國的科舉考試制度。 客觀標(biāo)準(zhǔn)化測驗階段(1864一1940年) 法國的比納 、西蒙,美國的推孟 、桑戴克、麥柯爾 比納被稱為智力測量的鼻祖,桑戴克被稱為教育測量學(xué)的鼻祖 客觀測驗的深入發(fā)展階段(1940年) 過去教育測量多為對學(xué)生知識的測量,很少測量學(xué)生的心理和品德?,F(xiàn)在的教育測量,不僅重視測量學(xué)生的知識,而且重視學(xué)生的智力和思想品德的測量。 過去教育測量的量表編制多為單一答案的求同式思維,缺乏多種答案的求異式思維,現(xiàn)在教育測量的量表中,也包括有多種答案的求異式思維題和論文題。
48、過去教育測量多用于對學(xué)生的學(xué)習(xí)成績的測量,很少涉及課程設(shè)置、教材、教育改革方案等效益方面的測量,現(xiàn)在在教育工作的各個方面都運(yùn)用教育測量。 過去教育工作中的客觀測驗,一般是常模參照測驗,現(xiàn)在教育工作中的客觀測驗,不僅有“常模參照性測驗”,而且有“目標(biāo)參照性測驗”。第53頁,共79頁,2022年,5月20日,17點4分,星期三 第一章 教育測量概述三、教育測量的要素和種類 單位 教育測量中的單位不是絕對等價值的 參照點 教育測量的參照點都屬于人為設(shè)定,從參照點起計算的分?jǐn)?shù)不能 以“倍數(shù)”的方式解釋 量表 具有單位和參照點的連續(xù)體。 教育測量所使用的量表有四種:百分量表、年齡量表、等級量表、T量表
49、2、教育測量的種類 以測量的對象來分:學(xué)業(yè)成績測驗、智力測驗、人格測驗、特殊能力測驗 以測量的目的來分:預(yù)測測驗、形成性測驗、總結(jié)性測驗、診斷性測驗、 難度測驗、速度測驗 以測量的方式來分:個人測驗、團(tuán)體測驗 以試題的形式來分:客觀性測驗、論文式測驗、投射測驗、情景測驗 1、教育測量的要素第54頁,共79頁,2022年,5月20日,17點4分,星期三第一章 教育測量概述四、教育測量的功能及對教育測量的認(rèn)識態(tài)度1、教育測量的功能 教育測量是改進(jìn)教學(xué)的良好工具 教育測量是教育管理的重要手段 教育測量是教育研究的重要方法2、對教育測量應(yīng)有的認(rèn)識態(tài)度 教育測量是一種工具 教育測量尚需完善 對教育測量應(yīng)
50、持嚴(yán)肅的態(tài)度第55頁,共79頁,2022年,5月20日,17點4分,星期三教育測量學(xué)原理第二章 測驗的信度、效度、難度與區(qū)分度 測驗的信度、效度、難度與區(qū)分度是衡量測量質(zhì)量的基本標(biāo)準(zhǔn) 作為教育測量的工具測驗,它的編制是一項十分復(fù)雜的工作,它需要懂得一些教育測量基本知識和基本方法的人來完成。一個連信度、效度、難度和區(qū)分度等教育測量基本概念都不甚了解的人是難以編出高質(zhì)量的測驗的。 從教育測量的理論上來講,一個良好的測驗應(yīng)該具備以下條件: 測驗的試題與測量的目標(biāo)吻合 測驗的試題應(yīng)具有代表性 測驗的試題有恰當(dāng)?shù)碾y度和區(qū)分度 測驗的試題的語言陳述簡單、明確 測驗的結(jié)果有效和可靠(即效度、信度高) 測驗的
51、實施符合經(jīng)濟(jì)性原則 其中測驗的信度、效度、難度和區(qū)分度是衡量測驗質(zhì)量的基本指標(biāo)。 第56頁,共79頁,2022年,5月20日,17點4分,星期三測驗的信度、效度、難度與區(qū)分度 一、信度 (reliability) 所謂測驗的信度是指測驗的可靠性或者可靠程度。具體地說,測驗的信度是指同一組學(xué)生用同一測驗實施兩次后所得分?jǐn)?shù)的一致性,或者同一組學(xué)生經(jīng)過一次測驗后,用另一個同質(zhì)的測驗再測一次,這兩次測驗所得分?jǐn)?shù)的一致性。 根據(jù)統(tǒng)計學(xué)的基本原理,刻劃測驗的信度有三種方法: 穩(wěn)定性系數(shù) 穩(wěn)定性系數(shù)的求法是:先對某個測驗實施一次,過了一段時間后。再用這個測驗實施一次,然后計算學(xué)生在前后再次測驗中所得分?jǐn)?shù)的相
52、關(guān)系數(shù)。這個相關(guān)系數(shù)就是穩(wěn)定性系數(shù)。 等值性系數(shù) 等值性系數(shù)的求法是:等值性系數(shù)是以兩個等值(題型、題數(shù)、難度、區(qū)分度相等)但具體內(nèi)容不同的量表,在最短時距內(nèi),對相同應(yīng)試者先后施測兩次的兩組對應(yīng)分?jǐn)?shù)的相關(guān)系數(shù)。 內(nèi)部一致性系數(shù) 內(nèi)部一致性系數(shù)的求法是:將一個測驗分?jǐn)?shù)分為兩個相等而獨立的部分(例如奇數(shù)題和偶數(shù)題),然后求兩者的相關(guān)系數(shù)。對于這個相關(guān)系數(shù),再用斯皮爾曼-布朗公式r信=2r/1+r來校正。其中r是相關(guān)系數(shù),r信就是內(nèi)部一致性系數(shù)。 第57頁,共79頁,2022年,5月20日,17點4分,星期三測驗的信度、效度、難度與區(qū)分度 在前述三種類型的信度系數(shù)中,前兩個都要學(xué)生接受同一(或同質(zhì))
53、內(nèi)容的兩次測驗,這在實際的中小學(xué)教育過程中是不現(xiàn)實的。因此,在中小學(xué)教育或從事教育科學(xué)研究的過程中,信度系數(shù)的計算一般以內(nèi)部一致系數(shù)為主。 測驗的信度是十分重要的,不可靠的測驗是沒有什么意義的,如用一桿秤去稱肉,第一次稱的的重量是1500克,第二次稱得的重量是1000克,那么這種秤還有什么用呢?教育測量也是如此,如用一次去測量學(xué)生的數(shù)學(xué)學(xué)業(yè)水平,第一次測驗的成績是92分,第二次測驗的成績卻只有61分,這樣就無法確定這個學(xué)生的數(shù)學(xué)學(xué)業(yè)水平。當(dāng)然,這個測驗是根本不可靠的。 就測驗的內(nèi)容而言,學(xué)業(yè)成績測驗要求信度系數(shù)在0.9以上,常達(dá)到0.95;智力測驗應(yīng)達(dá)到0.85以上;個性測驗和興趣測驗稍低,應(yīng)
54、在0.70.8.第58頁,共79頁,2022年,5月20日,17點4分,星期三測驗的信度、效度、難度與區(qū)分度 提高測驗信度的方法:延長測驗的長度。量表題目越少,得分越容易受試題抽樣的偶然因素影響,當(dāng)然測驗的信度也越低。新增加的試題必須與原試題同質(zhì)(平均難度一樣)且不使被試感到厭倦。測驗的難度要適中,同一測驗中的試題難度水平接近。施測內(nèi)容盡量單一。不要妄圖在一次測驗中測量被試的所有能力,信度很低。測驗的時間要充分,使被試從容回答問題。測驗的程序要統(tǒng)一。進(jìn)行多次測驗,開始時的指導(dǎo)語、回答問題方式、分發(fā)收回試卷的辦法、時間掌握都要盡量一致。評分要客觀。客觀性測驗,評分標(biāo)準(zhǔn)明確有助于提高測驗的信度。主
55、觀性試題,受偶然因素影響大,往往評分者的“量尺”不統(tǒng)一,信度差。加大應(yīng)試者之間的差異。因為信度系數(shù)的大小與實得分?jǐn)?shù) 成正比,加大被試能力的差異可提高信度。2第59頁,共79頁,2022年,5月20日,17點4分,星期三測驗的信度、效度、難度與區(qū)分度 二、效度(Validity) 所謂測驗的效度是指一個測驗真正能確實測量到它所要測量的東西的程度。它是針對測量的目的和結(jié)果而言的。 根據(jù)測量的目的,可以把測驗的效度分為內(nèi)容效度、結(jié)構(gòu)效度和效標(biāo)關(guān)聯(lián)效度三種。 內(nèi)容效度 內(nèi)容效度是指測驗?zāi)康拇頊?zhǔn)備測驗的內(nèi)容和引起的預(yù)期反應(yīng)所達(dá)到的程度。如在教育實驗研究的測量中,“準(zhǔn)備測量的內(nèi)容”是指實驗自變量的變化,
56、“預(yù)期反應(yīng)”是指實驗因變量的變化。 目前,對測驗的內(nèi)容效度沒有恰當(dāng)?shù)挠嬎惴椒?,尚不能用一個簡單數(shù)字來刻劃它?,F(xiàn)在判斷測驗的內(nèi)容效度一般是用邏輯分析法或內(nèi)容分析法。 結(jié)構(gòu)效度 測驗的結(jié)構(gòu)效度是指測驗結(jié)果能夠說明教育學(xué)和心理學(xué)理論的某種結(jié)構(gòu)或特征的程度。它可以理解為測驗實際上測量了準(zhǔn)備測量的結(jié)構(gòu)特征所達(dá)到的程度。 測驗的結(jié)構(gòu)效度問題比較復(fù)雜。一般在中小學(xué)教育和教育科學(xué)研究中所使用的自編測驗是不考慮這個問題的。 效標(biāo)關(guān)聯(lián)效度 測驗的效標(biāo)關(guān)聯(lián)效度是指測驗結(jié)果與作為效標(biāo)的另一個獨立的測驗結(jié)果之間的一致性程度。這種一致性程度一般是用本測驗結(jié)果與另一個獨立的測驗結(jié)果之間的相關(guān)系數(shù)來描述的。 那個獨立的測驗結(jié)
57、果是用來估計本測驗效度的標(biāo)準(zhǔn),所以叫做效標(biāo)。實際上,效標(biāo)在一定程度上用另一個獨立測驗結(jié)果反映本測驗準(zhǔn)備測量的某些特征。 由于效標(biāo)是計算測驗的效標(biāo)關(guān)聯(lián)效度的主要依據(jù)。因此,效標(biāo)必須確實能反映某個方面的特征。只有這樣才能成計算測驗效標(biāo)關(guān)聯(lián)效度的依據(jù)。 第60頁,共79頁,2022年,5月20日,17點4分,星期三測驗的信度、效度、難度與區(qū)分度效度的統(tǒng)計定義:提高效度的方法控制系統(tǒng)誤差。精心編制量表。妥善組織測驗擴(kuò)充樣本的容量和代表性。 合理處理信度和效度的關(guān)系。從某種意義上講效度比信度更重要第61頁,共79頁,2022年,5月20日,17點4分,星期三 三、難度:被試完成題目(item)任務(wù)時所遇
58、到的困難程度。 在教育測量中,某測驗的難度一般是用正確解答該測驗題的人數(shù)與參與測驗的學(xué)生數(shù)的比值來刻劃的。用公式表示即 P=R/N 其中,P表示某測驗題的難度,R表示答對該測驗題的人數(shù),N表示參加測驗的人數(shù)。 難度對測驗有很大的影響。這種影響主要體現(xiàn)在影響測驗成績的分布,影響測驗成績的離散程度;影響測驗的區(qū)分能力等三個方面。 難度計算,常用的以下幾個公式: P=X/W 其中P表示某測驗題的難度,X表示接受測驗的學(xué)生在該測驗題上的平均分?jǐn)?shù),W表示該測驗題的最高得分。 P=PH+PL/2 其中P表示某測驗題的難度,PH表示接受測驗的高分組學(xué)生(占總數(shù)的27%)在該測驗題的通過率,PL表示接受測驗的
59、低分組學(xué)生(占總數(shù)的27%)在該測驗題的通過率。 P=XH+XL-2NL/2N(H-L) 該公式只適宜計算論文式測驗題的難度。其中P表示某測驗題的難度,XH表示接受測驗的高分級學(xué)生的得分總數(shù),XL 表示接受測驗的低分級學(xué)生的得分總數(shù),N表示接受測驗的學(xué)生總數(shù)。H表示該測驗題的最高可能得分,L表示該測驗題的最低可能得分。 測驗的信度、效度、難度與區(qū)分度第62頁,共79頁,2022年,5月20日,17點4分,星期三 四、區(qū)分度 區(qū)分度又叫鑒別力,它是測驗對學(xué)生實際水平的區(qū)分程度的指標(biāo)。一個具有良好區(qū)分度的測驗題,實際水平高的學(xué)生應(yīng)該得高分,實際水平低的學(xué)生應(yīng)該得低分。 測驗的區(qū)分度有積極區(qū)分度和消
60、極區(qū)分度兩種。積極區(qū)分是指區(qū)分的方向與測驗總分的方向一致的區(qū)分,區(qū)分的方向與測驗部分的方向不一致的區(qū)分是消極區(qū)分。 測驗題的區(qū)分度的取值范圍在-100至100之間。如果區(qū)分度是負(fù)值,則表示該區(qū)分是消極區(qū)分;如果區(qū)分度為0,則表示該測驗題沒有區(qū)分;如果區(qū)分度是正值,則表示該區(qū)分是積極區(qū)分。 測驗的信度、效度、難度與區(qū)分度第63頁,共79頁,2022年,5月20日,17點4分,星期三 四、區(qū)分度 測驗題的區(qū)分度的計算方法很多。在中小學(xué)教育和教育科學(xué)研究中使用的測驗題的區(qū)分度一般用下列公式來計算。 客觀性測驗題區(qū)分度計算公式 D=PH-PL 其中D表示某測驗題的區(qū)分度,PH表示測驗高分組學(xué)生對該測驗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑裝修勞務(wù)分包合同范本
- 2024年小吃檔口的承包合同協(xié)議書
- 代理配股繳款協(xié)議專業(yè)版
- 家庭住宅客戶專用
- 正式授權(quán)加工合同書
- 房產(chǎn)中介銷售代理合同范例
- 電臺合作協(xié)議范本新
- 委托投資合同協(xié)議書模板
- 長期出租協(xié)議
- 改進(jìn)版用工合同格式
- 提請法院裁定變價方案
- 小型服裝廠應(yīng)急預(yù)案范文
- 消防報警設(shè)備合同
- 提升初中英語書面表達(dá)能力的教學(xué)策略探析
- 第五單元寫作《如何突出中心》公開課一等獎創(chuàng)新教學(xué)設(shè)計-統(tǒng)編版語文七年級上冊
- 2023-2024學(xué)年北京朝陽區(qū)高三(上)期中地理試題及答案
- 江蘇省連云港市海州區(qū)新海初級中學(xué)2023-2024學(xué)年七年級上學(xué)期期中數(shù)學(xué)試題
- 污水處理廠冬季安全生產(chǎn)基礎(chǔ)知識
- 完整版八、施工現(xiàn)場總平面布置圖
- 分析化學(xué)期中考試試題
- 新外研版高二英語選擇性必修二Unit3-A-new-chapter課件(精編)
評論
0/150
提交評論