教育研究方法基礎(chǔ)-第七章_第1頁
教育研究方法基礎(chǔ)-第七章_第2頁
教育研究方法基礎(chǔ)-第七章_第3頁
教育研究方法基礎(chǔ)-第七章_第4頁
教育研究方法基礎(chǔ)-第七章_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

教育研究方法基礎(chǔ)---第七章《教育統(tǒng)計與教育測驗》

教育統(tǒng)計是運用數(shù)理統(tǒng)計原理和方法,研究教育問題的一門應(yīng)用科學。主要包括:描述統(tǒng)計、推斷統(tǒng)計、實驗設(shè)計。教育測量就是對教育領(lǐng)域內(nèi)的事物或現(xiàn)象,根據(jù)一定的客觀標準,作縝密地考核,并依一定的規(guī)則將考核的結(jié)果予以數(shù)量描述。如對學生的思想品德、健康狀況、學業(yè)成績等的測量。什么是教育統(tǒng)計與測量?

第一節(jié)變量與變量種類

一、總體與樣本

一般來說,統(tǒng)計中研究對象的全體稱為總體,組成總體的基本單位稱為個體。從總體總抽出一部分個體進行研究,被抽到的個體稱為樣品,樣品的全稱稱為樣本,樣品的個體稱為樣本容量,通常用N(n)表示。

二、變量

所謂變量是指研究對象的個體之間在性質(zhì)和數(shù)量上可以變化并可以測量的條件、現(xiàn)象或特征。許多時候,變量是描述個體某方面特征的名稱,

三、變量類型

1、定類變量

也稱類別變量,根據(jù)定性的原則區(qū)分總體各個案類別的變量。定類變量的值只能把研究對象分類,也即只能決定研究對象是同類抑或不同類,具有=與≠的數(shù)學性質(zhì),是一種虛擬變量。此變量沒有絕對零點,沒有測量單位,變量之間有“相等”和“不等”的關(guān)系,但不能比較大小,也不能進行加減乘除四則運算。

例如:

性別區(qū)分為男性和女性兩類出生地區(qū)分為農(nóng)村、城市、城鎮(zhèn)三類民族背景區(qū)分為漢、蒙、回、

苗、壯、藏、維吾爾等婚姻狀況區(qū)分為未婚、已婚、分居、離婚、喪偶等

2、定序變量

定序變量稱為等級變量,是區(qū)別同一類別個案中等級次序的變量。定序變量能決定次序,也即變量的值能把研究對象排列高低或大小,具有>與<的數(shù)學特質(zhì)。

定序變量既無零點又無測量單位,但變量之間的值具有“等于”或“不等于”的關(guān)系、四則運算沒有意義。

例如:

文化程度可以分為大學、高中、初中、小學、文盲工廠規(guī)??梢苑譃榇?、中、??;年齡可以分為老、中、青

這些變量的值,既可以區(qū)分異同,也可以區(qū)別研究對象的高低或大小。但是,各個定序變量的值之間沒有確切的間隔距離。比如大學究竟比高中高出多少,大學與高中之間的距離和初中與小學之間的距離是否相等,通常是沒有確切的尺度來測量的。定序變量在各個案上所取的變量值只具有大于或小于的性質(zhì),只能排列出它們的順序,而不能反映出大于或小于的數(shù)量或距離。

3、定距變量

區(qū)別同一類別個案中等級次序及其距離的變量。它除了包括定序變量的特性外,還能確切測量同一類別各個案高低、大小次序之間的距離,因而具有加與減的數(shù)學特質(zhì)。

攝氏溫度這一定距變量說明,攝氏40度比30度高10度,攝氏30度比20度又高10度,它們之間高出的距離相等,而攝氏零度并不是沒有溫度。又比如調(diào)查數(shù)個地區(qū)的工人占全部勞動人口的比率時,發(fā)現(xiàn)甲、乙,丙、丁、戊五個地區(qū)的比率分別是2%、10%、35%、20%、10%。甲區(qū)與丙區(qū)相差33%,丙區(qū)與丁區(qū)相差15%。這也是一個定距變量。定距變量各類別之間的距離,只能用加減而不能用乘除或倍數(shù)的形式來說明它們之間的關(guān)系。

例如:

4、定比變量

是區(qū)別同一類別個案中等級次序及其距離的變量。這是一種既有測量單位,又有絕對零點的變量,由于有絕對零點,故可以構(gòu)成有意義的比率。定比變量為最高級別的變量。除在運算在具有上述三種變量的特征外,還可以進行乘除運算,派生出比率、速度、效率、效益等指標。

例如:

年齡和收入這兩個變量,固然是定距變量,同時又是定比變量,因為其零點是絕對的,可以作乘除的運算。如A月收入是60元,而B是30元,我們可以算出前者是后者的兩倍。智力商數(shù)這個變量是定距變量,但不是定比變量,因為其0分只具有相對的意義,不是絕對的或固定的,不能說某人的智商是0分就是沒有智力;同時,由于其零點是不固定的,即使A是140分而B是70分,我們也不能說前者的智力是后者的兩倍,只能說兩者相差70分。因為0值是不固定的,如果將其向上移高20分,則A的智商變?yōu)?20分而B變成50分,兩者的相差仍是70分,但A卻是B的2.4倍,而不是原先的兩倍了。攝氏溫度這一變量也如此。定比變量是最高測量層次的變量。變量定類變量:不能排序、不能加減、不能乘除定序變量:能排序、不能加減、不能乘除定距變量:能排序、能加減、不能乘除定比變量:能排序、能加減、能乘除第二節(jié)描述統(tǒng)計

一、統(tǒng)計表

統(tǒng)計表是用表格的形式將數(shù)據(jù)進行分類的計算,具有簡明清晰、條理清楚、便于比較等優(yōu)點,根據(jù)分類變量的個數(shù),統(tǒng)計表可以分為單項表和多項表。

1、單項表(重慶2中各年高考錄取人數(shù))年份19931994199519961997合計高考錄取人數(shù)101109110150190560

2、多項表(雙項表)

初三(1)班男女生數(shù)學成績分布統(tǒng)計表

性別成績合計優(yōu)良中差男9137433女489223合計1321166561996年—2004年我國普通公立高校學雜費總額、招生人數(shù)以及增長比例(多項表)年份招生人數(shù)(萬人)國家財政性教育經(jīng)費(億元)財政性教育經(jīng)費占教育經(jīng)費總額的比例%學雜費總額(億元)學雜費占教育經(jīng)費總額的比例(%)199696.58262.680.644.616.91997100.04305.778.357.914.81998108.36356.864.973.113.31999159.68443.262.5120.817.12000220.61531.258.2192.621.12001268.28632.854.2282.424.22002340.76752.150.5390.630.42003382.17840.547.9505.728.82004447.34969.745.5647.630.4

3、次數(shù)分布表

次數(shù)分布表編寫步驟:(1)求全距:最大數(shù)-最小數(shù)(2)定組數(shù):如果樣本個數(shù)在100以上,一般10-20組為宜,常取12-16組(3)定組距:組距=全距/組數(shù)(常用2、3、5、10、20等數(shù)值表示)(4)定組限:每組的起止范圍(5)歸類:把原始數(shù)據(jù),分別歸到相關(guān)組中組別組中值次數(shù)累計次數(shù)頻率%累計頻率%95-9997250410090-9492548109685-89871043208680-8482733146675-7977626125270-7472520104065-6967615123060-64624981855-59573561050-54522244合計50100三、樣本的數(shù)字特征

平均數(shù)(M)

2、中位數(shù)(Md)

將變量的取值從小到大排列,如果樣品數(shù)是奇數(shù),則位于正中的那個稱為中位數(shù);如果樣品數(shù)是偶數(shù),則位于正中的兩個取值的平均數(shù)為中位數(shù)。

3、眾數(shù)(M0)

是指樣本中出現(xiàn)次數(shù)最多的那個數(shù)值。

4、方差(σ2或S2)

5、標準差(σ或S)

某班甲乙兩組在一次測驗中的成績分別為65,68,71,72,74(均分為70分)和30,50,86,90,94(均分為70分)。如何評價兩組的學習情況?

例1:

請計算下列數(shù)據(jù)的平均數(shù)和標準差。

9,3,7,5,6,8,7,5,8,9,4,6,5,6,8,7,4,10

例2:

2.請計算下列數(shù)據(jù)的中位數(shù)和標準差

11,11,11,15,14,13,13,9,17,10,10,10,12,12,12,8,8,9。解:根據(jù)中位數(shù)的計算方法,先對數(shù)據(jù)進行從小到大排序:

8,8,9,9,10,10,10,11,11,11,12,12,12,13,13,14,15,17。

Md=(11+11)/2=11

根據(jù)標準差的計算公式,得

四、相關(guān)系數(shù)相關(guān)系數(shù)的取值范圍在-1~1之間,其絕對值越大,表明兩變量間的線性關(guān)聯(lián)越強。高數(shù)Xi化學YiX

Yx2y2xy李安7177+1-4116-4李連杰6888-2+7449-14趙明7882+8+16418何其兵6276-8-5642540郭宇6478-6-336918成小亮6675-4-6163624露思7184+1+3193瑪麗7380+3-191-3湯姆7783+7+249414杰克70870+60360平均數(shù)70810024418686

一、原始分數(shù)及其局限

根據(jù)測驗的記分標準,對照被試的作答(或反應(yīng))計算出的測驗分數(shù)稱為原始分數(shù)。

第四節(jié):分數(shù)的轉(zhuǎn)換與解釋優(yōu)點:直觀性強、操作簡便缺點:不可比性不可加性不能反映學生在團體中的位置

二、幾種常用的導出分數(shù)

1、百分等級分數(shù)

一個原始的百分等級分數(shù)是指一個團體的原始分數(shù)中,得分低于這個分數(shù)人數(shù)的百分比。計算公式為:

pr=100-100R-50N

例:小東期末考試在30名同學中排列第五,其語文成績?yōu)?5分,請計算小東語文成績的百分等級分數(shù)?

解:

pr=100-100R-50N=100-(100*5-50/30)

=91

2、標準分數(shù)

概念:標準分是將原始分數(shù)(測驗分數(shù))與平均分數(shù)相減,再除以總體標準差所得的商。

標準分特點

(1)原始分數(shù)轉(zhuǎn)化成標準分數(shù)是線性轉(zhuǎn)換,不改變原始分數(shù)的分布形態(tài),也不改變原始分數(shù)的排列順序(2)無論各科的平均分、標準差怎樣不同,Z分數(shù)的平均數(shù)為0,標準差為1

(3)標準分數(shù)以原始分數(shù)的平均分為參照點,以標準差為參照單位。(4)如果測驗分數(shù)是正態(tài)分布或近似正態(tài)分布,從標準分數(shù)中可以知道其在團體中的位置。

例:對某校高二學生進行期中學習質(zhì)量檢測,語文、數(shù)學和英語成績的平均數(shù)分別是80分、70分和85分,這三種成績的標準差分別是10分、15分和12分。某學生的三科成績分別是85分、82分和90分,問:該生這三科成績哪一科最好?

3、T分數(shù)

T=a+bZ

上式中,a和b為選定的兩個常數(shù),Z為標準分數(shù),T為線性變換的標準分數(shù)。常見的有如下幾種:①教育與心理測驗中的T分數(shù):T=10Z+50②韋氏智力量表中各分測驗的量表分:

T=10Z+100③我國部分省份的高考標準化考試的公布分數(shù):T=500+100Z

第五節(jié):測驗信度

一、信度的定義

測驗信度是指測驗結(jié)果的一致性或穩(wěn)定性程度,即測驗的可靠性。因而,信度實際上就是對測驗誤差大小的一種描述。一般來說,誤差越小,信度越大;誤差越大,信度越小。信度通常介于0—1之間,一般來說,信度在0.9以上,信度很高;在0.75-0.9時,信度較高;在0.65-0.75時,信度中等;在0.55-0.65時,處于臨界狀態(tài);而0.5以下則是低信度。

二、信度的計算

重測信度:是指同一組被試使用同一分試題,前后兩次測驗分數(shù)的相關(guān)系數(shù)。需注意以下幾點:(1)兩次測驗的時間間隔要適宜,通常時間間隔為1-3周為宜,間隔不要超過半年。(2)比較適合于速度測驗、問卷調(diào)查等分難度測驗。(3)在第二次測驗時,應(yīng)注意提高被的積極性,使他們?nèi)缤谝淮螠y驗?zāi)菢诱J真對待。

復本測驗:是用兩份等值但具體題目又不同的兩份試題,相繼對同一組被試進行兩次測驗所得分數(shù)的相關(guān)系數(shù)。需要注意以下幾點:

(1)A和B兩分試題的具體內(nèi)容不重復,否則會高估信度。(2)兩次測驗的時間間隔要短些,如(1-2天),但是如果兩次測驗連續(xù)進行,容易使被試產(chǎn)生一定的厭倦情緒。

分半信度:是把一個測驗中的題目按編號分成兩半,例如一半為奇數(shù)題一半為偶數(shù)題,分別計算出每個被試兩部分的得分。然后計算這兩個部分的相關(guān)系數(shù)r.計算公式為:

Rxx=2r/(1+r)

(一)測驗的長度

一般來說,測驗越長,信度值越高,這是因為:①測驗加長,可能改進項目取樣的代表性,從而能更好地反映受測者的真實水平;②測驗的項目越多,在每個項目上的隨機誤差就可以互相抵消。(二)測驗的難度

測驗的難度與信度沒有直接對應(yīng)關(guān)系,但是當測驗太難或太易時,則分數(shù)的范圍就會縮小,從而降低信度。顯然只有當測驗難度水平可以使測驗分數(shù)的分布范圍最大時,測驗的信度才會最高,通常這個難度水平為0.50。(三)測驗的評分和實施方法三、提高測驗信度的方法第六節(jié):測驗效度

測驗效度是指測驗實際能測出所要測的特質(zhì)或能力的程度,即測驗的有效性。

二、內(nèi)容效度

內(nèi)容效度是指一個測驗實際測到的內(nèi)容代表了所要測量內(nèi)容的程度,對于學科測驗而言,所要測量的內(nèi)容就是教學大綱或課程標準所規(guī)定的教學內(nèi)容和教學目標,包括廣度和深度兩方面,廣度解決測什么的問題,通常列出要測的知識內(nèi)容;深度解決測何種認知層次的問題,包括記憶、理解和應(yīng)用等。這可以通過編制測驗的雙向細目表(命題藍圖)來解決。三、效標關(guān)聯(lián)效度

效標關(guān)聯(lián)效度是指一個測驗與選定的效標的相關(guān)系數(shù)。所謂效標,可以是特定的行為標準,也可以是一個已知的效度較高的測驗成績。四、影響效度的因素

一、測驗本身的因素:

1、測驗取材必須對對整個內(nèi)容具有的代表性

2、測題設(shè)計時應(yīng)盡量避免容易引起誤差的題型(如是非題)

3、測題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論