版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
教育統(tǒng)計學(xué)推斷統(tǒng)計的基本概念與
參數(shù)假設(shè)檢驗學(xué)部本科科生課課程
北京師范大學(xué)教育學(xué)部胡詠梅統(tǒng)計學(xué)、描述統(tǒng)計、推斷統(tǒng)計假設(shè)檢驗的原理與步驟單樣本的t檢驗兩個獨立樣本的t檢驗配對樣本的t檢驗3o
統(tǒng)計學(xué)是一門收集、整理、顯示和推理分析數(shù)據(jù)的科學(xué),其目的是探
索數(shù)據(jù)內(nèi)在的數(shù)量規(guī)律性。o
簡言之,統(tǒng)計學(xué)是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。
描述統(tǒng)計
推斷統(tǒng)計1.統(tǒng)計學(xué)的概念
o
描述統(tǒng)計(descriptive
statistics):研究如何整理原始數(shù)據(jù)資料,描述數(shù)
據(jù)的全貌的方法
。o目的在于使得雜亂無章的數(shù)據(jù)更好地顯示出事物或現(xiàn)象的某些特征,
有助于說明事物或現(xiàn)象的本質(zhì)。描述統(tǒng)計的概念
o
集中趨勢(算數(shù)平均數(shù)、加權(quán)平均數(shù)、幾何平均數(shù)、中位數(shù)、眾數(shù)等)o
離散趨勢(方差、標(biāo)準(zhǔn)差、四分位差、極差、差異系數(shù)等)o
數(shù)據(jù)分布的表與圖(頻數(shù)分布表、分組頻數(shù)分布表、累計頻數(shù)分布表、
條形圖、餅圖、直方圖等)描述統(tǒng)計的方法o
推斷統(tǒng)計(inferential
statistics):研究如何利用樣本數(shù)據(jù)推斷總體特征
的統(tǒng)計學(xué)方法。o
嚴(yán)格地說,推斷統(tǒng)計是一種依據(jù)隨機樣本數(shù)據(jù),從局部推斷總體,即對
總體的某些特征進行推斷、估計和預(yù)測。推斷統(tǒng)計學(xué)主要包括參數(shù)估計
、假設(shè)檢驗和多元統(tǒng)計分析三部分。推斷統(tǒng)計的概念o
對于數(shù)字特征量的估計(參數(shù)估計:點估計、區(qū)間估計)o
對于單樣本或兩個樣本的總體特征參數(shù)取值特點的假設(shè)
(H0
:μ
=
μ0
;
H0
:
μ1
=
μ2)o
多個樣本所來自的總體均值是否相等(方差分析,ANOVA)o
變量間關(guān)聯(lián)性的預(yù)測(相關(guān)分析)o
將變量關(guān)系模型化(回歸分析)o
對未來觀察的預(yù)測(時間序列分析)o
數(shù)據(jù)挖掘(如聚類分析、探索性因子分析等)推斷統(tǒng)計的方法o
基本概念o
假設(shè)檢驗是根據(jù)樣本信息來判斷總體分布是否具有指定特征的統(tǒng)計推
斷方法。2.假設(shè)檢驗的原理與步驟o
基本概念o
根據(jù)檢驗假設(shè)時是否需要利用總體分布形態(tài)方面的信息,假
設(shè)檢驗可分為參數(shù)假設(shè)檢驗和非參數(shù)假設(shè)檢驗兩大類。o
參數(shù)假設(shè)檢驗是在總體分布形態(tài)已知時,對總體某個未知參
數(shù)值的假設(shè)所作的檢驗。2.假設(shè)檢驗的原理例如,已知某個樣本的均值為
μ0
,它來自一個正態(tài)總體(
X
~
N(μ,σ
2
)),其中μ未知,問是否有理由說它來自均值為
μ0
的正態(tài)總體?檢驗假設(shè):μ
=
μ0參數(shù)假設(shè)檢驗已知兩個相互獨立的樣本,它們分別來自兩個正態(tài)總體(X1
~N(μ1
,
σ
),X2
~N(μ2
,
σ
)),其中μ1
、σ1
,μ2
、σ2
均是未知數(shù),
能否說這兩個總體的均值相等或方差相等?檢驗假設(shè):μ1
=
μ2
或σ
=
σ22122212參數(shù)假設(shè)檢驗非參數(shù)假設(shè)檢驗是在總體分布形態(tài)未知(其實也不需要知道總體的分布形態(tài))的情況下,對總體分布函數(shù)的類型或它的某些特征提出某種假設(shè)
所進行的檢驗。檢驗?zāi)硺颖舅鶎倏傮w是否服從正態(tài)分布;檢驗兩個樣本所屬總體的分布
是否相同;檢驗兩個樣本來自的總體取值的平均狀況是否有顯著性差異
等等。非參數(shù)假設(shè)檢驗o
零假設(shè)是關(guān)于當(dāng)前樣本所屬的總體(在參數(shù)值或分布形式方面)與原設(shè)總體(在參數(shù)值或分布形式方面)無區(qū)別的假設(shè)。它往往是研究者
根據(jù)樣本信息期待拒絕的假設(shè)。一般用H0表示零假設(shè)。o
例如H0:樣本所屬總體服從正態(tài)分布。零假設(shè)和備擇假設(shè)o
備擇假設(shè)是指與零假設(shè)相互對立的假設(shè)。它是關(guān)于當(dāng)前樣本所屬總體(在參數(shù)值或分布形式方面)與原設(shè)總體(在參數(shù)值或分布形式方面)不同的假設(shè)。而且它是當(dāng)否定了零假設(shè)之后,應(yīng)當(dāng)接受的假設(shè)。一般用
H1表示備擇假設(shè)。o
例如,H1:樣本所屬總體不服從正態(tài)分布。備擇假設(shè)
o
先建立一個零假設(shè)H0
,然后在H0成立的條件下,看看會產(chǎn)生什么樣的后果。如果經(jīng)過一系列正確的邏輯推理和分析計算之后,導(dǎo)致了一個
不合理的現(xiàn)象出現(xiàn),就有理由認(rèn)為原先的零假設(shè)H0
是錯誤的,應(yīng)當(dāng)否
定H0;如果沒有出現(xiàn)不合理的現(xiàn)象,那我們就沒有充分的理由否定H0。
所以,就應(yīng)當(dāng)接受H0。假設(shè)檢驗的基本思路o
小概率事件在一次試驗中不可能發(fā)生。
o
如果在一次試驗中,小概率事件居然發(fā)生了,我們就認(rèn)為是不合理的現(xiàn)
象,就有充分的理由懷疑其零假設(shè)的前提是不正確的,因而應(yīng)當(dāng)拒絕零
假設(shè)。不合理的現(xiàn)象
o
在統(tǒng)計學(xué)中,一般是將概率小于或等于α的事件,稱為小概率事件。o
通常規(guī)定α=0.05或α=0.01。o
在假設(shè)檢驗中,零假設(shè)是否成立與α的大小是有關(guān)系的,稱α為顯著性
水平。小概率事件o
在假設(shè)檢驗中,
“小概率事件”是指樣本統(tǒng)計量的值在其抽樣分布上出現(xiàn)的概率小于或等于事先規(guī)定的顯著性水平α
,
這時,就認(rèn)為小概率
事件發(fā)生了。把出現(xiàn)小概率的隨機事件稱為小概率事件。小概率事件
例8-1:某高校對男、女生每日平均鍛煉時間進行統(tǒng)計,分別隨機抽取了20名男同學(xué)和女同學(xué),他們平均日鍛煉時間數(shù)據(jù)(單位:小時)如下表。(8.
1)(7.16)其中n=20
,即統(tǒng)計量服從自由度為2n-2的t分布。此時,若選定
α=0.05,則對于滿足概率
P{|t
|>
tα
/
2
(2n
一
2)}
=
α
的臨界值tα/2(2n-2)
,可查t分布表df=30和df=40時的臨界值,并估算出tα/2(38)≈2.025。我們可以計算出:
因為小概率事件“
|t|>2.025”發(fā)生了,所以,拒絕H0
:
μ1
=
μ2
,接
受其備擇假設(shè)
H1
:
μ1
≠
μ2
,即認(rèn)為該校男女生日平均鍛煉時間是有顯著
差異的。由式(8.
1)所確定的統(tǒng)計量t的值域{t:|t|>
tα
/
2
(2n
-
2)}我們稱之為
H0
:
μ1
=μ2
的拒絕域,它的余集{t:|t
|≤tα
/
2
(2n
-
2)}
被稱為H0
的接受域。即當(dāng)樣本統(tǒng)計量t的值落入拒絕域時,我們要拒絕零假設(shè)H0
;當(dāng)樣本統(tǒng)計
量t的值落入接受域時,我們要接受H0
,即認(rèn)為
H0
:
μ1
=
μ2是相容的。拒絕域和接受域
1.建立零假設(shè),如前例
H0
:
μ1
=
μ2
。2.在假定零假設(shè)成立的前提下,選擇合適的檢驗方法及檢驗統(tǒng)計量。3.計算給定樣本的統(tǒng)計量值。4.選定顯著性水平α
,
查統(tǒng)計量所服從的分布表來確定臨界值,從而確定H0
的拒絕域和接受域。5.對H
0
作出判斷。將臨界值與樣本統(tǒng)計量值相比較,若統(tǒng)計量值落在H0
的拒絕域中,則拒絕H0
;若統(tǒng)計量值落在H0
的接受域中,則接受H0。23假設(shè)檢驗的一般步驟o
Analyze——Compare
Means(均值比較)——T
test(T檢驗)
按不同的比較方式,T
test分為3個子過程:o
One-Sample
T
Test(單樣本的T檢驗)o
Independent-Samples
T
Test(獨立樣本的T檢驗)o
Paired-Samples
T
Test(配對樣本的T檢驗)。參數(shù)假設(shè)檢驗的SPSS模塊單樣本的T檢驗是檢驗來自正態(tài)總體的一個樣本的總體均值與一個給定常數(shù)之間的差異是否顯著,即檢驗假設(shè)
H0
:
μ
=μ0
是否成立,這里μ
、μ0
分別為總體均值和給定的常數(shù)。
3.單樣本的t檢驗設(shè)
x1
、x2
…,xn
是來自正態(tài)總體N(μ,σ2
)
的樣本,其中
μ
和σ
均未知。如果假設(shè)H0
:
μ
=
μ0
成立,則由(7.8)知,統(tǒng)計量
(8.2)服從自由度為n-1的t分布,其中
X
、S
2
分別為樣本均值和樣本方差,n
為樣本容量。若
|t
|>tα
/
2
(n—1),則拒絕
H0
;若
|t
|≤tα
/
2
(n—1)
,則接受
H0
。3.單樣本的
t檢驗例8-20?8-1.sav?Analyze→Compare
Means→
One-Sample
T
Testo
兩個獨立樣本的T檢驗是用以檢驗服從正態(tài)分布的且相互獨立的兩個樣本的總體均值之間的差異是否顯著的假設(shè)檢驗問題。設(shè)有兩個服從正態(tài)分布的相互獨立的總體X和Y,X
~
N
(
μ1,
σ
12
)
,Y
~
N
(
μ2
,
σ
)。分別從這兩個總體中抽取兩個
隨機樣本:x
1
、x
2
…,x
n
1
,y
1
、y
2
…,y
n
2
。通過這兩個樣本的數(shù)據(jù)信息來推斷出兩個總體均值差異是否顯著的結(jié)論,即需要檢驗假
設(shè)
H
0
:
μ
1
=
μ
2
。224.兩個獨立樣本的t檢驗在未知兩個總體的方差信息時,必須先通過F檢驗來考察一下兩總體方差之間的差異是否顯著,即要先對兩總體方差進行齊性檢驗,檢驗假設(shè)
H0
:
σ
=
σ
。22124.兩個獨立樣本的t檢驗
如果假設(shè)
H0
:
σ
=
σ
成立,則統(tǒng)計量S
2
2212方差齊性檢驗(1)如果其相伴概率p≤
α
,
則拒絕H0
:
σ
=
σ
,即認(rèn)為兩個正態(tài)總體的方差差異顯著。此時,對于H0
:
μ1
=μ2,我們需要進行方差非齊性下的T檢驗,構(gòu)造如下
的t檢驗統(tǒng)計量:
令
,
則上式中的自由度
O
=
如果t統(tǒng)計量的相伴概率p≤α
,
則拒絕H0
:
μ1
=
μ2
;否則,接受H0
.2212方差非齊性下的兩個獨立樣本的T檢驗
(2)如果統(tǒng)計量F的相伴概率p>α
,
則接受H0
:
σ
=
σ
,即認(rèn)為兩個總體的方差相等。此時,對于H0
:
μ1
=
μ2,我們進行方差齊性下的T檢驗,
構(gòu)造如下的t檢驗統(tǒng)計量:
如果t統(tǒng)計量的相伴概率p≤α
,
則拒絕H0
:
μ1
=
μ2
;否則,接受
H0
。2212方差齊性下的兩個獨立樣本的T檢驗例8-3某小學(xué)對五年級學(xué)生開展語文教學(xué)改革試驗,選取甲、乙兩個平行班作試點,每班各25人。甲班用傳統(tǒng)的教師講授的教學(xué)方法,
乙班采取學(xué)生
自學(xué)和師生相互討論的新的教學(xué)方法。一學(xué)年后,用同一份試題對兩個班
的學(xué)生進行語文測驗,得到的成績?nèi)缦卤硭?。?這兩種教學(xué)方法的效果
是否有顯著性差異(α=0.01)?
數(shù)據(jù)文件8-2.sav
學(xué)生語文成績記為變量score
,分組變量名為tmehod
,其值為“
1”,表
示為傳統(tǒng)教學(xué)法,其值為“2”
,表示為新教學(xué)法(變量值標(biāo)簽為:1=“傳統(tǒng)教學(xué)法”
,2=“新教學(xué)法”)。
Analyze→Compare
Means→Independent
Samples
T
Test
…方差齊性下的兩個獨立樣本的T檢驗
方差齊性檢驗(Levene檢驗):F統(tǒng)計量的值為0.641
,其相伴概率為p=0.427>0.05
。因此,采用兩種不同教學(xué)方法下學(xué)生的語文成績變量
的方差是齊性的。在T檢驗結(jié)果中應(yīng)該選擇Equal
variances
assumed(假設(shè)方差相等)一行的數(shù)據(jù)作為此例的T檢驗結(jié)果數(shù)據(jù)(如若
Levene檢驗結(jié)果表明方差非齊性,在T檢驗結(jié)果中應(yīng)該選擇Equal
variances
not
assumed一行的數(shù)據(jù)作為T檢驗結(jié)果數(shù)據(jù))。
t統(tǒng)計量的值為
-2.804
,相伴概率為p=0.007<0.01
,因而拒絕零假設(shè),即得出采用兩種教學(xué)方法下學(xué)生語文成績存在顯著性差異的結(jié)論。結(jié)論?第二個表格還給出Mean
Difference
兩組均值之差,值為-8.480
,即采用新教學(xué)法下學(xué)生的語文成績比采用傳統(tǒng)教學(xué)法的學(xué)生的語文成績高8.480
分。?Std.Error
difference差值的標(biāo)準(zhǔn)誤為3.02465
。兩種教學(xué)方法下學(xué)生語文成
績得分均值之差的95%的Confidence
Interval
of
the
Difference置信區(qū)間[-
16.59274
,-0.36726]也列在該表中。結(jié)論o
進行配對樣本的T檢驗要求被比較的兩個樣本具有顯著的相關(guān)關(guān)系,而
且它們的樣品能搭配成對。o
一類配對樣本是對同一組被試對象在實驗前后兩次測試所獲得的數(shù)據(jù);o
另一種配對樣本是按某些條件基本相同的原則,經(jīng)過一一配對而成的兩
組被試對象,實施不同的實驗處理之后,所得到的兩組測試結(jié)果數(shù)據(jù)。5.配對樣本的t檢驗
配對樣本的T檢驗實際上就是比較不同處理的效果差異是否顯著,即檢驗服從正態(tài)分布的配對樣本的總體均值是否相等,即
H0
:
μ1
=μ2其檢驗統(tǒng)計量為
其中n為樣品對數(shù)。X
1、X2
分別為兩個樣本的均值,S1
、S2
分別為兩個
樣本的標(biāo)準(zhǔn)差,r
為兩個樣本的相關(guān)系數(shù)。如果該統(tǒng)計量的相伴概率p≤α
,
則拒絕
H0
:
μ1
=μ2
;如果p>α
,
則接受
H0
:
μ1
=
μ25.配對樣本的t檢驗(Paired-SamplesT
Test
)o
例8-4
為了檢驗?zāi)撤N識記方法的效能,對某班15名學(xué)生進行了一周的識記訓(xùn)練,他們在接受識記訓(xùn)練前后的識記成績?nèi)缦拢瑔栠@種識記訓(xùn)練
是否真的有效?
(α=0.05)5.配對樣本的t檢驗(Paired-SamplesT
Test
)?數(shù)據(jù)文件:8-3.sav?學(xué)生在參加識記訓(xùn)練之前的測驗成績記為變量prescore
,訓(xùn)練后的測驗
成績記為變量postscore。?待檢驗的假設(shè)為H0
:
μ1
=μ2?Analyze→Compare
Means→Paired→
Samples
T
Test
…46o
單擊Options按鈕?第一個表格給出了學(xué)生在進行識記訓(xùn)練前后的測驗成績變量prescore和postscore的描述性統(tǒng)計量:樣本容量N
,樣本均值Mean
,樣本標(biāo)準(zhǔn)差Std.Deviation以及樣本均值的標(biāo)準(zhǔn)誤Std.ErrorMean
。從兩個樣本的均值和標(biāo)準(zhǔn)差數(shù)據(jù)來看,它們的方差差異不大,而它們的均值有一定差異。這說明采用這種識記
訓(xùn)練后,學(xué)生的成績有一定提高。?第二個表格給出的是識記訓(xùn)練前后的測驗成績之間的相關(guān)系數(shù):Correlation=0
.
836
,相伴概率
p=0.000<0.05
,因此可以得出識記訓(xùn)練前后的測驗成績之間存在顯著的線性關(guān)系的結(jié)論。?第三個表格給出的是配對變量差值的T檢驗結(jié)果。均值之差為-6.000
,差值的標(biāo)準(zhǔn)差為8.39217
,差
值的均值標(biāo)準(zhǔn)誤為2
.
16685
。差值的95%置信區(qū)間下、上限為-10
.64743和-1
.35257
。t統(tǒng)計量的值為-
2.769
,其相伴概率為p=0.015<0.05
。因此,我們應(yīng)當(dāng)拒絕零假設(shè),即得出識記訓(xùn)練前后學(xué)生的測驗成績存在顯著性差異的結(jié)論。結(jié)論1.試述假設(shè)檢驗的基本思路與一般步驟。2.某高校學(xué)生會欲通過調(diào)查學(xué)生平均每天上網(wǎng)時長了解該校男女學(xué)生的業(yè)
余生活情況,分別隨機抽取了15名男女學(xué)生,他們平均每天瀏覽網(wǎng)頁的時間
數(shù)據(jù)(單位:分鐘)如下:試用數(shù)據(jù)文件“exe8-1.sav”計算能否據(jù)此數(shù)據(jù)就得出男學(xué)生與女學(xué)生
平均每天瀏覽網(wǎng)頁的時間不相等的結(jié)論。作業(yè)3.
已知某年級學(xué)生的語文成績X服從正態(tài)分布,即X~N
(μ0,σ2
),其中μ0=80,σ2
未知?,F(xiàn)從該年級某班隨機抽取20名學(xué)生的語文成績,數(shù)據(jù)如下:
75,88,73,93,85,76,68,90,61,58,78,89,95,77,60,74,91,95,88,87試用數(shù)據(jù)文件“exe8-2.sav”檢驗該班學(xué)生的平均語文成績是否達(dá)到80分
(α=0.05)。作業(yè)4.為了考察某種閱讀訓(xùn)練的效能,從某班學(xué)生中隨機抽取30名學(xué)生對他們
進行閱讀測驗,然后讓他們接受這種閱讀訓(xùn)練。經(jīng)過一段時間的訓(xùn)練后,
又對這30名學(xué)生進行了類似的閱讀測驗,兩次測驗成績?nèi)缦?試用數(shù)據(jù)文件“exe8-3.sav”檢驗閱讀訓(xùn)練前后的測驗成績是否有顯著性
差異(α=0.05)。作業(yè)相關(guān)分析及其應(yīng)用學(xué)部本科生課程北京師范大學(xué)教育學(xué)部胡詠梅教育統(tǒng)計學(xué)相關(guān)概念常用的相關(guān)分析方法相關(guān)分析的SPSS過程相關(guān)分析在教育與心理研究中的應(yīng)用contentso
確定性關(guān)系:
是通常的函數(shù)關(guān)系
,如圓的面積與半徑之間的關(guān)系:
S=πr2o
非確定性關(guān)系:即相關(guān)關(guān)系。例如,人的身高與體重之間的關(guān)系。一、相關(guān)概念o
相關(guān)關(guān)系o
變量之間的數(shù)量關(guān)系不十分嚴(yán)格,但卻存在某種依存關(guān)系
。(如智商與
學(xué)生學(xué)業(yè)成績的關(guān)系)o
不等于因果關(guān)系(如數(shù)學(xué)成績與物理成績之間的相關(guān)關(guān)系)一、相關(guān)概念o
相關(guān)分析是研究變量間相互關(guān)系緊密程度的統(tǒng)計分析方法。即它是研
究兩個或兩個以上變量之間是否存在相關(guān)關(guān)系,如果存在相關(guān)關(guān)系,
其相關(guān)的性質(zhì)(線性相關(guān)或曲線相關(guān);正相關(guān)或負(fù)相關(guān))和程度如何。o
用圖示法和計算法來刻畫變量之間的相關(guān)關(guān)系。相關(guān)分析
o
相關(guān)關(guān)系的圖示,是用散點在平面直角坐標(biāo)系中的分布情況,來描述兩個變量聯(lián)系的緊密程度,這種圖稱為相關(guān)散點圖,又簡稱為散點圖。圖示法散點圖o
數(shù)據(jù)文件9-1.savo
Graphs-Legacy
Dialogs-Scatter/dot
,選擇Simple
Scatter
,并單擊Defineo
例9-1
已知某校初二一班20名同學(xué)某次月考的數(shù)學(xué)成績和物理成績,請繪制出描述數(shù)學(xué)成績和物理成績關(guān)系的散點圖。在SPSS中繪制散點圖o
在數(shù)量上表現(xiàn)變量間相關(guān)關(guān)系的量稱為相關(guān)量。o
相關(guān)系數(shù)是描述變量間線性關(guān)系程度和方向的相關(guān)量,通常用r來表示。o
[-1
,1
]o
r>0正相關(guān)
r<0負(fù)相關(guān)
r=0
零相關(guān)計算法二、常用的相關(guān)分析方法
o
積差相關(guān)法o
等級相關(guān)法o
點二列相關(guān)法o
二列相關(guān)法
積差相關(guān)系數(shù)(Pearson相關(guān)系數(shù))
o
積差相關(guān)系數(shù)適用于兩個變量都是服從正態(tài)分布或兩個變量服從的分
布是接近正態(tài)的對稱分布的情形。o
對于scale測度水平(interval
variable/ratio
variable)的變量使用。積差相關(guān)系數(shù)例9-2對30名小學(xué)男教師進行問卷調(diào)查,其工作滿意度與職業(yè)認(rèn)同感得分
如下,試計算小學(xué)男教師職業(yè)認(rèn)同感與工作滿意度的相關(guān)系數(shù)。o
等級相關(guān)法是適用于研究具有等級順序的測量數(shù)據(jù)(ordinal
variable)
間相互關(guān)系的方法。o
Spearman斯皮爾曼等級相關(guān)系數(shù)\Kendall肯德爾和諧系數(shù)等級相關(guān)法
斯皮爾曼等級相關(guān)系數(shù)(9.2)則可采用如下的簡化公式計算
式中:Di
=
R
xi
—
Ry
i(對偶等級之差),n為對偶數(shù)據(jù)個數(shù)。式中R
xi
、Ry
i
分別是xi
、
yi
的秩,
。如果兩個變量的樣本數(shù)據(jù)均無相同秩,或只存在較少的相同秩的情況,斯皮爾曼等級相關(guān)系數(shù)(9.3)例9-3某大學(xué)一年級10名本科新生高考總分與其家庭社會經(jīng)濟地位等級如下。試問學(xué)生的高考總分與其家庭社會經(jīng)濟地位之間的關(guān)聯(lián)度如何?學(xué)生的高考總分與其家庭社會經(jīng)濟地位之間的斯皮爾曼等級相關(guān)系數(shù)為
0.205
。這一結(jié)果反映學(xué)生的高考總分與其家庭社會經(jīng)濟地位具有一定的
正相關(guān)性,即一般來說,家庭社會經(jīng)濟地位越高,學(xué)生高考成績也越高。0.205解:將n=10及上表中的數(shù)據(jù)代入公式,得:o
肯德爾和諧系數(shù)是計算多列等級變量相關(guān)程度的一種相關(guān)量。o
斯皮爾曼等級相關(guān)是計算兩個等級變量的相關(guān)程度的相關(guān)量。用于評
價時只適用于兩個評分者評價n個人或n件作品,或是同一個人先后兩
次評價n個人或n件作品??系聽柡椭C系數(shù)
--斯皮爾曼等級相關(guān)系數(shù)o
肯德爾和諧系數(shù)則適用于多列相關(guān)的等級數(shù)據(jù)。o
可以是k個(k>2)評分者評n個人或n件作品,也可以是同一個人先后k次
評n個人或n件作品。通過求得的肯德爾和諧系數(shù),我們可以較為客觀地
判斷評價結(jié)果的一致性程度??系聽柡椭C系數(shù)用W表示肯德爾和諧系數(shù),我們分兩種情形給出W的計算公式。①
同一評分者無相同等級評定時的W公式
(9.4)式中n是被評的對象數(shù)目,k是評分者的人數(shù)或等級變量的列數(shù),S是每一
個被評對象所評等級之和Ri
與所有這些和的平均數(shù)R
的離差平方和.肯德爾和諧系數(shù)
W的變化范圍是
0
≤
W
≤
1
??系聽柡椭C系數(shù)(9.5)即教師作文1作文2作文3
作文4
作文5
作文6教師1
教師2
教師3
教師4
教師5111212321232335445445645365666Ri61016
21
23
29同一評分者無相同等級評定的情況
教師作文1作文2作文3
作文4
作文5
作文6教師1教師2教師3教師4教師5111112222233333444445555566666Ri51015
2025
30
K個評分者的評價完全一致的情況(W=1)例9-4某高校碩士畢業(yè)論文答辯,需要4位答辯評委對5名同學(xué)的論文評定
等級,結(jié)果如下,試求其評分者的信度。
同一評分者無相同等級評定的情況解:由教育測量學(xué)中信度理論知,求評分者的信度
即是求k個評分者對n篇作文評價的一致性程度,因而
我們可以求其肯德爾和諧系數(shù)。將上表中的數(shù)據(jù)代入
公式,可得:即評分者的信度系數(shù)為0.813
,表明他們的評定結(jié)果
有較大的一致性。
其中k
、n和S的意義與(9.4)式相同.當(dāng)同一評分者對n個對象的評定出現(xiàn)相同等級時,肯德爾和諧系數(shù)的計算公式為同一評分者有相同等級評定的情況(9.6)
mi
為第i個評價者的評定結(jié)果中有重復(fù)等級的個數(shù),nij為第i個
評價者的評定結(jié)果中第j個重復(fù)等級的相同等級數(shù)。同一評分者有相同等級評定的情況例9-54名專家對5位教師課題成果評定等級的結(jié)果見下表,試計算4名專
家對課題成果評價標(biāo)準(zhǔn)掌握的一致性程度。所以,4名專家評定結(jié)果的肯德爾和諧系數(shù)為0
.676
,
說明專家的評價結(jié)果有較大的一致性。同一評分者有相同等級評定的情況
o
如果一個點數(shù)列中的點與一個“二分”數(shù)列的點存在一一對應(yīng)的關(guān)系,
則稱這兩個數(shù)列為點二列或點雙列。o
點二列相關(guān)法就是考察連續(xù)變量(其觀測值為點數(shù)列)與“二分”稱
名變量之間的相關(guān)程度的統(tǒng)計方法。點二列相關(guān)法點二列相關(guān)是求“二分”稱名變量與連續(xù)變量之間的相關(guān)系數(shù)rpq
,其
公式為:rpq
=
(9.8)p表示“二分”稱名變量中取某一值的比率;
q表示“二分”稱名變量中取另一值的比率;Y
p
表示與p部分相對應(yīng)的連續(xù)變量的觀測數(shù)據(jù)的平均值;
SY
表示連續(xù)變量全部觀測值的標(biāo)準(zhǔn)差,即
點二列相關(guān)法o
點二列相關(guān)系數(shù)在教育測量研究中常作為是非題的區(qū)分度指標(biāo)。o
試題的區(qū)分度是指試題對于被試反應(yīng)的區(qū)分程度和鑒別能力。通常用
某試題的得分與測驗總分之間的相關(guān)系數(shù)來表示。o
是非題的區(qū)分度是求一個二分變量(是非題得分)與一個連續(xù)變量(
測驗總分)的相關(guān)系數(shù)。
是非題的區(qū)分度o
例9-6
某校教育學(xué)院100名學(xué)生參加大學(xué)英語六級測試,其中一道是非題答對的有60人,答錯的有40人,該題答對的那些學(xué)生的六級考試得分
的平均值為500
,該題答錯的那些學(xué)生的六級考試得分的平均值475
。
100名學(xué)生六級考試得分的標(biāo)準(zhǔn)差為15
,試求該題的區(qū)分度。是非題的區(qū)分度解:由題意,答對該題的人數(shù)比率p=60/100=0
.6,
答錯該題的人數(shù)比率
q=40/100=0.4
。Y
p
=500,Y
q
=475,
SY
=
15,將這些數(shù)據(jù)代入公式,可得:該是非題的區(qū)分度為0.816。是非題的區(qū)分度o
區(qū)分度Do
D
≥
0.4
非常好o
0.30
≤
D
≤
0.39
良好o
0.20
≤
D
≤
0.29尚可,須修改試題o
D
≤
0.
19差,
需被淘汰區(qū)分度的評價例9-7
某小學(xué)四年級男女學(xué)生20人的數(shù)學(xué)成績?nèi)缦卤?,問?shù)學(xué)成績與性別
是否有關(guān)?點二列相關(guān)法解:上表中“
1
”代表男生,
“0”代表女生。男生的比率p=
10/20=0.5
,女
生的比率q=
10/20=0.5。F,=80,F,=79,
S,=10.5.所以,20名學(xué)生性別與數(shù)學(xué)成績的相關(guān)系數(shù)為0.048
,由于此值接近于0,
因此,20名學(xué)生的數(shù)學(xué)成績優(yōu)劣與性別無關(guān)。點二列相關(guān)法o
二列相關(guān)用于考察兩個正態(tài)變量的相互關(guān)系,但是一列是一個連續(xù)變量的觀測值(等距或等比數(shù)據(jù))
,另一列則是一個連續(xù)變量人為地按
一定標(biāo)準(zhǔn)劃分為兩個類別的數(shù)據(jù),即人為地被劃分成一個二分變量。二列相關(guān)法
X
p
表示與p部分相對應(yīng)的連續(xù)變量X的觀測數(shù)據(jù)的平均值;X
q
表示與q部分相對應(yīng)的
連續(xù)變量X的觀測數(shù)據(jù)的平均值;SX
表示連續(xù)變量X全部觀測值的標(biāo)準(zhǔn)差;Y表示標(biāo)
準(zhǔn)正態(tài)曲線下p與q交界點處的縱線高度,求法是:依據(jù)|0.5-p|的值,查標(biāo)準(zhǔn)正態(tài)分布表
,
P欄中該數(shù)值所對應(yīng)的Y值就是所求的縱線高度。二列相關(guān)系數(shù)
rb
的計算公式是:
式中:p表示二分變量中取某一值的比率;q表示二分變量中取另一值的比率;(9.9)
二列相關(guān)系數(shù)在教育測量研究中常作為問答題的區(qū)分度指標(biāo)。問答題的區(qū)分度例9-8
下表為10名學(xué)生閱讀測試總分和其中一道問答題的得分,試求該問
答題的區(qū)分度(該問答題滿分為10分,得6分或6分以上則認(rèn)為該題通過)。問答題的區(qū)分度解:問答題被人為地劃分為通過、不通過兩類,
因此,求該問答題的區(qū)分度需求二列相關(guān)系數(shù)rb。p
=5/10=0.5,q=5/10=0.5,Xp=80.6,X
q=64,SX=9.571,查標(biāo)準(zhǔn)正態(tài)分布表可
知,
當(dāng)p=0.5,|p-0.5|=0時,Y=0.399。將這些數(shù)據(jù)代入式(9.9),可得
所以,該問答題的區(qū)分度為1.087,非常高。問答題的區(qū)分度o
測度一個稱名變量與一個等距變量的相關(guān)程度。o
例如測量性別與數(shù)學(xué)成績的相關(guān)程度。
Eta系數(shù)
o
例9-9某小六年級男女學(xué)生20人的英語成績?nèi)缦卤?,問英語成績與性別是否有關(guān)?
(
“
1”代表男生,
“0”代表女生)o
由題意可知,稱名變量
X有兩個取值即0和
1
。當(dāng)
X=0
時,Y的取值包含十個數(shù)值,即
79
,77
,63
,92
,58
,88
,82
,78
,91
,80
,這十個取值的均值為78.8;當(dāng)
X=
1
時,Y的取值同樣包含十個數(shù)值,即
85
,78,
62
,89
,60
,91
,83
,87
,88
,82
,這十個取值的均值為80.5
。Y的總
平均
Y
為79.65
。通過代入公式,我們可以計算出
Y(學(xué)生英語成績)與
X(性別)的關(guān)聯(lián)程度為0.081
,兩者關(guān)聯(lián)度很低,說明學(xué)生英語成績
與性別無關(guān)。o
偏相關(guān)(partial
correlation)分析是研究在消除第三變量(或其它多個變量)影響之后的兩個變量之間相關(guān)程度的方法。偏相關(guān)分析
ll
偏相關(guān)系數(shù)(partialcorrelations)
o
偏相關(guān)系數(shù):它描述的是當(dāng)控制了一個或幾個附加變量的影響時兩個變
量的相關(guān)性。例如可以控制工齡的影響,來研究工資收入與受教育程度
之間的相關(guān)關(guān)系。簡單相關(guān)系數(shù)偏相關(guān)系數(shù)工資工齡教育2,3
=
(9.
11)式中,r12,3表示在剔除了變量X3
的影響之后,變量X1
與變量X2之間的偏
相關(guān)系數(shù);r12表示X1
與X2之間的簡單相關(guān)系數(shù);r13表示X1
與X3之間的簡
單相關(guān)系數(shù);r23表示X2
與X3之間的簡單相關(guān)系數(shù)。偏相關(guān)系數(shù)與公式(9.
11)類似,變量
X1
、X在2剔除變量
X、3
影響之后的偏相關(guān)系
數(shù)r12
,3用4
以下公式計算:2,34
=
(9.
12)偏相關(guān)系數(shù)例9-10某高校某班教育學(xué)專業(yè)本科生共30人,教育學(xué)原理(X1)、教育研究方法(X2)、教學(xué)論(X3)的考試成績?nèi)缦卤?。試通過該班情況分
析這三門課之間的相關(guān)關(guān)系。偏相關(guān)系數(shù)示例
偏相關(guān)系數(shù)示例
解:由表9-9中的數(shù)據(jù),我們可以利用具有統(tǒng)計運算功能(LR)的計算器得出:r12=0.075,r13=0.
144,r23=0.
128
。將這些數(shù)據(jù)代入式(9.
11),可得
r12,3==0.058類似可計算出:r13,2=
0.144?0.075×0.128
=0.
136r23,
1=
0.128?0.075×0.144
=0.
1191?0.0752
1?0.12821?0.0752
1?0.1442零假設(shè):總體中兩個變量間的相關(guān)系數(shù)為0。SPSS的相關(guān)分析過程給出該假設(shè)成立時統(tǒng)計量的相伴概率p
。常用公式
如下:
相關(guān)系數(shù)的顯著性檢驗(9.
13)(9.
14)式(9.
13)是皮爾遜和斯皮爾曼相關(guān)系數(shù)假設(shè)檢驗t值計算公式。其
中,r是樣本相關(guān)系數(shù);n是樣本量;n-2是自由度。當(dāng)t>t0.05(n-2)時,p<0.05,則拒絕零假設(shè),否則接受零假設(shè),即總體中兩變
量的相關(guān)系數(shù)為0。相關(guān)系數(shù)的顯著性檢驗式(9.
14)是偏相關(guān)系數(shù)假設(shè)檢驗t值計算公式。其中,r是相應(yīng)的偏相關(guān)
系數(shù);n是樣本量;k是控制變量的數(shù)目;n-k-2是自由度。當(dāng)t>t0.05(n-k-2)時,p<0.05,則拒絕零假設(shè),否則接受零假設(shè),即總體中兩
變量的偏相關(guān)系數(shù)為0。相關(guān)系數(shù)的顯著性檢驗o
Analyze的下拉菜單中的Correlate
命令項具有三個相關(guān)分析功能子命令Bivariate
…
,Partial
…
,Distances
…
,
它們分別對應(yīng)著二元變量間的相關(guān)分
析、偏相關(guān)分析以及距離測度分析的三個SPSS
過程。相關(guān)分析的SPSS過程Analyze——correlate——bivariate(二元變量)口打開對話框;口選擇兩個變量或更多的變量;口Correlationcoefficient欄中3個復(fù)選項n
Pearson:連續(xù)變量n
Kendall’s
tau-b:兩個等級變量n
Spearman
:兩個等級變量
(系統(tǒng)將會自動對變量值求秩)口Testof
significancen
Two-tailedn
One-tailed口
Flagssignificantcorrelations:加星號
二元變量的相關(guān)過程
o
用SPSS計算小學(xué)男教師職業(yè)認(rèn)同感與工作滿意度的相關(guān)系數(shù)。o
數(shù)據(jù)文件9-2.savo
Analyze-Correlate-Bivariate
…積差相關(guān)示例
結(jié)果表明,小學(xué)男教師的工作滿意度和職業(yè)認(rèn)同感的Pearson相關(guān)系數(shù)為0.781
,不相關(guān)的假設(shè)成立時的統(tǒng)計量相伴概率近似于0
,
“**”表示在
0.01的水平上,它們的相關(guān)系數(shù)有顯著意義。o
利用SPSS計算大學(xué)一年級本科新生高考總分與其家庭社會經(jīng)濟地位等
級之間的關(guān)聯(lián)度。o
數(shù)據(jù)文件9-3.sav。o
Analyze-Correlate-Bivariate
…
斯皮爾曼等級相關(guān)示例結(jié)果表明,大學(xué)一年級本科新生高考總分與其家庭社會經(jīng)濟地位等級之
間的相關(guān)系數(shù)為0.606
,但不相關(guān)的假設(shè)成立時的統(tǒng)計量相伴概率為0.063。
因此,該相關(guān)系數(shù)在0.
1水平上顯著,在0.05水平上并不顯著。Kendall和諧系數(shù)示例
o雖然Correlation
Coefficients
選擇欄中有
Kendall
’
t
tau-b選項,但此選項并不是Kendall
和諧系數(shù),它與
Spearman
相關(guān)類似,也是用來測量兩個定序變量間的相關(guān)
程度。o
SPSS20.0版本中無法給出肯德爾系數(shù)的具體數(shù)值,因此若要獲得
4位答辯評委對5名同學(xué)的論文評定等級的評分者的信度,我們可以依次在
SPSS
16.0
中進行如下
操作。o
數(shù)據(jù)文件o
Analyzecs-KRemlKendall和諧系數(shù)示例o
結(jié)果表明
Kendall’s
W值為
0.812
,相伴概率為
0.011
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)村集體土地租賃合同種農(nóng)作物
- 2025年人教B版選修2地理上冊階段測試試卷含答案
- 2025年滬科新版五年級語文上冊階段測試試卷含答案
- 2025年華師大版選修4化學(xué)上冊階段測試試卷含答案
- 2025年滬科新版八年級生物下冊階段測試試卷含答案
- 2025至2031年中國PE393行業(yè)投資前景及策略咨詢研究報告
- 2025至2030年中國高效精煉滲透漂白劑數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國蔡甸藕湯數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國滴水觀音盆景數(shù)據(jù)監(jiān)測研究報告
- 2025年人教B版七年級化學(xué)下冊階段測試試卷含答案
- ICU常見藥物課件
- CNAS實驗室評審不符合項整改報告
- 農(nóng)民工考勤表(模板)
- 承臺混凝土施工技術(shù)交底
- 臥床患者更換床單-軸線翻身
- 計量基礎(chǔ)知識培訓(xùn)教材201309
- 中考英語 短文填詞、選詞填空練習(xí)
- 一汽集團及各合資公司組織架構(gòu)
- 阿特拉斯基本擰緊技術(shù)ppt課件
- 初一至初三數(shù)學(xué)全部知識點
- 新課程理念下的班主任工作藝術(shù)
評論
0/150
提交評論