教育測量 第五講 幾種常用的檢驗(yàn)方法_第1頁
教育測量 第五講 幾種常用的檢驗(yàn)方法_第2頁
教育測量 第五講 幾種常用的檢驗(yàn)方法_第3頁
教育測量 第五講 幾種常用的檢驗(yàn)方法_第4頁
教育測量 第五講 幾種常用的檢驗(yàn)方法_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

教育測量第五講幾種常用的檢驗(yàn)方法第1頁,課件共39頁,創(chuàng)作于2023年2月第四節(jié)幾種常用統(tǒng)計(jì)檢驗(yàn)方法一、關(guān)于統(tǒng)計(jì)值之間差異的研究這些差異一般分為兩種情況討論:樣本統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)的差異兩個(gè)樣本統(tǒng)計(jì)量之間的差異。我們所關(guān)心的是從樣本統(tǒng)計(jì)值得到的差異能否作出一般性的結(jié)論——也就是總體參數(shù)之間是否確實(shí)存在差異。第2頁,課件共39頁,創(chuàng)作于2023年2月假設(shè)檢驗(yàn)的基本問題二、關(guān)于假設(shè)檢驗(yàn)統(tǒng)計(jì)學(xué)中進(jìn)行由樣本差異推斷總體差異的推論過程,稱為是假設(shè)檢驗(yàn)。經(jīng)過檢驗(yàn),如果所得到的差異超過了統(tǒng)計(jì)學(xué)規(guī)定的某一誤差限度,則表明這個(gè)誤差已經(jīng)不屬于抽樣誤差,而是總體確實(shí)有差異,這種情況就叫差異顯著;反之,差異達(dá)不到規(guī)定限度,說明該差異主要來源于抽樣誤差,稱差異不顯著。第3頁,課件共39頁,創(chuàng)作于2023年2月假設(shè)檢驗(yàn)的基本問題具體來說,如果樣本統(tǒng)計(jì)量與相應(yīng)的總體已知參數(shù)差異顯著,則意味著該樣本已基本不屬于已知總體;若兩個(gè)樣本統(tǒng)計(jì)量的差異顯著,則意味著各自代表的兩個(gè)總體參數(shù)之間確實(shí)存在差異。第4頁,課件共39頁,創(chuàng)作于2023年2月假設(shè)檢驗(yàn)的基本問題三、統(tǒng)計(jì)檢驗(yàn)的意義統(tǒng)計(jì)檢驗(yàn)的一個(gè)重要內(nèi)容就是進(jìn)行差異的顯著性檢驗(yàn)(檢驗(yàn)差異到底是來自總體還是來自樣本)如果在某種標(biāo)準(zhǔn)下,檢驗(yàn)結(jié)果差異顯著,則差異來自總體;如果差異不顯著,差異來自于樣本,或者說,差異是由于抽樣的原因而引起的。第5頁,課件共39頁,創(chuàng)作于2023年2月假設(shè)檢驗(yàn)的基本問題四、統(tǒng)計(jì)檢驗(yàn)的思想和方法檢驗(yàn)的思想是用反證法。檢驗(yàn)時(shí),我們先假設(shè)兩個(gè)總體平均數(shù)沒有顯著性差異,即μ1=μ2,這種假設(shè)稱為原假設(shè)或零假設(shè)H0,然后通過檢驗(yàn),檢驗(yàn)其是否成立.如果差異大,就否定假設(shè)H0,如果差異小,就接受假設(shè)H0.統(tǒng)計(jì)檢驗(yàn)有無差異必須以一定的標(biāo)準(zhǔn)去衡量.第6頁,課件共39頁,創(chuàng)作于2023年2月假設(shè)檢驗(yàn)的基本問題五、假設(shè)檢驗(yàn)的步驟1、提出原假設(shè)H0,即零假設(shè);2、選擇和計(jì)算教育統(tǒng)計(jì)量;3、對給定的顯著性水平α確定臨界值;4、將統(tǒng)計(jì)量計(jì)算的結(jié)果與臨界值進(jìn)行比較,從而決定是拒絕還是接受原假設(shè)。第7頁,課件共39頁,創(chuàng)作于2023年2月Z檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))2、分類根據(jù)樣本的多少可以分為單總體的Z檢驗(yàn)和雙總體的Z檢驗(yàn)。

適用條件:1、已知總體標(biāo)準(zhǔn)差σ,或者總體標(biāo)準(zhǔn)差未知,但樣本為大樣本的平均數(shù)的差異性檢驗(yàn)。因?yàn)榇髽颖镜钠骄鶖?shù)的抽樣分布服從于正態(tài)分布。故可采用統(tǒng)計(jì)量Z

檢驗(yàn)。1、已知總體標(biāo)準(zhǔn)差σ,或者總體標(biāo)準(zhǔn)差未知,但樣本為大樣本的平均數(shù)的差異性檢驗(yàn)。因?yàn)榇髽颖镜钠骄鶖?shù)的抽樣分布服從于正態(tài)分布。故可采用統(tǒng)計(jì)量Z

檢驗(yàn)。第8頁,課件共39頁,創(chuàng)作于2023年2月單總體的Z檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))1、適用條件:檢驗(yàn)一個(gè)樣本平均數(shù)與一個(gè)已知的總體平均數(shù)的差異是否顯著。2、檢驗(yàn)的統(tǒng)計(jì)量:這里,Z作為檢驗(yàn)的統(tǒng)計(jì)量,為樣本平均數(shù),μ為總體平均數(shù),σ為總體標(biāo)準(zhǔn)差,n為樣本容量。第9頁,課件共39頁,創(chuàng)作于2023年2月單總體的Z檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))3、檢驗(yàn)過程:①建立虛無假設(shè):②計(jì)算統(tǒng)計(jì)量:③確定顯著性水平α的值。若α為0.01,則臨界值為2.58;若α為0.05,則為1.96.④比較,作出判斷。若Z﹥Z0.05(或Z0.01),即Z﹥1.96,或Z﹥2.58,則說明在顯著性水平α=0.05(0.01)的水平上,差異是顯著的,否則,就說明差異不顯著.第10頁,課件共39頁,創(chuàng)作于2023年2月雙總體的Z檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))1、適用條件:檢驗(yàn)兩個(gè)樣本平均數(shù)各自代表的總體平均數(shù)的差異是否顯著。2、檢驗(yàn)的統(tǒng)計(jì)量:這里,Z作為檢驗(yàn)的統(tǒng)計(jì)量,為樣本平均數(shù),是兩樣本的標(biāo)準(zhǔn)差,n1,n2分別為兩樣本的容量。第11頁,課件共39頁,創(chuàng)作于2023年2月雙總體的Z檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))3、檢驗(yàn)過程:①建立虛無假設(shè):②計(jì)算統(tǒng)計(jì)量:③確定顯著性水平α的值。若α為0.01,則臨界值為2.58;若α為0.05,則為1.96.④比較,作出判斷。若Z﹥Z0.05(或Z0.01),即Z﹥1.96,或Z﹥2.58,則說明在顯著性水平α=0.05(0.01)的水平上,差異是顯著的,否則,就說明差異不顯著.第12頁,課件共39頁,創(chuàng)作于2023年2月適用條件:1、總體呈正態(tài)分布。如果總體標(biāo)準(zhǔn)未知而且樣本為小樣本(t≤30)的平均數(shù)的差異性檢驗(yàn)。2、分類根據(jù)樣本的多少可以分為單總體的t檢驗(yàn)和雙總體的t檢驗(yàn)。t檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))第13頁,課件共39頁,創(chuàng)作于2023年2月單總體的t檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))1、適用條件:檢驗(yàn)一個(gè)樣本平均數(shù)與一個(gè)已知的總體平均數(shù)的差異是否顯著。2、檢驗(yàn)的統(tǒng)計(jì)量:這里,t作為檢驗(yàn)的統(tǒng)計(jì)量,為樣本平均數(shù),μ為總體平均數(shù)為樣本標(biāo)準(zhǔn)差,n為樣本容量。第14頁,課件共39頁,創(chuàng)作于2023年2月單總體的t檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))3、檢驗(yàn)過程:①建立虛無假設(shè):②計(jì)算統(tǒng)計(jì)量:③確定顯著性水平α的值。并根據(jù)自由度和顯著性水平查表,得到臨界值。④比較,作出判斷。若t﹥t(n-1)0.05(或t(n-1)0.01),則說明在顯著性水平α=0.05(0.01)的水平上,差異是顯著的;否則,就說明差異不顯著.第15頁,課件共39頁,創(chuàng)作于2023年2月1、適用條件是檢驗(yàn)兩個(gè)樣本平均數(shù)與其各自代表的總體的差異是否顯著。2、分類相關(guān)樣本的平均數(shù)的差異性檢驗(yàn)獨(dú)立樣本的平均數(shù)的差異性檢驗(yàn)雙總體的t檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))第16頁,課件共39頁,創(chuàng)作于2023年2月雙總體的t檢驗(yàn)——相關(guān)樣本

(平均數(shù)的差異性檢驗(yàn))①相關(guān)樣本所謂相關(guān)樣本,是指兩個(gè)樣本之間存在一一對應(yīng)的關(guān)系。譬如,同一組被試在實(shí)驗(yàn)前與實(shí)驗(yàn)后結(jié)果的比較;同一組被試在兩種不同條件下結(jié)果的比較;被試的兩組是經(jīng)過有意匹配的對偶組;實(shí)驗(yàn)時(shí)經(jīng)過匹配的實(shí)驗(yàn)組與對照組的結(jié)果的比較,等等。都是相關(guān)樣本的比較。第17頁,課件共39頁,創(chuàng)作于2023年2月雙總體的t檢驗(yàn)——相關(guān)樣本

(平均數(shù)的差異性檢驗(yàn))②獨(dú)立樣本

所謂獨(dú)立樣本,是指從兩個(gè)無關(guān)的總體中隨即抽取的兩個(gè)樣本稱為是獨(dú)立樣本。譬如,男女性別的差異比較;沒有經(jīng)過匹配的、僅僅是隨機(jī)選擇的實(shí)驗(yàn)組與對照組的實(shí)驗(yàn)結(jié)果的比較;等等,都屬于獨(dú)立樣本的比較。第18頁,課件共39頁,創(chuàng)作于2023年2月獨(dú)立樣本的t檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))1、適用條件:檢驗(yàn)兩個(gè)樣本平均數(shù)各自代表的總體平均數(shù)的差異是否顯著。2、檢驗(yàn)的統(tǒng)計(jì)量:這里,t作為檢驗(yàn)的統(tǒng)計(jì)量,為樣本平均數(shù),是兩總體方差的估計(jì)值,n1,n2分別為兩樣本的容量。第19頁,課件共39頁,創(chuàng)作于2023年2月相關(guān)樣本的t檢驗(yàn)

(平均數(shù)的差異性檢驗(yàn))1、適用條件:檢驗(yàn)兩個(gè)配對樣本平均數(shù)各自代表的總體平均數(shù)的差異是否顯著。2、檢驗(yàn)的統(tǒng)計(jì)量:這里,t作為檢驗(yàn)的統(tǒng)計(jì)量,為樣本平均數(shù),是兩樣本方差,n為相關(guān)樣本的容量。r為相關(guān)樣本的相關(guān)系數(shù)。第20頁,課件共39頁,創(chuàng)作于2023年2月思考題1、為了研究男女生在學(xué)習(xí)數(shù)學(xué)方面的情況,從某校中隨機(jī)抽取男生10名,女生8名,測驗(yàn)得到男生的數(shù)學(xué)平均成績是80.4分,標(biāo)準(zhǔn)差是7.6分,女生的數(shù)學(xué)平均成績是71.8分,標(biāo)準(zhǔn)差是7.5分,問男生的數(shù)學(xué)成績是否比女生高?請問:進(jìn)行男女生數(shù)學(xué)成績的差異性檢驗(yàn)時(shí),是按照相關(guān)樣本還是按照獨(dú)立樣本進(jìn)行?為什么?第21頁,課件共39頁,創(chuàng)作于2023年2月思考題2、從某個(gè)人多次的視反應(yīng)時(shí)測量的結(jié)果隨即抽取40個(gè)數(shù)據(jù),再從其聽反應(yīng)時(shí)的多次測量結(jié)果中隨機(jī)抽取40個(gè)數(shù)據(jù),進(jìn)行視、聽反應(yīng)的差異檢驗(yàn)時(shí),是按照獨(dú)立樣本還是按照相關(guān)樣本進(jìn)行檢驗(yàn)?為什么?3、對于上題進(jìn)行數(shù)據(jù)收集的時(shí)候,如果每個(gè)被試只收集視、聽反應(yīng)時(shí)的數(shù)據(jù)各一個(gè),如果共有40個(gè)被試,則進(jìn)行視、聽反應(yīng)的差異檢驗(yàn)時(shí),是按照獨(dú)立樣本還是按照相關(guān)樣本進(jìn)行檢驗(yàn)?為什么?第22頁,課件共39頁,創(chuàng)作于2023年2月4、為了研究數(shù)學(xué)統(tǒng)編教材和數(shù)學(xué)實(shí)驗(yàn)教材的優(yōu)劣。某學(xué)校對一個(gè)班先用實(shí)驗(yàn)教材授課,時(shí)間為一年。然后用統(tǒng)編教材授課一年。兩種教材使用前都進(jìn)行前測,結(jié)束后進(jìn)行后測。從該班中抽取10名學(xué)生,檢驗(yàn)他們在使用兩種不同教材的實(shí)驗(yàn)結(jié)果的差異性檢驗(yàn),是按照獨(dú)立樣本還是按照相關(guān)樣本進(jìn)行檢驗(yàn)?為什么?思考題第23頁,課件共39頁,創(chuàng)作于2023年2月5、為了研究數(shù)學(xué)統(tǒng)編教材和數(shù)學(xué)實(shí)驗(yàn)教材的優(yōu)劣。某學(xué)校對一個(gè)班先用實(shí)驗(yàn)教材授課,時(shí)間為一年。然后用統(tǒng)編教材授課一年。兩種教材使用前都進(jìn)行前測,結(jié)束后進(jìn)行后測。如果已知該班的人數(shù)為35人,實(shí)驗(yàn)后統(tǒng)計(jì)兩種教學(xué)結(jié)果,要檢驗(yàn)他們在使用兩種不同教材的實(shí)驗(yàn)結(jié)果的差異性檢驗(yàn),應(yīng)該按照什么樣的檢驗(yàn)方法進(jìn)行檢驗(yàn)?思考題答案:雙總體的Z檢驗(yàn)第24頁,課件共39頁,創(chuàng)作于2023年2月平均數(shù)的檢驗(yàn)方法小結(jié)11、前提是兩個(gè)總體方差相同,或至少?zèng)]有顯著性差異。2、檢驗(yàn)的方法有兩種:總體服從正態(tài)分布,總體標(biāo)準(zhǔn)差已知,不管是大樣本還是小樣本,均用Z檢驗(yàn)。不知道總體的分布情形,總體標(biāo)準(zhǔn)差未知,當(dāng)樣本為大樣本時(shí),用Z檢驗(yàn),這時(shí)用樣本的標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差就可以了;當(dāng)樣本為小樣本時(shí),必須用t檢驗(yàn),這時(shí)的標(biāo)準(zhǔn)差可以用總體標(biāo)準(zhǔn)差的估計(jì)量S來表示,它與樣本標(biāo)準(zhǔn)差的關(guān)系是:第25頁,課件共39頁,創(chuàng)作于2023年2月2、關(guān)于顯著性水平差異性顯著檢驗(yàn)是和顯著性水平α聯(lián)系在一起的。我們說差異顯著不顯著,是針對特定的α而言的。同一個(gè)問題,由于顯著性水平的不同,可能會(huì)得到完全相反的結(jié)論。3、檢驗(yàn)時(shí)究竟采用單尾還是雙尾檢驗(yàn),這是假設(shè)檢驗(yàn)中的重要的技術(shù)性的問題。一般情況下,當(dāng)研究者如果想要知道兩個(gè)參數(shù)是否有差異,而不強(qiáng)調(diào)差異的方向時(shí),用雙尾檢驗(yàn);反之用單尾檢驗(yàn)。單尾檢驗(yàn)適用于檢驗(yàn)?zāi)骋粎?shù)是否“大于”或“優(yōu)于”、“快于”、“小于”、“劣于”、“慢于”另一參數(shù)的一類問題。平均數(shù)的檢驗(yàn)方法小結(jié)1第26頁,課件共39頁,創(chuàng)作于2023年2月關(guān)于雙尾與單尾檢驗(yàn)舉例例1:全區(qū)統(tǒng)一考試數(shù)學(xué)平均分標(biāo)準(zhǔn)差某學(xué)校的一個(gè)班(n=41)的數(shù)學(xué)平均成績問該班成績與全區(qū)平均成績差異是否顯著?例2:有人調(diào)查小學(xué)五年級中經(jīng)過奧數(shù)訓(xùn)練的學(xué)生對其數(shù)學(xué)思維的影響,從受過奧數(shù)訓(xùn)練的學(xué)生中隨機(jī)抽取70人,進(jìn)行數(shù)學(xué)思維能力的測試,結(jié)果平均成績是80分(已知小學(xué)五年級學(xué)生數(shù)學(xué)思維能力的測試的平均成績是75分,標(biāo)準(zhǔn)差是15分),能否認(rèn)為受過奧數(shù)訓(xùn)練的學(xué)生在數(shù)學(xué)思維能力方面高于一般水平?第27頁,課件共39頁,創(chuàng)作于2023年2月F檢驗(yàn)(方差的差異檢驗(yàn))1、適用條件檢驗(yàn)兩個(gè)總體的方差是否有顯著性差異(也稱為是方差齊性檢驗(yàn))。主要用于兩個(gè)獨(dú)立樣本的方差齊性檢驗(yàn)。由于標(biāo)準(zhǔn)差的抽樣分布受樣本容量的影響,只有樣本容量較大時(shí),抽樣分布才接近正態(tài),因此需要對標(biāo)準(zhǔn)差進(jìn)行參數(shù)估計(jì),也就是要對方差進(jìn)行參數(shù)估計(jì)。2、F檢驗(yàn)是右側(cè)單尾檢驗(yàn),計(jì)算統(tǒng)計(jì)量時(shí),應(yīng)該用總體方差估計(jì)值中較大的一個(gè)作為分子,較小的作為分母,使得F≥1,進(jìn)行比較。第28頁,課件共39頁,創(chuàng)作于2023年2月F檢驗(yàn)(方差的差異檢驗(yàn))2、關(guān)于F分布若從兩個(gè)相互獨(dú)立的正態(tài)總體中隨機(jī)抽取兩個(gè)樣本,以此為基礎(chǔ),分別求出兩個(gè)相應(yīng)總體方差的估計(jì)值,這兩個(gè)總體方差估計(jì)值的比值稱為F比值,即F比值的抽樣分布稱為F分布,F(xiàn)比值稱為統(tǒng)計(jì)量。F統(tǒng)計(jì)量有兩個(gè)自由度,一個(gè)是分子的自由度自由度,分母的自由度性水平α?xí)r的臨界F值,可表示為:第29頁,課件共39頁,創(chuàng)作于2023年2月F檢驗(yàn)一般步驟1、建立虛無假設(shè):2、計(jì)算統(tǒng)計(jì)量:3、確定顯著性水平α的值。并根據(jù)自由度df1、df2和顯著性水平查表,得到臨界值:4、比較,作出判斷。若F與臨界值進(jìn)行比較,并進(jìn)行統(tǒng)計(jì)決斷。第30頁,課件共39頁,創(chuàng)作于2023年2月1、適用條件是對樣本的頻數(shù)分布所來自的總體分布是否服從于某種理論分布所作的假設(shè)檢驗(yàn)。它適用于計(jì)數(shù)資料的檢驗(yàn)。譬如,根據(jù)類別不同的樣本頻數(shù)來推斷總體的分布。根據(jù)性別分類,按男女性別分別計(jì)數(shù);根據(jù)年齡分類,可以分為老年、中年、青年等,按照不同年齡段的人數(shù)進(jìn)行計(jì)數(shù)。因此,比較適合對問卷進(jìn)行統(tǒng)計(jì)分析。第31頁,課件共39頁,創(chuàng)作于2023年2月自由度的計(jì)算:單向表的自由度一般等于組數(shù)(K)減1,即df=K-1,而R×C表的自由度需注意計(jì)算公式為df=(R-1)(C-1)1、適用條件是實(shí)得次數(shù)與理論次數(shù)偏離程度的差異程度的差異性顯著檢驗(yàn)。用公式表示為:第32頁,課件共39頁,創(chuàng)作于2023年2月例題分析一一、從某校高中應(yīng)屆畢業(yè)生中抽取54人進(jìn)行體檢,健康狀況屬于良好的有15人,中等的有23人,差的有16人。問該校高中應(yīng)屆畢業(yè)生健康狀況好、中、差的人數(shù)比率是否是1:2:1?第33頁,課件共39頁,創(chuàng)作于2023年2月例題分析二二、某大學(xué)一年級學(xué)生在數(shù)學(xué)分析期中考試中,平均成績?yōu)?3分,標(biāo)準(zhǔn)差為17分;期末考試以后,隨機(jī)抽取20人的數(shù)學(xué)分析成績,其平均成績?yōu)?9.2分,問該年級學(xué)生的數(shù)學(xué)分析成績是否有明顯進(jìn)步?第34頁,課件共39頁,創(chuàng)作于2023年2月例題分析三三、一次數(shù)學(xué)考試后,從兩個(gè)學(xué)校隨機(jī)抽取試卷n1=10份和n2=9份,算得樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論