教育統(tǒng)計(jì)學(xué)第四章_第1頁
教育統(tǒng)計(jì)學(xué)第四章_第2頁
教育統(tǒng)計(jì)學(xué)第四章_第3頁
教育統(tǒng)計(jì)學(xué)第四章_第4頁
教育統(tǒng)計(jì)學(xué)第四章_第5頁
已閱讀5頁,還剩36頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、LOGO1第第四四章章 差異差異量量第一節(jié) 全距、四分位距、百分位距第二節(jié) 平均差第三節(jié) 方差和標(biāo)準(zhǔn)差第四節(jié) 相對(duì)差異量第五節(jié) 偏態(tài)量及峰態(tài)量2引引 言言兩組學(xué)生某科測驗(yàn)成績:兩組學(xué)生某科測驗(yàn)成績:甲組:甲組:54、63、72、74、82、88、99乙組:乙組:67、71、73、76、79、82、84 表示一組數(shù)據(jù)變異程度或離散程度的量稱為差異量。差表示一組數(shù)據(jù)變異程度或離散程度的量稱為差異量。差異量越大,表示數(shù)據(jù)分布的范圍越廣,越不整齊;差異量越異量越大,表示數(shù)據(jù)分布的范圍越廣,越不整齊;差異量越小,表示數(shù)據(jù)分布的越集中,變動(dòng)范圍越小。常用的差異量小,表示數(shù)據(jù)分布的越集中,變動(dòng)范圍越小。常用

2、的差異量指標(biāo)有全距、四分位距、百分位距、平均差、方差、標(biāo)準(zhǔn)差、指標(biāo)有全距、四分位距、百分位距、平均差、方差、標(biāo)準(zhǔn)差、差異系數(shù)等。差異系數(shù)等。3 差異量數(shù)就是對(duì)一組數(shù)據(jù)的變異性(離中趨差異量數(shù)就是對(duì)一組數(shù)據(jù)的變異性(離中趨勢)特點(diǎn)進(jìn)行度量和描述的統(tǒng)計(jì)量。它反映了次勢)特點(diǎn)進(jìn)行度量和描述的統(tǒng)計(jì)量。它反映了次數(shù)分布中數(shù)據(jù)彼此分散的程度。數(shù)分布中數(shù)據(jù)彼此分散的程度。4第一節(jié)第一節(jié) 全距、四分位距、百分位距全距、四分位距、百分位距一、全距一、全距 全距是一組數(shù)據(jù)中最大值與最小值之差,又稱極差。全距是一組數(shù)據(jù)中最大值與最小值之差,又稱極差。用用R表示。表示。如上例:兩組學(xué)生某科測驗(yàn)成績:如上例:兩組學(xué)生某

3、科測驗(yàn)成績:甲組:甲組:54、63、72、74、82、88、99乙組:乙組:67、71、73、76、79、82、84甲組的全距為甲組的全距為R=99-54=45乙組的全距為乙組的全距為R=84-67=17說明甲組比乙組的離散程度大。說明甲組比乙組的離散程度大。 頻數(shù)分布表求全距的方法是:最大一組與最小一組組頻數(shù)分布表求全距的方法是:最大一組與最小一組組中值之差。中值之差。5全距的應(yīng)用及優(yōu)缺點(diǎn)全距的應(yīng)用及優(yōu)缺點(diǎn) 概念清楚、意義明確,計(jì)算簡單,但易受兩概念清楚、意義明確,計(jì)算簡單,但易受兩極端數(shù)據(jù)的影響。不考慮中間值的差異,反應(yīng)不極端數(shù)據(jù)的影響。不考慮中間值的差異,反應(yīng)不靈敏。靈敏。 只能作為差異

4、量的粗略指標(biāo),在編制頻數(shù)分只能作為差異量的粗略指標(biāo),在編制頻數(shù)分布表時(shí)常用到。布表時(shí)常用到。6二、四分位距二、四分位距1.四分位距的概念四分位距的概念 四分位距是指在一個(gè)四分位距是指在一個(gè)頻頻數(shù)分布中,中間數(shù)分布中,中間50%的的頻頻數(shù)數(shù)的全距之半,也就是第的全距之半,也就是第3四分位數(shù)四分位數(shù)Q3(第(第75百分位數(shù))百分位數(shù))與第與第1四分位數(shù)四分位數(shù)Q1(第(第25百分位數(shù))百分位數(shù))之差的一半。所謂之差的一半。所謂第第3四分位數(shù)是指在這一點(diǎn)的下端有占總四分位數(shù)是指在這一點(diǎn)的下端有占總頻頻數(shù)數(shù)75%的數(shù)據(jù),的數(shù)據(jù),在其上端有占總在其上端有占總頻頻數(shù)數(shù)25%的數(shù)據(jù);所謂第的數(shù)據(jù);所謂第1四

5、分位數(shù)中指四分位數(shù)中指在這一點(diǎn)的下端有占總在這一點(diǎn)的下端有占總頻頻數(shù)數(shù)25%的數(shù)據(jù),在其上端有占的數(shù)據(jù),在其上端有占總總頻頻數(shù)數(shù)75%的數(shù)據(jù)。如圖的數(shù)據(jù)。如圖4-1。7圖圖4-1 四分差與四分位數(shù)四分差與四分位數(shù)Q1、Q2、Q3之間的關(guān)系之間的關(guān)系用公式可表示為用公式可表示為213QQQD8 2.四分位距的計(jì)算方法四分位距的計(jì)算方法 (1)原始數(shù)據(jù)計(jì)算法)原始數(shù)據(jù)計(jì)算法首先將一組數(shù)據(jù)按大小順序排列,然后用數(shù)據(jù)個(gè)數(shù)首先將一組數(shù)據(jù)按大小順序排列,然后用數(shù)據(jù)個(gè)數(shù)n除以除以4,則第(,則第(n/4+1/2)位置對(duì)應(yīng)的數(shù)據(jù)為第)位置對(duì)應(yīng)的數(shù)據(jù)為第1四分位數(shù)四分位數(shù)Q1,第(,第(3n/4+1/2)位置對(duì)

6、應(yīng)的數(shù)據(jù)為第)位置對(duì)應(yīng)的數(shù)據(jù)為第3四分位數(shù)四分位數(shù)Q3。 例例6 求下列求下列18個(gè)數(shù)據(jù)的四分差:個(gè)數(shù)據(jù)的四分差:51,60,58,63,74,88,66,70,71,75,81,86,52,57,61,65,90,77。9 解:按從小到大排序:解:按從小到大排序: 51,52,57,58,60,61,63,65,66,70,71, 74,75,77,81,86,88,90。由于由于n=18,所以,所以Q1=18/4+1/2=5,即第,即第5個(gè)位個(gè)位置所對(duì)應(yīng)的數(shù)據(jù)為置所對(duì)應(yīng)的數(shù)據(jù)為60;Q3=18*3/4+1/2=14,即第即第14個(gè)位置所對(duì)應(yīng)的數(shù)據(jù)為個(gè)位置所對(duì)應(yīng)的數(shù)據(jù)為77。將將Q1與與Q3

7、代入公式代入公式,得得QD=(77-60)/2=8.510 (2)頻數(shù)分布表計(jì)算法)頻數(shù)分布表計(jì)算法11)4(11QQfinnLQ33)43(23QQfinnLQ(第三個(gè)四分位數(shù))(第三個(gè)四分位數(shù))(第一個(gè)四分位數(shù))(第一個(gè)四分位數(shù))213QQQD 例如下表為師大附小二年級(jí)例如下表為師大附小二年級(jí)80個(gè)學(xué)生身高的頻數(shù)個(gè)學(xué)生身高的頻數(shù)分布,求四分位距。分布,求四分位距。11表表2.10 師大附小二年級(jí)師大附小二年級(jí)80個(gè)學(xué)生身高的頻數(shù)分布個(gè)學(xué)生身高的頻數(shù)分布1240.126103)12480(1241Q84.132193)428043(1303Q22. 3240.12684.132QD133.四

8、分位距的應(yīng)用及優(yōu)缺點(diǎn)四分位距的應(yīng)用及優(yōu)缺點(diǎn)l優(yōu)點(diǎn):簡明易懂,計(jì)算簡便,不易受兩極端數(shù)據(jù)的影優(yōu)點(diǎn):簡明易懂,計(jì)算簡便,不易受兩極端數(shù)據(jù)的影響響l缺點(diǎn):忽略了左右缺點(diǎn):忽略了左右50%數(shù)據(jù)的差異,不適合代數(shù)運(yùn)算數(shù)據(jù)的差異,不適合代數(shù)運(yùn)算 當(dāng)一組數(shù)據(jù)用中位數(shù)表示集中量時(shí),就要用四分位當(dāng)一組數(shù)據(jù)用中位數(shù)表示集中量時(shí),就要用四分位數(shù)表示差異量,因?yàn)樗鼈兺瑢儆诎俜煮w系。數(shù)表示差異量,因?yàn)樗鼈兺瑢儆诎俜煮w系。l應(yīng)用條件:有特大或特小兩極端數(shù)值;應(yīng)用條件:有特大或特小兩極端數(shù)值; 有個(gè)別數(shù)值不確切、不清楚;有個(gè)別數(shù)值不確切、不清楚; 用等級(jí)表示的數(shù)據(jù)用等級(jí)表示的數(shù)據(jù)14三、百分位距三、百分位距 百分位距是指兩

9、個(gè)百分位數(shù)之差。常用的百百分位距是指兩個(gè)百分位數(shù)之差。常用的百分位距有兩種:分位距有兩種:l第第90與第與第10百分位數(shù)之差百分位數(shù)之差 l第第93與第與第7百分位數(shù)之差百分位數(shù)之差 1090PP 793PP 例如,求下表中例如,求下表中 與與 。1090PP 793PP 15表表2.10 師大附小二年級(jí)師大附小二年級(jí)80個(gè)學(xué)生身高的頻數(shù)分布個(gè)學(xué)生身高的頻數(shù)分布16回憶百分位數(shù)計(jì)算方法回憶百分位數(shù)計(jì)算方法1()pppiPLpnnf75.135123)618010090(13390P50.12283)48010010(12110P25.1350.12275.1351090 PP45.15793

10、PP17第二節(jié)第二節(jié) 平均差平均差一、平均差的概念一、平均差的概念 每一個(gè)數(shù)據(jù)與該組數(shù)據(jù)中位數(shù)離差的絕對(duì)值的算術(shù)每一個(gè)數(shù)據(jù)與該組數(shù)據(jù)中位數(shù)離差的絕對(duì)值的算術(shù)平均數(shù)即為該組數(shù)據(jù)的平均差,用平均數(shù)即為該組數(shù)據(jù)的平均差,用MD表示。表示。二、平均差的計(jì)算方法二、平均差的計(jì)算方法 1.原始數(shù)據(jù)計(jì)算法原始數(shù)據(jù)計(jì)算法nMdXMD|XnMd原始數(shù)據(jù)原始數(shù)據(jù)中位數(shù)中位數(shù)總頻數(shù)總頻數(shù)18 例如,求原始數(shù)據(jù)例如,求原始數(shù)據(jù)78、83、69、75、97、88、86的的平均差。平均差。2.頻數(shù)分布表計(jì)算法頻數(shù)分布表計(jì)算法nMdXfMD|fnX各組頻數(shù)各組頻數(shù)各組組中值各組組中值總頻數(shù)總頻數(shù)19表表3-2 48個(gè)學(xué)生數(shù)

11、學(xué)成績頻個(gè)學(xué)生數(shù)學(xué)成績頻數(shù)分布表數(shù)分布表2071.8075)23248(80Md87. 9|nMdXfMD三、平均差的優(yōu)缺點(diǎn)三、平均差的優(yōu)缺點(diǎn)l優(yōu)點(diǎn):意義明確,計(jì)算簡單,每個(gè)數(shù)據(jù)都參加了運(yùn)算,優(yōu)點(diǎn):意義明確,計(jì)算簡單,每個(gè)數(shù)據(jù)都參加了運(yùn)算,考慮到了全部的離差,反應(yīng)靈敏考慮到了全部的離差,反應(yīng)靈敏l缺點(diǎn):計(jì)算用到絕對(duì)值,不適合代數(shù)運(yùn)算,因此在統(tǒng)缺點(diǎn):計(jì)算用到絕對(duì)值,不適合代數(shù)運(yùn)算,因此在統(tǒng)計(jì)分析中應(yīng)用較少。計(jì)分析中應(yīng)用較少。21第三節(jié)第三節(jié) 方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差一、方差和標(biāo)準(zhǔn)差的概念一、方差和標(biāo)準(zhǔn)差的概念 方差是指離差平方的算術(shù)平均數(shù),用方差是指離差平方的算術(shù)平均數(shù),用 表示,公表示,公式為

12、:式為:X2nXXX22)(nXXX2)(標(biāo)準(zhǔn)差是指方差的平方根,用標(biāo)準(zhǔn)差是指方差的平方根,用 表示,即:表示,即:X22 例如:例如:6名女童的跳遠(yuǎn)成績(名女童的跳遠(yuǎn)成績(cm)148.2、123.8、123.8、142.7、130.4、133.3,求方差和標(biāo)準(zhǔn)差。,求方差和標(biāo)準(zhǔn)差。 標(biāo)準(zhǔn)差的值越大,表明這組數(shù)據(jù)的離散程度標(biāo)準(zhǔn)差的值越大,表明這組數(shù)據(jù)的離散程度越大,即數(shù)據(jù)越參差不齊,分布范圍越廣;標(biāo)準(zhǔn)越大,即數(shù)據(jù)越參差不齊,分布范圍越廣;標(biāo)準(zhǔn)差的值越小,表明這組數(shù)據(jù)的離散程度越小,即差的值越小,表明這組數(shù)據(jù)的離散程度越小,即數(shù)據(jù)越集中、整齊,分布范圍越小。在教育科研數(shù)據(jù)越集中、整齊,分布范圍

13、越小。在教育科研中,究竟是標(biāo)準(zhǔn)差大好還是小好,這要看所分析中,究竟是標(biāo)準(zhǔn)差大好還是小好,這要看所分析的問題而異。的問題而異。23 二、二、方差和方差和標(biāo)準(zhǔn)差的計(jì)算方法標(biāo)準(zhǔn)差的計(jì)算方法 1.原始數(shù)據(jù)原始數(shù)據(jù)法法 為了減少計(jì)算量,可將公式為了減少計(jì)算量,可將公式4.1進(jìn)行轉(zhuǎn)換,使公式中參進(jìn)行轉(zhuǎn)換,使公式中參與運(yùn)算的變量皆為原始數(shù)據(jù)。公式為與運(yùn)算的變量皆為原始數(shù)據(jù)。公式為222nXnXX22nXnXX原始數(shù)據(jù)原始數(shù)據(jù)總頻數(shù)總頻數(shù)Xn24 2.頻數(shù)分布表計(jì)算法頻數(shù)分布表計(jì)算法 222nfXnfXX22nfXnfXX各組組中值各組組中值各組頻數(shù)各組頻數(shù)Xf例如:例如:25表表3-2 48個(gè)學(xué)生數(shù)學(xué)成績頻

14、個(gè)學(xué)生數(shù)學(xué)成績頻數(shù)分布表數(shù)分布表26三三、方差和方差和標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差的應(yīng)用及優(yōu)缺點(diǎn)應(yīng)用及優(yōu)缺點(diǎn)l優(yōu)點(diǎn):反應(yīng)靈敏;嚴(yán)密確定;計(jì)算簡單;適合代數(shù)運(yùn)算;優(yōu)點(diǎn):反應(yīng)靈敏;嚴(yán)密確定;計(jì)算簡單;適合代數(shù)運(yùn)算; 用樣本數(shù)據(jù)推斷總體差異量時(shí),是最好的估計(jì)量;用樣本數(shù)據(jù)推斷總體差異量時(shí),是最好的估計(jì)量; 在避免兩極端數(shù)值影響方面大大超過全距;在避免兩極端數(shù)值影響方面大大超過全距; 在考慮到全部離差方面,優(yōu)于四分位距;在考慮到全部離差方面,優(yōu)于四分位距; 在避免絕對(duì)值方面,優(yōu)于平均差。在避免絕對(duì)值方面,優(yōu)于平均差。l缺點(diǎn):不易理解;缺點(diǎn):不易理解; 易受極端數(shù)值影響;易受極端數(shù)值影響; 有個(gè)別數(shù)據(jù)模糊不清時(shí),無法

15、計(jì)算。有個(gè)別數(shù)據(jù)模糊不清時(shí),無法計(jì)算。27l 適用條件適用條件1、一組數(shù)據(jù)的一般水平適合用算術(shù)平均數(shù)描、一組數(shù)據(jù)的一般水平適合用算術(shù)平均數(shù)描述時(shí),其離散程度宜用述時(shí),其離散程度宜用方差和標(biāo)準(zhǔn)方差和標(biāo)準(zhǔn)差描述。差描述。2、計(jì)算其它統(tǒng)計(jì)量時(shí),如相關(guān)系數(shù)等,要用、計(jì)算其它統(tǒng)計(jì)量時(shí),如相關(guān)系數(shù)等,要用到標(biāo)準(zhǔn)差。到標(biāo)準(zhǔn)差。3、在推斷統(tǒng)計(jì)中,尤其是進(jìn)行方差分析時(shí),、在推斷統(tǒng)計(jì)中,尤其是進(jìn)行方差分析時(shí),常用方差表示數(shù)據(jù)的離散程度。常用方差表示數(shù)據(jù)的離散程度。28四、各種差異量的數(shù)值關(guān)系四、各種差異量的數(shù)值關(guān)系當(dāng)總頻數(shù)相當(dāng)大,且頻數(shù)分布呈正態(tài)時(shí),全距、四分位距、當(dāng)總頻數(shù)相當(dāng)大,且頻數(shù)分布呈正態(tài)時(shí),全距、四分位

16、距、平均差、標(biāo)準(zhǔn)差的數(shù)值存在如下關(guān)系:平均差、標(biāo)準(zhǔn)差的數(shù)值存在如下關(guān)系:QDMDRX95 . 76QDMDMDQDMDMDQDQDXXXX1843. 18453. 02533. 17979. 04826. 16745. 0中位數(shù)上下各一個(gè)四分位距之間包括中位數(shù)上下各一個(gè)四分位距之間包括50%的總頻數(shù);的總頻數(shù);算數(shù)平均數(shù)上下各一個(gè)平均差之間包括算數(shù)平均數(shù)上下各一個(gè)平均差之間包括57.51%的總頻數(shù);的總頻數(shù);算數(shù)平均數(shù)上下各一個(gè)標(biāo)準(zhǔn)差之間包括算數(shù)平均數(shù)上下各一個(gè)標(biāo)準(zhǔn)差之間包括68.26%的總頻數(shù);的總頻數(shù);29第四節(jié)第四節(jié) 差異系數(shù)差異系數(shù)一、差異系數(shù)的概念一、差異系數(shù)的概念 差異系數(shù)是一組數(shù)

17、據(jù)的標(biāo)準(zhǔn)差與差異系數(shù)是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與算數(shù)算數(shù)平均數(shù)平均數(shù)的比率,又稱相對(duì)的比率,又稱相對(duì)差異量差異量,它是沒有單位的相對(duì)它是沒有單位的相對(duì)數(shù)。數(shù)。用符號(hào)用符號(hào)CV表示。公式為表示。公式為%100XCVX 由上式可見,差異系數(shù)就是以平均數(shù)為單位,視標(biāo)由上式可見,差異系數(shù)就是以平均數(shù)為單位,視標(biāo)準(zhǔn)差占平均數(shù)百分比的大小來衡量差異的程度。差異系準(zhǔn)差占平均數(shù)百分比的大小來衡量差異的程度。差異系數(shù)越大,表明離散程度越大;差異系數(shù)越小,表明離散數(shù)越大,表明離散程度越大;差異系數(shù)越小,表明離散程度越小。程度越小。30 二、差異系數(shù)的用途二、差異系數(shù)的用途1.比較不同單位資料的差異程度比較不同單位資料的差

18、異程度例如:例如:1975年上海市區(qū)年上海市區(qū)6歲男童體重與身高為:歲男童體重與身高為:其差異系數(shù)為:其差異系數(shù)為:%19. 4%10087.11586. 4%14.11%10039.1916. 2CVCV體重體重身高身高可見,體重的差異大于身高的差異??梢?,體重的差異大于身高的差異。312.比較單位相同而平均數(shù)相差較大的兩組資料的差比較單位相同而平均數(shù)相差較大的兩組資料的差異程度異程度例如:例如:1975年上海市區(qū)兩組女童的體重為:年上海市區(qū)兩組女童的體重為:%15.11%10002.1912. 2%38.11%10045. 562. 0CVCV2個(gè)月個(gè)月組組6歲組歲組可見,兩組女童體重的離散程度大體相同。可見,兩組女童體重的離散程度大體相同。32 3.可判斷特殊差異情況可判斷特殊差異情況 根據(jù)經(jīng)驗(yàn),一般根據(jù)經(jīng)驗(yàn),一般CV值常在值常在5%35%之間。之間。 如果如果CV35%時(shí),可懷疑所求

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論