![第2章數(shù)據(jù)分布特征的描述(2)_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/13/33ce331f-57f0-4f4e-8aaa-27a44406a445/33ce331f-57f0-4f4e-8aaa-27a44406a4451.gif)
![第2章數(shù)據(jù)分布特征的描述(2)_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/13/33ce331f-57f0-4f4e-8aaa-27a44406a445/33ce331f-57f0-4f4e-8aaa-27a44406a4452.gif)
![第2章數(shù)據(jù)分布特征的描述(2)_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/13/33ce331f-57f0-4f4e-8aaa-27a44406a445/33ce331f-57f0-4f4e-8aaa-27a44406a4453.gif)
![第2章數(shù)據(jù)分布特征的描述(2)_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/13/33ce331f-57f0-4f4e-8aaa-27a44406a445/33ce331f-57f0-4f4e-8aaa-27a44406a4454.gif)
![第2章數(shù)據(jù)分布特征的描述(2)_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/13/33ce331f-57f0-4f4e-8aaa-27a44406a445/33ce331f-57f0-4f4e-8aaa-27a44406a4455.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 第第2 2章章 數(shù)據(jù)分布特征的描述數(shù)據(jù)分布特征的描述(2) 數(shù)據(jù)的分布特征主要體現(xiàn)在兩個方面:數(shù)據(jù)的分布特征主要體現(xiàn)在兩個方面: 1、數(shù)據(jù)分布的集中趨勢數(shù)據(jù)分布的集中趨勢 2、數(shù)據(jù)分布的離中趨勢(離散程度)數(shù)據(jù)分布的離中趨勢(離散程度)第一節(jié)第一節(jié) 數(shù)據(jù)分布集中趨勢的測度數(shù)據(jù)分布集中趨勢的測度 所謂集中趨勢是指一組數(shù)據(jù)向某一中心值靠所謂集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向,測度數(shù)據(jù)的集中趨勢也就是尋找數(shù)據(jù)一攏的傾向,測度數(shù)據(jù)的集中趨勢也就是尋找數(shù)據(jù)一般水平的代表值或中心值(即般水平的代表值或中心值(即平均數(shù)平均數(shù))。)。一、眾數(shù)(一、眾數(shù)(Mo) (一)概念(一)概念 眾數(shù)是一組數(shù)中出
2、現(xiàn)次數(shù)最多的眾數(shù)是一組數(shù)中出現(xiàn)次數(shù)最多的變量值變量值。 注意:注意:如果一組數(shù)中有多個變量值出現(xiàn)的次數(shù)同樣最多時,如果一組數(shù)中有多個變量值出現(xiàn)的次數(shù)同樣最多時,則有多個眾數(shù);一組數(shù)可能只有一個眾數(shù);如果各變量值出則有多個眾數(shù);一組數(shù)可能只有一個眾數(shù);如果各變量值出現(xiàn)次數(shù)一樣多或差不多時,則沒有眾數(shù)。所以,只有變量值現(xiàn)次數(shù)一樣多或差不多時,則沒有眾數(shù)。所以,只有變量值個數(shù)多且分布集中時,才有眾數(shù)。個數(shù)多且分布集中時,才有眾數(shù)。(二)眾數(shù)的確定(二)眾數(shù)的確定1、根據(jù)未分組或單項式變量數(shù)列計算眾數(shù)根據(jù)未分組或單項式變量數(shù)列計算眾數(shù) 出現(xiàn)次數(shù)最多的變量值就是眾數(shù)。出現(xiàn)次數(shù)最多的變量值就是眾數(shù)。注意:
3、注意:也可以從次數(shù)分布曲線的高低來判斷。也可以從次數(shù)分布曲線的高低來判斷。2、根據(jù)組距式變量數(shù)列確定眾數(shù)根據(jù)組距式變量數(shù)列確定眾數(shù) 標志值標志值 x 次數(shù)次數(shù) f x1x2 x2x3 x3x4 x4x5 . . . . xn-1xn f1 f2 :眾數(shù)所在組前一組(眾數(shù)所在組前一組( f-1) f3 :眾數(shù)所在組眾數(shù)所在組( f) f4 :眾數(shù)所在組后一組(眾數(shù)所在組后一組( f+1) . . . . fn-1 合合 計計 f 步驟:步驟: 第一,確定眾數(shù)所在的組第一,確定眾數(shù)所在的組(次數(shù)最多的組)(次數(shù)最多的組); 第二,運用公式計算:第二,運用公式計算:iffffffLoM)1()1(1
4、見第見第24頁的例題頁的例題二、中位數(shù)二、中位數(shù)(Me)(一)概念(一)概念 中位數(shù)是一組數(shù)據(jù)中位數(shù)是一組數(shù)據(jù)排序排序后,處于后,處于中間位置中間位置上的變上的變量值。量值。 如一組數(shù):如一組數(shù):x1、x2、x3、xn (二)中位數(shù)的確定(二)中位數(shù)的確定 (1 1)對于未分組數(shù)據(jù))對于未分組數(shù)據(jù) 步驟:步驟: 第一,對數(shù)據(jù)排序。第一,對數(shù)據(jù)排序。 第二,找出中位數(shù)所在的位置,該位置上的變量值就是中位第二,找出中位數(shù)所在的位置,該位置上的變量值就是中位數(shù)。數(shù)。 當當n為奇數(shù)時,中位數(shù)就是第為奇數(shù)時,中位數(shù)就是第(n+1)/2位置上的變量值;當位置上的變量值;當n為偶數(shù)時,中位數(shù)就是為偶數(shù)時,中
5、位數(shù)就是 中間位置上兩個變量值相中間位置上兩個變量值相加除以加除以2。122nn和第第見第見第25頁的例題頁的例題(2 2)對于單項式變量數(shù)列)對于單項式變量數(shù)列 標志值標志值 x 次數(shù)次數(shù) f 向下累計次數(shù)向下累計次數(shù)Z x1 x2 x3 x4 . . . . xn f1 f2 f3 f4 . . . . fn Z1 Z2 Z3:中位數(shù)所在組中位數(shù)所在組 Z4 . . . . Zn 合合 計計 f 注意:注意:這里的累計次數(shù)表示的是一個范圍。這里的累計次數(shù)表示的是一個范圍。步驟:步驟:第一,計算出向下累計次數(shù)。第一,計算出向下累計次數(shù)。第二,在累計次數(shù)中沿著累計的方向找出包括第二,在累計次數(shù)
6、中沿著累計的方向找出包括 的第一個組,該組即為中位數(shù)所在的組。的第一個組,該組即為中位數(shù)所在的組。第三,與該組相對應(yīng)的變量值即為中位數(shù)。第三,與該組相對應(yīng)的變量值即為中位數(shù)。2 f(3 3)對于組距式變量數(shù)列)對于組距式變量數(shù)列 分分 組組 次數(shù)次數(shù) f 向下累計向下累計 x1x2 x2x3 x3x4 x4x5 . . . . xn-1xn f1 f2 f3 (fm) f4 . . . . fn Z1 Z2 (Sm-1) Z3 Z4 . . . . Zn 合合 計計 f 注意:注意:這里的累計次數(shù)表示的是一個范圍。這里的累計次數(shù)表示的是一個范圍。步驟:步驟:第一,計算出向下累計次數(shù)。第一,計算
7、出向下累計次數(shù)。第二,在累計次數(shù)中沿著累計的方向找出包括第二,在累計次數(shù)中沿著累計的方向找出包括 的的 第一個組,該組即為中位數(shù)所在的組。第一個組,該組即為中位數(shù)所在的組。 第三,采用公式進行計算。第三,采用公式進行計算。2 f 2 1ifSfLMmme見第見第25頁的例題頁的例題三、分位數(shù)(以四分位數(shù)為例)三、分位數(shù)(以四分位數(shù)為例) 先將全部數(shù)據(jù)按從小到大的順序排列后,再將其先將全部數(shù)據(jù)按從小到大的順序排列后,再將其劃分為數(shù)據(jù)個數(shù)相等的四部分,每部分的數(shù)據(jù)個數(shù)各劃分為數(shù)據(jù)個數(shù)相等的四部分,每部分的數(shù)據(jù)個數(shù)各占占25%,其端點分別為,其端點分別為Q Q0、Q Q1、Q Q2、Q Q3、Q Q
8、4 。Q Q0 0Q Q1 1Q Q2 2Q Q3 3Q Q4 4Q1稱為下四分位數(shù)、稱為下四分位數(shù)、 Q2為中位數(shù)、為中位數(shù)、 Q3稱為上四分位數(shù)稱為上四分位數(shù)其中:其中: Q Q0 是最小值是最小值;Q Q1是第是第 位置上的數(shù)值位置上的數(shù)值; Q Q2是第是第 位置上的數(shù)值位置上的數(shù)值(即中位數(shù))即中位數(shù)); Q Q3是第是第 位置上的數(shù)值;位置上的數(shù)值; Q Q4是最大值是最大值。 413n41n21412nn 注意:注意: 1、如果數(shù)據(jù)個數(shù)不能被如果數(shù)據(jù)個數(shù)不能被4除盡時,還是按這個規(guī)則來確定分位除盡時,還是按這個規(guī)則來確定分位數(shù)的位置;數(shù)的位置;2、有時可能出現(xiàn)分位數(shù)在兩個數(shù)之間的
9、情況,這時有時可能出現(xiàn)分位數(shù)在兩個數(shù)之間的情況,這時如果分位數(shù)剛好在這兩個數(shù)的正中間時,分位數(shù)就是這兩個數(shù)相如果分位數(shù)剛好在這兩個數(shù)的正中間時,分位數(shù)就是這兩個數(shù)相加除以加除以2。但有時不是剛好在這兩個數(shù)的正中間時,要用其中比較但有時不是剛好在這兩個數(shù)的正中間時,要用其中比較小的數(shù)加上按比例分攤的這兩個數(shù)之間的距離。小的數(shù)加上按比例分攤的這兩個數(shù)之間的距離?!纠浚骸纠浚?個家庭的人均月收入數(shù)據(jù)個家庭的人均月收入數(shù)據(jù) 原始數(shù)據(jù)原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630 排排 序序: 750 780 850 960 1080 1250 1500
10、 1630 2000 位位 置置: 1 2 3 4 5 6 7 8 95 . 74) 19( 35 . 241931位置位置QQ1565216301500815285078031QQ見第見第26頁的例題。頁的例題。 注:該例是根據(jù)組距式變量數(shù)列來求分位數(shù),注:該例是根據(jù)組距式變量數(shù)列來求分位數(shù),計算方法與組距式變量數(shù)列求中位數(shù)的方法相同。計算方法與組距式變量數(shù)列求中位數(shù)的方法相同。 注意:注意:眾數(shù)、中位數(shù)和分位數(shù)是根據(jù)變量值在一組數(shù)中的眾數(shù)、中位數(shù)和分位數(shù)是根據(jù)變量值在一組數(shù)中的位置來確定的,而不是根據(jù)各變量值大小來確定的,故稱它們位置來確定的,而不是根據(jù)各變量值大小來確定的,故稱它們?yōu)槲恢?/p>
11、平均數(shù),它們不受極端值的影響。為位置平均數(shù),它們不受極端值的影響。四、均值(算術(shù)平均數(shù),四、均值(算術(shù)平均數(shù), ) (一)簡單算術(shù)平均數(shù)(一)簡單算術(shù)平均數(shù) 當掌握的資料是當掌握的資料是未分組資料未分組資料時,就計算時,就計算簡單算術(shù)平均簡單算術(shù)平均數(shù)數(shù)。如一組數(shù):。如一組數(shù):x1、x2、x3、xn 。則其算術(shù)平均數(shù)為;。則其算術(shù)平均數(shù)為;nxnxxxxn21x 注意:注意:算術(shù)平均數(shù)的分母等于分子中相加數(shù)據(jù)的個數(shù),即算術(shù)平均數(shù)的分母等于分子中相加數(shù)據(jù)的個數(shù),即分子與分母屬于同一總體。分子與分母屬于同一總體。(二)加權(quán)算術(shù)平均數(shù)(二)加權(quán)算術(shù)平均數(shù) 當掌握的資料是當掌握的資料是分組資料分組資料
12、時,就計算時,就計算加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)。 1、單項式變量數(shù)列單項式變量數(shù)列 標志值標志值 x 次數(shù)次數(shù) f 標志總量標志總量 xf 比重比重 f/ f x1 x2 x3 . . . . xn f1 f2 f3 . . . . fn x1f1 x2f2 x3f3 . . . . xn fn f1/ f f2/ f f3/ f . . . . fn/ f 合合 計計 f xf 1ffxfxfx見第見第27頁的例題頁的例題分析:分析: f與與 之間的關(guān)系。之間的關(guān)系。f越大,越大, 越靠近該組的變量越靠近該組的變量值,值,f越小,越小, 越遠離該組的變量值,越遠離該組的變量值, 說明說明f
13、對對 起一個起一個權(quán)衡輕重的作用,故權(quán)衡輕重的作用,故f叫權(quán)數(shù)。因為叫權(quán)數(shù)。因為 ,所以就,所以就權(quán)數(shù)的實質(zhì)而言,權(quán)數(shù)的實質(zhì)而言,f是通過其相對數(shù)形式是通過其相對數(shù)形式 來起作用來起作用的,所以,的,所以, 叫權(quán)重系數(shù)。叫權(quán)重系數(shù)。xxxffffxffxfxfx 根據(jù)根據(jù) ,加權(quán)算術(shù)平均數(shù)有兩種,加權(quán)算術(shù)平均數(shù)有兩種算法。算法。ffxfxfx2、組距式變量數(shù)列組距式變量數(shù)列 當組距式變量數(shù)列求算術(shù)平均數(shù)時,先要求出各組的組中值當組距式變量數(shù)列求算術(shù)平均數(shù)時,先要求出各組的組中值來作為各組的變量值來作為各組的變量值(x),其余步驟與單項式變量數(shù)列相同。,其余步驟與單項式變量數(shù)列相同。 分分 組組
14、 次數(shù)次數(shù) f 組中值組中值 x標志總量標志總量 xf a1b1 a2b2 a3b3 . . . . anbn f1 f2 f3 . . . . fn x1 x2 x3 . . . . xn x1f1 x2f2 x3f3 . . . . xn fn 合合 計計 f _ xf 見第見第27頁的例題頁的例題注意:注意:1、利用組中值來代表各組的一般水平時,是假定各組、利用組中值來代表各組的一般水平時,是假定各組 中各標志值在該組內(nèi)是均勻分布的,故根據(jù)組中值中各標志值在該組內(nèi)是均勻分布的,故根據(jù)組中值 計算的平均數(shù)是一個近似值。計算的平均數(shù)是一個近似值。 2、算術(shù)平均數(shù)易受到極端值(極大值和極小值統(tǒng)
15、稱極、算術(shù)平均數(shù)易受到極端值(極大值和極小值統(tǒng)稱極 端值)的影響,故在統(tǒng)計實務(wù)中,往往將極端值剔端值)的影響,故在統(tǒng)計實務(wù)中,往往將極端值剔 除掉再計算平均數(shù)。除掉再計算平均數(shù)。五五 幾何平均數(shù)(幾何平均數(shù)(G) 1、概念、概念 n個變量值個變量值 (一般是比率值一般是比率值) 連乘積的連乘積的n次方根。次方根。 幾何平均數(shù)的適用條件:幾何平均數(shù)的適用條件:當各變量值的總量等于各變量值當各變量值的總量等于各變量值的乘積,而不是各變量值相加時,對這些變量值求平均數(shù),就的乘積,而不是各變量值相加時,對這些變量值求平均數(shù),就應(yīng)采用幾何平均法,如求平均發(fā)展速度、平均合格率等。應(yīng)采用幾何平均法,如求平均
16、發(fā)展速度、平均合格率等。2、幾何平均數(shù)的計算、幾何平均數(shù)的計算(1 1)簡單幾何平均數(shù)(未分組的資料)簡單幾何平均數(shù)(未分組的資料) 如一組數(shù):如一組數(shù):x1、x2、x3、xn 。nnxxxG 21見第見第29頁的例題頁的例題 在求幾何平均數(shù)之前要判斷是否滿足求幾何平均數(shù)的適用條在求幾何平均數(shù)之前要判斷是否滿足求幾何平均數(shù)的適用條件。件。 標志值標志值 x 次數(shù)次數(shù) f x1 x2 x3 . . . . xn f1 f2 f3 . . . . fn 合合 計計 f (2 2)加權(quán)幾何平均數(shù)(分組資料)加權(quán)幾何平均數(shù)(分組資料)fxxxGnfnff 2211(1)(2)()2nnn nxxxxn
17、n 式中:式中:分子分子x的值是對的值是對原始數(shù)據(jù)排序原始數(shù)據(jù)排序以后的值;以后的值;n 表示數(shù)據(jù)表示數(shù)據(jù)的個數(shù);的個數(shù); 表示切尾系數(shù)表示切尾系數(shù) ,它等于兩端它等于兩端各各切除的數(shù)據(jù)個數(shù)與數(shù)切除的數(shù)據(jù)個數(shù)與數(shù)據(jù)總個數(shù)之比。據(jù)總個數(shù)之比。六、切尾均值六、切尾均值【例】【例】某次比賽共有某次比賽共有1111名評委,對某位歌手的給分分別是:名評委,對某位歌手的給分分別是: 經(jīng)整理得到順序統(tǒng)計量值為經(jīng)整理得到順序統(tǒng)計量值為123456, , , , , ,9.22,9.25,9.20,9.30,9.65,9.30,xxxxxx7891011, , , , 9.27,9.20,9.28,9.25,9
18、.24xxxxx(1)(2)(3)(4)(5)(6), , , , , ,9.20, 9.20, 9.22, 9.24, 9.25, 9.25,xxxxxx(7)(8)(9)(10)(11), , , , 9.27, 9.28, 9.30, 9.30, 9.65xxxxx去掉一個最高分和一個最低分,取去掉一個最高分和一個最低分,取 =1/11 26.993 .922.92 .921111111211)10()3()2(1111111211111111111111xxxxxxx 對稱分布:對稱分布: 左偏分布:左偏分布: 右偏分布:右偏分布:oeMMxxeMoMxeMoM左偏分布左偏分布xeMo
19、M右偏分布右偏分布oMeMx對稱分布對稱分布xoMeM=七、幾種平均數(shù)的關(guān)系七、幾種平均數(shù)的關(guān)系總結(jié):總結(jié): 1、中位數(shù)在一般情況下,始終居于算術(shù)平均數(shù)和眾數(shù)中位數(shù)在一般情況下,始終居于算術(shù)平均數(shù)和眾數(shù)之間,算術(shù)平均數(shù)和眾數(shù)分布在中位數(shù)兩側(cè),眾數(shù)以曲線之間,算術(shù)平均數(shù)和眾數(shù)分布在中位數(shù)兩側(cè),眾數(shù)以曲線最高點來定,算術(shù)平均數(shù)的位置根據(jù)極端值的種類來定。最高點來定,算術(shù)平均數(shù)的位置根據(jù)極端值的種類來定。 2、可以根據(jù)一組數(shù)的這三個平均數(shù)之間的大小關(guān)系來可以根據(jù)一組數(shù)的這三個平均數(shù)之間的大小關(guān)系來判斷該組數(shù)呈何種分布。判斷該組數(shù)呈何種分布。第二節(jié)第二節(jié) 數(shù)據(jù)分布離散程度的測度數(shù)據(jù)分布離散程度的測度
20、數(shù)據(jù)分布的離散程度是數(shù)據(jù)分布的另一個特征,它所反映數(shù)據(jù)分布的離散程度是數(shù)據(jù)分布的另一個特征,它所反映的是各變量值遠離其中心值的程度,也稱為離中趨勢。的是各變量值遠離其中心值的程度,也稱為離中趨勢。 平均數(shù)只反映了一組數(shù)中各數(shù)據(jù)的共性,掩蓋了數(shù)據(jù)之間平均數(shù)只反映了一組數(shù)中各數(shù)據(jù)的共性,掩蓋了數(shù)據(jù)之間的差異性。數(shù)據(jù)分布的離散程度就是用來反映數(shù)據(jù)之間的差異的差異性。數(shù)據(jù)分布的離散程度就是用來反映數(shù)據(jù)之間的差異性的。性的。 數(shù)據(jù)分布離散程度的測度就是找出能對該組數(shù)據(jù)進行分散數(shù)據(jù)分布離散程度的測度就是找出能對該組數(shù)據(jù)進行分散程度描述的測度值,程度描述的測度值,這些測度值常見的有:極差(全距)、方這些測度
21、值常見的有:極差(全距)、方差、標準差、離散系數(shù)等差、標準差、離散系數(shù)等。一、極差(全距,一、極差(全距,R) 全距是一組數(shù)中最大的數(shù)值與最小的數(shù)值之差。全距是一組數(shù)中最大的數(shù)值與最小的數(shù)值之差。 全距的優(yōu)點是計算簡單,意思明確。不足之處是它只反全距的優(yōu)點是計算簡單,意思明確。不足之處是它只反映了一組數(shù)中最大值與最小值之間的差異程度,對于中間其映了一組數(shù)中最大值與最小值之間的差異程度,對于中間其他數(shù)據(jù)之間的差異程度卻沒有反映出來。他數(shù)據(jù)之間的差異程度卻沒有反映出來。二、內(nèi)距(四分位差二、內(nèi)距(四分位差Q) 先將全部標志值按從小到大的順序排列后,再將先將全部標志值按從小到大的順序排列后,再將其劃
22、分為總體單位數(shù)相等的四部分,每部分的總體單其劃分為總體單位數(shù)相等的四部分,每部分的總體單位數(shù)各占位數(shù)各占25%,其端點分別為,其端點分別為Q Q0、Q Q1、Q Q2、Q Q3、Q Q4 。Q Q0 0Q Q1 1Q Q2 2Q Q3 3Q Q4 4Q1稱為下四分位數(shù)、稱為下四分位數(shù)、 Q2為中位數(shù)、為中位數(shù)、 Q3稱為上四分位數(shù)稱為上四分位數(shù)其中:其中: Q Q0 是第一個數(shù),即最小值是第一個數(shù),即最小值;Q Q1是第是第 位置上的位置上的數(shù)值數(shù)值; Q Q2是第是第 位置上的數(shù)值位置上的數(shù)值(即中位數(shù))即中位數(shù)); Q Q3是第是第 位置上的數(shù)值;位置上的數(shù)值; Q Q4是最后一個數(shù),即是
23、最后一個數(shù),即最大值最大值。 則四分位差為:則四分位差為:13QQQ413n41n21412nn見第見第33頁的例題頁的例題三、方差和標準差三、方差和標準差(一)概念(一)概念 各變量值與其算術(shù)平均數(shù)各變量值與其算術(shù)平均數(shù)離差離差平方平方的的算術(shù)平均數(shù)算術(shù)平均數(shù)叫方差;叫方差;方差的方根就是標準差。方差的方根就是標準差。 注意:注意:由于標準差與變量值的單位相同,其實際意義要比方由于標準差與變量值的單位相同,其實際意義要比方差清楚,因此在對社會經(jīng)濟現(xiàn)象進行分析時,更多使用標準差。差清楚,因此在對社會經(jīng)濟現(xiàn)象進行分析時,更多使用標準差。 (1 1)總體方差()總體方差(2) 對于未分組資料對于未
24、分組資料 對于分組數(shù)據(jù)對于分組數(shù)據(jù)(組距式變量數(shù)列要先計算出各組組中組距式變量數(shù)列要先計算出各組組中值來作為各組的變量值值來作為各組的變量值 X ) ) NXX22FFXX22(二)計算(二)計算 1、總體方差(總體方差(2)和總體標準差()和總體標準差() (2 2)總體標準差()總體標準差() 對于未分組資料:對于未分組資料: 對于分組數(shù)據(jù):對于分組數(shù)據(jù):NXX2FFXX22、樣本方差(樣本方差( )和樣本標準差()和樣本標準差( ) (1)樣本方差樣本方差 對于未分組資料:對于未分組資料: 對于分組數(shù)據(jù)對于分組數(shù)據(jù)(組距式變量數(shù)列要先計算出各組組中值組距式變量數(shù)列要先計算出各組組中值來作
25、為各組的變量值來作為各組的變量值 X ) ) 2SS1s22nxx1s22ffxx * * 樣本的方差和標準差為什么要除以樣本次數(shù)減樣本的方差和標準差為什么要除以樣本次數(shù)減1,見教,見教材的解釋。材的解釋。(2)樣本標準差樣本標準差 對于未分組資料:對于未分組資料: 對于分組數(shù)據(jù):對于分組數(shù)據(jù):1s2nxx1s2ffxx見第見第35頁的例題頁的例題 根據(jù)分組資料計算標準差的步驟:根據(jù)分組資料計算標準差的步驟: 第一、若是組距式變量數(shù)列,應(yīng)先計算出各組組中值;第一、若是組距式變量數(shù)列,應(yīng)先計算出各組組中值; 第二、計算算術(shù)平均數(shù);第二、計算算術(shù)平均數(shù); 第三、計算各組標志值與其算術(shù)平均數(shù)的離差;
26、第三、計算各組標志值與其算術(shù)平均數(shù)的離差; 第四、取離差的平方;第四、取離差的平方; 第五、對離差的平方求算術(shù)平均數(shù)。第五、對離差的平方求算術(shù)平均數(shù)。注意:注意: 1、當樣本的次數(shù)當樣本的次數(shù)n很大(一般是大于等于很大(一般是大于等于30時),樣本方差與總體方時),樣本方差與總體方差的計算結(jié)果相差很小,這時樣本方差也可以用總體方差來計算。差的計算結(jié)果相差很小,這時樣本方差也可以用總體方差來計算。 2、標準差(方差)是通過各變量值到其算術(shù)平均數(shù)的標準差(方差)是通過各變量值到其算術(shù)平均數(shù)的平均距離平均距離來反來反映該組中各數(shù)據(jù)之間的差異程度的。標準差(方差)值越大,表示各變映該組中各數(shù)據(jù)之間的差
27、異程度的。標準差(方差)值越大,表示各變量值到他們的算術(shù)平均數(shù)的平均距離越遠,數(shù)據(jù)越分散;標準差(方差)量值到他們的算術(shù)平均數(shù)的平均距離越遠,數(shù)據(jù)越分散;標準差(方差)值越小,表示各變量值到他們的算術(shù)平均數(shù)的平均距離越短,數(shù)據(jù)越集值越小,表示各變量值到他們的算術(shù)平均數(shù)的平均距離越短,數(shù)據(jù)越集中。中。四、四、 離散系數(shù)離散系數(shù) 全距和標準差的共同特點:全距和標準差的共同特點: 1、它們都是有單位的數(shù),其單位與變量值的單位相同。、它們都是有單位的數(shù),其單位與變量值的單位相同。 2、它們都能較好地反映、它們都能較好地反映一組一組數(shù)的離散程度,但要比較數(shù)的離散程度,但要比較多組多組數(shù)數(shù) 的離散程度時,
28、如果通過計算以上各指標來比較,則要求的離散程度時,如果通過計算以上各指標來比較,則要求 這幾組數(shù)的這幾組數(shù)的計量單位計量單位和和平均數(shù)平均數(shù)都必須相等。都必須相等。 要比較幾組要比較幾組平均水平平均水平或或計量單位計量單位不同的數(shù)據(jù)的離散程度時,不同的數(shù)據(jù)的離散程度時,不能通過計算以上各指標來比較,而應(yīng)該計算各組的離散系數(shù)來不能通過計算以上各指標來比較,而應(yīng)該計算各組的離散系數(shù)來比較。比較。 離散系數(shù):離散系數(shù):某組數(shù)的標準差除以該組數(shù)的算術(shù)某組數(shù)的標準差除以該組數(shù)的算術(shù)平均數(shù)。平均數(shù)。 計算出各組離散系數(shù)后,離散系數(shù)大的組差異程度大;計算出各組離散系數(shù)后,離散系數(shù)大的組差異程度大;離散系數(shù)小
29、的組差異程度小。離散系數(shù)小的組差異程度小。樣本總體 %100 %100 xssVXV見第見第36頁的例題頁的例題第三節(jié)第三節(jié) 數(shù)據(jù)分布偏態(tài)與峰度的測定數(shù)據(jù)分布偏態(tài)與峰度的測定一、偏態(tài)及其測定一、偏態(tài)及其測定 1 1、概念、概念 偏態(tài)是對數(shù)據(jù)分布偏斜方向及程度的測定。偏態(tài)是對數(shù)據(jù)分布偏斜方向及程度的測定。 2、偏態(tài)系數(shù)的計算公式、偏態(tài)系數(shù)的計算公式 偏斜程度:偏斜程度:SK 越大,偏斜程度越大;越大,偏斜程度越大; SK 越小,偏斜程度越小。越小,偏斜程度越小。 偏斜方向:偏斜方向: SK大于零,右偏分布;大于零,右偏分布; SK等于零,對稱分布;等于零,對稱分布; SK小于零,左偏分布。小于零
30、,左偏分布。)( 33fnnsfxx SK見第見第37-38頁例頁例2.3二、峰度二、峰度(一)概念(一)概念 峰度是指次數(shù)分布曲線尖峭的程度。它是與標準正態(tài)分布曲峰度是指次數(shù)分布曲線尖峭的程度。它是與標準正態(tài)分布曲線相對而言的,標準正態(tài)分布曲線的峰頂,叫正態(tài)峰;比標準線相對而言的,標準正態(tài)分布曲線的峰頂,叫正態(tài)峰;比標準正態(tài)分布曲線峰頂高的為尖頂峰;比標準正態(tài)分布曲線峰頂扁正態(tài)分布曲線峰頂高的為尖頂峰;比標準正態(tài)分布曲線峰頂扁平的為平頂峰。平的為平頂峰。尖頂峰尖頂峰與標準正態(tài)與標準正態(tài)分布比較!分布比較?。ǘ┓宥鹊臏y定(二)峰度的測定 峰度是通過峰度系數(shù)來測定的。峰度是通過峰度系數(shù)來測定的
31、。)( 3- 44fnnsfxxK 峰頂類型:峰頂類型: 當當 K 大于大于0,尖頂峰;,尖頂峰; 當當 K等于等于0,正態(tài)峰;,正態(tài)峰; 當當 K小于小于0,平頂峰。,平頂峰。 尖峭程度:尖峭程度: K 越大,尖峭程度越大;越大,尖峭程度越大; K 越小,尖峭程度越小。越小,尖峭程度越小。 見第見第39頁例頁例2.4第四節(jié)第四節(jié) 統(tǒng)計資料的顯示統(tǒng)計資料的顯示一、統(tǒng)計表一、統(tǒng)計表(一)概念(一)概念 統(tǒng)計表是集中而有序地顯示統(tǒng)計資料的表格,它是表現(xiàn)統(tǒng)計表是集中而有序地顯示統(tǒng)計資料的表格,它是表現(xiàn)統(tǒng)計資料和積累統(tǒng)計資料的基本手段。統(tǒng)計資料和積累統(tǒng)計資料的基本手段。(二)統(tǒng)計表的結(jié)構(gòu)(二)統(tǒng)計表的
32、結(jié)構(gòu) 由由表頭、行標題、列標題、數(shù)字資料表頭、行標題、列標題、數(shù)字資料和和附加附加五部分組五部分組成。成。 見第見第40頁表頁表2.16(三)編制統(tǒng)計表時應(yīng)注意的問題(三)編制統(tǒng)計表時應(yīng)注意的問題 總體上看:總體上看:科學、實用、簡練、美觀科學、實用、簡練、美觀 具體來說具體來說: 1 文字要簡練,應(yīng)使統(tǒng)計表的橫豎長度比例適當文字要簡練,應(yīng)使統(tǒng)計表的橫豎長度比例適當(10:7)。)。 2 如果全表只有一個單位,就寫在表的右上方。若各指如果全表只有一個單位,就寫在表的右上方。若各指 標的計量單位不同,則應(yīng)放在每個指標后(列標題標的計量單位不同,則應(yīng)放在每個指標后(列標題 的單位)或單獨列出一列(
33、行標題的單位)標明。的單位)或單獨列出一列(行標題的單位)標明。3 表的上下線要用粗線或雙線畫出,中間用細線。左右兩表的上下線要用粗線或雙線畫出,中間用細線。左右兩 端不能畫縱線封口。列與列之間要用豎線畫出,行與行端不能畫縱線封口。列與列之間要用豎線畫出,行與行 之間盡可能不用橫線。之間盡可能不用橫線。4 表中數(shù)據(jù)一般右對齊,有小數(shù)點的以小數(shù)點對齊,小數(shù)表中數(shù)據(jù)一般右對齊,有小數(shù)點的以小數(shù)點對齊,小數(shù) 的位數(shù)應(yīng)統(tǒng)一。對于沒有數(shù)據(jù)的用的位數(shù)應(yīng)統(tǒng)一。對于沒有數(shù)據(jù)的用“”表示,對于數(shù)字表示,對于數(shù)字 太小,可以忽略不計或數(shù)據(jù)不詳時用太小,可以忽略不計或數(shù)據(jù)不詳時用“”表示。表示。5 在統(tǒng)計表的下方注
34、明資料的來源、指標的注釋和必要的在統(tǒng)計表的下方注明資料的來源、指標的注釋和必要的 說明等內(nèi)容。說明等內(nèi)容。二、統(tǒng)計圖二、統(tǒng)計圖(一)線圖(一)線圖 線圖是在平面坐標上用折線表現(xiàn)事物的數(shù)量隨時間變化線圖是在平面坐標上用折線表現(xiàn)事物的數(shù)量隨時間變化的統(tǒng)計圖。的統(tǒng)計圖。 統(tǒng)計圖多種多樣,前面講過的直方圖、折線圖等也是統(tǒng)統(tǒng)計圖多種多樣,前面講過的直方圖、折線圖等也是統(tǒng)計圖。在計圖。在Excel中有各種統(tǒng)計圖。中有各種統(tǒng)計圖。020004000600019911992199319941995199619971998城鎮(zhèn)居民農(nóng)村居民收收入入 (元)(元) 圖圖3-14 3-14 城鄉(xiāng)居民家庭人均收入城鄉(xiāng)居
35、民家庭人均收入(二)條形圖(二)條形圖 條形圖是用寬度相同的條形的高度或長短來表示數(shù)據(jù)變條形圖是用寬度相同的條形的高度或長短來表示數(shù)據(jù)變動的圖形??梢詸M置,也可縱置??v置時也稱為柱形圖;可動的圖形??梢詸M置,也可縱置??v置時也稱為柱形圖;可以是立體的,也可以是平面的。以是立體的,也可以是平面的。 注意:注意:條形圖與直方圖的區(qū)別:條形圖與直方圖的區(qū)別:1、條形圖寬度相同,而條形圖寬度相同,而直方圖寬度不一定相同(如異距數(shù)列);直方圖寬度不一定相同(如異距數(shù)列);2、條形圖之間是條形圖之間是間隔的,而直方圖之間是靠攏的。間隔的,而直方圖之間是靠攏的。人數(shù)(人)人數(shù)(人)5191610211204
36、080120 商品廣告 服務(wù)廣告 金融廣告 房地產(chǎn)廣告 招生招聘廣告 其他廣告廣廣告告類類型型 圖圖3-1 3-1 某城市居民關(guān)注不同類型廣告的人數(shù)分布某城市居民關(guān)注不同類型廣告的人數(shù)分布0200400600800100012001400產(chǎn) 量 103t1989199019951998199920002001年 份大黃魚小黃魚帶魚魚(三)圓形圖(餅圖)和環(huán)形圖(三)圓形圖(餅圖)和環(huán)形圖 1、圓形圖(餅圖):圓形圖(餅圖):它是用圓形及圓內(nèi)扇形面積來表示數(shù)它是用圓形及圓內(nèi)扇形面積來表示數(shù)值大小的圖形。值大小的圖形。 2、環(huán)形圖:環(huán)形圖:環(huán)形圖中間有一個環(huán)形圖中間有一個“空洞空洞”,總體中的每一
37、部,總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示。分數(shù)據(jù)用環(huán)中的一段表示。 區(qū)別:區(qū)別:圓形圖只能顯示一個總體各部分所占的比例,而環(huán)圓形圖只能顯示一個總體各部分所占的比例,而環(huán)形圖可顯示多個總體各部分所占的相應(yīng)比例。形圖可顯示多個總體各部分所占的相應(yīng)比例。 其他廣告1.0% 房地產(chǎn)廣告8.0% 商品廣告56.0% 金融廣告4.5% 服務(wù)廣告25.5% 招生招聘廣告5.8%某城市居民關(guān)注不同類型廣告的人數(shù)構(gòu)成某城市居民關(guān)注不同類型廣告的人數(shù)構(gòu)成8%36%31%15%7%33%26%21%13%10% 非常不滿意 不滿意 一般 滿意 非常滿意 甲乙兩城市家庭對住房狀況的評價甲乙兩城市家庭對住房狀況的評價(
38、四)莖葉圖(四)莖葉圖1、用于顯示未分組的原始數(shù)據(jù)的分布;用于顯示未分組的原始數(shù)據(jù)的分布;2、由由“莖莖”和和“葉葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的;兩部分構(gòu)成,其圖形是由數(shù)字組成的;3、以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉;以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉;4、樹葉上只保留一位數(shù)字;樹葉上只保留一位數(shù)字;5、莖葉圖類似于橫置的直方圖,但又有區(qū)別:直方圖可觀察莖葉圖類似于橫置的直方圖,但又有區(qū)別:直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值;莖葉圖既一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值;莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留能給出數(shù)據(jù)的分布狀況
39、,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息。了原始數(shù)據(jù)的信息。數(shù)據(jù)見第數(shù)據(jù)見第17頁表頁表2.6。分析結(jié)果見第。分析結(jié)果見第41頁表頁表2.17莖葉圖的擴展莖葉圖的擴展(五)箱線圖(五)箱線圖(box plot)1.用于顯示未分組的原始數(shù)據(jù)的分布。用于顯示未分組的原始數(shù)據(jù)的分布。2.箱線圖由一組數(shù)據(jù)的箱線圖由一組數(shù)據(jù)的5個特征值(個特征值(最大值、最小值、中位數(shù)最大值、最小值、中位數(shù)Me、下四分位數(shù)下四分位數(shù)QL和上四分位數(shù)和上四分位數(shù)QU)繪制而成,它由一個箱子和)繪制而成,它由一個箱子和兩條線段組成。兩條線段組成。3.箱線圖的繪制方法:箱線圖的繪制方法:u排序排序u找出該組數(shù)據(jù)的找出該
40、組數(shù)據(jù)的5個特征值個特征值u連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接相連接 箱線圖的構(gòu)成:箱線圖的構(gòu)成:中位數(shù)中位數(shù)QULX最大值最大值X最小值最小值n以線段、箱體的長短來表示數(shù)據(jù)的分散程度,因為每一段中數(shù)以線段、箱體的長短來表示數(shù)據(jù)的分散程度,因為每一段中數(shù)據(jù)的個數(shù)相等,所以線段、箱體越長就表示數(shù)據(jù)越分散;以中據(jù)的個數(shù)相等,所以線段、箱體越長就表示數(shù)據(jù)越分散;以中位數(shù)的高低來表示平均數(shù)的大?。灰灾形粩?shù)在箱體的位置來表位數(shù)的高低來表示平均數(shù)的大??;以中位數(shù)在箱體的位置來表示分布。示分布。分布的形狀與箱線圖分布的形狀與箱線圖對稱分
41、布對稱分布QL中位數(shù)中位數(shù)左偏分布左偏分布QL中位數(shù)中位數(shù)Q右偏分布右偏分布Q中位數(shù)中位數(shù)例例1 ( (見表見表2.6的數(shù)據(jù)的數(shù)據(jù)) )最小值最小值84最大值最大值128中位數(shù)中位數(shù)105下四分位數(shù)下四分位數(shù)96上四分位數(shù)上四分位數(shù)1098085 90 95 100 105 110 150 120 125 130周加工零件數(shù)的箱線圖周加工零件數(shù)的箱線圖【例【例2】 從某從某大學經(jīng)濟管理大學經(jīng)濟管理專業(yè)二年級學專業(yè)二年級學生中隨機抽取生中隨機抽取11人,對人,對8門門主要課程的考主要課程的考試成績進行調(diào)試成績進行調(diào)查,所得結(jié)果查,所得結(jié)果如表。試繪制如表。試繪制各科考試成績各科考試成績的批比較箱線的批比較箱線圖,并分析各圖,并分析各科考試成績的科考試成績的分布特征分布特征11名學生各科的考試成績數(shù)據(jù)名學生各科的考試成績數(shù)據(jù)課程名稱課程名稱學生編號學生編號1234567891011英語英語經(jīng)濟數(shù)學經(jīng)濟數(shù)學西方經(jīng)濟學西方經(jīng)濟學市場營銷學市場營銷學財務(wù)管理財務(wù)管理基礎(chǔ)會計學基礎(chǔ)會計學統(tǒng)計學統(tǒng)計學計算機應(yīng)用基礎(chǔ)計算機應(yīng)用基礎(chǔ)766593746870558590958187757391789751768570926881717488698465739570786690737884
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學年高中語文課時作業(yè)10燭之武退秦師含解析蘇教版必修3
- 2024年高中歷史第一單元古代中國的政治制度第3課從漢至元政治制度的演變課后作業(yè)含解析新人教版必修1
- 2024年高中化學第三章有機化合物第二節(jié)綜合訓(xùn)練含解析新人教版必修2
- 2024-2025學年新教材高中歷史課時雙測過關(guān)五三國兩晉南北朝的政權(quán)更迭與民族交融含解析新人教版必修中外歷史綱要上
- 八年級班級工作總結(jié)
- 銷售人員個人年度工作總結(jié)
- 三年級第二學期數(shù)學教學計劃
- 2022-2023學年第二學期高一中職數(shù)學期末考試模擬考試答案解析
- 公司商務(wù)合同范本
- 小學信息技術(shù)五年級上冊第2課《插入圖片和藝術(shù)字》說課稿
- 中國古代突騎研究
- 20以內(nèi)進位加法100題(精心整理6套-可打印A4)
- 技術(shù)標(城鎮(zhèn)老舊小區(qū)改造工程)
- 人教版新教材高一上學期期末考試數(shù)學試卷及答案(共五套)
- 山東省各地市地圖課件
- 2022年4月天津高考英語試題-(第一次)
- LH制造中心組織架構(gòu)圖職能
- 醫(yī)院重點崗位工作人員輪崗制度
- (完整版)牧場物語精靈驛站詳細攻略
- 2020年化學品泄漏應(yīng)急演習報告(含現(xiàn)場圖片)
- 建設(shè)工程文明工地申報表
評論
0/150
提交評論