第三章數(shù)據(jù)的基本分析ppt課件_第1頁
第三章數(shù)據(jù)的基本分析ppt課件_第2頁
第三章數(shù)據(jù)的基本分析ppt課件_第3頁
第三章數(shù)據(jù)的基本分析ppt課件_第4頁
第三章數(shù)據(jù)的基本分析ppt課件_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三章第三章數(shù)據(jù)的根本分析數(shù)據(jù)的根本分析 本章提要本章提要算術(shù)平均數(shù)和幾何平均數(shù)的計算算術(shù)平均數(shù)的性質(zhì)極差、方差和規(guī)范差的計算方差與規(guī)范差之間的關(guān)系規(guī)范差的性質(zhì)第一節(jié) 平均值數(shù)據(jù)集中性平均值的計算平均值的計算 平均值平均值mean、average觀測值的平均觀測值的平均程度和集中趨勢的表示程度和集中趨勢的表示 常用的平均值有:常用的平均值有: 算術(shù)平均數(shù)算術(shù)平均數(shù) 幾何平均數(shù)幾何平均數(shù) 調(diào)和平均數(shù)調(diào)和平均數(shù) 眾數(shù)眾數(shù) 中位數(shù)中位數(shù) 百分位數(shù)百分位數(shù)在本專業(yè)的統(tǒng)計和日常任務(wù)中,以算術(shù)平均值和幾何在本專業(yè)的統(tǒng)計和日常任務(wù)中,以算術(shù)平均值和幾何平均值最為常見,運用最頻繁平均值最為常見,運用最頻繁調(diào)和

2、平均數(shù)普通用在速度類問題方面調(diào)和平均數(shù)普通用在速度類問題方面眾數(shù)、中位數(shù)由于計算工具的改良已用得不多眾數(shù)、中位數(shù)由于計算工具的改良已用得不多算術(shù)平均數(shù)算術(shù)平均數(shù)arithmetic mean是最常用的平均值,是最常用的平均值,簡稱為平均值,或均值簡稱為平均值,或均值算術(shù)平均數(shù)有兩種計算方法:算術(shù)平均數(shù)有兩種計算方法: 1、直接法、直接法 2、加權(quán)法、加權(quán)法 在次數(shù)分布表或資料分類的根底上進在次數(shù)分布表或資料分類的根底上進展計算,用加權(quán)法計算得的算術(shù)平均值稱加權(quán)平展計算,用加權(quán)法計算得的算術(shù)平均值稱加權(quán)平均值均值weighted mean或:或:111niixxxnn1 12212.iikkki

3、n xn xn xn xwnnnn1 12212.iikkiikif xf xf xf xwf xffff加權(quán)法第二式中的加權(quán)法第二式中的 是頻數(shù):是頻數(shù): 而而加權(quán)平均值用加權(quán)平均值用 表示,在很多情況下,表示,在很多情況下, 與算術(shù)平與算術(shù)平均值均值 不一定相等,特別是當(dāng)我們用組距式分組法不一定相等,特別是當(dāng)我們用組距式分組法中每一組的組中值作為每一組的組平均值中每一組的組中值作為每一組的組平均值 時更是時更是如此如此 直接法所得到的平均值有兩個根本性質(zhì):直接法所得到的平均值有兩個根本性質(zhì):1、離均差之和為零,用公式表示,即、離均差之和為零,用公式表示,即2、離均差平方和為最小,即、離均差

4、平方和為最小,即其中,其中, 為不等于為不等于 的恣意一個數(shù):的恣意一個數(shù): iiiinnfnn1if wwxix0 xx22x xx aaxxifa用直接法所得到的算術(shù)平均值的這兩個根本性質(zhì)很用直接法所得到的算術(shù)平均值的這兩個根本性質(zhì)很重要,同窗們可以本人加以證明重要,同窗們可以本人加以證明需求指出的是,加權(quán)平均值不具有這兩個根本性質(zhì)需求指出的是,加權(quán)平均值不具有這兩個根本性質(zhì)因此,普通不計算加權(quán)平均值因此,普通不計算加權(quán)平均值對于總體來說,我們通常用對于總體來說,我們通常用 表示其平均數(shù)表示其平均數(shù)當(dāng)總體為有限,且總體容量為當(dāng)總體為有限,且總體容量為 時,總體平均值的時,總體平均值的計算公

5、式為:計算公式為:但普通情況下,總體平均值總是未知的,需求用樣但普通情況下,總體平均值總是未知的,需求用樣本平均值來進展估計,因此,樣本的代表性就顯本平均值來進展估計,因此,樣本的代表性就顯得尤為重要得尤為重要NixN幾何平均值幾何平均值geometric mean主要用于非線性數(shù)主要用于非線性數(shù)據(jù)的統(tǒng)計分析,如增長率、疫病的埋伏期、藥物效據(jù)的統(tǒng)計分析,如增長率、疫病的埋伏期、藥物效價、抗體滴度等的平均值價、抗體滴度等的平均值幾何平均值用幾何平均值用 表示:表示:在實踐計算時可將其轉(zhuǎn)換為對數(shù)方式進展計算:在實踐計算時可將其轉(zhuǎn)換為對數(shù)方式進展計算:分組資料幾何平均值的計算公式為:分組資料幾何平均

6、值的計算公式為:G11212.nnnnGx xxx xx 111211lglglg. lglglgniGxxxxnn11lglgiiGfxn算術(shù)平均數(shù)普通用在加性算術(shù)平均數(shù)普通用在加性additive資料、或稱資料、或稱線性線性linear資料中資料中所謂加性資料或線性資料是指這些資料是可加的,所謂加性資料或線性資料是指這些資料是可加的,或每一個數(shù)據(jù)可分解成假設(shè)干個可加的部分,如或每一個數(shù)據(jù)可分解成假設(shè)干個可加的部分,如人體和動物體的身高、體重等外形性狀,人類和人體和動物體的身高、體重等外形性狀,人類和家畜的生理、生化數(shù)值等,這些資料普通服從或家畜的生理、生化數(shù)值等,這些資料普通服從或近似服從

7、正態(tài)分布近似服從正態(tài)分布幾何平均數(shù)普通用在非加性幾何平均數(shù)普通用在非加性non-additive或非或非線性線性non-linear資料中,如平均增長率、藥資料中,如平均增長率、藥物或疫苗的平均效價、抗體滴度等物或疫苗的平均效價、抗體滴度等調(diào)和平均值調(diào)和平均值harmonic mean普通用在平均速度、普通用在平均速度、“有效群體等方面,其公式為:有效群體等方面,其公式為:12111111.innHxnxxx第二節(jié) 變異數(shù)數(shù)據(jù)離散性變異數(shù)的計算變異數(shù)的計算 變異數(shù)變異數(shù)variable觀測值離散程度的表觀測值離散程度的表示,用來表示平均值代表性的強弱示,用來表示平均值代表性的強弱變異數(shù)大,闡明

8、數(shù)據(jù)離散程度大,平均值的代表性變異數(shù)大,闡明數(shù)據(jù)離散程度大,平均值的代表性差;反之,變異數(shù)小,闡明數(shù)據(jù)離散程度小,平差;反之,變異數(shù)小,闡明數(shù)據(jù)離散程度小,平均值的代表性好均值的代表性好因此,僅用一個平均值作為資料特征值進展統(tǒng)計描因此,僅用一個平均值作為資料特征值進展統(tǒng)計描畫是不夠的,還需求有表示數(shù)據(jù)離散程度描畫的畫是不夠的,還需求有表示數(shù)據(jù)離散程度描畫的統(tǒng)計量統(tǒng)計量常用來表示數(shù)據(jù)離散性的變異數(shù)有以下幾個:常用來表示數(shù)據(jù)離散性的變異數(shù)有以下幾個: 極差極差 方差方差 規(guī)范差規(guī)范差極差極差range R 將資料中的最大值數(shù)據(jù)減去最小值數(shù)據(jù)將資料中的最大值數(shù)據(jù)減去最小值數(shù)據(jù),即為極差即為極差顯然,

9、一批數(shù)據(jù)不論其樣本量有多大,計算極差總顯然,一批數(shù)據(jù)不論其樣本量有多大,計算極差總是只用兩個值,一個最大值,一個最小值,其他是只用兩個值,一個最大值,一個最小值,其他數(shù)據(jù)都沒有用上,因此這是不合理的,也沒有統(tǒng)數(shù)據(jù)都沒有用上,因此這是不合理的,也沒有統(tǒng)計學(xué)意義,樣本與樣本的離散程度也無法進展比計學(xué)意義,樣本與樣本的離散程度也無法進展比較,如以下兩個樣本:較,如以下兩個樣本:23,25,26,31,45,47,48 其極差為其極差為 2523,32,32,34,36,36,48 其極差為其極差為 25顯然第一個樣本的離散程度比第二個樣本要來得大,顯然第一個樣本的離散程度比第二個樣本要來得大,但僅從

10、極差上是看不出來的,由于兩個樣本的極但僅從極差上是看不出來的,由于兩個樣本的極差都等于差都等于 25方差方差variance V s2 合理的方法該當(dāng)使某一個數(shù)據(jù)都參與到計算離差的合理的方法該當(dāng)使某一個數(shù)據(jù)都參與到計算離差的過程中去,將某一個數(shù)據(jù)均與平均值相比較,即過程中去,將某一個數(shù)據(jù)均與平均值相比較,即某一個數(shù)據(jù)均與平均值相減某一個數(shù)據(jù)均與平均值相減顯然有多少個數(shù)據(jù),就有多少個差值,且這些差值顯然有多少個數(shù)據(jù),就有多少個差值,且這些差值之和必為之和必為 0算術(shù)平均數(shù)的第一個性質(zhì)算術(shù)平均數(shù)的第一個性質(zhì)將這些差值平方以后再相加,得到一個值將這些差值平方以后再相加,得到一個值這個值不會等于這個值

11、不會等于 0,且由于各個差值都平方了,其,且由于各個差值都平方了,其中離平均值較遠(yuǎn)的數(shù)值在表現(xiàn)離差時的作用更明中離平均值較遠(yuǎn)的數(shù)值在表現(xiàn)離差時的作用更明顯了顯了2但由于每個樣本在很多情況下不會一樣大,因此應(yīng)但由于每個樣本在很多情況下不會一樣大,因此應(yīng)將這一平方和將這一平方和SS平均一下,以利于比較平均一下,以利于比較如上例的兩批數(shù)據(jù):如上例的兩批數(shù)據(jù):23,25,26,31,45,47,48 其平均值為其平均值為 35離均差平方和為離均差平方和為 SS754,用自在度平均一下,得,用自在度平均一下,得125.66723,32,34,34,37,37,48 其平均值為其平均值為 35離均差平方和

12、為離均差平方和為 SS332,用自在度平均一下,得,用自在度平均一下,得55.333顯然第二個樣本較第一個樣本要集中一些顯然第二個樣本較第一個樣本要集中一些125.667為第一個樣本的方差值S2 55.333為第二個樣本的方差值S2方差值是平方以后的值,因此運用中不太方便規(guī)范差規(guī)范差standard deviation)將方差開一下平方根,得將方差開一下平方根,得上例中,第一個樣本的規(guī)范差為上例中,第一個樣本的規(guī)范差為 11.21 第二個樣本的規(guī)范差為第二個樣本的規(guī)范差為 7.44規(guī)范差由于曾經(jīng)過了開平方,其單位與平均數(shù)是一致規(guī)范差由于曾經(jīng)過了開平方,其單位與平均數(shù)是一致的,因此規(guī)范差是統(tǒng)計學(xué)

13、中經(jīng)常運用的一個值的,因此規(guī)范差是統(tǒng)計學(xué)中經(jīng)常運用的一個值得到平均值和規(guī)范差后,這批數(shù)據(jù)可以用下式來表示:得到平均值和規(guī)范差后,這批數(shù)據(jù)可以用下式來表示:總體:總體: 樣本:樣本: 是參數(shù)是參數(shù) 是統(tǒng)計量是統(tǒng)計量22ss xs2, 2,xs規(guī)范差的計算公式規(guī)范差的計算公式總體規(guī)范差:總體規(guī)范差:樣本規(guī)范差:樣本規(guī)范差:上面兩個式子中,每一個公式的后面部分是如何從上面兩個式子中,每一個公式的后面部分是如何從前面部分變來的,請同窗們作為作業(yè)自行推導(dǎo)前面部分變來的,請同窗們作為作業(yè)自行推導(dǎo)比較兩個公式的不同,我們會發(fā)現(xiàn):總體規(guī)范差用比較兩個公式的不同,我們會發(fā)現(xiàn):總體規(guī)范差用總體含量總體含量 N 來

14、得到,而樣本規(guī)范差那么用來得到,而樣本規(guī)范差那么用 n-1 來來得到得到222iiixxxNNN22211iiixxxxnsnnn-1 在這里稱為自在度degree of freedom df自在度的含義和闡明對于樣本容量為 n 的樣本來說,每一個觀測值都有一個離均差,即 n個離均差,由于受 的限制,只需 n-1個離均差是自在的,有一個離均差失去了自在在統(tǒng)計學(xué)中,假設(shè)某個統(tǒng)計量的計算遭到 k個條件的限制,那么其自在度就為 n-k,在估計樣本方差時遭到了平均數(shù)的限制,因此樣本方差的自在度就是 n-1;估計平均數(shù)時沒有限制條件,因此平均數(shù)的自在度就是 n0 x x樣本方差有一個非常重要的作用,就是

15、用來估計總樣本方差有一個非常重要的作用,就是用來估計總體方差由于體方差由于 ,根據(jù)平均數(shù)的第二個性質(zhì)可,根據(jù)平均數(shù)的第二個性質(zhì)可知,知, 必小于必小于 ,因此如用,因此如用 必定偏小必定偏小將分母改為將分母改為 n-1,那么可適當(dāng)增大,那么可適當(dāng)增大 值,使樣本方值,使樣本方差的數(shù)學(xué)期望更接近于總體方差差的數(shù)學(xué)期望更接近于總體方差因此運用自在度的目的就是為了能用樣本方差更好因此運用自在度的目的就是為了能用樣本方差更好地、無偏地、無偏unbias地估計總體方差地估計總體方差x2ixx2ix2222iixxxsnN來估計2s小樣本資料必需用小樣本資料必需用 n-1來計算方差,即規(guī)范差,大來計算方差

16、,即規(guī)范差,大樣本時樣本時 n與與 n-1相差無幾,因此大樣本時也可用相差無幾,因此大樣本時也可用 n替代替代 n-1由于大小樣本的界限沒有嚴(yán)厲的規(guī)定,因此在普通由于大小樣本的界限沒有嚴(yán)厲的規(guī)定,因此在普通情況下仍宜運用情況下仍宜運用 n-1在普通情況下,樣本方差通常也稱為均方在普通情況下,樣本方差通常也稱為均方Mean of square,用,用 或或 表示之表示之加權(quán)平均數(shù)的規(guī)范差公式:加權(quán)平均數(shù)的規(guī)范差公式:2sMS221iiiif xf xnsn有了平均數(shù)和規(guī)范差,我們就可以用一個比較簡單有了平均數(shù)和規(guī)范差,我們就可以用一個比較簡單的方法來表示一個樣本或一批資料:的方法來表示一個樣本或

17、一批資料:規(guī)范差的特性規(guī)范差的特性變量越離散,規(guī)范差越大;反之,規(guī)范差越大,表變量越離散,規(guī)范差越大;反之,規(guī)范差越大,表示數(shù)據(jù)越離散,資料的變異程度越大示數(shù)據(jù)越離散,資料的變異程度越大各變量加減一個常數(shù),規(guī)范差不變各變量加減一個常數(shù),規(guī)范差不變各變量乘一個常數(shù)各變量乘一個常數(shù) a,規(guī)范差將擴展,規(guī)范差將擴展 a 倍倍,xs n資料服從正態(tài)分布時,觀測值的分布為:資料服從正態(tài)分布時,觀測值的分布為:68.27的數(shù)據(jù)分布在的數(shù)據(jù)分布在 的范圍內(nèi)的范圍內(nèi)95.45的數(shù)據(jù)分布在的數(shù)據(jù)分布在 的范圍內(nèi)的范圍內(nèi)99.73的數(shù)據(jù)分布在的數(shù)據(jù)分布在 的范圍內(nèi)的范圍內(nèi)另外還有兩個非常重要的分布范圍:另外還有兩個非常重要的分布范圍: 內(nèi)包含了內(nèi)包含了95的變量的變量 內(nèi)包含了內(nèi)包含了99的變量的變量231.962.58變異系數(shù)變異系數(shù)coefficient of

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論