![統(tǒng)計學(xué) 第4章 數(shù)據(jù)的概括性度量_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/18/1814e716-2f0b-496b-b49a-74bf175d2051/1814e716-2f0b-496b-b49a-74bf175d20511.gif)
![統(tǒng)計學(xué) 第4章 數(shù)據(jù)的概括性度量_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/18/1814e716-2f0b-496b-b49a-74bf175d2051/1814e716-2f0b-496b-b49a-74bf175d20512.gif)
![統(tǒng)計學(xué) 第4章 數(shù)據(jù)的概括性度量_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/18/1814e716-2f0b-496b-b49a-74bf175d2051/1814e716-2f0b-496b-b49a-74bf175d20513.gif)
![統(tǒng)計學(xué) 第4章 數(shù)據(jù)的概括性度量_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/18/1814e716-2f0b-496b-b49a-74bf175d2051/1814e716-2f0b-496b-b49a-74bf175d20514.gif)
![統(tǒng)計學(xué) 第4章 數(shù)據(jù)的概括性度量_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/18/1814e716-2f0b-496b-b49a-74bf175d2051/1814e716-2f0b-496b-b49a-74bf175d20515.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、Nankai University1第四章第四章 數(shù)據(jù)的概括性度量數(shù)據(jù)的概括性度量Contents數(shù)據(jù)集中趨勢的度量數(shù)據(jù)集中趨勢的度量1數(shù)據(jù)離散程度的度量數(shù)據(jù)離散程度的度量2數(shù)據(jù)偏態(tài)與峰態(tài)的度量數(shù)據(jù)偏態(tài)與峰態(tài)的度量3Nankai University21.1.數(shù)據(jù)集中趨勢的度量數(shù)據(jù)集中趨勢的度量Nankai University3v 集中趨勢集中趨勢(central tendency)是指一組數(shù)據(jù)向某一中心值靠攏的程度,它反映了一組數(shù)據(jù)中心點的位置所在。v 眾數(shù)眾數(shù)v 中位數(shù)中位數(shù)v 四分位數(shù)四分位數(shù)v 平均數(shù)平均數(shù)Nankai University4眾數(shù)眾數(shù)v 眾數(shù)眾數(shù)(mode)是一組數(shù)據(jù)
2、中出現(xiàn)次數(shù)最多的變量值,用M0表示。v 眾數(shù)主要用于測度分類數(shù)據(jù)的集中趨勢,當(dāng)然也適用于作為順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)集中趨勢的測度值。v 一般情況下,只有在數(shù)據(jù)量較大的情況下,眾數(shù)才有意義v 眾數(shù)是一個位置代表值,它不受數(shù)據(jù)中極端值的影響。從分布的角度看,眾數(shù)是具有明顯集中趨勢點的數(shù)值,一組數(shù)據(jù)分布的最高峰點所對應(yīng)的數(shù)值即為眾數(shù)。v 眾數(shù)可能不存在,也可能有多個。Nankai University5中位數(shù)中位數(shù)v 中位數(shù)中位數(shù)(median)是一組數(shù)據(jù)排序后處于中間位置上的變量值,用Me表示。v 中位數(shù)主要用于測度順序數(shù)據(jù)的集中趨勢,當(dāng)然也適用于測度數(shù)值型數(shù)據(jù)的集中趨勢,但不適用于分類數(shù)據(jù)。v
3、中位數(shù)是一個位置代表值,其特點是不受極端值的影響。Nankai University6v 計算中位數(shù)時,要先對n個數(shù)據(jù)進行排序,然后確定中位數(shù)的位置,最后確定中位數(shù)的具體數(shù)值。v 中位數(shù)位置的確定公式為: 設(shè)一組數(shù)據(jù)按從小到大的順序排序x1,x2,xn,則中位數(shù)為:Nankai University721n中位數(shù)位置為偶數(shù)為奇數(shù)nxxnxMnnne,21,1222)1(四分位數(shù)四分位數(shù)v 四分位數(shù)四分位數(shù)(quartile)也稱四分位點,它是一組數(shù)據(jù)排序后處于25%和75%位置上的值,分別稱為下四分位數(shù)和上四分位數(shù)。v 計算四分位數(shù)時,首先對數(shù)據(jù)進行排序,然后確定四分位數(shù)所在的位置,該位置上的
4、數(shù)值就是四分位數(shù)。v 四分位數(shù)位置的確定方法有幾種*,每種方法得到的結(jié)果會有一定差異,但差異不會很大。設(shè)下四分位數(shù)為QL,上四分位數(shù)為QU,根據(jù)四分位數(shù)定義有 *一種較為準(zhǔn)確的算法是按照下列公式確定位置: , Nankai University84nQL位置43nQU位置41nQL位置4) 1(3nQU位置v 如果位置是整數(shù),四分位數(shù)就是該位置對應(yīng)的值;如果是在0.5的位置上,則取該位置兩側(cè)值的平均數(shù);如果是在0.25或0.75的位置上,則四分位數(shù)等于該位置的下側(cè)值加上按比例分攤位置兩側(cè)數(shù)值的差值。v Q1=第1四分位數(shù),即第25百分位數(shù)v Q2=第2四分位數(shù),即第50百分位數(shù)v Q3=第3四
5、分位數(shù),即第75百分位數(shù)Nankai University9平均數(shù)平均數(shù)v 平均數(shù)平均數(shù)(mean)也稱為均值,它是一組數(shù)據(jù)相加后除以數(shù)據(jù)的個數(shù)得到的結(jié)果。v 平均數(shù)是集中趨勢的最主要測度值,它主要適用于數(shù)值型數(shù)據(jù),而不適用于分類數(shù)據(jù)和順序數(shù)據(jù)。v 根據(jù)未經(jīng)分組數(shù)據(jù)計算的平均數(shù)稱為簡單平均數(shù)簡單平均數(shù)。Nankai University10NxNii1nxxnii1(總體)(樣本)v 根據(jù)分組數(shù)據(jù)計算的平均數(shù)稱為加權(quán)平均數(shù)加權(quán)平均數(shù),設(shè)共分成k組,各組組中值分別用M1,M2,Mk表示,f1,f2,fk表示各組頻數(shù),式中n為樣本量 。v 計算加權(quán)平均數(shù)時,用各組的組中值代表各組的實際數(shù)據(jù),使用這
6、一代表值時是假定各組數(shù)據(jù)在組內(nèi)是均勻分布的,如果實際數(shù)據(jù)與這一假定相吻合,計算的結(jié)果還是比較準(zhǔn)確的,否則誤差會很大。Nankai University11ifnnMfXkiii1v 幾何平均數(shù)幾何平均數(shù)(geometric mean)是n個變量值乘積的n次方根,用G表示。v 計算公式為v 幾何平均數(shù)是適用于特殊數(shù)據(jù)的一種平均數(shù),它主要用于計算平均比率。當(dāng)變量值本身是比率的形式時,采用幾何平均值計算平均比率更為合理。在實際應(yīng)用中,幾何平均數(shù)主要用于計算現(xiàn)象的平均增長率。v 當(dāng)所平均的各比率數(shù)值相差不大時,算術(shù)平均和幾何平均的結(jié)果相差不大,否則二者的差別就很明顯。Nankai University
7、12nniinnxxxxG121v 例例1:調(diào)查:調(diào)查300個人的政黨背景,形成如下數(shù)據(jù)分布結(jié)果個人的政黨背景,形成如下數(shù)據(jù)分布結(jié)果,請問眾數(shù)是什么?,請問眾數(shù)是什么?v 例例2:隨機抽?。弘S機抽取9個學(xué)生,調(diào)查得到的每位學(xué)生的人均月個學(xué)生,調(diào)查得到的每位學(xué)生的人均月花銷數(shù)據(jù)如下,請計算眾數(shù)、中位數(shù)、均值。花銷數(shù)據(jù)如下,請計算眾數(shù)、中位數(shù)、均值。 750 600 820 430 750 1000 550 680 480Nankai University13政黨背景頻數(shù)民主黨90共和黨70無黨派人士140v 例例3:下面是隨機抽取的:下面是隨機抽取的5個家庭的收入:個家庭的收入: 135,456
8、 25,500 32,456 54,365 37,668 請問中位數(shù)和平均值哪個可以更好的作為這組數(shù)據(jù)集請問中位數(shù)和平均值哪個可以更好的作為這組數(shù)據(jù)集中趨勢的代表值?中趨勢的代表值?Nankai University14優(yōu)點優(yōu)點眾數(shù)不受極端值影響眾數(shù)不受極端值影響可應(yīng)用于定性數(shù)據(jù)可應(yīng)用于定性數(shù)據(jù)15缺點缺點一組數(shù)據(jù)可能不存在眾數(shù)有時一組數(shù)據(jù)可能會有一個以上的眾數(shù)眾數(shù)的優(yōu)缺點只有在數(shù)據(jù)量較大的情況下,眾數(shù)才有意義,當(dāng)數(shù)據(jù)量較少時,不宜使用眾數(shù)。眾數(shù)主要適合作為分類數(shù)據(jù)的集中趨勢測度值。優(yōu)點優(yōu)點中位數(shù)不受極端值的中位數(shù)不受極端值的影響影響16缺點缺點需要對數(shù)據(jù)排序,對大樣本將非常繁瑣中位數(shù)的優(yōu)缺點
9、當(dāng)一組數(shù)據(jù)的分布偏斜程度較大時,考慮使用中位數(shù)。中位數(shù)主要適合作為順序數(shù)據(jù)的集中趨勢測度值。優(yōu)點優(yōu)點利用了全部數(shù)據(jù)信息利用了全部數(shù)據(jù)信息一組數(shù)據(jù)只有一個平一組數(shù)據(jù)只有一個平均數(shù)并且組中每個數(shù)均數(shù)并且組中每個數(shù)據(jù)的變化都會影響平據(jù)的變化都會影響平均數(shù)均數(shù)17缺點缺點平均數(shù)受極端值的影響平均數(shù)的優(yōu)缺點對于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差,當(dāng)一組數(shù)據(jù)的分布偏斜程度較大時,考慮使用中位數(shù)或眾數(shù)。平均數(shù)主要適合作為數(shù)值型數(shù)據(jù)的集中趨勢測度值。2.2.數(shù)據(jù)離散程度的度量數(shù)據(jù)離散程度的度量Nankai University18v 數(shù)據(jù)的離散程度離散程度是數(shù)據(jù)分布的另一個重要特征,反映的是各變量值遠離其中心
10、值的程度。v 數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差;離散程度越小,其代表性就越好。v 異眾比率異眾比率v 四分位間距四分位間距v 極差極差v 平均差平均差v 方差、標(biāo)準(zhǔn)差方差、標(biāo)準(zhǔn)差v 變異系數(shù)變異系數(shù)Nankai University19異眾比率異眾比率v 異眾比率異眾比率(variation ratio)是指非眾數(shù)組的頻數(shù)占總頻數(shù)的比例,用Vr表示。v 異眾比率主要適合測度分類數(shù)據(jù)的離散程度,當(dāng)然,對于順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)也可以計算異眾比率。v 異眾比率主要用于衡量眾數(shù)對一組數(shù)據(jù)的代表程度。異眾比率越大,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性越差;異眾
11、比率越小,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越小,眾數(shù)的代表性越好。Nankai University20四分位間距四分位間距v 四分位間距四分位間距( Interquartile Range, IQR )是上四分位數(shù)與下四分位數(shù)之差。v 四分位間距主要用于測度順序數(shù)據(jù)的離散程度,對于數(shù)值型數(shù)據(jù)也可以計算四分位間距,但并不適合分類數(shù)據(jù)。v 四分位間距反映了中間50%數(shù)據(jù)的離散程度,其數(shù)值越小,說明中間的數(shù)據(jù)越集中;其數(shù)值越大,說明中間的數(shù)據(jù)越分散。v 四分位間距不受極值的影響。Nankai University21極差極差v 測度數(shù)值型數(shù)據(jù)離散程度的方法主要有極差、平均差、方測度數(shù)值型數(shù)據(jù)離散程
12、度的方法主要有極差、平均差、方差和標(biāo)準(zhǔn)差。差和標(biāo)準(zhǔn)差。v 一組數(shù)據(jù)的最大值與最小值之差稱為極差極差(range),也稱全距,通常用R表示。v 極差是描述數(shù)據(jù)離散程度的最簡單測度值,計算簡單,易于理解,但它容易受極端值的影響。v 由于極差只利用了一組數(shù)據(jù)兩端的信息,不能反映出中間數(shù)據(jù)的分散情況,因而不能準(zhǔn)確描述出數(shù)據(jù)的分散程度。Nankai University22平均差平均差v 平均差平均差(mean deviation)也稱平均絕對離差平均絕對離差(mean absolute deviation),它是各變量值與其平均數(shù)離差的絕對值的平均數(shù),用Md表示。 根據(jù)未分組數(shù)據(jù)計算平均差: 根據(jù)分組
13、數(shù)據(jù)計算平均差:v 平均差以平均數(shù)為中心,反映了每個數(shù)據(jù)與平均數(shù)的平均差異程度。平均差越大,說明數(shù)據(jù)的離散程度越大;反之則說明數(shù)據(jù)的離散程度越小。v 為了避免離差之和等于零而無法計算平均差這一問題,平均差以離差的絕對值來表示總離差,這就給計算帶來了不便,因而在實際中應(yīng)用較少。Nankai University23niidxxnM11kiiidxMfnM11方差、標(biāo)準(zhǔn)差方差、標(biāo)準(zhǔn)差v方差方差(variance)是各變量值與其平均數(shù)離差平方的平均數(shù)。 根據(jù)未分組數(shù)據(jù)計算方差: 根據(jù)分組數(shù)據(jù)計算方差:Nankai University24樣本方差NXnii122)(1)(122nXXsnii總體方差
14、樣本方差NMfkiii122)(1)(122nXMfskiii總體方差v 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standard deviation)為方差的平方根。 根據(jù)未分組數(shù)據(jù)計算標(biāo)準(zhǔn)差: 根據(jù)分組數(shù)據(jù)計算標(biāo)準(zhǔn)差:v 方差和標(biāo)準(zhǔn)差能較好的反映出數(shù)據(jù)的離散程度,是實際中應(yīng)用最廣的離散程度測度值。Nankai University25樣本標(biāo)準(zhǔn)差niiXN12)(1niiXXns12)(11總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差kiiiMfN12)(1kiiiXMfns12)(11總體標(biāo)準(zhǔn)差v 方差、標(biāo)準(zhǔn)差都是變異性、離散度的量度。v 方差、標(biāo)準(zhǔn)差越大,數(shù)值分布越廣,則數(shù)值之間的相互差異越大。v 方差、標(biāo)準(zhǔn)差對極值很敏感。v 標(biāo)準(zhǔn)差以
15、最初的計算單位存在,方差以平方單位存在。Nankai University26變異系數(shù)變異系數(shù)v 變異系數(shù)變異系數(shù)(coefficient of variation)也稱為離散系數(shù),是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比。v 變異系數(shù)是測度數(shù)據(jù)離散程度的相對統(tǒng)計量,它是一個無量綱的量,主要是用于比較不同樣本數(shù)據(jù)的離散程度。v 變異系數(shù)大,說明數(shù)據(jù)的離散程度也大;變異系數(shù)小,說明數(shù)據(jù)的離散程度也小。* *注意:當(dāng)平均數(shù)接近零時,離散系數(shù)的值趨于增大,此時必須慎重解釋。Nankai University27xsv 3.3.數(shù)據(jù)偏態(tài)與峰態(tài)的度量數(shù)據(jù)偏態(tài)與峰態(tài)的度量Nankai University28v
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 加工安裝服務(wù)合同范本
- 別墅家具購買合同范本
- 公司舊車銷售合同范例
- 乙方工地材料合同范例
- 養(yǎng)生館共享店鋪合同范例
- 電源防雷插座板行業(yè)深度研究報告
- 中國電動拉鉚槍項目投資可行性研究報告
- led設(shè)備購買合同范本
- 制種水稻合同范本
- 公司外聘員工合同范例
- 2023年上海青浦區(qū)區(qū)管企業(yè)統(tǒng)一招考聘用筆試題庫含答案解析
- 2023版押品考試題庫必考點含答案
- 植物之歌觀后感
- 空氣能熱泵安裝示意圖
- 建筑工程施工質(zhì)量驗收規(guī)范檢驗批填寫全套表格示范填寫與說明
- 2020年中秋國慶假日文化旅游市場安全生產(chǎn)檢查表
- 昆明天大礦業(yè)有限公司尋甸縣金源磷礦老廠箐-小凹子礦段(擬設(shè))采礦權(quán)出讓收益評估報告
- 心有榜樣行有力量 -從冬奧冠軍徐夢桃身上感受青春奮斗初中主題班會
- GB/T 3860-1995文獻敘詞標(biāo)引規(guī)則
- 七年級英語下冊閱讀理解10篇
- 設(shè)計質(zhì)量、進度保證措施
評論
0/150
提交評論