版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第 4 章 數(shù)據(jù)的概括性度量,第 4 章 數(shù)據(jù)的概括性度量,4.1 集中趨勢的度量 4.2 離散程度的度量 4.3 偏態(tài)與峰態(tài)的度量,學(xué)習(xí)目標(biāo),1.掌握集中趨勢各測度值的計算方法 2.掌握離散程度各測度值的計算方法 3.理解偏態(tài)與峰態(tài)的測度方法 4.能熟練運用Excel計算描述統(tǒng)計量并進行分析,4.1 集中趨勢的度量,一. 分類數(shù)據(jù):眾數(shù) 二. 順序數(shù)據(jù):中位數(shù)和分位數(shù) 三. 數(shù)值型數(shù)據(jù):均值 四. 眾數(shù)、中位數(shù)和均值的比較,集中趨勢(Central tendency),一組數(shù)據(jù)向其中心值靠攏的傾向和程度 測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值 不同類型的數(shù)據(jù)用不同的集中趨勢測度值 低層
2、次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù),一、分類數(shù)據(jù):眾數(shù),眾數(shù)(mode),出現(xiàn)次數(shù)最多的變量值 不受極端值的影響 不唯一性:一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù) 主要應(yīng)用于分類數(shù)據(jù),也可以應(yīng)用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù),眾數(shù)(不唯一性),無眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8,一個眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5,多于一個眾數(shù)原始數(shù)據(jù): 25 28 28 36 42 42,分類數(shù)據(jù)的眾數(shù) (例題分析),解:這里的變量為“飲料品牌”,這是個分類變量,不同類型的飲料就是變量值 在所調(diào)查的50人中,購買可口可樂的人數(shù)最多,為15人,占總被調(diào)查人數(shù)
3、的30%,因此眾數(shù)為“可口可樂”這一品牌,即 Mo可口可樂,順序數(shù)據(jù)的眾數(shù) (例題分析),解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量為“回答類別” 甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即 Mo不滿意,二、順序數(shù)據(jù):中位數(shù)和分位數(shù),中位數(shù)(median),排序后處于中間位置上的值,不受極端值的影響 主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù),中位數(shù)(位置的確定),中位數(shù)的確定,設(shè)一組數(shù)據(jù)為 按從小到大排序后為,則中位數(shù)為:,順序數(shù)據(jù)的中位數(shù) (例題分析),解:中位數(shù)的位置為 (300+1)/2150.5 從累計頻數(shù)看,中位數(shù)在“一般”這一組別中。因此 M
4、e=一般,數(shù)值型數(shù)據(jù)的中位數(shù) (9個數(shù)據(jù)的算例),【例】:9個家庭的人均月收入數(shù)據(jù) 原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9,中位數(shù) 1080,數(shù)值型數(shù)據(jù)的中位數(shù) (10個數(shù)據(jù)的算例),【例】:10個家庭的人均月收入數(shù)據(jù) 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 10,四分位數(shù)(quartile),排序后
5、處于25%和75%位置上的值,不受極端值的影響 主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù),四分位數(shù)(位置的確定),順序數(shù)據(jù)的四分位數(shù) (例題分析),解:QL位置= (300)/4 =75 QU位置 =(3300)/4 =225 從累計頻數(shù)看, QL在“不滿意”這一組別中; QU在“一般”這一組別中。因此 QL = 不滿意 QU = 一般,數(shù)值型數(shù)據(jù)的四分位數(shù) (9個數(shù)據(jù)的算例),【例】:9個家庭的人均月收入數(shù)據(jù) 原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1
6、630 2000 位 置: 1 2 3 4 5 6 7 8 9,三、數(shù)值型數(shù)據(jù):均值,均值(mean),1.集中趨勢的最常用測度值 2. 易受極端值的影響 3.用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù),簡單均值與加權(quán)均值(simple mean / weighted mean),設(shè)一組數(shù)據(jù)為: x1 ,x2 , ,xn 各組的組中值為:M1 ,M2 , ,Mk 相應(yīng)的頻數(shù)為: f1 , f2 , ,fk,簡單均值,加權(quán)均值,已改至此!,加權(quán)均值 (例題分析),加權(quán)均值(權(quán)數(shù)對均值的影響),甲乙兩組各有10名學(xué)生,他們的考試成績及其分布數(shù)據(jù)如下 甲組: 考試成績(x ): 0 20 100 人
7、數(shù)分布(f ):1 1 8 乙組: 考試成績(x): 0 20 100 人數(shù)分布(f ):8 1 1,均值(數(shù)學(xué)性質(zhì)),1.各變量值與均值的離差之和等于零,2. 各變量值與均值的離差平方和最小,調(diào)和平均數(shù)(harmonic mean),均值的另一種表現(xiàn)形式 易受極端值的影響 計算公式為,原來只是計算時使用了不同的數(shù)據(jù)!,調(diào)和平均數(shù) (例題分析),【例】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表,計算三種蔬菜該日的平均批發(fā)價格 平均批發(fā)價格=成交額/成交量,幾何平均數(shù)(geometric mean),n 個變量值乘積的 n 次方根 適用于對比率數(shù)據(jù)的平均 主要用于計算平均增長率 計算公式為,5. 可
8、看作是均值的一種變形,幾何平均數(shù) (例題分析),【例】某水泥生產(chǎn)企業(yè)2001年的水泥產(chǎn)量為100萬噸,2002年與2001年相比增長率為9%,2003年與2002年相比增長率為16%,2004年與2003年相比增長率為20%。求各年的年平均增長率。,年平均增長率114.91%-1=14.91%,四、眾數(shù)、中位數(shù)和均值的比較,眾數(shù)、中位數(shù)和均值的關(guān)系(分布角度),眾數(shù)、中位數(shù)和均值的特點和應(yīng)用,眾數(shù) 不受極端值影響 具有不唯一性 數(shù)據(jù)分布偏斜程度較大時應(yīng)用 中位數(shù) 不受極端值影響 數(shù)據(jù)分布偏斜程度較大時應(yīng)用 均值 易受極端值影響 數(shù)學(xué)性質(zhì)優(yōu)良 數(shù)據(jù)對稱分布或接近對稱分布時應(yīng)用,數(shù)據(jù)類型與集中趨勢
9、測度值,4.2 離散程度的度量,分類數(shù)據(jù):異眾比率 順序數(shù)據(jù):四分位差 數(shù)值型數(shù)據(jù):方差及標(biāo)準(zhǔn)差 相對位置的測量:標(biāo)準(zhǔn)分數(shù) 相對離散程度:離散系數(shù),離中趨勢,數(shù)據(jù)分布的另一個重要特征 反映各變量值遠離其中心值的程度(離散程度) 從另一個側(cè)面說明了集中趨勢測度值的代表程度 不同類型的數(shù)據(jù)有不同的離散程度測度值,一、分類數(shù)據(jù):異眾比率,異眾比率(variation ratio),1.對分類數(shù)據(jù)離散程度的測度 2.非眾數(shù)組的頻數(shù)占總頻數(shù)的比率 3.異眾比率計算公式為:,4. 用于衡量眾數(shù)的代表性。異眾比率越大,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性就越差。,異眾比率 (例題分析),解:
10、在所調(diào)查的50人當(dāng)中,購買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂”代表消費者購買飲料品牌的狀況,其代表性不是很好,二、順序數(shù)據(jù):四分位差,四分位差(quartile deviation),對順序數(shù)據(jù)離散程度的測度 也稱為內(nèi)距或四分間距 上四分位數(shù)與下四分位數(shù)之差 QD = QU QL 反映了中間50%數(shù)據(jù)的離散程度,其數(shù)值越小,說明中間的數(shù)據(jù)越集中,數(shù)值越大,說明中間的數(shù)據(jù)越分散。 不受極端值的影響 用于衡量中位數(shù)的代表性,四分位差 (例題分析),解:設(shè)非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 已知 QL = 不滿意 = 2 QU = 一般
11、= 3 四分位差: QD = QU - QL = 3 2 = 1,三、數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差,極差(range),一組數(shù)據(jù)的最大值與最小值之差 離散程度的最簡單測度值 易受極端值影響 未考慮數(shù)據(jù)的分布,R = max(xi) - min(xi),計算公式為,平均差(mean deviation),也稱平均離差,是各變量值與其均值離差絕對值的平均數(shù) 能全面反映一組數(shù)據(jù)的離散程度,平均差越大,說明數(shù)據(jù)的離散程度就越大。 數(shù)學(xué)性質(zhì)較差,實際中應(yīng)用較少,計算公式為,未分組數(shù)據(jù),組距分組數(shù)據(jù),平均差 (例題分析),平均差 (例題分析),含義:每一天的銷售量與平均數(shù)相比, 平均相差17臺,方差和標(biāo)準(zhǔn)差(
12、variance and standard deviation),數(shù)據(jù)離散程度的最常用測度值 反映了各變量值與均值的平均差異 根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標(biāo)準(zhǔn)差,樣本方差和標(biāo)準(zhǔn)差 (simple variance and standard deviation),未分組數(shù)據(jù):,組距分組數(shù)據(jù):,未分組數(shù)據(jù):,組距分組數(shù)據(jù):,方差的計算公式,標(biāo)準(zhǔn)差的計算公式,樣本方差自由度(degree of freedom),一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù) 當(dāng)樣本數(shù)據(jù)的個數(shù)為 n 時,若樣本均值x 確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由
13、取值 例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值 樣本方差用自由度去除,其原因可從多方面來解釋,從實際應(yīng)用角度看,在抽樣估計中,當(dāng)用樣本方差s2去估計總體方差2時, s2是2的無偏估計量,樣本標(biāo)準(zhǔn)差 (例題分析),樣本標(biāo)準(zhǔn)差 (例題分析),含義:每一天的銷售量與平均數(shù)相比, 平均相差21.58臺,四、相對位置的測量:標(biāo)準(zhǔn)分數(shù),標(biāo)準(zhǔn)分數(shù)(standard score),1. 也稱標(biāo)準(zhǔn)化值 2.對某一個值在一組數(shù)據(jù)中相對位置的度
14、量 3. 計算公式為,標(biāo)準(zhǔn)分數(shù)(性質(zhì)),均值等于0 2.方差等于1,標(biāo)準(zhǔn)化值 (例題分析),經(jīng)驗法則,經(jīng)驗法則表明:當(dāng)一組數(shù)據(jù)對稱分布時 約有68%的數(shù)據(jù)在平均數(shù)加減1個標(biāo)準(zhǔn)差的范圍之內(nèi) 約有95%的數(shù)據(jù)在平均數(shù)加減2個標(biāo)準(zhǔn)差的范圍之內(nèi) 約有99%的數(shù)據(jù)在平均數(shù)加減3個標(biāo)準(zhǔn)差的范圍之內(nèi),切比雪夫不等式(Chebyshevs inequality ),如果一組數(shù)據(jù)不是對稱分布,經(jīng)驗法則就不再使用,這時可使用切比雪夫不等式,它對任何分布形狀的數(shù)據(jù)都適用 切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少” 對于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有 的數(shù)據(jù)落在k個標(biāo)準(zhǔn)差之內(nèi)。其中k
15、是大于1的任意值,但不一定是整數(shù),切比雪夫不等式(Chebyshevs inequality ),對于k=2,3,4,該不等式的含義是 至少有75%的數(shù)據(jù)落在平均數(shù)加減2個標(biāo)準(zhǔn)差的范圍之內(nèi) 至少有89%的數(shù)據(jù)落在平均數(shù)加減3個標(biāo)準(zhǔn)差的范圍之內(nèi) 至少有94%的數(shù)據(jù)落在平均數(shù)加減4個標(biāo)準(zhǔn)差的范圍之內(nèi),五、相對離散程度:離散系數(shù),離散系數(shù)(coefficient of variation),1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比 也稱變異系數(shù),是對數(shù)據(jù)相對離散程度的測度,離散系數(shù)大說明離散程度大 3. 計算公式為,離散系數(shù) (例題分析),【 例 】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷
16、售額與銷售利潤的離散程度,離散系數(shù) (例題分析),結(jié)論: 計算結(jié)果表明,v1v2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度,數(shù)據(jù)類型與離散程度測度值,4.3 偏態(tài)與峰態(tài)的測度,一. 偏態(tài)及其測度 二. 峰態(tài)及其測度,偏態(tài)與峰態(tài)分布的形狀,偏態(tài),峰態(tài),一、偏 態(tài),偏態(tài)(skewness),統(tǒng)計學(xué)家Pearson于1895年首次提出 數(shù)據(jù)分布偏斜程度的測度 偏態(tài)系數(shù)=0為對稱分布 偏態(tài)系數(shù) 0為右偏分布 偏態(tài)系數(shù) 0為左偏分布,偏態(tài)系數(shù) (skewness coefficient),根據(jù)原始數(shù)據(jù)計算 根據(jù)分組數(shù)據(jù)計算,偏態(tài)系數(shù) (例題分析),ENTER圖形,偏態(tài)系數(shù) (例題分析),結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù),偏態(tài)與峰態(tài)(從直方圖上觀察),按銷售量分組(臺),結(jié)論:1. 為右偏分布 2. 峰態(tài)適中,某電腦公司銷售量分布的直方圖,ENTER,二、峰 態(tài),峰態(tài)(kurtosis),統(tǒng)計學(xué)家Pearson于1905年首次提出 數(shù)據(jù)分布扁
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代短詩遠和近
- 石河子大學(xué)《通信原理》2023-2024學(xué)年第一學(xué)期期末試卷
- 石河子大學(xué)《葡萄酒市場學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷
- 石河子大學(xué)《大數(shù)據(jù)分析與可視化》2023-2024學(xué)年期末試卷
- 沈陽理工大學(xué)《優(yōu)化理論與方法》2021-2022學(xué)年第一學(xué)期期末試卷
- 腫瘤患者的飲食營養(yǎng)護理
- 沈陽理工大學(xué)《微波技術(shù)與天線》2022-2023學(xué)年第一學(xué)期期末試卷
- 沈陽理工大學(xué)《內(nèi)燃機原理》2022-2023學(xué)年第一學(xué)期期末試卷
- 沈陽理工大學(xué)《機械制造裝備設(shè)計》2022-2023學(xué)年第一學(xué)期期末試卷
- 沈陽理工大學(xué)《高頻電子電路》2021-2022學(xué)年期末試卷
- 代理申辦原產(chǎn)地證委托書
- 辦公室工作的職能定位
- 全套企業(yè)管理流程(文字版)
- 檢驗科規(guī)章制度
- ICC國際商會NCNDA和IMFPA中英文對照可編輯
- 關(guān)于房屋建筑和市政工程界定文件
- 各種表面活性劑耐堿性一覽表
- 我最喜歡的運動英語作文(精選3篇)
- 北師大版小學(xué)四年級數(shù)學(xué)上冊全冊說課稿
- 【中考英語】中考看圖寫話質(zhì)量分析
- 關(guān)于生態(tài)美育的思考-生態(tài)美育3篇
評論
0/150
提交評論