




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第四章 數(shù)據(jù)分布特征的測度第一節(jié) 集中趨勢的測度 第二節(jié) 離散程度的測度第三節(jié) 偏態(tài)與峰度的測度學(xué)習(xí)目標(biāo)1.集中趨勢各測度值的計算方法2.集中趨勢不同測度值的特點(diǎn)和應(yīng)用場合3.離散程度各測度值的計算方法4.離散程度不同測度值的特點(diǎn)和應(yīng)用場合5.偏態(tài)與峰度測度方法6.用Excel計算描述統(tǒng)計量并進(jìn)行分析數(shù)據(jù)分布的特征集中趨勢 (位置)離中趨勢 (分散程度)偏態(tài)和峰度(形狀)數(shù)據(jù)分布的特征和測度數(shù)據(jù)的特征和測度分布的形狀集中趨勢離散程度眾 數(shù)中位數(shù)均 值離散系數(shù)方差和標(biāo)準(zhǔn)差峰 度四分位差異眾比率偏 態(tài)第一節(jié) 集中趨勢的測度一. 定類數(shù)據(jù):眾數(shù)二. 定序數(shù)據(jù):中位數(shù)和分位數(shù)三. 定距和定比數(shù)據(jù):均值
2、四. 眾數(shù)、中位數(shù)和均值的比較定類數(shù)據(jù):眾數(shù)(概念要點(diǎn))集中趨勢的測度值之一;出現(xiàn)次數(shù)最多的變量值;對于定類變量,以眾值作預(yù)測所犯的錯誤總數(shù)是最小的;不受極端值的影響;可能沒有眾數(shù)或有幾個眾數(shù);主要用于定類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。眾數(shù)(眾數(shù)的不唯一性)無眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8一個眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5多于一個眾數(shù)原始數(shù)據(jù): 25 28 28 36 42 42定序數(shù)據(jù)的眾數(shù)(算例)【例】根據(jù)第三章表3-2中的數(shù)據(jù),計算眾數(shù)解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即
3、Mo不滿意表3-2 甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù) (戶)百分比 (%) 非常不滿意 不滿意 一般 滿意 非常滿意24108934530836311510合計300100.0數(shù)值型分組數(shù)據(jù)的眾數(shù)(要點(diǎn)及計算公式)1. 眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)4. 該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布2. 相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)Mo3. 相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMo數(shù)值型分組數(shù)據(jù)的眾數(shù)(算例)表3-5 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)10511011011511512012012512513013
4、0135135140358141064381630404650合計50【例4.1】根據(jù)第三章表3-5中的數(shù)據(jù),計算50名工人日加工零件數(shù)的眾數(shù)中位數(shù)(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù)的中位數(shù)(計算公式)數(shù)值型未分組數(shù)據(jù)的中位數(shù) (5個數(shù)據(jù)的算例)原始數(shù)據(jù): 24 22 21 26 20排 序: 20 21 22 24 26位 置: 1 2 3 4 5中位數(shù) 22數(shù)值型未分組數(shù)據(jù)的中位數(shù) (6個數(shù)據(jù)的算例)原始數(shù)據(jù): 10 5 9 12 6 8排 序: 5 6 8 9 10 12位 置: 1 2 3 4 5 6位置N+126+123.5中位數(shù)8 + 928.5根據(jù)位置公式確定中位
5、數(shù)所在的組采用下列近似公式計算:3. 該公式假定中位數(shù)組的頻數(shù)在該組內(nèi)均勻分布數(shù)值型分組數(shù)據(jù)的中位數(shù)(要點(diǎn)及計算公式)數(shù)值型分組數(shù)據(jù)的中位數(shù)(算例)表3-5 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計50【例4.3】根據(jù)第三章表3-5中的數(shù)據(jù),計算50 名工人日加工零件數(shù)的中位數(shù)四分位數(shù)(概念要點(diǎn))1.集中趨勢的測度值之一2.排序后處于25%和75%位置上的值3. 不受極端值的影響4. 主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)Q
6、LQMQU25%25%25%25%四分位數(shù)(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置 =N+14上四分位數(shù)(QU)位置 =3(N+1)4下四分位數(shù)(QL)位置 =N4上四分位數(shù)(QL)位置 =3N4數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (7個數(shù)據(jù)的算例)原始數(shù)據(jù): 23 21 30 32 28 25 26排 序: 21 23 25 26 28 30 32位 置: 1 2 3 4 5 6 7 N+1QL= 237+1QL位置 =4=4= 2QU位置 =3(N+1)43(7+1)4 = 6QU = 30數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (6個數(shù)據(jù)的算例)原始數(shù)據(jù): 23 21 30 28 25
7、 26排 序: 21 23 25 26 28 30位 置: 1 2 34 5 6QL= 21+0.75(23-21) = 22. 5QL位置 =N+14=6+14= 1.75QU位置 =3(N+1)43(6+1)4= 5.25QU = 28+0.25(30-28) = 28.5數(shù)值型分組數(shù)據(jù)的四分位數(shù)(算例)QL位置50/412.5QU位置350/437.5表3-5 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計50【例4.6】根據(jù)第三章表3-5中
8、的數(shù)據(jù),計算50 名工人日加工零件數(shù)的四分位數(shù)定距和定比數(shù)據(jù):均值(概念要點(diǎn))集中趨勢的測度值之一;最常用的測度值;一組數(shù)據(jù)的均衡點(diǎn)所在;易受極端值的影響;用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù);以均值估計數(shù)量型變量的資料,錯誤最小。均值(計算公式)設(shè)一組數(shù)據(jù)為:X1 ,X2 , ,XN 簡單均值的計算公式為設(shè)分組后的數(shù)據(jù)為:X1 ,X2 , ,XK 相應(yīng)的頻數(shù)為: F1 , F2, ,F(xiàn)K加權(quán)均值的計算公式為簡單均值(算例)原始數(shù)據(jù):10591368加權(quán)均值(算例)表4-1 某車間50名工人日加工零件均值計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi1051101101151151
9、20120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計506160.0【例4.7】根據(jù)第三章表3-5中的數(shù)據(jù),計算50 名工人日加工零件數(shù)的均值加權(quán)均值(權(quán)數(shù)對均值的影響) 甲乙兩組各有10名學(xué)生,他們的考試成績及其分布數(shù)據(jù)如下 甲組: 考試成績(X ): 0 20 100 人數(shù)分布(F ):1 1 8 乙組: 考試成績(X ): 0 20 100 人數(shù)分布(F ):8 1 1X甲01+201+1008n10i=1Xi 82(分)X
10、乙08+201+1001n10i=1Xi 12(分)調(diào)和平均數(shù)(概念要點(diǎn))1.集中趨勢的測度值之一2.均值的另一種表現(xiàn)形式3.易受極端值的影響4.用于定比數(shù)據(jù)5. 不能用于定類數(shù)據(jù)和定序數(shù)據(jù)6. 計算公式為調(diào)和平均數(shù)(算例)表4-3 某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價格(元) Xi成交額(元) XiFi成交量(公斤)Fi甲乙丙1.200.500.801800012500640015000250008000合計3690048000【例4.8】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表4-2,計算三種蔬菜該日的平均批發(fā)價格幾何平均數(shù)(概念要點(diǎn))1. 集中趨勢的測度值之一2. N 個變量值乘積的
11、N 次方根3. 適用于特殊的數(shù)據(jù)4. 主要用于計算平均發(fā)展速度5. 計算公式為6. 可看作是均值的一種變形幾何平均數(shù)(算例) 【例4.10】一位投資者持有一種股票,1996年、1997年、1998年和1999年收益率分別為4.5%、2.0%、3.5%、5.4%。計算該投資者在這四年內(nèi)的平均收益率。平均收益率103.84%-1=3.84%眾數(shù)、中位數(shù)和均值的關(guān)系對稱分布 均值= 中位數(shù)= 眾數(shù)左偏分布均值 中位數(shù) 眾數(shù)右偏分布眾數(shù) 中位數(shù) 均值數(shù)據(jù)類型與集中趨勢測度值表4-4 數(shù)據(jù)類型和所適用的集中趨勢測度值數(shù)據(jù)類型定類數(shù)據(jù) 定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)適用的測度值眾數(shù)中位數(shù)均值均值四分位數(shù)眾數(shù)調(diào)和
12、平均數(shù)眾數(shù)中位數(shù)幾何平均數(shù)四分位數(shù) 中位數(shù)四分位數(shù)眾數(shù)第二節(jié) 離散程度的測度一. 定類數(shù)據(jù):異眾比率二. 定序數(shù)據(jù):四分位差三. 定距和定比數(shù)據(jù):方差及標(biāo)準(zhǔn)差四. 相對離散程度:離散系數(shù)離中趨勢數(shù)據(jù)分布的另一個重要特征;離中趨勢或離散程度是對數(shù)據(jù)離散程度所作的描述;反映個案與個案之間的差異情況;它從另一個側(cè)面說明了集中趨勢測度值的代表程度;不同類型的數(shù)據(jù)有不同的離散程度測度值。定類數(shù)據(jù):異眾比率(概念要點(diǎn))1.離散程度的測度值之一2.非眾數(shù)組的頻數(shù)占總頻數(shù)的比率3.計算公式為 4. 用于衡量眾數(shù)的代表性異眾比率(算例)表3-1 某城市居民關(guān)注廣告類型的頻數(shù)分布 廣告類型人數(shù)(人)頻率(%) 商
13、品廣告 服務(wù)廣告 金融廣告 房地產(chǎn)廣告 招生招聘廣告 其他廣告1125191610256.025.54.58.05.01.0合計200100【例4.11】根據(jù)第三章表3-1中的數(shù)據(jù),計算異眾比率解: 在所調(diào)查的200人當(dāng)中,關(guān)注非商品廣告的人數(shù)占44%,異眾比率還是比較大。因此,用“商品廣告”來反映城市居民對廣告關(guān)注的一般趨勢,其代表性不是很好 Vr = 200 - 112200 = 1 - 112 200 = 0.44 = 44%定序數(shù)據(jù):四分位差(概念要點(diǎn))1.離散程度的測度值之一2.也稱為內(nèi)距或四分間距3.上四分位數(shù)與下四分位數(shù)之差 QD = QU - QL4.反映了中間50%數(shù)據(jù)的離散
14、程度5.不受極端值的影響6.用于衡量中位數(shù)的代表性四分位差(定序數(shù)據(jù)的算例)【例4.12】根據(jù)第三章表3-2中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位差解:設(shè)非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 已知 QL = 不滿意 = 2, QU = 一般 = 3四分位差: QD = QU = QL = 3 2 = 1表3-2 甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù) (戶)累計頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意2410893453024132225270300合計300定距和定比數(shù)據(jù):極差(概念要點(diǎn)及計算公式)1. 一組數(shù)據(jù)的最大值與最小值
15、之差2. 離散程度的最簡單測度值3. 易受極端值影響4. 未考慮數(shù)據(jù)的分布7891078910未分組數(shù)據(jù) R = max(Xi) - min(Xi).=組距分組數(shù)據(jù) R 最高組上限 - 最低組下限5. 計算公式為平均差(概念要點(diǎn)及計算公式)1. 離散程度的測度值之一2. 各變量值與其均值離差絕對值的平均數(shù)3. 能全面反映一組數(shù)據(jù)的離散程度4. 數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少5. 計算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)方差和標(biāo)準(zhǔn)差(概念要點(diǎn))1.離散程度的測度值之一2.最常用的測度值3.反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方
16、差或標(biāo)準(zhǔn)差4 6 8 10 12X = 8.3總體方差和標(biāo)準(zhǔn)差(計算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標(biāo)準(zhǔn)差的計算公式總體標(biāo)準(zhǔn)差(計算過程及結(jié)果)表4-6 某車間50名工人日加工零件標(biāo)準(zhǔn)差計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)(Xi- X )2(Xi- X )2Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86
17、184.90518.94817.96合計503100.5【例4.14】根據(jù)第三章表3-5中的數(shù)據(jù),計算工人日加工零件數(shù)的標(biāo)準(zhǔn)差樣本方差和標(biāo)準(zhǔn)差(計算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標(biāo)準(zhǔn)差的計算公式樣本方差自由度(degree of freedom)1.一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)2.當(dāng)樣本數(shù)據(jù)的個數(shù)為 n 時,若樣本均值x 確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值3.例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,
18、比如x1=6,x2=7,那么x3則必然取2,而不能取其他值4.樣本方差用自由度去除,其原因可從多方面來解釋,從實(shí)際應(yīng)用角度看,在抽樣估計中,當(dāng)用樣本方差去估計總體方差2時,它是2的無偏估計量樣本方差(算例)原始數(shù)據(jù): 10 5 9 13 6 8樣本標(biāo)準(zhǔn)差(算例)樣本標(biāo)準(zhǔn)差原始數(shù)據(jù): 10 5 9 13 6 8標(biāo)準(zhǔn)化值(概念要點(diǎn)和計算公式)也稱標(biāo)準(zhǔn)分?jǐn)?shù)給出某一個值在一組數(shù)據(jù)中的相對位置可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)用于對變量的標(biāo)準(zhǔn)化處理計算公式為相對離散程度:離散系數(shù)(概念要點(diǎn)和計算公式)標(biāo)準(zhǔn)差與其相應(yīng)的均值之比消除了數(shù)據(jù)水平高低和計量單位的影響測度了數(shù)據(jù)的相對離散程度用于對不同組別數(shù)據(jù)離散程度的比較計算公式為離散系數(shù)(實(shí)例和計算過程)表4-7 某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)X1銷售利潤(萬元)X21234567817022039043048065095010008.112.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國藝術(shù)井蓋數(shù)據(jù)監(jiān)測研究報告
- 工傷事故賠償及保險協(xié)議書2025年度范本
- 二零二五年度北京市工商局中小企業(yè)股權(quán)質(zhì)押擔(dān)保服務(wù)合同
- 二零二五年度特色工藝品柜臺租賃服務(wù)協(xié)議
- 二零二五年度學(xué)位論文保密協(xié)議及專利申請保密許可合同
- 項目共建合同范本
- 2025年度水產(chǎn)養(yǎng)殖保險與風(fēng)險管理合作協(xié)議
- 二零二五年度水利工程砌墻勞務(wù)合同
- 二零二五年度股份代持與知識產(chǎn)權(quán)轉(zhuǎn)讓合同
- 二零二五年度購房貸款合同財務(wù)審計合同
- 2024-2025年天津河西區(qū)七年級上學(xué)期期末道德與法治試題(含答案)
- 《藝術(shù)與傳播》課件
- 烹飪安全知識培訓(xùn)課件
- 預(yù)制板粘貼碳纖維加固計算表格
- 2025年海南農(nóng)墾自然資源開發(fā)集團(tuán)有限公司筆試題
- 2025年湖北宜昌枝江金潤源集團(tuán)招聘17人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2023CSCO兒童及青少年白血病診療指南
- 醫(yī)療垃圾轉(zhuǎn)運(yùn)流程
- 礦棉板模板施工合同
- DB31∕T 1148-2019 水量計量差錯的退補(bǔ)水量核算方法
- 2025蛇年元旦晚會
評論
0/150
提交評論