基礎(chǔ)統(tǒng)計-第4章-數(shù)據(jù)分布特征的測度_第1頁
基礎(chǔ)統(tǒng)計-第4章-數(shù)據(jù)分布特征的測度_第2頁
基礎(chǔ)統(tǒng)計-第4章-數(shù)據(jù)分布特征的測度_第3頁
基礎(chǔ)統(tǒng)計-第4章-數(shù)據(jù)分布特征的測度_第4頁
基礎(chǔ)統(tǒng)計-第4章-數(shù)據(jù)分布特征的測度_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章數(shù)據(jù)分布特征的測度第一節(jié)集中趨勢的測度第二節(jié)離散程度的測度第三節(jié)偏態(tài)與峰度的測度學習目標1.集中趨勢各測度值的計算方法2.集中趨勢不同測度值的特點和應(yīng)用場合3.離散程度各測度值的計算方法4.離散程度不同測度值的特點和應(yīng)用場合5.偏態(tài)與峰度測度方法6.用Excel計算描述統(tǒng)計量并進行分析數(shù)據(jù)分布的特征集中趨勢(位置)離中趨勢

(分散程度)偏態(tài)和峰度(形狀)數(shù)據(jù)分布的特征和測度數(shù)據(jù)的特征和測度分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標準差峰度四分位差異眾比率偏態(tài)第一節(jié)集中趨勢的測度一.定類數(shù)據(jù):眾數(shù)二.定序數(shù)據(jù):中位數(shù)和分位數(shù)三.定距和定比數(shù)據(jù):均值四.眾數(shù)、中位數(shù)和均值的比較集中趨勢(Centraltendency)指一組數(shù)據(jù)向其中心值靠攏的傾向和程度。集中趨勢測量法就是找出一個數(shù)值來代表變量的資料分布,即中心值或代表值,以反映資料的集結(jié)情況。可以根據(jù)這個代表值來估計或預(yù)測每個研究對象(即個案)的數(shù)值。不同類型的數(shù)據(jù)用不同的集中趨勢測度值。低層次數(shù)據(jù)的集中趨勢測度值適用于高層次的測量數(shù)據(jù),反過來,高層次數(shù)據(jù)的集中趨勢測度值并不適用于低層次的測量數(shù)據(jù)。定類數(shù)據(jù):眾數(shù)(概念要點)集中趨勢的測度值之一;出現(xiàn)次數(shù)最多的變量值;對于定類變量,以眾值作預(yù)測所犯的錯誤總數(shù)是最小的;不受極端值的影響;可能沒有眾數(shù)或有幾個眾數(shù);主要用于定類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。眾數(shù)(眾數(shù)的不唯一性)無眾數(shù)

原始數(shù)據(jù):10591268一個眾數(shù)

原始數(shù)據(jù):65

9855多于一個眾數(shù)

原始數(shù)據(jù):252828

364242定類數(shù)據(jù)的眾數(shù)(算例)表3-1某城市居民關(guān)注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)比例頻率(%)商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100【例】根據(jù)第三章表3-1中的數(shù)據(jù),計算眾數(shù)解:這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調(diào)查的200人當中,關(guān)注商品廣告的人數(shù)最多,為112人,占總被調(diào)查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即

Mo=商品廣告定序數(shù)據(jù)的眾數(shù)(算例)【例】根據(jù)第三章表3-2中的數(shù)據(jù),計算眾數(shù)解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510合計300100.0數(shù)值型分組數(shù)據(jù)的眾數(shù)(要點及計算公式)1.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)4.

該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布2.相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)Mo3.相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMo數(shù)值型分組數(shù)據(jù)的眾數(shù)

(算例)表3-5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例4.1】根據(jù)第三章表3-5中的數(shù)據(jù),計算50名工人日加工零件數(shù)的眾數(shù)定序數(shù)據(jù):中位數(shù)(概念要點)1.集中趨勢的測度值之一;2.排序后處于中間位置上的值。Me50%50%不受極端值的影響;主要用于定序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù);5.以中位值去估計定序變量的數(shù)值,所犯的錯誤總數(shù)是最小的。中位數(shù)(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù)的中位數(shù)(計算公式)定序數(shù)據(jù)的中位數(shù)(算例)【例4.2】根據(jù)第三章表3-2中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的中位數(shù)解:中位數(shù)的位置為:300/2=150從累計頻數(shù)看,中位數(shù)的在“一般”這一組別中。因此

Me=一般表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—數(shù)值型未分組數(shù)據(jù)的中位數(shù)

(5個數(shù)據(jù)的算例)原始數(shù)據(jù):

2422212620排序: 2021222426位置: 123 45中位數(shù)

22

數(shù)值型未分組數(shù)據(jù)的中位數(shù)

(6個數(shù)據(jù)的算例)原始數(shù)據(jù):105 91268排序: 56891012位置: 123

4

56位置

N+126+123.5中位數(shù)

8+928.5

根據(jù)位置公式確定中位數(shù)所在的組采用下列近似公式計算:3.

該公式假定中位數(shù)組的頻數(shù)在該組內(nèi)均勻分布數(shù)值型分組數(shù)據(jù)的中位數(shù)

(要點及計算公式)數(shù)值型分組數(shù)據(jù)的中位數(shù)(算例)表3-5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例4.3】根據(jù)第三章表3-5中的數(shù)據(jù),計算50名工人日加工零件數(shù)的中位數(shù)四分位數(shù)(概念要點)1. 集中趨勢的測度值之一2. 排序后處于25%和75%位置上的值3.不受極端值的影響4.主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)4下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N4定序數(shù)據(jù)的四分位數(shù)(算例)【例4.4】根據(jù)第三章表3-2中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位數(shù)解:

下四分位數(shù)(QL)的位置為:QL位置=(300)/4=75上四分位數(shù)(QL)的位置為:QU位置=(3×300)/4=225從累計頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此

QL

=不滿意

QU

=一般表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—數(shù)值型未分組數(shù)據(jù)的四分位數(shù)

(7個數(shù)據(jù)的算例)原始數(shù)據(jù):

2321 3032 282526排序:21232526283032位置:1 23 4567N+1QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=30

數(shù)值型未分組數(shù)據(jù)的四分位數(shù)

(6個數(shù)據(jù)的算例)原始數(shù)據(jù):

2321 30 282526排序:212325262830位置:1 2 3 4 56QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)

=28.5

數(shù)值型分組數(shù)據(jù)的四分位數(shù)

(計算公式)上四分位數(shù):

下四分位數(shù):

數(shù)值型分組數(shù)據(jù)的四分位數(shù)(算例)QL位置=50/4=12.5QU位置=3×50/4=37.5表3-5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例4.6】根據(jù)第三章表3-5中的數(shù)據(jù),計算50名工人日加工零件數(shù)的四分位數(shù)定距和定比數(shù)據(jù):均值(概念要點)集中趨勢的測度值之一;最常用的測度值;一組數(shù)據(jù)的均衡點所在;易受極端值的影響;用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù);以均值估計數(shù)量型變量的資料,錯誤最小。均值(計算公式)設(shè)一組數(shù)據(jù)為:X1,X2,…,XN

簡單均值的計算公式為設(shè)分組后的數(shù)據(jù)為:X1,X2,…,XK

相應(yīng)的頻數(shù)為:F1,F(xiàn)2,…,F(xiàn)K加權(quán)均值的計算公式為簡單均值(算例)原始數(shù)據(jù): 10 5 9 13 6 8加權(quán)均值(算例)表4-1某車間50名工人日加工零件均值計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計—506160.0【例4.7】根據(jù)第三章表3-5中的數(shù)據(jù),計算50名工人日加工零件數(shù)的均值加權(quán)均值(權(quán)數(shù)對均值的影響)

甲乙兩組各有10名學生,他們的考試成績及其分布數(shù)據(jù)如下

甲組:考試成績(X): 020100

人數(shù)分布(F):118乙組:考試成績(X): 020100

人數(shù)分布(F):811X甲0×1+20×1+100×8n

10i=1

Xi

82(分)X乙0×8+20×1+100×1n

10i=1

Xi

12(分)調(diào)和平均數(shù)(概念要點)1.集中趨勢的測度值之一2.均值的另一種表現(xiàn)形式3.易受極端值的影響4.用于定比數(shù)據(jù)5.不能用于定類數(shù)據(jù)和定序數(shù)據(jù)6.計算公式為調(diào)和平均數(shù)(算例)表4-3某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價格(元)

Xi成交額(元)XiFi成交量(公斤)Fi甲乙丙1.200.500.801800012500640015000250008000合計—3690048000【例4.8】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表4-2,計算三種蔬菜該日的平均批發(fā)價格幾何平均數(shù)(概念要點)1.集中趨勢的測度值之一2.N個變量值乘積的N次方根3.適用于特殊的數(shù)據(jù)4.主要用于計算平均發(fā)展速度5.計算公式為6.可看作是均值的一種變形幾何平均數(shù)(算例)

【例4.10】一位投資者持有一種股票,1996年、1997年、1998年和1999年收益率分別為4.5%、2.0%、3.5%、5.4%。計算該投資者在這四年內(nèi)的平均收益率。平均收益率=103.84%-1=3.84%眾數(shù)、中位數(shù)和均值的關(guān)系對稱分布

均值=中位數(shù)=眾數(shù)左偏分布均值

中位數(shù)

眾數(shù)右偏分布眾數(shù)

中位數(shù)

均值數(shù)據(jù)類型與集中趨勢測度值表4-4數(shù)據(jù)類型和所適用的集中趨勢測度值數(shù)據(jù)類型定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)適用的測度值※眾數(shù)※中位數(shù)※均值※均值—四分位數(shù)眾數(shù)調(diào)和平均數(shù)—眾數(shù)中位數(shù)幾何平均數(shù)——四分位數(shù)中位數(shù)———四分位數(shù)———眾數(shù)第二節(jié)離散程度的測度一.定類數(shù)據(jù):異眾比率二.定序數(shù)據(jù):四分位差三.定距和定比數(shù)據(jù):方差及標準差四.相對離散程度:離散系數(shù)離中趨勢數(shù)據(jù)分布的另一個重要特征;離中趨勢或離散程度是對數(shù)據(jù)離散程度所作的描述;反映個案與個案之間的差異情況;它從另一個側(cè)面說明了集中趨勢測度值的代表程度;不同類型的數(shù)據(jù)有不同的離散程度測度值。定類數(shù)據(jù):異眾比率(概念要點)1.離散程度的測度值之一2.非眾數(shù)組的頻數(shù)占總頻數(shù)的比率3.計算公式為

4.用于衡量眾數(shù)的代表性異眾比率(算例)表3-1某城市居民關(guān)注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)頻率(%)

商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161025

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論