版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第四章
數(shù)據(jù)分布特征的描述
一、均值(mean)(一)概念均值是反映數(shù)據(jù)分布集中趨勢(shì)十分重要的數(shù)據(jù),代表總體單位某一標(biāo)志值的一般水平。(二)特征1.具有抽象性。2.具有代表性。
3.反映總體分布的集中趨勢(shì)。(三)舉例
1.某市中學(xué)生每周平均上網(wǎng)時(shí)間為21小時(shí)。2.某農(nóng)貿(mào)市場(chǎng)2月份牛肉的平均價(jià)格為34元/千克。3.某地區(qū)“十五”期間經(jīng)濟(jì)平均增長(zhǎng)率為9.6%。第一節(jié)
數(shù)據(jù)分布集中趨勢(shì)的測(cè)定(四)均值的種類(lèi)及計(jì)算
1.算術(shù)平均數(shù)**
(1)概念
算術(shù)平均數(shù)又稱(chēng)平均值,是用一組數(shù)據(jù)中所有值之和除以該組數(shù)據(jù)的個(gè)數(shù)。
(我們最熟悉,用途最廣,但我們有時(shí)卻不一定能計(jì)算出均值,要學(xué)好均值的計(jì)算。)
(2)基本公式算術(shù)平均數(shù)的計(jì)算**簡(jiǎn)單算術(shù)平均數(shù):
總體平均數(shù)
樣本平均數(shù)算術(shù)平均數(shù)的計(jì)算
**加權(quán)算術(shù)平均數(shù)(重點(diǎn))
概念:是對(duì)每個(gè)數(shù)據(jù)都根據(jù)其在全組中的重要程度賦予一定權(quán)重后得到的算術(shù)平均數(shù)。
計(jì)算公式:
(1)未分組數(shù)據(jù)
其中,w表示各組的標(biāo)志總量,而不是各組變量值出現(xiàn)的次數(shù),總體和樣本加權(quán)算術(shù)平均數(shù)的公式是相同。
(雞兔同籠問(wèn)題,15只雞,20只兔子,平均每只動(dòng)物有多少條腿)
[例4-1]根據(jù)某公司四個(gè)品牌數(shù)碼相機(jī)的銷(xiāo)售資料計(jì)算平均利潤(rùn)率。(P71)表4-1四個(gè)品牌數(shù)碼相機(jī)的利潤(rùn)率和銷(xiāo)售額資料四個(gè)品牌數(shù)碼相機(jī)的平均銷(xiāo)售利潤(rùn)率為:⑵分組的加權(quán)平均數(shù):根據(jù)分組數(shù)據(jù)計(jì)算均值。
樣本均值的計(jì)算公式(難點(diǎn))
總體均值的計(jì)算公式:表示各組的變量值(組距式數(shù)列的組中值);表示各組變量值出現(xiàn)的頻數(shù)(即權(quán)數(shù))。(算術(shù)平均數(shù)的不足,P72.)其中,
[例4-2]根據(jù)某電腦公司在各市場(chǎng)上銷(xiāo)售量的分組數(shù)據(jù),計(jì)算電腦銷(xiāo)售量的均值。
按銷(xiāo)售量分組(臺(tái))組中值(Mi)市場(chǎng)個(gè)數(shù)(fi)Mifi
140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合計(jì)—
∑fi=
120∑Mifi
=222002.調(diào)和平均數(shù)(1)概念:
調(diào)和平均數(shù)又稱(chēng)倒數(shù)平均數(shù),是各個(gè)變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。
(調(diào)和平均數(shù)的特點(diǎn),P73)
(2)計(jì)算簡(jiǎn)單調(diào)和平均數(shù):針對(duì)未分組資料。計(jì)算公式為:2.調(diào)和平均數(shù)
加權(quán)調(diào)和平均數(shù):針對(duì)分組資料。
計(jì)算公式為:
其中:
是一種特殊權(quán)數(shù),它不是各組變量值出現(xiàn)的次數(shù),表示各組標(biāo)志總量。即
[例4-3]根據(jù)某商場(chǎng)職工月工資資料計(jì)算月平均工資。
表4-3某商場(chǎng)職工月工資資料3.幾何平均數(shù)(1)概念:幾何平均數(shù)(geometricmean)又稱(chēng)對(duì)稱(chēng)平均數(shù),它是各變量值乘積的n次方根。(2)計(jì)算基本公式:
對(duì)數(shù)公式:在實(shí)際工作中,由于變量個(gè)數(shù)較多,通常要應(yīng)用對(duì)數(shù)來(lái)進(jìn)行計(jì)算。即
(3)幾何平均數(shù)的應(yīng)用及特點(diǎn)
①應(yīng)用條件a.變量值是相對(duì)數(shù)據(jù),如比率或發(fā)展速度。b.變量值的連乘積等于總比率或總發(fā)展速度。②特點(diǎn)a.如果數(shù)列中有一個(gè)標(biāo)志值等于零或負(fù)值,則無(wú)法計(jì)算。b.受極端值影響較小,故較穩(wěn)健。
[例4-4]
某電器銷(xiāo)售公司2000~2005年銷(xiāo)售量的環(huán)比增長(zhǎng)率分別為:7.6%、2.5%、0.6%、2.7%和2.2%。求這期間銷(xiāo)售量的平均增長(zhǎng)速度。表4-4銷(xiāo)售量平均發(fā)展速度計(jì)算表幾何平均數(shù)的計(jì)算示例幾何平均數(shù)的計(jì)算示例
1.采用基本公式計(jì)算的銷(xiāo)售量平均發(fā)展速度為:2.采用對(duì)數(shù)公式計(jì)算的銷(xiāo)售量平均發(fā)展速度為:所以,銷(xiāo)售量的平均增長(zhǎng)速度=103.1%-1=3.1%二、位置平均數(shù)(一)中位數(shù)(median)
1.概念中位數(shù)是將一組數(shù)據(jù)項(xiàng)按照數(shù)值大小升序或者降序排列后位于中間位置的那個(gè)數(shù)據(jù),符號(hào)為。2.中位數(shù)的計(jì)算方法(1)未分組數(shù)據(jù)的中位數(shù)
將變量值按升序或降序排列,找中間位置的變量值。
(2)單項(xiàng)數(shù)列的中位數(shù)計(jì)算各組的累計(jì)頻數(shù)(向上累計(jì)或向下累計(jì));根據(jù)中位數(shù)位置確定中位數(shù)。[例4-5]
計(jì)算某公司銷(xiāo)售人員月銷(xiāo)售冰箱中位數(shù)
表4-5某公司銷(xiāo)售人員月銷(xiāo)售冰箱中位數(shù)計(jì)算按月銷(xiāo)售冰箱分組(臺(tái))銷(xiāo)售人員數(shù)(人)向上累計(jì)頻數(shù)向下累計(jì)頻數(shù)25303234363931014271883132754728080776753268合計(jì)80--中位數(shù)的位置
即中位數(shù)在累計(jì)頻數(shù)為40的那一組內(nèi)(向上累計(jì)或向下累計(jì)均可得出),則。
2.中位數(shù)的計(jì)算方法(3)組距數(shù)列的中位數(shù):由下列公式近似計(jì)算
下限公式其中:為總體單位總數(shù);為中位數(shù)組的下限;為中位數(shù)組以下的累計(jì)頻數(shù);為中位數(shù)組的頻數(shù);為中位數(shù)組的組距;[例4-6]求以下組距數(shù)列的中位數(shù)。
按家庭收入分組(元)家庭數(shù)(戶(hù))向上累計(jì)頻率5000以下5000~1000010000~1500015000~2000020000以上214514662166808692合計(jì)92-中位數(shù)的近似值為:表4-6某地區(qū)家庭收入分組中位數(shù)的位置在第46(92/2)位,應(yīng)在第二組中位數(shù)的特點(diǎn)⑴是一種位置平均數(shù),不受極端值及開(kāi)口組的影響。
⑵對(duì)于分配不對(duì)稱(chēng)的數(shù)據(jù),中位數(shù)比平均值更適合當(dāng)集中趨勢(shì)的代表值。⑶
對(duì)某些不具有數(shù)字特征或不能用數(shù)字測(cè)定的現(xiàn)象,可用中位數(shù)表示其一般水平。例如,對(duì)眾多的消費(fèi)者購(gòu)買(mǎi)數(shù)碼相機(jī)時(shí),分別對(duì)價(jià)格、外觀、品質(zhì)的注重程度排序后,可以求出消費(fèi)者在乎的中位數(shù)因素。
二、位置平均數(shù)(二)眾數(shù)
1.概念
眾數(shù)(mode)是指在一組數(shù)中出現(xiàn)次數(shù)最多的那個(gè)數(shù)值,符號(hào)為。
2.數(shù)據(jù)數(shù)列的眾數(shù)分布情況
無(wú)眾數(shù)如數(shù)據(jù)數(shù)列:13791268
一個(gè)眾數(shù)如數(shù)據(jù)數(shù)列:659866
多個(gè)眾數(shù)如數(shù)據(jù)數(shù)列:2235273527363.眾數(shù)的計(jì)算方法**品質(zhì)變量的眾數(shù)——觀察次數(shù),出現(xiàn)次數(shù)最多的變量值就是眾數(shù)。
例如:企業(yè)的所有制結(jié)構(gòu)分布、人口的城鄉(xiāng)分布。**數(shù)值變量的眾數(shù)未分組資料——觀察次數(shù),出現(xiàn)次數(shù)最多的數(shù)據(jù)就是眾數(shù)。分組資料(1)單項(xiàng)式數(shù)列——直接觀察,次數(shù)最多的組的變量值即為眾數(shù)。
[例4-7]單項(xiàng)式變量數(shù)列確定眾數(shù)實(shí)例
表4-7某市居民家庭按家庭人口數(shù)分組
由上表可以看出,家庭人口數(shù)為3人的家庭數(shù)最多,因此本例中家庭人口數(shù)的眾數(shù)為3人。3.眾數(shù)的計(jì)算方法
組距數(shù)列計(jì)算眾數(shù):由下列公式近似計(jì)算:
其中為眾數(shù)組與前一組頻數(shù)之差;為眾數(shù)組的下限;為眾數(shù)組與后一組頻數(shù)之差;為眾數(shù)組的組距。[例4-8]組距式數(shù)列計(jì)算眾數(shù)示例收入組別人均收入(元)頻數(shù)(人)1234562000元以下2000~4000元4000~6000元6000~8000元8000~10000元10000以上234368322410合計(jì)-200其眾數(shù)的近似值為:表4-8某地區(qū)的人均月收入調(diào)查數(shù)據(jù)三、均值、中位數(shù)和眾數(shù)的比較(一)均值、中位數(shù)和眾數(shù)的數(shù)量關(guān)系
1.當(dāng)數(shù)據(jù)呈對(duì)稱(chēng)分布時(shí),三者合而為一。2.當(dāng)數(shù)據(jù)呈左偏分布時(shí),說(shuō)明數(shù)據(jù)存在極小值,必然拉動(dòng)均值向極小值一方靠,則從左至右依次是均值、中位數(shù)和眾數(shù)。3.當(dāng)數(shù)據(jù)呈右偏分布時(shí),說(shuō)明數(shù)據(jù)存在極大值,必然拉動(dòng)均值向極大值一方靠,則從左至右依次是眾數(shù)、中位數(shù)和均值。
三、均值、中位數(shù)和眾數(shù)的比較(二)均值、眾數(shù)和中位數(shù)的特點(diǎn)及應(yīng)用場(chǎng)合
**均值是對(duì)數(shù)值型數(shù)據(jù)的計(jì)算,利用了全部數(shù)據(jù)信息,具有優(yōu)良的數(shù)學(xué)性質(zhì),是實(shí)際中應(yīng)用最廣泛的集中趨勢(shì)測(cè)度值。
**中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,其特點(diǎn)是不受數(shù)據(jù)極端值的影響,主要適合于作為順序數(shù)據(jù)的集中趨勢(shì)測(cè)度值。
**眾數(shù)是一組數(shù)據(jù)分布的峰值,它也是一種位置代表值,不受極端值的影響,主要適合于作為分類(lèi)數(shù)據(jù)的集中趨勢(shì)測(cè)度值。(P79)
一、極差(一)概念:又稱(chēng)全距,是數(shù)據(jù)中最大值和最小值之差。記為。(二)計(jì)算
1.未分組數(shù)據(jù)的極差為:表示數(shù)據(jù)的最大值;表示數(shù)據(jù)的最小值。2.分組數(shù)據(jù)的極差
極差=最大組的上限-最小組的下限
若存在開(kāi)口組,則:
最大組的上限=前一組的上限+組距最小組的下限=下一組的下限-組距其中:第二節(jié)
數(shù)據(jù)分布離散程度的測(cè)定(三)修正極差
1.概念:修正極差(modifiedrange)是去掉極端值后的極差,又稱(chēng)四分位全距(IQR,interquartilerange),是中間50%的數(shù)據(jù)的間距,即數(shù)據(jù)分布中第25個(gè)和第75個(gè)百分位數(shù)的間距,也即第1個(gè)和第3個(gè)四分位數(shù)的間距。
2.公式:
其中,Q3表示第3個(gè)四分位數(shù),即第75個(gè)百分位數(shù);
Q1表示第1個(gè)四分位數(shù),即第25百分位數(shù)。
二、平均差(一)概念
平均差(meanabsolutedeviation,MAD)是各數(shù)據(jù)對(duì)平均數(shù)的離差絕對(duì)值的平均數(shù)。
(假設(shè)有兩個(gè)球員,五場(chǎng)比賽得分如下,A:8、10、12、13、7;B:2、30、0、11、7。如果你是教練,你選哪個(gè)?試計(jì)算平均差和方差。)(二)樣本平均差的計(jì)算公式
1.未分組數(shù)據(jù):
2.分組數(shù)據(jù):
三、方差和標(biāo)準(zhǔn)差(一)概念方差(variance)是各變量值與其均值離差平方的平均數(shù)。標(biāo)準(zhǔn)差(standarddeviation)是方差的平方根,又稱(chēng)“均方差”。(二)比較與評(píng)價(jià)
1.其內(nèi)涵與平均差相似,均為各個(gè)數(shù)據(jù)對(duì)其平均數(shù)的平均離差。但平均差采用求絕對(duì)值消除正負(fù)離差,標(biāo)準(zhǔn)差采用平方法消除正負(fù)離差,在數(shù)學(xué)處理上標(biāo)準(zhǔn)差比平均差更為科學(xué)合理。2.方差和標(biāo)準(zhǔn)差是測(cè)度數(shù)值型數(shù)據(jù)離散程度的最主要的指標(biāo)。
(例:P84)[例4-9]某電腦公司銷(xiāo)售量分組數(shù)據(jù)如表4-7,計(jì)算銷(xiāo)售量的方差和標(biāo)準(zhǔn)差(如何計(jì)算均值?)
表4-7某電腦公司銷(xiāo)售量分組數(shù)據(jù)(三)總體方差和標(biāo)準(zhǔn)差計(jì)算示例總體方差和標(biāo)準(zhǔn)差計(jì)算示例
根據(jù)公式計(jì)算可知總體均值為:
總體方差為:
總體標(biāo)準(zhǔn)差為:
[例4-10]
根據(jù)以下資料,計(jì)算企業(yè)職工平均工資的標(biāo)準(zhǔn)差。(已知平均工資為760元)
表4-9某企業(yè)職工工資分組數(shù)據(jù)表總體方差和標(biāo)準(zhǔn)差計(jì)算示例
總體方差為:
總體標(biāo)準(zhǔn)差為:
(四)樣本方差和標(biāo)準(zhǔn)差
1.說(shuō)明
在大多數(shù)統(tǒng)計(jì)應(yīng)用中,都針對(duì)樣本數(shù)據(jù)來(lái)分析總體數(shù)量特征。因此通常用樣本方差來(lái)估計(jì)總體方差,用樣本標(biāo)準(zhǔn)差來(lái)估計(jì)總體標(biāo)準(zhǔn)差。2.符號(hào)樣本容量用n表示;樣本方差用S2表示;
樣本標(biāo)準(zhǔn)差用S表示。3.計(jì)算公式(P86)
與總體方差和標(biāo)準(zhǔn)差公式類(lèi)似,區(qū)別在于分母除以n-1。四、離散系數(shù)(一)概念:離散系數(shù)(coefficientofvariation)也稱(chēng)變異系數(shù),是一組數(shù)據(jù)的離散指標(biāo)的絕對(duì)數(shù)與其相應(yīng)的均值之比,是離散指標(biāo)的相對(duì)數(shù)形式。(二)表現(xiàn)形式有全距系數(shù)、平均差系數(shù)和標(biāo)準(zhǔn)差系數(shù)。最常用的是標(biāo)準(zhǔn)差系數(shù)。(三)計(jì)算公式總體標(biāo)準(zhǔn)差系數(shù)
樣本標(biāo)準(zhǔn)差系數(shù)四、離散系數(shù)
(四)應(yīng)用:用于比較不同總體數(shù)據(jù)分布的離散程度。[例題4-11]
甲乙企業(yè)職工的年均收入分別為20000元和50000元,收入的標(biāo)準(zhǔn)差分別為3000和5000元,哪家企業(yè)職工的收入差距小一些?
[分析]不同企業(yè)的年均收入不同,不能直接比較標(biāo)準(zhǔn)差,只能比較標(biāo)準(zhǔn)差系數(shù)。[結(jié)論]乙企業(yè)職工收入差距小于甲企業(yè)。甲企業(yè)標(biāo)準(zhǔn)差系數(shù)
乙企業(yè)標(biāo)準(zhǔn)差系數(shù)一、偏態(tài)及其測(cè)定(一)偏態(tài)(skewness)是指數(shù)據(jù)分布的不對(duì)稱(chēng)性,其度量值稱(chēng)為偏態(tài)系數(shù)SK。(二)計(jì)算
未分組數(shù)據(jù):分組數(shù)據(jù):
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年消防設(shè)施檢測(cè)與維保服務(wù)合同5篇
- 2025年度安置房質(zhì)量保證合同書(shū)3篇
- 2025年水泥制品環(huán)保技術(shù)轉(zhuǎn)移合同3篇
- 2025年度高空墜落防護(hù)HSE施工安全協(xié)議3篇
- 二零二五年房產(chǎn)銷(xiāo)售代理與廣告宣傳協(xié)議3篇
- 二零二五年鮮活水產(chǎn)品運(yùn)輸與質(zhì)量監(jiān)管協(xié)議3篇
- 2025年度免租金停車(chē)場(chǎng)租賃合同模板
- 2025版棋牌室三方合作協(xié)議-創(chuàng)新管理與行業(yè)規(guī)范4篇
- 2025年污水處理站污水處理設(shè)施設(shè)備租賃與維修合同3篇
- 2025年度留學(xué)簽證擔(dān)保與資金證明服務(wù)合同3篇
- 公司組織架構(gòu)圖(可編輯模版)
- 1汽輪機(jī)跳閘事故演練
- 陜西省銅川市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會(huì)明細(xì)
- 禮品(禮金)上交登記臺(tái)賬
- 普通高中英語(yǔ)課程標(biāo)準(zhǔn)詞匯表
- 北師大版七年級(jí)數(shù)學(xué)上冊(cè)教案(全冊(cè)完整版)教學(xué)設(shè)計(jì)含教學(xué)反思
- 2023高中物理步步高大一輪 第五章 第1講 萬(wàn)有引力定律及應(yīng)用
- 青少年軟件編程(Scratch)練習(xí)題及答案
- 浙江省公務(wù)員考試面試真題答案及解析精選
- 系統(tǒng)性紅斑狼瘡-第九版內(nèi)科學(xué)
- 全統(tǒng)定額工程量計(jì)算規(guī)則1994
評(píng)論
0/150
提交評(píng)論