版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2.2.2用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征
眾數(shù)、中位數(shù)、平均數(shù)2.標(biāo)準(zhǔn)差1眾數(shù)、中位數(shù)、平均數(shù)23一、眾數(shù)、中位數(shù)、平均數(shù)的概念
中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).
眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).
眾數(shù)、中位數(shù)、平均數(shù)都是描述一組數(shù)據(jù)的集中趨勢的特征數(shù),只是描述的角度不同,其中以平均數(shù)的應(yīng)用最為廣泛.平均數(shù):一組數(shù)據(jù)的算術(shù)平均數(shù),即
x=4頻率組距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)例如,在上一節(jié)調(diào)查的100位居民的月均用水量的問題中,從這些樣本數(shù)據(jù)的頻率分布直方圖可以看出,月均用水量的眾數(shù)是2.25t.如圖所示:
二、眾數(shù)、中位數(shù)、平均數(shù)與頻率分布直方圖的關(guān)系
1、眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點(diǎn)的橫坐標(biāo)。5
2、在樣本中,有50%的個(gè)體小于或等于中位數(shù),也有50%的個(gè)體大于或等于中位數(shù),因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等,由此可以估計(jì)中位數(shù)的值。下圖中虛線代表居民月均用水量的中位數(shù)的估計(jì)值,此數(shù)據(jù)值為2.02t.頻率組距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)6說明:
2.02這個(gè)中位數(shù)的估計(jì)值,與樣本的中位數(shù)值2.0不一樣,這是因?yàn)闃颖緮?shù)據(jù)的頻率分布直方圖,只是直觀地表明分布的形狀,但是從直方圖本身得不出原始的數(shù)據(jù)內(nèi)容,所以由頻率分布直方圖得到的中位數(shù)估計(jì)值往往與樣本的實(shí)際中位數(shù)值不一致.7頻率組距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)
3、平均數(shù)的估計(jì)值等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和。8三、三種數(shù)字特征的優(yōu)缺點(diǎn)
1、眾數(shù)體現(xiàn)了樣本數(shù)據(jù)的最大集中點(diǎn),但它對其它數(shù)據(jù)信息的忽視使得無法客觀地反映總體特征.如上例中眾數(shù)是2.25t,它告訴我們,月均用水量為2.25t的居民數(shù)比月均用水量為其它數(shù)值的居民數(shù)多,但它并沒有告訴我們多多少.9
2、中位數(shù)是樣本數(shù)據(jù)所占頻率的等分線,它不受少數(shù)幾個(gè)極端值的影響,這在某些情況下是優(yōu)點(diǎn),但它對極端值的不敏感有時(shí)也會成為缺點(diǎn)。如上例中假設(shè)有某一用戶月均用水量為10t,那么它所占頻率為0.01,幾乎不影響中位數(shù),但顯然這一極端值是不能忽視的。10
3、由于平均數(shù)與每一個(gè)樣本的數(shù)據(jù)有關(guān),所以任何一個(gè)樣本數(shù)據(jù)的改變都會引起平均數(shù)的改變,這是眾數(shù)、中位數(shù)都不具有的性質(zhì)。也正因如此,與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響較大,使平均數(shù)在估計(jì)時(shí)可靠性降低。11
四眾數(shù)、中位數(shù)、平均數(shù)的簡單應(yīng)用例某工廠人員及工資構(gòu)成如下:人員經(jīng)理管理人員高級技工工人學(xué)徒周工資2200250220200100人數(shù)165101(1)指出這個(gè)問題中周工資的眾數(shù)、中位數(shù)、平均數(shù)(2)這個(gè)問題中,工資的平均數(shù)能客觀地反映該廠的工資水平嗎?為什么?
解:眾數(shù)為200,中位數(shù)為220,平均數(shù)為300。因平均數(shù)為300,由表格中所列出的數(shù)據(jù)可見,只有經(jīng)理在平均數(shù)以上,其余的人都在平均數(shù)以下,故用平均數(shù)不能客觀真實(shí)地反映該工廠的工資水平。標(biāo)準(zhǔn)差1213
平均數(shù)向我們提供了樣本數(shù)據(jù)的重要信息,但是平均數(shù)有時(shí)也會使我們作出對總體的片面判斷.因?yàn)檫@個(gè)平均數(shù)掩蓋了一些極端的情況,而這些極端情況顯然是不能忽視的.因此,只有平均數(shù)還難以概括樣本數(shù)據(jù)的實(shí)際狀態(tài).如:有兩位射擊運(yùn)動員在一次射擊測試中各射靶10次,每次命中的環(huán)數(shù)如下:甲:78795491074乙:9578768677如果你是教練,你應(yīng)當(dāng)如何對這次射擊作出評價(jià)?如果看兩人本次射擊的平均成績,由于
兩人射擊的平均成績是一樣的.那么兩個(gè)人的水平就沒有什么差異嗎?14(甲)45678910環(huán)數(shù)頻率0.10.20.3頻率(乙)456789100.10.20.30.4環(huán)數(shù)
直觀上看,還是有差異的.如:甲成績比較分散,乙成績相對集中(如上圖所示).
因此,我們還需要從另外的角度來考察這兩組數(shù)據(jù).例如:在作統(tǒng)計(jì)圖表時(shí)提到過的極差.15
甲的環(huán)數(shù)極差=10-4=6乙的環(huán)數(shù)極差=9-5=4.
它們在一定程度上表明了樣本數(shù)據(jù)的分散程度,與平均數(shù)一起,可以給我們許多關(guān)于樣本數(shù)據(jù)的信息.顯然,極差對極端值非常敏感,注意到這一點(diǎn),我們可以得到一種“去掉一個(gè)最高分,去掉一個(gè)最低分”的統(tǒng)計(jì)策略.
考察樣本數(shù)據(jù)的分散程度的大小,最常用的統(tǒng)計(jì)量是標(biāo)準(zhǔn)差.標(biāo)準(zhǔn)差是樣本平均數(shù)的一種平均距離,一般用s表示.所謂“平均距離”,其含義可作如下理解:16
由于上式含有絕對值,運(yùn)算不太方便,因此,通常改用如下公式來計(jì)算標(biāo)準(zhǔn)差.一個(gè)樣本中的個(gè)體與平均數(shù)之間的距離關(guān)系可用下圖表示:考慮一個(gè)容量為2的樣本:17
顯然,標(biāo)準(zhǔn)差越大,則a越大,數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差越小,數(shù)據(jù)的離散程度越小.用計(jì)算器可算出甲,乙兩人的的成績的標(biāo)準(zhǔn)差由可以知道,甲的成績離散程度大,乙的成績離散程度小.由此可以估計(jì),乙比甲的射擊成績穩(wěn)定.上面兩組數(shù)據(jù)的離散程度與標(biāo)準(zhǔn)差之間的關(guān)系可用圖直觀地表示出來.45678910a18例題1:畫出下列四組樣本數(shù)據(jù)的直方圖,說明它們的異同點(diǎn).(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8;解:四組樣本數(shù)據(jù)的直方圖是:頻率o123456780.10.20.30.40.50.60.70.80.91.0S=0.00(1)1912345678頻率o0.10.20.30.40.50.60.70.80.91.0S=1.490.20.30.40.50.60.70.80.91.0(2)頻率o12345678S=0.82頻率o123456780.10.20.30.40.50.60.70.80.91.0S=2.8320四組數(shù)據(jù)的平均數(shù)都是5.0,標(biāo)準(zhǔn)差分別是0.00,0.82,1.49,2.83.雖然它們有相同的平均數(shù),但是它們有不同的標(biāo)準(zhǔn)差,說明數(shù)據(jù)的分散程度是不一樣的.標(biāo)準(zhǔn)差還可以用于對樣本數(shù)據(jù)的另外一種解釋.例如:在關(guān)于居民月均用水量的例子中,平均數(shù)標(biāo)準(zhǔn)差s=0.868
所以注:方差(或標(biāo)準(zhǔn)差)的意義:一組數(shù)據(jù)的方差(或標(biāo)準(zhǔn)差)反應(yīng)了這組數(shù)據(jù)的波動情況(或穩(wěn)定情況),方差(或標(biāo)準(zhǔn)差)越大,這組數(shù)據(jù)就越不穩(wěn)定,波動的越大;方差(或標(biāo)準(zhǔn)差)越小,則這組數(shù)據(jù)越穩(wěn)定,波動的越小。因?yàn)榭傮w的方差與標(biāo)準(zhǔn)差是不知道的,所以通常是用樣本的方差、標(biāo)準(zhǔn)差去估計(jì)總體的方差、標(biāo)準(zhǔn)差。22例2甲乙兩人同時(shí)生產(chǎn)內(nèi)徑為25.40mm的一種零件.為了對兩人的生產(chǎn)質(zhì)量進(jìn)行評比,從他們生產(chǎn)的零件中各抽出20件,量得其內(nèi)徑尺寸如下(單位:mm)甲25.46,25.32,25.45,25.39,25.3625.34,25.42,25.45,25.38,25.4225.39,25.43,25.39,25.40,25.4425.40,25.42,25.35,25.41,25.39乙25.40,25.43,25.44,25.48,25.4825.47,25.49,25.49,25.36,25.3425.33,25.43,25.43,25.32,25.4725.31,25.32,25.32,25.32,25.48從生產(chǎn)的零件內(nèi)徑的尺寸看,誰生產(chǎn)的質(zhì)量較高?23分析:每一個(gè)工人生產(chǎn)的所有零件的內(nèi)徑尺寸組成一個(gè)總體,由于零件的生產(chǎn)標(biāo)準(zhǔn)已經(jīng)給出(內(nèi)徑25.40mm),生產(chǎn)質(zhì)量可以從總體的平均數(shù)與標(biāo)準(zhǔn)差兩個(gè)角度來衡量.總體的平均數(shù)與內(nèi)徑標(biāo)準(zhǔn)尺寸25.00mm的差異在時(shí)質(zhì)量低,差異小時(shí)質(zhì)量高;當(dāng)總體的平均數(shù)與標(biāo)準(zhǔn)尺寸很接近時(shí),總體的標(biāo)準(zhǔn)差小的時(shí)候質(zhì)量高,標(biāo)準(zhǔn)差大的時(shí)候質(zhì)量低.這樣比較兩人的生產(chǎn)質(zhì)量只要比較他們所生產(chǎn)的零件內(nèi)徑尺寸所組成的兩個(gè)總體的平均數(shù)與標(biāo)準(zhǔn)差的大小即可.但是這兩個(gè)總體的平均數(shù)與標(biāo)準(zhǔn)差都是不知道的,根據(jù)用樣本估計(jì)總體的思想,我們可以通過抽樣分別獲得相應(yīng)的樣體數(shù)據(jù),然后比較這兩個(gè)樣本的平均數(shù),標(biāo)準(zhǔn)差,以此作為兩個(gè)總體之間的估計(jì)值.解:用計(jì)算器計(jì)算可得:24
從樣本平均數(shù)看,甲生產(chǎn)的零件內(nèi)徑比乙生產(chǎn)的更接近內(nèi)徑標(biāo)準(zhǔn)(25.40mm),但是差異很小;從樣本標(biāo)準(zhǔn)差看,由于
從上述例子我們可以看到,對一名工人生產(chǎn)的零件內(nèi)徑(總體)的質(zhì)量判斷,與我們抽取的內(nèi)徑(樣本數(shù)據(jù))直接相關(guān).顯然,我們可以從這名工人生產(chǎn)的零件中獲取許多樣本(為什么?).這樣,盡管總體是同一個(gè),但由于樣本不同,相應(yīng)的樣本頻率分布與平均數(shù),標(biāo)準(zhǔn)差等都會發(fā)生改變,這就會影響到我們對總體情況的估計(jì).如果樣本的的代表性差,那么對總體所作出的估計(jì)就會產(chǎn)生偏差;樣本沒有代表性時(shí),對總體作出錯(cuò)誤
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 八年級物理第一次月考卷(考試版A4)【測試范圍:序言~第2章】(滬科版(五四制 )2024)
- TGXAS-漓江流域多彩景觀植被配置與營造技術(shù)規(guī)程
- 幼兒缺勤當(dāng)日電訪內(nèi)容記錄表
- 河北省永年縣第二中學(xué)2024-2025學(xué)年高三下學(xué)期線上第二次周考語文試題含解析
- 海南省??谑兄攸c(diǎn)中學(xué)2025屆高三4月(二診)調(diào)研測試卷(康德版)語文試題含解析
- 福建省廈門外國語中學(xué)2024-2025學(xué)年高三3月雙基測試語文試題含解析
- 成都市雙流區(qū)2024-2025學(xué)年高三一模金卷語文試題分項(xiàng)解析版含解析
- 2024-2030年全球與中國注射用羥基磷灰石微球填充劑市場發(fā)展趨勢及投資機(jī)遇研究報(bào)告
- 北京市東城區(qū)2025年高三第四次質(zhì)量抽測語文試題含解析
- 老年患者髖部骨折應(yīng)用加速康復(fù)護(hù)理的效果研究-當(dāng)代護(hù)理
- 日管控、周排查、月調(diào)度記錄表
- GB/T 4464-2006染料泳移性的測定
- 《利用廢線路板分離的廢樹脂粉生產(chǎn)塑料母粒技術(shù)規(guī)程》編制說明
- GB/T 2408-2008塑料燃燒性能的測定水平法和垂直法
- 2023年體育單招考試英語試題及答案
- 電子病歷書寫規(guī)范課件
- 物業(yè)項(xiàng)目交接及移交方案(標(biāo)書專用)參考借鑒范本
- (完整版)雅思詞匯表大全
- 二代支付系統(tǒng)SAPS和CCMS部分 課件
- 金相組織識別-鐵碳相圖課件
- 全球人工智能現(xiàn)狀與未來課件
評論
0/150
提交評論