用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征 省賽獲獎_第1頁
用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征 省賽獲獎_第2頁
用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征 省賽獲獎_第3頁
用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征 省賽獲獎_第4頁
用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征 省賽獲獎_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2.2.2用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征

眾數(shù)、中位數(shù)、平均數(shù)2.標(biāo)準(zhǔn)差1眾數(shù)、中位數(shù)、平均數(shù)23一、眾數(shù)、中位數(shù)、平均數(shù)的概念

中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).

眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).

眾數(shù)、中位數(shù)、平均數(shù)都是描述一組數(shù)據(jù)的集中趨勢的特征數(shù),只是描述的角度不同,其中以平均數(shù)的應(yīng)用最為廣泛.平均數(shù):一組數(shù)據(jù)的算術(shù)平均數(shù),即

x=4頻率組距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)例如,在上一節(jié)調(diào)查的100位居民的月均用水量的問題中,從這些樣本數(shù)據(jù)的頻率分布直方圖可以看出,月均用水量的眾數(shù)是2.25t.如圖所示:

二、眾數(shù)、中位數(shù)、平均數(shù)與頻率分布直方圖的關(guān)系

1、眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點(diǎn)的橫坐標(biāo)。5

2、在樣本中,有50%的個(gè)體小于或等于中位數(shù),也有50%的個(gè)體大于或等于中位數(shù),因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等,由此可以估計(jì)中位數(shù)的值。下圖中虛線代表居民月均用水量的中位數(shù)的估計(jì)值,此數(shù)據(jù)值為2.02t.頻率組距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)6說明:

2.02這個(gè)中位數(shù)的估計(jì)值,與樣本的中位數(shù)值2.0不一樣,這是因?yàn)闃颖緮?shù)據(jù)的頻率分布直方圖,只是直觀地表明分布的形狀,但是從直方圖本身得不出原始的數(shù)據(jù)內(nèi)容,所以由頻率分布直方圖得到的中位數(shù)估計(jì)值往往與樣本的實(shí)際中位數(shù)值不一致.7頻率組距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)

3、平均數(shù)的估計(jì)值等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和。8三、三種數(shù)字特征的優(yōu)缺點(diǎn)

1、眾數(shù)體現(xiàn)了樣本數(shù)據(jù)的最大集中點(diǎn),但它對其它數(shù)據(jù)信息的忽視使得無法客觀地反映總體特征.如上例中眾數(shù)是2.25t,它告訴我們,月均用水量為2.25t的居民數(shù)比月均用水量為其它數(shù)值的居民數(shù)多,但它并沒有告訴我們多多少.9

2、中位數(shù)是樣本數(shù)據(jù)所占頻率的等分線,它不受少數(shù)幾個(gè)極端值的影響,這在某些情況下是優(yōu)點(diǎn),但它對極端值的不敏感有時(shí)也會成為缺點(diǎn)。如上例中假設(shè)有某一用戶月均用水量為10t,那么它所占頻率為0.01,幾乎不影響中位數(shù),但顯然這一極端值是不能忽視的。10

3、由于平均數(shù)與每一個(gè)樣本的數(shù)據(jù)有關(guān),所以任何一個(gè)樣本數(shù)據(jù)的改變都會引起平均數(shù)的改變,這是眾數(shù)、中位數(shù)都不具有的性質(zhì)。也正因如此,與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響較大,使平均數(shù)在估計(jì)時(shí)可靠性降低。11

四眾數(shù)、中位數(shù)、平均數(shù)的簡單應(yīng)用例某工廠人員及工資構(gòu)成如下:人員經(jīng)理管理人員高級技工工人學(xué)徒周工資2200250220200100人數(shù)165101(1)指出這個(gè)問題中周工資的眾數(shù)、中位數(shù)、平均數(shù)(2)這個(gè)問題中,工資的平均數(shù)能客觀地反映該廠的工資水平嗎?為什么?

解:眾數(shù)為200,中位數(shù)為220,平均數(shù)為300。因平均數(shù)為300,由表格中所列出的數(shù)據(jù)可見,只有經(jīng)理在平均數(shù)以上,其余的人都在平均數(shù)以下,故用平均數(shù)不能客觀真實(shí)地反映該工廠的工資水平。標(biāo)準(zhǔn)差1213

平均數(shù)向我們提供了樣本數(shù)據(jù)的重要信息,但是平均數(shù)有時(shí)也會使我們作出對總體的片面判斷.因?yàn)檫@個(gè)平均數(shù)掩蓋了一些極端的情況,而這些極端情況顯然是不能忽視的.因此,只有平均數(shù)還難以概括樣本數(shù)據(jù)的實(shí)際狀態(tài).如:有兩位射擊運(yùn)動員在一次射擊測試中各射靶10次,每次命中的環(huán)數(shù)如下:甲:78795491074乙:9578768677如果你是教練,你應(yīng)當(dāng)如何對這次射擊作出評價(jià)?如果看兩人本次射擊的平均成績,由于

兩人射擊的平均成績是一樣的.那么兩個(gè)人的水平就沒有什么差異嗎?14(甲)45678910環(huán)數(shù)頻率0.10.20.3頻率(乙)456789100.10.20.30.4環(huán)數(shù)

直觀上看,還是有差異的.如:甲成績比較分散,乙成績相對集中(如上圖所示).

因此,我們還需要從另外的角度來考察這兩組數(shù)據(jù).例如:在作統(tǒng)計(jì)圖表時(shí)提到過的極差.15

甲的環(huán)數(shù)極差=10-4=6乙的環(huán)數(shù)極差=9-5=4.

它們在一定程度上表明了樣本數(shù)據(jù)的分散程度,與平均數(shù)一起,可以給我們許多關(guān)于樣本數(shù)據(jù)的信息.顯然,極差對極端值非常敏感,注意到這一點(diǎn),我們可以得到一種“去掉一個(gè)最高分,去掉一個(gè)最低分”的統(tǒng)計(jì)策略.

考察樣本數(shù)據(jù)的分散程度的大小,最常用的統(tǒng)計(jì)量是標(biāo)準(zhǔn)差.標(biāo)準(zhǔn)差是樣本平均數(shù)的一種平均距離,一般用s表示.所謂“平均距離”,其含義可作如下理解:16

由于上式含有絕對值,運(yùn)算不太方便,因此,通常改用如下公式來計(jì)算標(biāo)準(zhǔn)差.一個(gè)樣本中的個(gè)體與平均數(shù)之間的距離關(guān)系可用下圖表示:考慮一個(gè)容量為2的樣本:17

顯然,標(biāo)準(zhǔn)差越大,則a越大,數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差越小,數(shù)據(jù)的離散程度越小.用計(jì)算器可算出甲,乙兩人的的成績的標(biāo)準(zhǔn)差由可以知道,甲的成績離散程度大,乙的成績離散程度小.由此可以估計(jì),乙比甲的射擊成績穩(wěn)定.上面兩組數(shù)據(jù)的離散程度與標(biāo)準(zhǔn)差之間的關(guān)系可用圖直觀地表示出來.45678910a18例題1:畫出下列四組樣本數(shù)據(jù)的直方圖,說明它們的異同點(diǎn).(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8;解:四組樣本數(shù)據(jù)的直方圖是:頻率o123456780.10.20.30.40.50.60.70.80.91.0S=0.00(1)1912345678頻率o0.10.20.30.40.50.60.70.80.91.0S=1.490.20.30.40.50.60.70.80.91.0(2)頻率o12345678S=0.82頻率o123456780.10.20.30.40.50.60.70.80.91.0S=2.8320四組數(shù)據(jù)的平均數(shù)都是5.0,標(biāo)準(zhǔn)差分別是0.00,0.82,1.49,2.83.雖然它們有相同的平均數(shù),但是它們有不同的標(biāo)準(zhǔn)差,說明數(shù)據(jù)的分散程度是不一樣的.標(biāo)準(zhǔn)差還可以用于對樣本數(shù)據(jù)的另外一種解釋.例如:在關(guān)于居民月均用水量的例子中,平均數(shù)標(biāo)準(zhǔn)差s=0.868

所以注:方差(或標(biāo)準(zhǔn)差)的意義:一組數(shù)據(jù)的方差(或標(biāo)準(zhǔn)差)反應(yīng)了這組數(shù)據(jù)的波動情況(或穩(wěn)定情況),方差(或標(biāo)準(zhǔn)差)越大,這組數(shù)據(jù)就越不穩(wěn)定,波動的越大;方差(或標(biāo)準(zhǔn)差)越小,則這組數(shù)據(jù)越穩(wěn)定,波動的越小。因?yàn)榭傮w的方差與標(biāo)準(zhǔn)差是不知道的,所以通常是用樣本的方差、標(biāo)準(zhǔn)差去估計(jì)總體的方差、標(biāo)準(zhǔn)差。22例2甲乙兩人同時(shí)生產(chǎn)內(nèi)徑為25.40mm的一種零件.為了對兩人的生產(chǎn)質(zhì)量進(jìn)行評比,從他們生產(chǎn)的零件中各抽出20件,量得其內(nèi)徑尺寸如下(單位:mm)甲25.46,25.32,25.45,25.39,25.3625.34,25.42,25.45,25.38,25.4225.39,25.43,25.39,25.40,25.4425.40,25.42,25.35,25.41,25.39乙25.40,25.43,25.44,25.48,25.4825.47,25.49,25.49,25.36,25.3425.33,25.43,25.43,25.32,25.4725.31,25.32,25.32,25.32,25.48從生產(chǎn)的零件內(nèi)徑的尺寸看,誰生產(chǎn)的質(zhì)量較高?23分析:每一個(gè)工人生產(chǎn)的所有零件的內(nèi)徑尺寸組成一個(gè)總體,由于零件的生產(chǎn)標(biāo)準(zhǔn)已經(jīng)給出(內(nèi)徑25.40mm),生產(chǎn)質(zhì)量可以從總體的平均數(shù)與標(biāo)準(zhǔn)差兩個(gè)角度來衡量.總體的平均數(shù)與內(nèi)徑標(biāo)準(zhǔn)尺寸25.00mm的差異在時(shí)質(zhì)量低,差異小時(shí)質(zhì)量高;當(dāng)總體的平均數(shù)與標(biāo)準(zhǔn)尺寸很接近時(shí),總體的標(biāo)準(zhǔn)差小的時(shí)候質(zhì)量高,標(biāo)準(zhǔn)差大的時(shí)候質(zhì)量低.這樣比較兩人的生產(chǎn)質(zhì)量只要比較他們所生產(chǎn)的零件內(nèi)徑尺寸所組成的兩個(gè)總體的平均數(shù)與標(biāo)準(zhǔn)差的大小即可.但是這兩個(gè)總體的平均數(shù)與標(biāo)準(zhǔn)差都是不知道的,根據(jù)用樣本估計(jì)總體的思想,我們可以通過抽樣分別獲得相應(yīng)的樣體數(shù)據(jù),然后比較這兩個(gè)樣本的平均數(shù),標(biāo)準(zhǔn)差,以此作為兩個(gè)總體之間的估計(jì)值.解:用計(jì)算器計(jì)算可得:24

從樣本平均數(shù)看,甲生產(chǎn)的零件內(nèi)徑比乙生產(chǎn)的更接近內(nèi)徑標(biāo)準(zhǔn)(25.40mm),但是差異很小;從樣本標(biāo)準(zhǔn)差看,由于

從上述例子我們可以看到,對一名工人生產(chǎn)的零件內(nèi)徑(總體)的質(zhì)量判斷,與我們抽取的內(nèi)徑(樣本數(shù)據(jù))直接相關(guān).顯然,我們可以從這名工人生產(chǎn)的零件中獲取許多樣本(為什么?).這樣,盡管總體是同一個(gè),但由于樣本不同,相應(yīng)的樣本頻率分布與平均數(shù),標(biāo)準(zhǔn)差等都會發(fā)生改變,這就會影響到我們對總體情況的估計(jì).如果樣本的的代表性差,那么對總體所作出的估計(jì)就會產(chǎn)生偏差;樣本沒有代表性時(shí),對總體作出錯(cuò)誤

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論