用樣本的數(shù)字特征估計總體的數(shù)字特征ppt課件_第1頁
用樣本的數(shù)字特征估計總體的數(shù)字特征ppt課件_第2頁
用樣本的數(shù)字特征估計總體的數(shù)字特征ppt課件_第3頁
用樣本的數(shù)字特征估計總體的數(shù)字特征ppt課件_第4頁
用樣本的數(shù)字特征估計總體的數(shù)字特征ppt課件_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

.,2.2.2用樣本的數(shù)字特征估計總體的數(shù)字特征,.,一、復(fù)習(xí)眾數(shù)、中位數(shù)、平均數(shù)的概念,2、中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個數(shù)據(jù)(或最中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù),1、眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù),眾數(shù)、中位數(shù)、平均數(shù)都是描述一組數(shù)據(jù)的集中趨勢的特征數(shù),只是描述的角度不同,其中以平均數(shù)的應(yīng)用最為廣泛.,3、平均數(shù):一般地,如果n個數(shù),那么,叫做這n個數(shù)的平均數(shù)。,.,1、求下列各組數(shù)據(jù)的眾數(shù),(1)、1,2,3,3,3,5,5,8,8,8,9,9,眾數(shù)是:3和8,(2)、1,2,3,3,3,5,5,8,8,9,9,眾數(shù)是:3,2、求下列各組數(shù)據(jù)的中位數(shù),(1)、1,2,3,3,3,4,6,8,8,8,9,9,(2)1,2,3,3,3,4,8,8,8,9,9,中位數(shù)是:5,中位數(shù)是:4,.,3、在一次中學(xué)生田徑運動會上,參加男子跳高的17名運動員的成績?nèi)缦卤硭荆?分別求這些運動員成績的眾數(shù),中位數(shù)與平均數(shù)。,解:在17個數(shù)據(jù)中,1.75出現(xiàn)了4次,出現(xiàn)的次數(shù)最多,即這組數(shù)據(jù)的眾數(shù)是1.75上面表里的17個數(shù)據(jù)可看成是按從小到大的順序排列的,其中第9個數(shù)據(jù)1.70是最中間的一個數(shù)據(jù),即這組數(shù)據(jù)的中位數(shù)是1.70;,答:17名運動員成績的眾數(shù)、中位數(shù)、平均數(shù)依次是1.75(米)、1.70(米)、1.69(米)。,這組數(shù)據(jù)的平均數(shù)是,.,二、怎么由頻率分布直方圖求眾數(shù),中位數(shù)和平均數(shù)?,例如,在上一節(jié)抽樣調(diào)查的100位居民的月均用水量的數(shù)據(jù)中,我們得知這一組樣本數(shù)據(jù)的,并畫出過這組數(shù)據(jù)的頻率分布直方圖.,眾數(shù)=2.3(t)中位數(shù)=2.0(t)平均數(shù)=2.0(t),現(xiàn)在,觀察這組數(shù)據(jù)的頻率分布直方圖,能否得出這組數(shù)據(jù)的眾數(shù)、中位數(shù)和平均數(shù)?,眾數(shù)、中位數(shù)和平均數(shù),.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率組距,.,歸納總結(jié)得:因為在頻率分布直方圖中,各小長方形的面積表示相應(yīng)各組的頻率,也顯示出樣本數(shù)據(jù)落在各小組的比例的大小,所以從圖中可以看到,在區(qū)間2,2.5)的小長方形的面積最大,即這組的頻率是最大的,也就是說月均用水量在區(qū)間2,2.5)內(nèi)的居民最多,即眾數(shù)就是在區(qū)間2,2.5)內(nèi)。眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點的橫坐標(biāo)。,.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率組距,2.25,.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,提示:中位數(shù)左邊的數(shù)據(jù)個數(shù)與右邊的數(shù)據(jù)個數(shù)是相等的。,.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四個小矩形的面積和=0.49,后四個小矩形的面積和=0.26,2.02,.,歸納總結(jié)得:在樣本中,有50的個體小于或等于中位數(shù),也有50的個體大于或等于中位數(shù),因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等,由此可以估計中位數(shù)的值。在這個頻率分布直方圖中,左邊的直方圖的面積代表50個單位,右邊的直方圖也是代表50個單位,它們的分界線與x軸交點的橫坐標(biāo)就是中位數(shù)。中位數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是把頻率分布直方圖劃分左右兩個面積相等的分界線與x軸交點的橫坐標(biāo)。,.,思考討論以下問題:1、2.02這個中位數(shù)的估計值,與樣本的中位數(shù)值2.0不一樣,你能解釋其中原因嗎?,答:2.02這個中位數(shù)的估計值,與樣本的中位數(shù)值2.0不一樣,這是因為樣本數(shù)據(jù)的頻率分布直方圖,只是直觀地表明分布的形狀,但是從直方圖本身得不出原始的數(shù)據(jù)內(nèi)容,直方圖已經(jīng)損失一些樣本信息。所以由頻率分布直方圖得到的中位數(shù)估計值往往與樣本的實際中位數(shù)值不一致.,.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,提示:在頻率分布直方圖中,各個組的平均數(shù)如何找?,.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,.,.,.,.,.,.,.,.,.,0.75,1.75,2.25,2.75,3.25,3.75,4.25,1.25,0.5,提示:與小長方形面積的比例有關(guān)嗎?,.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,2.02,.,.,.,.,.,.,.,.,.,0.75,1.75,2.25,2.75,3.25,3.75,4.25,1.25,0.5,.,總結(jié)歸納得:平均數(shù)是頻率分布直方圖的“重心”,是直方圖的平衡點。先找出每個小長方形的“重心”,即每小組的平均數(shù),再按比例算出直方圖的平均數(shù)。平均數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,等于頻率分布圖中每個小長方形面積乘以小矩形底邊中點的橫坐標(biāo)之和。,.,總結(jié):,眾數(shù):最高矩形的中點的橫坐標(biāo),中位數(shù):在頻率分布直方圖中,中位數(shù)的左右兩邊的直方圖的面積相等,都為0.5,平均數(shù):每個小矩形的面積乘以中點的橫坐標(biāo)之和,.,三、三種數(shù)字特征的優(yōu)缺點,1、眾數(shù)體現(xiàn)了樣本數(shù)據(jù)的最大集中點,但它對其它數(shù)據(jù)信息的忽視使得無法客觀地反映總體特征。,2、中位數(shù)是樣本數(shù)據(jù)所占頻率的等分線,它不受少數(shù)幾個極端值的影響,這在某些情況下是優(yōu)點,但它對極端值的不敏感有時也會成為缺點。,.,3、平均數(shù)與每一個樣本的數(shù)據(jù)有關(guān),與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響較大,而且越極端,對平均數(shù)的影響就越大。當(dāng)樣本數(shù)據(jù)質(zhì)量較差時,用平均數(shù)來估計,可靠性不高,可能會與實際情況產(chǎn)生較大的誤差。,.,四、思考討論以下問題:1、樣本中位數(shù)不受少數(shù)極端值的影響,這在某些情況下是一個優(yōu)點,但它對極端值的不敏感有時也會成為缺點。你能舉例說明嗎?,答:優(yōu)點:對極端數(shù)據(jù)不敏感的方法能夠有效地預(yù)防錯誤數(shù)據(jù)的影響。對極端值不敏感有利的例子:例如當(dāng)樣本數(shù)據(jù)質(zhì)量比較差,即存在一些錯誤數(shù)據(jù)(如數(shù)據(jù)錄入錯誤、測量錯誤等)時,用抗極端數(shù)據(jù)強的中位數(shù)表示數(shù)據(jù)的中心值更準(zhǔn)確。,.,缺點:(1)出現(xiàn)錯誤的數(shù)據(jù)也不知道;(2)對極端值不敏感有弊的例子:某人具有初級計算機專業(yè)技術(shù)水平,想找一份收入好的工作。這時如果采用各個公司計算機專業(yè)技術(shù)人員收入的中位數(shù)作為選擇工作的參考指標(biāo)就會冒這樣的風(fēng)險:,很可能所選擇公司的初級計算機專業(yè)技術(shù)水平人員的收入很低,其原因是中位數(shù)對極小的數(shù)據(jù)不敏感。這里更好的方法是同時用平均工資和中位數(shù)作為參考指標(biāo),選擇平均工資較高且中位數(shù)較大的公司就業(yè).,.,思考討論以下問題:3、“用數(shù)據(jù)說話”,這是我們經(jīng)常聽到的一句話。但是,數(shù)據(jù)有時也會被利用,從而產(chǎn)生誤導(dǎo)。例如,一個企業(yè)中,絕大多數(shù)人是一線工人,他們的年收入可能是一萬元左右,另有一些經(jīng)理層次的人,年收入過到幾十萬元。這時年收入的平均數(shù)比中位數(shù)大得多。盡管這時的中位數(shù)比平均數(shù)更合理些,但是這個企業(yè)的老板到人力市場去招聘工人時,也許更可能用平均數(shù)來回答有關(guān)工次待遇的指問。你認(rèn)為“我們單位的收入水平比別的單位高”這句話應(yīng)當(dāng)怎么解釋?,.,答:我認(rèn)為這句話是這樣解釋的:這個企業(yè)的老板以員工平均工資收入水平去描述他們單位的收入情況。我覺得這是不合理的,因為這些員工當(dāng)中,少數(shù)經(jīng)理層次的收入與大多數(shù)一般員工收入的差別比較大,所以平均數(shù)不能反映該單位員工的收入水平。這個老板的話有誤導(dǎo)與蒙騙行為。,.,課后練習(xí)假設(shè)你是一名交通部門的工作人員,你打算向市長報告國家對本市26個公路項目投資的平均資金數(shù)額,其中一條新公路的建設(shè)投資為2000萬元人民幣,另外25個項目的投資是20100萬元。中位數(shù)是25萬元,平均數(shù)是100萬元,眾數(shù)是20萬元。你會選擇哪一種數(shù)據(jù)特征來表示國家對每一個項目投資的平均金額?你選擇這種數(shù)字特征的缺點是什么?,.,答

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論