上課版 221用樣本的頻率分布估計總體分布 - 副本_第1頁
上課版 221用樣本的頻率分布估計總體分布 - 副本_第2頁
上課版 221用樣本的頻率分布估計總體分布 - 副本_第3頁
上課版 221用樣本的頻率分布估計總體分布 - 副本_第4頁
上課版 221用樣本的頻率分布估計總體分布 - 副本_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2.2.1用樣本的頻率分布估計總體分布1、下列問題中,采用怎樣的抽樣方法比較合理:①從10臺冰箱中抽取3臺進行質(zhì)量檢查;②某電影院有32排座位,每排有40個座位,座位號為1~40。有一次報告會坐滿了聽眾,會議結(jié)束后為聽取意見,留下座位號為18的32名聽眾進行座談;③某學校有160名教職工,其中教師120名,行政人員16名,后勤人員24名。為了了解教職工對學校在校務公開方面的意見,擬抽取一個容量為20的樣本。

③分層抽樣

②系統(tǒng)抽樣

①簡單隨機抽樣復習檢測133、某工廠生產(chǎn)A、B、C三種不同型號的產(chǎn)品,產(chǎn)品數(shù)量之比為2:3:5,現(xiàn)用分層抽樣方法抽取一個容量為n的樣本,樣本中A型產(chǎn)品有16種,那么此樣本容量n=______.80復習引入:

統(tǒng)計的基本思想方法:

用樣本估計總體,即通常不直接去研究總體,而是通過從總體中抽取一個樣本,根據(jù)樣本的情況去估計總體的相應情況.統(tǒng)計的核心問題:如何根據(jù)樣本的情況對總體的情況作出一種推斷.這里包括兩類問題:一類是如何從總體中抽取樣本?

簡單隨機抽樣系統(tǒng)抽樣分層抽樣另一類是如何根據(jù)對樣本的整理、計算、分析,對總體的情況作出推斷.整體介紹:用樣本的有關(guān)情況去估計總體的相應情況,這種估計大體分為兩類,一類是用樣本頻率分布估計總體分布,一類是用樣本的某種數(shù)字特征(例如平均數(shù)、方差等)去估計總體的相應數(shù)字特征。

頻數(shù):將一批數(shù)據(jù)按要求分為若干個組,各組內(nèi)數(shù)據(jù)的個數(shù),叫做該組的頻數(shù)。

頻率:每組數(shù)據(jù)的個數(shù)除以全體數(shù)據(jù)個數(shù)的商叫做該組的頻率。根據(jù)隨機抽取樣本的大小,分別計算某一事件出現(xiàn)的頻率,這些頻率的分布規(guī)律(取值狀況),就叫做樣本的頻率分布。說明:樣本頻率分布與總體頻率分布有什么關(guān)系?通過樣本的頻數(shù)分布、頻率分布可以估計總體的頻率分布.如何用樣本的頻率分布估計總體分布?我國是世界上嚴重缺水的國家之一,城市缺水問題較為突出,某市政府為了節(jié)約生活用水,計劃在本市試行居民生活用水定額管理,即確定一個居民月用水量標準a,用水量不超過a的部分按平價收費,超出a的部分按議價收費。如果希望大部分居民的日常生活不受影響,那么標準a定為多少比較合理呢?探究:你認為,為了較為合理地確定出這個標準,需要做哪些工作?我國是世界上嚴重缺水的國家之一,城市缺水問題較為突出,某市政府為了節(jié)約生活用水,計劃在本市試行居民生活用水定額管理,即確定一個居民月用水量標準a,用水量不超過a的部分按平價收費,超出a的部分按議價收費。如果希望大部分居民的日常生活不受影響,那么標準a定為多少比較合理呢?探究:①采用抽樣調(diào)查的方式獲得樣本數(shù)據(jù)②分析樣本數(shù)據(jù)來估計全市居民用水量的分布情況分析數(shù)據(jù)的一種基本方法是用圖將它們畫出來,或者用緊湊的表格改變數(shù)據(jù)的排列方式,作圖可以達到兩個目的,一是從數(shù)據(jù)中提取信息,二是利用圖形傳遞信息。表格則是通過改變數(shù)據(jù)的構(gòu)成形式,為我們提供解釋數(shù)據(jù)的新方式討論:如何分析數(shù)據(jù)?根據(jù)這些數(shù)據(jù)你能得出用水量其他信息嗎?為此我們要對這些數(shù)據(jù)進行整理與分析通過抽樣,我們獲得了100位居民某年的月平均用水量(單位:t),如下表:

〈一〉頻率分布的概念:頻率分布是指一個樣本數(shù)據(jù)在各個小范圍內(nèi)所占比例的大小。一般用頻率分布直方圖反映樣本的頻率分布〈二〉畫頻率分布直方圖其一般步驟為:(1)計算一組數(shù)據(jù)中最大值與最小值的差,即求極差(2)決定組距與組數(shù)(3)將數(shù)據(jù)分組(4)列頻率分布表(5)畫頻率分布直方圖第一步:求極差:(數(shù)據(jù)組中最大值與最小值的差距)

最大值=4.3最小值=0.2所以極差=4.3-0.2=4.1第二步:決定組距與組數(shù):

(強調(diào)取整)

當樣本容量不超過100時,按照數(shù)據(jù)的多少,常分成5~12組.為方便組距的選擇應力求“取整”.本題如果組距為0.5(t).則第三步:將數(shù)據(jù)分組:(給出組的界限)

所以將數(shù)據(jù)分成9組較合適.

[0,0.5),[0.5,1),[1,1.5),……[4,4.5)共9組.

第四步:列頻率分布表.

分組(x)頻數(shù)頻率(頻數(shù)/總數(shù))頻率/組距(y)[0-0.5)4[0.5-1)8[1-1.5)15[1.5-2)22[2-2.5)25[2.5-3)15[3-3.5)5[3.5-4)4[4-4.5)2合計100組距=0.5

0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.0500.10.20.30.40.50.60.511.522.533.544.5第五步:畫出頻率分布直方圖.頻率/組距

月均用水量/t

(組距=0.5)

0.080.160.30.440.50.30.10.080.04小長方形的面積=?小長方形的面積總和=?月均用水量最多的在哪個區(qū)間?頻率分布直方圖的特征:從頻率分布直方圖可以清楚的看出數(shù)據(jù)分布的總體趨勢。從頻率分布直方圖得不出原始的數(shù)據(jù)內(nèi)容,把數(shù)據(jù)表示成直方圖后,原有的具體數(shù)據(jù)信息就被抹掉了。思考:頻率分布表與頻率分布直方圖的區(qū)別?頻率分布表列出的是在各個不同區(qū)間內(nèi)取值的頻率。頻率分布直方圖是用小長方形面積的大小來表示在各個區(qū)間內(nèi)取值的頻率。注意(2)縱坐標為:練習:有一個容量為50的樣本數(shù)據(jù)的分組的頻數(shù)如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出樣本的頻率分布表;(2)畫出頻率分布直方圖;(3)根據(jù)頻率分布直方圖估計,數(shù)據(jù)落在[15.5,24.5)的百分比是多少?解:組距為3

分組頻數(shù)頻率頻率/組距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027頻率分布直方圖如下:頻率組距0.0100.0200.0300.0400.05012.515.50.0600.070課堂小結(jié)(二)頻率分布折線圖:畫好頻率分布圖后,我們把頻率分布直方圖中各小長方形上端的中點連接起來,得到的圖形就叫頻率分布折線圖.00.10.20.30.40.50.60.511.522.533.544.5畫出頻率分布折線圖.頻率/組距月均用水量/t(取組距中點,并連線)0.080.160.30.440.50.30.10.080.04在樣本頻率分布直方圖中,當樣本容量增加,作圖時所分的組數(shù)增加,組距減少,相應的頻率折線圖會越來越接近于一條光滑曲線,統(tǒng)計中稱這條光滑曲線為總體密度曲線.它能夠精確地反映了總體在各個范圍內(nèi)取值的百分比,它能給我們提供更加精細的信息.總體密度曲線:月均用水量/t頻率組距0ab月均用水量/t頻率組距0ab1.對于任何一個總體,它的密度曲線是不是一定存在?它的密度曲線是否可以被非常準確地畫出來?思考2.圖中陰影部分的面積表示什么?2.總體在范圍(a,b)內(nèi)取值的百分比月均用水量/t頻率組距0ab1.實際上,盡管有些總體密度曲線是客觀存在的,但一般很難像函數(shù)圖象那樣準確地畫出來,我們只能用樣本的頻率分布對它進行估計,一般來說,樣本容量越大,這種估計就越精確。莖葉圖:

當數(shù)據(jù)是兩位有效數(shù)字時,用中間的數(shù)字表示十位數(shù),即第一個有效數(shù)字,兩邊的數(shù)字表示個位數(shù),即第二個有效數(shù)字,它的中間部分像植物的莖,兩邊部分像植物莖上長出來的葉子,因此通常把這樣的圖叫做莖葉圖

例某賽季甲、乙兩名籃球運動員每場比賽得分的原始記錄如下:(1)甲運動員得分:13,51,23,8,26,38,16,33,14,28,39(2)乙運動員得分:49,24,12,31,50,31,44,36,15,37,25,36,39甲乙01234525541616794908463368389

1甲乙01234525541616794908463368389

1從這個莖葉圖可以看出,乙運動員的得分大致對稱,葉的分布是“單峰”的,大多數(shù)的葉集中在莖2,3,4上,中位數(shù)是36;甲運動員的得分除一個特殊得分外,也大致對稱,葉的分布也是“單峰”的,大多數(shù)的葉集中在莖1,2,3上,中位數(shù)是26。由此可以看出,乙運動員的發(fā)揮更穩(wěn)定,成績更好。優(yōu)點:(1)保留了原始數(shù)據(jù),沒有損失樣本信息;(2)數(shù)據(jù)可以隨時記錄、添加或修改.缺點:不適合樣本容量很大或莖、葉不分明的樣本數(shù)據(jù).練習1、從兩個班中各隨機的抽取10名學生,他們的數(shù)學成績?nèi)缦拢杭装啵?6,74,82,96,66,76,78,72,52,68乙班:86,84,62,76,78,92,82,74,88,85畫出莖葉圖并分析兩個班學生的數(shù)學學習情況。

由莖葉圖可知,乙班的成績較好,而且較穩(wěn)定。解析:練習2:對于樣本頻率分布折線圖與總體密度曲線的關(guān)系,下列說法中正確的是()A、頻率分布折線圖與總體密度曲線無關(guān)B、頻率分布折線圖就是總體密度曲線C、樣本容量很大的頻率分布折線圖就是總體密度曲線D、如果樣本容量無限增大,分組的組距無限減小,那么頻率分布折線圖就會無限接近于總體密度曲線D3、一個容量為20的樣本,分組后組距與頻數(shù)如下:

[10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,

則樣本在(10,50]上的頻率為()4、對于用樣本頻率估計總體分布的過程,下列說法中正確的是()A.總體容量越大,估計越準確B.總體容量越小,估計越準確C.樣本容量越大,估計越準確D.樣本容量越小,估計越準確DCA根據(jù)上圖可得這100名學生中體重在[56.5,64.5]的學生人數(shù)是()A.20

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論