用樣本頻率分布估計(jì)總體分布教材_第1頁(yè)
用樣本頻率分布估計(jì)總體分布教材_第2頁(yè)
用樣本頻率分布估計(jì)總體分布教材_第3頁(yè)
用樣本頻率分布估計(jì)總體分布教材_第4頁(yè)
用樣本頻率分布估計(jì)總體分布教材_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2.2.1用樣本的頻率分布估計(jì)總體分布頻率分布的表示形式有:①樣本頻率分布表②樣本頻率分布圖樣本頻率分布條形圖樣本頻率分布直方圖③樣本頻率分布折線圖

1、初中時(shí)我們學(xué)習(xí)過(guò)樣本的頻率分布,包括頻數(shù)、頻率的概念,頻數(shù)分布表和頻數(shù)分布直方圖的制作。例1.

為檢測(cè)某種產(chǎn)品的質(zhì)量,抽取了一個(gè)容量為30的樣本,檢測(cè)結(jié)果為一級(jí)品5件,二級(jí)品8件,三級(jí)品13件,次品4件.(1)列出樣本的頻率分布表;(2)畫出表示樣本頻率分布的條形圖;(3)根據(jù)上述結(jié)果,估計(jì)此種產(chǎn)品為二級(jí)品或三級(jí)品的概率約是多少.

解:(1)樣本的頻率分布表為:

0.134次品0.4313三級(jí)品0.278二級(jí)品0.175一級(jí)品頻率頻數(shù)產(chǎn)品解:(2)樣本頻率分布的條形圖為:

0.10.20.30.40.50.60.7一級(jí)品二級(jí)品產(chǎn)品頻率三級(jí)品次品(3)此種產(chǎn)品為二級(jí)品或三級(jí)品的概率約為0.27+0.43=0.7.

知識(shí)探究(一):頻率分布表【問(wèn)題】

我國(guó)是世界上嚴(yán)重缺水的國(guó)家之一,城市缺水問(wèn)題較為突出,某市政府為了節(jié)約生活用水,計(jì)劃在本市試行居民生活用水定額管理,即確定一個(gè)居民月用水量標(biāo)準(zhǔn)a,用水量不超過(guò)a的部分按平價(jià)收費(fèi),超出a的部分按議價(jià)收費(fèi).通過(guò)抽樣調(diào)查,獲得100位居民2007年的月均用水量如下表(單位:t):3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2顯然:這里的總體可以在一個(gè)實(shí)數(shù)區(qū)間取值,稱為連續(xù)型總體。樣本的頻率分布表示形式有:

頻率分布表和頻率分布直方圖1.極差:樣本數(shù)據(jù)中的最大值和最小值的差稱為極差2.確定組距,組數(shù):.如果將上述100個(gè)數(shù)據(jù)按組距為0.5進(jìn)行分組,那么這些數(shù)據(jù)共分為多少組?0.2~4.3(4.3-0.2)÷0.5=8.2

3將數(shù)據(jù)分組,決定分點(diǎn):以組距為0.5進(jìn)行分組,上述100個(gè)數(shù)據(jù)共分為9組,各組數(shù)據(jù)的取值范圍可以如何設(shè)定?4畫頻率分布表:如何統(tǒng)計(jì)上述100個(gè)數(shù)據(jù)在各組中的頻數(shù)?如何計(jì)算樣本數(shù)據(jù)在各組中的頻率?你能將這些數(shù)據(jù)用表格反映出來(lái)嗎?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].

分組頻數(shù)累計(jì)頻數(shù)頻率

[0,0.5)40.04[0.5,1)正80.08[1,1.5)正正正150.15[1.5,2)正正正正220.22[2,2.5)正正正正正250.25[2.5,3)正正140.14[3,3.5)正一60.06[3.5,4)40.04[4,4.5]20.02

合計(jì)1001.00頻率分布表:知識(shí)探究(二):頻率分布直方圖5畫頻率分布直方圖為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O上圖稱為頻率分布直方圖,其中橫軸表示月均用水量,縱軸表示頻率/組距.頻率分布直方圖中各小長(zhǎng)方形的寬度和高度在數(shù)量上有何特點(diǎn)?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O寬度:組距高度:頻率組距2圖形的意義圖形的意義:頻率分布直方圖中各小長(zhǎng)方形的面積表示什么?各小長(zhǎng)方形的面積之和為多少?各小長(zhǎng)方形的面積=頻率各小長(zhǎng)方形的面積之和=1月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O寬度:組距高度:頻率組距3分析例題:你能根據(jù)上述頻率分布直方圖指出居民月均用水量的一些數(shù)據(jù)特點(diǎn)嗎?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O(1)居民月均用水量的分布是“山峰”狀的,而且是“單峰”的;(2)大部分居民的月均用水量集中在一個(gè)中間值附近,只有少數(shù)居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的對(duì)稱性等.月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O思考:對(duì)一組給定的樣本數(shù)據(jù),頻率分布直方圖的外觀形狀與哪些因素有關(guān)?在居民月均用水量樣本中,你能以1為組距畫頻率分布直方圖嗎?

與分組數(shù)(或組距)及坐標(biāo)系的單位長(zhǎng)度有關(guān).月均用水量/t頻率組距0.40.30.20.112345

O1、求極差(即一組數(shù)據(jù)中最大值與最小值的差)

知道這組數(shù)據(jù)的變動(dòng)范圍4.3-0.2=4.12、決定組距與組數(shù)(將數(shù)據(jù)分組)3、將數(shù)據(jù)分組(8.2取整,分為9組)畫頻率分布直方圖的步驟4、列出頻率分布表.(填寫頻率/組距一欄)5、畫出頻率分布直方圖。組距:指每個(gè)小組的兩個(gè)端點(diǎn)的距離組數(shù):將數(shù)據(jù)分組,當(dāng)數(shù)據(jù)在100個(gè)以內(nèi)時(shí),按數(shù)據(jù)多少常分5-12組。頻率分布的條形圖和頻率分布直方圖的區(qū)別兩者是不同的概念;橫軸:兩者表示內(nèi)容相同思考:頻率分布條形圖和頻率分布直方圖是兩個(gè)相同的概念嗎?有什么區(qū)別?縱軸:兩者表示的內(nèi)容不相同頻率分布條形圖的縱軸(長(zhǎng)方形的高)表示頻率頻率分布直方圖的縱軸(長(zhǎng)方形的高)表示頻率與組距的比值,其相應(yīng)組距上的頻率等于該組距上長(zhǎng)方形的面積。頻率分布直方圖如下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5連接頻率分布直方圖中各小長(zhǎng)方形上端的中點(diǎn),得到頻率分布折線圖利用樣本頻分布對(duì)總體分布進(jìn)行相應(yīng)估計(jì)(2)樣本容量越大,這種估計(jì)越精確。(1)上例的樣本容量為100,如果增至1000,其頻率分布直方圖的情況會(huì)有什么變化?假如增至10000呢?總體密度曲線頻率組距月均用水量/tab(圖中陰影部分的面積,表示總體在某個(gè)區(qū)間(a,b)內(nèi)取值的百分比)。當(dāng)樣本容量無(wú)限增大,分組的組距無(wú)限縮小,那么頻率分布折線圖就會(huì)無(wú)限接近一條光滑曲線——總體密度曲線.總體密度曲線

用樣本分布直方圖去估計(jì)相應(yīng)的總體分布時(shí),一般樣本容量越大,頻率分布直方圖就會(huì)無(wú)限接近總體密度曲線,就越精確地反映了總體的分布規(guī)律,即越精確地反映了總體在各個(gè)范圍內(nèi)取值百分比。

總體密度曲線反映了總體在各個(gè)范圍內(nèi)取值的百分比,精確地反映了總體的分布規(guī)律。是研究總體分布的工具.總體密度曲線莖葉圖某賽季甲、乙兩名籃球運(yùn)動(dòng)員每場(chǎng)比賽得分的原始記錄如下:(1)甲運(yùn)動(dòng)員得分:13,51,23,8,26,38,16,33,14,28,39(2)乙運(yùn)動(dòng)員得分:

49,24,12,31,50,31,44,36,15,37,25,36,39

甲乙

804631253682543893161679449150注:中間的數(shù)字表示得分的十位數(shù)字。

旁邊的數(shù)字分別表示兩個(gè)人得分的個(gè)位數(shù)。莖葉圖當(dāng)樣本數(shù)據(jù)較少時(shí),用莖葉圖表示數(shù)據(jù)的效果較好,它不但可以保留所有的信息,而且可以隨時(shí)記錄,給數(shù)據(jù)的記錄和表示都方便。練習(xí):某中學(xué)高一(2)班甲,乙兩名同學(xué)自高中以來(lái)每場(chǎng)數(shù)學(xué)考試成績(jī)情況如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:83,86,93,99,88,96,98,98,79,85,97畫出兩人數(shù)學(xué)成績(jī)莖葉圖,請(qǐng)根據(jù)莖葉圖對(duì)兩人的成績(jī)進(jìn)行比較。

小結(jié)圖形優(yōu)點(diǎn)缺點(diǎn)頻率分布1)易表示大量數(shù)據(jù)丟失一些直方圖

2)直觀地表明分布地情況信息

1)無(wú)信息損失只能處理樣本莖頁(yè)圖

2)隨時(shí)記錄方便記錄和表示容量較小數(shù)據(jù)課堂小結(jié)表示樣本分布的方法:(1)頻率分布表(2)頻率分布圖(包括直方圖和條形圖)(3)頻率分布折線圖(4)莖葉圖一眾數(shù)、中位數(shù)、平均數(shù)的概念中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).

眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).

平均數(shù):一組數(shù)據(jù)的算術(shù)平均數(shù),即

問(wèn)題1:眾數(shù)、中位數(shù)、平均數(shù)這三個(gè)數(shù)一般都會(huì)來(lái)自于同一個(gè)總體或樣本,它們能表明總體或樣本的什么性質(zhì)?平均數(shù):反映所有數(shù)據(jù)的平均水平

眾數(shù):反映的往往是局部較集中的數(shù)據(jù)信息

中位數(shù):是位置型數(shù),反映處于中間部位的數(shù)據(jù)信息

1、求下列各組數(shù)據(jù)的眾數(shù)(1)、1,2,3,3,3,5,5,8,8,8,9,9眾數(shù)是:3和8(2)、1,2,3,3,3,5,5,8,8,9,9眾數(shù)是:32、求下列各組數(shù)據(jù)的中位數(shù)(1)、1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,9中位數(shù)是:5中位數(shù)是:4

3、在一次中學(xué)生田徑運(yùn)動(dòng)會(huì)上,參加男子跳高的17名運(yùn)動(dòng)員的成績(jī)?nèi)缦卤硭荆撼煽?jī)(米)1.501.601.651.701.751.801.851.90人數(shù)23234111分別求這些運(yùn)動(dòng)員成績(jī)的眾數(shù),中位數(shù)與平均數(shù)。解:在17個(gè)數(shù)據(jù)中,1.75出現(xiàn)了4次,出現(xiàn)的次數(shù)最多,即這組數(shù)據(jù)的眾數(shù)是1.75.上面表里的17個(gè)數(shù)據(jù)可看成是按從小到大的順序排列的,其中第9個(gè)數(shù)據(jù)1.70是最中間的一個(gè)數(shù)據(jù),即這組數(shù)據(jù)的中位數(shù)是1.70;

答:17名運(yùn)動(dòng)員成績(jī)的眾數(shù)、中位數(shù)、平均數(shù)依次是1.75(米)、1.70(米)、1.69(米)。

這組數(shù)據(jù)的平均數(shù)是二、眾數(shù)、中位數(shù)、平均數(shù)與頻率分布直方圖的關(guān)系頻率組距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)

眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點(diǎn)的橫坐標(biāo)。如何在頻率分布直方圖中估計(jì)眾數(shù)可將眾數(shù)看作直方圖中面積最大長(zhǎng)方形的“中心”0.52.521.5143.534.5頻率組距0.040.080.150.220.250.140.060.040.02前四個(gè)小矩形的面積和=0.49后四個(gè)小矩形的面積和=0.262.02如何在頻率分布直方圖中估計(jì)中位數(shù)分組[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合計(jì)頻率0.040.080.150.220.250.140.060.040.021在樣本中中位數(shù)的左右各有50%的樣本數(shù),條形面積各為0.5,所以反映在直方圖中位數(shù)左右的面積相等.,中位數(shù))可將中位數(shù)看作整個(gè)直方圖面積的“中心”思考討論以下問(wèn)題:1、2.02這個(gè)中位數(shù)的估計(jì)值,與樣本的中位數(shù)值2.0不一樣,你能解釋其中原因嗎?答:2.02這個(gè)中位數(shù)的估計(jì)值,與樣本的中位數(shù)值2.0不一樣,這是因?yàn)闃颖緮?shù)據(jù)的頻率分布直方圖,只是直觀地表明分布的形狀,但是從直方圖本身得不出原始的數(shù)據(jù)內(nèi)容,直方圖已經(jīng)損失一些樣本信息。所以由頻率分布直方圖得到的中位數(shù)估計(jì)值往往與樣本的實(shí)際中位數(shù)值不一致.如何在頻率分布直方圖中估計(jì)平均數(shù)=2.02=2.02平均數(shù)的估計(jì)值等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和。可將平均數(shù)看作整個(gè)直方圖面積的“重心”

思考討論以下問(wèn)題:2、樣本中位數(shù)不受少數(shù)極端值的影響,這在某些情況下是一個(gè)優(yōu)點(diǎn),但它對(duì)極端值的不敏感有時(shí)也會(huì)成為缺點(diǎn)。你能舉例說(shuō)明嗎?答:優(yōu)點(diǎn):對(duì)極端數(shù)據(jù)不敏感的方法能夠有效地預(yù)防錯(cuò)誤數(shù)據(jù)的影響。對(duì)極端值不敏感有利的例子:例如當(dāng)樣本數(shù)據(jù)質(zhì)量比較差,即存在一些錯(cuò)誤數(shù)據(jù)(如數(shù)據(jù)錄入錯(cuò)誤、測(cè)量錯(cuò)誤等)時(shí),用抗極端數(shù)據(jù)強(qiáng)的中位數(shù)表示數(shù)據(jù)的中心值更準(zhǔn)確。缺點(diǎn):(1)出現(xiàn)錯(cuò)誤的數(shù)據(jù)也不知道;(2)對(duì)極端值不敏感有弊的例子:某人具有初級(jí)計(jì)算機(jī)專業(yè)技術(shù)水平,想找一份收入好的工作。這時(shí)如果采用各個(gè)公司計(jì)算機(jī)專業(yè)技術(shù)人員收入的中位數(shù)作為選擇工作的參考指標(biāo)就會(huì)冒這樣的風(fēng)險(xiǎn):很可能所選擇公司的初級(jí)計(jì)算機(jī)專業(yè)技術(shù)水平人員的收入很低,其原因是中位數(shù)對(duì)極小的數(shù)據(jù)不敏感。這里更好的方法是同時(shí)用平均工資和中位數(shù)作為參考指標(biāo),選擇平均工資較高且中位數(shù)較大的公司就業(yè).例1、下表是七位評(píng)委給某參賽選手的打分,總分為10分,你認(rèn)為如何計(jì)算這位選手的最后得分才較為合理?評(píng)委1號(hào)2號(hào)3號(hào)4號(hào)5號(hào)6號(hào)7號(hào)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論