用樣本估計(jì)總體一_第1頁
用樣本估計(jì)總體一_第2頁
用樣本估計(jì)總體一_第3頁
用樣本估計(jì)總體一_第4頁
用樣本估計(jì)總體一_第5頁
已閱讀5頁,還剩87頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

用樣本估計(jì)總體一第1頁,課件共92頁,創(chuàng)作于2023年2月復(fù)習(xí)回顧1.抽樣方法有哪些?第2頁,課件共92頁,創(chuàng)作于2023年2月類別共同點(diǎn)各自特點(diǎn)相互聯(lián)系適用范圍簡(jiǎn)單隨機(jī)抽樣系統(tǒng)抽樣分層抽樣2.三種抽樣方式比較1.不放回抽樣2.抽樣過程中,每個(gè)個(gè)體被抽取的機(jī)會(huì)均等從總體中逐個(gè)抽取將總體均分為幾部分,按簡(jiǎn)單隨機(jī)抽樣抽取第一個(gè)樣本,然后按相同的間隔抽取其他樣本將總體分成幾層,分層進(jìn)行抽取抽取第一個(gè)樣本時(shí)采用簡(jiǎn)單隨機(jī)抽樣

各層抽樣時(shí),采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣總體中的個(gè)體數(shù)較少總體中的個(gè)體數(shù)較多(間隔相同的時(shí)間或距離)總體由差異明顯的幾部分組成第3頁,課件共92頁,創(chuàng)作于2023年2月練習(xí):在下列問題中,各采用什么抽樣方法抽取樣本較合適?1、從20臺(tái)電腦中抽取4臺(tái)進(jìn)行質(zhì)量檢測(cè);2、從2004名同學(xué)中,抽取一個(gè)容量為20的樣本3、某中學(xué)有180名教工,其中業(yè)務(wù)人員136名,管理人員20名,后勤人員24名,從中抽取一個(gè)容量為15的樣本。簡(jiǎn)單隨機(jī)抽樣系統(tǒng)抽樣分層抽樣第4頁,課件共92頁,創(chuàng)作于2023年2月

如何從樣本數(shù)據(jù)中提取基本信息來估計(jì)總體的情況呢?抽樣是統(tǒng)計(jì)的第一步,接下來就要對(duì)樣本進(jìn)行分析。第5頁,課件共92頁,創(chuàng)作于2023年2月2.2用樣本估計(jì)總體一、用樣本的頻率分布估計(jì)總體的分布二、用樣本的數(shù)字特征估計(jì)總體的特征平均數(shù)、中位數(shù)、眾數(shù)、極差、方差、標(biāo)準(zhǔn)差頻率分布表、頻率分布直方圖、頻率折線圖、莖葉圖第6頁,課件共92頁,創(chuàng)作于2023年2月①采用抽樣調(diào)查的方式獲得樣本數(shù)據(jù)②分析樣本數(shù)據(jù)來估計(jì)全市居民用水量的分布情況我國(guó)是世界上嚴(yán)重缺水的國(guó)家之一,城市缺水問題較為突出,某市政府為了節(jié)約生活用水,計(jì)劃在本市試行居民生活用水定額管理,即確定一個(gè)居民月用水量標(biāo)準(zhǔn)a,用水量不超過a的部分按平價(jià)收費(fèi),超出a的部分按議價(jià)收費(fèi)。如果希望大部分居民的日常生活不受影響,那么標(biāo)準(zhǔn)a定為多少比較合理呢?探究:你認(rèn)為,為了較為合理地確定出這個(gè)標(biāo)準(zhǔn),需要做哪些工作?

第7頁,課件共92頁,創(chuàng)作于2023年2月下表給出100位居民的月均用水量表

分析數(shù)據(jù)的一種基本方法是用圖將它們畫出來,或者用緊湊的表格改變數(shù)據(jù)的排列方式,作圖可以達(dá)到兩個(gè)目的,一是從數(shù)據(jù)中提取信息,二是利用圖形傳遞信息。表格則是通過改變數(shù)據(jù)的構(gòu)成形式,為我們提供解釋數(shù)據(jù)的新方式討論:如何分析數(shù)據(jù)?根據(jù)這些數(shù)據(jù)你能得出用水量其他信息嗎?為此我們要對(duì)這些數(shù)據(jù)進(jìn)行整理與分析第8頁,課件共92頁,創(chuàng)作于2023年2月初中我們?cè)?jīng)學(xué)過頻數(shù)分布圖和頻數(shù)分布表,這使我們能夠清楚地知道數(shù)據(jù)分布在各個(gè)小組的個(gè)數(shù)。下面將要學(xué)習(xí)的頻率分布圖和頻率分布表,則是從各個(gè)小組數(shù)據(jù)在樣本容量中所占比例大小的角度,來表示數(shù)據(jù)分布的規(guī)律。它可以使我們看到整個(gè)樣本數(shù)據(jù)的頻率分布情況。第9頁,課件共92頁,創(chuàng)作于2023年2月〈一〉頻率分布的概念:頻率分布是指一個(gè)樣本數(shù)據(jù)在各個(gè)小范圍內(nèi)所占比例的大小。一般用頻率分布直方圖反映樣本的頻率分布一、頻率分布直方圖第10頁,課件共92頁,創(chuàng)作于2023年2月第一步:求極差:(數(shù)據(jù)組中最大值與最小值的差距)

最大值=4.3最小值=0.2所以極差=4.3-0.2=4.1第二步:決定組距與組數(shù):

(注意取整)

當(dāng)樣本容量不超過100時(shí),按照數(shù)據(jù)的多少,常分成5~12組.為方便組距的選擇應(yīng)力求“取整”.本題如果組距為0.5(t).則第三步:將數(shù)據(jù)分組:(給出組的界限)

所以將數(shù)據(jù)分成9組較合適.

[0,0.5),[0.5,1),[1,1.5),……[4,4.5)共9組.

第11頁,課件共92頁,創(chuàng)作于2023年2月第四步:列頻率分布表.

分組頻數(shù)頻率頻率/組距[0-0.5)4[0.5-1)8[1-1.5)15[1.5-2)22[2-2.5)25[2.5-3)15[3-3.5)5[3.5-4)4[4-4.5)2合計(jì)100組距=0.5

0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.05第12頁,課件共92頁,創(chuàng)作于2023年2月為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第13頁,課件共92頁,創(chuàng)作于2023年2月為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第14頁,課件共92頁,創(chuàng)作于2023年2月為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第15頁,課件共92頁,創(chuàng)作于2023年2月為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第16頁,課件共92頁,創(chuàng)作于2023年2月

為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第17頁,課件共92頁,創(chuàng)作于2023年2月

為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第18頁,課件共92頁,創(chuàng)作于2023年2月

為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第19頁,課件共92頁,創(chuàng)作于2023年2月

為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第20頁,課件共92頁,創(chuàng)作于2023年2月

為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第21頁,課件共92頁,創(chuàng)作于2023年2月為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第22頁,課件共92頁,創(chuàng)作于2023年2月00.10.20.30.40.50.6

0.511.522.533.544.5頻率/組距

月均用水量/t

(組距=0.5)

0.080.160.30.440.50.30.10.080.04小長(zhǎng)方形的面積=?小長(zhǎng)方形的面積總和=?月均用水量居民人數(shù)最多的在哪個(gè)區(qū)間?請(qǐng)大家閱讀第68頁,直方圖有哪些優(yōu)點(diǎn)和缺點(diǎn)?第五步:畫出頻率分布直方圖.第23頁,課件共92頁,創(chuàng)作于2023年2月

同樣一組數(shù)據(jù),如果組距不同,橫軸、縱軸的單位不同,得到的圖的形狀也會(huì)不同.不同的形狀給人以不同的印象,這種印象有時(shí)會(huì)影響我們對(duì)總體的判斷.分別以1和0.1為組距重新作圖,然后談?wù)勀銓?duì)圖的印象.第24頁,課件共92頁,創(chuàng)作于2023年2月頻率分布直方圖的特征:1.頻率分布直方圖頻率分布表更直觀地反映了樣本的分布規(guī)律.2.從頻率分布直方圖得不出原始的數(shù)據(jù)內(nèi)容,把數(shù)據(jù)表示成直方圖后,原有的具體數(shù)據(jù)信息就被抹掉了。第25頁,課件共92頁,創(chuàng)作于2023年2月如果當(dāng)?shù)卣M?5%以上的居民每月的用水量不超出標(biāo)準(zhǔn),根據(jù)頻率分布表2-2和頻率分布直方圖2.2-1,你能對(duì)制定月用水量標(biāo)準(zhǔn)提出建議嗎?思考:88%的居民月用水量在3t以下,可建議取a=3.

第26頁,課件共92頁,創(chuàng)作于2023年2月小結(jié):

畫頻率分布直方圖的步驟:

第一步:求極差:(數(shù)據(jù)組中最大值與最小值的差距)

第二步:決定組距與組數(shù):(強(qiáng)調(diào)取整)

第三步:將數(shù)據(jù)分組

(給出組的界限)

第四步:列頻率分布表.

(包括分組、頻數(shù)、頻率、頻率/組距)

第五步:畫頻率分布直方圖(在頻率分布表的基礎(chǔ)上繪制,橫坐標(biāo)為樣本數(shù)據(jù)尺寸,縱坐標(biāo)為頻率/組距.)

組距:指每個(gè)小組的兩個(gè)端點(diǎn)的距離組數(shù):將數(shù)據(jù)分組,當(dāng)數(shù)據(jù)在100個(gè)以內(nèi)時(shí),按數(shù)據(jù)多少常分5-12組。第27頁,課件共92頁,創(chuàng)作于2023年2月注意(2)縱坐標(biāo)為:第28頁,課件共92頁,創(chuàng)作于2023年2月練習(xí):

例某地區(qū)為了了解知識(shí)分子的年齡結(jié)構(gòu),隨機(jī)抽樣50名,其年齡分別如下:

42,38,29,36,41,43,54,43,34,44,

40,59,39,42,44,50,37,44,45,29,

48,45,53,48,37,28,46,50,37,44,

42,39,51,52,62,47,59,46,45,67,

53,49,65,47,54,63,57,43,46,58.(1)列出樣本頻率分布表;(2)畫出頻率分布直方圖;(3)估計(jì)年齡在32~52歲的知識(shí)分子所占的比例約是多少.第29頁,課件共92頁,創(chuàng)作于2023年2月(1)極差為67-28=39,取組距為5,分為8組.

分組頻數(shù)頻率

[27,32)30.06[32,37)30.06[37,42)90.18[42,47)160.32[47,52)70.14[52,57)50.10[57,62)40.08[62,67)30.06

合計(jì)501.00樣本頻率分布表:第30頁,課件共92頁,創(chuàng)作于2023年2月(2)樣本頻率分布直方圖:年齡0.060.050.040.030.020.01273237424752576267頻率組距O(3)因?yàn)?.06+0.18+0.32+0.14=0.7,故年齡在32~52歲的知識(shí)分子約占70%.第31頁,課件共92頁,創(chuàng)作于2023年2月課堂練習(xí)2.(2006年全國(guó)卷II)一個(gè)社會(huì)調(diào)查機(jī)構(gòu)就某地居民的月收入調(diào)查了10000人,并根據(jù)所得數(shù)據(jù)畫了樣本的頻率分布直方圖(如下圖).為了分析居民的收入與年齡、學(xué)歷、職業(yè)等方面的關(guān)系,要從這10000人中再用分層抽樣方法抽出100人作進(jìn)一步調(diào)查,則在[2500,3000](元)月收入段應(yīng)抽出_______人.0.00010.00020.00030.00040.0005月收入(元)頻率/組距251000150020002500300035004000第32頁,課件共92頁,創(chuàng)作于2023年2月課堂練習(xí)0.30.14.34.54.74.95.1視力頻率/組距A.0.27,78 B.0.27,83C.2.7,78 D.2.7,83A第33頁,課件共92頁,創(chuàng)作于2023年2月2.2.1用樣本的頻率分布估計(jì)總體分布(二)第34頁,課件共92頁,創(chuàng)作于2023年2月頻率分布直方圖如下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5連接頻率分布直方圖中各小長(zhǎng)方形上端的中點(diǎn),得到頻率分布折線圖第35頁,課件共92頁,創(chuàng)作于2023年2月頻率分布折線圖由于樣本是隨機(jī)的,不同的樣本的得到的頻率分布折線圖不同,即使對(duì)于同一樣本,不同的分組情況得到的頻率分布折線圖也不同,頻率分布折線圖是隨著樣本的容量和分組情況的變化而變化的。第36頁,課件共92頁,創(chuàng)作于2023年2月利用樣本頻分布對(duì)總體分布進(jìn)行相應(yīng)估計(jì)(3)當(dāng)樣本容量無限增大,組距無限縮小,那么頻率折線圖就會(huì)無限接近于一條光滑曲線——總體密度曲線。(2)樣本容量越大,這種估計(jì)越精確。(1)上例的樣本容量為100,如果增至1000,其頻率分布直方圖的情況會(huì)有什么變化?假如增至10000呢?第37頁,課件共92頁,創(chuàng)作于2023年2月總體密度曲線頻率組距月均用水量/tab(圖中陰影部分的面積,表示總體在某個(gè)區(qū)間(a,b)內(nèi)取值的百分比)。第38頁,課件共92頁,創(chuàng)作于2023年2月

用樣本分布直方圖去估計(jì)相應(yīng)的總體分布時(shí),一般樣本容量越大,頻率分布直方圖就會(huì)無限接近總體密度曲線,就越精確地反映了總體的分布規(guī)律,即越精確地反映了總體在各個(gè)范圍內(nèi)取值百分比。

總體密度曲線反映了總體在各個(gè)范圍內(nèi)取值的百分比,精確地反映了總體的分布規(guī)律。是研究總體分布的工具.總體密度曲線并非所有的總體都存在密度曲線,如一些離散型總體不能由樣本折線圖得到準(zhǔn)確的總體密度曲線注:第39頁,課件共92頁,創(chuàng)作于2023年2月隨堂訓(xùn)練第40頁,課件共92頁,創(chuàng)作于2023年2月第41頁,課件共92頁,創(chuàng)作于2023年2月第42頁,課件共92頁,創(chuàng)作于2023年2月第43頁,課件共92頁,創(chuàng)作于2023年2月第44頁,課件共92頁,創(chuàng)作于2023年2月6.如圖是總體密度曲線,下列說法正確的是()(A)組距越大,頻率分布折線圖越接近于它(B)樣本容量越小,頻率分布折線圖越接近于它(C)陰影部分的面積代表總體在(a,b)內(nèi)取值的百分比(D)陰影部分的平均高度代表總體在(a,b)內(nèi)取值的百分比c第45頁,課件共92頁,創(chuàng)作于2023年2月莖葉圖某賽季甲、乙兩名籃球運(yùn)動(dòng)員每場(chǎng)比賽得分的原始記錄如下:甲運(yùn)動(dòng)員得分:13,51,23,8,26,38,16,33,14,28,39乙運(yùn)動(dòng)員得分:

49,24,12,31,50,31,44,36,15,37,25,36,39第46頁,課件共92頁,創(chuàng)作于2023年2月甲 乙0123452554161679490

84633683891葉 莖葉當(dāng)數(shù)據(jù)是兩位有效數(shù)字時(shí),用中間的數(shù)字表示十位數(shù),即第一個(gè)有效數(shù)字,兩邊的數(shù)字表示個(gè)位數(shù),即第二個(gè)有效數(shù)字,它的中間部分像植物的莖,兩邊部分像植物莖上長(zhǎng)出來的葉子,因此通常把這樣的圖叫做莖葉圖。1.莖葉圖:第47頁,課件共92頁,創(chuàng)作于2023年2月2.畫莖葉圖的步驟:1.將每個(gè)數(shù)據(jù)分為莖(高位)和葉(低位)兩部分,在此例中,莖為十位上的數(shù)字,葉為個(gè)位上的數(shù)字;2.將最小莖和最大莖之間的數(shù)按大小次序排成一列,寫在左(右)側(cè);3.將各個(gè)數(shù)據(jù)的葉按大小次序?qū)懺谄淝o右(左)側(cè).莖葉08134523683389451第48頁,課件共92頁,創(chuàng)作于2023年2月3.莖葉圖優(yōu)缺點(diǎn):

從統(tǒng)計(jì)圖上沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到;莖葉圖中的數(shù)據(jù)可以隨時(shí)記錄,隨時(shí)添加

,方便記錄與表示

莖葉圖只便于表示兩位或一位有效數(shù)字的數(shù)據(jù),對(duì)位數(shù)多的數(shù)據(jù)不太容易操作;莖葉圖只便于記錄兩組數(shù)據(jù),兩組以上的數(shù)據(jù)雖然能夠記錄但是沒有表示兩組記錄那么直觀、清晰莖葉圖對(duì)重復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄,不能遺漏注:優(yōu)點(diǎn):缺點(diǎn):第49頁,課件共92頁,創(chuàng)作于2023年2月甲、乙兩個(gè)小組各10名學(xué)生的英語口語測(cè)試成績(jī)?nèi)缦拢杭捉M76908486818786828583乙組82848589798091897974用莖葉圖表示兩小組的成績(jī),并判斷哪個(gè)小組的成績(jī)更整齊一些甲乙7894990245991

6766543210甲組成績(jī)較集中,所以甲組成績(jī)更穩(wěn)定一些例、第50頁,課件共92頁,創(chuàng)作于2023年2月

小結(jié)圖形優(yōu)點(diǎn)缺點(diǎn)頻率分布1)易表示大量數(shù)據(jù)丟失一些直方圖2)直觀地表明分布地情況信息1)無信息損失只能處理樣本莖葉圖2)隨時(shí)記錄方便記錄和表示容量較小數(shù)據(jù)第51頁,課件共92頁,創(chuàng)作于2023年2月幾種表示頻率分布的方法的優(yōu)點(diǎn)與不足1.頻率分布表在數(shù)量表示上比較確切,但不夠直觀、形象,分析數(shù)據(jù)分布的總體態(tài)勢(shì)不太方便。2.頻率分布直方圖能夠很容易地表示大量數(shù)據(jù),非常直觀地表明分布的形狀,使我們能夠看到在分布表中看不清楚的數(shù)據(jù)模式。但是從直方圖本身得不出原始的數(shù)據(jù)內(nèi)容。3.頻率分布折線圖的優(yōu)點(diǎn)是它反映了數(shù)據(jù)的變化趨勢(shì)。如果樣本容量不斷增大,分組的組距不斷縮小,那么折線圖就趨向于總體分布的密度曲線。4.用莖葉圖刻畫數(shù)據(jù)有兩個(gè)優(yōu)點(diǎn):一是所有的信息都可以從這個(gè)莖葉圖中得到;二是莖葉圖便于記錄和表示,能夠展示數(shù)據(jù)的分布情況。但當(dāng)樣本數(shù)據(jù)較多或數(shù)據(jù)位數(shù)較多時(shí),莖葉圖就顯得不太方便了。第52頁,課件共92頁,創(chuàng)作于2023年2月4.(2010·龍巖高一檢測(cè))如圖是某賽季甲、乙兩名籃球運(yùn)動(dòng)員參加的每場(chǎng)比賽得分的莖葉圖,則甲、乙兩人這幾場(chǎng)比賽得分的中位數(shù)之和是()(A)65(B)64(C)63(D)62第53頁,課件共92頁,創(chuàng)作于2023年2月用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征第54頁,課件共92頁,創(chuàng)作于2023年2月中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).

眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).

平均數(shù):一組數(shù)據(jù)的算術(shù)平均數(shù),即

三眾數(shù)、中位數(shù)、平均數(shù)的概念第55頁,課件共92頁,創(chuàng)作于2023年2月

問題1:眾數(shù)、中位數(shù)、平均數(shù)這三個(gè)數(shù)一般都會(huì)來自于同一個(gè)總體或樣本,它們能表明總體或樣本的什么性質(zhì)?平均數(shù):反映所有數(shù)據(jù)的平均水平

眾數(shù):反映的往往是局部較集中的數(shù)據(jù)信息

中位數(shù):是位置型數(shù),反映處于中間部位的數(shù)據(jù)信息

第56頁,課件共92頁,創(chuàng)作于2023年2月三種數(shù)字特征的優(yōu)缺點(diǎn)特征數(shù)優(yōu)點(diǎn)缺點(diǎn)眾數(shù)體現(xiàn)了樣本數(shù)據(jù)的最大集中點(diǎn)無法客觀反映總體特征中位數(shù)不受少數(shù)極端值的影響不受少數(shù)極端值的影響有時(shí)也是缺點(diǎn)平均數(shù)與每一個(gè)數(shù)據(jù)有關(guān),更能反映全體的信息.受少數(shù)極端值的影響較大,使其在估計(jì)總體時(shí)的可靠性降低.第57頁,課件共92頁,創(chuàng)作于2023年2月月均用水量/t頻率/組距o4.543.532.521.510.50.500.400.300.200.10思考1:如何從頻率分布直方圖中估計(jì)眾數(shù)?2.25

眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點(diǎn)的橫坐標(biāo)。第58頁,課件共92頁,創(chuàng)作于2023年2月思考2:如何從頻率分布直方圖中估計(jì)中位數(shù)?

0.020.040.060.140.250.220.150.080.04月均用水量/t頻率/組距o4.543.532.521.510.50.500.400.300.200.10前四個(gè)小矩形的面積和=0.492.02后四個(gè)小矩形的面積和=0.26分析:在樣本數(shù)據(jù)中,有50%的個(gè)體小于或等于中位數(shù),也有50%的個(gè)體大于或等于中位數(shù),因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等。

總結(jié):在頻率分布直方圖中,把頻率分布直方圖劃分左右兩個(gè)面積相等的分界線與x軸交點(diǎn)的橫坐標(biāo)稱為中位數(shù)。

注:圖中的數(shù)據(jù)是小矩形的面積即頻率上圖中,設(shè)中位數(shù)為x,則

第59頁,課件共92頁,創(chuàng)作于2023年2月

思考3:如何從頻率分布直方圖中估計(jì)平均數(shù)?

注:圖中的數(shù)據(jù)是小矩形的面積即頻率0.020.040.060.140.250.220.150.080.04月均用水量/t頻率/組距o4.543.532.521.510.50.500.400.300.200.10........0.250.751.251.752.25.2.753.253.754.25平均數(shù)等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和。2.02第60頁,課件共92頁,創(chuàng)作于2023年2月在頻率分布直方圖中如何估計(jì)眾數(shù)?月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5眾數(shù):頻率分布直方圖中最高小長(zhǎng)方形底邊中點(diǎn)的橫坐標(biāo).左圖中,眾數(shù)為_____.2.25第61頁,課件共92頁,創(chuàng)作于2023年2月在頻率分布直方圖中如何估計(jì)中位數(shù)?月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5中位數(shù):在頻率分布直方圖中,把頻率分布直方圖劃分左右兩個(gè)面積相等的分界線與x軸交點(diǎn)的橫坐標(biāo)。左圖中,中位數(shù)為____.2.02第62頁,課件共92頁,創(chuàng)作于2023年2月在頻率分布直方圖中如何估計(jì)平均數(shù)?月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和.左圖中,平均數(shù)為____.2.02第63頁,課件共92頁,創(chuàng)作于2023年2月方差與標(biāo)準(zhǔn)差第64頁,課件共92頁,創(chuàng)作于2023年2月1.頻率分布折線圖:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5連接頻率分布直方圖中各小長(zhǎng)方形上端的中點(diǎn),得到頻率分布折線圖復(fù)習(xí)提問:第65頁,課件共92頁,創(chuàng)作于2023年2月2.總體密度曲線頻率組距月均用水量/tab(圖中陰影部分的面積,表示總體在某個(gè)區(qū)間(a,b)內(nèi)取值的百分比)。第66頁,課件共92頁,創(chuàng)作于2023年2月3.莖葉圖優(yōu)缺點(diǎn):

從統(tǒng)計(jì)圖上沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到;莖葉圖中的數(shù)據(jù)可以隨時(shí)記錄,隨時(shí)添加

,方便記錄與表示

莖葉圖只便于表示兩位或一位有效數(shù)字的數(shù)據(jù),對(duì)位數(shù)多的數(shù)據(jù)不太容易操作;莖葉圖只便于記錄兩組數(shù)據(jù),兩組以上的數(shù)據(jù)雖然能夠記錄但是沒有表示兩組記錄那么直觀、清晰莖葉圖對(duì)重復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄,不能遺漏注:優(yōu)點(diǎn):缺點(diǎn):第67頁,課件共92頁,創(chuàng)作于2023年2月在頻率分布直方圖中如何估計(jì)眾數(shù)?月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5眾數(shù):頻率分布直方圖中最高小長(zhǎng)方形底邊中點(diǎn)的橫坐標(biāo).左圖中,眾數(shù)為_____.2.25第68頁,課件共92頁,創(chuàng)作于2023年2月在頻率分布直方圖中如何估計(jì)中位數(shù)?月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5中位數(shù):在頻率分布直方圖中,把頻率分布直方圖劃分左右兩個(gè)面積相等的分界線與x軸交點(diǎn)的橫坐標(biāo)。左圖中,中位數(shù)為____.2.02第69頁,課件共92頁,創(chuàng)作于2023年2月在頻率分布直方圖中如何估計(jì)平均數(shù)?月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和.左圖中,平均數(shù)為____.2.02第70頁,課件共92頁,創(chuàng)作于2023年2月

引言:

樣本的眾數(shù)、中位數(shù)和平均數(shù)常用來表示樣本數(shù)據(jù)的“中心值”,其中眾數(shù)和中位數(shù)容易計(jì)算,不受少數(shù)幾個(gè)極端值的影響,但只能表達(dá)樣本數(shù)據(jù)中的少量信息.平均數(shù)代表了數(shù)據(jù)更多的信息,但受樣本中每個(gè)數(shù)據(jù)的影響,越極端的數(shù)據(jù)對(duì)平均數(shù)的影響也越大.當(dāng)樣本數(shù)據(jù)質(zhì)量比較差時(shí),使用眾數(shù)、中位數(shù)或平均數(shù)描述數(shù)據(jù)的中心位置,可能與實(shí)際情況產(chǎn)生較大的誤差,難以反映樣本數(shù)據(jù)的實(shí)際狀況,因此,我們需要一個(gè)統(tǒng)計(jì)數(shù)字刻畫樣本數(shù)據(jù)的離散程度.第71頁,課件共92頁,創(chuàng)作于2023年2月情境一:

某農(nóng)場(chǎng)種植了甲、乙兩種玉米苗,從中各抽取了10株,分別測(cè)得它們的株高如下:(單位cm)

甲:31323537333032313029乙:53165413661613111662思考:哪種玉米苗長(zhǎng)得齊?第72頁,課件共92頁,創(chuàng)作于2023年2月甲37(最大值)-

29(最小值

=8乙66(最大值)-11(最小值)=55極差

甲:31323537333032313029

乙:53165413661613111662甲32372937321166乙第73頁,課件共92頁,創(chuàng)作于2023年2月情景二:在一次射擊選拔賽中,甲、乙兩名運(yùn)動(dòng)員各射擊10次,每次命中的環(huán)數(shù)如下:甲:78795491074乙:9578768677

甲、乙兩人本次射擊的平均成績(jī)分別為多少環(huán)?第74頁,課件共92頁,創(chuàng)作于2023年2月思考:甲、乙兩人射擊的平均成績(jī)相等,觀察兩人成績(jī)的頻率分布條形圖,你能說明其水平差異在那里嗎?環(huán)數(shù)甲的成績(jī)比較分散,極差較大,乙的成績(jī)相對(duì)集中,比較穩(wěn)定.第75頁,課件共92頁,創(chuàng)作于2023年2月極差:一組數(shù)據(jù)的最大值與最小值的差極差越大,數(shù)據(jù)越分散,越不穩(wěn)定極差越小,數(shù)據(jù)越集中,越穩(wěn)定極差體現(xiàn)了數(shù)據(jù)的離散程度.第76頁,課件共92頁,創(chuàng)作于2023年2月

為了對(duì)玉米生長(zhǎng)的高度差異以及兩人射擊水平的穩(wěn)定程度等做個(gè)合理的評(píng)價(jià),我們用一個(gè)新的概念來研究,方差和標(biāo)準(zhǔn)差.有沒有一種可能兩組數(shù)據(jù)極差相同但是穩(wěn)定性差別很大呢?思考第77頁,課件共92頁,創(chuàng)作于2023年2月甲的環(huán)數(shù)極差=10-4=6

乙的環(huán)數(shù)極差=9-5=4.

它們?cè)谝欢ǔ潭壬媳砻髁藰颖緮?shù)據(jù)的分散程度,與平均數(shù)一起,可以給我們?cè)S多關(guān)于樣本數(shù)據(jù)的信息.顯然,極差對(duì)極端值非常敏感,注意到這一點(diǎn),我們可以得到一種“去掉一個(gè)最高分,去掉一個(gè)最低分”的統(tǒng)計(jì)策略.考察樣本數(shù)據(jù)的分散程度的大小,最常用的統(tǒng)計(jì)量是標(biāo)準(zhǔn)差.標(biāo)準(zhǔn)差是樣本數(shù)據(jù)到平均數(shù)的一種平均距離,一般用s表示.所謂“平均距離”,其含義可作如下理解:第78頁,課件共92頁,創(chuàng)作于2023年2月由于上式含有絕對(duì)值,運(yùn)算不太方便,因此,通常改用如下公式來計(jì)算標(biāo)準(zhǔn)差.方差:第79頁,課件共92頁,創(chuàng)作于2023年2月對(duì)于樣本數(shù)據(jù)x1,x2,…,xn,設(shè)想通過各數(shù)據(jù)到其平均數(shù)的平均距離來反映樣本數(shù)據(jù)的分散程度,那么這個(gè)平均距離如何計(jì)算?標(biāo)準(zhǔn)差的概念:第80頁,課件共92頁,創(chuàng)作于2023年2月計(jì)算標(biāo)準(zhǔn)差的公

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論