第一節(jié) 隨機(jī)抽樣與用樣本估計總體_第1頁
第一節(jié) 隨機(jī)抽樣與用樣本估計總體_第2頁
第一節(jié) 隨機(jī)抽樣與用樣本估計總體_第3頁
第一節(jié) 隨機(jī)抽樣與用樣本估計總體_第4頁
第一節(jié) 隨機(jī)抽樣與用樣本估計總體_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第九章|

統(tǒng)計與成對數(shù)據(jù)的統(tǒng)計分析第一節(jié)隨機(jī)抽樣與用樣本估計總體1.了解總體、樣本、樣本量的概念及數(shù)據(jù)的隨機(jī)性.2.掌握簡單隨機(jī)抽樣及分層隨機(jī)抽樣,能根據(jù)實(shí)際問題的特點(diǎn),設(shè)計恰當(dāng)?shù)某闃臃椒?,解決實(shí)際問題.3.能根據(jù)實(shí)際問題的特點(diǎn),選擇恰當(dāng)?shù)慕y(tǒng)計圖表對數(shù)據(jù)進(jìn)行可視化描述.4.理解集中趨勢參數(shù)、離散程度參數(shù)的統(tǒng)計含義;能用樣本估計總體的取值規(guī)律;理解百分位數(shù)的統(tǒng)計含義.1.簡單隨機(jī)抽樣放回簡單隨機(jī)抽樣和不放回簡單隨機(jī)抽樣統(tǒng)稱為簡單隨機(jī)抽樣.除非特殊聲明,所稱的簡單隨機(jī)抽樣指不放回簡單隨機(jī)抽樣.(1)抽取方式:逐個不放回抽取;(2)特點(diǎn):每個個體被抽到的概率相等;(3)常用方法:抽簽法和

.隨機(jī)數(shù)法2.分層隨機(jī)抽樣(1)定義:一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨(dú)立地進(jìn)行_________抽樣,再把所有子總體中抽取的樣本_________作為總樣本,這樣的抽樣方法稱為分層隨機(jī)抽樣,每一個子總體稱為層.(2)比例分配:在分層隨機(jī)抽樣中,如果每層_______都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配.簡單隨機(jī)合在一起樣本量3.作頻率分布直方圖的步驟(1)求_____

(即一組數(shù)據(jù)中最大值與最小值的差);(2)決定組距與組數(shù);(3)將_____分組;(4)列頻率分布表;(5)畫頻率分布直方圖.極差數(shù)據(jù)4.其他統(tǒng)計圖表統(tǒng)計圖表主要應(yīng)用扇形圖直觀描述各類數(shù)據(jù)占總數(shù)的_____條形圖和直方圖直觀描述不同類別或分組數(shù)據(jù)的頻數(shù)和頻率折線圖描述數(shù)據(jù)隨_____的變化趨勢比例時間5.樣本的數(shù)字特征(1)簡單隨機(jī)抽樣和分層隨機(jī)抽樣在抽樣過程中每個個體被抽取的機(jī)會相等,分層隨機(jī)抽樣中各層抽樣時采用簡單隨機(jī)抽樣.(2)利用分層隨機(jī)抽樣要注意按比例抽取,若各層應(yīng)抽取的個體數(shù)不都是整數(shù),則應(yīng)當(dāng)調(diào)整各層容量,即先剔除各層中“多余”的個體.1.已知一組數(shù)據(jù)為20,30,40,50,50,60,70,80,則該組數(shù)據(jù)的平均數(shù)、中位數(shù)和眾數(shù)的大小關(guān)系是

(

)A.平均數(shù)>中位數(shù)>眾數(shù)B.平均數(shù)<中位數(shù)<眾數(shù)C.中位數(shù)<眾數(shù)<平均數(shù)D.平均數(shù)=中位數(shù)=眾數(shù)答案:D2.(人教A版必修第二冊P197·T1改編)如圖是60名學(xué)生參加數(shù)學(xué)競賽的成績(均為整數(shù))的頻率分布直方圖,估計這次數(shù)學(xué)競賽的及格率是

(

)A.75% B.25%C.15% D.40%答案:A3.某款具有社交屬性的健身APP,致力于提供健身教學(xué)、跑步、騎行、交友及健身飲食指導(dǎo)、裝備購買等一站式運(yùn)動解決方案.可以讓你隨時隨地進(jìn)行鍛煉,記錄你每天的訓(xùn)練進(jìn)程.不僅如此,它還可以根據(jù)不同人的體質(zhì),制定不同的健身計劃.小明根據(jù)該APP記錄的2021年1月至2021年11月期間每月跑步的里程(單位:十公里)數(shù)據(jù)整理并繪制了下面的折線圖.根據(jù)該折線圖,下列結(jié)論錯誤的是

(

)A.月跑步里程的最小值出現(xiàn)在2月B.月跑步里程逐月增加C.月跑步里程的中位數(shù)為5月份對應(yīng)的里程數(shù)D.1月至5月的月跑步里程相對于6月至11月波動性更小解析:由折線圖可知,月跑步里程的最小值出現(xiàn)在2月,故A正確;月跑步里程不是逐月增加的,故B不正確;月跑步里程數(shù)從小到大排列分別是:2月,8月,3月,4月,1月,5月,7月,6月,11月,9月,10月對應(yīng)的里程數(shù),故5月份對應(yīng)的里程數(shù)為中位數(shù),故C正確;由圖可知,1月至5月的月跑步里程相對于6月至11月波動性更小,變化比較平穩(wěn),故D正確.答案:B4.(蘇教版必修第二冊P220·T2改編)某校高一年級有900名學(xué)生,其中女生400名.按男女比例用分層隨機(jī)抽樣的方法,從該年級學(xué)生中抽取一個容量為45的樣本,則應(yīng)抽取的男生人數(shù)為________.答案:255.(人教A版必修第二冊P202·例2改編)一個容量為20的樣本,其數(shù)據(jù)按從小到大的順序排列為:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,則該組數(shù)據(jù)的第75百分位數(shù)為__________,第86百分位數(shù)為________.6.(人教A版必修第二冊P184·T3改編)某班級有50名同學(xué),一次數(shù)學(xué)測試平均成績是92分,如果30名男生的平均成績?yōu)?0分,那么20名女生的平均成績?yōu)開_______分.層級一/基礎(chǔ)點(diǎn)——自練通關(guān)(省時間)基礎(chǔ)點(diǎn)(一)抽樣方法

[題點(diǎn)全訓(xùn)]1.某班有男生36人,女生18人,用分層隨機(jī)抽樣的方法從該班全體學(xué)生中抽取一個容量為9的樣本,則抽取的女生人數(shù)為

(

)A.6 B.4C.3 D.22.(2022·廣州綜合測試)某公司生產(chǎn)A,B,C三種不同型號的轎車,其產(chǎn)量之比為2∶3∶4,為檢驗(yàn)該公司的產(chǎn)品質(zhì)量,用分層隨機(jī)抽樣的方法抽取一個容量為n的樣本,若樣本中A種型號的轎車比B種型號的轎車少8輛,則n=

(

)A.96 B.72

C.48 D.363.總體由編號為1,2,…,99,100的100個個體組成.現(xiàn)用隨機(jī)數(shù)法選取60個個體,利用電子表格軟件產(chǎn)生的若干個1~100范圍內(nèi)的整數(shù)隨機(jī)數(shù)的開始部分?jǐn)?shù)據(jù)如下,則選出來的第5個個體的編號為______.8

44

2

17

8

31

57

4

55

688

77

74

47

7

21

76

33

50

63解析:生成的隨機(jī)數(shù)中落在編號1~100范圍內(nèi)的有8,44,2,17,8(重復(fù),舍棄),31……故選中的第5個個體的編號為31.答案:314.某企業(yè)三個分廠生產(chǎn)同一種電子產(chǎn)品,三個分廠的產(chǎn)量分布如圖所示.現(xiàn)在用分層隨機(jī)抽樣的方法從三個分廠生產(chǎn)的產(chǎn)品中共抽取100件進(jìn)行使用壽命的測試,則第一分廠應(yīng)抽取的件數(shù)為________;測試結(jié)果為第一、二、三分廠取出的產(chǎn)品的平均使用壽命分別為1020小時,980小時,1030小時,估計這個企業(yè)生產(chǎn)的這批電子產(chǎn)品的平均使用壽命為________小時.解析:由分層隨機(jī)抽樣可知,第一分廠應(yīng)抽取100×50%=50(件).由樣本的平均數(shù)估計總體的平均數(shù),可知這批電子產(chǎn)品的平均使用壽命約為1020×50%+980×20%+1030×30%=1015(小時).答案:50

10152.已知一組樣本數(shù)據(jù)由小到大依次為2,3,3,7,a,b,12,13.7,18.3,20,且樣本的中位數(shù)為10.5,若使該樣本的方差最小,則a,b的值分別為

(

)A.10,11 B.9.5,10.5C.10.4,10.6 D.10.5,10.53.(2021·新高考Ⅰ卷改編)有一組樣本數(shù)據(jù)x1,x2,…,xn,由這組數(shù)據(jù)得到新樣本數(shù)據(jù)y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c為非零常數(shù),有以下結(jié)論:①兩組樣本數(shù)據(jù)的樣本平均數(shù)相同;②兩組樣本數(shù)據(jù)的樣本中位數(shù)相同;③兩組樣本數(shù)據(jù)的樣本標(biāo)準(zhǔn)差相同;④兩組樣本數(shù)據(jù)的樣本極差相同.其中正確結(jié)論的序號為________.基礎(chǔ)點(diǎn)(三)統(tǒng)計圖表的直觀應(yīng)用

[題點(diǎn)全訓(xùn)]1.某企業(yè)2021年12個月的收入與支出數(shù)據(jù)的折線圖如下:已知:利潤=收入-支出,根據(jù)該折線圖,下列說法不正確的是

(

)A.該企業(yè)2021年1月至6月的總利潤低于2021年7月至12月的總利潤B.該企業(yè)2021年1月至6月的平均收入低于2021年7月至12月的平均收入C.該企業(yè)2021年8月至12月的支出持續(xù)增長D.該企業(yè)2021年11月份的月利潤最大解析:因?yàn)閳D中的實(shí)線與虛線的相對高度表示當(dāng)月利潤.由折線統(tǒng)計圖可知1月至6月的相對高度的總量要比7月至12月的相對高度總量少,故A正確;由折線統(tǒng)計圖可知1月至6月的收入都普遍低于7月至12月的收入,故B正確;由折線統(tǒng)計圖可知2021年8月至12月支出的圖象是上升的,所以支出持續(xù)增長,故C正確;由折線統(tǒng)計圖可知11月的相對高度比7月、8月都要小,故D錯誤.答案:D

2.某學(xué)校為了了解本校學(xué)生的上學(xué)方式,在全校范圍內(nèi)隨機(jī)抽查部分學(xué)生,了解到上學(xué)方式主要有:A—結(jié)伴步行,B—自行乘車,C—家人接送,D—其他方式.并將收集的數(shù)據(jù)整理繪制成如圖所示的兩幅不完整的統(tǒng)計圖.根據(jù)圖中信息,下列說法不正確的是

(

)A.扇形圖中D的占比最小B.條形圖中A和C一樣高C.無法計算扇形圖中A的占比D.估計該校一半的學(xué)生選擇結(jié)伴步行或家人接送答案:

C

3.某地區(qū)經(jīng)過一年的新農(nóng)村建設(shè),農(nóng)村的經(jīng)濟(jì)收入增加了一倍,實(shí)現(xiàn)翻番.為更好地了解該地區(qū)農(nóng)村的經(jīng)濟(jì)收入變化情況,統(tǒng)計了該地區(qū)新農(nóng)村建設(shè)前后農(nóng)村的經(jīng)濟(jì)收入構(gòu)成比例,得到如下餅圖:則下面結(jié)論中不正確的是

(

)A.新農(nóng)村建設(shè)后,種植收入減少B.新農(nóng)村建設(shè)后,其他收入增加了一倍以上C.新農(nóng)村建設(shè)后,養(yǎng)殖收入增加了一倍D.新農(nóng)村建設(shè)后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和超過了經(jīng)濟(jì)收入的一半解析:設(shè)新農(nóng)村建設(shè)前的收入為M,則新農(nóng)村建設(shè)后的收入為2M,新農(nóng)村建設(shè)前種植收入為0.6M,新農(nóng)村建設(shè)后種植收入為0.74M,所以種植收入增加了,所以A不正確;新農(nóng)村建設(shè)前其他收入為0.04M,新農(nóng)村建設(shè)后其他收入為0.1M,故增加了一倍以上,所以B正確;新農(nóng)村建設(shè)前,養(yǎng)殖收入為0.3M,新農(nóng)村建設(shè)后為0.6M,增加了一倍,所以C正確;新農(nóng)村建設(shè)后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和占經(jīng)濟(jì)收入的30%+28%=58%>50%,所以超過了經(jīng)濟(jì)收入的一半,所以D正確.故選A.答案:A

[方法技巧]常見的能夠反映實(shí)際情況的統(tǒng)計圖有條形圖、折線圖、扇形圖等.扇形圖中每一個扇形的圓心角以及弧長,都與這一部分表示的數(shù)據(jù)大小成正比;折線圖能夠很直觀地體現(xiàn)數(shù)據(jù)隨時間的變化情況;條形圖可以直觀地體現(xiàn)各數(shù)據(jù)之間的數(shù)量關(guān)系;莖葉圖可以直觀展現(xiàn)各個數(shù)據(jù),而且能夠通過計算和分布情況體現(xiàn)各個數(shù)字特征.具體的應(yīng)用中要能夠準(zhǔn)確掌握各個統(tǒng)計圖的功能,同時要能夠準(zhǔn)確理解試題的環(huán)境含義.

層級二/重難點(diǎn)——逐一精研(補(bǔ)欠缺)重難點(diǎn)(一)統(tǒng)計圖表中的數(shù)字特征的計算

[典例]統(tǒng)計局就某地居民的月收入(單位:元)情況調(diào)查了10000人,并根據(jù)所得數(shù)據(jù)畫出了樣本頻率分布直方圖(如圖),每個分組包括左端點(diǎn),不包括右端點(diǎn),如第一組表示月收入在[2500,3000)內(nèi).(1)為了分析居民的收入與年齡、職業(yè)等方面的關(guān)系,必須按月收入再從這10000人中用分層隨機(jī)抽樣的方法抽出100人做進(jìn)一步分析,則月收入在[4000,4500)內(nèi)的應(yīng)抽取多少人?(2)估計該地居民月收入的中位數(shù)和眾數(shù);(3)假設(shè)同組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值為代表,估計該地居民月收入的平均數(shù).[解]

(1)因?yàn)?0.0002+0.0004+0.0003+0.0001)×500=0.5,所以2a×500=0.5,所以a=0.0005.又0.0005×500=0.25,所以月收入在[4000,4500)內(nèi)的頻率為0.25,所以月收入在[4000,4500)內(nèi)的應(yīng)抽取的人數(shù)為0.25×100=25.[針對訓(xùn)練]某小區(qū)為了提高小區(qū)內(nèi)人員的讀書興趣,準(zhǔn)備舉辦讀書活動,并購買一定數(shù)量的書籍豐富小區(qū)圖書站.由于不同年齡段的人看不同類型的書籍,為了合理配備資源,現(xiàn)對小區(qū)內(nèi)看書人員進(jìn)行年齡調(diào)查,隨機(jī)抽取了40名讀書者進(jìn)行調(diào)查,將他們的年齡(單位:歲)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如圖所示的頻率分布直方圖.(1)求在這40名讀書者中年齡分布在[40,70)的人數(shù);(2)求這40名讀書者的年齡的平均數(shù)和中位數(shù).解:(1)由頻率分布直方圖知,年齡在[40,70)的頻率為(0.020+0.030+0.025)×10=0.75.故這40名讀書者中年齡分布在[40,70)的人數(shù)為40×0.75=30.(2)這40名讀書者年齡的平均數(shù)為25×0.05+35×0.10+45×0.20+55×0.30+65×0.25+75×0.10=54.設(shè)中位數(shù)為x,則0.005×10+0.010×10+0.020×10+0.030×(x-50)=0.5,解得x=55.故這40名讀書者年齡的中位數(shù)為55.重難點(diǎn)(二)用樣本估計總體

[典例]

(2019·全國卷Ⅱ)某行業(yè)主管部門為了解本行業(yè)中小企業(yè)的生產(chǎn)情況,隨機(jī)調(diào)查了100個企業(yè),得到這些企業(yè)第一季度相對于前一年第一季度產(chǎn)值增長率y的頻率分布表.(1)分別估計這類企業(yè)中產(chǎn)值增長率不低于40%的企業(yè)比例、產(chǎn)值負(fù)增長的企業(yè)比例;(2)求這類企業(yè)產(chǎn)值增長率的平均數(shù)與標(biāo)準(zhǔn)差的估計值(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值為代表).(精確到0.01)y的分組[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企業(yè)數(shù)22453147[方法技巧]利用樣本的數(shù)字特征解決優(yōu)化決策問題的依據(jù)(1)平均數(shù)反映了數(shù)據(jù)取值的平均水平;標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大?。畼?biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定.(2)用樣本估計總體就是利用樣本的數(shù)字特征來描述總體的數(shù)字特征.

[針對訓(xùn)練]某校開展了線上教學(xué)活動.?dāng)?shù)學(xué)組積極研討網(wǎng)上教學(xué)策略:先采取甲、乙兩套方案教學(xué),并對分別采取兩套方案教學(xué)的班級的7次線上測試成績進(jìn)行統(tǒng)計,如圖所示.(1)請?zhí)顚懴卤?要求寫出計算過程).(2)從下列不同的角度對這次方案選擇的結(jié)果進(jìn)行分析:①從平均數(shù)和方差相結(jié)合看(分析哪種方案的成績更好);②從折線圖上兩種方案的走勢看(分析哪種方案更有潛力).

平均數(shù)方差甲

2.(樣本數(shù)字特征意義不清)為評估一種農(nóng)作物的種植效果,選了n塊地作試驗(yàn)田.這n塊地的畝產(chǎn)量(單位:kg)分別為x1,x2,…,xn,下面給出的指標(biāo)中可以用來評估這種農(nóng)作物畝產(chǎn)量穩(wěn)定程度的是

(

)A.x1,x2,…,xn的平均數(shù)B.x1,x2,…,xn的標(biāo)準(zhǔn)差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位數(shù)解析:評估這種農(nóng)作物畝產(chǎn)量穩(wěn)定程度的指標(biāo)是標(biāo)準(zhǔn)差.答案:B

解析:假設(shè)每月新增一組人,將其編號為1,2,3,4,…,則每個月接受調(diào)查的情況為:1月:1;2月:1,2;3月:2,3;4月:3,4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論