統(tǒng)計(jì)初步及成對數(shù)據(jù)的統(tǒng)計(jì)分析_第1頁
統(tǒng)計(jì)初步及成對數(shù)據(jù)的統(tǒng)計(jì)分析_第2頁
統(tǒng)計(jì)初步及成對數(shù)據(jù)的統(tǒng)計(jì)分析_第3頁
統(tǒng)計(jì)初步及成對數(shù)據(jù)的統(tǒng)計(jì)分析_第4頁
統(tǒng)計(jì)初步及成對數(shù)據(jù)的統(tǒng)計(jì)分析_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二十二講:統(tǒng)計(jì)初步及成對數(shù)據(jù)的統(tǒng)計(jì)分析

【考點(diǎn)梳理】

1.統(tǒng)計(jì)初步

(1)隨機(jī)抽樣:簡單隨機(jī)抽樣,分層抽樣

(2)用樣本估計(jì)總體:頻率分布直方圖,樣本數(shù)字特征(百分位數(shù)、平均數(shù)、眾數(shù)、中位數(shù)、方差、

標(biāo)準(zhǔn)差)

特征數(shù)具體數(shù)字算法頻率分布直方圖(表)

眾數(shù)次數(shù)出現(xiàn)最多的數(shù)字頻率最大或最高組的中間值

中位數(shù)樣本數(shù)據(jù)中,將數(shù)據(jù)按大小排列,位于最中間

的數(shù)據(jù).如果數(shù)據(jù)的個(gè)數(shù)為偶數(shù),就取當(dāng)中兩

個(gè)數(shù)據(jù)的平均數(shù)作為中位數(shù)

平均數(shù)所有數(shù)字之和除以總個(gè)數(shù)每個(gè)小矩形面積乘以小矩形底邊中點(diǎn)的橫坐

標(biāo)之和

方差2++(—]

平均數(shù)反映了數(shù)據(jù)取值的平均水平,標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)波動的大小.標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)

的離散程度越大,越不穩(wěn)定;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定

2.成對數(shù)據(jù)的統(tǒng)計(jì)分析

(1)相關(guān)關(guān)系,(2)回歸分析,(3)獨(dú)立性檢驗(yàn)

【典型題型講解】

考點(diǎn)一:抽樣:簡單隨機(jī)抽樣分層抽樣

【典例例題】

例1.某工廠利用隨機(jī)數(shù)表對生產(chǎn)的700個(gè)零件進(jìn)行抽樣測試,先將700個(gè)零件進(jìn)行編號,001,002,.........

699,700.從中抽取70個(gè)樣本,下圖提供隨機(jī)數(shù)表的第4行到第6行,若從表中第5行第6列開始向右讀取

數(shù)據(jù),則得到的第6個(gè)樣本編號是()

32211834297864540732524206443812234356773578905642

84421253313457860736253007328623457889072368960804

32567808436789535577348994837522535578324577892345

A.623B.328C.253D.007

【答案】A

【解析】從第5行第6列開始向又讀取數(shù)據(jù),

第一個(gè)數(shù)為253,第二個(gè)數(shù)是313,第三個(gè)數(shù)是457,

下一個(gè)數(shù)是860,不符合要求,下一個(gè)數(shù)是736,不符合要求,下一個(gè)是253,重復(fù),

第四個(gè)是007,第五個(gè)是328,第六個(gè)是623.

故選:A.

例2.2022年7月24日,搭載問天實(shí)驗(yàn)艙的長征五號B1000人,高二學(xué)生800人,高三學(xué)生1200人,為了調(diào)

查該校學(xué)生對我國航天事業(yè)的了解程度,現(xiàn)從三個(gè)年級中采用分層抽樣的方式抽取60人填寫問卷調(diào)查,則

高三年級有多少人被抽中()

A.16B.18C.20D.24

【答案】D

【解析】由分層抽樣原則可知:高三年級應(yīng)抽取曾,”c=24人.

1000+800+1200

故選:D.

【方法技巧與總結(jié)】

根據(jù)樣本數(shù)據(jù)的特點(diǎn)要判定采用隨機(jī)簡單抽樣和分層抽樣

【變式訓(xùn)練】

1.某個(gè)年級有男生180人,女生160人,用分層抽樣的方法從該年級全體學(xué)生中抽取一個(gè)容量為68的樣本,

則此樣本中女生人數(shù)為()

A.40B.36C.34D.32

【答案】D

【解析】由題意得:樣本中女生人數(shù)為68x32.

故選:D

2.某中學(xué)為了掌握學(xué)校員工身體狀況,偶爾會采用抽檢的方式來收集各部門員工的健康情況.為了讓樣本更

具有代表性,學(xué)校對各部門采用分層抽樣的方法進(jìn)行抽檢.已知該校部門A、部門8、部門C分別有40、

60、80人,各部門員工不存在交叉任職情況,若共抽檢了90人,則部門A抽檢人數(shù)為.

【答案】20

【解析】由題意得從部「JA抽檢人數(shù)為90xk^^=20(人),

故答案為:20

3.某市甲、乙、丙三所學(xué)校的高三學(xué)生共有800名,其中男、女生人數(shù)如下表:

甲校乙校丙校

9790X

女生153160y

(1)現(xiàn)用分層隨機(jī)抽樣的方法從這三所學(xué)校的所有高三學(xué)生中抽取48人,則應(yīng)從丙校抽取多少人?

(2)該市??己?,市教研室準(zhǔn)備從這三所學(xué)校的所有高三學(xué)生中利用隨機(jī)數(shù)法抽取100人進(jìn)行成績統(tǒng)計(jì)分析,

將800人按001,002,800進(jìn)行編號,如果從第8行第7列的數(shù)開始向右讀,請你依次寫出最先抽取

的4個(gè)人的編號.(下面摘取了隨機(jī)數(shù)表第7行至第9行)

84421753315724550688770474476721763350268392

63015316591692753816582170717512867358074439

13263321134278641607825207443815032442997931

【解析】⑴根據(jù)題意可得丙校共有“k8(刈-(97+153+90+160)=300人,

根據(jù)分層抽樣規(guī)則可得,應(yīng)從丙校抽取4就8x3OO=18人.

oOu

(2)第8行第7列的數(shù)為1,從數(shù)1開始向右讀,則最先抽取的4個(gè)人的編號為165,538,707,175.

考點(diǎn)二:樣本數(shù)字特征

【典例例題】

例1.(2022?廣東中山?高三期末)甲、乙兩支田徑隊(duì)的體檢結(jié)果為:甲隊(duì)體重的平均數(shù)為60kg,方差為200,

乙隊(duì)體重的平均數(shù)為70kg,方差為300,又已知甲、乙兩隊(duì)的隊(duì)員人數(shù)之比為1:4,那么甲、乙兩隊(duì)全部

隊(duì)員的平均體重和方差分別是()

A.65,280B.68,280C.65,296D.68,296

【答案】B

【解析】設(shè)甲隊(duì)有a人,甲、乙兩隊(duì)的隊(duì)員人數(shù)之比為1:4,則乙隊(duì)有4a人,

因?yàn)榧钻?duì)體重的平均數(shù)為60,乙隊(duì)體重的平均數(shù)為70,

則甲、乙兩隊(duì)全部隊(duì)員的平均體重為

-60-a+70-4o

x=-----------=68,

5a

甲隊(duì)體重的方差

.d=-[(x,-60)2+(x-60)2+-+(x-60)2]=200

a2a

=—[(x;+x:++x;)+。?6()2—2x60x(x+占++X)]

a-(a

=_[(x:+x;++x;)+a-602-2x60x(60-a)]=200

a

則x;+x;++x;=200a+〃6。2

乙隊(duì)體重的方差為

s;=;[(乂-70)2+(%-70)2++(加?70)2]=300

=;[(犬+貨++>i)+4a.702-2x70x(y+%++%)]

=L(y;+4++犬,)+44.7()2-2X70X(70-4a)]=300

4。

2

貝+++y^a=300-4a+4^-70

甲、乙兩隊(duì)全部隊(duì)員體重的方差為

_[(X,-68)2+(X-68)2++(/-632_2+(%一68)2++(y-68)2]

s2一2]+[(y)68)4fl

5a

——[(x;+x;++芍)+Q?68?—2x68x(%+/++4)]+

5a

41(犬+£++yl,)+4a-682-2x68x(y,+y,++%)]

ja

=—[(200a+a602)+a-682-2x68x(60-a)]+—[(300.4a+4a-702)+4?-682-2x68x(70.4a)]

5a5a

故選:B.

例2.(2022?廣東深圳?高三期末)為了分析某次考試的情況,隨機(jī)抽取了若干學(xué)生,將其考試成績分組為:

[60,70),[70,80),[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],并繪制

成如下圖所示的頻率分布直方圖,據(jù)此可估計(jì)該次考試成績的中位數(shù)小€化歡+1),則整數(shù)k的值為()

A.99B.100C.101D.102

【答案】B

【詳解】考試成績在[90,100)內(nèi)的頻率為:

P=1-(0.004+0.008+0.015+0.025+0.015+0.006+0.004+0.002)x10=0.21,

則前4組考試成績頻率分別為:

[60,70),0.04

[70,80),0.08

[80,90),0.15

[90,100),0.21

考試成績的中位數(shù)為機(jī),

則().04+0.08+0.15+0.21+(加-100)x0.025=0.5,

.?./n=100.8e(l(X),101)

.?"=100

故選:B.

例3.(2021?廣東汕頭?高三期末)某中學(xué)為了解學(xué)生數(shù)學(xué)史知識的積累情況,隨機(jī)抽取150名同學(xué)參加數(shù)學(xué)

史知識測試,測試題共5道,每答對一題得20分,答錯(cuò)得0分.得分不少于60分記為及格,不少于80分

記為優(yōu)秀,測試成績百分比分布圖如圖所示,則()

A.該次數(shù)學(xué)史知識測試及格率超過90%

B.該次數(shù)學(xué)史知識測試得滿分的同學(xué)有15名

C.該次測試成績的中位數(shù)大于測試成績的平均數(shù)

D.若該校共有1500名學(xué)生,則數(shù)學(xué)史知識測試成績能得優(yōu)秀的同學(xué)大約有720名

【答案】AC

【詳解】由圖知,及格率為1-8%=92%>90%,故A正確.

該測試滿分同學(xué)的百分比為1—8%-32%-48%=12%,即有12%xl50=18名,B錯(cuò)誤.

由圖知,中位數(shù)為80分,平均數(shù)為40x8%+60x32%+80x48%+100xl2%=72.8分,故C正確.

由題意,1500名學(xué)生成績能得優(yōu)秀的同學(xué)有1500x(48%+12%)=900,故D錯(cuò)誤.

故選:AC

例4.2021年7月至2022年7月,我國居民消費(fèi)價(jià)格保持平穩(wěn),居民消費(fèi)價(jià)格漲跌幅如圖所示,則()

全國居民消費(fèi)價(jià)格漲跌幅

夕*當(dāng)月消費(fèi)價(jià)格-去年同期消費(fèi)價(jià)格,4小.上.令

備汪:同比增長率=------去年同期消費(fèi)補(bǔ)格-------環(huán)比AA增0長,率=

當(dāng)月消費(fèi)價(jià)格-上月同期消費(fèi)價(jià)格1m。/

上月同期消費(fèi)價(jià)格,0,

A.2022年1月全國居民消費(fèi)價(jià)格比2021年1月全國居民消費(fèi)價(jià)格有所下降

B.2022年5月全國居民消費(fèi)價(jià)格比2022年4月全國居民消費(fèi)價(jià)格有所上升

C.2021年7月至2022年7月全國居民消費(fèi)價(jià)格同比增長率的40%分位數(shù)為1.0%

D.2021年10月至2022年7月全國居民消費(fèi)價(jià)格環(huán)比增長率的平均數(shù)為0.25%

【答案】D

【解析】*jA,從圖中可以看出2022年1月全國居民消費(fèi)價(jià)格的同比增長率為0.9%>0,

所以2022年1月全國居民消費(fèi)價(jià)格有所上升,故A錯(cuò)誤;

對B,由圖2022年5月全國居民消費(fèi)價(jià)格環(huán)比增長率為-0.2%<0,

所以2022年5月全國居民消費(fèi)價(jià)格有所下降,故B錯(cuò)誤;

對C,將C選項(xiàng)中的數(shù)據(jù)由小到大排列得,

0.7%,0.8%,0.9%0.9%,1%,1.5%,1.5%,1.5%,2.1%,2.1%,2.3%,2.5%,2.7%,

因?yàn)?3x40%=5.2,則同比增長率的40%分位數(shù)為第6個(gè)數(shù)1.5%,故C錯(cuò)誤;

對D,環(huán)比增長率的平均數(shù)為

-----------------------------------------------=0.25%,故D正確.

故選:D

【方法技巧與總結(jié)】

1、頻率分布直方圖

(1)利用頻率分布直方圖求頻率、頻數(shù);

(2)利用頻率分布直方圖估計(jì)總體.

(3)頻率分布直方圖的縱坐標(biāo)是頻率除以組距,而不是頻率.

2、百分位數(shù)

計(jì)算一組,,個(gè)數(shù)據(jù)的的第〃百分位數(shù)的步驟

①按從小到大排列原始數(shù)據(jù).

②計(jì)算p%.

③若i不是整數(shù)而大于i的比鄰整數(shù)則第“百分位數(shù)為第./項(xiàng)數(shù)據(jù);若,是整數(shù),則第〃百分位數(shù)

為第j項(xiàng)與第j+1項(xiàng)數(shù)據(jù)的平均數(shù).

【變式訓(xùn)練】

1.(2022?廣東東莞?高三期末)氣象意義上從春季進(jìn)入夏季的標(biāo)志為“當(dāng)且僅當(dāng)連續(xù)5天每天日平均溫度不低

于22C”.現(xiàn)有甲、乙、丙三地連續(xù)5天日平均溫度的記錄數(shù)據(jù)(數(shù)據(jù)均為正整數(shù),單位C)且滿足以下條

件:

甲地:5個(gè)數(shù)據(jù)的中位數(shù)是24,眾數(shù)是22;

乙地:5個(gè)數(shù)據(jù)的中位數(shù)是27,平均數(shù)是24;

丙地:5個(gè)數(shù)據(jù)有1個(gè)是30,平均數(shù)是24,方差是9.6;

根據(jù)以上數(shù)據(jù),下列統(tǒng)計(jì)結(jié)論正確的是()

A.甲地進(jìn)入了夏季B.乙地進(jìn)入了夏季

C.不能確定丙地進(jìn)入了夏季D.恰有2地確定進(jìn)入了夏季

【答案】AC

【詳解】甲地:5個(gè)數(shù)據(jù)由小到大排,則22,22,24,。,b,其中24<。<6,滿足進(jìn)入夏季的標(biāo)志;

乙地:將5個(gè)數(shù)據(jù)由小到大排,則。,b,27,c,d,其中,

貝IJ27+C+4281,而a+6+27+c+d=120,

故。+。439,其中必有一個(gè)小于22,故不滿足一定進(jìn)入夏季的標(biāo)志;

丙地:設(shè)5個(gè)數(shù)據(jù)為。,b,c,d,30,且。力,c,dwZ,

由方差公式可知:(a-24)2+e_24)2+?_24)2+①_24y+(3。_24y=9.6X5=48,

貝ij(a-24)2+0-24)2+(c-24)2+("-24『=12=9+1+1+1,

不妨設(shè)|。-24|=3,|。_26|=1,卜_26|=._26|=1,

則匕,%d均大于22,但。不確定是否大于22,故不能確定丙地進(jìn)入夏天.

故選:AC.

2.如圖1為某省2019年17月份快遞業(yè)務(wù)量統(tǒng)計(jì)圖,圖2為該省2019年17月份快遞業(yè)務(wù)收入統(tǒng)計(jì)圖,對

統(tǒng)計(jì)圖理解不正確的是()

口快遞、業(yè)務(wù)量(萬件)?同比增長率(%)口快遞業(yè)務(wù)收入(萬元)?同比增長率(%)

圖1圖2

A.2019年1?4月份快遞業(yè)務(wù)量3月份最高,2月份最低,差值接近2000萬件

B.從1?4月份來看,業(yè)務(wù)量與業(yè)務(wù)收入有波動,但整體保持高速增長

C.從兩圖中看,增量與增長速度并不完全一致,但業(yè)務(wù)量與業(yè)務(wù)收入變化高度一致

D.2019年1?4月份快遞業(yè)務(wù)量同比增長率均超過50%,在3月份最高,和春節(jié)后網(wǎng)購迎來噴漲有關(guān)

【答案】B

【解析】從圖(1)的柱形圖可得2019年1-4月份快遞業(yè)務(wù)量3月份最高,2月份最低,

3月份比2月份高4397-2411=1986,差值接近2000萬件,故A正確.

從1?4月份來看,業(yè)務(wù)量與業(yè)務(wù)收入有波動,結(jié)合圖(1)(2)中的柱形圖可得業(yè)務(wù)量與業(yè)務(wù)收入在2月份

和4月份均下降,故B錯(cuò)誤.

從兩圖中柱狀圖可得業(yè)務(wù)量與業(yè)務(wù)收入變化高度一致,但業(yè)務(wù)量2月份同比增長53%,而業(yè)務(wù)收入2月份

同比增長30%,因此增量與增長速度并不完全一致,故C正確.

從圖(I)中可得2019年1?4月份快遞業(yè)務(wù)量同比增長率均超過50%,在3月份最高,這的確和春節(jié)后網(wǎng)

購迎來噴漲有關(guān),故D正確.

故選:B.

3.(2022?廣東清遠(yuǎn)?高三期末)某學(xué)校組織了一次勞動技能大賽,共有100名學(xué)生參賽,經(jīng)過評判,這100

名參賽者的得分都在[40,90]內(nèi),得分60分以下為不及格,其得分的頻率分布直方圖如圖所示(按得分分成

[40,50),[50,60),[60,70),[70,80),[80,90]這五組),則下列結(jié)論正確的是()

B.此次比賽得分不及格的共有40人

C.以頻率為概率,從這100名參賽者中隨機(jī)選取1人,其得分在[60,80)

D.這100名參賽者得分的中位數(shù)為65

【答案】ABC

【詳解】因?yàn)?+0.01+0.02+0.03+0.035)*10=1,所以。=0.005,所以A正確;

因?yàn)椴患案竦娜藬?shù)為100x(0.005+0.035)x10=40,所以B正確;

因?yàn)榈梅衷赱60,80)的頻率為(0.03+0.02)x10=0.5,所以從這100名參賽者中隨機(jī)選取1人,其得分在[60,80)

的概率為0.5,所以C正確;

這100名參賽者得分的中位數(shù)為60+蕊R65,所以D錯(cuò)誤.

故選:ABC.

4.(2022?廣東汕頭?一模)在黨史學(xué)習(xí)教育動員大會上,習(xí)近平總書記強(qiáng)調(diào)全黨同志要做到學(xué)史明理、學(xué)史

增信、學(xué)史崇德,學(xué)史力行.某單位對200名黨員進(jìn)行黨史知識測試,將成績分成6組:[70,75),[75,80),

[80,85),[85,90),[90,95),[95,100],得到如圖所示的頻率分布直方圖,則。=.

【詳解】由(0.020+0.025+0.030+0.035+0.040+4)x5=1,

解得a=0.050.

5.(2022?廣東廣東?一模)(多選)為了解某地農(nóng)村經(jīng)濟(jì)情況,對該地農(nóng)戶家庭年收入進(jìn)行抽樣調(diào)查,將農(nóng)

戶家庭年收入調(diào)查數(shù)據(jù)整理得到如下頻率分布直方圖(如圖):

根據(jù)此頻率分布直方圖,下面結(jié)論中正確的是()

A.該地農(nóng)戶家庭年收入低于4.5萬元的農(nóng)戶比率估計(jì)為6%

【答案】.ABC

0.02+0.04=0.06=6%,所以比率估計(jì)為6%,故A正確;

對于B,因?yàn)?.02+0.04+0.10+014+0.20=0.5,所以該地農(nóng)戶家庭年收入的中位數(shù)約為7.5萬元,故B正

確;

0.10+0.14+0.20+0.20=0.64>0.5,所以估計(jì)該地有一半以上的農(nóng)戶,其家庭年收入介于4.5萬元至8.5萬

元之間,故c正確;

對于D,該地農(nóng)戶家庭年收入的平均值為3x0.02+4x0.04+5x0.1+6x0.14+7x0.2+8x0.2+9x0.1

+10x0.1+11X0.04+12X0.02+13X0.02+14X0.02=7.68>6,5,

所以估計(jì)該地農(nóng)戶家庭年收入的平均值超過6.5萬元,故D錯(cuò)誤.

故選:ABC.

6.(2022?廣東韶關(guān)?一模)(多選)在一次演講比賽中,以下表格數(shù)據(jù)是5位評委給甲、乙兩名選手評出的成

績,則下列說法正確的是()

甲乙

86909592879188938895

A.甲選手成績的極差大于乙選手成績的極差

B.甲選手成績的中位數(shù)小于乙選手成績的中位數(shù)

C.甲選手成績的方差小于乙選手成績的方差

D.甲選手成績的平均數(shù)小于乙選手成績的平均數(shù)

【答案】ABD

【詳解】對于A:根據(jù)極差的概念,可知甲選手成績的極差為9,乙選手成績的極差為7.故A正確;

對于B:易知甲成績的中位數(shù)是90,乙成績的中位數(shù)是91.故B正確;

對于C:甲選手成績的平均數(shù)為386+87+90+92+95)=90,方差為

22

1[(86-90)+(90-90)2+(95-90尸+(92一加尸+(87-90)]=y

乙選手成績的平均數(shù)為(88+88+91+93+95)x[=91,方差為

2

g[(88-9T+(88-91>+(91-91)2+(93-91>+(95-91)]=yC錯(cuò)誤;

對于D:由于甲選手成績的平均數(shù)為90,乙選手成績的為91.故D正確.

故選:ABD.

7.某市政府為了節(jié)約生活用水,實(shí)施居民生活用水定額管理政策,即確定一個(gè)居民月用水量標(biāo)準(zhǔn)x(單位:

噸),用水量不超過x的部分按平價(jià)收費(fèi),超出x的部分按議價(jià)收費(fèi),并隨機(jī)抽取部分居民進(jìn)行調(diào)查,抽取

的居民月均用水量的頻率分布直方圖如圖所示.(同一組中的數(shù)據(jù)以該組區(qū)間的中點(diǎn)值為代表)

(2)試估計(jì)該市居民月均用水量的眾數(shù)、平均數(shù);

(3)如果希望85%的居民月均用水量不超過標(biāo)準(zhǔn)x,那么標(biāo)準(zhǔn)x定為多少比較合理?

【解析】(I)山頻率分布直方圖中所有矩形的面積之和為1,可得

(0.08x2+0.16+2a+0.4+0.52+0.12+0.04)x0.5=l解得.々=0.3

3=225

(2)由頻率分布直方圖可知,該市居民月均用水量的眾數(shù)約為2(噸),

山頻率分布直方圖可知,平均數(shù)約為0.25x0.()4+().75x0.08+1.25x().15

+1.75x0.2+2.25x0.26+2.75x0.15+3.25x0.06+3.75x0.04+4.25x0.02=2.035(噸).

0.5x(0.08+0.16+0.3+0.4+0.52)x100%=73%;月均用水量低于3噸的居民人數(shù)所占的百分比為

73%+0.5x0.3x100%-88%,

所以xe(2.5,3),由題意可得0.73+(x—2.5)x0.3=0.85,解得x=2.9.

所以如果希望85%的居民月均用水量不超過標(biāo)準(zhǔn)x,那么x定為2.9噸比較合理.

8.隨著新冠肺炎疫情的穩(wěn)定,各地的經(jīng)濟(jì)均呈現(xiàn)緩慢的恢復(fù)趨勢,為了更進(jìn)一步做好疫情的防控工作,避免

疫情的再度爆發(fā),/地區(qū)規(guī)定居民出行或者出席公共場合均需佩戴口罩,現(xiàn)將力地區(qū)20000個(gè)居民一周的口

罩使用個(gè)數(shù)統(tǒng)計(jì)如下表所示,其中每周的口罩使用個(gè)數(shù)在6以上(含6)的有14000人.

口罩使用數(shù)量[2,4)[4,6)[6,8)18,10)[10,12]

頻率mn

t頻率

0.3

0.2

0.1

O24681012z/口罩使用個(gè)數(shù)

(1)求機(jī),n的值;

Q)根據(jù)表中數(shù)據(jù),完善上面的頻率分布直方圖;

(3)計(jì)算A地區(qū)居民一周口罩使用個(gè)數(shù)的平均數(shù)以及方差.

140006000

n=-0.3-0.1=0.3m—-0.2=0.1

【解析】(1)由已知2000020000

(2)頻率分布直方圖如卜:

(3)由頻率分布直方圖得

一周內(nèi)使用口罩的平均數(shù)為

x=3x0.2+5x0,l+7x0.3+9x0.3+11x0.1=7>

方差為S2=0.2x(3-7)2+0.1,(5-7)2+03x(7-7>+0.3x(9-7)2+0.1x(11-7)2=64.

考點(diǎn)二:回歸分析

【典例例題】

例1.(2022?廣東汕尾?高三期末)"綠水青山就是金山銀山”的生態(tài)文明發(fā)展理念已經(jīng)深入人心,這將推動新

能源汽車產(chǎn)業(yè)的迅速發(fā)展,下表是近幾年我國某地區(qū)新能源汽車的年銷售量與年價(jià)的統(tǒng)計(jì)表

年份20162017201820192020

年銷售量(萬臺)812152025

根據(jù)上表,利用最小二乘法,新能源汽車的年銷售量y萬臺關(guān)于年份x的線性回歸方程為.

5

參考數(shù)據(jù):Z(x「君(,-9)=(-2)X(-8)+(-l)x(-4)+lx4+2x9=42,

i=l

5

2

^(x;-x)=4+1+1+4=10,42x2017=84714,42x2018=84756.

i=l

附:對于一組數(shù)據(jù)(4必),(%,%),,區(qū)》“),其回歸直線Rbx+d的斜率和截距的最小二乘估計(jì)分別為:

2(x;-x)(?-y)

b=-------,a=y-bx.

:(占3

;=1

【答案】."4.2x—8459.6

2016+2017+2018+2019+2020

【詳解】元=-----------------------------=2(Jlo,

5

8+12+15+20+25

5=----------------=lo

5

A£(玉-可(%-9)42

故b=上J-----------=—=4.2,

210

Z(x;-x)

<=1

/一宸=16-4.2x2018=-8459.6,

所以線性回歸方程為f=4.2x-8459.6

故答案為:y=4.2x-8459.6

例2.(2022?廣東?鐵一中學(xué)高三期末)2020年11月23日至29日累計(jì)確診人數(shù)如下表:

日期(1月)23日24日25日26日27日28日29日

人數(shù)(人)611213466101196

由上述表格得到如散點(diǎn)圖(1月23日為封城第一天).

>>(累計(jì)確診人數(shù))

(I)根據(jù)散點(diǎn)圖判斷>=〃+區(qū)與y=c.,(c,d均為大于0的常數(shù))哪一個(gè)適宜作為累計(jì)確診人數(shù)》與封

城后的天數(shù)X的回歸方程類型(給出判斷即可,不必說明理由);并根據(jù)上表中的數(shù)據(jù)求出回歸方程;

(2)隨著更多的醫(yī)護(hù)人員投入疫情的研究,2月20日武漢影像科醫(yī)生提出存在大量核酸檢測呈陰性(陽性

則確診),但觀其CT肺片具有明顯病變,這一提議引起了廣泛的關(guān)注,2月20日武漢疾控中心接收了1000

份血液樣本,假設(shè)每份樣本的檢驗(yàn)結(jié)果是陽性還是陰性都是相互獨(dú)立的,且每份樣本是陽性樣本的概率為

0.7,核酸試劑能把陽性樣本檢測出陽性結(jié)果的概率是0.99(核酸檢測存在陽性樣本檢測不出來的情況,但

不會把陰性檢測呈陽性),求這1000份樣本中檢測呈陽性的份數(shù)的期望.

參考數(shù)據(jù):

77

1嚴(yán)

yw

i=\?=1

62.141.54253550.123.47

_I7

其中叱=lgy,卬=弓2嗎,參考公式:對于一組數(shù)據(jù)(4,叫),(%%),…,(”",叱),其回歸直線卬=a+£〃

/f=l

”__

Z%叱-nuw

的斜率和截距的最小二乘估計(jì)公式分別為夕=弓------,a=w-/3u.

2-2

),%—nu

/=1

【答案】(1)由散點(diǎn)圖可知選擇y=

由丫=八,兩邊同時(shí)取常用對數(shù)得lgy=lgc+lg〃x,

設(shè)igy=w,w=igc+igi/x.

7

計(jì)算%=4,w=1.54,Zx;=140,

/=1

7____

〉2毛叱一7xw

50.12-7x4x1.547八“

-----------------1----=—=0.25,

lgd=2

-7?140-7X4---28

i=\

把樣本中心點(diǎn)(4,1.54)代入?yún)n=尼。+愴小*得吠=0.54.

w=0.54+0.25%,丫關(guān)于x的回歸方程為y=3.47xIO025";

(2)這1000份樣本中檢測呈陽性的份數(shù)為X,

則每份檢測出陽性的概率尸=0.7x0.99=0.693,

由題意可知X?8(1000,0.693),.?.£(%)=1000x0.693=693(人),

故這1000份樣本中檢測呈陽性份數(shù)的期望為693人.

【方法技巧與總結(jié)】

1.線性回歸方程的求法;

2.非線性回歸方程要通過換元換成線性回歸方程.

【變式訓(xùn)練】

1.(2022?廣東深圳?一模)某人工智能公司近5年的利潤情況如下表所示:

第X年12345

利潤y/億元23457

已知變量y與x之間具有線性相關(guān)關(guān)系,設(shè)用最小二乘法建立的回歸直線方程為y=1.2x+a,則下列說法正

確的是()A.a=0.6

B.變量y與x之間的線性相關(guān)系數(shù)r<0

D.該人工智能公司這5年的利潤的方差小于2

【答案】.AC

【詳解】解:依題意還:(1+2+3+4+5)=3,亍=:(2+3+4+5+7)=Z,

因?yàn)榛貧w直線方程為y=1.2x+a必過樣本中心點(diǎn)「可,即£=1.2x3+。,解得“=0.6,

故A正確;則回歸直線方程為y=1.2x+0.6,則%與V成正相關(guān),即相關(guān)系數(shù)/?>(),故B錯(cuò)誤,

當(dāng)x=6時(shí)=12x6+0.6=7.8,即該人工智能公司第6年的利潤約為7.8億元,故C正確,

該人工智能公司這5年的利潤的方差為((2-,)+,-弓)

故D錯(cuò)誤;

故選:AC

2.(2022?廣東惠州?二模)某地建立了農(nóng)業(yè)科技圖書館,供農(nóng)民免費(fèi)借閱,收集了近5年的借閱數(shù)據(jù)如下表:

年份20162017201820192020

年份代碼X12345

年借閱量W萬冊

根據(jù)上表,可得y關(guān)于x的線性回歸方程為?=0.24x+&,則()A.5=4.68

C.y與x的樣本相關(guān)系數(shù)r>0

26.(2022?廣東汕頭?二模)如圖所示,5個(gè)(x,y)數(shù)據(jù),去掉。(3,10)后,下列說法正確的是()

y?E(\0,l2)

,D(3,10)

O|*

A.相關(guān)系數(shù)r變大B.殘差平方和變大

C.相關(guān)指數(shù)R2變小D.解釋變量x與預(yù)報(bào)變量y的相關(guān)性變強(qiáng)

【答案】AD

【詳解】由散點(diǎn)圖知,去掉離群點(diǎn)D后,x與y的相關(guān)性變強(qiáng),且為正相關(guān),

所以相關(guān)系數(shù)r的值變大,相關(guān)指數(shù)網(wǎng)的值變大,殘差平方和變小.

故選:AD.

3.(2022?廣東?金山中學(xué)高三期末)2021年,我國脫貧攻堅(jiān)戰(zhàn)取得了全面勝利.為了鞏固拓展脫貧攻堅(jiān)成果,

不斷提高群眾的幸福感,某縣繼續(xù)推進(jìn)山羊養(yǎng)殖項(xiàng)目.為了建設(shè)相應(yīng)的配套項(xiàng)目,該縣主管部門對該縣近年

來山羊養(yǎng)殖業(yè)的規(guī)模進(jìn)行了跟蹤調(diào)查,得到了該縣每年售賣山羊數(shù)量y(單位:萬只)與相應(yīng)年份代碼x的

數(shù)據(jù)如下表:

年份201520162017201820192020

年份代碼X123456

售賣山羊數(shù)量》(萬只)111316152021

(1)由表可知y與x有較強(qiáng)的線性相關(guān)關(guān)系,求y關(guān)于x的線性回歸方程;

(2)已知該縣養(yǎng)殖的山羊品種只有甲、乙兩種,且甲品種山羊與乙品種山羊的數(shù)量之比為2:3,甲品種山

羊達(dá)到售賣標(biāo)準(zhǔn)后的出售價(jià)為2500元/只,乙品種山羊達(dá)到售賣標(biāo)準(zhǔn)后的出售價(jià)為2700元/只.為了解養(yǎng)殖

山羊所需要的時(shí)間,該縣主管部門隨機(jī)抽取了甲品種山羊和乙品種山羊各100只進(jìn)行調(diào)查,得到要達(dá)到售

賣標(biāo)準(zhǔn)所需的養(yǎng)殖時(shí)間如下表:

養(yǎng)殖時(shí)間(月數(shù))6789

甲品種山羊(只)20353510

乙品種山羊(只)10304020

以上述樣本統(tǒng)計(jì)的養(yǎng)殖山羊所需時(shí)間情況估計(jì)全縣養(yǎng)殖山羊所需時(shí)間(即以各養(yǎng)殖時(shí)間的頻率作為各養(yǎng)殖

時(shí)間的概率),且每月每只山羊的養(yǎng)殖成本為300元,結(jié)合(1)中所求回歸方程,試求2022年該縣養(yǎng)殖山

羊所獲利潤的期望(假設(shè)山羊達(dá)到售賣標(biāo)準(zhǔn)后全部及時(shí)賣完).(利潤=賣山羊的收入一山羊的養(yǎng)殖成本)

參考公式及數(shù)據(jù):回歸直線方程為¥=隊(duì)+隊(duì)其中坂=『--------,a=y-bx.

2

可2ZX:-rix

/=!;=i

【答案】?(1)>2工+9;(2)8800萬元.

1+2+3+4+5+611+13+16+15+20+21

【詳解】(1)因?yàn)榱?=3.5,y=-------------------=16,

66

-2.5x(-5)+(-1.5)x(-3)+(-0.5)x0+0.5x(-l)4-1.5x44-2.5x5_35

所以,==777=2,

(-2.5)2+(_]+(?5)2+0.52+1.52+2.5217.5

可得&=16—2x3.5=9.

所以丫與x之間的線性回歸方程為y=2x+9.

(2)由(1)可知,當(dāng)x=8時(shí),可得夕=25,

23

其中甲品種山羊有25、1=10萬只,乙品種山羊有25xg=15力只.

由頻率估計(jì)概率,可得甲品種山羊達(dá)到售賣標(biāo)準(zhǔn)需要的養(yǎng)殖時(shí)間為6個(gè)月,7個(gè)月,8個(gè)月和9個(gè)月的概率

分別為0.2,0.35,0.35和0.1,

所以甲品種山羊要達(dá)到售賣標(biāo)準(zhǔn)需要養(yǎng)殖時(shí)間的期望為6x0.2+7x0.35+8x0.35+9x0.1=7.35(月).

由頻率估計(jì)概率,可得乙品種山羊達(dá)到售賣標(biāo)準(zhǔn)需要的養(yǎng)殖時(shí)間為6個(gè)月,7個(gè)月,8個(gè)月和9個(gè)月的概率

分別為0.1,0.3,0.4和0.2,

所以乙品種山羊要達(dá)到售賣標(biāo)準(zhǔn)需要養(yǎng)殖時(shí)間的期望為6X0.1+7X0.3+8X0.4+9X0.2=7.7(月).

養(yǎng)殖每只甲品種山羊利潤的期望為2500-7.35x300=2500-2205=295(元),

養(yǎng)殖每只乙品種山羊利潤的期望為2700-7.7x300=2700-2310=390(元),

故2022年該縣售賣的山羊所獲利潤的期望為10x295+15x390=8800(萬元).

4.(2022?廣東廣州?一模)人們用大數(shù)據(jù)來描述和定義信息時(shí)代產(chǎn)生的海量數(shù)據(jù),并利用這些數(shù)據(jù)處理事務(wù)

和做出決策,某公司通過大數(shù)據(jù)收集到該公司銷售的某電子產(chǎn)品1月至5月的銷售量如下表.

月份X12345

銷售量y(萬件)

該公司為了預(yù)測未來幾個(gè)月的銷售量,建立了y關(guān)于x的回歸模型:y=ux2+v.

⑴根據(jù)所給數(shù)據(jù)與回歸模型,求y關(guān)于x的回歸方程(力的值精確到0.1);

⑵已知該公司的月利潤z(單位:萬元)與x,y的關(guān)系為z=244-&7,根據(jù)(1)的結(jié)果,問該公司

哪一個(gè)月的月利潤預(yù)報(bào)值最大?

參考公式:對于一組數(shù)據(jù)(七,乂),(9,%),,(%,%),其回歸直線?=以+4的斜率和截距的最小二乘估計(jì)公

£(一)(%-刃

式分別為b=J-----------,a=y-bx.

;=1

【答案】.(1)?=0.2/+5;(2)第9個(gè)月的月利潤預(yù)報(bào)值最大

(1)

.,1+4+9+16+25,,-4.9+5.8+6.8+8.3+10.2好

》卬=/,則n卬=-------------=11,y=---------------------=7.2,

g(叱一卬)(%一歹)__10X(_2.3)+(-7)X(-1.4)+(-2)X(-Q.4)+5X1.1+14x3_81,1

-22222

(1-11)+(4-11)+(9-11)+(16-11)+(25-11)-374

/=1'

v=y一加=7.2—0.2x11=5,所以y關(guān)于x的回歸方程為y=0.2丁+5:

(2)

由(1)知:y=0.2x2+5,

z=244=24.-5(°.2*:5)+2=246_%_令g)=244_£_年(x>0),

\lxylx\lx7x

"詈2/=一3八2尸「3(…尸])(,>o)

,x22Ixsjx2x\Jx

令廳(犬)>0得:0<x<9,令〃'(x)<0得:x>9,令〃(x)=0得:x=9,所以〃(力=244一/一?^?(x>0)

在x=9處取得極大值,也是最大值,/7(XL=M9)=72-27-9=36

所以第9個(gè)月的月利潤預(yù)報(bào)值最大.

5.(2022?廣東肇慶?二模)下表是我國從2016年到2020年能源消費(fèi)總量近似值y(單位:千萬噸標(biāo)準(zhǔn)煤)

的數(shù)據(jù)表格:

年份20162017201820192020

年份代號X12345

能源消費(fèi)總量近似值y(單位:

442456472488498

千萬噸標(biāo)準(zhǔn)煤)

以x為解釋變量,y為預(yù)報(bào)變量,若以夕=幻:+4為回歸方程,則相關(guān)指數(shù)用。0.9946,若以》=%+alnx

為回歸方程,則相關(guān)指數(shù)周=09568.

⑴判斷$與?=。2+8Inx哪一個(gè)更適宜作為能源消費(fèi)總量近似值y關(guān)于年份代號x的回歸方程,并

說明理由;

⑵根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),求出y關(guān)于年份代號x的回歸方程.

參考數(shù)據(jù):之必=2356,次x,?=7212.

1=1/=|

參考公式:回歸方程9=派+6中斜率和截距的最小二乘估計(jì)公式分別為:

?=毛-----------=號---------,a=y-bx.

i=li=l

【答案】.(l)£=4x+q更適宜作為y關(guān)于x的回歸方程,答案見解析;

(2)y=14.4^+428.

(1)

因?yàn)镽;>后,

所以£=b^x+a,更適宜作為y關(guān)于x的回歸方程.

(2)

I=1+2+3+4+5=3,%=l2+22+32+42+52=55.

5/=|

£X/-5郎7212-5x3x2356

b.=々--------=-----------3一=14.4,等*4x3=428,

十2<—255—5x9

i=l

所以以x為解釋變量,y為預(yù)報(bào)變量的回歸方程為5>=14.4X+428.

6.(2022?廣東潮州?二模)我國在芯片領(lǐng)域的短板有光刻機(jī)和光刻膠,某風(fēng)險(xiǎn)投資公司準(zhǔn)備投資芯片領(lǐng)域,

若投資光刻機(jī)項(xiàng)目,據(jù)預(yù)期,每年的收益率為30%的概率為P,收益率為-10%的概率為1-P;若投資光

刻膠項(xiàng)目,據(jù)預(yù)期,每年的收益率為30%的概率為0.4,收益率為-20%的概率為0.1,收益率為零的概率

為0.5.

⑴已知投資以上兩個(gè)項(xiàng)目,獲利的期望是一樣的,請你從風(fēng)險(xiǎn)角度考慮為該公司選擇一個(gè)較穩(wěn)妥的項(xiàng)目;

⑵若該風(fēng)險(xiǎn)投資公司準(zhǔn)備對以上你認(rèn)為較穩(wěn)妥的項(xiàng)目進(jìn)行投資,4年累計(jì)投資數(shù)據(jù)如下表:

年份X2018201920202021

1234

累計(jì)投資金額y(單位:億元)2356

請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于〃的線性回歸方程》=&,+4,并預(yù)測到哪一年年末,該

公司在芯片領(lǐng)域的投資收益預(yù)期能達(dá)到0.75億元.

2(再-五)(%-刃

附:收益=投入的資金x獲利的期望;線性回歸夕=應(yīng)+&中,?=『-----------=嚀---------,a=y-bx.

f(七-村成2

i=l

【答案】.⑴該風(fēng)投公司投資光刻膠項(xiàng)目:(2戶=14〃+0.5;2022年年末.

(1)

若投資光刻機(jī)項(xiàng)目,設(shè)收益率為四,則%的分布列為

?|

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論