版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二十二講:統(tǒng)計(jì)初步及成對數(shù)據(jù)的統(tǒng)計(jì)分析
【考點(diǎn)梳理】
1.統(tǒng)計(jì)初步
(1)隨機(jī)抽樣:簡單隨機(jī)抽樣,分層抽樣
(2)用樣本估計(jì)總體:頻率分布直方圖,樣本數(shù)字特征(百分位數(shù)、平均數(shù)、眾數(shù)、中位數(shù)、方差、
標(biāo)準(zhǔn)差)
特征數(shù)具體數(shù)字算法頻率分布直方圖(表)
眾數(shù)次數(shù)出現(xiàn)最多的數(shù)字頻率最大或最高組的中間值
中位數(shù)樣本數(shù)據(jù)中,將數(shù)據(jù)按大小排列,位于最中間
的數(shù)據(jù).如果數(shù)據(jù)的個(gè)數(shù)為偶數(shù),就取當(dāng)中兩
個(gè)數(shù)據(jù)的平均數(shù)作為中位數(shù)
平均數(shù)所有數(shù)字之和除以總個(gè)數(shù)每個(gè)小矩形面積乘以小矩形底邊中點(diǎn)的橫坐
標(biāo)之和
方差2++(—]
平均數(shù)反映了數(shù)據(jù)取值的平均水平,標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)波動的大小.標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)
的離散程度越大,越不穩(wěn)定;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定
2.成對數(shù)據(jù)的統(tǒng)計(jì)分析
(1)相關(guān)關(guān)系,(2)回歸分析,(3)獨(dú)立性檢驗(yàn)
【典型題型講解】
考點(diǎn)一:抽樣:簡單隨機(jī)抽樣分層抽樣
【典例例題】
例1.某工廠利用隨機(jī)數(shù)表對生產(chǎn)的700個(gè)零件進(jìn)行抽樣測試,先將700個(gè)零件進(jìn)行編號,001,002,.........
699,700.從中抽取70個(gè)樣本,下圖提供隨機(jī)數(shù)表的第4行到第6行,若從表中第5行第6列開始向右讀取
數(shù)據(jù),則得到的第6個(gè)樣本編號是()
32211834297864540732524206443812234356773578905642
84421253313457860736253007328623457889072368960804
32567808436789535577348994837522535578324577892345
A.623B.328C.253D.007
【答案】A
【解析】從第5行第6列開始向又讀取數(shù)據(jù),
第一個(gè)數(shù)為253,第二個(gè)數(shù)是313,第三個(gè)數(shù)是457,
下一個(gè)數(shù)是860,不符合要求,下一個(gè)數(shù)是736,不符合要求,下一個(gè)是253,重復(fù),
第四個(gè)是007,第五個(gè)是328,第六個(gè)是623.
故選:A.
例2.2022年7月24日,搭載問天實(shí)驗(yàn)艙的長征五號B1000人,高二學(xué)生800人,高三學(xué)生1200人,為了調(diào)
查該校學(xué)生對我國航天事業(yè)的了解程度,現(xiàn)從三個(gè)年級中采用分層抽樣的方式抽取60人填寫問卷調(diào)查,則
高三年級有多少人被抽中()
A.16B.18C.20D.24
【答案】D
【解析】由分層抽樣原則可知:高三年級應(yīng)抽取曾,”c=24人.
1000+800+1200
故選:D.
【方法技巧與總結(jié)】
根據(jù)樣本數(shù)據(jù)的特點(diǎn)要判定采用隨機(jī)簡單抽樣和分層抽樣
【變式訓(xùn)練】
1.某個(gè)年級有男生180人,女生160人,用分層抽樣的方法從該年級全體學(xué)生中抽取一個(gè)容量為68的樣本,
則此樣本中女生人數(shù)為()
A.40B.36C.34D.32
【答案】D
【解析】由題意得:樣本中女生人數(shù)為68x32.
故選:D
2.某中學(xué)為了掌握學(xué)校員工身體狀況,偶爾會采用抽檢的方式來收集各部門員工的健康情況.為了讓樣本更
具有代表性,學(xué)校對各部門采用分層抽樣的方法進(jìn)行抽檢.已知該校部門A、部門8、部門C分別有40、
60、80人,各部門員工不存在交叉任職情況,若共抽檢了90人,則部門A抽檢人數(shù)為.
【答案】20
【解析】由題意得從部「JA抽檢人數(shù)為90xk^^=20(人),
故答案為:20
3.某市甲、乙、丙三所學(xué)校的高三學(xué)生共有800名,其中男、女生人數(shù)如下表:
甲校乙校丙校
9790X
女生153160y
(1)現(xiàn)用分層隨機(jī)抽樣的方法從這三所學(xué)校的所有高三學(xué)生中抽取48人,則應(yīng)從丙校抽取多少人?
(2)該市??己?,市教研室準(zhǔn)備從這三所學(xué)校的所有高三學(xué)生中利用隨機(jī)數(shù)法抽取100人進(jìn)行成績統(tǒng)計(jì)分析,
將800人按001,002,800進(jìn)行編號,如果從第8行第7列的數(shù)開始向右讀,請你依次寫出最先抽取
的4個(gè)人的編號.(下面摘取了隨機(jī)數(shù)表第7行至第9行)
84421753315724550688770474476721763350268392
63015316591692753816582170717512867358074439
13263321134278641607825207443815032442997931
【解析】⑴根據(jù)題意可得丙校共有“k8(刈-(97+153+90+160)=300人,
根據(jù)分層抽樣規(guī)則可得,應(yīng)從丙校抽取4就8x3OO=18人.
oOu
(2)第8行第7列的數(shù)為1,從數(shù)1開始向右讀,則最先抽取的4個(gè)人的編號為165,538,707,175.
考點(diǎn)二:樣本數(shù)字特征
【典例例題】
例1.(2022?廣東中山?高三期末)甲、乙兩支田徑隊(duì)的體檢結(jié)果為:甲隊(duì)體重的平均數(shù)為60kg,方差為200,
乙隊(duì)體重的平均數(shù)為70kg,方差為300,又已知甲、乙兩隊(duì)的隊(duì)員人數(shù)之比為1:4,那么甲、乙兩隊(duì)全部
隊(duì)員的平均體重和方差分別是()
A.65,280B.68,280C.65,296D.68,296
【答案】B
【解析】設(shè)甲隊(duì)有a人,甲、乙兩隊(duì)的隊(duì)員人數(shù)之比為1:4,則乙隊(duì)有4a人,
因?yàn)榧钻?duì)體重的平均數(shù)為60,乙隊(duì)體重的平均數(shù)為70,
則甲、乙兩隊(duì)全部隊(duì)員的平均體重為
-60-a+70-4o
x=-----------=68,
5a
甲隊(duì)體重的方差
.d=-[(x,-60)2+(x-60)2+-+(x-60)2]=200
a2a
=—[(x;+x:++x;)+。?6()2—2x60x(x+占++X)]
a-(a
=_[(x:+x;++x;)+a-602-2x60x(60-a)]=200
a
則x;+x;++x;=200a+〃6。2
乙隊(duì)體重的方差為
s;=;[(乂-70)2+(%-70)2++(加?70)2]=300
=;[(犬+貨++>i)+4a.702-2x70x(y+%++%)]
=L(y;+4++犬,)+44.7()2-2X70X(70-4a)]=300
4。
2
貝+++y^a=300-4a+4^-70
甲、乙兩隊(duì)全部隊(duì)員體重的方差為
_[(X,-68)2+(X-68)2++(/-632_2+(%一68)2++(y-68)2]
s2一2]+[(y)68)4fl
5a
——[(x;+x;++芍)+Q?68?—2x68x(%+/++4)]+
5a
41(犬+£++yl,)+4a-682-2x68x(y,+y,++%)]
ja
=—[(200a+a602)+a-682-2x68x(60-a)]+—[(300.4a+4a-702)+4?-682-2x68x(70.4a)]
5a5a
故選:B.
例2.(2022?廣東深圳?高三期末)為了分析某次考試的情況,隨機(jī)抽取了若干學(xué)生,將其考試成績分組為:
[60,70),[70,80),[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],并繪制
成如下圖所示的頻率分布直方圖,據(jù)此可估計(jì)該次考試成績的中位數(shù)小€化歡+1),則整數(shù)k的值為()
A.99B.100C.101D.102
【答案】B
【詳解】考試成績在[90,100)內(nèi)的頻率為:
P=1-(0.004+0.008+0.015+0.025+0.015+0.006+0.004+0.002)x10=0.21,
則前4組考試成績頻率分別為:
[60,70),0.04
[70,80),0.08
[80,90),0.15
[90,100),0.21
考試成績的中位數(shù)為機(jī),
則().04+0.08+0.15+0.21+(加-100)x0.025=0.5,
.?./n=100.8e(l(X),101)
.?"=100
故選:B.
例3.(2021?廣東汕頭?高三期末)某中學(xué)為了解學(xué)生數(shù)學(xué)史知識的積累情況,隨機(jī)抽取150名同學(xué)參加數(shù)學(xué)
史知識測試,測試題共5道,每答對一題得20分,答錯(cuò)得0分.得分不少于60分記為及格,不少于80分
記為優(yōu)秀,測試成績百分比分布圖如圖所示,則()
A.該次數(shù)學(xué)史知識測試及格率超過90%
B.該次數(shù)學(xué)史知識測試得滿分的同學(xué)有15名
C.該次測試成績的中位數(shù)大于測試成績的平均數(shù)
D.若該校共有1500名學(xué)生,則數(shù)學(xué)史知識測試成績能得優(yōu)秀的同學(xué)大約有720名
【答案】AC
【詳解】由圖知,及格率為1-8%=92%>90%,故A正確.
該測試滿分同學(xué)的百分比為1—8%-32%-48%=12%,即有12%xl50=18名,B錯(cuò)誤.
由圖知,中位數(shù)為80分,平均數(shù)為40x8%+60x32%+80x48%+100xl2%=72.8分,故C正確.
由題意,1500名學(xué)生成績能得優(yōu)秀的同學(xué)有1500x(48%+12%)=900,故D錯(cuò)誤.
故選:AC
例4.2021年7月至2022年7月,我國居民消費(fèi)價(jià)格保持平穩(wěn),居民消費(fèi)價(jià)格漲跌幅如圖所示,則()
全國居民消費(fèi)價(jià)格漲跌幅
夕*當(dāng)月消費(fèi)價(jià)格-去年同期消費(fèi)價(jià)格,4小.上.令
備汪:同比增長率=------去年同期消費(fèi)補(bǔ)格-------環(huán)比AA增0長,率=
當(dāng)月消費(fèi)價(jià)格-上月同期消費(fèi)價(jià)格1m。/
上月同期消費(fèi)價(jià)格,0,
A.2022年1月全國居民消費(fèi)價(jià)格比2021年1月全國居民消費(fèi)價(jià)格有所下降
B.2022年5月全國居民消費(fèi)價(jià)格比2022年4月全國居民消費(fèi)價(jià)格有所上升
C.2021年7月至2022年7月全國居民消費(fèi)價(jià)格同比增長率的40%分位數(shù)為1.0%
D.2021年10月至2022年7月全國居民消費(fèi)價(jià)格環(huán)比增長率的平均數(shù)為0.25%
【答案】D
【解析】*jA,從圖中可以看出2022年1月全國居民消費(fèi)價(jià)格的同比增長率為0.9%>0,
所以2022年1月全國居民消費(fèi)價(jià)格有所上升,故A錯(cuò)誤;
對B,由圖2022年5月全國居民消費(fèi)價(jià)格環(huán)比增長率為-0.2%<0,
所以2022年5月全國居民消費(fèi)價(jià)格有所下降,故B錯(cuò)誤;
對C,將C選項(xiàng)中的數(shù)據(jù)由小到大排列得,
0.7%,0.8%,0.9%0.9%,1%,1.5%,1.5%,1.5%,2.1%,2.1%,2.3%,2.5%,2.7%,
因?yàn)?3x40%=5.2,則同比增長率的40%分位數(shù)為第6個(gè)數(shù)1.5%,故C錯(cuò)誤;
對D,環(huán)比增長率的平均數(shù)為
-----------------------------------------------=0.25%,故D正確.
故選:D
【方法技巧與總結(jié)】
1、頻率分布直方圖
(1)利用頻率分布直方圖求頻率、頻數(shù);
(2)利用頻率分布直方圖估計(jì)總體.
(3)頻率分布直方圖的縱坐標(biāo)是頻率除以組距,而不是頻率.
2、百分位數(shù)
計(jì)算一組,,個(gè)數(shù)據(jù)的的第〃百分位數(shù)的步驟
①按從小到大排列原始數(shù)據(jù).
②計(jì)算p%.
③若i不是整數(shù)而大于i的比鄰整數(shù)則第“百分位數(shù)為第./項(xiàng)數(shù)據(jù);若,是整數(shù),則第〃百分位數(shù)
為第j項(xiàng)與第j+1項(xiàng)數(shù)據(jù)的平均數(shù).
【變式訓(xùn)練】
1.(2022?廣東東莞?高三期末)氣象意義上從春季進(jìn)入夏季的標(biāo)志為“當(dāng)且僅當(dāng)連續(xù)5天每天日平均溫度不低
于22C”.現(xiàn)有甲、乙、丙三地連續(xù)5天日平均溫度的記錄數(shù)據(jù)(數(shù)據(jù)均為正整數(shù),單位C)且滿足以下條
件:
甲地:5個(gè)數(shù)據(jù)的中位數(shù)是24,眾數(shù)是22;
乙地:5個(gè)數(shù)據(jù)的中位數(shù)是27,平均數(shù)是24;
丙地:5個(gè)數(shù)據(jù)有1個(gè)是30,平均數(shù)是24,方差是9.6;
根據(jù)以上數(shù)據(jù),下列統(tǒng)計(jì)結(jié)論正確的是()
A.甲地進(jìn)入了夏季B.乙地進(jìn)入了夏季
C.不能確定丙地進(jìn)入了夏季D.恰有2地確定進(jìn)入了夏季
【答案】AC
【詳解】甲地:5個(gè)數(shù)據(jù)由小到大排,則22,22,24,。,b,其中24<。<6,滿足進(jìn)入夏季的標(biāo)志;
乙地:將5個(gè)數(shù)據(jù)由小到大排,則。,b,27,c,d,其中,
貝IJ27+C+4281,而a+6+27+c+d=120,
故。+。439,其中必有一個(gè)小于22,故不滿足一定進(jìn)入夏季的標(biāo)志;
丙地:設(shè)5個(gè)數(shù)據(jù)為。,b,c,d,30,且。力,c,dwZ,
由方差公式可知:(a-24)2+e_24)2+?_24)2+①_24y+(3。_24y=9.6X5=48,
貝ij(a-24)2+0-24)2+(c-24)2+("-24『=12=9+1+1+1,
不妨設(shè)|。-24|=3,|。_26|=1,卜_26|=._26|=1,
則匕,%d均大于22,但。不確定是否大于22,故不能確定丙地進(jìn)入夏天.
故選:AC.
2.如圖1為某省2019年17月份快遞業(yè)務(wù)量統(tǒng)計(jì)圖,圖2為該省2019年17月份快遞業(yè)務(wù)收入統(tǒng)計(jì)圖,對
統(tǒng)計(jì)圖理解不正確的是()
口快遞、業(yè)務(wù)量(萬件)?同比增長率(%)口快遞業(yè)務(wù)收入(萬元)?同比增長率(%)
圖1圖2
A.2019年1?4月份快遞業(yè)務(wù)量3月份最高,2月份最低,差值接近2000萬件
B.從1?4月份來看,業(yè)務(wù)量與業(yè)務(wù)收入有波動,但整體保持高速增長
C.從兩圖中看,增量與增長速度并不完全一致,但業(yè)務(wù)量與業(yè)務(wù)收入變化高度一致
D.2019年1?4月份快遞業(yè)務(wù)量同比增長率均超過50%,在3月份最高,和春節(jié)后網(wǎng)購迎來噴漲有關(guān)
【答案】B
【解析】從圖(1)的柱形圖可得2019年1-4月份快遞業(yè)務(wù)量3月份最高,2月份最低,
3月份比2月份高4397-2411=1986,差值接近2000萬件,故A正確.
從1?4月份來看,業(yè)務(wù)量與業(yè)務(wù)收入有波動,結(jié)合圖(1)(2)中的柱形圖可得業(yè)務(wù)量與業(yè)務(wù)收入在2月份
和4月份均下降,故B錯(cuò)誤.
從兩圖中柱狀圖可得業(yè)務(wù)量與業(yè)務(wù)收入變化高度一致,但業(yè)務(wù)量2月份同比增長53%,而業(yè)務(wù)收入2月份
同比增長30%,因此增量與增長速度并不完全一致,故C正確.
從圖(I)中可得2019年1?4月份快遞業(yè)務(wù)量同比增長率均超過50%,在3月份最高,這的確和春節(jié)后網(wǎng)
購迎來噴漲有關(guān),故D正確.
故選:B.
3.(2022?廣東清遠(yuǎn)?高三期末)某學(xué)校組織了一次勞動技能大賽,共有100名學(xué)生參賽,經(jīng)過評判,這100
名參賽者的得分都在[40,90]內(nèi),得分60分以下為不及格,其得分的頻率分布直方圖如圖所示(按得分分成
[40,50),[50,60),[60,70),[70,80),[80,90]這五組),則下列結(jié)論正確的是()
B.此次比賽得分不及格的共有40人
C.以頻率為概率,從這100名參賽者中隨機(jī)選取1人,其得分在[60,80)
D.這100名參賽者得分的中位數(shù)為65
【答案】ABC
【詳解】因?yàn)?+0.01+0.02+0.03+0.035)*10=1,所以。=0.005,所以A正確;
因?yàn)椴患案竦娜藬?shù)為100x(0.005+0.035)x10=40,所以B正確;
因?yàn)榈梅衷赱60,80)的頻率為(0.03+0.02)x10=0.5,所以從這100名參賽者中隨機(jī)選取1人,其得分在[60,80)
的概率為0.5,所以C正確;
這100名參賽者得分的中位數(shù)為60+蕊R65,所以D錯(cuò)誤.
故選:ABC.
4.(2022?廣東汕頭?一模)在黨史學(xué)習(xí)教育動員大會上,習(xí)近平總書記強(qiáng)調(diào)全黨同志要做到學(xué)史明理、學(xué)史
增信、學(xué)史崇德,學(xué)史力行.某單位對200名黨員進(jìn)行黨史知識測試,將成績分成6組:[70,75),[75,80),
[80,85),[85,90),[90,95),[95,100],得到如圖所示的頻率分布直方圖,則。=.
【詳解】由(0.020+0.025+0.030+0.035+0.040+4)x5=1,
解得a=0.050.
5.(2022?廣東廣東?一模)(多選)為了解某地農(nóng)村經(jīng)濟(jì)情況,對該地農(nóng)戶家庭年收入進(jìn)行抽樣調(diào)查,將農(nóng)
戶家庭年收入調(diào)查數(shù)據(jù)整理得到如下頻率分布直方圖(如圖):
根據(jù)此頻率分布直方圖,下面結(jié)論中正確的是()
A.該地農(nóng)戶家庭年收入低于4.5萬元的農(nóng)戶比率估計(jì)為6%
【答案】.ABC
0.02+0.04=0.06=6%,所以比率估計(jì)為6%,故A正確;
對于B,因?yàn)?.02+0.04+0.10+014+0.20=0.5,所以該地農(nóng)戶家庭年收入的中位數(shù)約為7.5萬元,故B正
確;
0.10+0.14+0.20+0.20=0.64>0.5,所以估計(jì)該地有一半以上的農(nóng)戶,其家庭年收入介于4.5萬元至8.5萬
元之間,故c正確;
對于D,該地農(nóng)戶家庭年收入的平均值為3x0.02+4x0.04+5x0.1+6x0.14+7x0.2+8x0.2+9x0.1
+10x0.1+11X0.04+12X0.02+13X0.02+14X0.02=7.68>6,5,
所以估計(jì)該地農(nóng)戶家庭年收入的平均值超過6.5萬元,故D錯(cuò)誤.
故選:ABC.
6.(2022?廣東韶關(guān)?一模)(多選)在一次演講比賽中,以下表格數(shù)據(jù)是5位評委給甲、乙兩名選手評出的成
績,則下列說法正確的是()
甲乙
86909592879188938895
A.甲選手成績的極差大于乙選手成績的極差
B.甲選手成績的中位數(shù)小于乙選手成績的中位數(shù)
C.甲選手成績的方差小于乙選手成績的方差
D.甲選手成績的平均數(shù)小于乙選手成績的平均數(shù)
【答案】ABD
【詳解】對于A:根據(jù)極差的概念,可知甲選手成績的極差為9,乙選手成績的極差為7.故A正確;
對于B:易知甲成績的中位數(shù)是90,乙成績的中位數(shù)是91.故B正確;
對于C:甲選手成績的平均數(shù)為386+87+90+92+95)=90,方差為
22
1[(86-90)+(90-90)2+(95-90尸+(92一加尸+(87-90)]=y
乙選手成績的平均數(shù)為(88+88+91+93+95)x[=91,方差為
2
g[(88-9T+(88-91>+(91-91)2+(93-91>+(95-91)]=yC錯(cuò)誤;
對于D:由于甲選手成績的平均數(shù)為90,乙選手成績的為91.故D正確.
故選:ABD.
7.某市政府為了節(jié)約生活用水,實(shí)施居民生活用水定額管理政策,即確定一個(gè)居民月用水量標(biāo)準(zhǔn)x(單位:
噸),用水量不超過x的部分按平價(jià)收費(fèi),超出x的部分按議價(jià)收費(fèi),并隨機(jī)抽取部分居民進(jìn)行調(diào)查,抽取
的居民月均用水量的頻率分布直方圖如圖所示.(同一組中的數(shù)據(jù)以該組區(qū)間的中點(diǎn)值為代表)
(2)試估計(jì)該市居民月均用水量的眾數(shù)、平均數(shù);
(3)如果希望85%的居民月均用水量不超過標(biāo)準(zhǔn)x,那么標(biāo)準(zhǔn)x定為多少比較合理?
【解析】(I)山頻率分布直方圖中所有矩形的面積之和為1,可得
(0.08x2+0.16+2a+0.4+0.52+0.12+0.04)x0.5=l解得.々=0.3
3=225
(2)由頻率分布直方圖可知,該市居民月均用水量的眾數(shù)約為2(噸),
山頻率分布直方圖可知,平均數(shù)約為0.25x0.()4+().75x0.08+1.25x().15
+1.75x0.2+2.25x0.26+2.75x0.15+3.25x0.06+3.75x0.04+4.25x0.02=2.035(噸).
0.5x(0.08+0.16+0.3+0.4+0.52)x100%=73%;月均用水量低于3噸的居民人數(shù)所占的百分比為
73%+0.5x0.3x100%-88%,
所以xe(2.5,3),由題意可得0.73+(x—2.5)x0.3=0.85,解得x=2.9.
所以如果希望85%的居民月均用水量不超過標(biāo)準(zhǔn)x,那么x定為2.9噸比較合理.
8.隨著新冠肺炎疫情的穩(wěn)定,各地的經(jīng)濟(jì)均呈現(xiàn)緩慢的恢復(fù)趨勢,為了更進(jìn)一步做好疫情的防控工作,避免
疫情的再度爆發(fā),/地區(qū)規(guī)定居民出行或者出席公共場合均需佩戴口罩,現(xiàn)將力地區(qū)20000個(gè)居民一周的口
罩使用個(gè)數(shù)統(tǒng)計(jì)如下表所示,其中每周的口罩使用個(gè)數(shù)在6以上(含6)的有14000人.
口罩使用數(shù)量[2,4)[4,6)[6,8)18,10)[10,12]
頻率mn
t頻率
0.3
0.2
0.1
O24681012z/口罩使用個(gè)數(shù)
(1)求機(jī),n的值;
Q)根據(jù)表中數(shù)據(jù),完善上面的頻率分布直方圖;
(3)計(jì)算A地區(qū)居民一周口罩使用個(gè)數(shù)的平均數(shù)以及方差.
140006000
n=-0.3-0.1=0.3m—-0.2=0.1
【解析】(1)由已知2000020000
(2)頻率分布直方圖如卜:
(3)由頻率分布直方圖得
一周內(nèi)使用口罩的平均數(shù)為
x=3x0.2+5x0,l+7x0.3+9x0.3+11x0.1=7>
方差為S2=0.2x(3-7)2+0.1,(5-7)2+03x(7-7>+0.3x(9-7)2+0.1x(11-7)2=64.
考點(diǎn)二:回歸分析
【典例例題】
例1.(2022?廣東汕尾?高三期末)"綠水青山就是金山銀山”的生態(tài)文明發(fā)展理念已經(jīng)深入人心,這將推動新
能源汽車產(chǎn)業(yè)的迅速發(fā)展,下表是近幾年我國某地區(qū)新能源汽車的年銷售量與年價(jià)的統(tǒng)計(jì)表
年份20162017201820192020
年銷售量(萬臺)812152025
根據(jù)上表,利用最小二乘法,新能源汽車的年銷售量y萬臺關(guān)于年份x的線性回歸方程為.
5
參考數(shù)據(jù):Z(x「君(,-9)=(-2)X(-8)+(-l)x(-4)+lx4+2x9=42,
i=l
5
2
^(x;-x)=4+1+1+4=10,42x2017=84714,42x2018=84756.
i=l
附:對于一組數(shù)據(jù)(4必),(%,%),,區(qū)》“),其回歸直線Rbx+d的斜率和截距的最小二乘估計(jì)分別為:
2(x;-x)(?-y)
b=-------,a=y-bx.
:(占3
;=1
【答案】."4.2x—8459.6
2016+2017+2018+2019+2020
【詳解】元=-----------------------------=2(Jlo,
5
8+12+15+20+25
5=----------------=lo
5
A£(玉-可(%-9)42
故b=上J-----------=—=4.2,
210
Z(x;-x)
<=1
/一宸=16-4.2x2018=-8459.6,
所以線性回歸方程為f=4.2x-8459.6
故答案為:y=4.2x-8459.6
例2.(2022?廣東?鐵一中學(xué)高三期末)2020年11月23日至29日累計(jì)確診人數(shù)如下表:
日期(1月)23日24日25日26日27日28日29日
人數(shù)(人)611213466101196
由上述表格得到如散點(diǎn)圖(1月23日為封城第一天).
>>(累計(jì)確診人數(shù))
(I)根據(jù)散點(diǎn)圖判斷>=〃+區(qū)與y=c.,(c,d均為大于0的常數(shù))哪一個(gè)適宜作為累計(jì)確診人數(shù)》與封
城后的天數(shù)X的回歸方程類型(給出判斷即可,不必說明理由);并根據(jù)上表中的數(shù)據(jù)求出回歸方程;
(2)隨著更多的醫(yī)護(hù)人員投入疫情的研究,2月20日武漢影像科醫(yī)生提出存在大量核酸檢測呈陰性(陽性
則確診),但觀其CT肺片具有明顯病變,這一提議引起了廣泛的關(guān)注,2月20日武漢疾控中心接收了1000
份血液樣本,假設(shè)每份樣本的檢驗(yàn)結(jié)果是陽性還是陰性都是相互獨(dú)立的,且每份樣本是陽性樣本的概率為
0.7,核酸試劑能把陽性樣本檢測出陽性結(jié)果的概率是0.99(核酸檢測存在陽性樣本檢測不出來的情況,但
不會把陰性檢測呈陽性),求這1000份樣本中檢測呈陽性的份數(shù)的期望.
參考數(shù)據(jù):
77
1嚴(yán)
yw
i=\?=1
62.141.54253550.123.47
_I7
其中叱=lgy,卬=弓2嗎,參考公式:對于一組數(shù)據(jù)(4,叫),(%%),…,(”",叱),其回歸直線卬=a+£〃
/f=l
”__
Z%叱-nuw
的斜率和截距的最小二乘估計(jì)公式分別為夕=弓------,a=w-/3u.
2-2
),%—nu
/=1
【答案】(1)由散點(diǎn)圖可知選擇y=
由丫=八,兩邊同時(shí)取常用對數(shù)得lgy=lgc+lg〃x,
設(shè)igy=w,w=igc+igi/x.
7
計(jì)算%=4,w=1.54,Zx;=140,
/=1
7____
〉2毛叱一7xw
50.12-7x4x1.547八“
-----------------1----=—=0.25,
lgd=2
-7?140-7X4---28
i=\
把樣本中心點(diǎn)(4,1.54)代入?yún)n=尼。+愴小*得吠=0.54.
w=0.54+0.25%,丫關(guān)于x的回歸方程為y=3.47xIO025";
(2)這1000份樣本中檢測呈陽性的份數(shù)為X,
則每份檢測出陽性的概率尸=0.7x0.99=0.693,
由題意可知X?8(1000,0.693),.?.£(%)=1000x0.693=693(人),
故這1000份樣本中檢測呈陽性份數(shù)的期望為693人.
【方法技巧與總結(jié)】
1.線性回歸方程的求法;
2.非線性回歸方程要通過換元換成線性回歸方程.
【變式訓(xùn)練】
1.(2022?廣東深圳?一模)某人工智能公司近5年的利潤情況如下表所示:
第X年12345
利潤y/億元23457
已知變量y與x之間具有線性相關(guān)關(guān)系,設(shè)用最小二乘法建立的回歸直線方程為y=1.2x+a,則下列說法正
確的是()A.a=0.6
B.變量y與x之間的線性相關(guān)系數(shù)r<0
D.該人工智能公司這5年的利潤的方差小于2
【答案】.AC
【詳解】解:依題意還:(1+2+3+4+5)=3,亍=:(2+3+4+5+7)=Z,
因?yàn)榛貧w直線方程為y=1.2x+a必過樣本中心點(diǎn)「可,即£=1.2x3+。,解得“=0.6,
故A正確;則回歸直線方程為y=1.2x+0.6,則%與V成正相關(guān),即相關(guān)系數(shù)/?>(),故B錯(cuò)誤,
當(dāng)x=6時(shí)=12x6+0.6=7.8,即該人工智能公司第6年的利潤約為7.8億元,故C正確,
該人工智能公司這5年的利潤的方差為((2-,)+,-弓)
故D錯(cuò)誤;
故選:AC
2.(2022?廣東惠州?二模)某地建立了農(nóng)業(yè)科技圖書館,供農(nóng)民免費(fèi)借閱,收集了近5年的借閱數(shù)據(jù)如下表:
年份20162017201820192020
年份代碼X12345
年借閱量W萬冊
根據(jù)上表,可得y關(guān)于x的線性回歸方程為?=0.24x+&,則()A.5=4.68
C.y與x的樣本相關(guān)系數(shù)r>0
26.(2022?廣東汕頭?二模)如圖所示,5個(gè)(x,y)數(shù)據(jù),去掉。(3,10)后,下列說法正確的是()
y?E(\0,l2)
,D(3,10)
O|*
A.相關(guān)系數(shù)r變大B.殘差平方和變大
C.相關(guān)指數(shù)R2變小D.解釋變量x與預(yù)報(bào)變量y的相關(guān)性變強(qiáng)
【答案】AD
【詳解】由散點(diǎn)圖知,去掉離群點(diǎn)D后,x與y的相關(guān)性變強(qiáng),且為正相關(guān),
所以相關(guān)系數(shù)r的值變大,相關(guān)指數(shù)網(wǎng)的值變大,殘差平方和變小.
故選:AD.
3.(2022?廣東?金山中學(xué)高三期末)2021年,我國脫貧攻堅(jiān)戰(zhàn)取得了全面勝利.為了鞏固拓展脫貧攻堅(jiān)成果,
不斷提高群眾的幸福感,某縣繼續(xù)推進(jìn)山羊養(yǎng)殖項(xiàng)目.為了建設(shè)相應(yīng)的配套項(xiàng)目,該縣主管部門對該縣近年
來山羊養(yǎng)殖業(yè)的規(guī)模進(jìn)行了跟蹤調(diào)查,得到了該縣每年售賣山羊數(shù)量y(單位:萬只)與相應(yīng)年份代碼x的
數(shù)據(jù)如下表:
年份201520162017201820192020
年份代碼X123456
售賣山羊數(shù)量》(萬只)111316152021
(1)由表可知y與x有較強(qiáng)的線性相關(guān)關(guān)系,求y關(guān)于x的線性回歸方程;
(2)已知該縣養(yǎng)殖的山羊品種只有甲、乙兩種,且甲品種山羊與乙品種山羊的數(shù)量之比為2:3,甲品種山
羊達(dá)到售賣標(biāo)準(zhǔn)后的出售價(jià)為2500元/只,乙品種山羊達(dá)到售賣標(biāo)準(zhǔn)后的出售價(jià)為2700元/只.為了解養(yǎng)殖
山羊所需要的時(shí)間,該縣主管部門隨機(jī)抽取了甲品種山羊和乙品種山羊各100只進(jìn)行調(diào)查,得到要達(dá)到售
賣標(biāo)準(zhǔn)所需的養(yǎng)殖時(shí)間如下表:
養(yǎng)殖時(shí)間(月數(shù))6789
甲品種山羊(只)20353510
乙品種山羊(只)10304020
以上述樣本統(tǒng)計(jì)的養(yǎng)殖山羊所需時(shí)間情況估計(jì)全縣養(yǎng)殖山羊所需時(shí)間(即以各養(yǎng)殖時(shí)間的頻率作為各養(yǎng)殖
時(shí)間的概率),且每月每只山羊的養(yǎng)殖成本為300元,結(jié)合(1)中所求回歸方程,試求2022年該縣養(yǎng)殖山
羊所獲利潤的期望(假設(shè)山羊達(dá)到售賣標(biāo)準(zhǔn)后全部及時(shí)賣完).(利潤=賣山羊的收入一山羊的養(yǎng)殖成本)
參考公式及數(shù)據(jù):回歸直線方程為¥=隊(duì)+隊(duì)其中坂=『--------,a=y-bx.
2
可2ZX:-rix
/=!;=i
【答案】?(1)>2工+9;(2)8800萬元.
1+2+3+4+5+611+13+16+15+20+21
【詳解】(1)因?yàn)榱?=3.5,y=-------------------=16,
66
-2.5x(-5)+(-1.5)x(-3)+(-0.5)x0+0.5x(-l)4-1.5x44-2.5x5_35
所以,==777=2,
(-2.5)2+(_]+(?5)2+0.52+1.52+2.5217.5
可得&=16—2x3.5=9.
所以丫與x之間的線性回歸方程為y=2x+9.
(2)由(1)可知,當(dāng)x=8時(shí),可得夕=25,
23
其中甲品種山羊有25、1=10萬只,乙品種山羊有25xg=15力只.
由頻率估計(jì)概率,可得甲品種山羊達(dá)到售賣標(biāo)準(zhǔn)需要的養(yǎng)殖時(shí)間為6個(gè)月,7個(gè)月,8個(gè)月和9個(gè)月的概率
分別為0.2,0.35,0.35和0.1,
所以甲品種山羊要達(dá)到售賣標(biāo)準(zhǔn)需要養(yǎng)殖時(shí)間的期望為6x0.2+7x0.35+8x0.35+9x0.1=7.35(月).
由頻率估計(jì)概率,可得乙品種山羊達(dá)到售賣標(biāo)準(zhǔn)需要的養(yǎng)殖時(shí)間為6個(gè)月,7個(gè)月,8個(gè)月和9個(gè)月的概率
分別為0.1,0.3,0.4和0.2,
所以乙品種山羊要達(dá)到售賣標(biāo)準(zhǔn)需要養(yǎng)殖時(shí)間的期望為6X0.1+7X0.3+8X0.4+9X0.2=7.7(月).
養(yǎng)殖每只甲品種山羊利潤的期望為2500-7.35x300=2500-2205=295(元),
養(yǎng)殖每只乙品種山羊利潤的期望為2700-7.7x300=2700-2310=390(元),
故2022年該縣售賣的山羊所獲利潤的期望為10x295+15x390=8800(萬元).
4.(2022?廣東廣州?一模)人們用大數(shù)據(jù)來描述和定義信息時(shí)代產(chǎn)生的海量數(shù)據(jù),并利用這些數(shù)據(jù)處理事務(wù)
和做出決策,某公司通過大數(shù)據(jù)收集到該公司銷售的某電子產(chǎn)品1月至5月的銷售量如下表.
月份X12345
銷售量y(萬件)
該公司為了預(yù)測未來幾個(gè)月的銷售量,建立了y關(guān)于x的回歸模型:y=ux2+v.
⑴根據(jù)所給數(shù)據(jù)與回歸模型,求y關(guān)于x的回歸方程(力的值精確到0.1);
⑵已知該公司的月利潤z(單位:萬元)與x,y的關(guān)系為z=244-&7,根據(jù)(1)的結(jié)果,問該公司
哪一個(gè)月的月利潤預(yù)報(bào)值最大?
參考公式:對于一組數(shù)據(jù)(七,乂),(9,%),,(%,%),其回歸直線?=以+4的斜率和截距的最小二乘估計(jì)公
£(一)(%-刃
式分別為b=J-----------,a=y-bx.
;=1
【答案】.(1)?=0.2/+5;(2)第9個(gè)月的月利潤預(yù)報(bào)值最大
(1)
.,1+4+9+16+25,,-4.9+5.8+6.8+8.3+10.2好
》卬=/,則n卬=-------------=11,y=---------------------=7.2,
g(叱一卬)(%一歹)__10X(_2.3)+(-7)X(-1.4)+(-2)X(-Q.4)+5X1.1+14x3_81,1
-22222
(1-11)+(4-11)+(9-11)+(16-11)+(25-11)-374
/=1'
v=y一加=7.2—0.2x11=5,所以y關(guān)于x的回歸方程為y=0.2丁+5:
(2)
由(1)知:y=0.2x2+5,
z=244=24.-5(°.2*:5)+2=246_%_令g)=244_£_年(x>0),
\lxylx\lx7x
"詈2/=一3八2尸「3(…尸])(,>o)
,x22Ixsjx2x\Jx
令廳(犬)>0得:0<x<9,令〃'(x)<0得:x>9,令〃(x)=0得:x=9,所以〃(力=244一/一?^?(x>0)
在x=9處取得極大值,也是最大值,/7(XL=M9)=72-27-9=36
所以第9個(gè)月的月利潤預(yù)報(bào)值最大.
5.(2022?廣東肇慶?二模)下表是我國從2016年到2020年能源消費(fèi)總量近似值y(單位:千萬噸標(biāo)準(zhǔn)煤)
的數(shù)據(jù)表格:
年份20162017201820192020
年份代號X12345
能源消費(fèi)總量近似值y(單位:
442456472488498
千萬噸標(biāo)準(zhǔn)煤)
以x為解釋變量,y為預(yù)報(bào)變量,若以夕=幻:+4為回歸方程,則相關(guān)指數(shù)用。0.9946,若以》=%+alnx
為回歸方程,則相關(guān)指數(shù)周=09568.
⑴判斷$與?=。2+8Inx哪一個(gè)更適宜作為能源消費(fèi)總量近似值y關(guān)于年份代號x的回歸方程,并
說明理由;
⑵根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),求出y關(guān)于年份代號x的回歸方程.
參考數(shù)據(jù):之必=2356,次x,?=7212.
1=1/=|
參考公式:回歸方程9=派+6中斜率和截距的最小二乘估計(jì)公式分別為:
?=毛-----------=號---------,a=y-bx.
i=li=l
【答案】.(l)£=4x+q更適宜作為y關(guān)于x的回歸方程,答案見解析;
(2)y=14.4^+428.
(1)
因?yàn)镽;>后,
所以£=b^x+a,更適宜作為y關(guān)于x的回歸方程.
(2)
I=1+2+3+4+5=3,%=l2+22+32+42+52=55.
5/=|
£X/-5郎7212-5x3x2356
b.=々--------=-----------3一=14.4,等*4x3=428,
十2<—255—5x9
i=l
所以以x為解釋變量,y為預(yù)報(bào)變量的回歸方程為5>=14.4X+428.
6.(2022?廣東潮州?二模)我國在芯片領(lǐng)域的短板有光刻機(jī)和光刻膠,某風(fēng)險(xiǎn)投資公司準(zhǔn)備投資芯片領(lǐng)域,
若投資光刻機(jī)項(xiàng)目,據(jù)預(yù)期,每年的收益率為30%的概率為P,收益率為-10%的概率為1-P;若投資光
刻膠項(xiàng)目,據(jù)預(yù)期,每年的收益率為30%的概率為0.4,收益率為-20%的概率為0.1,收益率為零的概率
為0.5.
⑴已知投資以上兩個(gè)項(xiàng)目,獲利的期望是一樣的,請你從風(fēng)險(xiǎn)角度考慮為該公司選擇一個(gè)較穩(wěn)妥的項(xiàng)目;
⑵若該風(fēng)險(xiǎn)投資公司準(zhǔn)備對以上你認(rèn)為較穩(wěn)妥的項(xiàng)目進(jìn)行投資,4年累計(jì)投資數(shù)據(jù)如下表:
年份X2018201920202021
1234
累計(jì)投資金額y(單位:億元)2356
請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于〃的線性回歸方程》=&,+4,并預(yù)測到哪一年年末,該
公司在芯片領(lǐng)域的投資收益預(yù)期能達(dá)到0.75億元.
2(再-五)(%-刃
附:收益=投入的資金x獲利的期望;線性回歸夕=應(yīng)+&中,?=『-----------=嚀---------,a=y-bx.
f(七-村成2
i=l
【答案】.⑴該風(fēng)投公司投資光刻膠項(xiàng)目:(2戶=14〃+0.5;2022年年末.
(1)
若投資光刻機(jī)項(xiàng)目,設(shè)收益率為四,則%的分布列為
?|
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度商業(yè)地產(chǎn)產(chǎn)權(quán)商鋪?zhàn)赓U市場推廣合同3篇
- 聲音記憶與個(gè)體身份建構(gòu)-深度研究
- 城市群發(fā)展模式比較研究-深度研究
- 2025年度車庫買賣合同(含車位產(chǎn)權(quán)分割)4篇
- 2025年度民辦學(xué)校教師學(xué)術(shù)交流與合作合同4篇
- 2025年度新型苗木培育與推廣項(xiàng)目合作協(xié)議4篇
- 二零二五版奶茶店員工薪酬福利與績效考核合同4篇
- 二零二五年度企業(yè)年會舞臺道具租賃合同協(xié)議書2篇
- 2025年度泥水班組勞務(wù)綠色施工合同4篇
- 二零二五年度城市公園樹木種植與景觀提升合同3篇
- GB/T 43650-2024野生動物及其制品DNA物種鑒定技術(shù)規(guī)程
- 2024年南京鐵道職業(yè)技術(shù)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 暴發(fā)性心肌炎查房
- 口腔醫(yī)學(xué)中的人工智能應(yīng)用培訓(xùn)課件
- 工程質(zhì)保金返還審批單
- 【可行性報(bào)告】2023年電動自行車項(xiàng)目可行性研究分析報(bào)告
- 五月天歌詞全集
- 商品退換貨申請表模板
- 實(shí)習(xí)單位鑒定表(模板)
- 數(shù)字媒體應(yīng)用技術(shù)專業(yè)調(diào)研方案
- 2023年常州市新課結(jié)束考試九年級數(shù)學(xué)試卷(含答案)
評論
0/150
提交評論