




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
微專題33統(tǒng)計與成對數(shù)據(jù)的統(tǒng)計分析
[考情分析]高考對本講內(nèi)容的考查往往以實際問題為背景,考查隨機(jī)抽樣與用樣本估計總
體、經(jīng)驗回歸方程的求解與運用、獨立性檢驗問題,常與概率綜合考查,中等難度.
-思維導(dǎo)圖
隨機(jī)抽樣一「一利用頻率分布直方圖求眾數(shù)、中位數(shù)與平均數(shù)
統(tǒng)
頻率分布直方圖一斗醞函隨機(jī)抽樣與用樣本估計總體
計L
數(shù)字特征一"|狗識與題應(yīng)一經(jīng)驗回歸方程的求解與運用
成
成對數(shù)據(jù)的統(tǒng)計分析一對—獨立性檢驗問題
數(shù)
據(jù)
的頻率分布直方圖中縱坐標(biāo)誤以為是頻率
利用最小二乘法求解經(jīng)驗回歸方程—統(tǒng)
必備計常見通過經(jīng)驗回歸方程求的都是估計值,而不是真
比較X2與臨界值的大小,判斷兩類—分誤區(qū)「實值
解法析
變量的關(guān)系.
_在犯錯誤的概率不大于?的前提下認(rèn)為兩個變
一量有關(guān),變量為a
典型例題
考點一圖表、數(shù)字特征
【典例1](1)(多選)(2023?南京模擬)新能源汽車包括純電動汽車、增程式電動汽車、混合動力
汽車、燃料電池電動汽車、氫發(fā)動機(jī)汽車等.我國的新能源汽車發(fā)展開始于21世紀(jì)初,近年
來發(fā)展迅速,連續(xù)8年產(chǎn)銷量位居世界第一.下面兩圖分別是2017年至2022年我國新能源
汽車年產(chǎn)量和占比(占我國汽車年總產(chǎn)量的比例)情況,貝1()
2017年2018年2019年2020年2021年2022年
2017年2018年2019年2020年2021年2022年
A.2017?2022年我國新能源汽車年產(chǎn)量逐年增加
B.2017-2022年我國新能源汽車年產(chǎn)量的極差為626.4萬輛
C.2022年我國汽車年總產(chǎn)量超過2700萬輛
D.2019年我國汽車年總產(chǎn)量低于2018年我國汽車年總產(chǎn)量
答案BCD
解析對于A,由圖可知,從2018年到2019年,我國新能源汽車年產(chǎn)量在下降,故A錯誤;
對于B,2017?2022年我國新能源汽車年產(chǎn)量的極差為705.8—79.4=626.4(萬輛),故B正確;
對于C,2022年我國汽車年總產(chǎn)量約為線!g2757(萬輛),故C正確;
1242
對于D,2019年我國汽車年總產(chǎn)量為5氤=2587.5(萬輛),
127
2018年我國汽車年總產(chǎn)量為萬麗P2822.22(萬輛),
所以2019年我國汽車年總產(chǎn)量低于2018年我國汽車年總產(chǎn)量,故D正確.
⑵(多選X2023?新高考全國I)有一組樣本數(shù)據(jù)XI,X2,…,如其中為是最小值,X6是最大值,
則()
A.X2,13,冗4,X5的平均數(shù)等于%1,X2,?,%6的平均數(shù)
B.X2,元3,%4,%5的中位數(shù)等于陽,工2,,X6的中位數(shù)
C.%2,工3,%4,%5的標(biāo)準(zhǔn)差不小于即,入2,?,,X6的標(biāo)準(zhǔn)差
D.%2,13,X4,X5的極差不大于,,%6的極差
答案BD
解析取為=1,%2=期=冗4=工5=2,%6=9,
22
則X2,X3,X4,X5的平均數(shù)等于2,標(biāo)準(zhǔn)差為0,XI,尤2,…,無6的平均數(shù)等于3,標(biāo)準(zhǔn)差為
哼,故A,C均不正確;
根據(jù)中位數(shù)的定義,將XI,X2,…,X6按從小到大的順序進(jìn)行排列,中位數(shù)是中間兩個數(shù)的
算術(shù)平均數(shù),由于即是最小值,X6是最大值,故%2,X3,%4,%5的中位數(shù)是將%2,%3,X4,%5
按從小到大的順序排列后中間兩個數(shù)的算術(shù)平均數(shù),與XI,X2,…,入6的中位數(shù)相等,故B
正確;
根據(jù)極差的定義,知X2,X3,%4,%5的極差不大于Xl,X2,…,%6的極差,故D正確.
跟蹤訓(xùn)練1(1)(多選)(2023?荷澤模擬)在某次數(shù)學(xué)競賽活動中,學(xué)生得分在[35,95]之間,滿
分100分,隨機(jī)調(diào)查了200位學(xué)生的成績,得到樣本數(shù)據(jù)的頻率分布直方圖,則()
A.圖中x的值為0.029
B.參賽學(xué)生分?jǐn)?shù)位于區(qū)間[45,75)上的概率約為0.85
C.樣本數(shù)據(jù)的75%分位數(shù)約為79
D.參賽學(xué)生的平均分?jǐn)?shù)約為69.4
答案AC
解析對于A,i(0.005+0.015+0.016+x+0.025+0.01)X10=l,解得x=0.029,A正確;
對于B,分?jǐn)?shù)位于區(qū)間[45,75)上的頻率為(0.015+0.016+0.029)X10=0.6,估計概率為0.60,
B錯誤;
對于C,由選項B知,樣本數(shù)據(jù)的75%分位數(shù)根e(75,85),由(小一75)X0.025=0.75—0.65,
解得加=79,C正確;
對于D,由頻率分布直方圖知,各小矩形面積從左到右依次為0.05,0.15,0.16,0.29,0.25,0.1,
平均分?jǐn)?shù)1=40X0.05+50X0.15+60X0.16+70)<0.29+80X0.25+90X0.1=68.4,D錯誤.
(2)(多選)有一組樣本甲的數(shù)據(jù)如一組樣本乙的數(shù)據(jù)2尤其中尤&=1,2,3,4,5,6,7,8)為不完
全相等的正數(shù),則下列說法正確的是()
A.樣本甲的極差一定小于樣本乙的極差
B.樣本甲的方差一定大于樣本乙的方差
C.若樣本甲的中位數(shù)是加,則樣本乙的中位數(shù)是2%+1
D.若樣本甲的平均數(shù)是小則樣本乙的平均數(shù)是2w+l
答案ACD
解析不妨設(shè)樣本甲的數(shù)據(jù)為CXXIWQW…(迎,且X1<X8,
則樣本乙的數(shù)據(jù)為2xi+1W2尤2+1W…W2x&+1,且23+1<21+1-
對于選項A,樣本甲的極差為X8—尤1>0,樣本乙的極差為(2x8+1)—(2為+1)=2(尤8—尤1),
因為2(迎—Xl)一(%8—尤1)=X8—Xl>0,
即2(耶—X1)>X8一處,
所以樣本甲的極差一定小于樣本乙的極差,故A正確;
對于選項B,記樣本甲的方差為另>0,則樣本乙的方差為4竟,
因為4s卷一=3s蜚>0,即4s卷,
所以樣本甲的方差一定小于樣本乙的方差,故B錯誤;
對于選項C,因為樣本甲的中位數(shù)是根=今熱,
則樣本乙的中位數(shù)是(2必+l)q(2X5+1)=X4+X5+1=2力+1,故C正確;
對于選項D,若樣本甲的平均數(shù)是〃,則樣本乙的平均數(shù)是2〃+1,故D正確.
考點二回歸分析
【典例21(2023?遼陽模擬)2022年12月份以來,全國多個地區(qū)紛紛采取不同的形式發(fā)放多輪
消費券,助力消費復(fù)蘇.記發(fā)放的消費券額度為x(百萬元),帶動的消費為M百萬元)?某省
隨機(jī)抽查的一些城市的數(shù)據(jù)如表所示.
X33455668
y1012131819212427
(1)根據(jù)表中的數(shù)據(jù),請用樣本相關(guān)系數(shù)說明y與尤有很強(qiáng)的線性相關(guān)關(guān)系,并求出y關(guān)于x
的經(jīng)驗回歸方程;
(2)①若該省A城市在2023年2月份準(zhǔn)備發(fā)放一輪額度為10百萬元的消費券,利用(1)中求得
的線性回歸方程,預(yù)計可以帶動多少消費?
②當(dāng)實際值與估計值的差的絕對值與估計值的比值不超過10%時,認(rèn)為發(fā)放的該輪消費券助
力消費復(fù)蘇是理想的.若該省A城市2023年2月份發(fā)放額度為10百萬元的消費券后,經(jīng)過
一個月的統(tǒng)計,發(fā)現(xiàn)實際帶動的消費為30百萬元,請問發(fā)放的該輪消費券助力消費復(fù)蘇是否
理想?若不理想,請分析可能存在的原因.
X(智―尤)8—y)E(Xi-x)(y,—y)
Z=1A尸1AA
參考公式:----/,b=-------------,".當(dāng)|廠|>0.75
A/S(x「x)2X(yi-y)2Ex尸
\/i=l產(chǎn)1尸1
時,兩個變量之間具有很強(qiáng)的線性相關(guān)關(guān)系.
參考數(shù)據(jù):存處5.9.
3+3+4+5+5+6+6+8
解⑴x=8=5
—10+12+13+18+19+21+24+27
'=R=18.
8__
E(xt—x)(yz,—>)=16+12+5+0+0+3+6+27=69,
Z=1
8_
2(xz—x>=4+4+1+0+0+1+1+9=20,
i=l
8—
XCVz—y尸=64+36+25+°+1+9+36+81=252,
i=l
8——
E(XLX)8-y)
一69竿
8_8_^20X^2524yf35''
£(XLx)2X8-y)2
i=l尸1
由于IM>0.75且r非常接近1,所以y與x具有很強(qiáng)的線性相關(guān)關(guān)系.
E⑶一尤)8-y)
A
經(jīng)計算可得2-1------------------------=§639=3.45,
X(X,-x)2
1=1
a=y~bx=18—3.45X5=0.75.
A
所以所求經(jīng)驗回歸方程為y=3.45尤+0.75.
A
(2)①當(dāng)x=10時,>=3.45X10+0.75=35.25,所以預(yù)計能帶動的消費達(dá)35.25百萬元.
②因為的35卷25bl5%>10%,所以發(fā)放的該輪消費券助力消費復(fù)蘇不是理想的.
發(fā)放消費券只是影響消費的其中一個因素,還有其他重要因素.
比如:A城市經(jīng)濟(jì)發(fā)展水平不高,居民的收入水平直接影響了居民的消費水平;
A城市人口數(shù)量有限、商品價格水平、消費者偏好、消費者年齡構(gòu)成等因素一定程度上影響
了消費總量.
跟蹤訓(xùn)練2(2023?承德模擬)某公司研制了一種對人畜無害的滅草劑,為了解其效果,通過
實驗,收集到其不同濃度x(mol/L)與滅死率y的數(shù)據(jù),得下表:
濃度x(mol/L)10-12W1010-810~610-4
滅死率y0.10.240.460.760.94
(1)以x為解釋變量,y為響應(yīng)變量,在和y=a+c21gx中選一個作為滅死率y關(guān)于濃
度x(mol/L)的經(jīng)驗回歸方程,不用說明理由;
(2)①根據(jù)(1)的選擇結(jié)果及表中數(shù)據(jù),求出所選經(jīng)驗回歸方程;
②依據(jù)①中所求經(jīng)驗回歸方程,要使滅死率不低于0.8,估計該滅草劑的濃度至少要達(dá)到多少
mol/L?
AAA
參考公式:對于一組數(shù)據(jù)(Xl,yD,(%2,J2),(xn,yn),其經(jīng)驗回歸直線>=/?X+〃的斜率
E(XLx)(y,-y)Er/y,—nxy
=
AZ1i=lA____A____
和截距的最小二乘估計公式分別為6=-------------------------=-----------------,a=~~b~.
£(x,—x產(chǎn)x2
尸1尸1
解(1)根據(jù)表格數(shù)據(jù)可知解釋變量X呈指數(shù)增長,而響應(yīng)變量y增長幅度不大,且相應(yīng)的增
加量大約相等,
AAA
故選y=ci+c21gx.
AAA
(2)①令%=lgXi,貝3=。1+。2〃,
所以可得如下數(shù)據(jù):
U-12-10-8-6-4
y0.10.240.460.760.94
—1—1
則U=5義(-12—10—8—6—4)=—8,y(0.1+0.24+0.46+0.76+0.94)=0.5,
5
XM?=(-12)2+(-10)2+(-8)2+(-6)2+(-4)2=360,
i=l
5
E^=(-12)X0.H-(-10)X0.24+(-8)X0.46+(-6)X0.76+(-4)X0.94=-15.6,
i=l
匕一、J-15.6-5X(-8)X0.5A
所以。2=—360—5力/2—=0.11,ci=0.5-0.11X(-8)=1.38,
AA
所以y=1.38+0.11",即y=1.38+0.111g尤.
人58
②依題意y=1.38+Olllgx》O8,即O.lllgxM—0.58,即Igx去一五,
5858
所以即要使滅死率不低于0.8,則該滅草劑的濃度至少要達(dá)到10「五mol/L.
考點三獨立性檢驗
【典例3](2023?長春模擬)某學(xué)校號召學(xué)生參加“每天鍛煉1小時”活動,為了了解學(xué)生參與
活動的情況,隨機(jī)調(diào)查了100名學(xué)生一個月(30天)完成鍛煉活動的天數(shù),制成如下頻數(shù)分布
表:
天數(shù)[0,5)[5,10)[10,15)[15,20)[20,25)[25,30]
人數(shù)4153331116
(1)由頻數(shù)分布表可以認(rèn)為,學(xué)生參加體育鍛煉天數(shù)X近似服從正態(tài)分布N(〃,/),其中〃近
似為樣本的平均數(shù)(每組數(shù)據(jù)取區(qū)間的中間值),且。=6.1,若全校有3000名學(xué)生,求參加“每
天鍛煉1小時”活動超過21天的人數(shù)(精確到1);
(2)調(diào)查數(shù)據(jù)表明,參加“每天鍛煉1小時”活動的天數(shù)在[15,30]的學(xué)生中有30名男生,天
數(shù)在[0,15)的學(xué)生中有20名男生,學(xué)校對當(dāng)月參加“每天鍛煉1小時”活動超過15天的學(xué)生
授予“運動達(dá)人”稱號.請?zhí)顚懴旅媪新?lián)表:
活動天數(shù)
性別合計
[0,15)[15,30]
男生
女生
合計
并依據(jù)小概率值a=0.05的獨立性檢驗,能否認(rèn)為學(xué)生性別與獲得“運動達(dá)人”稱號有關(guān)
聯(lián)?如果有關(guān)聯(lián),請解釋它們之間如何相互影響.
參考數(shù)據(jù):若隨機(jī)變量X服從正態(tài)分布o(jì)2),
則尸5一0<XW〃+<7)-0.6827;
Pa-ZoWXW〃+2cr)-0.9545;
〃+3(7)-0.9973.
,_____n(ad-bc)2/.
X~(a+bXc+d)(a+cXb+dfn~a+b+c+d)'
a0.10.050.010.0050.001
2.7063.8416.6357.87910.828
解(1)由頻數(shù)分布表知〃=
4X2.5+15X7.5+33X12.5+31X17.5+11X22.5+6X27.5
100
=14.9,則X?N(14.9,612),
yXW〃+Q-0.6827,
,1-0.6827
.?.P(X>21)=P(X>14.9+6.1)--------------=0.15865,
.?.3000X0.15865=475.952476,
參加“每天鍛煉1小時”活動超過21天的人數(shù)約為476.
⑵由頻數(shù)分布表知,鍛煉活動的天數(shù)在[0,15)的人數(shù)為4+15+33=52,
???參加”每天鍛煉1小時”活動的天數(shù)在[0,15)的學(xué)生中有20名男生,
.?.參加“每天鍛煉1小時”活動的天數(shù)在[0,15)的學(xué)生中女生人數(shù)為52-20=32,
由頻數(shù)分布表知,鍛煉活動的天數(shù)在[15,30]的人數(shù)為31+11+6=48,
?.?參加“每天鍛煉1小時”活動的天數(shù)在[15,30]的學(xué)生中有30名男生,
參加“每天鍛煉1小時”活動的天數(shù)在[15,30]的學(xué)生中女生人數(shù)為48-30=18.
.?.列聯(lián)表為
活動天數(shù)
性別合計
[0,15)[15,30]
男生203050
女生321850
合計5248100
零假設(shè)為豆:學(xué)生性別與獲得“運動達(dá)人”稱號無關(guān),
,100X(20X18—30X32)2
L50X50X52X48^5,769>3.841=^o.o5-
依據(jù)a=0.05的獨立性檢驗,我們推斷為不成立,即可以認(rèn)為學(xué)生性別與獲得“運動達(dá)人”
稱號有關(guān),而且此推斷犯錯誤的概率不大于0.05.
on1o
根據(jù)列聯(lián)表中的數(shù)據(jù)得至U,男生、女生中活動天數(shù)超過15天的頻率分別為第=0.6和第=0.36,
可見男生中獲得“運動達(dá)人”稱號的頻率是女生中獲得“運動達(dá)人”的稱號頻率的粽
心1.67倍,于是依據(jù)頻率穩(wěn)定與概率的原理,我們可以認(rèn)為男生獲得“運動達(dá)人”的概率大
于女生,即男生更容易獲得“運動達(dá)人”稱號.
跟蹤訓(xùn)練3(2023?福州模擬)國內(nèi)某大學(xué)為了了解本校學(xué)生的運動狀況,采用簡單隨機(jī)抽樣
的方法從全校學(xué)生中抽取2000人,調(diào)查他們平均每天運動的時間(單位:小時),統(tǒng)計表明該
校學(xué)生平均每天運動的時間范圍是[0,3],記平均每天運動的時間不少于2小時的學(xué)生為“運
動達(dá)人”,少于2小時的學(xué)生為“非運動達(dá)人”.整理分析數(shù)據(jù)得到下面的列聯(lián)表:
運動時間
性別合計
運動達(dá)人非運動達(dá)人
男生11003001400
女生400200600
合/p>
零假設(shè)為Ho:運動時間與性別之間無關(guān)聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),算得/七31.746,根據(jù)小
概率值a=0.001的/獨立性檢驗,則認(rèn)為運動時間與性別有關(guān),此推斷犯錯誤的概率不大于
0.001.
(1)如果將表中所有數(shù)據(jù)都縮小為原來的古,在相同的檢驗標(biāo)準(zhǔn)下,再用獨立性檢驗推斷運動
時間與性別之間的關(guān)聯(lián)性,結(jié)論還一樣嗎?請用統(tǒng)計語言解釋其中的原因;
(2)采用按樣本性別比例分配的分層隨機(jī)抽樣方法抽取20名同學(xué),并統(tǒng)計每位同學(xué)的運動時
間,統(tǒng)計數(shù)據(jù)為:男生運動時間的平均數(shù)為2.5,方差為1;女生運動時間的平均數(shù)為1.5,
方差為0.5,求這20名同學(xué)運動時間的均值與方差.
n(ad—be)?
其中幾=〃+Z?+c+d.
(〃+Z?)(c++c)(b+4'
臨界值表:
a0.10.050.010.0050.001
2.7063.8416.6357.87910.828
Xa
解(1)方法一改變數(shù)據(jù)之后的列聯(lián)表為
運動時間
性別合計
運動達(dá)人非運動達(dá)人
男生11030140
女生402060
合計15050200
200X(110X20—30X40)2200
則倜整后的9140X60X150X50=63—3,175<10.828=xo.ooi-
根據(jù)小概率值Q=o.ooi的獨立性檢驗,沒有充分證據(jù)推斷運動時間與性別有關(guān),與之前結(jié)論
不一樣,原因是每個數(shù)據(jù)都縮小為原來的擊,相當(dāng)于樣本容量縮小為原來的導(dǎo)致推斷結(jié)
論發(fā)生了變化,當(dāng)樣本容量越大時,用樣本估計總體的準(zhǔn)確性會越高.
方法二調(diào)整后的
10(a+/?)(c+d)(a+c)(Jb+d)10
-3.175<lO.828=w.ooi,
根據(jù)小概率值。=0.001的獨立性檢驗,沒有充分證據(jù)推斷運動時間與性別有關(guān),與之前結(jié)論
不一樣,原因是每個數(shù)據(jù)都縮小為原來的強(qiáng),相當(dāng)于樣本容量縮小為原來的擊,導(dǎo)致推斷結(jié)
論發(fā)生了變化,當(dāng)樣本容量越大時,用樣本估計總體的準(zhǔn)確性會越高.
(2)男生抽取另霽*20=14(人),女生抽取^^jX20=6(人),
由已知,男生運動時間的平均數(shù)%=2.5,樣本方差4=1;
女生運動時間的平均數(shù)y=1.5,樣本方差$3=0.5.
14X2.5+6X1.5
所以樣本均值a.=2.2,
20
記樣本方差為$2,則$2=
14X[l+(2.5—2.2)2]+6X[0.5+(1.5—2.2)2]
=1.06,
20
所以這20名同學(xué)運動時間的均值為2.2,方差為1.06.
[總結(jié)提升]
1.對于回歸分析主要考查求經(jīng)驗回歸方程(非線性經(jīng)驗回歸方程)和對變量值預(yù)測,用最小二
乘法來求解經(jīng)驗回歸方程,對非線性經(jīng)驗回歸方程選擇恰當(dāng)?shù)臄M合函數(shù),作恰當(dāng)?shù)淖儞Q,將
其轉(zhuǎn)化為線性函數(shù).
2.對變量的預(yù)測,若已知經(jīng)驗回歸方程(方程中無參數(shù)),可以直接將數(shù)值代入求得特定要求
下的預(yù)測值;若經(jīng)驗回歸方程中有參數(shù),則根據(jù)經(jīng)驗回歸直線一定經(jīng)過點(x,y),求出參
數(shù)值,得到經(jīng)驗回歸方程,進(jìn)而完成預(yù)測.
熱點突破
1.(2023?桂林模擬)某學(xué)校組建了演講、舞蹈、航模、合唱、機(jī)器人五個社團(tuán),全校3000名
學(xué)生每人都參加且只參加其中一個社團(tuán),校團(tuán)委從這3000名學(xué)生中隨機(jī)選取部分學(xué)生進(jìn)行
調(diào)查,并將調(diào)查結(jié)果繪制了如下不完整的兩個統(tǒng)計圖.
1人數(shù)
150----------------------------
-------------------------------------------------------------------------------------------------------------?
演講舞蹈航模合唱機(jī)器人社團(tuán)
則選取的學(xué)生中參加機(jī)器人社團(tuán)的學(xué)生人數(shù)為()
A.50B.75C.100D.125
答案B
解析由題意,本次調(diào)查的人數(shù)為50勺0%=500,
其中合唱比賽所占的比例為第=0.4=40%,
所以機(jī)器人所占的比例為1一10%—20%—15%—40%=15%,
所以選取的學(xué)生中參加機(jī)器人社團(tuán)的學(xué)生人數(shù)為500X15%=75.
2.(2023?濰坊質(zhì)檢)甲、乙兩名籃球運動員在8場比賽中的單場得分用莖葉圖表示(圖1),莖
葉圖中甲的得分有部分?jǐn)?shù)據(jù)丟失,但甲得分的折線圖(圖2)完好,貝|()
A.甲的單場平均得分比乙低
B.乙的60%分位數(shù)為19
C.甲、乙的極差均為H
D.乙得分的中位數(shù)是16.5
答案D
解析對于A,由莖葉圖和直方圖,甲比賽得分為9,12,13,13,15,20,26,28,平均得分為
9+12+13+13+15+20+26+28_
9=17,
..,、9+14+15+16+17+18+19+20
乙比賽得分為9,14,15,16,17,18,19,20,平均得分為--------------g-----------------------=16,甲
高于乙,故A錯誤;
對于B,由8X60%=4.8,故乙的60%分位數(shù)為17,故B錯誤;
對于C,甲的極差為28—9=19,乙的極差為20—9=11,故C錯誤;
對于D,乙得分的中位數(shù)是丹”=16.5,故D正確.
3.(2023?杭州模擬)某興趣小組研究光照時長尤(h)和向日葵種子發(fā)芽數(shù)量y(顆)之間的關(guān)系,
采集5組數(shù)據(jù),作如圖所示的散點圖.若去掉0(10,2)后,下列說法正確的是()
y
?£(8,11)
B⑵6)
/?C(3,5)
么(1,4).£>(10,2)
0|x
A.樣本相關(guān)系數(shù)r變小
B.決定系數(shù)配變小
C.殘差平方和變大
D.解釋變量x與響應(yīng)變量y的相關(guān)性變強(qiáng)
答案D
解析從圖中可以看出。(10,2)較其他點,偏離直線遠(yuǎn),故去掉0(10,2)后,回歸效果更好,
對于A,樣本相關(guān)系數(shù)H越接近于1,模型的擬合效果越好,若去掉。(10,2)后,樣本相關(guān)系
數(shù)r變大,故A錯誤;
對于B,決定系數(shù)相越接近于1,模型的擬合效果越好,若去掉0(10,2)后,決定系數(shù)F變
大,故B錯誤;
對于C,殘差平方和越小,模型的擬合效果越好,若去掉。(10,2)后,殘差平方和變小,故C
錯誤;
對于D,若去掉0(10,2)后,解釋變量x與響應(yīng)變量y的相關(guān)性變強(qiáng),且是正相關(guān),故D正確.
4.(2023?杭州模擬)有一組樣本數(shù)據(jù)xi,愈,…,斯,由這組數(shù)據(jù)得到新樣本數(shù)據(jù)Xl+k,愈
+k,xn+k,左為非零常數(shù).則下列說法不正確的是()
A.兩組樣本數(shù)據(jù)的極差相同
B.兩組樣本數(shù)據(jù)的標(biāo)準(zhǔn)差相同
C.兩組樣本數(shù)據(jù)的方差相同
D.兩組樣本數(shù)據(jù)的平均數(shù)相同
答案D
解析設(shè)樣本數(shù)據(jù)制,X2,…,沏的平均數(shù)為三,方差為心
樣本數(shù)據(jù)Xl+左,X2+鼠…,斯+反左為非零常數(shù))的平均數(shù)為X,,方差為總
對于A選項,不妨設(shè)X1WX2W…Wx”,則樣本數(shù)據(jù)打,了2,…,斯的極差為期—X1,
對于樣本數(shù)據(jù)X1+左,M+鼠…,左為非零常數(shù)),
則/+左或&+左<…Wx”+人,
所以樣本數(shù)據(jù)Xl+左,X2~\~k,???,X'+網(wǎng)人為非零常數(shù))的極差為(X"+A)—(X1+A)=X"—X1,
所以兩組樣本數(shù)據(jù)的極差相同,A正確;
對于D選項,
―;—(Xl+?+(X2+Z)+…+(無”+%)
X—n
Xl+x2-\-----\-Xn,,—,,
=---------n---------+k=x+k,
所以兩組樣本數(shù)據(jù)的平均數(shù)不相同,D錯誤;
對于B,C選項,s3=
[{?l+Z)_(x+A:)]2+1(X2+k)-(X+左)]2
H-----H[(x?+^)—(x+^)]21
(尤1—X)2+(%2-x)2H-----h(無“-X)2
所以兩組樣本數(shù)據(jù)的方差相同,這兩組數(shù)據(jù)的標(biāo)準(zhǔn)差也相同,B,C正確.
5.(多選)(2023?廣州模擬)某校隨機(jī)抽取了100名學(xué)生測量體重,經(jīng)統(tǒng)計,這些學(xué)生的體重數(shù)
據(jù)(單位:kg)全部介于45至70之間,將數(shù)據(jù)整理得到如圖所示的頻率分布直方圖,則()
A.頻率分布直方圖中。的值為0.07
B.這100名學(xué)生中體重低于60kg的人數(shù)為60
C.據(jù)此可以估計該校學(xué)生體重的第78百分位數(shù)約為62
D.據(jù)此可以估計該校學(xué)生體重的平均數(shù)約為62.5
答案AC
解析對于A,因為5X(0.01+a+0.06+0.04+0,02)=l,解得。=0.07,故A正確;
對于B,(0.01+0.07+0.06)X5X100=70(人),故B錯誤;
對于C,因為0.01X5+0.07X5+0.06X5=0.7,
0.01X5+0,07X5+0.06X5+0.04X5=0.9,0.7<0.78<0.9,所以第78百分位數(shù)位于[60,65)之
間,
設(shè)第78百分位數(shù)為x,則0,01X5+0.07X5+0.06X5+(x—60)X0.04=0.78,解得x=62,故
C正確;
對于D,因為0.01X5X47.5+0.07X5X52.5+0.06X5X57.5+0.04X5X62.5+0.02X5X67.5
=57.25,
即估計該校學(xué)生體重的平均數(shù)約為57.25,故D錯誤.
6.(多選)(2023?華南師大附中模擬)中國茶文化博大精深,茶水的口感與茶葉類型和水的溫度
有關(guān).為了建立茶水溫度y隨時間無變化的回歸模型,小明每隔1分鐘測量一次茶水溫度,
___1n___1n
得到若干組數(shù)據(jù)(即,yD,(必刈,…,%)(其中%>=[£%),繪制了如圖所
示的散點圖.小明選擇了如下2個回歸模型來擬合茶水溫度y隨時間x的變化情況,回歸模
型一:y=kx+b(k<0,x20);回歸模型二:y=kef+b(k>0fi<a<1,x20),下列說法正確的是
y
90
80
W????.
4...........
o12345X
A.茶水溫度與時間這兩個變量負(fù)相關(guān)
B.由于水溫開始降得快,后面降得慢,最后趨于平緩,因此模型二能更好的擬合茶水溫度
隨時間的變化情況
C.若選擇回歸模型二,利用最小二乘法求得的圖象一定經(jīng)過點(",7)
D.當(dāng)尤=5時,通過回歸模型二計算得y=65.1,用溫度計測得實際茶水溫度為65.2,則殘
差為一0.1
答案AB
解析由散點圖可知隨時間增加,溫度逐漸降低,且變化趨勢趨于平緩,故為負(fù)相關(guān)且模型
二擬合效果更好,故A,B正確;
根據(jù)非線性回歸模型的擬合方法,先令/=4,則/=公+乩此時擬合為一元線性回歸模型,
對應(yīng)的經(jīng)驗回歸直線過點(7,7),原曲線不一定經(jīng)過(。工,7),故c錯誤;
殘差為觀測值減估計值,即為65.2—65.1=0.1,故D錯誤.
7.蟋蟀鳴叫可以說是大自然優(yōu)美、和諧的音樂,蟋蟀鳴叫的頻率x(單位:次數(shù)/分鐘)與氣溫
y(單位:。C)有較強(qiáng)的線性相關(guān)關(guān)系.某同學(xué)在當(dāng)?shù)赝ㄟ^觀測,得到如下數(shù)據(jù),并利用最小二
乘法建立了y關(guān)于x的經(jīng)驗回歸方程尸*二.當(dāng)蟋蟀每分鐘鳴叫52次時,該地當(dāng)時的氣溫
預(yù)測值為.
x(次數(shù)/分鐘)24364060
M℃)2628.63035.4
答案33
——1
角翠析x=w><(24+36+40+60)=40,
——1
y=4義(26+28.6+30+35.4)=30,
人1A一一
又〃必過點(%,V),
1AA
.?.30=wX40+〃,解得。=20,
A1
.*.y=^x+20,
A1
.?.當(dāng)x=52時,j=^X52+20=33.
8.某學(xué)校有高中學(xué)生500人,其中男生320人,女生180人.為了獲得全體高中生身高的信
息,按照比例分配分層隨機(jī)抽樣原則抽取樣本,男生樣本量為32,女生樣本量為18,通過計
算得男生身高樣本平均數(shù)為173.5cm,方差為17,女生身高樣本平均數(shù)為163.83cm,方差
為30.03,則所有數(shù)據(jù)的樣本平均數(shù)為cm,方差為.
答案170.0243.24
__3212
解析由題意得。=5QX173.5+^OX163.83^170.02(cm),
{[32X17+32X(173.5-170.02)2]
+[18X30.03+18X(163.83-170.02)2]}
心43.24.
9.(2023?滁州模擬)大氣污染物PM2.5(大氣中直徑小于或等于2.5(im的顆粒物)的濃度超過一
定的限度會影響人的身體健康.為了研究PM2.5的濃度是否受到汽車流量等因素的影響,研
究人員選擇了20個社會經(jīng)濟(jì)發(fā)展水平相近的城市,在每個城市選擇一個交通點建立監(jiān)測點,
統(tǒng)計每個監(jiān)測點24h內(nèi)過往的汽車流量(單位:千輛),同時在低空相同的高度測定每個監(jiān)測
點空氣中PM2.5的平均濃度(單位:[ig/m3),得到的數(shù)據(jù)如下表:
城市編號汽車流量PM2.5濃度城市編號汽車流量PM2.5濃度
11.3066111.82135
21.4476121.4399
30.7821130.9235
41.65170141.4458
51.75156151.1029
61.75120161.84140
71.2072171.1143
81.51120181.6569
91.20100191.5387
101.47129200.9145
(1)根據(jù)上表,若24h內(nèi)過往的汽車流量大于等于1500輛屬于車流量大,PM2.5大于等于
75ng/m3屬于空氣污染.請結(jié)合表中的數(shù)據(jù),依據(jù)小概率值a=0.05的獨立性檢驗,能否認(rèn)為
車流量大小與空氣污染有關(guān)聯(lián)?
(2)設(shè)PM2.5濃度為y,汽車流量為尤.根據(jù)這些數(shù)據(jù)建立PM2.5濃度關(guān)于汽車流量的線性回歸模
型,并求出對應(yīng)的經(jīng)驗回歸方程(系數(shù)精確到0.01).
n(ad-bcf
附:p=
(。+Z?)(c+4)(。+c)(Z?+的'
a0.1000.0500.010
Xa2.7063.8416.635
2020202020A
5>Z=27.8,ZM=1770,2>?=40.537,ZM=193694,5>M=2680.48,在經(jīng)驗回歸方程y=
i=\i=\i=li=lz=l
n____
E(為一無)8一y)
=
Ai\
AAb=
Zzx+o中,Vz(%j_x)2
i=l
AA__
』=y—bx.
解(1)由表格,可得如下列聯(lián)表,
車流量小車流量大合計
空氣無污染819
空氣污染4711
合計12820
零假設(shè)為%:車流量大小與空氣污染無關(guān),
,2OX(8X7-4X1)2
L-12X8X9X11--5-690>3-841>
故依據(jù)小概率值a=0.05的獨立性檢驗,我們推斷Ho不成立,即能認(rèn)為車流量大小與空氣污
染有關(guān)聯(lián).
—12027.8—1201770
(2)由x=與》尸(o=L39,y=而工》==88.5,
i=li=l~
20—_20_____
工(XLx)(yt—>)=5>必一20%y=2680.48-20X1.39X88.5=220.18,
i=li=l
20—20—
Z(H—x)2=2>?—20x2=40.537—20X1.392=1.895,
i=li=l
A22018A
所以b=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專題2.9 函數(shù)的零點(原卷版)-2024年高考數(shù)學(xué)一輪復(fù)習(xí)精講精練寶典(新高考專用)
- 2022年北京市石景山初三二模英語試卷及答案
- (一模)萍鄉(xiāng)市2025年高三第一次模擬考試生物試卷(含答案解析)
- 2020-2021深圳寶文學(xué)校小學(xué)三年級數(shù)學(xué)下期中第一次模擬試卷(及答案)
- 機(jī)井電力配套施工方案
- 關(guān)于活動付款合同范例
- 專利委托合同范例
- 化工勞務(wù)合同范例
- 保安工作總結(jié)計劃裝飾行業(yè)保安工作的工地保護(hù)
- 會計工作與企業(yè)發(fā)展的關(guān)系計劃
- 邏輯判斷課件
- 社會心理學(xué):社會心理學(xué)的研究方法完整版
- 預(yù)防住院患者跌倒墜床的防范措施及宣教
- 地坪漆施工合同地坪漆施工合同范本
- (完整)2-吸附脫附等溫線及吸附理論
- 2023年全國甲卷作文真題導(dǎo)寫-2024年高考語文一輪復(fù)習(xí)作文備考特輯(全國通用)
- 畢業(yè)設(shè)計(論文)-基于PLC的供水控制系統(tǒng)設(shè)計
- 金稅四期下的稅務(wù)風(fēng)險與防范
- 把未來點亮歌詞打印版
- 國家中醫(yī)藥管理局第3批24個專業(yè)104個病種中醫(yī)診療方案
- 國際結(jié)算實驗
評論
0/150
提交評論