




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2025.高考科學(xué)復(fù)習(xí)創(chuàng)新方案?數(shù)學(xué).提升版第3講成對
數(shù)據(jù)的統(tǒng)計分析
[課程標(biāo)準(zhǔn).了解樣本相關(guān)系數(shù)的統(tǒng)計含義,了解樣本相關(guān)系數(shù)與標(biāo)準(zhǔn)化數(shù)據(jù)
向量夾角的關(guān)系.2.會通過相關(guān)系數(shù)比較多組成對數(shù)據(jù)的相關(guān)性3了解一元線性回
歸模型的含義,了解模型參數(shù)的統(tǒng)計意義,了解最小二乘原理,掌握一元線性回
歸模型參數(shù)的最小二乘估計方法,會使用相關(guān)的統(tǒng)計軟件4會用一元線性回歸模
型進(jìn)行預(yù)測5理解2x2列聯(lián)表的統(tǒng)計意義.6.了解2x2列聯(lián)表獨立性檢驗及其應(yīng)
用.
基礎(chǔ)知識整合
>知識梳理
1.相關(guān)關(guān)系
兩個變量有關(guān)系,但沒有確切到可由其中一個去精確地決定另一個的程度,
這種關(guān)系稱為相關(guān)關(guān)系.
2.相關(guān)關(guān)系的分類
(1)按變量間的增減性分為畫歪相關(guān)和國負(fù)相關(guān).
①正相關(guān):當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)畫增加的
趨勢.
②負(fù)相關(guān):當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)畫減少的趨
勢.
(2)按變量間是否有線性特征分為直線性相關(guān)或國韭線性相關(guān)(曲線相關(guān)).
①線性相關(guān):如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點落在國二
條直線附近,我們就稱這兩個變量線性相關(guān).
②非線性相關(guān)或曲線相關(guān):如果兩個變量具有相關(guān)性,但不是畫線性相關(guān),
我們就稱這兩個變量非線性相關(guān)或曲線相關(guān).
3.相關(guān)關(guān)系的刻畫
(1)散點圖:為了直觀描述成對樣本數(shù)據(jù)的特征,把每對成對數(shù)據(jù)都用直角坐
標(biāo)系中的點表示出來,由這些點組成的統(tǒng)計圖,叫做散點圖.
(2)樣本相關(guān)系數(shù)
①我們常用樣本相關(guān)系數(shù)一來確切地反映成對樣本數(shù)據(jù)(川,刈的相關(guān)程度,
其中r=
n__
E(劉-x)⑶-,)
(>")(…)2
②樣本相關(guān)系數(shù)r的取值范圍為畫JL—LL
當(dāng)時,成對樣本數(shù)據(jù)回正相關(guān);當(dāng)xo時,成對樣本數(shù)據(jù)回負(fù)相關(guān);
當(dāng)仍越接近回L時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);當(dāng)團(tuán)越接近回。時,成
對樣本數(shù)據(jù)的線性相關(guān)程度越弱.
4.一元線性回歸模型
Y=bx+ae,____.
稱口』八八,、二為y關(guān)于犬的一元線性回歸模型.其中y稱為回
E(e)=0,D(e)=(r
因變量或回響應(yīng)變量,尢稱為畫自變量或回健釋變量,回且稱為截距參數(shù),
回女稱為斜率參數(shù);6是回上與回公吐幺之間的隨機(jī)誤差,如果《二畫。,那
么丫與x之間的關(guān)系就可以用一元線性函數(shù)模型來描述.
5.最小二乘法
AAA
將y二飯+〃稱為y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公
式,其圖形稱為經(jīng)驗回歸直線,這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求
AAA/£(劉一工)87)Aj
得的乩。叫做R。的最小二乘估計,其中二——------Z--------------------,。二回
£(X/-X)2
6.殘差與殘差分析
⑴殘差
對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為畫觀測值,通過經(jīng)驗回歸方程得
到的f稱為網(wǎng)預(yù)測值,網(wǎng)觀測值減去因預(yù)測值稱為殘差.
(2)殘差分析
國殘差是隨機(jī)誤差的估計結(jié)果,通過對畫殘差的分析可以判斷模型刻畫數(shù)
據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.
7.對模型刻畫數(shù)據(jù)效果的分析
(1)殘差圖法
在殘差圖中,如果殘差比較均勻地集中在同以橫軸為對稱軸的水平帶狀區(qū)
域內(nèi),則說明經(jīng)驗回歸方程較好地刻畫了兩個變量的關(guān)系.
(2)殘差平方和法
殘差平方和回三_('?-倒2越小,模型的擬合效果越好.
i三1
(3)決定系數(shù)R2法
士n(》fA)-
可以用決定系數(shù)產(chǎn)=1-亍----------來比較兩個模型的擬合效果,R2越
W(D
國大,模型擬合效果越好,收越國小,模型擬合效果越差.
8.列聯(lián)表與獨立性檢驗
(1)2x2列聯(lián)表
①2X2列聯(lián)表給出了成對分類變量數(shù)據(jù)的同交叉分類頻數(shù).
②定義一對分類變量x和匕我們整理數(shù)據(jù)如下表所示:
Y
X合計
Y=0Y=1
x=oaba+b
X=1cdc+d
合計a+cb+dn=a+h+c+d
像這種形式的數(shù)據(jù)統(tǒng)計表稱為2x2列聯(lián)表.
(2)獨立性檢驗
①定義:利用Z2的取值推斷分類變量X和庖是查獨立的方法稱為了獨立
性檢驗,讀作“卡方獨立性檢驗。簡稱獨立性檢驗.
?—?n[ad-be)2
(2)/2=36—------------7-----7——-,其中〃=a+/?+c+d.
J人1—,(〃+〃)(丁+一)(〃+?)(〃+〃)1
(3)獨立性檢險解決實際問題的主要環(huán)節(jié)
①提出零假設(shè)”。:x和丫相互獨立,并給出在問題中的解釋.
②根據(jù)抽樣數(shù)據(jù)整理出2x2列聯(lián)表,計算/的值,并與臨界值打比較.
③根據(jù)檢驗規(guī)則得出推斷結(jié)論.
④在x和y不獨立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析x和y
間的影響規(guī)律.
0知識拓展
1.相關(guān)關(guān)系與函數(shù)關(guān)系的異同
共同點:二者都是指兩個變量間的關(guān)系;
不同點:函數(shù)關(guān)系是一種確定性關(guān)系,體現(xiàn)的是因果關(guān)系,而相關(guān)關(guān)系是一
種非確定性關(guān)系,體現(xiàn)的不一定是因果關(guān)系,也可能是伴隨關(guān)系.
AAA__
2.經(jīng)驗回歸直線):二云+。一定過點(x,y).
>雙基自測
1.(人教A選擇性必修第三冊習(xí)題8.1Ti改編)下列四個散點圖中,變量x與
y之間具有負(fù)線性相關(guān)關(guān)系的是()
y)
()
I)
答案D
解析觀察散點圖可知,只有D中的散點圖表示的是變量x與),之間具有負(fù)
線性相關(guān)關(guān)系.故選D.
2.甲、乙、丙、丁四位同學(xué)各自對A,B兩個變量的線性相關(guān)性做了試驗,
并用回歸分析方法分別求得相關(guān)系數(shù)一與殘差平方和〃3如下表:
甲乙丙T
r0.820.780.690.85
m106115124103
則哪位同學(xué)的試驗結(jié)果體現(xiàn)的A,B兩變量有更強(qiáng)的線性相關(guān)性()
A.甲B.乙
C.丙D.丁
答案D
解析團(tuán)越接近1,"Z越小,線性相關(guān)性越強(qiáng),故選D.
3.已知相關(guān)變量工和),滿足關(guān)系£=-。以+1,相關(guān)變量丁與z負(fù)相關(guān),則
下列結(jié)論中正確的是()
A.x與y正相關(guān),x與z負(fù)相關(guān)
B.x與y正相關(guān),x與z正相關(guān)
C.x與y負(fù)相關(guān),x與z負(fù)相關(guān)
D.x與y負(fù)相關(guān),x與z正相關(guān)
答案D
AAA
解析由-0.1X+1可得x與),負(fù)相關(guān).因為y與z負(fù)相關(guān),可設(shè)z=Z?),+
AAAAAAAA
a,b<0,JjllJz=Z?(-0.1A+1)+6/=-OAbx+b+a,故x與z正相關(guān).
4.(多選)(人教B選擇性必修第二冊432例1改編)為了解閱讀量多少與幸福
感強(qiáng)弱之間的關(guān)系,一個調(diào)查機(jī)構(gòu)根據(jù)所得到的數(shù)據(jù),繪制了如下所示的2x2列
聯(lián)表(個別數(shù)據(jù)暫用字母表示):
幸福感
閱讀量合計
強(qiáng)弱
多m1872
少36n78
合計906015()
計算得到Z2力2.981,參照下表:
a0.100.050.0250.0100.0050.001
Xa2.7063.8415.0246.6357.87910.828
則下列結(jié)論正確的是()
A.根據(jù)小概率值。=0.010的獨立性檢驗,可以認(rèn)為“閱讀量多少與幸福感強(qiáng)
弱無關(guān)”
B.=54
C.n=52
D.根據(jù)小概率值a=0.005的獨立性檢驗,可以在犯錯誤的概率不超過0.5%
的前提下認(rèn)為“閱讀量多少與幸福感強(qiáng)弱有關(guān)”
答案BD
解析.??/引2.981>7.879>6.635,.?.根據(jù)小概率值。=0.010的獨立性檢驗,
可以在犯錯誤的概率不超過1%的前提下認(rèn)為“閱讀量多少與幸福感強(qiáng)弱有關(guān)”,根
據(jù)小概率值〃=0.005的獨立性檢驗,可以在犯錯誤的概率不超過0.5%的前提下
認(rèn)為“閱讀量多少與幸福感強(qiáng)弱有關(guān)”,A錯誤,D正確;?.■〃2+36=90,18+〃
=60,「.團(tuán)=54,〃=42,7.B正確,C錯誤.
5.某產(chǎn)品的廣告費用x與銷售額),的統(tǒng)計數(shù)據(jù)如下表:
廣告費用*萬元)4235
銷售額y(萬元)49263954
根據(jù)上表可得經(jīng)驗回歸方程5二篇+2中的分為9.4,據(jù)此模型預(yù)測廣告費用為
6萬元時銷售額約為萬元.
答案65.5
_4+2+3+5_49+26+39+54
解析由表可得了二----4----二3.5,y=-------4------=42,因為點
AAAAAA
(3.5,42)在經(jīng)驗回歸直線),=灰+々上,旦〃=9.4,所以42=9.4x3.5+〃,解得a=
9.1.故經(jīng)驗回歸方程為£=9.4x+9.1.令x=6,得R=65.5.故預(yù)測廣告費用為6萬元
時銷售額約為65.5萬元.
核心考向突破
多角度探究突破
考向一兩個變量的相關(guān)性
角度1相關(guān)關(guān)系的判斷
例1(1)某商家今年上半年各月的人均銷售額(單位:千元)與利潤率統(tǒng)計表
如下:
月份123456
人均銷售額658347
18.
利潤率(%)12.610.43.08.116.3
5
根據(jù)表中數(shù)據(jù),下列說法正確的是()
A.利潤率與人均銷售額成正相關(guān)關(guān)系
B.利潤率與人均銷售額成負(fù)相關(guān)關(guān)系
C.利潤率與人均銷售額成正比例函數(shù)關(guān)系
D.利潤率與人均第售額成反比例函數(shù)關(guān)系
答案A
解析由統(tǒng)計表可得利潤率與人均銷售額不是正比例關(guān)系,也不是反比例關(guān)
系,排除C,D;其屬于正相關(guān)關(guān)系,A正確,B錯誤.故選A.
(2)在以下4幅散點圖中,圖_______中的y和x之間存在相關(guān)關(guān)系(將正確答
案的序號填在橫線上)
答案②③④
解析圖②③中的點成帶狀區(qū)域分布在某一直線附近,④中的點分布在某一
曲線附近,故②③④存在相關(guān)關(guān)系.
角度2相關(guān)系數(shù)的計算及意義
例2(1)(多選)某同學(xué)將收集到的六對數(shù)據(jù)制作成散點圖一
AA
如右,得到其經(jīng)驗回歸方程為八:),=0.681+出計算其相關(guān)系.
*c{)
數(shù)為n,決定系數(shù)為即經(jīng)過分析確定點F為“離群點”,把它去_上_____,
X
掉后,再利用剩下的五對數(shù)據(jù)計算得到經(jīng)驗回歸方程為/2:y=
源+0.68,相關(guān)系數(shù)為2決定系數(shù)為R幺下列結(jié)論正確的是()
A.n>/*!>0B.Ri>Ri
AA
C.0<Z?<0.68D力>0.68
答案AC
解析由圖可知兩變量呈正相關(guān),故n>0,m>0,去掉"離群點''后,相關(guān)
性更強(qiáng),所以「V廢,故此v審,故A正確,B錯誤;根據(jù)圖象,當(dāng)去掉尸點后,
直線基本在4,B,C,D,E附近的那條直線上,直線的傾斜程度會略向x軸偏
向,故斜率會變小,因此0<合<0.68,故C正確:D錯誤.故選AC.
(2)某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為
調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊
中用簡單隨機(jī)抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)5,??)(,=1,
2,…,20),其中H和"分別表示第,個樣區(qū)的植物覆蓋面積(單位:公頃)和這種
2()2020-20_、
野生動物的數(shù)量,并計算得£即=60,Z?=1200,Z8-1)2=80,£(>7-y)2
/=1/=1/=1/=1
20__
=9(X)0,E(Xi-x)('?-),)=800.
,=!
①求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣
區(qū)這種野生動物數(shù)量的平均數(shù)乘以地塊數(shù));
②求樣本(孫2,…,20)的相關(guān)系數(shù)(精確到0.01).
n
2U-x)(yi-y)
附:相關(guān)系數(shù),二一----------:-------------,/R.414.
、Z(r-X)2E(V-y)2
V口?i='
1201
解①每個樣區(qū)野生動物數(shù)量的平均數(shù)為疝=而xl20()=6(),地塊數(shù)為
1=1
200,所以該地區(qū)這種野生動物數(shù)量的估計值為200x60=12000.
②樣本6,V)的相關(guān)系數(shù)為
20__
_g—Lx)(p—y)__________8002迫
r==
^(y;-7)r^=3??
口觸類旁通n判定兩個變量相關(guān)性的方法
若點的分布從左下角到右上角,則兩個變量正相關(guān);若點的分
畫散點圖
布從左上角到右下角,則兩個變量負(fù)相關(guān)
當(dāng)廠>0時,正相關(guān);當(dāng)X。時,負(fù)相關(guān);M越接近1,線性相關(guān)
樣本相關(guān)系數(shù)
程度遺強(qiáng)
AA
經(jīng)驗回歸方程當(dāng)比>0時,正相關(guān);當(dāng)8Vo時,負(fù)相關(guān)
r即時訓(xùn)練1.(2024?薊州開學(xué)考試)對兩個變量羽),進(jìn)行線性市地嬴榛
性相關(guān)系數(shù)門=0.8995,對兩個變量〃,u進(jìn)行線性相關(guān)檢驗,得線性相關(guān)系數(shù)9
=-0.9568,則下列判斷正確的是()
A.變量x與y正相關(guān),變量〃與u負(fù)相關(guān),變量x與),的線性相關(guān)性較強(qiáng)
B.變量x與y負(fù)相關(guān),變量〃與口正相關(guān),變量無與),的線性相關(guān)性較強(qiáng)
C.變量x與),正相關(guān),變量〃與口負(fù)相關(guān),變量〃與口的線性相關(guān)性較強(qiáng)
D.變量x與),負(fù)相關(guān),變量〃與u正相關(guān),變量〃與u的線性相關(guān)性較強(qiáng)
答案C
解析因為線性相關(guān)系數(shù)門二0.8995X),所以二y正相關(guān),因為線性相關(guān)系
數(shù)旌=-0.9568<0,所以〃,>,負(fù)相關(guān),又因為|川<四,所以變量〃,?的線性相關(guān)
性比心的線性相關(guān)性強(qiáng),故A,B,D錯誤,C正確.故選C.
2.為了監(jiān)控某種零件的一條生產(chǎn)線的生產(chǎn)過程,檢驗員每隔30min從該生
產(chǎn)線上隨機(jī)抽取一個零件,并測量其尺寸(單位:cm).下面是檢驗員在一天內(nèi)依
次抽取的16個零件的尺寸:
抽取次序12345678
零件尺寸9.9510.129.969.9610.019.929.9810.04
抽取次序910111213141516
零件尺寸10.269.9110.1310.029.2210.0410.059.95
116/I16
經(jīng)計算得x=石£一二9.97,s='/諱Z)2=
([?-16£2)=0.212,8.5)2-8.439,£(劉_I)*8.5)=-
2.78,其中方為抽取的第,個零件的尺寸,,.=1,2,…,16.
(1)求(8,/)(/=1,2,16)的相關(guān)系數(shù)人并回答是否可以認(rèn)為這一天生產(chǎn)
的零件尺寸不隨生產(chǎn)過程的進(jìn)行而系統(tǒng)地變大或變小(若I/K0.25,則可以認(rèn)為零件
的尺寸不隨生產(chǎn)過程的進(jìn)行而系統(tǒng)地變大或變小);
(2)一天內(nèi)抽檢零件中,如果出現(xiàn)了尺寸在(1-3s,1+3s)之外的零件,就
認(rèn)為這條生產(chǎn)線在這一天的生產(chǎn)過程可能出現(xiàn)了異常情況,需對當(dāng)天的生產(chǎn)過程
進(jìn)行檢查.
①從這一天抽檢的結(jié)果看,是否需對當(dāng)天的生產(chǎn)過程進(jìn)行檢查?
②在(1-35,工+3s)之外的數(shù)據(jù)稱為離群值,試剔除離群值,估計這條生產(chǎn)
線當(dāng)天生產(chǎn)的零件尺寸的均值與標(biāo)準(zhǔn)差(精確到0.01).
附:樣本(孫,?)(,=1,2,〃)的相關(guān)系數(shù)
參考數(shù)據(jù):^0.008-0.09.
解(1)由樣本數(shù)據(jù),得但,i)(i=1,2,…,16)的相關(guān)系數(shù)r
16
-2.78
-------F=-------=-()18
0.212x716x18.439
由于仍<0.25,因此可以認(rèn)為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過程的進(jìn)行而系
統(tǒng)地變大或變小.
(2)①由于工二9.97,s=0.212,因此由樣本數(shù)據(jù)可以看出抽取的第13個零件
的尺寸在(1-3s,1+3s)以外,因此需對當(dāng)天的生產(chǎn)過程進(jìn)行檢查.
②剔除離群值,即第13個數(shù)據(jù),剩下數(shù)據(jù)的平均數(shù)為tX(16X9.97-9.22)=
10.02,
這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的均值的估計值為10.02.
16
£^^16X0.2122416x9.972=1591.134,
/=1
剔除第13個數(shù)據(jù),剩下數(shù)據(jù)的樣本方差為tx(1591.134-9.222-
15x10.022戶0.008,
這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的標(biāo)準(zhǔn)差的估計值為M麗巾.09.
多角度探究突破
考向二回歸分析
角度1線性回歸模型
例3(2024.濟(jì)南開學(xué)考試)隨著科技的發(fā)展,網(wǎng)購成了人們購物的重要選擇,
并對實體經(jīng)濟(jì)產(chǎn)生了一定影響.為了解實體經(jīng)濟(jì)的現(xiàn)狀,某研究機(jī)構(gòu)統(tǒng)計了一個
大商場2019-2023年的線下銷售額如下:
年份編號X12345
年份20192020202120222023
銷售額y
1513146512021060860
(單位:萬元)
(1)由表中數(shù)據(jù)可以看出,可用線性回歸模型擬合銷售額),與年份編號x的關(guān)
系,請用相關(guān)系數(shù)加以說明;
(2)建立),關(guān)于久?的經(jīng)驗回歸方程,并預(yù)測2024年該商場的線下銷售額.
參考公式及數(shù)據(jù):
A£砂-〃工aA_A_
b=~,a=y-bx,
£京-nx2
1736.
5
斗
解(1)由已知數(shù)據(jù)可得,X=3,y=—=^=1220,
5
所以£卬,-5Ty=16589-5x3x1220=-1711,
/=!
5
I___________________________
所以〃二J7,21’5y)工浦在-0.9856.
因為M非常接近1,所以可用線性回歸模型擬合銷售額),與年份編號x的關(guān)系.
22222
(2)由已知數(shù)據(jù)可得,1>?=14-2+3+4+5=55,
/=i
5
孕C
Ay16589-5x3x1220
所以。二當(dāng)者5“——=-171.1,
=DD-
a=y-bx=1220-(-171.1)x3=1733.3,
所以>關(guān)于x的經(jīng)驗回歸方程為5二-171.我+1733.3.
令x=6,
5!ljy=-171.1x6+1733.3=706.7(萬元).
所以預(yù)測2024年該商場的線下銷售額為706.7萬元.
角度2非線性回歸模型
例4某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費工(單
位:千元)對年銷售量)(單位:。和年利潤z(單位:千元)的影響.對近8年的年宣
傳費即和年銷售量2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一
些統(tǒng)計量的值.
年銷售址/|
620
600...
580.■
560?
540.
520
500.?
48()1AA1AAAA,,A.
34363840424446485)525456
年宣傳費/千元
8
88_2(WL
£(M篙(Xz-X)?(y?
yj(無一IF
Xyvr
初2-y)vv)-(>v-y)
46.65636.8289.81.61469108.8
表中卬i=?,W=R*Wi.
⑴根據(jù)散點圖判斷,),二。+bx與尸c+小「哪一個適宜作為年銷售量y關(guān)于
年宣傳費X的經(jīng)驗回歸方程類型?(給出判斷即可,不必說明理由)
(2)根據(jù)⑴的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于支的經(jīng)驗回歸方程;
(3)已知這種產(chǎn)品的年利潤z與x,y的關(guān)系為z=().2y-x.根據(jù)⑵的結(jié)果回答
下列問題:
①年宣傳費工二49時,年銷售量及年利潤的預(yù)測值是多少?
②年宣傳費x為何值時,年利潤的預(yù)測值最大?
附:對于一組數(shù)據(jù)("I,Vl),(U2,V2),???,(4,v?),其經(jīng)驗回歸直線^A二aA+/A
AZ/)(V/-V)AA_
〃的斜率和截距的最小二乘估計分別為"~~-----------------,?=v-Pu.
X〃)2
解(1)由散點圖可以判斷,y=c+M適宜作為年銷售量y關(guān)于年宣傳費x
的經(jīng)驗回歸方程類型.
(2)令w=先建立y關(guān)于卬的經(jīng)驗回歸方程.
8
八(Wi-(yi-y)
108.8
由于"二'68,
8_1.6
R(Wi~W)2
A_A_,一____
c=y-dvv=563-68x6.8=100.6,
A
所以y關(guān)于卬的經(jīng)驗回歸方程為y=100.6+68iv,
因此y關(guān)于x的經(jīng)驗回歸方程為£=100.6+68G.
(3)①由(2)知,當(dāng)戶49時,年銷售量),的預(yù)測值為£=100.6+6隊用=576.6
千元,
年利潤z的預(yù)測值為1=576.6x0.2-49=66.32千元.
②根據(jù)⑵的結(jié)果知,年利潤z的預(yù)測值
z=0.2(100.6+68^)-x=-x+13.6^+20.12.
所以當(dāng)5:號=6.8,即x=46.24時,2取得最大值.
故年宣傳費為46.24千元時,年利潤的預(yù)測值最大.
1觸類旁通I求經(jīng)驗回歸方程的步驟
提醒:對非線性回歸分析問題,可通過適當(dāng)?shù)膿Q元轉(zhuǎn)化為線性回歸分析問題
求解.
&即時訓(xùn)練1.(2023?廈門二模)移動物聯(lián)網(wǎng)廣泛應(yīng)用于皿億戶
25?
生產(chǎn)制造、公共服務(wù)、個人消費等領(lǐng)域.截至2022年底,20.
我國移動物聯(lián)網(wǎng)連接數(shù)達(dá)18.45億戶,成為全球主要經(jīng)濟(jì)體!??
00I2345/
中首個實現(xiàn)''物超人''的國家.如圖是2018?2()22年移動物
聯(lián)網(wǎng)連接數(shù)卬與年份代碼,的散點圖,其中年份2018?2022對應(yīng)的1分別為1?
5.
(1)根據(jù)散點圖推斷兩個變量是否線性相關(guān).計算樣本相關(guān)系數(shù)(精確到0.01),
并推斷它們的相關(guān)程度;
(2)①假設(shè)變量x與變量丫的〃對觀測數(shù)據(jù)為(xi,yi),(X2,聞,…,g泗),
Y=bx+e
兩個變量滿足一元線性回歸模型口二、:八/、式隨機(jī)誤差
E(e)=0,D(e)-(T
bxi).請推導(dǎo):當(dāng)隨機(jī)誤差平方和。二£區(qū)取得最小值時,參數(shù)的最小二乘估計;
/=!
②令變量x=/-7,y=卬-6,則變量x與變量y滿足一元線性回歸模型
(Y=bx+e
1,、:n/、,利用①中結(jié)論求y關(guān)于X的經(jīng)驗回歸方程,并預(yù)測2024
年移動物聯(lián)網(wǎng)連接數(shù).
內(nèi)
-
S(0f)(wf—w)
附:樣本相關(guān)系數(shù)r="£(%.一而",
2
S(w,-w)=76.9,S(/,-f)(w,-w)=27.2,Sw,=6081網(wǎng)之277
解(1)由散點圖可以看出樣本點都集中在一條直線附近,由此推斷兩個變量
線性相關(guān).
因為7=1x(l+24-3+4+5)=3,
5
所以Ze-7)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=1(),
z=i
Z(6-7)(W7-HO
,7.2_27.227.2
[10x76.9=”27.7
=0.98,
所以這兩個變量正線性相關(guān),且相關(guān)程度很強(qiáng).
£一=£(北一)2=£(9一2bxiy,
⑵①。二-1"I"1
+b2xj)=lrN乂
—I___
要使Q取得最小值,當(dāng)且僅當(dāng)〃A二與y右??2.
55
2工<“2(?!?(w,
r°1_________£_____~_w__)
②由①知公二£5—')2二*二2.72,
所以y關(guān)于X的經(jīng)驗回歸方程為£=2.72X,
5
之卬i
又6二一§一=?3=12.16,所以當(dāng)/=7時,
貝IJx=7-3=4,w=y+b=2.72x4+12.16=23.04,
所以預(yù)測2024年移動物聯(lián)網(wǎng)連接數(shù)為23.04億戶.
2.(2023?遼寧名校聯(lián)盟期末)紅鈴蟲是棉花的主要害蟲之一,也侵害木棉、錦
葵等植物.為了防治蟲害,從根源上抑制害蟲數(shù)量.現(xiàn)研究紅鈴蟲的產(chǎn)卵數(shù)和溫
度的關(guān)系,收集到7組溫度工和產(chǎn)卵數(shù)y的觀測數(shù)據(jù)于表I中.根據(jù)繪制的散點
圖決定從回歸模型①),=oeclr與回歸模型②.v=+C4中選擇一個來進(jìn)行擬合.
表【
溫度x/℃20222527293135
產(chǎn)卵數(shù)w個711212465114325
(1)請借助表n中的數(shù)據(jù),求出回歸模型①的方程(精確到().01);
表11(注:表中Zi=lny)
7777_7_
X(Xi-x)2
工(V-5)2
18956725.2716278106
7£y>(ti
zli(力-居8-,S(無一
2
7)工)?(》-y)x)-(A-7)-7)
11.06304041.86825.09
(2)類似地,可以得到回歸模型②的方程為>=0.361-202.54,試求兩種模型
下溫度為20℃時的殘差;
(3)若求得回歸模型①的決定系數(shù)R2=0.95,回歸模型②的決定系數(shù)R2=0.81,
請結(jié)合(2)說明哪個模型的擬合效果更好.
參考數(shù)據(jù):e-3⑷=o.o3,e026?1.30,e,79?5.99,e52O?181.27.
附:經(jīng)驗回歸方程9=加+1中
n__
"(船一x)(y-y)
AA_A_
?Z~7,a-y-px.
£{Xi-X)2
解⑴由y=ciec2r,fliny=\nc\+ax,
令,=Iny,b=a,a=Inci,得,=+a,
由表H數(shù)據(jù)可得,
7
41.86
7-0.26,
£(Xi-X)2162
A_A_25.27八r,189
a-i-bx~~~-0.26x-=-3o.41,
A
所以f=0.26x—3.41,
所以所求經(jīng)驗回歸方程為Q=e°.-3⑷(或Q=o.O3eO26v).
⑵由題意可知,模型①在x=20時殘差為yi-yi=7-e°-26x20-3-41?1.01,
模型②在x=20時殘差為yi-yi=7-(0.36x202-202.54)=65.54.
(3)因為0.95>0.81,即模型①的決定系數(shù)大于模型②的決定系數(shù),由決定系
數(shù)公式知,模型①的殘差平方和小于模型②的殘差平方和,因此模型①得到的數(shù)
據(jù)更接近真實數(shù)據(jù),所以模型①的擬合效果更好.
考向三獨立性檢驗
例5(2023?棗莊三中期末)某中學(xué)為調(diào)查本校學(xué)生“保
護(hù)動物意識的強(qiáng)弱與性別是否有關(guān)“,采用簡單隨機(jī)抽樣的
方法,從該校分別抽取了男生和女生各50名作為樣本,經(jīng)
統(tǒng)計,得到如圖所示的等高堆積條形圖.
(1)根據(jù)已知條件,將下面2x2列聯(lián)表補(bǔ)充完整:II保護(hù)動物意隊強(qiáng)
II保護(hù)動物意隊弱
保護(hù)動物意識合計
性別
強(qiáng)弱
男生50
女生50
合計100
(2)根據(jù)(1)表中數(shù)據(jù),依據(jù)小概率值a=0.005的獨立性檢驗,分析該校學(xué)生
保護(hù)動物意識的強(qiáng)弱與性別是否有關(guān).
,n(ad-be)2
附.(〃+/?)(c+d)(a+c)(b+d),n=a+b+c+d.
a0.100.050.010.005
Xa2.7063.8416.6357.879
解(1)由等高堆積條形圖知,男生保護(hù)動物意識強(qiáng)的有50x0.7=35人,女生
保護(hù)動物意識強(qiáng)的有50x0.4=20人,于是補(bǔ)充2x2列聯(lián)表如下:
保護(hù)動物意識合計
性別
強(qiáng)弱
男生351550
女生203050
合計5545100
(2)零假設(shè)為"0:該校學(xué)生保護(hù)動物意識的強(qiáng)弱與性別無關(guān),根據(jù)列聯(lián)表中的
數(shù)據(jù),得
、100x(35x30-15x20)2100
/=-50X50X55X45-二,9.091>7.879=xo.oo5,
根據(jù)小概率值a=0.005的獨立性檢驗,我們推斷“0不成立,即認(rèn)為該校學(xué)
生保護(hù)動物意識的強(qiáng)弱與性別有關(guān),此推斷犯錯誤的概率不大于0.005.
I觸類旁通I
1.比較幾個分類變量有關(guān)聯(lián)的可能性大小的方法
(1)通過計算Z2的大小判斷:Z2越大,兩變量有關(guān)聯(lián)的可能性越大.
(2)通過計算|〃-慶|的大小判斷:|〃-曲|越大,兩變量有關(guān)聯(lián)的可能性越大.
(3)通過計算備與力的大小判斷:相差越大,兩變量有關(guān)聯(lián)的可能性越大.
V*Iexv*IV*
2.獨立性檢驗的一般步驟
(1)根據(jù)樣本數(shù)據(jù)制成2x2列聯(lián)表.
.n(ad-be)2.
⑵根據(jù)公式r=("份(,+d)(a+c)g+計算/的值,
(3)比較/與臨界值打的大小關(guān)系,作統(tǒng)計推斷.
r即時訓(xùn)練(2024.貴州黔東南州從江縣高三期中檢測謀學(xué)?,F(xiàn)有1000名學(xué)
生,為調(diào)查該校學(xué)生一周使用手機(jī)上網(wǎng)時間的情況,收集了〃名學(xué)生某周使用手
機(jī)上網(wǎng)時間的樣本數(shù)據(jù)(單位:小時).將數(shù)據(jù)分為6組:[0,2],(2,4J,(4,6J,
(6,8],(8,10],(1(),12],并整理得到如下的頻率分布直方圖:
(1)估計該校學(xué)生一周平均使用手機(jī)上網(wǎng)時間(每組數(shù)據(jù)以該組中點值為代
表);
(2)將一周使用手機(jī)上網(wǎng)時間在(4,12]內(nèi)定義為“長時間使用手機(jī)上網(wǎng)“;一周
使用手機(jī)上網(wǎng)時間在(0,4]內(nèi)定義為“不長時間使用手機(jī)上網(wǎng)”,在樣本數(shù)據(jù)中,
有().25〃名學(xué)生不近視.
①請補(bǔ)充完成該周使用手機(jī)上網(wǎng)時間與近視程度的列聯(lián)表;
②若〃為100,那么在犯錯誤的概率不超過0.001的前提下是否能認(rèn)為該校學(xué)
生一周使用手機(jī)上網(wǎng)時間與近視程度有關(guān)?
一周使用手機(jī)近視程度
合計
上網(wǎng)時間近視不近視
長時間使用手機(jī)
不長時間使用手機(jī)0.15/?
合計0.25〃
n(ad-be)2
附:1“)(c+d)…(〃+"),其中,…+b+c+&
a0.10.050.0100.0050.001
2.7063.8416.6357.87910.828
解(1)根據(jù)頻率分布直方圖可估計該校學(xué)生一周平均使用手機(jī)上網(wǎng)時間為
x=1x0.025x2+3x0.100x2+5x0.150x2+7x0.125x2+9x0.075x2+11x0.025x2=
5.8(小時).
(2)①由頻率分布直方圖可得,上網(wǎng)時間在(0,4]內(nèi)和(4,12]內(nèi)的比例為0.25:
0.75=1:3,
故可得列聯(lián)表如下:
近視程度
一周使用手機(jī)上網(wǎng)時間合計
近視不近視
長時間使用手磯0.65〃0.1On0.75〃
不長時間使用手機(jī)0.10〃0.15/?0.25〃
合計0.75〃0.25〃n
100x(65x15-10x10)2
②若〃為100,則茬=—乂—?21.78>10.828,故在犯錯誤
的概率不超過0.001的前提下能認(rèn)為該校學(xué)生一周使用手機(jī)上網(wǎng)時間與近視程度
有關(guān).
課時作業(yè)
一、單項選擇題
1.根據(jù)分類變量X與>的成對樣本數(shù)據(jù),計算得到犬二6.147.依據(jù)a=0.01
的獨立性檢驗(xo.oi=6.635),結(jié)論為()
A.變量犬與y不獨立
B.變量犬與),不獨立,這個結(jié)論犯錯誤的概率不超過0.01
C.變量x與),獨立
D.變量x與y獨立,這個結(jié)論犯錯誤的概率不超過0.01
答案C
解析依據(jù)a=0。的獨立性檢驗,當(dāng)/=6.147<6.635時,可以認(rèn)為變量x
與)獨立.故選C
2.(2023?天津高考)調(diào)查某種群花萼長度和花瓣長度,所得數(shù)據(jù)如圖所示.其
中相關(guān)系數(shù)一二0.8245,下列說法正確的是()
花滯長度
花萼氏度
A.花瓣長度和花萼長度沒有相關(guān)性
B.花瓣長度和花萼長度呈負(fù)相關(guān)
C.花瓣長度和花萼長度呈正相關(guān)
D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.8245
答案C
解析因為相關(guān)系數(shù)r=0,8245>0.75,所以花瓣長度和花萼長度的相關(guān)性較
強(qiáng),并且呈正相關(guān),所以A,B錯誤,C正確;因為相關(guān)系數(shù)與樣本的數(shù)據(jù)有關(guān),
所以當(dāng)樣本發(fā)生變化時,相關(guān)系數(shù)也可能會發(fā)生變化,所以D錯誤.故選C.
3.(2024.青島開學(xué)考試)已知某設(shè)備的使用年限x(單位:年)與年維護(hù)費用),(單
位:千元)的對應(yīng)數(shù)據(jù)如下表:
X24568
y34.56.57.59
由所給數(shù)據(jù)分析可知,x與),之間具有線性相關(guān)關(guān)系,且y關(guān)于x的經(jīng)驗回
AAA
歸方程為L05x+a,則。=()
A.0.75B.0.85
C.0.95D.1.05
答案B
_2+4+5+6+8_3+4.5+6.5+7.5+9
解析由已知可得,x==5,y==6.1,
AA
因為經(jīng)驗回歸直線過樣本點的中心(5,6.1),所以6.1=1.05x5+。,解得4=0.85.
故選B.
4.用模型y=配機(jī)+1(〃>0)擬合一組數(shù)據(jù)時,令z=lny,將其變換后得到經(jīng)驗
回歸方程z=2x+a,?j-=()
A.e
C.5D.2
答案D
解析對y=a/”(a>0)兩邊同時取對數(shù),則析y=ln3ax+I)=lna+公+兀
b=2,b=2,b
令z=lny,5JlJz=+Ina+1,所以,I,解得所以.故選D.
a=\na+I,
5.下圖是某地區(qū)20()3年至2023年環(huán)境保護(hù)建設(shè)投資額(單位:萬元)的折線
圖.
根據(jù)該折線圖判斷,下列結(jié)論正確的是()
A.為預(yù)測該地2024年的環(huán)境保護(hù)建設(shè)投資額,應(yīng)用2003年至2023年的數(shù)
據(jù)建立回歸模型更可靠
B.為預(yù)測該地2024年的環(huán)境保護(hù)建設(shè)投資額,應(yīng)用2012年至2023年的數(shù)
據(jù)建立回歸模型更可靠
C.投資額與年份負(fù)相關(guān)
D.投資額與年份的相關(guān)系數(shù)廠<()
答案B
解析因為2011年之前與2012年之后投資額變化較大,故為預(yù)測該地2024
年的環(huán)境保護(hù)建設(shè)投資額,應(yīng)用2012年至2023年的數(shù)據(jù)建立回歸模型更可靠,
所以A錯誤,B正確;隨年份的增長,投資額總體上在增長,所以投資額與年份
正相關(guān),r>0,故C,D錯誤.故選B.
6.根據(jù)如下樣本數(shù)據(jù):
X345678
y4.02.50.50.50.40.1
AAA
得到經(jīng)驗回歸方程為),=尿+。,貝IJ()
AA
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 道路土石方外借協(xié)議書
- 委托檢測出協(xié)議書
- 媽寶男婚前協(xié)議書
- 碧桂園物業(yè)協(xié)議書
- 牙種植手術(shù)協(xié)議書
- 打工抵債務(wù)協(xié)議書
- 安置房互換協(xié)議書
- 禁止玩手機(jī)協(xié)議書
- 終止合同違約金協(xié)議書
- 收割機(jī)租賃協(xié)議書
- 商場超市公司章程
- 1與食品經(jīng)營相適應(yīng)的操作流程
- 農(nóng)險理賠培訓(xùn)
- 制藥車間5S標(biāo)準(zhǔn)化管理
- 寫字樓租賃技巧培訓(xùn)
- T-CEEAS 003-2024 養(yǎng)老合規(guī)師職業(yè)技能評價標(biāo)準(zhǔn)
- 鋼筋混凝土蓄水池設(shè)計方案
- 2025年保密知識試題庫帶答案(考試直接用)
- 伊斯蘭教完整版本
- 【MOOC】大學(xué)物理-力學(xué)、電磁學(xué)-重慶大學(xué) 中國大學(xué)慕課MOOC答案
- 擋土墻施工圖設(shè)計說明(完整版)
評論
0/150
提交評論