版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第02講成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
目錄
I-變量間的相關(guān)關(guān)系
-線性回歸
-非線性回歸
1-獨(dú)立性檢驗(yàn)
題型一:變量間的相關(guān)關(guān)系
題型二:一元線性回歸模型
題型三:非線性回歸
題型四:列聯(lián)表與獨(dú)立性檢驗(yàn)
題型五:誤差分析
第1頁共46頁
考點(diǎn)要求考題統(tǒng)計(jì)考情分析
(1)了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義.從近五年的全國卷的考查情況來看,本節(jié)是
(2)理解一元線性回歸模型和2x2列聯(lián)高考的熱點(diǎn),主要以解答題形式出現(xiàn),經(jīng)常
表,會(huì)運(yùn)用這些方法解決簡(jiǎn)單的實(shí)際問2023年上海卷第14題,4分與概率綜合出題,一般難度為中等.也可能
題.2023年天津卷第7題,5分以選擇題、填空題形式出現(xiàn),難度不大.主
(3)會(huì)利用統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析.2023年甲卷(文)第19題,12分要以應(yīng)用題的方式出現(xiàn),多與經(jīng)濟(jì)、生活實(shí)
2022年/卷第20題,12分際相聯(lián)系,需要在復(fù)雜的題目描述中找出數(shù)
量關(guān)系,建立數(shù)學(xué)模型,并且運(yùn)用數(shù)學(xué)模型
解決實(shí)際問題.
變置之間的相關(guān)關(guān)系
成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
列聯(lián)表
獨(dú)立性檢驗(yàn)
等高條形圖
H夯基?必備基礎(chǔ)知識(shí)梳理
知識(shí)點(diǎn)一、變量間的相關(guān)關(guān)系
1、變量之間的相關(guān)關(guān)系
當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫相關(guān)關(guān)系.由于
相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計(jì)發(fā)揮著非常重要的作用.我們可以通過收
集大量的數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對(duì)它們的關(guān)系作出判斷.
注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,
而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.
2、散點(diǎn)圖
第2頁共46頁
將樣本中的n個(gè)數(shù)據(jù)點(diǎn)(4力)(i=1,2,…,〃)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖.根據(jù)散點(diǎn)圖
中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.
(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將
它稱為正相關(guān),如圖(1)所示;
(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將
它稱為負(fù)相關(guān),如圖(2)所示.
⑵
3、相關(guān)系數(shù)
若相應(yīng)于變量工的取值%?,變量y的觀測(cè)值為則變量1與y的相關(guān)系數(shù)
-x)(%-y)-nxy
r=----------=?2:,通常用r來衡量X與y之間的線性關(guān)系的強(qiáng)弱,
22
?。?-x)2次(%7)2區(qū)xi-nx/Jyt-ny
Vz=li=lVi=lVi=l
r的范圍為-iWrWl.
(1)當(dāng)r>0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表示兩個(gè)變量負(fù)相關(guān).
(2)卜|越接近1,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);卜|越接近°,表示兩個(gè)變量間幾乎不存在線性相
關(guān)關(guān)系.當(dāng)團(tuán)=1時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.
(3)通常當(dāng)舊>0.75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.
知識(shí)點(diǎn)二、線性回歸
1、線性回歸
線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.
對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(xi,yi),(及,竺),…,(/,為),其回歸方程y=bx+a的求法為
Z(X,.-尤)(%-y)E\yi-nxy
b=-^—^----------二號(hào)---------
士(七―才fl:—信
Z=1Z=1
a-y-bx
—1n_in—_
其中,x=~y'xj,y=—Vy;,(x,y)稱為樣本點(diǎn)的中心.
ni=in,=1
2、殘差分析
對(duì)于預(yù)報(bào)變量y,通過觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值%,通過回歸方程得到的y稱為預(yù)測(cè)值,觀測(cè)值減
第3頁共46頁
去預(yù)測(cè)值等于殘差,2稱為相應(yīng)于點(diǎn)(4外)的殘差,即有自=%-%.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過
對(duì)殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘
差分析.
(1)殘差圖
通過殘差分析,殘差點(diǎn)(專的比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這樣
的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.
(2)通過殘差平方和。=f(y-502分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;
1=1
反之,不合適.
(3)相關(guān)指數(shù)
iA
用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:R2=l-^--------.
i=l
改越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.
知識(shí)點(diǎn)三、非線性回歸
解答非線性擬合問題,要先根據(jù)散點(diǎn)圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線
性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.
求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計(jì)算方法計(jì)算變換后的線性回歸方程系數(shù),還原
后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報(bào)預(yù)測(cè),注意計(jì)算要細(xì)心,避免計(jì)算錯(cuò)誤.
1、建立非線性回歸模型的基本步驟:
(1)確定研究對(duì)象,明確哪個(gè)是解釋變量,哪個(gè)是預(yù)報(bào)變量;
(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);
(3)由經(jīng)驗(yàn)確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、二
次函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)、募函數(shù)模型等);
(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;
(5)按照公式計(jì)算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;
(6)消去新元,得到非線性回歸方程;
(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.
知識(shí)點(diǎn)四、獨(dú)立性檢驗(yàn)
1、分類變量和列聯(lián)表
(1)分類變量:
變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.
(2)列聯(lián)表:
①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.
第4頁共46頁
②2x2列聯(lián)表.
一般地,假設(shè)有兩個(gè)分類變量X和匕它們的取值分別為{玉,Z}和{%,為},其樣本頻數(shù)列聯(lián)表(稱
為2x2列聯(lián)表)為
為總計(jì)
不aba+b
x2Cdc+d
總計(jì)Q+Cb+dn=a+b+c+d
從2x2列表中,依據(jù)二與工的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.
a+bc+d
2、等高條形圖
(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖表示列
聯(lián)表數(shù)據(jù)的頻率特征.
(2)觀察等高條形圖發(fā)現(xiàn),與上相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.
a+bc+d
3、獨(dú)立性檢驗(yàn)
2
計(jì)算隨機(jī)變量Z=------"(ad-bcf-------利用2的取值推斷分類變量x和y是否獨(dú)立的方法稱為
(a+b)(c+d)(a+c)S+d)
/獨(dú)立性檢驗(yàn).
a0.100.050.0100.0050.001
Xa2.7063.8416.6357.87910.828
【解題方法總結(jié)】
常見的非線性回歸模型
(1)指數(shù)函數(shù)型y=c優(yōu)(°>0且awl,c>0)
兩邊取自然對(duì)數(shù),lny=ln(ca*),即Iny=Inc+xlna,
令],’,原方程變?yōu)閥'=lnc+x'lna,然后按線性回歸模型求出Ina,Inc.
[x=%
(2)對(duì)數(shù)函數(shù)型y=Z?lnx+a
令R,原方程變?yōu)閥'=6x'+a,然后按線性回歸模型求出a.
[x=Inx
(3)嘉函數(shù)型y=
兩邊取常用對(duì)數(shù),lgy=lg(dx"),即Igy=〃lgx+lga,
第5頁共46頁
令11Tgy,原方程變?yōu)閥'=nx'+lga,然后按線性回歸模型求出“,Iga.
[x=Igx
(4)二次函數(shù)型)=笈2+。
令=1,原方程變?yōu)閥'=6元'+4,然后按線性回歸模型求出6,a.
\x=x
h
(5)反比例函數(shù)型y=a+2型
x
y,=y
令,i,原方程變?yōu)?/=云,+々,然后按線性回歸模型求出人,
X=—
f提升?必考題型歸納
題型一:變量間的相關(guān)關(guān)系
例L(2023?河北?高三校聯(lián)考期末)下列四幅殘差分析圖中,與一元線性回歸模型擬合精度最高的是
)
八殘差八殘差
400.40
200**.*20
A.B.
0-
7002.4-6-810121424.6810-1214觀測(cè)
-200
/-時(shí)間-20??二時(shí)間
-400--40
「殘差
T殘差
10004
5002
C.D.
0-0
2.4.6310L214觀測(cè)24.68101214
-500?\.房間-2,,?時(shí)間
-1000-4
【答案】D
【解析】用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明這樣的模型比較
合適,
帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高,顯然D選項(xiàng)的擬合精度最高.
故選:D.
例2.(2023?天津薊州?高三??奸_學(xué)考試)對(duì)兩個(gè)變量x,y進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)
4=0.8995,對(duì)兩個(gè)變量M,v進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)4=-09568,則下列判斷正確的是
()
A.變量x與〉正相關(guān),變量〃與v負(fù)相關(guān),變量x與〉的線性相關(guān)性較強(qiáng)
B.變量X與y負(fù)相關(guān),變量M與V正相關(guān),變量X與y的線性相關(guān)性較強(qiáng)
第6頁共46頁
C.變量x與y正相關(guān),變量〃與V負(fù)相關(guān),變量M與V的線性相關(guān)性較強(qiáng)
D.變量X與y負(fù)相關(guān),變量M與V正相關(guān),變量a與V的線性相關(guān)性較強(qiáng)
【答案】C
【解析】因?yàn)榫€性相關(guān)系數(shù)4=0.8995>0,所以x,y正相關(guān),
因?yàn)榫€性相關(guān)系數(shù)4=-。9568<0,所以a,v負(fù)相關(guān),
又因?yàn)橛谩赐?,所以變量a,v的線性相關(guān)性比x,>的線性相關(guān)性強(qiáng),
故A、B、D錯(cuò)誤,C正確.
故選:C.
例3.(2023?寧夏吳忠?高三鹽池高級(jí)中學(xué)??茧A段練習(xí))在如圖所示的散點(diǎn)圖中,若去掉點(diǎn)P,則下列說
法正確的是()
?.P
-------------------------------------------------------?
OX
A.樣本相關(guān)系數(shù)「變大
B.變量x與變量y的相關(guān)程度變?nèi)?/p>
C,變量X與變量y呈正相關(guān)
D.變量x與變量y的相關(guān)程度變強(qiáng)
【答案】D
【解析】由散點(diǎn)圖知,自變量x與因變量>呈負(fù)相關(guān),即廠<o(jì),故c錯(cuò)誤;
去掉點(diǎn)尸后,卜|進(jìn)一步接近1,所以「變小,故A錯(cuò)誤;
去掉點(diǎn)尸后,y與X的線性相關(guān)加強(qiáng),即相關(guān)程度變強(qiáng),故B錯(cuò)誤,D正確.
故選:D.
變式1.(2023?四川成都?高三統(tǒng)考階段練習(xí))已知建筑地基沉降預(yù)測(cè)對(duì)于保證施工安全,實(shí)現(xiàn)信息化監(jiān)控
有著重要意義.某工程師建立了四個(gè)函數(shù)模型來模擬建筑地基沉降隨時(shí)間的變化趨勢(shì),并用相關(guān)指數(shù)、誤
差平方和、均方根值三個(gè)指標(biāo)來衡量擬合效果.相關(guān)指數(shù)越接近1表明模型的擬合效果越好,誤差平方和
越小表明誤差越小,均方根值越小越好.依此判斷下面指標(biāo)對(duì)應(yīng)的模型擬合效果最好的是()
A.
相關(guān)指數(shù)誤差平方和均方根值
0.9498.4910.499
B.
第7頁共46頁
相關(guān)指數(shù)誤差平方和均方根值
0.9334.1790.436
c.
相關(guān)指數(shù)誤差平方和均方根值
0.9971.7010.141
D.
相關(guān)指數(shù)誤差平方和均方根值
0.9972.8990.326
【答案】C
【解析】相關(guān)指數(shù)越接近于1,擬合效果越好,比較相關(guān)指數(shù)知,可選c,D,
誤差平方和及均方根值都越小,擬合效果越好,觀察誤差平方和和均方根值,知C的擬合效果最好.
故選:C.
變式2.(2023?高三課時(shí)練習(xí))甲、乙、丙、丁四位同學(xué)各自對(duì),A,B兩變量的線性相關(guān)性做試驗(yàn),并用
回歸分析方法分別求得相關(guān)系數(shù)r與殘差平方和m如下表:
甲乙丙T
r0.820.780.690.85
m106115124103
則能體現(xiàn)人2兩變量有更強(qiáng)的線性相關(guān)性的是()
A.甲B.乙C.丙D.丁
【答案】D
【解析】在驗(yàn)證兩個(gè)變量之間的線性相關(guān)關(guān)系中,相關(guān)系數(shù)的絕對(duì)值越接近于1,相關(guān)性越強(qiáng),
在四個(gè)選項(xiàng)中只有丁的相關(guān)系數(shù)最大,
殘差平方和越小,相關(guān)性越強(qiáng),只有丁的殘差平方和最小,
綜上可知丁的試驗(yàn)結(jié)果體現(xiàn)A、B兩變量有更強(qiáng)的線性相關(guān)性,
故選:D.
變式3.(2023?河北石家莊?統(tǒng)考三模)觀察下列四幅殘差圖,滿足一元線性回歸模型中對(duì)隨機(jī)誤差的假定
的是()
第8頁共46頁
“殘差產(chǎn)
100-3-
50
A.oB.一3?糊惘.磔燃:徽麒輜
-50-3-,,
-100■401002003004005006007008009001000*
020406080100觀測(cè)時(shí)間觀測(cè)時(shí)間
。殘差
1500?p左200
1000\150
100
500-50
C.0-D.0
-500--50
-100
-1000--150
-200
020406080100觀測(cè)時(shí)間0102030405060708090100觀測(cè)時(shí)間
【答案】B
【解析】根據(jù)一元線性回歸模型中對(duì)隨機(jī)誤差e的假定,殘差應(yīng)是均值為0、方差為人的隨機(jī)變量的觀測(cè)
值.
對(duì)于A選項(xiàng),殘差與觀測(cè)時(shí)間有線性關(guān)系,故A錯(cuò);
對(duì)于B選項(xiàng),殘差比較均勻地分布在以取值為0的橫軸為對(duì)稱軸的水平帶狀區(qū)域內(nèi);故B正確;
對(duì)于C選項(xiàng),殘差與觀測(cè)時(shí)間有非線性關(guān)系,故C錯(cuò);
對(duì)于D選項(xiàng),殘差的方差不是一個(gè)常數(shù),隨著觀測(cè)時(shí)間變大而變大,故D錯(cuò).
故選:B.
變式4.(2023?全國?高三專題練習(xí))甲、乙、丙、丁四位同學(xué)分別對(duì)一組變量進(jìn)行線性相關(guān)試驗(yàn),并分別
計(jì)算出相關(guān)系數(shù)小則線性相關(guān)程度最高的是()
甲乙丙T
r0.870.910.580.83
A.甲B.乙C.丙D.T
【答案】B
【解析】因?yàn)橄嚓P(guān)系數(shù)上|越大,線性相關(guān)程度越強(qiáng),
所以線性相關(guān)程度最高的是乙.
故選:B
變式5.(2023?全國?高三專題練習(xí))給出下列有關(guān)線性回歸分析的四個(gè)命題:
①線性回歸直線未必過樣本數(shù)據(jù)點(diǎn)的中心(下,7);
②回歸直線就是散點(diǎn)圖中經(jīng)過樣本數(shù)據(jù)點(diǎn)最多的那條直線;
③當(dāng)相關(guān)系數(shù)廠>0時(shí),兩個(gè)變量正相關(guān);
第9頁共46頁
④如果兩個(gè)變量的相關(guān)性越強(qiáng),則相關(guān)系數(shù)「就越接近于1.
其中真命題的個(gè)數(shù)為()
A.1B.2C.3D.4
【答案】A
【解析】對(duì)于①,線性回歸直線一定過樣本數(shù)據(jù)點(diǎn)的中心叵,歹),故①錯(cuò)誤;
對(duì)于②,回歸直線在散點(diǎn)圖中可能不經(jīng)過任何一個(gè)樣本數(shù)據(jù)點(diǎn),故②錯(cuò)誤;
對(duì)于③,當(dāng)相關(guān)系數(shù)r>0時(shí),兩個(gè)變量正相關(guān),故③正確;
對(duì)于④,如果兩個(gè)變量的相關(guān)性越強(qiáng),則相關(guān)性系數(shù)廠就越接近于1或-1,故④錯(cuò)誤.
故真命題的個(gè)數(shù)為1,
故選:A.
【解題方法總結(jié)】
判定兩個(gè)變量相關(guān)性的方法
U)畫散點(diǎn)圖:點(diǎn)的分布從左下角到右上角,兩個(gè)變量正相關(guān);點(diǎn)的分布從左上角到右下角,兩個(gè)變
量負(fù)相關(guān).
(2)樣本相關(guān)系數(shù):當(dāng)廠>0時(shí),正相關(guān);當(dāng)K0時(shí),負(fù)相關(guān);卜|越接近于1,相關(guān)性越強(qiáng).
(3)經(jīng)驗(yàn)回歸方程:當(dāng)各>0時(shí),正相關(guān);當(dāng)5<0時(shí),負(fù)相關(guān).
題型二:一元線性回歸模型
例4.(2023?天津薊州?高三校考開學(xué)考試)為研究某種細(xì)菌在特定環(huán)境下,隨時(shí)間變化的繁殖情況,得到
如下實(shí)驗(yàn)數(shù)據(jù):
天數(shù)x(天)3456
繁殖個(gè)數(shù)y(千個(gè))2.5344.5
由最小二乘法得y與x的線性回歸方程為y=Q7x+a,則當(dāng)%=7時(shí),繁殖個(gè)數(shù)丁的預(yù)測(cè)值為()
A.4.9B.5.25C.5.95D.6.15
【答案】B
—1—1
【解析】由題中數(shù)據(jù)可得:x=W(3+4+5+6)=4.5,y=工(2.5+3+4+4.5)=3.5,
因?yàn)榛貧w直線必過樣本中心,
所以。=工-0.7%=3.5-0.7x4,5=0,35;
所以y=0.7x+0.35,
所以當(dāng)x=7時(shí),>=0.7x7+0.35=5.25,
故選:B
例5.(2023?湖南長沙?高三長郡中學(xué)校聯(lián)考階段練習(xí))某社區(qū)為了豐富退休人員的業(yè)余文化生活,自2018
第10頁共46頁
年以來,始終堅(jiān)持開展“悅讀小屋讀書活動(dòng)”.下表是對(duì)2018年以來近5年該社區(qū)退休人員的年人均借閱量
的數(shù)據(jù)統(tǒng)計(jì):
年份20182019202020212022
年份代碼X12345
年人均借閱量y(冊(cè))%%162228
(參考數(shù)據(jù):=9。)通過分析散點(diǎn)圖的特征后,年人均借閱量V關(guān)于年份代碼x的回歸分析模型為
Z=1
y=5x+〃z,則2023年的年人均借閱量約為()
A.31B.32C.33D.34
【答案】C
5
【解析】因?yàn)?J+2+:+4+5=3,_石"90]。,所以18=5x3+/〃,即〃7=3.
5y=——=——=18
所以回歸方程為y=5元+3,當(dāng)兀=6時(shí),y=5x6+3=33.
故選:C.
例6.(2023?遼寧?遼寧實(shí)驗(yàn)中學(xué)??寄M預(yù)測(cè))已知x,y的對(duì)應(yīng)值如下表所示:
X02468
y1m+12m+l3m+311
若y與x線性相關(guān),且回歸直線方程為y=L6%+0.6,則機(jī)=()
A.2B.3C.4D.5
【答案】B
■分TILL.—0+2+4+6+8—1+"z+1+2機(jī)+1+3機(jī)+3+11
[解析]X=-------------------=4,y=--------------------------------------=1.2m+3.4
又回歸直線方程為y=L6x+0.6,
所以1.27"+3.4=1.6X4+0.6,解得加=3.
故選:B.
變式6.(2023?廣西南寧?南寧二中校聯(lián)考模擬預(yù)測(cè))某單位在當(dāng)?shù)囟c(diǎn)幫扶某村種植一種草莓,并把這種
原本露天種植的草莓搬到了大棚里,獲得了很好的經(jīng)濟(jì)效益.根據(jù)資料顯示,產(chǎn)出的草莓的箱數(shù)x(單
位:箱)與成本y(單位:千元)的關(guān)系如下:
X102030406080
yX%%%>6
(1)根據(jù)散點(diǎn)圖可以認(rèn)為尤與y之間存在線性相關(guān)關(guān)系,請(qǐng)用最小二乘法求出線性回歸方程y=bx+a(4,
第11頁共46頁
5用分?jǐn)?shù)表示)
(2)某農(nóng)戶種植的草莓主要以300元/箱的價(jià)格給當(dāng)?shù)卮笮蜕坛┴洠嘤嗟牟葺恳?00元/箱的價(jià)格銷
售給當(dāng)?shù)匦∩特?據(jù)統(tǒng)計(jì),往年1月份當(dāng)?shù)卮笮蜕坛葺男枨罅繛?0箱、100箱、150箱、200箱的概
率分別為二,J,;,根據(jù)回歸方程以及往年商超草莓的需求情況進(jìn)行預(yù)測(cè),求今年1月份農(nóng)戶草莓
105z5
的種植量為200箱時(shí)所獲得的利潤情況.(最后結(jié)果精確到個(gè)位)
66£(%-可(其-刃
附:y)=790,E%=54,在線性回歸直線方程9=&+&中上―-----------
i=l
d=y-bx.
10+20+30+40+60+80-54
【解析】(1)因?yàn)樵?=40,y=—=Q9,
6o
所以士(七—元『二900+4°°+10°+°+400+160°=3400,
i=l
由題意可知£山一x)(y,.-y)=790,
i=l
£(%-?。ǎ?9)
790_79
所以3=―-----------------
f(%-元)23400~340
i=l
795
又因?yàn)椋?9-------x40=——
34017
所以回歸方程為£=急791-5
79“八5785/十一、
(2)由回歸方程知,若農(nóng)戶草莓的種植量為200箱,則成本為9=備乂200-----=-----(千兀).
1717
設(shè)農(nóng)戶草莓的種植量為200箱時(shí)的收入為y元,200箱草莓供給大型商超和小商販分別光箱和y,顯然
x+y=200,
由題意y=300x+200y,因此羽,以及丫的可能取值如下表:
X50100150200
y150100500
Y=300x+200y45000500005500060000
所以丫的分布列為:
Y45000500005500060000
第12頁共46頁
1111
P————
10525
所以磯卜)=乂]
45000+50000x-+55000x-+60000x-=54000,
525
7X5
所以預(yù)測(cè)所獲利潤約為54000-石-'100°。7824元.
變式7.(2023?江西?高三統(tǒng)考開學(xué)考試)某新能源汽車銷售部對(duì)今年1月至7月的銷售量進(jìn)行統(tǒng)計(jì)與分
析,因不慎丟失一些數(shù)據(jù),現(xiàn)整理出如下統(tǒng)計(jì)表與一些分析數(shù)據(jù):
月份1月2月3月4月5月6月7月
月份代號(hào)X1234567
銷售量y(單位:萬輛)15.6mnS37.739.644.5
其中9=312.
(1)若加,n,$成遞增的等差數(shù)列,求從7個(gè)月的銷售量中任取1個(gè),月銷售量不高于27萬輛的概率;
⑵若=670.48,x與y的樣本相關(guān)系數(shù)廠=。99,求y關(guān)于x的線性回歸方程9=幾+。,并預(yù)測(cè)
1=1
今年8月份的銷售量工精確到0.1).
附:相關(guān)系數(shù),線性回歸方程?=取+3中斜率和截距的最小二乘估計(jì)公式分別
為一:a=y-bx.
白尤廠X)2
/=1
參考數(shù)據(jù):6a2.65,V670.48?25.89.
15.6+根+〃+s+37.7+39.6+44.5...
【解析】(1)因?yàn)榇?31.2.所以--------------------------------------------=31.2,
7
所以〃7+a+s=81,
又加,n,s成遞增的等差數(shù)列,所以加+s=2〃旦根<〃<s,
所以"=27,且m<27<s,
所以月銷售量不高于27萬輛的有15.6,加,〃共3個(gè),又基本事件總數(shù)為7,
故所求概率為:3
一17
(2)由表中數(shù)據(jù)可知,x=-^xt=4,28
/i=l
第13頁共46頁
所以gb4.88r=4.88x0.99。4.8,
由元=4,V=31.2,得&=9一成元=31.2-4.8x4=12.0,
故》關(guān)于x的線性回歸方程為£=4.8元+12.0.
當(dāng)x=8時(shí),£=4.8x8+12=50.4,
所以預(yù)測(cè)今年8月份的銷售量大約為50.4萬輛.
變式8.(2023?四川成都?高三石室中學(xué)??奸_學(xué)考試)己知某綠豆新品種發(fā)芽的適宜溫度在6℃~22c之
間,一農(nóng)學(xué)實(shí)驗(yàn)室研究人員為研究溫度x(℃)與綠豆新品種發(fā)芽數(shù)y(顆)之間的關(guān)系,每組選取了成
熟種子50顆,分別在對(duì)應(yīng)的8℃~14℃的溫度環(huán)境下進(jìn)行實(shí)驗(yàn),得到如下散點(diǎn)圖:
35■
V___1___X___I____I____I____I____I____I
JIIIIIIII
o'—::-!――i—!—!~!―>
789101112131415x
_7__7_
其中y=24,X(W-x)(y-y)=70,^(x-y)2=176.
i=li=l
(1)運(yùn)用相關(guān)系數(shù)進(jìn)行分析說明,是否可以用線性回歸模型擬合y與x的關(guān)系?
⑵求出y關(guān)于x的線性回歸方程與=鼠+機(jī)并預(yù)測(cè)在19。。的溫度下,種子的發(fā)芽的顆數(shù).
?__n__
X(%-X)(%-y)Z(%-x)(%-y)
參考公式:相關(guān)系數(shù)r=下「_”U,回歸直線方程¥=鼠+)其中b=上,——=——
JS(七一元)5(%一y)2£(七-
Vz=lz=li=l
6=亍-版.參考數(shù)據(jù):V77?8.77.
【解析】(1)根據(jù)題意,=1(8+9+10+11+12+13+14)=11.
^(x,.-x)2=(8-11)2+(9-11)2+(10-11)2+(11-11)2+(12-11)2+(13-11)2+(14-11)2=28,
Z=1
工(%-可力(%一刃2
=128x176=8"B70.16.
1=11=1
第14頁共46頁
7
£(%-可(%-刃70
08
因而相關(guān)系數(shù)r=「7=布/""
忙(一)》(—吊-
Vi=lZ=1
由于卜上0.998很接近1,.?.可以用線性回歸方程模型擬合y與x的關(guān)系.
7
2(七一下肌-刃
5
⑵6=『----------=-
訃T2
Z=1
57
3=24----x11=—,
22
57
.??y關(guān)于x的回歸方程為9=
57
若X=19,則夕=彳翅9-彳=44顆.
...在19℃的溫度下,預(yù)測(cè)種子的發(fā)芽顆數(shù)為44.
變式9.(2023?安徽亳州?蒙城第一中學(xué)校聯(lián)考模擬預(yù)測(cè))為調(diào)查某地區(qū)植被覆蓋面積x(單位:公頃)和
野生動(dòng)物數(shù)量y的關(guān)系,某研究小組將該地區(qū)等面積花分為400個(gè)區(qū)塊,從中隨機(jī)抽取40個(gè)區(qū)塊,得到樣
本數(shù)據(jù)(4%)。=12,40),部分?jǐn)?shù)據(jù)如下:
X2.73.63.23.9
y50.663.752.154.3
40404040
經(jīng)計(jì)算得:+>,=160,£%=2400,E(x,-可一=160,-元)(y-y)=1280.
1=1Z=1Z=1Z=1
(1)利用最小二乘估計(jì)建立y關(guān)于x的線性回歸方程;
(2)該小組又利用這組數(shù)據(jù)建立了無關(guān)于y的線性回歸方程,并把這兩條擬合直線畫在同一坐標(biāo)系xOy下,
橫坐標(biāo)x,縱坐標(biāo)y的意義與植被覆蓋面積x和野生動(dòng)物數(shù)量〉一致.設(shè)前者與后者的斜率分別為k2,
比較左,我的大小關(guān)系,并證明.
^x^i-nx-y
附:y關(guān)于x的回歸方程y=a+bx中,斜率和截距的最小二乘估計(jì)公式分別為:b=^----—
£x:一〃x-
1=1
信5]島2打
【解析】⑴片果=4,-2400071280o
y=-77T=6。,^=---=8,Q=60—32=28,
40160
第15頁共46頁
故回歸方程為y=8x+28;
(2)x關(guān)于y的線性回歸方程為x=的+"y,4=乂工----------
又卜⑷,卜,
h>Q,故即k14k2,
下證:k#k小
若匕=心,則|廠|=1,即y=8%+281=1,2,,40)恒成立,
代入表格中的一組數(shù)據(jù)得:50.6^8x2.7+28,矛盾,
故匕<£.
綜上,y關(guān)于龍的回歸方程為y=8x+28.
【解題方法總結(jié)】
求經(jīng)驗(yàn)回歸方程的步驟
I-----------------------------------------------------------1
(步驟一甘甘算出得了,的,>必或士(x,-x)(y,-y),1
12(%-初2的值
VL-----------------------------------;
(步驟二H利用公式計(jì)算系數(shù)工務(wù)]
0二二二二二二二二二___
(步驟三H寫出經(jīng)驗(yàn)回歸方程$=5x+AJ
題型三:非線性回歸
例7.(2023?湖南?校聯(lián)考模擬預(yù)測(cè))若需要刻畫預(yù)報(bào)變量w和解釋變量x的相關(guān)關(guān)系,且從已知數(shù)據(jù)中知
道預(yù)報(bào)變量卬隨著解釋變量x的增大而減小,并且隨著解釋變量x的增大,預(yù)報(bào)變量w大致趨于一個(gè)確定
的值,為擬合卬和x之間的關(guān)系,應(yīng)使用以下回歸方程中的(b>0,e為自然對(duì)數(shù)的底數(shù))()
A.w-bx+aB.w=-blnx+aC.w=-b^[x+aD.w-be~x+a
【答案】D
【解析】對(duì)于A:因?yàn)閥=x在定義域內(nèi)單調(diào)遞增且方>0,所以W隨著X的增大而增大,不合題意,故A
錯(cuò)誤;
對(duì)于B:因?yàn)閥=lnx在定義域內(nèi)單調(diào)遞增且6>0,所以w隨著x的增大而減小,當(dāng)解釋變量x-+8,
第16頁共46頁
W-—co,不合題意,故B錯(cuò)誤;
對(duì)于C:因?yàn)閥=?在定義域內(nèi)單調(diào)遞增且6>0,所以W隨著X的增大而減小,當(dāng)解釋變量Xf+8,
wf-co,不合題意,故C錯(cuò)誤;
對(duì)于D:因?yàn)閥=er=d『在定義域內(nèi)單調(diào)遞減且6>0,所以w隨著x的增大而減小,當(dāng)解釋變量
e
x->+8,w->a,故D錯(cuò)誤;
故選:D.
例8.(2023?全國?高三專題練習(xí))云計(jì)算是信息技術(shù)發(fā)展的集中體現(xiàn),近年來,我國云計(jì)算市場(chǎng)規(guī)模持續(xù)
增長.已知某科技公司2018年至2022年云計(jì)算市場(chǎng)規(guī)模數(shù)據(jù),且市場(chǎng)規(guī)模y與年份代碼尤的關(guān)系可以用模
型>=。聲/(其中e為自然對(duì)數(shù)的底數(shù))擬合,設(shè)z=lny,得到數(shù)據(jù)統(tǒng)計(jì)表如下:
年份2018年2019年2020年2021年2022年
年份代碼尤12345
云計(jì)算市場(chǎng)規(guī)模y/千萬元7.4112036.666.7
z=Iny22.433.64
由上表可得經(jīng)驗(yàn)回歸方程z=Q52x+a,則2025年該科技公司云計(jì)算市場(chǎng)規(guī)模y的估計(jì)值為()
A.e508B.e5-6C.e612D.e65
【答案】B
【解析】因?yàn)閤=3,z=3,
所以a=1-0.521=3-3x0.52=1.44,
即經(jīng)驗(yàn)回歸方程z=0.52x+1.44,
當(dāng)x=8時(shí),z=0.52x8+1.44=5.6,
所以y=ez=e&6,
即2025年該科技公司云計(jì)算市場(chǎng)規(guī)模y的估計(jì)值為e56,
故選:B
例9.(多選題)(2023?福建廈門?廈門一中??既#┰趯?duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行回歸分析時(shí),若兩
個(gè)變量不呈線性相關(guān)關(guān)系,可以建立含兩個(gè)待定參數(shù)的非線性模型,并引入中間變量將其轉(zhuǎn)化為線性關(guān)
系,再利用最小二乘法進(jìn)行線性回歸分析.下列選項(xiàng)為四個(gè)同學(xué)根據(jù)自己所得數(shù)據(jù)的散點(diǎn)圖建立的非線性模
型,且散點(diǎn)圖的樣本點(diǎn)均位于第一象限,則其中可以根據(jù)上述方法進(jìn)行回歸分析的模型有()
2x+G
A.y=cxx"+c2xB.y=t+c
C.y=q+ln(x+C2)D.^qex+C2
【答案】ABC
第17頁共46頁
2
[解析】對(duì)于選項(xiàng)A:y=c1x+c2x=>—=cxx+c2,令〃=上則〃=q%+%;
XX
對(duì)于選項(xiàng)B:
%+qrG一Q1%+g1a
y二=1+£LZSy-l=———-n-----------二------x+——
x+c2x+c2X+。2y-]01_C?C]_G%—Q
4-M=^-=>?=——X+—
y—1。]—c*2G—Q
-C1
對(duì)于選項(xiàng)C:y=c1+ln(x+c2)^>y-q=ln(x+c2)^>^=x+c2
Cl
即e,=e-(x+c2)令〃貝|〃=于<x+Cz)=1?x+Q,/;
x+C2
對(duì)于選項(xiàng)D:y=cxenIny=Inq+X+G令〃=lny貝Ij〃=x+lnq+。2
此時(shí)斜率為1,與最小二乘法不符.
故選:ABC
變式10.(2023?全國?高三專題練習(xí))已知變量的關(guān)系可以用模型y=Ze儂擬合,設(shè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆山東省日照市五蓮縣物理高一上期末學(xué)業(yè)水平測(cè)試試題含解析
- 2025屆四川省資陽市高中高三物理第一學(xué)期期中質(zhì)量檢測(cè)模擬試題含解析
- 云南省綠春縣一中2025屆物理高二上期末綜合測(cè)試模擬試題含解析
- 江西省上饒市民校聯(lián)盟2025屆物理高二第一學(xué)期期中質(zhì)量檢測(cè)試題含解析
- 2025屆黑龍江省友誼縣紅興隆管理局第一高級(jí)中學(xué)物理高一第一學(xué)期期中考試模擬試題含解析
- 內(nèi)蒙古包頭市北方重工業(yè)集團(tuán)有限公司第三中學(xué)2025屆高三上物理期中學(xué)業(yè)水平測(cè)試模擬試題含解析
- 2025屆江蘇省徐州市睢寧縣高級(jí)中學(xué)物理高一上期末監(jiān)測(cè)試題含解析
- 2025屆福建省長汀、連城、武平、永定、漳平、上杭六地一中聯(lián)考物理高一上期中聯(lián)考模擬試題含解析
- 2025屆江蘇省南通市啟東中學(xué)物理高三第一學(xué)期期末檢測(cè)模擬試題含解析
- 2025屆江西省南昌市安義中學(xué)物理高三第一學(xué)期期中復(fù)習(xí)檢測(cè)模擬試題含解析
- 西南油氣田分公司招聘筆試題庫2024
- 2024-2030年電鍍行業(yè)市場(chǎng)發(fā)展分析及發(fā)展趨勢(shì)與投資前景研究報(bào)告
- 小學(xué)生主題班會(huì)開學(xué)第一課學(xué)習(xí)奧運(yùn)精神 爭(zhēng)做強(qiáng)國少年 課件
- 上海市豐鎮(zhèn)中學(xué)2024-2025學(xué)年九年級(jí)上學(xué)期分層練習(xí)數(shù)學(xué)試題(無答案)
- 文件評(píng)審表(標(biāo)準(zhǔn)樣本)
- 醫(yī)療輔助服務(wù)行業(yè)發(fā)展前景與機(jī)遇展望報(bào)告
- 1 小熊購物 (教學(xué)設(shè)計(jì))-2024-2025學(xué)年數(shù)學(xué)三年級(jí)上冊(cè)北師大版
- (2024年)新人教版部編一年級(jí)道德與法治教材解讀5
- 跨學(xué)科主題學(xué)習(xí)-美化校園(課件) 2024-2025學(xué)年七年級(jí)地理(人教版2024)
- 2024年醫(yī)師定期考核必刷題庫附含參考答案
- 經(jīng)外周靜脈穿刺中心靜脈置管(PICC)操作技術(shù)專家共識(shí)解讀
評(píng)論
0/150
提交評(píng)論