成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)-2024年高考數(shù)學(xué)復(fù)習(xí)(新教材新高考)(解析版)_第1頁
成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)-2024年高考數(shù)學(xué)復(fù)習(xí)(新教材新高考)(解析版)_第2頁
成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)-2024年高考數(shù)學(xué)復(fù)習(xí)(新教材新高考)(解析版)_第3頁
成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)-2024年高考數(shù)學(xué)復(fù)習(xí)(新教材新高考)(解析版)_第4頁
成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)-2024年高考數(shù)學(xué)復(fù)習(xí)(新教材新高考)(解析版)_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第02講成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析

目錄

I-變量間的相關(guān)關(guān)系

-線性回歸

-非線性回歸

1-獨(dú)立性檢驗(yàn)

題型一:變量間的相關(guān)關(guān)系

題型二:一元線性回歸模型

題型三:非線性回歸

題型四:列聯(lián)表與獨(dú)立性檢驗(yàn)

題型五:誤差分析

第1頁共46頁

考點(diǎn)要求考題統(tǒng)計(jì)考情分析

(1)了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義.從近五年的全國卷的考查情況來看,本節(jié)是

(2)理解一元線性回歸模型和2x2列聯(lián)高考的熱點(diǎn),主要以解答題形式出現(xiàn),經(jīng)常

表,會(huì)運(yùn)用這些方法解決簡(jiǎn)單的實(shí)際問2023年上海卷第14題,4分與概率綜合出題,一般難度為中等.也可能

題.2023年天津卷第7題,5分以選擇題、填空題形式出現(xiàn),難度不大.主

(3)會(huì)利用統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析.2023年甲卷(文)第19題,12分要以應(yīng)用題的方式出現(xiàn),多與經(jīng)濟(jì)、生活實(shí)

2022年/卷第20題,12分際相聯(lián)系,需要在復(fù)雜的題目描述中找出數(shù)

量關(guān)系,建立數(shù)學(xué)模型,并且運(yùn)用數(shù)學(xué)模型

解決實(shí)際問題.

變置之間的相關(guān)關(guān)系

成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析

列聯(lián)表

獨(dú)立性檢驗(yàn)

等高條形圖

H夯基?必備基礎(chǔ)知識(shí)梳理

知識(shí)點(diǎn)一、變量間的相關(guān)關(guān)系

1、變量之間的相關(guān)關(guān)系

當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫相關(guān)關(guān)系.由于

相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計(jì)發(fā)揮著非常重要的作用.我們可以通過收

集大量的數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對(duì)它們的關(guān)系作出判斷.

注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,

而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.

2、散點(diǎn)圖

第2頁共46頁

將樣本中的n個(gè)數(shù)據(jù)點(diǎn)(4力)(i=1,2,…,〃)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖.根據(jù)散點(diǎn)圖

中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.

(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將

它稱為正相關(guān),如圖(1)所示;

(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將

它稱為負(fù)相關(guān),如圖(2)所示.

3、相關(guān)系數(shù)

若相應(yīng)于變量工的取值%?,變量y的觀測(cè)值為則變量1與y的相關(guān)系數(shù)

-x)(%-y)-nxy

r=----------=?2:,通常用r來衡量X與y之間的線性關(guān)系的強(qiáng)弱,

22

?。?-x)2次(%7)2區(qū)xi-nx/Jyt-ny

Vz=li=lVi=lVi=l

r的范圍為-iWrWl.

(1)當(dāng)r>0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表示兩個(gè)變量負(fù)相關(guān).

(2)卜|越接近1,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);卜|越接近°,表示兩個(gè)變量間幾乎不存在線性相

關(guān)關(guān)系.當(dāng)團(tuán)=1時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.

(3)通常當(dāng)舊>0.75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.

知識(shí)點(diǎn)二、線性回歸

1、線性回歸

線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.

對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(xi,yi),(及,竺),…,(/,為),其回歸方程y=bx+a的求法為

Z(X,.-尤)(%-y)E\yi-nxy

b=-^—^----------二號(hào)---------

士(七―才fl:—信

Z=1Z=1

a-y-bx

—1n_in—_

其中,x=~y'xj,y=—Vy;,(x,y)稱為樣本點(diǎn)的中心.

ni=in,=1

2、殘差分析

對(duì)于預(yù)報(bào)變量y,通過觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值%,通過回歸方程得到的y稱為預(yù)測(cè)值,觀測(cè)值減

第3頁共46頁

去預(yù)測(cè)值等于殘差,2稱為相應(yīng)于點(diǎn)(4外)的殘差,即有自=%-%.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過

對(duì)殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘

差分析.

(1)殘差圖

通過殘差分析,殘差點(diǎn)(專的比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這樣

的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.

(2)通過殘差平方和。=f(y-502分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;

1=1

反之,不合適.

(3)相關(guān)指數(shù)

iA

用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:R2=l-^--------.

i=l

改越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.

知識(shí)點(diǎn)三、非線性回歸

解答非線性擬合問題,要先根據(jù)散點(diǎn)圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線

性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.

求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計(jì)算方法計(jì)算變換后的線性回歸方程系數(shù),還原

后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報(bào)預(yù)測(cè),注意計(jì)算要細(xì)心,避免計(jì)算錯(cuò)誤.

1、建立非線性回歸模型的基本步驟:

(1)確定研究對(duì)象,明確哪個(gè)是解釋變量,哪個(gè)是預(yù)報(bào)變量;

(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);

(3)由經(jīng)驗(yàn)確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、二

次函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)、募函數(shù)模型等);

(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;

(5)按照公式計(jì)算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;

(6)消去新元,得到非線性回歸方程;

(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.

知識(shí)點(diǎn)四、獨(dú)立性檢驗(yàn)

1、分類變量和列聯(lián)表

(1)分類變量:

變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.

(2)列聯(lián)表:

①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.

第4頁共46頁

②2x2列聯(lián)表.

一般地,假設(shè)有兩個(gè)分類變量X和匕它們的取值分別為{玉,Z}和{%,為},其樣本頻數(shù)列聯(lián)表(稱

為2x2列聯(lián)表)為

為總計(jì)

不aba+b

x2Cdc+d

總計(jì)Q+Cb+dn=a+b+c+d

從2x2列表中,依據(jù)二與工的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.

a+bc+d

2、等高條形圖

(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖表示列

聯(lián)表數(shù)據(jù)的頻率特征.

(2)觀察等高條形圖發(fā)現(xiàn),與上相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.

a+bc+d

3、獨(dú)立性檢驗(yàn)

2

計(jì)算隨機(jī)變量Z=------"(ad-bcf-------利用2的取值推斷分類變量x和y是否獨(dú)立的方法稱為

(a+b)(c+d)(a+c)S+d)

/獨(dú)立性檢驗(yàn).

a0.100.050.0100.0050.001

Xa2.7063.8416.6357.87910.828

【解題方法總結(jié)】

常見的非線性回歸模型

(1)指數(shù)函數(shù)型y=c優(yōu)(°>0且awl,c>0)

兩邊取自然對(duì)數(shù),lny=ln(ca*),即Iny=Inc+xlna,

令],’,原方程變?yōu)閥'=lnc+x'lna,然后按線性回歸模型求出Ina,Inc.

[x=%

(2)對(duì)數(shù)函數(shù)型y=Z?lnx+a

令R,原方程變?yōu)閥'=6x'+a,然后按線性回歸模型求出a.

[x=Inx

(3)嘉函數(shù)型y=

兩邊取常用對(duì)數(shù),lgy=lg(dx"),即Igy=〃lgx+lga,

第5頁共46頁

令11Tgy,原方程變?yōu)閥'=nx'+lga,然后按線性回歸模型求出“,Iga.

[x=Igx

(4)二次函數(shù)型)=笈2+。

令=1,原方程變?yōu)閥'=6元'+4,然后按線性回歸模型求出6,a.

\x=x

h

(5)反比例函數(shù)型y=a+2型

x

y,=y

令,i,原方程變?yōu)?/=云,+々,然后按線性回歸模型求出人,

X=—

f提升?必考題型歸納

題型一:變量間的相關(guān)關(guān)系

例L(2023?河北?高三校聯(lián)考期末)下列四幅殘差分析圖中,與一元線性回歸模型擬合精度最高的是

)

八殘差八殘差

400.40

200**.*20

A.B.

0-

7002.4-6-810121424.6810-1214觀測(cè)

-200

/-時(shí)間-20??二時(shí)間

-400--40

「殘差

T殘差

10004

5002

C.D.

0-0

2.4.6310L214觀測(cè)24.68101214

-500?\.房間-2,,?時(shí)間

-1000-4

【答案】D

【解析】用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明這樣的模型比較

合適,

帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高,顯然D選項(xiàng)的擬合精度最高.

故選:D.

例2.(2023?天津薊州?高三??奸_學(xué)考試)對(duì)兩個(gè)變量x,y進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)

4=0.8995,對(duì)兩個(gè)變量M,v進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)4=-09568,則下列判斷正確的是

()

A.變量x與〉正相關(guān),變量〃與v負(fù)相關(guān),變量x與〉的線性相關(guān)性較強(qiáng)

B.變量X與y負(fù)相關(guān),變量M與V正相關(guān),變量X與y的線性相關(guān)性較強(qiáng)

第6頁共46頁

C.變量x與y正相關(guān),變量〃與V負(fù)相關(guān),變量M與V的線性相關(guān)性較強(qiáng)

D.變量X與y負(fù)相關(guān),變量M與V正相關(guān),變量a與V的線性相關(guān)性較強(qiáng)

【答案】C

【解析】因?yàn)榫€性相關(guān)系數(shù)4=0.8995>0,所以x,y正相關(guān),

因?yàn)榫€性相關(guān)系數(shù)4=-。9568<0,所以a,v負(fù)相關(guān),

又因?yàn)橛谩赐?,所以變量a,v的線性相關(guān)性比x,>的線性相關(guān)性強(qiáng),

故A、B、D錯(cuò)誤,C正確.

故選:C.

例3.(2023?寧夏吳忠?高三鹽池高級(jí)中學(xué)??茧A段練習(xí))在如圖所示的散點(diǎn)圖中,若去掉點(diǎn)P,則下列說

法正確的是()

?.P

-------------------------------------------------------?

OX

A.樣本相關(guān)系數(shù)「變大

B.變量x與變量y的相關(guān)程度變?nèi)?/p>

C,變量X與變量y呈正相關(guān)

D.變量x與變量y的相關(guān)程度變強(qiáng)

【答案】D

【解析】由散點(diǎn)圖知,自變量x與因變量>呈負(fù)相關(guān),即廠<o(jì),故c錯(cuò)誤;

去掉點(diǎn)尸后,卜|進(jìn)一步接近1,所以「變小,故A錯(cuò)誤;

去掉點(diǎn)尸后,y與X的線性相關(guān)加強(qiáng),即相關(guān)程度變強(qiáng),故B錯(cuò)誤,D正確.

故選:D.

變式1.(2023?四川成都?高三統(tǒng)考階段練習(xí))已知建筑地基沉降預(yù)測(cè)對(duì)于保證施工安全,實(shí)現(xiàn)信息化監(jiān)控

有著重要意義.某工程師建立了四個(gè)函數(shù)模型來模擬建筑地基沉降隨時(shí)間的變化趨勢(shì),并用相關(guān)指數(shù)、誤

差平方和、均方根值三個(gè)指標(biāo)來衡量擬合效果.相關(guān)指數(shù)越接近1表明模型的擬合效果越好,誤差平方和

越小表明誤差越小,均方根值越小越好.依此判斷下面指標(biāo)對(duì)應(yīng)的模型擬合效果最好的是()

A.

相關(guān)指數(shù)誤差平方和均方根值

0.9498.4910.499

B.

第7頁共46頁

相關(guān)指數(shù)誤差平方和均方根值

0.9334.1790.436

c.

相關(guān)指數(shù)誤差平方和均方根值

0.9971.7010.141

D.

相關(guān)指數(shù)誤差平方和均方根值

0.9972.8990.326

【答案】C

【解析】相關(guān)指數(shù)越接近于1,擬合效果越好,比較相關(guān)指數(shù)知,可選c,D,

誤差平方和及均方根值都越小,擬合效果越好,觀察誤差平方和和均方根值,知C的擬合效果最好.

故選:C.

變式2.(2023?高三課時(shí)練習(xí))甲、乙、丙、丁四位同學(xué)各自對(duì),A,B兩變量的線性相關(guān)性做試驗(yàn),并用

回歸分析方法分別求得相關(guān)系數(shù)r與殘差平方和m如下表:

甲乙丙T

r0.820.780.690.85

m106115124103

則能體現(xiàn)人2兩變量有更強(qiáng)的線性相關(guān)性的是()

A.甲B.乙C.丙D.丁

【答案】D

【解析】在驗(yàn)證兩個(gè)變量之間的線性相關(guān)關(guān)系中,相關(guān)系數(shù)的絕對(duì)值越接近于1,相關(guān)性越強(qiáng),

在四個(gè)選項(xiàng)中只有丁的相關(guān)系數(shù)最大,

殘差平方和越小,相關(guān)性越強(qiáng),只有丁的殘差平方和最小,

綜上可知丁的試驗(yàn)結(jié)果體現(xiàn)A、B兩變量有更強(qiáng)的線性相關(guān)性,

故選:D.

變式3.(2023?河北石家莊?統(tǒng)考三模)觀察下列四幅殘差圖,滿足一元線性回歸模型中對(duì)隨機(jī)誤差的假定

的是()

第8頁共46頁

“殘差產(chǎn)

100-3-

50

A.oB.一3?糊惘.磔燃:徽麒輜

-50-3-,,

-100■401002003004005006007008009001000*

020406080100觀測(cè)時(shí)間觀測(cè)時(shí)間

。殘差

1500?p左200

1000\150

100

500-50

C.0-D.0

-500--50

-100

-1000--150

-200

020406080100觀測(cè)時(shí)間0102030405060708090100觀測(cè)時(shí)間

【答案】B

【解析】根據(jù)一元線性回歸模型中對(duì)隨機(jī)誤差e的假定,殘差應(yīng)是均值為0、方差為人的隨機(jī)變量的觀測(cè)

值.

對(duì)于A選項(xiàng),殘差與觀測(cè)時(shí)間有線性關(guān)系,故A錯(cuò);

對(duì)于B選項(xiàng),殘差比較均勻地分布在以取值為0的橫軸為對(duì)稱軸的水平帶狀區(qū)域內(nèi);故B正確;

對(duì)于C選項(xiàng),殘差與觀測(cè)時(shí)間有非線性關(guān)系,故C錯(cuò);

對(duì)于D選項(xiàng),殘差的方差不是一個(gè)常數(shù),隨著觀測(cè)時(shí)間變大而變大,故D錯(cuò).

故選:B.

變式4.(2023?全國?高三專題練習(xí))甲、乙、丙、丁四位同學(xué)分別對(duì)一組變量進(jìn)行線性相關(guān)試驗(yàn),并分別

計(jì)算出相關(guān)系數(shù)小則線性相關(guān)程度最高的是()

甲乙丙T

r0.870.910.580.83

A.甲B.乙C.丙D.T

【答案】B

【解析】因?yàn)橄嚓P(guān)系數(shù)上|越大,線性相關(guān)程度越強(qiáng),

所以線性相關(guān)程度最高的是乙.

故選:B

變式5.(2023?全國?高三專題練習(xí))給出下列有關(guān)線性回歸分析的四個(gè)命題:

①線性回歸直線未必過樣本數(shù)據(jù)點(diǎn)的中心(下,7);

②回歸直線就是散點(diǎn)圖中經(jīng)過樣本數(shù)據(jù)點(diǎn)最多的那條直線;

③當(dāng)相關(guān)系數(shù)廠>0時(shí),兩個(gè)變量正相關(guān);

第9頁共46頁

④如果兩個(gè)變量的相關(guān)性越強(qiáng),則相關(guān)系數(shù)「就越接近于1.

其中真命題的個(gè)數(shù)為()

A.1B.2C.3D.4

【答案】A

【解析】對(duì)于①,線性回歸直線一定過樣本數(shù)據(jù)點(diǎn)的中心叵,歹),故①錯(cuò)誤;

對(duì)于②,回歸直線在散點(diǎn)圖中可能不經(jīng)過任何一個(gè)樣本數(shù)據(jù)點(diǎn),故②錯(cuò)誤;

對(duì)于③,當(dāng)相關(guān)系數(shù)r>0時(shí),兩個(gè)變量正相關(guān),故③正確;

對(duì)于④,如果兩個(gè)變量的相關(guān)性越強(qiáng),則相關(guān)性系數(shù)廠就越接近于1或-1,故④錯(cuò)誤.

故真命題的個(gè)數(shù)為1,

故選:A.

【解題方法總結(jié)】

判定兩個(gè)變量相關(guān)性的方法

U)畫散點(diǎn)圖:點(diǎn)的分布從左下角到右上角,兩個(gè)變量正相關(guān);點(diǎn)的分布從左上角到右下角,兩個(gè)變

量負(fù)相關(guān).

(2)樣本相關(guān)系數(shù):當(dāng)廠>0時(shí),正相關(guān);當(dāng)K0時(shí),負(fù)相關(guān);卜|越接近于1,相關(guān)性越強(qiáng).

(3)經(jīng)驗(yàn)回歸方程:當(dāng)各>0時(shí),正相關(guān);當(dāng)5<0時(shí),負(fù)相關(guān).

題型二:一元線性回歸模型

例4.(2023?天津薊州?高三校考開學(xué)考試)為研究某種細(xì)菌在特定環(huán)境下,隨時(shí)間變化的繁殖情況,得到

如下實(shí)驗(yàn)數(shù)據(jù):

天數(shù)x(天)3456

繁殖個(gè)數(shù)y(千個(gè))2.5344.5

由最小二乘法得y與x的線性回歸方程為y=Q7x+a,則當(dāng)%=7時(shí),繁殖個(gè)數(shù)丁的預(yù)測(cè)值為()

A.4.9B.5.25C.5.95D.6.15

【答案】B

—1—1

【解析】由題中數(shù)據(jù)可得:x=W(3+4+5+6)=4.5,y=工(2.5+3+4+4.5)=3.5,

因?yàn)榛貧w直線必過樣本中心,

所以。=工-0.7%=3.5-0.7x4,5=0,35;

所以y=0.7x+0.35,

所以當(dāng)x=7時(shí),>=0.7x7+0.35=5.25,

故選:B

例5.(2023?湖南長沙?高三長郡中學(xué)校聯(lián)考階段練習(xí))某社區(qū)為了豐富退休人員的業(yè)余文化生活,自2018

第10頁共46頁

年以來,始終堅(jiān)持開展“悅讀小屋讀書活動(dòng)”.下表是對(duì)2018年以來近5年該社區(qū)退休人員的年人均借閱量

的數(shù)據(jù)統(tǒng)計(jì):

年份20182019202020212022

年份代碼X12345

年人均借閱量y(冊(cè))%%162228

(參考數(shù)據(jù):=9。)通過分析散點(diǎn)圖的特征后,年人均借閱量V關(guān)于年份代碼x的回歸分析模型為

Z=1

y=5x+〃z,則2023年的年人均借閱量約為()

A.31B.32C.33D.34

【答案】C

5

【解析】因?yàn)?J+2+:+4+5=3,_石"90]。,所以18=5x3+/〃,即〃7=3.

5y=——=——=18

所以回歸方程為y=5元+3,當(dāng)兀=6時(shí),y=5x6+3=33.

故選:C.

例6.(2023?遼寧?遼寧實(shí)驗(yàn)中學(xué)??寄M預(yù)測(cè))已知x,y的對(duì)應(yīng)值如下表所示:

X02468

y1m+12m+l3m+311

若y與x線性相關(guān),且回歸直線方程為y=L6%+0.6,則機(jī)=()

A.2B.3C.4D.5

【答案】B

■分TILL.—0+2+4+6+8—1+"z+1+2機(jī)+1+3機(jī)+3+11

[解析]X=-------------------=4,y=--------------------------------------=1.2m+3.4

又回歸直線方程為y=L6x+0.6,

所以1.27"+3.4=1.6X4+0.6,解得加=3.

故選:B.

變式6.(2023?廣西南寧?南寧二中校聯(lián)考模擬預(yù)測(cè))某單位在當(dāng)?shù)囟c(diǎn)幫扶某村種植一種草莓,并把這種

原本露天種植的草莓搬到了大棚里,獲得了很好的經(jīng)濟(jì)效益.根據(jù)資料顯示,產(chǎn)出的草莓的箱數(shù)x(單

位:箱)與成本y(單位:千元)的關(guān)系如下:

X102030406080

yX%%%>6

(1)根據(jù)散點(diǎn)圖可以認(rèn)為尤與y之間存在線性相關(guān)關(guān)系,請(qǐng)用最小二乘法求出線性回歸方程y=bx+a(4,

第11頁共46頁

5用分?jǐn)?shù)表示)

(2)某農(nóng)戶種植的草莓主要以300元/箱的價(jià)格給當(dāng)?shù)卮笮蜕坛┴洠嘤嗟牟葺恳?00元/箱的價(jià)格銷

售給當(dāng)?shù)匦∩特?據(jù)統(tǒng)計(jì),往年1月份當(dāng)?shù)卮笮蜕坛葺男枨罅繛?0箱、100箱、150箱、200箱的概

率分別為二,J,;,根據(jù)回歸方程以及往年商超草莓的需求情況進(jìn)行預(yù)測(cè),求今年1月份農(nóng)戶草莓

105z5

的種植量為200箱時(shí)所獲得的利潤情況.(最后結(jié)果精確到個(gè)位)

66£(%-可(其-刃

附:y)=790,E%=54,在線性回歸直線方程9=&+&中上―-----------

i=l

d=y-bx.

10+20+30+40+60+80-54

【解析】(1)因?yàn)樵?=40,y=—=Q9,

6o

所以士(七—元『二900+4°°+10°+°+400+160°=3400,

i=l

由題意可知£山一x)(y,.-y)=790,

i=l

£(%-?。ǎ?9)

790_79

所以3=―-----------------

f(%-元)23400~340

i=l

795

又因?yàn)椋?9-------x40=——

34017

所以回歸方程為£=急791-5

79“八5785/十一、

(2)由回歸方程知,若農(nóng)戶草莓的種植量為200箱,則成本為9=備乂200-----=-----(千兀).

1717

設(shè)農(nóng)戶草莓的種植量為200箱時(shí)的收入為y元,200箱草莓供給大型商超和小商販分別光箱和y,顯然

x+y=200,

由題意y=300x+200y,因此羽,以及丫的可能取值如下表:

X50100150200

y150100500

Y=300x+200y45000500005500060000

所以丫的分布列為:

Y45000500005500060000

第12頁共46頁

1111

P————

10525

所以磯卜)=乂]

45000+50000x-+55000x-+60000x-=54000,

525

7X5

所以預(yù)測(cè)所獲利潤約為54000-石-'100°。7824元.

變式7.(2023?江西?高三統(tǒng)考開學(xué)考試)某新能源汽車銷售部對(duì)今年1月至7月的銷售量進(jìn)行統(tǒng)計(jì)與分

析,因不慎丟失一些數(shù)據(jù),現(xiàn)整理出如下統(tǒng)計(jì)表與一些分析數(shù)據(jù):

月份1月2月3月4月5月6月7月

月份代號(hào)X1234567

銷售量y(單位:萬輛)15.6mnS37.739.644.5

其中9=312.

(1)若加,n,$成遞增的等差數(shù)列,求從7個(gè)月的銷售量中任取1個(gè),月銷售量不高于27萬輛的概率;

⑵若=670.48,x與y的樣本相關(guān)系數(shù)廠=。99,求y關(guān)于x的線性回歸方程9=幾+。,并預(yù)測(cè)

1=1

今年8月份的銷售量工精確到0.1).

附:相關(guān)系數(shù),線性回歸方程?=取+3中斜率和截距的最小二乘估計(jì)公式分別

為一:a=y-bx.

白尤廠X)2

/=1

參考數(shù)據(jù):6a2.65,V670.48?25.89.

15.6+根+〃+s+37.7+39.6+44.5...

【解析】(1)因?yàn)榇?31.2.所以--------------------------------------------=31.2,

7

所以〃7+a+s=81,

又加,n,s成遞增的等差數(shù)列,所以加+s=2〃旦根<〃<s,

所以"=27,且m<27<s,

所以月銷售量不高于27萬輛的有15.6,加,〃共3個(gè),又基本事件總數(shù)為7,

故所求概率為:3

一17

(2)由表中數(shù)據(jù)可知,x=-^xt=4,28

/i=l

第13頁共46頁

所以gb4.88r=4.88x0.99。4.8,

由元=4,V=31.2,得&=9一成元=31.2-4.8x4=12.0,

故》關(guān)于x的線性回歸方程為£=4.8元+12.0.

當(dāng)x=8時(shí),£=4.8x8+12=50.4,

所以預(yù)測(cè)今年8月份的銷售量大約為50.4萬輛.

變式8.(2023?四川成都?高三石室中學(xué)??奸_學(xué)考試)己知某綠豆新品種發(fā)芽的適宜溫度在6℃~22c之

間,一農(nóng)學(xué)實(shí)驗(yàn)室研究人員為研究溫度x(℃)與綠豆新品種發(fā)芽數(shù)y(顆)之間的關(guān)系,每組選取了成

熟種子50顆,分別在對(duì)應(yīng)的8℃~14℃的溫度環(huán)境下進(jìn)行實(shí)驗(yàn),得到如下散點(diǎn)圖:

35■

V___1___X___I____I____I____I____I____I

JIIIIIIII

o'—::-!――i—!—!~!―>

789101112131415x

_7__7_

其中y=24,X(W-x)(y-y)=70,^(x-y)2=176.

i=li=l

(1)運(yùn)用相關(guān)系數(shù)進(jìn)行分析說明,是否可以用線性回歸模型擬合y與x的關(guān)系?

⑵求出y關(guān)于x的線性回歸方程與=鼠+機(jī)并預(yù)測(cè)在19。。的溫度下,種子的發(fā)芽的顆數(shù).

?__n__

X(%-X)(%-y)Z(%-x)(%-y)

參考公式:相關(guān)系數(shù)r=下「_”U,回歸直線方程¥=鼠+)其中b=上,——=——

JS(七一元)5(%一y)2£(七-

Vz=lz=li=l

6=亍-版.參考數(shù)據(jù):V77?8.77.

【解析】(1)根據(jù)題意,=1(8+9+10+11+12+13+14)=11.

^(x,.-x)2=(8-11)2+(9-11)2+(10-11)2+(11-11)2+(12-11)2+(13-11)2+(14-11)2=28,

Z=1

工(%-可力(%一刃2

=128x176=8"B70.16.

1=11=1

第14頁共46頁

7

£(%-可(%-刃70

08

因而相關(guān)系數(shù)r=「7=布/""

忙(一)》(—吊-

Vi=lZ=1

由于卜上0.998很接近1,.?.可以用線性回歸方程模型擬合y與x的關(guān)系.

7

2(七一下肌-刃

5

⑵6=『----------=-

訃T2

Z=1

57

3=24----x11=—,

22

57

.??y關(guān)于x的回歸方程為9=

57

若X=19,則夕=彳翅9-彳=44顆.

...在19℃的溫度下,預(yù)測(cè)種子的發(fā)芽顆數(shù)為44.

變式9.(2023?安徽亳州?蒙城第一中學(xué)校聯(lián)考模擬預(yù)測(cè))為調(diào)查某地區(qū)植被覆蓋面積x(單位:公頃)和

野生動(dòng)物數(shù)量y的關(guān)系,某研究小組將該地區(qū)等面積花分為400個(gè)區(qū)塊,從中隨機(jī)抽取40個(gè)區(qū)塊,得到樣

本數(shù)據(jù)(4%)。=12,40),部分?jǐn)?shù)據(jù)如下:

X2.73.63.23.9

y50.663.752.154.3

40404040

經(jīng)計(jì)算得:+>,=160,£%=2400,E(x,-可一=160,-元)(y-y)=1280.

1=1Z=1Z=1Z=1

(1)利用最小二乘估計(jì)建立y關(guān)于x的線性回歸方程;

(2)該小組又利用這組數(shù)據(jù)建立了無關(guān)于y的線性回歸方程,并把這兩條擬合直線畫在同一坐標(biāo)系xOy下,

橫坐標(biāo)x,縱坐標(biāo)y的意義與植被覆蓋面積x和野生動(dòng)物數(shù)量〉一致.設(shè)前者與后者的斜率分別為k2,

比較左,我的大小關(guān)系,并證明.

^x^i-nx-y

附:y關(guān)于x的回歸方程y=a+bx中,斜率和截距的最小二乘估計(jì)公式分別為:b=^----—

£x:一〃x-

1=1

信5]島2打

【解析】⑴片果=4,-2400071280o

y=-77T=6。,^=---=8,Q=60—32=28,

40160

第15頁共46頁

故回歸方程為y=8x+28;

(2)x關(guān)于y的線性回歸方程為x=的+"y,4=乂工----------

又卜⑷,卜,

h>Q,故即k14k2,

下證:k#k小

若匕=心,則|廠|=1,即y=8%+281=1,2,,40)恒成立,

代入表格中的一組數(shù)據(jù)得:50.6^8x2.7+28,矛盾,

故匕<£.

綜上,y關(guān)于龍的回歸方程為y=8x+28.

【解題方法總結(jié)】

求經(jīng)驗(yàn)回歸方程的步驟

I-----------------------------------------------------------1

(步驟一甘甘算出得了,的,>必或士(x,-x)(y,-y),1

12(%-初2的值

VL-----------------------------------;

(步驟二H利用公式計(jì)算系數(shù)工務(wù)]

0二二二二二二二二二___

(步驟三H寫出經(jīng)驗(yàn)回歸方程$=5x+AJ

題型三:非線性回歸

例7.(2023?湖南?校聯(lián)考模擬預(yù)測(cè))若需要刻畫預(yù)報(bào)變量w和解釋變量x的相關(guān)關(guān)系,且從已知數(shù)據(jù)中知

道預(yù)報(bào)變量卬隨著解釋變量x的增大而減小,并且隨著解釋變量x的增大,預(yù)報(bào)變量w大致趨于一個(gè)確定

的值,為擬合卬和x之間的關(guān)系,應(yīng)使用以下回歸方程中的(b>0,e為自然對(duì)數(shù)的底數(shù))()

A.w-bx+aB.w=-blnx+aC.w=-b^[x+aD.w-be~x+a

【答案】D

【解析】對(duì)于A:因?yàn)閥=x在定義域內(nèi)單調(diào)遞增且方>0,所以W隨著X的增大而增大,不合題意,故A

錯(cuò)誤;

對(duì)于B:因?yàn)閥=lnx在定義域內(nèi)單調(diào)遞增且6>0,所以w隨著x的增大而減小,當(dāng)解釋變量x-+8,

第16頁共46頁

W-—co,不合題意,故B錯(cuò)誤;

對(duì)于C:因?yàn)閥=?在定義域內(nèi)單調(diào)遞增且6>0,所以W隨著X的增大而減小,當(dāng)解釋變量Xf+8,

wf-co,不合題意,故C錯(cuò)誤;

對(duì)于D:因?yàn)閥=er=d『在定義域內(nèi)單調(diào)遞減且6>0,所以w隨著x的增大而減小,當(dāng)解釋變量

e

x->+8,w->a,故D錯(cuò)誤;

故選:D.

例8.(2023?全國?高三專題練習(xí))云計(jì)算是信息技術(shù)發(fā)展的集中體現(xiàn),近年來,我國云計(jì)算市場(chǎng)規(guī)模持續(xù)

增長.已知某科技公司2018年至2022年云計(jì)算市場(chǎng)規(guī)模數(shù)據(jù),且市場(chǎng)規(guī)模y與年份代碼尤的關(guān)系可以用模

型>=。聲/(其中e為自然對(duì)數(shù)的底數(shù))擬合,設(shè)z=lny,得到數(shù)據(jù)統(tǒng)計(jì)表如下:

年份2018年2019年2020年2021年2022年

年份代碼尤12345

云計(jì)算市場(chǎng)規(guī)模y/千萬元7.4112036.666.7

z=Iny22.433.64

由上表可得經(jīng)驗(yàn)回歸方程z=Q52x+a,則2025年該科技公司云計(jì)算市場(chǎng)規(guī)模y的估計(jì)值為()

A.e508B.e5-6C.e612D.e65

【答案】B

【解析】因?yàn)閤=3,z=3,

所以a=1-0.521=3-3x0.52=1.44,

即經(jīng)驗(yàn)回歸方程z=0.52x+1.44,

當(dāng)x=8時(shí),z=0.52x8+1.44=5.6,

所以y=ez=e&6,

即2025年該科技公司云計(jì)算市場(chǎng)規(guī)模y的估計(jì)值為e56,

故選:B

例9.(多選題)(2023?福建廈門?廈門一中??既#┰趯?duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行回歸分析時(shí),若兩

個(gè)變量不呈線性相關(guān)關(guān)系,可以建立含兩個(gè)待定參數(shù)的非線性模型,并引入中間變量將其轉(zhuǎn)化為線性關(guān)

系,再利用最小二乘法進(jìn)行線性回歸分析.下列選項(xiàng)為四個(gè)同學(xué)根據(jù)自己所得數(shù)據(jù)的散點(diǎn)圖建立的非線性模

型,且散點(diǎn)圖的樣本點(diǎn)均位于第一象限,則其中可以根據(jù)上述方法進(jìn)行回歸分析的模型有()

2x+G

A.y=cxx"+c2xB.y=t+c

C.y=q+ln(x+C2)D.^qex+C2

【答案】ABC

第17頁共46頁

2

[解析】對(duì)于選項(xiàng)A:y=c1x+c2x=>—=cxx+c2,令〃=上則〃=q%+%;

XX

對(duì)于選項(xiàng)B:

%+qrG一Q1%+g1a

y二=1+£LZSy-l=———-n-----------二------x+——

x+c2x+c2X+。2y-]01_C?C]_G%—Q

4-M=^-=>?=——X+—

y—1。]—c*2G—Q

-C1

對(duì)于選項(xiàng)C:y=c1+ln(x+c2)^>y-q=ln(x+c2)^>^=x+c2

Cl

即e,=e-(x+c2)令〃貝|〃=于<x+Cz)=1?x+Q,/;

x+C2

對(duì)于選項(xiàng)D:y=cxenIny=Inq+X+G令〃=lny貝Ij〃=x+lnq+。2

此時(shí)斜率為1,與最小二乘法不符.

故選:ABC

變式10.(2023?全國?高三專題練習(xí))已知變量的關(guān)系可以用模型y=Ze儂擬合,設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論