2025年新高考數(shù)學(xué)一輪復(fù)習(xí):成對數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)(學(xué)生版+解析)_第1頁
2025年新高考數(shù)學(xué)一輪復(fù)習(xí):成對數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)(學(xué)生版+解析)_第2頁
2025年新高考數(shù)學(xué)一輪復(fù)習(xí):成對數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)(學(xué)生版+解析)_第3頁
2025年新高考數(shù)學(xué)一輪復(fù)習(xí):成對數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)(學(xué)生版+解析)_第4頁
2025年新高考數(shù)學(xué)一輪復(fù)習(xí):成對數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)(學(xué)生版+解析)_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第02講成對數(shù)據(jù)的統(tǒng)計(jì)分析

目錄

01考情透視?目標(biāo)導(dǎo)航............................................................2

02知識導(dǎo)圖?思維引航............................................................3

03考點(diǎn)突破題型探究............................................................4

知識點(diǎn)1:變量間的相關(guān)關(guān)系......................................................4

知識點(diǎn)2:線性回歸..............................................................5

知識點(diǎn)3:非線性回歸............................................................6

知識點(diǎn)4:獨(dú)立性檢驗(yàn)............................................................7

解題方法總結(jié)...................................................................9

題型一:變量間的相關(guān)關(guān)系.......................................................9

題型二:一元線性回歸模型......................................................11

題型三:非線性回歸............................................................14

題型四:列聯(lián)表與獨(dú)立性檢驗(yàn)....................................................18

題型五:誤差分析..............................................................21

04真題練習(xí)?命題洞見............................................................24

05課本典例高考素材............................................................25

06易錯(cuò)分析?答題模板............................................................46

易錯(cuò)點(diǎn):對回歸直線的性質(zhì)理解不深刻............................................46

答題模板:獨(dú)立性檢驗(yàn)...........................................

考情透視.目標(biāo)導(dǎo)航

考點(diǎn)要求考題統(tǒng)計(jì)考情分析

從近五年的全國卷的考查情況來看,

本節(jié)是高考的熱點(diǎn),主要以解答題形式出

2024年甲卷(理)第17題,12分

(1)變量的相關(guān)關(guān)系現(xiàn),經(jīng)常與概率綜合出題,一般難度為中

2023年上海卷第14題,4分

(2)樣本相關(guān)系數(shù)等.也可能以選擇題、填空題形式出現(xiàn),

2023年天津卷第7題,5分

(3)一元線性回歸模型難度不大.主要以應(yīng)用題的方式出現(xiàn),多

2023年甲卷(文)第19題,12分

(4)列聯(lián)表與獨(dú)立性檢驗(yàn)與經(jīng)濟(jì)、生活實(shí)際相聯(lián)系,需要在復(fù)雜的

2022年I卷第20題,12分

題目描述中找出數(shù)量關(guān)系,建立數(shù)學(xué)模

型,并且運(yùn)用數(shù)學(xué)模型解決實(shí)際問題.

復(fù)習(xí)目標(biāo):

(1)了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義.

(2)理解一元線性回歸模型和2x2列聯(lián)表,會(huì)運(yùn)用這些方法解決簡單的實(shí)際問題.

(3)會(huì)利用統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析.

匐2

〃二知識導(dǎo)圖?思維引航\\

變置之間的相關(guān)關(guān)系

成對數(shù)據(jù)的統(tǒng)計(jì)分析

老占突硒?力理慳宙

-----

知識JJ

知識點(diǎn)1:變量間的相關(guān)關(guān)系

1、變量之間的相關(guān)關(guān)系

當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫相關(guān)關(guān)系.由于

相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計(jì)發(fā)揮著非常重要的作用.我們可以通過收

集大量的數(shù)據(jù),在對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對它們的關(guān)系作出判斷.

注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,

而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.

2、散點(diǎn)圖

將樣本中的?個(gè)數(shù)據(jù)點(diǎn)(4%)(,=1,2,…,〃)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖.根據(jù)散點(diǎn)圖

中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.

(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對于兩個(gè)變量的這種相關(guān)關(guān)系,我們將

它稱為正相關(guān),如圖(1)所示;

(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對于兩個(gè)變量的這種相關(guān)關(guān)系,我們將

它稱為負(fù)相關(guān),如圖(2)所小.

(1)(2)

3、相關(guān)系數(shù)

若相應(yīng)于變量X的取值毛,變量y的觀測值為y(i則變量%與y的相關(guān)系數(shù)

〃__n__

Z(占一%)(%-y)X占%-nxy

?t=——I=,通常用「來衡量x與y之間的線性關(guān)系的強(qiáng)弱,r

忙(…茂(…尸、如,一小忙兒一方

vi=li=lVz=lVi=l

的范圍為一

(1)當(dāng)r>0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表示兩個(gè)變量負(fù)相關(guān).

(2)m越接近i,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);團(tuán)越接近o,表示兩個(gè)變量間幾乎不存在線性

相關(guān)關(guān)系.當(dāng)卜|=1時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.

(3)通常當(dāng)0.75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.

【診斷自測】如圖,為某組數(shù)據(jù)的散點(diǎn)圖,由最小二乘法計(jì)算得到回歸直線4的方程為=相關(guān)

系數(shù)為4,決定系數(shù)為若經(jīng)過殘差分析后去掉點(diǎn)P,剩余的點(diǎn)重新計(jì)算得到回歸直線4的方程為

.則下列結(jié)論一定正確的是(

D.4>0,

C.bx<b2馬v°

知識點(diǎn)2:線性回歸

1、線性回歸

線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.

對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(為,》),(X2,以),…,(羽,如),其回歸方程)=加+。的求法為

I__〃____

nx

Z(%-x)(yi-y)Z%%-y

/=歸=-----------=-4---------------------------

£(七一龍)2之七2一/

Z=1Z=1

a=y—bx

其中,X=—,y=-'\\y.,(X,y)稱為樣本點(diǎn)的中心.

2、殘差分析

對于預(yù)報(bào)變量y,通過觀測得到的數(shù)據(jù)稱為觀測值y,通過回歸方程得到的y稱為預(yù)測值,觀測值減

去預(yù)測值等于殘差,4稱為相應(yīng)于點(diǎn)(4口)的殘差,即有自=%-凡.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對

殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差

分析.

(1)殘差圖

通過殘差分析,殘差點(diǎn)?后)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這

樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.

(2)通過殘差平方和。=之(/_%)2分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;

i=\

反之,不合適.

(3)相關(guān)指數(shù)

Z(y-£)2

用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:叱=1—上」二.

£u-y)2

4=1

代越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.

【診斷自測】將某保護(hù)區(qū)分為面積大小相近的多個(gè)區(qū)域,用簡單隨機(jī)抽樣的方法抽取其中6個(gè)區(qū)域,統(tǒng)計(jì)

這些區(qū)域內(nèi)的某種水源指標(biāo)訪和某植物分布的數(shù)量y(,=i,2,…,6),得到樣本(4/),且其相關(guān)系數(shù)r=與,

16

記y關(guān)于X的線性回歸方程為y=a+bx.經(jīng)計(jì)算可知:x=9,XX;=550,士(y-9『=256,則%.

i=lz=l

-£(%-元)(%-刃£(王-丁)(%-9)

參考公式?^=--------------,r=,'='^=―,

1V/=1V1=1

知識點(diǎn)3:非線性回歸

解答非線性擬合問題,要先根據(jù)散點(diǎn)圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線

性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.

求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計(jì)算方法計(jì)算變換后的線性回歸方程系數(shù),還原

后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報(bào)預(yù)測,注意計(jì)算要細(xì)心,避免計(jì)算錯(cuò)誤.

1、建立非線性回歸模型的基本步驟:

(1)確定研究對象,明確哪個(gè)是解釋變量,哪個(gè)是預(yù)報(bào)變量;

(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);

(3)由經(jīng)驗(yàn)確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、

二次函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)、幕函數(shù)模型等);

(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;

(5)按照公式計(jì)算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;

(6)消去新元,得到非線性回歸方程;

(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.

【診斷自測】某人新房剛裝修完,為了監(jiān)測房屋內(nèi)空氣質(zhì)量的情況,每天在固定的時(shí)間測一次甲醛濃度

(單位:mg/m3),連續(xù)測量了10天,所得數(shù)據(jù)繪制成散點(diǎn)圖如下:用y,表示第,…,10)天測得的甲

101010

醛濃度,令z,=ln%,經(jīng)計(jì)算得£>,=12.8,£『=385,,氏=60.

i=li=li=\

7上甲醛濃度Mmg/n?)

6

5

4

3

2

1

IIIIIII]]II______

°12345678910天數(shù)

⑴由散點(diǎn)圖可知,>與i可用指數(shù)型回歸模型進(jìn)行擬合,請利用所給條件求出回歸方程;(系數(shù)精確到o.oi)

(2)已知房屋內(nèi)空氣中的甲醛濃度的安全范圍是低于0.08mg/m3,則根據(jù)(1)中所得回歸模型,該新房裝

修完第幾天開始達(dá)到此標(biāo)準(zhǔn)?(參考數(shù)據(jù):ln0.08a-2.53)

a'(%一元Xy-歹)^x^.-nxy

附:,=3~n=與,a=y-bx.

方(%-元)2,片_衣2

1=1i=\

知識點(diǎn)4:獨(dú)立性檢驗(yàn)

1、分類變量和列聯(lián)表

(1)分類變量:

變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.

(2)列聯(lián)表:

①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.

②2x2列聯(lián)表.

一般地,假設(shè)有兩個(gè)分類變量X和匕它們的取值分別為{不,三}和{必,8},其樣本頻數(shù)列聯(lián)表

(稱為2x2列聯(lián)表)為

總計(jì)

多aba+b

九2Cdc+d

總計(jì)a+cb+dn=a+b+c+d

從2x2列表中,依據(jù),^與,的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.

a+bc+d

2、等高條形圖

(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖表示

列聯(lián)表數(shù)據(jù)的頻率特征.

(2)觀察等高條形圖發(fā)現(xiàn)^與」二相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.

a+bc+a

3、獨(dú)立性檢驗(yàn)

計(jì)算隨機(jī)變量/=-----^ad-bcf-------利用/的取值推斷分類變量X和y是否獨(dú)立的方法稱為

(a+b)(c+d)(a+c)(Z?+d)

了獨(dú)立性檢驗(yàn).

oc0.100.050.0100.0050.001

2.7063.8416.6357.87910.828

【診斷自測】近年中國新能源汽車進(jìn)入高速發(fā)展時(shí)期.專家預(yù)測2024年中國汽車總銷售量將超過3100萬輛,

繼續(xù)領(lǐng)跑全球.為了了解廣大消費(fèi)者購買新能源汽車意向與年齡是否具有相關(guān)性,某汽車APP采用問卷調(diào)

查形式對400名消費(fèi)者進(jìn)行調(diào)查,數(shù)據(jù)顯示這400人中中老年人共有150人,且愿意購買新能源車的人數(shù)

是愿意購買燃油車的2倍;青年中愿意購買新能源車的人數(shù)是愿意購買燃油車的4倍.

購車意向

年齡段合計(jì)

愿意購買新能源車愿意購買燃油車

青年

中老年

合計(jì)

(1)完善2x2列聯(lián)表,請根據(jù)小概率值a=0.01的獨(dú)立性檢驗(yàn),分析消費(fèi)者對新能源車和燃油車的意向購買

與年齡是否有關(guān);

(2)采用分層隨機(jī)抽樣從愿意購買新能源車的消費(fèi)者中抽取9人,再從這9人中隨機(jī)抽取4人,求這4人中

青年人數(shù)的期望.

2n^ad-bcX

附:”(a+b)(c+d)(a+c)(b+d)'n=a+b+c+d.

a0.050.010.001

Xa3.8416.63510.828

解題方法總結(jié)

常見的非線性回歸模型

(1)指數(shù)函數(shù)型_y=ca"(。>0且4W1,C>0)

兩邊取自然對數(shù),Iny=In(cct',即Iny=lnc+xlna,

\y'=\ny

令,,原方程變?yōu)閥=lnc+31na,然后按線性回歸模型求出Ina,Inc.

[x=x

(2)對數(shù)函數(shù)型y=61nx+a

令11一:,原方程變?yōu)榱?法,+°,然后按線性回歸模型求出在,?.

[X=lnx

(3)籍函數(shù)型丁="〃

兩邊取常用對數(shù),lgy=lg(G;〃),即lgy=〃lgx+lga,

y'Tgy

令,I,原方程變?yōu)閂=n/+lga,然后按線性回歸模型求出〃,Iga.

x=lgx

(4)二次函數(shù)型丁=-2+.

令],原方程變?yōu)閥'=fo/+a,然后按線性回歸模型求出心心

[x=x

(5)反比例函數(shù)型y=a型

x

丁二y

令1,原方程變?yōu)閂=-a,然后按線性回歸模型求出心?.

%'=—

、%

題型洞察

題型一:變量間的相關(guān)關(guān)系

【典例1-1】已知5個(gè)成對數(shù)據(jù)(x,y)的散點(diǎn)圖如下,若去掉點(diǎn)。(4,3),則下列說法正確的是()

/(1,4)

,.5(2,3.5)

.?£>(4,3)

C(3,2.5)

_______________

Ox

A,變量x與變量y呈正相關(guān)B.變量x與變量y的相關(guān)性變強(qiáng)

C.殘差平方和變大D.樣本相關(guān)系數(shù)廠變大

【典例1-2]已知4表示變量無與y之間的相關(guān)系數(shù),4表示變量”與v之間的相關(guān)系數(shù),且4=0.836,

=-0.958,貝U()

A.變量x與y之間呈正相關(guān)關(guān)系,且無與y之間的相關(guān)性強(qiáng)于a與v之間的相關(guān)性

B.變量尤與y之間呈負(fù)相關(guān)關(guān)系,且x與y之間的相關(guān)性強(qiáng)于“與v之間的相關(guān)性

C.變量〃與v之間呈負(fù)相關(guān)關(guān)系,且尤與y之間的相關(guān)性弱于a與v之間的相關(guān)性

D.變量a與v之間呈正相關(guān)關(guān)系,且x與y之間的相關(guān)性弱于〃與v之間的相關(guān)性

【方法技巧】

判定兩個(gè)變量相關(guān)性的方法

(1)畫散點(diǎn)圖:點(diǎn)的分布從左下角到右上角,兩個(gè)變量正相關(guān);點(diǎn)的分布從左上角到右下角,兩個(gè)

變量負(fù)相關(guān).

(2)樣本相關(guān)系數(shù):當(dāng)廠>0時(shí),正相關(guān);當(dāng)K0時(shí),負(fù)相關(guān);川越接近于1,相關(guān)性越強(qiáng).

(3)經(jīng)驗(yàn)回歸方程:當(dāng)g>0時(shí),正相關(guān);當(dāng)信0時(shí),負(fù)相關(guān).

【變式1-1】某校學(xué)生科研興趣小組為了解1~12歲兒童的體質(zhì)健康情況,隨機(jī)調(diào)查了20名兒童的相關(guān)數(shù)

據(jù),分別制作了肺活量、視力、肢體柔韌度、BMI指數(shù)和身高之間的散點(diǎn)圖,則與身高之間具有正相關(guān)關(guān)

系的是()

O高

肢BK/

指a

數(shù)

柔I

O)身高O*身高

A.肺活量B.視力C.肢體柔韌度D.BMI指數(shù)

【變式1-2]對變量x,y由觀測數(shù)據(jù)得散點(diǎn)圖1;對變量",v由觀測數(shù)據(jù)得散

點(diǎn)圖2.々表示變量x,y之間的線性相關(guān)系數(shù),4表示變量",v之間的線性相關(guān)系數(shù),則下列說法正確的

是()

A.變量x與y呈現(xiàn)正相關(guān),且團(tuán)>閆B.變量x與y呈現(xiàn)負(fù)相關(guān),且閆

C.變量〃與v呈現(xiàn)正相關(guān),且田〉⑻D.變量M與v呈現(xiàn)負(fù)相關(guān),且值|〈人|

【變式1-3](2024.江西南昌?三模)如圖對兩組數(shù)據(jù)x,>和v,"分別進(jìn)行回歸分析,得到散點(diǎn)圖如圖,

并求得線性回歸方程分別是y=+q和"=%>,+/,并對變量X,了進(jìn)行線性相關(guān)檢驗(yàn),得到相關(guān)系數(shù)4,

對變量*“進(jìn)行線性相關(guān)檢驗(yàn),得到相關(guān)系數(shù)4,則下列判斷正確的是()

A.々>0B.<0C.H|<|^|D.rx+r2<0

【變式1-4](2024?遼寧葫蘆島?一模)己知變量x與y的回歸直線方程為y=3x-l,變量y與Z負(fù)相關(guān),則

A.X與y負(fù)相關(guān),x與Z負(fù)相關(guān)B.x與y正相關(guān),x與z正相關(guān)

C.x與>負(fù)相關(guān),x與z正相關(guān)D.x與y正相關(guān),x與z負(fù)相關(guān)

題型二:一元線性回歸模型

【典例2-1】(2024?四川成都?模擬預(yù)測)已知關(guān)于x的一組數(shù)據(jù):

X1m345

y0.50.6n1.31.4

根據(jù)表中數(shù)據(jù)得到的線性回歸直線方程為9=028X+0.16,則,7-0.28m的值

【典例2-2】(2024?四川綿陽?三模)根據(jù)統(tǒng)計(jì),某蔬菜基地西紅柿畝產(chǎn)量的增加量八百千克)與某種液體

肥料每畝的使用量x(千克)之間的對應(yīng)數(shù)據(jù)的散點(diǎn)圖如圖所示.

本”百千克

7

6

5

4

3

。24568x/千克

(1)從散點(diǎn)圖可以看出,可用線性回歸方程擬合>與x的關(guān)系,請計(jì)算樣本相關(guān)系數(shù)『并判斷它們的相關(guān)程

度;

(2)求y關(guān)于X的線性回歸方程夕=去+m并預(yù)測液體肥料每畝的使用量為12千克時(shí)西紅柿畝產(chǎn)量的增加

量.

£(%一)(%-刃-S(^-^)(x-y)八

附.力=_[皂「=£=3---------------------,a=y-bxt

【方法技巧】

求經(jīng)驗(yàn)回歸方程的步驟

川甘算出x,y,左》或自(x,-x)(y,-y),

(步驟一

廠:官@-1)2的值

0

(步驟二H利用公式計(jì)算系數(shù)點(diǎn)》;

0二二二二二二二二二二二二二

(步驟三H寫出經(jīng)驗(yàn)回歸方程9=標(biāo)+]

【變式2-11某中醫(yī)藥企業(yè)根據(jù)市場調(diào)研與模擬,得到研發(fā)投入x(億元)與產(chǎn)品收益y(億元)的數(shù)據(jù)統(tǒng)

計(jì)如下:

研發(fā)投入X(億元)12345

產(chǎn)品收益y(億元)3791011

⑴計(jì)算X,y的相關(guān)系數(shù)乙并判斷是否可以認(rèn)為研發(fā)投入與產(chǎn)品收益具有較高的線性相關(guān)程度?(若

0.3<|r|<0.75,則線性相關(guān)程度一般;若|川>0.75,則線性相關(guān)程度較高)

(2)求出,關(guān)于*的線性回歸方程,并預(yù)測若想收益超過20(億元),則需研發(fā)投入至少多少億元?(結(jié)果保

留一位小數(shù))

汽a-x)(yf-y)

參考公式:回歸直線的斜率和截距的最小二乘法估計(jì)公式,相關(guān)系數(shù)「的公式分別為3=J----------------

f(七-方2

1=1

z(%-5)(%-歹)

555

參考數(shù)據(jù):5>廠制2=10,Z(K-刃2=40,2(%-君(%-9)=19.

i=li=li=l

【變式2-2](2024.河南周口.模擬預(yù)測)直播帶貨是扶貧助農(nóng)的一種新模式,這種模式是利用主流媒體的

公信力,聚合銷售主播的力量助力打通農(nóng)產(chǎn)品產(chǎn)銷鏈條,切實(shí)助力農(nóng)民增收.我國南方某蜜桔種植縣通過

網(wǎng)絡(luò)平臺直播銷售蜜桔,其中每箱蜜桔重5千克,單價(jià)為40元/箱,己知最近5天單日直播總時(shí)長尤(即所

有主播的直播時(shí)長之和,單位:小時(shí))與蜜桔的單目銷售量y(單位:百箱)之間的統(tǒng)計(jì)數(shù)據(jù)如下表:

直播總時(shí)長工89111215

單日銷售量y6763808085

可用線性回歸模型擬合y與x之間的關(guān)系.

(1)試求變量y與尤的線性回歸方程y=bx+a;

(2)若每位主播每天直播的時(shí)間不超過4小時(shí),要使每天直播帶貨銷售蜜桔的總金額超過60萬元,則至少

要請幾位主播進(jìn)行直播?

(3)直播帶貨大大提升銷量的同時(shí),也增加了壞果賠付的成本.該蜜桔平均每箱按80個(gè)計(jì)算,若客戶在收

到貨時(shí)有壞果,則每個(gè)壞果要賠付1元.現(xiàn)有甲、乙兩款包裝箱,若采用甲款包裝箱,成本為MIMIM5)

-1

,i=。

32

元/箱,且每箱壞果的個(gè)數(shù)X服從尸(X=i)=<g),i=l,2,3,4,5;若采用乙款包裝箱,成本為十元/箱,且

0,i=6,…,80

[9.八

——,1=0

16

每箱壞果的個(gè)數(shù)y服從尸c=o=<g[m,i=1,2,

3.請運(yùn)用概率統(tǒng)計(jì)的相關(guān)知識分析,選擇哪款包裝箱獲

0,i=4,5,…,8(

得的利潤更大?

,^(x,-x)(x-y)§

5

附:",a-y-bx,=4218,ZX:=635.

21=1

E(X,.-X)0

Z-1

【變式2-3](2024?全國?模擬預(yù)測)氮氧化物是一種常見的大氣污染物,它是由氮和氧兩種元素組成的化

合物,有多種不同的形式.下圖為我國2014年至2022年氮氧化物排放量(單位:萬噸)的折線圖,其中,

年份代碼1?9分別對應(yīng)年份2014?2022.

年氮氧化物排放量y

(1)是否可用線性回歸模型擬合>與/的關(guān)系?請用折線圖和相關(guān)系數(shù)加以說明;

(2)是否可用題中數(shù)據(jù)擬合得到的線性回歸模型預(yù)測2023年和2033年的氮氧化物排放量?請說明理由.

£(—)(%-9)_

附:相關(guān)系數(shù)廠二十^1---------------,JI?=3.87.

ZU-n2Z(x-y)2

i=lz=l

題型三:非線性回歸

【典例3-1](多選題)(2024?湖北武漢?二模)在對具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行回歸分析時(shí),若兩個(gè)變量

不呈線性相關(guān)關(guān)系,可以建立含兩個(gè)待定參數(shù)的非線性模型,并引入中間變量將其轉(zhuǎn)化為線性關(guān)系,再利

用最小二乘法進(jìn)行線性回歸分析.下列選項(xiàng)為四個(gè)同學(xué)根據(jù)自己所得數(shù)據(jù)的散點(diǎn)圖建立的非線性模型,且散

點(diǎn)圖的樣本點(diǎn)均位于第一象限,則其中可以根據(jù)上述方法進(jìn)行回歸分析的模型有()

,x+c.

A.y=qx+c2xB.y=-------

X+C2

c.y=cx+ln(x+c2)D.

【典例3-2]已知變量x和,之間的關(guān)系可以用模型y=來擬合.設(shè)z=lny,若根據(jù)樣本數(shù)據(jù)計(jì)算可得

1=3.5工=0.9,且x與z的線性回歸方程為z=0.6x+a,則—.(參考數(shù)據(jù):

lnO.3?-1.2,lnO.25?-1.4)

【方法技巧】

換元法變成一元線性回歸模型

【變式3-1】紅蜘蛛是柚子的主要害蟲之一,能對柚子樹造成嚴(yán)重傷害,每只紅蜘蛛的平均產(chǎn)卵數(shù)>(個(gè))

和平均溫度“°C)有關(guān),現(xiàn)收集了以往某地的7組數(shù)據(jù),得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.

…為自然對數(shù)的底數(shù))哪一個(gè)更適合作為平均產(chǎn)

(給出判斷即可,不必說明理由)

⑵由(1)的判斷結(jié)果及表中數(shù)據(jù),求出,關(guān)于x的回歸方程.(計(jì)算結(jié)果精確到0.1)

-?。▂-y)國

附:回歸方程中5=去+&花=『-----------=號--------,a=y-bx

支(%-可2夕-戒2

1=11=1

【變式3-2】設(shè)某幼苗從觀察之日起,第x天的高度為山川,測得的一些數(shù)據(jù)如下表所示:

第X/p>

高度*m0479111213

作出這組數(shù)據(jù)的散點(diǎn)圖發(fā)現(xiàn):>(cm)與x(天)之間近似滿足頭系式y(tǒng)+其中。,匕均為大于。的

常數(shù).

(1)試借助一元線性回歸模型,根據(jù)所給數(shù)據(jù),用最小二乘法對。,匕作出估計(jì),并求出》關(guān)于x的經(jīng)驗(yàn)回歸

方程;

(2)在作出的這組數(shù)據(jù)的散點(diǎn)圖中,甲同學(xué)隨機(jī)圈取了其中的4個(gè)點(diǎn),記這4個(gè)點(diǎn)中幼苗的高度大于]的點(diǎn)

的個(gè)數(shù)為八其中亍為表格中所給的幼苗高度的平均數(shù),試求隨機(jī)變量4的分布列和數(shù)學(xué)期望.

附:對于一組數(shù)據(jù)(匕,4),(右,心),…,(v“,H),其回歸直線方程衣=C+用,的斜率和截距的最小二乘

估計(jì)分別為6=上,-------,&=4一雨.

Ei

i=l

【變式3-3】紅鈴蟲(Pectinophoragossypiella)是棉花的主要害蟲之一,其產(chǎn)卵數(shù)與溫度有關(guān).現(xiàn)收集到

一只紅鈴蟲的產(chǎn)卵數(shù)y(個(gè))和溫度x(℃)的8組觀測數(shù)據(jù),制成圖1所示的散點(diǎn)圖.現(xiàn)用兩種模型①

>=eto+\②y=c/+d分別進(jìn)行擬合,由此得到相應(yīng)的回歸方程并進(jìn)行殘差分析,進(jìn)一步得到圖2所示的

殘差圖.

產(chǎn)卵數(shù)”個(gè)

1殘差

140

2030

0020

80107

——?->

601至20萬、巡26近,&Z2_34就度

40-10

20-20'O

。???1??1?1A-3O

182022242628303234溫度x/C

一模型①9-模型②

圖1產(chǎn)卵數(shù)散點(diǎn)圖

圖2兩種模型的殘差圖

根據(jù)收集到的數(shù)據(jù),計(jì)算得到如下值:

8888

XZ?之&-元)Z(Zj-z)(%r)支(口-刃(―)

i=l1=1Z=11=1

252.964616842268850.470308

]8_|8

表中Zj=lny;z=_22Z/;tt=xf;t

O<=13i=l

(1)根據(jù)殘差圖,比較模型①、②的擬合效果,哪種模型比較合適?

(2)根據(jù)(1)中所選擇的模型,求出,關(guān)于,的回歸方程.

附:對于一組數(shù)據(jù)(以,匕),(牡,彩),…(◎,,/.),其回歸直線0=戊+公。的斜率和截距的最小二乘估計(jì)分別為,

、£(例一萬)(匕一U)

6=旦:-----------,a=v-Pm

f(0,一5了

1=1

【變式3-4](2024.福建南平.模擬預(yù)測)某大型商場的所有飲料自動(dòng)售賣機(jī)在一天中某種飲料的銷售量了

(單位:瓶)與天氣溫度x(單位:。C)有很強(qiáng)的相關(guān)關(guān)系,為能及時(shí)給飲料自動(dòng)售賣機(jī)添加該種飲料,

該商場對天氣溫度X和飲料的銷售量>進(jìn)行了數(shù)據(jù)收集,得到下面的表格:

X10152025303540

y41664256204840968192

經(jīng)分析,可以用y=。?2&作為,關(guān)于,的經(jīng)驗(yàn)回歸方程.

(1)根據(jù)表中數(shù)據(jù),求>關(guān)于x的經(jīng)驗(yàn)回歸方程(結(jié)果保留兩位小數(shù));

(2)若飲料自動(dòng)售賣機(jī)在一天中不需添加飲料的記1分,需添加飲料的記2分,每臺飲料自動(dòng)售賣機(jī)在一天

中需添加飲料的概率均為;,在商場的所有飲料自動(dòng)售賣機(jī)中隨機(jī)抽取3臺,記總得分為隨機(jī)變量X,求

X的分布列與數(shù)學(xué)期望.

參考公式及數(shù)據(jù):對于一組數(shù)據(jù)(4,乂),(吃,%),…,(%,乂),經(jīng)驗(yàn)回歸方程夕=標(biāo)+占的斜率和截距的最小

二乘估計(jì)公式分別為A=J----------------,a=y-bx-,x=25,^(x,.-x)2=700

1=1

【變式3-5]在國家積極推動(dòng)美麗鄉(xiāng)村建設(shè)的政策背景下,各地根據(jù)當(dāng)?shù)厣鷳B(tài)資源打造了眾多特色紛呈的

鄉(xiāng)村旅游勝地.某人意圖將自己位于鄉(xiāng)村旅游勝地的房子改造成民宿用于出租,在旅游淡季隨機(jī)選取100

天,對當(dāng)?shù)匾延械牧g不同價(jià)位的民宿進(jìn)行跟蹤,統(tǒng)計(jì)其出租率y1l0°天中?的天數(shù)],設(shè)民宿租金為X

(單位:元/日),得到如圖的數(shù)據(jù)散點(diǎn)圖.

卜出租率

1

9

8-.(88,0.91)

7

6二.(128,072)

5

4->(188,0.51)

3_.(288,0.32)

2

1-.(388,0.2)

-*(488,0.16)

100200300400500600租金

(1)若用“出租率”近似估計(jì)旅游淡季民宿每天租出去的概率,求租金為388元的那間民宿在淡季內(nèi)的3天中

至少有2天閑置的概率.

⑵(i)根據(jù)散點(diǎn)圖判斷,、=云+。與丫=加+”哪個(gè)更適合此模型(給出判斷即可,不必說明理由)?根

據(jù)判斷結(jié)果求經(jīng)驗(yàn)回歸方程.

(ii)若該地一年中旅游淡季約為280天,在此期間無論民宿是否出租,每天都要付出9.9%x的固定成本,

若民宿出租,則每天需要再付出10%x的日常支出成本.試用(i)中模型進(jìn)行分析,旅游淡季民宿租金定

為多少元時(shí),該民宿在這280天的收益W達(dá)到最大.

n

附:記Z,=1叫,X?261,3,5=0.47,z=5,4,一元)(%-力=-221,

1=1

55152

之(七一元)2=121333.3,之卜,一項(xiàng)其一歹卜一0.99,力(z「可、2.2,e?148,e?164,e-?181.

i=li=li=l

【變式3-6](2024?全國?模擬預(yù)測)近三年的新冠肺炎疫情對我們的生活產(chǎn)生了很大的影響,當(dāng)然也影響

著我們的旅游習(xí)慣,鄉(xiāng)村游、近郊游、周邊游熱鬧了許多,甚至出現(xiàn)“微度假”的概念.在國家有條不紊的

防疫政策下,旅游又重新回到了老百姓的日常生活中.某鄉(xiāng)村抓住機(jī)遇,依托良好的生態(tài)環(huán)境、厚重的民

族文化,開展鄉(xiāng)村旅游.通過文旅度假項(xiàng)目考察,該村推出了多款套票文旅產(chǎn)品,得到消費(fèi)者的積極回

應(yīng).該村推出了六條鄉(xiāng)村旅游經(jīng)典線路,對應(yīng)六款不同價(jià)位的旅游套票,相應(yīng)的價(jià)格x與購買人數(shù)y的數(shù)

據(jù)如下表.

旅游線路奇山秀水游古村落游慢生活游親子游采摘游舌尖之旅

套票型號ABCDEF

價(jià)格X阮394958677786

經(jīng)數(shù)據(jù)分析、描點(diǎn)繪圖,發(fā)現(xiàn)價(jià)格X與購買人數(shù)y近似滿足關(guān)系式、=*(,>。力>0),即

lny=blnx+lna(q>0,b>0),對上述數(shù)據(jù)進(jìn)行初步處理,其中匕=ln^,vvz.=In,i-\,2,6.

6666

附:①可能用到的數(shù)據(jù):2>叱=75.3,Z匕=24.6,2>=18.3,^^=101.4.

Z=1?=1?=11=1

②對于一組數(shù)據(jù)(匕,%),(彩,叫),…,其回歸直線4=薪+&的斜率和截距的最小二乘估計(jì)值分

nn

Z(匕一/)(叱一日)£匕叱一〃麗

另!J為公=――,a=w-bv-

t(匕-琦曲2-疝2

4=1;=1

(1)根據(jù)所給數(shù)據(jù),求y關(guān)于尤的回歸方程.

(2)按照相關(guān)部門的指標(biāo)測定,當(dāng)套票價(jià)格XC[49,81]時(shí),該套票受消費(fèi)者的歡迎程度更高,可以被認(rèn)定為

“熱門套票現(xiàn)有三位游客,每人從以上六款套票中購買一款旅游,購買任意一款的可能性相等.若三人

買的套票各不相同,記三人中購買“熱門套票”的人數(shù)為X,求隨機(jī)變量X的分布列和期望.

題型四:列聯(lián)表與獨(dú)立性檢驗(yàn)

【典例4-1】觀察下圖的等高條形圖,其中最有把握認(rèn)為兩個(gè)分類變量x,>之間沒有關(guān)系的是()

【典例4-2】(2024?上海金山?二模)為了考察某種藥物預(yù)防疾病的效果,進(jìn)行動(dòng)物試驗(yàn),得到如下圖所示

列聯(lián)表:

疾病

藥物合計(jì)

未患病患病

服用m50-m50

未服用80-mm-3050

合計(jì)8020100

取顯著性水平a=0.05,若本次考察結(jié)果支持“藥物對疾病預(yù)防有顯著效果”,則2(加24O,〃zeN)的最小

值為_____

n{ad-be)2

(參考公式:/=;參考值:>3.841)?0.05)

(a+b)(c+d)(a+c)(b+d)

【方法技巧】

獨(dú)立性檢驗(yàn)的一般步驟

(1)根據(jù)樣本數(shù)據(jù)制成2x2列聯(lián)表.

(2)根據(jù)公式/=-----Mad-bc#-------計(jì)算.

(a+Z7)(c+d)(a+c)(b+d)

(3)比較爐與臨界值的大小關(guān)系,作統(tǒng)計(jì)推斷.

【變式4-1](2024?四川成都?模擬預(yù)測)在學(xué)校食堂就餐成為了很多學(xué)生的就餐選擇.學(xué)校為了解學(xué)生食

堂就餐情況,在校內(nèi)隨機(jī)抽取了100名學(xué)生,其中男生和女生人數(shù)之比為1:1,現(xiàn)將一周內(nèi)在食堂就餐超過

8次的學(xué)生認(rèn)定為“喜歡食堂就餐”,不超過8次的學(xué)生認(rèn)定為“不喜歡食堂就餐”.“喜歡食堂就餐”的人數(shù)比

“不喜歡食堂就餐”人數(shù)多20人,“不喜歡食堂就餐”的男生只有10人.

男生女生合計(jì)

喜歡食堂就餐

不喜歡食堂就餐10

合計(jì)100

(1)將上面的列聯(lián)表補(bǔ)充完整,并依據(jù)小概率值a=0.001的獨(dú)立性檢驗(yàn),分析學(xué)生喜歡食堂就餐是否與性別

有關(guān):

⑵用頻率估計(jì)概率,從該校學(xué)生中隨機(jī)抽取10名,記其中“喜歡食堂就餐”的人數(shù)為X.事件“X=k”的概

率為P(X=Q,求隨機(jī)變量X的期望和方差.

rt(ad-be)2

參考公式:/=其中“=a+6+c+d.

(a+b)(c+d)(a+c)(i>+d)

a0.10.050.010.0050.001

%2.7063.8416.6357.87910.828

【變式4-2](2024?高三?河南焦作?開學(xué)考試)交通強(qiáng)國,鐵路先行,每年我國鐵路部門都會(huì)根據(jù)運(yùn)輸需求

進(jìn)行鐵路調(diào)圖,一鐵路線/上有自東向西依次編號為1,2,21的21個(gè)車站.

(1)為調(diào)查乘客對調(diào)圖的滿意度,在編號為10和11兩個(gè)站點(diǎn)多次乘坐列車尸的旅客中,隨機(jī)抽取100名旅

客,得出數(shù)據(jù)(不完整)如下表所示:

車站編號滿意不滿意合計(jì)

102840

113

合計(jì)85

完善表格數(shù)據(jù)并計(jì)算分析:依據(jù)小概率值a=0.001的獨(dú)立性檢驗(yàn),在這兩個(gè)車站中,能否認(rèn)為旅客滿意程

度與車站編號有關(guān)聯(lián)?

(2)根據(jù)以往調(diào)圖經(jīng)驗(yàn),列車尸在編號為8至14的終到站每次調(diào)圖時(shí)有;的概率改為當(dāng)前終到站的西側(cè)一站,

2

有]的概率改為當(dāng)前終到站的東側(cè)一站,每次調(diào)圖之間相互獨(dú)立.已知原定終到站編號為11的列車P經(jīng)歷

了3次調(diào)圖,第3次調(diào)圖后的終到站編號記為X,求X的分布列及均值.

2n^ad-bcX

附:”(a+b)(c+1)(a+c)(b+1)'其中〃=a+6+c+d.

a0.10.010.001

Xa2.7066.63510.828

【變式4-3]2024年7月26日,第33屆夏季奧林匹克運(yùn)動(dòng)會(huì)在法國巴黎正式開幕.人們在觀看奧運(yùn)比賽的

同時(shí),開始投入健身的行列.某興趣小組為了解成都市不同年齡段的市民每周鍛煉時(shí)長情況,隨機(jī)從抽取

200人進(jìn)行調(diào)查,得到如下列聯(lián)表:

周平均鍛煉時(shí)長

年齡合計(jì)

周平均鍛煉時(shí)間少于4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論