版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第84講成對數(shù)據(jù)的統(tǒng)計(jì)分析
知識梳理
知識點(diǎn)一、變量間的相關(guān)關(guān)系
1、變量之間的相關(guān)關(guān)系
當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫
相關(guān)關(guān)系.由于相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計(jì)發(fā)揮著非
常重要的作用.我們可以通過收集大量的數(shù)據(jù),在對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其
中的規(guī)律,對它們的關(guān)系作出判斷.
注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一
種確定的關(guān)系,而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是
伴隨關(guān)系.
2、散點(diǎn)圖
將樣本中的幾個(gè)數(shù)據(jù)點(diǎn)(%,%)?=1,2,…,ri)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)
圖.根據(jù)散點(diǎn)圖中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.
(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對于兩個(gè)變量的這種相關(guān)
關(guān)系,我們將它稱為正相關(guān),如圖(1)所示;
(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對于兩個(gè)變量的這種相關(guān)
關(guān)系,我們將它稱為負(fù)相關(guān),如圖(2)所示.
(1)(2)
3、相關(guān)系數(shù)
若相應(yīng)于變量x的取值玉,變量y的觀測值為則變量x與y的相關(guān)系數(shù)
〃__n___
X(%一%)(%-v)X%%-nxy
J7--------=,一二,通常用r來衡量x與y之間的線
/n_n_|n_In_
(%_x)2次(y-y)2JXx:-"X9y'i-ny9
Vi=li=lVi=lVi=\
性關(guān)系的強(qiáng)弱,的范圍為一1<〃<1.
(1)當(dāng)廠>0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)廠<0時(shí),表示兩個(gè)變量負(fù)相關(guān).
(2)越接近1,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);”越接近0,表示兩個(gè)變量間幾
乎不存在線性相關(guān)關(guān)系.當(dāng)卜|=1時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.
(3)通常當(dāng)M>0—75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.
知識點(diǎn)二、線性回歸
1、線性回歸
線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.
對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(xi,%),(尤2,>2),…,(用,如),其回歸方程y=bx+a
的求法為
〃__n__
-x)(y,-y)-nxy
b=-----------二號---------
4=14=1
a=y—bx
_1n—1n——
其中,x=—,Yxi,y=-y\yi,(x,y)稱為樣本點(diǎn)的中心.
n,=in,=i
2、殘差分析
對于預(yù)報(bào)變量y,通過觀測得到的數(shù)據(jù)稱為觀測值%,通過回歸方程得到的y稱為預(yù)
測值,觀測值減去預(yù)測值等于殘差,自稱為相應(yīng)于點(diǎn)(4y)的殘差,即有自=%-夕,.殘
差是隨機(jī)誤差的估計(jì)結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始
數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.
(1)殘差圖
通過殘差分析,殘差點(diǎn)(占在)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較
合適,其中這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.
(2)通過殘差平方和。=分析,如果殘差平方和越小,則說明選用的模型
1=1
的擬合效果越好;反之,不合適.
(3)相關(guān)指數(shù)
用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:片=1一上」_L.
Z=1
K越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.
知識點(diǎn)三、非線性回歸
解答非線性擬合問題,要先根據(jù)散點(diǎn)圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換
元將陌生的非線性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.
求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計(jì)算方法計(jì)算變換后的線性回歸
方程系數(shù),還原后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報(bào)預(yù)測,注意計(jì)算要
細(xì)心,避免計(jì)算錯(cuò)誤.
1、建立非線性回歸模型的基本步驟:
(1)確定研究對象,明確哪個(gè)是解釋變量,哪個(gè)是預(yù)報(bào)變量;
(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(是否存在非
線性關(guān)系);
(3)由經(jīng)驗(yàn)確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用
反比例函數(shù)、二次函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)、幕函數(shù)模型等);
(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;
(5)按照公式計(jì)算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;
(6)消去新元,得到非線性回歸方程;
(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型
是否合適等.
知識點(diǎn)四、獨(dú)立性檢驗(yàn)
1、分類變量和列聯(lián)表
(1)分類變量:
變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.
(2)列聯(lián)表:
①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.
②2x2列聯(lián)表.
一般地,假設(shè)有兩個(gè)分類變量X和匕它們的取值分別為{不,x?}和{%,為},其樣
本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)表)為
為總計(jì)
aba+b
x2cdc+d
總計(jì)a+cb+dn=a+b+c+d
從2x2列表中,依據(jù)‘一與工的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.
a+bc+d
2、等高條形圖
(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等
高條形圖表示列聯(lián)表數(shù)據(jù)的頻率特征.
(2)觀察等高條形圖發(fā)現(xiàn),-與工相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.
a+bc+d
3、獨(dú)立性檢驗(yàn)
計(jì)算隨機(jī)變量/丁+以胃之);…)利用/的取值推斷分類變量X和Y是否
獨(dú)立的方法稱為z2獨(dú)立性檢驗(yàn).
a0.100.050.0100.0050.001
兀2.7063.8416.6357.87910.828
【解題方法總結(jié)】
常見的非線性回歸模型
(1)指數(shù)函數(shù)型y=c/(a>0且0工1,c>0)
兩邊取自然對數(shù),lny=ln?即Iny=lnc+xlna,
令|y,Iny,原方程變?yōu)閥=]nc+x,lna,然后按線性回歸模型求出Ina,Inc.
[x=x
(2)對數(shù)函數(shù)型y=〃lnx+a
令,原方程變?yōu)閥'=6x'+“,然后按線性回歸模型求出b,a.
x=lnx
(3)幕函數(shù)型y二以〃
兩邊取常用對數(shù),Igy=坨體〃),即Igy=〃lgx+lga,
令0,=產(chǎn)>,原方程變?yōu)閥'=7zx'+lga,然后按線性回歸模型求出”,Iga.
[x=Igx
(4)二次函數(shù)型y=汝2+。
令廠,=[,原方程變?yōu)榱?法'+。,然后按線性回歸模型求出匕,
a.
\x=x
(5)反比例函數(shù)型y=a+2b型
x
令,1,原方程變?yōu)閂=Zu'+Q,然后按線性回歸模型求出b,a.
x=-
x
必考題型全歸納
題型一:變量間的相關(guān)關(guān)系
例L(2024?河北?高三校聯(lián)考期末)下列四幅殘差分析圖中,與一元線性回歸模型擬合精
度最高的是()
「殘差十殘差
40040
20020
A.0B.
0
2.4,6.8101214觀測24.6810-1214觀測
-200-20
時(shí)間,-時(shí)間
-400-40
「殘差「殘差
10004
5002
cD.
J00
2-4.6B.10L214觀測4.68101214^i]
-500-2???時(shí)間
-1000-4
例2.(2024?天津薊州?高三??奸_學(xué)考試)對兩個(gè)變量x,y進(jìn)行線性相關(guān)檢驗(yàn),得線性相
關(guān)系數(shù)6=0.8995,對兩個(gè)變量“,v進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)4=49568,
則下列判斷正確的是()
A.變量x與y正相關(guān),變量〃與v負(fù)相關(guān),變量x與y的線性相關(guān)性較強(qiáng)
B.變量x與y負(fù)相關(guān),變量〃與V正相關(guān),變量X與〉的線性相關(guān)性較強(qiáng)
C.變量x與y正相關(guān),變量a與v負(fù)相關(guān),變量a與v的線性相關(guān)性較強(qiáng)
D.變量x與y負(fù)相關(guān),變量a與v正相關(guān),變量比與v的線性相關(guān)性較強(qiáng)
例3.(2024?寧夏吳忠?高三鹽池高級中學(xué)??茧A段練習(xí))在如圖所示的散點(diǎn)圖中,若去掉
點(diǎn)尸,則下列說法正確的是()
??
..P
*
------------------------------------>
OX
A.樣本相關(guān)系數(shù)「變大
B.變量x與變量》的相關(guān)程度變?nèi)?/p>
C.變量x與變量y呈正相關(guān)
D.變量X與變量,的相關(guān)程度變強(qiáng)
變式1.(2024.四川成都.高三統(tǒng)考階段練習(xí))已知建筑地基沉降預(yù)測對于保證施工安全,
實(shí)現(xiàn)信息化監(jiān)控有著重要意義.某工程師建立了四個(gè)函數(shù)模型來模擬建筑地基沉降隨時(shí)間
的變化趨勢,并用相關(guān)指數(shù)、誤差平方和、均方根值三個(gè)指標(biāo)來衡量擬合效果.相關(guān)指數(shù)
越接近1表明模型的擬合效果越好,誤差平方和越小表明誤差越小,均方根值越小越
好.依此判斷下面指標(biāo)對應(yīng)的模型擬合效果最好的是()
A.
相關(guān)指數(shù)誤差平方和均方根值
0.9498.4910.499
B.
相關(guān)指數(shù)誤差平方和均方根值
0.9334.1790.436
C.
相關(guān)指數(shù)誤差平方和均方根值
0.9971.7010.141
D.
相關(guān)指數(shù)誤差平方和均方根值
0.9972.8990.326
變式2.(2024?高三課時(shí)練習(xí))甲、乙、丙、丁四位同學(xué)各自對,A,8兩變量的線性相關(guān)
性做試驗(yàn),并用回歸分析方法分別求得相關(guān)系數(shù)r與殘差平方和根如下表:
甲乙丙T
r0.820.780.690.85
m106115124103
則能體現(xiàn)4B兩變量有更強(qiáng)的線性相關(guān)性的是()
A.甲B.乙C.丙D.丁
變式3.(2024.河北石家莊.統(tǒng)考三模)觀察下列四幅殘差圖,滿足一元線性回歸模型中對
隨機(jī)誤差的假定的是()
“殘差
100-
-100-----1-----1-----1-----1-----1---->
020406080100觀測時(shí)間
B.
力殘差
4■
2
-40100200300400500600700800900IODO*
觀測時(shí)間
£殘差
1500
1000
500
C.0
-500
-1000
-1500
020406080100觀測時(shí)間
。殘差
200
150
100
50
-50
-100
-150
?2001...........................................——>
0102030405060708090100觀測時(shí)間
變式4.(2024?全國?高三專題練習(xí))甲、乙、丙、丁四位同學(xué)分別對一組變量進(jìn)行線性相
關(guān)試驗(yàn),并分別計(jì)算出相關(guān)系數(shù)小則線性相關(guān)程度最高的是()
甲乙丙T
r0.870.910.580.83
A.甲B.乙C.丙D.T
變式5.(2024.全國?高三專題練習(xí))給出下列有關(guān)線性回歸分析的四個(gè)命題:
①線性回歸直線未必過樣本數(shù)據(jù)點(diǎn)的中心(食歹);
②回歸直線就是散點(diǎn)圖中經(jīng)過樣本數(shù)據(jù)點(diǎn)最多的那條直線;
③當(dāng)相關(guān)系數(shù)廠>0時(shí),兩個(gè)變量正相關(guān);
④如果兩個(gè)變量的相關(guān)性越強(qiáng),則相關(guān)系數(shù)r就越接近于1.
其中真命題的個(gè)數(shù)為()
A.1B.2C.3D.4
【解題方法總結(jié)】
判定兩個(gè)變量相關(guān)性的方法
(1)畫散點(diǎn)圖:點(diǎn)的分布從左下角到右上角,兩個(gè)變量正相關(guān);點(diǎn)的分布從左上角到
右下角,兩個(gè)變量負(fù)相關(guān).
(2)樣本相關(guān)系數(shù):當(dāng)r>0時(shí),正相關(guān);當(dāng)r<0時(shí),負(fù)相關(guān);川越接近于1,相關(guān)性越
強(qiáng).
(3)經(jīng)驗(yàn)回歸方程:當(dāng)石>0時(shí),正相關(guān);當(dāng),<0時(shí),負(fù)相關(guān).
題型二:一元線性回歸模型
例4.(2024?天津薊州?高三??奸_學(xué)考試)為研究某種細(xì)菌在特定環(huán)境下,隨時(shí)間變化的
繁殖情況,得到如下實(shí)驗(yàn)數(shù)據(jù):
天數(shù)x(天)3456
繁殖個(gè)數(shù)y(千個(gè))2.5344.5
由最小二乘法得y與x的線性回歸方程為y=Q7x+a,則當(dāng)x=7時(shí),繁殖個(gè)數(shù)y的預(yù)測值
為()
A.4.9B.5.25C.5.95D.6.15
例5.(2024?湖南長沙?高三長郡中學(xué)校聯(lián)考階段練習(xí))某社區(qū)為了豐富退休人員的業(yè)余文
化生活,自2018年以來,始終堅(jiān)持開展“悅讀小屋讀書活動(dòng)”.下表是對2018年以來近5年
該社區(qū)退休人員的年人均借閱量的數(shù)據(jù)統(tǒng)計(jì):
年份20182019202020212022
年份代碼X12345
年人均借閱量y(冊)%%162228
(參考數(shù)據(jù):£*=90)通過分析散點(diǎn)圖的特征后,年人均借閱量》關(guān)于年份代碼x的回
1=1
歸分析模型為y=5x+機(jī),則2024年的年人均借閱量約為()
A.31B.32C.33D.34
例6.(2024?遼寧?遼寧實(shí)驗(yàn)中學(xué)校考模擬預(yù)測)已知x,y的對應(yīng)值如下表所示:
X02468
y1m+l2m+l3m+311
若y與x線性相關(guān),且回歸直線方程為y=L6x+0.6,則()
A.2B.3C.4D.5
變式6.(2024?廣西南寧?南寧二中校聯(lián)考模擬預(yù)測)某單位在當(dāng)?shù)囟c(diǎn)幫扶某村種植一種
草莓,并把這種原本露天種植的草莓搬到了大棚里,獲得了很好的經(jīng)濟(jì)效益.根據(jù)資料顯
示,產(chǎn)出的草莓的箱數(shù)無(單位:箱)與成本y(單位:千元)的關(guān)系如下:
X102030406080
y%%為%%%
(1)根據(jù)散點(diǎn)圖可以認(rèn)為x與y之間存在線性相關(guān)關(guān)系,請用最小二乘法求出線性回歸方程
y=bx+a(a,g用分?jǐn)?shù)表示)
(2)某農(nóng)戶種植的草莓主要以300元/箱的價(jià)格給當(dāng)?shù)卮笮蜕坛┴?,多余的草莓全部?00
元/箱的價(jià)格銷售給當(dāng)?shù)匦∩特?據(jù)統(tǒng)計(jì),往年1月份當(dāng)?shù)卮笮蜕坛葺男枨罅繛?0
箱、100箱、150箱、200箱的概率分別為木,I-根據(jù)回歸方程以及往年商超草
莓的需求情況進(jìn)行預(yù)測,求今年1月份農(nóng)戶草莓的種植量為200箱時(shí)所獲得的利潤情
況.(最后結(jié)果精確到個(gè)位)
66
附:Z(x,-可(%-刃=790,2%=54,在線性回歸直線方程£=嬴+&中
Z=11=1
,ta-?。▂-歹)
b=--------,a=y-bx.
Z=1
變式7.(2024.江西?高三統(tǒng)考開學(xué)考試)某新能源汽車銷售部對今年1月至7月的銷售量
進(jìn)行統(tǒng)計(jì)與分析,因不慎丟失一些數(shù)據(jù),現(xiàn)整理出如下統(tǒng)計(jì)表與一些分析數(shù)據(jù):
月份1月2月3月4月5月6月7月
月份代號X1234567
銷售量y(單位:萬輛)15.6mns37.739.644.5
其中歹=31.2.
⑴若根,“,5成遞增的等差數(shù)列,求從7個(gè)月的銷售量中任取1個(gè),月銷售量不高于27
萬輛的概率;
7
⑵若Z5-才=670.48,X與〉的樣本相關(guān)系數(shù)r=0.99,求V關(guān)于x的線性回歸方程
Z=1
y=bx+a,并預(yù)測今年8月份的銷售量(3精確到0.1).
-磯y-y)
附:相關(guān)系數(shù)廠=I「〃線性回歸方程5>=嬴+0中斜率和截距的最小二
歸"4(…『
V1=1i=i
乘估計(jì)公式分別為5=a=y—bx.
參考數(shù)據(jù):2.65,,670.48125.89.
變式8.(2024?四川成都?高三石室中學(xué)??奸_學(xué)考試)已知某綠豆新品種發(fā)芽的適宜溫度
在6℃~22℃之間,一農(nóng)學(xué)實(shí)驗(yàn)室研究人員為研究溫度無(C)與綠豆新品種發(fā)芽數(shù)y
(顆)之間的關(guān)系,每組選取了成熟種子50顆,分別在對應(yīng)的8℃~14℃的溫度環(huán)境下進(jìn)
行實(shí)驗(yàn),得到如下散點(diǎn)圖:
35
30
25
20
15
10
5
°789101112131415x
_7__7_
其中y=24,X(%-x)(y-y)=70,X"7)2=176.
i=l?=1
(1)運(yùn)用相關(guān)系數(shù)進(jìn)行分析說明,是否可以用線性回歸模型擬合y與x的關(guān)系?
(2)求出y關(guān)于X的線性回歸方程,=院+機(jī)并預(yù)測在19℃的溫度下,種子的發(fā)芽的顆數(shù).
參考公式:相關(guān)系數(shù)」=I「_)_,回歸直線方程恒%+3其中
(苦-
Vi=li=l
n__
X(x,-x)(%-y)___
b=-------z——,B=7-/.參考數(shù)據(jù):V77-8.77.
2(±-X)2
4=1
變式9.(2024.安徽亳州.蒙城第一中學(xué)校聯(lián)考模擬預(yù)測)為調(diào)查某地區(qū)植被覆蓋面積無(單
位:公頃)和野生動(dòng)物數(shù)量y的關(guān)系,某研究小組將該地區(qū)等面積花分為400個(gè)區(qū)塊,從
中隨機(jī)抽取40個(gè)區(qū)塊,得到樣本數(shù)據(jù)(%,%)(i=l,2,,40),部分?jǐn)?shù)據(jù)如下:
X2.73.63.23.9
y50.663.752.154.3
40404040
經(jīng)計(jì)算得:2>=16。,?=2400,工(七-元『=160,^(x,.-x)(y;-y)=1280.
Z=1Z=1Z=1Z=1
(1)利用最小二乘估計(jì)建立y關(guān)于x的線性回歸方程;
(2)該小組又利用這組數(shù)據(jù)建立了x關(guān)于y的線性回歸方程,并把這兩條擬合直線畫在同一
坐標(biāo)系xOy下,橫坐標(biāo)無,縱坐標(biāo)y的意義與植被覆蓋面積尤和野生動(dòng)物數(shù)量y一致.設(shè)前
者與后者的斜率分別為K,k2,比較左,心的大小關(guān)系,并證明.
附:y關(guān)于尤的回歸方程y=a+灰中,斜率和截距的最小二乘估計(jì)公式分別為:
n__
Y.x.y.-nx-y^x^-nxy
5———,屋“院,i=l
,X;-nx
i=l
【解題方法總結(jié)】
求經(jīng)驗(yàn)回歸方程的步驟
甘算出工,歹,或£(x,-x)(y,-y),!
金(箝-三尸的值
__________________________________J
(步驟二H利用公式計(jì)算系數(shù)£,3
0二二二二二二二二二
題型三:非線性回歸
例7.(2024?湖南?校聯(lián)考模擬預(yù)測)若需要刻畫預(yù)報(bào)變量卬和解釋變量X的相關(guān)關(guān)系,且
從已知數(shù)據(jù)中知道預(yù)報(bào)變量w隨著解釋變量x的增大而減小,并且隨著解釋變量x的增
大,預(yù)報(bào)變量卬大致趨于一個(gè)確定的值,為擬合卬和x之間的關(guān)系,應(yīng)使用以下回歸方程
中的(6>0,e為自然對數(shù)的底數(shù))()
A.w-bx+aB.w--b]nx+aC.w=-bs/x+aD.w=be~x+a
例8.(2024?全國?高三專題練習(xí))云計(jì)算是信息技術(shù)發(fā)展的集中體現(xiàn),近年來,我國云計(jì)
算市場規(guī)模持續(xù)增長.己知某科技公司2018年至2022年云計(jì)算市場規(guī)模數(shù)據(jù),且市場規(guī)模
y與年份代碼x的關(guān)系可以用模型y=(其中e為自然對數(shù)的底數(shù))擬合,設(shè)
z=lny,得到數(shù)據(jù)統(tǒng)計(jì)表如下:
年份2018年2019年2020年2021年2022年
年份代碼X12345
云計(jì)算市場規(guī)模y/千萬元7.4112036.666.7
z=\ny22.433.64
由上表可得經(jīng)驗(yàn)回歸方程z=0.52尤+a,則2025年該科技公司云計(jì)算市場規(guī)模y的估計(jì)值
為()
A.e508B.e5-6C.e612D.e6-5
例9.(多選題)(2024?福建廈門?廈門一中校考三模)在對具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行回
歸分析時(shí),若兩個(gè)變量不呈線性相關(guān)關(guān)系,可以建立含兩個(gè)待定參數(shù)的非線性模型,并引
入中間變量將其轉(zhuǎn)化為線性關(guān)系,再利用最小二乘法進(jìn)行線性回歸分析.下列選項(xiàng)為四個(gè)同
學(xué)根據(jù)自己所得數(shù)據(jù)的散點(diǎn)圖建立的非線性模型,且散點(diǎn)圖的樣本點(diǎn)均位于第一象限,則
其中可以根據(jù)上述方法進(jìn)行回歸分析的模型有()
x+c.
2
A.y=cxx+c2xB.y=
x+c2
D.y=
C.y=cr+ln(x+c2)
變式10.(2024?全國?高三專題練習(xí))已知變量的關(guān)系可以用模型y=在""擬合,設(shè)
z=lny,其變換后得到一組數(shù)據(jù)如下.由上表可得線性回歸方程z=3x+a,貝必=()
X12345
z2451014
23
A.JB.rC.eD.e
變式IL(2024?全國?高三專題練習(xí))某校課外學(xué)習(xí)小組研究某作物種子的發(fā)芽率〉和溫度
x(單位:C)的關(guān)系,由實(shí)驗(yàn)數(shù)據(jù)得到如圖所示的散點(diǎn)圖.由此散點(diǎn)圖判斷,最適宜作為
A.y=a+bxB.y=a+bx1(b>0i)
C.y=a+bexD.y=a+b\nx
變式12.(2024?全國?高二專題練習(xí))蘭溪楊梅從5月15日起開始陸續(xù)上市,據(jù)調(diào)查統(tǒng)
計(jì),得到楊梅銷售價(jià)格(單位:0元/千克)與上市時(shí)間/(單位:天)的數(shù)據(jù)如下表所
z5:
時(shí)間〃(單位:天)102070
銷售價(jià)格Q(單位:元/千克)10050100
根據(jù)上表數(shù)據(jù),從下列函數(shù)模型中選取一個(gè)描述楊梅銷售價(jià)格。與上市時(shí)間t的變化關(guān)
系:Q=at+》,Q=a〃+"+c,Q=a-Z/,Q=a-log/.利用你選取的函數(shù)模型,在以下四個(gè)日
期中,楊梅銷售價(jià)格最低的日期為()
A.6月5日B.6月15日C.6月25日D.7月5日
變式13.(2024?四川瀘州?高三四川省瀘縣第四中學(xué)??奸_學(xué)考試)抗體藥物的研發(fā)是生物
技術(shù)制藥領(lǐng)域的一個(gè)重要組成部分,抗體藥物的攝入量與體內(nèi)抗體數(shù)量的關(guān)系成為研究抗
體藥物的一個(gè)重要方面.某研究團(tuán)隊(duì)收集了10組抗體藥物的攝入量與體內(nèi)抗體數(shù)量的數(shù)
據(jù),并對這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計(jì)量的值,抗體藥物
攝入量為x(單位:mg),體內(nèi)抗體數(shù)量為y(單位:AU/mL).
10101010
2a
Z=IZ=1i=li=i
29.2121634.4
九
12-
10-
8-
6-
4-
2-
62468101214161820222426%
(1)根據(jù)經(jīng)驗(yàn),我們選擇、=。/作為體內(nèi)抗體數(shù)量y關(guān)于抗體藥物攝入量尤的回歸方程,將
y=cx"兩邊取對數(shù),得lny=lnc+dlnx,可以看出也彳與Iny具有線性相關(guān)關(guān)系,試根據(jù)
參考數(shù)據(jù)建立》關(guān)于x的回歸方程,并預(yù)測抗體藥物攝入量為25mg時(shí),體內(nèi)抗體數(shù)量》的
值;
(2)經(jīng)技術(shù)改造后,該抗體藥物的有效率z大幅提高,經(jīng)試驗(yàn)統(tǒng)計(jì)得z服從正態(tài)分布
N:(0.48,0.032),那這種抗體藥物的有效率z超過0.54的概率約為多少?
附:①對于一組數(shù)據(jù)(4M(i=l,2,L/0),其回歸直線>=例+。的斜率和截距的最小二乘
__
z%匕一〃〃口
估計(jì)分別為萬二三------,a=v-M
-nil
i=l
②若隨機(jī)變量z~N(〃,),則有尸(〃-<Z<〃+。)Q0.6826,
PQi—2b<Z<//+2cr)?0.9544,P(ju—3cr<Zv〃+3b)?0.9974;
③取e=2.7.
變式14.(2024?江西贛州?高三??茧A段練習(xí))為了研究某種細(xì)菌隨天數(shù)x變化的繁殖個(gè)數(shù)
⑴在圖中作出繁殖個(gè)數(shù)y關(guān)于天數(shù)x變化的散點(diǎn)圖,并由散點(diǎn)圖判斷y=5x+&("花為常
數(shù))與g=c盧/(qq為常數(shù),且cpOqwO)哪一個(gè)適宜作為繁殖個(gè)數(shù)y關(guān)于天數(shù)x變
化的回歸方程類型?(給出判斷即可,不必說明理由)
(2)對于非線性回歸方程勺=°盧/為常數(shù),且6>0,°2W0),令z=lny,可以得到繁
殖個(gè)數(shù)的對數(shù)z關(guān)于天數(shù)尤具有線性關(guān)系及一些統(tǒng)計(jì)量的值.
6°66
£(七一可^(x,.-x)(z,.-z)
XyZ-可(y-刃
i=li=li=l
3.5062.833.5317.50596.5712.09
(i)證明:“對于非緝隹回歸方程亍=/W,令z=lny,可以得到繁殖個(gè)數(shù)的對數(shù)z關(guān)于
天數(shù)x具有線性關(guān)系(即2=歷+6,/,6為常數(shù))”;
(ii)根據(jù)(i)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(系數(shù)保留2位小
數(shù)).
附:對于一組數(shù)據(jù)(%,片),(4,嶺),,(““,乙),其回歸直線方程。=氏+&的斜率和截距的
£(%-萬)(匕-")
最小二乘估計(jì)分別為B=J-------------,a=v-pu.
i=l
變式15.(2024?重慶沙坪壩?高三重慶八中校考階段練習(xí))在正常生產(chǎn)條件下,根據(jù)經(jīng)驗(yàn),
可以認(rèn)為化肥的有效利用率近似服從正態(tài)分布N(0.54,0.022),而化肥施肥量因農(nóng)作物的種
類不同每畝也存在差異.
⑴假設(shè)生產(chǎn)條件正常,記X表示化肥的有效利用率,求P(XN0.56);
(2)課題組為研究每畝化肥施用量與某農(nóng)作物畝產(chǎn)量之間的關(guān)系,收集了10組數(shù)據(jù),并對
這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.其中每畝化肥施用量
為x(單位:公斤),糧食畝產(chǎn)量為?。▎挝唬喊俟铮?/p>
川
10-
8
6
4
2
1?1?????1?1?1?1
O24681012141618202224262830x
參考數(shù)據(jù):
1010101010101010
X%%儲ZxExD
Z=1Z=11=1i=\i=l1=1i=li=l
65091.552.51478.630.5151546.5
tj=Inxt,zi=Iny;(z=1,2,…,10).
⑴根據(jù)散點(diǎn)圖判斷,法與尸c/,哪一個(gè)適宜作為該農(nóng)作物畝產(chǎn)量>關(guān)于每畝化
肥施用量x的回歸方程(給出判斷即可,不必說明理由);
(ii)根據(jù)(i)的判斷結(jié)果及表中數(shù)據(jù),建立V關(guān)于x的回歸方程;并預(yù)測每畝化肥施用
量為27公斤時(shí),糧食畝產(chǎn)量V的值.(e合2.7)
附:①對于一組數(shù)據(jù)的,匕)H=1,2,3,…,?),其回歸直線/=£"+&的斜率和截距的
-riuv
最小二乘估計(jì)分別為6=W---------,&=心
-nu2
Z=1
②若隨機(jī)變量XN("),貝—b<Xv〃+b)p0.6827,
—2b<X<ju+2b)?0.9545.
變式16.(2024.重慶.高三校聯(lián)考開學(xué)考試)某公司為了解年研發(fā)資金投入量x(單位:億
元)對年銷售額y(單位:億元)的影響.對公司近12年的年研發(fā)資金投入量羽?和年銷售額
yi的數(shù)據(jù),進(jìn)行了對比分析,建立了兩個(gè)模型:①>=&+//,②R=e疝",其中。,}
九f均為常數(shù),e為自然對數(shù)的底數(shù),并得到一些統(tǒng)計(jì)量的值.令
%=啟、=lny,(z,=l,2,3,…,12),經(jīng)計(jì)算得如下數(shù)據(jù):
12c*…)2
X£(XT)uV
Z=1i=l
20667724604.20
七ITZ(蒼-x)(匕-v)
Z=1Z=1
312502153.0814
(1)請從相關(guān)系數(shù)的角度,分析哪一個(gè)模型擬合程度更好?
(2)(i)根據(jù)分析及表中數(shù)據(jù),建立了關(guān)于x的回歸方程;
(ii)若下一年銷售額y需達(dá)到90億元,預(yù)測下一年的研發(fā)資金投入量尤是多少億元?
附:①相關(guān)系數(shù)丫=I「1t,回歸直$=4+%中公式分別為
Jxa--)2X(y.-y)2
Vi=li=l
nn__
^(x;-x)(j,.-y)£x^-nx-y
②參考數(shù)據(jù):308=4x77,790?9.4868,e44998?90.
變式17.(2024?江蘇鎮(zhèn)江?江蘇省鎮(zhèn)江中學(xué)??既?經(jīng)觀測,長江中某魚類的產(chǎn)卵數(shù)V與
溫度x有關(guān),現(xiàn)將收集到的溫度占和產(chǎn)卵數(shù)%1=1,2,,10)的10組觀測數(shù)據(jù)作了初步處
理,得到如圖的散點(diǎn)圖及一些統(tǒng)計(jì)量表.
1010101010
口z%£(占-可
Z=11=1Z=1i=\Z=1
36054.5136044384
10c101010
Z(—)一目(—)(y-歹)£(&-元)(%-歹)
Z=1i=\i=lZ=1
3588326430
[10
表中4=6,z,=ln%,7=6Zz,.
1Uj=i
九
350-
300-
250-
200-
150-
100-
50-
1tl?????.
°202224262830323436x
(1)根據(jù)散點(diǎn)圖判斷,y=a+bx,y=n+my[x與y=qe。"哪一個(gè)適宜作為V與x之間的回歸方
程模型并求出》關(guān)于x回歸方程;(給出判斷即可,不必說明理由)
(2)某興趣小組抽取兩批魚卵,已知第一批中共有6個(gè)魚卵,其中“死卵”有2個(gè);第二批中
共有8個(gè)魚卵,其中“死卵”有3個(gè).現(xiàn)隨機(jī)挑選一批,然后從該批次中隨機(jī)取出2個(gè)魚
卵,求取出“死卵”個(gè)數(shù)的分布列及數(shù)學(xué)期望.
附:對于一組數(shù)據(jù)(%,%),(%,匕),(%/“),其回歸直線v=e+例的斜率和截距的最小二
'(%-江)(匕一#)
乘估計(jì)分別為夕=J=1------------,a=v-jBu.
L/—\2
Z=1
變式18.(2024?廣西南寧?南寧三中??家荒?數(shù)據(jù)顯示中國車載音樂已步入快速發(fā)展期,
隨著車載音樂的商業(yè)化模式進(jìn)一步完善,市場將持續(xù)擴(kuò)大,下表為2018—2022年中國車載
音樂市場規(guī)模(單位:十億元),其中年份2018—2022對應(yīng)的代碼分別為1-5.
年份代碼x
車載音樂市場規(guī)模了2.83.97.312.017.0
(1)由上表數(shù)據(jù)知,可用指數(shù)函數(shù)模型、=。力,擬合>與x的關(guān)系,請建立y關(guān)于x的回歸方
程;
(2)根據(jù)上述數(shù)據(jù)求得y關(guān)于X的回歸方程后,預(yù)測2024年的中國車載音樂市場規(guī)模.
參考數(shù)據(jù):
5
e°$24e°4727
V1.6
i=l
1.9433.821.71.626.84
_I5
其中匕=In%,v=-2,v,.
3z=i
參考公式:對于一組數(shù)據(jù)(%,匕),(%,%),L,(〃/“)其回歸直線y=a+m,的斜率和截
-nU'V
距的最小二乘法估計(jì)公式分別為P=――
_2,a=v-/3u?
-nu
Z=1
變式19.(2024.安徽合肥?合肥市第八中學(xué)??寄M預(yù)測)當(dāng)前移動(dòng)網(wǎng)絡(luò)已融入社會生活的
方方面面,深刻改變了人們的溝通、交流乃至整個(gè)生活方式4G網(wǎng)絡(luò)雖然解決了人與人隨時(shí)
隨地通信的問題,但隨著移動(dòng)互聯(lián)網(wǎng)快速發(fā)展,其已難以滿足未來移動(dòng)數(shù)據(jù)流量暴漲的需
求,而5G作為一種新型移動(dòng)通信網(wǎng)絡(luò),不但可以解決人與人的通信問題,而且還可以為
用戶提供增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)、超高清(3。)視頻等更加身臨其境的極致業(yè)務(wù)體驗(yàn),更重要
的是還可以解決人與物、物與物的通信問題,從而滿足移動(dòng)醫(yī)療、車聯(lián)網(wǎng)、智能家居、工業(yè)控
制、環(huán)境監(jiān)測等物聯(lián)網(wǎng)應(yīng)用需求,為更好的滿足消費(fèi)者對5G網(wǎng)絡(luò)的需求,中國電信在某地
區(qū)推出了六款不同價(jià)位的流量套餐,每款套餐的月資費(fèi)尤(單位:元)與購買人數(shù)y(單
位:萬人)的數(shù)據(jù)如下表:
套餐ABCDEF
月資費(fèi)X(元)384858687888
購買人數(shù)y(萬人)16.818.820.722.424.025.5
對數(shù)據(jù)作初步的處理,相關(guān)統(tǒng)計(jì)量的值如下表:
6666
i=li=li=li=l
75.324.618.3101.4
其中匕=1叫g(shù)=lny,且繪圖發(fā)現(xiàn),散點(diǎn)(”,外)(區(qū)注6)集中在一條直線附近.
(1)根據(jù)所給數(shù)據(jù),求出y關(guān)于x的回歸方程;
⑵已知流量套餐受關(guān)注度通過指標(biāo)T(x)=土受來測定,當(dāng)T(x”俘,翼時(shí)相應(yīng)的流量
套餐受大眾的歡迎程度更高,被指定為“主打套餐”.現(xiàn)有一家四口從這六款套餐中,購買不
同的四款各自使用.記四人中使用“主打套督”的人數(shù)為X,求隨機(jī)變量X的分布列和期望.
附:對于一組數(shù)據(jù)(匕⑼?…,(匕,④),其回歸方程0=加+口的斜率和截距的最小
n
Z(匕-"),(啰i一5)
二乘估計(jì)值分別為另=—............,a=ai-bv
石(匕-于
Z=1
【解題方法總結(jié)】
換元法變成一元線性回歸模型
題型四:列聯(lián)表與獨(dú)立性檢驗(yàn)
例10.(2024.廣東佛山.華南師大附中南海實(shí)驗(yàn)高中??寄M預(yù)測)四川省將從2022年秋
季入學(xué)的高一年級學(xué)生開始實(shí)行高考綜合改革,高考采用“3+1+2”模式,其中“1”為首選科
目,即物理與歷史二選一.某校為了解學(xué)生的首選意愿,對部分高一學(xué)生進(jìn)行了抽樣調(diào)查,
制作出如下兩個(gè)等高條形圖,根據(jù)條形圖信息,下列結(jié)論正確的是()
聞2
A.樣本中選擇物理意愿的男生人數(shù)少于選擇歷史意愿的女生人數(shù)
B.樣本中女生選擇歷史意愿的人數(shù)多于男生選擇歷史意愿的人數(shù)
C.樣本中選擇物理學(xué)科的人數(shù)較多
D.樣本中男生人數(shù)少于女生人數(shù)
例11.(2024?全國?高三專題練習(xí))在新高考改革中,浙江省新高考實(shí)行的是7選3的3+3
模式,即語數(shù)外三門為必考科目,然后從物理、化學(xué)、生物、政治、歷史、地理、技術(shù)
(含信息技術(shù)和通用技術(shù))7門課中選考3門.某校高二學(xué)生選課情況如下列聯(lián)表一和列聯(lián)
表二(單位:人)
選物理不選物理總計(jì)
男生340110450
女生140210350
總計(jì)480320800
表一
選生物不選生物總計(jì)
男生150300450
女生150200350
總計(jì)300500800
表二
試根據(jù)小概率值a=0.005的獨(dú)立性檢驗(yàn),分析物理和生物選課與性別是否有關(guān)()
2
|7/42n(ad-bc)7
PIT:Y----------------------n=a+b+c+d.a=P
(a+b)(c+d)(Q+C)(b+d)I
a0.150.100.050.0250.010.0050.001
Xa2.0722.7063.8415.0246.6357.87910.828
A.選物理與性別有關(guān),選生物與性別有關(guān)
B.選物理與性別無關(guān),選生物與性別有關(guān)
C.選物理與性別有關(guān),選生物與性別無關(guān)
D.選物理與性別無關(guān),選生物與性別無關(guān)
例12.(2024.全國?高三專題練習(xí))通過隨機(jī)詢問相同數(shù)量的不同性別大學(xué)生在購買食物時(shí)
是否看營養(yǎng)說明,得知有士的男大學(xué)生“不看”,有:的女大學(xué)生“不看”,若有99%的把握
63
認(rèn)為性別與是否看營養(yǎng)說明之間有關(guān),則調(diào)查的總?cè)藬?shù)可能為()
A.150B.170C.240D.175
變式20.(2024?全國?高三專題練習(xí))針對時(shí)下的“短視頻熱”,某高校團(tuán)委對學(xué)生性別和喜
歡短視頻是否有關(guān)聯(lián)進(jìn)行了一次調(diào)查,其中被調(diào)查的男生、女生人數(shù)均為5根(根€1<)人,
男生中喜歡短視頻的人數(shù)占男生人數(shù)的,4,女生中喜歡短視頻的人數(shù)占女生人數(shù)的3:零假
設(shè)為HQ:喜歡短視頻和性別相互獨(dú)立.若依據(jù)a=0.05的獨(dú)立性檢驗(yàn)認(rèn)為喜歡短視頻和性別
不獨(dú)立,則機(jī)的最小值為()
附:―取"/產(chǎn)打八附表
[a+b)[c+a)[a+c)[b+a)
a0.050.01
Xa3.8416.635
A.7B.8C.9D.1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 租賃廠房合同協(xié)議
- 招標(biāo)文件評審的實(shí)踐操作與評審標(biāo)準(zhǔn)
- 家庭護(hù)理家政工雇傭合同
- 土地居間合作合同書
- 現(xiàn)金贖樓服務(wù)合同還款還款監(jiān)管政策
- 借款保證協(xié)議模板
- 個(gè)人社會救助借款合同范本
- 河砂礫石采購協(xié)議
- 林業(yè)采伐合作合同
- 抗洪項(xiàng)目論證招標(biāo)
- 電力行業(yè)電力調(diào)度培訓(xùn)
- 生態(tài)安全與國家安全
- 全力以赴備戰(zhàn)期末-2024-2025學(xué)年上學(xué)期備戰(zhàn)期末考試主題班會課件
- 2024年保密協(xié)議書(政府機(jī)關(guān))3篇
- 《視頻拍攝與制作:短視頻?商品視頻?直播視頻(第2版)》-課程標(biāo)準(zhǔn)
- 研發(fā)部年終總結(jié)和規(guī)劃
- 石油開采技術(shù)服務(wù)支持合同
- 山東省煙臺市2024屆高三上學(xué)期期末考試英語試題 含解析
- 公司戰(zhàn)略與風(fēng)險(xiǎn)管理戰(zhàn)略實(shí)施
- 2024年-2025年《農(nóng)作物生產(chǎn)技術(shù)》綜合知識考試題庫及答案
- 廣東省廣州市白云區(qū)2022-2023學(xué)年八年級上學(xué)期物理期末試卷(含答案)
評論
0/150
提交評論