版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
專題12.6成對數(shù)據(jù)的相關(guān)關(guān)系
1.變量的相關(guān)關(guān)系
⑴相關(guān)關(guān)系:兩個變量有關(guān)系,但又沒有確切到可由其中一個去精確地決定另一個的程度,這種關(guān)系稱為相
關(guān)關(guān)系.
注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,而且
函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.
⑵線性相關(guān)、非線性相關(guān)
①線性相關(guān):一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點落在一條直線附近,我們就稱這
兩個變量線性相關(guān).
②非線性相關(guān):一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相關(guān)
或曲線相關(guān).
⑶散點圖
將樣本中的幾個數(shù)據(jù)點(肛%)(i=1,2,…必)描在平面直角坐標(biāo)系中,所得圖形叫做散點圖.根據(jù)散點圖中點
的分布可以直觀地判斷兩個變量之間的關(guān)系.
①如果散點圖中的點散布在從左下角到右上角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為正
相關(guān),如圖(1)所示;
②如果散點圖中的點散布在從左上角到右下角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為負(fù)
相關(guān),如圖(2)所示.
①將收集到的兩個變量的統(tǒng)計數(shù)據(jù)分別作為橫、縱坐標(biāo),在直角坐標(biāo)系中描點,這樣得到的圖叫作散點圖;
②散點圖具有直觀簡明的特點,可以根據(jù)散點圖判斷兩個變量有沒有相關(guān)關(guān)系.
⑷正相關(guān)、負(fù)相關(guān)
①正相關(guān):從整體上看,當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)增加的趨勢,我們就稱這兩個
變量正相關(guān);
②負(fù)相關(guān):從整體上看,如果當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)減小的趨勢,則稱這兩個變
量負(fù)相關(guān).
2.樣本相關(guān)系數(shù)
⑴相關(guān)系數(shù)r的計算
變量x與變量y的樣本相關(guān)系數(shù)r的計算公式如下:r=,?屋8')(%一歹).
出匕(4-/)2位乙(九一7)2
⑵相關(guān)系數(shù)r的性質(zhì)
①當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);
當(dāng)r<0時,稱成對樣本數(shù)據(jù)負(fù)相關(guān);
當(dāng)r=0時,成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.
②樣本相關(guān)系數(shù)r的取值范圍為[-1,1],當(dāng)|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強;當(dāng)|r|越接近
0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.
3.一元線性回歸模型
⑴經(jīng)驗回歸方程
我們將9=5久+a稱為丫關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回
歸直線,其中
t_鄧=1(XL五)3-y)_E乙符%-n型
■=i(%-冗AXjtix^-nx2.
a—y—bx
⑵利用決定系數(shù)R2刻畫回歸效果
R2=1_宏呼L露R2越大,即擬合效果越好,R2越小,模型擬合效果越差.
⑶一元線性回歸模型參數(shù)的最小二乘估計
①經(jīng)驗回歸方程:如果散點圖中點的分布從整體上大致在一條直線附近,就稱這兩個變量之間具有線性相
關(guān)關(guān)系,我們把這條直線稱為經(jīng)驗回歸直線(回歸直線),借助最小二乘法得到的直線方程,=bx+a稱為經(jīng)
驗回歸方程(線性回歸方程).
②經(jīng)驗回歸方程的性質(zhì)
i.經(jīng)驗回歸直線一定過點(工,);
ii.y與x正相關(guān)的充要條件是的分>0;y與x負(fù)相關(guān)的充要條件是石<0;
iii.當(dāng)%增大一個單位時,9增大石個單位,這就是回歸系數(shù)B的實際意義.
4.列聯(lián)表與獨立性檢驗
(1)2x2列聯(lián)表
如圖,給出成對分類變量數(shù)據(jù)的交叉分類頻數(shù)的數(shù)據(jù)統(tǒng)計表稱為2x2列聯(lián)表.
XY合計
Y=0Y=1
x=0aba+b
X=1cdc+d
合計a+cb+dn=a+b+c+d
(2)獨立性檢驗
2
①依據(jù)上述2x2列聯(lián)表構(gòu)造統(tǒng)計量X?nQad-bc)
(a+b)(c+d)(a+c)(b+d)'
忽略乂2的實際分布與該近似分布的誤差后,對于任何小概率值a,可以找到相應(yīng)的正實數(shù)%,
使得P(x2>%)=a成立.我們稱為為a的臨界值,這個臨界值就可作為判斷X?大小的標(biāo)準(zhǔn).
②基于小概率值a的檢驗規(guī)則是:
當(dāng)乂22/時,我們就推斷/不成立,即認(rèn)為X和丫不獨立,該推斷犯錯誤的概率不超過a;
當(dāng)乂2<%時,我們沒有充分證據(jù)推斷為不成立,可以認(rèn)為X和丫獨立.
這種利用X?的取值推斷分類變量X和丫是否獨立的方法稱為乂2獨立性檢驗,讀作“卡方獨立性檢驗”,簡
稱獨立性檢驗.
下表給出了X2獨立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值
a
Xa
【重要結(jié)論】
1.線性回歸直線一定經(jīng)過樣本點的中心@歹),據(jù)此性質(zhì)可以解決有關(guān)的計算問題、判斷結(jié)論的正確性.
y值,僅是一個預(yù)報值,不是真實發(fā)生的值.
X?的值可以判斷兩個分類變量有關(guān)的可信程度,若X?越大,則兩分類變量有關(guān)的把握越大.
L【人教A版選擇性必修三習(xí)題8.2第1題P120】如果發(fā)現(xiàn)散點圖中所有的樣本點都落在一條斜率為非
0實數(shù)的直線上,則下列說法錯誤的是()
A.解釋變量和預(yù)報變量是一次函數(shù)關(guān)系B.決定系數(shù)#=1
C.殘差平方和為0D.相關(guān)系數(shù)r=1
2.【人教A版選擇性必修一習(xí)題8.3第5題P135】為了研究高三年級學(xué)生的性別和身高是否大于170cm
的關(guān)聯(lián)性,同學(xué)甲調(diào)查了某中學(xué)高三年級所有學(xué)生,整理得到列聯(lián)表1,同學(xué)乙從該校高三學(xué)生中獲取容
量為40的有放回簡單隨機樣本,由樣本數(shù)據(jù)整理得到列聯(lián)表2.
表1單位:人
身高
性別合計
<170crr>1705
女811697
男2875103
合計10991200
表2單位:人
身高
性別合計
<170cn>170cn
女15621
男91019
合計241640
(1)利用表1,通過比較不低于170cM的學(xué)生在女生和男生中的比率,判斷該中學(xué)高三年級學(xué)生的性別和
身高是否有關(guān)聯(lián),如果有關(guān)聯(lián),請解釋它們之間如何相互影響;
(II)利用表2,依據(jù)a=0.05的獨立性檢驗,推斷該中學(xué)高三年級學(xué)生的性別和身高是否有關(guān)聯(lián),并解釋
所得結(jié)論的實際含義:
(Ill)以上兩種方法得出的結(jié)論是否一致?如果不一致,你認(rèn)為哪種方法得出的結(jié)論準(zhǔn)確,原因是什么?
(X2=(a+b)(c+d)(a+c)(b+d),n=a+b+c+d)
P(x2>fco)0.1500.1000.0500.0250.010
2.0722.7063.8415.0246.635
考點一成對數(shù)據(jù)相關(guān)性與相關(guān)系數(shù)
【方法儲備】
判斷數(shù)據(jù)相關(guān)關(guān)系的方法:
1函數(shù)曲線的附近,變量之間就有相關(guān)關(guān)系.
2.樣本相關(guān)系數(shù)法:若|r|的值越接近于1,說明變量之間的線性相關(guān)程度越高;當(dāng)尸>0時,稱成對樣本數(shù)據(jù)
正相關(guān);當(dāng)廠<0時,稱成對樣本數(shù)據(jù)負(fù)相關(guān).
3.經(jīng)驗回歸方程法:在經(jīng)驗回歸方程中,當(dāng)時,正相關(guān);當(dāng)務(wù)<0時,負(fù)相關(guān).
【典例精講】
例1.(2023?天津市真題)調(diào)查某種群花萼長度和花瓣長度,所得數(shù)據(jù)如圖所示,其中相關(guān)系數(shù)r=0.8245,
下列說法正確的是()
A.花瓣長度和花萼長度沒有相關(guān)性
B.花瓣長度和花萼長度呈現(xiàn)負(fù)相關(guān)
C.花瓣長度和花萼長度呈現(xiàn)正相關(guān)
D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.8245
例2.(2023?浙江省溫州市月考)中國茶文化博大精深,茶水的口感與茶葉類型和水的溫度有關(guān)為了建立
茶水溫度y隨時間久變化的函數(shù)模型,小明每隔1分鐘測量一次茶水溫度,得到若干組數(shù)據(jù)(%,乃),(冷)2),
…,(馬,%),繪制了如圖所示的散點圖.小明選擇了如下2個函數(shù)模型來擬合茶水溫度y隨時間x的變化情
況,函數(shù)模型一:y=人久+b(k<0,%20);函數(shù)模型二:y=kax+b(J<>0,0<a<l,x>0),下列說法正
確的是()
90-
8C-?
■
70-??.
Lilt1.
°I2345x
①變量y與久具有負(fù)的相關(guān)關(guān)系
②由于水溫開始降得快,后面降得慢,最后趨于平緩,因此模型二能更好的擬合茶水溫度隨時間的變化情
況
③若選擇函數(shù)模型二,利用最小二乘法求得到y(tǒng)=叱+b的圖象一定經(jīng)過點(元,歹)
④當(dāng)x=5時,通過函數(shù)模型二計算得y=65.1,用溫度計測得實際茶水溫度為65.2,則殘差為0.1
A.②③④B.①②④C.①③④D.①②③
【拓展提升】
練11(2023?廣東省揭陽市月考)在由一組樣本數(shù)據(jù)(久口為),(x2,y2),(xn,yn)(?i22,%i,%2,...,xn不全相
等)的點所構(gòu)成的散點圖中,若所有樣本點(4%)(i=L2,…,⑶都在直線y=-2x+l上,則這組樣本數(shù)據(jù)
中變量%,y的相關(guān)系數(shù)為()
A.-2B.-1C.1D.2
練12(2023?浙江省寧波市模擬)(多選)根據(jù)某地3月5日到3月15日的每天最高氣溫與最低氣溫數(shù)
A.5號到11號的最低氣溫與日期之間呈線性相關(guān)關(guān)系且為正相關(guān)
B.9號的最高氣溫與最低氣溫的差值最大
C.最高氣溫的眾數(shù)為2TC
D.5號到15號的最低氣溫的極差比最高氣溫的極差大
考點二一元線性回歸模型及其應(yīng)用
【方法儲備】
1.求線性回歸萬程的步驟:
⑴利用散點圖或進行相關(guān)性檢驗判定兩個變量具有線性相關(guān)關(guān)系;
⑵列表求出Q著々%;
⑶利用相應(yīng)公式計算
⑷寫出線性回歸方程.
⑸經(jīng)驗回歸方程的擬合效果,可以利用相關(guān)系數(shù)|r|判斷,當(dāng)|r|R2判斷,爐越大,擬合效果越好.
2.利用回歸方程可以進行預(yù)測和估計總體,回歸方程將部分觀測值所反映的規(guī)律進行延伸,是我們對有線
性相關(guān)關(guān)系的兩個變量進行分析和控制、依據(jù)自變量的取值估計和預(yù)報因變量值的基礎(chǔ)和依據(jù).
3.非線性經(jīng)驗回歸方程轉(zhuǎn)化為線性經(jīng)驗回歸方程的方法
如:①若9-a+byfx,設(shè)t=y/x,則夕—a+bt;②若滿足對數(shù)式:y-a+blnx,設(shè)t=Inx,則產(chǎn)—a+bt;
C1X
③若滿足指數(shù)式:y=cre,兩邊取對數(shù)解Iny=Inq+設(shè)z=lny,a=lnq,b=c2,貝!Jz=a+bx.
【典例精講】
例3.(2023?湖南省長沙市模擬)若需要刻畫預(yù)報變量w和解釋變量x的相關(guān)關(guān)系,且從已知數(shù)據(jù)中知道
預(yù)報變量w隨著解釋變量久的增大而減小,并且隨著解釋變量x的增大,預(yù)報變量w大致趨于一個確定
的值,為擬合w和x之間的關(guān)系,應(yīng)使用以下回歸方程中的(b>0,e為自然對數(shù)的底數(shù))()
A.w=bx+aB.w=—b\nx+aC.w=—by/~x+aD.iv=be~x+a
例4.(2023?江蘇省無錫市月考)新能源汽車作為戰(zhàn)略性新興產(chǎn)業(yè),代表汽車產(chǎn)業(yè)的發(fā)展方向.發(fā)展新能
源汽車,對改善能源消費結(jié)構(gòu)、減少空氣污染、推動汽車產(chǎn)業(yè)和交通運輸行業(yè)轉(zhuǎn)型升級具有積極意義.經(jīng)
過十多年的精心培育,我國新能源汽車產(chǎn)業(yè)取得了顯著成績,產(chǎn)銷量連續(xù)四年全球第一,保有量居全球首
位.
(1)已知某公司生產(chǎn)的新能源汽車電池的使用壽命家單位:萬公里)服從正態(tài)分布N(60,16),問:該公司每
月生產(chǎn)的2萬塊電池中,大約有多少塊電池的使用壽命可以超過68萬公里?
參考數(shù)據(jù):若隨機變量己?則p(〃一彳=0.683,^</Z+2CT)?0.955,
PQi—3<J<^</z+3c)x0.997.
(2)下表給出了我國2017?2021年新能源汽車保有量y(單位:萬輛)的數(shù)據(jù).
年份20172018201920202021
年份代碼X12345
新能源汽車保有量y153260381492784
經(jīng)計算,變量x與y的樣本相關(guān)系數(shù)勺笈0.946,變量/與y的樣本相關(guān)系數(shù)寶=0985.
①試判斷9-bx+a與y=bx2+a哪一個更適合作為y與比之間的回歸方程模型?
②根據(jù)①的判斷結(jié)果,求出y關(guān)于x的回歸方程(精確到0.1),并預(yù)測2023年我國新能源汽車保有量.
參考數(shù)據(jù):令力=青0=1,234,5),計算得歹=414,%%%=7704,£著為%=32094,建著號=979.
參考公式:在回歸方程產(chǎn)=亂+a中,務(wù)==丁,a=y-bt.
【拓展提升】
練21(2023?江西省南昌市模擬)(多選)某同學(xué)用搜集到的六組數(shù)據(jù)(如%)(i=1,2,…,6)繪制了如下散點
圖,在這六個點中去掉B點后重新進行回歸分析,則下列說法正確的是()
Bf
一
0X
A.殘差平方和變小B.相關(guān)系數(shù)r的絕對值越趨于1
C.決定系數(shù)W變小D.解釋變量%與預(yù)報變量y相關(guān)性變?nèi)?/p>
練22(2023?黑龍江省哈爾濱市模擬)碳中和是指國家、企業(yè)、產(chǎn)品、活動或個人在一定時間內(nèi)直接或間
接產(chǎn)生的二氧化碳或溫室氣體排放總量,通過植樹造林、節(jié)能減排等形式,以抵消自身產(chǎn)生的二氧化碳或
溫室氣體排放量,實現(xiàn)正負(fù)抵消,達(dá)到相對“零排放,”2020年9月22日,中國政府在第七十五屆聯(lián)合
國大會上提出:“中國將提高國家自主貢獻(xiàn)力度,采取更加有力的政策和措施,二氧化碳排放力爭于2030
年前達(dá)到峰值,努力爭取2060年前實現(xiàn)碳中和.”某工廠響應(yīng)國家號召,隨著對工業(yè)廢氣進行處理新技
術(shù)不斷升級,最近半年二氧化碳排放量逐月遞減,具體數(shù)據(jù)如下表:
月份序號也)123456
碳排放量Pi(噸)1007050352520
并計算得弓=91,EtilnPi-73.1,£:=Jnpi=22.5,e4-87~130,e4-88~132.
(1)這6個月中,任取2個月,求已知其中1個月的碳排放量低于6個月碳排放量的平均值的條件下,另1
個月碳排放量高于6個月碳排放量的平均值的概率;
(2)若用函數(shù)模型p=po*t對兩個變量月份t與排放量p進行擬合,根據(jù)表中數(shù)據(jù),求出p關(guān)于t的回歸
方程.
附:對于同一組數(shù)據(jù)(%1,為),(x2,y2)>...>On,%),其回歸直線產(chǎn)=阪+a的斜率和截距的最小二乘估計公
式分別為:
rCxi-x)(yt-y)-
b=圾i(“為2'a=y-bx
考點三列聯(lián)表與獨立性檢驗
【方法儲備】
獨立性檢驗的一般步驟:
(1)獨立性檢驗原理只能解決兩個對象,且每個對象有兩類屬性的問題,所以對于一個實際問題,我們首
先要確定能否用獨立性檢驗的思想加以解決;
(2)如果確實屬于這類問題,要科學(xué)地抽取樣本,樣本容量要適當(dāng),不可太小;
(3)根據(jù)數(shù)據(jù)列出2x2列聯(lián)表;
⑷提出假設(shè)飛:所研究的兩類對象(X,Y)無關(guān);
n^ad-bc)2
(5)根據(jù)公式計算乂2=的值;
(a+b)(c+d)(a+c)(b+d)
(6)比較乂2與臨界值力,根據(jù)小概率原理肯定或者否定假設(shè),即判斷XX是否相關(guān).
【典例精講】
例5.(2023?湖南省長沙市期末)根據(jù)分類變量比與y的成對樣本數(shù)據(jù),計算得到x?=6.147.依據(jù)a=0.01的獨立
性檢驗(的.01=6.635),結(jié)論為()
A.變量比與y不獨立
B.變量久與y不獨立,這個結(jié)論犯錯誤的概率不超過0.01
變量x與y獨立
D.變量x與y獨立,這個結(jié)論犯錯誤的概率不超過0.01
例6.(2022?湖南省長沙市期中)新能源汽車是指除汽油、柴油發(fā)動機之外的所有其他能源汽車,被認(rèn)為
能減少空氣污染和緩解能源短缺的壓力.在當(dāng)今提倡全球環(huán)保的前提下,新能源汽車越來越受到消費者的青
睞,新能源汽車產(chǎn)業(yè)也必將成為未來汽車產(chǎn)業(yè)發(fā)展的導(dǎo)向與目標(biāo).某機構(gòu)從某地區(qū)抽取了500名近期購買新
能源汽車的車主,調(diào)查他們的年齡情況,其中購買甲車型的有200人,統(tǒng)計得到如下的頻率分布直方圖.
(1)將年齡不低于45歲的人稱為中年,低于45歲的人稱為青年,購買其他車型的車主青年人數(shù)與中年人
數(shù)之比為3:1.完成下列2x2列聯(lián)表,依據(jù)a=0.005的獨立性檢驗,能否認(rèn)為購買甲車型新能源汽車與
(2)用分層抽樣的方法從購買甲車型的樣本中抽取8人,再從中隨機抽取4人,記青年有X人,求X的分
布列和數(shù)學(xué)期望.
嗎.v2_n(ad—bc)2.力―々工辦.廠上〃
A(a+b)(c+d)(a+c)(b+d)
a0.1000.0500.0100.0050.001
2.7063.8416.6357.87910.828
【拓展提升】
練31(2023?陜西省西安市模擬)(多選)已知某學(xué)校高二年級男生人數(shù)是女生人數(shù)的2倍,該年級全部
男、女學(xué)生是否喜歡徒步運動的等高堆積條形圖如下,下列說法正確的是
□喜歡徒步
II不喜歡徒步
a0.050.010.005
Xa3.8416.6357.879
A.參加調(diào)查的學(xué)生中喜歡徒步的男生比喜歡徒步的女生多;
B.參加調(diào)查的學(xué)生中不喜歡徒步的男生比不喜歡徒步的女生少;
C.若參加調(diào)查的學(xué)生總?cè)藬?shù)為300,則能根據(jù)小概率a=0.01的獨立性檢驗,推斷喜歡徒步和性別有關(guān);
D.無論參加調(diào)查的學(xué)生總?cè)藬?shù)為多少,都能根據(jù)小概率a=0.01的獨立性檢驗,推斷喜歡徒步和性別有
美.
練32(2023?安徽省合肥市聯(lián)考)針對“中學(xué)生追星問題”,某校團委正在對“性別與中學(xué)生追星是否有
關(guān)”做相關(guān)研究.現(xiàn)從本校隨機抽取100名學(xué)生進行調(diào)查,得到下表:
性別
是否追星合計
男生女生
追星4570
不追星20
合計100
(1)請將上述2x2列聯(lián)表補充完整,并依據(jù)a=0.01的獨立性檢驗,能否認(rèn)為性別與中學(xué)生追星有關(guān)聯(lián)?
(2)根據(jù)是否追星,在樣本的女生中,按照分層抽樣的方法抽取9人作為研究小組.為了更詳細(xì)地了解情況,
再從研究小組中隨機抽取4人,求抽到追星人數(shù)X的分布列及數(shù)學(xué)期望.
n^ad-bc)2
參考公式:2n=a+b+c+d
x=(a+b)(c+d)(a+c)(b+d)'
下表給出了獨立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值.
a0.0500.0250.0100.001
%3.84105.0246.63510.828
1.(2023?浙江省杭州市聯(lián)考)足球是一項大眾喜愛的運動,為了解喜愛足球是否與性別有關(guān),隨機抽取
了若干人進行調(diào)查,抽取女性人數(shù)是男性的2倍,男性喜愛足球的人數(shù)占男性人數(shù)的,,女性喜愛足球的
O
人數(shù)占女性人數(shù)的,,若本次調(diào)查得出“在犯錯誤的概率不超過0.005的前提下認(rèn)為喜愛足球與性別有關(guān)”
的結(jié)論,則被調(diào)查的男性至少有人(*=…鑿點Wd)
a0.100.050.010.0050.001
Xa2.7063.8416.6357.87910.828
A.10B.11C.12D.13
2.(2023?重慶市市轄區(qū)模擬)已知變量y關(guān)于光的回歸方程為y=涉尸。.6,若對y=6丘-。6兩邊取自然
對數(shù),可以發(fā)現(xiàn)my與久線性相關(guān),現(xiàn)有一組數(shù)據(jù)如下表所示:
X12345
yee3e4e6e7
則當(dāng)%=6時,預(yù)測y的值為()
A.9B.8C.e9D.e8
3.(2023?湖北省荊州市月考)5G技術(shù)對社會和國家十分重要.從戰(zhàn)略地位來看,業(yè)界一般將其定義為繼
蒸汽機革命、電氣革命和計算機革命后的第四次工業(yè)革命.某科技集團生產(chǎn)48兩種5G通信基站核心
部件,下表統(tǒng)計了該科技集團近幾年來在4部件上的研發(fā)投入x(億元)與收益y(億元)的數(shù)據(jù),結(jié)果如下:
研發(fā)投入x(億元)12345
收益y(億元)3791011
(1)利用相關(guān)系數(shù)r說明是否可以用線性回歸模型擬合y與x的關(guān)系(當(dāng)|r|G[0.75,1]時,可以認(rèn)為兩個變
量有很強的線性相關(guān)性);
(2)求出y關(guān)于光的線性回歸方程,并利用該方程回答下列問題:
。)若要使生產(chǎn)A部件的收益不低于15億元,估計至少需要投入多少研發(fā)資金?(精確到0.001億元)
5)該科技集團計劃用10億元對A,B兩種部件進行投資,對B部件投資x(l<x<6)億元所獲得的收益
y近似滿足y=0.9%-5+3.7,則該科技集團針對4B兩種部件各應(yīng)投入多少研發(fā)資金,能使所獲得的
總收益P最大.
£憶1(陽一團(力一9)
附:相關(guān)系數(shù)「=回歸直線方程的斜率1=啊各])三嚴(yán),截距。=歹一石記
,£之1(3一乃2]£21例一刃2Li=lixi-x)
【答案解析】
L【人教A版選擇性必修三習(xí)題8.2第1題P120]
解:因為樣本點都落在一條斜率為非。實數(shù)的直線上,所以相關(guān)系數(shù)r滿足m=1,若直線的斜率為正,
則r=l;若斜率為負(fù),則r=—1,故。錯誤;
直線對應(yīng)的函數(shù)為一次函數(shù),所以解釋變量和預(yù)報變量是一次函數(shù)關(guān)系,故/正確;
決定系數(shù)和殘差平方和都能反映模型的擬合程度,所以決定系數(shù)R2=l,殘差的平方和為0,故8,C正
確.
故本題選D
2.1人教A版選擇性必修一習(xí)題8.3第5題P135]
解:(I)女學(xué)生身高低于170cm,不低于170cm的頻率分別為筮=0.835,招=0.165,
男學(xué)生身高低于170cm,不低于170cm的頻率分別為溫-0.272,^~0.728,
通過比較發(fā)現(xiàn),如果從女生、男生中各隨機選取一名學(xué)生,女生中身高低于170sl的概率大于男生中身
高低于170cm的概率,
故高三年級學(xué)生的性別和身高有關(guān)聯(lián),
故女生中身高低于170cm的頻率是男生中身高低于170cm的頻率的3倍以上,
所以女生身高更容易低于170cm;
所以依據(jù)a=0.05的獨立性檢驗,沒有95%的把握認(rèn)為該中學(xué)高三年級學(xué)生的性別與身高有關(guān)系;
(III)不一致,第一種準(zhǔn)確,第二種樣本容量太少,隨機性太大.
例1.解:根據(jù)散點的集中程度可知,花瓣長度和花萼長度有相關(guān)性,A選項錯誤
散點的分布是從左下到右上,從而花瓣長度和花萼長度呈現(xiàn)正相關(guān)性,B選項錯誤,C選項正確;
由于r=0.8245是全部數(shù)據(jù)的相關(guān)系數(shù),取出來一部分?jǐn)?shù)據(jù),相關(guān)性可能變強,可能變?nèi)酰?/p>
即取出的數(shù)據(jù)的相關(guān)系數(shù)不一定是0.8245,D選項錯誤.
故選:C
例2.解:觀察散點圖,變量”與y具有負(fù)的相關(guān)關(guān)系,①正確,易得②正確,
若選擇函數(shù)模型二,
利用最小二乘法求出的回歸方程一定經(jīng)過(后,歹),③錯誤;
殘差=真實值-預(yù)測值,因此殘差為0.1,④正確.
其中說法正確的是①②④.
故選8.
練11.解:???直線2x+y-1=0的斜率k=—2,
且若所有本點(孫力)(i=1,2,3,…,孔)都在直線y=-2x+l±,
???說明這組數(shù)據(jù)的樣本完全負(fù)相關(guān),則相關(guān)系數(shù)達(dá)到最小值-1.
故選:B.
練12.解:由某地3月5日到3月15日的每天最高氣溫與最低氣溫(單位:。口數(shù)據(jù),折線圖,知:
在力中,5號到11號的最低氣溫與日期之間,在一條直線附近,成上升趨勢,即呈線性相關(guān)關(guān)系且為正
相關(guān),故/正確;
在8中,由圖知,6號的最高氣溫與最低氣溫的差值最大,故8錯誤;
在C中,最高氣溫27。出現(xiàn)2次,次數(shù)最多,則眾數(shù)為27。。故C正確;
在。中,5號到15號的最低氣溫的極差小于15-3-12,最高氣溫的極差為27-15=12,故最高氣溫
的極差大,故。錯誤
故選:AC.
例3.解:對于4因為y=x在定義域內(nèi)單調(diào)遞增且b>0,所以w隨著久的增大而增大,不合題意,
故4錯誤;
對于B:因為y=lnx在定義域內(nèi)單調(diào)遞增且6>0,所以w隨著x的增大而減小,
當(dāng)解釋變量X—+8,W00,不合題意,故3錯誤;
對于C:因為y=C在定義域內(nèi)單調(diào)遞增且。>0,所以卬隨著x的增大而減小,
當(dāng)解釋變量久一+8,W00,不合題意,故C錯誤;
對于D:因為y=e-=(;尸在定義域內(nèi)單調(diào)遞減且0,所以w隨著x的增大而減小,
當(dāng)解釋變量x->+8,wa,故。正確;
故選:D.
例4.解:(1)因為新能源汽車電池的使用壽命;?N(60,42),
所以PG>68)==(丁2『〃+2。)x=0Q225,
所以20000X0.0225=450塊,
則每月生產(chǎn)的2萬塊電池中,使用壽命超過68萬公里的大約有450塊;
(2)①因為IQI>I—
所以產(chǎn)=bx2+a更適合作為y與x之間的回歸方程模型;
②因為干=停+22+;2+42+52=]],
刑務(wù)-戲=1M53_32094-5X11X414
則南后5979-5X1P24.9,
a=y-St=414-24.9x11=140.1,
所以y=24.9t+140.1=24.9/+140.1,
當(dāng)尤=7時,y=24.9X49+140.1=1360.2萬輛,
則2023年我國新能源汽車保有量約為1360.2萬輛.
練21.解:由題圖,去掉B點后,回歸效果更好,
則殘差平方和變小,故/正確;
相關(guān)系數(shù)r的絕對值|川越趨于1,故8正確;
決定系數(shù)產(chǎn)變大,故C錯誤;
解釋變量久與預(yù)報變量y相關(guān)性增強,故。錯誤.
故選AB.
練22.解:(1)設(shè)4="1個月的碳排放低于6個月排放的平均值”,
B="1個月的碳排放高于6個月排放的平均值”,
則P(8|A)=鬻1
21
kt
(2)p=poe=>Inp=kt+lnp0,
則仁疆半丹她…32,
慶斤6t
7
Inpo—3.75+0.32X—=4.87,
所以回歸方程為:Inp=—0.32t+4.87=>p=e4,87'e~032t?130e_032t.
例5.解:a=0.01時,Xa=6.635,則大于Xa時相關(guān),不獨立,
而X?=6.147<Xa=6,635,所以變量比與y獨立,
但是這個結(jié)論犯錯誤的概率超過0.01,故4B,D錯誤,C正確.
故選C
例6.解:(1)由直方圖可知,購買甲車型的青年人數(shù)為200(0.005+0.025+0.0325)x10=125人,中年
人數(shù)為200-125=75人,
購買其他車型的青年人數(shù)為(500-200)X言=225人,中年人數(shù)為300-225=75人,
可得2x2列聯(lián)表:
青年中年合計
甲車型12575200
其他車型22575300
合計350150500
零假設(shè)%:購買甲車型新能源汽車與年齡無關(guān).
因為2=500(125x75-225x75)2=經(jīng)=g929>7879
X350x150x200x30014>'
根據(jù)小概率值a=0.005的獨立性檢驗,我們推斷/不成立,即認(rèn)為購買甲車型新能源汽車與年齡有關(guān),
此推斷犯錯誤的概率不大于0.005.
(2)用分層抽樣的方法從購買甲車型的樣本中抽取8人,則青年有8x株=5人,中年有8x益=3人,
所以X的可能取值為1,2,3,4.
51鬃303
P(X=1)=塞。。=2)=骨=*慨
L87014
303CfCg51
P(X=3)=普I-P(X=4)=常=磊
L7014
8o
得分布列:
X1234
1331
P
147714
所以E(X)=lx=+2x5+3x#4x==|
練31.解:設(shè)高二年級總?cè)藬?shù)為3a,則根據(jù)等高堆積條形圖可得:
喜歡不喜歡合計
男生1.4a0.6a2a
女生0.4a0.6aa
合計1.8a1.2a3a
對于A:參加調(diào)查的學(xué)生中喜歡徒步的男生人數(shù)為1.4a,喜歡徒步的女生人數(shù)為0.4a,所以N正確;
對于B-.參加調(diào)查的學(xué)生中不喜歡徒步的男生與不喜歡徒步的女生人數(shù)均為0.6a,所以2錯誤;
對于c與D.2_3a(1.4ax0.6a—0.4ax0.6a)2_a
?X2axaxl.8axl.2a4'
當(dāng)3a=300時,x2=25>6,635,所以能根據(jù)小概率a=0.01的獨立性檢驗,推斷喜歡徒步和性別有關(guān);
當(dāng)總?cè)藬?shù)時,即不能根據(jù)小概率的獨立性檢驗,
3a<3x4x6,635x?=jq<6,635a=0.01
推斷喜歡徒步和性別有關(guān),故C正確,。錯誤.
故選NC.
練32.解:(1)列聯(lián)表補充為
性別
是否追星合計
男生女生
追星452570
不追星102030
合計5545100
零假設(shè)"oH■生別與中學(xué)生追星無關(guān)聯(lián),
2_100x(45x20-25x10)2
久—55x45x70x30?8.129>6.635=Xo.op
依據(jù)小概率值a=0.01的獨立性檢驗,我們推斷為不成立,即認(rèn)為性別與中學(xué)生追星有關(guān)聯(lián),
此推斷犯錯誤的概率不大于0.0L
(2)由題意知,9人中追星的有5人,不追星的有4人.
由題意可知,X的可能取值為0,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)人教英語上下冊人教版新起點英語二年級下冊:Unit-10-Weather課件(共11張)公
- 《機械設(shè)計基礎(chǔ) 第4版》 教案 朱龍英 第13-15章 軸承、其他常用零部件、機械傳動系統(tǒng)設(shè)計
- 《機械設(shè)計基礎(chǔ) 第4版》 教案 第13章 軸承
- 北京海淀外國語實驗2021-2022學(xué)年物理高一第二學(xué)期期末復(fù)習(xí)檢測試題含解析
- 安徽省亳州市渦陽縣第一中學(xué)2021-2022學(xué)年物理高一下期末聯(lián)考模擬試題含解析
- 機械設(shè)計基礎(chǔ) 第4版 朱東華 A-z專業(yè)詞匯大全
- 2022年物理高一下期末達(dá)標(biāo)檢測模擬試題含解析
- 愛護環(huán)境主題班會課件
- 2024年試壓泵項目申請報告
- 2024年高導(dǎo)熱石墨散熱材料項目規(guī)劃申請報告模板
- 碎石技術(shù)供應(yīng)保障方案
- (2024年)C語言程序設(shè)計教程
- 屈原【六幕話劇】郭沫若
- 鼻部整形發(fā)展與現(xiàn)狀
- 學(xué)前教育政策與法規(guī)-全書知識點
- 儀表檢測報告
- 遼寧沈陽市南昌中學(xué)2023-2024學(xué)年上學(xué)期七年級第一次月考數(shù)學(xué)試卷+
- 安裝維修與維護工作人員培訓(xùn)
- 肺栓塞圖文健康宣教課件
- 2024年海南高考物理試題(真題+純WORD+解析)
- 疼痛病人健康宣教課件
評論
0/150
提交評論