版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第3講變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例[考綱解讀]1.會(huì)作兩個(gè)相關(guān)變量的數(shù)據(jù)的散點(diǎn)圖,會(huì)利用散點(diǎn)圖認(rèn)識(shí)變量間的相關(guān)關(guān)系;根據(jù)最小二乘法求出回歸直線方程.(重點(diǎn))2.了解獨(dú)立性檢驗(yàn)(只要求2×2列聯(lián)表)的基本思想、方法及其初步應(yīng)用.[考向預(yù)測]從近三年高考情況來看,本講是高考中的一個(gè)熱點(diǎn)考查內(nèi)容.預(yù)測2021年將會(huì)考查:①回歸直線方程的判斷、求解及相關(guān)系數(shù)的意義,并用其解決實(shí)際問題;②獨(dú)立性檢驗(yàn)思想在實(shí)際問題中的應(yīng)用.試題以解答題的形式呈現(xiàn),難度為中等.此外,也可能出現(xiàn)在客觀題中,此時(shí)試題難度不大,屬中、低檔題型.1.相關(guān)關(guān)系與回歸方程(1)相關(guān)關(guān)系的分類①正相關(guān):從散點(diǎn)圖上看,點(diǎn)散布在從eq\o(□,\s\up3(01))左下角到eq\o(□,\s\up3(02))右上角的區(qū)域內(nèi),如圖1;②負(fù)相關(guān):從散點(diǎn)圖上看,點(diǎn)散布在從eq\o(□,\s\up3(03))左上角到eq\o(□,\s\up3(04))右下角的區(qū)域內(nèi),如圖2.(2)線性相關(guān)關(guān)系:從散點(diǎn)圖上看,如果這些點(diǎn)從整體上看大致分布在eq\o(□,\s\up3(05))一條直線附近,則稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做eq\o(□,\s\up3(06))回歸直線.(3)回歸方程①最小二乘法:使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的eq\o(□,\s\up3(07))距離的平方和最小的方法叫做最小二乘法.②回歸方程:兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),則eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)xi-\o(x,\s\up6(-))2)=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).其中,eq\o(b,\s\up6(^))是回歸方程的eq\o(□,\s\up3(08))斜率,eq\o(a,\s\up6(^))是在y軸上的eq\o(□,\s\up3(09))截距,eq\o(x,\s\up6(-))=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do14(i=1))xi,eq\o(y,\s\up6(-))=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do14(i=1))yi,eq\o(□,\s\up3(10))(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))稱為樣本點(diǎn)的中心.說明:回歸直線eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必過樣本點(diǎn)的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))),這個(gè)結(jié)論既是檢驗(yàn)所求回歸直線方程是否準(zhǔn)確的依據(jù),也是求參數(shù)的一個(gè)依據(jù).(4)樣本相關(guān)系數(shù)r=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up6(-))2\i\su(i=1,n,)yi-\o(y,\s\up6(-))2)),用它來衡量兩個(gè)變量間的線性相關(guān)關(guān)系.①當(dāng)r>0時(shí),表明兩個(gè)變量eq\o(□,\s\up3(11))正相關(guān);②當(dāng)r<0時(shí),表明兩個(gè)變量eq\o(□,\s\up3(12))負(fù)相關(guān);③r的絕對值越接近1,表明兩個(gè)變量的線性相關(guān)性eq\o(□,\s\up3(13))越強(qiáng);r的絕對值接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.通常當(dāng)|r|>0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系.2.殘差分析(1)殘差:對于樣本點(diǎn)(x1,y1),(x2,y2),…,(xn,yn),它們的隨機(jī)誤差為ei=y(tǒng)i-bxi-a,i=1,2,…,n,其估計(jì)值為eq\o(e,\s\up6(^))i=y(tǒng)i-eq\o(y,\s\up6(^))i=y(tǒng)i-eq\o(b,\s\up6(^))xi-eq\o(a,\s\up6(^)),i=1,2,…,n,eq\o(e,\s\up6(^))i稱為相應(yīng)于點(diǎn)(xi,yi)的殘差.(2)殘差平方和為eq\o(∑,\s\up6(n),\s\do4(i=1))(yi-eq\o(y,\s\up6(^))i)2.(3)相關(guān)指數(shù):R2=1-eq\o(□,\s\up3(01))eq\f(\o(∑,\s\up6(n),\s\do4(i=1))yi-\o(y,\s\up6(^))i2,\o(∑,\s\up6(n),\s\do4(i=1))yi-\o(y,\s\up6(-))2).3.獨(dú)立性檢驗(yàn)(1)分類變量:變量的不同“值”表示個(gè)體所屬的eq\o(□,\s\up3(01))不同類別,像這類變量稱為分類變量.(2)列聯(lián)表:列出兩個(gè)分類變量的eq\o(□,\s\up3(02))頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為2×2列聯(lián)表y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d構(gòu)造一個(gè)隨機(jī)變量K2=eq\o(□,\s\up3(03))eq\f(nad-bc2,a+bc+da+cb+d),其中n=eq\o(□,\s\up3(04))a+b+c+d為樣本容量.(3)獨(dú)立性檢驗(yàn)利用隨機(jī)變量eq\o(□,\s\up3(05))K2來判斷“兩個(gè)分類變量eq\o(□,\s\up3(06))有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn).1.概念辨析(1)相關(guān)關(guān)系與函數(shù)關(guān)系都是一種確定性的關(guān)系,也是一種因果關(guān)系.()(2)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生水平成正相關(guān)關(guān)系.()(3)只有兩個(gè)變量有相關(guān)關(guān)系,所得到的回歸模型才有預(yù)測價(jià)值.()(4)事件X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計(jì)算得到的K2的觀測值越大.()(5)由獨(dú)立性檢驗(yàn)可知,有99%的把握認(rèn)為物理成績優(yōu)秀與數(shù)學(xué)成績有關(guān),某人數(shù)學(xué)成績優(yōu)秀,則他有99%的可能物理優(yōu)秀.()答案(1)×(2)√(3)√(4)√(5)×2.小題熱身(1)設(shè)回歸方程為eq\o(y,\s\up6(^))=3-5x,則變量x增加一個(gè)單位時(shí)()A.y平均增加3個(gè)單位B.y平均減少5個(gè)單位C.y平均增加5個(gè)單位D.y平均減少3個(gè)單位答案B解析因?yàn)椋?是斜率的估計(jì)值,說明x每增加一個(gè)單位,y平均減少5個(gè)單位.故選B.(2)在下列各圖中,兩個(gè)變量具有相關(guān)關(guān)系的圖是()A.①②B.①③C.②④D.②③答案D解析①為函數(shù)關(guān)系;②顯然成正相關(guān);③顯然成負(fù)相關(guān);④沒有明顯相關(guān)性.(3)隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡單隨機(jī)抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如表.非一線一線總計(jì)愿生452065不愿生132235總計(jì)5842100算得K2=eq\f(100×45×22-20×132,58×42×35×65)≈9.616.附表:P(K2≥k0)0.0500.0100.001k03.8416.63510.828參照附表,得到的正確結(jié)論是()A.在犯錯(cuò)誤的概率不超過0.1%的前提下,認(rèn)為“生育意愿與城市級(jí)別有關(guān)”B.在犯錯(cuò)誤的概率不超過0.1%的前提下,認(rèn)為“生育意愿與城市級(jí)別無關(guān)”C.有99%以上的把握認(rèn)為“生育意愿與城市級(jí)別有關(guān)”D.有99%以上的把握認(rèn)為“生育意愿與城市級(jí)別無關(guān)”答案C解析因?yàn)镵2≈9.616>6.635,所以有99%以上的把握認(rèn)為“生育意愿與城市級(jí)別有關(guān)”.(4)已知變量x,y具有線性相關(guān)關(guān)系,它們之間的一組數(shù)據(jù)如下表所示,若y關(guān)于x的回歸方程為eq\o(y,\s\up6(^))=1.3x-1,則m=________.x1234y0.11.8m4答案3.1解析由已知得eq\o(x,\s\up6(-))=eq\f(1,4)×(1+2+3+4)=2.5,eq\o(y,\s\up6(-))=eq\f(1,4)(0.1+1.8+m+4)=eq\f(1,4)×(5.9+m).因?yàn)?eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))在直線eq\o(y,\s\up6(^))=1.3x-1上,所以eq\o(y,\s\up6(-))=1.3×2.5-1=2.25,所以eq\f(1,4)×(5.9+m)=2.25,解得m=3.1.題型一相關(guān)關(guān)系的判斷1.下列兩變量中不存在相關(guān)關(guān)系的是()①人的身高與視力;②曲線上的點(diǎn)與該點(diǎn)的坐標(biāo)之間的關(guān)系;③某農(nóng)田的水稻產(chǎn)量與施肥量;④某同學(xué)考試成績與復(fù)習(xí)時(shí)間的投入量;⑤勻速行駛的汽車的行駛距離與時(shí)間;⑥商品的銷售額與廣告費(fèi).A.①②⑤B.①③⑥C.④⑤⑥D(zhuǎn).②⑥答案A解析根據(jù)相關(guān)關(guān)系的定義知,①②⑤中兩個(gè)變量不存在相關(guān)關(guān)系.2.下列命題中正確的為()A.線性相關(guān)系數(shù)r越大,兩個(gè)變量的線性相關(guān)性越強(qiáng)B.線性相關(guān)系數(shù)r越小,兩個(gè)變量的線性相關(guān)性越弱C.殘差平方和越小的模型,模型擬合的效果越好D.用相關(guān)指數(shù)R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好答案C解析線性相關(guān)系數(shù)r的絕對值越接近于1,兩個(gè)變量的線性相關(guān)性越強(qiáng),故A,B錯(cuò)誤;殘差平方和越小,相關(guān)指數(shù)R2越大,越接近于1,擬合效果越好,故C正確,D錯(cuò)誤.3.對四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3答案A解析易知題中圖①與圖③是正相關(guān),圖②與圖④是負(fù)相關(guān),且圖①與圖②中的樣本點(diǎn)集中分布在一條直線附近,則r2<r4<0<r3<r1.故選A.1.判定兩個(gè)變量正、負(fù)相關(guān)性的方法(1)畫散點(diǎn)圖:點(diǎn)的分布從左下角到右上角,兩個(gè)變量正相關(guān);點(diǎn)的分布從左上角到右下角,兩個(gè)變量負(fù)相關(guān).(2)相關(guān)系數(shù):r>0時(shí),正相關(guān);r<0時(shí),負(fù)相關(guān).|r|越趨近于1相關(guān)性越強(qiáng).見舉例說明3.(3)線性回歸直線方程中:eq\o(b,\s\up6(^))>0時(shí),正相關(guān);eq\o(b,\s\up6(^))<0時(shí),負(fù)相關(guān).2.判斷擬合效果的兩個(gè)方法(1)殘差平方和越小,擬合效果越好.見舉例說明2.(2)相關(guān)指數(shù)R2越大,越接近于1,擬合效果越好.1.在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點(diǎn)圖中,若所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=eq\f(1,2)x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為()A.-1B.0C.eq\f(1,2)D.1答案D解析所有點(diǎn)均在直線上,則樣本相關(guān)系數(shù)最大即為1,故選D.2.四名同學(xué)根據(jù)各自的樣本數(shù)據(jù)研究變量x,y之間的相關(guān)關(guān)系,并求得線性回歸方程,分別得到以下四個(gè)結(jié)論:①y與x負(fù)相關(guān)且eq\o(y,\s\up6(^))=2.347x-6.423;②y與x負(fù)相關(guān)且eq\o(y,\s\up6(^))=-3.476x+5.648;③y與x正相關(guān)且eq\o(y,\s\up6(^))=5.437x+8.493;④y與x正相關(guān)且eq\o(y,\s\up6(^))=-4.326x-4.578.其中一定不正確的結(jié)論的序號(hào)是()A.①②B.②③C.③④D.①④答案D解析由回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))知當(dāng)eq\o(b,\s\up6(^))>0時(shí),y與x正相關(guān),當(dāng)eq\o(b,\s\up6(^))<0時(shí),y與x負(fù)相關(guān),∴①④一定錯(cuò)誤.題型二回歸分析角度1線性回歸方程及應(yīng)用1.某汽車的使用年數(shù)x與所支出的維修總費(fèi)用y的統(tǒng)計(jì)數(shù)據(jù)如表:使用年數(shù)x/年12345維修總費(fèi)用y/萬元0.51.22.23.34.5根據(jù)上表可得y關(guān)于x的線性回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x-0.69,若該汽車維修總費(fèi)用超過10萬元就不再維修,直接報(bào)廢,據(jù)此模型預(yù)測該汽車最多可使用(不足1年按1年計(jì)算)()A.8年B.9年C.10年D.11年答案D解析由y關(guān)于x的線性回歸直線eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x-0.69過樣本點(diǎn)的中心(3,2.34),得eq\o(b,\s\up6(^))=1.01,即線性回歸方程為eq\o(y,\s\up6(^))=1.01x-0.69,令eq\o(y,\s\up6(^))=1.01x-0.69=10,得x≈10.6,所以預(yù)測該汽車最多可使用11年.故選D.2.(2020·泉州模擬)某測試團(tuán)隊(duì)為了研究“飲酒”對“駕車安全”的影響,隨機(jī)選取100名駕駛員先后在無酒狀態(tài)、酒后狀態(tài)下進(jìn)行“停車距離”測試,測試的方案:電腦模擬駕駛,以某速度勻速行駛,記錄下駕駛員的“停車距離”(駕駛員從看到意外情況到車子停下所需要的距離),無酒狀態(tài)與酒后狀態(tài)下的試驗(yàn)數(shù)據(jù)分別列于下表.表1停車距離d(米)(10,20](20,30](30,40](40,50](50,60]頻數(shù)26ab82表2平均每毫升血液酒精含量x(毫克)1030507090平均停車距離y(米)3050607090已知表1數(shù)據(jù)的中位數(shù)估計(jì)值為26,回答以下問題.(1)求a,b的值,并估計(jì)駕駛員無酒狀態(tài)下停車距離的平均數(shù);(2)根據(jù)最小二乘法,由表2的數(shù)據(jù)計(jì)算y關(guān)于x的回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)該測試團(tuán)隊(duì)認(rèn)為:若駕駛員酒后駕車的平均“停車距離”y大于(1)中無酒狀態(tài)下的停車距離平均數(shù)的3倍,則認(rèn)定駕駛員是“醉駕”.請根據(jù)(2)中的回歸方程,預(yù)測當(dāng)每毫升血液酒精含量大于多少毫克時(shí)為“醉駕”?附:回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解(1)依題意,得eq\f(6,10)a=50-26,解得a=40.又a+b+36=100,解得b=24,故停車距離的平均數(shù)為15×eq\f(26,100)+25×eq\f(40,100)+35×eq\f(24,100)+45×eq\f(8,100)+55×eq\f(2,100)=27.(2)依題意,可知eq\o(x,\s\up6(-))=50,eq\o(y,\s\up6(-))=60,eq\i\su(i=1,5,x)iyi=10×30+30×50+50×60+70×70+90×90=17800,eq\i\su(i=1,5,x)eq\o\al(2,i)=102+302+502+702+902=16500,所以eq\o(b,\s\up6(^))=eq\f(17800-5×50×60,16500-5×502)=0.7,eq\o(a,\s\up6(^))=60-0.7×50=25,所以回歸直線方程為eq\o(y,\s\up6(^))=0.7x+25.(3)由(1)知當(dāng)y>81時(shí),認(rèn)定駕駛員是“醉駕”.令eq\o(y,\s\up6(^))>81,得0.7x+25>81,解得x>80,則當(dāng)每毫升血液酒精含量大于80毫克時(shí)認(rèn)定為“醉駕”.角度2非線性回歸模型的應(yīng)用3.(2019·莆田二模)某芯片公司為制定下一年的研發(fā)投入計(jì)劃,需了解年研發(fā)資金投入量xi(單位:億元)對年銷售額yi(單位:億元)的影響.該公司對歷史數(shù)據(jù)進(jìn)行對比分析,建立了兩個(gè)函數(shù)模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t均為常數(shù),e為自然對數(shù)的底數(shù).現(xiàn)該公司收集了近12年的年研發(fā)資金投入量xi和年銷售額yi的數(shù)據(jù),i=1,2,…,12,并對這些數(shù)據(jù)作了初步處理,得到了如下的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.令ui=x2,vi=lnyi(i=1,2,…,12),經(jīng)計(jì)算得如下數(shù)據(jù):eq\o(x,\s\up6(-))eq\o(y,\s\up6(-))eq\i\su(i=1,12,)(xi-eq\o(x,\s\up6(-)))2eq\i\su(i=1,12,)(yi-eq\o(y,\s\up6(-)))2eq\o(u,\s\up6(-))eq\o(v,\s\up6(-))20667702004604.20eq\i\su(i=1,12,)(ui-eq\o(u,\s\up6(-)))2eq\i\su(i=1,12,)(ui-eq\o(u,\s\up6(-)))·(yi-eq\o(y,\s\up6(-)))eq\i\su(i=1,12,)(vi-eq\o(v,\s\up6(-)))2eq\i\su(i=1,12,)(xi-eq\o(x,\s\up6(-)))·(vi-eq\o(v,\s\up6(-)))3125000215000.30814(1)設(shè){ui}和{yi}的相關(guān)系數(shù)為r1,{xi}和{vi}的相關(guān)系數(shù)為r2,請從相關(guān)系數(shù)的角度,選擇一個(gè)擬合程度更好的模型;(2)①根據(jù)(1)的選擇及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(系數(shù)精確到0.01);②若下一年銷售額y需達(dá)到90億元,預(yù)測下一年的研發(fā)資金投入量x是多少億元?附:相關(guān)系數(shù)r=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up6(-))2\i\su(i=1,n,)yi-\o(y,\s\up6(-))2)),回歸直線eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x中斜率和截距的最小二乘估計(jì)公式分別為eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)xi-\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-));參考數(shù)據(jù):308=4×77,eq\r(90)≈9.4868,e4.4998≈90.解(1)由題意,r1=eq\f(\i\su(i=1,12,)ui-\o(u,\s\up6(-))yi-\o(y,\s\up6(-)),\r(\i\su(i=1,12,)ui-\o(u,\s\up6(-))2\i\su(i=1,12,)yi-\o(y,\s\up6(-))2))=eq\f(21500,\r(3125000×200))=eq\f(21500,25000)=eq\f(43,50)=0.86,r2=eq\f(\i\su(i=1,12,)xi-\o(x,\s\up6(-))vi-\o(v,\s\up6(-)),\r(\i\su(i=1,12,)xi-\o(x,\s\up6(-))2\i\su(i=1,12,)vi-\o(v,\s\up6(-))2))=eq\f(14,\r(770×0.308))=eq\f(14,77×0.2)=eq\f(10,11)≈0.91,則|r1|<|r2|,因此從相關(guān)系數(shù)的角度,模型y=eλx+t的擬合程度更好.(2)①先建立v關(guān)于x的線性回歸方程,由y=eλx+t,得lny=t+λx,即v=t+λx;由于λ=eq\f(\i\su(i=1,12,)xi-\o(x,\s\up6(-))vi-\o(v,\s\up6(-)),\i\su(i=1,12,)xi-\o(x,\s\up6(-))2)=eq\f(14,770)≈0.018,t=eq\o(v,\s\up6(-))-λeq\o(x,\s\up6(-))=4.20-0.018×20=3.84,所以v關(guān)于x的線性回歸方程為eq\o(v,\s\up6(^))=0.02x+3.84,所以lneq\o(y,\s\up6(^))=0.02x+3.84,則eq\o(y,\s\up6(^))=e0.02x+3.84.②下一年銷售額y需達(dá)到90億元,即y=90,代入eq\o(y,\s\up6(^))=e0.02x+3.84,得90=e0.02x+3.84,又e4.4998≈90,所以4.4998≈0.02x+3.84,所以x≈eq\f(4.4998-3.84,0.02)=32.99,所以預(yù)測下一年的研發(fā)資金投入量約是32.99億元.1.利用線性回歸方程時(shí)的關(guān)注點(diǎn)(1)正確理解計(jì)算eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))的公式和準(zhǔn)確的計(jì)算是求線性回歸方程的關(guān)鍵.(2)回歸直線方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必過樣本點(diǎn)中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).見舉例說明1.(3)在分析兩個(gè)變量的相關(guān)關(guān)系時(shí),可根據(jù)樣本數(shù)據(jù)作出散點(diǎn)圖來確定兩個(gè)變量之間是否具有相關(guān)關(guān)系,若具有線性相關(guān)關(guān)系,則可通過線性回歸方程來估計(jì)和預(yù)測.2.非線性回歸方程的求法(1)根據(jù)原始數(shù)據(jù)(x,y)作出散點(diǎn)圖.(2)根據(jù)散點(diǎn)圖選擇恰當(dāng)?shù)臄M合函數(shù).(3)作恰當(dāng)?shù)淖儞Q,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方程.(4)在(3)的基礎(chǔ)上通過相應(yīng)變換,即可得非線性回歸方程.見舉例說明3.1.(2019·南寧二模)一汽車銷售公司對開業(yè)4年來某種型號(hào)的汽車“五一”優(yōu)惠金額與銷售量之間的關(guān)系進(jìn)行分析研究并做了記錄,得到如下資料.日期第1年第2年第3年第4年優(yōu)惠金額x(千元)10111312銷售量y(輛)22243127經(jīng)過統(tǒng)計(jì)分析(利用散點(diǎn)圖)可知x,y線性相關(guān).(1)用最小二乘法求出y關(guān)于x的線性回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(2)若第5年優(yōu)惠金額為8.5千元,估計(jì)第5年的銷售量y(輛)的值.參考公式:eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)xi-\o(x,\s\up6(-))2)=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解(1)由題意,得eq\o(x,\s\up6(-))=11.5,eq\o(y,\s\up6(-))=26,eq\i\su(i=1,4,x)iyi=1211,eq\i\su(i=1,4,x)eq\o\al(2,i)=534,∴eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,4,x)iyi-4\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,4,x)\o\al(2,i)-4\o(x,\s\up6(-))2)=eq\f(1211-4×11.5×26,534-4×11.52)=eq\f(15,5)=3,則eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=26-3×11.5=-8.5.∴eq\o(y,\s\up6(^))=3x-8.5.(2)當(dāng)x=8.5時(shí),eq\o(y,\s\up6(^))=17,∴第5年優(yōu)惠金額為8.5千元時(shí),銷售量估計(jì)為17輛.2.對某地區(qū)兒童的身高與體重的一組數(shù)據(jù),我們用兩種模型:①y=bx+a,②y=cedx擬合,得到回歸方程分別為eq\o(y,\s\up6(^))(1)=0.24x-8.81,eq\o(y,\s\up6(^))(2)=1.70e0.022x,作殘差分析,如下表:身高x(cm)60708090100110體重y(kg)6810141518eq\o(e,\s\up6(^))(1)0.410.011.21-0.190.41eq\o(e,\s\up6(^))(2)-0.360.070.121.69-0.34-1.12(1)求表中空格內(nèi)的值;(2)根據(jù)殘差比較模型①②的擬合效果,決定選擇哪個(gè)模型;(3)若殘差大于1kg的樣本點(diǎn)被認(rèn)為是異常數(shù)據(jù),應(yīng)剔除,剔除后對(2)所選擇的模型重新建立回歸方程.(結(jié)果保留到小數(shù)點(diǎn)后兩位)附:對于一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸直線eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的斜率和截距的最小二乘估計(jì)分別為eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xi-\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解(1)根據(jù)殘差分析,把x=80代入eq\o(y,\s\up6(^))(1)=0.24x-8.81,得eq\o(y,\s\up6(^))(1)=10.39.∵10-10.39=-0.39,∴表中空格內(nèi)的值為-0.39.(2)模型①殘差的絕對值的和為0.41+0.01+0.39+1.21+0.19+0.41=2.62,模型②殘差的絕對值的和為0.36+0.07+0.12+1.69+0.34+1.12=3.7.∵2.62<3.7,∴模型①的擬合效果比較好,選擇模型①.(3)殘差大于1kg的樣本點(diǎn)被剔除后,剩余的數(shù)據(jù)如下表:身高x(cm)607080100110體重y(kg)68101518eq\o(e,\s\up6(^))(1)0.410.01-0.39-0.190.41則eq\o(x,\s\up6(-))=84,eq\o(y,\s\up6(-))=11.4,eq\i\su(i=1,5,)(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=412,eq\i\su(i=1,5,)(xi-eq\o(x,\s\up6(-)))2=1720,由公式eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xi-\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)),得eq\o(b,\s\up6(^))≈0.24,eq\o(a,\s\up6(^))=-8.76.得回歸方程為eq\o(y,\s\up6(^))=0.24x-8.76.題型三獨(dú)立性檢驗(yàn)1.假設(shè)有兩個(gè)分類變量X和Y的2×2列聯(lián)表如下:YXy1y2總計(jì)x1a10a+10x2c30c+30總計(jì)6040100對同一樣本,以下數(shù)據(jù)能說明X與Y有關(guān)系的可能性最大的一組為()A.a=45,c=15 B.a(chǎn)=40,c=20C.a=35,c=25 D.a(chǎn)=30,c=30答案A解析根據(jù)2×2列聯(lián)表與獨(dú)立性檢驗(yàn)可知,當(dāng)eq\f(a,a+10)與eq\f(c,c+30)相差越大時(shí),X與Y有關(guān)系的可能性越大,即a,c相差越大,eq\f(a,a+10)與eq\f(c,c+30)相差越大.故選A.2.(2019·南昌三模)某校高三文科(1)班共有學(xué)生45人,其中男生15人,女生30人.在一次地理考試后,對成績作了數(shù)據(jù)分析(滿分100分),成績?yōu)?5分以上的同學(xué)稱為“地理之星”,得到了如下列聯(lián)表和條形圖:地理之星非地理之星合計(jì)男生女生合計(jì)如果從全班45人中任意抽取1人,抽到“地理之星”的概率為eq\f(1,3).(1)完成“地理之星”與性別的2×2列聯(lián)表,并回答是否有90%以上的把握認(rèn)為獲得“地理之星”與“性別”有關(guān)?(2)若已知此次考試中獲得“地理之星”的同學(xué)的成績平均值為90,方差為7.2,請你判斷這些同學(xué)中是否有得到滿分的同學(xué),并說明理由.(得分均為整數(shù)分)參考公式:K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.臨界值表:P(K2≥k0)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828解(1)根據(jù)題意知“地理之星”總?cè)藬?shù)為45×eq\f(1,3)=15,填寫列聯(lián)表如下:地理之星非地理之星合計(jì)男生7815女生82230合計(jì)153045根據(jù)表中數(shù)據(jù),計(jì)算K2=eq\f(45×7×22-8×82,15×30×15×30)=1.8<2.706,所以沒有90%的把握認(rèn)為獲得“地理之星”與性別有關(guān).(2)沒有得滿分的同學(xué).記各個(gè)分值由高到低分別為x1,x2,…,x15;①若有2個(gè)以上的滿分,則s2=eq\f(1,15)×[(100-90)2+(100-90)2+…+(x15-90)2]>eq\f(40,3)>7.2,不符合題意.②若恰有1個(gè)滿分,為使方差最小,則其他分值需集中分布在平均數(shù)90的附近,且為保證平均值為90,則有10個(gè)得分為89,其余4個(gè)得分為90,此時(shí)方差取得最小值,∴seq\o\al(2,min)=eq\f(1,15)×[(100-90)2+4×(90-90)2+10×(89-90)2]=eq\f(22,3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年國際足球賽事場地租賃合同
- 2024年建筑施工勞務(wù)承包簡約合同樣本
- 2024樁基礎(chǔ)工程專業(yè)分包合同模板
- 2024代理合同樣式
- 2024技術(shù)參股合作協(xié)議書
- 2024版藥品代理合同
- 二手房交易合同
- 店面承租協(xié)議書范本
- 2024項(xiàng)目開發(fā)全過程專項(xiàng)法律服務(wù)合同
- 2024常用合作合同范本
- 2023~2024學(xué)年第一學(xué)期高一期中考試數(shù)學(xué)試題含答案
- 2023年全國中學(xué)生英語能力競賽初三年級(jí)組試題及答案
- (完整版)青年就業(yè)創(chuàng)業(yè)見習(xí)基地匯報(bào)材料(完整版)
- 月光(羽泉)原版五線譜鋼琴譜正譜樂譜.docx
- 660MW機(jī)組空預(yù)器聲波吹灰器可行性研究報(bào)告最新(精華版)
- 控制柜安裝施工方案
- 動(dòng)車組火災(zāi)檢測(報(bào)警)系統(tǒng)
- 水面垃圾自動(dòng)打撈船的設(shè)計(jì) (全套圖紙)
- 煙草企業(yè)安全生產(chǎn)標(biāo)準(zhǔn)化 規(guī)范
- 裝飾施工技術(shù)標(biāo)準(zhǔn)及要求
- 2018秋七年級(jí)虎外考試卷英語試卷
評論
0/150
提交評論