版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
專題9.3成對數(shù)據(jù)的統(tǒng)計(jì)分析【七大題型】【新高考專用】TOC\o"1-3"\h\u【題型1變量的相關(guān)關(guān)系】 4【題型2樣本相關(guān)系數(shù)】 6【題型3一元線性回歸模型】 8【題型4非線性回歸模型】 11【題型5殘差分析】 16【題型6列聯(lián)表與獨(dú)立性檢驗(yàn)】 18【題型7獨(dú)立性檢驗(yàn)與其他知識綜合】 211、成對數(shù)據(jù)的統(tǒng)計(jì)分析考點(diǎn)要求真題統(tǒng)計(jì)考情分析(1)了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義(2)了解一元線性回歸模型和2×2列聯(lián)表,會運(yùn)用這些方法解決簡單的實(shí)際問題(3)會利用統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析2022年新高考全國I卷:第20題,12分2023年全國甲卷(文數(shù)、理數(shù)):第19題,12分2024年全國甲卷(文數(shù)):第18題,12分2024年天津卷:第3題,5分2024年上海卷:第13題,5分、第19題,12分成對數(shù)據(jù)的統(tǒng)計(jì)分析是高考的重點(diǎn)、熱點(diǎn)內(nèi)容,從近幾年的高考情況來看,主要以解答題的形式考查,一般會與概率等知識結(jié)合考查,綜合性強(qiáng),難度中等;有時(shí)也會在選擇、填空題中出現(xiàn),難度不大;復(fù)習(xí)時(shí)要加強(qiáng)此類問題的訓(xùn)練.【知識點(diǎn)1變量的相關(guān)關(guān)系】1.變量的相關(guān)關(guān)系(1)函數(shù)關(guān)系
函數(shù)關(guān)系是一種確定性關(guān)系,常用解析式來表示.
(2)相關(guān)關(guān)系
兩個(gè)變量有關(guān)系,但又沒有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這種關(guān)系稱為相關(guān)關(guān)系.與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.2.散點(diǎn)圖(1)散點(diǎn)圖
成對樣本數(shù)據(jù)都可用直角坐標(biāo)系中的點(diǎn)表示出來,由這些點(diǎn)組成的統(tǒng)計(jì)圖叫做散點(diǎn)圖.
(2)正相關(guān)和負(fù)相關(guān)
如果從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)增加的趨勢,我們就稱這兩個(gè)變量正相關(guān);如果當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)減少的趨勢,則稱這兩個(gè)變量負(fù)相關(guān).3.線性相關(guān)一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條直線附近,則稱這兩個(gè)變量線性相關(guān).【知識點(diǎn)2樣本相關(guān)系數(shù)】1.樣本相關(guān)系數(shù)(1)對于變量x和變量y,設(shè)經(jīng)過隨機(jī)抽樣獲得的成對樣本數(shù)據(jù)為(,),(,),,(,),利用相關(guān)系數(shù)r來衡量兩個(gè)變量之間線性關(guān)系的強(qiáng)弱,相關(guān)系數(shù)r的計(jì)算公式:(其中,,,和,,,的均值分別為和).①當(dāng)r>0時(shí),稱成對樣本數(shù)據(jù)正相關(guān).這時(shí),當(dāng)其中一個(gè)數(shù)據(jù)的值變小時(shí),另一個(gè)數(shù)據(jù)的值通常也變??;當(dāng)其中一個(gè)數(shù)據(jù)的值變大時(shí),另一個(gè)數(shù)據(jù)的值通常也變大.
②當(dāng)r<0時(shí),稱成對樣本數(shù)據(jù)負(fù)相關(guān).這時(shí),當(dāng)其中一個(gè)數(shù)據(jù)的值變小時(shí),另一個(gè)數(shù)據(jù)的值通常會變大;當(dāng)其中一個(gè)數(shù)據(jù)的值變大時(shí),另一個(gè)數(shù)據(jù)的值通常會變小.【知識點(diǎn)3一元線性回歸模型】1.一元線性回歸模型把式子為Y關(guān)于x的一元線性回歸模型.其中,Y稱為因變量或響應(yīng)變量,x稱為自變量或解釋變量;a和b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的隨機(jī)誤差.2.線性經(jīng)驗(yàn)回歸方程與最小二乘法設(shè)滿足一元線性回歸模型的兩個(gè)變量的n對樣本數(shù)據(jù)為(,),(,),,(,),由=+a+(i=1,2,,n),得|-(+a)|=||,顯然||越小,表示樣本數(shù)據(jù)點(diǎn)離直線y=bx+a的豎直距離越小.
通常用各散點(diǎn)到直線的豎直距離的平方之和Q=來刻畫各樣本觀測數(shù)據(jù)與直線y=bx+a的“整體接近程度”.當(dāng)a,b的取值為時(shí),Q達(dá)到最小.將=x+稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線.這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估計(jì).
經(jīng)驗(yàn)回歸直線一定過點(diǎn)(,).3.殘差分析對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.4.回歸分析的三大常用結(jié)論(1)求解經(jīng)驗(yàn)回歸方程的關(guān)鍵是確定回歸系數(shù),應(yīng)充分利用回歸直線過樣本點(diǎn)的中心.(2)根據(jù)經(jīng)驗(yàn)回歸方程計(jì)算的值,僅是一個(gè)預(yù)報(bào)值,不是真實(shí)發(fā)生的值.(3)根據(jù)的值可以判斷兩個(gè)分類變量有關(guān)的可信程度,若越大,則兩分類變量有關(guān)的把握越大.【知識點(diǎn)4列聯(lián)表與獨(dú)立性檢驗(yàn)】1.2×2列聯(lián)表假設(shè)兩個(gè)分類變量X和Y,它們的可能取值分別為{,}和{,},其2×2列聯(lián)表為XY合計(jì)y1y2x1aba+bx2cdc+d合計(jì)a+cb+da+b+c+d2×2列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù).2.獨(dú)立性檢驗(yàn)(1)假定通過簡單隨機(jī)抽樣得到了X和Y的抽樣數(shù)據(jù)列聯(lián)表,如下表所示.XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d則.(2)利用的取值推斷分類變量X和Y是否獨(dú)立的方法稱為獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡稱獨(dú)立性檢驗(yàn).
(3)獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值.3.獨(dú)立性檢驗(yàn)的應(yīng)用問題的解題策略解決獨(dú)立性檢驗(yàn)的應(yīng)用問題,一定要按照獨(dú)立性檢驗(yàn)的步驟得出結(jié)論.獨(dú)立性檢驗(yàn)的一般步驟:(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表;(2)根據(jù)公式計(jì)算;(3)通過比較與臨界值的大小關(guān)系來作統(tǒng)計(jì)推斷.【方法技巧與總結(jié)】1.經(jīng)驗(yàn)回歸直線過點(diǎn).2.求時(shí),常用公式.3.回歸分析和獨(dú)立性檢驗(yàn)都是基于成對樣本觀測數(shù)據(jù)進(jìn)行估計(jì)或推斷,得出的結(jié)論都可能犯錯誤.【題型1變量的相關(guān)關(guān)系】【例1】(2024·遼寧葫蘆島·一模)已知變量x與y的回歸直線方程為y=3x?1,變量y與z負(fù)相關(guān),則(
)A.x與y負(fù)相關(guān),x與z負(fù)相關(guān) B.x與y正相關(guān),x與z正相關(guān)C.x與y負(fù)相關(guān),x與z正相關(guān) D.x與y正相關(guān),x與z負(fù)相關(guān)【解題思路】根據(jù)已知條件,結(jié)合回歸方程可判斷x與y正相關(guān),再由變量y與z負(fù)相關(guān),即可判斷x與z負(fù)相關(guān).【解答過程】根據(jù)回歸方程y=3x?1可知變量x與y正相關(guān),又變量y與z負(fù)相關(guān),由正相關(guān)、負(fù)相關(guān)的定義可知,x與z負(fù)相關(guān).故選:D.【變式1-1】(23-24高二下·北京豐臺·期末)在一般情況下,下列各組的兩個(gè)變量呈正相關(guān)的是(
)A.某商品的銷售價(jià)格與銷售量 B.汽車勻速行駛時(shí)的路程與時(shí)間C.氣溫與冷飲的銷售量 D.人的年齡與視力【解題思路】根據(jù)相關(guān)關(guān)系的概念逐項(xiàng)判定,即可求解.【解答過程】對于A,某商品的銷售價(jià)格與銷售量呈負(fù)相關(guān)關(guān)系,故錯誤;對于B,汽車勻速行駛時(shí)的路程與時(shí)間是函數(shù)關(guān)系,故錯誤;對于C,氣溫與冷飲的銷售量呈正相關(guān),故正確;
對于D,人的年齡與視力呈負(fù)相關(guān),故錯誤.故選:C.【變式1-2】(23-24高二下·四川眉山·期末)根據(jù)物理中的胡克定律,彈簧伸長的長度與所受的外力成正比.測得一根彈簧伸長長度x和相應(yīng)所受外力F的一組數(shù)據(jù)如下:編號123456x11.21.41.61.82.0F3.083.764.315.025.516.25據(jù)此給出以下結(jié)論:①這兩變量不相關(guān);②這兩個(gè)變量負(fù)相關(guān);③這兩個(gè)變量正相關(guān).其中所有正確結(jié)論的個(gè)數(shù)是(
)A.3 B.2 C.1 D.0【解題思路】根據(jù)散點(diǎn)圖判斷.【解答過程】畫出彈簧伸長長度x和相應(yīng)所受外力F的散點(diǎn)圖,可以判斷這兩變量相關(guān),且為正相關(guān),故①②錯誤,③正確.故選:C.【變式1-3】(2024·全國·模擬預(yù)測)觀察下列散點(diǎn)圖,其中兩個(gè)變量的相關(guān)關(guān)系判斷正確的是(
)A.a(chǎn)為正相關(guān),b為負(fù)相關(guān),c為不相關(guān) B.a(chǎn)為負(fù)相關(guān),b為不相關(guān),c為正相關(guān)C.a(chǎn)為負(fù)相關(guān),b為正相關(guān),c為不相關(guān) D.a(chǎn)為正相關(guān),b為不相關(guān),c為負(fù)相關(guān)【解題思路】根據(jù)給定的散點(diǎn)圖,結(jié)合相關(guān)性,即可求解.【解答過程】根據(jù)給定的散點(diǎn)圖,可得a中的數(shù)據(jù)分布在左下方到右上方的區(qū)域里,為正相關(guān),b中的數(shù)據(jù)分布在左上方到右下方的區(qū)域里,為負(fù)相關(guān),c中的數(shù)據(jù)各點(diǎn)分布不成帶狀,相關(guān)性不明確,不相關(guān).故選:A.【題型2樣本相關(guān)系數(shù)】【例2】(2024·上海·三模)上海百聯(lián)集團(tuán)對旗下若干門店的營業(yè)額與三個(gè)影響因素分別作了相關(guān)性分析,繪制了如下的散點(diǎn)圖,則下述大小關(guān)系正確的為(
).A.r1>r2>r3 B.【解題思路】根據(jù)散點(diǎn)圖判斷兩變量的線性相關(guān)性,再根據(jù)線性相關(guān)性與相關(guān)系數(shù)的關(guān)系判斷即可.【解答過程】由散點(diǎn)圖可知,圖一兩個(gè)變量成正相關(guān),且線性相關(guān)性較強(qiáng),故r1圖二、圖三兩個(gè)變量都成負(fù)相關(guān),且圖二的線性相關(guān)性更強(qiáng),故r2<0,r3<0,r2故選:C.【變式2-1】(23-24高二上·遼寧·期末)在一組樣本數(shù)據(jù)x1,y1、x2,y2、?、xn,ynn≥2、xA.2 B.?2 C.?1 D.1【解題思路】根據(jù)相關(guān)系數(shù)的與線性相關(guān)關(guān)系可得解.【解答過程】因?yàn)樗械臉颖军c(diǎn)都在直線y=?2x+1上,所以相關(guān)系數(shù)r滿足r=1又因?yàn)?2<0,所以r<0,所以r=?1.故選:C.【變式2-2】(2024·四川成都·二模)對變量x,y有觀測數(shù)據(jù)xi,yii∈N*,得散點(diǎn)圖1;對變量u,v有觀測數(shù)據(jù)ui,viA.變量x與y呈現(xiàn)正相關(guān),且r1<r2 B.變量xC.變量x與y呈現(xiàn)正相關(guān),且r1>r2 D.變量x【解題思路】利用散點(diǎn)圖,結(jié)合相關(guān)系數(shù)的知識可得答案.【解答過程】由題意可知,變量x,y的散點(diǎn)圖中,y隨x的增大而增大,所以變量x與y呈現(xiàn)正相關(guān);再分別觀察兩個(gè)散點(diǎn)圖,圖1比圖2點(diǎn)更加集中,相關(guān)性更好,所以線性相關(guān)系數(shù)r1故選:C.【變式2-3】(2024·湖南·模擬預(yù)測)某騎行愛好者在專業(yè)人士指導(dǎo)下對近段時(shí)間騎行鍛煉情況進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)每次騎行期間的身體綜合指標(biāo)評分x與騎行用時(shí)y(單位:小時(shí))如下表:身體綜合指標(biāo)評分x12345用時(shí)(y/小時(shí))9.58.87.876.1由上表數(shù)據(jù)得到的正確結(jié)論是(
)參考數(shù)據(jù):i=1參考公式:相關(guān)系數(shù)r=i=1A.身體綜合指標(biāo)評分x與騎行用時(shí)y正相關(guān)B.身體綜合指標(biāo)評分x與騎行用時(shí)y的相關(guān)程度較弱C.身體綜合指標(biāo)評分x與騎行用時(shí)y的相關(guān)程度較強(qiáng)D.身體綜合指標(biāo)評分x與騎行用時(shí)y的關(guān)系不適合用線性回歸模型擬合【解題思路】求出相關(guān)系數(shù),根據(jù)相關(guān)系數(shù)的大小確定答案即可.【解答過程】因?yàn)橄嚓P(guān)系數(shù)r=i=1即相關(guān)系數(shù)近似為?1,y與x負(fù)相關(guān),且相關(guān)程度相當(dāng)高,從而可用線性回歸模型擬合y與x的關(guān)系.所以選項(xiàng)ABD錯誤,C正確.故選:C.【題型3一元線性回歸模型】【例3】(2024·全國·模擬預(yù)測)2023年第19屆亞運(yùn)會在杭州舉行,亞運(yùn)會的吉祥物琮琮、蓮蓮、宸宸深受大家喜愛,某商家統(tǒng)計(jì)了最近5個(gè)月銷量,如表所示:若y與x線性相關(guān),且線性回歸方程為y=?0.6x+a,則下列說法不正確的是(時(shí)間x12345銷售量y/萬只54.543.52.5A.由題中數(shù)據(jù)可知,變量y與x負(fù)相關(guān)B.當(dāng)x=5時(shí),殘差為0.2C.可以預(yù)測當(dāng)x=6時(shí)銷量約為2.1萬只D.線性回歸方程y=?0.6x+a【解題思路】對于選項(xiàng)A,利用表中數(shù)據(jù)變化情況或看回歸方程的b正負(fù)均可求解;對于選項(xiàng)B,利用樣本中心點(diǎn)求出線性回歸方程,再利用回歸方程即可求出預(yù)測值,進(jìn)而可求出殘差;對于選項(xiàng)C,利用回歸方程即可求出預(yù)測值;對于選項(xiàng)D,利用回歸方程一定過樣本中心點(diǎn)即可求解.【解答過程】對于選項(xiàng)A,從數(shù)據(jù)看,y隨x的增大而減小,所以變量y與x負(fù)相關(guān),故A正確;對于選項(xiàng)B,由表中數(shù)據(jù)知x=1+2+3+4+55所以樣本中心點(diǎn)為(3,3.9),將樣本中心點(diǎn)(3,3.9)代入y=?0.6x+a中得所以線性回歸方程為y=?0.6x+5.7,所以y5=?0.6×5+5.7=2.7對于選項(xiàng)C,當(dāng)x=6時(shí)銷量約為y=?0.6×6+5.7=2.1對于選項(xiàng)D,由B選項(xiàng)可知a=3.9+1.8=5.7故選:B.【變式3-1】(2024·河北滄州·二模)隨著“一帶一路”經(jīng)貿(mào)合作持續(xù)深化,西安某地對外貿(mào)易近幾年持續(xù)繁榮,2023年6月18日,該地很多商場都在搞“6?18”促銷活動.市物價(jià)局派人對某商品同一天的銷售量及其價(jià)格進(jìn)行調(diào)查,得到該商品的售價(jià)x(單位:元)和銷售量y(單位:百件)之間的一組數(shù)據(jù):x2025303540y578911用最小二乘法求得y與x之間的經(jīng)驗(yàn)回歸方程是y=0.28x+a,當(dāng)售價(jià)為45元時(shí),預(yù)測該商品的銷售量件數(shù)大約為(A.11.2 B.11.75 C.12 D.12.2【解題思路】求出x,y,根據(jù)回歸直線方程必過樣本中心點(diǎn)x,y求出【解答過程】因?yàn)閤=15所以回歸直線y=0.28x+a過點(diǎn)30,8,故8=0.28×30+a所以y=0.28x?0.4,將x=45代入y=0.28x?0.4中,得即當(dāng)售價(jià)為45元時(shí),該商品的銷售量件數(shù)大約為12.2百件.故選:D.【變式3-2】(2024·青海西寧·二模)只要騎車,都應(yīng)該戴頭盔.騎行頭盔是騎行中生命堅(jiān)實(shí)的保護(hù)屏障.騎行過程中的摔倒會對頭部造成很大的損害,即使騎行者是以較低的車速沿著坡度平穩(wěn)的自行車道騎行,也同樣不可忽視安全問題.佩戴頭盔的原因很簡單也很重要——保護(hù)頭部,減少傷害.相關(guān)數(shù)據(jù)表明,在每年超過500例的騎車死亡事故中,有75%的死亡原因是頭部受到致命傷害造成的,醫(yī)學(xué)研究發(fā)現(xiàn),騎車佩戴頭盔可防止85%的頭部受傷,并且大大減小了損傷程度和事故死亡率.某市對此不斷進(jìn)行安全教育,下表是該市某主干路口連續(xù)5年監(jiān)控設(shè)備抓拍到通過該路口的騎電動車不戴頭盔的人數(shù)的統(tǒng)計(jì)數(shù)據(jù):年份20192020202120222023年份序號x12345不戴頭盔人數(shù)y1450130012001100950(1)求不戴頭盔人數(shù)y與年份序號x之間的線性回歸方程;(2)預(yù)測該路口2024年不戴頭盔的人數(shù).參考公式:回歸方程y=bx+【解題思路】(1)根據(jù)所給數(shù)據(jù)求出x,y,i=15xi?x2,(2)求出x=6時(shí)y即可得解.【解答過程】(1)由題意知x=1+2+3+4+55所以i=15i=15xi所以b=所以a=所以不戴頭盔人數(shù)y與年份序號x之間的線性回歸方程為y=?120x+1560(2)當(dāng)x=6時(shí),y=?120×6+1560=840即預(yù)測該路口2024年不戴頭盔的人數(shù)為840.【變式3-3】(2024·吉林延邊·二模)我國為全面建設(shè)社會主義現(xiàn)代化國家,制定了從2021年到2025年的“十四五”規(guī)劃.某企業(yè)為響應(yīng)國家號召,匯聚科研力量,加強(qiáng)科技創(chuàng)新,準(zhǔn)備增加研發(fā)資金.該企業(yè)為了了解研發(fā)資金的投入額x(單位:百萬元)對年收入的附加額y(單位:百萬元)的影響,對往年研發(fā)資金投入額xi和年收入的附加額y投入額x234568911年收入的附加額y3.64.14.85.46.27.57.99.1(1)求年收入的附加額y與投入額x的經(jīng)驗(yàn)回歸方程;(2)若年收入的附加額與投入額的比值大于1,則稱對應(yīng)的投入額為“優(yōu)秀投資額”,現(xiàn)從上面8個(gè)投入額中任意取3個(gè),用X表示這3個(gè)投入額為“優(yōu)秀投資額”的個(gè)數(shù),求X的分布列及數(shù)學(xué)期望.【參考數(shù)據(jù)】i=18xiyi【附】在經(jīng)驗(yàn)回歸方程y=bx+a中,【解題思路】(1)根據(jù)已知數(shù)據(jù)和參考公式,即可出y與投入額x的經(jīng)驗(yàn)回歸方程;(2)求出X的所有可能取值和對應(yīng)的概率,即可求出X的分布列,再由期望公式即可求出答案.【解答過程】(1)x=2+3+4+5+6+8+9+118b=又因?yàn)閍=y?所以年收入的附加額y與投入額x的線性回歸方程為y(2)8個(gè)投入額中,“優(yōu)秀投資額”的個(gè)數(shù)為5個(gè),故X的所有可能取值為0,1,2,3,PX=0=C33C則X的分布列為X0123P115155EX=0×1【題型4非線性回歸模型】【例4】(2024·陜西安康·模擬預(yù)測)隨著移動互聯(lián)網(wǎng)和直播帶貨技術(shù)的發(fā)展,直播帶貨已經(jīng)成為一種熱門的銷售方式,特別是商家通過展示產(chǎn)品,使顧客對商品有更全面的了解.下面統(tǒng)計(jì)了某新手開啟直播帶貨后從6月份到10月份每個(gè)月的銷售量yi(萬件)(i=1,2,3,4,5)的數(shù)據(jù),得到如圖所示的散點(diǎn)圖.其中6月份至10月份相應(yīng)的代碼為xi(i=1,2,3,4,5)(1)根據(jù)散點(diǎn)圖判斷,模型①y=a+bx與模型②y=c+dx2哪一個(gè)更適宜作為月銷售量y關(guān)于月份代碼(2)(i)根據(jù)(1)的判斷結(jié)果,建立y關(guān)于x的回歸方程;(計(jì)算結(jié)果精確到0.01)(ⅱ)根據(jù)結(jié)果預(yù)測12月份的銷售量大約是多少萬件?參考公式與數(shù)據(jù):b=i=1nxi?xyi?yi=1n【解題思路】(1)根據(jù)散點(diǎn)圖結(jié)合一次函數(shù)以及二次函數(shù)圖象特征分析判斷;(2)(i)令t=x(ⅱ)令x=7,代入回歸方程運(yùn)算求解即可.【解答過程】(1)由散點(diǎn)圖可知增加幅度不一致,且散點(diǎn)圖接近于曲線,非線性,結(jié)合圖象故選模型②y=c+dx(2)(i)令t=x2,則可得t=15則d=i=15所以y關(guān)于t的回歸方程為y=1.65+0.25t即y關(guān)于x的回歸方程y=1.65+0.25(ⅱ)令x=7,可得y=1.65+0.25×預(yù)測12月份的銷售量大約是13.9萬件.【變式4-1】(2024·全國·模擬預(yù)測)腦機(jī)接口,即指在人或動物大腦與外部設(shè)備之間創(chuàng)建的直接連接,實(shí)現(xiàn)腦與設(shè)備的信息交換.近日埃隆.馬斯克宣布,腦機(jī)接口公司Neuralink正在接收第二位植入者申請,該試驗(yàn)可以實(shí)現(xiàn)意念控制手機(jī)和電腦.未來10到20年,我國腦機(jī)接口產(chǎn)業(yè)將產(chǎn)生數(shù)百億元的經(jīng)濟(jì)價(jià)值.為了適應(yīng)市場需求,同時(shí)兼顧企業(yè)盈利的預(yù)期,某科技公司決定增加一定數(shù)量的研發(fā)人員,經(jīng)過調(diào)研,得到年收益增量y(單位:億元)與研發(fā)人員增量x(人)的10組數(shù)據(jù).現(xiàn)用模型①y=bx+a,②y=c+dx根據(jù)收集到的數(shù)據(jù),計(jì)算得到下表數(shù)據(jù),其中tiyti=1i=1i=1i=17.52.2582.504.5012.142.88(1)根據(jù)殘差圖,判斷應(yīng)選擇哪個(gè)模型;(無需說明理由)(2)根據(jù)(1)中所選模型,求出y關(guān)于x的經(jīng)驗(yàn)回歸方程;并用該模型預(yù)測,要使年收益增量超過8億元,研發(fā)人員增量至少多少人?(精確到1)附:對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)x1,y1【解題思路】(1)根據(jù)殘差圖分析判斷;(2)令t=x,y與t可用線性回歸來擬合,有y=c+dt,然后根據(jù)公式結(jié)合已知的數(shù)據(jù)求出c,d,從而可求出y關(guān)于t【解答過程】(1)選擇模型②,理由如下:由于模型②殘差點(diǎn)比較均勻在落在水平的帶狀區(qū)域中,且?guī)顓^(qū)域的寬度比模型①帶狀寬度窄,所以模型②的擬合精度更高,回歸方程的預(yù)報(bào)精度相應(yīng)就會越高,所以模型②比較合適.(2)根據(jù)模型②,令t=x,y與t可用線性回歸來擬合,有則d=i=1則y關(guān)于t的經(jīng)驗(yàn)回歸方程為y^=0.64t+6.06,所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為由題意,y^=0.64x+6.06>8,解得x>97所以,要使年收益增量超過8億元,研發(fā)人員增量至少為10人.【變式4-2】(2024·福建南平·模擬預(yù)測)某大型商場的所有飲料自動售賣機(jī)在一天中某種飲料的銷售量y(單位:瓶)與天氣溫度x(單位:℃)有很強(qiáng)的相關(guān)關(guān)系,為能及時(shí)給飲料自動售賣機(jī)添加該種飲料,該商場對天氣溫度x和飲料的銷售量y進(jìn)行了數(shù)據(jù)收集,得到下面的表格:x10152025303540y41664256204840968192經(jīng)分析,可以用y=a?2kx作為y關(guān)于(1)根據(jù)表中數(shù)據(jù),求y關(guān)于x的經(jīng)驗(yàn)回歸方程(結(jié)果保留兩位小數(shù));(2)若飲料自動售賣機(jī)在一天中不需添加飲料的記1分,需添加飲料的記2分,每臺飲料自動售賣機(jī)在一天中需添加飲料的概率均為13,在商場的所有飲料自動售賣機(jī)中隨機(jī)抽取3臺,記總得分為隨機(jī)變量X,求X參考公式及數(shù)據(jù):對于一組數(shù)據(jù)x1,y1【解題思路】(1)設(shè)z=log2y,m=log2a,轉(zhuǎn)化為z=kx+m,利用最小二乘法,求得k=(2)根據(jù)題意,得到變量X的可能取值為3,4,5,6,利用獨(dú)立重復(fù)試驗(yàn)的概率公式,求得相應(yīng)的概率,列出分布列,結(jié)合期望的公式,即可求解.【解答過程】(1)解:設(shè)z=log2y,m=log2因?yàn)閘og24=2,loglog28192=13,所以由表中的數(shù)據(jù)可得x=則i=17所以k=則m=z?所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為y^(2)解:由題意,隨機(jī)變量X的可能取值為3,4,5,6,可得PX=3=2PX=5=C所以變量X的分布列為X3456P8421所以,期望為E【變式4-3】(2024·重慶·二模)某商場推出“云閃付”購物活動,由于推廣期內(nèi)優(yōu)惠力度較大,吸引了越來越多的顧客使用這種支付方式.現(xiàn)統(tǒng)計(jì)了活動剛推出一周內(nèi)每天使用“云閃付”支付的人數(shù),用x表示活動推出的天數(shù),y表示每天使用該支付方式的人數(shù),統(tǒng)計(jì)數(shù)據(jù)如下表所示:x1234567y613254073110201根據(jù)散點(diǎn)圖判斷,在推廣期內(nèi),支付的人數(shù)y關(guān)于天數(shù)x的回歸方程適合用y=c?d(1)求該回歸方程,并預(yù)測活動推出第8天使用“云閃付”的人數(shù);(lgc,(2)推廣期結(jié)束后,商場對顧客的支付方式進(jìn)行統(tǒng)計(jì),結(jié)果如下表:支付方式云閃付會員卡其它支付方式比例303040商場規(guī)定:使用會員卡支付的顧客享8折,“云閃付”的顧客隨機(jī)優(yōu)惠,其它支付方式的顧客無優(yōu)惠,根據(jù)統(tǒng)計(jì)結(jié)果得知,使用“云閃付”的顧客,享7折的概率為13,享8折的概率為16,享9折的概率為12.設(shè)顧客購買標(biāo)價(jià)為a元的商品支付的費(fèi)用為X,根據(jù)所給數(shù)據(jù)用事件發(fā)生的頻率估計(jì)相應(yīng)事件發(fā)生的概率,寫出X參考數(shù)據(jù):設(shè)vi參考公式:對于一組數(shù)據(jù)u1,v1,【解題思路】(1)由y=c?d(2)根據(jù)概率的乘法公式進(jìn)行求解列出分布列,根據(jù)期望公式計(jì)算結(jié)果.【解答過程】(1)由y=c?dx,得lgy=lgc+lgd?x,設(shè)v=x=4,lgd=把樣本中心點(diǎn)4,1.59代入方程得lgc=所以v=0.24x+0.63,即lg其回歸方程為y=當(dāng)x=8時(shí),y=(2)X的可能取值為:0.7a,0.8a,0.9a,a.PP分布列如下:X0.7a0.8a0.9aaP0.10.350.150.4所以,購物的平均費(fèi)用為:EX【題型5殘差分析】【例5】(2024·河南·模擬預(yù)測)已知一組樣本數(shù)據(jù)x1,y1,x2,y2,,xn,yA.38.1 B.22.6 C.?38.1 D.91.1【解題思路】對于響應(yīng)變量y,通過觀測得到的數(shù)據(jù)為觀測值,通過線性回歸方程得到y(tǒng)的稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.【解答過程】因?yàn)橛^測值減去預(yù)測值稱為殘差,所以當(dāng)x=9時(shí),y=?30.4+13.5×9=91.1所以殘差為53?91.1=?38.1.故選:C.【變式5-1】(2024·河北石家莊·三模)下列殘差滿足一元線性回歸模型中對隨機(jī)誤差的假定的是(
)A.
B.
C.
D.
【解題思路】根據(jù)一元線性回歸模型對隨機(jī)誤差的假定即可判斷結(jié)果.【解答過程】圖A顯示殘差與觀測時(shí)間有非線性關(guān)系,應(yīng)在模型中加入時(shí)間的非線性函數(shù)部分;圖B說明殘差的方差不是一個(gè)常數(shù),隨觀測時(shí)間變大而變大;圖C顯示殘差與觀測時(shí)間有線性關(guān)系,應(yīng)將時(shí)間變量納入模型;圖D的殘差較均勻地分布在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域內(nèi),可見D滿足一元線性回歸模型對隨機(jī)誤差的假定.故選:D.【變式5-2】(23-24高二下·河北唐山·階段練習(xí))某種產(chǎn)品的廣告費(fèi)支出x與銷售額y(單位:萬元)之間有下表關(guān)系:x24568y3040605070y與x的線性回歸方程為y=6.5x+17.5,當(dāng)廣告支出5萬元時(shí),隨機(jī)誤差的效應(yīng)(殘差)為(
A.?10 B.?20 C.20 D.10【解題思路】隨機(jī)誤差的效應(yīng)(殘差)為觀測值減去預(yù)測值【解答過程】當(dāng)廣告支出5萬元時(shí),觀測值為60,預(yù)測值為y=6.5×5+17.5=50,則隨機(jī)誤差的效應(yīng)(殘差)為60?50=10故選:D.【變式5-3】(23-24高二下·安徽·階段練習(xí))設(shè)某制造公司進(jìn)行技術(shù)升級后的第x個(gè)月(x=1,2,3,4,5)的利潤為y(單位:百萬元),根據(jù)統(tǒng)計(jì)數(shù)據(jù),求得y關(guān)于x的經(jīng)驗(yàn)回歸方程為y=6x+3,若x=1時(shí)的觀測值y=10,則x=1時(shí)的殘差為(
A.?1 B.1 C.3 D.6【解題思路】利用殘差的定義求解.【解答過程】解:因?yàn)閤=1時(shí)的預(yù)測值為y^所以殘差為10?9=1.故選:B.【題型6列聯(lián)表與獨(dú)立性檢驗(yàn)】【例6】(2024·上海閔行·二模)某疾病預(yù)防中心隨機(jī)調(diào)查了339名50歲以上的公民,研究吸煙習(xí)慣與慢性氣管炎患病的關(guān)系,調(diào)查數(shù)據(jù)如下表:不吸煙者吸煙者總計(jì)不患慢性氣管炎者121162283患慢性氣管炎者134356總計(jì)134205339假設(shè)H0:患慢性氣管炎與吸煙沒有關(guān)系,即它們相互獨(dú)立.通過計(jì)算統(tǒng)計(jì)量χ2,得χ2≈7.468,根據(jù)χ2分布概率表:P(χ2≥6.635)≈0.01,①“患慢性氣管炎與吸煙沒有關(guān)系”成立的可能性小于5%②有99%③χ2分布概率表中的0.05、0.01A.0個(gè) B.1個(gè) C.2個(gè) D.3個(gè)【解題思路】根據(jù)χ2【解答過程】解:因?yàn)棣?≈7.468,且所以有99%即“患慢性氣管炎與吸煙沒有關(guān)系”成立的可能性小于5%故①②正確;χ2分布概率表中的0.05、0.01故選:D.【變式6-1】(2024·遼寧鞍山·二模)校數(shù)學(xué)興趣社團(tuán)對“學(xué)生性別和選學(xué)生物學(xué)是否有關(guān)”作了嘗試性調(diào)查.其中被調(diào)查的男女生人數(shù)相同.男生選學(xué)生物學(xué)的人數(shù)占男生人數(shù)的45,女生選學(xué)生物學(xué)的人數(shù)占女生人數(shù)35.若有90%附表:P0.1000.0500.0100.0050.001k2.7063.8416.6357.87910.828其中,K2A.20 B.30 C.35 D.40【解題思路】借助卡方計(jì)算即可得.【解答過程】設(shè)總?cè)藬?shù)為2n,則男生選學(xué)生物學(xué)的人數(shù)為45n,女生選生物學(xué)的人數(shù)為則K2即n≥2.706×212≈28.413,又n為5故選:A.【變式6-2】(2024高三·全國·專題練習(xí))某醫(yī)院對治療支氣管肺炎的兩種方案A,B進(jìn)行比較研究,將志愿者分為兩組,分別采用方案A和方案B進(jìn)行治療,統(tǒng)計(jì)結(jié)果如下:有效無效合計(jì)使用方案A組96120使用方案B組72合計(jì)32(1)完成上述列聯(lián)表,并比較兩種治療方案有效的頻率;(2)能否在犯錯誤的概率不超過0.05的前提下認(rèn)為治療是否有效與方案選擇有關(guān)?附:K2P(K20.0050.0100.001k03.8416.63510.828【解題思路】(1)根據(jù)合計(jì)數(shù)可以完善表格,結(jié)合頻數(shù)可得頻率;(2)根據(jù)列聯(lián)表的數(shù)據(jù)和卡方公式,計(jì)算觀測值,比較觀測值和臨界值可得結(jié)論.【解答過程】解:(1)列聯(lián)表如下:有效無效合計(jì)使用方案A組9624120使用方案B組72880合計(jì)16832200使用方案A組有效的頻率為96120=0.8;使用方案B組有效的頻率為72(2)K2所以,不能在犯錯誤的概率不超過0.05的前提下認(rèn)為治療是否有效與方案選擇有關(guān).【變式6-3】(2024·上?!じ呖颊骖})為了解某地初中學(xué)生體育鍛煉時(shí)長與學(xué)業(yè)成績的關(guān)系,從該地區(qū)29000名學(xué)生中抽取580人,得到日均體育鍛煉時(shí)長與學(xué)業(yè)成績的數(shù)據(jù)如下表所示:時(shí)間范圍學(xué)業(yè)成績0,0.50.5,11,1.51.5,22,2.5優(yōu)秀5444231不優(yōu)秀1341471374027(1)該地區(qū)29000名學(xué)生中體育鍛煉時(shí)長不少于1小時(shí)人數(shù)約為多少?(2)估計(jì)該地區(qū)初中學(xué)生日均體育鍛煉的時(shí)長(精確到0.1)(3)是否有95%(附:χ2=n(ad?bc)2【解題思路】(1)求出相關(guān)占比,乘以總?cè)藬?shù)即可;(2)根據(jù)平均數(shù)的計(jì)算公式即可得到答案;(3)作出列聯(lián)表,再提出零假設(shè),計(jì)算卡方值和臨界值比較大小即可得到結(jié)論.【解答過程】(1)由表可知鍛煉時(shí)長不少于1小時(shí)的人數(shù)為占比179+43+28580則估計(jì)該地區(qū)29000名學(xué)生中體育鍛煉時(shí)長不少于1小時(shí)的人數(shù)為29000×25(2)估計(jì)該地區(qū)初中生的日均體育鍛煉時(shí)長約為15800.52則估計(jì)該地區(qū)初中學(xué)生日均體育鍛煉的時(shí)長為0.9小時(shí).(3)由題列聯(lián)表如下:1,2其他合計(jì)優(yōu)秀455095不優(yōu)秀177308485合計(jì)222358580提出零假設(shè)H0其中α=0.05.χ2則零假設(shè)不成立,即有95%【題型7獨(dú)立性檢驗(yàn)與其他知識綜合】【例7】(2024·江蘇南通·模擬預(yù)測)跑步是人們?nèi)粘I钪谐R姷囊环N鍛煉方式,其可以提高人體呼吸系統(tǒng)和心血管系統(tǒng)機(jī)能,抑制人體癌細(xì)胞生長和繁殖.為了解人們是否喜歡跑步,某調(diào)查機(jī)構(gòu)在一小區(qū)隨機(jī)抽取了40人進(jìn)行調(diào)查,統(tǒng)計(jì)結(jié)果如下表.喜歡不喜歡合計(jì)男12820女101020合計(jì)221840(1)根據(jù)以上數(shù)據(jù),判斷能否有95%的把握認(rèn)為人們對跑步的喜歡情況與性別有關(guān)?(2)該小區(qū)居民張先生每天跑步或開車上班,據(jù)以往經(jīng)驗(yàn),張先生跑步上班準(zhǔn)時(shí)到公司的概率為23,張先生跑步上班遲到的概率為13.對于下周(周一~周五)上班方式張先生作出如下安排:周一跑步上班,從周二開始,若前一天準(zhǔn)時(shí)到公司,當(dāng)天就繼續(xù)跑步上班,否則,當(dāng)天就開車上班,且因公司安排,周五開車去公司(無論周四是否準(zhǔn)時(shí)到達(dá)公司).設(shè)從周一開始到張先生第一次開車去上班前跑步上班的天數(shù)為X,求X的概率分布及數(shù)學(xué)期望附:χ2=nP0.1000.0500.0250.0100.001x2.7063.8415.0246.63510.828【解題思路】(1)由2×2列聯(lián)表中的數(shù)據(jù),求得χ2(2)由題意,得到變量X的可能取值為1,2,3,4,求得相應(yīng)的概率,列出分布列,結(jié)合期望的公式,即可求解.【解答過程】(1)解:假設(shè)H0根據(jù)題意,由2×2列聯(lián)表中的數(shù)據(jù),可得χ2因?yàn)镻χ(2)解:由題意,隨機(jī)變量X的所有可能取值分別為1,2,3,4,可得PX=1=13,PX=4所以變量X的概率分布為X1234P1248所以,期望為EX【變式7-1】(2024·安徽蕪湖·三模)在學(xué)校食堂就餐成為了很多學(xué)生的就餐選擇.現(xiàn)將一周內(nèi)在食堂就餐超過3次的學(xué)生認(rèn)定為“喜歡食堂就餐”,不超過3次的學(xué)生認(rèn)定為“不喜歡食堂就餐”.學(xué)校為了解學(xué)生食堂就餐情況,在校內(nèi)隨機(jī)抽取了100名學(xué)生,統(tǒng)計(jì)數(shù)據(jù)如下:男生女生合計(jì)喜歡食堂就餐402060不喜歡食堂就餐103040合計(jì)5050100(1)依據(jù)小概率值α=0.(2)該校甲同學(xué)逢星期二和星期四都在學(xué)校食堂就餐,且星期二會從①號、②號兩個(gè)套餐中隨機(jī)選擇一個(gè)套餐,若星期二選擇了①號套餐,則星期四選擇①號套餐的概率為45;若星期二選擇了②號套餐,則星期四選擇①號套餐的概率為23,求甲同學(xué)星期四選擇(3)用頻率估計(jì)概率,從該校學(xué)生中隨機(jī)抽取10名,記其中“喜歡食堂就餐”的人數(shù)為X.事件“X=k”的概率為PX=k,求使PX=k取得最大值時(shí)參考公式:χ2=nα0.10.050.010.0050.001x2.7063.8416.6357.87910.828【解題思路】(1)計(jì)算χ2(2)全概率公式計(jì)算概率;(3)依題意可得ξ~B10,35,即可得到【解答過程】(1)H0由列聯(lián)表可得χ所以依據(jù)小概率值α=0.(2)記星期二選擇了①號套餐為事件A1,選擇②號套餐為A星期四選擇了①號套餐為事件B1,選擇②號套餐為B則PA所以PB所以PB(3)依題意可得學(xué)生“喜歡飯?zhí)镁筒汀钡母怕蔖=60則ξ~B10,35,所以若Pξ=k取得最大值,則PC即25≥又0≤k≤10且k∈N,所以k=6【變式7-2】(2024·湖南邵陽·三模)某市開展“安全隨我行”活動,交警部門在某個(gè)交通路口增設(shè)電子抓拍眼,并記錄了某月該路口連續(xù)10日騎電動摩托車未佩戴頭盔的人數(shù)y與天數(shù)x的情況,對統(tǒng)計(jì)得到的樣本數(shù)據(jù)xixyYi=1i=1i=15.58.71.930138579.75表中Yi=ln(1)依據(jù)散點(diǎn)圖推斷,y=bx+a與y=ebx+a哪一個(gè)更適合作為未佩戴頭盔人數(shù)y與天數(shù)(2)依據(jù)(1)的結(jié)果和上表中的數(shù)據(jù)求出y關(guān)于x的回歸方程.(3)為了解佩戴頭盔情況與性別的關(guān)聯(lián)性,交警對該路口騎電動摩托車市民進(jìn)行調(diào)查,得到如下列聯(lián)表:性別佩戴頭盔合計(jì)不佩戴佩戴女性81220男性14620合計(jì)221840依據(jù)α=0.10的獨(dú)立性檢驗(yàn),能否認(rèn)為市民騎電動摩托車佩戴頭盔與性別有關(guān)聯(lián)?參考公式:b=i=1nxiyiα0.150.100.050.0250.0100.0050.001x2.0722.7063.8415.0246.6357.87910.828【解題思路】(1)根據(jù)散點(diǎn)圖的形狀,可判斷更適宜作為未佩戴頭盔人數(shù)y與天數(shù)x的回歸方程類型.(2)將y=e(3)應(yīng)用卡方公式求卡方值,由獨(dú)立性檢驗(yàn)的基本思想下結(jié)論即可.【解答過程】(1)依據(jù)散點(diǎn)圖可以判斷,y=ebx+a更適合作為未佩戴頭盔人數(shù)y與天數(shù)(2)由Yi=ln依題意得b=a=所以Y=?0.3x+3.55,即y=e(3)零假設(shè)H0根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到:χ2根據(jù)小概率值α=0.10的獨(dú)立性檢驗(yàn),我們推斷H0此推斷犯錯誤的概率不超過0.10.【變式7-3】(2024·陜西西安·模擬預(yù)測)某醫(yī)療科研小組為研究某市市民患有疾病A與是否具有生活習(xí)慣B的關(guān)系,從該市市民中隨機(jī)抽查了100人,得到如表數(shù)據(jù).(注:用M表示M的對立事件)疾病A生活習(xí)慣B具有不具有患病2515未患病2040(1)是否有超過99%的把握認(rèn)為,該市市民患有疾病A與是否具有生活習(xí)慣B(2)從該市市民中任選一人,M表示事件“選到的人不具有生活習(xí)慣B”,N表示事件“選到的人患有疾病A”,試?yán)迷撜{(diào)查數(shù)據(jù),求PN(3)從該市市民中任選3人,記這3人中具有生活習(xí)慣B,且未患有疾病A的人數(shù)為X,試?yán)迷撜{(diào)查數(shù)據(jù),求X的數(shù)學(xué)期望的估計(jì)值.附:k2=nα0.100.050.0100.001k2.7063.8416.63510.828【解題思路】(1)先完善列聯(lián)表,然后根據(jù)公式計(jì)算卡方,對照臨界值表即可得結(jié)論;(2)根據(jù)表中數(shù)據(jù)分別求出P(M(3)由二項(xiàng)分布的期望公式可得.【解答過程】(1)由已知得列聯(lián)表如下:疾病A生活習(xí)慣B合計(jì)具有不具有患病251540未患病204060合計(jì)4555100根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得:k故有超過99%的把握認(rèn)為,該市市民患有疾病A與是否具有生活習(xí)慣B(2)由(1)數(shù)據(jù)可得:P(M所以P(N(3)由(2)知,P(N所以X~B3,15,所以E(X)一、單選題1.(23-24高二下·重慶沙坪壩·階段練習(xí))已知變量x和y滿足關(guān)系y=?x+1,變量y與z正相關(guān),則(
)A.x與y負(fù)相關(guān),x與z負(fù)相關(guān) B.x與y正相關(guān),x與z正相關(guān)C.x與y正相關(guān),x與z負(fù)相關(guān) D.x與y負(fù)相關(guān),x與z正相關(guān)【解題思路】根據(jù)關(guān)系式判斷x,y負(fù)相關(guān),再由變量y與z正相關(guān)可得x,z負(fù)相關(guān)即可判斷.【解答過程】因?yàn)樽兞縳和y滿足關(guān)系y=?x+1,變量y與z正相關(guān),由正相關(guān)、負(fù)相關(guān)的定義可知x與y負(fù)相關(guān),x與z負(fù)相關(guān).故選:A.2.(2024·廣西貴港·模擬預(yù)測)下列說法中錯誤的是(
)A.獨(dú)立性檢驗(yàn)的本質(zhì)是比較觀測值與期望值之間的差異B.兩個(gè)變量x,y的相關(guān)系數(shù)為r,若r越接近1,則x與y之間的線性相關(guān)程度越強(qiáng)C.若一組樣本數(shù)據(jù)(xi,yi)(D.由一組樣本數(shù)據(jù)(xi,yi)(i=1,2,3,?,n【解題思路】根據(jù)獨(dú)立檢驗(yàn)和線性回歸方程的相關(guān)性質(zhì)進(jìn)行判斷,得到答案.【解答過程】A,獨(dú)立性檢驗(yàn)的本質(zhì)是比較觀測值與期望值之間的差異,從而確定研究對象是否有關(guān)聯(lián),A正確;B,兩個(gè)變量x,y的相關(guān)系數(shù)為r,若r越接近1,則x與y之間的線性相關(guān)程度越強(qiáng),B正確;C,若一組樣本數(shù)據(jù)(xi,yi)(D,由殘差分析可知,i=1n故選:C.3.(2024·上?!つM預(yù)測)在研究線性回歸模型時(shí),樣本數(shù)據(jù)xi,yii=1,2,3,?,n所對應(yīng)的點(diǎn)均在直線y=?12A.?1 B.1 C.?12【解題思路】結(jié)合回歸方程,根據(jù)線性相關(guān)系數(shù)的性質(zhì)可得結(jié)論.【解答過程】因?yàn)闃颖緮?shù)據(jù)所對應(yīng)的點(diǎn)都在直線y=?1所以變量y,x為負(fù)相關(guān)關(guān)系,且r=?1,故選:A.4.(2024·江西南昌·三模)如圖對兩組數(shù)據(jù)x,y和v,u分別進(jìn)行回歸分析,得到散點(diǎn)圖如圖,并求得線性回歸方程分別是y=b1x+a1和u=b2v+a2,并對變量x,y進(jìn)行線性相關(guān)檢驗(yàn),得到相關(guān)系數(shù)A.b1>0 B.b2<0 C.【解題思路】由兩散點(diǎn)圖中散點(diǎn)的位置關(guān)系直接得答案.【解答過程】由散點(diǎn)圖可知,x與y負(fù)相關(guān),v與u正相關(guān),則b1<0,且圖形中點(diǎn)x,y比v,u更加集中在一條直線附近,則r1>r2,又r1故C錯誤,D正確.故選:D.5.(2024·湖南邵陽·三模)某學(xué)習(xí)小組對一組數(shù)據(jù)xi,yii=1,2,3,?,7進(jìn)行回歸分析,甲同學(xué)首先求出回歸直線方程y=5x+4,樣本點(diǎn)的中心為2,m.乙同學(xué)對甲的計(jì)算過程進(jìn)行檢查,發(fā)現(xiàn)甲將數(shù)據(jù)2,3誤輸成3,2,將這兩個(gè)數(shù)據(jù)修正后得到回歸直線方程A.5013 B.2533 C.1123【解題思路】根據(jù)題意分析求得x2+x【解答過程】由題意可得m=5×2+4=14,即修正前的樣本中心點(diǎn)為2,14,假設(shè)甲輸入的x1,y則3+x2+且2+y2+則改為正確數(shù)據(jù)后,則x=17所以修正后的樣本中心點(diǎn)為137將點(diǎn)137,997代入回歸直線方程y=kx+7故選:A.6.(2024·湖北荊州·三模)根據(jù)變量Y和x的成對樣本數(shù)據(jù),由一元線性回歸模型Y=bx+a+eEe=0,De=A.滿足一元線性回歸模型的所有假設(shè)B.不滿足一元線性回歸模型的E(e)=0的假設(shè)C.不滿足一元線性回歸模型的D(e)=σD.不滿足一元線性回歸模型的E(e)=0和D(e)=σ【解題思路】根據(jù)一元線性回歸模型Y=bx+a+eE(e)=0,D(e)=【解答過程】用一元線性回歸模型Y=bx+a+eE(e)=0,D(e)=σ2根據(jù)對應(yīng)的殘差圖,殘差的均值E(e)=0不可能成立,且殘差圖中的點(diǎn)分布在一條拋物線形狀的彎曲帶狀區(qū)域上,說明殘差與坐標(biāo)軸變量有二次關(guān)系,D(e)=σ故選:D.7.(2024·天津河北·二模)云計(jì)算是信息技術(shù)發(fā)展的集中體現(xiàn),近年來,我國云計(jì)算市場規(guī)模持續(xù)增長.已知某科技公司2018年至2022年云計(jì)算市場規(guī)模數(shù)據(jù),且市場規(guī)模y與年份代碼x的關(guān)系可以用模型y=c1ec2年份2018年2019年2020年2021年2022年年份代碼x12345z=ln22.433.64由上表可得經(jīng)驗(yàn)回歸方程z=0.52x+a,則2026年該科技公司云計(jì)算市場規(guī)模y的估計(jì)值為(
(參考公式:a=A.e5.08 B.e5.6 C.e6.12【解題思路】根據(jù)a=z?bx可得線性回歸方程,再由回歸方程求出2026年【解答過程】因?yàn)閤所以a=即經(jīng)驗(yàn)回歸方程z=0.52x+1.44當(dāng)x=9時(shí),z=0.52×9+1.44=6.12所以y=即2026年該科技公司云計(jì)算市場規(guī)模y的估計(jì)值為e6.12故選:C.8.(2024·四川成都·三模)有甲、乙兩個(gè)班級進(jìn)行數(shù)學(xué)考試,按照大于等于85分為優(yōu)秀,85分以下為非優(yōu)秀統(tǒng)計(jì)成績,得到如下所示的列聯(lián)表:優(yōu)秀非優(yōu)秀甲班10b乙班c30附:K2=nP0.050.0250.0100.005k3.8415.0246.6357.879已知在全部105人中隨機(jī)抽取1人,成績優(yōu)秀的概率為27,則下列說法正確的是(
A.甲班人數(shù)少于乙班人數(shù)B.甲班的優(yōu)秀率高于乙班的優(yōu)秀率C.表中c的值為15,b的值為50D.根據(jù)表中的數(shù)據(jù),若按97.5%【解題思路】根據(jù)條件解出b=45,c=20,然后直接計(jì)算即可判斷A,B,C錯誤,使用K2的計(jì)算公式計(jì)算K2,并將其與【解答過程】對于C,由條件知10+b+c+30=105,10+c105=27,故所以b=45,c=20,故C錯誤;對于A,由于甲班人數(shù)為10+b=10+45=55,乙班人數(shù)為c+30=20+30=50<55,故A錯誤;對于B,由于甲班優(yōu)秀率為1055=2對于D,由于K2故選:D.二、多選題9.(2024·廣東東莞·三模)下列選項(xiàng)中正確的有(
)A.若兩個(gè)具有線性相關(guān)關(guān)系的變量的相關(guān)性越強(qiáng),則線性相關(guān)系數(shù)r的絕對值越接近于1B.在殘差圖中,殘差點(diǎn)分布的水平帶狀區(qū)域越窄,說明模型的擬合精度越高C.已知隨機(jī)變量X服從正態(tài)分布N2,σD.若數(shù)據(jù)2x1+1,2【解題思路】對于AB,結(jié)合相關(guān)系數(shù),殘差的定義,即可求解;對于C,結(jié)合正態(tài)分布的對稱性,即可求解;對于D,結(jié)合方差的線性公式,即可求解.【解答過程】若兩個(gè)具有線性相關(guān)關(guān)系的變量的相關(guān)性越強(qiáng),則線性相關(guān)系數(shù)|r|的值越接近于1,故A正確;在殘差圖中,殘差點(diǎn)分布的水平帶狀區(qū)域越窄,說明模型的擬合精度越高,故B正確;隨機(jī)變量X服從正態(tài)分布N(2,σ則P(2<X<4)=P(X<4)?P(X≤2)=0.8?0.5=0.3,故C錯誤;設(shè)數(shù)據(jù)x1,x2,…,x16的方差為m,因?yàn)閿?shù)據(jù)2x1+1,則22×m=8,解得故選:ABD.10.(2024·湖北武漢·模擬預(yù)測)某科技公司統(tǒng)計(jì)了一款A(yù)pp最近5個(gè)月的下載量如表所示,若y與x線性相關(guān),且線性回歸方程為y^=?0.6x+a月份編號x12345下載量y(萬次)54.543.52.5A.y與x負(fù)相關(guān) B.a(chǎn)C.預(yù)測第6個(gè)月的下載量是2.1萬次 D.殘差絕對值的最大值為0.2【解題思路】對于A:根據(jù)回歸方程分析判斷;對于B:根據(jù)線性回歸方程必過樣本中心點(diǎn),運(yùn)算求解;對于C:根據(jù)回歸方程進(jìn)而預(yù)測;對于D:根據(jù)題意結(jié)合殘差的定義分析判斷.【解答過程】對于A:因?yàn)?0.6<0,所以變量y與x負(fù)相關(guān),故A正確;對于B:x=y=y=?0.6x+a,則解得a=5.7,故B對于C:當(dāng)x=6時(shí),y=?0.6×6+5.7=2.1故可以預(yù)測第6個(gè)月的下載量約為2.1萬次,故C正確;對于D:當(dāng)x=1時(shí),y1=?0.6×1+5.7=5.1,當(dāng)x=2時(shí),y2=?0.6×2+5.7=4.5,當(dāng)x=3時(shí),y3=?0.6×3+5.7=3.9,當(dāng)x=4時(shí),y4=?0.6×4+5.7=3.3,當(dāng)x=5時(shí),y5=?0.6×5+5.7=2.7,故殘差絕對值的最大值為0.2,故D正確.故選:ACD.11.(2024·廣東江門·模擬預(yù)測)某中學(xué)為更好的開展素質(zhì)教育,現(xiàn)對外出研學(xué)課程是否和性別有關(guān)做了一項(xiàng)調(diào)查,其中被調(diào)查的男生和女生人數(shù)相同,且男生中選修外出研學(xué)課程的人數(shù)占男生總?cè)藬?shù)的35,女生中選修外出研學(xué)課程的人數(shù)占女生總?cè)藬?shù)的12.若依據(jù)α=0.05的獨(dú)立性檢驗(yàn),可以認(rèn)為“選修外出研學(xué)課程與性別有關(guān)”.則調(diào)查人數(shù)中男生可能有(男生女生合計(jì)選修外出研學(xué)課程aba+b未選修外出研學(xué)課程cdc+d合計(jì)a+cb+d附:P0.050.010k3.8416.635K2=A.150人 B.225人 C.300人 D.375人【解題思路】設(shè)男生人數(shù)為5nn∈N?,根據(jù)題意用n表示出女生人數(shù)、男生中“選修外出研學(xué)課程”人數(shù)、女生中“選修外出研學(xué)課程”人數(shù),進(jìn)而表示出表格中其它人數(shù),利用公式計(jì)算出K2,由【解答過程】設(shè)男生人數(shù)為5nn∈N?男生女生合計(jì)選修外出研學(xué)課程3n5n11n不選修外出研學(xué)課程2n5n9n合計(jì)5n5n10n則K2若有95%的把握認(rèn)為喜歡選修外出研學(xué)課程與性別有關(guān),則10n解得n>38.03,則5n>190.13.故選:BCD.三、填空題12.(2024·全國·模擬預(yù)測)某試驗(yàn)小組收集了部分父親和兒子的身高數(shù)據(jù),通過測量與回歸方程計(jì)算得到如下五組兒子身高的觀測值與估計(jì)值,則該組統(tǒng)計(jì)數(shù)據(jù)的決定系數(shù)R2=兒子身高觀測值/cm161.3167.7170.0173.5177.5兒子身高估計(jì)值/cm161.3167.7170.0173.5177.5【解題思路】根據(jù)決定系數(shù)的意義及表格中的數(shù)據(jù)即可求解.【解答過程】因?yàn)闆Q定系數(shù)R2從表中數(shù)據(jù)可知沒有誤差,所以R2故答案為:1.13.(2024·陜西銅川·模擬預(yù)測)已知某品牌的新能源汽車的使用時(shí)間x(年)與維護(hù)費(fèi)用y(千元)之間有如下數(shù)據(jù):使用時(shí)間x(年)246810維護(hù)費(fèi)用y(千元)2.43.24.46.87.6若x與y之間具有線性相關(guān)關(guān)系,且y關(guān)于x的線性回歸方程為y=0.7x+a.據(jù)此估計(jì),該品牌的新能源汽車的使用時(shí)間為12年時(shí),維護(hù)費(fèi)用約為【解題思路】求出x,y,得到樣本中心點(diǎn)坐標(biāo),將其代入回歸方程可求出a,然后將【解答過程】由題意可得x=2+4+6+8+10由于回歸直線過樣本的中心點(diǎn),所以0.7×6+a=4.88,解得所以回歸直線方程為y=0.7x+0.68,當(dāng)x=12時(shí),y所以當(dāng)該品牌的新能源汽車的使用時(shí)間為12年時(shí),維護(hù)費(fèi)用約為9.08千元.故答案為:9.08.14.(2024·上海金山·二模)為了考察某種藥物預(yù)防疾病的效果,進(jìn)行動物試驗(yàn),得到如下圖所示列聯(lián)表:藥物疾病合計(jì)未患病患病服用m50?m50未服用80?mm?3050合計(jì)8020100取顯著性水平α=0.05,若本次考察結(jié)果支持“藥物對疾病預(yù)防有顯著效果”,則m(m≥40,m∈N)的最小值為44.(參考公式:χ2=n【解題思路】由題意列出不等式,結(jié)合近似計(jì)算求出m的取值范圍,即可得答案.【解答過程】由題意可知χ2則(100m?4000)2解得m≥43.92或m≤36.08,而m≥40,m∈N,故m的最小值為44.故答案為:44.四、解答題15.(2024·河南新鄉(xiāng)·模擬預(yù)測)氮氧化物是一種常見的大氣污染物,下圖為我國2015年至2023年氮氧化物排放量(單位:萬噸)的折線圖,其中年份代碼1~9分別對應(yīng)年份2015~2023.已知i=19yi≈12000,i=19(1)可否用線性回歸模型擬合y與t的關(guān)系?請分別根據(jù)折線圖和相關(guān)系數(shù)加以說明.(2)若根據(jù)所給數(shù)據(jù)建立回歸模型y=?138t+2025附:相關(guān)系數(shù)r=i=1【解題思路】(1)根據(jù)題意,由相關(guān)系數(shù)的計(jì)算公式代入計(jì)算,即可判斷;(2)根據(jù)題意,由線性回歸方程的意義,即可判斷.【解答過程】(1)從折線圖看,各點(diǎn)落在一條直線附近,因而可以用線性回歸模型擬合y與t的關(guān)系,由題意知t=相關(guān)系數(shù)r=i=1故可以用線性回歸模型擬合y與t的關(guān)系.(2)可以預(yù)測2024年的氮氧化物排放量,但不可以預(yù)測2034年的氮氧化物排放量.理由如下:①2024年與所給數(shù)據(jù)的年份較接近,因而可以認(rèn)為短期內(nèi)氮氧化物排放量將延續(xù)該趨勢,故可以用此模型進(jìn)行預(yù)測;②2034年與所給數(shù)據(jù)的年份相距過遠(yuǎn),而影響氮氧化物排放量的因素有很多,這些因素在短期內(nèi)可能保持不變,但從長期看很有可能會變化,因而用此模型預(yù)測可能是不準(zhǔn)確的.16.(2024·青?!ざ#┠称髽I(yè)近年來的廣告費(fèi)用x(百萬元)與所獲得的利潤y(千萬元)的數(shù)據(jù)如下表所示,已知y與x之間具有線性相關(guān)關(guān)系.年份20182019202020212022廣告費(fèi)用x/百萬元1.51
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年專業(yè)級水暖安裝工程設(shè)計(jì)與施工合同3篇
- 2024年度章筠與前配偶關(guān)于股權(quán)分配的離婚協(xié)議書3篇
- 2024園林綠化植物租賃合同2篇
- 2024年標(biāo)準(zhǔn)挖掘機(jī)作業(yè)協(xié)議范例版B版
- 2024ic銷售合同范本:集成電路銷售及售后服務(wù)合作框架
- 2024年度智能安防系統(tǒng)操作保安員勞動合同書3篇
- 2024年教育培訓(xùn)合同標(biāo)的及培訓(xùn)內(nèi)容
- 2024年二手車買賣及二手車二手車市場管理合同書
- 2024版國畫藝術(shù)品研究與買賣合同2篇
- 2024年度體育產(chǎn)業(yè)聘用運(yùn)動員合同協(xié)議書3篇
- DB15-T 2964-2023谷子無膜淺埋滴灌栽培技術(shù)規(guī)程
- 銀行存款收支業(yè)務(wù)的處理
- 特種設(shè)備安全風(fēng)險(xiǎn)點(diǎn)管控措施清單
- WMAH開關(guān)電源產(chǎn)品規(guī)格書
- 國開電大本科《管理英語4》機(jī)考真題(第0005套)
- D500-D505 2016年合訂本防雷與接地圖集
- 贈與合同模板
- 醫(yī)療整形美容門診病例模板
- 人教版七年級生物上冊期末試卷及答案
- 道路運(yùn)輸液體危險(xiǎn)貨物罐式車輛常壓罐體定期檢驗(yàn)規(guī)則
- GB/T 34112-2022信息與文獻(xiàn)文件(檔案)管理體系要求
評論
0/150
提交評論