版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第八章成對數(shù)據(jù)的統(tǒng)計分析章末小結(jié)及測試考法一相關(guān)系數(shù)【例1-1】(2024·山西運城)對變量,有觀測數(shù)據(jù),得散點圖1;對變量,有觀測數(shù)據(jù),得散點圖2.表示變量,之間的樣本相關(guān)系數(shù),表示變量,之間的樣本相關(guān)系數(shù),則(
)A. B.C. D.【答案】A【解析】從圖像中看出隨增大而減少(圖像下降),隨增大而減少(圖像下降),則與呈負相關(guān)關(guān)系,與呈負相關(guān)關(guān)系,即,故C,D不正確;另外對比兩圖,容易看出與相關(guān)性更強,故越接近,所以得,A正確,B錯誤.故選:A.【例1-2】(2024·湖南)某騎行愛好者在專業(yè)人士指導下對近段時間騎行鍛煉情況進行統(tǒng)計分析,統(tǒng)計每次騎行期間的身體綜合指標評分與騎行用時(單位:小時)如下表:身體綜合指標評分12345用時小時)9.58.87.876.1由上表數(shù)據(jù)得到的正確結(jié)論是(
)參考數(shù)據(jù):參考公式:相關(guān)系數(shù).A.身體綜合指標評分與騎行用時正相關(guān)B.身體綜合指標評分與騎行用時的相關(guān)程度較弱C.身體綜合指標評分與騎行用時的相關(guān)程度較強D.身體綜合指標評分與騎行用時的關(guān)系不適合用線性回歸模型擬合【答案】C【解析】因為相關(guān)系數(shù).即相關(guān)系數(shù)近似為與負相關(guān),且相關(guān)程度相當高,從而可用線性回歸模型擬合與的關(guān)系.所以選項ABD錯誤,C正確.故選:C.【例1-3】(2024陜西漢中)大學生劉銘去某工廠實習,實習結(jié)束時從自己制作的某種零件中隨機選取了10個樣品,測量每個零件的橫截面積(單位:)和耗材量(單位:),得到如下數(shù)據(jù):樣本號12345678910總和零件的橫截面積0.030.050.040.070.070.040.050.060.060.050.52耗材量0.240.400.230.550.500.340.350.450.430.413.9并計算得.(1)估算劉銘同學制作的這種零件平均每個零件的橫截面積以及平均一個零件的耗材量;(2)求劉銘同學制作的這種零件的橫截面積和耗材量的樣本相關(guān)系數(shù)(精確到0.01);(3)劉銘同學測量了自己實習期制作的所有這種零件的橫截面積,并得到所有這種零件的橫截面積的和為,若這種零件的耗材量和其橫截面積近似成正比,請幫劉銘計算一下他制作的零件的總耗材量的估計值.附:相關(guān)系數(shù).【答案】(1)平均每個零件的橫截面積為,一個零件的耗材量(2)(3)【解析】(1)樣本中10個這種零件的橫截面積的平均值,樣本中10個這種零件的耗材量的平均值,由此可估算劉銘同學制作的這種零件平均每個零件的橫截面積為,平均一個零件的耗材量為.(2),這種零件的橫截面積和耗材量的樣本相關(guān)系數(shù)為.(3)設(shè)這種零件的總耗材量的估計值為,又已知這種零件的耗材量和其橫截面積近似成正比,,解得,故這種零件的總耗材量的估計值為.4【例1-4】(2023·河南·模擬預測)黨的二十大以來,國家不斷加大對科技創(chuàng)新的支持力度,極大鼓舞了企業(yè)持續(xù)投入研發(fā)的信心.某科技企業(yè)在國家一系列優(yōu)惠政策的大力扶持下,通過不斷的研發(fā)和技術(shù)革新,提升了企業(yè)收益水平.下表是對2023年1~5月份該企業(yè)的利潤y(單位:百萬)的統(tǒng)計.月份1月2月3月4月5月月份編號x12345利潤y(百萬)712131924(1)根據(jù)統(tǒng)計表,求該企業(yè)的利潤y與月份編號x的樣本相關(guān)系數(shù)(精確到0.01),并判斷它們是否具有線性相關(guān)關(guān)系(,則認為y與x的線性相關(guān)性較強,,則認為y與x的線性相關(guān)性較弱.);(2)該企業(yè)現(xiàn)有甲、乙兩條流水線生產(chǎn)同一種產(chǎn)品.為對產(chǎn)品質(zhì)量進行監(jiān)控,質(zhì)檢人員先用簡單隨機抽樣的方法從甲、乙兩條流水線上分別抽取了5件、3件產(chǎn)品進行初檢,再從中隨機選取3件做進一步的質(zhì)檢,記抽到“甲流水線產(chǎn)品”的件數(shù)為,試求的分布列與期望.附:相關(guān)系數(shù)【答案】(1);具有很強的線性相關(guān)性(2)分布列見解析;【解析】(1)由統(tǒng)計表數(shù)據(jù)可得:
所以
所以相關(guān)系數(shù),因此,兩個變量具有很強的線性相關(guān)性.(2)由題意知,的可能取值為
因為,,所以的分布列為:所以考法二線性回歸方程【例2-1】(2023山東濱州·期末)某學校一同學研究溫差(單位:℃)與本校當天新增感冒人數(shù)(單位:人)的關(guān)系,該同學記錄了5天的數(shù)據(jù):5689121620252836由上表中數(shù)據(jù)求得溫差與新增感冒人數(shù)滿足經(jīng)驗回歸方程,則下列結(jié)論不正確的是(
)A.與有正相關(guān)關(guān)系 B.經(jīng)驗回歸直線經(jīng)過點C. D.時,殘差為0.2【答案】C【解析】由表格可知,越大,越大,所以與有正相關(guān)關(guān)系,故A正確;,,樣本點中心為,經(jīng)驗回歸直線經(jīng)過點,故B正確;將樣本點中心代入直線方程,得,所以,故C錯誤;,當時,,,故D正確.故選:C【例2-2】(2024·全國·模擬預測)(多選)節(jié)約用電是低碳生活的重要組成部分,契合環(huán)保和社會可持續(xù)發(fā)展的原則,是推動“雙碳”目標實現(xiàn)的一場全社會的行動,離不開你我的共同參與.某企業(yè)從2019年開始加強節(jié)電管理,收效明顯.下表是該企業(yè)自2018年至2022年的用電量:年份2018年2019年2020年2021年2022年年份編號x12345用電量y(單位:)3.242.942.602.222.00根據(jù)表格數(shù)據(jù)計算得,.已知y與x具有線性相關(guān)關(guān)系,則下列說法中正確的是(
)(附:,)A.該企業(yè)2018年至2022年平均每年用電量為B.y與x正相關(guān)C.估計該企業(yè)2017年用電量為D.預測該企業(yè)2023年用電量為【答案】AD【解析】因為,,所以A正確;,,所以B錯誤;因為該企業(yè)是從2019年開始加強節(jié)電管理,所以不能估計2017年的用電量,所以C錯誤;因為,即y與x滿足的線性回歸方程為,2023年對應的年份編號為6,所以預計2023年該校用電量為,所以D正確.故選:AD.【例2-3】(2023山東日照)發(fā)展新能源汽車是我國從汽車大國邁向汽車強國的必由之路,是應對氣候變化推動綠色發(fā)展的戰(zhàn)略舉措.隨著國務(wù)院《新能源汽車產(chǎn)業(yè)發(fā)展規(guī)劃(2021—2035)》的發(fā)布,我國自主品牌汽車越來越具備競爭力.國產(chǎn)某品牌汽車對市場進行調(diào)研,統(tǒng)計了該品牌新能源汽車在某城市年前幾個月的銷售量(單位:輛),用表示第月份該市汽車的銷售量,得到如下統(tǒng)計表格:123456728323745475260(1)經(jīng)研究,、滿足線性相關(guān)關(guān)系,求關(guān)于的線性回歸方程,并根據(jù)此方程預測該店月份的成交量(、按四舍五入精確到整數(shù));(2)該市某店為感謝客戶,決定針對該品牌的汽車成交客戶開展抽獎活動,設(shè)“一等獎”、“二等獎”和“祝您平安”三種獎項,“一等獎”獎勵千元;“二等獎”獎勵千元;“祝您平安”獎勵紀念品一份.在一次抽獎活動中獲得“二等獎”的概率為,獲得一份紀念品的概率為,現(xiàn)有甲、乙兩個客戶參與抽獎活動,假設(shè)他們是否中獎相互獨立,求此二人所獲獎金總額(千元)的分布列及數(shù)學期望.參考數(shù)據(jù)及公式:,,.【答案】(1),預測該店月份的成交量為輛(2)分布列見解析,【解析】(1)解:由題意可得,,,,,故線性回歸方程為,當時,,故預計月份的成交量為輛.(2)解:由題意可得,獲得“一等獎”的概率為,的所有可能取值為、、、、、,,,,,,,故的分布列為:故.【例2-4】(2024重慶·階段練習)黨的十八大以來,全國各地區(qū)各部門持續(xù)加大就業(yè)優(yōu)先政策實施力度,促進居民收入增長的各項措施持續(xù)發(fā)力,居民分享到更多經(jīng)濟社會發(fā)展紅利,居民收入保持較快增長,收入結(jié)構(gòu)不斷優(yōu)化,隨著居民總收入較快增長,全體居民人均可支配收入也在不斷提升.下表為重慶市20142022年全體居民人均可支配收入,將其繪制成散點圖(如圖1),發(fā)現(xiàn)全體居民人均可支配收入與年份具有線性相關(guān)關(guān)系.(數(shù)據(jù)來源于重慶市統(tǒng)計局2023-05-06發(fā)布).年份201420152016201720182019202020212022全體居民人均可支配收入(元)183522011022034241532638628920308243380335666(1)設(shè)年份編號為(2014年的編號為1,2015年的編號為2,依此類推),記全體居民人均可支配收入為(單位:萬元),求經(jīng)驗回歸方程(結(jié)果精確到0.01),并根據(jù)所求回歸方程,預測2023年重慶市全體居民人均可支配收入;(2)為進一步對居民人均可支配收入的結(jié)構(gòu)進行分析,某分析員從20142022中任取3年的數(shù)據(jù)進行分析,將選出的人均可支配收入超過3萬的年數(shù)記為,求隨機變量的分布列與數(shù)學期望.參考數(shù)據(jù):.參考公式:對于一組數(shù)據(jù),其回歸直線方程的斜率和截距的最小二乘估計分別為.【答案】(1);3.77萬元(2)分布列見解析;1【解析】(1)由題意得,,,故,故回歸方程為,又2023年的年份編號為10,將代入,得,即預測2023年重慶市全體居民人均可支配收入為3.77萬元;(2)由圖表知,人均可支配收入超過3萬的年份有3年,故X的可能取值為,則,,,,故隨機變量的分布列為:X0123P故.考法三獨立性檢驗【例3-1】(2023江蘇常州·期末)某單位為了調(diào)查性別與對工作的滿意程度是否具有相關(guān)性,隨機抽取了若干名員工,所得數(shù)據(jù)統(tǒng)計如下表所示,其中,且,若有的把握可以認為性別與對工作的滿意程度具有相關(guān)性,則的值是.對工作滿意對工作不滿意男女附:,其中.【答案】5【解析】根據(jù)獨立性檢驗思想可得,,得,因為且,所以;故答案為:5.【例3-2】(2024河南省直轄縣級單位·期中)為了解患某疾病是否與性別有關(guān),隨機地調(diào)查了50人,得到如下的列聯(lián)表:患該疾病不患該疾病總計男151025女52025總計203050則(填“有”或“沒有”)的把握認為患該疾病與性別有關(guān).參考公式:,其中.參考數(shù)據(jù):0.0500.0100.001k3.8416.63510.828【答案】沒有【解析】根據(jù)的計算公式求得,結(jié)合題意給的數(shù)據(jù)表和獨立性檢驗的思想即可下結(jié)論.由題意知,,所以沒有99.9%的把握認為患者與該疾病有關(guān).故答案為:沒有【例3-3】(2024·山東淄博)為了解居民體育鍛煉情況,某地區(qū)對轄區(qū)內(nèi)居民體育鍛煉進行抽樣調(diào)查.統(tǒng)計其中400名居民體育鍛煉的次數(shù)與年齡,得到如下的頻數(shù)分布表.
年齡次數(shù)[20,30)[30,40)[40,50)[50,60]每周0~2次70553659每周3~4次25404431每周5次及以上552010(1)若把年齡在的鍛煉者稱為青年,年齡在的鍛煉者稱為中年,每周體育鍛煉不超過2次的稱為體育鍛煉頻率低,不低于3次的稱為體育鍛煉頻率高,根據(jù)小概率值的獨立性檢驗判斷體育鍛煉頻率的高低與年齡是否有關(guān)聯(lián);(2)從每周體育鍛煉5次及以上的樣本鍛煉者中,按照表中年齡段采用按比例分配的分層隨機抽樣,抽取8人,再從這8人中隨機抽取3人,記這3人中年齡在與的人數(shù)分別為,求ξ的分布列與期望;(3)已知小明每周的星期六、星期天都進行體育鍛煉,且兩次鍛煉均在跑步、籃球、羽毛球3種運動項目中選擇一種,已知小明在某星期六等可能選擇一種運動項目,如果星期六選擇跑步、籃球、羽毛球,則星期天選擇跑步的概率分別為,求小明星期天選擇跑步的概率.參考公式:附:α0.100.050.010.0050.0012.7063.8416.6357.87910.828【答案】(1)有關(guān)(2)分布列見解析;期望為(3)【解析】(1)零假設(shè):體育鍛煉頻率的高低與年齡無關(guān),由題得列聯(lián)表如下:青年中年合計體育鍛煉頻率低12595220體育鍛煉頻率高75105180合計200200400,根據(jù)小概率值的獨立性檢驗推斷不成立,即認為體育鍛煉頻率的高低與年齡有關(guān),此推斷犯錯誤的概率不大于0.01.(2)由數(shù)表知,利用分層抽樣的方法抽取的8人中,年齡在內(nèi)的人數(shù)分別為1,2,依題意,的所有可能取值分別為為0,1,2,所以,,,所以的分布列::012所以的數(shù)學期望為.(3)記小明在某一周星期六選擇跑步、籃球、羽毛球,分別為事件A,B,C,星期天選擇跑步為事件,則,,所以所以小明星期天選擇跑步的概率為.【例3-4】(2024·江蘇徐州)某中學對該校學生的學習興趣和預習情況進行長期調(diào)查,學習興趣分為興趣高和興趣一般兩類,預習分為主動預習和不太主動預習兩類,設(shè)事件A:學習興趣高,事件B:主動預習.據(jù)統(tǒng)計顯示,,,.(1)計算和的值,并判斷A與B是否為獨立事件;(2)為驗證學習興趣與主動預習是否有關(guān),該校用分層抽樣的方法抽取了一個容量為的樣本,利用獨立性檢驗,計算得.為提高檢驗結(jié)論的可靠性,現(xiàn)將樣本容量調(diào)整為原來的倍,使得能有99.5%的把握認為學習興趣與主動預習有關(guān),試確定的最小值.附:,其中.0.100.050.0100.0050.001k2.7063.8416.6357.87910.828【答案】(1),,不相互獨立(2)【解析】(1)由已知,,又因為,所以,所以,又,所以,所以A與B不為獨立事件;(2)假設(shè)原列聯(lián)表為興趣高興趣不高總計主動預習不太主動預習總計根據(jù)原數(shù)據(jù)有若將樣本容量調(diào)整為原來的倍,則新的列聯(lián)表為:興趣高興趣不高總計主動預習不太主動預習總計則,解得,又,所以的最小值為.考法四非線性回歸方程【例4-1】(2023山東·開學考試)為研究某池塘中水生植物的覆蓋水塘面積(單位:)與水生植物的株數(shù)(單位:株)之間的相關(guān)關(guān)系,收集了4組數(shù)據(jù),用模型去擬合與的關(guān)系,設(shè)與的數(shù)據(jù)如表格所示:得到與的線性回歸方程,則(
)346722.54.57A.-2 B.-1 C. D.【答案】C【解析】由已知可得,,,所以,有,解得,所以,,由,得,所以,,則.故選:C.【例4-2】(2024山東聊城·階段練習)今年剛過去的4月份是“全國消費促進月”,各地拼起了特色經(jīng)濟”,帶動消費復蘇、市場回暖.“小餅烤爐加蘸料,靈魂燒烤三件套”,最近,淄博燒烤在社交媒體火爆出圈,吸引全國各地的游客坐著高鐵,直奔燒烤店,而多家店鋪的營業(yè)額也在近一個月內(nèi)實現(xiàn)了成倍增長.因此某燒烤店老板考慮投入更多的人工成本,現(xiàn)有以往的服務(wù)人員增量x(單位:人)與年收益增量y單位:萬元)的數(shù)據(jù)如下:服務(wù)人員增量x/人234681013年收益增量y/萬元13223142505658據(jù)此,建立了y與x的兩個回歸模型:
模型①:由最小二乘公式可求得與的一元線性經(jīng)驗回歸方程為;模型②:由散點圖(如圖)的樣本點分布,可以認為樣本點集中在曲線的附近.對數(shù)據(jù)進行初步處理后,得到了一些統(tǒng)計的量的值:,,,,其中,(1)根據(jù)所給的統(tǒng)計量,求模型②中關(guān)于的經(jīng)驗回歸方程(精確到0.1);(2)根據(jù)下列表格中的數(shù)據(jù),比較兩種模型的決定系數(shù),并選擇擬合精度更高的模型,預測服務(wù)人員增加25人時的年收益增量.回歸模型模型①模型②回歸方程182.479.2附:樣本的最小二乘估計公式為,,刻畫樣本回歸效果的決定系數(shù)【答案】(1)=21.3-14.4(2)模型①的R2小于模型②,說明回歸模型②刻畫的擬合效果更好,92.1萬元.【解析】(1)令,則.由參考數(shù)據(jù)得==38.9-21.32×2.5≈-14.4,所以,模型②中y關(guān)于x的經(jīng)驗回歸方程為=21.3-14.4.(2)由表格中的數(shù)據(jù),有182.4>79.2,即,模型①的小于模型②,說明回歸模型②刻畫的擬合效果更好當x=25時,模型②的收益增量的預測值為=21.3×-14.4=21.3×5-14.4=92.1(萬元).所以預測服務(wù)人員增加25人時的年收益增量為92.1萬元.【例4-3】(2024吉林長春·階段練習)《中共中央國務(wù)院關(guān)于全面推進鄉(xiāng)村振興加快農(nóng)業(yè)農(nóng)村現(xiàn)代化的意見》,這是21世紀以來第個指導“三農(nóng)”工作的中央一號文件.文件指出,民族要復興,鄉(xiāng)村必振興,要大力推進數(shù)字鄉(xiāng)村建設(shè),推進智慧農(nóng)業(yè)發(fā)展.某鄉(xiāng)村合作社借助互聯(lián)網(wǎng)直播平臺進行農(nóng)產(chǎn)品銷售,眾多網(wǎng)紅主播參與到直播當中,在眾多網(wǎng)紅直播中,統(tǒng)計了名網(wǎng)紅直播的觀看人次和農(nóng)產(chǎn)品銷售量的數(shù)據(jù),得到如圖所示的散點圖.(1)利用散點圖判斷,和哪一個更適合作為觀看人次和銷售量的回歸方程類型;(只要給出判斷即可,不必說明理由)(2)對數(shù)據(jù)作出如下處理:得到相關(guān)統(tǒng)計量的值如表:其中令,.根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),求(單位:千件)關(guān)于(單位:十萬次)的回歸方程,并預測當觀看人次為萬人時的銷售量;參考數(shù)據(jù)和公式:,附:對于一組數(shù)據(jù)、、、,其回歸線的斜率和截距的最小二乘估計分別為:,.【答案】(1)更適合;(2),預測當觀看人次為萬人時的銷售量約為件.【解析】(1)解:由散點圖可知,散點分布在一條對數(shù)型曲線附近,所以選擇回歸方程更適合.(2)解:令,則,因為,,所以,又因為,,所以,所以與的線性回歸方程為,故關(guān)于的回歸方程為.令,代入回歸方程可得(千件)所以預測觀看人次為萬人時的銷售量約為件.考法五綜合運用【例5-1】(2023遼寧沈陽·期末)(多選)對兩個變量和進行回歸分析,則下列結(jié)論正確的為()A.回歸直線至少會經(jīng)過其中一個樣本點B.殘差平方和越小的模型,擬合的效果越好C.建立兩個回歸模型,模型的相關(guān)系數(shù),模型的相關(guān)系數(shù),則模型的擬合度更好D.以模型去擬合某組數(shù)據(jù)時,為了求出回歸方程,設(shè),將其變換后得到線性方程,則的值分別為【答案】BD【解析】A選項,回歸直線不一定經(jīng)過樣本點,A選項錯誤.B選項,殘差平方和越小的模型,擬合的效果越好,B選項正確.C選項,,所以模型的擬合度更好,C選項錯誤.D選項,由,得,D選項正確.故選:BD【例5-2】(2024·河南南陽)(多選)下列說法中,正確的是(
)A.設(shè)有一個經(jīng)驗回歸方程為,變量增加1個單位時,平均增加2個單位B.已知隨機變量,若,則C.兩組樣本數(shù)據(jù)和的方差分別為.若已知且,則D.已知一系列樣本點的經(jīng)驗回歸方程為,若樣本點與的殘差相等,則【答案】BC【解析】若有一個經(jīng)驗回歸方程,隨著的增大,會減小,錯誤;曲線關(guān)于對稱,因為,所以,所以,B正確;因為,所以,所以,同理可得:,故,C正確;經(jīng)驗回歸方程為,且樣本點與的殘差相等,則,D錯誤.故選:.【例5-3】(2023浙江湖州·期末)(多選)下列結(jié)論中正確的是(
)A.在列聯(lián)表中,若每個數(shù)據(jù)均變?yōu)樵瓉淼?倍,則的值不變B.已知隨機變量服從正態(tài)分布,若,則C.在一組樣本數(shù)據(jù)的散點圖中,若所有樣本點都在直線上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為0.9D.分別拋擲2枚相同的硬幣,事件表示為“第1枚為正面”,事件表示為“兩枚結(jié)果相同”,則事件是相互獨立事件【答案】BD【解析】對于A中,若的列聯(lián)表中的每個數(shù)字變成原理的2倍,則,此時變?yōu)樵淼?倍,所以A錯誤;對于B中,在隨機變量服從正態(tài)分布,若,則,所以B正確;對于C中,若所有樣本點都在直線上,則這組樣本數(shù)據(jù)完全相關(guān),所以這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為,所以C不正確;對于D中,分別拋擲2枚相同的硬幣,事件表示為“第1枚為正面”,事件表示為“兩枚結(jié)果相同”,可得,,可得,所以事件是相互獨立事件,所以D正確.故選:BD.單選題1.(2023湖北)調(diào)查某種群花萼長度和花瓣長度,所得數(shù)據(jù)如圖所示,其中相關(guān)系數(shù),下列說法正確的是(
)A.花瓣長度和花萼長度沒有相關(guān)性B.花瓣長度和花萼長度呈現(xiàn)負相關(guān)C.花瓣長度和花萼長度呈現(xiàn)正相關(guān)D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是【答案】C【解析】根據(jù)散點的集中程度可知,花瓣長度和花萼長度有相關(guān)性,A選項錯誤散點的分布是從左下到右上,從而花瓣長度和花萼長度呈現(xiàn)正相關(guān)性,B選項錯誤,C選項正確;由于是全部數(shù)據(jù)的相關(guān)系數(shù),取出來一部分數(shù)據(jù),相關(guān)性可能變強,可能變?nèi)?,即取出的?shù)據(jù)的相關(guān)系數(shù)不一定是,D選項錯誤故選:C2.(2023陜西西安)如圖是某地在50天內(nèi)感染新冠病毒的累計病例y(單位:萬人)與時間x(單位:天)的散點圖,則下列最適宜作為此模型的回歸方程類型的是(
)
A. B.C. D.【答案】B【解析】選項A,對應的“直線型”的擬合函數(shù),散點圖中的點應在某直線附近,故A錯誤;選項B,根據(jù)散點圖可以看出散點大致分布在一條“指數(shù)型”函數(shù)曲線附近,則的圖象可以如圖所示,故B正確;選項C,對應的“冪函數(shù)型”的擬合函數(shù),則其對應圖象應上凸下凹,故C錯誤;選項D,對應的“對數(shù)型”的擬合函數(shù),則其對應圖象應上凸下凹,故D錯誤.故選:B.3.(2024高三·全國·專題練習)下列命題中①散點圖可以直觀地判斷兩個變量是否具有線性相關(guān)關(guān)系;②回歸直線就是散點圖中經(jīng)過樣本數(shù)據(jù)點最多的那條直線;③回歸分析和獨立性檢驗沒有什么區(qū)別;④回歸直線一定經(jīng)過樣本中心點.其中正確的命題個數(shù)為()A. B. C. D.【答案】B【解析】散點圖可以直觀地判斷兩個變量是否具有線性相關(guān)關(guān)系,故①正確;回歸直線可以不經(jīng)過散點圖中的任何一個點,故②錯誤;回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種方法,獨立性檢驗是對兩個變量是否具有某種關(guān)系的分析,故③錯誤;回歸直線一定經(jīng)過樣本中心點,故④正確.所以正確的命題個數(shù)為個.故選:B.4.(2024天津)中國茶文化博大精深、茶水的口感與茶葉的類型和水的溫度有關(guān),某數(shù)學建模小組建立了茶水冷卻時間和茶水溫度的一組數(shù)據(jù),經(jīng)過分析,提出了四種回歸模型,①②③④四種模型的殘差平方和的值分別是.則擬合效果最好的模型是(
)A.模型① B.模型② C.模型③ D.模型④【答案】B【解析】對于回歸模型,殘差平方和越小,回歸模型的擬合效果越好,故擬合效果最好的模型是模型②.故選:B.5.(2024河北)集校為了解本校高一男生身高和體重的相關(guān)關(guān)系,在該校高一年級隨機抽取了7名男生,測量了他們的身高和體重得下表:身高(單位:167173175177178180181體重(單位:90545964677276由表格制作成如圖所示的散點圖:
由最小二乘法計算得到經(jīng)驗回歸直線的方程為,其相關(guān)系數(shù)為;經(jīng)過殘差分析,點對應殘差過大,把它去掉后,再用剩下的6組數(shù)據(jù)計算得到經(jīng)驗回歸直線的方程為,相關(guān)系數(shù)為.則下列選項正確的是(
)A.B.C.D.【答案】A【解析】身高的平均數(shù)為,因為離群點的橫坐標167小于平均值176,縱坐標90相對過大,所以去掉后經(jīng)驗回歸直線的截距變小而斜率變大,故去掉后相關(guān)性更強,擬合效果也更好,且還是正相關(guān),,故選:A.6.(2023高二下·全國·課時練習)經(jīng)統(tǒng)計,用于數(shù)學學習的時間(單位:小時)與成績(單位:分)近似于線性相關(guān)關(guān)系.對某小組學生每周用于數(shù)學的學習時間與數(shù)學成績進行數(shù)據(jù)收集如下:x1516181922y10298115115120由樣本中樣本數(shù)據(jù)求得回歸直線方程為,則點與直線的位置關(guān)系是(
)A. B.C. D.與的大小無法確定【答案】B【解析】由題意,,,因為落在回歸直線方程上,所以,故.故選:B.7.(2024天津)有人調(diào)查了某高校14名男大學生的身高及其父親的身高,得到如下數(shù)據(jù)表:編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182利用最小二乘法計算的兒子身高關(guān)于父親身高的回歸直線為.根據(jù)以上信息進行的如下推斷中,正確的是(
)A.當時,,若一位父親身高為,則他兒子長大成人后的身高一定是B.父親身高和兒子身高是正相關(guān),因此身高更高的父親,其兒子的身高也更高C.從回歸直線中,無法判斷父親身高和兒子身高是正相關(guān)還是負相關(guān)D.回歸直線的斜率可以解釋為父親身高每增加,其兒子身高平均增加【答案】D【解析】對A選項:為估計值,并不一定,故錯誤;對B選項:同上,該值為估計值,并不絕對,故錯誤;對C選項:由,故可判斷父親身高和兒子身高是正相關(guān),故錯誤;都D選項:回歸直線的斜率可以解釋為父親身高每增加,其兒子身高平均增加,故正確.故選:D.8.(2024四川綿陽)有一散點圖如圖所示,在5個數(shù)據(jù)中去掉后,給出下列說法:①相關(guān)系數(shù)r變大;②相關(guān)指數(shù)變大;③殘差平方和變??;④變量x與變量y的相關(guān)性變強.其中正確說法的個數(shù)為(
)A.1個 B.2個 C.3個 D.4個【答案】D【解析】根據(jù)題意,散點圖有5個數(shù)據(jù)中去掉,可得與的相關(guān)性越強,并且是正相關(guān),所以相關(guān)系數(shù)變大,相關(guān)指數(shù)變大,殘差的平方和變小,所以四個命題都正確.故選:D.多選題9.(2024·湖南邵陽)下列命題中,說法正確的有(
)A.設(shè)隨機變量,則B.成對樣本數(shù)據(jù)的線性相關(guān)程度越強,樣本相關(guān)系數(shù)越接近于1C.決定系數(shù)越大,表示殘差平方和越小,即模型的擬合效果越好D.基于小概率值的檢驗規(guī)則是:當時,我們就推斷不成立,即認為和不獨立,該推斷犯錯誤的概率不超過;當時,我們沒有充分證據(jù)推斷不成立,可以認為和獨立【答案】CD【解析】對于A項,根據(jù)二項分布的方差公式可得,.故A錯誤;對于B項,樣本相關(guān)系數(shù)越接近于1,線性相關(guān)性越強.故B錯誤;對于C項,決定系數(shù),殘差平方和為,根據(jù)決定系數(shù)公式可得,越大,表示殘差平方和越小,即模型的擬合效果越好.故C正確;對于D項,根據(jù)獨立性檢驗思想可知,D正確.故選:CD.10.(2023山西·期末)下列說法正確的是(
)A.設(shè)隨機變量的均值為,是不等于的常數(shù),則相對于的偏離程度小于相對于的偏離程度(偏離程度用差的平方表示)B.若一組數(shù)據(jù),,…,的方差為0,則所有數(shù)據(jù)都相同C.用決定系數(shù)比較兩個回歸模型的擬合效果時,越大,殘差平方和越小,模型擬合效果越好D.在對兩個分類變量進行獨立性檢驗時,如果列聯(lián)表中所有數(shù)據(jù)都擴大為原來的10倍,在相同的檢驗標準下,再去判斷兩變量的關(guān)聯(lián)性時,結(jié)論不會發(fā)生改變【答案】ABC【解析】對于A,由均值的性質(zhì)可知,由于是不等于的常數(shù),故可得,即相對于的偏離程度小于相對于的偏離程度,A正確;對于B,根據(jù)方差公式,可知若一組數(shù)據(jù),,…,的方差為0,則,B正確;對于C,由決定系數(shù)的定義可知,C正確,對于D,的值變?yōu)樵瓉淼?0倍,在相同的檢驗標準下,再去判斷兩變量的關(guān)聯(lián)性時,結(jié)論可能發(fā)生改變,D錯誤,故選:ABC11.(2023江蘇常州)已知由樣本數(shù)據(jù)組成的一個樣本,根據(jù)最小二乘法求得線性回歸方程為且,去除兩個異常數(shù)據(jù)和后,得到新的線性回歸直線的斜率為3,則下列結(jié)論中正確的是(
)A.相關(guān)變量,具有正相關(guān)關(guān)系B.去除異常數(shù)據(jù)后,新的平均數(shù)C.去除異常數(shù)據(jù)后的線性回歸方程為D.去除異常數(shù)據(jù)后,隨值增加,的值增加速度變大【答案】AD【解析】A選項,因為回歸方程的斜率為正,所以相關(guān)變量,具有正相關(guān)關(guān)系,所以A正確;B選項,因為,所以去除兩個異常數(shù)據(jù)和后,得到新的,故B錯;且,得,因為得到的新的經(jīng)驗回歸直線的斜率為3,所以,去除異常數(shù)據(jù)后的線性回歸方程為,故C錯;因為經(jīng)驗回歸直線的斜率為正數(shù),所以變量x,y具有正相關(guān)關(guān)系,且去除異常數(shù)據(jù)后,斜率由2增大到3,故值增加的速度變大,故D對;故選:AD12.(2023浙江寧波)某電商平臺為了對某一產(chǎn)品進行合理定價,采用不同的單價在平臺試銷,得到的數(shù)據(jù)如下表所示:單價x/元88.599.510銷量y/萬件8985807868根據(jù)以上數(shù)據(jù)得到與具有較強的線性關(guān)系,若用最小二乘估計得到經(jīng)驗回歸方程為,則(
)A.相關(guān)系數(shù) B.點一定在經(jīng)驗回歸直線上C. D.時,對應銷量的殘差為【答案】BC【解析】由表中數(shù)據(jù)可得,所以樣本中心為,故在經(jīng)驗回歸直線上,B正確,由可得與具負相關(guān),故A錯誤,將代入可得,解得,C正確,當時,,所以殘差為,D錯誤,故選:BC填空題13.(2024江西·開學考試)商家為了解某品牌取暖器的月銷售量Y(臺)與月平均氣溫之間的關(guān)系,隨機統(tǒng)計了某4個月該品牌取暖器的月銷售量與當月平均氣溫,其數(shù)據(jù)如下表;平均氣溫()10741月銷售量(臺)26375582由表中數(shù)據(jù)算出線性回歸方程中的,當平均氣溫為時,此品牌取暖器的月銷售量為臺(結(jié)果保留整數(shù)).【答案】90【解析】由題意可得,,可知點在回歸方程上,其中,即,解得,所以,當時,.故答案為:90.14.(2024·山西呂梁)某市2018年至2022年新能源汽車年銷量(單位:百臺)與年份代號的數(shù)據(jù)如下表:年份20182019202020212022年份代號01234年銷量1015203035若根據(jù)表中的數(shù)據(jù)用最小二乘法求得關(guān)于的回歸直線方程為,據(jù)此計算相應于樣本點的殘差為.【答案】/【解析】依題意,,,代入回歸直線,解得所以回歸直線為當時,,因此殘差為,故答案為:15.(2024江蘇·課時練習)在研究兩個變量的相關(guān)關(guān)系時,觀察散點圖發(fā)現(xiàn)樣本點集中于某一條指數(shù)曲線的周圍.令,求得線性回歸方程為,則該模型的非線性回歸方程為.【答案】【解析】由回歸直線方程,得:,整理得:,所以該模型的回歸方程為.故答案為:.16(2023江蘇·單元測試)為了調(diào)查患慢性氣管炎是否與吸煙有關(guān),調(diào)查了100名50歲以下的人,調(diào)查結(jié)果如下表:患慢性氣管炎未患慢性氣管炎合計吸煙20m40不吸煙n5560合計2575100根據(jù)列聯(lián)表數(shù)據(jù),求得χ2=(保留3位有效數(shù)字),根據(jù)下表,有的把握認為患慢性氣管炎與吸煙有關(guān).附:P(χ2≥x0)0.0500.0100.001x03.8416.63510.828χ2=.【答案】22.299.9%【解析】由20+m=40,得m=20.由20+n=25,得n=5.故χ2=≈22.2>10.828.所以有99.9%的把握認為患慢性氣管炎與吸煙有關(guān).故答案為:22.2;99.9%解答題17.(2023·全國·模擬預測)新冠病毒奧密克戎毒株開始流行后,為了控制新冠肺炎疫情,杭州某高中開展了每周核酸檢測工作.周一至周五,每天中午13:30開始,安排位師生進行核酸檢測,教職工每天都要檢測,用五天時間實現(xiàn)全員覆蓋.(1)該校教職工有人,高二學生有人,高三學生有人.①用分層抽樣的方法,求高一學生每天的檢測人數(shù).②高一年級共個班,該年級每天進行核酸檢測的學生有兩種安排方案.方案一:集中來自部分班級;方案二:分散來自所有班級.你認為哪種方案更合理?給出理由.(2)學校開展核酸檢測的第一周,周一至周五核酸檢測用時記錄如下表.第天用時①計算變量和的相關(guān)系數(shù)(精確到),并說明兩變量的線性相關(guān)程度;②根據(jù)①中的計算結(jié)果,判定變量和是正相關(guān)還是負相關(guān),并給出可能的原因.參考數(shù)據(jù)和公式:,相關(guān)系數(shù).【答案】(1)①;②方案二更合理,理由見解析(2)①,兩變量線性相關(guān)性很強;②負相關(guān),理由見解析【解析】(1)①高一學生每天的檢測人數(shù)為人,②方案二更合理,因為新冠病毒奧密克戎毒株傳染性更強,潛伏期更短,分散抽檢可以全面檢測年級中每班學生的狀況,更有利于防控篩查工作;(2)①,,,,,故,,兩變量線性相關(guān)性很強,②由可知變量和負相關(guān).可能的原因:隨著核酸檢測工作的開展,學校相關(guān)管理協(xié)調(diào)工作效率提高,因此用時縮短.18.(2024·貴州貴陽)某學校為學生開設(shè)了一門模具加工課,經(jīng)過一段時間的學習,擬舉行一次模具加工大賽,學生小明、小紅打算報名參加大賽.賽前,小明、小紅分別進行了為期一周的封閉強化訓練,下表記錄了兩人在封閉強化訓練期間每天加工模具成功的次數(shù),其中小明第7天的成功次數(shù)忘了記錄,但知道,(,分別表示小明、小紅第天的成功次數(shù)).第一天第二天第三天第四天第五天第六天第七天序號1234567小明成功次數(shù)162020253036小紅成功次數(shù)16222526323535(1)求這7天內(nèi)小明成功的總次數(shù)不少于小紅成功的總次數(shù)的概率;(2)根據(jù)小明這7天內(nèi)前6天的成功次數(shù),求其成功次數(shù)關(guān)于序號的線性回歸方程,并估計小明第七天成功次數(shù)的值.參考公式:回歸方程中斜率與截距的最小二乘估計公式分別為:,.參考數(shù)據(jù):;.【答案】(1)(2),【解析】(1)因為,且,所以的取值共有種情況,、分別表示小明、小紅第i天成功次數(shù),又當小明成功的總次數(shù)不少于小紅成功的總次數(shù)時,在,即,得,又,所以,且,所以小明成功的總次數(shù)不少于小紅成功的總次數(shù)時,的取值共有情況,所以這7天內(nèi)小明成功的總次數(shù)不少于小紅成功的總次數(shù)的概率為;(2)由題設(shè)可知,,,所以,,所以關(guān)于序號的線性回舊方程為.當時,,估計小明第7天成功次數(shù)的值為.19.(2023山東菏澤·期末)2023年9月23日第19屆亞運會在杭州開幕,本屆亞運會共設(shè)40個競賽大項,包括31個奧運項目和9個非奧運項目.為研究不同性別學生對杭州亞運會項目的了解情況,某學校進行了一次抽樣調(diào)查,分別抽取男生和女生各50名作為樣本,設(shè)事件“了解亞運會項目”,“學生為女生”,據(jù)統(tǒng)計,.(1)根據(jù)已知條件,填寫列聯(lián)表,并依據(jù)的獨立性檢驗,能否認為該校學生對亞運會項目的了解情況與性別有關(guān)?(2)現(xiàn)從該校了解亞運會項目的學生中,采用分層隨機抽樣的方法隨機抽取9名學生,再從這9名學生中隨機抽取4人,設(shè)抽取的4人中男生的人數(shù)為,求的分布列和數(shù)學期望.附:,.0.0500.0100.0013.8416.63510.828【答案】(1)列聯(lián)表見解析,不能(2)分布列見解析,【解析】(1)因為,,所以對杭州亞運會項目了解的女生為了解亞運會項目的學生為,結(jié)合男生和女生各50名,填寫列聯(lián)表為:了解不了解合計男生153550女生302050合計4555100零假設(shè):該校學生對杭州亞運會項目的了解情況與性別無關(guān),根據(jù)列聯(lián)表中的數(shù)據(jù),依據(jù)的獨立性檢驗,可以推斷成立,即該校學生對杭州亞運會項目的了解情況與性別無關(guān).(2)由(1)知,采用分層隨機抽樣的方法隨機抽取9名學生,其中男生人數(shù)為(人);女生人數(shù)為(人),由題意可得,隨機變量的所有可能取值為0,1,2,3.,,,.隨機變量X的分布列如下:X0123P則.20(2023·貴州貴陽)為了研究某種細菌隨天數(shù)x變化的繁殖個數(shù)y,收集數(shù)據(jù)如下:天數(shù)x123456繁殖個數(shù)y612254995190(1)在圖中作出繁殖個數(shù)y關(guān)于天數(shù)x變化的散點圖,并由散點圖判斷(a,b為常數(shù))與(,為常數(shù),且,)哪一個適宜作為繁殖個數(shù)y關(guān)于天數(shù)x變化的回歸方程類型?(給出判斷即可,不必說明理由)(2)對于非線性回歸方程(,為常數(shù),且,),令,可以得到繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x具有線性關(guān)系及一些統(tǒng)計量的值.3.5062.833.5317.50596.5712.09①證明:“對于非線性回歸方程,令,可以得到繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x具有線性關(guān)系(即,β,α為常數(shù))”;②根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(系數(shù)保留2位小數(shù)).附:對于一組數(shù)據(jù),,…,,其回歸直線方程的斜率和截距的最小二乘估計分別為,.【答案】(1)作圖見解析,選擇為回歸方程較適宜(2)①證明見解析;②【解析】(1)作出散點圖如圖所示.由散點圖看出樣本點分布在一條指數(shù)型曲線的周圍,故選擇為回歸方程較適宜;(2)①由已知,,則,則,,即.所以繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x具有線性關(guān)系.②由①知繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x可以用線性回歸方程來擬合.由表中數(shù)據(jù)可得,,則z關(guān)于x的線性回歸方程為.又,因此細菌的繁殖個數(shù)y關(guān)于天數(shù)x的非線性回歸方程為.21.(2024·四川·模擬預測)甲、乙兩醫(yī)院到某醫(yī)科大學實施“
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版返點合同協(xié)議書
- 2024贈送房地產(chǎn)投資房產(chǎn)協(xié)議范本3篇
- 2025年度醫(yī)療設(shè)備制造加工承包合同范本3篇
- 2024物業(yè)租賃合同規(guī)定書
- 2024證券公司資產(chǎn)托管業(yè)務(wù)服務(wù)合同
- 臨床微生物標本的采集方法與運送課件
- 2025年度互聯(lián)網(wǎng)公司100%股權(quán)轉(zhuǎn)讓協(xié)議書3篇
- 2024版海洋工程勘探與開發(fā)合作合同2篇
- 2024西安市二手房交易資金監(jiān)管服務(wù)合同
- 珠寶銷售顧問月工作總結(jié)
- 商鋪租賃撤場協(xié)議
- 2021版醫(yī)療廢物分類目錄專業(yè)解讀課件
- 樁基工程勞務(wù)分包施工方案
- 衛(wèi)生經(jīng)濟學理論知識考核試題及答案
- 反電信詐騙ppt-防范電信詐騙的ppt
- 危險化學品倉庫施工方案
- 加法交換律說課課件
- 樁基檢測的環(huán)保措施
- 輪機概論-大連海事大學
- 鋼筋計算截面面積及理論重量
- 基層動物防疫員培訓課件
評論
0/150
提交評論