第02講 成對數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)(原卷版)_第1頁
第02講 成對數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)(原卷版)_第2頁
第02講 成對數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)(原卷版)_第3頁
第02講 成對數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)(原卷版)_第4頁
第02講 成對數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)(原卷版)_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第02講成對數(shù)據(jù)的統(tǒng)計(jì)分析目錄考點(diǎn)要求考題統(tǒng)計(jì)考情分析(1)了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義.(2)理解一元線性回歸模型和2×2列聯(lián)表,會運(yùn)用這些方法解決簡單的實(shí)際問題.(3)會利用統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析.2023年上海卷第14題,4分2023年天津卷第7題,5分2023年甲卷(文)第19題,12分2022年I卷第20題,12分從近五年的全國卷的考查情況來看,本節(jié)是高考的熱點(diǎn),主要以解答題形式出現(xiàn),經(jīng)常與概率綜合出題,一般難度為中等.也可能以選擇題、填空題形式出現(xiàn),難度不大.主要以應(yīng)用題的方式出現(xiàn),多與經(jīng)濟(jì)、生活實(shí)際相聯(lián)系,需要在復(fù)雜的題目描述中找出數(shù)量關(guān)系,建立數(shù)學(xué)模型,并且運(yùn)用數(shù)學(xué)模型解決實(shí)際問題.知識點(diǎn)一、變量間的相關(guān)關(guān)系1、變量之間的相關(guān)關(guān)系當(dāng)自變量取值一定時,因變量的取值帶有一定的隨機(jī)性,則這兩個變量之間的關(guān)系叫相關(guān)關(guān)系.由于相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計(jì)發(fā)揮著非常重要的作用.我們可以通過收集大量的數(shù)據(jù),在對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對它們的關(guān)系作出判斷.注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.2、散點(diǎn)圖將樣本中的個數(shù)據(jù)點(diǎn)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖.根據(jù)散點(diǎn)圖中點(diǎn)的分布可以直觀地判斷兩個變量之間的關(guān)系.(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān),如圖(1)所示;(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為負(fù)相關(guān),如圖(2)所示.3、相關(guān)系數(shù)若相應(yīng)于變量的取值,變量的觀測值為,則變量與的相關(guān)系數(shù),通常用來衡量與之間的線性關(guān)系的強(qiáng)弱,的范圍為.(1)當(dāng)時,表示兩個變量正相關(guān);當(dāng)時,表示兩個變量負(fù)相關(guān).(2)越接近,表示兩個變量的線性相關(guān)性越強(qiáng);越接近,表示兩個變量間幾乎不存在線性相關(guān)關(guān)系.當(dāng)時,所有數(shù)據(jù)點(diǎn)都在一條直線上.(3)通常當(dāng)時,認(rèn)為兩個變量具有很強(qiáng)的線性相關(guān)關(guān)系.知識點(diǎn)二、線性回歸1、線性回歸線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個變量之間的關(guān)系(相關(guān)關(guān)系)的方法.對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸方程的求法為其中,,,(,)稱為樣本點(diǎn)的中心.2、殘差分析對于預(yù)報變量,通過觀測得到的數(shù)據(jù)稱為觀測值,通過回歸方程得到的稱為預(yù)測值,觀測值減去預(yù)測值等于殘差,稱為相應(yīng)于點(diǎn)的殘差,即有.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.(1)殘差圖通過殘差分析,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.(2)通過殘差平方和分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;反之,不合適.(3)相關(guān)指數(shù)用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:.越接近于,說明殘差的平方和越小,也表示回歸的效果越好.知識點(diǎn)三、非線性回歸解答非線性擬合問題,要先根據(jù)散點(diǎn)圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計(jì)算方法計(jì)算變換后的線性回歸方程系數(shù),還原后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報預(yù)測,注意計(jì)算要細(xì)心,避免計(jì)算錯誤.1、建立非線性回歸模型的基本步驟:(1)確定研究對象,明確哪個是解釋變量,哪個是預(yù)報變量;(2)畫出確定好的解釋變量和預(yù)報變量的散點(diǎn)圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);(3)由經(jīng)驗(yàn)確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、二次函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)、冪函數(shù)模型等);(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;(5)按照公式計(jì)算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;(6)消去新元,得到非線性回歸方程;(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.知識點(diǎn)四、獨(dú)立性檢驗(yàn)1、分類變量和列聯(lián)表(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯(lián)表:①定義:列出的兩個分類變量的頻數(shù)表稱為列聯(lián)表.②2×2列聯(lián)表.一般地,假設(shè)有兩個分類變量X和Y,它們的取值分別為{,}和{,},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為總計(jì)總計(jì)從列表中,依據(jù)與的值可直觀得出結(jié)論:兩個變量是否有關(guān)系.2、等高條形圖(1)等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖表示列聯(lián)表數(shù)據(jù)的頻率特征.(2)觀察等高條形圖發(fā)現(xiàn)與相差很大,就判斷兩個分類變量之間有關(guān)系.3、獨(dú)立性檢驗(yàn)計(jì)算隨機(jī)變量利用的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn).0.100.050.0100.0050.0012.7063.8416.6357.87910.828【解題方法總結(jié)】常見的非線性回歸模型(1)指數(shù)函數(shù)型(且,)兩邊取自然對數(shù),,即,令,原方程變?yōu)?,然后按線性回歸模型求出,.(2)對數(shù)函數(shù)型令,原方程變?yōu)?,然后按線性回歸模型求出,.(3)冪函數(shù)型兩邊取常用對數(shù),,即,令,原方程變?yōu)椋缓蟀淳€性回歸模型求出,.(4)二次函數(shù)型令,原方程變?yōu)?,然后按線性回歸模型求出,.(5)反比例函數(shù)型型令,原方程變?yōu)?,然后按線性回歸模型求出,.題型一:變量間的相關(guān)關(guān)系例1.(2023·河北·高三校聯(lián)考期末)下列四幅殘差分析圖中,與一元線性回歸模型擬合精度最高的是(

)A.

B.

C.

D.

例2.(2023·天津薊州·高三??奸_學(xué)考試)對兩個變量,進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù),對兩個變量,進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù),則下列判斷正確的是(

)A.變量與正相關(guān),變量與負(fù)相關(guān),變量與的線性相關(guān)性較強(qiáng)B.變量與負(fù)相關(guān),變量與正相關(guān),變量與的線性相關(guān)性較強(qiáng)C.變量與正相關(guān),變量與負(fù)相關(guān),變量與的線性相關(guān)性較強(qiáng)D.變量與負(fù)相關(guān),變量與正相關(guān),變量與的線性相關(guān)性較強(qiáng)例3.(2023·寧夏吳忠·高三鹽池高級中學(xué)校考階段練習(xí))在如圖所示的散點(diǎn)圖中,若去掉點(diǎn),則下列說法正確的是(

A.樣本相關(guān)系數(shù)變大B.變量與變量的相關(guān)程度變?nèi)魿.變量與變量呈正相關(guān)D.變量與變量的相關(guān)程度變強(qiáng)變式1.(2023·四川成都·高三統(tǒng)考階段練習(xí))已知建筑地基沉降預(yù)測對于保證施工安全,實(shí)現(xiàn)信息化監(jiān)控有著重要意義.某工程師建立了四個函數(shù)模型來模擬建筑地基沉降隨時間的變化趨勢,并用相關(guān)指數(shù)、誤差平方和、均方根值三個指標(biāo)來衡量擬合效果.相關(guān)指數(shù)越接近1表明模型的擬合效果越好,誤差平方和越小表明誤差越小,均方根值越小越好.依此判斷下面指標(biāo)對應(yīng)的模型擬合效果最好的是(

)A.相關(guān)指數(shù)誤差平方和均方根值0.9498.4910.499B.相關(guān)指數(shù)誤差平方和均方根值0.9334.1790.436C.相關(guān)指數(shù)誤差平方和均方根值0.9971.7010.141D.相關(guān)指數(shù)誤差平方和均方根值0.9972.8990.326變式2.(2023·高三課時練習(xí))甲、乙、丙、丁四位同學(xué)各自對,A,B兩變量的線性相關(guān)性做試驗(yàn),并用回歸分析方法分別求得相關(guān)系數(shù)r與殘差平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103則能體現(xiàn)A,B兩變量有更強(qiáng)的線性相關(guān)性的是(

)A.甲 B.乙 C.丙 D.丁變式3.(2023·河北石家莊·統(tǒng)考三模)觀察下列四幅殘差圖,滿足一元線性回歸模型中對隨機(jī)誤差的假定的是(

)A. B.C. D.變式4.(2023·全國·高三專題練習(xí))甲、乙、丙、丁四位同學(xué)分別對一組變量進(jìn)行線性相關(guān)試驗(yàn),并分別計(jì)算出相關(guān)系數(shù),則線性相關(guān)程度最高的是(

)甲乙丙丁0.870.910.580.83A.甲 B.乙 C.丙 D.丁變式5.(2023·全國·高三專題練習(xí))給出下列有關(guān)線性回歸分析的四個命題:①線性回歸直線未必過樣本數(shù)據(jù)點(diǎn)的中心;②回歸直線就是散點(diǎn)圖中經(jīng)過樣本數(shù)據(jù)點(diǎn)最多的那條直線;③當(dāng)相關(guān)系數(shù)時,兩個變量正相關(guān);④如果兩個變量的相關(guān)性越強(qiáng),則相關(guān)系數(shù)就越接近于.其中真命題的個數(shù)為(

)A. B. C. D.【解題方法總結(jié)】判定兩個變量相關(guān)性的方法(1)畫散點(diǎn)圖:點(diǎn)的分布從左下角到右上角,兩個變量正相關(guān);點(diǎn)的分布從左上角到右下角,兩個變量負(fù)相關(guān).(2)樣本相關(guān)系數(shù):當(dāng)r>0時,正相關(guān);當(dāng)r<0時,負(fù)相關(guān);|r|越接近于1,相關(guān)性越強(qiáng).(3)經(jīng)驗(yàn)回歸方程:當(dāng)時,正相關(guān);當(dāng)時,負(fù)相關(guān).題型二:一元線性回歸模型例4.(2023·天津薊州·高三校考開學(xué)考試)為研究某種細(xì)菌在特定環(huán)境下,隨時間變化的繁殖情況,得到如下實(shí)驗(yàn)數(shù)據(jù):天數(shù)天

繁殖個數(shù)千個

由最小二乘法得與的線性回歸方程為,則當(dāng)時,繁殖個數(shù)的預(yù)測值為(

)A. B. C. D.例5.(2023·湖南長沙·高三長郡中學(xué)校聯(lián)考階段練習(xí))某社區(qū)為了豐富退休人員的業(yè)余文化生活,自2018年以來,始終堅(jiān)持開展“悅讀小屋讀書活動”.下表是對2018年以來近5年該社區(qū)退休人員的年人均借閱量的數(shù)據(jù)統(tǒng)計(jì):年份20182019202020212022年份代碼12345年人均借閱量(冊)162228(參考數(shù)據(jù):)通過分析散點(diǎn)圖的特征后,年人均借閱量關(guān)于年份代碼的回歸分析模型為,則2023年的年人均借閱量約為(

)A.31 B.32 C.33 D.34例6.(2023·遼寧·遼寧實(shí)驗(yàn)中學(xué)??寄M預(yù)測)已知x,y的對應(yīng)值如下表所示:x02468y111若y與x線性相關(guān),且回歸直線方程為,則(

)A.2 B.3 C.4 D.5變式6.(2023·廣西南寧·南寧二中校聯(lián)考模擬預(yù)測)某單位在當(dāng)?shù)囟c(diǎn)幫扶某村種植一種草莓,并把這種原本露天種植的草莓搬到了大棚里,獲得了很好的經(jīng)濟(jì)效益.根據(jù)資料顯示,產(chǎn)出的草莓的箱數(shù)x(單位:箱)與成本y(單位:千元)的關(guān)系如下:x102030406080y(1)根據(jù)散點(diǎn)圖可以認(rèn)為x與y之間存在線性相關(guān)關(guān)系,請用最小二乘法求出線性回歸方程(,用分?jǐn)?shù)表示)(2)某農(nóng)戶種植的草莓主要以300元/箱的價格給當(dāng)?shù)卮笮蜕坛┴?,多余的草莓全部?00元/箱的價格銷售給當(dāng)?shù)匦∩特湥畵?jù)統(tǒng)計(jì),往年1月份當(dāng)?shù)卮笮蜕坛葺男枨罅繛?0箱、100箱、150箱、200箱的概率分別為,,,,根據(jù)回歸方程以及往年商超草莓的需求情況進(jìn)行預(yù)測,求今年1月份農(nóng)戶草莓的種植量為200箱時所獲得的利潤情況.(最后結(jié)果精確到個位)附:,,在線性回歸直線方程中,.變式7.(2023·江西·高三統(tǒng)考開學(xué)考試)某新能源汽車銷售部對今年1月至7月的銷售量進(jìn)行統(tǒng)計(jì)與分析,因不慎丟失一些數(shù)據(jù),現(xiàn)整理出如下統(tǒng)計(jì)表與一些分析數(shù)據(jù):月份1月2月3月4月5月6月7月月份代號1234567銷售量(單位:萬輛)15.637.739.644.5其中.(1)若,,成遞增的等差數(shù)列,求從7個月的銷售量中任取1個,月銷售量不高于27萬輛的概率;(2)若,與的樣本相關(guān)系數(shù),求關(guān)于的線性回歸方程,并預(yù)測今年8月份的銷售量(精確到0.1).附:相關(guān)系數(shù),線性回歸方程中斜率和截距的最小二乘估計(jì)公式分別為,.參考數(shù)據(jù):,.變式8.(2023·四川成都·高三石室中學(xué)??奸_學(xué)考試)已知某綠豆新品種發(fā)芽的適宜溫度在之間,一農(nóng)學(xué)實(shí)驗(yàn)室研究人員為研究溫度x()與綠豆新品種發(fā)芽數(shù)y(顆)之間的關(guān)系,每組選取了成熟種子50顆,分別在對應(yīng)的的溫度環(huán)境下進(jìn)行實(shí)驗(yàn),得到如下散點(diǎn)圖:

其中,,.(1)運(yùn)用相關(guān)系數(shù)進(jìn)行分析說明,是否可以用線性回歸模型擬合與的關(guān)系?(2)求出關(guān)于的線性回歸方程,并預(yù)測在的溫度下,種子的發(fā)芽的顆數(shù).參考公式:相關(guān)系數(shù),回歸直線方程,其中,.參考數(shù)據(jù):.變式9.(2023·安徽亳州·蒙城第一中學(xué)校聯(lián)考模擬預(yù)測)為調(diào)查某地區(qū)植被覆蓋面積x(單位:公頃)和野生動物數(shù)量y的關(guān)系,某研究小組將該地區(qū)等面積花分為400個區(qū)塊,從中隨機(jī)抽取40個區(qū)塊,得到樣本數(shù)據(jù)(),部分?jǐn)?shù)據(jù)如下:x…2.73.63.23.9…y…50.663.752.154.3…經(jīng)計(jì)算得:,,,.(1)利用最小二乘估計(jì)建立y關(guān)于x的線性回歸方程;(2)該小組又利用這組數(shù)據(jù)建立了x關(guān)于y的線性回歸方程,并把這兩條擬合直線畫在同一坐標(biāo)系下,橫坐標(biāo)x,縱坐標(biāo)y的意義與植被覆蓋面積x和野生動物數(shù)量y一致.設(shè)前者與后者的斜率分別為,,比較,的大小關(guān)系,并證明.附:y關(guān)于x的回歸方程中,斜率和截距的最小二乘估計(jì)公式分別為:,,

【解題方法總結(jié)】求經(jīng)驗(yàn)回歸方程的步驟題型三:非線性回歸例7.(2023·湖南·校聯(lián)考模擬預(yù)測)若需要刻畫預(yù)報變量和解釋變量的相關(guān)關(guān)系,且從已知數(shù)據(jù)中知道預(yù)報變量隨著解釋變量的增大而減小,并且隨著解釋變量的增大,預(yù)報變量大致趨于一個確定的值,為擬合和之間的關(guān)系,應(yīng)使用以下回歸方程中的(,為自然對數(shù)的底數(shù))(

)A. B. C. D.例8.(2023·全國·高三專題練習(xí))云計(jì)算是信息技術(shù)發(fā)展的集中體現(xiàn),近年來,我國云計(jì)算市場規(guī)模持續(xù)增長.已知某科技公司2018年至2022年云計(jì)算市場規(guī)模數(shù)據(jù),且市場規(guī)模y與年份代碼x的關(guān)系可以用模型(其中e為自然對數(shù)的底數(shù))擬合,設(shè),得到數(shù)據(jù)統(tǒng)計(jì)表如下:年份2018年2019年2020年2021年2022年年份代碼x12345云計(jì)算市場規(guī)模y/千萬元7.4112036.666.722.433.64由上表可得經(jīng)驗(yàn)回歸方程,則2025年該科技公司云計(jì)算市場規(guī)模y的估計(jì)值為(

)A. B. C. D.例9.(多選題)(2023·福建廈門·廈門一中??既#┰趯哂邢嚓P(guān)關(guān)系的兩個變量進(jìn)行回歸分析時,若兩個變量不呈線性相關(guān)關(guān)系,可以建立含兩個待定參數(shù)的非線性模型,并引入中間變量將其轉(zhuǎn)化為線性關(guān)系,再利用最小二乘法進(jìn)行線性回歸分析.下列選項(xiàng)為四個同學(xué)根據(jù)自己所得數(shù)據(jù)的散點(diǎn)圖建立的非線性模型,且散點(diǎn)圖的樣本點(diǎn)均位于第一象限,則其中可以根據(jù)上述方法進(jìn)行回歸分析的模型有(

)A. B.C. D.變式10.(2023·全國·高三專題練習(xí))已知變量的關(guān)系可以用模型擬合,設(shè),其變換后得到一組數(shù)據(jù)如下.由上表可得線性回歸方程,則(

)x12345z2451014A. B. C. D.變式11.(2023·全國·高三專題練習(xí))某校課外學(xué)習(xí)小組研究某作物種子的發(fā)芽率和溫度(單位:)的關(guān)系,由實(shí)驗(yàn)數(shù)據(jù)得到如圖所示的散點(diǎn)圖.由此散點(diǎn)圖判斷,最適宜作為發(fā)芽率和溫度的回歸方程類型的是(

)A. B.C. D.變式12.(2023·全國·高二專題練習(xí))蘭溪楊梅從5月15日起開始陸續(xù)上市,據(jù)調(diào)查統(tǒng)計(jì),得到楊梅銷售價格(單位:Q元/千克)與上市時間t(單位:天)的數(shù)據(jù)如下表所示:時間t/(單位:天)102070銷售價格Q(單位:元/千克)10050100根據(jù)上表數(shù)據(jù),從下列函數(shù)模型中選取一個描述楊梅銷售價格Q與上市時間t的變化關(guān)系:.利用你選取的函數(shù)模型,在以下四個日期中,楊梅銷售價格最低的日期為(

)A.6月5日 B.6月15日 C.6月25日 D.7月5日變式13.(2023·四川瀘州·高三四川省瀘縣第四中學(xué)??奸_學(xué)考試)抗體藥物的研發(fā)是生物技術(shù)制藥領(lǐng)域的一個重要組成部分,抗體藥物的攝入量與體內(nèi)抗體數(shù)量的關(guān)系成為研究抗體藥物的一個重要方面.某研究團(tuán)隊(duì)收集了10組抗體藥物的攝入量與體內(nèi)抗體數(shù)量的數(shù)據(jù),并對這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計(jì)量的值,抗體藥物攝入量為x(單位:),體內(nèi)抗體數(shù)量為y(單位:).29.2121634.4

(1)根據(jù)經(jīng)驗(yàn),我們選擇作為體內(nèi)抗體數(shù)量y關(guān)于抗體藥物攝入量x的回歸方程,將兩邊取對數(shù),得,可以看出與具有線性相關(guān)關(guān)系,試根據(jù)參考數(shù)據(jù)建立關(guān)于的回歸方程,并預(yù)測抗體藥物攝入量為時,體內(nèi)抗體數(shù)量的值;(2)經(jīng)技術(shù)改造后,該抗體藥物的有效率z大幅提高,經(jīng)試驗(yàn)統(tǒng)計(jì)得z服從正態(tài)分布,那這種抗體藥物的有效率超過0.54的概率約為多少?附:①對于一組數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計(jì)分別為,;②若隨機(jī)變量,則有,,;③取.變式14.(2023·江西贛州·高三??茧A段練習(xí))為了研究某種細(xì)菌隨天數(shù)變化的繁殖個數(shù),收集數(shù)據(jù)如下:天數(shù)123456繁殖個數(shù)612254995190

(1)在圖中作出繁殖個數(shù)關(guān)于天數(shù)變化的散點(diǎn)圖,并由散點(diǎn)圖判斷(為常數(shù))與(為常數(shù),且)哪一個適宜作為繁殖個數(shù)關(guān)于天數(shù)變化的回歸方程類型?(給出判斷即可,不必說明理由)(2)對于非線性回歸方程(為常數(shù),且),令,可以得到繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x具有線性關(guān)系及一些統(tǒng)計(jì)量的值.3.5062.833.5317.50596.5712.09(?。┳C明:“對于非線性回歸方程,令,可以得到繁殖個數(shù)的對數(shù)關(guān)于天數(shù)具有線性關(guān)系(即為常數(shù))”;(ⅱ)根據(jù)(ⅰ)的判斷結(jié)果及表中數(shù)據(jù),建立關(guān)于的回歸方程(系數(shù)保留2位小數(shù)).附:對于一組數(shù)據(jù),其回歸直線方程的斜率和截距的最小二乘估計(jì)分別為.變式15.(2023·重慶沙坪壩·高三重慶八中校考階段練習(xí))在正常生產(chǎn)條件下,根據(jù)經(jīng)驗(yàn),可以認(rèn)為化肥的有效利用率近似服從正態(tài)分布,而化肥施肥量因農(nóng)作物的種類不同每畝也存在差異.(1)假設(shè)生產(chǎn)條件正常,記表示化肥的有效利用率,求;(2)課題組為研究每畝化肥施用量與某農(nóng)作物畝產(chǎn)量之間的關(guān)系,收集了10組數(shù)據(jù),并對這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.其中每畝化肥施用量為(單位:公斤),糧食畝產(chǎn)量為(單位:百公斤)

參考數(shù)據(jù):65091.552.51478.630.5151546.5,,2,,.(i)根據(jù)散點(diǎn)圖判斷,與,哪一個適宜作為該農(nóng)作物畝產(chǎn)量關(guān)于每畝化肥施用量的回歸方程(給出判斷即可,不必說明理由);(ii)根據(jù)(i)的判斷結(jié)果及表中數(shù)據(jù),建立關(guān)于的回歸方程;并預(yù)測每畝化肥施用量為27公斤時,糧食畝產(chǎn)量的值.附:①對于一組數(shù)據(jù),2,3,,,其回歸直線的斜率和截距的最小二乘估計(jì)分別為,;②若隨機(jī)變量,則,.變式16.(2023·重慶·高三校聯(lián)考開學(xué)考試)某公司為了解年研發(fā)資金投入量x(單位:億元)對年銷售額y(單位:億元)的影響.對公司近12年的年研發(fā)資金投入量xi和年銷售額yi的數(shù)據(jù),進(jìn)行了對比分析,建立了兩個模型:①,②,其中α,β,λ,t均為常數(shù),e為自然對數(shù)的底數(shù),并得到一些統(tǒng)計(jì)量的值.令,經(jīng)計(jì)算得如下數(shù)據(jù):20667724604.20312502153.0814(1)請從相關(guān)系數(shù)的角度,分析哪一個模型擬合程度更好?(2)(?。└鶕?jù)分析及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;(ⅱ)若下一年銷售額y需達(dá)到90億元,預(yù)測下一年的研發(fā)資金投入量x是多少億元?附:①相關(guān)系數(shù),回歸直中公式分別為;②參考數(shù)據(jù):.變式17.(2023·江蘇鎮(zhèn)江·江蘇省鎮(zhèn)江中學(xué)??既#┙?jīng)觀測,長江中某魚類的產(chǎn)卵數(shù)與溫度有關(guān),現(xiàn)將收集到的溫度和產(chǎn)卵數(shù)的10組觀測數(shù)據(jù)作了初步處理,得到如圖的散點(diǎn)圖及一些統(tǒng)計(jì)量表.360表中

(1)根據(jù)散點(diǎn)圖判斷,與哪一個適宜作為與之間的回歸方程模型并求出關(guān)于回歸方程;(給出判斷即可,不必說明理由)(2)某興趣小組抽取兩批魚卵,已知第一批中共有6個魚卵,其中“死卵”有2個;第二批中共有8個魚卵,其中“死卵”有3個.現(xiàn)隨機(jī)挑選一批,然后從該批次中隨機(jī)取出2個魚卵,求取出“死卵”個數(shù)的分布列及數(shù)學(xué)期望.附:對于一組數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計(jì)分別為.變式18.(2023·廣西南寧·南寧三中??家荒#?shù)據(jù)顯示中國車載音樂已步入快速發(fā)展期,隨著車載音樂的商業(yè)化模式進(jìn)一步完善,市場將持續(xù)擴(kuò)大,下表為2018-2022年中國車載音樂市場規(guī)模(單位:十億元),其中年份2018—2022對應(yīng)的代碼分別為1-5.年份代碼12345車載音樂市場規(guī)模2.83.97.312.017.0(1)由上表數(shù)據(jù)知,可用指數(shù)函數(shù)模型擬合與的關(guān)系,請建立關(guān)于的回歸方程;(2)根據(jù)上述數(shù)據(jù)求得關(guān)于的回歸方程后,預(yù)測2024年的中國車載音樂市場規(guī)模.參考數(shù)據(jù):1.9433.821.71.626.84其中,.參考公式:對于一組數(shù)據(jù),,,其回歸直線的斜率和截距的最小二乘法估計(jì)公式分別為,.變式19.(2023·安徽合肥·合肥市第八中學(xué)??寄M預(yù)測)當(dāng)前移動網(wǎng)絡(luò)已融入社會生活的方方面面,深刻改變了人們的溝通?交流乃至整個生活方式.4G網(wǎng)絡(luò)雖然解決了人與人隨時隨地通信的問題,但隨著移動互聯(lián)網(wǎng)快速發(fā)展,其已難以滿足未來移動數(shù)據(jù)流量暴漲的需求,而5G作為一種新型移動通信網(wǎng)絡(luò),不但可以解決人與人的通信問題,而且還可以為用戶提供增強(qiáng)現(xiàn)實(shí)?虛擬現(xiàn)實(shí)?超高清(3D)視頻等更加身臨其境的極致業(yè)務(wù)體驗(yàn),更重要的是還可以解決人與物?物與物的通信問題,從而滿足移動醫(yī)療?車聯(lián)網(wǎng)?智能家居?工業(yè)控制?環(huán)境監(jiān)測等物聯(lián)網(wǎng)應(yīng)用需求,為更好的滿足消費(fèi)者對5G網(wǎng)絡(luò)的需求,中國電信在某地區(qū)推出了六款不同價位的流量套餐,每款套餐的月資費(fèi)x(單位:元)與購買人數(shù)y(單位:萬人)的數(shù)據(jù)如下表:套餐ABCDEF月資費(fèi)x(元)384858687888購買人數(shù)y(萬人)16.818.820.722.424.025.5對數(shù)據(jù)作初步的處理,相關(guān)統(tǒng)計(jì)量的值如下表:75.324.618.3101.4其中,且繪圖發(fā)現(xiàn),散點(diǎn)集中在一條直線附近.(1)根據(jù)所給數(shù)據(jù),求出關(guān)于的回歸方程;(2)已知流量套餐受關(guān)注度通過指標(biāo)來測定,當(dāng)時相應(yīng)的流量套餐受大眾的歡迎程度更高,被指定為“主打套餐”.現(xiàn)有一家四口從這六款套餐中,購買不同的四款各自使用.記四人中使用“主打套督”的人數(shù)為,求隨機(jī)變量的分布列和期望.附:對于一組數(shù)據(jù),其回歸方程的斜率和截距的最小二乘估計(jì)值分別為.【解題方法總結(jié)】換元法變成一元線性回歸模型題型四:列聯(lián)表與獨(dú)立性檢驗(yàn)例10.(2023·廣東佛山·華南師大附中南海實(shí)驗(yàn)高中??寄M預(yù)測)四川省將從2022年秋季入學(xué)的高一年級學(xué)生開始實(shí)行高考綜合改革,高考采用“3+1+2”模式,其中“1”為首選科目,即物理與歷史二選一.某校為了解學(xué)生的首選意愿,對部分高一學(xué)生進(jìn)行了抽樣調(diào)查,制作出如下兩個等高條形圖,根據(jù)條形圖信息,下列結(jié)論正確的是(

)A.樣本中選擇物理意愿的男生人數(shù)少于選擇歷史意愿的女生人數(shù)B.樣本中女生選擇歷史意愿的人數(shù)多于男生選擇歷史意愿的人數(shù)C.樣本中選擇物理學(xué)科的人數(shù)較多D.樣本中男生人數(shù)少于女生人數(shù)例11.(2023·全國·高三專題練習(xí))在新高考改革中,浙江省新高考實(shí)行的是7選3的模式,即語數(shù)外三門為必考科目,然后從物理、化學(xué)、生物、政治、歷史、地理、技術(shù)(含信息技術(shù)和通用技術(shù))7門課中選考3門.某校高二學(xué)生選課情況如下列聯(lián)表一和列聯(lián)表二(單位:人)選物理不選物理總計(jì)男生340110450女生140210350總計(jì)480320800表一選生物不選生物總計(jì)男生150300450女生150200350總計(jì)300500800表二試根據(jù)小概率值的獨(dú)立性檢驗(yàn),分析物理和生物選課與性別是否有關(guān)(

)附:A.選物理與性別有關(guān),選生物與性別有關(guān)B.選物理與性別無關(guān),選生物與性別有關(guān)C.選物理與性別有關(guān),選生物與性別無關(guān)D.選物理與性別無關(guān),選生物與性別無關(guān)例12.(2023·全國·高三專題練習(xí))通過隨機(jī)詢問相同數(shù)量的不同性別大學(xué)生在購買食物時是否看營養(yǎng)說明,得知有的男大學(xué)生“不看”,有的女大學(xué)生“不看”,若有99%的把握認(rèn)為性別與是否看營養(yǎng)說明之間有關(guān),則調(diào)查的總?cè)藬?shù)可能為(

)A.150 B.170 C.240 D.175變式20.(2023·全國·高三專題練習(xí))針對時下的“短視頻熱”,某高校團(tuán)委對學(xué)生性別和喜歡短視頻是否有關(guān)聯(lián)進(jìn)行了一次調(diào)查,其中被調(diào)查的男生?女生人數(shù)均為人,男生中喜歡短視頻的人數(shù)占男生人數(shù)的,女生中喜歡短視頻的人數(shù)占女生人數(shù)的.零假設(shè)為:喜歡短視頻和性別相互獨(dú)立.若依據(jù)的獨(dú)立性檢驗(yàn)認(rèn)為喜歡短視頻和性別不獨(dú)立,則的最小值為(

)附:,附表:0.050.013.8416.635A.7 B.8 C.9 D.10變式21.(2023·全國·高三專題練習(xí))在一次聯(lián)考后,某校對甲、乙兩個文科班的數(shù)學(xué)考試成績進(jìn)行分析,規(guī)定:大于或等于120分為優(yōu)秀,120分以下為非優(yōu)秀,統(tǒng)計(jì)成績后,得到如下2×2列聯(lián)表:優(yōu)秀非優(yōu)秀合計(jì)甲班人數(shù)50乙班人數(shù)20合計(jì)30110附:,其中.根據(jù)獨(dú)立性檢驗(yàn),可以認(rèn)為數(shù)學(xué)考試成績與班級有關(guān)系的把握為(

)A. B. C. D.變式22.(2023·全國·高三專題練習(xí))2020年2月,全國掀起了“停課不停學(xué)”的熱潮,各地教師通過網(wǎng)絡(luò)直播?微課推送等多種方式來指導(dǎo)學(xué)生線上學(xué)習(xí).為了調(diào)查學(xué)生對網(wǎng)絡(luò)課程的熱愛程度,研究人員隨機(jī)調(diào)查了相同數(shù)量的男?女學(xué)生,發(fā)現(xiàn)有80%的男生喜歡網(wǎng)絡(luò)課程,有40%的女生不喜歡網(wǎng)絡(luò)課程,且有99%的把握但沒有99.9%的把握認(rèn)為是否喜歡網(wǎng)絡(luò)課程與性別有關(guān),則被調(diào)查的男?女學(xué)生總數(shù)量可能為(

)附:,其中.0.10.050.010.0012.7063.8416.63510.828A.130 B.190 C.240 D.250變式23.(2023·全國·高三專題練習(xí))觀察下列各圖,其中兩個分類變量x,y之間關(guān)系最強(qiáng)的是(

)A. B.C. D.變式24.(2023·重慶沙坪壩·高三重慶八中??奸_學(xué)考試)2022年卡塔爾世界杯決賽圈共有32支球隊(duì)參加,歐洲球隊(duì)有13支:其中有5支歐洲球隊(duì)闖入8強(qiáng).比賽進(jìn)入淘汰賽階段后,必須要分出勝負(fù).淘汰賽規(guī)則如下:在比賽常規(guī)時間90分鐘內(nèi)分出勝負(fù);比賽結(jié)束,若比分相同.則進(jìn)入30分鐘的加時賽.在加時賽分出勝負(fù),比賽結(jié)束,若加時賽比分依然相同,就要通過點(diǎn)球大戰(zhàn)來分出最后的勝負(fù).點(diǎn)球大戰(zhàn)分為2個階段,第一階段:共5輪,雙方每輪各派1名球員,依次踢點(diǎn)球,以5輪的總進(jìn)球數(shù)作為標(biāo)準(zhǔn),5輪合計(jì)踢進(jìn)點(diǎn)球數(shù)更多的球隊(duì)獲得比賽的勝利.如果第一階段的5輪還是平局,則進(jìn)入第二階段:在該階段雙方每輪各派1名球員,依次踢點(diǎn)球,如果在一輪里,雙方都進(jìn)球或者雙方都不進(jìn)球,則繼續(xù)下一輪,直到某一輪里,一方罰進(jìn)點(diǎn)球,另一方?jīng)]罰進(jìn),比賽結(jié)束,罰進(jìn)點(diǎn)球的一方獲得最終的勝利.(1)根據(jù)題意填寫下面的列聯(lián)表,并根據(jù)小概率值的獨(dú)立性檢驗(yàn),判斷32支決賽圈球隊(duì)“闖入8強(qiáng)”與“是歐洲球隊(duì)”是否有關(guān).歐洲球隊(duì)其他球隊(duì)合計(jì)闖入強(qiáng)未闖入強(qiáng)合計(jì)(2)甲、乙兩隊(duì)在淘汰賽相遇,經(jīng)過120分鐘比賽未分出勝負(fù),雙方進(jìn)入點(diǎn)球大戰(zhàn).已知甲隊(duì)球員每輪踢進(jìn)點(diǎn)球的概率為,乙隊(duì)球員每輪踢進(jìn)點(diǎn)球的概率為,每輪每隊(duì)是否進(jìn)球相互獨(dú)立,在點(diǎn)球大戰(zhàn)中,兩隊(duì)前3輪比分為,試求出甲隊(duì)在第二階段第一輪結(jié)束后獲得最終勝利的概率.參考公式:.變式25.(2023·廣東東莞·高三校聯(lián)考階段練習(xí))在“雙減”政策背景之下,某校就推進(jìn)學(xué)校、家庭、社會體育教育的“一體化”,實(shí)現(xiàn)“教會、勤練、常賽”的核心任務(wù).學(xué)校組織人員對在校學(xué)生“是否喜愛運(yùn)動”做了一次隨機(jī)調(diào)查.共隨機(jī)調(diào)查了18名男生和12名女生,調(diào)查發(fā)現(xiàn),男、女生中分別有12人和6人喜愛運(yùn)動,其余不喜愛.喜歡運(yùn)動不喜歡運(yùn)動總計(jì)男女總計(jì)(1)根據(jù)以上數(shù)據(jù)完成以下列聯(lián)表:0.400.250.100.0100.7081.3232.7066.635根據(jù)小概率值的獨(dú)立性檢驗(yàn),能否據(jù)此推斷性別與喜愛運(yùn)動有關(guān)?(2)從被調(diào)查的女生中抽取3人,若其中喜愛運(yùn)動的人數(shù)為,求的分布列及數(shù)學(xué)期望.附參考公式及參考數(shù)據(jù):,其中.變式26.(2023·遼寧·高三校聯(lián)考開學(xué)考試)第31屆世界大學(xué)生夏季運(yùn)動會,是中國西部第一次舉辦世界性綜合運(yùn)動會,共設(shè)籃球、排球、田徑、游泳等18個大項(xiàng)、269個小項(xiàng).該屆賽事約有來自170個國家和地區(qū)的1萬余名運(yùn)動員及官員赴蓉參加,該屆賽事于2023年7月28日至8月8日在中國四川省成都市舉行.為了了解關(guān)注該賽事是否與性別有關(guān),某體育臺隨機(jī)抽取2000名觀眾進(jìn)行統(tǒng)計(jì),得到如下2×2列聯(lián)表.男女合計(jì)關(guān)注該賽事600300900不關(guān)注該賽事4007001100合計(jì)100010002000(1)在所有女觀眾中,試估計(jì)她們關(guān)注該賽事的概率(結(jié)果用百分?jǐn)?shù)表示);(2)根據(jù)小概率值的獨(dú)立性檢驗(yàn),能否認(rèn)為是否關(guān)注該賽事與性別有關(guān)聯(lián)?附:,其中.0.10.050.010.0050.0012.7063.8416.6357.87910.828變式27.(2023·安徽滁州·校考二模)為了研究學(xué)生每天整理數(shù)學(xué)錯題情況,某課題組在某市中學(xué)生中隨機(jī)抽取了100名學(xué)生調(diào)查了他們期中考試的數(shù)學(xué)成績和平時整理數(shù)學(xué)錯題情況,并繪制了下列兩個統(tǒng)計(jì)圖表,圖1為學(xué)生期中考試數(shù)學(xué)成績的頻率分布直方圖,圖2為學(xué)生一個星期內(nèi)整理數(shù)學(xué)錯題天數(shù)的扇形圖.若本次數(shù)學(xué)成績在110分及以上視為優(yōu)秀,將一個星期有4天及以上整理數(shù)學(xué)錯題視為“經(jīng)常整理”,少于4天視為“不經(jīng)常整理”.已知數(shù)學(xué)成績優(yōu)秀的學(xué)生中,經(jīng)常整理錯題的學(xué)生占.數(shù)學(xué)成績優(yōu)秀數(shù)學(xué)成績不優(yōu)秀合計(jì)經(jīng)常整理不經(jīng)常整理合計(jì)(1)求圖1中的值以及學(xué)生期中考試數(shù)學(xué)成績的上四分位數(shù);(2)根據(jù)圖1、圖2中的數(shù)據(jù),補(bǔ)全上方列聯(lián)表,并根據(jù)小概率值的獨(dú)立性檢驗(yàn),分析數(shù)學(xué)成績優(yōu)秀與經(jīng)常整理數(shù)學(xué)錯題是否有關(guān)?(3)用頻率估計(jì)概率,在全市中學(xué)生中按“經(jīng)常整理錯題”與“不經(jīng)常整理錯題”進(jìn)行分層抽樣,隨機(jī)抽取5名學(xué)生,再從這5名學(xué)生中隨機(jī)抽取2人進(jìn)行座談.求這2名同學(xué)中經(jīng)常整理錯題且數(shù)學(xué)成績優(yōu)秀的人數(shù)X的分布列和數(shù)學(xué)期望.附:變式28.(2023·全國·高三專題練習(xí))2022年11月20日,卡塔爾足球世界杯正式開幕,世界杯上的中國元素隨處可見.從體育場建設(shè)到電力保障,從賽場內(nèi)的裁判到賽場外的吉祥物都是中國制造,為卡塔爾世界杯提供了強(qiáng)有力的支持.國內(nèi)也再次掀起足球熱潮.某地足球協(xié)會組建球隊(duì)參加業(yè)余比賽,該足球隊(duì)教練組為了考查球員甲對球隊(duì)的貢獻(xiàn),作出如下數(shù)據(jù)統(tǒng)計(jì)(甲參加過的比賽均分出了輸贏):球隊(duì)輸球球隊(duì)贏球總計(jì)甲參加23032甲未參加81018總計(jì)104050(1)根據(jù)小概率值的獨(dú)立性檢驗(yàn),能否認(rèn)為該球隊(duì)贏球與甲球員參賽有關(guān)聯(lián);(2)從該球隊(duì)中任選一人,A表示事件“選中的球員參賽”,B表示事件“球隊(duì)輸球”.與的比值是選中的球員參賽對球隊(duì)貢獻(xiàn)程度的一項(xiàng)度量指標(biāo),記該指標(biāo)為R.①證明:;②利用球員甲數(shù)據(jù)統(tǒng)計(jì),給出,的估計(jì)值,并求出R的估計(jì)值.附:.參考數(shù)據(jù):a0.050.010.0050.0013.8416.6357.87910.828【解題方法總結(jié)】獨(dú)立性檢驗(yàn)的一般步驟(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表.(2)根據(jù)公式計(jì)算.(3)比較與臨界值的大小關(guān)系,作統(tǒng)計(jì)推斷.題型五:誤差分析例13.(2023·河北衡水·河北衡水中學(xué)校考一模)某新能源汽車生產(chǎn)公司,為了研究某生產(chǎn)環(huán)節(jié)中兩個變量之間的相關(guān)關(guān)系,統(tǒng)計(jì)樣本數(shù)據(jù)得到如下表格:由表格中的數(shù)據(jù)可以得到與的經(jīng)驗(yàn)回歸方程為,據(jù)此計(jì)算,下列選項(xiàng)中殘差的絕對值最小的樣本數(shù)據(jù)是(

)A. B.C. D.例14.(2023·云南保山·高三統(tǒng)考期末)新冠肺炎疫情發(fā)生以來,中醫(yī)藥全面參與疫情防控救治,做出了重要貢獻(xiàn).某中醫(yī)藥企業(yè)根據(jù)市場調(diào)研與模擬,得到研發(fā)投入(億元)與產(chǎn)品收益(億元)的數(shù)據(jù)統(tǒng)計(jì)如下表:研發(fā)投入(億元)12345產(chǎn)品收益(億元)3791011用最小二乘法求得關(guān)于的經(jīng)驗(yàn)回歸直線方程是,相關(guān)系數(shù)(若,則線

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論