第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析(單元知識清單)高二數(shù)學(xué)(人教A版2019選擇性)_第1頁
第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析(單元知識清單)高二數(shù)學(xué)(人教A版2019選擇性)_第2頁
第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析(單元知識清單)高二數(shù)學(xué)(人教A版2019選擇性)_第3頁
第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析(單元知識清單)高二數(shù)學(xué)(人教A版2019選擇性)_第4頁
第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析(單元知識清單)高二數(shù)學(xué)(人教A版2019選擇性)_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

選擇性必修三第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析知識點(diǎn)清單一、本章思維導(dǎo)圖§8.1成對數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性相關(guān)關(guān)系:兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.相關(guān)關(guān)系是一種不確定性關(guān)系;相關(guān)關(guān)系是相對于函數(shù)關(guān)系而言的.像這樣,兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.相關(guān)關(guān)系與函數(shù)關(guān)系的異同點(diǎn)關(guān)系項(xiàng)目函數(shù)關(guān)系相關(guān)關(guān)系相同點(diǎn)都是兩個變量間的關(guān)系不同點(diǎn)是一種確定關(guān)系是一種非確定關(guān)系是一種因果關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系2.散點(diǎn)圖:成對樣本數(shù)據(jù)都可用直角坐標(biāo)系中的點(diǎn)表示出來,由這些點(diǎn)組成了統(tǒng)計(jì)圖.我們我們把這樣的統(tǒng)計(jì)圖叫做散點(diǎn)圖。3.相關(guān)關(guān)系分類:正相關(guān):當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)增加的趨勢,就稱這兩個變量正相關(guān);負(fù)相關(guān):當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)減小的趨勢,就稱這兩個變量負(fù)相關(guān).4.線性相關(guān):如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條直線附近,就稱這兩個變量線性相關(guān).5.樣本相關(guān)系數(shù):(1)(2)樣本相關(guān)系數(shù)的數(shù)字特征:當(dāng)時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)時,稱成對樣本數(shù)據(jù)負(fù)相關(guān);當(dāng)越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);當(dāng)越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.線性相關(guān)系數(shù)是從數(shù)值上來判斷變量間的線性相關(guān)程度,是定量的方法.與散點(diǎn)圖相比較,線性相關(guān)系數(shù)要精細(xì)得多,需要注意的是線性相關(guān)系數(shù)r的絕對值小,只是說明線性相關(guān)程度低,但不一定不相關(guān),可能是非線性相關(guān).利用相關(guān)系數(shù)r來檢驗(yàn)線性相關(guān)顯著性水平時,通常與0.75作比較,若|r|>0.75,則線性相關(guān)較為顯著,否則不顯著.§8.2一元線性回歸模型及其應(yīng)用1.一元線性回歸模型:稱為因變量或響應(yīng)變量,稱為自變量或解釋變量,為截距參數(shù),為斜率參數(shù),是與之間的隨機(jī)誤差.2.經(jīng)驗(yàn)回歸方程:(1)相關(guān)概念:經(jīng)驗(yàn)回歸直線:經(jīng)驗(yàn)回歸方程也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,圖形稱為經(jīng)驗(yàn)回歸直線.最小二乘估計(jì):求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的叫做的最小二乘估計(jì).殘差:對于響應(yīng)變量,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.(2)(3)決定系數(shù):越大,表示殘差平方和越小,即模型的擬合效果越好;越小,表示殘差平方和越大,即模型的擬合效果越差;3.方法技巧經(jīng)驗(yàn)回歸方程的求法及應(yīng)用

在散點(diǎn)圖中,樣本點(diǎn)大致分布在一條直線附近,利用公式求出,可寫出經(jīng)驗(yàn)回歸方程,利用經(jīng)驗(yàn)回歸模型進(jìn)行研究,可近似地利用經(jīng)驗(yàn)回歸方程來預(yù)測。4.方法技巧一元線性回歸模型擬合問題的求解策略

在一元線性回歸模型中,R2與相關(guān)系數(shù)r都能刻畫模型擬合數(shù)據(jù)的效果.|r|越大,R2就越大,用模型擬合數(shù)據(jù)的效果就越好.

§8.3列聯(lián)表與獨(dú)立性檢驗(yàn)1.分類變量:現(xiàn)實(shí)生活中,人們經(jīng)常需要回答一定范圍內(nèi)的兩種現(xiàn)象或性質(zhì)之間是否存在關(guān)聯(lián)性或相互影響的問題,為了表述方便,我們經(jīng)常會使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為分類變量.2.列聯(lián)表:合計(jì)合計(jì)3.獨(dú)立性檢驗(yàn):(1)零假設(shè)(原假設(shè)):,即分類變量和獨(dú)立.(2)獨(dú)立性檢驗(yàn):①②臨界值:對于小概率值,可以找到相應(yīng)的正實(shí)數(shù),使下面關(guān)系成立:,我們稱為的臨界值.常用小概率值和相應(yīng)的臨界值表:0.10.050.010.0050.0012.7063.8416.6357.87910.828③基于小概率值的檢驗(yàn)規(guī)則:當(dāng)時,我們就推斷不成立,即認(rèn)為和不獨(dú)立,該推斷犯錯誤的概率不超過.當(dāng)時,我們沒有充分證據(jù)推斷不成立,可以認(rèn)為和獨(dú)立.這種利用的取值推斷分類變量和是否獨(dú)立的方法稱為獨(dú)立性檢驗(yàn),簡稱獨(dú)立性檢驗(yàn).4.方法技巧獨(dú)立性檢驗(yàn)的一般步驟

(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表;

(2)根據(jù)公式計(jì)算χ2;

(3)比較χ2與臨界值xα的大小關(guān)系,得到推斷結(jié)論.

成對數(shù)據(jù)的相關(guān)關(guān)系考點(diǎn)分析考法一相關(guān)關(guān)系1.對變量x,y有觀測數(shù)據(jù)(xi,yi)(i=1,2,3,…,10),得散點(diǎn)圖1;對變量u,v有觀測數(shù)據(jù)(ui,vi)(i=1,2,3,…,10),得散點(diǎn)圖2,由這兩個散點(diǎn)圖可以斷定()A.x與y正相關(guān),u與v正相關(guān)B.x與y正相關(guān),u與v負(fù)相關(guān)C.x與y負(fù)相關(guān),u與v正相關(guān)D.x與y負(fù)相關(guān),u與v負(fù)相關(guān)【答案】C【解析】由圖1可知,點(diǎn)散布在從左上角到右下角的區(qū)域,各點(diǎn)整體呈遞減趨勢,故x與y負(fù)相關(guān);由圖2可知,點(diǎn)散布在從左下角到右上角的區(qū)域,各點(diǎn)整體呈遞增趨勢,故u與v正相關(guān).故選:C.考法一相關(guān)關(guān)系2.下列兩變量具有相關(guān)關(guān)系的是()A.正方體的體積與邊長 B.人的身高與體重C.勻速行駛車輛的行駛距離與時間 D.球的半徑與體積【答案】B【解析】對選項(xiàng)A,設(shè)正方體的體積,邊長,則,它們之間的關(guān)系是函數(shù)關(guān)系,故A不正確;對選項(xiàng)B,人的身高會影響體重,但不是唯一因素,故B正確.對選項(xiàng)C,勻速行駛車輛的行駛距離與時間的關(guān)系為,其中為勻速速度,它們之間的關(guān)系是函數(shù)關(guān)系,故C不正確;對選項(xiàng)D,設(shè)球的半徑為,則球的體積為,它們之間的關(guān)系是函數(shù)關(guān)系,故D不正確;故選:B.考點(diǎn)二樣本的相關(guān)系數(shù)3.兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù),,…,下列說法錯誤的是()A.相關(guān)系數(shù)越接近1,變量相關(guān)性越強(qiáng)B.落在回歸直線方程上的樣本點(diǎn)越多,回歸直線方程擬合效果越好C.相關(guān)指數(shù)越小,殘差平方和越大,即模型的擬合效果越差D.若表示女大學(xué)生的身高,表示體重則表示女大學(xué)生的身高解釋了的體重變化【答案】B【解析】對于A.根據(jù)相關(guān)系數(shù)越接近1,變量相關(guān)性越強(qiáng),故正確;對于B.回歸直線方程擬合效果的強(qiáng)弱是由相關(guān)指數(shù)或相關(guān)系數(shù)判定,故不正確;對于C.相關(guān)指數(shù)越小,殘差平方和越大,效果越差,故正確;對于D.根據(jù)的實(shí)際意義可得,表示女大學(xué)生的身高解釋了的體重變化,故正確;故選:B考點(diǎn)二樣本的相關(guān)系數(shù)4.在線性回歸模型中,分別選擇了甲,乙,丙,丁四個不同的模型,它們的相關(guān)指數(shù)分別為0.46,0.85,0.72,0.93,其中回歸效果最好的模型是()A.甲 B.乙 C.丙 D.丁【答案】D【解析】因?yàn)閮蓚€變量y與x的回歸模型中,它們的相關(guān)指數(shù)越接近于1,這個模型的擬合效果越好,而丁的相關(guān)指數(shù)0.93最大,所以回歸效果最好的模型是丁,故選:D一元線性回歸模型及其應(yīng)用考點(diǎn)一樣本中心解小題5.某產(chǎn)品在某零售攤位上的零售價(元)與每天的銷售量(個)統(tǒng)計(jì)如下表:16171819503431據(jù)上表可得回歸直線方程為,則上表中的的值為()A.38 B.39 C.40 D.41【答案】D【解析】由題意,,所以,解得.故選:D.考點(diǎn)一樣本中心解小題6.蟋蟀鳴叫可以說是大自然優(yōu)美、和諧的音樂,殊不知蟋蟀鳴叫的頻率(每分鐘鳴叫的次數(shù))與氣溫(單位:)存在著較強(qiáng)的線性相關(guān)關(guān)系.某地觀測人員根據(jù)下表的觀測數(shù)據(jù),建立了關(guān)于的線性回歸方程.(次數(shù)/分鐘)則當(dāng)蟋蟀每分鐘鳴叫次時,該地當(dāng)時的氣溫預(yù)報(bào)值為()A. B. C. D.【答案】D【解析】由表格中的數(shù)據(jù)可得,,由于回歸直線過樣本中心點(diǎn),可得,解得.所以,回歸直線方程為.在回歸直線方程中,令,可得.故選:D.考點(diǎn)二一元線性方程7.配速是馬拉松運(yùn)動中常使用的一個概念,是速度的一種,是指每公里所需要的時間,相比配速,把心率控制在一個合理水平是安全理性跑馬拉松的一個重要策略.圖1是一個馬拉松跑者的心率(單位:次/分鐘)和配速(單位:分鐘/公里)的散點(diǎn)圖,圖2是一次馬拉松比賽(全程約42公里)前3000名跑者成績(單位:分鐘)的頻率分布直方圖.(1)由散點(diǎn)圖看出,可用線性回歸模型擬合與的關(guān)系,求與的線性回歸方程;(2)該跑者如果參加本次比賽,將心率控制在160左右跑完全程,估計(jì)他跑完全程花費(fèi)的時間,并估計(jì)他能獲得的名次.參考公式:線性回歸方程中,,參考數(shù)據(jù):.【答案】(1);(2)210分鐘,192名.【解析】(1)由散點(diǎn)圖中數(shù)據(jù)和參考數(shù)據(jù)得,,,,所以與的線性回歸方程為.(2)將代入回歸方程得,所以該跑者跑完馬拉松全程所花的時間為分鐘.從馬拉松比賽的頻率分布直方圖可知成績好于210分鐘的累積頻率為,有的跑者成績超過該跑者,則該跑者在本次比賽獲得的名次大約是名.考點(diǎn)二一元線性方程8.隨著電商事業(yè)的快速發(fā)展,網(wǎng)絡(luò)購物交易額也快速提升,特別是每年的“雙十一”,天貓的交易額數(shù)目驚人.2020年天貓公司的工作人員為了迎接天貓“雙十一”年度購物狂歡節(jié),加班加點(diǎn)做了大量準(zhǔn)備活動,截止2020年11月11日24時,2020年的天貓“雙十一”交易額定格在3700多億元,天貓總公司所有員工對于新的戰(zhàn)績皆大歡喜,同時又對2021年充滿了憧憬,因此公司工作人員反思從2014年至2020年每年“雙十一”總交易額(取近似值),進(jìn)行分析統(tǒng)計(jì)如下表:年份2014201520162017201820192020年份代碼()1234567總交易額(單位:百億)5.79.112.116.821.326.837(1)通過分析,發(fā)現(xiàn)可用線性回歸模型擬合總交易額y與年份代碼t的關(guān)系,請用相關(guān)系數(shù)加以說明;(2)利用最小二乘法建立y關(guān)于t的回歸方程(系數(shù)精確到0.1),預(yù)測2021年天貓“雙十一”的總交易額.參考數(shù)據(jù):,,;參考公式:相關(guān)系數(shù);回歸方程中,斜率和截距的最小二乘估計(jì)公式分別為:,.【答案】(1)答案見解析;(2)回歸方程為,預(yù)測2021年天貓“雙十一”的總交易額約為38百億.【解析】(1),,,所以因?yàn)榭偨灰最~y與年份代碼t的相關(guān)系數(shù)近似為0.98,說明總交易額y與年份代碼t的線性相關(guān)性很強(qiáng),從而可用線性回歸模型擬合總交易額y與年份代碼t的關(guān)系.(2)因?yàn)?,,所以,,所以y關(guān)于t的回歸方程為又將2021年對應(yīng)的代入回歸方程得:.所以預(yù)測2021年天貓“雙十一”的總交易額約為38百億.考點(diǎn)三非一元線性方程9.在一次抽樣調(diào)查中測得個樣本點(diǎn),得到下表及散點(diǎn)圖.(1)根據(jù)散點(diǎn)圖判斷與哪一個適宜作為關(guān)于的回歸方程;(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結(jié)果試建立與的回歸方程;(計(jì)算結(jié)果保留整數(shù))(3)在(2)的條件下,設(shè)且,試求的最小值.參考公式:回歸方程中,,.【答案】(1);(2);(3).【解析】(1)由題中散點(diǎn)圖可以判斷,適宜作為關(guān)于的回歸方程;(2)令,則,原數(shù)據(jù)變?yōu)橛杀砜芍c近似具有線性相關(guān)關(guān)系,計(jì)算得,,,所以,,則.所以關(guān)于的回歸方程是.(3)由(2)得,,任取、,且,即,可得,因?yàn)?,則,,所以,,所以,函數(shù)在區(qū)間上單調(diào)遞增,則.考點(diǎn)三非一元線性方程10.某種新產(chǎn)品投放市場一段時間后,經(jīng)過調(diào)研獲得了時間x(天數(shù))與銷售單價y(元)的一組數(shù)據(jù),且做了一定的數(shù)據(jù)處理(如表),并作出了散點(diǎn)圖(如圖).表中.(1)根據(jù)散點(diǎn)圖判斷,與哪一個更適合作價格y關(guān)于時間x的回歸方程類型?(不必說明理由)(2)根據(jù)判斷結(jié)果和表中數(shù)據(jù),建立y關(guān)于x的回歸方程.(3)若該產(chǎn)品的日銷售量(件)與時間x的函數(shù)關(guān)系為,求該產(chǎn)品投放市場第幾天的銷售額最高?最高為多少元?附:對于一組數(shù)據(jù),其回歸直線的斜率和截距的最小二乘法估計(jì)分別為.【答案】(1)更適合作價格y關(guān)于時間x的回歸方程;(2);(3)第10天,最高銷售額為2420元;【解析】(1)根據(jù)散點(diǎn)圖知更適合作價格y關(guān)于時間x的回歸方程類型;(2)令,則,而,,即有;(3)由題意結(jié)合(2)知:日銷售額為,∴,若,令,∴時,,即天,元,所以該產(chǎn)品投放市場第10天的銷售額最高,最高銷售額為2420元.分類變量與列聯(lián)表考法一列聯(lián)表11.疫苗是為預(yù)防、控制傳染病的發(fā)生、流行,用于人體預(yù)防接種的預(yù)防性生物制品,其前期研發(fā)過程中,一般都會進(jìn)行動物保護(hù)測試,為了考察某種疫苗預(yù)防效果,在進(jìn)行動物試驗(yàn)時,得到如下統(tǒng)計(jì)數(shù)據(jù):未發(fā)病發(fā)病總計(jì)未注射疫苗20注射疫苗30總計(jì)5050100附表及公式:,.0.050.010.0050.0013.8416.6357.87910.828現(xiàn)從試驗(yàn)動物中任取一只,取得“注射疫苗”的概率為,則下列判斷錯誤的是()A.注射疫苗發(fā)病的動物數(shù)為10B.從該試驗(yàn)未注射疫苗的動物中任取一只,發(fā)病的概率為C.能在犯錯概率不超過0.001的前提下,認(rèn)為疫苗有效D.該疫苗的有效率為75%【答案】(1)D(2)D【解析】(1)由題意得,,,,,,所以,,,,,則.故選:D.(2)由題知:注射疫苗動物共40只,未注射為60只,補(bǔ)充列聯(lián)表,未發(fā)病發(fā)病總計(jì)未注射疫苗204060注射疫苗301040總計(jì)5050100由此可得A、B正確.計(jì)算得:,故能在犯錯概率不超過0.001的前提下認(rèn)為疫苗有效.C正確,D錯誤.故選:D.考法一列聯(lián)表12.現(xiàn)行普通高中學(xué)生在高一時面臨著選科的問題,學(xué)校抽取了部分男?女學(xué)生意愿的一份樣本,制作出如下兩個等高堆積條形圖:根據(jù)這兩幅圖中的信息,下列哪個統(tǒng)計(jì)結(jié)論是不正確的()A.樣本中的女生數(shù)量多于男生數(shù)量B.樣本中有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量C.樣本中的男生偏愛兩理一文D.樣本中的女生偏愛兩文一理【答案】D【解析】由條形圖知女生數(shù)量多于男生數(shù)量,故A正確;有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量,故B正確;男生偏愛兩理一文,故C正確;女生中有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量,故D錯誤.故選:D.考點(diǎn)二獨(dú)立性檢驗(yàn)13.為了解使用是否對學(xué)生的學(xué)習(xí)有影響,某校隨機(jī)抽取名學(xué)生,對學(xué)習(xí)成績和使用情況進(jìn)行了調(diào)查,統(tǒng)計(jì)數(shù)據(jù)如表所示(不完整):使用不使用總計(jì)學(xué)習(xí)成績優(yōu)秀學(xué)習(xí)成績一般總計(jì)(1)補(bǔ)充完整所給表格,并根據(jù)表格數(shù)據(jù)計(jì)算是否有的把握認(rèn)為學(xué)生的學(xué)習(xí)成績與使用有關(guān);(2)現(xiàn)從上表不使用的學(xué)生中按學(xué)習(xí)成績是否優(yōu)秀分層抽樣選出人,再從這人中隨機(jī)抽取人,記這人中“學(xué)習(xí)成績優(yōu)秀”的人數(shù)為,試求的分布列與數(shù)學(xué)期望.參考公式:,其中.參考數(shù)據(jù):【答案】(1)沒有的把握認(rèn)為學(xué)生的學(xué)習(xí)成績與使用有關(guān);(2)分布列見解析,.【解析】(1)列聯(lián)表如下表所示:使用不使用總計(jì)學(xué)習(xí)成績優(yōu)秀學(xué)習(xí)成績一般總計(jì)假設(shè)學(xué)生的學(xué)習(xí)成績與使用無關(guān),,所以,沒有的把握認(rèn)為學(xué)生的學(xué)習(xí)成績與使用有關(guān);(2)人中學(xué)習(xí)成績優(yōu)秀的人有人,學(xué)習(xí)成績一般的有人,可能的取值有、、、,,,,.所以,隨機(jī)變量的分布列為.考點(diǎn)二獨(dú)立性檢驗(yàn)14.隨著新冠疫情防控進(jìn)入常態(tài)化,人們的生產(chǎn)生活逐步步入正軌.為拉動消費(fèi),某市發(fā)行億元消費(fèi)券.為了解該消費(fèi)券使用人群的年齡結(jié)構(gòu)情況,該市隨機(jī)抽取了人,對是否使用過消費(fèi)券的情況進(jìn)行調(diào)查,結(jié)果如下表所示,其中年齡低于歲的人數(shù)占總?cè)藬?shù)的.年齡(單位:歲)調(diào)查人數(shù)使用消費(fèi)券人數(shù)(1)求、值;(2)若以“年齡歲為分界點(diǎn)”,由以上統(tǒng)計(jì)數(shù)據(jù)完成下面列聯(lián)表,并判斷是否有的把握認(rèn)為是否使用消費(fèi)券與人的年齡有關(guān).年齡低于歲的人數(shù)年齡不低于歲的人數(shù)合計(jì)使用消費(fèi)券人數(shù)未使用消費(fèi)券人數(shù)合計(jì)參考數(shù)據(jù):,其中.【答案】(1),;(2)列聯(lián)表答案見解析,有的把握認(rèn)為是否使用消費(fèi)券與人的年齡有關(guān).【解析】(1)由題意得,解得,;(2)由以上統(tǒng)計(jì)數(shù)據(jù)填寫下面列聯(lián)表,如下年齡低于歲的人數(shù)年齡不低于歲的人數(shù)合計(jì)使用消費(fèi)券人數(shù)未使用消費(fèi)券人數(shù)合計(jì)根據(jù)公式計(jì)算,所以有的把握認(rèn)為是否使用消費(fèi)券與人的年齡有關(guān).易混易錯練易錯點(diǎn)1選錯回歸模型致錯1.在一次抽樣調(diào)查中測得5組成對數(shù)據(jù),其數(shù)值及散點(diǎn)圖如下:x0.250.5124y1612521(1)根據(jù)散點(diǎn)圖判斷y=a+bx與y=c+k·x1哪一個更適宜作為y關(guān)于x的經(jīng)驗(yàn)回歸方程類型;(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),試建立y與x的經(jīng)驗(yàn)回歸方程;(計(jì)算結(jié)果保留整數(shù))(3)在(2)的條件下,設(shè)z=y+x且x∈[4,+∞),試求z的最小值.參考公式:經(jīng)驗(yàn)回歸方程y^=b^x+b^=∑i1.解析(1)由題中散點(diǎn)圖可以判斷,y=c+k·x1更適宜作為y關(guān)于x的經(jīng)驗(yàn)回歸方程類型.(2)令t=x1,則y=c+kt,構(gòu)造新的成對數(shù)據(jù),如下表:t4210.50.25y1612521易知y與t存在線性相關(guān)關(guān)系.計(jì)算得t=1.55,y=7.2,k^≈4,c^=yk^t所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為y^=4(3)由(2)得z=y+x=4x+x+1,易得z=4易錯點(diǎn)2求χ2用錯公式致錯2.為了解人們對延遲退休年齡政策的態(tài)度,某部門從年齡在15歲到65歲的人群中隨機(jī)調(diào)查了100人,并得到如圖所示的頻率分布直方圖,在這100人中不支持延遲退休年齡政策的人數(shù)與年齡的統(tǒng)計(jì)結(jié)果如下表所示.年齡不支持延遲退休年齡政策的人數(shù)[15,25)15[25,35)5[35,45)15[45,55)23[55,65]17(1)由頻率分布直方圖,估計(jì)這100人年齡的平均數(shù)(同一組數(shù)據(jù)用該區(qū)間的中點(diǎn)值代表);(2)根據(jù)以上統(tǒng)計(jì)數(shù)據(jù)填寫下面的2×2列聯(lián)表,并依據(jù)α=0.05的獨(dú)立性檢驗(yàn),分析以45歲為分界點(diǎn)的不同人群對延遲退休年齡政策的態(tài)度是否存在差異.單位:人45歲以下45歲及以上合計(jì)不支持支持合計(jì)附表及公式:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828χ2=n(2.解析(1)估計(jì)這100人年齡的平均數(shù)為20×0.2+30×0.1+40×0.2+50×0.3+60×0.2=42(歲).(2)由題中頻率分布直方圖可知,45歲以下的有50人,45歲及以上的有50人.可得2×2列聯(lián)表如下:單位:人45歲以下45歲及以上合計(jì)不支持354075支持151025合計(jì)5050100零假設(shè)為H0:不同人群與態(tài)度相互獨(dú)立,即以45歲為分界點(diǎn)的不同人群對延遲退休年齡政策的態(tài)度不存在差異.計(jì)算可得χ2=100×(35×10?40×15)275×25×50×50≈1.333<3.841=x0.05,依據(jù)α=0.05的獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H03.今年1月至2月由新型冠狀病毒引起的肺炎病例陡然增多,為了嚴(yán)控疫情擴(kuò)散,做好重點(diǎn)人群的預(yù)防工作,某地區(qū)共統(tǒng)計(jì)返鄉(xiāng)人員100人,其中50歲及以上的共有40人.這100人中確診的有10人,其中50歲以下的人占310(1)試估計(jì)50歲及以上的返鄉(xiāng)人員因感染新型冠狀病毒而引起肺炎的概率;(2)請將下面的列聯(lián)表補(bǔ)充完整,并依據(jù)α=0.05的獨(dú)立性檢驗(yàn),分析確診患新冠肺炎與年齡是否有關(guān).單位:人確診患新冠肺炎未確診患新冠肺炎合計(jì)50歲及以上4050歲以下合計(jì)10100附表及公式:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828χ2=n(3.解析(1)因?yàn)?00人中確診的有10人,50歲以下的人占310所以50歲以下的確診人數(shù)為3,50歲及以上的確診人數(shù)為7,因?yàn)?0歲及以上的共有40人,所以50歲及以上的返鄉(xiāng)人員因感染新型冠狀病毒而引起肺炎的概率約為740(2)補(bǔ)充列聯(lián)表如下:單位:人確診患新冠肺炎未確診患新冠肺炎合計(jì)50歲及以上7334050歲以下35760合計(jì)1090100零假設(shè)為H0:確診患新冠肺炎與年齡無關(guān).計(jì)算可得χ2=100×(7×57-33×3)240×60×10×90=25依據(jù)α=0.05的獨(dú)立性檢驗(yàn),推斷H0不成立,即認(rèn)為確診患新冠肺炎與年齡有關(guān).4.某地區(qū)在“精準(zhǔn)扶貧”工作中切實(shí)貫徹習(xí)近平總書記提出的“因地制宜”的指導(dǎo)思想,扶貧工作小組經(jīng)過多方調(diào)研,綜合該地區(qū)的氣候、地質(zhì)、地理位置等特點(diǎn),決定向當(dāng)?shù)剞r(nóng)戶推行某類景觀樹苗種植.工作小組根據(jù)市場前景重點(diǎn)考察了A,B兩種景觀樹苗,為對比兩種樹苗的成活率,工作小組進(jìn)行了引種試驗(yàn),分別引種樹苗A,B各50株,試驗(yàn)發(fā)現(xiàn)有80%的樹苗成活,未成活的樹苗A,B株數(shù)之比為1∶3.(1)完成下面的2×2列聯(lián)表,依據(jù)α=0.01的獨(dú)立性檢驗(yàn),分析樹苗A,B的成活率是否有差異;樹苗A樹苗B合計(jì)成活株數(shù)未成活株數(shù)合計(jì)5050100(2)已知樹苗A引種成活后再經(jīng)過1年的生長即可作為景觀樹A在市場上出售,但每株售價y(單位:百元)受其樹干的直徑x(單位:cm)影響,扶貧工作小組對一批已出售的景觀樹A的相關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),得到結(jié)果如下表:直徑x1015202530單株售價y48101627根據(jù)上述數(shù)據(jù),判斷是否可以用線性回歸模型擬合y與x的關(guān)系,并用樣本相關(guān)系數(shù)r加以說明.(一般認(rèn)為|r|>0.75為高度線性相關(guān))參考公式及數(shù)據(jù):樣本相關(guān)系數(shù)r=∑i=1n∑iχ2=n(附表:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8284.解析試驗(yàn)發(fā)現(xiàn)有80%的樹苗成活,故未成活的樹苗有20株,未成活的樹苗A,B株數(shù)之比為1∶3,所以樹苗A未成活5株,成活45株,樹苗B未成活15株,成活35株.(1)補(bǔ)充列聯(lián)表如下:樹苗A樹苗B合計(jì)成活株數(shù)453580未成活株數(shù)51520合計(jì)5050100零假設(shè)為H0:樹苗A,B的成活率無差異.計(jì)算可得χ2=100×(45×15-35×5)280×20×50×50依據(jù)α=0.01的獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立,因此認(rèn)為H0成立,即認(rèn)為樹苗A,B的成活率無差異.(2)可以用線性回歸模型擬合y與x的關(guān)系.由題表中數(shù)據(jù)易得x=20,y=13,所以r=(-10)×(-9)+(-5)×(-5)+0×(-3)+5×3+10×14≈0.95>0.75.故可以用線性回歸模型擬合y與x的關(guān)系.一、數(shù)形結(jié)合思想在統(tǒng)計(jì)中的應(yīng)用1.下圖是某地區(qū)2010年至2019年污染天數(shù)y與年份x的折線圖,根據(jù)2010年至2014年的數(shù)據(jù),2015年至2019年的數(shù)據(jù),2010年至2019年的數(shù)據(jù)分別建立一元線性回歸模型y^=b1x+a1,y^=b2x+a2,y^=b3A.b1<b2<b3,a1<a2<a3B.b1<b3<b2,a1<a3<a2C.b2<b3<b1,a1<a3<a2D.b2<b3<b1,a3<a2<a11.C經(jīng)驗(yàn)回歸直線應(yīng)分布在散點(diǎn)圖的附近,由題中統(tǒng)計(jì)圖可知2010年至2014年,y隨著x的增加而減少,2015年至2019年,y隨著x的增加而減少的更多,根據(jù)經(jīng)驗(yàn)回歸方程y^=b^x+a^中a^,b^的幾何意義可知,a2>a1,b2<b1<0,由點(diǎn)的分布可知,a3∈(a1,a2),b3∈(b2,b1),所以b2<b3<b1,a12.某研究機(jī)構(gòu)對高三學(xué)生的記憶力x和判斷力y進(jìn)行統(tǒng)計(jì)分析,得到下表數(shù)據(jù):x681012y2356(1)畫出散點(diǎn)圖;(2)請根據(jù)上表提供的數(shù)據(jù),求出y關(guān)于x的經(jīng)驗(yàn)回歸方程y^=b^x+參考公式:b^=∑i=1nxi2.解析(1)散點(diǎn)圖如圖所示.(2)易得x=6+8+10+124=9,y=2+3+5+6∑i=14xi∑i=14xi2=62+8所以b^=158?4×9×4344?4×9a^=yb^x故經(jīng)驗(yàn)回歸方程為y^=0.7x3.某醫(yī)院用光電比色計(jì)檢查尿汞時,得尿汞含量(毫克/升)與消光系數(shù)如下表:尿汞含量x246810消光系數(shù)y64138205285360(1)畫出散點(diǎn)圖;(2)如果y與x之間具有線性相關(guān)關(guān)系,求y關(guān)于x的經(jīng)驗(yàn)回歸方程;(3)估計(jì)尿汞含量為9毫克/升時的消光系數(shù)(結(jié)果保留整數(shù)).參考公式:b^=∑i=1a^=yb參考數(shù)據(jù):22+42+62+82+102=220,2×64+4×138+6×205+8×285+10×360=7790.3.解析(1)散點(diǎn)圖如圖所示.(2)設(shè)經(jīng)驗(yàn)回歸方程為y^=b^x+易得x=6,y=210.4,b^=7790?5×6×210.4220?5×6∴a^=210.436.95×6=∴y關(guān)于x的經(jīng)驗(yàn)回歸方程為y^=36.95x(3)當(dāng)x=9時,y^=36.95×9故估計(jì)尿汞含量為9毫克/升時消光系數(shù)為321.4.根據(jù)統(tǒng)計(jì),某蔬菜基地西紅柿畝產(chǎn)量的增加量y(百千克)與某種液體肥料每畝使用量x(千克)之間的對應(yīng)數(shù)據(jù)的散點(diǎn)圖如圖所示.(1)依據(jù)散點(diǎn)圖判斷是否可以用線性回歸模型擬合y與x的關(guān)系,并用樣本相關(guān)系數(shù)r加以說明(若r>0.75,則線性相關(guān)程度很高,可用線性回歸模型擬合);(2)求y關(guān)于x的經(jīng)驗(yàn)回歸方程,并預(yù)測液體肥料每畝使用量為12千克時,西紅柿畝產(chǎn)量的增加量.附:樣本相關(guān)系數(shù)r=∑i=1n(xi-x)(yi-y)∑i=1n(x4.解析(1)可以用線性回歸模型擬合y與x的關(guān)系.易得x=2+4+5+6+85=5,y=3+4+5+6+7∑i=15(xix)(yiy)=(3)×(∑i=15(xi-x)2=(3)2∑i=15(yi-y)2=(2)2∴r=∑i=15(x∴可以用線性回歸模型擬合y與x的關(guān)系.(2)設(shè)經(jīng)驗(yàn)回歸方程為y^=b^x+a^,b^=∑i=15(xi-當(dāng)x=12時,y^∴預(yù)測液體肥料每畝使用量為12千克時,西紅柿畝產(chǎn)量的增加量為9.9百千克.二、轉(zhuǎn)化與化歸思想在統(tǒng)計(jì)中的應(yīng)用5.某公司為了確定下一年度投入某種產(chǎn)品的宣傳費(fèi)用,需了解年宣傳費(fèi)x(單位:萬元)對年銷售量y(單位:噸)和年利潤(單位:萬元)的影響.對2014年至2019年的宣傳費(fèi)xi和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論