高中專題復(fù)習(xí)及考試要求 第九章 統(tǒng)計(jì)與統(tǒng)計(jì)案例 第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例_第1頁(yè)
高中專題復(fù)習(xí)及考試要求 第九章 統(tǒng)計(jì)與統(tǒng)計(jì)案例 第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例_第2頁(yè)
高中專題復(fù)習(xí)及考試要求 第九章 統(tǒng)計(jì)與統(tǒng)計(jì)案例 第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例_第3頁(yè)
高中專題復(fù)習(xí)及考試要求 第九章 統(tǒng)計(jì)與統(tǒng)計(jì)案例 第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例_第4頁(yè)
高中專題復(fù)習(xí)及考試要求 第九章 統(tǒng)計(jì)與統(tǒng)計(jì)案例 第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例_第5頁(yè)
已閱讀5頁(yè),還剩45頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第3節(jié)變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例考試要求1.了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義,了解樣本相關(guān)系數(shù)與標(biāo)準(zhǔn)化數(shù)據(jù)變量間的關(guān)系,會(huì)通過(guò)相關(guān)系數(shù)比較多組成對(duì)數(shù)據(jù)的相關(guān)性;2.了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計(jì)意義,了解最小二乘法原理,掌握一元線性回歸模型參數(shù)的最小二乘法估計(jì)方法,會(huì)使用相關(guān)的統(tǒng)計(jì)軟件,會(huì)用一元線性回歸模型進(jìn)行預(yù)測(cè);3.理解2×2列聯(lián)表的統(tǒng)計(jì)意義,了解2×2列聯(lián)表獨(dú)立性檢驗(yàn)及其應(yīng)用.1.相關(guān)關(guān)系與回歸分析知

識(shí)

理回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法;判斷相關(guān)性的常用統(tǒng)計(jì)圖是:_______;統(tǒng)計(jì)量有相關(guān)系數(shù)與相關(guān)指數(shù).(1)在散點(diǎn)圖中,點(diǎn)散布在從________到_______的區(qū)域,對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān).(2)在散點(diǎn)圖中,點(diǎn)散布在從________到________的區(qū)域,兩個(gè)變量的這種相關(guān)關(guān)系稱為負(fù)相關(guān).散點(diǎn)圖左下角右上角左上角右下角2.線性回歸方程(3)如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在__________附近,稱兩個(gè)變量具有線性相關(guān)關(guān)系.一條直線(1)最小二乘法:使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的________________最小的方法叫做最小二乘法.距離的平方和斜率3.回歸分析(1)定義:對(duì)具有___________的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.(2)樣本點(diǎn)的中心:對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其中_______稱為樣本點(diǎn)的中心.(3)相關(guān)系數(shù)當(dāng)r>0時(shí),表明兩個(gè)變量_______;當(dāng)r<0時(shí),表明兩個(gè)變量_______.r的絕對(duì)值越接近于1,表明兩個(gè)變量的線性相關(guān)性_____.相關(guān)關(guān)系正相關(guān)負(fù)相關(guān)越強(qiáng)0.754.獨(dú)立性檢驗(yàn)(1)利用隨機(jī)變量K2來(lái)判斷“兩個(gè)分類變量________”的方法稱為獨(dú)立性檢驗(yàn).(2)列聯(lián)表:列出的兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(2×2列聯(lián)表)為有關(guān)系

y1y2總計(jì)x1ab_______x2cdc+d總計(jì)a+c______a+b+c+da+bb+da+b+c+d診

測(cè)1.判斷下列結(jié)論正誤(在括號(hào)內(nèi)打“√”或“×”)答案(1)√

(2)√

(3)√

(4)√2.(老教材選修2-3P91探究改編)為調(diào)查中學(xué)生近視情況,測(cè)得某校在150名男生中有80名近視,在140名女生中有70名近視.在檢驗(yàn)這些學(xué)生眼睛近視是否與性別有關(guān)時(shí),用下列哪種方法最有說(shuō)服力(

) A.回歸分析 B.均值與方差 C.獨(dú)立性檢驗(yàn) D.概率

解析“近視”與“性別”是兩類變量,其是否有關(guān),應(yīng)用獨(dú)立性檢驗(yàn)判斷.

答案C3.(老教材選修2-3P85講解改編)兩個(gè)變量y與x的回歸模型中,分別選擇了4個(gè)不同模型,它們的相關(guān)指數(shù)R2如下,其中擬合效果最好的模型是(

) A.模型1的相關(guān)指數(shù)R2為0.98 B.模型2的相關(guān)指數(shù)R2為0.80 C.模型3的相關(guān)指數(shù)R2為0.50 D.模型4的相關(guān)指數(shù)R2為0.25

解析在兩個(gè)變量y與x的回歸模型中,它們的相關(guān)指數(shù)R2越近于1,模擬效果越好,在四個(gè)選項(xiàng)中A的相關(guān)指數(shù)最大,所以擬合效果最好的是模型1.

答案

AA.2 B.1 C.0 D.-1x45678y54321答案D5.(2020·臨沂月考)隨著國(guó)家二孩政策的全面放開(kāi),為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡(jiǎn)單隨機(jī)抽樣的方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.

非一線一線總計(jì)愿生452065不愿生132235總計(jì)5842100P(K2≥k0)0.0500.0100.001k03.8416.63510.823正確的結(jié)論是(

)A.在犯錯(cuò)誤的概率不超過(guò)0.1%的前提下,認(rèn)為“生育意愿與城市級(jí)別有關(guān)”B.在犯錯(cuò)誤的概率不超過(guò)0.1%的前提下,認(rèn)為“生育意愿與城市級(jí)別無(wú)關(guān)”C.有99%以上的把握認(rèn)為“生育意愿與城市級(jí)別有關(guān)”D.有99%以上的把握認(rèn)為“生育意愿與城市級(jí)別無(wú)關(guān)”解析∵K2≈9.616>6.635.∴有99%以上的把握認(rèn)為“生育意愿與城市級(jí)別有關(guān)”.答案C考點(diǎn)一相關(guān)關(guān)系的判斷【例1】(1)下列四個(gè)散點(diǎn)圖中,變量x與y之間具有負(fù)的線性相關(guān)關(guān)系的是(

)解析(1)觀察散點(diǎn)圖可知,只有D選項(xiàng)的散點(diǎn)圖表示的是變量x與y之間具有負(fù)的線性相關(guān)關(guān)系.故選D.(2)完全的線性關(guān)系,且為負(fù)相關(guān),故其相關(guān)系數(shù)為-1,故選A.答案(1)D

(2)A規(guī)律方法判斷相關(guān)關(guān)系的兩種方法:(1)散點(diǎn)圖法:如果樣本點(diǎn)的分布從整體上看大致在某一曲線附近,變量之間就有相關(guān)關(guān)系;如果樣本點(diǎn)的分布從整體上看大致在某一直線附近,變量之間就有線性相關(guān)關(guān)系.(2)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判定,|r|越趨近于1,相關(guān)性越強(qiáng).【訓(xùn)練1】

在一次對(duì)人體脂肪含量和年齡的關(guān)系的研究中,研究人員獲得了一組樣本數(shù)據(jù),并制成如圖所示的人體脂肪含量與年齡的關(guān)系的散點(diǎn)圖,下列結(jié)論中正確的是________(填序號(hào)).①人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)等于20%;②人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)小于20%;③人體脂肪含量與年齡負(fù)相關(guān),且脂肪含量的中位數(shù)等于20%;④人體脂肪含量與年齡負(fù)相關(guān),且脂肪含量的中位數(shù)小于20%.解析觀察圖形,可知人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)小于20%.答案②角度1線性回歸方程及應(yīng)用【例2-1】

(2020·長(zhǎng)沙統(tǒng)考)某互聯(lián)網(wǎng)公司為了確定下一季度的前期廣告投入計(jì)劃,收集了近6個(gè)月廣告投入量x(單位:萬(wàn)元)和收益y(單位:萬(wàn)元)的數(shù)據(jù)如下表:考點(diǎn)二回歸分析多維探究月份123456廣告投入量/萬(wàn)元24681012收益/萬(wàn)元14.2120.3131.831.1837.8344.67(1)根據(jù)殘差圖,比較模型①,②的擬合效果,應(yīng)選擇哪個(gè)模型?并說(shuō)明理由.(2)殘差絕對(duì)值大于2的數(shù)據(jù)被認(rèn)為是異常數(shù)據(jù),需要剔除:(ⅰ)剔除異常數(shù)據(jù)后,求出(1)中所選模型的回歸方程;(ⅱ)廣告投入量x=18時(shí),(1)中所選模型收益的預(yù)報(bào)值是多少?解(1)應(yīng)該選擇模型①,因?yàn)槟P廷俚臍埐铧c(diǎn)比較均勻地落在水平的帶狀區(qū)域中,且模型①的帶狀區(qū)域比模型②的帶狀區(qū)域窄,所以模型①的擬合精度高,回歸方程的預(yù)報(bào)精度高.(2)(ⅰ)剔除異常數(shù)據(jù),即3月份的數(shù)據(jù)后,得故預(yù)報(bào)值為62.04萬(wàn)元.角度2非線性回歸方程及應(yīng)用【例2-2】

某公司為確定下一年度投入某種產(chǎn)品的宣傳費(fèi),需了解年宣傳費(fèi)x(單位:千元)對(duì)年銷售量y(單位:t)和年利潤(rùn)z(單位:千元)的影響,對(duì)近8年的年宣傳費(fèi)xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;(3)已知這種產(chǎn)品的年利潤(rùn)z與x,y的關(guān)系為z=0.2y-x.根據(jù)(2)的結(jié)果回答下列問(wèn)題:①年宣傳費(fèi)x=49時(shí),年銷售量及年利潤(rùn)的預(yù)報(bào)值是多少?②年宣傳費(fèi)x為何值時(shí),年利潤(rùn)的預(yù)報(bào)值最大?附:對(duì)于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其回歸直線v=α+βu的斜率和截距的最小二乘估計(jì)分別為:(3)①由(2)知,當(dāng)x=49時(shí),年銷售量y的預(yù)報(bào)值②根據(jù)(2)的結(jié)果知,年利潤(rùn)z的預(yù)報(bào)值故年宣傳費(fèi)為46.24千元時(shí),年利潤(rùn)的預(yù)報(bào)值最大.規(guī)律方法1.對(duì)于非線性回歸分析問(wèn)題,應(yīng)先進(jìn)行變量代換,

求出代換后的回歸直線方程,再求非線性回歸方程.2.回歸方程的擬合效果,可以利用相關(guān)系數(shù)判斷,當(dāng)|r|越趨近于1時(shí),兩變量的線性相關(guān)性越強(qiáng).【訓(xùn)練2】

(2020·廣州模擬)某班的健康調(diào)查小組從所在學(xué)校共選取15名男同學(xué),其年齡、身高和體重?cái)?shù)據(jù)如表所示(本題中身高單位:cm,體重單位:kg).年齡(身高,體重)

年齡(身高,體重)15(154,48),(161,65),(168,64)

18(166,64),(168,72),(182,74)16(158,50),(162,59),(175,80)

19(160,51),(172,68),(178,90)17(161,60),(167,62),(173,68)

根據(jù)表中數(shù)據(jù),設(shè)計(jì)了兩種方案預(yù)測(cè)學(xué)生身高.方案①:建立平均體重與年齡的線性回歸模型,表中各年齡的體重按三名同學(xué)的平均體重計(jì)算,數(shù)據(jù)整理如下表:i12345年齡ti1516171819平均體重si596363.37069.7方案②:建立平均體重與平均身高的線性回歸模型,將所有數(shù)據(jù)按身高重新分成6組:[153,158),[158,163),[163,168),[168,173),[173,178),[178,183],并將每組的平均身高依次折算為155,160,165,170,175,180,各組的體重按平均體重計(jì)算,數(shù)據(jù)整理如下表.i123456平均身高xi155160165170175180平均體重yi485763687482故平均體重y與平均身高x的線性回歸方程為解(1)對(duì)比兩種方案,用方案②預(yù)測(cè)身高168cm的男同學(xué)的平均體重更合理.因?yàn)樯砀吆腕w重的相關(guān)關(guān)系強(qiáng)于年齡與體重的相關(guān)關(guān)系.考點(diǎn)三獨(dú)立性檢驗(yàn)【例3】

(2020·日照模擬)某企業(yè)生產(chǎn)的某種產(chǎn)品被檢測(cè)出其中一項(xiàng)質(zhì)量指標(biāo)存在問(wèn)題.該企業(yè)為了檢查生產(chǎn)該產(chǎn)品的甲、乙兩條流水線的生產(chǎn)情況,隨機(jī)地從這兩條流水線上生產(chǎn)的大量產(chǎn)品中各抽取50件產(chǎn)品作為樣本,測(cè)出它們的這一項(xiàng)質(zhì)量指標(biāo)值.若該項(xiàng)質(zhì)量指標(biāo)值落在(195,210]內(nèi),則為合格品,否則為不合格品.甲流水線樣本的頻數(shù)分布表和乙流水線樣本的頻數(shù)分布直方圖如下:甲流水線樣本的頻數(shù)分布表質(zhì)量指標(biāo)值頻數(shù)(190,195]9(195,200]10(200,205]17(205,210]8(210,215]6乙流水線樣本頻率分布直方圖(1)根據(jù)乙流水線樣本頻率分布直方圖,估計(jì)乙流水線生產(chǎn)產(chǎn)品的該項(xiàng)質(zhì)量指標(biāo)值的中位數(shù);(2)若將頻率視為概率,某個(gè)月內(nèi)甲、乙兩條流水線均生產(chǎn)了5000件產(chǎn)品,則甲、乙兩條流水線分別生產(chǎn)出不合格品約多少件?(3)根據(jù)已知條件完成下面2×2列聯(lián)表,并回答是否有85%的把握認(rèn)為“該企業(yè)生產(chǎn)的這種產(chǎn)品的該項(xiàng)質(zhì)量指標(biāo)值與甲、乙兩條流水線的選擇有關(guān)”?

甲生產(chǎn)線乙生產(chǎn)線合計(jì)合格品

不合格品

合計(jì)

附:P(K2≥k0)0.150.100.050.0250.010

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論