高中數(shù)學高考72第十一章 算法、統(tǒng)計與統(tǒng)計案例 11 4 變量的相關性、統(tǒng)計案例_第1頁
高中數(shù)學高考72第十一章 算法、統(tǒng)計與統(tǒng)計案例 11 4 變量的相關性、統(tǒng)計案例_第2頁
高中數(shù)學高考72第十一章 算法、統(tǒng)計與統(tǒng)計案例 11 4 變量的相關性、統(tǒng)計案例_第3頁
高中數(shù)學高考72第十一章 算法、統(tǒng)計與統(tǒng)計案例 11 4 變量的相關性、統(tǒng)計案例_第4頁
高中數(shù)學高考72第十一章 算法、統(tǒng)計與統(tǒng)計案例 11 4 變量的相關性、統(tǒng)計案例_第5頁
已閱讀5頁,還剩67頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第十一章

算法、統(tǒng)計與統(tǒng)計案例§11.4變量間的相關關系、統(tǒng)計案例NEIRONGSUOYIN內(nèi)容索引基礎知識自主學習題型分類深度剖析課時作業(yè)1基礎知識自主學習PARTONE(1)正相關在散點圖中,點散布在從_______到_______的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關.(2)負相關在散點圖中,點散布在從_______到_______的區(qū)域,兩個變量的這種相關關系稱為負相關.(3)線性相關關系、回歸直線如果散點圖中點的分布從整體上看大致在______________,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線.1.兩個變量的線性相關知識梳理ZHISHISHULI左下角右上角左上角右下角一條直線附近2.回歸方程(1)最小二乘法求回歸直線,使得樣本數(shù)據(jù)的點到它的__________________的方法叫做最小二乘法.(2)回歸方程距離的平方和最小3.回歸分析(1)定義:對具有_________的兩個變量進行統(tǒng)計分析的一種常用方法.(2)樣本點的中心對于一組具有線性相關關系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其中(

)稱為樣本點的中心.(3)相關系數(shù)當r>0時,表明兩個變量_______;當r<0時,表明兩個變量_______.r的絕對值越接近于1,表明兩個變量的線性相關性_____.r的絕對值越接近于0,表明兩個變量之間_______________________.通常|r|大于____時,認為兩個變量有很強的線性相關性.相關關系正相關負相關越強幾乎不存在線性相關關系0.754.獨立性檢驗(1)分類變量:變量的不同“值”表示個體所屬的_________,像這樣的變量稱為分類變量.(2)列聯(lián)表:列出的兩個分類變量的_______,稱為列聯(lián)表.假設有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為2×2列聯(lián)表

y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d不同類別頻數(shù)表(3)獨立性檢驗利用隨機變量___來判斷“兩個分類變量_______”的方法稱為獨立性檢驗.a+b+c+dK2有關系1.變量的相關關系與變量的函數(shù)關系有什么區(qū)別?提示相同點:兩者均是指兩個變量的關系.不同點:①函數(shù)關系是一種確定的關系,相關關系是一種非確定的關系.②函數(shù)關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.2.如何判斷兩個變量間的線性相關關系?提示散點圖中點的分布從整體上看大致在一條直線附近,或者通過計算相關系數(shù)作出判斷.【概念方法微思考】3.獨立性檢驗的基本步驟是什么?提示列出2×2列聯(lián)表,計算k值,根據(jù)臨界值表得出結論.4.線性回歸方程是否都有實際意義?根據(jù)回歸方程進行預報是否一定準確?提示(1)不一定都有實際意義.回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義.(2)根據(jù)回歸方程進行預報,僅是一個預報值,而不是真實發(fā)生的值.題組一思考辨析1.判斷下列結論是否正確(請在括號中打“√”或“×”)(1)相關關系與函數(shù)關系都是一種確定性的關系,也是一種因果關系.(

)(2)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關關系.(

)(3)只有兩個變量有相關關系,所得到的回歸模型才有預測價值.(

)(4)某同學研究賣出的熱飲杯數(shù)y與氣溫x(℃)之間的關系,得線性回歸方程

=-2.352x+147.767,則氣溫為2℃時,一定可賣出143杯熱飲.(

)(5)事件X,Y關系越密切,則由觀測數(shù)據(jù)計算得到的K2的觀測值越大.(

)×基礎自測JICHUZICE123456×√√√題組二教材改編1234562.[P97T2]為調(diào)查中學生近視情況,測得某校男生150名中有80名近視,在140名女生中有70名近視.在檢驗這些學生眼睛近視是否與性別有關時,用下列哪種方法最有說服力A.回歸分析

B.均值與方差

C.獨立性檢驗

D.概率√解析“近視”與“性別”是兩類變量,其是否有關,應用獨立性檢驗判斷.則表中a,b的值分別為A.94,72 B.52,50

C.52,74

D.74,52√1234563.[P97練習]下面是2×2列聯(lián)表:

y1y2總計x1a2173x2222547總計b46120解析∵a+21=73,∴a=52.又a+22=b,∴b=74.4.[P81例1]某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此進行了5次試驗.根據(jù)收集到的數(shù)據(jù)(如下表),由最小二乘法求得回歸方程

=0.67x+54.9.現(xiàn)發(fā)現(xiàn)表中有一個數(shù)據(jù)看不清,請你推斷出該數(shù)據(jù)的值為____.設表中的“模糊數(shù)字”為a,則62+a+75+81+89=75×5,∴a=68.123456零件數(shù)x(個)1020304050加工時間y(min)6275818968題組三易錯自糾5.某醫(yī)療機構通過抽樣調(diào)查(樣本容量n=1000),利用2×2列聯(lián)表和K2統(tǒng)計量研究患肺病是否與吸煙有關.計算得K2=4.453,經(jīng)查閱臨界值表知P(K2≥3.841)≈0.05,現(xiàn)給出四個結論,其中正確的是A.在100個吸煙的人中約有95個人患肺病B.若某人吸煙,那么他有95%的可能性患肺病C.有95%的把握認為“患肺病與吸煙有關”D.只有5%的把握認為“患肺病與吸煙有關”123456√解析由已知數(shù)據(jù)可得,有1-0.05=95%的把握認為“患肺病與吸煙有關”.1234566.在一次考試中,5名學生的數(shù)學和物理成績?nèi)缦卤恚?已知學生的數(shù)學和物理成績具有線性相關關系)現(xiàn)已知其線性回歸方程為

,則根據(jù)此線性回歸方程估計數(shù)學得90分的同學的物理成績?yōu)開___.(四舍五入到整數(shù))學生的編號i12345數(shù)學成績x8075706560物理成績y7066686462731234562題型分類深度剖析PARTTWO題型一相關關系的判斷例1

(1)觀察下列各圖形,其中兩個變量x,y具有相關關系的圖是A.①②

B.①④

C.③④

D.②③師生共研解析由散點圖知③中的點都分布在一條直線附近.④中的點都分布在一條曲線附近,所以③④中的兩個變量具有相關關系.√(2)(2018·廣州質(zhì)檢)根據(jù)下面給出的2004年至2013年我國二氧化硫排放量(單位:萬噸)的柱形圖.以下結論不正確的是A.逐年比較,2008年減少二氧化硫排放量的效果最顯著B.2007年我國治理二氧化硫排放顯現(xiàn)成效C.2006年以來我國二氧化硫年排放量呈減少趨勢D.2006年以來我國二氧化硫年排放量與年份正相關√解析從2006年,將每年的二氧化硫排放量與前一年作差比較,得到2008年二氧化硫排放量與2007年排放量的差最大,A選項正確;2007年二氧化硫排放量較2006年降低了很多,B選項正確;雖然2011年二氧化硫排放量較2010年多一些,但自2006年以來,整體呈遞減趨勢,C選項正確;自2006年以來我國二氧化硫年排放量與年份負相關,D選項錯誤,故選D.判定兩個變量正,負相關性的方法(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關;點的分布從左上角到右下角,兩個變量負相關.(2)相關系數(shù):當r>0時,正相關;當r<0時,負相關.(3)線性回歸方程中:當

>0時,正相關;當

<0時,負相關.思維升華跟蹤訓練1

(1)在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=-

x+1上,則這組樣本數(shù)據(jù)的樣本相關系數(shù)為A.-1 B.0

C.-

D.1解析完全的線性關系,且為負相關,故其相關系數(shù)為-1,故選A.√(2)x和y的散點圖如圖所示,則下列說法中所有正確命題的序號為_____.①x,y是負相關關系;②在該相關關系中,若用y=

擬合時的相關指數(shù)為

,用

擬合時的相關指數(shù)為

,則

;③x,y之間不能建立線性回歸方程.①②解析在散點圖中,點散布在從左上角到右下角的區(qū)域,因此x,y是負相關關系,故①正確;x,y之間可以建立線性回歸方程,但擬合效果不好,故③錯誤.題型二回歸分析命題點1線性回歸分析多維探究例2

下圖是我國2011年至2017年生活垃圾無害化處理量(單位:億噸)的折線圖.注:年份代碼1~7分別對應年份2011~2017.(1)由折線圖看出,可用線性回歸模型擬合y與t的關系,請用相關系數(shù)加以說明;因為y與t的相關系數(shù)近似為0.99,說明y與t的線性相關程度相當高,從而可以用線性回歸模型擬合y與t的關系.解由折線圖中數(shù)據(jù)和附注中參考數(shù)據(jù)得(2)建立y關于t的回歸方程(系數(shù)精確到0.01),預測2019年我國生活垃圾無害化處理量.附注:所以預測2019年我國生活垃圾無害化處理量約為1.83億噸.命題點2非線性回歸例3

某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響,對近8年的年宣傳費xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.46.65636.8289.81.61469108.8(1)根據(jù)散點圖判斷,y=a+bx與y=c+d哪一個適宜作為年銷售量y關于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由)解由散點圖可以判斷,y=c+d適宜作為年銷售量y關于年宣傳費x的回歸方程類型.(2)根據(jù)(1)的判斷結果及表中數(shù)據(jù),建立y關于x的回歸方程;(3)已知這種產(chǎn)品的年利潤z與x,y的關系為z=0.2y-x.根據(jù)(2)的結果回答下列問題:①年宣傳費x=49時,年銷售量及年利潤的預報值是多少?②年宣傳費x為何值時,年利潤的預報值最大?解①由(2)知,當x=49時,②根據(jù)(2)的結果知,年利潤z的預報值故年宣傳費為46.24千元時,年利潤的預報值最大.回歸分析問題的類型及解題方法(1)求回歸方程①根據(jù)散點圖判斷兩變量是否線性相關,如不是,應通過換元構造線性相關.②利用公式,求出回歸系數(shù)

.③待定系數(shù)法:利用回歸直線過樣本點的中心求系數(shù)

.(2)利用回歸方程進行預測,把線性回歸方程看作一次函數(shù),求函數(shù)值.(3)利用回歸直線判斷正、負相關;決定正相關還是負相關的是系數(shù)

.(4)回歸方程的擬合效果,可以利用相關系數(shù)判斷,當|r|越趨近于1時,兩變量的線性相關性越強.思維升華跟蹤訓練2

(2018·全國Ⅱ)下圖是某地區(qū)2000年至2016年環(huán)境基礎設施投資額y(單位:億元)的折線圖.為了預測該地區(qū)2018年的環(huán)境基礎設施投資額,建立了y與時間變量t的兩個線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,…,17)建立模型①:

=-30.4+13.5t;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,…,7)建立模型②:=99+17.5t.(1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎設施投資額的預測值;解利用模型①,可得該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為

=-30.4+13.5×19=226.1(億元).利用模型②,可得該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為

=99+17.5×9=256.5(億元).(2)你認為用哪個模型得到的預測值更可靠?并說明理由.解利用模型②得到的預測值更可靠.理由如下:(ⅰ)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對應的點沒有隨機散布在直線y=-30.4+13.5t上下,這說明利用2000年至2016年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境基礎設施投資額的變化趨勢.2010年相對2009年的環(huán)境基礎設施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對應的點位于一條直線的附近,這說明從2010年開始環(huán)境基礎設施投資額的變化規(guī)律呈線性增長趨勢,利用2010年至2016年的數(shù)據(jù)建立的線性模型

=99+17.5t可以較好地描述2010年以后的環(huán)境基礎設施投資額的變化趨勢,因此利用模型②得到的預測值更可靠.(ⅱ)從計算結果看,相對于2016年的環(huán)境基礎設施投資額220億元,由模型①得到的預測值226.1億元的增幅明顯偏低,而利用模型②得到的預測值的增幅比較合理,說明利用模型②得到的預測值更可靠.題型三獨立性檢驗師生共研例4

(2017·全國Ⅱ)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:(1)設兩種養(yǎng)殖方法的箱產(chǎn)量相互獨立,記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg,新養(yǎng)殖法的箱產(chǎn)量不低于50kg”,估計A的概率;解記B表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg”,C表示事件“新養(yǎng)殖法的箱產(chǎn)量不低于50kg”.由題意知,P(A)=P(BC)=P(B)P(C).舊養(yǎng)殖法的箱產(chǎn)量低于50kg的頻率為(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估計值為0.62.新養(yǎng)殖法的箱產(chǎn)量不低于50kg的頻率為(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估計值為0.66.因此,事件A的概率估計值為0.62×0.66=0.4092.(2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關:

箱產(chǎn)量<50kg箱產(chǎn)量≥50kg舊養(yǎng)殖法

新養(yǎng)殖法

解根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表如下:

箱產(chǎn)量<50kg箱產(chǎn)量≥50kg舊養(yǎng)殖法6238新養(yǎng)殖法3466由于15.705>6.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關.(3)根據(jù)箱產(chǎn)量的頻率分布直方圖,求新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值(精確到0.01).附:P(K2≥k0)0.0500.0100.001k03.8416.63510.828解因為新養(yǎng)殖法的箱產(chǎn)量頻率分布直方圖中,箱產(chǎn)量低于50kg的直方圖面積為(0.004+0.020+0.044)×5=0.34<0.5,箱產(chǎn)量低于55kg的直方圖面積為(0.004+0.020+0.044+0.068)×5=0.68>0.5,(1)比較幾個分類變量有關聯(lián)的可能性大小的方法①通過計算K2的大小判斷:K2越大,兩變量有關聯(lián)的可能性越大.②通過計算|ad-bc|的大小判斷:|ad-bc|越大,兩變量有關聯(lián)的可能性越大.(2)獨立性檢驗的一般步驟①根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表.③比較k與臨界值的大小關系,做統(tǒng)計推斷.思維升華跟蹤訓練3

(2018·廣州檢測)某企業(yè)生產(chǎn)的某種產(chǎn)品被檢測出其中一項質(zhì)量指標存在問題.該企業(yè)為了檢查生產(chǎn)該產(chǎn)品的甲、乙兩條流水線的生產(chǎn)情況,隨機地從這兩條流水線上生產(chǎn)的大量產(chǎn)品中各抽取50件產(chǎn)品作為樣本,測出它們的這一項質(zhì)量指標值.若該項質(zhì)量指標值落在(195,210]內(nèi),則為合格品,否則為不合格品.甲流水線樣本的頻數(shù)分布表和乙流水線樣本的頻率分布直方圖如下:甲流水線樣本的頻數(shù)分布表質(zhì)量指標值頻數(shù)(190,195]9(195,200]10(200,205]17(205,210]8(210,215]6乙流水線樣本頻率分布直方圖(1)根據(jù)乙流水線樣本頻率分布直方圖,估計乙流水線生產(chǎn)產(chǎn)品的該項質(zhì)量指標值的中位數(shù);解設乙流水線生產(chǎn)產(chǎn)品的該項質(zhì)量指標值的中位數(shù)為x,因為(0.012+0.032+0.052)×5=0.48<0.5<(0.012+0.032+0.052+0.076)×5=0.86,則(0.012+0.032+0.052)×5+0.076×(x-205)=0.5,(2)若將頻率視為概率,某個月內(nèi)甲、乙兩條流水線均生產(chǎn)了5000件產(chǎn)品,則甲,乙兩條流水線分別生產(chǎn)出不合格品約多少件?解由甲、乙兩條流水線各抽取的50件產(chǎn)品可得,甲流水線生產(chǎn)的不合格品有15件,于是,若某個月內(nèi)甲、乙兩條流水線均生產(chǎn)了5000件產(chǎn)品,(3)根據(jù)已知條件完成下面2×2列聯(lián)表,并回答是否有85%的把握認為“該企業(yè)生產(chǎn)的這種產(chǎn)品的該項質(zhì)量指標值與甲、乙兩條流水線的選擇有關”?

甲生產(chǎn)線乙生產(chǎn)線總計合格品

不合格品

總計

附:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解2×2列聯(lián)表:

甲生產(chǎn)線乙生產(chǎn)線總計合格品354075不合格品151025總計5050100∵1.3<2.072,∴沒有85%的把握認為“該企業(yè)生產(chǎn)的這種產(chǎn)品的該項質(zhì)量指標值與甲、乙兩條流水線的選擇有關”.數(shù)據(jù)分析是指針對研究對象獲得相關數(shù)據(jù),運用統(tǒng)計方法對數(shù)據(jù)中的有用信息進行分析和推斷,形成知識的過程.主要包括:收集數(shù)據(jù)、整理數(shù)據(jù)、提取信息、構建模型對信息進行分析、推斷、獲得結論.核心素養(yǎng)之數(shù)據(jù)分析HEXINSUYANGZHISHUJUFENXI線性回歸方程及其應用例某地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計數(shù)據(jù):年份20062008201020122014需求量/萬噸236246257276286解由所給數(shù)據(jù)看出,年需求量與年份之間近似直線上升,下面來求線性回歸方程,先將數(shù)據(jù)處理如下表.年份-2010-4-2024需求-257-21-1101929(2)利用(1)中所求出的線性回歸方程預測該地2019年的糧食需求量.解利用所求得的線性回歸方程,可預測2019年的糧食需求量大約為6.5×(2019-2010)+260.2=6.5×9+260.2=318.7(萬噸).素養(yǎng)提升例題中利用所給數(shù)據(jù)求回歸方程的過程體現(xiàn)的就是數(shù)據(jù)分析素養(yǎng).3課時作業(yè)PARTTHREE1.已知變量x和y滿足關系

=-0.1x+1,變量y與z正相關.下列結論中正確的是A.x與y正相關,x與z負相關

B.x與y正相關,x與z正相關C.x與y負相關,x與z負相關

D.x與y負相關,x與z正相關√基礎保分練12345678910111213141516所以x與z負相關.故選C.123456789101112131415162.(2018·湖南省五市十校聯(lián)考)下表提供了某工廠節(jié)能降耗技術改造后,一種產(chǎn)品的產(chǎn)量x(單位:噸)與相應的生產(chǎn)能耗y(單位:噸)的幾組對應數(shù)據(jù):根據(jù)上表提供的數(shù)據(jù),求得y關于x的線性回歸方程為

=0.7x+0.35,那么表格中t的值為A.3B.3.15C.3.25D.3.5√x/噸3456y/噸2.5t44.512345678910111213141516解得t=3.123456789101112131415163.(2018·廣東省百校聯(lián)盟聯(lián)考)下表是我國某城市在2017年1月份至10月份期間各月最低溫度與最高溫度(單位:℃)的數(shù)據(jù)一覽表.已知該城市的各月最低溫與最高溫具有相關關系,根據(jù)該一覽表,則下列結論錯誤的是A.最低溫度與最高溫度為正相關B.每月最高溫度與最低溫度的平均值在前8個月逐月增加C.月溫差(最高溫度減最低溫度)的最大值出現(xiàn)在1月D.1月至4月的月溫差(最高溫度減最低溫度)相對于7月至10月,波動性更大√月份12345678910最高溫度/℃59911172427303121最低溫度/℃-12-31-27171923251012345678910111213141516解析將最高溫度、最低溫度、溫差列表如下:由表格可知,最低溫度大致隨最高溫度的升高而升高,A正確;每月最高溫度與最低溫度的平均值在前8個月不是逐月增加,B錯誤;月溫差的最大值出現(xiàn)在1月,C正確;1月至4月的月溫差相對于7月至10月,波動性更大,D正確.月份12345678910最高溫度/℃59911172427303121最低溫度/℃-12-31-271719232510溫差度/℃1712813107876114.對具有線性相關關系的變量x,y有一組觀測數(shù)據(jù)(xi,yi)(i=1,2,…,8),其線性回歸方程是

,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,則實數(shù)

的值是12345678910111213141516√5.為了解某社區(qū)居民購買水果和牛奶的年支出費用與購買食品的年支出費用的關系,隨機調(diào)查了該社區(qū)5戶家庭,得到如下統(tǒng)計數(shù)據(jù)表:根據(jù)上表可得線性回歸方程

,其中

,據(jù)此估計該社區(qū)一戶購買食品的年支出費用為3.00萬元的家庭購買水果和牛奶的年支出費用為A.1.795萬元 B.2.555萬元C.1.915萬元 D.1.945萬元購買食品的年支出費用x/萬元2.092.152.502.842.92購買水果和牛奶的年支出費用y/萬元1.251.301.501.701.75√12345678910111213141516123456789101112131415166.(2018·開封模擬)下列說法錯誤的是A.回歸直線過樣本點的中心(

)B.線性回歸方程對應的直線

至少經(jīng)過其樣本數(shù)據(jù)點(x1,y1),(x2,y2),

…,(xn,yn)中的一個點C.在殘差圖中,殘差點分布的帶狀區(qū)域的寬度越狹窄,其模型擬合的精度越高D.在回歸分析中,R2為0.98的模型比R2為0.80的模型擬合的效果好12345678910111213141516√12345678910111213141516解析回歸直線必過樣本點的中心,A正確;由殘差分析可知殘差點分布的帶狀區(qū)域的寬度越狹窄,其模型擬合的精度越高,C正確;在回歸分析中,R2越接近于1,模擬效果越好,D正確;但不一定經(jīng)過樣本的數(shù)據(jù)點,所以B錯誤,故選B.7.某市居民2010~2014年家庭年平均收入x(單位:萬元)與年平均支出y(單位:萬元)的統(tǒng)計資料如下表所示:根據(jù)統(tǒng)計資料,居民家庭年平均收入的中位數(shù)是___,家庭年平均收入與年平均支出有____相關關系.(填“正”或“負”)12345678910111213141516年份20102011201220132014收入x11.512.11313.315支出y6.88.89.8101213正解析中位數(shù)是13.由相關性知識,根據(jù)統(tǒng)計資料可以看出,當年平均收入增多時,年平均支出也增多,因此兩者之間具有正相關關系.123456789101112131415168.某公司為確定明年投入某產(chǎn)品的廣告支出,對近5年的年廣告支出m與年銷售額t(單位:百萬元)進行了初步統(tǒng)計,得到下列表格中的數(shù)據(jù):經(jīng)測算,年廣告支出m與年銷售額t滿足線性回歸方程

=6.5m+17.5,則p=___.年廣告支出m24568年銷售額t3040p507060123456789101112131415169.以下四個命題,其中正確的序號是_____.①從勻速傳遞的產(chǎn)品生產(chǎn)流水線上,質(zhì)檢員每20分鐘從中抽取一件產(chǎn)品進行某項指標檢測,這樣的抽樣是分層抽樣;②兩個隨機變量相關性越強,則相關系數(shù)的絕對值越接近于1;③在線性回歸方程

=0.2x+12中,當解釋變量x每增加一個單位時,預報變量

平均增加0.2個單位;④對分類變量X與Y的統(tǒng)計量K2來說,K2越小,“X與Y有關系”的把握程度越大.②③解析①是系統(tǒng)抽樣;對于④,統(tǒng)計量K2越小,說明兩個相關變量有關系的把握程度越小.1234567891011121314151610.為了判斷高中三年級學生選修文科是否與性別有關,現(xiàn)隨機抽取50名學生,得到如圖所示2×2列聯(lián)表:

理科文科總計男131023女72027總計20305095%因為4.844>3.841,所以有95%的把握認為選修文科與性別有關.123456789101112131415161234567891011121314151611.某公司為了準確地把握市場,做好產(chǎn)品生產(chǎn)計劃,對過去四年的數(shù)據(jù)進行整理得到了第x年與年銷售量y(單位:萬件)之間的關系如下表.x1234y12284256(1)在圖中畫出表中數(shù)據(jù)的散點圖;12345678910111213141516解作出的散點圖如圖所示:12345678910111213141516(2)根據(jù)散點圖選擇合適的回歸模型擬合y與x的關系(不必說明理由);解根據(jù)散點圖可知,可以用線性回歸模型擬合y與x的關系.12345678910111213141516(3)建立y關于x的回歸方程,預測第5年的銷售量.參考公式:回歸直線的斜率和截距的最小二乘估計分別為12345678910111213141516解觀察(1)中散點圖可知各點大致分布在一條直線附近,列出表格:ixiyixiyi1112112222845633429126445616224∑101383041812345678910111213141516故預測第5年的銷售量為71萬件.12.某省會城市地鐵將于2019年6月開始運營,為此召開了一個價格聽證會,擬定價格后又進行了一次調(diào)查,隨機抽查了50人,他們的收入與態(tài)度如下:12345678910111213141516月收入(單位:百元)[15,25)[25,35)[35,45)[45,55)[55,65)[65,75]贊成定價者人數(shù)123534認為價格偏高者人數(shù)4812521(1)若以區(qū)間的中點值為該區(qū)間內(nèi)的人均月收入,求參與調(diào)查的人員中“贊成定價者”與“認為價格偏高者”的月平均收入的差異是多少(結果保留2位小數(shù));12345678910111213141516解“贊成定價者”的月平均收入為“認為價格偏高者”的月平均收入為∴“贊成定價者”與“認為價格偏高者”的月平均收入的差距是x1-x2=50.56-38.75=11.81(百元).(2)由以上統(tǒng)計數(shù)據(jù)填下面2×2列聯(lián)表,分析是否有99%的把握認為“月收入以55百元為分界點對地鐵定價的態(tài)度有差異”.12345678910111213141516

月收入不低于55百元的人數(shù)月收入低于55百元的人數(shù)總計認為價格偏高者

贊成定價者

總計

P(K2≥k0)0.050.01k03.8416.63512345678910111213141516解根據(jù)條件可得2×2列聯(lián)表如下:∴沒有99%的把握認為“月收入以55百元為分界點對地鐵定價的態(tài)度有差異”.

月收入不低于55百元的人數(shù)月收入低于55百元的人數(shù)總計認為價格偏高者32932贊成定價者71118總計104050技能提升練1234567891011121314151613.(2018·保定模擬)中央政府為了應對因人口老齡化而造成的勞動力短缺問題,擬定出臺“延遲退休年齡政策”.為了了解人們對“延遲退休年齡政策”的態(tài)度,責成人社部進行調(diào)研.人社部從網(wǎng)上年齡在15~65的人群中隨機調(diào)查100人,調(diào)查數(shù)據(jù)的頻率分布直方圖和支持“延遲退休”的人數(shù)與年齡的統(tǒng)計結果如下:12345678910111213141516年齡[15,25)[25,35)[35,45)[45,55)[55,65]支持“延遲退休”的人數(shù)155152817(1)由以上統(tǒng)計數(shù)據(jù)填寫2×2列聯(lián)表,并判斷是否有95%的把握認為以45歲為分界點的不同人群對“延遲退休年齡政策”的支持度有差異;

45歲以下45歲及45歲以上總計支持

不支持

總計

解2×2列聯(lián)表如下:12345

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論