變量間的相關(guān)關(guān)系、統(tǒng)計案例_第1頁
變量間的相關(guān)關(guān)系、統(tǒng)計案例_第2頁
變量間的相關(guān)關(guān)系、統(tǒng)計案例_第3頁
變量間的相關(guān)關(guān)系、統(tǒng)計案例_第4頁
變量間的相關(guān)關(guān)系、統(tǒng)計案例_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

變量間的相關(guān)關(guān)系、統(tǒng)計案例相關(guān)性通常將變量所對應的點描出來,這些點就組成了變量之間的一個圖,通常稱這種圖為變量之間的散點圖.從散點圖上可以看出,如果變量之間存在著某種關(guān)系,這些點會有一個集中的大致趨勢,這種趨勢通常可以用一條光滑的曲線來近似,這樣近似的過程稱為曲線擬僉若兩個變量x和j的散點圖中,所有點看上去都在一條直線附近波動,則稱變量間是線性相關(guān)的,若所有點看上去都在某條曲線(不是一條直線)附近波動,則稱此相關(guān)是韭線性相關(guān)的.如果所有的點在散點圖中沒有顯示任何關(guān)系,則稱變量間是不相關(guān)的線性回歸方程最小二乘法如果有n個點(x1,y1),(x2,%),???,(%,匕),可以用比一(a+bX])]2+[j2—(a+bx2)]2^既一(a+b%)]2來刻畫這些點與直線y=a+bx的接近程度,使得上式達到最小值的直線y=a+bx就是所要求的直線,這種方法稱為最小二乘法.線性回歸方程方程y=bx+a是兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(%,y1),(x2,y2),???,(%,y〃)的線性回歸方程,其中a,b是待定參數(shù).nn—1^n,Ex2-nx2i=11nE(x一x)2i=1^n,Ex2-nx2i=11nE(x一x)2i=1a=y-bx.回歸分析定義:對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法.樣本點的中心對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),-,(xn,yn)中,(Z,?)稱為樣本點的中心.相關(guān)系數(shù)nE(x—x)(y一y)i=1,-—n!n弋苦(xi-x)2\lEy-y)2n—^xy.~nxyExEx2-nx2i=ilEy2-ny2l=1②當r>0時,表明兩個變量正相關(guān):當r<0時,表明兩個變量負相關(guān):當r=0時,表明兩個變量線性不相關(guān).Irl值越接近于1,表明兩個變量之間的線性相關(guān)程度越高.Irl值越接近于0,表明兩個變量之間的線性相關(guān)程度越低.獨立性檢驗設A,B為兩個變量,每一個變量都可以取兩個值,變量A:A「A2=A]:變量B:B],B2=B1.2X2列聯(lián)表:XB1B2總計A1aba+bA2cdc+d總計a+cb+dn=a+b+c+d構(gòu)造一個統(tǒng)計量n(ad—bc)2.(a+b)(c+d)(a+c)(b+d)利用統(tǒng)計量%2來判斷“兩個分類變量有關(guān)系”的方法稱為獨立性檢驗.當/2W2.706時,沒有充分的證據(jù)判定變量A,B有關(guān)聯(lián),可以認為變量A,B是沒有關(guān)聯(lián)的;當x2>2.706時,有90%的把握判定變量A,B有關(guān)聯(lián);當x2>3.841時,有95%的把握判定變量A,B有關(guān)聯(lián);當x2>6.635時,有99%的把握判定變量A,B有關(guān)聯(lián).【概念方法微思考】變量的相關(guān)關(guān)系與變量的函數(shù)關(guān)系有什么區(qū)別?提示相同點:兩者均是指兩個變量的關(guān)系.不同點:①函數(shù)關(guān)系是一種確定的關(guān)系,相關(guān)關(guān)系是一種非確定的關(guān)系②函數(shù)關(guān)系是一種因果關(guān)系,而相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系如何判斷兩個變量間的線性相關(guān)關(guān)系?提示散點圖中點的分布從整體上看大致在一條直線附近,或者通過計算相關(guān)系數(shù)作出判斷.獨立性檢驗的基本步驟是什么?

提示列出2X2列聯(lián)表,計算X值,根據(jù)臨界值表得出結(jié)論.線性回歸方程是否都有實際意義?根據(jù)回歸方程進行預測是否一定準確?提示(1)不一定都有實際意義.回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義.(2)根據(jù)回歸方程進行預測,僅是一個預測值,而不是真實發(fā)生的值匚基礎自測題組一思考辨析判斷下列結(jié)論是否正確(請在括號中打“””或“X”)(1)相關(guān)關(guān)系與函數(shù)關(guān)系都是一種確定性的關(guān)系,也是一種因果關(guān)系.(X)(2)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關(guān)關(guān)系(V)(3)只有兩個變量有相關(guān)關(guān)系,所得到的回歸模型才有預測價值.(V)(4)某同學研究賣出的熱飲杯數(shù)j與氣溫MC)之間的關(guān)系,得線性回歸方程j=-2.352x+147.767,則氣溫為2C時,一定可賣出143杯熱飲.(X)⑸事件X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的X的值越大.(V)題組二教材改編為調(diào)查中學生近視情況,測得某校男生150名中有80名近視,在140名女生中有70名近視.在檢驗這些學生眼睛近視是否與性別有關(guān)時,用下列哪種方法最有說服力()回歸分析B.均值與方差C.獨立性檢驗D.概率答案C解析“近視”與“性別”是兩類變量,其是否有關(guān),應用獨立性檢驗判斷.下面是2X2列聯(lián)表:j1j2總計%a2173X2222547總計b46120則表中a,b的值分別為()B,52,50D,74,52A,94,72C,52,74答案C解析.「。+21=73,..?q=B,52,50D,74,52又a+22=b,Ab=74.某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此進行了5次試驗.根據(jù)收集到的數(shù)據(jù)(如下表),由最小二乘法求得回歸方程j=0.67x+54.9.零件數(shù)x(個)1020304050加工時間y(min)62■758189現(xiàn)發(fā)現(xiàn)表中有一個數(shù)據(jù)看不清,請你推斷出該數(shù)據(jù)的值為.答案68解析由7=30,得;=0.67X30+54.9=75.設表中的“模糊數(shù)字”為a,則62+a+75+81+89=75X5,Aa=68.題組三易錯自糾某醫(yī)療機構(gòu)通過抽樣調(diào)查(樣本容量n=1000),利用2X2列聯(lián)表和X統(tǒng)計量研究患肺病是否與吸煙有關(guān).計算得左=4.453,經(jīng)查閱臨界值表知P(x2N3.841)o0.05,現(xiàn)給出四個結(jié)論,其中正確的是()在100個吸煙的人中約有95個人患肺病若某人吸煙,那么他有95%的可能性患肺病有95%的把握認為“患肺病與吸煙有關(guān)”只有5%的把握認為“患肺病與吸煙有關(guān)”答案C解析由已知數(shù)據(jù)可得,有1—0.05=95%的把握認為“患肺病與吸煙有關(guān)”.在一次考試中,5名學生的數(shù)學和物理成績?nèi)缦卤恚海ㄒ阎獙W生的數(shù)學和物理成績具有線性相關(guān)關(guān)系)學生的編號,12345數(shù)學成績x8075706560物理成績y7066686462現(xiàn)已知其線性回歸方程為j=0.36x+a,則根據(jù)此線性回歸方程估計數(shù)學得90分的同學的物理成績?yōu)?(四舍五入到整數(shù))答案7360+65+70+75+80解析x=5=70

62+64+66+68+70J=5=66所以66=0.36X70+。,a=40.8,即線性回歸方程為y=0.36x+40.8.當x=90時,y=0.36X90+40.8=73.2e73.題型分類真題典題深度剖析題型分類真題典題深度剖析深度剖析重點難點多維探究J具有相關(guān)關(guān)系的圖是()B.①④270()260()25()0240023002200210020()。1900題型一相關(guān)關(guān)系的判斷■師生共研例1(1)觀察下列各圖形,J具有相關(guān)關(guān)系的圖是()B.①④270()260()25()0240023002200210020()。1900C.③④(2)(2018-合肥質(zhì)檢)根據(jù)下面給出的2004年至2013年我國二氧化硫排放量(單位:萬噸)的柱形圖.以下結(jié)論不正確的是()逐年比較,2008年減少二氧化硫排放量的效果最顯著2007年我國治理二氧化硫排放顯現(xiàn)成效2006年以來我國二氧化硫年排放量呈減少趨勢2006年以來我國二氧化硫年排放量與年份正相關(guān)答案D解析從2006年,將每年的二氧化硫排放量與前一年作差比較,得到2008年二氧化硫排放量與2007年排放量的差最大,A選項正確;2007年二氧化硫排放量較2006年降低了很多,B選項正確;

雖然2011年二氧化硫排放量較2010年多一些,但自2006年以來,整體呈遞減趨勢,C選項正確;自2006年以來我國二氧化硫年排放量與年份負相關(guān),D選項錯誤,故選D.思維升華判定兩個變量正,負相關(guān)性的方法(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關(guān);點的分布從左上角到右下角,兩個變量負相關(guān).(2)相關(guān)系數(shù):當r>0時,正相關(guān);當r<0時,負相關(guān).(3)線性回歸方程中:當b>0時,正相關(guān);當b<0時,負相關(guān).跟蹤訓練1在一組樣本數(shù)據(jù)(氣,y1),(x2,%),,",(Xn,匕)(nN2,x「x2,…,%不全相等)的散點圖中,若所有樣本點(x,,y,)(Z=1,2,…,n)都在直線y=-|x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為()A.-1B.0C.-2D.1答案A多維探究解析完全的線性關(guān)系,且為負相關(guān),故其相關(guān)系數(shù)為一1,故選A.題型二回歸分析命題點1線性回歸分析例2下圖是我國2011年至2017年生活垃圾無害化處理量(單位:億噸)的折線圖.注:年份代碼1?7分別對應年份2011?2017.(1)由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請用相關(guān)系數(shù)加以說明;(2)建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預測2019年我國生活垃圾無害化處理量.附注:參考數(shù)據(jù):Xy=9.32,£ty=40.17,飛:£(y-?)2=0.55,;'7^2.646.,=1,=1,■■■■',=1TOC\o"1-5"\h\zn——覽(t~t)3,一y)=1參考公式:相關(guān)系數(shù)r=—,■\私。一t)2私3一y)2■■■-.I1i=1i=1回歸方程y=a+bt中斜率和截距的最小二乘估計公式分別為:羌(廣t)3一y),=1b=,a=y一bt.切(t一t)2解(1)由折線圖中數(shù)據(jù)和附注中參考數(shù)據(jù)得—,寸,—、―t=4,£(t,—t)2=28,孑,—、,—、旗(t~t)(y~y)i=1=£ty—7£y,i=1i=1=40.17—4X9.32=2.89,2.89所以r°0.55X2X2.646°0*9.因為y與t的相關(guān)系數(shù)近似為0.99,說明y與t的線性相關(guān)程度相當高,從而可以用線性回歸模型擬合y與t的關(guān)系.,—9.32⑵由y=~7~^1.331及⑴得孑,—…—、£(t—t)(y—y)―2.89—b==gQ0.10,28(t—t)2a=J—b721.331—0.10X420.93.所以y關(guān)于t的回歸方程為y=0.93+0.10t.將2019年對應的t=9代入回歸方程得y=0.93+0.10X9=1.83.

所以預測2019年我國生活垃圾無害化處理量約為1.83億噸.命題點2非線性回歸例3某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響,對近8年的年宣傳費Xj和年銷售量y仰=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.620-600-??*5S0-??560-?540-.620-600-??*5S0-??560-?540-.52()-雙-?4S0L77w£(x—x)2i=1'£(w—w)2i=1£(x—x)?i=11y—y)£(w.—w)?i=1(y—y)46.65636.8289.81.61469108.8表中w=\X,w=8丈w.=1(1)根據(jù)散點圖判斷,y=a+bx與y=c+戒哪一個適宜作為年銷售量y關(guān)于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;(3)已知這種產(chǎn)品的年利潤z與x,y的關(guān)系為z=0.2y-x.根據(jù)(2)的結(jié)果回答下列問題:年宣傳費x=49時,年銷售量及年利潤的預測值是多少?②年宣傳費x為何值時,年利潤的預測值最大?附:對于一組數(shù)據(jù)(u,弓),(%,?),???,(〃,v),其回歸直線v=a+&u的斜率和截距的1122nn最小二乘估計分別為切(u.—u)(v.—v)=1一&=,a=v—£(u—u)2=1解(1)由散點圖可以判斷,y=c+d&適宜作為年銷售量y關(guān)于年宣傳費x的回歸方程類型.(2)令w=x,先建立y關(guān)于w的線性回歸方程,由于二(%—w).(y~y),l=1108.8ed===68'方(w—w)2i=1c=y—dw=563—68X6.8=100.6,所以y關(guān)于w的線性回歸方程為y=100.6+68w,因此y關(guān)于x的回歸方程為y=100.6+68&.⑶①由(2)知,當x=49時,年銷售量y的預測值y=100.6+6^49=576.6,年利潤z的預測值[=576.6X0.2—49=66.32.根據(jù)(2)的結(jié)果知,年利潤z的預測值z=0.2(100.6+6^'x)—x=—x+13.6七&+20.12.所以當卜學=6.8,即x=46.24時,z取得最大值.故年宣傳費為46.24千元時,年利潤的預測值最大.思維升華回歸分析問題的類型及解題方法求回歸方程根據(jù)散點圖判斷兩變量是否線性相關(guān),如不是,應通過換元構(gòu)造線性相關(guān)利用公式,求出回歸系數(shù)》.待定系數(shù)法:利用回歸直線過樣本點的中心求系數(shù)Q.利用回歸方程進行預測,把線性回歸方程看作一次函數(shù),求函數(shù)值利用回歸直線判斷正、負相關(guān);決定正相關(guān)還是負相關(guān)的是系數(shù)b.回歸方程的擬合效果,可以利用相關(guān)系數(shù)判斷,當IH越趨近于1時,兩變量的線性相關(guān)性越強.跟蹤訓練2(2018-全國II)下圖是某地區(qū)2000年至2016年環(huán)境基礎設施投資額y(單位:億元)的折線圖.

220209/2402202(H)1B0160144)12010080604()20為了預測該地區(qū)2018年的環(huán)境基礎設施投資額,建立了j與時間變量t的兩個線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,…,17)建立模型①:j=—30.4+13.5t;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,…,7)建立模型②:j=99+17.5t.220209/(1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎設施投資額的預測值;(2)你認為用哪個模型得到的預測值更可靠?并說明理由.解(1)利用模型①,可得該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為j=—30.4+13.5X19=226.1(億元).利用模型②,可得該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為j=99+17.5X9=256.5(億元).(2)利用模型②得到的預測值更可靠.理由如下:(i)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對應的點沒有隨機散布在直線j=—30.4+13.5t上下,這說明利用2000年至2016年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境基礎設施投資額的變化趨勢.2010年相對2009年的環(huán)境基礎設施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對應的點位于一條直線的附近,這說明從2010年開始環(huán)境基礎設施投資額的變化規(guī)律呈線性增長趨勢,利用2010年至2016年的數(shù)據(jù)建立的線性模型j=99+17.5t可以較好地描述2010年以后的環(huán)境基礎設施投資額的變化趨勢,因此利用模型②得到的預測值更可靠.(ii)從計算結(jié)果看,相對于2016年的環(huán)境基礎設施投資額220億元,由模型①得到的預測值226.1億元的增幅明顯偏低,而利用模型②得到的預測值的增幅比較合理,說明利用模型②得到的預測值更可靠.題型三獨立性檢驗*師生共研例4(2017-全國II)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:

設兩種養(yǎng)殖方法的箱產(chǎn)量相互獨立,記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg,新養(yǎng)殖法的箱產(chǎn)量不低于50kg”,估計A的概率;填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān):箱產(chǎn)量<50kg箱產(chǎn)量N50kg舊養(yǎng)殖法新養(yǎng)殖法根據(jù)箱產(chǎn)量的頻率分布直方圖,求新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值(精確到0.01).n(n(adbc)2PSNk)0.0500.0100.001k3.8416.63510.828X(a+b)(c+d)(a+c)(b+d)'解(1)記B表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg”,C表示事件“新養(yǎng)殖法的箱產(chǎn)量不低于50kg”.由題意知,P(A)=P(BC)=P(B)P(C).舊養(yǎng)殖法的箱產(chǎn)量低于50kg的頻率為(0.012+0.014+0.024+0.034+0.040)X5=0.62,故P(B)的估計值為0.62.新養(yǎng)殖法的箱產(chǎn)量不低于50kg的頻率為

(0.068+0.046+0.010+0.008)X5=0.66,故尸(。的估計值為0.66.因此,事件A的概率估計值為0.62X0.66=0.4092.(2)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表如下:箱產(chǎn)量<50kg箱產(chǎn)量N50kg舊養(yǎng)殖法6238新養(yǎng)殖法3466200X(62X66—34X38)2%2=100X100X96X104^15,705,由于15.705>6.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān).(3)因為新養(yǎng)殖法的箱產(chǎn)量頻率分布直方圖中,箱產(chǎn)量低于50kg的直方圖面積為(0.004+0.020+0.044)X5=0.34<0.5,箱產(chǎn)量低于55kg的直方圖面積為(0.004+0.020+0.044+0.068)X5=0.68>0.5,故新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值為,0.5—0.3450+0.068e52.35(kg).思維升華(1)比較幾個分類變量有關(guān)聯(lián)的可能性大小的方法通過計算%2的大小判斷:%2越大,兩變量有關(guān)聯(lián)的可能性越大.通過計算淑一阮I(lǐng)的大小判斷:\ad~bc\越大,兩變量有關(guān)聯(lián)的可能性越大.(2)獨立性檢驗的一般步驟n(ad-bc)①根據(jù)樣本數(shù)據(jù)制成n(ad-bc)②根據(jù)公式%2=(a+b)(a+c)(b+d)(c+d)計算X的值.比較%2與臨界值的大小關(guān)系,做統(tǒng)計推斷.跟蹤訓練3(2018-鄭州檢測)某企業(yè)生產(chǎn)的某種產(chǎn)品被檢測出其中一項質(zhì)量指標存在問題該企業(yè)為了檢查生產(chǎn)該產(chǎn)品的甲、乙兩條流水線的生產(chǎn)情況,隨機地從這兩條流水線上生產(chǎn)的大量產(chǎn)品中各抽取50件產(chǎn)品作為樣本,測出它們的這一項質(zhì)量指標值.若該項質(zhì)量指標值落在[195,210)內(nèi),則為合格品,否則為不合格品甲流水線樣本的頻數(shù)分布表和乙流水線樣本的頻率分布直方圖如下:甲流水線樣本的頻數(shù)分布表質(zhì)量指標值頻數(shù)[190,195)9[195,200)10

[200,205)17[205,210)8[210,215)6乙流水線樣本頻率分布直方圖根據(jù)乙流水線樣本頻率分布直方圖,估計乙流水線生產(chǎn)產(chǎn)品的該項質(zhì)量指標值的中位數(shù);若將頻率視為概率,某個月內(nèi)甲、乙兩條流水線均生產(chǎn)了5000件產(chǎn)品,則甲,乙兩條流水線分別生產(chǎn)出不合格品約多少件?根據(jù)已知條件完成下面2X2列聯(lián)表,并回答是否有85%的把握認為“該企業(yè)生產(chǎn)的這種產(chǎn)品的該項質(zhì)量指標值與甲、乙兩條流水線的選擇有關(guān)”?甲生產(chǎn)線乙生產(chǎn)線總計合格品不合格品總計附:P(xM)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828n(ad—bc)2甘出/(a+b)(c+d)(a+c)(b+d)('、n=a+b+c+d).解(1)設乙流水線生產(chǎn)產(chǎn)品的該項質(zhì)量指標值的中位數(shù)為x,因為(0.012+0.032+0.052)X5=0.48<0.5<(0.012+0.032+0.052+0.076)X5=0.86,則(0.012+0.032+0.052)X5+0.076X(x—205)=0.5,炳/曰_3900解牛得x=19.(2)由甲、乙兩條流水線各抽取的50件產(chǎn)品可得,甲流水線生產(chǎn)的不合格品有15件,153則甲流水線生產(chǎn)的產(chǎn)品為不合格品的概率為P田=10=*;甲501U乙流水線生產(chǎn)的產(chǎn)品為不合格品的概率為P乙=(U.U12+U.U28)X5=|.于是,若某個月內(nèi)甲、乙兩條流水線均生產(chǎn)了5UUU件產(chǎn)品,則甲、乙兩條流水線生產(chǎn)的不31合格品件數(shù)分別為5UUUX^=15UU,5UUUX5=1UUU.(3)2X2列聯(lián)表:甲生產(chǎn)線乙生產(chǎn)線總計合格品354U75不合格品151U25總計5U5U1UU1UUX(35X1U—4UX15)2則X=5UX5UX75X254=3勺.3,..?1.3v2.U72,?..沒有85%的把握認為“該企業(yè)生產(chǎn)的這種產(chǎn)品的該項質(zhì)量指標值與甲、乙兩條流水線的選擇有關(guān)”..核心素養(yǎng)之數(shù)據(jù)分析線性回歸方程及其應用數(shù)據(jù)分析是指針對研究對象獲得相關(guān)數(shù)據(jù),運用統(tǒng)計方法對數(shù)據(jù)中的有用信息進行分析和推斷,形成知識的過程.主要包括:收集數(shù)據(jù)、整理數(shù)據(jù)、提取信息、構(gòu)建模型對信息進行分析、推斷、獲得結(jié)論.例某地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計數(shù)據(jù):年份2UU62UU82U1U2U122U14需求量/萬噸236246257276286利用所給數(shù)據(jù)求年需求量與年份之間的線性回歸方程y=bx+a;利用(1)中所求出的線性回歸方程預測該地2U19年的糧食需求量.解(1)由所給數(shù)據(jù)看出,年需求量與年份之間近似直線上升,下面來求線性回歸方程,先將數(shù)據(jù)處理如下表.年份一2U1U—4—2U24需求一257—21—11U1929

對處理的數(shù)據(jù),容易算得X=0,J=3.2,(—4)2+(—2)2+22+42—5X02(一4)X(—21)+(—2)(—4)2+(—2)2+22+42—5X02迎一6540=6.5a=y—bx=3.2.由上述計算結(jié)果,知所求線性回歸方程為y—257=6.5(x—2010)+3.2,即y=6.5(x—2010)+260.2.(2)利用所求得的線性回歸方程,可預測2019年的糧食需求量大約為6.5X(2019—2010)+260.2=6.5X9+260.2=318.7(萬噸).素養(yǎng)提升例題中利用所給數(shù)據(jù)求回歸方程的過程體現(xiàn)的就是數(shù)據(jù)分析素養(yǎng)課時作業(yè)&基礎保分練已知變量X和y滿足關(guān)系y=—0.1X+1,變量y與z正相關(guān).下列結(jié)論中正確的是()X與y正相關(guān),X與z負相關(guān)X與y正相關(guān),X與z正相關(guān)X與y負相關(guān),X與z負相關(guān)X與y負相關(guān),X與z正相關(guān)答案C解析因為y=—0.1x+1,—0.1<0,所以x與y負相關(guān).又y與z正相關(guān),故可設z=by+a(b>0),所以z=—0.1bx+b+a,—0.1b<0,所以X與z負相關(guān).故選C.下表提供了某工廠節(jié)能降耗技術(shù)改造后,一種產(chǎn)品的產(chǎn)量x(單位:噸)與相應的生產(chǎn)能耗y(單位:噸)的幾組對應數(shù)據(jù):X/噸3456y/噸2.5t44.5根據(jù)上表提供的數(shù)據(jù),求得y關(guān)于x的線性回歸方程為y=0.7x+0.35,那么表格中t的值為()A.3B.3.15C.3.25D.3.5答案A3+4+5+6解析x=4=4.5,

—2.5+」+4+4.511+匕線性回歸方程過樣本點的中心(x,j),所以114+^=0.7X4.5+0.35,解得t=3.3.(2018-江西省百校聯(lián)盟聯(lián)考)下表是我國某城市在2017年1月份至10月份期間各月最低溫度與最高溫度(單位:。C)的數(shù)據(jù)一覽表.月份12345678910最高溫度/C59911172427303121最低溫度/C一12-31-271719232510已知該城市的各月最低溫與最高溫具有相關(guān)關(guān)系,根據(jù)該一覽表,則下列結(jié)論錯誤的是()最低溫度與最高溫度為正相關(guān)每月最高溫度與最低溫度的平均值在前8個月逐月增加月溫差(最高溫度減最低溫度)的最大值出現(xiàn)在1月1月至4月的月溫差(最高溫度減最低溫度)相對于7月至10月,波動性更大答案B解析將最高溫度、最低溫度、溫差列表如下:月份12345678910最高溫度/C59911172427303121最低溫度/C一12-31-271719232510溫差度/C171281310787611由表格可知,最低溫度大致隨最高溫度的升高而升高,A正確;每月最高溫度與最低溫度的平均值在前8個月不是逐月增加,B錯誤;月溫差的最大值出現(xiàn)在1月,C正確;1月至4月的月溫差相對于7月至10月,波動性更大,D正確.1AA.16c1C.44.對具有線性相關(guān)關(guān)系的變量x,j有一組觀測數(shù)據(jù)(號W(i=1,2,???,8),其線性回歸方程是j=x+a,且X]+x2+x3x8=2(j]+j2+j3J8)=6,則實數(shù)a的值是1AA.16c1C.41

D.2答案B

解析依題意可知樣本點的中心為(4,D,一,3131則6=弓乂+s解得。=石.83485.為了解某社區(qū)居民購買水果和牛奶的年支出費用與購買食品的年支出費用的關(guān)系,隨機調(diào)查了該社區(qū)5戶家庭,得到如下統(tǒng)計數(shù)據(jù)表:購買食品的年支出費用x/萬元2.092.152.502.842.92購買水果和牛奶的年支出費用y/萬元1.251.301.501.701.75根據(jù)上表可得線性回歸方程y=bx+a,其中b=0.59,a=y~bx,據(jù)此估計該社區(qū)一戶購買食品的年支出費用為3.00萬元的家庭購買水果和牛奶的年支出費用為()A.1.795萬元B.2.555萬元C.1.915萬元D.1.945萬元答案A2.09+2.15+2.50+2.84+2.92解析x=5=2.50(萬元),1.25+1.301.25+1.30+1.50+1.70+1.75y==1.50(萬元),又b=0.59,所以a=y—bx=0.025,y=0.59x+0.025,故年支出費用為3.00萬元的家庭購買水果和牛奶的年支出費用約為y=0.59X3.00+0.025=1.795(萬元).6.(2018-江西南城一中、高安中學等九校聯(lián)考)隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機構(gòu)用簡單隨機抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.非一線一線總計愿生452065不愿生132235總計5842100n(ad—bc)2X(a+b)(c+d)(a+c)(b+d),得X2=Q9.616.100X(45X22—20得X2=Q9.616.65X35X58X42參照下表,P(/2^k)0.0500.0100.001k3.8416.63510.828正確的結(jié)論是()在犯錯誤的概率不超過0.1%的前提下,認為“生育意愿與城市級別有關(guān)”在犯錯誤的概率不超過0.1%的前提下,認為“生育意愿與城市級別無關(guān)”有99%以上的把握認為“生育意愿與城市級別有關(guān)”有99%以上的把握認為“生育意愿與城市級別無關(guān)”答案C解析?「%229.616>6.635,...有99%以上的把握認為“生育意愿與城市級別有關(guān)”,故選C.某市居民2010?2014年家庭年平均收入戒單位:萬元)與年平均支出y(單位:萬元)的統(tǒng)計資料如下表所示:年份20102011201220132014收入X11.512.11313.315支出J6.88.89.81012根據(jù)統(tǒng)計資料,居民家庭年平均收入的中位數(shù),家庭年平均收入與年平均支出有相關(guān)關(guān)系.(填“正”或“負”)答案13正解析中位數(shù)是13.由相關(guān)性知識,根據(jù)統(tǒng)計資料可以看出,當年平均收入增多時,年平均支出也增多,因此兩者之間具有正相關(guān)關(guān)系.某公司為確定明年投入某產(chǎn)品的廣告支出,對近5年的年廣告支出m與年銷售額R單位:百萬元)進行了初步統(tǒng)計,得到下列表格中的數(shù)據(jù):年廣告支出m24568年銷售額t3040P5070經(jīng)測算,年廣告支出m與年銷售額t滿足線性回歸方程t=6.5m+17.5,則p=.答案60l——190+p解析由于回歸直線過樣本點的中心,m=5,t=一,代入t=6.5m+17.5,解得p=60.以下四個命題,其中正確的序號.從勻速傳遞的產(chǎn)品生產(chǎn)流水線上,質(zhì)檢員每20分鐘從中抽取一件產(chǎn)品進行某項指標檢測,這樣的抽樣是分層抽樣;兩個隨機變量相關(guān)性越強,則相關(guān)系數(shù)的絕對值越接近于1;在線性回歸方程j=0.2x+12中,當自變量x每增加一個單位時,因變量j平均增加0.2個單位;對分類變量X與y的統(tǒng)計量X來說,X越小,“X與r有關(guān)系”的把握程度越大.答案②③解析①是系統(tǒng)抽樣;對于④,統(tǒng)計量%2越小,說明兩個相關(guān)變量有關(guān)系的把握程度越小.為了判斷高中三年級學生選修文科是否與性別有關(guān),現(xiàn)隨機抽取50名學生,得到如圖所示2X2列聯(lián)表:理科文科總計男131023女72027總計20305050X(13X20-10X7)2已知P(z根據(jù)散點圖選擇合適的回歸模型擬合j與x的關(guān)系(不必說明理由);建立j關(guān)于x的回歸方程,預測第5年的銷售量.參考公式:回歸直線的斜率和截距的最小二乘估計分別為N3.841)e0.05,P(z2N5.024)e0.025.根據(jù)表中數(shù)據(jù),得到%根據(jù)散點圖選擇合適的回歸模型擬合j與x的關(guān)系(不必說明理由);建立j關(guān)于x的回歸方程,預測第5年的銷售量.參考公式:回歸直線的斜率和截距的最小二乘估計分別為答案95%解析由題意,/心命羅^籍筍由湖,因為4.844>3.841,所以有95%的把握認為選修文科與性別有關(guān).某公司為了準確地把握市場,做好產(chǎn)品生產(chǎn)計劃,對過去四年的數(shù)據(jù)進行整理得到了第x年與年銷售量j(單位:萬件)之間的關(guān)系如下表.x1234J12284256在圖中畫出表中數(shù)據(jù)的散點圖;M萬件605040302010..01234x

私(X—X)3—y)Txy—nxyi=1i=1b==私(X.—X)2i=1n^Lx2~nx2ii私(X.—X)2i=1n^Lx2~nx2ii=i解(1)作出的散點圖如圖所示:■W萬件605040302010根據(jù)散點圖可知,可以用線性回歸模型擬合y與x的關(guān)系.觀察(1)中散點圖可知各點大致分布在一條直線附近,列出表格:-t/曰—_5—69可得x=2,y=2,乙xy—4xyi=1所以b=力x2—4x2ii=1569418-4X2X~2=7330—4X(*5iXiyiX2iXN1112112222845633429126445616224E1013830418a=§-b飛=69-蕓2=一2,,,?73將x=5代入所求線性回歸萬程,得y=~5X5—2=71.故預測第5年的銷售量為71萬件.

12.某省會城市地鐵將于2019年6月開始運營,為此召開了一個價格聽證會,擬定價格后又進行了一次調(diào)查,隨機抽查了50人,他們的收入與態(tài)度如下:月收入(單位:百元)[15,25)[25,35)[35,45)[45,55)[55,65)[65,75)贊成定價者人數(shù)123534認為價格偏高者人數(shù)4812521(1)若以區(qū)間的中點值為該區(qū)間內(nèi)的人均月收入,求參與調(diào)查的人員中“贊成定價者”與“認為價格偏高者”的月平均收入的差異是多少(結(jié)果保留2位小數(shù));(2)由以上統(tǒng)計數(shù)據(jù)填下面2X2列聯(lián)表,分析是否有99%的把握認為“月收入以55百元為分界點對地鐵定價的態(tài)度有差異”.月收入不低于55百元的人數(shù)月收入低于55百元的人數(shù)總計認為價格偏高者贊成定價者總計n(ad—bc)2、.:(a+b)(c+d)(a+c)(b+d)'&冰)0.050.01k3.8416.635解(1)“贊成定價者"的月平均收入為20X1+30X2+40X3+50X5+60X3+70X4%=1+2+3+5+3+4Q50.56.“認為價格偏高者"的月平均收入為20X4+30X8+40X12+50X5+60X2+70X1%=4+8+12+5+2+1=38.75,?.?“贊成定價者”與“認為價格偏高者”的月平均收入的差距是%一%=50.56-38.75=11.81(百元).(2)根據(jù)條件可得2X2列聯(lián)表如下:

月收入不低于55百元的人數(shù)月收入低于55百元的人數(shù)總計認為價格偏高者32932贊成定價者71118總計104050Q6.272<6.635,50X(3X11—7X29)2x2x10X40X18X32?..沒有99%的把握認為“月收入以55Q6.272<6.635,&技能提升練13.(2018-西安模擬)中央政府為了應對因人口老齡化而造成的勞動力短缺問題,擬定出臺“延遲退休年齡政策”.為了了解人們對“延遲退休年齡政策”的態(tài)度,責成人社部進行調(diào)研.人社部從網(wǎng)上年齡在15?65的人群中隨機調(diào)查100人,調(diào)查數(shù)據(jù)的頻率分布直方圖和支持“延遲退休”的人數(shù)與年齡的統(tǒng)計結(jié)果如下:年齡[15,25)[25,35)[35,45)[45,55)[55,65)支持“延遲退休”的人數(shù)155152817(1)由以上統(tǒng)計數(shù)據(jù)填寫2X2列聯(lián)表,并判斷是否有95%的把握認為以45歲為分界點的不同人群對“延遲退休年齡政策”的支持度有差異;45歲以下45歲及45歲以上總計支持不支持總計(2)若以45歲為分界點,從不支持“延遲退休年齡政策”的人中按分層抽樣的方法抽取8人參加某項活動.現(xiàn)從這8人中隨機抽2人,求至少有1人是45歲及45歲以上的概率.參考數(shù)據(jù):P(/2^k)0.1000.0500.0100.001k2.7063.8416.63510.828

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論