2019年數(shù)學(xué)新同步湘教版選修3講義+精練85一元線性回歸案例版含解析_第1頁(yè)
2019年數(shù)學(xué)新同步湘教版選修3講義+精練85一元線性回歸案例版含解析_第2頁(yè)
2019年數(shù)學(xué)新同步湘教版選修3講義+精練85一元線性回歸案例版含解析_第3頁(yè)
2019年數(shù)學(xué)新同步湘教版選修3講義+精練85一元線性回歸案例版含解析_第4頁(yè)
2019年數(shù)學(xué)新同步湘教版選修3講義+精練85一元線性回歸案例版含解析_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽象問(wèn)題tft競(jìng)比*新知無(wú)師自通[讀教材填要點(diǎn)]相關(guān)系數(shù)⑴定義:樣本容量是n的成對(duì)觀測(cè)數(shù)據(jù),用(X1,yi),(X2,y2),…,(xn,yn)表示,用{xi}表示數(shù)據(jù)Xi,X2,…,xn,用{yi}表示數(shù)據(jù)yi,y2,…,yn,用x與y分別表示{xi}和{yi}的均值,用Sx表示{xi}的標(biāo)準(zhǔn)差,用s表示{yi}的標(biāo)準(zhǔn)差,再引入:Sxy=xiyi+x2y+?+xnyn_-亍n當(dāng)rxy>0時(shí),我們稱{Xi}和{yi}正相關(guān);當(dāng)rxy<0時(shí),我們稱{xi}和{yi}負(fù)相關(guān);當(dāng)「xy=0時(shí),我們稱{xi}和{yi}不相關(guān).⑵性質(zhì):rxy總在區(qū)間[—1,1]中取值;當(dāng)rxy越接近于1時(shí),X,y的線性相關(guān)程度越強(qiáng),且 x增加,y也傾向于增虬這時(shí)數(shù)據(jù)(X1,y1),(X2,y2),…,(Xn,yn)分散在一條上升的直線附近.當(dāng)rxy越接近于一1時(shí),X,y的線性相關(guān)程度越強(qiáng),且 x增加,y傾向于減少,這時(shí)數(shù)據(jù)(X1,y1),(X2,y2),…,(Xn,yn)分散在一條下降的直線附近.當(dāng)rxy越接近于0時(shí),X,y的線性相關(guān)程度越弱.一元線性回歸A C^y回歸直線方程:I:y=bx+a,其中b=&,a=y—bx.—元線性回歸模型:若樣本量n的成對(duì)觀測(cè)數(shù)據(jù)(xi, yi), (x2, y2),…,(xn, yn)中y和xi滿足關(guān)系:yi=bxi+a+ei(i =1,2,…,n,),其中ei,e2,…,en表示隨機(jī)誤差,則稱該模型為一元線性回歸模型.[小問(wèn)題大思維]|rxy|越接近1,及越接近于0,表示兩個(gè)變量x與y之間線性相關(guān)程度如何?提示:l「xy|越接近1,表明兩個(gè)變量的線性相關(guān)程度越強(qiáng),它們的散點(diǎn)圖越接近于一條直線,這時(shí)用線性回歸模型擬合這組數(shù)據(jù)的效果就越好; |rxy|越接近0,表明兩個(gè)變量的線性相關(guān)程度越弱,通常|rxy|>0.8時(shí),認(rèn)為有很強(qiáng)的相關(guān)關(guān)系.在一元線性回歸模型中,變量 y由變量x唯一確定嗎?提示:不唯一.y值由x和隨機(jī)誤差e共同確定,即自變量x只能解釋部分y的變化.3?隨機(jī)誤差e產(chǎn)生的主要原因有哪些?提示:隨機(jī)誤差e產(chǎn)生的主要原因有:(1)所用的確定性函數(shù)不恰當(dāng)引起的誤差;⑵忽略了某些因素的影響;存在觀測(cè)誤差.4?回歸分析中,利用線性回歸方程求出的函數(shù)值一定是真實(shí)值嗎?為什么?提示:不一定是真實(shí)值?利用線性回歸方程求的值,在很多時(shí)候是個(gè)預(yù)報(bào)值,例如,人的體重與身高存在一定的線性關(guān)系, 但體重除了受身高的影響外, 還受其他因素的影響,如飲食,是否喜歡運(yùn)動(dòng)等.學(xué)生學(xué)科ABCDE數(shù)學(xué)成績(jī)(x)8876736663物理成績(jī)(y)7865716461(1)畫(huà)出散點(diǎn)圖;(2)求物理成績(jī)y對(duì)數(shù)學(xué)成績(jī)x的線性回歸方程;⑶一名學(xué)生的數(shù)學(xué)成績(jī)是96,試預(yù)測(cè)他的物理成績(jī).[解]⑴散點(diǎn)圖如圖.(2)7=1X(88+76+73+66+63)=73.2,5y= (78+65+71+64+61)=67.8.55Xiyi=88X78+76X65+73X71+66X64+63X61i=1=25054.5x2=882+762+732+662+632=27174.i=15 xiyi—5xyi=1所以b= 5 —22Xi—5xi=125054—5X73.2X67.827174—5X73.22?0.625.a=y—bx~67.8—0.625X73.2=22.05.所以y對(duì)x的回歸直線方程是y=22.05+0.625x.(3)x=96,則y=0.625X96+22.05~82,即可以預(yù)測(cè)他的物理成績(jī)是 82.回歸直線方程中系數(shù)的兩種求法(1)公式法:利用公式,求出回歸系數(shù)b,a.回歸分析的兩種策略(1)利用回歸方程進(jìn)行預(yù)測(cè):把回歸直線方程看作一次函數(shù),求函數(shù)值.(2)利用回歸直線判斷正、負(fù)相關(guān):決定正相關(guān)還是負(fù)相關(guān)的是回歸系數(shù) b.)與月儲(chǔ)蓄1?從某居民區(qū)隨機(jī)抽取10個(gè)家庭,獲得第i個(gè)家庭的月收入xi()與月儲(chǔ)蓄10101010101010102xf=720.yi(單位:千元)的數(shù)據(jù)資料,算得xi=80, yi=20,xiyi=184,i=1 i=1 i=1求家庭的月儲(chǔ)蓄y對(duì)月收入x的線性回歸方程y=bx+a;判斷變量x與y之間是正相關(guān)還是負(fù)相關(guān);若該居民區(qū)某家庭月收入為 7千元,預(yù)測(cè)該家庭的月儲(chǔ)蓄.附:線性回歸方程nXiyi—nxyi=1 — — —y=bx+a中,b= ,a=y—bx,其中xn2 —2xi—nxi=1,亍為樣本平均值.解:(1)由題意知n=10,x=nxi= 8,i=1—1n20oy=nyi=局=2.i=1n又x2—n—x2=720—10X82=80,i=1xiyi—nxi=1y=184—10X8X2=24,24802480=0.3,由此可得b=

nxiyi—nxyi=1a=y—bx=2—0.3x8=—0.4,故所求回歸方程為 y=0.3x—0.4.(2)由于變量y的值隨x的值增加而增加(b=0.3>0),故x與y之間是正相關(guān).⑶將x=7代入回歸方程可以預(yù)測(cè)該家庭的月儲(chǔ)蓄為 y=0.3x7—0.4=1.7(千元).相關(guān)系數(shù)[例2]關(guān)于兩個(gè)變量x和y的7組數(shù)據(jù)如下表所示:x21232527293235y711212466115325試判斷x與y之間是否有線性相關(guān)關(guān)系.—1[解]x=7X(21+23+25+27+29+32+35)~27.4,―1y=7X(7+11+21+24+66+115+325)?81.3,7x2=212+232+252+272+292+322+352=5414,i=17Xiyi=21x7+23x11+25X21+27X24+29x66+32x115+35x325=18542,i=17y2=72+112+212+242+662+1152+3252=124393,i=17 ——xiyi—7xyi=1r=77Ax2—7x2y2—7y2\i=1i=118542—7x27.4x81.3■^5414—7x27.42x124393—7x81.32?0.8375.由于r疋0.8375與1比較接近,「X與y具有線性相關(guān)關(guān)系.規(guī)圖]S&

回歸分析是定義在具有相關(guān)關(guān)系的兩個(gè)變量的基礎(chǔ)上的,對(duì)于相關(guān)關(guān)系不明確的兩個(gè)變量,可先作散點(diǎn)圖,由圖粗略的分析它們是否具有相關(guān)關(guān)系,在此基礎(chǔ)上,求其回歸方程,并作回歸分析.x(單位:百萬(wàn)元)與銷售額y(單位:百萬(wàn)元)之間有如下的對(duì)應(yīng)Ix(單位:百萬(wàn)元)與銷售額y(單位:百萬(wàn)元)之間有如下的對(duì)應(yīng)2?某廠的生產(chǎn)原料耗費(fèi)關(guān)系:x2468y30405070判斷x與y之間是否存在線性相關(guān)關(guān)系.r70■LbO?■30■2 4 6 8*解:畫(huà)出(x,y)的散點(diǎn)圖,如圖所示,由圖可知 x,y呈現(xiàn)線性相關(guān)關(guān)系._ _ 4x=5,y=47.5, x2=120,i=14y4y2=9900,xiyi=1080,i=11080—4X5X47.5■^120—4X529900—4X47.52?0.9827.故x與y之間存在線性相關(guān)關(guān)系.可線性化的回歸分析問(wèn)題[例3]為了研究某種細(xì)菌隨時(shí)間x變化繁殖個(gè)數(shù)y的變化,收集數(shù)據(jù)如下:時(shí)間x/天123456

繁殖個(gè)數(shù)y612254995190作出這些數(shù)據(jù)的散點(diǎn)圖;⑵求y與x之間的回歸方程.[解] ⑴散點(diǎn)圖如圖所示:兼殖個(gè)數(shù)2001801&0140-1ZD-100+冊(cè)-6040*20*> 2 .下列說(shuō)法中正確的是( .下列說(shuō)法中正確的是( )A.y=2x2+1中的x,y是具有相關(guān)關(guān)系的兩個(gè)變量B.正四面體的體積與其棱長(zhǎng)具有相關(guān)關(guān)系C.電腦的銷售量與電腦的價(jià)格之間是一種確定性的關(guān)系Iny,則⑵由散點(diǎn)圖看出樣本點(diǎn)分布在一條指數(shù)函數(shù) y=cieC2X圖像的周圍,于是令zIny,則x123456z1.792.483.223.894.555.25由計(jì)算器算得z=0.69x+1.112,則有y=e°.69x+“12.現(xiàn)因議跖非線性回歸問(wèn)題一般不給出經(jīng)驗(yàn)公式,這時(shí),應(yīng)先畫(huà)出已知數(shù)據(jù)的散點(diǎn)圖,把它與所學(xué)過(guò)的各種函數(shù)圖像作比較,挑選一種跟這些散點(diǎn)圖擬合得最好的函數(shù),采用適當(dāng)?shù)淖兞恐脫Q,把問(wèn)題化為線性回歸分析問(wèn)題,使問(wèn)題得以解決.3?在一次抽樣調(diào)查中測(cè)得樣本的 5個(gè)樣本點(diǎn),數(shù)值如下表:x0.250.5124y1612521試建立y與x之間的回歸方程.解:由數(shù)值表可作散點(diǎn)圖如下根據(jù)散點(diǎn)圖可知y與x近似地呈反比例函數(shù)關(guān)系,k 1設(shè)y=x,令t=1,則y=kt,原數(shù)據(jù)變?yōu)?/p>

t4210.50.25y1612521由置換后的數(shù)值表作散點(diǎn)圖如下:141210K42■*■Oi2i1j由散點(diǎn)圖可以看出y與t呈近似的線性相關(guān)關(guān)系?列表如下itiWtiyit2y2141664162562212244144315512540.5210.25450.2510.250.06251刀7.753694.2521.3125430所以T=1.55,y=725 tiyi—5tyi=1所以b= =4.1344.5 —t2—5—1DD.傳染病醫(yī)院感染甲型H1N1流感的醫(yī)務(wù)人員數(shù)與醫(yī)院收治的甲型流感人數(shù)是具有相關(guān)關(guān)系的兩個(gè)變量i=1a=y—bt=0.8.所以y=0.8+4.1344t.41344所以y對(duì)x的回歸方程是y=0.8+玉134^陡堂統(tǒng)習(xí)常態(tài)比*當(dāng)堂崔化所學(xué)陡堂統(tǒng)習(xí)常態(tài)比*當(dāng)堂崔化所學(xué)解析:選D感染的醫(yī)務(wù)人員不僅受醫(yī)院收治的病人數(shù)的影響,還受防護(hù)措施等其它因素的影響.設(shè)(X1,yi),(x2,y2),…,(xn,yn)是變量x和y的n個(gè)樣本點(diǎn),直線I是由這些樣本點(diǎn)通過(guò)最小二乘法得到的線性回歸直線 (如圖),以下結(jié)論中正確的是( )x和y的相關(guān)系數(shù)在0至U1之間C?當(dāng)n為偶數(shù)時(shí),分布在I兩側(cè)的樣本點(diǎn)的個(gè)數(shù)一定相同D.直線I過(guò)點(diǎn)(匚,y)解析:選D回歸直線過(guò)樣本中心點(diǎn)(y,y).為了解兒子身高與其父親身高的關(guān)系,隨機(jī)抽取 5對(duì)父子的身高數(shù)據(jù)如下:父親身高x(cm)174176176176178兒子身高y(cm)175175176177177TOC\o"1-5"\h\z則y對(duì)x的線性回歸方程為( )A Ay=x—1 B.y=x+1A 1 Ay=88+2xD.y=176解析:選C設(shè)y對(duì)x的線性回歸方程為y=bx+a,因?yàn)閎=sxy=?,1a=176—2X176=88,A1所以y對(duì)x的線性回歸方程為y=2x+88.在關(guān)于兩個(gè)變量的回歸分析中,作散點(diǎn)圖的目的是 .答案:觀察兩個(gè)變量之間是否存在線性相關(guān)關(guān)系某服裝廠的產(chǎn)品產(chǎn)量x(萬(wàn)件)與單位成本y(元/件)之間的回歸直線方程是y=52.15—19.5x,當(dāng)產(chǎn)量每增加一萬(wàn)件時(shí),單位成本下降 元.解析:由回歸系數(shù)的意義得下降 19.5元.答案:19.56?在一段時(shí)間內(nèi),分5次測(cè)得某種商品的價(jià)格 x(萬(wàn)元)和需求量y(t)之間的一組數(shù)據(jù)為:12345價(jià)格x1.41.61.822.2需求量y1210753已知Xiyi=62,i=1x2=16.6.i已知Xiyi=62,i=1x2=16.6.i=1(1) 畫(huà)出散點(diǎn)圖;(2) 求出y對(duì)x的回歸方程;⑶如價(jià)格定為1.9萬(wàn)元,預(yù)測(cè)需求量大約是多少? (精確到0.01t).解:(1)散點(diǎn)圖如下圖所示:11因?yàn)閤=5X9=1.8,y=5X37=7.4,xiyi=62,i=1x2=16.6,Sxy=xiyii=1xy=12.4-13.32=—0.92.—0.92=—11.5,a=y—bx=7.4+11.5X1.8=28.1,故y對(duì)x的回歸方程為y=28.1—11.5x.y=28.1—11.5X1.9=6.25(t).課下訓(xùn)第經(jīng)典比.貴在觸類童通1?下表是x與y之間的一組數(shù)據(jù),則 y關(guān)于x的線性回歸方程必過(guò)( )x0123y1357解析:選Dx0解析:選Dx0+1+2+346=1.5,1+3+5+74???線性回歸方程必過(guò)點(diǎn)(1.5,4).2.已知變量x和y滿足關(guān)系y=-0.1x+1,變量y與z正相關(guān).下列結(jié)論中正確的是( )A.x與y正相關(guān),x與z負(fù)相關(guān)x與y正相關(guān),x與z正相關(guān)x與y負(fù)相關(guān),x與z負(fù)相關(guān)x與y負(fù)相關(guān),x與z正相關(guān)解析:選C因?yàn)閥=—0.1x+1的斜率小于0,故x與y負(fù)相關(guān)?因?yàn)閥與z正相關(guān),TOC\o"1-5"\h\zA A A可設(shè)z=by+a,b>0,A A A A A則z=by+a=—0.1bx+b+a,故x與z負(fù)相關(guān).3?某醫(yī)學(xué)科研所對(duì)人體脂肪含量與年齡這兩個(gè)變量研究得到一組隨機(jī)樣本數(shù)據(jù),運(yùn)用Excel軟件計(jì)算得y=0.577x—0.448(x為人的年齡,y為人體脂肪含量)?對(duì)年齡為37歲的人來(lái)說(shuō),下面說(shuō)法正確的是( )A.年齡為37歲的人體內(nèi)脂肪含量都為20.90%B.年齡為37歲的人體內(nèi)脂肪含量為 21.01%C.年齡為37歲的人群中的大部分人的體內(nèi)脂肪含量為 20.90%D.年齡為37歲的大部分的人體內(nèi)脂肪含量為 31.5%解析:選C當(dāng)x=37時(shí),y=0.577X37—0.448=20.901?20.90,由此估計(jì):年齡為37歲的人群中的大部分人的體內(nèi)脂肪含量為 20.90%.某產(chǎn)品的廣告費(fèi)用 x與銷售額y的統(tǒng)計(jì)數(shù)據(jù)如下表:廣告費(fèi)用x(萬(wàn)兀)4235銷售額y(萬(wàn)兀)49263954根據(jù)上表可得回歸方程 =bx+a中的b為9.4,據(jù)此模型預(yù)報(bào)廣告費(fèi)用為 6萬(wàn)元時(shí)銷售額為( )B.65.5萬(wàn)元DB.65.5萬(wàn)元D.72.0萬(wàn)元C.67.7萬(wàn)元解析:選B樣本中心點(diǎn)是(3.5,42),貝Ua=y—bx=42-9.4X3.5=9.1,所以回歸直線方程是y=9.4x+9.1,把x=6代入得y=65.5.二、填空題調(diào)查了某地若干戶家庭的年收入 x(單位:萬(wàn)元)和年飲食支出y(單位:萬(wàn)元),調(diào)查顯示年收入x與年飲食支出y具有線性相關(guān)關(guān)系,并由調(diào)查數(shù)據(jù)得到y(tǒng)對(duì)x的回歸直線方程:y=0.254X+0.321?由回歸直線方程可知,家庭年收入每增加 1萬(wàn)元,年飲食支出平均增加 萬(wàn)元.解析:以x+1代x,得y=0.254(x+1)+0.321,與y=0.254x+0.321相減可得,年飲食支出平均增加0.254萬(wàn)元.答案:0.2546?下表是某廠1?4月份用水量(單位:百噸)的一組數(shù)據(jù),?'a=3.5+0.7X2.5=5.25.答案:5.251.23.樣本點(diǎn)的中心為(4,5)1.23.樣本點(diǎn)的中心為(4,5),則回歸直線方程是(4,5),可得y—(4,5),可得y—5=1.23(x—4),即y=1.23x+0.08.答案:y=1.23x+0.08&在研究硝酸鈉的可溶性程度時(shí),觀察它在不同溫度的水中的溶解度,得觀測(cè)結(jié)果如下:溫度(x)010205070溶解度(y)66.776.085.0112.3128.0由此,得到回歸直線的斜率是

n占Xiyi sx解析:根據(jù)sxy=n——xy,及b=s,得b=0.8809.答案:0.8809三、解答題在關(guān)于人體的脂肪含量(百分比)和年齡關(guān)系研究中,研究人員獲得了如下一組數(shù)據(jù):年齡x2226384145485053545657脂肪含量y9.417.821.224.926.527.128.229.430.231.432.6畫(huà)出散點(diǎn)圖;求y與x之間的回歸方程;預(yù)測(cè)39歲的人脂肪含量.(保留四位有效數(shù)字)解:(1)畫(huà)出散點(diǎn)圖⑵由散點(diǎn)圖可以看出44.5455,_iii 11y=1yi~25.3364, xiyi=13205,i=1 i=111x2=23224,zb=營(yíng)~0.5657,a=y—bx~0.1370

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論