回歸分析的基本知識點(diǎn)及習(xí)題_第1頁
回歸分析的基本知識點(diǎn)及習(xí)題_第2頁
回歸分析的基本知識點(diǎn)及習(xí)題_第3頁
回歸分析的基本知識點(diǎn)及習(xí)題_第4頁
回歸分析的基本知識點(diǎn)及習(xí)題_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、回歸分析的基本知識點(diǎn)及習(xí)題本周難點(diǎn):(1)求回歸直線方程,會用所學(xué)的知識對實(shí)際問題進(jìn)行回歸分析(2)掌握回歸分析的實(shí)際價值與基本思想(3)能運(yùn)用自己所學(xué)的知識對具體案例進(jìn)行檢驗(yàn)與說明(4)殘差變量的解釋;(5)偏差平方和分解的思想;1 .回歸直線:如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,我們就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫作回歸直線。求回歸直線方程的一般步驟:作出散點(diǎn)圖(由樣本點(diǎn)是否呈條狀分布來判斷兩個量是否具有線性相關(guān)關(guān)系),若存在線性相關(guān)關(guān)系-求回歸系數(shù)-寫出回歸直線方程,并利用回歸直線方程進(jìn)行預(yù)測說明.2 .回歸分析:對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種常用

2、方法。建立回歸模型的基本步驟是:確定研究對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量;畫好確定好的解釋變量和預(yù)報變量的散點(diǎn)圖,觀察它們之間的關(guān)系(線性關(guān)系)由經(jīng)驗(yàn)確定回歸方程的類型.按一定規(guī)則估計回歸方程中的參數(shù)(最小二乘法);得出結(jié)論后在分析殘差圖是否異常,若存在異常,則檢驗(yàn)數(shù)據(jù)是否有誤,后模型是否合適等4.殘差變量它的主要來源:(1)用線性回歸模型近似真實(shí)模型(真實(shí)模型是客觀存在的,通常我們并不知道真實(shí)模型到底是什么)所引起的誤差。可能存在非線性的函數(shù)能夠更好地描述T與矛之間的關(guān)系,但是現(xiàn)在卻用線性函數(shù)來表述這種關(guān)系,結(jié)果就會產(chǎn)生誤差。這種由于模型近似所引起的誤差包含在白中(2)忽略了

3、某些因素的影響。影響變量少的因素不只變量近一個,可能還包含其他許多因素(例如在描述身高和體重關(guān)系的模型中,體重不僅受身高的影響,還會受遺傳基因、飲食習(xí)慣、生長環(huán)境等其他因素的影響),但通常它們每一個因素的影響可能都是比較小的,它們的影響都體現(xiàn)在日中。(3)觀測誤差。由于測量工具等原因,得到的少的觀測值一般是有誤差的(比如一個人的體重是確定的數(shù),不同的秤可能會得到不同的觀測值,它們與真實(shí)值之間存在誤差),這樣的誤差也包含在上面三項(xiàng)誤差越小,說明我們的回歸模型的擬合效果越好。二、例題選講1為研究某市家庭平均收入與月平均生活支出的關(guān)系,該市統(tǒng)計部門隨機(jī)調(diào)查了書中。家庭編號12345678910Xi(

4、收入)千元0.81.11.31.51.51.82.02.22.42.8V、(支出)千元0.71.01.21.01.31.51.31.72.02.510個家庭,得數(shù)據(jù)如下:判斷家庭平均收入與月平均生活支出是否相關(guān)?若二者線性相關(guān),求回歸直線方程.(1)作出散點(diǎn)圖:(1)(2)解貝立業(yè)11rH2JC03F223i*平出收元觀察發(fā)現(xiàn)各個數(shù)據(jù)對應(yīng)的點(diǎn)都在一條直線附近,所以二者呈線性相關(guān)關(guān)系,一、1_(2)x=(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,101,_、一y=_(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)

5、=1.42,10n“xiyi-nx"1?=!=0.8136,?=1.42-1.74X0.81360.0043,:回歸方程y?=0.8136x+0.0043.Xi2_nx2i12下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸)標(biāo)準(zhǔn)煤的幾組對照數(shù)據(jù).(1)請畫出上表數(shù)據(jù)的散點(diǎn)圖;x3456y2.5344.5(2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程?=?x+a?;(3)已知該廠技改前100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標(biāo)準(zhǔn)煤.試根據(jù)(2)求出的線性回歸方程,預(yù)測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標(biāo)準(zhǔn)煤?解(1)散點(diǎn)

6、圖如下圖:-3456/口-2.5344.5Q口(2)x=4.5,y=3.54444Vxiyi=3X2.5+4X3+4X5+6X4.5=66.5.工x2=32+42+52+62=86i1i14xiyi-4x*y.4=66.5-43.54.5=07U42.42286-44.52、xi-4xi生a?=y-?x=3.5-0.7X4.5=0.35.;所求的線性回歸方程為?=0.7x+0.35.(3)現(xiàn)在生產(chǎn)100噸甲產(chǎn)品用煤y=0.7X100+0.35=70.35,;降低90-70.35=19.65(噸)標(biāo)準(zhǔn)煤.3科研人員為了全面掌握棉花新品種的生產(chǎn)情況,查看了氣象局對該地區(qū)年降雨量與年平均氣溫的統(tǒng)計數(shù)

7、據(jù)(單位分別是計.mm,C),并作了統(tǒng)年平均氣溫12.5112.8412.8413.6913.3312.7413.05年降雨量748542507813574701432(1)試畫出散點(diǎn)圖;(2)判斷兩個變量是否具有相關(guān)關(guān)系解(1)作出散點(diǎn)圖如圖所示,MH!洲由MWMm1*I1八,1153中F百二*t(2)由散點(diǎn)圖可知,各點(diǎn)并不在一條直線附近,所以兩個變量是非線性相關(guān)關(guān)系.4在研究硝酸鈉的可溶性程度時,對于不同的溫度觀測它在水中的溶解度,得觀測結(jié)果如下:溫度(x)010205070溶解度(y)66.776.085.0112.3128.0由資料看y與x呈線性相關(guān),試求回歸方程.66.776.085

8、.0112.3128.0解x=30,y=93.6.55、Xiyi-5X*y?=烏=0.8809.?=y-b?X=93.6-0.8809X30=67.173.5Xi2_5X2i4;回歸方程為?=0.8809x+67.173.5.某企業(yè)上半年產(chǎn)品產(chǎn)量與單位成本資料如下:月份產(chǎn)量(千件)單位成本(元)127323723471437354696568(1)求出線性回歸方程;(2)指出產(chǎn)量每增加1000件時,單位成本平均變動多少?(3)假定產(chǎn)量為6000件時,單位成本為多少元?66y=71,9.x2=79,Xiyi=1481,i1i166解(1)n=6,XLXi=21,工yi=426,X=3.5,i1i

9、161481-63.571_=-1.82.一_279-63.52:Xiyi-6X*y?=36x2-6X2i1,?=y-|?X=71+1.82X3.5=77.37.回歸方程為?=a?+?x=77.37-1.82x.(2)因?yàn)閱挝怀杀酒骄儎樱?-1.82<0,且產(chǎn)量x的計量單位是千件,所以根據(jù)回歸系數(shù)b的意義有:產(chǎn)量每增加一個單位即1000件時,單位成本平均減少1.82元.(3)當(dāng)產(chǎn)量為6000件時,即x=6,代入回歸方程:7=77.37-1.82X6=66.45(元)當(dāng)產(chǎn)量為6000件時,單位成本為66.45元.1 .觀察下列散點(diǎn)圖,則正相關(guān);負(fù)相關(guān);不相關(guān).它們的排列順序與圖形對應(yīng)順序

10、是.答案a,c,b2 .回歸方程?=1.5x-15,則下列說法正確的有個.y=1.5x-1515是回歸系數(shù)a1.5是回歸系數(shù)ax=10時,y=0答案13 .(2009.湛江模擬)某地區(qū)調(diào)查了29歲兒童的身高,由此建立的身高y(cm)與年齡x(歲)的回歸模型為y?=8.25x+60.13,下列敘述正確的是.該地區(qū)一個10歲兒童的身高為142.63cm該地區(qū)29歲的兒童每年身高約增加8.25cm該地區(qū)9歲兒童的平均身高是134.38cm利用這個模型可以準(zhǔn)確地預(yù)算該地區(qū)每個29歲兒童的身高答案4 .某人對一地區(qū)人均工資x(千元)與該地區(qū)人均消費(fèi)y(千元)進(jìn)行統(tǒng)計調(diào)查,y與x有相關(guān)關(guān)系,得到回歸直線方

11、程7=0.66x+1.562.若該地區(qū)的人均消費(fèi)水平為7.675千元,估計該地區(qū)的人均消費(fèi)額占人均工資收入的百分比約為.答案83%885.某化工廠為預(yù)測產(chǎn)品的回收率y,需要研究它和原料有效成分含量x之間的相關(guān)關(guān)系,現(xiàn)取8對觀測值,計算,得£xi=52,£yi=228,yid88£xi2=478,Zxiyi=1849,則其線性回歸方程為i1i1答案?=11.47+2.62x6 .有下列關(guān)系:人的年齡與他(她)擁有的財富之間的關(guān)系;曲線上的點(diǎn)與該點(diǎn)的坐標(biāo)之間的關(guān)系;蘋果的產(chǎn)量與氣候之間的關(guān)系;森林中的同一種樹木,其斷面直徑與高度之間的關(guān)系.其中,具有相關(guān)關(guān)系的是.答案

12、7 .已知關(guān)于某設(shè)備的使用年限x與所支出的維修費(fèi)用y(萬元),有如下統(tǒng)計資料:使用年限x23456維修費(fèi)用y2.23.85.56.57.0若y對x呈線性相關(guān)關(guān)系,則回歸直線方程y>=t?x+a>表示的直線一定過定點(diǎn).答案(4,5)二、解答題8 .期中考試結(jié)束后,記錄了5名同學(xué)的數(shù)學(xué)和物理成績,如下表:、一-學(xué)生學(xué)科J-、ABCDE數(shù)學(xué)8075706560物理7066686462(1)數(shù)學(xué)成績和物理成績具有相關(guān)關(guān)系嗎?(2)請你畫出兩科成績的散點(diǎn)圖,結(jié)合散點(diǎn)圖,認(rèn)識(1)的結(jié)論的特點(diǎn)解(1)數(shù)學(xué)成績和物理成績具有相關(guān)關(guān)系.(2)以x軸表示數(shù)學(xué)成績,y軸表示物理成績,可得相應(yīng)的散點(diǎn)圖如

13、下:'*號Eli噫axim由散點(diǎn)圖可以看出,物理成績和數(shù)學(xué)成績對應(yīng)的點(diǎn)不分散,大致分布在一條直線附近9.以下是某地搜集到的新房屋的銷售價格y和房屋的面積x的數(shù)據(jù):房屋面積x(m2)11511080135105銷售價格y(萬元)24.821.618.429.222(1)畫出數(shù)據(jù)對應(yīng)的散點(diǎn)圖;(2)求線性回歸方程,并在散點(diǎn)圖中加上回歸直線解(1)數(shù)據(jù)對應(yīng)的散點(diǎn)圖如圖所示:訕在做*142?n驪ino13。15n<5、Xiyi-5X兩?=2-0.19625工-Xi2_5X2i455(2)x=109,y=23.2,、x2=60975,為yi=12952,i1i4a?=y-bX=1.8142

14、?=0.1962x+1.8142.10.某公司利潤y與銷售總額x(單位:千萬元)之間有如下對應(yīng)數(shù)據(jù):X10151720252832y11.31.822.62.73.3(1)畫出散點(diǎn)圖;(2)求回歸直線方程;(3)估計銷售總額為24千萬元時的利潤.解(1)散點(diǎn)圖如圖所示:劇得了1*K|,一14一一一一一一一(2)X=1(10+15+17+20+25+28+32)=21,77廠夫+1.8®2,2.7,'Xi'd+Hm20*5%28%3*3447,i17£Xiyi=10X1+15X1.3+17*1.8+20X2+25X2.6+28*2.7+32義3.3=346.3

15、,1 17.二Xiyi-7x*y?y346.3-7212.1?=-i=0.104,7993447-7212'、Xi2-7X2i1臺=y-I?X=2.1-0.104X21=-0.084,?=0.104x-0.084.(3)把x=24(千萬元)代入方程得,?=2.412(千萬元).;估計銷售總額為24千萬元時,利潤為2.412千萬元.11某種產(chǎn)品的廣告費(fèi)支出x與銷售額y(單位:百萬元)之間有如下對應(yīng)數(shù)據(jù)X24568y3040605070(1)畫出散點(diǎn)圖;(2)求回歸直線方程;(3)解試預(yù)測廣告費(fèi)支出為10百萬元時,銷售額多大?7U5040制(1)根據(jù)表中所列數(shù)據(jù)可得散點(diǎn)圖如下:(2)列出下

16、表,并用科學(xué)計算器進(jìn)行有關(guān)計算:i12345xi24568yi3040605070xiyi60160300300560因止匕,x=25=5,y=-250=50,55555、x2=145,'y2=13500,、x.y.=1380.i1i1i15、x.y.-5X*y于是可得:白=2=1380-5550=6.5;5145-555vXi2-5X2i1<?=y-I?X=50-6.5X5=17.5.因此,所求回歸直線方程為:7=6.5x+17.5.82.5(3)根據(jù)上面求得的回歸直線方程,當(dāng)廣告費(fèi)支出為10百萬元時,?=6.5X10+17.5=82.5(百萬元),即這種產(chǎn)品的銷售收入大約為百

17、萬元.獨(dú)立性檢驗(yàn)的基本知識點(diǎn)及習(xí)題本周內(nèi)容:一、基礎(chǔ)知識梳理1 .獨(dú)立性檢驗(yàn)利用隨機(jī)變量來確定在多大程度上可以認(rèn)為兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨(dú)立性檢驗(yàn)。2 .判斷結(jié)論成立的可能性的步驟:(1)通過三維柱形圖和二維條形圖,可以粗略地判斷兩個分類變量是否有關(guān)系,但是這種判斷無法精確地給出所得結(jié)論的可靠程度。(2)可以利用獨(dú)立性檢驗(yàn)來考察兩個分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度。二、例題選講例1.為了探究患慢性氣管炎是否與吸煙有關(guān),調(diào)查了339名50歲以上的人,調(diào)查結(jié)果如下表所示:患病不患病合計吸煙43162205不吸煙13121134合計56283339試問:

18、50歲以上的人患慢性氣管炎與吸煙習(xí)慣有關(guān)嗎?分析:最理想的解決辦法是向所有50歲以上的人作調(diào)查,然后對所得到的數(shù)據(jù)進(jìn)行統(tǒng)計處理,但這花費(fèi)的代價太大,實(shí)際上是行不通的,339人相對于全體50歲以上的人,只是一個小部分,已學(xué)過總體和樣本的關(guān)系,當(dāng)用樣本平均數(shù),樣本方差去估計總體相應(yīng)的數(shù)字特征時,由于抽樣的隨機(jī)性,結(jié)果并不唯一。現(xiàn)在情況類似,我們用部分對全體作推斷,推斷可能正確,也可能錯誤。如果抽取的339個調(diào)查對象中很多人是吸煙但沒患慢性氣管炎,而雖不吸煙因身體體質(zhì)差而患慢性氣管炎,能夠得出什么結(jié)論呢?我們有95%(或99%)的把握說事件總與事件8有關(guān),是指推斷犯錯誤的可能性為5%(或1%),這也

19、常常說成是以95%(或99%)的概率”是一樣的。解:根據(jù)列聯(lián)表中的數(shù)據(jù),得1=燮金辿上衛(wèi)史二?小205x134x56x283因?yàn)槎?'三二,所以我們有99%的把握說:50歲以上的人患慢性氣管炎與吸煙習(xí)慣有關(guān)。例2.甲乙兩個班級進(jìn)行一門考試,按照學(xué)生考試成績優(yōu)秀和不優(yōu)秀統(tǒng)計成績后,得到如下的列聯(lián)表:班級與成績列聯(lián)表優(yōu)秀不優(yōu)秀總計甲班103545乙班73845總計177390畫出列聯(lián)表的條形圖,并通過圖形判斷成績與班級是否有關(guān);利用列聯(lián)表的獨(dú)立性檢驗(yàn)估計,認(rèn)為成績與班級有關(guān)系”犯錯誤的概率是多少。解:列聯(lián)表的條形圖如圖所示:由表中數(shù)據(jù)計算得K2的觀察值為k0.653>0,455o由下

20、表中數(shù)據(jù)2-、P(K"0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828得:P(K2>0.455)y0.50從而有50%的把握認(rèn)為成績與班級有關(guān)系”,即斷言成績優(yōu)秀與班級有關(guān)系”犯錯誤的概率為0.5。評注:(1)畫出條形圖后,從圖形上判斷兩個分類變量之間是否有關(guān)系。這里通過圖形的直觀感覺的結(jié)果可能會出錯。(2)計算得到K2的觀測值比較小,所以沒有理由說明成績優(yōu)秀與班級有關(guān)系這與反證法也有類似的地方,在使用反證法證明結(jié)論時,假設(shè)結(jié)論不成立的

21、條件下如果沒有推出矛盾,并不能說明結(jié)論成立也不能說明結(jié)論不成立。在獨(dú)立性檢驗(yàn)中,在假設(shè)成績優(yōu)秀與班級沒有關(guān)系”的情況下,計算得到的K2的值比較小,且P(K2>0.653)y0.42明事件(K2>0.653不是一個小概率事件,這個事件的發(fā)生不足以說明戰(zhàn)績優(yōu)秀與班級沒有關(guān)系”,即沒有理由說明成績優(yōu)秀與班級有關(guān)系這里沒有推出小概率事件發(fā)生類似于反證法中沒有推出矛盾。例3.為考察某種藥物預(yù)防疾病的效果,進(jìn)行動物試驗(yàn),得到如下的列聯(lián)列表:藥物效果與動物試驗(yàn)列聯(lián)表患病未患病總計服用藥104555沒服用藥203050總計3075105請問能有多大把握認(rèn)為藥物有效?解:假設(shè)服藥情況與是否患病之間沒有關(guān)系”,則K2的值應(yīng)比較小;如果K2的值很大,則說明很可能服藥情況與是否患病之間有關(guān)系由題目中所給數(shù)據(jù)計算,得K2的觀測值為k6.110,而P(K2>5.024)y0.025以有97.5%的把握認(rèn)為服藥情況與是否患病之間有關(guān)系”,即大約有97.5%的把握認(rèn)為藥物有效。例4.在一次惡劣氣候的飛行航程中調(diào)查男女乘客在機(jī)上暈機(jī)的情況如下表所示,根據(jù)此資料你是否認(rèn)為在惡劣氣候中男人比女人更容易暈機(jī)?暈機(jī)不暈機(jī)合計男人243155女人82634合計325789分析:這是一個2x2列聯(lián)表的獨(dú)立性檢驗(yàn)問題,根據(jù)列聯(lián)表的數(shù)據(jù)求解。心受絲空三生二3689解:由條

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論