線性回歸方程分析_第1頁(yè)
線性回歸方程分析_第2頁(yè)
線性回歸方程分析_第3頁(yè)
線性回歸方程分析_第4頁(yè)
線性回歸方程分析_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、環(huán)球雅思學(xué)科教師輔導(dǎo)講義講義編號(hào): 組長(zhǎng)簽字: 簽字日期: 學(xué)員編號(hào): 年 級(jí): 高二 課時(shí)數(shù):3學(xué)員姓名: 輔導(dǎo)科目: 數(shù)學(xué) 學(xué)科教師:閆建斌課 題線性回歸方程授課日期及時(shí)段2014-2-11 18:00-20:00教學(xué)目標(biāo)線性回歸方程基礎(chǔ)重點(diǎn)、難點(diǎn)教 學(xué) 內(nèi) 容1、本周錯(cuò)題講解2、知識(shí)點(diǎn)梳理1線性回歸方程變量之間的兩類關(guān)系:函數(shù)關(guān)系與相關(guān)關(guān)系制作散點(diǎn)圖,判斷線性相關(guān)關(guān)系線性回歸方程:(最小二乘法)最小二乘法:求回歸直線,使得樣本數(shù)據(jù)的點(diǎn)到它的距離的平方最小的方法 注意:線性回歸直線經(jīng)過(guò)定點(diǎn)2相關(guān)系數(shù)(判定兩個(gè)變量線性相關(guān)性):注:0時(shí),變量正相關(guān); 0時(shí),變量負(fù)相關(guān); 越接近于1,兩個(gè)變量

2、的線性相關(guān)性越強(qiáng); 接近于0時(shí),兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系。3線形回歸模型:隨機(jī)誤差:我們把線性回歸模型,其中為模型的未知參數(shù),稱為隨機(jī)誤差。 隨機(jī)誤差殘差:我們用回歸方程中的估計(jì),隨機(jī)誤差,所以是的估計(jì)量,故,稱為相應(yīng)于點(diǎn)的殘差?;貧w效果判定-相關(guān)指數(shù)(解釋變量對(duì)于預(yù)報(bào)變量的貢獻(xiàn)率) (的表達(dá)式中確定)注:得知越大,說(shuō)明殘差平方和越小,則模型擬合效果越好;越接近于1,則回歸效果越好。4獨(dú)立性檢驗(yàn)(分類變量關(guān)系):(1)分類變量:這種變量的不同“值”表示個(gè)體所屬的不同類別的變量。(2)列聯(lián)表:列出兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表。(3)對(duì)于列聯(lián)表:的觀測(cè)值。(4)臨界值表:0.500.

3、400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828如果,就推斷“有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過(guò);否則,在樣本數(shù)據(jù)中沒(méi)有發(fā)現(xiàn)足夠證據(jù)支持結(jié)論“有關(guān)系”。(5)反證法與獨(dú)立性檢驗(yàn)原理的比較:反證法原理在假設(shè)下,如果推出矛盾,就證明了不成立。獨(dú)立性檢驗(yàn)原理在假設(shè)下,如果出現(xiàn)一個(gè)與相矛盾的小概率事件,就推斷不成立,且該推斷犯錯(cuò)誤的概率不超過(guò)這個(gè)小概率。典型例題1(2011山東)某產(chǎn)品的廣告費(fèi)用x與銷售額y的統(tǒng)計(jì)數(shù)據(jù)如下表:廣告費(fèi)用x/萬(wàn)元4235銷售額y/萬(wàn)元49263

4、954根據(jù)上表可得回歸方程x中的為9.4,據(jù)此模型預(yù)報(bào)廣告費(fèi)用為6萬(wàn)元時(shí)銷售額為 ()A63.6萬(wàn)元 B65.5萬(wàn)元C67.7萬(wàn)元 D72.0萬(wàn)元解析,42,又x必過(guò)(,),429.4,9.1.線性回歸方程為9.4x9.1.當(dāng)x6時(shí),9.469.165.5(萬(wàn)元)答案B2(2011江西)為了解兒子身高與其父親身高的關(guān)系,隨機(jī)抽取5對(duì)父子的身高數(shù)據(jù)如下:父親身高x/cm174176176176178兒子身高y/cm175175176177177則y對(duì)x的線性回歸方程為 ()A.x1 B.x1C.88x D.176解析因?yàn)?76,176,又y對(duì)x的線性回歸方程表示的直線恒過(guò)點(diǎn)(,),所以將(176

5、,176)代入A、B、C、D中檢驗(yàn)知選C.答案C3(2011陜西)設(shè)(x1,y1),(x2,y2),(xn,yn)是變量x和y的n個(gè)樣本點(diǎn),直線l是由這些樣本點(diǎn)通過(guò)最小二乘法得到的線性回歸直線(如圖),以下結(jié)論中正確的是()Ax和y的相關(guān)系數(shù)為直線l的斜率Bx和y的相關(guān)系數(shù)在0到1之間C當(dāng)n為偶數(shù)時(shí),分布在l兩側(cè)的樣本點(diǎn)的個(gè)數(shù)一定相同D直線l過(guò)點(diǎn)(,)解析因?yàn)橄嚓P(guān)系數(shù)是表示兩個(gè)變量是否具有線性相關(guān)關(guān)系的一個(gè)值,它的絕對(duì)值越接近1,兩個(gè)變量的線性相關(guān)程度越強(qiáng),所以A、B錯(cuò)誤C中n為偶數(shù)時(shí),分布在l兩側(cè)的樣本點(diǎn)的個(gè)數(shù)可以不相同,所以C錯(cuò)誤根據(jù)回歸直線方程一定經(jīng)過(guò)樣本中心點(diǎn)可知D正確,所以選D.答案

6、D4(2011廣東)為了解籃球愛(ài)好者小李的投籃命中率與打籃球時(shí)間之間的關(guān)系,下表記錄了小李某月1號(hào)到5號(hào)每天打籃球時(shí)間x(單位:小時(shí))與當(dāng)天投籃命中率y之間的關(guān)系:時(shí)間x12345命中率y0.40.50.60.60.4小李這5天的平均投籃命中率為_(kāi);用線性回歸分析的方法,預(yù)測(cè)小李該月6號(hào)打6小時(shí)籃球的投籃命中率為_(kāi)解析小李這5天的平均投籃命中率0.5,可求得小李這5天的平均打籃球時(shí)間3.根據(jù)表中數(shù)據(jù)可求得0.01,0.47,故回歸直線方程為0.470.01x,將x6代入得6號(hào)打6小時(shí)籃球的投籃命中率約為0.53.答案0.50.535(2011遼寧)調(diào)查了某地若干戶家庭的年收入x(單位:萬(wàn)元)和

7、年飲食支出y(單位:萬(wàn)元),調(diào)查顯示年收入x與年飲食支出y具有線性相關(guān)關(guān)系,并由調(diào)查數(shù)據(jù)得到y(tǒng)對(duì)x的回歸直線方程:0.254x0.321.由回歸直線方程可知,家庭年收入每增加1萬(wàn)元,年飲食支出平均增加_萬(wàn)元解析由題意知0.254(x1)0.321(0.254x0.321)0.254.答案0.2546(2011安徽)某地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計(jì)數(shù)據(jù):年份20022004200620082010需求量(萬(wàn)噸)236246257276286(1)利用所給數(shù)據(jù)求年需求量與年份之間的回歸直線方程x;(2)利用(1)中所求出的直線方程預(yù)測(cè)該地2012年的糧食需求量解(1)由所給數(shù)據(jù)看出,

8、年需求量與年份之間是近似直線上升的,下面求回歸直線方程為此對(duì)數(shù)據(jù)預(yù)處理如下:年份200642024需求量257211101929對(duì)預(yù)處理后的數(shù)據(jù),容易算得0,3.2.6.5,b3.由上述計(jì)算結(jié)果,知所求回歸直線方程為257(x2 006)6.5(x2 006)3.2,即6.5(x2 006)260.2.(2)利用直線方程,可預(yù)測(cè)2012年的糧食需求量為65(20122006)260.26.56260.2299.2(萬(wàn)噸)課堂練習(xí)1實(shí)驗(yàn)測(cè)得四組(x,y)的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的回歸直線方程為()A.x1B.x2 C.2x1 D.x12在比較兩個(gè)模型的擬

9、合效果時(shí),甲、乙兩個(gè)模型的相關(guān)指數(shù)R2的值分別約為0.96和0.85,則擬合效果好的模型是()A甲 B乙 C甲、乙相同 D不確定3某化工廠為預(yù)測(cè)產(chǎn)品的回收率y,需要研究它和原料有效成分含量x之間的相關(guān)關(guān)系,現(xiàn)取8對(duì)觀測(cè)值,計(jì)算,得xi52,yi228,x478,xiyi1849,則其線性回歸方程為()A.11.472.62x B.11.472.62xC.2.6211.47x D.11.472.62x4下表是某廠14月份用水量(單位:百噸)的一組數(shù)據(jù):月份x1234用水量y4.5432.5由散點(diǎn)圖可知,用水量y與月份x之間有較好的線性相關(guān)關(guān)系,其線性回歸直線方程是0.7xa,則a等于_5某車間為

10、了規(guī)定工時(shí)定額,需要確定加工零件所花費(fèi)的時(shí)間,為此作了四次試驗(yàn),得到的數(shù)據(jù)如下:零件的個(gè)數(shù)x(個(gè))2345加工的時(shí)間y(小時(shí))2.5344.5(1)在給定的坐標(biāo)系中畫(huà)出表中數(shù)據(jù)的散點(diǎn)圖;(2)求出y關(guān)于x的線性回歸方程bxa,并在坐標(biāo)系中畫(huà)出回歸直線;(3)試預(yù)測(cè)加工10個(gè)零件需要多少小時(shí)?課后練習(xí)一、選擇題1實(shí)驗(yàn)測(cè)得四組(x,y)的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的回歸直線方程為()A.x1B.x2C.2x1 D.x1答案A解析畫(huà)出散點(diǎn)圖,四點(diǎn)都在直線x1.2下列有關(guān)樣本相關(guān)系數(shù)的說(shuō)法不正確的是()A相關(guān)系數(shù)用來(lái)衡量變量x與y之間的線性相關(guān)程度B|r|1,且|

11、r|越接近于1,相關(guān)程度越大C|r|1,且|r|越接近0,相關(guān)程度越小D|r|1,且|r|越接近1,相關(guān)程度越小答案D3由一組樣本(x1,y1),(x2,y2),(xn,yn)得到的回歸直線方程abx,下面有四種關(guān)于回歸直線方程的論述:(1)直線abx至少經(jīng)過(guò)點(diǎn)(x1,y1),(x2,y2),(xn,yn)中的一個(gè)點(diǎn);(2)直線abx的斜率是;(3)直線abx必過(guò)(,)點(diǎn);(4)直線abx和各點(diǎn)(x1,y1),(x2,y2),(xn,yn)的偏差 (yiabxi)2是該坐標(biāo)平面上所有的直線與這些點(diǎn)的偏差中最小的直線其中正確的論述有()A0個(gè) B1個(gè)C2個(gè) D3個(gè)答案D解析線性回歸直線不一定過(guò)點(diǎn)

12、(x1,y1),(x2,y2),(xn,yn)中的任何一點(diǎn);b就是線性回歸直線的斜率,也就是回歸系數(shù);線性回歸直線過(guò)點(diǎn)(,);線性回歸直線是平面上所有直線中偏差 (yiabxi)2取得最小的那一條故有三種論述是正確的,選D.4設(shè)兩個(gè)變量x和y之間具有線性相關(guān)關(guān)系,它們的相關(guān)系數(shù)是r,y關(guān)于x的回歸直線的斜率是b,縱截距是a,那么必有()Ab與r的符號(hào)相同 Ba與r的符號(hào)相同Cb與r的符號(hào)相反 Da與r的符號(hào)相反答案A5在比較兩個(gè)模型的擬合效果時(shí),甲、乙兩個(gè)模型的相關(guān)指數(shù)R2的值分別約為0.96和0.85,則擬合效果好的模型是()A甲 B乙C甲、乙相同 D不確定答案A6某化工廠為預(yù)測(cè)產(chǎn)品的回收率

13、y,需要研究它和原料有效成分含量x之間的相關(guān)關(guān)系,現(xiàn)取8對(duì)觀測(cè)值,計(jì)算,得xi52,yi228,x478,xiyi1849,則其線性回歸方程為()A.11.472.62x B.11.472.62xC.2.6211.47x D.11.472.62x答案A解析利用回歸系數(shù)公式計(jì)算可得a11.47,b2.62,故11.472.62x.二、填空題7下表是某廠14月份用水量(單位:百噸)的一組數(shù)據(jù):月份x1234用水量y4.5432.5由散點(diǎn)圖可知,用水量y與月份x之間有較好的線性相關(guān)關(guān)系,其線性回歸直線方程是0.7xa,則a等于_解析2.5,3.5,回歸直線方程過(guò)定點(diǎn)(,),3.50.72.5a.a5

14、.25.8某服裝商場(chǎng)為了了解毛衣的月銷售量y(件)與月平均氣溫x()之間的關(guān)系,隨機(jī)統(tǒng)計(jì)了某4個(gè)月的月銷售量與當(dāng)月平均氣溫,其數(shù)據(jù)如下表:月平均氣溫x()171382月銷售量y(件)24334055由表中數(shù)據(jù)算出線性回歸方程bxa中的b2,氣象部門(mén)預(yù)測(cè)下個(gè)月的平均氣溫約為6,據(jù)此估計(jì),該商場(chǎng)下個(gè)月毛衣的銷售量約為_(kāi)件(參考公式:b,ab )答案46解析由所提供數(shù)據(jù)可計(jì)算得出10,38,又b2代入公式ab 可得a58,即線性回歸方程2x58,將x6代入可得9對(duì)196個(gè)接受心臟搭橋手術(shù)的病人和196個(gè)接受血管清障手術(shù)的病人進(jìn)行了3年的跟蹤研究,調(diào)查他們是否又發(fā)作過(guò)心臟病,調(diào)查結(jié)果如下表所示:又發(fā)作

15、過(guò)心臟病未發(fā)作過(guò)心臟病合計(jì)心臟搭橋手術(shù)39157196血管清障手術(shù)29167196合計(jì)68324392試根據(jù)上述數(shù)據(jù)計(jì)算K2_.比較這兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響有沒(méi)有差別_.答案1.78不能作出這兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響有差別的結(jié)論解析提出假設(shè)H0:兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響沒(méi)有差別根據(jù)列聯(lián)表中的數(shù)據(jù),可以求得K21.78.當(dāng)H0成立時(shí)K21.78,而K22.072的概率為0.85.所以,不能否定假設(shè)H0.也就是不能作出這兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響有差別的結(jié)論三、解答題10某農(nóng)科所對(duì)冬季晝夜溫差大小與某反季大豆新品種發(fā)芽多少之間的關(guān)系進(jìn)行分析研究,他們分別記錄了201

16、0年12月1日至12月5日的每天晝夜溫差與實(shí)驗(yàn)室每天每100顆種子中的發(fā)芽數(shù),得到如下表:日期12月1日12月2日12月3日12月4日12月5日溫差x()101113128發(fā)芽數(shù)y(顆)2325302616該農(nóng)科所確定的研究方案是:先從這五組數(shù)據(jù)中選取2組,用剩下的3組數(shù)據(jù)求線性回歸方程,再對(duì)被選取的2組數(shù)據(jù)進(jìn)行檢驗(yàn)(1)求選取的2組數(shù)據(jù)恰好是不相鄰的2天數(shù)據(jù)的概率;(2)若選取的是12月1日與12月5日的兩組數(shù)據(jù),請(qǐng)根據(jù)12月2日至12月4日的數(shù)據(jù),求出y關(guān)于x的線性回歸方程bxa;(3)若由線性回歸方程得到的估計(jì)數(shù)據(jù)與所選出的檢驗(yàn)數(shù)據(jù)的誤差均不超過(guò)2顆,則認(rèn)為得到的線性回歸方程是可靠的,試

17、問(wèn)(2)中所得到的線性回歸方程是否可靠?解析(1)設(shè)抽到不相鄰的兩組數(shù)據(jù)為事件A,因?yàn)閺?組數(shù)據(jù)中選取2組數(shù)據(jù)共有10種情況:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)其中數(shù)據(jù)為12月份的日期數(shù)每種情況都是可能出現(xiàn)的,事件A包括的基本事件有6種:所以P(A).所以選取的2組數(shù)據(jù)恰好是不相鄰2天數(shù)據(jù)的概率是.(2)由數(shù)據(jù),求得12,27.由公式,求得b,ab 3.所以y關(guān)于x的線性回歸方程為x3.(3)當(dāng)x10,10322,|2223|2;同樣,當(dāng)x8時(shí),8317,|1716|2;所以,該研究所得到的回歸方程是可靠的11

18、某車間為了規(guī)定工時(shí)定額,需要確定加工零件所花費(fèi)的時(shí)間,為此作了四次試驗(yàn),得到的數(shù)據(jù)如下:零件的個(gè)數(shù)x(個(gè))2345加工的時(shí)間y(小時(shí))2.5344.5(1)在給定的坐標(biāo)系中畫(huà)出表中數(shù)據(jù)的散點(diǎn)圖;(2)求出y關(guān)于x的線性回歸方程bxa,并在坐標(biāo)系中畫(huà)出回歸直線;(3)試預(yù)測(cè)加工10個(gè)零件需要多少小時(shí)?(注:b,ab )解析(1)散點(diǎn)圖如圖(2)由表中數(shù)據(jù)得:xiyi52.5,3.5,3.5,x54,b0.7,a1.05,0.7x1.05.回歸直線如圖所示(3)將x10代入回歸直線方程,得0.7101.058.05(小時(shí) )預(yù)測(cè)加工10個(gè)零件需要8.05小時(shí)12(2010遼寧卷)為了比較注射A,B兩種藥物后產(chǎn)生的皮膚皰疹的面積,選200只家兔做試驗(yàn),將這200只家兔隨機(jī)地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.下表1和表2分別是注射藥物A和B后的試驗(yàn)結(jié)果(皰疹面積單位:mm2)表1:注射藥物A后皮膚皰疹面積的頻數(shù)分布表皰疹面積60,65)65,70)70,75)75,80)頻數(shù)30402010表2:注射藥物B后皮膚皰疹面積的頻數(shù)分布表皰疹面積60,65)65,70)70,75)75,80)80,85)頻數(shù)1025203015()完成下面頻率分布直方圖,并比較注射兩種藥物后皰疹面積的中位數(shù)大小;()完成下面22列聯(lián)表,并回答能否有99.9% 的把握認(rèn)為

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論