《變量間的相關(guān)關(guān)系》設(shè)計(jì)10_第1頁(yè)
《變量間的相關(guān)關(guān)系》設(shè)計(jì)10_第2頁(yè)
《變量間的相關(guān)關(guān)系》設(shè)計(jì)10_第3頁(yè)
《變量間的相關(guān)關(guān)系》設(shè)計(jì)10_第4頁(yè)
《變量間的相關(guān)關(guān)系》設(shè)計(jì)10_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《變量間的相關(guān)關(guān)系》教學(xué)設(shè)計(jì)【教學(xué)目標(biāo)】經(jīng)歷用不同估算方法描述兩個(gè)變量線性相關(guān)的過(guò)程.知道最小二乘法的思想,能根據(jù)給出的線性回歸方程的系數(shù)公式建立線性回歸方程.【教學(xué)重難點(diǎn)及課時(shí)】重點(diǎn):根據(jù)給出的線性回歸方程的系數(shù)公式建立線性回歸方程.難點(diǎn):理解最小二乘法的思想.課時(shí):1課時(shí).【教學(xué)過(guò)程】導(dǎo)入新課思路1客觀事物是相互聯(lián)系的,過(guò)去研究的大多數(shù)是因果關(guān)系,但實(shí)際上更多存在的是一種非因果關(guān)系.比如說(shuō):某某同學(xué)的數(shù)學(xué)成績(jī)與物理成績(jī),彼此是互相聯(lián)系的,但不能認(rèn)為數(shù)學(xué)是“因”,物理是“果”,或者反過(guò)來(lái)說(shuō).事實(shí)上數(shù)學(xué)和物理成績(jī)都是“果”,而真正的“因”是學(xué)生的理科學(xué)習(xí)能力和努力程度.所以說(shuō),函數(shù)關(guān)系存在著一種確定性關(guān)系,但還存在著另一種非確定性關(guān)系——相關(guān)關(guān)系.為表示這種相關(guān)關(guān)系,我們接著學(xué)習(xí)兩個(gè)變量的線性相關(guān)——回歸直線及其方程.思路2某小賣部為了了解熱茶銷售量與氣溫之間的關(guān)系,隨機(jī)統(tǒng)計(jì)并制作了某6天賣出熱茶的杯數(shù)與當(dāng)天氣溫的對(duì)照表:氣溫/℃261813104-1杯數(shù)202434385064如果某天的氣溫是-5℃,你能根據(jù)這些數(shù)據(jù)預(yù)測(cè)這天小賣部賣出熱茶的杯數(shù)嗎?為解決這個(gè)問(wèn)題我們接著學(xué)習(xí)兩個(gè)變量的線性相關(guān)——回歸直線及其方程.推進(jìn)新課新知探究提出問(wèn)題(1)作散點(diǎn)圖的步驟和方法?(2)正、負(fù)相關(guān)的概念?(3)什么是線性相關(guān)?(4)看人體的脂肪百分比和年齡的散點(diǎn)圖,當(dāng)人的年齡增加時(shí),體內(nèi)脂肪含量到底是以什么方式增加的呢?(5)什么叫做回歸直線?(6)如何求回歸直線的方程?什么是最小二乘法?它有什么樣的思想?(7)利用計(jì)算機(jī)如何求回歸直線的方程?(8)利用計(jì)算器如何求回歸直線的方程?活動(dòng):學(xué)生回顧,再思考或討論,教師及時(shí)提示指導(dǎo).討論結(jié)果:(1)建立相應(yīng)的平面直角坐標(biāo)系,將各數(shù)據(jù)在平面直角坐標(biāo)中的對(duì)應(yīng)點(diǎn)畫出來(lái),得到表示兩個(gè)變量的一組數(shù)據(jù)的圖形,這樣的圖形叫做散點(diǎn)圖.(a.如果所有的樣本點(diǎn)都落在某一函數(shù)曲線上,就用該函數(shù)來(lái)描述變量之間的關(guān)系,即變量之間具有函數(shù)關(guān)系.b.如果所有的樣本點(diǎn)都落在某一函數(shù)曲線附近,變量之間就有相關(guān)關(guān)系.c.如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系)(2)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),稱為正相關(guān).如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),稱為負(fù)相關(guān).(3)如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)的關(guān)系.(4)大體上來(lái)看,隨著年齡的增加,人體中脂肪的百分比也在增加,呈正相關(guān)的趨勢(shì),我們可以從散點(diǎn)圖上來(lái)進(jìn)一步分析.(5)如下圖:從散點(diǎn)圖上可以看出,這些點(diǎn)大致分布在通過(guò)散點(diǎn)圖中心的一條直線附近.如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,我們就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線(regressionline).如果能夠求出這條回歸直線的方程(簡(jiǎn)稱回歸方程),那么我們就可以比較清楚地了解年齡與體內(nèi)脂肪含量的相關(guān)性.就像平均數(shù)可以作為一個(gè)變量的數(shù)據(jù)的代表一樣,這條直線可以作為兩個(gè)變量具有線性相關(guān)關(guān)系的代表.(6)從散點(diǎn)圖上可以發(fā)現(xiàn),人體的脂肪百分比和年齡的散點(diǎn)圖,大致分布在通過(guò)散點(diǎn)圖中心的一條直線.那么,我們應(yīng)當(dāng)如何具體求出這個(gè)回歸方程呢?有的同學(xué)可能會(huì)想,我可以采用測(cè)量的方法,先畫出一條直線,測(cè)量出各點(diǎn)與它的距離,然后移動(dòng)直線,到達(dá)一個(gè)使距離的和最小的位置,測(cè)量出此時(shí)的斜率和截距,就可得到回歸方程了.但是,這樣做可靠嗎?有的同學(xué)可能還會(huì)想,在圖中選擇這樣的兩點(diǎn)畫直線,使得直線兩側(cè)的點(diǎn)的個(gè)數(shù)基本相同.同樣地,這樣做能保證各點(diǎn)與此直線在整體上是最接近的嗎?還有的同學(xué)會(huì)想,在散點(diǎn)圖中多取幾組點(diǎn),確定出幾條直線的方程,再分別求出各條直線的斜率、截距的平均數(shù),將這兩個(gè)平均數(shù)當(dāng)成回歸方程的斜率和截距.同學(xué)們不妨去實(shí)踐一下,看看這些方法是不是真的可行?(學(xué)生討論:1.選擇能反映直線變化的兩個(gè)點(diǎn).2.在圖中放上一根細(xì)繩,使得上面和下面點(diǎn)的個(gè)數(shù)相同或基本相同.3.多取幾組點(diǎn)對(duì),確定幾條直線方程.再分別算出各個(gè)直線方程斜率、截距的算術(shù)平均值,作為所求直線的斜率、截距.)教師:分別分析各方法的可靠性.如下圖:上面這些方法雖然有一定的道理,但總讓人感到可靠性不強(qiáng).實(shí)際上,求回歸方程的關(guān)鍵是如何用數(shù)學(xué)的方法來(lái)刻畫“從整體上看,各點(diǎn)與此直線的距離最小”.人們經(jīng)過(guò)長(zhǎng)期的實(shí)踐與研究,已經(jīng)得出了計(jì)算回歸方程的斜率與截距的一般公式其中,b是回歸方程的斜率,a是截距.推導(dǎo)公式①的計(jì)算比較復(fù)雜,這里不作推導(dǎo).但是,我們可以解釋一下得出它的原理.假設(shè)我們已經(jīng)得到兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),且所求回歸方程是=bx+a,其中a、b是待定參數(shù).當(dāng)變量x取xi(i=1,2,…,n)時(shí)可以得到=bxi+a(i=1,2,…,n),它與實(shí)際收集到的yi之間的偏差是yi-=yi-(bxi+a)(i=1,2,…,n).這樣,用這n個(gè)偏差的和來(lái)刻畫“各點(diǎn)與此直線的整體偏差”是比較合適的.由于(yi-)可正可負(fù),為了避免相互抵消,可以考慮用來(lái)代替,但由于它含有絕對(duì)值,運(yùn)算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2②來(lái)刻畫n個(gè)點(diǎn)與回歸直線在整體上的偏差.這樣,問(wèn)題就歸結(jié)為:當(dāng)a,b取什么值時(shí)Q最小,即總體偏差最小.經(jīng)過(guò)數(shù)學(xué)上求最小值的運(yùn)算,a,b的值由公式①給出.通過(guò)求②式的最小值而得出回歸直線的方法,即求回歸直線,使得樣本數(shù)據(jù)的點(diǎn)到它的距離的平方和最小,這一方法叫做最小二乘法(methodofleastsquare).(7)利用計(jì)算機(jī)求回歸直線的方程.根據(jù)最小二乘法的思想和公式①,利用計(jì)算器或計(jì)算機(jī),可以方便地求出回歸方程.以Excel軟件為例,用散點(diǎn)圖來(lái)建立表示人體的脂肪含量與年齡的相關(guān)關(guān)系的線性回歸方程,具體步驟如下:①在Excel中選定表示人體的脂肪含量與年齡的相關(guān)關(guān)系的散點(diǎn)圖(如下圖),在菜單中選定“圖表”中的“添加趨勢(shì)線”選項(xiàng),彈出“添加趨勢(shì)線”對(duì)話框.②單擊“類型”標(biāo)簽,選定“趨勢(shì)預(yù)測(cè)/回歸分析類型”中的“線性”選項(xiàng),單擊“確定”按鈕,得到回歸直線.③雙擊回歸直線,彈出“趨勢(shì)線格式”對(duì)話框.單擊“選項(xiàng)”標(biāo)簽,選定“顯示公式”,最后單擊“確定”按鈕,得到回歸直線的回歸方程=(8)利用計(jì)算器求回歸直線的方程.用計(jì)算器求這個(gè)回歸方程的過(guò)程如下:所以回歸方程為=正像本節(jié)開(kāi)頭所說(shuō)的,我們從人體脂肪含量與年齡這兩個(gè)變量的一組隨機(jī)樣本數(shù)據(jù)中,找到了它們之間關(guān)系的一個(gè)規(guī)律,這個(gè)規(guī)律是由回歸直線來(lái)反映的.直線回歸方程的應(yīng)用:①描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個(gè)變量間依存的數(shù)量關(guān)系.②利用回歸方程進(jìn)行預(yù)測(cè);把預(yù)報(bào)因子(即自變量x)代入回歸方程對(duì)預(yù)報(bào)量(即因變量Y)進(jìn)行估計(jì),即可得到個(gè)體Y值的容許區(qū)間.③利用回歸方程進(jìn)行統(tǒng)計(jì)控制規(guī)定Y值的變化,通過(guò)控制x的范圍來(lái)實(shí)現(xiàn)統(tǒng)計(jì)控制的目標(biāo).如已經(jīng)得到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過(guò)控制汽車流量來(lái)控制空氣中NO2的濃度.應(yīng)用示例思路1例1有一個(gè)同學(xué)家開(kāi)了一個(gè)小賣部,他為了研究氣溫對(duì)熱飲銷售的影響,經(jīng)過(guò)統(tǒng)計(jì),得到一個(gè)賣出的熱飲杯數(shù)與當(dāng)天氣溫的對(duì)比表:攝氏溫度/℃-504712151923273136熱飲杯數(shù)15615013212813011610489937654(1)畫出散點(diǎn)圖;(2)從散點(diǎn)圖中發(fā)現(xiàn)氣溫與熱飲銷售杯數(shù)之間關(guān)系的一般規(guī)律;(3)求回歸方程;(4)如果某天的氣溫是2℃,預(yù)測(cè)這天賣出的熱飲杯數(shù).解:(1)散點(diǎn)圖如下圖所示:(2)從上圖看到,各點(diǎn)散布在從左上角到右下角的區(qū)域里,因此,氣溫與熱飲銷售杯數(shù)之間呈負(fù)相關(guān),即氣溫越高,賣出去的熱飲杯數(shù)越少.(3)從散點(diǎn)圖可以看出,這些點(diǎn)大致分布在一條直線的附近,因此,可用公式①求出回歸方程的系數(shù).利用計(jì)算器容易求得回歸方程=+.(4)當(dāng)x=2時(shí),=.因此,某天的氣溫為2℃時(shí),這天大約可以賣出143杯熱飲.思考?xì)鉁貫?℃時(shí),小賣部一定能夠賣出143杯左右熱飲嗎?為什么?這里的答案是小賣部不一定能夠賣出143杯左右熱飲,原因如下:1.線性回歸方程中的截距和斜率都是通過(guò)樣本估計(jì)出來(lái)的,存在隨機(jī)誤差,這種誤差可以導(dǎo)致預(yù)測(cè)結(jié)果的偏差.2.即使截距和斜率的估計(jì)沒(méi)有誤差,也不可能百分之百地保證對(duì)應(yīng)于x的預(yù)報(bào)值,能夠與實(shí)際值y很接近.我們不能保證點(diǎn)(x,y)落在回歸直線上,甚至不能百分之百地保證它落在回歸直線的附近,事實(shí)上,y=bx+a+e=+e.這里e是隨機(jī)變量,預(yù)報(bào)值與實(shí)際值y的接近程度由隨機(jī)變量e的標(biāo)準(zhǔn)差所決定.一些學(xué)生可能會(huì)提出問(wèn)題:既然不一定能夠賣出143杯左右熱飲,那么為什么我們還以“這天大約可以賣出143杯熱飲”作為結(jié)論呢?這是因?yàn)檫@個(gè)結(jié)論出現(xiàn)的可能性最大.具體地說(shuō),假如我們規(guī)定可以選擇連續(xù)的3個(gè)非負(fù)整數(shù)作為可能的預(yù)測(cè)結(jié)果,則我們選擇142,143和144能夠保證預(yù)測(cè)成功(即實(shí)際賣出的杯數(shù)是這3個(gè)數(shù)之一)的概率最大.例2下表為某地近幾年機(jī)動(dòng)車輛數(shù)與交通事故數(shù)的統(tǒng)計(jì)資料.機(jī)動(dòng)車輛數(shù)x/千臺(tái)95110112120129135150180交通事故數(shù)y/千件13(1)請(qǐng)判斷機(jī)動(dòng)車輛數(shù)與交通事故數(shù)之間是否有線性相關(guān)關(guān)系,如果不具有線性相關(guān)關(guān)系,說(shuō)明理由;(2)如果具有線性相關(guān)關(guān)系,求出線性回歸方程.解:(1)在直角坐標(biāo)系中畫出數(shù)據(jù)的散點(diǎn)圖,如下圖.直觀判斷散點(diǎn)在一條直線附近,故具有線性相關(guān)關(guān)系.(2)計(jì)算相應(yīng)的數(shù)據(jù)之和:=1031,=,=137835,=9.將它們代入公式計(jì)算得b≈4,a=1,所以,所求線性回歸方程為=1.思路2例1給出施化肥量對(duì)水稻產(chǎn)量影響的試驗(yàn)數(shù)據(jù):施化肥量x15202530354045水稻產(chǎn)量y330345365405445450455(1)畫出上表的散點(diǎn)圖;(2)求出回歸直線的方程.解:(1)散點(diǎn)圖如下圖.(2)表中的數(shù)據(jù)進(jìn)行具體計(jì)算,列成以下表格:i1234567xi15202530354045yi330345365405445450455xiyi49506900912512150155751800020475故可得到b=≈,a=從而得回歸直線方程是=+257.例2一個(gè)車間為了規(guī)定工時(shí)定額,需要確定加工零件所花費(fèi)的時(shí)間.為此進(jìn)行了10次試驗(yàn),測(cè)得數(shù)據(jù)如下:零件個(gè)數(shù)x(個(gè))102030405060708090100加工時(shí)間y(分)626875818995102108115122請(qǐng)判斷y與x是否具有線性相關(guān)關(guān)系,如果y與x具有線性相關(guān)關(guān)系,求線性回歸方程.解:在直角坐標(biāo)系中畫出數(shù)據(jù)的散點(diǎn)圖,如下圖.直觀判斷散點(diǎn)在一條直線附近,故具有線性相關(guān)關(guān)系.由測(cè)得的數(shù)據(jù)表可知:=38500,=87777,=55950.b=≈.a==因此,所求線性回歸方程為=bx+a=+.例3已知10條狗的血球體積及紅血球數(shù)的測(cè)量值如下:血球體積x(mL)45424648423558403950紅血球數(shù)y(百萬(wàn))(1)畫出上表的散點(diǎn)圖;(2)求出回歸直線的方程.解:(1)散點(diǎn)圖如下.(2)(45+42+46+48+42+35+58+40+39+50)=,+++++++++=.設(shè)回歸直線方程為=bx+a,則b==,a==,所以所求回歸直線的方程為=點(diǎn)評(píng):對(duì)一組數(shù)據(jù)進(jìn)行線性回歸分析時(shí),應(yīng)先畫出其散點(diǎn)圖,看其是否呈直線形,再依系數(shù)a,b的計(jì)算公式,算出a,b.由于計(jì)算量較大,所以在計(jì)算時(shí)應(yīng)借助技術(shù)手段,認(rèn)真細(xì)致,謹(jǐn)防計(jì)算中產(chǎn)生錯(cuò)誤,求線性回歸方程的步驟:計(jì)算平均數(shù);計(jì)算xi與yi的積,求∑xiyi;計(jì)算∑xi2;將結(jié)果代入公式求b;用a=求a;寫出回歸直線方程.知能訓(xùn)練1.下列兩個(gè)變量之間的關(guān)系哪個(gè)不是函數(shù)關(guān)系()A.角度和它的余弦值B.正方形邊長(zhǎng)和面積C.正n邊形的邊數(shù)和它的內(nèi)角和D.人的年齡和身高答案:D2.三點(diǎn)(3,10),(7,20),(11,24)的線性回歸方程是()A.=B.=+C.=D.=+答案:D3.已知關(guān)于某設(shè)備的使用年限x與所支出的維修費(fèi)用y(萬(wàn)元),有如下統(tǒng)計(jì)資料:使用年限x23456維修費(fèi)用y2.23.85.56.57.0設(shè)y對(duì)x呈線性相關(guān)關(guān)系.試求:(1)線性回歸方程=bx+a的回歸系數(shù)a,b;(2)估計(jì)使用年限為10年時(shí),維修費(fèi)用是多少?答案:(1)b=,a=;(2).4.我們考慮兩個(gè)表示變量x與y之間的關(guān)系的模型,δ為誤差項(xiàng),模型如下:模型1:y=6+4x;模型2:y=6+4x+e.(1)如果x=3,e=1,分別求兩個(gè)模型中y的值;(2)分別說(shuō)明以上兩個(gè)模型是確定性模型還是隨機(jī)模型.解:(1)模型1:y=6+4x=6+4×3=18;模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x值一定得到相同的y值,所以是確定性模型;模型2中相同的x值,因δ的不同,所得y值不一定相同,且δ為誤差項(xiàng)是隨機(jī)的,所以模型2是隨機(jī)性模型.5.以下是收集到的新房屋銷售價(jià)格y與房屋大小x的數(shù)據(jù):房屋大小x(m2)80105110115135銷售價(jià)格y(萬(wàn)元)22(1)畫出數(shù)據(jù)的散點(diǎn)圖;(2)用最小二乘法估計(jì)求線性回歸方程.解:(1)散點(diǎn)圖如下圖.(2)n=5,=545,=109,=116,=,=60952,=12952,b=≈,a=所以,線性回歸方程為y=+.拓展提升某調(diào)查者從調(diào)查中獲知某公司近年來(lái)科研費(fèi)用支出(Xi)與公司所獲得利潤(rùn)(Yi)的統(tǒng)計(jì)資料如下表:科研費(fèi)用支出(Xi)與利潤(rùn)(Yi)統(tǒng)計(jì)表單位:萬(wàn)元年份科研費(fèi)用支出利潤(rùn)1998199920002001200220035114532314030342520合計(jì)30180要求估計(jì)利潤(rùn)(Yi)對(duì)科研費(fèi)用支出(Xi)的線性回歸模型.解:設(shè)線性回歸模型直線方程為:,因?yàn)椋?

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論