變量之間的相關(guān)關(guān)系(課堂PPT)_第1頁(yè)
變量之間的相關(guān)關(guān)系(課堂PPT)_第2頁(yè)
變量之間的相關(guān)關(guān)系(課堂PPT)_第3頁(yè)
變量之間的相關(guān)關(guān)系(課堂PPT)_第4頁(yè)
變量之間的相關(guān)關(guān)系(課堂PPT)_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、12.3 2.3 變量間的相關(guān)關(guān)系變量間的相關(guān)關(guān)系2.3.1 2.3.1 變量之間的相關(guān)關(guān)系變量之間的相關(guān)關(guān)系2.3.2 2.3.2 兩個(gè)變量的線性相關(guān)兩個(gè)變量的線性相關(guān) 第二課時(shí)第二課時(shí)2復(fù)習(xí)回顧復(fù)習(xí)回顧1 1、相關(guān)關(guān)系、相關(guān)關(guān)系自變量取值一定時(shí),因變量的取值帶有一定自變量取值一定時(shí),因變量的取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系隨機(jī)性的兩個(gè)變量之間的關(guān)系. .正相關(guān)的散點(diǎn)圖中的點(diǎn)散布在從左下角到右正相關(guān)的散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域,負(fù)相關(guān)的散點(diǎn)圖中的點(diǎn)散布在上角的區(qū)域,負(fù)相關(guān)的散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域從左上角到右下角的區(qū)域 2 2、正相關(guān)和負(fù)相關(guān)的兩個(gè)相關(guān)變量

2、的、正相關(guān)和負(fù)相關(guān)的兩個(gè)相關(guān)變量的散點(diǎn)圖的特點(diǎn)散點(diǎn)圖的特點(diǎn)33.3.觀察人體的脂肪含量百分比和年齡的樣本觀察人體的脂肪含量百分比和年齡的樣本數(shù)據(jù)的散點(diǎn)圖,這兩個(gè)相關(guān)變量成正相關(guān)數(shù)據(jù)的散點(diǎn)圖,這兩個(gè)相關(guān)變量成正相關(guān). .我們需要進(jìn)一步考慮的問(wèn)題是,當(dāng)人的年齡增我們需要進(jìn)一步考慮的問(wèn)題是,當(dāng)人的年齡增加時(shí),體內(nèi)脂肪含量到底是以什么方式增加呢?加時(shí),體內(nèi)脂肪含量到底是以什么方式增加呢?對(duì)此,我們從理論上作些研究對(duì)此,我們從理論上作些研究. .45思考思考1 1:在各種各樣的散點(diǎn)圖中,有些散點(diǎn)圖中的在各種各樣的散點(diǎn)圖中,有些散點(diǎn)圖中的點(diǎn)是雜亂分布的,有些散點(diǎn)圖中的點(diǎn)的分布有一點(diǎn)是雜亂分布的,有些散點(diǎn)圖

3、中的點(diǎn)的分布有一定的規(guī)律性,年齡和人體脂肪含量的樣本數(shù)據(jù)的定的規(guī)律性,年齡和人體脂肪含量的樣本數(shù)據(jù)的散點(diǎn)圖中的點(diǎn)的分布有什么特點(diǎn)?散點(diǎn)圖中的點(diǎn)的分布有什么特點(diǎn)? 這些點(diǎn)大致分布在一條直線附近這些點(diǎn)大致分布在一條直線附近. .知識(shí)探究(一):回歸直線知識(shí)探究(一):回歸直線 6如果散點(diǎn)圖中的點(diǎn)的分布,從整體上看大致在一如果散點(diǎn)圖中的點(diǎn)的分布,從整體上看大致在一條直線附近,則稱這兩個(gè)變量之間具有條直線附近,則稱這兩個(gè)變量之間具有線性相關(guān)線性相關(guān)關(guān)系關(guān)系,這條直線叫做,這條直線叫做回歸直線回歸直線. .該直線叫該直線叫回歸方程回歸方程。 注注: :如果關(guān)于兩個(gè)變量統(tǒng)計(jì)數(shù)據(jù)的散點(diǎn)圖呈如果關(guān)于兩個(gè)變量統(tǒng)

4、計(jì)數(shù)據(jù)的散點(diǎn)圖呈現(xiàn)發(fā)散狀現(xiàn)發(fā)散狀, ,則這兩個(gè)變量之間不具有相關(guān)關(guān)系則這兩個(gè)變量之間不具有相關(guān)關(guān)系. .720 2530354045 50 55 60 65年齡脂肪含量0510152025303540如圖如圖 :思考思考2:2:那么,我們?cè)撛鯓觼?lái)求出這個(gè)回歸方程?那么,我們?cè)撛鯓觼?lái)求出這個(gè)回歸方程?我們有這樣幾種方案?我們有這樣幾種方案?對(duì)一組具有線性相關(guān)關(guān)系的樣本數(shù)據(jù),如果能夠求出它的回歸方程,對(duì)一組具有線性相關(guān)關(guān)系的樣本數(shù)據(jù),如果能夠求出它的回歸方程,那么我們就可以比較具體、清楚地了解兩個(gè)相關(guān)變量的內(nèi)在聯(lián)系,那么我們就可以比較具體、清楚地了解兩個(gè)相關(guān)變量的內(nèi)在聯(lián)系,并根據(jù)回歸方程對(duì)總體進(jìn)行

5、估計(jì)并根據(jù)回歸方程對(duì)總體進(jìn)行估計(jì). . 8202530 35 4045 50 55 60 65年齡脂肪含量05101520253035409202530 35 4045 50 55 60 65年齡脂肪含量0510152025303540我們把由一個(gè)變量的變化我們把由一個(gè)變量的變化去推測(cè)另一個(gè)變量的方法去推測(cè)另一個(gè)變量的方法稱為稱為回歸方法?;貧w方法。10實(shí)際上,求回歸方程的關(guān)鍵是如何用數(shù)學(xué)的實(shí)際上,求回歸方程的關(guān)鍵是如何用數(shù)學(xué)的方法來(lái)刻畫方法來(lái)刻畫“從整體上看,各點(diǎn)與此直線的從整體上看,各點(diǎn)與此直線的距離最小。距離最小。整體上最接近整體上最接近 思考:思考:回歸直線與散點(diǎn)圖中各點(diǎn)的位置回歸直線

6、與散點(diǎn)圖中各點(diǎn)的位置應(yīng)具有怎樣的關(guān)系?應(yīng)具有怎樣的關(guān)系? (x1, y1)(x2,y2)(xi,yi)(xn,yn)11(x1, y1)(x2,y2)(xi,yi)(xn,yn)假設(shè)兩個(gè)具有線性相關(guān)關(guān)系的變量的一組樣本假設(shè)兩個(gè)具有線性相關(guān)關(guān)系的變量的一組樣本數(shù)據(jù):數(shù)據(jù):(x(x1 1,y y1 1) ),(x(x2 2,y y2 2) ),(x(xn n,y yn n) ),設(shè),設(shè)其回歸方程為其回歸方程為ybxa我們可用點(diǎn)我們可用點(diǎn) 與這條直線上橫標(biāo)為與這條直線上橫標(biāo)為 的點(diǎn)之的點(diǎn)之間的距離來(lái)刻畫點(diǎn)間的距離來(lái)刻畫點(diǎn) 到直線距離的遠(yuǎn)近,即到直線距離的遠(yuǎn)近,即( ,)iix yix( ,)iix

7、y() (1,2,3, )iiybxain用這n個(gè)距離之和 來(lái)刻畫各點(diǎn)到直線的”整體距離”1()niiiybxa1221()niiQyy2221122()()(a)nnybxaybxaybx(x1, y1)(x2,y2)(xi,yi)(xn,yn)由于絕對(duì)值使得計(jì)算不方便,實(shí)際應(yīng)用中采用13根根據(jù)有關(guān)數(shù)學(xué)原理分析,當(dāng)據(jù)有關(guān)數(shù)學(xué)原理分析,當(dāng) 時(shí),時(shí),1122211()(),()nniiiiiinniiiixxyyx ynx ybxxxnxaybx總體偏差總體偏差 為最小,這樣就得到了回歸方為最小,這樣就得到了回歸方程,這種求回歸方程的方法叫做最小二乘法程,這種求回歸方程的方法叫做最小二乘法. .

8、回歸方程回歸方程21()niiiQyyybxa注:注:對(duì)具有線性相關(guān)關(guān)系的兩個(gè)變量,其回歸直線一定對(duì)具有線性相關(guān)關(guān)系的兩個(gè)變量,其回歸直線一定通過(guò)樣本點(diǎn)的中心通過(guò)樣本點(diǎn)的中心,yx(其中回歸方程的斜率為 截距為 )ba141.1.回歸方程被樣本數(shù)據(jù)惟一確定,各樣本點(diǎn)回歸方程被樣本數(shù)據(jù)惟一確定,各樣本點(diǎn)大致分布在回歸直線附近大致分布在回歸直線附近. .對(duì)同一個(gè)總體,對(duì)同一個(gè)總體,不同的樣本數(shù)據(jù)對(duì)應(yīng)不同的回歸直線,所以不同的樣本數(shù)據(jù)對(duì)應(yīng)不同的回歸直線,所以回歸直線也具有隨機(jī)性回歸直線也具有隨機(jī)性. . 2 2. .對(duì)于任意一組樣本數(shù)據(jù),利用上述公式都對(duì)于任意一組樣本數(shù)據(jù),利用上述公式都可以求得可以

9、求得“回歸方程回歸方程”,如果這組數(shù)據(jù)不具,如果這組數(shù)據(jù)不具有線性相關(guān)關(guān)系,即不存在回歸直線,那么有線性相關(guān)關(guān)系,即不存在回歸直線,那么所得的所得的“回歸方程回歸方程”是沒(méi)有實(shí)際意義的是沒(méi)有實(shí)際意義的. .因此,因此,對(duì)一組樣本數(shù)據(jù),應(yīng)先作散點(diǎn)圖,在具有線對(duì)一組樣本數(shù)據(jù),應(yīng)先作散點(diǎn)圖,在具有線性相關(guān)關(guān)系的前提下再求回歸方程性相關(guān)關(guān)系的前提下再求回歸方程. .15解:散點(diǎn)圖如圖所示由散點(diǎn)圖可知:在平面直角坐標(biāo)系中,各點(diǎn)散布在左下角到右上角的區(qū)域,這些點(diǎn)大致分布在一條直線附近,因此x、y具有線性相關(guān)關(guān)系141421148.0727.2619403.234181iiiiixyx yx 1411422

10、1140.578140.524iiiiix yx ybxxaybx 故可得:故可得:所求回歸直線方程為0.5770.448xy16在上例中:若某人在上例中:若某人3737歲,則其體內(nèi)脂肪含歲,則其體內(nèi)脂肪含量的百分比約為多少?量的百分比約為多少?0.5770.448xy由此可以估計(jì)年齡為由此可以估計(jì)年齡為3737歲的人其體內(nèi)脂肪含量的歲的人其體內(nèi)脂肪含量的百分比約為百分比約為20.901%20.901%0.577 37 0.44820.90117求樣本數(shù)據(jù)的線性回歸方程步驟求樣本數(shù)據(jù)的線性回歸方程步驟第一步,作散點(diǎn)圖,確定第一步,作散點(diǎn)圖,確定x,yx,y具有線性相關(guān)關(guān)系;具有線性相關(guān)關(guān)系;

11、1122211()(),()nniiiiiinniiiixxyyx ynx ybaybxxxxnx第三步,計(jì)算第三步,計(jì)算 ybxa第四步,寫出回歸方程第四步,寫出回歸方程 第二步,求第二步,求 1niiix y21niixxy18例例1 1: 有一個(gè)同學(xué)家開了一個(gè)小賣部,他為了研有一個(gè)同學(xué)家開了一個(gè)小賣部,他為了研究氣溫對(duì)熱飲銷售的影響,經(jīng)過(guò)統(tǒng)計(jì),得到一個(gè)究氣溫對(duì)熱飲銷售的影響,經(jīng)過(guò)統(tǒng)計(jì),得到一個(gè)賣出的飲料杯數(shù)與當(dāng)天氣溫的對(duì)比表:賣出的飲料杯數(shù)與當(dāng)天氣溫的對(duì)比表: (1 1)畫出散點(diǎn)圖;)畫出散點(diǎn)圖;(2 2)從散點(diǎn)圖中發(fā)現(xiàn)氣溫與熱飲杯數(shù)之)從散點(diǎn)圖中發(fā)現(xiàn)氣溫與熱飲杯數(shù)之 間關(guān)系間關(guān)系的一般

12、規(guī)律;的一般規(guī)律;(3 3)求回歸方程;)求回歸方程;(4 4)如果某天的氣溫是)如果某天的氣溫是22,預(yù)測(cè)這天賣出的熱,預(yù)測(cè)這天賣出的熱飲杯數(shù)飲杯數(shù). .19當(dāng)當(dāng)x=2x=2時(shí),時(shí),y=143.063y=143.063. .20例例2 2:假設(shè)某設(shè)備的使用年限x(年)和所支出的維修費(fèi)用y(萬(wàn)元)有如下統(tǒng)計(jì)資料:使用年限使用年限x x( (年年) )2 23 34 45 56 6維修費(fèi)用維修費(fèi)用y y( (萬(wàn)元萬(wàn)元) )2.22.23.83.85.55.56.56.57.07.0由資料知 y對(duì) x呈線性關(guān)系,試求:;,) 1 (的值中的回歸直線方程ababxy(2)估計(jì)使用年限是10年時(shí),維修

13、費(fèi)用估計(jì)是多少?21解解:(1) 制表:制表:i12345合計(jì)合計(jì)xi2345620yi2.23.85.56.57.025xi24916253690 xi yi4.411.422.032.542.0 112.3. 3 .112,90, 5, 4:51512iiiiiyxxyx于是有23. 1103 .1245905453 .1122b08.0423.15xbya22(2) 回歸直線方程是.08. 023. 1xy(2)估計(jì)使用年限是10年時(shí),維修費(fèi)用估計(jì)是多少?)(4 .1238.1208. 01023. 1,10萬(wàn)元時(shí)當(dāng)yx答:估計(jì)使用10年時(shí),維修費(fèi)用估計(jì)是12.4萬(wàn)元。23練習(xí)練習(xí)某種產(chǎn)

14、品是的廣告費(fèi)支出某種產(chǎn)品是的廣告費(fèi)支出x x(單位:百萬(wàn)元)(單位:百萬(wàn)元)與銷售額與銷售額y y(單位:百萬(wàn)元)之間有如下對(duì)(單位:百萬(wàn)元)之間有如下對(duì)應(yīng)數(shù)據(jù)應(yīng)數(shù)據(jù)(1)畫出散點(diǎn)圖;(2)如果x與y具有相關(guān)關(guān)系,求回歸直線方程,并說(shuō)明b的意義24解(1)散點(diǎn)圖如圖所示:1735910305080銷售額(百萬(wàn)元)廣告費(fèi)(百萬(wàn)元)(2)由散點(diǎn)圖可知:X與Y具有相關(guān)關(guān)系515215501380145iiiiixyx yx 51522156.517.55iiiiix yx ybaybxxx故可得:故可得:所求回歸直線方程為6.517.5yxb表示廣告每增加100萬(wàn)元,銷售量平均增加650元25課堂總

15、結(jié)課堂總結(jié)1、兩種相關(guān)關(guān)系:正相關(guān)、負(fù)相關(guān)、兩種相關(guān)關(guān)系:正相關(guān)、負(fù)相關(guān)2、線性回歸方程:、線性回歸方程:回歸直線所在方程的斜率與截距的一般公式回歸直線所在方程的斜率與截距的一般公式: :1122211()(),().nniiiiiinniiiixxyyx ynxybxxxnxaybx ybxaybxa26則 b= ,a= , 1.由一組 5 個(gè)數(shù)據(jù)(xi,yi)算得 4,5,xy211112.3,90,nniiiiix yx回歸方程為 . 1.230.081.230.08yx鞏固練習(xí)鞏固練習(xí):;)()(1221121xbyaxnxyxnyxxxyyxxbniiniiiniiniii,4.75

16、257yx2對(duì)于回歸方程對(duì)于回歸方程 當(dāng)當(dāng)x=28時(shí)時(shí),y的估計(jì)值是的估計(jì)值是39027(0 0),( 0)x,(0 ) y,()x y,3線性回歸方程表示的直線線性回歸方程表示的直線 必定過(guò)()必定過(guò)().22.5yx4 4設(shè)有一個(gè)回歸方程設(shè)有一個(gè)回歸方程, 變量變量x 增加增加1 1個(gè)單位個(gè)單位長(zhǎng)度時(shí),變量長(zhǎng)度時(shí),變量y y()()平均增加平均增加2.5個(gè)單位長(zhǎng)度個(gè)單位長(zhǎng)度 平均增加平均增加0.5個(gè)單位長(zhǎng)度個(gè)單位長(zhǎng)度平均減少平均減少2.5個(gè)單位長(zhǎng)度個(gè)單位長(zhǎng)度 平均減少平均減少0.5個(gè)單位長(zhǎng)度個(gè)單位長(zhǎng)度yabxDC28思考思考:根據(jù)最小二乘法的知識(shí)根據(jù)最小二乘法的知識(shí),我們對(duì)于任何數(shù)我們對(duì)于

17、任何數(shù)據(jù)都可以利用最小二乘計(jì)算出其回歸方據(jù)都可以利用最小二乘計(jì)算出其回歸方程程,問(wèn)問(wèn):是否所有的問(wèn)題是否所有的問(wèn)題,我們都可以利我們都可以利用最小二乘來(lái)估計(jì)用最小二乘來(lái)估計(jì)?下面的數(shù)據(jù)給定了兩個(gè)變量之間的關(guān)系下面的數(shù)據(jù)給定了兩個(gè)變量之間的關(guān)系X12345678Y1491625364964請(qǐng)利用最小二乘法求出這兩個(gè)變量之間的線性回歸方程請(qǐng)利用最小二乘法求出這兩個(gè)變量之間的線性回歸方程29解解根據(jù)數(shù)據(jù)顯示:根據(jù)數(shù)據(jù)顯示:5 .25, 5 . 4yx其他數(shù)據(jù)如表其他數(shù)據(jù)如表1296512343216125642781204644936251694120464493625169413687654321合計(jì)合計(jì)iiyxiy2ixix進(jìn)而可以求得進(jìn)而可以求得b=9a=-15于是,線性回歸方程為:于是,線性回歸方程為: Y=-15+9x30事實(shí)上,從表中的數(shù)據(jù)可以看出:事實(shí)上,從表中的數(shù)據(jù)可以看出:2xy 從而我們利用最小二乘估計(jì)時(shí),已經(jīng)失去從而我們利用最小二乘

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論