變量間的相關關系_第1頁
變量間的相關關系_第2頁
變量間的相關關系_第3頁
變量間的相關關系_第4頁
變量間的相關關系_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2.3.1-2小明小明,你數(shù)學成績不太好你數(shù)學成績不太好,物理怎么樣物理怎么樣?也不太好啊也不太好啊.學不好數(shù)學學不好數(shù)學,物理物理也是學不好的也是學不好的?.你認為老師的說法對嗎你認為老師的說法對嗎?數(shù)學數(shù)學成績成績學習學習興趣興趣花費花費時間時間其他其他因素因素商品銷售收入商品銷售收入廣告支出經(jīng)費廣告支出經(jīng)費?糧食產(chǎn)量糧食產(chǎn)量施肥量施肥量?付出付出收入收入?人體脂肪含量人體脂肪含量年齡年齡?相關關系相關關系當自變量取值一定當自變量取值一定,因變量的因變量的取值帶有一定的隨機性(取值帶有一定的隨機性( 非確定性關系非確定性關系)函數(shù)關系函數(shù)關系-函數(shù)關系指的是自變量和因函數(shù)關系指的是自變量和

2、因變量之間的關系是確定的變量之間的關系是確定的.注:相關關系和函數(shù)關系的異同點注:相關關系和函數(shù)關系的異同點相同點:兩者均是指兩個變量間的關系相同點:兩者均是指兩個變量間的關系不同點:函數(shù)關系是一種確定關系,不同點:函數(shù)關系是一種確定關系, 相關關系是一種非確定的關系。相關關系是一種非確定的關系。對相關關系的理解對相關關系的理解1:下列兩變量中具有相關關系的是(:下列兩變量中具有相關關系的是( )A角度和它的余弦值角度和它的余弦值 B正方形的邊長和面積正方形的邊長和面積C成人的身高和視力成人的身高和視力 D 身高和體重身高和體重D練習:練習:1.下列關系中下列關系中,是帶有隨機性相關關系的是是

3、帶有隨機性相關關系的是 .正方形的邊長與面積的關系正方形的邊長與面積的關系;水稻產(chǎn)量與施肥量之間的關系水稻產(chǎn)量與施肥量之間的關系;人的身高與年齡之間的關系人的身高與年齡之間的關系;降雪量與交通事故發(fā)生之間的關系降雪量與交通事故發(fā)生之間的關系.即學即練即學即練: :2. 下列兩個變量之間的關系哪個不是函數(shù)關系下列兩個變量之間的關系哪個不是函數(shù)關系()()A角度和它的余弦值角度和它的余弦值B. 正方形邊長和面積正方形邊長和面積C正邊形的邊數(shù)和它的內角和正邊形的邊數(shù)和它的內角和 D. 人的年齡和身高人的年齡和身高D注意:注意:兩個變量之間的關系具兩個變量之間的關系具有確定性關系有確定性關系函數(shù)關函數(shù)

4、關系系. .兩個變量變量之間的關兩個變量變量之間的關系具有隨機性,不確定系具有隨機性,不確定性性相關關系相關關系. .2.下列兩變量中具有相關關系的是(下列兩變量中具有相關關系的是( ) 正方形的邊長與面積之間的關系正方形的邊長與面積之間的關系 水稻產(chǎn)量與施肥量之間的關系水稻產(chǎn)量與施肥量之間的關系 人的身高與年齡之間的關系人的身高與年齡之間的關系 降雪量與交通事故的發(fā)生率之間的關系降雪量與交通事故的發(fā)生率之間的關系 以上種種問題中的兩個變量之間的相關關系以上種種問題中的兩個變量之間的相關關系,我們都可以根據(jù)自己的生活我們都可以根據(jù)自己的生活,學習經(jīng)驗作出相應學習經(jīng)驗作出相應的判斷的判斷,“規(guī)律

5、是經(jīng)驗的總結規(guī)律是經(jīng)驗的總結”,不管你多有經(jīng)驗不管你多有經(jīng)驗,只憑經(jīng)驗辦事只憑經(jīng)驗辦事,還是很容易出錯的還是很容易出錯的,因此在尋找因此在尋找變量間的相關關系時變量間的相關關系時,我們需要一些更為科學的我們需要一些更為科學的方法來說明問題方法來說明問題. 在尋找變量間的相關關系時在尋找變量間的相關關系時,統(tǒng)計統(tǒng)計同樣發(fā)揮同樣發(fā)揮了非常重要的作用了非常重要的作用,我們是通過收集大量的數(shù)我們是通過收集大量的數(shù)據(jù)據(jù),對數(shù)據(jù)進行統(tǒng)計分析的基礎上對數(shù)據(jù)進行統(tǒng)計分析的基礎上,發(fā)現(xiàn)其中的發(fā)現(xiàn)其中的規(guī)律規(guī)律,才能對它們之間的關系作出判斷才能對它們之間的關系作出判斷.下面我下面我們通過具體的例子來分析們通過具體

6、的例子來分析【問題問題】在一次對人體脂肪含量和年齡關系在一次對人體脂肪含量和年齡關系的研究中,研究人員獲得了一組樣本數(shù)據(jù):的研究中,研究人員獲得了一組樣本數(shù)據(jù):其中各年齡對應的脂肪數(shù)據(jù)是這個年齡人群其中各年齡對應的脂肪數(shù)據(jù)是這個年齡人群脂肪含量的樣本平均數(shù)脂肪含量的樣本平均數(shù). .年齡年齡 2323272739394141454549495050脂肪脂肪 9.59.517.817.8 21.221.2 25.925.9 27.527.5 26.326.3 28.228.2年齡年齡 5353545456565757585860606161脂肪脂肪 29.629.6 30.230.2 31.431

7、.4 30.830.8 33.533.5 35.235.2 34.634.6根據(jù)上述數(shù)據(jù),人體的脂肪含量與年齡之間根據(jù)上述數(shù)據(jù),人體的脂肪含量與年齡之間有怎樣的關系?有怎樣的關系?思考思考1 1:對某一個人來說,他的體內脂肪含對某一個人來說,他的體內脂肪含量不一定隨年齡增長而增加或減少,但是如量不一定隨年齡增長而增加或減少,但是如果把很多個體放在一起,就可能表現(xiàn)出一定果把很多個體放在一起,就可能表現(xiàn)出一定的規(guī)律性的規(guī)律性. .觀察上表中的數(shù)據(jù),大體上看,觀察上表中的數(shù)據(jù),大體上看,隨著年齡的增加,人體脂肪含量怎樣變化?隨著年齡的增加,人體脂肪含量怎樣變化?年齡年齡 23232727393941

8、41454549495050脂肪脂肪 9.59.517.817.8 21.221.2 25.925.9 27.527.5 26.326.3 28.228.2年齡年齡 5353545456565757585860606161脂肪脂肪 29.629.6 30.230.2 31.431.4 30.830.8 33.533.5 35.235.2 34.634.6思考思考2 2:為了確定年齡和人體脂肪含量之間的為了確定年齡和人體脂肪含量之間的更明確的關系,我們需要對數(shù)據(jù)進行分析,更明確的關系,我們需要對數(shù)據(jù)進行分析,通過作圖可以對兩個變量之間的關系有一個通過作圖可以對兩個變量之間的關系有一個直觀的印象直

9、觀的印象. .以以x x軸表示年齡,軸表示年齡,y y軸表示脂肪含軸表示脂肪含量,量,你能在直角坐標系中描出樣本數(shù)據(jù)對應你能在直角坐標系中描出樣本數(shù)據(jù)對應的圖形嗎?的圖形嗎? 年齡年齡 2323272739394141454549495050脂肪脂肪 9.59.517.817.8 21.221.2 25.925.9 27.527.5 26.326.3 28.228.2年齡年齡 5353545456565757585860606161脂肪脂肪 29.629.6 30.230.2 31.431.4 30.830.8 33.533.5 35.235.2 34.634.6思考思考3 3:上圖叫做上圖叫

10、做散點圖散點圖,你能描述一下散,你能描述一下散點圖的含義嗎?點圖的含義嗎? 在平面直角坐標系中,表示具有相關關系在平面直角坐標系中,表示具有相關關系的兩個變量的一組數(shù)據(jù)圖形,稱為散點圖的兩個變量的一組數(shù)據(jù)圖形,稱為散點圖. . 散點圖散點圖3).3).如果所有的樣本點都落在某一如果所有的樣本點都落在某一直線附近直線附近,變量之間就有變量之間就有線性相關關系線性相關關系 . .1).1).如果所有的樣本點都落在某一如果所有的樣本點都落在某一函數(shù)曲線上函數(shù)曲線上, ,就用該函數(shù)來描述變量之間的關系,即變量之就用該函數(shù)來描述變量之間的關系,即變量之間具有間具有函數(shù)關系函數(shù)關系2).2).如果所有的樣

11、本點都落在某一如果所有的樣本點都落在某一函數(shù)曲線附近函數(shù)曲線附近, ,變量之間就有變量之間就有相關關系相關關系。說明說明散點圖散點圖:用來判斷兩個變量是否具有相關關系用來判斷兩個變量是否具有相關關系.觀察散點圖的大致趨勢,觀察散點圖的大致趨勢, 兩個變量的兩個變量的散點圖散點圖中中點的分布的位置是從左下角到右上角的區(qū)域,點的分布的位置是從左下角到右上角的區(qū)域,我們稱這種相關關系為我們稱這種相關關系為正相關。正相關。思考思考4 4:如果兩個變量成如果兩個變量成負相關負相關,從整體上看這兩,從整體上看這兩個變量的變化趨勢如何?其散點圖有什么特點?個變量的變化趨勢如何?其散點圖有什么特點? 散點圖中

12、的點散布在從左上角到右下角的區(qū)域散點圖中的點散布在從左上角到右下角的區(qū)域. .思考思考5 5:你能列舉一些生活中的變量成正你能列舉一些生活中的變量成正相關或負相關的實例嗎相關或負相關的實例嗎? ? 如高原含氧量與海拔高度如高原含氧量與海拔高度的相關關系,海平面以上,的相關關系,海平面以上,海拔高度越高,含氧量越海拔高度越高,含氧量越少。少。 作出散點圖發(fā)現(xiàn),它們散作出散點圖發(fā)現(xiàn),它們散布在從左上角到右下角的區(qū)布在從左上角到右下角的區(qū)域內。又如汽車的載重和汽域內。又如汽車的載重和汽車每消耗車每消耗1升汽油所行使的升汽油所行使的平均路程,稱它們成平均路程,稱它們成負相關負相關.O2.下列關系屬于負

13、相關關系的是(下列關系屬于負相關關系的是( )A.父母的身高與子女的身高父母的身高與子女的身高B.農作物產(chǎn)量與施肥的關系農作物產(chǎn)量與施肥的關系C.吸煙與健康的關系吸煙與健康的關系D.數(shù)學成績與物理成績的關系數(shù)學成績與物理成績的關系C C練習:練習:思考思考1 1:當人的年齡增加時,體內脂肪含量也增加,當人的年齡增加時,體內脂肪含量也增加,那么它到底是以什么方式增加的呢?我們觀察年那么它到底是以什么方式增加的呢?我們觀察年齡和人體脂肪含量的樣本數(shù)據(jù)的散點圖中的點的齡和人體脂肪含量的樣本數(shù)據(jù)的散點圖中的點的分布有什么特點?分布有什么特點? 這些點大致分布在一條直線附近,我們稱這兩個變這些點大致分布

14、在一條直線附近,我們稱這兩個變量之間具有量之間具有線性相關關系線性相關關系,這條直線叫做,這條直線叫做知識探究(二):回歸直線知識探究(二):回歸直線 ( , )x y回歸直線回歸直線 實際上實際上,求回歸直線的關鍵是如何用數(shù)學的方法求回歸直線的關鍵是如何用數(shù)學的方法來刻畫來刻畫“從整體上看從整體上看,各點到此直線的距離最小各點到此直線的距離最小”. 如果我們能求出這條回歸直線的方程,如果我們能求出這條回歸直線的方程,那么我們就可以清楚地了解年齡與體內脂肪那么我們就可以清楚地了解年齡與體內脂肪含量的相關性,那么怎樣求出這個回歸方程含量的相關性,那么怎樣求出這個回歸方程呢?呢?ybxa儋=+一般

15、地我們將其方程設為 ,其中這種求法叫其中xy尖叫1122211()(),()nniiiiiinniiiixxyyx yn xybxxxn xayb xaxby例例2 某車間為了規(guī)定工時定額某車間為了規(guī)定工時定額,需要確定加工需要確定加工零件所花費的時間零件所花費的時間,為此做了四次試驗為此做了四次試驗,根據(jù)試根據(jù)試驗數(shù)據(jù)得到如下圖所示的散點圖驗數(shù)據(jù)得到如下圖所示的散點圖,其中其中x表示零表示零件的個數(shù)件的個數(shù),y表示加工時間表示加工時間. (1)求出求出y關于關于x的線性的線性 回歸方程回歸方程 =bx+a; (2)試預測加工試預測加工10個零個零 件需多長時間?件需多長時間? y (1) =

16、 =3.5, = =3.5,所以所以b= =0.7,a=3.5-0.73.5=1.05,所以線性回歸方程為所以線性回歸方程為 =0.7x+1.05.45 . 4435 . 223454 y4122144iiiniix yxyxx2222222 2.53 34 45 4.54 3.523454 3.5 yx(2)當當x=10時,時, =0.710+1.05=8.05,故加工故加工10個零件大約需個零件大約需8.05小時小時. 求出回歸直線方程后,往求出回歸直線方程后,往往用來作為現(xiàn)實生產(chǎn)中的變量之往用來作為現(xiàn)實生產(chǎn)中的變量之間相關關系的近似關系,從而可間相關關系的近似關系,從而可用來指導生產(chǎn)實踐

17、用來指導生產(chǎn)實踐. y 三、回歸直線三、回歸直線 年齡年齡 2323272739394141454549495050脂肪脂肪 9.59.517.817.8 21.221.2 25.925.9 27.527.5 26.326.3 28.228.2年齡年齡 5353545456565757585860606161脂肪脂肪 29.629.6 30.230.2 31.431.4 30.830.8 33.533.5 35.235.2 34.634.6整體上最接近整體上最接近 采用測量的方法:先畫一條直線,測采用測量的方法:先畫一條直線,測量出各點到它的距離,然后移動直線,到達一量出各點到它的距離,然后移

18、動直線,到達一個使距離之和最小的位置,測量出此時直線的個使距離之和最小的位置,測量出此時直線的斜率和截距,就得到回歸方程。斜率和截距,就得到回歸方程。四、如何具體的求出這個回歸方程呢?四、如何具體的求出這個回歸方程呢? 在圖中選取兩點畫直線,使得直線在圖中選取兩點畫直線,使得直線兩側的點的個數(shù)基本相同。兩側的點的個數(shù)基本相同。脂肪010203040020406080脂肪四、如何具體的求出這個回歸方程呢?四、如何具體的求出這個回歸方程呢? 在散點圖中多取幾組點,確定幾條直線的在散點圖中多取幾組點,確定幾條直線的方程,分別求出各條直線的斜率和截距的平均數(shù),方程,分別求出各條直線的斜率和截距的平均數(shù)

19、,將這兩個平均數(shù)作為回歸方程的斜率和截距。將這兩個平均數(shù)作為回歸方程的斜率和截距。脂肪010203040020406080脂肪四、如何具體的求出這個回歸方程呢?四、如何具體的求出這個回歸方程呢?上述三種方案均有一定的道理,但可靠性不強,上述三種方案均有一定的道理,但可靠性不強,我們回到回歸直線的定義。我們回到回歸直線的定義。求回歸方程的關鍵是如何用數(shù)學的方法來刻畫求回歸方程的關鍵是如何用數(shù)學的方法來刻畫“從整體上看,各點與直線的偏差最小從整體上看,各點與直線的偏差最小”。如果散點圖中點的分布如果散點圖中點的分布從整體上看從整體上看大致在一條直線附近,大致在一條直線附近,我們就稱這兩個變量之間具

20、有我們就稱這兩個變量之間具有線性相關關系線性相關關系,這條直線,這條直線就叫做就叫做回歸直線回歸直線。思考思考6 6:對一組具有線性相關關系的樣本數(shù)據(jù):對一組具有線性相關關系的樣本數(shù)據(jù):(x(x1 1,y y1 1) ),(x(x2 2,y y2 2) ),(x(xn n,y yn n) ),設其回歸,設其回歸方程為方程為 可以用哪些數(shù)量關系來刻畫可以用哪些數(shù)量關系來刻畫各樣本點與回歸直線的接近程度?各樣本點與回歸直線的接近程度? 這樣的方法叫做最小二乘法這樣的方法叫做最小二乘法.計算回歸方程的斜率與截距的一般公式計算回歸方程的斜率與截距的一般公式:xbyaxnxyxnxxxyyxxbniin

21、iiiniiniiiy,)()(1221121,10, 5 yx,292,584121 niiniiixyx20y=2x思考思考7 7:利用利用計算器或計算機計算器或計算機可求得年齡和可求得年齡和人體脂肪含量的樣本數(shù)據(jù)的回歸方程為人體脂肪含量的樣本數(shù)據(jù)的回歸方程為 ,由此我們可以根據(jù),由此我們可以根據(jù)一個人個年齡預測其體內脂肪含量的百分一個人個年齡預測其體內脂肪含量的百分比的比的回歸值回歸值. .若某人若某人6565歲,則其體內脂肪含歲,則其體內脂肪含量的百分比量的百分比約約為多少?為多少?0. 5770. 448yx=-37.1(0.57765-0.448= 37.1)若某人若某人6565歲

22、,可預測他體內脂肪含量在歲,可預測他體內脂肪含量在37.137.1(0.5770.57765-0.448= 37.165-0.448= 37.1)附近的可能性比較)附近的可能性比較大。大。 但不能說他體內脂肪含量一定是但不能說他體內脂肪含量一定是37.137.1原因原因:線性回歸方程中的截距和斜率都是通過樣:線性回歸方程中的截距和斜率都是通過樣本本估計的估計的,存在隨機誤差,這種誤差可以導致預,存在隨機誤差,這種誤差可以導致預測結果的偏差,即使截距斜率沒有誤差,也不可測結果的偏差,即使截距斜率沒有誤差,也不可能百分百地保證對應于能百分百地保證對應于x x,預報值,預報值Y Y能等于實際值能等于

23、實際值y y練習練習:給出施化肥量對水稻產(chǎn)量影響的給出施化肥量對水稻產(chǎn)量影響的試驗數(shù)據(jù):試驗數(shù)據(jù):施化肥施化肥量量x15202530354045水稻產(chǎn)水稻產(chǎn)量量y330 345 365 405 445 450 455(1)(1)畫出上表的散點圖畫出上表的散點圖; ;(2)(2)求出回歸直線并且畫出圖形求出回歸直線并且畫出圖形. . 從而得回歸直線方程是從而得回歸直線方程是 3 .399,30yx777221117000,1132725,87175iiiiiiixyx y2573075. 43 .399,75. 430770003 .399307871752ab4.75257yx解:解:(1)(

24、1)散點圖(略)散點圖(略)(2)(2)表中的數(shù)據(jù)進行具體計算,列成以下表格表中的數(shù)據(jù)進行具體計算,列成以下表格20475180001557512150912569004950 xiyi455450445405365345330yi45403530252015xi7654321i( (圖形略圖形略) )故可得到故可得到二、求線性回歸方程二、求線性回歸方程例例2:觀察兩相關變量得如下表:觀察兩相關變量得如下表:x-1-2-3-4-553421y-9-7-5-3-115379求兩變量間的回歸方程求兩變量間的回歸方程解解1: 列表:列表:i12345678910-1-2-3-4-553421-9-7

25、-5-3-1153799141512551512149xiyixiyi計算得計算得:0, 0 yx110,1101011012yxxiiiii1010110010110101010122101iiiiixxyxyxb000bxbya小結小結1.1.求樣本數(shù)據(jù)的線性回歸方程,可按求樣本數(shù)據(jù)的線性回歸方程,可按下列步驟進行:下列步驟進行:第一步,列表計算平均數(shù)第一步,列表計算平均數(shù) , xy1niiix y21niix第二步,求和第二步,求和 , 1122211()(),()nniii iiinniiiixx yyxynx ybay bxxxxnx 第三步,計算第三步,計算 第四步,寫出回歸方程第

26、四步,寫出回歸方程 3.某裝飾品的廣告費投入某裝飾品的廣告費投入x(單位單位:萬元萬元)與銷售與銷售y(單位單位:萬元萬元)之間有如下表所示的對應數(shù)據(jù):之間有如下表所示的對應數(shù)據(jù): 則回歸直線方程為則回歸直線方程為( )x34567y4060657570AA. =7.5x+24.5 B. =7.5x-24.5C. =-7.5x+24.5 D. =-7.5x-24.5 通過公式通過公式b= , ,a= - b,求之求之.xy1221niiiniix ynxyxnx y y y y2.2.回歸方程被樣本數(shù)據(jù)惟一確定,各樣本點回歸方程被樣本數(shù)據(jù)惟一確定,各樣本點大致分布在回歸直線附近大致分布在回歸直

27、線附近. .對同一個總體,對同一個總體,不同的樣本數(shù)據(jù)對應不同的回歸直線,所以不同的樣本數(shù)據(jù)對應不同的回歸直線,所以回歸直線也具有隨機性回歸直線也具有隨機性. . 3.3.對于任意一組樣本數(shù)據(jù),利用上述公式都對于任意一組樣本數(shù)據(jù),利用上述公式都可以求得可以求得“回歸方程回歸方程”,如果這組數(shù)據(jù)不具,如果這組數(shù)據(jù)不具有線性相關關系,即不存在回歸直線,那么有線性相關關系,即不存在回歸直線,那么所得的所得的“回歸方程回歸方程”是沒有實際意義的是沒有實際意義的. .因此,因此,對一組樣本數(shù)據(jù),應先作散點圖,在具有線對一組樣本數(shù)據(jù),應先作散點圖,在具有線性相關關系的前提下再求回歸方程性相關關系的前提下再

28、求回歸方程. .練習練習:根據(jù)下表根據(jù)下表,求回歸方程求回歸方程.1、列表、列表2、代入公式計算、代入公式計算3、寫出回歸直線方程、寫出回歸直線方程2.2.回歸直線方程回歸直線方程 (1 1)回歸直線:觀察散點圖的特征,如)回歸直線:觀察散點圖的特征,如果各點大致分布在一條直線的附近,就稱果各點大致分布在一條直線的附近,就稱兩個變量之間具有線性相關的關系,這條兩個變量之間具有線性相關的關系,這條直線叫做回歸直線直線叫做回歸直線. .(2 2)最小二乘法)最小二乘法. .A.A.定義;定義;B.B.正相關、負相關正相關、負相關. .1.1.散點圖散點圖 小結小結總結總結基礎知識框圖表解基礎知識框圖表解變量間關系變量間關系函數(shù)關系函數(shù)關系相關關系相關關系 散點圖散點圖線形回歸線形回歸線形回歸方程線形回歸方程1 1、相關關系、相關關系 (1 1)概念:自變量取值一定時,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論