必修三課件232變量之間的相關關系_第1頁
必修三課件232變量之間的相關關系_第2頁
必修三課件232變量之間的相關關系_第3頁
必修三課件232變量之間的相關關系_第4頁
必修三課件232變量之間的相關關系_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、基礎知識框圖表解基礎知識框圖表解變量間關系變量間關系函數(shù)關系函數(shù)關系相關關系相關關系 散點圖散點圖線形相關線形相關線形回歸方程線形回歸方程如果散點圖中點的分布如果散點圖中點的分布從從整體整體上看上看大致在大致在一條直線附近,我們就稱這兩個變量之間一條直線附近,我們就稱這兩個變量之間具有具有線性相關線性相關關系,這條直線就叫做關系,這條直線就叫做回歸回歸直線直線?;貧w直線的方程,簡稱為回歸直線的方程,簡稱為回歸方程回歸方程。二、回歸直線二、回歸直線 O45 50 55606520 25 30 35 40年齡年齡脂肪含量脂肪含量5101520253035401. 所有的樣本點都落在某一函數(shù)所有的樣

2、本點都落在某一函數(shù)曲線上曲線上,變量之,變量之間具有間具有函數(shù)關系函數(shù)關系2. 所有的樣本點都落在某一所有的樣本點都落在某一直線附近直線附近,變量之間,變量之間就有就有線性相關線性相關關系關系散點圖散點圖中的點呈中的點呈條狀集中條狀集中在某一直在某一直線周圍,兩個變量之間具有線周圍,兩個變量之間具有線性關系線性關系,(正正線性相關或線性相關或負負線性相關),才可線性相關),才可以用回歸直線來描述兩個變量之間的以用回歸直線來描述兩個變量之間的關系關系三、如何具體的求出這個回歸方程呢?三、如何具體的求出這個回歸方程呢?O45 50 55606520 25 30 35 40年齡年齡脂肪含量脂肪含量5

3、10152025303540求回歸方程的關鍵是求回歸方程的關鍵是 “從整體上看,各從整體上看,各點與直線的偏差最小點與直線的偏差最小”。思考:思考:對一組具有線性相關關系的樣對一組具有線性相關關系的樣本數(shù)據(jù):本數(shù)據(jù):(x(x1 1,y y1 1) ),(x(x2 2,y y2 2) ),(x(xn n,y yn n) ),設其回歸方程為,設其回歸方程為 可以用哪些數(shù)量關系來刻畫各樣本點可以用哪些數(shù)量關系來刻畫各樣本點與回歸直線的接近程度?與回歸直線的接近程度? abxy設已經(jīng)得到具有線性相關關系的變量的一組數(shù)據(jù):(設已經(jīng)得到具有線性相關關系的變量的一組數(shù)據(jù):(x x1 1,y y1 1),()

4、,(x x2 2,y y2 2),),(,(x xn n,y yn n)設所求的回歸直線方程為設所求的回歸直線方程為 其中其中a a,b b是待定是待定的系數(shù)。當變量的系數(shù)。當變量x x取取x x1 1,x x2 2,x xn n時,可以得到時,可以得到 (i=1i=1,2 2,n n)它與實際收集得到的它與實際收集得到的 之間偏差是之間偏差是 (i=1i=1,2 2,n n)探索過程如下:探索過程如下:這樣,用這這樣,用這n n個偏差的和來個偏差的和來刻畫刻畫“各點與此直線的整體各點與此直線的整體偏差偏差”是比較合適的。是比較合適的。(x1, y1)(x2,y2)(xi,yi)(xn,yn)

5、abxyabxyii)(abxyiyyiiiiy的最小值21)(iyynii當當a,b取什么值時,取什么值時,Q的值最小,即總體偏差最小的值最小,即總體偏差最小2222211)abxyabxyabxyQnn (的最小值)(1iyynii的最小值|1iyynii根據(jù)有關數(shù)學原理分析,當根據(jù)有關數(shù)學原理分析,當 時,總體偏差時,總體偏差 為最小,這樣為最小,這樣就得到了回歸方程,這種求回歸方程的方法叫做就得到了回歸方程,這種求回歸方程的方法叫做最小二乘法最小二乘法. .21()niiiQyy xbyaxnxyxnyxxxyyxxbniiniiiniiniii,)()(1221121(其中,(其中,

6、b是回歸方程的斜率,是回歸方程的斜率,a是截距)是截距)abxy估計值樣本數(shù)值yx0.57765-0.448= 37.1思考:思考:利用計算機可求得年齡和人體脂肪利用計算機可求得年齡和人體脂肪含量的樣本數(shù)據(jù)的回歸方程為含量的樣本數(shù)據(jù)的回歸方程為 由此我們可以根據(jù)一個人的年齡預測其體由此我們可以根據(jù)一個人的年齡預測其體內(nèi)脂肪含量的百分比的內(nèi)脂肪含量的百分比的回歸值回歸值. .若某人若某人6565歲,歲,則其體內(nèi)脂肪含量的百分比則其體內(nèi)脂肪含量的百分比約約為多少?為多少?448. 0577. 0 xy能不能說他體內(nèi)脂肪含量一定是能不能說他體內(nèi)脂肪含量一定是37.1?若某人若某人6565歲,可預測他

7、體內(nèi)脂肪含量在歲,可預測他體內(nèi)脂肪含量在37.137.1(0.5770.57765-0.448= 37.165-0.448= 37.1)附近的可能性比較大。但不能說他體內(nèi)附近的可能性比較大。但不能說他體內(nèi)脂肪含量一定是脂肪含量一定是37.137.1原因:線性回歸方程中的原因:線性回歸方程中的截距截距和和斜率斜率都都是通過樣本是通過樣本估計的估計的,存在隨機誤差,對,存在隨機誤差,對應于應于x x,預報值,預報值 不可能等于實際值不可能等于實際值y yy例例1、某廠降耗技術發(fā)行后生產(chǎn)甲產(chǎn)品過程中記錄某廠降耗技術發(fā)行后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量的產(chǎn)量(噸噸)與相應的生產(chǎn)能耗與相應的生產(chǎn)能耗y(噸標

8、準煤噸標準煤)的幾組對的幾組對應數(shù)據(jù)應數(shù)據(jù).X 3 4 5 6 y 2.5 3 4 4.5(1)畫出上表數(shù)據(jù)的散點圖;)畫出上表數(shù)據(jù)的散點圖;(2)根據(jù)提供的數(shù)據(jù),用最小二乘法求出)根據(jù)提供的數(shù)據(jù),用最小二乘法求出y關于關于x的線性回歸方程的線性回歸方程(3)已知該廠技改前)已知該廠技改前100噸甲產(chǎn)品的生產(chǎn)能耗為噸甲產(chǎn)品的生產(chǎn)能耗為90噸標準煤,根據(jù)(噸標準煤,根據(jù)(2)求出的線性回歸方程,預)求出的線性回歸方程,預測生產(chǎn)測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標準煤?噸標準煤?(參考數(shù)值:(參考數(shù)值:32.5+43+54+64.566.5)4166

9、.5iiiX Y4222221345686iiX4.5X 3.5Y 266.54 4.5 3.566.5630.7864 4.58681b 3.50.7 4.50.35aYbX所求的回歸方程為所求的回歸方程為 0.70.35yx(2)解:)解:100 x (3)100 0.70.3570.35y 預測生產(chǎn)預測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低低 (噸噸) 9070.3519.65例例2 2、一個小賣部,為了研究氣溫對熱飲銷售的影一個小賣部,為了研究氣溫對熱飲銷售的影響,經(jīng)統(tǒng)計,得到一個賣出的熱飲杯數(shù)與當天氣響,經(jīng)統(tǒng)計,得到一個賣出的熱飲杯數(shù)與當天氣溫的對比表:

10、溫的對比表:1 1、畫出散點圖;、畫出散點圖;2 2、從散點圖中發(fā)現(xiàn)氣溫與熱飲、從散點圖中發(fā)現(xiàn)氣溫與熱飲銷售杯數(shù)之間關系的一般規(guī)律;銷售杯數(shù)之間關系的一般規(guī)律;3 3、求回歸方程;、求回歸方程;4 4、如果某天的氣溫是、如果某天的氣溫是2 2攝氏度,攝氏度,預測這天賣出的熱飲杯數(shù)。預測這天賣出的熱飲杯數(shù)。圖3-1050100150200-2002040熱飲杯數(shù)1、散點圖散點圖2 2、各點散布在從左上角到右下角的區(qū)域里,氣溫與熱飲各點散布在從左上角到右下角的區(qū)域里,氣溫與熱飲銷售杯數(shù)之間成負相關,即氣溫越高,賣出去的熱飲杯數(shù)銷售杯數(shù)之間成負相關,即氣溫越高,賣出去的熱飲杯數(shù)越少。越少。3 3、從

11、散點圖可以看出,這些點大致分布在一條直線的附從散點圖可以看出,這些點大致分布在一條直線的附近,因此利用公式近,因此利用公式1 1求出回歸方程的系數(shù)。求出回歸方程的系數(shù)。Y= -Y= -2.352x+147.7672.352x+147.7674 4、當當x=2x=2時,時,Y=143.063 Y=143.063 因此,某天的氣溫為因此,某天的氣溫為2 2攝氏度攝氏度時,這天大約可以賣出時,這天大約可以賣出143143杯熱飲。杯熱飲。本節(jié)重點知識回顧本節(jié)重點知識回顧1 1、相關關系、相關關系 (1 1)概念:自變量取值一定時,因變量的取值帶有一概念:自變量取值一定時,因變量的取值帶有一定隨機性,兩

12、個變量之間的關系叫相關關系。定隨機性,兩個變量之間的關系叫相關關系。 (2 2)相關關系與函數(shù)關系的異同點。相關關系與函數(shù)關系的異同點。 相同點:兩者均是指兩個變量間的關系。相同點:兩者均是指兩個變量間的關系。 不同點:函數(shù)關系是一種確定關系;相關關系是一種不同點:函數(shù)關系是一種確定關系;相關關系是一種非確定的關系,是伴隨關系。非確定的關系,是伴隨關系。 (3 3)相關關系的分析方向。相關關系的分析方向。 在在收集收集大量數(shù)據(jù)大量數(shù)據(jù)的基礎上,利用統(tǒng)計分析,發(fā)現(xiàn)規(guī)律,的基礎上,利用統(tǒng)計分析,發(fā)現(xiàn)規(guī)律,對它們的關系作出判斷。對它們的關系作出判斷。2、兩個變量的線性相關、兩個變量的線性相關 (1

13、1)回歸分析)回歸分析回歸分析是尋找相關關系中非確定關系的某種確定性。回歸分析是尋找相關關系中非確定關系的某種確定性。 (2 2)散點圖)散點圖 A A、定義;、定義;B B、正相關、負相關。、正相關、負相關。 3 3、回歸直線方程、回歸直線方程 注注: :如果關于兩個變量統(tǒng)計數(shù)據(jù)的散點圖呈現(xiàn)如果關于兩個變量統(tǒng)計數(shù)據(jù)的散點圖呈現(xiàn)發(fā)散狀發(fā)散狀, ,則則這兩個變量之間這兩個變量之間不具有不具有相關關系相關關系. .3 3、回歸直線方程、回歸直線方程 (1 1)回歸直線:觀察散點圖的特征,如果各點大致分)回歸直線:觀察散點圖的特征,如果各點大致分布在一條直線的附近,就稱兩個變量之間具有線性相關的布在

14、一條直線的附近,就稱兩個變量之間具有線性相關的關系,這條直線叫做回歸直線。關系,這條直線叫做回歸直線。(2 2)最小二乘法)最小二乘法nn( x- x ) ( y- y )xy- n x yiiiii = 1i = 1b =,nn222( x- x )x- n xiii = 1i = 1a = y - b x .nn11x =x, y =y.iinni = 1i = 1其其中中 yb xa(3)(3)利用回歸直線對總體進行估計利用回歸直線對總體進行估計練習練習1 1、 觀察兩相關量得如下數(shù)據(jù)觀察兩相關量得如下數(shù)據(jù): :101022110,0,110,330,110.iiiiiixyyyxx求兩

15、變量間的回歸方程求兩變量間的回歸方程. .解:列表:解:列表:計算得:計算得:1011022110110100111010010iiiiixybyxxx000aybxb .yx所求回歸直線方程為所求回歸直線方程為練習練習2、:給出施化肥量對水稻產(chǎn)量給出施化肥量對水稻產(chǎn)量影響的試驗數(shù)據(jù):影響的試驗數(shù)據(jù):施化肥施化肥量量x15202530354045水稻產(chǎn)水稻產(chǎn)量量y330 345 365 405 445 450 455(1)(1)畫出上表的散點圖畫出上表的散點圖; ;(2)(2)求出回歸直線并且畫出圖形求出回歸直線并且畫出圖形. . 從而得回歸直線方程是從而得回歸直線方程是 3 .399,30y

16、x777221117000,1132725,87175iiiiiiixyx y2573075. 43 .399,75. 430770003 .399307871752ab4.75257yx解:解:(1)(1)散點圖(略)散點圖(略)(2)(2)表中的數(shù)據(jù)進行具體計算,列成以下表格表中的數(shù)據(jù)進行具體計算,列成以下表格20475180001557512150912569004950 xiyi455450445405365345330yi45403530252015xi7654321i( (圖形略圖形略) )故可得到故可得到利用回歸直線方程對總體進行估計利用回歸直線方程對總體進行估計練習:練習:煉鋼

17、是氧化降碳的過程,煉鋼是氧化降碳的過程,如果已測得爐料如果已測得爐料熔化完畢時,鋼水的含碳量熔化完畢時,鋼水的含碳量X與冶煉時間與冶煉時間y的一列的一列數(shù)據(jù),如下表所示:數(shù)據(jù),如下表所示:(1 1)作出散點圖,找規(guī)律。)作出散點圖,找規(guī)律。(2 2)求回歸直線方程。)求回歸直線方程。(3 3)預測當鋼水含碳量為)預測當鋼水含碳量為160160時,應冶時,應冶煉多少分鐘?煉多少分鐘? 解解: (1) : (1) 作散點圖作散點圖從圖可以看出從圖可以看出, ,各點分布在一條直線附近各點分布在一條直線附近, ,即它們線形相關即它們線形相關. .(2)(2)列出下表列出下表, ,并計算并計算10101

18、022111159.8,172,265448,312350,287640iiiiiiixyyyxx ybxa1021()iiiQybxa10110221101.26710iiiiixybyxxx30.51.aybx 設所求的回歸直線方程為設所求的回歸直線方程為其中其中a,ba,b的值使的值使的值最小的值最小. .所以回歸直線的方程為所以回歸直線的方程為 =1.267x-30.51(3)(3)當當x=160 x=160時時, , 1.267.160-30.51=1721.267.160-30.51=172 y y歸納:歸納:1.1.求樣本數(shù)據(jù)的線性回歸方程,可按下列步驟進行求樣本數(shù)據(jù)的線性回歸方程,可按下列步驟進行第一步,計算平均數(shù)第一步,計算平均數(shù) , xy1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論