統(tǒng)計案例相關(guān)與回歸ppt課件_第1頁
統(tǒng)計案例相關(guān)與回歸ppt課件_第2頁
統(tǒng)計案例相關(guān)與回歸ppt課件_第3頁
統(tǒng)計案例相關(guān)與回歸ppt課件_第4頁
統(tǒng)計案例相關(guān)與回歸ppt課件_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第一章第一章 統(tǒng)計案例統(tǒng)計案例a. 比中“回歸添加的內(nèi)容數(shù)學(xué)統(tǒng)計畫散點圖了解最小二乘法的思想求回歸直線方程ybxa用回歸直線方程處理運用問題選修-統(tǒng)計案例引入線性回歸模型ybxae了解模型中隨機誤差項e產(chǎn)生的緣由了解相關(guān)指數(shù) R2 和模型擬合的效果之間的關(guān)系了解殘差圖的作用利用線性回歸模型處理一類非線性回歸問題正確了解分析方法與結(jié)果什么是回歸分析:什么是回歸分析:“回歸一詞是由英國生物學(xué)家回歸一詞是由英國生物學(xué)家F.Galton在研討人體身高的遺傳問題時首先提出的。在研討人體身高的遺傳問題時首先提出的。 根據(jù)遺傳學(xué)的觀念,子輩的身高受父輩影響,以X記父輩身高,Y記子輩身高。雖然子輩身高普通受父

2、輩影響,但同樣身高的父親,其子身高并不一致,因此,X和Y之間存在一種相關(guān)關(guān)系。 普通而言,父輩身高者,其子輩身高也高,依此推論,祖祖輩輩遺傳下來,身高必然向兩極分化,而現(xiàn)實上并非如此,顯然有一種力量將身高拉向中心,即子輩的身高有向中心回歸的特點?!盎貧w一詞即源于此。 雖然這種向中心回歸的景象只是特定領(lǐng)域里的結(jié)論,并不具有普遍性,但從它雖然這種向中心回歸的景象只是特定領(lǐng)域里的結(jié)論,并不具有普遍性,但從它所描畫的關(guān)于所描畫的關(guān)于X為自變量,為自變量,Y為不確定的因變量這種變量間的關(guān)系看,和我們?nèi)缃竦臑椴淮_定的因變量這種變量間的關(guān)系看,和我們?nèi)缃竦幕貧w含義是一樣的。回歸含義是一樣的。 不過,現(xiàn)代回歸

3、分析雖然沿用了“回歸一詞,但內(nèi)容已有很大變化,它是一種運用于許多領(lǐng)域的廣泛的分析研討方法,在經(jīng)濟(jì)實際研討和實證研討中也發(fā)揚著重要作用。問題問題1 1:正方形的面積:正方形的面積y y與正方形的邊長與正方形的邊長x x之間之間 的函數(shù)關(guān)系是的函數(shù)關(guān)系是y = y = x2x2確定性關(guān)系確定性關(guān)系問題問題2 2:某水田水稻產(chǎn)量:某水田水稻產(chǎn)量y y與施肥量與施肥量x x之間能否之間能否 -有一個確定性的關(guān)系?有一個確定性的關(guān)系?例如:在例如:在 7 7 塊并排、外形大小一樣的實驗田塊并排、外形大小一樣的實驗田上上 進(jìn)展施肥量對水稻產(chǎn)量影響的實驗,得到進(jìn)展施肥量對水稻產(chǎn)量影響的實驗,得到如下所示的一

4、組數(shù)據(jù):如下所示的一組數(shù)據(jù):施化肥量施化肥量x 15 20 25 30 35 40 45x 15 20 25 30 35 40 45水稻產(chǎn)量水稻產(chǎn)量y 330 345 365 405 445 450 455y 330 345 365 405 445 450 455復(fù)習(xí)復(fù)習(xí): :變量之間的兩種關(guān)系變量之間的兩種關(guān)系自變量取值一定時,因變量的取值帶有一定隨自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系。機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系。1 1、定義:、定義: 1 1:相關(guān)關(guān)系是一種不確定性關(guān)系;:相關(guān)關(guān)系是一種不確定性關(guān)系;注注對具有相關(guān)關(guān)系的兩個變量進(jìn)展對具有相

5、關(guān)關(guān)系的兩個變量進(jìn)展統(tǒng)計分析的方法叫回歸分析。統(tǒng)計分析的方法叫回歸分析。2 2:2 2、現(xiàn)實生活中存在著大量的相關(guān)關(guān)系。、現(xiàn)實生活中存在著大量的相關(guān)關(guān)系。 如:人的身高與年齡;如:人的身高與年齡; 產(chǎn)品的本錢與消費數(shù)產(chǎn)品的本錢與消費數(shù)量;量; 商品的銷售額與廣告商品的銷售額與廣告費;費; 家庭的支出與收入。家庭的支出與收入。等等等等探求:水稻產(chǎn)量探求:水稻產(chǎn)量y y與施肥量與施肥量x x之間大致有何之間大致有何規(guī)律?規(guī)律?10 20 30 40 5010 20 30 40 50500500450450400400350350300300發(fā)現(xiàn):圖中各點,大致分布在某條直線附近。發(fā)現(xiàn):圖中各點,大

6、致分布在某條直線附近。探求探求2 2:在這些點附近可畫直線不止一條,:在這些點附近可畫直線不止一條, 哪條直線最能代表哪條直線最能代表x x與與y y之間的關(guān)系呢?之間的關(guān)系呢?x xy y施化肥量施化肥量水稻產(chǎn)量水稻產(chǎn)量施化肥量施化肥量x 15 20 25 30 35 40 45x 15 20 25 30 35 40 45水稻產(chǎn)量水稻產(chǎn)量y 330 345 365 405 445 450 455y 330 345 365 405 445 450 455散點圖散點圖例例1 從某大學(xué)中隨機選取從某大學(xué)中隨機選取8名女大學(xué)生,其身高和體重數(shù)據(jù)如表名女大學(xué)生,其身高和體重數(shù)據(jù)如表1-1所示。所示。編

7、號12345678身高/cm165165 157 170 175 165 155 170體重/kg4857505464614359求根據(jù)一名女大學(xué)生的身高預(yù)告她的體重的回歸方程,并預(yù)告一名身高為求根據(jù)一名女大學(xué)生的身高預(yù)告她的體重的回歸方程,并預(yù)告一名身高為172cm的女大學(xué)生的體重。的女大學(xué)生的體重。案例案例1:女大學(xué)生的身高與體重:女大學(xué)生的身高與體重解:解:1、選取身高為自變量、選取身高為自變量x,體重為因變量,體重為因變量y,作散點圖:,作散點圖:2、由散點圖知道身高和體重有比較好的、由散點圖知道身高和體重有比較好的線性相關(guān)關(guān)系,因此可以用線性回歸方程線性相關(guān)關(guān)系,因此可以用線性回歸方

8、程描寫它們之間的關(guān)系。描寫它們之間的關(guān)系。3、從散點圖還看到,樣本點分布在某一條、從散點圖還看到,樣本點分布在某一條直線的附近,而不是在一條直線上,所以直線的附近,而不是在一條直線上,所以不能用一次函數(shù)不能用一次函數(shù)y=bx+a描畫它們關(guān)系。描畫它們關(guān)系。 我們可以用下面的線性回歸模型來表示:我們可以用下面的線性回歸模型來表示:y=bx+a+e,其中,其中a和和b為模型的未知參數(shù),為模型的未知參數(shù),e稱為隨機誤差。稱為隨機誤差。思索思索P3產(chǎn)生隨機誤差項產(chǎn)生隨機誤差項e的緣由是什么?的緣由是什么?思索思索P3產(chǎn)生隨機誤差項產(chǎn)生隨機誤差項e的緣由是什么?的緣由是什么?隨機誤差隨機誤差e e的來源

9、的來源( (可以推行到普通:可以推行到普通:1 1、其它要素的影響:影響身高、其它要素的影響:影響身高 y y 的要素的要素不只是體重不只是體重 x x,能夠還包括遺傳基因、,能夠還包括遺傳基因、飲食習(xí)慣、生長環(huán)境等要素;飲食習(xí)慣、生長環(huán)境等要素;2 2、用線性回歸模型近似真實模型所引起的、用線性回歸模型近似真實模型所引起的誤差;誤差;3 3、身高、身高 y y 的觀測誤差。的觀測誤差。函數(shù)模型與回歸模型之間的差別函數(shù)模型與回歸模型之間的差別函數(shù)模型:abxy回歸模型:eabxy可以提供選擇模型的準(zhǔn)那么例例1 從某大學(xué)中隨機選取從某大學(xué)中隨機選取8名女大學(xué)生,其身高和體重數(shù)據(jù)如表名女大學(xué)生,其

10、身高和體重數(shù)據(jù)如表1-1所示。所示。5943616454505748體重/kg170155165175170157165165身高/cm87654321編號求根據(jù)一名女大學(xué)生的身高預(yù)告她的體重的回歸方程,并預(yù)告一名身高為求根據(jù)一名女大學(xué)生的身高預(yù)告她的體重的回歸方程,并預(yù)告一名身高為172cm的女大學(xué)生的體重。的女大學(xué)生的體重。根據(jù)最小二乘法估計 和 就是未知參數(shù)a和b的最好估計,ab制表7 8 合計654321ixy , ,ixxiyy()()iixxyy2()ixx例例1 從某大學(xué)中隨機選取從某大學(xué)中隨機選取8名女大學(xué)生,其身高和體重數(shù)據(jù)如表名女大學(xué)生,其身高和體重數(shù)據(jù)如表1-1所示。所示

11、。5943616454505748體重/kg170155165175170157165165身高/cm87654321編號求根據(jù)一名女大學(xué)生的身高預(yù)告她的體重的回歸方程,并預(yù)告一名身高為求根據(jù)一名女大學(xué)生的身高預(yù)告她的體重的回歸方程,并預(yù)告一名身高為172cm的女大學(xué)生的體重。的女大學(xué)生的體重。根據(jù)最小二乘法估計 和 就是未知參數(shù)a和b的最好估計,ab于是有b=12210.849niiiniix ynx yxnx85.712aybx 所以回歸方程是0.84985.712yx所以,對于身高為所以,對于身高為172cm的女大學(xué)生,由回歸方程可以預(yù)告其體重為的女大學(xué)生,由回歸方程可以預(yù)告其體重為 0

12、.849 7285.71260.316()ykg( , )x y 稱為樣本點的中心探求探求P4:身高為身高為172cm的女大學(xué)生的體重一定是的女大學(xué)生的體重一定是60.316kg嗎?嗎?假設(shè)不是,他能解析一下緣由嗎?假設(shè)不是,他能解析一下緣由嗎?函數(shù)模型與回歸模型之間的差別函數(shù)模型與回歸模型之間的差別函數(shù)模型:abxy回歸模型:eabxy 線性回歸模型y=bx+a+e添加了隨機誤差項e,因變量y的值由自變量x和隨機誤差項e共同確定,即自變量x只能解析部分y的變化。 在統(tǒng)計中,我們也把自變量x稱為解析變量,因變量y稱為預(yù)告變量。五五.求出線性相關(guān)方程后,如何描畫斜率估計值求出線性相關(guān)方程后,如何

13、描畫斜率估計值與變化增量值之間相關(guān)關(guān)系的強弱?經(jīng)過什么與變化增量值之間相關(guān)關(guān)系的強弱?經(jīng)過什么量來闡明?量來闡明?1.用相關(guān)系數(shù)用相關(guān)系數(shù) r 來衡量來衡量2.公式:公式:12211niiinniiiixxyyrxxyy3.性質(zhì):性質(zhì):00rxyrxy當(dāng)時,表示 與 為正相關(guān);當(dāng)時,表示 與 為負(fù)相關(guān)、當(dāng)、當(dāng) 時,時,x x與與y y為完全線性相關(guān),它們之間為完全線性相關(guān),它們之間存在確定的函數(shù)關(guān)系。存在確定的函數(shù)關(guān)系。、當(dāng)、當(dāng) 時,表示時,表示x x與與y y存在著一定的線性相存在著一定的線性相關(guān),關(guān),r r的絕對值越大,越接近于的絕對值越大,越接近于1 1,表示,表示x x與與y y直線直

14、線相關(guān)程度越高,反之越低。相關(guān)程度越高,反之越低。1r10 r探求探求P4:身高為身高為172cm的女大學(xué)生的體重一定是的女大學(xué)生的體重一定是60.316kg嗎?嗎?假設(shè)不是,他能解析一下緣由嗎?假設(shè)不是,他能解析一下緣由嗎?答:身高為答:身高為172cm的女大學(xué)生的體重不一定是的女大學(xué)生的體重不一定是60.316kg, 但普通可以以為她的體重在但普通可以以為她的體重在60.316kg左右。左右。函數(shù)模型與回歸模型之間的差別函數(shù)模型與回歸模型之間的差別函數(shù)模型:abxy回歸模型:eabxy五五.求出線性相關(guān)方程后,如何描畫斜率估計值求出線性相關(guān)方程后,如何描畫斜率估計值與變化增量值之間相關(guān)關(guān)系

15、的強弱?經(jīng)過什么與變化增量值之間相關(guān)關(guān)系的強弱?經(jīng)過什么量來闡明?量來闡明?1.用相關(guān)系數(shù)用相關(guān)系數(shù) r 來衡量來衡量2.公式:公式:12211niiinniiiixxyyrxxyy3.性質(zhì):性質(zhì):00rxyrxy當(dāng)時,表示 與 為正相關(guān);當(dāng)時,表示 與 為負(fù)相關(guān)、當(dāng)、當(dāng) 時,時,x x與與y y為完全線性相關(guān),它們之間為完全線性相關(guān),它們之間存在確定的函數(shù)關(guān)系。存在確定的函數(shù)關(guān)系。、當(dāng)、當(dāng) 時,表示時,表示x x與與y y存在著一定的線性相存在著一定的線性相關(guān),關(guān),r r的絕對值越大,越接近于的絕對值越大,越接近于1 1,表示,表示x x與與y y直線直線相關(guān)程度越高,反之越低。相關(guān)程度越高

16、,反之越低。1r10 r如何描畫兩個變量之間線性相關(guān)關(guān)系的強弱?如何描畫兩個變量之間線性相關(guān)關(guān)系的強弱? 在中,我們學(xué)習(xí)了用相關(guān)系數(shù)r來衡量兩個變量之間線性相關(guān)關(guān)系的方法。相關(guān)系數(shù)相關(guān)系數(shù)r12211()().()()niiinniiiixxyyxxyy0.751, 1, 0.75, 0 25,0.25,rrr 當(dāng), 表明兩個變量正相關(guān)很強;當(dāng)表明兩個變量負(fù)相關(guān)很強;當(dāng).表明兩個變量相關(guān)性較弱。相關(guān)關(guān)系的測度相關(guān)關(guān)系的測度相關(guān)系數(shù)取值及其意義相關(guān)系數(shù)取值及其意義練練:某種產(chǎn)品的廣告費支出某種產(chǎn)品的廣告費支出x與銷售額與銷售額y之間有如表之間有如表所示數(shù)據(jù)所示數(shù)據(jù):零件數(shù)零件數(shù)X24568加工時

17、間加工時間y(分分鐘鐘)3040605070(1)0.9192r (2)6.517.5yx(1)求求x,y之間的相關(guān)系數(shù)之間的相關(guān)系數(shù);(2)求線性回歸方程求線性回歸方程;對回歸模型進(jìn)展統(tǒng)計檢驗對回歸模型進(jìn)展統(tǒng)計檢驗思索思索P6:如何描寫預(yù)告變量體重的變化?這個變化在多大程度上如何描寫預(yù)告變量體重的變化?這個變化在多大程度上與解析變量身高有關(guān)?在多大程度上與隨機誤差有關(guān)?與解析變量身高有關(guān)?在多大程度上與隨機誤差有關(guān)? 假設(shè)身高和隨機誤差的不同不會對體重產(chǎn)生任何影響,那么一切人的體重將相同。在體重不受任何變量影響的假設(shè)下,設(shè)8名女大學(xué)生的體重都是她們的平均值,即8個人的體重都為54.5kg。5

18、4.554.554.554.554.554.554.554.5體重/kg170155165175170157165165身高/cm87654321編號54.5kg在散點圖中,一切的點應(yīng)該落在同一條在散點圖中,一切的點應(yīng)該落在同一條程度直線上,但是觀測到的數(shù)據(jù)并非如程度直線上,但是觀測到的數(shù)據(jù)并非如此。這就意味著預(yù)告變量體重的值此。這就意味著預(yù)告變量體重的值受解析變量身高或隨機誤差的影響。受解析變量身高或隨機誤差的影響。5943616454505748體重/kg170155165175170157165165身高/cm87654321編號 例如,編號為例如,編號為6的女大學(xué)生的體重并沒有落在程度

19、直線上,她的體重為的女大學(xué)生的體重并沒有落在程度直線上,她的體重為61kg。解析。解析變量身高和隨機誤差共同把這名學(xué)生的體重從變量身高和隨機誤差共同把這名學(xué)生的體重從54.5kg“推到了推到了61kg,相差,相差6.5kg,所以所以6.5kg是解析變量和隨機誤差的組合效應(yīng)。是解析變量和隨機誤差的組合效應(yīng)。 編號為編號為3的女大學(xué)生的體重并也沒有落在程度直線上,她的體重為的女大學(xué)生的體重并也沒有落在程度直線上,她的體重為50kg。解析。解析變量身高和隨機誤差共同把這名學(xué)生的體重從變量身高和隨機誤差共同把這名學(xué)生的體重從50kg“推到了推到了54.5kg,相差,相差-4.5kg,這時解析變量和隨機

20、誤差的組合效應(yīng)為這時解析變量和隨機誤差的組合效應(yīng)為-4.5kg。用這種方法可以對一切預(yù)告變量計算組合效應(yīng)。用這種方法可以對一切預(yù)告變量計算組合效應(yīng)。數(shù)學(xué)上,把每個效應(yīng)觀測值減去總的平均值的平方加起來,即用數(shù)學(xué)上,把每個效應(yīng)觀測值減去總的平均值的平方加起來,即用21()niiyy表示總的效應(yīng),稱為總偏向平方和。表示總的效應(yīng),稱為總偏向平方和。在例在例1中,總偏向平方和為中,總偏向平方和為354。5943616454505748體重/kg170155165175170157165165身高/cm87654321編號 那么,在這個總的效應(yīng)總偏向平方和中,有多少來自于解析變量身高?有多少來自于隨機誤差

21、? 假設(shè)隨機誤差對體重沒有影響,也就是說,體重僅受身高的影響,那么散點圖中一切的點將完全落在回歸直線上。但是,在圖中,數(shù)據(jù)點并沒有完全落在回歸直線上。這些點分布在回歸直線附近,所以一定是隨機誤差把這些點從回歸直線上“推開了。在例在例1中,殘差平方和約為中,殘差平方和約為128.361。 因此,數(shù)據(jù)點和它在回歸直線上相應(yīng)位置的差別 是隨機誤差的效應(yīng),稱 為殘差。)iiyy(iiieyy=例如,編號為例如,編號為6的女大學(xué)生,計算隨機誤差的效應(yīng)殘差為:的女大學(xué)生,計算隨機誤差的效應(yīng)殘差為:61 (0.849 16585.712)6.627對每名女大學(xué)生計算這個差別,然后分別將所得的值平方后加起來,

22、用數(shù)學(xué)符號對每名女大學(xué)生計算這個差別,然后分別將所得的值平方后加起來,用數(shù)學(xué)符號21()niiiyy稱為殘差平方和,它代表了隨機誤差的效應(yīng)。稱為殘差平方和,它代表了隨機誤差的效應(yīng)。表示為:表示為: 由于解析變量和隨機誤差的總效應(yīng)總偏向平方和為354,而隨機誤差的效應(yīng)為128.361,所以解析變量的效應(yīng)為解析變量和隨機誤差的總效應(yīng)總偏向平方和解析變量和隨機誤差的總效應(yīng)總偏向平方和 =解析變量的效應(yīng)回歸平方和解析變量的效應(yīng)回歸平方和+隨機誤差的效應(yīng)殘差平方和隨機誤差的效應(yīng)殘差平方和354-128.361=225.639 這個值稱為回歸平方和。這個值稱為回歸平方和。我們可以用相關(guān)指數(shù)我們可以用相關(guān)指

23、數(shù)R2來描寫回歸的效果,其計算公式是來描寫回歸的效果,其計算公式是22121()11()niiiniiyyRyy 殘差平方和??偲钇椒胶?221121()()()nniiiiiniiyyyyRyy總偏差平方和殘差平方和回歸平方和總偏差平方和總偏差平方和離差平方和的分解離差平方和的分解 三個平方和的意義三個平方和的意義n總偏向平方和總偏向平方和(SST)n反映因變量的反映因變量的 n 個察看值與其均值的總離差個察看值與其均值的總離差n回歸平方和回歸平方和(SSR)n反映自變量反映自變量 x 的變化對因變量的變化對因變量 y 取值變化的影取值變化的影響,或者說,是由于響,或者說,是由于 x 與與

24、 y 之間的線性關(guān)系引之間的線性關(guān)系引起的起的 y 的取值變化,也稱為可解釋的平方和的取值變化,也稱為可解釋的平方和n殘差平方和殘差平方和(SSE)n反映除反映除 x 以外的其他要素對以外的其他要素對 y 取值的影響,也取值的影響,也稱為不可解釋的平方和或剩余平方和稱為不可解釋的平方和或剩余平方和樣本決議系數(shù)樣本決議系數(shù) 斷定系數(shù)斷定系數(shù) r2 n回歸平方和占總離差平方和的比例niiniiniiniiyyyyyyyySSTSSRr1212121221我們可以用相關(guān)指數(shù)我們可以用相關(guān)指數(shù)R2來描寫回歸的效果,其計算公式是來描寫回歸的效果,其計算公式是22121()11()niiiniiyyRyy

25、 殘差平方和??偲钇椒胶惋@然,顯然,R2的值越大,闡明殘差平方和越小,也就是說模型擬合效果越好。的值越大,闡明殘差平方和越小,也就是說模型擬合效果越好。在線性回歸模型中,在線性回歸模型中,R2表示解析變量對預(yù)告變量變化的奉獻(xiàn)率。表示解析變量對預(yù)告變量變化的奉獻(xiàn)率。 R2越接近1,表示回歸的效果越好由于R2越接近1,表示解析變量和預(yù)告變量的線性相關(guān)性越強。 假設(shè)某組數(shù)據(jù)能夠采取幾種不同回歸方程進(jìn)展回歸分析,那么可以經(jīng)過比較R2的值來做出選擇,即選取R2較大的模型作為這組數(shù)據(jù)的模型??偟膩碚f:總的來說:相關(guān)指數(shù)相關(guān)指數(shù)R2是度量模型擬合效果的一種目的。是度量模型擬合效果的一種目的。在線性模型中,

26、它代表自變量描寫預(yù)告變量的才干。在線性模型中,它代表自變量描寫預(yù)告變量的才干。我們可以用相關(guān)指數(shù)我們可以用相關(guān)指數(shù)R2來描寫回歸的效果,其計算公式是來描寫回歸的效果,其計算公式是22121()11()niiiniiyyRyy 殘差平方和??偲钇椒胶?354總計0.36128.361殘差變量0.64225.639隨機誤差比例平方和來源表表1-3 從表從表3-1中可以看出,解析變量對總效應(yīng)約奉獻(xiàn)了中可以看出,解析變量對總效應(yīng)約奉獻(xiàn)了64%,即,即R2 0.64,可以表達(dá)為,可以表達(dá)為“身高解析了身高解析了64%的體重變化,而隨機誤差奉獻(xiàn)了剩余的的體重變化,而隨機誤差奉獻(xiàn)了剩余的36%。 所以,身

27、高對體重的效應(yīng)比隨機誤差的效應(yīng)大得多。所以,身高對體重的效應(yīng)比隨機誤差的效應(yīng)大得多。表表1-4列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)。列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)。 在研討兩個變量間的關(guān)系時,首先要根據(jù)散點圖來粗略判別它們能否線性相關(guān),在研討兩個變量間的關(guān)系時,首先要根據(jù)散點圖來粗略判別它們能否線性相關(guān),能否可以用回歸模型來擬合數(shù)據(jù)。能否可以用回歸模型來擬合數(shù)據(jù)。殘差分析與殘差圖的定義:殘差分析與殘差圖的定義: 然后,我們可以經(jīng)過殘差然后,我們可以經(jīng)過殘差 來判別模型擬合的效果,判別原始來判別模型擬合的效果,判別原始數(shù)據(jù)中能否存在可疑數(shù)據(jù),這方面的分析任務(wù)

28、稱為殘差分析。數(shù)據(jù)中能否存在可疑數(shù)據(jù),這方面的分析任務(wù)稱為殘差分析。12,ne ee 編號編號12345678身高身高/cm165165157170175165155170體重體重/kg4857505464614359殘差殘差-6.3732.6272.419-4.6181.6.627-2.8830.382 我們可以利用圖形來分析殘差特性,作圖時縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本我們可以利用圖形來分析殘差特性,作圖時縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘差圖。編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘差圖。殘差圖的制造及作用。殘差圖的制造

29、及作用。坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇;坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇;假設(shè)模型選擇的正確,殘差圖中的點應(yīng)該分布在以橫軸假設(shè)模型選擇的正確,殘差圖中的點應(yīng)該分布在以橫軸為心的帶形區(qū)域;為心的帶形區(qū)域;對于遠(yuǎn)離橫軸的點,要特別留意。對于遠(yuǎn)離橫軸的點,要特別留意。身高與體重殘差圖異常點 錯誤數(shù)據(jù) 模型問題 幾點闡明:幾點闡明: 第一個樣本點和第第一個樣本點和第6個樣本點的殘差比較大,需求確認(rèn)在采集過程中能否有人為個樣本點的殘差比較大,需求確認(rèn)在采集過程中能否有人為的錯誤。假設(shè)數(shù)據(jù)采集有錯誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)的錯誤。假設(shè)數(shù)據(jù)采集有錯誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)據(jù);假設(shè)數(shù)據(jù)采集沒有錯誤,那么需求尋覓其他的緣由。據(jù);假設(shè)數(shù)據(jù)采集沒有錯誤,那么需求尋覓其他的緣由

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論