回歸分析的基本思想及其初步應(yīng)用(1)_第1頁(yè)
回歸分析的基本思想及其初步應(yīng)用(1)_第2頁(yè)
回歸分析的基本思想及其初步應(yīng)用(1)_第3頁(yè)
回歸分析的基本思想及其初步應(yīng)用(1)_第4頁(yè)
回歸分析的基本思想及其初步應(yīng)用(1)_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、必修必修3(3(第二章第二章 統(tǒng)計(jì)統(tǒng)計(jì)) )知識(shí)結(jié)構(gòu)知識(shí)結(jié)構(gòu) 收集數(shù)據(jù)收集數(shù)據(jù) ( (隨機(jī)抽樣隨機(jī)抽樣) )整理、分析數(shù)據(jù)整理、分析數(shù)據(jù)估計(jì)、推斷估計(jì)、推斷簡(jiǎn)單隨機(jī)抽簡(jiǎn)單隨機(jī)抽樣樣分層抽樣分層抽樣系統(tǒng)抽樣系統(tǒng)抽樣用樣本估計(jì)總體用樣本估計(jì)總體變量間的相關(guān)關(guān)系變量間的相關(guān)關(guān)系 用樣本用樣本的頻率的頻率分布估分布估計(jì)總體計(jì)總體分布分布 用樣本用樣本數(shù)字特?cái)?shù)字特征估計(jì)征估計(jì)總體數(shù)總體數(shù)字特征字特征線性回歸分析線性回歸分析統(tǒng)計(jì)的基本思想統(tǒng)計(jì)的基本思想y = f(x)y = f(x)y = f(x)y = f(x)y = f(x)y = f(x)實(shí)際實(shí)際樣本樣本模模 擬擬抽抽 樣樣分分 析析問(wèn)題問(wèn)題1 1

2、:正方形的面積正方形的面積y y與正方形的邊長(zhǎng)與正方形的邊長(zhǎng)x x之間之間 的的函數(shù)關(guān)系函數(shù)關(guān)系是是y = xy = x2 2確定性關(guān)系確定性關(guān)系問(wèn)題問(wèn)題2 2:某水田水稻產(chǎn)量某水田水稻產(chǎn)量y y與施肥量與施肥量x x之間是否之間是否 -有一個(gè)確定性的關(guān)系?有一個(gè)確定性的關(guān)系?例如:例如:在在 7 7 塊并排、形狀大小相同的試驗(yàn)田塊并排、形狀大小相同的試驗(yàn)田上上 進(jìn)行施肥量對(duì)水稻產(chǎn)量影響的試驗(yàn),得到進(jìn)行施肥量對(duì)水稻產(chǎn)量影響的試驗(yàn),得到如下所示的一組數(shù)據(jù):如下所示的一組數(shù)據(jù):施化肥量施化肥量x x 15 20 25 30 35 40 45 15 20 25 30 35 40 45水稻產(chǎn)量水稻產(chǎn)量

3、y y 330 345 365 405 445 450 455 330 345 365 405 445 450 455復(fù)習(xí)、變量之間的兩種關(guān)系復(fù)習(xí)、變量之間的兩種關(guān)系自變量取值一定時(shí),因變量的取值帶有一定隨自變量取值一定時(shí),因變量的取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系叫做機(jī)性的兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系相關(guān)關(guān)系。1 1、定義:、定義: 1 1):相關(guān)關(guān)系是一種不確定性關(guān)系;):相關(guān)關(guān)系是一種不確定性關(guān)系;注注對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法叫統(tǒng)計(jì)分析的方法叫回歸分析回歸分析。2 2):):2 2、現(xiàn)實(shí)生活中存在著大量的相關(guān)關(guān)系。現(xiàn)實(shí)生活中存在著大量的

4、相關(guān)關(guān)系。探索:水稻產(chǎn)量探索:水稻產(chǎn)量y y與施肥量與施肥量x x之間大致有何之間大致有何規(guī)律?規(guī)律?10 20 30 40 5010 20 30 40 50500500450450400400350350300300發(fā)現(xiàn):圖中各點(diǎn),大致分布在某條直線附近。發(fā)現(xiàn):圖中各點(diǎn),大致分布在某條直線附近。探索探索2 2:在這些點(diǎn)附近可畫(huà)直線不止一條,:在這些點(diǎn)附近可畫(huà)直線不止一條, 哪條直線最能代表哪條直線最能代表x x與與y y之間的關(guān)系呢?之間的關(guān)系呢?x xy y施化肥量施化肥量水稻產(chǎn)量水稻產(chǎn)量施化肥量施化肥量x x 15 20 25 30 35 40 45 15 20 25 30 35 40

5、45水稻產(chǎn)量水稻產(chǎn)量y y 330 345 365 405 445 450 455 330 345 365 405 445 450 455散點(diǎn)圖散點(diǎn)圖10 20 30 40 50500450400350300 xy施化肥量施化肥量水稻產(chǎn)量水稻產(chǎn)量n n2 2i ii ii i= =1 1Q Q( (a a, ,b b) )= =( (y y - -b bx x - -a a) ) 取取最最小小值值時(shí)時(shí), ,a a, ,b b的的值值. .推導(dǎo)過(guò)程請(qǐng)閱讀P92推導(dǎo)過(guò)程請(qǐng)閱讀P92iiii(x ,y )(x ,y )i ii i(x ,y )(x ,y )|i ii i| |y y - -y y最

6、小二乘法:最小二乘法: y = bx+a(x,y)(x,y)稱為樣本點(diǎn)的中心稱為樣本點(diǎn)的中心。n n( (x x- - x x) )( (y y- - y y) )i ii ii i= =1 1b b = =n n2 2( (x x- - x x) )i ii i= =1 1a a = = y y - - b bx x. .n nn n1 11 1其其 中中 x x = =x x , ,y y = =y y . .i ii in nn ni i= =1 1i i= =1 1n niiiii=1i=1n n2 22 2i ii=1i=1x y -nxyx y -nxy=,=,x-nxx-nx3

7、3、對(duì)兩個(gè)變量進(jìn)行的線性分析叫做、對(duì)兩個(gè)變量進(jìn)行的線性分析叫做線性線性回歸分析回歸分析。2 2、回歸直線方程:、回歸直線方程:n nn ni ii ii ii ii i= =1 1i i= =1 1n nn n2 22 22 2i ii ii i= =1 1i i= =1 1( (x x - -x x) )( (y y - -y y) )x x- -n nx xy yb b = = =, ,( (x x - -x x) )x x - -n nx xa a = = y y- -b bx xy y2.2.相應(yīng)的直線叫做相應(yīng)的直線叫做回歸直線回歸直線。1 1、所求直線方程、所求直線方程 叫做叫做回歸

8、直回歸直 -線方程線方程;其中;其中 y = bx+ay = bx+a相關(guān)系數(shù)相關(guān)系數(shù) 1. 1.計(jì)算公式計(jì)算公式 2 2相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)的性質(zhì) (1)|r|1(1)|r|1 (2)|r|(2)|r|越接近于越接近于1 1,相關(guān)程度越大;,相關(guān)程度越大;|r|r|越接越接近于近于0 0,相關(guān)程度越小,相關(guān)程度越小 問(wèn)題:達(dá)到怎樣程度,問(wèn)題:達(dá)到怎樣程度,x x、y y線性相關(guān)呢?它線性相關(guān)呢?它們的相關(guān)程度怎樣呢?們的相關(guān)程度怎樣呢?n ni ii ii i= =1 1n nn n2 22 2i ii ii i= =1 1i i= =1 1( (x x - - x x) )( (y y

9、- - y y) )r r = =( (x x - - x x) )( (y y - - y y) )負(fù)相關(guān)負(fù)相關(guān)正相關(guān)正相關(guān)n n( (x x - -x x) )( (y y - -y y) )i ii ii i= =1 1r r= =n nn n2 22 2( (x x - -x x) ) ( (y y - -y y) )i ii ii i= =1 1i i= =1 1相關(guān)系數(shù)相關(guān)系數(shù)正相關(guān);負(fù)相關(guān)通常,正相關(guān);負(fù)相關(guān)通常, r r-1,-0.75-0.75-負(fù)相關(guān)很強(qiáng)負(fù)相關(guān)很強(qiáng); ; r0.75,1正相關(guān)很強(qiáng)正相關(guān)很強(qiáng); r-0.75,-0.3-負(fù)相關(guān)一般負(fù)相關(guān)一般; ; r0.3, 0

10、.75正相關(guān)一般正相關(guān)一般; r r-0.25, 0.25-0.25-相關(guān)性較弱相關(guān)性較弱; ; 10 20 30 40 5010 20 30 40 50500500450450400400350350300300 xy施化肥量施化肥量水稻產(chǎn)量水稻產(chǎn)量施化肥量施化肥量x x 15 20 25 30 35 40 45 15 20 25 30 35 40 45水稻產(chǎn)量水稻產(chǎn)量y y 330 345 365 405 445 450 455 330 345 365 405 445 450 455解解: 1.畫(huà)出散點(diǎn)圖畫(huà)出散點(diǎn)圖2.求出求出b b = = 4 4. .7 75 5, , a a = =

11、2 25 56 6. .7 79 93.寫(xiě)出回歸方程寫(xiě)出回歸方程 y = 4.75x+256.79y = 4.75x+256.794.計(jì)算相關(guān)系數(shù)計(jì)算相關(guān)系數(shù)r r = = 0 0. .9 97 71 18 8例題例題1 1 從某大學(xué)中隨機(jī)選出從某大學(xué)中隨機(jī)選出8 8名女大學(xué)生,其身名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如下表:高和體重?cái)?shù)據(jù)如下表:編號(hào)編號(hào)1 12 23 34 45 56 67 78 8身高身高165165165165157157170170175175165165155155170170體重體重48485757505054546464616143435959求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)

12、她的體重的求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程,并預(yù)報(bào)一名身高為回歸方程,并預(yù)報(bào)一名身高為172172的女的女大學(xué)生的體重。大學(xué)生的體重。 y y = = 0 0. .8 84 49 9x x- -8 85 5. .1 17 72 2分析:由于問(wèn)題中分析:由于問(wèn)題中要求根據(jù)身高預(yù)報(bào)要求根據(jù)身高預(yù)報(bào)體重,因此選取身體重,因此選取身高為自變量,體重高為自變量,體重為因變量為因變量身身高高1 17 72 2c cm m女女大大學(xué)學(xué)生生體體重重y y = = 0 0. .8 84 49 91 17 72 2- -8 85 5. .7 71 12 2 = = 6 60 0. .3 31 16

13、6( (k kg g) )3.通過(guò)探究欄目引入通過(guò)探究欄目引入“線性回歸模型線性回歸模型”。此處可以引。此處可以引導(dǎo)學(xué)生們體會(huì)函數(shù)模型與回歸模型之間的差別。導(dǎo)學(xué)生們體會(huì)函數(shù)模型與回歸模型之間的差別。(2 2)從散點(diǎn)圖還可以看到,樣本點(diǎn)散布在某一條)從散點(diǎn)圖還可以看到,樣本點(diǎn)散布在某一條直線的附近,而不是一條直線上,所以不能用一次直線的附近,而不是一條直線上,所以不能用一次函數(shù)來(lái)描述它們之間的關(guān)系。這時(shí)我函數(shù)來(lái)描述它們之間的關(guān)系。這時(shí)我們用下面的線性回歸模型來(lái)描述身高和體重的關(guān)系:們用下面的線性回歸模型來(lái)描述身高和體重的關(guān)系:+ +其中和為模型的其中和為模型的未知參數(shù)未知參數(shù),e e是是y y與

14、與 之間的誤差之間的誤差, ,通常通常稱為稱為隨機(jī)誤差隨機(jī)誤差。 y2 2它它的的均均值值E E( (e e) )= = 0 0, ,方方差差D D( (e e) )= = 0 0(1 1)由圖形觀察可以看出,樣本點(diǎn)呈條狀分)由圖形觀察可以看出,樣本點(diǎn)呈條狀分布,身高和體重有比較好的線性相關(guān)關(guān)系,因布,身高和體重有比較好的線性相關(guān)關(guān)系,因此可以用線性回歸方程刻畫(huà)它們之間的關(guān)系。此可以用線性回歸方程刻畫(huà)它們之間的關(guān)系。 y y線性回歸模型線性回歸模型 + +2 2E E( (e e) )= = 0 0, , D D( (e e) )= = y+ +其中和為模型的其中和為模型的未知參數(shù)未知參數(shù),e

15、 e是是y與與 之間的誤差之間的誤差,通常通常稱為稱為隨機(jī)誤差隨機(jī)誤差。為了衡量預(yù)報(bào)的精度為了衡量預(yù)報(bào)的精度, ,需要估計(jì)的需要估計(jì)的2 2值值? ?(1, 2,. )iiiiiiybxa inyyybxaiiiii隨 機(jī) 誤 差 e其 估 計(jì) 值 為 : ee 稱 為 相 應(yīng) 點(diǎn) (x ,y )的 殘 差22111(,)(2)22(,)niieQ a bnnnQ a b類 比 樣 本 方 差 估 計(jì) 總 體 方 差 的 思 想稱 為 殘 差 平 方 和21( ,)()niiiQyx (1 1)根據(jù)散點(diǎn)圖來(lái)粗略判斷它們是否線性相關(guān)。)根據(jù)散點(diǎn)圖來(lái)粗略判斷它們是否線性相關(guān)。(2 2)是否可以用線性回歸模型來(lái)擬合數(shù)據(jù))是否可以用線性回歸模型來(lái)擬合數(shù)據(jù)(3 3)通過(guò)殘差)通過(guò)殘差 來(lái)判斷模型擬合的效來(lái)判斷模型擬合的效 果這種分析工作稱

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論