選修1-2第一章統(tǒng)計案例1.1.3《回歸分析》課時3_第1頁
選修1-2第一章統(tǒng)計案例1.1.3《回歸分析》課時3_第2頁
選修1-2第一章統(tǒng)計案例1.1.3《回歸分析》課時3_第3頁
選修1-2第一章統(tǒng)計案例1.1.3《回歸分析》課時3_第4頁
選修1-2第一章統(tǒng)計案例1.1.3《回歸分析》課時3_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選課件11.1.31.1.3回歸分析的回歸分析的基本思想及其初步應(yīng)用基本思想及其初步應(yīng)用(第三課時)(第三課時)深圳市民辦學(xué)校高中數(shù)學(xué)教師歐陽文豐深圳市民辦學(xué)校高中數(shù)學(xué)教師歐陽文豐精選課件2建立回歸模型的基本步驟建立回歸模型的基本步驟(1)(1)確定研究對象,明確哪個變量是解釋變量,哪個變量確定研究對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量是預(yù)報變量(2)(2)畫出確定好的解釋變量和預(yù)報變量的散點圖,觀察它畫出確定好的解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系們之間的關(guān)系( (如是否存在線性關(guān)系等如是否存在線性關(guān)系等) )(3)(3)由經(jīng)驗確定回歸方程的類型由經(jīng)驗確定回歸方程的類型

2、( (如我們觀察到數(shù)據(jù)呈線如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程性關(guān)系,則選用線性回歸方程) )(4)(4)按一定規(guī)則按一定規(guī)則( (如最小二乘法如最小二乘法) )估計回歸方程中的參數(shù)估計回歸方程中的參數(shù)(5)(5)得出結(jié)果后分析殘差圖是否有異常得出結(jié)果后分析殘差圖是否有異常( (如個別數(shù)據(jù)對應(yīng)如個別數(shù)據(jù)對應(yīng)殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性等殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性等) )若存在異若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等精選課件3(1)(1)參數(shù)參數(shù)R R2 2與相關(guān)系數(shù)與相關(guān)系數(shù)r r提示提示: :它們都是刻畫兩個變量之間的

3、的相關(guān)關(guān)系的它們都是刻畫兩個變量之間的的相關(guān)關(guān)系的, ,區(qū)區(qū)別是別是R R2 2表示解釋變量對預(yù)報變量變化的貢獻率表示解釋變量對預(yù)報變量變化的貢獻率, ,其表其表達式為達式為R R2 2=1- ;=1- ;相關(guān)系數(shù)相關(guān)系數(shù)r r是檢驗兩個變量相關(guān)性的強弱程度是檢驗兩個變量相關(guān)性的強弱程度, ,其表達式為其表達式為 n2iii 1n2ii 1yyyy$nniii ii 1i 1nnnn222222iiiii 1i 1i 1i 1x x y yxy nx yr.x xy y( xnx)( yny)精選課件4(2 2)相關(guān)系數(shù))相關(guān)系數(shù)r r與與R R2 2(1)R(1)R2 2是相關(guān)系數(shù)的平方是相

4、關(guān)系數(shù)的平方, ,其變化范圍為其變化范圍為0,1,0,1,而相關(guān)系而相關(guān)系數(shù)的變化范圍為數(shù)的變化范圍為-1,1.-1,1.(2)(2)相關(guān)系數(shù)可較好地反映變量的相關(guān)性及正相關(guān)或負(fù)相關(guān)系數(shù)可較好地反映變量的相關(guān)性及正相關(guān)或負(fù)相關(guān)相關(guān), ,而而R R2 2反映了回歸模型擬合數(shù)據(jù)的效果反映了回歸模型擬合數(shù)據(jù)的效果. .(3)(3)當(dāng)當(dāng)|r|r|接近于接近于1 1時說明兩變量的相關(guān)性較強時說明兩變量的相關(guān)性較強, ,當(dāng)當(dāng)|r|r|接接近于近于0 0時說明兩變量的相關(guān)性較弱時說明兩變量的相關(guān)性較弱, ,而當(dāng)而當(dāng)R R2 2接近于接近于1 1時時, ,說說明線性回歸方程的擬合效果較好明線性回歸方程的擬合效

5、果較好. .精選課件531表 325115662421117/y35322927252321C/0個個產(chǎn)卵數(shù)產(chǎn)卵數(shù)溫度溫度例:一只紅鈴蟲產(chǎn)卵數(shù)例:一只紅鈴蟲產(chǎn)卵數(shù)y和溫度和溫度x有關(guān),現(xiàn)收集到的一有關(guān),現(xiàn)收集到的一組數(shù)據(jù)如下表組數(shù)據(jù)如下表1-3表,試建立表,試建立y與與x之間的回歸方程。之間的回歸方程。精選課件6畫出確定好的解釋變量畫出確定好的解釋變量和預(yù)報變量的散點圖,和預(yù)報變量的散點圖,觀察它們之間的關(guān)系觀察它們之間的關(guān)系(1)是否存在線性關(guān)系?(2)散點圖具有哪種函數(shù)特征?(3)以指數(shù)函數(shù)模型為例,如何設(shè)模型函數(shù)?非線性關(guān)系非線性關(guān)系指數(shù)函數(shù)、二次函數(shù)、三次函數(shù)指數(shù)函數(shù)、二次函數(shù)、三次函

6、數(shù)41 . 1圖溫度溫度產(chǎn)卵數(shù)產(chǎn)卵數(shù)精選課件7 .,abxy線性回歸方程線性回歸方程我們稱之為非我們稱之為非時時當(dāng)回歸方程不是形如當(dāng)回歸方程不是形如cc21設(shè)指數(shù)函數(shù)曲線 其中 和 是待定參數(shù)。ecyxc12我們可以通過對數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系 這樣就可以利用線性回歸模型來建立z 與x回歸模型,進而找到y(tǒng)與x的非線性回歸方程 。則變換后樣本點分布在直線的周圍。令)cb,clna(abxz21ylnz 現(xiàn)在問題變?yōu)槿绾喂烙嫶▍?shù) 和 ?cc21非線性回歸模型非線性回歸模型精選課件8.,51 . 1.4151 . 1用線性回歸方程來擬合因此可以一條直線的附近變換后的樣本點分布在看出中可以從

7、圖中數(shù)據(jù)的散點圖給出了表784.5745.4190.4178.3045.3398.2946.1z35322927252321x41表產(chǎn)卵數(shù)的對數(shù)溫度51 . 1圖.843. 3272. 041xz到線性回歸方程中的數(shù)據(jù)得由表圖的樣本數(shù)據(jù)表的數(shù)據(jù)可以得到變換后由表, 4131(6)ey0.272x-3.843(1)精選課件9325115662421117y12251024841729625529441t51表另一方面另一方面, ,可以認(rèn)為圖可以認(rèn)為圖11-411-4中樣本點集中在某二次曲線中樣本點集中在某二次曲線因此可以對溫度變量做變換因此可以對溫度變量做變換, ,即令即令 然后建立然后建立y

8、y與與t t之間的線性回歸方程,從而得到之間的線性回歸方程,從而得到y(tǒng) y與與x x之間的排線性回之間的排線性回歸方程。歸方程。,2xt 的附近的附近, ,其中其中 和和 為待定參數(shù)為待定參數(shù). .43cc423cxcy 表表1-51-5是紅鈴蟲的產(chǎn)卵數(shù)和對應(yīng)的溫度的平方,圖是紅鈴蟲的產(chǎn)卵數(shù)和對應(yīng)的溫度的平方,圖1.1-61.1-6是相應(yīng)的散點圖是相應(yīng)的散點圖. .精選課件10.,61 . 1423下面介紹具體方法到還可以通過殘差分析得這個結(jié)論之間的關(guān)系與來擬合二次曲線即不宜用合它回歸方程來擬此不宜用線性因直線的周圍不分布在一條的散點圖并與可以看出中從圖xycxcyty溫度的平方數(shù)卵產(chǎn)61 .

9、 1圖中用線性回歸模型擬合表的二次回歸方程關(guān)于下面建立的指數(shù)回歸方程關(guān)于前面已經(jīng)建立了方程歸需要建立兩個相應(yīng)的回殘差為比較兩個不同模型的51.,.,xyxy精選課件11 7.54.202x367.0y xy,54.202t367.0y ty,222的二次回歸方程為關(guān)于即的線性回歸方程關(guān)于得到的數(shù)據(jù) 的殘差計算公式分別為和則回歸方程列的數(shù)據(jù)行第第表示表用的擬合效果和個回歸方程可以通過殘差來比較兩76,1151.76ixi ; 7 , 2 , 1i ,eyy ye 843.3x272.0i1ii1i .7 , 2 , 1i ,54.202x367.0yy ye 2ii2ii2i .的擬合效果好7型

10、的擬合效果比模6因此模型,的殘差的絕對值小7模型的殘差的絕對值顯然比6模型從表中的數(shù)據(jù)可以看出.殘差的兩個回歸方程的給出了原始數(shù)據(jù)及相應(yīng)61表 精選課件12 965.77268.58107.4041003835.5397.19693.47e 928.32153.14889.8149.9760.1617.0518.0e 325115662421117y35322927252321x2161表 .7型的擬合效果遠遠優(yōu)于模6因此模型.432.15448,673.1450的殘差平方和分別為7和6算出模型容易61由表.擬合的效果越好,殘差平方和越小的模型.合效果的大小來判斷模型的擬兩個模型的殘差平方和這

11、時可以通過比較.則相反而另一些樣本點的情況,的小型差的絕對值比另一個模的殘某些樣本點上一個模型原因是在.較困難比較兩個模型的殘差比,在一般情況下21QQ精選課件13 ,b, xgya, xfy21和和對于給定的樣本點 ,兩個含有未知數(shù)的模型 1122,nnxyxyxy其中a和b都是未知參數(shù),可以按如下的步驟來比較它們的擬合效果. .ba 其中 和 分別是參數(shù)a、b的估計值(1)分別建立對應(yīng)于兩個模型的回歸方程 ,b, xgy 2 a , xfy 1 ;y yQn1i22ii2 Q1 y yn1i21ii與(2)分別計算兩個回歸方程的殘差平方和 .b, xgy a , xfy ,;b, xgy

12、a , xfy ,QQ212121的好的效果不如反之的好的效果比則(3)若精選課件14非線性回歸問題的處理方法(1)兩個變量不呈線性關(guān)系,不能直接利用線性回歸方程建立兩個變量的關(guān)系,可以通過變換的方法轉(zhuǎn)化為線性回歸模型,如y= ,我們可以通過對數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系.令z=lny,則變換后樣本點應(yīng)該分布在直線z=bx+a(a=lnc1,b=c2)的周圍.2c x1ce精選課件15(2)非線性回歸方程的求法根據(jù)原始數(shù)據(jù)(x,y)作出散點圖;根據(jù)散點圖,選擇恰當(dāng)?shù)臄M合函數(shù);作恰當(dāng)?shù)淖儞Q,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方程;在的基礎(chǔ)上通過相應(yīng)的變換,即可得非線性回歸方程.精選課件16(3)非線

13、性相關(guān)問題中常見的幾種線性變換在實際問題中,常常要根據(jù)一批實驗數(shù)據(jù)繪出曲線,當(dāng)曲線類型不具備線性相關(guān)關(guān)系時,可以根據(jù)散點分布的形狀與已知函數(shù)的圖象進行比較,確定曲線的類型,再作變量替換,將曲線改為直線.下面是幾種容易通過變量替換轉(zhuǎn)化為直線的函數(shù)模型:精選課件17y=a+ ,y=a+ ,令令t= t= ,則有,則有y=a+bty=a+bt;y=axy=axb b,令,令z=ln yz=ln y,t=ln xt=ln x,m=ln am=ln a,則有,則有z=m+btz=m+bt;y=aey=aebxbx,令,令z=ln yz=ln y,m=ln a,m=ln a,則有則有z=m+btz=m+b

14、t;y= ,y= ,令令z=ln y,t= z=ln y,t= ,m=ln am=ln a,則有,則有z=m+btz=m+bt;y=a+bln xy=a+bln x,令,令t=ln xt=ln x,則有,則有z=a+btz=a+bt;y=bxy=bx2 2+a,+a,令令t=xt=x2 2,則有,則有y=bt+a.y=bt+a.bx1xbxae1x精選課件18例例 某種食品每公斤的生產(chǎn)成本y(元)與該食品生產(chǎn)的重量x(公斤)有關(guān),經(jīng)生產(chǎn)統(tǒng)計得到以下數(shù)據(jù):x123510203050100200y10.155.524.082.852.111.621.411.301.211.15通過以上數(shù)據(jù)判斷該食

15、品的成本y(元)與生產(chǎn)的重量x(公斤)的倒數(shù)1/x之間是否具有線性相關(guān)關(guān)系?若有,求出y關(guān)于1/x的回歸直線方程,并借此估計一下生產(chǎn)該食品500公斤時每公斤的生產(chǎn)成本是多少?(精確到0.01) 精選課件19精選課件20 于是 y 與1x的回歸方程為y8.973x1.125. 當(dāng) x500(公斤)時,y8.9735001.1251.14.即估計生產(chǎn)該食品 500 公斤時每公斤的生產(chǎn)成本是1.14 元 精選課件21X x精選課件222.為了解兒子身高與其父親身高的關(guān)系,隨機抽取5對父子的身高數(shù)據(jù)如下:則y關(guān)于x的線性回歸方程為().A.y=x-1 B.y=x+1C.y=88+12x D.y=176父親身高父親身高x(cm)174176176176178兒子身高兒子身高y(cm)175175176177177答案:C解析:方法一:由線性回歸直線方程過樣本中心(176,176),排除A,B答案,結(jié)合選項可得C為正確答案.方法二:將表中的五組數(shù)值分別代入選項驗證,可知y=88+12x最適合.精選課件23xx精選課件24xx精選課件25

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論