人教版數(shù)學高二《回歸分析的基本思想及其初步應用》 測試_第1頁
人教版數(shù)學高二《回歸分析的基本思想及其初步應用》 測試_第2頁
人教版數(shù)學高二《回歸分析的基本思想及其初步應用》 測試_第3頁
人教版數(shù)學高二《回歸分析的基本思想及其初步應用》 測試_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、即Q(ybxa)2來刻畫出n個點與回歸直線在整體上的偏差的平方和,顯打印版回歸分析的基本思想及其初步應用知識梳理一線性回歸方程的確定如果一組具有相關關系的數(shù)據(jù)(x,y),(x,y),(x,y),作出散點圖大致分布在一1122nn條直線附近,那么我們稱這樣的變量之間的關系為線性相關關系(也稱一元線性相關),這條直線就是回歸直線,記為ybxa那么如何求得參數(shù)a和b使得各點與此直線的距離的平方和為最小,即如何求得線性回歸方程呢?在所求回歸直線方程ybxa中,當x取x時,ybxa與實際收集到的數(shù)據(jù)y之iiii間的偏差為yyy(bxa),偏差的平方為(yy)2y(bxa)2(如圖1).iiiiiiiin

2、iii1然Q取最小值時的a,b的值就是我們所求的:(xx)(yy)xynxy(xx)xnx2bnniiiii1i1nn22ii1x,yn1y為樣本平均數(shù),(x,y)稱為樣本點ni1aybx其中(x,y)為樣本數(shù)據(jù),xiii1niinii中心,且所求線性回歸直線經過樣本點中心(如圖2所示)當回歸直線斜率b0時,為線性正相關,b0時為線性負相關.應注意,這個最小距離不是通常所指的各數(shù)據(jù)的點(x,y)到直線的距離,而是各數(shù)ii據(jù)點(x,y)沿平行y軸方向到直線的距離(如圖1所示)iiyybxayiy(yy)2ybxaiiyyixoxoxix圖2Q(ybxa)2展開,再合并,然后配方整理,從而求得a,

3、b.圖1對于上面參數(shù)a和b的求法原理及方法是簡單的,但是運算量較大,需要將niii1例如,當a,b,m,n取怎樣實數(shù)時,(an)2(bm)2k的值為最小,顯然當am,bn時最小值為k,像這樣配方求最值的方法是經常用到的,線性回歸方程ybxa中的參數(shù)b,a就是這樣求出的.打印版Q(,)(yx)2取最小值時,的值打印版教材中用了添項法較為簡捷的求出了截距a和斜率b分別是使niii1(xx)(yy)(xx)求得ni1niii2,yx的值,請同學們體會其解法i1線性回歸方程的確定是進行回歸分析的基礎二回歸分析:是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法線性相關關系的強弱(xx)(yy)兩個變

4、量之間線性相關關系的樣本相關系數(shù)rni1ii衡量線性相(xx)(yy)nn2ii2i1i1性關系的強弱,由于分子與斜率b的分子一樣,因此,當r0時,兩個變量正相關;當r0時兩個變量負相關當r的絕對值接近,表明兩個變量的線性相關性很強;當r的絕對值接近,表明兩個變量之間幾乎不存在線性相關關系規(guī)定當r0.75時,我們認為兩個變量有很強的線性相關關系解釋變量與隨機誤差對預報精度的影響以及殘差分析(1)有關概念線性回歸模型ybxae其中a和b為模型的未知參數(shù);x稱為解釋變量,y稱為預報變量;E(e)0,D(e)2yeyyiiyiiybxae是y與ybxa之間的誤差,e叫隨機誤差。yiox(2)隨機誤差

5、的方差估計值衡量回歸方程的預報精度隨機誤差的估計值為eiyiyiyibxiaixei稱為相應于樣本點(xi,yi)的殘差(如圖)圖321e0,由于隨機誤差的均值E(e)n因此,可以用隨機誤差的方差估計值121eiQ(a,b)(其中ni1i2n2n2ni1n2,殘差平方和為Q(a,b)(yy)2)衡量回歸方程的預報精度,顯然2越niii1小,預報精度越高。(3)通過殘差分析判斷模型擬合效果由eiyiyiyibxia計算出殘差e1,e2,en,然后選取橫坐標為編號、或解釋變量或預報變量,縱坐標為殘差作出殘差圖通過圖形分析,如果樣本打印版打印版點的殘差較大,就要分析樣本數(shù)據(jù)的采集是否有錯誤;另一方面

6、,可以通過殘差點分布的水平帶狀區(qū)域的寬窄,說明模型擬合效果,反映回歸方程的預報精度3相關指數(shù)R2反應模型的擬合效果(yy)(yy)(yy)(yy)(yy)R21n2iii1n2iinn2iiiii1i1n2ii2i1(1)變量理解:i1(yy)nii2為總偏差平方和,表示解釋變量和隨機誤差產生的總的效應;(yy)2為殘差平方和,表示了隨機誤差效應;i1niii1(yy)(yy)nni1iiii2i12,表示了解釋變量效應(yy)n,反映了隨機誤差對預報變量(總效應)的貢獻率;()模型擬合效果n2iii1(yy)2iii1(yy)(yy)R21n2iii1n2iii1反映了解釋變量對預報變量(總

7、效應)的貢獻率;(yy)n越接近0),表示回歸的效果越好,因此,R2越接近(即niii1(yy)2ii2i1即解釋變量和預報變量的線性相關性越強三非線性回歸的問題轉化為線性回歸問題(1)作散點圖確定曲線模型根據(jù)收集的數(shù)據(jù)作散點圖(如圖),可見兩個變量不呈線性相關關系而是分布在某一條指數(shù)函數(shù)曲線ycec2x的周圍,1也可以認為樣本點集中在某二次o曲線ycx2c的附近34(2)非線性轉化為線性這時通過對數(shù)變換把指數(shù)關系ycec2x1變?yōu)榫€性關系zcxlnc;通過換元把二次函數(shù)ycx2c關系變換為2134線性關系yctc在這兩種情況下就可以利用線性回歸模型,建立y和x之34間的非線性回歸方程了(3)比較兩種模型的擬合效果打印版打印版對于給定的樣本點(x,y),(x,y),(x,y),1122nn可以通過轉換后的對應數(shù)表作散點圖來確定線性回歸的擬合情況,判斷選用哪一種曲線模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論