數(shù)據(jù)擬合方法_第1頁
數(shù)據(jù)擬合方法_第2頁
數(shù)據(jù)擬合方法_第3頁
數(shù)據(jù)擬合方法_第4頁
數(shù)據(jù)擬合方法_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第二講 數(shù)據(jù)擬合方法 在實(shí)驗(yàn)中,實(shí)驗(yàn)和戡測常常會(huì)產(chǎn)生大量的數(shù)據(jù)。為了解釋這些數(shù)據(jù)或者根據(jù)這些數(shù)據(jù)做出預(yù)測、判斷,給決策者提供重要的依據(jù)。需要對測量數(shù)據(jù)進(jìn)行擬合,尋找一個(gè)反映數(shù)據(jù)變化規(guī)律的函數(shù)。數(shù)據(jù)擬合方法與數(shù)據(jù)插值方法不同,它所處理的數(shù)據(jù)量大而且不能保證每一個(gè)數(shù)據(jù)沒有誤差,所以要求一個(gè)函數(shù)嚴(yán)格通過每一個(gè)數(shù)據(jù)點(diǎn)是不合理的。數(shù)據(jù)擬合方法求擬合函數(shù),插值方法求插值函數(shù)。這兩類函數(shù)最大的不同之處是,對擬合函數(shù)不要求它通過所給的數(shù)據(jù)點(diǎn),而插值函數(shù)則必須通過每一個(gè)數(shù)據(jù)點(diǎn)。例如,在某化學(xué)反應(yīng)中,測得生成物的質(zhì)量濃度y (10 3 g/cm3)與時(shí)間t (min)的關(guān)系如表所示t12346810121416y

2、4.006.418.018.799.539.8610.3310.4210.5310.61顯然,連續(xù)函數(shù)關(guān)系y(t)是客觀存在的。但是通過表中的數(shù)據(jù)不可能確切地得到這種關(guān)系。何況,由于儀器和環(huán)境的影響,測量數(shù)據(jù)難免有誤差。因此只能尋求一個(gè)近擬表達(dá)式y(tǒng) = (t)尋求合理的近擬表達(dá)式,以反映數(shù)據(jù)變化的規(guī)律,這種方法就是數(shù)據(jù)擬合方法。數(shù)據(jù)擬合需要解決兩個(gè)問題:第一,選擇什么類型的函數(shù)作為擬合函數(shù)(數(shù)學(xué)模型);第二,對于選定的擬合函數(shù),如何確定擬合函數(shù)中的參數(shù)。數(shù)學(xué)模型應(yīng)建立在合理假設(shè)的基礎(chǔ)上,假設(shè)的合理性首先體現(xiàn)在選擇某種類型的擬合函數(shù)使之符合數(shù)據(jù)變化的趨勢(總體的變化規(guī)律)。擬合函數(shù)的選擇比較靈活

3、,可以選擇線性函數(shù)、多項(xiàng)式函數(shù)、指數(shù)函數(shù)、三角函數(shù)或其它函數(shù),這應(yīng)根據(jù)數(shù)據(jù)分布的趨勢作出選擇。為了問題敘述的方便,將例1的數(shù)據(jù)表寫成一般的形式tx1x2x3x4x5x6x7x8x9x10yy1y2y3y4y5y6y7y8y9y10一線性擬合(線性模型)假設(shè)擬合函數(shù)是線性函數(shù),即擬合函數(shù)的圖形是一條平面上的直線。而表中的數(shù)據(jù)點(diǎn)未能精確地落在一條直線上的原因是實(shí)驗(yàn)數(shù)據(jù)的誤差。則下一步是確定函數(shù)y= a + b x中系數(shù)a和bt 各等于多少?從幾何背景來考慮,就是要以a和b作為待定系數(shù),確定一條平面直線使得表中數(shù)據(jù)所對應(yīng)的10個(gè)點(diǎn)盡可能地靠近這條直線。一般來講,數(shù)據(jù)點(diǎn)將不會(huì)全部落在這條直線上,如果第

4、k個(gè)點(diǎn)的數(shù)據(jù)恰好落在這條直線上,則這個(gè)點(diǎn)的坐標(biāo)滿足直線的方程,即a + b xk = y k如果這個(gè)點(diǎn)不在直線上,則它的坐標(biāo)不滿足直線方程,有一個(gè)絕對值為的差異(殘差)。于是全部點(diǎn)處的總誤差是這是關(guān)于a和b的一個(gè)二元函數(shù),合理的做法是選取a和b ,使得這個(gè)函數(shù)取極小值。但是在實(shí)際求解問題時(shí)為了操作上的方便,常常是求a和b使得函數(shù)達(dá)到極小。為了求該函數(shù)的極小值點(diǎn),令,得, 這是關(guān)于未知數(shù)a和b的線性方程組。它們被稱為法方程,又可以寫成求解這個(gè)二元線性方程組便得待定系數(shù)a和b,從而得線性擬合函數(shù) y = a + b x。下圖中直線是數(shù)據(jù)的線性擬合的結(jié)果。二二次函數(shù)擬合(二次多項(xiàng)式模型)假設(shè)擬合函數(shù)

5、不是線性函數(shù),而是一個(gè)二次多項(xiàng)式函數(shù)。即擬合函數(shù)的圖形是一條平面上的拋物線,而表中的數(shù)據(jù)點(diǎn)未能精確地落在這條拋物線上的原因是實(shí)驗(yàn)數(shù)據(jù)的誤差。則下一步是確定函數(shù)y = a0 + a1 x + a2 x 2中系數(shù)a0、a1和a2t 各等于多少?從幾何背景來考慮,就是要以a0、a1和a2為待定系數(shù),確定二次曲線使得表中數(shù)據(jù)所對應(yīng)的10個(gè)點(diǎn)盡可能地靠近這條曲線。一般來講,數(shù)據(jù)點(diǎn)將不會(huì)全部落在這條曲線上,如果第k個(gè)點(diǎn)的數(shù)據(jù)恰好落在曲線上,則這個(gè)點(diǎn)的坐標(biāo)滿足二次曲線的方程,即a0 + a1 xk + a2 xk 2 = yk如果這個(gè)點(diǎn)不在曲線上,則它的坐標(biāo)不滿足曲線方程,有一個(gè)誤差(殘差)。于是全部點(diǎn)處的

6、總誤差用殘差平方和表示這是關(guān)于a0、a1和a2的一個(gè)三元函數(shù),合理的做法是選取a0、a1和a2 ,使得這個(gè)函數(shù)取極小值。為了求該函數(shù)的極小值點(diǎn),令,得這是關(guān)于待定系數(shù)a0、a1和a2的線性方程組,寫成等價(jià)的形式為這就是法方程,求解這一方程組可得二次擬合函數(shù)中的三個(gè)待定系數(shù)。下圖反映了例題所給數(shù)據(jù)的二次曲線擬合的結(jié)果三 數(shù)據(jù)的n次多項(xiàng)式擬合 x x1 x2 xm f(x) y1 x2 ym已知函數(shù)在個(gè)離散點(diǎn)處的函數(shù)值,假設(shè)擬合函數(shù)是n次多項(xiàng)式,則需要用所給數(shù)據(jù)來確定下面的函數(shù)y = a0 + a1 x + a2 x 2 + + an x n這里要做一個(gè)假設(shè),即多項(xiàng)式的階數(shù)n應(yīng)小于題目所給數(shù)據(jù)的數(shù)

7、目m(例題中m = 10)。類似前面的推導(dǎo),可得數(shù)據(jù)的n次多項(xiàng)式擬合中擬合函數(shù)的系數(shù)應(yīng)滿足的正規(guī)方程組如下從這一方程組可以看出,線性擬合方法和二次擬合方法是多項(xiàng)式擬合的特殊情況。從算法上看,數(shù)據(jù)最小二乘擬合的多項(xiàng)式方法是解一個(gè)超定方程組( m n)的最小二乘解。而多項(xiàng)式擬合所引出的正規(guī)方程組恰好是用超定方程組的系數(shù)矩陣的轉(zhuǎn)置矩陣去左乘超定方程組左、右兩端所得。正規(guī)方程組的系數(shù)矩陣是一個(gè)病態(tài)矩陣,這類方程組被稱為病態(tài)方程組。當(dāng)系數(shù)矩陣或者是右端向量有微小的誤差時(shí),可能引起方程組準(zhǔn)確解有很大的誤差。為了避免求解這樣的線性方程組,在做多項(xiàng)式擬合時(shí)可以將多項(xiàng)式中的各次冪函數(shù)做正交化變換,使得所推出的正

8、規(guī)方程的系數(shù)矩陣是對角矩陣。四點(diǎn)集x1,x2,xm上的正交多項(xiàng)式系多項(xiàng)式q0(x),q1(x),q2(x),qn(x)在點(diǎn)集x1,x2,xm上的正交 正交多項(xiàng)式系可以認(rèn)為是冪函數(shù)系:1,x,x 2,x n通過正交變換而得到的一組函數(shù)。正交多項(xiàng)式系構(gòu)造的方法如下:q0(x)=1,q0(x) = x a1 ,(a1 = ),qk(x) = (x - ak) qk -1(x) - bk qk-2(x) ,( k = 2,3,n)其中,五用正交多項(xiàng)式系組成擬合函數(shù)的多項(xiàng)式擬合考慮擬合函數(shù):,將數(shù)據(jù)表 x x1 x2 xm f(x) y1 x2 ym中的數(shù)據(jù)代入,得超定方程(m n)其系數(shù)矩陣為由于多項(xiàng)

9、式q0(x),q1(x),q2(x),qn(x)在點(diǎn)集x1,x2,xm上的正交,所以超定方程組的系數(shù)矩陣中不同列的列向量是相互正交的向量組。于是用這一矩陣的轉(zhuǎn)置矩陣去左乘超定方程組左、右兩端得正規(guī)方程組 = 其中,。因?yàn)檎?guī)方程組中每一個(gè)方程都是一元一次方程可以直接寫出原超方程組的最小二乘解,所以擬合函數(shù)為這一結(jié)果與用次多項(xiàng)式擬合所得結(jié)果在理論是完全一樣的,只是形式上不同、算法實(shí)現(xiàn)上避免了解病態(tài)方程組。六指數(shù)函數(shù)的數(shù)據(jù)擬合問題1:世界人中預(yù)測問題 下表給出了本世紀(jì)六十年代世界人口的統(tǒng)計(jì)數(shù)據(jù)(單位:億)年196019611962196319641965196619671968人口29.7230.

10、6131.5132.1332.3432.8533.5634.2034.83有人根據(jù)表中數(shù)據(jù),預(yù)測公元2000年世界人口會(huì)超過 60億。這一結(jié)論在六十年代末令人難以置信,但現(xiàn)在已成為事實(shí)。試建立數(shù)學(xué)模型并根據(jù)表中數(shù)據(jù)推算出2000年世界人口的數(shù)量。根據(jù)馬爾薩斯人口理論,人口數(shù)量按指數(shù)遞增的規(guī)律發(fā)展。記人口數(shù)為 N(t),則有指數(shù)函數(shù)?,F(xiàn)需要根據(jù)六十年代的人口數(shù)據(jù)確定函數(shù)表達(dá)式中兩個(gè)常數(shù)a、b。為了計(jì)算方便,對表達(dá)式兩邊取對數(shù),得 ,令 。于是。(1)計(jì)算出表中人口數(shù)據(jù)的對數(shù)值yk = ln Nk ( k = 1,2,9)(2) 根據(jù)表中數(shù)據(jù)寫出關(guān)于兩個(gè)未知數(shù)a 、b的9個(gè)方程的超定方程組(方程數(shù)

11、多于未知數(shù)個(gè)數(shù)的方程組)a + b t k = y k ( k = 1,2,9)其中,t1 =1960,t2 =1961,t3 =1962,t9 =1968; y1= ln29.72,y2 = ln 30.61,y9 = ln34.83。(3) 利用MATLAB解線性方程組Ax=c的命令A(yù)c計(jì)算出a 、b的值,并寫出人口增長函數(shù)。利用人口增長函數(shù)計(jì)算出2000年世界人口數(shù)據(jù):N(2000) 七多元線性函數(shù)的數(shù)據(jù)擬合問題2 人的耗氧能力的數(shù)據(jù)擬合。人的耗氧能力y (ml/minkg)與下列變量有關(guān)x1 年齡x2 體重x3 1.5英里跑步所用時(shí)間x4 靜止時(shí)心速x5 跑步時(shí)最大心速某健身中心對31個(gè)自愿者進(jìn)行測試,得到31組數(shù)據(jù)(每一組數(shù)據(jù)有6個(gè)數(shù))ykx1kx2kx3kx4kx5k(k = 1,31)令耗氧能力為因變量,其它的指標(biāo)為自變量,建立線性模型y = a0 + a1 x1+ a2 x2+ a3 x3+ a4 x4+ a5 x5為了確定6個(gè)系數(shù),利

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論