數(shù)學(xué)建模數(shù)據(jù)分析資料_第1頁(yè)
數(shù)學(xué)建模數(shù)據(jù)分析資料_第2頁(yè)
數(shù)學(xué)建模數(shù)據(jù)分析資料_第3頁(yè)
數(shù)學(xué)建模數(shù)據(jù)分析資料_第4頁(yè)
數(shù)學(xué)建模數(shù)據(jù)分析資料_第5頁(yè)
已閱讀5頁(yè),還剩229頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、一. 一元數(shù)據(jù)處理方法二. 多元數(shù)據(jù)處理方法三.如何寫好建模競(jìng)賽論文數(shù)據(jù)處理專題數(shù)據(jù)處理專題數(shù)據(jù)處理是指用簡(jiǎn)明而嚴(yán)格的方法把獲得的實(shí)驗(yàn)數(shù)據(jù)所代表的事物內(nèi)在的規(guī)律提煉出來(lái),得出結(jié)果的加工過(guò)程,包括數(shù)據(jù)記錄、描繪曲線,從帶有誤差的數(shù)據(jù)中提取參數(shù),驗(yàn)證和尋找經(jīng)驗(yàn)規(guī)律,外推實(shí)驗(yàn)數(shù)據(jù)等等。本章介紹一些最基本的數(shù)據(jù)處理方法。1.插值插值 2.擬合及線性回歸擬合及線性回歸 在解決實(shí)際問(wèn)題的生產(chǎn)(或工程)實(shí)踐和科學(xué)實(shí)驗(yàn)過(guò)程中,通常需要通過(guò)研究某些變量之間的函數(shù)關(guān)系來(lái)幫助我們認(rèn)識(shí)事物的內(nèi)在規(guī)律和本質(zhì)屬性,而這些變量之間的未知函數(shù)關(guān)系又常常隱含在從試驗(yàn)、觀測(cè)得到的一組數(shù)據(jù)之中。因此,能否根據(jù)一組試驗(yàn)觀測(cè)數(shù)據(jù)找到變

2、量之間相對(duì)準(zhǔn)確的函數(shù)關(guān)系就成為解決實(shí)際問(wèn)題的關(guān)鍵 例如在工程實(shí)踐和科學(xué)實(shí)驗(yàn)中,常常需要從一組試驗(yàn)觀測(cè)數(shù)據(jù)(xi ,yi ) ,i = 0,1,.,n之中找到自變量x與因變量y 之間的函數(shù)關(guān)系,一般可用一個(gè)近似函數(shù)y = f (x)來(lái)表示。函數(shù)y = f (x)的產(chǎn)生辦法因觀測(cè)數(shù)據(jù)和要求不同而異,通??刹捎脭?shù)據(jù)擬合與函數(shù)插值兩種辦法來(lái)實(shí)現(xiàn)。 數(shù)據(jù)擬合數(shù)據(jù)擬合主要是考慮到觀測(cè)數(shù)據(jù)受隨機(jī)觀測(cè)誤差的影響,進(jìn)而尋求整體誤差最小、能較好反映觀測(cè)數(shù)據(jù)的近似函數(shù)y = f (x),此時(shí)并不要求所得到的近似函數(shù)y = f (x)滿足yi= f (xi) , i = 0,1,n。 函數(shù)插值函數(shù)插值則要求近似函數(shù)y

3、 = f (x)在每一個(gè)觀測(cè)點(diǎn) xi 處一定要滿足y i= f (xi) , i = 0,1,n ,在這種情況下,通常要求觀測(cè)數(shù)據(jù)相對(duì)比較準(zhǔn)確,即不考慮觀測(cè)誤差的影響。在實(shí)際問(wèn)題中,通過(guò)觀測(cè)數(shù)據(jù)能否正確揭示某些變量之間的關(guān)系,進(jìn)而正確認(rèn)識(shí)事物的內(nèi)在規(guī)律與本質(zhì)屬性,往往取決于兩方面因素。其一其一是觀測(cè)數(shù)據(jù)的準(zhǔn)確性或準(zhǔn)確程度,這是因?yàn)樵讷@取觀測(cè)數(shù)據(jù)的過(guò)程中一般存在隨機(jī)測(cè)量誤差,導(dǎo)致所討論的變量成為隨機(jī)變量。其二其二是對(duì)觀測(cè)數(shù)據(jù)處理方法的選擇,即到底是采用插值方法還是用擬合方法,插值方法之中、擬合方法之中又選用哪一種插值或擬合技巧來(lái)處理觀測(cè)數(shù)據(jù)。插值問(wèn)題忽略了觀測(cè)誤差的影響,而擬合問(wèn)題則考慮了觀測(cè)誤

4、差的影響。但由于觀測(cè)數(shù)據(jù)客觀上總是存在觀測(cè)誤差,而擬合函數(shù)大多數(shù)情況下是通過(guò)經(jīng)驗(yàn)公式獲得的,因此要正確揭示事物的內(nèi)在規(guī)律,往往需要對(duì)大量的觀測(cè)數(shù)據(jù)進(jìn)行分析,尤為重要的是進(jìn)行統(tǒng)計(jì)分析。統(tǒng)計(jì)分析的方法有許多,如方差分析、回歸分析等。 數(shù)據(jù)擬合雖然較有效地克服了隨機(jī)觀測(cè)誤差的影響,但從數(shù)理統(tǒng)計(jì)的角度看,根據(jù)一個(gè)樣本計(jì)算出來(lái)的擬合函數(shù)(系數(shù)),只是擬合問(wèn)題的一個(gè)點(diǎn)估計(jì),還不能完全說(shuō)明其整體性質(zhì)。因此,還應(yīng)該對(duì)擬合函數(shù)作區(qū)間估計(jì)或假設(shè)檢驗(yàn),如果置信區(qū)間太大或包含零點(diǎn),則由計(jì)算得到的擬合函數(shù)系數(shù)的估計(jì)值就毫無(wú)意義。這里所采用的統(tǒng)計(jì)分析方法就是所謂的回歸分析。另外還可用方差分析的方法對(duì)模型的誤差作定量分析。

5、 對(duì)于插值方法,本文簡(jiǎn)單介紹最常用的插值法的基本結(jié)論及其Matlab實(shí)現(xiàn)問(wèn)題。由于數(shù)據(jù)擬合問(wèn)題必須作區(qū)間估計(jì)或假設(shè)檢驗(yàn),所以除了介紹最基本的數(shù)據(jù)擬合方法最小二乘法的基本結(jié)論及其Matlab實(shí)現(xiàn)問(wèn)題外,我們專門介紹了對(duì)數(shù)值擬合問(wèn)題進(jìn)行區(qū)間估計(jì)或假設(shè)檢驗(yàn)的統(tǒng)計(jì)方法。即介紹回歸分析方法及其Matlab實(shí)現(xiàn)。 數(shù)據(jù)處理問(wèn)題通常情況下只是某個(gè)復(fù)雜實(shí)際問(wèn)題的一個(gè)方面或部分內(nèi)容,因而這里所介紹的數(shù)據(jù)處理方法函數(shù)插值和數(shù)據(jù)擬合的方法(包括回歸分析)通常只能解決實(shí)際問(wèn)題中的部分問(wèn)題計(jì)算問(wèn)題。一般來(lái)說(shuō),對(duì)實(shí)際問(wèn)題進(jìn)行數(shù)學(xué)建模需要用到多方面知識(shí),只有很少的情況下可以單獨(dú)使用本章所介紹的內(nèi)容,故我們最后以修改后的美國(guó)

6、91年數(shù)學(xué)建模A題為例說(shuō)明如何使用數(shù)值計(jì)算知識(shí)建立數(shù)學(xué)模型,從而解決實(shí)際問(wèn)題的方法。 在生產(chǎn)和實(shí)驗(yàn)中,常常需要根據(jù)一張表格表示的函在生產(chǎn)和實(shí)驗(yàn)中,常常需要根據(jù)一張表格表示的函數(shù)推算該表中沒(méi)有的函數(shù)值數(shù)推算該表中沒(méi)有的函數(shù)值.解決此類問(wèn)題的簡(jiǎn)單途徑之解決此類問(wèn)題的簡(jiǎn)單途徑之一利用插值法。一利用插值法。 插值在數(shù)學(xué)發(fā)展史上是一個(gè)老問(wèn)題,它是和插值在數(shù)學(xué)發(fā)展史上是一個(gè)老問(wèn)題,它是和Gauss, Lagrange, Newton等在著名數(shù)學(xué)家連在一起的。它最初等在著名數(shù)學(xué)家連在一起的。它最初來(lái)源于天體計(jì)算來(lái)源于天體計(jì)算由若干觀測(cè)值計(jì)算人一時(shí)刻星球的由若干觀測(cè)值計(jì)算人一時(shí)刻星球的位置?,F(xiàn)在,插值法在工程

7、技術(shù)和數(shù)據(jù)處理有許多直接位置。現(xiàn)在,插值法在工程技術(shù)和數(shù)據(jù)處理有許多直接應(yīng)用,而且也是數(shù)值積分、數(shù)值微分的基礎(chǔ)。應(yīng)用,而且也是數(shù)值積分、數(shù)值微分的基礎(chǔ)。1.1 插值概念與基礎(chǔ)理論插值概念與基礎(chǔ)理論1.1.1 插值問(wèn)題的提法對(duì)于給定的函數(shù)表xx0 x1. xnY=f(x) y0y1. yn(其中其中 在在a,b上連續(xù),上連續(xù), x0,x1,xn 是是 a,b上的上的 n+1個(gè)互異的點(diǎn)個(gè)互異的點(diǎn)),在某函數(shù)類,在某函數(shù)類 (x) 中求一個(gè)函數(shù)中求一個(gè)函數(shù) (x) ,使,使( )yf x (xi)=yi , (i=0,1,2,n) (2)(1)并用函數(shù)并用函數(shù) (x) 作為函數(shù)作為函數(shù) y=f(x)

8、 的近似函數(shù),即的近似函數(shù),即y= f(x) (x) , ( xa,b ) 這類問(wèn)題稱為這類問(wèn)題稱為插值問(wèn)題插值問(wèn)題。 a,b稱為稱為插值區(qū)間插值區(qū)間, x0 , x1, . , xn 稱為稱為插值節(jié)點(diǎn)插值節(jié)點(diǎn),(,(2)稱為)稱為插值條件插值條件,插值條件,插值條件是選擇近似函數(shù)的標(biāo)準(zhǔn),滿足此條件的近似函數(shù)是選擇近似函數(shù)的標(biāo)準(zhǔn),滿足此條件的近似函數(shù) (x) 稱稱為為插值函數(shù)插值函數(shù), f(x) 稱為稱為被插值函數(shù)被插值函數(shù)。 函數(shù)類函數(shù)類 (x) 有多種取法,常用的有代數(shù)多項(xiàng)式、有多種取法,常用的有代數(shù)多項(xiàng)式、三角函數(shù)和有理函數(shù)。三角函數(shù)和有理函數(shù)。 最簡(jiǎn)單的插值函數(shù)是代數(shù)多項(xiàng)式最簡(jiǎn)單的插值

9、函數(shù)是代數(shù)多項(xiàng)式,相應(yīng)的插值問(wèn)題稱為多項(xiàng)式插值多項(xiàng)式插值。 最簡(jiǎn)單的插值函數(shù)是代數(shù)多項(xiàng)式最簡(jiǎn)單的插值函數(shù)是代數(shù)多項(xiàng)式,相應(yīng)的插值問(wèn)題稱為多項(xiàng)式插值多項(xiàng)式插值。 求)(xf的n次插值多項(xiàng)式( )nypx 的幾何意義,就是)(xfy 上的若干個(gè)節(jié)點(diǎn),作一條代數(shù)曲線( )nypx 來(lái)近似代替曲線)(xfy 。如圖所示。 通過(guò)曲線1.2 插值多項(xiàng)式的求法插值多項(xiàng)式的求法 在前面討論插值多項(xiàng)式的存在唯一性時(shí),實(shí)際上已提供在前面討論插值多項(xiàng)式的存在唯一性時(shí),實(shí)際上已提供了它的一種求法,即通過(guò)求解線性方程組來(lái)確定其系數(shù)了它的一種求法,即通過(guò)求解線性方程組來(lái)確定其系數(shù)ai (i=0,1,2,n) 但是這種方法

10、不僅計(jì)算量大,而且因不能獲得簡(jiǎn)明的表但是這種方法不僅計(jì)算量大,而且因不能獲得簡(jiǎn)明的表達(dá)式而給理論和應(yīng)用研究帶來(lái)不便。在這里我們學(xué)習(xí)兩種達(dá)式而給理論和應(yīng)用研究帶來(lái)不便。在這里我們學(xué)習(xí)兩種簡(jiǎn)便而實(shí)用的求答。簡(jiǎn)便而實(shí)用的求答。1.2.1 拉格朗日插值多項(xiàng)式拉格朗日插值多項(xiàng)式 在線性代數(shù)中知道,所有次數(shù)不超過(guò)在線性代數(shù)中知道,所有次數(shù)不超過(guò)n次的多項(xiàng)式構(gòu)次的多項(xiàng)式構(gòu)成一個(gè)成一個(gè)n+1維線性空間。其基有各種不同的取法。因此維線性空間。其基有各種不同的取法。因此盡管滿足條件(盡管滿足條件(4)的)的n次插值多項(xiàng)式是唯一的,然而它次插值多項(xiàng)式是唯一的,然而它的表達(dá)式可以有多種不同的形式。如果取滿足條件:的表

11、達(dá)式可以有多種不同的形式。如果取滿足條件:0,()1,kiikikl x 的一組n次多項(xiàng)式xlxlxlxln,210作為上述線性空間的基,則容易看出10010( )( )( )( )nnnk kklx ylx ylx yy lx n 是是一一個(gè)個(gè)次次數(shù)數(shù)不不超超過(guò)過(guò) 的的多多項(xiàng)項(xiàng)式式。且且滿滿足足插插值值條條件件(4 4)。因此,由n+1個(gè)代數(shù)多項(xiàng)式 xlxlxlxln,210線性生成的多項(xiàng)式(10)就是滿足插值條件的n次插值多項(xiàng)式。(10)(9)滿足條件(9)的多項(xiàng)式稱為n+1個(gè)節(jié)點(diǎn)的n次基本插值多項(xiàng)式(或n次基函數(shù)) xlxlxlxln,210 顯然,求拉格朗日多項(xiàng)式的關(guān)鍵是求n次插值基函

12、數(shù)。0,()1,kiikikl x 因此,可設(shè) 0111()().()().()kkkknlxA xxxxxxxxxx 因?yàn)?xlk為n次多項(xiàng)式,且n 011011()()()()( )()()()()nkkkkkkknkkxxxxxxxxlxxxxxxxxx 兩種特殊的兩種特殊的Lagrange插值多項(xiàng)式插值多項(xiàng)式1.線性插值線性插值(兩點(diǎn)插值兩點(diǎn)插值) 最簡(jiǎn)單的插值是線性插值最簡(jiǎn)單的插值是線性插值(此時(shí)此時(shí)n=1), 這時(shí)插值問(wèn)題就是這時(shí)插值問(wèn)題就是求一次多項(xiàng)式求一次多項(xiàng)式P1(x)=a0+a1x 使它滿足條件使它滿足條件P1(x0)=y0 , P1(x1)=y1 ,這時(shí)這時(shí)1001( )

13、xxlxxx 0110( )xxlxxx 于是線性插值多項(xiàng)式為于是線性插值多項(xiàng)式為011010110( )xxxxL xyyxxxx 即即100010( )()nyyLxyxxxx 它就是通過(guò)它就是通過(guò)M0(x0,y0)和和M1(x1,y1)兩點(diǎn)的線段兩點(diǎn)的線段.2.拋物插值拋物插值 線性插值僅僅用兩個(gè)節(jié)點(diǎn)以上的信息,精確度較差。為線性插值僅僅用兩個(gè)節(jié)點(diǎn)以上的信息,精確度較差。為了提高精確度,我們進(jìn)一步考察以下三點(diǎn)的插值問(wèn)題了提高精確度,我們進(jìn)一步考察以下三點(diǎn)的插值問(wèn)題(n=2):這時(shí)1200102()()( )()()xxxxlxxxxx 0211012()()( )()()xxxxlxxx

14、xx 0122021()()( )()()xxxxlxxxxx 由此得到拋物插值多項(xiàng)式由此得到拋物插值多項(xiàng)式20 01 12 2( )( )( )( )L xy l xy l xy l x 拋物插值又稱三點(diǎn)插值拋物插值又稱三點(diǎn)插值.xyln 例例1 1 已知已知的函數(shù)表的函數(shù)表x 10 11 12 13 14y 2.3026 2.3979 2.4849 2.5649 2.6391 ln(11.5)并估計(jì)誤差。并估計(jì)誤差。分別用拉格朗日線性和拋物線插值求分別用拉格朗日線性和拋物線插值求的近似值,的近似值,%lagrange插值法的程序插值法的程序function y=lagrange(x0,y0

15、,x);n=length(x0);m=length(x);for i=1:mz=x(i);s=0.0;for k=1:np=1.0;for j=1:nif j=kp=p*(z-x0(j)/(x0(k)-x0(j);endends=p*y0(k)+s;endy(i)=s;endclearx0=10 11 12 13 14 ;y0=2.3026 2.3979,2.4849,2.5649 2.6391;x=10:0.1:15;y=lagrange(x0,y0,x);plot(x0,y0,+,x,y) 1901年龍格年龍格(Runge) 給出一個(gè)例子給出一個(gè)例子: 定義在區(qū)間-1,1上,這是一個(gè)光滑函

16、數(shù),它的任意階導(dǎo)數(shù)都存在,對(duì)它在-1,1上作等距節(jié)點(diǎn)插值時(shí),插值多項(xiàng)式情況,見(jiàn)圖:從圖中,可見(jiàn),在靠近-1或1時(shí),余項(xiàng)會(huì)隨n值增大而增大,如P12(0.96)=36!但f(0.96)=0.25 21()1fxx-5-4-3-2-1012345-1.5-1-0.500.511.52n=2n=4n=6n=8n=10f(x)=1/(1+x2) 從圖中,還可發(fā)現(xiàn),在0附近插值效果是好的,即余項(xiàng)較小,另一種現(xiàn)象是插值多項(xiàng)式隨節(jié)點(diǎn)增多而振動(dòng)更多。 這種插值多項(xiàng)式當(dāng)節(jié)點(diǎn)增加時(shí)反而不能更好地接近被插之?dāng)?shù)的現(xiàn)象,稱為龍格現(xiàn)象龍格現(xiàn)象。 上述現(xiàn)象和定理,告訴我們用高次插值多項(xiàng)式是不妥當(dāng)?shù)?,從?shù)值計(jì)算上可解釋為高次

17、插值多項(xiàng)式的計(jì)算會(huì)帶來(lái)舍入誤差的增大,從而引起計(jì)算失真。那么如何提高插值精度呢?采用分段插值是一種辦法。實(shí)踐上作插值時(shí)一般只用一次、二次最多用三次插值多項(xiàng)式。分段線性插值的構(gòu)造分段線性插值的構(gòu)造: 設(shè)f(x)是定義在a,b上的函數(shù),在a,b上節(jié)點(diǎn) a= x0 x1x2xn-1xn=b, 的函數(shù)值為 y0 , y1 ,y2 ,yn-1 ,yn 。 (x)在每個(gè)子區(qū)間xi , xi+1(i=0,1,2,n-1)上是一次插 值多項(xiàng)式;11111 iiiiiiiiiixxxxxxxyxxxxyx,)(這種分段低次插值稱為分段線性插值分段線性插值.在幾何上就是用折線段帶代替曲線,故分段線性插值又稱為折線

18、插值折線插值.(,) ,0,1,kkxyin實(shí)際上是連接點(diǎn)的一條折線1.2.2 分段線性插值分段線性插值分段線性插值:分段線性插值:matalb調(diào)用格式:調(diào)用格式:yi=interp1(x,y,xi,linear)x,y為插值節(jié)點(diǎn),xi為待求節(jié)點(diǎn)分段線性插值曲線圖:-4-3-2-101234-1-0.8-0.6-0.4-0.200.20.40.60.81曲線的光滑性較差在節(jié)點(diǎn)處有尖點(diǎn) 但如果增加節(jié)點(diǎn)的數(shù)量減小步長(zhǎng),會(huì)改善插值效果xyln 例例1 1 已知已知的函數(shù)表的函數(shù)表x 10 11 12 13 14y 2.3026 2.3979 2.4849 2.5649 2.6391 ln(11.5)

19、并估計(jì)誤差。并估計(jì)誤差。分別用拉格朗日線性和拋物線插值求分別用拉格朗日線性和拋物線插值求的近似值,的近似值,clearx0=10 11 12 13 14 ;y0=2.3026 2.3979,2.4849 2.5649 2.6391 ;x=10:0.1:15;y1=interp1(x0,y0,x,linear);yy1=interp1(x0,y0,11.5,linear); y2=interp1(x0,y0,x,cubic);yy2=interp1(x0,y0,11.5,cubic);subplot(1,2,1)plot(x0,y0,+,x,y1,11.5,yy1,rO)title(Piecew

20、ise linear)subplot(1,2,2)plot(x0,y0,+,x,y2,11.5,yy2,rO)title(Piecewise cubic)分段二次插值分段二次插值即:選取跟節(jié)點(diǎn)x最近的三個(gè)節(jié)點(diǎn)xi-1,xi, xi+1進(jìn)行二次插值,即在區(qū)間xi-1, xi+1,?。哼@種分段的低次插值叫分段二次插值,在幾何上就是用分段拋物線代替y=f(x),故分段二次插值又和分段拋物插值。 11112iikikjijikjikxxxxyxLxf)()()()(matlab調(diào)用格式調(diào)用格式y(tǒng)i=interp1(x,y,xi,cubic) %二次多項(xiàng)式插值二次多項(xiàng)式插值什么是樣條:是 指飛機(jī)或輪船等

21、的制造過(guò)程中為描繪出光滑的外形曲線(放樣)所用的工具樣條本質(zhì)上是一段一段的三次多項(xiàng)式拼合而成的曲線在拼接處,不僅函數(shù)是連續(xù)的,且一階和二階導(dǎo)數(shù)也是連續(xù)的1946年,Schoenberg將樣條引入數(shù)學(xué),即所謂的樣條函數(shù) 1.3 三次樣條三次樣條插值插值,)(,)(),(),()1(2baCxSbaxSxSxS 即上連續(xù)都在區(qū)間上都是三次多項(xiàng)式在每個(gè)小區(qū)間,)()2(1kkxxxS處的函數(shù)值為在節(jié)點(diǎn)如果函數(shù)nxxxxf,)()3(10njyxfjj, 1 , 0,)( )S x而滿足njyxSjj, 1 , 0,)(上的三次樣條插值函數(shù)在為則稱,)()(baxfxS-(1)定義1. 的一個(gè)分割為區(qū)

22、間,10babxxxan:,)(上滿足條件在區(qū)間如果函數(shù)baxS1.4.1、三次樣條插值函數(shù)2( )s x由條件( ),不妨將記為1 ,1,2,.,iiisxs x xx xin( )= ( ),32( )(1)iiiixa xb xc xdisiiiiabcd其中 , , , 為待定系數(shù),共4n個(gè)。1由條件( ),有( )( )( )( )(1,2,.,1)(2)( )( )iiiiiixxxxinxxii+1ii+1ii+1ssssss3由條件( ),有( )(0,1,2,., )(3)iiis xyin 2342n容易看出,( )和( )共有個(gè)方程,為確定s(x)的4n個(gè)待定參數(shù),尚需再

23、給出兩個(gè)條件,即所謂邊界條件。通常使用的邊界條件有以下三類:000,nnnxfxfff第一類邊界條件是s ()=s ()=為給定的值。00000( ) nnnnnf xx - xs xx - xs xs xs xs xs xs x第三類邊界條件是周期條件。設(shè) ( )是周期函數(shù),不妨設(shè)以為一個(gè)周期,這時(shí)也應(yīng)以為周期的周期函數(shù),于是 s(x)在端點(diǎn)處滿足條件:(+0)= (-0); (+0)= (-0); (+0)= (-0).000nnnxfxfff第二類邊界條件是s ()=s ()=, 為給定的值。0=0nxx當(dāng)s ()=s ()時(shí),樣條函數(shù)在兩端點(diǎn)不受力,呈自然狀態(tài),故稱之為自然邊界條件。4

24、( )4( ).ns xns x 利用個(gè)條件求出三次樣條函數(shù)的個(gè)待定常數(shù),直接求解計(jì)算量很大,通常利用Matlab軟件求例2設(shè)f(x)為定義在0,3上的函數(shù),有下列函數(shù)值表xi0123yi00.521.503()0.2,()1,0,3( ).fxfxs x 且試求區(qū)間上滿足上述條件的三樣次條插值函數(shù)解 matlab求解s(x).程序?yàn)椋篶learx0=0 1 2 3;y0=0 0.5 2 1.5;x=0:0.1:3;pp1=csape(x0,y0,complete);y3=ppval(pp1,x);%計(jì)算插值函數(shù)在x處的值plot(x0,y0,+,x,y3,r)pp=csape(x,y,com

25、plete)breaks,coefs,npolys,ncoefs,dim=unmkpp(pp)( , ,)csape x y complete上述程序中函數(shù)是指定邊界條件的樣條插值函數(shù),csape返回一個(gè)包含三次樣條插值的pp形,或者說(shuō)是分段多項(xiàng)式的結(jié)構(gòu)。這個(gè)結(jié)構(gòu)包含了計(jì)算用戶希望的任何插值點(diǎn)數(shù)值的三次樣條值需要的所有信息。字符串complete表示所給邊界條件是第一類邊界條件;若將complete換成second表示第二類邊界條件;periodic表示第三類邊界條件。在第一類邊界條件和第二類邊界條件時(shí),邊界條件值放在y的第一個(gè)分量和最后一個(gè)分量的位置上。這樣y的分量的個(gè)數(shù)比x的分量的個(gè)數(shù)多。

26、例如,在例中,x=0 1 2 3y=0.2 0 0.5 2.0 1.5 -1周期邊界條件時(shí),無(wú)需指定邊界條件值。在計(jì)算一個(gè)三次樣條表達(dá)式的時(shí)候,必須將pp形中不同域提取出來(lái)進(jìn)行計(jì)算,這個(gè)過(guò)程可以由函數(shù)unmkpp完成,該函數(shù)的使用方法為:breaks,coefs,npolys,ncoefs,dim=unmkpp(pp)其中輸入變量pp是樣條插值函數(shù)csape的輸出變量,unmkpp的輸出變量有個(gè):breaks,coefs,npolys,ncoefs,dim。0123320111213,.( )()()():dim:iiiia a a as xa xxa xxa xxanpolysncoefsb

27、reaks:包含了插值節(jié)點(diǎn);coefs:是一個(gè)矩陣,其第i行是第i個(gè)多項(xiàng)式的系數(shù):即 中的系數(shù)。是多項(xiàng)式的個(gè)數(shù);是每個(gè)多項(xiàng)式系數(shù)的個(gè)數(shù);是樣條的維數(shù)。其中輸入變量pp是樣條插值函數(shù)csape的輸出變量,unmkpp的輸出變量有個(gè):breaks,coefs,npolys,ncoefs,dim。0123320111213,.( )()()():dim:iiiia a a as xa xxa xxa xxanpolysncoefsbreaks:包含了插值節(jié)點(diǎn);coefs:是一個(gè)矩陣,其第i行是第i個(gè)多項(xiàng)式的系數(shù):即 中的系數(shù)。是多項(xiàng)式的個(gè)數(shù);是每個(gè)多項(xiàng)式系數(shù)的個(gè)數(shù);是樣條的維數(shù)。運(yùn)行結(jié)果如下:pp=

28、 form:ppbreaks:0 1 2 3coefs:3 4 doublepieces:3order:4dim:13232320.180.2 ,0,11.04(1)1.26(1)1.28(1)0.5, 1,22,3(2)1.86(2)0.68(2)2.0,xxxxs xxxxxxxxx因此所求的三次樣條函數(shù)為0.28( )=0.68breaks= 0 1 2 3coefs= 0.2800 -0.1800 0.2000 0 -1.0400 1.2600 1.2800 0.5000 0.6800 -1.8600 0.6800 2.0000npolys= 3ncoefs= 4dim= 1例已知函數(shù)

29、值表xi1245yi1342( ).s x試求在區(qū)間,5 上滿足上述函數(shù)表所給出的插值條件的三次樣自然樣條插值函數(shù)解用Matlab求解s(x).程序?yàn)椋簒=;y=;pp=csape(x,y,second)breaks,coefs,npolys,ncoefs,dim=unmkpp(pp)運(yùn)行結(jié)果如下:pp= form:ppbreaks:1 2 4 5coefs:3 4 doublepieces:3order:4dim:1332321)2.125(1) 1,1,20.125(2)0.375(2)1.75(2)3, 2,44,5(4)1.125(4)1.25(4)4,xxxs xxxxxxxxx因此

30、所求的三次樣條函數(shù)為-0.125( )=0.375breaks= 1 2 4 5coefs= -0.1250 0 2.1250 1.0000 -0.1250 -0.3750 1.7500 3.0000 0.3750 -1.1250 -1.2500 4.0000 一維插值總結(jié)一維插值總結(jié) 插值函數(shù)一般是已知函數(shù)的線性組合或者稱為加權(quán)平均。在已知數(shù)據(jù)點(diǎn)較少時(shí),插值技術(shù)在工程實(shí)踐和科學(xué)實(shí)驗(yàn)中有著廣泛而又十分重要的應(yīng)用。例如在信息技術(shù)中的圖像重建、圖像放大過(guò)程中為避免圖像失真、扭曲而增加的插值補(bǔ)點(diǎn),建筑工程的外觀設(shè)計(jì),化學(xué)工程試驗(yàn)數(shù)據(jù)與模型分析,天文觀測(cè)數(shù)據(jù)、地理信息數(shù)據(jù)的處理,社會(huì)經(jīng)濟(jì)現(xiàn)象的統(tǒng)計(jì)分析

31、等方面,插值技術(shù)的應(yīng)用是不可或缺的。插值技術(shù)(插值技術(shù)(或方法)遠(yuǎn)不止這里所介紹的這些,但在解決實(shí)際問(wèn)題時(shí),對(duì)于一位插值問(wèn)題而言,前面介紹的插值方法已經(jīng)足夠了。剩下的問(wèn)題關(guān)鍵在于什么情況下使用、怎樣使用和使用何種插值方法的選擇上。拉格朗日插值函數(shù)在整個(gè)插值區(qū)間上有統(tǒng)一的解析表達(dá)式,其形式關(guān)于節(jié)點(diǎn)對(duì)稱,光滑性好。但缺點(diǎn)同樣明顯,這主要體現(xiàn)在高次插值收斂性差(龍格現(xiàn)象);增加節(jié)點(diǎn)時(shí)前期計(jì)算作廢,導(dǎo)致計(jì)算量大;一個(gè)節(jié)點(diǎn)函數(shù)值的微小變化(觀測(cè)誤差存在)將導(dǎo)致整個(gè)區(qū)間上插值函數(shù)都發(fā)生改變,因而穩(wěn)定性差等幾個(gè)方面。因此拉格朗日插值法多用于理論分析,在采用拉格朗日插值方法進(jìn)行插值計(jì)算時(shí)通常選取n 0.(4)

32、倒倒指指數(shù)數(shù)曲曲線線 y=axbe/其中 a0,(5)對(duì)對(duì)數(shù)數(shù)曲曲線線y=a+blogx,x0(6)S型型曲曲線線xbeay11、二維插值2、多元回歸分析3、聚類分析4、主成分分析二維插值的定義二維插值的定義 xyO O第一種(網(wǎng)格節(jié)點(diǎn)):第一種(網(wǎng)格節(jié)點(diǎn)): 已知已知 m n個(gè)節(jié)點(diǎn)個(gè)節(jié)點(diǎn) ),2 , 1;,.,2 , 1(),(njmizyxijji 其中其中jiyx ,互不相同,不妨設(shè)互不相同,不妨設(shè)bxxxam 21dyyycn 21 構(gòu)造一個(gè)二元函數(shù)構(gòu)造一個(gè)二元函數(shù)),(yxfz 通過(guò)全部已知節(jié)點(diǎn)通過(guò)全部已知節(jié)點(diǎn),即即再用再用),(yxf計(jì)算插值,即計(jì)算插值,即).,(*yxfz ),

33、1 ,0;,1 ,0(),(njmizyxfijji 第二種(散亂節(jié)點(diǎn)):第二種(散亂節(jié)點(diǎn)): yx0 0已知已知n個(gè)節(jié)點(diǎn)個(gè)節(jié)點(diǎn)),.,2 , 1(),(nizyxiii 其中其中),(iiyx互不相同,互不相同, 構(gòu)造一個(gè)二元函數(shù)構(gòu)造一個(gè)二元函數(shù)),(yxfz 通過(guò)全部已知節(jié)點(diǎn)通過(guò)全部已知節(jié)點(diǎn),即即),1 ,0(),(nizyxfiii 再用再用),(yxf計(jì)算插值,即計(jì)算插值,即).,(*yxfz 注意:注意:最鄰近插值一般不連續(xù)。具有連續(xù)性的最簡(jiǎn)單的插值是分片線性插值。最鄰近插值最鄰近插值x y(x1, y1)(x1, y2)(x2, y1)(x2, y2)O O 二維或高維情形的最鄰近

34、插值,與被插值點(diǎn)最鄰近的節(jié)點(diǎn)的函數(shù)值即為所求。 將四個(gè)插值點(diǎn)(矩形的四個(gè)頂點(diǎn))處的函數(shù)值依次簡(jiǎn)記為: 分片線性插值分片線性插值xy (xi, yj)(xi, yj+1)(xi+1, yj)(xi+1, yj+1)O Of (xi, yj)=f1,f (xi+1, yj)=f2,f (xi+1, yj+1)=f3,f (xi, yj+1)=f4插值函數(shù)為:jii1ij1jy)xx(xxyyy)yy)(ff ()xx)(ff (f)y, x(fj23i121第二片(上三角形區(qū)域):(x, y)滿足iii1ij1jy)xx(xxyyy插值函數(shù)為:)xx)(ff ()yy)(ff (f)y, x(fi

35、43j141注意注意:(x, y)當(dāng)然應(yīng)該是在插值節(jié)點(diǎn)所形成的矩形區(qū)域內(nèi)。顯然,分片線性插值函數(shù)是連續(xù)的;分兩片的函數(shù)表達(dá)式如下:第一片(下三角形區(qū)域): (x, y)滿足 雙線性插值是一片一片的空間二次曲面構(gòu)成。雙線性插值函數(shù)的形式如下:)dcy)(bax()y, x(f其中有四個(gè)待定系數(shù),利用該函數(shù)在矩形的四個(gè)頂點(diǎn)(插值節(jié)點(diǎn))的函數(shù)值,得到四個(gè)代數(shù)方程,正好確定四個(gè)系數(shù)。雙線性插值雙線性插值x y(x1, y1)(x1, y2)(x2, y1)(x2, y2)O O 要求要求x0,y0 x0,y0單調(diào);單調(diào);x x,y y可取為矩陣,或可取為矩陣,或x x取取行向量,行向量,y y取為列向

36、量,取為列向量,x,yx,y的值分別不能超出的值分別不能超出x0,y0 x0,y0的范圍。的范圍。z=interp2(x0,y0,z0,x,y,method)被插值點(diǎn)插值方法用用MATLAB作網(wǎng)格節(jié)點(diǎn)數(shù)據(jù)的插值作網(wǎng)格節(jié)點(diǎn)數(shù)據(jù)的插值插值節(jié)點(diǎn)被插值點(diǎn)的函數(shù)值nearest nearest 最鄰近插值最鄰近插值linear linear 雙線性插值雙線性插值cubic cubic 雙三次插值雙三次插值缺省時(shí)缺省時(shí), , 雙線性插值雙線性插值例:測(cè)得平板表面例:測(cè)得平板表面3 3* *5 5網(wǎng)格點(diǎn)處的溫度分別為:網(wǎng)格點(diǎn)處的溫度分別為: 82 81 80 82 84 82 81 80 82 84 79

37、63 61 65 81 79 63 61 65 81 84 84 82 85 86 84 84 82 85 86 試作出平板表面的溫度分布曲面試作出平板表面的溫度分布曲面z=f(x,y)z=f(x,y)的圖形。的圖形。輸入以下命令:x=1:5;y=1:3;temps=82 81 80 82 84;79 63 61 65 81;84 84 82 85 86;mesh(x,y,temps)1.先在三維坐標(biāo)畫出原始數(shù)據(jù),畫出粗糙的溫度分布曲圖.2以平滑數(shù)據(jù),在x、y方向上每隔0.2個(gè)單位的地方進(jìn)行插值.再輸入以下命令:xi=1:0.2:5;yi=1:0.2:3;zi=interp2(x,y,temp

38、s,xi,yi,cubic);mesh(xi,yi,zi)畫出插值后的溫度分布曲面圖. 例例 山區(qū)地貌:山區(qū)地貌: 在某山區(qū)測(cè)得一些地點(diǎn)的高程如下表。平面區(qū)域?yàn)樵谀成絽^(qū)測(cè)得一些地點(diǎn)的高程如下表。平面區(qū)域?yàn)?1200=x=4000,1200=y=3600)試作出該山區(qū)的地貌圖和等高線圖,并對(duì)幾種插值方法進(jìn)行比較。試作出該山區(qū)的地貌圖和等高線圖,并對(duì)幾種插值方法進(jìn)行比較。 X Y120016002000240028003200360040001200113012501280123010409005007001600132014501420140013007009008502000139015001

39、50014009001100106095024001500120011001350145012001150101028001500120011001550160015501380107032001500155016001550160016001600155036001480150015501510143013001200980 通過(guò)此例對(duì)最近鄰點(diǎn)插值、雙線性插值方法和雙三次插值方法的插值效果進(jìn)行比較。 插值函數(shù)插值函數(shù)griddata格式為格式為: cz =griddata(x,y,z,cx,cy,method)用用MATLABMATLAB作散點(diǎn)數(shù)據(jù)的插值計(jì)算作散點(diǎn)數(shù)據(jù)的插值計(jì)算 要求要求cx

40、cx取行向量,取行向量,cycy取為列向量。取為列向量。被插值點(diǎn)插值方法插值節(jié)點(diǎn)被插值點(diǎn)的函數(shù)值nearest nearest 最鄰近插值最鄰近插值linear linear 雙線性插值雙線性插值cubic cubic 雙三次插值雙三次插值v4- Matlab提供的插值方法提供的插值方法缺省時(shí)缺省時(shí), , 雙線性插值雙線性插值 例例 在某海域測(cè)得一些點(diǎn)在某海域測(cè)得一些點(diǎn)(x,y)(x,y)處的水深處的水深z z由下由下表給出,船的吃水深度為表給出,船的吃水深度為5 5英尺,在矩形區(qū)域(英尺,在矩形區(qū)域(7575,200200)* *(-50-50,150150)里的哪些地方船要避免進(jìn)入。)里的

41、哪些地方船要避免進(jìn)入。xyz129 140 103.5 88 185.5 195 1057.5 141.5 23 147 22.5 137.5 85.54 8 6 8 6 8 8xyz157.5 107.5 77 81 162 162 117.5-6.5 -81 3 56.5 -66.5 84 -33.59 9 8 8 9 4 9 ) 1( .150,50200,75. 2hd三次插值法作二維插值在矩形區(qū)域.1 輸入插值基點(diǎn)數(shù)據(jù)4.作出水深小于5的海域范圍,即z=5的等高線.3、作海底曲面圖實(shí)驗(yàn)作業(yè)實(shí)驗(yàn)作業(yè) 山區(qū)地貌:山區(qū)地貌:在某山區(qū)測(cè)得一些地點(diǎn)的高程如下表:在某山區(qū)測(cè)得一些地點(diǎn)的高程如下表

42、:( (平平面區(qū)域面區(qū)域1200=x=4000,1200=y=3600)1200=x=4000,1200=y F1-(k,n-k-1) ,則拒絕 H0,認(rèn)為 y 與 x1, xk之間顯著地有線性關(guān)系;否則就接受 H0,認(rèn)為 y 與 x1, xk之間線性關(guān)系不顯著.其中 niiyyU12(回回歸歸平平方方和和) niiieyyQ12)(殘差平方和)殘差平方和)F檢驗(yàn)法檢驗(yàn)法(2)預(yù)測(cè)預(yù)測(cè)(A)點(diǎn)預(yù)測(cè))點(diǎn)預(yù)測(cè)(B)區(qū)間預(yù)測(cè))區(qū)間預(yù)測(cè)1knQees1.5 逐步回歸分析逐步回歸分析 實(shí)際問(wèn)題中影響因變量的因素可能很多,我們希望從中挑選出影響顯著的自變量來(lái)建立回歸模型,這就涉及到變量選擇的問(wèn)題。逐步回歸

43、是一種從眾多變量中有效地選擇重要變量的方法。它是在多元線性回歸的基礎(chǔ)上派生出來(lái)的一種算法技巧。 “最優(yōu)最優(yōu)”的回歸方程的回歸方程就是包含所有對(duì)Y有影響的變量, 而不包含對(duì)Y影響不顯著的變量回歸方程。如果采用的自變量越多,則回歸平方和越大,殘差平方和越小,然而較多的變量來(lái)擬合回歸方程,得到的防策劃能夠穩(wěn)定性差,用它作預(yù)測(cè)可靠性差,精度低另一方面,如果采用了y 影響較小的變量而遺漏了重要變量,可導(dǎo)致估計(jì)量產(chǎn)生偏崎和不一致性為此,我們希望得到“最優(yōu)”的回歸方程(4)“有進(jìn)有出”的逐步回歸分析。(1)從所有可能的因子(變量)組合的回歸方程中選擇最優(yōu)者;(2)從包含全部變量的回歸方程中逐次剔除不顯著因子

44、;(3)從一個(gè)變量開(kāi)始,把變量逐個(gè)引入方程;選擇“最優(yōu)”的回歸方程有以下幾種方法:以第四種方法,即逐步回歸分析法逐步回歸分析法在篩選變量方面較為理想. 這個(gè)過(guò)程反復(fù)進(jìn)行,直至既無(wú)不顯著的變量從回歸方程中剔除,又無(wú)顯著變量可引入回歸方程時(shí)為止。逐步回歸分析法逐步回歸分析法的思想: 從一個(gè)自變量開(kāi)始,視自變量Y作用的顯著程度,從大到小地依次逐個(gè)引入回歸方程。 當(dāng)引入的自變量由于后面變量的引入而變得不顯著時(shí),要將其剔除掉。 引入一個(gè)自變量或從回歸方程中剔除一個(gè)自變量,為逐步回歸的一步。 對(duì)于每一步都要進(jìn)行Y值檢驗(yàn),以確保每次引入新的顯著性變量前回歸方程中只包含對(duì)Y作用顯著的變量。1.1多元線性回歸多

45、元線性回歸 b=regress( Y, X )npnnppxxxxxxxxxX.1.1.1212222111211nYYYY.21pb.101)確定回歸系數(shù)的點(diǎn)估計(jì)值:確定回歸系數(shù)的點(diǎn)估計(jì)值:ppxxy.1101. MATLAB統(tǒng)計(jì)工具箱中的回歸分析命令對(duì)一元線性回歸,取p=1即可.3、畫出殘差及其置信區(qū)間:畫出殘差及其置信區(qū)間: rcoplot(r,rint)2)求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型: b, bint,r,rint,stats=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計(jì)殘差用于檢驗(yàn)回歸模型的統(tǒng)計(jì)量,有三個(gè)數(shù)值:

46、相關(guān)系數(shù)r2、F值、與F對(duì)應(yīng)的概率p置信區(qū)間 顯著性水平(缺省時(shí)為0.05) 相關(guān)系數(shù) r2越接近 1,說(shuō)明回歸方程越顯著; F F1-(k,n-k-1)時(shí)拒絕 H0,F(xiàn) 越大,說(shuō)明回歸方程越顯著; 與 F 對(duì)應(yīng)的概率 p時(shí)拒絕 H0,回歸模型成立.例例1 解:解:1、輸入數(shù)據(jù):輸入數(shù)據(jù): x=143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164; X=ones(16,1) x; Y=88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102;2、回歸分析及檢驗(yàn):回歸分析及檢驗(yàn):

47、b,bint,r,rint,stats=regress(Y,X) b,bint,statsTo MATLAB(liti11)3、殘差分析,作殘差圖:、殘差分析,作殘差圖: rcoplot(r,rint) 從殘差圖可以看出,除第二個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說(shuō)明回歸模型 y=-16.073+0.7194x能較好的符合原始數(shù)據(jù),而第二個(gè)數(shù)據(jù)可視為異常點(diǎn). 4、預(yù)測(cè)及作圖:、預(yù)測(cè)及作圖:z=b(1)+b(2)*x plot(x,Y,k+,x,z,r)246810121416-5-4-3-2-101234Residual Case Order PlotResid

48、ualsCase Number返回返回To MATLAB(liti12)1.2多多 項(xiàng)項(xiàng) 式式 回回 歸歸 (1)一元多項(xiàng)式回歸)一元多項(xiàng)式回歸 1)確定多項(xiàng)式系數(shù)的命令:p,S=polyfit(x,y,m)2)一元多項(xiàng)式回歸命令:polytool(x,y,m)A、回歸:、回歸:y=a1xm+a2xm-1+amx+am+1 此命令產(chǎn)生一個(gè)交互式的畫面,畫面中有擬合曲線和此命令產(chǎn)生一個(gè)交互式的畫面,畫面中有擬合曲線和y y的置信區(qū)間。通過(guò)左下方的的置信區(qū)間。通過(guò)左下方的ExportExport菜單,可以輸出回歸系數(shù)菜單,可以輸出回歸系數(shù)等。等。B、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):(1)

49、Y=polyval(p,x)求polyfit所得的回歸多項(xiàng)式在x處的預(yù) 測(cè)值Y; (2)Y,DELTA=polyconf(p,x,S,alpha)求polyfit所得 的回歸多項(xiàng)式在x處的預(yù)測(cè)值Y及預(yù)測(cè)值的顯著性為1- alpha的置信區(qū)間Y DELTA;alpha缺省時(shí)為0.05.一元多項(xiàng)式回歸也可以化為多元線性回歸來(lái)解。 例例 2 觀測(cè)物體降落的距離s 與時(shí)間t 的關(guān)系,得到數(shù)據(jù)如下表,求s關(guān)于 t 的回歸方程2ctbtas.t (s)1/302/303/304/305/306/307/30s (cm)11.8615.6720.6026.6933.7141.9351.13t (s)8/30

50、9/3010/3011/3012/3013/3014/30s (cm)61.4972.9085.4499.08113.77129.54146.48法一法一 直接作二次多項(xiàng)式回歸:直接作二次多項(xiàng)式回歸: t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48; p,S=polyfit(t,s,2)To MATLAB(liti21)1329. 98896.652946.4892tts得回歸模型為 :法二法二化為多元線性回歸:化為多元線性回歸

51、:t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;T=ones(14,1) t (t.2);b,bint,r,rint,stats=regress(s,T);b,statsTo MATLAB(liti22)22946.4898896.651329. 9tts得回歸模型為 :Y=polyconf(p,t,S) plot(t,s,k+,t,Y,r)預(yù)測(cè)及作圖預(yù)測(cè)及作圖To MATLAB(liti23)1.6.3多元二項(xiàng)式回歸多元二項(xiàng)式

52、回歸命令:rstool(x,y,model, alpha)nm矩陣顯著性水平(缺省時(shí)為0.05)n維列向量 命令rstool產(chǎn)生一個(gè)交互式畫面,畫面中有m個(gè)圖形,這m個(gè)圖形分別給出了一個(gè)獨(dú)立變量xi(另m-1個(gè)變量取固定值)與y的擬合曲線,以及y的置信區(qū)間??梢酝ㄟ^(guò)鍵入不同的xi值來(lái)獲得相應(yīng)的y值。 例例3 設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價(jià)格的統(tǒng)計(jì)數(shù) 據(jù)如下,建立回歸模型,預(yù)測(cè)平均收入為800、價(jià)格為6時(shí) 的商品需求量.需求量10075807050659010011060收入10006001200500300400130011001300300價(jià)格5766875439選擇純二次模型,

53、即 2222211122110 xxxxy解解 直接用多元二項(xiàng)式回歸:x1=1000 600 1200 500 300 400 1300 1100 1300 300;x2=5 7 6 6 8 7 5 4 3 9;y=100 75 80 70 50 65 90 100 110 60;x=x1 x2; rstool(x,y,purequadratic) 在畫面左下方的下拉式菜單中選”all”, 則beta(回歸系數(shù))、rmse(剩余標(biāo)準(zhǔn)差)和residuals(殘差)都傳送到Matlab工作區(qū)中.在左邊圖形下方的方框中輸入800,右邊圖形下方的方框中輸入6。則畫面左邊的“Predicted Y”下

54、方的數(shù)據(jù)變?yōu)?6.3971,即預(yù)測(cè)出平均收入為800、價(jià)格為6時(shí)的商品需求量為86.3971.在Matlab工作區(qū)中輸入命令: beta, rmseTo MATLAB(liti31)1.非線性回非線性回 歸歸 (1)確定回歸系數(shù)的命令: beta,r,J=nlinfit(x,y,model, beta0)(2)非線性回歸命令:nlintool(x,y,model, beta0,alpha)1.1回歸:回歸:殘差Jacobian矩陣,用于估計(jì)預(yù)測(cè)誤差需要的數(shù)據(jù)?;貧w系數(shù)的初值是事先用m-文件定義的非線性函數(shù)估計(jì)出的回歸系數(shù)輸入數(shù)據(jù)x、y分別為 矩陣和n維列向量,對(duì)一元非線性回歸,x為n維列向量。

55、mn其中個(gè)參數(shù)含義同前,alpha為顯著性水平,缺省時(shí)為0.05。該命令產(chǎn)生一個(gè)交互式的畫面,畫面中有擬合曲線和y的置信區(qū)間。通過(guò)左下方的Export菜單,可以輸出回歸系數(shù)等。1.2、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):該命令用于求nlinfit 或nlintool所得的回歸函數(shù)在x處的預(yù)測(cè)值Y及預(yù)測(cè)值的顯著性為1-alpha的置信區(qū)間Y DELTA.Y,DELTA=nlpredci(model, x,beta,r,J)例例 4 對(duì)第一節(jié)例2,求解如下:1、對(duì)將要擬合的非線性模型 y=axbe/,建立 m-文件 volum.m 如下: function yhat=volum(beta,x

56、) yhat=beta(1)*exp(beta(2)./x);2、輸入數(shù)據(jù): x=2:16; y=6.42 8.20 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.60 10.80 10.60 10.90 10.76; beta0=8 2;3、求回歸系數(shù): beta,r ,J=nlinfit(x,y,volum,beta0); beta得結(jié)果:beta = 11.6036 -1.0641即得回歸模型為:xey10641. 16036.11To MATLAB(liti41)4、預(yù)測(cè)及作圖: YY,delta=nlpredci(volum,x,beta,r ,J

57、); plot(x,y,k+,x,YY,r).逐逐 步步 回回 歸歸逐步回歸的命令是: stepwise(x,y,inmodel,alpha) 運(yùn)行stepwise命令時(shí)產(chǎn)生三個(gè)圖形窗口:Stepwise Plot,Stepwise Table,Stepwise History.在Stepwise Plot窗口,顯示出各項(xiàng)的回歸系數(shù)及其置信區(qū)間. Stepwise Table 窗口中列出了一個(gè)統(tǒng)計(jì)表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計(jì)量剩余標(biāo)準(zhǔn)差(RMSE)、相關(guān)系數(shù)(R-square)、F值、與F對(duì)應(yīng)的概率P.矩陣的列數(shù)的指標(biāo),給出初始模型中包括的子集(缺省時(shí)設(shè)定為全部自變量)顯著性水

58、平(缺省時(shí)為0.5)自變量數(shù)據(jù), 階矩陣mn因變量數(shù)據(jù), 階矩陣1n例例6 水泥凝固時(shí)放出的熱量y與水泥中4種化學(xué)成分x1、x2、x3、 x4 有關(guān),今測(cè)得一組數(shù)據(jù)如下,試用逐步回歸法確定一個(gè) 線性模 型. 序號(hào)12345678910111213x17111117113122111110 x226295631525571315447406668x3615886917221842398x46052204733226442226341212y78.574.3104.387.695.9109.2102.772.593.1115.983.8113.3109.41、數(shù)據(jù)輸入:、數(shù)據(jù)輸入:x1=7 1 1

59、1 11 7 11 3 1 2 21 1 11 10;x2=26 29 56 31 52 55 71 31 54 47 40 66 68;x3=6 15 8 8 6 9 17 22 18 4 23 9 8;x4=60 52 20 47 33 22 6 44 22 26 34 12 12;y=78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4;x=x1 x2 x3 x4;2、逐步回歸:、逐步回歸:(1)先在初始模型中取全部自變量:)先在初始模型中取全部自變量: stepwise(x,y)得圖Stepwise

60、 Plot 和表Stepwise Table圖圖Stepwise Plot中四條直線都是虛中四條直線都是虛線,說(shuō)明模型的顯著性不好線,說(shuō)明模型的顯著性不好Stepwise Table中列出了各變量的回中列出了各變量的回歸系數(shù)和置信區(qū)間,從該表中看出歸系數(shù)和置信區(qū)間,從該表中看出變量變量x3和和x4的顯著性最差的顯著性最差.(2)在圖)在圖Stepwise Plot中點(diǎn)擊直線中點(diǎn)擊直線3和直線和直線4,移去變量,移去變量x3和和x4移去變量移去變量x3和和x4后模型具有顯著性后模型具有顯著性. 雖然剩余標(biāo)準(zhǔn)差(雖然剩余標(biāo)準(zhǔn)差(RMSE)沒(méi))沒(méi)有太大的變化,但是統(tǒng)計(jì)量有太大的變化,但是統(tǒng)計(jì)量F的的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論