一元線性回歸_第1頁
一元線性回歸_第2頁
一元線性回歸_第3頁
一元線性回歸_第4頁
一元線性回歸_第5頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

12.9一元線性回歸以前我們所研究的函數(shù)關(guān)系是完全確定的,但在實際問題中,常常會遇到兩個變量之間具有密切關(guān)系卻又不能用一個確定的數(shù)學式子表達,這種非確定性的關(guān)系稱為相關(guān)關(guān)系。通過大量的試驗和觀察,用統(tǒng)計的方法找到試驗結(jié)果的統(tǒng)計規(guī)律,這種方法稱為回歸分析。一元回歸分析是研究兩個變量之間的相關(guān)關(guān)系的方法。如果兩個變量之間的關(guān)系是線性的,這就是一元線性回歸問題。一元線性回歸問題主要分以下三個方面:(1)通過對大量試驗數(shù)據(jù)的分析、處理,得到兩個變量之間的經(jīng)驗公式即一元線性回歸方程。(2)對經(jīng)驗公式的可信程度進行檢驗,判斷經(jīng)驗公式是否可信。(3)利用已建立的經(jīng)驗公式,進行預測和控制。12.9.1一元線性回歸方程1.散點圖與回歸直線在一元線性回歸分析里,主要是考察隨機變量y與普通變量x之間的關(guān)系。通過試驗,可得到x、y的若干對實測數(shù)據(jù),將這些數(shù)據(jù)在坐標系中描繪出來,所得到的圖叫做散點圖。例1在硝酸鈉(NaNO3)的溶解度試驗中,測得在不同溫度x(°C)下,溶解于100份水中的硝酸鈉份數(shù)y的數(shù)據(jù)如下:X.0410152129366168y.66.771.076.380.685.792.999.4113.6125.1——±4 1 1 1 1 給出散點圖并試建X與y的經(jīng)驗公式。解將每對觀察值(x.,y.)在直角坐標系中描出,得散點圖如圖12.11所示。從圖12.11可看出,這些點雖不在一條直線上,但都在一條直線附近。于是,很自然會想到用一條直線來近似地表示x與y之間的關(guān)系,這條直線的方程就叫做y對x的一元線性回歸方程。設(shè)這條直線的方程為y=a+bx其中a、b叫做回歸系數(shù)($表示直線上y的值與實際值y.不同)。圖12.11下面是怎樣確定a和b,使直線總的看來最靠近這幾個點。2.最小二乘法與回歸方程在一次試驗中,取得n對數(shù)據(jù)(x.,y.),其中y.是隨機變量y對應于x.的觀察值。我們所要求的直線應該是使所有丨y—$丨之和最小的一條直線,其中$.=a+bx.o由于絕對.i.值在處理上比較麻煩,所以用平方和來代替,即要求a、b的值使Q=£($-$)2最小。ii利用多元函數(shù)求極值的方法求回歸系數(shù)a、b, 八一利用多元函數(shù)求極值的方法求回歸系數(shù)a、b, 八一a=y-bx入Lb=Lxx其中x=1工xnii=1—y)=工xy—nxyi iii=1b稱為參數(shù)a、b的最小二乘估計,上這里n=9,g,”)由例1給出,計算出x=26,y=90.1444,L=工x2—9x2=10144xxii=1=工(X一X)2==工(X一X)2=£x2一nx2iii=1 i=1nixxi=1L=£(y—y)2=工y2—ny2,l=工(x—x)(yyy i i xy ii=1 i=1 i=1從而得到一元線性回歸方程y=a+bx。其中a,述方法叫做最小二乘估計法。下面計算例1中y對x的一元線性回歸方程?!?X262=4060L=£y2—9y2=76218.17—9X90.14442=3083.9822TOC\o"1-5"\h\zyy ii=1L=為xy—9Xy=24628.6—9X26X90.1444=3534.8xy iii=1fL 3534.8 .-;-b=—= =0.8706a=y—bx=90.1444—0.8706X26=67.5078L4046xy故所求回歸方程為 y=67.5078+0.8706x12.9.2一元線性回歸的相關(guān)性檢驗上面介紹了由試驗數(shù)據(jù)求出回歸方程的最小二乘法,但是在使用這種方法之前,并沒有判定兩個變量之間是否具有線性的相關(guān)關(guān)系。因此,即使在平面上一些并不呈現(xiàn)線性關(guān)系的點之間,也照樣可以求出一條回歸直線,這顯然毫無意義。因此,我們要用假設(shè)檢驗的方法進行相關(guān)關(guān)系的檢驗,其方法如下:假設(shè)H°:y與x存在密切的線性相關(guān)關(guān)系。0L計算相關(guān)系數(shù)r=xy=:LLxxyy給定a,根據(jù)自由度n—2,查項關(guān)系數(shù)表,求出臨界值入。作出判斷:如果丨r丨三入時,接受假設(shè)H。,即認為在顯著性水平a下,y與x的線性相關(guān)關(guān)系較顯著;如果|r|V入時,則可認為在顯著性水平a下,y與x的線性相關(guān)關(guān)系不顯著,即拒絕假設(shè)H。。例2檢驗例1中的y與x的線性關(guān)系是否顯著?取水平a=0.05。解假設(shè)H°:y與x存在密切的線性相關(guān)關(guān)系。L 3534.8r=xy= =0.9990■LL <4060x3083.9822*xxyya=0.05,n—2=7,查表得入=0.6666 IrI=0.9990>入=0.6666所以接受假設(shè)H°,即在水平a=0.05下認為y與x間的線性相關(guān)關(guān)系較顯著。12.9.03預測與控制在求出隨機變量y與變量x的一元線性回歸方程,并通過相關(guān)性檢驗后,便能用回歸方程進行預測和控制。1.預測(1) 點預測:對給定的x=x0,根據(jù)回歸方程求得yo=a+bx0,作為y0的預測值,這種方法叫做點預測。(2) 區(qū)間預測:區(qū)間預測就是對給定的x=xo,利用區(qū)間估計的方法求出y0的置信區(qū)間。對給定的x=x0,由回歸方程可計算一個回歸值y=a+bx0000設(shè)在x=xo的一次觀察值為『0,記£0=y0—yo £i=yi—y, (i=l,2,…,n)其中y.為對應x.的觀察值,亍為對應x.的回歸值。iiii一般地(特別當n很大時)£0與£1,£2,…,£相互獨立,而且服從同一正態(tài)分布0 1 2 nN(0,O2)??梢宰C明,統(tǒng)計量&2=S2 是O2的無偏估計量,其中yn—2Q=££2=£(y—y)2=L—bL。從而可近似地認為y0y0?N(0,1)TOC\o"1-5"\h\zi iiyyxy Si=1 i=1 y于是,我們得到y(tǒng)0的95%預測區(qū)間為 (亍0—1.96Sy,y°+1.96Sy),y0的99%預測區(qū)間為(y—2.58S,y+2.58S)0 y0 y上述預測區(qū)間在n較大且(x0—X)較小時適用。例3某種合金鋼的抗拉強度y與鋼中含碳量x(質(zhì)量份數(shù))有關(guān),測得數(shù)據(jù)如下:X:(%)y:(kg/mm^)x:(%)y:(kg/mm^)0.0540.80.1345.60.0741.70.1445.10.0841.90.1648.90.0942.80.1850.00.1042.00.2055.00.1143.60.2154.80.1244.80.2360.0(1)檢驗抗拉強度y與含碳量x之間是否存在顯著的線性相關(guān)關(guān)系。如果存在,求y與x的線性回歸方程。(2)預測當含碳量為0.15%時,抗拉強度的變化區(qū)間(取置信水平為0.95)。解由數(shù)據(jù)計算得X=0.134,y=46.929;L=0.2899—14X0.1342=0.0401,xxL=91.909—14X0.134X46.929=4.1526,L=31295.60—14X46.9292=463.5286。xy yy4.1526(1)現(xiàn)在計算相關(guān)系數(shù) r= =0.9630.0401x463.5286查相關(guān)系數(shù)表,當a=0.05,n—2=14—2=12時,臨界值入=0.532因為丨r丨>入,所以抗拉強度y與含碳量x之間線性相關(guān)關(guān)系較顯著?!甃 4.1526下面求a及b的估計值:b=牡= =103.56L 0.0401Xya=y—bx=46.929—103.56X0.134=33.05

(2)當 x0=0.15 (2)當 x0=0.15 時,「 '463.5286-103.56x4.1526S—y 14-2=1.670=33.05103.56X0.15=48.584所以,y的95%預測區(qū)間為 (48.524—1.96X1.670,48.524+1.96X1.670)即(45.31,51.86)2.控制控制是預測的反問題,就是如何控制x值使y落在指定范圍內(nèi),也就是給定y的變化范圍求x的變化范圍。如果希望y在區(qū)間(y],y2)內(nèi)取值(『]與y2已知),則x的控制區(qū)間的兩個端點x1>x2可由下述方程解出2y=a+bx一3S<1 八 八1 yy=a+bx+3S2 2 y當回歸系數(shù)b>0時,控制區(qū)間為(X],x2);當b<0時,控制區(qū)間為(x2,X])。應當指出下面兩點:y的取值范圍一般僅限于在已試驗過的y的變化范圍之內(nèi),不能任意外推;對y的指定區(qū)間(y],y2)不能任意小,按上面的方程組計算時,『]、y2必須滿足y2—y1>6S時,所求的x的控制區(qū)間才有意義。例4在例3中,如果要求抗拉強度y在41.5?54之間,問含碳量x(%)應如何控制?解依題意y]=41.5,y2=54,由方程組y=a+bx—3S 「41.5=33.05+103.56x—3x1.670y=a

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論