第6章 直線回歸與相關(guān)分析_第1頁
第6章 直線回歸與相關(guān)分析_第2頁
第6章 直線回歸與相關(guān)分析_第3頁
第6章 直線回歸與相關(guān)分析_第4頁
第6章 直線回歸與相關(guān)分析_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第六章直線回歸與相關(guān)分析第一節(jié)回歸與相關(guān)分析的概念u、t、F、檢驗(yàn)——差異顯著性檢驗(yàn),只涉及一個變量。變量間的關(guān)系:⑴函數(shù)關(guān)系;⑵相關(guān)關(guān)系回歸與相關(guān)分析——研究變量間相關(guān)關(guān)系的統(tǒng)計方法。相關(guān)分析:研究變量之間的聯(lián)系程度和聯(lián)系性質(zhì)的一種統(tǒng)計方法。程度:變量間關(guān)系密切程度。變量關(guān)系正一致性質(zhì):相關(guān)——方向負(fù)相反

一元直線相關(guān)(簡單相關(guān))相關(guān)分析復(fù)相關(guān)多元線性相關(guān)偏相關(guān)回歸分析:研究變量之間的聯(lián)系形式的一種統(tǒng)計方法。聯(lián)系形式用回歸方程來表示。由方程次數(shù)不同來分:線性回歸———方程次數(shù)為1如:y=a+bx。非線性回歸——方程次數(shù)不為1如:y=axb(b≠1)由方程的自變量個數(shù)來分一元回歸——只有一個自變量如:y=a+bx,y=axb多元回歸——自變量個數(shù)多于1如:y=b0+b1x1+…+bmxm直線相關(guān)與回歸分析可應(yīng)用于:①從一組實(shí)測數(shù)據(jù)出發(fā),找出描述兩個變量間關(guān)系的直線回歸方程,以確定一條最接近于各實(shí)測點(diǎn)的標(biāo)準(zhǔn)曲線;②檢驗(yàn)兩變量間關(guān)系的密切程度;③應(yīng)用直線回歸方程,從一個變量所取的值去估計另一變量的對應(yīng)值,并評價估計的精確度與計算置信區(qū)間。第二節(jié)直線回歸分析一、直線回歸方程式其中,——自變量,——依變量的回歸估計值確定自、依變量的原則:1.因果關(guān)系明確:原因變量作自變量x;結(jié)果變量作依變量y。2.因果關(guān)系不明確:作估測依據(jù)的變量作自變量x;被估測的變量作依變量y。a——回歸截距(直線在y軸上的切割點(diǎn))b——回歸系數(shù),其統(tǒng)計意義為y隨x改變一個單位而改變的單位數(shù);幾何意義是直線的斜率。有一雙變量總體(X,Y),從中抽出一個容量為n的雙變量樣本(x,y)于是,但y-=ε≠0……0

要求:總偏差最小??勺C最小總偏差最小。令于是,通過求最小值解出、——最小二乘法:求偏導(dǎo)數(shù):整理第一個方程得,

代入第二個方程得,整理得,其中,SP—離均差乘積和SSx—自變量的離均差平方和由b的公式可見,b的符號由分子SP確定。當(dāng)時,,故回歸直線一定要過(,)這一點(diǎn)??梢宰C明,的平均數(shù)就是。例1,[例6-1]解:一級統(tǒng)計數(shù)二級統(tǒng)計數(shù)注:回歸與相關(guān)分析中,一般要求中間結(jié)果保留4~6位小數(shù)?;貧w方程:b的解釋:b=1.255表明蔗糖質(zhì)量分?jǐn)?shù)x每增加(或減少)1個百分點(diǎn),將使食品甜度y增加(或減少)約1.255度。二、回歸關(guān)系的顯著性檢驗(yàn)檢驗(yàn)x與y是否有真實(shí)的回歸關(guān)系。H0:=0HA:≠0

㈠F檢驗(yàn):回歸關(guān)系引起的變異依變量y的總變異其它因素引起的變異

因?yàn)樗云渲?,——回歸平方和,記作SSR

——離回歸平方和(偏差平方和)記作SSr所以,SSy=SSR+SSr相應(yīng)地,dfy=dfR+dfr其中,dfy=n-1

dfR=1

dfr=dfy-dfR=n-2各項平方和的實(shí)用計算公式:SSr=SSy-SSR=SSy-∴S2R==SSR,S2r=注:叫做回歸估計標(biāo)準(zhǔn)誤,是表示回歸估計精度的重要統(tǒng)計數(shù)。Syx大(或?。?,由回歸方程估計y的精度就低(或高)。

F<F0.05接受不顯著。當(dāng)F0.05≤F<F0.01時,否定H0,推斷回歸關(guān)系顯著,記*

F≥F0.01否定極顯著,**查表4上例,已知:SSy=84.0343,SSx=53.2143,SP=66.7857,n=7,dfy=n-1=6解:

dfR=1SSr=SSy-SSR=0.2160dfr=n-2=5F0.05(1,5)=6.61F0.01(1,5)=16.26因?yàn)镕>F0.01,所以否定H0,推斷回歸關(guān)系極顯著,即表明蔗糖質(zhì)量分?jǐn)?shù)x與食品甜度y具有真實(shí)的直線關(guān)系。叫做回歸系數(shù)標(biāo)準(zhǔn)誤。由表3查臨界t值,用離回歸自由度dfr=n-2。㈡t檢驗(yàn):可證:當(dāng)分子自由度=1時,F(xiàn)與t有如下關(guān)系:F=t2

其中,上例,已知:b=1.255,SSx=53.2143,SSr=0.216,n=7解:df=n-2=7-2=5查表3得t0.05(5)=2.571t0.01(5)=4.032因?yàn)閨t|>t0.01(5),所以否定H0,推斷回歸關(guān)系極顯著,即表明蔗糖質(zhì)量分?jǐn)?shù)x與食品甜度y具有真實(shí)的直線關(guān)系。三、直線回歸方程的圖示由[,]和[,]兩點(diǎn)畫直線。上例,=1.0=13.9585+1.255×1.0=15.2135=9.5=13.9585+1.255×9.5=25.881四、回歸方程的應(yīng)用方向1.預(yù)測:由x去預(yù)測y。在產(chǎn)量預(yù)測、病蟲害預(yù)報等方面應(yīng)用較多。例,一代三化螟蛾盛發(fā)期y與三至四月積溫x的回歸方程如下:假設(shè)某年的積溫x=35,則

該蟲的盛發(fā)期約為5月20日(以10/5為0)左右。2.控制:由y去控制x。這主要在制定生產(chǎn)措施時用。例,某作物產(chǎn)量y與施肥量x的回歸方程如下:

若希望y>600斤/畝,則施肥量至少多少斤/畝?由可推出注:①實(shí)際應(yīng)用中,預(yù)測應(yīng)結(jié)合誤差和概率進(jìn)行區(qū)間估計。②應(yīng)用回歸方程時,自變量x的取值范圍只限于原觀察值的變化范圍。③樣本容量n應(yīng)盡量大,至少要大于5?;貧w分析的完整步驟:第一步建立回歸方程必作第二步進(jìn)行回歸關(guān)系的顯著性檢驗(yàn)(F檢驗(yàn))第三步繪制回歸直線第三節(jié)直線相關(guān)分析一、相關(guān)系數(shù)與決定系數(shù)㈠相關(guān)系數(shù):是表示變量間的聯(lián)系性質(zhì)和聯(lián)系程度的統(tǒng)計數(shù)。設(shè)有一個雙變量樣本(x,y)xx1x2…xnyy1y2…yn在xˊoˊyˊ中,有第一象限:第二象限:第三象限:第四象限:xˊyˊ(x,y)

yyOx

x(,)O'進(jìn)一步討論當(dāng)正相關(guān)時,如右圖,可見大多數(shù)點(diǎn)子在一、三象限,則>0;而且當(dāng)n一定時,在第一、三象限的點(diǎn)子愈多(相應(yīng)第二、四象限的點(diǎn)子就愈少),此值也愈大,而此時也正是正相關(guān)程度愈大。yˊxˊ

當(dāng)負(fù)相關(guān)時,如右圖,可見大多數(shù)點(diǎn)子在二、四象限,則<0;而且當(dāng)n一定時,在第二、四象限的點(diǎn)子愈多(相應(yīng)第一、三象限點(diǎn)子就愈少),此和值的絕對值也愈大,而此時也正是負(fù)相關(guān)程度愈大。yˊxˊ

當(dāng)無關(guān)時,如右圖,可見點(diǎn)子在四個象限分布均勻,這樣,=0。值受變量單位、樣本容量n影響。yˊ

其中當(dāng)正相關(guān)時,>0,于是,r>0;極端地,完全正相關(guān)時,y-=(x-),則r=1。當(dāng)負(fù)相關(guān)時,<0,于是,r<0;極端地,完全負(fù)相關(guān)時,y-=-(x-),則r=-1。當(dāng)無關(guān)時,=0,于是,r=0

所以,相關(guān)系數(shù)的取值范圍:-1≤r≤1or|r|≤1|r|愈接近于1(0),表明變量的相關(guān)程度愈大(?。?。㈡決定系數(shù):SSR=表示回歸關(guān)系引起的變異部分——相關(guān)系數(shù)的平方?jīng)Q定系數(shù)r2表示在依變量y的總變異中,由回歸關(guān)系引起的變異部分所占的百分比。例如,r=0.8,r2=0.64,表示由回歸關(guān)系引起的變異部分只占y的總變異的64%,還有36%是其它因素引起的變異。也可表示回歸方程的可靠程度。決定系數(shù)r2是在相關(guān)系數(shù)r顯著時才計算。例2,[例6-3]解:一級統(tǒng)計數(shù)二級統(tǒng)計數(shù)相關(guān)系數(shù)二、相關(guān)系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))設(shè)一雙變量總體(X,Y),相關(guān)系數(shù)=0,r≠0?≠0,r≠0H0:=0HA:≠0t檢驗(yàn):相關(guān)系數(shù)標(biāo)準(zhǔn)誤

由表3查臨界t值的自由度df=n-2顯著水準(zhǔn)α=0.05,0.01前例,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論