版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
直線相關(guān)與回歸xjli@流行病與衛(wèi)生統(tǒng)計學(xué)系統(tǒng)計室山東大學(xué)公共衛(wèi)生學(xué)院本章內(nèi)容直線相關(guān)分析的基本概念直線相關(guān)分析步驟相關(guān)分析注意事項(xiàng)Spearman秩相關(guān)直線回歸分析的基本概念直線回歸分析步驟回歸分析注意事項(xiàng)直線相關(guān)與回歸的區(qū)別與聯(lián)系相關(guān)關(guān)系與確定性關(guān)系的比較兩變量間的相關(guān)分析——直線相關(guān)分析直線相關(guān)分析的基本概念相關(guān)分析是研究變量或變量集合之間數(shù)量協(xié)同變化關(guān)系密切程度和方向的統(tǒng)計方法。兩個數(shù)值變量之間出現(xiàn)如下情況:當(dāng)一個變量增大,另一個也隨之增大(或減少),我們稱這種現(xiàn)象為共變,也就是有相關(guān)關(guān)系。若兩個變量同時增加或減少,變化趨勢是同向的,則兩變量之間的關(guān)系為正相關(guān)(positivecorrelation);若一個變量增加時,另一個變量減少,變化趨勢是反向的,則稱為負(fù)相關(guān)(negativecorrelation)?!嚓P(guān)的方向兩變量間的相關(guān)分析——直線相關(guān)分析兩個相關(guān)關(guān)系的圖示(散點(diǎn)圖)yx兩變量間的相關(guān)分析——直線相關(guān)分析r=0(h)r=0(f)r=-1(d)r=1(b)0<r<1(a)-1<r<0(c)r0(e)r
0(g)零相關(guān)正相關(guān)負(fù)相關(guān)完全正相關(guān)完全負(fù)相關(guān)零相關(guān)零相關(guān)零相關(guān)直線相關(guān)分析的資料要求(雙變量X,Y正態(tài)分布)(單變量X量正態(tài)分布)xf(x)f(x,y)兩變量間的相關(guān)分析——直線相關(guān)分析相關(guān)系數(shù)(CorrelationCoefficient
)用以說明具有直線關(guān)系的兩個變量間相關(guān)關(guān)系的密切程度和相關(guān)方向的指標(biāo),稱為相關(guān)系數(shù)(correlationcoefficient),又稱為積矩相關(guān)系數(shù)(coefficientofproduct-momentcorrelation),Pearson相關(guān)系數(shù)。兩變量間的相關(guān)分析——直線相關(guān)分析兩變量間的相關(guān)分析——直線相關(guān)分析相關(guān)系數(shù)(CorrelationCoefficient
)相關(guān)系數(shù)沒有量綱,且-1r1。當(dāng)r>0,且(ρ=0)被拒絕時,認(rèn)為兩變量之間呈正相關(guān)關(guān)系;當(dāng)r<0,且(ρ=0)被拒絕時,認(rèn)為兩變量之間呈負(fù)相關(guān)關(guān)系。當(dāng)r值接近于零,且(ρ=0)被接受時,認(rèn)為兩變量之間不呈直線關(guān)系,但不能排除兩變量之間可能存在某種曲線關(guān)系。兩變量間的相關(guān)分析——直線相關(guān)分析相關(guān)系數(shù)(CorrelationCoefficient
)兩變量間的相關(guān)分析——直線相關(guān)分析相關(guān)系數(shù)(CorrelationCoefficient
)相關(guān)分析的步驟例題1:某克山病區(qū)10名健康兒童頭發(fā)與全血中的硒含量1000ppm(百萬分之一)如下:問發(fā)硒與血硒之間有無直線相關(guān)關(guān)系?兩變量間的相關(guān)分析——直線相關(guān)分析相關(guān)分析的步驟(1)繪制散點(diǎn)圖:在直角坐標(biāo)系內(nèi)繪制x,y散點(diǎn)圖。①若散點(diǎn)圖呈直線趨勢時,計算相關(guān)系數(shù);②若散點(diǎn)圖呈曲線趨勢,進(jìn)行曲線擬合;③若散點(diǎn)圖顯示無任何趨勢,則不必進(jìn)行分析。本例散點(diǎn)圖為:兩變量間的相關(guān)分析——直線相關(guān)分析相關(guān)分析的步驟(2)計算相關(guān)系數(shù):r=0.872兩變量間的相關(guān)分析——直線相關(guān)分析相關(guān)分析的步驟(3)相關(guān)系數(shù)的假設(shè)檢驗(yàn):也就是說,根據(jù)樣本計算出的相關(guān)系數(shù)r,是總體相關(guān)系數(shù)ρ的估計值。從ρ=0(無直線相關(guān))的總體中抽取樣本,其r不一定為0。因此,得到r≠0后,由于存在抽樣誤差,則有必要檢驗(yàn)r是否來自ρ=0的總體,以判定兩變量間是否有直線相關(guān)關(guān)系。兩變量間的相關(guān)分析——直線相關(guān)分析相關(guān)分析的步驟(3)相關(guān)系數(shù)的假設(shè)檢驗(yàn):1)
建立假設(shè),確定檢驗(yàn)水準(zhǔn)2)
計算統(tǒng)計量本例:兩變量間的相關(guān)分析——直線相關(guān)分析相關(guān)分析的步驟(3)相關(guān)系數(shù)的假設(shè)檢驗(yàn):3)
確定P值,做出推斷結(jié)論本例,r=0.872,發(fā)硒與血硒高度相關(guān)。兩變量間的相關(guān)分析——直線相關(guān)分析兩變量間的相關(guān)分析——直線相關(guān)分析(4)總體相關(guān)系數(shù)ρ的可信區(qū)間估計:1.點(diǎn)值估計:=r2.區(qū)間估計:若0,則r呈偏態(tài)分布,估計的可信區(qū)間時應(yīng)進(jìn)行變量變換變換后的變量z近似服從正態(tài)分布,其100(1-)%可信區(qū)間為:然后將z的可信區(qū)間的下、上限分別進(jìn)行逆變換,即得的可信區(qū)間:或相關(guān)系數(shù)的抽樣分布
(||=0.8,n=100,1000次抽樣)-0.8-0.6-0.4-0.20.00100200300-1.0
00.20.40.60.81.00100200300
=-0.8
=0.8R.A.Fisher(1921)的提出的z變換
z近似服從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布。
相關(guān)系數(shù)的z變換值的抽樣分布(=-0.8)00.51.01.52.0050100150200-0.8-0.6-0.4-0.20.00100200300-1.0變換前變換后
01234050100150200
00.20.40.60.81.00100200300相關(guān)系數(shù)的z變換值的抽樣分布(=0.8)變換前變換后相關(guān)系數(shù)的可信區(qū)間估計1.將r變換為z。2.根據(jù)z服從正態(tài)分布,估計z的可信區(qū)間。3.再將z變換回r。求得8名健康成人血清總膽固醇與低密度脂蛋白膽固醇含量間的r=0.974,試求總體相關(guān)系數(shù)ρ的95%可信區(qū)間。z的95%可信區(qū)間:
總體相關(guān)系數(shù)ρ的95%可信區(qū)間:
(0.85870.9954)直線相關(guān)分析中的注意事項(xiàng)兩變量間的相關(guān)分析——直線相關(guān)分析
(1)在進(jìn)行相關(guān)分析(Pearson相關(guān))前,需作散點(diǎn)圖,從散點(diǎn)圖的趨勢判斷是否可以作線性相關(guān)分析;
(2)樣本相關(guān)系數(shù)與總體相關(guān)系數(shù)間存在抽樣誤差,所以求得樣本相關(guān)系數(shù)后應(yīng)進(jìn)行假設(shè)檢驗(yàn)。
(3)相關(guān)關(guān)系是一種共變關(guān)系,不一定是因果關(guān)系;有無因果關(guān)系還需結(jié)合專業(yè)知識進(jìn)一步研究。
(4)在實(shí)際工作中要區(qū)別相關(guān)的統(tǒng)計學(xué)意義與相關(guān)強(qiáng)度。相關(guān)有統(tǒng)計學(xué)意義指該樣本相關(guān)系數(shù)r來自ρ=0的總體概率很小,而相關(guān)強(qiáng)度表示兩變量間相互關(guān)系的密切程度,用r值的大小來反映。直線相關(guān)分析中的注意事項(xiàng)兩變量間的相關(guān)分析——直線相關(guān)分析
(5)作相關(guān)分析時,必須剔除異常點(diǎn)。異常點(diǎn)就是一些特大或特小的離群值,相關(guān)系數(shù)的數(shù)值受這些點(diǎn)的影響較大,有此點(diǎn)時兩變量相關(guān),無此點(diǎn)時可能就不相關(guān)了。所以,應(yīng)及時復(fù)核檢查,對由于測定、記錄或計算機(jī)錄入的錯誤數(shù)據(jù),應(yīng)予以修正和剔除。
直線相關(guān)分析中的注意事項(xiàng)兩變量間的相關(guān)分析——直線相關(guān)分析(6)分層資料不宜盲目合并進(jìn)行相關(guān)分析。若將分層資料合并進(jìn)行分析,可能會出現(xiàn)各層內(nèi)均不相關(guān)而合并后出現(xiàn)相關(guān)的假象,也可能本來各層內(nèi)兩變量均有相關(guān)而合并后掩蓋了其真實(shí)的相關(guān)性。因此,進(jìn)行相關(guān)分析時,如果不能確定各層研究對象具有同質(zhì)基礎(chǔ),不宜盲目合并。等級相關(guān)分析的基本概念兩變量間的相關(guān)分析——等級相關(guān)分析
前述的直線相關(guān)分析要求兩變量來自雙變量正態(tài)分布資料,當(dāng)不能滿足此條件時,需用等級相關(guān)又稱秩相關(guān)(rankcorrelation)來分析兩變量間的關(guān)系。等級相關(guān)屬于非參數(shù)統(tǒng)計方法,常用的方法有Spearman秩相關(guān)。它是用等級相關(guān)系數(shù)(rankcorrelationcoefficient)來反映兩變量間相關(guān)關(guān)系的密切程度和方向的。等級相關(guān)系數(shù)計算公式:兩變量間的相關(guān)分析——等級相關(guān)分析等級相關(guān)分析的基本概念兩變量間的相關(guān)分析——等級相關(guān)分析數(shù)值變量資料的等級相關(guān)分析例題2:在肝癌病因研究中,調(diào)查了某地10個鄉(xiāng)的肝癌死亡率(1/10萬)與玉米中黃曲霉毒素相對含量,資料見下表。試作相關(guān)分析。兩變量間的相關(guān)分析——等級相關(guān)分析該資料不服從雙變量正態(tài)分布,用等級相關(guān)分析。數(shù)值變量資料的等級相關(guān)分析(1)求等級相關(guān)系數(shù)兩變量間的相關(guān)分析——等級相關(guān)分析數(shù)值變量資料的等級相關(guān)分析(2)對等級相關(guān)系數(shù)做假設(shè)檢驗(yàn)1)建立假設(shè),確定檢驗(yàn)水準(zhǔn)2)計算檢驗(yàn)統(tǒng)計量3)確定p值,得出結(jié)論。兩變量間的相關(guān)分析——等級相關(guān)分析雙向有序R×C表資料的等級相關(guān)分析例題3觀察依沙酰胺治療皮膚真菌感染效果的臨床試驗(yàn)結(jié)果見表3,試分析該病的療效是否與病程有關(guān)?兩變量間的相關(guān)分析——等級相關(guān)分析雙向有序R×C表資料的等級相關(guān)分析Spearman等級相關(guān):Ho:總體等級相關(guān)系數(shù)等于0H1:總體等級相關(guān)系數(shù)不等于0α=0.05(雙側(cè))對子數(shù)n=435
差值平方和=8894802,Tx=972115,Ty=1421112.5
等級相關(guān)系數(shù)rs=0.3516,P=0.0000
等級相關(guān)系數(shù)rs′=0.2148,P=0.0000
結(jié)論:經(jīng)檢驗(yàn),按α=0.05水準(zhǔn)拒絕Ho…..兩變量間的回歸分析——直線回歸分析“回歸”一詞的由來及其生物學(xué)意義
“回歸”一詞最早由Golton(戈爾頓)在一項(xiàng)有關(guān)父親與兒子身高的關(guān)系的研究中提出。兒子身高(Y)與父親身高(X)自然是相關(guān)的,他發(fā)現(xiàn)身材高大的父親所生兒子的身高有不少要比父親矮,而身材矮小的父親所生兒子的身高有不少要比父親高。進(jìn)一步研究表明:雖然高個子的父親常生高個子的兒子,但兒子身高超過父親的概率要小于比父親矮的概率;同樣,雖然矮個子的父親常生矮個子的兒子,但兒子身高比父親更矮的概率要小于比父親高的概率。也就是說不可能無限制的一代比一代高,或一代比一代矮。后代的高度有向人群中個體的平均高度“回歸”的趨勢;離開均值越遠(yuǎn),所受到回歸的壓力也越大。兩變量間的回歸分析——直線回歸分析無論是身材高還是身材矮的父親所生兒子的身高都有向人群的平均身高“回歸”的趨勢,這就是回歸的生物學(xué)含義。后來人們借用“回歸”這個詞來描述通過自變量(independentvariable)的數(shù)值預(yù)測因變量(dependentvariable)的平均水平。即通過可測或易測的變量對未知或難測或不可測變量的狀態(tài)進(jìn)行估計叫做回歸分析(regressionanalysis)?!盎貧w”一詞的由來及其生物學(xué)意義兩變量間的回歸分析——直線回歸分析
這項(xiàng)研究由
F·Galton(1822——1911年)和他的學(xué)生、現(xiàn)代統(tǒng)計學(xué)的奠基者之一K·Pearson(1857——1936年)在研究父母身高與其子女身高的遺傳問題時,觀察了1078對夫婦,以每對夫婦中父親的身高作為解釋變量X,而取他們的一個成年兒子的身高作為被解釋變量Y(應(yīng)變量),將結(jié)果在平面直角坐標(biāo)系上繪成散點(diǎn)圖,發(fā)現(xiàn)趨勢近乎一條直線。計算出的回歸直線方程為:“回歸”一詞的由來及其生物學(xué)意義Galton數(shù)據(jù)散點(diǎn)圖(英寸)FrancisGaltonFrancisGalton爵士(英,1822~1911)是達(dá)爾文(CharlesDarwin)的表弟。他對統(tǒng)計學(xué)的主要貢獻(xiàn)是提出“相關(guān)”與“回歸”的概念,用統(tǒng)計方法對進(jìn)化論中的變異進(jìn)行研究,開創(chuàng)了生物統(tǒng)計學(xué)。兩變量間的回歸分析——直線回歸分析KarlPearsonKarlPearson(英,1857~1936)是FrancisGalton的得意門生,他開創(chuàng)了統(tǒng)計方法學(xué)。他對統(tǒng)計學(xué)的主要貢獻(xiàn):變異數(shù)據(jù)的處理、分布曲線的選配、卡方檢驗(yàn)的提出、回歸與相關(guān)的發(fā)展。兩變量間的回歸分析——直線回歸分析40
目前“回歸”已成為表示變量之間數(shù)量依存關(guān)系的統(tǒng)計術(shù)語,并且衍生出“回歸方程”、“回歸系數(shù)”等統(tǒng)計學(xué)概念。兩變量間的回歸分析——直線回歸分析回歸分析的種類一元回歸(簡單回歸)多元回歸(復(fù)回歸)線性回歸非線性回歸一元線性回歸按自變量的個數(shù)分⒈按回歸曲線的形態(tài)分⒉直線回歸分析的基本概念兩變量間的回歸分析——直線回歸分析如果某一個變量隨著另一個變量的變化而變化,并且它們的變化趨勢呈現(xiàn)直線趨勢,就可以用一個直線方程來定量地描述它們之間的線性數(shù)量依存關(guān)系,這就是直線回歸分析(linearregressionanalysis)。直線回歸分析中兩個變量的地位不同,其中一個變量是依賴于另一個變量而變化的,因此分別稱為因變量(dependentvariable)和自變量(independentvariable),習(xí)慣上分別用Y和X表示。
Y因變量,響應(yīng)變量
(dependentvariable,responsevariable)X自變量,解釋變量
(independentvariable,explanatoryvariable)b回歸系數(shù)
(regressioncoefficient,slope)a截距
(intercept,constant)樣本線性回歸模型的幾個概念兩變量間的回歸分析——直線回歸分析總體一元線性回歸方程:樣本一元線性回歸方程:以樣本統(tǒng)計量估計總體參數(shù)截距a表示在沒有自變量x的影響時,其它各種因素對因變量y的平均影響;回歸系數(shù)b表明自變量x每變動一個單位,因變量y平均變動b個單位。兩變量間的回歸分析——直線回歸分析總體與樣本一元線性回歸模型殘差(Residual):e兩變量間的回歸分析——直線回歸分析幾何意義a>0:回歸線與縱軸交點(diǎn)在原點(diǎn)上方。a<0:回歸線與縱軸交點(diǎn)在原點(diǎn)下方。a=0:回歸線通過原點(diǎn)。統(tǒng)計學(xué)意義a表示自變量X取值為0時相應(yīng)Y條件均數(shù)的估計值。a的單位與Y值相同當(dāng)X可能取0時,a才有實(shí)際意義。線性回歸模型中參數(shù)的幾何意義截距a:兩變量間的回歸分析——直線相關(guān)分析XY回歸系數(shù):線性回歸模型中參數(shù)的幾何意義兩變量間的回歸分析——直線回歸分析b表示自變量X變化一個單位時應(yīng)變量Y的平均改變量。|b|越大,表示Y隨X變化越快,直線越陡峭線性LINEARITY:
因變量均數(shù)與X間呈直線關(guān)系獨(dú)立
INDEPENDENCE
每一觀察值之間彼此獨(dú)立(在給定自變量x的條件下,殘差的條件期望值為零,本假設(shè)又稱零均值假設(shè));該條件實(shí)際上隱含著:各隨機(jī)誤差項(xiàng)互不相關(guān);隨機(jī)誤差項(xiàng)與相應(yīng)的自變量x不相關(guān)。給定X時,Y正態(tài)分布(Normal):對于任何給定的X,Y服從正態(tài)分布,均數(shù)為Y|X,標(biāo)準(zhǔn)差為Y|X,該條件實(shí)際隱含著誤差項(xiàng)服從正態(tài)分布(隨機(jī)誤差,即殘差服從均值為零,方差為2的正態(tài)分布)。等方差(Equalvariance)或標(biāo)準(zhǔn)差相等:對于任何X值,隨機(jī)變量Y的標(biāo)準(zhǔn)差Y|X相等;隱含著不論x取何值,y都具有相同的方差(對于所有的自變量x,殘差的條件方差為2,且為常數(shù))。線性回歸模型的建模假設(shè)(LINE)兩變量間的回歸分析——直線回歸分析XY直線回歸分析的步驟例題1:某克山病區(qū)10名健康兒童頭發(fā)與全血中的硒含量1000ppm(百萬分之一)如下,試建立發(fā)硒(x)與血硒(y)之間的回歸模型?兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟兩變量間的回歸分析——直線回歸分析1繪制散點(diǎn)圖:同相關(guān)分析,即在直角坐標(biāo)系內(nèi)繪制散點(diǎn)圖。①若散點(diǎn)圖呈直線趨勢時,建立直線回歸方程;②若散點(diǎn)圖呈曲線趨勢,進(jìn)行曲線擬合;③若散點(diǎn)圖顯示無任何趨勢,則不必進(jìn)行分析。直線回歸分析的步驟兩變量間的回歸分析——直線回歸分析2建立直線回歸方程實(shí)際上是求出回歸方程中的回歸系數(shù)b和截距a:求回歸系數(shù)b和截距a的方法有最小二乘法、高斯牛頓法、麥夸特法、牛頓法、梯度法、正割法等等。這里重點(diǎn)給大家介紹最小二乘法。從上圖得知,要使能夠最好地代表y和x在數(shù)量上的互變關(guān)系,必須使yx0xiyi(yi-)實(shí)際觀察值與估計值之差兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟2建立直線回歸方程最小二乘法的基本原理:分別對上式的a和b求偏導(dǎo):兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟2建立直線回歸方程用最小二乘法求回歸方程:解方程組,得到回歸系數(shù)b和截距a:直線回歸分析的步驟兩變量間的回歸分析——直線回歸分析2建立直線回歸方程直線回歸分析的步驟兩變量間的回歸分析——直線回歸分析3繪制回歸線
總體一元線性回歸方程:樣本一元線性回歸方程:以樣本統(tǒng)計量估計總體參數(shù)對于直線回歸分析,回歸系數(shù)的假設(shè)檢驗(yàn),也是直線回歸方程的假設(shè)檢驗(yàn)。由于抽樣誤差的存在,回歸系數(shù)b往往不等于總體回歸系數(shù),要判斷是否來自=0的總體,也必須進(jìn)行假設(shè)檢驗(yàn)。常用的回歸系數(shù)的假設(shè)檢驗(yàn)有方差分析和t檢驗(yàn)。兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟4回歸系數(shù)的假設(shè)檢驗(yàn)
兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟4回歸系數(shù)的假設(shè)檢驗(yàn)——方差分析法
Y總變異的分解(1)建立假設(shè),確定H0:=0,即兩變量無直線關(guān)系H1:0,即兩變量有直線關(guān)系=0.05(2)求統(tǒng)計量F剩余(誤差)平方和回歸平方和總離差平方和兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟4回歸系數(shù)的假設(shè)檢驗(yàn)——方差分析法
(2)求統(tǒng)計量F兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟4回歸系數(shù)的假設(shè)檢驗(yàn)——方差分析法
(2)求統(tǒng)計量F兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟4回歸系數(shù)的假設(shè)檢驗(yàn)——方差分析法
(2)求統(tǒng)計量F兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟4回歸系數(shù)的假設(shè)檢驗(yàn)——方差分析法
(3)確定P值,做出結(jié)論兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟4回歸系數(shù)的假設(shè)檢驗(yàn)——t檢驗(yàn)法
(2)求統(tǒng)計量t兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟4回歸系數(shù)的假設(shè)檢驗(yàn)——t檢驗(yàn)法
(2)求統(tǒng)計量t(3)確定P值,做出結(jié)論查t界值表,得到P<0.05……兩種方法的等價性:兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟5直線回歸方程擬合效果評價本例:R2=0.7595亦稱為回歸模型的擬合優(yōu)度檢驗(yàn)。檢驗(yàn)回歸模型對樣本數(shù)據(jù)的擬合程度。1)決定系數(shù)(determinationcoefficient)(Rsquare)2)校正的決定系數(shù)(adjustedRsquare)兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟6直線回歸方程的區(qū)間估計兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟6直線回歸方程的區(qū)間估計(1)總體回歸系數(shù)的可信區(qū)間估計本例總體回歸系數(shù)的95%的可信區(qū)間為(0.1276,0.3440)
為回歸系數(shù)的標(biāo)準(zhǔn)誤,n-2為自由度。兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟6直線回歸方程的區(qū)間估計(2)總體均數(shù)的可信區(qū)間估計
兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟6直線回歸方程的區(qū)間估計(3)個體Y值的預(yù)測區(qū)間
兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟6直線回歸方程的區(qū)間估計在固定x處,總體均數(shù)的可信區(qū)間估計
與個體Y值的預(yù)測區(qū)間
含義不同:
前者表示在固定x處,反復(fù)抽樣100次,可算出100個相應(yīng)的y的總體均數(shù)的置信區(qū)間,有100(1-)個置信區(qū)間包含總體均數(shù);而后者表示預(yù)測值的取值范圍,即在固定x處,隨機(jī)抽取100個個體,平均將有100(1-)個個體值在求出的范圍內(nèi)。兩變量間的回歸分析——直線回歸分析直線回歸分析的步驟6直線回歸方程的區(qū)間估計反映了用估計的回歸方程去預(yù)測而引起的誤差。
可用于確定有關(guān)誤差項(xiàng)的假定是否成立。用于檢測有影響的觀測值。兩變量間的回歸分析——直線回歸分析7殘差分析因變量的觀測值與根據(jù)估計的回歸方程求出的預(yù)測值之差,用e表示.e0兩變量間的回歸分析——直線回歸分析0000eeee兩變量間的回歸分析——直線回歸分析兩變量間的回歸分析——直線回歸分析8直線回歸分析的應(yīng)用兩變量間的回歸分析——直線回歸分析直線回歸分析的注意事項(xiàng)1.做回歸分析要有實(shí)際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象,隨意進(jìn)行回歸分析,忽視事物現(xiàn)象間的內(nèi)在聯(lián)系和規(guī)律。2.直線回歸分析的資料,一般要求應(yīng)變量Y是來自正態(tài)總體的隨機(jī)變量,自變量X可以是正態(tài)隨機(jī)變量,也可以是精確測量和嚴(yán)密控制的值。3.進(jìn)行直線回歸分析時,應(yīng)先繪制散點(diǎn)圖(scatterplot)。散點(diǎn)圖提示有直線趨勢存在時,才可作直線回歸分析。4.繪制散點(diǎn)圖后,若出現(xiàn)一些特大或特小的離群值(異常點(diǎn),outlier),則應(yīng)及時復(fù)核檢查,對由于測定、記錄或計算機(jī)錄入的錯誤數(shù)據(jù),應(yīng)予以修正和剔除。否則,異常點(diǎn)的存在會對回歸方程的參數(shù)估計產(chǎn)生較大影響。5.應(yīng)注意回歸方程的適用范圍,回歸直線不宜外延。兩變量間的回歸分析——直線回歸分析直線相關(guān)與直線回歸的區(qū)別與聯(lián)系區(qū)別1.資料要求不同。相關(guān)要求兩個變量呈雙變量正態(tài)分布;回歸要求應(yīng)變量服從正態(tài)分布,自變量是能精確測量和嚴(yán)格控制的變量。2.統(tǒng)計意義不同。相關(guān)反映兩變量間的伴隨關(guān)系,這種關(guān)系是相互的,對等的,不一定有因果關(guān)系;回歸則反映兩變量間的依存關(guān)系,有自變量與因變量之分,一般將“因”或較易測定、變異較小者定為自變量。這種依存關(guān)系可能是因果關(guān)系或從屬關(guān)系。3.分析目的不同。相關(guān)分析的目的是描述兩變量間的相互關(guān)系,并用一個定量的指標(biāo)來反映這種關(guān)系的方向和密切程度;回歸分析的目的則是描述因變量與自變量間的數(shù)量依存關(guān)系,從而可以進(jìn)行統(tǒng)計預(yù)測和統(tǒng)計控制。兩變量間的回歸分析——直線回歸分析聯(lián)系1.對同一資料,r與b的符號一致,都能說明兩變量間關(guān)系的方向。
2.相關(guān)系數(shù)與回歸系數(shù)的假設(shè)檢驗(yàn)是等價的,對同一樣本,。因此實(shí)際應(yīng)用中同一組資料進(jìn)行相關(guān)和回歸分析時,只檢驗(yàn)其中之一即可。3.相關(guān)與回歸可以相互解釋。相關(guān)系數(shù)的平方等于回歸平方和占總平方和的比例,即反映應(yīng)變量的總變異中歸因于自變量的部分。又稱決定系數(shù)(coefficientofdetermination),可以用來衡量回歸效果的優(yōu)劣。兩變量間相關(guān)關(guān)系越密切,越接近1,說明回歸平方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報參考:教材插圖智能設(shè)計美學(xué)的社會主義核心價值觀對齊研究
- 課題申報參考:建成環(huán)境對老年人公交及地鐵出行的時空動態(tài)影響及適老化建成環(huán)境優(yōu)化研究
- 二零二五版文化藝術(shù)用品采購合同模板3篇
- 二零二五年度房地產(chǎn)投資定金監(jiān)管協(xié)議4篇
- 二零二五年度煤炭運(yùn)輸節(jié)能減排協(xié)議4篇
- 二零二五版爐渣清潔生產(chǎn)采購技術(shù)服務(wù)合同4篇
- 2025年度高壓供電線路維護(hù)服務(wù)協(xié)議范本3篇
- 2025版?zhèn)€人退股協(xié)議書:上市公司股份回購與股東退出協(xié)議4篇
- 深圳2025年度廠房租賃合同范本2篇
- 二零二五年度建筑安全評估師雇傭合同標(biāo)準(zhǔn)版3篇
- 化學(xué)-河南省TOP二十名校2025屆高三調(diào)研考試(三)試題和答案
- 智慧農(nóng)貿(mào)批發(fā)市場平臺規(guī)劃建設(shè)方案
- 林下野雞養(yǎng)殖建設(shè)項(xiàng)目可行性研究報告
- 2023年水利部黃河水利委員會招聘考試真題
- Python編程基礎(chǔ)(項(xiàng)目式微課版)教案22
- 01J925-1壓型鋼板、夾芯板屋面及墻體建筑構(gòu)造
- 乳腺導(dǎo)管原位癌
- 冷庫管道應(yīng)急預(yù)案
- 《學(xué)習(xí)教育重要論述》考試復(fù)習(xí)題庫(共250余題)
- 網(wǎng)易云音樂用戶情感畫像研究
- 小學(xué)四年級奧數(shù)題平均數(shù)問題習(xí)題及答案
評論
0/150
提交評論