統(tǒng)計(jì)學(xué)教案習(xí)題10直線相關(guān)與回歸分享_第1頁
統(tǒng)計(jì)學(xué)教案習(xí)題10直線相關(guān)與回歸分享_第2頁
統(tǒng)計(jì)學(xué)教案習(xí)題10直線相關(guān)與回歸分享_第3頁
統(tǒng)計(jì)學(xué)教案習(xí)題10直線相關(guān)與回歸分享_第4頁
統(tǒng)計(jì)學(xué)教案習(xí)題10直線相關(guān)與回歸分享_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、文檔供參考,可復(fù)制、編制,期待您的好評(píng)與關(guān)注! 第十章 直線相關(guān)與回歸一、教學(xué)大綱要求(一) 掌握內(nèi)容直線相關(guān)與回歸的基本概念。相關(guān)系數(shù)與回歸系數(shù)的意義及計(jì)算。相關(guān)系數(shù)與回歸系數(shù)相互的區(qū)別與了解。(二)熟悉內(nèi)容相關(guān)系數(shù)與回歸系數(shù)的假設(shè)檢驗(yàn)。直線回歸方程的應(yīng)用。秩相關(guān)與秩回歸的意義。(三)了解內(nèi)容 曲線直線化。二、 學(xué)內(nèi)容精要(一) 直線回歸1. 基本概念直線回歸(linear regression)建立一個(gè)描述應(yīng)變量依自變量變化而變化的直線方程,并要求各點(diǎn)與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基本、最簡(jiǎn)單的一種,故又稱簡(jiǎn)單回歸(simple regression)。直線回歸方程

2、中,a、b是決定直線的兩個(gè)系數(shù),見表10-1。表10-1 直線回歸方程a、b兩系數(shù)對(duì)比ab含義回歸直線在Y軸上的截距(intercept)。表示X為零時(shí),Y的平均水平的估計(jì)值?;貧w系數(shù)(regression coefficient),即直線的斜率。表示X每變化一個(gè)單位時(shí),Y的平均變化量的估計(jì)值。系數(shù)>0a>0表示直線與縱軸的交點(diǎn)在原點(diǎn)的上方b>0,表示直線從左下方走向右上方,即Y隨X增大而增大系數(shù)<0a<0表示直線與縱軸的交點(diǎn)在原點(diǎn)的下方b<0,表示直線從左上方走向右下方,即Y隨X增大而減小系數(shù)=0a=0表示回歸直線通過原點(diǎn)b=0,表示直線與X軸平行,即Y不

3、隨X的變化而變化計(jì)算公式2. 樣本回歸系數(shù)b的假設(shè)檢驗(yàn)(1)方差分析;(2)t檢驗(yàn)。3. 直線回歸方程的應(yīng)用(1)描述兩變量的依存關(guān)系;(2)用回歸方程進(jìn)行預(yù)測(cè);(3)用回歸方程進(jìn)行統(tǒng)計(jì)控制;(4)用直線回歸應(yīng)注意的問題。 (二) 直線相關(guān)1. 基本概念直線相關(guān)(linear correlation)又稱簡(jiǎn)單相關(guān)(simple correlation),用于雙變量正態(tài)分布資料。有正相關(guān)、負(fù)相關(guān)和零相關(guān)等關(guān)系。直線相關(guān)的性質(zhì)可由散點(diǎn)圖直觀的說明。相關(guān)系數(shù)又稱積差相關(guān)系數(shù)(coefficient of product-moment correlation),以符號(hào)r表示樣本相關(guān)系數(shù),表示總體相關(guān)系

4、數(shù)。它是說明具有直線關(guān)系的兩個(gè)變量間,相關(guān)關(guān)系的密切程度與相關(guān)方向的指標(biāo)。2. 計(jì)算公式相關(guān)系數(shù)r沒有單位,其值為1r1。其絕對(duì)值愈接近1,兩個(gè)變量間的直線相關(guān)愈密切;愈接近0,相關(guān)愈不密切。r值為正表示正相關(guān),說明一變量隨另一變量增減而增減,方向相同;r值為負(fù)表示負(fù)相關(guān),說明一變量增加、另一變量減少,即方向相反;r的絕對(duì)值等于1為完全相關(guān)。3. 樣本相關(guān)系數(shù)r的假設(shè)檢驗(yàn)(1)r界值表法;(2)t檢驗(yàn)法。(三)直線回歸與相關(guān)的區(qū)別與了解1. 區(qū)別(1) 資料要求:直線回歸要求因變量Y服從正態(tài)分布,X是可以精確測(cè)量和嚴(yán)格控制的變量,一般稱為型回歸;直線相關(guān)要求兩個(gè)變量X、Y服從雙變量正態(tài)分布。這

5、種資料若進(jìn)行回歸分析稱為型回歸。(2) 應(yīng)用情況:直線回歸是說明兩變量依存變化的數(shù)量關(guān)系;直線相關(guān)是說明兩變量間的相關(guān)關(guān)系。(3) 意義:b表示X每增(減)一個(gè)單位時(shí),Y平均改變b個(gè)單位;r說明具有直線關(guān)系的兩個(gè)變量間關(guān)系的密切程度與相關(guān)方向。(4) 計(jì)算:b= lxy/ lxx ;r = lxy/。(5) 取值范圍:b+ ;1r1 。(6) 單位:b有單位;r沒有單位。2. 了解(1) 方向一致:對(duì)一組數(shù)據(jù)若能同時(shí)計(jì)算b和r,它們的符號(hào)一致。(2) 假設(shè)檢驗(yàn)等價(jià):對(duì)同一樣本,r和b的假設(shè)檢驗(yàn)得到的t值相等,即tb=tr 。(3) 用回歸解釋相關(guān):決定系數(shù),回歸平方和越接近總平方和,則r2越接

6、近1,說明引入相關(guān)的效果越好。 (四)秩相關(guān)秩相關(guān),又稱等級(jí)相關(guān)(rank correlation),是用雙變量等級(jí)數(shù)據(jù)作直線相關(guān)分析,適用于下列資料:不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析;總體分布型未知;用等級(jí)表示的原始數(shù)據(jù)。三、典型試題分析1回歸系數(shù)的假設(shè)檢驗(yàn)( )A只能用r的檢驗(yàn)代替 B只能用t檢驗(yàn)C只能用F檢驗(yàn) D三者均可答案:D評(píng)析 本題考點(diǎn):回歸系數(shù)假設(shè)檢驗(yàn)方法的理解。回歸系數(shù)的假設(shè)檢驗(yàn)常用的方法有:方差分析;t檢驗(yàn)。對(duì)同一樣本,r和b的假設(shè)檢驗(yàn)等價(jià),r和b的假設(shè)檢驗(yàn)得到的t值相等,即tb=tr。故回歸系數(shù)的假設(shè)檢驗(yàn)用三者均可。2已知r1=r2,那么( ) Ab1=b2 Btb

7、1=tb2 Ctr1=tr2 D兩樣本決定系數(shù)相等 答案: D評(píng)析 本題考點(diǎn):直線相關(guān)系數(shù)與回歸系數(shù)關(guān)系的理解。因?yàn)橄嚓P(guān)系數(shù)r和回歸系數(shù)b的計(jì)算公式不同,不能推導(dǎo)出b1=b2 ;r和b的假設(shè)檢驗(yàn)等價(jià),即tr1= tb1,tr2=tb2,而不是tb1=tb2,tr1=tr2 ;樣本決定系數(shù)為r2,已知r1=r2,則兩樣本決定系數(shù)相等,即r12=r22。3|r|>r0.05( n-2)時(shí),可認(rèn)為兩變量X與Y間( )A有一定關(guān)系 B. 有正相關(guān)關(guān)系C一定有直線關(guān)系 D. 有直線關(guān)系答案: D評(píng)析 本題考點(diǎn):直線相關(guān)系數(shù)假設(shè)檢驗(yàn)的理解。因?yàn)橹本€相關(guān)系數(shù)r是樣本的相關(guān)系數(shù),它是相應(yīng)總體相關(guān)系數(shù)的估

8、計(jì)值。由于抽樣誤差的影響,必須進(jìn)行顯著性檢驗(yàn)。r的假設(shè)檢驗(yàn)是檢驗(yàn)兩變量是否有直線相關(guān)關(guān)系。|r|>r0.05( n-2)時(shí),P<0.05,拒絕H0,接受H1,認(rèn)為總體相關(guān)系數(shù)0,因此可認(rèn)為兩變量X與Y間有直線關(guān)系。4相關(guān)系數(shù)檢驗(yàn)的無效假設(shè)H0是( )A=0 B. 0C>0 D. <0答案: A評(píng)析 本題考點(diǎn):直線相關(guān)系數(shù)顯著性檢驗(yàn)中檢驗(yàn)假設(shè)的理解。因?yàn)閞是樣本相關(guān)系數(shù),它是總體相關(guān)系數(shù)的估計(jì)值。要判兩變量間是否有相關(guān)關(guān)系,就要檢驗(yàn)r是否來自總體相關(guān)系數(shù)為零的總體。因?yàn)榧词箯?0的總體作隨機(jī)抽樣,由于抽樣誤差的影響,所得r值也常不等于零。5同一雙變量資料,進(jìn)行直線相關(guān)與回

9、歸分析,有( )。Ar>0,b<0 B. r>0,b>0Cr<0,b>0 D. r與b的符號(hào)毫無關(guān)系答案: B評(píng)析 本題考點(diǎn):直線相關(guān)與回歸的區(qū)別與了解的理解。因?yàn)閷?duì)同一資料而言直線相關(guān)系數(shù)與回歸系數(shù)的方向一致,若能同時(shí)計(jì)算b和r,它們的符號(hào)一致。因此,同一雙變量資料,進(jìn)行直線相關(guān)與回歸分析,有r>0,b>0。四、習(xí) 題(一) 單項(xiàng)選擇題1 下列( )式可出現(xiàn)負(fù)值。A(X)2 BY 2(Y)2/nC(Y) 2 D(X)(Y)2 Y=14+4X是17歲兒童以年齡(歲)估計(jì)體重(市斤)的回歸方程,若體重?fù)Q成國際單位kg,則此方程( )。A截距改變 B

10、回歸系數(shù)改變C兩者都改變 D兩者都不改變3 已知r=1,則一定有( )。Ab=1 Ba=1CSY. X=0 DSY. X= SY4 用最小二乘法確定直線回歸方程的原則是各觀察點(diǎn)( )。A距直線的縱向距離相等B距直線的縱向距離的平方和最小C與直線的垂直距離相等D與直線的垂直距離的平方和最小5 直線回歸分析中,X的影響被扣除后,Y方面的變異可用指標(biāo)( )表示。A B. C. D. 6 直線回歸系數(shù)假設(shè)檢驗(yàn),其自由度為( )。An Bn1Cn2 D2n17 應(yīng)變量Y的離均差平方和劃分,可出現(xiàn)( )。ASS剩=SS回 BSS總=SS剩CSS總=SS回 D以上均可8 下列計(jì)算SS剩的公式不正確的是( )

11、。A B C. D 9 直線相關(guān)系數(shù)可用( )計(jì)算。A BC D 以上均可10 當(dāng)r=0時(shí),回歸方程中有( )。Aa必大于零 B. a必等于Ca必等于零 D. a必等于(二) 名詞解釋1. 直線回歸 2. 回歸系數(shù) 3. 剩余平方和 4. 回歸平方和 5. 直線相關(guān)6. 零相關(guān) 7. 相關(guān)系數(shù) 8. 決定系數(shù) 9. 曲線直線化 10.秩相關(guān)(三) 是非題1 剩余平方和SS剩1=SS剩2,則r1必然等于r2。2 直線回歸反映兩變量間的依存關(guān)系,而直線相關(guān)反映兩變量間的相互直線關(guān)系。3 兩變量關(guān)系越密切r值越大。(四)簡(jiǎn)答題1 用什么方法考察回歸直線圖示是否正確?2 剩余標(biāo)準(zhǔn)差的意義和用途?3 某

12、資料n=100,X與Y的相關(guān)系數(shù)為r=0.1,可否認(rèn)為X與Y有較密切的相關(guān)關(guān)系?4 r與rs的應(yīng)用條件有何不同?5 應(yīng)用直線回歸和相關(guān)分析時(shí)應(yīng)注意哪些問題?6 舉例說明如何用直線回歸方程進(jìn)行預(yù)測(cè)和控制?7 直線回歸分析時(shí)怎樣確定因變量與自變量?(五)計(jì)算題110名20歲男青年身高與前臂長(zhǎng)的數(shù)據(jù)見表10-2。計(jì)算相關(guān)系數(shù)并對(duì)=0進(jìn)行假設(shè)檢驗(yàn);計(jì)算總體的95%可信區(qū)間。表10-2 10名20歲男青年身高與前臂長(zhǎng)身 高(cm)170173160155173188178183180165前臂長(zhǎng)(cm)454244414750474649432 某單位研究代乳粉營(yíng)養(yǎng)價(jià)值時(shí),用大白鼠作實(shí)驗(yàn),得到大白鼠進(jìn)食

13、量和增加體重的數(shù)據(jù)見表10-3。此資料有無可疑的異常點(diǎn)?求直線回歸方程并對(duì)回歸系數(shù)作假設(shè)檢驗(yàn)。試估計(jì)進(jìn)食量為900g時(shí),大白鼠的體重平均增加多少,計(jì)算其95%的可信區(qū)間,并說明其含義。求進(jìn)食量為900g時(shí),個(gè)體Y值的95%容許區(qū)間,并解釋其意義。表10-3 八只大白鼠的進(jìn)食量和體重增加量鼠號(hào)12345678進(jìn)食量(g)800780720867690787934750增量(g)1851581301801341671861333 某省衛(wèi)生防疫站對(duì)八個(gè)城市進(jìn)行肺癌死亡回顧調(diào)查,并對(duì)大氣中苯并(a)芘進(jìn)行監(jiān)測(cè),結(jié)果如下,試檢驗(yàn)兩者有無相關(guān)?表10-4 八個(gè)城市的肺癌標(biāo)化死亡率和大氣中苯并(a)芘濃度城

14、市編號(hào)12345678肺癌標(biāo)化死亡率(1/10萬)5.6018.5016.2311.4013.808.1318.0012.10苯并(a)芘(g/100m3)0.051.171.050.100.750.500.651.204 就下表資料分析血小板和出血癥的關(guān)系。表10-5 12例病人的血小板濃度和出血癥的關(guān)系病例號(hào)123456789101112血小板數(shù)(109/L)12013016031042054074010601260123014402000出血癥狀+±+五、習(xí)題答題要點(diǎn)(一) 單項(xiàng)選擇題1.D 2.C 3.C 4.B 5.C 6.C 7.D 8.B 9.D 10.D(二) 名詞解

15、釋1 直線回歸(linear regression)建立一個(gè)描述應(yīng)變量依自變量變化而變化的直線方程,并要求各點(diǎn)與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基本、最簡(jiǎn)單的一種,故又稱簡(jiǎn)單回歸(simple regression)。2 回歸系數(shù)(regression coefficient)即直線的斜率(slope),在直線回歸方程中用b表示,b的統(tǒng)計(jì)意義為X每增(減)一個(gè)單位時(shí),Y平均改變b個(gè)單位。3 剩余平方和(residual sum of squares),SS剩即,它反映X對(duì)Y的線性影響之外的一切因素對(duì)Y的變異的作用,也就是在總平方和中無法用X解釋的部分。在散點(diǎn)圖中,各實(shí)測(cè)點(diǎn)離

16、回歸直線越近,也就越小,說明直線回歸的估計(jì)誤差越小。4 回歸平方和(regression sum of squares),SS回即,它反映由于X與Y的直線關(guān)系而使Y的總變異所減小的部分,也就是在總平方和中可以用X解釋的部分?;貧w平方和越大,說明回歸效果越好。5 直線相關(guān)(linear correlation)又稱簡(jiǎn)單相關(guān)(simple correlation),用于雙變量正態(tài)分布資料。有正相關(guān)、負(fù)相關(guān)和零相關(guān)等關(guān)系。直線相關(guān)的性質(zhì)可由散點(diǎn)圖直觀的說明。6 零相關(guān)(zerro correlation)是指兩變量間沒有直線相關(guān)關(guān)系。11 相關(guān)系數(shù)又稱積差相關(guān)系數(shù)(coefficient of pr

17、oduct-moment correlation),以符號(hào)r表示樣本相關(guān)系數(shù),表示總體相關(guān)系數(shù)。它是說明具有直線關(guān)系的兩個(gè)變量間,相關(guān)關(guān)系的密切程度與相關(guān)方向的指標(biāo)。12 決定系數(shù)(coefficient of determination)即r的平方,說明當(dāng)SS總固定不變時(shí),回歸平方和的大小決定了r平方的大小?;貧w平方和越接近總平方和,則r平方值越接近1。13 曲線直線化(rectification)是曲線擬合的重要手段之一。對(duì)于某些非線性的資料可以通過簡(jiǎn)單的變量變換使之直線化,用直線回歸分析方法來分析。14. 秩相關(guān)又稱等級(jí)相關(guān)(rank correlation),是用雙變量等級(jí)數(shù)據(jù)作直線相

18、關(guān)分析,適用于下列資料:不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析;總體分布型未知;用等級(jí)表示的原始數(shù)據(jù)。(三)是非題1錯(cuò)。兩樣本剩余平方和SS剩1=SS剩2,但兩樣本總平方和SS總及回歸平方和SS回不一定相等,故兩樣本相關(guān)系數(shù)r1與 r2不一定相等。2正確。3錯(cuò)。相關(guān)系數(shù)r有正負(fù)之分,其值為1r1,在總體相關(guān)系數(shù)不為零,即兩變量確有直線關(guān)系前提下,r絕對(duì)值愈接近1,兩個(gè)變量間的直線相關(guān)愈密切;愈接近0,相關(guān)愈不密切。(四)簡(jiǎn)答題1用以下三種方法判定:直線必須通過點(diǎn)()。若縱坐標(biāo)、橫坐標(biāo)無折斷號(hào)時(shí),將此線左端延長(zhǎng)與縱軸相交,交點(diǎn)的縱坐標(biāo)必等于截距a。直線是否在自變量X的實(shí)測(cè)范圍內(nèi)。2剩余標(biāo)準(zhǔn)差用

19、sY. X表示: 其意義是指當(dāng)X對(duì)Y的影響被扣除后,Y方面仍有變異。這部分變異與X無關(guān),純屬抽樣變異。故sY. X是用來反映Y的剩余變異的,即不考慮X以后Y本身的隨機(jī)變異。剩余標(biāo)準(zhǔn)差可用于:估計(jì)回歸系數(shù)b的標(biāo)準(zhǔn)誤,進(jìn)行回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)。估計(jì)總體中當(dāng)X為某一定值時(shí),估計(jì)值的標(biāo)準(zhǔn)誤。 并可計(jì)算的可信區(qū)間,sY. X可作為預(yù)報(bào)精度的指標(biāo)。估計(jì)總體中當(dāng)X為某一定值時(shí),個(gè)體Y值的標(biāo)準(zhǔn)差。,并計(jì)算個(gè)體Y值的容許區(qū)間。3n=100,r=0.1時(shí),對(duì)相關(guān)系數(shù)進(jìn)行t檢驗(yàn),按檢驗(yàn)水準(zhǔn)=0.05,拒絕H0(=0),接受H1(0),認(rèn)為兩變量有相關(guān)關(guān)系,但決定系數(shù)r2=0.12=0.01,表示回歸平方和在

20、總平方和中僅占1%,說明兩變量間相關(guān)關(guān)系實(shí)際意義不大。4積差相關(guān)系數(shù)r用于描述雙變量正態(tài)分布資料的相關(guān)關(guān)系。等級(jí)相關(guān)系數(shù)rs適用于下列資料:不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析的資料;總體分布型未知的資料;原始資料是用等級(jí)表示的資料。5注意以下五個(gè)問題作回歸分析和相關(guān)分析時(shí)要有實(shí)際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象作回歸、相關(guān)分析,必須對(duì)兩種現(xiàn)象間的內(nèi)在了解有所認(rèn)識(shí)。在進(jìn)行回歸分析和相關(guān)分析之前,應(yīng)繪制散點(diǎn)圖。但觀察點(diǎn)的分布有直線趨勢(shì)時(shí),才適宜作回歸、相關(guān)分析。如果散點(diǎn)圖呈明顯曲線趨勢(shì),應(yīng)使之直線化再行分析。散點(diǎn)圖還能提示資料有無可疑異常點(diǎn)。直線回歸方程的應(yīng)用范圍一般以自變量的取值范圍為限。若

21、無充分理由證明超過自變量取值范圍外還是直線,應(yīng)避免外延。雙變量的小樣本經(jīng)t檢驗(yàn)只能推斷兩變量間有無直線關(guān)系,而不能推斷相關(guān)的緊密程度,要推斷相關(guān)的緊密程度,樣本含量必須很大。相關(guān)或回歸關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,有相關(guān)或回歸關(guān)系不能證明事物間確有內(nèi)在了解。6用直線回歸方程進(jìn)行預(yù)測(cè)和控制的步驟根據(jù)研究目的確定預(yù)報(bào)因子(X)和預(yù)報(bào)量(Y),由X估計(jì)Y值,收集資料。建立預(yù)報(bào)方程,并進(jìn)行回歸系數(shù)假設(shè)檢驗(yàn)。若P小于臨界值,則回歸方程成立。根據(jù)回歸方程在X實(shí)測(cè)范圍內(nèi)對(duì)Y進(jìn)行預(yù)測(cè),并計(jì)算X為某定值時(shí),個(gè)體Y值波動(dòng)范圍(容許區(qū)間)。例如,17歲兒童,X為年齡,Y為體重,可根據(jù)年齡預(yù)測(cè)(估計(jì))體重。

22、統(tǒng)計(jì)控制是利用回歸方程進(jìn)行逆估計(jì),如要求因變量Y值在一定范圍內(nèi)波動(dòng),可以通過控制自變量X的取值來實(shí)現(xiàn)。步驟同前。例如,針刺啞門穴,進(jìn)針深度Y與頸圍X間存在直線關(guān)系,可根據(jù)X取值達(dá)到控制Y的目的。7型回歸中,X為精密測(cè)量和嚴(yán)格控制的變量,Y為正態(tài)變量。型回歸中,X、Y均為服從正態(tài)分布的隨機(jī)變量,可計(jì)算兩個(gè)回歸方程。何者為X,何者為Y,根據(jù)研究目的確定。例如,測(cè)得某一人群的身高和體重兩變量,若目的只是由身高估計(jì)體重,則確定X為身高,Y為體重。 (五)計(jì)算題1由原始數(shù)據(jù)及散點(diǎn)圖的初步分析(圖10-1),估計(jì)本資料有直線趨勢(shì)。(1)計(jì)算相關(guān)系數(shù)與=0進(jìn)行假設(shè)檢驗(yàn)。H0:=0,即身高與前臂長(zhǎng)間無直線相關(guān)

23、關(guān)系H1:0,即身高與前臂長(zhǎng)間有直線相關(guān)關(guān)系=0.05,查t界值表,得0.002<P<0.005,按=0.05水準(zhǔn)拒絕H0,接受H1,故可認(rèn)為20歲男青年身高與前臂長(zhǎng)呈正直線相關(guān)。 算總體的95%可信區(qū)間。對(duì)r作z變換:或,z=tanh10.8227=1.1651z的95%可信區(qū)間:按r=tanhz對(duì)z作反變換,得20歲男青年身高與與前臂長(zhǎng)總體相關(guān)系數(shù)的95%可信區(qū)間為(0.4005,0.9567)。2由原始數(shù)據(jù)及散點(diǎn)圖初步分析(圖10-2),估本資料有直線趨勢(shì),故作下列計(jì)算。X=6328,X2=5048814,Y=1273,Y2=206619, ,XY=1018263 Y=172

24、.94+0.42XY=47.33+0.26XY=78.29+0.10X 圖10-2 大白鼠的進(jìn)食量與增加體重散點(diǎn)圖(1)回歸系數(shù)假設(shè)檢驗(yàn):H0:0,即進(jìn)食量與增重之間無直線關(guān)系H1:0,即進(jìn)食量與增重之間有直線關(guān)系0.05 方差分析,見表10-6。表10-6 方差分析表變異來源SSMSF總變異4052.8757回歸2954.90512954.90516.147剩余1097.9706182.995計(jì)算得F=16.147,查F界值表,得P<0.01,按0.05水準(zhǔn),拒絕H0,接受H1,可認(rèn)為大白鼠的進(jìn)食量與增加體重間有直線關(guān)系。 t檢驗(yàn):H0:0,即進(jìn)食量與增重之間無直線關(guān)系H1:0,即進(jìn)食

25、量與增重之間有直線關(guān)系0.05按=6,查t界值表,得0.01>P>0.05,按0.05水準(zhǔn),拒絕H0,接受H1,結(jié)論同上。本題故可用直線回歸方程來描述大白鼠的進(jìn)食量與增加體重的關(guān)系。異常點(diǎn)即對(duì)應(yīng)于殘差(Y)絕對(duì)值特大的觀測(cè)數(shù)據(jù)見表10-7。表10-7 殘差的計(jì)算序號(hào)XY Y1800185161.47423.5262780158156.2541.7463720130140.59410.5944867180178.9611.0395690134132.7641.2366787167158.0818.9197934186196.44810.4488750133148.42415.424由

26、散點(diǎn)圖及殘差分析,第一號(hào)點(diǎn)(X=800,Y=185)為可疑的異常點(diǎn)。根據(jù)以上的計(jì)算結(jié)果,進(jìn)一步求其總體回歸系數(shù)的95%可信區(qū)間。繪制回歸直線并圖示回歸系數(shù)95%可信區(qū)間??傮w回歸系數(shù)的95%可信區(qū)間:(bt0.05(n2) Sb,bt0.05(n2) Sb)=(0.2612.447×13.5107,0.2612.447×13.5107)=(0.1022,0.4198)取X1=690,代入回歸方程=47.326+0.261X,得Y1=132.76;X2=934,Y2=196.45。在圖上確定(690,132.76)和(934,196.45)兩個(gè)點(diǎn),以直線連接即得回歸直線的圖形

27、見圖10-2。按回歸系數(shù)的95%可信區(qū)間下限和上限分別代入,得=78.285,=172.937。回歸系數(shù)的95%可信區(qū)間上、下限對(duì)應(yīng)的兩條直線,即圖10-2中兩條回歸直線,回歸方程為:=78.285+0.1022X,=172.937+0.4198X估計(jì)進(jìn)食量為900g時(shí),大白鼠的體重平均增加多少,計(jì)算其95%的可信區(qū)間,并說明其含義。當(dāng)X=900時(shí),的95%可信區(qū)間:(t0.05(6) ,t0.05(6) )=(187.5742.447×8.5446,187.5742.447×8.5446)=(166.67,208.48)即總體中,進(jìn)食量為900g時(shí),大白鼠的體重平均增加1

28、87.574g,其95%的可信區(qū)間為166.67208.48g。其含義為:當(dāng)進(jìn)食量為900g時(shí),相應(yīng)的平均增重服從一個(gè)正態(tài)分布(此正態(tài)分布的樣本均數(shù)估計(jì)值為187.574g),如果從此正態(tài)分布中重復(fù)抽樣100次,這100個(gè)可信區(qū)間中理論上將有95個(gè)區(qū)間包含真正的總體均數(shù)(雖然這個(gè)總體均數(shù)真值是未知的)。求進(jìn)食量為900g時(shí),個(gè)體Y值的95%容許區(qū)間,并解釋其意義。當(dāng)X=900時(shí),=47.326+0.261X=187.574,個(gè)體Y值的95%容許區(qū)間:(t0.05(6)SY ,t0.05(6)SY)=(187.5742.447×16.0002,187.5742.447×16.0002)=(148.42,226.73)即估計(jì)總體中,進(jìn)食量為9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論