3一元線性回歸PPT教學(xué)課件_第1頁
3一元線性回歸PPT教學(xué)課件_第2頁
3一元線性回歸PPT教學(xué)課件_第3頁
3一元線性回歸PPT教學(xué)課件_第4頁
3一元線性回歸PPT教學(xué)課件_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、變量之間的關(guān)系大致有兩種:1.: 確定性關(guān)系2. :非確定性關(guān)系社會經(jīng)濟領(lǐng)域中, 投入與產(chǎn)出;價格與需求的關(guān)系等.例如: 人的身高與體重; 人的年齡與血壓;第1頁/共63頁x: 普通變量, Y : 隨機變量,),(),(),(2211nnyxyxyx, 對Y 獨立觀察得到,21nxxx當(dāng)x 取定一組不完全相同的值),(),(),(2211nnYxYxYx, 對應(yīng)的樣本值用樣本來估計Y 關(guān)于x 的回歸函數(shù)(x).第2頁/共63頁例1 為研究某化學(xué)反應(yīng)過程中,溫度x ()對產(chǎn)品得率Y(%) 的影響,測得數(shù)據(jù)如下: x () 100 110120 130 140150160 170 180 190Y

2、 (%) 45 51 54 61 66 70 74 78 85 89散點圖020406080100050100150200系列1第3頁/共63頁),(2 bxaNY ), 0(2 N稱為,b 稱為.其中未知參數(shù)a,b 和 都不依賴于x, 2 bxax )( ),(bxaY 假設(shè)對x 的每一個值有, bxaYY 有兩部分組成:x 的線性函數(shù)bxa 隨機誤差), 0(2 N記第4頁/共63頁作獨立試驗,得到樣本,21nxxx當(dāng)x 取一組不全相同的值),(),(),(2211nnYxYxYx, ,iiibxaY ), 0(2 Nin ,21相互獨立,),(2 iibxaNY ni, 2 , 1 nY

3、YY,21,相互獨立,它們的聯(lián)合密度是 221)(21exp21iinibxayL 第5頁/共63頁 niiibxaybaQ12)(),( niiinbxay122)(21exp21 用最大似然估計法估計a,b.L最大,只需下式最小, 0)(21 niiibxayaQ0)(21 iniiixbxaybQ第6頁/共63頁 niiiniiniiniiniiyxbxaxybxna112111 正規(guī)方程組: niiniiniixxxn12112112 niiniixxn系數(shù)行列式0)(12 niixxn有唯一解,第7頁/共63頁 niiniiniiniiniiniiniiixnbynaxxnyxyxn

4、b1121121111 niiniiixxyyxx121)()(,11 niixnx niiyny11 xby bxax )( ,)( xbax 回歸函數(shù) 的估計 稱為,簡稱,其圖形稱為.xbay )(xxbyy 第8頁/共63頁 niixxxxS12)( niiixyyyxxS1)( niiyyyyS12)(21121 niiniixnx niiniiniiiyxnyx111121121 niiniiyny xbyaSSbxxxy 第9頁/共63頁例2 例1中為研究某化學(xué)反應(yīng)過程中,溫度x ()對產(chǎn)品得率Y(%) 的影響,測得數(shù)據(jù)如下: x () 100 110120 130 1401501

5、60 170 180 190Y (%) 45 51 54 61 66 70 74 78 85 89計算,1450101 iix 673,101 iiy,2185001012 iix,101570101 iiiyx.472251012 iiy第10頁/共63頁,825014501012185002 21121 niiniixxxnxS niiniiniiixyyxnyxS1111,39856731450101101570 xxxySSb 48303. 082503985 xbya 73935. 248303. 01450101673101 回歸直線方程:,48303. 073935. 2xy )

6、,145(48303. 03 .67 xy或第11頁/共63頁 niiieyyQ12)( niiixbay12)()()(22 EbxaYE 22)()( ED,ixxixbayyi 記iiyy ix稱 為 處的殘差.殘差平方和iixbax)( 是 與 處的觀察值 的偏差的平方和.ixiy第12頁/共63頁 niiieyyQ12)(21)(xxbyyinii niininiiiixxbyyxxbyy12211)()()(2)(xxxyyySbSbS2)(2 Qe的分解:,xxxySSb ;xyyyeSbSQ Qe的一個分解式:第13頁/共63頁 niiixYYYxxS1)(,)(12 niiY

7、YYYSxYYYeSbSQ ),2(22 nQe , 22 nQEe ,)2(2 nQEe2的無偏估計量:22 nQe xYYYSbSn21 記可證明:第14頁/共63頁例3 求例2中2的無偏估計.21121 niiniiyyynyS, 1 .1932673101472252 ,3985 xyS,48303. 0 bxyyyeSbSQ ,23. 7 22 nQe 90. 0823. 7 第15頁/共63頁, 0:0 bH, 0:1 bH提出假設(shè)),2()2(2222 nQne , ),(2xxSbNb 可以證明,),2()2()2(222 ntnnSbbxx b與Qe獨立,),2( ntSbb

8、xx 2 第16頁/共63頁當(dāng)H0為真時, 0 b),2( ntSbtxx , 0)( bbE拒絕域:)2(2 ntSbtxx 第17頁/共63頁例4 檢驗例2中的回歸效果是否顯著,=0.05,48303. 0 b, 9 . 02 ,8250 xxS,3060. 2)8(025. 0 t, 0:0 bH, 0:1 bH),2( ntSbtxx 25.46 xxSbt ,3060. 2 拒絕 , 0:0 bH認為回歸效果是顯著的.第18頁/共63頁),2( ntSbbxx xxSntb )2(2b 的置信水平為1-的置信區(qū)間為 825090. 03060. 2048303. 0=(0.45894

9、,0.50712)例2中b 的置信水平為0.95的置信區(qū)間為第19頁/共63頁點估計:,0時時當(dāng)當(dāng)xx 000)( xbaxy 00 xbaY 相應(yīng)的估計量:可以證明,)(00bxaYE (0,1)(1)( 2000NSxxnbxaYxx ),2()2(2222 nQne 0YeQ與 獨立,第20頁/共63頁)2()2()(1)( 222000 nnSxxnbxaYxx 2)( nt2)()(1)( 2000 ntSxxnbxaYxx 00)(bxax 置信水平為1-的置信區(qū)間 xxSxxnntY2020)(1)2( xxSxxnntxba2020)(1)2( 或第21頁/共63頁,000 b

10、xaY), 0(20 N點預(yù)測:000)( xbaxY 22000)(11, 0 xxSxxnNYY)1 , 0()(11200NSxxnYYxx eQYY,00相互獨立,第22頁/共63頁)2()2()(11 222000 nnSxxnYYxx 2)( nt2)()(11 2000 ntSxxnYYxx Y0的置信水平為1-的預(yù)測區(qū)間 xxSxxnntY2020)(11)2( 第23頁/共63頁 xxSxxnntxba2020)(11)2( 1* 該區(qū)間以 為中心,長度為0YxxSxxnnt202)(11)2(2 是x0的函數(shù);或 0 xx x2* 在 處區(qū)間長度最短, x0越遠離 ,則長度

11、就越長,隨n的增加,長度縮短;第24頁/共63頁2y1yyxy xoxxbay )()(1xyxv )()(2xyxv 3* 置信區(qū)間的上限與下限的曲線對稱地落在回歸直線的兩側(cè),成喇叭型.第25頁/共63頁例5 例2中(1)*求回歸函數(shù)(x)在x =125處的值(125) 的置信水平為0.95的置信區(qū)間,求在x =125處Y 的新觀察值Y0置信水平為0.95的預(yù)測區(qū)間;(2) 求在x = x0處Y 的新觀察值Y0置信水平為0.95的預(yù)測區(qū)間;,48303. 0 b, 9 . 02 ,8250 xxS,3060. 2)8(025. 0 t,73935. 2 a,145 x 12512504830

12、3. 073935. 2 xxxYY=57.64第26頁/共63頁xxSxxnnt202)(1)2( 8250)145125(1019 . 03060. 22 =0.84回歸函數(shù)(x)在x =125處的值(125) 的置信水平為0.95的置信區(qū)間為(57.640.84)=(56.80,58.48)第27頁/共63頁在x =125處得率Y0 的置信水平為0.95的預(yù)測區(qū)間(57.642.34)=(55.3059.98)(2) 求在x = x0 處得率Y0 的置信水平為0.95的預(yù)測區(qū)間: 8250)145(1011)8( 20025. 00 xtYxx xxSxxnnt202)(11)2( 82

13、50)145125(10119 . 03060. 22 =2.34第28頁/共63頁 變量之間的相關(guān)關(guān)系在實際中往往不一定是線性的,直接求解回歸曲線往往比較困難,對一些特殊類型,可通過適當(dāng)?shù)淖兞刻鎿Q化為線性回歸問題來處理.通常需要用回歸曲線來描述.第29頁/共63頁常見的曲線方程及其圖形如下:1. 雙曲線型xbay 1原方程:變換方法:xxyy1 ,1 變換后方程:xbay y0 a0 boa1xyox0 a0 b第30頁/共63頁2. 指數(shù)曲線型(之一)原方程:變換方法:變換后方程:bxcey cayyln ,ln bxay 0 boxyoyx0 b第31頁/共63頁原方程:變換方法:變換后

14、方程:xbcey caxxyyln,1 ,ln xbay (之二)yox0 b0 byox第32頁/共63頁3. 冪函數(shù)型原方程:變換方法:變換后方程:bcxy caxxyyln,ln ,ln xbay yox1 b1 b10 boyx1 b1 b01 b第33頁/共63頁4. 對數(shù)曲線型原方程:變換方法:變換后方程:xbayln xxln xbay yxo0 boyx0 b第34頁/共63頁5. S 曲線型原方程:變換方法:變換后方程:xbeay 1xexyy ,1xbay a10, 0 bayxo第35頁/共63頁例6:為了解百貨商店銷售額x與流通費率(這是反映商業(yè)活動的一個質(zhì)量指標,指每

15、元商品流轉(zhuǎn)額所分攤的流通費用)y 之間的關(guān)系,收集了九個商店的有關(guān)數(shù)據(jù)見下表: i 銷售額(銷售額(x :萬元)萬元)流通費率(流通費率(y:%)1 1.5 7.12 4.5 4.83 7.5 3.6410.5 3.1513.5 2.7616.5 2.5719.5 2.4822.5 2.3925.5 2.2第36頁/共63頁解:(1) x 與y 的: 觀察上述散點圖可以發(fā)現(xiàn),這九個點大致在一條曲線附近,因而宜用曲線去擬合這批數(shù)據(jù),即建立回歸曲線方程.024680102030系列1第37頁/共63頁 回歸曲線的形式確定,應(yīng)盡可能地采用專業(yè)知識,此外也可以與典型的函數(shù)圖象對照使用.此時可能有多種選

16、擇方案,對本例來講可選用(2) 確定回歸曲線類型bxay (3) 對原始數(shù)據(jù)作相應(yīng)的變量替換,yvxuln ,ln 令令變換后的第38頁/共63頁 1 1.5 7.0 0.4055 1.9459 7.1665 0.1665 2 4.5 4.8 1.5041 1.5686 4.4885 0.3115 3 7.5 3.6 2.0149 1.2809 3.6109 0.0109 4 10.5 3.1 2.3514 1.1314 3.1288 0.0228 5 13.5 2.7 2.6027 0.9933 2.8112 0.1112 6 16.5 2.5 2.8034 0.9163 2.5809 0.

17、0809 7 19.5 2.4 2.9704 0.8755 2.4037 0.0037 8 22.5 2.3 3.1135 0.8329 2.2616 0.0384 9 25.5 2.2 3.2387 0.7885 2.1442 0.0558iixiyiixuln iiyvln iy iiyy 變換后的數(shù)據(jù)及擬合值與殘差值第39頁/共63頁(4) 計算過程如下:,0046.2191 iiu9 n,3333.1091 iiv,3338. 2 u,1481. 1 v 912912.21iiivu 9120215.49)(1iiun,6551.55912 iiu1163.24)( )(19191 i

18、iiivun,6336. 6 uuS,8251. 2 uvS第40頁/共63頁,4259. 0 uuuvSSb,1421. 2 ubva, 4259. 01421. 2 uv 在上述方程中用原變量代入,有:xyln4259. 01421. 2ln 4259. 05173. 8 xy第41頁/共63頁,1492. 0)(912 iiieyyQ,20)(912 iiyyyyS291492. 0 1460. 0 可見,回歸效果還是較好的.,4259. 0 b),2( ntSbtxx ,3646. 2)7(025. 0 t79.67 xxSbt ,540 xxS第42頁/共63頁回歸分析中應(yīng)注意的問題

19、:1. 定性分析與定量分析相結(jié)合;2. 檢驗假設(shè)的條件是否符合(可利用殘差圖);3. 回歸方程一般不宜外推,實際工作中往往需要外推,必須在理論上分析其是否可行.4. 關(guān)于時間序列資料的回歸.第43頁/共63頁 1.在線性模型 中,x 是什么變量?Y是什么變量?對固定的x,Y 服從什么分布?), 0(,2 NbxaY 2. 一元線性回歸系數(shù) 與樣本相關(guān)系數(shù) R 有什么關(guān)系?b第44頁/共63頁 1. x是普通變量,Y 是隨機變量,),(2 bxaNY . 2yyxxxySSSR yyxxxxxxxySSSSS1 yyxxxxxySSSS yyxxSSb 第45頁/共63頁), 1()2(2 N)

20、1 , 0()4(N), 0()3(2 N bxay2.在一元線性回歸模型 中,假定隨機變量服從( )(1) 兩點分布(1) 0 (2) 6 (3) 2 (4) 6xay4 , 3 x)(, 6 ay則則1.已知一元線性回歸直線方程 ,且第46頁/共63頁3. 在一元線性回歸中,式子( )是正確的.21)()4( niiiyyyyS21)()3(yyQSniieyy 21)()1( niieyyQ21)()2( niiixyyxS4. 在線性模型 的相關(guān)性檢驗中,如果原 假設(shè) 沒有被否定,則表明( ) bxay0:0 bH)(xfy (4) 不存在一條曲線 能近似地描述兩變量間的關(guān)系.(1)

21、兩個變量之間沒有任何相關(guān)關(guān)系;(2) 兩個變量之間不存在顯著的線性相關(guān)關(guān)系;(3) 兩個變量之間存在顯著的線性相關(guān)關(guān)系;第47頁/共63頁5. 對下表所給的數(shù)據(jù),建立水稻產(chǎn)量 y 對化肥用量 x 的回歸直線.45549045404454053530365345252033015iiyx6. 考察硫酸銅在水中的溶解度 y 與溫度 x 的關(guān)系時,作了9次試驗得數(shù)據(jù)如下,8 .54488070403 .3360502 .291 .2640302 .215 .172010140yx求 y 對 x 的線性回歸方程.第48頁/共63頁7.某商品的價格與供給量的觀察數(shù)據(jù)見下表: x(元元) 2 3 4 5

22、6 8101214 16Y(噸噸)152025303545608080110(1) 求 y 對 x 的線性回歸方程;(2) 作相關(guān)性檢驗.8. 求下表中營業(yè)稅稅收總額Y對某商品零售總額x的線性回歸方程;并作回歸效果的顯著性檢驗;當(dāng)x =300時,對營業(yè)稅稅收總額作出預(yù)測.第49頁/共63頁序號序號 社會商品零售額社會商品零售額 稅收總額稅收總額 1 142.08 3.93 2 177.30 5.96 3 204.68 7.85 4 242.88 9.82 5 316.24 12.50 6 341.99 15.55 7 332.69 15.79 8 389.29 16.39 9 453.40 1

23、8.45第50頁/共63頁9. 隨機地抽取50位婦女為樣本,調(diào)查其年齡x與 膽固醇濃度y 的關(guān)系.現(xiàn)得到樣本信息:一元回歸平方和 2 .50,40,1625. 7,73. 5 yxSQSxyeyy試求y對x的線性回歸方程.10. 某化工廠生產(chǎn)一種油漆,其含雜質(zhì)率 與攪拌速 度x有關(guān),現(xiàn)抽取12桶,檢驗結(jié)果經(jīng)計算得, (%)y,31 x,14 y.260,121 xyeyySQS試求y對x的線性回歸方程.第51頁/共63頁11.為研究一化學(xué)過程中,溫度 對產(chǎn)品得率y(%)的影響,觀測到10對數(shù)據(jù),經(jīng)計算得, )(0Cx1932,3985,8250, 3 .67,145 yyxyxxSSSyx能否

24、據(jù)此斷定x與y 間存在顯著的線性關(guān)系?(1)求y 關(guān)于x 的線性回歸方程 ;(2)對所建立線性回歸方程進行相關(guān)性檢驗;(3)當(dāng)銷售額95元時,利潤的95%的預(yù)測區(qū)間.xbay 05. 0 12.某種商品的銷售額x(元)與利潤y(元)的統(tǒng)計數(shù)據(jù)如下:銷售額 54.5 61.0 67.5 74.0 80.5 87.0利 潤 6.54 7.22 8.55 9.61 10.53 11.46第52頁/共63頁13. 設(shè)x,y分別表示我國農(nóng)民人均年純收入與人均年消費支出(單位:元),統(tǒng)計了1978至1987年十年數(shù)據(jù)后計算得 ,2950101 iix,2400101 iiy,9770001012 iix,

25、806000101 iiiyx求y對x的線性回歸方程. 假設(shè)1988年農(nóng)民人均收入為550元,預(yù)測1988年的農(nóng)民人均消費支出是多少? 第53頁/共63頁14.工廠在若干年內(nèi)收集的資料說明,一批產(chǎn)品的成本 y(元)與生產(chǎn)件數(shù) x(千件) 的關(guān)系:xbby10 x千件千件 1 2 3 5 10 20 30 50 100 200Y 元元10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15(1) 求y 關(guān)于x 的回歸方程; (2) 對所建立回歸方程進行顯著性檢驗; (3) 當(dāng)產(chǎn)量為100時,成本 y 的置信度95%的預(yù)測區(qū)間.第54頁/共63頁1. 4;2. 3; 3. 3; 4. 2;xySSxyxx321. 537.245,3725,700. 5 xySSxyxx5 . 05 .11,3019,6000. 6 7. 散點圖02040608010012005101520系列1第55頁/共63頁, 0 8101 iix, 500101 iiy, 8501012 iix,5350101 iiiyx, 339001012 iiy, 8101101 iix, 50101101 iiyy )( 1012 iixxxxS 1010122 iixx 101)( iiixyyyxxS 10110iiiyxyx1350508105350 210881

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論