回歸分析應(yīng)用統(tǒng)計學(xué)_第1頁
回歸分析應(yīng)用統(tǒng)計學(xué)_第2頁
回歸分析應(yīng)用統(tǒng)計學(xué)_第3頁
回歸分析應(yīng)用統(tǒng)計學(xué)_第4頁
回歸分析應(yīng)用統(tǒng)計學(xué)_第5頁
已閱讀5頁,還剩134頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、應(yīng)用統(tǒng)計學(xué)任飛華東理工大學(xué):回歸分析回歸分析是隨量(因變量)與可控變量(自變量)之間的相關(guān)關(guān)系本講介紹一元線性回歸、可化為一元線性回歸的曲線回歸、多元線性回歸、逐步回歸等在回歸分析中的主要問題建立回歸模型-回歸系數(shù)的估計回歸模型的度檢驗回歸系數(shù)的檢驗回歸模型的應(yīng)用-和控制線性關(guān)系舉例我國人均消費水平問題,記人均消費金額記作y(元),人均國民收入為x(元),收集到19801998(xi , yi ) 。年19年的樣本數(shù)據(jù)樣本數(shù)據(jù)點大致都落在一條直線附近,這說明變量x與y之間具有明顯的線性關(guān)系。一元線性回歸模型及其應(yīng)用最小平方估計假設(shè)檢驗利用一元線性回歸模型一元線性回歸的數(shù)學(xué)模型yi 0 x21,

2、ii1i,E ),.n.,0 D,) 2相互獨立,且(ijiii,1j2,.n.,必要時還假定 :各 i獨立同分(布0 ,2)即最小平方估計 當(dāng)Yi為隨量,Xi為可控變量,兩者之間呈線性關(guān)系時:Yi=01i+i或者表達(dá)為: E(Yi)=01i確定0和1的估計值條件下,E(Yi)為線性方程的回歸值。n, ) Y2Q( X使為最小01i01ii1X X Y Y nLxyii其解:, Y X i 1101Xn X 2Lxxii 1為0 ,1的最小二乘估計Y X稱i01i為Y關(guān)于X的一元線性回歸方程一元線性回歸模型應(yīng)用條件量i的值,隨對于任何給定的非隨量Yi服從正態(tài)分布其平均值 E(Yi)=01i為線

3、性函數(shù),且對于每個i,Yi的方差不變,均為2而且Yi的任何值與其它每個值都是獨立的最小二乘估計的性質(zhì)(1)線性性,估計量是Yi的線性組合 ( XiX )(Yi Y ) xi (Yi Y ) xiYi Y xi證:xi1222xxxiiik 令,又因,X ) 0i2xi xiYi kY 故有 i1ii2x 1 k X Y w Yi i Y X 1 Y k Y X n01iiiiin(2)無偏性,估計量的均值等于總體回歸參數(shù)真值證: kiYi ki (0 1 Xi i ) 0 ki 1 ki Xi kii1xi可以證明 k k X 1 02iixii k 故11ii) E( kii ) 1 ki

4、E(i ) 1E(11同理E( ) E(0 wii ) 0 wi E(i ) 00(3)有效性(最小方差性),在所有線性無偏估計中,OLS得到的估計量具有最小方差估計量 0和 1 的方差:var( ) var(kvar( X ) kvar( )kY ) 221iii01iiii2 2x 2 i=22xixi2 1var( ) var(w Y ) w var(0 1 Xi ) Xk 220iiiiin 12 1 21n2nx=X k 2 222i22iXkX kXii n2 n xi1= 2i2222 nxinxinxinxi(3)有效性(最小方差性),在所有線性無偏估計中,OLS得到的估計量具

5、有最小方差假設(shè)是其它估計方法得到的關(guān)于 11的線性無偏估計: cY 1iici ki di0,di設(shè)為不全為零的常數(shù),則很容易證明var( ) var( )11同理,可以證明具有最小方差。的最小二乘估計 00回歸方程的顯著性檢驗要使一元線性回歸方程有意義,僅對1是否為零進(jìn)行顯著性檢驗H0:1=0的t檢驗H0:10,H1:10構(gòu)造統(tǒng)計量: 0t 11LxxD ( )1ni 1SE其中: )y2S,(yEiin 2n 2時,當(dāng)tt原假設(shè),即回歸顯著20、1的置信區(qū)間在置信水平(1)的條件下:n2xi i 1ts200EnLxx1ts211ELxxH0:1=0的F檢驗ST偏差平方和分解方法:SRSE

6、n yi1 yi1 yi1 y2 y2 LS,Tiyyn 21SLRixxn2 yL 21SLEiiyyxx在假設(shè)10成立的條件下,S RF 統(tǒng)計量:服從F(1,n-2)分布S Enn21 ,FF2時,當(dāng)原假設(shè),即回歸顯著方差分析表來源平方和S均方和V比顯著性度f1* (*)SRn SRS Ry (iy)V2F VR1AVEi 1Sn-2nVe SE(Eyy2)Sn2Eiii 1ST2 y ynSn-1Tiii1判斷說明*:*: (*):高度顯著顯著一般顯著FF0.01F0.01 F0.05F0.05F0.1F否則,不顯著f(x)概率為0.1概率為0.05概率為0.01(*)*xF0.1 F0

7、.05F0.01F 分布可決系數(shù)/判定系數(shù)(coefficient ofdetermination):n(xi x )( yi y )i1LSxyr r 2RSTLxx Lyynn(x x )2 ( y y )2iii1i1反映了在Y的總離差平方和中由回歸模型解釋的部分所占的比例取值范圍:0,1越接近1,說明樣本回歸線越接近實際觀測點,擬合優(yōu)高。一元線性回歸的SPSS實現(xiàn)SPSS-10.0YZERegresLinear Regres例6.1:已知某社區(qū)10戶家庭每周可支配收入和消費支出的基本信息,如下表所示x(收入)80100120140160180200220240260y(支出)70659

8、095110115120140155150利用一元線性回歸模型因變量y0的置信區(qū)間y N ( x , )2 x 由知:y00100010(x x )2于是 y N (0, 2 (1 0)y1n00n i2xi 1,可構(gòu)造t統(tǒng)計量 2t 2用估計量替代未知量y0y0 t(n 2)(x x )2 2 (1 0)1nni 12xi當(dāng)x=x0時,因變量y0的置信水平為1-的預(yù)測區(qū)間為:(x x )21n 0Lxxy0 y0 t (n 2)21SE其中: n 2x0 x當(dāng)樣本容量n較大,的置信水平為1-的較小時,因變量y0區(qū)間近似為y0 y0 2因變量y0均值的置信區(qū)間(x x )2 N (0, ( 0

9、)由可知y E( y )21E( y ) x00nn00102xii 1 2 2用估計量替代未知量,可構(gòu)造t統(tǒng)計量 E( y0 )y0t t(n 2)(x x )2 2 ( 1 0)nni 12xi當(dāng)x=x0時,因變量y0均值的置信水平為區(qū)間為:1-的(x x )21 0E( y ) y t(n 2)200nLxxSEn 2其中: 利用一元線性回歸模型控制控制問題可以看成是作圖法的反問題采用近似區(qū)間,解不等式 y0 2 x 2y01Ly 2 x 2 y001u例6.5: 經(jīng),某地區(qū)住宅建筑面積和建筑成本的有關(guān)資料如下表所示,求建筑面積與建筑成本的回歸方程。工地建筑面積(x)萬米2建造成本(y)

10、萬元12345642354514.812.813.315.414.315.9可化為一元線性回歸的曲線回歸判別數(shù)據(jù)反映的函數(shù)形態(tài)非線性函數(shù)變換為線性函數(shù)運用線性回歸確定未知參數(shù)還原非線性函數(shù)常見函數(shù)形態(tài)及線性化-1b1y b0Yxb1 01x xy b b xx01b1 0常見函數(shù)形態(tài)及線性化-2y b0b1xYb1 0 x xb1 0b0y b0 b1xx常見函數(shù)形態(tài)及線性化-3y b0 b1Ln(x)x Ln(x)b0Yy b0 b1xx0b1 0b1 01常見函數(shù)形態(tài)及線性化-4y b b x2Y01b1 0 x x2b0y b0 b1xx01b1 0常見函數(shù)形態(tài)及線性化-5y b xb

11、e10Yb1 0y Ln( y)b0y Ln(b0 ) b1xxb 0011常見函數(shù)形態(tài)及線性化-6xy Yb0 x b1b1 011x y ;xyx0b1 0y b0 b1x常見函數(shù)形態(tài)及線性化-7 b1Yby e0 x0b1x 1 ; y Ln(y)x0 xYb1 0y b0 b1xx0常見函數(shù)形態(tài)及線性化-8Yy x Ln(x);b 1b xb110b 110 b1x 1y Ln( y)01Yy Ln(b0 ) b1xb1 00 x常見函數(shù)形態(tài)及線性化-9by0Lin(y xx);iL(n)yn0b ) i1Lni by(xi方程擬和的好壞相關(guān)指數(shù) RR2)(可決系數(shù)( y y )2(

12、y y )2S 1R2R ST剩余標(biāo)準(zhǔn)差 s( y y )2s n 2多元線性回歸模型及其應(yīng)用最小平方估計回歸方程的顯著性檢驗回歸系數(shù)的顯著性檢驗多元線性回歸模型的應(yīng)用多元線性回歸的數(shù)學(xué)模型 yi 0 1 xi1 . p xip i , i 1,2,., nE ( ) 0,iD( ) 2 ,icov( , ) 0, i j,iji, j 1,2,., n或進(jìn)一步假定 : yi 0 1 xi1 . p xip i , i 1,2,., n各 i 獨立同分布 (即: i.i.d .),服從N (0,)2矩陣形式 0 1 1x1p y1x11 x21.xn1.x2 p 1 2 Y y2X 1 . .

13、 . . 1 yn n xpnpY X E ( ) 0, D ( ) 2 I或進(jìn)一步假定nY X N(0, 2 I)nn最小平方估計(矩陣形式)采用最小二乘法得正規(guī)方程組:XX=XYXX為系數(shù)矩陣,XY為常數(shù)項矩陣,當(dāng)XX的逆矩陣存在時,則的最小二乘估計可表示為:XY =(XX)-1則的最小二乘估計矩陣表達(dá)式為:1 LL.LL11121 p1y1 2 L21L22.L2 p . L2 y . . . Lpp Lpy LL0p p1p 2 y 1 x1 2 x2 . p xpe Y Y殘差為:n ( y y )2 e e殘差平方和: SEiii 1偏回歸系數(shù)的意義 i當(dāng)為正時,自變量增加一個 i

14、,則因變量 y 增加 i當(dāng)為負(fù)時,自變量增加一個 i,則因變量 y 減少回歸估計的幾個重要的性質(zhì).E () , D() 2 ( X X )1.E (e) 0, D(e) .cov(e, ) 0.E (SE ) (n p 1)12 ( I H ), HnX Y2定理.當(dāng)Y Nn ( X ,I )時,2n21SN p 1 ( ,( X X ),E且SE 與獨立 2 (n p 1)2模型的假定條件Y與E(y)之間的隨機誤差服從均值為0,方差為2的正態(tài)分布與任意兩個yi,yj相聯(lián)系的隨機誤差i ,j均相互獨立,即:i ,j獨立同正態(tài)分布回歸方程的顯著性檢驗2 =H0:1p=0,H1:至少有一個i00的

15、F檢驗2 =H0:1p=偏差平方和分解方法:nSTSRSE yi1 yi1 y2 LSTiyypn y2 j12jSLRijypn yi12 j1 yL2jSLEiiyyjy在H0成立的條件下,S Rp統(tǒng)計量:F服從F(p,n-p-1)分布S Enp1Fp ,p ,nF 當(dāng)1時原假設(shè),即回歸顯著多元線性復(fù)相關(guān)系數(shù)由 STSRSE,R2可進(jìn)一步構(gòu)造多元線性回歸的可決系數(shù)和復(fù)相關(guān)系數(shù)R:SRR ST回歸系數(shù)的顯著性檢驗H0j:j0,H1j:j0由于 j 是服從正態(tài)分布的隨量,且E 2 Ljj 2, jjj其中:Ljj 為矩陣L-1中的對角線上的元素,則:構(gòu)造的t檢驗統(tǒng)計量為:jnp1ttjSLjj

16、En p 1或者等價地有 F統(tǒng)計量為:2j1 F np2tF,1jjjj SLEpn1對給定的顯著水平下,t np F 或11 ,p當(dāng)tnFj1j2原假設(shè),認(rèn)為變量xj對y有顯著影響時回歸系數(shù)檢驗中應(yīng)注意的問題若經(jīng)檢驗,有多個回歸系數(shù)不顯著時,由于 1 , 2 ,., p 間的相關(guān)性,通常只能去掉一個Fj最小的變量,重新建立 p-1元線性回歸方程,再對系數(shù)逐一檢驗,若還有不顯著的,再去掉一個,如此下去,直到所有的系數(shù)均顯著不為零多元線性回歸的計算機實現(xiàn)SPSS-11.0YZERegresLinear Regres例6.6:某種產(chǎn)品20022008年七年的銷售額與它的流通費用及利潤的資料如下表所

17、示,試給出該產(chǎn)品的銷售利潤與消費額、流通費用之間的回歸關(guān)系。年份2002200320042005200620072008銷售額 x1 萬元500480520515525532550流通費用x2 萬元350315360355351367374利潤額 y 萬元124142132134147140149多元線性回歸模型的應(yīng)用當(dāng)多元線性回歸方程經(jīng)檢驗是顯著時,且其中每一個系數(shù)均顯著不為零,才能利用此方程進(jìn)行對給定x=x0=(x01,x02,x0p),y0的置信水平為1-的區(qū)間是: y, (y 0)0其中:pp1F (1 ,E)1 Ln(xxxj 2ijf )(x)0ii0jj 1i 1當(dāng)n較大時, x

18、0 和 x 接近時,置信水平為0.95的近似y( 0 區(qū)間為:2y, 02 )逐步回歸“最優(yōu)”回歸方程的理介:“最優(yōu)”具指從可供選擇的所有變量中選出對y有顯著影響的變量建立方程,且方程中不含對y無顯著影響的變量“逐步回歸法”的基本變量一個個引入方程,在引入變量時需利用偏回歸平方和進(jìn)行檢驗,當(dāng)其顯著時才將該變量加入到方程中去;當(dāng)方程中加入了新變量后,又要對方程中原有的老變量重新用偏回歸平方和進(jìn)行檢驗,一旦某個變量變得不顯著時要將它從方程中剔除;直到老變量均不能剔除,新變量也無法再加入為止。預(yù)備知識數(shù)據(jù)的標(biāo)準(zhǔn)化處理求解求逆緊湊變換數(shù)據(jù)的標(biāo)準(zhǔn)化處理對n個樣本來講,x j xjy xz,jmj( 1,

19、2,., n;j 1,2,., m)E(z) 0Var(z) 1標(biāo)準(zhǔn)化的回歸方程為 d1z1 d2 z2. dm1zm1zm結(jié)構(gòu)矩陣X與觀察向量Z: z1,1z1,2.z1,m 1 z1 m zzzz 2,m 1 2,12,22 mXZ.zn ,2.z zn ,1zn ,m 1 nmd1d2系數(shù)向量D .dm1 Z XD回歸方程的矩陣形式正規(guī)方程組的系數(shù)矩陣:r11 r21.r12 r22.r1,m 1r2,m 1. RX X rrrm 1,m 1 m 11m 12r1m r2 m. B常數(shù)項向量:X Z rm 1,m標(biāo)準(zhǔn)化的回歸方程為: d1 z1 d2 z2 . dm 1 zm 1zm其矩

20、陣形式為:Z XD求解系數(shù)D即求解方程:X XD X Z或者: RD B求解求逆緊湊變換一般的線性方程求解為R x Bx R 1 BIR 1 x RBI nxn而緊湊變換為:R 1RB 記:求解求逆緊湊變換 為LB u ij記:R1u u kkkk ukj, ( j k )uukkkjLk:u , (i k )uikikukkuu u, (i, j k )ikkjuukkijij u11.u1 j.u1k.ukk.uik.u1m.ukm.uim. . . uk 1.ukj . . ui1.uij . .u.uuumm mjmkm1為建立回歸方程,構(gòu)造 RB r B(0)Rijrmm 逐步回歸的

21、計算步驟選第一個變量: d (1) zzmii(i 1,2,., m 1)2r(1 )im計算 Virii( i 1, 2 ,.,m 1)max V(1 )k 1(1 )記 Vi(1 )V(1 )1kl ( n計算 F2 )V(1 )klrmm(1, n (1 ) F當(dāng) F2 )時,1zk 1 ,引入變量( 0 ) 作變換并對 RLk 1(1 )( 0 )(1 )ij記 RLR( r)k 1選第二個變量: d (2) z d (2) zzmk1k1ii(i 1, 2,., m 1, i k1)(1 )2( r)( 2 )im(1 )計算Virii( i 1, 2 ,., 1, i( 2 )mk

22、 1 )max V( 2 )k 2記 Vi( 2 )V( 2 )1k 2 ( n計算 F3 )V(1 )mm( 2 )k 2r(1, n ( 2 ) F當(dāng) F3 )時,1引入變量z k 2 ,(1) 作變換并對 RL k 2 L (r ( 2) )( 2 )(1)記RRk 2ij(1, n 3)時,F(xiàn) ( 2 ) F否則,即當(dāng)1表明己無顯著變量選入從而結(jié)束變量挑選工作對原有變量的重新檢驗: d (2) z d (2) zzmk1k1k 2k 2其中d (2) r (2)k1k1 m(2 ) ) 2( rk1 m(2 )k 1計 算 V(2 )k 1 k 1r( 2 )V( 2 )2k 1 (

23、n計算 F3 )( 2 )mmr(1, n ( 2 ) F當(dāng) F3 )時,2保留變量 z k 1 ,繼續(xù)新變量的挑選(1, n 3)時,F(xiàn) ( 2 ) F否則,即當(dāng)1( 2 ) 作變換剔除 z k 1 , 對RL k 1一般地,經(jīng)過l 次變換Lk1, Lk2, , Lkl ,選出了 l 個變量zk1, zk2, zkl,先檢驗其中有無不顯著變量(r(l )2k jm( j 1, 2,.,l)算V (l )k jr(l )k jk j記V (l )(l )kjminVkV (l )計算F2 k (n l 1)r (l )mm當(dāng)F2F (1, n l 1)時,保留一切變量否則剔除z , 對R(l)

24、作變換Lkk重新對留下的變量進(jìn)行檢驗,直到?jīng)]有變量剔除為止再考慮新變量的挑選(r ( l ) ) 2( l 1)計算 Viimr ( l )ii(i 1,2,., m 1, i k1 , k 2 ,., kl ) max V( l 1)k( l 1)記 Vi( l 1)V計算 F1k (n l 2)( l 1)kVr ( l )mm當(dāng) F1 F (1, n l 2)時,則選變量工作結(jié)束( l )zk , 對R作變換Lk否則引入若最終選上了變量zk1, zk2, zkl,則可建立回歸方程dk . dkzmdzkzkzkk1122ll r (l ), ( j 1, 2,., l)其中dk jk j

25、m多元線性回歸(逐步回歸)的計算機實現(xiàn)SPSS-11.0YZERegresLinear Regres例6.7含定性變量的回歸定性變量的回歸存在含定性變量或者名義尺度變量的回歸模型,這類變量也被稱為定性變量(qualiive variables)或虛擬變量(dummy variables),如區(qū)等。、種族、地兩分定性變量的回歸若定性變量只取兩類可能,引入一個01型虛擬變量,分別表示變量的兩類情況。設(shè)立線性回歸方程,采用普通最小二乘方法求解。例6.8在一個中等收入的樣本框中,隨機了13戶高學(xué)歷家庭與14戶中低學(xué)歷的家庭。設(shè)因變量y為上一年家庭儲蓄增加額,自變量x1為上一年家庭總收入,自變量x2表示

26、家庭學(xué)歷。高學(xué)歷家庭x2=1,低學(xué)歷家庭x2=0,數(shù)據(jù)見下表:序號y(元)x1(萬元)x2序號y(元)x1(萬元)x21232.33.22.83.52.63.22.63.42.22.82.33.74.02.901010101010110151617181920212223242526273256325635673658458864369047798589509865986610235101403.84.64.23.73.54.85.04.23.94.84.64.84.211110110000003256多分定性變量的回歸若定性變量只取k類可能,需要引入k-1個0-1型虛擬變量,分別表示變量的k

27、類情況。設(shè)立線性回歸方程,采用普通最小二乘方法求解。例6.9右側(cè)表列的是1986年50個州和哥倫比29470266103067827170258532450024274271703016826525273602169021974208161809520939226442462427186339902338220627466948885710553641683547315936213782424739823568315530592967328539144517434950203594282100000000000000000111112094021800229341844319538204602

28、14192516022482209692722425892226442464022341256102601525788291324148025845285325332729230526423124275234293947250954404042340228292297293237054123360883493766000000000000000000000亞特區(qū)公立學(xué)校教師平均薪水和地方對公立學(xué)校的支出數(shù)據(jù),這 51個州被分為三個地理區(qū)域: 1) 東北和中部,2) 南部,3) 西部。學(xué)校教師平均薪水與地方對公立學(xué)校的支出和區(qū)域的關(guān)系。111000000000000D1=1=0D2=1=0東北和

29、中部其它地區(qū)南部地區(qū)其它地區(qū)薪水支出D1D2薪水支出D1D219583202632023526800334631143554464200002279521570220802225033662920298037310000最小二乘估計的改進(jìn)本節(jié)介紹兩個內(nèi)容:多共重線性問題異常點的處理1.2.多共重線性問題多重共線性產(chǎn)生于自變量之間的高度線性相關(guān),當(dāng)發(fā)生多重共線性時,多元回歸模型就不可能對由這些自變量每個的變化去準(zhǔn)確估計或因變量的變化例3.10 x1與x3間有很強的線性相關(guān)關(guān)系SPSSCoefficient CorrelationsaMX3X2X11CorrelationsX3 X2X11.000

30、-.1340.997-.1341.000.1320.997.1321.000a. Dependent Variable: YCoefficientasa. Dependent Variable: Y對x1的系數(shù)無法作計量經(jīng)濟解釋SPSSMUnstandardized CoefficientstSig.BStd. Error1(Constant)X1X2 X3-10.128-5.14E-02.587.2871.212.070.095.102-8.355-.7316.2032.807.000.488.000.026問題的提出如何能既保留該自變量,又能滿足回歸方程的檢驗?嶺估計從減少最小二乘估計的均

31、方誤差的角度出發(fā)主成分估計從消除自變量之間的多重共線性關(guān)系出發(fā)嶺估計變量標(biāo)準(zhǔn)化以后的正規(guī)方程組的系數(shù)矩陣恰好是相關(guān)系數(shù)矩陣: r11r12 r22.r1, pX X r21r2, p R . rrrp, p p1p 2其特征根為:1 2 . pE( )( )的均方誤差:p 2 i1 1iD( )( )且有,p 1 242ii1線性代數(shù)知識pi i1 pR的特征根之和pR的特征根之積 Rii1減少均方誤差的一種直觀的設(shè)想便是加大特征根定義設(shè) k0,稱:(k) (X X kI)1 XY為的嶺估計(0) (X X)1 XY為的最小二乘估計用嶺估計建立的回歸方程為嶺回歸方程y 1 (k)x1 2 (k

32、)x2 . p (k)xpk確定如果令的方法c1, 選擇滿足SE (k) (Y X(k)(Y X(k )c(Y X)(Y X) cSE (0)k的最大的值,c通常取1.5,2等例3.10(標(biāo)準(zhǔn)化嶺估計及對應(yīng)方程的殘差平方和)k00.010.020.030.040.050.061 (k) 2 (k) 3 (k)-0.3390.2131.3020.3040.2170.6540.3790.2170.5750.4060.2140.5430.4200.2130.5250.4270.2110.5130.4320.2090.504SE (k)1.6732.1422.2762.3522.4162.482.54

33、8SPSS例3.10若取c=1.5,則1.5SE(0)=2.5095,使SE(k)1.5SE(0)的最大k值為標(biāo)準(zhǔn)化嶺回歸方程為:v 0.427u1 0.211u 2還原后的回歸方程為:k=0.05 0.513u 3y 8.4076 0.0647x1 0.5809x 2 0.1130 x 3異常點的處理在實際問題中,而形成的“異常點”,而又很難判斷的情況下,“穩(wěn)健”方法能使得在“異常點”的情況下減小它對回歸系數(shù)的影響,通常采用秩估計方法(R估計)例3.11SPSS123456xy-42.48-30.73-2-0.04-1-1.440-1.32100殘 差(3.105)式2.090.42-0.2

34、7-1.59-1.390.75(3.106)式0.44-0.33-0.12-0.540.5511.64前5個數(shù)據(jù)是由yi=-2-xi+i隨機產(chǎn)生,第六個數(shù)據(jù)是由y6=10-x6+6隨機產(chǎn)生由6組數(shù)據(jù)建立的回歸方程為:y 0.0683 0.0815x1由前5組數(shù)據(jù)建立的回歸方程為:y 1.872 0.977x1R估計由于原始數(shù)據(jù)的秩受異常值影響較小,因此首先將數(shù)據(jù)由小到大重新排列,然后賦予秩值利用秩值建立回歸方程(R回歸方程)最后利用變換規(guī)則,作變換規(guī)則將x0i變換為R(x0i):x0 x0(x1 j ) R(1xj) )j(, 3j, ,.n., R ( x)x(j2)j) R (R(0 xj

35、 1 )j)xxx R ( n) j0 j(n) jR( )j xR (x()( x)jxx1 )j(j )1j1 ), 2,.n.,1R(x02), ,將R(x01),R(x0p)代入秩回歸方程,求出R (y0 )將變換為:R (y0 )y(1)y 0R( y) 10 y) , 2,3,., n1( )R( yy00 y)(R( y ) R( y( yy)( )( 1)( )( )0R( y0 ) 1, 1,2,., n 1例3.11對應(yīng)的所以由于y(3)=y(4)=8,(y(4) y(3) )(R (y) R(y(3) ) 8y17 y(3)SPSSR估計的殘差:y17 y17 0由秩回歸

36、方程, 得 R (y) 3.837R(x3)=1x3=72R(x2)=8x2=19第17個樣本點R(x1)=3x1=50對應(yīng)的由于y(1)=7,y(2)=8,所以 ( y( 2 ) y(1) )( R ( y ) 1) 7.67y15y(1)R估計的殘差:y15 y15 8 7.67 0.33由秩回歸方程,得 R ( y ) 1 . 67R(x3)=15x3=89R(x2)=4x2=18第15個樣本點R(x1)=3x1=50思考R估計的變換規(guī)則的實際使用價值何在?習(xí)題三第9題參考 01 2 3 4R (1)117.56/-0.74R (2)103.101.44/-0.61R (3)71.671

37、.450.42/-0.24R (4)52.591.470.66/習(xí)題三第9題參考SRSE F RR (1)1832.05883.7122.810.82138.9641R (2)2641.0974.68176.820.98622.7323R (3)2667.6748.07166.490.99112.311R (4)2657.8257.85229.500.9892.689習(xí)題三第9題參考Q1 Q2Q3Q4R (1)/ 1831.83R (2)809.25/ 1190.91R (3)820.8226.79/ 9.93R (4)848.351207.76/習(xí)題三第9題參考F1 F2F3F4R (1)/ 22.81R (2)108.22/ 159.54R (3)153.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論