版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第二章一元線性回歸分析思考與練習參考答案2.1 一元線性回歸有哪些基本假定?答:假設1、解釋變量X是確定性變量,Y是隨機變量;假設2、隨機誤差項e具有零均值、同方差和不序列相關性:E( e)=0i=1,2,nVar (i)=。2i=1,2,nCov( i, j)=0i wj i,j= 1,2,,n假設3、隨機誤差項e與解釋變量X之間不相關:Cov(Xi, i)=0i=1,2,,n假設4、e服從零均值、同方差、零協(xié)方差的正態(tài)分布iN(0,仃2)i=1,2,,n2.2 考慮過原點的線性回歸模型Yi= 3iXi+ a i=1,2,,n誤差& (i=1,2,)n仍滿足基本假定。求 自的最小二乘估計解:
2、nnQe =Z (Yi -Y?)2 = (Yi 邑 Xi)2 i =1i=1Qe = 2. (Yi /Xi)Xi =0二?1i 1n” (XiYJ i dnx (Xi2)i T2.3 證明(2.27 式),工ei =0 ,工eiXi=0 。nnQ=Z (Y -Y?)2 =S (Y -(K+因XJ)2證明:11其中:葉=用+歌 e=Y-Y?I (向+A37= o|Vo+/?rVj-T;)A; = 0即:三 eiXi=02.4 回歸方程E (Y)=向+自X的參數(shù) 亂例的最小二乘估計與最大似然估計在什 么條件下等價?給出證明。答:由于 e iN(0,仃2)i=1,2,,n所以 Yi=0 + X +
3、qN (向+ iXi ,仃2 )最大似然函數(shù):一 一 2-n2n/217- 一2L( 0, 1,02) =nLfi(Yi) =(2二二 2)exp Yi -( 01 0,Xi)22 ijcm)n91,ncc9LnL( 0, 1,二 2)= -2 二二2)一2% Yi -( 01 0,X i )222 ij使彳3Ln (L)最大的網,邑就是由,伉的最大似然估計值。同時發(fā)現(xiàn)使得Ln (L)最大就是使得下式最小, nnQ = (Y T)2 = (Y-(凡+ Xi)2 11上式恰好就是最小二乘估計的目標函數(shù)相同。值得注意的是:最大似然估計是在iN(0,。2)的假設下求得,最小二乘估計則不要求分布假設。
4、所以在iN(0,仃2 )的條件下,參數(shù)亂代的最小二乘估計與最大似然估 計等價。2.5 證明穌是由的無偏估計。n _ n x _ x證明:E(彳)=E(Y- ZX)= E-x Yi - X iYi)nid Lxx二 En (l_X)Yi = En (口一 XA)。,)i=1 nLxxy nLxx=E 0 : P -X,i=1 nLxx2.6證明證明:)曾=九十 PX告二X)E(M) = P0i T nLxxVar( ?0)=(工X),2 =二 2p -X-)n Xi X 2n Lxxi 1Var(?0) =VarJ - XXi X(- X jXjX)2Var( 0Xi i)U nLxxV nLx
5、x1 2_ X X一()2 -2X ii4 nnLxx(XXi XLxxr1 X、2 二n小2.7 證明平方和分解公式:SST=SSE+SSR證明:SST = (Yi -Y 2 = M Y?)+(Y?Y2=z_ 2 n_ nY? Y2V Yi Y?)(Y? Y 八 Yid)2=(Yi Y2 +Z (Yi i) 2 =SSR +SSE i=12.8驗證三種檢驗的關系,即驗證:(2)u SSR/1F 二SSE/(n -2)c?2=t2證明:(1)t ?Lxx一 ;?yy Lxx.c? Lxx - SSE(Lxx(n-2) - . SSE (n - 2) 一,SSE SST 一,1 一 r2(2)s
6、src(?-y)2 = (?1xi -y)2 =、(y 備Xi-X)-y)2=E (耳(xX)2”2Lxxi=1l SSR/1F 二?2hSS日(n -2)2.9 驗證(2.63)式:1 Var(ei )=(1 -1 n(xi -x)2Lxx證明:var(e ) = var( X y?) = var( x) + var( y?) 2cov( yi, y?)= var(V)+var(用 +) -2cov( yi, y + 用3 1)(為-x)22 1 (xi -x) -2; -=1(xx)Lxx二2Cov(yi,y ?i(Xi X)=Cov(yi, y) Cov(yi, ?i(Xi X)nn其中
7、:1 (xi - x)、= Cov(yi,yi) (xi - x)Cov(y-y )n i 1iL xx2 21 _ 2 (xi - X) _ 21 (xi - X) 2=;.- = (一 - ) _nLxxn Lxx2.10用第9題證明 n-2是的無偏估計量證明:1 n1noE(;22) =-E(yi -?)2 =- E(e2)n -2 yn -2 T1 J / 1 ,1 (x -x)22二一var(s)二一-y 1 -(卜n _ 2 i 4n _ 2 i 4 nLxx122=(n2)。=:;n -22.11驗證決定系數(shù)與F值之間的關系式2 F r 二F n-2證明:2 SSR SSR1r
8、二 SST SSR SSE 1 SSE/SSR1二n21 SSR/(SSE/(n -2)1Fd n -2 F n -21 - F2.14為了調查某廣告對銷售收入的影響, 某商店記錄了 5個月的銷售收入y (萬元)和廣告費用x (萬元),數(shù)據(jù)見表2.6,要求用手工計算:表2.6月份12345X12345Y1010202040(1)畫散點圖(略)(2) X與Y是否大致呈線性關系?答:從散點圖看,X與Y大致呈線性關系(3)用最小二乘法估計求出回歸方程。計算表XY一 2(Xi -X)一 2(Yi Y)(Xi _X)(Yi _Y)Y?(Y?-Y)2(Y?-Yi)21104100206(-14) 2(-4
9、) 221011001013(-7) 2(3) 2320000200042010027727254044004034142(-6) 2和15100和 Lxx=10Lyy=600和 Lxy=70和100SSR=490SSE=110均3均20均20Lw70M7,*iX回歸方程為:Y?=阿+I?X = 1+7X(4)求回歸標準誤差所以先求SSR (Qe)見計算表。qQe110-?6.055.,n-23(5)給用,耳的置信度為95%的區(qū)間估計;由于(1-口)的置信度下,f?的置信區(qū)間是(現(xiàn)-7?,? + %/5?)查表可得 t /2(n-2)=to.o25(3) =3.182。?236.667S ?1
10、.915所以?的95%的區(qū)間估計為:1 Lxx. 10(73.182*1.915, 7+3.182*1.915),即(0.906,13.094)y 1X2氣=?(nL、x)1 2536.667() = 6.3515 10所以?0的 95%的區(qū)間估計為:(-1-3.182*6.351, -1+3.182*6.351),即(-21.211,19.211)。P0的置信區(qū)間包含0,表示P0不顯著“ SSR SSRSST Lyy490600= 0.817(6)計算x和y的決定系數(shù)說明回歸方程的擬合優(yōu)度高。(7)對回歸方程作方差分析方差分析表方差來源平方和自由度F值SSR490149013.364SSE1
11、10336.667SST6004F值= 13.364F 0.05(1,3)=10.13(當5=1m2=8時,%=0.05查表得對應的值為10.13),所以拒絕原假設,說明回歸方程顯著。(8)做回歸系數(shù)01的顯著性檢驗H0: P 1=0t =舀/S? =7/1.915 = 3.656t值=3.656t 0.05/2(3)=3.182,所以拒絕原假設,說明x對Y有顯著的影 響。(8)做相關系數(shù)R的顯著性檢驗R = R2 = SSR = 0.817 = 0.904 SSTR值=0.904R 0.05(3)=0.878,所以接受原假設,說明x和Y有顯著的 線性關系。(9)對回歸方程作殘差圖并作相應的分
12、析殘差圖(略).從殘差圖上看出,殘差是圍繞e=0在一個固定的帶子里隨 機波動,基本滿足模型的假設eiN(0, 22,但由于樣本量太少,所以誤差 較大.(10)求廣告費用為4.2萬元時,銷售收入將達到多少?并給出置信度為95%的 置信區(qū)間.解:當=4.2時,Y0 = ?0?,=1 7 4.2 = 28.4所以廣告費用為4.2萬元時,銷售收入將達到28.4萬元.由于置信度為1-a時,Yo估計值的置信區(qū)間為:Yo-t:Sy?丫Y0:二 Y0t:Sy?y2 Yo- 0-2 丫0-丫0qq2 1( X 0 - X )1 1.44 xSY? Y = ? (136.667(1 -)工 0nLxx.510所以
13、求得Yo的95%的置信區(qū)間為:6.05932 ,50.74068預測誤差較大.2.15 一家保險公司十分關心其總公司營業(yè)部加班的制度,決定認真調查一下現(xiàn)狀。經過十周時間,收集了每周加班工作時間的數(shù)據(jù)和簽發(fā)的新保單數(shù)目,x為每周新簽發(fā)的保單數(shù)目,y為每周加班工作時間(小時)。見表2.7。表 2.7周序號12345678910X825215107055048092013503256701215Y3.51.04.02.01.03.04.51.53.05.01、畫散點圖散點圖5.0 每周加 4.0 一班工作,3.0 時間(小 2.0 時)1.0 OO0&O。GOOO111111120040060080
14、0100012001400每周簽發(fā)的新保單數(shù)目2、由散點圖可以看出,x與y之間大致呈線性關系3、用最小二乘法求出回歸系數(shù)回歸系數(shù)顯著性檢驗表a模型未標準化系數(shù)標準化系數(shù)tP直95%回歸系數(shù)的置信區(qū)間B標準誤下限上限1(Constant).118.355.333.748-.701.937每周簽發(fā)的新保單數(shù)目.004.000.9498.509.000.003.005a. Dependent Variable:周加班工作時間(小時)由表可知:?0 =0.118 ?1 = 0.00 35 9回歸方程為:夕=0.118+0.00359X4、求回歸標準誤差?方差分析表b模型平方和自由度均方FP值1回歸16
15、.682116.68272.396.000 a殘差1.8438.230總和18.5259a. Predictors: (Constant), 每周 簽發(fā) 的新 保單 數(shù)目b. Dependent Var iable:每周 加班 工作時間(小時)由方差分析表可以得到:SSE=1.843A 2故回歸標準誤差仃=壁,仃=0.48n 25、給出回歸系數(shù)的置信度為95%的區(qū)間估計回歸系數(shù)顯著性檢驗表a模型未標準化系數(shù)標準化系數(shù)tP195%回歸系數(shù)的置信區(qū)間B標準誤3下限上限1(Constant).118.355.333.748-.701.937每周簽發(fā)的新保單數(shù)目.004.000.9498.509.00
16、0.003.005a. Dependent Variables周加班工作時間(小時)由回歸系數(shù)顯著性檢驗表可以看出,當置信度為95%時:*0的預測區(qū)間為-0.701,0.937,61的預測區(qū)間為0.003,0.005.瓦的置信區(qū)間包含0,表示瓦不拒絕為零的假設。模型概要b模型R決定系 數(shù)調整后的 決定系數(shù)估計值的標 準誤差Durbin-Wats on1.949 a.900.888.4800.753a. Predictor s: (Constant), 每周簽發(fā)的新保單數(shù)目b. Dependent Vari able:每 周加 班 工作時 間(小 時)6、決定系數(shù)由模型概要表得到決定系數(shù)為0.9
17、接近于1,說明模型的擬合優(yōu)度高方差分析表b模型平方和自由度均方FP值1回歸16.682116.68272.396.000 a殘差1.8438.230總和18.5259a. Predictors: (Constant), 每周 簽發(fā) 的新保單 數(shù)目b. Dependent Var iable:每周加班 工作 時間(小時)7.對回歸方程作方差分析由方差分析表可知:F值=72.3965.32(當星=1門2=8時,查表得對應的值為5.32)P值=0,所以拒絕原假設,說明回歸方程顯著。8、對3的顯著性檢驗從上面回歸系數(shù)顯著性檢驗表可以得到 Pi的t統(tǒng)計量為t=8.509 , 所對應的p值近似為0,通過t
18、檢驗。說明每周簽發(fā)的新保單數(shù)目x對每 周加班工作時間y有顯著的影響。9.做相關系數(shù)顯著性檢驗相關分析表每周簽發(fā)的 新保單數(shù)目每周加班 工作時間 (小時)每周簽發(fā)的新保單數(shù)目Pearson Correlation1.949*Sig. (2-tailed).000N1010每周加班工作時間(小Pearson Correlation.949*1時)Sig. (2-tailed).000N1010*.Correlation is significant at the 0.01 level (2-tailed).相關系數(shù)達到0.949,說明x與y顯著線性相關。10、對回歸方程作殘 差圖并作相應分析從殘差
19、圖上看出,殘 差是圍繞e=0隨即波 動,滿足模型的基本 假設。0.600000.30000 _未標 0.00000 _準化殘-0.30000 差-0.60000 一-0.90000殘差圖20040060080010001200每周簽發(fā)的新保單數(shù)目140011、該公司預計下一周簽發(fā)新保單 X0=1000張,需要的加班時間是多少?當X0=1000 張時,y =0.118 + 0.00359* 1000 = 3.7032 小時12、給出Y。的置信水平為95%的預測區(qū)間通過SPSS運算得到Y0的置信水平為95%的預測區(qū)間為:(2.5195 , 4.8870 )13給出E (Y0)的置信水平為95%的預
20、測區(qū)間(3.284,通過SPSS運算得到Y0的置信水平為95%的預測區(qū)間為:4.123)。2.16 表是1985年美國50個州和哥倫比亞特區(qū)公立學校中教師的人均年工資 y(美元)和學生的人均經費投入x(美元).序號yX序號yX序號yX119583334618208163059351953826422202633114191809529673620460312432032535542020939328537214192752426800454221226443914382516034295294704669222462445173922482394762661048882327186434940
21、209692509730678571024339905020412722454408271705536252338235944225892404292585341682620627282143226443402102450035472722795336644246402829112427431592821570292045223412297122717036212922080298046256102932133016837823022250373147260153705142652542473120940285348257884123152736039823221800253349291323608162169035683322934272950414808349172197431553418443230551258453766解答:(1)繪制y對x的散點圖,可以用直線回歸描述兩者之間的關系嗎?4 0 0 0 0.03 5 0 0 0.03 0 0 0 0.02 5 0 0 0.02 0 0 0 0.02 0 0 0.0 030 00.0 04 0 0 0.0 0500 0.0 06
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建師范大學《自然災害與防治》2023-2024學年第一學期期末試卷
- 福建師范大學《學校心理健康教育與輔導》2023-2024學年第一學期期末試卷
- 福建師范大學《小學教育測量與評價》2022-2023學年第一學期期末試卷
- 福建師范大學《體育測量與評價》2023-2024學年第一學期期末試卷
- 福建師范大學《環(huán)境工程原理》2022-2023學年第一學期期末試卷
- 福建師范大學《公共倫理學》2022-2023學年第一學期期末試卷
- 福建師范大學《燈光及錄音技術基礎》2023-2024學年第一學期期末試卷
- 戶用光伏電站合作開發(fā)合同(范本)
- 課余時光英文課件
- 2024屆云南省曲靖市富源六中下學期高三生物第二次階段檢測試題考試試卷
- 認知行為療法(CBT)實操講座
- 第九套廣播體操比賽評分表
- 融資融券知識測評題目+答案
- 企業(yè)宣傳視頻制作方案(技術方案)
- GB/T 3683-2023橡膠軟管及軟管組合件油基或水基流體適用的鋼絲編織增強液壓型規(guī)范
- 抖音直播商業(yè)模式研究5000字【(論文)】
- 《深刻理解和把握“兩個結合”》全文PPT
- 固體酸催化材料1:多金屬氧酸鹽
- 擔保公司業(yè)務流程圖
- 湖南省2023年對口高考計算機應用類專業(yè)考試大綱
- 2023年特種設備(承壓類)生產單位安全風險管控(日管控、周排查、月調度)清單
評論
0/150
提交評論