應(yīng)用回歸_第2章課后習(xí)題參考答案_第1頁(yè)
應(yīng)用回歸_第2章課后習(xí)題參考答案_第2頁(yè)
應(yīng)用回歸_第2章課后習(xí)題參考答案_第3頁(yè)
應(yīng)用回歸_第2章課后習(xí)題參考答案_第4頁(yè)
應(yīng)用回歸_第2章課后習(xí)題參考答案_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2.1 一元線性回歸模型有哪些基本假定?答:1. 解釋變量 是非隨機(jī)變量,觀測(cè)值是常數(shù)。2. 等方差及不相關(guān)的假定條件為 這個(gè)條件稱為高斯-馬爾柯夫(Gauss-Markov)條件,簡(jiǎn)稱G-M條件。在此條件下,便可以得到關(guān)于回歸系數(shù)的最小二乘估計(jì)及誤差項(xiàng)方差估計(jì)的一些重要性質(zhì),如回歸系數(shù)的最小二乘估計(jì)是回歸系數(shù)的最小方差線性無(wú)偏估計(jì)等。 3. 正態(tài)分布的假定條件為 在此條件下便可得到關(guān)于回歸系數(shù)的最小二乘估計(jì)及估計(jì)的進(jìn)一步結(jié)果,如它們分別是回歸系數(shù)的最及的最小方差無(wú)偏估計(jì)等,并且可以作回歸的顯著性檢驗(yàn)及區(qū)間估計(jì)。4. 通常為了便于數(shù)學(xué)上的處理,還要求及樣本容量的個(gè)數(shù)要多于解釋變量的個(gè)數(shù)。 在整

2、個(gè)回歸分析中,線性回歸的統(tǒng)計(jì)模型最為重要。一方面是因?yàn)榫€性回歸的應(yīng)用最廣泛;另一方面是只有在回歸模型為線性的假設(shè)下,才能的到比較深入和一般的結(jié)果;再就是有許多非線性的回歸模型可以通過適當(dāng)?shù)霓D(zhuǎn)化變?yōu)榫€性回歸問題進(jìn)行處理。因此,線性回歸模型的理論和應(yīng)用是本書研究的重點(diǎn)。1. 如何根據(jù)樣本求出及方差的估計(jì);2. 對(duì)回歸方程及回歸系數(shù)的種種假設(shè)進(jìn)行檢驗(yàn);3. 如何根據(jù)回歸方程進(jìn)行預(yù)測(cè)和控制,以及如何進(jìn)行實(shí)際問題的結(jié)構(gòu)分析。2.2 考慮過原點(diǎn)的線性回歸模型 誤差仍滿足基本假定。求的最小二乘估計(jì)。答:令即解得即的最小二乘估計(jì)為2.3 證明:Q (,)= (-)2 因?yàn)镼 (,)=min Q (, )而Q

3、(, ) 非負(fù)且在上可導(dǎo),當(dāng)Q取得最小值時(shí),有即-2(-)=0 -2(-) =0又=-( +)= - =0, =0(即殘差的期望為0,殘差以變量x的加權(quán)平均值為零)2.4 解:參數(shù)0,1的最小二乘估計(jì)與最大似然估計(jì)在iN(0, 2 ) i=1,2,n的條件下等價(jià)。 證明:因?yàn)?所以 其最大似然函數(shù)為 已知使得Ln(L)最大的,就是,的最大似然估計(jì)值。 即使得下式最小 : 因?yàn)榍『镁褪亲钚《斯烙?jì)的目標(biāo)函數(shù)相同。 所以,在 的條件下, 參數(shù)0,1的最小二乘估計(jì)與最大似然估計(jì)等價(jià)。2.5.證明是的無(wú)偏估計(jì)。 證明:若要證明是的無(wú)偏估計(jì),則只需證明E()=。 因?yàn)椋淖钚《斯烙?jì)為 其中E()=E(

4、)=E()=E =E =E()+E()+E() 其中=由于=0,所以= =)=0又因?yàn)橐辉€性回歸模型為所以E()=0所以E()+E()+E( = =所以是的無(wú)偏估計(jì)。2.6 解:因?yàn)?, , 聯(lián)立 式,得到。 因?yàn)?,所?2.7 證明平方和分解公式:SST=SSE+SSR證明:2.8 驗(yàn)證三種檢驗(yàn)的關(guān)系,即驗(yàn)證:(1);(2)證明:(1)因?yàn)?,所以又因?yàn)?,所以?得證。(2)2.9 驗(yàn)證(2.63)式: 證明: 其中: 注:各個(gè)因變量是獨(dú)立的隨機(jī)變量 2.10 用第9題證明是的無(wú)偏估計(jì)量 證明: 注:2.11驗(yàn)證證明:所以有以上表達(dá)式說明r ²與F 等價(jià),但我們要分別引入這兩個(gè)統(tǒng)計(jì)

5、量,而不是只引入其中一個(gè)。理由如下:r ²與F,n都有關(guān),且當(dāng)n較小時(shí),r較大,尤其當(dāng)n趨向于2時(shí),|r|趨向于1,說明x與y的相關(guān)程度很高;但當(dāng)n趨向于2或等于2時(shí),可能回歸方程并不能通過F的顯著性檢驗(yàn),即可能x與y都不存在顯著的線性關(guān)系。所以,僅憑r較大并不能斷定x與y之間有密切的相關(guān)關(guān)系,只有當(dāng)樣本量n較大時(shí)才可以用樣本相關(guān)系數(shù)r判定兩變量間的相關(guān)程度的強(qiáng)弱。 F檢驗(yàn)檢驗(yàn)是否存在顯著的線性關(guān)系,相關(guān)系數(shù)的顯著性檢驗(yàn)是判斷回歸直線與回歸模型擬合的優(yōu)劣,只有二者結(jié)合起來,才可以更好的回歸結(jié)果的好壞。2.12 如果把自變量觀測(cè)值都乘以2,回歸參數(shù)的最小二乘法估計(jì)和會(huì)發(fā)生什么變化?如果

6、把自變量觀測(cè)值都加上2,回歸參數(shù)的最小二乘估計(jì)和會(huì)發(fā)生什么變化?解: 解法(一):我們知道當(dāng),時(shí),用最小二乘法估計(jì)的和分別為當(dāng)時(shí)有 將帶入得到當(dāng)時(shí) 有 將帶入得到·解法(二): 當(dāng),時(shí),有 當(dāng)時(shí) 當(dāng) , ,由最小二乘法可知,離差平方和時(shí),其估計(jì)值應(yīng)當(dāng)有 。即回歸參數(shù)的最小二乘估計(jì)和在自變量觀測(cè)值變化時(shí)不會(huì)變。2.13 如果回歸方程相應(yīng)的相關(guān)系數(shù)r很大,則用它預(yù)測(cè)時(shí),預(yù)測(cè)誤差一定較小。這一結(jié)論能成立嗎?對(duì)你的回答說明理由。解:這一結(jié)論不成立。因?yàn)橄嚓P(guān)系數(shù)r表示x與線性關(guān)系的密切程度,而它接近1的程度與數(shù)據(jù)組數(shù)有關(guān)。n越小,r越接近1。n=2時(shí),|r|=1。因此僅憑相關(guān)系數(shù)說明x與有密切

7、關(guān)系是不正確的。只有在樣本量較大時(shí),用相關(guān)系數(shù)r判定兩變量之間的相關(guān)程度才可以信服,這樣預(yù)測(cè)的誤差才會(huì)較小。2.14 解:(1)散點(diǎn)圖為:(2)x與y大致在一條直線上,所以x與y大致呈線性關(guān)系。(3)得到計(jì)算表:XY1104100206(-14)2(-4)221011001013(-7)2(3)2320000200042010027727254044004034142(-6)2和15100和Lxx=10Lyy=600和Lxy=70和100SSR=490SSE=110均3均20均20 所以回歸方程為:(4)= 所以,(5)因?yàn)?,的置信區(qū)間為; 同理,因?yàn)?,所以,的置信區(qū)間為。查表知, 所以,的

8、置信區(qū)間為(-21.21,19.21),的置信區(qū)間為(0.91,13.09)。(6)決定系數(shù) (7)計(jì)算得出,方差分析表如下:方差來源平方和自由度均方F值SSR490149013.364SSE110336.667SST6004 查表知,F(xiàn)0.05(1,3)=10.13,F(xiàn)值>F0.05(1,3),故拒絕原假設(shè),說明回歸方程顯著。(8) 做回歸系數(shù)1的顯著性檢驗(yàn) 計(jì)算t統(tǒng)計(jì)量: 查表知, ,所以,t>t0.05/2(3),所以接受原假設(shè),說明x和Y有顯著的線性關(guān)系。(9)做相關(guān)系數(shù)r的顯著性檢驗(yàn):因?yàn)?所以,相關(guān)系數(shù) 因?yàn)椴楸碇琻-2等于3時(shí),%的值為0.959,%的值為0.878

9、 。 所以,%<|r|<%,故x與y有顯著的線性關(guān)系。(10)殘差表為:序號(hào)殘差111064221013-33320200442027-75540346 殘差圖為: (11)當(dāng)X0=4.2時(shí), 其95%的置信區(qū)間近似為,即為: (17.1,39.7)。2.15解:(1)畫散點(diǎn)圖; 圖形舊對(duì)話框散點(diǎn)圖,得到散點(diǎn)圖(表1)如下: (2)x與y之間是否大致呈線性關(guān)系? 由上面(1)散點(diǎn)圖可以看出,x與y之間大致呈線性關(guān)系。 用最小二乘估計(jì)求出回歸方程; 分析回歸線性,得到“回歸系數(shù)顯著性檢驗(yàn)表(表2)”如 下:CoefficientsaModelUnstandardized Coeffi

10、cientsStandardized CoefficientstBStd. ErrorBeta1(Constant).118.355.333每周簽發(fā)的新保單數(shù)目x.004.000.9498.509a. Dependent Variable: 每周加班工作時(shí)間y 由上表可知: =0.118 =0.004 所以可得回歸方程為:=0.118+0.004x(4)求回歸標(biāo)準(zhǔn)誤差; 分析回歸線性,得到“方析分析表(表3)”如下:ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression16.682116.68272.396.000aResidual1.84

11、38.230Total18.5259a. Predictors: (Constant), 每周簽發(fā)的新保單數(shù)目xb. Dependent Variable: 每周加班工作時(shí)間y 由上表可得, SSE=1.843 n=10 故回歸標(biāo)準(zhǔn)誤差為: =0.23 =0.48(5)給出與的置信度為95%的區(qū)間估計(jì); 由表2可以看出,當(dāng)置信度為95%時(shí), 的預(yù)測(cè)區(qū)間為:-0.701,0.937 的預(yù)測(cè)區(qū)間為:0.003,0.005 (6)計(jì)算x與y的決定系數(shù); 分析回歸線性,得到“模型概要表(表4)”如下:Model SummarybModelRR SquareAdjusted R SquareStd. E

12、rror of the Estimate1.949a.900.888.4800a. Predictors: (Constant), 每周簽發(fā)的新保單數(shù)目xb. Dependent Variable: 每周加班工作時(shí)間y 由上表可知,x與y的決定系數(shù)為0.9,可以看到很接近于1,這就說明此模型的擬合度很好。(7)對(duì)回歸方程作方差分析; 由“方差分析表(表3)”可得,F(xiàn)-值=72.396, 我們知道,當(dāng)原假設(shè):=0成立時(shí),F(xiàn)服從自由度為(1,n-2)的F分布(見),臨界值(1,n-2)=(1,8)=5.32 因?yàn)镕-值=72.396>5.32, 所以拒絕原假設(shè),說明回歸方程顯著,即x與y有顯

13、著的線性關(guān)系。(8)做回歸系數(shù)顯著性的檢驗(yàn); 由“回歸系數(shù)顯著性檢驗(yàn)表(表2)”可得, 的t檢驗(yàn)統(tǒng)計(jì)量為t=8.509,對(duì)應(yīng)p-值近似為0,p<, 說明每周簽發(fā)的新報(bào)單數(shù)目x對(duì)每周加班工作時(shí)間y有顯著的影響。(9)做相關(guān)系數(shù)的顯著性檢驗(yàn); 分析相關(guān)雙變量,得到“相關(guān)分析表(表5)”如下:Correlations每周簽發(fā)的新保單數(shù)目x每周加班工作時(shí)間y每周簽發(fā)的新保單數(shù)目xPearson Correlation1.949*Sig. (2-tailed).000N1010每周加班工作時(shí)間yPearson Correlation.949*1Sig. (2-tailed).000N1010*.

14、Correlation is significant at the 0.01 level (2-tailed). 由上表可知,相關(guān)系數(shù)為0.949,說明x與y顯著線性相關(guān)。(10)對(duì)回歸方程作殘差圖并作相應(yīng)的分析; 從上圖可以看出,殘差是圍繞e=0隨即波動(dòng)的,滿足模型的基本假設(shè)。(11)該公司預(yù)計(jì)下一周簽發(fā)新保單=1000張,需要的加班時(shí)間是多少? 當(dāng)=1000張時(shí),=0.118+0.004×1000=4.118小時(shí)。(12)給出的置信水平為95%的精確預(yù)測(cè)區(qū)間和近似預(yù)測(cè)區(qū)間。(13)給出E()置信水平為95%的區(qū)間估計(jì)。 最后兩問一起解答: 在計(jì)算回歸之前,把自變量新值輸入樣本數(shù)據(jù)

15、中,因變量的相應(yīng)值空缺,然后在Save對(duì)話框中點(diǎn)選Individul和Mean計(jì)算因變量單個(gè)新值和因變量平均值E()的置信區(qū)間。結(jié)果顯示在原始數(shù)據(jù)表中,如下圖所示(由于排版問題,中間部分圖省略): 的精確預(yù)測(cè)區(qū)間為:2.519,4.887 E()的區(qū)間估計(jì)為:3.284,4.123而的近似預(yù)測(cè)區(qū)間則根據(jù)2手動(dòng)計(jì)算,結(jié)果為: 4.118-2×0.48,4.118+2×0.48=3.158,5.078 2.16 解答:(1)繪制y對(duì)x的散點(diǎn)圖,可以用直線回歸描述兩者之間的關(guān)系嗎?如圖所示:(2)由上圖可以看出,y與x的散點(diǎn)分布大致呈直線趨勢(shì),所以可以用直線回歸描述兩者之間的關(guān)系

16、。(3)建立y對(duì)x的線性回歸。利用SPSS建立y對(duì)x的線性回歸,輸出結(jié)果如下: 表1 模型匯總模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計(jì)的誤差1.835a.697.6912323.256a. 預(yù)測(cè)變量: (常量), x。表2 方差分析表Anovab模型平方和df均方FSig.1回歸6.089E816.089E8112.811.000a殘差2.645E8495397517.938總計(jì)8.734E850a. 預(yù)測(cè)變量: (常量), x。b. 因變量: y 表3 系數(shù)表系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn) 誤差試用版1(常量)12112.6291197.76810.113.000x3.314.312.83510.621.000a. 因變量: y(a)由表1可知,x與y決定系數(shù)為,說明模型的擬合效果一般。x與y線性相關(guān)系數(shù)R=0.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論